آموزش کامل سامانه های توصیه کننده

هدف اصلی از این آموزش معرفی سیستم های توصیه گر و نحوه عملکرد انها می باشد. این آموزش به زبانی ساده و روان و کاربردی آماده شده است که خواننده می تواند در مدت زمان کوتاهی مفاهیم اصلی را درک کرده و بتواند کارهای علمی پژوهشی یا کاربردی خوبی را بر پایه این آموزش ها انجام داد. موارد موجود در این فیلم آموزشی:

  • معرفی سیستم های توصیه گر
  • نحوه عملکرد سیستم های توصیه گر
  • چالش های موجود در این سیستم ها
  • موارد مهم در پروسه طراحی و پیاده سازی سیستم های توصیه گر
  • انواع الگوریتم های سیستم های توصیه گر
  • پیدا کردن ارتباط بین کاربران و محصولات
  • مدل مبتنی بر همسایگی برای سیستم های توصیه گر
  • معیارهای پیدا کردن شباهت بین کاربران
  • پیدا کردن 10 محصول برتر برای پیشنهاد به کاربر
  • مدل مبتنی بر فاکتور نهان برای سیستم های توصیه پالایش گروهی
  • تقابل روش های مبتنی بر فاکتورنهان و روش های مبتنی بر همسایگی
  • تکنیک های بهینه سازی مختلف برای حل فاکتورهای نهان
  • معرفی اطلاعات کناری (کمکی) در سیستم های توصیه گر
  • نحوه استفاده از اطلاعات کمی برای بهبود عملکرد سیستم
  • مقایسه روش های ارائه شده پیشین برای سیستم های توصیه گر
  • مواردی دیگر ……

علاقه مندان به موضوع و آموزش می توانند، این آموزش مفید و کاربردی را از لینک مربوط دریافت نمایند:

  معرفی موضوع: پیشنهاد دادن به صورتی مطابق سلایق کاربر باشد، بر عهده سیستم‌های توصیه گر است. این سیستم‌ها که امروز ما کاربر بسیاری از آن‌ها هستیم، سعی می‌کنند از روی علاقه‌مندی‌های ما و دیگران، پیشنهاد مناسبی به ما بدهند. سیستم‌های توصیه گر در پیدا کردن و انتخاب نمودن آیتم‌های موردنظر کاربران به آن‌ها کمک می‌کنند. طبیعی است که این سیستم‌ها بدون در اختیار داشتن اطلاعات کافی و صحیح در مورد کاربران و آیتم‌های موردنظر آن‌ها قادر به پیشنهاد دادن نمی‌باشند؛ بنابراین یکی از اساسی‌ترین اهداف آن‌ها جمع‌آوری اطلاعات گوناگون در رابطه با سلایق کاربران و آیتم‌های موجود در سیستم است(فضل اللهی & رزقی, 1395). منابع و روش های گوناگونی برای جمع‌آوری چنین اطلاعاتی وجود دارد. یک روش جمع‌آوری اطلاعات به‌صورت صریح که در آن کاربر صراحتاً اعلام می‌کند که به چه چیزهایی علاقه دارد(بوستانی & آرسته, 1392). روش دیگر روش ضمنی است که کمی دشوارتر است و در آن سیستم باید سلایق کاربر را با کنترل و دنبال کردن رفتارها و فعالیت‌های او بیابد (به‌عنوان مثال باید ببینید کاربر به چه آهنگ‌هایی بیشتر گوش می‌دهد، چه صفحاتی را بازدید می‌کند، با چه کسانی در ارتباط است و …). معمولاً سیستم‌های توصیه گر در ابتدای کار از کاربر می‌خواهند درجه علاقه‌مندی خود به هر یک از آیتم‌ها را به‌وسیله یک رتبه مشخص کنند. این امتیازها با استفاده از ماتریس کاربر-آیتم نمایش داده می‌شود. مثلاً همان‌طور که در جدول ‏2‑1 مشخص است کاربر A به آیتم اول امتیاز 1 داده است یا کاربر B به آیتم دوم امتیاز 4 را داده است. این امتیازها معمولاً در بازه 1 تا 5 هستند. همانطور که در جدول ‏2‑1  مشخص است، تعدادی از عناصر با امتیاز 0 وجود دارد. بدین معنی که کاربر به این آیتم‌ها امتیاز نداده است؛ بنابراین وظیفه سیستم توصیه گر تخمین این امتیازات مجهول است. اگر این رتبه‌ها با رتبه بالا پیش‌بینی شوند به کاربر پیشنهاد می‌شوند. نمونه ایی از ماتریس کاربر -آیتم

Item5 Item4 Item3 Item2 Item1  
0 3 5 0 1 User A
0 0 4 4 2 User B
1 3 1 0 0 User C
2 4 0 0 5 User D

انواع داده‌های ورودی در سیستم‌های توصیه گر

یک سیستم توصیه گر بر اساس داده‌های ورودی به آن عمل می‌کند و هر چه تعداد و تنوع این داده‌ها بیشتر باشد، مسلماً کیفیت و دقت سیستم نیز بالاتر خواهد بود. لذا آنچه اهمیت دارد، نحوه استفاده و به‌کارگیری این داده‌ها برای ساخت یک مدل مناسب است تا بتوانیم بر اساس این مدل یک توصیه خیلی مناسب به کاربر موردنظر داشته باشیم. یک سیستم توصیه گر ممکن است از یک یا چندین نوع مختلف از داده‌ها و اطلاعات استفاده کند که در زیر به موارد مهمی از این داده‌ها اشاره شده است:

داده‌های ضمنی

روش ضمنی است که کمی دشوارتر است و در آن سیستم باید سلایق کاربر را با کنترل و دنبال کردن رفتارها و فعالیت‌های او بیابد، به‌عنوان مثال باید ببینید کاربر به چه آهنگ‌هایی بیشتر گوش می‌دهد، چه صفحاتی را بازدید می‌کند، با چه کسانی در ارتباط است.

داده‌های صریح

یک روش جمع‌آوری اطلاعات به‌صورت صریح که در آن کاربر صراحتاً اعلام می‌کند که به چه چیزهایی علاقه دارد، به‌عنوان نمونه با امتیاز دادن  به یک آهنگ.

داده‌های دموگرافیک

علاوه بر اطلاعات ضمنی و صریح برخی از سیستم‌ها نیز هستند که از اطلاعات شخصی کاربران استفاده می‌کنند. به‌عنوان مثال سن، جنسیت و ملیت کاربران می‌تواند منبع خوبی برای شناخت کاربر  و ارائه پیشنهاد به وی باشد. به این‌گونه از اطلاعات ، اطلاعات دموگرافیک گفته می‌شود که گروهی از سیستم‌های پیشنهاد دهنده مبتنی بر همین اطلاعات بناشده‌اند. اطلاعاتی نظیر سن، جنسیت، ملیت و … در گروه اطلاعات دموگرافیک قرار می‌گیرند. سیستم‌هایی که از این روش استفاده می‌کنند بر این اساس عمل می‌کنند که کاربرانی که صفات دموگرافیک مشابهی دارند (مثلاً در یک بازه سنی قرار می‌گیرند) احتمالاً سلایق و خواسته‌ها مشابهی نیز دارند.

 داده‌های شبکه اجتماعی

با ظهور و گسترش شبکه‌های اجتماعی در سال‌های اخیر محققین به منبع اطلاعاتی دیگری برای بهبود کیفیت پیشنهادها پی بردند  که همان اطلاعات موجود در شبکه‌های اجتماعی بود  و بر همین اساس کارهای تحقیقاتی زیادی در این حوزه شکل ریزی گردید(فهمیده وطن دوست & جلالی, 1395). توجه داشته باشید که این اطلاعات ممکن است به‌صورت صریح و یا ضمنی جمع‌آوری شوند. بر اساس نتایج حاصل از به‌کارگیری این اطلاعات مشخص‌شده است که این کار باعث بهبود نتایج پیشنهادی و همچنین کاهش مشکل پراکندگی داده شده است.

 داده‌های مربوط به شرایط و محیط کاربر

یکی از موفق‌ترین این سیستم‌ها که در سال‌های اخیر کارهای خوبی نیز بر روی آن انجام شده است، سیستم‌های پیشنهاد دهنده مبتنی بر موقعیت[4] می‌باشند. این‌گونه از سیستم‌ها که عموماً در برنامه‌های تلفن همراه نمود دارند، بر اساس موقعیت فعلی کاربر پیشنهاد‌هایی را در حوزه خاصی به وی می‌دهند. دسته‌ای از این سیستم‌ها، به‌صورت ترکیبی با سیستم‌های پالایش گروهی[5] استفاده می‌شوند. راهکار رایج در این نوع سیستم‌های پیشنهاد دهنده بدین‌صورت است که امتیازدهی به‌صورت سنتی در قالب یک روش سیستم‌های پالایش گروهی به آیتم‌ها داده می‌شود؛ اما هنگامی‌که پیشنهاد به کاربر داده می‌شود اطلاعات جغرافیایی او نیز در پروسه ارائه پیشنهاد دخیل می‌گردند.

 ******************************

سیستم‌های توصیه‌گر یکی از کاربردی­ترین ابزارها برای کمک به کاربران، در میان حجم زیادی از اطلاعات است، طوری که کاربر سریع‌تر و بهتر به آیتم‌هایی که موردنیازش است، برسد. توصیه کردن کار مهمی است که نقش مهمی در بسیاری از برنامه‌های کاربردی دارد. سیستم‌های توصیه‌گر سعي دارند، بر اساس عملکرد، سلیقه‌های شخصي، رفتارهاي کاربر و بسته به زمینه‌ای که در آن مورداستفاده قرارگرفته‌اند، به هر کاربر پيشنهادهايي را ارائه دهند که با تمايلات شخصي وي تطابق دارد[14]. با رشد سریع اطلاعات، لزوم طراحي و پیاده‌سازی چنين سیستم‌هایی غیرقابل انکار است . این سیستم‌ها نقش مهمی در طیف گسترده‌ای از خریدهای آنلاین، خدمات تجارت الکترونیک و برنامه‌های کاربردی شبکه‌های اجتماعی ایفا می‌کند. سیستم‌های توصیه‌گر قادرند به شکل مؤثری مشکل سرریز داده را برطرف نموده و برای کاربران خدمات شخصی‌سازی‌شده‌ای ارائه کنند. این سیستم‌ها به حیطه برنامه‌های کاربردی گوناگونی اعمال شده‌اند. ازجمله: پیشنهاد کالا در وب‌سایت‌های تجارت الکترونیکی، پیشنهاد صفحات وب در سامانه‌های وب و پیشنهاد در شبکه‌های اجتماعی[15-17].

انواع الگوریتم­های توصیه

بر اساس نوع اطلاعات جمع‌آوری‌شده و روش‌های استفاده‌ی آن‌ها در سیستم‌های توصیه‌گر، روش‌های توصیه می‌تواند در سه دسته طبقه‌بندی شوند: مبتنی بر محتوی[1]، پالایش مشارکتی[2] و ترکیبی[3].

مبتنی بر محتوی

سیستم‌های توصیه‌گر مبتنی بر محتوا بر اساس علاقه کاربر و شرح محتوا، آیتم‌ها را به کاربر پیشنهاد می‌دهد. این روش بر اساس خصوصیات کالاها و محصولات و شباهت بین آن‌ها و نیز سلایق کاربر، توصیه‌هایی به کاربر ارائه می­کند. سیستم‌های توصیه‌گر مبتنی بر محتوا بر اساس ویژگی‌های آیتم و علایق کاربران که در پروفایل آن‌ها مشخص‌شده است، پیشنهاد مناسب را ارائه می‌دهند. تمام سیستم‌های توصیه‌گر مبتنی بر محتوا دارای وجه تشابه‌هایی هستند، مانند شرح وضعیت آیتم‌ها، پروفایل کاربر و روش‌هایی برای مقایسه آیتم‌ها با پروفایل کاربران، برای شناسایی این‌که چه چیزی برای توصیه به کاربر خاص مناسب است. برای تعیین این‌که چه آیتمی به کاربر توصیه شود، اطلاعات جمع‌آوری‌شده از کاربران با ویژگی محتوای آیتم‌ها مقایسه می‌شوند. در این روش تکیه‌بر اطلاعات و سلایق کاربر جاری است، بدین شکل که برای ارائه پیشنهاد، به انتخاب‌ها و تجربیات وی درگذشته توجه می‌شود. عموماً در چنین روش‌هایی نیاز به تحلیل و آنالیز اطلاعات و محتویات مربوط به کاربر و آیتم‌های موجود در سیستم است تا بتوان میزان شباهت بین کاربر و آیتم‌های سیستم (و نیز شباهت بین آیتم‌ها با یکدیگر) را تعیین نمود. در نتایج پیشنهادی به کاربر، آیتم‌هایی آورده می‌شوند که شباهت بیشتری به آیتم‌هایی دارند که قبلاً کاربر آن‌ها را انتخاب نموده است[8, 15]. به دلیل وجود معضلاتی و معایبی ازجمله (عدم امکان گرفتن بازخورد کاربران- دشوار بودن استخراج داده‌ها و اطلاعات در مورد آیتم‌ها و کاربران-عدم پیشنهاد برخی آیتم‌ها به کاربر در طول حیات سیستم- و…) معمولاً این راهکار را به‌صورت ترکیبی با راهکارهای دیگر مورداستفاده قرار می‌دهند. در چنین سیستم‌هایی علاوه بر رتبه‌ها از اطلاعات موجود در شبکه‌های اجتماعی مانند کامنت­ها[4]، بلاگ ها، ارتباطات بین دوستان و… استفاده می‌شود تا بتوان کیفیت و دقت نتایج را بهبود داد[18].

پالایش مشارکتی

روش توصیه بر اساس پالایش مشارکتی، یکی از روش‌های موفق در سیستم‌های توصیه‌گر است و به شکلی گسترده‌ای در وب‌سایت‌های تجارت الکترونیکی مورداستفاده قرار می‌گیرد. این نوع سیستم‌ها، نقش اصلی در بسیاری از برنامه‌های آنلاین و خدمات تبلیغاتی اینترنتی بازی می‌کنند، مانند پیشنهاد در شبکه‌های اجتماعی، پیشنهاد محصولات، فیلم‌ها، موسیقی و مقاله‌ها. تعداد زیادی از شرکت‌های بزرگ مانند آمازون[5]، ابی[6] و نتفلیکس[7]، در پیشنهادهای خود از روش‌های پالایش مشارکتی استفاده می‌کنند[19, 20]. این شیوه مقدار زیادی از اطلاعات جمع‌آوری‌شده از رفتار کاربر در گذشته را به کار می‌برد و پیش‌بینی می‌کند که کدام آیتم‌ها موردپسند کاربران خواهد بود، در این روش نیازی نیست تا محتوای آیتم‌ها بررسی شود. در عوض به رابطه‌ی بین کاربران تکیه می‌کند که به‌طور معمول در یک ماتریس بازخورد رتبه رمزگذاری شده است، در ماتریس رتبه‌بندی تنها درصد کمی از آیتم‌ها رتبه‌بندی شده‌اند. حتی ممکن است مشهورترین آیتم‌ها رتبه کمی داشته باشند. با داشتن ماتریس رتبه‌بندی پراکنده ارزیابی کردن روابط میان آیتم‌ها و کاربران و ایجاد پیشنهاد موثرکاری بسیار چالش‌انگیز است و روش‌های مبتنی بر پالایش مشارکتی به دلیل استفاده از رتبه‌بندی دوستان کاربر، برای ارائه پیشنهاد به او، دارای کارایی بالایی در توصیه کردن به کاربر روی ماتریس‌های پراکنده هستند[8]. بخش عمده دسته‌بندی‌های پالایش مشارکتی شامل دو روش مبتنی بر حافظه[8] و مبتنی بر مدل[9] می‌شود[21]. روش‌های مبتنی بر حافظه می‌توانند به روش‌های مبتنی بر کاربر یا مبتنی بر آیتم طبقه‌بندی شوند. آن‌ها پیشنهاد‌هایی مبتنی بر همه داده‌های همسایه ارائه می‌دهند و گزینش کاربران (آیتم‌ها) همسایه، بر پایه تابع فاصله می‌باشد. روش‌های مبتنی بر مدل مانند روش‌های مبتنی بر فاکتورگیری ماتریس[10]، از ضریب عملکرد شناخته‌شده کاربران برای آموزش مدل معین (پیش‌گویی) استفاده کرده، سپس از این مدل آموخته‌شده برای پیشنهاد به کاربران موردنظر استفاده می‌کند[16]. به دلیل قابلیت بالایی روش­های پالایش مشارکتی، در این پایان­نامه سعی می­شود، با بهره‌گیری از مزایای سایر روش­های پالایش مشارکتی، یک راهکار جدید و خوب ارائه شود، تا بتوان چالش­های اساسی در سیستم­های توصیه­گر پالایش مشارکتی، را به‌خوبی پر کرد.

روش‌های ترکیبی

شیوه‌ی ترکیبی شیوه‌ای است که روش‌های مبتنی بر محتوی و پالایش مشارکتی را ترکیب می‌کند و تلاش می‌کند تا معایب آن‌ها را کم کرده و نتیجه‌ی مؤثرتری را ایجاد کند. روش‌های ترکیبی، ترکیبات مختلفی از روش‌های محتوا محور و مشارکتی را ارائه می‌دهد؛ یعنی این روش‌ها از مزایای روش‌های قبلی، استفاده می‌کنند تا کارایی سیستم را تا حد مناسبی افزایش دهند. یکی از معایب اصلی این روش­ها پیچیدگی­های ناشی از ترکیب دو روش است، چون‌که هرکدام از روش­های فوق دارای پیچیدگی خاص خود در برخورد با داده‌های بزرگ دارند، لذا ترکیب آن‌ها می‌تواند دقت را زیاد کند، اما پیچیدگی را افزایش می­دهد[22]. سیستم‌های توصیه‌گر سیستم‌هایی هستند که بر اساس اطلاعات ورودی به آن تصمیم‌گیری‌های مختلفی را برای ارائه پیشنهاد به کاربر انجام می‌دهند، طبیعی است که این سیستم‌ها باید اطلاعات مختلفی را از روند عملکرد کاربران داشته باشند تا توصیه مناسب را به آن‌ها داشته باشند؛ بنابراین یکی از اساسی‌ترین اهداف آن‌ها جمع‌آوری اطلاعات گوناگون در رابطه با سلایق کاربران و آیتم‌های موجود در سیستم است. اطلاعات در سیستم‌های توصیه‌گر به‌صورت های مختلفی به دست می‌آیند که در دودسته بندی کلی به دودسته اطلاعات ضمنی[11] و اطلاعات صریح[12] تقسیم‌بندی می‌شوند[23]. همان‌طور که از شکل ‏2‑1 مشخص است هدف از این تحقیق ارائه یک روش مبتنی بر پالایش گروهی است که بتواند به‌صورت یک مدل مناسب از ایده فاکتورسازی ماتریس به‌خوبی استفاده کند. همان‌طور که مشخص است فاکتورسازی ماتریس یک روش مدل محور است که می­تواند به‌خوبی داده­ها را روی یک سیستم پالایش گروهی مدل کند. دو رویکرد اصلی برای فیلترینگ مشارکتی وجود دارد: مبتنی بر حافظه و مبتنی بر مدل. روش­های مبتنی بر حافظه مبتنی بر الگوریتم‌های یادگیری نظارتی تنبل هستند، مانند نزدیک‌ترین همسایه درحالی‌که روش­های مدل محور معمولاً به ایجاد مدل‌های نظارتی از ماتریس رتبه‌بندی کاربر ـ آیتم تمرکز می‌کند. الگوریتم‌های مبنی بر حافظه از پیش‌بینی‌ها در تشابه میان یک جفت آیتم یا آیتم‌ها استفاده می‌کند. در این روش، رتبه‌بندی‌ها برای یک کاربر مشخص بر روی یک آیتم مشخص پیش‌بینی می‌شود و فقط رتبه‌بندی‌های متشابه‌ترین کاربری که آیتم موردنظر را رتبه کرده است ارزیابی و بررسی می‌کند. نقطه مقابل الگوریتم‌های مبتنی بر حافظه، فیلترینگ مشارکتی مبتنی بر مدل وجود دارد که در تلاش است تا مدل‌های یاریگری برای پیش‌بینی رتبه‌بندی القا کند. تکنیک‌های یادگیری و الگوریتم‌های داده‌کاوی اغلب برای پشتیبانی از چنین مدل‌هایی، استفاده می‌شوند و الگوهایی را تعریف می‌کنند تا رتبه‌بندی‌ها را پیش‌بینی کنند. مشکل اصلی مربوط به فیلترینگ مشارکتی، ارائه‌ی ماتریس فضا است؛ بنابراین کاربران زیادی، اکثر آیتم‌ها را ارزیابی و بررسی نمی‌کنند، ماتریس رتبه‌بندی به یک ماتریس با پراکندگی بالا تبدیل می‌شود. یک ماتریس، همراه با ویژگی‌های پراکنده، یک چالش قابل‌توجهی را برای یادگیری ایجاد می‌کند. در حقیقت، باید رتبه‌بندی‌ها را درک کرد؛ بنابراین روشی که هدف آن بهره‌برداری از اطلاعات پشت داده‌ها است، منجر به‌پیش بینی‌های بهتر می‌شود. بعلاوه، باید به‌صورت ضمنی این اولویت‌ها را از طریق به‌کارگیری تحلیل متغیر معنایی ارائه دهد.

شکل ‏2‑1: نمودار درختی روش­های توصیه

مشکلات سیستم­های توصیه­گر

سیستم‌های توصیه‌گر باوجود کاربردها و مزایای زیاد، از یکسری چالش‌های اساسی رنج می‌برند که هدف الگوریتم‌های ارائه‌شده تاکنون، رفع یک یا چند مورد از این چالش‌ها است؛ که در زیر به چهار مورد از مهم‌ترین آن‌ها اشاره خواهیم کرد.

مشکل تنکی داده

این مشکل یکی از مهم‌ترین چالش‌ها در سیستم‌های توصیه‌گر است که عملکرد سیستم را به‌شدت تحت تأثیر قرار می‌دهد. این مشکل اشاره به حالتی دارد که در آن کاربران به تعداد کمی از آیتم‌ها، رتبه می‌دهند، یعنی از آیتم‌های زیادی که در سیستم وجود دارد، فقط تعداد اندکی از آن‌ها توسط کاربران، رتبه دهی شده‌اند. لذا زمانی که سیستم تنها به تعداد اندکی از رکوردهای مربوط به تراکنش­های سابق دسترسی داشته باشند، تشخیص اینکه کدام‌یک از مشتریان شبیه به یکدیگر بوده و علایق آن‌ها چیست، اساساً مشکل خواهد بود[25, 26]. یکی از راهکار پیشنهادی در این تحقیق استفاده از یکسری اطلاعات اضافی دامنه و یا ایجاد فرض‌هایی درباره­ی فرآیند ایجاد داده، برای حل این مشکل است، یعنی بتوان از اطلاعات اضافی برای کمک به تخمین دقیق­تر رتبه­هایی که هر کاربر به محصولات می­دهد، به‌خوبی استفاده کرد و براین اساس مشکل تنکی داده را تا حدی مناسبی برطرف کرد.

مشکل ویژه‌کاری[13]

در طول حیات سیستم، تلاش بر این است که آیتم‌هایی به کاربر پیشنهاد داده شوند که شباهت بیشتری به آیتم‌های انتخاب‌شده توسط او درگذشته داشته باشند. این باعث می‌شود که آیتم‌هایی که ممکن است موردپسند کاربر باشند ولی شباهتی به آیتم‌های انتخاب‌شده درگذشته ندارند، به کاربر هر گز پیشنهاد داده نشوند و از دید وی مخفی بمانند.

مشکل شروع سرد

مشکل شروع سرد تقریباً در همه سیستم‌های توصیه‌گر وجود دارد که کارایی سیستم را خیلی کاهش می‌دهد. به زبانی ساده می‌توان گفت مشکل شروع سرد هنگامی رخ می‌دهد که یک کاربر یا آیتم جدید وارد سیستم شود و سیستم در مورد آن‌ها اطلاعات یا دانش خاصی نداشته باشد، لذا در هنگام توصیه دچار مشکل می‌شود. این مشکل یکی از چالش‌های اساسی در سیستم‌های پالایش گروهی است[27]. یکی از اهداف این تحقیق به‌کارگیری اطلاعات دموگرافی کاربران برای کمک به فاکتورسازی موثرماتریس، جهت مقابله با این نوع مشکلات است، یعنی اگر کاربر رتبه­ایی در سیستم ندارد، بتوان از روی ویژگی­های دموگرافی او (سن، جنسیت، شغل،…) سلیقه کاربر را به محصولات مختلف پیش‌بینی کنیم.

استخراج اطلاعات در مورد آیتم‌ها و کاربران

در سیستم­های توصیه­گر هدف پیدا نمودن شباهت بین آیتم‌های مختلف و کاربران بر اساس صفات و محتویات آن‌هاست که در برخی از کاربردها و حوزه‌ها این کار بسیار پیچیده و دشوار است. لذا نیاز به راهکارهایی برای استخراج صفات و اطلاعات کاربران و آیتم­ها به‌صورت خودکار می‌باشد.

انعطاف‌پذیری

بیشتر الگوریتم­هایی که ارائه‌شده‌اند نمی­توانند به‌صورت همه­جانبه عمل کنند و در اکثر موارد با تغییر داده­هایی ورودی امکان گرفتن نتیجه مطلوب میسر نیست. لذا باید الگوریتمی ارائه شود که بتواند به‌صورت هم ­جانبه روی اکثر مجموعه­های دادهایی عمل کند.

کمبود داده

کمبود اطلاعات در دسترس سیستم، می‌تواند در ارائه پیشنهاد به کاربران تأثیر بسزایی داشته باشد. چون یک سیستم توصیه بر اساس داده‌های ورودی به آن عمل می‌کند. شرکت­هایی همچون گوگل، آمازون و…، به این دلیل داشتن اطلاعات زیاد درباره­ی آیتم­ها و کاربران، این قابلیت را به سیستم­های توصیه­گر می‌دهد که شانس بیشتری برای ارائه­ی پیشنهادهای خوب داشته باشد؛ بنابراین، یک سیستم توصیه­گر مؤثر و کارا، باید داده­های زیادی برای ارائه­ی پیشنهاد داشته باشد که معمولاً داده‌های موردنیاز در سیستم خیلی کم است و لذا باید به‌صورت مناسبی این چالش رو هم پر کرد[2]. لذا در این تحقیق برای غلبه بر کمبود داده از اطلاعات ضمنی بین آیتم­ها و کاربران برای کمک به رتبه‌های صریح کاربران استفاده‌ می­شود. یعنی ترکیبی از اطلاعات دموگرافی افراد و اطلاعات ثانویه آیتم­ها، می‌تواند برای غلبه بر کمبود داده استفاده شود.

مراحل خرید فایل دانلودی
اگر محصول را می پسندید لطفا آنرا به اشتراک بگذارید.

محصولات مرتبط

مجوز ارسال دیدگاه داده نشده است!

0