دانلود پایان نامه

ارها و بلکه ميليونها آيتم، باعث ميگردد تا دو کاربر، داراي اشتراک اندکي در امتيازدهي به آيتمهاي يکسان و مشابه باشند که اين امر محاسبه تشابه کاربران با يکديگر را با مشکل مواجه ميکند. معمولا مشکل بيان شده براي کاربراني که به تعداد زيادي آيتم امتياز دادهاند رخ نميدهد بلکه کاربراني که داراي تعداد اندکي امتياز دهي ميباشند سيستم توصيهگر مبتني بر روش پالايش گروهي را با مشکل مواجه ميکنند.

2-7- معيارهاي ارزيابي77 سيستمهاي توصيهگر

جهت ارزيابي کيفيت يک سيستم توصيهگر ميتوان نتايج توليدي آنرا با نتايج موجود از نظرات کاربران در خصوص آيتمهاي مختلف مقايسه نمود و بر اساس خطاي موجود ميان مقادير پيشبيني شده و نظرات واقعي کاربران، دقت سيستم را مشخص نمود[48][39][22].

2-7-1- خطاي جذر ميانگين مربعات (RMSE)78

متداولترين روش ارزيابي يک سيستم توصيهگر استفاده از معيار “خطاي مطلق ميانگين79″ميباشد که به صورت ميانگين قدر مطلق تفاضل امتياز پيشبيني شده توسط سيستم و امتياز واقعي در قالب فرمول شماره 7 محاسبه ميگردد.
(7)
MAE=(?_((u,i))?|r ?_(u,i)-r_(u,i) | )/N

در فرمول فوق r ?_(u,i) مقدار امتياز پيشبيني شده توسط سيستم براي کاربر u و آيتم i ميباشد و r_(u,i) مقدار واقعي امتياز کاربر u به آيتم i ميباشد و N تعداد رديفهاي مجموعه مورد ارزيابي ميباشد.
يکي ديگر از معيارهاي ارزيابي مرتبط با معيار خطاي مطلق ميانگين معيار “خطاي جذر ميانگين مربعات”ميباشد[49][50] که درآن تاکيد بيشتري بر روي مقادير بزرگتر خطاي مطلق وجود دارد. نحوه محاسبه اين نوع خطا مطابق فرمول شماره 8 ميباشد.
(8)
RMSE=?((?_((u,i)|R_(u,i))?(r ?_(u,i)-r_(u,i) )^2 )/N)

در فرمول فوق R_(u,i)، متغيري دوحالته است که نشان دهنده اين مطلب است که دردادههاي موجود، آيا به آيتم i توسط کاربر u امتياز داده شده است يا خير. هرچه که مقدارRMSE کمتر باشد نشان دهنده دقت بالاتر نتايج سيستم توصيهگر ميباشد.

2-7-2- معيار درصد پوشش80

يکي ديگر از معيارهاي ارزيابي سيستمهاي توصيهگر معيار “درصد پوشش” ميباشد که اندازه آن بيانگر درصد زوجهايآيتم،کاربر موجود در دادههاي مورد ارزيابي که سيستم توصيهگر ميتواند براي آنها امتيازي پيشبيني نمايد به تعداد کل زوجهاي آيتم،کاربر موجود در مجموعه داده مورد ارزيابي ميباشد .
(9)
Coverage=(جواب داراي (u,i)هاي زوج تعداد)/(ارزيابي مورد مجموعه در موجود (u,i)هاي زوج کل تعداد)*100

2-7-3- معيار دقت81

اين معيار داراي مقاديري در بازه ]1,0[ مي باشد و بيانگر ميزان وجود خطا ميباشد. مقدار صفر بيانگر وجود خطاي مطلق و مقدار يک بيانگر عدم وجود خطا ميباشد لذا با فرض اينکه نتايج خروجي سيستم توصيهگر عددي صحيح در بازه ]5,1[ ميباشد ميتوان مقدار معيار دقت را در قالب فرمول ذيل تعريف نمود[48].
(10)
Percision=1-RMSE/4

عدد 4 در مخرج کسر فرمول فوق بيانگر حداکثر ميزان خطاي موجود (1-5=4)ميباشد.

2-7-4- معيار F-Measure

براي ترکيب معيارهاي درصد پوشش وخطاي جذر ميانگين مربعات در قالب يک معيار، F-Measure محاسبه ميگردد اما براي اينکار بايد خطاي جذر ميانگين مربعات به معيار دقت که در بالا معرفي گرديد تبديل و بر اساس عددي در بازه ]1,0[ نمايش داده شود. بنابراين فرمول F-Measure به صورت زير تعريف ميگردد[20] :

(11)
F-Measure=(2*Coverage*Precision)/(Coverage+Precision)

فصل سوم

مروري بر مطالعات و تحقيقات پيشين

3- مروري بر مطالعات و تحقيقات پيشين

3-1- مقدمه

در سالهاي اخير از تکنيکها و روشهاي مختلف آماري، دادهکاوي، هوش مصنوعي و الگوريتمهاي رياضي در پيادهسازي سيستمهاي توصيهگر مورد استفاده قرار گرفته است. در بخش قبل به صورت کلي و مختصر هر يک از روشهاي فوق معرفي گرديدند و در اين بخش کارهايي که در زمينه رفع مشکلات و نقايص آنها انجام شده است و همچنين روند پيشرفت تحقيقات صورت گرفته در زمينه بهبود و توسعه سيستمهاي توصيهگر مبتني بر اعتماد بيان ميگردد تا بر اساس اين مطالعات، بتوان زمينه فعاليتهاي آينده را مشخص نمود.
اين روشها، تکنيکها و الگوريتمها به لحاظ سرعت، هزينه اجرا، دقت، تک هدفي يا چند هدفي بودن، در نظر گرفتن نيازهاي کوتاه مدت و بلند مدت کاربران با يکديگر تفاوت دارند و هريک در پاره اي از موضوعات کاربرد مناسبتر و راندمان بهتري دارند، لذا بايد در حوزه هاي مختلف و از ابعاد گوناگون مورد بررسي قرار گيرند.

3-2- مرور کارهاي گذشته

جهت رفع ايراد سيستمهاي توصيهگر مبتني بر روش پالايش گروهي، تعدادي از محققان با بهرهگيري از مقوله اعتماد و شبکههاي مبتني بر اعتماد باعث بهبود و توسعه سيستمهاي توصيهگر و ايجاد مدلهاي مبتني بر اعتماد گرديدهاند[51]-[54][39].
اين مدلها نقش بسزايي در بسياري از سايتهاي تجاري ايفا ميکنند به عنوان مثال سيستمهاي پاسخگويي به سوالات ميتوانند بر اساس پاسخهاي کاربران و تاييد يا تکذيب پاسخها توسط ساير کاربران نسبت به محاسبه اعتماد اقدام نمايند و پاسخهاي مناسبتري را به کاربران خود ارائه دهند[55]. سيستمهاي توصيهگر همچنين ميتوانند پيشنهاداتي مناسب نظر و سليقه کاربران خود ارائه دهند به عنوان مثال سايت Epinions بر اساس اعتماد کاربران به يکديگر، نظرات ساير کاربران در خصوص يک آيتم خاص را به صورت مرتب شده به کاربران خود نمايش ميدهد.اعتماد و مدلهاي مبتني بر اعتماد، در شاخه هاي بسيار زيادي از علوم کامپيوتر و بستههاي نرم افزاري مورد استفاده قرار ميگيرند. Artz و Gil در تحقيق خود [56] مطالعات حوزه اعتماد و کاربرد آنرا در 4 دسته کلي طبقهبندي مينمايد. دسته اول مدلهايي هستند که از سياستهاي موجود و محدوديتها و قوانين مديريتي موجود براي ايجاد رابطه اعتماد استفاده مينمايند. دسته دوم مدلهاي عمومي اعتماد مانند مدلهاي مطرح شده در [57], [58]ميباشند. دسته سوم مدلهاي اعتماد در منابع اطلاعات مانند مدل ارائه شده در [55] مي باشد و دسته چهارم مدلهاي اعتماد مبتني بر شهرت82 ميباشند.
در يک طبقهبندي ديگر سيستمهاي مبتني بر اعتماد به دسته کلي “احتمالي83” و “تدريجي84” تقسيم بندي و در قالب نمايش “اعتماد” در مقابل “اعتماد و عدم اعتماد” بيان ميگردند. در جدول 3-1 پاره اي از کارهاي صورت گرفته در هر دسته نمايش داده شده است.
در رويکرد احتمالي مقادير اعتماد در قالب وجود يا عدم وجود اعتماد بيان ميگردند به عبارت ديگر مقدار اعتماد ميان دو فرد 0 يا 1 است و احتمال اينکه يک کاربر مورد اعتماد واقع شود بر اين اساس محاسبه ميگردد.
جدول 3-1 : دستهبندي مدلهاي اعتماد
اعتماد و عدم اعتماد
اعتماد به تنهايي
دستهبندي
J?sangو همکاران[59]
Kamvar و همکاران[60]
Richardson و همکاران[61]
Zaihrayeu و همکاران[55]
احتمالي
De Cockو همکاران[62]
Guha و همکاران[63]
Abdul-Rahmanو همکاران[64]
Falcone و همکاران[57]
Golbeck ]15[
Massa و همکاران[19]
تدريجي

در برخي موارد اعتماد بر اساس تعداد تراکنش و مراودات مثبت و منفي ميان دو کاربر در يک فضاي مجازي ميباشد، به عنوان مثال، مدل ارائه شده توسط Noh يک مدل رسمي بر اساس نظرات متقابل کاربران در يک شبکه اجتماعي ميباشد[65].
در مقابل در رويکرد تدريجي مقدار اعتماد به صورت درجه بندي ميان دو مقدار و به صورت فازي بيان ميگردد و مقدار مطلق 0 يا 1 نيست بلکه ميتواند به صورت يک عدد اعشاري در محدوده ]1,0[ بيان گردد به عنوان مثال، مدلهاي ارائه شده در تحقيقات [62][63][66] از اين رويکرد در مدلهاي پيشنهادي خود استفاده نمودهاند. در اين رويکرد مقادير اعتماد به عنوان مقادير احتمال تفسير نميشوند بلکه مقدار بالاتر اعتماد نشان دهنده اعتماد بيشتر به نظرات کاربر ميباشد که اين امر مرتب سازي نظرات بر اساس مقادير اعتماد را به يک فاکتور مهم تبديل ميکند. در زندگي روزمره نيز اعتماد به عنوان يک مقوله تدريجي در ميان افراد وجود دارد و افراد به يکديگر تا حد و حدودي اعتماد دارند و به صورت يک رابطه مطلق نميباشد. به عنوان مثال در [67], [68] از واژههاي فازي براي بيان اعتماد موجود ميان کاربران در يک شبکه نقطه به نقطه85يا يک شبکه اجتماعي استفاده ميگردد يا به عنوان يک مثال کلاسيک از بيان تدريجي اعتماد، ميتوان به مدل تحقيق [64] اشاره نمود که در آن از 4 واژه “بسيار مورد اعتماد”، “مورد اعتماد”، “غير قابل اعتماد” و “بسيار غير قابل اعتماد” براي بيان اعتماد در نظر گرفته شده است.
در سالهاي اخير رويکرد تدريجي به دليل تطابق با دنياي واقعي، بيشتر مورد نظر محققان قرار گرفته است و در زمينه هاي مختلف خصوصا سيستمهاي توصيهگر مورد استفاده قرار گرفته است، به عنوان مثال در [15][39] از رويکرد تدريجي به عنوان پايه مدل مبتني بر اعتماد استفاده شده است.
در حاليکه استفاده از مفهوم “اعتماد” به سرعت در حال پيشرفت مي باشد و کاملا در تحقيقات جايگاه خود را تبيين نموده است ولي استفاده و مدل سازي بر اساس مفهوم “غير قابل اعتماد86” هنوز ناشناخته باقي مانده است و تحقيقات خاصي در اين زمينه صورت نگرفته است. در مقالات [69], [70] سعي شده است تا مفهوم “غير قابل اعتماد ” در قالب مدل بيان شوند ولي مدلهايي که تواما هر دو مفهوم را در مدل خود لحاظ نموده باشند بسيار نادر و کمياب ميباشند و تنها مدل احتمالي موجود، که هر دو مفهوم را به صورت توام در نظر گرفته است مدل ارائه شده توسط J?sang ميباشد[59][71].

3-2-1- مدل MoleTrust

در ميان کارها و تحقيقات صورت گرفته مدل ارائه شده توسط Massa و Avesani محبوبترين مدل موجود در اين زمينه ميباشد [51][72], [73] و اين مدل در يک سيستم توصيهگر کاربردي به نام Moleskiing به صورت عملي مورد استفاده قرار گرفته است[74].
مدل مذکور به دليل محبوبيت، به عنوان پايه و اساس بسياري از تحقيقات ديگر در نظر گرفته ميشود. معماري مدل MoleTrust در شکل 3-1 نمايش داده شده است .

شکل 3-1 : معماري مدل MoleTrustارائه شده توسط Massa

ورودي مدل، ماتريس امتيازات و ماتريس اعتماد ميان کاربران و خروجي آن امتياز پيشبيني شده براي آيتمهاي مختلف و تمامي کاربران ميباشد. ماتريس اعتماد، در واقع مجموعه روابط اعتماد ميان کاربران سيستم توصيهگر ميباشد. هر عنصر از اين ماتريس بيانگر وجود و مقدار رابطه اعتماد ميان دو کاربر ميباشد. ماتريس امتيازات نشان دهنده امتياز دهي کاربران به آيتمهاي مختلف ميباشد و هر عنصر آن نشان دهنده امتياز داده شده توسط يک کاربر به يک آيتم خاص مي باشد.
روش پيشبيني امتيازات در مدل ارائه شده توسط Massa شبيه روش پالايش گروهي ميباشد با اين تفاوت که در روش پالايش گروهي، محاسبه امتيازات بر اساس تشابه کاربران با يکديگر ميباشد در حاليکه در مدل مبتني بر اعتماد، بر اساس وزن اعتماد ميان کاربر مقصد و ساير کاربران، امتياز نهايي مطابق فرمول زير محاسبه ميگردد.
(12)

که در فرمول فوق w_(a,u) از فرمول زير محاسبه ميگردد.
(13)

در فرمول فوق d_max حداکثر مجاز عمق پيمايش87 در شب
که اعتماد ميباشد که توسط مدير سيستم قابل تنظيم ميباشد و معمولا عددي در محدوده 1 تا 6 مي باشد. d_(a,u) فاصله ميان کاربر مبدا a تا کاربر توصيه کننده u ميباشد. در مدل MoleTrust ارائه شده توسط Massa فاصله انتشار اعتماد، در واقع کوتاهترين مسير موجود ميان کاربر هدف و کاربر مورد اعتماد وي در شبکه اعتماد ميباشد.
با توجه به مکانيزم موجود در مدل Massa، مقدار پارامتر حداکثر عمق قابل پيمايش در شبکه اعتماد، از اهميت بالايي برخوردار است ولي مکانيزم مشخص و معيني براي تعيين اين پارامتر وجود ندارد و مقادير مختلفي توسط محققان براي اين پارامتر پيشنهاد شده است. نکته قابل توجه اين است که در صورتيکه مقدار اين پارامتر 1 در نظر گرفته شود ممکن است نظرات ارزشمند کاربراني که در فواصل دورتري نسبت به کاربر هدف قرار دارند در نظر گرفته نشود و از طرف ديگر در نظر گرفتن مقادير بزرگ، مانند 6 براي اين پارامتر، باعث افزايش تصاعدي پيچيدگي محاسبات ميگردد لذا بسته به توپولوژي شبکه، ساختار، تعداد کاربران و روابط ميان ايشان بايد مقدار مناسبي را براي اين پارامتر در نظر گرفت.

3-2-2- مدل TidalTrust

يکي ديگر از مدلهاي مطرح در زمينه سيستمهاي توصيهگر مبتني بر اعتماد، مدل ارائه شده توسط Golbeck ميباشد که اين مدل تحت نام TidalTrust مطرح گرديده است[15]. در مدل ارائه شده توسط Massa جستجو در عمق شبکه اعتماد ميان کاربران صورت ميگيرد اما در اين مدل جستجو در عرض شبکه اعتماد رخ ميدهد، به عبارت ديگر، کاربران نظر دهندهاي که داراي کوتاهترين مسير با کاربر مبدا در شبکه اعتماد مي باشند، جستجو ميگردند و سپس از تجميع وزني امتيازات تخصيص داده شده توسط اين کاربران به آيتم هدف بر اساس مقدار اعتماد ميان ايشان و کاربر مبدا، محاسبه پيشبيني امتياز صورت ميگيرد. در اين مدل براي محاسبه ميزان اعتماد ميان دو کاربرu و v که مستقيما با يکديگر ارتباط ندارند، از تجميع مقادير اعتماد ميان همسايگان مستقيمu و v بر اساس وزن ميزان اعتماد ميان u و همسايگان مستقيمش استفاده ميگردد. از آنجائيکه مدل TidalTrust تنها از نظرات کاربراني که در کوتاهترين فاصله با کاربر مبدا ميباشند استفاده ميکند، ممکن است اطلاعات ارزشمندي را که در فواصل دورتر در شبکه اعتماد ميان کاربران موجود ميباشد را مد نظر قرار ندهد که اين امر ميتواند باعث کاهش دقت و همچنين کاهش درصد پوشش اين مدل گردد.

3-2-3- مدل دانه سيب88

يکي ديگر از مدلهاي موجود در زمينه انتشار اعتماد و نحوه محاسبه آن مدل دانه سيب ميباشد [75]. پايه اين مدل بر اساس مدلهاي فعالسازي انتشار89 ميباشد. در اين مدل، کاربر مبدا u با تزريق انرژي e فعال ميگردد و سپس اين انرژي در گراف ميان کاربران بر اساس وزن هر يال انتشار و تقسيم ميگردد. در اين مدل ميزان اعتماد به صورت افزايشي در نظر گرفته ميشود به اين معني که اگر تعدادي مسير ميان دو کاربر وجود داشته باشد که هر مسير داراي ميزان اعتماد اندکي باشد در نهايت ميزان اعتماد ميان آن دو کاربر زياد و قابل ملاحظه خواهد بود که اين اصل در رويکرد سيستمهاي توصيهگر مبتني بر اعتماد قابل لمس و درک نميباشد.

3-2-4- مدل ارائه شده توسط Anderson

مدلي ديگر نيز توسط Anderson و همکارانش ارائه شده است[10] که در آن مجموعهاي از محورها


دیدگاهتان را بنویسید