پایان نامه ارشد با موضوع اجرای برنامه

میشود. در مرحله پردازش متنی هدف پردازش توصیفهای متنی سرویس است. مستندات متنی سرویس به صورت فایلهای WSDL ارائه میگردند. برای پردازش متنی مستندات WSDL محتوای تگ Documentation و نام پیامها و پارامترها را از تگ Message استخراج مینماییم. در مرحله بعد کلمات ترکیبی را براساس تغییر Case از هم جدا مینماییم. برای مثال کلمه ترکیبی BookTicket به کلمات Book و Ticket تفکیک میشود. در مرحله بعد کلماتی که در لیست توقف107 وجود دارند را حذف مینماییم. لیست توقف شامل حروف اضافه و به طور کلی بخشهایی از زبان میشود که کاربرد کلی دارند و از نظر معنایی برای ما ارزش خاصی ندارند. سپس در مرحله Stemming افعال را به مصدر و اسامی جمع را به مفرد تبدیل مینماییم. برای این منظور از پایگاهداده واژگانی WordNet استفاده مینماییم. لیست به دست آمده خروجی مرحله کلاسهبندی سرویسها میباشد. این لیست میبایست در اختیار مرحله کلاسهبندی سرویسها قرار گیرد.
در مرحله کلاسهبندی سرویسها هر سرویس به دامنه خاصی که به آن تعلق دارد منسوب میشود. برای این منظور از روش SVM استفاده میگردد. در پیادهسازی صورت گرفته از ابزار LIBSVM استفاده شده است. برای اعمال روش SVM میبایست لیست کلماتی که از مرحله پردازش متنی به دست آوردیم را به بردار تبدیل نماییم. در نتیجه به ازای هر یک از سرویسها یک بردار خواهیم داشت که هر مولفه این بردار متناظر با یک کلمه میباشد. مقداری هم که در بردار برای هر مولفه در نظر گرفته شده است برابر با مقدار TFIDF(i, j) است. بهطوریکه مقدار TFIDF برای سرویس i و کلمه j محاسبه میگردد. نمایی از بردار مذکور در شکل ‏61 آمده است.

کلمهکلیدی N

کلمهکلیدی 3
کلمهکلیدی 2
کلمهکلیدی 1

TFIDF(i, N)

TFIDF(i, 3)
TFIDF(i, 2)
TFIDF(i, 1)
بردار سرویس i
شکل ‏61- بردار نمونه یک سرویس در روش متنی بر SVM

در شکل ‏61 منظور از TFIDF(i, 1) محاسبهی مقدار TFIDF برای سرویس i و کلمهکلیدی 1 میباشد.
تابع Kernel ای هم که به کارگرفته شده تابع غیرخطی sigmoid میباشد.
ارزیابی این روش شامل دو فاز آموزش و تست میباشد. برای اجرای فاز آموزش از 70 درصد مجموعهداده و برای اجرای فاز تست از 30 درصد باقیمانده مجموعه داده استفاده نمودهایم. در ادامه با جزئیات بیشتری به بررسی هر یک از فازها خواهیم پرداخت.
فاز آموزش
مجموعهدادهای که در این پژوهش از آن بهرهگرفته شد، شامل 1088 سرویس وب که متعلق به 9 دامنه مختلف میباشد. در فاز آموزش از 70 درصد سرویسهای وب این مجموعهداده استفاده شده است. انتخاب سرویسهای وب به این صورت انجام گرفته که بهطور تصادفی برای هر دامنه 70 درصد سرویسهای مرتبط با آن دامنه برای فاز آموزش جدا شده و 30 درصد سرویسهای باقیمانده برای فاز تست کنار گذاشته شده است.
در فاز آموزش با استفاده از ابزار LIBSVM Tools و مجموعهداده در نظر گرفته شده برای فاز آموزش، مدل آموزشدادهشده 108را به دست آوردیم.
فاز تست
در فاز تست مدل آموزشدادهشدهای را که از فاز آموزش به دست آوردیم برای پیشبینی کلاس برای 30 درصد از دادهای که برای فاز تست در نظر گرفتهایم استفاده نمودیم.
بررسی دقت روش مبتنی بر SVM
در این قسمت به بررسی دقت روش مبتنی بر SVM میپردازیم. نتیجهای که از بررسی دقت روش مبتنی بر SVM به دست آمده است در جدول ‏65 مشاهده میشود.

پیشنهاد یک دامنه
پیشنهاد دو دامنه
پیشنهاد سه دامنه
صحیح
198
241
270
کل
325
325
325
دقت
61%
74%
83%
جدول ‏65- بررسی دقت روش مبتنی بر SVM
ستون پیشنهاد یک کلاس مربوط به حالتی میشود که برای هر سرویس وب تنها یک کلاس پیشنهاد داده شده است. ستونهای پیشنهاد دو کلاس و پیشنهاد سه کلاس به ترتیب مربوط به حالتهایی میشوند که برای هر سرویس وب به ترتیب 2 و 3 کلاس پیشنهاد داده شده است.
بررسی زمان اجرای روش مبتنی بر SVM
برای ارزیابی زمان اجرای روش مبتنی بر SVM مجموعهداده را به 5 قسمت مساوی تقسیم نمودیم و برای هر قسمت به طور جداگانه عملیات کلاسهبندی صورت گرفت و زمان مربوط به هر اجرا ثبت گردید. در نهایت میانگین زمانهای اجرا را به عنوان نتیجه اصلی مورد نظر قرار دادیم. نتایج حاصل از اجرای برنامه در جدول ‏66 آمده است.

اجرای اول
اجرای دوم
اجرای سوم
اجرای چهارم
اجرای پنجم
زمان اجرا
55
64
56
51
65
میانگین
58 ثانیه
جدول ‏66- زمانی اجرای روش مبتنی بر SVM

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *