ارائه دهنده:
پوریا پیروزفر
استاد راهنما:
دکتر
بهروز مینایی
هیات داوری:
دکتر حسین رحمانی
دکتر مریم حورعلی
زمان:
۱۴۰۱/۰۸/۰۷
ساعت ۱۵:۰۰
آقای پوریا پیروزفر دانشجوی کارشناسی ارشد آقای دکتر بهروز مینایی روز شنبه ۷ آبانماه ساعت ۱۵:۰۰ از پروژه کارشناسی ارشد خود تحت عنوان "ارائه روش ترکیبی از مدل های مبتنی بر مبدل های چندزبانه برای بهبود شباهت یابی جملات" دفاع خواهند نمود.
چکیده پایان نامه:
شباهتیابی معنایی متون یکی از زیرشاخههای پردازش زبان طبیعی است که در چند سال اخیر تحقیقات گستردهای را به خود معطوف کردهاست. منظور از شباهتیابی معنایی، محاسبه میزان شباهت معنایی بین دو سند متنی، پاراگراف یا جمله میباشد که به دو صورت تک زبانه و چندزبانه مطرح است. هدف اصلی این پایان نامه ارائه روشی بهبودیافته برای شباهتیابی بین جملاتی میباشد که زبان متفاوتی دارند؛ بعضی از روشهایی که تاکنون ارائه شدهاند بصورت مستقیم و با ایجاد فضای برداری یکسان این عمل را انجام میدهند و بعضی از آنها نیز از ماشینهای ترجمه برای یکسان کردن زبان دو جمله استفاده میکنند سپس با استفاده از روشهای شباهتیابی جملات تکزبانه میزان شباهت دو جمله را اندازهگیری میکنند و این میزان شباهت با عددی بین ۰ تا ۵ مشخص میشود.
در چند سال اخیر مدلهای زبانی مبتنی بر مبدلها ارائه شدهاند، که زمینهی مناسبی برای پیشرفت در زمینه شباهتیابی متون را فراهم کردهاست و همین موضوع انگیزه ما برای این پژوهش شدهاست و در روش ما این مدلها با استفاده از مجموعه دادهای که تولید شده است تنظیم دقیق شده است و با استفاده از روش مناسبی، این مدلها ترکیب شدهاند و جهت شباهتیابی جملات بینزبانی (زبان فارسی-انگلیسی) مورد استفاده قرار گرفتهاست.
روشهای ترکیبی که در این پایاننامه ارائه شدهاست، علاوه بر حفظ مزایای روشهای پیشین، معایب آنها را برطرف مینماید و نسبت به روشهای پیشین و مدلهای مبتنیبر مبدلها، برای کار شباهتیابی جملات بینزبانی، بهبود حدود ۱۰ تا ۱۲ درصدی همبستگی پیرسون را برای جفت زبان فارسی – انگلیسی به همراه داشته است.
واژههای کلیدی: شباهتیابی جملات، جملات بینزبانی، بازنمایی جملات
|