ارائه دهنده:
سید هیمن قادری
استاد راهنما:
دکتر
حسن نادری
هیات داوری:
دکتر محمدرضا کنگاوری
دکتر محمود نشاطی
زمان:
۱۴۰۱/۰۸/۱۶
ساعت ۱۶:۰۰
آقای سید هیمن قادری دانشجوی کارشناسی ارشد آقای دکتر حسن نادری روز دوشنبه ۱۶ آبانماه ساعت ۱۶:۰۰ از پروژه کارشناسی ارشد خود تحت عنوان "ارائه الگوریتمی مبتنی بر شباهتیابی معنایی برای استخراج پاسخهای نامزد در سامانههای پرسشوپاسخ" دفاع خواهند نمود.
چکیده پایان نامه:
امروزه بسیاری از درخواستها روی سامانههای پرسش پاسخ از جنس چندگامی و به صورت زبان طبیعی هستند. پرسشهایی که صرفا با تکیه بر یک پاراگراف یا سند نمیتوان به پاسخ دقیق رسید. بسیاری از پرسشها شواهد چندگانه که در اسناد مختلف پراکنده هستند را نیاز دارند. برای این کار لازم است که اطلاعاتی مختلفی بازیابی شوند که از لحاظ معنایی با پرسش مرتبط باشند. با این کار میتوان دانشی را استخراج کرد که به صورت عادی قابل دسترس نباشد.
از آنجا که اطلاعات لازم جهت بازیابی اسناد مرتبط در پرسشهای چندگامی به صورت مستقیم گنجانده نمیشوند سامانههای بازیابی اطلاعت موجود توانایی شناسایی و بازیابی همه اسناد مرتبط را ندارند. برای این پرسشها نیازمند سامانه بازیابی اطلاعاتی هستیم که روابط بین اسناد مرتبط با پاسخ را شناسایی و اطلاعات لازم را بازیابی کند. زمانی که پرسش چندگامی مطرح شده به صورت دامنه باز و تعداد اسناد موجود زیاد باشد، فرایند بازیابی اطلاعات چالشبرانگیزتر خواهد بود.
در این پژوهش هدف پیدا کردن روابط بین پرسش و اسناد و بازرگرداندن اسناد مرتبط است که راه رسیدن به پاسخ نهایی را هموار کند. پرسشهای چندگامی موضوعی است که در این پژوهش مورد بررسی قرار میگیرد. شناسایی نوع پرسش و استفاده از بازیابیهای چند مرحلهای راهکاری است که در این پژوهش مورد بررسی قرار میگیرد. در سالهای اخیر استفاده از مدلهای مبتنی بر شبکههای عصبی از پیش آموزش دیده شده منجر به بهبود نتایج در حوزه بازیابی اطلاعات و پردازش زبان طبیعی شده است. در این پژوهش نیز از مدلهای مختلف مانند مدلهای تبدیلکننده، برت و شبکههای عصبی عمیق جهت بهبود عملکرد بازیابی اطلاعات استفاده شده است. جاسازی متن در بردار، استخراج موجودیتهای و در نهایت تاکید بر کلمات کلیدی در پرسش و متن از مهمترین بخشهای این پژوهش است.
الگوریتم پیشنهادی روی مجموعه داده هات پات کیوای ارزیابی شده است. این مجموعه داده در سال ۲۰۱۸ برای ارزیابی سامانههای پرسشپاسخ چندگامی ایجاد شده است. همچنین روش ارائه شده روی بیش از ۵ میلیون مقاله ویکیپدیا به خوبی عمل کرده و نسبت به روشهای پایه بهتر عمل کرده است.
واژههای کلیدی: پردازش زبان طبیعی، بازیابی اطلاعات، پرسشپاسخ، درک مطلب ماشین.
|