ارائه دهنده:
هما نصیری
اساتید راهنما:
دکتر مرتضی آنالویی
هیات داوران:
دکتر بهروز مینایی بیدگلی
دکتر حمید بیگی
زمان:
۱۴۰۰/۱۲/۰۹
ساعت ۱۶:۰۰
خانم هما نصیری دانشجوی کارشناسی ارشد جناب آقای دکتر مرتضی آنالویی روز دوشنبه ۰۹ اسفند ماه ساعت ۱۶:۰۰ از پروژه کارشناسی ارشد خود تحت عنوان "
تشخیص موضع در متون فارسی به کمک یادگیری انتقالی و افزایش داده
" دفاع خواهند نمود.
چکیده پایان نامه:
با گسترش شبکههای اجتماعی نظیر فیسبوک، اینستاگرام و توییتر، روزانه حجم عظیمی از اطلاعات تولید و تکثیر شده که میتواند حاوی محتوای مشکوک و نادرست باشد. این محتواها با اهدافی نظیر جلب مخاطب، تأثیرگذاری بر عقاید و تصمیمات افراد، افزایش درآمد حاصل از کلیک و تاثیرگذاری بر رویدادهای مهم مانند انتخابات سیاسی تولید میشوند. شناسایی این اخبار به روش سنتی و دستی معمولا کاری بسیار زمانبر، پرهزینه و طاقتفرسایی بوده درنتیجه لزوم وجود ابزارهای کشف اخبار جعلی به یک ضرورت اساسی بدل شده تا مردم از سردرگمیهای ایجاد شده توسط این محتواهای مشکوک و نادرست رها شوند. شناسایی مقالات خبری جعلی با درک آنچه سایر پایگاههای خبری در مورد همان موضوع گزارش میدهند، میتواند اولین قدم ارزشمند باشد. این مرحله به عنوان تشخیص موضع شناخته میشود.
تمرکز این پژوهش در حل مسئله تنکبودن و کمبود داده با کیفیت در حوزه تشخیص موضع زبان فارسی است. به کمک روشهای افزایش داده EDA تلاش شد تا با تولید نمونههای جدید در دادهی آموزشی، تنکبودن دادههای برخی از کلاسهای این وظیفه که باعث عدم شناسایی کلاسهای مربوطه میشد، تا حدی رفع و مقداری توازن به مجموعه داده اضافه شود. به طور معمول در کارهای انجامشده در تشخیص موضع و یا شایعه زبان فارسی، بازنمایی دادهها، توسط الگوریتمهای مبتنی بر پیشبینی بوده که در این پژوهش بر خلاف کارهای موجود، به کمک تعبیهساز پارسبرت که جز تعبیهسازهای مبتنی بر محتواست، بازنمایی متفاوتی از هر کلمه با توجه به محتوای به کار رفته در آن، در اختیار مدل قرار گرفت تا بتواند برچسبهای هر کلاس را بهتر شناسایی کند. همچنین با استفاده از مدل از پیش آموزش دادهشده پارسبرت، تلاش شد تا کمبود دادههای این حوزه با اطلاعات و دانشی که مدل از فاز پیشآموزشی بر روی پیکرههای متفاوت کسب کرده، جبران شود. در نهایت هم، به کمک الگوریتم ASHA، فراپارامترهای مناسب مدل جهت فرآیند آموزشی آن، انتخاب و به کار گرفتهشد که به نسبت روش آزمون و خطای انتخاب فراپارامتر، به انتخاب بهینهتر ترکیب فراپامترها انجامید. نتایج حاصل از این پژوهش بیانگر آن است که با کمک روشهای افزایش داده، بازنمایی محتوایی دادههای به کار رفته و مدل پارسبرت میتوان موضع یک خبر نسبت به ادعای مطرحشده را بهتر از کارهای موجود شناسایی کرد.
"دفاع بهصورت آنلاین برگزار میشود"
دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی
|