هما نصیری

\| تاریخ ارسال: ۱۴۰۰/۱۲/۸ \|

ارائه دهنده: هما نصیری اساتید راهنما: دکتر مرتضی آنالویی هیات داوران: دکتر بهروز مینایی بیدگلی دکتر حمید بیگی زمان: ۱۴۰۰/۱۲/۰۹ ساعت ۱۶:۰۰ خانم هما نصیری دانشجوی کارشناسی ارشد جناب آقای دکتر مرتضی آنالویی روز دوشنبه ۰۹ اسفند ماه ساعت ۱۶:۰۰ از پروژه کارشناسی ارشد خود تحت عنوان " تشخیص موضع در متون فارسی به کمک یادگیری انتقالی و افزایش داده " دفاع خواهند نمود. چکیده پایان نامه: با گسترش شبکه‌های اجتماعی نظیر فیس‌بوک، اینستاگرام و توییتر، روزانه حجم عظیمی از اطلاعات تولید و تکثیر شده که می‌تواند حاوی محتوای مشکوک و نادرست باشد. این محتواها با اهدافی نظیر جلب مخاطب، تأثیرگذاری بر عقاید و تصمیمات افراد، افزایش درآمد حاصل از کلیک و تاثیرگذاری بر رویدادهای مهم مانند انتخابات سیاسی تولید می‌شوند. شناسایی این اخبار به روش سنتی و دستی معمولا کاری بسیار زمان‌بر، پرهزینه و طاقت‌فرسایی بوده درنتیجه لزوم وجود ابزارهای کشف اخبار جعلی به یک ضرورت اساسی بدل شده تا مردم از سردرگمی‌های ایجاد شده توسط این محتواهای مشکوک و نادرست رها شوند. شناسایی مقالات خبری جعلی با درک آنچه سایر پایگاه‌های خبری در مورد همان موضوع گزارش می‌دهند، می‌تواند اولین قدم ارزشمند باشد. این مرحله به عنوان تشخیص موضع شناخته می‌شود. تمرکز این پژوهش در حل مسئله تنک‌بودن و کمبود داده با کیفیت در حوزه تشخیص موضع زبان فارسی است. به کمک روش‌های افزایش داده EDA تلاش شد تا با تولید نمونه‌های جدید در داده‌ی آموزشی، تنک‌بودن داده‌های برخی از کلاس‌های این وظیفه که باعث عدم شناسایی کلاس‌های مربوطه می‌شد، تا حدی رفع و مقداری توازن به مجموعه داده اضافه‌ شود. به طور معمول در کارهای انجام‌شده در تشخیص موضع و یا شایعه زبان فارسی، بازنمایی داده‌ها، توسط الگوریتم‌های مبتنی بر پیش‌بینی بوده که در این پژوهش بر خلاف کارهای موجود، به کمک تعبیه‌ساز پارس‌برت که جز تعبیه‌سازهای مبتنی بر محتواست، بازنمایی متفاوتی از هر کلمه با توجه به محتوای به کار رفته در آن، در اختیار مدل قرار گرفت تا بتواند برچسب‌های هر کلاس را بهتر شناسایی کند. همچنین با استفاده از مدل از پیش آموزش داده‌شده پارس‌برت، تلاش شد تا کمبود داده‌های این حوزه با اطلاعات و دانشی که مدل از فاز پیش‌آموزشی بر روی پیکره‌های متفاوت کسب کرده، جبران شود. در نهایت هم، به کمک الگوریتم ASHA، فراپارامترهای مناسب مدل جهت فرآیند آموزشی آن، انتخاب و به کار گرفته‌شد که به نسبت روش آزمون و خطای انتخاب فراپارامتر، به انتخاب بهینه‌تر ترکیب فراپامترها انجامید. نتایج حاصل از این پژوهش بیان‌گر آن است که با کمک روش‌های افزایش داده، بازنمایی محتوایی داده‌های به کار رفته و مدل پارس‌برت می‌توان موضع‌ یک خبر نسبت به ادعای مطرح‌شده را بهتر از کارهای موجود شناسایی کرد. "دفاع به‌صورت آنلاین برگزار می‌شود" دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی

دفعات مشاهده: ۱۷۱۷ بار | دفعات چاپ: ۱۶۹ بار | دفعات ارسال به دیگران: ۰ بار | ۰ نظر


سایر مطالب این بخش	نسخه قابل چاپ	ارسال به دوستان

Persian site map - English site map - Created in 0.18 seconds with 53 queries by YEKTAWEB 4709