دانشکده مهندسی کامپیوتر- دفاعیه ارشد
بهروز جان‌فدا

حذف تصاویر و رنگ‌ها  | تاریخ ارسال: 1400/1/30 | 

ارائه­ دهنده:

بهروز جان‌فدا

  استاد راهنما:

دکتر بهروز مینایی
هیات داوران:

دکتر محمد رضا کنگاوری؛ دکتر سعیده ممتازی
زمان:
سه شنبه ۱۴۰۰/۰۱/۳۱


آقای بهروز جان‌فدا دانشجوی کارشناسی ارشد آقای دکتر بهروز مینایی سه شنبه  ۳۱  فروردین ماه ساعت ۱۱:۳۰ از پروژه کارشناسی ارشد خود تحت عنوان "الگوریتمی برای ساده‌سازی متن در زبان فارسی و کاربرد آن در بهبود الگوریتم های استخراج رابطه " دفاع خواهند نمود.

چکیده پایان نامه:

ساده‌سازی متن از زمینه‌های در حال توسعه در پردازش زبان طبیعی است و با بهبود امکانات سخت‌افزاری، پیشرفت روش‌ها و تنوع کاربرد‌ها، مورد توجه روزافزون قرار گرفته است. ساده‌سازی متن فرایندی است که طی آن جملات زبان طبیعی به شیوه‌ای تغییر داده می‌شوند که پیچیدگی‌شان کاهش و خوانایی و فهم‌پذیری‌شان افزایش یابد. خودکارسازی این فرایند دشوار است و الگوریتم‌های پیشنهادی در این حوزه تلاش دارند تا با کمترین خطا، بیشترین کاهش پیچیدگی و بیشترین افزایش خوانایی و فهم‌پذیری را فراهم کنند. از طرف دیگر  متون ورودی در فرآیند‌های متن‌کاوی عموماً مجموعه‌ای از جملات پیچیده‌ی زبان طبیعی هستند که تشخیص ویژگی‌های دستوری و واژگانی این جملات را برای الگوریتم‌های متن‌کاو دشوار می‌کنند و میزان خطا در نتایج را بالا می‌برند. از راه‌های کاهش میزان این خطا استفاده از الگوریتم‌های ساده‌سازی متن به‌عنوان یکی از وظایف پیش‌پردازش متن در الگوریتم‌های متن‌کاو است که باعث کاهش پیچیدگی ورودی شده و در نتیجه خطای الگوریتم متن‌کاو کاهش و بازخوانی آن افزایش داده می‌شود.
پیش از این در زبان فارسی الگوریتمی برای ساده‌سازی متن ارائه نشده است. از سوی دیگر در حال حاضر الگوریتم‌های استخراج رابطه و استخراج دانش موجود در زبان فارسی نیاز به بهبود دارند. در این پژوهش نخستین الگوریتم ساده‌سازی متن در زبان فارسی را ارائه می‌دهیم. از آنجا که الگوریتم‌های موجود در مرز‌های دانش در زبان‌های دیگر، بر اساس پیکره‌های آموزشی موجود در آن زبان‌ها آموزش داده می‌شوند و چنین پیکره‌ای در زبان فارسی موجود نیست و در عین حال تولید چنین پیکره‌ای نیز بسیار پرهزینه و زمان‌بر است، الگوریتم پیشنهاد شده در این پژوهش یک الگوریتم بی‌ناظر و بدون نیاز به مجموعه دادگان آموزشی است. این الگوریتم یک سامانه قاعده‌محور است که قواعد ساده‌سازی در آن به کمک گونه خاصی از عبارات منظم بر روی ویژگی‌های متن (مثلاً ویژگی‌های دستوری) و به کمک کاربران خبره طراحی شده است. برای ارزیابی، این الگوریتم را به عنوان یک سامانه پیش‌پردازشی برای الگوریتم‌های موجود استخراج رابطه به کار بستیم و نتایج حاصله را در مقایسه با نتایج الگوریتم استخراج رابطه بدون استفاده از این پیش‌پردازش مورد ارزیابی و مقایسه قرار دادیم و نشان دادیم که استفاده از الگوریتم ساده‌ساز متن به عنوان یک وظیفه پیش‌پردازشی، نتایج الگوریتم استخراج رابطه مورد نظر را بهبود می‌دهد.
واژگان کلیدی:
ساده‌سازی متن، استخراج رابطه، استخراج دانش، پردازش زبان طبیعی، زبان فارسی


"دفاع به‌صورت آنلاین برگزار می‌شود"
  دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی
نشانی مطلب در وبگاه دانشکده مهندسی کامپیوتر:
http://idea.iust.ac.ir/find.php?item=14.11064.63188.fa
برگشت به اصل مطلب