
خانم ماریا رجب زاده دانشجوی کارشناسی ارشد جناب آقای دکتر احمد اکبری روز سه شنبه 8/9/90 ساعت 17در اتاق 304 واقع در طبقه سوم دانشکده کامپیوتر از پروژه کارشناسی ارشد خود تحت عنوان بهبود کارایی واژه یابی گفتار با استفاده از جستجو در شبکه های واجی دفاع خواهند نمود. چکیده پایان نامه: جستجوی کلمات کلیدی در گفتار (واژهیابی) به معنی تشخیص کلماتی خاص در گفتار و تعیین محل رخداد آن است. این زمینه به عنوان شاخهای از بازشناسی گفتار دارای کاربردهای گستردهای نظیر جستجوی کلمات در فایلهای ویدیوئی و یا صوتی است. روشهای واژهیابی را میتوان به دو دسته تقسیم کرد. دسته اول، روشهای مبتنی بر بازشناسی گفتار پیوسته در دادگان بزرگ است و دسته دوم روشهای مبتنی بر دنباله واجی است. دسته اول با مشکل کلمات خارج از دادگان یا OOV مواجه است، ولی روشهای مبتنی بر دنباله واجی مشکل کلمات خارج از دادگان را ندارند. نمایش هر کدام از این دو دسته از روشهای واژهیاب میتواند براساس اول-بهترین یا براساس شبکه باشد. مزیتی که روشهای مبتنی بر شبکه دارند این است که به جای یک فرضیه کاندید، چند فرضیه را درنظر میگیرند و خطای هر فرضیه میتواند توسط فرضیهای دیگر پوشانده شود. به دلیل مزیتهایی که روش واژهیابی مبتنی بر دنباله واجی و نیز مبتنی بر شبکه دارد، در این پایاننامه برای جستجوی سیستم واژهیاب از این روش استفاده میشود. یعنی سیستم واژهیاب پیشنهادی برای جستجوی کلمه کلیدی بر روی شبکهای از دنبالههای واجی به جستجو میپردازد. در این پایان نامه، روش جستجوی کلمات کلیدی به این ترتیب است که ابتدا با انجام پیشپردازشهایی بر روی شبکه واجی حاصل شده از بازشناسی گفتار همانند شاخصگذاری، شاخص گذاری معکوس و هرس کردن، فضای جستجو تعیین و محدودتر میشود و برای دو حالت برخط و برون خط فضای جستجو تعیین میشود (درحالت برخط نسبت به حالت برون خط نیاز به روش جستجوی سریعتری میباشد). سپس روش جستجوی اول-عمق برای یافتن کلمات کلیدی در شبکه اعمال میشود تا مسیرها یا دنبالههای واجی کاندید برای کلمه کلیدی مورد جستجو بدست بیاید. این جستجوی عمقی برای یافتن مسیرها با اعمال سه فاز انجام میشود. فاز اول، اعمال معیار پایه لونشتین است که در روش DMPLS ( Dynamic Match Phone Lattice Search) استفاده شده است. مزیتی که اعمال معیار لونشتین دارد، این است که برای تصحیح خطای بازشناس گفتار و تصحیح خطای تلفظ کلمات توسط گوینده است و درنتیجه نرخ تشخیص کلمات کلیدی را افزایش میدهد، ولی از جمله مشکلات آن، این است که نرخ اخطارهای اشتباه را نیز افزایش میدهد و همچنین برای امتیازدهی به کلمات کلیدی فقط از اطلاعات خود زیررشته استفاده میکند. برای این منظور در روش پیشنهادی روی فاز اول، دو فاز اعمال شده است که نرخ اخطارهای اشتباه را کاهش میدهد. فاز دوم با استفاده از روش جستجوی ویتربی و با استفاده کردن از اطلاعات کل شبکه، کاندیدهای کلمهی کلیدی که از فاز اول بدست آمدهاند را امتیازدهی میکند و با نحوهی نرمالسازی که روی این امتیازات انجام میدهد و آستانهگذاری میکند، منجر به کاهش اخطارهای اشتباه میشود. فاز سوم نیز با اعمال معیار فاصلهی جارو-وینکلر، مشابهت پیشوندی بین کلمهی کلیدی مورد جستجو و کاندیدهایی که از فاز دوم بدست آمدهاند را بررسی میکند. مشابهت پیشوندی بین رشتهها در تعیین مشابهت آنها، بسیار موثر عمل میکند و معیار جارو-وینکلر با درنظر گرفتن این مشابهت، نرخ اخطارهای اشتباه را کاهش میدهد. درنهایت خروجی سیستم واژهیاب پیشنهادی حضور یا عدم حضور کلمه کلیدی در عبارت گفتار و مکان آن است. در این پایان نامه روش پیشنهادی بر روی دادگان فارسدات تلفنی کوچک اعمال شده است. روش پیشنهادی درحالتیکه مدل کلمه کلیدی به صورت تکواج و سه واج باشد، درنظر گرفته شده است. نتایج روش پیشنهادی برای حالتیکه مدل کلمه کلیدی تکواج باشد با روش پایه DMPLS مقایسه شده است که به شرح زیر است: اگر به سیستم پیشنهادی اجازه پوشاندن یک خطا با معیار لونشتین داده شود، در حالت برخط نسبت به روش پایه DMPLS ، 0.072 واحد و در حالت برون خط 0.12 افزایش دقت داریم. اگر به سیستم پیشنهادی اجازه پوشاندن دو خطا با معیار لونشتین داده شود، در حالت برخط 0.12 و در حالت برون خط ، 0.16 افزایش دقت داریم. نتایج روش پیشنهادی برای حالتیکه مدل کلمه کلیدی سه واج باشد، به شرح زیر است: اگر به سیستم پیشنهادی اجازه پوشاندن یک خطا با معیار لونشتین داده شود، در حالت برخط نسبت به روش DMPLS ، 0.12 و در حالت برون خط، 0.14 افزایش دقت داریم. اگر به سیستم پیشنهادی اجازه پوشاندن دو خطا با معیار لونشتین داده شود، در حالت برخط 0.17 و در حالت برون خط، 0.17 افزایش دقت داریم. واژههای کلیدی: واژهیابی – شبکه واجی – جستجوی شبکه – امتیازدهی – معیار فاصله. ارائهدهنده: ماریا رجب زاده اساتید راهنما: دکتر احمد اکبری استاد ممتحن داخلی : دکتر مرتضی آنالویی استاد ممتحن خارجی :دکتر محمد مهدی همایون پور زمان : چهارشنبه 8 آذرماه ساعت 17 مکان: دانشکده مهندسی کامپیوتر- طبقه سوم- اتاق 304 از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند. دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی |