
آقای حمیدرضا قادر دانشجوی کارشناسی ارشد جناب آقای دکتر مرتضی آنالویی روزیکشنبه 21/12/90 ساعت 18 در اتاق دفاعیه واقع در طبقه سوم دانشکده کامپیوتر از پروژه کارشناسی ارشد خود تحت عنوان یک مدل بیزی شناختی برای استخراج گرامر از متون زبان طبیعی دفاع خواهند نمود. چکیده پایان نامه: در این تحقیق نشان دادهایم که مسئله استخراج گرامر برای گرامرهای جایگزینی درخت، میتواند به عنوان ترکیبی پیچیده از تعداد زیادی مسئله انتخاب مدل تعریف شود. مسئله انتخاب مدل به مسائلی گفته میشود که در آنها میان مدلهایی با پیچیدگی متفاوت تصمیمگیری میشود. برای ارائه مدل مورد نظر، ابتدا یک مدل بیزی از فرایند شناختی انتخاب مدل را معرفی کردهایم. این مدل مسئله انتخاب مدل را با تطابق بیشتر با رفتار انسان حل میکند. سپس نشان دادهایم شکل تعمیم یافتهی این مدل، که منجر به فرایند دریکله و فرایند رستوران چینی میشود، میتواند برای حل مسئله استخراج گرامر بکارگرفته شود. ما این فرایندها را با مفاهیم گرامرهای مبتنی بر سابقه ترکیب کرده و مدل استخراج گرامر خود را ارائه کردهایم. استخراج گرامر در مدل ارائه شده بدینترتیب اتفاق میافتد که ابتدا توزیع احتمال هدف به شرط دادههای مشاهده شده ایجاد میشود. این توزیع احتمال، در مدل ارائه شده، توزیع احتمال توأم تعداد زیادی متغیر تصادفی خواهد بود. چنین توزیع احتمالی به دلیل پیچیدگی زیاد، به روشهای تحلیلی قابل محاسبه نیست. بنابراین برای تخمین این توزیع احتمال و یافتن پاسخ مناسب برای مسئله از یکی از روشهای تخمین توزیعهای احتمال، که تحت عنوان مونت کارلوی زنجیرهی مارکوف شناخته میشوند، استفاده کردهایم. در ادامه پس از فرموله کردن مدل مورد نظر با استفاده از فرایندهای دریکله و رستوران چینی، این مدل را ایجاد کرده و روی دادههای استاندارد پایگاه درخت Penn مورد آزمایش قرار دادهایم. نتایج آزمایشهای انجام شده بوسیله EVALB ، که ابزار استاندارد ارزیابی درختهای تجزیه میباشد، ارزیابی شده است و در مقایسه با یک مدل مشابه و یک مدل مبتنی بر درستنمایی بیشینه، در معیار F1 پیشرفت نشان میدهد. تحلیل نتایج نشان میدهد که این پیشرفت نتیجه سادهتر شدن مسائل انتخاب مدل درگیر در مسئله استخراج گرامر، در اثر روشهای مبتنی بر سابقه است. واژههای کلیدی: مدل بیزی از فرایند شناختی انتخاب مدل، گرامر جایگزینی درخت، فرایند دریکله، فرایند رستوران چینی، گرامرهای مبتنی بر سابقه.
Abstract: In this research, we show that the problem of grammar induction could be modeled as a combination of several model selection problems. At first, we introduce a Bayesian model of cognition and show that this model will be generalized to Chinese restaurant process, in grammar induction problem. Then we implement our model based on this model of cognition. In the next step, we apply a standard technique to induce history-based grammars using the defined model. Our model results to an increase of F1 measure in comparison with a similar model in experiments on standard corpora. Lastly, we explain why this increase has been achieved in our model. Keywords: Bayesian Model of Cognition, Tree Substitution Grammar, Dirichlet Process, Chinese Restaurant Process, History-based Gramma ارائهدهنده: حمیدرضا قادر اساتید راهنما: دکتر مرتضی آنالویی استاد ممتحن داخلی : دکتر بهروز مینایی استاد ممتحن خارجی :دکتر غلامرضا قاسم ثانی زمان : یکشنبه 21/12/90 ساعت 18 مکان: دانشکده مهندسی کامپیوتر- طبقه سوم- اتاق دفاعیه از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند. دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی |