[صفحه اصلی ]    
بخش‌های اصلی
درباره دانشکده::
مدیریت دانشکده::
اعضای هیات علمی ::
معرفی افراد::
امور آموزش و اطلاعیه دفاعیه ها::
امور فرهنگی::
امور پژوهشی::
اخبار و رویدادهای دانشکده::
فضاهای آموزشی و تحقیقاتی ::
تسهیلات پایگاه::
تماس با ما::
::
ورود به سایت دروس
دانشجویان روزانه و پردیس
دانشجویان مرکز آموزش الکترونیکی
..
اطلاعیه ها
 اطلاعیه های آموزشی
..
فراخوان ها
فراخوان های همکاری با صنعت و سازمان ها
..
دفاعیه‌ها

دفاعیه های دکتری


دفاعیه های کارشناسی ارشد

..
جستجو در پایگاه

جستجوی پیشرفته
..
دریافت اطلاعات پایگاه
نشانی پست الکترونیک خود را برای دریافت اطلاعات و اخبار پایگاه، در کادر زیر وارد کنید.
..
:: خلیل علیجانی ممقانی-8/8 ::
 | تاریخ ارسال: 1390/7/25 | 

AWT IMAGE

 آقای خلیل علیجانی ممقانی دانشجوی کارشناسی ارشد جناب آقای دکتر مصطفی حق روز روز یکشنبه 8 /8/90 ساعت 11:30 در اتاق 304 واقع در طبقه سوم دانشکده کامپیوتر از پروژه کارشناسی ارشد خود تحت عنوان ارائه الگوریتمی برای مرحله ادغام نتایج در بازیابی اطلاعات توزیع شده دفاع خواهند نمود.

 

  چکیده پایان نامه:

  بازیابی اطلاعات به تکنیک­هایی جهت یافتن اطلاعات ( معمولا اسناد ) اطلاق می­شود به طوری­که اطلاعات مرتبط با نیاز کاربر در رتبه­های بالاتری قرار گیرند. افزایش روزافزون اطلاعات، سیستم­های متمرکز را برای بازیابی کارای اطلاعات ناتوان کرده است، از اینرو برای غلبه بر این نقص از سیستم­های بازیابی اطلاعات توزیع شده استفاده می­شود. فرآیند بازیابی اطلاعات توزیع شده به صورت واسطی عمل می­کند تا توانایی جستجوی همزمان اسناد را از چندین سیستم بازیابی اطلاعات مستقل ( مجموعه­های راه دور ) برای کاربر فراهم کند. این فرآیند از سه مرحله­ی اصلی تشکیل شده است : نمایش مجموعهها به صورت برون خطی انجام می­شود، با ورود هر پرس و جو انتخاب مجموعهها به صورت برخط صورت گرفته و سپس در مرحله­ی ادغام نتایج، جواب­های برگردانده از این مجموعه­ها ادغام شده و به کاربر نشان داده می­شود. به دلیل وجود خاصیت توزیع شدگی، این فرآیند با چالش­هایی در هر کدام از این مراحل روبروست که باعث کاهش رقم دقت در هرکدام از این مراحل و در نتیجه کاهش دقت کلی بازیابی می­شود.

  مرحله­ی اول بازیابی اطلاعات توزیع شده ، ایجاد اطلاعاتی در مورد مجموعه­ها می­باشد. این اطلاعات پس از جمع­آوری از مجموعه­ها ( که به آن نمونه­گیری گفته می­شود ) در یک شاخص نگهداری شده و در دو مرحله­ی بعد با استفاده از اطلاعات این شاخص، مجموعه­ها انتخاب و نتایج برگردانده شده از آن­ها ترکیب می­شوند. بدیهی­ست که کیفیت اطلاعات شاخص به اطلاعات جمع­آوری شده از مجموعه­ها بستگی دارد که علاوه بر سربار حافظه، سربار زمانی در دو مرحله­ی انتخاب مجموعه­ها و ادغام نتایج ایجاد می ‫ کند.

  در این پایان­نامه روشی برای ادغام نتایج ارائه می­شود که نیازی به استفاده از شاخص نمونه­گیری شده ندارد. از آن­جا که ادغام نتایج به انتخاب مجموعه­ها نیز بستگی دارد روشی هم برای مرحله­ی انتخاب مجموعه­ها ارائه می­شود. در روش ارائه شده برای مرحله­ی ادغام نتایج به جای امتیاز سندها، دلیل امتیازدهی به سندها (مانند موقعیت کلمه­ها در سند) از مجموعه­ها درخواست می­شود. با استفاده از این دلیل، امتیازی به هر سند داده می­شود و به این ترتیب نتایج برگردانده شده از مجموعه­ها با استفاده از این امتیاز ادغام می­شوند.

  به منظور ارزیابی روش ارائه شده برای مرحله ‫ ی ادغام نتایج، محیط ‫ های آزمایش را با استفاده از اسناد پیکره­ی همشهری ایجاد کرده و آزمایش­ها را روی سیستم بازیابی اطلاعات توزیع شده­ای که چندین سیستم بازیابی اطلاعات مستقل ( با مدل­های بازیابی متفاوت ) را مدیریت می ‫ کند، اجرا می ‫ کنیم. نتایج ارزیابی­ها نشان می­دهد که روش ارائه شده برای مرحله­ی ادغام نتایج در محیط­های آزمایش مختلف، دقت بازیابی را افزایش می­دهد.

 

  واژه‌های کلیدی: بازیابی اطلاعات توزیع شده، نمایش مجموعه، انتخاب مجموعه، ادغام نتایج، مدل ‫ های بازیابی اطلاعات، موقعیت واژه­ها، دقت بازیابی

 

  Abstract:

 Information Retrieval is defined as a set of techniques to search and find pieces of information (usually in the form of document) in a way that user`s needs come first automatically. Daily increase of bulk of information resulted in unhability of central information systems to retrieve information efficiently. In an effort to resolve such difficulties, Distributed Information Retrieval systems have been widely opted for. This system acts like an intermediate to ease the operation of retrieving information from a number of sources simoltainiously. The mentiond process is comprised of three steps as follows: Source Representaion is off-line, and by entering each new user`s query Source Selection is outlined as on-line. In Result Merging, all the returened result from selected collections are merged and shown. Due to distribution features, the process is challenged in each phase. This might concequently result in lack of precision in Source Selection phase and finally in the final result supplied.

 The first phase of Distributed Information Retrieval is to create information for the Sources. The information is indexed after being sampled. The Index is then used to select the sources and to merge the results. Needless to say that quality of the information in the Index depends a great deal on the collected (sampled) data. This even can result in data or time overhead at times in the second and third phases.

 The presented thesis argues a methodology for Result Merging in which there`s no needs of Index. Since merging the results depends on Source Selection, the thesis also proposes a new methodology for Source Selection as well. In Result Merging`s method, reasoning used to score the documents replaces the document`s score that returned from sources. The returned results are then merged employing the new scoring system.

 In order to evaluate the proposed method, for merging the results, a test environment is created taking of advantage of Hamshahri corpus. Then the Distributed Information Retrival system comprising of a lot of sources of information is tested. The results reveal that the proposed methodology can indeed increase retrival precision.

 

 Keywords: Distributed Information Retrieval, Source Representation, Source Selection, Result Merging, Information Retrieval Models, Terms Position, Retrieval Precision

 

   ارائه­دهنده:

خلیل علیجانی ممقانی

  اساتید راهنما:

  دکتر مصطفی حق جو

  استاد ممتحن داخلی : دکتر بهروز مینایی

  استاد ممتحن خارجی :دکتر مسعود رهگذر

  زمان : یکشنبه 8 آبان ماه

  ساعت11:30

  مکان: دانشکده مهندسی کامپیوتر- طبقه سوم- اتاق 304

  از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت
می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند.

  دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی

 

 

دفعات مشاهده: 3898 بار   |   دفعات چاپ: 918 بار   |   دفعات ارسال به دیگران: 72 بار   |   0 نظر
سایر مطالب این بخش سایر مطالب این بخش نسخه قابل چاپ نسخه قابل چاپ ارسال به دوستان ارسال به دوستان
data
Persian site map - English site map - Created in 0.16 seconds with 55 queries by YEKTAWEB 4709