دانشکده مهندسی کامپیوتر- دفاعیه ارشد
مارال کافی ثانی - 15/8/92

حذف تصاویر و رنگ‌ها  | تاریخ ارسال: 1392/8/15 | 

 

AWT IMAGE

 خانم مارال کافی ثانی دانشجوی کارشناسی ارشد جناب آقای دکتر محمدرضا کنگاوری روز چهارشنبه 15/8/92 ساعت 14 در اتاق دفاعیه واقع در طبقه سوم دانشکده کامپیوتر از پروژه کارشناسی ارشد خود تحت عنوان تحلیل داده های از دست رفته ، جهت بهبود کارایی الگوریتم های یادگیری از داده های جریانی دفاع خواهند نمود.

 

  چکیده پایان نامه:

  داده­کاوی جریانی یکی از مهم­ترین مسائل تحقیقاتی در سال­های اخیر بوده است. استخراج دانش موجود در این داده­ها می­تواند راه­گشای حل مشکلات موجود در بسیاری از کاربردهای روزمره این داده­ها باشد. از طرفی مسائل خاص موجود در این حیطه، از جمله سرعت بالای رسیدن تراکنش­ها موجب از دست رفتن بخش مهمی از این داده­ها می­گردد؛ که این مساله نیز به نوبه­ی خود موضوع بسیاری از تحقیقات دهه­ی اخیر در حوزه­ی داده­های جریانی بوده است.

  در این پایان­نامه سیستمی ارائه گشته که در آن با استفاده از ترکیب تکنیک­های تخمین داده­های از دست رفته و شیوه­های داده­کاوی جریانی بتوان با کیفیت بهتری ، استخراج دانش از این داده­ها را تحقق بخشید. این سیستم با بهره­گیری از سه لایه­ی مختلف به این مهم دست یافته است. در لایه­ی اول، داده­های از دست رفته در این داده­ی جریانی تخمین زده می­شوند و اطلاعات به دست آمده از این تخمین، در اختیار لایه­ی دوم قرار می­گیرد؛ که در این پایان نامه، از شیوه­ی کشف الگوهای پرتکرار [1] در داده­ی جریانی برای تخمین استفاده شده است. در لایه­ی دوم، الگوهای به دست آمده پردازش می­گردند تا بخشی از اطلاعات که قابلیت استفاده در الگوریتم یادگیری اصلی را دارند جدا شوند. در لایه­ی سوم، یک الگوریتم یادگیرنده از داده­ی جریانی قرار داردکه به آن الگوریتم یادگیری اصلی اطلاق گشته است. این الگوریتم که قبلاً فرایند یادگیری را به صورت مستقل انجام می­داده، در این سیستم با بهره­گیری از اطلاعات به دست آمده از لایه­های قبلی، عملکرد خود را بهبود داده و با دقت بیشتری دانش موجود در این داده­ها را استخراج کرده است. نتایج حاصل از ارزیابی مدل، مؤیّد بهبود عملکرد الگوریتم یادگیری اصلی، در چارچوب این مدل می­باشد.

  واژه­های کلیدی: داده­کاوی جریانی، تخمین داده­های از دست رفته، الگوهای پرتکرار



  [1] Frequent Pattern

 

 : Abstract

 

  Extracting meaningful information from stream data has been a popular open problem. In stream data, the missing of some records of data is inevitable due to the inherent characteristic of it, and it causes many difficulties in various applications, such as reducing the performance. To solve this problem, we propose a new architecture to improve the accuracy of an existing machine learning algorithm that uses stream data containing missing records.

  In this architecture, we first catch the missed data by delayed reading of and then find the frequent patterns of it. Then we use discovered closed frequent patterns to improve the performance of the main machine learning algorithm. Since the decision tree, has a high degree of knowledge interpretation and has been favored in many real world applications, we use VFDT; One of famous and efficient decision trees that has been presented for stream data; as the main algorithm for implementing our architecture. Furthermore we use CloStream algorithm as one of best algorithms in finding closed frequent patterns from stream data.

  Experimental results compared with the existing normal results of algorithm show that using information extracted from closed item set can increase the accuracy of the algorithm effectively.

 



  [1] Frequent Pattern

 

 

 

  ارائه­دهنده:

  مارال کافی ثانی

  مهندسی کامپیوتر- هوش مصنوعی

  استاد راهنما:

  دکتر محمدرضا کنگاوری

  استاد ممتحن داخلی : دکتر بهروز مینایی

  استاد ممتحن خارجی : دکتر میرمحسن پدرام

  زمان : چهارشنبه 15 آبان 92

  ساعت 14

  مکان: دانشکده مهندسی کامپیوتر- طبقه سوم- اتاق دفاعیه

  از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت
می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند.

  دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی

نشانی مطلب در وبگاه دانشکده مهندسی کامپیوتر:
http://idea.iust.ac.ir/find-14.11064.30565.fa.html
برگشت به اصل مطلب