
خانم مارال کافی ثانی دانشجوی کارشناسی ارشد جناب آقای دکتر محمدرضا کنگاوری روز چهارشنبه 15/8/92 ساعت 14 در اتاق دفاعیه واقع در طبقه سوم دانشکده کامپیوتر از پروژه کارشناسی ارشد خود تحت عنوان تحلیل داده های از دست رفته ، جهت بهبود کارایی الگوریتم های یادگیری از داده های جریانی دفاع خواهند نمود. چکیده پایان نامه: دادهکاوی جریانی یکی از مهمترین مسائل تحقیقاتی در سالهای اخیر بوده است. استخراج دانش موجود در این دادهها میتواند راهگشای حل مشکلات موجود در بسیاری از کاربردهای روزمره این دادهها باشد. از طرفی مسائل خاص موجود در این حیطه، از جمله سرعت بالای رسیدن تراکنشها موجب از دست رفتن بخش مهمی از این دادهها میگردد؛ که این مساله نیز به نوبهی خود موضوع بسیاری از تحقیقات دههی اخیر در حوزهی دادههای جریانی بوده است. در این پایاننامه سیستمی ارائه گشته که در آن با استفاده از ترکیب تکنیکهای تخمین دادههای از دست رفته و شیوههای دادهکاوی جریانی بتوان با کیفیت بهتری ، استخراج دانش از این دادهها را تحقق بخشید. این سیستم با بهرهگیری از سه لایهی مختلف به این مهم دست یافته است. در لایهی اول، دادههای از دست رفته در این دادهی جریانی تخمین زده میشوند و اطلاعات به دست آمده از این تخمین، در اختیار لایهی دوم قرار میگیرد؛ که در این پایان نامه، از شیوهی کشف الگوهای پرتکرار [1] در دادهی جریانی برای تخمین استفاده شده است. در لایهی دوم، الگوهای به دست آمده پردازش میگردند تا بخشی از اطلاعات که قابلیت استفاده در الگوریتم یادگیری اصلی را دارند جدا شوند. در لایهی سوم، یک الگوریتم یادگیرنده از دادهی جریانی قرار داردکه به آن الگوریتم یادگیری اصلی اطلاق گشته است. این الگوریتم که قبلاً فرایند یادگیری را به صورت مستقل انجام میداده، در این سیستم با بهرهگیری از اطلاعات به دست آمده از لایههای قبلی، عملکرد خود را بهبود داده و با دقت بیشتری دانش موجود در این دادهها را استخراج کرده است. نتایج حاصل از ارزیابی مدل، مؤیّد بهبود عملکرد الگوریتم یادگیری اصلی، در چارچوب این مدل میباشد. واژههای کلیدی: دادهکاوی جریانی، تخمین دادههای از دست رفته، الگوهای پرتکرار
[1] Frequent Pattern
: Abstract Extracting meaningful information from stream data has been a popular open problem. In stream data, the missing of some records of data is inevitable due to the inherent characteristic of it, and it causes many difficulties in various applications, such as reducing the performance. To solve this problem, we propose a new architecture to improve the accuracy of an existing machine learning algorithm that uses stream data containing missing records. In this architecture, we first catch the missed data by delayed reading of and then find the frequent patterns of it. Then we use discovered closed frequent patterns to improve the performance of the main machine learning algorithm. Since the decision tree, has a high degree of knowledge interpretation and has been favored in many real world applications, we use VFDT; One of famous and efficient decision trees that has been presented for stream data; as the main algorithm for implementing our architecture. Furthermore we use CloStream algorithm as one of best algorithms in finding closed frequent patterns from stream data. Experimental results compared with the existing normal results of algorithm show that using information extracted from closed item set can increase the accuracy of the algorithm effectively.
[1] Frequent Pattern ارائهدهنده: مارال کافی ثانی مهندسی کامپیوتر- هوش مصنوعی استاد راهنما: دکتر محمدرضا کنگاوری استاد ممتحن داخلی : دکتر بهروز مینایی استاد ممتحن خارجی : دکتر میرمحسن پدرام زمان : چهارشنبه 15 آبان 92 ساعت 14 مکان: دانشکده مهندسی کامپیوتر- طبقه سوم- اتاق دفاعیه از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند. دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی |