
آقای ابراهیم شیرانی دانشجوی کارشناسی ارشد جناب آقای دکتر محمدرضا کنگاوری روز دوشنبه 15/12/90 ساعت 17 در اتاق دفاعیه واقع در طبقه سوم دانشکده کامپیوتر از پروژه کارشناسی ارشد خود تحت عنوان توسعه یادگیری ماشین در حوزه داده های جریانی بر اساس مکانیزم های یادگیری انسان دفاع خواهند نمود. چکیده پایان نامه: در سالهای اخیر، دادهکاوی دادههای جریانی که معمولاً با تغییر مفهوم همراه هستند، یکی از مهمترین موضوعات مورد علاقه محققان در زمینه یادگیری ماشین و دادهکاوی بوده است. یکی از بهترین روشهایی که در این زمینه میتوانند به خوبی با تغییر مفهوم مقابله کنند، کلاسهکنندههای چندتایی [1] یا کلاسهکنندههای جمعی [2] هستند. در سالهای اخیر، کارهای زیادی در مورد کلاسهکنندههای چندتایی انجام شده و مدلهای موفقی نیز بر مبنای این نوع کلاسهکنندهها برای کلاسبندی دادههای جریانی ارائه شده است. با وجود دستاوردهای زیادی که این مدلها داشتهاند، هنوز برخی مشکلات حل نشده باقی ماندهاند. یکی از مشکلات مدلهای مبتنی بر کلاسهکننده چندتایی موجود، بالا بودن هزینه بروزرسانی این مدلها است که با توجه به بروز تغییر مفهوم در دادههای جریانی اهمیت ویژهای دارد. مشکل دیگری که در این مدلها وجود دارد، معنادار و قابل درک نبودن وظیفه هر یک از عضوها در سیستم کلاسهکننده چندتایی میباشد. این امر باعث میشود که از طرفی درک مدل ساده نباشد، و از طرف دیگر، با بروز تغییر مفهوم، عضوِ متأثر از تغییر مفهوم قابل شناسایی نباشد که باعث میشود مدل در برابر تغییر مفهوم کارایی لازم را نداشته باشد. به منظور حل این مشکلات در اِین پایاننامه، مدل "مجموعه کلاسهکنندههای متخصص" که مدلی مبتنی بر کلاسهکننده چندتایی است، برای استفاده در کلاسبندی دادههای جریانی معرفی و پس از تحلیلهای تئوری و تجربی، به عنوان یک مدل کارآمد پیشنهاد شده است. برای ارزیابی این مدل پیشنهادی، دقت کلاسبندی و زمان اجرای این مدل روی چندین مجموعه داده معروف، با چهار مدل موفق در کلاسبندی دادههای جریانی مقایسه شده است. همچنین پیچیدگی زمانی این مدل به صورت تئوری بررسی شده است. نتایج بدستآمده نشان میدهند که این مدل میتواند یادگیری و بروزرسانی سریعتر و دقت کلاسبندی بالاتری را نسبت به بسیاری از الگوریتمهای معروف کلاسبندی دادههای جریانی ارائه دهد. همچنین در این پایاننامه، یک معیار جدید برای ارزیابی مدلهای کلاسبندی داده جریانی تعریف و پیشنهاد شده است. این معیار، میزان پایداری یک مدل کلاسبندی را در برابر تغییر مفهوم اندازهگیری میکند. آزمایشها نشان میدهند که با توجه به معیار تعریف شده، مدل پیشنهادی در این پایاننامه بیشترین میزان پایداری در برابر تغییر مفهوم را در مقایسه با چهار الگوریتم مورد مقایسه دارا میباشد. Abstract: One-versus-all (OVA) classifiers learn k individual binary classifiers, each distinguishing the instances of a single class from the instances of all other classes. To classify a new instance, the k classifiers are run, and the one that returns the highest confidence is chosen. Thus, OVA is different from existing data stream classification schemes whose majority use multiclass classifiers, each discriminating among all the classes. This paper advocates some outstanding advantages of OVA for data stream classification. First, there is low error correlation and, hence, high diversity among OVA’s component classifiers, which leads to high classification accuracy. Second, OVA is adept at accommodating new class labels that often appear in data streams. However, there also remain many challenges to deploy traditional OVA for classifying data streams. First, traditional OVA does not handle concept change, a key feature of data streams. Second, as every instance is fed to all component classifiers, OVA is known as an inefficient model. Third, OVA’s classification accuracy is adversely affected by the imbalanced class distributions in data streams. This paper addresses those key challenges and consequently proposes a new OVA scheme that is adapted for data stream classification. Theoretical analysis and empirical evidence reveal that the adapted OVA can offer faster training, faster updating, and higher classification accuracy than many existing popular data stream classification algorithms. We expect these results to be of interest to researchers and practitioners because they suggest a simple but very elegant and effective alternative to existing classification schemes for data streams.
[1] Multiple Classifier System [2] Ensemble Classifier ارائهدهنده: ابراهیم شیرانی اساتید راهنما: دکتر محمدرضا کنگاوری استاد مشاور: دکتر حاتمی استاد ممتحن داخلی : دکتر ناصر مزینی استاد ممتحن خارجی :دکتر بدیع زمان : دوشنبه 15/12/90 ساعت 17 مکان: دانشکده مهندسی کامپیوتر- طبقه سوم- اتاق دفاعیه از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند. دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی |