
آقای احسان کوزه گردانشجوی کارشناسی ارشد جناب آقای دکتر محسن سریانی روز شنبه 12/9/90 ساعت 17در اتاق 304 واقع در طبقه سوم دانشکده کامپیوتر از پروژه کارشناسی ارشد خود تحت عنوان پیاده سازی روشی کارا برای شناسایی خودکار توده ها در تصاویر مامو گرام دفاع خواهند نمود. چکیده پایان نامه: هدف از این پایاننامه، پیادهسازی سیستمی برای شناسایی تودهها در تصاویر ماموگرام میباشد. تودهها جزء رایجترین علائم سرطان سینه به حساب میآیند و شناسایی زودهنگام آنها میتواند تأثیر زیادی در درمان سرطان داشته باشد. سیستم تودهیاب پیشنهاد شده در این پایاننامه دارای 2 گام اساسی میباشد. در گام 1 تعدادی ناحیهی مشکوک به توده از تصاویر ماموگرام استخراج میشود. بعضی از این نواحی واقعاَ مبین توده هستند و بعضی از آنها به اشتباه به عنوان توده استخراج میشوند. ما برای استخراج نواحی مشکوک روشی پیشنهاد کردهایم که این روش مبتنی بر کانتور تکشدتی میباشد. در گام 2 با استفاده از تکنیکهای یادگیری ماشین سعی میکنیم بسیاری از ناحیههایی که در گام 1 به اشتباه به عنوان توده استخراج شدهاند را کاهش دهیم. در رویکرد پیشنهاد شده، تعداد زیادی ویژگی به ازای هر ناحیه استخراج شده و یک بردار ویژگی طویل متناظر با هر ناحیه ساخته میشود. در ادامه با یک مشکل اساسی روبهرو خواهیم بود که تقریباَ تمام الگوریتمها از این مشکل رنج میبرند. این مشکل اساسی نامتعادل بودن مجموعه داده میباشد. یعنی تعداد نمونههای مثبت نادرست به مراتب بیشتر از نمونههای مثبت درست میباشد. این عدم تعادل موجب تمایل ردهبندها به سمت کلاس بزرگتر شده و بدین ترتیب شاهد اَفت شدید کارایی سیستم خواهیم بود. برای رویارویی با مشکل عدم تعادل از 2 راهکار در کنار یکدیگر بهره بردهایم: 1- نمونهگیری 2- استفاده از ردهبندی حساس به هزینه. در این پایاننامه از یک روش نمونهگیری به نام SMOTE برای افزایش نمونههای مثبت در مجموعه آموزشی استفاده کردیم. پس از نمونهگیری، به منظور کاهش پیچیدگیهای فضایی و زمانی و همچنین افزایش کارایی ردهبند از یک روش انتخاب ویژگی بر مبنای معیار سود اطلاعاتی استفاده شد. سرانجام برای ردهبندی نمونهها، یک ردهبند مرکب و حساس به هزینه طراحی نمودیم. این ردهبند مرکب خود ترکیبی از 3 ردهبند مرکب به نام AdaBoost ، Bagging و جنگل چرخش میباشد که از طریق مکانیزم رأیگیری با هم ترکیب شدهاند. از آنجاییکه هزینهی ردهبندی نادرست تودهها با یکدیگر متفاوت است، تصمیم گرفتیم که با استفاده از یک فرا-ردهبند به نام متاکاست ، ردهبند مرکب پیشنهادشده را به ردهبندی حساس به هزینه تبدیل کنیم. سیستم تودهیاب پیشنهاد شده بر روی مجموعه دادهی mini-MIAS آزمایش شده است. تحلیل FROC کارایی روش پیشنهادشده را تأیید میکند و نتایج حاکی از این است که کارایی تودهیاب پیشنهاد شده بهتر از تودهیابهای رقیب میباشد. Abstract: The goal of this thesis is implementing an efficient method for detectiong masses in mammograms. Masses are the most common sign of breast cancer and early detection of them has a critical effect on curing breast cancer. Our proposed mass detector consists of two major steps; in the first step, we extract several suspicious regions from the mammograms. Some of these regions truly represent a mass and the others were mistakenly extracted. We have proposed an iso-intensity-based method for extracting suspicious regions in this step. In the second step, we have to reduce many of the false positive regions to reach a better performance. In our approach, so many features were extracted from each region, this redundancy in feature extraction results in a long feature vector. Then, we will encounter a crucial problem that all the learning algorithms suffer from. This problem is related to the imbalanced datasets. In our dataset, the number of false positives is much higher than the true positives. Because of this problem, classifiers were biased toward the major class, our mass detector algorithm`s performance is decreased by this problem as well. We used two strategies to overcome the problem: 1- sampling 2- using a cost-sensitive classifier. In this thesis, we use a sampling method called SMOTE, according to this sampling method, we increase the number of the true positive samples in the dataset to construct a balanced dataset. After sampling, for decreasing time and space complexity and also increasing the classifier’s performance, we use a feature selection method based on the information gain. Finally, we design a cost-sensitive ensemble classifier to filter false positives. Our ensemble classifier consists of three ensembles (AdaBoost, Bagging and Rotation Forest) itself, which are combined according to a voting strategy. As the samples misclassification cost is different with each other, we decided to transform our ensemble to a cost-sensitive ensemble using a meta-classifier called MetaCost. We tested our mass detector on mini-MIAS database. FROC analysis verifies the performance of our proposed method. The results show the better performanece of our approach relative to the other competing methods. ارائهدهنده: احسان کوزه گر اساتید راهنما: دکترمحسن سریانی استاد ممتحن داخلی : دکتر محمدرضا جاهد مطلق استاد ممتحن خارجی :دکتر حمید ابریشمی مقدم زمان : شنبه 12 آذرماه ساعت 17 مکان: دانشکده مهندسی کامپیوتر- طبقه سوم- اتاق 304 از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند. دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی |