ارائه دهنده:
سینا باقری نژاد
اساتید راهنما:
دکتر ناصر مزینی
هیات داوران:
دکتر بهروز مینایی
دکتر مریم امیرمزلقانی
زمان:
سه شنبه ۱۴۰۰/۱۰/۷
ساعت ۱۶:۳۰
آقای سینا باقری نژاد
دانشجوی کارشناسی ارشد جناب آقای دکتر ناصر مزینی روز سه شنبه ۷ دی ماه ساعت ۱۶:۳۰ از پروژه کارشناسی ارشد خود تحت عنوان "استفاده از روش های یادگیری ماشین جهت تعیین عوامل تأثیرگذار بر کاهش میزان مرگ و میر و زمان بستری بیماران مبتلا به کووید-۱۹
" دفاع خواهند نمود
چکیده پایان نامه:
در پژوهش پیش رو با جمع آوری دادههای ۱۰۴۰ بیمار کووید-۱۹ بستری در ۳ بیمارستان در شهرهای تهران، بجنورد و رشت، به تحلیل آنها به منظور کشف عوامل تأثیرگذار بر فوت و مدت زمان بستری بیماران پرداختهایم.
به منظور کشف عوامل مؤثر بر فوت بیماران، با استفاده از آموزش درخت تصمیم، ویژگیهایی که درخت تصمیم در جداسازی افراد فوت شده و بهبود یافته استفاده میکند را شناسائی کرده و سپس با کمک آزمون کولموگروف - اسمیرنوف بررسی کردیم که کدام ویژگی را میتوان با اطمینان بالای ۹۵ درصد به عنوان ویژگیهایی بیان کرد که بین جامعه افراد فوت شده و بهبود یافته دارای توزیع متفاوتی هستند. با اینکار از بین ویژگیهای متعدد دادهها، ۲۵ ویژگی شناسائی شدند. با توجه به اینکه این ویژگیها دارای توزیع متفاوتی در دو جامعه آماری هستند، این ویژگیها را میتوان ویژگیهای تأثیرگذار بر جداسازی این دو جامعه از یکدیگر معرفی کرد. لذا درخت تصمیم دیگری با این ویژگیها تعریف کردیم و نشان دادیم که درخت جدید عملکرد مشابهی با درخت تصمیمی که با همه ویژگیها آموزش دیده است دارد و اینگونه نشان دادیم که استفاده از آزمون فرضیههای آماری چگونه میتواند ویژگیهایی که در ردهبندی دادهها مؤثر هستند را شناسائی کند و لذا به نوعی میتواند به عنوان یک انتخابکننده ویژگی به منظور کاهش ابعاد داده از آن استفاده نمود.
در ادامه با همین روش ویژگیهایی که بر مدتزمان بستری بیماران تأثیرگذار هستند را شناسائی کردهایم. اینبار از آزمون کراسکال-والیس برای تفاوت توزیع ویژگیها در کلاسهای مختلف افراد دوره بستری بیماران استفاده کردیم. ابتدا آزمون را با سطح اطمینان ۹۵ درصد انجام دادیم و ۵۴ ویژگی مؤثر بر دوره بستری بیماران را شناسائی کردیم. سپس با انجام آزمون با سطح اطمینان ۹۹ درصد تعداد ویژگیها را به ۳۶ کاهش دادیم و نشان دادیم که چگونه با افزایش سطح اطمینان آزمون فرضیه میتوان به ابعاد دادهها را به طوری کاهش داد که ویژگیهایی که تفاوت بیشتری بین ردهها ایجاد میکنند حفظ شوند. در ادامه درخت تصمیمی با این ۳۶ ویژگی آموزش دادیم و عملکرد آن را بررسی کردیم. در انتها دیدیم که درخت ساخته شده با این ۳۶ ویژگی تفاوتی از لحاظ عملکرد با درخت ساخته شده با تمام ویژگیها ندارد و بنابراین میتوان از روش آزمونهای آماری ناپارامتریک برای کاهش ابعاد دادهها و انتخاب ویژگیهای موثر و متمایز کننده استفاده نمود. مزیت این روش انتخاب ویژگی در این است که ثابت میشود ویژگیهای انتخاب شده با احتمال بالایی بین ردههای مختلف داده متفاوت هستند و بنابراین ویژگیهایی که تفاوتی در ردهبندی ایجاد نمیکنند با دقت بالایی حذف میشوند.
"دفاع بهصورت آنلاین برگزار میشود"
دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی
|