جستجو در مقالات منتشر شده


3 نتیجه برای داده‌کاوی

، ،
جلد 23، شماره 2 - ( 6-1391 )
چکیده

مساله خوشه بندی به منظور کمینه کردن مجموع مجذور انحراف، یک مساله غیر خطی و غیر محدب بوده و دارای تعداد زیادی نقاط بهینه محلی است. در مسائل خوشه­بندی در دنیای واقعی، اغلب با مجموعه داده­هایی مواجهیم که از ترکیبی از مقادیر عددی و دسته­ای تشکیل شده­اند. در حالیکه اغلب روشهای خوشه­بندی موجود تنها بر روی داده­های عددی از کارایی مناسبی برخوردارند و قابلیت استفاده بر روی داده­های مختلط را ندارند. از سوی دیگر، بیشتر روشهای سنتی، تعداد خوشه­ها را به عنوان ورودی از کاربر طلب می­کنند. در حالیکه در بیشتر موارد تعداد خوشه­ها برای کاربر مقداری نامعلوم است و حدس زدن مقدار آن نیز به خصوص در مورد مجموعه داده­های بزرگ کاری مشکل و حتی غیرممکن است. در این مقاله قصد داریم تا با بهره­گیری از روشی دقیق­تر جهت اندازه­گیری فاصله میان مقادیر دسته­ای،  روش جدیدی را برای خوشه­بندی داده­های مختلط ارائه نماییم که نیازی به تعیین تعداد خوشه­ها به عنوان ورودی الگوریتم نداشته و  قادر است همزمان با خوشه­بندی داده ها، مقدار بهینه برای تعداد خوشه­ها را محاسبه نماید. در روش پیشنهادی معکوس شاخص Davies-Bouldin به عنوان تابع برازش در نظر گرفته شده و به منظور جستجوی فضای جواب از الگوریتم ژنتیک استفاده می­شود. برای ارزیابی عملکرد الگوریتم از دو گروه از داده های استاندارد و شبیه­سازی شده استفاده شده است. نتایج بدست آمده، عملکرد بسیار بالای الگوریتم پیشنهادی را نشان می­دهد


ابوالفضل کاظمی، سیامک ابوطالب ،
جلد 23، شماره 4 - ( 12-1391 )
چکیده

در این مقاله به بررسی مسائل طبقه‌بندی داده‌ها (به عنوان یکی از شاخه های علم داده‌کاوی) در قالب مدل برنامه‌ریزی ریاضی چند‌هدفه می‌پردازیم. مدلی که ارائه و بررسی می‌گردد یک مسئله MODM می‌باشد. اولین بار بر پایه ایده ماشین بردار پشتیبان (SVM) (ماکزیمم کردن حاشیه دو گروه)، یک مدل برنامه‌ریزی ریاضی چند‌معیاره برای مسائل داده‌کاوی بر پایه طبقه‌بندی مشاهدات به دو گروه مجزا مبتنی بر دو هدف تفکیک داده‌ها (ماکزیمم کردن فاصله بین گروه‌های مختلف و مینیمم کردن طبقه‌بندی نادرست داده‌های مورد مشاهده) معرفی شد و از آن پس تاکنون ضمن اینکه افراد زیادی روی گسترش مدلهای طبقه‌بندی مبتنی بر روش‌های برنامه‌ریزی ریاضی کار کرده‌اند، همزمان و به صورت مستقل افرادی نیز روی بهبود روش‌های ماشین بردار پشتیبان مطالعه نموده‌اند. با توجه به فلسفه یکسان این دو دسته از روش‌های بهینه‌سازی، در این مقاله به منظور پر کردن شکاف بین این دو مسیر پژوهش، از روش‌های به روز و بهبود یافته SVM جهت ارائه مدلی به منظور طبقه‌بندی در داده‌کاوی مبتنی بر برنامه‌ریزی چند‌هدفه استفاده خواهد شد.
سمیرا رضائی نوائی، حمیدرضا کوشا،
جلد 27، شماره 4 - ( 12-1395 )
چکیده

رقابتی شدن صنعت بیمه در سال‌های اخیر و ورود بخش خصوصی به این عرصه، توجه به پیش‌بینی رویگردانی مشتری را با اهمیت ساخته است. در این پژوهش، تعدادی از تکنیک‌های شناخته شده دسته‌بندی داده‌کاوی برای پیش‌بینی رویگردانی مشتری در صنعت بیمه به کار گرفته شده است. برای نخستین بار پیش‌بینی‌ رویگردانی مشتری در یک سازمان بیمه‌ای‌ با استفاده از تکنیک ماشین‌ بردار پشتیبان (SVM) انجام می‌شود. در این مقاله نخست از الگوریتم ژنتیک برای فرایند انتخاب مشخصه‌‌های تأثیرگذار استفاده شده است. پس از مدل‌سازی مسأله، پارامترهای مدل ماشین بردار پشتیبان با استفاده از دو روش جستجوی شبکه و اعتبارسنجی متقابل K لایه، بهینه می‌شوند. عملکرد پیش‌بینی روش SVM با روش‌های درخت‌ تصمیم، شبکه‌های عصبی، رگرسیون لجستیک، جنگل تصادفی، دسته‌بندی‌کننده‌ بیزی، K نزدیک‌ترین ‌همسایگی، مقایسه و بهینه‌سازی پارامترهای هر روش با استفاده از جستجوی شبکه انجام شده است. یافته‌های تحقیق نشان می‌دهد که روش ماشین بردار پشتیبان از عملکرد بالاتری نسبت به سایر روش‌ها برخوردار است. در مدل پیشنهادی مبتنی بر این روش، مشخصه‌های سابقه‌ خرید، نحوه‌ آشنایی با سازمان و تمایل به خرید، به‌ عنوان مشخصه‌های اصلی پیش‌بینی‌کننده رویگردانی مشتری شناسایی شدند. در این پژوهش با توجه به مشخصه‌های اصلی پیش‌بینی‌کننده‌ رویگردانی، راهکارهایی برای جلوگیری از رویگردانی مشتری ارائه شده است.



صفحه 1 از 1     

کلیه حقوق این وب سایت متعلق به نشریه بین المللی مهندسی صنایع و مدیریت تولید می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق