[صفحه اصلی ]    
بخش‌های اصلی
درباره دانشکده::
مدیریت دانشکده::
اعضای هیات علمی ::
معرفی افراد::
امور آموزش::
امور فرهنگی::
امور پژوهشی::
اخبار و رویدادها::
فضاهای آموزشی و تحقیقاتی ::
تسهیلات پایگاه::
تماس با ما::
::
ورود به سایت دروس
دانشجویان روزانه و پردیس
دانشجویان مرکز آموزش الکترونیکی
..
اطلاعیه ها
 اطلاعیه های آموزشی
..
فراخوان ها
فراخوان های همکاری با صنعت و سازمان ها
..
دفاعیه‌ها

دفاعیه های دکتری


دفاعیه های کارشناسی ارشد

..
جستجو در پایگاه

جستجوی پیشرفته
..
دریافت اطلاعات پایگاه
نشانی پست الکترونیک خود را برای دریافت اطلاعات و اخبار پایگاه، در کادر زیر وارد کنید.
..
:: زهرا جلالیان ::
 | تاریخ ارسال: 1401/8/22 | 

خانم زهرا جلالیان دانشجوی دکترای آقای دکتر محسن شریفی روز یکشنبه مورخ  1401/08/22 ساعت 18:30 از رساله دکتری خود با عنوان "زمانبندی خودمختار وظایف در سامانههای توزیعی پردازش سریع دادهها "دفاع خواهند نمود.

 

ارائه ­دهنده:
زهرا جلالیان

  استاد راهنما:
دکتر 
محسن شریفی

  هیات داوران:

دکتر ناصر یزدانی ؛ دکتر میرمحسن پدرام؛ دکتربهروز مینایی؛ دکتر محمد عبدالهی ازگمی

زمان : 22 آبان ماه 1401

  ساعت 18:30

       


چکیده پایان نامه :
 

با توجه به رشد سریع تولید و انتشار داده­های­ حجیم از منابع مختلف، ناگزیر سرعت پردازش داده­ها­ نیز باید افزایش یابد. در سیستم­های توزیعی پردازش داده­های­ حجیم مانند محاسبات ابری، تخصیص مجموعه بزرگی از وظایف گوناگون به تعداد زیادی از گره­های محاسباتی )که ممکن است ناهمسان هم باشند) به عهده زمان­بند وظایف است. انتخاب گره محاسباتی توسط زمان­بند جهت ارسال و اجرای وظیفه، باید درراستای تامین اهداف متعددی (مانند بهره­وری منابع، کاهش زمان اجرای مجموعه­ای از وظایف، کاهش تبادل داده بین گره­های پردازشی و تعادل بار بین گره­های محاسباتی) صورت ­پذیرد. امروزه تلاش می­شود که زمان­بندها به قسمت اعظمی از این اهداف دست یابند. راهبرد­های زمان­بندی که سعی دارند در یک مرحله به این اهداف دست یابند، عملکرد ضعیف­تری نسبت به راهبردهای چند مرحله­ای دارند. دراین رساله یک طرح پردازش سریع داده­های­ حجیم، به منظور دستیابی به عملکرد بهتر درجهت نیل به اهداف ذکرشده ارائه می­شود. با استفاده از منابع مورد نیاز وظایف که در اجراهای قبلی به دست آمده و الگوریتم خوشه بندیk-means درکنار یک معادله تعادل بار برای افزایش کارایی منابع در مرحله اول، و سپس با بکارگیری الگوریتم تکامل تفاضلی برای کاهش زمان اجرای خوشه­ها، یک طرح زمان­بند وظیفه چند منظوره سلسله مراتبی پیشنهاد می­گردد. به منظور بهره­وری بهتر منابع، از حالت پویای گره­های ­محاسباتی جهت ارسال خوشه وظایف استفاده می­شود. همچنین با ارسال وظایف متوالی مرتبط به یک گره محاسباتی، از انتقال داده­ها بین گره­های محاسباتی خودداری می­شود. طرح پیشنهادی در نرم­افزارCloudsim، شبیه­سازی و مورد آزمایش قرار گرفته است. در این آزمایشات طرح پیشنهادی در مقایسه با رویکرد یادگیری تقویت کننده Mai و روش اجرای موازی Bugerya، تقریباً 10% کاهش زمان اجرای مجموعه وظایف و 4% افزایش کارایی پردازشگر را نشان می دهد. هزینه انتقال اطلاعات بین وظایف متوالی نیز در مقایسه با دیگر روش­ها 10% کاهش داشته­است. با توجه به نتایج حاصل و این واقعیت که طرح زمان­بندی وظایف پیشنهادی که از روش iHadoop برای اجرای موازی الهام گرفته، برای استفاده در سیستم های توزیعی پردازش داده­های حجیم مناسب­تر است. اطلاعات مربوط به اجرای قبلی وظایف و وضعیت فعلی گره های محاسباتی، در نگاشت کارآمد وظایف به گره­های محاسباتی بسیار تأثیرگذار است. در ادامه طرح پیشنهادی، پیش­بینی میزان منابع مورد نیاز وظایف جهت اجرا و ظرفیت­های موجود در گره­های محاسباتی می تواند در انتخاب بهینه گره­های ­محاسباتی و در نتیجه پردازش سریعتر داده­ها مفید باشد.

 

 

 
Abstract:
The rapid growth of the production and dissemination of big data from various sources indicates the need for increased speed of data processing. In big data processing distribution systems such as cloud computing, assigning an immense set of various tasks to an enormous number of computing nodes (which may be heterogeneous) is the responsibility of the task scheduler. The selection of the computing node by the scheduler to send and execute the task should be aimed at fulfilling several goals (e.g., resource efficiency, reducing the time of executing a set of tasks, reducing data exchange between processing nodes, and balancing the load between computing nodes). Nowadays, achieving as many of the mentioned goals by the schedulers is developers’ biggest challenge. Scheduling strategies trying to achieve these goals in one step have significantly weaker performance than multi-step strategies. The main purpose of this dissertation is to present a scheme for fast big data processing in order to achieve better performance in fulfilling the mentioned goals. A scheme hierarchical multitasking scheduler is proposed by assessing the required resources of the tasks obtained in the previous executions, the k-means clustering algorithm, along with a load balance equation to increase the efficiency of the resources in the first stage, and then by using the differential evolution algorithm to reduce the execution time of the clusters. In order to improve the efficiency of resources, the dynamic status of computing nodes is used to send clusters of tasks. Additionally, by sending consecutive tasks related to a computing node, data transfer between computing nodes is avoided. The proposed scheme has been implemented and tested in Java programming language, and later on, employed in the CloudSim software. In our tests, the proposed scheme showed approximately a 10% reduction in task set execution time and a 4% increase in processor efficiency, in comparison with Mai's reinforcement learning approach and Bugerya's parallel execution method. The cost of transferring information between consecutive tasks also decreased by 10% compared to other methods. According to the results, the proposed task scheduling scheme inspired by the iHadoop method for parallel execution is more suitable for use in big data processing distribution systems. The information regarding the previous execution of the tasks and the current status of the computing nodes is crucially effective in the efficient mapping of the tasks to the computing nodes. In the continuation of the proposed scheme, predicting the number of resources required for the execution of the tasks and the available capacities in the computing nodes can be beneficial in the optimal selection of computing nodes and as a result, faster data processing.

Keywords: Fast big data processing, task scheduling, task clustering, optimal tasks assignment.

 


محل برگزاری: 
    اتاق دفاع طبقه سوم

 

دفعات مشاهده: 3468 بار   |   دفعات چاپ: 344 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر
سایر مطالب این بخش سایر مطالب این بخش نسخه قابل چاپ نسخه قابل چاپ ارسال به دوستان ارسال به دوستان
data
Persian site map - English site map - Created in 0.14 seconds with 55 queries by YEKTAWEB 4665