آقای احسان عادلی مسبب دانشجوی دکترای جناب آقای دکتر محمود فتحی روز دوشنبه مورخ 13/08/92 ساعت 9:30 در اتاق دفاعیه واقع در طبقه دوم دانشکده مهندسی کامپیوتر از رساله دکترای خود تحت عنوان رویکردی توزیع شده مبتنی بر بینایی ماشین برای شناسایی فعالیت انساندفاع خواهند نمود . چکیده پایان نامه: با افزایش روز افزون کاربرد شبکههای دوربینی در محیطهای هوشمند، نیاز مبرمی به توسعهی الگوریتمهای توزیعشدهی بینایی ماشین برای شبکههای دوربینی احساس میشود. از طرف دیگر، شناسایی فعالیت از چند دید بسیاری از چالشهای روشهای تکدیدی را برطرف میکند. اما به دلیل حجم بالای پردازش و ارسال/دریافت اطلاعات، این الگوریتمها برای کاربردهای روزمره قابل استفاده نیستند. در این رساله، روشهای مختلفی برای شناسایی فعالیت انسان ارایه میکنیم. ابتدا الگوریتمهای یادگیری باناظر ضعیف برای شناسایی فعالیت انسان در توالی تصاویر تکدیدی و سپس الگوریتمهای توزیعشده برای شناسایی فعالیت چنددیدی ارایه میشوند. شناسایی فعالیت تکدیدی، به دلایل مختلفی چون حرکت دوربین و تغییرات زیاد درون ردهای، مسئلهای چالش برانگیز است. روشهای ارایهشدهی اخیر، از ویژگیها و ردهبندهای مختلفی بهره گرفتهاند و توانستهاند کارایی این سامانهها را بهبود ببخشند. اما این روشها عموماً نیاز به حاشیهنویسی کامل ویدیوها برای آموزش دارند، به طوری که برای تکتک فریمها مکان فعالیت موردنظر مشخص باشد. در این رساله روشهایی مبتنی بر یادگیری باناظر ضعیف و یادگیری چندنمونهای برای شناسایی و مکانیابی فعالیت در ویدیو ارایه میکنیم. در این روشها، یادگیری را از روی دادههای برچسبزنیشدهی غیرکامل انجام میدهیم. این رویکردها از بهینهسازی محدب استفاده کرده و در برابر نویز و دادههای پَرت مقاوم هستند. نتایج اجرا روی مجموعه دادههای متفاوت برتری روشهای پیشنهادی را نشان میدهد. سپس، الگوریتمهایی توزیعشده برای مسائل ردهبندی و برای شناسایی فعالیت انسان به صورت چنددیدی در شبکهی دوربینی ارایه میکنیم. هر دوربین صحنهی مقابل خود را پردازش کرده و از طریق برقراری ارتباط با دیگر دوربینها در شبکه، توافقی در مورد نوع فعالیتِ در حال انجام، ایجاد مینماید. ابتدا، روشی مبتنی بر بازیابی ماتریسِ مرتبهی پایین از طریق کمینهسازیِ توزیعشدهی نُرمهستهای ماتریس پیشنهاد میشود. سپس، مدلی تحت عنوان ماشین بردار پشتیبان چنددیدی اجماعی ارایه میکنیم. برخلاف بسیاری از سامانههای یادگیری توزیعشده؛ فرض میکنیم که هر یک از نمونهها از چندین منبع به دست میآیند. این مدلسازی برای دادههای چنددیدی بسیار مناسب است. الگوریتمهای پیشنهادی از نظر میزان افزایش سرعت اجرا و میزان سربار اضافی مورد بررسی قرار گرفتهاند. آزمایشات متفاوتی روی پایگاههای دادهی استاندارد شناسایی فعالیت چنددیدی ترتیب دادهایم که کارایی الگوریتمهای ارایهشده را نشان میدهد. مقایسهی نتایج شبیهسازی، بیانگر کارایی الگوریتمهای پیشنهادی است.
Abstract: With the increasing demand on the usage of smart and networked cameras in intelligent and ambient technology environments, development of algorithms for such resource-distributed networks are of great interest. Multi-view action recognition addresses many challenges dealing with view-invariance and occlusion, but due to the huge amount of processing and communication in real life applications, it is not easy to adapt these methods for use in smart camera networks. In this thesis, we propose several activity recognition methods. First, some single-view activity recognition algorithms are presented, based on weakly supervised learning algorithms, and then distributed multi-view activity recognition methods are introduced for camera networks. Single-view activity recognition in videos has become increasingly important due to its applicability in a myriad of situations, ranging from in-home elder-care, to automatic sports commentary and surveillance. The challenge of this problem mostly stems from the large variability in motion and spatial features, due to camera motion and inter and intra-subject variability. To address these challenges, most recent researches have focused on the use of different features and classifiers. While these approaches have led to improved performance, they typically lack interpretability and understanding of what the system is learning. We use weakly supervised and multiple instance learning algorithms to address these issues. Our approaches are based on convex low-rank matrix recovery and are robust to noise and outliers. We illustrate the benefits of our approaches in different well known easy (Weizmann, KTH, MSR2) and hard (UCF Sports and Hollywood Human Action) datasets. We also proposed two distributed activity classification frameworks, in which we assume that several camera sensors are observing the scene. Each camera processes its own observations, and while communicating with other cameras, they come to an agreement about the activity class. Our first method is based on recovering a low-rank matrix over consensus to perform a distributed matrix completion via convex optimization. The second approach uses multi-view and consensus regularizations for SVMs. We test our approaches on IXMAS and MuHAVi datasets to show the performance and the feasibility of the method. ارائهدهنده: احسان عادلی مسبب eadeli@iust.ac.ir استاد راهنما: دکتر محمود فتحی هیات داوران: دکتر شهره کسایی-دکتر نصراله مقدم- دکتر ناصر مزینی دکتر محمدرضا کنگاوری- دکتر محسن سریانی زمان : دوشنبه 13 آبانماه 1392 ساعت 9:30 مکان: دانشکده مهندسی کامپیوتر- طبقه دوم- اتاق دفاعیه از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند. دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی |