
آقای امیرفرید امینیان مدرس دانشجوی دکترای جناب آقای دکتر محسن سریانی روز سهشنبه مورخ 20/03/93 ساعت 11 صبح در دانشکده مهندسی کامپیوتر از رساله دکترای خود تحت عنوان بازشناسی و تحلیل فعالیت انسان در تصاویر ویدیویی چند دیدی دفاع خواهند نمود . چکیده پایان نامه: حجم عظیم دادههای تصویری باعث شده است نیاز مبرمی به وجود سامانههای هوشمند خودکار جهت پردازش آنها احساس شود. بنابراین تولید چنین سامانههایی که قابلیت دریافت، پردازش، تحلیل و درک تصاویر ویدیویی را داشته باشند، یکی از اصلیترین چالشهای متخصصین هوش مصنوعی و به طور خاص بینایی ماشینی است. تحلیل فعالیت انسان یکی از مسایل مطرح در این زمینه است که هدف آن، بازشناسی و ایجاد درک و فهم نسبت به کنشی است که انسانها انجام میدهند. مفهوم گسترده و متنوع فعالیت و شرایط متفاوت دنبالههای ویدیویی، باعث دشواری ذاتی مساله میشود. در ویدیوهای چنددیدی، به خاطر وجود دادههای مرتبط و تکراری، این مساله پیچیدهتر میشود. هر چند تحقیقات بسیاری در هر یک از بخشهای بازشناسی و تحلیل فعالیت انساندر ویدیوهای چنددیدی، از جمله استخراج ویژگی، روش دستهبندی، روش ادغام اطلاعات دیدها و شیوه تحلیل انجام شده است، اما جای تحقیقی جامع و همه منظوره درباره تمامی موضوعات، خالی است. این رویکرد ما در این رساله بوده است. ابتدا ویژگی معنایی جدید، توصیف کننده گراف وضعیت بدن، که متمایز کننده خوبی برای فعالیتهای انسانی است، پیشنهاد و تشریح شده است. سپس، طرح جدیدی از مدل مخفی مارکوف، به نام مدل مخفی مارکوف لایهای هرمی، ابداع و معرفی گشته است که به طور ویژه برای ویدیوهای چند دیدی، به عنوان یک مساله چند حسگری، توسعه یافته است. شیوههای گوناگونی از بازشناسی و تحلیل فعالیت به کمک این طرح پیادهسازی، اجرا و آزمایش شده است و در نهایت کارآمدی این توسعه جدید در بازشناسی و تحلیل فعالیت انسان در ویدیوهای چنددیدی به اثبات رسیده است. از مجموعهدادههای Sinica ، KTH و UCF Sport در بخش یکدیدی و MuHAVi ، IXMAS و HumanEva-I در حوزه چنددیدی استفاده شده و دقت بازشناسی چنددیدی به صورت جامع در این مجموعه دادهها حدود 8/93 بوده است. واژههای کلیدی: پردازش ویدیو، بینایی ماشینی، بازشناسی فعالیت انسان، تحلیل فعالیت انسان، ویدیوهای چنددیدی، استخراج ویژگی، توصیفکننده حرکت، مدل مخفی مارکوف. : Abstract Processing a huge amount of visual data which is the consequence of new scientific and industrial improvements in electronics and communications caused demands for automatic intelligent video processing systems. Therefore, production of such systems which receive, process, analyze and recognize the contents of video sequences is one of the main challenges of artificial intelligence and machine vision experts . Human behavior recognition and analysis is one of the principal issues in this context which aims to gain an understanding about what a human does and what is the meaning of his actions. Broad definition of activity or behavior and also various environmental conditions of video sequences makes this issue a multi-sided problem, especially when multiview video streams are considered. Therefore, in addition to feature extraction/selection and classification steps, as in a usual classification problem, selection of a proper recognition scenario is very essential. There are many researches about each part of human activity recognition and analysis in multiview video sequences, but a general framework does not exist . This is our goal in this thesis. First, a new semantic feature, BPG descriptor, which is a good discriminator for human behaviors, is introduced. Next, a new extension of hidden Markov model, PLHMM, is designed which is especially developed for using in classification of multiview video streams, a special case of a multi-sensor system. Afterwards, some analysis strategies are developed in multiview behavior video streams using this new classifier. Good performance and accurate resultshave been achieved which prove the proposed systems' applicability in multiview human behavior recognition and analysis. Keywords: video processing, machine vision, human action recognition, human behavior analysis, multiview video sequences, feature extraction, action descriptor, hidden Markov models. ارائهدهنده: امیرفرید امینیان مدرس استاد راهنما: دکتر محسن سریانی هیات داوران: دکتر شهره کسایی (دانشگاه صنعتی شریف) دکتر نصرالله مقدم چرکری (دانشگاه تربیت مدرس)
دکتر حمیدرضا صادق محمدی
دکتر محمدرضا جاهد مطلق
دکتر محمود فتحی
زمان : سهشنبه 20 خردادماه 1393
ساعت 11 صبح مکان: دانشکده مهندسی کامپیوتر- طبقه دوم- اتاق دفاعیه دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی
|