[صفحه اصلی ]    
بخش‌های اصلی
درباره دانشکده::
مدیریت دانشکده::
اعضای هیات علمی ::
معرفی افراد::
امور آموزش و اطلاعیه دفاعیه ها::
امور فرهنگی::
امور پژوهشی::
اخبار و رویدادهای دانشکده::
فضاهای آموزشی و تحقیقاتی ::
تسهیلات پایگاه::
تماس با ما::
::
ورود به سایت دروس
دانشجویان روزانه و پردیس
دانشجویان مرکز آموزش الکترونیکی
..
اطلاعیه ها
 اطلاعیه های آموزشی
..
فراخوان ها
فراخوان های همکاری با صنعت و سازمان ها
..
دفاعیه‌ها

دفاعیه های دکتری


دفاعیه های کارشناسی ارشد

..
جستجو در پایگاه

جستجوی پیشرفته
..
دریافت اطلاعات پایگاه
نشانی پست الکترونیک خود را برای دریافت اطلاعات و اخبار پایگاه، در کادر زیر وارد کنید.
..
:: محمد فرهنگی - 28/10 ::
 | تاریخ ارسال: 1390/10/25 | 

 

 

AWT IMAGE

 

 آقای محمد مهدی فرهنگی دانشجوی کارشناسی ارشد جناب آقایان دکتر محسن سریانی و دکتر محمود فتحی روز چهارشنبه 28/10/90 ساعت 8 صبح در اتاق 304 واقع در طبقه سوم دانشکده کامپیوتر از پروژه کارشناسی ارشد خود تحت عنوان ارائه روشی برای تشخیص مفاهیم در تصاویر برپایه کلمات دیداری دفاع خواهند نمود.

 

  چکیده پایان نامه:

با گسترش روش­های جدید به منظور اخذ داده­های چند رسانه­ای و تسهیل در ذخیره­سازی آن­ها، پایگاه داده­های شامل این انواع داده با سرعت چشمگیری رو به گسترش می­باشند. در این شرایط لزوم ارائه روش­های جدید به منظور مدیریت این پایگاه­های داده بیش از پیش احساس می­شود. تشخیص مفاهیم در تصاویر با استفاده از سیستم­های کامپیوتری یکی از روش­های مدیریت این پایگاه داده­ها است که بدون نیاز به عامل انسانی به کشف مفاهیم در تصاویر می­پردازد. مطالعات اخیر در زمینه تشخیص و طبقه­بندی تصاویر اغلب از توصیف کننده­هایی برای نمایش تصاویر بصورت محلی استفاده می­کنند و بر اساس این توصیف کننده­های محلی نمایشی از تصویر تحت عنوان بسته کلمات دیداری ( BOW ) بدست می­آید. با این حال، نمایش BOW از مشکل نادیده گرفتن اطلاعات مکانی موجود در تصویر رنج می­برد. برای جبران این نقیصه در این پایان نامه نمایش جدیدی برای تصویر ارئه می­شود که در آن دو دسته از اطلاعات مکانی به نمایش BOW اضافه می­گردد. برای این منظور یک تصویر به چندین زیر تصویر تقسیم می­شود و BOW برای هر یک از زیر تصاویر جداگانه محاسبه شده و در نهایت بردارهای ویژگی BOW به یکدیگر الحاق می­شوند تا نمایش جدیدی از تصویر بدست آید. مجاورت کلمات، اطلاعات مکانی دیگری است که برای استفاده از این اطلاعات تعداد دفعاتی که هر جفت از کلمات دیداری در مجاورت یکدیگر اتفاق می­افتند شمارش شده و به مدل BOW اضافه می­شود. تعداد دفعاتی که ترکیب­های دوتایی از کلمات در مجاورت یکدیگر اتفاق می­افتند ویژگی جدیدی می­باشد که به نمایش BOW اضافه شده و نمایش جدیدی از تصویر که در بردارنده اطلاعات مکانی موجود در تصویر است بدست می­آید.

  Abstract:

  As the acquiring and storing of images and multimedia data is becoming fast and easy, the database of these data is become very large. In this situation the necessity for developing methods to manage these databases is become more and more important. Classifying images based on their content is one of these methods that finds the category of an image among several categories. However, this task is a challenging problem in the real world because we encounter a number of difficulties in the images where there exists occlusion, background clutter and lightning changes. Many of the recent methods for classifying the images represent them as sets of patches or regions, described by various descriptors. Based on these descriptions, an image can be represented as a bag of visual words (BOW). Recent studies have shown that the content of the images can be determined accurately when they are represented by the BOW model. However, this type of representation suffers from the fact that, it does not contain any spatial information. So, the spatial information in images is neglected when they are represented by this model. To deal with this problem, we propose a new representation for images which adds the spatial information to bag of word representation. For this purpose we explore two types of spatial information. First of all, it is important to know that where does a certain visual word occur in the image. To consider this information the image is divided into several sub images and the BOW is computed for each sub image independently. Words adjacency is the second type of spatial information which although conveys important information about the content of the image, it is neglected in BOW model. To consider this relation, we calculate number of times that each pair combination of words occurs in a certain neighborhood. For this purpose, we use an ontology structure to reduce the size of the vocabulary. Number of times that each pair of visual words occurs in vicinity, is the new feature which is concatenated to the bag of word representation. So, a new image representation contains the spatial information in the image is obtained.

 

 

 

  ارائه­دهنده:

محمد مهدی فرهنگی

 اساتید راهنما:

  دکتر محسن سریانی و دکتر محمود فتحی

  استاد ممتحن داخلی : دکتر پیمان کبیری

  استاد ممتحن خارجی :دکتر نصراله مقدم چرکری

  زمان : چهارشنبه 28 دیماه

  ساعت 8 صبح

  مکان: دانشکده مهندسی کامپیوتر- طبقه سوم- اتاق 304

  از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت
می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند.

  دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی

 

دفعات مشاهده: 2870 بار   |   دفعات چاپ: 816 بار   |   دفعات ارسال به دیگران: 40 بار   |   0 نظر
سایر مطالب این بخش سایر مطالب این بخش نسخه قابل چاپ نسخه قابل چاپ ارسال به دوستان ارسال به دوستان
data
Persian site map - English site map - Created in 0.15 seconds with 55 queries by YEKTAWEB 4709