دانشکده ریاضی، آمار و علوم کامپیوترـ پردیس علوم ـ دانشگاه تهران ـ تهران - ایران
چکیده
تصویر منعکس شده از اشیاء پیرامون بر روی شبکیه چشم همواره با تغییراتی در اندازه، زاویه دید، شرایط نوری، پسزمینه و نوفه همراه است. با این وجود، سیستم بینایی انسان میتواند اشیاء را در زمان بسیار کوتاهی شناسایی کند. تا به امروز مدلهای محاسباتی متعددی به منظور شبیهسازی فرایند پردازشی سلسلهمراتبی در قشر بینایی مغز ارائه شدهاند که با موفقیتهای محدودی همراه بودهاند. در این مقاله نشان میدهیم که ترکیب ساختاری مبتنی بر قشر بینایی با قواعد یادگیری موجود در مغز منجر به افزایش دقت در بازشناسی اشیاء مستقل از تغییرات میگردد. مدل پیشنهادی یک شبکه عصبی ضربهای پیشرو است که در آن نورونهای لایه اول لبههای موجود در تصویر با زوایای مختلف را شناسایی میکنند به طوری که نورون متناظر با لبهای با تضاد نوری بیشتر سریعتر از سایر نورونها فعال میشود. نورونهای لایۀ بعدی نیز با استفاده از قاعده یادگیری وابسته به ترتیب زمانی ضربهها به یادگیری ویژگیهای بینایی موجود در تصاویر ورودی میپردازند. نتایج بهدست آمده بر روی مجموعه دادههای 3D-Object و ETH-80، قدرت بالای مدل پیشنهادی در بازشناسایی اشیاء را نشان میدهد. همچنین ویژگیهای استخراج شده در مدل پیشنهادی بازسازی و به همراه مکان شناسایی آنها در تصاویر ورودی نشان داده شدهاند.