چکیده مقاله تشخیص موجودیت های اسمی بر پایه شبکه های عصبی با حافظه بلندمدت-کوتاه مدت

مسئلۀ شناسایی موجودیت‌های اسمی به‌عنوان یکی از شاخه‌های پردازش زبان طبیعی و زیرمجموعه‌ای از استخراج اطلاعات به‌شمار می‌رود. هدف اصلی در تشخیص موجودیت‌های اسمی، دسته‌بندی اسامی خاص متن با برچسب‌هایی مانند شخص، مکان و سازمان است. امروزه اکثر روش‌هایی که برای این منظور معرفی شده‌اند سعی در استفاده از ویژگی‌هایی دارند که مختص به یک زبان خاص نیست. از جمله این روش‌ها می‌توان به استفاده از شبکه عصبی با حافظه بلند مدت – کوتاه مدت اشاره‌کرد. آموزش این شبکه‌های عصبی به‌وسیله استخراج ویژگی‌ها از بردارهای کلمات در سطح نویسه و بردارهای کلمات از پیش آموزش دیده انجام می‌گیرد. دراین مقاله مدل جدیدی برای ساخت نمایش‌های برداری کلمات پیشنهاد می‌شود که از ترکیب بردار نحوی کلمه با دو بردار کلمه قبلی به‌دست می‌آید. بردار نحوی کلمه شامل اطلاعات نحوی موجود در جمله مانند موقعیت کلمه در جمله، نقش کلمات و ارتباط نحوی آن‌ها با یکدیگر است. استفاده از این روش باعث توسعه سیستم‌هایی می‌شود که کمترین وابستگی را به دامنه دارند. کارایی روش پیشنهادی بر روی مجموعه داده موجودیت‌های اسمی مورد ارزیابی قرار گرفته‌است. نتایج به‌دست آمده، نشان‌دهنده بهبود قابل ملاحظه‌ای در مقایسه با سایر روش‌های مطرح در حوزه تشخیص موجودیت‌های اسمی می‌باشد.