انتخاب نمونه‌های آموزشی بهینه براساس معیارهای فاصله برای آموزش رده‌بندی احساسات

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی کارشناسی ارشد، دانشکده مهندسی فناوری اطالعات و کامپیوترـ دانشگاه صنعتی ارومیه ـ ارومیه ـ ایران

2 استادیار دانشکده مهندسی فناوری اطلاعات و کامپیوترـ دانشگاه صنعتی ارومیه ـ ارومیه ـ ایران

چکیده

افزایش چشمگیر دسترس‌‌پذیری به نظرها و توصیه‌های برخط باعث می‌شود رده‌بندی احساسات در متون کوتاه یکی از موضوع‌های جالب توجه در تحقیقات علمی و صنعتی باشد. در زمینه رده‌بندی احساسات، اصطلاحات به کار برده شده در دامنه‌های مختلف ممکن است متفاوت باشند. درنتیجه مدلی که با داده‌های برچسب‌دار آموزشی (دامنۀ منبع) یادگیری می‌شود ممکن است عملکرد خوبی در برچسب‌گذاری داده‌های آزمایشی (دامنۀ هدف) نداشته باشد. یادگیری انتقالی و انطباق دامنه دو راه حل مفید برای مواجهه با این مشکل هستند. یادگیری انتقالی و انطباق دامنه، توزیع‌های دامنه منبع و هدف را به هم نزدیک می‌کنند تا عملکرد رده‌بند در دامنۀ هدف بهبود یابد اما نکتۀ حائز اهمیت این است که کدام دامنه‌ از مجموعه دامنه‌های نامزد به‌عنوان دامنه منبع انتخاب شود. روش پیشنهادی در این مقاله یک ترکیب خطی از معیارهای فاصله بین توزیع دامنه‌های منبع و هدف است که بهترین دامنۀ منبع را برای یادگیری رده‌بند انتخاب می‌کند. روش پیشنهادی بر روی مجموعه داده‌های همگن و ناهمگن ارزیابی شده است. همان‌طورکه نتایج نشان می‌دهد، مدل پیشنهادی، در مجموعه داده همگن با احتمال 47.1 درصد (5.9 درصد در مدل تصادفی) و در مجموعه داده ناهمگن با احتمال 23.1 درصد (8.3 درصد در مدل تصادفی) می‌تواند دامنه منبع صحیح را انتخاب کند که حاکی از بهبود چشمگیر عملکرد مدل پیشنهادی نسبت به مدل تصادفی در انتخاب دامنه منبع صحیح است.





 

کلیدواژه‌ها