مجله علوم رایانشی

چکیده مقاله روشی نوین برای شناسایی نویسنده متون با ترکیب الگوریتم‌های بهینه‌سازی توده ذرات و ماشین بردار پشتیبان

تشخیص هوشمند نویسنده متون در زمینه‌های جرم‌شناسی دارای کاربردهای فراوانی می‌باشد اما به دلیل این‌که عوامل بسیاری در تشخیص نویسنده متون دخیل می‌باشند، نمی‌توان به‌طور دقیق و مطمئن نویسندگان متون را تشخیص داد. از این رو تحقیقات بسیاری در این زمینه از قرن نوزدهم صورت گرفته است اما تاکنون روشی با دقت 100 درصد برای تمامی متون ارائه نشده است و محققان هر روزه روش‌های جدیدی را ارایه می‌دهند تا به دقت 100 درصد نزدیک بشوند. در این مقاله برای حل این مسئله از ترکیب الگوریتم بهینه‌سازی توده ذرات و الگوریتم ماشین بردار پشتیبان استفاده شده است که از الگوریتم بهینه‌سازی توده ذرات به‌عنوان الگوریتم استخراج‌کننده ویژگی و از الگوریتم ماشین بردار پشتیبان به‌عنوان تشخیص‌دهنده نویسندگان استفاده شده است. ارزیابی برروی مجموعه داده Reuter_50_50 انجام شده است. در روش پیشنهادی پس از استخراج ویژگی‌ها، داده‌ها با نسبت 80 به 20 به داده‌های آموزشی و آزمایشی تقسیم می‌شوند. مجموعه ‌داده‌های آموزشی به‌عنوان ورودی به الگوریتم ماشین بردار پشتیبان داده می‌شوند و پس از آموزش دیدن توسط ماشین بردار پشتیبان، مدل مناسب ساخته می‌شود و سپس مجموعه ‌داده‌های آزمایشی براساس مدل ساخته شده، اعتبارسنجی می‌شوند. تقسیم‌بندی داده‌ها در حالت 80 (آموزش) درصد و 20 (آزمایشی) درصد بهترین نتیجه را داشته است. نتایج برمبنای معیارهای دقت و فراخوانی نشان می‌دهد که دقت تشخیص مدل پیشنهادی در مقایسه با مدل ماشین بردار پشتیبان بیشتر است.