ارائۀ مدلی مبتنی بر ویژگی های زمانی برای تشخیص شایعات فاری در شبکه اجتماعی توییتر

نوع مقاله : مقاله پژوهشی

نویسندگان

1 کارشناسی ارشد مهندسی کامپیوتر، دانشگاه صنعتی امیرکبیر)پلیتکنیک(، تهران

2 استادیار گروه علوم کامپیوتر، دانشگاه شاهد، تهران، ایران

3 دانشیار گروه مهندسی کامپیوتر، دانشگاه صنعتی امیرکبیر)پلیتکنیک(، تهران

چکیده

امروزه با پیشرفت فناوری و رشد چشم‌گیر شبکه‌های اجتماعی برخط، بسیاری از مردم جهت اطلاع از آخرین اخبار روز به این دسته از رسانه‌ها رجوع می‌کنند. این شبکه‌ها با تسهیل در ایجاد و انتشار پیام‌ها، امکان پخش شایعات را افزایش داده و در نتیجه اخبار حاصل از آن‌ها، از اعتبار کمتری نسبت به رسانه‌های سنتی برخوردار شده است. تشخیص خودکار شایعات از میان پیام‌های منتشر شده در شبکه‌های اجتماعی برخط، نیازی است که در سال‌های اخیر مطرح شده و بسیاری از دانشمندان در تلاش بوده‌اند تا راه‌حلی برای آن ارائه دهند. بنابراین ارائه روش‌هایی برای تشخیص شایعات، بیشتر از گذشته مورد توجه قرار گرفته است. در این مقاله، روشی برای تشخیص شایعات فارسی در شبکه اجتماعی توئیتر ارائه می‌شود. روش ارائه شده ابتدا کل پیام‌های مجموعه‌داده را پردازش و پیام‌های مشابه را خوشه‌بندی می‌کند و برچسب اکثریت پیام‌ها در هر خوشه را به‌عنوان برچسب آن خوشه در نظر می‌گیرد. سپس یکسری ویژگی از این خوشه‌ها استخراج می‌شود. در این مقاله، برای اولین بار ویژگی‌های مربوط به زمان در این مسئله استفاده شده است. با استفاده از این خوشه‌های برچسب‌خورده و ویژگی‌های استخراج شده یک مدل درخت تصمیم آموزش داده می‌شود. مدل حاصل نهایتا قابلیت این را دارد که شایعه بودن خوشه پیام‌های منتشر شده در شبکه‌ اجتماعی توئیتر را تشخیص دهد. ارزیابی‌های انجام شده نشان می‌دهد که این مدل قادر است شایعه بودن خوشه پیام‌های شامل پنج پیام یا بیشتر را با دقت و فراخوانی 847/0 و 866/0 تشخیص دهد.





 

کلیدواژه‌ها