خوشه‌بندی داده‌های جریان داده دارای برچسب

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی کارشناسی ارشد دانشکده ریاضی، آمار و علوم کامپیوتر، پردیس علوم، دانشگاه تهران

2 استادیار دانشکده ریاضی، آمار و علوم کامپیوتر، پردیس علوم، دانشگاه تهران

چکیده

امروزه مسئلۀ پیداکردن الگوریتم‌های خوشه‌بندی نظارت‌شده برای داده‌های پویا و جریان داده اهمیت زیادی دارد. محققان سعی می‌کنند برای حل کردن این مسئله الگوریتم‌های جدید ارائه نمایند و یا الگوریتم‌های موجود را بهبود دهند. در میان این الگوریتم‌ها، روش SAIC برای خوشه‌بندی داده‌های پویا با خوشه‌های با اندازه و شکل دلخواه ارائه شده‌است. در این روش، تعداد خوشه‌ها به طور خودکار توسط الگوریتم مشخص می‌شود اما این الگوریتم قادر به تشخیص صحیح خوشه‌های مسائل تک دسته‌ای نیست. این امر موجب می‌شود که بعضاً در خوشه‌بندی جریان داده اختلال ایجاد شود. در این مقاله ضمن توضیح علت ایجاد این مشکل، الگوریتمISAIC برای بهبود الگوریتم SAIC پیشنهاد می‌شود. همچنین عملکرد الگوریتم‌ ISAIC با الگوریتم SAIC روی چند مجموعه‌ داده مورد مقایسه قرار گرفته و نتایج ارایه شده است. میزان بهبود دقت دسته‌بندی بر روی مجموعه داده‌های مورد آزمایش حداقل صفر و حداکثر حدود 65% است.

 

کلیدواژه‌ها