1
دانشجوی کارشناسی ارشد دانشکده ریاضی، آمار و علوم کامپیوتر، پردیس علوم، دانشگاه تهران
2
استادیار دانشکده ریاضی، آمار و علوم کامپیوتر، پردیس علوم، دانشگاه تهران
چکیده
امروزه مسئلۀ پیداکردن الگوریتمهای خوشهبندی نظارتشده برای دادههای پویا و جریان داده اهمیت زیادی دارد. محققان سعی میکنند برای حل کردن این مسئله الگوریتمهای جدید ارائه نمایند و یا الگوریتمهای موجود را بهبود دهند. در میان این الگوریتمها، روش SAIC برای خوشهبندی دادههای پویا با خوشههای با اندازه و شکل دلخواه ارائه شدهاست. در این روش، تعداد خوشهها به طور خودکار توسط الگوریتم مشخص میشود اما این الگوریتم قادر به تشخیص صحیح خوشههای مسائل تک دستهای نیست. این امر موجب میشود که بعضاً در خوشهبندی جریان داده اختلال ایجاد شود. در این مقاله ضمن توضیح علت ایجاد این مشکل، الگوریتمISAIC برای بهبود الگوریتم SAIC پیشنهاد میشود. همچنین عملکرد الگوریتم ISAIC با الگوریتم SAIC روی چند مجموعه داده مورد مقایسه قرار گرفته و نتایج ارایه شده است. میزان بهبود دقت دستهبندی بر روی مجموعه دادههای مورد آزمایش حداقل صفر و حداکثر حدود 65% است.