طبقه بندی ترافیک شبکه با استفاده از الگوریتم جنگل تصادفی بهبودیافته

نوع مقاله : مقاله پژوهشی

نویسندگان

1 کارشناس ارشد دانشکده مهندسی- گروه کامپیوتر- دانشگاه کردستان – سنندج - ایران

2 استادیار دانشکده مهندسی- گروه کامپیوتر- دانشگاه کردستان - سنندج - ایران

چکیده

با افزایش سریع تعداد کاربران اینترنت و ظهور برنامه‌های جدید، ترافیک اینترنت به‌ شدت در حال رشد است. در نتیجه، شناسایی برنامه ها در شبکه به امر پیچیده ای تبدیل شده است. از طرف دیگر، طبقه بندی جریانها نقش مهمی در امنیت و مدیریت شبکه دارد. تکنیک های سنتی طبقه بندی ترافیک به بازرسی مستقیم بسته های جریان وابسته بودند. اخیراً، با توجه به محدودیت های روش های قبلی، از الگوریتم های یادگیری ماشین به‌منظور بهبود دقت طبقه بندی جریان های ترافیک، استفاده شده است. الگوریتم های یادگیری ماشین با استفاده از اطلاعات آماری جریان ها روی بسته ها، توانایی بالایی در طبقه بندی جریانهای ترافیک شبکه دارند. در این مقاله، ما تغییراتی را در الگوریتم جنگل تصادفی که جزء الگوریتم های با ناظراست، اعمال کرده و آن را جنگل تصادفی بهبودیافته نامگذاری کرده ایم. تغییرات داده شده به صورت انتخابهای پارامتری در رابطه با معیار مناسب برای ساخت درختان تصمیم و نحوه وزن دهی به درختان هنگام رای گیری می باشد. برای ارزیابی و مقایسه روش پیشنهادی از شش طبقه بند دیگر یادگیری ماشین شامل: الگوریتم شبکه عصبی چندلایه، ماشین بردار پشتیبان، درخت تصمیم C4.5، الگوریتم نزدیک ترین همسایه، بیز ساده و جنگل تصادفی ساده استفاده کرده ایم. نتایج آزمایشات بر روی مجموعه داده جریان های ترافیک واقعی UNIBS نشان می‌دهد که روش پیشنهادی عملکرد بهتری نسبت به سایر الگوریتم ها ارائه می دهد و میانگین دقت طبقه‌بندی روی همه برنامه‌ها به 75/98 درصد می رسد.





 

کلیدواژه‌ها