چکیده مقاله طبقه بندی ترافیک شبکه با استفاده از الگوریتم جنگل تصادفی بهبودیافته

با افزایش سریع تعداد کاربران اینترنت و ظهور برنامه‌های جدید، ترافیک اینترنت به‌ شدت در حال رشد است. در نتیجه، شناسایی برنامه ها در شبکه به امر پیچیده ای تبدیل شده است. از طرف دیگر، طبقه بندی جریانها نقش مهمی در امنیت و مدیریت شبکه دارد. تکنیک های سنتی طبقه بندی ترافیک به بازرسی مستقیم بسته های جریان وابسته بودند. اخیراً، با توجه به محدودیت های روش های قبلی، از الگوریتم های یادگیری ماشین به‌منظور بهبود دقت طبقه بندی جریان های ترافیک، استفاده شده است. الگوریتم های یادگیری ماشین با استفاده از اطلاعات آماري جريان ها روی بسته ها، توانایی بالایی در طبقه بندی جریانهای ترافیک شبکه دارند. در این مقاله، ما تغییراتی را در الگوریتم جنگل تصادفی که جزء الگوریتم های با ناظراست، اعمال کرده و آن را جنگل تصادفی بهبودیافته نامگذاری کرده ایم. تغییرات داده شده به صورت انتخابهای پارامتری در رابطه با معیار مناسب برای ساخت درختان تصمیم و نحوه وزن دهی به درختان هنگام رای گیری می باشد. برای ارزیابی و مقایسه روش پیشنهادی از شش طبقه بند دیگر یادگیری ماشین شامل: الگوریتم شبکه عصبی چندلایه، ماشین بردار پشتیبان، درخت تصمیم C4.5، الگوریتم نزدیک ترین همسایه، بیز ساده و جنگل تصادفی ساده استفاده کرده ایم. نتایج آزمايشات بر روی مجموعه داده جریان های ترافیک واقعی UNIBS نشان می‌دهد كه روش پيشنهادي عملکرد بهتری نسبت به سایر الگوریتم ها ارائه می دهد و میانگین دقت طبقه‌بندی روی همه برنامه‌ها به 75/98 درصد می رسد.