چکیده مقاله بهبود رده بندی داده های نامتوازن در الگوریتم جنگل تصادفی با استفاده از شبکه های عصبی- مرحله

امروزه پژوهشگران برای داده‌کاوی ، با دو نوع داده، مواجه هستند: 1- داده‌های متوازن 2- داده‌های نامتوازن . چالش اصلی، در داده‌کاوی داده‌های نامتوازن است. از طرفی، یکی از روش‌های داده‌کاوی، رده‌بندی است. برای رده‌بندی داده‌های نامتوازن با چالش‌هایی مانند: استخراج مدل جانبدارانۀ متمایل به داده‌های آموزشی، رده‌بندی اشتباه رده اقلیت ، صرفه‌نظر کردن از داده‌های مهم ردۀ اقلیت و بیش‌پوشش مواجه هستیم؛ از این رو از روش‌های مرسوم و معمول نمی‌توان برای رده‌بندی این نوع داده‌ها استفاده کرد. در این تحقیق، سعی شده است رده‌بندی داده‌های نامتوازن با الگوریتم جنگل تصادفی را با استفاده از روش شبکه‌های عصبی–مرحلۀی انفیس ، بهبود بخشیده و معیارهای مختلف برای ارزیابی این روش، سنجیده شود.