استفاده از روش نیمه‌نظارتی انتشار برچسب برای رتبه‌بندی اعتباری مشتریان بانک (مطالعه موردی بانک پاسارگاد)

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی کارشناسی ارشد دانشکدۀ علوم پایه، گروه ریاضی، دانشگاه آیتاهللالعظمی بروجردی

2 استادیار دانشکدۀ علوم پایه، گروه ریاضی، دانشگاه آیتاهللالعظمی بروجردی

چکیده

امروزه، بانک‌ها و موسسات مالی مجموعه‌های حجیم از داده‌های مختلف و متنوعی مرتبط با مشتریان خود جمع‌آوری و نگهداری می‎کنند. رتبه‌بندی اعتباری با هدف شناسایی برچسب مشتریان اعتباری اعم از این‌که خوش‌حساب یا بدحساب هستند، سبب کاهش معوقات بانکی و ارائه بهینه و درست تسهیلات به مشتریان می‌شود و به‌عنوان یکی از مهم‌ترین روش‌های تحقیقی و عملیاتی مورد استفاده در بانک‌داری و مهندسی مالی شناخته می‌شود. در این راستا، روش‌های گوناگونی که تحت عنوان روش‎های نظارتی شناخته می‎شوند ابداع و استفاده شده است. در این روش‎ها، مدلی به کمک داده‎های برچسب‎دار موجود، ایجاد و برای پیش‎بینی برچسب داده‎های جدید استفاده می‎شود. بنابراین پیش‎فرض چنین روش‎هایی، وجود پایگاه داده‎ای است که تمام اشیاء داده‎ای آن برچسب داشته باشند. اما از آنجا که تعداد زیادی از داده‌های موجود در بانک‌ها فاقد برچسب هستند، یا برچسب دقیق و کارشناسی شده ندارند، استفاده از روش‎های نیمه‌نظارتی توصیه می‎شود. در روش‎های نیمه‎نظارتی برخلاف روش‎های نظارتی، لزومی به برچسب‎دار بودن تمام داده‎ها نیست و می‎توانند به‎وسیلۀ مجموعه‎های داده‌ای که بخش زیادی از آن بدون برچسب هستند، مدل‎های قابل اعتمادی ایجاد کنند. روش انتشار برچسب یکی از روش‎های نیمه‌نظارتی موفق و پرکاربرد در این زمینه می‌باشد. در این روش، ویژگی ردۀ داده‌های برچسب‌دار با یک روش تکراری به داده‌های فاقد برچسب منتشر می‌شود. در این پژوهش، ابتدا با کمک روش درخت تصمیم، ویژگی‌های تاثیرگذار بر وضعیت اعتباری مشتریان شناسایی و با کمک روش انتشار برچسب، مدل طبقه‌بندی مشتریان بانک ساخته می‎شود. به‌منظور نمایش کارایی مدل، از مجموعه داده‌های بانک پاسارگاد استفاده شده است. مدل نهایی بر روی داده‌های بانک پاسارگاد توانست به 78/99 درصد نرخ تشخیص مشتریان بدحساب و دقت کلی 77/98 درصد برسد. همچنین به‌منظور مقایسه، داده‌های یک بانک خارجی (آلمانی) نیز مورد بررسی قرار گرفت. بر اساس منابع مورد مطالعه در این تحقیق، بهترین دقت در بین مدل‌های نظارتی توسط روش درخت تصمیم مبتنی بر خوشه‌بندی و الگوریتم ژنتیک با دقت 37/85 درصد گزارش شده است. همچنین در بین مدل‌های نیمه‌نظارتی، روش نیمه‌نظارتی گروهی مبتنی بر پرسپترون چندلایه با دقت 4/75 درصد گزارش شده است، در حالی که روش نیمه‌نظارتی پیشنهادی در این مقاله، دقت 76.85 درصدی را کسب کرد. یافته‌های پژوهش حاکی از عملکرد مطلوب روش نیمه‌نظارتی پیشنهادی است.





 

کلیدواژه‌ها