چکیده مقاله روش بی نام سازی داده های حساس با حفظ سودمندی مبتنی بر مرتب سازی داده ها

ریزتجمیع خانواده‌ای از روش‌های کنترل افشای آماری (SDC) از ریزداده‌ها (رکوردهای اشخاص و یا شرکت‌ها) برای پوشش ریزداده‌ها است. داده‌های منتشر شده باید ضمن حفظ سودمندی، حریم خصوصی صاحبان داده‌ها را حفظ کند. بنابراین یک توازن بین سودمندی داده‌ها و حریم خصوصی وجود دارد. در این مقاله دو الگوریتم ریزتجمیع پیشنهاد شده است که NFPN++ و ENFPN نامیده می‌شود که ابتدا داده‌ها را با توجه به رکورد آخر و رکورد ماقبل آخر و پنج رکورد آخر مرتب می‌سازد، سپس یک بخش‌بندی با کمترین اتلاف سودمندی نسبت به داده‌های مرتب شده جستجو می‌کند. نتایج تجربی نشان می‌دهد که روش پیشنهادی به کمترین اتلاف اطلاعات نسبت به روش‌های ریزتجمیع گذشته دست یافته است و توازن بهتر بین سودمندی داده‌ها و حریم خصوصی را میسر ساخته است.