نگاشت ویژگی صریح دقیق متناهی‌البعد برای توابع هسته

غیاثی شیرازی, سید کمال الدین; قرائی, محمدرضا

نگاشت ویژگی صریح دقیق متناهی‌البعد برای توابع هسته

نوع مقاله : مقاله پژوهشی

نویسندگان

¹ استادیار، دانشکده مهندسی کامپیوترـ دانشگاه فردوسی مشهدـ مشهدـ ایران

² دانشجوی دکتری، دانشکده مهندسی کامپیوترـ دانشگاه آلتوـ اسپو ـ فنالند

چکیده

روش‌های هسته در یادگیری ماشین، از یک تابع هسته استفاده می‌کنند که به‌عنوان ورودی دو داده را دریافت می‌کند و حاصل‌ضرب داخلی آن‌ها پس از نگاشت به یک فضای هیلبرت را، به‌صورت ضمنی و بدون این‌که چنین نگاشتی به فضای هیلبرت واقعا محاسبه شود، برمی‌گرداند. برای بسیاری از توابع هسته، همانند هسته‌های گوسی و لاپلاسی، فضای ویژگی شناخته شده بی‌نهایت بعدی است و به همین دلیل گفته می‌شود که عملیات در فضای هیلبرت این توابع هسته تنها به‌صورت ضمنی ممکن است. ضمنی بودن این فضا باعث می‌شود که ما مجبور باشیم الگوریتم‌ها را در فضایی که تصوری از آن نداریم با استفاده از نمایش دوگان و حقۀ هسته بیان کنیم. ما در این مقاله برای هر تابع هسته دلخواه یک فضای ویژگی متناهی البعد و نگاشتی صریح و دقیق به این فضای ویژگی معرفی می‌کنیم که در حد عملیات مورد نیاز در الگوریتم‌های یادگیری ماشین هسته‌ای، هم در زمان آموزش و هم آزمون، حاصل‌ضرب داخلی داده‌ها در این فضای ویژگی صریح با مقدار تابع هسته برابر است. وجود این نگاشت صریح به فضای ویژگی به ما این امکان را می‌دهد که نسخۀ هسته‌ای یک الگوریتم را در فرم اولیه و بدون نیاز به حقه هسته و نمایش دوگان به‌دست آوریم. به‌عنوان اولین کاربرد، ما نشان می‌دهیم که چطور می‌توان، بدون توسل به نمایش دوگان، نسخۀ هسته‌ای الگوریتم‌های یادگیری ماشین را به‌دست آورد و این روش را به‌صورت مشخص در مورد PCA به کار می‌بریم. به‌عنوان کاربردی دیگر از روش پیشنهادی، ما بدون انجام هیچ تغییری در الگوریتم t-SNE، از کد آماده آن برای بصری‌سازی فضای ویژگی توابع هسته استفاده می‌کنیم.

کلیدواژه‌ها