1
استادیار، دانشکده مهندسی کامپیوترـ دانشگاه فردوسی مشهدـ مشهدـ ایران
2
دانشجوی دکتری، دانشکده مهندسی کامپیوترـ دانشگاه آلتوـ اسپو ـ فنالند
چکیده
روشهای هسته در یادگیری ماشین، از یک تابع هسته استفاده میکنند که بهعنوان ورودی دو داده را دریافت میکند و حاصلضرب داخلی آنها پس از نگاشت به یک فضای هیلبرت را، بهصورت ضمنی و بدون اینکه چنین نگاشتی به فضای هیلبرت واقعا محاسبه شود، برمیگرداند. برای بسیاری از توابع هسته، همانند هستههای گوسی و لاپلاسی، فضای ویژگی شناخته شده بینهایت بعدی است و به همین دلیل گفته میشود که عملیات در فضای هیلبرت این توابع هسته تنها بهصورت ضمنی ممکن است. ضمنی بودن این فضا باعث میشود که ما مجبور باشیم الگوریتمها را در فضایی که تصوری از آن نداریم با استفاده از نمایش دوگان و حقۀ هسته بیان کنیم. ما در این مقاله برای هر تابع هسته دلخواه یک فضای ویژگی متناهی البعد و نگاشتی صریح و دقیق به این فضای ویژگی معرفی میکنیم که در حد عملیات مورد نیاز در الگوریتمهای یادگیری ماشین هستهای، هم در زمان آموزش و هم آزمون، حاصلضرب داخلی دادهها در این فضای ویژگی صریح با مقدار تابع هسته برابر است. وجود این نگاشت صریح به فضای ویژگی به ما این امکان را میدهد که نسخۀ هستهای یک الگوریتم را در فرم اولیه و بدون نیاز به حقه هسته و نمایش دوگان بهدست آوریم. بهعنوان اولین کاربرد، ما نشان میدهیم که چطور میتوان، بدون توسل به نمایش دوگان، نسخۀ هستهای الگوریتمهای یادگیری ماشین را بهدست آورد و این روش را بهصورت مشخص در مورد PCA به کار میبریم. بهعنوان کاربردی دیگر از روش پیشنهادی، ما بدون انجام هیچ تغییری در الگوریتم t-SNE، از کد آماده آن برای بصریسازی فضای ویژگی توابع هسته استفاده میکنیم.