چکیده مقاله رفع ابهام معنايي کلمات فارسي با استفاده از رویکرد نظارت شده الگوریتمهای IBL

در هر زبان کلماتی مبهم وجود دارند که دارای معانی متفاوتی هستند. مساله یافتن معنای صحیح کلمه ی دارای معانی متعدد، از مسایل جاری در حوزه پردازش زبانهای طبیعی محسوب میشود. انتخاب معنی درست ممکن است برای انسان بسیار واضح و آسان باشد ولی تشخیص اینکه کدام یک از معانی موجود برای یک کلمه بایستی در جمله خاص انتخاب شود برای ماشین دشوار است. چهار رویکرد متفاوت برای رفع ابهام معنایی کلمات وجود دارد: رویکرد مبتنی بر دانش، رویکرد تحت نظارت، رویکرد نیمه نظارتی و رویکرد بدون نظارت هستند.در میان این روش¬ها ما روش یادگیری مبتنی بر نمونه(IBL) که بر اساس رویکرد نظارتی است برگزیدیم. در این مقاله دو دسته ویژگی مبتنی بر کلمات موضوعی معرفی کردیم، دسته اول وجود و عدم وجود کلمات موضوعی را وابسته به وزن هر کلمه موضوعی تعیین می کند و دسته دوم مجموع وزن کلمات موضوعی در هر جمله را مشخص می کند. بعد از انجام عملیات پیش پردازش روی نمونه های ذخیره شده برای هر کلمه، دو ماتریس ویژگی استخراج می¬شود. هر ماتریس ویژگی به عنوان ورودی نرم افزار وکا در نظر گرفته شده است. سپس با استفاده از طبقه بندی کننده مبتنی بر نمونه و با روش اعتبار سنجی متقابل 10 تایی نتایج را ارائه می¬دهیم. سپس نتایج حاصل از هر ماتریس ویژگی را برای یافتن ویژگی بهینه مورد بررسی قرار می¬دهیم. همچنین روش خود را روی دیگر الگوریتم های یادگیری ماشین مورد بررسی قرار داده و نتایج را ارائه می¬کنیم.میانگین صحت عملکرد روش پیشنهادی 88.31% میباشد.