چکیده مقاله جویا: یک سیستم پرسش و پاسخ فارسی

سیستم‌های پرسش و پاسخ زیر شاخه ای از علوم پردازش زبان طبیعی و بازیابی اطلاعات محسوب می‌شوند. سیستم‌های پرسش و پاسخ، پرسش را به یک زبان طبیعی (مثلاً فارسی) دریافت کرده و جواب مختصر و دقیق را در اختیار کاربر قرار می‌دهند. بنابراین دیگر لازم نیست کاربر مانند سیستم‌های بازیابی اطلاعات پرسش خود را به کلید واژه‌‌ها تبدیل کند و پس از بازیابی، تعداد زیادی سند را مطالعه کند تا به جواب دلخواه خود برسد. پیشرفت‌های قابل توجهی در این زمینه، بخصوص در زبان انگلیسی انجام شده است، اما در زبان فارسی چنین سیستمی طراحی و پیاده سازی نشده است. در صورتیکه مزایای اینگونه سیستم¬ها و کاربردهای آنها مانند استفاده به عنوان جویشگر با قابلیت ویژه پرسش و پاسخ، دستیارهای همراه و غیره قابل توجه است. در این مقاله، مراحل تولید اولین سیستم پرسش و پاسخ فارسی در دامنه نامحدود و وب مبنا به نام "جویا" به همراه مجموعه داده‌های این سیستم، معرفی خواهد شد. جویا بصورت کلی شامل زیرمولفه¬های پردازش پرسش، بازیابی اطلاعات و استخراج جواب دقیق می¬باشد. به دلیل نبود مجموعه داده ارزیابی در زبان فارسی مجموعه داده ارزیابی برای این سیستم تهیه شده است. مجموعه داده ارزیابی شامل 412 پرسش متنوع، و پاسخ متناظر آن است. سیستم پیشنهادی به 80 درصد صحت دست پیدا کرده است.