سیستمهای پرسش و پاسخ زیر شاخه ای از علوم پردازش زبان طبیعی و بازیابی اطلاعات محسوب میشوند. سیستمهای پرسش و پاسخ، پرسش را به یک زبان طبیعی (مثلاً فارسی) دریافت کرده و جواب مختصر و دقیق را در اختیار کاربر قرار میدهند. بنابراین دیگر لازم نیست کاربر مانند سیستمهای بازیابی اطلاعات پرسش خود را به کلید واژهها تبدیل کند و پس از بازیابی، تعداد زیادی سند را مطالعه کند تا به جواب دلخواه خود برسد. پیشرفتهای قابل توجهی در این زمینه، بخصوص در زبان انگلیسی انجام شده است، اما در زبان فارسی چنین سیستمی طراحی و پیاده سازی نشده است. در صورتیکه مزایای اینگونه سیستم¬ها و کاربردهای آنها مانند استفاده به عنوان جویشگر با قابلیت ویژه پرسش و پاسخ، دستیارهای همراه و غیره قابل توجه است. در این مقاله، مراحل تولید اولین سیستم پرسش و پاسخ فارسی در دامنه نامحدود و وب مبنا به نام "جویا" به همراه مجموعه دادههای این سیستم، معرفی خواهد شد. جویا بصورت کلی شامل زیرمولفه¬های پردازش پرسش، بازیابی اطلاعات و استخراج جواب دقیق می¬باشد. به دلیل نبود مجموعه داده ارزیابی در زبان فارسی مجموعه داده ارزیابی برای این سیستم تهیه شده است. مجموعه داده ارزیابی شامل 412 پرسش متنوع، و پاسخ متناظر آن است. سیستم پیشنهادی به 80 درصد صحت دست پیدا کرده است.