چکیده:
هدف مقاله تعیین مسیری برای تبیین فناورانه مفهومیابی از آیات قرآن است. مفهومیابی یکی از مراحل اصلی روش تحقیق موضوعی در قرآن کریم است و در عین حال در سایر مطالعات مرتبط با فهم قرآن میتواند به کار گرفته شود. استفاده از دانش متنکاوی رایانشی برای پردازش متون، روشی متداول در فناوری دنیای امروز است. قرآن کریم نیز به عنوان یک متن و زبان مورد توجه این دانش قرار گرفته است. گام اول برای تحلیل هر متن تشکیل پیکره متنی است که متن را به دادههای ساختیافته تبدیل میکنند. در طراحی این پیکرهها از قواعد مختلفی از جمله قواعد متداول صرفی- نحوی استفاده میشود. آنچه انتظار داریم درنهایت به عنوان خروجی ماشین از آن بهره بگیریم، مفهومیابی و استخراج دانش یا ابزارهایی برای تسهیل این کار است؛ لذا پس از تشکیل پیکره متنی، دادههای نمونه برای استفاده در فرایند یادگیری ماشین برای مفهومیابی آماده شدهاند. این دادهها الگوهای ساده زبانی مبتنی بر پیکره متنی است که منجر به دریافت مفهوم میشود و میتواند در مراحل تکمیلی تدقیق شده، به سمت الگوهای پیشرفته سوق پیدا کند.
خلاصه ماشینی:
امروزه محققان زيادي در حوزه علوم کامپيوتر به ايجاد داده از متن قرآن و تحليل آنها پرداخته اند؛ لکن مشاهده نمونه هاي دادهکاوي در قرآن نشان ميدهد در اين پژوهش ها عمدتاً آمارهاي کمّي قرآني مورد پردازش قرار ميگيرد.
نحوه تبديل متن قرآن به دادههاي ساختاريافته به نحوي که قابل پردازش بوده و نتايج آن به حوزه فهم قرآن ارتباط ٨٣ بيشتري داشته باشد، پرسشي است که اين پژوهش در صدد پاسخگويي به آن است ؛ به عبارتي اين پژوهش در صدد است فرايند به خدمت گيري دانش دادهکاوي براي مفهوميابي از آيات قرآن کريم را شرح دهد.
علاوه بر اين توليد دادههاي ساخت يافته متناظر اين الگوريتم ها در مرحله پيش پردازش (Pre processing) نيز ميتواند متفاوت باشد؛ براي نمونه ميتوان عملگرها و وظايفي (Task) چون ردهبندي (Classification)، خوشه بندي (Clustering)، پيشگويي (Prediction) و استخراج دانش (Knowledge Extraction) را از الگوريتم هاي مختلف يادگيري ماشين بر شمرد.
الگوريتم هاي «NLP» در مرحله پيش پردازش مورد استفاده قرار ميگيرد؛ لذا آنچه در تبيين فناورانه هر فرايندي بايد پيموده شود، تبيين آن فرايند به قوانين منطقي و تکرارپذير است تا آن را به دادههاي ساخت يافته تبديل کند.
(رجوع شود به تصویر صفحه) تبديل هر متن از جمله قرآن کريم به دادههاي ساخت يافته با روشهاي گوناگوني ميتواند صورت بگيرد و اين روشها بر نحوه پردازش متن ، کشف روابط و الگوهاي ميان آنها تأثيرگذار خواهد بود.
همان طور که از محتواي اين جدول مشخص است ، برچسب هاي واژگان ميتوان در کنار متن تبديل به کدهايي شود که توسط سيستم قابل پردازش خواهد بود.