معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسی مقاله

پردازش و مدیریت اطلاعات زمستان 1401 - شماره 110 رتبه بین المللی (وزارت علوم/ISC (‎31 صفحه - از 273 تا 303 )

کلیدواژه ها: PerCause یادگیری عمیق CRF شناسایی عبارات علّی CRF Deep learning PerCause Causality Annotated Corpus Causality Detection

fa en

چکیده:

شناسایی روابط علّی و همچنین تعیین مرز عناصر علّی در متن، از جمله مسائل چالش برانگیز در پردازش زبان طبیعی (NLP) به ویژه در زبان‌‌های کم‌منبع مانند فارسی است. در این پژوهش، در راستای آموزش سیستمی برای شناسایی روابط علّی و مرز عناصر آن، یک پیکره علّیت برچسب خورده انسانی برای زبان فارسی معرفی می‌شود. این مجموعه شامل 4446 جمله (مستخرج از پیکره بیجن خان و متن یکسری کتاب) و 5128 رابطه علّی است و در صورت وجود، سه برچسب علت، معلول و نشانه علّی برای هر رابطه مشخص شده است. ما از این پیکره برای آموزش سیستمی برای تشخیص مرزهای عناصر علّی استفاده کردیم. همچنین، یک بستر آزمون شناسایی علّیت را با سه روش یادگیری ماشین و دو سیستم یادگیری عمیق مبتنی بر این پیکره ارائه می‌کنیم. ارزیابی‌های عملکرد نشان می‌دهد که بهترین نتیجه کلی از طریق طبقه‌بندی کننده CRF به دست می‌آید که معیار F برابر 76% را ارائه می‌کند. علاوه بر این، بهترین صحت (91.4٪) در روش یادگیری عمیق BiLSTM-CRF به دست آمده است. به نظر می‌رسد وجود CRF به دلیل مدلسازی بافتار منجر به بهبود دقت سیستم می‌شود.

دریافت فایل ارجاع :
(پژوهیار, , , )

دانلود HTML
دانلود PDF

ورود / عضویت

برای مشاهده محتوای مقاله لازم است وارد پایگاه شوید. در صورتی که عضو نیستید از قسمت عضویت اقدام فرمایید.

ورود

عضویت

تحتاج دخول لعرض محتوى المقالة. إذا لم تكن عضوًا ، فتابع من الجزء الاشتراک.
إن كنت لا تقدر علی شراء الاشتراك عبرPayPal أو بطاقة VISA، الرجاء ارسال رقم هاتفك المحمول إلی مدير الموقع عبر webmaster@noormags.com .

You need Sign in to view the content of the article. If you are not a member, proceed from part Sign up.
If you fail to purchase subscription via PayPal or VISA Card, please send your mobile number to the Website Administrator via webmaster@noormags.com .

لینک کوتاه: