تاثیر تکنیک‌های خلاصه‌سازی بر دسته‌بندی متون فارسی مقاله

مطالعات کتابداری و سازماندهی اطلاعات پاییز 1398 - شماره 119 رتبه ب (وزارت علوم/ISC (‎15 صفحه - از 9 تا 23 )

کلیدواژه ها: دسته‌بندی متون فارسی خلاصه‌ساز TF-ISF الگوریتم های دسته‌بندی معیارهای ارزیابی دسته‌بندی Classification of Persian texts TF ISF Summarizer Classification metrics Classification Algorithms متن خلاصه‌سازی اسناد

fa en

چکیده:

هدف این پژوهش، استفاده از ترکیب تکنیک های دسته بندی و خلاصه سازی و بررسی تاثیر افزایش تعداد اسناد می باشد که تأثیر پارامترهای خلاصه سازی TF وISF و چهار تکنیک دسته بندی بیزین، درخت تصمیم، قانون و بردار پشتیبان و سه معیار ارزیابی دقت، صحت و فراخوان بر روی 1000 سند متن اصلی و خلاصه محاسبه و تفاوت ها بررسی شدند. نتیجه ی این پژوهش حاکی از برتری اسناد 1000 تایی، روش خلاصه ساز ISF نسبت به TF، روش های دسته بندی بیزین و بردار پشتیان نسبت به روش قانون و درخت تصمیم، متن اصلی نسبت به متن خلاصه می باشد که بیشترین مقدار %96.67 از معیار صحت در دسته بندی SVM و اسناد 1000 تایی متن اصلی از تکنیک خلاصه ساز ISF حاصل شد.

خلاصه ماشینی:

Inverse sentence frequency مجموعه استاد ورودی مرحله پیش پردازش داده حذف کلمات ایست واژه یاهازی :: TF اده ازی :: TSF مرحله استخراج کلمات خروجی غلاسه ساز خروجی TF Tree خروجی 1SF پیاده سازی الگوریتم های دسته بندی Rule خروجی precision خروجی recall خروجی Accuracy مقایسه شکل ۱ چهارچوب گامهای اجرایی در پژوهش جدول ۱ تعداد برچسب ها در اسناد جمع آوری شده تعداد برچسب در ۱۰۰۰ برچسب تعداد برچسب در ۲۵۰ سند تعداد برچسب در ۵۰۰ سند ورزش بین الملل فرهنگی انتخابات اقتصاد سیاسی علمی- پزشکی در این پژوهش به جای سیستم وزن دهی کلاسیک TF-IDF از معیار TF-ISF استفاده شد که معیار محاسبه وزن در واحد جمله است پارامترهای TF و ISF به ترتیب نشان دهنده تعداد تکرار واژه در هر سند و معکوس تعداد جمله های حاوی کلمه در هر سند است و از آنها برای انتخاب جملههای . نتایج به دست آمده از این پژوهش حاکی از تأثیر مثبت استفاده از تکنیکهای خلاصه سازی در کارایی الگوریتمهای دسته بندی متون فارسی است (حداکثر مقدار ۸۸/۴۴ درصد در معیار صحت الگوریتم دسته بندی بیزین توسط پارامتر TF خلاصه).

دریافت فایل ارجاع :
(پژوهیار, , , )

دانلود HTML
دانلود PDF

ورود / عضویت

برای مشاهده محتوای مقاله لازم است وارد پایگاه شوید. در صورتی که عضو نیستید از قسمت عضویت اقدام فرمایید.

ورود

عضویت

تحتاج دخول لعرض محتوى المقالة. إذا لم تكن عضوًا ، فتابع من الجزء الاشتراک.
إن كنت لا تقدر علی شراء الاشتراك عبرPayPal أو بطاقة VISA، الرجاء ارسال رقم هاتفك المحمول إلی مدير الموقع عبر webmaster@noormags.com .

You need Sign in to view the content of the article. If you are not a member, proceed from part Sign up.
If you fail to purchase subscription via PayPal or VISA Card, please send your mobile number to the Website Administrator via webmaster@noormags.com .

لینک کوتاه:

1402

1401

1400

1399

1398

1397

1396

1395

1394

1393

1392

1391

1390

1389

1388

1387

1386

1385

1384

1383

1382

1381

1380

1379

1378

1377

1376

1375

1374

1373

1372

1371

1370

1369

تاثیر تکنیک‌های خلاصه‌سازی بر دسته‌بندی متون فارسی مقاله