استخراج ماشینی کلیدواژه با مدل‌سازی موضوعی LDA: شباهت‌سنجی با کلیدواژه‌های استاندارد و ارزیابی کاربران مقاله

نویسنده: شادان‌پور، فرزانه ؛ برنا، کیوان ؛ منتظر، غلامعلی ؛

تعامل انسان و اطلاعات پاییز 1401 - شماره 35 رتبه ب (وزارت علوم (‎20 صفحه - از 1 تا 20 )

کلیدواژه ها: استخراج ماشینی کلیدواژه مدل سازی موضو عی ال. دی. ای شباهت سنجی ارزیابی کاربر Similarity evaluation Us-ers' evaluation topic modeling Keyword Extraction Latent Dirichlet Allocation (LDA)

fa en

چکیده:

هدف: هدف این پژوهش بررسی نتایج استخراج خودکار کلیدواژه از فهرست مندرجات کتاب‌های الکترونیکی فارسی حوزۀ علوم با استفاده از مدل‌سازی موضوعی LDA، سنجش شباهت‌ کلیدواژه‌های خروجی با کلیدواژه‌های استاندارد و ارزیابی کاربران از کلیدواژه‌های استخراج‌شده به‌صورت ماشینی است. روش پژوهش: این پژوهش از حیث هدف کاربردی، از نوع پژوهش‌های متن‌کاوی و از جنبۀ روش‌های مورداستفاده در آن پژوهشی آمیخته است که در آن از مدل‌سازی موضوعی LDA برای استخراج کلیدواژه از فهرست‌های مندرجات استفاده‌شده‌است. ارزیابی رویکرد مورداستفاده با دو روش سنجش کسینوس شباهت و ارزیابی کیفی توسط کاربران صورت گرفته است. یافته‌ها: فهرست‌های مندرجات موردبررسی با میانگین پیراسته 02/260 کلمه از متون با طول متوسط محسوب می‌شوند و حدود 20 درصد از کلمات آن‌ها را ایست‌واژه‌ها تشکیل داده اند. میان کلیدواژه‌های استاندارد سرعنوانی و کلیدواژه‌های خروجی مدل LDA کسینوس شباهت 0932/0 و بسیار پایین به دست آمد. توافق کامل کاربران نشان داد کلیدواژه‌های خروجی مدل موضوعی LDA حوزه موضوعی کل پیکره را نشان می‌دهند، اما ازنظر کاربران به ترتیب کلیدواژه‌های سرعنوانی استاندارد ، کلیدواژه‌های مستخرج از مدل در زیرحوزه‌های موضوعی و کلیدواژه‌های مستخرج از مدل با کل پیکره در توصیف موضوعات هر تک مدرک موفق‌اند. نتیجه‌گیری: کلیدواژه‌های به‌دست‌آمده از مدل موضوعی LDA را می‌توان در مجموعه‌های ناشناخته به‌منظور استخراج محتوای موضوعی نا آشکار کل مجموعه به کار برد، اما برای ربط دقیق موضوع به مدرک در پیکره‌های بزرگ با موضوعات ناهمگن و متنوع، نمی‌توان از این روش استفاده کرد. این روش در رویه‌های رسمی توصیف موضوعی تک‌تک مدارک به‌صورت مستقل می‌تواند به عنوان یک سیستم پیشنهاددهنده کلیدواژه به نیروی انسانی نمایه‌ساز به کار گرفته شود.

دریافت فایل ارجاع :
(پژوهیار, , , )

دانلود HTML
دانلود PDF

ورود / عضویت

برای مشاهده محتوای مقاله لازم است وارد پایگاه شوید. در صورتی که عضو نیستید از قسمت عضویت اقدام فرمایید.

ورود

عضویت

تحتاج دخول لعرض محتوى المقالة. إذا لم تكن عضوًا ، فتابع من الجزء الاشتراک.
إن كنت لا تقدر علی شراء الاشتراك عبرPayPal أو بطاقة VISA، الرجاء ارسال رقم هاتفك المحمول إلی مدير الموقع عبر webmaster@noormags.com .

You need Sign in to view the content of the article. If you are not a member, proceed from part Sign up.
If you fail to purchase subscription via PayPal or VISA Card, please send your mobile number to the Website Administrator via webmaster@noormags.com .

لینک کوتاه:

1402

1401

1400

1399

1398

1397

1396

1395

1394

1393

استخراج ماشینی کلیدواژه با مدل‌سازی موضوعی LDA: شباهت‌سنجی با کلیدواژه‌های استاندارد و ارزیابی کاربران مقاله