چکیده:
اخبار جعلی ورزشی که در شبکههای اجتماعی پخش میشوند برای ورزشکاران، باشگاههای ورزشی، ورزش دوستان و ... ناخوشایند هستند، پس تشخیص اخبار جعلی و غیرجعلی امری مهم و کاربردی است. این پژوهش، در چارچوب زبانشناسی رایانهای انجامگرفته است. پیکرهی زبانی این تحقیق بر اساس بارگیری اخبار ورزشی از تارنمای ایسنا و برنامۀ اینستاگرام بوده است؛ بدین صورت که اخبار ورزشی از تارنمای ایسنا در یک محدودۀ زمانی بارگیری شده است و سپس در چند صفحه برنامۀ اینستاگرام، اخبار ورزشی بارگیری شده و از لحاظ جعلی بودن یا غیرجعلی بودن با هم مقایسه شدهاند. برای شناسایی اخبار جعلی از غیرجعلی از روش ان-گرم و روش حافظه طولانی کوتاه-مدت (ال اس تی ام) استفاده شده است. روش پیشنهاد شده در این مقاله روی چهار دیتاست معتبر و موجود پیاده سازی شده و با شش روش پیشین مقایسه شده است. دقت این روش نسبت به دیگر روشها قابل قبول میباشد و نتایج به دست آمده، بیانگر این است که برای شناسایی اخبار جعلی، در میان خبرهای منتشر شده در اینستاگرام، این روش، مناسب میباشد و دقت کافی را دارد.
The distribution of fake sport news is not based on the satisfaction of sport men, sport clubs and sport fans. Correspondingly, the identification of fake news is important and practical. This research has been done in the framework of computational linguistics. The linguistic data are based on a corpus of sports news from ISNA website and Instagram program. In this way, sports news is downloaded from the ISNA website in a period of time, and then in a few pages of the Instagram program, sports news is downloaded and compared in terms of being fake or not. The N-gram method and long and short term memory (LSTM) method have been used to identify fake news from non-fake ones. The method proposed in this paper has been implemented on four valid and existing datasets and has been compared with the previous six methods. The accuracy of this method is acceptable compared to other methods, and the results obtained indicate that this method is suitable and accurate enough to identify fake news among the news published on Instagram.