چکیده:
بیماری همهگیر کرونا موجب تغییراتی در سبک زندگی روزمره، مانند کاهش مراودات اجتماعی و ایجاد فاصلهگذاری اجتماعی، شده است. در این پژوهش، دو هدف را پیگیری کردهایم. هدف نخست تحلیل الگوریتمی نظرات و پیامهای مرتبط با کرونا به زبان فارسی است که توسط افراد مختلف، در دو رسانۀ اجتماعی توییتر و اینستاگرام، منتشر میشود. برای این هدف، با استفاده از مدلسازی موضوعی، بهعنوان یک شیوۀ تحلیل محتوایی داده، دادهها را به موضوعات انتزاعی خوشهبندی کردهایم. هدف دیگر، یافتن رابطۀ همبستگی بین موضوعات در نظرات و هشتگهای بهکاررفته در نظرات است. برای تحقق این هدف، با گردآوری نظرات و پیامهای خزششدۀ مربوط به کرونا از این دو رسانه، یک پیکرۀ زبانی تهیه شده است. از تحلیل محتوایی نظرات این پیکره، 24 موضوع انتزاعی به دست آمد که بهصورت دستی برچسبگذاری شد تا این موضوعها هویت پیدا کنند. با بررسی دادههای این پیکره و آمار بهدستآمده از پردازش موضوعی آنها، میتوان گمانهزنی کرد که حدود 25٪ از نظرات این پیکره بر دو موضوع «سیاسی» و «اجتماعی» متمرکز است. 10 موضوع دانهریز این پیکره، یعنی 35٪ از حجم نظرات، به خود ویروس کرونا و ماهیت همهگیری آن مربوط است که بیانگر اهمیت توجه به رسانههای اجتماعی برای آگاهسازی و نشر اطلاعات است. علاوهبرآن، فرضیۀ وجود رابطه بین هشتگها و موضوعها، با استفاده از ضریب همبستگی پیرسون، از نظر آماری مورد بررسی قرار گرفت. برای 20 موضوع، همبستگی بالا بین موضوع و تعدادی از هشتگها یافت شد؛ ولی برای 4 موضوع این همبستگی یافت نشد. از این پژوهش میتوان برای افزایش انسجام درونی متن و پیشبینیپذیری هشتگها استفاده کرد.
Coronavirus pandemic caused changes in the daily lifestyle, such as reducing social interactions and creating social distancing. In this research, we pursue two goals. One is algorithmic content analysis of comments/posts in Persian related to the Coronavirus on two social media, namely Tweeter and Instagram. To this end, topic modeling is used as a method for content analysis to cluster the data into abstract topics. The other goal is finding the correlation between topics and hashtags in the comments/posts. To this end, we developed a corpus from these two social media. We found 24 abstract topics by algorithmic content analysis of this corpus and they were manually labeled to be comprehensive. According to the corpus and the statistical information of the extracted topics, it can be speculated that about 25% of the comments/posts in this corpus focused on political and social issues of the virus. 10 fine-grained topics which contained 35% of the comments were related to the Coronavirus itself and its pandemic property. This indicates the importance of the attention that has been paid to social media for informing and disseminating information. Furthermore, the hypothesis of existing correlation between topics and hashtags was studied from statistical point of view by using the Pearson correlation coefficient. For 20 topics, a high correlation score between topics and hashtags was found; but this correlation was not found for 4 topics. The outcome of this research can be used to increase the internal coherence of a text and to make the hashtags predictable.