چکیده:
هدف از این تحقیق بررسی میزان مطابقت بازیابی محتوا با تصویرها و چالشهای آن در مقالههای پایگاههای اطلاعاتی علمی است. روش پیمایشی توصیفی بوده و جامعه آماری آن پایگاههای اطلاعاتی علمی «ساینس دایرکت»، «اسکوپوس»، «مدلاین» و «وب آو ساینس» است. ابتدا عنوان، چکیده، بیان مسئله و نتیجهگیری مقالهها بهصورت جداگانه وارد نرمافزار Extreme Picture Finderشد. سپس، تصویرهای مرتبط با عنوان، چکیده، بیان مسئله و نتیجهگیری مقالهها از نرمافزار مورد نظر استخراج گردید. تصویرهای استخراجشده وارد نرمافزار Visual Similarity Duplicate Image Finder گردید تا مطابقت تصویرهای استخراجشده از نرمافزار و تصویرهای مقالهها انجام شود. نتایج نشان داد که بیشترین میزان مطابقت محتوا با تصویر در پایگاه «وبآوساینس» و کمترین میزان مطابقت در پایگاه «ساینس دایرکت» وجود داشت. همچنین بهترتیب، بیشترین شباهت بین عنوانها، بیان مسئله، چکیده و نتیجهگیری با تصویرهای مقالهها در پایگاهها وجود داشت. عدم رعایت استانداردهای مصورسازی در تصویرهای بهکاررفته در مقالههای پایگاههای علمی چالشی جدی است. تصاویری که از استاندارهای مصورسازی (متن، رنگ، لبه، حاشیه و...) به دور بودند، بازیابی نشدند و در صورت بازیابی از میزان شباهت نازلی برخوردار بودند. عدم جامعیت قابلیتهای نرمافزارهای مورد استفاده، چالش بعدی بود. مسئله دیگر عدم رعایت یا پیروی از یک شیوهنامه استاندارد در چیدمان تصویرها در مقالههاست. برخی تصویرها بدون توجه به متن در مقالهها درج شدهاند. این مورد در پایگاه «وبآوساینس» کمتر، اما در سایر پایگاههای مورد بررسی بسیار مشاهده گردید. با توجه به ابداع روشهای جدید بازیابی تصویر و محتوا، نتیجه این بررسی نشان میدهد که عدم شباهت بین تصویرهای بازیابیشده با محتوا در مقالات پایگاههای معتبر علمی چشمگیر و گمراهکننده است.
The purpose of this research is to match the content retrieval with images in the articles of scientific databases. The research method is a correlation-based procedure and the statistical population of the present study is the scientific databases such as Science Direct, Scopus, Medline and Web of Science. Six papers were extracted from each base along with a separate issue. First, the title, abstract, problem statement and conclusion of the articles were inserted into the software Etreme Picture Finder, separately. Then, the images related to title, abstract, problem statement and conclusions of the articles were extracted from the relevant software. The images extracted were inserted into the Visual Similarity Duplicate Image Finder software. The results show that the highest level of content matching was found with the images in the WebAsiensis database and the least amount of match in the database of the SinjServer. There were also the most similarities between the titles, the problem statement, the abstract and the conclusions with the images of the articles in the bases.
Failure to observe the standards of visualization in the images used in scientific articles was a serious challenge. Images that have been removed from image editors (text, color, edges, margins, etc.) have not been recovered, and if recovered, they have had a fairly similar resemblance. The lack of comprehensiveness of the superficial capabilities used was the next challenge. Another problem is the non-observance of or compliance with a standard style sheet in the layout of images in the articles. Some images have been brought to the articles regardless of the text. This item was found to be smaller in the Web site, but was seen in many other sites.