چکیده:
در دهه اخیر، توانایی بشر برای تولید و ذخیره دادهها بهسرعت افزایش یافته است. با افزایش حجم دادههای ذخیرهشده، نیاز به روشی که بتوان با استفاده از آن به تحلیل اطلاعات و دانش موجود در دادهها پرداخت بیشتر از پیش احساس میشود. فنون دادهکاوی و روشهای تصمیمگیری چند شاخصه در دهههای اخیر هرکدام به شکلی کمکرسان مدیران در عرصه تصمیمگیری بودهاند. در پژوهش حاضر، با تلفیق فرآیند دادهکاوی و روشهای تصمیمگیری چندشاخصه، روشی برای خوشهبندی کارگاههای صنعتی ارائه شده است. در روش پیشنهادی، ابتدا فرآیند دادهکاوی بر اساس روشهای تجزیهوتحلیل سلسله مراتبی، K-means و شبکه عصبی کوهونن صورت گرفته و سپس عملکرد مدل طراحیشده جهت تعیین تعداد خوشه بهینه با شاخصهای اعتبارسنجی مجموع خطای مربعی و واریانس بین خوشهای سنجیده شده است. بخش صنایع غذایی بهعنوان مورد مطالعاتی پژوهش موردبررسی قرار گرفته و بر اساس یافتههای بهدستآمده، چهار خوشه بهعنوان تعداد خوشه بهینه کارگاههای صنعتی این بخش معرفی شده است. خوشههای بهدستآمده بر اساس متغیرهای توزیع جمعیت، سطح درآمد و ارزشافزوده فعالیتهای صنعتی در خوشهها نامگذاری شدهاند و در پایان، پیشنهادهایی در دو بخش کاربردی و پژوهشی برای تصمیمگیرندگان و سیاستگذاران این صنعت و سایر محققان این حوزه ارائه شده است.
In recent decade, humans' ability have rapidly increased in the way of producing and storage of data. By increasing the volume of data stored, the needs for a method by which information and knowledge resources within the data could be analyzed is sensed. Multi-criteria decision making methods and data mining techniques in recent decades helped managers in their decision making process. In this study, a method has been proposed for workshops clustering by combining data mining and MCDM approaches. In the proposed method, first data mining is conducted based on the AHP, K-means and Kohonen neural network approaches, then the performance of designed model is measured by validation indices like SSE and variance between cluster methods in order to determine optimal number of clusters. The food industry has been analyzed as a case study and based on the obtained results, four clusters as the optimal number of clusters have been introduced. The obtained clusters are named based on the variables of population distribution, income, value-added industry and industrial activities in the clusters. Finally, the suggestion is proposed in two sections of practical and research for decision and policy makers in industry and the other researchers in this field.
خلاصه ماشینی:
Clustering شــاخه هــوش مصــنوعي بــا علــم مــديريت و فنـاوري اطلاعــات ، درســت در همــين نــوع تصميم گيري است ؛ لذا در پژوهش حاضر، سـعي بـر آن اسـت کـه در مـورد کارگـاه هـاي صنعتي نيز اين کاربرد اجرايي شود و اين نوع کارگاه ها به کمـک روش هـاي خوشـه بنـدي که معيارهاي آن با توجه به روش هـاي تصـميم گيـري چندهدفـه بـر مبنـاي خوشـه بنـدي اولويت دهي شده اند، در خوشه هاي مختلفي دسته بندي شوند تا با اسـتفاده از خوشـه هـاي شکل گرفته به تصميمات کارآمدتري دست يابيم .
فهرست اطلاعات مربوط به اين کارگاه ها مطابق جدول زير ارائه شده است : جدول ٢ اطلاعات مربوط به حوزهاي مختلف مورداستفاده براي خوشه بندي (بر اساس گزارش وزارت صنايع در سال ١٣٩٤) (به تصویر صفحه مراجعه شود) آماده سازي داده ها ازآنجاييکه يکي از فنون اصلي استفاده شـده در ايـن پـژوهش بـراي خوشـه بنـدي کارگاه ها K-means بوده و اين الگـوريتم نسـبت بـه داده هـاي پـرت ، داده هـاي خـالي و داده هاي غيرنرمال حساس است ، سعي بر آن شـده کـه تـا حـد امکـان بـا اسـتفاده از روش هاي پاکسازي داده ها، از ميـزان داده هـاي مشـکل دار کاسـته شـود.
نتايج نهايي به دست آمـده پـس از رندسـازي بـه شـرح جدول زير است : جدول ٣ وزن هاي نهايي به دست آمده براي متغيرهاي تأثيرگذار بر خوشه بندي (به تصویر صفحه مراجعه شود) بعد از به دست آوردن وزن ها، وزن هر متغير وارد نرم افزار Clementine شـده است ؛ سـپس از الگـوريتم K-means بـراي فرآينـد خوشـه بنـدي داده هـاي وزن دار استفاده ميشود.