خلاصه ماشینی:
در مقایسه این عام با gninim atad قدمت بیشتری دارد و جزو روشهای کلاسیک داده کاوی محسوب میشود.
علاقهمند روشهای آماری نیستیم؟برای جواب این سوال چندین دلیل وجود دارد اول اینکه روشهای کلاسیک داده کاوی از قبیل شبکههای عصبی و تکنیک نزدیکترین همسایه،روشهای قویتری برای دادههای واقعی به ما میدهند و همچنین استفاده از آنها برای کاربرانی که تجربه کمتری دارند،راحتتر است و بهتر میتوانند از آن استفاده کنند.
در جایی دیگر اینگونه بیان شده است که دادههای جمعآوری شده نوعا خیلی از فرضهای قدیمی آماری را در نظر نمیگیرند،از قبیل اینکه مشخصهها باید مستقل باشند،تعیین توزیع دادهها،داشتن کمترین همپوشانی در فضا و زمان، (به تصویر صفحه مراجعه شود) اغلب دادهها همپوشانی زیادی دارند،تخلف کردن از هر کدام از فرضها میتواند مشکلات بزرگی ایجاد کند،زمانی که یک کاربر(تصمیم گیرنده)سعی میکند که نتیجهای را بدست آورد.
به هر حال ذکر این نکته ضروری است که بسیاری از روشهای یادگیری ماشین برای ساخت مدل tesatad از حداقل چند استنتاج آماری استفاده میکنند که این مساله بطور خاص در شبکه عصبی دیده میشود.
روشهای آماری بیشتر،زمانی که تعداد دادهها کمتر است و اطلاعات بیشتری در مورد دادهها میتوان بدست آورد،استفاده میشوند به عبارت دیگر،این روشها با مجموعه دادههای کوچکتر سروکار دارند.
تفاوتهای کلی روشهای آماری و دیگر روشهای gninim atad در جدول 1 ارایه شده است: همچنین میتوان گفت که در MD ،دادهها اغلب براساس همپوشانی نمونهها هستند،نسبت به اینکه براساس احتمال دادهها باشد.
مفاهیم اساسی در داده کاوی gniggab این مفهوم برای ترکیب ردهبندیهای پیشبینی شده از چند مدل به کار میرود.