تحلیل داده؛ آچار فرانسه--آسیب پنجم

به طور خلاصه، علم داده کاوی در برگیرنده مفاهیم، مدلها و ابزار قدرتمند جهت انجام تحلیل های پیچیده بر روی داده است. داده کاوی به نوعی زیر مجموعه تحلیل داده به شمار می‌رود و خروجی آن اغلب توصیفی از اوضاع سیستم مورد مطالعه (مثلا چند دسته مشتری از نظر شدت فعالیت داریم؟) یا پیش بینی از آینده آن است (فروش ماه آینده حدودا چقدر خواهد بود؟).

داده کاوی
داده کاوی

گفته می شود بعضی از مدعیان علم داده کاوی، گستره این علم را بسیار وسیع می‌دانند. آنها، طبق این گزاره که «خروجی فرایند داده کاوی (مانند تحلیل داده)، دانشی است که پیش تر آن را نمی دانستیم» پا را فراتر از مرزهای این علم نهاده و میانگین گیری چند مقدار را هم، از آنجا که پیش از محاسبه مقدار میانگین آن ها را نمی دانیم، در زمره داده کاوی بر می شمرند. این گزاره اشتباهی خطرناک است. در اینجا آن (اشتباه بودن آن گزاره) را اثبات نمی کنم فقط به این بیندیشید که اگر چنان باشد، حاصل جمع دو عدد سه رقمی هم داده کاوی خواهد بود!!! و داده کاوی، تحلیل داده را دربر خواهد گرفت.

اما آسیب اصلی آنجا است که وجود ابزارهای پرطمطراق داده کاوی سبب شده که افراد «مقداری آگاه از آن» به دنبال این باشند که کوچکترین مسایل تحلیلی خود را با آچارکشیهای داده کاوی حل کنند. این یک آسیب بزرگ است. زیرا آن عده گویا دنبال این هستند که پشه را با موشک کروز بکشند!

به نقل از: جادوبی

https://virgool.io/@amkm65/freezeddata-oyzmjfssc5cg
https://virgool.io/@amkm65/%D9%85%D9%88%D8%A7%D8%B8%D8%A8-%D8%A8%D8%A7%D8%B4%DB%8C%D8%AF%D8%9B-%D8%AA%DA%A9%D9%86%D9%88%D9%84%D9%88%DA%98%DB%8C-%D8%AE%D8%A7%D9%84%D9%87-%D8%AE%D9%90%D8%B1%D8%B3%D9%87-%D8%A7%D8%B3%D8%AA-m3dci6v7kunu