داده کاوی که ترجمهی عبارت «Data Mining» میباشد دارای تعاریف مختلفی است که به شرح تعدادی از تعاریف مستند با ذکر منابع آنها میپردازیم.
۱ـ داده کاوی زیر شاخهای بین علوم کامپیوتر و آمار است که هدف کلی آن استخراج اطلاعات (با روشهای هوشمند) از یک مجموعه داده میباشد که با تبدیل اطلاعات به یک ساختار قابل درک، آنها را برای استفادهی بهتر آماده میکند.
منابع:
"Data Mining Curriculum: A Proposal (Version 1.0)" | ACM | 2006<br/>"Encyclopædia Britannica: Definition of Data Mining" | 2010
"The Elements of Statistical Learning: Data Mining, Inference, and Prediction" | 2009
"Data Mining: Concepts and Techniques (3rd ed.)" | 2011
۲ـ اصطلاح داده کاوی به معنای استخراج داده، نادرست است. زیرا هدف، استخراج الگو و دانش از مقادیر زیادی از دادههاست نه استخراج دادهها از خودش.
منبع:
"Data Mining: Concepts and Techniques (3rd ed.)" | 2011
۳ـ داده کاوی فرایند کشف الگوها در مجموعه دادههای بزرگ با استفاده از روشهای موجود در فصل مشترک حوزههای یادگیری ماشین، آمار و سیستمهای پایگاه دادهاست.
منبع:
"Data Mining Curriculum: A Proposal (Version 1.0)" | ACM | 2006
۴ـ داده کاوی مرحله تجزیه و تحلیل فرآیند «کشف دانش در پایگاههای داده» یا
knowledge discovery in databases یا همان KDD است.
فرایند KDD شامل پنج مرحله زیر میباشد که داده کاوی در مرحله چهارم آن قرار میگیرد.
۱ـ گزینش یا انتخاب
۲ـ پیش پردازش یا pre-processing
۳ـ داده کاوی
۴ـ تفسیر / ارزیابی
منبع:
"From Data Mining to Knowledge Discovery in Databases" | 2008