اگر با داده (Data) سروکار دارید یا نسبت به تحلیل داده و هوش تجاری علاقهمند هستید احتمالاً با مدل هرم داده یا هرم دانش برخورد کردهاید. در این مقاله قصد داریم به هرم دانش، اجزاء و کاربرد آن بپردازیم و با مثالی کوتاه نشان بدهیم چطور میتوان از داده خام به دانش و خرد رسید.
هرم دانش یک مدل ساده شده و قابلفهم برای نشاندادن رابطه بین داده (Data)، اطلاعات (information)، دانش (knowledge) و خرد (wisdom) است. DIKW در واقع سرواژه و مخفف این چهار کلمه است.
هرم دانش یک مدل است. مدلها در واقع یک تمثال یا نمایش ساده از واقعیت هستند. یک مدل به ما کمک میکنند تا متوجه بشویم چیزها چطور کار میکنند و اجزاء آنها چه ارتباط منطقی با هم دارند.
در اینجا هرم دانش به ما کمک میکند تا فرایند تبدیل داده به دانش و خرد را بهتر درک کنیم. هرم دانش یک مدل سلسهمراتبی (hierarchy) است؛ یعنی هرکدام از بخشهای آن نسبت به بقیه در جایی بالاتر یا پایینتر قرار میگیرند و ارتباط آنها با هم بر همین اساس تعریف میشود.
هرم دانش به چهار بخش یا مرحله تقسیم میشود:
کار در مرحله اول با داده خام شروع میشود و مرحلههای بعد با انجام کاری روی داده آن را به اطلاعات، دانش، و خرد تبدیل میکنیم. هرکدام از این مراحل پیش نیازی برای رسیدن به مرحله بعد هستند.
بیایید این بخشها را جداگانه ببینیم و چگونگی تبدیل داده به خرد را مرحلهبهمرحله بررسی کنیم
اگر به تعریف رسمی مراجعه کنیم دادهها شامل حقایق (facts)، آمار، کمیت یا کیفیت چیزی هستند؛ اما بهطورکلی داده میتواند شامل هر چیزی باشد (از تراکنشهای بانکی گفته تا دمای هوا)
داده اولین مرحله، نقطه آغاز و پایه هرم دانش است. در واقع بدون داده هیچ کاری انجام نمیشود از طرفی داده خام بهخودیخود هیچ معنا و مفهومی را منتقل نمیکند.
برای درک داده باید آن را در زمینه (context) خاص خودش بررسی کرد
به این عدد دقت کنید 14011220 این عدد مثالی از یک داده خام است. بهخودیخود مفهومی را منتقل نمیکند؛ اما اگر آن را در زمینه مناسب مثلاً تقویم سالیانه! بگنجانیم تاریخ 1401/12/20 یعنی روزنگارش این مقاله را به ما میدهد.
مقاله داده چیست و تحلیل داده چه میکندرا از اینجا مطالعه کنید
در پله دوم هرم به اطلاعات میرسیم. قبلاً گفتیم که برای درک داده باید آن را در زمینه (context) خودش بررسی کرد. این زمینه میتواند پرسیدن سؤالهایی مثل چه چیزی؟ کجا؟ و کی اتفاق افتاده باشد.
این سؤالها به ما کمک میکند دادههای بیمعنی را به اطلاعات بامعنی تبدیل کنیم.
اطلاعات حاصل پردازش داده خام است. داده نامنظم و مملو از خطا است؛ اما اطلاعات دستهبندی شده، صحیح، قابلفهم، و دارای چهارچوب و زمانبندی است. بر عکس داده خام، اطلاعات معنا و مفهومی را به مخاطب منتقل میکند.
دانش سومین مرحله در هرم DIWK است. دانش را میتوان جمع اطلاعات بعلاوه تجربه و تخصص دانست. در واقع دانش درک رابطه بین اطلاعات مختلف است.
دانش به سؤالاتی که درباره چگونگی یک موضوع است پاسخ میدهد. سؤالاتی مثل:
اگر به اطلاعات صرفاً بهعنوان توصیفی از حقایق نگاه نکنیم و یاد بگیریم چطور برای رسیدن به اهدافمان از آنها استفاده کنیم اطلاعات را به دانش تبدیل کردهایم.
خرد آخرین مرحله و در رأس هرم دانش است. خرد؛ یعنی دانش بعلاوه عمل، استفاده از دانش برای تصمیمگیری در مورد آینده ما را وارد قلمرو خرد میکند. خرد به ما میگوید بهتر است چه کاری را انجام بدهیم یا انجام ندهیم! در واقع خرد دانش کاربردی است.
داده و اطلاعات درباره گذشته هستند؛ اما دانش و خرد با زمان حال و آینده گرهخوردهاند.
داده درباره مشاهده پدیده ها و اتفاقات است؛ اطلاعات آنها را توصیف میکند، دانش درک روابط بین اتفاقات را میسر میکند و خرد به ما میگوید چه کاری باید انجام دهیم.
برای اینکه بهتر مفهوم تبدیل داده به خرد را متوجه شویم از یک مثال با دادهای ساده استفاده میکنیم.
داده:
به جدول دادههای زیر نگاه کنید. این جدول دو سطر و سه ستون دارد. اما معنی و مفهوم خاصی را نمیرساند
قرمز|20| 50
آبی |30| 50
تبدیل داده به اطلاعات:
بیایید داده جدول بالا را در کانتکس خودش قرار بدهیم. این جدول دادههای مربوط به دو ماشین را نشان میدهد. ستون اول از راست مسافت طی شده بر حسب کیلومتر، ستون دوم زمانی است که برای طی مسافت صرف شده و ستون سوم رنگ آن خودرو را نشان میدهد.
با دانستن این دادههای جدید جدول شماره 2 را میتوانیم ایجاد کنیم.
قرمز | 20min | 50km|150km/h
آبی |30min| 50km |100km/h
ستون چهارم سرعت هر خودرو را نشان میدهد و بر اساس دادههای اولیه محاسبه شده است.
استفاده از دانش
فرض کنید اطلاعات دیگری هم به دست آوردهایم، دادههای بالا برای مسیری است که ما میشناسیم (مثلاً تهران – کرج) با استفاده از تجربه خودمان میتوانیم بفهمیم که راننده خودرو قرمز با سرعتی بیش از سرعت مجاز در این مسیر رانندگی کرده است (110 کیلومتر برای بیشینه سرعت مجاز) درحالیکه راننده آبی از سرعت متوسط 100 کیلومتر بر ساعت تجاوز نکرده است.
خرد
خرد؛ یعنی دانش بعلاوه عمل، شما اگر کارگذار یک شرکت بیمه بودید باتوجهبه اطلاعات بالا چه میکردید؟ قطعاً در محاسبه بیمه سالیانه برای راننده خودرو قرمز مبلغ بالاتری را در نظر میگرفتید؛ چون احتمال تصادف رانندهای که بالاتر از سرعت مجاز میراند بیشتر است.
آنچه در علم داده و هوش تجاری برای تبدیل داده به اطلاعات انجام میشود (دو مرحله اول) کاملاً با مدل هرم دانش مطابقت دارد.
کار یک مهندس یا تحلیلگر داده را در نظر بگیرید آنها برای آمادهکردن داده معمولاً کارهای زیر را انجام میدهند.
تمام این کارها برای آن انجام میشود تا داده نامنظم را به اطلاعات تبدیل کنیم. در مراحل بعد میتوان این اطلاعات را مصورسازی کرد، روی آنها تحلیل انجام داد و بر اساس این تحلیل تصمیمگیری کرد.
تحلیل به ما میگوید:
همانطور که گفتیم هرم دانش یک مدل است و مدل شبیهسازی یا تمثالی از واقعیت است. اما مدل هرچقدر هم که خوب باشد باز نمیتواند تمام واقعیت را نمایش دهد. به مدل هرم داده نیز ایراداتی وارد است.
یکی از این ایرادات به خود ساختار هرم بازمیگردد. نمایش رابطه داده و خرد به شکل هرم بیش از اندازه ساده و سرراست است. از طرفی این چهار مرحله شاید فرایند را به طور کامل نشان ندهد. به همین دلیل انواع متفاوتی از هرم دانش با مراحل بیشتر و کمتر وجود دارد.
اختلاف دیگر معمولاً در باره تعریف خرد و دانش است. تعاریف متفاوتی برای این دو وجود دارد که ممکن است باعث سردرگمی شود.
درهرحال نباید فراموش کرد که هرم دانش در عین سادگی و سرراست بود یک اصل مهم را نشان میدهد راه رسیدن به خرد از طریق داده انجام میشود.