داده و تحلیل داده موضوعی است که در چند سال گذشته بهشدت موردتوجه قرار گرفته است. شرکتهای بینالمللی داده را بهعنوان یکی از مهمترین داراییهای خود در کنار منابع مالی و انسانی لحاظ میکنند.
این اهمیت تا جایی پیش رفته است که داده “نفت خام جدید” لقب گرفته است. اما داده از نفت هم ارزشمندتر است؛ در اثر استفاده تمام نمیشود! و هر لحظه دادههای جدید تولید و ذخیره میشوند.
شغل دانشمند داده (Data Scientist) یکی از جذابترین مشاغل در قرن جدید است؛ اما تحلیل داده و سر درآوردن از اطلاعات فقط مختص دانشمند داده نیست. تحلیلگران کسبوکار (business analyst)، تحلیلگران داده (data analyst)، متخصصان هوش تجاری و بیش از همه آنها مدیران اجرایی و ارشد با داده و اطلاعات سروکار دارند.
داده باارزش است اگر از آن برای بهبود عملکرد و پیشرفت شرکت خود استفاده کنید در غیر این صورت مثل نفت خامی که زیرزمین مانده و استخراج نشده ارزشی برای شما خلق نخواهد کرد.
در این مقاله داده و انواع آن، تفاوت داده با اطلاعات، تحلیل داده و روشهای تحلیل را بهصورت مختصر معرفی میکنیم تا به دید بهتری از اهمیت آن برای کسبوکارها و نقش آن در هوش تجاری دست پیدا کنیم. با دیکام همراه باشید.
همه چیز، تمام چیزهایی که اطراف شما وجود دارد (چه دیده شود چه نشود) میتواند حامل داده باشد. داده مجموعهای از مقادیر مجزا است که اطلاعات یا معنایی را منتقل میکند. دادهها شامل حقایق (facts)،آمار،کمیت یا کیفیت چیزی هستند.
? چند ثانیه چشم از صفحه مانیتور یا گوشی تلفن همراه خودتان بردارید، چه میبینید؟
اگر این متن را در دفتر کار خود میخوانید اشیای زیادی در اطراف شماست. میز و صندلی که بر روی آن مینشینید، فنجانی که در آن چای و قهوه مینوشید، کامپیوتر، کیبورد …
از پنجره به بیرون نگاه کنید، آدمها، درخت، ساختمان، آسمان، و هرآنچه که میبینید خصوصیاتی دارد که قابل توصیف، شمارش یا اندازهگیری است. این خصوصیات را میتوانید بهصورت کمی یا کیفی بیان کنید.
مثلاً رنگ آسمان آبی است یا قند داخل قندان شیرین است و شیرینی یک کیفیت قابل توصیف است. میتوانید تعداد قندهای داخل قندان را بشمارید! و آن را با یک عدد صحیح بیان کنید. یعنی بهصورت کمی میتوان آن را نشان داد.
داده را به دودسته کمی و کیفی تقسیم میکنند. داده کیفی چیزی را توصیف میکند که به شکل عدد و رقم قابل بیان یا اندازهگیری نیست. (مثل رنگ، طعم، سایز) این نوع داده برای دستهبندی و طبقهبندیکردن سایر چیزها استفاده میشود.
یک کالا مثل پیراهن را در نظر بگیرید. برای دستهبندی پیراهنها را به سه اندازه کوچک، متوسط، و بزرگ تقسیم میکنیم. وقتی میگوییم یک پیراهن سایز متوسط است اطلاعاتی را درباره آن کالا منتقل کردهایم.
داده کمی معیار یا ارزشی است که بهصورت عدد و رقم بیان میشود. دادههای کمی معمولاً به سؤالاتی مثل چند عدد یا چه مقدار از یک چیز وجود دارد؟ پاسخ میدهند. هر چیز قابلاندازهگیری یا شمارش یک مقدار عددی به ما میدهد که دادهای کمی است.مثلاً وزن یک کالا را با عدد و واحد گرم بیان میکنند که نشان میدهد چه مقدار از آن کالا در اختیار ما است.
دادههای کمی به دو نوع گسسته و پیوسته تقسیم میشود.
داده را بر اساس ساختار و شیوه ذخیره کردن آن به 3 دسته ساختاریافته (نظاممند)، بدون ساختار، و نیمهساختاریافته تقسیم میکنند. تقسیمبندی ذکر شده برای هوش تجاری و تحلیل داده مهم است و هرکدام از این نوع دادهها روش خاص خود را برای گردآوری و تحلیل دارند.
بیشترین چالش در تحلیل داده در نوع ساختار نیافته آن وجود دارد.
بسته به کاری که میخواهیم انجام بدهیم (پیداکردن جوال سؤالات و الگوها یا توضیح دادن مطلبی به دیگران) ممکن است با انواع متفاوتی از داده سروکار داشته باشیم. برای استفاده از هوش تجاری و تحلیل داده بهتر است با انواع دادهها و کاربرد آنها تا حدودی آشنا باشیم.
به این سؤال توجه کنید.
پرسش بالا سه نوع داده متفاوت را شامل میشود. بعد ( dimension) زمان که بازهای یکماهه است (داده کمی)، بعد رنگ که یک داده کیفی است و داده سوم (معیار سنجش – داده کمی) که مبلغ فروخته شده از این کالای خاص است.
دادههایی که برای پاسخدادن به سؤال بالا نیاز داریم داخل نرمافزار حسابداری یافت میشوند (داده ساختاریافته)
برای پیداکردن جواب پرسشهایی که داریم یا تبدیل دادهها به نمودار (تصویرسازی) باید بدانیم با چه نوعی از دادهها سروکار داریم.
تا اینجا متوجه شدیم انواع مختلفی از داده وجود دارد؛ اما کاربرد آن برای یک کسبوکار چیست؟
داده در شکل خام مقداری عدد و رقم است که کمکی به ما نمیکند! اما میتوان برای دو هدف مهم از آنها استفاده کرد
اجازه بدهید یک مثال را با هم بررسی کنیم.
? فرض کنید شما مدیر یک فروشگاه (خردهفروشی) هستید؛ بنابراین فعالیت اصلی شما “فروش” است. چه دادههایی در فروشگاه ذخیره و ثبت میشود؟
کالاهای فروخته شده، قیمت واحد آنها، زمان فروش (ساعت، روز، هفته) و تخفیف اعمال شده روی هر کالا، اگر از این دادهها استفاده کنید و آنها را به اطلاعات تبدیل کنید میتواند به سؤالات زیر پاسخ دهد.
تمام موارد بالا اطلاعات بدرد بخوری هستند که به یک مدیر کمک میکنند بهترین تصمیم را برای موفقیت کسبوکار تحت مدیریتش بگیرد.
حال فرض کنید قرار است عملکرد فروشگاه تحت مدیریت خود را بهصورت گزارش در یک جلسه ارائه کنید. باز هم با داده سروکار دارید و بهتر است بدانید چطور از دادهها برای رساندن مقصود خود استفاده کنید. (داستانگویی با داده)
داده و اطلاعات ممکن است به یک معنی به کار بروند و در جای یکدیگر استفاده شوند؛ اما تفاوتهای مهمی بین داده (data) و اطلاعات (Information) وجود دارد.
به تصویر زیر نگاه کنید اعداد نمایشدادهشده در قسمت یک چه چیزی را به شما میگویند. ازآنجاکه هیچ پیشزمینهای درباره این اعداد نداریم نمیدانیم درباره چه هستند. به قیمت چیزی اشاره دارند؟ بودجه سازمانی را نشان میدهند؟
حال به قسمت دوم نگاه کنید چه چیزی را متوجه میشوید؟ همان اعداد را مشاهده میکنید که درباره فروش یک شرکت در فصل بهار به شما اطلاعاتی میدهد. اطلاعات ما را نسبت چیزی که قبلاً نمیدانستهایم مطلع میکند.
داده خام: دستهبندی نشده، پردازش نشده، تفسیر نشده، و نامرتبط است.
اطلاعات: حاصل پردازش دادهها است. اطلاعات دادههای پردازش شده است که صحیح، قابلفهم، مرتبط، دارای چهارچوب و زمانبندی هستند.
بنابراین، اطلاعات دادههایی است که:
شرکتها معمولاً دادههای زیادی را ذخیره میکنند اما داده در همان حالت خام باقی میماند و استفاده مؤثری از آن نمیشود. تجزیهوتحلیل داده فرایندی است که داده خام را پردازش میکند تا از داخل آن اطلاعات معناداری استخراج کند. اطلاعاتی که باتوجهبه آن، بتوان تصمیمی را گرفت یا عملی را انجام داد.
تحلیل داده تبدیل دادههای غیرقابلدرک به اطلاعات منسجم و قابلفهم برای مدیران و تصمیم گیرندگان یک سازمان یا شرکت است.
تحلیل داده کمک میکند تا اتفاقات گذشته را بهدرستی متوجه شویم و اتفاقات آینده را پیشبینی کنیم.
تحلیلگر داده یافتههای خود را بهصورت گزارش و یا داشبورد در اختیار افرادی که به آن اطلاعات نیاز دارند قرار میدهد.
وظایف تحلیلگر کسبوکار همپوشانی زیادی با تحلیلگر داده دارد. اما علاوه بر توانایی کار با داده و پیداکردن الگو در دادهها، تحلیلگر کسبوکار باید درک عمیقی از حوزه کاری یک شرکت و سازمان داشته باشد. تحلیلگر کسبوکار روی موضوع یا مشکلات خاص در یک شرکت کار میکند. پس از تجزیهوتحلیل داده پیشنهادها و گامهایی که برای بهبود تجارت باید برداشته شود را به مدیران و ذینفعان یک شرکت ارائه میکند. در واقع کار تحلیلگر کسبوکار پیداکردن مشکلات یک شرکت از درون دادهها و یافتن راهی برای حل آنها است.
حالا که بهتر با داده و اطلاعات و تجزیهوتحلیل آشنا شدیم به سراغ انواع تحلیل روی دادهها میرویم.
چند نوع تحلیل داده داریم؟
تحلیل توصیفی پله اول در مراحل بلوغ تحلیلی یک سازمان است. تحلیل توصیفکننده به ما میگوید چه اتفاقی درگذشته افتاده است. تجمیع داده و دادهکاوی دو تکنیک اصلی در تحلیل توصیفی هستند تحلیلگر ابتدا دادهها را جمعآوری میکند و به شکل خلاصه شده آنها را ارائه میکند تا بعد دادهها را برای پیداکردن الگوها کاوش کند.
پس از طی این مراحل داده به صورتی که برای مخاطبان قابلدرک باشد تصویرسازی میشود. باید توجه کرد تحلیل توصیفی تلاشی برای توضیح دادن دادهها یا مشخصکردن روابط علت و معلولی نمیکند. در این مرحله صرفاً تحلیل میگوید “چه چیزی” اتفاق افتاده است.
تحلیل توصیفی میگوید چه چیزی اتفاق افتاده، تحلیل تشخیصی میگوید چرا اتفاق افتاده است.
معمولاً تحلیلگر داده ابتدا سعی میکند ناهنجاریهای داخل داده را پیدا کند (هر چیزی که نمی توان باتوجهبه داده توضیح داد) مثلاً اگر داده نشان دهد که افزایش یا کاهش ناگهانی فروش در دیماه اتفاق افتاده است تحلیلگر داده باید آن را بررسی کند. برای این کار تحلیلگر مرحله “کشف” را شروع میکند؛ یعنی به دنبال سایر منابعی میگردد که ممکن است علت ناهنجاری را به او بگویید.
در نهایت تحلیلگر سعی میکند روابط سببی که منجر به ناهنجاری شده اند را کشف کند، مثلاً بررسی هر رویدادی که ممکن است با افزایش و کاهش فروش همبستگی یا مطابقت داشته باشد. (مثلاً تغییرات بازار، نوع فروش، تخفیف و …) در این مرحله تحلیلگر داده از تحلیل رگرسیون، تئوری احتمال، فیلترکردن و تحلیل سریهای زمانی استفاده کند.
تجزیهوتحلیل داده بهمحض ثبت و ذخیره شدن داده اتفاق میافتد. به عبارتی کاربران میتوانند بلافاصله پس از ثبت داده در سیستم از آن برای نتیجهگیری و درک شرایطی که در حال رخ دادن در آن لحظه است استفاده کنند.
تحلیل لحظهای به شرکتها اجازه میدهد تا بدون تأخیر به اتفاقات واکنش نشان دهند، فرصتها را جذب و مشکلات را پیش از شکلگرفتن رفع کنند.
همانطور که از اسمش پیداست سعی میکند آنچه که احتمالاً در آینده اتفاق میافتد را پیشبینی کند. در این مرحله است که تحلیلگر داده راهحلهای عملی و دادهمحور را در اختیار شرکت میگذارد تا قدمهای بعدی را با آگاهی بردارند.
تحلیل پیشبینیکننده احتمال وقوع اتفاقات آینده را بر اساس دادههای قبلی و تئوری احتمالات میسنجد. با اینکه پیشبینی هیچوقت کاملاً قطعی نیست؛ اما میزان اطمینان به تصمیمات را بالا برده و حدس و گمان قبل از تصمیم گرفتن را تا حد زیادی از بین میبرد.این نوع از تحلیل برای پیشبینی اتفاقات متنوع و متفاوتی استفاده میشود؛ مثلاً چه محصولی بیشترین تقاضا را در سه ماه آینده خواهد داشت یا شش ماه آینده درآمد شرکت چقدر افزایش یا کاهش پیدا میکند.
تحلیل پیشبینی کننده شانس شرکتها برای رسیدن به نتیجه دلخواه را بهشدت افزایش میدهد.
در ادامه تحلیل پیشبینیکننده قرار دارد، آن را تکمیل میکند و کارها و اقداماتی که باید انجام شوند را به ما توصیه میکند. بهعبارتدیگر به ما نشان میدهد چطور از نتایج پیشبینی شده استفاده کنیم.تحلیلگر برای انجام این نوع از تجزیهوتحلیل تمام سناریوهای احتمالی را در نظر میگیرد سپس کارهایی که شرکت امکان انجام آنها را دارد بررسی و ارزیابی میکند.
تحلیل تجویزی یکی از پیچیدهترین انواع تجزیهوتحلیل است و معمولاً به استفاده از الگوریتمها، یادگیری ماشین، و مدلسازی محاسباتی نیاز دارد.
دادهها از روشهای مختلف روی موفقیت یک کسبوکار تأثیر میگذارند؛ اما بیشترین استفاده شرکتهای پیشرو در سه مورد زیر خلاصه میشود
اولین استفاده مهم شرکتها از تحلیل داده، تأثیرگذاری آن در روش تصمیمگیری مدیران و بهبود فرایند تصمیمگیری در شرکت است. تحلیل داده میتواند پاسخ سؤالات شما را بدهد تا در نهایت بهترین تصمیم را برای کسبوکار خود بگیرید.
ابتدا سؤالات بیپاسخ درباره کسبوکار خود را مشخص کنید سپس ببینید چه دادهای را باید تحلیل کنید تا به جواب آن سؤالها برسید.
هر فرایند تجاری که به تولید داده منجر میشود (اطلاعات سفارش مشتریها یا دادههای خط تولید کارخانه) را میتوان بهینهسازی کرد.
بهرهوری در خطوط تولید، زنجیره تأمین، انبارداری، و منابع انسانی با بهبود در کارهایی که روزانه تکرار میشوند افزایش مییابد. تحلیل داده به درک ما را از فرایندهای روزانه کمک کرده و بهینهکردن آنها را ممکن میکند.
هر چه حجم و پیچیدگی دادهای که در شرکت ذخیره میشود بیشتر باشد جذابیت آن بهعنوان یک منبع تجاری بالاتر میرود. فروش و به اشتراک گذاشتن این دادهها میتواند یک منبع جدید درآمدی باشد. شرکتهای زیادی در جهان به دلیل در اختیار داشتن دادههای خاص توانستهاند به بازیگر اصلی صنعت خود تبدیل شوند.
جمعبندی پایانی: