رضا کشاورز
رضا کشاورز
خواندن ۶ دقیقه·۳ سال پیش

تحلیل داده: خامی تا پختگی

توی آگهی های شغلی احتمالا این رو دیدید: توانایی استخراج بینش از داده برای بهبود کسب و کار. این جمله درواقع بزرگترین دلیلیه که کسب و کارها حاضر میشن هزینه کنن و تحلیلگر داده جذب کنن و منتظر باشن که کسب و کارشون مثل موشک بره بالا. ولی خب یه نکته تلخ اینجا هست: اساسا تفکری که پشت این جمله هست تفکر غلط و ناکارآمدیه. تصور غلطی که از تحلیلگر داده توی دنیا جا افتاده اینه:‌ یه آدم که یه خروار دیتا میذاره جلوش و خیره میشه بهش تا بالاخره اسرار کسب و کار رو از زیر زبون دیتا بیرون بکشه.

توی این مطلب،‌ من میخوام تلاش کنم درباره ماهیت واقعی تحلیل داده و داده-محور بودن صحبت کنم. درواقع وقتی از تحلیل داده صحبت می کنیم،‌ سه رویکرد اصلی داریم که هرکدوم می تونن از یه راه به ما کمک کنن. اول یه نگاهی به این سه رویکرد بندازیم و بشناسیمشون، بعد می رسیم به...؟


نکته: این مطلب با این پیشفرض نوشته شده که شما درباره دنیای تحلیل داده و کاری که یک تحلیلگر داده انجام میده، یه چیزایی می دونید از قبل. اگر ندونید هم ممکنه براتون مفید باشه، اما اگر دیدید مطلب براتون سنگین یا مبهمه، بپرید به قسمت آخر نوشته.


اول: تحلیل توصیفی

این قسمت ماجرا برای همه ما آشناست. کوهی از داده داریم. میریم سراغش و شروع می کنیم از چند و چون وضعیتمون آگاه بشیم. کارهایی انجام میدیم که توش به وفور درصد و میانگین و کاهش و افزایش رو میشه دید، و همینطور نمودارهای گرد و دراز و کج و کوله، مثلا:

  • نگاهی به داده فروشمون میندازیم و گزارشی تولید می کنیم از این که توی هر ماه چه مقدار فروش داشتیم.
  • تعداد کاربرای سیستممون رو بررسی می کنیم و حساب می کنیم که چند درصد از کاربرها یک روز بعد از ثبت نامشون، پلتفرم ما رو ترک می کنن.
  • محصولاتمون رو بالا پایین می کنیم و پیدا می کنیم که کدوم دسته از محصولات رضایت مشتری رو بیشتر تونستن جذب کنن.
  • ...

با نگاه کردن به اینجور گزارشها درک کلیمون از سیستم بالاتر میره و بینشی که به دست آوردیم رو موقع تصمیم گیری میتونیم استفاده کنیم. مثلا اگر یک سرویس ارائه دهنده موسیقی باشیم، با دیدن استقبال کاربرامون از فلان خواننده نوظهور، می تونیم به این نتیجه برسیم که باید دست بجنبونیم و بریم زودتر الباقی آلبومهاش رو هم تهیه کنیم که کاربرامون رو راضی نگه داریم.


دوم: تحلیل پیشگویانه

اینجا پای سلبریتی دنیای علم داده میاد وسط:‌یادگیری ماشین. بیاید این رو با یه مثال پیش ببریم: فرض کنیم یه فروشگاه آنلاین داریم. بعد از گشت و گذار توی داده موجود،‌ متوجه میشیم ۸۳ درصد کاربرامون بعد از خرید اول دیگه به سایت ما برنمی‌گردن. با هیجان میریم و داده مناسب رو برمیداریم و یه مدل هوشمند میسازیم. این مدل ما داده رو از ما تحویل می گیره و خروجیش اینه:‌ آیا فلان کاربر در آینده باز هم به پلتفرم ما برمی‌گرده یا نه؟ این یه مسئله طبقه بندی حساب میشه با خروجی دودویی.

حالا با استفاده از یادگیری ماشین ما قدرت اینو داریم که پیشبینی کنیم مشتری قراره برگرده یا بره و پشت سرشو نگاه نکنه. خیلی مفید می تونه باشه، مگه نه؟


سوم: تحلیل تجویزی

وقتی مجهز شدیم به توان پیشگویی،‌ یه سوال بزرگ پیش میاد: خب که چی؟‌ اصلا تونستیم پیش بینی کنیم کی میره، کی میاد. این چه سودی برای ما داره؟ اینجاست که می رسیم به پله بعدی تحلیل داده مون:‌ نسخه پیچیدن. درسته. اینجا ما به عنوان تصمیم گیرنده کسب و کار،‌ که هم از اوضاع مطلعه (تحلیل توصیفی) و هم می تونه یک سری وقایع در آینده رو پیشبینی کنه (تحلیل پیشگویانه) می تونیم آستینها رو بالا بزنیم.

در قدم اول باید تواناییهامون رو بشناسیم. برگردیم به مثال فروشگاه. اول باید بررسی کنیم ببینیم چطور می تونیم کاری با کاربرهامون بکنیم که ترغیب بشن به بازگشت دوباره. مثلا گزینه های روی میز می تونه اینا باشه:‌ تخفیف بیشتر روی یه سری محصول خاص،‌ تخفیف اندک روی همه محصولات،‌ ارائه کد تخفیف به کاربرای خاص به صورت هدفمند، یا هر کار دیگه ای که در توانمونه.

وقتی کارهای ممکن رو شناختیم، می تونیم بریم دست به کار بشیم و انبوه کد تخفیف رو پخش کنیم بین کاربرا. ولی نه! دست نگه دارید. داریم قدرت اصلیمون رو فراموش می کنیم: پیش بینی. ما که مجهز به پیشبینی وقایع هستیم،‌ میتونیم بیایم برگردیم به دنیای یادگیری ماشین. با استفاده از داده موجود و مدلی که توی مرحله قبل ساخته بودیم،‌ قبل هر اقدامی بریم پیشبینی کنیم خروجی هرکدوم از تصمیم هایی که ممکنه گرفته باشیم چیه. کدوم یک از اون کارهایی که بالا درباره شون صحبت کردیم (انواع تخفیف) می تونه تاثیر بیشتری روی بازگشت مشتری داشته باشه؟ بعد از استفاده از قدرت پیشبینیمون،‌ خواهیم دید که یکی از اون گزینه های روی میز تاثیر خیلی مثبتی میتونه بذاره روی اون سوژه مورد بحث ما. حالا وقت عمل کردنه. حالا می تونیم به جای آزمون و خطا (و سورپرایز شدنهای گاه به گاهی) فقط کاری رو انجام بدیم که احتمال موفقیت آمیز بودنش بیشتر از بقیه ست.


بسیار سفر باید تا پخته شود خامی

حقیقت اینه که وقتی از تحلیل داده صحبت می کنیم،‌ با سه سطح متفاوت از بلوغ مواجهیم. هر سازمانی بسته به اینکه چه زمانی حرکتش رو به سمت داده-محور شدن شروع کرده باشه، و چقدر هوشمندانه پیش رفته باشه، وضع متفاوتی داره. ممکنه یک سازمان در مرحله اول باشه و صرفا به یک سری گزارش بسنده کنه. ممکنه همین براش کاملا موثر و مفید باشه و حتی حس نکنه که نیاز به جلوتر رفتن داره. یه سازمان دیگه هم ممکنه به مرحله تحلیل تجویزی رسیده باشه و توی ریزترین تصمیم گیری ها هم کاملا داده محور عمل کنه.

ولی یه نکته اینجا خیلی مهمه و اونهم اینه: نمیشه از مرحله سوم شروع کرد. نمی شه توقع داشته باشیم از روز اول بتونیم همه چیز رو با استفاده از داده به بهینه ترین حالت ممکن انجام بدیم. رسیدن به مرحله سوم نیازمند اینه که اول درک درستی از سیستممون داشته باشیم. در راه رسیدن به یه تحلیل توصیفی درست از محصولمون، متوجه خیلی چیزها میشیم. خیلی تاثیرهای مثبت رو می تونیم روی فرایندهامون بذاریم و درکمون که از چند و چون ماجرا بالا رفت،‌ بریم سراغ مراحل بعدی.


چطور داده-محور بشیم؟

احتمالا این سوالها الان توی ذهنتون داره می چرخه: اگر تازه بخوایم به سمت تصمیم گیری داده-محور حرکت کنیم از کجا باید شروع کنیم؟‌ چه قدمهایی برداریم، و به کجا برسیم؟ من شخصا یه راه برای تصمیم گیری داده محور دارم که طی کلی مطالعه و کلی بیشتر از اون کلنجار رفتن با مسائل، بهش رسیدم. این راه حل قراره مطلب بعدی من توی ویرگول باشه. اگر دوست داشتید به محض منتشر شدن،‌ ازش با خبر بشید، کافیه من رو توی ویرگول دنبال کنید.

من کی ام؟

من رضا کشاورز، یه تحلیلگر داده و مدرس علم داده م. اگر دوست داشتید مطالب دیگه ای که در زمینه دیتا ساینس و هوش مصنوعی می نویسم رو بخونید، کافیه من رو اینجا توی ویرگول دنبال کنید، یا بیاید توی لینکدین کانکت بشیم. اونجا هم لینک مطالبی که می نویسم رو میذارم. با لایک کردن و فرستادن این مطلب به کسایی که فکر می کنین بهش نیاز دارن، هم من و هم اونها رو می تونید خوشحال کنید :)

تحلیل دادههوش مصنوعیعلم دادهپایتونکسب و کار
رضا کشاورزم. یک تحلیلگر داده که مغزش همیشه درحال تحلیل جهان پیرامونشه. از تحلیل داده و هوش مصنوعی می نویسم اینجا.
شاید از این پست‌ها خوشتان بیاید