خوب، بد، زشت های تصمیم‌گیری‌ دیتا محور

حدود یک سال پیش اعضای تیم محصول برای اخذ تصمیم استراتژیک مهمی دور هم جمع شده بودند. جریان ایجاد شده تصمیم نهایی را به سمتی می‌برد که من کاملا مخالف بودم؛ من معتقد بودم به محصولی که تیم ما در حال کار روی آن است، ضربه وارد می‌شود.

چند دقیقه بیشتر برای نجات محصولمان (البته به عقیده خودم) فرصت نداشتم. بنابراین پنل بی‌آی، گوگل آنالیتیکز و گوگل استودیو را باز کردم و با این جمله «ویلیام ادواردز» جلسه را به دست گرفتم:

“In God we trust; all others must bring data.”

چند ماه قبل در جلسه استندآپ شرکت قول داده بودم که از این به بعد تمام تصمیماتم دیتا محور خواهد بود و طی ماه‌های بعد با جمع‌آوری و نمایش اطلاعات در پنل‌های مختلف مقدماتش را فراهم کرده بودم. بنابراین ذهن حاضران در جلسه آماده نطق غرای من بود؛ در نهایت با سوءاستفاده از دیتا (دقت کنید استفاده نه، سوءاستفاده) توانستم مسیر تصمیم‌گیری را به سمتی که شهودم می‌گفت، هدایت کنم.

بعد از جلسه از طرفی خوشحال بودم که محصول را نجات داده‌ام (خوشبختانه بعدها مشخص شد واقعا نجات دادم) و از طرفی فکرم به شدت درگیر این بود که خودم تا به حال چند بار قربانی سوءاستفاده از دیتا بوده‌ام؟

اتفاقا چند روز بعد در حال تحلیل داده‌ها متوجه شدم به خاطر یک بی‌دقتی، تا به حال راجع به رفتار خرید کاربرها به کل در اشتباه بودیم.

تقابل این دو موضوع باعث شد به قداست دیتا شک کنم. شک کنم که شاید دیتا آن «حبل المتین»ی نیست که باید تمام قد به آن تکیه کنیم.

بنابراین از دیدگاه «ویلیام ادواردز» ی عقب‌نشینی و سعی کردم یک بار دیگر جایگاه دیتا را بررسی کنم.

آن زمان کتاب «lean analytics» را بازخوانی می‌کردم و کتاب «قوی سیاه» را تازه شروع کرده بودم. بنابراین اکثر مباحثی که در این متن می‌خوانید تحت تاثیر این دو کتاب ارزشمند نوشته شده است.


مغز انسان و هزارتوی تصمیم‌گیری

طی دهه‌های اخیر تحقیقات زیادی بر روی مغز انسان انجام شده و خطاها و ضعف‌های بسیاری از خطای تکیه‌گاهی و اجتناب از زیان گرفته تا تاییدجویی برای همه آشکار شده است.

به دنبال همین تحقیقات، اصطلاح یا بهتر بگویم جنبش تصمیم‌گیری دیتامحور برای مقابله با تصمیمات شهودی ایجاد شد؛ چرا که ما انسان‌ها کاملا متوجه شده بودیم شهود ما نه تنها به تنهایی برای تصمیم‌گیری مناسب نیست بلکه ضعف‌های بی‌شماری هم دارد.

ولی آیا واقعا مغز ما صلاحیت تصمیم‌گیری ندارد؟

اگر مغز ما نمی‌تواند درست تصمیم بگیرد پس چطور توانسته این بدن ضعیف (به نسبت بقیه موجودات) را این همه سال زنده نگه دارد؟

واقعیت این است که مغز ما طوری طراحی شده تا با حداقل اطلاعات سریع‌ترین تصمیم را بگیرد؛ چون انسان اولیه برای بقا مجبور بوده سریع عکس‌العمل نشان بدهد. تصور کنید انسان اولیه اگر می‌خواست بعد از اولین غرش، دیتای بیشتری برای اثبات وجود شیر جمع‌آوری کند قطعا خورده می‌شد (احتمالا آنهایی که اینطوری بودند خورده شدند و نسلشان ادامه پیدا نکرده است.)

این فرمول قطعا برای زندگی بدوی کاملا دقیق طراحی شده بود تا وقتی که انسان تصمیم گرفت شهرهای بزرگ را بسازد، روش‌های ارتباطی در لحظه ایجاد کند، کامپیوتر بسازد و ریاضیات را توسعه دهد.

حالا ما انسان‌ها اطلاعات زیادی در لحظه داشتیم که دانشمندهای آمار می‌توانستند تحلیلش کنند و مثلا بگویند چقدر احتمال دارد امسال خشکسالی داشته باشیم.

یک لحظه تصور کنید انسانی که در گذشته به خاطر تغییرات آب و هوا ممکن بوده ضررهای جبران ناپذیری تحمل کند، امروزه می‌داند که امسال خشکسالی می‌شود و می‌تواند برای آن برنامه‌ریزی کند.

این دوره عصر طلایی ویلیام ادوارزها بود که انصافا خدمت بزرگی به بشریت انجام دادند.

همه چیز خوب بود تا وقتی که ما انسان‌ها به خاطر ذات حریصمان پیش خودمان گفتیم حالا که می‌شود آب و هوا را پیش‌بینی کرد، پس بیایید همه چیز را تحلیل و پیش‌بینی کنیم.

بیایید اول درباره بعضی از نقاط ضعف ذاتی دیتا صحبت کنیم: ارزش دیتاهای گذشته و آینده

داده‌ها برای گذشته

ما هیچ وقت دیتای کامل گذشته را تمام و کمال نمی‌توانیم نگه داریم؛ فقط یک اسنپ‌شات را از گذشته نگه می‌داریم.

بیایید فرض کنیم همه ما با هم در یک مهمانی هستیم. در این مهمانی اتفاقات زیادی از قهر، آشتی، شادی و غم ممکن است اتفاق بیافتد. ما یک سری خاطره و تعدادی عکس از آن مهمانی برایمان باقی می‌ماند.

احتمالا فردا خیلی دقیق می‌توانیم راجع به مهمانی شب قبل صحبت کنیم و مثلا بگوییم لبخند فلانی در این عکس زورکی است. فقط کافی است غبار زمان روی این عکس بنشیند؛ چند سال بعد همه یادشان می‌رود که اون لبخند زورکی بوده است.

دیتای محدودی که ما جمع کردیم با ترکیب شهودمان فقط بخشی از واقعیت را نمایش می‌دهد. این بخشی از واقعیت هم به مرور زمان اسیر فراموشی و کم اعتبارتر می‌شود. حالا هر چقدر هم ما دیتایی که ممکن است بعدا نیاز بشود را روی دیتاسنترها انبار کنیم، بازهم چیزی را که امروز می‌دانیم جمع کرده‌ایم، معلوم نیست در آینده برایمان کافی باشد.

داده‌ها برای آینده

فرض کنیم یک میز بیلیارد بدون اصطکاک داریم که توپ بیلیارد می‌تواند تا بی‌نهایت با بدنه برخورد کند و به مسیرش ادامه دهد. ما می‌خواهیم براساس دیتای موجود، محل برخورد توپ بیلیارد با دیواره میز را پیش‌بینی کنیم.

«سر مایکل بری» ریاضیدان به جای ما زحمت کشیده و سال‌ها پیش این محاسبات را انجام داده است. پیش‌بینی محل ضربه اول اصلا سخت نیست، دو و سوم هم همینطور ولی برای پیش‌بینی ضربه نهم باید اثر گرانش تمام افراد دور میز را در محاسباتمان بیاوریم. برای محاسبه ضربه پنجاه و چهارم باید اثر گرانش تمام ذرات موجود در کائنات را وارد محاسباتمان کنیم.

یعنی گرانش دورترین الکترون دورترین کهکشان روی محاسبات ما تاثیر دارد.

مایکل بری این محاسبات را با فرض اینکه هیچ تغییر غیر منتظره‌ای مثل جابه‌جا شدن یکی از حضار رخ ندهد، انجام داده بود. یعنی من و شما و تمام موجودات دارای اختیار تا ضربه پنجاه و چهارم بدون نفس کشیدن سر جای خودمان نشسته باشیم.

حتی با این فرض هم نمی‌توانیم حرکت ۱۵ دقیقه بعد یک توپ بیلیارد را پیش‌بینی کنیم. حالا دنیایی پر از اختیار و عدم قطعیت امروز را در نظر بگیرید که ما می‌خواهیم مسائل پیچیده‌تری مثل بازار بورس، رشد استارت‌آپ‌ها و … را پیش‌بینی کنیم.

جمع آوری دیتا، گران و تحلیل دیتا گرانتر

جمع‌آوری دیتا کار پر هزینه ای است. منظور دیتایی نیست که می‌دانید نیاز دارید، منظور دیتایی است که ممکن است در آینده نیاز پیدا کنیم. برای جمع‌آوری این دیتای عظیم به دیتاسنترهای بی‌نهایت بزرگی نیاز داریم که هزینه‌اش برای دیتایی که شاید لازم بشود، قطعا معقول به نظر نمی‌آید.

حالا با فرض وجود دیتای کافی به آدم‌های باهوشی نیاز داریم که تجربه و دانش کافی برای کار با دیتا را داشته باشند. با کمی جستجو متوجه می‌شویم که این آدم‌ها به هیچ وجه ارزان نیستند.

دنیای کرانستان و میانستان

«نسیم نیکلاس طالب» در کتاب ارزشمندش «قوی سیاه» دنیا را به دو بخش تقسیم می‌کند.

کرانستان و میانستان (این دو کلمه به ترتیب ترجمه انگلیسی دو کلمه Extremistan و Mediocristan هستند که توسط نویسنده ساخته شده‌اند و آقای محمد ابراهیم محبوب هم به پیروی از نویسنده این دو کلمه را از نو خلق کرده است).

میانستان دنیایی است که مغز ما راحت‌تر می‌فهمد. در این بخش از دنیا اختلاف‌ها از یک میانگین، تفاوت معنی‌دار ندارند. مثلا قد انسان‌ها احتمالا بین ۵۰ تا ۲۵۰ سانتی‌متر بوده و در طول تاریخ موارد نادری از این میانگین خارج بوده‌اند. حتی این موارد معدود تاثیری در کل هر تحلیلی که داشته باشیم ندارد.

اما امان از کرانستان،

کرانستان دنیایی است که مغز ما درک درستی از آن ندارد. مثل پولی که انسان‌ها دارند. موجودی بانکی انسان‌ها می‌تواند از صفر (یا حتی منفی هر عددی) تا مثبت هر عددی باشد. هیچ محدودیتی نمی‌توان برایش قائل شد و این اختلاف‌ها در تصمیم‌گیری ما تاثیر چشمگیری دارند.

تقریبا تمام ریاضیات ما بر پایه میانستان بوده و در میانستان جواب می‌دهد. مثل پیش‌بینی آب و هوا (در کره زمین سرعت باد و دمای هوا و… از یک میانگین پیروی می‌کنند که اگر پیروی نمی‌کردند احتمالا ما الان اینجا نبودیم که بخواهیم راجع به دیتا صحبت کنیم.)

ولی در کرانستان دیتای ما خیلی کم ارزش‌تر و تحلیل ما خیلی سطحی تر خواهد بود. تقریبا هیچ توزیع آماری در این دنیا کار نمی‌کند. در کرانستان اصل پارتو کار نمی‌کند، هیچ توزیع آماری کارآمدی نداریم و تقریبا هیچ وقت نتوانستیم نقاط شکست این دنیا را پیش‌بینی کنیم.

در کرانستان تقریبا خلع سلاح شده‌ایم.

محدودیت‌های ساخته انسان

حالا که با محدودیت‌های جمع‌آوری و تحلیل دیتا آشنا شدیم قبل از جمع‌بندی نهایی باید درباره بعضی از محدودیت‌های که خودمان در این راه پر پیچ و خم جلوی راهمان می‌گذاریم، صحبت کنیم.

تهوع دیتا

اوایل متن گفتیم که مغز ما طوری ساخته شده که با دیتای کم تصمیم سریع بگیرد و این کار را خیلی با کیفیت انجام می‌دهد. یکی از عارضه‌های دیتامحور شدن داشبوردهای دیتای شلوغ و آزاردهنده است که مغزمان را گیج و احتمال تصمیم‌گیری به موقع را غیرممکن می‌کند.

تحقیقات زیادی انجام شده که هر چه گزینه‌های بیشتری جلوی مشتری قرار بدهیم، شانس خریدش کمتر می‌شود.

راه حلی که lean analytics‌ پیشنهاد کرده استفاده از OMTM(one metrics that matters) است. یعنی در هر لحظه فقط و فقط روی یک kpi متمرکز بشویم و هر دیتای دیگری را نادیده بگیریم.

دیتای درست به آدم درست

نباید از همه آدم‌ها توقع داشته باشیم که همه نوع دیتا را بفهمند. طبیعتا انسان‌ها هرکدام تخصص‌ها و دغدغه‌های متفاوتی دارند. دیتایی که برای یکی از اعضای تیم قابل فهم و الهام بخش است برای یکی دیگر از اعضای تیم ممکن است استرس‌زا باشد.

راه حل این است که OMTM را خیلی قابل‌فهم و ساده انتخاب کنیم و به آدم‌های درگیر، بیشتر دیتایی بدهیم که مورد نیازشان باشد.

مثلا در یک تیم محصول اعلام می‌‌کنیم می‌خواهیم نرخ تبدیل ترافیک ورودی به خرید را ۵۰ درصد بیشتر کنیم. از دیزاینر می‌خواهیم که روی ux مترکز شود، فنی down time را کاهش بدهد، مرکز تماس نرخ پاسگخویی را افزایش دهد و... .

نادیده گرفتن خبرگی

می‌خواهیم یک تست را از دو نفر بگیریم. نفر اول از بچگی در بازار کار کرده و الان تاجری موفق است؛ بیایید اسمش را بگذاریم اصغر اعیادی.

نفر دوم یک آدم تحصیل‌کرده با شغل کارشناس ارشد دیتا در علی باباست. بیایید اسم این شخص را هم بگذاریم امید.

سوال این است: یک سکه را ۹۹ بار به هوا می‌ندازیم و نتیجه شیر می‌شود چقدر احتمال دارد دفعه ۱۰۰ ام خط بیاد؟

امید بدون درنگ می‌گوید ۵۰ درصد.

اصغر اعیادی می‌گوید آن سکه خراب است و همیشه شیر می‌آید بنابراین احتمال خط شدن صفر است.

حتی اگه به او بگوییم سکه سالم است به احتمال خیلی زیاد ما را دروغگو خطاب می‌کند که البته حق هم دارد. واقعا چقدر احتمال دارد یک سکه ۹۹ بار خط بیاد؟ آیا احتمال دروغگو بودن ما بیشتر نیست؟

امید اشتباه نکرده، حتی اگه این دیتا را در اختیار ابرکامپیوتر واتسون هم قرار بدهیم نتیجه همان است و جواب صحیح را اصغر داده است.

این مثال ارزش خبرگی را نشان می‌دهد که من اسمش را می‌گذارم فهم شهودی. بینش عمیقی که حاصل تعامل طولانی با مسئله دشواری است که باعث می‌شود مسیر نورونی مغز ما بارها و بارها در تمام حالت‌های ممکن به چالش کشیده و برای نباختن آماده شود.

همین خبرگی است که باعث می‌شود نفر اول روزبه‌روز موفق‌تر باشد و نفر دوم سال به سال از نفر اول پاداش عملکرد بگیرد. (فکر می‌کنم همه ما یک پسر عمه بازاری داریم که چندین برابر ما ثروت دارد!)

احتمالا قدرت شهود مغز ما تا مدت‌ها جایگاه خود را حفظ می‌کند (روزی که ما این قابلیت را به هوش مصنوعی ببازیم، به نظرم دنیا خیلی جای کسل کننده‌ای می‌شود).


جایگاه دیتا:

اگه تا اینجای متن به این نتیجه رسیدید که من قصد دارم به دیتا بتازم چند لحظه صبر کنید؛ منظور من به هیچ وجه تقبیح شخصیت محترم دیتا نیست. بیشتر روی نقاط ضعف و محدودیت‌های خودمان اشاره دارم والا دیتا یک شمشیر بُرنده است که بستگی دارد چطور از آن استفاده کنیم.

ولی راه حل چیست؟

داشبورد خودرو مثال کاملی از دیتای دقیق، حداقلی و درلحظه است‌
داشبورد خودرو مثال کاملی از دیتای دقیق، حداقلی و درلحظه است‌


من معتقدم هر قدر دیتایی که تحلیل می‌کنیم مربوط به زمان نزدیک‌تری به اکنون باشد (چه گذشته، چه آینده)، با قبول ریسک و محدودیت‌های جمع‌آوری و تحلیل اطلاعات و با علم به عدم قطعیت‌های دنیای کرانستانی امروزی، می‌توانیم خطی روی شن‌ها بکشیم و با داشبوردهای محدود اطلاعات وضعیت فعلی‌مان را کنترل کنیم.

درست است که آینده قابل پیش‌بینی نیست ولی همیشه برنامه‌ای منعطف (اصلاحا روی شن‌ها) داشته باشیم و هر وقت دیتای جدیدی داشتیم این خط را به‌روز کنیم.

به قول «یوگی برا» مربی افسانه‌ای بیسبال:

“If you don't know where you are going, you'll end up someplace else.”

حتی ماشین‌های تسلا هم با وجود اینکه می‌دانند مسیر نهایی کجاست ولی فقط برای ۱۰۰ متر جلوتر برنامه‌ریزی دقیق دارند و برنامه دورترشان هر لحظه ممکن است به روز شود.

من عمیقا به دانش خبره بازار (یعنی «اصغر ایادی» در بخش نادیده گرفتن خبرگی) اعتقاد دارم ولی همیشه می‌شود دانش این افراد را با دشبوردهایی با دیتای کافی تقویت کرد. ما پشت فرمان زندگی نشستیم. با داشبوردی که به ما سرعت، میزان سوخت، دمای موتور و دور موتور را نشان می‌دهد. این داشبورد به شدت ریسک رانندگی را کم می‌کنند ولی تصمیم نهایی با خود ماست. ممکن است سر پیچی که سرعت مجاز ۶۰ کیلومتر بر ساعت است و داشبورد سرعت ۸۰ کیلومتر بر ساعت را نشان می‌دهد تصمیم بگیرم سرعت را بیشتر کنیم یا شاید تصمیم بگیریم بزنیم بغل تا بقیه رد شوند. برای همین گذاشتن تمام تخم مرغ‌ها در سبد دیتا همان قدر خطرناک است که بی‌توجهی به دیتا.

ولی اگه مجبور به انتخاب باشم عمیقا معتقدم شهود انسانی از هر دیتا و تحلیلی قوی تر است.

روند جدیدی در دنیا به عنوان data insightبه جای data driven به راه افتاده و همان طور که از اسمش پیداست، از دیدگاه دیتا محور بودن صرف فاصله گرفته و نقش شهود را جدی‌تر می‌کند.

این متن در نتیجه تجربه و مطالعات محدود نگارنده نوشته شده و احتمال اینکه در بند دانش کم و محدودیت‌های شناختی گرفتار باشد وجود دارد. بنابراین با به اشتراک گذاشتن نظر و تجربیات خود به کامل شدن این متن کمک خواهید کرد.

منتظر نظرات شما هستیم.