مدیر محصول هستم. تمام عمرم شیفته استارتآپ(کارآفرینی) ها بودم . موسیقی راک و هنر معاصر دوست دارم و ماهی یک بار کوه می رم. دغدغه ایران دارم.
خوب، بد، زشت های تصمیمگیری دیتا محور
حدود یک سال پیش اعضای تیم محصول برای اخذ تصمیم استراتژیک مهمی دور هم جمع شده بودند. جریان ایجاد شده تصمیم نهایی را به سمتی میبرد که من کاملا مخالف بودم؛ من معتقد بودم به محصولی که تیم ما در حال کار روی آن است، ضربه وارد میشود.
چند دقیقه بیشتر برای نجات محصولمان (البته به عقیده خودم) فرصت نداشتم. بنابراین پنل بیآی، گوگل آنالیتیکز و گوگل استودیو را باز کردم و با این جمله «ویلیام ادواردز» جلسه را به دست گرفتم:
“In God we trust; all others must bring data.”
چند ماه قبل در جلسه استندآپ شرکت قول داده بودم که از این به بعد تمام تصمیماتم دیتا محور خواهد بود و طی ماههای بعد با جمعآوری و نمایش اطلاعات در پنلهای مختلف مقدماتش را فراهم کرده بودم. بنابراین ذهن حاضران در جلسه آماده نطق غرای من بود؛ در نهایت با سوءاستفاده از دیتا (دقت کنید استفاده نه، سوءاستفاده) توانستم مسیر تصمیمگیری را به سمتی که شهودم میگفت، هدایت کنم.
بعد از جلسه از طرفی خوشحال بودم که محصول را نجات دادهام (خوشبختانه بعدها مشخص شد واقعا نجات دادم) و از طرفی فکرم به شدت درگیر این بود که خودم تا به حال چند بار قربانی سوءاستفاده از دیتا بودهام؟
اتفاقا چند روز بعد در حال تحلیل دادهها متوجه شدم به خاطر یک بیدقتی، تا به حال راجع به رفتار خرید کاربرها به کل در اشتباه بودیم.
تقابل این دو موضوع باعث شد به قداست دیتا شک کنم. شک کنم که شاید دیتا آن «حبل المتین»ی نیست که باید تمام قد به آن تکیه کنیم.
بنابراین از دیدگاه «ویلیام ادواردز» ی عقبنشینی و سعی کردم یک بار دیگر جایگاه دیتا را بررسی کنم.
آن زمان کتاب «lean analytics» را بازخوانی میکردم و کتاب «قوی سیاه» را تازه شروع کرده بودم. بنابراین اکثر مباحثی که در این متن میخوانید تحت تاثیر این دو کتاب ارزشمند نوشته شده است.
مغز انسان و هزارتوی تصمیمگیری
طی دهههای اخیر تحقیقات زیادی بر روی مغز انسان انجام شده و خطاها و ضعفهای بسیاری از خطای تکیهگاهی و اجتناب از زیان گرفته تا تاییدجویی برای همه آشکار شده است.
به دنبال همین تحقیقات، اصطلاح یا بهتر بگویم جنبش تصمیمگیری دیتامحور برای مقابله با تصمیمات شهودی ایجاد شد؛ چرا که ما انسانها کاملا متوجه شده بودیم شهود ما نه تنها به تنهایی برای تصمیمگیری مناسب نیست بلکه ضعفهای بیشماری هم دارد.
ولی آیا واقعا مغز ما صلاحیت تصمیمگیری ندارد؟
اگر مغز ما نمیتواند درست تصمیم بگیرد پس چطور توانسته این بدن ضعیف (به نسبت بقیه موجودات) را این همه سال زنده نگه دارد؟
واقعیت این است که مغز ما طوری طراحی شده تا با حداقل اطلاعات سریعترین تصمیم را بگیرد؛ چون انسان اولیه برای بقا مجبور بوده سریع عکسالعمل نشان بدهد. تصور کنید انسان اولیه اگر میخواست بعد از اولین غرش، دیتای بیشتری برای اثبات وجود شیر جمعآوری کند قطعا خورده میشد (احتمالا آنهایی که اینطوری بودند خورده شدند و نسلشان ادامه پیدا نکرده است.)
این فرمول قطعا برای زندگی بدوی کاملا دقیق طراحی شده بود تا وقتی که انسان تصمیم گرفت شهرهای بزرگ را بسازد، روشهای ارتباطی در لحظه ایجاد کند، کامپیوتر بسازد و ریاضیات را توسعه دهد.
حالا ما انسانها اطلاعات زیادی در لحظه داشتیم که دانشمندهای آمار میتوانستند تحلیلش کنند و مثلا بگویند چقدر احتمال دارد امسال خشکسالی داشته باشیم.
یک لحظه تصور کنید انسانی که در گذشته به خاطر تغییرات آب و هوا ممکن بوده ضررهای جبران ناپذیری تحمل کند، امروزه میداند که امسال خشکسالی میشود و میتواند برای آن برنامهریزی کند.
این دوره عصر طلایی ویلیام ادوارزها بود که انصافا خدمت بزرگی به بشریت انجام دادند.
همه چیز خوب بود تا وقتی که ما انسانها به خاطر ذات حریصمان پیش خودمان گفتیم حالا که میشود آب و هوا را پیشبینی کرد، پس بیایید همه چیز را تحلیل و پیشبینی کنیم.
بیایید اول درباره بعضی از نقاط ضعف ذاتی دیتا صحبت کنیم: ارزش دیتاهای گذشته و آینده
دادهها برای گذشته
ما هیچ وقت دیتای کامل گذشته را تمام و کمال نمیتوانیم نگه داریم؛ فقط یک اسنپشات را از گذشته نگه میداریم.
بیایید فرض کنیم همه ما با هم در یک مهمانی هستیم. در این مهمانی اتفاقات زیادی از قهر، آشتی، شادی و غم ممکن است اتفاق بیافتد. ما یک سری خاطره و تعدادی عکس از آن مهمانی برایمان باقی میماند.
احتمالا فردا خیلی دقیق میتوانیم راجع به مهمانی شب قبل صحبت کنیم و مثلا بگوییم لبخند فلانی در این عکس زورکی است. فقط کافی است غبار زمان روی این عکس بنشیند؛ چند سال بعد همه یادشان میرود که اون لبخند زورکی بوده است.
دیتای محدودی که ما جمع کردیم با ترکیب شهودمان فقط بخشی از واقعیت را نمایش میدهد. این بخشی از واقعیت هم به مرور زمان اسیر فراموشی و کم اعتبارتر میشود. حالا هر چقدر هم ما دیتایی که ممکن است بعدا نیاز بشود را روی دیتاسنترها انبار کنیم، بازهم چیزی را که امروز میدانیم جمع کردهایم، معلوم نیست در آینده برایمان کافی باشد.
دادهها برای آینده
فرض کنیم یک میز بیلیارد بدون اصطکاک داریم که توپ بیلیارد میتواند تا بینهایت با بدنه برخورد کند و به مسیرش ادامه دهد. ما میخواهیم براساس دیتای موجود، محل برخورد توپ بیلیارد با دیواره میز را پیشبینی کنیم.
«سر مایکل بری» ریاضیدان به جای ما زحمت کشیده و سالها پیش این محاسبات را انجام داده است. پیشبینی محل ضربه اول اصلا سخت نیست، دو و سوم هم همینطور ولی برای پیشبینی ضربه نهم باید اثر گرانش تمام افراد دور میز را در محاسباتمان بیاوریم. برای محاسبه ضربه پنجاه و چهارم باید اثر گرانش تمام ذرات موجود در کائنات را وارد محاسباتمان کنیم.
یعنی گرانش دورترین الکترون دورترین کهکشان روی محاسبات ما تاثیر دارد.
مایکل بری این محاسبات را با فرض اینکه هیچ تغییر غیر منتظرهای مثل جابهجا شدن یکی از حضار رخ ندهد، انجام داده بود. یعنی من و شما و تمام موجودات دارای اختیار تا ضربه پنجاه و چهارم بدون نفس کشیدن سر جای خودمان نشسته باشیم.
حتی با این فرض هم نمیتوانیم حرکت ۱۵ دقیقه بعد یک توپ بیلیارد را پیشبینی کنیم. حالا دنیایی پر از اختیار و عدم قطعیت امروز را در نظر بگیرید که ما میخواهیم مسائل پیچیدهتری مثل بازار بورس، رشد استارتآپها و … را پیشبینی کنیم.
جمع آوری دیتا، گران و تحلیل دیتا گرانتر
جمعآوری دیتا کار پر هزینه ای است. منظور دیتایی نیست که میدانید نیاز دارید، منظور دیتایی است که ممکن است در آینده نیاز پیدا کنیم. برای جمعآوری این دیتای عظیم به دیتاسنترهای بینهایت بزرگی نیاز داریم که هزینهاش برای دیتایی که شاید لازم بشود، قطعا معقول به نظر نمیآید.
حالا با فرض وجود دیتای کافی به آدمهای باهوشی نیاز داریم که تجربه و دانش کافی برای کار با دیتا را داشته باشند. با کمی جستجو متوجه میشویم که این آدمها به هیچ وجه ارزان نیستند.
دنیای کرانستان و میانستان
«نسیم نیکلاس طالب» در کتاب ارزشمندش «قوی سیاه» دنیا را به دو بخش تقسیم میکند.
کرانستان و میانستان (این دو کلمه به ترتیب ترجمه انگلیسی دو کلمه Extremistan و Mediocristan هستند که توسط نویسنده ساخته شدهاند و آقای محمد ابراهیم محبوب هم به پیروی از نویسنده این دو کلمه را از نو خلق کرده است).
میانستان دنیایی است که مغز ما راحتتر میفهمد. در این بخش از دنیا اختلافها از یک میانگین، تفاوت معنیدار ندارند. مثلا قد انسانها احتمالا بین ۵۰ تا ۲۵۰ سانتیمتر بوده و در طول تاریخ موارد نادری از این میانگین خارج بودهاند. حتی این موارد معدود تاثیری در کل هر تحلیلی که داشته باشیم ندارد.
اما امان از کرانستان،
کرانستان دنیایی است که مغز ما درک درستی از آن ندارد. مثل پولی که انسانها دارند. موجودی بانکی انسانها میتواند از صفر (یا حتی منفی هر عددی) تا مثبت هر عددی باشد. هیچ محدودیتی نمیتوان برایش قائل شد و این اختلافها در تصمیمگیری ما تاثیر چشمگیری دارند.
تقریبا تمام ریاضیات ما بر پایه میانستان بوده و در میانستان جواب میدهد. مثل پیشبینی آب و هوا (در کره زمین سرعت باد و دمای هوا و… از یک میانگین پیروی میکنند که اگر پیروی نمیکردند احتمالا ما الان اینجا نبودیم که بخواهیم راجع به دیتا صحبت کنیم.)
ولی در کرانستان دیتای ما خیلی کم ارزشتر و تحلیل ما خیلی سطحی تر خواهد بود. تقریبا هیچ توزیع آماری در این دنیا کار نمیکند. در کرانستان اصل پارتو کار نمیکند، هیچ توزیع آماری کارآمدی نداریم و تقریبا هیچ وقت نتوانستیم نقاط شکست این دنیا را پیشبینی کنیم.
در کرانستان تقریبا خلع سلاح شدهایم.
محدودیتهای ساخته انسان
حالا که با محدودیتهای جمعآوری و تحلیل دیتا آشنا شدیم قبل از جمعبندی نهایی باید درباره بعضی از محدودیتهای که خودمان در این راه پر پیچ و خم جلوی راهمان میگذاریم، صحبت کنیم.
تهوع دیتا
اوایل متن گفتیم که مغز ما طوری ساخته شده که با دیتای کم تصمیم سریع بگیرد و این کار را خیلی با کیفیت انجام میدهد. یکی از عارضههای دیتامحور شدن داشبوردهای دیتای شلوغ و آزاردهنده است که مغزمان را گیج و احتمال تصمیمگیری به موقع را غیرممکن میکند.
تحقیقات زیادی انجام شده که هر چه گزینههای بیشتری جلوی مشتری قرار بدهیم، شانس خریدش کمتر میشود.
راه حلی که lean analytics پیشنهاد کرده استفاده از OMTM(one metrics that matters) است. یعنی در هر لحظه فقط و فقط روی یک kpi متمرکز بشویم و هر دیتای دیگری را نادیده بگیریم.
دیتای درست به آدم درست
نباید از همه آدمها توقع داشته باشیم که همه نوع دیتا را بفهمند. طبیعتا انسانها هرکدام تخصصها و دغدغههای متفاوتی دارند. دیتایی که برای یکی از اعضای تیم قابل فهم و الهام بخش است برای یکی دیگر از اعضای تیم ممکن است استرسزا باشد.
راه حل این است که OMTM را خیلی قابلفهم و ساده انتخاب کنیم و به آدمهای درگیر، بیشتر دیتایی بدهیم که مورد نیازشان باشد.
مثلا در یک تیم محصول اعلام میکنیم میخواهیم نرخ تبدیل ترافیک ورودی به خرید را ۵۰ درصد بیشتر کنیم. از دیزاینر میخواهیم که روی ux مترکز شود، فنی down time را کاهش بدهد، مرکز تماس نرخ پاسگخویی را افزایش دهد و... .
نادیده گرفتن خبرگی
میخواهیم یک تست را از دو نفر بگیریم. نفر اول از بچگی در بازار کار کرده و الان تاجری موفق است؛ بیایید اسمش را بگذاریم اصغر اعیادی.
نفر دوم یک آدم تحصیلکرده با شغل کارشناس ارشد دیتا در علی باباست. بیایید اسم این شخص را هم بگذاریم امید.
سوال این است: یک سکه را ۹۹ بار به هوا میندازیم و نتیجه شیر میشود چقدر احتمال دارد دفعه ۱۰۰ ام خط بیاد؟
امید بدون درنگ میگوید ۵۰ درصد.
اصغر اعیادی میگوید آن سکه خراب است و همیشه شیر میآید بنابراین احتمال خط شدن صفر است.
حتی اگه به او بگوییم سکه سالم است به احتمال خیلی زیاد ما را دروغگو خطاب میکند که البته حق هم دارد. واقعا چقدر احتمال دارد یک سکه ۹۹ بار خط بیاد؟ آیا احتمال دروغگو بودن ما بیشتر نیست؟
امید اشتباه نکرده، حتی اگه این دیتا را در اختیار ابرکامپیوتر واتسون هم قرار بدهیم نتیجه همان است و جواب صحیح را اصغر داده است.
این مثال ارزش خبرگی را نشان میدهد که من اسمش را میگذارم فهم شهودی. بینش عمیقی که حاصل تعامل طولانی با مسئله دشواری است که باعث میشود مسیر نورونی مغز ما بارها و بارها در تمام حالتهای ممکن به چالش کشیده و برای نباختن آماده شود.
همین خبرگی است که باعث میشود نفر اول روزبهروز موفقتر باشد و نفر دوم سال به سال از نفر اول پاداش عملکرد بگیرد. (فکر میکنم همه ما یک پسر عمه بازاری داریم که چندین برابر ما ثروت دارد!)
احتمالا قدرت شهود مغز ما تا مدتها جایگاه خود را حفظ میکند (روزی که ما این قابلیت را به هوش مصنوعی ببازیم، به نظرم دنیا خیلی جای کسل کنندهای میشود).
جایگاه دیتا:
اگه تا اینجای متن به این نتیجه رسیدید که من قصد دارم به دیتا بتازم چند لحظه صبر کنید؛ منظور من به هیچ وجه تقبیح شخصیت محترم دیتا نیست. بیشتر روی نقاط ضعف و محدودیتهای خودمان اشاره دارم والا دیتا یک شمشیر بُرنده است که بستگی دارد چطور از آن استفاده کنیم.
ولی راه حل چیست؟
من معتقدم هر قدر دیتایی که تحلیل میکنیم مربوط به زمان نزدیکتری به اکنون باشد (چه گذشته، چه آینده)، با قبول ریسک و محدودیتهای جمعآوری و تحلیل اطلاعات و با علم به عدم قطعیتهای دنیای کرانستانی امروزی، میتوانیم خطی روی شنها بکشیم و با داشبوردهای محدود اطلاعات وضعیت فعلیمان را کنترل کنیم.
درست است که آینده قابل پیشبینی نیست ولی همیشه برنامهای منعطف (اصلاحا روی شنها) داشته باشیم و هر وقت دیتای جدیدی داشتیم این خط را بهروز کنیم.
به قول «یوگی برا» مربی افسانهای بیسبال:
“If you don't know where you are going, you'll end up someplace else.”
حتی ماشینهای تسلا هم با وجود اینکه میدانند مسیر نهایی کجاست ولی فقط برای ۱۰۰ متر جلوتر برنامهریزی دقیق دارند و برنامه دورترشان هر لحظه ممکن است به روز شود.
من عمیقا به دانش خبره بازار (یعنی «اصغر ایادی» در بخش نادیده گرفتن خبرگی) اعتقاد دارم ولی همیشه میشود دانش این افراد را با دشبوردهایی با دیتای کافی تقویت کرد. ما پشت فرمان زندگی نشستیم. با داشبوردی که به ما سرعت، میزان سوخت، دمای موتور و دور موتور را نشان میدهد. این داشبورد به شدت ریسک رانندگی را کم میکنند ولی تصمیم نهایی با خود ماست. ممکن است سر پیچی که سرعت مجاز ۶۰ کیلومتر بر ساعت است و داشبورد سرعت ۸۰ کیلومتر بر ساعت را نشان میدهد تصمیم بگیرم سرعت را بیشتر کنیم یا شاید تصمیم بگیریم بزنیم بغل تا بقیه رد شوند. برای همین گذاشتن تمام تخم مرغها در سبد دیتا همان قدر خطرناک است که بیتوجهی به دیتا.
ولی اگه مجبور به انتخاب باشم عمیقا معتقدم شهود انسانی از هر دیتا و تحلیلی قوی تر است.
روند جدیدی در دنیا به عنوان data insightبه جای data driven به راه افتاده و همان طور که از اسمش پیداست، از دیدگاه دیتا محور بودن صرف فاصله گرفته و نقش شهود را جدیتر میکند.
این متن در نتیجه تجربه و مطالعات محدود نگارنده نوشته شده و احتمال اینکه در بند دانش کم و محدودیتهای شناختی گرفتار باشد وجود دارد. بنابراین با به اشتراک گذاشتن نظر و تجربیات خود به کامل شدن این متن کمک خواهید کرد.
منتظر نظرات شما هستیم.
مطلبی دیگر از این انتشارات
داستان ساختن محصولی که ساختنش را بلد نبودم
مطلبی دیگر از این انتشارات
چطور در علی بابا یک بکلاگ ۳۰۰ موردی را اولویتبندی کردم؟ (قسمت دوم)
مطلبی دیگر از این انتشارات
تست کاربردپذیری چطور وارد علی بابا شد؟