مدیرمحصول! عاشق علوم داده و محاسبات کوانتومی
چگونه با یک سکه نتیجه انتخابات را درست پیشبینی کنیم؟
پیشبینی رویدادها و وقایع، یکی از مهارتهایی است که از همان نخستین روزهای تشکیل جامعه انسانی تا به امروز برای بشریت اهمیت داشته است. این مهارت به قدری برای انسانها جذابیت داشته که افرادی شغل «پیشگویی» را برای خود برگزیده و از این راه، درآمد و طرفداران زیادی پیدا کرده بودند. نام تعدادی از آن افراد مانند «نوستراداموس» هنوز هم به گوش میرسد و بعد از گذشت قرنها، همچنان عدهای به دنبال بررسی تحقق یا عدم تحقق پیشگوییهای وی هستند.
در دنیای کسبوکار نیز پیشگویی و داشتن آگاهی نسبت به وقایع آینده یک هنر مهم به شمار میآید. به طور کلی به هر میزان بصیرت و آگاهی یک کسبوکار نسبت به آینده واقعبینانهتر باشد، موفقتر خواهد بود و پلههای رشد را با سرعت بیشتری طی خواهد نمود. چرا که متناسب با اتفاقات آینده یک مجموعه استراتژی تدوین میکند. به همین دلیل اکنون بیشتر شرکتها به علوم داده توجه بیشتری نشان داده و اکثر کسبوکارها، سرمایهگذاریهای کلانی برای دادهمحور شدن سازمان خود انجام میدهند. در بسیاری از شرکتها نیز دپارتمان علوم داده ایجاد شده و تعداد زیادی دانشمند داده استخدام شدهاند.
بدیهی است که پیشبینیهای جهان امروز که به کمک علوم داده صورت میگیرد، تفاوت ماهیتی با پیشبینیهای چند قرن قبل دارد. پیشبینی و ایجاد بصیرتی که به کمک علوم داده صورت میپذیرد، ماهیت علمی داشته و مبتنی بر تحلیل و بررسی یک مجموعه داده است.
حال کمی از فضای کسبوکار فاصله گرفته و وارد فضای زردتری به نام انتخابات شویم. پیشبینی این که چه کسی پیروز یک کارزار انتخاباتی خواهد بود، یکی از جذابترین کارهایی است که افراد انجام میدهند. بسیاری از موسسات آماری و تحقیقاتی، همه ساله پیش از برگزاری یک انتخابات، شروع به جمعآوری داده و تحلیل آن کرده تا بتوانند پیروز انتخابات را پیش از برگزاری رایگیری اعلام کنند. در بسیاری از موارد، سیاستمداران مبالغ گزافی تقدیم شرکتهای آماری کرده تا گزارشهای لحظهای از وضعیت اقبال عمومی آنها تهیه کنند و نامزد موردنظر بر اساس این گزارشها، کمپینهای تبلیغاتی خود را پیش ببرد.
چالش بزرگ جمعآوری داده
در پیشبینی انتخابات یک چالش بزرگ برای اکثر آژانسها و موسسات جمعآوری داده وجود دارد و آن هم وجود دادههای اشتباه به مقدار زیاد است. این اتفاق، در نهایت منجر به نتیجهگیری اشتباه خواهد شد. یکی از بزرگترین نمودهای این موضوع در انتخابات ریاست جمهوری سال ۲۰۱۶ ایالات متحده اتفاق افتاد. در آن سال رقابت میان دونالد ترامپ و هیلاری کلینتون برقرار بود. آن زمان تقریبا تمام نظرسنجیها و رسانههای معتبر هیلاری را فاتح بلامنازغ این کارزار میدانستند.
این پیشبینی برای اکثریت مردم نیز باور پذیر بود؛ چراکه یک طرف ماجرا ترامپی ایستاده بود فارغ از هرگونه تجربه سیاسی و مواضعی به شدت تند و افراطی را در کمپینهای انتخاباتی خود اتخاذ کرده بود و در سوی دیگر، کلینتون بیش از سه دهه حضور مستمر در سیاست را تجربه کرده و پیشتر نیز سکان وزارت امور خارجه ایالات متحده را برعهده داشت. با تمام این تفاسیر، پیروزی کلینتون بر ترامپ اتفاق چندان عجیبی به نظر نمیرسید. بسیاری از رسانههای معتبر نظیر نیویورک تایمز شانس برتری کلینتون بر ترامپ را ۸۵ به ۱۵ میدانستند.
حیرت جهان!
با شروع شمارش آرا، بهت و حیرت مردم جهان را فرا گرفته بود. در حالی که خوشبینترین موسسات آماری نیز شانسی برای ترامپ قائل نبودند، او یک به یک آرای الکترال ایالاتها را مال خود کرده و خیلی سریع به ۲۷۰ الکترال لازم برای کسب عنوان ریاست جمهوری ایالات متحده دست پیدا کرد.
در پایان رایگیری، ترامپ ۳۰۶ به ۲۳۲ کلینتون را شکست داد تا یکی از غیرمنتظرهترین اتفاقات تاریخ انتخابات ایالات متحده آمریکا رقم بخورد. این شکست، بسیاری از متخصصان حوزه علوم داده را شوکه کرد. تا به امروز، مقالات متعددی درباره عوامل موثر بر رخ دادن این فاجعهٔ آماری نوشته و ابعاد مختلف این اتفاق بررسی شده است.
بهطور کلی، یکی از مهمترین دلایل انحراف نتایج بسیاری از نظرسنجیهای پیش از رایگیری این است که افراد به دلایل مختلف کاندیدای موردنظر خود را اعلام نمیکنند. بنابراین یا در نظرسنجی شرکت نکرده و یا گزینههای دیگری را به عنوان منتخب خود اعلام میکنند. این در حالی است که چنین شخصی در روز انتخابات و پای صندوق به همان فرد موردنظرش (که نامش را اعلام نمیکرد) رای میدهد. حال اگر درصد قابل توجهی از جامعه چنین کاری را انجام دهند، بدیهی است که نتایج نظرسنجی به انحراف کشیده شده و فاجعهٔ آماری شبیه سال ۲۰۱۶ رخ میدهد.
طرح مسئله
ما در این مقاله قصد نداریم که دلایل شکست پیشبینیهای انتخابات ۲۰۱۶ را بررسی کنیم. شاید در آینده در یک مقاله، مفصل به دلایل آماری و عوامل منجر به این اتفاق بپردازیم. در این مقاله قصد داریم با یک بازی ریاضی-آماری آشنا شویم.
همانطور که اشاره شد، یکی از مهمترین عواملی که منجر به اشتباه در پیشبینی میشود، دادههای اشتباهی است که به صورت انبوه وارد نظرسنجی میشود. حال اگر بتوانیم به طریقی و با ایجاد تغییراتی در نحوه جمعآوری داده، کاری کنیم که دقت دادههای دریافتی به طور قابل توجی بالا رود، در این صورت احتمالا پیشبینی ما از نتیجه انتخابات نیز صحیح خواهد بود. در ادامه مقاله، به بررسی چند مثال از این مدل جمع آوری داده میپردازیم.
جنگل رویایی
در یک جنگل دورافتاده که ۲۰۰ حیوان در آن زندگی میکنند، انتخاباتی به منظور مشخص کردن ریاست جنگل در جریان است. «درخت آموزگار» و «گراز زرهپوش» نامزدهای اصلی این انتخابات هستند. «درخت آموزگار» سالها مشغول تعلیم اهالی جنگل بوده و اعتقاد دارد که صلح و تعامل باید میان تمام اعضای جنگل و میان دیگر جنگلها برقرار باشد.
از سوی دیگر «گراز زرهپوش» فردی خشن است و عقایدی جنگجویانه دارد، او معتقد است که باید بخش عظیمی از منابع را صرف سرمایهگذاری در حوزه نظامی کرد و در صورت امکان به دیگر جنگلها حمله و منابع آنها را تصاحب کرد. در این میان یک آژانس سری که در جنگل به طور مخفیانه فعالیت میکند، به ما ماموریت میدهد تا پیروز انتخابات را پیش از برگزاری پیشبینی کنیم. در صورتی که پیشبینی ما اشتباه باشد، جانمان در خطر است!
بنابراین تصمیم میگیریم تا با پرسش از تک تک اعضای جنگل، قدرت پیشبینی پیروز واقعی انتخابات را به دست آوریم. هنگامی که از افراد درباره نامزد موردنظرشان میپرسیم، شرایط زیر برقرار خواهد بود:
- در صورتی که فرد مایل به رای دادن به «درخت آموزگار» باشد، او را به عنوان نامزد موردنظر خود انتخاب میکند.
- در صورتی که فرد مایل به رای دادن به «گراز زرهپوش» باشد، احتمال دارد نام «درخت آموزگار» را به ما بگوید (از شانس وقوع این رخداد اطلاعی نداریم؛ اما میدانیم که این اتفاق به صورت متناوب رخ میدهد)
بدین ترتیب، همانطور که مشخص است مهمترین چالش ما جمعآوری داده صحیح از اهالی جنگل است. بنابراین باید روشی را برگزینیم که در آن نظر واقعی اهالی را بدون آن که آن فرد را وادار به بیان مستقیم آن کنیم، متوجه شویم. به بیان بهتر باید یک زبان واسط میان خودمان و فرد تعریف کنیم تا فرد پاسخ سوال ما را به آن زبان واسطه بدهد و در سوی دیگر، ما بتوانیم پاسخ سوال را متوجه شویم.
بدین ترتیب در همان حال که ما اطلاعات صحیح را دریافت میکنیم، آن فرد نیز دیدگاه شخصی خود را به صورت علنی بیان نکرده است و حریم شخصی او حفظ میشود. اما برای حل این مشکل چه استراتژیای باید در نظر گرفت؟
یک سکه و دنیای احتمال
برای حل این مشکل کافی است از یک سکه کمک بگیریم! میدانیم که در هر سکه فضای نمونه دو حالت دارد: «شیر» یا «خط» که بعضی آن را «رو» و «پشت» نیز مینامند. بنابراین کافی است تا به سراغ هریک از اهالی جنگل رفته و با دادن یک سکه به او از وی بخواهیم بازی زیر را در خانهٔ خود (بدون حضور ما) انجام داده و نتیجه را به ما اعلام کند. قوانین بازی به شرح زیر است:
- اگر سکه «شیر» آمد، نام آن فردی را که مایل به رای دادن به او هستید، اعلام کنید.
- اگر سکه «خط» آمد، نام «گراز زرهپوش» را اعلام کنید.
همانطور که اشاره شد، بزرگترین مشکل جمعآوری داده در انتخابات این است که تعدادی از افراد با وجود آن که مایل به رای دادن به «گراز زرهپوش» بودند، به دلایل مختلف از ابراز تمایل خود به صورت علنی خودداری میکردند. با این روش این مشکل حل میشود؛ چراکه وقتی یک فرد نام «گراز زرهپوش» را به زبان میآورد، مشخص نیست که آیا این امر به دلیل تمایل قلبی وی بوده است، یا به این علت است که سکه «خط» آمده است. از آنجایی که ما از نتیجه شیر یا خط خبر نداریم، افراد با خیال راحت میتوانند، نتیجهی بازی را به ما اعلام کنند. پس از جمعآوری دادهها نتیجه به شکل زیر شد:
- مجموع آرا: ۲۰۰
- تعداد رأی «گراز زرهپوش» = ۱۳۰
- تعداد رأی «درخت آموزگار» = ۷۰
اکنون زمان آن است که ریاضیات وارد میدان شود. میدانیم که هنگام پرتاب یک سکه، احتمال «شیر» یا «خط» آمدن برابر و هر یک برابر ۲/۱ (یک دوم) است. بنابراین اگر یک سکه را ۲۰۰ بار پرتاب کنیم، تقریبا میتوان گفت که ۱۰۰ بار «شیر» و ۱۰۰ بار «خط» خواهیم داشت. در حقیقت داریم:
به خاطر دارید که قانون دوم بازی آن بود که اگر سکه «خط» آمد، فرد باید نام «گراز زرهپوش» را اعلام کند. بنابراین در ۱۰۰ حالت افراد بدون آن که لزوما تمایلی به «گرازه زرهپوش» داشته باشند نام او را اعلام کردهاند. بنابراین باید از ۱۳۰ رأی «گراز زرهپوش» ۱۰۰ عدد کسر کنیم؛ چراکه در این ۱۰۰ رأی هیچ اختیاری در میان نبوده است و فرد تنها به منظور رعایت قاعده بازی نام «گراز زرهپوش» را اعلام کرده است. پس در حقیقت تنها ۳۰ نفر از افراد واقعا به «گراز زرهپوش» رأی دادهاند. این در حالی است که ۷۰ رای «درخت آموزگار» همگی واقعی بوده است؛ چراکه طبق قاعده بازی، در حالتی که پس از پرتاب سکه نتیجه «شیر» آمده است، باید به نامزد مورد علاقه خود رأی بدهند. بنابراین پس از اعمال این قاعده خواهیم داشت:
- تعداد رأی «درخت آموزگار» : ۷۰
- تعداد رأی «گراز زرهپوش» : ۳۰
با توجه به فاصله معناداری که میان تعداد رأی «درخت آموزگار» و «گراز زرهپوش» وجود دارد، با قطعیت میتوان پیشبینی کرد که در روز انتخابات «درخت آموزگار» پیروز خواهد بود. بدین ترتیب توانستیم بدون آن که به صورت مستقیم وارد حریم شخصی افراد شویم، اطلاعات مورد نیاز خود را از آنها دریافت و نتیجهٔ انتخابات را پیشبینی کنیم.
ممکن است این سوال برای عدهای پیش بیاید، که ممکن است حالتی وجود داشته باشد که فردی واقعا تمایل به رأی دادن به «گراز زرهپوش» را داشته باشد، اما به علت آن که سکه «خط» آمده است، رای او عملا در نظر گرفته نشده است. چند پاسخ برای این سوال وجود دارد؛
اول آن که ما به دنبال آن هستیم تا پیروز انتخابات را مشخص کنیم و این که هرکس دقیقا چه میزان رأی میآورد، مقصود ما نیست و اساسا توانایی انجام آن را به صورت دقیق نداریم. دوم آن که این حالت در شرایط معکوس نیز صدق میکند؛ یعنی عدهای طرفدار «درخت آموزگار» هستند، اما به این دلیل که سکه «خط» آمده، نظرشان حذف شده است. بنابراین میتوان گفت که این حالتها در نتیجهٔ نهایی پیشبینی ما چندان تاثیرگذار نخواهد بود و پیشبینی ما صحیح است. در ادامه این مقاله، به کاربرد این تکنیک در فضای مدیریت محصول خواهیم پرداخت.
نظرسنجی و معرفی محصول
هُلدینگ شما به تازگی از یک محصول جدید رونمایی کرده است. شما مدیریت این محصول را بر عهده دارید و پس از گذشت چند وقت، برای این که آگاهی و بصیرت بیشتری دربارهٔ نظر کاربران داشته باشید، تصمیم میگیرید تا یک پرسشنامه طراحی کنید که در آن پاسخ سوالات دو گزینهای است.
جهت آن که افراد بیشتری در نظرسنجی شرکت کنند و مشارکت بالا رود، هُلدینگ به هر فردی که نظرسنجی را تا انتها انجام دهد، ۱۰ دلار پاداش میدهد؛ اما اعطای این پاداش ممکن است افراد را ناخودآگاه به سمت آن سوق دهد که گزینههایی با بار مثبت را انتخاب کنند و از انتخاب گزینههای انتقادی پرهیز کنند.
از طرفی اگر این ۱۰ دلار به افراد داده نشود، ممکن است مشارکت کاهش یافته و افراد، با دقت پایینی سوالات را مطالعه کنند. بنابراین باید استراتژیای اتخاد کرد که علاوه بر افزایش انگیزه افراد، دقت پاسخها را نیز افزایش داد. بنابراین شما به عنوان مدیرمحصول، تصمیم میگیرید بازی زیر را طراحی کنید.
همانطور که گفته شد، پاسخ هر سوال دو گزینهای است. بدیهی است که یک گزینه بار مفهومی مثبت و یک گزینه بار مفهومی انتقادی و منفی دارد. اکنون شما در کنار گزینههایی که بار مفهومی مثبت دارند علامت «+» را قرار داده و به طریق مشابه، در کنار گزینههایی با بار مفهومی انتقادی علامت«–» را قرار میدهید. در ابتدای نظرسنجی از فرد میخواهید که یک سکه در دست بگیرد و پاسخ سوالات نظرسنجی را به این شیوه بدهد:
- پیش از آن که سوال را بخواند، یک سکه بیندازد
- در صورتی که سکه «خط» آمد، بدون آن که صورت سوال را بخواند، گزینه مثبت را انتخاب کند.
- در صورتی که سکه «شیر» آمد، صورت سوال را تا انتها خوانده و گزینهٔ مدنظر خود را انتخاب کند.
بدین ترتیب، احتمال آن را که افراد به سمت انتخاب گزینه مثبت سوق داده شوند، کاهش دادهاید. اکنون میتوانید نظارت دقیقتری بر نتیجهٔ نظرسنجی داشته باشید. به طور مثال پاسخ به یکی از سوالات که دو هزار نفر به آن پاسخ دادهاند به شکل زیر بوده است:
- تعداد افراد شرکتکننده: ۲۰۰۰ نفر
- تعداد رأی به گزینه با بار معنایی مثبت: 1300 نفر
- تعداد رأی به گزینه با بار معنایی منفی و انتقادی: 700 نفر
به مانند دفعه قبل عمل میکنیم. میدانیم که در دو هزار بار پرتاب سکه، حدودا هزار بار سکه «شیر» و هزار بار «خط» خواهد آمد. در حقیقت داریم:
از آنجایی که طبق شیوهنامه اگر سکه خط بیاید افراد گزینه مثبت را انتخاب میکنند (بدون آن که حتی صورت سوال را بخوانند) از آن 1300 رای مثبت، تعداد ۱۰۰۰ عدد کسر میکنیم. اکنون خواهیم داشت:
- تعداد رأی به گزینه با بار معنایی مثبت: 300 نفر
- تعداد رأی به گزینه با بار معنایی منفی و انتقادی: 700 نفر
بنابراین به طور کلی میتوان نتیجه گرفت که بر خلاف چیزی که در ابتدا نشان داده میشد، نظر اکثریت افراد نسبت به آن سوال، منفی بوده و نیاز است تا به دنبال علت این اتفاق بگردیم. بدین ترتیب، علاوه بر این که با دادن پاداش مالی، میزان مشارکت در نظرسنجی افزایش یافت، با ایجاد این بازی ساده دقت پاسخها نیز بهبود چشمگیری داشته و در آینده، میتوان تصمیمگیری واقعبینانهتری متناسب با نتایج نظرسنجی انجام داد.
جمعبندی
همانطور که اشاره شد، یکی از مهمترین چالشهایی که اکثر شرکتهای آماری در نظرسنجیهای مردمی با آن روبهرو هستند این است که افراد نظر واقعی خود را بیان نمیکنند. همین امر باعث به انحراف کشیده شدن نتیجه نظرسنجی میشود. بنابراین، پیشبینیها و نتیجهگیریها معمولا با آنچه در واقعیت رخ میدهد، تفاوت چشمگیری دارد. اما با انجام این روش ساده به کمک یک سکه که به نوعی یک بازی ریاضی-آماری به حساب میآید، در عین این که فرد احساس میکند حریم شخصیاش حفظ شده و راحتتر اعتماد میکند، میتوانیم دقت خروجی نظرسنجی را به شکل چشمگیری افزایش دهیم.
مطلبی دیگر از این انتشارات
گرفتاری مدیران در دوراهی عملکرد - همدلی
مطلبی دیگر از این انتشارات
متدهای مدرن برای ساخت محصول سازمانیِ موفق
مطلبی دیگر از این انتشارات
۱۰ درس ضروری که باید از مدیریت محصول سازمانی بیاموزیم