در تلاش برای یادگرفتن چیزهای جدید، مثلا چیدن کلمات کنار یکدیگر..
چالش کتابخوانی طاقچه : «همه دروغ میگویند»
نویسنده زمانیکه دانشجوی ارشد بوده با گوگل ترندز آشنا میشه و تصمیم میگیره پایان نامه اش رو بر اساس داده های اون بنویسه. پس اولین کلمه ای که توی این برنامه تایپ میکنه : خداوند بوده و اینطور متوجه میشه بیشترین جستوجو درباره ی خدا که روزهای یکشنبه ام اتفاق می افتاده تو کدوم مناطق بوده.
ایشون فارغ التحصیل رشته ی اقتصاد از دانشگاه هاروارده و مدتی در شرکت گوگل به عنوان متخصص علوم داده فعالیت میکرده و حاصل تجربیات اون زمانش رو در این کتاب آورده.
نویسنده اوایل کتاب یه مثالی میزنه از اینکه مردم دروغ میگن : برخی مردم باور داشتن از زمان ریاست جمهوری باراک اوباما دورهی پسانژادپرستی رسیده اما با سرچ کلمهی کاکاسیاه و جمع این کلمه (و بررسی دقیق تر با سرچ های متفاوت و پیشوند و پسوند ها) متوجه میشه همه دروغ میگن و فقط سایز دروغ اشون باهم متفاوته. پس با همین اطلاعات مشابه میشه فهمید افراد در انتخابات (آمریکا) به چه کسی رای میدن : و مثالی میزنه از جستوجوهایی که ابتدا نام ترامپ اومده و بعد کلینتون و برعکسش.
درنهایت هم با همین داده ها به یک نتیجه گیری میرسه :
مناطقی از کشور که بیشتر از ترامپ حمایت کردن همان هایی هستند که بیشتر از دیگران کلمه ی کاکاسیاه رو در گوگل سرچ کردن.
پس هدف کتاب راهی برای پاسخ به همچین سوالاتیه : هرکس واقعا چقدر درآمد دارد؟ چند درصد از آمریکاییها نژادپرست اند؟ آیا میشه بازار سهام رو دستکاری کرد؟ چه تعداد از مردم، واقعا کتابهایی که میخرند رو میخوانند؟ آیا بازیها و سرگرمیهای خشونتآمیز، نرخ جنایات رو بالا میبرن ؟ یا مثلا آیا والدین، با فرزندان دختر و پسر خودشون، به طرز متفاوتی رفتار میکنند؟ و نویسنده میگه که مردم دروغ میگن چه به دوستانشون چه خانواده و همکار و اطرافیان و حتی به خودشون. اون ها حتی پرسشنامه های شفاهی، تلفنی یا کاغذی رو هم با صداقت کامل جواب نمیدن، و با مثالی که از همکلامی با مادربزرگش داشته میگه که اگر در مورد مسئله ای از ما سوالی بپرسن که تجربه ای توش داشته باشیم با اغراق بیشتری نظر میدیم. به عبارتی ما به داده ها وزن میدیم و بیشترین وزن در بین داده ها خودمون ایم.
نویسنده ادعا میکنه همه دروغ میگویند اما داده ها نه. در نتیجه پاسخ به هزاران پرسش مثل سوالات بالا رو فقط میشه از طریق داده ها( البته نه به تنهایی) پیدا کرد. حالا چرا این راه بهترینه؟ چون دهه های قبل موتورهای جست و جو نبود ولی الان که هست مردم حتی رازهای خصوصی اشون رو هم گوگل میکنند و در این مورد با بررسی داده ها، به تفاوت بین واقعیتی که از داده های بدست میاد و نتایج یک نوع نظرسنجی دیگه میرسیم. البته یادآوری میکنه که داده ها تنها راه نیستن و باید در کنار منابع سنتی و قدیمی ازشون استفاده بشه. و بعد هم یک مثالی میزنه که خیلی خلاصه بخوام بگم نقض جمله ی " آدم تو محدودیت ها ستاره میشه" هست.
کتاب با همین مثالها پیش میره و روی همین مثالهای عینی و واقعی نکته هایی رو بیان میکنه : مثلا یکی از چیزهایی هم که بررسی کرده غلط های تایپی هست. سرچ کردن کلمات و بلافاصله اصلاح اشون. تا نتایجی که از یک سری داده ها گرفته رو با این آمار هم مورد بررسی قرار بده.
جلوتر هم چندتا از قدرتهای داده های بزرگ رو لیست میکنه :
1- ارائه ی داده های تازه
2- ارائه ی داده های صادقانه
3- قدرت تمرکز روی زیرمجموعه های کوچک جمعیتی
4- قدرت اجرای آزمایش آنی
که در جلوتر هر کدوم رو بررسی میکنه. در صفحات بعدی یک داستانی از خرید اسب تعریف میکنه که قسمت جالبش اونجاییه که صاحب اسب با نام مستعار اسب خودش رو میخره ( وقتی به این نتیجه میرسه که نباید اسب رو بفروشه اما مجبور به فروختنه) و اینجا دنبال پاسخ به این سوال هستیم که کدوم اسب برای خریدن مناسبه با کدوم معیار؟ خب بعد از تعریف ماجرای طولانی اما جالب این قسمت هم سه تا درس میگیره که یکی اش اینه : همین کافی است که بدانید چه چیز موثر است،( برای انتخاب یک اسب) دلیلش اهمیتی ندارد..
تا اینجا تقریبا یک سوم کتاب پیش رفته و من هم در مدت زمان نسبتا طولانی تونستم مطالعه اش رو ادامه بدم. مثال ها و نمونه ها از خوابی که آدمها میبینند، علائم هایی که از یک بیماری دارن چه قبل و چه بعد از تشخیص دکتر که در موردش سرچ میکنند هست تا چیزهای دیگه، درنهایت هم میگه که :
کلمات بطور کلی داده اند، کلیک و لینک داده اند، غلط های تایپی داده اند، موزهایی که به خواب می آیند داده اند ، لحن صدا و نفس نفس زدن و تپش قلب داده است، اندازه طحال (اسب) هم داده است و به ادعای نویسنده سرچ انقلابی ترین نوع داده است.
بله مردم به دوستانشان دروغ میگویند، به رئیسشان، پدر و مادرشان، پزشک شان، همسران شان و به خودشان دروغ میگویند.مهم تر از همه آنها در نظر سنجی ها نیز دروغ میگویند، بسیاری از افراد درباره ی رفتارها و افکار خجالت آور خود در نظر سنجی ها دروغ میگویند زیرا آنها میخواهند پذیرفتنی جلوه کنند، گرچه هویت شان در نظر سنجی ها ناشناس باقی می ماند اما درباره میزان مشارکت خود در انتخابات و کمک به خیریه ها اغراق میکنند، این چیزی است که به آن خطای محبوبیت اجتماعی میگویند.
در مورد یکی از سوالات سطرهای بالا هم داده ها نشون میده احتمال اینکه والدین عبارت "آیا پسرم نابغه است؟" را جست و جو کنند 2.5 برابر بیشتر از آن است که جست و جو کنند "آیا دخترم نابغه است؟" اما نگرانی عمده والدین درباره دختران خود چیست ؟ درواقع هر چیزی که به ظاهر آنها مربوط باشد مایه نگرانی است. و بااینکه حدود 28 درصد دختران و 35 درصد پسران اضافه وزن دارند عبارت "آیا دخترم اضافه وزن دارد؟" دوبرابر بیشتر است نسبت به "آیا پسرم اضافه وزن دارد؟" :)))
یک جایی در اواسط کتاب نویسنده میگه زمانی که دادگاه سرگرم پژوهش درباره ممنوعیت سقط جنین بوده سراغ داده ها رفته و همونطور که حدس میزنه سرچ راه های غیرمجاز سقط در همون مناطق بالاتر رفته و عبارت هایی مثل : خرید اینترنتی قرص سقط جنین، قرص مجانی سقط جنین، چطور از چوب لباسی برای سقط جنین استفاده کنیم، و یا سقط جنین به کمک وایتکس! توی داده ها مشخص شده.
در همین بخش یک جمله ای هم هست که خیلی خوبه : به گفته ی مردم توجه نکن و فقط ببین در عمل چه میکنند. و با همین نتیجه گیری زمانیکه نتفیلکس به دوگانگی بین تمایل مردم به دیدن فیلم هایی که لیست کرده بودند اما هنگام یادآوری روش کلیک نمیکردن رسید نتیجه گرفت بجای پرسیدن علایق اشون بر اساس کلیک ها و بازدیدهای مشتریان بهشون فیلم معرفی کنه پس باید قبول کنیم : الگوریتم شما را بهتر از خودتان میشناسد.
داده ها و محتوای کتاب در مورد موضوعات متفاوتیه که در میان اون ها شباهت ادم ها و پرسش ذهنی اشون بهم، سوالات عجیب اما پر تکرار، سوالات و جست و جو های مشابه به هم در یک منطقه مکانی و جغرافیایی.. رو نشون میده :
و اینجوریه که در مورد اهمیت مردم به سلامتی اشون با توجه به سطح مالی و یا آینده ی فرزندانشون با توجه به مدارسی که توش درس خوندن میشه پیش بینی های دقیقی کرد....پس دیگه باید بپذیریم که در عصر داده های بزرگ، جهان ما به یک آزمایشگاه تبدیل شده است.
پانوشت : خلاصه و معرفی کلی از کتاب بود که اگر بخواید از طاقچه بخونید روی لینک زیر کلیک کنید :
مطلبی دیگر از این انتشارات
چالش کتابخوانی طاقچه: زمستان 62
مطلبی دیگر از این انتشارات
شازده کوچولو، فراتر از بعد زمان...
مطلبی دیگر از این انتشارات
چالش کتابخوانی طاقچه:چراغ سبزها