چرا باید کتاب «همه دروغ می‌گویند» را بخوانید

مطالعه‌ی این کتاب نه به این خاطر که درباره داده‌های بزرگ است، بلکه بیشتر به این خاطر که نشان داده چطور می‌توان از آن به عنوان یک راهکار نوآورانه و جسورانه برای حل مسائل کاربردی و پاسخ به پرسش‌های لاینحل استفاده کرد، برایم جذاب و هیجان‌برانگیز بود. مسائل و پرسش‌هایی که انسان تا به حال نتوانسته بود با روش‌های معمولِ علمی، جواب قانع‌کننده‌ای برای آنها بیابد. در این کتاب به چالش‌هایی پرداخته شده است که تا به حال یا نمی‌توانستیم با روشی علمی حل‌شان کنیم یا اینکه مجبور بودیم از روش‌هایی تقریبی و نامعتبر برای پاسخ به آنها استفاده کنیم. تمام کتاب حول این ادعای محوری می‌چرخد که داده‌های بزرگ، انقلاب بعدی تاریخ بشر است؛ و پربیراه نمی‌گوید.

این کتاب را سث استفنز نوشته‌ است. استفنز یک دانشمند داده است که در استنفورد و هاروارد فلسفه و اقتصاد هم خوانده، مدتی‌ در گوگل با بزرگ‌ترین داده‌های تاریخ بشر دست و پنجه نرم کرده و با رسانه‌های بزرگی مانند نیویرک تایمز برای یافتن پاسخ‌های مبتنی بر داده برای مسائل اجتماعی همکاری کرده است. کتاب «همه دروغ می‌گویند؛ اینترنت در مورد خود واقعی ما چه می‌گوید؟» اولین کتاب اوست.
این کتاب فعلاً توسط دو انتشارات شفاف (نسخه آنلاین در فیدیبو) و گمان (نسخه آنلاین در طاقچه) منتشر شده است. می‌توانید خلاصه این کتاب را در این اپیزود از پادکست بی‌پلاس گوش دهید.


جلد کتاب - نسخه‌ای که من از طریق فیدیبو خوانده‌ام
جلد کتاب - نسخه‌ای که من از طریق فیدیبو خوانده‌ام

ادعای اصلی این کتاب: انقلاب جدیدی در راه است

ادعای اصلی کتاب را شاید بتوان در این خلاصه کرد که عصر جدیدی در حوزه شناخت بهتر انسان شروع شده است. پارادایم جدیدی که برخلاف پاردایم قبلی که بر استقرا و تعمیم استوار بود، بر مشاهده همه داده‌ها، یا بیشینه‌ی آنها بنیان نهاده شده است. و علم داده‌های بزرگ، محرک اصلی این پارادایم جدید تحقیقاتی است.

برای مثال، دیگر نیاز نیست برای فهم چرخه عمر یک زبان به گزاره‌های کیفی مبتنی بر مثال رجوع کنیم. کافی‌ست تمام متون تاریخ را به یک برنامه تحلیل داده‌های بزرگ بدهیم تا او با تحلیل تمام داده‌های ثبت شده تاریخ آن زبان، به ما بگوید که داستان آن زبان چیست. یا ده‌ها مثال دیگر در حوزه‌های مختلف که در این کتاب گفته شده است.

همه دروغ می‌گویند ولی داده‌ها نه! این دومین پیام محوری کتاب است. شاید برای بیشتر جذاب شدن عنوان کتاب، نویسنده ترجیح داده فقط بخش اول آن را بنویسد و با بخش دومش سریع دست خودش را رو نکند ولی به نظر من اتفاقاً بخش دوم عنوان بهتری برای کتاب است.

این ادعا گرچه به نظر ساده می‌آید ولی واقعا یک ایده انقلابی را در خود پنهان کرده است. بسیاری از دانش موجود در علوم انسانی، اجتماعی، روانشناسی و حتی سلامتی بر اساس اطلاعاتی‌ست که افراد خود آنها را اظهار کرده‌اند یا بر اساس تفسیری‌ست که محقق از مشاهدات خود بیان کرده است. ولی این یک حقیقت روانشناسی‌ست که آدم‌ها اکثراً برخلاف آن چیزی که می‌گویند یا فکر می‌کنند، عمل می‌کنند. نکته انقلابی دقیقاً اینجاست؛ روز به روز دسترسی ما به داده‌های رفتاری انسان‌ها بیشتر و بیشتر می‌شود و حالا با تحلیل این حجم عظیم داده‌ها می‌توان فهمید مردم دقیقاً چطور رفتار می‌کنند و این رفتار چقدر با آنچه خود تا به حال می‌گفتند یا پنهان می‌کردند تطابق دارد.

بیشتر از مردم غیر از آنچیزی که می‌گویند فکر می‌کنند
بیشتر از مردم غیر از آنچیزی که می‌گویند فکر می‌کنند

کتابی که می‌خواهد انقلابی به پا کند

با وجود ادعای درست نویسنده درباره‌ی اهمیت داده‌ها، او بیشتر یک کتاب عامه‌پسندِ علمی نوشته است تا یک مرجع انقلابی. کتابی سرگرم‌کننده و مملو از یافته‌ها و حقایق جدیدی که شنیدن آنها هر انسانی را به وجد می‌آورد. حقایقی مفید که برای اولین بار در تاریخ می‌توان به آنها دست یافت.

کتاب ادعای بزرگ و درستی دارد که در خلال مثال‌ها، تحقیقات و تحلیل‌ها و یافته‌های مختلف آن را به لبه آگاهی ذهن خواننده می‌رساند. اینکه بسیاری از روش‌های سنتی تحقیقات در حوزه‌های عموماً انسانی مانند رفتارشناسی، جامعه‌شناسی، روان‌شناسی و حتی سلامتی به این خاطر توسعه یافته و فراگیر شده‌اند که ما نمی‌توانستیم داده‌های مرتبط با آنها را تک‌به‌تک از انسان‌ها جمع‌آوری کنیم. برای همین دانشمندان مجبور بودند به روش‌هایی که مبنای همه‌ی آنها نمونه‌گیری و بعد تعمیم نتیجه بر اساس آن بود، روی بیاورند. ولی آن دوران گذشته و حالا ما به مرور به همه‌ی داده‌ها دسترسی داریم و می‌توانیم به جای تمرکز روی نمونه‌هایی از داده‌ها، همه‌ی آنها را بررسی کرده و نتیجه‌گیری معتبری به دست آوریم. این چیزی نیست که ابزارهای نوین اطلاعاتی به تازگی برای‌مان میسر کرده باشند بلکه سال‌هاست این داده‌ها به روش‌های مختلف ذخیره شده و در حال نگهداری هستند.

نویسنده دوست دارد -کما اینکه در انتهای کتاب هم آن را آشکارا بیان می‌کند- این کتاب یک کتاب انقلابی در این عرصه باشد، همه توجه‌ها را به خود جلب کند و فضا را برای تغییر پاردایم آماده کند. برای همین تا جایی که توانسته از بیان روش‌ها و تکنیک‌ها دوری کرده و همه‌ی فصل‌های کتاب را مملو از یافته‌های تحلیلی کرده است. اکثراً موضوعات مناقشه‌برانگیز یا باورهای بدیهی را انتخاب کرده و اغلب به نتایجی دور از انتظار رسیده است.

با خواندن کتاب شما به خوبی قدرت پشت داده‌های بزرگ و تحلیل آنها را درک خواهید کرد، ولی بعید است به جز دو سه مورد بسیار آشکار، آنقدر چیزی یاد گرفته باشید که بتوانید همان کارها را تکرار کنید. در واقع کتاب، به جای رویکرد آموزشی، روی آگاه‌سازی و موج‌سازی تمرکز کرده است. بنابراین انتظار نداشته باشید با خواندن این کتاب یک دانشمند داده‌های بزرگ شوید.

این رویکرد کتاب برای عموم مردم بسیار دلپذیر است ولی برای مخاطب متخصص آورده‌‌ی خاصی ندارد. من انتظار داشتم حداقل بخش‌هایی از کتاب، نویسنده بیشتر و فنی‌تر به بیان روش و تکنیک‌های مرتبط با تحلیل داده‌های بزرگ با همان رویکردی که دارد پرداخته باشد و نبودِ حداقلِ چنین آموزه‌هایی با توجه به انتظار اولیه من، ناامیدکننده بود. این کتاب حتی اسم یک ابزار را هم نیاورده است. هیچ صبحتی در مورد چارچوب فنی تحلیل هدفمند ابرداده‌ها ارائه نداده است. گاه آنقدر در بیان نتایج و تحقیقات مختلف عجول است که انگار نیازی به توضیح مبانی علمی تحلیل نمی‌بیند و به همراهی مخاطب اطمینان دارد.

ما در حال نوشتن تاریخ هستیم!

محتوای این کتاب یکی از محتمل‌ترین پیش‌بینی‌ها در مورد دوران جدید است؛ دورانی نه مربوط به آینده بلکه دورانی که سال‌هاست شروع شده و همچون یک ابَرترند به آرامی در حال رشد است. آنقدر در زندگی‌مان تنیده شده که متوجه حضورش نیستیم. همه‌ی ما حجم عظیمی از داده‌ها را از خود به جا می‌گذاریم. همین‌قدر عجیب که از وقتی یک گوشی موبایل فعال در دستان شماست، برای من از ۱۵ سال پیش، تمام جاهایی که به آن رفته‌اید، زمان رفتن، و ... در پایگاه داده‌ها ثبت شده است. با کنار هم قرار دادن داده‌های تمام انسان‌ها به راحتی می‌توان با دقت بالایی مشخص کرد شما دقیقا در چه تاریخ و ساعتی با چه کسی یا کسانی، کجا ملاقات داشتید. می‌توان ابرالگوی جابجایی انسان‌ها را به تفکیک جغرافیا، دموگرافی و در همبستگی با بقیه داده‌های تاریخی مربوط به تحولات اجتماعی، طبیعی،‌ اقتصادی و ... قرار داد و دینامیک جوامع بشری را استنتاج کرد. دانشی که تا قبل از این آنقدر دور از دسترس به نظر می‌رسید که به قول پوپر ابطال‌ناپذیر بود و تنها فیلسوفانی در برج عاج نشسته بر اساس مطالعات محدود و تاملات شخصی و مشاهدات منطقه‌ای درباره‌ی آن حرف می‌زدند و داستان‌هایی مثل کمون می‌ساختند. ولی حالا ما به روشی علمی و ابطال‌پذیر دست پیدا کرده‌ایم که در مورد چیزهایی‌ست که قبلاً نمی‌توانستیم درباره‌شان حرفی بزنیم.

آیندگان تاریخ را از روی حجم بی‌کران داده‌هایی که ما در زندگی روزمره‌مان در اینترنت به جا می‌گذاریم، خواهند نوشت و خواهند خواند. این معتبرترین روایت تمدنی بشری خواهد بود. روایتی آنقدر صریح، دقیق و با جزئیات کامل که هیچ روایت قدرت‌مآبانه‌ای امکان تخطئه آن را نخواهد داشت. ما در حال نوشتن تاریخ هستیم.

حالا باید فهمیده باشید در هر حوزه‌ای که هستید و آینده خود را در هر فضایی که ترسیم می‌کنید چرا باید این کتاب را بخوانید؛ چون قبل از شما داده‌های بزرگ آنجا هستند. برای همین به نظرم باید این کتاب را خواند. گرچه این کتاب، کتاب مقدس و این نویسنده پیامبر دوران جدید نخواهند بود ولی پیشگویی‌های آن قطعاً به زودی مبنای دین جدیدی در علم خواهد شد: شریعت ابرداده‌ها

طرح جلد اصلی کتاب به زبان انگلیسی
طرح جلد اصلی کتاب به زبان انگلیسی



روندهای ایران

همسو با رویکرد کتاب در تحلیل داده‌های بزرگ، برای شناخت بهتر روندهای اجتماعی در ایران، تا به حال چندین مطلب نوشته‌ام که همه‌ی آنها را در انتشارات زیر می‌توانید بخوانید:

https://virgool.io/irantrends

سایر نوشته‌هایم #درباره_یک_کتاب

http://vrgl.ir/vrVUI
http://vrgl.ir/H9kIs
Photo by Joël de Vriend on Unsplash