مشاهدات کسی که به تماشا ایستاده | تحلیلگر داده
چرا باید کتاب «همه دروغ میگویند» را بخوانید
مطالعهی این کتاب نه به این خاطر که درباره دادههای بزرگ است، بلکه بیشتر به این خاطر که نشان داده چطور میتوان از آن به عنوان یک راهکار نوآورانه و جسورانه برای حل مسائل کاربردی و پاسخ به پرسشهای لاینحل استفاده کرد، برایم جذاب و هیجانبرانگیز بود. مسائل و پرسشهایی که انسان تا به حال نتوانسته بود با روشهای معمولِ علمی، جواب قانعکنندهای برای آنها بیابد. در این کتاب به چالشهایی پرداخته شده است که تا به حال یا نمیتوانستیم با روشی علمی حلشان کنیم یا اینکه مجبور بودیم از روشهایی تقریبی و نامعتبر برای پاسخ به آنها استفاده کنیم. تمام کتاب حول این ادعای محوری میچرخد که دادههای بزرگ، انقلاب بعدی تاریخ بشر است؛ و پربیراه نمیگوید.
این کتاب را سث استفنز نوشته است. استفنز یک دانشمند داده است که در استنفورد و هاروارد فلسفه و اقتصاد هم خوانده، مدتی در گوگل با بزرگترین دادههای تاریخ بشر دست و پنجه نرم کرده و با رسانههای بزرگی مانند نیویرک تایمز برای یافتن پاسخهای مبتنی بر داده برای مسائل اجتماعی همکاری کرده است. کتاب «همه دروغ میگویند؛ اینترنت در مورد خود واقعی ما چه میگوید؟» اولین کتاب اوست.
این کتاب فعلاً توسط دو انتشارات شفاف (نسخه آنلاین در فیدیبو) و گمان (نسخه آنلاین در طاقچه) منتشر شده است. میتوانید خلاصه این کتاب را در این اپیزود از پادکست بیپلاس گوش دهید.
ادعای اصلی این کتاب: انقلاب جدیدی در راه است
ادعای اصلی کتاب را شاید بتوان در این خلاصه کرد که عصر جدیدی در حوزه شناخت بهتر انسان شروع شده است. پارادایم جدیدی که برخلاف پاردایم قبلی که بر استقرا و تعمیم استوار بود، بر مشاهده همه دادهها، یا بیشینهی آنها بنیان نهاده شده است. و علم دادههای بزرگ، محرک اصلی این پارادایم جدید تحقیقاتی است.
برای مثال، دیگر نیاز نیست برای فهم چرخه عمر یک زبان به گزارههای کیفی مبتنی بر مثال رجوع کنیم. کافیست تمام متون تاریخ را به یک برنامه تحلیل دادههای بزرگ بدهیم تا او با تحلیل تمام دادههای ثبت شده تاریخ آن زبان، به ما بگوید که داستان آن زبان چیست. یا دهها مثال دیگر در حوزههای مختلف که در این کتاب گفته شده است.
همه دروغ میگویند ولی دادهها نه! این دومین پیام محوری کتاب است. شاید برای بیشتر جذاب شدن عنوان کتاب، نویسنده ترجیح داده فقط بخش اول آن را بنویسد و با بخش دومش سریع دست خودش را رو نکند ولی به نظر من اتفاقاً بخش دوم عنوان بهتری برای کتاب است.
این ادعا گرچه به نظر ساده میآید ولی واقعا یک ایده انقلابی را در خود پنهان کرده است. بسیاری از دانش موجود در علوم انسانی، اجتماعی، روانشناسی و حتی سلامتی بر اساس اطلاعاتیست که افراد خود آنها را اظهار کردهاند یا بر اساس تفسیریست که محقق از مشاهدات خود بیان کرده است. ولی این یک حقیقت روانشناسیست که آدمها اکثراً برخلاف آن چیزی که میگویند یا فکر میکنند، عمل میکنند. نکته انقلابی دقیقاً اینجاست؛ روز به روز دسترسی ما به دادههای رفتاری انسانها بیشتر و بیشتر میشود و حالا با تحلیل این حجم عظیم دادهها میتوان فهمید مردم دقیقاً چطور رفتار میکنند و این رفتار چقدر با آنچه خود تا به حال میگفتند یا پنهان میکردند تطابق دارد.
کتابی که میخواهد انقلابی به پا کند
با وجود ادعای درست نویسنده دربارهی اهمیت دادهها، او بیشتر یک کتاب عامهپسندِ علمی نوشته است تا یک مرجع انقلابی. کتابی سرگرمکننده و مملو از یافتهها و حقایق جدیدی که شنیدن آنها هر انسانی را به وجد میآورد. حقایقی مفید که برای اولین بار در تاریخ میتوان به آنها دست یافت.
کتاب ادعای بزرگ و درستی دارد که در خلال مثالها، تحقیقات و تحلیلها و یافتههای مختلف آن را به لبه آگاهی ذهن خواننده میرساند. اینکه بسیاری از روشهای سنتی تحقیقات در حوزههای عموماً انسانی مانند رفتارشناسی، جامعهشناسی، روانشناسی و حتی سلامتی به این خاطر توسعه یافته و فراگیر شدهاند که ما نمیتوانستیم دادههای مرتبط با آنها را تکبهتک از انسانها جمعآوری کنیم. برای همین دانشمندان مجبور بودند به روشهایی که مبنای همهی آنها نمونهگیری و بعد تعمیم نتیجه بر اساس آن بود، روی بیاورند. ولی آن دوران گذشته و حالا ما به مرور به همهی دادهها دسترسی داریم و میتوانیم به جای تمرکز روی نمونههایی از دادهها، همهی آنها را بررسی کرده و نتیجهگیری معتبری به دست آوریم. این چیزی نیست که ابزارهای نوین اطلاعاتی به تازگی برایمان میسر کرده باشند بلکه سالهاست این دادهها به روشهای مختلف ذخیره شده و در حال نگهداری هستند.
نویسنده دوست دارد -کما اینکه در انتهای کتاب هم آن را آشکارا بیان میکند- این کتاب یک کتاب انقلابی در این عرصه باشد، همه توجهها را به خود جلب کند و فضا را برای تغییر پاردایم آماده کند. برای همین تا جایی که توانسته از بیان روشها و تکنیکها دوری کرده و همهی فصلهای کتاب را مملو از یافتههای تحلیلی کرده است. اکثراً موضوعات مناقشهبرانگیز یا باورهای بدیهی را انتخاب کرده و اغلب به نتایجی دور از انتظار رسیده است.
با خواندن کتاب شما به خوبی قدرت پشت دادههای بزرگ و تحلیل آنها را درک خواهید کرد، ولی بعید است به جز دو سه مورد بسیار آشکار، آنقدر چیزی یاد گرفته باشید که بتوانید همان کارها را تکرار کنید. در واقع کتاب، به جای رویکرد آموزشی، روی آگاهسازی و موجسازی تمرکز کرده است. بنابراین انتظار نداشته باشید با خواندن این کتاب یک دانشمند دادههای بزرگ شوید.
این رویکرد کتاب برای عموم مردم بسیار دلپذیر است ولی برای مخاطب متخصص آوردهی خاصی ندارد. من انتظار داشتم حداقل بخشهایی از کتاب، نویسنده بیشتر و فنیتر به بیان روش و تکنیکهای مرتبط با تحلیل دادههای بزرگ با همان رویکردی که دارد پرداخته باشد و نبودِ حداقلِ چنین آموزههایی با توجه به انتظار اولیه من، ناامیدکننده بود. این کتاب حتی اسم یک ابزار را هم نیاورده است. هیچ صبحتی در مورد چارچوب فنی تحلیل هدفمند ابردادهها ارائه نداده است. گاه آنقدر در بیان نتایج و تحقیقات مختلف عجول است که انگار نیازی به توضیح مبانی علمی تحلیل نمیبیند و به همراهی مخاطب اطمینان دارد.
ما در حال نوشتن تاریخ هستیم!
محتوای این کتاب یکی از محتملترین پیشبینیها در مورد دوران جدید است؛ دورانی نه مربوط به آینده بلکه دورانی که سالهاست شروع شده و همچون یک ابَرترند به آرامی در حال رشد است. آنقدر در زندگیمان تنیده شده که متوجه حضورش نیستیم. همهی ما حجم عظیمی از دادهها را از خود به جا میگذاریم. همینقدر عجیب که از وقتی یک گوشی موبایل فعال در دستان شماست، برای من از ۱۵ سال پیش، تمام جاهایی که به آن رفتهاید، زمان رفتن، و ... در پایگاه دادهها ثبت شده است. با کنار هم قرار دادن دادههای تمام انسانها به راحتی میتوان با دقت بالایی مشخص کرد شما دقیقا در چه تاریخ و ساعتی با چه کسی یا کسانی، کجا ملاقات داشتید. میتوان ابرالگوی جابجایی انسانها را به تفکیک جغرافیا، دموگرافی و در همبستگی با بقیه دادههای تاریخی مربوط به تحولات اجتماعی، طبیعی، اقتصادی و ... قرار داد و دینامیک جوامع بشری را استنتاج کرد. دانشی که تا قبل از این آنقدر دور از دسترس به نظر میرسید که به قول پوپر ابطالناپذیر بود و تنها فیلسوفانی در برج عاج نشسته بر اساس مطالعات محدود و تاملات شخصی و مشاهدات منطقهای دربارهی آن حرف میزدند و داستانهایی مثل کمون میساختند. ولی حالا ما به روشی علمی و ابطالپذیر دست پیدا کردهایم که در مورد چیزهاییست که قبلاً نمیتوانستیم دربارهشان حرفی بزنیم.
آیندگان تاریخ را از روی حجم بیکران دادههایی که ما در زندگی روزمرهمان در اینترنت به جا میگذاریم، خواهند نوشت و خواهند خواند. این معتبرترین روایت تمدنی بشری خواهد بود. روایتی آنقدر صریح، دقیق و با جزئیات کامل که هیچ روایت قدرتمآبانهای امکان تخطئه آن را نخواهد داشت. ما در حال نوشتن تاریخ هستیم.
حالا باید فهمیده باشید در هر حوزهای که هستید و آینده خود را در هر فضایی که ترسیم میکنید چرا باید این کتاب را بخوانید؛ چون قبل از شما دادههای بزرگ آنجا هستند. برای همین به نظرم باید این کتاب را خواند. گرچه این کتاب، کتاب مقدس و این نویسنده پیامبر دوران جدید نخواهند بود ولی پیشگوییهای آن قطعاً به زودی مبنای دین جدیدی در علم خواهد شد: شریعت ابردادهها
روندهای ایران
همسو با رویکرد کتاب در تحلیل دادههای بزرگ، برای شناخت بهتر روندهای اجتماعی در ایران، تا به حال چندین مطلب نوشتهام که همهی آنها را در انتشارات زیر میتوانید بخوانید:
سایر نوشتههایم #درباره_یک_کتاب
Photo by Joël de Vriend on Unsplash
مطلبی دیگر از این انتشارات
کگل( Kaggle) چیست؟_ قسمت اول
مطلبی دیگر از این انتشارات
هوش تجاری در حال تحول کسبوکارهاست
مطلبی دیگر از این انتشارات
پردازش تصویر ( سیستم تشخیص پلاک خودرو ) + پایتون