چالش کتابخوانی طاقچه: همه دروغ می‌گویند

کتاب «همه دروغ می‌گویند» نوشته ست استیونز دیویدویتس، ما را با نثر روان و ساده‌اش با کلان‌داده و استفاده‌های آن برای شناختن جهان، آشنا می‌کند.

بیگ دیتا یا کلان‌داده از امکاناتی است که دنیای مدرن برای ما فراهم کرده؛ روزانه هزاران هزار بایت اطلاعات در اینترنت می‌سازیم. با هر کلیک، هر جستوجوی گوگل، هر لایک و بازدید، ردی از خود به جا می‌گذاریم که ما را تعریف می‌کند. با صداقتی که هرگز در برابر پژوهشگران نخواهیم داشت.

در روش سنتی مطالعه رفتارهای فردی و جمعی انسان، اطلاعات از طریق پرسش‌نامه‌ها جمع‌آوری می‌شوند. اما اطلاعاتی که پرسش‌نامه‌ها به ما می‌دهند، چیزی است که مردم دوست دارند پرسش‌گر بداند و به او می‌گویند نه چیزی که انجام می‌دهند. نتایج این اطلاعات هم واقعیت درونی افراد را به ما نشان نمی‌دهد. افراد تمایل دارند تصویری از خود ارائه دهند که مقبولیت اجتماعی بیشتری می‌سازد. پس تصورات جامعه‌شناسان از رفتارهای افراد در جامعه هم متفاوت خواهد بود.

با انتخاب باراک اوباما به عنوان رییس‌جمهور امریکا، تصویری عبور کرده از نژادپرستی از جامعه آمریکا ساخته شد. مردم بارها در نظرسنجی‌ها اعلام کردند که نژاد و رنگ پوست تاثیری در انتخابشان برای ریاست جمهوری ندارد. اما بررسی‌های ست نشان می‌دهد که همزمان با انتخاب باراک اوباما سرچ‌های گوگل با کلمات نژادپرستانه در مورد او و سرچ‌های به طور کلی نژادپرستانه به شدت افزایش پیدا کرده، هم‌چنین بازدید و عضویت در یکی از انجمن‌های راست افراطی نژادپرستانه. در ایالت‌هایی با سرچ‌های نژادپرستی بیشتر، ارای اوباما کمتر از هم‌حزبی‌های سفیدپوستش رای آورده بود. کلان داده اطلاعاتی را به ما می‌دهد که انتظارشان را نداریم، و پنهانشان می‌کنیم.

اما ست می‌نویسد که تعریف دقیق کلان داده، کار ساده‌ای نیست. خروارها داده به‌تنهایی بینش ایجاد نمی‌کند، قدرت بیگ‌دیتا در این چهار چیز است:

•کلان‌داده انواع جدیدی از داده‌ها را عرضه می‌کند.

در مثال‌های متعددی در کتاب از اطلاعاتی استفاده شده که از سایت‌های هرزه‌نگاری جمع شده‌اند، محدوده‌ای که جامعه‌شناسان به ندرت از آن استفاده کرده‌اند. اما نرخ بازدید‌ها و سرچ‌های این سایت‌ها، با استفاده فراوانی که در دنیای امروز دارند، اطلاعات زیادی در خودش دارد. داده‌هایی که تا پیش از این نداشتیم، و نتیجه‌هایی که تا به حال نگرفته‌ایم.

•کلان‌داده داده‌های صادقانه فراهم می‌کند.

مردم در نظرسنجی‌ها و به دیگران دروغ می‌گویند. هرچه موضوع خجالت‌آورتر و خصوصی‌تر دروغ‌ها بیشتر. اما مردم به گوگل و پورن‌هاب دروغ نمی‌گویند، خیلی ساده چون ناشناس می‌مانند. کلا‌ن‌داده به ما چیزی که مردم می‌خواهند و می‌کنند را نشان می‌دهد نه چیزی را که می‌گویند می‌خواهند.

•کلان‌داده توانایی تمرکز بر زیرمجموعه‌های کوچکی از افراد را ایجاد می‌کند.

با بالارفتن حجم اطلاعات حتی برای بخش‌های کوچک جمعیت هم داده‌ها معنی‌دار می‌شوند. می‌توانیم حتی افرادی که خواب گوجه می‌بینند را با کسانی که خواب خیار می‌بینند مقایسه کنیم.

•کلان داده به ما اجازه می‌دهد ازمایش‌های علّی انجام بدهیم. و با آزمایشات سریع و کنترل شده به جای محدود شدن به روابط همبستگی، روابط علی معلولی را هم بسنجیم.

دنیای جدید، نیازمند نگاه‌های جدید است. کلان‌داده و مهندسی داده یا دیتا ساینس نگاه جدید ما در این دنیای جدید است. این کتاب با مثال‌های واقعی این نگاه جدید را به ما می‌شناساند. حوزه‌های مختلفی که مهندسی داده‌ها در ان کاربرد پیدا می‌کنند و بیشتر از همه استفاده ان در جامعه‌شناسی و شناخت خودمان را به ما نشان می‌دهد. پیش‌فرض‌های پذیرفته‌شده را زیر سوال می‌برد و نشان می‌دهد که آن چه فکر می‌کنیم همواره واقعیت ندارد.

این کتاب با ترجمه ریحانه عبدی از نشر گمان و شایان سادات از انتشارات خوب روی طاقچه است که نسخه نشر گمان متن کاملتری دارد و نسخه انتشارات خوب در سرویس بی‌نهایت قابل دسترسی است.

https://taaghche.com/book/63772