احتمالاً تنها کاری که بلدم خوندن و نوشتن. همه چیز رو میخونم و از همه چیز مینویسم.
چالش کتابخوانی طاقچه: همه دروغ میگویند
کتاب «همه دروغ میگویند» نوشته ست استیونز دیویدویتس، ما را با نثر روان و سادهاش با کلانداده و استفادههای آن برای شناختن جهان، آشنا میکند.
بیگ دیتا یا کلانداده از امکاناتی است که دنیای مدرن برای ما فراهم کرده؛ روزانه هزاران هزار بایت اطلاعات در اینترنت میسازیم. با هر کلیک، هر جستوجوی گوگل، هر لایک و بازدید، ردی از خود به جا میگذاریم که ما را تعریف میکند. با صداقتی که هرگز در برابر پژوهشگران نخواهیم داشت.
در روش سنتی مطالعه رفتارهای فردی و جمعی انسان، اطلاعات از طریق پرسشنامهها جمعآوری میشوند. اما اطلاعاتی که پرسشنامهها به ما میدهند، چیزی است که مردم دوست دارند پرسشگر بداند و به او میگویند نه چیزی که انجام میدهند. نتایج این اطلاعات هم واقعیت درونی افراد را به ما نشان نمیدهد. افراد تمایل دارند تصویری از خود ارائه دهند که مقبولیت اجتماعی بیشتری میسازد. پس تصورات جامعهشناسان از رفتارهای افراد در جامعه هم متفاوت خواهد بود.
با انتخاب باراک اوباما به عنوان رییسجمهور امریکا، تصویری عبور کرده از نژادپرستی از جامعه آمریکا ساخته شد. مردم بارها در نظرسنجیها اعلام کردند که نژاد و رنگ پوست تاثیری در انتخابشان برای ریاست جمهوری ندارد. اما بررسیهای ست نشان میدهد که همزمان با انتخاب باراک اوباما سرچهای گوگل با کلمات نژادپرستانه در مورد او و سرچهای به طور کلی نژادپرستانه به شدت افزایش پیدا کرده، همچنین بازدید و عضویت در یکی از انجمنهای راست افراطی نژادپرستانه. در ایالتهایی با سرچهای نژادپرستی بیشتر، ارای اوباما کمتر از همحزبیهای سفیدپوستش رای آورده بود. کلان داده اطلاعاتی را به ما میدهد که انتظارشان را نداریم، و پنهانشان میکنیم.
اما ست مینویسد که تعریف دقیق کلان داده، کار سادهای نیست. خروارها داده بهتنهایی بینش ایجاد نمیکند، قدرت بیگدیتا در این چهار چیز است:
•کلانداده انواع جدیدی از دادهها را عرضه میکند.
در مثالهای متعددی در کتاب از اطلاعاتی استفاده شده که از سایتهای هرزهنگاری جمع شدهاند، محدودهای که جامعهشناسان به ندرت از آن استفاده کردهاند. اما نرخ بازدیدها و سرچهای این سایتها، با استفاده فراوانی که در دنیای امروز دارند، اطلاعات زیادی در خودش دارد. دادههایی که تا پیش از این نداشتیم، و نتیجههایی که تا به حال نگرفتهایم.
•کلانداده دادههای صادقانه فراهم میکند.
مردم در نظرسنجیها و به دیگران دروغ میگویند. هرچه موضوع خجالتآورتر و خصوصیتر دروغها بیشتر. اما مردم به گوگل و پورنهاب دروغ نمیگویند، خیلی ساده چون ناشناس میمانند. کلانداده به ما چیزی که مردم میخواهند و میکنند را نشان میدهد نه چیزی را که میگویند میخواهند.
•کلانداده توانایی تمرکز بر زیرمجموعههای کوچکی از افراد را ایجاد میکند.
با بالارفتن حجم اطلاعات حتی برای بخشهای کوچک جمعیت هم دادهها معنیدار میشوند. میتوانیم حتی افرادی که خواب گوجه میبینند را با کسانی که خواب خیار میبینند مقایسه کنیم.
•کلان داده به ما اجازه میدهد ازمایشهای علّی انجام بدهیم. و با آزمایشات سریع و کنترل شده به جای محدود شدن به روابط همبستگی، روابط علی معلولی را هم بسنجیم.
دنیای جدید، نیازمند نگاههای جدید است. کلانداده و مهندسی داده یا دیتا ساینس نگاه جدید ما در این دنیای جدید است. این کتاب با مثالهای واقعی این نگاه جدید را به ما میشناساند. حوزههای مختلفی که مهندسی دادهها در ان کاربرد پیدا میکنند و بیشتر از همه استفاده ان در جامعهشناسی و شناخت خودمان را به ما نشان میدهد. پیشفرضهای پذیرفتهشده را زیر سوال میبرد و نشان میدهد که آن چه فکر میکنیم همواره واقعیت ندارد.
این کتاب با ترجمه ریحانه عبدی از نشر گمان و شایان سادات از انتشارات خوب روی طاقچه است که نسخه نشر گمان متن کاملتری دارد و نسخه انتشارات خوب در سرویس بینهایت قابل دسترسی است.
مطلبی دیگر از این انتشارات
چالش کتابخوانی طاقچه: پیرمرد و دریا
مطلبی دیگر از این انتشارات
چالش کتابخوانی طاقچه: مغازه خودکشی
مطلبی دیگر از این انتشارات
چالش کتابخوانی طاقچه: هنر شفاف اندیشیدن