نقد کتاب همه دروغ میگویند؛اثر خواندنی در مورد کلان داده

این چند وقت یک کتاب خوبی که خوندم کتاب همه دروغ می گویند (Everybody Lies:big data,new data) بود که اثر جالب از ست استوینز و دیوید ویتس است شاهد هستیم ،ست استویز که خود مدتی در گوگل کار کرده در این کتاب قصد دارد راز پنهان فعالیت جامعه در اینترنت بازگو کند در اصل چیزی که بارها با کتاب روبه رو میشوید این است که ما فقط با موتور جستجو راستگو هستیم هر زمان که دردی داریم احتمال اینکه راجب آن با مادر یا دوستمان حرف بزنیم خیلی کم است اما واقعیت برای گفتن به گوگل هر حرفی میزنیم احتمالا نگران قضاوت گوگل نیستم !

در این کتاب مثال های متنوعی زده میشود که در واقع اوایل کتاب شما با این فرضیه روبه رو میشوید خوب گفتن این حجم از اطلاعات به چه درد می خورد؟ نکته مهم در آن است که ما با واقعیت رو به رو میشویم در واقع حتما شما پرسش نامه های مختلفی تجربه دارید اکثر ما به این پرسش ها جواب درستی نمی دادیم اما احتمالا در گوگل با سوالاتی محرمانه و شخصی تری اطلاعات میدهیم اهمیت این موضوع آنجا است که کارشناسان داده کاوی می توانند با جمع آوری این اطلاعات در تجربه بهتر نرم افزار خود استفاده کنند برای مثال فرض کنید شما میخواهید علاقه اشخاص به تیم فوتبال خاصی بررسی کنید اینکار در شرایط عمومی کمی سخت است اما احتمالا با گرفتن داده از وبسایت های باشگاه ها و جستجو های طرفداران رشد هواداران تیم های مختلف بررسی و مشخص کنید .

بگذارید یک مثال ساده از خو دکتاب بزنم که واقعا خیلی برام جالب بود از نظر شما مردم چه روزهای به دنبال جوک در اینترنت می گردند؟ روزهای غمگین و کسالت بار ، به نظر جواب درستی است اما نگاهی به آمار کنیم در آمریکا بعد از تراژدی بمب گذاری بوستون در 2013 جستجو جوک به کمترین میزان خود رسید اما برعکس در روز شلوغی مثل دوشنبه آمار جستجو جوک به بالاترین جستجو می رسد .

این عادت دروغ گفتن کار به موارد جنسی هم برده است در کتاب از اشتباهات نوشتاری رایج که انگیسی زبان ها دارند تا استفاده از داده های پورن هاب برای رسیدن به نگاه مردم و این واقعا عجیب است تقریبا در هیچ پرسش نامه من بعید می دانم کسی به اشتیاق به زنا با محارم یا سکس چت را اعلام کند ولی انگار داده های پورن هاب واقعیت را افشا میکند.

داده های پورن هاب و گوگل
داده های پورن هاب و گوگل

به نظر من این اطلاعات هر چقدر هم عجیب باشند اما اینکه ما می توانیم آنها تحلیل کنیم و ببینیم که مردم برایشان چه چیزی جذاب است می توانند به همه ما کمک کند در واقع می توان داده های شبکه های اجتماعی مثل یک تلسکوپ تشبیه کرد که اگر دقت کنید می توانید چیزهای بیشتری از آنچه که با چشم نگاه می کنید پیدا کنید به نظر جهان جالبی میاد !

یکی از دیگر نمونه های کتاب نمایش فیلم های خشن و تاثیر گذاری بر خشونت مردم داشت که شواهد نشان داد تاثیری روی خشونت افراد و مصرف بیش از حد الکل نداشته است

اکثر این آمار با گوگل ترند و البته سرویس گوگل ادز به دست آماده بخشی از اطلاعات هم توسط الگوریتم که خود نویسنده طراحی کرده پیاده سازی شده است،ترجمه که من خوندم هم از نشر گمان و ریحانه عبدی بود که واقعا ترجمه روان و خوبی بود میتوانید از طاقچه هم نسخه ایبوک خریداری کنید اگر ترجمه دیگری دوست دارید بخونید میتونید از فیدیبو تهیه کنید در نهایت اگر علاقه به دیدن سورس کدها و داده های بیشتری هستید به وبلاگ استوینز حتما نگاهی کنید .

این کتاب بهم پیشنهاد میکنی ؟

نگاه کنید دلیل جذابیت این کتاب قطعا مثال های متنوع بود با توجه به علاقه ای که به هوش مصنوعی دارم خوندش برام جذاب بود به خصوص فصل های آخر اما ایرادتی هم به کتاب وارد هست از مثال های سطحی که ممکن است برایتان جذاب نباشد اما به طور کلی خوندن این کتاب بد نیست .

نویسنده این کتاب چه کسی هست ؟

ست استوینز به عنوان مهندس داده کاوی در گوگل مدتی کار کرده و تحصیلات خودش با اقتصاد و بعد علوم داده در هاروارد تمام کرد علاقه استوینز به داده کاوی موجب شد تز دکترا خود با موضوعی کلان داده بنویسد استوینز همچنین نوسینده سایت های نیویورک تایمز و گاردین هم بوده و میتوانید مطالب او بخوانید این کتاب زیر نظر استیون پینکر دوست داشتنی هم به چاپ رسیده .