نگرش های نوین برای حل مسائل دنیای واقعی در حوزههای روشهای تحلیلی کسبوکار، هوش تجاری، دادهکاوی، مدیریت عملیات و تصمیمگیری. Website:http://analica.ir/
ماجرای اخیر درز اطلاعات فیسبوک چیست؟
داستان درز اطلاعات کاربران فیسبوک و استفاده شرکت کمبریج آنالتیکا برای کمک به پیروزی دونالد ترامپ در انتخابات ریاست جمهوری آمریکا سال 2016 جنبههای متنوع و بسیار جالبی دارد. انتشار این ماجرا موجب شد کمپین قدرتمندی که افراد را به حذف اکانت کاربریشان تشویق میکند (DeleteFacebook#)، به راه بیفتد. بر اساس محاسباتم تنها در عرض هفته گذشته (بین 16 تا 23 مارچ 2018) شرکت فیسبوک در بازار سهام بیش از 70 میلیارد دلار ارزش از دست داده است.
اما نکته هیجانانگیزتر که شاید کمتر بحث میشود این که شرکت کمبریج آنالتیکا از اطلاعات بهدستآمده چگونه استفاده کرده؟ آنچه کمبریج آنالتیکا انجام داده بهنوعی بازتاب قدرت روشهای محاسباتی در علوم اجتماعی، روانشناسی و کسبوکار است.
سالها در علوم سیاسی، بازاریابی و روانشناسی برای پیشبینی رفتارهای افراد از متغیرهای جمعیت شناختی مثل سن، جنسیت، تحصیلات، محل سکونت و مانند اینها استفاده شده است. برای مثال در دوران انتخابات چنین تحلیلهایی را میشنویم که مردم شهر تهران بیشتر به کاندیدای الف رأی میدهند درحالیکه مردم شهر مشهد بیشتر طرفدار کاندیدای ب هستند. اما این پیشبینیها چقدر دقیق هستند؟ آیا همه ساکنان شهر تهران دارای یک طرز فکر هستند؟
آیا میتوان افراد را به شکل دقیقتری و بر اساس المانهای روانشناختی دستهبندی و شناسایی کرد؟ و متناسب باشخصیت هر کس پیامهای انتخاباتی را سفارشی کرد؟ برای مثال اگر کسی محافظهکار است، پیامهای محافظهکارانه را برای او پررنگ کرد؟ اینجاست که کمبریج آنالتیکا یک ابزار کاملاً جدید در اختیار دونالد ترامپ قرار میدهد.
الکساندر کوگان، استاد روانشناسی دانشگاه کمبریج، به منظور یک کار تحقیقاتی در سال 2014 یک اپلیکیشن تست شخصیت در فضای فیسبوک طراحی میکند و نزدیک به 270 هزار کاربر آمریکایی فیسبوک به شکل داوطلبانه از آن استفاده میکنند. جنبه کمتر روشن ماجرا این است که این اپلیکشن علاوه بر دادههای کسانی که تست را داده بودند، دادههای دوستان آنها را بدون اطلاعشان جمع میکرده است. اگر فرض کنیم هر فردی 200 دوست داشته است، آنها به دادههای نزدیک به 50 میلیون نفر دسترسی داشتهاند. ظاهراً تا اینجا، کار خلافی بر اساس قوانین داخلی آن زمان فیسبوک صورت نگرفته است.
اما الکساندر کوگان در نهایت این دادهها را به شرکت دیگری به نام کمبریج آنالتیکا میفروشد. این کار ظاهراً برخلاف قوانین فیسبوک است که دادههای کاربران فیسبوک نباید به شرکتهای تبلیغاتی و یا واسطهگری داده فروخته شود. اما نکته مهم اینکه کمبریج آنالتیکا تنها مشخصات روانشناختی 270 هزار نفر را داشته و 50 میلیون نفر دیگر این تست را نداده بودند. اینجاست که با روشهای مبتنی بر ماشینهای یادگیرنده، مهندسی معکوس صورت گرفته است. با داشتن تست روانشناسی یک نمونه 270 هزارنفری و تطبیق آن با رفتار آنها در شبکههای اجتماعی، کمبریج آنالتیکا احتمالاً موفق شده مدل ریاضی بسازد که میتوانسته بر اساس آنچه افراد در شبکه اجتماعی انجام میدهند مشخصات روانشناسی آنان را معین کند. بهمرور این الگوریتم یاد گرفته که اگر مثلا فردی عکس غروب خورشید را لایک میکند نسبت به آنکه یک گل آفتابگردان در روز روشن را لایک میکند در کدام دسته شخصیتی قرار میگیرد. بهاینترتیب آنها با استفاده از این الگوریتم مشخصات روانشناختی 50 میلیون آمریکایی دیگر را پیدا کردند. به ادعای خود کمبریج آنالتیکا، آنها تنها با تحلیل 300 لایک، شخصیت فرد را بهاندازه همسرش میشناسند.
با داشتن این پروفایلها، کمبریج آنالتیکا شروع به تهیه تمهای مختلف تبلیغاتی راجع به مسائل موردبحث در انتخابات مانند سیاستهای مهاجرتی، اقتصاد، مالکیت اسلحه و غیره و سفارشی کردن آن برای مخاطبان و عرضه آن در فیسبوک کرده است. اگر درگذشته همه افراد از تلویزیون یک کاندیدای ریاست جمهوری را با پیامهای مشخصی میدیدند، کمبریج آنالتیکا کاری میکند که هر کس متناسب با علایقش آن جنبه از ترامپ را که دوست دارد، ببیند!
شواهدی در دست نیست که آیا هیلاری کلینتون هم مجهز به چنین ابزاری بوده است یا خیر. ولی اگر تنها ترامپ دارای چنین ابزاری بوده باشد، مقایسه هزینههای تبلیغاتی کلینتون (نزدیک به یک میلیارد دلار) در مقابل ترامپ (نزدیک به 600 میلیون دلار) در کنار نتیجه انتخابات میتواند شاهدی بر کارآیی ابزارهای مورد استفاده کمپین او باشد.
در نهایت اینکه این ماجرا دوباره بحثها پیرامون پروتکلهای استفاده از دادهها، اخلاق در دادهکاوی و قدرت روشهای تحلیلی در علوم اجتماعی و کسب و کار را داغ کرده است. اما چیزی که واضح است این که استفاده از روشهای داده محور جعبه پاندورایی است که باز شده و باید منتظر بروز جنبه های آن در حوزه های مختلف بود.
?در رابطه با امنیت اطلاعات در فضای مجازی مقاله زیر را در آنالیکا بخوانید:
مطلبی دیگر از این انتشارات
الگوریتم های فراابتکاری و داده کاوی
مطلبی دیگر از این انتشارات
شبکه عصبی بازگشتی (Recurrent Neural Networks)
مطلبی دیگر از این انتشارات
مجموعه کاملی از فوت و فن های کار با Jupyter Notebook - بخش 1/4