نقطه.
نقطه.
خواندن ۷ دقیقه·۴ سال پیش

دیکتاتوری داده ها¹

کلان‌داده به داده‌هایی گفته می‌شود که به سرعت و در حجم‌های بزرگ تولید شده و دارای پیچیدگی‌های فراوانی هستند به نحوی که با روش‌های سنتی تحلیل داده قابل بررسی نیستند. از کلان‌داده‌ها برای بهبود روش‌ها و فرایند‌ها و ارتقای بینش در یک سازمان یا نهاد سیاسی استفاده می‌شود؛ تحلیل کلان داده تاثیر عمیقی بر ما و جهان اطراف ما می‌گذارد. این گستره از پیشنهاد دادن محصولات به مشتریان در سایت‌ها و شبکه‌های اجتماعی تا انتخاب قدرتمندترین مقام سیاسی جهان را شامل می‌شود. تجزیه و تحلیل داده‌ها به کارزار‌های انتخاباتی کمک می‌کند تا رای دهندگان را بهتر درک کنند و با احساسات آنها همسو شوند.

کارزار انتخاباتی اوباما در سال 2008 از اولین کارزار‌هایی بود که برای پیروزی در یک انتخابات از تحلیل و پیش‌بینی به روش داده محور بهره برد. تیمی که در کارزار اوباما بر تحلیل کلان داده کار می‌کرد شامل 100 نفر بود، اما در انتخابات 2016 آمریکا، داده‌ها نقشی اساسی‌تر ایفا کردند تا جایی که از آنها به عنوان نیرویی کلیدی برای پیروزی در انتخابات یاد شده است. اما سوال اینجاست که آیا کلان داده این قدرت را دارد که نتیجه انتخابات را تغییر دهد؟ در سال 2016 اکثر سایت‌های نظرسنجی از برتری 70 درصدی هیلاری کلینتون بر دونالد ترامپ خبر می‌دادند اما هنوز نتیجه انتخابات قطعی نبود. آنچه در عمل اتفاق افتاد این بود که در واقع این نظرسنجی باعث تقویت کارزار ترامپ و متحد شدن جمهوری خواهان و شکست هیلاری کلینتون شد. این واقعه به جهانیان نشان داد تحلیلی که صرفا مبتنی بر نظرسنجی‌ها باشد و داده های کلان دیگر را در نظر نگیرد، کافی نیست و حتی می‌تواند گمراه کننده باشد.

یک نمونه از پروژه‌های مهم و کلیدی تحلیل کلان داده در این زمینه پروژه لاکس 2020 بود. تفاوت اصلی این برنامه ابرکامپیوتری با سایر برنامه‌ها این بود که این برنامه فقط نتایج نظرسنجی‌ها را در نظر نمی‌گرفت، بلکه داده‌های دیگر را نیز در راستای ساخت تصویری حقیقی از احساس رای دهندگان به خدمت می‌گرفت. این پروژه با شکستن مرز‌های سنتی تحلیل داده دریچه‌ای جدید را در تاثیر کلان داده بر سیاست بر روی جهانیان باز کرد. نحوه کار لاکس این‌گونه بود که به جای تکیه بر نتایج نظرسنجی‌ها، شبکه‌های اجتماعی را به تفکیک نژاد، سن، جنسیت و وابستگی سیاسی برای کسب اطلاعات در مورد آنچه مردم درباره کارزار‌های انتخاباتی فعلی و نامزدها می‌گویند جارو می‌کرد و سپس از داده‌های جمعیتی در کنار افکار عمومی و نظرات کاربران شبکه‌های اجتماعی برای ترسیم خط روندی استفاده می‌کرد که نشان می‌داد رغبت رای دهندگان به هر نامزد چگونه بالا می‌رود یا پایین می‌آید.

جالب اینجاست که اگرچه بسیاری از نظرسنجی‌های سال 2016 نشان نمی‌داد که ترامپ به سمت پیروزی پیش می‌رود، اما نسخه قبلی نرم افزار لاکس این پیش‌بینی را انجام داد. این نرم افزار نشان داد جمع‌آوری بسیار دقیق داده‌ها و تحلیل آنها بر اساس طیف گسترده از عوامل تاثیر گذار، نتیجه‌ای بسیار دقیق‌تر از اکتفا به نتایج نظرسنجی‌ها در پی دارد.

لاکس متشکل از طیف وسیعی از مدل‌های یادگیری ماشین است که برای جمع‌آوری اطلاعات، منابعی که اکثر آمریکایی‌ها استفاده می‌کنند مانند شبکه‌های اجتماعی را به کار می‌گیرد و با تحلیل این داده‌ها، تصویری بسیار شبیه واقعیت را برای فعالین سیاسی خلق می‌کند. داده‌هایی که این سیستم جمع‌آوری می‌کند آن‌قدر در هم تنیده و پیچیده هستند که هیچ‌کسی نمی‌تواند نتیجه‌ای قابل استفاده از آن‌ها استخراج کند، اما لاکس با استفاده از الگوریتم‌های پیشرفته یادگیری ماشین، داده‌های پیچیده را به تصویر می‌کشد و به استراتژیست‌های کارزار‌های انتخاباتی یا روزنامه نگاران سیاسی این اجازه را می‌دهد که به سرعت دیدگاه ارزشمندی از مجموعه داده‌های بسیار پیچیده به دست آورند.

اما آیا با تحلیل کلان داده می‌توان همه زندگی انسان ها را پیش‌بینی کرد؟

همین الآن که شما دارید این متن را می‌خوانید سیستم‌های بسیاری در حال ساختن و دقیق‌تر کردن مدلی از شما هستند. با این حال تصمیمات ما مانند رای دادن مساله‌ای مربوط به انسان هاست نه نظرسنجی‌ها. اگر روز قبل از انتخابات صد‌ها هزار نفر نظرشان را تغییر دهند یا یک اتفاق نظر مردم را نسبت به کاندیدایی منفی کند، تمامی تحلیل‌ها اعتبارشان را از دست می‌دهند. بنابراین هیچ گاه نمی‌توان اطمینان صدر درصدی به تحلیل‌ها داشت اما نباید از تاثیر جدی آنها بر انتخابات‌ها غافل بود. به عبارت دیگر با اینکه تحلیل‌ها و پیش‌بینی ها بیشتر مواقع با تقریب خوبی برنده انتخابات را تعیین می‌کنند اما این نکته را هم باید در نظر گرفت که همه عوامل تحت کنترل ما نیستند و همیشه پیروزی‌های غافلگیرکننده ممکن است.

با این حال کلان‌داده می‌تواند بهترین راه تنظیم استراتژی، برای جناح‌های سیاسی باشد؛ تحلیل کلان داده امکان شناسایی موضوعات مورد اهمیت برای تک تک افراد جامعه و موثر‌ترین راه ارائه آن مورد به همان افراد را در اختیار سازمان‌های سیاسی قرار می‌دهد. یعنی اگر شخصی به عنوان یک شهروند به هزینه‌های نظامی اهمیتی نمی‌دهد، چرا باید وقتش را با تبلیغات در این مورد تلف کنیم؟ کلان داده به ما اجازه می‌دهد که بدانیم برای او هزینه‌های رفاه اجتماعی مهم است نه مسائل ارتش در نتیجه به او تبلیغی در مورد اینکه با هزینه‌های رفاه اجتماعی چه خواهیم کرد نشان می‌دهیم. همچنین با این اطلاعات می‌توانیم به یک سرباز تبلیغی را نشان دهیم که به او اطمینان می‌دهد اگر حزب ما قدرت را در دست بگیرد شغل او در امان خواهد ماند.

جالب است بدانید که در مبارزات انتخاباتی 2016 حدود 15 درصد از تیم کلینتون روی داده‌ها و تجزیه و تحلیل کار می‌کردند. اما در طرف مقابل بیش از 38 درصد از تیم ترامپ خود را وقف تجزیه و تحلیل داده‌ها و تعیین استراتژی کردند و دیدیم که خروجی کارزار ترامپ، نتیجه بهتری در پی داشت. برای همین امروزه سازمان‌هایی که جمع‌آوری و تحلیل موثر داده‌ها را در اولویت بالاتری قرار می‌دهند، دست بالاتر را در رقابت پیدا می‌کنند. ولی با وجود اینکه کلان داده‌ها فرصت عظیمی را در حوزه‌های مختلف مانند انتخابات پیش روی ما می‌گذارند، می‌توانند خطرات مهمی نیز به همراه داشته باشند. مثلا استفاده از داده‌ها برای اهداف کارزار‌های انتخاباتی می‌تواند با ایجاد اتاق‌های پژواک³ - جایی که الگوریتم‌ها نظرات سیاسی از پیش تعیین شده را تولید و تقویت می‌کنند- منجر به دو قطبی‌سازی جامعه شود.

به گفته کارشناسانی مانند پروفسور هاروارد کاس سانستین و الی پاریسر -کارآفرین و نویسنده کتاب حباب فیلتر: چگونه وب شخصی‌سازی شده جدید آنچه را که می‌خوانیم و چگونه فکر می‌کنیم تغییر می‌دهد- داده‌های کلان به طور فزاینده‌ای برای ایجاد «حباب» مورد استفاده قرار می‌گیرند. حباب به فضایی گفته می‌شود که در آن افراد همفکر منحصرا اطلاعاتی مشابه را دریافت می‌کنند که در نتیجه این اطلاعات آنها به سوی موضع‌گیری‌های شدید‌تر کشیده می‌شوند. به عنوان راه حل پاریسر از مدل‌های داده‌ای حمایت می‌کند که به طور مسئولانه‌ای برای اجتناب از دو قطبی‌سازی و فروپاشی جامعه به کار گرفته می‌شوند. گذشته از این کالین کوپمن، رییس فلسفه و برنامه گواهی فرهنگی در دانشگاه اورگان میگوید «داده فرمان دموکراسی را در دست خواهد‌گرفت» و این به آن خاطر است که «جامعه ما کمبود نظامی اخلاقی در سطح وابستگی به داده‌ها دارد».

ما باید از داده‌ها برای پیشبرد فهممان استفاده کنیم اما سوال اینجاست که آیا همانقدر که استفاده ما از داده‌ها گسترده است، همانقدر به چالش‌های اخلاقی آن‌ها اندیشیده‌ایم؟ تحلیل داده‌ها در سطح کلان و استفاده از آنها برای اهداف سیاسی می‌تواند موجب تشدید تنش‌ها در جامعه شود و چند قطبی‌سازی را تسریع بخشد. در ناآرامی‌های اخیر ایالات متحده، نوع تحلیل داده در شبکه‌های اجتماعی باعث تشدید تنفر در فضای جامعه شد و با ساخت مرز‌بندی های مشخص کار به درگیری خیابانی کشید، حال آنکه کسی فکر نمی‌کرد چنین اتفاقی در شبکه‌های اجتماعی بیافتد.

مانند شبکه‌های اجتماعی و هر فناوری دیگری، استفاده از تحلیل کلان داده در سیاست نیازمند تاملی فلسفی است تا مخاطرات آن عیان گردد، اگر جامعه انسانی بدون تامل به دنبال پیشرفت تکنولوژی باشد دیری نخواهد گذشت که انسان به دست همین فناوری‌ها نابود می‌شود. ما تا به اینجا مانند طفلی نوپا قدم‌های اولیه را در راستای استفاده از فناوری‌های نو نظیر جمع‌آوری و تحلیل کلان داده‌ها و استفاده از آنها در عرصه سیاست برداشته‌ایم، اما باید حواسمان را جمع کنیم همانگونه که این فناوری‌ها ما را در پیشبرد اهدافمان یاری می‌کنند، ممکن است خطراتی مهلک برای دموکراسی در خود داشته باشند. اگر هر کسی در اتاق پژواکش گرفتار شود، مفاهمه میان انسان‌ها به امری محال تبدیل شده و این خطر حاکمیت‌های دیکتاتور را افزایش می‌دهد. ما باید همان گونه که علاقه‌مند به پیشرفت تکنولوژی هستیم، صبورانه و با تحلیل دقیق آنها را به کار بگیریم تا از خطرات آنها در امان بمانیم.



پی نوشت‌ها:

1. برای نوشتن این مطلب از مطالب لینک های زیر استفاده شده است:

https://yun.ir/rpwo1f

https://yun.ir/eko0kb

https://yun.ir/wazv13

2. برای مطالعه بیشتر در این مورد می‌توانید به مطلب «معضل اجتماعی» که در شماره قبلی نشریه نقطه منتشر شده است، مراجعه بفرمایید.

3. اتاق پژواک توصیفی کنایی از وضعیتی است که در آن اطلاعات، ایده‌ها، یا باورها با ارتباطات و تکرار درون یک سامانه تقویت می‌شوند.


انتخاباتترامپکلان دادهنقطه
نشریه نقطه، دوماهنامه علم و فناوری
شاید از این پست‌ها خوشتان بیاید