کلانداده به دادههایی گفته میشود که به سرعت و در حجمهای بزرگ تولید شده و دارای پیچیدگیهای فراوانی هستند به نحوی که با روشهای سنتی تحلیل داده قابل بررسی نیستند. از کلاندادهها برای بهبود روشها و فرایندها و ارتقای بینش در یک سازمان یا نهاد سیاسی استفاده میشود؛ تحلیل کلان داده تاثیر عمیقی بر ما و جهان اطراف ما میگذارد. این گستره از پیشنهاد دادن محصولات به مشتریان در سایتها و شبکههای اجتماعی تا انتخاب قدرتمندترین مقام سیاسی جهان را شامل میشود. تجزیه و تحلیل دادهها به کارزارهای انتخاباتی کمک میکند تا رای دهندگان را بهتر درک کنند و با احساسات آنها همسو شوند.
کارزار انتخاباتی اوباما در سال 2008 از اولین کارزارهایی بود که برای پیروزی در یک انتخابات از تحلیل و پیشبینی به روش داده محور بهره برد. تیمی که در کارزار اوباما بر تحلیل کلان داده کار میکرد شامل 100 نفر بود، اما در انتخابات 2016 آمریکا، دادهها نقشی اساسیتر ایفا کردند تا جایی که از آنها به عنوان نیرویی کلیدی برای پیروزی در انتخابات یاد شده است. اما سوال اینجاست که آیا کلان داده این قدرت را دارد که نتیجه انتخابات را تغییر دهد؟ در سال 2016 اکثر سایتهای نظرسنجی از برتری 70 درصدی هیلاری کلینتون بر دونالد ترامپ خبر میدادند اما هنوز نتیجه انتخابات قطعی نبود. آنچه در عمل اتفاق افتاد این بود که در واقع این نظرسنجی باعث تقویت کارزار ترامپ و متحد شدن جمهوری خواهان و شکست هیلاری کلینتون شد. این واقعه به جهانیان نشان داد تحلیلی که صرفا مبتنی بر نظرسنجیها باشد و داده های کلان دیگر را در نظر نگیرد، کافی نیست و حتی میتواند گمراه کننده باشد.
یک نمونه از پروژههای مهم و کلیدی تحلیل کلان داده در این زمینه پروژه لاکس 2020 بود. تفاوت اصلی این برنامه ابرکامپیوتری با سایر برنامهها این بود که این برنامه فقط نتایج نظرسنجیها را در نظر نمیگرفت، بلکه دادههای دیگر را نیز در راستای ساخت تصویری حقیقی از احساس رای دهندگان به خدمت میگرفت. این پروژه با شکستن مرزهای سنتی تحلیل داده دریچهای جدید را در تاثیر کلان داده بر سیاست بر روی جهانیان باز کرد. نحوه کار لاکس اینگونه بود که به جای تکیه بر نتایج نظرسنجیها، شبکههای اجتماعی را به تفکیک نژاد، سن، جنسیت و وابستگی سیاسی برای کسب اطلاعات در مورد آنچه مردم درباره کارزارهای انتخاباتی فعلی و نامزدها میگویند جارو میکرد و سپس از دادههای جمعیتی در کنار افکار عمومی و نظرات کاربران شبکههای اجتماعی برای ترسیم خط روندی استفاده میکرد که نشان میداد رغبت رای دهندگان به هر نامزد چگونه بالا میرود یا پایین میآید.
جالب اینجاست که اگرچه بسیاری از نظرسنجیهای سال 2016 نشان نمیداد که ترامپ به سمت پیروزی پیش میرود، اما نسخه قبلی نرم افزار لاکس این پیشبینی را انجام داد. این نرم افزار نشان داد جمعآوری بسیار دقیق دادهها و تحلیل آنها بر اساس طیف گسترده از عوامل تاثیر گذار، نتیجهای بسیار دقیقتر از اکتفا به نتایج نظرسنجیها در پی دارد.
لاکس متشکل از طیف وسیعی از مدلهای یادگیری ماشین است که برای جمعآوری اطلاعات، منابعی که اکثر آمریکاییها استفاده میکنند مانند شبکههای اجتماعی را به کار میگیرد و با تحلیل این دادهها، تصویری بسیار شبیه واقعیت را برای فعالین سیاسی خلق میکند. دادههایی که این سیستم جمعآوری میکند آنقدر در هم تنیده و پیچیده هستند که هیچکسی نمیتواند نتیجهای قابل استفاده از آنها استخراج کند، اما لاکس با استفاده از الگوریتمهای پیشرفته یادگیری ماشین، دادههای پیچیده را به تصویر میکشد و به استراتژیستهای کارزارهای انتخاباتی یا روزنامه نگاران سیاسی این اجازه را میدهد که به سرعت دیدگاه ارزشمندی از مجموعه دادههای بسیار پیچیده به دست آورند.
اما آیا با تحلیل کلان داده میتوان همه زندگی انسان ها را پیشبینی کرد؟
همین الآن که شما دارید این متن را میخوانید سیستمهای بسیاری در حال ساختن و دقیقتر کردن مدلی از شما هستند. با این حال تصمیمات ما مانند رای دادن مسالهای مربوط به انسان هاست نه نظرسنجیها. اگر روز قبل از انتخابات صدها هزار نفر نظرشان را تغییر دهند یا یک اتفاق نظر مردم را نسبت به کاندیدایی منفی کند، تمامی تحلیلها اعتبارشان را از دست میدهند. بنابراین هیچ گاه نمیتوان اطمینان صدر درصدی به تحلیلها داشت اما نباید از تاثیر جدی آنها بر انتخاباتها غافل بود. به عبارت دیگر با اینکه تحلیلها و پیشبینی ها بیشتر مواقع با تقریب خوبی برنده انتخابات را تعیین میکنند اما این نکته را هم باید در نظر گرفت که همه عوامل تحت کنترل ما نیستند و همیشه پیروزیهای غافلگیرکننده ممکن است.
با این حال کلانداده میتواند بهترین راه تنظیم استراتژی، برای جناحهای سیاسی باشد؛ تحلیل کلان داده امکان شناسایی موضوعات مورد اهمیت برای تک تک افراد جامعه و موثرترین راه ارائه آن مورد به همان افراد را در اختیار سازمانهای سیاسی قرار میدهد. یعنی اگر شخصی به عنوان یک شهروند به هزینههای نظامی اهمیتی نمیدهد، چرا باید وقتش را با تبلیغات در این مورد تلف کنیم؟ کلان داده به ما اجازه میدهد که بدانیم برای او هزینههای رفاه اجتماعی مهم است نه مسائل ارتش در نتیجه به او تبلیغی در مورد اینکه با هزینههای رفاه اجتماعی چه خواهیم کرد نشان میدهیم. همچنین با این اطلاعات میتوانیم به یک سرباز تبلیغی را نشان دهیم که به او اطمینان میدهد اگر حزب ما قدرت را در دست بگیرد شغل او در امان خواهد ماند.
جالب است بدانید که در مبارزات انتخاباتی 2016 حدود 15 درصد از تیم کلینتون روی دادهها و تجزیه و تحلیل کار میکردند. اما در طرف مقابل بیش از 38 درصد از تیم ترامپ خود را وقف تجزیه و تحلیل دادهها و تعیین استراتژی کردند و دیدیم که خروجی کارزار ترامپ، نتیجه بهتری در پی داشت. برای همین امروزه سازمانهایی که جمعآوری و تحلیل موثر دادهها را در اولویت بالاتری قرار میدهند، دست بالاتر را در رقابت پیدا میکنند. ولی با وجود اینکه کلان دادهها فرصت عظیمی را در حوزههای مختلف مانند انتخابات پیش روی ما میگذارند، میتوانند خطرات مهمی نیز به همراه داشته باشند. مثلا استفاده از دادهها برای اهداف کارزارهای انتخاباتی میتواند با ایجاد اتاقهای پژواک³ - جایی که الگوریتمها نظرات سیاسی از پیش تعیین شده را تولید و تقویت میکنند- منجر به دو قطبیسازی جامعه شود.
به گفته کارشناسانی مانند پروفسور هاروارد کاس سانستین و الی پاریسر -کارآفرین و نویسنده کتاب حباب فیلتر: چگونه وب شخصیسازی شده جدید آنچه را که میخوانیم و چگونه فکر میکنیم تغییر میدهد- دادههای کلان به طور فزایندهای برای ایجاد «حباب» مورد استفاده قرار میگیرند. حباب به فضایی گفته میشود که در آن افراد همفکر منحصرا اطلاعاتی مشابه را دریافت میکنند که در نتیجه این اطلاعات آنها به سوی موضعگیریهای شدیدتر کشیده میشوند. به عنوان راه حل پاریسر از مدلهای دادهای حمایت میکند که به طور مسئولانهای برای اجتناب از دو قطبیسازی و فروپاشی جامعه به کار گرفته میشوند. گذشته از این کالین کوپمن، رییس فلسفه و برنامه گواهی فرهنگی در دانشگاه اورگان میگوید «داده فرمان دموکراسی را در دست خواهدگرفت» و این به آن خاطر است که «جامعه ما کمبود نظامی اخلاقی در سطح وابستگی به دادهها دارد».
ما باید از دادهها برای پیشبرد فهممان استفاده کنیم اما سوال اینجاست که آیا همانقدر که استفاده ما از دادهها گسترده است، همانقدر به چالشهای اخلاقی آنها اندیشیدهایم؟ تحلیل دادهها در سطح کلان و استفاده از آنها برای اهداف سیاسی میتواند موجب تشدید تنشها در جامعه شود و چند قطبیسازی را تسریع بخشد. در ناآرامیهای اخیر ایالات متحده، نوع تحلیل داده در شبکههای اجتماعی باعث تشدید تنفر در فضای جامعه شد و با ساخت مرزبندی های مشخص کار به درگیری خیابانی کشید، حال آنکه کسی فکر نمیکرد چنین اتفاقی در شبکههای اجتماعی بیافتد.
مانند شبکههای اجتماعی و هر فناوری دیگری، استفاده از تحلیل کلان داده در سیاست نیازمند تاملی فلسفی است تا مخاطرات آن عیان گردد، اگر جامعه انسانی بدون تامل به دنبال پیشرفت تکنولوژی باشد دیری نخواهد گذشت که انسان به دست همین فناوریها نابود میشود. ما تا به اینجا مانند طفلی نوپا قدمهای اولیه را در راستای استفاده از فناوریهای نو نظیر جمعآوری و تحلیل کلان دادهها و استفاده از آنها در عرصه سیاست برداشتهایم، اما باید حواسمان را جمع کنیم همانگونه که این فناوریها ما را در پیشبرد اهدافمان یاری میکنند، ممکن است خطراتی مهلک برای دموکراسی در خود داشته باشند. اگر هر کسی در اتاق پژواکش گرفتار شود، مفاهمه میان انسانها به امری محال تبدیل شده و این خطر حاکمیتهای دیکتاتور را افزایش میدهد. ما باید همان گونه که علاقهمند به پیشرفت تکنولوژی هستیم، صبورانه و با تحلیل دقیق آنها را به کار بگیریم تا از خطرات آنها در امان بمانیم.
پی نوشتها:
1. برای نوشتن این مطلب از مطالب لینک های زیر استفاده شده است:
2. برای مطالعه بیشتر در این مورد میتوانید به مطلب «معضل اجتماعی» که در شماره قبلی نشریه نقطه منتشر شده است، مراجعه بفرمایید.
3. اتاق پژواک توصیفی کنایی از وضعیتی است که در آن اطلاعات، ایدهها، یا باورها با ارتباطات و تکرار درون یک سامانه تقویت میشوند.