قبلاً گفتم که علوم اجتماعی محاسباتی جزو دادهبنیادترین دانشهای کنونی دنیا است. اینجا:
اساساً این روزها استفاده از کلانداده، بیگدیتا، دادههای انبوه یا هر اسم دیگری که روی این اندوختهی دانشی بگذارید، بیش از هر زمان دیگری شایع شده و هر گوشهای را که نگاه کنید، فرد یا موسسهای را میبینید که مقداری از دادهها را گرفته و دارد رویش کار میکند. خروجی این قبیل پژوهشها و آزمایشها هم معمولاً اسناد و گزارشهای خوشآبورنگ و قانعکنندهای است که به نظر کاملاً مستند و «علمی» و متکی به «واقعیت اجتماعی» هستند.
اما همین نقطهی قوت دارد به نقطهی ضعف و خطر برای پژوهشگران اجتماعی محاسباتی تبدیل میشود.
چون ما در گرایشهای مختلف محاسباتی معمولاً از داده شروع میکنیم و فکر میکنیم که داریم خودِ پدیدهها را میبینیم. در حالی که اینطور نیست. آنچه ما در اختیار داریم، خودِ پدیدهی اجتماعی نیست؛ ردپای دیجیتال آن است. این عبارت «رد پای دیجیتال» (digital footprint) را جدی بگیرید. همهی چیزی که ما در اختیار داریم، فقط همین است؛ فقط همین.
ما دادههایی را در دست داریم که در پی وقوع یک کنشِ اجتماعی تولید شدهاند و لزوماً نمایشگرِ واقعیت و معنای آن کنش نیستند. این دادهها ارتباط مستحکم، قطعی و اثباتشدهای با معنای کنش ندارند. آنها همچون نقشی هستند که از قدم زدن روی شنهای ساحل ایجاد میشود. ردپا نتیجهی قدم زدن است و نه خودِ قدم زدن.
اما مگر چیز دیگری هم داریم؟ نه. همانطور که اول اعتراف کردم، این همهی چیزی است که ما در اختیار داریم. اما همینجا است که مهمترین خطای محاسباتی اتفاق میافتد؛ خطایی که از آن با عنوان «اثر تیر چراغ» (Streetlight effect) یا «جستجوی مست» (drunkard's search) هم یاد میکنند.
این اصطلاح داستان مشهوری دارد که شاید شنیده باشید. این داستان به شکلهای گوناگونی نقل شده و من نقل ویکیپدیایی آن را مینویسم:
میگویند مامور پلیس دید که مرد مستی در حال گشتنِ زیر یک تیر چراغ است و پرسید که چه چیزی را گم کرده. او کلیدهایش را گم کرده بود و هر دو با هم مشغول جستجو شدند. بعد از چند دقیقه، پلیس از مرد پرسید که آیا مطمئن است که کلیدها باید آنجا باشند. مرد گفت که کلیدها را در پارک گم کرده. پلیس اینبار پرسید که پس چرا زیر تیر چراغ را میگردد و پاسخ شنید که «چون اینجا روشنتر است».
این همان خطایی است که ما به ناچار داریم مرتکب میشویم. ما انبوهی از داده داریم و طبیعی است که برای پاسخ به هر سوالی، صرفاً به همینها متکی شویم؛ «چون دادهها اینجایند».
مثلاً این روزها با گسترش استفادهی مردم از گوشیهای تلفن همراه و ابزارهای پوشیدنی (مثلاً دستبندهای دیجیتال)، انبوهی از اطلاعات دربارهی حرکت و جابجایی افراد در اختیار داریم یا به خاطر حضور بسیاری از مردم در نرمافزارهایی مثل اینستاگرام، توییتر و تلگرام (و به لطف فناوریهای دادهکاوی و ...) میتوانیم به راحتی جداول متعددی از دادههای اینستاگرامی و توییتری و تلگرامی داشته باشیم.
به همین دلیل، پیش از آن که نگران واقعیت رفتار اجتماعی مردم باشیم و به دنبال بهترین روش برای شناخت این واقعیت (بر اساس مسالهی پژوهشی خاصی که داریم) بگردیم، همان اول چند جدول و نمودار (= گراف) رنگارنگ میکشیم و خلاص.
شاید پاسخ سوالات ما در آن سویِ تاریک خیابان باشد.
اگر میخواهید دربارهی این خطا بدانید و این که بالاخره چه میشود کرد، پیشنهاد میکنم که این مقالهی کوتاه و خوبِ دکتر مارک موریتز (استاد انسانشناسی در دانشگاه ایالتی اوهایو) را بخوانید. او راهحل کارگشایی را پیشنهاد میکند: به جای آن که دادهبنیاد باشید، مسالهبنیاد شوید.