این پست یازدهم درس Using Big Data to Solve Economic and Social Problems -که سال ۲۰۱۹ برای ۳۷۵تا دانشجو تو هاروارد ارائه شده- هستش که ما دور هم که میدیدیم همینجور چیزهایی که بامزه بود رو مینوشتیم و برای من خیلی جالب و جدید بود، نوشتههای اول، دوم، سوم، چهارم، پنجم، ششم، هفتم، هشتم، نهم و دهم رو میتونید اینجاها بخونید.
این نوشته هم برای جلسهی هفتم درس و یازدهمین نوشتهس؛ موضوع: «The Causal Effects of Colleges».
خب ما توی مسیر صحبت بعد از صحبت کردن راجع به رویای آمریکایی، تعریفش و یکم هم بررسی تغییرش در طول زمان به تاثیر دانشگاهها و کالجها در موضوع آرمان رویای آمریکایی( :)) ) یا -دقیقتر امکان پیشرفت در طبقات جامعه(upward mobility) برای همه- رسیدیم. درس تو این جلسه موضوع «تاثیرات عِلّی دانشگاهها بر پیشرفت اجتماعی» رو به دو زیرموضوع تقسیم میکنه؛ اولی این که واقعا دانشگاهها چقدر تاثیر دارند، و دومی مشکل دهکهای پایین جامعه در استفاده از این تاثیر واقعا چه چیزهایی میتونه باشه. در هرکدوم از این دو موضوع هم یک آزمایش اولیه مطرح میکنه که نتیجههای نسبتا جالبی رو میبینیم که به این دید آماری به این مساله کمک میکنه.
من تو این یادداشت اول ۲تا مقدمه جدا از هم و مرتبط با این جلسه که به نظرم جالب اومد رو میگم؛ بعد هم سراغ نمودارها و کارهای آماری تیم آقای چِتی میریم.
نهاد دانشگاه به ادعای خیلی از جامعهشناسها هنوز هم از اصلیترین تونلهاییه که یک فرد تو جامعه میتونه ازش استفاده کنه تا یک طورهایی به «طبقهی اجتماعی» بالاتر مهاجرت کنه؛ حتی تو همین ایران خودمون خوب میدونیم که خونوادههای طبقه متوسط و پایین جامعه چه اصراری به درس خوندن بچههای خانواده دارن، تا حدی که میشه گفت جملهی «بچه درس بخون برو دانشگاه تا یه چیزی بشی» به ضربالمثل اکثر جامعهی ایران تبدیل شده. بعیده یه پدری که ۱۰تا ماشینفروشی بالاشهر تهران داره به بچهش بگه «درس بخون تا یه چیزی بشی»؛ و این اتفاق در همین ایران، نشوندهندهی همین اصلیترین -یا شایدم تنهاترین- نقب ارتباطی بچههای دهکهای غیر اول جامعه به پیشرفت اجتماعی است(۱). انتخاب چِتی(استاد درس) برای مطرح کردن تاثیر علی(causal) دانشگاه دقیقا بعد از موضوع رویای آمریکایی از این جهت خیلی هوشمندانه و منطقی به نظر میاد.
عنوان این جلسه خیلی جسورانه انتخاب شده؛ در واقع این که یک آماردان یا اقتصاددان بیاد بگه من میخوام تاثیرات عِلّی -causal effect- یک موضوعی رو براتون بگم و همبستگیها -correlation- ها رو دور بریزم خیلی جرات میخواد. یک جملهی معروفی هست که «در نظر گرفتن همبستگیها به عنوان روابط عِلَی کابوس ساینیستهاست»(۲)
در واقعتر بعضیها میگن کل کار علم آمار -statistics- همین پیدا کردن استنتاجهای از لحاظ احتمالاتی بهتر(نه کامل؛ تو یه فضای احتمالاتی چجوری علم کامل رو به دست بیاریم:/ .) حساب میشه؛ و ادامه میدن که فرق یه چیزی مثل آمار، با یادگیری ماشین و هوش مصنوعی - که در جریاناید که به شکل اورریتدی همه فکر میکنن چه خبره توش – این هست که ما توی آمار دنبال یک سری استنتاج -inference- عِلی هستیم؛ ولی توی یادگیری ماشین دنبال یک سری پیشبینی -prediction- همبسته. من هم حس کردم توی این ارائه چِتی به مقدار زیادی حواسش به این هست و چند بار بحث درست نمونه آماری گرفتن و این که تلاش کرده تصادفی بودن -randomness- درستی توی راهاندازی آزمایشش به وجود بیاره رو پیش میکشه. از این جهت این ارائه دیدش با اکثر ارائههایی که مثلا توی فضای AI دیدید شاید متفاوت باشه و جالبه.(۳)
و البته در لایههای بالاتر(که مشخصا فلسفه و اینا میشه.) دربارهی امکان به دست آوردن علیت بحث میشه و من حتی تو تاکسی یک باری شنیدم که یک آقایی به اسم هیوم(hume) حدود سالهای ۱۸۰۰ با نوشتن «the problem of induction» میگه که به دست آوردن علیت، تحت هیچ شرایطی ممکن نیست و کل مساله کانتکسچوال(معادل فارسی خوبی نیافتم) است معالاسف (۴). بعدها هم این دعوای فلسفی ادامه پیدا کرده که زمین بازی ما نیست و بهتره ما عرض خودمون و زحمت بزرگواران رو نبریم.
قطعا یه دانشگاه خوب یکی از محلهایی که آدمها رشد میکنند هست، منتها سوالها اینجاست که دانشگاه چقدر توی پیشرفت جایگاه اجتماعی افراد(ترجمه کنید: درآمد) تاثیرگذاره؛ در واقع سوال دو قسمت داره، یکی این که «چقدر»، دوم این که آیا واقعا توی پیشرفت جایگاه اجتماعی هم موثر هست؟ یا این که صرفا خونوادههای پولدار نهایتا به دانشگاههای خوب دسترسی دارند.(۵)
خب حالا چه آزمایشی میتونیم برای اندازهگیری و جواب به این سوال طراحی کنیم؟. اگر بخواهیم مثل دفعههای قبل نگاه کنیم مثلا باید به شکل تصادفی افراد رو به دانشگاههای مختلف بفرستیم و در سن ۳۰سالگی بین آنها مقایسه درآمد انجام بدهیم؛ منتها خب مشخصا این کار ممکن نیست. در قسمت بعد یک ایده و ابزار نسبتا جالب که چتی هم به عنوان راهحل ارائه میده صحبت میکنیم و کمی بررسیش میکنیم.
ایدهی جالبی که توی این پیپر هست و چِتی هم همین رو توضیح میده اینه که روی یک دانشگاه خاص(در اینجا دانشگاه فلوریدا) و بین افرادی که روی مرز قبولی بودهاند مقایسه رو انجام بدهیم.
در واقع همینطور که توی دو تا نمودار بالا میبینیم در یک مرزی روز GPA(نوعی معدل کل) نرخ قبول شدن در دانشگاه پله میخورد. نکتهای که وجود دارد همینه که بین آدمهای با GPA مثلا ۲.۹۹ و ۳.۰۱ نباید اختلاف آنچنانیای در بقیهی فاکتورها باشد و میشود قبول کرد که این ۲ گروه صرفا در قبولی در دانشگاه متفاوت شدهاند. برای مثال مقاله توزیع جنسیت برحسب GPA را نیز آورده که همونطور در نمودار پایین میبینید آنچنان پلهای در بقیه موارد مثل توزیع جنسیت یا… به وجود نیاورده. پس به نظر میرسه انتخاب معقولی باشه برای بررسی بیشتر.
این هم نتیجهی جالبی است، بعد از ۸ تا ۱۴ سال آدمهایی که دانشگاه فلوریدا قبول شدند از لحاظ درآمدی چه فرقی میکنند؟. نمودار زیر نشون میده یک چیزی حدود ۵درصد نهایت اختلاف درآمد هست بین آدمهایی که به دانشگاه فلوریدا رفتند و نرفتند. یک قوس جالبی هم سمت چپ تصویر نمودار هست که انگار اونهایی که خیلی از کف نمرهی قبولی فاصله داشتند(به اصطلاح کلا درسخوان نبودند!) از لحاظ درآمدی وضع بهتری پیدا کردند از کسانی که فاصله کمی با کف قبولی داشتند؛ در واقع در مجموع بدترین وضع درآمدی برای اون کسایی هست که لب مرز قبول نشدند.
شاید الان به این فکر میکنید که خب پس همین کاری رو که بالا کردیم میتونیم برای هر دانشگاهی بخواهیم انجام بدهیم و تاثیر علّی اون دانشگاه رو ببینیم. منتها نخیر. نکته اینجاست که دانشگاه فلوریدا رنک خیلی پایینی بین دانشگاههای آمریکا داره، و اگر کسی اینجا قبول نشه مرحلهی بعد به کالج ۲ساله میره؛ در حالی که اگر کسی مثلا هاروارد قبول نشه لزوما به «خیلی کم درس خوندن» نزدیک نیست، شاید یهو استنفورد قبول بشه!. پس این نوع راهحل ساده در اون مساله خیلی جوابگو نیست، باید به راهحلهای جدیتری فکر کنیم.
یک سمت مساله اینه که دانشگاهها واقعا چقدر تاثیر در پیشرفت اجتماعی دارند، سمت دیگه این که چرا دانشآموزهای دهکهای پایین اما بااستعداد کمتر به دانشگاه میان. الان بعد از کمی بازی با سمت اول ماجرا میخوایم یکم هم راجع به سمت دوم ماجرا صحبت کنیم. جالبی این بخش اینه که مثلا سیاستهای کمک بشتر و سهمیهای به خونوادههای دهک پایین همیشه وجود داشته، اما بیاید دقیقتر ببینیم؛ شاید یک سری گره جاهای دیگه هم باشه. از اینجا به بعد درس هدفش اینه که یکی از همین گرهها رو نشون بده.
این نمودار نشوندهندهی مقدار پولی هست که باید صدک ۲۰ام جامعه(که در اون دانشگاه قبول میشن) خرج تحصیل بدن. بخش قرمز نشوندهنده کل هزینهی تحصیل هست و بخش آبی مقدار پولی که باید این بخش از جامعه برای تحصیل تو اون دسته از دانشگاه بدن. همونطور که میبینید خیلی جاها مشکل هزینه برای این خانوادهها وجود نداره. پس مشکل کجاست؟
اولین حدس خب همینه که این قشر از جامعه اصولا کمتر به فکر دانشگاه رفتن میافتند، و شرایط خونوادگیشون هم به شکلی است که خودشون رو «دستکم» میگیرند؛ کمبود اطلاعات، پشتیبانی دیگران و اعتماد به نفس و نه توانایی.(۶)
خانم susan dynarski که یک استاد دانشگاه در میشیگانه این فرضیه رو به این شکل در سال ۲۰۱۸ آزمایش کرد که؛ بیایم بچههای خونوادههای کمدرآمد (درآمد سالانه کمتر از $47k) اما توانمند(GPA بیشتر از ۳.۳ و SAT بیشتر از ۱۱۰۰) رو جدا کنیم. این بچهها در ایالت میشیگان ۲هزار نفر شدند. به شکل تصادفی و به نصف این دانشآموزها یک دعوتنامهی ترتمیز به خودشون (+ یک ایمیل حمایتی به والدینشون) بفرستیم که اگر شما به دانشگاه میشیگان اپلای کنید احتمال بالایی قبول میشید و فاند خوبی هم میگیرید. و ببینیم بین این دو گروه از بچهها که به شکل تصادفی این نامه رو گرفتند یا نگرفتند چه تفاوتی وجود داره.
نتیجهی این آزمایش خیلی جالبه. این نمودارهای پایین رو ببینید.
نمودار بالا نشون میده با اختلاف گروهی که دعوتنامه رو دریافت کردهاند بیشتر اقدام به ادامه تحصیل در این دانشگاه کردهاند.
و این نمودار هم ورود نهایی این بچهها رو نشون میده. بچههایی که دعوتنامه رو دریافت کردند ۲برابر به این دانشگاه وارد شدهاند تا گروهی که دعوتنامهای نگرفتند.
البته این لزوما به این معنی نیست که این بچهها اگر میشیگان نمیاومدند جای دیگری هم نمیرفتند، در واقع این دعوتنامه اختلاف بین رفتن یا نرفتن دانشگاه نیست. منتها نشوندهندهی این هست که درست کردن نرمافزار چند مسیر یا یکی دو تا فرهنگ سازنده خیلی موثره و همهچیز اختصاص سهمیههای مختلف به این گروه نیست.
این جلسه اینجا تموم میشه و این دو بحث بیشتر صرفا باز میشن برای فکر و کار کردن بیشتر. جلسهی بعدی در رابطه با مدرسههاست.
همین.
----
۱- البته بماند که از ۲سال پیش چندتا از دانشکدههای شریف(بعد از امیرکبیر) هم مقدار زیادی پذیرش پردیس و آزاد(بخوانید: پولی) اضافه کردند که در همان زمانها هم بحثها و دعواهایی شد بر سر این معدود نهادهای اجتماعی نیمهجون باقیمانده در ایران -بد نیست حال که این همه راه آمدهاید برای تن رنجورِ زیر قلمچی و مدرسه خصوصیها ماندهی سمپاد دوستداشتنی نیز یک فاتحهای بخوانید-، مثلا گزارش روزنامه شریف را میتوانید اینجا بخوانید.
۲- و خب یک دوستی در ادامهی این نقل میگفت که «میدونیم که کابوسها اغلب بازتاب دهنده واقعیاتیاند که فرد در انکارشون به سر میبره» :)))
۳- و این که AI دیگه برای ما همهکار نخواهد کرد. در واقع تو خیلی از مسالههای اجتماعی اقتصادیمون رو خیلی وقتها میخوایم همین استنتاجها بررسی کنیم.
۴- البته قاعدتا حرف هیوم خیلی دقیقتر از این ۲ جملهی مندرآوردی بنده بوده.
۵- اگر مثلا از شهرهای کوچکتر به شریف اومدهباشید احتمالا این تجربه رو داشتید که یهو احساس کنید آدمهای اینجا خیلی پولدارتر از بچههای مدرسهتون باشند.
۶- اگر سراغ بعضی مدارس کمدرآمدتر در ایران هم رفتهباشید احتمالا دیدهاید که در ایران هم همین قصه هست.