خانم فیروزآبادی

این پست دوازدهم درس Using Big Data to Solve Economic and Social Problems -که سال ۲۰۱۹ برای ۳۷۵تا دانشجو تو هاروارد ارائه شده- هستش که ما دور هم که می‌دیدیم همینجور چیزهایی که بامزه بود رو می‌نوشتیم و برای من خیلی جالب و جدید بود، نوشته‌های اول، دوم، سوم، چهارم، پنجم، ششم، هفتم، هشتم، نهم، دهم و یازدهم رو می‌تونید اینجاها بخونید.

این نوشته هم برای جلسه‌ی هفتم درس‌ و یازدهمین نوشته‌س؛ موضوع: «K-12 Education».

خب

ما هم‌چنان در بحث رویای آمریکایی و پیشرفت در طبقات جامعه(upward mobility) هستیم. بعد از صحبت راجع به دانشگاه‌ها می‌خوایم سراغ مدارس ابتدایی بریم؛ تحصیلات K-12 در آمریکا یک طورهایی همون مدارس ابتدایی تا دبیرستان در ایران است. در واقع بخش پایینی این نمودار(که از ویکی‌پدیا برداشتم) تحصیلات K-12 است.


ساختار کلی تحصیلات در آمریکا
ساختار کلی تحصیلات در آمریکا

تو این قسمت درس، چِتی می‌خواد کمی تاثیر این تحصیلات و مدل‌های مختلفش رو در پیشرفت آدم‌ها در جامعه ببینه. باحاله این قسمت ببینید فیلم یا اسلاید یا این خلاصه‌ش رو.

مدرسه

دولت آمریکا حدود ۱۰ به توان ۱۲ دلار در سال برای مدارس هزینه می‌کنه. سیستم اداره‌ی مدارس در آمریکا غیرمتمرکزه؛ به این شکل که هزینه‌ی مدارس عمومی هر منطقه از مالیات همون منطقه تامین میشه و تبعا سرمایه‌ی مدارس مناطق پولدار بیشتر از فقیرهاست. مدارس غیرانتفاعی و خیریه هم که حساب‌شون جداست. اکثرا ما به شکل کیفی تاثیر مدارس یا سازمان‌ها رو اندازه می‌گرفتیم؛ مثلا میریم با مدیر مدرسه مصاحبه می‌کنیم، از بچه‌ها نظرشون رو می‌پرسیم، پرسش‌نامه پخش می‌کنیم و… . نکته‌ی جالب این درس همینه که این چیز میزا رو می‌ریزیم دور و از روی حرف حساب سعی می‌کنیم یه چیزهایی بفهمیم.

تو این جلسه راجع به ۴ مقاله حرف می‌زنیم. اولی «چقدر کلاس مهدکودک شما روی درآمد بزرگسالی‌تون تاثیر داره؟»، دومی «جغرافیای شکاف‌های نژادی در آزمون‌های کلی مدارس» (عجب ترجمه‌ای اه)، سومی «تاثیرات بلند مدت جمعیت کلاس‌های مدرسه»، چهارمی «اندازه‌گیری تاثیرات دو دسته از معلم‌ها».

«این که من دور اردک خط بکشم یا مداد روی درآمد آینده‌م تاثیر داره؟!» یا«چگونه یک تیتر زرد بنویسیم.»

داده‌ای که در این بخش داریم نمره‌ی دسته‌ای از بچه‌ها در تحصیلات خیلی ابتدایی -kindergarten- است. سوالی که به وجود می‌آید این است که آیا نمره‌ی مهدکودک بچه‌ها در موفقیت آینده‌ی بچه‌ها موثر است؟ در واقع چقدر نمره‌ی بچه‌ها ناشی از به دست آوردن توانایی آن‌ها است و چقدر ناشی از مثلا بهتر امتحان دادن آن‌ها. چِتی در سال ۲۰۱۱ این مساله رو با نمره‌ی ۱۲هزار دانش‌آموز سال ۱۹۸۵ بررسی کرده؛ نتایج‌ش عجیبه.

آزمون‌های مهدکودک رو اگه یادتون باشه در این حد ساده بودند. مثلا این که دور کلمه‌ی هم‌تلفظ خط بکشید.


این نمودار رو ببینید خیلی عجیبه.

نمودار میانگین درآمد بر حسب نمره‌ی مهدکودک
نمودار میانگین درآمد بر حسب نمره‌ی مهدکودک

این نمودار داره میانگین درآمد افراد در ۲۷-۲۵سالگی برحسب نمره آزمون مهدکودک‌شون رو نشون میده. همون‌طور که می‌بینید به طرز زیادی این ۲ مورد با هم هم‌بسته‌اند!. (یکم بهش فکر کنید؛ خیلی عجیبه)

البته دو تا نکته وجود دارند که باید بهشون توجه کرد. اولی این که این نقطه داده‌ها واریانس زیادی دارند. دومی هم این که این دو تا صرفا «هم‌بسته» هستند، وابسته یا رابطه‌ی عِلّی بین‌شون برقرار نیست. شاید هر دو معلول یک چیز سومی باشه؛ برای مثال شرایط خونوادگی خوب و بد، هوش بچه و … .

این نمودارها چون برای من خیلی جالب بود همه‌ش رو می‌ذارم اینجا که ببینید.

نمودار درصد قبولی در دانشگاه برحسب نمره مهدکودک؛ به مقیاس محور عمودی نمودار دقت کنید، از ۲۰ تا ۸۰.
نمودار درصد قبولی در دانشگاه برحسب نمره مهدکودک؛ به مقیاس محور عمودی نمودار دقت کنید، از ۲۰ تا ۸۰.
نمودار نرخ ازدواج در سن ۲۷سالگی برحسب نمره مهدکودک!
نمودار نرخ ازدواج در سن ۲۷سالگی برحسب نمره مهدکودک!

قدم بعد

خب پس تا الان فهمیدیم که نمره‌ی آدم‌ها در مدرسه با پیشرفت اجتماعی‌شون در آینده هم‌بستگی زیادی داره؛ پس می‌تونیم از توزیع نمره‌ی بچه‌ها در جامعه به عنوان یک پارامتر برای تحلیل استفاده کنیم. اینجا چِتی به یک مشکلی اشاره می‌کنه که این هست که هر ایالت برای خودش آزمون می‌گیره و نمره‌ها قابل مقایسه نیستند، بعد یک مقاله‌ای رو معرفی می‌کنه برای سال ۲۰۱۶ که تلاش کرده این نمره‌ها رو تبدیل به یک چیز قابل‌مقایسه کنه که بتونیم پیش بریم؛ چون کاری که تو مقاله کرده خیلی ساده(یک طورهایی نرمال کردن برحسب میانگین) است من از این بخش می‌گذرم و سراغ نمودار بعدی میرم.

این تصویر نمره‌ی بچه‌ها در مناطق مختلفه، همون‌طور که می‌بینید اصلا یک‌پارچه نیست و اختلاف محله‌ها با هم کاملا مشهوده.
این تصویر نمره‌ی بچه‌ها در مناطق مختلفه، همون‌طور که می‌بینید اصلا یک‌پارچه نیست و اختلاف محله‌ها با هم کاملا مشهوده.

ما جدول رو به نیمکت ترجیح دادیم

حالا ما می‌خوایم ببینیم چقدر و واقعا چرا توزیع نمره‌ی بچه‌ها یک‌پارچه نیست:؟. مشکل چیه که یک محله کلا وضع بدتری از لحاظ تحصیل داره.

برای مشاهده‌ی این قضیه از یک شاخص که در جامعه‌شناسی برای سطح محله‌های مختلف تعریف شده به اسم socioeconomic status -SES استفاده می‌کنیم؛ این شاخص مثلا با توجه به توزیع درآمد آدم‌های مختلف، درصد قبولی دانشگاه، درصد تک‌والدی تو اون منطقه و… یک طورهایی می‌خواد شاخص خوب یا بد بودن این محله رو نشون بده. حالا این شاخص رو می‌ندازیم رو داده‌ی نمره‌ها که قبلا به دست آوردیم که ببینیم محلیت چقدر واقعا بر روی تحصیل موثره.

نمودار نمره بچه‌ها برحسب SES
نمودار نمره بچه‌ها برحسب SES

خب قابل پیش‌بینی بود؛ به شکل خوبی صعودیه. تو نمودار پایین بچه‌های فقیر از بقیه جدا شدن. این جدا شدن آدم‌ها هم بر حسب این‌ه که آیا reduced price lunch بهشون تعلق می‌گیره یا نه؛ یه جور کوپن که به آدم‌های فقیرتر تو آمریکا داده میشه.

هم‌اکنون گپ عمودی و اختلاف شیب خط‌ها و توزیع افقی رو خودتون مشاهده کنید.
هم‌اکنون گپ عمودی و اختلاف شیب خط‌ها و توزیع افقی رو خودتون مشاهده کنید.

مشکل چیه

خب اولین مشکلی که آدم به ذهنش می‌رسه این‌ه که مدارس منطقه‌های فقیر از مالیات کمتری تغذیه می‌کنن پس عملکرد ضعیف‌تری دارند. پس بیایم توزیع نمره‌ی بچه‌ها بر حسب پولی که برای تحصیل کنار می‌گذارند ببینیم.

نمودار نمره‌ی بچه‌ها بر حسب بودجه استفاده شده برای هر نفر
نمودار نمره‌ی بچه‌ها بر حسب بودجه استفاده شده برای هر نفر

همون‌طور که می‌بینید و قابل پیش‌بینی هم بود همینجور یاعلی مددی بودجه اختصاص دادن برای تحصیل نه که تاثیری نداشته‌باشد، اما تاثیر خیلی کمی( corr = 0.14) دارد. پس بیایم یکم تاثیر سیاست‌های مختلف رو دقیق‌تر نگاه کنیم تو چند تا آزمایش. در کل دو مدل سیاست رو میشه متصور شد؛ یکی کمک دولتی به مدرسه‌ها برای بهتر شدن کیفیت‌شون، دومی درست کردن مدرسه‌های خیریه‌ی مختلف یا کمک‌هزینه دادن به بچه‌های خاص برای رفتن به مدرسه‌ها خصوصی۲. چِتی تو بخش آخر درس سراغ این دو تا سیاست میره و این موضوع رو تا جلسه بعد هم ادامه میده.

سیاست اول

واقعا چقدر بهتر کردن مدرسه‌های دولتی تاثیر داره؟ برای بهتر کردن یک مدرسه چه کارهایی میشه کرد؟ یکی دو تا از اصلی‌ترین کارهایی که معمولا بهش فکر می‌کنیم کمتر کردن جمعیت کلاس‌ها و بهتر کردن کیفیت معلم‌هاست. تو قسمت آخر این جلسه صرفا می‌رسیم تاثیر جمعیت کلاس رو نگاه کنیم. جلسه بعد هم سراغ مدرسه‌های غیرانتفاعی و تاثیر معلم‌ها می‌ریم.

جمعیت کلاس

اولین آزمایشی که به ذهن آدم می‌رسه خب همینه که ایزی؛ میایم توزیع درآمد یا قبولی دانشگاه آدم‌ها رو برحسب جمعیت کلاس‌هاشون تو بچگی ببینیم. ولی این مشکل داره؛ منطقا تاثیر علّی رو نمیشه از این آزمایش برداشت کرد. خب پس می‌تونیم چی کار کنیم:؟. سعی کنیم مثل جلسه قبل عمل کنیم و از ناپیوستگی رگرسیون استفاده کنیم!

سوئد

قضیه اینه که سوئد سقف جمعیت ۲۵نفر برای کلاس‌هاش داره؛ و اگر یه کلاسی به هر دلیلی به ۲۶نفر برسه باید طبق قانون به ۲تا کلاس ۱۳نفره تقسیم بشه. پس اینجا مورد خوبی برای آزمایش به شکل ناپیوستگی رگرسیون هست. در نمودار زیر این قطعی نمودار، تعداد دانش‌آموزان در کلاس برحسب تعداد کل بچه‌هایی که در آن منطقه برای مدرسه -چهارم ابتدایی- ثبت‌نام کرده‌اند نشان می‌دهد.

نمودار تعداد افراد حاضر در یک کلاس بر حسب تعداد ثبت‌نامی در سوئد
نمودار تعداد افراد حاضر در یک کلاس بر حسب تعداد ثبت‌نامی در سوئد

حالا ببینیم که این اختلاف تعداد دانش‌آموزان در کلاس چقدر روی قبولی در دانشگاه یا درآمد تاثیر دارد.

این نمودار اختلاف نمره‌ی این بچه‌ها در ۱۳سالگی(بعد از حدود ۴سال شرکت در کلاس‌های مختلف) رو نشون میده. همون‌طور که می‌بینید اختلاف جمعیت کلاس از ۲۵ به ۱۳نفر باعث یک قطعی ۸درصدی در نمودار نمره‌ی بچه‌ها شده؛‌ در واقع اگه فقط ۵نفر از جمعیت کلاس‌ها کم بشه ۸درصد نمره‌شون بالاتر میره.

و این نمودار که قطعی(cutoff) نمودار درآمد افراد رو برحسب تغییر جمعیت کلاس‌شون نشون میده. همون‌طور که می‌بینید در کل حدود ۴درصد، کم شدن حدود ۵نفر از جمعیت کلاس روی درآمد افراد در بزرگسالی تاثیر داره. این خیلی تاثیر زیادی‌ه؛ در واقع یک بازی عددی: میانگین کل درآمد یک بچه که در صدک ۲۵ام جامعه بزرگ می‌شود ۵۰۰هزار دلار است. ۴درصد این ۵۰۰هزاردلار می‌کند به عبارتی ۲۰هزار دلار، پس تقسیم یک کلاس ۳۰ نفره به دو کلاس ۱۵ نفره باعث افزایش درآمد در حدود ۶۰۰هزاردلار می‌شود؛ بعید است هزینه‌ی اضافه کردن یک کلاس اضافه (معلم و مکان کلاس و …) به ۶۰۰هزار دلار برسد.


این جلسه اینجا تموم میشه. چتی تو این جلسه مسیر تحلیل جالبی رو میاد، و ادامه‌ش رو برای جلسه‌ی بعد می‌گذاره. همین.


-----

۱-خانم فیروزآبادی: نام معلم اول ابتدایی بنده.

۲- تو این قضیه سمپاد هم یادتون باشه این دوگانه رو یک طورایی می‌شد دید.