این پست دوازدهم درس Using Big Data to Solve Economic and Social Problems -که سال ۲۰۱۹ برای ۳۷۵تا دانشجو تو هاروارد ارائه شده- هستش که ما دور هم که میدیدیم همینجور چیزهایی که بامزه بود رو مینوشتیم و برای من خیلی جالب و جدید بود، نوشتههای اول، دوم، سوم، چهارم، پنجم، ششم، هفتم، هشتم، نهم، دهم و یازدهم رو میتونید اینجاها بخونید.
این نوشته هم برای جلسهی هفتم درس و یازدهمین نوشتهس؛ موضوع: «K-12 Education».
ما همچنان در بحث رویای آمریکایی و پیشرفت در طبقات جامعه(upward mobility) هستیم. بعد از صحبت راجع به دانشگاهها میخوایم سراغ مدارس ابتدایی بریم؛ تحصیلات K-12 در آمریکا یک طورهایی همون مدارس ابتدایی تا دبیرستان در ایران است. در واقع بخش پایینی این نمودار(که از ویکیپدیا برداشتم) تحصیلات K-12 است.
تو این قسمت درس، چِتی میخواد کمی تاثیر این تحصیلات و مدلهای مختلفش رو در پیشرفت آدمها در جامعه ببینه. باحاله این قسمت ببینید فیلم یا اسلاید یا این خلاصهش رو.
دولت آمریکا حدود ۱۰ به توان ۱۲ دلار در سال برای مدارس هزینه میکنه. سیستم ادارهی مدارس در آمریکا غیرمتمرکزه؛ به این شکل که هزینهی مدارس عمومی هر منطقه از مالیات همون منطقه تامین میشه و تبعا سرمایهی مدارس مناطق پولدار بیشتر از فقیرهاست. مدارس غیرانتفاعی و خیریه هم که حسابشون جداست. اکثرا ما به شکل کیفی تاثیر مدارس یا سازمانها رو اندازه میگرفتیم؛ مثلا میریم با مدیر مدرسه مصاحبه میکنیم، از بچهها نظرشون رو میپرسیم، پرسشنامه پخش میکنیم و… . نکتهی جالب این درس همینه که این چیز میزا رو میریزیم دور و از روی حرف حساب سعی میکنیم یه چیزهایی بفهمیم.
تو این جلسه راجع به ۴ مقاله حرف میزنیم. اولی «چقدر کلاس مهدکودک شما روی درآمد بزرگسالیتون تاثیر داره؟»، دومی «جغرافیای شکافهای نژادی در آزمونهای کلی مدارس» (عجب ترجمهای اه)، سومی «تاثیرات بلند مدت جمعیت کلاسهای مدرسه»، چهارمی «اندازهگیری تاثیرات دو دسته از معلمها».
دادهای که در این بخش داریم نمرهی دستهای از بچهها در تحصیلات خیلی ابتدایی -kindergarten- است. سوالی که به وجود میآید این است که آیا نمرهی مهدکودک بچهها در موفقیت آیندهی بچهها موثر است؟ در واقع چقدر نمرهی بچهها ناشی از به دست آوردن توانایی آنها است و چقدر ناشی از مثلا بهتر امتحان دادن آنها. چِتی در سال ۲۰۱۱ این مساله رو با نمرهی ۱۲هزار دانشآموز سال ۱۹۸۵ بررسی کرده؛ نتایجش عجیبه.
آزمونهای مهدکودک رو اگه یادتون باشه در این حد ساده بودند. مثلا این که دور کلمهی همتلفظ خط بکشید.
این نمودار رو ببینید خیلی عجیبه.
این نمودار داره میانگین درآمد افراد در ۲۷-۲۵سالگی برحسب نمره آزمون مهدکودکشون رو نشون میده. همونطور که میبینید به طرز زیادی این ۲ مورد با هم همبستهاند!. (یکم بهش فکر کنید؛ خیلی عجیبه)
البته دو تا نکته وجود دارند که باید بهشون توجه کرد. اولی این که این نقطه دادهها واریانس زیادی دارند. دومی هم این که این دو تا صرفا «همبسته» هستند، وابسته یا رابطهی عِلّی بینشون برقرار نیست. شاید هر دو معلول یک چیز سومی باشه؛ برای مثال شرایط خونوادگی خوب و بد، هوش بچه و … .
این نمودارها چون برای من خیلی جالب بود همهش رو میذارم اینجا که ببینید.
خب پس تا الان فهمیدیم که نمرهی آدمها در مدرسه با پیشرفت اجتماعیشون در آینده همبستگی زیادی داره؛ پس میتونیم از توزیع نمرهی بچهها در جامعه به عنوان یک پارامتر برای تحلیل استفاده کنیم. اینجا چِتی به یک مشکلی اشاره میکنه که این هست که هر ایالت برای خودش آزمون میگیره و نمرهها قابل مقایسه نیستند، بعد یک مقالهای رو معرفی میکنه برای سال ۲۰۱۶ که تلاش کرده این نمرهها رو تبدیل به یک چیز قابلمقایسه کنه که بتونیم پیش بریم؛ چون کاری که تو مقاله کرده خیلی ساده(یک طورهایی نرمال کردن برحسب میانگین) است من از این بخش میگذرم و سراغ نمودار بعدی میرم.
حالا ما میخوایم ببینیم چقدر و واقعا چرا توزیع نمرهی بچهها یکپارچه نیست:؟. مشکل چیه که یک محله کلا وضع بدتری از لحاظ تحصیل داره.
برای مشاهدهی این قضیه از یک شاخص که در جامعهشناسی برای سطح محلههای مختلف تعریف شده به اسم socioeconomic status -SES استفاده میکنیم؛ این شاخص مثلا با توجه به توزیع درآمد آدمهای مختلف، درصد قبولی دانشگاه، درصد تکوالدی تو اون منطقه و… یک طورهایی میخواد شاخص خوب یا بد بودن این محله رو نشون بده. حالا این شاخص رو میندازیم رو دادهی نمرهها که قبلا به دست آوردیم که ببینیم محلیت چقدر واقعا بر روی تحصیل موثره.
خب قابل پیشبینی بود؛ به شکل خوبی صعودیه. تو نمودار پایین بچههای فقیر از بقیه جدا شدن. این جدا شدن آدمها هم بر حسب اینه که آیا reduced price lunch بهشون تعلق میگیره یا نه؛ یه جور کوپن که به آدمهای فقیرتر تو آمریکا داده میشه.
خب اولین مشکلی که آدم به ذهنش میرسه اینه که مدارس منطقههای فقیر از مالیات کمتری تغذیه میکنن پس عملکرد ضعیفتری دارند. پس بیایم توزیع نمرهی بچهها بر حسب پولی که برای تحصیل کنار میگذارند ببینیم.
همونطور که میبینید و قابل پیشبینی هم بود همینجور یاعلی مددی بودجه اختصاص دادن برای تحصیل نه که تاثیری نداشتهباشد، اما تاثیر خیلی کمی( corr = 0.14) دارد. پس بیایم یکم تاثیر سیاستهای مختلف رو دقیقتر نگاه کنیم تو چند تا آزمایش. در کل دو مدل سیاست رو میشه متصور شد؛ یکی کمک دولتی به مدرسهها برای بهتر شدن کیفیتشون، دومی درست کردن مدرسههای خیریهی مختلف یا کمکهزینه دادن به بچههای خاص برای رفتن به مدرسهها خصوصی۲. چِتی تو بخش آخر درس سراغ این دو تا سیاست میره و این موضوع رو تا جلسه بعد هم ادامه میده.
واقعا چقدر بهتر کردن مدرسههای دولتی تاثیر داره؟ برای بهتر کردن یک مدرسه چه کارهایی میشه کرد؟ یکی دو تا از اصلیترین کارهایی که معمولا بهش فکر میکنیم کمتر کردن جمعیت کلاسها و بهتر کردن کیفیت معلمهاست. تو قسمت آخر این جلسه صرفا میرسیم تاثیر جمعیت کلاس رو نگاه کنیم. جلسه بعد هم سراغ مدرسههای غیرانتفاعی و تاثیر معلمها میریم.
اولین آزمایشی که به ذهن آدم میرسه خب همینه که ایزی؛ میایم توزیع درآمد یا قبولی دانشگاه آدمها رو برحسب جمعیت کلاسهاشون تو بچگی ببینیم. ولی این مشکل داره؛ منطقا تاثیر علّی رو نمیشه از این آزمایش برداشت کرد. خب پس میتونیم چی کار کنیم:؟. سعی کنیم مثل جلسه قبل عمل کنیم و از ناپیوستگی رگرسیون استفاده کنیم!
قضیه اینه که سوئد سقف جمعیت ۲۵نفر برای کلاسهاش داره؛ و اگر یه کلاسی به هر دلیلی به ۲۶نفر برسه باید طبق قانون به ۲تا کلاس ۱۳نفره تقسیم بشه. پس اینجا مورد خوبی برای آزمایش به شکل ناپیوستگی رگرسیون هست. در نمودار زیر این قطعی نمودار، تعداد دانشآموزان در کلاس برحسب تعداد کل بچههایی که در آن منطقه برای مدرسه -چهارم ابتدایی- ثبتنام کردهاند نشان میدهد.
حالا ببینیم که این اختلاف تعداد دانشآموزان در کلاس چقدر روی قبولی در دانشگاه یا درآمد تاثیر دارد.
این نمودار اختلاف نمرهی این بچهها در ۱۳سالگی(بعد از حدود ۴سال شرکت در کلاسهای مختلف) رو نشون میده. همونطور که میبینید اختلاف جمعیت کلاس از ۲۵ به ۱۳نفر باعث یک قطعی ۸درصدی در نمودار نمرهی بچهها شده؛ در واقع اگه فقط ۵نفر از جمعیت کلاسها کم بشه ۸درصد نمرهشون بالاتر میره.
و این نمودار که قطعی(cutoff) نمودار درآمد افراد رو برحسب تغییر جمعیت کلاسشون نشون میده. همونطور که میبینید در کل حدود ۴درصد، کم شدن حدود ۵نفر از جمعیت کلاس روی درآمد افراد در بزرگسالی تاثیر داره. این خیلی تاثیر زیادیه؛ در واقع یک بازی عددی: میانگین کل درآمد یک بچه که در صدک ۲۵ام جامعه بزرگ میشود ۵۰۰هزار دلار است. ۴درصد این ۵۰۰هزاردلار میکند به عبارتی ۲۰هزار دلار، پس تقسیم یک کلاس ۳۰ نفره به دو کلاس ۱۵ نفره باعث افزایش درآمد در حدود ۶۰۰هزاردلار میشود؛ بعید است هزینهی اضافه کردن یک کلاس اضافه (معلم و مکان کلاس و …) به ۶۰۰هزار دلار برسد.
این جلسه اینجا تموم میشه. چتی تو این جلسه مسیر تحلیل جالبی رو میاد، و ادامهش رو برای جلسهی بعد میگذاره. همین.
-----
۱-خانم فیروزآبادی: نام معلم اول ابتدایی بنده.
۲- تو این قضیه سمپاد هم یادتون باشه این دوگانه رو یک طورایی میشد دید.