منبع اصلی این پست، دوره آمار و احتمال مهندسی دکتر علی شریفی زارچی از آکادمی مکتبخونه میباشد. لطفاً برای حفظ حقوق منتشر کننده اصلی، ویدیوهارو از منبع اصلی دنبال کنید. همچنین، در انتهای هر جلسه، به ویدیو مربوط به آن جلسه ارجاع داده شده است.
سعی کردم هرچیزی که از ویدیوها فهمیدم رو به صورت متن در بیارم و در این پلتفورم با بقیه به اشتراک بذارم. کل ویدیوها 27 تاست که سعی میکنم هفتهای یک الی دو جلسه رو منتشر کنم. تا جایی که تونستم سعی کردم خوب و کامل بنویسم، اما اگر جایی ایرادی داشت، حتما تو کامنتها بهم بگید تا درستش کنم.
پیشنهاد میکنم قبل از خوندن ادامه مطلب، یک کاغذ و قلم جلو دستتون باشه تا بتونید روابط ارائه شده رو در جاهایی که لازم هست برای خودتون تو کاغذ بنویسید و محاسبات لازم رو خودتون هم انجام بدین تا بهتر متوجه بشید که در هر مرحله چه اتفاقی میفته.
در جلسه گذشته دیدیم که اگر هر تعداد متغیر تصادفی مستقل از یک توزیع یکسان بیان، این متغیرهارو باهم جمع بزنیم در نهایت به یک توزیع نرمال میرسیم. حالا سوال پیش میاد که چرا چنین اتفاقی میفته؟ چرا در نهایت به یک توزیع نرمال میرسیم؟ این از یک قضیهای میاد که اسمش قضیه حد مرکزی هست و این جلسه قراره در موردش یاد بگیریم.
اگر X1, X2, X3, ..., Xn متغیرهای تصادفی مستقل از یک توزیع یکسان باشن، با میل دادن n به بینهایت باعث میشه که حاصل جمع متغیرهای تصادفی به توزیع نرمال میل کنه. حالا این توزیع نرمال چه میانگین و چه واریانسی داره؟ میانگین و واریانس برابر هست با جمع میانگینها و جمع واریانسها و اگر n به سمت بینهایت بره، باعث میشه میانگین و واریانس هم به بینهایت میل کنن.
برای اینکه جلوی این کار رو بگیریم و نذاریم میانگین و واریانس به بینهایت برسن میایم میانگین و واریانس رو استاندارد میکنیم.
با این کار جلوی بینهایت شدن میانگین و واریانس رو میگیریم و با میل کردن n به سمت بینهایت باعث میشیم که میانگین و واریانس از یک توزیع نرمال استاندارد N(0 , 1) تبعیت کنن. یعنی میانگین 0 و واریانس 1.
حالا، یه سوال. اگر X1, X2, ..., Xn از هم مستقل نباشن، باز هم این قضیه برقراره؟ خیر. مثلاً اگر یک توزیعی داشته باشیم که یک سری از Xiها منفی یک سری Xi دیگه باشن. تو این حالت اگر همه Xiهارو باهم جمع بزنیم همواره جواب 0 میشه و اصلاً از توزیع نرمال پیروی نمیکنه.
یه سوال دیگه. اگر X1, X2, ..., Xn از هم مستقل باشن، ولی از یک توزیع یکسان نیان چی؟ در این حالت اگر جمع بزنیم Xi هارو توزیع نهایی به چه صورت میشه؟ یک مثال نقض ساده میشه آورد و نشون داد که تو این حالت هم باز جمع متغیرهای تصادفی مستقل از توزیع نرمال پیروی نمیکنه.
فرض کنید X1 یک توزیع یکنواخت هست و مقادیر زیر رو میتونه داشته باشه:
X1 ∈ {0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9}
متغیر X2 هم از یک توزیع یکنواخت اومده و مقادیر زیر رو داره:
X2 ∈ {0, 0.01, 0.02, 0.03, 0.04, 0.05, 0.06, 0.07, 0.08, 0.09}
متغیر X3 هم از یک توزیع یکنواخت اومده و مقادیر زیر رو داره:
X3 ∈ {0, 0.001, 0.002, 0.003, 0.004, 0.005, 0.006, 0.007, 0.008, 0.009}
به همین ترتیب متغیر Xi هم از یک توزیع یکنواخت اومده و مقادیر زیر رو داره:
Xi ∈ {0, 1 * 10^-i, 2 * 10^-i, 3 * 10^-i, 4 * 10^-i, ..., 8 * 10^-i, 9 * 10^-i}
حالا، اگر بیایم مقادیر X1, X2, ..., Xn رو باهم جمع بزنیم و n به بینهایت میل کنه، توزیع نهایی یک توزیع یکنواخت بین 0 تا 1 پیدا میکنه. چرا اینطوری میشه؟ متغیر X1 میاد رقم دهم رو در نهایت مشخص میکنه. متغیر X2 میاد رقم صدم رو در نهایت مشخص میکنه. متغیر X3 میاد رقم هزارم رو در نهایت مشخص میکنه و همینطور الی آخر. در نهایت به یک توزیع یکنواخت میرسیم.
پس، اگر متغیرهای تصادفی مستقل از هم نباشن، یا از توزیعهای یکسان نیان، نمیتونیم قضیه حد مرکزی رو براشون تعریف کنیم و این دو شرط حتماً باید لحاظ بشن.
در ادامه میخوایم ببینیم قضیه حد مرکزی اصلا به چه دردی میخوره و یکی دو تا مثال ازش ببینیم.
مثال زیر رو در نظر بگیرید:
خب با توجه به صورت مسئله در نهایت باید n رو پیدا کنیم. الان یک سری Xi مستقل از هم داریم که دارن از یک توزیعی که نمیدونیم چیه میان با میانگین µ و واریانس 9. حالا با استفاده از قضیه حد مرکزی میدونیم که رابطه زیر برقراره:
در گام بعدی باید خطارو تعریف کنیم.
دنبال این هستیم که µ رو اندازه گیری کنیم. فرض کنید چیزی که داریم بعنوان µ اندازهگیری میکنیم معدل باشه که به صورت زیر تعریف میشه:
در واقع انگار دو تا µ داریم. یکی µ واقعی هست و یکی µ تخمین زده شده هست. µ تخمین زده شده همون معدله که گفتیم. در نهایت دنبال این هستیم که µ تخمین زده شده از µ واقعی با احتمال 95 درصد حداکثر 1 واحد فاصله داشته باشه. این اختلاف خطارو بهمون میده.
اگر چیزی که گفتیم رو به بیان ریاضی بنویسیم داریم:
حالا، رابطه بالا رو جوری بازنویسی میکنیم که Zn توش ظاهر بشه:
میدونیم که Zn از توزیع نرمال استاندارد پیروی میکنه. از طرفی میدونیم که جواب احتمال بالا 95 درصد میشه. دنبال پیدا کردن n هستیم. عکس زیر رو ببینید. برای محاسبه احتمال میتونیم بیایم احتمال از منفی بینهایت تا radical(n) / 3 رو محاسبه کنیم. بعد احتمال از منفی بینهایت تا منفی radical(n) / 3 رو محاسبه کنیم. در نهایت این دو مقدار رو از هم کم کنیم تا احتمال قسمت هاشور خورده رو که همون 0.95 هست بهمون بده.
پس اگر چیزایی که تا اینجا گفتیم رو به ریاضی بنویسیم داریم:
در جلسات قبلی دیدیم که Phi(-a) برابر هست با 1 منهای Phi(a). پس داریم:
Phi(√n / 3) - (- Phi(√n / 3)) = Phi(√n / 3) - (1 - Phi(√n / 3)) = 0.95 Phi(√n / 3) + Phi(√n / 3) - 1 = 0.95 2 Phi(√n / 3) = 1.95 Phi(√n / 3) = 1.95 / 2 = 0.975
حالا چه عددی هست که Phi اون برابر میشه با 0.975؟ این رو میشه با R محاسبه کرد که برابر هست با 1.96.
در نهایت داریم:
√n / 3 = 1.96 √n = 5.88 n = 34.57
پس حداقل باید 35 مشاهده انجام بشه تا ستاره شناس به چیزی که دنبالشه برسه.
حالا بریم سراغ یک مثال دیگه:
خب با توجه به صورت مسئله میدونیم که Xiها دارن از یک توزیع ناشناخته میان، با میانگین 30 و واریانس 4. دنبال چی هستیم؟ دنبال به دست آوردن احتمال زیر:
حالا، میدونیم که توزیع نهایی داره از یک توزیع نرمال میاد و اگر رابطه بالا رو استاندارد کنیم، توزیعی که داره استاندارد نرمال میشه. پس داریم:
حالا الان کافیه که فقط چیزی که پایین ساختیم رو تو رابطه بالا به وجود بیاریم و مسئله حل میشه:
مقدار Phi(-3) رو هم میشه با R محاسبه کرد و در نهایت به عدد 0.001 میرسیم.
حالا، بریم سراغ یک مثال دیگه.
خب تو این سوال بهمون یک بازه a تا b رو دادن که داره وزن بستههارو مشخص میکنه و باید میانگین و واریانس رو از روی این بازه محاسبه کنیم.
میانگین برابر میشه با:
E(X) = (a + b) / 2 = (10 + 50) / 2 = 30
واریانس رو چجوری محاسبه کنیم؟ برای واریانس داریم:
که در نهایت اگر محاسبات و سادهسازیهارو انجام بدیم خواهیم داشت:
پس مقدار واریانس میشه 400/3 و مقدار انحراف از معیار هم میشه:
40 / radical(12)
حالا با استفاده از قضیه حد مرکزی توزیع زیر که از یک نرمال استاندارد پیروی میکنه به دست میاد:
سوال هم خواسته که در نهایت مقدار زیر رو محاسبه کنیم:
برای رسیدن به جواب، باید توزیع Zn رو تو احتمال بالا به وجود بیاریم. داریم:
در نهایت جواب به صورت زیر میشه:
که اگر محاسبات رو با R انجام بدیم خواهیم داشت 0.0048.
توزیع یکنواخت توزیعی هست که با جمع تعداد کم متغیر تصادفی مستقل ازش هم خیلی زود به توزیع نرمال میرسه. مثلاً تو نمودار زیر فقط 5 تا متغیر تصادفی مستقل از توزیع یکنواخت باهم جمع شدن:
بدیهی هست که هرچقدر تعداد متغیرها بیشتر بشه، نمودار آبی خیلی بیشتر شبیه میشه به نمودار قرمز و در نهایت کاملاً روش میفته.
با قضیه حد مرکزی آشنا شدیم و چند تا مثال مختلف ازش رو حل کردیم.
اگر جایی ایراد یا مشکلی بود، حتما بهم بگید تا تصحیحش کنم. همچنین، پیشنهاد میکنم که حتماً صفحه گیتهاب این دوره رو مورد بررسی قرار بدین. حتماً به دردتون میخوره.