خواندن ۷ دقیقه·۳ سال پیش

جزوه دوره آمار و احتمال دکتر علی شریفی - جلسه شانزدهم - قضیه حد مرکزی

منبع اصلی این پست، دوره آمار و احتمال مهندسی دکتر علی شریفی زارچی از آکادمی مکتبخونه می‌باشد. لطفاً برای حفظ حقوق منتشر کننده اصلی، ویدیوهارو از منبع اصلی دنبال کنید. همچنین، در انتهای هر جلسه، به ویدیو مربوط به آن جلسه ارجاع داده شده است.

سعی کردم هرچیزی که از ویدیوها فهمیدم رو به صورت متن در بیارم و در این پلت‌فورم با بقیه به اشتراک بذارم. کل ویدیوها 27 تاست که سعی می‌کنم هفته‌ای یک الی دو جلسه رو منتشر کنم. تا جایی که تونستم سعی کردم خوب و کامل بنویسم، اما اگر جایی ایرادی داشت، حتما تو کامنت‌ها بهم بگید تا درستش کنم.

پیشنهاد می‌کنم قبل از خوندن ادامه مطلب، یک کاغذ و قلم جلو دستتون باشه تا بتونید روابط ارائه شده رو در جاهایی که لازم هست برای خودتون تو کاغذ بنویسید و محاسبات لازم رو خودتون هم انجام بدین تا بهتر متوجه بشید که در هر مرحله چه اتفاقی میفته.

در جلسه گذشته دیدیم که اگر هر تعداد متغیر تصادفی مستقل از یک توزیع یکسان بیان، این متغیرهارو باهم جمع بزنیم در نهایت به یک توزیع نرمال می‌رسیم. حالا سوال پیش میاد که چرا چنین اتفاقی میفته؟ چرا در نهایت به یک توزیع نرمال می‌رسیم؟ این از یک قضیه‌ای میاد که اسمش قضیه حد مرکزی هست و این جلسه قراره در موردش یاد بگیریم.

قضیه حد مرکزی

اگر X1, X2, X3, ..., Xn متغیرهای تصادفی مستقل از یک توزیع یکسان باشن، با میل دادن n به بی‌نهایت باعث میشه که حاصل جمع متغیرهای تصادفی به توزیع نرمال میل کنه. حالا این توزیع نرمال چه میانگین و چه واریانسی داره؟ میانگین و واریانس برابر هست با جمع میانگین‌ها و جمع واریانس‌ها و اگر n به سمت بی‌نهایت بره، باعث میشه میانگین و واریانس هم به بی‌نهایت میل کنن.

برای اینکه جلوی این کار رو بگیریم و نذاریم میانگین و واریانس به بی‌نهایت برسن میایم میانگین و واریانس رو استاندارد می‌کنیم.

با این کار جلوی بی‌نهایت شدن میانگین و واریانس رو می‌گیریم و با میل کردن n به سمت بی‌نهایت باعث میشیم که میانگین و واریانس از یک توزیع نرمال استاندارد N(0 , 1) تبعیت کنن. یعنی میانگین 0 و واریانس 1.

حالا، یه سوال. اگر X1, X2, ..., Xn از هم مستقل نباشن، باز هم این قضیه برقراره؟ خیر. مثلاً اگر یک توزیعی داشته باشیم که یک سری از Xiها منفی یک سری Xi دیگه باشن. تو این حالت اگر همه Xiهارو باهم جمع بزنیم همواره جواب 0 میشه و اصلاً از توزیع نرمال پیروی نمی‌کنه.

یه سوال دیگه. اگر X1, X2, ..., Xn از هم مستقل باشن، ولی از یک توزیع یکسان نیان چی؟ در این حالت اگر جمع بزنیم Xi هارو توزیع نهایی به چه صورت میشه؟ یک مثال نقض ساده میشه آورد و نشون داد که تو این حالت هم باز جمع متغیرهای تصادفی مستقل از توزیع نرمال پیروی نمی‌کنه.

فرض کنید X1 یک توزیع یکنواخت هست و مقادیر زیر رو می‌تونه داشته باشه:

X1 ∈ {0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9}

متغیر X2 هم از یک توزیع یکنواخت اومده و مقادیر زیر رو داره:

X2 ∈ {0, 0.01, 0.02, 0.03, 0.04, 0.05, 0.06, 0.07, 0.08, 0.09}

متغیر X3 هم از یک توزیع یکنواخت اومده و مقادیر زیر رو داره:

X3 ∈ {0, 0.001, 0.002, 0.003, 0.004, 0.005, 0.006, 0.007, 0.008, 0.009}

به همین ترتیب متغیر Xi هم از یک توزیع یکنواخت اومده و مقادیر زیر رو داره:

Xi ∈ {0, 1 * 10^-i, 2 * 10^-i, 3 * 10^-i, 4 * 10^-i, ..., 8 * 10^-i, 9 * 10^-i}

حالا، اگر بیایم مقادیر X1, X2, ..., Xn رو باهم جمع بزنیم و n به بی‌نهایت میل کنه، توزیع نهایی یک توزیع یکنواخت بین 0 تا 1 پیدا می‌کنه. چرا اینطوری میشه؟ متغیر X1 میاد رقم دهم رو در نهایت مشخص می‌کنه. متغیر X2 میاد رقم صدم رو در نهایت مشخص می‌کنه. متغیر X3 میاد رقم هزارم رو در نهایت مشخص می‌کنه و همینطور الی آخر. در نهایت به یک توزیع یکنواخت می‌رسیم.

پس، اگر متغیرهای تصادفی مستقل از هم نباشن، یا از توزیع‌های یکسان نیان، نمی‌تونیم قضیه حد مرکزی رو براشون تعریف کنیم و این دو شرط حتماً باید لحاظ بشن.

در ادامه می‌خوایم ببینیم قضیه حد مرکزی اصلا به چه دردی میخوره و یکی دو تا مثال ازش ببینیم.

مثال زیر رو در نظر بگیرید:

خب با توجه به صورت مسئله در نهایت باید n رو پیدا کنیم. الان یک سری Xi مستقل از هم داریم که دارن از یک توزیعی که نمی‌دونیم چیه میان با میانگین µ و واریانس 9. حالا با استفاده از قضیه حد مرکزی می‌دونیم که رابطه زیر برقراره:

در گام بعدی باید خطارو تعریف کنیم.

دنبال این هستیم که µ رو اندازه گیری کنیم. فرض کنید چیزی که داریم بعنوان µ اندازه‌گیری می‌کنیم معدل باشه که به صورت زیر تعریف میشه:

در واقع انگار دو تا µ داریم. یکی µ واقعی هست و یکی µ تخمین زده شده هست. µ تخمین زده شده همون معدله که گفتیم. در نهایت دنبال این هستیم که µ تخمین زده شده از µ واقعی با احتمال 95 درصد حداکثر 1 واحد فاصله داشته باشه. این اختلاف خطارو بهمون میده.

اگر چیزی که گفتیم رو به بیان ریاضی بنویسیم داریم:

حالا، رابطه بالا رو جوری بازنویسی می‌کنیم که Zn توش ظاهر بشه:

می‌دونیم که Zn از توزیع نرمال استاندارد پیروی می‌کنه. از طرفی می‌دونیم که جواب احتمال بالا 95 درصد میشه. دنبال پیدا کردن n هستیم. عکس زیر رو ببینید. برای محاسبه احتمال می‌تونیم بیایم احتمال از منفی بی‌نهایت تا radical(n) / 3 رو محاسبه کنیم. بعد احتمال از منفی بی‌نهایت تا منفی radical(n) / 3 رو محاسبه کنیم. در نهایت این دو مقدار رو از هم کم کنیم تا احتمال قسمت هاشور خورده رو که همون 0.95 هست بهمون بده.

پس اگر چیزایی که تا اینجا گفتیم رو به ریاضی بنویسیم داریم:

در جلسات قبلی دیدیم که Phi(-a) برابر هست با 1 منهای Phi(a). پس داریم:

Phi(√n / 3) - (- Phi(√n / 3)) = Phi(√n / 3) - (1 - Phi(√n / 3)) = 0.95
Phi(√n / 3) + Phi(√n / 3) - 1 = 0.95
2 Phi(√n / 3) = 1.95
Phi(√n / 3) = 1.95 / 2 = 0.975

حالا چه عددی هست که Phi اون برابر میشه با 0.975؟ این رو میشه با R محاسبه کرد که برابر هست با 1.96.

در نهایت داریم:

√n / 3 = 1.96
√n = 5.88
n = 34.57

پس حداقل باید 35 مشاهده انجام بشه تا ستاره شناس به چیزی که دنبالشه برسه.

حالا بریم سراغ یک مثال دیگه:

خب با توجه به صورت مسئله می‌دونیم که Xiها دارن از یک توزیع ناشناخته میان، با میانگین 30 و واریانس 4. دنبال چی هستیم؟ دنبال به دست آوردن احتمال زیر:

حالا، می‌دونیم که توزیع نهایی داره از یک توزیع نرمال میاد و اگر رابطه بالا رو استاندارد کنیم، توزیعی که داره استاندارد نرمال میشه. پس داریم:

حالا الان کافیه که فقط چیزی که پایین ساختیم رو تو رابطه بالا به وجود بیاریم و مسئله حل میشه:

مقدار Phi(-3) رو هم میشه با R محاسبه کرد و در نهایت به عدد 0.001 می‌رسیم.

حالا، بریم سراغ یک مثال دیگه.

خب تو این سوال بهمون یک بازه a تا b رو دادن که داره وزن بسته‌هارو مشخص می‌کنه و باید میانگین و واریانس رو از روی این بازه محاسبه کنیم.

میانگین برابر میشه با:

E(X) = (a + b) / 2 = (10 + 50) / 2 = 30

واریانس رو چجوری محاسبه کنیم؟ برای واریانس داریم:

که در نهایت اگر محاسبات و ساده‌سازی‌هارو انجام بدیم خواهیم داشت:

پس مقدار واریانس میشه 400/3 و مقدار انحراف از معیار هم میشه:

40 / radical(12)

حالا با استفاده از قضیه حد مرکزی توزیع زیر که از یک نرمال استاندارد پیروی میکنه به دست میاد:

سوال هم خواسته که در نهایت مقدار زیر رو محاسبه کنیم:

برای رسیدن به جواب، باید توزیع Zn رو تو احتمال بالا به وجود بیاریم. داریم:

در نهایت جواب به صورت زیر میشه:

که اگر محاسبات رو با R انجام بدیم خواهیم داشت 0.0048.

توزیع یکنواخت توزیعی هست که با جمع تعداد کم متغیر تصادفی مستقل ازش هم خیلی زود به توزیع نرمال میرسه. مثلاً تو نمودار زیر فقط 5 تا متغیر تصادفی مستقل از توزیع یکنواخت باهم جمع شدن:

بدیهی هست که هرچقدر تعداد متغیرها بیشتر بشه، نمودار آبی خیلی بیشتر شبیه میشه به نمودار قرمز و در نهایت کاملاً روش میفته.

جمع‌بندی مطالب ارائه شده

با قضیه حد مرکزی آشنا شدیم و چند تا مثال مختلف ازش رو حل کردیم.

اگر جایی ایراد یا مشکلی بود، حتما بهم بگید تا تصحیحش کنم. همچنین، پیشنهاد می‌کنم که حتماً صفحه گیت‌هاب این دوره رو مورد بررسی قرار بدین. حتماً به دردتون می‌خوره.

ویدیو این جلسه

صفحه گیت‌هاب مرتبط با این دوره

جزوه جلسه قبلی (جلسه پانزدهم)

جزوه جلسه بعدی (جلسه هفدهم)

توزیع نرمال

هانیه مهدوی

من هانیه‌ام. مدتیه شروع کردم به تولید محتوا در قالب متن و به زبان فارسی، از روی دوره‌هایی که می‌گذرونم. اگر دوست داشتین برام قهوه بخرید: https://coffeete.ir/honio

شاید از این پست‌ها خوشتان بیاید

هانیه مهدوی

خواندن ۷ دقیقه·۳ سال پیش

جزوه دوره آمار و احتمال دکتر علی شریفی - جلسه شانزدهم - قضیه حد مرکزی

قضیه حد مرکزی

فرض کنید X1 یک توزیع یکنواخت هست و مقادیر زیر رو می‌تونه داشته باشه:

X1 ∈ {0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9}

متغیر X2 هم از یک توزیع یکنواخت اومده و مقادیر زیر رو داره:

X2 ∈ {0, 0.01, 0.02, 0.03, 0.04, 0.05, 0.06, 0.07, 0.08, 0.09}

متغیر X3 هم از یک توزیع یکنواخت اومده و مقادیر زیر رو داره:

X3 ∈ {0, 0.001, 0.002, 0.003, 0.004, 0.005, 0.006, 0.007, 0.008, 0.009}

به همین ترتیب متغیر Xi هم از یک توزیع یکنواخت اومده و مقادیر زیر رو داره:

Xi ∈ {0, 1 * 10^-i, 2 * 10^-i, 3 * 10^-i, 4 * 10^-i, ..., 8 * 10^-i, 9 * 10^-i}

در ادامه می‌خوایم ببینیم قضیه حد مرکزی اصلا به چه دردی میخوره و یکی دو تا مثال ازش ببینیم.

مثال زیر رو در نظر بگیرید:

در گام بعدی باید خطارو تعریف کنیم.

اگر چیزی که گفتیم رو به بیان ریاضی بنویسیم داریم:

حالا، رابطه بالا رو جوری بازنویسی می‌کنیم که Zn توش ظاهر بشه:

پس اگر چیزایی که تا اینجا گفتیم رو به ریاضی بنویسیم داریم:

در جلسات قبلی دیدیم که Phi(-a) برابر هست با 1 منهای Phi(a). پس داریم:

Phi(√n / 3) - (- Phi(√n / 3)) = Phi(√n / 3) - (1 - Phi(√n / 3)) = 0.95
Phi(√n / 3) + Phi(√n / 3) - 1 = 0.95
2 Phi(√n / 3) = 1.95
Phi(√n / 3) = 1.95 / 2 = 0.975

حالا چه عددی هست که Phi اون برابر میشه با 0.975؟ این رو میشه با R محاسبه کرد که برابر هست با 1.96.

در نهایت داریم:

√n / 3 = 1.96
√n = 5.88
n = 34.57

پس حداقل باید 35 مشاهده انجام بشه تا ستاره شناس به چیزی که دنبالشه برسه.

حالا بریم سراغ یک مثال دیگه:

حالا الان کافیه که فقط چیزی که پایین ساختیم رو تو رابطه بالا به وجود بیاریم و مسئله حل میشه:

مقدار Phi(-3) رو هم میشه با R محاسبه کرد و در نهایت به عدد 0.001 می‌رسیم.

حالا، بریم سراغ یک مثال دیگه.

میانگین برابر میشه با:

E(X) = (a + b) / 2 = (10 + 50) / 2 = 30

واریانس رو چجوری محاسبه کنیم؟ برای واریانس داریم:

که در نهایت اگر محاسبات و ساده‌سازی‌هارو انجام بدیم خواهیم داشت:

پس مقدار واریانس میشه 400/3 و مقدار انحراف از معیار هم میشه:

40 / radical(12)

حالا با استفاده از قضیه حد مرکزی توزیع زیر که از یک نرمال استاندارد پیروی میکنه به دست میاد:

سوال هم خواسته که در نهایت مقدار زیر رو محاسبه کنیم:

برای رسیدن به جواب، باید توزیع Zn رو تو احتمال بالا به وجود بیاریم. داریم:

در نهایت جواب به صورت زیر میشه:

که اگر محاسبات رو با R انجام بدیم خواهیم داشت 0.0048.

جمع‌بندی مطالب ارائه شده

با قضیه حد مرکزی آشنا شدیم و چند تا مثال مختلف ازش رو حل کردیم.

ویدیو این جلسه

صفحه گیت‌هاب مرتبط با این دوره

جزوه جلسه قبلی (جلسه پانزدهم)

جزوه جلسه بعدی (جلسه هفدهم)

توزیع نرمال

هانیه مهدوی

شاید از این پست‌ها خوشتان بیاید