منبع اصلی این پست، دوره آمار و احتمال مهندسی دکتر علی شریفی زارچی از آکادمی مکتبخونه میباشد. لطفاً برای حفظ حقوق منتشر کننده اصلی، ویدیوهارو از منبع اصلی دنبال کنید. همچنین، در انتهای هر جلسه، به ویدیو مربوط به آن جلسه ارجاع داده شده است.
سعی کردم هرچیزی که از ویدیوها فهمیدم رو به صورت متن در بیارم و در این پلتفورم با بقیه به اشتراک بذارم. کل ویدیوها 27 تاست که سعی میکنم هفتهای یک الی دو جلسه رو منتشر کنم. تا جایی که تونستم سعی کردم خوب و کامل بنویسم، اما اگر جایی ایرادی داشت، حتما تو کامنتها بهم بگید تا درستش کنم.
پیشنهاد میکنم قبل از خوندن ادامه مطلب، یک کاغذ و قلم جلو دستتون باشه تا بتونید روابط ارائه شده رو در جاهایی که لازم هست برای خودتون تو کاغذ بنویسید و محاسبات لازم رو خودتون هم انجام بدین تا بهتر متوجه بشید که در هر مرحله چه اتفاقی میفته.
در جلسه گذشته با متغیرهای تصادفی پیوسته، توزیع یکنواخت و توزیع نرمال آشنا شدیم. این مورد رو هم بررسی کردیم که اگر به تعدادِ n متغیرِ مستقل از هم داشته باشیم که از یک توزیع یکسان اومده باشن و تمام n متغیر رو باهم دیگه جمع بزنیم، در نهایت به توزیع نرمال میرسیم که به صورت زیر نشون داده میشه:
حتی اگر به جای جمع کردن، از n متغیر میانگین هم بگیریم، همچنان یک توزیع نرمال خواهیم داشت. به توزیع نرمال توزیع گاوسی (Gaussian) هم میگن.
این مورد رو هم بررسی کردیم که اگر Z یک متغیر از یک توزیع نرمال با میانگین صفر و انحراف از معیار 1 اومده باشه، رابطهای که براش خواهیم داشت برابر هست با:
Z ~ N(0, 1) f_Z(z) = e ^ (- (Z^(2)) / 2)
اگر از رابطه بالا انتگرال بگیریم برابر با 1 نمیشه، بنابراین یک ضریبی مثل C رو لازم داریم که در اون ضرب کنیم تا وقتی ازش انتگرال گرفتیم برابر با 1 بشه:
f_Z(z) = C (e ^ (- (Z^(2)) / 2))
در ادامه میخوایم این رو بررسی کنیم که ضریب C چی باشه تا شرطی که گفتیم برقرار باشه. در واقع میخوایم حاصل عبارت زیر رو به دست بیاریم:
به عبارتی دیگه، میخوایم این رو بررسی کنیم که چرا وقتی میانگین و انحراف از معیار رو به ترتیب با 0 و 1 در نظر میگیریم، ضریب 1 بر روی رادیکال 2pi در رابطه زیر ظاهر میشه:
حالا چطور میشه حاصل انتگرالی که بالاتر دیدیم رو محاسبه کرد؟
قضیه اینکه، به هیچ طریقی نمیشه حاصل انتگرال رو به صورت نامعین محاسبه کرد! پس چاره چیه؟ چاره اینکه انتگرال رو به صورت معین و روی بازهای خاص حل کنیم و جوابش رو به دست بیاریم.
حالا، روش حل!
فرض کنید انتگرال زیر رو داریم و دنبال پیدا کردن A هستیم:
اگر بیایم و طرفین رو در خود انتگرال ضرب کنیم خواهیم داشت:
این کارو چرا میکنیم؟ برای اینکه با این کار میتونیم حاصل انتگرال رو حساب کنیم و در نهایت A^2 رو به دست بیاریم، بعد اگه ازش جذر بگیریم A به دست میاد و به چیزی که دنبالش بودیم میرسیم!
حالا برای حل انتگرال بالا اول از همه یک تغییر نامگذاری ساده انجام میدیم و خواهیم داشت:
میتونیم بیایم و دو انتگرال رو در هم ضرب کنیم که نتیجه میشه:
از اونجایی که x^2 + y^2 رابطه یک دایره که روی مبدا مختصات قرار گرفته رو نشون میده، میتونیم بیایم انتگرال بالا رو تغییر متغیر بدیم و به حالت قطبی ببریم:
اگه فرض کنیم شعاع دایره r باشه و زاویهای که با محور افقی ساخته باشه رو theta در نظر بگیریم، برای x و y به ترتیب داریم:
x = r cos(theta) y = r sin(theta)
ممکنه سوال پیش بیاد که ضریب r از کجا ظاهر میشه و تو عبارت داخل انتگرال ضرب میشه، که برمیگرده به ماتریس ژاکوبین و محاسباتی که داره. برای محاسبه ماتریس ژاکوبین داریم:
حالا، ضریبی که اون بالا داخل انتگرال قرار میگیره برابر هست با دترمینان ماتریس ژاکوبین که اگر محاسبات رو انجام بدیم خواهیم داشت:
(r cos(theta) cos(theta)) - (-r sin(theta) sin(theta)) = (r cos^2(theta) + r sin^2(theta)) (r cos^2(theta) + r sin^2(theta)) = r (cos^2(theta) + sin^2(theta)) = r
تا اینجا تغییر متغیر زدیم و میخواهیم جواب انتگرال زیر رو به دست بیاریم، حواسمون هم هست که در نهایت باید از جواب به دست اومده جذر بگیریم تا چیزی که دنبالش هستیم به دست بیاد:
برای ادامه محاسبات از انتگرال داخلی شروع به حل میکنیم. برای حل نیاز داریم تا مجدداً یک تغییر متغیر بزنیم و محاسبات رو ادامه بدیم. برای تغییر متغیر داریم:
u = r^2 / 2 du / dr = r du = r dr
پس انتگرالی که داریم به فرم زیر تغییر میکنه:
در نهایت با یه یه تغییر متغیر دیگه میشه حاصل انتگرال داخلی رو محاسبه کرد. بنابراین برای تغییر متغیر خواهیم داشت:
v = -u dv / du = -1 dv = - du
و بعد محاسبات به صورت زیر انجام میشه:
در نهایت داریم:
حالا برای اینکه جواب نهایی انتگرال به دست بیاد باید از حاصل به دست اومده جذر بگیریم که برابر هست با:
∫ = A = √(2pi)
با توجه به جواب انتگرال ضریب C که دنبالش بودیم برابر میشه با:
C = 1/√(2pi)
دیدیم که توزیع نرمال به صورت زیر تعریف میشه:
اگر Z متغیری باشه که از توزیع نرمال با میانگین 0 و انحراف از معیار 1 اومده باشه، خواهیم داشت:
امید ریاضی Z برابر هست با:
برای محاسبه انتگرال بالا، باید بیایم ببینیم برای Z های مثبت و Z های منفی دو عبارت داخل انتگرال چه رفتاری دارن.
عبارت Z برای Z های مثبت و Z های منفی قرینه هم دیگه هستن. عبارت e^(-(Z^2)/2) هم برای Z های مثبت و هم برای Z های منفی یک مقدار داره و مقدارش باهم برابره. از اونجایی که دو عبارت در هم ضرب شدن، در نهایت تشکیل یک تابع فرد رو میدن. پس، یعنی در حال انتگرال گرفتن از یک تابع فرد هستیم. حالا، در مورد انتگرال توابع فرد هم میدونیم که اگر در یک بازه متقارن واگرا نشن (بینهایت)، حاصل انتگرالشون صفر میشه.
حالا، اگر بتونیم نشون بدیم که حاصل انتگرال بالا، بینهایت (واگرا) نمیشه، پس میتونیم به جواب برسیم و جواب انتگرال برابر با صفر خواهد بود.
انتگرال تابع زیر رو در نظر بگیرید:
تابع بالا، تابع محدودیه و اگر ازش در یک بازه متقارن انتگرال بگیریم واگرا نمیشه. از طرفی اگر به جای منفی Z، منفی Z به توان 2 رو داشته باشیم، تابع زودتر به صفر نزدیک میشه. پس میتونیم بگیم که انتگرال تابعی که دنبالش هستیم واگرا نمیشه و محدوده، در نهایت امید ریاضی Z برابر با 0 میشه.
برای محاسبه واریانس Z داریم:
پس یعنی باید امید ریاضی Z^2 رو محاسبه کنیم. برای محاسبه امید ریاضی Z^2 داریم:
پس برای محاسبه جواب نهایی داریم:
برای محاسبه CDF داریم:
پس از اونجایی که نمیتونیم فرم بسته انتگرال بالا رو محاسبه کنیم، همواره برای محاسبه CDF(Z) مقدار عددی Phi(Z) رو در نظر میگیریم.
طبق محاسبات بالا برای Phi(-Z) داریم:
همونطور که از عکس بالا مشخصه بازه Phi(-Z) با رنگ آبی (سمت چپ) مشخص شده. از طرفی مقدار 1 برابر هست با رنگ قرمز که کل فضا رو شامل میشه. اگر بیایم از 1 مقدار Phi(Z) که با رنگ زرد مشخص شده رو برداریم، تیکه آبی سمت راست باقی میمونه. چون تیکه آبی سمت راست با تیکه آبی سمت برابر هست، پس رابطه بالا برقراره.
اگر نمودار CDF رو برای Z رسم کنیم به صورت زیر در میاد:
طبق نمودار بالا اگر Phi(1) رو محاسبه کنیم حاصل برابر خواهد بود با 0.84 و اگر Phi(0) رو محاسبه کنیم حاصل برابر خواهد بود با 0.5.
در ادامه میخوایم این رو بررسی کنیم که وقتی Phi(1) برابر میشه با 0.84 یعنی چی؟
فرض کنید متغیر Z رو که بالاتر در نظر گرفتیم همچنان داریم. یعنی داره از توزیع نرمالی میاد که میانگین 0 و واریانس 1 داره. نمودار توزیعش رو رسم کردیم و به اندازه یک انحراف معیار (1 = SD) از مبدا (جایی که میانگین برابر با 0 هست) دور شدیم و به سمت چپ و راست حرکت کردیم. ناحیه مورد نظر با رنگ صورتی در نمودار زیر نشون داده شده:
قصد داریم این رو بررسی کنیم که مساحت قسمت صورتی رنگ برابر با چقدر هست. چطور باید محاسبه کنیم؟
گفتیم به اندازه یک انحراف معیار از مبدا دور شدیم، از طرفی مقدار انحراف معیار برابر با 1 هست. طبق توضیحاتی که بالاتر دادیم، Phi(1) برابر هست با نمودار زیر:
با روابطی که یکم قبلتر معرفی کردیم، میشه Phi(-1) رو هم محاسبه کرد. بنابراین نمودار بالا به صورت زیر در میاد:
در نهایت، با توجه به محاسباتی که انجام شده، قسمتی که از اول دنبال مساحتش بودیم، حاصلش برابر میشه با:
1 - (0.16 + 0.16) = 0.68
حالا، این عدد 0.68 به چه معنایی هست؟ به این معنی هست که اگر یک متغیر تصادفی از توزیع نرمال با میانگین 0 و انحراف از معیار 1 تبعیت کنه، به احتمال 68 درصد تو ناحیهای که تو عکس بالا با رنگ صورتی مشخص شده میفته. یعنی اون متغیر تصادفی به احتمال 68 درصد به اندازه یک انحراف معیار از میانگین فاصله داره.
حالا اگر به جای یک انحراف معیار، دو انحراف معیار رو در نظر بگیریم چطور میشه؟ اینجا نیاز داریم که مشابه قسمت قبلی، اول Phi(2) و بعد Phi(-2) رو محاسبه کنیم و در نهایت خواهیم داشت:
1 - (Phi(-2) + 1 - Phi(2)) = 1 - (1 - Phi(2) + 1 - Phi(2)) = 1 - (2 - 2 * Phi(2)) = 1 - 2 * (1 - Phi(2)) = 1 - 2 * (1 - 0.977) = 0.95
عدد 0.95 داره میگه که اگر یک متغیر تصادفی از توزیع نرمال با میانگین 0 و انحراف از معیار 1 تبعیت کنه، به احتمال 95 درصد تو ناحیهای که تو عکس بالا با رنگ آبی و بنفش مشخص شده میفته. یعنی اون متغیر تصادفی به احتمال 95 درصد به اندازه دو انحراف معیار از میانگین فاصله داره.
به همین ترتیب، اگر به اندازه 3 انحراف معیار از مبدا دور بشیم خواهیم داشت:
1 - (Phi(-3) + 1 - Phi(3)) = 1 - (1 - Phi(3) + 1 - Phi(3)) = 1 - (2 - 2 * Phi(3)) = 1 - 2 * (1 - Phi(3)) = 1 - 2 * (1 - 0.986) = 0.997
عدد 0.997 داره میگه که اگر یک متغیر تصادفی از توزیع نرمال با میانگین 0 و انحراف از معیار 1 تبعیت کنه، به احتمال 99.7 درصد تو ناحیهای که تو عکس بالا با رنگ زرد و سبز و خاکستری مشخص شده میفته. یعنی اون متغیر تصادفی به احتمال 99.7 درصد به اندازه سه انحراف معیار از میانگین فاصله داره.
این مواردی که تا اینجا بررسی کردیم به صورت یک قاعده در اومده و بهش قانون 68-95-99.7 میگن.
تا اینجا گفتیم اگر Z از یک توزیع نرمال با میانگین صفر و واریانس یک بیاد این شرایط براش برقراره. اما، اصل ماجرا اینکه توزیع نرمال با هر میانگین و هر واریانسی داشته باشیم این قانون در موردش صدق میکنه!
فرض کنید X از یک توزیع نرمال با میانگین µ و واریانس ó^2 اومده باشه (یعنی یک توزیع نرمال با هر میانگین و با هر واریانسی):
X ~ N(µ, ó^2)
روابط زیر براش برقراره:
P(µ - ó ⩽ X ⩽ µ + ó) = 0.68 P(µ - 2 * ó ⩽ X ⩽ µ + 2 * ó) = 0.95 P(µ - 3 * ó ⩽ X ⩽ µ + 3 * ó) = 0.997
روابطی که تا اینجا بررسی کردیم، روابط خیلی مهمی هستن و در صنعت هم زیاد استفاده میشن. در ادامه با یک مثال میتونیم این مورد رو توضیح بدیم.
فرض کنید یک کارخونهای ترانزیستور میسازه و برآورد کرده که میانگین طول عمر هر ترانزیستور برابر هست با 100 ماه و انحراف از معیاری هم که داره برابر هست با 1 ماه و توزیعی که طول عمر داره از توزیع نرمال پیروی میکنه. در این صورت احتمال اینکه هر ترانزیستور بین 99 ماه تا 101 ماه عمر کنه برابر هست با 68 درصد. احتمال اینکه هر ترانزیستور بین 98 ماه تا 102 ماه عمر کنه برابر هست با 95 درصد و احتمال اینکه هر ترانزیستور بین 97 ماه تا 103 ماه عمر کنه برابر هست با 99.7 درصد. اگر از 0.7 چشمپوشی کنیم، میتونیم بگیم که هر طول عمر هر ترانزیستور برابر هست با (100 ± 3) و با احتمال 99 درصد مطمئن هستیم که طول عمر هر ترانزیستور تو همین بازه قرار میگیره.
تا اینجا شهود توزیع نرمال رو بررسی کردیم. همچنین لازم به ذکره که خیلی از مواردی که در طبیعت وجود دارن از توزیع نرمال تبعیت میکنن.
بالاتر گفتیم متغیر تصادفی Z از توزیع نرمالی با میانگین 0 و واریانس 1 میاد. فرض کنید یک متغیر تصادفی دیگه مثل X داریم که از توزیع نرمال با میانگین دلخواه µ و واریانس ó^2 میاد. قصد داریم از متغیر Z استفاده کنیم و متغیر X رو بازنویسی کنیم.
اول میخوایم کاری کنیم که میانگین X برابر بشه با µ:
X = Z + u E(X) = E(Z + u) = E(Z) + u = 0 + µ = µ
X = ó Z + µ E(X) = E(ó Z + µ) = E(ó Z) + u = 0 + u = u
حالا برای محاسبه واریانس داریم:
Var(X) = Var(ó Z + µ) = ó^2 (Var(Z)) = ó^2 * 1 = ó^2
پس با نوشتن X به صورت X = ó Z + µ میشه از توزیع نرمال با میانگین 0 و واریانس 1 به توزیع نرمال با میانگین دلخواه و واریانس دلخواه رسید.
حالا اگر بخوایم تبدیل برعکس انجام بدیم به چه صورتی میشه؟ برای X داریم:
X ~ N(µ, ó) X = ó Z + µ
اگر Z رو تنها کنیم خواهیم داشت:
Z ~ N(0, 1) Z = (X - µ) / ó
و در این حالت اگر بیایمPDF رو محاسبه کنیم به رابطه زیر خواهیم رسید:
از اثبات رابطه بالا در این بلاگ پست صرف نظر شده. اما اگر علاقهمند به روند اثباتش هستید، میتونید به این سایت مراجعه کنید.
در ادامه به حل یک مثال خواهیم پرداخت.
فرض کنید متغیر تصادفی X رو داریم به صورتی که:
X ~ N(-5, 4)
و دنبال محاسبه P(X < 0) هستیم.
برای محاسبه این مورد، میتونیم بیایم از متغیر تصادفی Z که میانگین 0 و واریانس 1 داره استفاده کنیم و Z رو بر اساس X بنویسیم:
Z = (X - µ) / ó Z = (X + 5) / 2 Z ~ N (0, 1)
حالا، از اونجایی که احتمال Z رو بر اساس مقادیر مختلف داریم و میتونیم به کمک Phi(Z) محاسبه کنیم، میشه مقداری که دنبالش هستیم رو محاسبه کنیم:
P(Z ⩽ z) = Phi(z) P(X ⩽ 0) = ? Z = (X + 5) / 2 X = 2Z - 5 P(2Z - 5 ⩽ 0) = P(2Z ⩽ 5) = P(Z ⩽ 5/2) = P(Z ⩽ 2.5) = Phi(2.5) = 0.99
ویژگیهای مختلف توزیع نرمال رو بررسی کردیم.
اگر جایی ایراد یا مشکلی بود، حتما بهم بگید تا تصحیحش کنم. همچنین، پیشنهاد میکنم که حتماً صفحه گیتهاب این دوره رو مورد بررسی قرار بدین. حتماً به دردتون میخوره.