هانیه مهدوی
هانیه مهدوی
خواندن ۱۳ دقیقه·۲ سال پیش

جزوه دوره آمار و احتمال دکتر علی شریفی - جلسه دهم - توزیع نرمال

منبع اصلی این پست، دوره آمار و احتمال مهندسی دکتر علی شریفی زارچی از آکادمی مکتبخونه می‌باشد. لطفاً برای حفظ حقوق منتشر کننده اصلی، ویدیوهارو از منبع اصلی دنبال کنید. همچنین، در انتهای هر جلسه، به ویدیو مربوط به آن جلسه ارجاع داده شده است.

سعی کردم هرچیزی که از ویدیوها فهمیدم رو به صورت متن در بیارم و در این پلت‌فورم با بقیه به اشتراک بذارم. کل ویدیوها 27 تاست که سعی می‌کنم هفته‌ای یک الی دو جلسه رو منتشر کنم. تا جایی که تونستم سعی کردم خوب و کامل بنویسم، اما اگر جایی ایرادی داشت، حتما تو کامنت‌ها بهم بگید تا درستش کنم.

پیشنهاد می‌کنم قبل از خوندن ادامه مطلب، یک کاغذ و قلم جلو دستتون باشه تا بتونید روابط ارائه شده رو در جاهایی که لازم هست برای خودتون تو کاغذ بنویسید و محاسبات لازم رو خودتون هم انجام بدین تا بهتر متوجه بشید که در هر مرحله چه اتفاقی میفته.


مروری بر مباحث جلسه گذشته

در جلسه گذشته با متغیرهای تصادفی پیوسته، توزیع یکنواخت و توزیع نرمال آشنا شدیم. این مورد رو هم بررسی کردیم که اگر به تعدادِ n متغیرِ مستقل از هم داشته باشیم که از یک توزیع یکسان اومده باشن و تمام n متغیر رو باهم دیگه جمع بزنیم، در نهایت به توزیع نرمال می‌رسیم که به صورت زیر نشون داده میشه:

حتی اگر به جای جمع کردن، از n متغیر میانگین هم بگیریم، همچنان یک توزیع نرمال خواهیم داشت. به توزیع نرمال توزیع گاوسی (Gaussian) هم میگن.

مباحث این جلسه

این مورد رو هم بررسی کردیم که اگر Z یک متغیر از یک توزیع نرمال با میانگین صفر و انحراف از معیار 1 اومده باشه، رابطه‌ای که براش خواهیم داشت برابر هست با:

Z ~ N(0, 1) f_Z(z) = e ^ (- (Z^(2)) / 2)

اگر از رابطه بالا انتگرال بگیریم برابر با 1 نمیشه، بنابراین یک ضریبی مثل C رو لازم داریم که در اون ضرب کنیم تا وقتی ازش انتگرال گرفتیم برابر با 1 بشه:

f_Z(z) = C (e ^ (- (Z^(2)) / 2))

در ادامه می‌خوایم این رو بررسی کنیم که ضریب C چی باشه تا شرطی که گفتیم برقرار باشه. در واقع می‌خوایم حاصل عبارت زیر رو به دست بیاریم:

به عبارتی دیگه، می‌خوایم این رو بررسی کنیم که چرا وقتی میانگین و انحراف از معیار رو به ترتیب با 0 و 1 در نظر می‌گیریم، ضریب 1 بر روی رادیکال 2pi در رابطه زیر ظاهر میشه:

حالا چطور میشه حاصل انتگرالی که بالاتر دیدیم رو محاسبه کرد؟

قضیه اینکه، به هیچ طریقی نمیشه حاصل انتگرال رو به صورت نامعین محاسبه کرد! پس چاره چیه؟ چاره اینکه انتگرال رو به صورت معین و روی بازه‌ای خاص حل کنیم و جوابش رو به دست بیاریم.

حالا، روش حل!

فرض کنید انتگرال زیر رو داریم و دنبال پیدا کردن A هستیم:

اگر بیایم و طرفین رو در خود انتگرال ضرب کنیم خواهیم داشت:

این کارو چرا می‌کنیم؟ برای اینکه با این کار می‌تونیم حاصل انتگرال رو حساب کنیم و در نهایت A^2 رو به دست بیاریم، بعد اگه ازش جذر بگیریم A به دست میاد و به چیزی که دنبالش بودیم می‌رسیم!

حالا برای حل انتگرال بالا اول از همه یک تغییر نام‌گذاری ساده انجام می‌دیم و خواهیم داشت:

می‌تونیم بیایم و دو انتگرال رو در هم ضرب کنیم که نتیجه میشه:

از اونجایی که x^2 + y^2 رابطه یک دایره که روی مبدا مختصات قرار گرفته رو نشون میده، می‌تونیم بیایم انتگرال بالا رو تغییر متغیر بدیم و به حالت قطبی ببریم:

اگه فرض کنیم شعاع دایره r باشه و زاویه‌ای که با محور افقی ساخته باشه رو theta در نظر بگیریم، برای x و y به ترتیب داریم:

x = r cos(theta) y = r sin(theta)

ممکنه سوال پیش بیاد که ضریب r از کجا ظاهر میشه و تو عبارت داخل انتگرال ضرب میشه، که برمی‌گرده به ماتریس ژاکوبین و محاسباتی که داره. برای محاسبه ماتریس ژاکوبین داریم:

حالا، ضریبی که اون بالا داخل انتگرال قرار می‌گیره برابر هست با دترمینان ماتریس ژاکوبین که اگر محاسبات رو انجام بدیم خواهیم داشت:

(r cos(theta) cos(theta)) - (-r sin(theta) sin(theta)) = (r cos^2(theta) + r sin^2(theta)) (r cos^2(theta) + r sin^2(theta)) = r (cos^2(theta) + sin^2(theta)) = r

تا اینجا تغییر متغیر زدیم و می‌خواهیم جواب انتگرال زیر رو به دست بیاریم، حواسمون هم هست که در نهایت باید از جواب به دست اومده جذر بگیریم تا چیزی که دنبالش هستیم به دست بیاد:

برای ادامه محاسبات از انتگرال داخلی شروع به حل می‌کنیم. برای حل نیاز داریم تا مجدداً یک تغییر متغیر بزنیم و محاسبات رو ادامه بدیم. برای تغییر متغیر داریم:

u = r^2 / 2 du / dr = r du = r dr

پس انتگرالی که داریم به فرم زیر تغییر می‌کنه:

در نهایت با یه یه تغییر متغیر دیگه میشه حاصل انتگرال داخلی رو محاسبه کرد. بنابراین برای تغییر متغیر خواهیم داشت:

v = -u dv / du = -1 dv = - du

و بعد محاسبات به صورت زیر انجام میشه:

در نهایت داریم:

حالا برای اینکه جواب نهایی انتگرال به دست بیاد باید از حاصل به دست اومده جذر بگیریم که برابر هست با:

∫ = A = √(2pi)

با توجه به جواب انتگرال ضریب C که دنبالش بودیم برابر میشه با:

C = 1/√(2pi)

خصوصیات توزیع نرمال

دیدیم که توزیع نرمال به صورت زیر تعریف میشه:

اگر Z متغیری باشه که از توزیع نرمال با میانگین 0 و انحراف از معیار 1 اومده باشه، خواهیم داشت:

امید ریاضی Z برابر هست با:

برای محاسبه انتگرال بالا، باید بیایم ببینیم برای Z های مثبت و Z های منفی دو عبارت داخل انتگرال چه رفتاری دارن.

عبارت Z برای Z های مثبت و Z های منفی قرینه هم دیگه هستن. عبارت e^(-(Z^2)/2) هم برای Z های مثبت و هم برای Z های منفی یک مقدار داره و مقدارش باهم برابره. از اونجایی که دو عبارت در هم ضرب شدن، در نهایت تشکیل یک تابع فرد رو میدن. پس، یعنی در حال انتگرال گرفتن از یک تابع فرد هستیم. حالا، در مورد انتگرال توابع فرد هم می‌دونیم که اگر در یک بازه متقارن واگرا نشن (بی‌نهایت)، حاصل انتگرالشون صفر میشه.

حالا، اگر بتونیم نشون بدیم که حاصل انتگرال بالا، بی‌نهایت (واگرا) نمیشه، پس می‌تونیم به جواب برسیم و جواب انتگرال برابر با صفر خواهد بود.

انتگرال تابع زیر رو در نظر بگیرید:

تابع بالا، تابع محدودیه و اگر ازش در یک بازه متقارن انتگرال بگیریم واگرا نمیشه. از طرفی اگر به جای منفی Z، منفی Z به توان 2 رو داشته باشیم، تابع زودتر به صفر نزدیک میشه. پس می‌تونیم بگیم که انتگرال تابعی که دنبالش هستیم واگرا نمیشه و محدوده، در نهایت امید ریاضی Z برابر با 0 میشه.

برای محاسبه واریانس Z داریم:

پس یعنی باید امید ریاضی Z^2 رو محاسبه کنیم. برای محاسبه امید ریاضی Z^2 داریم:

پس برای محاسبه جواب نهایی داریم:

برای محاسبه CDF داریم:

پس از اونجایی که نمی‌تونیم فرم بسته انتگرال بالا رو محاسبه کنیم، همواره برای محاسبه CDF(Z) مقدار عددی Phi(Z) رو در نظر می‌گیریم.

طبق محاسبات بالا برای Phi(-Z) داریم:

همونطور که از عکس بالا مشخصه بازه Phi(-Z) با رنگ آبی (سمت چپ) مشخص شده. از طرفی مقدار 1 برابر هست با رنگ قرمز که کل فضا رو شامل میشه. اگر بیایم از 1 مقدار Phi(Z) که با رنگ زرد مشخص شده رو برداریم، تیکه آبی سمت راست باقی می‌مونه. چون تیکه آبی سمت راست با تیکه آبی سمت برابر هست، پس رابطه بالا برقراره.

اگر نمودار CDF رو برای Z رسم کنیم به صورت زیر در میاد:

طبق نمودار بالا اگر Phi(1) رو محاسبه کنیم حاصل برابر خواهد بود با 0.84 و اگر Phi(0) رو محاسبه کنیم حاصل برابر خواهد بود با 0.5.

در ادامه می‌خوایم این رو بررسی کنیم که وقتی Phi(1) برابر میشه با 0.84 یعنی چی؟

قانون 68-95-99.7

فرض کنید متغیر Z رو که بالاتر در نظر گرفتیم همچنان داریم. یعنی داره از توزیع نرمالی میاد که میانگین 0 و واریانس 1 داره. نمودار توزیعش رو رسم کردیم و به اندازه یک انحراف معیار (1 = SD) از مبدا (جایی که میانگین برابر با 0 هست) دور شدیم و به سمت چپ و راست حرکت کردیم. ناحیه مورد نظر با رنگ صورتی در نمودار زیر نشون داده شده:

قصد داریم این رو بررسی کنیم که مساحت قسمت صورتی رنگ برابر با چقدر هست. چطور باید محاسبه کنیم؟

گفتیم به اندازه یک انحراف معیار از مبدا دور شدیم، از طرفی مقدار انحراف معیار برابر با 1 هست. طبق توضیحاتی که بالاتر دادیم، Phi(1) برابر هست با نمودار زیر:

با روابطی که یکم قبل‌تر معرفی کردیم، میشه Phi(-1) رو هم محاسبه کرد. بنابراین نمودار بالا به صورت زیر در میاد:

در نهایت، با توجه به محاسباتی که انجام شده، قسمتی که از اول دنبال مساحتش بودیم، حاصلش برابر میشه با:

1 - (0.16 + 0.16) = 0.68

حالا، این عدد 0.68 به چه معنایی هست؟ به این معنی هست که اگر یک متغیر تصادفی از توزیع نرمال با میانگین 0 و انحراف از معیار 1 تبعیت کنه، به احتمال 68 درصد تو ناحیه‌ای که تو عکس بالا با رنگ صورتی مشخص شده میفته. یعنی اون متغیر تصادفی به احتمال 68 درصد به اندازه یک انحراف معیار از میانگین فاصله داره.

حالا اگر به جای یک انحراف معیار، دو انحراف معیار رو در نظر بگیریم چطور میشه؟ اینجا نیاز داریم که مشابه قسمت قبلی، اول Phi(2) و بعد Phi(-2) رو محاسبه کنیم و در نهایت خواهیم داشت:

1 - (Phi(-2) + 1 - Phi(2)) = 1 - (1 - Phi(2) + 1 - Phi(2)) = 1 - (2 - 2 * Phi(2)) = 1 - 2 * (1 - Phi(2)) = 1 - 2 * (1 - 0.977) = 0.95

عدد 0.95 داره میگه که اگر یک متغیر تصادفی از توزیع نرمال با میانگین 0 و انحراف از معیار 1 تبعیت کنه، به احتمال 95 درصد تو ناحیه‌ای که تو عکس بالا با رنگ آبی و بنفش مشخص شده میفته. یعنی اون متغیر تصادفی به احتمال 95 درصد به اندازه دو انحراف معیار از میانگین فاصله داره.

به همین ترتیب، اگر به اندازه 3 انحراف معیار از مبدا دور بشیم خواهیم داشت:

1 - (Phi(-3) + 1 - Phi(3)) = 1 - (1 - Phi(3) + 1 - Phi(3)) = 1 - (2 - 2 * Phi(3)) = 1 - 2 * (1 - Phi(3)) = 1 - 2 * (1 - 0.986) = 0.997

عدد 0.997 داره میگه که اگر یک متغیر تصادفی از توزیع نرمال با میانگین 0 و انحراف از معیار 1 تبعیت کنه، به احتمال 99.7 درصد تو ناحیه‌ای که تو عکس بالا با رنگ زرد و سبز و خاکستری مشخص شده میفته. یعنی اون متغیر تصادفی به احتمال 99.7 درصد به اندازه سه انحراف معیار از میانگین فاصله داره.

این مواردی که تا اینجا بررسی کردیم به صورت یک قاعده در اومده و بهش قانون 68-95-99.7 میگن.

تا اینجا گفتیم اگر Z از یک توزیع نرمال با میانگین صفر و واریانس یک بیاد این شرایط براش برقراره. اما، اصل ماجرا اینکه توزیع نرمال با هر میانگین و هر واریانسی داشته باشیم این قانون در موردش صدق میکنه!

فرض کنید X از یک توزیع نرمال با میانگین µ و واریانس ó^2 اومده باشه (یعنی یک توزیع نرمال با هر میانگین و با هر واریانسی):

X ~ N(µ, ó^2)

روابط زیر براش برقراره:

P(µ - ó ⩽ X ⩽ µ + ó) = 0.68 P(µ - 2 * ó ⩽ X ⩽ µ + 2 * ó) = 0.95 P(µ - 3 * ó ⩽ X ⩽ µ + 3 * ó) = 0.997

روابطی که تا اینجا بررسی کردیم، روابط خیلی مهمی هستن و در صنعت هم زیاد استفاده میشن. در ادامه با یک مثال می‌تونیم این مورد رو توضیح بدیم.

فرض کنید یک کارخونه‌ای ترانزیستور میسازه و برآورد کرده که میانگین طول عمر هر ترانزیستور برابر هست با 100 ماه و انحراف از معیاری هم که داره برابر هست با 1 ماه و توزیعی که طول عمر داره از توزیع نرمال پیروی میکنه. در این صورت احتمال اینکه هر ترانزیستور بین 99 ماه تا 101 ماه عمر کنه برابر هست با 68 درصد. احتمال اینکه هر ترانزیستور بین 98 ماه تا 102 ماه عمر کنه برابر هست با 95 درصد و احتمال اینکه هر ترانزیستور بین 97 ماه تا 103 ماه عمر کنه برابر هست با 99.7 درصد. اگر از 0.7 چشم‌پوشی کنیم، می‌تونیم بگیم که هر طول عمر هر ترانزیستور برابر هست با (100 ± 3) و با احتمال 99 درصد مطمئن هستیم که طول عمر هر ترانزیستور تو همین بازه قرار میگیره.

تا اینجا شهود توزیع نرمال رو بررسی کردیم. همچنین لازم به ذکره که خیلی از مواردی که در طبیعت وجود دارن از توزیع نرمال تبعیت می‌کنن.

تبدیل متغیر تصادفی از توزیع نرمال با میانگین 0 و واریانس 1 به توزیع نرمال با میانگین µ و واریانس ó^2

بالاتر گفتیم متغیر تصادفی Z از توزیع نرمالی با میانگین 0 و واریانس 1 میاد. فرض کنید یک متغیر تصادفی دیگه مثل X داریم که از توزیع نرمال با میانگین دلخواه µ و واریانس ó^2 میاد. قصد داریم از متغیر Z استفاده کنیم و متغیر X رو بازنویسی کنیم.

اول می‌خوایم کاری کنیم که میانگین X برابر بشه با µ:

X = Z + u E(X) = E(Z + u) = E(Z) + u = 0 + µ = µ
X = ó Z + µ E(X) = E(ó Z + µ) = E(ó Z) + u = 0 + u = u

حالا برای محاسبه واریانس داریم:

Var(X) = Var(ó Z + µ) = ó^2 (Var(Z)) = ó^2 * 1 = ó^2

پس با نوشتن X به صورت X = ó Z + µ میشه از توزیع نرمال با میانگین 0 و واریانس 1 به توزیع نرمال با میانگین دلخواه و واریانس دلخواه رسید.

حالا اگر بخوایم تبدیل برعکس انجام بدیم به چه صورتی میشه؟ برای X داریم:

X ~ N(µ, ó) X = ó Z + µ

اگر Z رو تنها کنیم خواهیم داشت:

Z ~ N(0, 1) Z = (X - µ) / ó

و در این حالت اگر بیایمPDF رو محاسبه کنیم به رابطه زیر خواهیم رسید:

از اثبات رابطه بالا در این بلاگ پست صرف نظر شده. اما اگر علاقه‌مند به روند اثباتش هستید، می‌تونید به این سایت مراجعه کنید.

در ادامه به حل یک مثال خواهیم پرداخت.

مثال

فرض کنید متغیر تصادفی X رو داریم به صورتی که:

X ~ N(-5, 4)

و دنبال محاسبه P(X < 0) هستیم.

برای محاسبه این مورد، می‌تونیم بیایم از متغیر تصادفی Z که میانگین 0 و واریانس 1 داره استفاده کنیم و Z رو بر اساس X بنویسیم:

Z = (X - µ) / ó Z = (X + 5) / 2 Z ~ N (0, 1)

حالا، از اونجایی که احتمال Z رو بر اساس مقادیر مختلف داریم و می‌تونیم به کمک Phi(Z) محاسبه کنیم، میشه مقداری که دنبالش هستیم رو محاسبه کنیم:

P(Z ⩽ z) = Phi(z) P(X ⩽ 0) = ? Z = (X + 5) / 2 X = 2Z - 5 P(2Z - 5 ⩽ 0) = P(2Z ⩽ 5) = P(Z ⩽ 5/2) = P(Z ⩽ 2.5) = Phi(2.5) = 0.99

جمع‌بندی مطالب ارائه شده

ویژگی‌های مختلف توزیع نرمال رو بررسی کردیم.


اگر جایی ایراد یا مشکلی بود، حتما بهم بگید تا تصحیحش کنم. همچنین، پیشنهاد می‌کنم که حتماً صفحه گیت‌هاب این دوره رو مورد بررسی قرار بدین. حتماً به دردتون می‌خوره.

ویدیو این جلسه

صفحه گیت‌هاب مرتبط با این دوره

جزوه جلسه قبلی (جلسه نهم)

جزوه جلسه بعدی (جلسه یازدهم)

من هانیه‌ام. مدتیه شروع کردم به تولید محتوا در قالب متن و به زبان فارسی، از روی دوره‌هایی که می‌گذرونم. اگر دوست داشتین برام قهوه بخرید: https://coffeete.ir/honio
شاید از این پست‌ها خوشتان بیاید