هانیه مهدوی
هانیه مهدوی
خواندن ۷ دقیقه·۲ سال پیش

جزوه دوره آمار و احتمال دکتر علی شریفی - جلسه نهم - متغیرهای تصادفی پیوسته، توزیع یکنواخت، توزیع نرمال

منبع اصلی این پست، دوره آمار و احتمال مهندسی دکتر علی شریفی زارچی از آکادمی مکتبخونه می‌باشد. لطفاً برای حفظ حقوق منتشر کننده اصلی، ویدیوهارو از منبع اصلی دنبال کنید. همچنین، در انتهای هر جلسه، به ویدیو مربوط به آن جلسه ارجاع داده شده است.

سعی کردم هرچیزی که از ویدیوها فهمیدم رو به صورت متن در بیارم و در این پلت‌فورم با بقیه به اشتراک بذارم. کل ویدیوها 27 تاست که سعی می‌کنم هفته‌ای یک الی دو جلسه رو منتشر کنم. تا جایی که تونستم سعی کردم خوب و کامل بنویسم، اما اگر جایی ایرادی داشت، حتما تو کامنت‌ها بهم بگید تا درستش کنم.

پیشنهاد می‌کنم قبل از خوندن ادامه مطلب، یک کاغذ و قلم جلو دستتون باشه تا بتونید روابط ارائه شده رو در جاهایی که لازم هست برای خودتون تو کاغذ بنویسید و محاسبات لازم رو خودتون هم انجام بدین تا بهتر متوجه بشید که در هر مرحله چه اتفاقی میفته.


مروری بر مباحث جلسه گذشته

با متغیر تصادفی گسسته آشنا شدیم و انواع توزیع‌های گسسته رو شناختیم. از جمله توزیع‌های برنولی، دوجمله‌ای، هندسی، فوق هندسی و پوآسون. یه خلاصه بخوایم از هر توزیع بدیم به این صورت میشه گفت:

توزیع برنولی: پرتاب یک سکه که با احتمال p شیر می‌آید؟

توزیع دوجمله‌ای: پرتاب n سکه / چند بار شیر می‌آید؟

توزیع هندسی: سکه با احتمال شیر آمدن p را چند بار بیندازیم تا اولین شیر بیاید؟

توزیع فوق هندسی: در یک ظرفیN1 تا توپ قرمز داریم و N2 تا توپ آبی. در مجموع n توپ تصادفی از ظرف خارج میکنیم و دنبال این هستیم که احتمال k تا توپ قرمز رو محاسبه کنیم.

توزیع پوآسون: تعداد دفعات وقوع یک پدیده در یک بازه زمانی با نرخ متوسط ʎ

در ادامه این جلسه قراره با متغیر تصادفی پیوسته و توزیع‌های پیوسته آشنا بشیم.

متغیر تصادفی پیوسته

اگر متغیر تصادفی X پیوسته باشه، range این متغیر دیگه اعداد شمارا نیستن و اعداد پیوسته هستن. تو حالت پیوسته تابعی رو تعریف می‌کنیم به اسم f_X(x) و بهش تابع چگالی احتمال میگیم. با یک مثال این تابع رو توضیح میدیم.

فرض کنید در یک بازه زمانی بین ساعت 4 الی 5 قراره فردی رو ملاقات کنیم و اصلاً مشخص نیست که در چه ساعتی بین این بازه زمانی قراره دیدار اتفاق بیفته. ولی مطمئن هستیم که قطعاً در این بازه زمانی خواهد بود. اگه بخوایم تابع چگالی احتمال رو براش مدل کنیم، خواهیم داشت:

احتمال دیدار قبل از ساعت 4 و بعد از ساعت 5 برابر با 0 هست و بین بازه 4 تا 5 برابر با عددی غیر صفر هست و اگر از تابع مدل شده انتگرال بگیریم حاصل برابر با 1 میشه. جلوتر در مورد اینکه این انتگرال چی هست بیشتر توضیح میدیم.

برای یک متغیر تصادفی پیوسته احتمال اینکه P(X=x) بشه برابر با 0 هست. به عبارتی دیگه، احتمال اینکه یک متغیر تصادفی دقیقاً یک عدد خاص بیاد برابر با 0 هست.

انتگرال زیر رو در نظر بگیرید:

داره این احتمال این رو نشون میده که X بین a تا b باشه:

در واقع، این رو بهمون نشون میده که چقدر احتمال داره قد یه آدمی بین 170 تا 180 باشه مثلاً. این رو نشون نمیده که اگه یه آدم رندوم انتخاب کنیم و بخوایم احتمال این رو حساب کنیم که قدش دقیقاً برابر با 176 باشه.

تابع چگالی احتمال

در توزیع گسسته مفهومی وجود داشت با عنوان تابع جرم احتمال، از اونجایی که در توزیع پیوسته در هر نقطه جرمی وجود نداره و فقط چگالی وجود داره، تابع چگالی احتمال رو داریم. مفهومش رو میشه با یه مثال توضیح داد.

فرض کنید توزیعی که قد آدم‌هارو نشون میده به صورت زیر باشه:

نمودار بالا داره این رو نشون میده که انگار تعداد آدم‌ها با قد (160 تا 160 + دلتا) بیشتر هست نسبت به تعداد آدم‌ها با قد (170 تا 170 + دلتا). در واقع این مفهوم تابع چگالی احتمال هست. دلتا هم یک عدد ثابته که با 160 و 170 می‌تونه جمع بشه و یک بازه رو به وجود بیاره. همونطور که از عکس هم مشخصه، مساحت زیر نمودار قرمز بیشتره نسبت به مساحت زیر نمودار آبی. به عبارتی دیگه، یعنی اگر بخوایم قد یک آدم رندوم رو اندازه بگیریم، با احتمال بیشتری تو ناحیه قرمز میفته نسبت به ناحیه آبی.

تابع توزیع تجمعی

تابع دیگه‌ای داریم که با نوتیشن F_X(x) نشون داده میشه و بهش CDF یا تابع توزیع تجمعی گفته میشه. دقت کنید که با تابع چگالی احتمال (که با نوتیشن f_X(x) مشخص میشه) فرق داره. با یه مثال بهتر مفهوم این تابع رو توضیح میدیم.

نمودار زیر رو در نظر بگیرید. نمودار مشخص کننده تابع چگالی احتمال همون مثالی هست که قرار بود با دوستمون بین ساعت 4 تا 5 ملاقات داشته باشیم.

اگه بخوایم برای نمودار بالا تابع توزیع تجمعی رو نشون بدیم، نمودارش به صورت زیر در میاد که با رنگ سبز مشخص شده. تا به ساعت 4 برسیم مقدارش 0 هست، از ساعت 4 تا 5 کم کم مقدارش به یک میرسه و بعد از ساعت 5 هم مقدارش 1 باقی می‌مونه.

مقدار ریاضی این تابع برابر هست با:

F_X(x) = P(X ≤ x) = ∫ f_x(u) du, (-∞, x)

و در ادامه با خصوصیات این تابع برای متغیرهای تصادفی پیوسته آشنا میشیم:

  • به ازای هر مقدار x که عضو R باشد، همواره مقدار تابع F_X(x) بین 0 تا 1 هست (خود مقادیر 0 و 1 رو هم شامل میشه)
  • اگر x به سمت منفی بی‌نهایت میل کنه، حد تابع F_X(x) برابر با 0 میشه (چرا؟ چون احتمال اینکه یک متغیر تصادفی از منفی بی‌نهایت کوچیک‌تر باشه برابر صفره)
  • اگر x به سمت مثبت بی‌نهایت میل کنه، حد تابع F_X(x) برابر با 1 میشه (چرا؟ چون احتمال اینکه یک متغیر تصادفی از مثبت بی‌نهایت بزرگ‌تر باشه از 1 بیشتره)
  • صعودی است
  • پیوسته است (دقت کنید با مشتق‌پذیر بودن فرق داره، پیوسته بودن به این معنی است که نمی‌تونه یهو یه جهش داشته باشه)
  • تقریباً این تابع همه‌جا مشتق‌پذیر است (منظور از تقریباً اینجا چیه؟ یعنی تعداد نقاطی که توش مشتق‌پذیر نیست، شمارا هست)

در ادامه انواع متغیرهای تصادفی رو بررسی خواهیم کرد.

متغیر تصادفی یکنواخت یا Uniform

مثال ملاقات با دوستتون رو در نظر بگیرید. فرض کنید قرار هست در یک ساعتی بین بازه a تا b هم‌دیگه رو ملاقات کنید. از طرفی اصلاً مشخص نیست که در چه زمانی قراره ملاقات صورت بگیره، یه عبارتی دیگه، مشخص نیست زمان ملاقات نزدیک به زمان a باشه یا نزدیک به زمان b باشه. این مثالی هست از اولین متغیر تصادفی که بهش متغیر تصادفی یکنواخت گفته میشه و اگر X از توزیع یکنواخت اومده باشه به صورت زیر نمایش میدن:

X ~ Uniform(a, b)

از اونجایی که تابع چگالی احتمال این متغیر فقط در بازه a تا b مقدار داره و در به جز اون بازه 0 هست نمودارش به صورت زیر رسم میشه:

و برای تعریف تابع چگالی احتمال داریم:

برای تابع توزیع تجمعی نیز داریم:

تعریف تابع توزیع تجمعی برابر هست با:

تو تعریف بالا، در حالتی که x بین a و b قرار گرفته، اگر x برابر با a در نظر گرفته بشه مقدار تابع 0 میشه و اگر x برابر با b در نظر گرفته بشه مقدار تابع 1 میشه.

امید ریاضی هم برای این متغیر به صورت زیر تعریف میشه:

واریانس هم برابر هست با:

Var(X) = (a - b) ^ 2 / 12

که به صورت زیر محاسبه شده:

توزیع نرمال

اگر هر متغیر تصادفی دلخواهی رو (چه گسسته باشه، چه پیوسته) برداریم، سپس به تعداد دفعات زیاد ازش نمونه بگیریم، بعد، هر دفعه از خروجی نمونه‌ها میانگین بگیریم و در نهایت، مقادیر میانگین‌هارو پلات کنیم و رو نمودار ببریم، می‌بینیم که مقادیر میانگین از یک توزیعی تبعیت میکنن که به اون توزیع، توزیع نرمال میگن. برای جزییات بیشتر در این خصوص می‌تونید به دقیقه 50 تا 65 ویدیو این جلسه مراجعه کنید.

فرمول توزیع نرمال به صورت زیر تعریف میشه:

فرض کنید میانگین رو 0 در نظر بگیریم و مقدار واریانس رو 1. در این حالت خواهیم داشت:

در ادامه اثر مقادیر مختلف بر واریانس رو بررسی می‌کنیم.

فرض کنید دو تا توزیع نرمال داریم که میانگین هر دو 0 هست. یکی از توزیع‌ها واریانس 1 داره و یکی دیگه از توزیع‌ها واریانس 10. اگر نمودار این دو توزیع رو یک جا رسم کنیم به صورت زیر میشه:

نمودار بالا داره این رو نشون رو میده که هر چقدر مقدار واریانس بزرگ‌تر باشه، انگار میزان پراکندگی بیشتر میشه، برای همین نمودار بازتر میشه و هرچقدر مقدار واریانس کوچیک‌تر باشه، انگار میزان پراکندگی کمتر میشه و به همین دلیل نمودار جمع‌تر میشه.

به همین ترتیب اگر مقدار میانگین رو از صفر به عددی مثبت یا عددی منفی تغییر بدیم، نمودارهای بالا به ترتیب به سمت راست یا چپ حرکت می‌کنن.

جمع‌بندی مطالب ارائه شده

با متغیر تصادفی پیوسته آشنا شدیم و توزیع یکنواخت و توزیع نرمال رو بررسی کردیم.


اگر جایی ایراد یا مشکلی بود، حتما بهم بگید تا تصحیحش کنم. همچنین، پیشنهاد می‌کنم که حتماً صفحه گیت‌هاب این دوره رو مورد بررسی قرار بدین. حتماً به دردتون می‌خوره.

ویدیو این جلسه

صفحه گیت‌هاب مرتبط با این دوره

جزوه جلسه قبلی (جلسه هشتم)

جزوه جلسه بعدی (جلسه دهم)

توزیع نرمالمتغیر تصادفی
من هانیه‌ام. مدتیه شروع کردم به تولید محتوا در قالب متن و به زبان فارسی، از روی دوره‌هایی که می‌گذرونم. اگر دوست داشتین برام قهوه بخرید: https://coffeete.ir/honio
شاید از این پست‌ها خوشتان بیاید