منبع اصلی این پست، دوره آمار و احتمال مهندسی دکتر علی شریفی زارچی از آکادمی مکتبخونه میباشد. لطفاً برای حفظ حقوق منتشر کننده اصلی، ویدیوهارو از منبع اصلی دنبال کنید. همچنین، در انتهای هر جلسه، به ویدیو مربوط به آن جلسه ارجاع داده شده است.
سعی کردم هرچیزی که از ویدیوها فهمیدم رو به صورت متن در بیارم و در این پلتفورم با بقیه به اشتراک بذارم. کل ویدیوها 27 تاست که سعی میکنم هفتهای یک الی دو جلسه رو منتشر کنم. تا جایی که تونستم سعی کردم خوب و کامل بنویسم، اما اگر جایی ایرادی داشت، حتما تو کامنتها بهم بگید تا درستش کنم.
پیشنهاد میکنم قبل از خوندن ادامه مطلب، یک کاغذ و قلم جلو دستتون باشه تا بتونید روابط ارائه شده رو در جاهایی که لازم هست برای خودتون تو کاغذ بنویسید و محاسبات لازم رو خودتون هم انجام بدین تا بهتر متوجه بشید که در هر مرحله چه اتفاقی میفته.
با متغیر تصادفی گسسته آشنا شدیم و انواع توزیعهای گسسته رو شناختیم. از جمله توزیعهای برنولی، دوجملهای، هندسی، فوق هندسی و پوآسون. یه خلاصه بخوایم از هر توزیع بدیم به این صورت میشه گفت:
توزیع برنولی: پرتاب یک سکه که با احتمال p شیر میآید؟
توزیع دوجملهای: پرتاب n سکه / چند بار شیر میآید؟
توزیع هندسی: سکه با احتمال شیر آمدن p را چند بار بیندازیم تا اولین شیر بیاید؟
توزیع فوق هندسی: در یک ظرفیN1 تا توپ قرمز داریم و N2 تا توپ آبی. در مجموع n توپ تصادفی از ظرف خارج میکنیم و دنبال این هستیم که احتمال k تا توپ قرمز رو محاسبه کنیم.
توزیع پوآسون: تعداد دفعات وقوع یک پدیده در یک بازه زمانی با نرخ متوسط ʎ
در ادامه این جلسه قراره با متغیر تصادفی پیوسته و توزیعهای پیوسته آشنا بشیم.
اگر متغیر تصادفی X پیوسته باشه، range این متغیر دیگه اعداد شمارا نیستن و اعداد پیوسته هستن. تو حالت پیوسته تابعی رو تعریف میکنیم به اسم f_X(x) و بهش تابع چگالی احتمال میگیم. با یک مثال این تابع رو توضیح میدیم.
فرض کنید در یک بازه زمانی بین ساعت 4 الی 5 قراره فردی رو ملاقات کنیم و اصلاً مشخص نیست که در چه ساعتی بین این بازه زمانی قراره دیدار اتفاق بیفته. ولی مطمئن هستیم که قطعاً در این بازه زمانی خواهد بود. اگه بخوایم تابع چگالی احتمال رو براش مدل کنیم، خواهیم داشت:
احتمال دیدار قبل از ساعت 4 و بعد از ساعت 5 برابر با 0 هست و بین بازه 4 تا 5 برابر با عددی غیر صفر هست و اگر از تابع مدل شده انتگرال بگیریم حاصل برابر با 1 میشه. جلوتر در مورد اینکه این انتگرال چی هست بیشتر توضیح میدیم.
برای یک متغیر تصادفی پیوسته احتمال اینکه P(X=x) بشه برابر با 0 هست. به عبارتی دیگه، احتمال اینکه یک متغیر تصادفی دقیقاً یک عدد خاص بیاد برابر با 0 هست.
انتگرال زیر رو در نظر بگیرید:
داره این احتمال این رو نشون میده که X بین a تا b باشه:
در واقع، این رو بهمون نشون میده که چقدر احتمال داره قد یه آدمی بین 170 تا 180 باشه مثلاً. این رو نشون نمیده که اگه یه آدم رندوم انتخاب کنیم و بخوایم احتمال این رو حساب کنیم که قدش دقیقاً برابر با 176 باشه.
در توزیع گسسته مفهومی وجود داشت با عنوان تابع جرم احتمال، از اونجایی که در توزیع پیوسته در هر نقطه جرمی وجود نداره و فقط چگالی وجود داره، تابع چگالی احتمال رو داریم. مفهومش رو میشه با یه مثال توضیح داد.
فرض کنید توزیعی که قد آدمهارو نشون میده به صورت زیر باشه:
نمودار بالا داره این رو نشون میده که انگار تعداد آدمها با قد (160 تا 160 + دلتا) بیشتر هست نسبت به تعداد آدمها با قد (170 تا 170 + دلتا). در واقع این مفهوم تابع چگالی احتمال هست. دلتا هم یک عدد ثابته که با 160 و 170 میتونه جمع بشه و یک بازه رو به وجود بیاره. همونطور که از عکس هم مشخصه، مساحت زیر نمودار قرمز بیشتره نسبت به مساحت زیر نمودار آبی. به عبارتی دیگه، یعنی اگر بخوایم قد یک آدم رندوم رو اندازه بگیریم، با احتمال بیشتری تو ناحیه قرمز میفته نسبت به ناحیه آبی.
تابع دیگهای داریم که با نوتیشن F_X(x) نشون داده میشه و بهش CDF یا تابع توزیع تجمعی گفته میشه. دقت کنید که با تابع چگالی احتمال (که با نوتیشن f_X(x) مشخص میشه) فرق داره. با یه مثال بهتر مفهوم این تابع رو توضیح میدیم.
نمودار زیر رو در نظر بگیرید. نمودار مشخص کننده تابع چگالی احتمال همون مثالی هست که قرار بود با دوستمون بین ساعت 4 تا 5 ملاقات داشته باشیم.
اگه بخوایم برای نمودار بالا تابع توزیع تجمعی رو نشون بدیم، نمودارش به صورت زیر در میاد که با رنگ سبز مشخص شده. تا به ساعت 4 برسیم مقدارش 0 هست، از ساعت 4 تا 5 کم کم مقدارش به یک میرسه و بعد از ساعت 5 هم مقدارش 1 باقی میمونه.
مقدار ریاضی این تابع برابر هست با:
F_X(x) = P(X ≤ x) = ∫ f_x(u) du, (-∞, x)
و در ادامه با خصوصیات این تابع برای متغیرهای تصادفی پیوسته آشنا میشیم:
در ادامه انواع متغیرهای تصادفی رو بررسی خواهیم کرد.
مثال ملاقات با دوستتون رو در نظر بگیرید. فرض کنید قرار هست در یک ساعتی بین بازه a تا b همدیگه رو ملاقات کنید. از طرفی اصلاً مشخص نیست که در چه زمانی قراره ملاقات صورت بگیره، یه عبارتی دیگه، مشخص نیست زمان ملاقات نزدیک به زمان a باشه یا نزدیک به زمان b باشه. این مثالی هست از اولین متغیر تصادفی که بهش متغیر تصادفی یکنواخت گفته میشه و اگر X از توزیع یکنواخت اومده باشه به صورت زیر نمایش میدن:
X ~ Uniform(a, b)
از اونجایی که تابع چگالی احتمال این متغیر فقط در بازه a تا b مقدار داره و در به جز اون بازه 0 هست نمودارش به صورت زیر رسم میشه:
و برای تعریف تابع چگالی احتمال داریم:
برای تابع توزیع تجمعی نیز داریم:
تعریف تابع توزیع تجمعی برابر هست با:
تو تعریف بالا، در حالتی که x بین a و b قرار گرفته، اگر x برابر با a در نظر گرفته بشه مقدار تابع 0 میشه و اگر x برابر با b در نظر گرفته بشه مقدار تابع 1 میشه.
امید ریاضی هم برای این متغیر به صورت زیر تعریف میشه:
واریانس هم برابر هست با:
Var(X) = (a - b) ^ 2 / 12
که به صورت زیر محاسبه شده:
اگر هر متغیر تصادفی دلخواهی رو (چه گسسته باشه، چه پیوسته) برداریم، سپس به تعداد دفعات زیاد ازش نمونه بگیریم، بعد، هر دفعه از خروجی نمونهها میانگین بگیریم و در نهایت، مقادیر میانگینهارو پلات کنیم و رو نمودار ببریم، میبینیم که مقادیر میانگین از یک توزیعی تبعیت میکنن که به اون توزیع، توزیع نرمال میگن. برای جزییات بیشتر در این خصوص میتونید به دقیقه 50 تا 65 ویدیو این جلسه مراجعه کنید.
فرمول توزیع نرمال به صورت زیر تعریف میشه:
فرض کنید میانگین رو 0 در نظر بگیریم و مقدار واریانس رو 1. در این حالت خواهیم داشت:
در ادامه اثر مقادیر مختلف بر واریانس رو بررسی میکنیم.
فرض کنید دو تا توزیع نرمال داریم که میانگین هر دو 0 هست. یکی از توزیعها واریانس 1 داره و یکی دیگه از توزیعها واریانس 10. اگر نمودار این دو توزیع رو یک جا رسم کنیم به صورت زیر میشه:
نمودار بالا داره این رو نشون رو میده که هر چقدر مقدار واریانس بزرگتر باشه، انگار میزان پراکندگی بیشتر میشه، برای همین نمودار بازتر میشه و هرچقدر مقدار واریانس کوچیکتر باشه، انگار میزان پراکندگی کمتر میشه و به همین دلیل نمودار جمعتر میشه.
به همین ترتیب اگر مقدار میانگین رو از صفر به عددی مثبت یا عددی منفی تغییر بدیم، نمودارهای بالا به ترتیب به سمت راست یا چپ حرکت میکنن.
با متغیر تصادفی پیوسته آشنا شدیم و توزیع یکنواخت و توزیع نرمال رو بررسی کردیم.
اگر جایی ایراد یا مشکلی بود، حتما بهم بگید تا تصحیحش کنم. همچنین، پیشنهاد میکنم که حتماً صفحه گیتهاب این دوره رو مورد بررسی قرار بدین. حتماً به دردتون میخوره.