منبع اصلی این پست، دوره آمار و احتمال مهندسی دکتر علی شریفی زارچی از آکادمی مکتبخونه میباشد. لطفاً برای حفظ حقوق منتشر کننده اصلی، ویدیوهارو از منبع اصلی دنبال کنید. همچنین، در انتهای هر جلسه، به ویدیو مربوط به آن جلسه ارجاع داده شده است.
سعی کردم هرچیزی که از ویدیوها فهمیدم رو به صورت متن در بیارم و در این پلتفورم با بقیه به اشتراک بذارم. کل ویدیوها 27 تاست که سعی میکنم هفتهای یک الی دو جلسه رو منتشر کنم. تا جایی که تونستم سعی کردم خوب و کامل بنویسم، اما اگر جایی ایرادی داشت، حتما تو کامنتها بهم بگید تا درستش کنم.
پیشنهاد میکنم قبل از خوندن ادامه مطلب، یک کاغذ و قلم جلو دستتون باشه تا بتونید روابط ارائه شده رو در جاهایی که لازم هست برای خودتون تو کاغذ بنویسید و محاسبات لازم رو خودتون هم انجام بدین تا بهتر متوجه بشید که در هر مرحله چه اتفاقی میفته.
در جلسه گذشته با مفاهیم جدیدی به نام امید ریاضی و واریانس آشنا شدیم. امید ریاضی یا مقدار مورد انتظار بهمون میگفت که انتظار داریم یک متغیر تصافی به صورت میانگین چقدر بشه. واریانس هم این رو نشون میداد که توزیع متغیر تصادفی حول میانگین خیلی باز هست یا خیلی فشرده هست. یک مثال در تصویر زیر آورده شده است. در مثال زیر امید ریاضی برابر با 0 هست و مقدار واریانس نیز به صورت فرمولی محاسبه شده است و مقدار آن برابر هست با 5.25.
واریانس به صورت زیر فرموله میشه:
Var(X) = E [ x - E(X) ] ^ 2 = ∑ p(X=x) (x - E(X)) ^ 2 = ∑ p(X=x) (x^2 + E(X)^2 - 2xE(X)) = E(X)^2 ∑ p(X=x) - 2E(X) ∑ x p(X=x) + ∑ p(X=x) x^2 = E(X)^2 - 2E(X)^2 + E(X^2) = E(X^2) - E(X)^2
در ادامه میخوایم برگردیم به مثال پرتاب تاس و هر دو عبارت رو براش محاسبه کنیم.
از جلسه قبل میدونیم که E(X) پرتاب یک تاس برابر هست با 3.5 و اگر این مقدار به توان 2 برسه برابر میشه با 12.25. حالا بریم سراغ محاسبه E(X^2). میدونیم از قبل که برای یک تاس داریم X = {1, 2, 3, 4, 5, 6} و همچنین X^2 = {1, 4, 9, 16, 25, 36}. از طرفی p(x) برای هر وجه برابر هست با 1/6. پس E(X^2) برابر میشه با:
E(X^2) = ∑ p(x) x^2 = ∑ 1/6 * x^2 = 1/6 ∑ x^2 = 1/6 * (1 + 4 + 9 + 16 + 36) = 91/6 = 15.17
حالا اگه بخوایم واریانس رو برای تاس حساب کنیم، داریم:
E(X^2) - E(X)^2 = 15.17 - 12.25 = 2.92
مقدار انحراف از معیار هم برابر میشه با:
Radical(2.92) = 1.71
بعنوان اولین ویژگی داریم:
برای اینکه ویژگی بالارو بهتر درک کنیم میتونیم مثال تاس رو در نظر بگیریم. فرض کنید به جای اینکه مقادیر تاس از 1 تا 6 باشن همشون با عدد 5 جمع بشن و داشته باشیم:
X = {6, 7, 8, 9, 10 , 11}
تو این حالت هم اگه واریانس رو حساب کنیم میبینیم که برابر میشه با 2.92 که معادل هست با حالت قبلی. دلیلش هم اینکه امید ریاضی هم مثل همه مقادیر تاس 5 تا بهش اضافه میشه.
بعنوان یک مثال دیگه تصویر زیر رو در نظر بگیرید.
فرض کنید همه مقادیر X رو با 1/2 جمع کنیم. در این صورت خواهیم داشت:
آیا شکل نمودار تغییری کرد؟ نحوه پراکندگی دادهها حول میانگین عوض شد؟ نه ولی خود میانگین هم به اندازه 1/2 به سمت راست شیفت پیدا کرد و عوض شد. پس این یعنی اینکه جمع و تفریق X با عددی ثابت تو مقدار واریانس بیتاثیره.
حالا میخوایم این رو بررسی کنیم که ضرب یک عدد ثابت در X چه تاثیری روی واریانس میتونه بذاره. همون تصویر اولیه بالا رو در نظر بگیرید که میانگین روی 0 هست. فرض کنید هر x رو در عدد 3 ضرب کنیم. نتیجه به صورت تصویر زیر میشه. نقاط حاصل با رنگ نارنجی مشخص شدن. نقطه 1/2 به نقطه 3/2 تغییر پیدا کرده، نقطه 3/2 به نقطه 9/2 و همینطور بقیه نقاط جابجا شدن. همونطور که از تصویر هم مشخص هست میزان پراکندگی بیشتر شده. اگر به جای عدد 3، نقاط رو در 1/3 ضرب میکردیم نمودار جمعتر میشد و میزان پراکندگی کمتر. پس اگر x در عددی ضرب بشه، مقدار واریانس در مجذور اون عدد ضرب میشه. میتونید برای مثال واریانس نمودار زیر رو محاسبه کنید و با حالت اولیهش مقایسه کنید.
در ادامه قصد داریم یک سری متغیرهای مهم رو مورد بررسی قرار بدیم.
فرض کنید سکهای داریم. در هر بار انداختن این سکه با احتمال p میتونه شیر بیاد و با احتمال q = 1-p میتونه خط بیاد. فرض کنید پیشامدمون رو به صورت زیر فرموله کردیم:
سکهای داریم که با احتمال 3/4 شیر میاد و با احتمال 1/4 خط. اگر E(X) رو حساب کنیم حاصل میشه 3/4 که معادل هست با p. یعنی در یک آزمایش برنولی در صورتی که outcomeها 0 و 1 باشن، E(X) همواره برابر با p هست. حالا بریم سراغ بررسی واریانس که معادل میشه با p-p^2. به عبارتی دیگه برابر میشه با p(1-p) که معادل هست با pq.
توزیعی هست که در اون یک آزمایش برنولی به جای اینکه یک بار انجام بشه، n بار انجام میشه. مثلاً در پرتاب یک سکه مثل این میمونه که بیایم یک سکه رو مثلاً 20 بار بندازیم و بعد بررسی کنیم چند بار شیر اومده یا چند بار خط اومده.
برای بررسی دقیقتر این توزیع، فرض کنید سکهای داریم که با احتمال p شیر میاد (1) و با احتمال q=p-1 خط میاد (0). این سکه رو n بار پرتاب میکنیم. این متغیر تصادفی رو با X نشون میدیم. فرض کنید یک متغیر تصادفی دیگهای هم داریم که با Y نشون میدیم و مشخص میکنه که تعداد 1 آمدنها (شیر آمدنها) در n بار پرتاب سکه چقدر هست. میدونیم که X از توزیع برنولی تبعیت میکنه و Y از توزیع دو جملهای تبعیت میکنه. حالا میخوایم احتمال P(Y=k) رو محاسبه کنیم. داریم:
P(Y=k) = C(k, n) (p)^k (1-p)^(n-k)
به کمک این فرمول بهدست اومده میتونیم حساب کنیم که احتمال اینکه مثلاً در 50 بار پرتاب سکه 23 بار سکه رو آمده باشد چقدر است.
در ادامه E(Y) رو میخوایم محاسبه کنیم. بعنوان راه اول میشه فرمول زیر رو بسط داد و به جواب رسید. داریم:
E(Y) = ∑ k P(Y=k) = ∑ k C(k, n) (p)^k (1-p)^(n-k) = np
از راه دیگری هم میشه حاصل E(Y) رو محاسبه کرد. در جلسات آینده خواهیم دید که فرمول زیر برای امید ریاضی تحت هر شرایطی همواره برقرار است:
E(X1 + X2 + ... + Xn) = E(X1) + E(X2) + ... + E(Xn)
حالا، متغیر تصادفی Y انگار خودش از جمع تعدادی متغیر تصادفی دیگه به دست اومده. به این صورت که هر دفعه یک بار داریم سکه رو میاندازیم. پس داریم:
Y = X1 + x2 + ... + Xn
E(Y) = E(X1) + E(X2) + ... + E(Xn) = ∑ E(Xi) = np
ممکنه سوال پیش بیاد چرا E(Xi) برابر با p هست. هر E(Xi) از یک توزیع برنولی میاد و کمی بالاتر دیدیم که E(X) در صورتی که X از یک توزیع برنولی اومده باشه برابر میشه با p.
در ادامه قصد داریم واریانس Y رو محاسبه کنیم. برای محاسبه واریانس هم نیاز هست تا از رابطهای که در جلسات آینده مورد بررسی قرار میدیم استفاده کنیم. رابطه زیر فقط و فقط در صورتی برقرار هست که متغیرهای تصادفی Xi همگی مستقل از هم باشند. داریم:
Var(X1 + X2 + ... + Xn) = Var(X1) + Var(X2) + ... + Var(Xn)
در توزیع دو جملهای مطمئن هستیم که در هر بار تکرار آزمایش برنولی، هر آزمایش مستقل از آزمایش دیگری است. هر بار که سکهای میاندازیم، مستقل از دفعه پیشین و پسین است. پس به همین دلیل میتوانیم از رابطه بالا برای محاسبه واریانس استفاده کنیم. بنابراین داریم:
Var(Y) = Var(X1) + Var(X2) + ... + Var(Xn) = ∑ Var(Xi) = npq
اگر سوال شد که مقدار pq چجوری به دست اومده، مجدداً به این دلیل هست که هر متغیر تصادفی Xi از یک توزیع برنولی میاد و بالاتر دیدیم که واریانس X در صورتی که از توزیع برنولی اومده باشه برابر هست با pq.
حالا، اگر یک سکه fair رو (سکهای که با احتمال 0.5 شیر و با احتمال 0.5 خط میاد) 42 بار بندازیم و نمودار PMF اون رو رسم کنیم خواهیم داشت:
نمودار بالا داره میگه که احتمال اینکه 21 بار از 42 بار پرتاب سکه شیر بیاد برابر هست با 0.12.
حالا اگه سکه fair نباشه و با احتمال 0.75 شیر بیاد و با احتمال 0.25 صدم خط بیاد و 42 بار پرتاب بشه، نمودار PMFاون به صورت زیر میشه:
تقریباً از دقیقه 60 تا انتهای جلسه یک سری کد به زبان R در کلاس زده میشه که اگر علاقهمند هستید، پیشنهاد میکنم نگاهی به ویدیو این جلسه بندازید.
با توزیع برنولی و توزیع دو جملهای آشنا شدیم و مقادیر امید ریاضی و واریانس رو برای هر کدوم محاسبه کردیم.
اگر جایی ایراد یا مشکلی بود، حتما بهم بگید تا تصحیحش کنم. همچنین، پیشنهاد میکنم که حتماً صفحه گیتهاب این دوره رو مورد بررسی قرار بدین. حتماً به دردتون میخوره.