هانیه مهدوی
هانیه مهدوی
خواندن ۸ دقیقه·۲ سال پیش

جزوه دوره آمار و احتمال دکتر علی شریفی - جلسه هفتم - توزیع برنولی و دو جمله‌ای

منبع اصلی این پست، دوره آمار و احتمال مهندسی دکتر علی شریفی زارچی از آکادمی مکتبخونه می‌باشد. لطفاً برای حفظ حقوق منتشر کننده اصلی، ویدیوهارو از منبع اصلی دنبال کنید. همچنین، در انتهای هر جلسه، به ویدیو مربوط به آن جلسه ارجاع داده شده است.

سعی کردم هرچیزی که از ویدیوها فهمیدم رو به صورت متن در بیارم و در این پلت‌فورم با بقیه به اشتراک بذارم. کل ویدیوها 27 تاست که سعی می‌کنم هفته‌ای یک الی دو جلسه رو منتشر کنم. تا جایی که تونستم سعی کردم خوب و کامل بنویسم، اما اگر جایی ایرادی داشت، حتما تو کامنت‌ها بهم بگید تا درستش کنم.

پیشنهاد می‌کنم قبل از خوندن ادامه مطلب، یک کاغذ و قلم جلو دستتون باشه تا بتونید روابط ارائه شده رو در جاهایی که لازم هست برای خودتون تو کاغذ بنویسید و محاسبات لازم رو خودتون هم انجام بدین تا بهتر متوجه بشید که در هر مرحله چه اتفاقی میفته.


مروری بر مباحث جلسه گذشته

در جلسه گذشته با مفاهیم جدیدی به نام امید ریاضی و واریانس آشنا شدیم. امید ریاضی یا مقدار مورد انتظار بهمون میگفت که انتظار داریم یک متغیر تصافی به صورت میانگین چقدر بشه. واریانس هم این رو نشون میداد که توزیع متغیر تصادفی حول میانگین خیلی باز هست یا خیلی فشرده هست. یک مثال در تصویر زیر آورده شده است. در مثال زیر امید ریاضی برابر با 0 هست و مقدار واریانس نیز به صورت فرمولی محاسبه شده است و مقدار آن برابر هست با 5.25.

نگاهی دقیق‌تر بر واریانس

واریانس به صورت زیر فرموله میشه:

Var(X) = E [ x - E(X) ] ^ 2 = ∑ p(X=x) (x - E(X)) ^ 2 = ∑ p(X=x) (x^2 + E(X)^2 - 2xE(X)) = E(X)^2 ∑ p(X=x) - 2E(X) ∑ x p(X=x) + ∑ p(X=x) x^2 = E(X)^2 - 2E(X)^2 + E(X^2) = E(X^2) - E(X)^2

در ادامه می‌خوایم برگردیم به مثال پرتاب تاس و هر دو عبارت رو براش محاسبه کنیم.

از جلسه قبل می‌دونیم که E(X) پرتاب یک تاس برابر هست با 3.5 و اگر این مقدار به توان 2 برسه برابر میشه با 12.25. حالا بریم سراغ محاسبه E(X^2). می‌دونیم از قبل که برای یک تاس داریم X = {1, 2, 3, 4, 5, 6} و همچنین X^2 = {1, 4, 9, 16, 25, 36}. از طرفی p(x) برای هر وجه برابر هست با 1/6. پس E(X^2) برابر میشه با:

E(X^2) = ∑ p(x) x^2 = ∑ 1/6 * x^2 = 1/6 ∑ x^2 = 1/6 * (1 + 4 + 9 + 16 + 36) = 91/6 = 15.17

حالا اگه بخوایم واریانس رو برای تاس حساب کنیم، داریم:

E(X^2) - E(X)^2 = 15.17 - 12.25 = 2.92

مقدار انحراف از معیار هم برابر میشه با:

Radical(2.92) = 1.71

ویژگی‌های واریانس

بعنوان اولین ویژگی داریم:

برای اینکه ویژگی بالارو بهتر درک کنیم می‌تونیم مثال تاس رو در نظر بگیریم. فرض کنید به جای اینکه مقادیر تاس از 1 تا 6 باشن همشون با عدد 5 جمع بشن و داشته باشیم:

X = {6, 7, 8, 9, 10 , 11}

تو این حالت هم اگه واریانس رو حساب کنیم می‌بینیم که برابر میشه با 2.92 که معادل هست با حالت قبلی. دلیلش هم اینکه امید ریاضی هم مثل همه مقادیر تاس 5 تا بهش اضافه میشه.

بعنوان یک مثال دیگه تصویر زیر رو در نظر بگیرید.

فرض کنید همه مقادیر X رو با 1/2 جمع کنیم. در این صورت خواهیم داشت:

آیا شکل نمودار تغییری کرد؟ نحوه پراکندگی داده‌ها حول میانگین عوض شد؟ نه ولی خود میانگین هم به اندازه 1/2 به سمت راست شیفت پیدا کرد و عوض شد. پس این یعنی اینکه جمع و تفریق X با عددی ثابت تو مقدار واریانس بی‌تاثیره.

حالا می‌خوایم این رو بررسی کنیم که ضرب یک عدد ثابت در X چه تاثیری روی واریانس می‌تونه بذاره. همون تصویر اولیه بالا رو در نظر بگیرید که میانگین روی 0 هست. فرض کنید هر x رو در عدد 3 ضرب کنیم. نتیجه به صورت تصویر زیر میشه. نقاط حاصل با رنگ نارنجی مشخص شدن. نقطه 1/2 به نقطه 3/2 تغییر پیدا کرده، نقطه 3/2 به نقطه 9/2 و همینطور بقیه نقاط جابجا شدن. همونطور که از تصویر هم مشخص هست میزان پراکندگی بیشتر شده. اگر به جای عدد 3، نقاط رو در 1/3 ضرب می‌کردیم نمودار جمع‌تر میشد و میزان پراکندگی کمتر. پس اگر x در عددی ضرب بشه، مقدار واریانس در مجذور اون عدد ضرب میشه. می‌تونید برای مثال واریانس نمودار زیر رو محاسبه کنید و با حالت اولیه‌ش مقایسه کنید.

در ادامه قصد داریم یک سری متغیرهای مهم رو مورد بررسی قرار بدیم.

توزیع برنولی

فرض کنید سکه‌ای داریم. در هر بار انداختن این سکه با احتمال p میتونه شیر بیاد و با احتمال q = 1-p می‌تونه خط بیاد. فرض کنید پیشامدمون رو به صورت زیر فرموله کردیم:

سکه‌ای داریم که با احتمال 3/4 شیر میاد و با احتمال 1/4 خط. اگر E(X) رو حساب کنیم حاصل میشه 3/4 که معادل هست با p. یعنی در یک آزمایش برنولی در صورتی که outcomeها 0 و 1 باشن، E(X) همواره برابر با p هست. حالا بریم سراغ بررسی واریانس که معادل میشه با p-p^2. به عبارتی دیگه برابر میشه با p(1-p) که معادل هست با pq.

توزیع دو جمله‌ای

توزیعی هست که در اون یک آزمایش برنولی به جای اینکه یک بار انجام بشه، n بار انجام میشه. مثلاً در پرتاب یک سکه مثل این می‌مونه که بیایم یک سکه رو مثلاً 20 بار بندازیم و بعد بررسی کنیم چند بار شیر اومده یا چند بار خط اومده.

برای بررسی دقیق‌تر این توزیع، فرض کنید سکه‌ای داریم که با احتمال p شیر میاد (1) و با احتمال q=p-1 خط میاد (0). این سکه رو n بار پرتاب می‌کنیم. این متغیر تصادفی رو با X نشون می‌دیم. فرض کنید یک متغیر تصادفی دیگه‌ای هم داریم که با Y نشون می‌دیم و مشخص می‌کنه که تعداد 1 آمدن‌ها (شیر آمدن‌ها) در n بار پرتاب سکه چقدر هست. می‌دونیم که X از توزیع برنولی تبعیت می‌کنه و Y از توزیع دو جمله‌ای تبعیت می‌کنه. حالا می‌خوایم احتمال P(Y=k) رو محاسبه کنیم. داریم:

P(Y=k) = C(k, n) (p)^k (1-p)^(n-k)

به کمک این فرمول به‌دست اومده می‌تونیم حساب کنیم که احتمال اینکه مثلاً در 50 بار پرتاب سکه 23 بار سکه رو آمده باشد چقدر است.

در ادامه E(Y) رو می‌خوایم محاسبه کنیم. بعنوان راه اول میشه فرمول زیر رو بسط داد و به جواب رسید. داریم:

E(Y) = ∑ k P(Y=k) = ∑ k C(k, n) (p)^k (1-p)^(n-k) = np

از راه دیگری هم میشه حاصل E(Y) رو محاسبه کرد. در جلسات آینده خواهیم دید که فرمول زیر برای امید ریاضی تحت هر شرایطی همواره برقرار است:

E(X1 + X2 + ... + Xn) = E(X1) + E(X2) + ... + E(Xn)

حالا، متغیر تصادفی Y انگار خودش از جمع تعدادی متغیر تصادفی دیگه به دست اومده. به این صورت که هر دفعه یک بار داریم سکه رو می‌اندازیم. پس داریم:

Y = X1 + x2 + ... + Xn

E(Y) = E(X1) + E(X2) + ... + E(Xn) = ∑ E(Xi) = np

ممکنه سوال پیش بیاد چرا E(Xi) برابر با p هست. هر E(Xi) از یک توزیع برنولی میاد و کمی بالاتر دیدیم که E(X) در صورتی که X از یک توزیع برنولی اومده باشه برابر میشه با p.

در ادامه قصد داریم واریانس Y رو محاسبه کنیم. برای محاسبه واریانس هم نیاز هست تا از رابطه‌ای که در جلسات آینده مورد بررسی قرار می‌دیم استفاده کنیم. رابطه زیر فقط و فقط در صورتی برقرار هست که متغیرهای تصادفی Xi همگی مستقل از هم باشند. داریم:

Var(X1 + X2 + ... + Xn) = Var(X1) + Var(X2) + ... + Var(Xn)

در توزیع دو جمله‌ای مطمئن هستیم که در هر بار تکرار آزمایش برنولی، هر آزمایش مستقل از آزمایش دیگری است. هر بار که سکه‌ای می‌اندازیم، مستقل از دفعه پیشین و پسین است. پس به همین دلیل می‌توانیم از رابطه بالا برای محاسبه واریانس استفاده کنیم. بنابراین داریم:

Var(Y) = Var(X1) + Var(X2) + ... + Var(Xn) = ∑ Var(Xi) = npq

اگر سوال شد که مقدار pq چجوری به دست اومده، مجدداً به این دلیل هست که هر متغیر تصادفی Xi از یک توزیع برنولی میاد و بالاتر دیدیم که واریانس X در صورتی که از توزیع برنولی اومده باشه برابر هست با pq.

حالا، اگر یک سکه fair رو (سکه‌ای که با احتمال 0.5 شیر و با احتمال 0.5 خط میاد) 42 بار بندازیم و نمودار PMF اون رو رسم کنیم خواهیم داشت:

نمودار بالا داره میگه که احتمال اینکه 21 بار از 42 بار پرتاب سکه شیر بیاد برابر هست با 0.12.

حالا اگه سکه fair نباشه و با احتمال 0.75 شیر بیاد و با احتمال 0.25 صدم خط بیاد و 42 بار پرتاب بشه، نمودار PMFاون به صورت زیر میشه:

تقریباً از دقیقه 60 تا انتهای جلسه یک سری کد به زبان R در کلاس زده میشه که اگر علاقه‌مند هستید، پیشنهاد می‌کنم نگاهی به ویدیو این جلسه بندازید.

جمع‌بندی مطالب ارائه شده

با توزیع برنولی و توزیع دو جمله‌ای آشنا شدیم و مقادیر امید ریاضی و واریانس رو برای هر کدوم محاسبه کردیم.


اگر جایی ایراد یا مشکلی بود، حتما بهم بگید تا تصحیحش کنم. همچنین، پیشنهاد می‌کنم که حتماً صفحه گیت‌هاب این دوره رو مورد بررسی قرار بدین. حتماً به دردتون می‌خوره.

ویدیو این جلسه

صفحه گیت‌هاب مرتبط با این دوره

جزوه جلسه قبلی (جلسه ششم)

جزوه جلسه بعدی (جلسه هشتم)

واریانساحتمال
من هانیه‌ام. مدتیه شروع کردم به تولید محتوا در قالب متن و به زبان فارسی، از روی دوره‌هایی که می‌گذرونم. اگر دوست داشتین برام قهوه بخرید: https://coffeete.ir/honio
شاید از این پست‌ها خوشتان بیاید