هانیه مهدوی
هانیه مهدوی
خواندن ۱۱ دقیقه·۳ سال پیش

جزوه دوره آمار و احتمال دکتر علی شریفی - جلسه پنجم - استقلال شرطی، قاعده زنجیره، متغیر تصادفی

منبع اصلی این پست، دوره آمار و احتمال مهندسی دکتر علی شریفی زارچی از آکادمی مکتبخونه می‌باشد. لطفاً برای حفظ حقوق منتشر کننده اصلی، ویدیوهارو از منبع اصلی دنبال کنید. همچنین، در انتهای هر جلسه، به ویدیو مربوط به آن جلسه ارجاع داده شده است.

سعی کردم هرچیزی که از ویدیوها فهمیدم رو به صورت متن در بیارم و در این پلت‌فورم با بقیه به اشتراک بذارم. کل ویدیوها 27 تاست که سعی می‌کنم هفته‌ای یک الی دو جلسه رو منتشر کنم. تا جایی که تونستم سعی کردم خوب و کامل بنویسم، اما اگر جایی ایرادی داشت، حتما تو کامنت‌ها بهم بگید تا درستش کنم.

پیشنهاد می‌کنم قبل از خوندن ادامه مطلب، یک کاغذ و قلم جلو دستتون باشه تا بتونید روابط ارائه شده رو در جاهایی که لازم هست برای خودتون تو کاغذ بنویسید و محاسبات لازم رو خودتون هم انجام بدین تا بهتر متوجه بشید که در هر مرحله چه اتفاقی میفته.

توجه: در ادامه این پست منظور از A' و 'A متمم مجموعه A و منظور از B' و 'B متمم مجموعه B است.

مروری بر جلسه گذشته و مبحث این جلسه

مفهوم استقلال و وابستگی رو بررسی کردیم و گفتیم دو رویداد رو مستقل از هم میگیم هرگاه اطلاعات یکی از رویدادها تاثیری در رویداد دیگه نذاره. به عبارتی دیگه:

P(A | B) = P(A)

P(B | A) = P(B)

و از این دو رابطه به رابطه زیر می‌رسیدیم:

P(A ∩ B) = P(A) P(B)

حالا یه سوال. فرض کنید دیتای 1000 تا خانواده رو جمع کردیم که دارای دو فرزند هستند. حالا اتفاقی که افتاده اینطور بوده که اون خانواده‌هایی که دو تا دختر داشتن (یعنی احتمال اینکه بچه اول دختر باشه و احتمال اینکه بچه دوم دختر باشه) یعنی P(A ∩ B) دقیقاً با P(A) P(B) برابر نمیشه و اندازه یک هزارم جواب‌ها باهم تفاوت دارند. در این صورت دو رویداد A و B رو مستقل از هم در نظر می‌گیرید، یا چون دو طرف رابطه دقیقاً باهم برابر نشدن، دو رویداد رو غیر مستقل از هم در نظر می‌گیرید؟

قضیه اینکه وقتی میایم آمار می‌گیریم همه نمونه‌ها رو که نداریم، باید بیایم از رو نمونه‌هایی که داریم تخمین بزنیم که آیا دو رویداد A و B مستقل از هم هستند یا بهم وابسته‌اند. حالا اینجا باید چه تصمیمی بگیریم؟
یه رویکرد اینکه بگیم چقدر احتمال داره که دو رویداد از هم مستقل باشن و چقدر احتمال داره که بهم وابسته باشن. حالا اینکه چجوری اینارو تست می‌کنیم و این احتمال‌هارو به دست بیاریم رو در جلسات آینده مفصل در موردشون توضیح خواهیم داد.

یه جمله هست که میگه "روح اصلی آمار شرطی بودن اون هست" و تقریباً هر اتفاقی که در آمار و احتمال میفته رو می‌تونیم به صورت شرطی در بیاریم.

حالا یه مثال رو در نظر بگیرید.

فرض کنید یه تاسی رو یک بار می‌اندازیم، رویداد اینکه عدد تاس 5 بیاد رو رویداد A در نظر می‌گیریم. بار دوم تاس رو می‌اندازیم و رویداد اینکه در دفعه دوم هم عدد 5 بیاد رو رویداد B در نظر می‌گیریم. یک رویداد C هم در نظر بگیرید که اینطور باشه که جمع دو بار تاس انداختن برابر بشه با 10.

حالا سوال. آیا می‌تونیم بگیم دو رویداد A و B از هم مستقل هستند یا نه؟

بله مستقل هستند. چون داریم:

P(A) = 1/6

P(B) = 1/6

P(A ∩ B) = 1/6 * 1/6 = 1/36 = P(A) P(B)

پس انگار داریم:

P(A | B) = P(A)

P(B | A) = P(B)

حالا اگه اینطور باشه که بهمون بگن می‌دونیم رویداد C حتماً اتفاق افتاده، یعنی دو بار تاس ریختیم و می‌دونیم که جمع دو تاس 10 شده. آیا باز هم A و B از هم مستقل هستند؟

اگه بخوایم سوال رو به زبان ریاضی بنویسیم میگه بیا بررسی کن که آیا روابط زیر درست هستند یا نه:

P(A | C, B) = P(A | C ∩ B) = P(A | CB) ≟ P(A | C)

P(B | C, A) = P(B | C ∩ A) = P(B | CA) ≟ P(B | C)

اگه براتون سوال شد روابط بالا یعنی چی، مثل این می‌مونه که انگار بیایم به روابط زیر یه ترم given C اضافه کنیم:

P(A | B) = P(A)

P(B | A) = P(B)

بعد از اضافه کردن given C:

P(A | BC) = P(A | C)

P(B | AC) = P(B | C)

اگه بخوایم روابط بالا رو به صورت فارسی بگیم به این صورت گفته میشه: دو تا رویداد مستقل هستند به شرط C یا اینکه دو تا رویداد مستقل هستند given C اگر روابط زیر برقرار باشد:

P(A | BC) = P(A | C)

P(B | AC) = P(B | C)

حالا اگر دو رابطه بالا برقرار باشند، نتیجه میشه اینکه A و B با دانستن C مستقل هستند.

حالا برگردیم به سوالی که داشتیم. می‌خوایم ببینیم اگه بدونیم C رخ داده باشه آیا همچنان دو رویداد B و A از هم مستقل هستند یا خیر؟

اول بریم P(A | C) رو محاسبه کنیم:

P(A | C) = P(A ∩ C) / P(C) = (1/36) / (3/36) = 1/3

حالا بریم سراغ محاسبه P(A | BC):

P(A | BC) = P(A ∩ B ∩ C) / P(B ∩ C) = (1/36) / (1/36) = 1

حالا چون داریم:

P(A | C) ≠ P(A | BC)

پس با دونستن C دو رویداد A و B از هم مستقل نیستند.

اگه بخوایم به یک جمع‌بندی در مورد همه مواردی که تا اینجا گفتیم برسیم به این صورت خواهد بود:

دو رویداد که از هم مستقل هستند با دونستن اطلاعات جدید ممکن است دیگر از هم مستقل نباشند و استقلالشون رو از دست بدن. برعکس این مورد هم ممکنه.

حالا بریم جزییات بیشتری از این روابط رو بررسی کنیم.

گفتیم روابط زیر برقرار هست:

P(A | B, C) = P(A | C)

P(B | A, C) = P(B | C)

می‌تونیم روابط بالا رو باز کنیم و به رابطه‌ی زیر برسیم:

P(A | B, C) = P(A | C) = P(A ∩ B ∩ C) / P(B ∩ C) = P(A ∩ C) / P(C)

حالا میشه یک طرفین وسطین انجام داد و خواهیم داشت:

P(A ∩ B ∩ C) / P(A ∩ C) = P(B ∩ C) / P(C)

از رابطه بالا می‌تونیم به رابطه زیر برسیم:

P(B | A, C) = P(B | C)

تمام این روابط به شرطی برقرار هست که P(C) از صفر بزرگ‌تر باشه.

میشه حتی به روابط دیگه‌ای هم رسید. مثلاً رابطه زیر رو که یکم بالاتر هم حسابش کردیم در نظر بگیرید:

P(A | B, C) = P(A | C) = P(A ∩ B ∩ C) / P(B ∩ C) = P(A ∩ C) / P(C)

فرض کنید میایم به صورت زیر تغییرش می‌دیم:

P(A ∩ B ∩ C) = P(A ∩ C) P(B ∩ C) / P(C)

و بعد طرفین رو بر P(C) تقسیم می‌کنیم:

P(A ∩ B ∩ C) / P(C) = P(A ∩ C) P(B ∩ C) / P(C) P(C)

رابطه بالا معادل هست با:

P(A ∩ B | C) = P(A | C) P(B | C)

این رابطه آخری که به دست آوردیم، در واقع ورژن شرطی رابطه زیر هست:

P(A ∩ B) = P(A) P(B)

کلاً هدف از نوشتن این روابط این بود که نشون بدیم این رابطه‌های به دست اومده همشون باهم هم ارز هستن.

در ادامه یک کوییز در قالب چند سوال آورده شده. در صورت تمایل می‌تونید قبل دیدن جواب خودتون به حل سوالات بپردازید و بعد جوابش رو چک کنید.

کوییز

شرح مسئله کلی به صورت زیر هست:

حالا تو هر مرحله جواب هر سوال رو محاسبه کنید:

سوال اول: P(A | C) = ?

پاسخ: سوال داره میگه می‌دونیم که سکه معمولی رو انتخاب کردیم. احتمال اینکه پرتاپ اول شیر بیاد چقدره؟ مسلماً میشه 1/2.

P(A | C) = P(A ∩ C) / P(C) = (1/2)(1/2) / (1/2) = 1/2

سوال دوم: P(B | C) = ?

پاسخ: سوال داره میگه می‌دونیم که سکه معمولی رو انتخاب کردیم. احتمال اینکه پرتاپ دوم شیر بیاد چقدره؟ مسلماً بازم میشه 1/2.

P(B | C) = P(B ∩ C) / P(C) = (1/2)(1/2) / (1/2) = 1/2

سوال سوم: P(A ∩ B | C) = ?

پاسخ: سوال داره میگه می‌دونیم که سکه معمولی رو انتخاب کردیم. احتمال اینکه پرتاپ اول شیر بیاد و پرتاب دوم شیر بیاد چقدره؟ میشه 1/4.

P(A ∩ B | C) = P(A ∩ B ∩ C) / P(C) = (1/2)(1/2)(1/2) / (1/2) = 1/4

سوال چهارم: P(A) = ?

پاسخ: دو حالت وجود داره. سکه از نوع سالم باشد و پرتاب اول شیر بیاید یا سکه از نوع ناسالم باشد و پرتاب اول شیر بیاید. پس داریم:

P(A) = (1/2)(1/2) + (1/2)(1) = (1/4) + (1/2) = 3/4

جواب بالا در واقع از فرمول زیر اومده:

P(A) = P(A | C) P(C) + P(A | C') P(C') = (1/2)(1/2) + (1)(1/2) = 3/4

سوال پنجم: P(B) = ?

پاسخ: دو حالت وجود داره. سکه از نوع سالم باشد و پرتاب دوم شیر بیاید یا سکه از نوع ناسالم باشد و پرتاب دوم شیر بیاید. پس داریم:

P(B) = (1/2)(1/2) + (1/2)(1) = (1/4) + (1/2) = 3/4

جواب بالا در واقع از فرمول زیر اومده:

P(B) = P(B | C) P(C) + P(B | C') P(C') = (1/2)(1/2) + (1)(1/2) = 3/4

سوال ششم: P(A ∩ B) = ?

پاسخ: میگه چقدر احتمال داره پرتاب اول شیر بیاد و پرتاپ دوم شیر بیاد؟ دو حالت داریم. یا سکه سالم باشه یا سکه ناسالم باشه. برای هر کدوم جدا جدا حساب می‌کنیم و در نهایت جمع می‌کنیم. پس داریم:

P(A ∩ B) = ((1/2)(1/2)(1/2)) + ((1/2)(1)(1)) = 1/8 + 1/2 = 5/8

سوال هفتم: آیا A و B نسبت بهم مستقل هستند؟

پاسخ: باید این رو بررسی کنیم که آیا رابطه زیر برقرار هست یا خیر:

P(A ∩ B) = P(A) P(B)

سمت چپ مساوی داره میگه احتمال این رو حساب کن که پرتاب اول شیر بیاد و پرتاب دوم هم شیر بیاد که میشه:

P(A ∩ B) = ((1/2)(1/2)(1/2)) + ((1/2)(1)(1)) = 1/8 + 1/2 = 5/8

سمت راست تساوی هم جوابش میشه:

P(A) P(B) = (3/4)(3/4) = 9/16

پس دو رویداد A و B از هم مستقل نیستند.

سوال هشتم: اگر C رو بدونیم، آیا A و B از هم مستقل هستند؟

پاسخ: باید این رو بررسی کنیم که آیا رابطه زیر برقرار هست یا خیر:

P(A ∩ B | C) = P(A | C) P(B | C)

چون مقادیرشو در سوالات قبلی حساب کردیم فقط جایگذاری می‌کنیم و داریم:

1/4 = (1/2)(1/2)

پس با فرض دونستن C دو رویداد A و B از هم مستقل هستند.

مثال

حالا در ادامه یک مثال دیگه رو باهم بررسی خواهیم کرد.

فرض کنید یک کارخونه 100 تا لامپ ساخته و می‌دونیم 5 تا از لامپ‌ها خرابه. 3 تا لامپ رو انتخاب کردیم، می‌خوایم احتمال این رو حساب کنیم که هر سه تا لامپ سالم باشه چقدره؟

فرض کنید میایم سه تا رویداد رو به صورت زیر در نظر می‌گیریم:

A = لامپ اول درست

B = لامپ دوم درست

C = لامپ سوم درست

حالا هدف اینکه بیایم مقدار P(A ∩ B ∩ C) رو در نهایت حساب کنیم. قدم به قدم جلو میریم. اول مقدار P(A) رو حساب می‌کنیم:

P(A) = 95/100

بعد مقدار P(A ∩ B) رو به دست میاریم:

P(A ∩ B) = P(B | A) P(A) = (94/99)(95/100)

حالا میایم سراغ محاسبه P(A ∩ B ∩ C):

P(A ∩ B ∩ C) = P(C | A ∩ B) P(A ∩ B ) = P(C | A ∩ B) P(B | A) P(A) = (93/98)((94/99)(95/100))

به قاعده‌ای که در رابطه بالا برای حل مسئله ازش استفاده کردیم، قانون زنجیره‌ای میگن.

در جلسات گذشته دیدیم که برای به دست آوردن اجتماع میشه از رابطه زیر استفاده کرد:

P(A1 ∪ A2 ∪ ... ∪ Ak) = P(∪Ai) = ∑P(Ai) - ∑P(Ai ∩ Aj) + ∑P(Ai ∩Aj ∩ Ak) + ...

حالا به کمک قانون زنجیره‌ای میشه اشتراک رو محاسبه کرد:

P(A1 ∩ A2 ∩ ... ∩ Ak) = P(A1) P(A2 | A1) P(A3 | A2, A1) ... P(Ak | Ak-1, Ak-2, ..., A1)

سوال

وقتی میگیم یک تاسی رو می‌اندازیم، فضای احتمال میشه {1, 2, 3, 4, 5, 6} و وقتی میگیم یک سکه‌ای رو می‌اندازیم فضای احتمال میشه {H, T}. حالا اگه بیایم تاس ریختن رو رویداد A در نظر بگیریم و انداختن سکه رو رویداد B، یعنی چی وقتی میگیم بیا A∩B رو محاسبه کن؟ مگه میشه دو تا فضای احتمالی مستقل از هم رو، باهم دیگه مقایسه کرد؟

تو این حالت انگار میایم ضرب دکارتی دو فضای احتمال رو در نظر می‌گیریم و انگار داریم فضای احتمال جدیدی رو می‌سازیم که هست {(H, 1), (T, 1), (H, 2), ..., (6, H), (6, T)}. پس مشکلی نداره اگه بخوایم اشتراک یا اجتماع بگیریم.

متغیر تصادفی

متغیر تصادفی تعریف خیلی ساده و واضحی داره. فرض کنید در مورد خانواده‌هایی که دو تا فرزند دارن تحقیق کردیم و X رو یک متغیر تصادفی تعریف کردیم به صورتی که:

در واقع یک مپ کردن هست بین پیشامدها و اعداد. یه جور قرارداده. در واقع داریم هر کدوم از پیشامدها رو به یک عدد از محور حقیقی مپ می‌کنیم. انگار یک تابع است از هر پیشامد (outcome) از فضای نمونه به مجموعه اعداد حقیقی.

مثلاً یک متغیر تصادفی می‌تونه این باشه که بیایم بگیم شیر اومدن سکه رو 1 در نظر می‌گیریم و خط اومدنش رو 0. اگه بخوایم نموداری هم رسم کنیم براش به این صورت میشه:

اگه همین نمودار بالا رو برای مثال خانواده‌ها (با این فرض که جنسیت بچه اول مستقل از جنسیت بچه دوم هست) بکشیم به صورت زیر میشه:

اگه قرار بود متغیر تصادفی رو در مثال خانواده اینجوری در نظر بگیریم که تعداد دخترها رو نشون بده به صورت زیر می‌تونستیم تعریفش کنیم:

نمودارش رو هم بخوایم بکشیم به این صورت میشه:

به این متغیرهای تصادفی که تا اینجا دیدیم می‌گین متغیر تصادفی گسسته. به توابعی هم که نمودارش رو رسم کردیم میگن تابع جرم احتمال یا probability mass function.

حواستون باشه به این نکته که هم متغیر تصادفی یک تابع هست و هم تابع جرم احتمال. این دو تا باهم دیگه فرق دارن. متغیر تصادفی پیشامد میگیره یه عدد میده. مثلاً اگه سکه شیر بیاد میشه 1 سکه خط بیاد میشه 0. تابع جرم احتمال تابعی هست که تو ورودی عدد می‌گیره، تو خروجی هم بهمون عدد میده. مثلاً تو مثال سکه 1 رو می‌گیره بمون 1/2 خروجی میده یا 0 رو می‌گیره بهمون 1/2 خروجی میده.

تابع جرم احتمال باید جمع مقادیر خروجیش 1 بشه و عدداش همگی مثبت باشن چون هیچوقت احتمال منفی نمیشه.

مثال زیر هم یک تابع جرم احتمال هست:

جمع‌بندی مطالب ارائه شده

در مورد قانون زنجیره‌ای و استقلال شرطی صحبت کردیم و مفهوم متغیر تصادفی و تابع جرم احتمال رو بررسی کردیم.

اگر جایی ایراد یا مشکلی بود، حتما بهم بگید تا تصحیحش کنم. همچنین، پیشنهاد می‌کنم که حتماً صفحه گیت‌هاب این دوره رو مورد بررسی قرار بدین. حتماً به دردتون می‌خوره.

ویدیو این جلسه

صفحه گیت‌هاب مرتبط با این دوره

جزوه جلسه قبلی (جلسه چهارم)

جزوه جلسه بعدی (جلسه ششم)

استقلال شرطیقاعده زنجیریمتغیر تصادفیتابع جرم احتمال
من هانیه‌ام. مدتیه شروع کردم به تولید محتوا در قالب متن و به زبان فارسی، از روی دوره‌هایی که می‌گذرونم. اگر دوست داشتین برام قهوه بخرید: https://coffeete.ir/honio
شاید از این پست‌ها خوشتان بیاید