مبحث احتمال، از جمله مفاهیمی است که در عین سادگی، گاه باعث سردرگمی و کجفهمی علاقهمندان به ریاضی و آمار میشود. به طوری که از نظر اکثر افرادی که در حوزهی کاری خود با آمار و احتمال سروکار دارند، این مفاهیم از جملهی سختترین مباحث درسی محسوب میشود.
اگر آشنایی اولیهای با مفاهیم احتمال دارید اما ممکن است در فهم برخی مطالب اشتباه کنید، خواندن این مقاله برای شما مفید خواهد بود. در این مقاله فرض میشود که خواننده با مفاهیم اولیه مانند فضای نمونه، پیشامد و فرمول احتمال آشنایی دارد و هدف، سادهسازی مباحث این حوزه است.
درک فرمول احتمال پیچیده نیست. مهمترین نکته در محاسبهی احتمال، این است که ما ابتدا مشاهده میکنیم؛ به بیان دیگر شروع به جمعآوری داده میکنیم. سپس بررسی میکنیم که تعداد حالتهای مورد نظرِ ما چند بار اتفاق افتاده است. برای نمونه فرض کنید میخواهیم احتمال بارش در یک شهر را محاسبه کنیم. برای این کار نیاز داریم تا وضعیت آب و هوایی چند وقت اخیر (مثلا یک سال گذشته) این شهر را در اختیار داشته باشیم. آنگاه کافی است تعداد روزهای بارانی را بشماریم و تقسیم بر تعداد کل روزها کنیم. بدین ترتیب احتمال بارش برای شهر موردنظر محاسبه میشود.
برای نمونه، مطابق شکل بالا اگر ما آبوهوای ۹ روز را بررسی کرده باشیم که ۳ روز آن بارانی بوده، احتمال بارش باران برابر با یک سوم است. همچنین میتوان به صورت هندسی میزان احتمال را با توجه به مساحت محصور شده تصور کرد:
حال مثال دیگری را در نظر بگیرید؛ فرض کنید آب و هوای ۱۶ روز را در مشاهده و ثبت کردهایم. تعداد روزهای آقتابی، بارانی، ابری، نیمه ابری و طوفانی در نمودار زیر قابل مشاهده است. به این نکته توجه کنید که عمداً اعداد کوچک در نظر گرفته شده تا محاسبات سادهتر باشد، در واقعیت (بنا بر نوع مسئله) باید دادههای بیشتری در اختیار داشته باشیم تا تخمین دقیقتری صورت گیرد.
مطابق شکل بالا، در ۶ روز از ۱۶ روز، هوا بارانی بوده است. پس بر اساس دادههای موجود احتمال بارش باران برابر با ۰٫۳۷۵=۱۶÷۶ است. از شکل بالا مشخص میشود که در ۳ روز از ۱۶ روز، هوا فقط بارانی بوده و در ۳ روز از کل روزها، هوا هم بارانی و هم ابری بودهاست.
حال این سوال را در نظر بگیرید: اگر بدانیم که هوا ابری است، چقدر احتمال دارد که باران ببارد؟
برای محاسبهی احتمال بارش در روزهای ابری، کافی است کل روزهای ابری را در نظر بگیریم(۵ روز). سپس تعداد روزهایی که ابری و بارانی بوده را تقسیم بر کل روزهای ابری کنیم: ۰٫۶=۵÷۳
در این سوال، احتمال شرطی را محاسبه کردیم که با نمادهای ریاضی به این صورت نوشته میشود:
p (Rainy and Cloudy | Cloudy ) = ۰٫۶
حال کمی این عبارت کسری را تغییر میدهیم و صورت و مخرج را تقسیم بر کل دادهها میکنیم:
بنابراین برای این دو رویداد، فرمول محاسبهی احتمال شرطی را میتوان بدین صورت نوشت. لازم به ذکر است که میتوان برای سادگی بیشتر، عبارت (Rainy and Cloudy) به صورت خلاصه نوشته میشود:
درک فرمول احتمال شرطی، مبنای تئوری Bayesian است.
در ادامه فرض کنید بارش باران را رویداد A و هوای ابری را شواهد E نامیدهایم. فرمول احتمال شرطی را در دو حالت زیر در نظر بگیرید:
همانطور که ملاحظه میکنید، احتمال P(A and E) در هر دو عبارت سمت چپ مشترک است. بنابراین به عبارت سمت راست میرسیم. حال فرمول زیر که همان تئوری bayesian است به دست میآید:
هر کدام از بخشهای فرمول بیزین نام گذاری شده و تعریف مشخصی دارند:
بنابراین در مثال آب و هوا، در صورتی که بخواهیم احتمال بارش باران را بر اساس ابری بودن هوا پیشبینی کنیم، باید احتمال رخداد بارش باران، احتمال رخداد هوای ابری و احتمال ابری بودن هوا به شرط بارش باران را محاسبه کنیم. دقت کنید که در این نمونهی خاص، میتوانیم قرارداد کنیم که ما مثلاً قصد پیشبینی آبوهوای کلیِ یک روز را بر اساس وضعیت هوا در زمان طلوع آفتابِ همان روز داریم. در واقع این مثال، حالت ساده شدهای از مسئلهی پیشبینی آبوهواست و تنها برای فهم بهتر مسئله و نحوهی محاسبه از روی دادهها و مشاهدات بیان شدهاست.
منابع:
https://www.youtube.com/watch?v=9wCnvr7Xw4E
https://www.youtube.com/watch?v=HZGCoVF3YvM
https://www.youtube.com/watch?v=U_85TaXbeIo&t=85s