منبع اصلی این پست، دوره آمار و احتمال مهندسی دکتر علی شریفی زارچی از آکادمی مکتبخونه میباشد. لطفاً برای حفظ حقوق منتشر کننده اصلی، ویدیوهارو از منبع اصلی دنبال کنید. همچنین، در انتهای هر جلسه، به ویدیو مربوط به آن جلسه ارجاع داده شده است.
سعی کردم هرچیزی که از ویدیوها فهمیدم رو به صورت متن در بیارم و در این پلتفورم با بقیه به اشتراک بذارم. کل ویدیوها 27 تاست که سعی میکنم هفتهای یک الی دو جلسه رو منتشر کنم. تا جایی که تونستم سعی کردم خوب و کامل بنویسم، اما اگر جایی ایرادی داشت، حتما تو کامنتها بهم بگید تا درستش کنم.
در ابتدای این جلسه توضیحاتی در مورد متریال درس که در گیتهاب قرار گرفته است ارائه میشود. علاوه بر نوت بوکهای کاربردی، سوالات و پاسخ تکالیف، کوییزها و امتحان دوره نیز در گیتهاب موجود است. در ادامه کلاس، توضیحاتی مقدماتی در مورد زبان R ارائه میشود. در صورت تمایل میتوانید به 22 دقیقه ابتدایی ویدیو این جلسه مراجعه نمایید.
در مورد اصل جمع و اصل ضرب صحبت کردیم. ترکیب و جایگشت رو دیدیم. در نهایت، به اصل شمول و عدم شمول رسیدیم. در مورد مباحث ارائه شده در نوت بوک موجود در گیتهاب، سوال، مثال و توضیحات بیشتری وجود دارد که در صورت تمایل میتوانید به آن مراجعه کنید.
اصل شمول و عدم شمول رو برای حالت دو مجموعهای و سه مجموعهای بررسی کردیم. اگه بخوایم این اصل رو به حالت کلی تعمیم بدیم خواهیم داشت:
این فرمول داره میگه اندازه اجتماع Ai ها برابر هست با اندازه تک تک Ai ها، منهای اندازه اشتراکهای دو به دوی آنها، بعلاوه اشتراک سه به سهی آنها، منهای اشتراک چهار به چهار آنها و همینطور به صورت یکی در میون مثبت و منفی تا آخر. اگر بخوایم اشتراک تعداد زوج Ai را به دست بیاریم قبلش باید علامت منفی به معنای منها در نظر بگیریم و اگه بخوایم اشتراک تعداد فرد Ai رو حساب کنیم باید قبلش علامت مثبت به معنای جمع بذاریم.
به چه رویدادی رویداد احتمالاتی یا غیر قطعی گفته میشه؟ با یه مثال توضیح میدیم. اگر زمانی که داریم یک سکه رو پرتاپ میکنیم، دقیقاً بدونیم که فشاری که داریم به سکه وارد میکنیم چقدر هست، یا میزان جریان هوا چقدر هست، یا سطحی که سکه قراره سکه روی آن فرود بیاد دقیقاً چه وضعیتی داره، و در نهایت با دونستن مقدار این فاکتورها بتونیم تعیین کنیم به صورت قطعی که نتیجه سکه شیر میشه یا خط، پس در این حالت رویداد احتمالاتی نداریم. یه مثال دیگه در مورد تعیین جنسیت بچه هست. معمولاً این رویداد ازش بعنوان رویداد احتمالاتی یاد میشه. اما در صورتی که بتونیم با قطعیت جنسیت بچه رو به کمک ابزارهایی که داریم از قبل تعیین کنیم دیگه رویداد احتمالاتی نیست. در مورد وضعیت آب و هوا هم همینطوره.
پس به صورت کلی، اگه بتونیم رویدادی رو دقیق مدل و اندازهگیری کنیم پس رویداد احتمالاتی نداریم و قطعی هست. ولی اگه یه سطحی از ناآگاهی و یا دقت ناکافی داشته باشیم میایم مسئله رو ساده میکنیم و به صورت یک رویداد غیر قطعی مدلش میکنیم. خلاصه، بعضی رویدادها وجود دارن که نمیتونیم به صورت قطعی در موردشون اظهار نظر کنیم و به صورت احتمالاتی باقی میمونن. حالا، ما به کمک علم احتمال میخوایم این رویدادهای غیر قطعی رو مدل کنیم.
حالا در قالب یک مثال بحث رو ادامه میدیم.
فرض کنید یک شرکت داروسازی وجود داره و یک دارویی رو برای رفع سر درد اختراع کرده. این شرکت میاد دارویی که اختراع کرده رو، روی 100 نفر تست میکنه. از این 100 نفر 70 نفر میگن سردردشون رفع شده و 30 نفر باقیمونده میگن فرقی نکرده. حالا این شرکت میاد یه آزمایش دیگه هم انجام میده. 100 نفر دیگه رو در نظر میگیره و بهشون یک قرص الکی میده. یعنی قرصی که عملاً هیچ کاری نمیکنه، صرفاً اثر روانی خوردن دارو رو میخواست روی افراد تست کنه. تو این حالت مثلاً 50 نفر گفتن که سردردشون بهتر شده و 50 نفر هم گفتن که هیچ فرقی نکردن. حالا این شرکت میخواد ببینه که آیا میتونه ادعا کنه که قرصی که اختراع کرده اثر بهبود بخشی داره یا نه. این مسئله جوابش به سادگی به دست نمیاد و به علم احتمال نیازه تا بشه جوابش رو حساب کرد.
حالا، میگیم اگه یه تاس 6 وجهی رو بندازیم احتمال اینکه هر وجهش رو بیاد میشه 1/6. چجوری همچین ادعایی میتونیم کنیم؟ این حرف از کجا میاد؟ یعنی چی اصلاً معنی این حرف؟ یکی از جوابهای معمول اینکه مثلا بیایم بینهایت بار یک تاس رو بندازیم و ببینیم جواب برای وجههای مختلف چجوری میشه و در نهایت مثلاً به عدد 1/6 برسیم. ولی خب این تعریف اشکال داره. چون خیلی سخته که بخوایم بیایم یک تاس رو به تعداد خیلی زیاد و نزدیک به بینهایت بار بندازیم و نتایج رو بررسی کنیم. برای اینکه نشون بدیم همچین تعریفی اشکال داره یکی دو مثال دیگه رو بررسی میکنیم.
فرض کنید مثلاً حساب کردیم که با احتمال 0.03 فردا در شهر x زلزله میاد. این یعنی چی؟ آیا میشه با تعریفی که تو مثال تاس دیدیم اینجا هم به نتیجه برسیم؟ منطقاً خیر! یا مثلاً یک دانشجویی با خودش میگه درس y رو با احتمال 0.8 پاس میکنم. آیا این به این معنیه که اون دانشجو درس y رو بینهایت بار گذرونده و در نهایت به این نتیجه رسیده که با احتمال 0.8 میتونه پاس کنه؟!
هدف از مطرح کردن این سوالات و مثالها این هست که در نهایت به این نتیجه برسیم که احتمال صرفاً مبتنی بر شانس نیست و مفاهیم خیلی دقیق و عمیقی براش وجود داره و در ادامه این دوره همینهارو بررسی خواهیم کرد.
علم ریاضیات به یک سری اصول موضوعه متصل شده که این اصول موضوعه از نظریه مجموعهها نشئت میگیره. حالا، اصول موضوعه ریاضیات چند تاست کلاً؟ در ابتدا تعداد اصول 9 تا بوده، منتها در ادامه ریاضیدانها دیدن که با این 9 تا اصل یک سری قضایا رو نمیشه اثبات کرد. بخاطر همین بعدها یک اصل دیگه هم بهش اضافه شد و مجموعاً شد 10 اصل. اگه علاقهمند بودین جزییات بیشتری بدونین از این لینک استفاده کنید. این اصول در واقع پایه ریاضیات هست.
یک مجموعه جزو اصول موضوعه است و نمیشه خیلی تعریف خاصی براش کرد. یک مجموعه ممکنه یک تعدادی عضو داشته باشه و عضویت یک رابطه هست بین یک عنصر و مجموعه. یک عنصر میتونه عضو یک مجموعه باشه یا نباشه. تعداد اعضای یک مجموعه میتونه محدود، نامحدود یا ناشمارا باشه. ممکنه سوال پیش بیاد که فرق بین مجموعههای شمارا و ناشمارا چیه. مجموعههایی شمارا هستن که بتونیم یک تناظری بین اعضای اون مجموعه و اعداد طبیعی نسبت بدیم. مثلاً مجموعه وجههای تاس شماراست. چون میتونیم با اعداد طبیعی 1 تا 6 مشخصش کنیم. یا مجموعه حروف الفبا شماراست. مجموعه اعداد صحیح هم شماراست. چون میتونیم با اعداد طبیعی اعداد صحیح رو بشمریم. بیاید این رو اثبات کنیم. پس الان مسئله اینکه نشون بدیم که چجوری مجموعه اعداد صحیح شمارا هستن.
فرض کنید مجموعه اعداد صحیح رو به صورت زیر در نظر بگیریم:
اگه بیایم برای شمارش اعضای این مجموعه به صورت زیر عمل کنیم، مسئله اثبات نمیشه.
دلیلش اینکه نتونستیم اعداد منفی رو مپ کنیم به اعداد طبیعی.
برای اثبات مسئله باید بیایم به شیوه زیر عمل کنیم:
اینجوری برای هر عدد صحیح مثبت i یا عدد صحیح نامثبت i تکلیف مشخصه و میتونیم هر کدوم رو مپ کنیم به اعداد طبیعی. با این حساب، هر عدد صحیح مثبت i معادل میشه با عدد طبیعی 2i و هر عدد صحیح نامثبت i معادل میشه با 2i+1-. به صورت خلاصه میتونیم به نحو زیر بنویسیم:
حالا، سوال. آیا مجموعه اعداد گویا شماراست؟ مجموعه اعداد گویا به صورت زیر مشخص میشه:
برای جواب دادن این سوال، میتونیم مجموعه اعداد گویا رو به صورت زیر بازنویسی کنیم:
یعنی هم p و هم q جزو مجموعه اعداد صحیح هستن و مخرج همواره مثبته. اما صورت میتونه مثبت یا نامثبت باشه. حالا، با این بانویسی میتونیم جدولی به صورت زیر رو تشکیل بدیم:
سطرهای جدول بالا داره p رو مشخص میکنه و ستونهاش نشوندهنده q هستن. اول کاری میایم عدد 0 رو مپ میکنیم به 1. بعد به ترتیبی که رنگها و شمارههای هر خونه داره نشون میده میشه جدول رو پر کرد. به این ترتیب میشه اثبات کرد که مجموعه اعداد گویا هم شمارا هست. اتفاقاً یک رابطهای هم بین اعداد هر خونه به دست میاد که از جدول بالا به راحتی میشه فهمید. مثلاً ستونی که با p=0 مشخص شده اعدادش مجذور q هستن. ممکنه سوال پیش بیاد چرا جدول رو قطری پر میکنیم و سطری پر نمیکنیم. دلیلش اینکه وقتی قطری پر بشه برای هر عدد جدیدی میشه مپینگ رو انجام داد ولی اگه سطری پر کنیم، سطر اول هیچوقت تموم نمیشه که بخوایم به سطر دوم برسیم.
حالا، یه مسئله جالبی توسط یک ریاضیدان مشهور به نام هیلبرت مطرح شده که عنوانش هتل بینهایت هست. در قالب یک ویدیو 6 دقیقهای اومدن این مسئله جذاب رو شرح دادن و در موردش توضیح دادن. ویدیو اصلی به زبان انگلیسی در یوتیوب موجوده که میتونید ببینید. به زبان فارسی هم احتمالاً در آپارات سرچ کنید مسئله هتل بینهایت هیلبرت ویدیو مربوط بهش موجود باشه. مسئلهی زیبایی هست و دکتر هم سر کلاس در موردش بحث میکنن و توضیح میدن. از اونجایی که خود ویدیو خیلی گویا و واضحه و توضیحات دکتر هم موجود هست، از نوشتن توضیحات مرتبط با این بخش خودداری میکنم. توضیحات مرتبط با این ویدیو از دقیقه 58 این جلسه شروع میشه و تا دقیقه 63 ادامه پیدا میکنه.
در نوتبوکهای ارائه شده برای این درس که در گیتهاب موجوده، فولدری با عنوان Axioms of Probability وجود داره که در حال حاضر از این لینک قابل دسترسه. عملیاتهای پایهای روی مجموعهها مثل اشتراک و اجتماع و متمم و... که مفاهیم سادهای هم هستن در اون توضیح داده شده که اگه نمیدونید چی هستن میتونید به لینک ارائه شده مراجعه کنید و مورد مطالعه قرار بدین.
حالا بریم یکم دیگه در مورد احتمال توضیح بدیم.
فرض کنید یک آزمایش دلخواهی انجام میشه. نتایج حاصل از این آزمایش رو در یک مجموعه قرار میدیم. به این مجموعه sample space یا فضای نمونه گفته میشه. مثلاً اگه آزمایش انداختن یک سکه باشه، فضای نمونه معادل میشه با پشت و رو که میشه به این صورت هم نشون داد:
SP = {Head, Tail}
اگه آزمایشی که داریم انداختن یک تاس باشه فضای نمونه میشه اعداد 1 تا 6 که به صورت زیر میشه نشون داد:
SP = {1, 2, 3, 4, 5, 6}
حالا وقتی یک آزمایش رو انجام میدیم، یک نتیجه یا outcome برامون به دست میاد. مثلاً وقتی یک بار سکه رو پرتاپ میکنیم ممکنه شیر (Head) بیاد یا وقتی یک تاس رو پرتاپ میکنیم ممکنه 2 بیاد.
حالا، واقعه یا event چیه؟ با مثال توضیح میدیم. فرض کنید آزمایش انداختن سکه باشه و یک واقعه رو به این صورت تعریف کردیم که سکه شیر بیاد. یا داریم یک تاس رو میندازیم و یک واقعه رو اینجوری تعریف میکنیم که عدد تاس زوج بیاد. هر واقعه یک زیر مجموعه از فضای نمونه هست. حالا فرض کنید بیایم دو تاس رو بریزیم و واقعهای که جفت شیش بیاد رو هم حساب کرده باشیم. فضای نمونه برای دو تاس به صورت زیر تعریف میشه:
SP = {(1, 1), (1, 2), ..., (1, 6), (2, 1), (2, 2), ..., (2, 6), ..., (6, 6)}
واقعهای هم که داریم فقط شامل عضو {(6 ,6)} هست. حالا اگه دو تاس سالم باشه، احتمال رخداد این واقعه در این آزمایش میشه 1/36.
حالا یه چیزی داریم با عنوان تابع احتمال. این تابع احتمال کارش اینکه یک واقعه رو بعنوان ورودی میگیره و یک عدد رو در خروجی میده. اگه داشته باشیم P(A) به این معنیه که واقعه A رو داریم و P یک تابع احتمال هست. مثال بالاتر با این تابع به این صورت میشه که واقعهمون جفت شیش اومدن دو تاس باشه. پس با این تابع احتمال خواهیم داشت: 1/36 = P({(6, 6)})
حالا میخوایم در ادامه خصوصیات تابع احتمال رو بررسی کنیم.
خصوصیات تابع احتمال
Axiom 1: ∨A Ⅽ Ω: 0 ≤ P(A) ≤ 1
P(A U B) = P(A) + P(B)
اصل سوم رو میشه به بیشتر از 2 مجموعه هم تعمیم داد.
به این اصول، اصول کولموگروف هم گفته میشه. خلاصهی اصول در تصویر زیر آورده شده.
مفهوم احتمال رو بررسی کردیم و با اصول اولیه در ریاضی شروع کردیم. سپس به مجموعهها در ریاضی رسیدیم و اصول اونهارو هم دیدیم. در نهایت هم در مورد تابع احتمال توضیح دادیم.
اگر جایی ایراد یا مشکلی بود، حتما بهم بگید تا تصحیحش کنم. همچنین، پیشنهاد میکنم که حتماً صفحه گیتهاب این دوره رو مورد بررسی قرار بدین. حتماً به دردتون میخوره.