فضای نمونه یعنی مجموعهی تمام حالتهایی که ممکن است رخ دهد.
مثال ساده:
- اگر یک تاس بیندازیم، ممکن است عددهای ۱ تا ۶ بیاید.
پس فضای نمونه ما این است:
S={1,2,3,4,5,6}
رخداد یعنی یک مجموعه (زیرمجموعه) از فضای نمونه که به یک «شرط» یا «پرسش» مربوط میشود.
مثال:
- رخداد «عدد زوج بیاید» یعنی:
A={2,4,6}
این یعنی فقط همان حالتهایی که زوج هستند، رخداد محسوب میشوند.
> پس: فضای نمونه کلِ حالتهاست، و رخداد یک تکه از آن است.
در احتمال دو نوع «حالت» داریم:
گسسته (شمردنی)
پیوسته (بینهایت مقدار ممکن در یک بازه)
الف) متغیر تصادفی گسسته (Discrete)
مثل:
تعداد دانشجوها: ۱، ۲، ۳، ...
تعداد سکههای شیر هنگام پرتاب چند سکه
برای گسسته، معمولاً میخواهیم بدانیم: احتمال اینکه دقیقاً مقدار x رخ بدهد چقدر است؟
تابع PMF (Probability Mass Function)
PMF احتمالِ دقیقِ هر مقدار را میدهد.
مثال: تاس سالم
وقتی تاس سالم ۶ وجهی داریم:
- احتمال اینکه عدد ۱ بیاید:
P(X=1)= 1 / 6
- احتمال اینکه عدد ۲ بیاید:
P(X=2)= 2 / 6
و به همین ترتیب برای ۳،۴،۵،۶.
پس PMF میگوید برای هر مقدار مشخص، چقدر احتمال دارد.
ب) متغیر تصادفی پیوسته (Continuous)
مثال:
وزن، قد، دما
در متغیر پیوسته، مقدار دقیق معمولاً “دقیقاً یک عدد مشخص” نیست. چون بین دو عدد، بینهایت عدد دیگر هم وجود دارد.
مثال:
فرض کنید وزن یک کیسه برنج همیشه دقیقاً مثلاً ۱ کیلوگرم نیست و معمولاً کمی کموزیاد میشود.
تابع PDF (Probability Density Function)
PDF برای پیوستهها به ما میگوید:
اگر یک بازه را در نظر بگیریم (مثلاً بین ۹۰۰ تا ۱۱۰۰ گرم)،
«چقدر محتمل» است مقدار داخل آن بازه باشد.
تابع PDF (Probability Density Function) به ما میگوید که احتمال اینکه وزن کیسه برنج در این بازه (۹۰۰ تا ۱۱۰۰ گرم) قرار گیرد چقدر است.
برای پیوستهها احتمالِ دقیقاً روی یک عدد مشخص معمولاً صفر در نظر گرفته میشود.
اما احتمال داخل یک بازه از روی مساحت زیر نمودار PDF به دست میآید.
قضیه حد مرکزی میگه: اگه از هر چیزی (مثل پرتاب سکه یا قد بچهها) تعداد زیاد نمونه بگیری و میانگین شون رو حساب کنی، میانگینها همیشه دور یه عدد مرکزی جمع میشن و شکل منحنیشون زنگولهای (توزیع نرمال) میشه!
مثال سوپرمارکت: وزن سیبها فرق داره (بعضی سنگین، بعضی سبک). اگه ۳۰ سیب تصادفی برداری و میانگین وزنشون رو حساب کنی، و این کار رو ۱۰۰۰ بار تکرار کنی، همه میانگینها نزدیک ۱۵۰ گرم جمع میشن و منحنیشون زنگولهای (توزیع نرمال) میشه!
این یعنی با چند نمونه میتونی مشخصه کل جمعیت رو حدس بزنی!
شبکههای عصبی امتیازهای خام (logits) تولید میکنند. سافتمکس آنها را به یک توزیع احتمال معتبر تبدیل میکند. یعنی تبدیل کردن ارقام بی معنی یه یک توزیع احتمالی که قابل تفسیر است.
softmax(z_i) = exp(z_i) / sum(exp(z_j) for all j)
ویژگیها:
- همه خروجیها در بازه (۰، ۱) هستند
- مجموع همه خروجیها برابر ۱ است
- ترتیب نسبی ورودیها را حفظ میکند