در این مطلب به معرفی توزیعهای گسسته و بیان برخی از ویژگیهایشان میپردازیم.
توزیع برنولی یا دودویی (Bernoulli distribution):
توزیع برنولی را میتوان به عنوان سادهترین نوع توزیع گسسته شناخت که از دو برآمد شکست یا موفقیت تشکیل میشود . آزمایش پرتاب سکه یک آزمایش برنولی است . اگر p احتمال موفقیت باشد ، آنگاه 1-p (که گاهی با q نمایش داده میشود) احتمال شکست است. تابع جرم احتمال این توزیع به صورت زیر میباشد :
x=0,1
توجه داریم که منظور از موفقیت، نتیجه هایی از آزمایش است که میخواهیم روی آن تحلیل انجام دهیم. برای این توزیع که با نماد x~ber(p) نشان داده می شود، داریم:
اگر X1,X2,......Xnمتغیرهای تصادفی برنولی حاصل از آزمایشهای مستقل و با پارامتر p باشند، داریم:
مثال : اگر در ریختن یک تاس سالم پیشامد مشاهدهی خال ۲ یا ۳ را موفقیت و وقوع پیشامدهای ۱،۴،۵،۶ را شکست بنامیم ، آنگاه :
یک متغیر تصادفی برنولی با پارامتر p=1/13 است. بنابراین تابع جرم احتمال آن عبارت است از :
میانگین و واریانس X به صورت زیر میباشند :
توزیع دوجملهای (Binomial distribution)
اگر n آزمایش برنولی ، همه با احتمالهای موفقیت p ، به صورت مستقل انجام شوند .، آنگاه X تعداد موفقیت ها در این n آزمایش را متغیر دوجملهای با پارامترهای n و p مینامند. که مجموعه مقادیر آن به صورت x = 0,1,...,n میباشد.
تعداد موفقیت ها در n آزمایش مستقل برنولی با پارامتر p را متغیر تصادفی دوجمله ای می نامند که نماد آن X~B (n,p) و تابع احتمال آن به صورت زیر است:
تابع توزیع تجمعی این متغیر برابر است با:
که برای محاسبه آن از رابطه زیر استفاده میشود:
اگر X یک متغیر تصادفی دوجملهای با پارامترهای n و p باشد داریم:
مثال : رستورانی دارای ۸ نوع گوشت قرمز ، ۱۲ نوع خوراک ماهی و ۱۰ نوع خوراک مرغ میباشد . اگر مشتریان از بین این غذاها به تصادف یک مورد را انتخاب کنند ، احتمال اینکه دو نفر از ۴ مشتری بعدی خوراک ماهی سفارش دهند چقدر است ؟
پاسخ : فرض کنید X تعداد خوراکهای ماهی باشد که ممکن است چهار مشتری بعدی آن را انتخاب کنند . پس X یک متغیر تصادفی دو جملهای با پارامترهای است در نتیجه ،
تقریب توزیع دوجملهای به وسیله توزیع نرمال:
اگر X متغیر تصادفی دوجملهای با پارامترهای n و p را باشد:
یعنی در n های بزرگ میتوان توزیع دو جملهای را با توزیع نرمال تقریب زد.
قضیه حدی دموار-لاپلاس:
اگر Sn نشان دهنده تعداد موفقیتها در n آزمایش ساده مستقل هر کدام با احتمال موفقیت P باشد، آنگاه برای هر a<b، وقتی که n->∞:
که در این قضیه عبارت ، تابع توزیع تجمعی نرمال استاندارد است که به صورت زیر میباشد:
توزیع پواسون :(Poisson distribution)
متغیر تصادفی است که برای مدل سازی تعداد پیشامدها در طول زمان استفاده میشود و تابع احتمال آن به صورت زیر است:
λ نرخ وقوع اتفاق یا متوسط تعداد اتفاق ها در واحد زمان یا مکان است.
اگر X یک متغیر تصادفی پواسون با پارامترλ باشد، میانگین و واریانس آن با هم برابر است و داریم:
مثال :
در یک کارخانه تولید خودرو، احتمال اینکه خودرو به خاطر نقص فنی در بخش کنترل کیفیت بازگردانده شود، برابر ۲٪ است. احتمال آنکه در بین ۳۰۰ دستگاه تولیدی ۵ دستگاه برگشت داده شود، چقدر است؟
پاسخ :
در اینجا متوسط تعداد برگشتیها همان پارامتر توزیع پواسون است. یعنی λ= 300X0.02=6
و در نهایت به صورت زیر احتمال مورد نظر را بدست میآوریم.
یا
-در فرآیند پواسون تعداد اتفاق ها در فواصل زمانی مجزا مستقل هستند.
مثال ( فرایند پواسون ): فرض کنید در یک زایشگاه نوزادان با نرخ پواسون ۵ نوزاد در روز متولد شوند. مطلوب است محاسبه احتمال این که طی ۶ ساعت آینده حداقل دو نوزاد متولد شوند.
پس احتمال مورد نظر به صورت زیر بدست میآید.
توزیع هندسی(Geometric distribution):
آزمایشهای مستقل برنولی با پارامتر p تا رسیدن به اولین موفقیت را متغیر تصادفی هندسی با نماد X~G(p)مینامند که تابع احتمال آن به صورت زیر است:
اگر X یک متغیر تصادفی هندسی با پارامتر p باشد، داریم:
نکته : توزیع هندسی بی حافظه است. یعنی در آزمایشهای متوالی و مستقل برنولی اطلاع از این موضوع که m برآمد متوالی مشاهده شده تاکنون، همگی شکست بودهاند در احتمال اینکه n برآمد بعدی همه شکست باشند، بیاثر است. دلیل این موضوع استقلال آزمایشهای بدیهی است. اما از این نظر که توزیع هندسی، تنها توزیع گسسته بیحافظه است، جالب است.
به طور مثال فرض کنید دستگاهی داریم که X طول عمر آن تا زمان خرابی باشد اگر بدانیم دستگاه تا زمان m خراب نشده باشد ، احتمال اینکه تا زمان n+m هم خراب نشود مستقل از طول عمر گذشته خود است و برابر است با احتمال اینکه دستگاه تا زمان n خراب نشود.
مثال :
از بین ۱۳ کارت که از ۱ تا ۱۳ شماره گذاری شدهاند ، به صورت متوالی و به تصادف همراه با جایگذاری کارتی بیرون میکشیم تا زمانی که کارت با شماره ۱ را انتخاب کنیم . احتمال اینکه برای رسیدن به اولین کارت با شمارهی ۱ ، ۱۰ بار کارت بکشیم؟
پاسخ :
فرض کنید X تعداد کارت های کشیدهشده تا مشاهده اولین شماره ۱ باشد . X یک متغیر تصادفی هندسی با پارامتر p=1/13 است . پس :
این احتمال برابر است با :
توزیع دوجملهای منفی: (Negative binomial distribution)
تعداد آزمایشهای مستقل برنولی با پارامتر p تا رسیدن به rامین موفقیت را متغیر تصادفی دوجملهای منفی با نماد x~nb(r,p)مینامند که تابع احتمال آن به صورت زیر است:
امید ریاضی و واریانس متغیر تصادفی دو جمله ای منفی برابر است با:
میانگین و واریانس توزیع دوجملهای منفی r برابر میانگین و واریانس توزیع هندسی است.
اگر X یک متغیر تصادفی دوجملهای منفی با پارامترهای r و p باشد و Y یک متغیر تصادفی دوجملهای با پارامترهای n و p باشد، آنگاه:
(rامین موفقیت بعد از آزمایش nام رخ دهد یعنی در n آزمایش اول کمتر از r موفقیت داشته باشیم)
اگر در توزیع دوجملهای منفی مقدار r برابر یک باشد توزیع حاصل توزیع هندسی است.
اگر x1,...xr متغیرهای تصادفی مستقل هندسی با پارامترهای pi باشند، آنگاه:
مثال :
احمد و مرتضی یه تعداد دفعات با یکدیگر تختهنرد بازی میکنند تا اینکه بالاخره یکی از آنها ۵ بار برنده شود . فرض کنید بازیها مستقل و احتمال اینکه احمد در یک بازی پیروز شود برابر با ۰.۵۸ باشد . مطلوب است محاسبه احتمال این که بازی در دور هفتم خاتمه یابد
پاسخ :
فرض کنید X تعداد دفعات بازی تا برنده شدن احمد در ۵ دور باشد . همچنین فرض کنید Y تعداد دفعات بازی تا برنده شدن رضا در ۵ دور باشد . متغیرهای تصادفی X و Y متغیرهای دوجملهای منفی به ترتیب با پارامترهای (۰.۵۸ ، ۵) و (۰.۴۲ ، ۵) هستند. احتمال اینکه این بازی در دور هفتم خاتمه پیدا کند برابر است با :
توزیع فوق هندسی (hypergeometric distribution)
فرض کنید از جعبهای که دارای m قطعه معیوب و N-m قطعه سالم است، n قطعه به تصادف و بدون جایگذاری انتخاب شود. اگر X تعداد قطعات معیوب خارج شده باشد، این متغیر تصادفی را فوق هندسی با نماد X~HG(N,m,n) مینامند و تابع احتمال آن به صورت زیر است:
امید ریاضی و واریانس متغیر فوق هندسی برابر است با:
مثال :
پژوهشگری در انجام ۵۰۰ محاسبه مستقل مرتکب ۲۵ اشتباه شده است . اگر پژوهشگر دیگری ۷ محاسبه از آنها را به تصادف کنترل کند ، احتمال این که دو اشتباه پیدا کند چقدر است ؟( فرض کنید پژوهشگر دوم کاملا به صحت محاسبات آگاه است. )
پاسخ : فرض کنید X تعداد اشتباهاتی باشد که پژوهشگر دوم پیدا میکند . X یک متغیر فوق هندسیست با پارامتر های n=۷ , N=۵۰۰ , D= ۲۵ . احتمال مورد نظر به صورت زیر محاسبه میشود .
نکته : هرگاه در متغیر تصادفی فوق هندسی نسبت n به N کوچک باشد، آنگاه توزیع فوق هندسی به توزیع دو جمله ای با پارامترهای n و p=m/N میل مینماید.
نکته : فرض کنید از جعبهای که دارای m قطعه معیوب و N-m قطعه سالم است، n قطعه به تصادف و با جایگذاری انتخاب شود. اگر X تعداد قطعات معیوب خارج شده باشد، آنگاه X یک متغیر دوجملهای است و داریم:
توزیع یکنواخت گسسته( discrete uniform distribution):
فرض کنید متغیر تصادفی x دارای n نقطه و تکیهگاه اعداد طبیعی از ۱ تا n باشد . اگر تابع احتمال آن به صورت زیر باشد به آن تابه یکنواخت گسسته گوییم.
در این توزیع احتمال انتخاب هر نقطه از ۱ تا n ، احتمالی برابر و یکسان است . در نتیجه برای بیان این توزیع نیاز به n داریم. برای نمایش تابع توزیع احتمال تجمعی این متغیر تصادفی از رابطهی زیر بهره میبریم:
در صورت این رابطه منظور از جزء صحیح x ، بزرگترین مقدار صحیحیست که از x کوچکتر باشد.
مثال : تاسی را پرتاب میکنیم. اگر X بیانگر عدد مشاهده شده در هر پرتاب باشد، توزیع این متغیر را میتوان توزیع یکنواخت گسسته دانست زیرا با فرض n=۶، هر پیشامد دارای احتمال یکسان بوده و همچنین تابع توزیع آن به صورت زیر میباشد.
در حالت قبل تکیهگاه متغیر تصادفی از ۱ شروع میشد و به n ختم میشد. همانطور که گفته شد در این حالت فقط نیاز به مقدار n خواهیم داشت. اما حالتی دیگر نیز وجود دارد که در آن تکیه گاه، تعداد اعداد صحیح در فاصلهی [a,b] در نظر میگیریم و آن را به صورت زیر مینویسیم.
و میگوییم X دارای توزیع یکنواخت گسسته با پارامترهای a و b میباشد. در این توزیع مقدار n به صورت زیر بدست میآید:
n= b - a + ۱
در این حالت همواره مقدار b از a بزرگتر است و تابع چگالی احتمال و تابع توزیع احتمال تجمعی آن را به صورت زیر مینویسیم:
نمودار تابع احتمال و تابع توزیع تجمعی برای این متغیر تصادفی به ترتیب به صورت زیر است:
امید ریاضی و واریانس این توزیع برابر است با:
نکته: در این توزیع میانه و میانگین با هم برابرند.
مثالی از این توزیع انداختن تاس سالم است که تمام شش وجه آن با احتمال یکسان 1/6 ظاهر میشوند.