توزیع گسسته در آمار

در این مطلب به معرفی توزیع‌های گسسته و بیان برخی از ویژگی‌هایشان می‌پردازیم.

توزیع برنولی یا دودویی (Bernoulli distribution):

توزیع برنولی را می‌توان به عنوان ساده‌ترین نوع توزیع گسسته شناخت که از دو برآمد شکست یا موفقیت تشکیل می‌شود . آزمایش پرتاب سکه یک آزمایش برنولی است . اگر p احتمال موفقیت باشد ، آنگاه p-1 (که گاهی با q نمایش داده می‌شود) احتمال شکست است. تابع جرم احتمال این توزیع به صورت زیر می‌باشد :


توجه داریم که منظور از موفقیت، نتیجه هایی از آزمایش است که می‌خواهیم روی آن تحلیل انجام دهیم. برای این توزیع که با نماد (p)X ~ ber نشان داده می شود، داریم:

اگر Xها متغیرهای تصادفی برنولی حاصل از آزمایش‌­های مستقل و با پارامتر p باشند، داریم:

مثال : اگر در ریختن یک تاس سالم پیشامد مشاهده‌ی خال ۲ یا ۳ را موفقیت و وقوع پیشامد‌های ۱،۴،۵،۶ را شکست بنامیم ، آنگاه :

یک متغیر تصادفی برنولی با پارامتر p=13 است. بنابراین تابع جرم احتمال آن عبارت است از :

توزیع دوجمله­‌ای (Binomial distribution)

اگر n آزمایش برنولی ، همه با احتمال‌های موفقیت p ، به صورت مستقل انجام شوند .، آنگاه X تعداد موفقیت ها در این n آزمایش را متغیر دوجمله‌ای با پارامتر‌های n و p می‌نامند. که مجموعه مقادیر آن به صورت x = 0,1,...,n می‌باشد.

تعداد موفقیت ها در n آزمایش مستقل برنولی با پارامتر p را متغیر تصادفی دوجمله ای می نامند که نماد آن (n,p)X ~ B و تابع احتمال آن به صورت زیر است:

تابع توزیع تجمعی این متغیر برابر است با:

که برای محاسبه آن از رابطه زیر استفاده می‌­شود:

اگر X یک متغیر تصادفی دوجمله‌ای با پارامترهای n و p باشد داریم:


اگر در توزیع دوجمله­‌ای دو نقطه متوالی احتمال یکسان داشته باشند، آن دو نقطه حتما مد هستند.

تقریب توزیع دوجمله­‌ای به وسیله توزیع نرمال

اگر یک متغیر تصادفی دوجمله­‌ای با پارامترهای n و p را با کم کردن میانگین np و سپس از تقسیم نتیجه به انحراف معیار به صورت استاندارد در آوریم، آن­گاه این متغیر تصادفی استاندارد شده، وقتی که n بزرگ باشد دارای توزیع نرمال استاندارد خواهد بود.

قضیه حدی دموار-لاپلاس

اگر S نشان دهنده تعداد موفقیت‌­ها در n آزمایش ساده مستقل هر کدام با احتمال موفقیت P باشد، آن­ گاه برای هر a<b، وقتی که n به سمت بینهایت میل کند:

توزیع پواسن (Poisson distribution)

متغیر تصادفی است که برای مدل­ سازی تعداد اتفاق‌­ها در واحد زمان یا مکان استفاده می‌­شود و تابع احتمال آن به صورت زیر است:

که لاندا نرخ وقوع اتفاق یا متوسط تعداد اتفاق‌­ها در واحد زمان یا مکان است.

اگر X یک متغیر تصادفی پواسن با پارامتر لاندا باشد، میانگین و واریانس آن با هم برابر است و داریم:

فرآیند پواسن

اگر تعداد اتفاق‌­ها در واحد زمان دارای توزیع پواسن با پارامتر لاندا باشد، تعداد اتفاق­ها در t واحد زمانی از توزیع پواسن با پارامتر لاندا*t پیروی می­‌نماید.

در فرآیند پواسن تعداد اتفاق­‌ها در فواصل زمانی مجزا مستقل هستند.

اگر تعداد دفعات رخ دادن یک اتفاق در واحد زمان، از توزیع پواسن با پارامتر لاندا پیروی نماید و هر اتفاق از این توزیع با احتمال P از نوع i باشد، آن گاه تعداد دفعات رخ دادن اتفاق نوع i در واحد زمان از توزیع پواسن با پارامتر P*لاندا پیروی می­‌نماید.

توزیع تعداد موفقیت­ها در n آزمایش مستقل برنولی با پارامتر p را می‌­توان با متغیر تصادفی پواسن با پارامتر لاندا = np تقریب زد، به شرطی که n بزرگ و p کوچک باشد.

توزیع هندسی (Geometric distribution)

تعداد آزمایش‌­های مستقل برنولی با پارامتر p تا رسیدن به اولین موفقیت را متغیر تصادفی هندسی می‌­نامند که تابع احتمال آن به صورت زیر است:

اگر X یک متغیر تصادفی هندسی با پارامتر p باشد، داریم:

توزیع هندسی بی‌حافظه است.

این رابطه بیان می‌کند که اگر برای مثال متغیر تصادفی هندسی X را طول عمر یک دستگاه تا خرابی در نظر بگیریم، چنان چه بدانیم دستگاه تا زمان n خراب نشده، احتمال اینکه a زمان دیگر هم کار کند، مستقل از طول عمر گذشته‌­اش است.

توزیع دوجمله‌­ای منفی (Negative binomial distribution)

تعداد آزمایش‌­های مستقل برنولی با پارامتر p تا رسیدن به rامین موفقیت را متغیر تصادفی دوجمله‌­ای منفی می‌­نامند که تابع احتمال آن به صورت زیر است:

امید ریاضی و واریانس متغیر تصادفی دوجمله­ای منفی برابر است با:

میانگین و واریانس توزیع دوجمله­ای منفی r برابر میانگین و واریانس توزیع هندسی است.

اگر X یک متغیر تصادفی دوجمله­ای منفی با پارامترهای r و p باشد و Y یک متغیر تصادفی دوجمله­‌ای با پارامترهای n و p باشد، آن­گاه:

اگر در توزیع دوجمله­ای منفی مقدار r برابر یک باشد توزیع حاصل توزیع هندسی است.

اگر Xها متغیرهای تصادفی مستقل هندسی با پارامترهای p باشند، آنگاه:

توزیع فوق هندسی (hypergeometric distribution)

فرض کنید از جعبه­‌ای که دارای m قطعه معیوب و N-m قطعه سالم است، n قطعه به تصادف و بدون جایگذاری انتخاب شود. اگر X تعداد قطعات معیوب خارج شده باشد، این متغیر تصادفی را فوق هندسی می‌نامند و تابع احتمال آن به صورت زیر است:

امید ریاضی و واریانس متغیر فوق هندسی برابر است با:

‌

فرض کنید از جعبه‌­ای که دارای m قطعه معیوب و N-m قطعه سالم است، n قطعه به تصادف و با جایگذاری انتخاب شود. اگر X تعداد قطعات معیوب خارج شده باشد، آن­گاه X یک متغیر دوجمله­ای است و داریم:

هرگاه در متغیر تصادفی فوق هندسی نسبت n به N کوچک باشد، آن­گاه توزیع فوق هندسی به توزیع دو جمله­ای با پارامترهای n و p = m/N میل می­‌نماید.

توزیع یکنواخت گسسته ( discrete uniform distribution)

اگر متغیر تصادفی X، n پیشامد را در فاصله­ی a تا b با احتمال یکسان 1 بر n اختیار کند به آن متغیر تصادفی یکنواخت گسسته گویند و تابع احتمال آن به صورت

و تابع توزیع تجمعی آن به صورت زیر است:

نمودار تابع احتمال و تابع توزیع تجمعی برای این متغیر تصادفی به ترتیب به صورت زیر است:

امید ریاضی و واریانس این توزیع برابر است با:

در این توزیع میانه و میانگین با هم برابرند.

مثالی از این توزیع انداختن تاس سالم است که تمام شش وجه آن با احتمال یکسان یک ششم ظاهر می‌شوند.