مرجع تخصصی آمار ایران
توزیع گسسته در آمار
در این مطلب به معرفی توزیعهای گسسته و بیان برخی از ویژگیهایشان میپردازیم.
توزیع برنولی یا دودویی (Bernoulli distribution):
توزیع برنولی را میتوان به عنوان سادهترین نوع توزیع گسسته شناخت که از دو برآمد شکست یا موفقیت تشکیل میشود . آزمایش پرتاب سکه یک آزمایش برنولی است . اگر p احتمال موفقیت باشد ، آنگاه p-1 (که گاهی با q نمایش داده میشود) احتمال شکست است. تابع جرم احتمال این توزیع به صورت زیر میباشد :
توجه داریم که منظور از موفقیت، نتیجه هایی از آزمایش است که میخواهیم روی آن تحلیل انجام دهیم. برای این توزیع که با نماد (p)X ~ ber نشان داده می شود، داریم:
اگر Xها متغیرهای تصادفی برنولی حاصل از آزمایشهای مستقل و با پارامتر p باشند، داریم:
مثال : اگر در ریختن یک تاس سالم پیشامد مشاهدهی خال ۲ یا ۳ را موفقیت و وقوع پیشامدهای ۱،۴،۵،۶ را شکست بنامیم ، آنگاه :
یک متغیر تصادفی برنولی با پارامتر p=13 است. بنابراین تابع جرم احتمال آن عبارت است از :
توزیع دوجملهای (Binomial distribution)
اگر n آزمایش برنولی ، همه با احتمالهای موفقیت p ، به صورت مستقل انجام شوند .، آنگاه X تعداد موفقیت ها در این n آزمایش را متغیر دوجملهای با پارامترهای n و p مینامند. که مجموعه مقادیر آن به صورت x = 0,1,...,n میباشد.
تعداد موفقیت ها در n آزمایش مستقل برنولی با پارامتر p را متغیر تصادفی دوجمله ای می نامند که نماد آن (n,p)X ~ B و تابع احتمال آن به صورت زیر است:
تابع توزیع تجمعی این متغیر برابر است با:
که برای محاسبه آن از رابطه زیر استفاده میشود:
اگر X یک متغیر تصادفی دوجملهای با پارامترهای n و p باشد داریم:
اگر در توزیع دوجملهای دو نقطه متوالی احتمال یکسان داشته باشند، آن دو نقطه حتما مد هستند.
تقریب توزیع دوجملهای به وسیله توزیع نرمال
اگر یک متغیر تصادفی دوجملهای با پارامترهای n و p را با کم کردن میانگین np و سپس از تقسیم نتیجه به انحراف معیار به صورت استاندارد در آوریم، آنگاه این متغیر تصادفی استاندارد شده، وقتی که n بزرگ باشد دارای توزیع نرمال استاندارد خواهد بود.
قضیه حدی دموار-لاپلاس
اگر S نشان دهنده تعداد موفقیتها در n آزمایش ساده مستقل هر کدام با احتمال موفقیت P باشد، آن گاه برای هر a<b، وقتی که n به سمت بینهایت میل کند:
توزیع پواسن (Poisson distribution)
متغیر تصادفی است که برای مدل سازی تعداد اتفاقها در واحد زمان یا مکان استفاده میشود و تابع احتمال آن به صورت زیر است:
که لاندا نرخ وقوع اتفاق یا متوسط تعداد اتفاقها در واحد زمان یا مکان است.
اگر X یک متغیر تصادفی پواسن با پارامتر لاندا باشد، میانگین و واریانس آن با هم برابر است و داریم:
فرآیند پواسن
اگر تعداد اتفاقها در واحد زمان دارای توزیع پواسن با پارامتر لاندا باشد، تعداد اتفاقها در t واحد زمانی از توزیع پواسن با پارامتر لاندا*t پیروی مینماید.
در فرآیند پواسن تعداد اتفاقها در فواصل زمانی مجزا مستقل هستند.
اگر تعداد دفعات رخ دادن یک اتفاق در واحد زمان، از توزیع پواسن با پارامتر لاندا پیروی نماید و هر اتفاق از این توزیع با احتمال P از نوع i باشد، آن گاه تعداد دفعات رخ دادن اتفاق نوع i در واحد زمان از توزیع پواسن با پارامتر P*لاندا پیروی مینماید.
توزیع تعداد موفقیتها در n آزمایش مستقل برنولی با پارامتر p را میتوان با متغیر تصادفی پواسن با پارامتر لاندا = np تقریب زد، به شرطی که n بزرگ و p کوچک باشد.
توزیع هندسی (Geometric distribution)
تعداد آزمایشهای مستقل برنولی با پارامتر p تا رسیدن به اولین موفقیت را متغیر تصادفی هندسی مینامند که تابع احتمال آن به صورت زیر است:
اگر X یک متغیر تصادفی هندسی با پارامتر p باشد، داریم:
توزیع هندسی بیحافظه است.
این رابطه بیان میکند که اگر برای مثال متغیر تصادفی هندسی X را طول عمر یک دستگاه تا خرابی در نظر بگیریم، چنان چه بدانیم دستگاه تا زمان n خراب نشده، احتمال اینکه a زمان دیگر هم کار کند، مستقل از طول عمر گذشتهاش است.
توزیع دوجملهای منفی (Negative binomial distribution)
تعداد آزمایشهای مستقل برنولی با پارامتر p تا رسیدن به rامین موفقیت را متغیر تصادفی دوجملهای منفی مینامند که تابع احتمال آن به صورت زیر است:
امید ریاضی و واریانس متغیر تصادفی دوجملهای منفی برابر است با:
میانگین و واریانس توزیع دوجملهای منفی r برابر میانگین و واریانس توزیع هندسی است.
اگر X یک متغیر تصادفی دوجملهای منفی با پارامترهای r و p باشد و Y یک متغیر تصادفی دوجملهای با پارامترهای n و p باشد، آنگاه:
اگر در توزیع دوجملهای منفی مقدار r برابر یک باشد توزیع حاصل توزیع هندسی است.
اگر Xها متغیرهای تصادفی مستقل هندسی با پارامترهای p باشند، آنگاه:
توزیع فوق هندسی (hypergeometric distribution)
فرض کنید از جعبهای که دارای m قطعه معیوب و N-m قطعه سالم است، n قطعه به تصادف و بدون جایگذاری انتخاب شود. اگر X تعداد قطعات معیوب خارج شده باشد، این متغیر تصادفی را فوق هندسی مینامند و تابع احتمال آن به صورت زیر است:
امید ریاضی و واریانس متغیر فوق هندسی برابر است با:
فرض کنید از جعبهای که دارای m قطعه معیوب و N-m قطعه سالم است، n قطعه به تصادف و با جایگذاری انتخاب شود. اگر X تعداد قطعات معیوب خارج شده باشد، آنگاه X یک متغیر دوجملهای است و داریم:
هرگاه در متغیر تصادفی فوق هندسی نسبت n به N کوچک باشد، آنگاه توزیع فوق هندسی به توزیع دو جملهای با پارامترهای n و p = m/N میل مینماید.
توزیع یکنواخت گسسته ( discrete uniform distribution)
اگر متغیر تصادفی X، n پیشامد را در فاصلهی a تا b با احتمال یکسان 1 بر n اختیار کند به آن متغیر تصادفی یکنواخت گسسته گویند و تابع احتمال آن به صورت
و تابع توزیع تجمعی آن به صورت زیر است:
نمودار تابع احتمال و تابع توزیع تجمعی برای این متغیر تصادفی به ترتیب به صورت زیر است:
امید ریاضی و واریانس این توزیع برابر است با:
در این توزیع میانه و میانگین با هم برابرند.
مثالی از این توزیع انداختن تاس سالم است که تمام شش وجه آن با احتمال یکسان یک ششم ظاهر میشوند.
مطلبی دیگر از این انتشارات
توزیع های پیوسته در آمار
مطلبی دیگر از این انتشارات
چگونه در سال آینده محقق داده (data scientist) بزرگی بشویم؟
مطلبی دیگر از این انتشارات
حال غریب آمار در ایران