خواندن ۹ دقیقه·۵ سال پیش

توزیع های گسسته

در این مطلب به معرفی توزیعهای گسسته و بیان برخی از ویژگی‌هایشان می‌پردازیم.

توزیع برنولی یا دودویی (Bernoulli distribution):

توزیع برنولی را می‌توان به عنوان ساده‌ترین نوع توزیع گسسته شناخت که از دو برآمد شکست یا موفقیت تشکیل می‌شود . آزمایش پرتاب سکه یک آزمایش برنولی است . اگر p احتمال موفقیت باشد ، آنگاه 1-p (که گاهی با q نمایش داده می‌شود) احتمال شکست است. تابع جرم احتمال این توزیع به صورت زیر می‌باشد :

x=0,1

توجه داریم که منظور از موفقیت، نتیجه هایی از آزمایش است که می‌خواهیم روی آن تحلیل انجام دهیم. برای این توزیع که با نماد x~ber(p) نشان داده می شود، داریم:

اگر X1,X2,......Xnمتغیرهای تصادفی برنولی حاصل از آزمایشهای مستقل و با پارامتر p باشند، داریم:

مثال : اگر در ریختن یک تاس سالم پیشامد مشاهده‌ی خال ۲ یا ۳ را موفقیت و وقوع پیشامد‌های ۱،۴،۵،۶ را شکست بنامیم ، آنگاه :

یک متغیر تصادفی برنولی با پارامتر p=1/13 است. بنابراین تابع جرم احتمال آن عبارت است از :

میانگین و واریانس X به صورت زیر می‌باشند :

توزیع دوجمله‌ای (Binomial distribution)

اگر n آزمایش برنولی ، همه با احتمال‌های موفقیت p ، به صورت مستقل انجام شوند .، آنگاه X تعداد موفقیت ها در این n آزمایش را متغیر دوجمله‌ای با پارامتر‌های n و p می‌نامند. که مجموعه مقادیر آن به صورت x = 0,1,...,n می‌باشد.

تعداد موفقیت ها در n آزمایش مستقل برنولی با پارامتر p را متغیر تصادفی دوجمله ای می نامند که نماد آن X~B (n,p) و تابع احتمال آن به صورت زیر است:

تابع توزیع تجمعی این متغیر برابر است با:

که برای محاسبه آن از رابطه زیر استفاده می‌شود:

اگر X یک متغیر تصادفی دوجمله‌ای با پارامترهای n و p باشد داریم:

مثال : رستورانی دارای ۸ نوع گوشت قرمز ، ۱۲ نوع خوراک ماهی و ۱۰ نوع خوراک مرغ می‌باشد . اگر مشتریان از بین این غذاها به تصادف یک مورد را انتخاب کنند ، احتمال اینکه دو نفر از ۴ مشتری بعدی خوراک ماهی سفارش دهند چقدر است ؟

پاسخ : فرض کنید X تعداد خوراک‌های ماهی باشد که ممکن است چهار مشتری بعدی آن را انتخاب کنند . پس X یک متغیر تصادفی دو جمله‌ای با پارامتر‌های است در نتیجه ،

تقریب توزیع دوجمله‌ای به وسیله توزیع نرمال:

اگر X متغیر تصادفی دوجمله‌ای با پارامترهای n و p را باشد:

یعنی در n های بزرگ می‌توان توزیع دو جمله‌ای را با توزیع نرمال تقریب زد.

قضیه حدی دموار-لاپلاس:

اگر Sn نشان دهنده تعداد موفقیتها در n آزمایش ساده مستقل هر کدام با احتمال موفقیت P باشد، آنگاه برای هر a<b، وقتی که n->∞:

که در این قضیه عبارت ، تابع توزیع تجمعی نرمال استاندارد است که به صورت زیر می‌باشد:

توزیع پواسون :(Poisson distribution)

متغیر تصادفی است که برای مدل سازی تعداد پیشامد‌ها در طول زمان استفاده می‌شود و تابع احتمال آن به صورت زیر است:

λ نرخ وقوع اتفاق یا متوسط تعداد اتفاق ها در واحد زمان یا مکان است.

اگر X یک متغیر تصادفی پواسون با پارامترλ باشد، میانگین و واریانس آن با هم برابر است و داریم:

مثال :

در یک کارخانه تولید خودرو، احتمال اینکه خودرو به خاطر نقص فنی در بخش کنترل کیفیت بازگردانده شود،‌ برابر ۲٪ است. احتمال آنکه در بین ۳۰۰ دستگاه تولیدی ۵ دستگاه برگشت داده شود، چقدر است؟

پاسخ :

در اینجا متوسط تعداد برگشتی‌ها همان پارامتر توزیع پواسون است. یعنی λ= 300X0.02=6

و در نهایت به صورت زیر احتمال مورد نظر را بدست می‌آوریم.

فرایند پواسون: اگر تعداد اتفاق ها در واحد زمان دارای توزیع پواسون با پارامترλ باشد، تعداد اتفاق‌ها در t واحد زمانی از توزیع پواسون با پارامترλt پیروی می نماید.
N(0)=0
این فرایند را به صورت نمایش داده می‌شود با نرخ λ>0
این فرایند افزایشی مستقل است .
تعداد رویداد‌های رخ داده در بازه‌ی زمانی به طول t دارای توزیع پواسون است و میانگین آن برابر با λt می‌باشد. در واقع برای تمام s ها (یک نقطه زمانی دلخواه) :

یا

-در فرآیند پواسون تعداد اتفاق ها در فواصل زمانی مجزا مستقل هستند.

-اگر تعداد دفعات رخ دادن یک اتفاق در واحد زمان، از توزیع پواسون با پارامترλ پیروی نماید و هر اتفاق از این توزیع با احتمال Pi از نوع i باشد، آنگاه تعداد دفعات رخ دادن اتفاق نوع i در واحد زمان از توزیع پواسون با پارامتر λpi پیروی می‌نماید.
-توزیع تعداد موفقیت‌ها در n آزمایش مستقل برنولی با پارامتر p را می‌توان با متغیر تصادفی پواسون با پارامتر λ=np تقریب زد، به شرطی که n بزرگ و p کوچک باشد.

مثال ( فرایند پواسون ): فرض کنید در یک زایشگاه نوزادان با نرخ پواسون ۵ نوزاد در روز متولد شوند. مطلوب است محاسبه احتمال این که طی ۶ ساعت آینده حداقل دو نوزاد متولد شوند.

پاسخ: فرض کنید کنید توزیع پواسونی برای تعداد نوزادان متولد شده در زمان t و قبل از آن داریم. اگر واحد زمان را روز در نظر بگیریم آنگاه λ=5. بنابراین :

پس احتمال مورد نظر به صورت زیر بدست می‌آید.

توزیع هندسی(Geometric distribution):

آزمایش‌های مستقل برنولی با پارامتر p تا رسیدن به اولین موفقیت را متغیر تصادفی هندسی با نماد X~G(p)می‌نامند که تابع احتمال آن به صورت زیر است:

اگر X یک متغیر تصادفی هندسی با پارامتر p باشد، داریم:

نکته : توزیع هندسی بی حافظه است. یعنی در آزمایش‌های متوالی و مستقل برنولی اطلاع از این موضوع که m برآمد متوالی مشاهده شده تاکنون، همگی شکست بوده‌اند در احتمال اینکه n برآمد بعدی همه شکست باشند، بی‌اثر است. دلیل این موضوع استقلال آزمایش‌های بدیهی‌ است. اما از این نظر که توزیع هندسی، تنها توزیع گسسته بی‌حافظه است، جالب است.

به طور مثال فرض کنید دستگاهی داریم که X طول عمر آن تا زمان خرابی باشد اگر بدانیم دستگاه تا زمان m خراب نشده باشد ، احتمال اینکه تا زمان n+m هم خراب نشود مستقل از طول عمر گذشته خود است و برابر است با احتمال اینکه دستگاه تا زمان n خراب نشود.

مثال :

از بین ۱۳ کارت که از ۱ تا ۱۳ شماره گذاری شده‌اند ، به صورت متوالی و به تصادف همراه با جایگذاری کارتی بیرون می‌کشیم تا زمانی که کارت با شماره ۱ را انتخاب کنیم . احتمال این‌که برای رسیدن به اولین کارت با شماره‌ی ۱ ، ۱۰ بار کارت بکشیم؟

پاسخ :‌

فرض کنید X تعداد کارت های کشیده‌شده تا مشاهده اولین شماره ۱ باشد . X یک متغیر تصادفی هندسی با پارامتر p=1/13 است . پس :

این احتمال برابر است با :

توزیع دوجمله‌ای منفی: (Negative binomial distribution)

تعداد آزمایش‌های مستقل برنولی با پارامتر p تا رسیدن به rامین موفقیت را متغیر تصادفی دوجمله‌ای منفی با نماد x~nb(r,p)می‌نامند که تابع احتمال آن به صورت زیر است:

امید ریاضی و واریانس متغیر تصادفی دو جمله ای منفی برابر است با:

میانگین و واریانس توزیع دوجمله‌ای منفی r برابر میانگین و واریانس توزیع هندسی است.

اگر X یک متغیر تصادفی دوجمله‌ای منفی با پارامترهای r و p باشد و Y یک متغیر تصادفی دوجمله‌ای با پارامترهای n و p باشد، آنگاه:

(rامین موفقیت بعد از آزمایش nام رخ دهد یعنی در n آزمایش اول کمتر از r موفقیت داشته باشیم)

اگر در توزیع دوجمله‌ای منفی مقدار r برابر یک باشد توزیع حاصل توزیع هندسی است.

اگر x1,...xr متغیرهای تصادفی مستقل هندسی با پارامترهای pi باشند، آنگاه:

مثال :

احمد و مرتضی یه تعداد دفعات با یکدیگر تخته‌نرد بازی می‌کنند تا اینکه بالاخره یکی از آن‌ها ۵ بار برنده شود . فرض کنید بازی‌ها مستقل و احتمال اینکه احمد در یک بازی پیروز شود برابر با ۰.۵۸ باشد . مطلوب است محاسبه احتمال این که بازی در دور هفتم خاتمه یابد

پاسخ :

فرض کنید X تعداد دفعات بازی تا برنده‌ شدن احمد در ۵ دور باشد . همچنین فرض کنید Y تعداد دفعات بازی تا برنده شدن رضا در ۵ دور باشد . متغیرهای تصادفی X و Y متغیر‌های دوجمله‌ای منفی به ترتیب با پارامترهای (۰.۵۸ ، ۵) و (۰.۴۲ ، ۵) هستند. احتمال اینکه این بازی در دور هفتم خاتمه پیدا کند برابر است با :

توزیع فوق هندسی (hypergeometric distribution)

فرض کنید از جعبه‌ای که دارای m قطعه معیوب و N-m قطعه سالم است، n قطعه به تصادف و بدون جایگذاری انتخاب شود. اگر X تعداد قطعات معیوب خارج شده باشد، این متغیر تصادفی را فوق هندسی با نماد X~HG(N,m,n) می‌نامند و تابع احتمال آن به صورت زیر است:

امید ریاضی و واریانس متغیر فوق هندسی برابر است با:

مثال :

پژوهشگری در انجام ۵۰۰ محاسبه مستقل مرتکب ۲۵ اشتباه شده است . اگر پژوهشگر دیگری ۷ محاسبه از آن‌ها را به تصادف کنترل کند ، احتمال این که دو اشتباه پیدا کند چقدر است ؟( فرض کنید پژوهشگر دوم کاملا به صحت محاسبات آگاه است. )

پاسخ : فرض کنید X تعداد اشتباهاتی باشد که پژوهشگر دوم پیدا می‌کند . X یک متغیر فوق هندسی‌ست با پارامتر های n=۷ , N=۵۰۰ , D= ۲۵ . احتمال مورد نظر به صورت زیر محاسبه می‌شود .

نکته : هرگاه در متغیر تصادفی فوق هندسی نسبت n به N کوچک باشد، آنگاه توزیع فوق هندسی به توزیع دو جمله ای با پارامترهای n و p=m/N میل می‌نماید.

نکته : فرض کنید از جعبه‌ای که دارای m قطعه معیوب و N-m قطعه سالم است، n قطعه به تصادف و با جایگذاری انتخاب شود. اگر X تعداد قطعات معیوب خارج شده باشد، آنگاه X یک متغیر دوجمله‌ای است و داریم:

توزیع یکنواخت گسسته( discrete uniform distribution):

فرض کنید متغیر تصادفی x دارای n نقطه و تکیه‌گاه اعداد طبیعی از ۱ تا n باشد . اگر تابع احتمال آن به صورت زیر باشد به آن تابه یکنواخت گسسته گوییم.

در این توزیع احتمال انتخاب هر نقطه از ۱ تا n ، احتمالی برابر و یکسان است . در نتیجه برای بیان این توزیع نیاز به n داریم. برای نمایش تابع توزیع احتمال تجمعی این متغیر تصادفی از رابطه‌ی زیر بهره می‌بریم:

در صورت این رابطه منظور از جزء صحیح x ، بزرگترین مقدار صحیحی‌ست که از x کوچک‌تر باشد.

مثال : تاسی را پرتاب می‌کنیم. اگر X بیانگر عدد مشاهده شده در هر پرتاب باشد، توزیع این متغیر را می‌توان توزیع یکنواخت گسسته دانست زیرا با فرض n=۶، هر پیشامد دارای احتمال یکسان بوده و همچنین تابع توزیع آن به صورت زیر می‌باشد.

در حالت قبل تکیه‌گاه متغیر تصادفی از ۱ شروع می‌شد و به n ختم میشد. همانطور که گفته شد در این حالت فقط نیاز به مقدار n خواهیم داشت. اما حالتی دیگر نیز وجود دارد که در آن تکیه گاه، تعداد اعداد صحیح در فاصله‌ی [a,b] در نظر می‌گیریم و آن را به صورت زیر می‌نویسیم.
و می‌گوییم X دارای توزیع یکنواخت گسسته با پارامتر‌های a و b می‌باشد. در این توزیع مقدار n به صورت زیر بدست می‌آید:

n= b - a + ۱

در این حالت همواره مقدار b از a بزرگتر است و تابع چگالی احتمال و تابع توزیع احتمال تجمعی آن را به صورت زیر می‌نویسیم:

نمودار تابع احتمال و تابع توزیع تجمعی برای این متغیر تصادفی به ترتیب به صورت زیر است:

امید ریاضی و واریانس این توزیع برابر است با:

نکته: در این توزیع میانه و میانگین با هم برابرند.

مثالی از این توزیع انداختن تاس سالم است که تمام شش وجه آن با احتمال یکسان 1/6 ظاهر می‌شوند.

آمار

ایردا - IRDA

مرجع تخصصی آمار ایران

شاید از این پست‌ها خوشتان بیاید

ایردا - IRDA

خواندن ۹ دقیقه·۵ سال پیش

توزیع های گسسته

در این مطلب به معرفی توزیعهای گسسته و بیان برخی از ویژگی‌هایشان می‌پردازیم.

توزیع برنولی یا دودویی (Bernoulli distribution):

x=0,1

اگر X1,X2,......Xnمتغیرهای تصادفی برنولی حاصل از آزمایشهای مستقل و با پارامتر p باشند، داریم:

یک متغیر تصادفی برنولی با پارامتر p=1/13 است. بنابراین تابع جرم احتمال آن عبارت است از :

میانگین و واریانس X به صورت زیر می‌باشند :

توزیع دوجمله‌ای (Binomial distribution)

تابع توزیع تجمعی این متغیر برابر است با:

که برای محاسبه آن از رابطه زیر استفاده می‌شود:

اگر X یک متغیر تصادفی دوجمله‌ای با پارامترهای n و p باشد داریم:

تقریب توزیع دوجمله‌ای به وسیله توزیع نرمال:

اگر X متغیر تصادفی دوجمله‌ای با پارامترهای n و p را باشد:

یعنی در n های بزرگ می‌توان توزیع دو جمله‌ای را با توزیع نرمال تقریب زد.

قضیه حدی دموار-لاپلاس:

که در این قضیه عبارت ، تابع توزیع تجمعی نرمال استاندارد است که به صورت زیر می‌باشد:

توزیع پواسون :(Poisson distribution)

متغیر تصادفی است که برای مدل سازی تعداد پیشامد‌ها در طول زمان استفاده می‌شود و تابع احتمال آن به صورت زیر است:

λ نرخ وقوع اتفاق یا متوسط تعداد اتفاق ها در واحد زمان یا مکان است.

اگر X یک متغیر تصادفی پواسون با پارامترλ باشد، میانگین و واریانس آن با هم برابر است و داریم:

مثال :

پاسخ :

در اینجا متوسط تعداد برگشتی‌ها همان پارامتر توزیع پواسون است. یعنی λ= 300X0.02=6

و در نهایت به صورت زیر احتمال مورد نظر را بدست می‌آوریم.

فرایند پواسون: اگر تعداد اتفاق ها در واحد زمان دارای توزیع پواسون با پارامترλ باشد، تعداد اتفاق‌ها در t واحد زمانی از توزیع پواسون با پارامترλt پیروی می نماید.
N(0)=0
این فرایند را به صورت نمایش داده می‌شود با نرخ λ>0
این فرایند افزایشی مستقل است .
تعداد رویداد‌های رخ داده در بازه‌ی زمانی به طول t دارای توزیع پواسون است و میانگین آن برابر با λt می‌باشد. در واقع برای تمام s ها (یک نقطه زمانی دلخواه) :

یا

-در فرآیند پواسون تعداد اتفاق ها در فواصل زمانی مجزا مستقل هستند.

-اگر تعداد دفعات رخ دادن یک اتفاق در واحد زمان، از توزیع پواسون با پارامترλ پیروی نماید و هر اتفاق از این توزیع با احتمال Pi از نوع i باشد، آنگاه تعداد دفعات رخ دادن اتفاق نوع i در واحد زمان از توزیع پواسون با پارامتر λpi پیروی می‌نماید.
-توزیع تعداد موفقیت‌ها در n آزمایش مستقل برنولی با پارامتر p را می‌توان با متغیر تصادفی پواسون با پارامتر λ=np تقریب زد، به شرطی که n بزرگ و p کوچک باشد.