بسیاری از رویدادهایی که روزانه با آنها در ارتباطیم، میتوانند به صورت یک توزیع آماری مدلسازی شوند. قبلاً دربارهی توزیع برنولی و دو جملهای و نمونههایی از رویدادهای واقعی صحبت کردم. در این پست میخواهم به سه توزیع پرکاربرد دیگر اشاره کنم و با هم مثالهای عینی از آنها را بررسی کنیم. برای مطالعهی بیشتر میتوانید به دوره آمار و احتمال مهندسی دانشگاه شریف در سایت مکتبخونه مراجعه کنید.
برای فهم توزیع هندسی، باید ابتدا با توزیع برنولی آشنا باشید:
متغیر تصادفی گسستهای را در نظر بگیرید که فقط دو حالت دارد؛ حالت اول با احتمال p و حالت دوم با احتمال (q=1-p) رخ میدهد. این متغیر تصادفی از نوع برنولی است. مثال کلاسیک توزیع برنولی پرتاب یک سکه است. در زندگی روزمره هم با توزیع برنولی سر و کار داریم؛ مانند احتمال بیمار/سالم بودن فرد و یا احتمال شکست/موفقیت در آزمون.
حال اگر آزمایش برنولی را چند بار انجام دهیم و این کار را تا جایی ادامه دهیم تا پس از چند بار نتیجهی غیر قابل قبول، به نتیجهی دلخواه (مثلا موفقیت) برسیم این یک توزیع هندسی است.
تفاوت توزیع دوجملهای و توزیع هندسی در این است که در توزیع دو جملهای، آزمایش برنولی را به تعداد دلخواه (مثلا n بار) انجام میدهیم و تعداد نتایج شکست/موفقیت را میشماریم. اما در توزیع هندسی، آن قدر آزمایش برنولی را تکرار میکنیم تا به شکست/موفقیت برسیم و پس از آن انجام آزمایش متوقف میشود.
برای مثال اگر n بار یک سکه را پرتاب کنیم و تعداد اینکه k بار رو آمده باشد را بشماریم، این یک توزیع دو جملهای است. حال اگر آن قدر سکه را پرتاب کنیم تا پشت بیاید، شمارش تعداد رو آمدن از توزیع هندسی پیروی میکند.
برای درک بیشتر، دو مثال زیر را در نظر بگیرید:
۱. فرض کنید یک شرکت میخواهد از مشتریان خود دربارهی یک کالای خاص نظرسنجی کند. برای این کار از چند کارشناس میخواهد که با مشتریان تماس بگیرند و نظر آنها را دربارهی کالای خریداری شده بپرسند. در این جا باید با چند مشتری تماس گرفته شود؟ آیا لازم است از تمامی مشتریان نظرسنجی کرد؟ یا میتوان با بدون پرسیدن نظر همهی مشتریان میزان رضایت از این کالا را ارزیابی کرد؟
در این مورد میتوان از توزیع هندسی استفاده کرد. با مدل کردن اینکه از بین n کالای تولید شده، چندمین کالا ممکن است معیوب باشد، شرکت میتواند تصمیم بگیرد که حداقل بهتر است با چند مشتری تماس گرفته شود؟
۲. در نمونهی دیگری، فرض کنید که حوادثِ رخ داده در یک کارخانه مورد بررسی و تحلیل قرار گیرد. یک مهندس ایمنی حدس میزند که احتمالاً ۴۰ درصد حوادث به علت عدم رعایت دستورالعملها اتفاق افتاده است.
در اینجا تعداد n گزارشِ حوادث به صورت تصادفی انتخاب میشود. سپس هر گزارش مطالعه میشود تا جایی که موردی یافت شود که علت حادثه، عدم رعایت دستورالعملها باشد.
فرض کنید مجموعهای داریم که N1 عضو آن دارای ویژگی خاصی باشند؛ در حالی که N2 عضو آن فاقد این ویژگی هستند. پس در مجموع N1+N2 نمونه داریم. میخواهیم از این مجموعه x مورد را (بدون جایگذاری) انتخاب کنیم. چقدر احتمال دارد که k تا از این x مورد دارای آن ویژگی خاص باشند.
مثال سادهی توزیع فوق هندسی که میتواند درک بهتری از این توزیع سبدی را در نظر بگیرید که تعدادی توپ آبی و قرمز در آن قرار دارد. اگر بخواهیم x توپ از آن انتخاب کنیم، احتمال اینکه k توپ قرمز انتخاب شود چقدر است؟
اما مثالهای کلاسیک نمیتوانند کاربرد واقعی آمار را در واقعیت نشان دهند، پس بهتر است چند مثال کاربردی در حوزههای مختلف را بررسی کنیم:
به عنوان مثال هنگام کنترل کیفیت محصولات در یک کارخانه، ممکن است کارشناس تصمیم بگیرد که از بین تعدادی از محصولِ تولید شده، x عدد را انتخاب کند. احتمال اینکه k محصول معیوب باشد با کمک توزیع فوق هندسی محاسبه میشود.
نمونهی دیگر زیست شناسانی هستند که جمعیت جانوران را مطالعه میکنند، میتوانند با استفاده از توزیع فوق هندسی محاسبه کنند که در یک منطقهی مشخص، چقدر احتمال دارد تا چند نمونه گونهی جانوری که در خطر انقراض قرار دارد یافت شود؟
فرض کنید در یک بازهی زمانی مشخص، تعداد رخداد یک رویداد را بشماریم. به شرطی که هر رویداد از بقیه مستقل باشند و با نرخ میانگین مشخصی رخ میدهند. برای نمونه تعداد ماشینهایی که طی یک ساعت از یک خیابان میگذرند از توزیع پواسون تبعیت میکند.
مثلاً تعداد بازدیدکنندگان یک سایت در بازهی زمانی مشخص میتواند از توزیع پواسون تبعیت کند. همچنین تعداد مشتریانی که در بازهی زمانی دلخواه (مثلاً یک ساعت) وارد بانک میشوند هم با توزیع پواسون مدل میشود. به شرطی که مشتریان با هم هماهنگ نکرده باشند یا به عبارت دیگر ورود مشتریها به بانک مستقل از هم باشند. تعداد ماشینهای عبوری از یک خیابان نیز میتواند با توزیع پواسون مدل شود.
منبع مثالهای توزیع هندسی :
https://www.statisticshowto.com/geometric-distribution-real-life-examples/
منبع مثالهای توزیع فوق هندسی:
https://www.quora.com/What-is-the-real-life-examples-of-Hypergeometric-Distribution