محدثه رهنما
محدثه رهنما
خواندن ۴ دقیقه·۷ ماه پیش

توزیع هندسی، فوق هندسی و پواسون

بسیاری از رویدادهایی که روزانه با آن‌ها در ارتباطیم، می‌توانند به صورت یک توزیع آماری مدل‌سازی شوند. قبلاً درباره‌ی توزیع برنولی و دو جمله‌ای و نمونه‌هایی از رویدادهای واقعی صحبت کردم. در این پست می‌خواهم به سه توزیع پرکاربرد دیگر اشاره کنم و با هم مثال‌های عینی از آن‌ها را بررسی کنیم. برای مطالعه‌ی بیشتر می‌توانید به دوره آمار و احتمال مهندسی دانشگاه شریف در سایت مکتبخونه مراجعه کنید.


منبع عکس
منبع عکس

توزیع هندسی

برای فهم توزیع هندسی، باید ابتدا با توزیع برنولی آشنا باشید:

متغیر تصادفی گسسته‌ای را در نظر بگیرید که فقط دو حالت دارد؛ حالت اول با احتمال p و حالت دوم با احتمال (q=1-p) رخ می‌دهد. این متغیر تصادفی از نوع برنولی است. مثال کلاسیک توزیع برنولی پرتاب یک سکه است. در زندگی روزمره هم با توزیع برنولی سر و کار داریم؛ مانند احتمال بیمار/سالم بودن فرد و یا احتمال شکست/موفقیت در آزمون.

حال اگر آزمایش برنولی را چند بار انجام دهیم و این کار را تا جایی ادامه دهیم تا پس از چند بار نتیجه‌ی غیر قابل قبول، به نتیجه‌ی دلخواه (مثلا موفقیت) برسیم این یک توزیع هندسی است.

تفاوت توزیع دوجمله‌ای و توزیع هندسی در این است که در توزیع دو جمله‌ای، آزمایش برنولی را به تعداد دلخواه (مثلا n بار) انجام می‌دهیم و تعداد نتایج شکست/موفقیت را می‌شماریم. اما در توزیع هندسی، آن قدر آزمایش برنولی را تکرار می‌کنیم تا به شکست/موفقیت برسیم و پس از آن انجام آزمایش متوقف می‌شود.

برای مثال اگر n بار یک سکه را پرتاب کنیم و تعداد اینکه k بار رو آمده باشد را بشماریم، این یک توزیع دو جمله‌ای است. حال اگر آن قدر سکه را پرتاب کنیم تا پشت بیاید، شمارش تعداد رو آمدن از توزیع هندسی پیروی می‌کند.

برای درک بیشتر، دو مثال زیر را در نظر بگیرید:

۱. فرض کنید یک شرکت می‌خواهد از مشتریان خود درباره‌ی یک کالای خاص نظرسنجی کند. برای این کار از چند کارشناس می‌خواهد که با مشتریان تماس بگیرند و نظر آن‌ها را درباره‌ی کالای خریداری شده بپرسند. در این جا باید با چند مشتری تماس گرفته شود؟ آیا لازم است از تمامی مشتریان نظرسنجی کرد؟ یا می‌توان با بدون پرسیدن نظر همه‌ی مشتریان میزان رضایت از این کالا را ارزیابی کرد؟
در این مورد می‌توان از توزیع هندسی استفاده کرد. با مدل کردن اینکه از بین n کالای تولید شده، چندمین کالا ممکن است معیوب باشد، شرکت می‌تواند تصمیم بگیرد که حداقل بهتر است با چند مشتری تماس گرفته شود؟

۲. در نمونه‌ی دیگری، فرض کنید که حوادثِ رخ داده در یک کارخانه مورد بررسی و تحلیل قرار گیرد. یک مهندس ایمنی حدس می‌زند که احتمالاً ۴۰ درصد حوادث به علت عدم رعایت دستورالعمل‌ها اتفاق افتاده است.

در اینجا تعداد n گزارشِ حوادث به صورت تصادفی انتخاب می‌شود. سپس هر گزارش مطالعه می‌شود تا جایی که موردی یافت شود که علت حادثه، عدم رعایت دستورالعمل‌ها باشد.

توزیع فوق هندسی

فرض کنید مجموعه‌ای داریم که N1 عضو آن دارای ویژگی خاصی باشند؛ در حالی که N2 عضو آن فاقد این ویژگی هستند. پس در مجموع N1+N2 نمونه داریم. می‌خواهیم از این مجموعه x مورد را (بدون جایگذاری) انتخاب کنیم. چقدر احتمال دارد که k تا از این x مورد دارای آن ویژگی خاص باشند.

مثال ساده‌ی توزیع فوق هندسی که می‌تواند درک بهتری از این توزیع سبدی را در نظر بگیرید که تعدادی توپ آبی و قرمز در آن قرار دارد. اگر بخواهیم x توپ از آن انتخاب کنیم، احتمال اینکه k توپ قرمز انتخاب شود چقدر است؟

اما مثال‌های کلاسیک نمی‌توانند کاربرد واقعی آمار را در واقعیت نشان دهند، پس بهتر است چند مثال کاربردی در حوزه‌های مختلف را بررسی کنیم:
به عنوان مثال هنگام کنترل کیفیت محصولات در یک کارخانه، ممکن است کارشناس تصمیم بگیرد که از بین تعدادی از محصولِ تولید شده، x عدد را انتخاب کند. احتمال اینکه k محصول معیوب باشد با کمک توزیع فوق هندسی محاسبه می‌شود.

نمونه‌ی دیگر زیست شناسانی هستند که جمعیت جانوران را مطالعه می‌کنند، می‌توانند با استفاده از توزیع فوق هندسی محاسبه کنند که در یک منطقه‌ی مشخص، چقدر احتمال دارد تا چند نمونه گونه‌ی جانوری که در خطر انقراض قرار دارد یافت شود؟

توزیع پواسون

فرض کنید در یک بازه‌ی زمانی مشخص، تعداد رخداد یک رویداد را بشماریم. به شرطی که هر رویداد از بقیه مستقل باشند و با نرخ میانگین مشخصی رخ می‌دهند. برای نمونه تعداد ماشین‌هایی که طی یک ساعت از یک خیابان می‌گذرند از توزیع پواسون تبعیت می‌کند.

مثلاً تعداد بازدیدکنندگان یک سایت در بازه‌ی زمانی مشخص می‌تواند از توزیع پواسون تبعیت کند. همچنین تعداد مشتریانی که در بازه‌ی زمانی دلخواه (مثلاً یک ساعت) وارد بانک می‌شوند هم با توزیع پواسون مدل می‌شود. به شرطی که مشتریان با هم هماهنگ نکرده باشند یا به عبارت دیگر ورود مشتری‌ها به بانک مستقل از هم باشند. تعداد ماشین‌های عبوری از یک خیابان نیز می‌تواند با توزیع پواسون مدل شود.

منبع مثال‌های توزیع هندسی :

https://www.statisticshowto.com/geometric-distribution-real-life-examples/

منبع مثال‌های توزیع فوق هندسی:

https://www.quora.com/What-is-the-real-life-examples-of-Hypergeometric-Distribution


آمار و احتمالیادگیری ماشینهوش مصنوعیمفاهیم
دانش‌آموخته‌ی هوش مصنوعی از دانشگاه الزهرا، جویای علم در زمینه هوش مصنوعی و یادگیری ماشین
شاید از این پست‌ها خوشتان بیاید