در پستهای قبل دربارهی توزیعهای پرکاربرد در آمار توضیح دادم. توزیع برنولی، دوجملهای، هندسی، فوق هندسی و پواسون از جمله پرکاربردترین توزیعهایی هستند که میتوان بسیاری از رویدادهای روزمره را با آنها مدل کرد. در این پست هم به توزیعی اشاره میکنم که در دنیای واقعی کاربردهای زیادی دارد. بهتر از قبل از مطالعهی این پست، دربارهی متغیر تصادفی، تابع چگالی احتمال (PDF) و تابع توزیع تجمعی (CDF) اطلاعات داشته باشید.
برای درک توزیع نمایی، لازم است تعریف توزیع برنولی و توزیع هندسی را مرور کنیم:
توزیع برنولی مانند پرتاب یک سکه است که تنها دو حالت دارد: شیر و خط. اگر همین سکه را چند بار پرتاب کنیم و این کار را تا وقتی انجام دهیم که سکه شیر (نتیجه مطلوب) بیاید، تعداد خط آمدنها (نتایج نامطلوب) از توزیع هندسی پیروی میکند. یعنی هر کار مشابه پرتاب سکه را که چند بار امتحان کنیم، تعداد نتایج غیر قابل قبول را بشماریم تا ببینیم بعد از چند بار تکرار به نتیجهی قابل قبول میرسیم، با توزیع هندسی مدل میشود.
حال به مثال زیر توجه کنید:
فرض کنید ماشینهای عبوری از یک خیابان را در نظر گرفتیم. از قبل مشاهده کردیم و میدانیم که در یک بازهی زمانی مشخص (مثلاً یک دقیقه) به طور متوسط چند ماشین از این خیابان عبور میکند. حال بار دیگر در به این خیابان میآییم و یک لحظه را در نظر میگیریم. میخواهیم محاسبه کنیم که چقدر باید از این لحظه بگذرد تا اولین ماشین از این خیابان رد بشود. میزان زمانی که باید منتظر باشیم تا اولین ماشین را ببینیم، از توزیعی تبعیت میکند که به آن توزیع نمایی میگویند. به بیان دیگر اگر تعداد تکرارها در توزیع هندسی به بینهایت میل کند، به توزیع نمایی میرسیم.
بنابراین هر مسئلهای را که در انتظار رخداد یک اتفاق مشخص هستیم میتوانیم با توزیع نمایی مدل کنیم. مانند موارد زیر:
۱− چه مدت زمانی طول میکشد تا تاکسی اینترنتی درخواست ما را قبول کند؟
۲− چقدر منتظر بمانیم تا اولین مشتری وارد فروشگاه شود؟
۳− آیا احتمال دارد که مشتری قبل از اتمام ضمانت یک کالا (که مدت آن از قبل مشخص است)، نیاز به دریافت خدمات پس از فروش داشته باشد؟
۴− چقدر طول میکشد تا مرکز تماس، تلفن بعدی را دریافت کند؟
۵− یک قطعهی ماشین تا چه مدت بدون خرابی کار میکند؟
برای توزیع نمایی، باید بدانیم که به طور متوسط چند بار اتفاق مورد نظر ما رخ میدهد؛ مثلاً در مثال ماشینهای عبوری از خیابان، از روی مشاهدات قبلی بررسی میکنیم که در واحد زمانی مشخص (یک دقیقه، یک ساعت و ...)، میانگین تعداد ماشینهایی که از این خیابان عبور میکنند چقدر است. این میزان متوسط را با حرف لاتین «λ» نمایش میدهند.
اگر متغیر تصادفی X از توزیع نمایی با پارامتر λ تبعیت کند، آنگاه تابع چگالی احتمال آن به صورت زیر است:
در واقع احتمال P(X) با انتگرال گرفتن از f(X) محاسبه میشود. از طرفی میدانید تابع توزیع تجمعی F(X) میتواند از تابع چگالی احتمال f(X) به دست آید؛ یعنی F(X) برابر است با P(X<=x). این تابع برای توزیع نمایی به صورت زیر نوشته میشود:
در اینجا مفهوم توزیع تجمعی برای متغیر تصادفی X به این معناست: چقدر احتمال دارد قبل از x واحد زمانی، نتیجه مطلوب رخ دهد؟ یعنی میزان احتمال P(X<=x) برابر چند است؟
پینوشت: اگر علاقه به اثبات فرمولها دارید، میتوانید تدریس کامل دکتر شریفی زارچی از این مبحث را در مکتبخونه مشاهده کنید.
تا این جا متوجه شدیم که صبر کردن برای هر اتفاق را میتوانیم با توزیع نمایی مدل کنیم. حال به پاسخ این سوال کمی فکر کنید:
اگر بدانیم که در t زمان گذشته هیچ رویدادی رخ نداده است، آیا میتوانیم نتیجه بگیریم که فعلاً قرار نیست رویداد مورد نظر اتفاق بیافتد؟ مثلاً میدانیم که از صبح که فروشگاه باز شده تا الان که ۲ ساعت گذشته، هنوز هیچ مشتری مراجعه نکرده است. با دانستن این اطلاعات آیا میتوان نتیجه گرفت که تا یک ساعت دیگر هم مشتری نخواهد آمد؟
این موضوع را میتوان با فرمول احتمال شرطی بررسی کرد. فرض کنیم میدانیم که a واحد زمانی گذشته و هنوز اتفاق مورد نظر رخ نداده است؛ یعنی X<a. احتمال اینکه از این به بعد (بعد از زمان a) این اتفاق رخ دهد به چه صورت است؟ ابتدا فرمول احتمال شرطی را برای مسئله مینویسیم:
از فرمول توزیع تجمعی میدانیم که P(X<=x) برابر با F(X) است. اما چون میخواهیم P(X>x) را محاسبه کنیم لازم است NOT آن محاسبه شود؛ یعنی P(X>x)=1-P(X<=x). پس از جایگذاری داریم:
در نهایت به این نتیجه میرسیم که دانستن اینکه قبل از این لحظه اتفاق مورد نظر نیافتاده هیچ تأثیری در آینده ندارد (پس به آینده امیدوار باشید!). به بیان دیگر تابع توزیع نمایی بیحافظه است.