در این پست درباره تفاوت آمار با نظریه احتمال صحبت کردم حالا اینجا میخوام تا درباره چرایی استفاده از آمار بیزی به جای آمار کلاسیک صحبت کنم و یه سوال رو مطرح کنم که آیا اصلا نیازی هست که بریم سمت بیز؟
اگه خاطرتون باشه در مورد نظریه احتمال گفتم جامعه رو میشناسیم حالا احتمال رخ داد رو میایم بررسی میکنیم و میگیم که چه قدر ممکنه یه اتفاقی رخ بده.
اینکه این احتمال چی هست، آماردان های کلاسیک و آماردان های بیزی، تفاوت دیدگاه دارن،
آماردان های کلاسیک میگن که، یه کاری رو اگه به تعداد زیاد تکرار کنیم اون اتفاقی که مدنظرمون هست چه نسبتی توی کل تکرار هامون اتفاق میوفته رو میگیم احتمال حالا این یعنی چی؟
مثلا وقتی میگیم توی پرتاب سکه احتمال اینکه خط بیاد برابر یک دوم است یعنی یک سکه رو هزار بار پرتاب میکنیم تقریبا ۵۰۰ بارش خط میاد یا به عبارت بهتر نسبت تعداد خط ها به کل پرتاب سکه به سمت یک دوم میره.
اما آماردان های بیزی میگن احتمال یه چیز ذهنی هستش و بستگی به اون فردی داره که، داره در مورد پدیده تصمیم میگیره، اینکه چه تجربه ای از این اتفاق ممکنه داشته باشه،
یا نه تجربه نداره ولی یه اعتقاد خاصی درباره رخ دادن پیشامد داشته باشه.
حالا با داشتن این پیش زمینه ذهنی میاد و نمونه رو هم میبینه و اعتقاد خودش رو فرد نسبت به اون پدیده،
بهروز میکنه، مثلا تو مثالی که توی پست قبلی گفتم، اگه ازمون بپرسن که سکه شیر میاد یا خط میگی خب احتمال اینکه شیر بیاد با احتمال اینکه خط بیاد یکی هست(چون انتظار داریم سکه سالم باشه)، اما وقتی نمونه رو بهت میدن در مورد این اعتقادت تجدید نظر میکنی و میای یه احتمال دیگه ای رو در نظر میگیری، به عبارت دیگه اعتقاد خودت رو به روز کردی، در واقع اعتقاد خودت رو با نمونه ای که بهت دادن ادغام کردی و یک احتمال دیگه ای برای رخ دادن شیر یا خط اومدن توی سکه برای خودت بدست آوردی. به این احتمال های بعدی که بدست آوردی در مفهوم بیزی میگن تابع احتمال پسین(یا توزیع پسین).
حالا سوال اینجاست خب که چی؟ چرا اصلا بریم بیز! اعتقاد پیشین رو فوقش در نظر نمیگیرم، میخواین این رو بگین دیگه درسته؟
حالا می خوام به سوال آیا آمار کلاسیک همه جا جوابه؟ جواب بدم.
بحث اینجاست میگی اعتقاد پیشینم رو میزارم کنار!!! اگه یه وقت یه اعتقادی داشته باشیم که مهم باشه چی؟
به مثال زیر توجه کنید:
فرض کنین ده تا سوال از کلاس ۵ ام دبستان داریم که به صورت ۲ گزینه ای هستش و این سوالا رو از دو تا دانش آموز یکی کلاس ۵ امی و یکی دیگه کلاس سومی میپرسیم. و توی نتیجه این آزمون هر دو دانشآموز به هر ده تا سوال پاسخ درست دادن!!.
سوال من از تو که این متن رو میخونی اینه، به نظرت اون کلاس سومیه سوادش اندازه کلاس ۵ امی هست؟!
خب دیتات که این رو میگه تو چی؟ تو قبول میکنی؟ معلومه که نمیکنی میگی خب بابا سوالا از کلاس ۵ ام بود تو اومدی یه بچه کلاس سومی رو گذاشتی شانسی همه رو درست جواب داده یا اینکه سوالا راحت بوده، این دلیلی نمیشه بیام قبول کنم که سواد این دوتا یکی هستش.
وقتی دچار این بحران فکری و نتیجه ای میشیم آمار کلاسیک دیگه جواب نمیده، و در واقع آمار بیزی میتونه جواب بده، چون اعتقاد خودمون رو نسبت به هر یک از دانش آموزان میتونیم وارد مدل کنیم که در نهایت باعث میشه این تفاوت سواد در بین این دو آشکار بشه.
دیگه کجا ها باعث میشه آمار کلاسیک جواب نده؟
بزارین یه سوال بپرسم؟
احتمال اینکه نرخ بیکاری توی سال آینده بین ۳۰ تا ۳۵ درصد بشه چه قدر هست؟
به نظرتون این سوال رو میتونه آمار کلاسیک جواب بده؟
برای اینکه بتونیم به این سوال جواب بدیم بر میگردیم به تعریف احتمال توی آمار کلاسیک و آمار بیزی،
آمار کلاسیک میگفت که احتمال، فراوانی نسبی پیشامد مطلوب در طولانی مدت هستش. حالا یه سوال،
سال بعد چند بار اتفاق میوفته که من بخوام فراوانی نسبی پیشامد مطلوب رو داشته باشم؟ که بعد تازه بخوام احتمال گفته شده رو بدست بیارم، در واقع در آمار کلاسیک برای بدست آوردن احتمال رخداد پیشامد، نیاز داریم تا پیشامدمون قابل تکرار باشه.
میبینین نمیشه، یعنی کلاسیک وقتی که یه پیشامدی فقط یک بار رخ میده دیگه نمیتونه برای احتمال رخ داد اون پیشامد جوابی بده به خاطر همین نیاز داریم تا رویکرد بیزی رو داشته باشیم و ازش استفاده کنیم.
متاسفانه چون اکثر مواقع توزیع پسین فرم بسته ای براش پیدا نمیتونیم، مجبوریم شبیه سازی کنیم همین باعث میشه تا هزینه محاسباتی بیشتری داشته باشه، اما خب، بعضی وقتا واقعا لازمه تا این هزینه رو قبول کنیم تا بتونیم نتایج مطلوب تری بدست بیاریم.