قضیه بیز (نام این قضیه به افتخار دانشمند انگلیسی آمار «توماس بیز» (Thomas Bayes) که در سال 1763 مقالهای با این موضوع منتشر کرد، انتخاب شده است.) روشی برای دستهبندی پدیدهها، بر پایه احتمال وقوع یا عدم وقوع یک پدیدهاست و در نظریه احتمالات با اهمیت و پرکاربرد است. اگر برای فضای نمونهای مفروضی بتوانیم چنان افرازی انتخاب کنیم که با دانستن اینکه کدامیک از پیشامدهای افراز شده رخ دادهاست، بخش مهمی از عدم قطعیت تقلیل مییابد.
این قضیه از آن جهت مفید است که میتوان از طریق آن، احتمال یک پیشامد را با مشروط کردن نسبت به وقوع یا عدم وقوع یک پیشامد دیگر محاسبه کرد. در بسیاری از حالتها، محاسبهٔ احتمال یک پیشامد به صورت مستقیم کاری دشوار است. با استفاده از این قضیه و مشروط کردن پیشامد مورد نظر نسبت به پیشامد دیگر، میتوان احتمال مورد نظر را محاسبه کرد.
بدون شک قضیه بیز (Bayes Theorem) یکی از مهمترین اصول آمار و احتمالات است که بخش قابل توجهی از دانش مدرن ما در حوزههای مختلف، به طور خاص در حوزه هوش مصنوعی و مهندسی کنترل، بر آن استوار است. پروازهای امن در خطوط هوایی، سیستمهای نظارتی و کنترلی شبکه برق، روباتهای متحرک، موتورهای جستجو و دهها کاربرد دیگر در زندگی روزمره ما، بدون این قانون عملا نمیتوانستند وجود داشته باشند. بخش قابل توجهی از دانش هوش مصنوعی، که وظیفه آن توسعه هوشمندی سیستمهای کامپیوتری است، بر روی قانون بیز و آمار بیزی بنا شده است. به عقیده بسیاری از دانشمندان علوم کامپیوتر، اساسیترین معادله توصیف کننده هوش، همین قانون بیز است.
اگر فضای نمونه ای توسط B1,B2,…,BnB1,B2,…,Bn افراز شده باشد، بطوری که P(Bi)>0 و P(Bi)>0 آنگاه برای هر پیشامد A میتوانیم بنویسیم:
P(Bj|A)=P(Bj)P(A|Bj)/P(A)
مثال 1 : سه سبد در اختیار داریم که در سبد اول دو مهره سفید و یک مهره قرمز و در سبد دوم یک مهره سفید و یک مهره قرمز و در سبد سوم نیز دو مهره سفید و سه مهره قرمز قرار دارد. اگر بدانیم مهرهای که از سبد خارج شده، سفید است، احتمال اینکه این مهره از سبد سوم خارج شده باشد چقدر است؟
P(B3|A)=(P(A|B3)P(B3))/ (P(A|B1)P(B1)+P(A|B2)P(B2)+P(A|B3)P(B3))=12/47
مثال 2:
در یک آزمایش پزشکی، دیابت (مرض قند) یک فرد قندی با احتمال 0.8 به درستی تشخیص داده میشود و با احتمال 0.9 نیز برای افراد سالم نتیجه عدم ابتلا به این بیماری اعلام میشود. اگر از هر 10000نفر مردم جامعه 2 نفر دچار بیماری دیابت باشند (احتمال پیشین)، احتمال اینکه نتیجه مثبت آزمایش یک فرد، بیانگر ابتلا به مرض قند باشد چقدر است (احتمال پسین)؟
با توجه به مسئله، جامعه آماری یا فضای نمونه به دو گروه بیماران قندی و سالم طبقهبندی (افراز) شده است. حال اگر B را پیشامد ابتلا به دیابت و B′B′ را عدم ابتلا به بیماری دیابت در نظر بگیریم و A پیشامد این باشد که نتیجه آزمایش مثبت است، اطلاعات زیر توسط مسئله داده شده.
A|B: پیشامد اینکه نتیجه آزمایش مثبت برای فرد مبتلا به دیابت باشد. یعنی آزمایش نشان دهد که فرد دیابتی مبتلا به بیماری دیابت است.
A′|B′A′|B′: پیشامد اینکه نتیجه آزمایش منفی مربوط به فرد سالم باشد. یعنی آزمایش نشان دهد که فرد سالم به دیابت دچار نیست. در نتیجه خواهیم داشت:
P(A|B)=0.8, P(A′|B′)=0.9, P(B)=0.0002 P(A|B)=0.8, P(A′|B′)=0.9, P(B)=0.0002
حال با استفاده از قضیه بیز داریم: P(B|A)=0.0016
مثال 3 :
مقایسه احتمال ارتکاب جرم در مجردها و متاهل ها:
فرض کنید ۳۵ درصد افرادی که به سن ازدواج رسیدهاند، هنوز مجرد هستند؛ ۶۵ درصد باقی مانده هم، ازدواج کرده و متأهل هستند. ضمنا، فرض کنید طبق آمار، ۵ درصد از مجردها یک جرم خاص را مرتکب میشوند؛ اما همین کسر در میان متأهلین، ۳ درصد است. یعنی احتمال ارتکاب جرم میان متأهلها، کمتر است
P(C) = P(C|S)×P(S) + P(C|M)×P(M) = ۰/۰۳۷
P(S|C) = P(C|S)×P(S)÷P(C) ≃ ۰/۴۷۳
P(M|C) = P(C|M)×P(M)÷P(C) ≃ ۰/۵۲۷
مثال 4 :
تست سرطان سینه :
حتمال یک رویداد از تقسیم تعداد راههایی که ممکن است رخ بدهد بر همه خروجیهای ممکن به دست میآید:
احتمال این که فردی واقعاً یک نتیجه مثبت داشته باشد برابر با 0.008 است.
احتمال این که هر گونه نتیجه مثبتی داشته باشد، برابر است با احتمال یک مثبت درست به علاوه احتمال مثبت نادرست یعنی (0.008 + 0.09504 = 0.10304)
بنابراین احتمال وجود سرطان در صورت مثبت بودن نتیجه برابر خواهد بود با 0.008/0.10304 = 0.0776 یا در حدود 7.8 درصد.
مثال 5 :
فرض کنید در بخش پایانی مسابقه ای، شرکت کننده باید جایزه ای را که پشت یکی از سه در، پنهان شده با حدس زدن درِ مربوطه پیدا کند. چون هیچ اطلاعاتی درباره ی مکان پنهان شدن جایزه وجود ندارد، احتمال وجود جایزه پشت تمامی درها از دید شرکت کننده، یکسان و برابر با 1/3 است.
حال اگر مجری با کسر چند امتیاز از شرکت کننده، یک راهنمایی به او بکند، مثلاً یکی از درها را حذف کند، چه تغییری در احتمال وجود جایزه پشت دو درِ باقی مانده بوجود می آید؟ آیا احتمال وجود در پشت آن دو در باقی مانده، همان 1/3 باقی می ماند؟
ما دنبال توزیع احتمال وجود جایزه پشت درها هستیم. در ابتدای کار:
پس احتمال اولیه برای همه درها مساوی است. وقتی ما یک اطلاعات جدید یا یک مشاهده داریم (که آن را y مینامیم)، توزیع احتمال روی xi ها تغییر میکند. در واقع اگر بدانیم که در سوم پوچ است، احتمال x3 برابر صفر خواهد بود و احتمال x1 و x2 با یکدیگر برابر و هر یک برابر 1/2 خواهد شد.
مثال 6:تشخیص سرطان معده
در مجموع 178 بيمار مبتلا به سرطان معده به اين مطالعه وارد شدند. دامنه سني اين بيماران 28 تا 83 سال با ميانگين 58.5 بود. 20 % بيماران كم تر از 48 سال داشتند و تنها 5% بيماران سن پايين 35 سال داشتند و ميانه سن بيماران 59 سال بود. 73 % بيماران مرد بودند. 63.5% بيماران در انتهاي مطالعه هنوز زنده بودند. 1 هنوز به مرحله متاستاز نرسيده بودند و 73 % بيماران اندازه تومور آن ها بيش تر از 35 ميلي متر بوده است. اطلاعات زیر نتيجه بيزي را براي عوامل موثر بر بقاي بيماران مبتلا به سرطان معده نشان ميدهد.
نسبت خطر زن 0.079 و مرد 1
نسبت خطر برای کسانیکه متاستاز دارند 1.5 وآنهایکه ندارند 1
نسبت خطر برای اندازه تومور کمتر از35 میلی متر 1 و برای اندازع بیش از 35 میلی متر 2.33
مثال 7 : شركت بيمه اي بر اين باور است كه افراد را مي توان به دو گروه تقسيم كرد : گروهي كه مستعد تصادف اند و گروهي كه نيستند . آمارهاي اين شركت نشان مي دهد كه يك فرد مستعد تصادف، با احتمال 0.4 در ظرف يك دوره يك ساله معين خواهد داشت، در صورتي كه اين احتمال براي يك فرد فاقد اين استعداد به0.2 كاهش مي يابد. اگر فرض كنيم كه 30 درصد جامعه اي مستعد تصادف است، احتمال اين كه بيمه گذار جديدي در ظرف مدت يك سال از قرارداد بيمه، يك تصادف داشته باشد چقدر است؟
(0.4)(0.3)+(0.2)(0.7)=0.26
مثال 8 : فرض كنيد بيمه گذار جديدي در ظرف يك سال از خريد بيمه يك تصادف دارد . احتمال اين كه اين فرد مستعد تصادف باشد چقدر است؟
(0.3)(0.4)/26=6/13
مثال 9 :فدر يك كلينيك روانپزشكي مددكاران اجتماعي بقدري گرفتاراند كه بطور متوسط تنها ٦٠ درصد از بيماران جديد
بالقوه كه به كلينيك تلفن مي زنند موفق مي شوند بلافاصله با يك مددكار اجتماعي مكالمه كنند . از 40 درصد بقيه خواسته مي شود كه شماره تلفن خود را بدهند . حدود 75 درصد موارد را يك مددكار اجتماعي در همان روز تلفني پاسخ مي دهد و 25 درصد بقيه را روز بعد . تجربه در كلينيك نشان مي دهد احتمال اين كه تماس گيرنده اي از كلينيك به منظور مشاوره ديدن كند 0.8 است اگر وي بلافاصله موفق به مكالمه با يك مددكار اجتماعي شود،اگر پاسخ تلفن بيمار همان روز يا روز بعد داده شود اين احتمال به ترتيب برابر 0.6 و 0.4 است. چه درصدي از بيماران كه تماس تلفني مي گيرند براي مشاوره از كلينيك ديدن ميكنند؟
v: تماس گيرنده از كلينيك براي مشاوره ديدن ميكند
I: تماس گیرنده بلافاصله با یک مدد کار مکالمه میکند
s : به تماس گیرنده در همان روز پاسخ داده می شود
f: به تماس گیرنده روز بعد پاسخ داده می شود
p(v)=0.8*0.6+0.6*0.4*0.75+0.4*0.4*0.25=0.70
p(s)=0.4*0.75
p(f)=0.4*0.25
مثال 10 : هواپيمايي گم شده و گمان مي رود كه در يكي از مناطبق سه گانه ممكن به زمين نشسته باشد. فرض کنید a احتمالي را كه اين هو ا پيما به دنبال جستجوي منطقه iام پيدا شود در صورتيكه هواپيما در حقيقت در اين منطقه است، i=1,2,3 است، نشان میدهد.
احتمال شرطي كه اين هواپيما در منطقه ii ُام، ( ١ ٢ ٣ ) باشد چقدر است، در صورتي كه مي دانيم جستجوي منطقه ١ بدون نتيجه بوده است؟
فرض كنيد ، ١ ٢ ٣ ، پيشامدي را كه اين هواپيما در منطقه ُام باشد، و i پيشامدي را كه جستجوي منطقه ١ ناموفق بوده است نشان مي دهد. از فرمول بيز داريم
p(r1|e)=(ai)/(ai+2)
برای j=2,3 داریم
p(rj|e)=1/(aij+2)