ویرگول
ورودثبت نام
محمدرضا محمدی
محمدرضا محمدی
خواندن ۷ دقیقه·۴ سال پیش

قضیه بیز و کابرد آن در هوش مصنوعی

قضیه بیز (نام این قضیه به افتخار دانشمند انگلیسی آمار «توماس بیز» (Thomas Bayes) که در سال‌ 1763 مقاله‌ای با این موضوع منتشر کرد، انتخاب شده است.) روشی برای دسته‌بندی پدیده‌ها، بر پایه احتمال وقوع یا عدم وقوع یک پدیده‌است و در نظریه احتمالات با اهمیت و پرکاربرد است. اگر برای فضای نمونه‌ای مفروضی بتوانیم چنان افرازی انتخاب کنیم که با دانستن اینکه کدامیک از پیشامدهای افراز شده رخ داده‌است، بخش مهمی از عدم قطعیت تقلیل می‌یابد.

این قضیه از آن جهت مفید است که می‌توان از طریق آن، احتمال یک پیشامد را با مشروط کردن نسبت به وقوع یا عدم وقوع یک پیشامد دیگر محاسبه کرد. در بسیاری از حالت‌ها، محاسبهٔ احتمال یک پیشامد به صورت مستقیم کاری دشوار است. با استفاده از این قضیه و مشروط کردن پیشامد مورد نظر نسبت به پیشامد دیگر، می‌توان احتمال مورد نظر را محاسبه کرد.

بدون شک قضیه بیز (Bayes Theorem) یکی از مهم‌ترین اصول آمار و احتمالات است که بخش قابل توجهی از دانش مدرن ما در حوزه‌های مختلف، به طور خاص در حوزه هوش مصنوعی و مهندسی کنترل، بر آن استوار است. پروازهای امن در خطوط هوایی، سیستم‌های نظارتی و کنترلی شبکه برق، روبات‌های متحرک، موتورهای جستجو و ده‌ها کاربرد دیگر در زندگی روزمره ما، بدون این قانون عملا نمی‌توانستند وجود داشته باشند. بخش قابل توجهی از دانش هوش مصنوعی، که وظیفه آن توسعه هوشمندی سیستم‌های کامپیوتری است، بر روی قانون بیز و آمار بیزی بنا شده است. به عقیده بسیاری از دانشمندان علوم کامپیوتر، اساسی‌ترین معادله توصیف کننده هوش، همین قانون بیز است.

اگر فضای نمونه ای توسط B1,B2,…,BnB1,B2,…,Bn افراز شده باشد، بطوری که P(Bi)>0 و P(Bi)>0 آنگاه برای هر پیشامد A می‌توانیم بنویسیم:

P(Bj|A)=P(Bj)P(A|Bj)/P(A)


مثال 1 : سه سبد در اختیار داریم که در سبد اول دو مهره سفید و یک مهره قرمز و در سبد دوم یک مهره سفید و یک مهره قرمز و در سبد سوم نیز دو مهره سفید و سه مهره قرمز قرار دارد. اگر بدانیم مهره‌ای که از سبد خارج شده، سفید است، احتمال اینکه این مهره از سبد سوم خارج شده باشد چقدر است؟

P(B3|A)=(P(A|B3)P(B3))/ (P(A|B1)P(B1)+P(A|B2)P(B2)+P(A|B3)P(B3))=12/47


مثال 2:

در یک آزمایش پزشکی، دیابت (مرض قند) یک فرد قندی با احتمال 0.8 به درستی تشخیص داده می‌شود و با احتمال 0.9 نیز برای افراد سالم نتیجه عدم ابتلا به این بیماری اعلام می‌شود. اگر از هر 10000نفر مردم جامعه 2 نفر دچار بیماری دیابت باشند (احتمال پیشین)، احتمال اینکه نتیجه مثبت آزمایش یک فرد، بیانگر ابتلا به مرض قند باشد چقدر است (احتمال پسین)؟

با توجه به مسئله، جامعه آماری یا فضای نمونه به دو گروه بیماران قندی و سالم طبقه‌بندی (افراز) شده است. حال اگر B را پیشامد ابتلا به دیابت و B′B′ را عدم ابتلا به بیماری دیابت در نظر بگیریم و A پیشامد این باشد که نتیجه آزمایش مثبت است، اطلاعات زیر توسط مسئله داده شده.

A|B: پیشامد اینکه نتیجه آزمایش مثبت برای فرد مبتلا به دیابت باشد. یعنی آزمایش نشان دهد که فرد دیابتی مبتلا به بیماری دیابت است.

A′|B′A′|B′: پیشامد اینکه نتیجه آزمایش منفی مربوط به فرد سالم باشد. یعنی آزمایش نشان دهد که فرد سالم به دیابت دچار نیست. در نتیجه خواهیم داشت:

P(A|B)=0.8, P(A′|B′)=0.9, P(B)=0.0002 P(A|B)=0.8, P(A′|B′)=0.9, P(B)=0.0002

حال با استفاده از قضیه بیز داریم: P(B|A)=0.0016


مثال 3 :

مقایسه احتمال ارتکاب جرم در مجردها و متاهل ها:

  • مجرد بودن: S
  • متأهل بودن: M
  • مجرم بودن: C
  • مجرم نبودن: N

فرض کنید ۳۵ درصد افرادی که به سن ازدواج رسیده‌اند، هنوز مجرد هستند؛ ۶۵ درصد باقی مانده هم، ازدواج کرده و متأهل هستند. ضمنا، فرض کنید طبق آمار، ۵ درصد از مجردها یک جرم خاص را مرتکب می‌شوند؛ اما همین کسر در میان متأهلین، ۳ درصد است. یعنی احتمال ارتکاب جرم میان متأهل‌ها، کمتر است

P(C) = P(C|S)×P(S) + P(C|M)×P(M) = ۰/۰۳۷
P(S|C) = P(C|S)×P(S)÷P(C) ≃ ۰/۴۷۳

P(M|C) = P(C|M)×P(M)÷P(C) ≃ ۰/۵۲۷

مثال 4 :

تست سرطان سینه :

  • 1% از زنان سرطان سینه دارند (و از این رو 99% ندارند)
  • 80% از تست‌های ماموگرافی در صورت وجود سرطان می‌توانند آن را تشخیص دهند
    (و از این رو 20% نمی‌توانند آن را تشخیص دهند)
  • 9.6% از تست‌های ماموگرافی در مواردی که سرطان وجود نداشته باشد، منجر به اعلام نتایج مثبت نادرست می‌شوند
    (و از این رو 90.4% مورد منفی را به درستی نشان می‌دهند)

حتمال یک رویداد از تقسیم تعداد راه‌هایی که ممکن است رخ بدهد بر همه خروجی‌های ممکن به دست می‌آید:

احتمال این که فردی واقعاً یک نتیجه مثبت داشته باشد برابر با 0.008 است.

احتمال این که هر گونه نتیجه مثبتی داشته باشد، برابر است با احتمال یک مثبت درست به علاوه احتمال مثبت نادرست یعنی (0.008 + 0.09504 = 0.10304)

بنابراین احتمال وجود سرطان در صورت مثبت بودن نتیجه برابر خواهد بود با 0.008/0.10304 = 0.0776 یا در حدود 7.8 درصد.


مثال 5 :

فرض کنید در بخش پایانی مسابقه ای، شرکت کننده باید جایزه ای را که پشت یکی از سه در، پنهان شده با حدس زدن درِ مربوطه پیدا کند. چون هیچ اطلاعاتی درباره ی مکان پنهان شدن جایزه وجود ندارد، احتمال وجود جایزه پشت تمامی درها از دید شرکت کننده، یکسان و برابر با 1/3 است.
حال اگر مجری با کسر چند امتیاز از شرکت کننده، یک راهنمایی به او بکند، مثلاً یکی از درها را حذف کند، چه تغییری در احتمال وجود جایزه پشت دو درِ باقی مانده بوجود می آید؟ آیا احتمال وجود در پشت آن دو در باقی مانده، همان 1/3 باقی می ماند؟
ما دنبال توزیع احتمال وجود جایزه پشت درها هستیم. در ابتدای کار:

پس احتمال اولیه برای همه درها مساوی است. وقتی ما یک اطلاعات جدید یا یک مشاهده داریم (که آن را y مینامیم)، توزیع احتمال روی xi ها تغییر میکند. در واقع اگر بدانیم که در سوم پوچ است، احتمال x3 برابر صفر خواهد بود و احتمال x1 و x2 با یکدیگر برابر و هر یک برابر 1/2 خواهد شد.


مثال 6:تشخیص سرطان معده

در مجموع 178 بيمار مبتلا به سرطان معده به اين مطالعه وارد شدند. دامنه سني اين بيماران 28 تا 83 سال با ميانگين 58.5 بود. 20 % بيماران كم تر از 48 سال داشتند و تنها 5% بيماران سن پايين 35 سال داشتند و ميانه سن بيماران 59 سال بود. 73 % بيماران مرد بودند. 63.5% بيماران در انتهاي مطالعه هنوز زنده بودند. 1 هنوز به مرحله متاستاز نرسيده بودند و 73 % بيماران اندازه تومور آن ها بيش تر از 35 ميلي متر بوده است. اطلاعات زیر نتيجه بيزي را براي عوامل موثر بر بقاي بيماران مبتلا به سرطان معده نشان ميدهد.

نسبت خطر زن 0.079 و مرد 1

نسبت خطر برای کسانیکه متاستاز دارند 1.5 وآنهایکه ندارند 1

نسبت خطر برای اندازه تومور کمتر از35 میلی متر 1 و برای اندازع بیش از 35 میلی متر 2.33


مثال 7 : شركت بيمه اي بر اين باور است كه افراد را مي توان به دو گروه تقسيم كرد : گروهي كه مستعد تصادف اند و گروهي كه نيستند . آمارهاي اين شركت نشان مي دهد كه يك فرد مستعد تصادف، با احتمال 0.4 در ظرف يك دوره يك ساله معين خواهد داشت، در صورتي كه اين احتمال براي يك فرد فاقد اين استعداد به0.2 كاهش مي يابد. اگر فرض كنيم كه 30 درصد جامعه اي مستعد تصادف است، احتمال اين كه بيمه گذار جديدي در ظرف مدت يك سال از قرارداد بيمه، يك تصادف داشته باشد چقدر است؟

(0.4)(0.3)+(0.2)(0.7)=0.26


مثال 8 : فرض كنيد بيمه گذار جديدي در ظرف يك سال از خريد بيمه يك تصادف دارد . احتمال اين كه اين فرد مستعد تصادف باشد چقدر است؟

(0.3)(0.4)/26=6/13



مثال 9 :فدر يك كلينيك روانپزشكي مددكاران اجتماعي بقدري گرفتاراند كه بطور متوسط تنها ٦٠ درصد از بيماران جديد

بالقوه كه به كلينيك تلفن مي زنند موفق مي شوند بلافاصله با يك مددكار اجتماعي مكالمه كنند . از 40 درصد بقيه خواسته مي شود كه شماره تلفن خود را بدهند . حدود 75 درصد موارد را يك مددكار اجتماعي در همان روز تلفني پاسخ مي دهد و 25 درصد بقيه را روز بعد . تجربه در كلينيك نشان مي دهد احتمال اين كه تماس گيرنده اي از كلينيك به منظور مشاوره ديدن كند 0.8 است اگر وي بلافاصله موفق به مكالمه با يك مددكار اجتماعي شود،اگر پاسخ تلفن بيمار همان روز يا روز بعد داده شود اين احتمال به ترتيب برابر 0.6 و 0.4 است. چه درصدي از بيماران كه تماس تلفني مي گيرند براي مشاوره از كلينيك ديدن ميكنند؟

v: تماس گيرنده از كلينيك براي مشاوره ديدن ميكند

I: تماس گیرنده بلافاصله با یک مدد کار مکالمه میکند

s : به تماس گیرنده در همان روز پاسخ داده می شود

f: به تماس گیرنده روز بعد پاسخ داده می شود

p(v)=0.8*0.6+0.6*0.4*0.75+0.4*0.4*0.25=0.70

p(s)=0.4*0.75

p(f)=0.4*0.25






مثال 10 : هواپيمايي گم شده و گمان مي رود كه در يكي از مناطبق سه گانه ممكن به زمين نشسته باشد. فرض کنید a احتمالي را كه اين هو ا پيما به دنبال جستجوي منطقه iام پيدا شود در صورتيكه هواپيما در حقيقت در اين منطقه است، i=1,2,3 است، نشان میدهد.

احتمال شرطي كه اين هواپيما در منطقه ii ُام، ( ١ ٢ ٣ ) باشد چقدر است، در صورتي كه مي دانيم جستجوي منطقه ١ بدون نتيجه بوده است؟

فرض كنيد ، ١ ٢ ٣ ، پيشامدي را كه اين هواپيما در منطقه ُام باشد، و i پيشامدي را كه جستجوي منطقه ١ ناموفق بوده است نشان مي دهد. از فرمول بيز داريم

p(r1|e)=(ai)/(ai+2)

برای j=2,3 داریم

p(rj|e)=1/(aij+2)

بیزهوش مصنوعی
شاید از این پست‌ها خوشتان بیاید