مقدمه‌ای بر کاربردهای یادگیری ماشین در پزشکی

این مقاله با نمونه‌های عملی به بررسی کاربردهای یادگیری ماشین در پزشکی می‌پردازد. در همین راستا، مقدمه‌ کوتاهی درباره یادگیری ماشین و موضوع نخست‌مان «رگرسیون» ارائه خواهیم کرد. لذا از پای‌چارم یا XCode IDE’s برای نمایش بهتر داده‌ها استفاده خواهد شد. پایتون بنا به دلیلی آشکار یکی از زبان‌های برنامه‌نویسی محبوب و پرکاربرد به شمار می‌رود، اما در برخی سناریوها زبان سوئیفت ترجیح داده شده است. الگوریتم قطعه‌بندی تصویر  ابزاری برای رادیولوژیست‌ها است. ابزاری نظیر این می‌تواند برای اهداف متعددی استفاده شود. دقت آن حدود %۹۲ ارزیابی شده است و می‌تواند در بخش‌های مختلفی مورد استفاده قرار گیرد.

۱. کمک به اولویت‌بندی موارد اضطراری و کمک به رادیولوژیست‌ها در شناسایی سریع ضایعه‌ها.

۲. تایید تشخیص برای پیشگیری از هر نوع تشخیص اشتباه.

۳. کمک به آموزش رادیولوژیست‌های جدید.

هنوز راه دور و درازی پیش روی‌مان قرار دارد تا یک الگوریتم جایگزینِ تجارب غنیِ متخصصان ارشد رادیولوژی شود. الگوریتم‌های یادگیری ماشین عملکرد بسیار خوبی در خودکارسازی برخی از کارها یا انجام تشخیص مقدماتی دارند، اما حتی اگر قرار باشد این الگوریتم‌ها در مورد بیماران واقعی به کار برده شود، ما از آمادگی کافی برای رویارویی با آن برخوردار هستیم. این ابزارهای پیشرفته می‌توانند دقت ۹/۹۹ درصدی را تضمین کنند، اما این اقدام چندین پیامد اخلاقی به همراه دارد. به این سناریو دقت کنید. تصور نمائید که الگوریتم بیماری GBM (کشنده‌ترین و تخاصمی‌ترین نوع تومور مغزی در بزرگسالان) را در بدن یک بیمار شناسایی می‌کند. تنها ۱۰ دقیقه بعد، رادیولوژیست می‌گوید: «اوه، متاسفم. هوش مصنوعیِ ما عارضه را اشتباه تشخیص داده است. این بیمار تومور مغزی دارد، اما به غده‌ پرده‌های مغز شباهت دارد. اگر بیمار علائم شدیدی داشته باشد، تشخیص جراحی به تنهایی کفایت می‌کند.» حال بیایید قدری به خود بیمار بپردازیم. بیمار در طی آن ۱۰ دقیقه تصور می‌کرد که فقط ۱۲ ماه زنده خواهد بود. شما فکر می‌کنید در طی آن ۱۰ دقیقه چه فعل و انفعالاتی در مغز بیمار رخ داده است؟ چه احساسی داشته است؟ شاید آن زمانِ کم برای او اندازه یک عمر گذشته باشد. چنین خطاهایی جایز نیست و امید است تا کاربردهای یادگیری ماشین در پزشکی آن‌ها را کاهش داده یا از بین ببرد.

پس همان‌طور که ملاحظه می‌کنید، رادیولوژیست‌ها برای مدتی طولانی کنار ما خواهند بود. البته رادیولوژیست‌هایی که از هوش مصنوعی استفاده کنند، مدت زمان بیشتری در کنارمان خواهند بود. رادیولوژی به دلیل توانایی بالا در پردازش تصاویر یکی از بهترین حوزه‌ها برای بکارگیری هوش مصنوعی به حساب می‌آید، اما نمونه‌ کاربردهای متعددی در همه تخصص‌ها (از پوست‌شناسی گرفته تا چشم‌پزشکی) یافت می‌شود. از این رو، کاربردهای یادگیری ماشین در پزشکی بسیار زیاد و مهم هستند.  البته یکی از دشوارترین حوزه‌ها نیز می‌باشد. مقاله حاضر قصد دارد به همکاران و دانشجویان پزشکی کمک کند تا یادگیری ماشین را درک کرده و یاد گیرند. بی‌تردید، نیازی نیست حتماً پزشک یا دانشجوی پزشکی باشید تا این مقاله‌ها را بخوانید. چند نمونه می‌تواند به درک بهتر این مسائل کمک کند.

رگرسیون

این مقاله درباره کاربردهای یادگیری ماشین در پزشکی است؛ اما بگذارید همین اول کار شفاف‌سازی کنیم. رگرسیون چیست؟ چرا به آن نیاز داریم؟ چطور باید از آن استفاده کرد؟ در ساده‌ترین حالت، می‌توان رگرسیون را به عنوان فرایند حذف رابطه میان یک متغیر وابسته و یک یا چند متغیر مستقل تعریف کرد. حال، بیایید این موضوع را با یک مثال حقیقی توضیح دهیم.

بازیافت ضربان قلب

می‌خواهیم نخستین عبارت پزشکی‌مان را در این بخش به کار ببریم. بازیافت ضربان قلب به کاهش ضربان قلب در یک دقیقه پس از توقف فعالیت اشاره می‌کند. این شاخص نشان می‌دهد که فرد از سلامت قلبی و عروقی برخوردار است. بنابراین، تحقیقات زیادی درباره این موضوع انجام شده و کماکان نیز ادامه دارد. ما یک آزمایش ECG بر روی بیمار انجام می‌دهیم و بر تغییرات ضربان قلب یک دقیقه پس از پایان آزمایش نظارت می‌کنیم. سپس، بازیافت ضربان قلب بیمار را مقایسه می‌کنیم. انتظار داریم ضربان بیمار در بازه زمانی معینی به وضعیت آرامش بازگردد. بر اساس میانگین ضربان قلب و مقادیر ضربان مشاهده شده در طول آزمایش، می‌دانیم که ضربان بیمار در طول ۱ دقیقه چه شرایطی را تجربه خواهد کرد. مقدار نرخ بازیافت اندازه‌گیری شده همسو با این پارامترها بوده و شاخص مهمی برای سلامت قلب بیمار می‌باشد. مقاله منتشر شده در مجله «انجمن سلامت آمریکا» به ارزیابی بازیافت ضربان قلب پرداخته است.

محققان در یکی از مطالعات خود به بررسی مقدار بازیافت ضربان قلب در ۱۰، ۲۰، ۳۰، ۴۰ و ۵۰ ثانیه پس از توقف ورزش پرداختند. سن میانگین شرکت‌کنندگان مطالعه ۵۶ نفر بود و %۴۵ آنان مذکر بودند. در طی دوره پیگیری ۶ ساله، ۵۳۶ نفر از شرکت‌کنندگان فوت کردند (۳۹ نفر از فوتی‌ها از بیماری قلبی عروقی رنج می‌بردند). محققان پس از تحلیل‌های چندمتغیری، بررسی ظرفیت تمرین‌های هوازی؛ عوامل ریسک قلبی عروقی و عوامل مرتبط با مرگ توانستند بازیافت ضربان قلب در ۱۰ ثانیه را به عنوان نشانه‌ای برای پیش‌بینی عوامل مرگ و میر بیماری‌های قلبی عروقی شناسایی کنند. بر اساس یافته‌های این مطالعه، اثرات بازیافت ضربان قلب در زمانی که بلافاصله پس از توقف ورزش اندازه گرفته شد، بسیار چشمگیر و معنادار بودند. علاوه بر این، ارتباط تغییر ضربان قلب بین ۱۰ ثانیه الی ۱ دقیقه پس از توقف با میزان مرگ و میر به بازیافت ضربان قلب در ۱۰ ثانیه بستگی داشت. آن‌طور که در این مثال ملاحظه می‌کنید، رابطه‌ای میان تغییر ضربان قلب و سایر پارامترهای موجود در این سناریو وجود دارد. محققان از تحلیل رگرسیون برای شناسایی آن روابط استفاده کردند. افزون بر این، آنان متغیرهای مرتبط را شناسایی کرده و تمرکزشان را بر موثرترین متغیرها معطوف کردند.

دلیل استفاده از رگرسیون چیست؟

در ادامه بحث درباره کاربردهای یادگیری ماشین در پزشکی باید به دلیل استفاده از رگرسیون اشاره کنیم. استفاده از تحلیل رگرسیون دو دلیل دارد: پیش‌بینیِ مقدار یا بررسی رابطه عِلّی میان متغیرهای متغیرهای وابسته و مستقل. پیش از توضیح متغیرهای وابسته و مستقل، باید تفاوت میان پیش‌بینی و ارزیابی پیامدها را شفاف‌سازی کنیم. پیش‌بینی  در علم آمار به اظهارنظر درباره رویدادهای آتی اشاره می‌کند. این پیش‌بینی‌ها غالباً (نه همیشه) بر پایه‌ی تجربه یا دانش قرار دارند. تخمین رویدادها یا پیامدها  به انجام پیش‌بینی بر اساس داده‌های گذشته و حال اطلاق می‌شود و عمدتاً با تحلیل روندهای موجود صورت می‌گیرد. در یادگیری ماشین، این واژگان به جای یکدیگر نیز استفاده می‌شوند. تا بدین‌جای کار درباره تحلیل رگرسیون صحبت کردیم، اما هنوز متغیرهای وابسته و مستقل را توضیح نداده‌ایم. فرض کنید قصد داریم آزمایشی را بر روی عده‌ای از بیماران انجام دهیم که عمل جراحی مغز و اعصاب دارند. آزمایش‌کننده، متغیر مستقل را دستکاری یا تغییر می‌دهد. احتمال می‌رود این اقدام به طور مستقیم بر متغیر وابسته تاثیر بگذارد. برای نمونه، شرکت‌کنندگان را در دو گروه دارو یا دارونما (متغیر مستقل) دسته‌بندی می‌کنیم تا تغییر شدت اضطراب‌شان (متغیر وابسته) را اندازه بگیریم.

متغیر وابسته در آزمایش اندازه گرفته می‌شود و به متغیر مستقل بستگی دارد. علائم افسردگی، نمونه‌ای از متغیر وابسته به شمار می‌رود که به متغیر مستقل بستگی دارد (یعنی درمان). پیش از اینکه لیستی از مدل‌های رگرسیون تهیه کنید، بیایید موضوع دیگری را شفاف‌سازی کنیم. چند مدل رگرسیون خطی و غیرخطی وجود دارد. رگرسیون خطی ساده به یک متغیر خطی نیاز دارد. مدل زمانی خطی است که هر کدام از عبارات یا ثابت باشند یا محصولی از یک پارامتر یا متغیر پیش‌بینی باشند. معادله خطی با جمع بستن نتایج هر عبارت ساخته می‌شود. لذا، معادله فقط یک شکل پایه به خود می‌گیرد:

در علم آمار، معادله رگرسیون (یا تابع) زمانی خطی است که در پارامترها خطی باشد. گفتیم که معادله باید در پارامترها خطی باشد، اما می‌توانید متغیرهای پیش‌بینی را به نحوی تغییر دهید که انحنا ایجاد شود. برای نمونه، می‌توانید از یک متغیر مربعی برای ایجاد منحنی U شکل استفاده نمائید. این مدل کماکان در پارامترها خطی است، اگرچه متغیر پیش‌بینی مربعی است. می‌توانید از فرم‌های تابعی معکوس و لگاریتم برای ایجاد منحنی‌های مختلف استفاده کنید. در زیر، نمونه‌ای از مدل رگرسیون خطی را مشاهده می‌کنید که از یک عبارت مربعی برای تطابق رابطه منحنی میان شاخص توده بدنی و درصد چربی بدن استفاده کرده است.

اگرچه معادله خطی یک شکل اصلی دارد، اما معادلات غیرخطی می‌توانند به اَشکال مختلفی درآیند. آسان‌ترین راه برای تعیین اینکه معادله غیرخطی است یا خیر، تمرکز بر خود عبارت «غیرخطی» است. اگر معادله با معیارهای تعریف شده در اسلاید قبلی سازگار نباشد، خطی نیست. این عامل به شکل‌های مختلفی بیان می‌شود و به همین دلیل است که رگرسیون غیرخطی دارای انعطاف‌پذیرترین کارکرد در مواجهه با منحنی است. مدل‌های رگرسیون متعددی وجود دارد. اما مقاله حاضر به متداول‌ترین مدل‌ها اشاره کرده است. بنابراین، شش مدل رگرسیون زیر در ویدئوها بررسی خواهند شد.

• رگرسیون خطی ساده

• رگرسیون خطی چندگانه

• رگرسیون چنداسمی

• بردار پشتیبان برای رگرسیون

• طبقه‌بندی درخت تصمیم

• طبقه‌بندی جنگل تصادفی

انواع کاربردهای هوش مصنوعی در صنایع مختلف را در هوشیو بخوانید.

منبع: هوشیو