استفاده از یادگیری انتقال برای تشخیص سرطان سینه

شکل ۱. اسلاید بافتی حاوی سلول‌های تومور سرطانی
شکل ۱. اسلاید بافتی حاوی سلول‌های تومور سرطانی
منتشر‌شده در: towardsdatascience به تاریخ ۳۱ می ۲۰۲۱
لینک منبع: Using Transfer Learning for Breast Cancer Detection

مقدمه

هر ساله بیش از 230،000 بیمار مبتلا به سرطان پستان در ایالات متحده وابسته به متاستاز بودن سرطان هستند. تشخیص متاستازیس توسط آسیب‌شناسانی انجام می‌شود که در حال بررسی گسترش‌های بزرگ بافت‌های بیولوژیکی هستند. این فرآیند کار محور و مستعد خطا است. منبع

هدف ما در این پروژه، پیاده‌سازی یک مدل طبقه‌بندی متاستاز چندمقیاسی است که در مقاله تشخیص آنزیم‌های سرطان در تصاویر آسیب‌شناسی Gigapxel ارائه شده‌است.

مجموعه داده‌ها

ما از داده‌های اسلایدهای چند گیگا پیکسلی CAMELYON-۱۶ استفاده می‌کنیم. مجموعه‌ای از ۲۲ اسلاید با تومورهای قابل‌توجه از مجموعه داده‌های اصلی نمونه‌گیری شدند. هر اسلاید دارای یک ماسک متناظر است که ناحیه تومور را علامت‌گذاری می‌کند. ما می‌توانیم به حدود ۹ سطح بزرگنمایی دسترسی داشته باشیم.

شکل ۲. تصاویر چند بزرگنمایی تومور (پرونده‌های tif) منبع
شکل ۲. تصاویر چند بزرگنمایی تومور (پرونده‌های tif) منبع

هر تصویر چند مقیاسی یکی پس از دیگری با یک سیستم مختصات ثابت ذخیره می‌شود تا به کاربران اجازه دهد به هر قطعه تصویری از هر بزرگنمایی دسترسی داشته باشند.

ما از کتابخانه OpenSlide C با اتصالات پایتون استفاده می کنیم تا به طور موثر به پرونده های فشرده شده با اندازه گیگاپیکسل دسترسی داشته باشیم.

آماده‌سازی داده‌ها

به عنوان اولین گام برای تولید داده‌های آموزشی برچسب‌دار، ما از یک رویکرد پنجره کشویی برای لغزش بر روی سطوح زوم بالاتر و ایجاد تصاویر برچسب دار از بخش‌های اسلاید استفاده می‌کنیم، که بعدا برای آموزش و آزمایش از آن استفاده خواهیم کرد.

ما از رویکرد دنبال شده در مقاله استفاده می‌کنیم، که در آن یک پنجره مرکزی را تعریف می‌کنیم، و اگر مرکز شامل حداقل ۱ پیکسل به عنوان تومور باشد، تصویر را برچسب می‌زنیم تا حاوی سلول‌های توموری باشد.

اندازه پنجره و اندازه مرکز به ترتیب ۸۰ و ۵۰ انتخاب شده‌اند. در نهایت، برای چند مقیاسی کردن داده‌های آموزشی، ما یک نسخه با اندازه مشابه از بخش تصویر اصلی ایجاد می‌کنیم. نسخه زوم شده برای ارائه یک زمینه در سطح کلان برای مدل طبقه‌بندی استفاده می‌شود. ما داده‌ها را با استفاده از یک رویکرد چند مقیاسی تولید کرده‌ایم و از دو بزرگنمایی مختلف برای آماده‌سازی مجموعه داده استفاده کرده‌ایم.

شکل ۳. جفت تصاویر چند مقیاسی
شکل ۳. جفت تصاویر چند مقیاسی

جمع کردن داده‌ها

ما از تکنیک‌های مختلف افزایش داده برای تکمیل داده‌های آموزشی خود و قوی‌تر کردن مدل خود استفاده کرده‌ایم.

چرخش ها و جابه‌جایی‌های متعامد

ما افزوده‌های متعامد را برای معرفی تغییرناپذیری دورانی معرفی کردیم زیرا یک اسلاید می‌تواند در هر یک از این جهت گیری ها مورد بررسی قرار گیرد.

  • روندهای متعامد تصادفی
  • جابه‌جایی‌های افقی و عمودی تصادفی

آشفتگی رنگ

برای اینکه مدل خود را در مقابل نور و قدرت رنگ مقاوم کنیم، رنگ‌ها را به صورت زیر مختل کردیم.

  • روشنی با حداکثر دلتای ۶۴ / ۲۵۵
  • غلظت با حداکثر سرعت ۰.۲۵
  • پرواز با حداکثر دلتای ۰.۰۴
  • تضاد با حداکثر دلتای ۰.۷۵

روش‌شناسی

ما از یک مدل V3 ورودی چندبرجی برای استفاده از تصاویر چندمقیاسی برای طبقه‌بندی استفاده کردیم. ما فقط لایه‌های بالایی را به خوبی تنظیم می‌کنیم زیرا اینها لایه‌هایی هستند که ویژگی‌های سطح بالاتر را یاد می‌گیرند و نتایج می‌توانند تا حد زیادی با تنظیم دقیق این لایه‌ها براساس مجموعه داده‌های ما بهبود یابند. برای کسب اطلاعات بیشتر این پست وبلاگ را توسط Google AI بخوانید.

  • معماری مورد استفاده: دریافت v3 (چند مقیاسی) تنظیم دقیق برای لایه‌های ۱۵۰
  • سایه اولیه: شبکه تصویر
  • تلفات مورد استفاده: از دست دادن آنتروپی رشته دودویی
  • بزرگنمایی: سطوح ۲ و ۳
شکل ۴. سرآیند مدل چند مقیاسی
شکل ۴. سرآیند مدل چند مقیاسی

نتایج

ما در نهایت مدل خود را براساس یک اسلاید تومور جدید تست کردیم. پس از پیش‌پردازش اسلاید تومور و پیش‌بینی، ما با استفاده از خروجی مدل یک نقشه داغ ایجاد کردیم.

شکل ۵. ماسک واقعی در مقابل ماسک پیش‌بینی‌شده
شکل ۵. ماسک واقعی در مقابل ماسک پیش‌بینی‌شده
شکل ۶. نمودار پیش‌بینی
شکل ۶. نمودار پیش‌بینی

۱. مورد AUC: مقدار ۰.۹۷۶۵۹

۲. آستانه: ۰.۴۸۴۲۹

۳. حساسیت: ۰.۹۷۴۷۸

۴. ویژگی: ۰.۹۵۰۰۴

۵. پوشش: ۰.۹۷۲۷۷

۶. دقت: ۰.۲۲۲۷۵

  • ما می‌بینیم که همه نواحی تومور به درستی شناسایی شده‌اند.
  • ما می توانیم یک فراخوان بسیار جدی ایجاد کنیم (که در زمینه پیش آگهی پزشکی مهم است)
  • یادگیری انتقال با تنظیم دقیق در تولید نتایج خوب با آموزش فشرده محاسباتی کم‌تر موثر بود.
  • به نظر می‌رسد که این مدل پیش‌بینی‌های کمتری در مورد مرزها انجام می‌دهد.

پیشرفت‌های آینده

  • با دسترسی به GPU بهتر و ماشین‌های RAM بالا، از تصاویر با بزرگنمایی کم‌تر استفاده کنید.
  • برای بهبود دقت و معرفی عدم تغییر چرخشی، از میانگین پیش‌بینی با محاسبه پیش‌بینی در هر جهت‌گیری احتمالی اسلاید استفاده کنید.
  • از تکنیک‌های تفکیک پیش‌زمینه و پس‌زمینه بهتر برای بهبود عملکرد مرزها استفاده کنید.

شما می‌توانید کل کد پروژه را در اینجا پیدا کنید.

این متن با استفاده از ربات ترجمه مقاله دیتاساینس ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.
مقالات لینک‌شده در این متن می‌توانند به صورت رایگان با استفاده از مقاله‌خوان ترجمیار به فارسی مطالعه شوند.