قطعه‌بندی معنایی(Semantic Segmentation) تصاویر توسط کتابخانه جدید دانشگاه MIT

اگر با تصاویر و پردازش تصویر کار کرده باشید احتمالا به قطعه‌بندی تصاویر(Image Segmentation) به عنوان یکی از مسائل این حوزه برخورد کرده باشید. در قطعه‌بندی تصاویر، به دنبال روش‌های مختلف شناسایی تکه‌های مختلف از یک تصویر هستیم. مثلا اگر یک آدم در میان چند درخت در یک فضای سبز قرار دارد، قطعه‌بندی تصاویر باید بتواند آدم، درخت‌ها و فضای‌سبز را به عنوان عناصر جداگانه‌ای درک کند. این کار کاربرد فراوانی در پردازش تصویر دارد.

جدیدترین تحقیقات دانشگاه MIT منجر به ارائه یک مقاله همراه با ساخت یک کتابخانه در نرم‌افزار متلب(Matlab) شده است. این روش که به قطعه‌بندی نرم معنایی(Semantic Soft Segmentation) معروف است، می‌تواند با استفاده از شبکه‌های عصبی عمیق CNN، قطعه‌های مختلف تصاویر را شناسایی کرده و دقت عملیات قطعه‌بندی را افزایش دهد. به تصویر زیر نگاه کنید.

برای مثال تصویر سگ را در سمت چپ نگاه کنید. این الگوریتم توانسته است که تصویر یک سگ را با کیفیت بسیار بالا در عکس سوم از چپ برش دهد به گونه‌ای که میتوان تصویر سگ را به نوعی جدا شده از تصویر اصلی دانست.

برای این‌کار، محققان دانشگاه MIT از روش شبکه‌های عصبی عمیق CNN استفاده کرده‌اند که جزئیات بیشتر را می‌توانید در این مقاله مشاهده کنید. همچنین اطلاعات بیشتر درباره این پروژه در وب‌سایت اصلی این پروژه و یا از این‌جا اطلاعاتی به دست بیاورید. سورس کد نرم‌افزار متلب برای این پروژه را می‌توانید از این‌جا مشاهده کنید.

قطعه‌بندی معنایی(Semantic Segmentation) تصاویر توسط کتابخانه جدید دانشگاه MIT

مجموعه داده ای در یادگیری ماشین چیست؟

زمانی که هوش مصنوعی ،بشر را از ویروس کرونا نجات می دهد!

دیپ فیک چیست؟