هوش مصنوعی شاهد رشد چشمگیری در پر کردن شکاف بین تواناییهای انسان و ماشین بوده است. محققان و علاقه مندان به طور یکسان، روی جنبههای متعددی از این رشته کار میکنند تا بتوانند اتفاقات شگفت انگیزی را رقم بزنند. یکی از این حوزهها، حوزه بینایی کامپیوتر است. پیشرفتهای بینایی رایانهای با یادگیری عمیق در گذشت زمان، عمدتا بر روی یک الگوریتم خاص یک شبکه عصبی کانالوشن، ساخته و تکمیل شده است.
شبکه عصبی کانولوشن برای یافتن الگوهایی در تصاویر برای تشخیص اشیا، چهرهها و صحنهها مفید میباشد. آنها همچنین میتوانند برای طبقه بندی دادههای غیر تصویری مانند: صدا، دادههای سیگنال کاملا موثر باشند. برنامههایی که به تشخیص اشیا و دید کامپیوتری نیاز دارند. مانند: وسایل نقلیه خودران و برنامههای تشخیص چهره به شدت به CNNها متکی هستند.
توضیحی مختصر درباره بینایی کامپیوتر
بینایی کامپیوتری حوزهای از هوش مصنوعی است که به رایانهها و سیستمها این قابلیت را میدهد؛ تا اطلاعات معنا داری را از تصاویر دیجیتال، ویدئوها و سایر ورودیهای بصری به دست آورند. و بر اساس آن اطلاعات، اقداماتی انجام دهند یا توصیههایی را ارائه کنند. هوش مصنوعی رایانهها را قادر میسازد فکر کنند، بینایی رایانه آنها را قادر میسازد که ببینند، مشاهده کنند و بفهمند.
انواع مختلفی از شبکههای عصبی وجود دارد. به عنوان مثال: شبکههای عصبی مکرر که معمولا برای پردازش زبان طبیعی و تشخیص گفتار استفاده میشوند. در حالی که شبکههای عصبی کانولوشنال (یا CNN) اغلب برای طبقه بندی و وظایف بینایی کامپیوتری مورد استفاده قرار میگیرند.
تعریف شبکه عصبی کانولوشن
شبکه عصبی کانولوشن (CNN) نوعی شبکه عصبی مصنوعی میباشد. که در تشخیص و پردازش تصویر استفاده میشود و به طور خاص برای پردازش دادههای پیکسلی طراحی شده است. شبکه عصبی سیستمی از سخت افزار و یا نرم افزار میباشد. که از عملکرد نورونها در مغز انسان الگوبرداری شده است. CNN نورونهای خود را بیشتر شبیه نورونهای لوب فرونتال، ناحیهای که مسئول پردازش محرکهای بصری در انسان و سایر حیوانات است، مرتب میکند. لایههای CNN شامل یک لایه ورودی، یک لایه خروجی و یک لایه پنهان است.
دستور کار در زمینه شبکههای عصبی کانولوشن این است که ماشینها را قادر سازد تا جهان را مانند: انسانها ببینند، آن را به شیوهای مشابه درک کنند و حتی از این دانش برای بسیاری از وظایف مشابه استفاده کنند. مانند: تشخیص تصویر و ویدئو، تجزیه و تحلیل و طبقه بندی تصویر و باز آفرینی رسانهها مورد استفاده قرار میگیرد. شبکه عصبی کانولوشن (CNN)، یک معماری شبکه برای یادگیری عمیق است که مستقیما از دادهها یاد میگیرد. شبکههای عصبی کانولوشنال زیر مجموعهای از ادامه مطلب...