هوش مصنوعی
هوش مصنوعی
خواندن ۳ دقیقه·۲ سال پیش

یادگیری عمیق

یکی از مهم‌ترین ویژگی‌های سامانه بینایی انسان، توانایی بازشناسی اشیاء با دقت و سرعت‌بالا و مستقل از تغییرات آن شئ در محیط‌های گوناگون است. این ویژگی همواره موردتوجه دانشمندان حوزه هوش مصنوعی و بینایی ماشین[1] بوده و باعث توسعه مدل‌های محاسباتی مختلفی با الگوبرداری از سازوکار این سامانه شده است.

روش­های مرسوم یادگیری ماشین در توانایی پردازش داده­ی اصلی در حالت خام خود محدودیت داشتند. برای دهه­ ها ساخت یک سیستم تشخیص ­دهنده الگو[2] یا یک سیستم یادگیرنده، نیازمند یک مهندسی دقیق برای طراحی استخراج­کننده ویژگی[3] مناسب بود. استخراج­کننده ویژگی، وظیفه تبدیل داده­ی خام (برای مثال مقادیر پیکسل­های موجود در یک عکس) به یک بازنمایی مناسب یا به شکل یک بردار ویژگی را بر عهده دارد[1].

یادگیری بازنمایی[4] یا یادگیری ویژگی­ها[5] مجموعه­ای از روش­ها هستند که اجازه می­دهند ماشین با داده­ی خام تغذیه شوند و به‌صورت خودکار بازنمایی لازم برای تشخیص یا طبقه­بندی را فرابگیرند. روش­های یادگیری عمیق درواقع روش­های یادگیری بازنمایی با چند سطح از بازنمایی هستند. در هر یک از این سطوح با محاسبه ساده ولی غیرخطی[6]یک بازنمایی در یک سطح به سطح بالاتر ایجاد می­شود. این بازنمایی از داده خام شروع‌شده و با افزایش سطوح کامل­تر می­شوند [1].

با افزایش سطوح و انتقالات، ویژگی­های پیچیده­تری استخراج می­شوند، پس می­توان انتظار داشت با افزایش این سطوح توابع خیلی پیچیده نیز یاد گرفته شوند. برای مسائل طبقه­بندی، یک بازنمایی سطح بالا از ورودی برای تفکیک کلاس­ها و مقاومت در برابر تغییرات ضروری است. برای مثال یک تصویر به‌صورت یک آرایه از مقادیر پیکسل­ها بیان می­شود، در ویژگی­های یاد گرفته‌شده در سطح اول بازنمایی، معمولاً حضور یا عدم حضور یک لبه در زاویه و مکان مشخص در تصویر بیان می­شود. لایه­ی دوم معمولاً شکل کلی­ای که با ترکیب خاصی از لبه­ها ایجاد می­شود را با مقاومت اندکی در مکان لبه­ها را تشخیص می­دهد. لایه­ی سوم به ترکیبی پیچیده­تری که شامل قسمت­هایی از اشیا مشابه است پاسخ می­دهد و لایه­های بعدی با ترکیب این قسمت­ها، شی‌ء را تشخیص می­دهند.

نکته­ی مهم در یادگیری ژرف این است که لایه­های تشخیص‌دهنده‌ی ویژگی­ها توسط انسان طراحی نشده­اند بلکه آن­ها از داده­ی خام با استفاده از یک روش یادگیری همه­ منظوره آموخته‌شده‌اند. یادگیری ژرف پیشرفت چشم­گیری در حل مسائلی که جامعه­ی هوش مصنوعی سال­های زیادی را صرف حل آن­ها کرده بود، ایجاد کرد و به یک ابزار کارآمد برای حل مسائل در تمامی حوزه­ها و علوم تبدیل شد.

بر اساس مطالعات انجام‌شده، بهترین روش­ها برای بازشناسی اشیاء و بازشناسی چهره روش‌های مبتنی بر یادگیری عمیق و به‌طور خاص شبکه‌های عصبی کانولوشنالی هستند.

یادگیری عمیق یک زیرشاخه از یادگیری ماشینی و بر مبنای مجموعه‌ای از الگوریتم‌ها است که در تلاش هستند مفاهیم انتزاعی سطح بالا در دادگان را مدل نمایند که این فرایند را با استفاده از یک گراف عمیق که دارای چندین لایه پردازشی متشکل از چندین لایه تبدیلات خطی[7] و غیرخطی هستند، مدل می‌کنند. در سال­های اخیر خصوصاً پس از سال 2012 با مقاله الکس کریجوسکی و پیشرفت چشم‌گیر مدل‌های مبتنی بر یادگیری عمیق در استخراج ویژگی و طبقه‌بندی اشیاء در مقایسه به روش­های پیشین راهکارهای مبتنی بر یادگیری عمیق به پیشرفت‌های موردتوجه قرارگرفته‌اند.

بنا بر اهداف پروژه، معماری‌ها و مدل‌های معروف کانولوشنالی موردبررسی قرار گرفتند تا معماری مناسب انتخاب شود. در این بخش به مبانی شبکه­های کانولوشنالی عمیق پرداخته خواهد شد و در ادامه معماری‌های مطرح ارائه‌شده در سال­های اخیر مطرح می­گردند.

[1] Machine vision

[2] Pattern Recognition

[3] Feature Extractor

[4] Representation Learning

[5] Feature Learning

[6] Nonlinear

[7] Linear

یادگیری عمیقبینایی کامپیوتربینایی کامپیوتری
هوش مصنوعی، یادگیری ماشین و یادگیری عمیق
شاید از این پست‌ها خوشتان بیاید