یادگیری عمیق یکی از زیرشاخههای یادگیری ماشین (Machine Learning) و الهامگرفته از ساختار مغز انسان است که از شبکههای عصبی مصنوعی چندلایه (Deep Neural Networks) برای استخراج الگوهای پیچیده از دادههای حجیم استفاده میکند.
تفاوت اصلی یادگیری عمیق با روشهای کلاسیک یادگیری ماشین در این است که:
استخراج ویژگی (Feature Extraction) بهصورت خودکار انجام میشود
نیاز به مهندسی ویژگی دستی به حداقل میرسد
عملکرد در دادههای غیرساختیافته (تصویر، متن، صوت) بسیار بالاتر است

یک مدل یادگیری عمیق معمولاً از اجزای زیر تشکیل میشود:
داده خام مانند:
پیکسلهای تصویر
بردار کلمات (Word Embeddings)
سیگنال صوتی
هسته اصلی یادگیری عمیق که:
شامل دهها تا هزاران نورون هستند
الگوهای ساده تا پیچیده را بهصورت سلسلهمراتبی یاد میگیرند
نتیجه نهایی مدل:
طبقهبندی (Classification)
پیشبینی عددی (Regression)
تولید محتوا (Generative Models)
توابع فعالسازی نقش غیرخطیسازی مدل را دارند:
