معماری کلی شبکه های یادگیری عمیق

سلام

تصویر زیر بهترین تصویری هست که تا حالا در مقالات و کتاب های مختلف در مورد معماری شبکه های یادگیری عمیق دیدم.

معماری شبکه های یادگیری عمیق
معماری شبکه های یادگیری عمیق

همانطور که در تصویر واضح هست، شبکه های یادگیری عمیق یا Deep Learning از لایه های مختلف و متوالی تشکیل شدند و کار اصلی این لایه ها به دست آوردن یک سری وزن یا weight هست که با آنها بتونیم ورودی را به خروجی نسبت بدیم. در واقع شبکه یادگیری عمیق میخواد با یه سری وزن ها x را به y نسبت بده.

تابع زیان یا Loss function تابعی هست که در هر مرحله مقدار ایجاد شده بوسیله شبکه را (y') با مقداری که درست هست و انتظار داریم (y) مقایسه می کنه و یه مقداری به نام loss score به دست میاره.

مقدار loss score به تابع optimizer فرستاده میشه و به وسیله عملیات back propagation مقدارهای قبلی وزن ها بهنگام میشن تا در دور بعد نتایج بهتری به دست بیاد.

میدونم ممکنه الان این مطالب کمی براتون نامفهوم باشه، ولی نگران نباشید منم اولش همینجوری بودم. کم کم به مرور زمان یاد میگیرید.

این تصویر را از کتاب Deep learning with python برداشتم که به نظرم بهترین و کاربردی ترین کتاب در این زمنیه است. نویسنده این کتاب آقای François Chollet در شرکت گوگل در توسعه دو کتابخانه معروف Tensorflow و keras همکاری داشته.

منبع:

https://www.amazon.com/Deep-Learning-Python-Francois-Chollet/dp/1617294438