Deep Learning را یاد نگیر !



یکی از بزرگترین پیشرفت های یادگیری ماشین در نسل گذشته یادگیری عمیق (Deep Learning) است . اماسوال اینجاست که آیا این به اون معنی هستش که نیازه یک دانشمند داده عمومی (Data Scientist) به سراغ این حرفه برود ؟


یادگیری عمیق به طور واضح برای شبکه های عصبی یک جهش رو به جلو بود. مشکلات بینایی ماشین ( Computer Vision) که قبلا با مشکل روبرو بودند ناگهان قابل حل شدند و یک دانش جدید به وجود آمد و کل حوزه هوش مصنوعی را احیا کرد .

در واقع این اهمیت اخیرا رسما شناخته شده است. که سه نفر از چهره های دارای اهمیت :

Yoshua Bengio ( دانشمند کامپیوتر کانادایی )

Geoffrey Hinto ( روانشناس شناختی و دانشمند علوم کامپیوتر )‌

Yann LeCunn ( دانشمند در زمینه علوم رایانه‌ )

به دلیل سهم خود از در توسعه یادگیری عمیق (Deep Learning) جایزه تورینگ را از طریق ACM دریافت کرده اند.


با توجه به این که یادگیری عمیق مکانی برای پیشرفت در یادگیری ماشین در حال حاضر در نظر گرفته می شود. اغلب توصیه میشود که دانشمندان داده نیاز به یادگیری اینکه یادگیری عمیق به چه صورت کار میکنددارند . و این به عنوان یک گام اساسی در حرفه ای شدن در این محسوب میشود .

دو راه وجود دارد برای اینکه Deep Learning را بتوانیم به عنوان یک مهارت در چارچوب علوم داده حساب کنیم :

موارد استفاده از یادگیری عمیق تا حدودی جدا از موارد اصلی است تا جایی که دانشمندان داده سعی در این دارند تا مدل هایی را با کاربردهای گسترده در زمینه تجارت ایجاد کنند. مانند پیش بینی بازار های زنجیره ای, حوادث بیمه یا همچین مواردی ...

مواردی که یادگیری عمیق به ویژه با آن ها همراه بوده است تمایل به چیز هایی مانند بینایی ماشین و برنامه های کاربردی دیگر هوش مصنوعی بوده است.



این حوزه های مختلف دانش به خودی خود نیاز به طرز فکر متفاوتی دارند. در حقیقت گرچه علوم داده و هوش مصنوعی به عنوان دو شکل از یک چیز شناخته میشوند. یا به عنوان زمینه هایی که یکی زیر مجموعه ی دیگریست. اما بیشتر مشاهده میشود آن ها زمینه هایی کاملا متفاوت با یک ناحیه ی مشترک کوچک هستند مانند دارو و دارو خانه یا قانون و حسابداری .


در نتیجه موارد استفاده از Deep Learning تحت سلطه ی هوش مصنوعی است. این برنامه ها با جریان اصلی برنامه های علوم داده متفاوت است. برنامه های کاربردی یادگیری عمیق در حال حاضر بر روی تشخیص تصویر و تشخیص گفتار است و این مسیر طولانی برای دانشمندان داده که سختی های زیادی به همراه دارد و علاوه بر این این مهارت ها اصطلاحات مربوط به خود را دارند که باید یاد بگیرند.



یادگیری عمیق نیز از نظر نیاز به دانش تخصصی در مورد معماری های خاص شبکه های عصبی به ویژه بسیار سنگین است. علاوه بر این بر خلاف بسیاری از الگوریتم های استخراج داده مانند جنگل تصادفی ( Random Forest) و یا گرادیان تقویتی (Gradient Boosted Machines) مورد استفاده قرار میگیرد. اصطلاحات یادگیری عمیق ضعیف است .

مسئله سوم این است که یادگیری عمیق یک تکنیک عالی برای داده های بزرگ ( Big Data) است که غالبا بر میلیون ها داده متکی است تا نتیجه خوبی به دست بیاید.

گری مارکوس در انتقاد به یادگیری عمیق میگوید :‌

" در زمانی که مشکل محدود بودن داده ها را داریم. یادگیری عمیق اغلب راه حل ایده عالی نیست"

حقیقت غم انگیز این است که اکثر دانشمندان داده با مشکل محدود بودن داده ها مواجه هستند و این یک دلیل ثانویه است که یادگیری عمیق اغلب برای برنامه هایی که دانشمندان داده با آن سر و کار دارند مناسب نیستند .


این سه عنصر مربوط به Deep Learning است که در مقایسه با آمار به یک طرز فکر متفاوت نیاز دارد و حتی در مقایسه با حداقل برخی از رویکردهای دیگر در مورد یادگیری ماشینی قابل مقایسه است. نه تنها این ذهنیت باید به یک تمرینگر آموخته شود که بتواند مؤثر باشد بلکه هنگام بازگشت پزشک به عرصه دیگری لازم است تا حدودی از آن آگاه نشود. در این روش یادگیری عمیق و آمار شبیه به جراحی میکروسکوپی در مقابل جراح ارتوپدی است - در مقایسه با کار با بزرگترین استخوان ها با ساختارهای بسیار کمی در بدن کار می کند.


این به این معنی نیست که توسعه مهارت های Deep Learning نمی تواند یک مهارت دیگر در تخصص های شما باشد. با این حال ، آنچه باید تحقق یابد این است که Deep Learning ، برای بیشتر افراد ، بازده ضعیفی را در زمان سرمایه گذاری شده برای تحصیل ، به ویژه در اوایل کار شما ایجاد می کند. به عنوان یکی از دشوارترین یادگیری مجموعه های ابزار با محدودترین زمینه های کاربرد ، سایر ابزارها بازده به مراتب بهتری را برای زمان سرمایه گذاری ارائه می دهند.


بار دیگر نیاز به مطالعه چیزهای اضافی که بعید است از آنها استفاده شود ، در حال حاضر باعث از بین رفتن افراد در تلاش برای یادگیری دانشمندان داده از اهدافشان می شود. این احتمالاً می تواند به فرسودگی شغلی که دانشمندان زیادی از آن گزارش می دهند ، کمک کند. محدود کردن مطالعه مورد نیاز به لیست کوچکتر از مباحث اساسی تر ، امکان گفتن را فراهم می کند: "من حداقل در حال حاضر آنچه را که باید تسلط داشته باشد ، تسلط کرده ام."


در این زمینه ، بار اضافی مجموعه مهارتهای تخصصی و غیرقابل انتقال که با یادگیری عمیق همراه باشد ، پلی برای بسیاری از افراد است. از یک طرف ، ایده الگوریتم های یادگیری عمیق که ویژگی های خاص خود را ایجاد می کنند به معنای این است که پزشکان جدا از داده هایی که می خواهند مدل سازی شوند ، نگه داشته می شوند. ما مدیون دانشمندان داده بعدی هستیم که به صفوف خود می آیند تا اطمینان حاصل کنند که آنها فقط آنچه را که برای شروع کارشان لازم است را مطالعه می کنند