خواندن ۵ دقیقه·۴ سال پیش

مدل های جدید یادگیری عمیق : نورون های کمتر، هوش بیشتر

هوش مصنوعی به زندگی روزمره ما رسیده است - از موتورهای جستجو گرفته تا اتومبیل های خودران.این امر به قدرت محاسباتی عظیمی که در سالهای اخیر در دسترس قرار گرفته است برمی گردد. اما نتایج جدید حاصل از تحقیقات هوش مصنوعی اکنون نشان می دهد که از شبکه های عصبی ساده تر و کوچکتر می توان برای حل برخی وظایف ، بهتر ، کارآمدتر و با اطمینان بیشتر از هر زمان دیگری استفاده کرد.

یک تیم تحقیقاتی بین المللی از TU وین ، IST اتریش و MIT امریکا یک سیستم جدید هوش مصنوعی مبتنی بر عملکرد مغز حیوانات کوچک مانند کرم ها ایجاد کرده اند.این سیستم جدید هوش مصنوعی می تواند یک وسیله نقلیه را فقط با چند نورون مصنوعی کنترل کند.

این تیم می گوید سیستم آنها نسبت به مدل های یادگیری عمیق قبلی مزایای تعیین کننده ای دارد:

با ورودی های دارای نویز زیاد بسیار بهتر کنار می آید و به دلیل سادگی، نحوه عملکرد آن را می توان با جزئیات توضیح داد. این مدل جدید یادگیری عمیق اکنون در مجله Nature Machine Intelligence منتشر شده است.

یادگیری از طبیعت

شبكه های عصبی مصنوعی ، مشابه مغز موجودات زنده ، از سلولهای منفرد بسیاری تشکیل شده است. وقتی سلول فعال است، سیگنالی به سلولهای دیگر می فرستد. تمام سیگنال های دریافتی توسط سلول بعدی نیز برای تصمیم گیری در مورد فعال شدن این سلول با یکدیگر ترکیب می شوند.

روشی که یک سلول بر فعالیت سلول بعدی تأثیر می گذارد ، رفتار سیستم را تعیین می کند - این پارامترها در یک فرایند یادگیری خودکار تنظیم می شوند تا زمانی که شبکه عصبی بتواند یک مسئله خاص را حل کند.

پروفسور رادو گروسو ، رئیس گروه تحقیقاتی "سیستمهای فیزیکی سایبری" در TU وین می گوید: "سالهاست که ما در حال بررسی مواردی هستیم که می توانیم از طبیعت برای بهبود یادگیری عمیق یاد بگیریم." "به عنوان مثال کرم های نخی شکل C. elegans ، به طور شگفت آوری با تعداد بسیار کمی نورون زندگی می کند و همچنان الگوهای رفتاری جالبی را نشان می دهد. این به دلیل روش کارآمد و هماهنگ سیستم عصبی این موجودات برای پردازش اطلاعات است."

پروفسور دانیلا روس ، مدیر آزمایشگاه علوم رایانه ای و هوش مصنوعی MIT CSAIL می گوید: "طبیعت به ما نشان می دهد که هنوز فضای زیادی برای پیشرفت وجود دارد." "بنابراین ، هدف ما کاهش گسترده پیچیدگی و افزایش تفسیرپذیری مدل های شبکه عصبی بود."

پروفسور توماس هنزینگر ، رئیس IST اتریش می گوید: "با الهام از طبیعت ، ما مدل های جدید ریاضی از سلول های عصبی و سیناپس را ایجاد کردیم."

دکتر رامین حسنی ، همکار فوق دکترا در انستیتوی مهندسی کامپیوتر ، TU Wien و MIT CSAIL می گوید: "پردازش سیگنال ها در سلول های فردی اصول ریاضی متفاوتی را نسبت به مدل های یادگیری عمیق قبلی دنبال می کند." "همچنین ، شبکه های ما بسیار پراکنده هستند - این بدان معنی است که همه سلول ها به سلول های دیگر متصل نیستند. که این امر همچنین شبکه را ساده تر می کند."

رانندگی در لاین مشخص

برای آزمایش ایده های جدید ، تیم یک آزمایش ویژه مهم را انتخاب کرد: اتومبیل های خودران در لاین خود بمانند. شبکه عصبی تصاویر دوربین از جاده را به عنوان ورودی دریافت می کند و می بایست به طور خودکار تصمیم بگیرد که به راست یا چپ هدایت شود.

ماتیاس لچنر ، دانش آموخته TU Wien و دانشجوی دکترا در IST اتریش می گوید: "امروزه اغلب مدل های یادگیری عمیق با میلیون ها پارامتر برای یادگیری کارهای پیچیده مانند رانندگی خودکار استفاده می شود. "با این حال ، رویکرد جدید ما این امکان را به ما می دهد تا اندازه شبکه ها را تا دو برابر کاهش دهیم. سیستم های ما فقط از 75000 پارامتر قابل آموزش استفاده می کنند. "

الكساندر امینی ، دانشجوی دكترا در MIT CSAIL توضیح می دهد كه این سیستم جدید از دو قسمت تشكیل شده است : ورودی دوربین ابتدا توسط یك شبکه عصبی به اصطلاح کانولوشن پردازش می شود ، که فقط داده های بصری را برای استخراج ویژگی های ساختاری از پیکسل های ورودی درک می کند. این شبکه تصمیم می گیرد کدام قسمت از تصویر دوربین مهم هستند ، و سپس سیگنال هایی را به قسمت حیاتی شبکه منتقل می کند یعنی "سیستم کنترل" که وسیله نقلیه را هدایت می کند.

هر دو زیر سیستم با هم انباشته شده و به طور همزمان آموزش می بینند. ساعتهای طولانی فیلم های ترافیکی مربوط به رانندگی انسان در منطقه بوستون جمع آوری شده و به همراه اطلاعاتی در مورد نحوه هدایت خودرو در هر شرایط خاص به شبکه منتقل می شوند - تا زمانی که سیستم یاد بگیرد به طور خودکار تصاویر را با جهت فرمان تطبیق داده و موقعیت های جدید را به طور مستقل اداره کند.

قسمت کنترل کننده سیستم (که به آن استراتژی مدار عصبی یا NCP گفته می شود) ، که داده ها را از ماژول ادراک به یک فرمان هدایت می کند ، فقط از 19 نورون تشکیل شده است.ماتیاس لچنر توضیح می دهد که NCP ها تا 3 برابر از آنچه در مدل های پیشرفته قبلی ممکن بود ، کوچکتر شده اند.

تحلیل استواری

ماتیاس لچنر می گوید: "برای آزمایش میزان استواری NCP ها نسبت به مدل های قبلی تصاویر ورودی را آشفته کرده و ارزیابی می کنیم شبکه موجود چگونه می تواند با نویز کنار بیایند."

"در حالی که این مسئله برای دیگر شبکه های عصبی عمیق به یک مشکل غیرقابل حل تبدیل شد ، NCP های ما مقاومت شدیدی در برابر مصنوعات ورودی نشان دادند. این ویژگی نتیجه مستقیم مدل عصبی جدید و معماری آن است."

رامین حسنی می گوید: "قابلیت تفسیر و استواری دو مزیت عمده مدل جدید ماست." "اما موارد دیگری نیز وجود دارد: با استفاده از روشهای جدید ما همچنین می توانیم زمان آموزش و امکان پیاده سازی هوش مصنوعی را در سیستمهای نسبتاً ساده کاهش دهیم.NCP های ما یادگیری تقلیدی را در طیف گسترده ای از کاربردهای ممکن ، از فعالیت خودکار در انبارها گرفته تا جابجایی ربات ، امکان پذیر می سازند.

یافته های جدید چشم اندازهای مهمی را برای جامعه AI ایجاد می کند:

اصول محاسبه در سیستم های عصبی بیولوژیکی می توانند به منبع بزرگی برای ایجاد هوش مصنوعی قابل تفسیر با عملکرد بالا -به عنوان جایگزینی برای سیستم های یادگیری ماشین black-box که تاکنون استفاده کرده ایم- تبدیل شوند .

یادگیری عمیق یادگیری ماشین شبکه عصبی سیناپس نریمان زعیم کهن

نریمان زعیم کهن

شاید از این پست‌ها خوشتان بیاید