یک راه بهتر برای کنترل Shape-Shifting Soft Bots

یک تکنیک جدید یادگیری ماشینی می‌تواند یک ربات نرم قابل تنظیم مجدد را آموزش دهد و کنترل کند که می‌تواند به صورت پویا شکل خود را برای تکمیل یک کار تغییر دهد.

یک ربات لجن مانند را تصور کنید که می تواند به طور یکپارچه شکل خود را تغییر دهد و از طریق فضاهای باریکی که می تواند در داخل بدن انسان مستقر شود تا یک مورد ناخواسته را از بین ببرد.

در حالی که چنین رباتی هنوز در خارج از آزمایشگاه وجود ندارد، محققان در حال توسعه ربات های نرم قابل تنظیم مجدد برای کاربرد در مراقبت های بهداشتی، دستگاه های پوشیدنی و سیستم های صنعتی هستند.

اما چگونه می‌توان رباتی را کنترل کرد که مفاصل، دست و پا یا انگشتان قابل دستکاری ندارد و در عوض می‌تواند به‌طور چشمگیری کل شکل آن را به دلخواه تغییر دهد؟ محققان MIT در حال کار برای پاسخ به این سوال هستند.

آنها یک الگوریتم کنترلی توسعه دادند که می تواند به طور مستقل یاد بگیرد که چگونه یک ربات قابل تنظیم مجدد را برای انجام یک کار خاص حرکت دهد، کشش دهد و شکل دهد، حتی زمانی که این کار به ربات نیاز دارد که مورفولوژی خود را چندین بار تغییر دهد. این تیم همچنین یک شبیه‌ساز برای آزمایش الگوریتم‌های کنترل برای ربات‌های نرم قابل تغییر شکل در یک سری وظایف چالش‌برانگیز و تغییر شکل ساختند.

روش آن‌ها هر یک از هشت وظیفه‌ای را که ارزیابی می‌کردند، در حالی که از سایر الگوریتم‌ها بهتر بود، تکمیل کرد. این تکنیک به ویژه در کارهای چند وجهی به خوبی کار می کرد. به عنوان مثال، در یک آزمایش، ربات مجبور شد قد خود را کاهش دهد در حالی که دو پای کوچک را رشد می‌داد تا از طریق لوله‌ای باریک بفشرد و سپس آن پاها را از بین برد و بالاتنه خود را برای باز کردن درب لوله باز کرد.

در حالی که ربات های نرم قابل تنظیم مجدد هنوز در مراحل ابتدایی خود هستند، چنین تکنیکی روزی می تواند ربات های همه منظوره را فعال کند که می توانند شکل خود را برای انجام وظایف مختلف تطبیق دهند.

وقتی مردم به ربات‌های نرم فکر می‌کنند، تمایل دارند به ربات‌هایی فکر کنند که انعطاف‌پذیر هستند، اما به شکل اولیه خود باز می‌گردند. ربات ما مانند لجن است و در واقع می تواند مورفولوژی آن را تغییر دهد. بویوان چن، دانشجوی فارغ التحصیل مهندسی برق و علوم کامپیوتر (EECS) و یکی از نویسندگان مقاله ای در مورد این رویکرد، می گوید: بسیار قابل توجه است که روش ما بسیار خوب کار می کند زیرا ما با چیز بسیار جدیدی روبرو هستیم.

نویسندگان مشترک چن عبارتند از سونینگ هوانگ، نویسنده اصلی، دانشجوی کارشناسی در دانشگاه تسینگ‌هوا در چین که این کار را در زمانی که دانشجوی مهمان در MIT بود تکمیل کرد. Huazhe Xu، استادیار دانشگاه Tsinghua; و نویسنده ارشد وینسنت سیتزمن، استادیار EECS در MIT که رهبری گروه نمایش صحنه در آزمایشگاه علوم کامپیوتر و هوش مصنوعی را بر عهده دارد. این تحقیق در کنفرانس بین‌المللی نمایش‌های یادگیری ارائه خواهد شد.

کنترل حرکت پویا

دانشمندان اغلب به ربات ها می آموزند که وظایف خود را با استفاده از یک رویکرد یادگیری ماشینی معروف به یادگیری تقویتی انجام دهند، که یک فرآیند آزمون و خطا است که در آن ربات برای اقداماتی که آن را به هدف نزدیکتر می کند، پاداش می گیرد.

این می تواند زمانی موثر باشد که قسمت های متحرک ربات یکدست و به خوبی مشخص باشد، مانند یک گیره با سه انگشت. با یک گیره رباتیک، یک الگوریتم یادگیری تقویتی ممکن است یک انگشت را کمی حرکت دهد و با آزمون و خطا بفهمد که آیا این حرکت پاداشی برای آن به همراه دارد یا خیر. سپس به انگشت بعدی می رفت و به همین ترتیب.

اما ربات‌های تغییر شکل، که توسط میدان‌های مغناطیسی کنترل می‌شوند، می‌توانند به صورت دینامیکی کل بدن خود را منقبض، خم یا دراز کنند.

محققان یک شبیه‌ساز برای آزمایش الگوریتم‌های کنترل ربات‌های نرم قابل تغییر شکل در یک سری وظایف چالش‌برانگیز و تغییر شکل ساختند. در اینجا، یک ربات قابل تنظیم مجدد یاد می گیرد که بدن نرم خود را کشیده و منحنی کند تا موانع را دور بزند و به هدف برسد.

چن می‌گوید: «چنین روباتی می‌تواند هزاران قطعه کوچک عضلانی برای کنترل داشته باشد، بنابراین یادگیری آن به روش سنتی بسیار دشوار است.

برای حل این مشکل، او و همکارانش باید جور دیگری درباره آن فکر می کردند. به جای حرکت دادن هر عضله کوچک به صورت جداگانه، الگوریتم یادگیری تقویتی آنها با یادگیری کنترل گروه هایی از عضلات مجاور که با هم کار می کنند شروع می شود.

سپس، پس از اینکه الگوریتم با تمرکز بر گروه‌های ماهیچه‌ای، فضای اقدامات ممکن را بررسی کرد، به جزئیات دقیق‌تری برای بهینه‌سازی خط‌مشی یا برنامه اقدام می‌پردازد. به این ترتیب، الگوریتم کنترل از یک روش درشت به ریز پیروی می کند.

"درشت به ریز به این معنی است که وقتی شما یک اقدام تصادفی انجام می دهید، آن عمل تصادفی احتمالاً تفاوت ایجاد می کند. Sitzmann می‌گوید: «تغییر در نتیجه احتمالاً بسیار مهم است، زیرا شما به طور همزمان چندین ماهیچه را کنترل می‌کنید.

برای فعال کردن این کار، محققان با فضای عمل یک ربات یا نحوه حرکت آن در یک منطقه خاص مانند یک تصویر رفتار می کنند.

مدل یادگیری ماشینی آنها از تصاویر محیط ربات برای ایجاد یک فضای عمل دو بعدی استفاده می کند که شامل ربات و ناحیه اطراف آن می شود. آنها حرکت ربات را با استفاده از روشی به نام ماده-نقطه-روش شبیه سازی می کنند، جایی که فضای عمل توسط نقاطی مانند پیکسل های تصویر پوشیده شده و با یک شبکه پوشانده شده است.

همان‌طور که پیکسل‌های نزدیک در یک تصویر با هم مرتبط هستند (مانند پیکسل‌هایی که یک درخت را در عکس تشکیل می‌دهند)، آنها الگوریتم خود را برای درک اینکه نقاط عمل نزدیک همبستگی قوی‌تری دارند ساخته‌اند. نقاط اطراف "شانه" ربات با تغییر شکل به طور مشابه حرکت می کنند، در حالی که نقاط روی "پای" ربات نیز مشابه حرکت می کنند، اما به روشی متفاوت از نقاط روی "شانه".

علاوه بر این، محققان از همان مدل یادگیری ماشینی برای نگاه کردن به محیط و پیش‌بینی اقداماتی که ربات باید انجام دهد استفاده می‌کنند که باعث کارآمدتر شدن آن می‌شود.

ساخت شبیه ساز

پس از توسعه این رویکرد، محققان به راهی برای آزمایش آن نیاز داشتند، بنابراین یک محیط شبیه‌سازی به نام DittoGym ایجاد کردند.

ربات DittoGym دارای هشت وظیفه است که توانایی یک ربات قابل تنظیم مجدد را برای تغییر شکل پویا ارزیابی می کند. در یکی، ربات باید بدن خود را کشیده و منحنی کند تا بتواند موانع را دور بزند تا به نقطه هدف برسد. در دیگری، باید شکل خود را به تقلید از حروف الفبا تغییر دهد.

در این شبیه سازی، ربات نرم قابل تنظیم مجدد که با استفاده از الگوریتم کنترل محققان آموزش دیده است، باید شکل خود را برای تقلید از اجسام مانند ستاره ها و حروف M-I-T تغییر دهد.

انتخاب کار ما در DittoGym از اصول طراحی معیار یادگیری تقویتی عمومی و نیازهای خاص ربات‌های قابل تنظیم مجدد پیروی می‌کند. هوانگ می‌گوید، هر کار به گونه‌ای طراحی شده است که ویژگی‌های خاصی را نشان دهد که به نظر ما مهم است، مانند قابلیت حرکت در کاوش‌های افق بلند، توانایی تجزیه و تحلیل محیط، و تعامل با اشیاء خارجی. "ما معتقدیم که آنها با هم می توانند درک جامعی از انعطاف پذیری ربات های قابل تنظیم مجدد و اثربخشی طرح یادگیری تقویتی ما به کاربران ارائه دهند."

الگوریتم آنها از روش های پایه بهتر عمل کرد و تنها تکنیک مناسب برای تکمیل کارهای چند مرحله ای بود که به چندین تغییر شکل نیاز داشت.

چن می‌گوید: «ما ارتباط قوی‌تری بین نقاط عملی که به یکدیگر نزدیک‌تر هستند، داریم و فکر می‌کنم این کلیدی است که این کار را به خوبی انجام می‌دهد.

در حالی که ممکن است سال‌ها طول بکشد تا ربات‌های تغییر شکل در دنیای واقعی به کار گرفته شوند، چن و همکارانش امیدوارند که کار آنها الهام بخش دانشمندان دیگر باشد نه تنها به مطالعه ربات‌های نرم قابل تنظیم مجدد، بلکه در مورد استفاده از فضاهای عمل دو بعدی برای سایر مشکلات کنترلی پیچیده فکر کنند.

منبع : MIT

🔹این مقاله به صورت ماشینی، توسط Aiticle ترجمه شده و ممکنه ایراداتی داشته باشه، فیدبک‌های شما به ما در جهت بهبود سیستممون خیلی کمک میکنه :) لطفا نظراتتون رو باهامون به اشتراک بگذارین.