تحقیقات جدید هوش مصنوعی با توسعه برنامه DragGAN به شما این امکان را میدهد روی عکسها کلیک کرده و بکشید تا بتوانید در چند ثانیه آنها را دستکاری کنید این ابزار DragGAN مانند ابزار Warp فتوشاپ عمل میکند اما بسیار قدرتمندتر. حتی میتوانید تصاویر را طوری بچرخانید که انگار سه بعدی هستند. کافی است خودتان ویدئوها را تماشا کنید تا به توانایی حیرت انگیز ابزار Drag GAN در خلق تصاویر واقع گرایانه با استفاده از هوش مصنوعی پی ببرید. دفعه بعد اگر تصویری کاملا طبیعی از یک شیر در آغوش یک کفتار را دیدید، دیگر نباید به چشمهایتان شک کنید!
ابزار DragGAN چیست؟
ایجاد محتوای بصری که متناسب با نیازهای کاربر باشد. اغلب مستلزم کنترل دقیق و منعطف بر ویژگیهایی مانند: حالت، شکل، بیان، و چیدمان اشیا تولید شده است. روشهای سنتی برای کنترل شبکههای متخاصم مولد (GAN)، به دادههای دستی یا مدلهای سه بعدی قبلی متکی هستند. با این حال، این رویکردها اغلب فاقد دقت، انعطاف پذیری و عمومیت هستند. در پاسخ به این کاستیها، موسسه Max Planck DragGAN ابزار DragGAN را معرفی میکند، رویکرد جدیدی که به کاربران اجازه میدهد تا به صورت تعاملی هر نقطه در یک تصویر را به مکانهای مورد نظر بکشند.
ابزار DraGAN شامل چند جز است؟
DragGAN شامل دو جز اصلی است: نظارت بر حرکت و رویکرد جدید ردیابی نقطهای. نظارت حرکت امکان حرکت توسط کاربر را در نقاط دسته در تصویر به سمت موقعیتهای هدف فراهم میکند. رویکرد ردیابی نقطهای از ویژگیهای متمایز ژنراتور استفاده میکند تا مکانها را در حین جابجایی ردیابی کند. در نتیجه، کاربران میتوانند تصاویر را با دقت تغییر شکل دهند و بر ویژگیهایی مانند: حالت، شکل، بیان و چیدمان در دستههای مختلف مانند: حیوانات، ماشینها، انسانها و مناظر تاثیر بگذارند.
نحوه کار با ابزار DragGAN
برای دستکاری تصاویر با استفاده از ابزار DragGAN کافیست بر روی نقاط دلخواه تصویر کلیک کرده و آن را بکشید تا تغییرات توسط مدل هوش مصنوعی اعمال شود. در واقع این مدل هوش مصنوعی، تغییرات کاملا مرتبطی بر روی تصاویر اعمال میکند تا یک تصویر جدید اما مرتبط با تصویر اصلی خلق شود. این ابزار جدید نه تنها میتواند اندازه یک خودرو را دستکاری کند یا لبخند را بر روی چهره موجود در عکسها بیاورد، بلکه حتی از عهده تغییر جهت و چرخش عناصر موجود در تصاویر هم بر میآید. البته برای این کار باید تصویر یک مدل سه بعدی باشد.
محققان این مدل که DragGAN نام دارد توضیح میدهند: «رویکرد ما میتواند محتواهای غیر قابل دسترس مانند دندانهای داخل دهان یک ادامه مطلب...