نویسنده: برندا کوواروبیاس[1]
منبع: Medium
مزایا و معایب آثار آفریدهشده با هوش مصنوعی
[توضیح مترجم: من قصد دارم (و در عمرم از این قصدهای نافرجام زیاد داشتهام) که ده مقاله دربارهی آثار هنریِ آفریدهی هوش مصنوعی ترجمه کنم و در اینترنت منتشر کنم تا اگر استقبالی از آنها شد، به فکر کار جدیتری در همین رابطه بیفتم. این سومین مقاله است. مقالهی اول را از اینجا و مقالهی دوم را از اینجا بخوانید.]
اثر هنری چیست؟ از نظر بعضیها بیانی انسانی است، که در نقاشیها و موسیقی و فیلم میبینیم. از نظر بعضی دیگر، نوعی از سرگرمی است، چیزی که بیاراده از آن لذت میبریم، اما لزوماً جدیاش نمیگیریم. گاهی معنایی دارد. گاهی ندارد. اما یک چیز ثابت است: اثر هنری را انسان برای انسان میآفریند.
لااقل اینکه قدیمها اینطوری بود.
هنرِ آفریدهی هوش مصنوعی مفهومی نسبتاً جدید در جهان هنر است و هنوز بهاندازهی کافی پرورانده نشده و شرکتهای فنآوری در تقلا هستند تا سبکها و تکنیکهای هنر انسانی را با سرعت تکنولوژی ترکیب کنند. انتظار میرود که آفرینشگرهای هنری بتوانند با جمعآوری اطلاعات از سرتاسر اینترنت یاد بگیرند که چگونه طبق پیامواره تصویر جدیدی بسازند.
من عاشق ساخت آثار هنری هستم، اما از مهارت بیبهرهام. یک روز با خودم فکر کردم بگذار هوش مصنوعی را امتحان کنم تا ببینم میتواند کمکم کند چیز جدیدی بسازم یا نه. من به مدت یک ماه از آفرینشگر آثار هنریِ میدجرنی[2] استفاده کردم. نتیجهی کار فراتر از انتظارم بود و پنجرهای بهسوی مهمترین قوتها و ضعفهای هوش مصنوعی باز کرد.
آفرینشگر هوش مصنوعی چه شکلی کار میکند؟
مثل بسیاری از آفرینشگرهای هوش مصنوعی، میدجرنی پیش از اینکه بازدیدکنندگان را به صفحهی عضویت هدایت کند اجازهی تعداد اندکی دانلود مجانی را میدهد. عضویت ماهانه ۱۰ تا ۵۰ دلار آب میخورد، که با گرانترین رقم عضویت میتوانید بهصورت نامحدود دانلود و تولید داشته باشید، ضمن اینکه حالت خصوصی هم در اختیار دارید.
برای اینکه فرد بتواند اثری بسازد، باید در صفحهی دیسکوردِ[3] آنها عضو شود و در هر کانالی که در دسترس است شروع به کار کند، یا اینکه از ربات میدجرنی[4] استفاده کند، که برای این کار باید در نوار گفتگو پیاموارهای[5] بفرستد. بر عهدهی خودتان است که در پیامواره جزئیات را کم یا زیاد تعریف کنید. گفتن ندارد که هرچقدر بیشتر جزئیات را مشخص کنید، تصویر به آنچه در ذهنتان دارید نزدیکتر میشود. همچنین با تعیین ابعاد مورد نظرتان میتوانید اندازهی تصویر را کنترل کنید.
روبات [ِ میدجرنی] برای پیاموارهی شما چهار پاسخ ارائه میدهد. شما میتوانید هرکدام از این تصویرها را، یا همهی آنها را، بازبینی کنید و کیفیت آنها را ارتقا دهید.
در تصویر زیر، من پیاموارهای ساده و بدون جزئیاتی چندان را به روبات دادم. پیامواره این بود:
“Dog dressed as ghost surrounded by jack-o-lanterns at night.”
[سگی که مثل اشباح لباس پوشیده و دورش را کدوهای جشن هالووین گرفتهاند در شب.]
من کیفیت عکس سوم (U3) را ارتقا دادم و به ساخت نسخههای دیگر از آن در این برنامه ادامه دادم تا به طرح اولیهای که میخواستم رسیدم، که در پایین آن را میبینید.
من تا آنجایی که میشد جزئیات را کم گرفته بودم، برای همین بیشتر تخیل [در این تصویر] بر عهدهی خود هوش مصنوعی بوده است. این میتواند خوب باشد یا بد. بستگی دارد به اینکه شما به چه نوع اثری میخواهید برسید.
مشکل اینجا است: بهنظر میرسد هوش مصنوعی بعضی از واژهها را با بعضی دیگر ارتباط میدهد و مفاهیمی را که در پیامواره وارد نشده با هم ترکیب میکند، مگر اینکه پیامواره خیلی دقیق باشد.
پس، در این مورد، با اینکه هوشِمصنوعی فهمید که من سگی میخواهم که در شب به شکل اشباح لباس پوشیده و در کنارش کدوهای جشن هالووین باشد، اما درنیافت که هرکدام از اینها را کجا میخواهم بگذارم و میخواهم هرکدام چه کاری انجام دهند. در نتیجه، این برنامه مفاهیمی را که در پیاموارهام نبود با هم ترکیب کرد و کدوهای جشن هالووین را شبیه برگ (در ارتباط با واژهی «اشباح» و به خاطر پاییز[6]) و توپ (در ارتباط با واژهی «سگ») درآورد.
من رویکردم را عوض کردم و تا جایی که میشد [به پیامواره] جزئیات اضافه کردم. پیاموارهی من این شد:
“hyper-realistic, photorealistic landscape of labrador dog dressed as a ghost, dog dressed as a ghost in bedsheets, surrounded by carved jack-o-lanterns and pumpkins, dog dressed as a ghost in pumpkin patch full of jack-o-lanterns, at night, with stars overhead, and trees in the background, photorealistic, high-definition, detailed — ar 6:5 — s 5000.”
[بهشدت واقعگرا، منظرهای واقعی مثل عکس از سگ لابرادوری با لباس اشباح، سگ با لباسی از ملافه به شکل اشباح، دور آن کدوهای چشم-و-دماغ-درآوردهی جشن هالووین، سگ با لباس اشباح در کشتزاری پر از کدوهای جشن هالووین، در شب، ستارهها در بالای سر، و درختانی در پسزمینه، واقعی مثل عکس، وضوح بالا، پرجزئیات -نسبت تصویر ۶ به ۵- اس ۵۰۰۰[7].]
این بار هم به همان مشکل قبلی دچار شدم. هوشمصنوعی کلیدواژهها را میفهمید، اما همچنان این واژهها را با مفاهیم نزدیکشان مرتبط میکرد.
البته این لزوماً اتفاق بدی نیست، چون فضایی برای خلاقیت فراهم میآورد. من وقتی به تصویر بالا نگاه میکنم میتوانم داستانی را تخیل کنم دربارهی سگی که تصادفاً در شب هالووین به دنیای پس از مرگ سفر کرده است. شاید این سگ کدوها را با توپ اشتباه گرفته و تصمیم گرفته تا وقتی صاحب خود را پیدا کند در کشتزار کدو بازی کند. شاید کدوها ارواح راهبلدی هستند که میخواهند راه خانه را به سگ نشان دهند. شاید این تصویر دقیقاً همان چیزی نباشد که من میخواستهام، اما وقتی به هوش مصنوعی اجازهی تجربهکردن میدهم، میتوانم مفهومی را بهتر از آنچه در ذهنم خیال کرده بودم پرورش دهم. تقریباً مثل این است که همراه یک دوست دربارهی یک پروژه جلسهی بارش مغزی برگزار کنیم.
بااینحال، کار من هنوز تمام نشده بود. من میخواستم به آن ظاهر بهشدت واقعیای که در پیاموارهام ذکر کرده بودم برسم. برای همین شروع به ساخت نسخههای دیگری از این تصویر کردم تا اینکه به تصویر زیر رسیدم:
اینجا جایی است که این فرایند خلاقانه سرگرمکننده میشود چون، با اینکه این تصویر بیعیبونقص نیست، آنقدر جزئیات دارد که بتوان آن را مبنا گرفت و ویرایشش را شروع کرد. کسانی که با فوتوشاب و دیگر نرمافزارهای ویرایشی آشنا هستند میتوانند این عکس را آنطوری که میخواهند اصلاح کنند و اثری بسازند مختص خودشان.
به این صورت، آثارِ آفریدهی هوش مصنوعی بهترین شیوه برای مبتدیان و کسانی است که دچار انسداد خلاقیت[8] شدهاند و برای شروع پروژهشان نیاز به کمک دارند.
مهمترین قوتها و ضعفهای هوشمصنوعی چیستند؟
بنا به تجربهی من، آفرینشگرهای هوش مصنوعیِ موجود در ساخت منظرهها و آثار فانتزی بهتر عمل میکنند تا در ساخت تصویرهای واقعگرایانه از انسانها. بهخصوص سیستمهای هوشمصنوعیای مثل میدجرنی در کشیدن[9] دست و پا و صورت به تقلا میافتند. ممکن است حتی بعد از اینکه ویرایشهای لازم را در برنامه اعمال کردید باز هم تصویرتان بانویی بدون دست، یا برعکس با سه دست، باشد. اما وقتی مساله بر سر سایهزنی و نورپردازی و احساس[10] باشد، هوش مصنوعی فراتر از انتظار عمل میکند.
هوش مصنوعی میتواند همهنوع اثری تولید کند، از جمله نقاشیهای آبرنگ، تصاویر بهشدت واقعی، فانتزی، سوررئالیستی، و انتزاعی. بااینحال، به نظر میرسد هوش مصنوعی میل به غرابت[11] دارد.
بیشتر عکسهای «واقعگرایانهی» آفریدهی هوشمصنوعی از آدمها شبیه آدمهای واقعی نیستند. در این عکسها، آدمها معمولاً پوستی محو و مات، چشمانی درشت، و یک جور حالت عجیبوغریب مشترکی دارند که تنها میتوان آن را با صفت «کامپیوتری» توصیف کرد. و بااینحال، همین گیر-و-گرفتها در تصاویر واقعگرایانه بهخوبی به ساخت شخصیتهای فانتزی و داستانی خدمت میکند، چون در این ژانرها نیازی به پشتیبانی از اجزای واقعگرایانهی صورت انسان وجود ندارد.
آثار مرا در ادامه ببینید. ترول باغی[12] همزمان هم چندشآور است و هم بامزه. غول یخی شبیه پادشاهی مهربان و درعینحال خوفناک است. مرد پوشیده در برگها مثل این است که نگهبان جنگل باشد. و زن محصور در گلها شیرین و رام است، انگار که متعلق به نقاشیای قدیمی باشد.
هیچکدام از این تصاویر قرار نبوده مثل تصویر اول این مقاله واقعگرایانه باشد، و به همین خاطر است که من توانستهام با هوش مصنوعی، و نه علیه هوش مصنوعی، کار کنم و تصاویری هنری و خلاقانه بسازم.
میتوان با ویرایشگرهای پیشرفتهتر روی این عکسها کار کرد و جزئیات آنها را بیش از آنچه هوش مصنوعی میتواند افزایش داد و آنها را واقعنمایانهتر کرد. اما اگر ضعفهای فرضی این سیستم را بپذیرید، میتوانید از آنها به نفع خودتان استفاده کنید.
صرفنظر از اینکه از چه برنامهای استفاده میکنید، واضح است که آفرینشگرهای هوش مصنوعی رویکرد یگانهای را نسبت به هنر فراهم میآورند و آفرینندگی -این خواست انسانی- را با سرعت و عمق فهم کامپیوتر ترکیب میکنند. بسیار جذاب است که ببینیم هنرمندان حرفهای چگونه در آیندهی نزدیک از این امکانات بهره میبرند.
پانویسها
[1] Brenda Covarrubias
[2] Midjourney
[3] Discord
[4] Midjourney Bot
[5] prompt
[6] جشن هالووین در ۳۱ اکتبر برگزار میشود که برابر است با ۹ آبان و طبق گفتهی ویکیپدیای فارسی «بسیاری از سنتهای هالووین برگرفته از مراسمهای فصل برداشت محصول در فرهنگ باستانی سلتها... است.»
[7] معنای این آخری را نفهمیدم. مترجم
[8] Creator’s block
[9] rendering
[10] perception
[11] Prone to the uncanny
[12] Garden troll