من با هوش مصنوعی یک ماه آثار هنری تولید کردم. و این‌طوری بود که...

نویسنده: برندا کوواروبیاس[1]

منبع: Medium

مزایا و معایب آثار آفریده‌شده با هوش مصنوعی

[توضیح مترجم: من قصد دارم (و در عمرم از این قصدهای نافرجام زیاد داشته‌ام) که ده مقاله درباره‌ی آثار هنریِ آفریده‌ی هوش مصنوعی ترجمه کنم و در اینترنت منتشر کنم تا اگر استقبالی از آن‌ها شد، به فکر کار جدی‌تری در همین رابطه بیفتم. این سومین مقاله است. مقاله‌ی اول را از اینجا و مقاله‌ی دوم را از اینجا بخوانید.]

اثر هنری چیست؟ از نظر بعضی‌ها بیانی انسانی است، که در نقاشی‌ها و موسیقی و فیلم می‌بینیم. از نظر بعضی دیگر، نوعی از سرگرمی است، چیزی که بی‌اراده از آن لذت می‌بریم، اما لزوماً جدی‌اش نمی‌گیریم. گاهی معنایی دارد. گاهی ندارد. اما یک چیز ثابت است: اثر هنری را انسان برای انسان می‌آفریند.

لااقل اینکه قدیم‌ها این‌طوری بود.

هنرِ آفریده‌ی هوش مصنوعی مفهومی نسبتاً جدید در جهان هنر است و هنوز به‌اندازه‌ی کافی پرورانده نشده و شرکت‌های فن‌آوری در تقلا هستند تا سبک‌ها و تکنیک‌های هنر انسانی را با سرعت تکنولوژی ترکیب کنند. انتظار می‌رود که آفرینشگرهای هنری بتوانند با جمع‌آوری اطلاعات از سرتاسر اینترنت یاد بگیرند که چگونه طبق پیام‌واره تصویر جدیدی بسازند.

من عاشق ساخت آثار هنری هستم، اما از مهارت بی‌بهره‌ام. یک روز با خودم فکر کردم بگذار هوش مصنوعی را امتحان کنم تا ببینم می‌تواند کمکم کند چیز جدیدی بسازم یا نه. من به مدت یک ماه از آفرینشگر آثار هنریِ میدجرنی[2] استفاده کردم. نتیجه‌ی کار فراتر از انتظارم بود و پنجره‌ای به‌سوی مهم‌ترین قوت‌ها و ضعف‌های هوش مصنوعی باز کرد.

آفرینشگر هوش مصنوعی چه شکلی کار می‌کند؟

مثل بسیاری از آفرینشگرهای هوش مصنوعی، میدجرنی پیش از اینکه بازدیدکنندگان را به صفحه‌ی عضویت هدایت کند اجازه‌ی تعداد اندکی دانلود مجانی را می‌دهد. عضویت ماهانه ۱۰ تا ۵۰ دلار آب می‌خورد، که با گران‌ترین رقم عضویت می‌توانید به‌صورت نامحدود دانلود و تولید داشته باشید، ضمن اینکه حالت خصوصی هم در اختیار دارید.

برای اینکه فرد بتواند اثری بسازد، باید در صفحه‌ی دیسکوردِ[3] آن‌ها عضو شود و در هر کانالی که در دسترس است شروع به کار کند، یا اینکه از ربات میدجرنی[4] استفاده کند، که برای این کار باید در نوار گفتگو پیام‌واره‌ای[5] بفرستد. بر عهده‌ی خودتان است که در پیام‌واره جزئیات را کم یا زیاد تعریف کنید. گفتن ندارد که هرچقدر بیشتر جزئیات را مشخص کنید، تصویر به آنچه در ذهن‌تان دارید نزدیکتر می‌شود. همچنین با تعیین ابعاد مورد نظرتان می‌توانید اندازه‌ی تصویر را کنترل کنید.

روبات [ِ میدجرنی] برای پیام‌واره‌ی شما چهار پاسخ ارائه می‌دهد. شما می‌توانید هرکدام از این تصویرها را، یا همه‌ی آن‌ها را، بازبینی کنید و کیفیت آن‌ها را ارتقا دهید.

در تصویر زیر، من پیام‌واره‌ای ساده و بدون جزئیاتی چندان را به روبات دادم. پیام‌واره این بود:

“Dog dressed as ghost surrounded by jack-o-lanterns at night.”

[سگی که مثل اشباح لباس پوشیده و دورش را کدوهای جشن هالووین گرفته‌اند در شب.]

من کیفیت عکس سوم (U3) را ارتقا دادم و به ساخت نسخه‌های دیگر از آن در این برنامه ادامه دادم تا به طرح اولیه‌ای که می‌خواستم رسیدم، که در پایین آن را می‌بینید.

من تا آنجایی که می‌شد جزئیات را کم گرفته بودم، برای همین بیشتر تخیل [در این تصویر] بر عهده‌ی خود هوش مصنوعی بوده است. این می‌تواند خوب باشد یا بد. بستگی دارد به اینکه شما به چه نوع اثری می‌خواهید برسید.

مشکل اینجا است: به‌نظر می‌رسد هوش مصنوعی بعضی از واژه‌ها را با بعضی دیگر ارتباط می‌دهد و مفاهیمی را که در پیام‌واره وارد نشده با هم ترکیب می‌کند، مگر اینکه پیام‌واره خیلی دقیق باشد.

پس، در این مورد، با اینکه هوشِ‌مصنوعی فهمید که من سگی می‌خواهم که در شب به شکل اشباح لباس پوشیده و در کنارش کدوهای جشن هالووین باشد، اما درنیافت که هرکدام از این‌ها را کجا می‌خواهم بگذارم و می‌خواهم هرکدام چه کاری انجام دهند. در نتیجه، این برنامه مفاهیمی را که در پیام‌واره‌ام نبود با هم ترکیب کرد و کدوهای جشن هالووین را شبیه برگ (در ارتباط با واژه‌ی «اشباح» و به خاطر پاییز[6]) و توپ (در ارتباط با واژه‌ی «سگ») درآورد.

من رویکردم را عوض کردم و تا جایی که می‌شد [به پیام‌واره] جزئیات اضافه کردم. پیام‌واره‌ی من این شد:

“hyper-realistic, photorealistic landscape of labrador dog dressed as a ghost, dog dressed as a ghost in bedsheets, surrounded by carved jack-o-lanterns and pumpkins, dog dressed as a ghost in pumpkin patch full of jack-o-lanterns, at night, with stars overhead, and trees in the background, photorealistic, high-definition, detailed — ar 6:5 — s 5000.”

[به‌شدت واقع‌گرا، منظره‌ای واقعی مثل عکس از سگ لابرادوری با لباس اشباح، سگ با لباسی از ملافه به شکل اشباح، دور آن کدوهای چشم-و-دماغ-درآورده‌ی جشن هالووین، سگ با لباس اشباح در کشتزاری پر از کدوهای جشن هالووین، در شب، ستاره‌ها در بالای سر، و درختانی در پس‌زمینه، واقعی مثل عکس، وضوح بالا، پرجزئیات -نسبت تصویر ۶ به ۵- اس ۵۰۰۰[7].]

این بار هم به همان مشکل قبلی دچار شدم. هوش‌مصنوعی کلیدواژه‌ها را می‌فهمید، اما همچنان این واژه‌ها را با مفاهیم نزدیکشان مرتبط می‌کرد.

البته این لزوماً اتفاق بدی نیست، چون فضایی برای خلاقیت فراهم می‌آورد. من وقتی به تصویر بالا نگاه می‌کنم می‌توانم داستانی را تخیل کنم درباره‌ی سگی که تصادفاً در شب هالووین به دنیای پس از مرگ سفر کرده است. شاید این سگ کدوها را با توپ اشتباه گرفته و تصمیم گرفته تا وقتی صاحب خود را پیدا کند در کشتزار کدو بازی کند. شاید کدوها ارواح راه‌بلدی هستند که می‌خواهند راه خانه را به سگ نشان دهند. شاید این تصویر دقیقاً همان چیزی نباشد که من می‌خواسته‌ام، اما وقتی به هوش مصنوعی اجازه‌ی تجربه‌کردن می‌دهم، می‌توانم مفهومی را بهتر از آنچه در ذهنم خیال کرده بودم پرورش دهم. تقریباً مثل این است که همراه یک دوست درباره‌ی یک پروژه جلسه‌ی بارش مغزی برگزار کنیم.

بااین‌حال، کار من هنوز تمام نشده بود. من می‌خواستم به آن ظاهر به‌شدت واقعی‌ای که در پیام‌واره‌ام ذکر کرده بودم برسم. برای همین شروع به ساخت نسخه‌های دیگری از این تصویر کردم تا اینکه به تصویر زیر رسیدم:

اینجا جایی است که این فرایند خلاقانه سرگرم‌کننده می‌شود چون، با اینکه این تصویر بی‌عیب‌ونقص نیست، آن‌قدر جزئیات دارد که بتوان آن را مبنا گرفت و ویرایشش را شروع کرد. کسانی که با فوتوشاب و دیگر نرم‌افزارهای ویرایشی آشنا هستند می‌توانند این عکس را آن‌طوری که می‌خواهند اصلاح کنند و اثری بسازند مختص خودشان.

به این صورت، آثارِ آفریده‌ی هوش مصنوعی بهترین شیوه برای مبتدیان و کسانی است که دچار انسداد خلاقیت[8] شده‌اند و برای شروع پروژه‌شان نیاز به کمک دارند.

مهم‌ترین قوت‌ها و ضعف‌های هوش‌مصنوعی چیستند؟

بنا به تجربه‌ی من، آفرینشگرهای هوش مصنوعیِ موجود در ساخت منظره‌ها و آثار فانتزی بهتر عمل می‌کنند تا در ساخت تصویرهای واقع‌گرایانه از انسان‌ها. به‌خصوص سیستم‌های هوش‌مصنوعی‌ای مثل میدجرنی در کشیدن[9] دست و پا و صورت به تقلا می‌افتند. ممکن است حتی بعد از اینکه ویرایش‌های لازم را در برنامه اعمال کردید باز هم تصویرتان بانویی بدون دست، یا برعکس با سه دست، باشد. اما وقتی مساله بر سر سایه‌زنی و نورپردازی و احساس[10] باشد، هوش مصنوعی فراتر از انتظار عمل می‌کند.

هوش مصنوعی می‌تواند همه‌نوع اثری تولید کند، از جمله نقاشی‌های آبرنگ، تصاویر به‌شدت واقعی، فانتزی، سوررئالیستی، و انتزاعی. بااین‌حال، به نظر می‌رسد هوش مصنوعی میل به غرابت[11] دارد.

بیشتر عکس‌های «واقع‌گرایانه‌ی» آفریده‌ی هوش‌مصنوعی از آدم‌ها شبیه آدم‌های واقعی نیستند. در این عکس‌ها، آدم‌ها معمولاً پوستی محو و مات، چشمانی درشت، و یک جور حالت عجیب‌وغریب مشترکی دارند که تنها می‌توان آن را با صفت «کامپیوتری» توصیف کرد. و بااین‌حال، همین گیر-و-گرفت‌ها در تصاویر واقع‌گرایانه به‌خوبی به ساخت شخصیت‌های فانتزی و داستانی خدمت می‌کند، چون در این ژانرها نیازی به پشتیبانی از اجزای واقع‌گرایانه‌ی صورت انسان وجود ندارد.

آثار مرا در ادامه ببینید. ترول باغی[12] همزمان هم چندش‌آور است و هم بامزه. غول یخی شبیه پادشاهی مهربان و درعین‌حال خوفناک است. مرد پوشیده در برگ‌ها مثل این است که نگهبان جنگل باشد. و زن محصور در گل‌ها شیرین و رام است، انگار که متعلق به نقاشی‌ای قدیمی باشد.

هیچ‌کدام از این تصاویر قرار نبوده مثل تصویر اول این مقاله واقع‌گرایانه باشد، و به همین خاطر است که من توانسته‌ام با هوش مصنوعی، و نه علیه هوش مصنوعی، کار کنم و تصاویری هنری و خلاقانه بسازم.

می‌توان با ویرایشگرهای پیشرفته‌تر روی این عکس‌ها کار کرد و جزئیات آن‌ها را بیش از آنچه هوش مصنوعی می‌تواند افزایش داد و آن‌ها را واقع‌نمایانه‌تر کرد. اما اگر ضعف‌های فرضی این سیستم را بپذیرید، می‌توانید از آن‌ها به نفع خودتان استفاده کنید.

صرف‌نظر از اینکه از چه برنامه‌ای استفاده می‌کنید، واضح است که آفرینشگرهای هوش مصنوعی رویکرد یگانه‌ای را نسبت به هنر فراهم می‌آورند و آفرینندگی -این خواست انسانی- را با سرعت و عمق فهم کامپیوتر ترکیب می‌کنند. بسیار جذاب است که ببینیم هنرمندان حرفه‌ای چگونه در آینده‌ی نزدیک از این امکانات بهره می‌برند.


پانویس‌ها

[1] Brenda Covarrubias

[2] Midjourney

[3] Discord

[4] Midjourney Bot

[5] prompt

[6] جشن هالووین در ۳۱ اکتبر برگزار می‌شود که برابر است با ۹ آبان و طبق گفته‌ی ویکی‌پدیای فارسی «بسیاری از سنت‌های هالووین برگرفته از مراسم‌های فصل برداشت محصول در فرهنگ باستانی سلت‌ها... است.»

[7] معنای این آخری را نفهمیدم. مترجم

[8] Creator’s block

[9] rendering

[10] perception

[11] Prone to the uncanny

[12] Garden troll