هوش مصنوعی این روزها نُقل هر محفلیه! خصوصا بین تولید کنندگان محتوا و کسانی که به تولید محتوا علاقمندند. حتما شما هم در یوتیوب یا اینستاگرام با انواع راه های استفاده از هوش مصنوعی آشنا شدید. من هم با یکی از این راه ها از طریق یوتیوب آشنا شدم و ویدئو مریم صادقی را دیدم که خیلی خوب در مورد میدجرنی توضیح داده بود.
بعد خودم سرچ کردم و تصمیم گرفتم کمی در مورد آن، اینجا در اولین پست ویرگولم، بنویسم تا شما هم اگر دوست دارید با این موضوع آشنا شوید. Midjourney، طبق تعریف سازندگانش یک سرویس هوش مصنوعی تبدیل متن به تصویر است. در واقع متن میتواند از طریق این سرویس به تصویر تبدیل شود. خب بدون هیچ حرف اضافه ای سراغ کار با این ابزار برویم. ولی پیش از این، احتمالا باید به یکی از مهمترین سوالات شما پاسخ دهم:
آیا استفاده از این ابزار رایگان است؟ ابزار Midjourney برای تولید حدودا 25 عکس رایگان است ولی برای تولید عکس بیشتر باید مبلغی پرداخت کنید.
برای استفاده از این ابزار ابتدا باید discord را دانلود کنید. وارد سایت discord شوید و نسخه متناسب با دستگاه خودتان را دانلود کرده و نصب کنید. (مراحل خیلی ساده ای دارد) سپس باید در discord ثبت نام کنید که این کار هم به سادگی داشتن یک ایمیل و انتخاب پسورد دلخواه انجام میشود. پس از آن وارد سایت Midjourney شده و روی Join the Betta کلیک کنید تا خودش به طور اتوماتیک به سرورش در اپلیکیشن discord وصل شود.
اندکی آب بنوشید و کمی صبر کنید تا آیکون میدجرنی ظاهر شود. وقتی آیکون را انتخاب کنید یک سری room برای شما ظاهر میشود که البته اصلا عجیب نیست چرا که discord بیشتر از همه یک اپ چت است و شاید برای شما جالب باشد بدانید که گیمرها، به ویژه با این اپ خیلی آشنایی دارند. از این roomها آنهایی که جدید هستند را انتخاب کنید و وارد شوید. فراموش نکنید که قبل از اینکه وارد ساخت تصاویر جذاب دلخواهتان شوید باید ایمیل تایید از طرف Midjourny را تایید کنید.
در این roomها میتوانید تصاویر سایر افراد را هم ببینید که همین هم میتواند ایده های خلاقانه ای به شما دهد. حالا آماده هستید تا تصویر مورد نظر را تحویل بگیرید، کافیست تایپ کنید [imagine [prompt/
مثل تصویر زیر!
پرومپت (Prompt)، ورودی است که به میدجرنی میدهید و از آن یک خروجی تحویل میگیرید. Prompt در chatGPT هم کاربرد دارد و همان پیغام و ورودی است که به chatGPT میدهیم تا خروجی مورد نظرمان را دریافت کنیم. حالا شاید بپرسید این prompt باید چه ویژگی هایی داشته باشد.
مهمترین و اصلیترین ویژگی prompt چه در chatGPT و چه در Midjourney توجه به جزئیات است. همچنین میتوانید برای نوشتن prompt از chatGPT استفاده کنید. مسئله ای که برای استفاده از Midjourney به صورت رایگان وجود دارد این است که پیام شما در بین پیام ها گم میشود. برای حل این مشکل دو راه دارید:
میدجرنی چهار عکس برای هر Prompt به شما پیشنهاد میدهد. زیر هر چهار عکس شما حروفی رو میبینید تحت عنوان
U1 U2 U3 U4
V1 V2 V3 V4
حالا این حروف چه معنی دارد؟ انواع Uها در واقع شماره عکسها است که شما با انتخاب هرکدام از آنها تایید میکنید که کدام عکس را با رزولوشن بالاتر را دریافت کنید. انواع Vها هم به این معنی است که کدام عکس را متنوع تر و با تغییرات جزئی تر میخواهید. با انتخاب هر کدام از Vها هم شما میتوانید ورژن های متفاوتی از آن عکس را ببینید.
یک علامت رفرش هم میبینید که کاربرد آن مانند regeneration در chatGPT است.
سایز تصاویر به صورت پیش فرض، مربعی و 1:1 است. اگر بخواهید عکس هایی با نسبت های طول به عرض متفاوت داشته باشید باید چه کاری انجام دهید؟
خیلی ساده است، ولی پیش از آن باید بگویم نسبت ها به چه شکلی است: 4:5، 2:3، 9:16، 1:1 و افقی ها 16:9، 3:2.
حالا برویم سراغ تغییر سایز در میدجرنی. برای این کار مثلا برای نسبت 3:2 کافی است که Prompt را به شکل زیر بنویسیم:
/imagine[prompt]--ar 3:2
مهمترین بخش Midjourney دستورات یا همان prompt ها هستند. هم خود سازندگان Midjourny و هم سایر افراد با سرچ های خود پیشنهاداتی برای دریافت نتیجه بهتر مطرح میکنند که در ادامه ابتدا پیشنهادات سازندگان و سپس پیشنهادات دیگران را برررسی میکنیم.
توجه به جزئیات میتواند شما را در دریافت بهترین نتیجه یاری کند. طبق گفته خود سازندگان هر چه درخواست ساده تری داشته باشید، Midjourney تصویری کلی تر و نزدیکتر به پیش فرضهای خودش پیشنهاد میدهد.
در مورد گرامر باید بدانید که Midjourney طبق گفته سازندگانش متوجه گرامر نمیشود. البته انتخاب کلمات اهمیت دارد و به کارگیری مترادف های خاص تر در بسیاری شرایط باعث ایجاد نتیجه مطلوبتر میشود. ضمن اینکه میتوانید از کلمات کلیدی به جای استفاده از جملات بهره ببرید. این کلمات می توانند با ویرگول از یکدیگر جدا شوند. Midjourney همچنین تفاوتی در مورد بزرگ و کوچک بودن حروف قائل نیست. البته در بین نسخه های پنجگانه Midjourney بهترین آن در تشخیص ساختار جملات سنتی، احتمالا ورژن چهارم باشد.
توصیه بعدی سازندگان این است که بهتر است روی خواسته هایتان تمرکز کنید. سایت Midjourney اینطور توضیح میدهد که اگر در prompt خود، دستور "بدون کیک" را بنویسید احتمالا تصویر حاوی کیک خواهد بود. پس اگر میخواهید تصویری حاوی چیزی نباشد بهتر است از دستور no-- استفاده کنید.
همانطور که بارها اشاره کردیم هر چقدر جزئیات را شفافتر بیان کنید تصویر جذابتری نصیب شما میشود. ضمن اینکه اگر تعداد مشخصی در نظر دارید حتما آن تعداد مشخص را به طور دقیق ذکر کنید و به استفاده از صفات جمعی اکتفا نکنید.
همانطور که گفتیم این سرویس برای تبدیل متن به تصویر است پس این متن که به آن prompt میگویند، بسیار اهمیت دارد. در سرچ هایی که انجام دادم به یک سایت رسیدم که تعدادی prompt جالب معرفی میکرد. تصمیم گرفتم تعدادی از آنها را اینجا برای شما معرفی کنم:
این سایت بهترین promptها را در یک دسته بندی ماهانه ارائه داده است ولی من اینجا تعدادی را برحسب علاقه خود با شما به اشتراک میگذارم.
یک نکته مهم: پیش از اینکه در مورد promptها صحبت کنیم باید بدانید Midjourney از زبان فارسی پشتیبانی نمیکند. پس طبیعتا باید promptها به زبان انگلیسی باشند.
این دستور تصاویری براساس تصاویر یک تصویرگر و هنرمند به نام Nychos تولید میکند که به خلق تصاویری پرجزئیات، کمی ترسناک با کاربرد اشعه ایکس در آثارش شهرت دارد. استفاده از این prompt و ترکیب آن با واژه ی explode که نمایانگر حس حرکت است میتواند در خلق تصاویری جذاب به شما کمک کند. حتما میدانید که در بخش subject موضوع مورد نظر خود را باید بنویسید. در ادامه یکی از نمونه های این تصاویر را که بوسیله این prompt ایجاد شده است را میبینید:
دستور 2: "[subject] subject] as] "
این prompt هم جالب است و به این معنی است که از Midjourney میخواهد که چیزها یا کاراکترها در موضوع اول را به شکل موضوع دوم دربیاورد. یک نمونه را ببینید که تصویر هری پاتر را به شکل قهرمان های مارول درآورده است:
این دستور "Knolling" یک اصطلاح عکاسی برای عکس های از بالای سر از وسایل روی یک سطح صاف است. این وسایل به موازات یکدیگر یا در زوایای 90 درجه قرار میگیرند. Midjourney یکی از بهترین ها در به کار بردن knolling است.
نمایش دوگانه یک متد است که در آن لایه های دو عکس روی یکدیگر قرار میگیرد. البته با سطح نمایش متفاوت و با شدت کمتر از حد نرمال در آن واحد. به این شکل ترکیب جذابی از دو عکس با دو موضوع را میتوانید ببینید.
نمودارهای مقطعی لایه ها را از اشیاء سه بعدی جدا می کنند تا آنچه داخل آن است را نشان داده و توضیح دهد. Midjourney به خوبی این کار را انجام میدهد، حتی اگر محتوای داخلی آن مبهم باشد میتوانید تا حدود زیادی به این هوش مصنوعی اعتماد کنید.
اگر به تصاویر ژاپنی علاقمند هستید احتمالا این promot برای شما جذاب است. این prompt، خلق تصاویر به شیوه اوکییوئه است. اوکییوئه گونهای از چاپ کلیشهٔ چوبی است که به آن "تصاویر جهان شناور" نیز میگویند. این نوع از نقاشیها از قرن 17 تا 19 در ژاپن شکوفا شد. هنرمندان اوکییوئه صحنه هایی از زندگی روزمره و طبیعت را به شیوه ای متمایز و کارتونی به تصویر میکشیدند. در Midjourney، با استفاده از prompt بالا میتوانید این تصاویر را ایجاد کنید.
احتمالا از اسم این prompt حدس زدید که چه دستوری میدهد؟ یک لنز ماکرو به شما امکان می دهد از چیزهای مختلف عکسهای نزدیک و دقیق بگیرید. سوپر ماکرو یک گام هم فراتر میرود و شما را به موضوع نزدیکتر هم میکند. این برگ را از نزدیک ببینید:
این تصاویر با الهام از یک ژانر موسیقی به اسم Synthwave ساخته می شود. این ژانر عمدتاً از فرهنگ فیلم و بازی های ویدیویی دهه 80 الهام گرفته شده است. این تصاویر ویژگی هایی همچون استفاده از عناصر بصری مانند رنگهای نئون، اشکال هندسی ساده و پسزمینههای تیره دارند.
این ها فقط تعداد اندکی از promptها هستند. ضمن اینکه با عضویت در کانال ها هم میتوانید از تصاویر دیگران ایده بگیرید. همانطور که گفتیم chatGPT هم میتواند در این مسیر شما را یاری کند.
نمیخواهم حوصله تان از این مطلب سر برود، پس همینجا صحبت در مورد این prompt های جذاب را تمام میکنم ولی اگر علاقمند بودید در این مورد بیشتر بدانید میتوانید کامنت بگذارید تا سایت را به شما معرفی کنم یا مطلب دیگری در مورد promptها بنویسم.