h_r 71
h_r 71
خواندن ۳ دقیقه·۲ سال پیش

تولید تصاویر انیمه با Stable Diffusion - قسمت ۰.۵

توجه: این قسمت شامل توضیحات کاملا به درد نخور هستش. اگر قصد نصب و راه‌اندازی Stable Diffusion را دارید،‌ حتما به قسمت ۱ مراجعه کنید. در اکثر موارد خواندن این قسمت ( قسمت ۰.۵) اتلاف وقت هستش.



البته این پست نیاز هستش تا دوستان طرفدار نرم‌افزار آزاد کله‌ی بنده رو از تن جدا نکنند! بسیاری از کدها و مدلهایی که در حال استفاده هستند، تحت مجوز Creative ML OpenRAIL-M انتشار پیدا کرده اند. مجوزی که استفاده از مدلها رو برای اهداف آزاد ارائه میدند. البته دارای محدودیت هایی نیز هستش (به عنوان مثال مدلهای استفاده شده نباید در جهت تولید محتوا برای صدمه زدن به اقلیت‌ها و یا دیگران استفاده بشه و یا قوانین محلی-کشوری رو نقض کنه) ضمنا مسئولیت انتشار محتوا و حق نشر هم بر عهده شماست.

نکته‌ای هم که باید بدونید اینه که برخی مدلهای آموزش داده شده،‌ توسط عکس‌هایی آموزش داده شده اند که سازنده الزاما دسترسی و مجوز برای استفاده از اون اثر رو در جهت آموزش مدلهای هوش مصنوعی نداده. به عنوان مثال، خود مدل اصلی که Stable Diffusion استفاده میکنه، از تصاویر laion-5b استفاده میکنه. LAION-5B شامل ۵ میلیارد تصاویر جمع‌آوری شده از سطح اینترنت هستش که جهت یادگیری هوش مصنوعی تگ گذاری شده‌اند. بسیاری از این تصاویر دارای مجوزهای مختلف هستند، و برخی از سازندگان این تصاویر گفتند که رضایت نداشتند که از محتوای تولید شده‌ی اونها در یادگیری ماشین استفاده بشه. در حال نوشتن این مطلب، همچنان یک دادگاه بین برخی از هنرمندان معترض!‌ با این شرکتها در حال پیگیری هستش. صرفه نظر از نتیجه‌ی دادگاه، شما بهتره که بدونید در مدل آموزش دیده‌ی شما ممکنه تصاویری استفاده شده باشه که طراح اون اثر اصلا رضایت استفاده از اون اثر برای استفاده در مدلها نداشته باشه. همواره در بروزرسانی مدلهای مختلف، مخصوصا مدل اصلی SD،‌ برخی داده‌ها (تصاویر اصلی داده شده به هوش مصنوعی جهت یادگیری)‌ بنا به درخواست هنرمند حذف میشوند. لذا در نتیجه‌ی نهایی در نسخه‌های مختلف ممکن هستش که نتایج متفاوتی رو بگیرید.


نکته بعدی در مورد مدل مورد استفاده‌ی ما هستش. در اکثر موارد،‌ مگر اینکه ذکر بشه،‌ از Anything AI استفاده خواهد شد. به عنوان نکته بگم که من به عنوان تفریح این محتواها رو تولید میکنم و نه به عنوان فعالیت جدی. لذا برای مصارف آموزشی،‌ مخصوصا این مجموعه مقاله‌ها، نیاز بود از یک مدل کم دردسر برای تولید استفاده بشه. اگر میخواستم برم سمت تولید عکس‌های realistic، قطعا عکس‌ها دارای ایرادات و مشکلات زیادی میشدند که نیاز به ریزه‌کاری‌های زیادی بود تا خروجی خوب بگیریم. با تولید عکس‌های انیمه‌ای، ایرادات کمتر در عکس مشاهده میشن (به عنوان مثال عکس بالا ایرادات بسیار واضحی در قسمت دست‌ها و نحوه گرفتن قلم، و همچنین قرارگیری چشم‌ها داره که اصلا ولش میکنیم :) چون این عکس صرفا جهت خالی نبودن این مطلب تولید شده و دقت ۱۰۰٪‌ ای برای تولیدش گذاشته نشده)

ضمنا در مورد Anything AI و سایر مدلهای معروفی که در huggingface و یا civitAI میبینید: هرچند این مدلها مجوز Creative ML OpenRAIL-M دارند، اما مدل‌ها از روی مدلی که بعد از هک شدن سایت NovelAI نشت پیدا کرده بود، شده بود تولید شده‌اند! لذا اگر بخواید پیگیر مجوز بازی!‌ این مدلها بشید، داستان اساسی خواهید داشت. ممکنه یک روز داستان اتفاقات Anything AI و اینکه چرا منتشر کننده‌ی اون بروزرسانی دیگه‌ای نمیده رو در یک پست جداگونه بنویسم. اما چون برخی از مخاطبین این پست روی موضوع نرم‌افزار آزاد ممکنه حساس باشند، باید بدونن که ممکنه برخی مدل‌های هوش مصنوعی با برخی اصول اخلاقی خودشون جور در نیاد. رعایت اصول اخلاقی ارتباطی به قانونی بودن یا نبودن موضوع نداره. همچنین دوست ندارم وقت خودمو صرف کنم برای جر و بحث با دوستانی که دنبال ایراد گرفتن الکی هستند که جنجال راه بندازند. مدلهایی که بنده دارم استفاده میکنم، دارای مجوز CreativeML Open RAIL++-M License هستند.

در نهایت اگر حوصله‌ی سردرد گرفتن دارید، میتونید برید سراغ خوندن license ها و با افراد بیکار! بشینید ساعت‌ها بحث کنید! من که حوصله‌ی این چیزها رو ندارم. (همچنین مدلها توسط بنده تولید نشده اند که بخوام نگران موضوعی باشم. قطعا RTX 3070 بنده کشش آموزش مدل رو نداره)

هوش مصنوعیتولید
شاید از این پست‌ها خوشتان بیاید