توجه: این قسمت شامل توضیحات کاملا به درد نخور هستش. اگر قصد نصب و راهاندازی Stable Diffusion را دارید، حتما به قسمت ۱ مراجعه کنید. در اکثر موارد خواندن این قسمت ( قسمت ۰.۵) اتلاف وقت هستش.
البته این پست نیاز هستش تا دوستان طرفدار نرمافزار آزاد کلهی بنده رو از تن جدا نکنند! بسیاری از کدها و مدلهایی که در حال استفاده هستند، تحت مجوز Creative ML OpenRAIL-M انتشار پیدا کرده اند. مجوزی که استفاده از مدلها رو برای اهداف آزاد ارائه میدند. البته دارای محدودیت هایی نیز هستش (به عنوان مثال مدلهای استفاده شده نباید در جهت تولید محتوا برای صدمه زدن به اقلیتها و یا دیگران استفاده بشه و یا قوانین محلی-کشوری رو نقض کنه) ضمنا مسئولیت انتشار محتوا و حق نشر هم بر عهده شماست.
نکتهای هم که باید بدونید اینه که برخی مدلهای آموزش داده شده، توسط عکسهایی آموزش داده شده اند که سازنده الزاما دسترسی و مجوز برای استفاده از اون اثر رو در جهت آموزش مدلهای هوش مصنوعی نداده. به عنوان مثال، خود مدل اصلی که Stable Diffusion استفاده میکنه، از تصاویر laion-5b استفاده میکنه. LAION-5B شامل ۵ میلیارد تصاویر جمعآوری شده از سطح اینترنت هستش که جهت یادگیری هوش مصنوعی تگ گذاری شدهاند. بسیاری از این تصاویر دارای مجوزهای مختلف هستند، و برخی از سازندگان این تصاویر گفتند که رضایت نداشتند که از محتوای تولید شدهی اونها در یادگیری ماشین استفاده بشه. در حال نوشتن این مطلب، همچنان یک دادگاه بین برخی از هنرمندان معترض! با این شرکتها در حال پیگیری هستش. صرفه نظر از نتیجهی دادگاه، شما بهتره که بدونید در مدل آموزش دیدهی شما ممکنه تصاویری استفاده شده باشه که طراح اون اثر اصلا رضایت استفاده از اون اثر برای استفاده در مدلها نداشته باشه. همواره در بروزرسانی مدلهای مختلف، مخصوصا مدل اصلی SD، برخی دادهها (تصاویر اصلی داده شده به هوش مصنوعی جهت یادگیری) بنا به درخواست هنرمند حذف میشوند. لذا در نتیجهی نهایی در نسخههای مختلف ممکن هستش که نتایج متفاوتی رو بگیرید.
نکته بعدی در مورد مدل مورد استفادهی ما هستش. در اکثر موارد، مگر اینکه ذکر بشه، از Anything AI استفاده خواهد شد. به عنوان نکته بگم که من به عنوان تفریح این محتواها رو تولید میکنم و نه به عنوان فعالیت جدی. لذا برای مصارف آموزشی، مخصوصا این مجموعه مقالهها، نیاز بود از یک مدل کم دردسر برای تولید استفاده بشه. اگر میخواستم برم سمت تولید عکسهای realistic، قطعا عکسها دارای ایرادات و مشکلات زیادی میشدند که نیاز به ریزهکاریهای زیادی بود تا خروجی خوب بگیریم. با تولید عکسهای انیمهای، ایرادات کمتر در عکس مشاهده میشن (به عنوان مثال عکس بالا ایرادات بسیار واضحی در قسمت دستها و نحوه گرفتن قلم، و همچنین قرارگیری چشمها داره که اصلا ولش میکنیم :) چون این عکس صرفا جهت خالی نبودن این مطلب تولید شده و دقت ۱۰۰٪ ای برای تولیدش گذاشته نشده)
ضمنا در مورد Anything AI و سایر مدلهای معروفی که در huggingface و یا civitAI میبینید: هرچند این مدلها مجوز Creative ML OpenRAIL-M دارند، اما مدلها از روی مدلی که بعد از هک شدن سایت NovelAI نشت پیدا کرده بود، شده بود تولید شدهاند! لذا اگر بخواید پیگیر مجوز بازی! این مدلها بشید، داستان اساسی خواهید داشت. ممکنه یک روز داستان اتفاقات Anything AI و اینکه چرا منتشر کنندهی اون بروزرسانی دیگهای نمیده رو در یک پست جداگونه بنویسم. اما چون برخی از مخاطبین این پست روی موضوع نرمافزار آزاد ممکنه حساس باشند، باید بدونن که ممکنه برخی مدلهای هوش مصنوعی با برخی اصول اخلاقی خودشون جور در نیاد. رعایت اصول اخلاقی ارتباطی به قانونی بودن یا نبودن موضوع نداره. همچنین دوست ندارم وقت خودمو صرف کنم برای جر و بحث با دوستانی که دنبال ایراد گرفتن الکی هستند که جنجال راه بندازند. مدلهایی که بنده دارم استفاده میکنم، دارای مجوز CreativeML Open RAIL++-M License هستند.
در نهایت اگر حوصلهی سردرد گرفتن دارید، میتونید برید سراغ خوندن license ها و با افراد بیکار! بشینید ساعتها بحث کنید! من که حوصلهی این چیزها رو ندارم. (همچنین مدلها توسط بنده تولید نشده اند که بخوام نگران موضوعی باشم. قطعا RTX 3070 بنده کشش آموزش مدل رو نداره)