شناسایی تصاویر تولید شده با GAN ساده شد

منتشرشده در: مجله Syncedreview به تاریخ ۴ مارچ ۲۰۲۰
نویسنده: Hecate He
لینک مقاله اصلی:https://medium.com/syncedreview/spotting-generated-images-just-got-much-easier-4b8032d0fe28

تکنیک‌های ایجاد تصویر برگرفته از هوش مصنوعی امروزی براساس GANها (شبکه‌های مولد خصمانه) و روش‌های دیگر می‌توانند تصاویر بسیار واقعی ایجاد کنند که تشخیص آن‌ها از تصاویر واقعی بسیار دشوار است. چنین فن‌آوری تولید تصویری می‌تواند تهدیدی جدی برای جامعه باشد، چرا که تصاویر تقلبی پتانسیل تاثیر گذاری بر این که مردم جهان را چگونه می‌بینند و می‌توانند افکار عمومی و حتی انتخابات را تحت‌تاثیر قرار دهند. در دست‌های اشتباه، تولید تصویر می‌تواند به عنوان ابزاری برای دستکاری یا آزار و اذیت استفاده شود و همچنین می‌تواند در امنیت هوش مصنوعی و سیستم‌های ایمنی اختلال ایجاد کند.

شناسایی تصاویر تولید شده با هوش مصنوعی با این حال از نظر فنی لارم است. اگرچه تشخیص یک تصویر که توسط یک تکنیک خاص ایجاد شده‌است می‌تواند نسبتا ساده باشد، اما چنین روش‌هایی به دلیل این واقعیت که روش‌های تولید تصویر بسیار متنوع هستند، با مجموعه داده‌های آموزشی مختلف، ساختارهای شبکه، توابع تلفات و حتی روش‌های پیش‌پردازش تصویر، فاقد قابلیت تعمیم هستند. این یک چالش برای طبقه‌بندی کننده آموزش‌دیده برای تشخیص یک رویکرد موثر بر تصاویر تولید شده توسط مدل‌های دیگر است.

برای پرداختن به این موضوع، دانشگاه برکلی و ادوبی ریسرچ آشکارساز "جهانی" را معرفی کرده‌اند که می‌تواند تصاویر واقعی را از تصاویر تولید شده بدون در نظر گرفتن این که چه معماری‌ها و یا مجموعه داده‌ها برای آموزش استفاده می‌شوند، تشخیص دهد.

محققان ۱۱ مدل مختلف تولید کننده تصویر مبتنی بر شبکه‌های عصبی کانولوشن - عمدتا ‌GANها - را جمع‌آوری کردند که تا کنون رایج‌ترین طراحی‌ها برای سی‌ان‌ان هستند. آن‌ها کار خود را با استفاده از ProGAN برای آموزش یک طبقه‌بندی کننده عمومی آغاز کردند و آن را در مقابل دیگر تولید کننده‌های تصویر مبتنی بر سی‌ان‌ان تست کردند.

یک طبقه‌بندی کننده آموزش‌دیده برای تشخیص تصاویر تولید شده توسط ProGAN (در سمت چپ ) و مدل‌های دیگر
یک طبقه‌بندی کننده آموزش‌دیده برای تشخیص تصاویر تولید شده توسط ProGAN (در سمت چپ ) و مدل‌های دیگر
نتایج تست برای طبقه‌بندی کننده‌های قانونی در انواع روش‌های تولید تصویر مبتنی بر سی‌ان‌ان
نتایج تست برای طبقه‌بندی کننده‌های قانونی در انواع روش‌های تولید تصویر مبتنی بر سی‌ان‌ان
تاثیر روش‌های تقویت
تاثیر روش‌های تقویت

نتایج آزمایش نشان می‌دهد که مدل‌های جرم‌شناسی آموزش‌دیده بر روی تصاویر تولید شده توسط سی‌ان‌ان می‌توانند تعمیم خود را به دیگر مدل‌های تصادفی سی ان ان نشان دهند. محققان همچنین کشف کردند که افزایش داده برای تولید و همچنین تنوع تصاویر آموزشی مهم است. مثال گرفتنBigGAN - با افزایش دقت متوسط (AP) به طور قابل‌توجهی از ۷۲.۲ به ۸۸.۲ بهبود می‌یابد. عملکرد برای مدل‌های دیگر (CycleGAN,GauGAN) نیز به همین ترتیب بهبود یافته‌است، ۸۴.۰ تا ۹۶.۸ و ۶۷.۰ تا ۹۸.۱. به طور کلی، آموزش با افزایش، به افزایش عملکرد کمک می‌کند.

تاثیر تنوع مجموعه داده‌ها
تاثیر تنوع مجموعه داده‌ها

محققان همچنین دریافتند که وقتی تعداد طبقات استفاده‌شده از ۲ به ۱۶ افزایش یابد، AP بهبود می‌یابد. اما این مساله تنها تا حدی درست است، زیرا با افزایش تعداد کلاس‌ها از ۱۶ به ۲۰، کم‌ترین بهبود وجود دارد.


این مقاله توسط مترجم تخصصی هوش مصنوعی و به صورت خودکار ترجمه شده و با حداقل ویرایش و بازبینی انسانی منتشر شده است.