万万哇 发表于 2024-11-3 06:14:52

轻松识别Midjourney等AI生成图片,开源GenImage

AIGC时代,大家都可以使用Midjourney、Stable Diffusion等AI产品生成高质量图片,其逼真程度肉眼难以区分真假。这种虚伪照片偶然会对社会产生不良影响,比方,生成公众人物不雅图片用于散播谣言;合成虚伪图片用于金融欺诈,造成信任危机等。
因此,华为诺亚方舟实行室开源了百万量级的GenImage数据集,资助企业、开发者快速构建区分AI生成的图像和真实图像的检测器和评估工具,致力于构建AIGC时代的ImageNet。
开源地址:https://github.com/GenImage-Dataset/GenImage
论文:https://arxiv.org/abs/2306.08571
项目主页:https://genimage-dataset.github.io/

https://i-blog.csdnimg.cn/blog_migrate/30717d655883a4eb76e1572d7385d950.png
GenImage主要优点
1)大量图像,包括凌驾一百万对 AI 生成的假图像和收集的真实图像。
2)丰富的图像内容,涵盖广泛的1000类图像。
3) 开始进的生成器,Midjourney、Stable Diffusion、ADM、GLIDE、Wukong、VQDM等,利用先进的扩散模子和 GAN 合成图像。
上述优点使得在GenImage 上训练的检测器可以或许经过全面的评估,并表现出对不同图像的强盛适用性。
华为团队对数据集进行了全面分析,并提出了两个使命来评估类似于真实场景的检测方法。交叉生成器:检测器在一种生成器生成的数据上训练,在其他生成器生成的数据上验证。这个使命目标是观察检测器在不同生成器上的泛化能力。

https://i-blog.csdnimg.cn/blog_migrate/a3f617e80ee919a2b2d1e4bf701b9a0e.png
退化图像识别:检测器必要对于低分辨率,模糊和压缩图像进行识别。这个使命主要观察检测器在真实条件(如互联网上传播)中面对低质量图像时的泛化问题。
数据集先容
已往开源界也推出了一些数据集,主要有三个特点。第一数据规模小,第二都是基于GAN的,第三是局限于人脸数据。随着时间推移,数据规模渐渐地在增加,生成器也从GAN时代过渡到Diffusion时代,数据的范围也在增加。
但是一个大规模以Diffusion模子为主,涵盖各类通用图像的数据集仍然是缺失的。
基于此,华为团队提出一个对标imagenet的genimage数据集。真实的图片采用了ImageNet。

https://i-blog.csdnimg.cn/blog_migrate/e3cafd2734416c17ae9fa0e474a596d6.png
虚伪的图片采用ImageNet的标签进行生成。华为团队利用了八个先进的生成器来生成,分别是Midjourney,
Stable Diffusion V1.4, Stable Diffusion V1.5, ADM, GLIDE, Wukong,VQDM和BigGAN。
这些生成器生成的图片总数基本与真实图片一致。每个生成器生成的图片数量也基本一致。每一类生成的图片数量基本一致。
实行结果
华为团队做了一些实行来观察这个数据集。他们发如今某个生成器上训练的ResNet-50模子在其他的测试准确率会显着低落。
然而在真实环境下华为团队难以得知遇到的图像的生成器是什么。因此检测器对于不同生成器生成图片的泛化能力很重要。

https://i-blog.csdnimg.cn/blog_migrate/b7779534eefea55198c6a53b7174a452.png
华为团队对比了现有方法在Stable Diffusion V1.4上训练,然后在各种生成器上测试的结果,也评测了各种生成器上训练,然后在各种生成器上测试的结果。
Testing Subset那一列中的每一个数据点,都是在八个生成器上训练,然后在一个生成器上测试得到的平均结果。然后华为团队将这些测试集上的结果平均,得到最右侧的平均结果。

https://i-blog.csdnimg.cn/blog_migrate/18da1833b998ac191ab779695ef626bf.png

https://i-blog.csdnimg.cn/blog_migrate/9c051b6bc627e5c3cba958fac98d38bd.png
华为团队对测试集进行退化处理,采用不同参数下的低分辨率,JPEG压缩和高斯模糊,评测结果如下

https://i-blog.csdnimg.cn/blog_migrate/56be85527aa428e443465032d8abb45b.png
那么采集这么多数据是不是有用呢?华为团队做了相干实行,证明通过提升数据类比和每类的图片数量是可以进步性能。

https://i-blog.csdnimg.cn/blog_migrate/9ff0288c56d412cf03b0e17d593ab2da.png
针对GenImage数据集对于不同图片的泛化能力,华为团队发现他对于人脸和艺术类图片也能达到很好的结果。

https://i-blog.csdnimg.cn/blog_migrate/c96fee6cc8156f83b84c9c722b7d5d31.png


https://i-blog.csdnimg.cn/blog_migrate/48e49a5a68526a8a9f283e70e6832449.png
将来展望
随着AI生成图片能力的不绝提升,对于AI生成的图片实现有效检测的需求将会越来越迫切。本数据集致力于为真实环境下的生成图片检测提供有效训练数据。
华为团队使用ResNet-50在本数据集中训练,然后在真实推文中进行检测。如下图,ResNet-50可以或许有效识别真图和假图。
这个结果证明了GenIamge可以用于训练模子以鉴别真实世界的虚伪信息。华为团队以为,该范畴将来值得努力的方向是不绝提升检测器在GenImage数据集上的准确率,并进而提升其在真实世界面对虚伪信息的能力。

https://i-blog.csdnimg.cn/blog_migrate/3c28058f093acc4d0da971d9d2c52c7e.png
真实图片

https://i-blog.csdnimg.cn/blog_migrate/091b3ea7645069f849f885c018eac267.png
AI生成虚伪图片
本文素材泉源华为GenImage,如有侵权请联系删除
END

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 轻松识别Midjourney等AI生成图片,开源GenImage