九天猎人 发表于 2024-8-10 16:44:32

Stable Diffusion教程:额外功能/后期处理/高清化

"额外功能"对应的英文单词是Extras,算是直译。但是部分版本中的翻译是“后期处理”或者“高清化”,这都是意译,因为它的重要功能是放大图片、去噪、修脸等对图片的后期处理。注意这里边对图片的处理不是 Stable Diffusion 本身的能力,都是额外扩展的。
下面正式开始先容“额外功能”的相干能力。
图片放大

先看最根本的图片放大能力。对于分辨率比较小的图片,假如逼迫用较大的分辨率展示,会出现图片暗昧的环境,这时间就可以利用SD WebUI的图片放大功能。所谓图片放大就是在保持图片清晰度的前提下增加图片的分辨率,它还有个专业点的名词:超分辨率技术,简称为“超分”。
详细操作方式请参考下图:
https://img-blog.csdnimg.cn/img_convert/9ff5bf189b6129eeebaa63a57d26d052.webp?x-oss-process=image/format,png
1、主菜单中点击进入“额外功能”。
2、点击“单张图像”,也就是一次只处理一张图片。后边的“批量处理”可以上传多张图片进行处理,“批量处理目次下图像”可以指定处理一个目次下的全部图片。
3、点击上传一张要处理的图片。
4、选择缩放比例。这里有两种方式:按照比例缩放和指定分辨率缩放,指定分辨率时可以设置是否自动裁剪,都很好明白,试试就明白了。
5、Upscaler1用来指定放大算法,常见的放大算法有下面几个:


[*]无/None:单纯的放大,不做任何优化处理。
[*]Lanczos:利用加权平均插值方法,利用原始图像自身的像素信息,增加图像的细节,从而进步图像的分辨率。传统的纯数学算法,结果一般。
[*]Nearest:利用简朴的插值方法,基于近来邻像素的值进行插值,从而增加图像的细节和进步分辨率。传统的纯数学算法,结果一般,还不如 Lanczos 的结果好。
[*]LDSR:基于深度学习,通过利用轻量级的网络结构和残差学习,实现较高的超分性能和盘算效率。适用于各种需要快速且准确地进步图像分辨率的应用场景,如实时视频处理、移动装备图像处理等。
[*]ESRGAN:全称Enhanced Super-Resolution Generative Adversarial Networks (增强超分生成对抗网络),基于深度学习的超分辨率算法。增加了很多看上去很真实的纹理,但是有时可能会过分拟合,出现不好的结果。
[*]4x-UltraSharp:基于ESRGAN做了优化,比较适合处理真人。
[*]ESRGAN_4x:Real ESRGAN,完全利用纯合成数据来尽量贴近真实数据进行练习。腾讯贡献。
[*]R-ESRGAN 4x+:基于Real ESRGAN的优化模型,适合放大真实风格的图片,常用。
[*]R-ESRGAN 4x+ Anime6B:基于Real ESRGAN的优化模型,适合放大动漫风格的图片,常用。
[*]ScuNET GAN:基于深度学习,利用生成对抗网络(GAN)进行练习。重要用在进步图像的视觉结果和感知质量,例如在图像增强、视频处理等。
[*]ScuNET PSNR:基于深度学习,利用均方偏差(PSNR)进行练习。重要用在进步图像的客观质量和准确性,例如在医学图像分析、监控视频处理等。
[*]SwinIR_4x:利用Swin Transformer思想,基于自注意力机制的Transformer结构,适合各种图像的超分,比较通用。
这些算法会在首次利用它们时分别下载,你也可以提前下载它们,并放到指定的目次。我整理的SD绘画资源中已经网络了这些文件,下载方式请看本文最后的部分。
6、Upscaler2 用来制止 Upscaler1 过分处理的题目,比如磨皮太严重。可以利用一些平凡方法算法,比如 Lanczos。Upscaler2 可见度是指图片放大时利用 Upscaler2 算法进行处理的比例,为0时完全倒霉用 Upscaler2,为1时只利用 Upscaler2。
7、点击“生成”。
8、放大后的图片在这里显示。
小结
这个图片放大功能重要是为了放大 Stable Diffusion 生成的低分辨率图片,因为图片分辨率越大对显存的要求也越大,所以对于显存较小的同学,可以先在文生图中生成一张低分辨率图片,然后再在这里放大。
对于修复暗昧图片,这个图片放大功能实在能力有限,实际测试 WebUI 默认自带的放大算法也就是能去去噪点,消消锯齿,出图的结果并不是很好,特殊是本来就很糊的图片。
不过可能存在别的的算法具备较好的暗昧图片修复结果,各人可以找来试试。保举一个放大模型的下载站点:openmodeldb.info/
修脸

虽然图片放大本身对修复暗昧图片的结果有限,但是它附带了一个修脸的参数。假如文生图生成的人脸结果不好,比如磨皮太严重、人脸变形等,都可以在这里试试。对于暗昧的人脸,也有比较好的修复结果。
修脸方法支持两个模型:GFPGAN 和 CodeFormer,操作方法参见下图:
https://img-blog.csdnimg.cn/img_convert/f5385dfc13c1332c2f4619fdea4efb4e.webp?x-oss-process=image/format,png
1、GFPGAN:腾讯开源的一个修脸模型,修复的细节比较清晰,人物形象的还原度比较高,气质保持的好。
2、CodeFormer:另一个修脸模型,修图的细节也比较清晰,皮肤纹理更真实一些,不过这个模型对牙齿的处理结果不好。这个模型还有一个面部重建权重的参数,取值范围0-1,0的时间模型会补充很多细节,面部改变较大;1的时间面部根本没有改变,不会补充很多细节,但是也有修脸的结果。
这两个模型可以一起利用,我们可以通过 GFPGAN visibility 和 CodeFormer visibility 来设置它们的到场度。
下面是几组示例。
1、原图是 Stable Diffusion 生成的,我用图片管理工具缩小了分辨率。可以看到,相比仅放大,加上修脸之后,人物的面部有了显着的改善。
https://img-blog.csdnimg.cn/img_convert/ecd32269497a71f7ef7996f9aa43560b.webp?x-oss-process=image/format,png
2、这是一张从网上网络的图片,原图就是比较暗昧的老照片,分别单独利用GPFGAN和CodeFormer的结果。GFPGAN的人物气质拿捏的比较到位,CodeFormer面部纹理更真实一些,但是不宜将重建权重值设置的过小。
https://img-blog.csdnimg.cn/img_convert/94248f17d0a6886e8cc0550f88c3568f.webp?x-oss-process=image/format,png
3、这也是从网上网络的图片,这张照片破损比较严重,利用的GFPGAN模型,能修复一些破损。
https://img-blog.csdnimg.cn/img_convert/33a805cceb5e9edc69a1ceaaa71aaafe.webp?x-oss-process=image/format,png
以上就是本文的重要内容了,如有题目,欢迎留言沟通交流。
写在最后

感兴趣的小伙伴,赠予全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,详细看这里。
​https://img-blog.csdnimg.cn/img_convert/7097b13adbbcfb3c403ca4a0ff4b2b27.jpeg
AIGC技术的将来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断进步。将来,AIGC技术将在游戏和盘算范畴得到更广泛的应用,使游戏和盘算系统具有更高效、更智能、更机动的特性。同时,AIGC技术也将与人工智能技术精密联合,在更多的范畴得到广泛应用,对程序员来说影响至关告急。将来,AIGC技术将继承得到进步,同时也将与人工智能技术精密联合,在更多的范畴得到广泛应用。

https://img-blog.csdnimg.cn/direct/e6a8b48b8024497daecb9d6652c72bb7.png#pic_center
一、AIGC全部方向的学习门路
AIGC全部方向的技术点做的整理,形成各个范畴的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,包管自己学得较为全面。
https://img-blog.csdnimg.cn/direct/af6e2f485a4f485d9b76a93afa81a02f.png
https://img-blog.csdnimg.cn/direct/7d91365d8b3a45aba258f4603c71dc5c.png#pic_center
二、AIGC必备工具
工具都帮各人整理好了,安装就可直接上手!
https://img-blog.csdnimg.cn/direct/01a2ea000b474fef83abfd18888b2e38.png
三、最新AIGC学习条记
当我学到一定基础,有自己的明白能力的时间,会去阅读一些先辈整理的册本或者手写的条记资料,这些条记详细纪录了他们对一些技术点的明白,这些明白是比较独到,可以学到不一样的思路。
https://img-blog.csdnimg.cn/direct/9e597a6fae9344cea8f4a9caf30ecc55.png
https://img-blog.csdnimg.cn/direct/f2619de95125425d8a19b85ce2ff1894.png
四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有结果的方式,跟着视频中老师的思路,从基础到深入,照旧很轻易入门的。
https://img-blog.csdnimg.cn/direct/ce803d0289b84736b059293d696429b6.png
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才华将自己的所学运用到实际当中去,这时间可以搞点实战案例来学习。
https://img-blog.csdnimg.cn/direct/373dd1f17ed14db1a2fa4dfec03c0559.png
​https://img-blog.csdnimg.cn/img_convert/7097b13adbbcfb3c403ca4a0ff4b2b27.jpeg

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: Stable Diffusion教程:额外功能/后期处理/高清化