人工智能-Stable Diffusion教程：额外功能/后期处理/高清化

九天猎人 发表于 2024-8-10 16:44:32

Stable Diffusion教程：额外功能/后期处理/高清化

"额外功能"对应的英文单词是Extras，算是直译。但是部分版本中的翻译是“后期处理”或者“高清化”，这都是意译，因为它的重要功能是放大图片、去噪、修脸等对图片的后期处理。注意这里边对图片的处理不是 Stable Diffusion 本身的能力，都是额外扩展的。
下面正式开始先容“额外功能”的相干能力。
图片放大

先看最根本的图片放大能力。对于分辨率比较小的图片，假如逼迫用较大的分辨率展示，会出现图片暗昧的环境，这时间就可以利用SD WebUI的图片放大功能。所谓图片放大就是在保持图片清晰度的前提下增加图片的分辨率，它还有个专业点的名词：超分辨率技术，简称为“超分”。
详细操作方式请参考下图：
https://img-blog.csdnimg.cn/img_convert/9ff5bf189b6129eeebaa63a57d26d052.webp?x-oss-process=image/format,png
1、主菜单中点击进入“额外功能”。
2、点击“单张图像”，也就是一次只处理一张图片。后边的“批量处理”可以上传多张图片进行处理，“批量处理目次下图像”可以指定处理一个目次下的全部图片。
3、点击上传一张要处理的图片。
4、选择缩放比例。这里有两种方式：按照比例缩放和指定分辨率缩放，指定分辨率时可以设置是否自动裁剪，都很好明白，试试就明白了。
5、Upscaler1用来指定放大算法，常见的放大算法有下面几个：

[*]无/None：单纯的放大，不做任何优化处理。
[*]Lanczos：利用加权平均插值方法，利用原始图像自身的像素信息，增加图像的细节，从而进步图像的分辨率。传统的纯数学算法，结果一般。
[*]Nearest：利用简朴的插值方法，基于近来邻像素的值进行插值，从而增加图像的细节和进步分辨率。传统的纯数学算法，结果一般，还不如 Lanczos 的结果好。
[*]LDSR：基于深度学习，通过利用轻量级的网络结构和残差学习，实现较高的超分性能和盘算效率。适用于各种需要快速且准确地进步图像分辨率的应用场景，如实时视频处理、移动装备图像处理等。
[*]ESRGAN：全称Enhanced Super-Resolution Generative Adversarial Networks （增强超分生成对抗网络），基于深度学习的超分辨率算法。增加了很多看上去很真实的纹理，但是有时可能会过分拟合，出现不好的结果。
[*]4x-UltraSharp：基于ESRGAN做了优化，比较适合处理真人。
[*]ESRGAN_4x：Real ESRGAN，完全利用纯合成数据来尽量贴近真实数据进行练习。腾讯贡献。
[*]R-ESRGAN 4x+：基于Real ESRGAN的优化模型，适合放大真实风格的图片，常用。
[*]R-ESRGAN 4x+ Anime6B：基于Real ESRGAN的优化模型，适合放大动漫风格的图片，常用。
[*]ScuNET GAN：基于深度学习，利用生成对抗网络（GAN）进行练习。重要用在进步图像的视觉结果和感知质量，例如在图像增强、视频处理等。
[*]ScuNET PSNR：基于深度学习，利用均方偏差（PSNR）进行练习。重要用在进步图像的客观质量和准确性，例如在医学图像分析、监控视频处理等。
[*]SwinIR_4x：利用Swin Transformer思想，基于自注意力机制的Transformer结构，适合各种图像的超分，比较通用。
这些算法会在首次利用它们时分别下载，你也可以提前下载它们，并放到指定的目次。我整理的SD绘画资源中已经网络了这些文件，下载方式请看本文最后的部分。
6、Upscaler2 用来制止 Upscaler1 过分处理的题目，比如磨皮太严重。可以利用一些平凡方法算法，比如 Lanczos。Upscaler2 可见度是指图片放大时利用 Upscaler2 算法进行处理的比例，为0时完全倒霉用 Upscaler2，为1时只利用 Upscaler2。
7、点击“生成”。
8、放大后的图片在这里显示。
小结
这个图片放大功能重要是为了放大 Stable Diffusion 生成的低分辨率图片，因为图片分辨率越大对显存的要求也越大，所以对于显存较小的同学，可以先在文生图中生成一张低分辨率图片，然后再在这里放大。
对于修复暗昧图片，这个图片放大功能实在能力有限，实际测试 WebUI 默认自带的放大算法也就是能去去噪点，消消锯齿，出图的结果并不是很好，特殊是本来就很糊的图片。
不过可能存在别的的算法具备较好的暗昧图片修复结果，各人可以找来试试。保举一个放大模型的下载站点：openmodeldb.info/
修脸

虽然图片放大本身对修复暗昧图片的结果有限，但是它附带了一个修脸的参数。假如文生图生成的人脸结果不好，比如磨皮太严重、人脸变形等，都可以在这里试试。对于暗昧的人脸，也有比较好的修复结果。
修脸方法支持两个模型：GFPGAN 和 CodeFormer，操作方法参见下图：
https://img-blog.csdnimg.cn/img_convert/f5385dfc13c1332c2f4619fdea4efb4e.webp?x-oss-process=image/format,png
1、GFPGAN：腾讯开源的一个修脸模型，修复的细节比较清晰，人物形象的还原度比较高，气质保持的好。
2、CodeFormer：另一个修脸模型，修图的细节也比较清晰，皮肤纹理更真实一些，不过这个模型对牙齿的处理结果不好。这个模型还有一个面部重建权重的参数，取值范围0-1，0的时间模型会补充很多细节，面部改变较大；1的时间面部根本没有改变，不会补充很多细节，但是也有修脸的结果。
这两个模型可以一起利用，我们可以通过 GFPGAN visibility 和 CodeFormer visibility 来设置它们的到场度。
下面是几组示例。
1、原图是 Stable Diffusion 生成的，我用图片管理工具缩小了分辨率。可以看到，相比仅放大，加上修脸之后，人物的面部有了显着的改善。
https://img-blog.csdnimg.cn/img_convert/ecd32269497a71f7ef7996f9aa43560b.webp?x-oss-process=image/format,png
2、这是一张从网上网络的图片，原图就是比较暗昧的老照片，分别单独利用GPFGAN和CodeFormer的结果。GFPGAN的人物气质拿捏的比较到位，CodeFormer面部纹理更真实一些，但是不宜将重建权重值设置的过小。
https://img-blog.csdnimg.cn/img_convert/94248f17d0a6886e8cc0550f88c3568f.webp?x-oss-process=image/format,png
3、这也是从网上网络的图片，这张照片破损比较严重，利用的GFPGAN模型，能修复一些破损。
https://img-blog.csdnimg.cn/img_convert/33a805cceb5e9edc69a1ceaaa71aaafe.webp?x-oss-process=image/format,png
以上就是本文的重要内容了，如有题目，欢迎留言沟通交流。
写在最后

感兴趣的小伙伴，赠予全套AIGC学习资料，包含AI绘画、AI人工智能等前沿科技教程和软件工具，详细看这里。
https://img-blog.csdnimg.cn/img_convert/7097b13adbbcfb3c403ca4a0ff4b2b27.jpeg
AIGC技术的将来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断进步。将来，AIGC技术将在游戏和盘算范畴得到更广泛的应用，使游戏和盘算系统具有更高效、更智能、更机动的特性。同时，AIGC技术也将与人工智能技术精密联合，在更多的范畴得到广泛应用，对程序员来说影响至关告急。将来，AIGC技术将继承得到进步，同时也将与人工智能技术精密联合，在更多的范畴得到广泛应用。

https://img-blog.csdnimg.cn/direct/e6a8b48b8024497daecb9d6652c72bb7.png#pic_center
一、AIGC全部方向的学习门路
AIGC全部方向的技术点做的整理，形成各个范畴的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，包管自己学得较为全面。
https://img-blog.csdnimg.cn/direct/af6e2f485a4f485d9b76a93afa81a02f.png
https://img-blog.csdnimg.cn/direct/7d91365d8b3a45aba258f4603c71dc5c.png#pic_center
二、AIGC必备工具
工具都帮各人整理好了，安装就可直接上手！
https://img-blog.csdnimg.cn/direct/01a2ea000b474fef83abfd18888b2e38.png
三、最新AIGC学习条记
当我学到一定基础，有自己的明白能力的时间，会去阅读一些先辈整理的册本或者手写的条记资料，这些条记详细纪录了他们对一些技术点的明白，这些明白是比较独到，可以学到不一样的思路。
https://img-blog.csdnimg.cn/direct/9e597a6fae9344cea8f4a9caf30ecc55.png
https://img-blog.csdnimg.cn/direct/f2619de95125425d8a19b85ce2ff1894.png
四、AIGC视频教程合集
观看全面零基础学习视频，看视频学习是最快捷也是最有结果的方式，跟着视频中老师的思路，从基础到深入，照旧很轻易入门的。
https://img-blog.csdnimg.cn/direct/ce803d0289b84736b059293d696429b6.png
五、实战案例
纸上得来终觉浅，要学会跟着视频一起敲，要动手实操，才华将自己的所学运用到实际当中去，这时间可以搞点实战案例来学习。
https://img-blog.csdnimg.cn/direct/373dd1f17ed14db1a2fa4dfec03c0559.png
https://img-blog.csdnimg.cn/img_convert/7097b13adbbcfb3c403ca4a0ff4b2b27.jpeg

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

页: [1]

qidao123.com技术社区-IT企服评测·应用市场's Archiver

Stable Diffusion教程：额外功能/后期处理/高清化