论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com
»
论坛
›
人工智能
›
人工智能
›
【AIGC 教程】WebUI 教程:图像高清修复
【AIGC 教程】WebUI 教程:图像高清修复
吴旭华
金牌会员
|
2025-3-21 16:28:14
|
显示全部楼层
|
阅读模式
楼主
主题
988
|
帖子
988
|
积分
2964
在许多场景下,我们需要用到一些高分辨率的高清图,但是我们一般不发起直接用 Stable Diffusion 来直接生成 4K 等高分辨率的图片,由于 Stable Diffusion 模型用到的练习图像的尺寸是 512 或 768 像素,假如直接生成高分辨率的图片通常会遇到一些问题,好比图像某些内容不公道叠加等等。
不外 Stable Diffusion WebUI 为我们提供了其他方式来生成高分辨率的高清图,我们里就来先容一下这些方案。
有需要stable diffusion整合包以及提示词插件,可以扫描下方,免费获取
1、高清修复几种方案
Stable Diffusion WebUI 在几个不同的地方都提供了对图像进行高清修复的功能:
1)文生图(txt2img)中的高清修复(Hires. fix)
2)图生图(img2img)中的 SD 放大(SD upscale)
3)额外功能(Extras)中的放大(Scale to/Scale by)
不外这里有几点需要留意:
方案 1(文生图)的高清修复(Hires. fix)主要是对文本生产图像的结果做分辨率提升。假如你是对已有图像做分辨率提升,那可以使用方案 2(图生图)和 方案 3(额外功能)。
上面方案 1(文生图)和 方案 2(图生图)中对图像分辨率提升上限为 2048x2048。若需生成 4K,可以先在文生图与图生图中生成 2048x2048,再使用方案 3(Extra)放大为 4K。
方案 1(文生图)和方案 2(图生图)中对图像分辨率提升时都会对图像进行重绘,以是要留意 Denoising strength 参数不要设置过高,最好不要凌驾 0.5。方案 3(Extra)则没有这个问题,专用于分辨率提升。
1.1、文生图(txt2img)中的高清修复(Hires. fix)
文生图(txt2img)中的高清修复(Hires. fix)在文生图(txt2img)功能栏页面选中高清修复(Hires. fix)来开启。使用方式如图:
文生图高清修复
1)在 Prompt 和 Negative prompt 提示词和负向提示词输入区输入提示词和负向提示词;
2)选中 Hires .fix 开启高清修复功能;
3)在 Upscaler 下拉框中选择分辨率放大算法;
4)通过 Denoising strength 参数设置降噪强度,该参数值越小越靠近原图,发起不要凌驾 0.5;
5)通过 Upscale by 参数设置分辨率放大倍数;
6)点击 Generate 开始生成使命。
这里涉及的一些参数作用,我们在前面《文生图》一节中已经先容过,这里就不再赘述。
1.2、图生图(img2img)中的 SD 放大(SD upscale)
**图生图(img2img)中的 SD 放大(SD upscale)**在图生图(img2img)功能栏页面选择 Script 下拉框中的 SD upscale 来使用。使用方式如图:
图生图 SD 放大
1)在 img2img 功能区导入想要放大的图片;
2)通过 Denoising strength 参数设置降噪强度,该参数值越小越靠近原图,发起不要凌驾 0.5;
3)在 Script 下拉框中选择的 SD upscale;
4)通过 Scale Factor 参数设置分辨率放大倍数,这里需要留意最终的分辨率不要凌驾 2048x2048;
5)在 Upscaler 区选择放大算法;
6)点击 Generate 开始生成使命。
下面是原图以及我们使用上述过程放大后的图:
原图 512x512
放大图 1024x1024
1.3、额外功能(Extras)中的放大(Scale by/Scale to)
**额外功能(Extras)中的放大(Scale by/Scale to)**功能可以在 Extras 功能栏页面来通过设置上采样器(Upscaler)来使用。如图:
额外功能中的放大
1)在 Single Image 功能区中导入想要放大的图片;
2)通过 Scale by 或 Scale to 设置想要放大的分辨率倍数或者目标分辨率;
3)在 Upscaler1 下拉框选择上采样器;
4)点击 Generate 开始生成使命。
下面是原图以及我们使用上述过程放大后的图:
原图 512x512
放大图 1024x1024
上面是在额外功能(Extras)中提升图片分辨率最简单的方式,不外这里另有一些其他参数可以在放大分辨率的时间使用:
Upscaler2:选择第二个上采样器,Upscaler1 和 Upscaler2 两个放大算法将混合使用。
Upscaler2 visibility:设置第二个上采样器的可见度。好比当我们设置改参数值为 0.3 时,表示第二个上采样器可见度占比 0.3,而第一个占比 1 - 0.3 = 0.7。
GFPGAN visibility:GFPGAN 模型用于在放大图片时对人脸进行修复。这个参数是设置它的可见度。
CodeFormer visibility:CodeFormer 模型也可以用于在放大图片时对人脸进行修复。这个参数是设置它的可见度。
CodeFormer weight:设置 CodeFormer 的权重。该参数值取值范围是 0-1,数值越小,结果越强。
2、高清修复算法
对图像提升分辨率,最重要的实在是选择符合的图像放大算法。从上面 Stable Diffusion WebUI 的几个图像高清修复的方案中,我们可以发现它们提供的分辨率放大算法选项是大抵雷同的:
高清修复的可选算法
Lanczos 是一种插值算法,它使用一个称为 Lanczos 核的卷积核来进行卷积运算,这个卷积核由一个范围内的 Lanczos 函数盘算得到。当放大图像时,它在通过权重盘算在原图像的每个像素四周插入新的像素;当缩小图像时,它会从原图像中的每个像素四周的像素中选择一个值来更换这个像素。该算法速度不错,但结果一般。
Nearest 是一种简单的插值算法,它通过缩放系数盘算目标图像在原图中的坐标位置,去找到原图中心隔该位置迩来的像素值作为目标图像当前像素的数值。Nearest 盘算速度快,但是可能会产生锯齿,结果一般不好。
ESRGAN_4x 是 ESRGAN(Enhanced Super-Resolution Generative Adversarial Network)算法的一种改进版本。ESRGAN 是一种基于生成对抗网络(GAN)的图像超分辨率算法。其主要思想是通过学习低分辨率(LR)图像与其高分辨率(HR)对应物之间的映射,来实现从 LR 图像到 HR 图像的映射过程,从而实现图像的超分辨率。相较于传统的基于插值的超分辨率算法,ESRGAN 可以生成更加清晰、细节更加丰富的高分辨率图像。别的,ESRGAN 生成的图像结果相对锐利。ESRGAN_4x 则可以将低分辨率的图像通过神经网络模型增强到 4 倍的分辨率。
LDSR 是 Latent Diffusion Super Resolution 的缩写,该算法与 Stable Diffusion 生成图像的原理有些雷同,它使用一个颠末练习的潜伏扩散模型来提升图像分辨率。这个算法结果不错,但是对显存占用很大、速度很慢。
R-ESRGAN 4x+ 是 Real-Time Enhanced Super-Resolution Generative Adversarial Network 4x+ 的缩写,是一种图像超分辨率重建算法。R-ESRGAN 4x+ 基于生成式对抗网络(GAN),是 ESRGAN 的改进版本之一。它通过引入残差毗连和递归结构,改进了 ESRGAN 的生成器网络,并使用 GAN 进行练习。R-ESRGAN 4x+ 在提高图像分辨率的同时,也可以增强图像的细节和纹理,而且生成的图像质量比传统方法更高。它在许多图像增强使命中都取得了很好的结果,好比图像超分辨率、图像去模糊和图像去噪等。
R-ESRGAN 4x+ Anime6B 是 R-ESRGAN 4x+ 的一个衍生版本,它基于 R-ESRGAN 4x+ 算法并使用了 Anime6B 数据集进行练习。Anime6B 数据集是一个专门用于动漫图像处置惩罚的数据集,其中包含了大量不同风格、不同质量的动漫图像,使得算法可以适应不同类型的动漫图像。R-ESRGAN 4x+ Anime6B 算法在动漫图像增强范畴具有较高的准确性和结果,而且可以应用于不同类型的动漫图像处置惩罚,如动画制作、漫画制作等。
ScuNET GAN 也叫 Swin-Conv-UNet GAN,是一个去除图像中噪声同时保留原始细节的神经网络模型,对于去除图像中的噪点有比较好的结果。
ScuNET PSNR 雷同 ScuNET GAN,实用于保持更多的图像细节、纹理、颜色等信息的处置惩罚场景。
SwinIR 4x 是一种基于 Swin Transformer 的图像超分辨率重建算法,可将低分辨率图像放大 4 倍,生成高分辨率图像。Swin Transformer 是一种新型的 Transformer 模型,相对于传统的 Transformer 模型,在处置惩罚图像等二维数据时,具有更好的并行性和更高的盘算效率。SwinIR 4x 通过引入 Swin Transformer 和局部自适应模块(LAM)来提高图像重建的质量和速度。其中,局部自适应模块用于提高图像的局部细节,从而增强图像的真实感和清晰度。SwinIR 4x 被广泛应用于盘算机视觉范畴,特别是图像重建、图像增强和图像超分辨率等方面。
这些算法各自有一些实用场景:
Nearest 和 Lanczos:一般结果不太好,不太常用。
ESRGAN_4x:对于照片,结果不错,不外可能出现细节较锐利的结果,但有些人喜好这样的风格;对于绘画,结果有些粗糙,不外可能得当有纹理的油漆风格;对于二次元漫画,结果比较差。
LDSR:对于照片,结果很不错,但是速度太慢;对于绘画,可能会有一些随机噪点;对于二次元漫画,也可能出现一点噪点。
R-ESRGAN 4x+:对于照片、绘画、二次元漫画结果都还不错,平衡型选择。
R-ESRGAN 4x+ Anime6B:对于照片、绘画的处置惩罚都带上了些二次元漫画的风格;对于二次元漫画,结果很好。
ScuNET GAN:对于照片,可以去除噪点,但是可能会糊;对于绘画,可能会糊;对于二次元漫画,结果还可以。
ScuNET PSNR:对于照片,可以去除噪点,但是可能会糊;对于绘画,可能会糊;对于二次元漫画,结果比较差。
SwinIR_4:对于照片,结果一般;对于绘画,结果还不错;对于二次元漫画,结果比较差。
综上,我们通常记住这条发起就好:
一般情况,我们使用 R-ESRGAN 4x+ 即可;对于二次元漫画,我们使用 R-ESRGAN 4x+ Anime6B。
下面我们就用下面一幅 512x512 的图像分别使用这些算法放大到 2048x2048 的结果:
1)示例
原图 512x512
Lanczos 2048x2048
Nearest 2048x2048
关于AI绘画技能储备
学好 AI绘画 不论是就业还是做副业赢利都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小同伴们一点帮助!
对于0基础小白入门:
假如你是零基础小白,想快速入门AI绘画是可以思量的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到得当本身的学习方案
包罗:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!
零基础AI绘画学习资源先容
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
吴旭华
金牌会员
这个人很懒什么都没写!
楼主热帖
【云原生】第二篇--容器管理工具 Docke ...
数据库系统课程设计(高校成绩管理数据 ...
《原CSharp》第二回 巧习得元素分类 子 ...
mamba-ssm安装building wheel卡着不动 ...
JVM虚拟机性能监控与故障处理工具(3) ...
使用TrueNas(FreeNas)进行华为手机备 ...
java中==和equals区别
【图论】—— 有向图的强连通分量 ...
Spark 总复习
AWVS漏洞扫描器的使用
标签云
运维
CIO
存储
服务器
浏览过的版块
数据仓库与分析
终端安全
用友
快速回复
返回顶部
返回列表