莫张周刘王 发表于 2024-7-12 23:02:22

深入浅出学习Stable diffusion之Tiled Diffusion&VAE

今日言论:
马斯克的管理风格非常独特,他不需要非技能性的中层管理职员,员工表现不佳就会被裁,也不喜好大型集会。
                                                                         -- 前特斯拉 AI 总监安德烈·卡帕西
深入解读:Tiled Diffusion,英文翻译为**平铺扩散,**也是一种深度学习模型。
它主要用于图像生成任务。这种模型基于扩散过程,通过逐渐向图像中引入噪声,然后通过一个生成网络逐步恢复出清楚的图像。Tiled Diffusion模型将图像分成多个小块(即“瓦片”),并在每个瓦片中独立地实行扩散和生成过程,从而允许模型更有效地处置惩罚大型图像。
详细来说,Tiled Diffusion模型的练习分为两个阶段:

[*] 正向扩散过程(Forward Diffusion):在这个过程中,模型逐步地将图像数据转换为一个高斯噪声状态。这个过程通常包括多个步骤,每个步骤都涉及到对图像的逐步扰动。
[*] 反向生成过程(Backward Generation):在正向扩散过程之后,模型需要通过一个生成网络将高斯噪声转换回原始的图像数据。在Tiled Diffusion中,这个过程在每个瓦片上是独立进行的,这使得模型能够并行处置惩罚不同瓦片,从而进步了练习和推理的效率。
浅出解读:
https://img-blog.csdnimg.cn/img_convert/485bfd15c0f1f3f03f5c52189c57171b.png
图片泉源:Technical Part · pkuliyi2015/multidiffusion-upscaler-for-automatic1111 Wiki · GitHub
这个图表现的其实是重绘放大的意思。核心技能是通过Tiled VAE插件降低了现存的消耗本领,让显卡更好的发挥其威力。(double双押!)
**关于安装:**一样平常秋叶大神的安装包是自带的,没有可以在扩展程序里面找到。
实用解读:
https://img-blog.csdnimg.cn/img_convert/d8628ce2ad51b5e1d0958d6e94f84342.png


[*] 从图中,您可以看到如何将图像拆分为图块。
[*] 在每个步骤中,潜在空间中的每个瓦片都将被发送到 Stable Diffusion UNet。
[*] 瓷砖一遍又一遍地被分割和融合,直到全部步骤都完成。
[*] 什么是好的瓷砖尺寸?
[*] 较大的图块尺寸将进步速度,因为它产生的图块更少。
[*] 但是,最佳大小取决于您的查抄点。基本的 SD1.4 只善于绘制 512 * 512 图像(SD2.1 将是 768 * 768)。而且大多数查抄点无法生成大于 1280 * 1280 的好图片。所以在潜在空间中,让我们将其除以 8,你会得到 64 - 160。
[*] 因此,您应该选择一个介于 64 - 160 之间的值。
[*] 就个人而言,我保举 96 或 128 以得到快速速度。
[*] 什么是好的重叠?
[*] 重叠减少了熔合中的接缝。显然,更大的重叠意味着更少的接缝,但会显着降低速度,因为它会带来更多的瓷砖来重绘。
[*] 与 MultiDiffusion 相比,Mixture of Diffusers 需要更少的重叠,因为它利用高斯平滑(因此可以更快)。
[*] 就个人而言,我建议 32 或 48 用于 MultiDiffusion,16 或 32 用于混合扩散器
生成超大图像:
示例 1:杰作、最佳质量、高分辨率、城市天涯线、夜晚

https://img-blog.csdnimg.cn/img_convert/591dbd70cf91ed60245ef61469026086.jpeg
https://img-blog.csdnimg.cn/img_convert/7fc85053a1f4b60bfb9790126540731b.png
需要开启地区提示控件并启用绘制全画布配景。
共同ControlNet把古代的画变为现代:
22020 x 1080 超广角图像转换


[*]杰作, 最好的质量, 高分辨率, 超详细的8k统一壁纸, 鸟瞰图, 树木, 古建筑, 石头, 农场, 人群, 行人
https://img-blog.csdnimg.cn/img_convert/cbdb97fd9e5b62b68b814bcd1bfb7fb3.jpeg
https://img-blog.csdnimg.cn/img_convert/22ae74bee5136c3533305ae53370219c.jpeg
2560*1280大图绘制:


[*]ControlNet(夺目的边沿)
https://img-blog.csdnimg.cn/img_convert/8a21b2dfce58746be0b8bfd9766aafa7.jpeg
https://img-blog.csdnimg.cn/img_convert/c7241b6c19b0ba6c69bdd3fb5208338b.jpeg
img2img:升级细节
示例:1024 * 800 -> 4096 * 3200 图像,默认参数



[*] 参数:
[*] denoise=0.4,steps=20,Sampler=Euler a,Upscaler=RealESRGAN++,Negative Prompts=EasyNegative,
[*] Ckpt:Gf-style2(4GB 版本),CFG 比例 = 14,剪辑跳过 = 2
[*] method = MultiDiffusion,瓦片批量大小 = 8,瓦片大小高度 = 96,瓦片大小宽度 = 96,重叠 = 32
[*] 提示 = 杰作,最佳质量,高分辨率,极其详细的 8k 壁纸,非常清楚,负提示 = EasyNegative。
https://img-blog.csdnimg.cn/img_convert/e39dce17b4941c1ffd7b02523279ba89.jpeg
https://img-blog.csdnimg.cn/img_convert/722d86ebf2ca99df752e0af248fb1acc.jpeg
4 倍高档后,无需挑剔。在 NVIDIA Tesla V100 上行驶 1 分 12 秒。(假如为 2x,则在 10 秒内完成)


[*]
https://img-blog.csdnimg.cn/img_convert/722d86ebf2ca99df752e0af248fb1acc.jpeg


[*] 保举用于高效升级的参数。
[*] 采样器 = Euler a,步长 = 20,降噪 = 0.35,方法 = 扩散器的混合物,潜在瓦片高度和宽度 = 128,重叠 = 16,瓦片批量大小 = 8(假如内存不足,则减小瓷砖批量大小)。
关于Automatic1111WebUI的安装:


[*]打开Automatic1111 WebUI -> 点击“扩展”选项卡 -> 点击“从网址安装”选项卡 -> 输入 https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111.git -> 点击“安装”。
本篇内容泉源于github、Kahsolt大佬、维基百科、老鹿AI等文献综合报道。
                                                                                  ——BODI
写在末了

感爱好的小同伴,赠予全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,详细看这里。

https://img-blog.csdnimg.cn/direct/8a3b39c10fca441da5cb199b7978a7aa.png#pic_center
AIGC技能的未来发展前景广阔,随着人工智能技能的不断发展,AIGC技能也将不断进步。未来,AIGC技能将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技能也将与人工智能技能精密团结,在更多的领域得到广泛应用,对程序员来说影响至关紧张。未来,AIGC技能将继续得到进步,同时也将与人工智能技能精密团结,在更多的领域得到广泛应用。

https://img-blog.csdnimg.cn/direct/e6a8b48b8024497daecb9d6652c72bb7.png#pic_center
一、AIGC全部方向的学习路线
AIGC全部方向的技能点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,包管自己学得较为全面。
https://img-blog.csdnimg.cn/direct/af6e2f485a4f485d9b76a93afa81a02f.png
https://img-blog.csdnimg.cn/direct/7d91365d8b3a45aba258f4603c71dc5c.png#pic_center
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
https://img-blog.csdnimg.cn/direct/01a2ea000b474fef83abfd18888b2e38.png
三、最新AIGC学习笔记
当我学到肯定根本,有自己的理解本领的时间,会去阅读一些前辈整理的书籍大概手写的笔记资料,这些笔记详细纪录了他们对一些技能点的理解,这些理解是比较独到,可以学到不一样的思绪。
https://img-blog.csdnimg.cn/direct/9e597a6fae9344cea8f4a9caf30ecc55.png
https://img-blog.csdnimg.cn/direct/f2619de95125425d8a19b85ce2ff1894.png
四、AIGC视频教程合集
观看全面零根本学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思绪,从根本到深入,还是很容易入门的。
https://img-blog.csdnimg.cn/direct/ce803d0289b84736b059293d696429b6.png
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时间可以搞点实战案例来学习。
https://img-blog.csdnimg.cn/direct/373dd1f17ed14db1a2fa4dfec03c0559.png
https://img-blog.csdnimg.cn/direct/093a4c4c08394a6aba8bb64cb6113910.png#pic_center
若有侵权,请接洽删除

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 深入浅出学习Stable diffusion之Tiled Diffusion&VAE