人工智能深入浅出学习Stable diffusion之Tiled Diffusion&VAE

莫张周刘王 发表于 2024-7-12 23:02:22

深入浅出学习Stable diffusion之Tiled Diffusion&VAE

今日言论：
马斯克的管理风格非常独特，他不需要非技能性的中层管理职员，员工表现不佳就会被裁，也不喜好大型集会。
-- 前特斯拉 AI 总监安德烈·卡帕西
深入解读：Tiled Diffusion，英文翻译为**平铺扩散，**也是一种深度学习模型。
它主要用于图像生成任务。这种模型基于扩散过程，通过逐渐向图像中引入噪声，然后通过一个生成网络逐步恢复出清楚的图像。Tiled Diffusion模型将图像分成多个小块（即“瓦片”），并在每个瓦片中独立地实行扩散和生成过程，从而允许模型更有效地处置惩罚大型图像。
详细来说，Tiled Diffusion模型的练习分为两个阶段：

[*] 正向扩散过程（Forward Diffusion）：在这个过程中，模型逐步地将图像数据转换为一个高斯噪声状态。这个过程通常包括多个步骤，每个步骤都涉及到对图像的逐步扰动。
[*] 反向生成过程（Backward Generation）：在正向扩散过程之后，模型需要通过一个生成网络将高斯噪声转换回原始的图像数据。在Tiled Diffusion中，这个过程在每个瓦片上是独立进行的，这使得模型能够并行处置惩罚不同瓦片，从而进步了练习和推理的效率。
浅出解读：
https://img-blog.csdnimg.cn/img_convert/485bfd15c0f1f3f03f5c52189c57171b.png
图片泉源：Technical Part · pkuliyi2015/multidiffusion-upscaler-for-automatic1111 Wiki · GitHub
这个图表现的其实是重绘放大的意思。核心技能是通过Tiled VAE插件降低了现存的消耗本领，让显卡更好的发挥其威力。（double双押！）
**关于安装：**一样平常秋叶大神的安装包是自带的，没有可以在扩展程序里面找到。
实用解读：
https://img-blog.csdnimg.cn/img_convert/d8628ce2ad51b5e1d0958d6e94f84342.png

[*] 从图中，您可以看到如何将图像拆分为图块。
[*] 在每个步骤中，潜在空间中的每个瓦片都将被发送到 Stable Diffusion UNet。
[*] 瓷砖一遍又一遍地被分割和融合，直到全部步骤都完成。
[*] 什么是好的瓷砖尺寸？
[*] 较大的图块尺寸将进步速度，因为它产生的图块更少。
[*] 但是，最佳大小取决于您的查抄点。基本的 SD1.4 只善于绘制 512 * 512 图像（SD2.1 将是 768 * 768）。而且大多数查抄点无法生成大于 1280 * 1280 的好图片。所以在潜在空间中，让我们将其除以 8，你会得到 64 - 160。
[*] 因此，您应该选择一个介于 64 - 160 之间的值。
[*] 就个人而言，我保举 96 或 128 以得到快速速度。
[*] 什么是好的重叠？
[*] 重叠减少了熔合中的接缝。显然，更大的重叠意味着更少的接缝，但会显着降低速度，因为它会带来更多的瓷砖来重绘。
[*] 与 MultiDiffusion 相比，Mixture of Diffusers 需要更少的重叠，因为它利用高斯平滑（因此可以更快）。
[*] 就个人而言，我建议 32 或 48 用于 MultiDiffusion，16 或 32 用于混合扩散器
生成超大图像：
示例 1：杰作、最佳质量、高分辨率、城市天涯线、夜晚

https://img-blog.csdnimg.cn/img_convert/591dbd70cf91ed60245ef61469026086.jpeg
https://img-blog.csdnimg.cn/img_convert/7fc85053a1f4b60bfb9790126540731b.png
需要开启地区提示控件并启用绘制全画布配景。
共同ControlNet把古代的画变为现代：
22020 x 1080 超广角图像转换

[*]杰作，最好的质量，高分辨率，超详细的8k统一壁纸，鸟瞰图，树木，古建筑，石头，农场，人群，行人
https://img-blog.csdnimg.cn/img_convert/cbdb97fd9e5b62b68b814bcd1bfb7fb3.jpeg
https://img-blog.csdnimg.cn/img_convert/22ae74bee5136c3533305ae53370219c.jpeg
2560*1280大图绘制：

[*]ControlNet（夺目的边沿）
https://img-blog.csdnimg.cn/img_convert/8a21b2dfce58746be0b8bfd9766aafa7.jpeg
https://img-blog.csdnimg.cn/img_convert/c7241b6c19b0ba6c69bdd3fb5208338b.jpeg
img2img:升级细节
示例：1024 * 800 -> 4096 * 3200 图像，默认参数

[*] 参数：
[*] denoise=0.4，steps=20，Sampler=Euler a，Upscaler=RealESRGAN++，Negative Prompts=EasyNegative，
[*] Ckpt：Gf-style2（4GB 版本），CFG 比例 = 14，剪辑跳过 = 2
[*] method = MultiDiffusion，瓦片批量大小 = 8，瓦片大小高度 = 96，瓦片大小宽度 = 96，重叠 = 32
[*] 提示 = 杰作，最佳质量，高分辨率，极其详细的 8k 壁纸，非常清楚，负提示 = EasyNegative。
https://img-blog.csdnimg.cn/img_convert/e39dce17b4941c1ffd7b02523279ba89.jpeg
https://img-blog.csdnimg.cn/img_convert/722d86ebf2ca99df752e0af248fb1acc.jpeg
4 倍高档后，无需挑剔。在 NVIDIA Tesla V100 上行驶 1 分 12 秒。（假如为 2x，则在 10 秒内完成）

[*]
https://img-blog.csdnimg.cn/img_convert/722d86ebf2ca99df752e0af248fb1acc.jpeg

[*] 保举用于高效升级的参数。
[*] 采样器 = Euler a，步长 = 20，降噪 = 0.35，方法 = 扩散器的混合物，潜在瓦片高度和宽度 = 128，重叠 = 16，瓦片批量大小 = 8（假如内存不足，则减小瓷砖批量大小）。
关于Automatic1111WebUI的安装：

[*]打开Automatic1111 WebUI -> 点击“扩展”选项卡 -> 点击“从网址安装”选项卡 -> 输入 https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111.git -> 点击“安装”。
本篇内容泉源于github、Kahsolt大佬、维基百科、老鹿AI等文献综合报道。
——BODI
写在末了

感爱好的小同伴，赠予全套AIGC学习资料，包含AI绘画、AI人工智能等前沿科技教程和软件工具，详细看这里。

https://img-blog.csdnimg.cn/direct/8a3b39c10fca441da5cb199b7978a7aa.png#pic_center
AIGC技能的未来发展前景广阔，随着人工智能技能的不断发展，AIGC技能也将不断进步。未来，AIGC技能将在游戏和计算领域得到更广泛的应用，使游戏和计算系统具有更高效、更智能、更灵活的特性。同时，AIGC技能也将与人工智能技能精密团结，在更多的领域得到广泛应用，对程序员来说影响至关紧张。未来，AIGC技能将继续得到进步，同时也将与人工智能技能精密团结，在更多的领域得到广泛应用。

https://img-blog.csdnimg.cn/direct/e6a8b48b8024497daecb9d6652c72bb7.png#pic_center
一、AIGC全部方向的学习路线
AIGC全部方向的技能点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，包管自己学得较为全面。
https://img-blog.csdnimg.cn/direct/af6e2f485a4f485d9b76a93afa81a02f.png
https://img-blog.csdnimg.cn/direct/7d91365d8b3a45aba258f4603c71dc5c.png#pic_center
二、AIGC必备工具
工具都帮大家整理好了，安装就可直接上手！
https://img-blog.csdnimg.cn/direct/01a2ea000b474fef83abfd18888b2e38.png
三、最新AIGC学习笔记
当我学到肯定根本，有自己的理解本领的时间，会去阅读一些前辈整理的书籍大概手写的笔记资料，这些笔记详细纪录了他们对一些技能点的理解，这些理解是比较独到，可以学到不一样的思绪。
https://img-blog.csdnimg.cn/direct/9e597a6fae9344cea8f4a9caf30ecc55.png
https://img-blog.csdnimg.cn/direct/f2619de95125425d8a19b85ce2ff1894.png
四、AIGC视频教程合集
观看全面零根本学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思绪，从根本到深入，还是很容易入门的。
https://img-blog.csdnimg.cn/direct/ce803d0289b84736b059293d696429b6.png
五、实战案例
纸上得来终觉浅，要学会跟着视频一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时间可以搞点实战案例来学习。
https://img-blog.csdnimg.cn/direct/373dd1f17ed14db1a2fa4dfec03c0559.png
https://img-blog.csdnimg.cn/direct/093a4c4c08394a6aba8bb64cb6113910.png#pic_center
若有侵权，请接洽删除

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

页: [1]

ToB企服应用市场:ToB评测及商务社交产业平台's Archiver

深入浅出学习Stable diffusion之Tiled Diffusion&VAE