乌市泽哥 发表于 2024-8-10 21:57:24

AI绘画Stable Diffusion到底有几个版本?超全SD汗青发布版本优缺点解析

大家好,我是设计师阿威
Stable Diffusion 在推出短短两年间已经发布了多个版本,最为人熟悉的就是 Stability AI 推出的 1.5 和 SDXL。那么除此之外,还有哪些版本呢?让我们从最初 Stable Diffusion 的起源开始提及。
没有 Version 1.0 的 Stable Diffusion

最早的 Stable Diffusion 版本由 CompVis 发布,版本号为 1.1,而不是由 Stability AI 推出,也不是从 version 1.0 开始。在此之前,它被称为 Latent Diffusion,由于 Stable Diffusion 自己就是一种 Latent Diffusion Model (LDM)。
同样由 CompVis 开发的 Latent Diffusion 才是真正的 Stable Diffusion 1.0,而且一开始就具备了 Text-to-Image 及 Inpaint 功能。Latent Diffusion 没有进一步的更新,由于接下来就推出了 Stable Diffusion。
https://img-blog.csdnimg.cn/direct/8528e9ed44b548c7a717d62a6f02c236.png
各个版本的演变

Stable Diffusion 1.1, 1.2, 1.3, 1.4

在 Latent Diffusion 推出后不久,2022 年 8 月 CompVis 接连推出了四个版本的 Stable Diffusion。版本号越高,使用的步数越多,效果也越好。


[*] Stable Diffusion 1.1:使用了 237000 步 256 x 256 及 197000 步 512 x 512 来练习。
[*] Stable Diffusion 1.2:使用了 515000 步 512 x 512 练习,并使用了 laion-improved-aesthetics 作为数据集。
[*] Stable Diffusion 1.3:是 1.2 的改良版,使用了 195000 步 512 x 512 的图像练习,减少了 10% 文字调节。
[*] Stable Diffusion 1.4:是 1.2 的改良版,使用了 225000 步 512 x 512 练习,减少了 10% 文字调节。
Stable Diffusion 1.5

2022 年 10 月,RunwayML 推出了广为人知的 Stable Diffusion 1.5,是早期最多用于 fine tune 练习的版本,甚至比之后的版本更受欢迎。此后,RunwayML 和 CompVis 也退出了 Stable Diffusion 的开发。


[*]Stable Diffusion 1.5:采用了 595000 步 512 x 512 的 laion-aesthetics v2 5+ 数据集并减少了 10% 文字调节练习而成。
Stable Diffusion 2.0, 2.1

2022 年 11 月,Stability AI 第一次推出了 Model,是 Stable Diffusion 2.0 和同年 12 月的 2.1。然而,这两款 Model 由于容量大但效果不如 1.5,一直使用者较少。


[*] Stable Diffusion 2.0:以 550000 步 256 x 256 练习后,再以 850000 步 512 x 512 图片加以练习出 base 版本。随后再以 base model 改良,使用 150000 步 v-objective 练习及 768 x 768 大小的 dataset 练习 140000 步。
[*] Stable Diffusion 2.1:以 2.0 为底子 fine tune 而成,追加了 55000 步的练习及 155000 步的额外步数。
https://img-blog.csdnimg.cn/direct/608a47656e744a82ba3315d0f4eb5e07.png
Stable Diffusion XL (SDXL)

2023 年 6 月,继 Stable Diffusion 1.5 后,Stability AI 推出了另一个强盛的 Model —— SDXL。


[*] Stable Diffusion XL 0.9 base / refiner:SDXL 的预览版,生成效果明显不如正式版。
[*] Stable Diffusion XL 1.0 base / refiner:SDXL 正式版,生成效果强盛,文字明白能力更强。
[*] Stable Diffusion XL beta 2.2.2:非公开版本,只能在 Stability AI Developer Platform v1 版的 API 中使用,是 SDXL 的 fine tune 版本。
[*] Stable Image Core:另一非公开的 SDXL Model,只能在 v2 API 中使用。
https://img-blog.csdnimg.cn/direct/ba4522640eec4b81bd65f4f6df71d853.png
Stable Diffusion 1.6

2023 年 11 月发布,只能在 Stability AI Developer Platform 的 v1 API 中使用,是 Stable Diffusion 1.5 的 fine tune 版本。


[*]Stable Diffusion 1.6:听说能生成比 1.5 更好的图片。
https://img-blog.csdnimg.cn/direct/f3e24de6b69043c88222d44f4c5ff969.png
Stable Diffusion XL Turbo (SDXL Turbo)

2023 年 11 月,Stability AI 推出了高速生成图片的版本,将一般 30~40 步的生成步数,大幅减少到 1~4 步。


[*] SDXL Turbo:从 SDXL 加上 Adversarial Diffusion Distillation (ADD) 技能蒸馏而成,生成图片所需步数减少,但效果略为含糊。
[*] SD Turbo:Stable Diffusion 2.1 的 Turbo 版本。
Stable Video Diffusion (SVD)

2023 年 11 月,Stability AI 推出了首个 img2vid 的动画 Model,仅需一张图片即可生成数秒动画。


[*] Stable Video Diffusion:用于生成 14 个影格 576 x 1024 的影片。
[*] Stable Video Diffusion XT:Fine tune 自 Stable Video Diffusion,用于生成 25 个影格 576 x 1024 的影片。
https://img-blog.csdnimg.cn/img_convert/d3402b96195d545f92b6738bca7d4826.png
Stable Zero 123

2023 年 12 月发布,基于 Zero 123 练习而成,可以生成多方向的图片,即使是背面也可以顺遂生成。


[*]Stable Zero 123:效果比 Zero 123 和 Zero 123 XL 更好。
https://img-blog.csdnimg.cn/img_convert/afd457e06949c4e077393bb8d6721aa4.png
Stable Diffusion Cascade

2024 年 2 月,Stability AI 发布了 Stable Diffusion Cascade,采用 ABC 三段式生成,单一 Model 即可生成差别风格的图片。
https://img-blog.csdnimg.cn/img_convert/67d09930affa7903db66adde3ee9ee59.png
Stable Diffusion XL Lightning (SDXL Lightning)

2024 年 2 月,ByteDance 开发的 SDXL Lightning 发布,不光能在 4~8 步内完成生成,并保持高质量。
https://img-blog.csdnimg.cn/img_convert/83a30e225ad2ea6233298b327b9bdbf3.png
Stable Diffusion 3

2024 年 2 月,Stability AI 发布了 Stable Diffusion 3,并于 4 月正式公开给公众使用。


[*] Stable Diffusion 3:只有在 Stability AI 提供的 API 中使用,画质和文字识别能力逾越以前所有 Model。
[*] Stable Diffusion 3 Turbo:Turbo 版本,生成速率更快。
[*] Stable Diffusion 3 Medium:首个 Open Source 的 Stable Diffusion 3 Model,练习数据量只有 Large 的一半,但明白能力强。
https://img-blog.csdnimg.cn/direct/cce9bd13d82c414390b11e8de815e9c9.png
Stable Video 3D

2024 年 3 月发布,联合 Stable Video Diffusion 和 Stable Zero 123 的技能,使用单一图片生成一段可以 360 度旋转的动画。


[*]Stable Video 3D:使用一张静态图片生成 21 个影格 576 x 576 的动画。
https://img-blog.csdnimg.cn/img_convert/fa87d1edccef6b0bdd2e10eed502a527.gif
Cos Stable Diffusion XL

2024 年 4 月发布,基于 SDXL 使用 Cosine-Continuous EDM VPred schedule fine tune 而成,可以生成纯黑至纯白的影像。


[*] Cos Stable Diffusion XL 1.0
[*] Cos Stable Diffusion XL 1.0 Edit:特点是可以直接用 prompt 实现 inpaint 效果。
总结

截至 2024 年 5 月,Stable Diffusion 推出了凌驾 20 个版本。以下是主要版本和推出日期:
MODEL 名称推出日期开发者相干链接Latent Diffusion2022 年 7 月CompVisGithubStable Diffusion 1.12022 年 8 月CompVisHuggingFaceStable Diffusion 1.22022 年 8 月CompVisHuggingFaceStable Diffusion 1.32022 年 8 月CompVisHuggingFaceStable Diffusion 1.42022 年 8 月CompVisHuggingFaceStable Diffusion 1.52022 年 10 月RunwayMLHuggingFaceStable Diffusion 1.62023 年 11 月Stability AIAPIStable Diffusion 2.02022 年 11 月Stability AIHuggingFaceStable Diffusion 2.12022 年 11 月Stability AIHuggingFaceStable Diffusion XL 0.92023 年 6 月Stability AIHuggingFaceStable Diffusion XL 1.02023 年 7 月Stability AIHuggingFaceStable Diffusion XL beta 2.2.22023 年 11 月Stability AIAPIStable Image Core2024 年 3 月Stability AIAPIStable Diffusion XL Turbo2023 年 11 月Stability AIHuggingFaceStable Diffusion Turbo2023 年 11 月Stability AIHuggingFaceStable Video Diffusion2023 年 11 月Stability AIHuggingFaceStable Video Diffusion XT2023 年 11 月Stability AIHuggingFaceStable Zero 1232023 年 12 月Stability AIHuggingFaceStable Diffusion Cascade2024 年 2 月Stability AIHuggingFaceSDXL Lightning2024 年 2 月ByteDanceHuggingFaceStable Diffusion 32024 年 2 月Stability AIAPIStable Diffusion 3 Turbo2024 年 2 月Stability AIAPIStable Diffusion 3 Medium2024 年 6 月Stability AIHuggingFaceStable Video 3D2024 年 3 月Stability AIHuggingFaceCos Stable Diffusion XL2024 年 4 月Stability AIHuggingFace 连同没公开的几个版本,其实Stable Diffusion在短短两年间推出了凌驾20个版本,你最喜欢使用的版本又是那一个呢?
感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

https://img-blog.csdnimg.cn/img_convert/383fd1f4ec69c6cb6da5751dd3ce4600.png
AIGC技能的未来发展远景广阔,随着人工智能技能的不停发展,AIGC技能也将不停进步。未来,AIGC技能将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技能也将与人工智能技能紧密联合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技能将继续得到进步,同时也将与人工智能技能紧密联合,在更多的领域得到广泛应用。

https://img-blog.csdnimg.cn/direct/e6a8b48b8024497daecb9d6652c72bb7.png#pic_center
一、AIGC所有方向的学习路线
AIGC所有方向的技能点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,包管自己学得较为全面。
https://img-blog.csdnimg.cn/direct/af6e2f485a4f485d9b76a93afa81a02f.png
https://img-blog.csdnimg.cn/direct/7d91365d8b3a45aba258f4603c71dc5c.png#pic_center
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
https://img-blog.csdnimg.cn/direct/01a2ea000b474fef83abfd18888b2e38.png
三、最新AIGC学习笔记
当我学到肯定底子,有自己的明白能力的时间,会去阅读一些先辈整理的册本或者手写的笔记资料,这些笔记具体记载了他们对一些技能点的明白,这些明白是比力独到,可以学到不一样的思绪。
https://img-blog.csdnimg.cn/direct/9e597a6fae9344cea8f4a9caf30ecc55.png
https://img-blog.csdnimg.cn/direct/f2619de95125425d8a19b85ce2ff1894.png
四、AIGC视频教程合集
观看全面零底子学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思绪,从底子到深入,还是很容易入门的。
https://img-blog.csdnimg.cn/direct/ce803d0289b84736b059293d696429b6.png
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时间可以搞点实战案例来学习。
https://img-blog.csdnimg.cn/direct/373dd1f17ed14db1a2fa4dfec03c0559.png
https://img-blog.csdnimg.cn/img_convert/383fd1f4ec69c6cb6da5751dd3ce4600.png 如有侵权,请联系删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: AI绘画Stable Diffusion到底有几个版本?超全SD汗青发布版本优缺点解析