反转基因福娃 发表于 2025-4-3 16:24:14

我奶奶都能学会的Stable Diffusion|文生图底子教程

随着深度学习技术的发达发展,天生对抗网络(GANs)特别是Stable
Diffusion(简称SD)在图像天生领域取得了令人瞩目的成果。本教程旨在为广大对SDAI文生图技术感兴趣的学习者提供一个入门级的指南,资助大家快速上手并把握这一前沿技术。
https://img-blog.csdnimg.cn/direct/5cace497130049a18a3d453d85573dd6.png
有需要stable diffusion整合包以及提示词插件,可以扫描下方,免费获取
https://i-blog.csdnimg.cn/direct/c299e4022f284f32a2ae062c1421cbe4.jpeg#pic_center
01.模型选择
AI绘画最紧张的是需要清晰自己的创作需求,即自己渴望出来的图片是什么风格、什么场景、什么人物等等。
那么我根据需求将模型分为五种类型:


[*] 官方模型 :由Stable Diffusion团队官方出的大模型,也叫底模;
[*] 二次元模型 :模型练习的数据以二次元的素材为主,对于二次元的场景和人物有着针对性的优化,出图效果好;
[*] 真实系模型 :模型练习的数据以现实照片素材为主,对于真实感和人物细节的还原会比其他模型好非常多;
[*] 2.5D模型 :多为混合模型,出来的效果图在二次元的底子上带有真实效果,类似于3D建模;
[*] 其他模型 :其他一些垂直领域的模型,如平面设计、魔幻场景、建筑风格等等;
选择需要使用的模型(底模),这是对天生结果影响最大的因素,重要体现在画面风格上。
https://img-blog.csdnimg.cn/img_convert/39a12ae2b9173bbb46635202cd39d5f5.png
02.写关键词
在中,关键词(或称为提示词)可以分为正向(Prompt)和反向(Negative prompt)两种,它们分别用于指导和限制模型天生图像的方向。
1、SD关键词根本规则:
A:关键词之间必须用英文状态下的逗号分割;
B:关键词是可以分行写的,特别是不同性子的关键词:
C:每个关键词的默认权重都是一样的为1,但越靠前的关键词,系统会自动分配更高一级的权重。以是我们在写关键词的时候,应当尽可能将需要突出的特征关键词放在前面位置;
D:关键词的数量并非越多越好。我们在SD中可以看到,关键词框背面有个75的数字,即表明系统默认为最多写75个单词,多出的关键词并不能对系统天生的结果起到明显的作用。
2、关键词中符号的用法:
A:在SD关键词中我们经常用()、[]、<>来设置某个关键词在整体中的权重。
( ):将关键词放在小括号中,表现这个关键词的权紧张提升10%即为1.1,小括号最多可以叠加三层(((
))),即表现这个关键词权重提升到1.331。固然更多的时候我们是只用一层小括号,然后在关键词背面加:和权重数字。好比(blue eyes:1.4)如许。
[ ] :将关键词放在中括号内,表现这个关键词的权紧张降低10%即为0.9,中括号同样最多叠加三层[[[ ]]]表现这个关键词权重降低到0.729.
{ }:将关键词放在大括号中,也是表现这个关键词的权重会增长,但它的提升幅度要比小括号( )小。一层{ }只能提升5%。
B:< >尖括号的作用重要是在关键词中引入Lora。格式为<Lora名称:Lora文件的触发词:Lora权重>
C:_ 英文状态下的下划线。它通常用在两个关键词之间,表现这两个关键词是精密联系的。好比
milk,cake两个关键词分开写SD系统会认为是表现牛奶、蛋糕两个品种,而 milk_cake表现牛奶蛋糕,一个品种。
3、控制关键词的生效时间:
在SD的关键词中,有时我们会需要控制某个关键词的生效时间,以控制该关键词特征在整体图片中的比例或权重,这时我们可以将此关键词放入中括号[
],加:生效时间段比例。好比:forest,tree,stone,bird,
https://img-blog.csdnimg.cn/img_convert/7ac6928484e40eb1e0474049e12b5b09.png
在第上面的框中填入提示词(Prompt),对想要天生的东西举行文字形貌在第下面框中填入负面提示词(Negative
prompt),你不想要天生的东西举行文字形貌。
03.参数调整
选择采样方法、采样次数、图片尺寸等参数。
https://img-blog.csdnimg.cn/img_convert/3c8adbe3d480e35cb4e591aff339b8da.png
1、采样方法:
https://img-blog.csdnimg.cn/img_convert/523f041ab76b27c405e9962790a40c12.png
•Sampler(采样器/采样方法) 选择使用哪种采样器。Euler a(Eular
ancestral)可以以较少的步数产生很大的多样性,不同的步数可能有不同的结果。而非 ancestral 采样器都会产生根本雷同的图像。DPM
干系的采样器通常具有不错的效果,但耗时也会相应增长。
•Euler 是最简朴、最快的
•Euler a 更多样,不同步数可以生产出不同的图片。但是太高步数 (>30) 效果不会更好。
•DDIM 收敛快,但服从相对较低,因为需要很多 step 才能得到好的结果,适合在重绘时候使用。
•LMS 是 Euler 的衍生,它们使用一种干系但稍有不同的方法(均匀已往的几个步调以提高准确性)。大概 30 step 可以得到稳定结果
•PLMS 是 Euler 的衍生,可以更好地处置惩罚神经网络布局中的奇特性。
•DPM2 是一种神奇的方法,它旨在改进 DDIM,淘汰步调以得到精良的结果。它需要每一步运行两次去噪,它的速率大约是 DDIM
的两倍,生图效果也非常好。但是假如你在举行调试提示词的实验,这个采样器可能会有点慢了。
•UniPC 效果较好且速率非常快,对平面、卡通的表现较好,保举使用。
2、迭代步数:
https://img-blog.csdnimg.cn/img_convert/3c0a087332dcc19a26eae1084949b982.png
•Sampling Steps(迭代步数) Stable Diffusion
的工作方式是从以随机高斯噪声起步,向符合提示的图像一步步降噪接近。随着步数增多,可以得到对目的更小、更准确的图像。但增长步数也会增长天生图像所需的时间。增长步数的边际收益递减,取决于采样器。一般开到
20~30。
•不同采样步数与采样器之间的关系:
https://img-blog.csdnimg.cn/img_convert/7d556e233066dfce7467fb4abcdb6424.png
3、CFG:
https://img-blog.csdnimg.cn/img_convert/1a25ebf4a4f696a45641270daa5c4cad.png
•CFG Scale(提示词干系性)
图像与你的提示的匹配水平。增长这个值将导致图像更接近你的提示,但它也在一定水平上降低了图像质量。可以用更多的采样步调来抵消。过高的 CFG Scale
体现为粗犷的线条和过锐化的图像。一般开到 7~11。CFG Scale 与采样器之间的关系:
https://img-blog.csdnimg.cn/img_convert/821fa045eb9245365a366fd369c1a8c8.png
4、批次:
https://img-blog.csdnimg.cn/img_convert/e5b78ca72294935cc8071af5f6d982ad.png
•总批次数 每次天生图像的组数。一次运行天生图像的数量为“批次* 批次数量”。
•单批数量 同时天生多少个图像。增长这个值可以提高性能,但也需要更多的显存。大的 Batch Size 需要斲丧巨量显存。若没有超过 12G
的显存,请保持为 1。
5、尺寸:
•尺寸 指定图像的长宽。出图尺寸太宽时,图中可能会出现多个主体。1024 之上的尺寸可能会出现不理想的结果,保举使用小尺寸分辨率+高清修复(Hires
fix)。
6、种子:
•种子 种子决定模型在天生图片时涉及的所有随机性,它初始化了 Diffusion 算法出发点的初始值。理论上,在应用完全雷同参数(如
Step、CFG、Seed、prompts)的环境下,生产的图片应当完全雷同。
7、高清修复:
•高清修复
https://img-blog.csdnimg.cn/img_convert/7d3778c426baf97f1288dfa9a1cd78ee.png
通过勾选 “Hires. fix”
来启用。默认环境下,文生图在高分辨率下会天生非常混沌的图像。假如使用高清修复,会型起首按照指定的尺寸天生一张图片,然后通过放大算法将图片分辨率扩大,以实现高清大图效果。最终尺寸为(原分辨率*缩放系数
Upscale by)。
•放大算法中,Latent 在很多环境下效果不错,但重绘幅度小于 0.5 后就不甚理想。ESRGAN_4x、SwinR 4x 对 0.5
以下的重绘幅度有较好支持。
•高分迭代步数 表现在举行这一步时计算的步数。
•重绘幅度,表现为末了天生图片对原始输入图像内容的变化水平。该值越高,放大后图像就比放大前图像差异越大。低,意味着修正原图,高 ,
就和原图就没有大的干系性了。一般来讲阈值是 0.7 左右,超过 0.7 和原图根本上无关,0.3 以下就是稍微改一些。
8、面部修复:
•面部修复 修复画面中人物的面部,但黑白写实风格的人物开启面部修复可能导致面部崩坏。
https://img-blog.csdnimg.cn/img_convert/d5857bafd8b4fb809c26d9e22af3656c.png
9、天生:
•点击“天生”
https://img-blog.csdnimg.cn/img_convert/9ca869027ab6f368a05b3d1bcc5c254c.png
关于AI绘画技术储备

学好 AI绘画 岂论是就业还是做副业赢利都不错,但要学会 AI绘画 还是要有一个学习规划。末了大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点资助!
对于0底子小白入门:
   假如你是零底子小白,想快速入门AI绘画是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更会合。
二方面是可以找到适合自己的学习方案
包罗:stable diffusion安装包、stable diffusion0底子入门全套PDF,视频学习教程。带你从零底子系统性的学好AI绘画!
零底子AI绘画学习资源先容

页: [1]
查看完整版本: 我奶奶都能学会的Stable Diffusion|文生图底子教程