论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
qidao123.com技术社区-IT企服评测·应用市场
»
论坛
›
人工智能
›
人工智能
›
我奶奶都能学会的Stable Diffusion|文生图底子教程 ...
我奶奶都能学会的Stable Diffusion|文生图底子教程
反转基因福娃
论坛元老
|
2025-4-3 16:24:14
|
显示全部楼层
|
阅读模式
楼主
主题
1765
|
帖子
1765
|
积分
5295
随着深度学习技术的发达发展,天生对抗网络(GANs)特别是Stable
Diffusion(简称SD)在图像天生领域取得了令人瞩目的成果。本教程旨在为广大对SDAI文生图技术感兴趣的学习者提供一个入门级的指南,资助大家快速上手并把握这一前沿技术。
有需要stable diffusion整合包以及提示词插件,可以扫描下方,免费获取
01.模型选择
AI绘画最紧张的是需要清晰自己的创作需求,即自己渴望出来的图片是什么风格、什么场景、什么人物等等。
那么我根据需求将模型分为五种类型:
官方模型
:由Stable Diffusion团队官方出的大模型,也叫底模;
二次元模型
:模型练习的数据以二次元的素材为主,对于二次元的场景和人物有着针对性的优化,出图效果好;
真实系模型
:模型练习的数据以现实照片素材为主,对于真实感和人物细节的还原会比其他模型好非常多;
2.5D模型
:多为混合模型,出来的效果图在二次元的底子上带有真实效果,类似于3D建模;
其他模型
:其他一些垂直领域的模型,如平面设计、魔幻场景、建筑风格等等;
选择需要使用的模型(底模),这是对天生结果影响最大的因素,重要体现在画面风格上。
02.写关键词
在中,关键词(或称为提示词)可以分为正向(Prompt)和反向(Negative prompt)两种,它们分别用于指导和限制模型天生图像的方向。
1、SD关键词根本规则:
A:关键词之间必须用英文状态下的逗号分割;
B:关键词是可以分行写的,特别是不同性子的关键词:
C:每个关键词的默认权重都是一样的为1,但越靠前的关键词,系统会自动分配更高一级的权重。以是我们在写关键词的时候,应当尽可能将需要突出的特征关键词放在前面位置;
D:关键词的数量并非越多越好。我们在SD中可以看到,关键词框背面有个75的数字,即表明系统默认为最多写75个单词,多出的关键词并不能对系统天生的结果起到明显的作用。
2、关键词中符号的用法:
A:在SD关键词中我们经常用()、[]、<>来设置某个关键词在整体中的权重。
( ):将关键词放在小括号中,表现这个关键词的权紧张提升10%即为1.1,小括号最多可以叠加三层(((
))),即表现这个关键词权重提升到1.331。固然更多的时候我们是只用一层小括号,然后在关键词背面加:和权重数字。好比(blue eyes:1.4)如许。
[ ] :将关键词放在中括号内,表现这个关键词的权紧张降低10%即为0.9,中括号同样最多叠加三层[[[ ]]]表现这个关键词权重降低到0.729.
{ }:将关键词放在大括号中,也是表现这个关键词的权重会增长,但它的提升幅度要比小括号( )小。一层{ }只能提升5%。
B:< >尖括号的作用重要是在关键词中引入Lora。格式为<Lora名称:Lora文件的触发词:Lora权重>
C:_ 英文状态下的下划线。它通常用在两个关键词之间,表现这两个关键词是精密联系的。好比
milk,cake两个关键词分开写SD系统会认为是表现牛奶、蛋糕两个品种,而 milk_cake表现牛奶蛋糕,一个品种。
3、控制关键词的生效时间:
在SD的关键词中,有时我们会需要控制某个关键词的生效时间,以控制该关键词特征在整体图片中的比例或权重,这时我们可以将此关键词放入中括号[
],加:生效时间段比例。好比:forest,tree,stone,bird,[flowers:0.8]
在第上面的框中填入提示词(Prompt),对想要天生的东西举行文字形貌在第下面框中填入负面提示词(Negative
prompt),你不想要天生的东西举行文字形貌。
03.参数调整
选择采样方法、采样次数、图片尺寸等参数。
1、采样方法:
•Sampler(采样器/采样方法) 选择使用哪种采样器。Euler a(Eular
ancestral)可以以较少的步数产生很大的多样性,不同的步数可能有不同的结果。而非 ancestral 采样器都会产生根本雷同的图像。DPM
干系的采样器通常具有不错的效果,但耗时也会相应增长。
•Euler 是最简朴、最快的
•Euler a 更多样,不同步数可以生产出不同的图片。但是太高步数 (>30) 效果不会更好。
•DDIM 收敛快,但服从相对较低,因为需要很多 step 才能得到好的结果,适合在重绘时候使用。
•LMS 是 Euler 的衍生,它们使用一种干系但稍有不同的方法(均匀已往的几个步调以提高准确性)。大概 30 step 可以得到稳定结果
•PLMS 是 Euler 的衍生,可以更好地处置惩罚神经网络布局中的奇特性。
•DPM2 是一种神奇的方法,它旨在改进 DDIM,淘汰步调以得到精良的结果。它需要每一步运行两次去噪,它的速率大约是 DDIM
的两倍,生图效果也非常好。但是假如你在举行调试提示词的实验,这个采样器可能会有点慢了。
•UniPC 效果较好且速率非常快,对平面、卡通的表现较好,保举使用。
2、迭代步数:
•Sampling Steps(迭代步数) Stable Diffusion
的工作方式是从以随机高斯噪声起步,向符合提示的图像一步步降噪接近。随着步数增多,可以得到对目的更小、更准确的图像。但增长步数也会增长天生图像所需的时间。增长步数的边际收益递减,取决于采样器。一般开到
20~30。
•不同采样步数与采样器之间的关系:
3、CFG:
•CFG Scale(提示词干系性)
图像与你的提示的匹配水平。增长这个值将导致图像更接近你的提示,但它也在一定水平上降低了图像质量。可以用更多的采样步调来抵消。过高的 CFG Scale
体现为粗犷的线条和过锐化的图像。一般开到 7~11。CFG Scale 与采样器之间的关系:
4、批次:
•总批次数 每次天生图像的组数。一次运行天生图像的数量为“批次* 批次数量”。
•单批数量 同时天生多少个图像。增长这个值可以提高性能,但也需要更多的显存。大的 Batch Size 需要斲丧巨量显存。若没有超过 12G
的显存,请保持为 1。
5、尺寸:
•尺寸 指定图像的长宽。出图尺寸太宽时,图中可能会出现多个主体。1024 之上的尺寸可能会出现不理想的结果,保举使用小尺寸分辨率+高清修复(Hires
fix)。
6、种子:
•种子 种子决定模型在天生图片时涉及的所有随机性,它初始化了 Diffusion 算法出发点的初始值。理论上,在应用完全雷同参数(如
Step、CFG、Seed、prompts)的环境下,生产的图片应当完全雷同。
7、高清修复:
•高清修复
通过勾选 “Hires. fix”
来启用。默认环境下,文生图在高分辨率下会天生非常混沌的图像。假如使用高清修复,会型起首按照指定的尺寸天生一张图片,然后通过放大算法将图片分辨率扩大,以实现高清大图效果。最终尺寸为(原分辨率*缩放系数
Upscale by)。
•放大算法中,Latent 在很多环境下效果不错,但重绘幅度小于 0.5 后就不甚理想。ESRGAN_4x、SwinR 4x 对 0.5
以下的重绘幅度有较好支持。
•高分迭代步数 表现在举行这一步时计算的步数。
•重绘幅度,表现为末了天生图片对原始输入图像内容的变化水平。该值越高,放大后图像就比放大前图像差异越大。低,意味着修正原图,高 ,
就和原图就没有大的干系性了。一般来讲阈值是 0.7 左右,超过 0.7 和原图根本上无关,0.3 以下就是稍微改一些。
8、面部修复:
•面部修复 修复画面中人物的面部,但黑白写实风格的人物开启面部修复可能导致面部崩坏。
9、天生:
•点击“天生”
关于AI绘画技术储备
学好 AI绘画 岂论是就业还是做副业赢利都不错,但要学会 AI绘画 还是要有一个学习规划。末了大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点资助!
对于0底子小白入门:
假如你是零底子小白,想快速入门AI绘画是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更会合。
二方面是可以找到适合自己的学习方案
包罗:stable diffusion安装包、stable diffusion0底子入门全套PDF,视频学习教程。带你从零底子系统性的学好AI绘画!
零底子AI绘画学习资源先容
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
反转基因福娃
论坛元老
这个人很懒什么都没写!
楼主热帖
设计模式---组合模式
Spark快速上手(4)Spark核心编程-Spark ...
【Unity3D】Transform组件
拿到12家offer,想给大家分享一下面试 ...
【渗透攻击】PowerShell与Shell 有什么 ...
Linux的目录结构
如何将鸿蒙(harmonyOS)系统退回安卓 ...
使用 Kubeadm 部署 K8S安装
[工具使用]SqlMap
echarts使用及遇到的问题
标签云
渠道
国产数据库
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
linux
快速回复
返回顶部
返回列表