论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
人工智能
›
人工智能
›
Stable diffusion保姆级底子知识(全网最详细) ...
Stable diffusion保姆级底子知识(全网最详细)
卖不甜枣
金牌会员
|
5 小时前
|
显示全部楼层
|
阅读模式
楼主
主题
914
|
帖子
914
|
积分
2742
我也不想标题党,可它们就是好萌啊!看看下面这些你熟悉多少?
我是憨憨,一个不会画画的设计师。过去半年里,AI绘画曾经多次引爆公众讨论,网络上那些精致的二次元同人插画、堪比真人的AI穿搭博主、打破次元壁的赛博Coser……背后都有一个“幕后黑手”
—— Stable Diffusion,其背后的技能便是人们常说的扩散模型(扩散模型这个概念源自热力学,在图像天生问题中得以应用)。
有需要stable diffusion整合包以及提示词插件,可以扫描下方,免费获取
想知道上面这些精致的插画是怎样实现的吗?接下来,我将联合这个案例带你走进 Stable Diffusion
的世界,帮你系统性地相识并把握这神奇AI绘画魔法。
虽然我们把这个过程称之为AI绘画,但现实上它并不是像人类画图一样打草稿、构线描边,再去上色、对细节加工……如许按部就班地去完成一幅画作的,它接纳了一个人类不曾设想的路径
—— Diffusion(扩散)。
一、Diffusion:眼一闭一睁,一张图画好了
有一个非常形象的方式,来解释 Diffusion 的原理。
这是我家的傻狗,你可以将本身的角色带入到执行绘画指令的AI中,现在让你把这幅画用宫崎骏风格重新绘制一遍,你做得到吗?你可以实验着把眼睛眯成一条缝去看它(假如你近视可以摘掉本身的眼镜),它是不是变得模糊了?保持这个状态,想象着它正在渐渐酿成动漫里的样子,随后徐徐睁开眼睛……
这就是一个扩散模型工作的根本流程了。
在这个过程中,AI会将图片通过增加噪声的方式进行“扩散”,使它变得模糊,就像是眯起眼睛的你一样,当内容模糊了以后,你就有更充分的空间去从它原本的形态抽离,并且想象它是否能酿成其他模样。AI通过深度学习的方式,将很多不同的图像都转换成了如许的抽象内容,并渐渐开始明白了这个“扩散”的过程,每学一张图,它就会通过一些方式提取图像里的信息特征,并和它的原图建立关联。
在刚才的例子中,当提到宫崎骏风格的时候,你的脑海里肯定也会跳出跟这类作品相干的风格特质来,因为你看过并且记得,这个时候,我们开始去想象它酿成动画片里的样子,并且用一个动漫的方式“睁开眼睛”,让图片恢复清晰,这就是在对图像进行逆向的扩散,也就是去噪。这幅画,就已经被你脑海里关于宫崎骏的想象重新绘制一遍了。
这一原理,为我们在AI绘画中的利用提供了理论底子和指导思想。当然,这只是一个简朴的比喻,在真实的AI图像天生过程中要远复杂得多,我们只需要知道,在SD里面我们能打仗到的各种提示词、模型、controlNet
等,其实控制的都只是AI的学习、转化、去噪过程,而非它一笔一画的动作。
二、一副AI绘画作品 = 提示词 + 参数设置 + 模型
这是 Stable Diffusion webUI,我们所有的利用都是在这里完成的。webUI其实只是一个执行的程序,用来屏蔽掉 Stable
Diffusion 复杂的模型和代码利用。当你在浏览器里打开了这个webUI以后,就可以利用它开始作画了。
WebUI
上面一整排标签栏对应了不同的功能,做图最常用的是前两个:文生图与图生图,它代表的是两种绘制的根本方式,第三个标签的更多主要用于对图片进行AI放大处置惩罚,它可以让你天生更清晰的大图。
看过《哈利波特》的影迷肯定会记得,在霍格沃滋的魔法世界里,一个魔咒想要乐成施展,不仅需要会合精神念对咒语,还需要一根魔杖,以及准确地摆荡魔杖的手势,任何一个步调出现错误,都有可能导致魔咒发动的失败,极端情况乃至会被反噬,在AI绘画的魔法世界里也是类似。
1、提示词:指挥AI作图的咒语
WebUI 中被我们输入进去的描述笔墨或图像信息,就是 Prompts (提示词):用于天生图像的笔墨输入,需要使用英文输入,但你也可以通过探索
Extensions 来实现中文输入。提示词的涵盖范围很广,可以包括:主体、风格、颜色、质感特点等一些详细要素。
提示词分成两部门,一部门是正向的提示词,另一部门是反向提示词,分别用来控制你想要在画面里出现的、想排除在外的内容。
AI 天生出来的东西是具有随机性的,每次天生出来的东西都会不太一样,这个过程就像是在“抽卡”:想出好的图片,得靠运气来抽。
好比:一个女孩在林中闲步,这其实只是一个非常概括的描述,这个女孩长什么样子、丛林里有什么、时间是早上还是晚上、天气怎样……这些AI都不知道,提示词太过于笼统,那AI就只能瞎蒙、抽卡了。我们可以把本身想象成一个无情的甲方,向AI沟通你的需求、AI需要改进的地方。我们对AI提的要求其实就是提示词
Prompts ,假如AI没有达到想要的效果,就不断补充、阐明,多试几次总有一次可以抽到想要的效果~
虽说AI是人工智能,但它和人类智慧还是有肯定差距的,有时候你会发现纵然提示词已经给了很多,本身依然很难向AI表达清楚本身的需求。其着实现实生存里,这种对于需求的通报偏差与错误解读其实也广泛存在着,好比:总是干架的产物司理和程序员、甲方客户与设计师。拿我熟悉的设计举例,假如你是需求方,除了不断对着设计师一遍又一遍的咆哮需求以外,还有什么办法让他快速开窍呢?
你可以拿着一张海报或者banner,告诉设计师我想要的感觉是如许的,那他就会更直观、详细的感受到你的想法。AI绘画也是一样,当你觉得提示词不敷以表达你的想法,或者盼望以一个更为简朴清晰的方式通报一些要求的时候,那就再丢一张图片给他就好了。此时,图片的作用和笔墨是相称的,就是都作为一种信息输送到AI那里,让它拿来天生一张新的图片,这就是图生图。
2、参数设置:控制咒语施放的魔杖
这部门内容先容一下在AI绘画过程中,webUI里面这些复杂的参数设置。
(1)采样算法(Sampler)
简朴来说,通过这些采样算法,噪声图像可以渐渐变得更清晰。webUI提供的算法选项非常多,包括 Euler
a、DPM、DDIM 等。我分享几个我们经常会用到的:
•想使用快速、新奇且质量不错的算法,可以实验 DPM++ 2M Karras,设置 20~30 步;
•想要高质量的图像,那么可以考虑使用 DPM++ SDE Karras,设置 10~15 步(计算较慢的采样器)、或者使用 DDIM 求解器,设置
10~15 步;
•喜好稳定、可重现的图像,请避免使用任何原始采样器(SDE 类采样器);
•Euler、Euler a 比力得当插画风格,出图比力朴素;
(2)采样迭代步数(Steps)
与采样算法配合使用,表示天生图像的步数。步数越大,需要等候的时间越长。通常 20-30
步就充足了。默认的采样步数一样平常都是20。假如你的算力富足且想追求更高的细致度,就设置为30-40,最低不要低于10,否则你可能会被你本身产出的作品吓到。
(3)面部修复
在画人物的时候需要勾选上,他可以改善细节、改正不准确的特征,让天生的人脸显得更加天然和雅观,类似美图秀秀的一键美颜。
(4)宽度 & 高度
天生图像的宽度和高度分辨率。默认的分辨率是 512 x 512,
但这个分辨率下的图片,哪怕是细节再丰富,看起来也很模糊,以是设备允许的情况下,我们一样平常把它提到1000左右。相同的提示词用更高的分辨率跑出来,质感完全都不一样。当然,分辨率设置的太高也会有问题,显卡显存扛不住,出现
“CUDA out of
memory”的提示。为了让我的AI绘画有刁悍的性能,包管我的出图效率和体验,我使用了
京东云GPU云主机
,它拥有超强的并行计算能力,在深度学习、科学计算、图形图像处置惩罚、视频编解码等场景广泛使用,可以提供触手可得的算力,有效缓解计算压力,让我在高清出图时不再有“爆显存”的烦恼。
[
**(5)平铺/分块(Tiling)**用来天生无缝贴满整个屏幕的、纹理性图片的,假如没有需要慎重勾选哦,它会让你的画面变得很奇怪。
**(6)提示词相干性(SFG Scale)**CFG Scale 的范围是 1-30,默认值为 7。我们可以通过调解不同的 Scale
值来观察图像的变化。它的数值越高,AI绘画忠实地反应你提示词的水平就越高,7~12之间是比力安全的数值,数值太高则轻易引起图片变形。
**(7)随机种子(Seed)**天生图像的随机种子,类似于抽奖的幸运种子,会影响天生的图像效果,是我们用来控制画面内容划一性的紧张参数。假如我们想要画面保持一样的风格,就可以使用同一个随机种子。在这个随机种子里面,有2个功能按钮,点击右侧的骰子,可以把随机参数设置成-1,每一次都抽一张新的卡;点击中间的循环按钮,就会把种子设置成上一张图片抽出来的数字。
(8)天生批次、每批数量
每批、每次次天生的图像数量,假如显存不够大,发起调小数值。因为AI绘画的不确定性,纵然是同一组提示词,也需要反复试验。这个试验过程有时候会很漫长,假如你想让AI不停不断地按照同一组提示词和参数出图,可以实验批次数调高,绘制的过程则会不断重复地进行。以是完全可以让它一口吻来上个几十次乃至上百次,本身去吃个饭、睡一觉,让显卡默默地在这里打黑工。增大
[每批数量]
可以让每批次绘制的图像数量增多,理论上效率会更高,但它同一批绘制的方法是:把这些图片拼在一起看作一张更大的图片,以是假如你的设备不好,非常轻易爆显存。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
卖不甜枣
金牌会员
这个人很懒什么都没写!
楼主热帖
Windows安装mysql数据库
内网渗透-红队内网渗透工具(Viper) ...
2022保密教育线上培训考试 06 ...
基于SqlSugar的开发框架循序渐进介绍( ...
用Java写一个PDF,Word文件转换工具 ...
嵌入式linux/鸿蒙开发板(IMX6ULL)开发 ...
C# 将HTML转为XML
C语言牛客(NowCoder)刷题——基础语法 ...
嵌入式软件工程师工作经验分享 ...
开源技术交流丨一站式全自动化运维管家 ...
标签云
存储
挺好的
服务器
快速回复
返回顶部
返回列表