论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
人工智能
›
人工智能
›
AI绘画Stable Diffusion新手超详细快速入门教程,我不允 ...
AI绘画Stable Diffusion新手超详细快速入门教程,我不允许你还不会! ...
勿忘初心做自己
金牌会员
|
6 天前
|
显示全部楼层
|
阅读模式
楼主
主题
577
|
帖子
577
|
积分
1731
大家好,我是步伐员晓晓
关于Ai绘画,很多人在体验了Midjourney(以下简称MJ)之后,发现它创意能力很强,但可控性比较弱,不便应用,于是转向Stable Diffussion(以下简称SD),但又发现SD貌似很复杂。我在配景收得比较多的留言,都是一些很基础的问题咨询,这是这篇文章的写作配景。
AI绘画先容
Ai绘画的算法工具,如果要做一个不一定准确的类比,可以说MJ是类似Ai美图秀秀般的存在,简朴易上手,SD则类似PhotoShop,同样是图片处理,但学习起来要复杂一些,醒目相对更难。
这篇文章的目的是作一个简朴先容,帮助新手熟悉SD,老鸟照旧可以略过。
Stable Diffussion的直译是“稳定的扩散”,很多教程一开始就讲“扩散”原理,讲一大堆运行逻辑,令人望而生畏。现实上,我们只需知道母鸡可以产蛋,但并不需要研究母鸡的生殖构造和产蛋原理。同理,平凡用户只需知道SD是一个Ai绘图算法工具即可。
一、利用环境
SD如今需要在电脑中工作,在利用SD之前,起首要了解它的利用环境。SD和MJ一样可在线利用,不同的是SD是开源的,如果条件允许的话可思量在本地部署,完全免费,可以非常机动地配置各种模型等,但对本地硬件要求比较高,比如独立显卡,要求显存一样平常在8G或以上,平凡的办公电脑无法达到要求,需要更高配的台式机或电竞本才可满足。
另外对软件环境也有要求,比方配置Python等。听起来好像很贫苦,现实否则,如今已有各种一键安装包,小白都可轻松安装(
一键安装包请看文末扫描即可获取哦
)。
而在线部署的,服务商也会提供具体教程,如今阿里云的SD部署照旧比较简朴,这里不做多讲。
二、利用基础:文本指令
ChatGPT也好,Ai绘画也好,都属于生成式Ai,这类Ai如今有一个特点,需要人工输入指令去引导它工作。我们利用ChatGPT时,需要输入你的问题,它才会回复你。你提出的“问题”,就是使它工作的指令。
Ai绘画和ChatGPT不同的是,不需要提问,但需要你告诉它,你要画什么东西。用过MJ的朋友应该非常理解这个动作,比方,MJ用户需要它画一个女孩,只需要输入对应的英文“A girl”即可。
在SD中,这种方式可行吗?当然可以。但和MJ这种一句话搞定的方式不同,SD的绘画指令和参数明确由多个部分组成,看似繁多但不复杂,也比较轻易理解。
这些指令主要属于文本指令,是“文生图”方式。SD还支持同时利用文本+样图,去生成图片或对图片进行修改,这种是“图生图”方式
三、文本指令构成
SD的所有绘画指令,在一个的操作界面(Webui)中完成,界面主体由几个部分组成。
1.具体的“文字”指令
包含2个部分:你想画什么(正面形貌)、你不希望画面出现什么(负面/发面形貌),下图是SD的Webui文字指令输入界面:
这种指令,和MJ是大要类似的,只不外在MJ中需要用一句话讲完,而在SD中,要在不同的输入框中分开填写,更加直观。比如说,你希望画“一个美丽的18岁的女孩”,这是一个正面形貌;你希望这个女孩不要出现“多余的手指”,这是一个反面形貌。只需要在对应的输入框中填入即可。
文本指令是非常紧张的部分,形貌得清晰不清晰,出来的画面大相径庭。
2.参数指令
无需一听“参数”二字就以为贫苦,就是一个简朴的设置。在SD中,基础参数设置主要包罗几个地方,如下图:
(1)采样方法(Sampler)。这个名词的本来寄义解释起来比较拗口,但你可以将它理解为不同的图像渲染方式。不同的采样方法有不同的特长。
有两种用得比较多,第一种是Euler a,生成速度比较快,适合于二次元、小场景和图标等画面生成。第二种是DPM++2S a Karras,适合写实人像,复杂场景等画面生成。其它的采样方法,自己可以探索,实践生成一下可看到它们之间的差异。
(2)采样迭代步数(Steps),这个步数值影响图像的细节,一样平常来说,发起20起步,越大代表图像越精细,但并不是越大越好,需要在实践中联合不同的模型去观察。区间在20-40比较常见。
(3)修复。这里常用的是“面部修复”和“高清修复”两个选项。
在画“真人”的时候,勾选前者会显著影响人脸细节,可以生成更好的人脸。后者主要是用来高清放大。因为硬件条件有限,很多电脑更适合生成小尺寸图像,勾选这个选项时,可以对生成的小图进行高清放大。
但需要指出的是,放大的尺寸并非无穷,平凡配置的电脑,长宽放大到1500*1500几乎已是极限,而且,放大的图片和小图风格同等但细节有差异,这个可以在实践中对照。
(4)图片的长宽设置。最轻易理解的一个选项。
(5)生成批次及每批数目设置。这2个数值很考验显卡盘算能力,以8g显存为例,发起批次设置为3(一次生成3批),每批数目为1,总共3张图片。每批数目的值越大,对显卡的压力越大,一样平常发起保留默认数值1。
(6)提示词相干性(CFG Scale)、随机种子(seed)
相干性值可以设置为1-30,值越小,生成的图片和你输入的文本指令的符合度越低,越大则越高。但并不是越大/越小越好。一样平常环境下,画人物时这个值在7-10之间是比较平衡的,画建筑一样平常是4-8之间,需要在实践联合不同的模型去观察。以下是一些参考:
当CFG处于2-6时,Ai发挥想象力空间大,不可控性进步。
当CFG处于10-15时,你的作品受到你的提示的良性影响。
当CFG处于16-20时,你得确定你的提示词真的是你想要的,否则结果不会太好。当CFG高于20时,可能会产生一些希奇的现象。
另一个是种子值,这是一个可以锁定生成图像的初始状态的值,一样平常设置为-1,意味着随机生成。当你利用了一个固定的seed值(非-1),并利用了其它类似的参数和指令时,会得到一张几乎完全一样的图片。
需要指出的是,即使所有的设置一样,在不同的显卡下,生成图片的细节差异可能会比较大。
四、模型选择
模型选择现实上也属于“指令”的组成部分,这里单列出来说。模型是Ai绘画中一个基础设施,决定生成画面的元素、风格、画风等。有些像PPT一样,你采用不同的模板,呈现的就是不同的画面风格。
从上图操作界面中可以看到,常用模型主要有3种。
(1)大模型:指SD绘图的基础模型,也叫大模型/底模。SD必须搭配大模型才能利用。大模型决定画面的主要风格,不同的大模型擅长的领域会有侧重,比如,有些擅长画漫画,有些是真人、建筑、国风等。
(2)小模型:常用的主要指Lora模型,属于微调模型,必须联合大模型利用,通过不同的权重影响画面特征。有人说,大模型相当于素颜,小模型相当于化装,在某种程度上简直可以这么理解。
Lora模型由于训练简朴结果显著,得到广泛应用,但这种小模型并不是必须的,很多大模型自己就带有很好的“化装”结果。所不同的是,小模型和大模型同时利用的时候,可以调解出大模型无法达到的叠加优化结果。
(3)VAE模型。可以理解为滤镜,用于调节和美化。同样的,它也不是必须的,依据个人绘画需要决定是否采用。也有例外,个别大模型由于训练结果等问题,会明确提示要联合VAE利用。VAE图片结果例:
(4)其它模型:Embeddings、Hypernetworks、LyCORIS、DreamBooth(微调大模型)模型,这些对初学者来说,很少有机会用到,以后再讲。
(5)模型从哪里来
要达到比较好的画面结果,必须通过训练得到绘画模型。初学者更多的是利用别人训练好的。在C站上,有大量免费共享模型,需要“科学上网”才可下载。熟练利用之后,也可以自己训练私有模型。模型训练需要较好的硬件支持,以及一些高质量的训练素材等,另文讨论。
五、绘画插件
在一些时候,单纯依靠文本指令,并不能画出我们想要的画面,这个时候就需要利用SD插件。插件是SD绘画可以进入应用层面的、非常紧张的一个部分。
SD如今最常用、最强盛的插件,一样平常以为是Controlnet插件。它可以控制人物心情、姿势、手势等,可以识别景深、线条,并生成文本指令无法实现的要素,诸如此类。这个插件也需要另开一篇专门的文章才可讲清楚。
下图是一个按骨骼图生成人物的图例:
这种的插件,意味着SD绘画拥有较高的“可控性”能力。这是其它Ai绘画工具如今无法相比的,也意味着其更加接近商业层面的应用。
了解了上述主要界面元素和指令之后,对SD生成图片基本就算是有了一个基础熟悉,大家也可以看到,它虽然指令和参数比较多,但理解起来并不困难。
最后小结一下,SD的文生图绘画指令从整理开看,主要包含了以下内容:
写在最后
感爱好的小伙伴,赠予全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。
AIGC技术的将来发展远景广阔,随着人工智能技术的不断发展,AIGC技术也将不断进步。将来,AIGC技术将在游戏和盘算领域得到更广泛的应用,使游戏和盘算系统具有更高效、更智能、更机动的特性。同时,AIGC技术也将与人工智能技术精密联合,在更多的领域得到广泛应用,对步伐员来说影响至关紧张。将来,AIGC技术将继续得到进步,同时也将与人工智能技术精密联合,在更多的领域得到广泛应用。
一、AIGC所有方向的学习路线
AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
三、最新AIGC学习条记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的册本或者手写的条记资料,这些条记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有结果的方式,跟着视频中老师的思路,从基础到深入,照旧很轻易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到现实当中去,这时候可以搞点实战案例来学习。
如有侵权,请接洽删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
正序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
发新帖
回复
勿忘初心做自己
金牌会员
这个人很懒什么都没写!
楼主热帖
集合论第6-8章
Java 代理模式
如何爆破js加密后的密码?
将git仓库从submodule转换为subtree ...
数字工厂介绍
反射 p1 反射机制
新一代企业级安全OneDNS
【技术积累】Mysql中的SQL语言【技术篇 ...
java -- Stringbuild、Date和Calendar ...
SignalR 2 与mvc 5实现实时聊天功能 ...
标签云
挺好的
服务器
快速回复
返回顶部
返回列表