AI绘画Stable Diffusion新手超详细快速入门教程,我不允许你还不会! ...

打印 上一主题 下一主题

主题 577|帖子 577|积分 1731

大家好,我是步伐员晓晓
关于Ai绘画,很多人在体验了Midjourney(以下简称MJ)之后,发现它创意能力很强,但可控性比较弱,不便应用,于是转向Stable Diffussion(以下简称SD),但又发现SD貌似很复杂。我在配景收得比较多的留言,都是一些很基础的问题咨询,这是这篇文章的写作配景。

AI绘画先容

Ai绘画的算法工具,如果要做一个不一定准确的类比,可以说MJ是类似Ai美图秀秀般的存在,简朴易上手,SD则类似PhotoShop,同样是图片处理,但学习起来要复杂一些,醒目相对更难。
这篇文章的目的是作一个简朴先容,帮助新手熟悉SD,老鸟照旧可以略过。
Stable Diffussion的直译是“稳定的扩散”,很多教程一开始就讲“扩散”原理,讲一大堆运行逻辑,令人望而生畏。现实上,我们只需知道母鸡可以产蛋,但并不需要研究母鸡的生殖构造和产蛋原理。同理,平凡用户只需知道SD是一个Ai绘图算法工具即可。

一、利用环境

SD如今需要在电脑中工作,在利用SD之前,起首要了解它的利用环境。SD和MJ一样可在线利用,不同的是SD是开源的,如果条件允许的话可思量在本地部署,完全免费,可以非常机动地配置各种模型等,但对本地硬件要求比较高,比如独立显卡,要求显存一样平常在8G或以上,平凡的办公电脑无法达到要求,需要更高配的台式机或电竞本才可满足。
另外对软件环境也有要求,比方配置Python等。听起来好像很贫苦,现实否则,如今已有各种一键安装包,小白都可轻松安装(一键安装包请看文末扫描即可获取哦)。
而在线部署的,服务商也会提供具体教程,如今阿里云的SD部署照旧比较简朴,这里不做多讲。

二、利用基础:文本指令

ChatGPT也好,Ai绘画也好,都属于生成式Ai,这类Ai如今有一个特点,需要人工输入指令去引导它工作。我们利用ChatGPT时,需要输入你的问题,它才会回复你。你提出的“问题”,就是使它工作的指令。
Ai绘画和ChatGPT不同的是,不需要提问,但需要你告诉它,你要画什么东西。用过MJ的朋友应该非常理解这个动作,比方,MJ用户需要它画一个女孩,只需要输入对应的英文“A girl”即可。
在SD中,这种方式可行吗?当然可以。但和MJ这种一句话搞定的方式不同,SD的绘画指令和参数明确由多个部分组成,看似繁多但不复杂,也比较轻易理解。
这些指令主要属于文本指令,是“文生图”方式。SD还支持同时利用文本+样图,去生成图片或对图片进行修改,这种是“图生图”方式

三、文本指令构成

SD的所有绘画指令,在一个的操作界面(Webui)中完成,界面主体由几个部分组成。
1.具体的“文字”指令
包含2个部分:你想画什么(正面形貌)、你不希望画面出现什么(负面/发面形貌),下图是SD的Webui文字指令输入界面:

这种指令,和MJ是大要类似的,只不外在MJ中需要用一句话讲完,而在SD中,要在不同的输入框中分开填写,更加直观。比如说,你希望画“一个美丽的18岁的女孩”,这是一个正面形貌;你希望这个女孩不要出现“多余的手指”,这是一个反面形貌。只需要在对应的输入框中填入即可。

文本指令是非常紧张的部分,形貌得清晰不清晰,出来的画面大相径庭。
2.参数指令
无需一听“参数”二字就以为贫苦,就是一个简朴的设置。在SD中,基础参数设置主要包罗几个地方,如下图:

(1)采样方法(Sampler)。这个名词的本来寄义解释起来比较拗口,但你可以将它理解为不同的图像渲染方式。不同的采样方法有不同的特长。
有两种用得比较多,第一种是Euler a,生成速度比较快,适合于二次元、小场景和图标等画面生成。第二种是DPM++2S a Karras,适合写实人像,复杂场景等画面生成。其它的采样方法,自己可以探索,实践生成一下可看到它们之间的差异。
(2)采样迭代步数(Steps),这个步数值影响图像的细节,一样平常来说,发起20起步,越大代表图像越精细,但并不是越大越好,需要在实践中联合不同的模型去观察。区间在20-40比较常见。
(3)修复。这里常用的是“面部修复”和“高清修复”两个选项。
在画“真人”的时候,勾选前者会显著影响人脸细节,可以生成更好的人脸。后者主要是用来高清放大。因为硬件条件有限,很多电脑更适合生成小尺寸图像,勾选这个选项时,可以对生成的小图进行高清放大。
但需要指出的是,放大的尺寸并非无穷,平凡配置的电脑,长宽放大到1500*1500几乎已是极限,而且,放大的图片和小图风格同等但细节有差异,这个可以在实践中对照。

(4)图片的长宽设置。最轻易理解的一个选项。
(5)生成批次及每批数目设置。这2个数值很考验显卡盘算能力,以8g显存为例,发起批次设置为3(一次生成3批),每批数目为1,总共3张图片。每批数目的值越大,对显卡的压力越大,一样平常发起保留默认数值1。
(6)提示词相干性(CFG Scale)、随机种子(seed)
相干性值可以设置为1-30,值越小,生成的图片和你输入的文本指令的符合度越低,越大则越高。但并不是越大/越小越好。一样平常环境下,画人物时这个值在7-10之间是比较平衡的,画建筑一样平常是4-8之间,需要在实践联合不同的模型去观察。以下是一些参考:
   当CFG处于2-6时,Ai发挥想象力空间大,不可控性进步。
  当CFG处于10-15时,你的作品受到你的提示的良性影响。
  当CFG处于16-20时,你得确定你的提示词真的是你想要的,否则结果不会太好。当CFG高于20时,可能会产生一些希奇的现象。
  另一个是种子值,这是一个可以锁定生成图像的初始状态的值,一样平常设置为-1,意味着随机生成。当你利用了一个固定的seed值(非-1),并利用了其它类似的参数和指令时,会得到一张几乎完全一样的图片。
需要指出的是,即使所有的设置一样,在不同的显卡下,生成图片的细节差异可能会比较大。

四、模型选择

模型选择现实上也属于“指令”的组成部分,这里单列出来说。模型是Ai绘画中一个基础设施,决定生成画面的元素、风格、画风等。有些像PPT一样,你采用不同的模板,呈现的就是不同的画面风格。

从上图操作界面中可以看到,常用模型主要有3种。
(1)大模型:指SD绘图的基础模型,也叫大模型/底模。SD必须搭配大模型才能利用。大模型决定画面的主要风格,不同的大模型擅长的领域会有侧重,比如,有些擅长画漫画,有些是真人、建筑、国风等。
(2)小模型:常用的主要指Lora模型,属于微调模型,必须联合大模型利用,通过不同的权重影响画面特征。有人说,大模型相当于素颜,小模型相当于化装,在某种程度上简直可以这么理解。
Lora模型由于训练简朴结果显著,得到广泛应用,但这种小模型并不是必须的,很多大模型自己就带有很好的“化装”结果。所不同的是,小模型和大模型同时利用的时候,可以调解出大模型无法达到的叠加优化结果。
(3)VAE模型。可以理解为滤镜,用于调节和美化。同样的,它也不是必须的,依据个人绘画需要决定是否采用。也有例外,个别大模型由于训练结果等问题,会明确提示要联合VAE利用。VAE图片结果例:

(4)其它模型:Embeddings、Hypernetworks、LyCORIS、DreamBooth(微调大模型)模型,这些对初学者来说,很少有机会用到,以后再讲。
(5)模型从哪里来
要达到比较好的画面结果,必须通过训练得到绘画模型。初学者更多的是利用别人训练好的。在C站上,有大量免费共享模型,需要“科学上网”才可下载。熟练利用之后,也可以自己训练私有模型。模型训练需要较好的硬件支持,以及一些高质量的训练素材等,另文讨论。

五、绘画插件

在一些时候,单纯依靠文本指令,并不能画出我们想要的画面,这个时候就需要利用SD插件。插件是SD绘画可以进入应用层面的、非常紧张的一个部分。
SD如今最常用、最强盛的插件,一样平常以为是Controlnet插件。它可以控制人物心情、姿势、手势等,可以识别景深、线条,并生成文本指令无法实现的要素,诸如此类。这个插件也需要另开一篇专门的文章才可讲清楚。
下图是一个按骨骼图生成人物的图例:

这种的插件,意味着SD绘画拥有较高的“可控性”能力。这是其它Ai绘画工具如今无法相比的,也意味着其更加接近商业层面的应用。
了解了上述主要界面元素和指令之后,对SD生成图片基本就算是有了一个基础熟悉,大家也可以看到,它虽然指令和参数比较多,但理解起来并不困难。
最后小结一下,SD的文生图绘画指令从整理开看,主要包含了以下内容:

写在最后

感爱好的小伙伴,赠予全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。


AIGC技术的将来发展远景广阔,随着人工智能技术的不断发展,AIGC技术也将不断进步。将来,AIGC技术将在游戏和盘算领域得到更广泛的应用,使游戏和盘算系统具有更高效、更智能、更机动的特性。同时,AIGC技术也将与人工智能技术精密联合,在更多的领域得到广泛应用,对步伐员来说影响至关紧张。将来,AIGC技术将继续得到进步,同时也将与人工智能技术精密联合,在更多的领域得到广泛应用。


一、AIGC所有方向的学习路线
AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。


二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!

三、最新AIGC学习条记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的册本或者手写的条记资料,这些条记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。


四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有结果的方式,跟着视频中老师的思路,从基础到深入,照旧很轻易入门的。

五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到现实当中去,这时候可以搞点实战案例来学习。

如有侵权,请接洽删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

勿忘初心做自己

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表