小秦哥 发表于 2025-4-1 12:54:39

Stable Diffusion教程:图生图_stable diffusion 图生图


[*] 本文重要分为四部门:
[*] 1. 图生图原理
[*] 2. 图生图流程先容
[*] 3. 随机种子Seed的应用
[*] 4. 图生图应用场景
今天开始解说 SD 的「图生图」功能。你肯定看到过下面这样的例子,通过原图通过AI绘画加工成自己想要的图片。
https://i-blog.csdnimg.cn/blog_migrate/1aab234fa0c87872b7ceb3a5543d2025.png
在 Midjourney 中叫「垫图」,而在 Stable Diffusion 中我们叫「图生图」,其实是差不多的意思。
1、图生图原理
我们前面先容过「文生图」,但是「文生图」有一个最大的特点就是「随机性」。对图片的操作几乎没有可控性一说,它画出来的图片可能根本不符合我们的需求。
https://i-blog.csdnimg.cn/blog_migrate/d59bbbe34243c04b448e005d26554707.png
在我们的现实生活里,这种对需求的偏差与错误理解还是很普遍存在的。
假如你是客户,负责产生设计需求,而设计师负责实现需求。你除了不断用文字和语言形貌你的需求,另有什么方法让设计师秒懂你需求想法呢?
你是不是通常会找一张类似风格的图片,说:跟这张图差不多的风格,你帮我模仿着这张图来。
https://i-blog.csdnimg.cn/blog_migrate/41d4cb41f83c48eb2584624e87f745a7.jpeg
那么在AI的天下里,同样也存在这样的情况,「文生图」就好像你对着一个AI设计师不断的用语言沟通,AI对你的需求理解是存在偏差的。
「图生图」就好像,你找好了一个模板给AI设计师,说:给我按照这个风格来。那么AI设计师就会从图片上得到更多信息,原本的图片上纪录的像素信息会在这个「加噪」和「去噪」的过程中被作为一种特征反应在作品上,末了越来越接近你的需求。
https://i-blog.csdnimg.cn/blog_migrate/114af526b612d3bb962ebee6291360cb.jpeg
那么「图生图」到底什么意思呢?实现把一张照片用另一种完全不同的方法画出来的过程,在 AI 的天下里管它叫「图生图」。简单来说的话,「图生图」可以资助你把一张图片画成另一种模样。
这下你明白了吧?借助AI里面的「图生图」,你可以将真实天下里的人物变成二次元天下的人物,你也可以将动漫角色人物变成真实人物面貌。是不是很魔幻?
2、图生图流程先容
在上面我们已经很清楚的先容完了「图生图」的原理,那具体应该怎么去做呢,「图生图」具体的流程是什么样的呢?
在 SD 里面举行「图生图」重要分为三步:导入图片、誊写提示词、调整参数
第一步:导入图片
打开 SD WebUI 找到「图生图」的操作界面,基本功能和「文生图」差不多,但在中心多了一个「上传图片」的流程。
https://i-blog.csdnimg.cn/blog_migrate/77614a48acc74fc4d67c79f995e33213.png
这个位置也是我们上传本地图片到 SD 中的重要环节。将我们准备好的图片上传上去。
https://i-blog.csdnimg.cn/blog_migrate/59eba8edb956d50b462f6a029fe80b9b.png
导入图片后,另有其他的一些功能,例如说涂鸦、局部重绘、涂鸦重绘等,我们在后续的环节中再解说。
https://i-blog.csdnimg.cn/blog_migrate/d757ba28db961f0ebedf0ee54661ad12.png
第二步:誊写提示词
其实「图生图」的提示词和「文生图」的提示词誊写逻辑是一样。
02 AI绘画提示词原理详解
当然在「图生图」中提示词也很告急,我们可以用上篇文章中学到的,实验形貌一下我们刚刚上传的图片的特征。先简单做个示范
https://i-blog.csdnimg.cn/blog_migrate/21a0083b0c14948c3a62ee842887b916.png
第三步:参数调整
「图生图」的参数和「文生图」参数基本上差不多,但是也有一些「图生图」才有的参数。
例如说「重绘幅度」。我们一般设置在 0.6 ~ 0.8 之间
https://i-blog.csdnimg.cn/blog_migrate/9529faeda7ccb99d321a139dabe0255e.png
其他参数的话,不再多啰嗦了。我们上一篇文章里面已经讲过了,还没看过的朋侪,点下面这个链接

在这里我们把「采样方法」设置为「DPM++ SDE Karras」
https://i-blog.csdnimg.cn/blog_migrate/58fd67f32e686b8a608bd77576feddd3.png
「提示词引导系数」设置为:8
https://i-blog.csdnimg.cn/blog_migrate/e9354144563581807828f3034e7c0176.png
「迭代步数」设置为:20
https://i-blog.csdnimg.cn/blog_migrate/49022bfb341b76aaaba47e9fb28ea16e.png
图片分辨率设置为:500 * 500
https://i-blog.csdnimg.cn/blog_migrate/e612757eeb29fc409e5fe8d10c950281.png
全部设置完成后,我们点击生成,这时候我们就利用「图生图」生成了一张新的图片。
https://i-blog.csdnimg.cn/blog_migrate/975375808af463643f53070baeea3742.png
这是我们通过「图生图」生成出来的一个最基本的全部过程,但是另有许多改进的空间。
那么另有哪些方面是可以优化的呢?提示词、重绘幅度设置、分辨率设置。
在提示词的环节,我们可以对上传的图片形貌更具体、更精准。
假如没有形貌清楚,那么就有可能导致画出来的图片翻车,由于AI只读取了图片,但是没有对图片中的具体内容。
https://i-blog.csdnimg.cn/blog_migrate/d165d5f68edc79a2fe2746ef08f67889.png
可以根据我们上一篇文章讲到的提示词来优化我们现在的提示词。这里不再具体说细节了,我们上篇文章已经对提示词做了很清楚的解说。
02 AI绘画提示词原理详解
那么优化之后的样子是什么样的呢?
https://i-blog.csdnimg.cn/blog_migrate/62161b6760d808a7f88fa503c09f9892.png
继续对「重绘幅度」举行优化。在设置的时候也必要自己调试一个安全范围,太高可能会导致画面变形,太低又看不出具体的重绘结果。
那么我们实验后,找到「重绘幅度」的平衡点是多少呢?
https://i-blog.csdnimg.cn/blog_migrate/0b542f9838d091fc3d8a41e3dc87d089.png
末了我们再来优化一下图片的分辨率。
我们最好是跟原图的尺寸一样。什么意思呢?假如你原图是 512 * 512,那说明比例是 1:1 的。那么你输出的图片的比例也应该是 1:1的。
否则我们生成的图片是会严重变形的。我们设置为 800 * 800,也是能和原图的1:1比例对应起来的。
https://i-blog.csdnimg.cn/blog_migrate/46ffe8b30f30a3eef05aa9e2e1287f1f.png
假如你上传的图片分辨率黑白常大的,那么是必要事先将图片裁剪到能被SD画出来的安全范围。
在上面这些参数都举行优化了之后,我们再点击「生成」。
https://i-blog.csdnimg.cn/blog_migrate/44cea472784a61f7daecc2a693041047.png
这时候很显着是要比前面第一次生成的结果要好的。
https://i-blog.csdnimg.cn/blog_migrate/0ae68e37d07ee116f6d8e138ee801055.png
3、随机种子seed的应用
就像我们之前说的,就算你给你原图,但是假如不对提示词举行准确精准的形貌,大概不调试符合的参数的话,AI也不能准确无误的懂得你的意思。
假如我们原图背景本来是室外的,而通过「图生图」生成出来的图片是室内的。
https://i-blog.csdnimg.cn/blog_migrate/8605af07c4f0a54a34f33dc027ce62fc.png
那么我们倒是可以通过增加和修改提示词,来达到我们想要的室内结果。
https://i-blog.csdnimg.cn/blog_migrate/770e87697430a27a2bf9808a8b77729e.png
修改完新的提示词后,我们得到的结果是下面这样,都成了室内的图片。
https://i-blog.csdnimg.cn/blog_migrate/659edcd44e18ae8ecfc9e07c6c481def.png
但是又出现了新的问题,但是人物的姿势怎么改变了,还是AI的「随机性」在作祟。
我们还是想要和之前的人物姿势一样,这怎么办呢?这时候我们就要用到「随机种子」
https://i-blog.csdnimg.cn/blog_migrate/86fae5a7c5b2f7f8f53f01b39d9d641f.png
AI生成一幅作品的过程是随机的,但它的每一次生成都有自己的一套形貌方式,而这个形貌方式会被纪录成一组随机数,也就是随机种子。
https://i-blog.csdnimg.cn/blog_migrate/03a0b0901cdb4e85389d66aed9b734ac.png
不同的随机种子生成出来的图片肯定是不一样的,但是假如你用同一个随机种子来生成图片,那肯定两组图片的相似度黑白常高的,由于都是用同一套随机方法生成出来的。
由于你每生成一张图,就会生成一套随机种子,有的种子结果好,有的种子结果差。你可以把这个随机种子简单理解成AI生成这张图的唯一编号。
在「随机种子」这个选项中,左边的
页: [1]
查看完整版本: Stable Diffusion教程:图生图_stable diffusion 图生图