论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
qidao123.com技术社区-IT企服评测·应用市场
»
论坛
›
人工智能
›
人工智能
›
Stable Diffusion教程:图生图_stable diffusion 图生图 ...
Stable Diffusion教程:图生图_stable diffusion 图生图
小秦哥
论坛元老
|
2025-4-1 12:54:39
|
显示全部楼层
|
阅读模式
楼主
主题
1731
|
帖子
1731
|
积分
5193
本文重要分为四部门:
1. 图生图原理
2. 图生图流程先容
3. 随机种子Seed的应用
4. 图生图应用场景
今天开始解说 SD 的「图生图」功能。你肯定看到过下面这样的例子,通过原图通过AI绘画加工成自己想要的图片。
在 Midjourney 中叫「垫图」,而在 Stable Diffusion 中我们叫「图生图」,其实是差不多的意思。
1、图生图原理
我们前面先容过「文生图」,但是「文生图」有一个最大的特点就是「随机性」。对图片的操作几乎没有可控性一说,它画出来的图片可能根本不符合我们的需求。
在我们的现实生活里,这种对需求的偏差与错误理解还是很普遍存在的。
假如你是客户,负责产生设计需求,而设计师负责实现需求。你除了不断用文字和语言形貌你的需求,另有什么方法让设计师秒懂你需求想法呢?
你是不是通常会找一张类似风格的图片,说:跟这张图差不多的风格,你帮我模仿着这张图来。
那么在AI的天下里,同样也存在这样的情况,「文生图」就好像你对着一个AI设计师不断的用语言沟通,AI对你的需求理解是存在偏差的。
「图生图」就好像,你找好了一个模板给AI设计师,说:给我按照这个风格来。那么AI设计师就会从图片上得到更多信息,原本的图片上纪录的像素信息会在这个「加噪」和「去噪」的过程中被作为一种特征反应在作品上,末了越来越接近你的需求。
那么「图生图」到底什么意思呢?实现把一张照片用另一种完全不同的方法画出来的过程,在 AI 的天下里管它叫「图生图」。简单来说的话,「图生图」可以资助你把一张图片画成另一种模样。
这下你明白了吧?借助AI里面的「图生图」,你可以将真实天下里的人物变成二次元天下的人物,你也可以将动漫角色人物变成真实人物面貌。是不是很魔幻?
2、图生图流程先容
在上面我们已经很清楚的先容完了「图生图」的原理,那具体应该怎么去做呢,「图生图」具体的流程是什么样的呢?
在 SD 里面举行「图生图」重要分为三步:导入图片、誊写提示词、调整参数
第一步:导入图片
打开 SD WebUI 找到「图生图」的操作界面,基本功能和「文生图」差不多,但在中心多了一个「上传图片」的流程。
这个位置也是我们上传本地图片到 SD 中的重要环节。将我们准备好的图片上传上去。
导入图片后,另有其他的一些功能,例如说涂鸦、局部重绘、涂鸦重绘等,我们在后续的环节中再解说。
第二步:誊写提示词
其实「图生图」的提示词和「文生图」的提示词誊写逻辑是一样。
02 AI绘画提示词原理详解
当然在「图生图」中提示词也很告急,我们可以用上篇文章中学到的,实验形貌一下我们刚刚上传的图片的特征。先简单做个示范
第三步:参数调整
「图生图」的参数和「文生图」参数基本上差不多,但是也有一些「图生图」才有的参数。
例如说「重绘幅度」。我们一般设置在 0.6 ~ 0.8 之间
其他参数的话,不再多啰嗦了。我们上一篇文章里面已经讲过了,还没看过的朋侪,点下面这个链接
[02 AI绘画提示词原理详解]
在这里我们把「采样方法」设置为「DPM++ SDE Karras」
「提示词引导系数」设置为:8
「迭代步数」设置为:20
图片分辨率设置为:500 * 500
全部设置完成后,我们点击生成,这时候我们就利用「图生图」生成了一张新的图片。
这是我们通过「图生图」生成出来的一个最基本的全部过程,但是另有许多改进的空间。
那么另有哪些方面是可以优化的呢?提示词、重绘幅度设置、分辨率设置。
在提示词的环节,我们可以对上传的图片形貌更具体、更精准。
假如没有形貌清楚,那么就有可能导致画出来的图片翻车,由于AI只读取了图片,但是没有对图片中的具体内容。
可以根据我们上一篇文章讲到的提示词来优化我们现在的提示词。这里不再具体说细节了,我们上篇文章已经对提示词做了很清楚的解说。
02 AI绘画提示词原理详解
那么优化之后的样子是什么样的呢?
继续对「重绘幅度」举行优化。在设置的时候也必要自己调试一个安全范围,太高可能会导致画面变形,太低又看不出具体的重绘结果。
那么我们实验后,找到「重绘幅度」的平衡点是多少呢?
末了我们再来优化一下图片的分辨率。
我们最好是跟原图的尺寸一样。什么意思呢?假如你原图是 512 * 512,那说明比例是 1:1 的。那么你输出的图片的比例也应该是 1:1的。
否则我们生成的图片是会严重变形的。我们设置为 800 * 800,也是能和原图的1:1比例对应起来的。
假如你上传的图片分辨率黑白常大的,那么是必要事先将图片裁剪到能被SD画出来的安全范围。
在上面这些参数都举行优化了之后,我们再点击「生成」。
这时候很显着是要比前面第一次生成的结果要好的。
3、随机种子seed的应用
就像我们之前说的,就算你给你原图,但是假如不对提示词举行准确精准的形貌,大概不调试符合的参数的话,AI也不能准确无误的懂得你的意思。
假如我们原图背景本来是室外的,而通过「图生图」生成出来的图片是室内的。
那么我们倒是可以通过增加和修改提示词,来达到我们想要的室内结果。
修改完新的提示词后,我们得到的结果是下面这样,都成了室内的图片。
但是又出现了新的问题,但是人物的姿势怎么改变了,还是AI的「随机性」在作祟。
我们还是想要和之前的人物姿势一样,这怎么办呢?这时候我们就要用到「随机种子」
AI生成一幅作品的过程是随机的,但它的每一次生成都有自己的一套形貌方式,而这个形貌方式会被纪录成一组随机数,也就是随机种子。
不同的随机种子生成出来的图片肯定是不一样的,但是假如你用同一个随机种子来生成图片,那肯定两组图片的相似度黑白常高的,由于都是用同一套随机方法生成出来的。
由于你每生成一张图,就会生成一套随机种子,有的种子结果好,有的种子结果差。你可以把这个随机种子简单理解成AI生成这张图的唯一编号。
在「随机种子」这个选项中,左边的
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
小秦哥
论坛元老
这个人很懒什么都没写!
楼主热帖
Python教程(5)——Python的第一个程序 ...
Kubernetes(k8s)安装以及搭建k8s-Das ...
网易云信实时视频直播在TCP数据传输层 ...
〖Python接口自动化测试实战篇⑤〗- 接 ...
java递归简介说明
liunx速记
海量监控数据处理如何做,看华为云SRE ...
从 Stream 到 Kotlin 再到 SPL
开发一个二方包,优雅地为系统接入ELK ...
那些年用过的机械键盘
标签云
渠道
国产数据库
集成商
AI
运维
CIO
存储
服务器
快速回复
返回顶部
返回列表