论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com
»
论坛
›
人工智能
›
人工智能
›
Midjourney如何实现多人物一致性(简易版) ...
Midjourney如何实现多人物一致性(简易版)
宝塔山
论坛元老
|
2024-8-14 16:26:51
|
显示全部楼层
|
阅读模式
楼主
主题
1013
|
帖子
1013
|
积分
3039
做AIGC相干范畴训练的一个多月里,接触到了很多AI工具。AI工具高效而聪明,但囿于技术的限定,在使用过程中仍然存在一些问题。
作为ai绘本制作者,使用Midjourney绘图时如何保持人物一致性就是一个困扰我许久的难点。经过反复尝试,或许有一些小办法可以减轻这个问题对作品结果带来的影响。
一、问题点
现在,Midjourney有两个下令可以影响一致性:–sref会影响图片风格一致性,–cref可以影响人物一致性。为演示cref结果,天生图1(下图)
假如要让黄裙女孩煮饭,可以使用cref指令,天生图2(下图)
此处没有设定cw指数,默认为100,会捕获整个角色,因此把图1中举手的动作也捕获进去了。两张图人物一致性还是不错的,脸部、头发、服饰都能相沿下来。
然而在现实操作中,会发现这cref下令的结果只有在画面包罗一个人时有比较好的结果。假如画面中有两个及以上的角色,尤其是角色为同性别时,出图结果就会大打扣头。
比方图3(下图),天生一个老奶奶和一个小女孩的画面。
直接用这张图进行角色迁徙,天生结果令人两眼一黑,即图4(下图)。
从图4我们可以知道,出现两个人物时,MJ不能很好地理解哪个是”老奶奶“,哪个是“小女孩”,从而无法分配两个角色的特性。于是张冠李戴,出现U3的情况。或是将两个人物合二为一,出现U2、U4。只有U1的人物保持了角色一致,但是小女孩体型和老奶奶差不多大,和原图也不一致,无法使用。
二、其他人是怎么做的?
在各个平台上搜索“MJ多人物一致性”,搜出的攻略基本上都是以单个角色作为展示基础,险些没有我想要的答案。
根据同事的先容,很多使用者都是靠PS办理这个问题的。也就是分别天生多个角色,再把这些角色抠出来P在同一张图里。
在CSDN上,博主“AI绘画小33”也提出了自己的方法,即天生一个大致符合要求的图片作为底图,基于底图,用局部重绘功能,将不合适的角色面目面貌替换掉,并且逐步修改细节,最终天生结果图。(可以在CSDN上搜“Midjourney角色一致性如何控制两个人物”找到这篇文章。)
B站上,有博主搬运了一个外网视频。这位外国使用者通过垫图和修改prompt来达到预期结果,并且试验出了MJ人物一致性的技术盲区,比方,在保持两个动物或两个同性别的人的一致性时轻易出错等。
三、我的需求
我对MJ的需求主要是英文绘本制作。首先通过ChatGPT天生英语故事,再将故事改编为一个包罗中英文字幕、画面描述的脚本,最后要求ChatGPT根据画面描述天生MJ指令。
这些故事光怪陆离,无法避免地会出现动物或是同性别人物的场景。而对绘原来说,人物、风格的一致性至关告急。假如按照以上三种方法,我将花费大量时间在调整一致性上,大大影响我的工(摸)作(鱼)效(时)率(间)。
因此我的需求很简朴:步调尽量少,结果尽量好。“步调尽量少”一方面指的是不怎么必要动脑,只要根据一定的流程就能操作,另一方面也指操作步调少,为达到结果而花费的时间少。
“结果尽量好”意味着我并不要求每个细节都完善无缺。在绘本视频中,一张图片最多只展示五六秒,观众并不会在意细节。只要人物们看上去长得差不多即可。对于自媒体创作而言,效率更为告急。
效率和质量难以兼得。假如必要更为精致的图片,第二大点中的三个方法大概会带来更好的结果。
四、我是怎么做的?
要想实现绘本故事的连贯性,画面既要风格一致,人物们的特性也要相似。从这个思绪出发,综合运用sref和cref两个指令,能带来不错的结果。我将通过一个工作中的实例来阐明。
第一步:算清整个故事有多少人物,将它们放在同一张场景下,天生“大合照”,即
图5(下图)
这是关于小女孩和母亲一起去超市购物的故事。故事只出现两个人,即小女孩和妈妈。此处的主要人物特性为:小女孩长发绿裙,妈妈短发白裙,共四个。理想情况下,四个都要达到。
第二步:分别截出小女孩和妈妈的单人照,如图6(下图),假如故事里有画面只需出现小女孩或妈妈个人,则使用对应单人照进行垫图。
第三步:当要获得该母女在厨房的场景时,通过新的prompt+sref+图6,天生同一风格的新图片,此处sw设为100 ,天生图7(下图)。
必要留意的是,这里sref后加的参考图,是小女孩的单人照!假如用了双人照,将产生特性混乱的情况。
此时,新的图片可以很好地表现人物的动作,赋予了图片故事性。同时也继承了原图的风格。如今要做的是把两个人物的特性改正过来。
这四张图中我对U4的动作最满意,因此选择V4,继续进行修改。
第四步:prompt+cref图5+cw 20,如图8(下图)
天生图9(下图)
图9中的人物为小女孩绿裙短发,妈妈白衣短发,即达到了四个特性中的服装部门,保持了母亲的头发特性,同时也比较好地模仿了人物脸部。最后选择U1作为故事配图。
和原图对比一下(左为原图,右为通过该方法天生出的新图)
不敷之处还是有的,小女孩的头发从长发变成了短发(变成了母亲头发同款),母亲的裙子变成了蓝色半裙。但是大部门特性还是得到了保留。对于一个短视频来说,还是够用了。
五、总结
方法:天生“大合照”——截出单人照——新prompt+sref单人照+sw100,此为图A——从图A的四张图中挑选一张,点V1/2/3/4——prompt稳定+cref大合照+cw20,天生最终想要的图
优点:画风一致,人物长相相似,快速且简朴,假如天生不出合适的图,多试几次
缺点:细节不敷,特性只能留下一半。随机性高,不适合对画面要求比较高的使用场景
再次阐明,这个方法依然存在不敷之处。假如您有更好的方法,请通过私信的方式告诉我,我将及时复兴。
写在最后
感兴趣的小伙伴,赠予全套AIGC学习资料,包罗AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。
AIGC技术的未来发展前景广阔,随着人工智能技术的不绝发展,AIGC技术也将不绝进步。未来,AIGC技术将在游戏和盘算范畴得到更广泛的应用,使游戏和盘算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术精密结合,在更多的范畴得到广泛应用,对步伐员来说影响至关告急。未来,AIGC技术将继续得到进步,同时也将与人工智能技术精密结合,在更多的范畴得到广泛应用。
一、AIGC全部方向的学习路线
AIGC全部方向的技术点做的整理,形成各个范畴的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
三、最新AIGC学习笔记
当我学到一定基础,有自己的理解能力的时间,会去阅读一些先辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思绪。
四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有用果的方式,跟着视频中老师的思绪,从基础到深入,还是很轻易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到现实当中去,这时间可以搞点实战案例来学习。
如有侵权,请接洽删除!
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
宝塔山
论坛元老
这个人很懒什么都没写!
楼主热帖
Sqlserver2012卸载
Maxwell 一款简单易上手的实时抓取Mysq ...
分布式事务 | 使用DTM 的Saga 模式 ...
哈工大信息安全概论期末复习 ...
WebLogic JNDI注入(CVE-2021-2109) ...
HTTPS基础原理和配置-3
轻量级CI/CD发布部署环境搭建及使用_03 ...
数字IC-1.9 吃透通信协议中状态机的代 ...
[DuckDB] 多核算子并行的源码解析 ...
.NET服务治理之限流中间件-FireflySoft ...
标签云
AI
运维
CIO
存储
服务器
浏览过的版块
物联网
DevOps与敏捷开发
Mysql
鸿蒙
IOS
快速回复
返回顶部
返回列表