怎样让Stable Diffusion在差别场景保持人物形象的同等性

[复制链接]
发表于 2026-2-22 21:51:29 | 显示全部楼层 |阅读模式
我们知道Stable Diffusion天生图像的随机性导致很难控制天生同样的人物形象或动作。这种题目会出现在绘本创作,小说配图等场景中,由于在这些场景,人物的衣着妆扮、人物动作、心情都不一样,但是要求始终是同一个人。这个根本要求很紧张,如果你细致看过 幼儿绘本,会发现很多脚色心情大概形象恨不及格,但是小孩子对这种差别性很敏感,很轻易辨别出这种差别,我自己就常常被小朋侪问到,“为什么这一个小人跟前面的谁人不一样”,“为什么这个人的两个眼睛一大一小”,诸如这类题目我只能说计划师画错了。。。

实在人工绘画堕落大概性很大,纵然两个雷同的绘画要保持完全同等也很有难度,但是对于盘算机却很轻易,这篇文章先容怎样让Stable Diffusion在差别场景保持人物形象的同等性,同时还能保持肯定的创造性。

这里重要通过两个场景来先容:


  • 在差别场景的同一人物保持雷同动作大概姿势;
  • 在差别场景的同一人保持差别当作大概姿势。

起首我先创建一个有“意见意义”的人物形象,通过输入
positive prompt:

masterpiece, best quality, 1girl, aqua eyes, black hair, closed mouth, multicolored background, looking at viewer, outdoors, solo, upper body, alluring, clean, beautiful face, pure face, pale skin, sexy pose,((tube top, navel, shorts)),short hair, ((perfect female figure)), mature female, narrow waist, chinese deity, seductive, highly detailed,best quality, masterpiece, highres, original, extremely detailed 8K, wallpaper, illustration, beautifully detailed eyes, cinematic lighting, earrings, jewelry,

negative prompt:

sketches, (worst quality:2), (low quality:2), (normal quality:2), multiple breasts, (mutated hands and fingers:1.5 ), (long body :1.3), (mutation, poorly drawn :1.2) , black-white, bad anatomy, liquid body, liquid tongue, disfigured, malformed, mutated, anatomical nonsense, text font ui, error, malformed hands, long neck, blurred, lowers, lowres, bad anatomy, bad proportions, bad shadow, uncoordinated body, unnatural body, fused breasts, bad breasts, huge breasts, poorly drawn breasts, extra breasts, liquid breasts, heavy breasts, missing breasts, huge haunch, huge thighs, huge calf, bad hands, fused hand, missing hand,

接纳抽签随机抽一个,就这个吧:





现在我要基于这个人物形象,让她在另一个场景中出现,比如给她换个配景,怎么做呢?你大概直接想到的是抠图?抠图很直观,就像我上篇文章【怎样用Stable Diffusion实现类似Photoshop中局部重绘功能】先容的那样,很贫苦,你得先绘制人物的mask,然后重绘非mask地域,这个过程中,你大概绘制的mask地域禁绝确,而且mask地域不可重绘。

但是我现在想给人物形象换套服装,那么这种方式就行不通了,这时间得请出ControlNet 新推出的Reference Only preprocessor,它可以大概基于一张图片作为参考就可以天生对应风格和特定人物的图片,而不须要调用特定训练的LoRa模子。要知道LoRa训练毕竟还是相称贫苦且贵,controlnet的Reference Only大大低落了利用门槛。

上面的照片是在室外,现在把她放到室内,同时更换下服装。假设你已经安装了ControlNet,现在直接将上面的人物形象照片发送到 img2img tab,同时修改下positive prompt:

masterpiece, best quality, 1girl, indoor, (scifi style background), ((in a local bar)),cyberpunker lighting, ((neon lamp)), sci-fi details, insane level of details, hyper realistic, cinematic, composition

Generate 天生4张照片看看:





从结果看,根本人物形象,包罗姿势跟前面保持同等,但是服装和装饰有所区别。这就是该处理处罚器的要告竣的结果:既保持根本形象,同时增长了创造性。这是inpaint 无法做到的,至少没那么轻易做到的。而且它的扩图本领比outpaint还方便!

但是天生的照片连姿势都保持了,这也太无趣了吧,如果我现在想她的姿势显得更“妖娆”一些,怎么办呢?这时间得再请出来ControlNet的另一个重量级的预处理处罚器 OpenPose。它可以大概迁徙人物姿势动作到新的图像上。

通过将这两个神器组合在一起,可以大概实现非常令人满足的新照片,怎么做呢?起首仍然基于上面的提示词,创建一个富有姿势的照片,由于只要姿势,外貌形象就无所谓了,随机抽签就行:





然后在ControlNet中创建两个unit:一个用于上面先容的换装,另一个用于迁徙姿势:





注:由于在天生图像的过程中,姿势渲染要早于形状渲染,上图中的红框Starting Control Step要稍微晚一点儿,调大一些,而姿势渲染的Starting Control Step要稍微早一点儿,调小一些:





好了,再Generate看看结果吧:





人物姿势美满迁徙过来了,但是人脸形象似乎有一点儿差别,这个可以通过下面的参数来控制:





Control Mode:如果须要让prompt起作用,勾选My prompt is more import,否则某些情况,无法更换服装大概配景。
fidelity 轻易保持原图风格的程度,值越大,跟原图越像,但不是越大越好,须要针对差别的图细致实验衡量结果。

好了,以上就是本文先容的怎样在差别场景保持人物形象的同等性。通过Stable Diffusion的reference only可以大概保持任务形象的同等性,同时联合Openpose可以大概实现保持人物形象险些稳固的情况下,丰富人物姿势。值得一体的是以上是基于真实人物大模子,现实上reference only还可以基于其他模子,比如如果换成二次元人物大模子,可以天生原来人物的二次元风格,也就是实现了图像风格迁徙。

比如下面的示例:



Stable Diffusion 最强提示词手册



  • Stable Diffusion先容
  • OpenArt先容
  • 提示词(Prompt) 工程先容
  • .......

第一章、提示词格式



  • 提问引导
  • 示例
  • 单词的次序
  • .......

   有须要的朋侪,可以点击下方卡片免费领取!
  


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!qidao123.com:ToB企服之家,中国第一个企服评测及软件市场,开放入驻,技术点评得现金

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

登录后关闭弹窗

登录参与点评抽奖  加入IT实名职场社区
去登录
快速回复 返回顶部 返回列表