AI实战案例!怎样运用SD完成运营计划海报?玩转Stable Diffusion必知的3大特技

[复制链接]
发表于 2026-2-23 17:32:46 | 显示全部楼层 |阅读模式
各人好我是安琪!
Satble Diffusion 给视觉计划带来了亘古未有的大概性和机遇,它为计划师提供了更多选择和工具的同时,也改变了计划师的脚色和计划流程。然而,计划师与人工智能软件的协作和创新本领仍然是不可或缺的。接下来我将从三个维度来向各人分享 Satble Diffusion 在视觉计划方向的本事应用。
一、线稿/插画秒变3D

1. 线稿秒变 3D 场景
在人工智能绘画软件之前,我们如果想将一张线稿计划图变化为一幅 3D 场景大概必要非常复杂的过程,比如:线稿填色成平面插画,然后根据画面物体的布局在 3d 软件中举行建模,终极根据配色举行打光渲染等步调来完成。而现在我们运用 stable diffusion 以致数秒的时间就可以完成一系列方案。
关于 stable diffusion 的使用原理网络上有许多详细的教程,在这里就不向各人赘述。接下来我将向各人分享怎样运用 SD 将 midjourney 天生的线稿图变化为 3d 场景。

整个的创作过程在文生图模式下举行创作的,大模子选择的是 disneypixarcartoon_v10.safetensors,外挂 VAE 滤镜为 chilloutmix_Niprunedfp32fix.vae.ckpt;最关键的部门 controlnet,前后都选择为 canny-边沿检测大概也可以实行 lineart-标准线稿提取(将线稿图上传此中),根据画面添加正反向详细的形貌关键词,不停的去调解符合的参数,就可以得到我们想要的效果。

如果终极效果图部门视觉没有到达我们的预期,我们可以联合图生图模式下的局部重绘大概上传重绘蒙版功能,运用重绘蒙板联合关键词举行重新绘制,直到达我们的预期效果为止。当认识了整个创作模式后举行批量输出方案时,线稿输出 3d 画面的服从大大超出我们的想象。

2. 平面卡通 IP 秒变 3D 脚色
除了上述的线稿转 3d 场景之外,我们一样平常的平面 IP 卡通人物也可以通过 stable diffuson 秒变 3d 人物,在实现过程上述的案例有所差异,由于我们必要更加精准的按照我们的平面插画举行 3d 人物的制作,固然我们更盼望终极的 3d 形象与我们的平面效果完全符合,因此这里我们不再使用文生图模式,而是接纳图生图模式来举行更精准的控制。
以一张用 midjourney 天生的 ip 卡通平面三视图为例:根据我们卡通人物的特性,添加详细的正反向形貌关键词来构建预期效果,重绘幅度数值设置为 0.5。别的,在模子的使用上照旧有很大区别的,大模子选用了 revanimated_v122.safetensors,滤镜是 animevae.pt。controlnet 接纳 depth-zoe 控制深度;canny 大概 lineart-anime 控制外形线稿的提取;关于 lora 模子选择了 blindbox 给予雷同于盲盒风趣的 3d 效果,别的还使用了 charturnerv2:0.4 这个 lora 模子用来增强模子的塑料质感,终极就形成了如图的 3D 脚色。

二、人物场景的精准控制

在互联网许多应用范畴筛选出符合预期的人物场景图是一个困难,但是自从有了 stable diffusion 之后,这个困难险些迎刃而解。通过 stable diffusion 的图生图模式,共同 controlnet 的精准控制就非常轻易到达我们想要的预期效果。固然在这个过程中,为了克制版权纠纷题目,在使用图生图的底图时只管选取我们拥有版权的图片,如许在这个根本上做衍生就规避了版权的风险。


比如,现在我想要一张(如下图)同样姿势的工作职员不是站在空调旁边,而是想让他站在微波炉旁边的场景,那么我们可以将原图放在图生图模式下,大模子同样选用 relisticv20,滤镜选择 animevae.pt。lora 模子选择 filmvelvia2 雷同于胶片质感来陪衬真实的场景氛围;controlnet 运用的是 openpose_full 用其来控制人物的姿势状态,共同重绘幅度参数的调治以及正反关键词的形貌来到达想要的效果。本案例的正反关键词形貌如下:
正向关键词:A handsome smiling Chinese repairman is standing under the microwave oven, wearing a green T-shirt. There are some white furniture in the scene, dramatic lighting,
一位面带微笑的中国补缀工站在微波炉下,身穿绿色 T 恤。场景中置放了一些白色的家具,引人注目的灯光。
反向关键词:EasyNegative ,GS-DeMasculate-neg,bhands-neg, lowres Unreasonable view (worst quality:2), (low quality:2),
前 3 个英文单词是调用的 embeddings 文件名称,低分辨率的,不公道的视图(最差质量:2),(低质量:2)

别的在真实人物场景的输出过程中,许多时间人物的手部、脸部会出现题目,我们可以通过 SD 的进阶模子 embeddings 在肯定程度上去修复画面手部的题目,比方调治手部的模子 bhands-neg.pt;对于人物脸部扭曲的题目,我们可以运用 face editor 插件,通过调解参数来使人物的心情更加真实自然。

三、SD计划创意字体

Stable diffusion 除了可以创作上述的 3d、真实场景图之外,固然也可以完成创意风格字体的计划。对于创意风格字体我们可以通过文生图的情势,给予 sd 更多的创作空间可以产出多样风格的字体样式,接下来继承和各人分享怎样将白底黑字变化为我们想要的创意风格的创作过程。


以上图冰块笔墨为案例:整个过程是在文生图模式下举行的,在大模子上必要选择是:realisticVision,滤镜选择的是:VAE 模子 vae-ft-mse-840000-ema-pruned.safetensors,如果没有的话可从前去 c 站去下载。采样方法在这个案例中选择了 DPM++ 2M Karras,Controlnet 预处置处罚器运用的是 lineart(标准线稿提取),模子运用的是 lineart。然后在内里导入我们的白底黑字图片,在正反向形貌语里形貌我们想要的效果,颠末多次实行就会碰到意想不到的惊喜。末了为了更好地进步视觉效果细节,我们可以将终极图片导入到图生图模式下(形貌同文生图),Controlnet 预处置处罚器选择 tile_resample,模子选择 control_v11f1e_sd15_tile,颠末二次处置处罚后会发现视觉效果更加惊艳过细。固然在这里紧张是向各人先容制作创意风格字体的一个思绪,详细的参数和模子各人可以根据详细情况去调治。

以下为本案例使用的关键词:
正向关键词:high quality, masterpiece, ((Transparent ice cubes)), glacier background,
高品格,佳构,(( 透明的冰块 )),冰川配景。
反向关键词:EasyNegative, BadArtist, BadPrompt, BadImages, poor anatomical structure, low quality, text errors, extra numbers, fewer numbers, jpeg artifacts, signatures, watermarks, username, blurring, cropped,
前 4 个英文单词是调用的 embeddings 文件名称,解剖布局差,低质量,文本错误,多余的数字,缺少的数字,jpeg 伪影,署名,水印,用户名,暗昧,被裁剪的。
怎样运用Stable Diffusion完成运营计划海报


一、制作前期构思与参考

这次需求是制作一张活动推送图,推送给玩家增长活动热度以及获取更多流量。
需求方盼望画面中紧张表现 IP、信件干系的元素,能给人一种在誊写信件的画面感。按照需求方所给到的信息,我们找了批参考图供给需求方确认画面大抵感觉。

通过参考图与需求方的沟通后,我们大抵确认画面是一张信纸在桌面上,信纸上写着本次活动的干系内容。
二、确定风格&AI 运用

视觉风格上,通过讨论以及参考图的视觉效果,终极照旧决定倾向于三维质感,不外这次我们操持实行运用 AI 辅助制作团体的画面基调。
由于之前做过一版雷同的推送图,以是本次就相当于做一次画面迭代,而用 AI 来举行画面的迭代也恰恰黑白常符合的。

话不多说,我们先辈入到 Stable diffusion。起首,我们进入到图生图界面,将垫图素材拖入图生图的图片地区。输入好关键词并调治好参数开始炼图。

关键词如下:The center of the image is a piece of paper on the table, The image is a close-up shot, showing the details of the paper, The image is taken from a bird’s-eye view angle, Close-up view, indoors, the scene is bright, The overall picture is bright, The picture is a 3D modeling, C4D, Octane renderer, masterpiece, best quality, highres, original, reflection, unreal engine rendered, body shadow, extremely detailed CG unity 8k wallpaper, minimalist
(在这里我们使用了 toon2 和 COOLKIDS 这两个 lora 模子。模子不唯一,可根据本身需求在 C 站上自行选择下载。)
反向关键词:(worst quality:2), (low quality:2), (normal quality:2), lowres, ((monochrome)), ((greyscale))
反向关键词就使用一些通用的即可。
参数内容如下:

此中要留意下,在一开始炼图时,重绘幅度必要大概控制在 0.5-0.7 范围内,克制厘革过大粉碎构图,也要克制厘革过小达不到画面迭代的效果。
接着就可以开始炼图了,这个环节对比 Midjourney 来说,可以克制耗费过多时间炼图,Stable Diffusion 的可控制参数比力多,也因此可以更快的炼出靠近本身想要的图片。

以上是筛选出的几张图,接着再选出一张图作为本次需求的底图,并开始举行下一环节的利用。
三、SD 放大&重绘功能的使用

我们选择用第二张图作为底图,但是放大后不难发现,它的分辨率低,不清晰。有许多细节也存在缺失的题目。这个时间我们可以对他举行 SD 放大利用。

1. SD Upscale 先容
SD Upscale 也被叫为 SD 放大,简单明白可以把它看作是图生图中的高清修复。它的工作原理是将要放大的图片匀称的分成多块,分别举行重新绘制,并终极拼回一张图,以此来举行高清放大的效果,于此同时还能为画面添加不少细节。
我们可以在图生图界面中滑至最下方,点击脚本这一栏睁开,内里有一个使用 SD 放大(SD Upscale),点击选择即可开启。(留意,只有图生图才气使用该脚本)

2. SD Upscale 的使用
起首,我们将底图拖入图生图的图片地区,然后打开 SD 放大,此中放大倍数以及图块重叠像素可以不做厘革,放大算法可以选择 R-ESRGAN 4X+ 大概 R-ESRGAN 4x+ Anime6B(这个方向二次元一些)。别的也可以实行,这两个放大算法是我们比力常用的。

接着我们在画面尺寸这里,宽度高度分别在原来的根本上加上图块重叠的像素数值,也就是分别加 64。对应着现在的宽度为 902,高度为 512,加上 64 后宽度就变为 966,高度变为 576。

大概许多人迷惑为什么要加上这 64 像素呢,这里简单表明下。由于 SD 放大的原理是将一张图分成匀称的多块重新渲染,然后再重新将这几块图片拼回一张图。而为了使拼接部门不会出现断层,割裂等反面谐的感觉,在这四块图片的贴合处增长了一部门地区,算法会使用这部门地区行止置处罚拼接处,使得拼接位置过分的更加自然,团体。
回到正题,设置好后,将重绘幅度调低至 0.3-0.35(由于只是用于高清修复,并不想画面内容发生厘革,以是此时要保持低重绘幅度),设置好后就可以开始天生图片了。

以上是高清修复后的图,可看到画面的清晰度肉眼可看法进步了,画面的细节也丰富了不少。但是也存在着一个题目,画面有许多希奇的物体,以及一些 bug 存在,这时间就可以开始用到 Stable Diffusion 的重绘功能了。
3. 重绘功能的使用
起首,我们想去掉纸上的内容,而且把桌子上一些紊乱的东西都去掉,我们可以选择把图片导入 ps 里举行简单的 p 图处置处罚,然后再导回 Stable Diffusion 中的图生图,将重绘幅度调低再天生一次即可。(一样平常重新用图生图输出的图片分辨率都会变低,必要重新用 Stable Diffusion 放大高清修复一下,然后再在此根本上举行重绘)

紧接着我们开始对画面个别元素举行调解。起首,我们想把右上角的黄色卡纸换成信封,这时间我们就可以运用涂鸦重绘功能。点击涂鸦重绘,进入涂鸦重绘版面。

由于我们想把卡纸换成黄色的信封,点击右上角的色盘 icon,选择黄色,调解画笔巨细,在卡纸的位置涂上一层,表现这里要换成一封信(留意涂鸦的造型只管和想天生的物体的造型靠近,如许有利于算法辨认)。然后在关键词后加上一个黄色的信封,并给上一些权重。(a yellow envelope:1.3)


点击天生后,多天生反复图,挑选较为满意的一张后,先不发急细化修改,继承把画面别的想要更换的物品调解好。更换的方式也可以像信封一样,使用涂鸦重绘即可。

不外像重叠的册本,大概玩具这类,造型表面不规则的,AI 在盘算过程大概不能很好地辨认。这个时间我们也可以直接使用局部重绘功能,在要重新绘制的地区涂上一层蒙版,然后在关键词后增补上想要更换的内容。比方一叠册本,就在关键词后增补上(A stack of books:1.4),记得加一点权重。


通过这种方式,我们可以把画面里想要更换的元素都更换掉,而且风格也能保持划一,实现“指哪打哪”。(固然,这也克制不了必要多次炼图,只管 Stable Diffusion 可控性好,但 AI 始终是 AI,想要直接渲出本身想要的图片照旧很难的。)

到末了,我想在桌面上加一支笔和一个闹钟,但是在涂鸦重绘过程中,始终渲不出我想要的效果。这个时间我们可以找一个笔和闹钟的 png 素材在 ps 里简单处置处罚下放在画面中,然后再把它放回到 Stable Diffusion 的图生图中,调解好低重绘幅度然后重新天生,末了筛选出较为满意的举行后期细化即可。

到了末了阶段,我们就可以回到 ps 里去增长一些画面的细节和内容了。

末了的末了,给画面加一些后期氛围处置处罚后得到终极版本

总结

在这个案例中我们也没有使用较为新颖的功能,紧张就是 Stable Diffusion 放大和重绘功能,这两功能在 Stable Diffusion 也算是比力根本的。学习新的技能固然紧张,但去探索怎样运用这些技能去实现项目落地的方法思绪更为关键。
三步搞定场景定制化


随着人工智能的徐徐发展,越来越多的 AI 工具也一窝蜂的涌现出来。
在浩繁的 AI 利器当中 Midjourney(简称 MJ)和 Stable diffusion(简称 SD)两款软件在图片的效果出现上表现尤为突出,固然 MJ 可以大概通过形貌关键词来对图像举行调解,但总以为跟脑海里假想的那张图还差一点意思,不能完全的符合内心预期。
迫于这个缘故原由我们将履历投入到 SD 的学习当中,在学习的过程中发现 SD 的利用界面临计划师来说比力友爱,利用界面更雷同于一款软件的利用界面,感觉是在学习一门技能(大概是总用绘图软件做图留下的后遗症)。
在实际利用 SD 这款软件时有两点是强于 MJ 的:1.它可以精准控制画面的构图及布局。2.它也可以定制画面的输出风格。在工作上能将所假想的草图通过 control net 插件举行百分之百的还原,可以说大大的进步了出图质量及数目。
本次分享将联合平常工作中,应用到 SD 软件举行出图的实操履历,通过对 SD 的运用输出行业场景图来给各人做一些树模。在一样平常的工作中,为了包管视觉构图尚有画面风格的划一性,故意去搭建了属于赶集行业特性的运营场景素材库,目的是为了让计划师能机动调用,随做随取,节流时间进步服从。

在开始实操之前,先来说下 SD 的工作流程:1.前期必要在脑筋里构想一个场景图,并借用绘图软件勾勒出大概的草图表面线。2.通过 SEG 图表找到对应材质的色值(SEG 色表各人可以网上搜刮自行下载),实现对画面中摆放物体的材质举行精准调治。3.将文生图得到的图片转到图生图中借助 control net 插件中 tile_resample 模子对图片里的细节举行处置处罚于此同时使用脚本中的 UItemate SD upscale 模子将已得到的图片举行人为放大(如许做是为了在图生图的放大过程中同时修补画面细节)

一、线稿天生图

好的废话不多说,咱们开始演示:
第一步输入正向关键词:CBD 办公场景,宽敞豁亮,有格调,高清拍照,广告级修图,8K 高清,CBD office scene,Bright and spacious,There is style,HD photography,Ad-level retouching,8K HD,
反向关键词:
NSFW,nude,naked,porn,(worst quality, low quality:1.4),deformed iris,deformed pupils,(deformed,distorteddisfigured:1.3)cropped,out of frame,
poorlydrawn,badanatomy,wronganatomy,extralimb,missinglimb,floatinglimbs,cdonedface(mutatedhandsandfingers:1.4),
disconnectedlimbs,extralegs,fusedfingers,toomanyfingers,longneck,mutation,mutated,ugly,
disgusting.amputation,blurry,jpegartifacts,watermark,watermarked,text,Signature,sketch,
输入关键词的同时将脑筋里的想法通过绘图软件绘制成线稿图(这个线稿的布局及外形决定了出图的布局及布局),将绘制好的草图上传至 control net 插件里选择 scribble 模子(实际利用界面如下)。


天生效果如下:







二、SEG色值天生

第二步:根据画面必要对场景内的物体举行材质更换(这一步必要共同关键词即画面中出现的材质必要在关键词中也对应提及,关键词的紧张程度要用()夸大,同样也借助 control net 插件里选择 seg 模子,共同第一步的利用双开 control net 模子,SEG 权重的巨细数值,决定终极出现的效果。


天生效果如下:






三、放大图片调解细节

第三步:选择一张本身心仪的图片然后转到图生图模式,将图片联合 control net 插件中的 tile_resample 举行细节丰富,同时使用脚本中的 UItemate SD upscale 模子将其放大至本身想要的图片巨细。


好啦,现在你已经得到了一张定制化的场景图片了,是不是照旧蛮精准的,按照我们上述的利用路径,我们分别对餐饮场景、贩卖办公场景、美容美发场景举行了批量天生,效果图片如下。
天生餐饮场景效果如下:

天生美业场景效果如下:

天生贩卖场景效果如下:

总结:AI 自我的学习本领非常强盛,每一刻都在迭代,大概身处这个期间的我们能做的就是不停的拥抱厘革,学习怎样去驾御 AI,学会用 AI 为工作提效,盼望能从不停的学习探索中找到新突破。
感爱好的小同伴,赠予全套AIGC学习资料,包罗AI绘画、AI人工智能等前沿科技教程和软件工具,详细看这里。

资料软件免费放送
越日同一发放请耐烦等候
关于AI绘画技能储备

学好 AI绘画 岂论是就业照旧做副业赢利都不错,但要学会 AI绘画 照旧要有一个学习规划。末了各人分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小同伴们一点资助!
必要的可以扫描下方CSDN官方认证二维码免费领取【包管100%免费】

**一、AIGC全部方向的学习门路**
AIGC全部方向的技能点做的整理,形成各个范畴的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,包管本身学得较为全面。


二、AIGC必备工具
工具都帮各人整理好了,安装就可直接上手!

三、最新AIGC学习条记
当我学到肯定根本,有本身的明白本领的时间,会去阅读一些先辈整理的册本大概手写的条记资料,这些条记详细纪录了他们对一些技能点的明白,这些明白是比力独到,可以学到不一样的思绪。


四、AIGC视频教程合集
观看全面零根本学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思绪,从根本到深入,照旧很轻易入门的。

五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才气将本身的所学运用到实际当中去,这时间可以搞点实战案例来学习。

这份完备版的学习资料已经上传CSDN,朋侪们如果必要可以微信扫描下方CSDN官方认证二维码免费领取【包管100%免费】


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!qidao123.com:ToB企服之家,中国第一个企服评测及软件市场,开放入驻,技术点评得现金

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

登录后关闭弹窗

登录参与点评抽奖  加入IT实名职场社区
去登录
快速回复 返回顶部 返回列表