Stable Diffusion文生图焦点参数及采样器图文详解

[复制链接]
发表于 2025-7-8 01:50:42 | 显示全部楼层 |阅读模式
在运用Stable Diffusion进行图像生成时,参数配置与采样器选择直接影响终极输出效果。本文将体系解析CFG Scale、Steps、Seed等关键参数的作用机制,并对比差别采样器的适用场景。
PS:后续全部演示图片及提示词及参数如下(参数来自阿里云DSW),必要注意的是公众号上传图片有巨细限定,所以演示图均为压缩后的效果,假如看着不是很清晰可以自行在当地尝试检察。






  1. ((masterpiece,best quality)),1girl, solo, animal ears, rabbit, barefoot, knees up, dress, sitting, rabbit ears, short sleeves, looking at viewer, grass, short hair, smile, white hair, puffy sleeves, outdoors, puffy short sleeves, bangs, on ground, full body, animal, white dress, sunlight, brown eyes, dappled sunlight, day, depth of field  Negative prompt: EasyNegative, extra fingers,fewer fingers  Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 10, Seed: 2337269170, Size: 512x832, Model hash: 71e703a0fc, Model: Counterfeit-V2.5_fp16, VAE hash: f921fb3f29, VAE: Counterfeit-V2.5.vae.pt, Denoising strength: 0.5, Clip skip: 2, Hires upscale: 1.8, Hires upscaler: Latent, TI hashes: "EasyNegative: c74b4e810b03", Version: v1.6.0提示词翻译:((杰作,最好的质量)),女孩,独奏,动物耳朵,兔子,赤脚,膝盖向上,衣服,坐着,兔子耳朵,短袖,看着观众,草,短发,微笑,白发,蓬松的袖子,户外,蓬松的短袖,刘海,在地上,全身,动物,白色衣服,阳光,棕色眼睛,斑纹的阳光,天,景深
复制代码
🍹 CFG Scale
这个参数是用来控制生成内容与提示词的契合程度,讲人话就是控制AI的听话指数,数值过小的时候AI就会随意发挥,大概出现你形貌的是一个美女,而AI终极给你生成出来的是一张长满触手的克苏鲁章鱼怪。而当你设置过大的数值时,AI工具会严酷按你的要求来进行绘画,如许会扼杀AI的创意,大概产生机械感较强的图像。这个数值范围发起在7-10之间较为均衡。通俗明白来说就是

  • 7以下:AI工具任意浪,越小越浪
  • 黄金区间7-10:就像让AI戴着镣铐跳舞,既有规矩又有创意
  • 10+:开始进入“军训”模式,越大教官管得越严
以下是别的参数与提示词完全不变的环境下,仅改变CFG Scale带来的变化,很容易可以看出来,值越低的环境下越抽象,而越高的参数就越靠近提示词。

🔧 Steps
这个参数的作用是控制去噪过程的精致度,每一次迭代,是指依据文本输入生成随机噪声并由此构建图像的过程。随着步调推进,每一阶段都在逐步减少图像中的噪声身分。步数过少的环境下大概会导致生成图片的质量不佳,且存在过多的噪点,而步数过多则会使图像生成过程变得漫长,当超出一定限度后,步数的提升未必能带来质量的提升或视觉清晰度改善,甚至在凌驾某个阈值后多余的步数大概会导致收益递减,甚至降低图像的团体质量。这里一样平常发起设置为25-35之间即可。通俗来说就是下面如许

  • 前10步:铅笔打稿(确定构图和主体)
  • 10-20步:炭笔描边(勾勒细节外貌)
  • 20-30步:水彩上色(渲染光影质感)
  • 30步后:美图秀秀(精修但大概用力过猛)
以下是别的参数与提示词完全不变的环境下,差别的迭代步数产出的图片变化,可以看到,从第20步开始后面都是在提升画面细节与质感,而35-50步并没有多大的提升

🎲 Seed
种子值决定生成过程的初始状态。-1表示完全随机模式,固定种子值可复现相似构图。需特殊注意:纵然使用相同种子值,差别硬件设备或软件版本仍大概产生差异。一样平常来说我们生成图片的时候不大概一次就出现本身想要的效果,所以必要使用随机种子来抽取盲盒,而抽到了心动盲盒,我们记载这个盲盒的种子值,就可以对效果进行复现了。发起保留满足种子值,并通过微调提示词实现大抵可控的创作迭代。
下面我们使用随机抽卡生成图片,这里我们一次抽8张看看效果,可以看到由于使用随机种子,生成出来的图片都各有差异。

这里比如说我们更喜欢倒数第二张,那么我们可以在图像输出区域选中该图片,底部会有该图片生成的全部信息,由于参数是一样的,所以我们复制内里的种子号即可复现这张图片了。

复制这个种子值2162729670到种子输入框中,再生成图片,可以看到,通过固定种子是可以复现构图的。

🍔 Batch双胞胎
在有一次生成多张图片的需求的时候,会用到Batch Count与Batch Size两个参数,Batch Count是指同一提示词和参数设置下实行生成操作的次数,每次都相称于独立的任务,不会影响显存的占用;而Batch Size是指单次生成任务中同时输出的图片数量,同时输出就意味着显存的占用会更大,这两个参数决定了终极输出图片的数量。
两个参数怎样设置取决于显存的巨细,假如显存较小的机器想一次生成多张图片,发起加大生成批次,每一次只生成一张图片,如许可以有用的防止爆显存。
而显存较大的机器可以均衡生成批次与批次数量加快出图速度。
必要注意的是,假如生成批次为1,批次数量为5,假如在生成过程中报错,则本次生成的效果会全部消散; 而假如生成批次为5,批次数量为1,报错时会保留前几个批次的生成效果,这个大家可以本身尝试一下。

🎨 采样器
个人比较常用的有Euler a和DPM++ 2M Karras,其中Euler a用于快速出图,随机性强,得当二次元风格,DPM++ 2M Karras效果比较精致,速度也较快,得当用于通用创作和写实人像。这里使用Euler a、DPM++2M Karras与DPM++2M SDE Karras采样器作个简单的对比供大家参考,假如微信没有压缩图片质量,那应该能很明显的看到DMP系列的采样器细节更多。

由于采样器众多,篇幅限定没办法一一讲解,必要根据具体的需求去选择,这里在文末给大家一个常用采样器介绍表格图片,包含各个采样器的优点、缺点以及使用场景供大家进行参考。
这里直接将该软件分享出来给大家吧~
1.stable diffusion安装包

随着技能的迭代,现在 Stable Diffusion 已经能够生成非常艺术化的图片了,完全有赶超人类的架势,已经有不少工作被这类服务替换,比如制作一个 logo 图片,画一张虚拟老婆照片,画质堪比相机。
最新 Stable Diffusion 除了有win多个版本,就算说底端的显卡也能玩了哦!别的还带来了Mac版本仅支持macOS 12.3或更高版本

2.stable diffusion视频合集

我们在学习的时候,往往册本源码难以明白,阅读困难,这时候视频教程教程是就很得当了,生动形象加上案例实战,一步步带你入坑stable diffusion,科学有趣才能更方便的学习下去。

3.stable diffusion模子下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果,这时则必要通过使用大量训练数据,调整模子的超参数(如学习率、训练轮数、模子巨细等),可以使得模子更好地适应数据集,并生成更加真实、准确、高质量的图像。

4.stable diffusion提示词

提示词是构建由文本到图像模子表明和明白的单词的过程。可以把它明白为你告诉 AI 模子要画什么而必要说的语言,整个SD学习过程中都离不开这本提示词手册。

5.SD从0到落地实战演练


假如你能在15天内完成全部的任务,那你堪称天才。然而,假如你能完成 60-70% 的内容,你就已经开始具备成为一名SD大神的正确特征了。
这份完备版的stable diffusion资料我已经打包好,必要的点击下方插件,即可前去免费领取!


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
继续阅读请点击广告

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

×
登录参与点评抽奖,加入IT实名职场社区
去登录
快速回复 返回顶部 返回列表