论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
qidao123.com技术社区-IT企服评测·应用市场
»
论坛
›
人工智能
›
人工智能
›
Classifier-Free Guidance (CFG) Scale in Stable Diffu ...
Classifier-Free Guidance (CFG) Scale in Stable Diffusion
守听
论坛元老
|
2024-9-17 16:38:39
|
显示全部楼层
|
阅读模式
楼主
主题
2139
|
帖子
2139
|
积分
6417
1.Classifier-Free Guidance Scale in Stable Diffusion
条记泉源:
1.How does Stable Diffusion work?
2.Classifier-Free Diffusion Guidance
3.Guide to Stable Diffusion CFG scale (guidance scale) parameter
1.1 Classifier Guidance Scale
分类器引导是一种将图像标签归并到扩散模子中的方法。您可以使用标签(label)来引导扩散过程。比方,标签“猫”引导反向扩散过程来生成猫的照片
分类器引导标准 (CG Scale) 是控制扩散过程有多大程度遵循标签引导的参数
下面是论文Classifier-Free Diffusion Guidance中的一个例子
假设有 3 组图像(下图中的三个分布代表),标签为“猫”、“狗”和“人”
如果扩散是无引导的(如最左侧)模子抽取的样本有时它可能会抽取恰当两个标签的图像,比方一个男孩在抚摸一只狗
如果扩散是有引导的(如右侧三个)模子抽取的样本可能只会含有一个标签的图像,比方一只狗
在高分类器引导下,扩散模子生成的图像将方向极度或明确的图像。如果你要求模子生成一只猫,它只会返回一张明确是猫的图像,除此之外别无其他
尽管分类器引导取得了破纪录的性能,但它
需要一个额外的模子来提供该引导
,这给训练带来了一些困难,我们需要同时训练两个模子(Unet + Classifier)代价较大
1.2 Classifier-Free Guidance Scale
无分类器引导是实现“没有分类器的分类器引导”的一种方法。他们没有使用类标签和单独的模子举行引导,而是建议
使用图像标题(caption)并训练条件扩散模子
,就像我们在文本到图像中讨论的模子一样。
他们将分类器部分作为噪声猜测器 U-Net 的条件,实现了图像生成中所谓的“无分类器”(即没有单独的图像分类器)引导。也就是文本提示提供了文本到图像的引导。
将Classifier用文本替代后,参加Cross Attention使得文本与图像融合,从而我们只需训练一个模子(Unet)
无分类器引导标准(CFG Scale)是控制扩散过程有多大程度遵循文本引导的参数
当 CFG 比例设置为 0 时,图像生成是无条件的(即忽略提示)
当 CFG 比例设置过高时,文本会引导扩散朝向,图像越贴近给定文本,但这并不意味着该值应始终设置为最大值,因为更多的引导意味着更少的多样性和质量
text (caption) = “panda playing guitar”
CFG=1
CFG=2
CFG=7
CFG=10
CFG=15
CFG=20
留意它在极度情况下的表现:
当CFG设置为1时,文本提示将被忽略。
当CFG设置为最大20时,但图像质量较差。
最具“创意”和“艺术性”的结果通常在 7-12 的引导范围内生成。但使用高达 15 的比例仍然会产生几乎没有伪影的结果。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
守听
论坛元老
这个人很懒什么都没写!
楼主热帖
【网络编程】从零开始搭建一个开源博客 ...
Python学习:import的正确用法
Vulnhub靶机-Al-Web-1
【CSDN云VS腾讯云】要不然怎么说CSDN开 ...
TCP协议
jdbc如何连接sqlserver数据库呢? ...
报错building for iOS Simulator, but ...
面试官:BIO、NIO、AIO是什么,他们有 ...
如何成为一名开发人员——第 3 部分: ...
SpringBoot整合SpringSecurityOauth2实 ...
标签云
渠道
国产数据库
集成商
AI
运维
CIO
存储
服务器
快速回复
返回顶部
返回列表