论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com
»
论坛
›
人工智能
›
人工智能
›
《VQ-VAE》:Stable Diffusion计划的架构源泉
《VQ-VAE》:Stable Diffusion计划的架构源泉
渣渣兔
金牌会员
|
2025-2-19 08:04:42
|
显示全部楼层
|
阅读模式
楼主
主题
949
|
帖子
949
|
积分
2847
文章目次
阅读本文你可以相识到
1 VQ-VAE的核心头脑
1.1 为什么VQ-VAE想要把图像编码成离散向量?
1.2 VQ-VAE引入codebook(即embedding space嵌入空间)
1.3 VQ-VAE的工作过程
2 VQ-VAE实现方法
2.1 VQ-VAE的编码器怎么输出离散向量。
2.2 VQ-VAE怎么优化编码器息争码器
2.3 VQ-VAE怎么优化嵌入空间
3 总结评价
参考资料
阅读本文你可以相识到
VQ-VAE的核心头脑
VQ-VAE中关键算法的具体形式
VQ-VAE的贡献及其对其他工作的影响
通过阅读这篇文章,你不仅能明白VQ-VAE自己的原理,更能知道如何将VQ-VAE中的核心机制活学活用。
1 VQ-VAE的核心头脑
1.1 为什么VQ-VAE想要把图像编码成离散向量?
最早的自编码器(Autoencoder, AE),AE是一类可以或许把图片压缩成较短的向量的神经网络模型,其结构如下图所示。AE包含一个编码器
和一个解码器
。在训练时,输入图像
会被编码成一个较短的向量
,再被解码回另一幅长得差不多的图像
。网络的学习目标是让重修出来的图像
和原图像
尽可能相似。
解码器可以把一个向量解码成图片。换一个角度看,解码器就是一个图像生成模型,因为它可以根据向量来生成图片。那么,AE可不可以用来做图像生成呢?很可惜,AE的编码器编码出来的向量空间是不规整的。
也就是说,解码器只认识经编码器编出来的向量,而不认识其他的向量。假如你把自己随机生成出来的向量输入给解码器,解码器是生成不出有意义的图片的
。AE不可以或许随机生成图片,所以它不能很好地完成图像生成任务,只能起到把图像压缩的作用。AE离图像生成只差一步了。只要AE的编码空间比力规整,符合某个简单的数学分布(比如最常见的尺度正态分布),那我们就可以从这个分布里随机采样向量,再让解码器根据这个向量来完成随机图片生成了。VAE就是如许一种改进版的AE。它用一些奇妙的方法约束了编码向量
,使得
满
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
渣渣兔
金牌会员
这个人很懒什么都没写!
楼主热帖
事务的ACID特性
SqlServer2012升级到SqlServer2016
DCM: 中间件家族迎来新成员
深度干货!一篇Paper带您读懂HTAP | St ...
iOS事件传递链与响应链
(内附源码)Node.js小试——使用Node ...
SaaS软件工程师成长路径
arthas使用介绍
go-zero单体服务使用泛型简化注册Handl ...
.NET for Apache Spark 入门演练
标签云
运维
CIO
存储
服务器
浏览过的版块
物联网
快速回复
返回顶部
返回列表