车辆重辨认(2021NIPS在图像合成方面,扩散模子打败了gans网络)论文阅读2024/10/01

[复制链接]
发表于 2026-1-14 10:32:22 | 显示全部楼层 |阅读模式
本文在架构方面的创新:
①增长留意头数量:
利用32⇥32、16⇥16和8⇥8分辨率的留意力,而不是只利用16⇥16
②利用BigGAN残差块
利用Big GAN残差块对激活举行上采样和下采样
③自顺应组归一化层
将颠末组归一化操纵后的时间步和类嵌入到每个残差块
1,那么是怎样对天生过程举行引导的?

2,那么详细来说,怎样根据当前时间xt的梯度,来调解xt?




在本文中先容了两种算法用于分类器引导:

向分类器中输入xt,发现与真实种别匹配概率小,盘算对xt的梯度,让xt以肯定的包罗梯度的步幅举行移动,使得匹配概率增长。着实这里有点像之前卷积神经网络中参数w更新的原理,w也是在梯度方向上移动,以此来使得loss值最小。但是这两种算法不是简朴的对xt举行处置惩罚,①是对推测的均值μ举行处置惩罚,让均值μ在梯度方向上移动。②是对推测的噪声举行处置惩罚,让噪声在梯度方向上移动。别的,s可以叫做学习率,重要是控制在梯度方向上移动的步幅,和之前卷积神经网络中的w更新公式中的学习率差不多。
BigGAN残差块是什么意思?





留意力池是什么?




免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!qidao123.com:ToB企服之家,中国第一个企服评测及软件市场,开放入驻,技术点评得现金

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

登录后关闭弹窗

登录参与点评抽奖  加入IT实名职场社区
去登录
快速回复 返回顶部 返回列表