ToB企服应用市场:ToB评测及商务社交产业平台
标题:
每日AIGC最新希望(51):昆仑万维震撼发布16B DiT-MoE图像生成模子、东北大
[打印本页]
作者:
写过一篇
时间:
2024-8-9 19:24
标题:
每日AIGC最新希望(51):昆仑万维震撼发布16B DiT-MoE图像生成模子、东北大
Diffusion Models专栏文章汇总:入门与实战
Scaling Diffusion Transformers to 16 Billion Parameters
本文介绍了DiT-MoE,
一种可扩展的稀疏变分Transformer模子
,它在保持与密集网络竞争力的同时,实现了高度优化的推理。通过
共享专家路由和专家级均衡损失筹划
,DiT-MoE捕获了共同知识并减少了不同路由专家之间的冗余。
DiT-MoE通过将DiT中的部分密集前馈层更换为稀疏MoE层,实现了条件计算。每个图像块的标志被路由到一组专家(即MLP层)。此外,引入了共享专家路由和专家负载均衡损失,以优化专家专业化并减少不同路由专家之间的冗余。
实验效果表明,DiT-MoE在条件图像生成使命中的表现与密集网络相当,但推理时的计算负载更小。通过合成图像数据进一步扩展模子参数至16.5B,DiT-MoE在512×512分辨率下达到了
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/)
Powered by Discuz! X3.4