剖析小米大模型MiMo:解锁语言模型推理潜力

打印 上一主题 下一主题

主题 1941|帖子 1941|积分 5823


一、根本介绍

1.1 项目配景

在大型语言模型快速发展的配景下,小米AI团队推出MiMo系列模型,突破性地在7B参数规模上实现杰出推理本领。传统观点以为32B以上模型才气胜任复杂推理任务,而MiMo通过创新的训练范式证明:经心计划的预训练和强化学习计谋,可使小模型迸发巨大推理潜力。
1.2 模型系列



  • MiMo-7B-Base:专注推理本领的基础模型
  • MiMo-7B-RL-Zero:从基础模型直接举行强化学习的产物
  • MiMo-7B-SFT:颠末监视微调的中心模型
  • MiMo-7B-RL:终极强化学习版本,性能比肩OpenAI o1-mini
1.3 核心上风



  • 推理速度提拔2.29倍(通过MTP技术)
  • 数学推理正确率达95.8%(MATH-500基准)
  • 代码生成通过率57.8%&

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

去皮卡多

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表