Llama 4 刷榜作弊风波:20 万显卡集群打造的模型竟如此“拉胯”? ...

打印 上一主题 下一主题

主题 1771|帖子 1771|积分 5313

Meta 放出了自家用了 20 万显卡集群训练出的 Llama 4 系列模型,其中包罗 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。消息一出,直接引爆了大模型圈。
Meta 还特意强调,这些模型都颠末了大量未标注的文本、图像和视频数据的训练,视觉明白本领已经到了 Next level,有种在大模型领域一骑绝尘的既视感。


Meta GenAI 负责人 Ahmad Al-Dahle 也表示:“我们的开放体系将产出最好的小型、中型和即将出现的前沿大模型。”并附上了一张 Llama 4 的性能对比测试图。


紧接着,在大模型竞技场中 Llama 4 Maverick 的排名直接跃升到第二名,成为了第 4 个突破 1400 分的大模型。在开放模型排行榜上更是超越了 DeepSeek,直接上桌坐“主座”。
“首次采用 MoE 架构”、“万万 token 上下文”...一时间 Llama 4 就被贴满了各种 Title。


但在一片赞美和吹捧声中,很快就故意细的网友发现了不对劲。这位网友用头段时间在
继续阅读请点击广告

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

伤心客

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表