伤心客 发表于 2025-4-17 20:07:22

Llama 4 刷榜作弊风波:20 万显卡集群打造的模型竟如此“拉胯”?

Meta 放出了自家用了 20 万显卡集群训练出的 Llama 4 系列模型,其中包罗 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。消息一出,直接引爆了大模型圈。
Meta 还特意强调,这些模型都颠末了大量未标注的文本、图像和视频数据的训练,视觉明白本领已经到了 Next level,有种在大模型领域一骑绝尘的既视感。

https://i-blog.csdnimg.cn/img_convert/9482de43d9d7a19a63681b4d394f3cbf.png
Meta GenAI 负责人 Ahmad Al-Dahle 也表示:“我们的开放体系将产出最好的小型、中型和即将出现的前沿大模型。”并附上了一张 Llama 4 的性能对比测试图。

https://i-blog.csdnimg.cn/img_convert/38f599b497d007bdc2e419636aabb185.png
紧接着,在大模型竞技场中 Llama 4 Maverick 的排名直接跃升到第二名,成为了第 4 个突破 1400 分的大模型。在开放模型排行榜上更是超越了 DeepSeek,直接上桌坐“主座”。
“首次采用 MoE 架构”、“万万 token 上下文”...一时间 Llama 4 就被贴满了各种 Title。

https://i-blog.csdnimg.cn/img_convert/b25b89156a016a538c18d703fa1477cb.png
但在一片赞美和吹捧声中,很快就故意细的网友发现了不对劲。这位网友用头段时间在
页: [1]
查看完整版本: Llama 4 刷榜作弊风波:20 万显卡集群打造的模型竟如此“拉胯”?