百度文心一言4.5大模型评测来啦,有不测,有惊喜

打印 上一主题 下一主题

主题 1602|帖子 1602|积分 4806

本次主要对文心一言4.5模型进行知识百科的问答测评,总共测评20个题目,答对16个题目
测评结论



  • 模型的响应速率很快,几乎是秒级响应,输入内容就直接开始输出对应的答案。
  • 指令的遵循和理解是有待提升的,输出的格式其实没有那么的直接和规整。
  • 针对于百科问答仍然有范围性,有些内容还是回答错误。但整体回答的准确率相比其他模型还是可以的。
  • 个别题目本身可能较难,对于回答错误的题目。换做其他模型也是常错题,对比的模型有kimi、GPT-4o、O3-mini、deepseek V3
想交流AI实战经验、获取一线AI谍报的,
继续阅读请点击广告

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

九天猎人

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表