百度文心一言4.5大模型评测来啦,有不测,有惊喜
本次主要对文心一言4.5模型进行知识百科的问答测评,总共测评20个题目,答对16个题目测评结论
[*]模型的响应速率很快,几乎是秒级响应,输入内容就直接开始输出对应的答案。
[*]指令的遵循和理解是有待提升的,输出的格式其实没有那么的直接和规整。
[*]针对于百科问答仍然有范围性,有些内容还是回答错误。但整体回答的准确率相比其他模型还是可以的。
[*]个别题目本身可能较难,对于回答错误的题目。换做其他模型也是常错题,对比的模型有kimi、GPT-4o、O3-mini、deepseek V3
想交流AI实战经验、获取一线AI谍报的,
页:
[1]