徐锦洪 发表于 2025-3-4 06:30:52

为什么DeepSeek出来可以惊动全天下,而豆包、Kimi、文心一言等却没这么大的

DeepSeek、豆包、Kimi等虽然都是大模子练习的产物,但是使用的练习模子不一样,导致功能不一样。
DeepSeek使用的是推理模子,其他使用的是普通模子。

这里先分两类,一类是DeepSeek简称DS,一类是其他包罗豆包、Kimi等。
由于两者使用的模子不同导致焦点目标不一样:



[*]其他:文本天生、基础问答、信息检索
[*]DS: 多步骤逻辑推理、复杂问题解决、因果分析
练习数据不一样:


[*]其他:通用语料(网页、书籍、对话等)
[*]DS:增加逻辑题、数学题、科学推理等结构化数据
练习方法不一样:



[*]其他:自回归语言建模
[*]DS:结合头脑链(CoT)、程序辅助、符号逻辑增强
输出特点不一样



[*]其他:流通但大概缺乏深度逻辑
[*]DS:结构化、分步骤、注重因果链推导
由于DS的模子开源,我们现在可以将DS部署到当地,并为其提供不同范例的数据来练习,以使其成为我们本身的助手。通过喂不同范例的数据,我们可以观察到不同的练习结果,从而提高DS的可玩性。在接下来的教程中,我将向各人展示如何将DS部署到当地,并为其提供不同范例的数据来练习,以资助我们打造一个个性化的、高效的助手。请期待!


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 为什么DeepSeek出来可以惊动全天下,而豆包、Kimi、文心一言等却没这么大的