ToB企服应用市场:ToB评测及商务社交产业平台
标题:
为什么DeepSeek出来可以惊动全天下,而豆包、Kimi、文心一言等却没这么大的
[打印本页]
作者:
徐锦洪
时间:
10 小时前
标题:
为什么DeepSeek出来可以惊动全天下,而豆包、Kimi、文心一言等却没这么大的
DeepSeek、豆包、Kimi等虽然都是大模子练习的产物,但是使用的练习模子不一样,导致功能不一样。
DeepSeek使用的是推理模子,其他使用的是普通模子。
这里先分两类,一类是DeepSeek简称DS,一类是其他包罗豆包、Kimi等。
由于两者使用的模子不同导致
焦点目标不一样
:
其他
:文本天生、基础问答、信息检索
DS
: 多步骤逻辑推理、复杂问题解决、因果分析
练习数据不一样
:
其他
:通用语料(网页、书籍、对话等)
DS
:增加逻辑题、数学题、科学推理等结构化数据
练习方法不一样:
其他
:自回归语言建模
DS
:结合头脑链(CoT)、程序辅助、符号逻辑增强
输出特点不一样
其他
:流通但大概缺乏深度逻辑
DS
:结构化、分步骤、注重因果链推导
由于DS的模子开源,我们现在可以将DS部署到当地,并为其提供不同范例的数据来练习,以使其成为我们本身的助手。通过喂不同范例的数据,我们可以观察到不同的练习结果,从而提高DS的可玩性。在接下来的教程中,我将向各人展示如何将DS部署到当地,并为其提供不同范例的数据来练习,以资助我们打造一个个性化的、高效的助手。请期待!
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/)
Powered by Discuz! X3.4