为什么DeepSeek出来可以惊动全天下，而豆包、Kimi、文心一言等却没这么大的 ...

徐锦洪 · 2025-3-4 06:30:52

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？立即注册

x

DeepSeek、豆包、Kimi等虽然都是大模子练习的产物，但是使用的练习模子不一样，导致功能不一样。
DeepSeek使用的是推理模子，其他使用的是普通模子。

这里先分两类，一类是DeepSeek简称DS，一类是其他包罗豆包、Kimi等。
由于两者使用的模子不同导致焦点目标不一样：

其他：文本天生、基础问答、信息检索
DS: 多步骤逻辑推理、复杂问题解决、因果分析

练习数据不一样：

其他：通用语料（网页、书籍、对话等）
DS：增加逻辑题、数学题、科学推理等结构化数据

练习方法不一样：

其他：自回归语言建模
DS：结合头脑链（CoT）、程序辅助、符号逻辑增强

输出特点不一样

其他：流通但大概缺乏深度逻辑
DS：结构化、分步骤、注重因果链推导

由于DS的模子开源，我们现在可以将DS部署到当地，并为其提供不同范例的数据来练习，以使其成为我们本身的助手。通过喂不同范例的数据，我们可以观察到不同的练习结果，从而提高DS的可玩性。在接下来的教程中，我将向各人展示如何将DS部署到当地，并为其提供不同范例的数据来练习，以资助我们打造一个个性化的、高效的助手。请期待！

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

为什么DeepSeek出来可以惊动全天下，而豆包、Kimi、文心一言等却没这么大的 ...

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

0 个回复

快速回复

楼主热帖

标签云

浏览过的版块