为什么DeepSeek出来可以惊动全天下,而豆包、Kimi、文心一言等却没这么大的 ...

打印 上一主题 下一主题

主题 840|帖子 840|积分 2520

DeepSeek、豆包、Kimi等虽然都是大模子练习的产物,但是使用的练习模子不一样,导致功能不一样。
DeepSeek使用的是推理模子,其他使用的是普通模子。

这里先分两类,一类是DeepSeek简称DS,一类是其他包罗豆包、Kimi等。
由于两者使用的模子不同导致焦点目标不一样



  • 其他:文本天生、基础问答、信息检索
  • DS: 多步骤逻辑推理、复杂问题解决、因果分析
练习数据不一样


  • 其他:通用语料(网页、书籍、对话等)
  • DS:增加逻辑题、数学题、科学推理等结构化数据
练习方法不一样:



  • 其他:自回归语言建模
  • DS:结合头脑链(CoT)、程序辅助、符号逻辑增强
输出特点不一样



  • 其他:流通但大概缺乏深度逻辑
  • DS:结构化、分步骤、注重因果链推导
由于DS的模子开源,我们现在可以将DS部署到当地,并为其提供不同范例的数据来练习,以使其成为我们本身的助手。通过喂不同范例的数据,我们可以观察到不同的练习结果,从而提高DS的可玩性。在接下来的教程中,我将向各人展示如何将DS部署到当地,并为其提供不同范例的数据来练习,以资助我们打造一个个性化的、高效的助手。请期待!


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

徐锦洪

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表