论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com
»
论坛
›
大数据
›
数据仓库与分析
›
DeepSeek:中国大模型领域的“效率革命者”与开源先锋 ...
DeepSeek:中国大模型领域的“效率革命者”与开源先锋 ...
何小豆儿在此
金牌会员
|
2025-3-11 15:26:32
|
显示全部楼层
|
阅读模式
楼主
主题
978
|
帖子
978
|
积分
2934
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
一、DeepSeek的技术定位与核心突破
DeepSeek(深度求索)是中国量化私募巨头幻方量化旗下的人工智能公司,专注于通用人工智能(AGI)的研发与应用。作为大模型领域的“黑马”,其核心创新在于通过算法优化而非单纯堆砌算力,实现了性能与本钱的均衡突破。其最新发布的推理模型DeepSeek-R1,不仅在复杂任务处理惩罚本领上比肩OpenAI的o1模型,更以开源免费商用的模式引发行业震惊。
技术架构的三大创新
MLA(多头匿伏注意力)架构
:通过压缩键值缓存,显著提升推理效率。相比前代模型,生成速率提升3倍至每秒60 token,同时显存占用降低30%。
DeepSeekMoE(混淆专家系统)
:接纳动态路由机制,在6710亿总参数中仅激活370亿参数,既保持模型容量,又减少计算资
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复
使用道具
举报
0 个回复
正序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
发新帖
回复
何小豆儿在此
金牌会员
这个人很懒什么都没写!
楼主热帖
使用 Mypy 检查 30 万行 Python 代码, ...
K3S系列文章-使用AutoK3s在腾讯云上安 ...
day05-优惠券秒杀01
再次入坑写学习笔记
1.2 Hadoop简介-hadoop-最全最完整的保 ...
mysql8.0.25安装配置教程(windows 64位 ...
3分钟告诉你如何成为一名黑客?|零基础 ...
TechEmpower 21轮Web框架 性能评测 -- ...
JS:函数自调用
主键约束,唯一约束,默认约束,检查约 ...
标签云
AI
运维
CIO
存储
服务器
浏览过的版块
linux
物联网
开源技术
移动端开发
人工智能
快速回复
返回顶部
返回列表