物联网天津大学：《2025深度解读DeepSeek：原理与效应》｜44页｜附PPT下载方法

勿忘初心做自己 发表于 2025-3-24 08:29:25

天津大学：《2025深度解读DeepSeek：原理与效应》｜44页｜附PPT下载方法

导读

INTRODUCTION
https://i-blog.csdnimg.cn/img_convert/57dd57415f47c01a27b0843c21c19f4e.png
今天禀享是由天津大学自然语言处理实验室团队带来的：《2025深度解读DeepSeek：原理与效应》，关于DeepSeek大语言模型技能原理与效应的报告文章，主要先容了DeepSeek模型的发展进程、技能创新、效应以及未来预测。详细先容了DeepSeek大语言模型的技能原理与创新，并通太过析其效应，展示了DeepSeek在推动AI技能进步和财产厘革中的重要作用。

天津大学：《2025深度解读DeepSeek：原理与效应》
网盘下载：https://pan.quark.cn/s/4e6d7b5688b0
后续会陆续分享DeepSeek讲座视频，关注我们不迷路哦！
以下是部门内容预览：

https://i-blog.csdnimg.cn/img_convert/92c0aabd3cba9385f142004941acaa55.png
https://i-blog.csdnimg.cn/img_convert/602277daf3fdff0aa28d8d0c411dd33c.png
1.生成式AI与大语言模型发展：

生成式AI使用生成式模型生成各类数据，包罗语言、语音、图片和视频等。
核心技能包罗注意力机制（Attention）、Transformer架构、扩展法则（Scaling Laws）和与人类代价对齐的数据生成（RLHF）。
生成式求解问题（o1/R1）涉及生成复杂问题的答案，举行推理。
https://i-blog.csdnimg.cn/img_convert/72f3b334cd99e4e15a2a94640bd1ceea.png
https://i-blog.csdnimg.cn/img_convert/373aab84897fafd8f65d6acb610ad248.png
https://i-blog.csdnimg.cn/img_convert/2fe274ec0356a78f0bc14894e1813741.png
https://i-blog.csdnimg.cn/img_convert/8ee709419f6ea91f666a4b5dabe731cb.png
https://i-blog.csdnimg.cn/img_convert/c149476f905c0d6cfb1f52efa50da976.png

https://i-blog.csdnimg.cn/img_convert/0035b78aed077cb9349ff1de8a1d999d.png
2.DeepSeek模型架构与技能创新：

DeepSeek V2：接纳希罕MoE模型，包罗DeepSeekMoE和MLA技能。模型总参数量为236B，激活参数量为21B，上下文窗口为128K。
DeepSeek V3：引入基础办法和多令牌猜测（MTP），实现一次猜测多个topken。模型总参数量为671B，激活参数量为37B，训练数据量为14.8T tokens。

https://i-blog.csdnimg.cn/img_convert/415730f6a9e443cc3cd01c93d79d25ea.png
https://i-blog.csdnimg.cn/img_convert/53de2eb3baf7ff0802d6dfbdb4a665df.png
https://i-blog.csdnimg.cn/img_convert/4c94704db25cedf9cf79f4f02f1f9df6.png
https://i-blog.csdnimg.cn/img_convert/d2ad5770e7795241667fe2d7156d8336.png
https://i-blog.csdnimg.cn/img_convert/0b5a87018e0b37efdd53881fd470962c.png
3.DeepSeek效应：

算力代价战：DeepSeek的出现打破了传统技能护城河，引发了算力代价战。
开源与闭源：DeepSeek R1的开源发布是开源大模型历史上的里程碑，打破了美国AI企业的技能封闭。
认知误区：DeepSeek颠覆了美国对中国AI水平的认知，证明大模型研发成本可以大幅降低。
https://i-blog.csdnimg.cn/img_convert/01dbe3d4f6f72f08c20fd1d9a4dc83cf.png
https://i-blog.csdnimg.cn/img_convert/e71b2e552a4ce431adf86f9b684e1246.png
https://i-blog.csdnimg.cn/img_convert/12508683b83aa904bdb08068046c9c6f.png
https://i-blog.csdnimg.cn/img_convert/55a394e04ecf33f3f553f20efdbee8ee.png
4.未来预测：

未来AGI/ASI的实现大概需要3-5个重大突破。
DeepSeek R2预计将很快发布，主要聚焦于数学、代码、逻辑推理等领域。
强调AI推理能力与安全性的联合，提出创新解决方案的需求。
https://i-blog.csdnimg.cn/img_convert/4d10e9eea7da9fdbcdf62b95ea191173.png
https://i-blog.csdnimg.cn/img_convert/7469189098a1de6de83f8dea229e6230.png
https://i-blog.csdnimg.cn/img_convert/e692dd23a33c74c7d1ff98fa2069fa84.png
篇幅有限以上只是部门内容概览
泉源：天津大学

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

页: [1]

IT评测·应用市场-qidao123.com技术社区's Archiver

天津大学：《2025深度解读DeepSeek：原理与效应》｜44页｜附PPT下载方法