老黄一举揭秘三代GPU!冲破摩尔定律,打造AI帝国,量产Blackwell解决ChatGP ...

打印 上一主题 下一主题

主题 968|帖子 968|积分 2904

近日,老黄手持Blackwell向全世界展示的那一刻,全场观众沸腾了。




这是迄今为止世界上最大的芯片!

用老黄的话来说,它是「全世界迄今为止制造出来的最复杂、性能最高的计算机。


GPT-4o深夜发布!Plus免费可用!
https://www.zhihu.com/pin/1773645611381747712

没体验过OpenAI最新版GPT-4o?快戳最详细升级教程,几分钟搞定:

升级ChatGPT-4o Turbo步骤
https://www.zhihu.com/pin/1768399982598909952

英伟达产品的迭代速率,已经彻底无视摩尔定律。




一手硬件,一手CUDA,老黄胸有成竹地穿过「计算通货膨胀」,豪言推测——在不久的将来,每一个处置处罚麋集型应用都将被加快,每一个数据中心也肯定会被加快。




到目前为止,计算机行业已有60多年的历史,而现在,一个全新的计算时代已然开始。

1964年,IBM的System 360首次引入了CPU,通用计算通过操纵体系将硬件和软件分离。

架构兼容性、向后兼容性等,所有我们今天所相识的技术,都是从这个时间点开始的。

直到1995年,PC革命开启让计算走进千家万户,更加民主化。


2007年,iPhone推出直接把「电脑」装进了口袋,并实现了云端链接。

可以看出,已往60年里,我们见证了2-3个推动计算行业转变的紧张技术节点。

而现在,我们将再一次见证历史。

老黄表现,「有两个最基础的事变正在发生」。

首先是处置处罚器,性能扩展已经大大放缓,而我们所需的计算量、必要处置处罚的数据都在呈指数级增长。 按老黄的话来说,我们端庄历着「计算通货膨胀」。

已往的20年里,英伟达一直在研究加快计算。比如,CUDA的出现加快了CPU负载。事实上,专用的GPU结果会更好。




当我们运行一个应用步调时,不希望它必要100秒乃至100小时才气完成。

因此,英伟达首创了异构计算,让CPU和GPU并行运行,将已往必要100个时间单元的使命,加快到仅需1个时间单元。

这实现了100倍的速率提升,而功耗仅增加3倍,本钱仅为原来的1.5倍。





除了GPU,英伟达还做了业界难以企及的事,那就是重写软件,以加快硬件的运行。

如下图所示,从深度学习的cuDNN、物理模拟的Modulus、通讯的Aerial RAN、基因序列的Parabricks,到量子计算模拟的cuQUANTUM、数据处置处罚的cuDF等领域,都有专用的CUDA软件。




也就是说,没有CUDA,就等同于计算机图形处置处罚没有OpenGL,数据处置处罚没有SQL。

而现在,接纳CUDA的生态遍布全球。




就在上周,谷歌公布将cuDF加入谷歌云,并加快世界上最受欢迎的数据科学库Pandas。

现在,只需点击一下,就可以在CoLab中使用Pandas。数据处置处罚速率快得令人难以置信。
 


推荐阅读:


怎样免费使用GPT-4o?怎样升级GPT...

LSTM卷土重来之Vision-LSTM横空出世!!




新架构Mamba-2正式发布!!真实版“man, what can i say”!!


黎曼意料取得重大进展!!


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

美丽的神话

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表