快速认识DPU

打印 上一主题 下一主题

主题 1023|帖子 1023|积分 3069

DPU(Data Processing Unit)是以数据为中心构造的专用处理器。那么为什么需要DPU?DPU主要负担什么功能?它带来什么影响?我们可以通过四个关键字快速认识DPU:数据中心数据卸载重构
数据中心

数据中心由大量的服务器构成。计算、存储、网络数据传输是数据中心的三大焦点功能。

CPU之上运行操纵系统假造机管理器Kubernetes等基础软件。在此之上业务应用部分通过假造机容器进行部署,实现资源共享、弹性伸缩、多租户、微服务、SaaS等。底层由GPUFPGA提供硬件加速,全部的加速资源网络资源存储资源由CPU同一协调调用。此时CPU不但仅是控制的中心,也是数据活动的中心。
数据


以CPU为中心的数据中心面临多方面的挑战:


  • 构建于假造化和容器基础上的业务系同一方面带来了极大的便利,另一方面由于假造化的开销越来越大。
  • 基础办法和业务处于同一个计算平台,基础办法的性能突发会干扰业务的性能稳定度;
  • 另有一个标题就是安全访问,宿主机侧管理具有业务虚机等的全部权限,运维管理的一些误操纵,以及宿主机OS的一些毛病被攻破后,黑客不光可以破坏宿主机,还可能导致用户的数据安全。
这些挑战在数据量剧增的环境下更是严峻:随着我们信息社会从互联网时代向物联网时代发展,万物互连,万物智能,数据中心需要负责海量的数据的收发和处理需求。来自终端的南北向数据流,好比直播、视频游戏、视频会议、电子商务、聪明城市、城市大脑等业务不但仅是数据量大,高并发,对算力要求高,而且有些业务对时延也很敏感。另外一个方面,数据中心内部位于差别服务器内的服务构成服务网格,也使得东西向数据流也剧增。

面临数据中心流量和业务带来的挑战,以CPU为中心的架构已经不堪负重。好比加速部分数据在CPU和加速器之间来回搬运的影响,加速比率打了扣头,有些场景综合加速效果不明显,以CPU为中心,整个IO路径很长,IO成为性能的瓶颈。如图所示,12个Core的CPU,提供能够提供给租户的就4个Core,其他8个Core都要用于处理网络传输存储安全相关的基础业务。数据中心的算力需求一直在增长,思量到CPU的性能瓶颈,我们需要有个平台来帮助CPU负担绝大部分算力的压力,而让CPU专注于应用层算力需求虽然不大但非常高净值的工作。
卸载


DPU可以有效卸载数据中心的基础办法方面的功能:


  • 假造化方面,可以在Host CPU侧存在一个轻量的Hypervisor Agent,然后在DPU支持Hypervisor、呈现给Host的设备管理(vDPA,SRIOV,SIOV)、设备迁移等。
  • 网络方面,网络类的使命处理非常消耗CPU资源,可以通过DPU卸载OVS,也可以引入DPU智能网卡将假造化网络的控制平面完全卸载到智能网卡上,与主机操纵系统相隔离。
  • 存储方面,DPU可以假造多个存储设备给主机,这些存储设备可以是NVMe也可以是VirtIO-BLK,从主机来看,这些存储设备相当于是本地磁盘设备。但实际上这些存储盘都是通过网络存储协议毗连到远端的存储设备,这些网络存储协议以及相关的控制都是下沉到DPU上来完成的。这些网络存储协议可以是标准的协议,好比NVMe Over Fabric, NVMe Over TCP和iSCSI, 也可以是用户本身界说的网络存储协议。除此别的,DPU还可以支持其他类型的存储卸载,好比存储数据的压缩解压缩,加密解密,也支持存储数据的署名和校验,好比T10-DIF.
  • 安全方面,DPU也提供众多的卸载功能,好比支持网络数据的在线(inline)加密和解密, 包括SSL/TLS和IPSec, 也支持对网络第7层数据的正则表达式匹配(RegEx)以及基于它的DPI支持。DPU 也支持PKI,从而实现TLS握手协议的硬件卸载。另外DPU本身是一个安全设备,可以确保自身的Firmware, Bootloader以及BMC code不受到串改。
  • IO加速,通过运行于CPU的控制面和慢路径,界说好之后,绝大部分数据流量的处理都在DPU就可以完成,不需要进CPU。
固然差别的DPU实现的卸载的程度有差别,或者是分阶段的:


  • 第1阶段,卸载1个使命。网络卸载,成为智能网卡。分布式远程存储遇到标题,卸载存储,成为智能存储卡。
  • 第2阶段,卸载2-4个使命(非严酷界说)。CPU的功能使命不光卸载,还需要卸载的功能集成到一个平台。好比把最底层的网络、存储、假造化和安全四大类功能从CPU侧卸载到DPU中。
  • 第3阶段,卸载5项以上。把整个系统栈里能够卸载的使命都尽可能的卸载到DPU中。这里可以给出卸载的一个更加通用的标准:①性能敏感,占据较多CPU资源;②广泛部署,运行于众多服务器。当整个系统栈都尽可能进行卸载加速之后,IPU的名称要更正确一些(IPU,基础办法处理器)。
  • 第4阶段,不光全量卸载,还需要均衡和弹性。卸载下来的使命需要更多的机动性,形成弹性的基础办法支持平台。或者说,需要把IaaS的服务融入到DPU中,并且这些服务的业务逻辑需要仍由云服务提供商CSP的软件工程负责界说,并且能够很好的支持多租户、微服务、同等性等云的高级特征。
重构


由于数据量大于计算量之后,整个计算的模式就从计算驱动酿成了数据驱动。这样促进了数据中心折务器架构的重构,DPU成为整个服务器架构的焦点器件。
DPU负担的事变越多,其功能也就需要越强大,其定位也就越来越不一样。对应上面的DPU实现的四个差别的阶段可以把DPU的定位分为四个层次:
层次一,DPU是CPU的使命卸载/加速。克服CPU性能瓶颈,把网络、存储、假造化及安全等使命从CPU卸载到DPU加速,减轻CPU的压力。
层次二,DPU是基础办法,支持上层应用。DPU成为集成加速平台,既完成基础办法层工作使命处理,也完成部分业务应用的加速,支持CPU和GPU的应用层工作。
层次三,DPU/IPU是计算的焦点。IaaS甚至PaaS、SaaS等云计算焦点服务,融入到DPU软硬件。DPU图灵完备,并且是数据的入口。这使得DPU成为焦点,而CPU和GPU成为扩展。
层次四,DPU/IPU的本质是超异构计算。算力持续提拔,数据中心的超异构计算,DPU是焦点承载。基于超异构的复杂计算,需要在极致机动性的基础上,提供极致的性能。
总结

概括地说,DPU就是在数据中心面临海量数据导致CPU不堪负重环境下,负责卸载基础办法功能的一种新形态的处理器,其也将引发数据中心架构从以计算为中心到以数据为中心的重构
参考链接



  • “DPU”非DPU
  • 智能网卡知识分享(Smart NIC、DPU、IPU)-2022.05
  • DPU
  • 超异构计算,Intel的一盘大棋
  • DPU:以数据为中心的专用处理器
  • 从DPU看未来网络架构的演进趋势
  • DPU应用场景系列(一)网络功能卸载
  • DPU应用场景系列(二) 存储功能卸载
  • DPU应用场景系列(三)安全功能卸载

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

知者何南

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表