快速认识DPU
DPU(Data Processing Unit)是以数据为中心构造的专用处理器。那么为什么需要DPU?DPU主要负担什么功能?它带来什么影响?我们可以通过四个关键字快速认识DPU:数据中心、数据、卸载和重构。数据中心
数据中心由大量的服务器构成。计算、存储、网络数据传输是数据中心的三大焦点功能。
https://i-blog.csdnimg.cn/blog_migrate/e06dadf075e0a7c86917edcce7d06710.png#pic_center
在CPU之上运行操纵系统、假造机管理器和Kubernetes等基础软件。在此之上业务应用部分通过假造机和容器进行部署,实现资源共享、弹性伸缩、多租户、微服务、SaaS等。底层由GPU、FPGA提供硬件加速,全部的加速资源、网络资源和存储资源由CPU同一协调调用。此时CPU不但仅是控制的中心,也是数据活动的中心。
数据
https://i-blog.csdnimg.cn/blog_migrate/950ae196f76d7da334a723c391081e75.png#pic_center
以CPU为中心的数据中心面临多方面的挑战:
[*]构建于假造化和容器基础上的业务系同一方面带来了极大的便利,另一方面由于假造化的开销越来越大。
[*]基础办法和业务处于同一个计算平台,基础办法的性能突发会干扰业务的性能稳定度;
[*]另有一个标题就是安全访问,宿主机侧管理具有业务虚机等的全部权限,运维管理的一些误操纵,以及宿主机OS的一些毛病被攻破后,黑客不光可以破坏宿主机,还可能导致用户的数据安全。
这些挑战在数据量剧增的环境下更是严峻:随着我们信息社会从互联网时代向物联网时代发展,万物互连,万物智能,数据中心需要负责海量的数据的收发和处理需求。来自终端的南北向数据流,好比直播、视频游戏、视频会议、电子商务、聪明城市、城市大脑等业务不但仅是数据量大,高并发,对算力要求高,而且有些业务对时延也很敏感。另外一个方面,数据中心内部位于差别服务器内的服务构成服务网格,也使得东西向数据流也剧增。
https://i-blog.csdnimg.cn/blog_migrate/8c86f5c44e0d96d7e6956f4fea770b6e.png#pic_center
面临数据中心流量和业务带来的挑战,以CPU为中心的架构已经不堪负重。好比加速部分数据在CPU和加速器之间来回搬运的影响,加速比率打了扣头,有些场景综合加速效果不明显,以CPU为中心,整个IO路径很长,IO成为性能的瓶颈。如图所示,12个Core的CPU,提供能够提供给租户的就4个Core,其他8个Core都要用于处理网络传输、存储和安全相关的基础业务。数据中心的算力需求一直在增长,思量到CPU的性能瓶颈,我们需要有个平台来帮助CPU负担绝大部分算力的压力,而让CPU专注于应用层算力需求虽然不大但非常高净值的工作。
卸载
https://i-blog.csdnimg.cn/blog_migrate/510688ef6b0a3b788cd89b15b1fc49c6.png#pic_center
DPU可以有效卸载数据中心的基础办法方面的功能:
[*]假造化方面,可以在Host CPU侧存在一个轻量的Hypervisor Agent,然后在DPU支持Hypervisor、呈现给Host的设备管理(vDPA,SRIOV,SIOV)、设备迁移等。
[*]网络方面,网络类的使命处理非常消耗CPU资源,可以通过DPU卸载OVS,也可以引入DPU智能网卡将假造化网络的控制平面完全卸载到智能网卡上,与主机操纵系统相隔离。
[*]存储方面,DPU可以假造多个存储设备给主机,这些存储设备可以是NVMe也可以是VirtIO-BLK,从主机来看,这些存储设备相当于是本地磁盘设备。但实际上这些存储盘都是通过网络存储协议毗连到远端的存储设备,这些网络存储协议以及相关的控制都是下沉到DPU上来完成的。这些网络存储协议可以是标准的协议,好比NVMe Over Fabric, NVMe Over TCP和iSCSI, 也可以是用户本身界说的网络存储协议。除此别的,DPU还可以支持其他类型的存储卸载,好比存储数据的压缩解压缩,加密解密,也支持存储数据的署名和校验,好比T10-DIF.
[*]安全方面,DPU也提供众多的卸载功能,好比支持网络数据的在线(inline)加密和解密, 包括SSL/TLS和IPSec, 也支持对网络第7层数据的正则表达式匹配(RegEx)以及基于它的DPI支持。DPU 也支持PKI,从而实现TLS握手协议的硬件卸载。另外DPU本身是一个安全设备,可以确保自身的Firmware, Bootloader以及BMC code不受到串改。
[*]IO加速,通过运行于CPU的控制面和慢路径,界说好之后,绝大部分数据流量的处理都在DPU就可以完成,不需要进CPU。
固然差别的DPU实现的卸载的程度有差别,或者是分阶段的:
[*]第1阶段,卸载1个使命。网络卸载,成为智能网卡。分布式远程存储遇到标题,卸载存储,成为智能存储卡。
[*]第2阶段,卸载2-4个使命(非严酷界说)。CPU的功能使命不光卸载,还需要卸载的功能集成到一个平台。好比把最底层的网络、存储、假造化和安全四大类功能从CPU侧卸载到DPU中。
[*]第3阶段,卸载5项以上。把整个系统栈里能够卸载的使命都尽可能的卸载到DPU中。这里可以给出卸载的一个更加通用的标准:①性能敏感,占据较多CPU资源;②广泛部署,运行于众多服务器。当整个系统栈都尽可能进行卸载加速之后,IPU的名称要更正确一些(IPU,基础办法处理器)。
[*]第4阶段,不光全量卸载,还需要均衡和弹性。卸载下来的使命需要更多的机动性,形成弹性的基础办法支持平台。或者说,需要把IaaS的服务融入到DPU中,并且这些服务的业务逻辑需要仍由云服务提供商CSP的软件工程负责界说,并且能够很好的支持多租户、微服务、同等性等云的高级特征。
重构
https://i-blog.csdnimg.cn/blog_migrate/0f6a35b46df50aa9f834c2dc5f8bf245.png#pic_center
由于数据量大于计算量之后,整个计算的模式就从计算驱动酿成了数据驱动。这样促进了数据中心折务器架构的重构,DPU成为整个服务器架构的焦点器件。
DPU负担的事变越多,其功能也就需要越强大,其定位也就越来越不一样。对应上面的DPU实现的四个差别的阶段可以把DPU的定位分为四个层次:
层次一,DPU是CPU的使命卸载/加速。克服CPU性能瓶颈,把网络、存储、假造化及安全等使命从CPU卸载到DPU加速,减轻CPU的压力。
层次二,DPU是基础办法,支持上层应用。DPU成为集成加速平台,既完成基础办法层工作使命处理,也完成部分业务应用的加速,支持CPU和GPU的应用层工作。
层次三,DPU/IPU是计算的焦点。IaaS甚至PaaS、SaaS等云计算焦点服务,融入到DPU软硬件。DPU图灵完备,并且是数据的入口。这使得DPU成为焦点,而CPU和GPU成为扩展。
层次四,DPU/IPU的本质是超异构计算。算力持续提拔,数据中心的超异构计算,DPU是焦点承载。基于超异构的复杂计算,需要在极致机动性的基础上,提供极致的性能。
总结
概括地说,DPU就是在数据中心面临海量数据导致CPU不堪负重环境下,负责卸载基础办法功能的一种新形态的处理器,其也将引发数据中心架构从以计算为中心到以数据为中心的重构。
参考链接
[*]“DPU”非DPU
[*]智能网卡知识分享(Smart NIC、DPU、IPU)-2022.05
[*]DPU
[*]超异构计算,Intel的一盘大棋
[*]DPU:以数据为中心的专用处理器
[*]从DPU看未来网络架构的演进趋势
[*]DPU应用场景系列(一)网络功能卸载
[*]DPU应用场景系列(二) 存储功能卸载
[*]DPU应用场景系列(三)安全功能卸载
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页:
[1]