DPU 一、什么是DPU:  DPU(Data Processing Unit)是以数据为中心构造的专用处理器,采用软件定义技术... 

您所在的位置:网站首页 dpu芯片股票 DPU 一、什么是DPU:  DPU(Data Processing Unit)是以数据为中心构造的专用处理器,采用软件定义技术... 

DPU 一、什么是DPU:  DPU(Data Processing Unit)是以数据为中心构造的专用处理器,采用软件定义技术... 

#DPU 一、什么是DPU:  DPU(Data Processing Unit)是以数据为中心构造的专用处理器,采用软件定义技术... | 来源: 网络整理| 查看: 265

来源:雪球App,作者: 半导体行业观察,(https://xueqiu.com/5736210091/211224390)

一、什么是DPU:

DPU(Data Processing Unit)是以数据为中心构造的专用处理器,采用软件定义技术路线支撑基础设施层资源虚拟化,支持存储、安全、服务质量管理等 基础设施层服务。2020年NVIDIA公司发布的DPU产品战略中将其定位为数据中 心继CPU和GPU之后的“第三颗主力芯片”,掀起了一波行业热潮。DPU的出 现是异构计算的一个阶段性标志。与GPU的发展类似,DPU是应用驱动的体系 结构设计的又一典型案例;但与GPU不同的是,DPU面向的应用更加底层。DPU要解决的核心问题是基础设施的“降本增效”,即将“CPU处理效率低 下、GPU处理不了”的负载卸载到专用DPU,提升整个计算系统的效率、降低 整体系统的总体拥有成本(TCO)。

DPU的出现也许是体系结构朝着专用化路线发展的又一个里程碑。

DPU的核心功能就是网络数据处理,既包括网络协议的分析,也可以是直接满足应用需求的加工计算。随之可以减少 22~80%的 CPU 性能,因此也被称为“卸载”(offload)。DPU 的部分前身功能在智能网卡(SmartNIC)上实现,完整的 DPU 芯片本身也通常会被集成到板卡(网卡)上。

DPU中的“D”有三种解释:(1)Data Processing Unit,即数据处理器。这种解释把“数据”放在核心 位置,区别于信号处理器、基带处理器等通信相关的处理器对应的“信号”, 也区别于GPU对应的图形图像类数据。(2)Datacenter Processing Unit,即数据中心处理器。这种解释把数据中心作为DPU的应用场景,特别是随着WSC(Warehouse-scale Computer)的兴起, 不同规模的数据中心成为了IT核心基础设施。目前来看,DPU确实在数据中心中使用前景非常广阔。

但是计算中心的三大部分:计算、网络、存储,计算部分是CPU占主导,GPU辅助;网络部分是路由器和交换机,存储部分是高密度 磁盘构成的的RAID系统和SSD为代表非易失性存储系统。在计算和网络中扮演 数据处理的芯片都可以称之为Datacenter Processing Unit,所以这种说法相对比 较片面。(3)Data-centric Processing Unit,即以数据为中心的处理器。Data-centric, 即数据为中心,是处理器设计的一种理念,相对于“Control-centric”即控制为中心。而数据为中心的理念与数据流 (Data Flow)计算一脉相承,是一种实现高效计算的方法。同时,现在试图打破访存墙(Memory Wall)的各种近存(Near-memory)计算、存内(Inmemory)计算、存算一体等技术路线,也符合数据为中心的设计理念。

SmartNIC

DPU的发展背景

DPU的出现是异构计算的又一个阶段性标志。

摩尔定律放缓使得通用CPU 性能增长的边际成本迅速上升,数据表明现在CPU的性能年化增长(面积归一化之后)仅有3%左右,但计算需求却是爆发性增长,这几乎是所有专用计算芯片得以发展的重要背景因素。

随着2019 年我国以信息网络等新型基础设施为代表的“新基建”战略帷幕的拉开,5G、千兆光纤网络建设发展迅速,移动互联网、工业互联网、车联网等领域发展日 新月异。云计算、数据中心、智算中心等基础设施快速扩容。网络带宽从主流 10G朝着25G、40G、100G、200G甚至400G发展。

网络带宽和连接数的剧增使得 数据的通路更宽、更密,直接将处于端、边、云各处的计算节点暴露在了剧增 的数据量下,而CPU的性能增长率与数据量增长率出现了显著的“剪刀差”现象。所以,寻求效率更高的计算芯片就成为了业界的共识。DPU芯片就是在这样的趋势下提出的。

DPU发展历程

随着云平台虚拟化技术的发展,智能网卡的发展基本可以分为三个阶段:

第⼀阶段:基础功能⽹卡

基础功能网卡(即普通网卡)提供2x10G或2x25G带宽吞吐,具有较少的硬 件卸载能力。在云平台虚拟化网络中,基础功能网卡向虚拟机(VM)提供网络接入的 方式主要是有三种:由操作系统内核驱动接管网卡并向虚拟机(VM)分发网络 流量;由OVS-DPDK接管网卡并向虚拟机(VM)分发网络流量;以及高性能场 景下通过SR-IOV的方式向虚拟机(VM)提供网络接入能力。

第⼆阶段:硬件卸载⽹卡可以认为是第一代智能网卡,具有丰富的硬件卸载能力,比较典型的有OVS Fastpath硬件卸载,基于RoCEv1和RoCEv2的RDMA网络硬件卸载,融合网络中无损网络能力(PFC,ECN,ETS等)的硬件卸载,存储领域NVMe-oF的硬件卸载,以及安全传输的数据面卸载等。这个时期的智能网卡以数据平面的卸载为主。

第三阶段:DPU智能⽹卡可以认为是第二代智能网卡,在第一代智能网卡基础上加入CPU,可以用 来卸载控制平面的任务和一些灵活复杂的数据平面任务。目前DPU智能网卡的 特点首先是支持PCIe Root Complex模式和Endpoint模式,在配置为PCIe Root Complex模式时,可以实现NVMe存储控制器,与NVMe SSD磁盘一起构建存储服务器;另外,由于大规模的数据中心网络的需要,对无损网络的要求更加严 格,需要解决数据中心网络中Incast流量、“大象”流等带来的网络拥塞和时延问题,各大公有云厂商纷纷提出自己的应对方法,比如阿里云的高精度拥塞控制(HPCC,High Precision Congestion Control),AWS的可扩展可靠数据报 (SRD,Scalable Reliable Datagram)等。DPU智能网卡在解决这类问题时将会引 入更为先进的方法,如Fungible的TrueFabric,就是在DPU智能网卡上的新式解 决方案。还有,业界提出了Hypervisor中的网络,存储和安全全栈卸载的发展方向,以Intel为代表提出了IPU,将基础设施的功能全部卸载到智能网卡中,可以 全面释放之前用于Hypervisor管理的CPU算力。

二、DPU的作用

DPU最直接的作用是作为CPU的卸载引擎,接管网络虚拟化、硬件资源池 化等基础设施层服务,释放CPU的算力到上层应用。以网络协议处理为例,要线速处理10G的网络需要的大约4个Xeon CPU的核,也就是说,单是做网络数据 包处理,就可以占去一个8核高端CPU一半的算力。如果考虑40G、100G的高速 网络,性能的 开销就 更 加 难 以 承 受 了。 DPU可以成为新的数据网关,将安全隐私提升到一个新的高度。在网络环境下,网络接口是理想的隐私的边界,但是加密、解密算法开销都很大,例如国密标准的非对称加密算法SM2、哈希算法SM3和对称分组密码算法SM4。如果 用CPU来处理,就只能做少部分数据量的加密。在未来,随着区块链承载的业 务的逐渐成熟,运行共识算法POW,验签等也会消耗掉大量的CPU算力。而这些都可以通过将其固化在DPU中来实现,甚至DPU将成为一个可信根。 DPU也可以成为存储的入口,将分布式的存储和远程访问本地化。随着 SSD性价比逐渐可接受,部分存储迁移到SSD器件上已经成为可能,传统的面向 机械硬盘的SATA协议并不适用于SSD存储,所以,将SSD通过本地PCIe或高速 网络接入系统就成为必选的技术路线。NVMe(Non Volatile Memory Express) 就是用于接入SSD存储的高速接口标准协议,可以通过PCIe作为底层传输协 议,将SSD的带宽优势充分发挥出来。同时,在分布式系统中,还可通过 NVMe over Fabrics(NVMe-oF)协议扩展到InfiniBand、Ethernet、或Fibre channel节点中,以RDMA的形式实现存储的共享和远程访问。这些新的协议处 理都可以集成在DPU中以实现对CPU的透明处理。进而,DPU将可能承接各种 互连协议控制器的角色,在灵活性和性能方面达到一个更优的平衡点。 DPU将成为算法加速的沙盒,成为最灵活的加速器载体。DPU不完全是一 颗固化的ASIC,在CXL、CCIX等标准组织所倡导CPU、GPU与DPU等数据一致性访问协议的铺垫下,将更进一步扫清DPU编程障碍,结合FPGA等可编程器 件,可定制硬件将有更大的发挥空间,“软件硬件化”将成为常态,异构计算 的潜能将因各种DPU的普及而彻底发挥出来。

DPU 的发展和网络数据规模增长相关:当 CPU 处理能力的增速(一度由摩尔定律定义)逐渐赶不上网络带宽、数据交换的规模增速时,这种需求就更加明显。将两个增速做成比值(称为带宽性能增速比 RBP),2020 年以来市场突破点的基础已经较明确的成型,RBP 从 1 提升到 10 左右,算力的架构变革箭在弦上,随时会出现爆发机会。

DPU优势及发展趋势分析 (1)DPU实现了业务与基础设施的操作分离

DPU将基础设施任务从CPU转移至DPU,释放CPU的资源,使更多的服务器CPU核可用于运行应用程序,完成业务计算,从而提高服务器和数据中心的效率。如通过在DPU上运行OVS,使业务域和基础设施域分离,实现VM和VM间的高效安全通信,如图6所示,传统应用场景中会使用CPU来执行OVS操作,其效率较低,消耗CPU核较多,且VM之间的通讯延时较长。Red Hat在部署了DPU后,用DPU来执行同样的OVS操作,其效率大幅提升,几乎不消耗CPU核,VM之间的通讯延时也得到了大幅缩减,大幅减少了长尾延时,从而提升了应用的性能。(2)DPU卸载网络数据实现性能提升

DPU针对云原生环境进行了优化,提供数据中心级的软件定义和硬件加速的网络、存储、安全和管理等服务。如图7所示,红帽Red Hat的容器化云平台即服务(PaaS)OpenShift上,借助DPU优化数据中心资源利用率,将网络相关的数据处理(如VxLan和IPSec等)卸载到DPU加速执行,在25Gb/s网络条件下,OpenShift部署DPU用来加速,可以只用1/3的CPU占用了来达到25Gb/s性能,而在100Gb/s网络条件下,未部署DPU的场景将达不到100Gb/s网络线速,DPU可以带来10倍的性能优势。

(3)DPU可以提供零信任安全保护

零信任(Zero Trust)是一种以安全性为中心的模型,其基于以下思想:企业不应对其内外的任何事物授予默认信任选项。零信任可以减少数据泄露、拒绝未授权的访问,因此在数据安全方面价值巨大。DPU可以为企业提供零信任保护,通过将控制平面由主机下放到了DPU,实现主机业务和控制平面的完全隔离,数据将无法进行穿透,保证安全性。DPU的出现相当于为每个服务器配备了一台“计算机前的计算机”以提供独立、安全的基础设施服务,并与服务器应用域安全隔离。如果主机遭受入侵,安全控制代理与被入侵主机之间的DPU隔离层可防止攻击扩散至整个数据中心。这样DPU就解决了企业不愿直接在计算平台上部署安全代理的情况。通过在完全隔离于应用程序域的DPU上部署安全代理,企业不仅能获得对应用程序工作负载的可见性,还能在其基础设施中执行一致的安全策略。

(4)DPU助力实现“算存分离”

DPU的BlueField SNAP技术方案通过在服务器系统的数据入口处引入计算资源,在DPU上独立实现面对应用需求的存储方案,帮助存储厂商在数据中心中低成本地灵活部署、升级高级存储协议,而完全不需要对现有软件栈进行任何更改。

存储厂商可以把自家团队为各行业应用开发的开放系统的直连式存储(DAS)、纵向扩展(Scale-UP)、横向扩展(Scale-OUT)、超融合架构(Hyperconverged)等存储解决方案,零开销地推广到各个应用领域的现有业务处理平台和数据中心基础架构中,而所有的安全加密、数据压缩、负载均衡等复杂又必须的功能则完全由DPU透明地卸载。存储行业的革新算法和实现,可以在DPU架构中,独立于服务器操作系统进行部署。DPU技术帮助存储厂商实现真正的“算存分离”,完全发挥自家产品的技术优势,打通最高效服务应用需求的通路。

未来的DPU智能网卡硬件形态:

随着越来越多的功能加入到智能网卡中,其功率将很难限制在75W之内, 这样就需要独立的供电系统。所以,未来的智能网卡形态可能有三种形态:(1)独立供电的智能网卡,需要考虑网卡状态与计算服务之间低层信号识 别,在计算系统启动的过程中或者启动之后,智能网卡是否已经是进入服务状 态,这些都需要探索和解决。

NVIDIA推出25G安全智能网卡(SmartNIC)

(2)没有PCIe接口的DPU智能网卡,可以组成DPU资源池,专门负责网络功能,例如负载均衡,访问控制,防火墙设备等。管理软件可以直接通过智能 网卡管理接口定义对应的网络功能,并作为虚拟化网络功能集群提供对应网络 能力,无需PCIe接口。(3)多PCIe接口,多网口的DPU芯片。例如Fungible F1芯片,支持16个双 模PCIe控制器,可以配置为Root Complex模式或Endpoint模式,以及8x100G网络 接口。通过PCIe Gen3 x8接口可以支撑8个Dual-Socket计算服务器,网络侧提供 8x100G带宽的网口。

DPU作为一种新型的专用处理器,随着需求侧的变化,必将在未来计算系统中成为一个重要组成部分,对于支撑下一代数据中心起到至关重要的作用。

DPU的产业化机遇

数据中心作为IT基础设施最重要的组成部分在过去10年成为了各大高端芯 片厂商关注的焦点。各大厂商都将原有的产品和技术,用全新的DPU的理念重 新封装后,推向了市场。NVIDIA收购Mellanox后,凭借原有的ConnectX系列高速网卡技术,推出其 BlueField系列DPU,成为DPU赛道的标杆。

当然,我们还是要佩服黄仁勋的“带货”能力,能让DPU概念一炮而红,吸引业内众多竞争者纷至沓来。从海外的英特尔、博通、英伟达、赛灵思、Marvell、Netronome、Pensando、Fungible、Dream Big Semiconductor,到国内的DPU创企中科驭数、星云智联、大禹智芯、芯启源、云豹智能,每一家企业都在摩拳擦掌,跃跃欲试。

中银国际认为,DPU 会部分分流(数据中心的)CPU 市场规模,但考虑到功能和性能的改善, DPU 相对已有芯片市场来说仍然是增量。 基于Fungible 和英伟达等公司的预测,即用于数据中心的 DPU 量级将达到和数据中心服务器等量的级别。《DPU 技术白皮书》主编、中科院计算所研究员鄢贵海估计服务器每年新增大约千万量级,对应一颗或多可 DPU(类比网卡比例),若服务器每年新增 1500万台,每颗 DPU 以 1 万元(或数千元)计算,则对应千亿级人民币市场。

数据研究预测DPU在云计算市场的应用需求最大,且市场规模随着云计算数据中心的迭代而增长,根据Canalys Cloud Channels Analysis预测,到2023年,中国DPU市场规模将达190亿人民币。当然,还有其它分析机构的预测更加乐观,认为中国DPU市场规模预计将在2025年超过37亿美元,约合240亿人民币。

DPU产业链:

国外布局DPU的企业:

英伟达:2019年 3月 11日,NVIDIA宣布和 Mellanox两家公司就收购事宜达成最终协议。NVIDIA现金收购 Mellanox,总价约 69 亿美元。完成收购后,基于 Mellanox 的 ConnectX 系列高速网卡推出了 BlueField 系列的 DPU。英伟达计划用3 年时间在 Bluefield 现有产品上陆续推出 2X、第三代和第四代产品,使得性能提升 1000 倍,支持 400TOPS(计算能力)和 400Gbps(吞吐量)的水平。

博通:博通在网卡市场处于领导者地位,其 DPU 布局更多源自 SmartNIC。Broadcom 在 Stingray 的中心设计了NetXtreme-S BCM58800 芯片,将 8 个 3 GHz 主频的 ARM v8 A72 内核放置其中。博通在逐步将产品转移到 7 纳米,使得可以从 8 核扩展到 12 核。

英特尔:英特尔 2015 年底收购了 FPGA头部厂商 Altera,使得在传统通用处理器的版图上增加了硬件加速布局。2021 年 6 月,英特尔公布了 IPU(Infrastructure Processing Unit,基础设施处理器)规划。公司数据平台事业部首席技术官 Guido Appenzeller 表示 DPU 和 IPU在功能上没有根本性差别,主要是命名不同。

迈威尔:Marvall在2021年发布了 OCTEON 10 DPU 产品,不仅具备强大的转发能力,还具有突出的 AI 处理能力。OCTEON 10 采用 ARM N2 内核和 5nm 制程,除了具备与上一代产品相同的多功能构建块阵列,还增加了先进的 IP 和新功能,包括集成极强学习推理的引擎、内联加密处理器以及矢量数据包处理器,它们也都能够以虚拟化方式运行。

国内布局DPU的企业:

华为:华为 DPU 研发信息目前披露的不多,但类似博通公司,华为也在智能网卡领域有长期深耕,拓展到DPU 领域比较自然。例如,华为云官网显示,2020 年华为海思自研的 Hi1822 网卡已在鲲鹏服务器上。采用,其中就实现了算力加速、卸载(offload)15%的 CPU 资源等功能。考虑到华为设备出货量的量级、供应链受限等情况,我们预计华为的 DPU 或类似智能网卡产品会优先满足自用需求为主。

左江科技:左江科技在 2007 年 8 月成立,2021 年在 A 股上市。左江科技持股72%的北中网科技目前主要投入在基础网络芯片 DPU的研发上面,基于芯片特性,可以应用到多个业务领域。公司人员规模约 60 人,近 90%的人员为研发人员,预计芯片量产在 2022年下半年。

国内初创新锐:

工业和信息化部发布的《新型数据中心发展三年行动计划(2021-2023年)》中明确提出要加快提升算力算效水平,“推动CPU、GPU等异构算力提升,逐步提高自主研发算力的部署比例”,“加强专用服务器等核心技术研发”,“树立基于5G和工业互联网等重点应用场景的边缘数据中心应用标杆”等等。

该行动计划也部分反映了DPU等新型算力芯片难得的历史发展机遇。虽然国内厂商在芯片产品化的环节还相比国外一线厂商还有差距,但是在DPU架构的理解上还是有独到的见解的,而且我国目前在数据中心这个领域,无论是市场规模还是增速,特别是用户数量,相较于国外都有巨大的优势。国内厂商有望充分利用这一“应用势能”,加快发展步伐,在DPU这个赛道与国外厂商逐鹿中原。

DPU的潜在市场非常巨大,预测到2025年仅中国市场就能达到每年40亿美元的规模,估计全球将超过120亿美元,但挑战与机遇并存。从目前行业的关注度来看,DPU带来的机遇已经基本形成共识,期待在这一趋势的驱使下,行业内的各个厂商协同起来,将DPU这一创新的产品早日赋能各行各业,成为新的生产力。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3