专用加速器从SMARTNIC到DPU的崛起

日期：2022-6-27 （来源：互联网）

它的另一个职责是减轻CPU的负担，节省服务器上有限的处理器核心。因此，虽然DPU看起来类似于一些PCIe智能网卡或GPU，但它本质上是一个微服务器，为数据流和数据包处理提供加速、卸载和本地服务。当服务器和数据中心开始节能减排时，如何权衡每个组件的功耗无疑是一个大问题。

随着计算架构和负载变得越来越复杂和多样化，处理器制造商已经开始了自己的造词方式。为了体现产品定位，让大家对其缩写印象深刻，PU成为最常见的后缀。如今，处理器家族中有许多成员。除了常见的CPU、GPU和APU，NPU和TPU也根据不同的处理对象出现，随着人工智能和深度学习的兴起。

DPU模糊的定义

然而，这些明确定义的处理单元并不是我们今天的主角，而是找到了一个新定义的xpu。很难定义什么是xpu，包括DPu(数据处理单元)、IPU(基础设施处理单元)和FAC(功能加速卡)。这些新产品是xpu，它们代表了新时代的加速器硬件，从smartnic演变而来，超越了它们的定位。除了smartnic，这些xpu虽然有不同的名字，但实际上它们在很多情况下是完全重叠的。现在，为了方便，它们通常被称为DPU。

这样，DPU的定义仍然非常模糊，我们看看它的特点。Smartnic通常需要主CPU来完成管理。虽然DPU通常属于主系统中的一个组件，但它可以完全独立，可以部署到边缘、JBOF存储和网关，并为它们提供网络接口和虚拟功能。它的另一个职责是减轻CPU的负担，节省服务器上有限的处理器核心。

因此，虽然DPU看起来类似于一些PCIe智能网卡或GPU，但它本质上是一个ADC0809CCV微服务器，为数据流和数据包处理提供加速、卸载和本地服务。虽然它在服务器中提供了一个独立的单元，但它并不缺乏协助其他单元的处理能力。

DPU需要什么样的任务

至于为什么使用DPU，我们必须讨论越来越多的数据密集型任务。随着短视频和实时金融交易的兴起，高带宽数据流需要数据中心有效地处理网络、存储、安全和AI/ML。例如，谷歌几年前提到，在他们的数据中心，三分之一的任务是数据密集型的，这些任务是由底层基础设施完成的，这类任务的比例正在逐渐增加。由于CPU和GPU等通用计算单元不擅长，专门用于此类任务的DPU必须承担这一重大责任。其次，企业数据中心和公共数据中心也希望获得超大型巨头制造商的效率。要做到这一点，我们必须解决和收集那些昂贵的硬件资源，如SSD、GPU等。DPU为数据中心的解决和收集提供了极高的效率，并优化了占地面积和安全性。

DPU可以完成卸载和加速的各个方面，特别是在网络、安全和存储方面。在网络端，DPU可以有效实现虚拟路由器、辅助数据包交换、定义交换规则等工作，减少延迟，增加吞吐量；在安全性方面，DPU可以用来加速下一代防火墙(NGFW)，完成数据包过滤、内容检测、头部检测和重写，将性能提升数倍以上；在存储方面，DPU可以卸载高速NVMe/TCP，进一步提高存储性能。最重要的是，这三者都能有效地接管CPU控制面的负载，节省CPU本身的计算核心。

以上是DPU为服务器提供的强化，主要以PCIe加速卡的形式提供。此外，还有单独的DPU存储产品。在传统的CPU存储方案中，整个系统由DRAM、X86CPU、Smartnic、加速器和PCIe接口组成，在未来的存储方案中，如高性能存储、计算存储、软件定义网络应用等，单片集成方案可以更好地满足要求，这种方案不仅可以提高IOPS，还可以进一步降低能耗。

因此，数据中心将使用DPU来完成数据密集型任务，从而降低功耗、拥有成本和占用空间。此外，他们还将使用基于DPU的存储器、GPU/TPU资源池和主机卡，以有效地完成高成本硬件资源的聚合。

混战DPU市场

在很多厂商对DPU的宣传中，经常提到这将是除了CPU和GPU之外的第三大硬件。人们可能会认为，一些AI处理器似乎也提到了类似的承诺，但GPU在市场上仍然占据主导地位。DPU会有什么区别？事实证明，市场对DPU有足够的信心，这可以从DPU的制造商那里看出。

目前制造DPU的企业有三种，一种是创业公司，比如:云豹智能、星云智联、中科数字、云脉核心、核心源头、大禹智芯、Fungible等。；二是市场上一些现有的服务器巨头，如AMD/Xilinx、英特尔、Marvel、英伟达；第三，CSP(云服务提供商)制造商，如亚马逊AWS、微软Azure、阿里云等。后者更负责设计或联合设计这些XPU，这样它们就可以专门用于自己的云服务器。除了DPU制造商，还有基础设施的OEM和ODM、增值经销商和集成解决方案制造商。CSP制造商在销售服务器时，自然会间接体现DPU的价值。

随着Mellanox被英伟达收购，Pensando被AMD收购，而Fungible的DPU主要是为了加速存储和卸载。虽然没有被收购，但也获得了软银主导的融资。国内DPU厂商也受到青睐，如腾讯反复投资的云豹智能、字节跳动投资的云脉核心、美团、百度投资的星云智联等。这些投资者要么是CSP，要么拥有大型数据中心。与其他CSP制造商不同，他们缺乏或有限的硬件设计能力，但他们也看到了DPU的前景。

DPU并不完美

尽管大型制造商对此持乐观态度，但从目前的情况来看，DPU的部署对一些中小企业来说仍然是一把双刃剑。当然，DPU可以卸载基础设施任务，减轻负担，使服务器的CPU空置，专注于应用程序本身。随之而来的是更高的效率、更低的拥有成本和更高的安全性。几乎每个服务器都可以享受这些优势。

然而，在一些服务器中，DPU的引入不可避免地增加了服务器的资本投资。此外，与CPU和GPU等硬件相比，它只能卸载和加速特定负载，而不是通用加速单元。此外，当一些服务器增加DPU时，功耗仍然会增加。当服务器和数据中心开始节能减排时，如何权衡每个组件的功耗无疑是一个大问题。此外，DPU的灵活性体现在可编程性上，但这需要一定的编程能力。此外，目前每个制造商都是单独工作，没有标准接口，因此适应绝对不容易。这也是为什么许多DPU选择ARM作为核心架构的原因，以降低其编程难度。

正是因为这些原因，从市场渗透率的角度来看，DPU主要是大型CSP厂商使用的，再加上托管应用的增加，这也将推动未来DPU产品的销售。对于自主开发的DPUCSP，他们肯定会继续增加这方面的投资，进一步降低成本。对于第三方制造商来说，服务器CPU和GPU制造商英伟达、AMD和英特尔无疑会有更多的优势，因为他们提供更具竞争力的集成解决方案。

电子百科

产品导航

专用加速器从SMARTNIC到DPU的崛起

相关资讯

关键字标签

IC37:专业IC行业平台