近日中科驭数宣布自主研发的第二代DPU(Data Processing Unit)芯片K2成功点亮,这是业内首颗完成点亮的国产DPU芯片,标志着国产DPU已取得新的重大进展。
巨头都看好DPU
DPU与CPU、GPU并称为三大计算支柱,打个比方来说,CPU相当于管家,负责思考处理各种业务;GPU相当于美工,专门处理各种图像处理工作;DPU相当于前台,负责打包、拆包各种数据。DPU虽然是芯片界后生,但因市场规模可期,这两年热潮涌动,疯狂入局的全球新玩家,都想从这片海中取一勺。
随着数字经济的推进,每年各行业产生的数据量以30%的速度增长,网络带宽从10G向20G、100G、400G迈进,然而后摩尔定律时代,CPU的性能以每年不足3%增长,网络传输、存储等任务就已经让CPU不堪重负,无法再有更多的资源用于计算、任务管理调度等。
数据中心面临迫切的算力架构变革,DPU作为新型数据专用处理器,可以针对基础设施层(IaaS)的计算负载,通过创新的专用DPU计算架构,解决“CPU处理效率低下、GPU处理不了”的任务负载,例如网络协议处理,高速存储协议,硬件资源虚拟化等。通过将这些基础层负载卸载到专用的DPU上处理,释放CPU的算力资源来更好的服务上层应用,从而提升整个计算系统的效率、降低整体系统的总体拥有成本(TCO)。
未来数据中心基础设施中,DPU将会是在CPU和GPU之外的又一个重要的算力支柱。它可以卸载网络、存储、虚拟化、安全等基础负载,有效减轻CPU的负担,具有广阔的应用前景。随着5G、人工智能、元宇宙的快速发展,传统的数据中心,已无法满足海量数据的处理需求。而基于DPU+CPU+GPU的异构计算,正在成为下一代智算中心的主流。
从市场上来说,DPU的需求量还在持续攀升,预计全球DPU市场规模在2024年将达100亿美元,其中中国DPU市场规模将从2022年超10亿美元增长至2025年37.41亿美元,复合增长率超过50%。
DPU极为重要,国际芯片厂商纷纷入局DPU,目前国际厂商有NVIDIA、Intel(收购Bearfoot)、AMD(收购DPU初创公司Pensando)等国际芯片大厂纷纷入局DPU。
英伟达在2020年推出BlueField-2系列DPU,BlueField-2 DPU具有较强的网络处理功能,可支持200G高速以太网或 InfiniBand两种接口。包含支持网络、存储、加密、流媒体等计算的专用加速器,同时具有面向安全、虚拟化、硬件隔离和远程管理的功能。
在2021年的Intel Architecture Day上,英特尔推出了基于FPGA和 ASIC的两种实现方式的IPU产品。英特尔IPU 全称为“Infrastructure Processing Unit”,是一种面向基础设施应用的处理器,作为一种可编程网络设备,旨在帮助云与通信服务提供商减少相关任务对中央处理器(CPU)的资源开销需求,并进一步释放相关平台的性能潜力。
2021年6月28日国际厂商Marvell发布了基于5nm工艺的OCTEON 10系列DPU,搭载了算力强劲的ARM Neoverse N2核,并且配备了多种硬件加速模块,包括加解密、包处理及人工智能推理加速器。同时为了提供用户友好的可编程接口,提高应用开发效率,Marvell配套硬件设计了包括DPDK、Marvell ML toolchain等在内的软件开发平台。
2022年初AMD以19亿美金收购DPU创业公司Pensando,Pensando的分布式服务平台包括了一个高性能、完全可编程的数据包处理器和全面的软件堆栈,可加速云、企业和边缘应用程序的网络、安全、存储和其他服务。
首颗国产自研DPU芯片已点亮
目前国内尚无ASIC形态的DPU芯片产品,中科驭数成功点亮的K2是第一颗国产的ASIC形态的DPU芯片。此外,该产品除了控制面以外,所有的数据面都是自研的。
K2采用28nm成熟工艺制程,可以支持网络、存储、虚拟化等功能卸载,是目前国内首颗功能较完整的ASIC形态的DPU芯片,具有成本低、性能优、功耗小等优势。尤其在性能上,具有极其出色的时延性能,可以达到1.2微秒超低时延,支持最高200G网络带宽。
在应用场景上,K2可以广泛适用于金融计算、高性能计算、数据中心、云原生、5G边缘计算等场景,有望成为最快规模化落地应用的国产DPU芯片。
据中科驭数创始人、CEO鄢贵海介绍,K2要解决的痛点包括两个方面:第一方面是延迟问题,K2采用了大量的超低延时相关技术,至少可以解决国内的金融市场纯国产替代方案;第二个方面是给后面DPU在数据中心中的应用打下基础,一年前,DPU在数据中心的应用,大部分还只是像英伟达这样的建议方案,而彼时DPU应用还不够标准化,因此中科驭数希望把K2的芯片的功能做得更加开放,以期增强后续DPU的应用。
“K2是中科驭数的第二代DPU产品,K2成功点亮为DPU芯片规模化量产打下了坚实的基础,是驭数DPU走向成熟的一大步。”鄢贵海评价K2点亮的意义时提及,K2完成研发时,正值国家提出东数西算战略,生而逢时。
当然,取得这样的成绩并不容易,中科驭数联合创始人、高级副总裁(兼CTO)卢文岩表示,一年时间内完成集成和芯片化研发难度是很大的,并且在技术路线上我们选择了一条性能最好也是最困难的一条路,采用自主研发的KPU芯片架构。
源于过往几年的技术积累,K2得以顺利流片。卢文岩强调,“我们团队在芯片体系结构领域有超过15年的积累,在2019年我们就完成了第一代芯片K1,我们在网络、存储、计算等领域积累了TOE、RDMA、NVMe-oF、大数据处理等功能核。”虽然技术积累深厚,卢文岩认为K2达到阶段性里程碑,依赖于研发团队坚韧不拔的协作精神。据卢文岩介绍,整个K2项目进行了60余次方案评审,芯片前端进行了近40万行代码的开发;DPU是一个与应用密切相关的芯片,在研发阶段就要完成云原生、存储、金融计算、边缘计算等5大场景的应用的原型适配;在功能仿真和测试阶段要完成数千个验证和测试用例。
鄢贵海表示,“在DPU芯片研发上,中科驭数会一如既往怀着如履薄冰的谨慎,风雨兼程,始终以提供优质创新方案满足客户需求为宗旨,加强研发投入,打磨产品,充分发挥出DPU的优势,推进规模化应用,做DPU行业的开拓者!”
值得一提的是,中科驭数也正在考虑产业应用的更多问题。比如说,在EDA上,虽然短期看来行业是可控,但长期来看可能会有影响,因此中科驭数尝试使用诸如华大九天的国内EDA产品,此外也尽可能地帮助国内生态贡献一份力量。
中科驭数是国内DPU芯片研发的领军企业,是国家专精特新小巨人企业,至今已经开展三代DPU芯片的研发迭代。DPU是数据专用处理器,被称为继CPU、GPU之后,数据中心的“第三块主力芯片”,可以提供网络处理、计算加速、本地存储、安全卸载等功能。公司近一年多来获得了三轮数亿元规模的融资,被评为中国信科“潜在独角兽”。
在核心技术特色上,中科驭数自研了敏捷异构KPU芯片架构,提出了软件开发平台HADOS,研发了网络卸载引擎NOE和数据计算卸载引擎DOE。以“软件定义加速器”为核心技术路线的专用计算架构KPU,解决了专用处理器设计碎片化的问题,KPU架构具有软件定义可配置、低设计成本、计算高效的优势。HADOS是中科驭数自研的DPU软件开发平台,是支撑DPU硬件平台的专用软件框架,生态兼容性高,可兼容多种操作系统,可以大幅降低应用软件开发难度。
在DPU产品的研发迭代上,中科驭数于2019年流片了第一代DPU芯片K1,第二代DPU芯片K2于2022年流片,基于DPU芯片核心技术,中科驭数研发了超低时延DPU网卡、RDMA加速卡、数据查询加速DPU卡、以及面向金融计算领域的极速风控、极速行情等解决方案。
在市场推广上,不仅在金融计算领域实现规模化应用,市场应用也开拓到了数据中心、通信、云计算等领域。已经实现几千万规模的营收。合作客户包括国内的大部分集成商以及新兴的服务器集成厂商,曙光、联想、浪潮、华为均为中科驭数的合作伙伴。
2021年中科驭数牵头发布了行业首部DPU技术白皮书,2022年发布了DPU评测技术白皮书,有力地推动了DPU领域的标准化。