边缘智芯:基于XPU的新数据中心计算架构

2021-09-15  

边缘智芯(Socnoc)是一家以PCIe技术为基础的数据芯片创业公司,旨在通过整合PPCLe和以太网技术,通过软硬件结合方式,彻底改变数据中心服务器架构、服务器互联架构,将传统以计算为中心的服务器行业带入下一代以数据为中心的“云原生”新计算时代。现在业界熟知DPU、IPU、XPU,正是边缘智芯布局的赛道。

时代变革和市场需求

为什么未来CPU为中心转变为数据为中心?李甫认为,当前网口数据已经超过CPU计算数据,而且未来5年预计网口数据继续翻倍。然而,CPU的频率翻倍是很难的。

这种情况下面出现一个问题,数据量远远超过计算速度,数据中心或者服务器将从以前的CPU为中心转变成以数据分发交换为中心。数据芯片将降低30%以上CPU负载,计算机架构迎来40年最大变革。

来自方舟投资的一则预测数据,在未来10年服务器市场增加一倍,从以前800多亿到1500亿规模。把新服务器分为数据服务器和传统服务器,传统服务器会下降,数据服务器会增加。

同时在“十四五”规划里面,2025年中国将拥有全球最大的数据资产,东数西算和新基建促进中国未来一定在数据生产量、机架数量、服务器数量等数据指标上全面超过美国,成为世界第一。

数据芯片能干什么?

“流量处理、流量分发、设备管理。”李甫开门见山地说道。

数据进入内存条,就是传统的TCP/IP协议;也可能进入GPU,则是传统的大数据计算。业界通常把数据界面分成三个模块,一个模块是数据芯片的计算模块,一个是网络模块,一个是设备管理模块。这三个模块总结相对于大家俗称的数据芯片CPU和TPU。

那为什么数据芯片会变成第三个大芯片?

第一个时代是CPU时代,不是独立存在,真正驱动CPU成为中心的原因是因为有一个通用的操作系统,在通用操作系统建立了企业级应用生态。真正CPU的架构支撑是CISC和RISC。

第二个时代是GPU时代,GPU本身是一个无限量处理芯片,但是真正让GPU成为通用芯片是人工智能计算,真正驱动GPU的是Cuda和Tensor core。NVIDIA走的是通用架构,Google走的是封闭框架。

第三个时代是DPU/IPU/XPU时代,占领一席之地应该是数据应用和网络协议,真正的数据芯片如果在未来能做出大核心必须有自己的网络协议,例如Ethernet、IB和PCIe。

在各个历史背景下面,边缘智芯推出了XPU。

李甫介绍道:“我们只做数据交换,是通过PCIe物理层加上协议层,把芯片做得非常简单,简单到只有一个模块PCIe。我们把所有芯片设计的难点从以前SOC的设计变成软件协议,同时在软件协议部署专利。”

XPU芯片有何优势?

李甫解答道:

  • 技术优势,PCIe比Ethernet更加适用低延迟、大通量计算。PCIe技术在延迟、CPU利用率、虚拟化方面具备明显优势,将解决PCIe在拓扑、p2p方面的劣势。
  • 架构优势,XPU引入协议管理模块,通过软件支持TCP/IP,RDMA等,加速协议,架构简洁、成本低。
  • 协议优势,第一家基于PCIe的RDMA协议,支持跨CPU内存通讯,极大简化CPU和CPU通讯协议栈,降低延迟和成本。

“总体来看,XPU芯片的优势是:芯片+协议=双壁垒”李甫分析称,“因为我们有比较通用的协议,所以成本极其低,架构上面由于价格优势,在成本上有非常大的优势,同时协议还有专利,希望把数据变成简单的芯片+协议双重壁垒。”

接下来,边缘智芯将从服务器、网卡、云计算等市场进行切入。

文章来源于:国际电子商情    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。