中国信通院《数据中心白皮书2022》报告显示,2021年全球数据中心市场规模超过679亿美元,较2020年增长9.8%。预计2022年市场收入将达到746亿美元,增速总体保持平稳。
受新基建、数字化转型及数字中国远景目标等国家政策促进及企业降本增效需求的驱动,我国数据中心业务收入持续高速增长。2021年,我国数据中心行业市场收入达到1500 亿元左右,近三年年均复合增长率达到30.69%,随着国内各地区、各行业数字化转型的深入推进,中国数据中心市场收入将保持持续增长态势。
为此,《国际电子商情》梳理了国内外数据中心行业,尤其是芯片头部厂商们的最新动向,读者们可以借此迅速了解数据中心行业正在发生的新变化与新趋势。
重新争夺云计算定义权
在本周结束的2022年阿里云峰会上,阿里云智能总裁张建锋表示,阿里云今年最重要策略是“B2B”,也就是“Back to Basic”,回到云计算的本质,坚持在技术的长征路上,不断取得新的突破。
他认为,云计算越来越接近进入下一个时代——全新的架构定义,全新的软件界面,硬件加速。“虽然我们错过了PC时代,但云这个时代大家起步是一样的。现在是重新定义云的窗口期,如果定义好了,中国就可以在下一个技术时代有自己的一席之地。”
会上,阿里云发布了一款云数据中心专用处理器CIPU(Cloud infrastructure Processing Units),将有望替代CPU成为云时代IDC的处理核心。
图源:阿里云
为什么要有CIPU?
在张建锋看来,过去十多年,云计算技术经历了两个发展阶段:
第一阶段是分布式和虚拟化技术替代了大型机,满足了当时企业所需的算力规模;
第二阶段出现了资源池化技术,把计算和存储资源分离,再规模化编排和调度,提供了超大规模的计算和存储资源池。
这两个阶段的演进的确推动了云计算发展,但张建锋表示,它们都是通过软件定义的方法,基于传统的以CPU为中心的体系架构去做优化,已经触及瓶颈。而近年来,云上客户的需求发生了很大变化,数据密集型的计算越来越多,不断地提高了对云计算提供的低时延、高带宽的需求,这些需求很难通过传统体系架构去满足。
因此,新一代的云计算要从数据中心的内部做体系化创新,从以往的以CPU为中心的体系架构,进入以CIPU为中心的体系架构。
根据阿里云方面的描述,这将是一个全新的架构体系,从最底层的数据中心核心部件到最上层云原生软件,是一套完整的自研技术体系。向下,CIPU接入物理的计算、存储、网络资源,快速云化并进行硬件加速;向上,CIPU接入飞天云操作系统,管控阿里云全球上百万台服务器。
中国工程院院士郑纬民对此评论称,CIPU概念的提出和落地,将使中国在争取云计算的定义权中处于有利位置,改变了原本由西方技术制定的游戏规则,让我国IT产业建立了全球领导力。
龙芯服务器处理器3C5000亮相
3C5000是龙芯面向通用计算、大型数据中心、云计算中心领域推出的服务器处理器,采用完全自主的LoongArch指令架构,16核心单芯片unixbench分值9500以上,双精度计算能力达560GFlops,16核处理器峰值性能与典型ARM 64核处理器的峰值性能相当。
龙芯中科董事长胡伟武认为,随着龙芯CPU性能的不断提高以及龙芯基础版操作系统的不断完善,2022年起龙芯技术平台的主要矛盾转向了应用生态,龙芯基础软件工作的重点,也要从操作系统与硬件结合转向操作系统与应用结合。今后,基于LoongArch的软件生态明确三大发展方向:一是提供基础版开源操作系统,二是通过高效二进制翻译系统消除指令系统壁垒,实现广泛兼容;三是形成自主编程语言和编程框架。
同时,为更好地实现提升兼容性,龙芯还推出了X86软件兼容“三件套”,即龙芯办公外设利旧通用解决方案、兼容IE的龙芯浏览器和dotnet生态建设。龙芯中科资深工程师曾露说,这是龙芯瞄准国产信息化建设的“堵点”的重要发力点,龙芯研发团队将贯彻“3+10+X”的X86平台应用兼容适配策略,其中,“3”指的是“三件套”,“10”指的是X86平台最常见的10个重点应用,“X”指的是实现广泛的X86兼容,从深度和广度两个方面共同推进龙芯生态的发展。
向云原生迈进的自研之路
云原生是当前的热词之一。Gartner预测,到2025 年,云原生平台将成为95%以上新数字应用的基础,而在2021 年这一比例只有不到40%。热潮之下,越来越多的企业和开发者开始推动业务与技术的创新向云原生演进。
Ampere Computing日前就公开了自研内核的部分细节。这款被命名为AmpereOne的处理器基于5nm工艺制造,支持PCIe 5.0和DDR5,新产品已经开始送样。
之所以选择自研,Ampere方面给出的解释是因为公司开发的产品是专门针对于云,而不是其他数据中心或者其他客户的应用,因此只能从微架构开始一直向上自己研发产品,才能给客户提供专门的定制化服务,才能满足客户对性能、能效、可扩展性提出的日趋严苛的需求。
图源:Ampere Computing
“从性能角度考虑,Ampere希望能够进一步地优化微架构,来实现更高层级的性能。” Ampere Computing首席产品官Jeff Wittich说目前可供选择的方法,包括持续增加内核数量;确保内核之间相互隔离,不会相互干扰;提供更低功耗,能够满足客户创新需求的云服务器性能;通过使用自研内核,加快处理速度,提高效率等等。
尽管没有透露更多新一代5nm处理器的细节,也没有与Arm Neoverse内核性能进行公开比较,但已知的消息显示,AmpereOne自研核不是基于Arm Neoverse V1或N2而研发的,不过仍以Arm ISA为基础,并与Altra和Altra Max处理器互相兼容。未来五年内,产品路线图会更富创新性,性能更高、功耗更低,并且为云端赋予更多独特的功能。
AMD 3纳米Zen 5在路上
AMD在其2022年金融分析师日上分享了新的核心路线图,概述了其到2024年的预计架构和工艺节点增强。该路线图包括基于Zen 4架构的5nm和4nm CPU,以及基于Zen 5架构的4nm和3nm处理器。
图源:AMD
如上图所示,Zen 4和Zen 5内核芯片都被分为三种类型:“Zen 4/ Zen 5”标准内核、配备3D V-Cache的内核、以及“Zen 4c/Zen 5c”密度优化内核。但AMD没有详细标注出CPU核心路线图的具体年份,只是给出了从2019年到2024年底的一条时间轴线。
新的第四代AMD Infinity架构也特别值得关注。这种互连架构支持CXL 2.0、UCIe互联标准,可以将小芯片(Chiplet)、内存和I/O芯片、甚至是GPU连接在一起,AMD正计划将收购来的Xilinx IP以及来自第三方供应商的IP也纳入其中。
除了不断研发高性能产品之外,AMD也正在通过收并购来增强自身在数据中心市场的实力。继大手笔收购Xilinx之后,日前,AMD还以约19亿美元的价格收购了DPU芯片厂商Pensando,使得AMD在数据中心领域也拥有了“高性能CPU+GPU+FPGA+DPU”的完整布局,进一步增强了与英伟达和英特尔竞争的底气。
用液冷GPU打造绿色数据中心
将这一理念落地的,是英伟达。
日前,英伟达发布了率先采用直接芯片(Direct-to-Chip)冷却技术的数据中心PCIe GPU,这在主流服务器GPU中尚属首例。从目前的市场进展来看,一些系统制造商已经先行启动使用计划,下一步有望快速在更大规模的应用中落地。
液冷NVIDIA A100 PCIe GPU(图源:NVIDIA)
Equinix是一家全球服务提供商,旗下管理的数据中心超过240个,他们正在验证A100 80GB PCIe液冷GPU在数据中心的应用表现。在单独的测试中,Equinix和英伟达均发现:采用液冷技术的数据中心工作负载可与风冷设施持平,同时消耗的能源减少了约 30%。英伟达估计,液冷数据中心的电源使用效率(PUE)可能达到1.15,远低于风冷的PUE 1.6。据报道,2023年正式推出的HGX Grace和HGX Grace Hopper,也将推出风冷和液冷两种版本。
从Data Bridge Market Research数据来看,预测到2026年,液冷数据中心市场规模将增长至1205亿美元,与2018年14.3亿美元相比翻了数十倍,年复合增长率高达30.45%。
英伟达2023财年第一季度财务报告显示,其数据中心业务收入创下37.5亿美元的纪录,同比增长83%,环比增长15%,超过游戏成为英伟达增速最快的业务。这其中,Hopper GPU、Grace CPU和BlueField DPU构成的“组合体”,扮演着关键角色。
今年3月,英伟达发布了Hopper GPU架构,以及首款基于Hopper架构的GPU—NVIDIA H100;而在5月的COMPUTEX 2022上,NVIDIA则宣布从2023年上半年开始,将出现第一波由NVIDIA Grace CPU超级芯片和Grace Hopper超级芯片驱动的系统。
英特尔强化数据中心GPU
同样是在5月,英特尔在“On产业创新峰会”上公布了在芯片、软件和服务方面取得的多项进展。其中一项就包括用于训练数据中心负载的英特尔Habana Gaudi2 AI处理器,据英特尔介绍,Gaudi2处理器的工作负载量几乎是英伟达A100 80GB处理器的2倍。
此外,英特尔还公布了延续到2026年的IPU产品路线图,其中包括基于全新FPGA和英特尔架构平台的代号为Hot Springs Canyon的产品,Mount Morga(MMG)ASIC,以及下一代800GB产品。希望通过专用的IPU强化加速功能,满足基础设施计算需求,加码未来数据中心。
向高性能数据中心GPU领域进军,拓展独立GPU的优势,以此来满足新兴行业对于算力的需求,一直是英特尔的目标。为此,英特尔公布了代号为Arctic Sound-M(ATS-M)的GPU,这是英特尔在数据中心领域创新配备AV1硬件编码器的独立GPU,支持高质量转码并提供每秒150万亿次的运算性能。据悉,将于2022年第三季度发布的ATS-M已经获得超过15款来自戴尔、Supermicro、思科、HPE、浪潮和新华三等合作伙伴的系统设计。
英特尔Arctic Sound-M数据中心GPU(图源:英特尔)
在此次峰会上,英特尔还展示了基于内置高带宽内存的代号为Sapphire Rapids英特尔处理器,以及代号为Ponte Vecchio的英特尔数据中心显卡,该处理器与显卡已经在为阿贡实验室的极光超级计算机提供每秒超过两百亿亿次的双精度峰值计算性能。
结语
群雄逐鹿数据中心行业,说明以数字技术为核心驱动的第四次工业革命正在给人类生产生活带来深刻变革,数据中心作为承载各类数字技术应用的物理底座,其产业赋能价值逐步凸显,并正成为全球战略竞争的新焦点。
相关文章