近年来,随着第四次科技革命浪潮的驱动,领域不再局限于芯片、服务器或机架,而是牵系着整个数据中心,它正在转向更复杂的仓库级计算。如今全球正迈入一个新的阶段,即生成式人工智能(Gen)时代,认为2024年及未来,预计将出现大规模的创新应用。作为领域技术变革的基石,再次带来创新。
本文引用地址:2024年2月22日,召开技术媒体沟通会,宣布推出两款基于全新第三代 IP构建的新的Arm® ™计算子系统 (CSS),主要包括Arm CSS V3以及Arm Neoverse CSS N3。
打造协同设计新模式,满足计算需求
Arm基础设施事业部产品解决方案副总裁Dermot O’Driscoll表示,从两个将推动未来基础设施发展的重要颠覆性趋势来看,人们希望对支持云计算关键工作负载的计算进行优化,以及头部企业正在打造定制芯片,并需要一种行之有效的方式来实现这一目标。而软件和硬件在过去分别由不同的公司负责开发,这样老旧的模式已经无法满足现在客户对性能的需求,也无法适配软件或硬件的复杂性。客户希望其部署的硬件,甚至是微架构层面,都能被优化,以便顺利运行其软件工作负载。此类联合优化很难实现,需要软硬件双方做出巨大的投入才能够完成。
在这样的背景下,Arm的合作式IP业务模式和计算子系统在其中可以发挥关键作用。据Dermot O’Driscoll表示,“通过与Arm的协作模式,合作伙伴可以在我们IP的开发过程中,在对应IP的典型系统上运行其工作负载。这种协作模式直接影响Arm架构的发展方向,以及我们在IP产品中实现微架构的方式。在交付IP之后,我们也将为合作伙伴提供贯穿整个芯片开发周期的支持。通过模拟和仿真,我们帮助他们评估由Arm提供的设计选择,并在开发与配置的全流程中提供支持,从而缩短产品上市进程。”
Dermot O’Driscoll认为,“我们与合作伙伴通力协作为定制计算开辟了一条独特路径,以满足当今计算基础设施的需求,这种协同设计并不局限于 CPU。为了深入优化TCO,就必须着眼于整个平台。而只有Arm能够在平台级别上调优内存和I/O,并添加自定义工作负载加速器。”
Arm于去年推出了Neoverse CSS,有助于更快地开发芯片或小芯片。在Neoverse CSS中,Arm负责配置、优化和验证一套完整的计算子系统,并针对基础设施市场的各种关键用例进行配置,使其合作伙伴能够专注于针对特定系统级工作负载塑造差异化竞争优势,比如软件调优、定制加速等。此外,客户还能从CSS中额外获得选购优势,他们能够加速产品上市时间、降低工程成本,同时还能够善用前沿的处理器技术。
值得一提的是,以Neoverse CSS为基础的Arm全面设计(Arm Total Design)生态项目也在去年下半年推出。Arm 基础设施事业部营销副总裁 Eddie Ramirez表示,Arm全面设计(Arm Total Design)生态项目在推出后四个月内,已经有20多家成员加入。其中包括新的EDA和配套IP提供商,以及来自包括韩国、中国台湾、中国大陆和印度等战略市场的芯片设计合作伙伴,这些市场存在巨大的发展潜力。Arm正在与三家主要代工厂合作,以确保其CSS产品能在其先进工艺节点上进行优化。
CSS定制芯片强力辅助,新一代Arm Neoverse技术功能深度优化
Arm发布的新一代Neoverse技术包括通过性能效率更优异的 N 系列新 IP 扩展Arm Neoverse CSS产品路线图,即Neoverse CSS N3;以及首次将计算子系统引入性能优先的V系列产品线,即新的Neoverse CSS V3。
01.Arm Neoverse CSS N3每瓦性能提高20%
本次Arm推出了N系列新的CSS产品——Neoverse CSS N3,新产品在N2的基础之上更新了许多功能。据Arm介绍,CSS N3是基于新的Neoverse N3 IP平台打造,为新的N系列产品引入了Armv9.2功能,能为每个核心提供2MB的专用L2缓存,并支持最新的PCIe和CXLI/O标准以及UCIe芯粒标准。
性能方面,与CSS N2相比,CSS N3每核心的每瓦性能可提高20%,单芯片可支持8到32核。此外,CSS N3的首个实例可提供 32 核,热设计功耗(TDP)低至40W,可扩展性非常强,可覆盖电信、网络和DPU等一系列应用。在 数据分析工作负载方面,通过有效的微架构调整,N3的性能提升高达 196%。
合作方面,Arm透露,智原科技正在构建基于芯粒的服务器芯片,该芯片将搭载64颗N系列核心,并基于英特尔代工服务的18A工艺节点进行生产制造。同时,ADTechnology将提供高性价比的16核CSS N系列边缘服务器平台,他们将与三星代工厂合作,为边缘计算释放更强大的算力。
02. Arm Neoverse CSS V3单芯片性能提高了 50%
Arm Neoverse CSS V3是Arm首次针对Neoverse V系列CPU内核提供该IP的现成CSS版本。
Arm Neoverse CSS V3是基于新的Neoverse V3核心打造,是Arm目前单线程性能最高的Neoverse核心,并为Arm机密计算架构(CCA)提供硬件支持。与N3核心一样,V3也可提供业界领先的专用L2缓存大小,显著改善性能表现。
从性能上看,与CSS N2产品相比,Arm Neoverse CSS V3单芯片性能可提高50%,在单芯片上最多可扩展至128核,同时还支持最新的高速内存和I/O标准。在 数据分析工作负载方面,相较于V2,V3的性能提升了84%。不过至于功耗方面,Arm并未提及更多内容。
从内部结构看,Arm Neoverse CSS V3每个集群拥有64个核心,每个插槽最多有128个核心,支持PCIe Gen5、CXL 3.0甚至HBM3等现代功能。此外,据Arm透露,Socionext正在设计一款32核Neoverse CSS V3小芯片,将在台积电(TSMC)生产。
Dermot O’Driscoll表示,新产品全方位地实现了非常良好的提升,从视频处理到 SQL 数据库的性能均有所跃进。N系列在压缩方面取得了性能优势,可降低云服务运营商的成本,并最终降低云服务客户的成本,同样地V系列显著提高了协议缓冲区的性能,这是在数据中心内传输数据的一项关键功能。以下是基于Neoverse N系列和V系列打造的芯片在一些关键工作负载下的性能数据。
Arm指出,凭借两款全新的Neoverse CSS产品CSS N3和CSS V3,Arm专注于释放芯粒等新技术的潜力,并更大限度地优化实际工作负载的TCO,这对于整个生态系统至关重要,其中包括AI、数据库、网络等。
这次的发布会中,Arm还向业界披露了其下一代CSS V系列(代号:CSS Vega)和N系列(代号:CSS Ranger)平台的代号,其中,Dionysus将是下一个N系列核心,Adonis将是下一个V系列核心。而Lycius将是下一个Neoverse E系列核心。但Arm只是公布了下一代产品代号,并未介绍更多技术细节。
“随着越来越多的AI工作负载被采用,并贯穿于整个计算流程,涵盖从大型数据中心到网络、服务器以及计算基础设施的方方面面。Arm Neoverse V3和N3提供了支撑这一转型所需的计算性能和效率,而在Arm全面设计生态项目的支持下,我们的计算子系统能够加速产品上市时间,并加大对创新的投资力度。”Arm高级副总裁兼基础设施事业部总经理Mohamed Awad在会上表示。
此外,基于 Arm 全面设计生态伙伴的反馈意见,Arm 近期发布芯粒系统架构 (Chiplet System Architecture,CSA)。CSA 旨在定义一个功能强大、支持通用的芯粒生态系统,以提高多个供应商之间的组件(包括物理设计 IP、软 IP 等)复用率。
相关文章