在过去五年多里,Arm在云到边缘基础设施产品推出方面可谓一路狂奔。从2018年10月发布Neoverse初步路线图,随后Neoverse分化出V、N、E三大平台产品,到去年还衍生出Arm Neoverse计算子系统(CSS),且在CSS基础上推出Arm全面设计生态项目。2024年2月下旬,Arm 更新Neoverse路线图,产品组合进一步壮大。
近日,Arm基础设施事业部发言人向《国际电子商情》在内的媒体,介绍了Arm最新发布的Neoverse CSS V3、CSS N3,同时他们还分享了Arm全面设计的最新成果。
Arm Neoverse CSS新品纷至沓来
自去年8月,Arm发布Neoverse CSS之后,迄今,CSS已经被引入Arm Neoverse N系列和V系列产品组合。
首先是,基于Neoverse N平台推出了CSS N2,这是第一代Neoverse CSS产品,旨在加快芯片生产时间、提供世界级效能,并将尖端技术导入Arm生态系统。
CSS N2一口气“打包”了大量的IP,包括了软件和硬件的IP——CSS N2将多达64 个Neoverse N2核心,以及DDR5内存和PCIe Gen5/CXL IO囊括到一个效能和功耗优化的子系统中。根据CSS N2合作伙伴指出,CSS N2 助其从设计概念到落实(在超过 100 个核心的系统上启动 Linux)只花了13个月,还帮助另一家合作伙伴每年节省80位工程师的工作时间,并且可以将设计资源集中于开发专用芯片。
CSS N2的优异表现让Arm大受鼓舞,紧接着在2024年2月下旬,Arm基于Neoverse计算子系统又发布了CSS V3和CSS N3两款新品,新品在性能上比CSS N2有更大的提升。
·CSS N3:每瓦性能比CSS N2提升20%
CSS N3是N系列Neoverse CSS产品组合的第二款,其同系列的前一代为CSS N2,CSS N3的每瓦性能比上一代提升20%。Arm Neoverse N3 平台由Arm验证及优化,可协助缩短上市时程,并降低成本及风险,该平台产品以 5G、企业连网及基础设施边缘使用场景为目标。
据Arm基础设施事业部产品解决方案副总裁Dermot O’Driscoll介绍,CSS N3的首个实例可提供32核,热设计功耗(TDP)低至40W。其可扩展性非常强,可覆盖电信、网络和DPU等一系列应用。同时,Arm也在考虑将其横向扩展云配置。
另外,由于CSS N3基于新的Neoverse N3 IP平台打造,为新的N系列引入了Armv9.2功能,能为每个核心提供2MB的专用L2缓存,并支持最新的PCIe和CXL I/O标准及UCIe芯粒标准。
·CSS V3:单芯片性能比CSS N2提高50%
针对客户更高性能的需求,Arm还将CSS项目扩展到V系列核心,推出了Neoverse CSS V3。CSS V3基于Neoverse V3核心打造,是Arm目前单线程性能最高的Neoverse 核心,基于V3核心的产品适用于云端、高效能运算及人工智能/机器学习工作负载。与前一代的CSS N2产品相比,CSS V3的单芯片性能提高了50%——CSS V3在单芯片上最多可扩展至128核,并支持最新的高速内存和I/O标准。
Arm高级副总裁兼基础设施事业部总经理Mohamed Awad评价说,凭借新的 CSS N3和CSS V3,Arm专注于释放芯粒等新技术的潜力,并更大限度地优化实际工作负载的TCO(总拥有成本),这对于整个生态系统包括AI、数据库、网络等都至关重要。
CSS代表着Arm向客户交付产品的方式不仅限于产品,也延伸到了软硬件生态系统。值得注意的是,Arm的E系列也在保持不断迭代更新,采用了新的CPU和新的 Neoverse S3系统 IP。
AI时代,定制芯片模式盛行
Dermot O’Driscoll列举了两个将推动未来基础设施发展的重要颠覆性趋势——首先,企业希望对支持云计算关键工作负载的计算进行优化;其次,头部企业正在打造定制芯片,并需要一种行之有效的方式来实现这一目标。他指出,借助Arm的合作式IP业务模式和计算子系统,Arm能为这些企业提供技术选用和选购的灵活性,助其同时实现这两个目标。
在他看来,AI应用需求大增的背景下,基础设施也正在发生变革。“头部云计算和网络企业对其数据中心、计算设备及运行其中的工作负载非常熟悉,他们高度专注于优化其基础设施的每一层,目的是让这些多样化的工作负载获得最佳性能,更重要的是获得最佳的每瓦性能。但没有一个基准测试能展现所有工作负载的性能表现,这带来了深入了解每个用例的必要性,并需要有针对性地对其进行调优。”
在过去,软件和硬件分别由不同的公司负责开发,而这样老旧的模式已经无法满足现在客户对性能的需求,也无法适配软件或硬件的复杂性。客户希望其部署的硬件,甚至是微架构层面,都能被优化,以便顺利运行其软件工作负载。此类联合优化需要软硬件双方做出巨大的投入才能够完成。
通过与Arm的协作模式,合作伙伴可以在IP的开发过程中,在对应IP的典型系统上运行其工作负载。这种协作模式直接影响Arm架构的发展方向,以及Arm在IP产品中实现微架构的方式。在交付IP之后,Arm也将为合作伙伴提供贯穿整个芯片开发周期的支持。通过模拟和仿真,帮助客户评估由Arm提供的设计选择,并在开发与配置的全流程中提供支持,从而缩短产品上市进程。
Arm与合作伙伴建立了更深层的合作关系,双方通力协作为定制计算开辟了一条独特路径,以满足当今计算基础设施的需求。当然,这种协同设计并不局限于CPU。“为了深入优化TCO,就必须着眼于整个平台。Arm能够在平台级别上调优内存和I/O,并添加自定义工作负载加速器。”
因此,Arm在去年8月推出了Neoverse CSS,它使得定制芯片变得更迅速,且更易实现。在 Neoverse CSS中,Arm负责配置、优化和验证一套完整的计算子系统,并针对基础设施市场的各种关键用例进行配置,从而让合作伙伴能够专注于,针对特定系统级工作负载塑造差异化竞争优势,比如软件调优、定制加速等。
此外,客户还能从CSS中额外获得选购优势,加速他们的产品上市时间、降低工程成本,同时还能够善用前沿的处理器技术。“我们创建CSS项目,是为了让客户能够像管理他们的软件和系统栈一样地管理芯片栈。”Dermot O’Driscoll强调说。
Arm全面设计生态项目动态
在Neoverse CSS的基础上,去年10月Arm宣布推出“Arm全面设计”生态项目,短短四个多月来,Arm 全面设计生态项目已吸引超过20家成员加入。并在三家领先的代工厂进行系统级芯片和芯粒设计
Arm全面设计汇集了ASIC设计公司、IP 供应商、EDA 工具提供商、代工厂和固件开发者等行业领先企业,以加快并简化基于 Neoverse CSS 的系统开发。Arm 全面设计生态项目的合作伙伴将可优先取用Neoverse CSS,从而为各方实现创新和加速上市时间,并降低打造定制芯片的成本和难度。
新加入的成员包括EDA和配套IP提供商,以及来自包括韩国、中国台湾、中国大陆和印度等战略市场的芯片设计合作伙伴。目前,Arm正在与三家主要代工厂合作,以确保CSS产品能在其先进工艺节点上进行优化。
去年10月,Socionext成为首家宣布计划在台积公司领先的2纳米工艺上开发基于CSS芯粒的合作伙伴。这款配置32核的芯粒可与其他芯粒结合使用,提供可扩展且经济高效的计算解决方案。该设计将基于Neoverse CSS V3打造。
同时,智原科技也在构建基于芯粒的服务器芯片,该芯片将搭载64颗N系列核心,并基于英特尔代工服务的18A工艺节点进行生产制造。
此外,ADTechnology将提供高性价比的16核CSS N系列边缘服务器平台,他们将与三星代工厂合作。
除了以上三家合作伙伴的例子之外,Arm全面设计生态项目在中国市场的首家合作伙伴是云豹智能。据悉,云豹智能为云计算和数据中心提供DPU和解决方案。Arm 全面设计正帮助云豹智能将业务拓展到其他领域,并有助于其开发其他类型的基础设施SoC。
如果说Arm Neoverse CSS是着重帮助合作伙伴在构建芯片时,进一步简化流程,进而加速产品上市时间。那么Arm全面设计的重要意义在于:许多不同的生态系统合作伙伴共同投资于Neoverse CSS,使得设计能够更轻松推向市场,并且方便在Arm Neoverse CSS上取用到先进技术,进而加速自己的产品上市时间,降低构建新芯片的成本。帮助合作伙伴将构建芯片的投资重点放在创新上。