Arm带来AI基础设施关键技术,新一代Neoverse CSS N3和CSS V

发布时间:2024-02-27  

近年来,随着第四次科技革命浪潮的驱动,领域不再局限于芯片、服务器或机架,而是牵系着整个数据中心,它正在转向更复杂的仓库级计算。如今全球正迈入一个新的阶段,即生成式人工智能(Gen)时代,认为2024年及未来,预计将出现大规模的创新应用。作为领域技术变革的基石,再次带来创新。

本文引用地址:

2024年2月22日,召开技术媒体沟通会,宣布推出两款基于全新第三代 IP构建的新的Arm® ™计算子系统 (CSS),主要包括Arm CSS V3以及Arm Neoverse CSS N3。

打造协同设计新模式,满足计算需求

Arm基础设施事业部产品解决方案副总裁Dermot O’Driscoll表示,从两个将推动未来基础设施发展的重要颠覆性趋势来看,人们希望对支持云计算关键工作负载的计算进行优化,以及头部企业正在打造定制芯片,并需要一种行之有效的方式来实现这一目标。而软件和硬件在过去分别由不同的公司负责开发,这样老旧的模式已经无法满足现在客户对性能的需求,也无法适配软件或硬件的复杂性。客户希望其部署的硬件,甚至是微架构层面,都能被优化,以便顺利运行其软件工作负载。此类联合优化很难实现,需要软硬件双方做出巨大的投入才能够完成。

在这样的背景下,Arm的合作式IP业务模式和计算子系统在其中可以发挥关键作用。据Dermot O’Driscoll表示,“通过与Arm的协作模式,合作伙伴可以在我们IP的开发过程中,在对应IP的典型系统上运行其工作负载。这种协作模式直接影响Arm架构的发展方向,以及我们在IP产品中实现微架构的方式。在交付IP之后,我们也将为合作伙伴提供贯穿整个芯片开发周期的支持。通过模拟和仿真,我们帮助他们评估由Arm提供的设计选择,并在开发与配置的全流程中提供支持,从而缩短产品上市进程。”

Dermot O’Driscoll认为,“我们与合作伙伴通力协作为定制计算开辟了一条独特路径,以满足当今计算基础设施的需求,这种协同设计并不局限于 CPU。为了深入优化TCO,就必须着眼于整个平台。而只有Arm能够在平台级别上调优内存和I/O,并添加自定义工作负载加速器。”

Arm于去年推出了Neoverse CSS,有助于更快地开发芯片或小芯片。在Neoverse CSS中,Arm负责配置、优化和验证一套完整的计算子系统,并针对基础设施市场的各种关键用例进行配置,使其合作伙伴能够专注于针对特定系统级工作负载塑造差异化竞争优势,比如软件调优、定制加速等。此外,客户还能从CSS中额外获得选购优势,他们能够加速产品上市时间、降低工程成本,同时还能够善用前沿的处理器技术。

值得一提的是,以Neoverse CSS为基础的Arm全面设计(Arm Total Design)生态项目也在去年下半年推出。Arm 基础设施事业部营销副总裁 Eddie Ramirez表示,Arm全面设计(Arm Total Design)生态项目在推出后四个月内,已经有20多家成员加入。其中包括新的EDA和配套IP提供商,以及来自包括韩国、中国台湾、中国大陆和印度等战略市场的芯片设计合作伙伴,这些市场存在巨大的发展潜力。Arm正在与三家主要代工厂合作,以确保其CSS产品能在其先进工艺节点上进行优化。

CSS定制芯片强力辅助,新一代Arm Neoverse技术功能深度优化

Arm发布的新一代Neoverse技术包括通过性能效率更优异的 N 系列新 IP 扩展Arm Neoverse CSS产品路线图,即Neoverse CSS N3;以及首次将计算子系统引入性能优先的V系列产品线,即新的Neoverse CSS V3。

01.Arm Neoverse CSS N3每瓦性能提高20%

本次Arm推出了N系列新的CSS产品——Neoverse CSS N3,新产品在N2的基础之上更新了许多功能。据Arm介绍,CSS N3是基于新的Neoverse N3 IP平台打造,为新的N系列产品引入了Armv9.2功能,能为每个核心提供2MB的专用L2缓存,并支持最新的PCIe和CXLI/O标准以及UCIe芯粒标准。

性能方面,与CSS N2相比,CSS N3每核心的每瓦性能可提高20%,单芯片可支持8到32核。此外,CSS N3的首个实例可提供 32 核,热设计功耗(TDP)低至40W,可扩展性非常强,可覆盖电信、网络和DPU等一系列应用。在 数据分析工作负载方面,通过有效的微架构调整,N3的性能提升高达 196%。

合作方面,Arm透露,智原科技正在构建基于芯粒的服务器芯片,该芯片将搭载64颗N系列核心,并基于英特尔代工服务的18A工艺节点进行生产制造。同时,ADTechnology将提供高性价比的16核CSS N系列边缘服务器平台,他们将与三星代工厂合作,为边缘计算释放更强大的算力。

02. Arm Neoverse CSS V3单芯片性能提高了 50%

Arm Neoverse CSS V3是Arm首次针对Neoverse V系列CPU内核提供该IP的现成CSS版本。

Arm Neoverse CSS V3是基于新的Neoverse V3核心打造,是Arm目前单线程性能最高的Neoverse核心,并为Arm机密计算架构(CCA)提供硬件支持。与N3核心一样,V3也可提供业界领先的专用L2缓存大小,显著改善性能表现。

从性能上看,与CSS N2产品相比,Arm Neoverse CSS V3单芯片性能可提高50%,在单芯片上最多可扩展至128核,同时还支持最新的高速内存和I/O标准。在 数据分析工作负载方面,相较于V2,V3的性能提升了84%。不过至于功耗方面,Arm并未提及更多内容。

从内部结构看,Arm Neoverse CSS V3每个集群拥有64个核心,每个插槽最多有128个核心,支持PCIe Gen5、CXL 3.0甚至HBM3等现代功能。此外,据Arm透露,Socionext正在设计一款32核Neoverse CSS V3小芯片,将在台积电(TSMC)生产。

Dermot O’Driscoll表示,新产品全方位地实现了非常良好的提升,从视频处理到 SQL 数据库的性能均有所跃进。N系列在压缩方面取得了性能优势,可降低云服务运营商的成本,并最终降低云服务客户的成本,同样地V系列显著提高了协议缓冲区的性能,这是在数据中心内传输数据的一项关键功能。以下是基于Neoverse N系列和V系列打造的芯片在一些关键工作负载下的性能数据。

Arm指出,凭借两款全新的Neoverse CSS产品CSS N3和CSS V3,Arm专注于释放芯粒等新技术的潜力,并更大限度地优化实际工作负载的TCO,这对于整个生态系统至关重要,其中包括AI、数据库、网络等。

这次的发布会中,Arm还向业界披露了其下一代CSS V系列(代号:CSS Vega)和N系列(代号:CSS Ranger)平台的代号,其中,Dionysus将是下一个N系列核心,Adonis将是下一个V系列核心。而Lycius将是下一个Neoverse E系列核心。但Arm只是公布了下一代产品代号,并未介绍更多技术细节。

“随着越来越多的AI工作负载被采用,并贯穿于整个计算流程,涵盖从大型数据中心到网络、服务器以及计算基础设施的方方面面。Arm Neoverse V3和N3提供了支撑这一转型所需的计算性能和效率,而在Arm全面设计生态项目的支持下,我们的计算子系统能够加速产品上市时间,并加大对创新的投资力度。”Arm高级副总裁兼基础设施事业部总经理Mohamed Awad在会上表示。

此外,基于 Arm 全面设计生态伙伴的反馈意见,Arm 近期发布芯粒系统架构 (Chiplet System Architecture,CSA)。CSA 旨在定义一个功能强大、支持通用的芯粒生态系统,以提高多个供应商之间的组件(包括物理设计 IP、软 IP 等)复用率。

文章来源于:电子产品世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    取代复杂繁琐的脚本编辑。 AWBlock详细介绍 https://z.zlg.cn/articleinfo?id=852971 5.4 UI 与业务有机结合 前端UI......
    UI 与业务有机结合   前端UI设计与后端系统业务的关联,是 HMI 软件开发最为头痛的的一个问题。软件耦合程度越深,后期需求变化和迭代的难度就越大。   为此,EsDA 提供......
    华为投资,国产PA第一股上市首日遭破发——全球及中国射频前端市场分析;2022年4月12日,有着国产PA(射频功率放大器)第一股之称的唯捷创芯正式在上市,却遭遇破发,最高跌幅超过50%,收盘......
    5G能让射频前端顺利“起飞”吗?; 尽管新冠肺炎疫情让5G在全球快速地进行规模化部署的进程受到了一定影响,但整体来看,疫情对5G商用的影响是短暂且有限的。相关数据显示,迄今为止,全球已有超过45家......
    科普 | 全面革新的5G射频前端;每一代通信移动技术的诞生,都会引发相关产业的重大变革。5G的高速率、大连接和低时延等特性,给射频前端设计带来了巨大的挑战,复杂度成倍增加。 一款优秀的5G射频前端......
    射频前端市场大变局;当前,苹果正在发力基带芯片业务,如今的iPhone12上,虽然搭载的还是高通基带芯片,但高通也意识到,自己的基带迟早会被苹果换下来。所以......
    5G芯片之王全面革新,射频前端模组化大势所趋;每一代通信移动技术的诞生,都会引发相关产业的重大变革。3G让世界跨入移动互联时代,4G使得移动互联网全面爆发并成熟,而5G,则是......
    示波器前面板上的校准参考信号来补偿探头。2. 始终尝试使用可最大程度地减小环路电感的前端,较小的弹簧接地线或使用同轴连接DUT,将减少振铃失真,并将探测带宽扩展到最高频率。3. 始终尝试使用同轴与DUT连接,以减......
    示波器前面板上的校准参考信号来补偿探头。 2、始终尝试使用可最大程度地减小环路电感的前端,较小的弹簧接地线或使用同轴连接DUT,将减少振铃失真,并将探测带宽扩展到最高频率。 3、始终尝试使用同轴与DUT连接,以减......
    猛发展也为射频滤波器提供了新的市场机遇。 国产手机崛起 射频滤波器机遇仍在 近几年,在国家产业政策和市场环境的共同推动下,射频前端领域自主可控不断加速,涌现出了多家国产射频滤波器企业,然而受疫情反复、大国博弈、全球经济增速放缓、终端......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>