首页
Arm Neoverse 新动态助推基础设施AI应用表现

Arm Neoverse 新动态助推基础设施AI应用表现

发布时间:2024-03-11

随着人工智能 () 渗透到教育、就业、制造、医疗和交通等领域，正在改变经济发展和的日常生活，构建了全球应用最为普及的 CPU 架构，在多个领域的技术革新中发挥主导作用，影响了世界各地人们的日常生活。技术的光明前景让算力资源开始逐渐向AI应用需求倾斜，甚至在最近一两年新配置的算力中如果没有更好的AI应用支持，可能会很快被市场所淘汰。高级副总裁兼事业部总经理 Mohamed Awad直言，Arm 是这一切变革的基石。

本文引用地址：

众多国际知名的大型科技企业正基于 Arm 平台构建新一代系统和。谈到Arm 为何能在基础设施领域收获累累硕果？Mohamed Awad总结了三大原因：首先是卓越性能，Arm的工程团队坚持不懈地实现迭代提升；其次是灵活性，Arm赋能技术合作伙伴定制芯片，以支持其专用的工作负载和系统，而非采用一体适用的方案；最后是生态系统，Arm在软件、 IP 和芯片生态系统中提供出色性能和灵活性，从而降低配置的总成本并加速产品上市。Arm独特的定位，皆因结合这些优势，帮助合作伙伴随时随地以任何方式进行部署。Arm 计算子系统 (CSS) 将这些优势演绎得淋漓尽致。而Arm 全面设计 (Arm Total Design) 生态项目便是以此为基础，提供了一个生态系统，参与其中的合作伙伴均致力于无缝交付基于 CSS 的定制芯片。

针对这样的市场需求，Arm近期推出的两款全新 CSS 产品均基于全新的第三代 IP 构建，通过全新的平台和计算子系统，Arm扩展了 N 系列的CSS产品路线图，推出Neoverse CSS N3，使每瓦性能更上一层楼。与此同时，Arm也针对性能优先的 V 系列平台推出新一代产品，并首次将计算子系统引入该产品线，推出Neoverse CSS V3。凭借新的 CSS N3 和 CSS V3，Arm专注于释放芯粒（Chiplet）等新技术的潜力，并更大限度地优化实际工作负载的总体拥有成本 (TCO)，这对于整个生态系统至关重要，其中包括 AI、数据库、网络等。

图片.png

谈到新推出的Neoverse CSS N3，Arm 基础设施事业部产品解决方案副总裁 Dermot O’Driscoll突出强调的就是能效。CSS N3 与 CSS N2 相比，其每核心的每瓦性能提升 20%。Arm对 CSS N3 进行了调优，以填补Arm发现的市场空缺，提供满足基础设施性能要求的高效计算。

CSS N3 的首个实例可提供 32 核，热设计功耗 (TDP) 低至 40W。其可扩展性非常强，可覆盖电信、网络和 DPU 等一系列应用。Arm也同时考虑横向扩展云配置。CSS N3 基于新的 Neoverse N3 IP 平台打造，为新的 N 系列产品引入了 Armv9.2 功能，能为每个核心提供 2MB 的专用 L2 缓存，并支持最新的 PCIe 和 CXL I/O 标准以及 UCIe 芯粒标准。

有些客户希望在保有 CSS 所有优势的同时，实现更高的性能。因此，Arm还将 CSS 项目扩展到V 系列核心，推出了 Neoverse CSS V3。与 CSS N2 产品相比，CSS V3 的单芯片性能提高了 50%。CSS V3 在单芯片上最多可扩展至 128 核，并支持最新的高速内存和 I/O 标准。CSS V3 基于Arm新的 Neoverse V3 核心打造，是 Arm 目前单线程性能最高的 Neoverse 核心。V3 为 Arm 机密计算架构 (CCA) 提供硬件支持。V3 和 N3 核心均可提供业界领先的专用 L2 缓存大小，显著改善性能表现。

图片.png

谈到新 CPU 核心的性能提升，Dermot O’Driscoll展示了新产品全方位的表现提升，从视频处理到 SQL 数据库的性能均有所跃进。如今，人们常常忽视的一点是，有多少计算周期最终被用于压缩和协议转换等后台任务。N 系列在压缩方面取得了性能优势，可降低云服务运营商的成本，并最终降低云服务客户的成本。同样地，V 系列显著提高了协议缓冲区的性能，这是在数据中心内传输数据的一项关键功能。

AI是基础设施不可避免的话题，Dermot O’Driscoll认为，2023年有关 AI 的讨论焦点主要集中在生成式 AI 和大语言模型 (LLM) 上。目前行业重点更多放在训练 LLM 上，但随着生成式 AI 广泛应用于实际业务场景，其工作重点将转向推理。有些分析师估计，已部署的 AI 服务器中有高达 80% 专用于推理，且这一数字还将持续攀升。这一转变意味着要找到合适的模型和模型配置，并加以训练，然后将其部署到更具成本效益的计算基础设施上。吞吐量是其中一部分考虑因素，而在当今广泛部署的基于 Arm 架构的芯片上，Token 生成吞吐量表现相当优异。但还有许多其他因素需要纳入考量。CPU 广泛可用，并可灵活用于 ML 或其他工作负载，此外，CPU 还易于部署，并可支持各种软件框架，具备低成本和高能效等优势。因此，CPU 推理将是生成式 AI 计算应用的关键组成。Arm可以看到，这些工作负载已从 ML 专用的 Neoverse 功能（如 Bfloat16、MatMul、SVE 和 SVE2），以及Arm的微架构优化中受益，而且这一趋势还将继续。

图片.png

但显然，并非所有 AI 处理都将在 CPU 上进行。打造 AI 加速器的公司非常多。据最近统计，这一领域的公司已接近 80 家。每家公司都想取得 NVIDIA 那样的成绩，而 NVIDIA 不仅利用其领先的 Hopper GPU，同时也使用了基于 Neoverse V2 平台的紧耦合计算芯粒 Grace。NVIDIA Grace Hopper 的一大关键创新在于内存容量和共享内存模式。这种紧耦合的 CPU 加上加速器配置，对大参数 LLM 非常有益，对检索-增强-生成 (RAG) 等新兴方法也很有帮助。Neoverse CSS 是专为帮助客户在基于Arm领先的 CPU 平台上，快速打造通用计算芯粒而推出的产品。它能提供客户所需的所有接口，以便选择耦合自身的加速器。这种方法既可以在需要 CPU 时提供 CPU，又可以在需要 AI 加速器时提供 AI 加速器，做到两全其美。

越来越多的 AI 工作负载被采用，并贯穿于整个计算流程，涵盖从大型数据中心到网络、服务器以及计算基础设施的方方面面。Arm 此次推出的Neoverse V3 和 N3 可以提供支撑这一转型所需的计算性能和效率，而在 Arm 全面设计生态项目的支持下，Arm的计算子系统能够加速产品上市时间，并加大对创新的投资力度。Neoverse 只是 Arm 为各个行业市场提供经 AI 优化的计算平台的一个例子。Arm 的独特之处在于其背靠庞大的生态系统，始终坚定不移地推动技术创新，为合作伙伴赋予了灵活的创新空间，为未来计算及 AI 起到基石作用。

文章来源于:电子产品世界原文链接

本站所有转载文章系出于传递更多信息之目的，且明确注明来源，不希望被转载的媒体或个人可与我们联系，我们将立即进行删除处理。

机器人标定技术的分类及三个步骤(2023-09-15)

是机器人运动学标定技术的关键其描述了机器人末端理论和真实位姿误差与运动学参数微分变化之间的关系类似运动学模型，误差模型的选取也是在精度和复杂度之间权衡。因此，应该根据实际的应用情况，适时地选用最合理的建模方式。一般而言，机器人末端误差模型的选取和机器人运动学模型......

自动驾驶仿真科普文之传感器建模知识(2023-05-19)

成本压力下，仿真团队显然不可能对激光雷达做10个、20个版本的建模吧？另一方面，又很难用一个通用的模型去将各种不同款式的传感器表达出来。模型的精度、效率和通用性是一个“不可能三角”的关系，你可......

自动驾驶仿真科普文之二：传感器的仿真究竟难在哪？(2022-12-19)

Tier 1仿真工程师说： “深度学习算法识别物体是一个从真实世界的传感器数据收集到信号去噪的过程，相比之下，传感器建模则是要在理想的物理模型的基础上合理地加入噪声，而其......

用STM32Cube.AI部署ONNX模型实操示例：风扇堵塞检测(2024-09-20)

创建的数据。该数据集的一部分（训练数据集）将用于训练模型，另一部分（测试数据集）稍后将用于评估所构建模型的性能。机器学习的数据集中的典型比率为：训练数据集占80%，测试数据集占20......

用MATLAB来做智能小车的建模与仿真案例(2023-07-27)

每个轮子都有电机，当然你可以说成为轮毂电机驱动。这种通常称为Tank-like Model. 通过在分析控制问题的时候，第一步就是需要对被控对象进行数学模型的建立。这里我们不强调模型的复杂性，因为......

台积电已在12英寸晶圆厂上花费了大约1350亿美元(2023-04-10)

台积电已在12英寸晶圆厂上花费了大约1350亿美元; 【导读】多年来，该机构发布跟踪全球所有 12英寸晶圆厂的数据库。他们检查战略成本和价格模型的建模结果，其中一种方法是将台积电12英寸晶圆厂的建模......

是德科技推出全新器件建模软件，助力实现一站式工作流程(2022-08-31)

是德科技推出全新器件建模软件，助力实现一站式工作流程;是德科技公司日前发布了一个全新的建模（MG）环境。该环境可提高整个工作流程的自动化程度，进而提升半导体器件建模工程师的工作效率。是德......

永磁同步电机控制系统仿真—控制器模型的整体结构(2024-08-30)

PWM比较器产生控制器模型触发信号整个系统仿真模型建模完成后，点击Simulink的左侧模型的图标，选择Colors，查看Simulink模型中不同模块的仿真速率。如下图所示，其中......

多速率仿真、同步和异步、永磁同步电机控制器模型概述(2024-08-23)

触发信号整个系统仿真模型建模完成后，点击Simulink的左侧模型的图标，选择Colors，查看Simulink模型中不同模块的仿真速率。如下图所示，其中红色表示仿真步长为0.1µs。粉红......

基于类别图增强算法的融合异构数据会话推荐分析(2023-08-24)

考虑物品与类别因素可以判断出用户的实际意图。根据文献[1]报道可以发现，以图神经网络构建会话序列模型的时候，如果只针对单一物品结构进行建模，即只根据物品ID 序号构建模型时，将会造成部分概念层数据丢失的结果。当会......

平台入驻

我们与500+贴片厂合作，完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页，多渠道推广，SEM/SEO精准营销以及与公众号的联合推广...详细>>

原厂代理商合作

利用葫芦芯平台的卓越技术服务和新产品推广能力，原厂代理能轻松打入消费物联网（IOT）、信息与通信（ICT）、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

闲置物料合作

充分利用其强大的电子元器件采购流量，创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术，不仅可以助你轻松识别与连接到需求方，更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

生态合作

我们的目标很明确：构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前，我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

加工与定制类服务商合作

我们深知加工与定制类服务商的价值和重要性，因此，我们倾力为您提供最顶尖的营销资源。在我们的平台上，您可以直接接触到100万的研发工程师和采购工程师，以及10万的活跃客户群体...详细>>

线上代理合作

凭借我们强大的专业流量和尖端的互联网数字营销技术，我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品，都可以通过我们的平台迅速传达给目标客户...详细>>

邮件营销及广告服务

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环，从引流、宣传到最终销售，全程跟进，确保每一个potential lead都得到妥善处理，从而大幅提高转化率。不仅如此...详细>>