Arm Neoverse S3 是 Arm 专门面向基础设施的第三代系统 IP,应用范围涵盖高性能计算 (HPC)、机器学习 (ML)、边缘和显示处理单元,是新一代基础设施系统级芯片 (SoC) 的理想技术根基。Neoverse S3 设计实现了芯粒 (Chiplet) 与机密计算 (Confidential Compute) 等关键创新,为合作伙伴提供了支持 UCIe、DDR5、CXL 3.1 和 PCIe Gen5/Gen6 等行业标准的现成功能。Neoverse S3 提供了一整套系统 IP,能够实现高度可组合性、更高的 IO 吞吐量和增强的安全特性。其主要特性包括:
支持设备分配机密计算的 Arm 机密领域管理扩展 (Realm Management Extension, RME) 功能,并且符合行业标准 DPE,进行“使用中”的数据保护。
支持 PCIe Gen6、CXL 3.1、DDR5 和 HBM3 的 IO 与内存系统。
通过基于 UCIe 的 AMBA CHI C2C 的标准化芯粒接口,搭配定制的芯粒开发工具包,可与 Arm CPU 配合使用。
实现机密计算
安全性是涉及各类 IP 的 SoC 系统级问题。多年来,加密技术广泛应用于数据的安全存储和传输,也就是用来保护“静态”或“传输中”的数据。目前基于硬件的安全性改进着重于保护“使用中”的内存数据。“机密计算”是一个表示加密内存中数据的行业术语。Armv9 架构使用硬件技术 RME 来为 Arm 机密计算架构 (CCA) 提供支持。Neoverse S3 率先支持 RME,使得 Arm Neoverse V3 核心能够支持完全加密的云虚拟机。
通过 PCIe 和 CXL 挂载的网卡或加速器等 IO 外设设备会引入一些潜在的安全威胁。Neoverse S3 系统 IP 可确保外部连接的设备在不影响应用的性能的同时,仅能访问授权的内存。这是通过“设备分配”技术而实现的,该技术允许外设通过直接内存访问 (DMA) 将数据传输到加密内存中。除了安全优势之外,该技术还让连接设备可以绕过庞杂的软件层直接共享数据,大大增强 I/O 性能。
这种将高效通用计算与高性能加速器结合起来的能力,是新推出的 Arm Neoverse 计算子系统 (CSS) —— Neoverse CSS V3 和 Neoverse CSS N3 的核心。CSS 产品旨在帮助 Arm 合作伙伴通过前所未有的方式,以更低的成本,更迅速、高效地向市场提供针对工作负载优化的定制芯片。Microsoft Azure Cobalt 100 便是基于 Neoverse CSS 的软硬件共同开发的成果。这些 CSS 产品展示了基于 Arm Neoverse 解决方案的未来,与 Arm 相关的整个行业和生态系统正致力于打造成本更低、复用性更强的基于 Arm 架构的芯粒。如果没有 Neoverse S3 系统 IP 这个“无名英雄”打下的基础,这一切都将无法实现。
为行业标准和芯粒提供支持
PCIe Gen5/Gen6、CXL 3.1、UCIe 和 DDR5 等行业标准是基础设施级 SoC 的关键。但正确实现这些标准并非易事。为支持这些标准,Arm Neoverse S3 完成了许多复杂的工作,并与请求方和物理层 (PHY) 等关键第三方 IP 进行了互操作性测试。Neoverse 为我们的合作伙伴提供了符合这些行业标准的现成功能,使其能够更专注于打造差异化、定制化的产品。
先进工艺的成本不断飙升,但并不是所有的芯片设计都能一样地进行扩展。换言之,只有特定的系统组件(例如 CPU 核心)可以有效地利用工艺进步的成果。芯粒技术能够将 SoC 分解到系统级封装 (SoaP) 中,以便更经济地采用不同工艺节点来构建系统。SoaP 支持以模块化方式打造解决方案,从而将芯粒开发的成本分摊到不同解决方案中。
不过,这种模块化设计不能增加架构和软件设计的复杂性。Arm Neoverse 解决方案下的芯粒采用标准化接口并带有预定义芯粒配置,这样 Arm Neoverse 生态系统中的每个芯粒供应商都能够构建兼容 Neoverse CSS 的芯粒。这些芯粒标准包括:
AMBA CHI C2C 涵盖了 SoaP 不同子系统通信的应用层和链路层协议。
Arm 芯粒系统架构 (Arm Chiplet System Architecture) 涵盖了定义地址转换、中断处理、系统管理和安全的架构合规性标准。
Arm 基础系统架构 (Arm Base System Architecture) 涵盖了对软件提供标准支持的硬件需求。
为了进一步推广 AMBA CHI C2C 和芯粒的普及,Arm 提供了基于 Neoverse S3 设计的芯粒设计套件。该设计套件为 IO 一致性和完全一致性加速,或分解式芯粒奠定了基础。
Neoverse CSS 和定制芯片的基础
图:Arm Neoverse 系统中 Neoverse S3 设计示意图,其中包括 CMN S3、MMU S3 和 NOC S3
Neoverse S3 系统 IP 由 Neoverse CMN S3、Neoverse MMU S3 和 Neoverse NOC S3 所组成,这三者共同构成了一个成熟可靠的强大平台,帮助合作伙伴构建其 SoC。
CMN S3 建立在 CMN-700 IP 基础之上,为性能更高、数据需求量更大的 Neoverse 核心提供一致性的支持。CMN S3 专为全新的芯粒技术而构建,支持机密计算,同时提高了性能和可扩展性,而这恰巧是实现互连的关键所在。
CMN S3 能够安全且高性能(高带宽、低延迟)地连接核心和加速器芯粒,这对于开发高能效、高性价并针对工作负载优化的 SoC 至关重要。领先的云服务提供商都利用数据处理单元 (DPU) 从主机 CPU 卸载安全、存储和网络功能。它们还会部署和开发 GPU、NPU 和 TPU,以加速现代云软件中的人工智能 (AI) 和 ML 功能。与此同时,电信提供商也在 5G RAN 和边缘基础设施中部署包括 CPU 和加速器的异构 SoC。
内存管理单元 MMU S3 建立在行业标准化的 MMU-700 IP 基础之上,可为片上、芯粒和插入式卡提供高性能,机密计算支持,并支持 PCIeG6 与 CXL3.1的 IO MMU 功能。
片上网络 NOC S3 是基于 NI-700 构建的新型非一致性互连技术,专为 IO 一致性加速器芯粒而打造,能够帮助合作伙伴如之前基于片上 AMBA 的设计一样,轻松简便地构建高性能的分解式 SoC。
Neoverse S3 是我们的第三代 Neoverse 系统 IP,同时也是 Neoverse CSS V3 和 Neoverse CSS N3 的基础,可以为构建从云服务到边缘 DPU 的高水平基础设施 SoC 提供所需的基本功能,该平台不仅符合关键的行业标准,并且成为了行业标杆。Neoverse S3 将提供现成的机密计算和芯粒功能,助力合作伙伴实现新一代创新的定制芯片。
作者:Arm 基础设施事业部高级产品经理 Mohit Taneja