Supermicro 扩展人工智能和 GPU 机架规模解决方案

发布时间:

来源: 电子创新网

Supermicro 支持 AMD Instinct MI300 系列加速器，从而扩展人工智能和 GPU 机架规模解决方案

由 AMD Instinct™ MI300X 加速器提供支持的全新 8-GPU 系统现已推出，具备突破性的人工智能和 HPC 性能，可用于大规模人工智能培训和 LLM 部署

Supermicro, Inc.（纳斯达克股票代码：SMCI）是一家为人工智能、云技术、存储和 5G/边缘提供全面 IT 解决方案的制造商，宣布推出三款基于 AMD 的全新 H13 代 GPU 服务器产品，这些经过优化的服务器，具备先进性能且高效，并由全新的 AMD Instinct MI300 系列加速器提供支持。Supermicro 强大的机架规模解决方案配置 8-GPU 服务器和 AMD Instinct MI300X OAM，是大型模型训练的理想选择。

Supermicro 支持 AMD Instinct MI300 系列加速器，从而扩展人工智能和 GPU 机架规模解决方案

现提供配备 AMD Instinct MI300A 加速处理单元 (APU) 加速器的新型 2U 液冷和 4U 风冷服务器，可提高数据中心效率，并为人工智能、LLM 和 HPC 领域快速增长的复杂需求提供动力。新系统包含四个用于可扩展应用程序的 APU。Supermicro 可以为大规模环境提供完整的液冷机架，每个机架的 FP64 性能高达 1,728 TFlops。Supermicro 在全球拥有制造工厂，简化了新服务器的交付流程，以实现人工智能和 HPC 的融合。

Supermicro 总裁兼首席执行官 Charles Liang 表示："我们非常高兴能够利用最新一代 AMD Instinct 加速器扩展我们用于人工智能培训的机架规模全面 IT 解决方案，与前几代产品相比，性能提升高达 3.4 倍。我们全球制造工厂每月可供应 4,000 个液冷机架，因此可以凭借 AMD Instinct MI300X 加速器或 AMD Instinct MI300A APU 提供最新的 H13 GPU 解决方案。我们的架构久经考验，能够为每个 GPU 提供 1:1 的 400G 网络，这些 GPU 专为大规模人工智能和超级计算集群设计，能够完全集成液冷解决方案，为客户提供兼备性能效率的竞争优势，并且易于部署。"

了解更多有关配备 AMD 加速器的 Supermicro 服务器信息

LLM 优化的 AS – 8125GS-TNMR2 系统基于 Supermicro 的构建块架构，是一种经验证的设计，可用于以风冷和液冷机架规模设计的高性能人工智能系统。平衡的系统设计将 GPU 与 1:1 网络相关联，从而形成跨节点和机架的大型高带宽内存池，以适应当今最大的语言模型，参数高达数万亿，最大限度地提高并行计算并最大限度地减少训练时间和推理延迟。配备 MI300X OAM 加速器的 8U 系统借助 AMD Infinity Fabric™Links 提供 8-GPU 的原始加速能力，可在开放标准平台上可实现高达 896GB/s 的峰值理论 P2P I/O 带宽，且在单个系统中具有 1.5TB 的 HBM3 GPU 内存，在业界遥遥领先，还支持原生稀疏矩阵，旨在节省功耗、降低计算周期并减少人工智能工作负载的内存使用。各服务器采用双插槽 AMD EPYC™9004 系列处理器，最高可达 256 核。在机架规模上，超过 1000 个内核的 CPU、24TB 的 DDR5 内存、6.144TB 的 HBM3 内存以及 9728 个计算单元可用于最复杂的人工智能环境。Supermicro 在 8U 配置方面拥有丰富经验，并使用 OCP 加速器模块 (OAM)，相较于定制设计，可更快将配置完整的服务器推向市场，从而降低成本和减少交付时间。

Supermicro 还推出了一款密度优化的 2U 液冷服务器 AS –2145GH-TNMR，以及一款 4U 风冷服务器 AS –4145GH-TNMR，每台服务器均配备 4 个 AMD Instinct™MI300A 加速器。新服务器专为 HPC 和人工智能应用设计，需要快速的 CPU - GPU 通信。通过在单个芯片上结合高性能的 AMD CPU、GPU 和 HBM3 内存，APU 消除了冗余内存副本。各服务器均配备用于应用程序扩展的先进 x86"Zen4"CPU 内核。此外，各服务器包括的 HBM3 内存高达 512GB。在一个由 21 个 2U 系统组成的全机架 (48U) 解决方案中，HBM3 可用内存达 10TB 以上，还配备 19,152 个计算单元。从 HBM3 到 CPU 的内存带宽为 5.3 TB/s。

这两个系统都具有支持 400G 以太网的双 AIOM 和网络扩展选项，旨在提升高性能计算空间、可扩展性和效率。2U 直接芯片液冷系统提供了出色的总体拥有成本 (TCO)，在 21 个 2U 系统机架解决方案的基础上，每个机架产生 61,780 瓦能量，而不是 95,256 瓦风冷机架，节能 35% 以上，并且与风冷系统相比，风扇数量减少 70%。

AMD 执行副总裁兼数据中心解决方案事业部总经理 Forrest Norrod 表示："AMD Instinct MI300 系列加速器在长期加速高性能计算应用和发展迅速的生成式人工智能需求方面都具有领先的性能。我们将继续与 Supermicro 密切合作，以 MI300 系列加速器为基础，利用 Supermicro 在系统和数据中心设计的专业知识，推动领先的人工智能和 HPC 全面解决方案上市。"

向 Supermicro 和 AMD 专家了解更多信息。观看网络研讨会直播或点播。

欲了解更多信息，请访问：

Supermicro AMD 加速器网站

AS -8125GS-TNMR2 (8U w/ MI300x)

AS -2145GH-TNMR (2U LC w/ MI300A)

AS -4145GH-TNMR (4U AC w/ MI300A)

关于 Super Micro Computer, Inc.

Supermicro（纳斯达克股票代码：SMCI）是应用优化整体 IT 解决方案的全球领军企业。Supermicro成立于加州圣何塞并在该地运营，致力于为企业、云计算、人工智能和 5G 电信/边缘 IT 基础设施提供率先面市的创新。我们是服务器、人工智能、存储、物联网、交换机系统、软件和支持服务的整体 IT 解决方案制造商。Supermicro 的主板、电源和机箱设计专业知识，更进一步推动了我们的研发和生产，为我们的全球客户提供了从云端到边缘的下一代创新技术。我们的产品均在公司内部（包括美国、亚洲和荷兰）完成设计和制造，通过全球运营实现规模和效益，从而优化总体拥有成本 (TCO)，并能够（通过绿色计算）减少对环境的影响。获奖无数的 Server Building Block Solutions® 通过我们灵活可重复使用的构建块，为客户提供了丰富的可选系统产品系列，用于优化其确切的工作负载和应用。这些构建块支持全系列外形规格、处理器、内存、GPU、存储、网络、电源和冷却解决方案（空调、自然空气冷却或液体冷却）。

稿源：美通社

文章来源于: 电子创新网原文链接

本站所有转载文章系出于传递更多信息之目的，且明确注明来源，不希望被转载的媒体或个人可与我们联系，我们将立即进行删除处理。