近日,Linux 基金会宣布,包括AMD、Arista、Broadcom、Cisco、Eviden(Atos 旗下公司)、HPE、Intel、Meta和Microsoft等企业作为创始成员的超以太网联盟((Ultra Ethernet Consortium,UEC) 正式成立。UEC将提供基于以太网的开放、可互操作、高性能的全通信堆栈架构,以满足大规模人工智能和高性能计算不断增长的网络需求。
人工智能 (AI) 和高性能计算 (HPC) 工作负载正在快速发展,需要一流的功能、性能、互操作性和总体拥有成本,同时又不牺牲开发人员和最终用户的友好性。超以太网解决方案堆栈将利用以太网的普遍性和灵活性来处理各种工作负载,同时具有可扩展性和成本效益。
图片来源:Linux 基金会
“这并不是要彻底改革以太网,”超以太网联盟主席 J Metz 博士说。“这是关于调整以太网以提高具有特定性能要求的工作负载的效率。我们正在研究每一层——从物理层一直到软件层——以找到大规模提高效率和性能的最佳方法。”
该联盟的技术目标是开发规范、API 和源代码来定义:
- 以太网通信的协议、电信号和光信号特征、应用程序接口和/或数据结构。 链路级和端到端网络传输协议可扩展或替换现有链路和传输协议。
- 链路级和端到端拥塞、遥测和信令机制;上述各项均适用于人工智能、机器学习和高性能计算环境。
- 软件、存储、管理和安全结构可促进各种工作负载和操作环境。
- UEC 将遵循模块化、兼容、可互操作层和紧密集成的系统方法,为要求苛刻的工作负载提供全面改进。
- 创始公司正在为联盟的四个工作组做出极具价值的贡献:物理层、链路层、传输层和软件层。
有分析指出,超以太网联盟(UEC)的成立,意味着将与InfiniBand在AI和HPC领域同台竞争。
数据显示,InfiniBand 起源于 1999 年,由Future I/O 和 Next Generation I/O (NGIO) 合并而成。NGIO 由Intel主导,并于 1998 年发布了规范 , Sun Microsystems和Dell也加入其中。Future I/O 得到了康柏(后被惠普收购)、IBM和惠普的支持。InfiniBand 架构规范的 1.0 版于 2000 年发布。
根据《国际电子商情》查询InfiniBand贸易协会(IBTA)官网信息,IBTA成员主要已经囊括了AMD、Broadcom、Cisco、HPE、Intel这些UEC创始会员企业。其中,HPE、Intel还是UEC联盟指导委员会成员(其他还包括IBM、NVIDIA)。
InfiniBand成員,IBTA官网截图
InfiniBand 连接技术已经超算中盛行
到 2014 年,InfiniBand 已成为超级计算机最流行的内部连接技术。2016 年,有报道称Oracle(Mellanox 的投资者)可能会设计自己的 InfiniBand 硬件。2019年,Nvidia收购了最后一家InfiniBand产品独立供应商Mellanox。
2022 年 7 月 ,IBTA宣布,在同年6月公布的全球超算中,197个系统部署了InfiniBand,同比增长 17%。InfiniBand还连接了Top100中的62个,使其成为世界顶级超级计算机中使用最多的高速互连。
InfiniBand 在 TOP500 中的突出表现表明,它有能力提供世界顶级系统所需的速度、低延迟和可扩展性。利用 InfiniBand 和融合以太网 RDMA (RoCE) 等远程直接内存访问 (RDMA) 结构还可以为数据中心提供可靠性、效率以及高度互操作性的环境,以便这些系统进行扩展。
InfiniBand 路线图,图片来源:IBTA官网