加速AI应用！IBM发布全新Telum处理器

近日，IBM在Hot Chips2024大会上公布了即将推出的IBM Telum® II处理器和IBMSpyre™加速器的架构细节。这些新技术旨在大幅扩展下一代IBMZ大型主机系统的处理能力，通过新的AI集成方法，加速企业对传统AI模型和大语言AI模型的协同使用。

此次IBM发布的主要创新技术包括IBM Telum II处理器、IO加速单元、IBM Spyre加速器。Telum II处理器和IBM Spyre加速器将由三星晶圆代工（Samsung Foundry）生产，采用其高性能、高能效的5纳米工艺节点。

具体来看，Telum II处理器配备八个运行频率达5.5GHz的高性能内核，每个内核配备36MB二级高速缓存，片上高速缓存容量增加40%（总容量达360MB）。每个处理器抽屉的虚拟L4高速缓存为2.88GB，相比上一代增加40%。集成的AI加速器可实现低延迟、高吞吐量的交易中AI推理，例如增强金融交易期间的欺诈检测，并且每块芯片的计算能力是上一代的四倍。TelumII芯片中集成了最新的I/O加速单元DPU。在设计上，其I/O密度提高50%，可大幅提高数据处理能力，进一步提高IBMZ的整体效率和可扩展性。

Spyre加速器是一款专为复杂AI模型和生成式AI用例提供可扩展功能的企业级加速器。它有高达1TB的内存，可在普通IO抽屉的八块卡上串联工作，以支持大型主机的整体AI工作负载，同时每块卡的功耗不超过75W。每块芯片由32个计算内核组成，支持int4、int8、fp8和fp16数据类型，适用于低延迟和高吞吐量的AI应用。

IBM主机和Linux ONE产品管理副总裁Tina Tarquinio表示，TelumII处理器和Spyre加速器旨在提供安全、节能、高性能的企业计算解决方案。这些多年研发的创新成果将被引入下一代IBMZ平台，帮助客户大规模利用大语言模型和生成式AI技术。

据IBM指出，作为IBM下一代IBM Z和IBM Linux ONE平台的中央处理器，Telum II处理器预计在2025年向IBM Z和Linux ONE客户提供。IBM Spyre加速器仍在技术预览阶段，预计也将于2025年推出。

根据摩根士丹利最近发布的一份研究报告预测，在未来几年，生成式AI的电力需求将以每年75%的速度激增，其2026年的能耗或将与西班牙2022年的全年能耗相当。业界人士认为，支持适当规模的基础模型和针对AI工作负载的混合架构越来越重要。

封面图片来源：拍信网