加速AI应用!IBM发布全新Telum处理器

发布时间:2024-09-03  

近日,IBM在Hot Chips2024大会上公布了即将推出的IBM Telum® II处理器和IBMSpyre™加速器的架构细节。这些新技术旨在大幅扩展下一代IBMZ大型主机系统的处理能力,通过新的AI集成方法,加速企业对传统AI模型和大语言AI模型的协同使用。

此次IBM发布的主要创新技术包括IBM Telum II处理器、IO加速单元、IBM Spyre加速器。Telum II处理器和IBM Spyre加速器将由三星晶圆代工(Samsung Foundry)生产,采用其高性能、高能效的5纳米工艺节点。

具体来看,Telum II处理器配备八个运行频率达5.5GHz的高性能内核,每个内核配备36MB二级高速缓存,片上高速缓存容量增加40%(总容量达360MB)。每个处理器抽屉的虚拟L4高速缓存为2.88GB,相比上一代增加40%。集成的AI加速器可实现低延迟、高吞吐量的交易中AI推理,例如增强金融交易期间的欺诈检测,并且每块芯片的计算能力是上一代的四倍。TelumII芯片中集成了最新的I/O加速单元DPU。在设计上,其I/O密度提高50%,可大幅提高数据处理能力,进一步提高IBMZ的整体效率和可扩展性。

Spyre加速器是一款专为复杂AI模型和生成式AI用例提供可扩展功能的企业级加速器。它有高达1TB的内存,可在普通IO抽屉的八块卡上串联工作,以支持大型主机的整体AI工作负载,同时每块卡的功耗不超过75W。每块芯片由32个计算内核组成,支持int4、int8、fp8和fp16数据类型,适用于低延迟和高吞吐量的AI应用。

IBM主机和Linux ONE产品管理副总裁Tina Tarquinio表示,TelumII处理器和Spyre加速器旨在提供安全、节能、高性能的企业计算解决方案。这些多年研发的创新成果将被引入下一代IBMZ平台,帮助客户大规模利用大语言模型和生成式AI技术。

据IBM指出,作为IBM下一代IBM Z和IBM Linux ONE平台的中央处理器,Telum II处理器预计在2025年向IBM Z和Linux ONE客户提供。IBM Spyre加速器仍在技术预览阶段,预计也将于2025年推出。

根据摩根士丹利最近发布的一份研究报告预测,在未来几年,生成式AI的电力需求将以每年75%的速度激增,其2026年的能耗或将与西班牙2022年的全年能耗相当。业界人士认为,支持适当规模的基础模型和针对AI工作负载的混合架构越来越重要。

封面图片来源:拍信网

文章来源于:全球半导体观察    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>