英特尔投资者网络研讨会四大要点
英特尔聚焦公司数据中心和人工智能(DCAI)部门,公布了新的路线图和一系列新进展。
近期,所有人的目光——尤其是投资者的目光——都集中在英特尔的数据中心业务上。
日前,英特尔公司Sandra Rivera、Greg Lavender和Lisa Spelman主持了一场网络研讨会,聚焦公司的数据中心和人工智能业务部门,详细介绍了英特尔最新的市场预测、硬件计划以及如何通过软件赋能开发者。
网络研讨会展示了英特尔数据中心业务的最新情况。其中包括有关未来几代英特尔®至强®芯片的信息、第四代英特尔®至强®可扩展处理器(代号Sapphire Rapids)的最新进展,以及英特尔硬件对比竞品、运行繁重的AI工作负载等演示。
1. 至强路线图产品名录
在Sapphire Rapids、Emerald Rapids、Sierra Forest和Granite Rapids几大处理器产品上,英特尔服务器CPU业务取得了多项进展。以下是最新的至强路线图,按发布顺序排列:
目前:第四代英特尔至强可扩展处理器(Sapphire Rapids)的最新情况
50+主流OEM和ODM厂商均在出货基于第四代英特尔至强可扩展处理器的系统,而前十大云服务提供商也在部署基于第四代至强的服务。作为英特尔迄今为止质量最高的数据中心CPU,Sapphire Rapids正在快速出货,目前,已获得450+处理器产品设计,创造了英特尔至强系列的新纪录,同时已有200+设计出货。
2023年第四季度:第五代英特尔至强可扩展处理器(代号Emerald Rapids)
Emerald Rapids是英特尔的下一款性能核(P-core)产品。从今天开始,它被正式称为第五代英特尔®至强®可扩展处理器。为了准备正式发布,它已经从代号切换到正式的品牌名称,目前正在向客户提供样品,并计划于2023年第四季度进行交付,量产验证正在进行中。
英特尔执行副总裁兼数据中心与人工智能事业部总经理Sandra Rivera告诉投资者,该产品的芯片质量非常高,并针对性能进行了优化。其将拥有极高的处理器内核性能,在相同功率范围内实现更高的每瓦性能,同时通过内置加速器为具体的工作负载进行优化。
(代号“Emerald Rapids”的第五代英特尔至强可扩展处理器)
2024年上半年:英特尔至强处理器(代号Sierra Forest)
Sierra Forest是第一款能效核(E-core)处理器,计划在2024年上半年上市。今天,英特尔宣布Sierra Forest将拥有每插槽144个内核。Sierra Forest是第一款采用即将推出的Intel 3制程工艺的CPU,在本季度早些时候上电后,多个操作系统在创纪录的时间内(不到一天)得以启动。它正在按计划推进,第一批样品已经交付。在Sierra Forest演示中,通过任务管理器展现了144个内核忙碌地处理演示工作负载的场景,令人印象深刻。Sierra Forest为云优化的工作负载而设计,将通过优化的每瓦性能、高内核密度,以及高吞吐量性能针对能效进行优化。
(代号“Sierra Forest”的英特尔至强处理器)
快速跟进:英特尔至强处理器(代号Granite Rapids)
Granite Rapids在2024年将紧随Sierra Forest之后发布。尽管具体发布日期尚未披露,但与Sierra Forest共享一个平台将有利于其快速上市。共享的IP和技术最大限度地缩短了开发和设计时间。Granite Rapids正在实现所有重大里程碑进展,并取得了顺利的工厂生产进程。它的样品也正在向客户提供,反馈良好。Spelman在一次演示中首次展现了Granite Rapids的创新,包括更高的内核密度、内存和I/O创新。
Spelman在启动命令提示符以展示其内存配置时表示:“我们正在为Granite Rapids构建世界上最快的内存接口。英特尔发明并引领整个生态系统开发了一种名为多路合并阵列(MCR)的新型DIMM,使我们能够在DDR5的基础上实现每秒8800兆次的传输速度。”
与当前一代服务器内存技术相比,MCR DIMM创新把峰值带宽增加了80%。Lisa的演示表明,Granite Rapids在健康的内存子系统满载读/写操作时非常稳定。
未来
英特尔首次公开表示,将在Sierra Forest之后开发后续产品Clearwater Forest,继续实施其能效核路线图。Clearwater Forest将于2025年上市,采用Intel 18A制程工艺制造。英特尔计划在该节点实现制程工艺领先——这也将是公司四年内推进五个制程节点战略的高潮。
其它信息
• Habana® Gaudi® 3人工智能加速器已完成设计认证(tape in)。虽然性能细节尚未公布,但Habana® Gaudi® 2已投入使用,并在运行主流的计算机视觉工作负载时拥有出色的每瓦吞吐量。
• 今年计划有15款新的FPGA产品通过生产放行资格(PRQ)程序,这是英特尔迄今为止最庞大的FPGA新品发布。
2. CPU市场规模超过1100亿美元
紧凑的路线图针对的是比预期更大的市场。Rivera认为,五年后,数据中心芯片市场的规模将达到1100亿美元,是去年英特尔投资者大会上所预期市场规模的两倍左右。究其原因,是不断变化的数据中心市场格局扩大了目前仅仅针对CPU的需求。
Rivera解释道:“当谈论计算需求时,我们经常通过CPU的出货量来衡量市场规模。然而,插槽数量并不能完全反映芯片创新为市场带来的价值。如今,创新涉及多个维度,包括提高CPU内核的密度、使用芯片中的内置加速器,以及使用独立加速器等。”
基于上述情况,Rivera列举了市场规模增加的几个具体原因:首先,随着数据中心业务整合加速器计算和领先的GPU产品,英特尔能够更好地服务更为广泛的客户群体。此外,至强可扩展处理器在运行大型工作负载(如AI、数据分析、安全、网络和HPC)方面的出色性能,推动了对主流计算以及为工作负载“量身定制”的独立加速器的需求。
3. 基于英特尔技术的AI无处不在,并面向所有人
除了有关芯片的最新情况,AI也是网络研讨会的一大主题。
英特尔技术是AI硬件的基石,从至强处理器上的数据准备及管理,到中、小型训练与推理,同时,越来越多的大模型训练和推理正在使用英特尔GPU和加速器。
而随着通用计算(主流为CPU)和加速计算(目前主流为GPU和专用加速器)的市场需求不断增长,到2027年,逻辑芯片的市场规模将超过400亿美元,AI芯片/加速器领域将大有可为。
英特尔致力于推动真正的AI普及,从云到网络到边缘。通过开放的生态系统,英特尔让更多人能够获得解决方案并进行更为经济的AI部署。今日,Rivera展现了英特尔的这一承诺。
Rivera表示:“客户希望他们的AI工作负载具有可移植性。他们希望通过一次构建,即可将AI部署到任何地方。随着我们继续为AI工作负载提供异构架构,它们的大规模部署将需要方便开发人员编程的软件,以及一个充满活力、开放、安全的生态系统。”
英特尔首席技术官兼软件与技术集团负责人Greg Lavender在现场谈到了英特尔的先进软件,以及其对于整体的端到端系统级AI软件开发方法的投资,包括为了实现Rivera提到的“可移植性”而推动编程语言的标准化。
Lavender表示:“我们认为,行业将受益于标准化的编程语言,让每个人都可以为其做出贡献,并展开广泛的合作,而不是受限于某个特定的供应商,与此同时,亦可以根据成员的以及一些共性需求寻求有机的发展。”
英特尔为SYCL(一种基于C++的开放编程模型)做出了很多贡献,并收购了Codeplay Software(SYCL语言和社区的领导者)。SYCL包含于oneAPI中,因此客户可以跨多个供应商的CPU、GPU和加速器进行编程和编译。上游软件优化方面的其他工作包括针对PyTorch 2.0和TensorFlow 2.9的优化,以及与Hugging Face的合作,均可在英特尔至强处理器和Gaudi 2的帮助下进行训练、调优和预测。
4. 助力生成式AI的发展
英特尔的开放理念延伸到了生成式AI领域,ChatGPT和从文本生成图像的模型DALL•E 2等强大工具正在利用AI算法和大型数据集,从复杂的人工提示词中生成内容。
生成式AI正在极速发展,而英特尔亦在积极地支持开放的生成式AI生态系统,并满足日益增长的性能需求。
近日,机器学习应用开发领域的重要厂商Hugging Face宣布在 Habana Gaudi 2上启用包含1760亿个参数的BLOOMZ模型。BLOOM模型是一个开源的大型语言AI模型,类似于ChatGPT所采用的包含1750亿个参数的GPT-3模型。该公司还证实,它在内置英特尔AMX加速器的第四代英特尔至强处理器上运行从文本到图像的深度学习模型Stable Diffusion,并利于其为AI工作负载加速。Stable Diffusion是DALL•E的开放访问替代方案。
除了为构建开放生态系统所做的贡献之外,至强处理器在生成式AI领域亦发挥了重大作用。Rivera指出,英伟达正在使用第四代至强作为主节点,与其H100 GPU一起运行,为在微软Azure中加速包括ChatGPT在内的生成式AI模型的虚拟机提供动力。