自2023年底第五代英特尔®至强®可扩展处理器发布以来,这款专为AI加速而生的CPU就一直在业内保持着很高的热度,其强大的算力、出色的性能、成熟的生态、广泛的合作伙伴等,都让人们对它的期待值日益高涨。
第五代至强可扩展处理器发布至今,它到底有哪些新特性值得关注?具体应用实践情况又是如何?
为了让大家有个全面的了解,在近日举办的2024英特尔数据中心产品技术媒体分享会上,多位英特尔技术专家从技术特性、产品价值、实践应用等角度对其进行了详细介绍。
提升软硬件,打造至强“芯”
最近一年多来,人类在算法、计算等方面取得的突破,让生成式AI实现了令人惊叹的进展。
数据显示,全球约有58%的企业都会运用到生成式AI;预计到2026年,生成式AI市场规模有望增长至3000亿美元,这其中包括硬件、软件、解决方案等;到2028年,大约80%以上的PC产品将会转换成AI PC;届时,人们将通过AI PC提高工作效率,释放更多的生产力和创造力。
在这场AI的革命浪潮中,英特尔作为计算领域的引领者,自然要走在行业的最前沿。而第五代至强的问世,就是迈向成功的第一步。
据英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰介绍,去年年底发布的第五代至强,主要面向生成式AI设计的,是英特尔迄今为止可持续性最强的数据中心处理器,并且与上一代英特尔®至强®可扩展处理器相比,都有着较大幅度的升级。
具体来说,在硬件方面,其核数和不同的性能指标都达到了行业领先水平。“第五代至强最多拥有64个核;同时,我们也通过和AI相关的新的指令集,如AMX、AVX等来提高主频和性能。这些性能的提升,对一些生成式AI的应用也有很大帮助。当然还有其他和AI相关的,比如提高内存的带宽等。”庄秉翰介绍说。
据悉,第五代至强在业界数据中心级的处理器当中,拥有较高内存带宽,能够达到5600MT/s。英特尔通过加大三级缓存,即把三级缓存的容量提升了三倍,使得数据处理无需内存,直接在芯片内部就可以进行处理。
针对这款处理器,除了硬件提升之外,英特尔在软件生态方面也做出了很大调整。
“随着第五代至强的发布,我们上传了300个以上的深度学习模型到社区,也支持50个以上的基于机器学习的、且基于第五代至强优化过的模型,这些开发者都可以调用。”庄秉翰谈到,不仅如此,我们还更新了AI开发软件,可以在第五代至强上的应用做到较大优化;同时加大了对主流大模型、生成式AI模型的框架投入,如PyTorch和TensorFlow等,让使用PyTorch和TensorFlow开发的资产,均可以无缝拓展至英特尔至强可扩展处理器上。
总之,基于硬件和软件的优化,第五代至强与第四代至强相比,在AI训练、实时推理、批量推理上,基于不同的算法,都可以看到不同性能的提升,最高可提升40%。
增强架构设计,助力CPU迭代升级
为了改善工作负载的性能,第五代至强在架构设计方面也进行了增强,这主要表现为五个方面:
一是,制程技术的改进。据英特尔资深技术专家介绍,制程是半导体领域离不开的话题,第四代和第五代至强都是基于Intel 7的制程,采用的是Dual-poly-pitch SuperFin晶体管技术。为了展现第五代至强的卓越性能,我们在关键技术指标做了改进,特别是在系统的漏电流控制和动态电容方面,这两项指标都对整个晶体管的性能表现有着较大的影响。通过这些调整,第五代至强在同等功耗下的频率可以提升3%(其中2.5%是由漏电流控制贡献的,动态电容下降贡献了0.5%)。
二是,芯片布局的改变。现阶段,人们对服务器的算力要求越来越高,因此需要在里面放更多的核心,以及更多的内存带宽。但这就意味着会有更多的IO,会使芯片面积不断增加。为了解决这一问题,第五代至强对芯片切分方式做了调整,把原来芯片分为四个部分的做法变成切为两份,这样就可以更好的对芯片的质量和面积进行控制。
三是,性能能效的提升。为了说明第五代至强在性能能效方面的优势,英特尔官方给出了两组数据:一个是常规的整数计算,相较于上一代,第五代至强针对AI负载的性能大幅提升了42%;二是SoC芯片拓扑结构的改变,把原来的4芯片封装改为2芯片封装,使芯片之间的功耗减少,从而将更多功耗放在处理器的性能提升上。
四是,三级缓存(LLC)的增加。正如前面提到的,把三级缓存的容量提升三倍,可以使数据处理无需内存,直接在芯片内部进行处理。“现在我们每个模块的LLC容量都从1.875MB增加到了5MB,这个提升是非常大的,所以第五代至强有着高达320MB的缓存。”该技术专家解释说。
五是,内存IO的扩展。第五代至强的DDR速度从4800MT/s提升到了5600MT/s,可以确保高度的信号完整性。要知道,实现这一过程并不容易,因为所有内存速度的增加,都是在现有的基板和PCB的基础上去实现的。所以,要想达到更高的速度,就需要从芯片设计到基板设计,以及链路上一系列整体的提升。为此,英特尔做了很多优化,包括一些MIM的内存、基板上走线的提升,以及片上的低噪声的供电措施等。
发挥资源优势,持续贡献更多力量
除了核心技术、架构细节之外,第五代至强在解决方案和实践应用中的表现同样值得一提。
在英特尔看来,解决方案的目的其实很简单,就是将底层硬件的能力充分发挥出来,真正将硬件能力转化为用户价值。而为了实现这一目标,英特尔投入了大量资源,比如在工艺、微架构、系统、生态上的投入,以及在数据安全和模型安全等方面的投入,这些英特尔都有端到端的解决方案。
据介绍,在云计算时代,英特尔在虚拟化技术上投入了“重兵”,在提升虚拟化效率的同时,也减少了对底层硬件的损耗。而到了AI时代亦是如此,其AI推理能力比上一代大幅提升了42%,同时核数也增加了,内存带宽也更多了,三级缓存容量也增大了,英特尔同样也在努力发挥着这些硬件能力。
“过去的10年,英特尔致力于构建一个完备的生态,通过软、硬件结合帮助生态合作伙伴们充分挖掘和利用底层CPU能力。可以说,我们挖掘CPU的能力并非是单一的。”英特尔技术专家表示,CPU就像是一位大侠,十八般武艺样样精通,一个人可以应对很多人,单打独斗能力很强;而GPU更像是一支军队,人数众多,执行的任务简单且并发高。所以,CPU和GPU适用的场景是不同的。面向时代,英特尔正在逐步优化CPU的架构,让性能得到不断的提升。
会上,英特尔官方还分享了几个关于第五代至强的应用案例,在展示该处理器强大的同时,也进一步体现了英特尔拥有开放生态的共赢格局。
在技术革新的道路上,英特尔永不止步。据官方透露,继第五代至强之后,2024年还会发布全新一代的至强可扩展处理器,并且将迎来丰富的产品组合,可以同时满足性能的要求和社会对能耗的要求。
除此之外,英特尔还将计划推出下一代的P-core(性能核)和E-core(能效核)处理器。其中,P-core看重的是整体性能的提升,而E-core则看重的是每瓦带来的性能提升。未来,底层能源的利用率便是企业最大的优势,谁的能源利用率高、转化率高,谁就更有竞争力。