在 PyTorch 上将 AI 算法的实时推理速度提升 10 倍,有可能吗?

2023-01-26  

前段时间的CES上,正式发布Ryzen 7000的3D缓存版,对于游戏玩家来说,Ryzen 7000 3D缓存版算是今年最期待的CPU。上一代的Ryzen7 5800X3D凭借超强的游戏性能和性价比,在德国最大的PC硬件零售商的统计中,甚至成为2022年最畅销的高性能处理器。有着Ryzen 5000 3D缓存版的珠玉在前,AMD也是对这个系列的迭代产品寄予了厚望,特别是在Ryzen 7000系列销量并不乐观的当下,3D缓存版几乎可以说是AMD唯一翻盘的希望。那么Ryzen 7000 3D缓存版的表现到底如何?又是否值得游戏玩家购买呢?年度游戏神U预定?

Ryzen 7000 3D缓存版备受期待不是没有原因的,以上一代的Ryzen7 5800X3D为例,虽然这款处理器并非AMD的旗舰型号,价格也仅为449美元(国行价格3099元),但是其游戏性能却可以媲美的特挑版旗舰处理器i9-12900KS,而且后者的售价高达739美元(国行为5699元)。

以接近一半的价格提供相同的游戏性能,Ryzen7 5800X3D自然也就得到了许多游戏玩家的追捧。同时,很多玩家也在期待Ryzen 7000 3D缓存版可以延续Ryzen 5800X3D的“神话”,以50%的价格在游戏性能上击败i9-13900K。

先来看看Ryzen 7000 3D缓存版的规格,此次发布的3D缓存版处理器一共三款,分别是Ryzen9 7950X3D、Ryzen9 7900X3D和Ryzen7 7800X3D,对比上一代新增了两个型号,规格如下:

Ryzen9 7950X3D:16核心32线程,16MB二级缓存、64MB三级缓存、64MB 3D缓存,基准频率4.2GHz,加速频率5.7GHz,TDP120W。

Ryzen9 7900X3D:12核心24线程,12MB二级缓存、64MB三级缓存、64MB 3D缓存,基准频率4.4GHz,加速频率5.6GHz,TDP120W。

Ryzen7 7800X3D:8核心16线程,8MB二级缓存、32MB二级缓存、64MB三级缓存,基准频率未知(官方标注为4.xGHz,或许是还未最终确定出厂基准频率),加速频率则是5.0GHz,TDP依然为120W。去年英特尔发布13代酷睿处理器,带来多款带K型号的旗舰处理器。而最近,英特尔在旗舰之上实现突破,推出i9-13900KS,主频高达6Ghz。

作为i9-13900K的升级款,KS后缀的处理器是英特尔特挑体质处理器,相比普通的i9-13900K默认主频更高,超频潜力也更大。i9-13900KS在没有超频的情况下就能稳定6GHz。在规格方面,i9-13900KS采用8颗性能核加上16颗能效核的24核32线程,相比i9-13900K,基础频率从3.0GHz增加到了3.2GHz,拥有UHD770集显。同时i9-13900KS拥有更高的默认TDP,相较i9-13900K提升25W,达到150W。

值得注意的是,i9-13900KS还支持极限性能模式,在开启这个模式之后,LP1和LP2将会增加到320W。此外i9-13900KS支持最高DDR5 5600MT/s和DDR4 3200MT/s的内存,兼容Z790和Z690主板。

在之前英特尔放出的视频中,英特尔技术营销工程师行了演示,搭配华硕Z790商用主板,以及海盗船一体式水冷。在全核心负载下,性能核的频率为5.6GHz,能效核的频率为4.3GHz。在没有经过任何改动的情况下,两个性能核最高可以达到6GHz,但频率并没有始终保持在这个水平。英特尔方面解释说,频率将取决于许多因素,例如功耗计算、热量或软件本身。

但尽管如此,i9-13900KS的性能依旧令人惊艳。同时官方表示,凭借现有的英特尔600或全新英特尔700芯片组主板,发烧友用户可以畅享第13代英特尔酷睿处理器带来的出众性能。产品支持最新的DDR5和既有的DDR4内存,用户在享受第 13 代酷睿所带来的性能优势的同时,也可以根据自己的功能需求和预算组装机器。

2023年初,英特尔酝酿已久的新一代数据中心芯片走至台前。

1月11日,英特尔正式推出第四代英特尔至强可扩展处理器(代号“Sapphire Rapids”)、英特尔至强CPU Max系列(代号“Sapphire Rapids HBM”)以及英特尔数据中心GPU Max系列(代号“Ponte Vecchio”)。

一方面,在英特尔的转型中,数据中心一直是核心业务。根据英特尔公布的数据,过去四代所有的至强处理器已经销售了约8500万颗,其中第三代产品在两年内销售了1500万颗。同时,在算力的新需求下,其数据中心产品也已经从CPU拓展至GPU等,芯片巨头们都在建立新的生态体系。

另一方面,在疫情和外部环境变换之下,半导体产业整体承压,尤其是终端需求下滑的情况下,数据中心成为半导体行业的重要增长点,这也成为众多芯片企业瞄准的方向,竞争随之更加猛烈。

根据Dell’Oro Group此前发布的报告,由于运营商、云计算厂商运算需求持续提升,到2026年,全球数据中心的资本支出预计将达到3770亿美元。在数字化的趋势下,算力产业格局也在重塑中。

在中国数据中心市场上,机构指出2023年有望回暖。IDC中国研究经理索引向21世纪经济报道记者表示:“抗疫政策的转变对中国2023年经济复苏带来了正面影响,2023年我们预计中国整体服务器市场需求也将出现反弹,出货量和厂商销售额分别增长5.5%和7.2%。”

企业数字化来势汹汹,建设数字化所需的计算力、数据等智能技术的基础设施常被忽略。

然而,当降本增效成为企业发展的指导方针之一,数字化项目落地所涉及的方方面面也已经不容小觑。驱动算法与模型的数据与算力,也成为实现 " 降本增效 " 的重要手段。

例如,假设一个供应给终端硬件的视觉算法的交付时长是六个月,算法训练与调优原为 2 个月,企业调配 2 个算法工程师,一个算法工程师的年薪为 100 万,如果算法的训练速度可以提升 10 倍,那么对企业所产生的直接影响就是四个字:真金白银!

当然,这是计算服务商一直在努力的目标。但,在 PyTorch 上将 AI 算法的实时推理速度提升 10 倍,有可能吗?

英特尔做到了。

在 1 月 11 日举办的第四代英特尔 ® 至强 ® 可扩展处理器新品发布会上,英特尔正式推出第四代英特尔 ® 至强 ® 可扩展处理器、英特尔 ® 至强 ® CPU Max 系列以及 ® 数据中心 GPU Max 系列。

第四代至强不仅实现了 AI 推理的加速,还推动了数据中心的性能、能效和安全性的大幅跃升,为为 AI、云、网络、边缘和全球领先的超级计算机带来全新功能。

文章来源于:21IC    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。