首页
在 PyTorch 上将 AI 算法的实时推理速度提升 10 倍，有可能吗?

在 PyTorch 上将 AI 算法的实时推理速度提升 10 倍，有可能吗?

发布时间:2023-01-26

前段时间的CES上，正式发布Ryzen 7000的3D缓存版，对于游戏玩家来说，Ryzen 7000 3D缓存版算是今年最期待的CPU。上一代的Ryzen7 5800X3D凭借超强的游戏性能和性价比，在德国最大的PC硬件零售商的统计中，甚至成为2022年最畅销的高性能处理器。有着Ryzen 5000 3D缓存版的珠玉在前，AMD也是对这个系列的迭代产品寄予了厚望，特别是在Ryzen 7000系列销量并不乐观的当下，3D缓存版几乎可以说是AMD唯一翻盘的希望。那么Ryzen 7000 3D缓存版的表现到底如何?又是否值得游戏玩家购买呢?年度游戏神U预定?

Ryzen 7000 3D缓存版备受期待不是没有原因的，以上一代的Ryzen7 5800X3D为例，虽然这款处理器并非AMD的旗舰型号，价格也仅为449美元(国行价格3099元)，但是其游戏性能却可以媲美的特挑版旗舰处理器i9-12900KS，而且后者的售价高达739美元(国行为5699元)。

以接近一半的价格提供相同的游戏性能，Ryzen7 5800X3D自然也就得到了许多游戏玩家的追捧。同时，很多玩家也在期待Ryzen 7000 3D缓存版可以延续Ryzen 5800X3D的“神话”，以50%的价格在游戏性能上击败i9-13900K。

先来看看Ryzen 7000 3D缓存版的规格，此次发布的3D缓存版处理器一共三款，分别是Ryzen9 7950X3D、Ryzen9 7900X3D和Ryzen7 7800X3D，对比上一代新增了两个型号，规格如下：

Ryzen9 7950X3D：16核心32线程，16MB二级缓存、64MB三级缓存、64MB 3D缓存，基准频率4.2GHz，加速频率5.7GHz，TDP120W。

Ryzen9 7900X3D：12核心24线程，12MB二级缓存、64MB三级缓存、64MB 3D缓存，基准频率4.4GHz，加速频率5.6GHz，TDP120W。

Ryzen7 7800X3D：8核心16线程，8MB二级缓存、32MB二级缓存、64MB三级缓存，基准频率未知(官方标注为4.xGHz，或许是还未最终确定出厂基准频率)，加速频率则是5.0GHz，TDP依然为120W。去年英特尔发布13代酷睿处理器，带来多款带K型号的旗舰处理器。而最近，英特尔在旗舰之上实现突破，推出i9-13900KS，主频高达6Ghz。

作为i9-13900K的升级款，KS后缀的处理器是英特尔特挑体质处理器，相比普通的i9-13900K默认主频更高，超频潜力也更大。i9-13900KS在没有超频的情况下就能稳定6GHz。在规格方面，i9-13900KS采用8颗性能核加上16颗能效核的24核32线程，相比i9-13900K，基础频率从3.0GHz增加到了3.2GHz，拥有UHD770集显。同时i9-13900KS拥有更高的默认TDP，相较i9-13900K提升25W，达到150W。

值得注意的是，i9-13900KS还支持极限性能模式，在开启这个模式之后，LP1和LP2将会增加到320W。此外i9-13900KS支持最高DDR5 5600MT/s和DDR4 3200MT/s的内存，兼容Z790和Z690主板。

在之前英特尔放出的视频中，英特尔技术营销工程师行了演示，搭配华硕Z790商用主板，以及海盗船一体式水冷。在全核心负载下，性能核的频率为5.6GHz，能效核的频率为4.3GHz。在没有经过任何改动的情况下，两个性能核最高可以达到6GHz，但频率并没有始终保持在这个水平。英特尔方面解释说，频率将取决于许多因素，例如功耗计算、热量或软件本身。

但尽管如此，i9-13900KS的性能依旧令人惊艳。同时官方表示，凭借现有的英特尔600或全新英特尔700芯片组主板，发烧友用户可以畅享第13代英特尔酷睿处理器带来的出众性能。产品支持最新的DDR5和既有的DDR4内存，用户在享受第 13 代酷睿所带来的性能优势的同时，也可以根据自己的功能需求和预算组装机器。

2023年初，英特尔酝酿已久的新一代数据中心芯片走至台前。

1月11日，英特尔正式推出第四代英特尔至强可扩展处理器(代号“Sapphire Rapids”)、英特尔至强CPU Max系列(代号“Sapphire Rapids HBM”)以及英特尔数据中心GPU Max系列(代号“Ponte Vecchio”)。

一方面，在英特尔的转型中，数据中心一直是核心业务。根据英特尔公布的数据，过去四代所有的至强处理器已经销售了约8500万颗，其中第三代产品在两年内销售了1500万颗。同时，在算力的新需求下，其数据中心产品也已经从CPU拓展至GPU等，芯片巨头们都在建立新的生态体系。

另一方面，在疫情和外部环境变换之下，半导体产业整体承压，尤其是终端需求下滑的情况下，数据中心成为半导体行业的重要增长点，这也成为众多芯片企业瞄准的方向，竞争随之更加猛烈。

根据Dell’Oro Group此前发布的报告，由于运营商、云计算厂商运算需求持续提升，到2026年，全球数据中心的资本支出预计将达到3770亿美元。在数字化的趋势下，算力产业格局也在重塑中。

在中国数据中心市场上，机构指出2023年有望回暖。IDC中国研究经理索引向21世纪经济报道记者表示：“抗疫政策的转变对中国2023年经济复苏带来了正面影响，2023年我们预计中国整体服务器市场需求也将出现反弹，出货量和厂商销售额分别增长5.5%和7.2%。”

企业数字化来势汹汹，建设数字化所需的计算力、数据等智能技术的基础设施常被忽略。

然而，当降本增效成为企业发展的指导方针之一，数字化项目落地所涉及的方方面面也已经不容小觑。驱动算法与模型的数据与算力，也成为实现 " 降本增效 " 的重要手段。

例如，假设一个供应给终端硬件的视觉算法的交付时长是六个月，算法训练与调优原为 2 个月，企业调配 2 个算法工程师，一个算法工程师的年薪为 100 万，如果算法的训练速度可以提升 10 倍，那么对企业所产生的直接影响就是四个字：真金白银!

当然，这是计算服务商一直在努力的目标。但，在 PyTorch 上将 AI 算法的实时推理速度提升 10 倍，有可能吗?

英特尔做到了。

在 1 月 11 日举办的第四代英特尔 ® 至强 ® 可扩展处理器新品发布会上，英特尔正式推出第四代英特尔 ® 至强 ® 可扩展处理器、英特尔 ® 至强 ® CPU Max 系列以及 ® 数据中心 GPU Max 系列。

第四代至强不仅实现了 AI 推理的加速，还推动了数据中心的性能、能效和安全性的大幅跃升，为为 AI、云、网络、边缘和全球领先的超级计算机带来全新功能。

文章来源于:21IC 原文链接

本站所有转载文章系出于传递更多信息之目的，且明确注明来源，不希望被转载的媒体或个人可与我们联系，我们将立即进行删除处理。

基于深度学习的智能电网短期日负荷曲线预测系统设计与实现(2023-02-27)

。通过文献调研发现，目前已有的负荷预测模型大多是浅层神经网络预测模型，而基于浅层神经网络的电力负荷预测......

基于多目标检测的交通监测反馈系统(2022-12-23)

。DarkNet-53 再次成为卷积神经网络，具有53 层。DarkNet-53 是一个完全卷积神经网络。池化层被步幅为 2 的卷积运算所取代。此外，使用残余单位以避免梯度色散。 YOLO V3......

基于意法半导体SPC58EC80E5, AIS2DW12的AI行车状态检测解决方案(2024-05-11)

的数据被传递到在 MCU 上运行的 LSTM（long short-term memory长短期记忆）递归神经网络(recurrent neural network)，该网络对驾驶条件进行分类并生成精确的车辆状态预测模型......

为什么可以在STM32上面跑神经网络(2023-06-28)

F4/H7/MP157开发板二、AI神经网络模型搭建这里使用官方提供的模型进行测试，用keras框架训练： https://github.com/Shahnawax/HAR-CNN-Keras......

STM32 AI实验课程—HAR在STM32L4上的实现(2023-02-08)

电脑上的应用程序，将传感器数据和标签记录在ST开发板上给定的Python脚本将处理数据集并训练NN模型在STM32CubeMX.AI工具的帮助下，将神经网络训练好的模型导入到STM32项目中相关......

国内端到端自动驾驶落地取得重大成果！(2024-04-22)

了综合性能国际领先的数据驱动强化学习算法（DSAC），首创了时空分离的交通参与者行为预测模型（SEPT），设计了具有动作平滑特性的控制型神经网络架构（LipsNet），开发了自主知识产权的最优控制策略近似求解器（GOPS），以蚂......

MCX N系列微处理器之NPU使用方法简介(2024-04-23)

处理速度上，比M33核心快出40倍，显著减少了设备的唤醒时间，并有效降低了总体功耗。 eIQ Neutron NPUs能够支援包括CNN（卷积神经网络）、RNN（循环神经网络）、TCN（时间卷积网络......

什么是神经网络？为什么说神经网络很重要？神经网络如何工作？(2024-07-16)

标签的数据示例中对新的观察结果进行分类。回归回归模型描述一个响应（输出）变量与一个或多个预测元（输入）变量之间的关系。模式识别模式识别是计算机视觉、雷达处理、语音识别和文本分类方面的神经网络应用的一个重要组成部分。它的......

硬件工程师技能提升：深入理解无源器件——从滤波器到天线的设计与应用(2024-10-10 15:31:18)

）理论内容：（基于自编码器代理模型和全连接神经网络的天线优化设计方案、AE-ANN天线优化设计方案整体框架、AE-ANN天线......

端到端自动驾驶到底是什么？(2023-09-21)

数据也有了，接下来就是塞进看不太懂的胶囊神经网络里进行全局优化训练，最后就能给出结果。这个方案好在没有吸引到什么大手笔投资，很快就销声匿迹了。不过这两天，大模型出来之后，我甚......

平台入驻

我们与500+贴片厂合作，完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页，多渠道推广，SEM/SEO精准营销以及与公众号的联合推广...详细>>

原厂代理商合作

利用葫芦芯平台的卓越技术服务和新产品推广能力，原厂代理能轻松打入消费物联网（IOT）、信息与通信（ICT）、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

闲置物料合作

充分利用其强大的电子元器件采购流量，创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术，不仅可以助你轻松识别与连接到需求方，更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

生态合作

我们的目标很明确：构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前，我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

加工与定制类服务商合作

我们深知加工与定制类服务商的价值和重要性，因此，我们倾力为您提供最顶尖的营销资源。在我们的平台上，您可以直接接触到100万的研发工程师和采购工程师，以及10万的活跃客户群体...详细>>

线上代理合作

凭借我们强大的专业流量和尖端的互联网数字营销技术，我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品，都可以通过我们的平台迅速传达给目标客户...详细>>

邮件营销及广告服务

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环，从引流、宣传到最终销售，全程跟进，确保每一个potential lead都得到妥善处理，从而大幅提高转化率。不仅如此...详细>>