解锁极致性能:Arm Cortex-X925 IPC 提升15%,终端用户体验感再突破

发布时间:2024-10-09 13:31  

打造卓越性能与更高效率的全新标准,实现人工智能、游戏和多任务处理的先进功能

如今,应用程序的性能表现已成为推动业务成功的核心支柱之一。随着技术不断发展,确保用户能在各种应用程序中获得理想体验的高性能 CPU 也变得至关重要。

基于 Armv9.2 架构的 Arm Cortex-X925 是Arm 迄今推出的出色 CPU 设计之一。在 Geekbench 6.2 基准测试中,它实现了创新纪录提升了 15% 的IPC(每时钟周期指令数)表现。

图:Arm Cortex-X925性能新突破

与过往从 Arm Cortex-X1 到 Cortex-X4 CPU 的年度同比性能提升幅度相比,此次的性能增幅高出了 1.5 倍,意味着能为最终用户带来卓越的性能体验,同时能有效缓解高频下过热问题。

图:Arm Cortex-X925提升IPC 15%,性能增幅比以往高出1.5倍

什么是 IPC?它为何重要?

IPC 是评估 CPU 性能的关键指标,用于衡量 CPU 在每个时钟周期内可执行的指令数。如何简单地理解 IPC 呢?举例来说,在一家工厂里,有多台机器人负责组装复杂的产品。CPU 执行的指令数就如同机器人为完成复杂计算(如最新的人工智能算法)而执行的任务。时钟周期则代表组装过程中单个步骤所花费的时间。

在 IPC 较高的工厂中,先进的机器人能在每条组装线步骤中加快执行多个任务,因而工厂能够在规定时间内制造出更多的产品。机器人的综合能力越强,实现预期产量所需的机器人数量就越少,工厂的用电效率就可能会更高。

为此,在智能手机、笔记本电脑和移动设备等消费电子设备中,鉴于电池续航时间和散热管理是关键因素,能效显得尤为重要。能效的提高意味着电池续航时间更长、运行温度更低、整体用户体验更佳。

基于 Armv9 的 Cortex-X925:出众的 IPC 表现满足实际需求必备的强劲性能

鉴于 IPC 是衡量 CPU 性能和能效的关键指标,基于 Armv9 架构的 Cortex-X925 专注于提高 IPC 性能,以提供满足实际需求的强劲性能。其中CPU 设计包括对私有 L2 缓存的升级,从 2MB 增加到 3MB,这个升级增强了 CPU 的整体性能和能效,尤其是结合Cortex-X925在更快速、更高效预取数据和复杂指令的能力后,成效尤为显著。

Cortex-X925 专为先进的三纳米工艺节点设计。作为一种更先进的制程技术,不仅提高了能效,而且能够利用更高的频率,从而在多种基准测试和应用场景中实现显著的性能提升,加快应用的启动速度,并提高了浏览器基准测试分数。此外,Cortex-X925 中的矢量管线提升50% Integer8的计算性能 (TOPS) ,加快智能手机上的人工智能应用响应速度。

总体而言,在消费者日常使用智能手机时,Cortex-X925 可使性能和能效平均提升 30%。由此带来诸多方面的用户体验升级,包括:

1. 更快的人工智能应用响应:人工智能聊天机器人的回复更准确、更快速。

2. 更优的 AAA 游戏质量:更流畅、更沉浸式的游戏体验和更高的画质。

3. 更快的应用操作:应用启动速度更快,用户体验更流畅。

4. 无缝多任务处理:用户可同时听音乐、浏览网站和聊天,带来顺畅的使用体验,而不会产生卡顿。

5. 更流畅的视频流传输:减少缓冲时间,播放更流畅。

6. 更快的网页加载速度:滚动和切换页面时反应更快。

7. 持续提供出色性能:得益于能效提升,智能手机续航增强,可保持稳定且持久的供电性能。

作为高性能解决方案,Cortex-X925 可满足不断发展的设备和应用场景需求,确保用户畅享优质体验。全新设计显著提高了速度和运行效率,尤其适用于人工智能应用。

图:Cortex-X925 可使消费电子设备的性能和能效平均提升 30%,为用户带来多方面的体验升级

Arm如何实现如此卓越的成果?

Arm 最新的创新成果之所以有如此令人瞩目的性能表现,源自于架构层面的多项提升。新架构从消费者的实际使用场景出发,在设计时着重考虑了三个层次的提升:

·前端:采用出色的微架构,适合具有复杂分支行为和指令占用空间大的实际应用。分支预测和指令获取能力提高两倍。

·核心:采用的行业内最高吞吐率的微架构,提升工作负载的性能。最大指令窗口容量增加 两倍,以实现更广泛的微架构深度并避免延迟。

·后端:负载管线从三个增加到四个,使后端工作负载得以增长 25%-40%,从而实现更高的性能和能效。

图:前端、核心、后端三层次架构设计提升

Armv9 架构特有的功能:通过集成 SVE2,提高多媒体处理性能和能效

SVE2(可伸缩矢量扩展2)的集成是 Cortex-X925 的一大显著特点。SVE2 将数据级并行处理扩展到了更多功能域,通过加速视频解码、提升摄像头传感器数据处理和增强计算机视觉管线,有效提升了视频播放和拍摄功能。

加速 10 位 HDR (高动态范围)视频解码,减少 10% 的处理周期和能耗

SVE2 可加速HDR 10 高品质视频的解码。无论是 VP9 解码格式还是 AV1 解码格式,SVE2 都能使处理周期减少 10% 且能耗降低 10%,从而将解码性能提升多达 10%。基于此特性,无论在视频流媒体平台上,还是社交平台的短视频中,消费者都能持续享受高清画质,手机电量也更持久耐用。

摄像头传感器数据的处理效率更高,处理周期减少 26% 且能耗更低

SVE2 可改善画质,提升视频通话时的流畅度。其中包括更好的摄像头旋转、切换和应用图像滤镜体验。

使计算机视觉 (CV) 管线的速度加快 20% 以上

凭借 SVE2 Halide 后端,消费者可在智能手机上体验到专业级的摄影性能。SVE2 Halide 广泛应用于智能手机中的影像类软件,得益于 SVE2 的复杂计算机视觉算法管线加速能力,后端能够加速小查询表和点积运算,消费者能够实时改进照片的锐度、色彩、色调和景深,而免去了后期修图的必要。

图:Armv9架构特有的 SVE2 功能,可提高多媒体处理性能和能效

Cortex-X925 是 Arm 迄今最强大的 CPU 之一

Cortex-X925 基于 Armv9.2 架构,树立了 CPU 性能的全新标杆,实现了 Cortex-X 系列有史以来最大幅度的 IPC 同比提升。得益于最新的三纳米工艺节点,Cortex-X925 实现了更高的频率,与 2023 年高端安卓设备上运行Geekbench 单核基准测试相比,这代架构与Cortex-X4相比,实现了超过 35% 的性能提升;Phi-3 等人工智能应用的词元 (token) 首次响应时间提升超过了 45%。

凭借上述的各种提升,Cortex-X925 旨在满足当今设备不断发展的需求,让消费者在广泛多样的应用中,获得无与伦比的性能、能效和用户体验。

 

文章来源于:ECCN    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>