苦心磨一剑,今朝露锋芒。全球IP龙头企业Arm于9月15日召开线上技术媒体沟通会,宣布推出新一代Neoverse V2平台,重新定义和变革全球的计算基础设施。
Arm表示,基于Neoverse的平台正通过市场领先的可扩展效率,使Arm生态伙伴能在各个基础设施领域自由创新,从而重新定义云计算的可能性。
据悉,在全球范围内,Arm现已被用于各个主要公有云,包括AWS、微软、谷歌、阿里巴巴、甲骨文等科技巨头。这意味着,世界各地的每一位开发者现在都可获取Arm Neoverse。
Arm独创Neoverse,为数据爆发时代提供技术支持
在这条Neoverse研发创新路上,Arm已步履多年,所谓厚积而薄发。2018年,Arm发布Arm Neoverse,为万亿联网设备描绘了安全、高性能、灵活的从云到边缘计算的愿景。
2019年2月,Arm公布Neoverse的技术细节和 Arm Neoverse平台路线图,打消了外界对公司愿景的所有疑虑。这一次,Arm推出了Neoverse N1平台,其性能对比 Cortex-A72提升了60%,大大超出了在2018年定下30%的目标。实际上,部分工作负载的性能提升幅度甚至更高。之后,Arm Neoverse合作阵营日渐壮大,诸如亚马逊、富士通(Fujitsu)、赛灵思(Xilinx)、恩智浦(NXP)等公司纷纷加入Arm Neoverse生态。
2020年9月,Arm提出基于Neoverse平台的E、N、V三大系列核心设计原则。其中,V系列在高性能计算、机器学习以及一些对性能优先的高计算应用上有非常大的优势;N系列是一个平衡PPA的设计,在性能、功耗、面积之间寻找平衡设计,适用于通用服务器的CPU芯片,智能网卡的应用芯片,5G基站的网络设备等;E系列专注于更高效的数据吞吐能力,对于网络数据层处理器、低功耗网关的5G部署等应用,优势明显。
今年9月15日,Arm更新Arm Neoverse路线图,推出Neoverse V2平台(代号“Demeter”)。该平台配备最新的V系列核心和产业广泛部署的Arm CMN-700 mesh互连技术,还将为云和HPC工作负载提供市场领先的整型性能,并引入若干Armv9架构安全增强功能。毫无疑问,Arm的新产品将加强其在新一代基础设施发展的地位。
从路线图中看出,在整个基础设施市场中,Arm一直在加速技术创新步伐。作为Arm持续投入于高效的性能和吞吐量的一部分,新一代N系列产品正在开发中,并将于2023年推出。与N2的市场领先效率相比,新一代N系列CPU将在性能和效率方面实现代际提升。针对N2在市场的表现,Arm表示,目前有近20家合作伙伴正基于该平台进行设计,市场反应相当积极正面。其中,国内的初创企业包括遇贤微电子、鸿钧微电子和云豹智能也正基于Neoverse N2进行芯片设计开发。
而E系列内核可以非常有效地作为数据平面处理器使用,支持高吞吐量的SoC和5G及网络。Arm透露,下一次将分享E系列的更多进展。
瞄准云、HPC等领域,Arm Neoverse V2重塑全球基础设施
Neoverse平台专为解决加速基础设施解决方案的各类问题而设计,专用处理能力有助于降低工作负载功耗,并满足现代工作负载更高的计算要求。
Arm Neoverse V2平台可满足大型互联网和HPC客户的需求,在不增加功耗和面积的情况下,进一步推动云工作负载性能。对于云工作负载,最基本的需求是强大的整型性能,要具有良好的可扩展性,并且对于云运营商而言是高效的,而Arm Neoverse V2平台将提供市场领先的整型性能。
除了整型可扩展性能之外,现代云应用程序还拥有大型工作数据集。为能在接近CPU的位置保留尽可能多的数据,Arm在Neoverse V2中增加了2MB的专用L2缓存,比V1上的L2要大上一倍,且使用延迟的负载不变,能让MySQL和Memcached等云应用获得显著的性能提升。
对于像HPC快速迁移到云端的工作负载,矢量性能尤为重要,而ML是未来的关键云工作负载。在Neoverse V2上,Arm已经完成了从SVE到SVE2的过渡,SVE2可帮助满足更多非HPC ML类型的工作负载,同时添加了更多加密指令。Arm还将矢量引擎重构为4通道的128位,并对微架构进行了调整,以提高其有效吞吐量。
在IO方面,通过V2平台,合作方已经能够利用支持Neoverse N2的系统IP底板,包括CMN mesh、MMU、GIC和NI非一致性互连。Arm的CMN-700 mesh互连技术,可支持每块裸片最高512MB的系统级缓存,当前基于CMN-700的设计中增加了每个核心的系统级缓存,从而提升了云原生工作负载性能。另外,Arm Neoverse V2还引入了一些关键的Armv9安全增强功能,主要目的是防御内存攻击。总体而言,Arm认为,在为云工作负载提供出色性能、可扩展性和效率方面,Neoverse V2无疑具有领先优势。
目前,已经有多家合作伙伴在Arm Neoverse V2的基础上进行设计,其中,NVIDIA正利用 Neoverse V2作为其Grace数据中心CPU的计算基础。Grace将结合Neoverse V2的能效与LPDDR5X内存的能效,带来高出传统架构的服务器2倍的每瓦性能表现。
NVIDIA超大规模和HPC副总裁兼总经理Ian Buck称,“Grace基于Arm Neoverse V2核心打造,可提供多达72个核心,并与我们的GPU相结合以建立这些AI。我们有一个新的NVLink-C2C互连技术,可将CPU与GPU结合起来,用于GPU和CPU之间的高性能和一致性通信。未来,Grace加上Hopper将建立其惊人的巨型AI,并解决未来的HPC问题。”
此外,针对从客户体验角度上看,Arm在基础设施架构上有哪些新目标的问题,Arm基础设施事业部产品解决方案副总裁Dermot O’Driscoll表示,“我们聆听了合作伙伴的需求,他们十分关注性能。但随着数据量爆发式增长,他们需要更有效的解决方案,而且是比传统架构来得更有效的解决方案。这将使他们能够拥有具备多核心数的多芯片解决方案,以及针对特定应用的加速能力。这些都有助于提高效率。”
当前,基础设施市场正在被重新定义,Arm Neoverse具备的高性能、高能效的计算能力,以及Arm生态系统所提供的专用处理和工作负载加速能力,将加固未来基础设施的创新技术支撑。
封面图片来源:拍信网
相关文章