Arm宣布Neoverse再度进阶,新增两个全新的平台—Arm Neoverse V1平台以及第二代的N系列平台Neoverse N2,N2与V1未来将分别代表最高单芯片性能和最高单线程性能。Arm Neoverse全新计算平台预计以每年增长30%的平台性能为指标,持续优化到2021年。
9月23日,Arm举办线上发布会,宣布面向云到边缘基础设施产品(Arm Neoverse)再度进阶,新增两个全新的平台—Arm Neoverse V1平台以及第二代的N系列平台Neoverse N2。
Arm曾在2018年底宣布了Arm Neoverse初步路线图,强调了对基础设施市场的专注和持续投资,并承诺平台效能达到30%的年增长率指标。2019年1月,Neoverse N1内核提供的性能与Cortex-A72相比提高了60%,远超当初目标。从HPC到边缘计算,Arm Neoverse无疑是非常成功的。
会上,Arm基础设施事业部高级副总裁兼总经理Chris Bergey细数了Arm近两年所获得的成就:
1、在前七大互联网公司中,公开宣布采用Arm技术的就有4家;
2、在高性能计算HPC领域,以Arm技术架构为基础的“富岳(Fugaku)” 超级计算机名列TOP500排行榜第一;
3、在整个5G生态系统厂商中,从L1到传输的整个堆栈及新兴OpenRAN和VRAN计划,Arm都获得了一系列重设计项目;
4、在关键的基础架构和边缘应用领域,Arm已推出uCPE 转Arm以及Project Cassini计划。
在软件方面,Arm拥有最大的持续集成/持续交付(CI/CD)平台,始终专注于云原生,之后也将继续建立大量商用ISV应用程序。
在数据中心领域,Arm兴起来源于诸多因素的推动,但始终是围绕着性能的。据Neoverse N1推出已将近一年,市场上也取得了颇多进展。下图为N1公开的测试数据,无论是存储、移动还是计算数据,N1都表现出优良的性能。
自Neoverse系列推出以来,Arm是如何说服互联网和云计算客户转向使用Arm产品的呢?
以下图为例,将基于传统架构的机架与基于Arm Neoverse的机架进行了对比,两个都是标准42U机架。在12.5KW功率下,Arm Neoverse平台提供了更高的整数吞吐量和单线程性能。通常受配电限制的云提供商,现在可以在每个机架上托管更多客户,从而带来更高收入和更多计算周期。N1不仅适用于数据中心,在5G和边缘计算领域也有很大的优势。
Arm推出全新平台Neoverse V1与N2
性能与效率获大幅提升
Arm对N系列的PPA特征定义是“性能、功率、面积得到了同等的考量”,这一点是非常值得进行扩展的。E系列则是注重效率,在功耗和面积的缩减上进行优化,对于网络流量和数据应用程序非常有效。
此次所发布的Arm Neoverse V1全新平台突破了性能极限。Neoverse V1作为V系列的第一个平台,与N1相比,其单线程性能可提升超过50%,对于CPU性能与带宽更高要求的应用来说,是性能表现最佳的平台。重要的是,Neoverse V1支持可伸缩矢量扩展(Scalable Vector Extensions, SVE),为高性能云、高性能计算与机器学习等市场带来庞大的应用潜力。VI平台在执行SVE代码时,可以全天全频率运行,SVE架构使其可以在寄存器宽度之间无缝转换,因此可以合并新的宽向量SVE指令,并重新使用较小寄存器编写的辅助函数。
Arm的N系列、E系列与V系列都允许单线程更快执行,基于这三个系列,Arm Neoverse可以满足完整计算需求。
Arm Neoverse平台PPA设计原则
据介绍,搭载N1平台的产品正在生产中,并已部署了数百万个内核,采用E1平台的产品设计正在开发中,将会很快面向市场。VI平台之前代号是“Zeus”,它将支持2个256位宽度的向量,在目标市场之间取得了良好的平衡。
Arm将于今年年底为客户提供一个更高性能的选择,即横向扩展高性能等级内核——N2平台,代号“Persens”。Arm表示,N2预计会比N1高出40%的单线程性能,同时保持相同水平的功率和面积效率。Arm再次承诺2022年及以后,Neoverse系列性能以30%速度进行增长。
Arm Neoverse N2平台
Neoverse N2是一个超级可扩展平台,其用例可横跨云、智能网卡(SmartNICs)、企业网络到功耗受限的边缘设备。相比于Neoverse N1,Neoverse N2在保持相同水平的功率和面积效率之余,单线程性能提升了40%,可以很好的满足高性能和大范围的应用。
Arm Neoverse路线图更新
如何选择Arm平台?
对于不同Arm平台的选择取决于应用程序需要什么。如果应用程序对CPU和贷款要求较高,选择VI可提供最佳的单线程性能,如果应用程序需要更多的涉及横向扩展并需要更多的内核,N2更为适用。
下图是Arm的一份对竞争系统的测试数据,其中X轴代表芯片级性能,Y轴代表每线程性能。在128核情况下,N1的芯片级吞吐鲁昂和单线程的性能方面都达到领先,N2与V1未来将分别代表最高单芯片性能和最高单线程性能。
Arm最主要的目标之一就是为合作伙伴的持续创新与设计灵活性提供必要组件,关键点在于Arm的芯片级接口,这提供了设计系统层级解决方案的机会。因此,Arm在CCIX(用于双向相干通信的协议)与CXL上都进行了投资,CCIX在使用方式上具有灵活性,用例包括多路计算与多核封装,可以减小晶圆尺寸、增加成品率并降低成本,而CXL解决了CCIX不能解决的一些关键应用,例如内存池和扩展,是连接加速器的首选方法。Arm为合作伙伴提供了可扩展性的交换网,用以支持大量的处理器核。
除全新平台外,Arm还推出了Project Cassini,目的在于为软件开发者提供流畅的体验。通过标准、平台安全性与参考实施,Project Cassini能够帮助行业伙伴在基于Arm平台上部署“装机即用“的软件。
同时,Arm也会持续推动基础设施的基础软件支持。操作系统 、虚拟机管理程序,例如 Xen、KVM、Docker容器以及越来越多的Kubernetes都已经陆续宣布支持Arm架构
相关文章