GPU如今似乎已经超越了CPU,无论是在桌面,服务器抑或是手机,都可以在图像处理或者ML处理方面显著提升用户体验。Arm最近推出了采用第五代GPU架构的Immortalis-G720,将为各种设备带来全新的体验。Arm 终端事业部产品管理高级总监 Anand Patel对该系列新品进行了解读。
Patel介绍道,全新第五代 GPU架构通过专注于系统级优化,专注于处理效率,实际应用场景等完善游戏体验,并且要支撑包括游戏机、笔记本、电话、游戏手机等丰富场景。
Immortalis-G720带来了全面系统级的效率提升,使用内存带宽减少 40%,每瓦特性能提升15%,峰值性能提升15%,并且整个架构吞吐量提升了一倍,而如果在工艺及DRAM上进行提升,终端系统性能还将有进一步提升。
延迟顶点着色(DVS)技术是新增特性,彻底解决了集合数据流。DVS可以有效减少DRAM带宽以及功率,这点Arm已经通过实际测试证实。
其中,VRS从增加到 4X2 或者 4X4 着色,意味着着色速度可以最高提升16倍。其次,增加了二倍多重采样抗锯齿,可以动态权衡性能与质量。第三,是完善对动态缓冲区的支持,提高了 GPU 和 CPU 的性能,并增加了带有硬件边界检查的加载和存储指令,这减少了使用Vulkan动态缓冲区的CPU负载。
另外,在GPU固定功能部分也有提升,优化了某些单元以及吞吐率,包括 Z/S 单元,纹理单元等等。另外,光线追踪有自己的电源区,这就意味着可关闭节省漏电。
在物理设计方面,首先,调整了时钟、电压和功率域的边界,使各域的操作点脱钩,从而灵活GPU 的功率使用。比如可降低着色器内核的速度,并在内存系统中花费更多的功率,从而应对内存系统的限制。另外可以提供两个电源轨,以支持更高级的GPU。
在工具方面,Arm提供了丰富的GPU工具,所有功能免费,且开箱即用,并且新增了很多功能组件。比如 profilers 数据分析器支持事件追踪、能计数器、着色器分析、图形 API 调试等。同时今年年底将会推出的Frame Advisor,是基于帧的游戏分析器,支持 Vulkan 和 OpenGLES,使用一个层驱动来捕获每一帧中所有的 API 调用,通过分析引擎,为开发者提供反馈。
在过去的一年中,Arm在光线追踪方面发力不少。包括在 Basemark 的 In Vitro 基准测试中展示了其性能,在今年 Vulkanised 大会上分享了其最新的最佳实践,与腾讯游戏和MediaTek合作,在今年 GDC 上发表了一篇关于 SmartGI的论文,在Google游戏者开发峰会上展示与Google 和Unity 在自适应领域的合作,与 Epic虚幻引擎 5 进行合作等等。
另外,Arm也在持续针对 GPU 开发功能来支持机器学习,比如MobileNeRF 进行基准测试。
第五代GPU还包括了Mali-G720和Mali-G620,以满足不同需求场景。