在近期(2024年9月11日)举行的发布会上,Imagination Technologies 推出了其最新的 GPU IP 产品,强调了在功能安全和计算性能方面的重大突破。Imagination车载GPU产品总监,章政先生向业界介绍了公司最新研发的车载 GPU 产品——DXS GPU。他表示,该产品专为汽车市场设计,以满足不断增长的自动驾驶和智能座舱的需求。而这款新一代 GPU 将为汽车市场带来更智能的驾驶体验、更迅速的人机交互以及更丰富的娱乐功能,同时降低能耗。
章政先生表示,车载市场正以每年8%到10%的速度快速增长,尤其在ADAS(高级驾驶辅助系统)和车内人机界面 (HMI) 领域。随着电气化的推进,越来越多的新玩家进入市场,OEM 和 ODM 厂商也开始自主研发芯片,以满足对高性能计算的需求。
传统移动设备领域的芯片厂商也纷纷切入汽车市场,竞争日趋激烈。而在传统的汽车架构之中,一般都采用分布式 ECU(电子控制单元)控制各个模块,存在升级困难、布线复杂、成本高昂等问题。随着电气化的发展,汽车架构正逐渐向中央计算和虚拟化转变。通过虚拟化技术,可以将多个 ECU 功能整合到一个计算单元中,并通过远程升级 (OTA) 方式不断更新功能,提升用户体验。
在当前的车载市场的大背景之下,章政进一步谈到,Imagination作为一家拥有39年历史的IP公司,一直致力于图形处理器技术的研发。特别是在车载行业,Imagination已深耕超过二十年,自2004年与瑞萨合作推出首款车载产品以来,其GPU产品出货量已达130亿颗,其中3.95亿颗器件被安装在车辆中。
多年的技术积累让Imagination在数字座舱、安全仪表盘和后排娱乐等方面提供了类似智能手机的视觉体验,同时在功能安全和多任务处理方面为传统和新兴车厂提供了卓越的用户体验。Imagination的GPU架构之所以在汽车领域受到欢迎,是因为它能够满足车辆座舱显示和自动驾驶计算的双重需求。PowerVR GPU原生支持多达8个虚拟机,可以完成车上所有任务,同时提供高效的渲染和高性能的计算能力。不仅如此,Imagination与合作伙伴长期在功能安全领域投入,推出了针对汽车需求的XS产品线。该产品线不断推出新功能,以更灵活的方式满足功能安全需求,提高效率和安全性。研发过程遵循严格的V字型流程,确保产品质量。
在回顾了Imagination的技术积累和车载市场的发展之后,章政向各位隆重介绍了本次线下会的全新产品——Imagination DXS GPU。章政表示,新一代车载GPU产品将给汽车消费者带来更智能的驾驶,更迅速的交互、更丰富的娱乐以及更低的电力消耗。
DXS GPU代表了Imagination在车载GPU领域的最新成就,它不仅是一款高性能的图形处理器,能够支持车内所有屏幕的娱乐和交互需求,而且在硬件性能上比前一代产品提升了50%。DXS GPU的推出,标志着Imagination在AI性能上的提升也远超50%。
DXS GPU的设计理念完美契合了当前汽车架构从分布式向中央计算转变的趋势。它不仅提供了超越CPU的计算性能,而且在编程灵活性上远远超过了NPU和加速器SoC,这使得DXS GPU成为高性能中央计算的理想选择。
DXS GPU最引人注目的创新之一是其全新的功能安全解决方案——分布式安全机制(DSM)。这一机制几乎完全消除了传统功能安全方案在性能和芯片面积上的损失,为车载GPU的安全性能树立了新的标准。在车载应用中,功能安全是至关重要的。它确保了车辆的电子系统能够在各种条件下稳定运行,从而保障驾驶员、乘客和行人的安全。DXS GPU通过其创新的分布式安全机制,不仅提升了GPU的性能,同时也确保了功能安全,这对于自动驾驶和高级驾驶辅助系统(ADAS)的发展具有重要意义。
提到安全,如今随着自动驾驶技术从实验室走向现实,功能安全成为汽车行业关注的焦点。章政表示,在实验室环境中,自动驾驶系统往往缺乏真实场景中的复杂性和风险因素,例如行人、障碍物等。然而,当自动驾驶汽车驶上街头,功能安全变得至关重要,它直接关系到人员安全和车辆可靠性。
功能安全的核心目标是确保自动驾驶系统在面对潜在风险时,能够按照预定的安全策略执行,避免发生事故。任何自动驾驶系统在执行过程中出现的偏差,都可能导致无法预料的后果,这对于企业、家庭和个人都是无法承受的损失。因此,功能安全已成为汽车领域不可或缺的重要趋势。
功能安全并非一刀切的标准,而是根据不同的安全风险等级划分。例如,车载娱乐系统可能不需要严格的功能安全保障,而车身状态显示、行人识别等与安全直接相关的功能,则需要满足高等级的功能安全要求。为了应对这些多样化的需求,Imagination 提供了相应的解决方案,例如利用虚拟化技术来解耦不同安全等级的任务,确保关键安全功能不受其他非安全任务的影响,从而实现安全高效的自动驾驶体验。
在讨论功能安全之后,章政开始介绍全新发布的DXS GPU的性能。
他谈到,DXS GPU在设计中引入了新的SPU单元,使其硬件性能提升了50%。DXS GPU采用5纳米工艺节点,运行频率更高,支持多核配置,四核配置下可达到1.5GHz主频,提供9 TFLOOS FP32性能和32 TOPS int 8性能,同时处理288G像素每秒。DXS GPU的设计还考虑了高端制程大芯片良率问题,采用多小芯片(chiplet)封装技术提高良率和设计灵活性。DXS GPU支持将两个chiplet组合成一个GPU或单独作为两个独立GPU使用,通过灵活的总线设计实现工作负载的均匀分配。
在SPU方面,DXS GPU进行了多项优化,包括2D双速纹理处理技术,以应对日益增长的纹理处理需求,提升性能。此外,针对Vulkan等游戏中小型任务的频繁切换,DXS GPU改进了流水线数据主控,减少了任务切换时的性能损失,并更新了固件处理器以提高任务调度效率。
DXS GPU引入了可变分辨率渲染和ASTC HDR支持等新功能,显著提升了游戏性能和效率。与传统图形处理相比,DXS GPU在硬件性能上高出竞品四倍,在渲染类任务上单位面积性能高出竞品两倍,在计算为中心的图形处理任务上单位面积性能高出竞品28%。
在安全性方面,DXS GPU的分布式功能安全机制使功能安全相关的应用性能翻倍。DXS GPU在软件和AI方面也有所提升,支持FP16半精度浮点计算和int 8精度计算,提供强大的AI计算能力。DXS GPU的生态系统基于开放标准,如OpenCL、Vulkan和one API,有利于降低研发成本和市场推广。
DXS GPU的灵活性使其能够通过虚拟化技术实现不同工作任务的和谐共存,如自动停车和ADAS功能。在安全性方面,DXS GPU致力于提供高可靠性的ADAS计算结果,并保证运行时的功能安全。
面对半导体技术的带宽和工艺节点瓶颈,DXS GPU通过架构创新,如FP16功能和双速率FP16单元,提高了AI工作负载的性能。DXS GPU还通过增加片上存储,减少了系统产品的带宽要求,降低了ADAS实现的限制。
在硬件之外,Imagination DXS GPU 通过一系列软件优化和库的支持,极大地提升了 GPU 的易用性和性能,降低了开发者的门槛,使得广泛的应用开发者能够充分利用 DXS GPU 的强大性能。为了帮助开发者尤其是应用开发者充分利用 GPU 的性能,Imagination 开发了多种底层库,包括几何库、BLAS库(imgBLAS)、CNN库(imgNN)以及专门处理车载工作的库,如 FFT 库(imgFFT)。这些底层库经过大量软件调优,确保了在 Imagination GPU 上的效率最高。
另一方面,Imagination 认识到并非所有开发者都使用底层库,因此将这些库对接到 open API 上,并进行了优化。作为 oneAPI 基金会的成员,Imagination 支持 oneAPI 的发展,并为基金会贡献专业知识,加速其发展。此外,对于习惯使用其他框架的开发者,Imagination 提供了 PVRtune 工具,帮助他们在 DXS GPU 上分析框架和工作负载,发现性能瓶颈。另外,DXS GPU 支持计算机视觉等应用,如 ADAS 数据的预处理和后处理。Imagination 与 OEM、ODM 和领先供应商合作,确保这些应用能够高效运行。同时,Imagination 遵循 UXL 基金会的标准,推动软件在不同架构间的自由迁移,降低迁移成本。DXS GPU 在 AI 性能上同样也实现了巨大飞跃,相较于前一代产品提升了近十倍。这一提升部分得益于硬件性能的增加(约 50%),但更多来自于软件支持和协同,特别是在计算库方面的 2 到 4 倍性能提升。通过优化带宽使用和片上内存,以及尽量保持计算在片上进行,DXS GPU 不仅节省了带宽,还降低了能耗。
最后,Imagination DXS GPU 不仅是最强的车载功能安全 GPU,还通过软件优化和计算库的增强,实现了硬件利用率的最大化。DXS GPU 提供了灵活的配置选项,满足不同厂商的产品定位和性能要求。随着计算库的不断进步,DXS GPU 能够实现更多的 ADAS 工作,并支持灵活的 ADAS 算法,使客户的产品更具可持续性。凭借 GPU 的可编程性和强大的算力,DXS GPU 能够快速适应新的自动驾驶算法或功能,满足市场和客户的需求。