MCU巨头,血拼GPU性能

2024-03-13  

曾经,MCU是电子产品的控制核心,GPU是图像世界的掌控者,二者在过去很少有交集。随着越来越多图形处理需求,MCU中放GPU,已经不是什么新鲜操作。


最近一段时间,边缘AI概念的兴起,以及汽车图形显示性能的提升,越来越多的MCU厂商开始“卷”图像处理性能。


MCU的图形历史


在那个没有GPU的时代,所有图形还都是交给CPU绘制。虽然这没什么问题,但随着显示图形图像愈发复杂,CPU越来越力不从心。对计算机来说,低效率带来的就是延迟和卡顿,整体功耗也会随之攀升,GPU便应运而生,将CPU从繁重的图形计算任务中拯救了出来。


MCU也有类似的发展历程。早期MCU极少有图形显示的需求,即便有,也只是简单的12864之类的显示设备,运算量不大,MCU的CPU可以轻松胜任。但渐渐的,嵌入式系统的显示分辨率和色彩一路飙升,光是用MCU中的CPU跑效率并不高。


自STM32F429开始,一个类似GPU的外设加入到STM32的MCU中,ST将其称之为Chrom-ART Accelerator或DMA2D,它可以为2D绘图提供加速,非常类似现代显卡中GPU的功能。


不过,与我们熟悉的PC GPU不同,这个“GPU形似物”只是为嵌入式控制系统做示意性的表示和控制,大多也只是提供2D或者2.5D加速,功能非常简单。但它已经可以满足大多数嵌入式开发中的图形显示加速需求。


这样的情况一直延续到了2017年,虽然巨头们的产品中都会有图形加速单元,但图形应用专用MCU的市场依旧一片空白。


那时候,MCU在图形处理方面,对比MPU或者SoC还是有很大短板,某些计算和图形处理方面不是很强的应用,用MPU和SoC来跑实在显得有些性能过剩,功耗效率也不尽人意。


2017年,Microchip就给MCU中塞进去了一个2D的GPU,支持高达24位色彩的3层图形控制器(GLCD)。在那个时期,图形处理性能堪称单片机界的翘楚,这颗芯片也被冠以“最强PIC”的名号。



光是塞进去GPU,可不行


不过,光是塞进去GPU是无法驱动起这种图形性能的,在图形应用中,MCU内部存储有时候会成为木桶短板。


典型MCU内存普遍为500KB左右,典型图形应用需求则达到3M~15M+,因此想要在MCU中实现GPU的功能,必须拓展内存。那时候Microchip的做法就是内置DDR2或者外置DDR2,同时内部拥有2MB的闪存。


Microchip的成功,引发诸多厂商跟进。现在,把GPU放进MCU似乎也不是什么稀奇事,越来越强大的存储系统,也为图形功能保驾护航。


反观如今的市场,比拼GPU性能,也是MCU厂商的暗战主线之一,可以说,现在的MCU和微处理器单元(MPU)之间的图形性能差距,已经越来越强小了。


MCU巨头,加码图像性能


最近一段时间,MCU厂商们依然在不断拓展其产品的图形处理能力,专攻图形的MCU已经逐渐成为构建完整产线的重要一环,目标则是用MCU实现昂贵的MPU才能实现的图形效果。


先楫:放进GPU IP的国产MCU


2024年3月4日,先楫半导体推出新一代数字仪表显示及人机界面系统应用平台——HPM6800系列。


HPM6800配备芯原的高性能2.5D OpenVG GPU,MIPI、LVDS双屏显示接口及双摄接口,非常适合高分辨率图形显示。


在存储方面,片上内存1MB,支持扩展内存DDR2-800,DDR3/DDR3L-1333。


根据介绍,芯原支持OpenVG的2.5D GPU IP能够为MCU/MPU设备提供高能效的图形处理和优质的图像输出,同时显著降低CPU负载。凭借其成熟的可扩展性,该GPU已广泛应用于领先的汽车、工业和可穿戴产品中。此外,芯原还与领先的GUI软件服务提供商展开合作,以丰富面向GPU关键应用的生态系统,有效加快客户产品的上市进程。



HPM6800封装17×17 417BGA P0.8,工程师们感觉可能会不太友好。不过,HPM6800的定位确实不太一样,更聚焦于将高效的图形处理、复杂的人机界面及实时的信号控制三项功能融合并集成一体,最大限度地发挥系统效能。


兆易创新:高性能MCU中的IPA


2023年5月,兆易创新推出Cortex-M7内核超高性能MCU GD32H7系列MCU,芯片内置了TFT LCD液晶驱动器和图形处理加速器IPA(Image Processing Accelerator),支持2D图像叠加、旋转、缩放及多种颜色格式转换等功能。


存储方面,配备了1024KB到3840KB的片上Flash及1024KB的SRAM,其中包含512KB可配置超大紧耦合内存(ITCM,DTCM),可确保关键指令与数据的零等待执行;配备了64KB L1-Cache高速缓存(I-Cache,D-Cache),有效提升CPU处理效率和实时性。外部总线扩展(EXMC)支持访问SDRAM、SRAM、ROM、NOR Flash和NAND Flash等多种片外存储器



ST:媲美MPU的工业MCU


STM32U5是一款改变游戏规则的低功耗MCU,该系列于2021年推出,主要定位于工业场景,包括工业控制、工业表计和医疗健康、个人穿戴设备等。


2024年1月31日,ST推出新款STM32U5微控制器(MCU) —— STM32U5F9/G9和STM32U5F7/G7,集成了ST的NeoChromVG图形处理器(GPU),能够实现的图形效果可与更昂贵的MPU相媲美。



新系列U5产品是STM32首批支持硬件加速矢量运算的MCU,能够渲染SVG图像和矢量字体。内嵌的NeoChrom GPU帮助CPU承载了图形计算任务,释放内存并提高性能,可实现更流畅、更丰富的图形效果,比如图像旋转、Alpha透明度混合和精确视角的纹理映射等高端图效。


此外,该系列产品的SRAM和闪存的性能有所增强,片上集成了3MB SRAM存储器和4MB闪存,为代码和数据提供了充足的非易失性存储空间。


可以看出,ST作为MCU界的风向标,已经开始将重点放在提升图形性能,以达到用简单的解决方案设计出高端、动态的显示屏的目标。


英飞凌:增强汽车图形显示


去年年底,英飞凌科技推出搭载新型图形引擎的全新TRAVEO T2G-C系列车用微控制器(MCU)。


根据介绍,TRAVEO T2G-C系列微控制器配有专用的图形加速器,能够以MCU的成本,打造具有MPU性能的仪表盘、车载信息娱乐和座舱系统。


在内存方面,该系列MCU具有高达6MB的闪存和4MB的内部显存或1GB LPPDR4显存。


MCU内置的图形引擎可将图形处理所需的内存减少3~5倍,从而降低功耗和成本。由于配备经过优化的2.5D图形引擎,该MCU可支持分辨率高达1920 x 1080的全虚拟仪表盘。此外,全新T2G-C系列MCU已推出工程样品。其具有一个LPDDR4接口,可显示复杂的3D场景,为设计人员设计现代人机界面(HMI)带来了更大的自由度。


不仅如此,今年1月,英飞凌又宣布与Qt Group合作。全球制造商一直在寻找能尽快将其产品推向市场的方法,这些MCU通常不会直接出厂配备高级的图形工具,Qt就是帮助设计和开发流程高效。


恩智浦:跨界MCU也有GPU


早在2020年,恩智浦发布的i.MX RT500系列跨界MCU便集成了2D GPU,同时将Cadence Tensilica Fusion F1 DSP内核与Arm Cortex-M33内核集于一身。GPU加速单元的好处是能提供更炫的显示效果,并更高效地完成诸如图形缩放、旋转、倾斜、图层叠加、混合等显示效果。


与此同时,在i.MX RT500集成了多达5MB的SRAM。根据恩智浦的介绍,通常来说,大SRAM是非常耗电的。但在i.MX RT500里,即使这么大的RAM,通过恩智浦工程师对电路结构的改良,也可以做到较低的功耗。


而后2021年推出的i.MX RT1160系列和2023年推出的i.MX RT1170系列跨界MCU均搭载2D GPU。



瑞萨:针对图形显示的解决方案


2023年12月,瑞萨发布RA8系列的第二款产品RA8D1,该产品也搭载了2D图形绘制引擎,图形LCD控制器支持高达WXGA的分辨率(1280×800),并行RGB和MIPI-DSI接口连接外部LCD和/或TFT显示器,强大的2D绘图引擎,16位CEU摄像头接口,32位外部SDRAM接口。


存储方面,集成2MB/1MB闪存和1MB SRAM(包括TCM,512KB ECC保护)。


不止如此,瑞萨支持开源的轻量级多功能图形库(LVGL),以及强大的图形和AI生态系统合作伙伴网络。具有LCD面板和相机模块的全功能图形评估套件完善了该解决方案,并为工业HMI、视频门铃、病人监护仪、图形计算器、安全面板、打印机显示面板和家电显示器等图形应用搭建了强大的开发平台。



图形性能之战,开启


通过上述巨头动作不难看出,越来越多的MCU巨头开始加码对于图形显示赛道的投入,随着越来越多智能家电、智能家居控制器、电动车和工业终端中追求越来越清晰的画质,并对动画徽标、字体大小、可缩放地图和视频播放等技术逐渐有了更大需求,图形专用MCU已经成为厂商竞争的另一个赛道。


一切源于需求,现在的MCU愈发“跨界”,与MPU的界限越来越模糊。


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。