前两年,MCU大缺货催生了许多新生玩家。由于Pin to Pin,所以功能架构基本一致,导致MCU厂商在前两年开启了价格方面的纷争。然而,单纯的比拼价格,并不能真正取得市场优势,所以现在MCU厂商转变思路。
“MCU+”是现在厂商的主要差异化思路。顾名思义,就是在MCU的基础上,延伸AI、传感、通信、加密等其它功能,变成一个较为完整的方案,提高产品竞争力。
有些厂商把MCU集成在片上做成SoC,也有厂商与其它产品进行配合。总之,加号后面什么都能放,这些主要看厂商如何理解。
随着MCU市场竞争愈发激烈,MCU+越来越成为市场主流。
MCU+AI
在AI大模型来临之前,行业早就有了边缘AI的概念,随着AI实现的功能越来越强大,将AI集成在MCU上,实现端侧单芯片方案已经成为新趋势。
不过,在低功耗MCU中增加AI/ML能力,又不会大幅度增加功耗是很大的挑战。对此,市面上有好几种解决方案,包括算法、硬件等方面。
在MCU上跑的模型和GPU并不一样,通常使用TinyML。TinyML是机器学习的一个子集,其运行功耗仅为毫瓦级。TinyML工作负载非常简单,所需内存和处理能力远低于面部识别等高级AI,在图像处理方面更多也是牺牲效果获取更低功耗。一般来说,比较小规模的算法,MCU上的DSP或者浮点运算单元 (FPU) 本身就能满足基本要求了,不过在效率上没有什么优化。
为了跑TinyML,Arm推出过专门为该任务设计的处理器内核,如Arm Cortex-M55。它采用Arm的Helium技术,使得设备能够并行执行算术运算,从而实现与 GPU 类似的操作,尽管规模较小。因此,Cortex-M55比典型内核更擅长处理AI负载。不过,这也进一步加大的功耗。
当MCU要跑更大AI算法时,很多厂商就开始在硬件上加入NPU,进一步提升AI/ML的性能,比如说Arm推出的Ethos-U microNPU,这种专用神经处理单元大大提高了Cortex-M 内核的性能,可用作嵌入式物联网设备的AI/ML加速器,AI/ML 计算可以直接在这个新的 microNPU架构上运行,效率远远高于Cortex-M的MCU。
厂商方面,具备AI功能的MCU产品也在最近两年开始爆发。
NXP较早把NPU放进MCU。其在2022年推出的MCX N微控制器产品,融合了LPC和Kinetis传统优势的通用MCU平台,在通用MCU中增加了一个NXP自研硬件NPU,以专门加速边缘通用的AI运算。NPU作为CPU的AI运算协处理器,其内部拥有专门的计算通道。
ST也瞄上NPU。同样在2022年推出首款集成自研硬件NPU神经网络硬件处理单元的通用微控制器STM32N6,算力可达0.6TOPS。此外,它集成了新IP和视频外设,如MIPI CSI摄像机、机器视觉图像信号处理器(ISP)、H.264视频编码器和支持时间敏感网络(TSN)端点的千兆以太网控制器。
英飞凌最近推出的产品,不仅支持Arm Helium DSP指令集,也拥有Arm Ethos-U55 NPU。新推出的PSoC Edge MCU产品里率先进入市场的是E81、E83 和 E84三大系列,除了Helium和NPU的加持,搭配英飞凌超低功耗NNLite(一种用于加速神经网络的专有硬件加速器)能够发挥出更好的AI性能。
瑞萨主要通过采用超强内核的方式,达到大力出奇迹的效果。其全新RA8系列MCU采用基于Arm v8.1M架构的Arm Cortex-M85内核和7级超标量流水线,可提供计算密集型神经网络处理或信号处理任务所需的额外加速。Cortex-M85是性能最高的Cortex-M内核,配备Helium,即Arm v8.1M架构中引入的Arm M -Profile矢量扩展(MVE)。
ADI早在2020年关注边缘AI。与其它厂商不同,ADI直接在MCU中放了一个CNN加速器,比如其在2023年推出的超低功耗AI MCU MAX78000,其内置硬件CNN、双微核、存储器、SIMO和多通信接口,集成的基于硬件的卷积神经网络 (CNN) 加速器可以执行 AI 推理(使用预训练的模型)在非常低的能量水平。
MCU+模拟
在MCU中集成模拟信号链能力,虽说不是什么新鲜事,但也早。早在十年前,电机领域的MCU就已经开始带驱动模块,可以说集成驱动是MCU领域的最早创新。对MCU来说,强大的模拟性能,也是衡量产品好坏的要点之一。
现在,厂商将越来越多的模拟能力集成在MCU内,还有厂商开始布局全集成的方案,也就是集成更多硬件和算法,提供一站式解决方案。
TI一直比较奉行“MCU+模拟”“MCU+传感器”的原则,十多年前就推出24位ADC+Cortex-M0内核的PGA900,后期发布的新发布的M0+ MCU MSPM0,也拥有满满的TI特色的模拟外设,包括1.45M的12位ADC、两个零漂移、零交越失真的运放。
ST在工业电机控制市场超过20年,其STM32C0系列可平替8位/16位MCU,新上市的STM32C071还将引脚拓展至64pin;入门级STM32G0系列内置12位ADC、DAC和比较器以及内置精确的内部时钟;主流STM32G4系列内置高达5个12位ADC、7个12位DAC、7个高速比较器和6个可编程运算放大器,集成了用于三相逆变器和全桥转换器驱动器的先进电机控制定时器;兼具高性能和安全性的STM32H5系列从最基本的安全构建模块到ST维护的安全认证服务,提供可扩展的安全性,满足所有应用需求;面向高端应用的STM32H7系列获得了基于Cortex-M的微控制器行业迄今最高的基准测试分数,高达3224 CoreMark。
NXP新一代电控专用MCU S32K396打造了新一代电机控制器方案,方案核心器件(如SBC, Driver)为业内比较前沿的芯片。
瑞萨去年11月推出的面向高端工业传感器系统推出一款全新RX产品——RX23E-B,该新型MCU集成24位Delta-Sigma A/D转换器,转换速度高达125 kSPS(125,000采样/秒),比现有RX23E-A产品快8倍。这一产品还将AFE和MCU集成在单个芯片,从而缩小了系统的整体尺寸,减少元件数量。
国内厂商对于MCU+模拟有着自己的理解。
芯海科技凭借“模拟信号链+MCU”双平台领域20余年的技术积累,专注于ADAS自动驾驶域、底盘域和座舱域等核心领域。比如说,CS32F036Q则是一款面向车身控制应用、通过AEC-Q100认证的车规MCU,它还提供了一整套的解决方案,包括MCU、模数转换器(ADC)和模拟前端(AFE)等。
元能芯则主要做MCU+Driver+MOSFET集成化设计,主打智能功率系统。比如说,其全集成明星产品MYi0002V0405,该产品集MCU、Driver、MOSFET于一体,集成式设计能将整个板子面积至少缩小50%以上,完美解决体积、贴片、散热等痛点,可广泛应用于风机、小水泵,甚至是汽车热管理系统中。这家公司也曾表示,现在MCU市场太卷了,所以不将自己定位为MCU公司,甚至可以大胆说元能芯方案中的MCU是不需要客户另外花钱买的,只要客户应用MetaOne平台开发智能功率系统,在整个方案中,MCU可以是送的,平台还附赠好用的整体解决方案。
MCU+感测
如果说MCU是电子产品的大脑,那么传感器就是电子产品的五官。二者密不可分,厂商越来越强调二者的融合。
当然,此处的传感器,并不是大多MCU内部都集成的温度传感器(检测MCU自身芯片温度和健康),而是专门为特定应用集成的传感器。
大约从2014年前后开始,“MCU+传感器”的结合成为一种主流方案。不过,大多数厂商给出的方案都是MCU和传感器的分离方案,因为这种方式更有弹性,加上如果使用MEMS传感器,MCU+MEMS的制造工艺比较复杂。
还没成为主流,不代表没人做,现在就有厂商开始采用“MCU+传感器”的SoC以及SIP形式,推出产品。
曦华科技的MCU+,就是MCU+电容传感器的形式,在MCU内部集成相应的资源,比如触控、车灯、电机、无线充电等特定应用。曦华的CVM012x系列集成19ch通道的自电容检测,为了提升电容检测的精确度,两个型号的TMCU都配备有12位ADC,采样速率为2.0Msps。CVM012x系列车规MCU采用曦华科技独创专利电容检测技术,具备极高的电容检测精度,自互一体电容检测技术,最高支持4nF负载电容、30ch自容通道以及15 x 15ch互容通道,支持Active Shielding技术以更好地支持触摸防水性能,远超常规产品量程水平等综合指标。
泰矽微是一家专注于物联网MCU+芯片的国产厂商,其推出的TCAE系列主要应用场景是TWS耳机的人机交互,单芯片可实现压力传感的检测和识别算法、电容滑条按键、耳机入耳佩戴识别以及电容按键的各种触摸组合。TCAE系列包括TCAE31和TCAE21两大分支产品,TCAE31“三合一”可同时实现2通道压感,4通道入耳检测和3通道滑条按键功能;TCAE21“二合一”可同时实现2通道压感和4通道入耳检测功能。根据其战略规划,后续还将在电源管理、电池管理、射频、触控等技术方向推出更多系列化“MCU+”芯片,覆盖消费,工控及汽车等各个应用领域。
逐渐变成SoC的MCU
现在的MCU,功能越加越多,变得和SoC越来越像了,不过毕竟还保持着低功耗的特性,叫MCU也未尝不可。
总之,MCU市场那么卷,想要从市场上脱颖而出,就要多一些差异化功能,提供更为完整的一体化方案。这样,既能加速产品上市速度,又能与MCU更好地同频共振。