恰巧最近做的几个有趣采访,都和边缘/端侧AI相关,包括瑞萨刚刚了收购Reality AI——这就是一家做边缘AI和TinyML的企业;还有国内的知存科技量产了首颗存内计算芯片,这类芯片目前的应用主场是端侧产品AI计算;去年EE Live直播间做过一场......(本文的“边缘(edge)”一词将窄化到终端(endpoint)设备)
把AI计算——或者有时可以窄化到神经网络的矩阵乘加运算,带到端侧设备上并不稀罕。智能手机就是个典型的端侧设备,现在的智能手机AP SoC芯片上普遍都配有专门的AI计算单元,苹果称其为NE(Neural Engine)、Arm和华为叫它NPU、联发科则将其叫做APU。
即便是IoT这种更小算力的端侧设备,其实也有AIoT这样的称谓。这里的A就是指AI——当然其含义可能比深度学习、神经网络更宽泛,但IoT端侧设备要带AI能力也是时代主旋律。2022年6月29日,全球领先的专业电子机构媒体AspenCore将与深圳市新一代信息通信产业集群联合主办,同期将举办工业互联网、智慧家庭、智慧机器人、智慧可穿戴、智慧两轮车等多场分论坛,多家企业将在论坛现场探讨AIOT领域的前景机遇。 现场与行业资深人士交流与互动!了解大会详情。
近一年TinyML这个词好像格外火:这和AI、IoT作为时下最热门的应用领域有很大的关系。虽说TinyML Foundation官网看起来像是个很松散的组织,Arm、瑞萨、Reality AI、莱迪思、英飞凌、谷歌、高通等都在其赞助商和合作伙伴之列,就足见TinyML的声势之大。
TinyML设备出货量几年后25亿
ABI Research的数据是2021-2026年,IoT连接数有3倍增长,届时IoT连接数会达到236亿。当然并不是所有的IoT设备都会带上AI或机器学习能力,但这是TinyML的市场基础。
所谓的TinyML,看字面意思就知道是微型的(Tiny)机器学习(ML)。“微型”是相对于一般需求更高算力的AI计算而言的。比如前文提到的手机AI计算单元——智能手机AI算力所需的功耗和成本是IoT设备上承受不住的。比如智能家居设备中由电池驱动的智能温度传感器,或者工业制造场景中部署的在马达上检测振动异常的传感器+MCU设备。
IoT设备通常总是通过传感器不停地收集数据,比如说影像画面、温度湿度、存在感知等等。将大量数据集合以后,进行机器学习的模型训练,就有机会生成更有价值的信息:AI在智慧交通、智能城市、智能家居之类的应用大多就是这么回事。不过AI计算是个需要算力和成本的工作。比如云上的大规模AI模型训练(training),必然是基于大算力的GPU或者专用的AI芯片。
模型训练完成后,复杂的AI推理(inference)工作也不适用于大多数小算力的IoT设备,而需要在云或边缘数据中心进行。一般IoT设备上的16位/32位MCU对于承接AI计算显得相当无能为力。TinyML的提出,就是为了找寻AI计算在IoT设备上的成本、功耗均衡,让数据分析工作也能在算力并没有那么高、存储资源还不多的硬件,配合专门设计的软件(小规模AI推理工作)上执行。
从TinyML Foundation官网介绍来看,典型的TinyML IoT设备应该将系统功耗控制在mW级别,模型尺寸小到100kB以下。也就是说TinyML设备,要在超低功耗、性能受限的环境下做本地的AI工作。不过这样的机器学习模型主要是扮演过滤的角色,比如说将那些不必要的参数、低于阈值的数据排除在外;唯有有价值的数据才会促使IoT设备做出相应的动作——不仅是本地响应(比如说家用警报器发现问题时发出警报),也可以是将数据进一步发往网关或云。
TinyML并不是要替代更复杂的AI推理,而是把一小部分特定能力迁到端侧设备上。那么就省去是总是需要联网、做数据通讯的麻烦,不仅能够显著降低功耗,而且也更为实时、有更高的隐私和安全性。ABI Research去年发布过一份TinyML: 白皮书。这家机构预测TinyML市场出货量会从2020年的1520万个设备,增长至2030年的25亿个IoT设备。
其潜在应用领域典型如家庭安防、智能家居自动化、宠物定位和追踪、健康类可穿戴设备;工业与生产中的资产追踪、制造缺陷发现、智能楼宇/建筑;交通领域的车流监控与交通高峰期的疏导、智能路灯;还有智能电网、智能仪表,以及物流和运输等。
来源:ABI Research
上面这两张图是ABI Research预测的2021-2030年,不同应用领域TinyML设备的出货量,以及TinyML芯片能够产生的营收(分成了ASIC、FPGA和MCU)。市场增长潜力看起来还是相当之大。
其实TinyML跟端侧AI的很多应用原本就是重合的,只不过TinyML给定了某种更严苛的算力和功耗限制。从某种角度来看,TinyML这个词或许更有浓重的市场宣传色彩。不过围绕TinyML展开的研究和努力是真实存在的,而且其发展动力可能还超乎想象。
聊聊TinyML芯片的可能性
我们见过不少边缘AI芯片或系统。为普罗大众所的,如——这是个能直接应用英伟达的AI和CUDA生态的硬件产品,基于英伟达GPU做AI开发。同类明星产品也不少,包括一些加入了专用AI计算单元的,像是瑞芯微RK3399 Pro、晶晨A311D、Intel Myriad X、谷歌edge TPU等。
前两年的工业博览会上,我们看到一种e-AI(嵌入式AI)故障预判解决方案,这个demo演示的是工业现场的电机运行状态:有个加速度传感器采集电机的振动情况。本地有专门的AI计算加速单元,名为DRP(Dynamic Reconfigurable Processor)。在电机的振动参数有某些异常变化的情况下,就能预判电机可能要发生故障。
当然在数据采集和训练上,整个过程还是涉及到了云上的机器学习。而且不管是英伟达Jetson Nano,还是瑞萨DRP,跑起来的系统功耗应该都远超mW水平了。下面这张图是此前我们在采访瑞萨时,他们提供的一张AI性能和效率对比。瑞萨RZ/V2M的DRP加速器效率是相当不错的,只是这些系统严格意义上应该都不能算“TinyML”。
但追求边缘AI应用,的确是IoT的大趋势。前年我们参加了瑞萨杯全国大学生电子设计竞赛,这一届比赛就在于鼓励参赛学生充分应用硬件的AI算力。
从目前TinyML及其合作伙伴的宣导来看,现在的TinyML“芯片”更多的还是在于处理器内核加上一些强化的并行计算资源:比如说Cortex-M3,用15KB代码、22KB数据,在检测到特定语音单词时,就能唤醒系统,跑语音识别模型。2021年,基于RP2040 MCU,Cortex-M0+双核,能跑TensorFlow Lite Micro。RP2040是被视为TinyML的标版的,开发者可以跑机器学习模型来进行一些传感器数据分析,包括视频和图片识别、手势识别等。
电子工程专辑今年6月刊的封面故事《》一文在这方面有更为详尽的解读,相关Arm、RISC-V在TinyML芯片和生态上的参与度。比如Cortex-M55新增了Helium矢量处理技术,加强了DSP和ML方面的能力。不过Arm在官方的TinyML宣传文章里也提到了自家的Ethos系列microNPU,专用于加速嵌入式和IoT设备的机器学习推理运算。可见TinyML的专用AI加速单元必然是要被提上日程的。
另外有关芯片,特别想提一嘴的是,或者把范围进一步泛化到模拟计算方法。存内计算还是个全新的领域,颠覆了传统的冯诺依曼架构体系:直接就在存储器内进行计算,最小化数据搬运过程。主流的存内计算技术是基于模拟电路的计算——加上少了数据通讯开销,所以能效大幅提升,功耗相比于一般的AI芯片几倍下降。
最近我们采访了知存科技,这家公司给出的数据显示以其刚刚量产的存内计算芯片,做40-100个词的语音检测,系统整体功耗能够控制在0.8mW量级——这就比一般的芯片低太多了,应用于电池驱动的可穿戴设备都毫无压力。所以在我们看来,这种新型结构的芯片在TinyML时代应当是最有发展潜力的。当然新架构的生态搭建,前期会需要一个漫长的积累过程。在这个方向上发力的企业,未来应该也会越来越多。
似乎从“模拟计算”的角度来看,在计算机科学的架构范式都可能产生颠覆的未来,TinyML的需求持续进化,可能对整个行业带来前所未有的革命。时代现如今就有不少点状式的发展趋势,比如各种神经拟态传感器和计算方式的发展。它们都有着相较于如今的计算机架构,更为显著的效率优势。
未来的不可限量与影响
在我们看来,TinyML或许只是AI发展的某种具体形式。但TinyML现在作为一个明确的概念在市场上流传,还是有利于这类技术的向前推进。而且研究人员也的确在“Tiny”这件事情上持续努力。
举个例子,去年底MIT(麻省理工学院)有个团队搞了一种技术,尝试缩减内存用量,具体能够提升视频的图像识别性能。这主要就是针对MCU可怜的存储资源,令其做卷积神经网络计算时的优化技术,属于特别针对TinyML视觉系统的优化,有兴趣的读者。这类研究应当还会越来越多。
ABI Research在paper中明确提到了TinyML带来的一些关键价值。比如说更好的数据隐私性、更高的能效——这两点前文都已经提到;更小尺寸的芯片(尤其降低片内或板上的存储资源用量);功能安全与网络安全方面的提升(硬件级AI实施方案相比于软件,具备更高的安全性);对于网络不稳定环境有更好的免疫性——这原本就是边缘AI的一大优势;不同组件之间更好的互联互通。
基于TinyML的特性,未来相关IoT的构成及供应链都可能会有新的动向。比如说基于功耗、可靠性、延迟等更严苛的要求,连接协议的选择或许会更明确;基于AI计算特性,AI模型OTA更新会成为标配;IoT设备或上游供应商可能要把更多的工夫花在AI和TinyML专业知识上——涉及到的能力会更多样,不管是用开源工具、选择与三方AI解决方案企业合作,还是自己去积累专业能力;生态构建和拥抱开发者社区会变得更重要。
这些好像会对IoT价值链持续产生影响,对IoT产品和相关厂商提出了更高的要求(虽然很多其实还是和单纯的边缘AI与传统AIoT是重合的)。TinyML在不同层面的发展,可能会超出我们的想象;甚至包括对计算机科学架构革新的推进。
2022年6月29日,全球领先的专业电子机构媒体AspenCore将与深圳市新一代信息通信产业集群联合主办,同期将举办工业互联网、智慧家庭、智慧机器人、智慧可穿戴、智慧两轮车等多场分论坛,多家企业将在论坛现场探讨AIOT领域的前景机遇。 现场与行业资深人士交流与互动!了解大会详情。
相关文章