作者:电子创新网张国斌
我们生活在一个以数字处理为主的模拟世界中,其实在数字计算机兴起以前,产业流行的模拟计算,只不过随着CPU的走热,模拟计算逐渐遇冷,但是随着人工智能应用越来越流行,对更多计算资源、更多模型存储容量以及更低功耗的需求变得越来越重要。目前用于人工智能应用的数字处理器难以满足这些极具挑战性的要求,于是,模拟计算再度被产业重视,与数字计算相比,模拟计算的速度和功效很有优势,在5月12日召开的第十三届松山湖中国 IC 创新高峰论坛上,每刻深思智能科技(北京)有限责任公司就介绍了一款采用模拟计算的低功耗“感存算一体”智能芯片MKS2206。
据每刻深思(MakeSens)智能科技创始人邹天琦介绍,MKS2206采用自主创新架构设计。该芯片能够在复杂的识别任务中以低功耗、高精度、高性能和高稳定性脱颖而出,因此在AR/VR/MR以及智能座舱等复杂人机感知和交互场景中广泛部署。通过集成轻量级识别交互算法,显著降低系统功耗,提升整体性能,并达到同行业领先水平。
他认为摩尔定律放缓的现象正在导致存储和计算之间的频繁数据迁移,这在整个过程中消耗了大量的能量。所以每刻深思提出模拟计算解决功耗问题,因为模拟信号无需进行模数转换(ADC),从而大大提高了系统效能。
他指出摩尔定律放缓下面临的很多问题:第一个是混合云架构,存储计算之间不停搬移,这里面90%的功耗都是在搬移数据过程当中,并没有用在数据处理过程当中。2、先进的制程,除了费用问题以外,还有很大的散热问题,其实模拟计算最大的优势就是工艺,例如采用40nm工艺对标是数字芯片22nm以下性能。同时模拟计算需要的晶极管比数字要更少,在成本上有很好的优势。相比22纳米以下的处理器,每刻深思可以把成本做到原来的70%。
他解释说传统方案当中,任何SOC信号进来,需要做高性能ADDA的转换,在ADC的模数转换当中,无论其他芯片做怎样的软硬件协同或优化,这个ADC的量是少不了的,但是模拟计算因为本身SOC接的物理信号是模拟的,不需要做ADC转换,这是最大的优势。从技术原理来说,放ADC之前,需要在模拟里面完成特征提取,包括基于存储器神经网络的处理,这个是如何做到呢?
他以很简单的成本预算为例,上图是神经网络核心内核。如果用数字芯片来说,要做逻辑搭建来完成数字成本预算,但是模拟有物理特性,本身可以用电压作为输入,可以用等效的权重来实现这个算法,可以很好基于机械特性来完成成本预算,达到很高的效率。
在上图所示处理中,将部分数字信号处理(DSP) 任务前置预处理,精简处理信息 ADC被移到模拟计算横块之后,仅在有效需求时被唤醒,降低无效功耗 原始信号中不必要的信息己被去除,主芯片只需计算精简信息,提高了计算效率。
他指出,MK2206和之前模拟计算的相关性,无论是多模态也好,还是其他的也好,剩下的这些厂商,本身外面带4个、6个,甚至8个摄象头,需要看手势识别的交互,需要用下面两个摄像头来做,也就是双目的方式是最自然的。在后面架构当中,每刻深思跟主控芯片有中段信息的输入来做融合。这一块芯片是可以一直开启适时感知周边的环境,包括手势的任务。这样可以让后面的AP在很多时候进行一个休眠状态,或者相对比较低的功耗去运行。
他指出在AR应用中,可能不需要用一些高端附加功能,只需要做一些基础的实时的交互,并且把功耗做得非常低,这样一个MKS处理器就可以实现这个任务,因为它把很多常态的任务,包括手势的、对于功耗非常敏感的任务放在Offload到专用芯片上,并且实现极低功耗实时交互。这样给很多方案厂和整机商提供更多选择。
“其实我们不仅做电路,我们也把新品和算法做紧密集成,深度优化,来实现完整的识别和跟踪方案。这里面算法做了很多工作,从图像预处理,大量采集器检测跟踪,后处理,还有显示上手部重建,用很多工作量完成。”他强调,“这里面原理很简单,抓手势特征点去完成手指节的识别,而不仅仅是手掌识别。我们做交互,希望用手指操作可以完成很多旋转动作,这里面要做很多工作,要把很大的模型和很大数据量做轻量化。无论是量化,在识别功能上相对更小、更轻,实现更低功耗。”
他指出在手势识别方面,每刻深思用了21个关键点坐标,不只是单手,左右手都可以区分,可以同时识别,同时处理帧率到60帧以上,识别精度小于10毫米。“如果用XR2跑的话,需要有将近1瓦功耗。但是2206峰值功耗保持在200毫瓦以内。并且可以持续优化。”他指出。
关于每刻深思产品规划,他表示接下来是聚焦基于视觉的处理能力,也会集成XR定位,还有就是跟常态的视觉相关的任务都会放在交互芯片上,提供给相关的方案商客户。
他表示每刻深思会基于2206实现小规模量产的基础上,在2024年至2025年随着VR、AR的爆发,实现大规模定制,实现高速增长。”我们的目标是建立以自研芯片为核心的全芯片智能感知服务平台!“他表示。