计算,经历了几个时代的发展,其核心也随之不断改变。在PC时代,最早的需求是在公司处理文件、数据库,后来随着互联网的普及,用户产生了对于CPU、OS以及软件的核心需求,这个需求成就了微软+英特尔(WinTel)联盟。
到了移动互联网时代,人们把更多是通过Arm+安卓或Arm+苹果的平台,把算力交付到每个人手中。这时候产生的算力,不仅仅用于工作上的记录和数据库,也用在越来越多地用在图像和视频上,摄像头成为我们和物理世界的新接口。因此在数据流的产生上,除了PC时代很重要的CPU,GPU也开始扮演越来越重要的角色。
“那么在经历了几个计算时代后,全新的智能计算时代除了CPU和GPU,还需要什么呢?我们认为其核心将是数据驱动。”在由全球电子技术领域知名媒体集团AspenCore主办的2021全球高科技领袖论坛 - 全球CEO峰会上,安谋科技执行董事长兼首席执行官吴雄昂分享了下一代感知计算和整个计算中对新架构的需求,并提出了对于新一代计算架构的想法。安谋科技执行董事长兼首席执行官吴雄昂(Allen Wu)
双轮驱动之“XPU芯架构”
据介绍,安谋科技创立于2017年,但要追溯其背景的话,历史非常长。2018年,安谋科技通过合资公司的方式,并入Arm在中国的所有IP业务,目前是全球唯一一家能开发、兼容Arm CPU核,并在中国做CPU核业务的公司。吴雄昂介绍道:“也就是说,我们不仅仅荣幸地继承了Arm在中国的专利、业务等,更重要的是我们有完全自主开发处理器和相关IP的能力。”
今年7月,安谋科技发布了新业务品牌“核芯动力”。据悉这个品牌来源于公司的使命——“创造核芯价值”,致力于在新一波计算浪潮中服务芯片产业。具体到战略则是“双轮驱动”,因为根据安谋科技的观察,整个计算趋势和产业在不断演进,“而Arm架构在CPU和控制层上的优势,是全球数一数二的。随着智能计算的发展,感知、决策、反应以及针对新变化和数据层需要新的处理器架构,我们将为之统称为超域架构(xDSA),也就是XPU的芯架构。”吴雄昂说到,其中数据流处理采用高密度数据流处理中心的专有核心计算单元,域计算采用智能处理专用架构,其他扩展则支持多样化算例堆叠。
数据大幅增长趋势已定,光靠CPU本身已经不够
在这波全新的智能物联网发展过程中,万物互联、5G和人工智能很重要,但吴雄昂认为更重要的是,未来是“机器产生数据”的时代,而不是“用户产生数据”的时代。这一点从Facebook改名Meta(元宇宙)可以窥见端倪,这是一个从“我们在数字化世界里产生数据”,逐渐迈向“数字世界和现实世界全面连接、混合”的过程。
对于做CPU的安谋科技来说,这个过程的核心是计算,因为算力提升是每一代技术革命的基础。以最新的iPhone 13为例,初代iPhone采用的是一颗700MHz的Arm 11架构CPU核,而iPhone13处理器的总算力相较一代提升了约300多倍,这里面包含了工艺、CPU、GPU以及苹果NPU等各类“XPU”算力的提升叠加。
再比如特斯拉最近发布的超级计算机处理器Dojo,主要用在自动驾驶的机器学习培训系统。回顾model S第一代,车载应用上的算例短短几年就从几个TOPS提升到几百甚至上千TOPS。
虽然算力提升速度很快,但业界也面临很多挑战,例如从2000年开始,CPU架构本身带来的演进效率提升越来越缓慢。这与CPU核架构本身和工艺提升趋缓有关,随着工艺从7nm、5nm到3nm,纯粹通过工艺提升算力方式效率已经不高,更多的创新开始聚焦于CPU和整个计算系统算力提升。
同时如果纯粹用原来的计算架构,也无法在现有基础上提升上百倍的算力。从CISC到RISC,再到Multi-core,从感知、处理到反应,必须提升新一代算力演进的方式,给下一代技术革命提供充沛算力。
新架构如何与现有体系融合?
机器产生的数据流呈现出高密度、实时性和多样性的特征,吴雄昂举例到,如今汽车上的视觉传感器从一个、两个逐渐增加到四个、八个,还在不断演进;分辨率从2K到4K,也在不断演进。“包括激光雷达、毫米波雷达等多感知计算流是需要实时处理的,这对我们未来的计算提出了挑战和很高的要求。”
但也正因为有这样的需求,xDSA架构过去几年中取得了飞速发展,据介绍该架构针对新领域可以提升百倍效率。但这个架构怎样和现有的CPU、GPU以及计算体系融合?吴雄昂认为,这不是简单的加法,这对整个计算行业的技术提出了新的要求。“在安谋科技多年来一直针对MPU、视频、ISP等数据流处理方面的核心技术研发进行投入。因此我们提出超域架构,也就是通过一个新的融合计算架构,既能有DSA高效率的优点,也能同时提供足够的通用性。”
在物联网计算时代,智能家居、机器人和汽车的需求都非常广泛,而单一芯片虽然效率高,但是在硬件算法和软件开发上面临挑战,只有用新架构面对同一群软件开发环境和开发者,轻松地把这些算力用到极致,才能达到算力百倍的集成效果。
纵观历史,所有算力的基础无外乎是芯片本身处理的能力,主要依赖从架构到工艺,加上软件开发者在软硬件耦合上的效率和能力提供最终的算力效果。“而全新的计算架构,必须得到广大芯片合作伙伴和开发者的认可,只有大的开发者群体基础,这个架构才能真正给产业带来所需要的算力提升。”吴雄昂说到,
具体来说,xDSA架构主要针对大幅增长的数据流、计算处理需求,不仅仅需要传统的CPU,还有多样计算元素的需求,从视频处理器到神经网络处理器,包括安全加密、可信计算。据介绍,安谋科技通过对Arm CPU的了解和设计能力,结合公司近年来在NPU各方面的不断投入以及与产业合作伙伴取得的合作经验,加上工具、软件、设计服务,以可定制化的应用场景、新客户计算需求为主导,提供了一个融合解决方案。
融合计算架构不仅仅是用在车载平台上,在物联网应用上也能更好地提高安全性,提供更高的效率。因为这项技术不仅仅融合了原来的CPU、GPU以及Arm模块,从安全模块、物理IP、开发工具、算法模型上也需要和产业广泛合作,这样打造出的计算架构才能灵活针对IoT行业的各种需求,提供更加有效、快捷、便利、低成本的可定制解决方案。
吴雄昂表示,在未来,不管是家用机器人、智能家居、自动驾驶,或是未来的元宇宙计算,核心都是产业链上下游如何一起合作,通过新老架构技术的融合、可定制化的方案,给产业提供更有效率的计算力。“但是这个新生态,在过去的PC行业需要几十年发展;在Arm主导的移动互联网时代,我有幸一路走过来,也经历了数十年的发展历程。在中国半导体产业发展最快的市场上,如何以有效且符合中国速度的方式打造这个生态?我们需要一个新的模式。”
开源推动,共享共建
因此,今年安谋科技和产业链上下游一起合作,发起了针对新一代NPU超域计算架构的开源联盟(ONIA)。该创新联合体也是第一次在NPU处理器的核心指令级上,在中国发起开源项目,在不到半年的时间里已有近百家芯片公司、系统公司、软件公司加入这个创新联盟。
吴雄昂表示,安谋科技除了在联盟中作出贡献以外,也会在今后所有NPU相关的IP产品上对这个开源架构进行全面兼容。“现有的NPU相关产品针对ONIA的成员提供免费使用的新商业模式,推动整个产业在新一代技术上能够一起投入,共享共建。在未来新的计算时代,再打造一个像Arm这样的优秀的新计算生态,助力我们在新一代计算革命的发展中,大家共同发展。”
相关文章