2023年5月10日,后摩智能正式发布存算一体智驾芯片——鸿途™H30,最高物理算力 256TOPS,典型功耗35W,成为国内率先落地存算一体大算力AI芯片的公司。
在人工智能技术飞速发展的今天,高效的AI计算能力成为智能驾驶普及应用的重要基石。这离不开芯片的底层支持,其是实现智能座舱和自动驾驶等各种功能场景与服务的重要因素。对于如何打造高算力、高效率的芯片平台,是行业共同的发力方向,也催生出了多种多样的架构创新。
为了效率
计算效率的提升都是科技发展和变革的底层驱动力。类比智能手机,相较于2000年代的个人PC,其计算能力和效率提高了至少1000倍。
后摩智能创始人兼CEO吴强表示,每1000倍的效率提升就会造就一个新的计算时代,创造一个全新的计算方式,就像从大型机到PC到手机,体积越来越小,算力越来越强,功能越来越丰富,一个新的计算形态,也创造了全新的生活和交往方式。
后摩智能创始人兼CEO吴强
图片来源:后摩智能
伴随着AI技术的跃进,未来万物智能时代的计算系统,和今天的芯片相比,在计算能力和效率上至少要再有1000倍以上的提升。
AI技术虽然蓬勃发展,但目前还是时不时出现一些人工智障的现象。“究其原因,我们还是认为AI计算的硬件不够高效,我们希望让芯片像人脑一样高效工作,于是,我们打造了这款基于存算一体的大算力AI芯片,来作为我们的起点。”后摩智能联合创始人兼研发副总裁陈亮说到。
后摩智能联合创始人兼研发副总裁陈亮
图片来源:后摩智能
2年前,后摩智能成立之际,就选择聚焦存算一体的底层架构创新。那么,何谓存算一体呢?
据陈亮介绍,从概念上讲,存算一体就是在存储单元内部完成部分或者是全部的计算,它是解决芯片性能瓶颈,提高能效比的一个有效的技术手段。
在AI计算当中存在大量的计算单元和存储单元之间的数据交互,当数据被从传统的存储器中读取出来,送到计算单位中进行计算,再写回存储器的过程中,会使访存功耗急剧地增加,还会造成计算单元使用效率的降低。存算一体架构将存储和计算功能融合,比传统架构更接近人脑的计算方式,具备远高于传统方式的计算效率。
存储一体芯片的设计目标是提高系统的集成度、和性能效率。通过将计算和存储性能集成在同一个芯片上,可以减少最少的组件之间的通信延迟,并提供高系统的整体性能。存储计算一体芯片还可以降低系统的尺寸和性能,提供高设备的可靠性和效率。
陈亮认为,存算一体技术是对开发者无侵入式的底层架构创新,从编程角度来看,用户感知不到任何底层硬件的影响。
而后摩智能之所以选择智驾场景,也有其深刻考虑。吴强表示,万物智能的时代,不可能没有无人驾驶。
从技术和产品需求匹配的角度来看,存算一体带来的技术和产品的优势,和智能驾驶的关键需求是吻合的,“因为智能驾驶的终局是要替代人的驾驶,我们用传感器代替人的眼睛,用各式各样的算法代替人的意识和灵魂。底层的智能驾驶芯片又扮演着人类大脑的角色,所以从终局的角度来看,智能驾驶芯片一定要无限接近人大脑的行驶和效率。”吴强说到。
在发布会上,中国电动汽车百人会副理事长兼秘书长张永伟也指出,存算一体作为一种创新技术,对工艺制程依赖度低,具有极高的竞争力,为智能驾驶芯片提供了更具前瞻性的技术路径选择。采用多种技术路径实现芯片国产化布局,将有利于解决汽车芯片供应链中存在的同质化竞争问题,助力提升产业链的韧性和供应链的安全性。
中国电动汽车百人会副理事长兼秘书长张永伟
图片来源:后摩智能
不止芯片
这款芯片究竟怎么样?首先从性能上来看,根据后摩智能介绍,鸿途™H30 基于 SRAM 存储介质,采用数字存算一体架构,拥有较低的访存功耗和更高的计算密度。
该芯片基于12nm工艺制程,在Int8数据精度下实现256TOPS的物理算力,所需功耗不超过35W,整个SoC能效比为7.3Tops/W,具有高计算效率、低计算延时、低工艺依赖等特点。
在实际性能测试中,鸿途™H30 基于Resnet 50模型的Benchmark,在Batch Size等于1和8的条件下分别达到了8700帧/秒和10300帧/秒的性能。
目前,基于鸿途™H30 已成功运行常用的经典CV网络和多种自动驾驶网络,包括BEV网络模型以及广泛应用于高阶辅助驾驶领域的Pointpillar网络模型。
后摩智能基于鸿途™H30自主研发了硬件增强机制和检测机制,在提升芯片可靠性的同时,保障功能安全性。此外,后摩智能面向智能驾驶场景打造了专用IPU(处理器架构)——天枢架构,其采用多核、多硬件线程的方式扩展算力,AI 计算可以在核内完成端到端处理,保证通用性。
据陈亮介绍,天枢架构是后摩智能自主研发的第一代 IPU(处理器架构),第二代天璇架构已经在研发中,将采用Mesh互联结构,可根据应用场景的不同配置计算单元的数量,第三代天玑架构也已经开始规划。
在商业化层面,以鸿途™H30 打造的智能驾驶解决方案已经在新石器的无人小车上完成部署。
不止于芯片,本次发布会,后摩智能同步推出了基于鸿途™H30芯片打造的智能驾驶硬件平台——力驭®。据悉,力驭®平台CPU算力达200Kdmips,AI算力达256Tops,支持多传感器输入。力驭®平台功耗为85W,可采用更加灵活的散热方式,实现更低成本的便捷部署。
后摩智能联合创始人兼产品副总裁信晓旭重点提到了工具链的打造,“我们的竞争力要构建两个方面:一个是要基于存算一体架构打造更好的PPA,这是硬的东西;另外一个是软的东西,我们要把软件工具链当成产品的另外一个关键的竞争力来打造,这也是我们的初衷和共识。”信晓旭直言。
后摩智能联合创始人兼产品副总裁信晓旭
图片来源:后摩智能
基于此,后摩智能基于鸿途™H30 芯片自主研发了一款软件开发工具链——后摩大道™,支持 PyTorch、TensorFlow 、ONNX等主流开源框架,编程兼容CUDA前端语法,同时支持SIMD和SIMT两种编程模型,兼顾运行效率和开发效率,以无侵入式的底层架构创新保障了通用性的同时,进一步实现鸿途™H30 的高效、易用。
信晓旭表示,鸿途™H30 将于6月份开始给 Alpha 客户送测。同时,后摩智能的第二代产品鸿途™H50 已经在全力研发中,将于2024年推出。
发布会上,后摩智能留下一个彩蛋,在适当的时候,后摩智能将会将其AI处理器硬件设计开源,用户可以在其网站上下载IPU设计资料,在此基础上可以做PPA的评估、软件算法的开发,或者将来用到自己的产品当中。
“我们希望有更多的人和组织能够参与进来,相信以大家的智慧可以更好的让(存算一体)这个方向落地,大家可以共建生态,最终让整个产业链受益。”陈亮说到。