“高速NOA全系上市就有,城市NOA今年8月全国可开。”在小米SU7上市发布会上,相较于内饰和智舱,创始人雷军讲述自动驾驶的篇幅较少,但分量很重——三年时间,从0追赶,小米如何能够做到能比肩第一梯队的智驾能力?我们综合了近期雷军等对外披露的信息,结合过往公开信息,从人事、软硬件,以及开发过程等多个维度拆解,试图复盘小米智驾从0到1的过程。
01、后发优势,三年追平第一梯队
三年之约过去,小米智驾团队交出的答卷大致是过关的。 和大部分车企一样,小米智驾有两套方案:Xiaomi Pilot Pro和Xiaomi Pilot Max。
Pro是纯视觉的方案,Max是视觉+激光雷达的方案。虽然技术配置不同,但都搭载了11V高清摄像头、英伟达DRIVE Orin芯片以及全栈自研算法。
其中,PRO版本搭载于小米SU7标准版,能够支持高快路领航辅助功能(NOA)。MAX版本在PRO版功能的基础上,还能实现城市领航辅助驾驶(NOA)。PRO版本搭载的是84TOPS的算力,根据雷军的描述,这已经足够使用,AEB能在高达135km/h时速下刹停能力,超过了特斯拉。假如能够按照预期,在今年8月开启全国城市NOA的话,那么,小米汽车将是当之无愧的智驾第一梯队的水平。
毕竟,目前只有华为实现了“全国都能开”,小鹏汽车的城市XNGP主打的目前覆盖范围还只是全国243城,“全国都能开”仅限部分用户。
在小米汽车首次发布会上,雷军展示了三个自动驾驶场景:分别是泊车、城区和高速。令人印象深刻的展示场景是,在无人情况下小米SU7自动开上东莞7层露天停车场,包含了回车退让、避让行人、寻位、落位等一系列动作。
据官方说法,小米是国内首个将端到端大模型应用于自动泊车功能的车厂,将感知、决策、规划算法多合一,也是迄今类人思考程度最深的智驾算法,可以实现5cm精度的极窄库位泊入和23km/h巡航的代客泊车。
在安全方面,据小米方面称,即便是最低配置的车型,小米SU7也能做到300公里完全接管不到一次;且一百公里都不会出现一次急加速或急刹。
在实操体验层面,据雷军的表述,他自己从北京到上海开了1270公里,中间一共只接手了三次。从雷军的说法来看,无论是落地速度,还是实践层面。小米汽车智驾都处于行业头部位置,其背后是全栈自研算法做支撑,即:自研底层算法、道路大模型和占用网络。
和大部分第一梯队车企一样,小米智驾系统算法采用BEV+Transformer+OCC,也是目前效率最高的解决方案。其中,小米智驾团队在BEV和OCC两个维度都有所创新。
BEV方面,小米汽车搭载的是变焦技术。按照发布会PPT的解法,那就是理解更准确,分辨率会更高。BEV输出分辨率由输入时的参数决定,如果BEV实现可变焦,意味着一开始的参数就是流动的。
也就是说,小米智驾准备了多套可以根据场景切换的输出模型。在占用网络部分,小米团队在2023年和北京大学联合发表了一篇论文《统一基于视觉的三维占据预测与几何和语义渲染》,提供了“Uni-OCC”的技术路径,Uni-OCC的亮点在于降低了对3D像素识别的依赖,大幅度降低了识别成本。
在发布会上,雷军对小米OCC技术寻找了类比,那就是搭建《我的世界》游戏里的基本方块。如果说,传统的占用网络是“大方块”,那么小米的OCC就是“小方块”,超分辨率占用网络模型精度达到了小于0.1m的水平,而特斯拉FSD的占用网络精度则为0.32m。
除了对底层算法的精进之外,小米还有一些新玩法。例如自研的道路大模型技术。官方称实时生成的道路拓扑效果媲美高清地图,在实际场景中,前方的路面正在修路,道路大模型也能准确生成智能引导线,提前预判,顺畅绕行。
另外,小米还研发了雨雪天自动降噪的技术,对原始输入数据经过算法再进入网络,即使在非常规天气下也能准确识别物体轮廓。当然,就如同每一个车企都想在智驾上比肩特斯拉一样,小米也考虑过采用更激进的纯视觉智驾方案。
据小米智驾核心技术人士消息,小米汽车在2021年考虑过做纯视觉方案,但后来还是用了激光雷达+视觉辅助方案。如果按照小米说法,软件层面其属于头部位置,那么在硬件层面的部署则是属于主流水平。
配置芯片层面,小米SU7三款车型之间芯片有梯度,在高档位小米安排了两块英伟达Orin X上车,和国内主流新能源车型在同一水平。
部分智能电动车型芯片配置情况最成熟先进的智驾芯片、最新的技术栈……得益于此,尽管入局晚,但有“后发优势”的小米也少走了不少弯路。同时,除了华为这个“不造车的车企”,小米汽车是唯一一家在自动驾驶领域没有寻找任何智驾供应商的车厂。这也使得它一直拥有更多的主动性,能够不断快速跟上智驾技术路线的迭代。
02、始于AI实验室,长期坚定投入
小米汽车从确立开始,就决定了要全栈自研,初始团队来自小米集团AI实验室,且团队扩大速度很快。在2021年9月1日,雷军放出了一张小米汽车初创团队的合照。
二排右起第六人,为打造了“小爱同学”的叶航军照片中,第一排左起为林世伟、张峰、刘德、王翔、雷军、洪锋、卢伟冰、祁燕、何勇,第二排右起为秦智帆、刘安昱、李田原、于错、李肖爽、叶航军、陈晋鸿、樊家麟。
这帮人马绝大部分来自小米内部转岗,大部分来自市场和政府关系部门,唯一和智能领域相关的,是打造了“小爱同学”的叶航军。叶航军,博士毕业于清华大学计算机系,研究领域为计算机视觉与图像检索。
在加入小米之前,他在互联网搜索领域深耕了很长时间,2006年至2010年,叶航军就职于谷歌。之后两年,叶航军加入了腾讯,从事搜索引擎的技术研发工作。
2012年,叶航军选择跳槽到更偏制造业的小米集团。事实证明叶航军的职业生涯是顺应时代发展的,2012年之后,搜索引擎就被信息流淘汰了。
2016年开始,AI成为小米未来十年的核心战略。当时,叶航军就是人工智能部总经理。组建人工智能部时,叶航军是“毛遂自荐”的。后来,他还被任命为AIoT战略委员会副主席。此后5年,他从人工智能部门总经理升任小米技术委员会主席,2021年初被雷军 “点将” 主持小米自动驾驶业务。
叶航军曾表示,一开始,整个小米团队都不算对自动驾驶领域有深度认知,尽管有“放手去做”的经济基础,但最重要的还是配备一个强大的决策和执行团队,需要大量人力的投入。
小米宣布造车的一年后,2022年中旬,叶航军在接受《晚点》的采访时表示,当时智驾团队就已经超过600人,其中,硕博占比超过 70%,囊括了智驾软硬件的所有方向。自动驾驶的核心是人工智能,因此,智驾团队大部分来自内部AI实验室转岗。一年半时间,小米智驾团队就有这样的规模,可见其投入之大。
另一个例子更能说明小米智驾团队的“力大砖飞”效应。在智能驾驶系统研发阶段,由于还没有自己的车,小米团队改装了一百辆其他品牌的车辆来测试智驾系统。
据小米智驾团队透露,小米做第一期NOA测试的时候,去了全国29个城市的每一个车库。光是测试智驾整体方案的车辆就有超过600台,真实里程超过500万公里,并且现在还在每日数十万级别的增长。雷军也表示,和其他车企相比,小米智驾的优势在于敢于做长期投入。
纵观国内车企,一方面能够自研的就少之又少,另一方面,长期投入自研的车企更是屈指可数。即便是早期就看好智驾,并且决心自研的车企,在成本高昂的前提下,一旦资金状态出现问题,“第一刀”砍的往往都是智驾,毕竟至少在当下它在用户心中不算必选项。而入局不久的小米,却坚持持续大规模投入不挣钱的智能驾驶,让技术团队发酵三年时间,才有可能从外行变成第一梯队玩家。
03、小米智驾,还需持续追赶
除了技术和团队,未来智驾之争,还在于算力、数据。这方面小米集团也有储备。小米智驾团队认为,自动驾驶拆解下来实际只有两个维度,也就是数据量和数据处理能力。
数据处理能力方面,自特斯拉打造自己的超算平台DOJO以来,各领先智驾企业都以“卷算力”为己任。根据公开信息,国内厂商中,领先的华为拥有2.8EFLOPS算力;吉利星睿中心算力为 810PFLOPS(1EFLOPS=1000PFLOPS),理想汽车、毫末智行和小鹏汽车的算力分别为 750PFLOPS、670PFLOPS 和 600PFLOPS。
部分车企/智驾厂商算力盘点。注:1EFLOPS=1000PFLOPS
小米智驾的超算中心信息没有公开信息。但是,小米智驾与小米集团共用一个大数据超算中心,底层架构和集团共享,算力分别部署。专门归属小米智驾的算力预计在2024年年末能达到1万张卡的水平。
如果这个卡指的是英伟达A100,就总算力大约是195PFLOPS;如果是英伟达H100,那就达到了600PFLOPS。如果是后者,和头部企业差距很小,算是一个不错的开始。
算力上来了,模型能力也随之提升。在端到端大模型构建层面,小米技术团队核心业务人员透露,除了在感知层做到端到端大模型量产之外,下一步是逐渐覆盖决策层和控制层,实现和特斯拉一样全栈端到端。
数据方面,小米汽车刚刚上路,还需要持续积累。好在小米智驾技术路线明确,无论高低配,除了激光雷达,感知设备一致,有利于收集数据。此外,小米生态的相关数据,也能一定程度助力智驾。
总体来说,造车三年的小米,在智驾领域的表现已然不错,其中有它“钞能力”做基础,以饱和投入,创造了“力大砖飞”的效果。当然,要想真正在2024年底达到第一梯队水平,后续小米智驾还需要持续提升基础能力,毕竟像华为这样的对手,更早就明确了智驾的方向,并且以惯用的“压强原则”——超同行数倍、十倍、百倍投入,取得了“遥遥领先”的地位。当然,既然手机小米可以与华为一战,那么智驾或许也可以。