5月20日,小鹏在520 AI DAY上,发布了智驾赛道国内首个量产上车的端到端大模型,并宣布到今年第三季度,小鹏的智驾即可实现不仅全国都能开,甚至是每条路都能开,到2025年实现城区智驾比肩高速智驾体验,在中国实现类L4级智驾体验。
这把今年智驾领域竞争的颗粒度,和宣传话术的烈度,都向上抬高一级。除了小鹏,国内各大车企这两年也不遑多让。不仅对自家智驾信心满满,推销嗓门也是越来越大,吆喝起来也更加不遗余力。
而对于最终的买单者,这些话术其实落到体验就是两个关键问题:城区NOA能不能做到全国都能开,以及是否做到了全量推送。
全国都能开VS全量推送
首先,值得指出的是,无论是“全国都能开”还是“全量推送”,大家一般默认说的是城区NOA,“全球都能用的LCC”不在本文的讨论之列。
全国都能开,说的是城区NOA的里程(基本)覆盖了全国(绝大部分城市)的(结构化)道路。全量推送,则是将具备全国都能开的城区NOA能力的高阶智驾系统向非内测/公测/鸟蛋用户之外的全部符合条件(智驾经验分、开通了高阶智驾包)的车主进行推送。
显然,“全国都能开”是“全量推送”的先决条件。从时间顺序上,全国都能开的宣传动作在前,全量推送这类实质性的技术动作在后。
比如,华为宣布2023年底实现全国都能开,但直到3月28日,才向搭载华为ADS系统的阿维塔12用户进行了全量推送。在中间这段时间里,高阶智驾系统会进行多次迭代,继续收敛长尾场景问题,根据用户反馈进行性能优化。
车企们一般会选择部分车主提前推送系统,比如问界曾在2024年1月招募了200名问界M5/M7高阶智驾版车型的车主,理想也在第一季度招募早鸟用户进行AD MAX 3.0内测,蔚来则是以陆续扩大领航团的方式将更多的车主纳入到系统优化的闭环中。
图片来源:阿维塔
从全国都能开到全量推送之间,高阶智驾系统会经历多次版本迭代,华为目前能够做到3-5天更新一次版本,训练算力更强、数据堡垒更深厚的特斯拉甚至能做到一天一迭代。从版本的频繁迭代可以看出,全量推送是对宣称“全国都能开”的车企高阶智驾系统的城区NOA能力的试金石,迭代来迭代去,敢不敢推给全量用户?
是骡子还是马,必须通过全量推送拉出来遛遛!
那么,全量推送城区NOA的条件到底是什么,头部智驾车企又是通过什么样的技术手段满足了这些条件呢?
关于第一个问题,蔚来给出的答案是全量推送=安全安心的体验(深度)+广大的里程覆盖(广度)。
图片来源:蔚来汽车
公式只是解题的前提,真要解题,还需要花很大的力气。提升智驾体验的安心感和安全,需要尽量闭环长尾问题,扩大智驾系统里程覆盖,可以借助提升无图感知能力、复杂场景博弈能力,对要覆盖的路线进行运营和验证,必要时还可以借助车道级导航地图或众包建图。
怎么闭环长尾问题
在数据驱动的自动驾驶时代,只有获得新的Corner Case数据,把数据本身包含的知识压缩到智驾的模型里,才有可能推动智驾算法的进步。换言之,闭环Corner Case不是问题的关键,关键的问题是怎么找到并发现Corner Case这种高质量数据。
通用化的解决方案是特斯拉首创的影子模式。具体是,在人驾模式下,定义一些触发机制,当满足触发条件时,车端智驾系统向云端上传数据。触发条件可以是人驾动作和智驾决策不一致的地方、急踩刹车的时刻,也可以是感知系统出现矛盾的时刻,比如发现车辆前方有一个白色物体,感知系统一会儿把它识别成横在马路中间的货车车厢车顶,一会儿把它识别成蓝天上的白云。
但是,在需要智驾系统全速运行的智驾模式下,影子模式背后的算力资源就分身乏术了。在智驾模式下,满足当下场景的实时性要求比满足未来系统迭代的数据采集更加重要,全速运行的智驾芯片很难在触发条件满足的情况下分出多余的算力进行数据的筛选、清洗和上传。
为了解决这个问题,特斯拉选择升级智驾芯片,将HW4.0芯片的算力提升了5倍,从而留出了多余的算力继续运行影子模式。
本土车企这边,采用四颗Orin被大家伙喷了好几年的蔚来,给出了一个差异化答案:群体智能。其做法是单独拿出一颗算力高达254TOPS的英伟达Orin芯片完成这项工作,其它芯片着眼当前,保证行车安全、场景通过率和通行效率,这颗用于群体智能的芯片立足长远,为智能驾驶算法的升级迭代提供宝贵的数据。而且,这颗用于群体智能的芯片还可以对采集数据进行筛选,过滤掉绝大部分的无效数据,降低车机流量负担和云端的算力负担。
发现Corner Case的另一种方案就是生成Corner Case。比如华为,2019年成立车BU,到2021年进入了智驾第一梯队,2022年ADS系统搭载量没有多少就开始和小鹏叫板,到2023年问界M7还没起死回生之前就敢剑指特斯拉——它的底气来自强大的自动驾驶仿真能力。
华为依靠在大模型领域的长期布局、对传感器系统的深度自研(对仿真很重要),通过生成式AI强大的场景生成能力重建Corner Case场景,进行模型的训练,从而完成了从0到1的跳变。
值得一提的是,理解能力和生成能力都有了数量级提升的生成式AI不是2022年年底(ChatGPT问世时)才出现的,早在2020年,华为盘古大模型就已经达到千亿参数级别,而且实现了多模态。
图片来源:华为2021全连接大会
对头部智驾车企而言,随着智能驾驶系统能力的提高,实车测试可以捕捉到的长尾场景越来越少了,所以,借助仿真闭环Corner Case的当然不只有华为一家。
比如小鹏在AI DAY上,也透露通过仿真测试加快模型迭代的方法。据悉,基于折算10亿+里程的视频训练、超646万累计公里数的实车测试、超2.16亿累计公里数的仿真测试,小鹏汽车端到端大模型已经能够做到“2天迭代一次”,距特斯拉的“一天迭代一次”只有一步之遥;而在未来18个月内小鹏称其智驾能力还能提升30倍。
扩大里程覆盖
无论华为还是蔚小理,本土车企都非常强调对NOP+/NGP/NCA/NOA开通路线的验证和运营——验证指的主要是验证车端感知系统对这条路线的道路拓扑推理能力,运营指的主要是对这条路线进行云端建图。
如果把影子模式理解为“大家一起来找茬”的话,那么,里程验证便可以理解为“大家一起来建图”。
即使是在无图(无高精地图)时代,轻量级地图对于高阶智驾系统依然是不可或缺的,最近,特斯拉通过百度提供的高阶辅助驾驶地图在国内落地FSD的传闻,结结实实地说明了地图的重要性。地图解决的不只是对车端进行道路拓扑的实时感知提供感知冗余,更重要的是,它提供了一种对于行驶路线上道路拓扑的长期记忆。
长期记忆可以提高系统感知的速度和实时性。人类驾驶员跑熟了一条路线后,对路口、车道、交通标识了然于心,之后再跑的时候,脑回路中处理驾驶行为的系统2(需要花费更多的时间和精力)切换到了系统1(基于直觉和记忆快速响应),就不用花费那么大的精力了,智能驾驶系统显然也该拥有这样的记忆。
图片来源:蔚来汽车
百度的车道级导航地图是个明牌;暗牌方面,小鹏汽车的AI代驾大概也是针对特定路线建图。
图片来源:小鹏汽车
还有一个例子是蔚来汽车。在蔚来自动驾驶系统架构图中,自动驾驶算法的核心指标是“看得全、想得深、记得住、好身手”。按照自动驾驶系统的认知方法论——感知、决策、执行来理解的话,决策层面要做到“想得深”,执行层面要做到“好身手”,感知层面不仅要依靠车端做到“看得全”,还可以依靠云端地图实现“记得住”。值得一提的是,蔚来的云端地图不止记忆和智能驾驶相关的图层信息,还记忆包含路面颠簸情况的4D路况图层,在智能驾驶系统的舒适性衡量指标上,应该也大有帮助。
写在最后
智驾赛道的赢家,显然还没有确定。比拼不能上嘴皮碰下嘴皮胡说一气,是有比较客观公正的指标的。
在我看来,一个是智驾相对于人驾的安全率,也就是开启智驾的平均事故里程/不开启智驾的平均事故里程,这是一个安全体验的衡量指标。小鹏给出的数字是10倍,特斯拉多年以来的宣传一直是10倍,马斯克在访谈中也提到过5-10倍的说法,而蔚来给出的是6.26倍。
另一个是覆盖里程。极越PPA到3月底超过50万公里;小鹏到1月是56.9万公里,何小鹏在微博上说,其“安全可用路段在以每个月近10万公里的速度增长”,推算大概在90万公里;蔚来到4月给出84.7万公里,和小鹏不相上下。至于华为,鉴于它并没有公布覆盖里程数据,在此就不做判断。
当然,所有能力和数据门槛,最后还是要落在体验上。这是终极指标。