在内卷到冒火星子的本土电动汽车市场,技术传播成了一种非常有力的营销手段。在智能座舱领域,对丰富应用生态的兼容性、是否具备认知和理解能力强大的多模态感知成了新质生产力和落后生产力之间的区隔,在智能驾驶领域,无图高阶智驾方案成了可以标榜车企智能驾驶算法实力强大的技术路线。春雨润物细无声,这样的技术传播多了,就会潜移默化地塑造人们的心智。比如,被很多人调侃智能化存在短板的比亚迪,前段时间展示城区NOA功能时,就被很多媒体特意强调“目前的方案依赖高精地图”。
有图等于落后,无图等于领先,在一定程度上,这种说法是无可厚非的。从技术的角度,高精地图确实相当于高阶智驾感知系统的一根拐杖,就好比你爬山不用拐杖可以证明自己身强力壮一样,依靠强大的车端实时感知实现对交通环境各个要素的识别,慢慢降低对高精地图所提供先验信息的依赖,在某种程度上确实可以佐证自家智驾方案中感知算法的强大。
不过,无图方案的本意是不依赖生产周期长、制作成本高、覆盖度有限、鲜度无法满足实时性要求的高精地图,经过一些意见领袖KOL有意无意的传播,在很多人的眼中竟然慢慢演变成了不使用地图的先验信息了。这绝对是一个误会,因为,虽然在营销方面宣传无图会显得自己更加强悍,但是,从技术端来看,大家真正落地实现的是轻图方案。一方面,从依赖高精地图的“重图”方案向不依赖高精地图的“轻图”方案转变,是智能驾驶行业毋庸置疑的演进方向。另一方面,在现在这个阶段,介于高精地图和标精地图之间的轻地图对高阶智驾系统依然很有价值。本文围绕这两个视角,详细展开谈一谈。中国车企和高精地图的蜜月是从2020年开始的,那一年,头部智驾车企蔚来汽车依靠高精地图在中国首个落地了高速NOA。 大家可以把高精地图理解成能力超强的“道路感知传感器”,它可以直接提供车周道路环境的结构拓扑信息,在这里,“拓扑”的概念非常丰富,包括车道线数量、车道拓扑、车道的几何关系和层级关系、道路曲率、交通标识等共计200+种语义要素,做个类比,高精地图相当于华为ADS2.0中的RCR道路拓扑推理网络、特斯拉FSD中的车道网络和小米Pilot中的道路大模型。很显然,在几年前车端感知能力(取决于车端算力和算法)不是特别强大的时候,能够直接提供道路拓扑信息的高精地图起到的作用非常大,再加上全国高速路里程有限,高精地图有能力实现对高速的全覆盖,所以,以蔚来、小鹏、理想为代表的中国车企自然而然地选择了高精地图实现高速NOA。 不过,随着NOA从高速向城区的推进,高精地图里程覆盖率低的致命缺陷和车企迫切想要快速开通更多城区NOA的要求的矛盾逐渐变得不可调和了。据公开数据显示,全国公路总里程535万公里,而高精地图的覆盖里程不到40万公里,覆盖率不足8%!去高精地图势在必行,摆在所有本土车企面前的第一个问题是,摆脱对高精地图的依赖,是否具备技术可行性?2021年6月份,大洋彼岸的特斯拉向用户推送了基于纯视觉方案且不依赖高精地图的城区NOA,同年8月份,特斯拉召开AI DAY,基于Transformer的BEV横空出世,依赖Transformer的自注意力机制和长时序融合,可以在车端进行道路环境的实时重建。 技术是可行的,算法路线是明晰的,但当时主流智驾芯片的算力还不足以实时运行车道网络,万事俱备,只欠东风,就等英伟达的Orin芯片了。算法和算力的双重进步使得头部车企的车端感知能力大幅度增强,也正是从Orin芯片量产的2022年起,腰杆子变硬的车企开始了对高精地图的炮轰。2021年刚刚收购过图商的小鹏汽车掌门人何小鹏当时表示:对于自动驾驶而言,高精地图一定是个过渡,云端的结合也只是一个辅助,真正的自动驾驶一定要能够全场景驾驶。”正在逐渐突破芯片生产困境的华为方面,余承东表示,“现在自动驾驶还在使用高精地图,但未来发展不应该依赖高精地图、车路协同。“以前陪我看月亮的时候,叫人家小甜甜,现在新人胜旧人,叫人家牛夫人。”也许所有图商的心中都在感慨没有高精地图的时代,只有时代的高精地图吧!不容否认的是,随着这几年来车端感知能力的逐步增强,智驾对地图的依赖在逐渐降低。不过,饶是车端感知能力比较强大,来自地图的部分先验信息也可以起到很大的作用。 首先,在车端传感器的感知范围之内,地图先验信息可以辅助车端感知。小鹏汽车曾经在去年的CVPR会议上分享过中国复杂的交通环境,比如这个左转等待区的信号指示既有红绿灯,还有数字、图案和文本,假若没有地图提供的信号灯与车道之间的绑定关系等先验信息,很难正确认识哪个车道匹配哪个信号灯,而且这里的文字标识必须经过OCR,再通过自然语言处理技术进行语义的理解,显然会对车端的实时感知提出巨大的挑战。即使强如特斯拉,他们那位印度裔的自动驾驶负责人也在去年的CVPR会议上吐槽过在某些场景下利用车端实时感知判断车道数量的困难。不要问元芳你怎么看?您看到图中这么复杂的左转等待区,一时之间也不知道应该怎么办,在这样的场景下,地图的作用马上就能得到凸显。其次,在车端传感器的感知范围之外,地图先验信息可以提供超视距感知。受限于功耗、成本、尺寸,摄像头和激光雷达的感知距离一般都在200米以内,受限于BEV和OCC计算量会随着感知距离的增加呈三次方增长,车端的高精度实时感知距离一般都在100米以内。对驾驶行为来说,前方三五百米处的道路信息也会影响驾驶决策,并直接决定驾驶的舒适性、效率和安全性,超视距感知能力有助于智驾系统实现更安全、更舒适、更高效的驾驶体验。 最后,现阶段的轻地图除了可以提供静态信息,开始加入越来越多的动态信息。借助于交通管理部门的数据,或者通过大数据和云计算相结合的方式,图商们现在可以提供在车端传感器感知距离之外的红绿灯状态、倒计时等动态信息,一路行车一路绿灯,光是想想就爽到不行。对于需要在极度激烈竞争环境之下成长的中国车企来说,不应该也不会将所有高精地图信息全都弃之不顾,他们会随着车端感知能力的增强一点一点地甩掉高精地图的拐杖。如果把高精地图的200+语义要素视为200+个拐杖的话,拐杖会一根一根地抛,抛到100根左右的时候,就要考虑到成本的问题了。如果直接使用地图里那些长时间不会改变的静态拓扑关系可以节省车端的算力,进而降低车端智驾系统的成本,那个时候,还深陷亏损泥潭的智驾车企还会接着抛拐杖吗?这是一个值得所有人深思的问题。