今年以来,轻地图逐渐成为热门关键词。高精度地图由于在地图鲜度、维护成本以及覆盖范围等局限性,逐渐被轻地图取代。
元戎启行是行业中布局轻地图方案较早的公司之一,通过重构技术框架,以及进行大量的泛化测试,在安全、效率与体感三者之间找到平衡点,最终做出了一套成本仅有传统高精地图成本十分之一的方案,让无图化方案成为可能。
据刘轩介绍,元戎启行的技术路线和特斯拉不完全一样,并不需要让车辆记住某个路口的具体数据,而是希望能够让这个模型本身学会,像人一样思考,在行驶操作中各个数据可能在一个什么样的范围之内,然后由系统自主完成操作。
按照计划,今年元戎启行会提供传统的L2+辅助驾驶和高速NOA方案,明年将提供城市NOA的纯视觉产品。
实时感知为主,SD Map作为参考输入
Q:虽然行业内大家都在提无图,但大部分车厂与供应商的核心还是采用了所谓SD Pro或者Lite地图。元戎只用SD Map就可以实现高阶辅助,这背后的技术支持是什么?
A:无论是SD Pro或者HD Lite,它里面依旧包含了高精地图的信息,它基本上是用高精地图向下阉割,提供一些更丰富的信息,能够帮助算法做得更好。但有关高精地图的更新,以及更新成本的问题依旧是绕不开的。如果能从算法层面解决掉这个问题,那么它可能就不再是一个特别大的强依赖项。
去地图化肯定是未来一个发展方向,因为它能减少维护成本。有关维护更新的部分,本质上类似人工智能中人工的那一部分,如果从智能的角度能解决这个问题,成本可以减少很多。
我们最早从2020年开始研发,技术上已经相对成熟,因此根据我们的经验认为,对高精地图的依赖是可以去除的。
Q:行业内研发重点由依赖高精地图转化为去高精地图,是单纯的成本问题还是高精地图发展跟不上落地速度呢?
A:其实早先在行业内,包括主机厂,一些创业公司也考虑过去高精地图,但可能主要还是前几年技术不够成熟,因此不太往这个方向投入。后来特斯拉,包括元戎做出来之后,大家发现这个技术是可行的。因此今年大家认为这项技术接近到了突破点,越来越多的人认可了这项技术。
Q:无图方案进行量产的话,是否需要对每一个城市都需要泛化?由于无图方案重感知的情况,这是否意味着系统需要强数据闭环?
A:首先,因为城市中大部分道路都比较规则,泛化的意义不是特别大。基本车辆在比较规整的简单路段开过一次后就能学会,因此换到另外的城市也可以运行。
难点是对于那些不规则的corner case,比如修路或者高架场景,这些人看着地图都可能开错的路口,我们需要更多的数据。因此在城市的复杂道路,还包含一些乡村的道路,都需要大量的数据去进行泛化,所以当然这里面一定要依赖于一个强数据闭环的系统。
这套系统是非常综合的,它包含感知,定位,规划等,有一整套的交互式的流程。我们需要非常多的数据,尤其未来想要过渡到纯视觉的话需要更多数据。所以如何从海量的数据中找到有用的,把这个算法迭代的更好,它对能力要求是非常高的,比以前的传统方案更难。
Q:在这种模式下,主机厂和集成商怎么高效地合作,才能把数据闭环打通?
A:数据的所有权一般归属主机厂,但主机厂会将数据共享给我们进行共同建设,让我们进行算法模型上的更新,能够适应更多路况,得到更好的表现。最终希望这个产品能够不断地迭代,升级服务提供给用户。另外这些数据都会在可控、可信的云平台上,我们只需要让它能够训练模型就行。
Q:Mapfree方案对于组合惯导这些定位设备的需求或者变化点在哪里?
A:我们目前的组合惯导产品包含IMU、GNSS,大概是百元级。不需要带差分定位,仅需要它能够提供十米左右位置的定位精度就可以了。然后通过算法让它能够满足安全的需求,这样也可以给车企降低一定的成本。
Q:无图系统在智驾的过程中怎么去利用好SD地图?
A:对于SD地图的应用,我们主要将其作为一种参考的信息,更多的以实际感知到的信息为主,然后将导航地图作为参考,让它能够学到更像人的一个价值行为。
Q:有图、轻图和完全没有图分别给车厂减掉多少成本上的压力?
A:纯SD的一辆车一个月大概几十块钱的成本,但是HD的一辆车一年可能是几百块,然后SD Pro或是HD Lite这个级别可能是一年一百到两百块。但是现在的问题是,HD和SD Pro覆盖的城市数据还不够多,目前只有六个城市,未来开更多城市的话,成本势必是要增加的,所以这个成本并不一定是固定值。
Q:轻地图成本和高精度地图相比,采集的过程中所产生的费用差距不大是吗?
A:对,并且它采集数据,后续更新时,同样需要经过审图的时间周期,所以更新的频率可能不会那么快。如果完全依赖于高精信息,更新频率不够高的话,可能对算法的性能表现也会有一定影响。
Q:城市泛化节奏是怎样的?前期从一个城市泛化到另外一个城市大概需要多久?
A:目前,测试车辆在16个城市做泛化性的数据采集和测试。因为完全不依赖高精地图,所以只需要将车投入城市进行测试就可以。因为如道路的交通灯等信息的识别,模型本身是经过一定的鲁棒性、泛化性的训练。其次不同城市最具挑战的,并非感知结果,而是道路结构是否复杂。
其实,所谓泛化测试,更多是采集路网的静态信息,让它学到不同的城市道路中难解决的,有挑战的场景。因为是Mapfree,不依赖于导航地图,因此不太需要做提前的准备,因此泛化需要的时间比较少。
与特斯拉不完全一样,更注重模型学习
Q:元戎这套无图方案,针对ICV/L3的功能安全方面的准入需求是如何应对考量的?
A:首先对于算法本身我们有具体的指标,与我们自己的使用高精地图的算法或者市面上采购到的算法定期做对比。从产品的效果上,包含系统的安全性,舒适性,行驶的效率等进行比较。
关于功能安全,现在合作的车企对此要求也是非常高的。在合作过程中,我们会把车企对于安全的方面的需求进行分解,然后根据其中的每一个模块,按照要求比如去进行系统层级的软件乃至硬件方面的监控。例如针对汽车MCU的芯片,我们会有对应的监控,然后对于Orin芯片上的一些故障事件,我们有对应的模块进行监控,保证系统有一些故障或者失效的时候,对应的信息能够达到车企需要的功能安全的状态。
Q:当道路环境复杂,出现盲区时,是否能够及时预判当前道路环境?交通拥堵产生感知盲区时,功能实现的效果和安全性是否会下降?
A:对于路口有遮挡的信息,如果之前已经识别到物体进入,那么在较短时间内,感知系统通过多帧的融合感知可以追踪到这个物体,并且我们内部有一些Benchmark,它的精度非常高。除非是对于之前是没有任何信息的鬼探头,可能难度比较高,但这种情况对于任何算法都是非常难的挑战。
更难的一点是Mapfree去认路时,如果由于堵车识别不到停止线,此时算法会通过机器学习的方式去猜测停止线的位置,根据大量人类驾驶员或是基于强化学习的经验来进行判断。
其实Mapfree比起传统的高精地图,对于堵车或者修路的情况,我认为是带来更多的便利性。
因为如果真实道路和地图不匹配的时候,导航地图会由于更新不及时有很多错误信息,那么传统车辆可能就会失去方向,但是Mapfree一切以实际道路发生的事情为准,这个是最准确的信息。所以我认为从安全性角度来是更可靠的。
Q:元戎在技术上走的是比较激进的路线,如何保证系统有足够的稳定性和安全性?
A:其实是把过去静态的高精地图的信息,转化为动态的实时去识别的信息。所有的安全性的认证指标还是沿用了L4 Robotaxi,并且因为现在需要考虑到用户的体感以及通行的效率,添加了很多指标。我们在软件算法方面,是尽力保证安全性的。但是在一些特别极端的情况下,也会去提醒乘客,让驾驶员进行一定程度的人工干预。所以其实它和用HD map的系统不会有太大的本质区别。
Q:你们提供的方案会放弃激光雷达吗?
A:我们今年纯视觉的产品是先提供传统的L2+辅助驾驶,加上高速NOA,后续我们计划明年让它也能够提供城市NOA。因为纯视觉需要的数据量更大一些,目前它给用户的体感和带激光雷达的还是有一些差距的。
Q:对于L2+或 L3级别未来的方向,实现城市的高阶辅助驾驶中激光雷达是必要的吗?
A:对于现阶段而言,要实现城市的L3高阶辅助驾驶,激光雷达还是必要的。由于目前量产的车不够多,纯视觉的数据不够多,所以现阶段用户的体验和安全性还不能完全和带激光雷达相比。但是我认为到明年这个很可能会有突破。往未来最终看,当数据足够多的时候,纯视觉应该是能够取代激光雷达。
Q:如果有激光雷达的话,还能做一层冗余,后续做纯视觉,如果硬件本身出了问题,安全性应该如何保障?
A:其实现在所有的车上的传感器都不会做两套备份,都是只有一套。比如,摄像头的视角是能够互相覆盖其中一些数据,所以如果失效其中一个摄像头,可能依旧可以以降速的方式正常驾驶的。如果在纯视觉影响比较大的情况下,可能会降速限制更多。对于这种情况有安全降级的概念,比如降到最基本的L2+,拨杆变道等等传统的L2+的功能。
Q:在某些城市比如上海,有一些左转的路口需要在最右侧车道进行,这与我们平常的习惯相悖,如果此时堵车,无法识别马路上的箭头指示怎么办?
A:这种拥堵情况相对来说可能会难一些,但是基本上我们会结合实时识别,加上导航给的信息综合考虑。类似这种路口,包括可变车道等等,相对来说都是比较难的,但现在基本上只要多跑几次都能学习处理。
Q:特斯拉在最新版本 HW4. 0硬件方案里面,设计了4D毫米波的接口,你们是否有测试过4D毫米波雷达,性能上跟基本的补盲雷达有什么区别?
A:4D毫米波可以看作激光雷达的平替版本,能生成点云,但点云质量比激光雷达差,价格也更便宜。它可以根据车企的需求使用,但也需要测试它的成本跟实际产出的效果。目前4D毫米波好像还未大规模出货,不是很成熟,另外激光雷达以后也有可能会降价,如果降价多的话,可能跟4D毫米波价格相差不大。那时可能车企又会有不同的想法。
Q:现在这个系统会记录历史的行驶信息吗?比如Model Y其实在所谓的众包地图上是有历史的,无论是车速信息还是轨迹信息,是可以去不断地去学习优化的,让它能更像人。元戎这套系统是否也会把之前行驶过的信息能够有存储和体现然后不断学习?
A:我们的技术路线和特斯拉不完全一样,并不需要让车辆记住某个路口的具体数据,这不是这个技术路线的目标,我们的目标是希望能够让这个模型本身学会,像人一样思考,在行驶操作中各个数据可能在一个什么样的范围之内,然后自己完成操作。我们更希望让模型自己去学习如何操作,而不是说把这个路口的信息记录下来,因为记录下来还会涉及到一些更新的问题,很多信息更新不及时也会带来一些问题。
追逐降本,打造平台化产品
Q:作为一个L4的公司,进入到 L2+的领域,有哪些优势,又有哪些不足需要补充?
A:无论是L4还是L2+,其实都在进一步精进技术。进入L2+的领域,能够让我们的技术适配在这种可量产的硬件上面,比如去高精地图依赖,其实技术是更向前进步,同时也更难的。因此在算法方面,我们的技术应该还是非常领先的,综合一下能够提供对这个行业更有竞争力的产品。
在量产定点等方面其实涉及很多难点,比如工程化的能力。因为在跟车企合作的过程中,车企会给我们很多具体的硬性的时间节点,在指定的节点需要交付什么技术。在进行合作的过程中公司的能力也提升了很多,毕竟之前没有走过这个流程,但是经历过一遍之后培养起来了这个能力。
Q:对于主机厂的不同要求,怎样引导他们做产品化,而不是项目制的交付要求?如何在满足主机厂要求的同时将自己的定制化要求降到最低?
A:我们目前打造的平台化的产品,通过平台提供一些基础的能力,同时可以针对不同主机厂的个性化需求,定制性开发其中某些特性。这样就不需要针对每一个主机厂或者每一个车型去单独开发,因为中间有很多是通用的能力。
据我们了解,现在越来越多的主机厂为了降本,内部的智能化也是走这种平台化的方案。我们作为供应商和车企进行交流的时候,发现这种平台化的方案很多时候是不谋而合的,所以在这方面上其实还是挺有优势。
Q:目前你们的L4和L2+是同时在进行研发吗?
A:L4和L2+的软件算法是同一套。并且我认为智能驾驶最终都是趋近这个方向的,未来Robotaxi想要实现单车盈利一定需要通过量产车完成,否则商业上很难形成闭环。因为传统的Robotaxi的传感器非常多,在商业上很难回本,所以目前包括国外的趋势也是往量产车这个方向考虑的。
Q:未来的Robotaxi 还需要地图吗?
A:可以不用。因为地图本身是人为地给车加上一些规则,人工编辑的一些信息,因此如果数据足够多,算法能让车按照人的思维去驾驶,实现真正人工智能的话,L4乃至L5是可以达到的。