6月27日,特斯拉CEO埃隆·马斯克在社交平台上透露,特斯拉的完全自动驾驶(FSD)系统即将迎来新版本——FSD v12.4.2,该版本预计将在28日进入内部测试阶段,将会带来更加流畅的驾驶体验。
6月25日,小鹏汽车董事长何小鹏发文高度评价特斯拉自动驾驶“表现极好”。他表示:“全程体验下来,FSD的表现还是很丝滑的。绝大部分路况处理都让我很安心,很像人类司机驾驶。但中国的道路比美国复杂程度更高,人流和车流更多,很期待FSD之后在中国的表现。”
几年前,中国引入了特斯拉这条大鲶鱼,激发了新能源汽车行业的活力,现在国内新能源渗透率已经超过油车。在智驾领域,类似的一幕上演。特斯拉最强智驾FSD即将入华,要做那条刺激智驾行业发展的大鲶鱼。
AI Day 2021上,特斯拉首次展示基于“BEV + Transformer”的感知范式,展示了纯视觉智驾能力。AI Day 2022之后不久,特斯拉正式宣布拿掉超声波传感器,靠8个摄像头+大算力芯片实现了智驾。
直到这个时候,很多厂商才真正确信,纯视觉智驾确实是可行,各家才正式行动起来,去高精地图、去激光雷达的说法也逐渐成为业内主流。
6月4日,工业和信息化部、公安部、住房和城乡建设部、交通运输部日前发布《进入智能网联汽车准入和上路通行试点联合体基本信息》,确定蔚来、长安等汽车生产企业和使用主体组成的9个联合体,将在北京、上海、广州等7个城市展开智能网联汽车准入和上路通行试点,试点产品涵盖乘用车、客车、货车三大类。
据工信部公开数据,截至2023年底,全国共建设17个国家级测试示范区、7个车联网先导区、16个智慧城市与智能网联汽车协同发展试点城市。近期开展的试点工作为搭载较高级别自动驾驶功能的智能网联汽车准入和上路试点打开了政策通道。
那么,入华之后的特斯拉FSD,会对国内一众智驾公司,以及中国的高阶智能驾驶行业,带来什么影响呢?高阶智能驾驶赢家又有谁呢?
6月15日下午,在中国汽车蓝皮书论坛上,尖峰辩论“高阶智能驾驶赢家已经确定了吗?”对此进行了分析和探讨。
参与嘉宾包括知行科技创始人、董事长兼CEO宋阳、理想汽车智能驾驶研发副总裁郎咸朋、Momenta CEO曹旭东和阿维塔智驾负责人董志华。本场主持人是晚点LatePost副主编、科技报道负责人程曼褀。
宋阳认为,特斯拉在自动驾驶里面投入的资源非常大,不论硬件成本很高,还是运行成本都非常高。它打造的结果肯定是非常好的。不过,不用特别担心,中国人通过创新和勤劳,是可以做的,肯定没问题。
郎咸朋认为,FSD进入中国对各家自动驾驶进展来讲,都是很好的事情。即使是V12版本,也没有达到让我们放心使用的程度,但从技术角度来讲,它的突破还是很明显的,但理想非常有信心和它一较高下。
曹旭东表示,特斯拉公司是非常强的,非常值得学习和尊敬。特斯拉FSD来到中国是非常有创造性的,对整个行业带来的冲击是非常大的,是良币驱逐劣币,会带动中国汽车市场、自动驾驶产业发展。Momenta有产品自信和技术自信,不可能和特斯拉有代差,甚至未来有机会领先于特斯拉。
董志华表示,这是一个好事,当我们讲智驾好坏或者领先与否的时候,一定要有一个标杆。特斯拉FSD代表技术演进的方向,技术演进从一个老的方法切换到一个新的方法,初期的水平未必能超过老技术,但是如果再给它一定的时间,新的方法生命力一定会表现出来。
以下为本次尖峰辩论实录,此处有删节。
程曼褀(晚点LatePost副主编、科技报道负责人):大家好,下午第一场圆桌讨论开始了,我是晚点LatePost科技报道负责人。我们是财经杂志合办的一家商业媒体,平时非常关注汽车行业和智驾的发展。今天非常感谢汽车商业评论组织中国汽车蓝皮书论坛,让我有机会参与。从这里也可以看出蓝皮书论坛的号召力,汇聚了车企和头部供应商的嘉宾,大家可以先简单自我介绍一下,因为有的嘉宾下午还没有上场。
宋阳(知行科技创始人、董事长兼CEO):大家好,我是知行科技的宋阳,知行科技主要乘用车自动驾驶里面的域控制器,我们是一家把算法、软件和硬件甚至包括生产,做到一起提供垂直化整合的系统解决公司。谢谢大家。
郎咸朋(理想汽车智能驾驶研发副总裁):我是理想汽车智能驾驶研发负责人郎咸朋,目前正在全心全力在做更高级别的自动驾驶。前两天李想在重庆论坛也提到我们在做端到端自动驾驶。
曹旭东(Momenta CEO):大家好,我是MomentaCEO曹旭东,很高兴和大家交流。
董志华(阿维塔智驾负责人):我是阿维塔智能驾驶负责人董志华,阿维塔是把智能化和设计定位为TOP的车企,在智能化领域,智能驾驶是非常重要的抓手,所以阿维塔和广大业界同仁今天共同探讨这个话题,特别荣幸和有意义。
程曼褀:第一个问题,在各位嘉宾心中,中国高阶智能驾驶做得最好的车企是哪些?不要犹豫,不用解释,就直接说一下。曹总先说一下,因为你笑得最开心了。
曹旭东:这肯定是用户说了算。我帮客户打一下广告,高阶智驾,像智己、腾势、广汽的昊铂,高阶智驾和城市NOA体验都非常好,当然华为M9、M7也做得不错,我非常推荐大家有机会在不同城市可以对比一下,试一试。百闻不如一试,试完之后大家就知道各自的亮点在哪里?
宋阳:我认为阿维塔、华为做得不错,理想汽车也是做得非常棒,还有行业也普遍认可的小鹏汽车做得也不错。
郎咸朋:各个车企都不错,各个城市各个场景下多试一试,中国智能驾驶这两年做得非常快,至少比国外快很多。而且我们看到有很多优秀的行业伙伴,大家共同加速智驾的成长,大家都挺好的。
程曼褀:董总回答一下。
董志华:特别难回答,这两年在座的各位应该感恩这个环境和行业。印象当中,十多年前大家提辅助驾驶的时候,消费者的眼光里面,这都是鸡肋,这两年再问消费者,他们已经不会这样看了,这就是所有人努力的结果。
尤其这两年,大家进步都很快,今天主持人出了一个非常难的题目,我分不出孰高孰低,我斗胆提名阿维塔属于第一梯队是应该有的。包括蔚小理,还有华为的ADS、曹总的Momenta等赋能的车企也都做得很棒。
曹旭东:感谢董总,讲得特别好。
安全最重要
程曼褀:您刚才说到消费者非常乐于看到智驾,你们心中智驾做的好标准是什么,比如说我是一个消费者,想买车,想买一个城市NOA功能的,从哪些点可以判断这是做得比较好的?
宋阳:消费者对于智驾非常喜欢,和智能座舱一起,是消费者买车最看重的两个点。什么是智驾最好的体验呢,消费者怎么想呢?
首先是基础的事儿,基础的事儿就是安全。消费者最关注的就是各种场景表现能力,其实在实际开车过程中,安全性会比较重要,只要在安全性方面有一次问题,比如说做智驾前向感知更重要的就是AEB,自动紧急刹车。AEB最重要的是要很少有误触发,车在路上开的时候,只要有一次不应该刹车,它却刹车了,消费者肯定认为这是一个烂车,下次不会买,也不会给朋友推荐。所以安全是消费者比较关注的
消费者是非常关注中高阶智驾非常重要的,就是复杂场景表现是怎样的,非常典型城市里面带红绿灯的左转弯,没有标识会车的情况,比较复杂的情况,突发的情况,如果接管次数比较少,体验就非常好。
程曼褀:有一个建议,试车的时候就专门去这种地方。
宋阳:是的。
程曼褀:大家有新的点可以补充。
郎咸朋:一个好的智驾或者自动驾驶的功能,主要有两点,一是用户满意,二是同行认可。用户满意主要是三个点,安全、舒适、便捷,宋总讲了很多安全性的内容,舒适和便捷也是非常重要的。安全方面多说一句,我觉得安全确实是智能驾驶中第一位的,因为车的智能和其他智能不太一样。
所有做AI产品里面,自动驾驶是最难做的,因为它既要求你有很高的能力上限,同时要求有很高的安全底线,车不可能这个地方开错了,再开一遍,就没有下一次了。安全是最重要的。
安全在人开车的时候安全,AEB是一个方面,更重要就是NOA和智能驾驶功能启动的时候,它的安全性就体现在MPI或者MPCI的指标上。
舒适和便捷,讲通俗的话,就是开得像人,这个车怎么开的像自己开的一样,这样用户就觉得购买智能驾驶功能值得。
开得像人,过去很长时间一个方式就是设置各种规则,让车开得更加安全和符合人类的驾驶体验。但是这种做法上限比较低,因为我们不可能穷举所有的规则和所有的Corner Case,数据驱动结合数据驱动大模型的方式,是更有潜力的一个方式。
我们对智驾核心的思路就是端到端+大模型,就是系统1+系统2的理念,我们认为这个方式是更接近于人类驾驶的更有前途的智能驾驶方案。
曹旭东:我估计这个答案没有特别的新意,还是安全、高效,总结的就更像开得特别好的老司机,比如说国宾司机,这样的体验是消费者更加认可。
怎么实现这个呢?我们公司从用户视角出发,把自动驾驶分了很多场景,不是从研发视角分的,而是从用户视角分的,比如说变道分成导航变道、车道变道,每个场景都有老司机的数据,算法出来之后和老司机的数据对比,比如说变道效率、安全性、舒适性等,通过这样的方式衡量现在的系统距离老司机水平到底好了多少,构建一套数据体系和评测体系,保证安全、安心、高效,更加像国宾司机、老司机的驾驶风格。
董志华:还是要多啰嗦一句,每个领导都讲到安全,安全是一个基线,确实是最重要的一环。阿维塔有一个理念叫做安全是最大的豪华,安全是所有议题的前提。但是安全和主持人的命题又不太一样。安全并不是消费者购车的时候就可以清晰感知到的,很难用一组数据向他表征,我这个智驾很安全,更多的是今后使用过程中,在一些意外场景里面挽救他,或者给他一些意外的惊喜。这是属于购车使用过程中后续的一个环节。
回到主持人的话题,在消费者眼里,他的认知有点类似于曹总讲的和老司机接近的程度。你今天问一个普通消费者,一个好的智驾应该怎么样?他肯定告诉你,应该像老司机那样。意味着我是一个新司机,我是一个不怎么会开车的人,都应该能够完全信任这套智驾,这是消费者今天的期待和民众的认知。
作为业内人士都知道,实际上今天的智驾真不敢说可以到一个老司机的程度,能够帮助一个不怎么会开车的新手司机很好地开车。我认为现在技术上还没有达到这一层。
今天的智驾能达到的是帮助那些老司机,本身开车比较好的司机,去减轻他的工作负荷。他还需要一个老司机监督他,在不行的时候,超出边界的时候,及时认知到这一点,及时接管,这是智驾能达到的水平。
反过来看,它的方向一定是越来越接近老司机,越来越可以胜任帮助新手司机从容开车的方向努力,越接近这个程度,我们可以说它是一个越好的智驾。
我觉得可以从事后用户使用黏性量化或者比较定量的这一点。如果这个智驾系统买回来之后,用户觉得不怎么样,不好用,使用黏性一定不高;如果越用越喜欢,上瘾、离不开,这个智驾对他的满足程度就比较高。从一前一后两个方面可以衡量。
程曼褀:你们看到的黏性是怎样的?
董志华:这个数据一直会持续更新,比如说自动泊车,具体数据记不清了,但确实已经比较高。这个“高”可以从另一个侧面来反映:当智驾系统因为某些原因暂时没法使用的时候,用户的抱怨会很强,因为平时一直在用,已经成为阿维塔车主们驾车体验的一部分了。
郎咸朋:大家知道理想做城市NOA千人公测,目前数据统计结果是截止到现在,基本上用户日平均使用率80%以上。TOP5用户日均使用比例是99%多,我们很怀疑他是怎么开出来的,但是确实是开到99%多。
程曼褀:是指中间开是2小时,中间99%都用智驾吗?
郎咸朋:99%都用NOA,他们能开到90%以上,之前刚开始包括我自己,能开到90%左右,还能进TOP5,后来很长时间进不去了。千人公测从5月10号开始,到现在一个月左右时间,有用户只用城市NOA就开了几千公里,很厉害。前几名里面有一个我们自己的员工,都是每天使用。
智驾价格怎么定
程曼褀:刚才你们没有提到价格,你们觉得消费者不是很Care这个事情多少钱吗?比如特斯拉FSD套件卖6.4万元,华为阿维塔是3万元左右,去年中间大家也有一些折扣,5折也可以买到,降价或者更便宜可以买断,这个对大家用这个东西会刺激消费吗?
郎咸朋:我们智驾是标配,不会收费的。智驾这样的功能,应该是无差别地给到大家。我们有两个配置,大家可以选,如果高速用的多可以用Pro,如果用更高级别的可以用Max,这是理想的考虑。
董志华:阿维塔智能驾驶硬件是标配,但是功能还是有选配。我们基线版本能做到高速领航辅助,像多个激光雷达和高速领航辅助在阿维塔是标配,需要付费的几万块钱高阶包,仅仅是针对一些持续发展的高阶功能,比如说城市领航、AVP,甚至将来L3的功能,这些需要付费。
总的来说,我们在标配的免费部分已经提供给了足够强大且丰富的功能,同时由于硬件预埋,又保留了用户进一步升级的可能性。
程曼褀:宋总和曹总,您们作为供应商,觉得怎么定价合理,您的PPT还出现“价格冰点”几个字,曹总演讲也讲BOM成本一直在下降,2年之后可能只有4000元的成本了。
宋阳:成本最终还是汽车行业竞争非常关键的因素。因为主机厂出于成本考虑,会让供应商降价,所以我们还是要用创新的方法降价,比如说我们设计的IDC300、IDC500,都通过一些硬件设计,比如说MCU收到SOC里面,然后通过提高工程效率,在算法和软件中间件、硬件结合上面,因为我们是一个团队,这样效率比较高,能够提供一个高性价比的产品,是通过创新和效率两种方式让价格降下来。
特斯拉FSD是6.4万元,这个背后肯定特斯拉并不是拍脑袋定价,肯定有一个财务模型算出来的。它做FSD的时候,背后会有服务器、人、数据的处理,统统算了一遍之后,发现这个价格,市场可以接受,而且考虑成本。这个价格中,成本是非常重要的。
曹旭东:关于价格的话,因为我不是OEM,OEM出于不同的市场策略会有不同的定价方式和销售方式。
我分享两点有确定性的东西。
第一,能够实现城市NOA的硬件,未来15万元以上的车会标配,这个事情会发生在2026年到2028年,那时候硬件BOM会降到4000元左右。这个BOM情况下,15万元以上的车会标配,会不会开通城市NOA不一定,有不同的销售模式,但是能够实现城市NOA的硬件会标配。
第二,商业模式上逐渐会往订阅模式发展。特斯拉每个月99美元,中国不同厂家的订阅费不一样,不同价位的车订阅费也会不一样,订阅模式会成为主流。
重要的原因是因为软件摩尔定律,订阅模式核心点就是体验好,消费者愿意复购,用了一个月之后,形成黏性了。实现订阅模式,现在智驾水平还做不到,2年提升10倍,2026年至少30%、40%的用户认为体验好到形成依赖,2028年提升到100%,可能80%的用户会认为智驾体验足够好到形成依赖。
FSD入华的影响
程曼褀:FSD现在就是订阅,FSD传言要进中国,可能会改变这个节奏吗?车企郎总和董总怎么看FSD进中国给行业带来什么影响?
郎咸朋:正好昨天有一个新闻,特斯拉新闻是大家很关注的。对于我们来说,我们内部早就聊过这个话题,FSD进入中国对各家自动驾驶进展来讲,都是很好的事情。我自己去美国的时候都体验过特斯拉FSD,希望有更好的产品进入到中国。我们一起参看行业的大家各自做的好的点,把更好的产品带给用户。不光是硬件标配,软件的标配也很重要,因为当前大的环境下,怎样给用户提供更好、更高用户价值的产品是非常重要的。
现在智能驾驶产品看起来还不能满足用户日常使用需求,高速上好一点,城市还不足以达到高速的水平。
程曼褀:你去试FSD的时候,觉得它的满足吗?订阅费达到让你上瘾的程度了吗?是V12吗?
郎咸朋:不是,那时候还没有V12,我今年年初试的时候。
程曼褀:那时候已经推了。
郎咸朋:即使是FSD V12版本,也没有达到让我们放心使用的程度,但从技术角度来讲,它的突破还是很明显的。
董志华:这是一个好事,无论是舆论场,还是民众,大家都很好奇,都想知道FSD在中国环境下会是什么样的表现。当我们讲智驾的好坏或者领先与否的时候,一定要有一个标杆。有这个标杆的话,大家才能够客观地比较,我们跟标杆比是什么样的水准。从这个意义上说,需要有这样一个事件发生。
对于阿维塔或者ADS,我们大体上的想法还是感觉比较有信心。我们认为至少在中国的特定场景下,以及在很多特定工况下,安全性和对于中国道路的适应性方面,有一定的信心,会做的比较好。对大环境来讲是好事。具体到这套系统来说,我们还是有信心的。
程曼褀:如果FSD进了中国,中国路况很复杂,FSD不适应,对整个行业不是利好吗?
董志华:它代表技术演进的方向,技术演进从一个老的方法切换到一个新的方法,初期的水平未必能超过老技术,但是如果再给它一定的时间,新的方法生命力一定会表现出来。如果在初期由于数据量或者开头的一些适应性的东西没有做得太好,也不能否定这个东西。这也是需要公众客观认知的。
郎咸朋:特斯拉也不会这么贸然把一个没有测试好的东西展现给大家。像理想、华为这些公司,在中国道路上还是有自己的优势,包括数据、测试环境的、数据程度的,如果特斯拉真的进来,我们非常有信心和它一较高下。
程曼褀:宋总、曹总,因为马斯克在今年第一季度汇报会上说他们也在和一家车企谈对外授权FSD,相当于特斯拉也到和你们同一个环节竞争,而且马斯克说他们今年就会和这个车企达成合作。请两位聊聊,有一个新的巨头特斯拉进到你们这个环节,你们怎么想的,什么感受?
宋阳:它是一个商业行为。商业行为还是要归到本质上来,特斯拉在自动驾驶里面投入的资源非常大。刚才几位演讲嘉宾也提到,他们是100亿美元来做数据训练,背后是有多少万张GPU卡,比如说二三十万规模的卡,这么多服务,不论硬件成本,还是运行成本都非常高。它打造的结果肯定是非常好的:一是有些新闻,二是它肯定是有所准备的。它做软件授权,肯定这个商业行为是有成本的,在这个成本下,是不是可以让消费者能够接受这样的功能表现。我们不用特别担心,至少中国人创造力不比美国人差。
程曼褀:FSD给别的车企用也是会很贵是吗?
宋阳:它肯定有很高的成本。这个商业行为也是要赚钱的。我们中国人通过创新和勤劳,不用特别担心,我们可以做的,肯定没问题。
曹旭东:首先特斯拉公司还是非常强的,非常值得学习和尊敬的。我今年年初试了特斯拉FSDV11,最近我们的团队又试了特斯拉FSDV12,团队反馈非常惊艳,相对V11大概提升50倍左右,进步速度非常快,提升非常大。对于整个行业来讲是非常大的利好,对整个行业是引领作用。
我去年年底也体验了Waymo的车,体验非常惊艳,FSD的体验很接近Waymo的体验。Waymo用了很多激光雷达,非常大的算力,传感器加算力可能要到10万美元,甚至更高的成本。
而特斯拉FSD只用了8个摄像头,用的还是HW3的芯片,传感器加域控成本,我们算过是大概4000元人民币。这样的成本,做到这样一个体验,在我们看来是非常有创造性的,对整个行业带来的冲击是非常大的。
而这个冲击在我看来也是非常正向的,尤其它来到中国,对中国整个智驾行业冲击也是非常正向的。有点像当年特斯拉来到中国之后,中国电动车拐点就发生在2019年,爆发时间点在2020年。
2018年甚至更早的时候,中国电动车的水平是比较参差不齐的,但是2019年之后很快洗牌,基本上良币驱逐劣币,整个电动车的体验有大幅提升,涌现出了非常好的企业,比如说理想和阿维塔,我试过理想和阿维塔的车,豪华感比特斯拉更强。
特斯拉FSD的创新来到中国,对中国的效果也是良币驱逐劣币,带动中国汽车市场以及自动驾驶产业的发展,最终中国自动驾驶公司不光能在特斯拉卷价值的方向上生存下来,甚至还变得更强了,最终从中国走向世界,就像现在中国的电动车走向世界一样。
程曼褀:这是回答上个问题,我现在的问题是它跟你抢生意了。
曹旭东:从战略来思考,只要特斯拉没有比我们领先一到两代,不可能抢走我的市场。因为对于很多OEM来讲,很难下定决心用它的潜在竞争对手的一套方案,对于我们来说,我们也有产品自信和技术自信,我们不可能和特斯拉有代差,甚至未来有机会领先于特斯拉,这是有很大的机会。
程曼褀:代差的定义是什么?
曹旭东:从用户视角,只要坐在这个车,半个小时就可以体验出代差,半个小时内体感没有差别就是没有代差,如果有很大的差别,就是有代差。这不需要量化的对比,普通消费者坐在车上半个小时就可以体验出来。
程曼褀:特斯拉FSD本身引领了很多的行业热点,如BEV+Transformer,自动驾驶大模型等等,中国车企比较激进,有些车企说今年要上,李想说最晚明年初也上端到端方案。有一种观点认为,一个新的方案刚上线的时候,端到端的一些体验,可能不如以前依靠高清地图加规则的路线,甚至大家有一些安全上的担心,你们认为端到端上车比较合理的步骤或者时间表是怎样的?
董志华:这个问题可能没有固定的答案或者正确的答案,对于端到端,大家都是在摸着石头过河,相信宋总和曹总,肯定有技术路线的规划,以局部端到端向完整端到端逐步发展,这个规划最终是不是能够按期落地,也要慢慢探索。就像主持人所讲的,可以这样上,上了之后效果好不好,安全性怎么样,都会影响实际商用落地的节奏。
我对这个比较持中立的态度,并没有最乐观,也不算悲观,我个人认为要实现完整的端到端的商用落地,大约需要两年到三年之间,大概是这样一个时间节奏。
曹旭东:我今天分享的报告里面已经汇报过了,就是我们端到端架构已经上车了,上车之后确实效果很好。从去年年底到现在,也就半年时间,我们的性能在城市NOA上面至少提升了10倍左右,带来的效果还是很好的。今年车展的时候,当时也来了一批国际客户,有日本的车企,也有欧洲的车企,他们都体验过特斯拉4月份FSD V12,V12每个月都不一样,当时的评价我们的体验和特斯拉V12体验各有千秋,中国路况更挑战,更复杂,更有意思一些。
整个端到端架构天花板也非常高,我们的目标从当前到今年年底再提升10倍,我分享软件摩尔定律是两年10倍,这是一个均值,实际上有可能在两年时间里提升100倍,甚至更多。尤其是在当前这个阶段,哪怕第一梯队整体的水平还有大幅提升空间的时候,其实提升速度是可以更快的。
端到端的落地,我们也是分了几个阶段。因为端到端感知+规控,感知用Deep Learning端到端来做比较成熟的,规控怎么用Deep Learning来做,行业里还不太成熟。我们过往的经验是Deep Learning,用深度学习如何做Planning做通,模型架构怎么做,数据闭环怎么建,怎么评测,以及上车之后怎么保证安全,这些问题都需要解决.
解决完之后,再把Deep Learning Planning 和Deep Learning Perception串通在一起,实现更高的天花板。这样的方式是我们过往探索出来比较稳健的路径,这个路径是不错的。当然也可以有其他不同的路径。
风险与挑战
程曼褀:你们两位讲讲主要风险和挑战是什么,你们马上也要上了。
朗咸朋:我今天来就是端到端过来的,我们内部工程验证车辆。端到端的研发最主要的需求是在数据、算力、人才三个方面上。
刚才各位嘉宾也提到很多端到端的方式,有组合式端到端,有单一大模型One-model端到端,我们选择的还是纯粹的单模型的端到端,输入就是传感器,输出就是直接出路线,出规划,出轨迹,直接交给控制模块执行。
这个还不够,刚才提到端到端只是系统1的部分,是人类日常开车时的常规场景。当你遇到一些复杂的路面情况,或者一些比较危险的场景,比方说路上有一个大坑,或者几点到几点是公交车道的牌子,系统2还要进行逻辑的分析。端到端可以解决系统1,VLM视觉语言大模型可以做逻辑思考和判断,系统1+系统2是理想认为最终能落到车上解决自动驾驶的方式。
基于此,这里面对算力、数据、人才都有很大的挑战。当解决了人才的前提下,我相信人才大家都能找到,但是数据和算力不一定都有充足的资源。特斯拉讲的,包括行业领先的企业,都开始在讲自己的算力和数据。对于我们来说今年要落地端到端前期工作,李想在重庆论坛上提到最晚明年初,还有可能在今年也会上车。
我们认为最核心的几个点,一是训练数据和训练算力;二是测试怎么做。之前我们做高速NOA测试,因为整个中国高速道路只有三四十万公里,如果一年能测试两三百万公里,你们Cover它5到10倍没有问题,但是中国城市道路上千万公里,抛开非热点道路,也有几百万公里。这几百万公里如何做测试,还是像以前用大量人力做吗?估计测不过来,或者需要很多钱才能做这个事情。
像旭东说的,模型迭代以月甚至以周为测量单位,每周如果大规模回归一次大的测试,你的速度花多少钱都来不及。在端到端时代,你的测试手段也需要有所创新和迭代。在理想来说,我们还有一个系统,叫世界模型,我们会用生成和重建两种模式做世界真实场景的重建和生成。我做了错题,永远知道怎么改,这叫重建,我遇到一个做错的场景拿回来做迭代,另外生成各种各样的场景,给自己出题做,让我的能力不断提升。