当特斯拉FSD V13将在2024年10月发布,国内关于“我们与特斯拉智驾孰强”的话题,仍然呈现出两极分化的态势。
一类是由于FSD未曾进入国内,不少人没有机会充分体验最新FSD版本,又或者被此前高精地图版智驾的“开卷考试”影响认知,觉得“这不算什么”,故而认为“我们的智驾遥遥领先”。
一类是被“BEV是特斯拉率先使用、OCC也是特斯拉独占鳌头,端到端还是特斯拉一马当先”给吓到了,加上“特斯拉有最多的智驾车在积累数据”,觉得“这辈子怎么都不可能超越特斯拉”。
然而,我们能不能从技术的底层原理去分析?中国汽车智驾能超越特斯拉吗?这个问题,适合提给进步速度最快、后来居上的“黑马”。
于是我们选中了理想汽车,这家企业原先并不以智驾技术作为长板,然而过去两年进步神速,在今年7月开放了无图智驾,并且截至9月已经达成19亿公里累计智驾行驶里程,超过了蔚来的10.41亿和小鹏的9.82亿,处在国内车企榜首。
能否超过特斯拉?带着前面的疑问,我们采访了理想汽车智能驾驶研发副总裁郎咸朋博士,和理想汽车智能驾驶高级算法专家詹锟。
“落后”可以扭转
如果,“智驾领域,中国落后于美国,该如何超越”,是不是可以参考“智驾领域,理想原本落后,现在后来居上”?
在采访过程中,我们没有客套,上来直接抛出问题“一开始落后的理想汽车智驾,是如何缩小差距并着眼反超的”。
“后进生逆袭到第一梯队很正常。”郎咸朋笑着解释,并未否认理想智驾曾经的落后,毕竟“不鲜亮的过往”,有时候并不是污点,反而更能反衬如今的光彩。
他将理想的后来居上归纳最重要的原因,归结为高组织效率。
乍一看似乎这是个管理学的概念,和智驾技术关联并不高,然而研发是一种团队工作,必然与组织、管理密不可分,需要统筹、协调和优化。
虽然不少消费者觉得理想和华为是天然的竞争对手,但从李想本人开始,理想汽车并不讳言对华为的尊重和学习态度。郎咸朋坦陈:“我们是向华为学习的组织架构,比如我们内部有IPD流程等。这是我们学习一些先进经验,然后结合理想汽车自己的企业特点进行内化处理的结果。”
而詹锟更详细地铺开了说明,目前在理想汽车的智驾团队,预研PD、研发RD和交付三者同步进行,“我们是交付一代、研发一代、预研一代,这是我们为什么能一直紧跟目前智驾最新技术方案的原因,我们有比较好的阶梯式研发流程。”
就像华罗庚当年给大家科普的“统筹思想”,可以在“烧开水”的时候“洗茶杯”,并行不悖的事情同时推进,最后总时长最短。
理想汽车在研发无图NOA时,就已经预研端到端架构,提前做好了储备。“所以这是我们为什么会速度比较快的原因。如果大家觉得牺牲了效率,其实是因为没有找到提效的方法,”詹锟非常一针见血,“我们逐渐已经找到了通过自动化测试、世界模型高效验证模型的方法,所以我们才能兼顾速度和质量。”
因此,某种意义上,我们可以把理想在智驾赛道上的奋起直追,简单概括为“组织架构决定研发效率,研发效率决定进步速度,进步速度决定智驾地位”。
为此,理想汽车一直在持续优化组织架构,以提速智驾技术研发。
现阶段理想智驾研发架构中分为算法研发和量产研发,分别对应着不同的小组,小组对应的是端到端不同模块。
根据郎咸朋所言,在整体战略规划和业务战略里,理想汽车对于业务组织有清晰的布局。组织根据业务变化,业务的目标和迭代则根据战略调整,这就是理想的BLM流程(业务领导力模型),原先被称为LSA流程(理想汽车战略分析法)。
“大家可能对外感知到的是产品、组织的迭代,但实际上背后影射的是我们战略和业务的迭代和变化。”在他看来,表层的变化,其实对应着底层的进化。
追溯理想汽车智驾研发的组织变化,可以比2023年更早,当时李想提出将智能驾驶作为公司战略,2023年秋季雁栖湖战略会上首次明确提出PD和RD都非常重要,并同步作为公司级战略展开。
“接下来组织会不会发生变化,要看跟业务是否有关联。”这个答案的本质在于“不变是相对的,变是永恒的”,毕竟业务的形势在无限拉长时间轴之后,一定会发生重大转变。而哪家企业能够迅速进行调整,哪家企业便能在技术研发、产品打造和销售营销等各个维度最快适应市场。
“我们可以超越特斯拉”
古代西方文明,“言必称希腊”。如今汽车智驾,“言必称特斯拉”。
希腊如今再也不是西方当代先进文明的代表,特斯拉在智驾领域能不能被超越?显然,这是从技术和工程角度考虑,而不是从对品牌的信任角度考虑。
以国内目前智能化技术最强的华为来说,我们相信它相对于特斯拉的优势并不只是“华为”两个字,而是“华为真正做到智能化全栈自研,从底层OS系统、传感器、软件和算法、云都是自行开发,更容易打通”。
同时特斯拉的智驾也并非没有短板。
例如端到端大模型,依然会在纠错端存在效率低下的短板,必然需要“教师模型”先于“学生模型”去纠偏纠错,而不是当真完全割离与人的关联。而纯视觉路线,虽然有“无需2D转3D的流程冗余”、“无多渠道信息互扰的牵绊”等优势,但无论如何无法克服“上限即为人驾”,以及恶劣天气对摄像头的拖累。
那么,不是所有的整车企业都能像华为那样,搭建七千到九千人的智能化技术研发团队,软硬件、系统和云全部自行研发并打通,那么又该如何超越特斯拉呢?理想汽车的思路似乎更具备借鉴意义。
“两个系统,强于一个系统”。
这既可以是简单的1+1>2算式,也可以是深邃的思考结论。
郎咸朋和詹锟已经不是第一次介绍“系统1+系统2”,但真正理解的人还不算多。
先回顾下端到端技术,这是指不再用人工制定规则的方式去约束智能驾驶系统,仅仅用人工智能模型,机械自学习的方式,去替代智能驾驶过程中的感知、规划控制等模块,从视觉的“输入”端,到智能驾驶系统最后控制车辆自行驶“输出”端,完全依靠模型自身系统来处理,让功能完全黑盒化。
端到端模型,追求One Model一体化端到端。
不过,出于安全冗余的考量,特斯拉、华为和小鹏等这些智驾领军的车企,都会设置一定的底层负责安全冗余的算法,将感知、规划控制模块独立,而接口仍然由人工定义和连接。
于是,超越特斯拉的机会就来了!
首先是真正做彻底One Model一体化端到端。理想这样做了,比特斯拉更彻底。
那么问题来了,包括特斯拉在内,FSD V12演示的时候遇到过短板,上限表现很好,一旦进入到不太熟悉的地区,会出现难以解释的规控决策。那么理想做彻底One Model一体化端到端,该怎么解决安全冗余?
那么这就是超越特斯拉的另一个机会,理想引入了另一个系统——系统2,VLM视觉语言模型。
郎咸朋这样解析运作机理:系统1完全靠自己的视觉感知,执行操作,系统2需要长期积累知识给系统1提醒和告知。系统2能够提供复杂环境的理解能力、读懂导航地图的能力以及交通规则的理解能力,辅助系统1进行规划决策。
打个比方,系统1是司机,系统2 就是驾校教练。
按照理想的说法,VLM视觉语言模型是世界上第一个成功部署在车端芯片的大模型,具备应对复杂场景的逻辑思考及决策能力。
其实,这并不是完全异想天开的构思,而是认知心理学和自然形成机理的延续。
双系统概念,其实正是詹锟团队提出,这是基于认知心理学家、诺贝尔奖得主丹尼尔·卡尼曼理念“人脑有两个系统,一个基于经验和直觉,一个会综合学习积累的逻辑推理能力”。
特斯拉模仿人类视觉,推进纯视觉感知路线。
理想汽车模仿人类大脑双系统架构,两个系统为整个理想的智能驾驶服务。
从模仿人眼,到模仿人脑,谁说特斯拉不可被超越呢?
世界模型也能优化可靠性
我们C次元在采访理想研发高管的同时,还不忘提一把新势力长期被诟病的“可靠性”问题——毕竟,就连特斯拉的FSD,迄今V12.5的测试仍然经常在高速上无故减速,而不信任智驾的受众更是未从“特斯拉智驾骗人”的泥潭中挣脱。
如何解决智驾的可靠性?
验证测试当然必不可少。
“在验证测试方面,我们通过技术提升做到更好的测试和发布效果,同时也减少了时间和人力。”郎咸朋介绍称,“而且,测试效果比原来人力测试更好,这是人工智能技术带来的结果。”
理想汽车用重建、生成技术取代了人工的测试,重建技术很快就能够重建几百公里的场景,包括各种天气路况下的场景,这些场景通过人类驾驶未必能够获取。
同时,提高数据的含金量和利用效率,这也仰赖于数据测试流程的那一套世界模型体系。
世界模型支撑了全新一代理想智能驾驶大范围、高速迭代,提供了自动化的AI能力评价体系,通过重建技术将用户遇到的问题场景变成“错题集”,通过生成技术将用户的真实驾驶场景举一反三为“模拟题”,两个技术确保了在模型评价时错题不再做错,同时兼具优秀的泛化能力。
因此,理想提出“有监督的自动驾驶”,以理想One Model+VLM+世界模型的技术方案,从1+1>2,走向1+1+1>>2。
从当年智驾的后进生,到如今第一家将VLM部署到Orin-X芯片的企业,率先采用双系统架构,以及近百万辆效率规模、到2024年底30亿公里的智驾里程、超过8EFLOPS的训练算力……“我们希望做到智驾第一,”郎咸朋平和地微笑着,并不是狂妄骄傲。
其实无论理想能不能做到第一,有华为、蔚来、小鹏等智驾强手齐头并进,最终智驾第一都将在中国,超越特斯拉也只是一个时间问题,并且已经在推进之中。