「天天说车子(智驾)跑了多少公里的人其实非常外行。」
「城市 NOA 其实只用 7000 元,而且油车同样可以使用。」
「行业第一批 AI+双目方案,4000 元就能实现领航辅助功能。」
3 月 17 日电动汽车百人会论坛上,没有第一天论坛举办时车企之间的唇枪舌剑,却是智驾的主场——自动驾驶企业以及 Tier1 的技术爆点不断。
根据各家企业的观点异同,可以将其大致分为三个流派:体验派、端到端大模型派和智驾平权派。
01、体验派
持有该观点的,以极氪、极越为代表的车企为主。
毕竟在整个汽车产业链中,车企是和消费者距离最近的,同时消费者也是车企产品的最终考核者,一家车企的产品只有打动了消费者才能实现最终的商业闭环,因此在追逐技术进步的同时,车企也更加需要考虑技术能带给消费者哪些更好的体验。
陈奇|极氪智能科技副总裁:智能驾驶正在从资本的狂欢回归理性
作为传统车企孵化出的新势力车企,极氪天然带了一份沉稳。
对于目前的智驾行业,陈奇最大的感受就是行业资本狂热正在消退,但技术狂热远未退潮。
资本退潮就是资本正在从看不清商业模式的 L4 级企业撤离,但智驾渗透率却越来越高。而 L2 级以上的智能驾驶系统渗透率逐渐超过 40%。
甚至极氪 007 智驾版占比超过 80%,其他几家头部车企的智驾渗透率也都达到了 70% 以上。
智能驾驶技术从曾经的空中楼阁,变成了消费者购车时切实考虑的功能。
所谓技术狂热,指的是近一两年智能驾驶领域的新技术如雨后春笋般涌现,如 BEV、transformer 以及大模型等,其中有部分企业一味堆砌「前沿技术」,然而产品的实际使用体验却一塌糊涂。
在陈奇看来,车企不仅要在技术的道路上狂奔,更要思考这些技术能给用户带来了什么。
用已经掌握的技术开发出实用的功能,比单纯地炫技更重要,极氪的指尖泊车和即将推出的机械车位泊车均是基于该理念开发的。
潘云鹏|极越汽车智能软件副总裁流畅交互、全域智驾、自我迭代是关键
同为车企的极越与极氪的观点颇为相似,即智能汽车作为 toC 的产品,技术的核心目的应该是为消费者的体验服务。
潘云鹏认为,汽车机器人必须具备三大底层核心能力:
第一,能用自然语言和人类进行流畅交互;第二,具备点到点的智能驾驶能力,替人类减负;第三,具备自我复盘和自我迭代的能力,不断提升智能化体验。
针对以上三大核心能力,极越给出解决方案。
在交互方面,极越选择了将大模型文言一心进行本地化部署,以此来提高车载语音的知识范围、响应速度和覆盖面积。同时极越还采用了多模态的交互方式,可以更好地理解和执行人类的指令,比如能根据天气情况和说话人的眼神判断要开哪扇窗以及开多大。
在智驾方面,极越正逐步将小模型小参数进行合并,基于一个统一的基础模型和多头任务来完成智能驾驶底层的软件架构的重构,最终实现端到端自动驾驶。目前极越已经实现了高速域和城市域、行车域和泊车域的融合,通过一套统一的感知模型来提升感知能力和最终的智驾体验。
除此之外,极越还选择了 BEV+Transformer+OCC 的纯视觉方案,提升智驾系统在未知障碍物和边缘场景下的应对能力。
自我迭代方面,极越重点提升了「自动化」的比重。比如通过 4D 的自动化标注,极越可以在日常用车场景中不断进行学习,从而提高感知和规控能力。
这一切背后,离不开极越 2.2EFLOPS 的算力支撑,目前极越可以每 10 天进行一次模型迭代,每个月都能带来产品和智驾能力的提升。
02、端到端大模型派
持有该观点的,主要以专注高阶辅助驾驶的自动驾驶公司和新型 Tier1 为主。
其中既有从 L4 降级来做 L2 的百度和元戎启行,也有从 L2 起家的毫末智行。不难看出对高阶智驾,整个行业已经达成了共识:
以大模型为基础的智能驾驶是行业的未来,而端到端大模型又是最终解。
周光|元戎启行 CEO L4 是骗人的,端到端才是未来
元戎启行作为曾经的 L4 明星公司,CEO 周光带头反水,直呼「L4 是骗人的,端到端才是未来」。
在周光看来,消费者和车企真正需要的智能驾驶,必须具备「低成本、能量产、车规级以及全时全域」等基本特点,而之前的高速 NOA 也好,L4 级自动驾驶也罢,全都存在时域限制,无法实现商业闭环。
而且目前很多非端到端的方案,包括一些已经量产的车型,都存在明显感觉有数码味。比如车子在执行加塞和变道的时候有明显的顿挫感,说明是不同系统在切换,而且智驾时也只会考虑到安全、舒适,不 care 其他交通参与者的通行效率。
实现全时域、去掉数码味的关键,就是端到端自动驾驶。所谓的端到端,指的是输入路面信息后,即可直接输出决策,让汽车可以更像人一样思考。
端到端方案标志着智能驾驶进入了 2.0 时代,整个行业的逻辑也发生了巨大变化。
周光认为基于模块的数据闭环跟端到端的数据闭环截然不同,「我的车子(智驾)跑了多少公里其实非常外行」,是在用人工智能 1.0 的思维来思考 2.0 的架构,端到端不需要说做了什么,只用展现结果。
周光认为要实现端到端必须具备三方面的实力:
首先是工程化能力,比如要用轻地图取代高精地图,让智驾大规模落地。
其次是人才积累,AI 和传统软件开发的显著区别,就是顶尖人才取代了人海战术。
最后,就是要有 TechVision。现在每天都有新技术产生,如何能快速 Get 到新技术并将其用于自动驾驶是最关键的能力,也是各车企和供应商拉开差距的关键。
顾维灏|毫末智行联合创始人&CEO,智驾 3.0 时代,端到端一定是未来
和元戎启行观点类似,毫末智行同样认为智能驾驶已经进入了新时代。
智能驾驶 1.0 时代,是以硬件驱动为主;2.0 时代,是以软件驱动为主;3.0 时代,则是以数据驱动为主的大模型时代。
在 3.0 时代中,端到端是最重要的方向。目前行业的发展趋势是一个从分散到聚集的过程。
把过去的离散的部分逐渐地聚集化、模型化,把感知的模型聚集到一块,把认知的模型聚集到一块,控制的模型聚集到一块,然后再来实践车端模型和云端模型的联动。
而要做好垂直化的智驾大模型,必须掌握三个要点:
1、大模型里有没有独到的看家本领。毫末 DriveGPT 里面最核心的能力,就是基于持续的多模态的视觉识别大模型,用 Token 化的表达方式进行训练,再进行三维化。
2.、善用自然语言模型领域、通用大模型领域已经存在的模型。目前毫末的大模型中融入了多模态大模型和大语言模型,多模态模型用来做三维渲染或者标注、识别,大语言模型用来加强认知。
3、大模型必须拥有足够的领域专业知识。毫末 DriveGPT 模型中引入了 CAN 的信号和 Goal 的信号(导航的信息以及车辆驾驶里面转向、刹车、油门信息),以及通过数据闭环所收集回来持续大量的数据,用这些领域的数据知识来协助训练大模型。
王亮|百度智能驾驶事业群组首席研发架构师,目前市场上还没有具备体验跨沟潜力的智驾产品
作为中国最老牌的智能驾驶公司之一,百度对于智驾产品的标准更高。
在王亮看来,目前市场上还不存在具备体验跨沟潜力的智驾产品。要具备体验跨沟潜力,则必须满足四个必要条件:
1、支持复杂城市道路的点到点领航辅助驾驶,发展城市智驾对提升用户智驾使用率非常关键。数据显示,在用户时长上,城市场景占比 90%。
2、领航辅助驾驶功能的时空覆盖范围要广,不能仅限于个别样板间城市,要全国都能开。
3、当智驾大规模渗透数量快速增长的同时,如何提升产品质量值得关注。用户使用智驾要能对系统产生信任和依赖,在不同路段和时段使用体验方差要小,这点可以用 MPI——即平均人工介入的里程指标来度量。
4、智驾产品通过用户的使用和反馈系统能够高频的迭代演进,给用户带来持续的获得感和体验层面的升级,这意味着智驾系统的核心是由人工智能、数据驱动的 AI 算法构建的,拥有自身的数据飞轮驱动自进化。
选择更困难的纯视觉方案,是百度和极越认为跨越鸿沟的必经之路。
比车辆上市的「初速度」更重要的是与时间相关的加速度———后续用户的使用反馈,才是驱动提升智驾的关键。
为什么百度要选择很困难的纯视觉?王亮给了解释:
初速度决定了产品原型的研发速度,这点上激光雷达占优,能让感知算法实现的难度大幅降低。
而视觉的初速度慢得多,从二维像素恢复三维信息是计算机视觉领的难题,不过一但技术进入轨道,图像里天然蕴含的信息量优势会在其在迭代加速度上更迅猛。
因此百度把数据资源、模型参数量、训练算力、研发人力资源都 All in 到演进速度更快、算法上限更高的视觉路线上。
03、智驾平权派
持有该观点的,主要以做性价比智驾方案起家的 Tire 1 为主。
大疆车载和鉴智机器人都表示已经将高阶智驾的成本控制在万元以下,从而让 10 万元以下的车型也能标配智驾,甚至大疆车载还将目标用户扩展到了燃油车市场。
目前 30 万元以上市场已经用实际销量证明了消费者对于高阶智驾功能的认可,但是在 20 万元以下的价位和燃油车市场,高阶智驾的覆盖率接近于 0,无疑是一片广阔的蓝海市场。
沈劭劼|大疆车载负责人 :智能驾驶要做到所有车型标配
昨天是追求极致性价比的大疆车载,今天是 20 万以上高端车型也做的大疆车载。
这次在百人会上,大疆车载更是放出了「要让所有车型标配智驾,燃油车也不例外」的狠话。
从过去两年的数据来看,30 万以上的新能源车上高阶智驾+低阶智驾的覆盖率已经几乎接近 100%,但是在 20 万元以下的新能源车和所有价位的燃油车上,高阶智驾的覆盖率接近于 0。
为了实现所有车型标配高阶智驾,大疆车载目前成行平台推出了两种方案:7V+32TOPS 高阶智驾基础版、7V+100TOPS 高阶智驾升级版。
7V+32TOPS 高阶智驾基础版:
「7V」是指前视一对 800 万像素的惯导双目,再加上后视 300 万像素的单目,以及 4 个 300 万像素的环视,总共 7 个相机;
「32TOPS」是基于 Ti 的 TDA4-VH 的 32TOPS 机器学习算力,同时可以根据车企需求配置毫米波雷达和超声波雷达。整个系统不依赖于高精度地图,而且不分动力形式。
7V+32TOPS 的整体成本在 5000 元,能够实现高速领航、城市记忆领航、记忆泊车等功能。
该方案基于已有车型整个适配工作量大概 3 个月左右,新车型落地 6-9 个月左右,成本大概在 6000 元左右。
7V+100TOPS 高阶智驾升级版:
升级版主要升级算力部分,传感器和基础版本相同,成本在 7000 元左右,可以实现全国都能开的城市领航。
目前装了 32TOPS 域控的车型,未来可以通过更换域控的方式直接进行车型功能的升级。
除此之外,4 月份的北京车展上大疆车载还将发布自研的激目方案,通过激光雷达来强化视觉方案的能力,整套方案的价格预计与一颗分立式激光雷达相同,预计会在 20 万以上车型上搭载,未来会冲击 L3 市场。
单羿|鉴智机器人联合创始人&CEO
和大疆车载「从低打高」不同,还有鉴智机器人是「从高打低」,进攻 10 万以下车型市场。
单羿表示,「将领航辅助驾驶逐步从 30 万的车型下放至 10 万元的车型是公司未来 3 年的业务目标。」
鉴智机器人推出了 AI 驱动的双目立体视觉的传感器,跟激光雷达相比,视觉最大的优点就是可以获得 10 倍的信息稠密度。
单羿认为,AI 驱动的双目立体视觉能够在以下三个地方帮助 NOA 演进:
第一,对通用非标障碍物的检测,尤其是越远越小的物体,需要更加精密的 3D 传感器。
第二,对单一的物体和场景中的 3D 结构拓扑,都能通过立体视觉得到归纳总结。
第三,数据闭环需要量产车和闭环系统达到严密吻合,通过双目立体视觉量产方案,可以更好地实现不依赖激光雷达的数据闭环。
目前鉴智机器人全套产品的价格在 4000 元人民币,包括 Transformer、域控、算法的解决方案,采用的芯片是地平线的征程 6 芯片,并且配备 SDMap 来实现。
据单羿透露,目前该方案已经获得国内头部车企的认可,也拿到了相应的量产定点。
04、智驾进行式:智驾之火已经燎原
不管是强调体验派,还是端到端大模型派和智驾平权派,他们都透露出一个信息:智能驾驶正在从未来时变成现在时。
虽然各企业侧重点不相同,但是智驾大规模上车铺开的范围却犹如星火燎原。
端到端大模型派主攻前沿科技,目标是 30 万元以上市场;
智驾平权派则贯彻螺蛳壳里做道场的精神,致力于用更低的成本实现高阶智驾,目的是为了打下 30 万元以下市场和燃油车市场。
两者的技术方案最终又将交由车企,由车企来负责体验调教。
从这点来看,三个派别虽然理念各不相同,但是却以互补的形式覆盖了整个智驾市场和产业链。
如果说 2023 年是属于城市 NOA 的一年,那么 2024 年就是高阶智驾全面普及的元年。
相关文章