在“2024中国汽车重庆论坛”上,理想汽车创始人李想,就向与会者揭秘了理想汽车团队在过去半年中取得的自动驾驶技术的重大突破。这一技术的核心理念在于模拟人类的驾驶方式,以实现更加智能、高效的自动驾驶。
李想首先强调了“自动驾驶”与“智能驾驶”或“辅助驾驶”之间的区别。他指出,自动驾驶的核心在于完全替代人类进行车辆操控,而不仅仅是提供辅助或智能建议。为了实现这一目标,理想汽车的团队从去年9月开始专注于研究人类驾驶的本质,并尝试将这种本质融入到自动驾驶技术中。
李想提到,人类驾驶时并不需要不断学习如何操作车辆,而是凭借直觉和经验来应对各种路况。这种直觉和经验是如何形成的呢?他引用了《思考,快与慢》这本书中的理论,指出人类大脑在处理信息时分为系统1和系统2。系统1负责快速、直觉性的反应,类似于人类驾驶时的大部分情况;而系统2则负责处理复杂、需要逻辑推演的问题,如在遇到特殊情况时的驾驶决策。
基于这一理论,理想汽车的团队开始探索如何将这种人类驾驶方式应用到自动驾驶技术上。他们提出了自动驾驶的系统1和系统2的概念。系统1对应于端到端的自动驾驶技术,即输入直接产出输出的高效模式,避免了传统的感知、规划、执行等模块的繁琐过程。然而,端到端技术也面临着挑战,如需要专业人才、高质量数据和强大的算力支持。
为了应对这些挑战,理想汽车团队进一步探索了系统2的应用。系统2的灵感来源于人类在面对复杂问题时如何提升能力而非仅仅通过学习来解决问题。以李想爱人的驾驶经历为例,通过参加宝马驾驶培训提升看路和刹车的能力后,她的驾驶技术得到了显著提升。
在自动驾驶领域,系统2旨在解决端到端技术无法处理的复杂和泛化问题。为此,理想汽车引入了视觉语言模型(VRM),该模型能够像人类一样读懂导航地图并作出预判。VRM不仅为端到端技术提供了兜底保障,还解决了各种复杂路况下的驾驶问题。值得一提的是,VRM还使得自动驾驶系统能够告别对高清地图的依赖,这是一个重大的技术突破。
李想透露,他们的自动驾驶系统采用了两颗芯片,一颗用于运行端到端技术,另一颗则运行压缩后的VRM模型。这一系统的验证结果令人兴奋,他们预计最早在今年年底或最晚明年上半年就能实现真正有监督的L3级别自动驾驶。
然而,随着AI技术的应用越来越广泛,如何验证AI的能力成为了一个新的挑战。理想汽车的团队提出了一种新的验证方式,即使用小型的视觉模型来模拟人的考试过程,以此验证自动驾驶系统的能力。这种验证方式不仅符合人类的工作原理,还为自动驾驶技术的发展提供了新的思路。
展望未来,李想表示理想汽车将在今年第三季度推出无图NOA功能,并计划在未来逐步推出端到端+VRM的监督型自动驾驶体系。随着技术的不断演进和算力的增强,他坚信在现有的计算平台上实现带有监督的L3级别自动驾驶是完全可行的,并预计在三年内实现无监督的L3级别自动驾驶。
李想的这次分享不仅展示了他们在自动驾驶技术上的重大突破,还为整个行业的发展提供了新的思路和方向。随着技术的不断进步和应用场景的拓展,我们有理由相信自动驾驶技术将在未来为人们的出行带来更加便捷、安全的体验