随着AI技术的快速发展,智能座舱的交互方式完成了多次演进。从最初单一的触控式交互、到简单的指令式交互、再进阶到复杂的语音交互,用户的使用频次也呈快速提升态势,从过去日均不到10次,提升到60多次。
“但日均交互次数是越多越好吗?”8月9日,在中国电动汽车百人会主办的“智能汽车产业生态发展路径”高端研讨会上,百度Apollo智舱业务部总经理李涛指出:“这可能因为车机没有真正满足用户需求。例如,用户在一天内和车对话100次,可能代表车机好用,也可能代表车机太笨拙,无法理解或预测用户需求,用户只能重复多次和车机对话。”
另外,李涛表示,目前车机的Pad化趋势非常严重,“把iPad或Android平板放在车机中央,并安装所有应用程序,这些程序都是用户真正需要的吗?”他认为,根据帕累托分布定律(即80/20原则),80%的功能很少会有人使用。过多的程序不仅意味着要增加用户理解和认知负担、占用宝贵车机资源,也意味着车厂需要付出大量成本。
那么,智能座舱应该向什么方向发展?大模型强大的语义理解、文本生成、逻辑推理和多模态等多种能力,又会为智舱带来哪些改变?百度Apollo做了哪些实践?李涛在演讲中一一给出答案。
百度Apollo智舱业务部总经理李涛
以下为他的演讲实录:
当前,我们处于AI与汽车深度融合的时代。我们先来看一下智能汽车的发展现状,用几组数据展示:在新能源车领域,L2智能驾驶的搭载率约40%左右,智能座舱装配率已经超过60%,预计今年将达到70%以上。另一方面,我们也看到一个趋势,即消费者对交互的满意度有所下降。这可能因为车机没有真正满足用户需求。
过去几年,座舱的控制方式经历了一些演变。最初通过精准指令控制实现,即说出A就是A,说出B就是B,没有泛化。后来出现了初步的泛化命令式交互,过去日均交互次数还在十次以下,现在有些车型上的语音日均交互次数已经达到了六十多次。行业里开始讨论,在向自然语言对话方向的演变过程中,日均交互次数是否还会增加。
但日均交互次数是越多越好吗?例如,用户在一天内和车对话100次,可能代表车机好用,但还有可能代表车机太笨拙,无法理解或预测用户的需求。因此,当用户需要什么时,他们只能重复多次和车辆对话。
另外,Pad化趋势非常严重。目前的实现方式是将iPad或Android平板安装在车机中央,并安装所有应用程序。这些程序都是用户真正需要的吗?过多的程序不仅意味着用户理解和认知负担的增加、宝贵车机资源的占用,也意味着车厂需要付出大量成本。这都在遵循帕累托分布,即80/20原则,80%的功能实际上很少有人使用。
在这种情况下,我们需要考虑,智能座舱最终会走向哪个方向。从大模型角度出发,我们认为智能座舱会走向智能体的方向,能够理解场景信息,很自然地了解用户需求,生成场景化的解决方案并完成执行。因此,我们推出Apollo超级座舱系列产品。它是一种智能体,能够实现全感融合、全局规划和全域执行的智能体。
用户希望车辆能够理解他们的需求、记录他们的习惯,并根据当前场景为他们提供最适合的车内环境或应用程序配置。这正是大模型最擅长的思想能力,即理解和记忆、逻辑和生成。我们有其他专业的模型分析架构。在这个框架中,可以让智舱自动理解、构建,并生成相应的模型。对于整车厂来说,这可以大大降低各种场景的适应成本,最终实现全域执行。我们也有一个底层的大模型,可以真正调度全车的能力,能够真正理解用户需求,并主动执行,为用户提供更好的体验。
我们在某些场景中取得了突破,例如将车内DMS、OMS和整个座舱语音结合起来。我们也采集了外部数据,如减速带预测、高速音乐内部播放以及多人检测等。比如在高速、开窗场景下,由于噪声过大,人声被淹没在噪声中,非常容易导致真实语音的检出困难,通过音&视频语音增强技术,高速、开窗场景下的语音检出成功率可提升至99%,这比普通车辆关闭窗户的情况还要好。
以上是我们关于生成式座舱的一些思考。未来,我们将继续沿着这个方向推进。谢谢大家。