最近,ChatGPT 掀起的这把大模型的火终于「烧」到了汽车圈。
自从百度自家的文心一言开启内测起,国内不仅各家科技公司开始了「百模大战」,各家车企也纷纷官宣加入文心生态圈,生怕错过了加速智能汽车进化的班车。官宣的动作虽然迅速,但是 AI 大模型究竟能为智能汽车带来哪些改变?如何尽快把大模型的能力用起来?这些问题可能在很多人心里都是未知数。
5 月 23 日,百度 Apollo 汽车智能化业务展示了以文心大模型为基础的新一代 AI 智舱探索成果,国内的 AI 大模型终于在汽车上迈出了探索的一步。点开下面的视频,GeekCar 先替大家提前体验了一下新一代 AI 智舱的探索成果。
我们来一起看看,AI 大模型究竟能为智能汽车,特别是智能座舱带来哪些惊喜?
座舱里的大模型 ,能怎么用?
在聊 AI 大模型上车之前,我们先回忆一下大模型有哪些「超能力」。
以 3 月份百度邀请测试的大语言模型文心一言来窥见一下文心大模型的部分能力:在开放域多轮对话的场景下,文心一言具有内容创作、知识问答、数学计算、写作代码等不同能力,总结起来的话,就是具备了理解、推理、梳理、创造的核心能力。
如果把这些核心能力综合起来,与智能座舱尝试着结合的话,最直观的体现就是在交互上:更聪明能听懂人话,包括那些模糊的指代命令,可以和人对话;能通过搜索分析,给出更贴切的反馈;能够提供个性化、拟人化的服务;甚至在文字、语音、图片之间的转换……
这其中有不少是目前座舱交互亟待解决的痛点,比如,目前的语音交互方式以目的明确的指令为主,处理模糊指令的能力有限;能提供搜索,但无法对搜索结果进行分析梳理并给出反馈……总之,有多少人力就有多少智能。
这次百度 Apollo 的新一代 AI 智舱,就是基于文心大模型针对车载场景进行专项训练和模型精调,进行人机交互体验升级。我们先来看看百度 Apollo 探索的几个创新场景:
超级闲聊:把车内变成一个交流场景,通过与语音助手对话式交互,规划行程、答疑解惑、闲聊,就像人与人交流一样自然;
灵感画画:利用 AI 大模型的绘图能力,语音描述想要的作画内容,AI 就可以在几秒钟内完成一副创意画作;
百变人设:利用大模型庞大的数据和模仿创作的能力,根据不同场景、不同偏好设定个性化的语音助手,而不是以往导入语音包的方式设置人设;
AI 新车导购:像新车销售顾问一样,以自然对话的方式向用户介绍汽车的亮点功能和车辆参数等信息,并与用户交流互动,解答用户针对车型的各类问题。
同时,基于大模型本地化技术,小度车载语音 SDK 支持流畅的免唤醒多路同时交互、全页面所见所说、全域毫秒级响应,这些都让细节的体验升级。特别是真多路同时对话能力,最大支持 8 路同时交互精确处理,覆盖整个座舱内外,可以实现多路同时、快速、连续对话的极限挑战,就算坐在驾驶位、副驾驶位和后排的一家人同时开口,语音助手也能满足每一个人的诉求。
总体看来,文心大模型给智舱带来的创新能力涉及到驾驶出行、导航、娱乐,甚至在车上社交、办公等场景,基本上涵盖了日常出行所能遇到的大部分场景。这只是百度在智能座舱上的探索,文心大模型带来的改变将会是跨代际的交互体验升级。
打开 「对话式交互 」的大门
直到如今,国内新车市场的智能座舱渗透力已经超过了 50%,但我们依然能听到这样的质疑:「车机屏幕不就是车里放一个 pad 么?」
除了车规级屏幕和操作系统的严苛要求,以及开车场景下使用习惯与 pad 的不同,让不少人产生这种质疑的最大原因是:目前无论是手机、PC 还是车机系统,都是脱胎于触摸屏幕点击控制的交互习惯。
因此,尽管语音交互已经成为目前座舱内的主流交互,车里的语音更像是一个「语音遥控器」,需要下达明确的指令才能执行,也就是『命令式交互』。要让座舱系统更懂人,理解模糊的指令,给出更贴心的服务,不只需要座舱具有多模态感知的能力,更需要在多维度感知信息后的理解、推理和创造能力,这就是大模型的基础能力。
「未来基于文心大模型的能力,车里所有的交互可以用自然语言的方式进行,而不是以点击页面然后跳转的逻辑进行交互。」百度阿波罗智舱业务部产品架构师徐嘉南这样看待文心大模型对于未来智能座舱的改变,「用户直接表达需求,系统根据它的分析和理解,调动应用资源进行需求满足。这将改变人和应用,甚至是人和车之间的关系。」
因此,无论是「超级闲聊」还是「灵感画画」,都只是 AI 大模型在座舱上的一个创新,当系统拥有更出色的语言理解能力和学习能力,最大的改变是我们与系统的交互方式,从「命令式交互」向「对话式交互」的转变。这种基础能力和交互方式的转变,为智能座舱提供了更多的可能性,和打造差异化的能力。
未来,百度计划通过两种方式利用文心大模型为座舱赋能:一种是小度车载语音 SDK 能力,本身具备全时全双工语音、可见即可说、毫秒级响应的基础能力,同时支持模块解耦,灵活组合,具备一定自研能力的车企也可以根据自家品牌、系列来定制化打造;另一种是推出 OS 整包方案,以小度助手 SDK 为内核,面向期望快速上市的整包采购客户,提供完整的端到端智能化方案,更快量产交付。
目前,小度车载语音 SDK 已在福特、林肯、凯迪拉克、别克、丰田、皇冠、现代、起亚、吉利、极氪、比亚迪等 31 个汽车品牌的 134 个车型上实现量产,累计搭载超 700 万辆;随着文心大模型在智能座舱上的探索,未来能带来更多想象力。
最后
AI 大模型究竟能帮助智能座舱发展成什么样?现在仍然在探索当中。但至少百度 Apollo 迈出了第一步,让我们看到了文心大模型在汽车场景下训练后的能力和可能性。
前不久,百度公布了文心一言开启内测后的数据,一个月内已经完成了 4 次技术版本升级,大模型推理成本降为原来的十分之一。
不论是 AI 大模型,还是座舱基于 AI 大模型的探索,都在快速的迭代当中,也在推动者智能汽车向着真正的智能化前进。