车载语音研究:大模型上车,语音交互是智能座舱场景第一站

2023-12-18  

佐思汽研发布《2023-2024年车载语音行业研究报告》,对车载语音供应商、主机厂及其语音交互标杆车型进行研究,总结梳理当前车载语音发展现状及未来发展趋势。


车载语音交互市场呈现以下特点:


01、2023年前装标配车载语音的品牌达46个


从2019到2023年1-9月,车载语音装配量及装配率逐年上升。2023年前三季度,前装车载语音搭载量接近1200万辆,装配率接近80%。


2023年,车载语音装配率100%的乘用车品牌有46个,包括问界、阿维塔、高合、飞凡、极氪、岚图、理想、领克、坦克、蔚来、小鹏等。2023年车载语音装配量将突破2000万辆,装配率突破80%。


2018-2023年1-9月车载语音装配量和装配率

来源:佐思汽研《2023-2024年车载语音行业研究报告》


02、车企语音自研,推动语音供应链重塑


主机厂对车载语音智能化与差异化的需求,以及主机厂自研趋势,推动传统语音供应链上的Tier 2厂商与主机厂直接产生合作关系,产业链上中下游的边界趋于模糊。比如,长城、极氪、五菱等车企的OS系统通过与思必驰直接合作,进而提升主机厂的智能语音装载能力及智能化水平。

产业链关系的变化,让车载语音竞争格局也发生改变。2023年1-9月,车载语音供应商装载量排名中,思必驰凭借超30家车企的150余款配套车型跻身第三位。


2023年1-9月车载语音供应商竞争格局

来源:佐思汽研《2023-2024年车载语音行业研究报告》


03、可见即可说渐成标配,并行指令、跨音区继承、离线语音、车外语音等高阶功能上车


2022年,佐思汽研发布的《2021-2022年中国车载语音行业研究报告》中,“可见即可说”还只有部分新势力以及头部自主品牌搭载,连续对话时长最高也只有90秒,双音区识别还是主流方案。


进入2023年,“可见即可说”在新势力标杆车型上已成为标配项,连续对话最高支持120秒,小鹏还推出了“主驾全时对话”功能(功能开启后,当主驾转头看向中控屏时,屏幕中内容无需唤醒,可见即可直接说)。同时,四音区识别已经成为新的主流方案,理想、小鹏还推出有六音区识别方案。


此外,2023年,更多语音高阶功能开始上车。


并行指令:发展至最多支持一句指令执行10个动作;


跨音区继承:在小鹏、极氪、理想品牌车型搭载(跨音区继承:当前一个人说完命令,如果其他乘客想继续操作,可以用“我也要”省略说法触发功能)


离线指令:可控内容更多,极越01支持全域全离线语音,在离线状态下,极越01依然可以做到与车内人员的极速交互


车外语音:长安启源 A07车外语音支持对后备箱、车窗、音乐、空调、出库/泊车等功能实现控制;极越01支持车外语音控车/泊车以及语音操作空调、音响、灯光、车窗、车门、后尾门、充电盖


部分品牌车载语音功能对比

来源:佐思汽研《2023-2024年车载语音行业研究报告》


04、大模型上车,语音交互是智能座舱场景第一站


ChatGPT 的爆火,让其背后依赖的大模型技术快速从AI领域向各行各业延伸。2023年,大模型在汽车领域快速发展,多个车企在智能座舱、智能驾驶等场景探索大模型落地机会。


在智能座舱场景中,语音交互是大模型上车第一站。2023年2月,百度发布中国版ChatGPT——文心一言,长城、吉利、岚图等品牌跟进;2023年4月,阿里披露AliOS智能汽车操作系统已接入通义千问大模型进行测试,后期应用于智己品牌;2023年8月,华为鸿蒙 4.0 中,智能助手小艺首次接入盘古大模型,主要提高智慧交互、场景编排、语言理解能力、生产力和个性化服务几个方面的能力。


除了传统互联网企业外,语音厂商也是大模型重要玩家,科大讯飞、思必驰、云知声等厂商均有推出相关产品。


科大讯飞星火认知大模型具备多轮对话的贯穿理解、知识应用、共情闲聊对话、多轮对话自主引导回复、基于文档的新知识快速学习、基于海量用户修正意见的进化六大核心能力;


思必驰DFM-2是一个具备通用智能的行业语言大模型。在车载交互领域,思必驰将天琴车载语音助手与DFM-2相融合,在规划能力、创作能力、知识以及干预能力、插件能力、多层次语义对话以及文档能力上均有显著提升,并支持多模态、多意图、多音区、全场景多轮连续对话。


主要供应商的大模型产品布局

来源:佐思汽研《2023-2024年车载语音行业研究报告》


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。