车载语音研究：大模型上车，语音交互是智能座舱场景第一站

佐思汽研发布《2023-2024年车载语音行业研究报告》，对车载语音供应商、主机厂及其语音交互标杆车型进行研究，总结梳理当前车载语音发展现状及未来发展趋势。

车载语音交互市场呈现以下特点：

01、2023年前装标配车载语音的品牌达46个

从2019到2023年1-9月，车载语音装配量及装配率逐年上升。2023年前三季度，前装车载语音搭载量接近1200万辆，装配率接近80%。

2023年，车载语音装配率100%的乘用车品牌有46个，包括问界、阿维塔、高合、飞凡、极氪、岚图、理想、领克、坦克、蔚来、小鹏等。2023年车载语音装配量将突破2000万辆，装配率突破80%。

2018-2023年1-9月车载语音装配量和装配率

来源：佐思汽研《2023-2024年车载语音行业研究报告》

02、车企语音自研，推动语音供应链重塑

主机厂对车载语音智能化与差异化的需求，以及主机厂自研趋势，推动传统语音供应链上的Tier 2厂商与主机厂直接产生合作关系，产业链上中下游的边界趋于模糊。比如，长城、极氪、五菱等车企的OS系统通过与思必驰直接合作，进而提升主机厂的智能语音装载能力及智能化水平。

产业链关系的变化，让车载语音竞争格局也发生改变。2023年1-9月，车载语音供应商装载量排名中，思必驰凭借超30家车企的150余款配套车型跻身第三位。

2023年1-9月车载语音供应商竞争格局

来源：佐思汽研《2023-2024年车载语音行业研究报告》

03、可见即可说渐成标配，并行指令、跨音区继承、离线语音、车外语音等高阶功能上车

2022年，佐思汽研发布的《2021-2022年中国车载语音行业研究报告》中，“可见即可说”还只有部分新势力以及头部自主品牌搭载，连续对话时长最高也只有90秒，双音区识别还是主流方案。

进入2023年，“可见即可说”在新势力标杆车型上已成为标配项，连续对话最高支持120秒，小鹏还推出了“主驾全时对话”功能（功能开启后，当主驾转头看向中控屏时，屏幕中内容无需唤醒，可见即可直接说）。同时，四音区识别已经成为新的主流方案，理想、小鹏还推出有六音区识别方案。

此外，2023年，更多语音高阶功能开始上车。

并行指令：发展至最多支持一句指令执行10个动作；

跨音区继承：在小鹏、极氪、理想品牌车型搭载（跨音区继承：当前一个人说完命令，如果其他乘客想继续操作，可以用“我也要”省略说法触发功能）

离线指令：可控内容更多，极越01支持全域全离线语音，在离线状态下，极越01依然可以做到与车内人员的极速交互

车外语音：长安启源 A07车外语音支持对后备箱、车窗、音乐、空调、出库/泊车等功能实现控制；极越01支持车外语音控车/泊车以及语音操作空调、音响、灯光、车窗、车门、后尾门、充电盖

部分品牌车载语音功能对比

来源：佐思汽研《2023-2024年车载语音行业研究报告》

04、大模型上车，语音交互是智能座舱场景第一站

ChatGPT 的爆火，让其背后依赖的大模型技术快速从AI领域向各行各业延伸。2023年，大模型在汽车领域快速发展，多个车企在智能座舱、智能驾驶等场景探索大模型落地机会。

在智能座舱场景中，语音交互是大模型上车第一站。2023年2月，百度发布中国版ChatGPT——文心一言，长城、吉利、岚图等品牌跟进；2023年4月，阿里披露AliOS智能汽车操作系统已接入通义千问大模型进行测试，后期应用于智己品牌；2023年8月，华为鸿蒙 4.0 中，智能助手小艺首次接入盘古大模型，主要提高智慧交互、场景编排、语言理解能力、生产力和个性化服务几个方面的能力。

除了传统互联网企业外，语音厂商也是大模型重要玩家，科大讯飞、思必驰、云知声等厂商均有推出相关产品。

科大讯飞星火认知大模型具备多轮对话的贯穿理解、知识应用、共情闲聊对话、多轮对话自主引导回复、基于文档的新知识快速学习、基于海量用户修正意见的进化六大核心能力；

思必驰DFM-2是一个具备通用智能的行业语言大模型。在车载交互领域，思必驰将天琴车载语音助手与DFM-2相融合，在规划能力、创作能力、知识以及干预能力、插件能力、多层次语义对话以及文档能力上均有显著提升，并支持多模态、多意图、多音区、全场景多轮连续对话。

主要供应商的大模型产品布局

来源：佐思汽研《2023-2024年车载语音行业研究报告》