车载语音研究:大模型上车,语音交互是智能座舱场景第一站

发布时间:2023-12-18  

佐思汽研发布《2023-2024年车载语音行业研究报告》,对车载语音供应商、主机厂及其语音交互标杆车型进行研究,总结梳理当前车载语音发展现状及未来发展趋势。


车载语音交互市场呈现以下特点:


01、2023年前装标配车载语音的品牌达46个


从2019到2023年1-9月,车载语音装配量及装配率逐年上升。2023年前三季度,前装车载语音搭载量接近1200万辆,装配率接近80%。


2023年,车载语音装配率100%的乘用车品牌有46个,包括问界、阿维塔、高合、飞凡、极氪、岚图、理想、领克、坦克、蔚来、小鹏等。2023年车载语音装配量将突破2000万辆,装配率突破80%。


2018-2023年1-9月车载语音装配量和装配率

来源:佐思汽研《2023-2024年车载语音行业研究报告》


02、车企语音自研,推动语音供应链重塑


主机厂对车载语音智能化与差异化的需求,以及主机厂自研趋势,推动传统语音供应链上的Tier 2厂商与主机厂直接产生合作关系,产业链上中下游的边界趋于模糊。比如,长城、极氪、五菱等车企的OS系统通过与思必驰直接合作,进而提升主机厂的智能语音装载能力及智能化水平。

产业链关系的变化,让车载语音竞争格局也发生改变。2023年1-9月,车载语音供应商装载量排名中,思必驰凭借超30家车企的150余款配套车型跻身第三位。


2023年1-9月车载语音供应商竞争格局

来源:佐思汽研《2023-2024年车载语音行业研究报告》


03、可见即可说渐成标配,并行指令、跨音区继承、离线语音、车外语音等高阶功能上车


2022年,佐思汽研发布的《2021-2022年中国车载语音行业研究报告》中,“可见即可说”还只有部分新势力以及头部自主品牌搭载,连续对话时长最高也只有90秒,双音区识别还是主流方案。


进入2023年,“可见即可说”在新势力标杆车型上已成为标配项,连续对话最高支持120秒,小鹏还推出了“主驾全时对话”功能(功能开启后,当主驾转头看向中控屏时,屏幕中内容无需唤醒,可见即可直接说)。同时,四音区识别已经成为新的主流方案,理想、小鹏还推出有六音区识别方案。


此外,2023年,更多语音高阶功能开始上车。


并行指令:发展至最多支持一句指令执行10个动作;


跨音区继承:在小鹏、极氪、理想品牌车型搭载(跨音区继承:当前一个人说完命令,如果其他乘客想继续操作,可以用“我也要”省略说法触发功能)


离线指令:可控内容更多,极越01支持全域全离线语音,在离线状态下,极越01依然可以做到与车内人员的极速交互


车外语音:长安启源 A07车外语音支持对后备箱、车窗、音乐、空调、出库/泊车等功能实现控制;极越01支持车外语音控车/泊车以及语音操作空调、音响、灯光、车窗、车门、后尾门、充电盖


部分品牌车载语音功能对比

来源:佐思汽研《2023-2024年车载语音行业研究报告》


04、大模型上车,语音交互是智能座舱场景第一站


ChatGPT 的爆火,让其背后依赖的大模型技术快速从AI领域向各行各业延伸。2023年,大模型在汽车领域快速发展,多个车企在智能座舱、智能驾驶等场景探索大模型落地机会。


在智能座舱场景中,语音交互是大模型上车第一站。2023年2月,百度发布中国版ChatGPT——文心一言,长城、吉利、岚图等品牌跟进;2023年4月,阿里披露AliOS智能汽车操作系统已接入通义千问大模型进行测试,后期应用于智己品牌;2023年8月,华为鸿蒙 4.0 中,智能助手小艺首次接入盘古大模型,主要提高智慧交互、场景编排、语言理解能力、生产力和个性化服务几个方面的能力。


除了传统互联网企业外,语音厂商也是大模型重要玩家,科大讯飞、思必驰、云知声等厂商均有推出相关产品。


科大讯飞星火认知大模型具备多轮对话的贯穿理解、知识应用、共情闲聊对话、多轮对话自主引导回复、基于文档的新知识快速学习、基于海量用户修正意见的进化六大核心能力;


思必驰DFM-2是一个具备通用智能的行业语言大模型。在车载交互领域,思必驰将天琴车载语音助手与DFM-2相融合,在规划能力、创作能力、知识以及干预能力、插件能力、多层次语义对话以及文档能力上均有显著提升,并支持多模态、多意图、多音区、全场景多轮连续对话。


主要供应商的大模型产品布局

来源:佐思汽研《2023-2024年车载语音行业研究报告》


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    鼓励以及整个大时代的发展去化解。因此,语音技术的未来或许不是坦途,但依然光明。语音识别主要基于深度学习的技术,其整个过程可以大致划分为声音信号处理、特征提取、声音模型训练、语言模型训练和识别这几个关键步骤。 首先,声音信号处理。因为......
    具体实现细节有所不同,但所采用的基本技术相似。一个典型的语音识别系统除了要选取适当的语音识别单元之外,还需要特征参数技术提取、系统建模、模型训练和模式匹配这三方面的技术。 语音......
    信号特征的关键特征参数形成特征矢量序列,以便用于后续处理。 (3)声学模型训练,声学模型可以理解为是对声音的建模,能够把语音输入转换成声学表示的输出,准确的说,是给出语音属于某个声学符号的概率。根据训练语音库的特征参数训练出声学模型......
    中的词汇内容转换为计算机可读的输入。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音......
    分是针对CW32F030C8T6的程序开发,另一部分是针对CI-C22GS02离线语音模块的命令词、语言模型、声学模型以及固件的制作。 1.CW32F030C8T6的程序开发。采用Keil5开发,借鉴了CW32官方......
    数据的能力,会使得性能急剧下降。   听写机:大词汇量、非特定人、连续语音识别系统通常称为听写机。其架构就是建立在前述声学模型和语言模型基础上的HMM拓扑结构。训练时对每个基元用前向后向算法获得模型......
    时尚等企业开展产业落地实践,成为产业大模型落地的领先企业。 滴普科技的Deepexi企业大模型,在语义、视觉、语音、跨模态等方面表现优越,可运用模型工具链,为企业提供高质量的数据准备、模型训练......
    个过程中,首先要根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模式。而在识别过程中要根据语音识别的整体模型,将输入的语音信号的特征与已经存在的语音模......
    汽车选择与浪潮信息合作,为星睿云·智算中心打造了前沿的大模型AI算力基础设施,高效支撑吉利汽车进行AI大模型训练和应用。系统采用全球领先的浪潮信息AI服务器算力机组,具备超强的通用处理和加速计算能力,多次......
    汽车选择与浪潮信息合作,为星睿云·智算中心打造了前沿的大模型AI算力基础设施,高效支撑吉利汽车进行AI大模型训练和应用。系统采用全球领先的浪潮信息AI服务器算力机组,具备超强的通用处理和加速计算能力,多次......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>