语音助理越来越聪明,但怎么让它们听见汽车驾驶的声音?

发布时间:2016-11-15  

8075709_1_thumb

半导体行业观察在车联网时代来临的前夕,我们车上已经有 GPS、行车记录仪、蓝牙喇叭等设备,营造更便利的驾驶环境。不过,在上路前免不了的一连串手动输入或设定,却又不是那么方便了,更遑论开车到一半时要进行变更。即使是趁着等红灯的空档,只要还得伸手去屏幕上按来按去,就多少增加了行车风险。于是,为了驾驶人与乘客更舒适安全的的乘车体验,语音助理搭配人工智能将是不可或缺的环节。

然而,这样一来我们就得面对另一个难题,便是这些车用语音智能产品,如何能提供优异的语音辨识品质,提高辨识率,让机器准确接收我们的指令呢?想像一下,你载着满车朋友出游,在国道上高速行驶,大家快意谈笑,夹杂引擎运转与风噪声,可能还正好放着一首 Lana Del Rey 的《Burning Desire》,使你不自觉脚踩油门。这时车内环境噪音绝对高于 70dB(分贝),而且还夹杂不同频率的声音。因此,让产品侦测说话的人并接收正确指令,是相当令人头痛的问题。

环境噪音对语音通讯品质的影响

在语音辨识的流程中,可分为五道程序:包含语音输入及语音讯号处理、语音特征撷取、以声学模型(acoustic model)进行语音单元辨识、以语言模型(language model)来组织语音单元、解码及输出等。

目前语音助理的市场上,Microsoft 耕耘最久,Apple、Google 相继而起,以完善智能手机体验为目标;近期火热的 Amazon Echo,其语音助理 Alexa 则一开始就以独立的声控家用平台为定位,建立自身生态系。以上这几家语音助理开发商,基本上已经掌握后面四道程序。不过,一旦来到车用领域,产品设备开发商则势必要在语音输入及语音讯号处理的程序上,投注更多心力。

车用语音智能产品在车内环境中,与使用者的距离不出 0.5~1 米之内。一般汽车引擎发动后且车窗紧闭的情况下,车内噪音约 60dB 左右。假设使用者发出约 89dB 的声音(即一般说话音量的平均值),此时嘴边的讯噪比为 29dB,足以维持良好的通讯品质。但你不会想要每次下指令还得把脸贴到汽车面板前,因此 0.5~1 米是产品接收语音讯号的合理距离。然而,当说话声音传到 0.5 米时会衰减至 65dB,此时讯噪比只剩 5dB;说话声音到 1 米时则只剩 60dB,与噪音的音量相当,更不用说上述提到高速行驶的环境下,噪音都比发出指令的人声还要大。

符合标准的车用通讯品质

当面临车联网逐渐完善、语音应用普及化,越来越多车厂要求内建 Android Auto、Apple Carplay 等智能助理,而这些都需要按照 ITU-T P.1110/P.1100 语音标准来设计,对代工组装或设计加工的车用电子系统厂来说,等于是踏入未知的领域,只能以现有产品不断侦错找出问题,相当耗费时间。因此像是贝尔声学这种第三方语音测试实验室,就会从麦克风模组、连接线材等部分测试,首先帮厂商判断选料是否正确。

贝尔声学曾针对一款旧的车用麦克风模组进行测试,该模组配两颗 ECM 电容式类比麦克风,一颗为全指向性,主要用来收环境音,作为背景噪音消除演算法的用途;另一颗为单指向性,收音方向指向驾驶,用来接收驾驶的语音讯号。依据 ITU-T P.1110 测试方式,得出了以下数据:

PAL-acoustics

从结果可以看到,麦克风模组离标准建议值太远,感度差了约 30dB,因此讯号必须放大 30dB,才能满足标准建议值。然而,这意味着杂讯也会跟着放大,造成语音品质跟辨识率低落。代表这款麦克风一开始根本就不该出现在车用语音智能产品上。透过贝尔声学的协助,能让厂商快速找到症结点,避免进行过多无意义的测试。

由于车子所处的环境噪音会随着车速、路段、路况、空调、乘客及音响等各种因素不断改变,而背景降噪演算法不易解决时时变动且突发性的声音,所以车用语音智能产品可以着重在一些细节,帮助提升通讯品质。例如采用两颗以上的麦克风阵列,以进行较佳的背景降噪演算法;采用讯噪比较高的麦克风,最好是 SNR 58dB 以上。其次,把麦克风置于离驾驶嘴巴最近的位置,如方向盘附近;但同时又要尽量缩短麦克风线材至主机的距离,且加强线材隔绝性,以减少外来的杂讯。最后,则是加上回音消除(Echo cancellation)、背景降噪(Background noise reduction)以及麦克风自动增益(Mic auto gain control)等三种功能,帮助提升语音辨识率。

(首图来源:太平洋汽车网)

如需获取更多资讯,请关注微信公众账号:半导体行业观察

责任编辑:mooreelite
文章来源于:半导体行业观察    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    全面探讨智能语音关键技术解决方案;传输、存储、识别、合成、增强等方面,智能语音技术的研发主要聚焦于语音的识别理解、合成输出和声音增强。随着信息技术的发展,智能语音......
    智能语音落地灯:离线语音控制技术的优势与应用;随着科技的进步和消费者对智能化生活的需求日益增长,智能家居产品逐渐走入了千家万户。其中,智能语音落地灯以其独特的控制方式和出色的实用性,成为......
    语音识别技术工作原理;人工智能语音识别技术,在现代社会中已开始广泛运用。这种先进技术使得人们可以通过声音指令控制家电、灯光、温度等物品。它不仅能提高生活的舒适度,还可以在医疗保健、安防......
    从传统的手动按钮操控,“进化”到了如今的语音控制,这让人们享受到了更多的智能化生活。 把语音控制和传统台灯结合之后,便是智能语音台灯,这一类台灯搭载了语音模块,语音模块赋予了台灯语音交互的功能,让我们可以通过语音......
    家居中重要组成部分,智能语音灯 ,更是给生活带来便利和舒适。 传统的灯具只具有手动调节功能,一般不具备人工交互功能,无法满足消费者对智能家居产品的强烈需求。因此很多灯具厂商为了满足市场需求,研发并生产出可以实现人工智能交互的智能语音......
    语音识别芯片助力开关控制器智能语音化;01左中括号前言左中括号上矩形 很多厂家的思维总停留在,智能家居必须联网的,要通过手机对家里的电器进行控制。无论是远程或者在家,这确实极大的方便了用户,在体......
    智能语音交互技术如何助力设备实现人机自然对话;智能语音交互技术是指通过语音识别、语音合成和自然语言理解等技术,实现人与机器之间自然语言的交流和互动。随着现代人工智能在各行业的普及,智能语音......
    领域的深度布局。这款产品搭载了思必驰提供的全链路智能语音语言交互技术,因而拥有了强大的语音交互能力。 智能语音精准识别,家居生活品质智慧升级X-Brain 7内置的智能语音助手“小睿”,在思必驰全链路智能语音......
    乐鑫声学前端算法:打造智能语音交互新体验,ESP32-S3 SOC技术方案;随着人工智能技术的不断进步,智能语音设备正逐渐成为我们生活中不可或缺的一部分。然而,在嘈杂的现实环境中,如何实现清晰、准确的语音......
    ,为人类提供更舒适便捷的服务,就成为人们不断探索的课题。语言交流是人与人沟通的基础,自然而然地,智能语音就成为人与机器交互的一个重要载体。在智能电视领域,随着技术升级和应用场景的不断拓展,智能语音已经成为智能......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>