随着AI的普及,越来越多人使用智能语音控制,从智能音箱慢慢开始延伸到智能耳机领域。目前市场的大部分耳机还是以手动唤醒语音助手为主,主要问题还是在语音检测方面功耗和开发难度问题,。本方案将为大家介绍一套开发难度小且功耗低的语音唤醒方案——DBMD4P + QCC3044,该方案在头戴耳机和运动型耳机上都适用。
首先介绍一下这款DBMD4P的公司——DSP Group,它是家庭和办公室的集成通信无线芯片产品全球领先的提供商。DSPg提供软件半导体系统产品和参考设计,使ODM、 DEM、 消费电子产品制造商和服务提供商能够经济高效地开发,快速实现市场创收的新产品。该公司处于半导体创新的前沿并实现卓越运营超过二十年,提供了一个广泛的无线芯片集成组合DEC/ CAT-iq、DECT ULE、Wi - Fi、PSTN、BoneTone智能语音增强和噪声消除器、视频和VoIP技术。 DSPg使集成的声音、音频、视频和数据连接不同消费者和商业产品,包括连接多媒体屏幕、移动设备、家庭安全自动化、无线电话、网络电话系统和家庭网关。利用行业领先的经验和专业知识,DSPg集团与CE制造商和服务提供商合作来塑造未来家庭和办公室的集成通信。
DBMD系列凭着极高的性价比,至今已向全球提供超一亿颗芯片,国内外各大智能语音引擎(如谷歌,亚马逊,思必驰,出门问问等)都已有成熟算法方案在DBMD系列芯片上运行。从支持AI的TWS耳机到支持语音的智能家居,再到物联网,安防,手机,平板电脑和笔记本电脑中,DSPg的身影无处不在。
其中DBMD4P是一款适用于电池供电设备(如手机,IoT,可穿戴设备等)的超低功耗语音和传感器数据处理器。这处理器可实现各种应用,例如语音触发(VT)、语音验证(VA)、语音命令(VC)、传感器数据处理和均衡器功能。DBMD4P是基于TeakLite-III?DSP 架构的处理器,具备与系统中其他设备(例如应用处理器(AP),编解码器,麦克风和传感器)进行通信所需的接口(如TDM,I2c,SPI,Uart等),加上已有的成熟算法,可为客户快速开发出想要的功能。
QCC3044大家应该也很熟悉,这是高通推出的新一代双声道蓝牙芯片,采用最新的BT5.2蓝牙标准,具备24bit DSP处理能力,这必然会带有有高通优秀的Aptx HD编码。同时这款芯片内置了flash,减少了外围器件成本和采购flash的压力。稳定的平台赋能,卓越的音乐品质,强悍的电源管理,丰富的功能接口和产业公认的低功耗是这套方案的不二之选,搭配DSPg的芯片可谓强强联合。
方案实现
D4p和QCC3044主要引脚连接
DBMD_INT:当D4P检测到有较大幅度声音变化时,就会启动识别引擎去识别这声音是否为唤醒词,如果识别是唤醒词,就通过这个引脚把AP唤醒,再进入语音传输模式(Audio Buffering)。
RSTN:该引脚为D4P的复位脚,在每次烧录FW之前,都需要下拉该引脚一段时间。
WAKEUP:该引脚为AP唤醒D4P的引脚,当D4P进入Hibernate时,只能通过该引脚唤醒。
SPI(或I2C、Uart):这组引脚用于AP与D4P之间的数据交互(如FW文件传输,配置和控制指令)。在D4P进入语音传输模式时(Audio Buffering),AP会通过SPI(或I2C、Uart)读取拾取的语音指令数据做进一步的语音指令识别。
程序控制
先了解D4p的5种工作模式,如下图:
Idle:Boot Firmware之后,系统会在idle模式,这个状态主要用于配置参数,为接下来的模式做准备
Audio Buffering:该模式是将声音都放到buffer中,让AP去提取使用
Detection:在该模式下,系统用较低的功耗检测环境声音,当有明显声音波动时,系统进入语音识别状态,识别成功后,进入声音传输状态
Sleep:该模式关闭ADC采集和处理, 保留与AP通讯能力
Hibernate:系统关闭处理功能,AP无法通讯,只有AP用IO唤醒才能恢复到Idle模式
Microphone:该模式用于debug,mic声音数据直接通过uart输出
根据这几个模式,在QCC3044中加入对应的处理
1)QCC3044开机时,对D4P复位并烧录FW文件(Idle模式)
2)配置D4P参数,并进入Sleep或Hibernate模式
3)QCC3044接收到用户指示,唤醒并控制D4P开启语音检测模式(Detection模式)
4)D4P检测唤醒词,唤醒QCC3044做语音识别(Audio Buffering模式)
设计要点
1)Boot模式选择:D4P支持多种boot模式,若需要独立启动可从flash加载程序;若从AP加载程序,可从Uart、SPI或I2C选一种加载,方便不同主控端选择。加载时芯片会自动识别当前通讯协议,从而自动选择对应的通讯方式。大致流程如下:
2)Mic设计:mic输入是差分信号,所以振幅比较低,设计时需要将mic的线路平行并尽可能靠近。Mic到D4p之间需要保持相同的距离和相同的阻抗。Mic的滤波电容应靠近mic,而其他部分则尽可能靠近D4p端。
3)实体mic之间的距离越大越好,这样有助于算法做beam forming
4)Uart引脚需要预留出来,调算法和debug时候都需要用到
5)Reset引脚是必须要接上的,D4p每次烧Firmware之前都需要拉低reset一下
6)Uart通讯时,D4p会自动识别比特率,但在此之前需要发送16个0进行同步
此外这个设计的连接方式同样适用于其他蓝牙、WiFi、ARM等应用平台。如要做通话降噪应用,D4P也提供了I2S接口,可将处理后的音频数据传入AP端。