目前的家庭智能音箱可以实现语音定闹钟、人工语音互动、语音播放音乐、查天气、查百科、查路况等功能,链接网络后可实现了解未来天气、上网购物、打电话等更多功能,另外还可以连接第三方软件,也可实现对家用智能电器的控制,可以说功能十分的强大。
智能音箱相比于传统音箱的优势在于其能够通过语音实现“隔空操作”。智能音箱的基本原理是用户使用自然语言与音箱交流,音箱通过识别用户的语音指令完成相应任务,在人们不方便使用手机或其他电子设备时提供帮助。用户更多的是通过声音与其进行交互,从而解放了双眼和手指。
芯岭技术为企业提供了一种基于单片机的智能音箱解决方案,下文是方案的一些相关介绍。
一、智能音箱解决方案的主要技术:
智能音箱的工作流程为语音唤醒,之后内部处理,最后找到对应内容输出,其中主要包括前端信号处理、语音唤醒、语音交互等技术。
1、前端信号处理
前端信号处理是在唤醒前进行准备工作,音箱工作时,麦列处于拾音状态,当接收到声音时,对声音进行处理,包括语音检测、降噪、声源定位和波束形成四个方面。
2、语音唤醒
语音唤醒又称关键词检测,即在连续不断的语音中将目标关键词检测出来,一般目标关键词的个数较少。语音唤醒性能取决于唤醒率和误唤醒率。唤醒率指将连续语流中存在的唤醒词检测出来的概率。语音唤醒常用的实现方式是dnn+hmm(深度神经网络+隐马尔科夫模型)和lstm+ctc(长短时记忆网络+全连接时序分类模型)。目前开源的唤醒方案可提供SDK,实现唤醒功能一般分为在线和离线版本。国内主要以科大讯飞为代表。网上也有多种开源的小型语音识别引擎,可实现单独的语音唤醒功能,性能参差不齐。
3、语音交互
语音交互包括语音识别、自然语言理解、对话管理、自然语言生成和语音合成。
语音识别技术也称为自动语音识别,可将语音信息转为文字信息。用户发出的指令为语音,然而语音并不能直接拿来分析,需要转化为文字。随着深度神经网络的应用、大数据的使用和云计算的普及,语音技术已经进入人们的日常生活,如科大讯飞、阿里巴巴的AliGenie、喜马拉雅的小雅等。
二、智能音箱解决方案可实现功能:
芯岭技术的智能音箱方案的主控芯片采用了我们的XL32F003S8这款单片机,封装型号为8引脚sop,该方案通过程序编写,烧录,电路设计完成功能模块的搭建,产品设计完成之后,最终能够实现如下多种功能:
1、夜灯功能:七彩闪烁小夜灯,跟随音乐的节奏闪烁;
2、LED显示:外置显示屏,电量显示,音乐显示;
3、时钟显示:自动适配时区,24小时时钟显示;
4、语音交互:用语音替代了之前的触摸按钮等交互功能,方便您的生活。