基于嵌入式Linux的语音识别系统硬软件设计详细讲解教程

发布时间:2023-01-12  

该设计运用三星公司的S3C2440,结合ICRoute公司的高性能语音识别芯片LD3320,进行了语音识别系统的硬件和软件设计。在嵌入式Linux操作系统下,运用多进程机制完成了对语音识别芯片、超声波测距和云台的控制,并将语音识别技术应用于多角度超声波测距系统中。通过测试,系统可以通过识别语音指令控制测量方向,无需手动干预,最后将测量结果通过语音播放出来。


1.引言

语言是人类传播信息的重要手段,语音识别则是实现语音控制的关键技术。采用嵌入式语音识别技术使得设备具有功耗低、使用简便、灵活等优点,摆脱了复杂按键和按钮的困扰,在服务机器人、智能家居及消费电子等领域发挥着重要作用。


2.系统构成与原理

语音识别主要包括两个阶段:训练阶段和识别阶段。在训练或识别过程中,都必须对输入语音进行预处理和特征提取。训练阶段通过用户输入的若干次训练语音,经过预处理和特征提取后得到特征参数,最后通过特征参数建模,进而建立训练语音的参考模型库。而识别阶段是将输入语音的特征矢量参数和参考模型库中的参考模型进行相似性度量,然后把相似度最高的输入特征矢量作为识别结果输出,从而达到语音识别目的,如图1所示。

基于嵌入式Linux的语音识别系统硬软件设计详细讲解教程

语音识别技术可分为:特定人识别和非特定人识别两种。特定人识别是指需要对待识别人的语音进行采集训练,识别对象为专门的人;非特定人识别是指识别对象为大多数用户,一般要采集多个人的语音进行录音、训练和学习,从而达到较高的识别率。


在实际应用中,现代技术开发嵌入式语音识别有两种实现方式:调入嵌入式语音开发包和外扩语音识别芯片。本文的语音识别系统方案是以嵌入式处理器S3C2440为核心,外扩非特定人语音识别芯片LD3320,并将超声波测距模块和云台相结合作为系统的机械执行机构。系统测量过程如下:首先根据语音指令控制两自由度云台的位姿,使超声波探测器指向特定方向,然后开启超声波探测器,测量出前方障碍物距离,最后将测量结果转化为可以播放的二进制数据流,通过LD3320的播放功能完成数据的播放。


3.硬件电路设计方案

硬件电路主要包括语音识别部分、主控部分、超声波测距部分和舵机控制部分,如图2所示。处理器为三星公司的S3C2440,系统主频最高可达533MHz,支持SPI、I2C、UART等接口,能够满足控制系统的需求。主控芯片S3C2440通过SPI总线完成对语音识别模块的读写操作,超声波测距部分和舵机控制部分由处理器的GPIO进行统一控制。

基于嵌入式Linux的语音识别系统硬软件设计详细讲解教程

3.1语音识别电路设计

为了使系统能够识别操作人员发出的语音指令,设计中采用了由ICRoute公司设计生产的非特定人语音识别芯片LD3320,它集成了语音识别处理电路和一些外部电路,包括AD、DA转换器、麦克风接口、声音输出接口等,不需要外接任何的辅助芯片如Flash、RAM。在主控制器的控制下,可以识别出预先添加到识别列表中的内容。设计中参考了ICRoute发布的LD3320数据手册,图中LD3320的P0、P1、P2引脚通过SPI接口与嵌入式处理器相接,控制信号WRB、CSB、RSTB以及中断返回信号引脚INTB与处理器S3C2440直接相连,如图3所示。

基于嵌入式Linux的语音识别系统硬软件设计详细讲解教程

3.2超声波测距和舵机控制电路设计

超声波测距原理相对比较成熟,系统中采用超声波测距模块HC-SR04。该模块有两个TTL电平通信引脚,兼容3.3V电平。其中,控制端口Trig发一个10us以上的高电平,接收端口Echo将输出与距离成正比的高电平信号。当Echo有高电平输出时就开启处理器定时器,当端口电平跳变为低电平时关闭定时器,根据定时器的值可计算得到障碍物的距离。其中,控制端口Trig和接收端口Echo分别接至处理器的GPG9、GPG6引脚。


超声波测距模块的感应角度小于15°,为了扩大测距的感应角度范围,将超声波测距模块安装在两自由度云台上,其中,舵机为SG90(9G),旋转角度为180°。处理器通过GPB0和GPB1分别控制两个舵机以实现云台的旋转,以测量不同方向的障碍物,如图4所示。

基于嵌入式Linux的语音识别系统硬软件设计详细讲解教程

4.软件设计方案

系统软件基于嵌入式Linux操作系统,实现了语音识别、语音播放、超声波测距和舵机控制等任务,使用fock机制为每项任务分配独立的进程,使系统可以进行多任务处理。针对不同功能模块编写了相应的底层驱动程序,为上层应用程序提供了调用接口。


系统工作流程如下:处理器通过SPI总线对语音识别芯片LD3320进行通用初始化,使语音识别芯片进入循环识别模式,系统处理器反复启动语音识别过程。如果有识别结果,则根据识别作相应处理后(比如播放某个声音作为应答)再启动下一个识别过程。处理器通过SPI总线读取C5寄存器的识别结果并分析,将语音命令转换为超声波测距和舵机的控制信号,完成多方位测距任务,如图5所示。

基于嵌入式Linux的语音识别系统硬软件设计详细讲解教程

4.1语音识别功能程序设计

语音识别芯片LD3320的特色是兼有语音识别和MP3播放的两项功能,在功能切换的时候,必须进行通用初始化,对芯片进行一系列的设置。


语音识别功能的驱动程序工作流程为通用初始化à语音识别用初始化→写入识别列表→开始识别→响应识别中断。为了提高识别成功率,在识别列表中增加了“垃圾关键词”以吸收错误的识别。上层应用程序为语音识别功能分配了单独的进程,通过ioctl()函数控制LD3320的工作状态,read()函数可以读取识别结果。程序中使用select机制实现read()函数的非阻塞访问。同时,设定select监控超时时间,在超时后,重新初始化语音识别芯片LD3320,为下一次语音识别做准备,如图6所示。

基于嵌入式Linux的语音识别系统硬软件设计详细讲解教程

4.2语音播放功能程序设计

LD3320支持MP3数据播放,程序中操作顺序为:通用初始化à播放模式初始化à音量调节à开始播放,并准备好中断响应函数,打开中断允许位。在程序中,首先将数字0~9、“十”、“百”、“点”的语音MP3数据分别转换为标准C语言数组格式文件,将该文件添加到工程中进行统一编译。然后把需要播放的距离数据进行拆分,并对每一位进行查表操作,得到相应的语音数据。例如,将距离数据12.5拆分为:“1”、“十”、“2”、“点”、“5”。最后将查表得到的语音数据按从左到右的顺序组合,并存储到LD3320的播放数据存储器,在即将播放完毕时,芯片会发出中断请求,在中断响应函数中连续写入播放数据,直到声音数据播放完毕。


4.3超声波测距和云台控制程序设计

超声波测距功能的驱动程序属于Linux字符型驱动,利用ioctl()函数对相应GPIO进行时序控制,完成超声波的发射和接收。在接收端口输出高电平脉冲信号时,触发系统中断并使用定时器计算得到高电平持续时间△T,根据公式(1)完成距离S的测量。式中V为超声波的传播速度,常温下超声波在空气中的传播速度是340米/秒。在应用程序中,可以通过read()函数读取到所测量的距离值。

S=VXΔT/2(1)

两自由度云台由两个舵机组成,分别控制云台水平和垂直方向的旋转角度。在驱动程序中,首先打开定时器PWM功能并设置定时周期,然后映射定时器中断函数,最后使能定时器,使定时器开始运行。程序中根据实验者发出的语音指令,利用ioctl()函数控制定时器输出两路PWM信号,分别控制两个舵机的旋转角度,最后将运动合成为云台的位姿。


5.结语

本文介绍了嵌入式语音识别技术在超声波测距系统中的一种应用以及实现方式,实验人员可以通过预先定义好的语音指令(例如:“开始测量”、“左上方”、“前方”)实现对系统的控制,并利用超声波进行距离测量。测量完成后,系统通过语音播放的方式将测量结果反馈给实验人员,完成人机交互,提高了用户体验度。本系统具有易扩展的优点,可以将其应用到其它嵌入式控制系统中。


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    stm32用什么语言编程 STM32单片机原理;STM32可以使用多种语言进行编程,包括: 1. C语言:C语言是最常用的STM32编程语言。STMicroelectronics提供了专门的C编译......
    stm32单片机用什么语言 编程 stm32各种型号;  stm32单片机用什么语言编程   STM32单片机可以使用多种编程语言进行编程,包括C语言、汇编语言以及基于图形化编程的工具,如ST的......
    stm32用什么语言编程;  编程语言(programming language),是用来定义计算机程序的形式语言。它是一种被标准化的交流技巧,用来向计算机发出指令。一种计算机语言......
    . 智能家居 这些产品内部都是通过嵌入式技术实现的,而大多数用的都是单片机。 嵌入式和单片机的区别是什么?有什么关系? 如果把嵌入式比作一颗大树,那单片机就是这棵树的树枝。 嵌入式一个行业,单片......
    单片机属于嵌入式系统吗?嵌入式开发要学哪些课程?;我们在做产品开发的时候,基本很少去了解这些概念性的东西。 后面我特意去了解了一下,今天就把这些概念分享给有同样问题的朋友。 嵌入式一般叫嵌入式......
    8051单片机由什么组成 8051单片机有多少管脚;8051单片机介绍 8051单片机是一款广泛应用于嵌入式系统中的8位单片机,由Intel公司在1980年推出,是当时业界最先进的8位单......
    程度方便了用户进行二次开发。 图:米尔的T507核心板图样 与嵌入式一体板相比,嵌入式核心板有什么优势? 嵌入式一体板是在客户的功能需求定下来之后,对功能进行剪裁,设计的一体化的嵌入式板卡,劣势是最小系统功能复杂,开发......
    最终呈现给用户的是一个带图形界面的完整操作系统,最大程度方便了用户进行二次开发。   图:米尔的T507核心板图样 与嵌入式一体板相比,嵌入式核心板有什么优势? 嵌入式一体板是在客户的功能需求定下来之后,对功能进行剪裁,设计的一体化的嵌入式......
    程度方便了用户进行二次开发。 图:米尔的T507核心板图样 与嵌入式一体板相比,嵌入式核心板有什么优势?嵌入式一体板是在客户的功能需求定下来之后,对功能进行剪裁,设计的一体化的嵌入式板卡,劣势是最小系统功能复杂,开发......
    的嵌头可以手动开启和关闭,优点是探头可以很容易地夹在电流测量导线上。当测量完成后,钳口可以打开,探头可以移动到另一根导线上。 有源探头按常见的钳口形式分为两种:一种是嵌入式结构,另一种是柔性结构。 嵌入式结构电流探头一般......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>