收款机TTS语音芯片新方案:WT3000T8,双语合成流畅,字库解码多样!

发布时间:2024-08-02  

一:方案背景概述


随着科技的飞速发展,人工智能和语音识别技术在各个领域都得到了广泛应用。其中,文本转语音(TTS)技术以其独特的优势,在收款机语音播报收银领域发挥着越来越重要的作用。本文将深入探讨TTS技术在收款机播报收银中的具体应用,包括播报需求、应用优势、内容定制、用户体验提升;

01

收款机播报需求:

在商场、超市等零售场所,收款机播报收银的需求日益凸显。通过语音播报,顾客可以无需查看屏幕即可了解交易金额、找零等信息,大大提高了购物体验和效率。同时,对于视力不佳或不便查看屏幕的顾客来说,语音播报更是提供了极大的便利。

02

TTS应用优势:

TTS技术在收款机播报收银中的应用具有以下优势:首先,实时性强,能够实时将交易信息转化为语音输出;其次,准确度高,能够确保播报内容的准确性;再次,灵活性好,可以根据实际需求定制播报内容;最后,用户体验佳,通过语音播报提高了顾客购物的便捷性和舒适性。

03

播报内容定制:

在TTS应用中,播报内容的定制是关键一环。收款机可以根据实际需求和场景设置不同的播报内容,包括交易金额、支付方式、找零情况、优惠信息等。同时,还可以根据顾客的偏好和需求进行个性化定制,提高播报内容的针对性和实用性。

04

用户体验提升:

通过应用TTS技术,收款机播报收银可以显著提升用户体验。顾客在购物过程中无需分心查看屏幕或询问收银员,就能获取到完整的交易信息。此外,语音播报还可以配合其他交互方式,如语音识别、触摸屏等,提供更加便捷、智能的购物体验。

综上所述,TTS技术在收款机播报收银中具有重要的应用价值和发展前景。本方案采用WT3000T芯片增加语音功能。不但可用耳朵听语音播报收款的情况等(依用户需求设置),而且可以播放音乐或英语口语美文。解决了在不同播报要求下语音占用大量资源空间的问题。可以实现低成本低功耗的文本转语音,支持中英文两种功能,实现播报语音自由配置无需通过升级方式替换语音,给方案商提供性价比非常高的解决方案。


二:方案系统组成


2.1芯片简介

WT3000T8是一款功能强大的高品质语音芯片,采用了高性能32位处理器、最高频率可达240MHz。WT3000T8高集成度的语音合成芯片,可实现中文、英文字母语音合成;并集成了语音编码、解码功能,可支持用户进行语音合成和语音播放,具有低成本、低功耗、高可靠性、通用性强等特点,现有WT3000T8-32N QFN32(体积小4*4MM)的封装芯片。带有地址播放、插播、单曲循环、所有曲目循环、随机播放等功能。31级音量可调、最大可以支持外挂128Mbit的Flash。


2.2系统主要功能

1:控制方式:UART(或者SPI),默认波特率9600;

2:上电默认不播放;具备BUSY状态指示,上电默认BUSY播放时为低电平,不播放时为高电平(可发码修改默认配置);

3:音频输出方式,样品默认DAC输出;

4:支持语音高品质音频格式,(8kbps~320kbps)声音优美,.MP3、.WAV格式;

5:支持指令随机播放,无缝循环播放功能等;

6:最大可以支持128Mbit的Flash;

7:音量可调,音量等级31级;

8:大功率IO驱动能力,最高可直接驱动32mA;

9:支持任意中文文本、英文字母的合成,并且支持中文与英文字母混读,英文字母暂不支持使用标记实现变速变调;

芯片支持任意中文、英文字母的合成,可以采用GB 2312编码方式。每次合成的文本量最多可达2K字节。

芯片对文本进行分析,对常见的数字、号码、时间、日期、度量衡符号等格式的文本,芯片能够根据内置的文本匹配规则进行正确的识别和处理。

10:支持多种控制命令

如合成文本、停止合成、暂停合成、恢复合成、状态查询、进入休眠模式、唤醒等。控制器通过通讯接口发送控制命令可以对芯片进行相应的控制。芯片的控制命令非常简单易用,例如:芯片可通过参考对应的指令说明即可实现播放提示音和中文文本合播放成,还可以通过标记文本实现对合成的参数设置。

11:支持多种方式查询芯片的工作状态

包括:查询状态管脚电平、通过读芯片自动返回的工作状态字、发送查询命令获 得芯片工作状态的回传数据。

12:单芯片使用(使用内置容量)时内置语音需出厂前写入。


2.3系统结构框图

90a6366e-4bb0-11ef-817b-92fbcf53809c.png


2.4主要芯片介绍

程序及模块选型简介

90c0202e-4bb0-11ef-817b-92fbcf53809c.png


2.5引脚描述

芯片封装管脚图

90dfc1cc-4bb0-11ef-817b-92fbcf53809c.png

90f77074-4bb0-11ef-817b-92fbcf53809c.png

9112243c-4bb0-11ef-817b-92fbcf53809c.png



三:协议命令格式

芯片内置标准UART异步串口接口,默认波特率9600,属于3.3V TTL电平接口。通讯数据格式是:起始位:1位;数据位:8位;奇偶位:无;停止位:1位。使用电脑串口调试助手,需要正确设置串口的参数,设置如图:

912701ae-4bb0-11ef-817b-92fbcf53809c.png


指令发码格式

913cb8dc-4bb0-11ef-817b-92fbcf53809c.png


指令返回码格式

9155dd76-4bb0-11ef-817b-92fbcf53809c.png

注:执行完每条写命令之后,按照通信协议格式返回该命令相对应的结果码。

帧长度:2字节,指帧长度+流水号+应答标志+数据帧来源+N个命令信息+累加和校验和的长度,帧长度高位在前低位在后;

流水号:1字节,每次一帧数据自动加1,避免接收重复的数据,相同流水号的数据为重复数据应做丢弃;

应答标志:1字节,固定填00;

数据帧来源:1字节,02为TTS芯片端,03为MCU芯片端;

N个命令信息:由N个命令信息组成,1个命令信息内容为2字节命令+1字节数据长度+N字节数据,单个命令信息最大支持255个字节数据,但支持同时传递多个相同的命令携带不同信息(返回码的此处信息与发码的略微有区别,详情见《WT3000Tx语音合成指令表》介绍);

累加和校验:是指帧长度+流水号+应答标志+数据帧来源+N个命令信息和的低字节。

文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>