我国科学家研发出可穿戴人工喉

发布时间:2023-03-20  

一枚硬币大小的石墨烯片,贴在颈部靠近喉咙处,就能帮助发音障碍者获得新“声”。近日,清华大学集成电路学院任天令教授及合作团队在智能语音交互方面取得重要进展,其研发的可穿戴人工喉可以感知喉部发声相关信号,并通过人工智能模型将其识别和合成为语音,还原准确率超过90%。


这一研究结果为语音识别与交互系统提供了一条新的技术途径,并于近日在线发表在《自然》人工智能子刊《自然·机器智能》上。


语音是人类交流的重要方式,但说话人的健康状态(例如神经疾病、癌症、外伤等原因导致的声音障碍)和周围环境(噪音干扰、传播介质)往往会影响声音的传输和识别。一直以来,研究人员在致力改进语音识别和交互技术以应对微弱的声源或嘈杂的环境。多通道声学传感器可以显著提高声音识别的精度,但会导致更大的设备体积,而可穿戴设备能够获取高质量的原始语音或其他生理信号。然而,目前尚无充分的证据表明喉部肌肉的运动模式和反映在体表的发声器官振动中隐含着可识别的语音特征,且尚无实验证明其作为语音识别技术的完备性。


为解决这一问题,任天令团队成员开发了一款基于石墨烯的智能可穿戴人工喉,同商业麦克风和压电薄膜相比,人工喉对低频的肌肉运动、中频食管振动和高频声波信息有很高的灵敏度,同时也具有抗噪声的语音感知能力。对声学信号和机械运动的混合模态的感知使人工喉能够获得更低的语音基频信号。此外,该器件还可以通过热声效应实现声音的播放功能。人工喉的制作过程简单、性能稳定、易于集成,为语音识别和交互提供了一种新的硬件平台。


团队还利用人工智能模型对人工喉感知的信号进行语音识别和合成,实现了对基本语音元素(音素、声调和词语)的高精度识别,以及对喉癌患者模糊语音的识别与再现,为声音障碍者的沟通和交互提供了一种创新的解决方案。


实验结果表明,人工喉采集的混合模态语音信号可以识别基本语音元素(音素、音调和单词),平均准确率为99.05%。同时人工喉的抗噪声性能明显优于麦克风,在60分贝以上环境噪声下仍能保持识别能力。任天令研究团队进一步演示了它的语音交互式应用:通过集成AI模型,人工喉能够识别一名喉切除术患者模糊说出的日常词语,准确率超过90%。识别出的内容被合成为语音在人工喉上播放,可以初步恢复患者的语音交流能力。


任天令介绍,该人工喉还有很大的优化和拓展空间,例如提高声音的质量和音量,增加语音的多样性和表情,以及结合其他生理信号和环境信息实现更自然和智能的语音交互。研究团队希望通过进一步的研究和合作,让人工喉造福更多的声音障碍者和语音交互的用户。


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    我国科学家研发出可穿戴人工喉;一枚硬币大小的石墨烯片,贴在颈部靠近喉咙处,就能帮助发音障碍者获得新“声”。近日,清华大学集成电路学院任天令教授及合作团队在智能语音交互方面取得重要进展,其研发的可穿戴人工喉可以感知喉部发声......
    Diodes公司推出增强型发声器驱动器,让小型智能传感器和穿戴式装置也能拥有音频用户接口;Diodes 公司 (Nasdaq:DIOD) 今日宣布推出热门发声器驱动器的增强版,以因......
    半导体制造技术扬声器应用,xMEMS MEMS扬声器改变未来音频发声;扬声器是一种将电信号转变为声信号的换能器件,广泛应用于众多的消费电子产品之中,为音频播放提供支持。扬声器的种类很多,在个......
    针正向偏转,则红表笔接的是扬声器负极,黑表笔接的是扬声器正极。反之,红表笔接的是正极,黑表笔接的是负极。 2 用万用表判断压电陶瓷的好坏 压电陶瓷是一种人工合成的压电材料。当受到外界压力时,两面会产生电荷,电荷......
    实现了全频域的音质,同时提高了芯片的声压级别。 通过在复杂的声学MEMS制造技术中所取得的一系列革命性突破,DSR扬声器产品在微型数字阵列发声器领域将产生革命性影响,预期市场需求量巨大,这一......
    程定时/计数器8253在扬声器中的应用  扬声器驱动系统的硬件组成如图3所示。利用8253驱动扬声器发声是由系统插件上8255的外围电路来发出驱动信号的。如图3中的SPK DATA和TIM GATESPK就是......
    减少声音的外泄,尤其是在公共场合提升聆听的私密性,是用户关注的另一大痛点。 瑞声科技AR专用超线性扬声器采取开放式后腔设计,通过泄声孔和主发声孔的设计,中低频隔离度高于主流AR眼镜......
    原理如图 27 所示。 本电路主要由发声集成电路KD~9561和开关集成电路TWH8778组成,工作时,由KD-9561输出警音信号,经TWH8778大电流开关集成电路处理放大后,推动扬声器......
    电磁式蜂鸣器和压电式蜂鸣器的区别;电磁式蜂鸣器广泛应用于计算机、打印机、复印机、报警器、电子玩具、汽车电子设备、电话机、定时器等电子产品中作发声器件;压电式蜂鸣器用于音乐贺卡、电子门铃和电子玩具等小型电子用品上作发声器......
    xMEMS推出全硅“片上风扇”,为移动设备提供主动散热功能; 【导读】压电微机电(piezoMEMS)创新平台开发商、全球领先MEMS扬声器创造者xMEMS Labs近日......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>