服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

清华大学任天令团队《Nature》子刊:一款基于石墨烯的智能可穿戴人工喉

日期: 来源:材料分析与应用收集编辑:carbon_art

近日,清华大学集成电路学院任天令教授及合作团队在智能语音交互方面取得重要进展,其研发的可穿戴人工喉可以感知喉部发声相关的多模态机械信号以用于语音识别,并依靠热声效应播放对应的声音,研究结果为语音识别与交互系统提供了一条新的技术途径。


图1. 基于智能可穿戴人工喉的语音交互范式


语音是人类交流的重要方式,但说话人的健康状态(例如神经疾病、癌症、外伤等原因导致的声音障碍)和周围环境(噪音干扰、传播介质)往往会影响声音的传输和识别。研究人员一直在改进语音识别和交互技术以应对微弱的声源或嘈杂的环境。多通道声学传感器可以显著提高声音识别的精度,但会导致更大的设备体积。而可穿戴设备能够获取高质量的原始语音或其他生理信号。然而,目前尚无充分的证据表明喉部肌肉的运动模式和反映在体表的发声器官振动中隐含着可识别的语音特征,且尚无实验证明其作为语音识别技术的完备性。


图2. 人工喉器件设计和性能表征

图3. 人工喉器件与麦克风采集的语音信息标注和共振峰特征分析


为解决这一问题,任天令团队成员开发了一款基于石墨烯的智能可穿戴人工喉(AT),同商业麦克风和压电薄膜相比,人工喉对低频的肌肉运动、中频食管振动和高频声波信息有很高的灵敏度(图1、图2),同时也具有抗噪声的语音感知能力(图2)。对声学信号和机械运动的混合模态的感知使人工喉能够获得更低的语音基频信号(图3)。此外,该器件还可以通过热声效应实现声音的播放功能。人工喉的制作过程简单、性能稳定、易于集成,为语音识别和交互提供了一种新的硬件平台。

图4. 人工喉语音识别性能

团队还利用人工智能模型对人工喉感知的信号进行语音识别和合成,实现了对基本语音元素(音素、声调和词语)的高精度识别,以及对喉癌患者模糊语音的识别与再现,为声音障碍者的沟通和交互提供了一种创新的解决方案。实验结果表明,人工喉采集的混合模态语音信号可以识别基本语音元素(音素、音调和单词),平均准确率为99.05%。同时人工喉的抗噪声性能明显优于麦克风,在60dB以上环境噪声下仍能保持识别能力。任天令研究团队进一步演示了它的语音交互式应用。通过集成AI模型,人工喉能够识别一名喉切除术患者模糊说出的日常词汇,准确率超过90%。识别出的内容被合成为语音在人工喉上播放,可以初步恢复患者的语音交流能力。

图5. 使用智能可穿戴人工喉进行无声语音交互

该人工喉还有很大的优化和拓展空间,例如提高声音的质量和音量,增加语音的多样性和表情,以及结合其他生理信号和环境信息实现更自然和智能的语音交互。研究团队希望通过进一步的研究和合作,让人工喉造福更多的声音障碍者和语音交互的用户。


该成果以“使用可穿戴人工喉的混合模态语音识别与交互”(Mixed-modality speech recognition and interaction using a wearable artificial throat)为题,于2月24日在线发表在《自然》(Nature)人工智能子刊《自然·机器智能》(Nature Machine Intelligence)上。


论文通讯作者为清华大学集成电路学院任天令教授、田禾副教授、杨轶副教授和上海交通大学医学院罗清泉教授,清华大学集成电路学院2019级博士生杨其晟、上海交通大学医学院2019级博士生金伟秋为共同第一作者。该项目得到了国家自然科学基金委、科技部、教育部霍英东基金、北京市自然基金委、清华大学国强研究院、清华大学佛山先进制造研究院、清华大学-丰田联合研究院、清华-华发建筑光电子技术联合研究院等的支持。


论文链接:

https://www.nature.com/articles/s42256-023-00616-6


往期精彩回顾
中国矿大(北京)《Carbon》:叶状3D碳纳米管/石墨烯气凝胶薄膜,用于电磁干扰屏蔽
哈工大(深圳)《J. Alloys Compd.》:大尺寸块状多级石墨烯结构多孔碳的合成及其作为Li-S全电池
河南科技大学《EA》:凝胶聚合物电解质与碱性水生胶体石墨烯,用于柔性和可充电锌空气电池

来源:文章来自清华大学


长按,识别图中二维码,点击关注

版权与免责声明:

① 凡本网注明"材料分析与应用"的所有作品,版权均属于材料分析与应用,未经本网授权不得转载、摘编或利用其它方式使用。已获本网授权的作品,应在授权范围内使用,并注明"来源:材料分析与应用"。违者本网将追究相关法律责任。

② 本网凡注明"来源:xxx(非本网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,且不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。

③ 如涉及作品内容、版权等问题,请在作品发表之日起三日内与本网联系,否则视为放弃相关权利。

相关阅读

  • Windows11 三月更新了什么?除了 NB,无话可说。

  • * / 截图工具支持录屏,小组件全屏,搜索框输入内容直达 New Bing,记事本多标签页并且可以拖拽开来,连通 iPhone…….微软的 Windows11 3 月更新,也就是他们称之为 Moment 2 的,都更
  • 你的梦想家居「GitHub 热点速览」

  • 作者:HelloGitHub-小鱼干上周推荐的 ChatGPT 版小爱,不知道有哪些小伙伴回去尝试接入了呢?本周依旧由 2 个不错的 ChatGPT 延伸项目,一个是比 DeepL、Grammarly 更懂你的划词翻
  • 武汉市高校,诚聘教师/教辅/专技等岗位

  • 武汉外语外事职业学院于2002年经湖北省人民政府批准成立,并经国家教育部备案,是我国中部地区第一所专门培养具有外语特长的高级技术型、技能型专门人才的普通高等职业学院。学
  • 南京视觉艺术职业学院2023年招聘公告

  • 南京视觉艺术学院(Nanjing Institute of Visual Arts,简称NIVA)前身为南京林业大学南方摄影学院,创建于2000年,是经江苏省人民政府批准、教育部备案的一所全日制综合性新型艺术大
  • 常州工学院2023年高层次人才招聘启事

  • 一、学校简介常州工学院是教育部批准成立的一所全日制普通本科高校。学校所在地常州市位于江苏省南部,长三角城市群中心地带,与上海、南京等距相邻,与苏州、无锡联袂成片,是江苏
  • 王川:关于 chatGPT 的随想 (一)

  • 本文是 王川: 关于 GPT-3 的随想 (一) 的续篇。1/ 过去三个多月,大部分人都已经听到各种关于 chatGPT 的铺天盖地的消息了。如果你还不清楚,chatGPT 作为一种基于人工智能的

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 它的成分99%是水,却影响着我们对食物的选择

  • 图源:Pixabay导读: 我们口腔分泌的液体可不仅仅只是一种润滑剂。一直以来,研究人员不断探索着唾液的功能,结果表明,唾液对于我们感知味道的方式有着非常积极的作用,并且影响
  • 关于退役军人工作,代表委员这样说

  • @退役军人他们的关注与你有关!促进退役军人投入乡村振兴邱宁宏,全国人大代表、贵州省遵义职业技术学院教授“退役军人政治素质强,纪律作风过硬,已成为乡村振兴的中坚力量。”她