行业资讯

任天令教授及其团队研发出可穿戴人工喉,为喉癌患者的交流提供了创新的解决方案
发布者:鸿腾智能科技(江苏)有限公司 发布时间:2023-03-19 09:29:00 点击次数:402 关闭
    3月19日消息,据清华大学集成电路学院官网消息,清华大学集成电路学院任天令教授及其团队近日在智能语音交互方面取得重要进展。-最先进的机械信号用于语音识别,依靠热声效应播放相应的声音研究成果为语音识别和交互系统提供了一种新的技术途径。
    语音是人类交流的重要方式,但说话者的健康状况(如神经系统疾病、癌症、外伤等引起的声音障碍)和周围环境(噪声干扰、传输介质)往往会影响传输和识别的声音。研究人员改进了语音识别和交互技术,以应对微弱的声源或嘈杂的环境。多通道声学传感器可以显着提高声音识别的准确性,但会导致设备尺寸更大。另一方面,可    穿戴设备可以接收高质量的原始语音或其他生理信号。但是,目前还没有足够的证据表明喉部肌肉的运动模式和体表反射的发声器官的振动涉及可识别的语音特征,也没有实验证明其作为语音识别技术的完整性。

    为解决这个问题,任天令团队成员开发了一种基于石墨烯的智能可穿戴人工喉头(AT),它对声学信息具有很高的灵敏度,同时还具有感知噪声对抗噪声的能力。对声    音信号和机械运动混合模式的感知使人工喉能够获得较低的语音基频信号。此外,该装置还可以通过热声效应实现声音的播放功能。该人工喉制造工艺简单、性能稳定、易于集成,为语音识别和交互提供了一个新的硬件平台。
    团队还利用人工智能模型对人工喉头感知到的信号进行语音识别和合成,实现语音基本要素(音素、声调和词)的高精度识别,以及含糊不清的语音识别和再现。喉癌患者的交流和互动为残疾人提供了创新的解决方案。
    实验结果表明,人工喉头采集的混合语音信号能够识别基本语音元素(音素、声调和单词),平均准确率为99.05%。同时,人工颈的抗噪性能明显优于麦克风,在60dB以上的环境噪声中仍能保持识别能力。任天令的研究团队进一步展示了其语音交互应用。通过集成AI模型,人工喉能够识别喉切除术患者含糊地说出的日常用语,准确率超过90%。将识别出的内容合成语音,在人工喉上回放,基本可以恢复患者的语音交流能力。
    据介绍,人工喉头还有很大的优化和扩展空间,比如提高声音的质量和音量,增加声音的多样性和表现力,结合其他生理信号和环境信息,实现更加自然和智能化。语音交互。研究团队希望通过进一步的研究与合作,让人工喉能够惠及更多的语音障碍人群和语音交互用户。
    从清华大学集成电路学院官网获悉,该成果“Mixed-modalSpeechRecognitionandInteractionUsingaWearableArtificialLarynx”于2月24日在线发表在人工智能子刊上。Nature,NatureMachineIntelligence”出类拔萃。
商务咨询 商务咨询
关于我们 产品展示 广告设计 客户案例 技术支持 联系我们

电话:0511-86930535(工作日)

手机:177-6865-8888(微信同号)

手机:137-7550-8287(微信同号)

零售:137-7550-7308(微信同号)