清华新闻网7月28日电 近日,清华大学电子工程系语音与音频技术实验室提出了一种端到端的基于注意力机制和能量评分器的关键词检索系统。该系统摆脱了语音识别的依赖,并且取得了超越传统方法的性能,尤其适用于低资源小语种关键词检索任务。
关键词检索即为在连续的语音流当中检测和定位用户给定的关键词的技术。在移动设备广泛应用、海量音视频源源不断产出的今天,关键词检索能有效提高信息检索的效率和多媒体资源的利用率。传统的关键词检索技术依赖于连续语音识别系统,即先使用语音识别系统得到识别结果(一般为多候选结果),然后再从识别结果之中寻找关键词并进行置信度估计。然而,训练出一个可靠的语音识别系统往往需要大量的标注语音数据,对于低资源语种,即可用的训练数据较少的语种,传统的方法往往会遇到一些困难。
为了解决低资源语种可训练数据少而制约关键词检索效果的问题,本工作采用的框架不再依赖于语音识别系统,大大降低对数据资源的依赖。以下是系统的整体结构框图:该系统主要由四部分组成,包括语音编码器(Speech Encoder),文本编码器(Query Encoder),注意力机制(Attention Mechanism)以及能量评分器(Energy Scorer)。
图1:端到端关键词检索系统的整体架构
语音编码器和文本编码器经过特殊设计,采用联结时序分类(Connectionist Temporal Classification, CTC)、基于注意力机制的序列到序列以及自监督训练等方法,使得生成的语音特征和文本特征包含关键词检索所需要的序列信息。其中,语音编码器结构如下图所示:
图2:语音特征提取过程以及使用联结时序分类或基于注意力的解码器从语音特征中预测字符或音素序列
然后,将语音和文本特征输入注意力机制和能量评分器,得到最终的评判结果。注意力机制和能量评分器,专门为关键词检测所设计,是本工作的两个重要创新点,也是超越传统方法的关键所在。图3演示了注意力权重在正负样本上的差异;图4是能量评分器的具体结构。
图3:负样本(左)和正样本(右)的注意力权重
图4:能量评分器的结构
课题组首先根据注意力权重对语音特征进行加权求和从而得到上下文特征。接着,通过计算上下文特征和语音特征的能量比。最终,课题组将能量比和由文本特征经过多层感知机得到的门限进行比较从而得到最后的判决结果。
该系统有效解决了低资源小语种缺乏标注数据和专家知识所带来的制约,使得关键词检索技术在相关领域迈向实用。该论文发表于《神经网络》(Neural Networks),题为“基于注意力机制和能量评分器的端到端低资源语种关键词检索系统”(End-to-end keyword search system based on attention mechanism and energy scorer for lowresource languages),第一作者为清华大学电子工程系硕士研究生赵泽宇,通讯作者为其导师张卫强副研究员。
清华大学电子工程系语音与音频技术实验室近年来专注于低资源语音识别和关键词检索研究,主持国家自然科学基金联合重点项目和国家重点研发计划重点专项课题,2020年在美国国家标准与技术研究院(NIST)主办的语音分析评测OpenSAT2020关键词检索任务取得国际第一名,在OpenASR2020低资源语音识别挑战赛中十个低资源语种取得四个国际第一名。
论文链接:
https://doi.org/10.1016/j.neunet.2021.04.002
供稿:电子系
编辑:张恩鸣
审核:吕婷
2021年07月28日 15:22:00
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
电子系语音与音频技术实验室提出新型低资源关键词检索技术
本站小编 Free考研考试/2021-12-20
相关话题/资源 系统 技术 数据 序列
清华智能产业研究院刘云新斩获国际计算机学会移动系统、应用和服务国际会议(Mobisys)2021 最佳论文奖
清华新闻网7月14日电7月7日,清华大学国强教授、智能产业研究院(AIR)首席研究员刘云新教授与微软亚洲研究院****合作完成的论文“nn-Meter:精准预测深度学习模型在边缘设备上的推理延迟”(nn-Meter:towardsaccuratelatencypredictionofdeep-lea ...清华大学通知公告 本站小编 Free考研考试 2021-12-20清华大学新技术概念汽车研究院管理委员会第三次会议召开
清华新闻网6月17日电6月11日上午,“清华大学新技术概念汽车研究院管理委员会第三次会议”在清华大学汽车研究所召开。会议旨在对清华大学新技术概念汽车研究院(以下简称“新研院”)成立以来的工作进行总结,并筹划布置新一年的工作安排。第十二届全国政协副主席、新研院管委会主任陈元,清华大学副校长、新研院管委 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20清华大学联合研制的国际首套输电线路全景智能监测系统成功投运
清华新闻网6月16日电6月10日,在云南香格里拉的500千伏建太甲线输电网上,技术人员完成了集成传感系统带电安装,并在云端平台上成功收集到导线电流、温度等监测数据。这标志着由清华大学电机系及清华四川能源互联网研究院与南方电网数字电网研究院联合研发的国际首套输电线路全景智能监测系统成功投运。中央电视台 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20精仪系和深圳国际研究生院教师合作项目荣获中国计量测试学会科学技术进步奖一等奖
清华新闻网6月4日电5月20日,中国计量测试学会成立六十周年暨纪念“5.20世界计量日”系列活动在京召开,会议公布了2020年度中国计量测试学会科学技术进步奖名单。清华大学精密仪器系副教授吴冠豪和深圳国际研究生院先进制造学部副研究员倪凯、周倩合作的“光频梳绝对距离测量关键技术及应用”项目荣获科技进步 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20清华大学深圳国际研究生院多位教师获2020年度广东省科学技术奖
清华新闻网6月1日电近日,广东省科技创新大会在广州举行。大会颁发了2020年度广东省科学技术奖,主要授予为促进科技进步和经济社会发展作出突出贡献的个人或组织。清华大学深圳国际研究生院多位教师荣获奖项。国际研究生院作为第一完成单位,清华大学土木水利学院教授方东平、清华大学深圳国际研究生院党委书记武晓峰 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20王祥珩团队:交流电机系统分析理论和技术的新突破
王祥珩教授等完成的交流电机系统的多回路分析技术及应用项目获2012年度国家技术发明奖二等奖交流电机系统分析理论和技术的新突破记者赵姝婧 在清华大学2012年度国家科技奖获奖成果中,有一个获奖项目跟其他相比颇有不同:项目的第一、第二完成人皆是清华大学的退休老教授,他们在退 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20机械系智能与生物机械实验室利用滑移式电荷泵稳压增流技术提升摩擦纳米发电机性能
清华新闻网5月25日电万物互联的物联网时代已经到来,各种分布式传感器、可穿戴设备愈加普及,长期稳定的电能供给问题成为制约产业发展的关键瓶颈。作为一种高效的低频动能收集技术,摩擦纳米发电机(TriboelectricNanogenerator,简称TENG)被认为是一种环境友好、极具潜力的分布式能源解 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20软件学院学生在数据管理国际会议SIGMOD程序竞赛中喜获佳绩
清华新闻网5月21日电5月17日,数据管理领域国际顶级学术会议ACMSIGMOD程序竞赛结果公布,清华大学软件学院3名研究生梅逸男、王浩宇、赵东明组成的参赛队伍(UKN)获得了第2名的好成绩,带队教师为宋韶旭副教授。本次大会程序竞赛由微软、华为与巨杉数据库赞助,共有27支队伍参加,分别来自清华大学、 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20精仪系欧阳证团队发文报道单细胞精细脂质组学技术
清华新闻网5月18日电5月17日,清华大学精密仪器系质谱研究团队发文报道基于质谱的单细胞脂质组精细结构表征技术,实现了哺乳动物单细胞内脂质的大规模精细结构分析,解决了单细胞质谱领域长期面临的关键技术挑战。基于单细胞内多种类型脂质异构体的鉴定与相对定量,该团队实现了野生型非小细胞肺癌(HCC827)细 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20朱听等在《环境科学与技术》上报道雾霾微生物组分
清华朱听等在《环境科学与技术》上报道雾霾的微生物组分 清华新闻网2月21日电日前,清华大学生命学院朱听研究员课题组在权威环境学杂志《环境科学与技术》上发表了题为《严重雾霾天气中北京PM2.5与PM10污染物中的可吸入微生物》(InhalablemicroorganismsinBeijing'sPM ...清华大学通知公告 本站小编 Free考研考试 2021-12-20