端对端语音识别是一种利用深度学习模型将语音信号直接转变为文字的技术,其中基于注意力机制的模型可以达到较高的识别准确率。但是大多数注意力机制模型需要完整的语音信号,不适用于在线处理语音流。
针对在线语音识别的应用场景,中科院语言声学与内容理解重点实验室的博士生缪浩然与其导师张鹏远研究员、程高峰助理研究员等人针对主流注意力机制处理语音流的性能开展研究,提出了一种单调截断语音流的在线注意力机制和一套高效实时的解码算法。
相关研究成果2020年4月在线发表于学术期刊 IEEE/ACM Transactions on Audio, Speech, and Language Processing 。
研究人员指出,语音识别系统对各时刻语音信号注意力的权重分布呈指数衰减态势,不利于处理长时语音流。他们还发现在线注意力模型训练和推理之间存在差异,从而导致模型性能下降。基于上述问题,研究人员在设计单调截断语音流的在线注意力模型时,优化了注意力权重指数衰减的特性,同时通过离散化注意力权重缩小训练和推理之间的差异。
基于公开的中英文语音识别数据集的实验表明,单调截断语音流的在线注意力模型在处理长时语音流时性能更加稳定。基于注意力机制和联结主义时序分类准则的联合在线解码算法,在线语音识别系统的字错误率略高于离线系统,其解码速度可以达到离线系统的1.5倍。
这种单调截断语音流的在线注意力机制和相关解码算法为端对端语音识别技术在大规模工业在线产品中的应用提供了可行方案。
此项研究得到国家自然科学基金(No.11590774,11590772,11590770)的资助。
在线端对端语音识别框架(图/中科院声学所)
关键词:
端对端语音识别;在线语音识别;注意力机制
参考文献:
MIAO Haoran, CHENG Gaofeng, ZHANG Pengyuan, YAN Yonghong, Online Hybrid CTC/Attention End-to-End Automatic Speech Recognition Architecture. IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 28, pp. 1452-1465, 2020, DOI: 10.1109/TASLP.2020.2987752.
论文链接:
https://ieeexplore.ieee.org/document/9072325
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
在线端对端语音识别研究获得进展
本站小编 Free考研考试/2022-01-02
相关话题/系统 信号 技术 声学 语言
研究人员将双向软判决反馈均衡器用于OFDM通信系统
OFDM(orthogonal frequency-division multiplexing)技术可以有效对抗信道的多径效应,但易受多普勒效应影响。在多普勒扩展较大的信道下,OFDM系统子载波间的正交性会被破坏,从而产生子载波间干扰。这将严重影响符号检测和后续的信道译码效果,增大系统的误码率。 ...中科院声学研究所 本站小编 Free考研考试 2022-01-02一种利用块稀疏贝叶斯学习的浅海宽带信号模态提取方法
宽带信号的模态提取包含水平波数和模态深度函数的估计,是浅海声学中一项经典的研究课题。传统方法通常需要以下三者之一:海洋环境的先验信息、大孔径的接收阵列或移动声源。 近期,中科院声学所声场声信息国家重点实验室的牛海强、李整林、张仁和、宫在晓、王海斌等人联合美国Scripps海洋研究所的研究人员,合作 ...中科院声学研究所 本站小编 Free考研考试 2022-01-02前沿信息技术在生物医学大数据中的应用及展望
郑广勇,1,曾涛1,李亦学,1,2,3,41.中国科学院上海营养与健康研究所,中国科学院计算生物学重点实验室,生物医学大数据中心,上海2000312.广州国家实验室,广州5103203.国科大杭州高等研究院,中国科学院大学,杭州3100134.复旦大学遗传与发育协同创新中心,上海200438Appl ...中科院遗传与发育生物学研究所 本站小编 Free考研考试 2022-01-01GSA-Human:人类遗传资源数据管理的公共系统
张思思,1,2,陈旭,1,2,陈婷婷,1,2,朱军伟1,2,唐碧霞1,2,王安可1,2,董丽莉1,2,张哲文1,2,孙艳玲1,2,俞彩霞1,2,翟爽1,2,孙玉彬1,2,陈焕新1,2,杜政霖1,2,3,肖景发1,2,3,章张1,2,3,鲍一明1,2,3,王彦青1,2,赵文明1,2,31.国家生物信息 ...中科院遗传与发育生物学研究所 本站小编 Free考研考试 2022-01-01细菌Cpx信号转导系统的功能及调控机制研究进展
吴丽雯,,曾洁,薛云新,赵西林,厦门大学公共卫生学院,分子疫苗学和分子诊断学国家重点实验室,厦门361102ProgressonthefunctionandregulatorymechanismsofbacterialCpxsignaltransductionsystemLiwenWu,,JieZe ...中科院遗传与发育生物学研究所 本站小编 Free考研考试 2022-01-01细胞自噬基因Atg6在涡虫中枢神经系统再生中的功能研究
马克学,,李睿,郭芳莹,宋鸽鸽,吴萌,陈广文,,刘德增河南师范大学生命科学学院,新乡453007Functionalanalysisofautophagy-relatedgeneAtg6inplanariancentralnervoussystemregenerationKexueMa,,RuiLi ...中科院遗传与发育生物学研究所 本站小编 Free考研考试 2022-01-01miR-191靶向BDNF基因通过激活PI3K/AKT信号通路促进猪未成熟支持细胞增殖
唐湘薇,,楚丹,颜赛娜,尹艳飞,卞桥,翁波,陈斌,冉茂良湖南农业大学动物科学技术学院,畜禽遗传改良湖南省重点实验室,长沙410128MiR-191promotestheporcineimmatureSertolicellproliferationbytargetingtheBDNFgenethrou ...中科院遗传与发育生物学研究所 本站小编 Free考研考试 2022-01-01遗传修饰技术在绵羊分子设计育种中的应用
王海涛,1,2,李亭亭3,黄勋1,2,马润林,1,2,4,刘秋月,11.中国科学院种子创新研究院,北京1001012.中国科学院遗传与发育生物学研究所,分子发育生物学国家重点实验室,北京1001013.浙江农林大学,杭州3113004.中国科学院大学,北京100049Applicationofgen ...中科院遗传与发育生物学研究所 本站小编 Free考研考试 2022-01-01造血干细胞发育过程中的信号通路调控
张春霞1,2,刘峰,11.中国科学院动物研究所,膜生物学国家重点实验室,北京1001012.波士顿儿童医院,波士顿02115RegulatorysignalingpathwaysinhematopoieticstemcelldevelopmentChunxiaZhang1,2,FengLiu,11. ...中科院遗传与发育生物学研究所 本站小编 Free考研考试 2022-01-01单细胞基因组测序技术新进展及其在生物医学中的应用
王卓,1,申笑涵1,施奇惠,11复旦大学生物医学研究院,上海201100Advancesinsingle-cellwholegenomesequencingtechnologyanditsapplicationinbiomedicineWangZhuo,1,ShenXiaohan1,ShiQihui ...中科院遗传与发育生物学研究所 本站小编 Free考研考试 2022-01-01