删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于降噪自动编码器的语种特征补偿方法

本站小编 Free考研考试/2022-01-01

苗晓晓1,2,徐及1,2,王剑1
1(中国科学院声学研究所语言声学与内容理解重点实验室 北京 100190); 2(中国科学院大学 北京 100190) (miaoxiaoxiao@hccl.ioa.ac.cn)
出版日期: 2019-05-01


基金资助:国家重点研发计划项目(2016YFB0801203,2016YFB0801200)

Denoising Autoencoder-Based Language Feature Compensation

Miao Xiaoxiao1,2, Xu Ji1,2, Wang Jian1
1(Key Laboratory of Speech Acoustics and Content Understanding, Institute of Acoustics, Chinese Academy of Sciences, Beijing 100190); 2(University of Chinese Academy of Sciences, Beijing 100190)
Online: 2019-05-01







摘要/Abstract


摘要: 在语种识别中,当训练语音与测试语音长度失配时,系统的识别性能会出现严重下降.基于降噪自动编码器(denoising auto-encoder, DAE)的方法对不同长度测试语音的语种特征进行补偿,把不同长度的语音特征都映射为固定长度的语音特征,一定程度上解决了长度失配和音素分配不平衡的问题.具体分为4个环节:1)语音信号经过分帧、变换得到底层声学特征;2)提取语音信号的原始i-vector,同时计算其音素向量;3)对原始i-vector和音素向量进行拼接,送入基于DAE的语种特征补偿处理单元得到补偿后的i-vector;4)将补偿后的i-vector和原始i-vector分别送入后端分类器得到2个分数向量,并将其在得分域融合后进行判决.在NIST-LRE07上的实验结果表明:所提出的语种特征补偿算法在各种测试语音时长上的识别性能均有提升.相比传统的语种识别系统,测试语音时长为30 s时性能相对提升3.16%,测试语音时长为10 s时性能相对提升2.90%.相比端到端语种识别系统,测试语音时长为3 s时性能相对提升3.21%.






[1]秦晨光, 王海, 任杰, 郑杰, 袁璐, 赵子鑫. 基于多任务学习的方言语种识别[J]. 计算机研究与发展, 2019, 56(12): 2632-2640.
[2]毛存礼,余正涛,沈韬,高盛祥,郭剑毅,线岩团. 基于深度神经网络的有色金属领域实体识别[J]. 计算机研究与发展, 2015, 52(11): 2451-2459.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3933
相关话题/测试 声学 信号 计算机 北京