面向真实噪声环境的语种识别
邵玉斌,刘晶,龙华,李一民昆明理工大学
收稿日期:
2021-04-01修回日期:
2021-07-08出版日期:
2021-12-28发布日期:
2021-11-16通讯作者:
刘晶E-mail:1505728066@qq.com基金资助:
国家地区自然科学基金Language Identification in Real Noisy Environments
yubin yubinshao,Liu-jing LIUJing, ,Received:
2021-04-01Revised:
2021-07-08Online:
2021-12-28Published:
2021-11-16Contact:
Liu-jing LIUJing E-mail:1505728066@qq.com摘要/Abstract
摘要: 语种识别受真实噪声环境的影响较大,导致识别效果不佳。为了解决真实噪声环境下语种识别的问题,提出一种基于对数灰度语谱图的图像处理方法,根据噪声能量和语音能量在语谱图上的分布规律不同对真实噪声中的声音进行带通滤波,再结合人耳听觉特性得出对数灰度语谱图, 然后提取图像主成分特征作为语种特征,采用 残差神经网络模型进行训练测试。实验结果表明:在 掠夺者战斗机驾驶舱噪声环境下,所提方法的平均识别正确率相对于线性灰度语谱图方法提升了27.5%,在其他一些噪声环境下的平均识别正确率也有相应提升。
中图分类号:
TN 912.3
引用本文
邵玉斌 刘晶 龙华 李一民. 面向真实噪声环境的语种识别[J]. 北京邮电大学学报, 2021, 44(06): 140-148.
yubin yubinshao Liu-jing LIUJing. Language Identification in Real Noisy Environments[J]. Journal of Beijing University of Posts and Telecommunications, 2021, 44(06): 140-148.
PDF全文下载地址:
https://journal.bupt.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4853