基于声道频谱参数的语种识别
邵玉斌, 刘晶, 龙华, 杜庆治, 李一民昆明理工大学 信息工程与自动化学院, 昆明 650500
收稿日期:
2020-11-09发布日期:
2021-06-23作者简介:
邵玉斌(1970-),男,教授,硕士生导师,E-mail:shaoyubin@kust.edu.cn.基金资助:
国家自然科学基金项目(61761025)Language Identification Based on Vocal Tract Spectrum Parameters
SHAO Yu-bin, LIU Jing, LONG Hua, DU Qing-zhi, LI Yi-minFaculty of Information Engineering and Automation, Kunming University of Science and Technology, Kunming 650500, China
Received:
2020-11-09Published:
2021-06-23摘要/Abstract
摘要: 针对低信噪比下语种识别正确率低的问题,提出了一种声道冲激响应频谱参数和Teager能量算子倒谱参数融合的识别方法.根据语音中不同特征信息量分布特性,首先在特征提取前端引入低通滤波器滤除信号高频部分,并采用重采样方法降低采样率,再基于信号频谱提取声道冲激响应频谱参数,然后融合Teager能量算子倒谱参数,最后通过高斯混合通用背景模型进行语种识别验证.不同信噪比条件下性能测试表明,所提方法相对于基于单一的梅尔频率倒谱系数特征、单一的伽玛通频率倒谱系数特征和基于对数梅尔尺度滤波器组能量特征,在低信噪比下提升约15 dB,显著提高了识别正确率.
中图分类号:
TN912.3
引用本文
邵玉斌, 刘晶, 龙华, 杜庆治, 李一民. 基于声道频谱参数的语种识别[J]. 北京邮电大学学报, 2021, 44(3): 112-119.
SHAO Yu-bin, LIU Jing, LONG Hua, DU Qing-zhi, LI Yi-min. Language Identification Based on Vocal Tract Spectrum Parameters[J]. Journal of Beijing University of Posts and Telecommunications, 2021, 44(3): 112-119.
PDF全文下载地址:
https://journal.bupt.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4800