基于谱熵梅尔积的语音端点检测方法
吴新忠, 夏令祥, 张旭, 周成中国矿业大学 信息与控制工程学院, 江苏 徐州 221116
收稿日期:
2018-09-11出版日期:
2019-04-28发布日期:
2019-04-09作者简介:
吴新忠(1976-),男,副教授,硕士生导师,E-mail:wxzcumt@126.com.基金资助:
"十三五"国家重点研发计划项目(2016YFC0801800);江苏省重点研发计划项目(BE2016046)Voice Activity Detection Method Based on MFPH
WU Xin-zhong, XIA Ling-xiang, ZHANG Xu, ZHOU ChengSchool of Information and Control Engineering, China University of Mining and Technology, Jiangsu Xuzhou 221116, China
Received:
2018-09-11Online:
2019-04-28Published:
2019-04-09摘要/Abstract
摘要: 为了克服传统语音端点检测算法在低信噪比环境下准确率低的问题,提出一种基于谱熵梅尔积(MFPH)的语音端点检测算法.首先,提取带噪语音信号的梅尔频率倒谱系数中的第一维参数MFCC0,将其与谱熵的乘积作为最终区分语音段和背景噪声段的融合特征参数;然后,结合模糊C均值聚类算法和贝叶斯信息准则(BIC)算法对MFPH特征参数门限值进行自适应估计;最后,采用双门限法进行语音端点检测.实验结果证明,与传统方法比较,该方法在-5~15 dB低信噪比环境下的语音端点检测准确率有较大提高.
中图分类号:
TN912.3
引用本文
吴新忠, 夏令祥, 张旭, 周成. 基于谱熵梅尔积的语音端点检测方法[J]. 北京邮电大学学报, 2019, 42(2): 83-89.
WU Xin-zhong, XIA Ling-xiang, ZHANG Xu, ZHOU Cheng. Voice Activity Detection Method Based on MFPH[J]. JOURNAL OF BEIJING UNIVERSITY OF POSTS AND TELECOM, 2019, 42(2): 83-89.
PDF全文下载地址:
https://journal.bupt.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3339