基于瓶颈特征的藏语拉萨话连续语音识别研究
周楠, 赵悦†, 李要嫱, 徐晓娜, 才旺拉姆, 吴立成 中央民族大学信息工程学院, 北京 100081收稿日期:
2017-05-31修回日期:
2017-09-05出版日期:
2018-03-20基金资助:
教育部人文社会科学规划基金(15YJAZH120)和中央民族大学双一流学科建设项目资助Study on Continuous Speech Recognition Based on Bottleneck Features for Lhasa-Tibetan Dialect
ZHOU Nan, ZHAO Yue†, LI Yaoqiang, XU Xiaona, CAIWANG Lamu, WU Licheng School of Information Engineering, Minzu University of China, Beijing 100081Received:
2017-05-31Revised:
2017-09-05Published:
2018-03-20
可视化
0复制本文网址
1. 探讨2016版国际胰瘘研究小组定义和分级系统对胰腺术后患者胰瘘分级的影响.PDF(500KB)
-->
摘要/Abstract
摘要: 基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点, 将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中, 可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明, 瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。
中图分类号:
-->TP391
引用本文
周楠, 赵悦, 李要嫱, 徐晓娜, 才旺拉姆, 吴立成. 基于瓶颈特征的藏语拉萨话连续语音识别研究[J]. 北京大学学报(自然科学版), 2018, 54(2): 249-254.
ZHOU Nan, ZHAO Yue, LI Yaoqiang, XU Xiaona, CAIWANG Lamu, WU Licheng. Study on Continuous Speech Recognition Based on Bottleneck Features for Lhasa-Tibetan Dialect[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2018, 54(2): 249-254.
PDF全文下载地址:
http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3178