基于声学特征的语言情感识别
外文标题:Speech Emotion Recognition Based on Acoustic Features
文献类型:期刊
作者:金琴[1]
机构:中国人民大学数据工程与知识工程教育部重点实验室 北京100872;中国人民大学信息学院 北京100872;中国人民大学信息学院 北京100872
年:2015
期刊名称:计算机科学
卷:42
期:9
页码范围:24-28
增刊:增刊
收录情况:中文核心期刊要目总览
所属部门:信息学院;数据工程与知识工程教育部重点实验室
语言:中文
ISSN:1002-137X
链接地址:http://d.g.wanfangdata.com.cn/Periodical_jsjkx201509005.aspx
DOI:10.11896/j.issn.1002-137X.2015.9.005
人气指数:3
浏览次数:3
基金:北京市自然科学基金; 中国人民大学科学研究基金(中央高校基本科研业务费专项资金)
关键词:语音情感识别;声学特征;特征融合
摘要:语音情感识别是语音处理领域中一个具有挑战性和广泛应用前景的研究课题.探索了语音情感识别中的关键问题之一:生成情感识别的有效的特征表示.从4个角度生成了语音信号中的情感特征表示:(1)低层次的声学特征,包括能量、基频、声音质量、频谱等相关的特征,以及基于这些低层次特征的统计特征;(2)倒谱声学特征根据情感相关的高斯混合模型进行距离转化而得出的特征;(3)声学特征依据声学词典进行转化而得出的特征;(4)声学特征转化为高斯超向量的特征.通过实验比较了各类特征在情感识别上的独立性能,并且尝试了将不同的特征进行融合,最后比较了不同的声学特征在几个不同语言的情感数据集上的效果(包括IEMOCAP英语情感语料库、CASIA汉语情感语料库和Berlin德语情感语料库).在IEMOCAP数据集上,系统的正确识别率达到了71.9%,超越了之前在此数据集上报告的最好结果.
作者其他论文
基于软近邻投票的图像标签相关性计算.李锡荣;许洁萍;薛盛博,等.计算机学报.2014,37(6),1365-1371.
一种基于眼部识别的信息采集系统及其应用.杨刚;吴少辉.2013.
一种基于短信终端的信息查询系统及查询方法.杨刚.2010.
一种基于哼唱的音乐数据库高效查询方法.刘怡;郝云飞;许洁萍,等.2006.
超声换能器.许洁萍;闫俐.2006.