删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于多特征融合的SVM声学场景分类算法研究

本站小编 Free考研考试/2021-12-21

本文二维码信息
二维码(扫一下试试看!)
基于多特征融合的SVM声学场景分类算法研究
Support Vector Machine for Acoustic Scene Classification Algorithm Research Based on Multi-Features Fusion
投稿时间:2018-04-17
DOI:10.15918/j.tbit1001-0645.2018.171
中文关键词:声学场景分类支持向量机参数寻优特征融合
English Keywords:acoustic scene classificationsupport vector machineparameter optimizationfeature fusion
基金项目:国家自然科学基金资助项目(61631016,61901421);中央高校基本科研业务费专项基金(CUC19ZD003)
作者单位
赵薇中国传媒大学 信息与通信工程学院, 北京 100024
靳聪中国传媒大学 信息与通信工程学院, 北京 100024
涂中文中国传媒大学 播音主持艺术学院, 北京 100024
SRIDHAR Krishnan加拿大怀雅逊大学 电气和计算机工程系, 多伦多 M5B 2K3, 加拿大
刘杉中国传媒大学 信息与通信工程学院, 北京 100024
摘要点击次数:1090
全文下载次数:427
中文摘要:
针对DCASE2017挑战赛的声场环境数据集,提取梅尔频率倒谱系数(MFCC)、短时能量(SE)、声学事件似然特征(AELF)、静音时间(MT)特征,组成多特征融合矩阵,通过对比多种核函数和寻优算法,最终选取高斯径向基核函数(RK)建立支持向量机(SVM)模型,采用交叉验证(CV)方法进行SVM参数寻优,对15种声学场景进行分类.实验结果表明,杂货店、办公室的分类准确性达到了90%以上,平均分类准确性达到71.11%,远高于挑战赛的基线系统61%的平均分类准确性.
English Summary:
For the sound environment dataset of the DCASE 2017 Challenge, Mel frequency cepstral coefficients (MFCC), short-time energy (SE), acoustic event likelihood features (AELF), and mute time (MT) features were extracted to form a multi-features fusion matrix. Comparing various kernel functions and optimization algorithms, radial basis function kernel (RK) was finally selected to establish the support vector machine (SVM) model, and cross validation (CV) method was utilized to optimize SVM parameters and to classify 15 acoustic scenes. The experimental results show that the classification accuracy of grocery store and office can reach more than 90%, and the average classification accuracy reaches 71.11%, which is much higher than the average classification accuracy of 61% of the baseline system given in the challenge.
查看全文查看/发表评论下载PDF阅读器
相关话题/中国传媒大学 北京 信息 通信工程学院 声学