东北大学 机械工程与自动化学院,辽宁 沈阳 110819
收稿日期: 2015-04-08
基金项目: 国家自然科学基金资助项目(51405073); 教育部高等学校博士学科点专项科研基金资助项目(20120042120023; 20130042120027); 辽宁省高等学校创新团队项目(LT2014006).
作者简介: 刘冲(1980-),男,辽宁沈阳人,东北大学讲师,博士; 王宏(1960-),女,辽宁沈阳人,东北大学教授,博士生导师.
摘要: 研究了基于运动想象脑电信号对大脑的想象运动状态进行分类识别的问题.根据事件相关同步和事件相关去同步现象识别出被试的想象运动状态,通过频带能量特征提取方法获得了想象左右手运动时的脑电信号特征,使用最小二乘支持向量机对提取到的频带能量特征进行分类.结果表明,使用最小二乘支持向量机可以对运动想象脑电信号的频带能量特征进行有效分类,分类正确率达到92%,其分类效果与使用标准支持向量机相当,但在计算速度上更有优势.
关键词: 脑电信号运动想象频带能量最小二乘支持向量机
EEG Classification Based on Least Squares Support Vector Machine
LIU Chong, YU Qing-wen, LU Zhi-guo,WANG Hong
School of Mechanical Engineering & Automation, Northeastern University, Shenyang 110819, China.
Corresponding author: LIU Chong, E-mail: congliu@me.neu.edu.cn
Abstract: The classification of mental states based on motor imagery(MI) electroencephalograph(EEG) signal was investigated. All the states were classified according to the phenomenon of event-related synchronization and event-related desynchronization. The band power of the MI EEG signal was extracted as the input feature and then classified by using LS-SVM. The final classification accuracy is 92%, which shows that LS-SVM performs well for the classification of the band power feature of MI EEG signal. And compared to the standard SVM, the performance of LS-SVM is as good as that of the standard SVM, but has some advantage in computing time.
Key words: EEG(electroencephalograph)motor imageryband powerleast squaresupport vector machine(SVM) 根据脑电信号表现出来的特征,往往可以判断被试的思维状态,例如当被试进行想象左右手抬起运动时,在大脑的运动相关皮层区域会产生与想象动作相关的脑电信号能量增加和减少的现象,即事件相关同步/去同步(event-related synchronization/ desynchronization,ERS/ERD)现象[1],基于这些现象可以使用脑电信号来对其他外部设备进行控制.能够实现脑电信号的采集、处理以及分析并输出控制命令的系统称为脑-机接口(brain-computer interface,BCI)[2, 3].而建立一种可用且可靠的BCI系统则需要有精确和有效的分类算法来支撑[4],这也是目前BCI研究者广泛关注的问题.
支持向量机(support vector machine,SVM)是20世纪90年代兴起的一种分类方法,这一方法兼顾了经验风险以及结构风险的最小化,使其在处理小样本训练数据时能够获得较好的效果.因此,在脑电信号特征模式识别中获得了广泛的应用.而在BCI分类算法研究中,既要考虑分类识别的正确率,又要考虑算法的实时性能,算法过于复杂,则往往实时性较差,不适合实时系统的开发.由于标准SVM算法在实现过程中需要解凸二次优化问题,算法复杂度相对比较高,而最小二乘支持向量机(LS-SVM)在求解过程中则将标准SVM中的二次优化问题转化为一个线性方程组的求解问题,有效降低了计算的复杂度,且具有良好的泛化能力[5].因此,本文对如何使用LS-SVM对脑电信号特征分类进行了研究,研究应用LS-SVM来对运动想象脑电信号特征进行分类,并对分类的效果进行评估.研究结果有利于LS-SVM在实时系统开发方面的应用,有利于BCI实时系统的开发.
1 数据介绍为了验证LS-SVM对脑电信号的分类效果,本文选用2005年的BCI竞赛数据中的数据集I来进行分析.该数据由德国Tüebingen大学提供,用于为全世界的BCI研究者提供统一的数据平台来对各自提出的算法效果进行对比分析.
该数据集包含训练数据集和测试数据集两部分,其中训练数据集包括278次任务实验的数据,测试数据包括100次任务实验的数据.在训练数据集的278次任务中有139次为想象左手小手指运动(类别“1”)的实验,另外139次为想象舌头运动(类别“-1”)的实验.使用该数据集进行分析的目的就是通过对训练数据集的分析建立分类模型,并使用该模型对包含100次未知想象实验类别的测试数据集进行分类,通过分类结果来评估算法的优劣.实验采用64导电极进行测量,脑电信号的采样率为1 000 Hz,为了避免干扰,仅截取被试在进行想象任务时的3 s数据进行离线分析.
2 特征提取2.1 信号的重采样这个实验主要利用的是ERS/ERD现象,该现象的特点是,当被试在进行想象单侧肢体运动时,在大脑对侧的运动感觉区的μ节律(8~13 Hz)和β节律(16~24 Hz)能量会减小,而同侧的运动感觉区的μ节律和β节律能量会增大[1].可以看到,实际上所需要的信号频率都在30Hz以下,因此,可以通过对信号进行重新采样的办法来减少数据量,这样既可以降低计算负担又不会影响分析结果.重新采样的具体过程为对原始数据每隔10个数据点保留1个数据[4].这样,对训练数据集和测试数据集进行重新采样后,既不影响分析效果,同时也使数据量得到大幅的减少.
2.2 频带能量特征针对以上ERS/ERD现象的特点,本文选择提取脑电信号中8~30 Hz(涵盖μ节律和β节律)处的频带能量作为特征.首先使用5阶Butterworth滤波器对数据进行滤波,然后按照式(1)进行频带能量特征提取.
其中:vijk为第i次实验第j个采集导联处的第k个脑电采样点电压值;bij为求得的频带能量;n为在此处采集的脑电数据样本数.
为了减少不同时段采集脑电信号时可能对被试思维状态造成的影响,本文对上述频带能量特征进行了归一化处理,其具体过程如式(2)所示:
其中:μj为所有实验在第j个采集导联处频带能量特征的平均值;std(bj)为所有实验在第j个采集导联处频带能量特征的标准差.
图 1和图 2所示为两个类别的平均频带能量特征和归一化后的频带能量特征.从图中可以看出,两个类别的频带能量特征在归一化后的分布区别比较明显,更加适合用于后期分类处理.
图1(Figure 1)
图1 平均频带能量特征 Fig. 1 Mean band power of EEG |
图2(Figure 2)
图2 归一化后的频带能量特征 Fig. 2 Normalized band power of EEG |
3 最小二乘支持向量机最小二乘支持向量机由Suykens等首先提出.通过把标准SVM的学习问题转化为解线性方程组问题,简化了计算过程,缩短了计算时间.
设分类面的方程为x·w+b=0,则在d维空间中,对线性可分的样本集(xi,yi),i=1,…,n,xi∈Rd,yi∈{+1,-1},LS-SVM算法需要分类面满足如下优化问题:
其中: i=1,…,n;ei为误差项;w为权值;b为偏移量;γ为误差惩罚因子,即综合考虑最少错分样本和最大分类间隔;φ(·)是一种能够将输入空间映射为高维空间的非线性变换.
使用Lagrange方法求解上述优化问题,则可以得到
其中,αi是第i个Lagrange乘子.
分别对w,ei,b以及αi求偏导数并令其为零,可得
由式(5)可以将优化问题变为解决如下线性方程:
其中:Y=[y1,y2,…,yn];I=[1,1,…,1];α=[α1,α2,…,αn];Ωij=ψ(xi,xj)=φ(xi)φ(xj)为核函数,选择不同的核函数可以构造不同的LS-SVM分类器.由于径向基核函数在生物医学信号处理方面是一种理想核函数,因此,本文使用径向基核函数来设计分类器,径向基核函数如式(7)所示:
其中σ为核函数参数,是LS-SVM的一个重要控制参数,对其选择的优劣直接影响建模时高维映射的效果.
这样,通过求解上述线性方程组,即可以求出对应的b和α,并进而可以解决式(3)所示的优化问题,求得最优分类面.
4 结果及分析4.1 分类结果1) 分类正确率.在进行分类之前,需要确定惩罚因子γ和径向基核函数中参数σ的值,这两个参数的值对分类效果会产生很大的影响.在本文中,这两个参数是通过对训练数据集采用模拟退火算法并结合 “留一法”进行交叉验证得到的,整个过程通过LS-SVMlab工具箱实现[6].图 3为对应100次测试数据集中类别“1”和类别“-1”时分类器对相应实验数据的分类输出决策值.很显然,那些属于类别“1”但分类输出决策值在0以下以及属于类别“-1”但分类输出决策值却在0以上的分类结果是错误的,可以从图可以得出使用LS-SVM分类器对测试数据集的频带能量特征的分类正确率为92%.
图3(Figure 3)
图3 LS-SVM分类器输出决策值 Fig. 3 Output value of LS-SVM classifier |
2) ROC曲线下面积.受试者操作特性(receiver operating characteristic,ROC)曲线是算法性能的二维直观描述,具有直观性和可理解性,能够有效克服分类准确度等评价指标在数据样本类别分布不均或者分类错误代价分布不均情况下评估效果不佳的缺点[7].ROC曲线下面积指标比正确率更适合作为模式识别性能的评价标准.为了更好地评价分类效果,本文结合ROC曲线来对分类器进行评价.图 4是利用分类器的输出产生的ROC曲线.
图4(Figure 4)
图4 LS-SVM输出的ROC曲线 Fig. 4 ROC curve of LS-SVM output |
从图中可以看到,使用LS-SVM分类器进行分类的ROC曲线比较靠近左上角,曲线下面积也比较大,证明LS-SVM分类器对该类数据具有很好的分类效果.
4.2 结果分析表 1为使用该数据集竞赛时的最佳结果与本文方法的结果,可见,本文所使用方法的分类正确率比竞赛结果略有提高.
表1(Table 1)
表1 本文分类结果与竞赛最佳结果[8]的对比Table 1 The best classification result of BCI competition and classification result of the method proposed
| 表1 本文分类结果与竞赛最佳结果[8]的对比 Table 1 The best classification result of BCI competition and classification result of the method proposed |
为了进一步分析LS-SVM分类器的性能及效率,本文分别将上述EEG频带能量特征在使用标准SVM与LS-SVM分类时的结果进行对比分析,表 2为二者的分类效果以及训练分类器的时间.其中,两个分类器均使用径向基核函数,且都通过对训练数据集特征的交叉验证选择出最佳参数组合.分类器的训练时间是在CPU为Intel Core i5-3470,内存为4 GB的计算机上运行Matlab(版本R2013a)所获得.
表2(Table 2)
表2 两种分类器的分类效果对比Table 2 Classification results of the SVM and LS-SVM
| 表2 两种分类器的分类效果对比 Table 2 Classification results of the SVM and LS-SVM |
从表中数据可以看出两种分类器的分类效果相当,分类正确率相同,但标准SVM分类器分类结果的ROC曲线下面积比LS-SVM略大,说明其分类效果要略好于LS-SVM,但LS-SVM在训练分类器时耗费的计算时间要比标准SVM短,这是由于LS-SVM用等式约束取代了标准SVM的二次约束问题,因此,在计算速度方面更具优势.
5 结论1) 本文提出的频带能量特征提取方法能够提取出大脑在进行运动想象过程中进行不同想象任务时脑电信号的区别,为后续分类器的分类提供依据.
2) 使用标准SVM和LS-SVM分类器都可有效分类出不同运动想象任务下脑电信号的频带能量特征,对本文所使用实验数据都可以获得92%的分类正确率.
3) 通过对比分析可以看出,在对本文所使用的实验数据进行分析时,LS-SVM分类器的分类效果虽然略逊于标准SVM,但其在计算速度方面却更具优势,适合应用在对计算速度要求较高的实时系统中.
参考文献
[1] | Pfurtscheller G, da Silva F H L.Event-related EEG/MEG synchronization and desynchronization:basic principles[J].Clinical Neurophysiology, 1999, 110(11):1842-1857.(2) |
[2] | Akram F, Han S M, Kim T.An efficient word typing P300-BCI system using a modified T9 interface and random forest classifier[J].Computers in Biology and Medicine, 2015, 56(1):30-36.(1) |
[3] | Lee M, Fazli S, Mehnert J, et al.Subject-dependent classification for robust idle state detection using multi-modal neuroimaging and data-fusion techniques in BCI[J].Pattern Recognition, 2015, 125(3):1498-1502.(1) |
[4] | Nguyen T, Khosravi A, Creighton D, et al.EEG signal classification for BCI applications by wavelets and interval type—2 fuzzy logic systems[J].Expert System with Applications, 2015, 42(9):4370-4380.(2) |
[5] | 王志芳,吴清.利用LS-SVM模块化决策系统求解EEG源参数[J].计算机仿真,2009,26(8):204-207. (Wang Zhi-fang, Wu Qing.Solving EEG source parameters with modular decision making system based on LS-SVM[J].Computer Simulation, 2009, 26(8):204-207.)(1) |
[6] | Brabanter K D, Karsmakers P, Ojeda F, et al.Least squares- support vector machines[EB/OL].(2010-08-16)[2015-04-08].http://www.esat.kuleuven.be/sista/lssvmlab/.(1) |
[7] | 万柏坤,薛召军,李佳,等.应用ROC曲线优选模式分类算法[J].自然科学进展,2006,16(11):1511-1516. (Wan Bai-kun, Xue Zhao-jun, Li Jia, et al.Application of ROC curve to optimize pattern classification algorithm[J].Progress in Natural Science, 2006, 16(11):1511-1516.)(1) |
[8] | Wei Q G, Meng F, Wang Y J, et al.Feature combination for classifying single-trial ECoG during motor imagery of different sessions[J].Progress in Natural Science, 2007, 17(7):851-858.(1) |
本文献在全文中的定位:
... 事件相关同步/去同步(event-related synchronization/ desynchronization,ERS/ERD)现象[1],基于这些现象可以使用脑电信号来对其他外部设备进行控制.能够实 ...
... 量会减小,而同侧的运动感觉区的μ节律和β节律能量会增大[1].可以看到,实际上所需要的信号频率都在30Hz以下,因此,可以通过对 ...
1
本文献在全文中的定位:
... 以及分析并输出控制命令的系统称为脑-机接口(brain-computer interface,BCI)[2, 3].而建立一种可用且可靠的BCI系统则 ...
1
本文献在全文中的定位:
... 脑-机接口(brain-computer interface,BCI)[2, 3].而建立一种可用且可靠的BCI系统则需要有精确和有效的分类算法来支 ...
2
本文献在全文中的定位:
... 而建立一种可用且可靠的BCI系统则需要有精确和有效的分类算法来支撑[4],这也是目前BCI研究者广泛关注的问题. ...
... 分析结果.重新采样的具体过程为对原始数据每隔10个数据点保留1个数据[4].这样,对训练数据集和测试数据集进行重新采样后,既不影响分析效 ...
1
本文献在全文中的定位:
... 方程组的求解问题,有效降低了计算的复杂度,且具有良好的泛化能力[5].因此,本文对如何使用LS-SVM对脑电信号特征分类进行了研究,研究应 ...
1
本文献在全文中的定位:
... 结合 “留一法”进行交叉验证得到的,整个过程通过LS-SVMlab工具箱实现[6]. ...
1
本文献在全文中的定位:
... 本类别分布不均或者分类错误代价分布不均情况下评估效果不佳的缺点[7].ROC曲线下面积指标比正确率更适合作为模式识别性能的评价标准.为了 ...
1
本文献在全文中的定位:
... 本文分类结果与竞赛最佳结果[8]的对 ...