本发明属于模式识别领域,是一种针对运动想象脑电信号(eeg),利用两类信号方差比的可分性,剔除不相关通道来提取区域内通道信号的特征及分类的方法。
背景技术:
脑机接口技术(bci)是一种不依赖于人体神经和肌肉组织的正常传输通路,而直接进行人脑与外界之间信息交流的人机交互系统,对于活动能力确实患者的能力恢复和功能训练具有重要意义,可以为意识障碍和中风患者的康复提供很大的帮助,患者可以通过该技术实现机械设备的控制,完成所需的动作。
基于运动想象的bci是研究最为广泛的一类,运动想象型bci通过捕捉和识别不同运动想象任务下的eeg信号来实现大脑与外界的信息交换和控制。然而,eeg信号具有非平稳噪声影响较大、个体差异性大、信噪比低等特点,因此如何从eeg信号中提取出能有效识别运动任务的特征,对bci系统的性能至关重要。
有效的判别运动想象eeg信号通常需要三个步骤:预处理、特征提取、分类器分类。而特征提取往往是最重要的环节,提取的特征好坏直接决定了分类的效果,因此如何提取有利分类的特征是研究的重要课题。
共同空间模式(csp)是一种针对两分类任务的空域滤波特征提取算法,用于从多通道eeg信号中提取有区分度的相关特征。算法的基本原理是利用矩阵的对角化,找到一组最优空间滤波器进行投影,使得两类信号的方差值差异最大化,从而得到具有较高区分度的特征向量。然而传统csp方法也有对噪声敏感以及多通道分析等局限性,因此学者们提出了许多改进算法。当训练样本过少时,样本协方差矩阵可能会较为嘈杂而影响算法性能。为了提高小样本集中协方差矩阵的鲁棒性,lotte等提出了正则化的csp方法(rcsp),通过在协方差矩阵中加入正则项调整对角阵以改变协方差矩阵来提高鲁棒性。
大多数基于eeg的bci系统往往需要处理多个通道的信号来提高性能,然而即使不同对象在完全相同条件进行实验,每个对象的活跃区域也并非一致,且多通道的eeg中也含有与运动想象不相关的冗余信息或较为嘈杂的信号,同时eeg信号个体化差异大的特点也体现在不同对象的活跃区域,于是各种各样的通道选择方法被相继提出。
有学者根据神经生理学知识来选择通道,基于运动想象的bci系统往往使用记录了运动想象重要特征的c3、c4、cz通道。然而如果仅对c3、c4、cz这三个活跃度较高的通道进行处理,也会忽略其它通道的信息,同时对于某些必须通道数量的选取没有明确认识,因此如何选取对识别运动想象有利的通道尤为重要。m.arvaneh等提出了稀疏csp(scsp),不同于选择全部通道的传统csp,scsp使用稀疏的csp滤波系数,通过l1/l2范数来选择区分度高的通道。li等提出了基于通道分数的通道选择方法,而通道分数是根据从csp投影矩阵中每个通道的范数比进行排列,从降序的通道分数中选择最具有区分度的通道。das等提出了一种基于有效值和z值的选择方法(ecsp),该方法不仅通过两类间的关系选择区分度高的通道,同时使用z-score来去除较为嘈杂的部分。park等提出了一种由若干通道组成的区域内特征的局部区域csp方法(lrcsp),基于给定的若干个通道组成的“局部区域”,分别用csp计算这些区域的特征,然后根据方差比可分性准则选取区分度较高的区域。然而,lrcsp定义了若干个局部区域,对于个体性差异大的脑电信号而言,并不能确定固定区域的范围和通道选择。为了确切得到每个对象的最佳通道以减少冗余信息,本发明提出了一种寻找最优区域通道的策略。
技术实现要素:
针对csp的通道选择问题,本发明提出了一种基于区域通道选择的特征提取方法,称作最优区域共空间模式(orcsp),并基于此完成运动想象脑电信号分类方法。
本发明包括以下步骤:
步骤(1):多通道脑电信号采集并进行预处理。
采集受试者的多通道运动想象脑点信号;接着利用带通滤波器对脑电信号进行8~35hz的低通滤波,用于脑电信号特征提取。
步骤(2):根据通道的欧氏距离选择通道附近的n个通道组成局部区域。
步骤(3):对这若干个区域的脑电信号分别用csp进行滤波,得到若干区域的方差比。
步骤(4):根据csp的可分性判据,最大方差比与最小方差比差值越大对应的特征为区分度越大,所以选择选择最大方差比与最小方差比差值最大的区域为选定的区域。
步骤(5):对区域内通道数目n进行交叉验证,得到区分度最大的最优区域。
步骤(6):将得到的最优区域进行csp算法滤波,取滤波后的3个最大和最小特征向量组成维数为6的特征空间,将训练集特征输入svm分类器训练分类模型后,对测试集特征进行分类得到测试结果。
本发明的有益效果:传统的共空间模式并未在特征提取前剔除较为嘈杂的不相关通道,根据神经生理学知识,运动想象通常在某些通道较为活跃,而其它通道可能包含许多眼电、心电等伪迹,这会影响特征的性能,所以本发明通过移除不相关的嘈杂通道提高了bci的性能;同时减少了通道数量以及校验运行时间,为用户提供了便利。
附图说明
图1为本发明方法的流程图;
图2(a)为受试a1两种算法的空间滤波及通道权重;
图2(b)为受试a5两种算法的空间滤波及通道权重;
图3(a)为受试a1不同参数下n的测试准确率变化;
图3(b)为受试a5不同参数下n的测试准确率变化。
具体实施方式
下面结合附图详细描述本发明基于最优区域共空间模式的运动想象脑电信号分类,如图1,本发明方法的实施主要包括6个步骤:(1)采集多通道脑电信号及预处理,(2)根据通道欧氏距离得到局部区域,(3)对若干局部局域进行共空间模式特征提取,(4)选择最大方差比的区域,(5)对区域内通道个数交叉验证寻优,(6)将提取的最优区域特征输入进分类器分类得到结果。
下面逐一对各步骤进行详细说明。
步骤(1):本实施例选用bci竞赛公开数据,数据按照以下方式进行采集。datasetiva:数据包含五位健康的受试者的脑电信号。受试者坐在舒适的椅子上进行实验,数据包括没有反馈的四个阶段。在视觉提示后的3.5秒后受试者进行左手、右手和右脚的运动想象,每次实验信号均使用118个电极进行记录,电极位置采用国际10/20系统。每位受试者进行每类140次共280次实验,包括一份训练集和测试集。其中168、224、84、56、28个样本分别组成训练集,剩余部分组成测试集。datasetiia:数据集包含九位健康的受试者的脑电信号,每位受试者执行四类运动想象任务:左手、右手、右脚还有舌头,每次实验持续4秒。所有实验均使用22个电极记录,电极位置采用国际10/20系统。训练集和测试集分别包含288组实验数据,本实验只选择其中的左手和右手的eeg信号进行测试,训练集和测试集都包含72组实验。
数据预处理:对所有的数据集进行相同的预处理步骤。每位受试者分别选择在视觉提示后的2s时间窗内提取受试者的运动想象脑电信号数据,然后利用5阶的巴特沃斯滤波器对数据进行8~30hz的带通滤波处理以滤除不相关的低频噪声。
步骤(2):根据通道的欧氏距离选择通道附近的n个通道组成局部区域。具体是:考虑一次实验中k个通道时空脑电信号矩阵
dis(vk,vi)=||vk-vi||(1)
其中k,i=1,2,…,k,vk和vi分别第k,i通道在空间中的坐标向量,即通道在空间中的位置信息。此时dis(vk,vi)是一个k×k的矩阵。对于通道k选择距离最小的前n个通道,将这n个通道组合获得通道k局部区域的脑电信号,即
步骤(3):对这k个区域的脑电信号分别用csp算法进行滤波,得到k个区域两类信号的的方差比。
具体是:首先计算k个区域内每次脑电信号的协方差
其中t代表实验次数,(·)t表示矩阵转置,trace(·)表示矩阵对角线元素之和。则局部区域内c类信号的平均协方差矩阵
其中|ic|表示属于c类脑电信号的实验次数。对区域内c类脑电信号用csp算法进行滤波得到滤波器w(k,n),则滤波后的每类平均方差表示为
步骤(4):根据csp算法原理,选择最大方差比与最小方差比差值最大的区域为选定的区域,具体为:
csp算法目的是滤波器投影后信号的方差比最大或最小。则对应满足最大或最小方差比的滤波器
对应得到的滤波器的最大和最小的方差比比值
对于这k个区域,比值差越大区域对应方差比越大,也就意味着两类信号方差越大,所以选择具有最大的差值的区域作为最优区域,max(·)表示最大值。
k*则为选取的最优区域的中心通道,
其中
步骤(5):区域内通道个数即参数n也是影响特征性能的重要因素,为了得到合适的区域通道个数,将训练集数据采用选用5折交叉验证选取最佳的区域内通道数,最后得到最大方差比的区域特征。
步骤(6):将得到的最优区域脑电信号进行csp算法滤波,滤波后取前3个最大和最小特征值组成维数为6的特征空间。将训练集特征输入svm分类器训练分类模型后,对测试集特征进行分类得到测试结果。
为验证本发明在脑电信号特征提取及分类研究中的真实分类性能,实验部分将本发明与rcsp、scsp以及lrcsp等方法在bci竞赛ivdataset2a以及bci竞赛iiidatasetiva的数据进行性能比较,通过测试分类精度来衡量本发明在脑电信号分类领域的可行性。
表1给出了所提方法在bcicompetitioniiidatasetiva数据集上的测试结果。从表1可以看出,本发明在5位受试者的数据集上都取得最高准确率,其中本发明方法中括号内第一个值为选择的中心通道,第二个值为其区域内通道的个数。受试a1的算法准确率提升较多,说明a1的运动想象区域权重更强,在运动想象时区域内信号更具有区分性。对于a2这种训练集较多的对象,每个算法准确率都接近100%,说明在协方差矩阵可靠的情况下两类信号区分度明显。a3是五个受试者中效果最差的,且区域内通道数最多,这可能说明对象本身信号较为复杂,两类方差较小。对于a4、a5这种训练集较小情况,准确率分别达到了91.07%和93.65%,这也验证了本发明在小样本集上的可行性。orcsp算法平均准确率高于第二名3.7%,并针对不同对象给出了区分度最大的区域,降低了通道数量,为在线测试提供了便利。
表1.bcicompetitioniiidatasetiva数据集上5位受试者的分类准确率(%)比较
图2(a)和图(b)分别为受试者a1和a5两种算法得到的空间滤波和各通道的权重示例,图中圆点为通道位置,orcsp仅标出了选择区域内通道位置。由图2(a)所示,传统的csp算法得到的滤波器显示比较混乱,从神经生理学角度来看在某些并不期望的位置加权。相反,orcsp算法得到的滤波器选择区域中的通道在两类任务中显示出明显的权重差异,区域位于c3通道附近,这也正是进行运动想象时神经生理学上最活跃的区域,验证了本方法的可行性。在图2(b)中,受试a5的区域则位于c3通道附近上方,但却并没有包括c3通道,说明不同对象间的个体差异性并不能只选择相同的固定通道。由此可以看出,orcsp算法选择的最优区域即是针对不同对象的个体差异自适应选择出两类任务活动中差异最大的区域,对于提取此区域的特征对分类才更有效果。
图3(a)和图(b)分别为受试者a1和a5区域内通道个数n对分类性能的影响。由图中可以看出当通道较少时准确率都较低,方差不够明显。当n增大时,准确率随之上升到最大,接着上下波动,最后接近下降趋势,这是因为当n足够大时包含了非运动想象活跃的通道,使得两类信号差异减小,导致准确率下降,这也说明了选择合适的区域来提取特征是必要的。
通道较多的数据可以使区域划分更为细密,有利于找出差异较大的区域。为了进一步验证本发明的适用性,本发明也在通道较少的bcicompetitionivdatasetiia数据集上进行了实验,表2为该数据集上四种算法取得的准确率。从表2中可以看到本发明除了c5和c6两个受试者,其他受试都取得了最好的成绩,说明对于通道较少的脑电信号,本发明也有不错的适用性。
表2.bcicompetitionivdatasetiia数据集上9位受试者的分类准确率(%)比较
综上,本发明提出了最优区域共空间模式的运动想象脑电信号分类方法,通过选择区域内两类方差比相差最大的通道来去除不相关通道成分对特征提取带来的影响,不仅提高了特征以及分类性能,更能够减少通道数量以减少校验时间提高校验效率,而且对个体差异性的通道选择提供了参考。