一种基于深度自编码神经网络的脑电信号EEG特征提取方法与流程

文档序号:16136580发布日期:2018-12-01 01:04阅读:278来源:国知局
本发明涉及脑电特征提取和脑电颜色认知
技术领域
,具体涉及一种基于深度自编码神经网络的脑电信号eeg特征提取方法。
背景技术
脑电领域的相关研究可以追溯到20世纪末,poulosm(1999)使用fft提取脑电信号特征,并用lvq神经网络进行身份识别分类;poulosm(2002)使用线性ar模型提取脑电信号特征;mohammadig(2006)使用线性ar模型提取脑电信号特征,利用竞争神经网络进行分类;palaniappanr(2007)使用脑电信号的功率作为特征;htouyama(2009)使用pca对脑电信号进行降维处理,使用降维后的脑电数据作为特征;tangkraingkijp(2009)使用ica提取脑电信号特征;laroccad(2012)使用ar模型提取脑电信号的特征;liews(2015)计算脑电信号的相干性、互相关、振幅均值作为特征;muz(2016)使用模糊熵提取脑电信号的特征;上述的特征提取方法大多都是基于信息处理领域的信号处理算法,例如提取脑电信号中的ar参数、fz-ar参数、功率谱(psd)和模糊熵等,而这些特征提取算法往往需要脑电信号是一个平稳随机信号,而在实际中的脑电信号是非平稳随机信号;同时,在一些特征提取算法中存在模型定阶等问题,例如ar模型等,阶数的确定会影响特征提取的效果,而且阶数的确定大多数是基于人为确定。因此使用传统的特征提取算法来提取eeg的特征具有一定的缺陷。通常采集到的eeg数据是一个多维时间序列集,即由各个头皮电极上的时间序列构成的数据集,因此eeg是一个高维度的数据集,而在选择哪些头皮电极数据来进行研究的问题中,在以往eeg论文的做法中有:(1)将每个头皮电极当做是独立的,对每个头皮电极的数据进行特征提取,最后再对每个头皮电极的实验结果进行平均,但是,这种做法忽略了每个头皮电极之间可能存在互相影响的关系;(2)按照经验或者穷举法来选择组合多个头皮电极,这种做法弥补了方法(1)的缺陷,但是,在实际应用过程中,这种做法所需要的时间远远小于(1),而且凭借经验选择的电极组合,缺乏一定的客观性和科学性。技术实现要素:本发明的目的在于克服现有技术的缺点与不足,提供一种基于深度自编码神经网络的脑电信号eeg特征提取方法,该方法避免了使用ar模型提取脑电信号特征中的阶数确定问题,而且使用深度自编码神经网络所提取的特征在颜色识别方面取得满意的结果,解决了在考虑每个头皮电极之间可能存在互相影响关系的前提下,将高维度eeg信号在应用分类器中的维度问题,同时也研究出了与颜色认知最相关的脑电频段,可应用于脑电身份识别,进一步提高身份识别精度。本发明的目的通过下述技术方案实现:一种基于深度自编码神经网络的脑电信号eeg特征提取方法,包括下述步骤:s1,设计颜色识别的脑电数据采集实验方案;设计一个周期有三张测试图片和三张全黑色的过渡图片,测试图片用时t1,过渡图片用时t2,每个周期中的测试图片分别为红、绿、蓝三原色,且红、绿、蓝三原色出现的顺序随机,则一个周期用时3t1+3t2,每个被试者测试n个周期,共用时n(3t1+3t2);设置过渡图片的目的是为了消除在切换测试图片时产生的视觉残留;s2,脑电数据的采集;被试者静坐在电脑屏幕前,电脑屏幕按照s1的实验方案来显示图片,通过脑电采集设备对被试者在认知图片时产生的脑电信号进行采集,脑电采集设备的采样频率为vhz;s3,脑电数据的预处理;s3.1,剔除与实验无关和损坏的头皮电极,设剔除后的头皮电极数为k;s3.2,利用fir滤波器,从采集的原始脑电信号提取出delta(0.5hz-4hz)、theta(4hz-8hz)、alpha(8hz-14hz)、beta(14hz-30hz)、gamma(30hz-45hz)和all(0.5hz-45hz)这六个频段的脑电数据;s3.3,分别针对s3.2中六个频段的脑电数据做归一化处理,则六个频段的脑电数据归一化后形成k行t1×v列的脑电信号矩阵;s4,建立深度自编码神经网络,并提取脑电信号的信号特征;s4.1,分别从s3.3中各个频段的脑电数据中,提取出每个头皮电极的脑电数据,构建出k个训练集和测试集,用于训练和测试对应头皮电极的深度自编码神经网络;s4.2,构建单个头皮电极的深度自编码神经网络,该深度自编码神经网络的结构如下:(1)输入层:神经元个数为t1×v;(2)编码层:神经元个数随着编码层层数的增加而减小,对输入层的数据进行压缩;(3)解码层:神经元个数随着解码层层数的增加而增大,对最后一个编码层的输出数据进行解压;(4)输出层:神经元个数为t1×v;最后一个编码层和最后一个解码层的激活函数为tanh,具体公式如下:其他编码层和解码层的激活函数为relu,具体公式如下:relu(x)=max(0,x);s4.3,训练深度自编码神经网络;在深度自编码神经网络的训练过程中,深度自编码神经网络的输出等于深度自编码神经网络的输入,即深度自编码神经网络训练的目标是使得网络的输出等于网络的输入;设为深度自编码神经网络中第l层第j个神经元与第l+1层的第i个神经元之间的权重系数,表示第l+1层的第i个神经元的偏置项,n为深度自编码神经网络的总层数,则深度自编码神经网络的参数为:则在m个样本中,上式为深度自编码神经网络的整体代价函数,取代价函数j(w,b)最小值时的w,b作为训练完成的深度自编码神经网络的参数;s4.4,利用训练完成的深度自编码神经网络提取脑电信号的信号特征;设单个头皮电极所对应的深度自编码神经网络的最后一个编码层神经元个数为p;将单个头皮电极所对应的脑电信号输入到对应的深度自编码神经网络,可获得1×p的特征向量,因为在每个样本中有k个头皮电极,所以当经过k个深度自编码神经网络的特征提取后,每个样本可得到一个k×p的特征矩阵;s5,建立三层bp神经网络分类器;bp神经网络分类器的输入节点数为k×p,输出节点数为m,每个输出节点代表m种颜色中的一种;每个样本的标签为1×m的标签矩阵,第i个颜色样本的标签矩阵中第i个元素为1,其余为0;第一层神经元的激活函数relu如下:relu(x)=max(0,x),第二层神经元的激活函数为softmax如下:s6,颜色的识别;s6.1,对于三层bp神经网络分类器,选择70%的样本作为训练集,30%的样本作为测试集;s6.2,进行分类识别验证;三层bp神经网络分类器的输出矩阵的每个数值代表该测试样本属于每种颜色的概率,取概率最大的颜色作为该测试样本的颜色识别结果。本发明与现有技术相比具有以下的有益效果:(1)本发明的自编码神经网络不要求信号是否具有平稳随机的条件,在自编码神经网络通过多次迭代训练,它能习得隐含在信号中的特征,并能在多次压缩和解压缩后还原出于原信号大致一致的eeg信号;避免了使用ar模型提取脑电信号特征中的阶数确定问题,而且使用深度自编码神经网络所提取的特征在颜色识别方面取得满意的结果;(2)本发明对每个电极分别用自编码神经网络进行信号压缩,提取压缩后的信号作为eeg特征,压缩后的eeg信号远小于原始eeg信号,从而减小分类算法的输入维度,而且还把每个头皮电极压缩后的eeg信号全部组合起来,放置到分类器中进行分类,从而解决了在考虑每个头皮电极之间可能存在互相影响关系的前提下,将高维度eeg信号在应用分类器中的维度问题;(3)本发明选择以颜色认知为主题的脑电实验,并研究出了与颜色认知最相关的脑电频段,同时也可应用于脑电身份识别,进一步提高身份识别的精度。附图说明图1为本发明的特征提取方法和颜色识别流程图;图2为本发明颜色识别的脑电数据采集实验方案示意图;图3为本发明的深度自编码神经网络示意图;图4为本发明的三层bp神经网络示意图。具体实施方式下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。如图1~4所示,一种基于深度自编码神经网络的脑电信号eeg特征提取方法,包括下述步骤:步骤一,设计颜色识别的脑电数据采集实验方案;设计一个周期有三张测试图片和三张全黑色的过渡图片,测试图片用时t1,过渡图片用时t2,每个周期中的测试图片分别为红、绿、蓝三原色,且红、绿、蓝三原色出现的顺序随机,则一个周期用时3t1+3t2,每个被试者测试n个周期,共用时n(3t1+3t2);设置过渡图片的目的是为了消除在切换测试图片时产生的视觉残留;具体来说,设一个周期有3张测试图片和3张过渡图片(全黑),测试图片1s,过渡图片0.2s,每个周期中的测试图片为rgb三原色,即红绿蓝三原色,且每张测试图片出现的顺序随机,因此一个周期是3.6s,每个被试者测试200个周期,即720s(12min)。步骤二,脑电数据的采集;被试者静坐在电脑屏幕前,电脑屏幕按照步骤一的实验方案来显示图片,通过脑电采集设备对被试者在认知图片时产生的脑电信号进行采集,脑电采集设备的采样频率为vhz;具体来说,脑电采集设备为brainproduct,brainampmrplus型放大器,采用64导电极帽连续记录脑电;参与实验的被试者个数为9个(5个男性,4个女性),他们的年龄在19岁到22岁之间,均无神经或精神上的疾病史,实验前亦无使用药物。被试者静坐在电脑屏幕前,电脑屏幕按照所设计的颜色识别实验方案显示图片,通过脑电采集设备,对被试者在认知图片时产生的脑电信号进行采集。脑电采集设备的采样频率为500hz。步骤三,脑电数据的预处理;(1)剔除与实验无关和损坏的头皮电极,设剔除后的头皮电极数为k;(2)利用fir滤波器,从采集的原始脑电信号提取出delta(0.5hz-4hz)、theta(4hz-8hz)、alpha(8hz-14hz)、beta(14hz-30hz)、gamma(30hz-45hz)和all(0.5hz-45hz)这六个频段的脑电数据;(3)针对步骤三(2)中六个频段的脑电数据做归一化处理,则六个频段的脑电数据归一化后形成k行t1×v列的脑电信号矩阵;具体来说,剔除与本实验无关和损坏的头皮电极('fp1”fp2”f4''f8”fz”pz”heol”heor”m2”f6'),剔除后的头皮电极数为54;利用fir滤波器,从采集的原始脑电信号提取出delta(0.5hz-4hz)、theta(4hz-8hz)、alpha(8hz-14hz)、beta(14hz-30hz)、gamma(30hz-45hz)、all(0.5hz-45hz),这六个频段的脑电数据。针对每个频段的脑电数据做归一化处理,每个样本归一化后为54行500列的矩阵。步骤四,建立深度自编码神经网络,并提取脑电信号的信号特征;(1)分别从步骤三(3)中各个频段的脑电数据中,提取出每个头皮电极的脑电数据,构建出k个训练集和测试集,用于训练和测试对应头皮电极的深度自编码神经网络;具体来说,从每个样本中提取出每个头皮电极的数据,构建出54个训练集和测试集。(2)构建单个头皮电极的深度自编码神经网络,该深度自编码神经网络的结构如下:输入层:神经元个数为t1×v;编码层:神经元个数随着编码层层数的增加而减小,对输入层的数据进行压缩;解码层:神经元个数随着解码层层数的增加而增大,对最后一个编码层的输出数据进行解压;输出层:神经元个数为t1×v;最后一个编码层和最后一个解码层的激活函数为tanh,具体公式如下:其他编码层和解码层的激活函数为relu,具体公式如下:relu(x)=max(0,x);具体来说,分别对54个头皮电极构建一个深度自编码神经网络。每个深度自编码神经网络的输入节点和输出节点数为500,编码层和解码层的层数为4,最后一层的编码层和最后一层的解码层的激活函数为tanh,其他层的激活函数为relu。(3)训练深度自编码神经网络;在深度自编码神经网络的训练过程中,深度自编码神经网络的输出等于深度自编码神经网络的输入,即深度自编码神经网络训练的目标是使得网络的输出等于网络的输入;具体来说,深度自编码神经网络的输入层节点数为500;设为深度自编码神经网络中第l层第j个神经元与第l+1层的第i个神经元之间的权重系数,表示第l+1层的第i个神经元的偏置项,n为深度自编码神经网络的总层数,可以为9层,则深度自编码神经网络的参数为:则在m个样本(此处的样本是指某一频段的某个头皮电极的训练集中的样本)中,上式为深度自编码神经网络的整体代价函数,取代价函数j(w,b)最小值时的w,b作为训练完成的深度自编码神经网络的参数;(4)利用训练完成的深度自编码神经网络提取脑电信号的信号特征;设单个头皮电极所对应的深度自编码神经网络的最后一个编码层神经元个数为p;将单个头皮电极所对应的脑电信号输入到对应的深度自编码神经网络,可获得1×p的特征向量,因为在每个样本中有k个头皮电极,所以当经过k个深度自编码神经网络的特征提取后,每个样本可得到一个k×p的特征矩阵;具体来说,深度自编码神经网络最后一层编码层的神经元个数为14,则把每个样本中所对应的头皮电极数据输入到对应的深度自编码神经网络,并把对应的深度自编码神经网络的最后一层编码层的输出作为脑电信号的信号特征,最后,每个样本可得到一个54×14的特征矩阵。步骤五,建立三层bp神经网络分类器;bp神经网络分类器的输入节点数为k×p,输出节点数为m,每个输出节点代表m种颜色中的一种;每个样本(此处的样本是指某个频段的某份脑电数据)的标签为1×m的标签矩阵,第i个颜色样本(此处的样本是指某个频段的某份脑电数据)的标签矩阵中第i个元素为1,其余为0;具体来说,bp神经网络分类器的输入节点数为756,输出节点数为3,每个输出节点分别代表红色、绿色和蓝色,每个样本的标签为1×3的标签矩阵;第一层神经元的激活函数relu如下:relu(x)=max(0,x),第二层神经元的激活函数为softmax如下:步骤六,颜色的识别;(1)对于三层bp神经网络分类器,选择70%的样本(此处的样本是指对某个频段的每份脑电数据进行随机采样所得的样本)作为训练集,30%的样本(此处的样本是指对某个频段的每份脑电数据进行随机采样所得的样本)作为测试集;为了使估计结果稳定可靠,实验重复进行多次,在保持数据分布的一致性和不重复选取样本的条件下,随机选取样本构建训练集和测试集,如下表1和表2所示::表1:训练集情况样本个数总占比红色样本126070%绿色样本126070%蓝色样本126070%表2:测试集情况样本个数总占比红色样本54030%绿色样本54030%蓝色样本54030%(2)进行分类识别验证;三层bp神经网络分类器的输出矩阵的每个数值代表该测试样本(此处的样本是指某个频段的某份脑电数据)属于每种颜色的概率,取概率最大的颜色作为该测试样本的颜色识别结果。颜色识别情况如下表所示:redgreenblueall84.39%76.28%56.17%delta76.83%74.61%47.06%theta73.28%72.94%41.72%alpha82.06%86.33%69.22%beta87.06%73.22%63.67%gamma75.17%70.11%33.33%从实验的结果可得,红色识别率最高的频段是beta(14hz-30hz),绿色识别率最高的频段是alpha(8hz-14hz),蓝色识别率最高的频段是alpha(8hz-14hz);即与红色认知最相关的频段为beta(14hz-30hz),与绿色认知最相关的频段为alpha(8hz-14hz),与蓝色认知最相关的频段为alpha(8hz-14hz);自编码神经网络不要求信号是否具有平稳随机的条件,在自编码神经网络通过多次迭代训练,它能习得隐含在信号中的特征,并能在多次压缩和解压缩后还原出于原信号大致一致的eeg信号;避免了使用ar模型提取脑电信号特征中的阶数确定问题,而且使用深度自编码神经网络所提取的特征在颜色识别方面取得满意的结果;对每个电极分别用自编码神经网络进行信号压缩,提取压缩后的信号作为eeg特征,压缩后的eeg信号远小于原始eeg信号,从而减小分类算法的输入维度,而且还把每个头皮电极压缩后的eeg信号全部组合起来,放置到分类器中进行分类,从而解决了在考虑每个头皮电极之间可能存在互相影响关系的前提下,将高维度eeg信号在应用分类器中的维度问题;选择以颜色认知为主题的脑电实验,并研究出了与颜色认知最相关的脑电频段,同时也可应用于脑电身份识别,进一步提高身份识别的精度。上述为本发明较佳的实施方式,但本发明的实施方式并不受上述内容的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1