一种基于深度自编码神经网络的脑电信号EEG身份识别方法与流程

文档序号:16595172发布日期:2019-01-14 19:32阅读:303来源:国知局
一种基于深度自编码神经网络的脑电信号EEG身份识别方法与流程
本发明涉及脑电身份识别
技术领域
,具体涉及一种基于深度自编码神经网络的脑电信号eeg身份识别方法。
背景技术
:脑电领域的相关研究可以追溯到20世纪末。poulosm(1999)使用fft提取脑电信号特征,并用lvq神经网络进行身份识别分类;poulosm(2002)使用线性ar模型提取脑电信号特征,用lvq神经网络进行身份识别分类;mohammadig(2006)使用线性ar模型提取脑电信号特征,利用竞争神经网络进行身份识别分类;palaniappanr(2007)使用脑电信号的功率作为特征,并使用bp神经网络,knn进行身份识别分类;htouyama(2009)使用pca对脑电信号进行降维处理,使用降维后的脑电数据作为特征,使用lda进行身份识别分类;laroccad(2012)使用ar模型提取脑电信号的特征,使用polynomialbasedclassification进行身份识别分类;liews(2015)计算脑电信号的相干性、互相关、振幅均值作为特征,使用frnn进行身份识别分类;muz(2016)使用模糊熵提取脑电信号的特征,使用bp神经网络进行身份识别分类;上述的特征提取方法大多数都是基于信息处理领域的信号处理算法,例如提取脑电信号中的ar参数、fz-ar参数、功率谱(psd)或者模糊熵等,而这些特征提取算法往往需要脑电信号是一个平稳随机信号,而在实际中的脑电信号是非平稳随机信号,在一些特征提取算法中的存在模型定阶等问题,例如ar模型等,阶数的确定会影响特征提取的效果,而阶数的确定大多数是基于人为确定,。因此使用传统的特征提取算法来提取eeg的特征具有一定的缺陷。通常采集到的eeg数据是一个多维时间序列集,即由各个头皮电极上的时间序列构成的数据集,因此eeg是一个高维度的数据集,而在选择哪些头皮电极数据来进行研究的问题中,在以往eeg论文的做法中有:(1)将每个头皮电极当做是独立的,对每个头皮电极的数据进行特征提取,最后再对每个头皮电极的实验结果进行平均,但是,这种做法忽略了每个头皮电极之间可能存在互相影响的关系;(2)按照经验或者穷举法来选择组合多个头皮电极,这种做法弥补了方法(1)的缺陷,但是,在实际应用过程中,这种做法所需要的时间远远小于(1),而且凭借经验选择的电极组合,缺乏一定的客观性和科学性。技术实现要素:本发明的目的在于克服现有技术的缺点与不足,提供一种基于深度自编码神经网络的脑电信号eeg身份识别方法,该方法利用静息脑电信号进行身份识别,具有隐蔽性、不可窃取性、不可仿制性、不可胁迫性以及必须活体验证等优势,将其应用于身份识别中,可有效弥补传统身份识别手段的缺陷,利用其对信息进行处理,可有效克服以往算法中大多数特征提取算法的缺点,可以使脑电信号数据中的噪音大大降低,利于后续的信息处理以及分类的精度的提高,并且相对于传统的身份识别算法来说,识别过程保密性更好,更难被破解,使整个身份识别的过程更加科学、客观以及准确。本发明的目的通过下述技术方案实现:一种基于深度自编码神经网络的脑电信号eeg身份识别方法,包括下述步骤:s1,设计身份识别的脑电数据采集实验方案;设计一个周期有三张测试图片和三张全黑色的过渡图片,测试图片用时t1,过渡图片用时t2,每个周期中的测试图片分别为红、绿、蓝三原色,且红、绿、蓝三原色出现的顺序随机,则一个周期用时3t1+3t2,每个被试者测试n个周期,共用时n(3t1+3t2);设置过渡图片的目的是为了消除在切换测试图片时产生的视觉残留;s2,采集脑电数据;被试者戴上脑电帽静坐于电脑屏幕前,当屏幕开始按照s1的实验方案显示图片时,脑电采集设备开始采集被试者观看屏幕时的脑电信号;脑电采集设备的采样频率为vhz;s3,脑电数据的预处理;s3.1,提取被试者在认知测试图片的脑电信号作为身份识别分类的脑电信号;s3.2,通过eeglab观察所采集的脑电信号,剔除与本实验无关或者因设备原因损坏的头皮电极;设剔除后的头皮电极个数为k;s3.3,对所采集的原始脑电信号进行fir滤波,剔除会成为噪声的眼电信号,同时提取出delta(0.5hz-4hz)、theta(4hz-8hz)、alpha(8hz-14hz)、beta(14hz-30hz)、gamma(30hz-45hz)和all(0.5hz-45hz)这六个频段的脑电数据用于实验;s3.4,为了消除不同头皮电极可能存在的不同量纲影响,对s3.3中所提取的每个频段的脑电数据进行归一化处理,归一化后的每份脑电数据为k行t1×v列的脑电信号矩阵;s3.5,从s3.4中六个频段的脑电数据中提取出头皮电极的数据,构建出k个训练集和测试集;s3.6,分别对k个头皮电极构建一个深度自编码神经网络;每个深度自编码神经网络的输入节点和输出节点数为t1×v,编码层和解码层的层数大于1,最后一层的编码层和最后一层的解码层的激活函数为tanh,具体公式如下:其他层的编码层和解码层的激活函数为relu,具体公式如下:relu(x)=max(0,x);s3.7,训练深度自编码神经网络;在深度自编码神经网络的训练过程中,深度自编码神经网络的输出等于深度自编码神经网络的输入,即深度自编码神经网络训练的目标是使得网络的输出等于网络的输入;设为深度自编码神经网络中第l层第j个神经元与第l+1层的第i个神经元之间的权重系数,表示第l+1层的第i个神经元的偏置项,n为深度自编码神经网络的总层数,则深度自编码神经网络的参数为:则在m个样本中,上式为深度自编码神经网络的整体代价函数,取代价函数j(w,b)最小值时的w,b作为训练完成的深度自编码神经网络的参数;s3.8,利用训练完成的深度自编码神经网络提取脑电信号的信号特征;设深度自编码神经网络最后一层编码层的神经元个数为p,则把每个样本中所对应的头皮电极数据输入到对应的深度自编码神经网络,并把对应的深度自编码神经网络的最后一层编码层的输出作为脑电信号的信号特征;最后,每个样本可得到一个k×p的特征矩阵;s4,建立三层bp神经网络分类器;bp神经网络分类器的输入节点数为k×p,输出节点数为m,每个输出节点代表一位被试者;每个样本的标签为1×m的标签矩阵,第i个被试者的标签矩阵中第i个元素为1,其余为0;第一层神经元的激活函数relu如下:relu(x)=max(0,x),第二层神经元的激活函数为softmax如下:s5,利用建立的三层bp神经网络分类器进行身份识别分类;从预处理后的脑电数据中进行随机不重复采样,采取70%的样本作为bp神经网络的训练集,采取30%的样本作为测试集;在bp神经网络的训练过程中,选择基于多分类的对数损失函数作为模型训练的损失函数;选择adam方法,在每次迭代训练后,根据bp神经网络在训练集上的loss值,调整bp神经网络中每层神经网络的参数;使用测试集,对已训练的bp神经网络进行身份识别分类测试。本发明与现有技术相比具有以下的有益效果:(1)本发明利用静息态脑电信号(eeg)具有隐蔽性、不可窃取性、不可仿制性、不可胁迫性以及必须活体等独特的优势,将其应用于身份识别中,可以弥补传统身份识别手段的缺陷;(2)本发明的自编码神经网络不要求信号是否具有平稳随机的条件,在自编码神经网络通过多次迭代训练,它能习得隐含在信号中的特征,并能在多次压缩和解压缩后还原出于原信号大致一致的eeg信号;(3)本发明避免了使用ar模型提取脑电信号特征中的阶数确定问题,而且使用深度自编码神经网络所提取的特征在颜色识别方面取得满意的结果;(4)本发明解决了在考虑每个头皮电极之间可能存在互相影响关系的前提下,将高维度eeg信号在应用分类器中的维度问题。附图说明图1为本发明的特征提取方法和身份识别流程图;图2为本发明的脑电数据采集实验方案示意图;图3为本发明的深度自编码神经网络示意图;图4为本发明的三层bp神经网络示意图。具体实施方式下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。如图1~4所示,一种基于深度自编码神经网络的脑电信号eeg身份识别方法,包括下述步骤:步骤一,设计身份识别的脑电数据采集实验方案;设计一个周期有三张测试图片和三张全黑色的过渡图片,测试图片用时t1,过渡图片用时t2,每个周期中的测试图片分别为红、绿、蓝三原色,且红、绿、蓝三原色出现的顺序随机,则一个周期用时3t1+3t2,每个被试者测试n个周期,共用时n(3t1+3t2);设置过渡图片的目的是为了消除在切换测试图片时产生的视觉残留;具体来说,一个周期有三张测试图片和三张过渡图片(全黑),测试图片用时1s,过渡图片用时0.2s;每个周期中的测试图片为rgb三原色,即红绿蓝三原色,且每张测试图片出现的顺序随机,因此一个周期用时是3.6s,每个被试者测试200个周期,即720s(12min)。步骤二,采集脑电数据;被试者戴上脑电帽静坐于电脑屏幕前,当屏幕开始按照步骤一的实验方案显示图片时,脑电采集设备开始采集被试者观看屏幕时的脑电信号;脑电采集设备的采样频率为vhz;;具体来说,脑电采集设备为brainproduct,brainampmrplus型放大器,采用64导电极帽连续记录脑电;参与实验的被试者个数为8个(4个男性,4个女性),他们的年龄在19岁到22岁之间,均无神经或精神上的疾病史,实验前亦无使用药物。被试者静坐在电脑屏幕前,电脑屏幕按照所设计的颜色识别实验方案显示图片,通过脑电采集设备,对被试者在认知图片时产生的脑电信号进行采集,脑电采集设备的采样频率为500hz。步骤三,脑电数据的预处理;(1)提取被试者在认知测试图片的脑电信号作为身份识别分类的脑电信号;(2)通过eeglab(eeglab是matlab的一个交互式工具箱,用于处理连续、与事件相关的脑电信号eeg,可进行独立成分分析,时域/频域分析,人造噪声抑制,事件相关统计,有多种面向平均或者单次实验数据的可视化模式)观察所采集的脑电信号,剔除与本实验无关或者因设备原因损坏的头皮电极;设剔除后的头皮电极个数为k;具体来说,剔除与本实验无关和损坏的头皮电极('fp1”fp2”f4”f8”fz''pz”heol”heor”m2”f6'),剔除后的头皮电极数为54;(3)对所采集的原始脑电信号进行fir滤波,剔除会成为噪声的眼电信号,同时提取出delta(0.5hz-4hz)、theta(4hz-8hz)、alpha(8hz-14hz)、beta(14hz-30hz)、gamma(30hz-45hz)和all(0.5hz-45hz)这六个频段的脑电数据用于实验;(4)为了消除不同头皮电极可能存在的不同量纲影响,对步骤三(3)中所提取的每个频段的脑电数据进行归一化处理,归一化后的每份脑电数据为k行t1×v列的脑电信号矩阵,具体来说,每个样本归一化后为54行500列的矩阵;(5)从步骤三(4)中六个频段的脑电数据中提取出头皮电极的数据,构建出k个训练集和测试集,具体来说,构建出54个训练集和测试集;(6)分别对k个头皮电极构建一个深度自编码神经网络;每个深度自编码神经网络的输入节点和输出节点数为t1×v,编码层和解码层的层数大于1,具体来说,分别对54个头皮电极构建一个深度自编码神经网络,每个深度自编码神经网络的输入节点和输出节点数为500,编码层和解码层的层数为4;最后一层的编码层和最后一层的解码层的激活函数为tanh,具体公式如下:其他层的编码层和解码层的激活函数为relu,具体公式如下:relu(x)=max(0,x);(7)训练深度自编码神经网络;深度自编码神经网络的输入层节点数为500;在深度自编码神经网络的训练过程中,深度自编码神经网络的输出等于深度自编码神经网络的输入,即深度自编码神经网络训练的目标是使得网络的输出等于网络的输入;设为深度自编码神经网络中第l层第j个神经元与第l+1层的第i个神经元之间的权重系数,表示第l+1层的第i个神经元的偏置项,n为深度自编码神经网络的总层数,具体来说,深度自编码神经网络的总层数为9,则深度自编码神经网络的参数为:则在m个样本(此处的样本是指某一频段的某个头皮电极的训练集中的样本)中,上式为深度自编码神经网络的整体代价函数,取代价函数j(w,b)最小值时的w,b作为训练完成的深度自编码神经网络的参数;(8)利用训练完成的深度自编码神经网络提取脑电信号的信号特征;设深度自编码神经网络最后一层编码层的神经元个数为p,即神经元个数为15,则把每个样本(此处的样本是指单个频段的脑电数据)中所对应的头皮电极数据输入到对应的深度自编码神经网络,并把对应的深度自编码神经网络的最后一层编码层的输出作为脑电信号的信号特征;最后,每个样本(此处的样本是指单个频段的脑电数据)可得到一个k×p的特征矩阵,具体来说,每个样本可得到一个54×15的特征矩阵;步骤四,建立三层bp神经网络分类器;bp神经网络分类器的输入节点数为k×p,输出节点数为m,具体来说,输入节点数为810,输出节点数为8,每个输出节点代表一位被试者;每个样本(此处的样本是指某个频段的某份脑电数据)的标签为1×m的标签矩阵,第i个被试者的标签矩阵中第i个元素为1,其余为0;第一层神经元的激活函数relu如下:relu(x)=max(0,x),第二层神经元的激活函数为softmax如下:步骤五,利用建立的三层bp神经网络分类器进行身份识别分类;从预处理后的脑电数据中进行随机不重复采样,采取70%的样本作为bp神经网络的训练集,采取30%的样本作为测试集;在bp神经网络的训练过程中,选择基于多分类的对数损失函数(该函数如下:)作为模型训练的损失函数;选择adam方法(adam方法的具体步骤如下:1、初始化步长;2、初始化矩估计的指数衰减速率;3、初始化用于数值稳定的小常数;4、初始化bp神经网络中每层网络的参;5、初始化一阶和二阶矩变量;6、初始化步数;7、从训练集中随机采样q个样本,计算loss函数的梯度;8、更新有偏一阶矩估计;9、更新有偏二阶矩估;10、修正一阶矩偏差;11、修正二阶矩偏;12、计算各参数更新幅;13、参数更;14、若满足停止准则则退出,否则返回步骤7,继续更新参数),在每次迭代训练后,根据bp神经网络在训练集上的loss值(loss值是由loss函数计算所得的值),调整bp神经网络中每层神经网络的参数;使用测试集,对已训练的bp神经网络进行身份识别分类测试,从而得到深度自编码神经网络的身份识别分类结果。具体来说,分类器的输出矩阵的每个数值代表该测试样本识别为对应被试者的概率,取概率最大的被试者作为该测试样本的识别结果。为了提供一种更直观、更容易理解的评估方法,使用了以下方程组来评估身份识别结果:tp表示正确识别为本人的个数,fp表示错误识别为本人的个数,fn表示错误识别为他人的个数,查全率表示本人样本有多少个被预测正确,查准率表示预测结果为本人的样子中有多少个是真正的本人。结果如下表所示:查准率1st2nd3rd4th5thaverageall58.93%63.42%68.6961.58%77.04%65.93%delta63.87%59.71%66.10%60.91%61.22%62.36%theta60.96%66.51%62.35%56.34%58.43%60.92%alpha74.98%78.92%72.71%84.52%72.78%76.78%beta91.76%90.67%93.02%92.81%92.71%92.19%gamma98.08%97.95%99.52%95.31%95.49%97.27%查全率1st2nd3rd4th5thaverageall58.94%59.22%54.81%54.56%77.67%61.04%delta61.78%56.58%62.99%61.70%55.22%59.65%theta61.37%57.35%59.64%56.40%56.45%58.24%alpha69.80%74.65%67.24%77.31%72.74%72.35%beta91.32%90.88%93.47%90.93%93.90%92.10%gamma96.70%97.61%97.69%95.79%95.07%96.57%从上述表格可以得出,使用基于深度自编码神经网络的脑电信号(eeg)身份识别方法,其查准率最高为99.52%,查全率最高为97.69%。与脑电身份识别最相关的脑电频段是gamma波段,其平均查准率为97.27%,平均查全率为96.57%。因此,该方法可应用于要求高隐蔽性、不可窃取性、不可仿制性、不可胁迫性以及必须活体的身份识别场景中。本发明利用静息态脑电信号(eeg)具有隐蔽性、不可窃取性、不可仿制性、不可胁迫性以及必须活体等独特的优势,将其应用于身份识别中,可以弥补传统身份识别手段的缺陷;自编码神经网络不要求信号是否具有平稳随机的条件,在自编码神经网络通过多次迭代训练,它能习得隐含在信号中的特征,并能在多次压缩和解压缩后还原出于原信号大致一致的eeg信号;避免了使用ar模型提取脑电信号特征中的阶数确定问题,而且使用深度自编码神经网络所提取的特征在颜色识别方面取得满意的结果;解决了在考虑每个头皮电极之间可能存在互相影响关系的前提下,将高维度eeg信号在应用分类器中的维度问题。上述为本发明较佳的实施方式,但本发明的实施方式并不受上述内容的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1