1.本发明属于脑电信号处理领域,涉及一种决策树式脑电噪声识别系统。
背景技术:2.随着脑电采集设备的小型化、便携化,基于脑电技术的产品和应用越来越广泛,进而脑电信号的数据量呈现爆发式增长。不管是医疗级的脑电采集设备,还是商用便携式脑电采集设备,脑电数据都不可避免被各种噪声影响,包括以电子设备的工频和电路电流为主的环境噪声和来源于不同肌肉群的生理噪声,如眼部噪声,面部肌肉噪声,心脏噪声等。因此脑电信号常常淹没在包括上述以及众多未知的各种噪声中,使得获取干净有效的脑电信号难度剧增。因此,去除脑电信号中掺杂的噪声是极为自然的想法,但由于脑电采集设备性能的不同,去除噪声的难度也不相同。比如,以凝胶为主的湿电极脑电设备来说,信号质量比干电极的脑电采集设备要高很多,相对而言也容易去除一些噪声,当然也有很多无法去除的。干电极脑电设备由于电极与头皮的接触不良或不紧导致阻抗过高,因此信号质量相较于湿电极来说会差很多,噪声源也更明显。
3.目前所存在问题是,脑电信号质量检测普通通过硬件给出单一指标,而我们不仅需要判断脑电信号好坏,同时,若脑电信号里包含噪声的话也要知道噪声的种类,从而能采取措施去避免产生噪声。处理脑电信号中的噪声一般采取的措施是剔除,而识别是空白领域。并且剔除噪声的算法都有各自的缺陷,并不都能成功剔除噪声。我们的想法是尽可能识别脑电信号中的噪声,采取一些措施去主动避免噪声产生,尽可能保证每一次采集的脑电数据都有较高的信噪比。
4.进一步的,脑电信号降噪方法多是准对于多通道脑电设备而设计的,单通道脑电设备并不能适用大部分方法,所以说对于单通道脑电设备而已信号质量检测时必不可少的。
5.我们为解决上述问题而设计了一种决策树式脑电噪声识别系统,可实现在线自动化识别多种噪声种类。
技术实现要素:6.本发明目的在于提供一种决策树式脑电噪声识别系统,识别可用脑电信号,以提高脑电设备的信号采集效率,同时解决难以检测脑电信号质量的问题。系统框架包括脑电信号预处理子系统,脑电信号基本特征提取与识别子系统,脑电信号复杂特征识别子系统(即神经网络子系统),以上三个部分。基本的处理流程是,实时收集脑电信号并做初步预处理,包括带通滤波和降采样。之后通过信号的基本特征做出初步的判断,包括信号幅值和能量以及基于统计特征的峰度。最后根据上一步的判断是否再需要精细识别,这一步通过神经网络子系统识别。
7.神经网络具体来说由两个模块组成:
8.由卷积神经网络构成的初级特征提取模块,用以提取脑电特征;
9.由条件随机场构成的特征识别模块,用以在线判断特征类别;
10.两个模块按照初级特征提取模块、特征识别模块来组合,经初级特征提取模块提取噪声特征后传输至噪声识别模块做出判断,神经网络子系统也在线对脑电数据进行处理;
11.为了实现上述目的,本发明提供技术方案如下:一个在线脑电信号质量检测系统,用以检测噪声类别。本系统具体的分析识别步骤如下:
12.步骤一:在线采集原始脑电信号,将原始脑电信号传输至预处理子系统,对原始脑电信号做带通滤波和降采样,将处理好的数据传输到脑电信号基本特征提取与识别子系统;
13.步骤二:通过预处理后的脑电数据基本特征判断噪声类别,判断类别分为:环境噪声、眼电噪声、肌电噪声三种大类别,若无法判断则将数据传输到精细识别子系统做进一步特征提取;
14.对步骤二中未能识别的脑电信号做标准化也叫z
‑
score化,后传输至神经网络子系统做进一步的判别;
15.步骤三:接收步骤二的数据,通过神经网络判断不易识别的噪声类别,判断类别分为:脑电信号、眼电噪声、肌电噪声三种大类别;
16.步骤二具体为,判断噪声类别的方法类似决策树式的步骤,其具体方法为:
17.根据信号幅值以及持续时间判断是否是环境噪声,若信号幅值超过阈值并且持续时间超过阈值则判断为环境噪声。进一步的,利用傅里叶变换将信号投影到频域,利用峰值检测算法计算频段及其谐波是否存在峰值,若存在则可判断为工频;
18.若信号幅值超过阈值但持续时间未超过阈值则判断为生理噪声。进一步的,利用傅里叶变换将信号投影到频域,若高频段能量超过阈值则可判断为肌电噪声。
19.若高频段未超过阈值,再根据计算信号的统计特征
‑
峰度,若峰度超过阈值则可判断为眼电,若未超过将信号传输到第三步的系统做进一步判断,其中峰度的计算公式为
20.步骤三,接收脑电信号基本特征提取与识别子系统未能识别出来的脑电信号,利用神经网络做更多种类的精细识别。先对脑电信号做标准化,再传输至神经网络子系统中。
21.步骤三所述神经网络子系统由两个模块组成,包括初级特征提取模块和噪声识别模块。
22.初级特征提取模块由三个卷积模块组成,每个卷积模块包括卷积层、最大池化层、非线性激活层构成。第一个卷积模块功能与带通滤波类似,提取某一频段的特征,再结合多个卷积核,可以自适应地提取多频段的特征图。后两个卷积模块的功能是进一步提取特征的同时,降低特征的维度以降低后续计算的复杂度;
23.进一步地,卷积层输出的特征图将输入到一层全链接层中,以满足条件随机场的参数需求;
24.最后地噪声识别功能由条件随机场完成。条件随机场接收全链接层的特征做最后的推理判断,输出结果即是噪声的类别。条件随机场支持不限长的时间序列,可以对每个时间点做出推断,构成在线噪声识别系统的最后一环。
附图说明
25.图1是本发明公开的一种决策树式脑电噪声识别系统的流程图。
26.图2是本发明公开的一种决策树式脑电噪声识别系统的基本识别系统流程图。
27.图3是本发明公开的一种决策树式脑电噪声识别系统的神经网络系统流程图。
具体实施方式
28.下面结合实施例和附图对本发明的决策树式脑电噪声识别系统做出详细说明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
29.如图1所示,本发明主要步骤如下:
30.步骤一:设定2s的时间窗从脑电采集设备中获取原始脑电数据,将原始脑电数据输入到脑电信号预处理子系统;
31.步骤二:将预处理后的数据输入到脑电信号基本特征提取与识别子系统对信号做出判断;
32.步骤三:对步骤二中未能识别的信号输入到神经网络子系统做出最后的判断;
33.步骤一的具体方法为,利用窗函数设计有限冲击响应滤波器对获得数据块做带通滤波,带通滤波器长度为200,在保证数据不扭曲的同时尽量减少时延;之后将信号降采样到200hz,减少运算量;
34.下面结合图2对神经网络做详细描述。
35.步骤二的具体方法为,若长时间大于阈值2s则转换到频域检测50hz是否出现峰值。结合峰值检测算法,若出现峰值则可认为是工频,若不是则是其他环境噪声无法判断。
36.若未长时间大于阈值,但短时大于阈值则考虑为生理噪声。结合fft判断大于20hz的波段是否能量大范围变大,同时计算其峰度,若大于20hz波段能量变大同时峰度在0
‑
20之间则可判断为肌电;若大于20hz波段能量未能大幅变化,则可判断为眼电。能量单位使用db,阈值设定为140db,此数值使用我们的数据集经验分析得出,并不完全固定。
37.进一步地,若上述若长时间大于阈值且幅值也未超过100μv,则需要神经网络子系统做进一步判断。
38.下面结合图3对步骤三中的神经网络做详细描述:
39.为了实现在线脑电信号分类,采取将数据分为多端的策略。每一个时间窗内的数据将被分割为长度1s、步长0.1s,也就是10组数据,之后将分好组的数据输入到神经网络中做判别,我们的系统将每0.1s做一次判断,当然上述设定只是实施例使用的参数,可以修改其设定。
40.神经网络由三个卷积模块、一个全链接层和一个条件随机场组成,每一个卷积模块由卷积层、批归一化层、最大池化层、非线性激活层组成;
41.卷积层的公式为:h
l+1
(t)=∑
t
w(x
‑
t)*h
l
(t)+b,其中h
l
和h
l+1
代表输入信号和输出信号,w代表卷积核权重,b代表偏置参数;最大池化层公式为:其中h
l
和h
l+1
代表输入信号和输出信号,m代表池化层大小;非线性激活层公式为:(x)
+
=max(0,x);
42.第一个卷积模块参数为:
43.卷积层:卷积核个数为32个,卷积核大小为1*101,步长参数为1,补零参数为50;批归一化层大小为32;最大池化层大小为1*2;
44.第二个卷积模块参数为:
45.卷积层:卷积核个数为32个,卷积核大小为1*51,步长为1,补零为25;批归一化大小为32;最大池化层大小为1*2;
46.第三个卷积模块参数为:
47.卷积层:卷积核个数为32个,卷积核大小为1*26,步长为1,补零为12;批归一化大小为32;最大池化层大小为1*2;
48.经过卷积神经网络后的特征大小为:b
×
32
×
50,其中b为batch size,32是卷积核数量,50为特征大小。
49.全链接层将第三个卷积模块输出特征大小变化为需要判断类别的大小,在此实施例中设定为3,分别代表脑电信号,眼电信号和肌电信号,其公式为y=w
·
x+b。其中w的大小为:50
×
3,这是此实施例中的参数大小;
50.条件随机场接收全链接层的输出做最后的判别。
51.条件随机场的目标函数为:
52.其中x代表输入参数,y代表判别类别。p(y|x)的概率密度函数表达为其中函数称为x的最大团。函数f与g称为特征函数。在此实施例中,f与g选择函数为
[0053][0054]
另外此条件随机场称为线性条件随机场。
[0055]
此实施例所使用的脑电电极为fp1,fpz,fp2,f7,f3,fz,f4,f8,fc5,fc1,fc2,fc6,m1,t7,c3,cz,c4,t8,m2,cp5,cp1,cp2,cp6,p7,p3,pz,p4,p8,poz,o1,oz,o2,以上电极覆盖全脑,脑电极帽的电极分布符合10~20国际标准导联。具体使用时不限于以上电极。
[0056]
步骤三所述神经网络子系统数据集构成:
[0057]
采集至少10人以上的噪声数据,脑电通道为32导,以及6个双极导联用以收集噪作为标注参考。数据集里面含有多种诱发噪声的动作,尽可能囊括不同噪声的不同特征,提高我们系统的识别率,以及使我们的系统具有更好的泛化能力。标注后数据按照8:2的比例分为训练集和测试集,判断类别分为环境噪声,眼电噪声,肌肉噪声三类;
[0058]
所有脑电数据在输入神经网络前做z
‑
score标准化,
[0059][0060]
其中x为一个电极通道的数据,μ为该通道的均值,σ为该通道的标准差,此操作可以避免神经网络训练时梯度爆炸;神经网络训练所使用的优化器为adam优化器,学习率为0.0001,权重初始化使用方法为xavier。
[0061]
以上对本发明及其实施方式进行了描述,这种描述没有限制性,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情
况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。