本发明属于信号处理领域,涉及一种多形态表征的多源域脑电信号分析方法。
背景技术:
1、脑电信号作为一种重要的生物电信号,记录了神经元在不同时间、不同位置上的电活动信息,它具有可重复性、非侵入性和低成本等优点,因此在康复医学、智能辅助等领域具有广泛的应用前景。然而,由于脑电信号的非稳态、非线性等特点,以及不同人群之间的差异性,如何有效地对脑电信号进行表征和分析,成为了当前研究的热点和难点问题。
2、近年来,人工智能技术在脑机接口领域得到了广泛的应用和研究。传统机器学习方法在eeg信号识别方面取得了很大的成功。在运动想象的研究领域,最为经典的是共空间模式(common space pattern,csp),该方法通过线性变换将多通道eeg信号转化为一组新的空间特征向量,使得对于某一任务相关的信号能够更好地分离出来。在驾驶疲劳检测领域上,短时傅立叶变换(stft)已经被广泛用于时频域分析,并且获得了很好的结果。
3、这些方法在一些eeg信号的分类任务中取得了不错的效果。然而,这些传统机器学习方法往往采用手动提取特征的方式,导致在特征提取和分类性能上存在一定局限性和不足。与传统机器学习方法不同,深度学习方法能够从原始数据中自动学习特征表达,并且具有很强的表征能力和泛化能力。针对eeg信号识别问题,已经出现了很多基于深度学习的方法。这些方法在eeg信号的特征提取和分类任务上均取得了较好的效果,且能够有效地减少人工干预和领域知识的影响。然而,传统机器学习和深度学习方法都没有很好解决跨受试者的eeg识别问题,即不同个体之间的eeg信号存在较大的差异性,这导致了模型在不同受试者之间的泛化能力不足。
4、解决不同受试者之间的差异性,得到一个泛化能力强的eeg信号分析模型对于未来的人机交互、神经康复等领域具有重要的应用价值和研究意义。迁移学习的出现就很好的解决了这一问题。近年来,越来越多的研究者将迁移学习的思想引入到eeg分类中。h.kang等将目标域受试者协方差矩阵和源域受试者协方差矩阵进行线性组合,提出了复合协方差矩阵方法。
技术实现思路
1、本发明针对现有技术的不足,为了能够增强多源域模型的泛化能力,本发明提出了一种多形态表征的多源域脑电信号分析方法。
2、脑电数据在不同受试者之间差异性较大导致了模型难以在多源域的情况下获得较强的泛化能力,通过迁移学习能够找到不同受试者之间的不变表示。本发明所提出的方法通过两个流形空间映射来构造公共特征提取器,该公共特征提取器通过多形态表征来保留脑电信号的多元统计特征与低维结构信息。
3、一种多形态表征的多源域脑电信号分析方法,该方法包括如下步骤:
4、步骤1:首先对eeg信号进行预处理,利用ca算法将预处理后的数据进行第一步地对齐,对齐后映射到黎曼流形中来获取eeg信号的多元统计特征信息;
5、步骤2:在映射的多元统计特征中提取整体源域与目标域的切空间特征,再映射到格拉斯曼流形中,得到公共不变表示特征,在此阶段计算整个多源域与目标域之间的coral损失,以此保证提取到eeg信号的低维结构信息的同时,最大限度上获取到多源域与目标域之间的公共不变表示;
6、步骤3:将公共不变表示特征中的多个源域划分为子域,通过设定的一对一特征提取器来获得每个子域与目标域的私有不变表示。在此阶段计算多个子源域与目标域之间的mmd损失与交叉熵损失;mmd损失保证了多个子源域与目标域之间能够减小差异;
7、步骤4:采用多个softmax分类器进行训练,训练的过程利用交叉熵来降低损失。作为优选,所述的步骤1中的利用ca算法将预处理后的数据进行第一步地对齐,具体为将训练数据划分为多个子源域进行单独的对齐。
8、作为优选,所述的步骤2中的采用格拉斯曼流形映射,映射维度为5-40。
9、作为优选,所述的格拉斯曼流形映射,映射维度为40。
10、作为优选,所述的在映射的多元统计特征中提取整体源域与目标域的切空间特征,切空间提取的表达式如下所示:
11、
12、其中,upper为取矩阵上三角元素,pi为协方差矩阵,为黎曼均值或欧几里德平均值。
13、作为优选,所述的计算整个多源域与目标域之间的coral损失,具体为:表达式如下:
14、
15、其中,表示coral损失,d为特征维度,cs和ct分别表示源域和目标域数据的协方差矩阵,i,j为协方差矩阵中的元素索引。
16、作为优选,计算多个子源域与目标域之间的mmd损失,具体为:表达式如下:
17、
18、其中,n表示源域个数,at表示变换矩阵,c代表类别个数,ns与nt分别表示源域与目标域的试验总数。
19、本发明的有益效果:
20、第一,本发明在不同源域作为训练时进行了特殊的处理过程,保留了多源域与目标域之间的公共不变表示与私有不变表示,相对于一般的在原始空间处理多源域训练集的方法,其能够更加有效的增加模型的泛化能力,拉近不同受试者之间的分布差异性,这也是传统的领域自适应算法没有考虑到的。
21、第二,本发明利用多种流形来获取多源域的公共不变表示与私有不变表示,其中利用黎曼流形保留了原始脑电数据的多元统计特征信息。
22、第三,本发明提出了一种多形态表征的多源脑电信号分析方法mmra,该方法利用两种流形空间映射作为公共特征提取器来提取脑电信号的公共不变表示,然后建立3层mlp来获取n个子域与目标域的私有不变表示。通过这种不同形态表征的方法,有效的提取不同受试者之间的不变表示。通过在公开数据集上与当前sota模型进行比较,发现该方法在多个源域作为训练集的情况下的表现更加优秀。
1.一种多形态表征的多源域脑电信号分析方法,其特征在于,该方法包括如下步骤:
2.根据权利要求1所述的一种多形态表征的多源域脑电信号分析方法,其特征在于:所述的步骤1中的利用ca算法将预处理后的数据进行第一步地对齐,具体为将训练数据划分为多个子源域进行单独的对齐。
3.根据权利要求1所述的一种多形态表征的多源域脑电信号分析方法,其特征在于:所述的步骤2中的采用格拉斯曼流形映射,映射维度为5-40。
4.根据权利要求1或3所述的一种多形态表征的多源域脑电信号分析方法,其特征在于:所述的格拉斯曼流形映射,映射维度为40。
5.根据权利要求1所述的一种多形态表征的多源域脑电信号分析方法,其特征在于:所述的在映射的多元统计特征中提取整体源域与目标域的切空间特征,切空间提取的表达式如下所示:
6.根据权利要求1所述的一种多形态表征的多源域脑电信号分析方法,其特征在于:所述的计算整个多源域与目标域之间的coral损失,具体为:表达式如下:
7.根据权利要求1所述的一种多形态表征的多源域脑电信号分析方法,其特征在于:计算多个子源域与目标域之间的mmd损失,具体为:表达式如下: