一种基于多模态脑影像的基因型分析方法与流程

文档序号:13283771阅读:1256来源:国知局

本发明公开了一种基于多模态脑影像的基因型分析方法,本发明属于医学影像与计算机科学的交叉领域,涉及数字图像分析与模式识别的技术领域。



背景技术:

随着医学成像技术的迅猛发展,基因影像学成为了一个新兴的科学领域,主要研究基因变异对脑部结构和功能的影响。对于阿尔茨海默病来说,遗传因素起着重要的调控作用。而目前已有证据表明apoe(apolipoproteine)ε4基因与阿尔茨海默病的发病高度相关。遗传基因变异对生物体的调控机理是复杂而未知的,其中单核苷酸多态性(singlenucleotidepolymorphisms,snps)是一种常见的生物遗传标记。由于阿尔茨海默病患者的脑部会产生结构性萎缩,因此我们可以从神经影像数据中提取到与疾病相关联的图像特征作定量性状(quantitativetraits,qts)。

目前大多数研究工作关注基于脑结构模态的神经影像与基因变异的关联分析,但这些方法都是将每个脑区视为单独的一个节点,而忽略了节点之间的连接信息。而脑网络模型是对大脑系统的简单表示,节点两两之间的功能连接边是构成整个功能网络的重要数据,反映了不同脑区之间的连接强度,承载有患者与正常人之间的差异信息。本发明试图将提取到的脑结构感兴趣区域和功能连接网络特征进行弹性网络特征选择之后,再采用多核支持向量回归机进行基因型与表现型的关联分析,发现两者之间的联系有利于更好地理解阿尔茨海默病的疾病机理,从而采取更好的预防措施和更有效的治疗措施。本发明基于以上问题,提出一种多模态脑影像回归基因型方法。实现了用多模态脑影像准确预测基因型的同时验证了多模态信息融合的有效性。



技术实现要素:

本发明是基于多模态脑影像,发明一个基因型回归分析的方法。

本发明的具体技术方案包括以下几个步骤:

步骤一:针对多模态脑影像数据的特点,利用fmri图像来构建脑功能连接网络;

步骤二:针对多模态脑影像数据的特点,利用smri图像提取roi的灰质密度特征;

步骤三:采用弹性网络选择roi的灰质密度特征(节点特征)和构建好的脑功能连接特征(边特征);

步骤四:使用多核支持向量回归机对前一步骤获得的特征进行回归分析。

所述步骤一中,对采集到的原始数据,我们使用dataprocessingassistantforresting-statefmri(dparsf)进行切片时间校正(slicetiming),头动校正(motioncorrelation),和空间正则化(spatialnormalization)等标准预处理流程。接着每个对象的fmri图像所对应的脑空间根据automatedanatomicallabeling(aal)模板被分割为90个脑区(每个脑区对应图中的一个顶点),计算每个脑区的平均时间序列以及脑区间的pearson相关系数作为脑区间的连接强度。从而获得了大脑的功能性连接网络。

所述步骤二中,处理结构磁共振图像时,首先,手动将所有被试的t1结构像数据调整到前联合-后联合的平行线。然后,使用统一的分割技术,将所有被试的t1加权像分割为灰质、白质以及脑脊液。再次,将每个被试的灰质图像使用dartel(diffeomorphicanatomicalregistrationthroughexponentiatedliealgebra)技术空间标准化到本研究特定的t1加权的模板。dartel配准首先从每个被试的图像上计算平均的图谱,然后将每个被试的图谱配准到该图谱上。为了提高配准质量以及得到一个更加准确的不同被试间的配准,配准过程将重复进行,直到产生最优的特定模板。随后再配准到蒙特利尔神经学研究所(mni)标准空间上。最后,每个被试将产生各自的灰质密度图。为了得到更好的结果,使用10mm的高斯平滑和将每个被试的灰质图像进行平滑。然后按照aal模板对90个脑区分别提取90个脑区的平均灰质密度。

所述步骤三中,我们采用弹性网络(elasticnet)算法分别对节点特征和网络边特征做特征选择。弹性网络系数可以由求解以下优化问题得到:

其中,输入为代表脑影像特征矩阵,和代表基因型数据(snp),其中n是样本数量,p是影像特征维数。输出为是脑影像特征对应的系数向量,在得到系数向量w之后将其中数值为0所对应的特征去掉,我们可以得到一个新的更具有代表性的特征表示。同时,系数向量w还包含了每一个特征的权重信息,由这个权重信息我们可以进一步对特征的代表性进行分析。λ1、λ2是l1范数和l2范数的正则化参数,通过交叉验证实现模型参数选择。

所述步骤四中,将步骤三中挑选出的节点特征和网络边特征使用多核支持向量回归机svr预测基因型。在每个模态上的特征数上都构造一个核矩阵,并通过下式进行融合:

其中表示第m个模态上的核函数,对应着训练样本xi和xj的第m个模态上的第i个和第j个特征,μm是第m个模态上的权重向量,并且满足约束式中k(xi,xj)是两个模态数据通过核变换及融合之后的核矩阵,将其作为svr的输入并建立回归模型来进行测试数据的回归。

本发明采用以上技术方案与现有技术相比,具有以下优点与有益效果:

(1)本发明提出的融合多模态的方法充分利用多种模态的优势并将其融合后进行回归预测,取得了很好的预测结果;

(2)目前大多数研究工作关注基于脑结构模态的神经影像与基因变异的关联分析,将每个脑区视为单独的一个节点,而忽略了节点之间的连接信息,脑网络模型是对大脑系统的简单表示,而本发明的目的是充分利用这种承载有患者与正常人之间的差异信息,该方法更具有分析参考的意义。

附图说明

图1为本发明所述方法的框架图。

具体实施方式

下面选择阿尔兹海默症患者以及正常人40例,结合图1对本发明上述方法进行具体说明。其中,被试者的年龄、性别、受教育年限如下表1所示。本文采用留一法(leave-one-out,loo)进行交叉验证,即每次预留一个样本作为测试数据,其余样本作为训练样本训练回归模型,一共进行64次交叉验证,最后取64次预测结果的平均值作为最终结果。

表1受试者信息统计表

本发明的总体流程如图1所示。具体的实施过程包含五个步骤:

步骤一是对所有样本的大脑功能核磁共振图像进行预处理并构建脑连接网络。我们使用dataprocessingassistantforresting-statefmri(dparsf)进行切片时间校正(slicetiming),头动校正(motioncorrelation),和空间正则化(spatialnormalization)等标准预处理流程。接着每个对象的fmri图像所对应的脑空间根据automatedanatomicallabeling(aal)模板被分割为90个脑区(每个脑区对应图中的一个顶点),计算每个脑区的平均时间序列以及脑区间的pearson相关系数作为脑区间的连接强度。从而获得了大脑的功能性连接网络。值得注意的是,该脑网络是一个对角线上全为1的对称矩阵。

步骤二是对所有样本的大脑结构核磁共振图像进行预处理并提取体素特征。首先,手动将所有被试的t1结构像数据调整到前联合-后联合的平行线。然后,使用统一的分割技术,将所有被试的t1加权像分割为灰质、白质以及脑脊液。再次,将每个被试的灰质图像使用dartel(diffeomorphicanatomicalregistrationthroughexponentiatedliealgebra)技术空间标准化到本研究特定的t1加权的模板。dartel配准首先从每个被试的图像上计算平均的图谱,然后将每个被试的图谱配准到该图谱上。为了提高配准质量以及得到一个更加准确的不同被试间的配准,配准过程将重复进行,直到产生最优的特定模板。随后再配准到蒙特利尔神经学研究所(mni)标准空间上。最后,每个被试将产生各自的灰质密度图。为了得到更好的结果,使用10mm的高斯平滑和将每个被试的灰质图像进行平滑。然后按照aal模板对90个脑区分别提取90个脑区的平均灰质密度。值得注意的是,对于每一个样本来说提取到的结构特征是一个90维的向量。

步骤三是采用弹性网络(elasticnet)算法分别对节点特征和网络边特征做特征选择。弹性网络系数可以由求解以下优化问题得到:

其中,输入为代表脑影像特征矩阵,和代表基因型数据(snp),其中n是样本数量,p是影像特征维数。输出为是脑影像特征对应的系数向量,在得到系数向量w之后将其中数值为0所对应的特征去掉,我们可以得到一个新的更具有代表性的特征表示。同时,系数向量w还包含了每一个特征的权重信息,由这个权重信息我们可以进一步对特征的代表性进行分析。λ1、λ2是l1范数和l2范数的正则化参数,通过交叉验证实现模型参数选择。在实验设置中,将上式中的参数λ1、λ2分别设置为0.7,1.1。

步骤四将步骤三中挑选出的节点特征和网络边特征使用多核支持向量回归机svr预测基因型。在每个模态上的特征数上都构造一个核矩阵,并通过下式进行融合:

其中表示第m个模态上的核函数,对应着训练样本xi和xj的第m个模态上的第i个和第j个特征,μm是第m个模态上的权重向量,并且满足约束式中k(xi,xj)是两个模态数据通过核变换及融合之后的核矩阵,将其作为svr的输入并建立回归模型来进行测试数据的回归,基因型作为因变量。在实验设置中,将上式中的参数μ1μ2分别设置为0.3,0.7。其具体过程如算法1描述:

算法1:多核支持向量回归机回归基因型

输入:预处理之后的功能核磁共振数据:预处理之后的结构核磁共振数据:基因型数据:

输出:相关性系数及均方根误差

1:将x和z代入公式(1)计算得到wx

2:将y和z代入公式(1)计算得到wy

3:选择wx中非零元素对应的特征构造新的矩阵

4:选择wy中非零元素对应的特征构造新的矩阵

5:将代入公式(2)中获得核矩阵k

6:将k作为支持向量回归机的输入来回归z,并计算回归值与真实值之间的相关性系数及均方根误差

经计算,采用弹性网络对两个模态的数据进行选择特征之后再用多核支持向量机回归时相关系数能够达到0.5668(按照相关系数的三级划分标准属于显著性相关),均方根误差为0.4619。

上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1