一种阿尔兹海默症分类预测方法及系统与流程

文档序号:19286168发布日期:2019-11-29 23:34阅读:562来源:国知局
一种阿尔兹海默症分类预测方法及系统与流程

本申请涉及图像特征提取技术领域,尤其涉及一种阿尔兹海默症分类预测方法及系统。



背景技术:

阿尔茨海默病(alzheimer'sdisease,ad)是老年人中常见的一种神经性疾病,其主要影响老年人脑部的中枢神经,使其发生退行性改变。当患者出现明显的阿尔茨海默病临床症状时,疾病多数已经进入晚期,完全无法治疗。故阿尔茨海默病的早期诊断和干预成为大多数研究关注的焦点。

现有技术中常用的针对阿尔茨海默病的早期诊断的方法包括构建基于脑影像特征的大脑功能网络,从网络化的角度研究阿尔兹海默症的病理学特征,从而进一步探索发病机制,实现疾病的早期诊断。然而现有方法所提取的特征相对较少,并且研究的是阿尔兹海默症的高维度数据,因此现有技术存在包括特征指标较少、检测准确率不高以及模型太复杂泛化能力差的问题。



技术实现要素:

本申请提供了一种阿尔兹海默症分类预测方法及系统,使得正确率更高,计算更加简单。

有鉴于此,本申请第一方面提供了一种阿尔兹海默症分类预测方法,所述方法包括:

获取阿尔兹海默症患者的磁共振成像的图像样本,并预处理所述图像样本,获取所述图像样本的k个特征指标;

采用多种特征选择算法将所述k个特征指标输入到所述特征选择算法对应的分类预测模型中,从所述k个特征指标中选取优质特征集,所述优质特征集中包括a个特征指标,a≤k;

将测试者的所述优质特征子集输入到所述对应的预测分类模型中,得到分类结果;

采用投票法处理所述分类结果,得到测试者的预测结果。

优选地,所述并预处理所述图像样本包括:对所述图像样本进行去头骨、配准、白质分割以及灰度归一化处理,获取所述图像样本中脑区各区域及各区域对应的特征个数。

优选地,所述获取所述图像样本的k个特征指标包括:从所述脑区中选取所需的区域数以及所述区域对应的特征个数,并将所述区域数与所述特征个数相乘得到k个特征指标。

优选地,所述各区域对应的特征个数具体为8个,包括表面面积、灰质体积、平均厚度、厚度标准差、积分校正平均曲率、积分校正高斯曲率、折叠指数和内在曲率指数。

优选地,所述多种特征选择算法具体包括:评价选择算法、遗传选择算法、方差选择算法。

优选地,当特征选择算法为所述评价选择算法时,所述从所述k个特征指标选取优质特征集具体包括:

将所述k个特征指标训练第一分类预测模型得到整体模型的准确度c;

从所述k个特征指标中剔除第i个特征指标1≤i≤k,将剩余的k-1个特征指标训练所述第一分类预测模型中得到准确度ci;则第i个特征指标的重要程度评估值vi=c-ci;

将vi与预设的评估阈值做对比,去除不合格的所述重要程度评估值,剩余的所述重要程度评估值对应的特征指标为优质特征集。

优选地,当特征选择算法为所述遗传选择算法时,所述从所述k个特征指标选取优质特征集具体包括:

采用二进制编码初始化种群中的个体;

获取所述个体二进制编码后对应的特征指标,并将所述对应的特征指标训练第二分类预测模型,得到所述个体的准确率,将所述准确度作为所述个体的适应度;

将所述个体两两个体不重复地进行交叉变异操作,选取父代个体个子代个体中优质的个体继续交叉变异;

重复上述步骤直到达到最大迭代次数,获得优质个体对应的优质特征集。

优选地,当特征选择算法为所述方差选择算法时,所述从所述k个特征指标选取优质特征集具体包括:

计算n个样本所对应的每个特征指标的方差,得到方差列表;

每次从所述方差列表中剔除方差值最小的m个方差值,将剔除掉所述方差值最小的m个方差值对应的特征指标,将剩余特征指标训练第三分类预测模型得到对应的准确率qk-m;

重复剔除方差值操作直到特征指标小于等于k时,获取的特征子集为准确率qk-jm对应的特征指标集合,其中j为特征子集的剔除方差值的次数,并且jm≥k/2;其中准确率最大的特征子集即为最优特征子集。

优选地,所述采用投票法处理所述分类结果,得到测试者的预测结果具体为:

所述分类结果对应是否患有阿尔兹海默症;若所述预测分类模型对应的所述分类结果中患有阿尔兹海默症的分类结果的数量大于未患有阿尔兹海默症的分类结果的数量,则表示测试者患有阿尔兹海默症。

本申请第二方面提供一种阿尔兹海默症分类预测系统,所述系统包括:

预处理模块,所述预处理模块用于获取阿尔兹海默症患者的磁共振成像的图像样本,并预处理所述图像样本,获取所述图像样本的k个特征指标;

优质特征选择模块,所述优质特征选择模块用于采用多种特征选择算法将所述k个特征指标输入到所述特征选择算法对应的分类预测模型中,从所述k个特征指标中选取优质特征集,所述优质特征集中包括a个特征指标,a≤k;

预测分类模块,所述预测分类模块用于将测试者的所述优质特征子集输入到所述对应的预测分类模型中,得到分类结果;

投票选择模块,所述投票选择模块用于采用投票法处理所述分类结果,得到测试者的预测结果。

从以上技术方案可以看出,本申请具有以下优点:本申请提供了一种阿尔兹海默症分类预测方法,包括采集测试者的磁共振成像的图像样本,并预处理图像样本,获取图像样本的k个特征指标;采用多种特征选择算法将k个特征指标输入到特征选择算法对应的分类预测模型中,从k个特征指标中选取优质特征集,特征集中包括a个特征指标,a≤k;将优质特征子集输入到所述对应的预测分类模型中,得到分类结果;采用投票法处理所述分类结果,得到测试者的预测结果。本申请通过多种特征选择算法选取优质特征集,获取对分类结果产生影响的特征指标,使得分类结果更加准确;并且通过有效剔除不相关的特征并获取高维特征空间中影响分类结果的主要特征,从而降低模型的复杂度,提高模型的泛化能力,采用投票法对多个预测分类模型结果进行综合判断也能够有效提高分类准确性。

附图说明

图1为本申请一种阿尔兹海默症分类预测方法的一个实施例的方法流程图;

图2为本申请一种阿尔兹海默症分类预测系统的一个实施例的系统框图。

具体实施方式

本申请通过多种特征选择算法选取优质特征集,获取对分类结果产生影响的特征指标,使得分类结果更加准确;并且通过有效剔除不相关的特征并获取高维特征空间中影响分类结果的主要特征,从而降低模型的复杂度,提高模型的泛化能力,采用投票法对多个预测分类模型结果进行综合判断也能够有效提高分类准确性。

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

为了便于理解,请参阅图1,图1为本申请一种阿尔兹海默症分类预测方法的一个实施例的方法流程图,如图1所示,图1中包括:

101、获取阿尔兹海默症患者的磁共振成像的图像样本,并预处理图像样本,获取图像样本的k个特征指标。

需要说明的是,首先需要获取公开的数据库中处于阿尔兹海默症不同阶段认知障碍人群的磁共振成像图像样本,通过对图像样本进行预处理,用brainnetome脑区模板划分成多个区域,然后采用freesurfer软件计算每个脑区的多种特征指标,从而获取到每个图像样本的所有特征指标。

102、采用多种特征选择算法将k个特征指标输入到特征选择算法对应的分类预测模型中,从k个特征指标中选取优质特征集,特征集中包括a个特征指标,a≤k。

需要说明的是,可以采用任意多个特征选择算法从图像样本的k个特征指标中选择出优质的特征指标,其特征选择算法都需要将k个特征指标输入到分类预测模型中判断其中的优质特征指标;其中,分类预测模型可以采用神经网络模型也可以是svm模型。

103、将优质特征子集输入到对应的预测分类模型中,得到分类结果。

需要说明的是,由于不同特征选择算法选择出的优质特征子集是不同的,其对应的分类预测模型也具有差异性;因此,对于不同的特征选择算法选取的优质特征集只能输入到对应的预测分类模型中,从而得到对应的分类结果。

104、采用投票法处理分类结果,得到测试者的预测结果。

需要说明的是,采用投票法对不同算法得到的分类结果进行投票,判断测试者是否患有阿尔兹海默症,若分类结果为患有阿尔兹海默症的数目大于分类结果为没患有阿尔兹海默症的数目,则表示测试者患有阿尔兹海默症,否则测试者没患有阿尔兹海默症。

本申请通过多种特征选择算法选取优质特征集,获取对分类结果产生影响的特征指标,使得分类结果更加准确;并且通过有效剔除不相关的特征并获取高维特征空间中影响分类结果的主要特征,从而降低模型的复杂度,提高模型的泛化能力,采用投票法对多个预测分类模型结果进行综合判断也能够有效提高分类准确性。

为了便于理解,本申请还提供了一种阿尔兹海默症分类预测方法另一个实施例,具体包括:

101、获取阿尔兹海默症患者的磁共振成像的图像样本,并预处理图像样本,获取图像样本的k个特征指标。

需要说明的是,首先需要获取公开的数据库中处于阿尔兹海默症不同阶段认知障碍人群的磁共振成像图像样本;对图像样本进行预处理,其中预处理包括去头骨、配准(使用brainnetome脑区模板进行配准)、白质分割、灰度归一化等操作。其中的配准是用brainnetome脑区模板划分成多个区域,具体可以划分成246个区域,其中36个区域为皮下区域,在具体实施例中可以只选取皮上层指标,即选取210个区域用于研究。然后采用freesurfer软件计算每个脑区的多种特征指标,具体可以包括8种特征指标,分别是:表面面积(area)、灰质体积(volume)、平均厚度(thickness)、厚度标准差(thicknessstd)、积分校正平均曲率(meancurv)、积分校正高斯曲率(gauscurv)、折叠指数(foldind)和内在曲率指数(curvind)。因此,在具体的研究过程中,可以获取到的总的特征指标为(246-36)*8=1680个,之后可以将预处理后的特征指标整理为特征表格,表格为n行k列,其中n表示图像样本个数,k表示总的特征指标数目。

102、采用多种特征选择算法将k个特征指标输入到特征选择算法对应的分类预测模型中,从k个特征指标中选取优质特征集,特征集中包括a个特征指标,a≤k。

需要说明的是,可以采用任意多个特征选择算法从图像样本的k个特征指标中选择出优质的特征指标,其特征选择算法都需要将k个特征指标输入到分类预测模型中判断其中的优质特征指标;其中,分类预测模型可以采用神经网络模型也可以是svm模型。

在一种具体的实施例中,特征选择算法可以为评价选择算法、遗传选择算法、方差选择算法。

评价选择算法具体为:首先将一个样本的k个特征指标训练对应的svm分类器,得到样本整体的准确度c,svm分类器即为分类预测模型;再从k个特征指标中选出第i个特征指标剔除,1≤i≤k,此时将剩余的特征指标训练svm分类器得到k-i个特征指标的准确度ci;则第i个特征指标的重要程度评估值为vi=c-ci;重复上述步骤可以得到每个特征指标的对应的重要程度评估值v={v0,v1,......vk-1}。将vi与预设的评估阈值做对比,在具体的实施例中是判断vi是否小于等于零,若是,则去除该不合格的重要程度评估值,剩余的所述重要程度评估值对应的特征指标为优质特征指标。在具体的实施例中,可以每次选择j个不合格的特征指标进行剔除,并训练对应的svm分类器,即第一个子集为k-j,第二个子集为k-2j,第b个子集为k-bj,每个子集对应训练一个svm分类模型,从而得到每个子集对应的准确度,从中选择准确度最高的子集作为优质特征集。

遗传选择算法具体为:首先获取从预处理中得到的特征表格,采用二进制编码初始化中群众的个体,即将特征表格中的每个特征随机设置为0或1,其中,0表示没有选中该特征指标,1代表选中该指标特征。采用这种方式初始化中群众的个体,其个体的编码长度为k,具体的为随机将k/2个码字设置为1,其余为0。用初始化后的个体去训练svm分类器,得到的个体对应的准确率,并将准确度作为该个体的适应度函数值,即选择标识为1对应的特征指标去训练svm分类器得到个体对应的准确度。需要说明的是,准确率越高其个体越优质。

将种群中的个体两两无重复的进行交叉操作,依次选择两个待交叉的个体,随机生成一个交叉位点即选择在个体中随机的码字处进行交叉操作。再选取个体中的随机的一个变异点进行变异,即该点码字如果是1,则变异为0,反之则变异为1。将交叉变异后的个体训练svm分类器得到对应个体的准确度,保留准确度排在前m的父代种群中的个体,再取前n-m个子代种群中的个体继续进行交叉变异,重复上述步骤,直到达到最大迭代次数,最终选择能够使分类器模型达到最优的优质特征子集,且该特征子集为最优特征集。

方差选择算法具体为:获取经预处理后得到的n行,k列的特征表格,其中n代表有n个样本,k代表每个样本里包含k个指标特征。首先计算样本中每列特征指标的方差,具体计算过程为:先计算表格中每列的均值,记为ud(代表第d列的均值);然后计算方差其中xid代表表格中第i个样本,第d个特征指标,n为表格中总体样本的数量,从而获得方差列表,方差列表中值的大小可以作为评估该特征对分类效果的重要程度,在具体的实施例中方差越大,其对分类效果越有帮助。

每次剔除掉m个方差最低的特征指标,并将剩余特征指标训练svm分类器,记录其准确率。第一个子集为k-m,第二个子集为k-2m,不断地剔除直到子集中的特征指标数目小于等于k/2,并记录每个子集对应的准确率,选择准确率最大的子集作为最优特征集。

103、将优质特征子集输入到对应的预测分类模型中,得到分类结果。

需要说明的是,由于不同特征选择算法选择出的优质特征子集是不同的,其对应的分类预测模型也具有差异性;因此,对于不同的特征选择算法选取的优质特征集只能输入到对应的预测分类模型中,从而得到对应的分类结果。

104、采用投票法处理分类结果,得到测试者的预测结果。

需要说明的是,采用投票法对不同算法得到的分类结果进行投票,判断测试者是否患有阿尔兹海默症,若分类结果为患有阿尔兹海默症的数目大于分类结果为没患有阿尔兹海默症的数目,则表示测试者患有阿尔兹海默症,否则测试者没患有阿尔兹海默症。在具体的实施例中,将测试者的三个优质特征子集训练对应的svm分类器得到分类结果,如果三个结果中至少有两个分类结果认为测试者患有阿尔兹海默症,则认定测试者患有阿尔兹海默症。

为了便于理解,请参阅图2,图2为本申请一种阿尔兹海默症分类预测系统的另一个实施例的系统框图,如图2所示,具体包括预处理模块201、优质特征选择模块202、预测分类模块203以及投票选择模块204。

预处理模块201用于获取阿尔兹海默症患者的磁共振成像的图像样本,并预处理图像样本,获取图像样本的k个特征指标。

优质特征选择模块202用于采用多种特征选择算法将k个特征指标输入到特征选择算法对应的分类预测模型中,从k个特征指标中选取优质特征集,优质特征集中包括a个特征指标,a≤k。

预测分类模块203用于将测试者的所述优质特征子集输入到对应的预测分类模型中,得到分类结果。

投票选择模块204用于采用投票法处理分类结果,得到测试者的预测结果。

本申请通过采用投票法处理所述分类结果,得到测试者的预测结果。本申请通过多种特征选择算法选取优质特征集,获取对分类结果产生影响的特征指标,使得分类结果更加准确;并且通过有效剔除不相关的特征并获取高维特征空间中影响分类结果的主要特征,从而降低模型的复杂度,提高模型的泛化能力,采用投票法对多个预测分类模型结果进行综合判断也能够有效提高分类准确性。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1