基于小样本的血管性认知障碍风险预测与模型训练方法、存储介质、云服务器及终端

文档序号:37311873发布日期:2024-03-13 21:01阅读:22来源:国知局
基于小样本的血管性认知障碍风险预测与模型训练方法、存储介质、云服务器及终端

本发明涉及医学疾病预测领域,尤其涉及基于小样本的血管性认知障碍风险预测与模型训练方法、存储介质、云服务器及终端。


背景技术:

1、血管性认知障碍(vci)源于脑血管疾病,涵盖了从主观认知下降到轻度认知障碍直至痴呆的一系列认知功能障碍,已成为老年人认知功能障碍的第二大病因。在痴呆的早期阶段,通过认知训练、运动训练和药物治疗,多数轻度认知障碍患者可以显著缓解症状并延缓疾病进展。然而痴呆早期通常只表现为记忆力减退,易被患者及家属忽视,从而错失早期干预的最佳时机。

2、当前,认知障碍的筛查方法包括标准化量表评估、脑脊液检查和功能性磁共振成像等。这些方法在社区人群的vci筛查中存在局限性。一方面,标准化量表评估需要具备相关专业资质的医学专业人员;另一方面,普通民众对血管性认知障碍的了解和重视程度还远远不足。因此一项简单易行、无创且适合于大规模筛查的方法变得更加迫切需要。

3、当前,许多机器学习自动化方法被广泛应用于早期疾病预测。例如,bougea等人探讨了逻辑回归、k最近邻以及集成模型在预测帕金森病痴呆和路易体痴呆方面的有效性。jin等人采用随机梯度提升和多层感知器等模型进行痴呆症的自动预测分类。stamate等人应用深度学习和其他监督式机器学习方法(如随机森林和极端梯度提升)检测血液中痴呆亚型(ad)。bansal等人则对比分析了使用临床变量的随机森林、多层感知器等模型在检测痴呆方面的性能。salem等人开发了一种基于回归的模型,通过对少数类过采样和多数类欠采样来处理痴呆症预测中的数据不平衡问题。categorical boosting(catboost)也常被用作疾病预测。张倩等人研究了利用支持向量机模型结合血管性高危因素预测血管性轻度认知障碍。因此,许多痴呆疾病预测都倾向于采用机器学习模型,这得益于它们在预测患者未来两年内痴呆进展方面的性能超过了人类判断。不难得出,现有vci预测一般将机器学习模型应用到决策树、神经网络、支持向量机等算法中,从而预测患者是否患有血管性认知障碍。这些算法是利用患者的体征、生物标志物等数据进行学习和训练的,通过学习数据中心血管疾病的规律和特征,从而预测患者发生心血管疾病的概率,但仍存在以下问题:

4、(1)从医院中获取到的真实病例数据过于稀疏,不仅容易导致数据过拟合,还可能掩盖特征间的潜在关联,进而影响模型预测的准确度;

5、(2)病例数据中存在较多的无关特征,这使得结果缺乏可解释性,且由于难以捕捉数据中的规律性,还需要依赖更多数据进行可靠的统计推断,而这恰恰又与上一技术问题相呼应——即难以获取充足的病例数据。

6、综上,如何在数据量小且无关特征较多的情况下,提升vci预测准确率是目前亟需解决的技术问题。


技术实现思路

1、本发明的目的在于克服现有技术的问题,提供了一种基于小样本的血管性认知障碍风险预测与模型训练方法、存储介质、云服务器及终端。

2、本发明的目的是通过以下技术方案来实现的:基于小样本的血管性认知障碍风险预测方法,该方法包括以下步骤:

3、建立以蒙特利尔认知评估量表评分为目标的原始特征集,原始特征集包括临床评估数据、患者医疗历史数据和生物标志物数据;

4、将遗传算法和n个模型分别结合进行特征选择,根据各模型分类准确度的分值确定排序靠前的k个性能优异的模型,并将各模型的最优特征子集合并得到合并特征子集;

5、采用集成算法融合k个模型得到融合模型,利用遗传算法对合并特征子集进行优化,以以此对融合模型进行训练。

6、在一示例中,所述特征选择包括以下子步骤:

7、数据初始化:设置最大进化代数,随机生成的个体数及其所构成的群体;

8、个体评价:计算群体中各个体的适应度,适应度为基于特征子集的模型分类准确率;

9、判断适应度是否达到期望值或迭代次数是否达到最大值,若是,停止迭代,输出最优特征;若否,进行选择、交叉、适应度计算,并判断适应度是否达到期望值或迭代次数是否达到最大值,若是,停止迭代,输出最优特征;若否,进行变异计算,并跳转至个体评价步骤。

10、在一示例中,所述适应度计算表达式为:

11、fitness(x)=α*f1(model(x))-β*num(x)

12、其中,x是特征子集;f1(model(x)是使用该特征子集的模型的f1分数,f1分数是模型分类性能的评估指标;num(x)是特征子集中的特征数量;α表示f1得分权重;β表示特征数量权重。

13、在一示例中,所述选择计算的表达式为:

14、winner=max(fitness(xi),fitness(xj))

15、其中,winner表示两个个体中适应度较高的个体。

16、在一示例中,所述交叉计算的表达式为:

17、child1,child2=cxuniform(parent1,parent2,p)

18、其中,parent1,parent2表示父代的两个个体;cxuniform是执行均匀交叉操作的函数;child1,child2表示通过交叉操作得到的两个子代个体;p表示基因交换概率。

19、在一示例中,所述变异计算为:

20、采用位翻转突变,通过对个体中的每一个基因按变异概率取非,以引入新的遗传多样性。

21、需要进一步说明的是,上述训练方法各示例对应的技术特征可以相互组合或替换构成新的技术方案。

22、本发明还包括一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一项或多项示例形成的所述基于小样本的血管性认知障碍风险预测模型的训练方法的步骤。

23、本发明还包括一种云服务器,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述任一项或多项示例形成的所述基于小样本的血管性认知障碍风险预测模型的训练方法的步骤。

24、本发明还包括基于小样本的血管性认知障碍风险预测方法,该方法基于上述任一项或多项示例形成的训练方法基础上实施,获取已经完成训练的融合模型后,将预测样本输入融合模型,融合模型基于投票机制确定的最终分类结果。

25、本发明还包括一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行所述基于小样本的血管性认知障碍风险预测方法的步骤。

26、与现有技术相比,本发明有益效果是:

27、本发明提出了遗传算法和集成学习算法的协同机制,通过特征选择能够使融合模型掩盖无关特征以增强模型的可解释性,保证特征选择的全局最优性,增强了模型决策过程的透明性;利用集成算法对多个机器学习算法进行融合,显著提高了数据稀疏情况下融合模型的vci预测准确性,该协同机制为复杂和罕见疾病诊断提供了开创性和高效的算法范式。



技术特征:

1.基于小样本的血管性认知障碍风险预测模型的训练方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于小样本的血管性认知障碍风险预测模型的训练方法,其特征在于:所述特征选择包括以下子步骤:

3.根据权利要求2所述的基于小样本的血管性认知障碍风险预测模型的训练方法,其特征在于:所述适应度计算表达式为:

4.根据权利要求2所述的基于小样本的血管性认知障碍风险预测模型的训练方法,其特征在于:所述选择计算的表达式为:

5.根据权利要求2所述的基于小样本的血管性认知障碍风险预测模型的训练方法,其特征在于:所述交叉计算的表达式为:

6.根据权利要求2所述的基于小样本的血管性认知障碍风险预测模型的训练方法,其特征在于:所述变异计算为:

7.一种存储介质,其上存储有计算机指令,其特征在于:所述计算机指令运行时执行权利要求1-6任意一项所述的基于小样本的血管性认知障碍风险预测模型的训练方法的步骤。

8.一种云服务器,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,其特征在于:所述处理器运行所述计算机指令时执行权利要求1-6任意一项所述的基于小样本的血管性认知障碍风险预测模型的训练方法的步骤。

9.基于小样本的血管性认知障碍风险预测方法,其特征在于:获取权利要求1-6任一项完成训练的融合模型,将预测样本输入融合模型,融合模型基于投票机制确定的最终分类结果。

10.一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,其特征在于:所述处理器运行所述计算机指令时执行权利要求9所述的基于小样本的血管性认知障碍风险预测方法的步骤。


技术总结
本发明公开了基于小样本的血管性认知障碍风险预测与模型训练方法、存储介质、云服务器及终端,属于医学疾病预测领域,训练方法包括:建立以MoCA评分为目标的原始特征集;结合遗传算法选择K个性能最优的模型并确定选择的特征子集;采用集成算法融合K个模型并利用遗传算法对特征子集再进行优化,以此对融合模型进行训练。本发明提出了遗传算法和集成学习算法的协同机制,通过特征选择能够使融合模型掩盖无关特征以增强模型的可解释性,保证特征选择的全局最优性;利用集成算法对多个机器学习算法进行融合,显著提高了数据稀疏情况下融合模型的VCI预测准确性。

技术研发人员:钱伟中,韩雨恒,羊源婷,夏勋,李林涛,朴振宇,邓平
受保护的技术使用者:电子科技大学
技术研发日:
技术公布日:2024/3/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1