构建认知障碍智能预测方法

文档序号:26585344发布日期:2021-09-10 18:59阅读:197来源:国知局
构建认知障碍智能预测方法

1.本技术涉及互联网技术领域,尤其涉及一种构建认知障碍智能预测方法。


背景技术:

2.认知障碍的发病与患者基本情况、生活习惯、身体状况、以及病史、治疗等情况都密切相关。目前尚不完全清楚哪些因素与认知障碍的发病有高度相关。也没有能够针对认知障碍风险实现预测的有效模型。
3.传统ad的筛查多使用mmse、moca等评分工具。这类量表往往需要通过医务人员指导被评估人,并且进行专业的量化评分才能得出结果。而更完整的系统问卷涉及上百问项,填写时间耗时巨大,最终评估结果需要很长时间才能计算出来。
4.现有技术中的认知障碍智能预测检测费时费力,不能实现快速自动化检测。


技术实现要素:

5.为了解决现有技术中的认知障碍智能预测检测费时费力,不能实现快速自动化检测的问题,本发明提供一种构建认知障碍智能预测方法,包括以下步骤,s1获取原始问卷数据;
6.s2数据清洗;
7.s3数据预处理及可视化处理;
8.s4结合专家知识特征筛选和智能算法特征筛选获取特征子集;
9.s5构建认知障碍智能预测模型;
10.s6采用十折交叉验证来检验构建认知障碍智能预测模型的有效性;
11.s7结合专家知识进行模型的调试优化;
12.s8采用认知障碍智能预测进行老年痴呆早期筛查。
13.进一步的,所述步骤s3具体包括,对特征的集成和变换、数据的离散化和归约,将277个原始问项扩展得到324个变量的向量,生成1121个二元变量。
14.进一步的,步骤s4具体包括专家知识特征选择和智能算法特征选择两个环节,在第一环节,基于专家知识剔除一些已知在数据收集过程中存在偏倚的问项、不适合作为预测因子的问项,以及需要专业人员进行评估、非简易的问项,由此从324个变量的向量降维到212个变量的向量,在第二环节,通过智能算法特征选择将212个变量的向量降维到具有高预测能力的关键20个变量的向量。
15.进一步的,所述步骤s6包括,采用随机分层抽样技术构建样本量比例为9:1的训练集和测试集配对数据集共10组;建模算法涉及的任何抽样或加权等改变正负例样本比例或权重的操作只限于训练集,测试集只用于已训练模型的性能评估,保证模型性能评估的严谨性;计算10组配对数据集的预测建模平均性能用于评估本发明建模方法的有效性。
16.进一步的,所述步骤s7包括,结合专家知识,对数据特征变量进行增删或集成、变换,调整模型参数,以达到预测模型的最佳效能。
17.本发明的有益效果是,根据患者的基本情况、生活习惯、身体状况、以及病史、治疗等相关因素,通过数据挖掘,分析出与认知障碍发病最为相关的、适合大众自评的预测因子20个。构建的智能预测模型可将问项控制在20项左右,只需要很少的时间填写,填写完毕立即可以获得评估结果,包括风险高低分类和风险概率估计,可以满足临床实践需要,模型预测准确率达到70%、召回率等至少达到70%,本发明构建评估问项简单易懂、操作简单、无需专业医护人员指导、适合大众自评、预测准确率高的智能预测模型。
附图说明
18.图1为本发明流程图。
19.图2十折交叉验证示意图。
具体实施方式
20.为了使本发明的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本发明做进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
21.如图1所示,本发明提供一种构建认知障碍智能预测方法,包括以下步骤,
22.s1获取原始问卷数据;
23.s2数据清洗;
24.s3数据预处理及可视化处理;
25.s4结合专家知识特征筛选和智能算法特征筛选获取特征子集;
26.s5构建认知障碍智能预测模型;
27.s6采用十折交叉验证来检验构建认知障碍智能预测模型的有效性;
28.s7结合专家知识进行模型的调试优化;
29.s8采用认知障碍智能预测进行老年痴呆早期筛查。
30.本发明步骤s2具体包括,对数据进行缺失值处理,平滑噪声数据处理,识别、删除孤立点,不一致性处理。
31.本发明步骤s3具体包括,对特征的集成和变换、数据的离散化和归约,将277个原始问项扩展得到324个变量的向量,生成1121个二元变量。
32.本发明步骤s4具体包括专家知识特征选择和智能算法特征选择两个环节。在第一环节,基于专家知识剔除一些已知在数据收集过程中存在偏倚的问项、不适合作为预测因子的问项,以及需要专业人员进行评估、非简易的问项,由此从324个变量的向量降维到212个变量的向量。在第二环节,通过智能算法特征选择将212个变量的向量降维到具有高预测能力的关键20个变量的向量,以满足最终模型的准确性和易用性要求,所述智能算法包括,方差选择法、相关系数法、卡方检验、互信息、递归特征消除法、决策树法。
33.所述步骤s5包括,
34.采用数据挖掘和机器学习领域的多种预测/分类算法(决策树、随机森林、本发明提供的认知障碍智能预测模型、贝叶斯网络、支持向量机、神经网络等)作为候选建模算法库。通过搜索建模算法及其参数的不同组合,构建候选模型库。通过10折交叉验证(10

foldcrossvalidation)模式,根据预测准确率(accuracy)、召回率、auc(areaunderroc)等
模型预测性能评价指标从候选模型库中选择最优模型。
35.构建模型包括对特征选择结果以及最终模型的参数和/或结构进行医学解读,以避免由于“数据窥探”而导致模型过拟合(over

fitting),实现模型预测性能和合理性的平衡。
36.所述步骤s6包括,
37.采用随机分层抽样技术构建样本量比例为9:1的训练集和测试集配对数据集共10组;建模算法涉及的任何抽样或加权等改变正负例样本比例或权重的操作只限于训练集,测试集只用于已训练模型的性能评估,保证模型性能评估的严谨性;计算10组配对数据集的预测建模平均性能用于评估本发明建模方法的有效性。
38.所述步骤s7包括,结合专家知识,对数据特征变量进行增删或集成、变换,调整模型参数,以达到预测模型的最佳效能。
39.本发明通过比较knn、决策树(decisiontree)、随机森林(randomforest)、本发明的认知障碍智能预测模型、朴素贝叶斯网络(bayes)、支持向量机(svm)、adaboost等。以auc、ca、f1

measure等常用性能评估指标作为度量,获得下表所示的多模型性能对比结果。实验结果表明,本发明提供的模型auc指标最高。
40.基于212个特征的候选模型性能对照表
[0041][0042]
本发明提供的认知障碍智能预测模型包括以下步骤,
[0043]
依据步骤s4获取的p个独立变量的向量x

=(x1,x2,x
p
),设条件概率p(y=1|x)=p为根据观测量相对于认知障碍事件发生的概率,认知障碍智能预测模型可表示为
[0044][0045]
将测试数据含有的名义变量变为虚拟变量,即具有k个取值的名义变量变为k

1个虚拟变量,d为虚拟变量;
[0046][0047]
j和l表示中间变量。
[0048]
参数β0,β1,

,β
p
为最大释然估计参数;
[0049]
定义不发生认知障碍的条件概率为
[0050][0051]
那么,认知障碍发生与认知障碍不发生的概率之比为
[0052][0053]
对上式取对数得到
[0054][0055]
对n个观测样本x1,x2,

,xn,观测值分别为y1,y2,

,y
n

[0056]
各联合分布可以表示为各边际分布的乘积。
[0057][0058]
对上述函数求对数
[0059][0060]
对上述函数求导,得到似然方程。
[0061][0062]
j=1,2,..,p,p为独立向量个数,
[0063]
对l(β)求二阶偏导数,
[0064][0065]
将上式写成矩阵形式,以h表示上述矩阵,x表示
[0066]

[0067][0068]
则h=x
t
vx。
[0069]
再令
[0070]
将上市转变为牛顿迭代法的形式
[0071]
w
new
=w
old

h
‑1u
[0072]
上式中矩阵h为对称正定的,求解h
‑1u即为求解线性方程h x=u中的矩阵x,将h表示成一个下三角矩阵l和其转置的乘积的分解。
[0073]
将最大似然估计的渐近方差和协方差由信息矩阵的逆矩阵估计出来。
[0074]
信息矩阵实际是l(β)二阶导数的负值,表示为
[0075]
估计值的方差和协方差表示为var(β)=i
‑1,
[0076]
估计值β
j
的方差为矩阵i的逆矩阵的对角线上的值,而估计值β
j
和β
l
的协方差(β
j
和β
l
的协方差等于)为除了对角线以外的值
[0077]
使用估计值β
j
的标准方差,表示为
[0078][0079]
求解参数β0,β1,

,β
p
的值。
[0080]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read

only memory,rom)或随机存储记忆体(randomaccess memory,ram)等。
[0081]
显然,本领域的技术人员应该明白,上述本发明的各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在计算机存储介质(rom/ram、磁碟、光盘)中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以,本发明不限制于任何特定的硬件和软件结合。
[0082]
以上内容是结合具体的实施方式对本发明所做的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1