一种基于广义神经网络聚类的疾病病种诊疗方案预测方法_3

文档序号：9200574阅读：来源：国知局

模块中，广义神经网络求和层学习算法的推导公式如下：
[0086] 设随机变量X和y的联合概率密度函数为f (X，y)，已知X的观测值为X，则y相对 X的条件均值为：
[0087]
[0088] f表示在输入为X的条件下Y的预测输出。
[0089] 针对样本数据集{~ 用非参数估计，其密度函数
[0090]
[0091] 式中，Xi, Yi为随机变量X和y的观测值；样本容量η ;x的维数为p ; σ为高斯函数的宽度系数。用I(X9J)代替f(X，y)，并改变积分的顺序：
[0092]
[0093] 由吁
，对两个积分进行计算后可得网络的输出f(X)为：
[0094]
[0095] 本发明在研宄过程中针对医疗数据的复杂性和不确定性，以及能为临床医生提供快速的辅助决策支持，基于此，本发明以医院的电子病历为基础，以《中国高血压防治指南》为诊断依据，以实现对患者采用不同治疗方案中最优治疗方案为目的进行研宄。在Hadoop 环境中，以住院的高血压患者为背景，通过提取患者住院期间的个人信息、体征信息和检验检查指标等特征信息，采用模糊聚类分析方法对患者的病症特征进行模糊划分，获得聚类结果，并在此基础上构建基于减法聚类算法的广义神经网络模型，对模糊聚类的结果进行网络训练，并将训练结果反馈到电子病历中，针对新患者在接受临床路径时可能产生的治疗效果和治疗费用等进行预测，从而实现优化临床路径决策的目的。
[0096] 结合图1，本发明提供的一种基于模糊聚类分析的疾病病种诊疗方案的预测模型的具体实施步骤为：
[0097] 步骤1、以2011年1月-2012年12月住院的426948名高血压患者的572975条住院信息为研宄对象，选取出院小结表中患者的基本信息数据包括性别、年龄等，非结构化的患者诊断体征数据信息，以及患者在住院期间的检验检查数据信息。
[0098] 步骤2、对非结构化的体征数据进行结构化处理，提取患者与高血压相关的体征数据信息，包括：乏力、腹痛腹胀、恶心呕吐、咳嗽、气促、心悸、干湿罗音、发烧、胸痛胸闷、头昏头痛、尿频尿急、盗汗、口干、视力模糊、大便秘结、腰酸腰痛、呼吸音低粗、四肢麻木、睡眠质量差、咳痰、颈部肿块、耳鸣、精神萎靡、意识模糊、□齿含糊、压痛、背部酸痛、舌淡、抽搐和吞咽困难等共30项体征数据指标，并将患者的体征数据指标整理成0-1的稀疏矩阵。高血压患者体征数据分词频数如下所示：
[0099] 表1高血压患者症状体征
[0100]
[0101]
[0102] 步骤3、结合结构化处理后的患者体征数据，以及年龄、性别等人口特征数据，在此基础上补充患者的检验检查信息，包括肝功能指标：AST(谷草转氨酶）、ALT(谷丙转氨酶）；肾功能指标：BUN(尿素氮）；尿常规指标：尿PH值、尿蛋白、24小时尿钠、B-型钠尿肽、24小时尿钾和C反应蛋白、尿红细胞等；代谢功能指标：OGTT(葡萄糖耐量试验）（1小时、2小时、空腹）、糖化血红蛋白、尿ACR(尿蛋白和肌酐）、LDL (低密度蛋白胆固醇）等16项检验检查指标组成48维的患者信息矩阵，作为模型的输入矩阵。
[0103] 结合我国的实际情况，依据《中国高血压防治指南（2010年版）》，根据高血压的危险因素的个数、靶器官的损害程度，临床并发症的情况以及合并糖尿病的情况，将高血压患者分为不同的治疗类型。如下表所示：
[0104] 表2高血压患者心血管风险水平分层
[0105]
[0106] 依据临床医生的实际诊疗经验，我们取选择年龄和住院天数（不同年龄段的高血压患者的高血压的严重程度与患者的住院天数有密切关系）为高血压病种的预后指标。根据患者的临床特征对患者类型进行模糊属性赋值，表示患者病情的严重程度。
[0107] 步骤4、对数据进行预处理，运用最大最小值标准化法对数据进行标准化处理，保证所有的数据处于[0，1]之内，并在此基础上采用夹角余弦法对患者样本的相似度进行计算，同时根据医师临床经验和临床路径实施效果以及变量之间的相关系数以及变量与住院天数之间的相关系数，对不同的特征参数设置相应的权重值，标准化后的数据矩阵乘以相应权重，作为最终的模糊划分矩阵。
[0108] 步骤5、构建基于减法FCM聚类的模糊聚类分析模型：
[0109] (1)确定聚类中心：通过减法聚类算法根据每个高血压患者特征数据以及检验检查指标数据对聚类中心的影响确定临床路径聚类中心及聚类数，在此基础上经FCM算法迭代计算聚类结果。
[0110] 由减法聚类算法得到的初始化聚类中心如下表所示：
[0111] 表3基于减法FCM聚类的聚类中心
[0112]

[0114] (2)初始化FCM算法相关参数
[0115] 根据减法聚类算法获得的初始聚类中心，选择FCM算法加权指数m = 2 ;停止因子 ε = 0.001，e = 0.00001，设置b = 1，迭代次数为100次，采用FCM函数，进行算法迭代与计算；根据减法FCM聚类算法迭代步骤，经过算法不断迭代反复修改原始聚类中心，使FCM 算法模型中目标函数达到最小值。通过迭代反复修改聚类中心和分类矩阵，当迭代停止时，模糊聚类的聚类中心如下表所示：
[0116] 表3模糊聚类的聚类中心
[0117]
[0118]
[0119] 步骤6、构建基于广义神经网络聚类的临床路径诊疗方案模型：
[0120] 根据FCM模糊聚类结果，从每一类中选择最靠近类内中心的100组数据作为神经网络训练数据。
[0121] (1)确定广义神经网络的输入空间：高血压患者的48个病症特征模糊聚类够的聚类结果构成了模型的输入空间。网络的输入空间是由网络输入量和输入层构成的，同时实现修正输入数据的聚类数、聚类中心。
[0122] (2)基于减法聚类FCM的广义神经网络临床路径预测模型：根据上述基于减法聚类的FCM算法对样本数据进行迭代运算获得的5个聚类中心，即是广义神经网络模型的初始值，综合以上分析可得该实验模型的辨识网络结构为：
[0123] 输入层：输入变量为模糊聚类后的5个聚类结果，此层节点数为5 ;
[0124] 模式层：计算每个输入变量的对应隶属度，每个输入节点与每条模糊规则相连，因此该层的节点个数为5X5 = 25 ;
[0125] 求和层：依据加权求和规则数决定该层的节点数目，因此该层节点个数为5 ;
[0126] 输出层，分析计算适合患者的临床路径介入治疗方案，节点为1。
[0127] 利用基于减法聚类的FCM算法的广义神经网络模型对聚类结果的样本特征值进行训练，如下表所示。
[0128]
[0129] 由该表可知，说明基于减法聚类FCM与广义神经网络相结合的模型算法的匹配度高达93. 9%，模型输出相对误差绝对值范围在0-0. 002范围内，具有较强的学习能力，通过训练高血压患者临床路径介入治疗的患者病症特征参数，对患者实施临床路径的治疗，不仅能够丰富临床路径知识库，而且还可以辅助医师快速为新患

完整全部详细技术资料下载

当前第3页1 2 3 4