一种基于K-means的癌症预嘱指标数据分析系统

文档序号:29704752发布日期:2022-04-16 15:24阅读:165来源:国知局
一种基于K-means的癌症预嘱指标数据分析系统
一种基于k-means的癌症预嘱指标数据分析系统
技术领域
1.本发明涉及智慧医疗领域,尤其涉及一种基于k-means的癌症预嘱指标数据分析系统。


背景技术:

2.癌症高发病率和高死亡率导致癌症患者面临这多种抢救措施,各种病症对应不同的预嘱指标,癌症患者对于自己身体状况的不清晰了解以及医护人员与家属沟通的不确定性,导致以下几点:(1)癌症患者相关知识缺乏、决策困难,医护人员与患者相关沟通困难,患者无法及时得到自己的疾病措施结果,生命自主权难以得到保证,家属决策时道德精神负担严重,无法充分体现对癌症患者自主权的尊重。(2)医疗资源得不到节约充分利用。随着智慧医院等级评价标准的实施,很多医院在智能化建设过程中,尤其是大型三级综合医院,医院信息系统大多停留在业务处理阶段,智能化程度不高。(3)市场上的智能医疗支持系统大多缺乏对医院实际医疗数据的支持,难以达到适合临床应用的效果。(4)在实际使用过程中,医疗数据的整合和利用也非常困难。由于缺乏对医疗数据的分析和有效工具,难以有效提取数据的有用价值,同时救助工作的范围很广,学科特点明显,有很多跨学科的知识,学科规则和模型的建立难以全面。


技术实现要素:

3.本发明的目的在于克服现有技术的不足,提供一种基于k-means的癌症预嘱指标数据分析系统。
4.本发明的目的是通过以下技术方案来实现的:
5.本发明的第一方面,提供一种基于k-means的癌症预嘱指标数据分析系统,包括:
6.历史数据获取模块:用于获取历史医疗数据,所述历史医疗数据包括预嘱指标和医疗参数;
7.医疗数据划分模块:用于将历史医疗数据中的医疗参数形成数据点,随机划分至与预嘱指标类别相同的n个子集中;
8.聚类计算模块:用于计算每个子集中每一个数据点到各个子集的簇中心的距离,并将每个数据点指派到离该数据点最近的簇中心的子集;并在对应子集更新后计算各个子集的所有数据点的均值,对簇中心进行更新;直到簇中心收敛;
9.子集类别划分模块:用于将得到的n个子集按照历史医疗数据划分为对应的预嘱指标,形成模型。
10.进一步地,所述预嘱指标q包括心肺复苏、气管切开、癌性疼痛。
11.进一步地,所述医疗参数包括血氧饱和度、脉搏、呼吸。
12.进一步地,所述医疗参数还包括身体、体重。
13.进一步地,所述医疗参数还包括参数对应的权值。
14.进一步地,所述聚类计算模块包括:
15.初始簇中心子模块:用于随机指派子集中的一个数据点作为初始簇中心;
16.距离计算与指派子模块:用于计算每个子集中每一个数据点到各个子集的簇中心的距离,并将每个数据点指派到离该数据点最近的簇中心的子集;
17.簇中心更新子模块:用于在数据点指派到其他子集后,计算各个子集的所有数据点的均值,对簇中心进行更新;
18.迭代与收敛判断子模块:用于判断簇中心是否收敛,如果不是则重新使用距离计算与指派子模块和簇中心更新子模块。
19.进一步地,所述计算每个子集中每一个数据点到各个子集的簇中心的距离的计算方式为:
[0020][0021]
式中,x表示子集中的数据点,y表示簇中心,1-d表示子集数。
[0022]
进一步地,所述计算各个子集的所有数据点的均值的计算方式为:
[0023][0024]
式中,ci表示第i个子集,xj表示ci的第j个数据点,ui表示ci的均值即簇中心。
[0025]
进一步地,所述判断簇中心是否收敛的计算方式包括:
[0026][0027]
即簇中心收敛时,使得组内平方和最小。
[0028]
进一步地,所述系统还包括:
[0029]
预嘱指标判断模块:将患者医疗数据输入至所述模型,形成簇类中心,后续新数据输入时,判断属于n个子集中的某一个或者几个,输出新数据对应的预嘱判断结果。
[0030]
本发明的有益效果是:
[0031]
(1)在本发明的一示例性实施例中,使用聚类算法,减少医护工作者的工作量,使用病患实时数据,让患者及时得到自己的抢救措施与结果,提高医院智能化程度,将医患数据整合在一起,提高了医院的智能化运行程度,为其他病理研究做好基础。具体地,患者病情一旦发生变化,则该系统会自动更新预嘱种类并提示医务人员以及患者本人,医务人员可以采取措施契合患者应对acp的决策。同时患者能自主选择抢救与否,提高自己的生命自主权,减轻了家属做决策时的道德背离感。
[0032]
(2)在本发明的一示例性实施例中,公开了预嘱指标q包括心肺复苏、气管切开、癌性疼痛;并且还公开了医疗参数和权值,公开了医疗数据模型生成的簇类中心。
[0033]
(3)在本发明的一示例性实施例中,公开了各个模块和子模块的具体实现方式。其中,在进行第一次迭代时,簇类质心是一个随机选择或者手动创建的点,采用该种方式(即第一次不进行平均计算)可以节约计算次数。
附图说明
[0034]
图1为本发明一示例性实施例提供的一种基于k-means的癌症预嘱指标数据分析系统的结构示意图。
具体实施方式
[0035]
下面结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0036]
在本发明的描述中,需要说明的是,属于“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方向或位置关系为基于附图所述的方向或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,属于“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0037]
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,属于“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
[0038]
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
[0039]
参见图1,图1示出了一示例性实施例提供的一种基于k-means的癌症预嘱指标数据分析系统,包括:
[0040]
历史数据获取模块:用于获取历史医疗数据,所述历史医疗数据包括预嘱指标和医疗参数;
[0041]
医疗数据划分模块:用于将历史医疗数据中的医疗参数形成数据点,随机划分至与预嘱指标类别相同的n个子集中;
[0042]
聚类计算模块:用于计算每个子集中每一个数据点到各个子集的簇中心的距离,并将每个数据点指派到离该数据点最近的簇中心的子集;并在对应子集更新后计算各个子集的所有数据点的均值,对簇中心进行更新;直到簇中心收敛;
[0043]
子集类别划分模块:用于将得到的n个子集按照历史医疗数据划分为对应的预嘱指标,形成模型。
[0044]
具体地,在该示例性实施例中,使用聚类算法,减少医护工作者的工作量,使用病患实时数据,让患者及时得到自己的抢救措施与结果,提高医院智能化程度,将医患数据整合在一起,提高了医院的智能化运行程度,为其他病理研究做好基础。具体地,患者病情一旦发生变化,则该系统会自动更新预嘱种类并提示医务人员以及患者本人,医务人员可以采取措施契合患者应对acp的决策。同时患者能自主选择抢救与否,提高自己的生命自主权,减轻了家属做决策时的道德背离感。
[0045]
其中,对于在该示例性实施例中,所述预嘱指标q包括心肺复苏、气管切开、癌性疼痛。所述医疗参数包括血氧饱和度、脉搏、呼吸;并且优选地,所述医疗参数还包括身体、体
重;另外,所述医疗参数还包括参数对应的权值,权值是指每一个数据在判断最终预嘱指标生成中所占的比重。
[0046]
下述内容将对各个模块进行详细说明:
[0047]
对于历史数据获取模块,其用于获取历史医疗数据,所述历史医疗数据包括预嘱指标和医疗参数。更为具体地,医疗数据处理,将医疗数据使用决策树计算每一个数据对最终结果的影响,使用决策树分类法,将数据进行筛选,得到血氧饱和度、脉搏、呼吸能够最终影响结果,使用决策树将冗杂繁复的医疗数据筛选出来,只留下影响最终数据结果的数据值;之后,将数据集导入,其中包含选取的数据指标以及权值,其中主诊断主要用于检测最终形成的预嘱指标,其余数据辅助决策抢救成功率。另外,还可以将每一位患者的数据进行分割,形成单独的个体,采用三层架构,使医院所有信息系统形成一种松耦合、粗粒度的结构,同时对现有的his、lis、emr等系统中存在的相关性指标进行提取,形成结构化病历指标池。对于医疗数据划分模块,将所有数据划分到三个空集中。
[0048]
更优地,在一示例性实施例中,对于所述聚类计算模块,包括:
[0049]
初始簇中心子模块:用于随机指派子集中的一个数据点作为初始簇中心。
[0050]
其中,初始化簇中心即为计算当前分区中的簇类质心(质心是这个簇的平均点),在进行第一次迭代时,簇类质心是一个随机选择或者手动创建的点(采用该种方式(即第一次不进行平均计算)可以节约计算次数),在之后的迭代次数中不断根据新输入的数据进行计算吗,即会重新计算所有簇的平均值,从而重新创建所有簇的质心。
[0051]
距离计算与指派子模块:用于计算每个子集中每一个数据点到各个子集的簇中心的距离,并将每个数据点指派到离该数据点最近的簇中心的子集。
[0052]
其中,在聚类中,对象根据相互之间的距离结合或者分离。这些距离被称作相异度(当对象互相远离时)或者相似度(当对象互相接近时)。
[0053]
更优地,在一示例性实施例中,本发明使用欧几里得距离对数据点与质心之间距离进行计算,欧几里得距离是聚类分离对象时最常见的距离类型,是在未经修改的原始数据上计算,同时添加新对象不会影响计算出来的距离。
[0054]
所述计算每个子集中每一个数据点到各个子集的簇中心的距离的计算方式为:
[0055][0056]
式中,x表示子集中的数据点,y表示簇中心,1-d表示子集数。
[0057]
簇中心更新子模块:用于在数据点指派到其他子集后,计算各个子集的所有数据点的均值,对簇中心进行更新。
[0058]
其中,所述计算各个子集的所有数据点的均值的计算方式为:
[0059][0060]
式中,ci表示第i个子集,xj表示ci的第j个数据点,ui表示ci的均值即簇中心。
[0061]
迭代与收敛判断子模块:用于判断簇中心是否收敛,如果不是则重新使用距离计算与指派子模块和簇中心更新子模块。
[0062]
具体地,划分簇类最终是使得一个组中的成员与其相应的质心之间的距离最小。
采用形式化表示,目标就是将多个数据划分到3个集合,使得簇内平方和或者组内平方和最小。对应的公式为:所述判断簇中心是否收敛的计算方式包括:
[0063][0064]
即簇中心收敛时,使得组内平方和最小。
[0065]
反复对算法进行迭代,每一步都会根据各个现有簇的当前中心重新计算簇中各个对象的成员关系,迭代处理各个值向量,并计算平均值向量。一旦找到平均值,这就是新的中心。这个算法会反复迭代,直至质心不再变化,此时就找到了本示例性实施例想要的n个簇。由于k-means算法是一个迭代过程,每一步都会根据各个现有簇中的数据点,直到达到我们期望的簇数。
[0066]
更优地,在一示例性实施例中,所述系统还包括:
[0067]
预嘱指标判断模块:将患者医疗数据输入至所述模型,形成簇类中心,后续新数据输入时,判断属于n个子集(在一优选示例性实施例中为3个子集)中的某一个或者几个,输出新数据对应的预嘱判断结果。
[0068]
具体地,根据前述示例性实施例,根据形成的簇数,将n个簇划分为心肺复苏、气管切开、癌性疼痛,对终末期患者进行评估。患者病情一旦发生变化,则该系统会自动更新预嘱种类并提示医务人员以及患者本人,医务人员可以采取措施契合患者应对acp的决策。同时患者能自主选择抢救与否,提高自己的生命自主权。
[0069]
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定,对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其他不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1