一种基于疾病聚类的共病轨迹分类方法和系统

文档序号:40531155发布日期:2024-12-31 13:45阅读:14来源:国知局
一种基于疾病聚类的共病轨迹分类方法和系统

本发明涉及医学健康,尤其涉及一种基于疾病聚类的共病轨迹分类方法和系统。


背景技术:

1、在医学健康领域,共病轨迹聚类技术具有广泛的应用前景。该技术基于疾病发生发展的数据,通过聚类算法将疾病轨迹按照相似性进行分组,以揭示共病发生发展模式的特征。这种技术能够帮助医生更好地识别和管理具有相似健康问题的患者群体,制定更有效的治疗方案和预防措施。此外,该技术还可用于研究疾病的发病机制和流行规律,为公共卫生政策制定提供科学依据。

2、然而,现有轨迹聚类方法对于疾病轨迹的聚类存在显著的局限性。由于某些常见疾病(如高血压)与其他多种疾病之间存在广泛而紧密的关联,现有的聚类方法往往错误地将这些相关性不高的疾病轨迹归并至同一群组。以高血压为例,其在多种疾病的发展路径中均有出现,但当前聚类技术经常将含有高血压的疾病轨迹无差别地聚类,即使这些轨迹在临床实践中并不具有高度的相关性,因此,无法捕捉共病的特点、针对共病的聚类精确率低,进而影响治疗方案和预防措施的精准性。


技术实现思路

1、鉴于上述的分析,本发明实施例旨在提供一种基于疾病聚类的共病轨迹分类方法和系统,用以解决现有共病轨迹分类精确率低的问题。

2、一方面,本发明实施例提供了一种基于疾病聚类的共病轨迹分类方法,包括以下步骤:

3、获取共病轨迹数据,提取共病轨迹数据中的所有疾病,计算疾病间的相关性;

4、基于所述疾病间的相关性判断疾病的属性,基于疾病的属性对共病轨迹数据中的所有疾病进行二分巢式聚类,所述疾病的属性包括枢纽疾病和非枢纽疾病;

5、根据疾病聚类结果和每个疾病的属性得到每条共病轨迹的类型。

6、基于上述方法的进一步改进,基于所述疾病间的相关性判断疾病的属性,基于疾病的属性对共病轨迹数据中的所有疾病进行二分巢式聚类,包括:

7、s20、对所有疾病集合进行二分类聚类得到两个子类疾病集合;

8、s21、对于每个子类疾病集合,基于该子类疾病集合中疾病间的相关性判断该子类疾病集合中每个疾病的属性;若该子类疾病集合存在枢纽疾病并且非枢纽疾病的数量大于第一阈值,则将该子类疾病集合作为一个待聚类子集,否则,该子类疾病集合为聚类结果中的一个集;

9、s22、若存在待聚类子集,则执行s23-s25,否则,结束聚类;

10、s23、对每个待聚类子集,剔除该待聚类子集中疾病属性为枢纽疾病的疾病;

11、s24、对每个剔除枢纽疾病的待聚类子集,进行二分类聚类得到每个待聚类子集对应的两个子类疾病集合;

12、s25、返回步骤s21。

13、基于上述方法的进一步改进,采用以下方式基于该子类疾病集合中疾病间的相关性判断该子类疾病集合中每个疾病的属性:

14、计算该子类疾病集合中疾病间的相关性的q-分位点,基于所述q-分位点以及疾病间的相关性构建该子类疾病集合对应的无向网络;

15、计算无向网络中每个节点的度,基于每个节点的度确定该节点对应疾病的属性。

16、基于上述方法的进一步改进,若节点的度dd>α×(|b|-1),则节点对应的疾病为枢纽疾病,否则该节点对应的疾病为非枢纽疾病,α表示比例参数,|b|表示子类疾病集合b的疾病数量。

17、基于上述方法的进一步改进,根据疾病聚类结果和每个疾病的属性采用以下方式得到每条共病轨迹的类型:

18、对于每条共病轨迹,若该共病轨迹不存在非枢纽疾病,则该共病轨迹属于枢纽类共病轨迹;否则:

19、若仅存在一个聚类类型,该共病轨迹中有超过第一数量的疾病属于所述聚类类型,则该共病轨迹的类型为所述聚类类型;

20、若存在两个以上聚类类型,对于所述两个以上聚类类型中的每个聚类类型,该共病轨迹中均有超过第一数量的疾病属于所述聚类类型,则该共病轨迹中第一个非枢纽疾病所属的聚类类型为该共病轨迹的类型;

21、否则,该共病轨迹属于混合类共病轨迹。

22、基于上述方法的进一步改进,采用以下方式计算疾病间的相关性:

23、

24、其中,表示第i个疾病di和第j个疾病dj间的相关性,表示同时包含di和dj的共病轨迹的数量,表示包含di或dj的共病轨迹的数量。

25、另一方面,本发明实施例提供了一种基于疾病聚类的共病轨迹分类系统,包括以下模块:

26、相关性计算模块,用于获取共病轨迹数据,提取共病轨迹数据中的所有疾病,计算疾病间的相关性;

27、疾病聚类模块,用于基于所述疾病间的相关性判断疾病的属性,基于疾病的属性对共病轨迹数据中的所有疾病进行二分巢式聚类,所述疾病的属性包括枢纽疾病和非枢纽疾病;

28、轨迹分配模块,用于根据疾病聚类结果和每个疾病的属性得到每条共病轨迹的类型。

29、基于上述系统的进一步改进,基于所述疾病间的相关性判断疾病的属性,基于疾病的属性对共病轨迹数据中的所有疾病进行二分巢式聚类,所述疾病的属性包括枢纽疾病和非枢纽疾病,包括:

30、s20、对所有疾病集合进行二分类聚类得到两个子类疾病集合;

31、s21、对于每个子类疾病集合,基于该子类疾病集合中疾病间的相关性判断该子类疾病集合中每个疾病的属性;若该子类疾病集合存在枢纽疾病并且非枢纽疾病的数量大于第一阈值,则将该子类疾病集合作为一个待聚类子集,否则,该子类疾病集合为聚类结果中的一个集;

32、s22、若存在待聚类子集,则执行s23-s25,否则,结束聚类;

33、s23、对每个待聚类子集,剔除该待聚类子集中疾病属性为枢纽疾病的疾病;

34、s24、对每个剔除枢纽疾病的待聚类子集,进行二分类聚类得到每个待聚类子集对应的两个子类疾病集合;

35、s25、返回步骤s21。

36、基于上述系统的进一步改进,采用以下方式基于该子类疾病集合中疾病间的相关性判断该子类疾病集合中每个疾病的属性:

37、计算该子类疾病集合中疾病间的相关性的q-分位点,基于所述分位点,以该子类疾病集合中的疾病为节点、疾病间的相关性为边构建该子类疾病集合对应的无向网络;

38、计算无向网络中每个节点的度,基于每个节点的度确定该节点对应疾病的属性。

39、基于上述系统的进一步改进,若节点的度dd>α×(|b|-1),则节点对应的疾病为枢纽疾病,否则该节点对应的疾病为非枢纽疾病,α表示比例参数,|b|表示子类疾病集合b的疾病数量。

40、与现有技术相比,本发明通过获取共病轨迹数据后,提取出轨迹所覆盖的疾病并计算疾病间的相关性,然后基于相关性进行疾病属性判断,基于疾病属性对轨迹所覆盖的所有疾病进行二分巢式聚类,从而能够识别出聚类间的层次结构关系,通过基于相关性识别出链接不同聚类群组间的枢纽疾病,可以有效分离出这些常见的疾病,从而基于疾病聚类结果和每个疾病的属性准确得到每条共病轨迹的类型,提高了分类的精确性;同时,本实施例提供的共病轨迹分类方法克服了传统非模糊处理中不允许群组间存在重叠结构、模糊聚类无法形成枢纽疾病隶属于多个子类而非枢纽节点仅隶属于单个子类的缺陷,允许不同群组之间存在一定程度的重叠,这使得聚类结果更加符合实际情况,因为疾病之间的关系往往不是绝对的,而是存在多种可能性和交叉,通过支持重叠结构,并且进行巢式聚类,本发明得到的轨迹类型能够更全面地反映疾病的复杂性和多样性,并且有助于医生更好地理解疾病的发展路径和相互关系,从而制定更加精准的治疗方案和预防措施。此外,还可用于研究疾病的发病机制和流行规律,为公共卫生政策制定提供科学依据。

41、本发明中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1