一种基于实例迁移的帕金森病严重性预测方法及装置

文档序号:34708017发布日期:2023-07-07 12:53阅读:34来源:国知局
一种基于实例迁移的帕金森病严重性预测方法及装置

本发明涉及数据处理,具体涉及一种基于实例迁移的帕金森病严重性预测方法及装置。


背景技术:

1、精准医疗是一种新型医学概念模式,其目的是对特定患者采取个性化精准治疗。相比于传统的诊疗手段,精准医疗以其高效、精准和个性化的突出优势,具有广阔的发展前景。不同帕金森病患者在人口统计学、遗传危险因素、共病、分期和治疗方案等方面具有高度异质性,因此,为了实现精准医疗,必须考虑间患者间存在的高度异质性。在远程监测的背景下,患者异质性意味着每个患者在远程监测信号和疾病严重性之间可能有不同的关系,需要为其建立特定的预测模型。但是,为每个目标患者建立特定的预测模型常常遇到样本量小的问题。

2、为了弥补特定患者数据量小的不足,目前现有的模型大多采用迁移学习的思想从其他患者的数据中学习对目标患者病情严重性预测具有互补性的信息。但这些方法只选择与特定目标患者的病情具有相似性的患者数据进行迁移,而未考虑患者中的单个实例对特定目标患者病情预测的影响,如果从其他患者的数据中学习过多不相关的信息,则很有可能导致负迁移的产生,降低模型的预测性能。


技术实现思路

1、本发明的目的在于提供一种基于实例迁移的帕金森病严重性预测方法及装置,实现了考虑患者中的单个实例对特定目标患者病情预测的影响,并且可以不需要从其他患者的数据中学习过多不相关的信息,避免可能导致负迁移的产生,提高模型的预测性能。

2、为实现上述目的,采用了以下技术方案:

3、第一方面,本发明提供了一种基于实例迁移的帕金森病严重性预测方法,包括:

4、分析特定目标患者与数据集中其他患者间帕金森病发展趋势的相似性,获取与所述特定目标患者疾病发展趋势相似的患者的集合;

5、统计获取所述相似患者的集合中每个患者的贡献百分比;

6、统计获取所述相似患者的集合中每个患者的单个实例数据的贡献度;

7、根据所述相似患者的集合中每个患者的贡献百分比和单个实例数据的贡献度,选择与所述特定目标患者病情相似的实例数据并迁移至所述特定目标患者的训练数据。

8、可选地,所述特定目标患者与数据集中其他患者间帕金森病发展趋势的相似性采用如下方式得到:

9、将数据集d中的所有数据按照患者的方式分别划分为源域的患者数据和所述特定目标患者数据t={ttrain,tval,ttest},其中,m表示源域中患者的数量,si表示源域中第i个患者的所有实例数据,ttrain,tval和ttest分别表示所述特定目标患者的训练集,验证集和测试集;

10、将源域s中m个患者的数据分别输入随机森林(random forest,rf)回归器中,建立m个特定的预测模型预测的目标值为统一帕金森病评定量表(unifiedparkinson′s disease rating scale,updrs),其中,表示利用第si个患者训练的随机森林rf模型;

11、所述特定目标患者与第si个患者间病情发展趋势的相似性按照以下公式计算:

12、

13、其中,和分别表示tval中第j个特征向量和目标值,nval表示tval中实例的个数,所述表示tval输入模型之后的平均绝对误差;将tval分别输入rf(s)中所有的随机森林rf预测模型可得到m个不同的平均绝对误差通过将中的平均绝对误差按照从小到大的顺序排序,可得到前k个平均绝对误差值较小的患者;据此,可获取与所述特定目标患者疾病发展趋势相似的患者的集合其中,表示从源域中迁移的第i个患者的数据;

14、可选地,统计获取所述相似患者的集合中每个患者的贡献百分比,包括:

15、按照以下公式,通过sh印ley值计算对所述特定目标患者的帕金森病严重性预测的贡献度

16、

17、其中,s表示st的子联盟,和尸(s)分别表示与s构建的随机森林rf模型预测所述特定目标患者的验证集tval所获得的平均绝对误差;

18、按照以下公式,对相似患者的贡献度进行归一化,并确定该患者对所述特定目标患者帕金森病严重性预测的贡献百分比:

19、

20、

21、其中,exp(·)表示以自然底数e为底的指数函数,表示相似患者的贡献度的归一化值,表示相似患者对所述特定目标患者帕金森病严重性预测的贡献百分比。

22、可选地,统计获取所述相似患者的集合中每个患者的单个实例数据的贡献度,包括:

23、按照以下公式,通过所述shapley值计算中每个实例对所述特定目标患者帕金森病严重性预测的贡献度:

24、

25、其中,表示第i个相似患者的第j个实例,n表示中实例的个数,表示实例对所述特定目标患者帕金森病严重性预测的贡献度大小。

26、可选地,根据所述相似患者的集合中每个患者的贡献百分比和单个实例数据的贡献度,选择与所述特定目标患者病情相似的实例数据并迁移至所述特定目标患者的训练数据,包括:

27、按照以下公式计算从每个相似患者中选取的实例个数numi:

28、

29、其中,μ表示待迁移的实例个数占所述特定目标患者训练实例总个数的比例;

30、将中所有实例的贡献度按照从大到小的顺序进行排序,据此选出前numi个实例并迁移至所述特定目标患者的训练数据ttrain,得到所述特定目标患者新的训练数据t′train:

31、

32、将新的训练数据输入随机森林rf模型,得到所述特定目标患者帕金森病的严重性updrs。

33、第二方面,本发明公开提供了一种基于实例迁移的帕金森病严重性预测预测装置,包括:

34、获取模块,被配置为分析特定目标患者与数据集中其他患者间帕金森病发展趋势的相似性,获取与所述特定目标患者疾病发展趋势相似的患者的集合;

35、第一统计模块,被配置为统计获取所述相似患者的集合中每个患者的贡献百分比;

36、第二统计模块,被配置为统计获取所述相似患者的集合中每个患者的单个实例数据的贡献度;

37、迁移模块,被配置为根据所述相似患者的集合中每个患者的贡献百分比和单个实例数据的贡献度,选择与所述特定目标患者病情相似的实例数据并迁移至所述特定目标患者的训练数据。

38、由于采用了上述技术方案,本发明取得的有益效果:

39、本发明公开提供的一种基于实例迁移的帕金森病严重性预测方法,通过分析特定目标患者与数据集中其他患者间帕金森病发展趋势的相似性,能够获取与特定目标患者疾病发展趋势相似的患者集合,大大减少了实例迁移的范围。采用sh印ley值分别统计了相似患者的集合中每个患者以及每个患者的单个实例数据对目标患者帕金森病严重性预测的贡献度,提升了模型的可解释性。根据相似患者的集合中每个患者的贡献百分比和每个患者的单个实例数据的贡献度,可以选择与特定目标患者病情相似的实例数据,并将其迁移至特定目标患者的训练集数据,从而能够有效地弥补特定目标患者数据量小的不足,减少负迁移的产生和提升帕金森病严重性预测模型的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1