使用机器学习预测白蛋白尿的制作方法

文档序号:40532483发布日期:2024-12-31 13:48阅读:23来源:国知局
使用机器学习预测白蛋白尿的制作方法


背景技术:

1、白蛋白是一种由肝脏分泌并存在于血液中的蛋白质。功能正常的肾脏不允许白蛋白从血液进入尿液。白蛋白尿是一种病理状况,其中白蛋白异常存在于尿液中,并且是慢性肾病(ckd)的指标。如果不治疗,则ckd可能导致肾衰竭和死亡。尿中白蛋白的测量可用于评估ckd的进展,并用作患者是用于治疗的候选的指示,并且也是治疗效果的替代标志物。虽然血液测试通常用于检测ckd的其它标志物的存在,但针对白蛋白尿筛查相对很少的患者。特别地,白蛋白尿测试需要收集尿样,其通常不会对于没有糖尿病或其它肾脏相关疾病的患者被开医嘱。因此,一些患者可能在长时间段(例如,数月或数年)内遭受白蛋白尿,而没有接受适当的诊断或必要的治疗。


技术实现思路

1、可以使用尿白蛋白与肌酐比率(uacr)测试从样品中确定尿白蛋白水平。30-300mg/g范围内的结果称为微量白蛋白尿,而大于300mg/g的结果称为大量白蛋白尿。尽管如此,300mg/g的这个截止是稍微随意的,并且不指示临床上显著的拐点。在一些临床情况下,截止可以以150mg/g和700mg/g之间任何地方的值变化。

2、早期检测任一类白蛋白尿和随后的医疗干预都可以降低发展恶化肾功能(包括ckd进展和进展为终末期肾病(esrd))的风险。即使在具有肾功能正常的患者中检测到白蛋白尿时,早期检测也可以降低诱发(incident)心血管事件的风险。鉴于对于许多患者无法获得uacr结果,通过基于更广泛可用的生物标志物标识疑似未诊断白蛋白尿的患者改进白蛋白尿筛查是有益的。用于这些生物标志物的数据已经存在于患者的电子健康记录中(例如,来自人口统计数据、健康数据、血液测试等)。因此,有可能基于这些记录和/或其它可用的医学信息来预测哪些患者可能具有未诊断的白蛋白尿。一旦标识了这些患者,如果这些测试指示白蛋白尿,则可以主动联系他们进行uacr测试和治疗。

3、因此,本文实施例的应用可以与其原本另外被检测到相比更早地标识白蛋白尿。早期检测和随后的早期医疗干预可以降低ckd的影响并防止最终的肾衰竭。此外,还可以招募标识的患者进行新治疗和/或药物的医学研究或临床试验,所述新治疗和/或药物可能能够提供改善的治疗选择和健康结果。

4、为了解决这些问题,这些实施例采用在患者人口统计、生命体征、血液测试和/或其它医疗信息的组合上训练的机器学习模型。训练产生预测uacr水平的分类器。在一些情况下,机器学习模型基于梯度提升技术,但是其它底层技术(例如,人工神经网络或专家系统)可以用来代替梯度提升或与梯度提升结合使用。这样的模型已经应用于临床数据,并且被示为在预测广泛患者的uacr水平方面是有效的。在一些实施例中,可以使用尿蛋白与肌酐比率(upr)水平代替uacr值或用于导出uacr值。这些uacr和upr水平可以从单独的尿白蛋白、尿肌酐和/或尿蛋白测量计算。

5、因此,第一示例实施例涉及通过计算系统获得训练数据集,其中训练数据集包含用于多个个体的对应人口统计值、生命体征值、血液测试值以及uacr值或upr值的观察;以及由所述计算系统将机器学习训练器应用于所述训练数据集,其中所述机器学习训练器产生机器学习模型,并且其中所述机器学习模型被配置成将新人口统计值、新生命体征值和新血液测试值的新观察作为输入,并提供表现出所述新观察的个体是否具有未诊断的白蛋白尿或蛋白尿的预测。

6、第二示例实施例涉及通过计算系统获得个体的人口统计值、个体的生命体征值和个体的血液测试值的观察;由所述计算系统将机器学习模型应用于所述观察,其中用训练数据集训练所述机器学习模型,其中所述训练数据集包含用于多个个体的对应人口统计值、生命体征值、血液测试值以及uacr值或upr值的观察,并且其中所述机器学习模型被配置成提供进一步的观察是否指示未诊断的白蛋白尿或蛋白尿的预测;以及由所述计算系统基于所述观察提供所述个体是否表现出未诊断的白蛋白尿或蛋白尿的预测。

7、第三示例实施例涉及通过计算系统获得训练数据集,其中训练数据集包含用于多个个体的对应人口统计值、生命体征值、血液测试值以及uacr值或upr值的观察;以及由所述计算系统将分位数(quantile)回归机器学习训练器应用于所述训练数据集,其中所述分位数回归机器学习训练器产生分位数回归机器学习模型,并且其中所述分位数回归机器学习模型被配置成将分位数和新人口统计值、新生命体征值和新血液测试值的新观察作为输入,并提供用于表现出所述新观察的个体在所述分位数处的uacr或upr值的预测。

8、第四示例实施例涉及通过计算系统获得个体的人口统计值、个体的生命体征值和个体的血液测试值的观察和分位数;由所述计算系统将分位数回归机器学习模型应用于所述观察,其中用训练数据集训练所述分位数回归机器学习模型,其中所述训练数据集包含用于多个个体的对应人口统计值、生命体征值、血液测试值以及uacr值或upr值的观察,并且其中所述分位数回归机器学习模型被配置成提供一个或多个分位数处的uacr值或upr值的预测以用于进一步观察;基于所述观察并且针对所述个体,由所述计算系统提供分位数处的uacr或upr值的预测。

9、在第五示例实施例中,制品包括具有在其上存储的程序指令的非暂时性计算机可读介质,所述程序指令在由计算系统执行时使计算系统执行根据第一、第二、第三和/或第四示例实施例的操作。

10、在第六示例实施例中,计算系统包括至少一个处理器以及存储器和程序指令。程序指令可以存储在存储器中,并且在由至少一个处理器执行时,使得计算系统执行根据第一、第二、第三和/或第四示例实施例的操作。

11、在第七示例实施例中,一种系统包括用于执行第一、第二、第三和/或第四示例实施例的操作中的每个操作的各种部件。

12、通过在适当的情况下参考附图阅读以下详细描述,这些以及其它实施例、方面、优点和备选方案对于本领域普通技术人员将变得显而易见。此外,本
技术实现要素:
和本文提供的其它描述和附图旨在仅通过示例的方式来说明实施例,并且因此,许多变型是可能的。例如,结构元件和过程步骤可以被重新布置、组合、分布、消除或以其它方式改变,同时保持在如所要求保护的实施例的范围内。



技术特征:

1.一种方法,包括:

2.根据权利要求1所述的方法,其中,所述人口统计值包括所述多个个体的年龄、性别或种族。

3.根据权利要求1所述的方法,其中,所述生命体征值包括所述多个个体的体重指数、血压读数或心率。

4.根据权利要求1所述的方法,其中,所述血液测试值包括所述多个个体的肌酐水平、糖化血红蛋白水平、甘油三酯、血液白蛋白水平或白细胞计数。

5.根据权利要求1所述的方法,其中,所述训练数据集内的值被填充20%-50%。

6.根据权利要求1所述的方法,其中,所述机器学习模型基于梯度提升。

7.根据权利要求1所述的方法,其中,表现出所述新观察的所述个体是否具有未诊断的白蛋白尿的所述预测包括预测所述个体是否具有微量白蛋白尿。

8.根据权利要求1所述的方法,其中,表现出所述新观察的所述个体是否患有未诊断的白蛋白尿的所述预测包括预测所述个体是否具有大量白蛋白尿。

9.根据权利要求1所述的方法,其中,表现出所述新观察的所述个体是否具有未诊断的白蛋白尿或蛋白尿的所述预测包括预测用于所述个体的uacr值或upr值。

10.根据权利要求1所述的方法,其中,所述训练数据集包括从医疗索赔记录或电子健康记录收集的至少100000个观察。

11.根据权利要求1所述的方法,其中,所述训练数据集包括从医疗索赔记录或电子健康记录收集的至少1000000个观察。

12.根据权利要求1所述的方法,其中,在5%至25%之间的所述观察具有指示白蛋白尿的uacr值或指示蛋白尿的upr值。

13.根据权利要求1所述的方法,其中,所述uacr值是从upr值数学导出的。

14.一种包括非暂时性计算机可读介质的制品,所述非暂时性计算机可读介质具有在其上存储的程序指令,所述程序指令在由计算系统执行时使得所述计算系统执行根据权利要求1-13中任一项所述的操作。

15.一种计算系统,包括:

16.一种方法,包括:

17.根据权利要求16所述的方法,其中,提供所述预测包括在图形用户界面上显示所述预测。

18.根据权利要求16所述的方法,其中,获得所述观察包括从通过网络与所述计算系统通信的客户端装置接收所述观察,并且其中提供所述预测包括向所述客户端装置传送所述预测。

19.根据权利要求16所述的方法,其中,所述人口统计值包括所述多个个体的年龄、性别或种族。

20.根据权利要求16所述的方法,其中,所述生命体征值包括所述多个个体的体重指数、血压读数或心率。

21.根据权利要求16所述的方法,其中,所述血液测试值包括所述多个个体的肌酐水平、糖化血红蛋白水平、甘油三酯、血液白蛋白水平或白细胞计数。

22.根据权利要求16所述的方法,其中,所述训练数据集内的值被填充20%-50%。

23.根据权利要求16所述的方法,其中,所述机器学习模型基于梯度提升。

24.根据权利要求16所述的方法,其中,表现出所述观察的所述个体是否具有未诊断的白蛋白尿的所述预测包括预测所述个体是否具有微量白蛋白尿。

25.根据权利要求16所述的方法,其中,表现出所述观察的所述个体是否具有未诊断的白蛋白尿的所述预测包括预测所述个体是否具有大量白蛋白尿。

26.根据权利要求16所述的方法,其中,表现出所述观察的所述个体是否具有未诊断的白蛋白尿或蛋白尿的所述预测包括预测用于所述个体的uacr值或upr值。

27.根据权利要求16所述的方法,其中,所述训练数据集包括从医疗索赔记录或电子健康记录收集的至少100000个观察。

28.根据权利要求16所述的方法,其中,所述训练数据集包括从医疗索赔记录或电子健康记录收集的至少1000000个观察。

29.根据权利要求16所述的方法,其中,在5%至25%之间的观察具有指示白蛋白尿的uacr值或指示蛋白尿的upr值。

30.根据权利要求16所述的方法,还包括:

31.根据权利要求16所述的方法,还包括:

32.根据权利要求16所述的方法,其中,所述uacr值是从upr值数学导出的。

33.一种方法,包括:

34.一种方法,包括:

35.一种非暂时性计算机可读介质,所述非暂时性计算机可读介质具有在其上存储的程序指令,所述程序指令在由计算系统执行时使得所述计算系统执行根据权利要求16-34中任一项所述的操作。

36.一种计算系统,包括:


技术总结
示例实施例可以涉及通过计算系统获得个体的人口统计值、个体的生命体征值和个体的血液测试值的观察;由所述计算系统将机器学习模型应用于所述观察,其中用训练数据集训练所述机器学习模型,其中所述训练数据集包含用于多个个体的对应人口统计值、生命体征值、血液测试值以及尿白蛋白与肌酐比率(UACR)值或尿蛋白与肌酐比率(UPR)值的观察,并且其中所述机器学习模型被配置成提供进一步的观察是否指示未诊断的白蛋白尿或蛋白尿的预测;以及由所述计算系统基于所述观察提供所述个体是否表现出未诊断的白蛋白尿或蛋白尿的预测。

技术研发人员:N·斯万加德,P·格雷斯利,P·阿姆贝里,S·海德
受保护的技术使用者:阿斯利康(瑞典)有限公司
技术研发日:
技术公布日:2024/12/30
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1