弥漫大B细胞淋巴瘤的预测模型的构建方法及系统与流程

文档序号:37276740发布日期:2024-03-12 21:11阅读:12来源:国知局
弥漫大B细胞淋巴瘤的预测模型的构建方法及系统与流程

本发明涉及预测,具体地,涉及弥漫大b细胞淋巴瘤的预测模型的构建方法及系统。


背景技术:

1、越来越多地研究显示,氨基酸代谢紊乱与多种疾病的发生发展密切相关。人体的氨基酸代谢涉及到复杂的化学反应,包括氨基酸的合成、降解和转化过程,在生命体征和能量代谢中扮演着至关重要的角色。

2、弥漫大b细胞淋巴是世界上最常见的非霍奇金淋巴瘤类型,病理诊断是淋巴瘤诊断的金标准。研究发现三羧酸循环中出现了肿瘤形成的细胞代谢重编程,而氨基酸需要进入三羧酸循环进行联系,实现代谢转化。因此可用氨基酸数据诊断弥漫大b细胞淋巴瘤,但是氨基酸数据多且复杂,弥漫大b细胞淋巴瘤不仅仅是基于单个氨基酸的浓度,所以可利用机器学习对弥漫大b细胞淋巴瘤和健康人的氨基酸数据进行建模训练,给临床诊断提供参考。

3、专利文献cn112086129b(申请号:202011009109.3)公开了一种预测肿瘤组织cfdna的方法及系统,该方法包括:待测样本特征提取步骤,包括提取待测样本的cfdna测序数据的末端特征和kmer频数特征;预测步骤,包括通过模型,对所述待测样本的cfdna测序数据的末端特征和kmer频数特征进行分析,根据分析结果,预测所述待测样本是否为健康样本或肿瘤样本。


技术实现思路

1、针对现有技术中的缺陷,本发明的目的是提供弥漫大b细胞淋巴瘤的预测模型的构建方法及系统。

2、根据本发明提供的一种弥漫大b细胞淋巴瘤的预测模型的构建方法,包括:

3、步骤s1:利用液相色谱-质谱仪对实验组及对照组进行21种氨基酸的定量检测得到检测结果;

4、步骤s2:基于21种氨基酸的定量检测的检测结果进行特征提取;

5、步骤s3:构建多个不同的预测模型,并基于提取的特征分别训练多个不同的预测模型,对训练后的不同的预测模型进行评估;

6、步骤s4:基于评估结果选择最优预测模型,并利用最优预测模型进行弥漫大b细胞淋巴瘤预测。

7、优选地,所述步骤s2采用:基于21种氨基酸的定量检测的检测结果通过wrapper包装法结合预测模型和学习曲线进行特征提取,包括:赖氨酸、色氨酸、苯丙氨酸、甲硫氨酸、苏氨酸、异亮氨酸、精氨酸、组氨酸、脯氨酸、瓜氨酸、丝氨酸、天冬氨酸以及年龄。

8、优选地,所述步骤s2采用:基于21种氨基酸的定量检测的检测结果通过wrapper包装法结合预测模型和学习曲线进行特征提取,当提取的特征为:赖氨酸,色氨酸,苏氨酸,精氨酸,组氨酸,丝氨酸,天冬氨酸时,评价指标最大。

9、优选地,所述步骤s3采用:

10、步骤s3.1:利用包括随机森林、xgboost、逻辑回归、k近邻和决策树分别构建预测模型;利用网格搜索结合十折交叉验证优化预测模型超参数,得到优化后的预测模型;

11、步骤s3.2:利用roc曲线分别对不同的优化后的预测模型进行评估。

12、优选地,所述步骤s4采用:基于评估结果选择利用随机森林构建的预测模型最为最终的预测模型;利用验证集对最终的预测模型进行验证,得到xgboost的预测模型对弥漫大b细胞淋巴瘤的混淆矩阵,从而验证当前预测模型的预测效果。

13、根据本发明提供的一种弥漫大b细胞淋巴瘤的预测模型的构建系统,包括:

14、模块m1:利用液相色谱-质谱仪对实验组及对照组进行21种氨基酸的定量检测得到检测结果;

15、模块m2:基于21种氨基酸的定量检测的检测结果进行特征提取;

16、模块m3:构建多个不同的预测模型,并基于提取的特征分别训练多个不同的预测模型,对训练后的不同的预测模型进行评估;

17、模块m4:基于评估结果选择最优预测模型,并利用最优预测模型进行弥漫大b细胞淋巴瘤预测。

18、优选地,所述模块m2采用:基于21种氨基酸的定量检测的检测结果通过wrapper包装法结合预测模型和学习曲线进行特征提取,包括:赖氨酸、色氨酸、苯丙氨酸、甲硫氨酸、苏氨酸、异亮氨酸、精氨酸、组氨酸、脯氨酸、瓜氨酸、丝氨酸、天冬氨酸以及年龄。

19、优选地,所述模块m2采用:基于21种氨基酸的定量检测的检测结果通过wrapper包装法结合预测模型和学习曲线进行特征提取,当提取的特征为:赖氨酸,色氨酸,苏氨酸,精氨酸,组氨酸,丝氨酸,天冬氨酸时,评价指标最大。

20、优选地,所述模块m3采用:

21、模块m3.1:利用包括随机森林、xgboost、逻辑回归、k近邻和决策树分别构建预测模型;利用网格搜索结合十折交叉验证优化预测模型超参数,得到优化后的预测模型;

22、模块m3.2:利用roc曲线分别对不同的优化后的预测模型进行评估。

23、优选地,所述模块m4采用:基于评估结果选择利用随机森林构建的预测模型最为最终的预测模型;利用验证集对最终的预测模型进行验证,得到xgboost的预测模型对弥漫大b细胞淋巴瘤的混淆矩阵,从而验证当前预测模型的预测效果。

24、与现有技术相比,本发明具有如下的有益效果:

25、1、本发明通过机器学习对健康人以及弥漫大b细胞淋巴瘤进行模型构建、训练和优化,得到了最优的预测模型xgboost;

26、2、本发明用新的数据进行验证,得到xgboost准确度85.0%,敏感度90.0%,精确度81.8%的结果。

27、3、本发明将预测模型xgboost封装,存储在硬盘中,可移动至rz-500主机上,进而在诊断中为医生提供参考。



技术特征:

1.一种弥漫大b细胞淋巴瘤的预测模型的构建方法,其特征在于,包括:

2.根据权利要求1所述的弥漫大b细胞淋巴瘤的预测模型的构建方法,其特征在于,所述步骤s2采用:基于21种氨基酸的定量检测的检测结果通过wrapper包装法结合预测模型和学习曲线进行特征提取,包括:赖氨酸、色氨酸、苯丙氨酸、甲硫氨酸、苏氨酸、异亮氨酸、精氨酸、组氨酸、脯氨酸、瓜氨酸、丝氨酸、天冬氨酸以及年龄。

3.根据权利要求1所述的弥漫大b细胞淋巴瘤的预测模型的构建方法,其特征在于,所述步骤s2采用:基于21种氨基酸的定量检测的检测结果通过wrapper包装法结合预测模型和学习曲线进行特征提取,当提取的特征为:赖氨酸,色氨酸,苏氨酸,精氨酸,组氨酸,丝氨酸,天冬氨酸时,评价指标最大。

4.根据权利要求1所述的弥漫大b细胞淋巴瘤的预测模型的构建方法,其特征在于,所述步骤s3采用:

5.根据权利要求4所述的弥漫大b细胞淋巴瘤的预测模型的构建方法,其特征在于,所述步骤s4采用:基于评估结果选择利用随机森林构建的预测模型最为最终的预测模型;利用验证集对最终的预测模型进行验证,得到xgboost的预测模型对弥漫大b细胞淋巴瘤的混淆矩阵,从而验证当前预测模型的预测效果。

6.一种弥漫大b细胞淋巴瘤的预测模型的构建系统,其特征在于,包括:

7.根据权利要求6所述的弥漫大b细胞淋巴瘤的预测模型的构建系统,其特征在于,所述模块m2采用:基于21种氨基酸的定量检测的检测结果通过wrapper包装法结合预测模型和学习曲线进行特征提取,包括:赖氨酸、色氨酸、苯丙氨酸、甲硫氨酸、苏氨酸、异亮氨酸、精氨酸、组氨酸、脯氨酸、瓜氨酸、丝氨酸、天冬氨酸以及年龄。

8.根据权利要求6所述的弥漫大b细胞淋巴瘤的预测模型的构建系统,其特征在于,所述模块m2采用:基于21种氨基酸的定量检测的检测结果通过wrapper包装法结合预测模型和学习曲线进行特征提取,当提取的特征为:赖氨酸,色氨酸,苏氨酸,精氨酸,组氨酸,丝氨酸,天冬氨酸时,评价指标最大。

9.根据权利要求6所述的弥漫大b细胞淋巴瘤的预测模型的构建系统,其特征在于,所述模块m3采用:

10.根据权利要求9所述的弥漫大b细胞淋巴瘤的预测模型的构建系统,其特征在于,所述模块m4采用:基于评估结果选择利用随机森林构建的预测模型最为最终的预测模型;利用验证集对最终的预测模型进行验证,得到xgboost的预测模型对弥漫大b细胞淋巴瘤的混淆矩阵,从而验证当前预测模型的预测效果。


技术总结
本发明提供了一种弥漫大B细胞淋巴瘤的预测模型的构建方法及系统,包括:步骤S1:利用液相色谱‑质谱仪对实验组及对照组进行21种氨基酸的定量检测得到检测结果;步骤S2:基于21种氨基酸的定量检测的检测结果进行特征提取;步骤S3:构建多个不同的预测模型,并基于提取的特征分别训练多个不同的预测模型,对训练后的不同的预测模型进行评估;步骤S4:基于评估结果选择最优预测模型,并利用最优预测模型进行弥漫大B细胞淋巴瘤预测。

技术研发人员:刘文文,谢晓磊
受保护的技术使用者:上海睿质科技有限公司
技术研发日:
技术公布日:2024/3/11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1