制备用于癌症诊断的多分析预测模型的方法与流程

文档序号:36787735发布日期:2024-01-23 12:04阅读:22来源:国知局
制备用于癌症诊断的多分析预测模型的方法与流程

本发明涉及用于制备用于癌症诊断的多分析预测模型的方法、以及使用所述多分析预测模型提供用于癌症诊断的信息的方法。


背景技术:

1、近年来,血液中存在的无细胞dna(cell-free dna,cfdna)或循环肿瘤dna(circulating tumor dna,ctdna)已用于检测癌症。在健康人中,大部分dna是从造血细胞中释放的,但是在癌症患者中,cfdna包含从垂死肿瘤细胞释放到血液中的ctdna。该ctdna包含与癌症相关的遗传突变,并且对这些遗传突变进行监测使得能够在病变发生之前早期检测癌症、分析对特定癌症治疗的响应、发现产生对抗癌药物的抗性的机制、检测剩余癌症的存在等。

2、同时,全基因组dna甲基化作图利用了许多表观遗传学改变,其可用于区分ctdna与正常循环无细胞dna。例如,一些肿瘤类型(例如室管膜瘤)可具有广泛的dna甲基化异常而没有任何显著的复发性体细胞突变。

3、近年来,使用cfdna开发了多种癌症诊断技术,例如cancerseek、panseer和grailmced测试。由于这些技术仅使用甲基化模式、蛋白质水平或特定区域中突变来主要使用靶向测序以进行诊断,因此它们的局限性在于仅使用有限数目的标志物。因此,需要具有高灵敏度和准确度的用于癌症诊断的预测模型。

4、因此,本发明旨在提出通过以下制备的用于癌症诊断的分析预测模型:使用单独的或通过应用多种特征例如甲基化模式分数、拷贝数比率和片段尺寸比率而提取的系综的数据进行机器学习。


技术实现思路

1、技术问题

2、本发明的一个方面的目的是提供制备用于癌症诊断的多分析预测模型的方法,所述方法包括以下步骤:a)从人参考基因组的cpg位点信息中选择癌症诊断预测所需的区段;b)从两个或更多个液体活检样品中获得cfdna的全基因组甲基化测序信息;c)将所获得的cfdna的全基因组甲基化测序信息中的甲基化模式分数特征应用于所选择的区段,另外将至少一个选自拷贝数比率和片段尺寸比率的特征应用于所选择的区段,从而提取特征数据;以及d)使用所提取的特征数据中的至少一者通过机器学习生成癌症诊断预测模型。

3、本发明的另一方面的目的是提供用于提供用于癌症诊断的信息的方法,所述方法包括以下步骤:a)从对象患者的液体活检样品中获得cfdna的全基因组甲基化测序信息;以及b)通过将所述cfdna的全基因组甲基化测序信息应用于用于癌症诊断的多分析预测模型来检测癌症和/或癌症来源组织的存在或不存在。

4、技术方案

5、本发明的一个实施方案提供了制备用于癌症诊断的多分析预测模型的方法,所述方法包括以下步骤:a)从人参考基因组的cpg位点信息中选择癌症诊断预测所需的区段;b)从两个或更多个液体活检样品中获得cfdna的全基因组甲基化测序信息;c)将步骤b)中获得的所述cfdna的全基因组甲基化测序信息中的甲基化模式分数特征应用于步骤a)中选择的所述区段,另外将至少一个选自拷贝数比率和片段尺寸比率的特征应用于所述区段,从而提取特征数据;以及d)使用步骤c)中提取的所述特征数据中的至少一者通过机器学习生成癌症诊断预测模型。

6、在本发明的一个实施方案中,步骤a)可包括选择满足以下条件的区段作为癌症诊断预测所需的区段:

7、1)所述区段包含在健康人中测序深度为3或更多的cpg位点;

8、2)cpg位点之间的距离小于100bp,并且所述区段包含至少3个cpg位点;

9、3)在区段长度超过1kb时,对区段进行分割;

10、4)排除性染色体;以及

11、5)所述区段在健康人中,在除了最低的10%之外的90%或更多人中的平均测序深度超过3。

12、在本发明的一个实施方案中,液体活检样品可以是来自健康人或癌症患者的血液。

13、在本发明的一个实施方案中,甲基化模式分数可通过计算步骤a)中选择的区段的所有读段中cpg中甲基化c数目的比率来确定。

14、在本发明的一个实施方案中,甲基化模式分数可通过计算步骤a)中选择的区段中与健康人的预定甲基化模式相反的甲基化cpg的比率来确定。

15、在本发明的一个实施方案中,拷贝数比率可通过以下来确定:将完整基因组划分成区块、计算每个区块的深度值、用对象样品的每个区块的深度值除以参考值、并随后计算对数值,所述参考值是来自健康人的cfdna的全基因组甲基化测序信息中每个区块的深度中值。

16、在本发明的一个实施方案中,片段尺寸比率可通过以下来确定:将映射至步骤a)中选择的区段中的每一个的片段分类成100bp至150bp的第一片段和150bp至220bp的第二片段,以及将第一区段的数目和第二区段的数目计算为对数比。

17、在本发明的一个实施方案中,癌症诊断预测模型可检测癌症和/或癌症来源组织的存在或不存在。

18、本发明的另一个方面提供了用于提供用于癌症诊断的信息的方法,所述方法包括以下步骤:a)从对象患者的液体活检样品中获得cfdna的全基因组甲基化测序信息;以及b)通过将步骤a)中获得的所述cfdna的全基因组甲基化测序信息应用于通过权利要求1所述的方法制备的用于癌症诊断的多分析预测模型来检测癌症和/或癌症来源组织的存在或不存在。

19、有益效果

20、根据本发明一个实施方案的制备用于癌症诊断的多分析预测模型的方法以及使用所述预测模型提供用于癌症诊断的信息的方法的优点在于,可以以高准确度和灵敏度来诊断癌症并在早期诊断癌症。



技术特征:

1.制备用于癌症诊断的多分析预测模型的方法,所述方法包括以下步骤:

2.根据权利要求1所述的方法,其中步骤a)包括选择满足以下条件的区段作为癌症诊断预测所需的区段:

3.根据权利要求1所述的方法,其中所述液体活检样品是来自健康人或癌症患者的血液。

4.根据权利要求1所述的方法,其中所述甲基化模式分数通过计算步骤a)所选区段的所有读段中cpg中甲基化c数目的比率来确定。

5.根据权利要求1所述的方法,其中所述甲基化模式分数通过计算步骤a)所选区段中与健康人的预定甲基化模式相反的甲基化cpg的比率来确定。

6.根据权利要求1所述的方法,其中所述拷贝数比率通过以下来确定:将完整基因组划分成区块、计算每个区块的深度值、用对象样品的每个区块的深度值除以参考值、并随后计算对数值,所述参考值是来自健康人的cfdna的全基因组甲基化测序信息中每个区块的深度中值。

7.根据权利要求1所述的方法,其中所述片段尺寸比率通过以下来确定:将映射至步骤a)中所选区段中每一个的片段分类成100bp至150bp的第一片段和150bp至220bp的第二片段,以及将第一区段的数目和第二区段的数目计算为对数比。

8.根据权利要求1所述的方法,其中所述癌症诊断预测模型检测癌症和/或癌症来源组织的存在或不存在。

9.用于提供用于癌症诊断的信息的方法,所述方法包括以下步骤:


技术总结
本发明涉及用于制备用于癌症诊断的多分析预测模型的方法、以及使用所述预测模型提供用于癌症诊断的信息的方法。根据本发明一个实施方案的制备用于癌症诊断的多分析预测模型的方法以及使用所述预测模型提供用于癌症诊断的信息的方法的优点在于:可以以高准确度和灵敏度来诊断癌症并且在早期诊断癌症。

技术研发人员:郑盛文,李旭宰,金洙延,金晃必,文成太,金泰裕
受保护的技术使用者:爱仁液体活检诊断公司
技术研发日:
技术公布日:2024/1/22
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1