用于胃癌辅助诊断的甲基化标志物、装置、设备和存储介质的制作方法

文档序号:35296587发布日期:2023-09-01 22:43阅读:60来源:国知局
用于胃癌辅助诊断的甲基化标志物、装置、设备和存储介质的制作方法

本技术属于生物医学,具体涉及用于胃癌辅助诊断的甲基化标志物、装置、设备和存储介质。


背景技术:

1、胃癌是指原发于胃的上皮源性恶性肿瘤。根据2020年中国最新数据,胃癌发病率和死亡率在各种恶性肿瘤中均居第三。全球每年新发胃癌病例约120万,中国约占其中的40%。我国早期胃癌占比很低,仅约20%,大多数发现时已是进展期,总体5年生存率不足50%(胃癌诊疗指南,2022年版)。尽管内镜技术不断发展,但目前公众对于通过内镜进行胃癌筛查的接受度仍不尽如人意,加之早期胃癌症状并不明显,因此大部分胃癌患者就诊时已到中晚期,丧失了手术根治的机会。鉴于胃癌恶性程度和异质性都非常高,以往虽有针对胃癌晚期患者的治疗探索,但对总生存的提升并不显著(2020版csco胃癌诊疗指南)。

2、2003-2015年,我国胃癌5年相对生存率有所升高,但是仍明显低于发达国家(中国胃癌筛查与早筛早诊指南,2022,北京)。胃癌患者的生存时间与其临床诊断发现的早晚密切相关。胃癌早期症状不明显,多数患者在确诊时已处于中晚期,即使接受手术治疗的5年生存率仍<30%,而早期病例经过及时治疗五年生存率可>90%。开展胃癌筛查可显著提高胃癌早期病变检出率,改善患者预后,大幅提高患者生存率。

3、随着生物科技的不断发展,利用基因检测来诊断或辅助诊断疾病的方法受到了广泛的瞩目。dna甲基化是基因表达调控的一种重要机制,dna甲基化检测是指利用各种方法对肿瘤细胞dna甲基化程度进行测定,甲基化状态的改变是肿瘤发生、发展过程中标志性事件之一,在肿瘤早期便在基因组中广泛发生。在恶性肿瘤的发展中,甲基化的状态并不是一成不变,肿瘤细胞内全基因组的低甲基化程度与疾病进展、肿瘤大小和恶性程度都有密切的关系,dna甲基化检测对肿瘤恶性程度的判断有重要意义,为癌症的早期预测、分类、分级及预后评估提供了新的依据,是目前的研究热点之一。


技术实现思路

1、1. 发明目的

2、本技术的目的在于提供一种用于胃癌辅助诊断的甲基化标志物、装置、设备和存储介质,该甲基化标志物为癌症患者样本与非癌对照样本甲基化水平存在差异的甲基化程度高相关区间(差异甲基化区间),包括本技术筛选的125个甲基化程度高相关区间(methylation-correlated block,mcb)中一个或多个的部分区间或全长区间,该差异甲基化区间内甲基化位点的甲基化程度在胃癌组织样本与胃良性组织样本中存在显著差异,与胃癌发生及发展有关。通过对差异甲基化区间进行模型构建,利用该模型可实现胃癌辅助诊断的目的,具有通量高、检测特异性和敏感性高等的优点,具有广阔的临床应用前景。将其用于胃癌辅助诊断,可以实现胃癌早筛早诊,并进一步提高生存率的目的。

3、2. 技术方案

4、为了解决上述问题,本技术所采用的技术方案如下:

5、本技术提供了一种用于胃癌辅助诊断的甲基化标志物,该甲基化标志物为癌症患者样本与非癌对照样本甲基化水平存在差异的甲基化程度高相关区间(差异甲基化区间),该差异甲基化区间包括以下125个甲基化程度高相关区间(methylation-correlatedblock,mcb)中一个或多个的部分区间或全长区间,上述甲基化程度高相关区间(mcb)在基因组上的位置(物理位置)基于人类全基因组序列(版本号为hg19)比对确定,上述甲基化程度高相关区间(mcb)内甲基化位点的甲基化程度在胃癌组织样本与胃良性组织样本存在显著差异,与胃癌发生及发展有关,125个甲基化程度高相关区间(mcb)如下:

6、

7、

8、进一步地,上述一种用于胃癌辅助诊断的甲基化标志物,该甲基化标志物为差异甲基化区间,该差异甲基化区间包括以下34个甲基化程度高相关区间(methylation-correlated block,mcb)中一个或多个的部分区间或全长区间,该34个甲基化程度高相关区间是通过血浆样本进一步筛选获得,更适用于基于血浆样本的胃癌辅助诊断,34个甲基化程度高相关区间(mcb)如下:

9、

10、进一步地,上述一种用于胃癌辅助诊断的甲基化标志物,部分区间是指该甲基化程度高相关区间中包含不少于3个cpg的区间。

11、进一步地,上述一种用于胃癌辅助诊断的甲基化标志物,该甲基化标志物为差异甲基化区间,该差异甲基化区间包括上述34个甲基化程度高相关区间(mcb)的部分区间或全长区间,部分区间是指该甲基化程度高相关区间中包含不少于3个cpg的区间。

12、进一步地,上述一种用于胃癌辅助诊断的甲基化标志物,该甲基化标志物为差异甲基化区间,该差异甲基化区间包括上述34个甲基化程度高相关区间(mcb)的全长区间。

13、进一步地,上述一种用于胃癌辅助诊断的甲基化标志物,该甲基化标志物为差异甲基化区间,该差异甲基化区间包括上述125个甲基化程度高相关区间(mcb)的全长区间。

14、本技术还提供了上述一种用于胃癌辅助诊断的甲基化标志物在构建胃癌风险预测模型中的应用。

15、进一步地,上述构建胃癌风险预测模型包括如下步骤:

16、s1,获取癌症患者样本和非癌对照样本的组织或血浆中dna的甲基化测序数据;

17、s2,从s1的测序数据中获取上述甲基化标志物(差异甲基化区间)的甲基化水平数据;

18、s3,利用s2中甲基化水平数据对预设数量组织或血浆样本,基于癌症患者分期和非癌对照样本信息,按照预设比例随机抽样,分成训练集、测试集和验证集;

19、s4,采用机器学习法构建胃癌风险预测模型。

20、进一步地,上述s2中甲基化水平数据指每个差异甲基化区间内的全甲基化片段占比(methylated fragment ratio, mfr)值,mfr值通过以下公式计算:

21、,

22、其中,表示第n个样本第i个差异甲基化区间的mfr值;表示第n个样本第i个差异甲基化区间的全甲基化片段数,全甲基化片段指该片段上所有的cpg位点全部甲基化的片段;表示第n个样本第i个差异甲基化区间的未甲基化片段数,未甲基化片段指该片段上所有的cpg位点全部未甲基化的片段。

23、进一步地,上述s4中采用机器学习法构建胃癌风险预测模型包括通过支持向量机(linearsvm)构建胃癌风险预测模型。

24、本技术还提供了上述一种用于胃癌辅助诊断的甲基化标志物在胃癌辅助诊断中的应用。

25、本技术还提供了上述一种用于胃癌辅助诊断的甲基化标志物在制备胃癌辅助诊断产品中的应用。

26、本技术还提供了检测上述甲基化标志物(差异甲基化区间)的甲基化水平数据的试剂在构建胃癌风险预测模型、胃癌辅助诊断或制备胃癌辅助诊断产品中的应用。

27、进一步地,上述检测甲基化水平的试剂可以包括以下任意一种或多种方法中所使用的试剂,所述方法包括:焦磷酸测序法、重亚硫酸盐转化测序法、甲基化芯片法、qpcr法、数字pcr法、二代测序法、三代测序法、全基因组甲基化测序法、dna富集检测法、简化亚硫酸氢盐测序技术、hplc法、massarray、甲基化特异pcr。

28、本技术还提供了一种胃癌风险预测模型的构建方法,该方法包括如下步骤:

29、m1,获取癌症患者样本和非癌对照样本的组织或血液中dna的甲基化测序数据;

30、m2,从m1的测序数据中获取上述甲基化标志物(差异甲基化区间)的甲基化水平数据;

31、m3,利用m2中甲基化水平数据对预设数量组织或血浆样本,基于癌症患者分期和非癌对照样本信息,按照预设比例随机抽样,分成训练集、测试集和验证集;

32、m4,采用机器学习法构建胃癌风险预测模型。

33、进一步地,上述m2中甲基化水平数据指每个差异甲基化区间内的全甲基化片段占比(methylated fragment ratio, mfr)值,mfr值通过以下公式计算:

34、,

35、其中,表示第n个样本第i个差异甲基化区间的mfr值;表示第n个样本第i个差异甲基化区间的全甲基化片段数,全甲基化片段指该片段上所有的cpg位点全部甲基化的片段;表示第n个样本第i个差异甲基化区间的未甲基化片段数,未甲基化片段指该片段上所有的cpg位点全部未甲基化的片段。

36、进一步地,上述m4中采用机器学习法构建胃癌风险预测模型包括通过支持向量机(linearsvm)构建胃癌风险预测模型。

37、本技术还提供了一种上述构建胃癌风险预测模型的方法构建的胃癌风险预测模型。

38、本技术还提供了一种预测胃癌风险的方法,包括如下步骤:

39、(1)获取受试者的组织或血浆dna的甲基化测序数据;

40、(2)从测序数据中计算上述甲基化标志物(差异甲基化区间)的mfr值;

41、(3)使用计算的mfr值和上述预先训练好的机器学习模型预测受试者患有胃癌的风险。

42、进一步地,上述获取受试者的组织或血浆dna的甲基化测序数据可以使用任意一种或多种方法,包括:焦磷酸测序法、重亚硫酸盐转化测序法、甲基化芯片法、qpcr法、数字pcr法、二代测序法、三代测序法、全基因组甲基化测序法、dna富集检测法、简化亚硫酸氢盐测序技术、hplc法、massarray、甲基化特异pcr。

43、本技术还提供了一种预测胃癌风险的装置,包括:

44、数据接收模块,其被配置为用于接收受试者的组织样本或血浆样本的dna的甲基化测序数据;

45、序列预处理模块,其被配置为用于对测序数据中的序列进行质控和过滤处理,并将过滤后的序列比对到参考基因组;

46、mfr值计算模块,其被配置为计算上述甲基化标志物(差异甲基化区间)的mfr值,mfr值通过以下公式计算:

47、,

48、其中,表示第n个样本第i个差异甲基化区间的mfr值;表示第n个样本第i个差异甲基化区间的全甲基化片段数,全甲基化片段指该片段上所有的cpg位点全部甲基化的片段;表示第n个样本第i个差异甲基化区间的未甲基化片段数,未甲基化片段指该片段上所有的cpg位点全部未甲基化的片段;

49、风险预测模块,其被配置为使用预先训练好的机器学习模型和计算的mfr值预测患有胃癌的风险。

50、本技术还提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述预测胃癌风险的方法。

51、本技术还提供了一种计算机存储介质,其上存储有计算机程序,其中,计算机程序被处理器执行时实现上述预测胃癌风险的方法。

52、3. 有益效果

53、本技术与现有技术相比,其有益效果在于:

54、本技术提供的一种用于胃癌辅助诊断的甲基化标志物、装置、设备和存储介质,该甲基化标志物包括差异甲基化区间,具体包括125个癌症与非癌对照样本甲基化水平存在差异的甲基化程度高相关区间(methylation-correlated block,mcb)中一个或多个的部分区间或全长区间,该差异甲基化区间内甲基化位点的甲基化程度在胃癌组织样本与胃良性组织样本存在显著差异,与胃癌发生及发展有关。通过对差异甲基化区间进行分析、构建模型,可实现了对胃癌辅助诊断的目的,具有通量高、检测特异性和敏感性高的优点,具有广阔的临床应用前景。将其用于胃癌辅助诊断,可以实现胃癌早筛早诊,提高生存率的目的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1