乳腺癌特异性甲基化标志物及其诊断乳腺癌的应用的制作方法

文档序号:36803887发布日期:2024-01-23 12:31阅读:23来源:国知局
乳腺癌特异性甲基化标志物及其诊断乳腺癌的应用的制作方法

本发明属于分子辅助诊断领域,并且具体地涉及乳腺癌组织特异性甲基化标志物及其诊断乳腺癌的应用。


背景技术:

1、

2、乳腺超声,乳腺x线检查(钼靶)和核磁共振是常用的乳腺癌筛查方法,但是这些传统的方法都有一定的技术限制,比较依赖于医生的操作水平,具有较高的漏诊误诊概率。

3、近年来研究火热的液体活检,以肿瘤细胞释放到血浆中的游离dna (ctdna)为基础,相比传统方法具有取样方便,非侵入性,可实现泛癌种早筛以及克服了肿瘤异质性等优点,得到了大量的应用。ctdna可以从多方面反映癌症的信息,如突变,片段化长度分布,甲基化等,其中ctdna的甲基化以其出众的性能已经成为癌症早筛产品研究和开发的热点,已经有众多 ctdna甲基化早筛的应用,如泛癌种甲基化早筛应用panseer在96%的特异性下,在5个癌种(胃癌,食管癌,肝癌,结直肠癌,肺癌)中可以达到88%的敏感性,相比传统方法可以提前4年发现癌症(xingdong chen等人,2020);结直肠癌中仅使用6个qpcr标志物构建的机器学习模型就可以在92%的特异性下达到86%的敏感性,达到远优于传统癌症筛查方法的效果(guo-xiang cai等人,2021)。

4、癌症筛查尤其是泛癌种早筛不仅需要预测癌症信号的有无,还需要对阳性的样本进行组织溯源,而人体不同的位置的癌种具有不同的甲基化特征 (kundaje a等人,2015),利用这些组织特异的甲基化特征可以实现组织溯源。但是,乳腺癌组织特异性甲基化标志物的发现需要多个癌种的大量甲基化测序数据以及严格的筛选验证过程,是一项具有较大挑战性的工作。本领域中需要用于乳腺癌组织特异性甲基化标志物。


技术实现思路

1、乳腺超声,乳腺x线检查(钼靶)和核磁共振是常用的乳腺癌筛查方法,但是这些传统的方法都有一定的技术限制,比较依赖于医生的操作水平。本领域中缺乏针对乳腺癌组织特异性甲基化标志物。针对这些技术问题,发明人从7个癌种(肺癌,肝癌,胃癌,食管癌,胰腺癌,乳腺癌)的大量下一代测序(ngs)cfdna甲基化靶向测序数据中筛选到乳腺癌组织特异性的甲基化标志物。发明人使用筛选得到的甲基化标志物进行机器学习模型的构建和验证,用于泛癌种早期筛查过程中对乳腺癌的组织溯源,达到更好的区分乳腺癌的目的。本发明的乳腺癌组织特异性甲基化标志物是先前没有描述的。

2、一方面,本发明提供了试剂或组件在制备试剂盒或装置中的用途,所述试剂盒或装置用于(1)区分乳腺癌患者与非乳腺癌的癌症患者,(2)用于诊断或辅助诊断乳腺癌;或者(3)用于泛癌筛查过程中对乳腺癌的组织溯源,其中试剂或组件包含检测样品基因组dna中乳腺癌组织特异性甲基化标志物的甲基化水平的试剂或组件,所述甲基化标志物是以下区域或其位点,所述区域是以下基因以及该基因在其所处的染色体中的2kb上游区和2kb下游区:基因barhl2;基因alx3;基因tbx15;基因c2cd4d;基因ryr2;基因 lbh;six3;基因six2;基因otx1;基因emx1;基因lbx2;基因bcl2l11;基因pax8;基因hoxd1;基因satb2;基因vill;基因cldn11;基因ephb3;基因nkx3-2;基因kctd8;基因pitx1;基因cxxc5;基因foxc1;基因 nrn1;基因hoxa9;基因dlx6;基因mos;基因tcf24;基因ca3;基因gdf6;基因foxd4;基因ptf1a;基因tlx1;基因ina;基因nkx6-2;基因pax6;基因pax6;基因bcat1;基因faim2;基因grasp;基因ccna1;基因six1;基因prkcb;基因sox9;基因st8sia5;基因nfix;基因eps8l1;基因zik1;基因kal1;基因znf81;或任一种基因的互补序列或变体,只要变体中的甲基化位点未发生突变。在一个实施方案中,位点的长度为 150bp-500bp。在一个实施方案中,位点的长度为200bp-470bp。

3、在一个实施方案中,非乳腺癌的癌症或泛癌包括结直肠癌、肝癌、胃癌、食管癌、胰腺癌和/或肺癌。

4、在一个实施方案中,甲基化标志物包含以下任一项或多项所示的核苷酸序列或者其互补序列或变体序列:seq id no:1-51。

5、在一个实施方案中,试剂或组件包含以下一种或多种检测甲基化的方法中使用的试剂或组件:基于重亚硫酸盐转化的pcr、dna测序、甲基化敏感的限制性内切酶分析法、荧光定量法、甲基化敏感性高分辨率熔解曲线法和基于芯片的甲基化图谱分析和质谱法。

6、在一个实施方案中,试剂或组件包含用于检测甲基化标志物的引物和/ 或探针,和/或样品为细胞、组织、细针穿刺活检物和/或血浆,优选地,样品基因组dna是血浆中的游离dna。

7、在另一个方面,本发明提供了一种构建区分乳腺癌与其他非乳腺癌的预测模型的方法,其包括:

8、(1)获得乳腺癌样品和非乳腺癌的癌症样品的基因组dna中甲基化标志物的甲基化水平作为训练集;所述甲基化标志物选自以下区域或该区域的位点,所述区域是以下基因以及该基因在其所处的染色体中的2kb上游区和2kb 下游区:基因barhl2;基因alx3;基因tbx15;基因c2cd4d;基因ryr2;基因lbh;six3;基因six2;基因otx1;基因emx1;基因lbx2;基因 bcl2l11;基因pax8;基因hoxd1;基因satb2;基因vill;基因cldn11;基因ephb3;基因nkx3-2;基因kctd8;基因pitx1;基因cxxc5;基因 foxc1;基因nrn1;基因hoxa9;基因dlx6;基因mos;基因tcf24;基因ca3;基因gdf6;基因foxd4;基因ptf1a;基因tlx1;基因ina;基因nkx6-2;基因pax6;基因pax6;基因bcat1;基因faim2;基因grasp;基因ccna1;基因six1;基因prkcb;基因sox9;基因st8sia5;基因nfix;基因eps8l1;基因zik1;基因kal1;基因znf81;或任一种基因的互补序列或变体,只要变体中的甲基化位点未发生突变;和

9、(2)使用甲基化标志物的甲基化水平数据构建逻辑回归的机器学习模型。

10、在一个实施方案中,位点的长度为150bp-500bp,优选200bp-470bp。在一个实施方案中,非乳腺癌的癌症是结直肠癌、肝癌、胃癌、食管癌、胰腺癌和/或肺癌。

11、在一个实施方案中,甲基化标志物包含以下任一项或多项所示的核苷酸序列或者其互补序列或变体序列:seq id no:1-51。

12、在一个实施方案中,样品为细胞、组织、细针穿刺活检物或血浆。在一个实施方案中,基因组dna是血浆中的游离dna。

13、在一个实施方案中,步骤(1)包括获得样品dna的甲基化测序数据。

14、在一个实施方案中,步骤(2)包括建立逻辑回归模型以及使用获得的甲基化标志物的甲基化水平作为训练集进行训练并根据训练集的样本确定模型的相关阈值。

15、例如,使用python(v3.9.7)中的sklearn(v1.0.1)包中的逻辑回归模型:allmodel=logisticregression(),该模型的公式如下,其中x为样品中甲基化标志物的甲基化水平值,w为甲基化标志物的系数,b为截距值,y为模型预测分值

16、以及使用获得的甲基化标志物的甲基化水平作为训练集进行训练:allmodel.fit(traindata,trainpheno),其中traindata是训练集的数据,trainpheno是训练集样本的性状,其中乳腺癌为1,其它癌种为0,并根据训练集的样本确定模型的相关阈值。

17、在另一个方面,提供了根据本发明的方法构建的乳腺癌预测模型。

18、在另一个方面,提供了诊断乳腺癌的装置,其包含存储器和处理存储器存储的指令的处理器,所述指令执行根据本发明的方法以构建乳腺癌预测模型;并且使用待测样品的基因组dna中的甲基化标志物的甲基化水平作为测试集以获得预测分值并根据阈值对样本是否是乳腺癌进行判断。例如,使用 testpred=allmodel.predict_proba(testdata)[:,1],其中testdata为测试集数据,testpred为模型预测分值,使用预测分值并根据阈值对样本是否是乳腺癌进行判断,大于阈值预测为乳腺癌,反之预测为其它癌种。

19、在另一个方面,提供了用于检测乳腺癌组织特异性甲基化标志物的试剂盒或装置,其包含检测来自样品的基因组dna中的一种或多种乳腺癌组织特异性甲基化标志物状态和/或水平的试剂或组件,所述乳腺癌组织特异性甲基化标志物是以下区域或其位点,所述区域是以下基因以及该基因在其所处的染色体中的2kb上游区和2kb下游区:基因barhl2;基因alx3;基因tbx15;基因c2cd4d;基因ryr2;基因lbh;six3;基因six2;基因otx1;基因 emx1;基因lbx2;基因bcl2l11;基因pax8;基因hoxd1;基因satb2;基因vill;基因cldn11;基因ephb3;基因nkx3-2;基因kctd8;基因 pitx1;基因cxxc5;基因foxc1;基因nrn1;基因hoxa9;基因dlx6;基因mos;基因tcf24;基因ca3;基因gdf6;基因foxd4;基因ptf1a;基因tlx1;基因ina;基因nkx6-2;基因pax6;基因pax6;基因bcat1;基因faim2;基因grasp;基因ccna1;基因six1;基因prkcb;基因sox9;基因st8sia5;基因nfix;基因eps8l1;基因zik1;基因kal1;基因znf81;或任一种基因的互补序列或变体,只要变体中的甲基化位点未发生突变。在一个实施方案中,位点的长度为150bp-500bp。在一个实施方案中,位点的长度为200bp-470bp。

20、在一个实施方案中,甲基化标志物包含以下中任一项或多项所示的核苷酸序列或其互补序列或者变体序列:seq id no:1-51。

21、在一个实施方案中,样品为细胞、组织、细针穿刺活检物或血浆。在一个实施方案中,核酸是血浆中的游离dna。

22、在一个实施方案中,试剂或组件包含以下一种或多种方法中使用的试剂或组件:基于重亚硫酸盐转化的pcr、dna测序、甲基化敏感的限制性内切酶分析法、荧光定量法、甲基化敏感性高分辨率熔解曲线法和基于芯片的甲基化图谱分析和质谱法。

23、在一个实施方案中,试剂包含用于检测甲基化标志物的寡核苷酸。在一个实施方案中,寡核苷酸是引物和/或探针。

24、在一个实施方案中,引物是利用甲基化测序法检测位点的甲基化水平/ 状态的引物或用于扩增一个或多个甲基化位点的pcr引物。

25、在一个实施方案中,试剂包含重亚硫酸盐及其衍生物、pcr缓冲液、聚合酶、dntp、引物、探针、甲基化敏感或不敏感的限制性内切酶、酶切缓冲液、荧光染料、荧光淬灭剂、荧光报告剂、外切核酸酶、碱性磷酸酶、内标和/或对照物,所述对照物是来自正常受试者或非乳腺癌的癌症患者的前述特异性甲基化标志物。在一个实施方案中,所述非乳腺癌的癌症是结直肠癌、肝癌、胃癌、食管癌、胰腺癌和/或肺癌。

26、本发明提供了分离的核酸,其是一种或多种特异性甲基化标志物。在一个实施方案中,分离的核酸是乳腺癌组织特异性甲基化标志物。在一个实施方案中,所述乳腺癌组织特异性甲基化标志物是以下区域或其位点,所述区域是以下基因以及该基因在其所处的染色体中的2kb上游区和2kb下游区:基因barhl2;基因alx3;基因tbx15;基因c2cd4d;基因ryr2;基因lbh; six3;基因six2;基因otx1;基因emx1;基因lbx2;基因bcl2l11;基因pax8;基因hoxd1;基因satb2;基因vill;基因cldn11;基因ephb3;基因nkx3-2;基因kctd8;基因pitx1;基因cxxc5;基因foxc1;基因 nrn1;基因hoxa9;基因dlx6;基因mos;基因tcf24;基因ca3;基因gdf6;基因foxd4;基因ptf1a;基因tlx1;基因ina;基因nkx6-2;基因pax6;基因pax6;基因bcat1;基因faim2;基因grasp;基因ccna1;基因six1;基因prkcb;基因sox9;基因st8sia5;基因nfix;基因eps8l1;基因zik1;基因kal1;基因znf81;或任一种基因的互补序列或变体,只要变体中的甲基化位点未发生突变。在一个实施方案中,位点的长度为150bp-500bp。在一个实施方案中,位点的长度为200bp-470bp。在一个实施方案中,甲基化标志物包含以下中任一项或多项所示的核苷酸序列或其互补序列或者变体序列:seq idno:1-51。在一个实施方案中,分离的核酸从样品分离。在一个实施方案中,样品是细胞、组织、细针穿刺活检物或血浆。在一个实施方案中,分离的核酸是从乳腺癌患者获得的。例如,分离的核酸是从血浆中的游离dna中获得的。

27、在本发明的各方面的实施方案中,变体包含与任一种基因的序列具有至少70%同一性的序列。例如,变体包含与任一种基因的序列具有至少75%、 76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列。

28、在本发明的各方面的实施方案中,所述区域是所述基因以及该基因在其所处的染色体中的2kb上游区和2kb下游区。在一个实施方案中,上游区是基因上游的1.9kb、1.8kb、1.7kb、1.6kb、1.5kb、1.4kb、1.3kb、1.2kb、1.1kb、 1kb、900bp、800bp、700bp、600bp、500bp、400bp、300bp、200bp、100bp、 90bp、80bp、70bp、60bp、50bp、40bp、30bp、20bp、10bp或5bp上游区。下游区是基因下游的1.9kb、1.8kb、1.7kb、1.6kb、1.5kb、1.4kb、1.3kb、1.2kb、1.1kb、1kb、900bp、800bp、700bp、600bp、500bp、400bp、300bp、200bp、 100bp、90bp、80bp、70bp、60bp、50bp、40bp、30bp、20bp、10bp或5bp下游区。

29、在本发明的各方面的实施方案中,位点的长度可以有所变化。在一个实施方案中,位点的长度可以是150bp-500bp。在一个实施方案中,位点的长度可以是200bp-470bp。在一个实施方案中,位点的长度可以是160bp、170bp、 180bp、190bp、200bp、210bp、220bp、230bp、240bp、250bp、260bp、270bp、 280bp、290bp、300bp、310bp、320bp、330bp、340bp、350bp、360bp、370bp、 380bp、390bp、400bp、410bp、420bp、430bp、440bp、450bp、460bp、470bp、 480bp、490bp或500bp。

30、在在本发明的各方面的实施方案中,变体是与上述任一项或多项所示的核苷酸序列具有至少70%、75%、76%、77%、78%、79%、80%、81%、82%、 83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%或99%同一性的变体序列。

31、在一个方面,本发明提供了方法,其(1)区分乳腺癌患者与非乳腺癌的癌症患者,(2)用于诊断或辅助诊断乳腺癌;或者(3)用于泛癌筛查过程中对乳腺癌的组织溯源,包括测定样品基因组dna中的本文中所述的一种或多种甲基化标志物的甲基化水平。在一个实施方案中,利用本发明的乳腺癌预测模型进行该方法。

32、本发明的优势包括:

33、1.本发明提供了新的甲基化标志物,可以用于泛癌种早期筛查过程中对乳腺癌的组织溯源,达到更好的区分乳腺癌的目的;

34、2.以肿瘤细胞释放到血浆中的游离dna(ctdna)为基础,为非侵入性方法,可实现乳腺癌早筛;

35、3.本发明的甲基化标志物可以以高的敏感性和特异性检出乳腺癌。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1