一种检测肺癌易感基因的方法及试剂盒的制作方法

文档序号:400371阅读:469来源:国知局
专利名称:一种检测肺癌易感基因的方法及试剂盒的制作方法
技术领域
本发明涉及基因工程领域,更具体地说,涉及一种检测肺癌易感基因的方法及试剂盒。
背景技术
易感基因是指和特定疾病具有一定关联的基因或等位基因。对复杂疾病的易感基因进行检测,得到其具体的序列信息,然后结合后续进一步的分子生物学试验、临床试验、临床观察以及综合数据的统计分析,建立一定的疾病模型,可以实现早期评估疾病的易感性并采取相应预防措施降低疾病的发生几率。大量研究证实遗传因素在疾病的易感性中发挥重要作用,复杂疾病的遗传因素己证实存在微效基因剂量效应,即多个微效基因的作用相互累加进而形成明显的表型综合效应。因此,对疾病的多个易感基因及突变位点 (特别是针对基因组中最主要的遗传突变形式——单核苷酸多态性(Single Nucleotide Polymorphisms, SNP),它约占整个基因组中遗传突变的92% )进行检测至关重要。肺癌发生于支气管粘膜上皮,亦称支气管肺癌。随着工业发展,大气污染加剧,在全球范围内肺癌发生率与死亡率每年都以4. 5%的速度快速递增。肺癌成为死亡率最高的一种癌症,一方面是目前仍没有特别有药物与治疗方案,10-15%的低治愈率,另一方面是肺癌发现一般都是晚期,甚至癌细胞已经发生了转移。临床表明,越早发现,肺癌患者生存率越高。肺癌易感基因为初步研究可能与肺癌有一定关联的基因,其中各易感基因的关联度有高有低。目前,检测肺癌易感基因的方法最常见的是Sanger测序法,该方法能对肺癌易感基因进行区域检测,但Sanger测序法每次只能对一个样品的某一段区域进行测序,测序成本高,灵敏度低(20% ),无法得出各突变位点发生变异的精确数据。此外,虽然针对肺癌易感基因检测以及SNP位点的研究成果已经很多,但现有技术适用于针对单个SNP位点进行检测及分析,不适于对多SNP位点进行联合检测和分析,检测结果均不够准确全面。因此需要一种检测肺癌易感基因的新方法,能对肺癌易感基因的多个区域同时进行检测,准确得出这些区域的序列信息,包括已知突变和未知突变的各突变位点的变异情况,检测灵敏度高,并能进一步同时对大量样品检测。

发明内容
本发明的目的在于提供一种检测肺癌易感基因的方法及相应的试剂盒,能对肺癌易感基因的多个目标区域同时进行检测,得出这些区域的准确序列信息,包括已知突变和未知突变的各突变位点的变异情况,检测灵敏度高,并能进一步同时对大量样品进行检测。为了实现发明目的,一种检测肺癌易感基因的方法,包括以下步骤A.利用肺癌易感基因特异性引物,对待测样品中的多个目标区域进行扩增,并基于扩增产物构建测序文库;
B.对测序文库进行单分子扩增,得到与所述多个目标区域对应的多个单分子扩增产物;C.同时对所述多个单分子扩增产物进行高通量基因测序,得到所述多个目标区域的序列信息。其中,所述步骤A包括Al.利用肺癌易感基因特异性引物,对待测样品中的多个目标区域进行扩增,得到与所述多个目标区域对应的扩增产物;A2.利用接头元件,与所述多个目标区域对应的扩增产物进行连接,得到测序文库;所述接头元件采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的至少一种。其中,步骤A2包括以下步骤A21.对与所述多个目标区域对应的扩增产物进行片段化,得到片段化产物;A22.利用接头元件,与片段化产物进行连接,构建测序文库。其中,所述步骤A22包括以下步骤A221.利用第一接头与片段化产物的两端连接,得第一连接产物;A222.环化第一连接产物,得环化产物;A223. II s型限制性内切酶酶切环化产物,得酶切产物;A224.在酶切产物两端接上第二接头和第三接头,得测序文库。其中,所述步骤A22包括以下步骤Α22Γ .利用第四接头与片段化产物连接,得第二连接产物;A222’ . II s型限制性内切酶酶切第二连接产物,得带有第四接头的酶切片段;A223’ .带有第四接头的酶切片段与第五接头连接,形成测序文库。其中,步骤A2所述接头元件中的至少一个接头包含有第一标签序列,用于在文库构建过程中,对不同待测样品的测序文库做上相应的标记。所述第一标签序列,优选为带有特定序列的核酸分子,其碱基数不限。进一步的,所述第一标签序列碱基数为3 20,更优选为4 10。其中,步骤A所述的肺癌易感基因特异性引物与目标区域完全互补或部分互补。进一步的,与每个目标区域对应的特异性引物中,至少有一条引物与目标区域部分互补,且该引物的5’端带有第二标签序列,用于在扩增目标区域过程中,对不同待测样品的目标区域扩增产物做上相应的标记。所述第二标签序列,优选为带有特定序列的核酸分子,其碱基数不限。进一步的,所述第二标签序列碱基数不限,优选为3 20,更优选为4 10。其中,所述肺癌易感基因包括APEl、CASP7、CASP8、CASP9、CHEK2、C0X-2、CYPlAl、 CYP2E1、ERCCl、ERCC2、ERCC6、Exol、GSTPl、Hmlhl、IL-1 β、MDM2、ΜΡ0、MTHFR、NQOl、OGGl、 Ρ73、RASSFU TERT, TGFBl、ΤΡ53、ΤΡ63、XPC 和 XRCCl 中的至少一个。进一步的,所述APEl的特异性引物为SEQ ID NO :1和SEQ IDNO 2 ;所述CASP7的特异性引物为SEQ ID NO 3和SEQ ID NO 4 ;所述CASP8的特异性引物为SEQ ID NO 5和 SEQ ID NO 6 ;所述CASP9的特异性引物为SEQ ID NO 7和SEQ ID NO 8 ;所述CHEK2的特异性引物为SEQ ID NO 9和SEQ ID NO 10 ;所述C0X—2的特异性引物为SEQ ID NO 11禾口SEQ ID NO 12 ;所述 CYPlAl 的特异性引物包括 SEQ ID N0:13 禾口 SEQ ID NO 14、SEQ ID NO 15和SEQ IDNO 16中的至少一对;所述CYP2E1的特异性引物为SEQ ID NO 17和SEQ IDNO 18 ;所述ERCCl的特异性引物为SEQ ID NO 19和SEQ ID NO 20 ;所述ERCC2的特异性引物包括 SEQ ID NO 21 和 SEQ ID NO :22、SEQ ID NO 23 和 SEQ ID NO 24 中的至少一对;所述ERCC6的特异性引物为SEQ ID NO 25和SEQ ID NO 26 ;所述Exol的特异性引物为 SEQ ID NO 27 和 SEQ ID NO 28 ;所述 GSTPl 的特异性引物为 SEQ ID NO 29 和 SEQ ID NO 30 ;所述Hmlhl的特异性引物为SEQ ID NO 31和SEQ ID NO 32 ;所述IL-I β的特异性引物为SEQ IDNO 33和SEQ ID NO 34 ;所述MDM2的特异性引物为SEQ ID NO 35和SEQ IDNO 36 ;所述MPO的特异性引物为SEQ ID NO 37和SEQ ID NO 38 ;所述MTHFR的特异性引物为SEQ ID NO 39和SEQ ID NO 40 ;所述NQOl的特异性引物为SEQ ID NO 41和SEQ ID NO 42 ;所述OGGl的特异性引物为SEQ IDNO :43和SEQ ID NO 44 ;所述Ρ73的特异性引物包括 SEQ ID NO 45 和 SEQ IDNO :46、SEQ ID NO 47 和 SEQ ID NO 48 中的至少一对;所述RASSFl的特异性引物为SEQ ID NO :49和SEQ ID NO 50 ;所述TERT的特异性引物为SEQ IDNO 51 和 SEQ ID NO 52 ;所述 TGFBl 的特异性引物为 SEQ ID NO 53 和 SEQ IDNO 54 ;所述ΤΡ53的特异性引物为SEQ ID NO 55和SEQ ID NO 56 ;所述ΤΡ63的特异性引物为SEQ ID NO 57 和 SEQ ID NO 58 ;所述 XPC 的特异性引物为 SEQ ID NO 59 和 SEQ ID NO 60 ;所述 XRCCl 的特异性引物包括 SEQ ID Ν0:61 禾口 SEQ ID NO :62、SEQ ID NO :63 禾口 SEQ ID NO: 64、SEQ ID NO :65 和 SEQ IDNO :66、SEQ ID NO 67 和 SEQ ID NO 68 中的至少一对。其中,所述方法还可以包括步骤D.利用GSTMl及GSTTl的扩增引物对待测样品的核酸进行PCR扩增,凝胶电泳检测GSTMl和GSTTl基因的缺失情况;步骤D与步骤A、B、C无先后关系。进一步的,所述GSTMl 的扩增引物包括 SEQ ID NO 69 禾口 SEQ ID NO 70、SEQ ID NO 71和SEQ ID NO -J2中的至少一对;所述GSTTl的扩增引物为SEQID NO 73和SEQ ID NO :74。一种能够用于本发明的任一种检测肺癌易感基因方法的试剂盒,包括肺癌易感基因特异性引物,用于对待测样品中的多个目标区域进行扩增;接头元件,用于与扩增产物结合构建测序文库。其中,所述接头元件采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的至少一种。其中,所述接头元件中的至少一个接头包含有第一标签序列,用于在文库构建过程中,对不同待测样品的测序文库做上相应的标记。所述第一标签序列,优选为带有特定碱基序列的核酸分子,其碱基数不限。进一步的,所述第一标签序列碱基数为3 20,更优选为4 10。其中,所述的待测易感基因有多个,与每个目标区域对应的特异性引物中,至少有一条引物与目标区域部分互补,且该引物的5’端带有第二标签序列,用于在扩增目标区域过程中,对不同待测样品的目标区域扩增产物做上相应的标记。所述第二标签序列优选为带有特定碱基序列的核酸分子,其碱基数不限,优选的, 第二标签序列的碱基数为3 20,更优选为4 10。其中,所述肺癌易感基因包括APEl、CASP7、CASP8、CASP9、CHEK2、C0X-2、CYPlAl、CYP2E1、ERCCl、ERCC2、ERCC6、Exol、GSTPl、Hmlhl、IL-1 β、MDM2、ΜΡ0、MTHFR、NQOl、OGGl、 Ρ73、RASSFU TERT, TGFBl、ΤΡ53、ΤΡ63、XPC 和 XRCCl 中的至少一个。进一步的,所述肺癌易感基因还包括GSTM1、GSTTl中的至少一个。进一步的,所述APEl的特异性引物为SEQ ID NO 1和SEQ ID NO 2 ;所述CASP7 的特异性引物为SEQ ID NO 3和SEQ ID NO 4 ;所述CASP8的特异性引物为SEQ ID NO 5 和SEQ ID NO 6 ;所述CASP9的特异性引物为SEQ ID NO 7和SEQ ID NO 8 ;所述CHEK2的特异性引物为SEQ ID NO 9和SEQ ID NO 10 ;所述C0X-2的特异性引物为SEQ ID NO 11 和 SEQ ID NO :12 ;所述 CYPlAl 的特异性引物包括 SEQ ID Ν0:13 禾口 SEQ ID NO 14、SEQ ID NO 15和SEQ IDNO 16中的至少一对;所述CYP2E1的特异性引物为SEQ ID NO 17和SEQ IDNO 18 ;所述ERCCl的特异性引物为SEQ ID NO 19和SEQ ID NO 20 ;所述ERCC2的特异性引物包括 SEQ ID NO 21 和 SEQ ID NO :22、SEQ ID NO 23 和 SEQ ID NO 24 中的至少一对;所述ERCC6的特异性引物为SEQ ID NO 25和SEQ ID NO 26 ;所述Exol的特异性引物为 SEQ ID NO 27 和 SEQ ID NO 28 ;所述 GSTPl 的特异性引物为 SEQ ID NO 29 和 SEQ ID NO 30 ;所述Hmlhl的特异性引物为SEQ ID NO 31和SEQ ID NO 32 ;所述IL-I β的特异性引物为SEQ IDNO 33和SEQ ID NO 34 ;所述MDM2的特异性引物为SEQ ID NO 35和SEQ IDNO 36 ;所述MPO的特异性引物为SEQ ID NO 37和SEQ ID NO 38 ;所述MTHFR的特异性引物为SEQ ID NO 39和SEQ ID NO 40 ;所述NQO 1的特异性引物为SEQ ID NO 41和SEQ ID NO 42 ;所述OGGl的特异性引物为SEQ IDNO 43和SEQ ID NO 44 ;所述Ρ73的特异性引物包括 SEQ ID NO 45 和 SEQ IDNO :46、SEQ ID NO 47 和 SEQ ID NO 48 中的至少一对; 所述RASSFl的特异性引物为SEQ ID NO 49和SEQ ID NO 50 ;所述TERT的特异性引物为 SEQ IDNO 51 和 SEQ ID NO 52 ;所述 TGFBl 的特异性引物为 SEQ ID NO 53 和 SEQ IDNO 54 ;所述ΤΡ53的特异性引物为SEQ ID Ν0:55和SEQ ID NO 56 ;所述ΤΡ63的特异性引物为 SEQ ID Ν0:57 禾口 SEQ ID NO :58 ;所述 XPC 的特异性引物为 SEQ ID NO 59 禾口 SEQ ID NO: 60 ;所述 XRCC 1 的特异性引物包括 SEQ ID NO 61 和 SEQ ID NO :62、SEQ ID NO :63 和 SEQ ID NO 64,SEQ ID NO 65 和 SEQ IDNO 66,SEQ ID NO 67 和 SEQ ID NO 68 中的至少一对; 所述 GSTMl 的特异性引物包括 SEQ ID NO 69 和 SEQ ID NO :70、SEQ ID NO 71 和 SEQ ID NO 72中的至少一对;所述GSTTl的特异性引物为SEQ ID NO 73和SEQ ID NO :74。由上可知,本发明提供的肺癌易感基因检测方法及其试剂盒,能同时检测肺癌易感基因的多个区域,准确得出这些区域的序列信息,包括已知突变和未知突变的各突变位点的变异情况,检测灵敏度高,并能进一步同时对大量样品检测。


图1是本发明一个实施例中检测肺癌易感基因的方法流程图;图2是本发明一个实施例中的单突出末端接头的接头示意图;图3是本发明一个实施例中的双突出末端接头的结构示意图;图4是本发明一个实施例中的带茎环结构的接头的结构示意图;图5是本发明一个实施例中的分叉接头的结构示意图;图6是本发明一个实施例中的T末端分叉接头的结构示意图;图7是本发明另一个实施例中的分叉接头的结构示意图8是本发明一个实施例中的双脱氧分叉接头的结构示意图;图9是本发明一个实施例中利用片段化产物和接头元件构建测序文库的方法流程图;图10是本发明另一个实施例中利用片段化产物和接头元件构建测序文库的方法流程图;图11是本发明另一个实施例中利用片段化产物和接头元件构建测序文库的方法流程图;图12是本发明另一个实施例中检测肺癌易感基因的方法流程图。
具体实施例方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。本发明所述的目标区域,为肺癌易感基因上的任意序列,可根据需要进行选择,包括但不限于肺癌易感基因的内部序列、肺癌易感基因的外部调控序列,所述肺癌易感基因的内部序列,包括但不限于肺癌易感基因的内含子区域、外显子区域、同时含有内含子与外显子的区域。图1示出了本发明的一种检测肺癌易感基因的方法流程,该方法包括以下步骤Si.利用肺癌易感基因特异性引物,对待测样品中的多个目标区域进行扩增,并基于扩增产物构建测序文库;S2.对测序文库进行单分子扩增,得到与所述多个目标区域对应的多个单分子扩增产物;S3.同时对所述多个单分子扩增产物进行高通量基因测序,得到所述多个目标区域的序列信息。本方法利用高通量测序技术对肺癌易感基因的多个区域同时进行区域测序,能够准确得知这些区域的序列信息,包括已知突变和未知突变的各突变位点的变异情况,检测灵敏度高,能够准确且全面得到肺癌易感基因的序列信息。通过本方法检测得到的肺癌易感基因序列信息,可以结合后续进一步的分子生物学试验和临床试验、临床观察以及综合数据的统计分析,并建立一定的肺癌疾病模型,实现早期评估肺癌的易感性。需要说明的是步骤Sl中所述待测样品为能提取核酸的任意形式的样品,包括但不限于全血、 血清、血浆和组织样品;所述组织样品包括但不限于石蜡包埋组织、新鲜组织和冰冻切片。步骤Sl中所述的多个目标区域,它们可来源于同一个肺癌易感基因,也可来源于不同的肺癌易感基因。步骤Sl所得测序文库中,存在多种测序文库分子,对测序文库进行单分子扩增, 即是指,将测序文库中的多种文库分子,以极微量(甚至单分子)的形式在空间上隔离(但这些文库分子整体上还是属于同一个反应体系),并且在各自的空间内实现扩增。现有技术中,Sanger测序技术每次只能对一个样品的某一段区域进行测序,要实
8现对多个目标区域的测序,只能是通过多次反应来实现。而在本发明中,测序文库中的各个分子经过单分子扩增后,每个测序文库分子均形成单分子拷贝阵列,各单分子拷贝阵列在进行高通量基因测序时处于不同的位置,使得测序引物与单分子拷贝阵列之间的杂交,以及在酶作用下的延伸反应可同时进行,相互之间互不干扰。因此,可以同时对大量的(成百万上千万,甚至更多的)单分子拷贝阵列同时进行测序反应,然后通过采集相应的信号, 进而获得所需的序列信息,且测序的灵敏度较Sanger更高。其中,步骤Sl所述的特异性引物与目标区域完全互补或部分互补。进一步的,与每个目标区域对应的引物中,至少有一条引物与目标区域部分互补, 且该引物的5’端带有第二标签序列。该第二标签序列,用于在扩增目标区域过程中,对不同待测样品的目标区域扩增产物做上相应的标记。该第二标签序列,优选为带有特定序列的核酸分子,其碱基数不限。该第二标签序列的碱基数优选为3 20,更优选为4 10。此外,所述特异性引物还可带有其它标记物,包括但不限于生物素标记、多聚组氨酸标记、抗原、抗体,从而使得目标区域扩增产物的纯化极为方便。另外,同一待测样品的不同目标区域的扩增可同时进行或分别独立进行或部分同时进行。在具体的实验过程中,可根据需要选用上述任一种方案进行。如果分别对各目标区域进行分别扩增的话,能够通过测定扩增产物的量来确保步骤Sl中用于构建目标区域测序文库的目标区域扩增产物的分子数保持一致,不会因为扩增步骤而导致同一待测样品的不同目标区域拷贝数不同,进而影响后续的测序反应结果。当然,当各目标区域的大小相近,GC含量也相近的时候,通过合理的设计引物,利用多重PCR技术,步骤Sl可对多个目标区域进行同时扩增,且保证各目标区域之间的扩增效率保持基本一致,这样就能够有效的提高实验效率,降低反应的成本。当待测样品有多个时,不同样品的目标区域的扩增必须分别进行。其中,步骤Sl所述的肺癌易感基因包括APEl、CASP7、CASP8、CASP9、CHEK2、C0X-2、 CYPIA1、CYP2E1、ERCC1、ERCC2、ERCC6、Exo1、GSTP1、Hmlh1、IL-1 β、MDM2、MPO、MTHFR、NQO1、 OGGl、Ρ73、RASSFU TERT, TGFBl、ΤΡ53、ΤΡ63、XPC 和 XRCCl 中的至少一种。进一步的,所述APEl的特异性引物为SEQ ID NO 1和SEQ ID NO 2 ;所述CASP7 的特异性引物为SEQ ID NO 3和SEQ ID NO 4 ;所述CASP8的特异性引物为SEQ ID NO 5 和SEQ ID NO 6 ;所述CASP9的特异性引物为SEQ ID NO 7和SEQ ID NO 8 ;所述CHEK2的特异性引物为SEQ ID NO 9和SEQ ID NO 10 ;所述C0X-2的特异性引物为SEQ ID NO 11 和 SEQ ID NO :12 ;所述 CYPlAl 的特异性引物包括 SEQ ID Ν0:13 禾口 SEQ ID NO 14、SEQ ID NO 15和SEQ IDNO 16中的至少一对;所述CYP2E1的特异性引物为SEQ ID NO 17和SEQ IDNO 18 ;所述ERCCl的特异性引物为SEQ ID NO 19和SEQ ID NO 20 ;所述ERCC2的特异性引物包括 SEQ ID NO 21 和 SEQ ID NO :22、SEQ ID NO 23 和 SEQ ID NO 24 中的至少一对;所述ERCC6的特异性引物为SEQ ID NO 25和SEQ ID NO 26 ;所述Exol的特异性引物为 SEQ ID NO 27 和 SEQ ID NO 28 ;所述 GSTPl 的特异性引物为 SEQ ID NO 29 和 SEQ ID NO 30 ;所述Hmlhl的特异性引物为SEQ ID NO 31和SEQ ID NO 32 ;所述IL-I β的特异性引物为SEQ IDNO 33和SEQ ID NO 34 ;所述MDM2的特异性引物为SEQ ID NO 35和SEQ IDNO 36 ;所述MPO的特异性引物为SEQ ID NO 37和SEQ ID NO 38 ;所述MTHFR的特异性引物为SEQ ID NO 39和SEQ ID NO 40 ;所述NQOl的特异性引物为SEQ ID NO 41和SEQ ID NO 42 ;所述OGGl的特异性引物为SEQ IDNO 43和SEQ ID NO 44 ;所述P73的特异性引物包括 SEQ ID NO 45 和 SEQ IDNO :46、SEQ ID NO 47 和 SEQ ID NO 48 中的至少一对; 所述RASSFl的特异性引物为SEQ ID NO 49和SEQ ID NO 50 ;所述TERT的特异性引物为 SEQ IDNO 51 和 SEQ ID NO 52 ;所述 TGFB 1 的特异性引物为 SEQ ID NO 53 和 SEQ IDNO 54 ;所述TP53的特异性引物为SEQ ID N0:55和SEQ ID NO :56 ;所述TP63的特异性引物为 SEQ ID NO 57 和 SEQ ID NO 58 ;所述 XPC 的特异性引物为 SEQ ID NO 59 和 SEQ ID NO 60 ;所述 XRCC 1 的特异性引物包括 SEQ ID NO 61 和 SEQ ID NO :62、SEQ ID NO :63 和 SEQ ID NO 64,SEQ ID NO :65 禾口 SEQ IDNO 66、SEQ ID NO :67 禾口 SEQ ID NO :68 中的至少一对。在一个实施例中,步骤Sl的具体实现过程是Sll.利用肺癌易感基因特异性引物,对待测样品中的多个目标区域进行扩增,得到与所述多个目标区域对应的扩增产物;S12.利用接头元件,与所述多个目标区域对应的扩增产物进行连接,得到测序文库;所述接头元件采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的至少一种。需要说明的是步骤Sll中,对同一待测样品中的多个目标区域的扩增,可同时进行或分别独立进行或部分同时进行。可根据实际情况,如扩增所用的肺癌易感基因特异性引物的退火温度,扩增的目标区域的大小、GC含量,扩增的目标区域的数量等,进行相应的调整。不同待测样品的目标区域的扩增必须分别进行。步骤S12中,所述接头元件与扩增产物的连接方式,可以采用多种方式实现,包括接头元件与扩增产物直接连接,或对扩增产物进行处理之后再进行连接。步骤S12所述接头元件,用于构建测序文库,可包括一种或多种接头。其中,步骤S12所述接头元件中的至少一个接头包含有第一标签序列,该第一标签序列,用于在文库构建过程中,对不同待测样品的测序文库做上相应的标记。这样,在分别获得目标区域测序文库后,不同的待测样品的目标区域测序文库可以混合在同一个反应体系中,进行单分子扩增反应,进而同时进行高通量测序。提高测序反应的效率,降低了样品检测的成本。该第一标签序列优选为带有特定序列的核酸分子,其碱基数不限。进一步的,所述第一标签序列的碱基数优选为3 20,这样,每次至少能够对43个样品进行同时检测。在综合考虑各种情况后,如标签的特异性、接头的成本、接头的长度等,第一标签序列的碱基数优选为4 10。通过第二标签和第一标签的结合,本发明的发明每次能够检测至少43X43个样品,即4096个样品。接头的修饰方式有多种,包括但不限于被生物素化或甲基化,或同时被生物素化和甲基化。在一个实施例中,该接头被生物素化,并与未生物素化的片段化产物连接,生物素的存在有利于构建的测序文库的分离纯化。在另一个实施例中,该接头被甲基化,并与未甲基化的片段化产物连接,然后用仅切割甲基化DNA的限制性内切酶消化成功连接的连接产物,从而确保酶切产物的单一性。
10
接头的结构形式也有多种,包括但不限于平末端接头、突出末端接头、带茎环结构的接头和分叉接头。构建测序文库过程中可以使用一种或多种接头。其中,突出末端接头、带茎环结构的接头和分叉接头均能够有效防止在连接过程中,多个接头自连现象的发生。针对接头的上述结构形式,以下将提供多个实施例。在第一实施例中,接头元件采用平末端接头,该接头是双链完全互补的核酸分子。在第二实施例中,接头元件采用突出末端接头,该接头是双链核酸分子,该双链核酸分子至少包括一突出末端。该突出末端的碱基数无具体限制,优选为1 10个碱基。根据该双链核酸分子的结构,突出末端接头可分成两类,分别是单突出末端接头、双突出末端接头。如图2所示的单突出末端接头,其一端为平末端,另一端为突出末端。其中带有分叉接头的单突出末端接头能够防止接头自连。为了防止一端为平末端的单突出末端接头自连,可对平末端上的3’ OH进行修饰(包括但不限于用氨基封闭羟基),或将平末端上的5’ 磷酸基团去除。如图3所示的双突出末端接头,其含有两个突出末端,这两个突出末端可在一条核苷酸链上(图3a)或在不同的核苷酸链上(图北)。当这两个突出末端在不同的核酸链上时,他们相互之间不互补,以防在连接时出现接头自连。在第三实施例中,接头元件采用带茎环结构的接头,如图4所示。该接头为单链核酸分子,该单链核酸分子包括第一互补配对区1、茎环区2和第二互补配对区3(图如),第一互补配对区1能够与第二互补配对区3互补配对,且它们形成的互补配对区包括至少一个限制性内切酶识别位点,而通过该酶切识别位点,特定的酶能够将茎环区切开或切除,从而将单链核酸分子变成双链核酸分子,以便于后续的操作。在本发明的一个实施例中,如图 4b所示,带茎环结构的接头还可带有突出末端4,该突出末端可位于单链核酸分子的5’端或3’端。突出末端4的存在能够进一步的防止接头自连现象的发生。该突出末端优选为 T。在第四实施例中,接头元件采用分叉接头,如图5所示,是双链核酸分子,包括互补区和分叉区,所述分叉区的两条单链各包含至少一个扩增引物结合位点。在本发明的一个实施例中,所述分叉接头的互补区包括至少一个限制性内切酶识别位点,该酶切识别位点可以在建库过程中酶切形成末端,以便于进行后续的操作。该分叉接头的分叉设计能够在建库过程避免多个接头自连现象的出现;所述分叉区上包含的扩增引物结合位点,可以直接用于结合扩增引物,进行扩增反应其中,所述分叉接头的分叉区的每条链各含有N个核苷酸;优选的,9 < NS 30。 其中,所述分叉接头的配对区互补配对的核苷酸对数不限;优选的,互补配对的核苷酸对数为7 15,更优选的,互补配对的核苷酸对数为9 13。其中,所述分叉接头的配对区的3’末端为突出末端或平末端。优选的,所述分叉接头的配对区的3’末端为突出末端,该突出末端可与所述片段化产物的粘性末端互补配对, 提高了连接效率,以利于构建测序文库反应的顺利进行。更优选的,所述分叉接头为T末端分叉接头,该接头的配对区的3’末端为突出末端,且突出末端最后一个碱基为T ;例如图6所示的T末端分叉接头,图中N为A、T、C、G碱基中的任一种。
更优选的,所述分叉接头的配对区的3’末端为突出末端,且突出末端的核苷酸包括通用碱基。其中,突出末端的碱基数无特殊限制,优选在1至4之间。例如图7所示的分叉接头,图中N为A、T、C、G碱基中的任一种,X为通用碱基。优选的,所述分叉接头为双脱氧接头,该接头的配对区的3’末端为平末端,且3’ 末端最后一个核苷酸为带有双脱氧碱基的核苷酸;例如图8所示的双脱氧分叉接头,图中N 为A、T、C、G碱基中的任一种,dd表示该3’末端最后一个核苷酸为带有双脱氧碱基的胞嘧啶核苷酸。应当说明的是,上述接头元件只是部分实施例,并不用以限制本发明的保护范围。关于步骤S12的实现方式在一个实施例中,步骤S12采用接头元件与扩增产物直接连接的方式,构建出测序文库。在另一个实施例中,根据高通量测序技术的需要,当目标区域扩增产物较大时或者需要构建的目标区域测序文库较小时,则对扩增产物进行片段化处理之后,再与接头元件进行连接,构建测序文库,如图9所示,步骤S12包括以下步骤S121.对与所述多个目标区域对应的扩增产物进行片段化,得到片段化产物;S122.利用接头元件,与片段化产物进行连接,构建测序文库。该步骤通过片段化处理,将不同的扩增产物变成长短相似的片段化产物,能够有助于后续的统一测序。需要说明的是步骤S121中,所述片段化扩增产物的方法有多种,可以根据需要选择采用现有技术,包括但不限于雾化、超声破碎、机械剪切破碎片段化、酶切片段化、化学以及热诱导片段化。所述片段化处理之后还可包括片段化产物的分离纯化以及末端修饰的步骤。根据测序的片段长度需要,对于片段化得到的核酸片段,进行目的核酸片段的分离纯化,分离方法可以采用常用方法,如凝胶电泳、蔗糖梯度或氯化铯梯度沉降、柱层析分离等。根据所使用的片段化方法,对所得的目的核酸片段进一步的末端修饰,包括但不限于磷酸化或去磷酸化、末端补平和末端加A,以便于后续的接头元件连接。上述目的核酸片段长短不限,优选为25bp 500bp,更优选为30bp 200bp,更优选为40 lOObp。步骤S121所述片段化产物的长度不限,优选在25bp至500bp之间,更优选在30bp 至200bp之间,更优选在40bp至IOObp之间。在实现对目标区域的测序的前提下,随着目标区域测序文库分子中含有的目标区域片段长度的减短,高通量测序技术的对目标区域的测序深度加深;而测序深度越深,即对目标区域的每一个碱基位置的测序次数越多,测序结果越准确,对样品中的少量突变的检测就越灵敏;这样就能够有效防止因为样品中带有突变的目标区域的比例偏低,而导致该突变的测序信号的绝对值偏低,发生测序结果不准确的现象。根据上述接头元件,针对步骤S122,本发明给出不同实施例,下面将通过多个实施例和附图对本步骤进行进一步的说明。在本发明的一个实施例中,直接在片段化产物的两端接上接头形成测序文库。所述接头可采用上述的平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的至少一种。 在本发明的另一个实施例中,直接在片段化产物两端接上分叉接头,形成测序文库。本技术方案可以利用分叉接头的特性,防止多个接头之间自连现象的发生。在本发明的另一个实施例中,如图10所示,步骤S122具体可由以下步骤实现S1221.利用第一接头与片段化产物的两端连接,得第一连接产物;S1222.环化第一连接产物,得环化产物;S1223. II s型限制性内切酶酶切环化产物,得酶切产物;S1224.在酶切产物两端接上第二接头和第三接头,得测序文库。步骤S1221中,所述第一接头可采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的一种,所述第一接头包含有II S型限制性内切酶酶切识别位点;所述的 II s型限制性内切酶为切割位点在识别序列之外的限制性内切酶,包括但不限于Acu I、 Alw I、Bbs I、BbV I、Bcc I、BceA I、BciV I、BfuA I、Bmr I、Bpm I、BpuE I、Bsa I、BseM II、BseR I、Bsg I、BsmA I、BsmB I、BsmF I、BspCN I、BspM I、BspQ I、BtgZ I、Ear I、Eci I、EcoP15I、Fau I,Fok I,Hga I,Hph I、HpyAV、Mbo II,Mly I,Mme I,Mnl I,NmeAIII,Ple I、Sap I、SfaN I 禾口 TspDT I,优选为 Acu I、Bsg I、EcoP15 I 或 Mme I。当所述第一接头为分叉接头时,该II s型限制性内切酶酶切识别位点位于互补区;当所述第一接头为带茎环结构的接头时,限制性内切酶识别位点与茎环结构之间的距离,较II S型限制性内切酶酶切识别位点与茎环结构之间的距离近。若片段化产物经过末端修复酶修复,以及末端加A反应,所述第一接头优选为带T 末端的分叉接头。若片段化产物只是经过末端修复酶修复,将片段化产物的末端补平,则所述第一接头优选双脱氧接头。在步骤S1222中,环化第一连接产物有多种实现方式。在本发明的一实施例中,步骤S1222包括以下步骤S12221.利用酶切引物对第一连接产物进行扩增,得扩增产物;S12222.对扩增产物进行酶切,使得扩增产物形成粘性末端,并自身环化成环化产物。所述酶切引物的3’端分别与第一连接产物的两个末端部分互补,5’端均含有限制性内切酶识别位点。经过步骤S12221的扩增形成的扩增产物,其两个末端均含有限制性内切酶识别位点,然后在相应的酶的作用下,使扩增产物的两端形成粘性末端,且这两个粘性末端互补,能够进行自身环化。在本发明的另一个实施例中,所述第一接头包含有2个酶切识别位点,其中一个为限制性内切酶识别位点,用于使步骤S1222形成的第一连接产物的两端在相应的酶的作用下,形成粘性末端,且它们之间互补,能够进行自身环化。另一个为II s型限制性内切酶酶切识别位点,用于在步骤S1223中,利用识别该酶切位点的酶识别环化产物,进行酶切, 进而得到酶切产物。应当说明,以上两个实施例仅为本发明中的两种实现环化第一连接产物的实施方案,对于本发明的保护范围不做任何具体的限制。在步骤S1223中,利用能够识别第一接头上的酶切识别位点,并切割环化产物 (DNA)但不切割第一接头的酶进行酶切。所述第一接头上的酶切识别位点包括但不限于Mme I酶切识别位点、Acu I酶切识别位点、Bsg I酶切识别位点。在步骤S1224中,所述第二接头可为平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的一种,可带有生物素标记。所述第三接头可为平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的一种。第二接头与第三接头可相同或不同。优选的, 所述第二接头和第三接头相同,均为分叉接头。更优选的,所述分叉接头为T末端分叉接头或双脱氧分叉接头。需要特别说明的是,步骤S1222与S1223之间还可包括步骤S1222A 滚环扩增环化产物,得滚环扩增产物。通过步骤S1222A,能够保证后续的酶切步骤S1223有足够的原材料。又或者,在步骤S1221与S1222之间还可包括步骤S1221A 利用扩增引物对第一连接产物进行扩增,得扩增产物。所述扩增引物分别与第一连接产物两端的接头序列互补。 通过步骤S1221A,能够保证后续的环化步骤有足够的原材料。本方案可避免在步骤S1222之后进行滚环扩增,而用步骤S1222之前的步骤 S1221A进行普通的PCR扩增代替,可有效减少后续酶切步骤中,II s型限制性内切酶的用量。其中,所述第一接头优选为分叉接头。其中,所述分叉接头的互补区可包含至少一个酶切识别位点。所述酶切识别位点可为普通的限制性内切酶识别位点,也可为II S型限制性内切酶酶切识别位点。其中,步骤S1221A所述扩增引物优选为生物素化引物,有利于扩增产物的回收纯化。其中,步骤S1221A所述扩增引物带有至少一个特异性酶切识别位点。若扩增引物上所带的特异性酶切识别位点是尿嘧啶碱基,则步骤S1222中利用尿嘧啶特异性切除试剂进行酶切,然后再进行连接环化;若扩增引物所带特异性酶切识别位点为限制性内切酶识别位点,则步骤S1222中利用相应的限制性内切酶进行酶切,然后再进行连接环化。在本发明的另一个实施例中,如图11所示,步骤S122具体可由以下步骤实现S1221’ .利用第四接头与片段化产物连接,得第二连接产物;S1222’ . II s型限制性内切酶酶切第二连接产物,得带有第四接头的酶切片段;S1223’ .带有第四接头的酶切片段与第五接头连接,形成测序文库。在步骤S1221’中,所述第四接头可采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的一种,所述第四接头包含有II S型限制性内切酶酶切识别位点;当所述第四接头为分叉接头时,该Π s型限制性内切酶酶切识别位点位于互补区;当所述第四接头为带茎环结构的接头时,限制性内切酶识别位点与茎环结构之间的距离,较II s型限制性内切酶酶切识别位点与茎环结构之间的距离近。若片段化产物经过末端修复酶修复,以及末端加A反应,所述第四接头优选为带T 末端的分叉接头。若片段化产物只是经过末端修复酶修复,将片段产物的末端补平,则所述第四接头优选双脱氧接头。在步骤S1222’中,利用能够识别第四接头上的酶切识别位点,并切割环化产物 (DNA)但不切割第四接头的酶进行酶切。所述第四接头上的酶切识别位点包括但不限于Mme I酶切识别位点、Acu I酶切识别位点、Bsg I酶切识别位点。在步骤S1223’中,所述第五接头可为平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的一种,可带有生物素标记。在本发明的另一个实施例中,步骤S122具体包括以下步骤S1221”.直接在片段化产物的两端接上带茎环结构的接头,形成带茎环结构的片段化产物;S1222”.利用限制性内切酶,将带茎环结构的片段化产物的茎环区切开或切除,从而形成测序文库。本技术方案利用带茎环结构的接头,防止了多个接头自连现象的发生。应当说明,以上实施例仅为步骤S122的其中几种具体实施方案,并不用以限制本发明的保护范围。其中,步骤S2所述的单分子扩增是指对测序文库中的每个分子进行单独扩增, 以提升各种分子在后续测序反应中的信号。所述单分子扩增的方法包括但不限于乳液 PCR(Emulsion PCR,EPCR)、桥式 PCR。所述EPCR将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR反应空间。 理想状态下,每个小水滴只含一个DNA模板(测序文库分子)和一个磁珠,磁珠上含有与测序文库分子的共有序列(由接头元件引入)互补的引物,在PCR反应后,磁珠表面就固定有拷贝数目巨大的同来源的DNA模板扩增产物。EPCR具体步骤可参考文献=BEAMing single-molecule PCR on microparticles in water—in—oil emulsions, Frank Diehl, Meng Li, Yiping He, nature methods, Vol. 3, No. 7,July 2006。所述桥式PCR的基本原理是,桥式PCR的引物被固定在固相载体上,PCR过程中 PCR扩增产物会被固定在固相载体上,且PCR扩增产物能够与固相载体上的引物互补配对,成桥状,然后互补配对的引物以与其成桥的扩增产物为模板进行扩增。通过控制初始模板加入的量,桥式PCR反应完成后,扩增产物在固相载体上以一簇簇的形式存在,且每一簇的扩增产物为同来源的DNA模板扩增产物。其具体的原理和实施方案可参考以下文献 CN20061009879. X、US6227604。如前所述,现有技术中,Sanger测序技术由于自身的技术限制,每次只能对一个样品的某一段区域进行测序。为了一次性实现对样品中多个区域的同时检测,本发明在测序方法上采取高通量基因测序方法。高通量基因测序相对Sanger测序法检测序列信息更为方便灵敏,测序文库中的各个分子经过单分子扩增后,每个测序文库分子均形成单分子拷贝阵列,各单分子拷贝阵列在进行高通量基因测序时处于不同的位置,使得测序引物与单分子拷贝阵列之间的杂交,以及在酶作用下的延伸反应可同时进行,相互之间互不干扰。因此,可以同时对大量的(成百万上千万,甚至更多的)单分子拷贝阵列同时进行测序反应, 然后通过采集相应的信号,进而准确的获得所需的序列信息,且测序的灵敏度较Sanger更高。尤其是对多个目标区域的扩增产物进行了片段化处理,相当于对相同序列的目标区域分子的每个碱基的测序次数增加了,能够进一步提高测序的灵敏度。其中,步骤S3所述高通量测序技术包括但不限于基于聚合酶的合成测序法和基于连接酶的连接测序法。
15
合成测序法是基于带可去除标记的核苷酸进行的,在每次合成反应中,每个模板链至多只能延伸一次。一种合成测序法的大致流程如下a.测序引物通过互补配对结合在单分子扩增产物共有的已知序列上(该单分子扩增产物固定在引物-固相载体复合物上),在DNA聚合酶的作用下,以带可去除标记的核苷酸进行单碱基延伸合成反应,收集该次加入核苷酸的标记信号,即可得到与测序引物3’ 最末端碱基互补的单分子扩增产物(固定在引物-固相载体复合物上)的下一位的碱基序列信息。b.切除可去除标记,然后在DNA聚合酶的作用下,以带可去除标记的核苷酸继续进行单碱基延伸合成反应,收集加入核苷酸的标记信号,即可得到与测序引物3’末端碱基互补的单分子扩增产物的下两位的碱基序列信息。重复b步骤,直至不能继续进行合成反应为止,从而获得单分子扩增产物的全部序列信息。连接测序法是基于带有荧光标记的寡核苷酸探针进行的,该寡核苷酸探针带有η 个碱基,分为h(h ^ η)组,同一组寡核苷酸探针的不同荧光标记对应同一特定位置的不同碱基序列,不同组之间的区别在于不同荧光标记对应的特定位置不同,因为该寡核苷酸探针的3’端进行了特定的修饰,寡核苷酸探针之间不能直接相互连接,每次连接反应,每个单分子扩增产物只能连接一个寡核苷酸探针。该连接测序法的的原理和具体实施方案可参考 CN200710170507. 1。此外,GSTMl和GSTTl基因都属于谷胱甘肽转移酶家族,在体内起分解代谢有毒有害物质的作用。GSTMl或GSTTl基因缺失的个体较易受吸烟的影响,发生肺癌的危险性增加。因此,为了肺癌易感基因序列信息的进一步准确与全面,本发明给出另一种更为准确和全面的检测肺癌易感基因的方法流程,如图12所示,该方法在图1所示方法的基础上增加了检测GSTMl或GSTTl基因缺失的步骤,具体包含以下步骤Si,.利用肺癌易感基因特异性引物,对待测样品中的多个目标区域进行扩增,并基于扩增产物构建测序文库;S2’.对测序文库进行单分子扩增,得到与所述多个目标区域对应的多个单分子扩增产物;S3’.同时对所述多个单分子扩增产物进行高通量基因测序,得到所述多个目标区域的序列信息,S4’.利用GSTMl及GSTTl的扩增引物对待测样品的核酸进行PCR扩增,凝胶电泳检测GSTMl和GSTTl基因的缺失情况。步骤S4,与步骤S3,、S2,、Si,无先后关系。本技术方案通过检测待测肺癌易感基因,确认已知和未知突变位点,进行基因分型,同时还进行GSTMl和GSTTl基因的缺失情况检测,能够得到更加准确而全面的易感基因序列信息。需要说明的是,在本技术方案中,步骤Si’至S3’可参见之前实施例中的步骤Sl 到S3,在此不作赘述。优选的,步骤S4中所述GSTMl的扩增引物包括SEQ ID Ν0:69和SEQ IDNO 70、SEQ ID NO 71和SEQ ID NO 72中的至少一对;所述GSTTl的扩增引物为SEQ ID NO 73和SEQID NO :74。更进一步的,步骤S4还包括对内参基因目标区域的扩增,所述内参基因的特异性引物为 SEQ ID NO 75 和 SEQ ID NO :76。本发明提出的一个实施例中,同时检测肺癌易感基因中的C0X-2、CYPlAU ERCC2、 GSTP1、TP53、XRCCl以及GSTMl、GSTTl等待测肺癌易感基因。针对C0X-2、CYPlAU ERCC2、GSTPU TP53、XRCCl的热点突变区域设计相应的特异性引物C1F(SEQ ID NO :11)禾口 ClR(SEQ ID NO 12)、C2F(SEQ ID NO :13)禾口 C2R(SEQ ID NO :14)、ElF (SEQ ID NO :21) ^P ElR (SEQ ID NO :22)、GIF (SEQ ID NO :29) ^P GlR (SEQ ID NO :30)、TlF(SEQ ID NO :55) ^P TlR(SEQ ID NO :56)、XlF(SEQ ID NO :63) ^P XlR(SEQ ID NO :64);同时设计检测GSTM1、GSTTl基因缺失的特异性引物G2F(SEQ ID NO :69)禾口 G2R(SEQ ID NO :70)、G3F(SEQ ID NO :73)和 G3R(SEQID NO :74),以及内参基因的特异性引物 M1F(SEQ ID NO :75)和 M1R(SEQID NO :76)。一、待测样品中DNA的提取利用市场上常见的核酸提取试剂盒分别提取全血样品(1至10)、血清样品(11至 20)、石蜡组织样品(21至30)的DNA,并分别做上相应的标记。二、待测肺癌易感基因多个目标区域的扩增利用上述待测易感基因的特异性引物,对肺癌易感基因的目标区域进行扩增,得到扩增产物。上述待测易感基因的目标区域扩增分别进行,反应体系如下
0187]上游引物(10μ Μ)2μ L ;
0188]下游引物(10μ Μ)2μ L ;
0189]dNTP(各 2.5mM)4μ L ;
0190]待测样品DNA20ng ;
0191]Ex Taq(5U/yL)0. 25 μ L ;
0192]IOXEx Taq Buffer5μ L ;
0193]ddH20 力口至 50μ L。
0194]PCR反应条件如下
0195]95 °C 3min ;94°C 30s, 58°C 30s,72°C 30s ;重复 25 个循环;72 °C 7min。利用PCR回收试剂盒,分别对各样品的扩增产物进行分离,除去未扩增的引物和 dNTP,回收扩增产物。三、利用扩增产物构建测序文库根据之前所述,本步骤可由多种方式实现。在本发明的一个实施例中,采用在片段化产物两端直接连上接头元件的方法构建测序文库,具体包括1.扩增产物的片段化本实施例中采用超声破碎法进行片段化处理,具体操作为测定回收后的扩增产物浓度,按等摩尔数将相同样品的不同肺癌易感基因目标区域扩增产物进行混合,得混合液,并标记加以区别。将每个样品的混合液50 μ L加入至400 μ L的TE buffer中,430W功率条件下超声4s,间隔10s,反复5次,得到片段混合物。利用1 %琼脂糖凝胶进行分离纯化,选择40-100bp 大小的片段切胶回收,得到片段化产物。2.利用片段化产物与接头元件构建测序文库为便于进行接头元件的连接,对片段化产物进行末端修饰。本实施例中,分别进行磷酸化、末端补平及加A尾反应,具体操作如下1)磷酸化以及末端补平反应体系为片段化产物约2000ng ;IOmMdNTP1. 5μ L ;
T4DNA 聚合酶(5U/ μ L) 1 μ L ;Klenow DNA 聚合酶0. 1 μ L ;Τ4 多核苷酸激酶(10U/yL)0. 5uL;IOm MATP1. 5μ L ;T4DNA 连接缓冲液IOyL;力口 ddH20 至 100 μ L。20°C孵育20min,反应结束后利用回收试剂盒进行纯化回收。2)末端加A尾反应体系为磷酸化以及末端补平后的回收产物Klenow 缓冲液(NEB Buffer2)IOmM dATPKlenow 酶(3,to 5,exo minus, IOU力口 ddH20 至 100μ L。37°C孵育30min,反应结束后利用纯化试剂盒纯化回收。3)连接接头1本实施例中采用如图6所示T末端分叉接头作为接头1,同一样品使用相同T末端分叉接头,不同样品对应不同T末端分叉接头,根据其上所带第一标签序列进行区分,不同样品对应的标签序列如下表1所示。表1.第一标签序列数据表
约 IOOOng ;
权利要求
1.一种检测肺癌易感基因的方法,其特征在于,所述方法包括以下步骤A.利用肺癌易感基因特异性引物,对待测样品中的多个目标区域进行扩增,并基于扩增产物构建测序文库;B.对测序文库进行单分子扩增,得到与所述多个目标区域对应的多个单分子扩增产物;C.同时对所述多个单分子扩增产物进行高通量基因测序,得到所述多个目标区域的序列信息。
2.根据权利要求1所述的检测肺癌易感基因的方法,其特征在于,所述步骤A包括 Al.利用肺癌易感基因特异性引物,对待测样品中的多个目标区域进行扩增,得到与所述多个目标区域对应的扩增产物;A2.利用接头元件,与所述多个目标区域对应的扩增产物进行连接,得到测序文库;所述接头元件采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的至少一种。
3.根据权利要求2所述的检测肺癌易感基因的方法,其特征在于,所述步骤A2包括以下步骤A21.对与所述多个目标区域对应的扩增产物进行片段化,得到片段化产物; A22.利用接头元件,与所述片段化产物进行连接,构建测序文库。
4.根据权利要求3所述的检测肺癌易感基因的方法,其特征在于,所述步骤A22包括以下步骤A221.利用第一接头与片段化产物的两端连接,得第一连接产物; A222.环化第一连接产物,得环化产物; A223. II s型限制性内切酶酶切环化产物,得酶切产物; A224.在酶切产物两端接上第二接头和第三接头,得测序文库。
5.根据权利要求3所述的检测肺癌易感基因的方法,其特征在于,所述步骤A22包括以下步骤Α22Γ .利用第四接头与片段化产物连接,得第二连接产物;A222’ . II s型限制性内切酶酶切第二连接产物,得带有第四接头的酶切片段;A223’ .带有第四接头的酶切片段与第五接头连接,形成测序文库。
6.根据权利要求2至5任一项所述的检测肺癌易感基因的方法,其特征在于,步骤A2 所述接头元件中的至少一个接头包含有第一标签序列,用于在文库构建过程中,对不同待测样品的测序文库做上相应的标记。
7.根据权利要求1至5任一项所述的检测肺癌易感基因的方法,其特征在于,步骤A与每个目标区域对应的特异性引物中,至少有一条引物与目标区域部分互补,且该引物的5’ 端带有第二标签序列,用于在扩增目标区域过程中,对不同待测样品的目标区域扩增产物做上相应的标记。
8.根据权利要求1至5任一项所述的检测肺癌易感基因的方法,其特征在于,所述肺癌易感基因包括 APE1、CASP7、CASP8、CASP9、CHEK2、C0X-2、CYP1A1、CYP2E1、ERCC1、ERCC2、 ERCC6、Exo1、GSTP1、Hmlh1、IL-1 β、MDM2、MPO、MTHFR、NQO1、OGG1、Ρ73、RASSF1、TERT、TGFB1、 TP53、TP63、XPC 和 XRCCl 中的至少一个。
9.根据权利要求1所述的检测肺癌易感基因的方法,其特征在于,所述方法还包括步骤D.利用GSTMl及GSTTl的扩增引物对待测样品的核酸进行PCR扩增,凝胶电泳检测 GSTMl和GSTTl基因的缺失情况;步骤D与步骤A、B、C无先后关系。
10.一种肺癌易感基因检测试剂盒,其特征在于,所述试剂盒包括肺癌易感基因特异性引物,用于对待测样品中的多个目标区域进行扩增;接头元件,用于与扩增产物结合构建测序文库。
11.根据权利要求10所述的肺癌易感基因检测试剂盒,其特征在于,所述接头元件采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的至少一种。
12.根据权利要求10所述的肺癌易感基因检测试剂盒,其特征在于,所述接头元件中的至少一个接头包含有第一标签序列,用于在文库构建过程中,对不同待测样品的测序文库做上相应的标记。
13.根据权利要求10所述的肺癌易感基因检测试剂盒,其特征在于,所述待测肺癌易感基因有多个,与每个目标区域对应的特异性引物中,至少有一条引物与目标区域部分互补,且该引物的5’端带有第二标签序列,用于在扩增目标区域过程中,对不同待测样品的目标区域扩增产物做上相应的标记。
14.根据权利要求10至13中任一项所述的肺癌易感基因检测试剂盒,其特征在于, 所述肺癌易感基因包括 APE1、CASP7、CASP8、CASP9、CHEK2、C0X-2、CYPlAl、CYP2E1、ERCCl、 ERCC2、ERCC6,ExoUGSTPUHmlhU IL-I β ,MDM2、MPO、MTHFR、NQO1、OGG1、Ρ73、RASSF1、TERT、 TGFBl、ΤΡ53、ΤΡ63、XPC 和 XRCCl 中的至少一个。
15.根据权利要求14所述的肺癌易感基因检测试剂盒,其特征在于,所述肺癌易感基因还包括GSTMl、GSTTl中的至少一个。
全文摘要
本发明涉及基因工程领域,提供一种检测肺癌易感基因的方法及相应的试剂盒。所述检测肺癌易感基因的方法包括以下步骤A.利用肺癌易感基因特异性引物,对待测样品中的多个目标区域进行扩增,并基于扩增产物构建测序文库;B.对测序文库进行单分子扩增,得到与所述多个目标区域对应的多个单分子扩增产物;C.同时对所述多个单分子扩增产物进行高通量基因测序,得到所述多个目标区域的序列信息。该方法及其相应的试剂盒利用高通量测序技术对肺癌易感基因的多个区域同时进行区域测序,能准确得出这些区域的序列信息,包括已知突变和未知突变位点的变异情况,检测灵敏度高,并能进一步同时对大量样品进行检测。
文档编号C12Q1/68GK102373287SQ20111039196
公开日2012年3月14日 申请日期2011年11月30日 优先权日2011年11月30日
发明者盛司潼 申请人:盛司潼
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1