专利名称:一种反向杂交偶联延伸dna测序方法
技术领域:
本发明涉及一种DNA测序方法,尤其是特别涉及一种DNA的杂交测序方法。
技术背景随着基因组研究的深入,从基因水平上认识生命的差异,疾病发生、发展的规律,以 及药物与生命体的相互作用将成为可能。虽然导致疾病发生的因素众多,但基因突变(单 核苷酸多态性、甲基化等)被广泛认为是一个重要的内在因素。在基础研究方面,基因突 变位点有助于基因组的精确定位,研究疾病基因的遗传规律,克隆致病基因;在应用方面, 直接寻找疾病的易感基因突变位点具有重要的价值。大多数复杂疾病,如癌症、糖尿病、 心血管疾病、抑郁症、哮喘等,受众多基因以及环境因子共同作用,通过对于大量某一特 定疾病的基因组样本中突变基因型进行大规模鉴定和检测,可以获得与该疾病相关基因型 的信息。更为重要的是,通过筛查药物敏感的基因突变位点,为今后实现个体化用药提供 依据。通过发现疾病易感性的基因突变位点,可以使人们及早地预防疾病,达到避免疾病 的发生的目的。因此,人类基因组草图刚刚绘制完成后,寻找人类基因组中基因突变位点立即成为人 类基因组计划的主要任务之一。目前有许多关于突变和单核苷酸多态性检测的方法,如DNA 测序、限制性酶切长度多态性、单链构象多态性、焦磷酸测序和等位基因特异的寡聚核苷 酸杂交等。这些技术虽在某种程度上能完成对突变或核苷酸多态性的检测,但均不能同时 对目标片段进行全方位的序列确定。能够全方位进行序列检测的方法,即全基因组序列测 定方法。然而全基因组序列测定费用太高,对第一个人类基因组序列测定的费用大约为10 亿美元,目前这一费用已经降低到大约2千万美元。因此,功能基因组的研究进展仍然受 限于DNA测序技术,大幅度降低DNA测序的成本将会大大推动生命科学和医学的研究,甚 至会带来革命性的变化。除了对现有的基于电泳的DNA测序技术进行改进外,当前正在发展的新型测序技术主 要集中在非电泳的手段上。从总体上来看,这类技术可以分成四大类第一类是合成测序, 在碱基加入到延伸的DNA链的过程中进行检测;第二类是杂交测序法,通过制备一组高密 度寡核苷酸微阵列芯片的杂交信号,进行目标基因的序列鉴定;第三类为分子影像技术, 一系列可以在单分子的水平上进行测序的技术;最后一类技术是诱导DNA分子蜿蜒通过非
常细微的小孔,在这个过程当中借助于电子学或者光学的方法对碱基进行读出,也称作纳 米孔测序。传统的杂交测序方法,是把一系列长度为K个碱基共4k条序列固定在芯片上,然后把 标记的待测DNA模板去杂交,通过检测杂交信号来确定该序列的杂交序列谱。如果要测定 长DNA序列,那么需要合成的探针需要量很大,成本倍数增加。更重要的是该方法有假阳 性高的缺点。发明内容技术问题本发明的目的是提供一种反向杂交偶联延伸DNA测序方法,能克服传统的 杂交测序方法假阳性高的缺陷,并解决现有方法探针合成量大、成本高昂的问题,实现高 通量,低成本,高灵敏度和快速测定短片段DNA序列。技术方案本发明采用一种反向杂交偶联延伸DNA测序方法,确定未知DNA模板的碱 基信息是通过DNA模板与多条探针平行杂交并延伸标记的碱基,通过检测是否有标记物延 伸,根据碱基互补原理确定未知DNA模板是否有对应的四个(或以上)连续碱基的信息。即 通过对DNA模板重复"杂交-延伸-检测"步骤来实现,即在传统杂交测序法中加入延伸一 步,能够解决假阳性及成本高的问题。本发明采用如下技术方案一种反向杂交偶联延伸DNA测序方法,其特征在于DNA序列确定是通过3'末端为已知 碱基的杂交引物平行地与待测DNA序列经过多次杂交、延伸、检测来实现,包括如下步骤步骤1) 3,末端为三个或三个以上己知碱基的杂交引物与固定的未知DNA模板在杂交液 中加热,然后冷却退火进行杂交;步骤2)用洗液洗净杂交液后,标记单体在聚合酶的催化下,在杂交引物的3'末端延伸 一个或多个碱基;通过芯片扫描仪读取延伸碱基的信息,确定未知DNA模板上的包含数个 碱基的序列;步骤3)用变性液将延伸碱基的杂交引物从未知DNA模板中洗脱,再将3'末端已知碱基 序列不同的杂交引物按步骤l)与未知DNA模板杂交并进行步骤2),确定未知DNA模板上 的包含数个碱基的不同序列;用不同的杂交引物重复上述过程,直到完成DNA序列测定。所述的杂交引物是指能和且只能和所有DNA模板中的一段通用特定序列杂交的寡核酸 片段。在DNA模板制备过程中,通过连接或者在扩增过程中引入与特定的杂交引物互补的 一段通用序列,其中引入的该段通用序列应与模板中任何一段序列片段有区别,即模板中
只有该段通用序列能够与该特定的杂交引物实现杂交。本发明中的杂交引物,其3'末端的3个或3个以上碱基为已知碱基,优选3个至5个 碱基为已知碱基,最优选3'末端为3个已知碱基;5'端带有7个或7个以上碱基,优选7 至13个。在最优选的情况下,即3'末端为三个已知碱基,杂交引物序列特征可以5, (N)nXYZ 3'表示,其中为N为四种碱基T, A, G, C中不限定的任意一种,或者可用通用碱基I来代 替,n为7 13的整数;X, Y, Z均是选自T, A, G, C中的确定的一种碱基。如此,序列 XYZ有43=64种不同组合,即本发明所述的方法,最少可以在合成64种不同杂交引物的条 件下实现;且杂交引物的长度可以只包含10 16个碱基。所述的未知DNA模板,是指通过常规的PCR,滚环扩增、固相扩增以及桥式扩增等增加 基因组中感兴趣的目的序列量的方法扩增后的待测DNA序列或其序列片断。扩增可以是单 重的,即一次扩增一个目的片断,也可以是多重的,即一次扩增多个目的片断。未知DNA 模板通过化学或者物理方法可以固定在平面基片上,也可以固定在"96、 384孔板"或者各 种修饰的珠子等载体上,还可以同时固定多个DNA模板,也包括固定单个DNA模板。步骤l)为杂交步骤,可按现有技术的方法,把杂交引物溶解于在高温条件下(60T左 右)短时间加热,然后低温(4°C左右)退火完成杂交过程。歩骤2)为延伸步骤,当杂交引物与固定的未知DNA模板杂交后,通过在杂交引物上延 伸一个或多个标记单体(共A,G,C,T四种),并通过芯片扫描仪检测延伸的碱基,可以确定 不同位置的待测点上未知DNA模板在该次延伸中的碱基信息。此时未知的DNA模板中某一 待测点(固定在基片上的单克隆模板DNA)上一小段DNA序列中包含数个碱基的序列已经确 定,即与标记单体所含的一个或多个碱基与杂交引物3'末端的3个或3个以上己知碱基组 成的序列形成碱基互补的DNA序列。标记单体的延伸采用已知的通用方法,即在缓冲液中,加入四种不同的标记单体,如 dATP(ddATP)、 dCTP(ddCTP)、 dGTP(ddGTP)和dUTP(ddUTP),在聚合酶的作用下,在4 10°C 条件下延伸5 15分钟,使杂交引物的3'末端延伸带标记的碱基。所述的标记单体,是指碱基单体(A,G,C,T)上包含可以直接或者间接检测的基团或者 粒子,而且3'为双脱氧或被可切割基团所封闭。可检测的基团或者粒子,即标记物,如修 饰荧光基团,生物素和量子点,或者不修饰的单体在反应中产生的光信号。所述的标记单 体可以是单色的,即四种单体均标记相同的标记物,也可以是多色的,即四种单体标记不 相同或者不完全相同的标记物。如标记单体可以是四种不同荧光标记的dATP(ddATP)、 dCTP(ddCTP)、 dGTP(ddGTP)和dUTP(ddUTP)。 所述的标记单体的延伸是标记的四种单体(A,G,C,T)的延伸。如果标记单体是单色的, 则对于任一杂交引物,相同标记的不同的四种单体(A,G,C,T)应分别延伸并读取碱基延伸 信息,不同的单体读取后应将其标记物去除后,再延伸另一种标记单体,其目的是芯片扫 描仪能读出不同碱基的信息。容易理解,如果四种单体标记不相同,则四种单体可以同时 延伸并读取延伸碱基的信息。单体的延伸可以一步延伸即延伸一个碱基,或多步延伸即延伸多个碱基。在多个碱基延伸中,每次延伸一个碱基,通过检测确定哪些未知DNA模板上的待测点发生了该次碱基 的延伸信息;然后采用标记物去除方法,如将荧光切除的方法,再进行下一个碱基的延伸, 或者釆用标记物叠加,如荧光叠加的方式确定那些未知DNA模板上的待测点发生了碱基的 多次延伸。完成某一待测点上DNA序列中的数个碱基序列的测定后,可以将延伸碱基的杂交引物 从未知DNA模板中用变性液洗脱。所述的变性液中含有尿素、NaOH、乙二醇、丙三醇和甲 酰胺等能降低DNA变性温度的组分。延伸标记单体的杂交引物从DNA模板中分离后,可重复步骤l)至步骤2)的方法,将 3'末端已知碱基序列不同的另一杂交引物与未知DNA模板杂交,延伸单体,并读出待测点上 未知DNA序列的碱基序列信息。以不同的杂交引物,循环上述"杂交-延伸-检测"过程, 直到测出未知DNA模板的序列谱,或4"种(K为杂交引物末端已知碱基的数目)杂交引物 都经过上述步骤,完成DNA序列测定。有益效果本发明与现有技术相比,具有如下优点1. 本发明的最大优点是正确性可靠。在传统的杂交测序方法中,如果末端有一个或多 个碱基错配,也有可能读出信号,但是读出的信号是错误的。而本发明的方法,只读3'末 端的最后几个碱基,而且加上延伸一步(聚合酶对3'末端错配碱基非常敏感)大大增加了 正确性。2. 本发明的测序方法成本低,最少只需要合成64条杂交引物(每条长度10-15个碱 基左右)、普通的聚合酶、荧光标记的dNTP及芯片扫描仪,就可以进行大规模DNA序列测 定。3. 本发明可实现高通量DNA测序。通过polony或乳液PCR等方法制得的高密度DNA 芯片,利用反向杂交偶联延伸DNA测序方法,很容易读出这些芯片上的序列。本发明所提出的方法,由于加入延伸一步,可解决假阳性及成本高的问题。而且应用 在芯片上进行杂交延伸测序,可达到高通量水平。此外本发明不需通过破坏或者切割标记
物的方法清除杂交引物,可建立快速、准确、便宜的基因组序列测定方法。 以下将结合具体实施方式
对本发明作进一步详细描述。
图1是本发明反向杂交偶联延伸DNA测序方法的示意图其中1为未知DNA模板;2为杂交引物;3为荧光基团;4为基片;i、 j、 k、 1、 m分别为芯片上的待测点。图2为DNA序列拼接示意图其中4为基片;1为固定在基片上的未知DNA模板,2为杂交引物;3为延伸的带标记的碱基;e为经过拼接得到的序列。
具体实施方式
实施例一将某一待测DNA序列通过常规的PCR扩增,并固定在丙烯酰胺基片上,制成未知DNA 模板。制备64条杂交引物,3'末端为三个已知碱基,5'端带有8个碱基,杂交引物序列特 征可以5' NNNNNNNNXYZ 3'表示,其中为N为四种碱基T, A, G, C中不限定的任意一种, 或者可用通用碱基I来代替,X, Y, Z均是选自T, A,G,C中的确定的一种碱基,如NNNN丽NNACG、 NN丽丽NNGAG等,杂交引物中XYZ组成64种不同序列。1) 杂交将杂交引物刚NNNNNNACG与固定的未知DNA模板杂交。把杂交引物以100uM 浓度溶解于1倍的杂交液中,取适量(把待测模板完全浸没)所配的杂交引物置于待测模 板中,60°C变性2分钟,然后4°C复性3分钟,用1倍4°C储藏的聚合酶缓冲液(10 mM Tris-HC1(pH 7.5) , 5 mM MgC12 , 7. 5 mM DTT)冲洗30秒,完成杂交过程。2) 延伸在lXEcoPol缓冲液(lOmMTris-HCl (pH7.5) , 5 mM MgC12 , 7. 5mMDTT) 中,加入不同荧光标记的四种标记单体dATP (ddATP) 、 dCTP (ddCTP) 、 dGTP (ddGTP)和 dUTP(ddUTP),在聚合酶(Klenow片段(3'—>5'exo-))的作用下,在4°C条件下发生延伸 反应10分钟,使杂交引物的3'末端延伸一个标记的碱基。3) 检测通过芯片扫描仪读取延伸碱基的信息,确定未知DNA序列某一待测点上包含 4个碱基的序列信息。即可以知道该序列是否含有与杂交引物上已知的三个碱基GCA及延伸 的一个碱基形成碱基互补的、共四个碱基的序列。
如图1,未知DNA模板1固定到固相载体丙烯酰胺基片4上,杂交引物NNNNNNNNACG 2 与DNA模板1杂交反应,加入标记单体后杂交引物2发生标记单体延伸反应,通过检测可 以知道本次延伸中,不同位置的待测点i、 j、 k、 l和m中,i、 j、 l和m处未知DNA模板分 别含有与序列ACGT、 ACGC、 ACGG和ACGA碱基互补的包含4个碱基的序列。4)杂交引物NNNNNNNNACG检测完后,再把其余的杂交引物依次重复1) 3)步,最多 检测其余的63条杂交引物,直至得到每一个待测点上的序列谱,通过对这些序列谱进行数 据整理、拼接,就可以读出这些序列。DNA序列拼接如图2所示,基片4上固定有DNA模板1,杂交引物2杂交后延伸带标 记的一个碱基3,图中一段序列共有19条杂交引物,经过拼接可得到序列e,则待测DNA 序列中有一与序列e碱基互补的DNA序列。实施例二反向杂交偶联延伸DNA测序方法对单个人类全基因组测序 DNA模板可按下述步骤制备1. 提取人类基因组。2. DNA片段化。用超声波处理,使DNA的平均大小在50bp左右。3. 加接头引物a。先把片段化后的基因组DNA用聚合酶补平,并使其3末端带一 个突出的A处理。然后在连接酶的作用下,把带有Mme I内切酶识别位点的接头引物连接 到小片段的DNA上。4. 酶切处理。在Mme I内切酶的作用下,把全基因组切成待测片段大小了 1%P的 基因组文库。5. 同步骤3,把另一端也加上接头引物b。6. 微乳液PCR扩增出单克隆的基因组文库。7. 全基因组芯片制作。把上一步的扩增产物,固定在丙烯酰胺基片上。 将所制备的固定的DNA模板利用本发明的方法进行杂交-延伸测序,测序方法同实施例一。将杂交序列组装、拼接后,得到全基因组信息。实施例三反向杂交偶联延伸DNA测序方法进行RNA表达谱分析
DNA模板可按下述步骤制备1. 分别提取正常细胞及病变细胞mRNA,用磁珠固定有30个T的核苷酸链纯化mRNA 使磁珠吸有mRNA。2. 反转录为cDNA,并用RNaseH、 DNA聚合酶等作用下合成第二链。3. 用识别四个碱基的内切酶(Sau 3AI)消化步骤2的产物。用binding buffer 洗干净磁珠。4. 在连接酶的作用下加上接头引物A (引物上带有内切酶Acu I识别位点)。5. 用Acu I消化步骤4的产物。得到接头引物A后面跟着要测的16个未知序列的 c賺文库。6. 加上另一接头引物B。然后用乳液PCR进行扩增。7. 扩增产物固定在芯片上。将所制备的固定的DNA模板利用本发明的方法进行杂交-延伸测序,测序方法同 实施例一。数据分析后拼接得到所要测定的DNA测序。实施例四反向杂交偶联延伸DNA测序方法检测包含人基因组中 SNP位点编号为rs 11053646 —段DNA片断设计一对PCR弓l物,其中一条引物修饰了丙烯酰胺基团。用PCR引物扩增人样本(如 血、唾液等)中包含SNP位点编号为rs 11053646 —段DNA序列片断。用聚合方法将PCR 产物固定在玻璃片上,采用变性、电泳方法将未固定的另一条PCR链和其他杂质清除,得 到一条纯净的DNA链。采用实施例一所描述的方法,把杂交引物跟上述芯片进行杂交,在延伸反应条件下, 插入带有荧光标记的A、 G、 C、 T,数据读取后,冲洗已经杂交上的引物,并对其他的杂交 引物重复进行杂交、延伸和检测,直到所有杂交引物完成杂交-延伸过程,对不同样品所对 应的序列进行序列谱分析,就可知编号为rs 11053646的SNP位点的碱基情况。
权利要求
1、一种反向杂交偶联延伸DNA测序方法,其特征在于DNA序列确定是通过3’末端为已知碱基的杂交引物平行地与待测DNA序列经过多次杂交、延伸、检测来实现,包括如下步骤步骤1)3’末端为三个或三个以上已知碱基的杂交引物与固定的未知DNA模板在杂交液中加热,然后冷却退火进行杂交;步骤2)用洗液洗净杂交液后,标记单体在聚合酶的催化下,在杂交引物的3’末端延伸一个或多个碱基;通过芯片扫描仪读取延伸碱基的信息,确定未知DNA模板上的包含数个碱基的序列;步骤3)用变性液将延伸碱基的杂交引物从未知DNA模板中洗脱,再将3’末端已知碱基序列不同的杂交引物按步骤1)与未知DNA模板杂交并进行步骤2),确定未知DNA模板上的包含数个碱基的不同序列;用不同的杂交引物重复上述过程,直到完成DNA序列测定。
2、 根据权利要求I所述的DNA测序方法,其特征在于所述的杂交引物5'端带有7个或7个 以上碱基。
3、 根据权利要求2所述的DNA测序方法,其特征在于所述的杂交引物3'末端为3个已知碱 基,5'端带有7 13个碱基,杂交引物序列特征为5' (N)nXYZ3',其中为N为四种碱基T, A, G, C中不限定的任意一种,或者是通用碱基I, X, Y, Z为选自T, A, G, C中的任一确 定的碱基,n为7 13的整数。
4、 根据权利要求1所述的DNA测序方法,其特征在于所述的未知DNA模板,是通过常规的 PCR、滚环扩增、固相扩增或桥式扩增方法,增加基因组中目的序列量后的待测DNA序列或 序列片断。
5、 根据权利要求1所述的DNA测序方法,其特征在于步骤l)中,所述的未知DNA模板通 过化学或者物理方法固定在平面基片上,或"96、 384孔板"上,或者各种修饰的珠子载 体上;固定单个DNA模板,或者固定多个DNA模板。
6、 根据权利要求1所述的DNA测序方法,其特征在于所述的标记单体,是指碱基单体(A, G, C 或T)上包含可以直接或者间接检测的基团或者粒子,而且3'为双脱氧或被可切割基团所封 闭。
7、 根据权利要求6所述的DNA测序方法,其特征在于所述的可检测的基团或者粒子,为修 饰荧光基团、生物素或量子点,或者不修饰的单体在反应中产生的光信号。
8、 根据权利要求6所述的DNA测序方法,其特征在于所述的标记单体是四种不同荧光标记 的dATP(ddATP)、 dCTP(ddCTP)、 dGTP(ddGTP)和dUTP(ddUTP)。
9、 根据权利要求1所述的DNA测序方法,其特征在于所述的变性液中含有能降低DNA变性温度的尿素、NaOH、乙二醇、丙三醇或甲酰胺组分。
10、根据权利要求1所述的DNA测序方法,其特征在于根据杂交引物已知碱基和所延伸的 碱基,通过碱基互补原理确定未知DNA模板的DNA序列。
全文摘要
本发明公开了一种反向杂交偶联延伸DNA测序方法,将未知DNA模板与多条3’末端为3个或3个以上已知碱基的探针平行杂交并延伸标记的碱基,通过检测是否有标记物延伸,根据碱基互补原理确定未知DNA模板是否有对应的四个(或以上)连续碱基的信息,拼接出待测DNA序列信息;包括重复进行的杂交、延伸和检测步骤。本发明方法在传统杂交测序法中加入延伸一步,能够解决假阳性及成本高的问题,实现高通量,低成本,高灵敏度和快速测定短片段DNA序列。
文档编号C12Q1/68GK101130823SQ20071013153
公开日2008年2月27日 申请日期2007年9月4日 优先权日2007年9月4日
发明者李燕强, 潘志强, 肖鹏峰, 陆祖宏 申请人:东南大学