扩增dna的方法
【技术领域】
[0001]本发明涉及扩增DNA的方法,特别是在扩增单细胞全基因组的方法。
【背景技术】
[0002] 单细胞全基因组测序技术是在单细胞水平对全基因组进行扩增与测序的一项新 技术。其原理是将分离的单个细胞的微量全基因组DNA进行扩增,获得高覆盖率的完整基因 组后进行高通量测序。该技术的建立需要两个必备条件:1.高质量的全基因组扩增技术;2. 高通量低成本的测序技术。
[0003] 目前主要的全基因组扩增技术主要有四类:扩增前引物延伸聚合酶链式反 (Primer Extension Preamplification-Polymerase Chain Reaction,简称为PEP-PCR,具 体方法参见Zhang L,Cui X,Schmitt K,Hubert R,Navidi W,Arnheim N.1992.Whole genome amplification from a single cell : implications for genetic analysis.Proc Natl Acad Sci U S A.89(13):5847_51·)、退变寡核昔酸引物聚合酶链式 反应(Degenerate Oligonucleotide-Primed Polymerase Chain Reaction,简称为D0P-PCR,具体方法参见 Telenius H, Carter NP,Bebb CE,Nordenskjo M, Ponder BA, Tunnac1i f f e A.1992.Degenerate oligonucleotide-primed PCR: general amplification of target DNA by a single degenerate primer.Genomics13:718-25)n 多重置换扩增(Multiple Displacement Amplification,简称为MDA,具体方法参见Dean FB,Nelson JR,Giesler TL,LaskenRS.2001.Rapid amplification of plasmid and phageDNA using phi29 DNA polymerase and multiply-primed rolling circle amplification .Genome Res · 11:1095-99)和多次退火环状循环扩(Multiple Annealing and Looping Based Amplification Cycles,简称为MALBAC,具体方法参见PCT专利申请 TO2012166425)。但是现有的主流扩增方法中的一些虽然操作简单但最终的扩增效果不甚 理想,而另一些扩增效果好但操作过程较为繁琐。以MALBAC为例,其主要由如下缺陷:1. 一 般需经过细胞裂解、终止裂解(升温/添加中和试剂)、预扩增、扩增等若干个步骤才可得到 扩增产物,整个过程涉及多次试剂配制,开盖加液操作,增加了引入环境污染的风险;2.整 个实验过程需4小时以上,人员及仪器效率较低,无法对临床上急需验证的样本在短时间内 给出令人满意的结果;3.整个实验过程对操作人员的熟练程度要求较高,初次接触者无法 很快的获得满意的扩增结果。
[0004] 因此,目前急需一种能够克服主流扩增方法的一个、多个或全部缺陷的改进的扩 增方法。
【发明内容】
[0005] 本发明提供了一种扩增细胞基因组DNA的方法和一种用于扩增基因组DNA的试剂 盒。
[0006] 在本申请的一个方面中,提供了一种扩增细胞基因组DNA的方法,所述方法包括: (a) 提供反应混合物,其中所述反应混合物包括所述基因组DNA、第一类引物、第二类引物、 核苷酸单体混合物、和核酸聚合酶,其中所述第一类引物从5'端到3'端包含通用序列和可 变序列,其中所述通用序列由G、A、C和T四种碱基中的三种或者两种组成,条件是所述通用 序列不同时包括G和C,,并且所述第二类引物包含所述通用序列且不包含所述可变序列; (b) 将所述反应混合物置于第一温度循环程序,使得所述第一类引物的可变序列能够与所 述基因组DNA配对并扩增所述基因组DNA以得到基因组扩增产物,其中所述基因组扩增产物 的5'端包含所述通用序列,3'端包含所述通用序列的互补序列;(c)将步骤(b)得到的反应 混合物置于第二温度循环程序,使得所述第二类引物的所述通用序列能够与所述基因组扩 增产物的3'端配对并扩增所述基因组扩增产物以得到扩大的基因组扩增产物,其中,在所 述步骤(b)和所述步骤(c)之前提供所述反应混合物。
[0007] 在一些实施方式中,所述的方法进一步包括分析所述扩增产物以识别与疾病或表 型相关的序列特征。在一些实施方式中,所述与疾病或表型相关的序列特征包括染色体水 平异常、染色体的异位、非整倍体、部分或全部染色体的缺失或重复、胎儿HLA单倍型和父源 突变。在一些实施方式中所述疾病或表型选自下组:β-地中海贫血、唐氏综合征、囊性纤维 化、镰状细胞病、泰-萨克斯病、脆性X综合征、脊髓性肌萎缩症、血红蛋白病、地中海贫血、 X连锁疾病(由在X染色体上基因主导的疾病)、脊柱裂、无脑畸形、先天性心脏病、肥胖、糖尿 病、癌症、胎儿性别和胎儿RHD。
[0008] 在一些实施方式中,所述基因组DNA包含在细胞中,并且所述反应混合物进一步包 含能够裂解所述细胞的表面活性剂和/或裂解酶。
[0009] 在一些实施方式中,在所述步骤(b)和步骤(c)之前还包括将所述反应混合物置于 裂解温度循环程序,使得所述细胞裂解并释放出所述基因组DNA。
[0010] 在一些实施方式中,所述通用序列被选择以使得其基本上不会与基因组DNA结合 产生扩增。在一些实施方式中,所述通用序列选自下组:SEQ ID N0:1、SEQ ID N0:2、SEQ ID N0:3、SEQ ID N0:4、SEQ ID N0:5、和SEQ ID N0:6。
[0011] 在一些实施方式中,所述可变序列包含随机序列。在一些实施方式中,所述可变序 列的长度为2-20个碱基、3-10个碱基,4-9个碱基或5-8个碱基。在一些实施方式中,所述可 变序列中的三个或三个以上的碱基位置由选自G、A、和T的一种或几种碱基组成,或者由C、A 和T的一种或几种碱基组成。在一些实施方式中,所述三个或三个以上的碱基位置位于所述 可变序列的3'端或者中间。在一些实施方式中,所述可变序列选自下组:(N)nGGG、(N)nTTT, (N)mTNTNG,(N)xGTGG(N)y,其中N为任意的可与天然核酸进行碱基配对的核苷酸,η是选自 3-17的正整数,m是选自3-15的正整数、X和y分别是选自3-13的正整数。在一些实施方式中, 所述可变序列被选择以使得在基因组上分别均匀并且覆盖度高。
[0012] 在一些实施方式中,所述第一类引物包括SEQ ID N0:11 [GTGAGTGATGGTTGAGGTAGTGTGGAGNNNNNNNN]、SEQ ID NO : 12 [GTGAGTGATGGTTGAGGTAGTGTGGAGNNNNNGGG]、SEQ ID NO : 13 [GTGAGTGATGGTTGAGGTAGTGTGGAGNNNNNTTT]、SEQ ID NO : 14 [GTGAGTGATGGTTGAGGTAGTGTGGAGNNNTNTNG]或SEQ ID NO : 1 5 [GTGAGTGATGGTTGAGGTAGTGTGGAGNNNGTGGNN]的序列,并且所述第二类引物从5 '到3 '具有 SEQ ID N0:1[GTGAGTGATGGTTGAGGTAGTGT GGAG]的序列,其中N为任意的可与天然核酸进行 碱基配对的核苷酸。
[0013] 在一些实施方式中,所述核酸聚合酶具有热稳定和/或链置换活性。在一些实施方 式中,所述核酸聚合酶选自:Phi29 DNA聚合酶、Bst DNA聚合酶、Pyrophage 3137、Vent聚合 酶(例如Thermococcus litoral is的Vent聚合酶、Deep Vent聚合酶、Vent (_exo)聚合酶、 Deep Vent(-exo)聚合酶)、T0P0Taq DNA聚合酶、9°Nm聚合酶、Klenow Fragment DNA聚合酶 I、MMLV反转录酶、AMV反转录酶、HIV反转录酶、T7 phase DNA聚合酶变种(缺少3 ' -5 '外切酶 活性)、Pluision?超保真DNA聚合酶、Taq聚合酶、Bst DNA聚合酶(全长)、E.coli DNA聚合 酶、LongAmp Taq DNA聚合酶、OneTaq DNA聚合酶,及其任意组合。
[0014] 在一些实施方式中,反应混合物进一步包含pH值调节剂,使得所述反应混合物的 pH值维持在7.0-9.0之间。
[0015] 在一些实施方式中,所述反应混合物进一步包含一种或多种选自下组的成分:Mg2 +、dTT、牛血清白蛋白、DNase 抑制剂、RNase、S〇42-、Cr、K+、Ca2+、Na+JP(NH4) +。
[0016] 在一些实施方式中,所述第一温度循环程序包括:(bl)将所述反应混合物置于能 够打开所述基因组DNA的双链的温度程序;(b2)将所述反应混合物置于能够使所述第一类 引物与DNA单链模板结合的温度程序;(b3)将所述反应混合物置于能够使与DNA单链模板结 合的第一类引物在所述核酸聚合酶的作用下延伸长度的温度程序,以产生扩增产物;(b4) 将所述反应混合物置于能够使所述扩增产物脱落成单链的温度程序;(b5)重复步骤(b2)到 (b4)至指定的第一循环次数。在一些实施方式中,所述指定的第一循环次数大于2。在一些 实施方式中,当进行到第二次循环后,所述扩增产物包含在5 '端包含所述通用序列,3 '端包 含所述通用序列的互补序列的基因组扩增产物。在一些实施方式中,所述方法在步骤(b4) 后并且在步骤(b5)之前进一步包括步骤(b4'),其中将所述反应混合物置于适当的温度程 序,使得所述基因组扩增产物的3'端与5'端杂交结合以形成环状结构,或者使所述基因组 扩增产物的3'端与引物结合。在一些实施方式中,所述方法在步骤(b4)后直接到步骤(b5)。 在一些实施方式中,所述步骤(b5)的所述第一循环次数大于3、大于4、大于5、大于6,并且不 超过10。
[0017] 在一些实施方式中,所述步骤(c)包括:(cl)将经步骤(b)获得的所述反应混合物 置于能够打开DNA双链的温度程序;(c2)将所述反应混合物置于能够使所述第二类引物与 所述经步骤(b)获得的基因组扩增产物的单链结合的温度程序;(c3)将所述反应混合物置 于能够使与所述扩增产物单链结合的第二类引物在所述核酸聚合酶的作用下延伸长度的 温度程序;(c4)重复步骤(cl)到(c3)至指定的第二循环次数。在一些实施方式中,所述步骤 (c4)中的所述第二循环次数大于所述步骤(b5)中所述的第一循环次数。在一些实施方式 中,所述步骤(bl)中所述的温度程序包括在90-95Γ的温度之间反应1-10分钟。在一些实施 方式中,所述步骤(b2)包括将所述反应混合物置于多于一种的温度程序,以促使所述第一 类引物充分与所述DNA模板有效结合;在一些实施方式中,所述多于一种的温度程序包括: 介于5-10°C之间的第一温度,介于25-30°C之间的第二温度,和介于45-50°C之间的第三温 度。
[0018] 在一些实施方式中,所述步骤(b2)中所述步骤包括在第一温度反应3-50秒、在第 二温度反应3-50秒、和在第三温度反应3-50秒。在一些实施方式中,所述步骤(b3)中所述的 温度程序包括在60-90°C的温度之间反应1-15分钟。在一些实施方式中,所述步骤(b4)中所 述的温度程序包括在90-95Γ的温度之间反应10-50秒。在一些实施方式中,所述步骤(cl) 中所述的温度程序包括在90-95Γ的温度之间反应10-30秒。在一些实施方式中,所述步骤 (c2)中所述的温度程序包括在45-65Γ的温度之间反应10-30秒。在一些实施方式中,所述 步骤(c3)中所述的温度程序包括在60-80°C的温度之间反应1-15分钟。在一些实施方式中, 所述步骤(a)中的基因组DNA从被裂解的细胞释放,所述裂解包括热裂解、碱裂解、酶裂解或 机械裂解。
[0019] 在一些实施方式中,所述热裂解包括温度在20_100°C之间裂解10-100分钟。在一 些实施方式中,所述热裂解是在裂解试剂存在的条件下进行的。在一些实施方式中,所述裂 解试剂包括一种或多种选自下组的表面活性剂:NP-40、吐温、SDS、TritonX-100、EDTA、和异 硫氰酸胍,和/或裂解酶。
[0020] 在本申请的另一个方面中,提供了一种扩增细胞基因组的方法,所述方法包括: (a)提供反应混合物,其中所述反应混合物包括所述基因组DNA、第一类引物、第二类引物、 核苷酸单体混合物、和核酸聚合酶,其中所述第一类引物从5'端到3'端包含通用序列和可 变序列,其中所述通用序列由G、A、C和T四种碱基中的三种或者两种组成,条件是所述通用 序列不同时包括G和C,所述第二类引物包含所述通用序列且不包含所述可变序列;(b)将所 述反应混合物置于第一温度循环程序,使得所述第一类引物的可变序列能够与所述基因组 DNA配对并扩增所述基因组DNA以得到基因组扩增产物,其中所述基因组扩增产物的5'端包 含所述通用序列,3'端包含所述通用序列的互补序列;其中所述第一温度循环程序包括: (bl)在介于90-95Γ的温度之间的第一变性温度反应1-10分钟;(b2)介于5-10°C之间的第 一退火温度反应3-50秒,介于25-30 °C之间的第二退火温度反应3-50秒,和介于45-50 °C之 间的第三退火温度反应3-50秒;(b3)在介于60-90°C之间的第一延伸温度反应1-15分钟; (b4)在介于90-95°C的第一解链温度之间反应10-50秒;(b5)重复步骤(b2)到(b4)至6-9个 循环;(c)将步骤(b)得到的反应混合物置于第二温度循环程序,使得所述第二类引物的所 述通用序列能够与所述基因组扩增产物的3'端配对并扩增所述基因组扩增产物以得到扩 大的基因组扩增产物;其中所述第二温度循环程序包括:(cl)在介于90-95Γ之间的第二变 性温度反应1-10分钟;(c2)在介于90-95°C之间的第二解链温度反应10-30秒;(c3)在介于 45-65°C之间的第四退火温度反应10-30秒;(c4)在介于60-80°C之间的第二延伸温度反应 1-15分钟;(c5)重复步骤(c2)到(c4)5-30个循环;(d)获得所述步骤(c)得到的扩增产物;其 中,在所述步骤(b)和所述步骤(c)之前提供所述反应混合物。
[0021 ] 在一些实施方式中,所述通用序列包含或由SEQ ID NO: 1组成;所述可变序列包含 或由NNNNNTTT或NNNNNGGG组成,N为任意的可与天然核酸进行碱基配对的核苷酸。
[0022] 在本申请的再一个方面中,提供了一种用于扩增基因组DNA的试剂盒,所述试剂盒 包括含有第一类引物和第二类引物的混合物,其中所述第一类引物从5'端到3'端包含通用 序列和可变序列,其中所述通用序列由G、A、C和T四种碱基中的三种或者两种组成,条件是 所述通用序列不同时包括G和C,并且所述第二类引物包含所述通用序列且不包含所述可变 序列。
[0023] 在一些实施方式中,所述混合物进一步包括核苷酸单体混合物和Mg2+。
[0024] 在一些实施方式中,所述混合物进一步包括一种或多种选自下组的成分:dTT、牛 血清白蛋白(BSA)、pH调节剂(例如Tris HCl)、DNase抑制剂、RNase、S〇42-、Cl-、K+、Ca2+、Na+、 和/或(NH4) +。
[0025] 在一些实施方式中,所述混合物进一步包括核酸聚合酶。
[0026] 在一些实施方式中,所述试剂盒进一步包括能够裂解细胞的表面活性剂和/或裂 解酶。在一些实施方式中,所述表面活性剂选自NP-40、吐温、303、1^丨〇1^-10040了4、和异 硫氰酸胍中的一种或多种。在一些实施方式中,所述裂解酶选自蛋白酶K、胃蛋白酶、和木瓜 蛋白酶中的一种或多种。
[0027] 在一些实施方式中,所述混合物进一步包括能够裂解细胞的表面活性剂和/或裂 解酶。
[0028] 在本申请的又一个方面中,提供了一种用于扩增基因组DNA的试剂盒,所述试剂盒 包括第一类引物和第二类引物,并且还包括使用说明书,所述使用说明书记载了在开始进 行所述扩增之前在同一容器中混合所述第一类引物和所述第二类引物的步骤,其中所述第 一类引物从5'端到3'端包含通用序列和可变序列,其中所述通用序列由G、A、C和T四种碱基 中的三种或者两种组成,条件是所述通用序列不同时包括G和C,并且所述第二类引物包含 所述通用序列且不包含所述可变序列。
【附图说明】
[0029] 通过下面说明书和所附的权利要求书并与附图结合,将会更加充分地描述本申请 内容的上述和其他特征。可以理解,这些附图仅描绘了本申请内容的若干实施方式,因此不 应认为是对本申请内容范围的限定。通过采用附图,本申请内容将会得到更加明确和详细 地说明。
[0030] 图1示出了本申请扩增方法的基本原理。
[0031] 图2示出了对正常人表皮成纤维细胞(AFP)的基因组DNA分别用实施例2的三步法 扩增以及用实施例3的两步法扩增,将两种方法得到的扩增产物分别进行凝胶电泳的结果, 其中a为实施例3的两步法扩增结果,自左向右第1泳道为分子量标记,2-11泳道为单细胞扩 增样品,12-14泳道为阳性对照(40pg gDNA),15-17泳道为阴性对照,第18泳道为分子量标 记;b为实施例2的三步法扩增结果,自左向右第1泳道为分子量标记,2-11泳道为单细胞扩 增样品,12-14泳道为阳性对照(40pg gDNA),15-17泳道为阴性对照,第18泳道为分子量标 记。
[0032]图3示出了对正常人表皮成纤维细胞(AFP)的基因组DNA分别用实施例2的三步法 扩增以及用实施例3的两步法扩增,将两种方法得到的扩增产物分别随机选取7个样品,即 总共14个样品分别作为模板,使用表7所示的引物分别针对表6所示的20个致病位点进行扩 增,将扩增产物进行凝胶电泳的结果。其中a-g分别表示重复进行的单细胞基因组DNA扩增 产物的凝胶电泳图,其中上排条带是用两步法扩增的结果,下排条带是用三步法扩增的结 果:a:上排对应样品2_1和下排对应样品3_1、b:上排对应样品2_2和下排对应样品3_3、c:上 排对应样品2_3和下排对应样品3_4、d:上排对应样品2_4和下排对应样品3_5、e:上排对应 样品2_5和下排对应样品3_6、f:上排对应样品2_6和下排对应样品3_7、g:上排对应样品2_7 和下排对应样品3_8;在每张电泳图片中,从左向右每个泳道依次表不分子量标记物、针对 表6所示的致病位点1-20进行的扩增结果(在图(a)中是1-16)。
[0033]图4示出了对正常人表皮成纤维细胞(AFP)的基因组DNA分别用实施例2的三步法 扩增以及用实施例3的两步法扩增,将两种方法得到的扩增产物分别随机选取3个样品,即 总共6个样品分别作为模板,使用表11所示的引物分别针对表10所示的20个致病位点进行 扩增,将扩增产物进行凝胶电泳的结果。其中a-c分别表示重复进行的单细胞基因组DNA扩 增产物的凝胶电泳图,其中上排条带是用两步法扩增的结果,下排条带是用三步法扩增的 结果:a:上排对应样品2_1和下排对应样品3_1、b:上排对应样品2_2和下排对应样品3_4、c: 上排对应样品2_7和下排对应样品3_8;在每张