专利名称:微量核酸样本的文库制备方法及其应用的制作方法
技术领域:
本发明属于基因工程技术领域,具体地涉及微量核酸样本的文库制备方法及其应用。
背景技术:
新一代测序技术(NGS)改变了以往对DNA/RNA样本的分析模式,几乎成为所有研究领域中必不可少的研究工具。新一代测序技术是通过对上百万条DNA短片段的同时的平行测序,使得在短时间内就能够完成每个碱基的测序,且成本大幅度降低。NGS技术在很多方面得到应用,如基因组学、转录组学、表观基因组学、临床诊断等。目前市场上新一代测序技术NGS平台有好几种,包括Illumina公司的GenomeAnalyzer、Hiseq、Miseq 系列测序平台,Roche 公司的 454 测序平台,Life Technologies 公司的SOLID测序平台、Ion Torrent测序平台等等。但是无论何种NGS平台,在测序前都需对DNA/RNA样本进行处理,制备成DNA片段文库。通常情况下,文库的制备需要微克级的起始DNA/RNA量,虽然经优化可以将建库起始量降低,但对于单细胞或极微量的核酸样本,仍无法直接进行文库制备,因此严重阻碍了对单细胞和微量核酸测序的应用。因此本领域迫切需要开发针对单细胞和微量核酸样本的文库构建方法。
发明内容
本发明的目的是提供一种对微量核酸样本进行文库制备的 方法和用途。本发明的另一目的是提供一种使用上述方法的试剂盒及其用途。在本发明的第一方面,提供了一种制备核酸文库的方法,包括步骤a.提供一待测样本,所述样本含有的核酸总量为2皮克 I微克;b.对待测样本进行D0P-PCR(Degenerate Oligonucleotide Primed PCR)扩增,获得第一 PCR扩增产物;C.用DOP-Amp弓I物对第一 PCR扩增产物进行第二次PCR扩增,获得第二 PCR扩增产物;d.对获得的第二 PCR扩增产物进行接头连接PCR (adaptor-1 igation PCR),获得第三PCR扩增产物,即为核酸文库。在另一优选例中,所述的第三PCR扩增产物的5'端具有接头,且3'端具有接头。在另一优选例中,还包括步骤(e):对第三PCR扩增产物依据片段大小进行选择。在另一优选例中,步骤(a)中所述的样本选自下组1-200个单细胞构成的样本,或含有1-200个单细胞的核酸样本,或核酸总含量为2皮克 I微克的核酸样本。在另一优选例中,所述样本选自下组
微量基因组DNA、免疫共沉淀产物DNA、游离DNA、cDNA、或其组合。 在另一优选例中,所述DNA来自环境,更佳地,来自土壤和/或水体。在另一优选例中,所述DNA来自体液或排泄物,更佳地,来自血浆和/或尿液。在另一优选例中,所述的DNA经化学或物理方法处理,更佳地,经亚硫酸氢盐处理。在另一优选例中,步骤(b)使用带有简并寡核苷酸区的DOP引物对样本DNA进行随机扩增。在另一优选例中,所述的DOP引物具有位于5'端的非简并寡核苷酸区和位于中部的简并寡核苷酸区和3'端的锚定区;或者位于5'端的非简并寡核苷酸区和位于中部和3'端的简并寡核苷酸区。在另一优选例中,所述DOP引物的3'端锚定区的序列长度为2-12个核苷酸,较佳地4-8个核苷酸。在另一优选例中,所述DOP引物的3'端锚定区任选自下组TG、ATGTGG、TGTGG,或GTCT。在另一优选例中,所述DOP引物的5'端非简并寡核苷酸序列如SEQ ID NO :2所示,或与SEQ ID NO : 2所示序列的同源性彡50%。在另一优选例中,所述的DOP引物的Y端非简并寡核苷酸长度为5_30bp,较佳地5-20bp,更佳地 6-13bp 。在另一优选例中,所述的简并寡核苷酸序列如(N)m所示,其中每个碱基位置上的N包括A、T、G和C,m为3-20的正整数。在另一优选例中,,步骤(C)所述的DOP-Amp引物与步骤(b)所述的5’端非简并寡核苷酸互补或基本上互补。在另一优选例中,DOP-Amp引物序列结合于DOP引物5’端非简并寡核苷酸区。在另一优选例中,DOP-Amp引物序列如SEQ ID NO 2所示。在另一优选例中,步骤(d)用接头引物进行接头连接PCR扩增。在另一优选例中,所述的接头引物为P5和P7,且P5和P7的3’端都具有可结合于DOP-Amp引物序列的非简并寡核苷酸区,所述的非简并寡核苷酸区的序列与SEQ ID NO 2所示序列相同或完全互补,或者与SEQ ID NO :2所示序列有> 80%的同源性。在另一优选例中,所述的接头引物P7还具有标签(barcode或index)序列。在另一优选例中,步骤(e)中所述的依据片段大小进行选择为在第三PCR扩增产物中选择IOO-1OOObp长度的片段。在另一优选例中,所述的依据片段大小进行选择为在第三PCR扩增产物中选择200-500bp长度的片段。在本发明的第二方面,提供了一种检测微量核酸样本中核苷酸序列的方法,包括步骤(i)对于所提供的单细胞及微量核酸样本,用本发明第一方面任一所述的方法制备所述样本的核酸文库;(ii)对所述核酸文库中的片段进行测序和数据分析。在另一优选例中,所述的测序为第二代高通量测序法,更佳地,所述第二代高通量测序法选自下组Roche454 FLX、Illumina Solexa或ABI SOLID测序平台。在另一优选例中,所述的测序包括步骤将需要测序的核酸文库与测序芯片(flow cell)上固定的测序探针进行杂交,并进行固相桥式PCR扩增,形成测序簇;对所述测序簇用“边合成-边测序”法进行测序,获得样本中核苷酸序列信息。在本发明的第三方面,提供了一种可用于本发明第一方面和第二方面任一方法的试剂盒,所述试剂盒包括(I)第一容器以及位于容器内的用于进行第一 PCR扩增的DOP引物;(2)第二容器以及位于容器内的用于进行第二 PCR扩增的DOP-Amp引物;(3)第三容器以及位于容器内的用于进行第三PCR扩增的接头连接引物;(4)说明书。在另一优选例中,所述试剂盒还包括用于进行PCR扩增所需的试剂、用于核酸纯化的试剂、用于进行高通量测序的测序芯片(flow cell)、或其组合。应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在
此不再一一累述。
下列附图用于说明本发明的具体实施方案,而不用于限定由权利要求书所界定的本发明范围。图1显示一个典型的构建文库及测序的流程示意图。图2显示用DOP-PCR方法制备单细胞基因组DNA文库接头连接PCR产物的电泳图。图3显示四个样本(YH1,YH2,YH3,T21)的接头连接PCR产物经片段选择和纯化后,进行片段检测的结果。图3A为样本YHl检测结果,需要的主带位于377bp ;图3B为样本YH2检测结果,需 要的主带位于326bp ;图3C为样本YH3检测结果,需要的主带位于339bp ;图3D为样本T21检测结果,需要的主带位于360bp。图4显示用DOP-PCR方法制备微量核酸样本(IP产物DNA,Plasma DNA, cDNA,gDNA)的接头连接PCR产物电泳胶图。图5显示用DOP-PCR方法制备微量DNA/cDNA样本的文库,经片段选择和纯化后片段检测的结果。图5A为微量基因组DNA-200pg检测结果,图5B为微量基因组DNA_40pg检测结果,图5C为免疫沉淀(IP)DNA-200pg检测结果,图K)为免疫沉淀(IP)DNA_40pg检测结果,图5E为cDNA-原浓度检测结果,图5F为cDNA-5-l检测结果,图5G为血浆游离DNA_200pg检
测结果。
具体实施例方式本发明人经过广泛而深入的研究,首次建立了一种对微量核酸样本进行文库制备的方法。用DOP引物对样本中的DNA进行第一次扩增,DOP引物序列具有至少Y端的非简并的核苷酸区和简并核苷酸区;用DOP-Amp引物对第一 PCR产物进行第二次扩增,获得第二PCR扩增产物;对第二 PCR扩增产物进行接头连接PCR,获得第三PCR扩增产物,第三PCR扩增产物的两端带有测序接头,即为核酸文库。对文库进行片段大小选择和高通量测序,能得到样本中疾病相关的基因信息术语如本文所用,术语“含有”包括“具有(comprise) ”、“基本上由...构成”和“由..·构成”。如本文所用,术语“以上”和“以下”包括本数,例如“ 80 %以上“指彡80 %,“ 2 %以下”指彡2%。DOP-PCR(Degenerate Oligonucleotide Primed PCR)DOP-PCR简并寡核苷酸引物PCR(DOP-PCR)是一种对微量DNA或单细胞进行扩增的方法,包括(但不限于)低严谨度预扩增和高严谨度扩增两个步骤。低严谨度扩增基于简并寡核苷酸引物进行,目的是在DNA片段加上了一段固定序列作为PCR引物结合区;再用DOP-Amp弓I物对低严谨度扩增产物进行高严谨度扩增。所述的简并寡核苷酸引物至少包括两部分,从5’到3’分别为5’端非简并核苷酸区及其下游的简并引物区。在另一优选例中,DOP引物序列如SEQ ID N0:1所示GCTCTTCCGATCTNNNNNNNNNN,其中,GCTCTTCCGATCT 为 5’ 端的非简并核苷酸区,NNNNNNNNNN为简并序列区,简并序列可记为(N)m,m为任选自3-20的正整数,N独立地任选自A、T、G和C。在一个优选例中,DOP引物序列还包括3’端锚定序列,如“TG”,“ATGTGG”,“TGTGG”,“GTCT”等。用简并寡核苷酸引物对样本进行扩增,获得第一 PCR产物。所述的DOP-Amp引物序列与DOP引物的5’端非简并核苷酸区基本上互补,在一个优选例中,DOP-Amp引物序列 与5’端非简并核苷酸区相同或完全互补或至少覆盖了 5’端特定核苷酸序列的50%区域或与5’端特定核苷酸序列有> 80%同源性。在另一优选例中,DOP-Amp 引物序列如 SEQ ID NO 2 所示:5,-GCTCTTCCGATCT-3’。用 DOP-Amp 引物对第一PCR产物进行扩增,获得第二 PCR产物。将扩增获得的第二 PCR产物直接进行电泳或检测浓度,也可以制备成质粒进行Sanger法测序,也可以用来进行后续建库。引物如本文所用,术语“引物”指的是能与模板互补配对,在DNA聚合酶的作用合成与模板互补的DNA链的寡聚核苷酸的总称。引物可以是天然的RNA、DNA,也可以是任何形式的天然核苷酸,引物甚至可以是非天然的核苷酸如LNA或ZNA等。引物“大致上”(或“基本上”)与模板上一条链上的一个特殊的序列互补。引物必须与模板上的一条链充分互补才能开始延伸,但引物的序列不必与模板的序列完全互补。t匕如,在一个3’端与模板互补的引物的5’端加上一段与模板不互补的序列,这样的引物仍大致上与模板互补。只要有足够长的引物能与模板充分的结合,非完全互补的引物也可以与模板形成引物-模板复合物,从而进行扩增。在本发明中,引物包括(但不限于)简并引物、DOP-Amp引物、接头引物。简并引物为(N)m,m为任选自3-20的正整数,N任选自A、T、G和C,能够通过碱基互补配对与样本随机结合,对样本进行随机片段化的扩增。DOP-Amp引物能与简并寡核苷酸引物的特定核苷酸序列基本上互补,对简并引物扩增的产物进一步扩增。接头引物特异性识别DOP-Amp引物扩增产物的两端,得到5’端和3’端分别为特异接头的、可用于进一步测序的产物。接头连接PCR(Adaptor-Ligation PCR)接头连接PCR (Adaptor-Ligation PCR)是指在PCR同时将接头加到模板DNA片段两端,此处的“接头”为高通量测序文库的接头序列。接头引物是接头连接PCR的重要组成部分。在一个优选例中,接头引物包括(但不限于)P5接头引物和P7接头引物。所述的P5接头引物具有如SEQ ID NO :3所示的序列AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT ;P7具有SEQ ID NO :4_7所示的任一序列;CAAGCAGAAGACGGCATACGAGATXXXXXXGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,其中 XXXXXX 为标签(barcode)序列,标签(barcode)用于区分不同的样本。P5接头和P7接头具有结合测序平台Flow cell,用于测序的序列。高通量测序基因组的“再测序”使得人类能够尽早地发现与疾病相关基因的异常变化,有助于对个体疾病的诊断和治疗进行深入的研究。本领域技术人员通常可以采用三种第二代测序平台进行高通量测序454 FLX(Roche 公司)、Solexa Genome Analyzer (IIIumina 公司)和Applied Biosystems公司的SOLID等。这些平台共同的特点是极高的测序通量,相对于传统测序的96道毛细管测序,高通量测序一次实验可以读取40万到400万条序列,根据平台的不同,读取长度从25bp到450bp不等,因此不同的测序平台在一次实验中,可以读取IG到14G不等的碱基数。其中,Solexa高通量测序包括DNA簇形成和上机测序两个步骤PCR扩增产物的混合物与固相载体上固定的测序 探针进行杂交,并进行固相桥式PCR扩增,形成测序簇;对所述测序簇用“边合成-边测序法”进行测序,从而得到样本中疾病相关核酸分子的核苷酸序列。DNA簇的形成是使用表面连有一层单链引物(primer)的测序芯片(flow cell),单链状态的DNA片段通过接头序列与芯片表面的引物通过碱基互补配对的原理被固定在芯片的表面,通过扩增反应,固定的单链DNA变为双链DNA,双链再次变性成为单链,其一端锚定在测序芯片上,另一端随机和附近的另一个引物互补从而被锚定,形成“桥”;在测序芯片上同时有上千万个DNA单分子发生以上的反应;形成的单链桥,以周围的引物为扩增引物,在扩增芯片的表面再次扩增,形成双链,双链经变性成单链,再次成为桥,称为下一轮扩增的模板继续扩增;反复进行了 30轮扩增后,每个单分子得到1000倍扩增,称为单克隆的DNA 簇。DNA簇在Solexa测序仪上进行边合成边测序,测序反应中,四种碱基分别标记不同的荧光,每个碱基末端被保护碱基封闭,单次反应只能加入一个碱基,经过扫描,读取该次反应的颜色后,该保护集团被除去,下一个反应可以继续进行,如此反复,即得到碱基的精确序列。在Solexa多重测序(Multiplexed Sequencing)过程中会使用Index(标签orbarcode)来区分样品,并在常规测序完成后,针对Index部分额外进行7个循环的测序,通过Index的识别,最多可以在I条测序甬道中区分12种不同的样品。本发明提供了一种制备单细胞及微量核酸的文库的方法,所述方法包括(但不限于)下述步骤1.获得样本;2.对样本 DNA 进行 DOP-PCR ;3.对 DOP-PCR 扩增产物进行 Adaptor-Ligation PCR ;PCR产物经片段大小选择和纯化,片段大小选择及纯化是指选取一定大小范围的DNA片段,并进行纯化,片段大小选择的方法可以是在琼脂糖凝胶电泳后切取一定大小范围的DNA片段胶块,进行回收纯化,纯化后即得到由单细胞及微量核酸制备的文库。在另一优选例中,还可以对所述文库进行测序,较佳地使用高通量测序。本发明一个典型的流程示意图见图1。试剂盒本发明还提供了一种用于微量核酸样本的文库制备的试剂盒,所述试剂盒包括(I)第一容器以及位于容器内的用于进行第一 PCR的DOP引物;(2)第二容器以及位于容器内的用于进行第二 PCR的DOP-Amp引物;(3)第三容器以及位于容器内的用于进行第三PCR的接头连接引物;(4)说明书。在本发明的一个优选例中,试剂盒还包括用于进行PCR扩增所需的试剂、用于核酸纯化的试剂、用于进行高通 量测序的测序芯片(flow cell)、或其组合。本发明的主要优点包括1.通过DOP引物对样本中的DNA进行第一次扩增,能够全面覆盖样本的DNA片段;2. DOP引物序列具有至少5'端的非简并核苷酸区及其下游的简并寡核苷酸区,获得的扩增产物带有特定的核苷酸序列,加入DOP-Amp引物,能够对预扩增产物进行第二次扩增,且第二次扩增为高严谨性扩增,大大提高灵敏度;3.第三次PCR中使用接头接头连接引物在片段两端加入接头,可以直接用于下一步测序;4.可以同时对多个样品建库和检测,且没有荧光背景的干扰;5.不受物种的限制,人、动物、微生物、植物等都可以进行个体式建库和检测;6.试验费用低,灵敏度高、精确度高、重复性好。下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如 Sambrook 等人,分子克隆实验室手册(New York Cold Spring Harbor LaboratoryPress, 1989)中所述的条件,或按照制造厂商所建议的条件。实施例1DOP-PCR方法制备单细胞基因组DNA文库本实施例以血液中的单个淋巴细胞为例,借助DOP-PCR的方法制备单细胞基因组DNA文库。1.样本来源血液单细胞样本分别来自于一个正常人(YH,炎黄计划样本)和一个唐氏综合症患者(T21)的外周血。2.单细胞分离
用口吸管方法共分离出3个YH和I个T21外周血单个淋巴细胞,置于含2 μ I碱性细胞裂解液(200mM KOH, 50mM DTT)的PCR管中,_80°C冻存30分钟以上。3.第一次PCR (低严谨度扩增,DOP预扩增):DOP预扩增将含单细胞的PCR管于65°C处理15分钟,之后加入DOP反应液进行DOP预扩增反应。本实施例以pfx DNA聚合酶进行扩增。DOP反应体系见表I。表权利要求
1.一种制备核酸文库的方法,其特征在于,包括步骤 a.提供一待测样本,所述样本含有的核酸总量为2皮克 I微克; b.对待测样本进行DOP-PCR扩增,获得第一PCR扩增产物;c.用DOP-Amp弓I物对第一PCR扩增产物进行第二次PCR扩增,获得第二 PCR扩增产物;d.对获得的第二PCR扩增产物进行接头连接PCR,获得第三PCR扩增产物,即为核酸文库; 较佳地,所述的第三PCR扩增产物的5'端具有接头,且3'端具有接头。
2.如权利要求1所述的方法,其特征在于,还包括步骤(e) 对第三PCR扩增产物依据片段大小进行选择。
3.如权利要求1所述的方法,其特征在于,步骤(a)中所述的样本选自下组 1-200个单细胞构成的样本,或 含有1-200个单细胞的核酸样本,或 核酸总含量为2皮克 I微克的核酸样本; 较佳地,所述样本选自下组微量基因组DNA、免疫共沉淀产物DNA、游离DNA、cDNA、或其组合; 或所述DNA具有选自下组的一个或多个特征 所述DNA来自环境,更佳地,来自土壤和/或水体; 所述DNA来自体液或排泄物; 所述DNA来自来自血浆和/或尿液; 所述DNA经化学或物理方法处理; 所述DNA经亚硫酸氢盐处理。
4.如权利要求1所述的方法,其特征在于,步骤(b)使用带有简并寡核苷酸区的DOP引物对样本DNA进行随机扩增; 所述的DOP引物具有选自下组的一个或多个特征 所述的DOP引物具有位于5'端的非简并寡核苷酸区和位于中部的简并寡核苷酸区和3'端的锚定区; 所述的DOP引物具有位于5'端的非简并寡核苷酸区和位于中部和3'端的简并寡核苷酸区; 所述DOP引物的3'端锚定区的序列长度为2-12个核苷酸; 所述DOP引物的3'端锚定区的序列长度为4-8个核苷酸; 所述DOP引物的3'端锚定区任选自下组TG、ATGTGG、TGTGG,或GTCT ; 所述DOP引物的5'端非简并寡核苷酸序列如SEQ ID NO :2所示; 所述DOP引物的5'端非简并寡核苷酸序列与SEQ ID NO :2所示序列的同源性> 50%;所述的DOP引物的5'端非简并寡核苷酸长度为5-30bp,较佳地5-20bp,更佳地6_13bp ; 所述的简并寡核苷酸序列如(N) m所示,其中每个碱基位置上的N包括A、T、G和C,m为3-20的正整数。
5.如权利要求1所述的方法,其特征在于,步骤(c)所述的DOP-Amp引物与步骤(b)所述的5’端非简并寡核苷酸互补或基本上互补;较佳地,DOP-Amp引物序列结合于DOP引物5’端非简并寡核苷酸区; 或较佳地,DOP-Amp引物序列如SEQ ID NO 2所示。
6.如权利要求1所述的方法,其特征在于,步骤(d)用接头引物进行接头连接PCR扩增; 较佳地,所述的接头引物为P5和P7,且P5和P7的3’端都具有可结合于DOP-Amp引物序列的非简并寡核苷酸区,所述的非简并寡核苷酸区的序列与SEQID NO 2所示序列相同或完全互补,或者与SEQ ID NO 2所示序列有彡80%的同源性; 或优选地,所述的接头引物P7具有标签序列。
7.如权利要求1所述的方法,其特征在于,步骤(e)中所述的依据片段大小进行选择为在第三PCR扩增产物中选择IOO-1OOObp长度的片段; 较佳地,所述的依据片段大小进行选择为在第三PCR扩增产物中选择200-500bp长度的片段。
8.—种检测微量核酸样本中核苷酸序列的方法,其特征在于,包括步骤 (i)对于所提供的单细胞及微量核酸样本,用权利要求1-7任一所述的方法制备所述样本的核酸文库; ( )对所述核酸文库中的片段进行测序和数据分析; 较佳地,所述的测序为第二代高通量测序法;更佳地,所述第二代高通量测序法选自下组Roche454 FLX、Illumina Solexa 或 ABI SOLID 测序平台。
9.如权利要求8所述的方法,其特征在于,所述的测序包括步骤 将需要测序的核酸文库与测序芯片上固定的测序探针进行杂交,并进行固相桥式PCR扩增,形成测序簇;对所述测序簇用“边合成-边测序”法进行测序,获得样本中核苷酸序列信息。
10.一种可用于权利要求1-9任一方法的试剂盒,其特征在于,所述试剂盒包括 (1)第一容器以及位于容器内的用于进行第一PCR扩增的DOP引物; (2)第二容器以及位于容器内的用于进行第二PCR扩增的DOP-Amp引物; (3)第三容器以及位于容器内的用于进行第三PCR扩增的接头连接引物; (4)说明书; 优选地,所述试剂盒还包括用于进行PCR扩增所需的试剂、用于核酸纯化的试剂、用于进行高通量测序的测序芯片、或其组合。
全文摘要
本发明涉及微量核酸样本的文库制备方法及其应用,所述方法包括用DOP(Degenerate Oligonucleotide Primed)引物对样本中的DNA进行第一次扩增,DOP引物序列具有至少5′端非简并核苷酸区和3′端简并核苷酸区;用DOP-Amp引物对第一PCR产物进行第二次扩增,获得第二PCR扩增产物;对第二PCR扩增产物进行接头连接PCR(adaptor-ligation PCR),获得第三PCR产物,两端带有测序接头的第三PCR产物即为核酸文库。所述文库可以进行片段大小选择和高通量测序,得到样本中疾病相关的基因信息。本发明还提供一种试剂盒及其在所述微量核酸样本文库制备的用途。
文档编号C12Q1/68GK103060924SQ20111031606
公开日2013年4月24日 申请日期2011年10月18日 优先权日2011年10月18日
发明者殷旭阳, 张春雷, 蒋慧, 张秀清 申请人:深圳华大基因科技有限公司, 深圳华大基因研究院