用于扩增样品中多个目标DNA序列的引物组及其应用的制作方法

文档序号:13128273阅读:504来源:国知局
本申请是申请日为2016年5月6日,申请号为201610293653.2,发明名称为“用于扩增样品中多个目标dna序列的引物组及其应用”的发明专利申请的分案申请。本发明涉及核酸序列的捕获、富集与分析。更具体来说,本发明涉及基于多重pcr的目标序列富集方法。
背景技术
:全基因组测序可以获得全基因组水平范围的突变、插入、缺失以及结构变异。然而,由于基因组容量巨大,以30×进行测序就会产生接近100g的数据量。而肿瘤等相关的低突变频率测序则需要至少1000×的覆盖度,如果进行全基因组测序,则会产生3000g的数据量。这样规模的数据量除了会对数据的分析工作造成极大的困难,还会显著增加测序的成本,进而制约测序的应用。为了解决这个难题,目标区域捕获技术应运而生。目标区域捕获技术是指通过特定的技术手段定向捕获目标区域的核酸序列,然后进行建库测序,以达到在对目标区域进行深度测序的目的的同时使得测序成本大大降低。pcr是一种常见的用于富集目标区域的技术,更为常见的是利用多重pcr技术一次性的捕获多个目标区域。多重pcr适用于热点区域或者长度较小的目标区域的捕获。制约多重pcr技术应用的两个重要因素是非特异扩增和二聚体的产生。因此,本领域中需要能有效降低非特异扩增和二聚体产生的多重pcr技术出现。技术实现要素:本发明提供了基于多重pcr扩增的目标序列富集方法,所述方法包括:兼容性多重pcr引物的筛选;进行第一轮特异性多重pcr扩增;进行第二轮通用引物扩增富集;回收产物并上机测序。因此,在第一方面,本发明提供了用于扩增样品中多个目标dna序列的引物组,所述引物组包括针对每个目标dna序列的多对上下游特异性引物,其中:a)每对所述上下游特异性引物包括针对目标序列的特异性序列,所有特异性序列之间满足如下条件:(1)每个特异性序列与目标序列之外的序列不发生扩增,(2)特异性序列之间不形成二聚体,(3)特异性序列不形成发卡结构;b)在所述特异性序列的5’端连接有与基因组不同源的通用序列;c)在所述特异性序列的3’端的碱基处有增加空间位阻的修饰,所述修饰不阻断其与所述特异性序列完全匹配的模板的结合与延伸,但基本阻断其与不完全匹配的模板的结合与延伸。在一个具体的实施方案中,所述特异性序列之间满足如下条件:(1)所述特异性序列与目标区域的tm–与非目标区域的tm≥5℃,优选≥10℃;(2)所述特异性序列与目标区域的tm–与其他特异性序列形成二聚体的tm≥5℃,优选≥10℃;(3)所述特异性序列与目标区域的tm–形成发卡结构的tm≥5℃,优选≥10℃,优选tm的值基于santalucia2007热力学参数表的最邻近法计算。在本发明中,所述特异性序列的3’端的碱基处修饰包括在所述特异性序列的3’端-2、-3位碱基、核糖或磷酸二酯键上;在优选的实施方案中,所述特异性序列的3’端的5个碱基的gc含量大于50%,即有三个或三个以上的碱基为c或g,所述特异性序列的3’端的碱基处修饰还包括在所述特异性序列的3’端-4位碱基、核糖或磷酸二酯键处。即,在优选的实施方案中,在所述特异性序列的3’端的5个碱基的gc含量大于50%的情况下,即有三个或三个以上的碱基为c或g,所述特异性序列的3’端的碱基处修饰还包括在所述特异性序列的3’端-2、-3、-4处位碱基、核糖或磷酸二酯键处。在一个具体的实施方案中,所述增加空间位阻的修饰选自:脱氧次黄嘌呤(di)、脱氧尿嘧啶(du)、5-methyldc、2'-o-me-dc、磷酸基团、硫代基团、地高辛、生物素、aminolinkerc7、bhq1、bhq2、dabcyl、joe、rox、fam、tamra、烷基基团、氟代基团、氨基基团和thiol-c3s-s。在一个具体的实施方案中,所述3’端的碱基处增加空间位阻的修饰包括3’端-1、-2、-3位碱基处的硫代修饰。在一个具体的实施方案中,所述特异性序列的3’端的5个碱基的gc含量大于50%,在所述特异性序列的3’端-4位碱基处有硫代修饰。在一个具体的实施方案中,所述特异性引物序列有一致的热力学参数,优选tm标准差≤5℃;更优选tm标准差≤2℃;最优选tm标准差≤1℃。tm标准差是所述所有特异性引物序列与相应目标dna序列之间的tm的标准差。在第二方面,本发明提供了一种扩增样品中多个目标dna序列的方法,所述方法包括:a)提供包含目标dna序列和非目标序列的样本、本发明第一方面的引物组和与所述引物组中特异性引物5’端通用序列互补的通用引物对;b)以所述引物组中的特异性引物进行pcr反应,扩增所述样本中的目标dna序列,所述pcr反应的退火温度按照从高到低的阶梯进行,例如在一个退火过程中使用等差的3个温度(例如60℃、59℃、58℃)进行退火;c)以所述通用引物对再次扩增步骤b)中的扩增产物,进一步富集所述扩增产物。在一个具体的实施方案中,所述方法还包括步骤d)对步骤c)得到扩增产物进行测序。在一个具体的实施方案中,所述方法还包括步骤b’):回收步骤b)中富集的扩增产物。在一个具体的实施方案中,所述回收是通过采用磁珠对第一轮pcr反应产物进行片段筛选和纯化,去除目标区域外的大片段、基因组dna、引物二聚体、引物和其他反应成分,得到目标区域序列的pcr产物。在一个具体的实施方案中,所述多个退火温度是3个温度,例如60℃、59℃、58℃。具体实施方式本发明提供了基于多重pcr扩增的目标序列富集方法,所述方法包括:兼容性多重pcr引物的筛选;第一轮特异性多重pcr扩增;第二轮通用引物扩增富集;回收产物并上机测序,达到检测的目的。因此,本发明提供了用于扩增样品中多个目标dna序列的引物组以及使用所述引物组扩增样品中多个目标dna序列的方法。在本发明中,本发明的多重pcr引物组中的引物优选具有如下特性:1.具有特异性,即在所述多重pcr体系中,同一反应体系内的所有引物,除了目标序列之外,不会扩增其他非目标序列。所述具有特异性的引物的设计方法是:首先对任意一对引物进行全基因组insillco扩增分析,将预测到的扩增产物与目标扩增产物进行比较,如果预测产物中有非目标产物,并且这些非目标预测产物和目标产物之间的热力学参数相近,那么判定这对引物有非特异扩增;如果这些非目标预测产物和目标产物的热力学参数相差较大,那么可认为不会产生非特异扩增。热力学参数相差的判定的标准为:tm(与目标产物)-tm(与非目标产物)≥5℃,优选tm(与目标产物)-tm(与非目标产物)≥10℃;另外,不同的热力学计算方法以及参数会对计算结果有影响,本发明中优选基于santalucia2007热力学参数表的最邻近法计算;2.无二聚体产生,即在所述多重pcr体系中,同一反应体系内的所有引物两两之间不能形成稳定的二聚体,判定的标准为:tm(与目标产物)-tm(二聚体)≥5℃,优选tm(与目标产物)-tm(二聚体)≥10℃;另外,不同的热力学计算方法以及参数会对计算结果有影响,本发明中优选基于santalucia2007热力学参数表的最邻近法计算;3.无发卡结构产生,即在所述多重pcr体系中任何引物自身都不形成稳定的发卡结构,判定的标准为:tm(与目标产物)-tm(发卡结构)≥5℃,优选tm(与目标产物)-tm(发卡结构)≥10℃;另外,不同的热力学计算方法以及参数会对计算结果有影响,本发明中优选基于santalucia2007热力学参数表的最邻近法计算;4.有一致的热力学参数,即在所述多重pcr体系中,同一反应体系内的所有引物具有相同或相似的tm值,优选tm标准差≤5℃,更优选tm标准差≤2℃,最优选tm标准差≤1℃;5.扩增产物长度在100-300bp的范围,优选150-250bp,最优选180-220bp;6.在所有引物的5’端连接有与基因组不同源的通用序列。在本发明的另一个实施方案中,在引物序列3’端增加空间位阻的方法包括:1.在所述特异性引物序列的3’端添加能增加空间位阻的修饰,所述修饰不阻断其对与所述特异性引物序列完全匹配的模板的结合与延伸,但基本阻断其对与所述特异性引物序列不完全匹配的模板的结合与延伸,所述修饰如脱氧次黄嘌呤(di)、脱氧尿嘧啶(du)、5-methyldc、2'-o-me-dc、磷酸基团、硫代基团、地高辛、生物素、aminolinkerc7、bhq1、bhq2、dabcyl、joe、rox、fam、tamra、烷基基团、氟代基团、氨基基团和thiol-c3s-s。其中,修饰基团aminolinkerc7、bhq1、bhq2、dabcyl、joe、rox、fam、tamr和thiol-c3s-s为基团名称的简写形式,为引物合成行业公认的名称。2.一般在所述特异性引物序列的3’端-2、-3位碱基处增加修饰,优选所述修饰是-1、-2、-3位碱基处增加修饰;3.当所述特异性引物序列的3’端的5个碱基的gc含量大于50%时,在所述特异性序列的3’端-4位碱基处增加修饰,例如硫代修饰。在本发明中,3’端-1、-2、-3位是指3’端往5’数第1、2、3位。以此类推。在本发明中,使用如下基团进行碱基修饰是为了不阻断其对与所述特异性引物序列完全匹配的模板的结合与延伸,但基本阻断其对与所述特异性引物不完全匹配的模板的结合与延伸:脱氧次黄嘌呤(di)、脱氧尿嘧啶(du)、5-methyldc、2'-o-me-dc、磷酸基团、硫代基团、地高辛、生物素、aminolinkerc7、bhq1、bhq2、dabcyl、joe、rox、fam、tamra、烷基基团、氟代基团、氨基基团、thiol-c3s-s等。所述修饰是在磷酸二酯键上,糖基或碱基上通过化学合成的方法,添加一些化学基团,目的是降低碱基配对的稳定性。在磷酸键上或者糖基或碱基上添加化学基团是本领域中已知的。例如,所述脱氧次黄嘌呤(di)连接到引物磷酸二酯键上、脱氧尿嘧啶(du)连接到引物的磷酸二酯键上、甲基基团连接到引物脱氧核糖胞嘧啶的5’(5-methyldc)、甲基基团连接到脱氧核糖胞嘧啶的2’(2'-o-me-dc)、磷酸基团连接到引物3’的磷酸二酯键上、硫代基团连接到引物3’的磷酸二酯键上、地高辛基团连接到引物3’的磷酸二酯键上、生物素基团连接到引物3’的磷酸二酯键上、aminolinkerc7连接到引物3’的磷酸二酯键上、bhq1连接到引物3’的磷酸二酯键上、bhq2连接到引物的3’磷酸二酯键上、dabcyl连接到引物的磷酸二酯键上、joe连接到引物3’的磷酸二酯键上、rox连接到引物3’的磷酸二酯键上、fam连接到引物的磷酸二酯键上、tamra连接到引物3’的磷酸二酯键上、烷基基团连接到引物脱氧核糖鸟嘌呤的6’、氟代基团连接到脱氧核糖的2’、氨基基团连接到引物脱氧核糖的2’、巯基基团连接到引物3’磷酸二酯键上(thiol-c3s-s)。在本发明中,序列的tm的计算不拘泥于具体的方法,各种方法计算的tm值均可以用于本发明,各种方法得到的tm值基本不能逆转本发明的效果,只是效果的程度会有差异。虽然santalucia2007热力学参数表的最邻近法可以计算tm,但其他方法计算的tm值可以与之相对应,本领域技术人员可以经过简单的试验比较各种方法计算得到的tm,从而对各种方法计算的tm值作出适当选择。根据发明人的经验,对于人基因组编码区而言,超过99%的目标区域均可以设计出适合本发明的引物序列,表明我们前述对引物组的过滤都是合理的。在发明中,术语“样品”以其最广泛的意思使用,其意在包括从任何来源,优选从生物来源获得的样本或培养物。生物样品可从动物(包括人)获得,并包括液体、固体、组织和气体。生物样品包括血液制品,例如血浆、血清等等。因此,“核酸样品”包含任何来源的核酸(例如dna、rna、cdna、mrna、trna、mirna等)。在所述核酸样品是rna或mrna的情况下,中步骤c)之前有将所述rna或mrna反转录成dna的步骤。在本申请中,核酸样品优选源自生物来源,例如人或非人细胞、组织等等。术语“非人”系指所有非人动物和实体,包括但不限于,脊椎动物例如啮齿动物、非人灵长动物、绵羊、牛、反刍动物、兔类动物、猪、山羊、马、犬、猫、鸟类等等。非人还包括无脊椎动物和原核生物,例如细菌、植物、酵母、病毒等等。因此,用于本发明的方法和系统的核酸样品为源自任何生物,无论真核或者原核的核酸样品。某些实施方案中,引物与目标核酸之间的杂交在优选地严格条件下进行,所述严格条件足以支持所述核酸之间的杂交,其中所述核酸包含连接化合物和所述目标核酸样品的互补区域,以提供所述核酸杂交复合物。所述复合物随后通过所述连接化合物捕获,并在足以去除非特应性结合核酸的条件下洗涤,然后所杂交的目标核酸序列从所捕获的核酸复合物中洗脱。在某些实施方案中,所述核酸包含化学基团或连接化合物,例如结合部分例如生物素、地高辛等等,其能结合于固体载体。所述固体载体可以包含相应的捕获化合物,例如用于生物素的链霉亲和素或用于地高辛的地高辛抗体。本发明不限于所使用的连接化合物,并且替代的连接化合物等同适用于本发明的方法、诱饵序列和试剂盒。在本发明的实施方案中,所述多个目标核酸分子优选包含一种生物的全基因组或至少一条染色体或一种任意大小分子量的核酸分子。优选地,所述核酸分子的大小至少约200kb、至少约500kb、至少约1mb、至少约2mb、或至少约5mb,更优选大小约100kb至约5mb、约200kb至约5mb、约500kb至约5mb、约1mb至约2mb或约2mb至约5mb。在某些实施方案中,所述目标核酸来自动物、植物或微生物,在优选的实施方案中,所述目标核酸分子选来自人。如果核酸样品的量比较少(例如某些情况下取得的人核酸样品,例如发育中的胎儿的基因组),在实施本发明的方法之前可扩增所述核酸,例如通过全基因组扩增。为进行本发明的方法,预先扩增可能是必须的,例如在法医应用中(例如在法医学中用于遗传特征目的)。在某些实施方案中,所述多个目标核酸分子为一组基因组dna分子。所述诱饵序列可选自例如限定来自多个遗传基因座的多种外显子、内含子或调控序列的多个诱饵序列;限定至少一个单独遗传基因座的全序列的多个诱饵序列,所述基因座大小任意,优选至少1mb,或至少上述特定大小之一;限定单核苷酸多态性(snp)的多种诱饵序列;或限定一种阵列的多种诱饵序列,例如设计为捕获至少一条完整染色体的全序列的嵌合阵列。在本文中,术语“杂交”系指互补核酸的配对。杂交和杂交强度(例如核酸之间结合的强度)受多种因素的影响,例如核酸之间互补的程度、使用杂交条件的严格程度、所形成杂交体的解链温度(tm)以及核酸的gc含量值。虽然本发明不受限于具体的杂交条件,但优选使用严格的杂交条件。严格的杂交条件取决于序列并随杂交参数(例如盐浓度、有机物存在等)而变化。通常,“严格的”条件选择为在规定的离子强度和ph下低于特定核酸序列的tm约5℃到约20℃。优选地,严格的条件为低于结合互补核酸的具体核酸的温度熔点约5℃到10℃。所述tm是50%核酸(例如目标核酸)与完全配对探针杂交的温度(在规定的离子强度和ph下)。在本文中,“严格的条件”,例如可为50%甲酰胺,5×ssc(0.75mnacl,0.075m柠檬酸钠),50mm磷酸钠(ph6.8),0.1%焦磷酸钠,5×denhardt溶液、超声波处理的鲑鱼精子dna(50mg/ml),0.1%sds,以及10%硫酸葡聚糖在42℃下杂交,在42℃以0.2×ssc(氯化钠/柠檬酸钠)和在55℃以50%甲酰胺洗涤,然后在55℃以含有edta的0.1×ssc洗涤。例如,预计包含35%甲酰胺、5×ssc和0.1%(w/v)十二烷基硫酸钠(sds)的缓冲液适合在适度非严格条件下在45℃杂交16-72小时。在本文中,术语“引物”系指寡核苷酸,无论天然存在经纯化、酶切后得到的或者经合成方法产生的,当置于诱导与核酸链互补的引物延伸产物的合成的条件下(例如在核苷酸和诱导试剂例如dna聚合酶存在下,并在合适的温度和ph下),能够作为合成的起点。所述引物优选为具有最大扩增效率的单链。优选地,所述引物为寡脱氧核苷酸。所述引物必须足够长以在所述诱导试剂存在下引发延伸产物的合成。所述引物的确切长度取决于很多因素,包括温度、引物来源和所使用方法。在本文中,术语“探针序列”系指寡核苷酸(例如核苷酸序列),无论天然存在经纯化、酶切后得到的或者经合成、重组或pcr扩增产生的,能够与另一目标寡核苷酸例如目标核酸序列的至少一部分杂交。探针可为单链或双链。探针可用于特定基因序列的检测、鉴别和分离。在本文中,术语“目标核酸分子”是指来自目标基因组区域的分子或序列。预选的探针确定了目标核酸分子的范围。因此,所述“目标”试图与其它核酸序列区分出来。一个“片段”定义为所述目标序列中的一个核酸区域,如作为核酸序列的一个“片段”或一“部分”。在本文中,术语“分离”当用于涉及核酸时,如用于“分离核酸”时,系指核酸序列从其天然来源通常结合的至少一种其他组分或污染物中被鉴别并分离出来。分离的核酸以不同于其天然存在的形式存在。相反,未分离的核酸例如dna和rna的核酸以其天然存在的状态存在。所述分离的核酸、寡核苷酸或多核苷酸可以单链形式或双链形式存在。在本发明的实施方案中,用于在本文所述的方法、引物组和试剂盒中使用的引物包含连接化合物,例如结合部分。结合部分包含任何连接或引入用于随后捕获核酸扩增产物的扩增引物的5’端的部分。结合部分为引入引物序列5’端的任何序列,例如可捕获的6组氨酸(6his)序列。例如,包含6his序列的引物可被镍捕获,例如在镍包被或包含镍包被珠子、颗粒等的管子、微孔、或纯化柱中,其中所述珠子包装入柱子中,样品装入并通过柱子以捕获复杂度降低的复合物(例如,和随后的目标洗脱)。用于本发明的实施方案的另一种结合部分的实例包括半抗原,例如地高辛,例如其连接到扩增引物的5’端。地高辛可使用地高辛抗体捕获,例如包被或包含抗地高辛抗体的基质。在某些实施方案中,所述结合部分为生物素,用链霉亲和素包被所述捕获基质,例如珠子如顺磁颗粒,用于从非特异性杂交目标核酸中分离所述扩增产物。例如,当生物素为结合部分时,链霉亲和素(sa)包被的基质,例如sa包被的珠子(例如磁珠/颗粒)用于捕获所述生物素标记的扩增产物。洗涤所述sa结合的复合物,所杂交的目标核酸从所述扩增产物洗脱进行测序。可使用无掩膜阵列合成技术在固体载体上并行提供序列中与所述基因组至少一个区域对应的引物序列。替代性地,引物序列可使用标准dna合成仪连续获得并应用到所述固体载体,或可从有机体获得并固定于所述固体载体。扩增之后,非扩增产物的核酸通过洗涤从所述载体结合的扩增产物中分离。例如在热水中或在包含例如tris缓冲液和/或edta的核酸洗脱缓冲液中从所述固体载体洗脱,以产生所述目标核酸分子富集的洗脱物。或者,用于目标分子的引物序列可如上所述在固体载体上合成,作为引物序列集合从所述固体载体释放并扩增。所释放的引物集合可共价或非共价固定于载体,例如玻璃、金属、陶瓷、或聚合珠子或其它固体载体。所述引物可设计为从所述固体载体方便释放,例如在最接近载体的核酸类似物末端或其附近提供酸或碱不稳定的核酸序列,其分别在低或高ph条件下释放所述引物。本领域已知多种可剪切的连接化合物。所述载体可以,例如,以具有液体进口和出口的圆柱提供。本领域熟悉将核酸固定到载体的方法,例如通过将生物素标记的核苷酸结合到所述引物中,并使用链霉亲和素包被所述载体,由此所述包被的载体非共价吸引并固定所述集合中的所述引物。所述样品在杂交条件下通过所述包含引物的载体,由此与所述固定载体杂交的扩增后的目标核酸分子可洗脱,用于之后的分析或其它用途。实施例1:本发明的方法的示例性步骤扩增样品中多个目标dna序列的方法包括以下步骤:1)提供包含目标dna序列和非目标序列的样本、本发明的特异性引物组和与所述特异性引物5’端通用序列互补的通用引物对;2)以所述引物组中的特异性引物进行第一轮多重pcr反应,扩增所述样本中的目标dna序列,所述pcr反应的退火温度按照从高到低的阶梯进行,在本实施例中一个退火过程中使用等差的3个温度(例如60℃、59℃、58℃)进行退火,并且扩增循环数小于10,第一轮多重pcr反应扩增多个目标区域dna序列以如下方式进行:在该轮pcr反应中,多对特异性引物放在同一反应体系中同时扩增多个目标区域序列,其中所有上游引物的3’端含有与目标区域序列互补的特异性序列,5’端含有通用序列1(gsp1:ctttccctacacgacgctcttccgatct(seqidno.1));所有下游引物的3’端含有与目标区域序列互补的特异性序列,5’端含有通用序列2(gsp2:ggagttcagacgtgtgctcttccgatct(seqidno.2)),上下游引物的3’端的碱基处均具有3或4个基团修饰,增加扩增的特异性;在本轮多重pcr反应中,反应体系的成分如下:ddh2o、pcr反应缓冲物、底物(dntp)、多重pcr引物混合物、样本基因组dna或cdna和高保真聚合酶。本轮多重pcr反应步骤包括如下三步:第一步预变性:95℃维持3.5min;第二步扩增:变性步骤在96-98℃下维持20s、梯度退火在66℃下维持1min、在65℃下维持1min和64℃下维持1min,延伸步骤在72℃下维持30s,第二步扩增根据模板的投入量扩增10-22个循环,退火时间根据扩增目标序列的个数而相应改变;第三步扩增在72℃下延伸5min,在本轮多重pcr反应中,采用梯度退火,使每对引物均能与模板高效互补结合,提高扩增效率,本实施例中如在一个退火过程中使用等差的3个温度(例如60℃、59℃、58℃)进行退火。本轮多重pcr反应结束后,得到多个目标区域序列的双链pcr产物。所述双链pcr产物的5’端包括通用序列1(gsp1),3’端包括通用序列2(gsp2)。采用核酸酶,如exonucleasevii、exonucleasei、mungbeannuclease、t7endonucleasei、nucleasebal-31、核酸酶p1、核酸酶s1、绿豆核酸酶等对所述双链pcr产物进行消化。采用agencourtampure磁珠对所述第一轮多重pcr反应的产物进行片段筛选和纯化,去除目标区域外的大片段、基因组dna、引物二聚体、引物和其他反应成分,得到包含目标区域序列的双链pcr产物;3)以通用引物进行第二轮pcr扩增反应,对第一轮多重pcr反应中得到的双链pcr扩增产物进行再次扩增,进一步富集双链pcr所述扩增产物;在所述第二轮pcr扩增反应的反应体系中,以第一轮多重pcr反应中纯化得到的包括目标区域序列的双链pcr产物为模板,以通用引物fgsp1(aatgatacggcgaccaccgagatctacactctttccctacacgac,seqidno.3)和rgsp2(caagcagaagacggcatacgagat******gtgactggagttcagacgtgt,seqidno.4)进行pcr扩增,其中fgsp1的3’端为通用序列1(gsp1),5端为通用序列3(aatgatacggcgaccaccgagatct,seqidno.5);rgsp2的3’端为通用序列2(gsp2),5’端为通用序列4(caagcagaagacggcatacgagat,seqidno.6),中间的6个“*”代表index序列,用于区分不同样本。index序列的设计原则是长度为6,两两之间确保至少两个碱基的差异。在所述第二轮pcr反应后,扩增得到的目标区域序列产物的5’端为通用引物序列fgsp1,3’端为通用引物序列rgsp2。采用agencourtampure磁珠对所述第二轮pcr反应的pcr产物进行纯化,去除其他成分,得到含通用引物序列fgsp1和通用引物序列rgsp2的目标区域序列产物;4)回收上一步富集的目标区域序列产物,进行上机测序。实施例2发明人随机选择人基因组上外显子和内含子上1000个位点用于测试本发明的方法,实验步骤按照实施例1的方法进行。表1:随机选择的1000个位点的染色体分布染色体个数染色体个数chr175chr1265chr240chr1320chr360chr1410chr4105chr1525chr555chr1635chr665chr1740chr730chr1810chr865chr1925chr930chr2035chr1065chr2115chr11100chr2230在本实施例中,基于santalucia2007热力学参数表的最邻近法计算tm。以下简要说明引物设计情况。(1)扩增产物长度在100-300bp的范围内随机选取,pcr引物分成多组,每组中2℃<tm标准差≤5℃、1℃<tm标准差≤2℃、tm标准差≤1℃;另外设对照组,未考虑tm标准差,组中存在tm标准差>5℃的情况;(2)选择部分引物(其他引物可以作为对照),在其序列的3’端-1、-2、-3处碱基、核糖或磷酸二酯键上增加修饰,脱氧次黄嘌呤(di)、脱氧尿嘧啶(du)、5-methyldc、2'-o-me-dc、磷酸基团、硫代基团、地高辛、生物素、aminolinkerc7、bhq1、bhq2、dabcyl、joe、rox、fam、tamra、烷基基团、氟代基团、氨基基团和thiol-c3s-s;(3)当引物序列的3’端的5个碱基的gc含量大于50%时,选取部分引物(其他引物作为对照)在其序列的3’端-4处碱基增加连接到脱氧核糖胞嘧啶的5’的甲基基团修饰(5-methyldc)、3’端-4处碱基增加连接到磷酸二酯键上硫代修饰基团、3’端-4处增加连接到脱氧核糖2’的氟代修饰基团、3’端-4处增加连接到磷酸二酯键上的脱氧次黄嘌呤(di)修饰基团或3’端-4处增加连接到磷酸二酯键上的脱氧尿嘧啶(du)修饰基团。其中,以上这些位置的基团修饰均是由引物合成公司通过有机化学方式合成得到。另外,对所有引物还进行如下分组:(1)tm(与目标产物)-tm(与非目标产物)≤5℃、5℃<tm(与目标产物)-tm(与非目标产物)≤10℃;tm(与目标产物)-tm(与非目标产物)>10℃;(2)tm(与目标产物)-tm(二聚体)≤5℃、5℃<tm(与目标产物)-tm(二聚体)≤10℃、tm(与目标产物)-tm(二聚体)>10℃;(3)tm(与目标产物)-tm(发卡结构)≤5℃、5℃<tm(与目标产物)-tm(发卡结构)≤10℃;tm(与目标产物)-tm(发卡结构)>10℃。检测结果,以捕获效率和100×覆盖度下的覆盖率来衡量检测结果,检测结果在后文以表格的形式给出,从这些数据表格中可以看出:1)tm标准差越小,捕获效率和覆盖率越高,但为了达到良好的捕获效率和100×覆盖率而又保证引物的设计空间,优选tm标准差≤2℃;2)大部分3’端引物修饰的捕获效率和覆盖率高于不修饰的对照组;3)当引物序列的3’端的5个碱基的gc含量大于50%时,引物序列的3’端-4处碱基硫代修饰的捕获效率和覆盖率高于不修饰的对照组;4)tm(目标产物)-tm(非目标产物)的差值越大,捕获效率和覆盖率越高,tm(目标产物)-tm(非目标产物)>10℃才可达到良好的捕获效率和100×覆盖率;5)tm(目标产物)-tm(二聚体)的差值越大,捕获效率和覆盖率越高,tm(目标产物)-tm(二聚体)>10℃才可达到良好的捕获效率和100×覆盖率;6)tm(目标产物)-tm(发卡结构)的差值越大,捕获效率和覆盖率越高,而且tm(目标产物)-tm(发卡结构)>5℃即可达到良好的捕获效率和100×覆盖率,同时保证比>10℃较多的候选引物可以选择。优选地,tm(目标产物)-tm(非目标产物)>10℃,tm(目标产物)-tm(二聚体)>10℃,tm(目标产物)-tm(发卡结构)>5℃。其中,对照指的是不做任何修饰的正常引物,用于与相应试验组数据进行比较。结果如下:表2.组中存在tm标准差对检测结果的影响引物特点捕获效率100x覆盖率tm标准差≤1℃80.01%84.37%1℃<tm标准差≤2℃76.34%78.80%2℃<tm标准差≤5℃71.24%72.02%tm标准差>5℃60.27%64.99%表3.引物序列的3’端-1、-2、-3处碱基修饰对检测结果的影响表4.当引物序列的3’端的5个碱基的gc含量大于50%时,引物序列的3’端-4处碱基硫代修饰对检测结果的影响引物特点捕获效率100×覆盖率3’端-4处氟代基团93.10%100%3’端-4处甲基修饰89.23%98.87%3’端-4处碱基硫代82.77%91.15%3’端-4脱氧尿嘧啶(du)90.92%99.57%3’端-4脱氧次黄嘌呤(di)94.03%99.91%对照(正常引物)79.21%84.09%表5.引物特异性对检测结果的影响引物特点捕获效率100×覆盖率tm(目标产物)-tm(非目标产物)≤5℃62.35%67.03%5℃<tm(目标产物)-tm(非目标产物)≤10℃70.01%73.45%tm(目标产物)-tm(非目标产物)>10℃78.84%82.47%表6.引物二聚体对检测结果的影响引物特点捕获效率100×覆盖率tm(目标产物)-tm(二聚体)≤5℃45.21%50.74%5℃<tm(目标产物)-tm(二聚体)≤10℃61.27%68.17%tm(目标产物)-tm(二聚体)>10℃78.64%83.55%表7.引物发夹结构对检测结果的影响引物特点捕获效率100×覆盖率tm(目标产物)-tm(发卡结构)≤5℃64.28%68.36%5℃<tm(目标产物)-tm(发卡结构)≤10℃75.09%80.94%tm(目标产物)-tm(发卡结构)>10℃79.98%83.49%序列表<110>艾吉泰康生物科技(北京)有限公司<120>用于扩增样品中多个目标dna序列的引物组及其应用<130>cp20170647<160>6<170>patentinversion3.3<210>1<211>28<212>dna<213>人工序列<400>1ctttccctacacgacgctcttccgatct28<210>2<211>28<212>dna<213>人工序列<400>2ggagttcagacgtgtgctcttccgatct28<210>3<211>45<212>dna<213>人工序列<400>3aatgatacggcgaccaccgagatctacactctttccctacacgac45<210>4<211>51<212>dna<213>人工序列<220><221>misc_feature<222>(25)..(30)<223>nisa,c,g,ort<400>4caagcagaagacggcatacgagatnnnnnngtgactggagttcagacgtgt51<210>5<211>25<212>dna<213>人工序列<400>5aatgatacggcgaccaccgagatct25<210>6<211>24<212>dna<213>人工序列<400>6caagcagaagacggcatacgagat24当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1