用于制备dna文库的dna接头分子以及生产它们的方法和用图

文档序号:9816008阅读:920来源:国知局
用于制备dna文库的dna接头分子以及生产它们的方法和用图
【技术领域】
[0001]本发明涉及用于制备DNA文库的DNA接头分子以及生产它们的方法和它们的用途。 本发明可用于分子生物学中的应用,特别是用于下一代测序(Next Generation Sequencing)和/或文库复用(Library Multiplexing) 〇
【背景技术】
[0002] 下一代测序(NGS)是用于确定DNA或RNA序列的核碱基序列的现代技术。NGS的优点 (速度、经济效益、准确性)导致它在应对遗传信息的分析及其执行的所有学术机构中的占 有率不断增长。几个全球性公司提供NGS解决方案,包括Roche、Life Technologies和 Illumina。
[0003] 为了在一次运行中对大量样品进行测序,可以将已知序列的条形码添加到确定样 品并用于在测序后将序列指派到样品。
[0004] 用于多路测序(同时对大量不同样品进行测序)的方法、组合物和试剂盒公开在W0 2011156529 A2中。在一个反应室中对来自于两个或更多不同样品的多个靶多核苷酸进行 测序并且通过条形码鉴定每个被测序的靶多核苷酸所源自的样品。
[0005] 另一份公开了具有提高的样品通量的测序方法的文献是W0 2008061193 A2。其中 将接头序列(被称为标签序列)连接到样品,随后将样品混合并测序。
[0006] W0 2013033721 A1公开了为多路DNA测序优化条形码设计的方法。
[0007] US 2013059762 A1提供了可用于样品中存在的一种或多种核酸的多路PCR的方 法、组合物、试剂盒、系统和装置。具体来说,提供了各种不同的靶特异性引物,其允许选择 性扩增一个或多个靶序列。因此,在平末端连接反应中将接头连接到靶序列。
[0008] 在用于下一代测序(NGS)的DNA文库的制备期间,在大多数情况下通过物理或化学 方法将高分子dsDNA片段化,并将特异性针对测序平台的接头序列连接到产生的DNA分子。 一般来说,接头序列含有用于引物的结合位点,并可能含有条形码序列,其允许在混合物中 测序多个带条形码的DNA文库(多路)并随后将关于相应条形码的测序信息指派到原始样 品。
[0009] 在可以进行这种接头序列与片段的连接之前,必须修复在片段化期间随机且不可 预见地形成的DNA末端。通过聚合酶将突出的3'末端切除并将突出的5'末端填补成双链。随 后,通过激酶将片段的5'末端磷酸化。随后,将在一侧是平末端以允许在那里连接并且在另 一侧具有3'突出端以避免在那里连接的未磷酸化的DNA接头,在连接酶帮助下连接到产生 的DNA分子。由于未磷酸化的接头序列的连接不在接头的5'末端处导致磷酸二酯键的形成, 因此在连接后在DNA双链中留下缺口,失去的磷酸二酯键随后需要用能够进行缺口平移的 酶封闭。
[0010] 常用的接头序列不能被添加到末端修复混合物,这是因为末端修复混合物中的酶 将修饰它们,使得连接的方向性丢失,并且将形成接头二聚体和寡聚体。
[0011] 发明目的
[0012] 本发明的目的是改良接头序列以使它们可以在文库制备开始时已被添加到片段 化的DNA。本发明的另一个目的是避免接头二聚体和寡聚体的形成。

【发明内容】

[0013] 本发明公开了 DNA接头分子,其包含双链多核苷酸分子,其中
[0014] a.所述第一链的5 '末端被修饰成使得第一核苷酸不含游离羟基并且在5 '位置处 没有游离磷酸基团,使得没有用于激酶的结合位点可用,
[0015] b.所述第一链的3 '末端被修饰成使得最后一个核苷酸在3 '位置处不含游离羟基, 使得不能发生连接,
[0016] c.所述反向链的5 '末端被修饰成使得第一核苷酸不含游离羟基并且在5 '位置处 没有游离磷酸基团,使得没有用于激酶的结合位点可用,并且
[0017] d.所述反向链的3'末端以游离羟基(在最后一个核苷酸的3'位置处)为特点。
[0018]第一链和反向链通过互补碱基配对彼此退火,没有任何突出端(平末端)。优选地, 所述双链内的核苷酸,除了上面提到的3 '和5 '末端处的末端核苷酸之外,未被修饰。然而, 不排除所述双链含有具有对抗核酸酶的提高的稳定性的核苷酸,特别是具有修饰的骨架例 如硫代磷酸基团的核苷酸。优选地,两条链具有完全相同的长度(具有相同的核苷酸数目), 其中反向链的核苷酸序列是第一链的核苷酸序列的反向互补体。
[0019] 有利情况下,可以在DNA文库制备期间将符合本发明的DNA接头分子直接添加到片 段化的DNA。与现有技术相反,在这里,在添加符合本发明的DNA接头分子之前和添加连接酶 之前,不必失活末端修复酶。由于符合本发明的接头分子是平末端的,因此它们不是具有5 ' -3 '聚合酶活性和3 ' -5 '核酸外切酶活性的聚合酶例如T4 DNA聚合酶、T7 DNA聚合酶或 Pfu聚合酶的底物。
[0020] 此外,有利情况下,符合本发明的DNA接头分子被设计成使得酶连接只能在一个方 向上发生(在反向链的3 '末端的游离羟基处)。
[0021] 当在本文中使用时,术语"游离羟基"是指-OH或去质子化的-0'术语"游离磷酸基 团"在本文中用于描述去质子化的磷酸酯(-ΟΡΟ,)、磷酸一氢酯或磷酸二氢酯。
[0022]当在本文中使用时,术语"聚合酶"是指DNA依赖性DNA聚合酶,优选为具有5 ' -3 ' 聚合酶活性和3 ' -5 '核酸外切酶活性并优选地没有5 ' -3 '核酸外切酶活性的聚合酶。优选 的聚合酶是能够产生平末端的酶,例如T4聚合酶、T7 DNA聚合酶或Pfu聚合酶。
[0023] 当在本文中使用时,术语"激酶"是指多核苷酸5'-羟基激酶,其催化向多核苷酸分 子的游离5'_羟基末端添加磷酸基团。优选的激酶是T4激酶或T7激酶。
[0024] 当在本文中使用时,"多核苷酸分子"是由共价连接成链的13个或更多核苷酸单体 构成的生物聚合物。
[0025] 符合本发明的DNA接头分子优选地另外含有用于扩增和测序引物以及优选地条形 码序列的结合位点。
[0026] 条形码序列优选地具有3至20、更优选地4至8个碱基对的长度。优选地,条形码序 列位于第一链的5'末端附近。
[0027] DNA接头分子优选地具有20至90、更优选地30至70、最优选地40至60个碱基对的长 度。
[0028]第一和/或最后一个核苷酸不含游离羟基这一表述,意味着符合本发明的DNA接头 分子被修饰成使得在两条链的5'末端处正常存在的羟基或磷酸基团以及在反向链的3'末 端处正常存在的羟基被在这里称为"末端基团"的其它基团代替,这产生不是上述相应酶的 底物的修饰的核苷酸。优选地,这些末端基团独立地选自氢、被取代或未取代的烷基、烷氧 基氨基和其它已知的链终止物。不排除这些末端基团可以自身含有游离羟基或甚至游离磷 酸基团,因为这些基团不是所述酶的底物。
[0029] 符合本发明的DNA接头分子优选地被修饰成使得两条链的5 '末端和第一链的3 '末 端含有链终止物。
[0030] 用于3'末端以及5'末端的链终止物对于本领域技术人员来说是公知的。在反向链 的5'末端和第一链的3'末端处,可以选择任何可能的链终止物来分别阻断游离的3'_0H或 5,-OH 〇
[0031] 用于第一链的3'末端的链终止物的优选实例是2'3'_双脱氧核苷酸(式1)或优选 地如式2中所示的3'-修饰的脱氧核苷酸:
[0032]
[0033] 其中B =核碱基,优选地选自腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T),并 且Μ选自NH2-L,其中L优选地选自直链或支链的C1至C6烷基,优选为C3或C4烷基,
[0034] 其中5'、#0是连接到DNA接头分子的第一链的以3 ' -5 '方向前进的核苷酸序列 的共价键。
[0035] 用于5'末端的链终止物的优选实例是醚化的脱氧核苷酸(式3)、4'_氨基-脱氧核 苷酸(式4)和5'-氨基-脱氧核苷酸(式5),例如:
[0036]
[0037] 其中B =如上选择的核碱基,并且优选地R = C1至C3烷基,更优选为CH3,
[0038] 其中0-3 '是连接到DNA接头分子的第一链或反向链的以5 ' -3 '方向前进的核苷 酸序列的共价键。
[0039] 优选地,
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1