跨膜测序中用于核酸构建体的衔接体的制作方法

文档序号:391989阅读:499来源:国知局
专利名称:跨膜测序中用于核酸构建体的衔接体的制作方法
技术领域
本发明涉及用于测序核酸的衔接体。所述衔接体可用于生成用于测序目的的单链核酸构建体。所述构建体可含有双链脱氧核糖核酸(DNA)或核糖核酸(RNA)模板的全部两条链。本发明还涉及使用所述衔接体生成的构建体,制备所述衔接体和构建体的方法,以及测序双链核酸的方法。
背景技术
随机检测是一种依赖于对分析物分子与受体之间的各个结合事件进行观察的传感方法。随机传感器可通过如下方式形成将纳米尺寸的单孔置入绝缘膜中,并且在存在分析物分子的情况下测量电压驱动的穿过所述孔的离子转运。电流波动的发生频率揭示在所述孔中结合的分析物的浓度。分析物的种类通过其特征性的电流特征特别是电流阻断的持续时间和程度而示出(Braha, 0.,Walker, B.,Cheley,S.,Kasianowicz, J. J.,Song, L., Gouaux, J. Ε. , and Bayley, H. (1997) Chem. Biol. 4,497-505 ;and Bayley, H. , and Cremer, P. S. (2001)Nature 413,226-230) 形成细菌孔的毒素α-溶血素(α-HL)的基因工程改造形式已用于对许多类型的分子进行随机传感(Bayley,H.,and Cremer, P. S. (2001) Nature413, 226-230 ;Shin, S., H. , Luchian, Τ. , Cheley, S. , Braha, 0. , and Bayley, H. (2002)Angew. Chem. Int. Ed. 41, 3707-3709 ;Guan, X. , Gu, L. -Q. , Cheley, S. , Braha, 0. , and Bayley, H. (2005) ChemBioChem 6,1875-1881)。在这些研究的过程中,已发现,将α-HL改造以直接结合小的有机分析物的尝试是很费力的,并且鲜有成功的实例(Guan,X.,Gu, L. -Q.,Cheley,S.,Braha, 0.,and Bayley, H. (2005)ChemBioChem 6,1875-1881)。幸运的是,人们发现了一种不同的策略,该策略利用了非共价结合的分子衔接体,特别是环糊精(Gu,L.-Q.,Braha, 0.,Conlan, S., Cheley, S. , and Bayley, H. (1999)Nature 398,686-690)、环肽(Sanchez-Quesada, J., Ghadiri, Μ. R.,Bayley, H.,and Braha, 0. (2000) J. Am. Chem. Soc. 122,11758-11766)和 ^1^11 (cucurbituril) (Braha, 0. , Webb, J. , Gu, L. -Q. , Kim, K. , and Bayley, H. (2005) ChemPhysChem 6,889-892)。环糊精可短暂地进入所述α-HL孔中,并产生很大程度但不完全的通道阻断。有机分析物结合于环糊精的疏水内部,它们可加强这种阻断,使得可实现分析物检测(Gu, L. -Q.,Braha, 0.,Conlan, S.,Cheley, S.,and Bayley, H. (1999) Nature 398,686-690)。现在,在广泛的应用中需要快速且廉价的DNA或RNA测序技术。现有的技术速度慢且价格昂贵,这主要是由于其倚赖于扩增技术来产生大量核酸并且需要大量专用的荧光化学物质用于信号检测。随机传感有可能通过减少所需核苷酸和试剂的量提供快速且廉价的DNA测序。

发明内容
发明人令人惊讶地证明,人工的、可鉴定的衔接体可用于生成含有双链核酸模板的全部两条链的单链核酸构建体。所述模板的两条链通过衔接体共价连接并分隔(分开)。 所述衔接体不仅使得可鉴定一条链到另一条链的转接点,而且使得可在对所述构建体进行测序之前先将其纯化。所述衔接体还使得所述构建体与所述链具有不同来源的相似构建体区分。因此,所述衔接体使得可对来源于不同个体源的模板进行多重序列分析。所述衔接体特别可用于测序双链DNA (dsDNA)和双链RNA (dsRNA)。所述衔接体可用于生成含有所述dsDNA或dsRNA的正义链和反义链的单链构建体。所述衔接体通常成对使用。所述对中的全部两种类型的衔接体不仅均包含构成半个回文切割位点的双链核酸区,而且是彼此可差异选择的。每一对包含两种类型的衔接体 I型和II型。I型衔接体包含发夹环,其使得双链核酸模板中的两条链可共价连接。II型衔接体可包含发夹环,但不是必须的。这种特征组合使得可生成和纯化其中双链核酸模板的两条链通过I型衔接体共价连接的单链构建体。通过衔接体相互连接形成的不需要的构建体可使用回文切割位点从反应混合物中除去。类似地,含有所述两种类型的衔接体之一的构建体可使用所述衔接体的差异选择性从反应混合物中分离。因此,本发明提供了用于测序核酸的衔接体,其包含双链核酸区,其中该区的至少一个末端构成半个回文切割位点,并且其中所述衔接体与另一衔接体可差异地选择。在某些实施方案中,所述区通过单链核酸的两个不同区之间杂交形成并且所述衔接体包含发夹环。本发明还提供了 -衔接体对,其包含通过单链核酸的两个不同区之间杂交形成并且包含发夹环的本发明衔接体(I型)以及本发明衔接体(II型),其中所述对中每种类型的衔接体与另一类型是可差异选择的,并且其中如果所述两种类型的衔接体任意组合彼此连接,那么就形成完整的回文切割位点;-包含至少两群本发明衔接体的试剂盒,其中每群中的每个衔接体均包含对该群特异的核酸序列;-用作测序模板的核酸构建体,其包含与至少一个本发明衔接体连接的双链核酸;-用作测序模板的单链核酸构建体,其包含通过本发明衔接体共价连接的两条核酸链,所述衔接体通过单链核酸的两个不同区之间杂交形成并且包含发夹环;-包含两条核酸链的用作测序模板的环状核酸构建体,所述两条核酸链在每个末端通过本发明衔接体共价连接,所述衔接体通过单链核酸的两个不同区之间杂交形成并且包含发夹环;-一种制备本发明衔接体的方法,包括(a)提供两个核酸,所述核酸(i)能够彼此杂交形成半个回文切割位点,并且(ii) 可与另一种衔接体的核酸差异地选择;以及(b)使所述核酸在使得它们可杂交的条件下接触,从而制备衔接体;-一种制备通过单链核酸的两个不同区之间杂交形成并且包含发夹环的本发明衔接体的方法,包括(a)提供单链核酸,其包含(i)能够彼此杂交的两个区,( )可与另一种衔接体的核酸差异选择的环形成区和(iii) 一起构成半个回文切割位点的两个末端;以及
(b)使所述核酸暴露于使得所述两个区可杂交并形成发夹环的条件下,从而制备衔接体;-一种制备本发明核酸构建体的方法,包括(a)使至少一个本发明衔接体与两条核酸链在使得所述衔接体与所述链之间可连接的条件下接触;以及(b)使所述衔接体与所述两条链连接,从而制备核酸构建体;-一种制备本发明单链核酸构建体的方法,包括(a)使通过单链核酸的两个不同区之间杂交形成并包含发夹环的本发明衔接体与两条核酸链在使得所述衔接体与所述链之间可杂交的条件下接触;(b)使得所述衔接体共价连接所述两条链;以及(c)使所述共价连接的构建体变性,从而制备单链核酸构建体;-一种用于制备本发明环状核酸构建体的方法,包括(a)使至少两个包含发夹环的本发明衔接体与两条核酸链在使得所述衔接体与链之间可连接的条件下接触;以及(b)使衔接体与所述两条链在每个末端共价连接,从而制备环状核酸构建体;-一种制备测序构建体的方法,包括(a)提供双链核酸;(b)使所述双链核酸与本发明衔接体对在使得所述衔接体与所述核酸可连接的条件下接触,其中I型衔接体不能被切割或缺刻,II型衔接体能够被切割或缺刻;(c)使所连接的产物与特异性结合所述II型衔接体的表面接触,并除去任何未结合的产物;(d)使所述表面与识别所述完整回文切割位点的酶接触,并除去任何未结合的产物;(e)切割所述II型衔接体;(f)使在步骤(e)中产生的可溶解产物与特异性结合所述I型衔接体的表面接触, 并除去任何未结合的产物;以及(g)从所述表面释放在步骤(f)后剩余的产物,从而产生测序构建体;-一种测序双链核酸的方法,包括(a)进行本发明的方法;(b)根据需要,使所述构建体变性以形成单链构建体;以及(c)测序所述单链构建体,从而测序所述双链核酸;以及-用于测序双链核酸的试剂盒,其包含本发明的衔接体对和用于切割所述回文切割位点的工具。


图1示出了 I型衔接体的一个实施方案。所述单链DNA具有自互补性,使得其可与自身杂交,产生单链DNA的大发夹环,其用于在纯化过程中选择性结合“ I型衔接体”连接产物。所述自杂交的衔接体的末端编码第一限制性核酸内切酶识别序列的一半(箭头所指,Γ0,用于切割通过衔接体衔接体(不管是I型1型、I型11型还是II型11型)连接形成的任何连接产物。图2示出了 II型衔接体的一个实施方案。在此图和所有后续图中,所述II型衔接体均包含发夹环。所述单链DNA间有Biotin-dT碱基(爆炸星),所述Biotin-dT碱基在所述链自杂交时位于所述单链的“泡”区。此生物素是仅那些包括II型衔接体的连接产物的选择性特征。此衔接体的双链元件包括第二限制性核酸内切酶的识别序列并且(与I型衔接体一样)末端为第一限制性核酸内切酶识别序列的一半,以能够除去如前所述的衔接体衔接体连接产物。图3示出了两种类型的发夹衔接体(黑色1型;深灰11型)与平端模板 dsDNA(浅灰)结合。A框示出了一个I型和一个II型衔接体连接到介于其间的模板DNA 序列的任一端的理想情况。B框绘出了,如果没有介于其间的模板,则会生成不需要的连接产物。所述连接产物内存在第一 RE限制性识别位点(实线框)可用于选择性破坏所述不需要的连接产物。另一个位于II型衔接体内的第二 RE限制性位点(虚线框)用于释放所述测序模板(见下文)。“B”标识存在II型衔接体的单链元件上包括的生物素部分。图4示出了闭合的环状“DNA哑铃”的产生始于大分子量模板DNA的常规随机片段化。仅一部分所产生的片段携带在全部两条链上悬挂有可延伸的3’0H,其可被DNA聚合酶末端修复。仍有少量修复的片段还会在全部两条链上具有5’ PO4末端。尽管数量不多,然而任何这样的平端片段均可接受人工发夹环衔接体的连接,这会形成对核酸外切酶在全部两条链上测序必需的闭合环状模板。图5示出了连接后的I型和II型衔接体。用于测序的所需产物可使用示出的方法进行纯化黑线代表“I型”衔接体;深灰线代表生物素化的“II型”衔接体;浅灰线标识模板DNA。交叉线箭头标识不转移至新板的操作。空箭头标识将之前孔的内含物转移至新板。(1)连接后,将产物吸至固定有链亲和素的板中。只有带有生物素化的II型衔接体的连接产物会结合。(2)洗涤所述板会除去所有I型/I型连接产物等。(3)用“连接于衔接体的衔接体”第一限制性核酸内切酶孵育会切割“衔接体/衔接体”产物。(4)从所述第一 RE消化中洗掉所有限制性内切碎片。( 用“II型衔接体”编码的第二限制性核酸内切酶孵育会切割结合的II型衔接体产物。(6)将第二 RE消化产物转移至新板,在所述新板上已固定化与I型单链发夹“泡”互补的ssDNA。使得来自(5)的RE片段与所述固定化的ssDNA 杂交。(7)洗掉任何未结合的物质,只剩下保留作为所需“连接于模板DNA的I型衔接体” 的物质。( 使用破坏所述连接产物与所述固定化DNA的杂交的条件(加热、NaOH或任何其他本领域已知的方式),将所需产物转移至进行后续变性和测序的新管/板。图6示出了用识别II型接头中的杂交区的酶处理捕获的哑铃结构(图1,A)释放如此处所绘的共价闭合的结构(左)。用变性剂处理此结构生成易被核酸外切酶I消化的单链结构(右),如果进行所述核酸外切酶I消化持续会释放要检测的DNA上的核苷酸、连接人工序列核苷酸以及反向互补核苷酸,这些核苷酸可与已经进行的碱基访问进行比较。 所述访问的组合产生更高质量的一致访问。图7示出的实例为从所述板回收的单链产物被核酸外切酶消化以释放引起流过衔接体修饰的α-HL蛋白孔的电流变化的5’单磷酸核苷。其中所述“碱基”被释放和鉴定的顺序是相继的。序列表说明
SEQ ID NO 1示出了编码野生型溶血素(α -HL)的一个亚基的多核苷酸序列。SEQ ID NO :2示出了野生型α-HL的一个亚基的氨基酸序列。氨基酸2_6、 73-75,207-209,214-216 和 219-222 构成 α -螺旋。氨基酸 22-30、35-44、52-62、67_71、 76-91、98-103、112-123、137-148、154-159、165-172、229-235、243-261、266-271、285-286 和291-293构成β -链。所有其他非末端氨基酸,即7-21、31-34、45-51、63-66、72、92-97、 104-111、124-136、149-153、160-164、173-206、210-213、217、218、223-228、236-242、 262-265,272-274和287-290构成环区。氨基酸1和四4为末端氨基酸。SEQ ID NO :3示出了编码α-HL Ml 13R/N139Q(HL-RQ)的一个亚基的多核苷酸序列。SEQ ID Ν0:4 示出了 α-HL Ml 13R/N139Q(HL-RQ)的一个亚基的氨基酸序列。在野生型α-HL中构成α-螺旋、β _链和环区的相同氨基酸在此亚基中构成相应的区域。SEQ ID NO 5示出了来源于大肠杆菌的sbcB基因的密码子优化的多核苷酸序列。 其编码大肠杆菌的核酸外切酶I (EcoExoI)。SEQ ID NO :6示出了大肠杆菌的核酸外切酶I (EcoExoI)的氨基酸序列。此酶以 3,到5,方向从单链DNA(ssDNA)持续消化5,单磷酸核苷。氨基酸60-68、70-78、80_93、 107-119、124-128、137-148、165-172、182-211、213-221、234-241、268-286、313-324、 326-352、362-370、373-391、401-454 和 457-475 构成 α -螺旋。氨基酸 10-18,28-26, 47-50、97-101、133-136、229-232、243-251、258-263、298-302 和 308-311 构成 β-链。 所有其他非末端氨基酸 19-27、37-46、51-59、69、79、94-96、102-106、120-123、口9-132、 149-164、173-181、212、222-228、233、242、252-257、264-267、287-297、303-307、312、325、 353-361、371、372、392-400、455和456构成环。氨基酸1_9为末端氨基酸。所述酶的整体折叠使得三个区域联合形成字母C外形的分子,但无序分布在所述晶体结构中的残基 355-358有效地将此C形转化为类0形。氨基末端(1-206)构成核酸外切酶结构域并与DnaQ 超家族具有同源性,如下残基(202-354)构成SH3样结构域并且羧基结构域(359-475)伸出所述核酸外切酶结构域,以形成C形的该分子。EcoExoI的4个酸性残基与DnaQ超家族的活性位点残基是保守的(对应于D15、E17、D108和D186)。已经提出,单个金属离子被残基D15和108结合。DNA的水解似乎通过活性水分子对易切断的磷酸基的攻击进行催化,以 H181为催化残基并对齐所述核苷酸底物。SEQ ID NO 7示出了来源于嗜热栖热菌(T. thermophilus)的recj基因的密码子优化的多核苷酸序列。其编码嗜热栖热菌的RecJ酶(TthRecJ-cd)。SEQ ID NO :8示出了嗜热栖热菌的RecJ酶(TthRecJ-cd)的氨基酸序列。此酶以5’到3’方向从单链DNA持续消化5’单磷酸核苷。酶在链上的启动需要至少4个核苷酸。氨基酸 19-33、44-61、80-89、103-111、136-140、148-163、169-183、189-202、207-217、 223-240、242-252、254-287、302-318、338-350 和 365-382 形成 α -螺旋。氨基酸 36-40、 64-68、93-96、116-120、133-135、294-297、321-325、328-332、352-355 和 359-363 构成 β _ 链。所有其他非末端氨基酸 34、35、41-43、62、63、69-79、90-92、97-102、112-115、 121-132、141-147、164-168、184-188、203-206、218-222、241、253、288-293、298-301、319、 320、326、327、333-337、351-358和364构成环。氨基酸1-18和383-425为末端氨基酸。仅对嗜热栖热菌(Thermus thermophilus)的RecJ的核心结构域(残基40-463)解析了晶体结构。为确保启动所述RecJ核心结构域的翻译和体内表达,在其氨基末端添加一个甲硫氨酸残基,这不包含在晶体结构信息中。所解析的结构示出了由一个长α -螺旋(254487)连接的两个结构域氨基区(2-25 和羧基区088-463)。催化残基(D46、D98、H122和D183) 配位单个二价金属离子用于对磷酸二酯键进行亲核攻击。D46和H120被认为是催化对 ’然而,在大肠杆菌的RecJ中突变这些保守残基的任一个均显示会完全破坏活性。SEQ ID NO 9示出了 I-SceI归巢(homing)核酸内切酶识别位点的序列。SEQ ID NO :10示出了可从中产生优选的核酸接头的核酸序列。SEQ ID NO :11示出了优选的核酸接头。MAL是马来酰亚胺。所述接头与SEQ ID NO: 14结合使用。SEQ ID NO :12示出了优选的核酸接头。MAL是马来酰亚胺。所述接头与SEQ ID NO: 15结合使用。SEQ ID NO :13示出了优选的核酸接头。MAL是马来酰亚胺。所述接头与SEQ ID NO 16结合使用。SEQ ID NO 14示出了优选的15mer的核酸接头。MAL是马来酰亚胺。所述接头与 SEQ ID NO 11互补并与SEQ ID NO 11结合使用。SEQ ID NO 15示出了优选的15mer的核酸接头。MAL是马来酰亚胺。所述接头与 SEQ ID NO 12互补并与SEQ ID NO 12结合使用。SEQ ID NO 16示出了优选的15mer的核酸接头。MAL是马来酰亚胺。所述接头与 SEQ ID NO 13互补并与SEQ ID NO 13结合使用。
具体实施例方式应理解,所公开的产物和方法的不同用途可根据本领域的具体需要进行调整。还应理解,本文所用的术语只是为了描述本发明的具体实施方案的目的,而非意图进行限制。此外,除非上下文另有清楚的指明,否则本说明书和所附权利要求书中所用的单数形式“a”、“an”和“the”也包括复数指代物。因此,例如,提及“a construct"时也包括 “constructs”,提及“a transmembrane”时包括两个或更多个这类孔,提及“a molecular adaptor"时包括两个或多个所述衔接体,等等。本文中——无论在上文还是下文——引用的所有出版物、专利和专利申请均以引用的方式全文纳入本文。衔接体本发明提供了用于测序核酸的衔接体。所述衔接体包含双链核酸区。该区的至少一端构成半个回文切割位点。所述衔接体与其他衔接体是可差异选择的。在某些实施方案中,所述区通过单链核酸的两个不同区之间杂交形成并且所述衔接体包含发夹环。本发明的衔接体通常作为衔接体对的一部分使用。本发明的衔接体具有多个优点。所述衔接体有助于所需单链测序构建体——其包含双链核酸模板的全部两条链——的构建、纯化和最终释放。这确保了在对所述构建体进行测序时,所述双链核酸中的每个位置都不仅观测一次,而是实际上被检测两次。这更加确定所述核酸中的每个位置都被观测,并且对每个位置上的两个碱基的累积访问具有比单次观测更高质量的值。换言之,本发明衔接体的关键优点是它们使得双链模板的每个“碱基对”位置可有效检测两次,作为相同“读取事件”的一部分。因此,这确保了所生成的序列的质量非常高,并且错误鉴定的碱基访问或完全遗漏碱基的可能性降低。这特别有助于测序dsDNA或dsRNA。本发明的衔接体使得可产生含有dsDNA和 dsRNA的正义链和反义链的构建体。所述dsDNA或dsRNA的每个“碱基对”位置可被有效检测两次一次在正义链上,一次在反义链上。这种检测每个位置两次的能力在使用随机传感测序核酸时尤其重要。这种测序通常倚赖所述跨膜孔对每个碱基的依次捕获和足够高的取样速率,以实现对流过所述孔的电流减小程度的精确测定。能够对每个碱基有效检测两次降低了以足够高的速率捕获每个碱基的要求。此外,本发明衔接体使得所述核酸可以以适于随机传感的形式提供。只有单链核酸可以穿过跨膜孔。此外,许多核酸操作酶——其是本文所述测序方法的组成部分——能够只操作单链核酸。所述对每个位置检测两次的能力还有助于使用随机传感区分甲基胞嘧啶和胸腺嘧啶。这两个碱基在它们穿过跨膜孔并与跨膜孔相互作用时产生非常类似的电流示踪线。 因此难以区分两者。然而,对核酸中每个位置检测两次会使得可进行所述区分,因为甲基胞嘧啶的互补碱基是鸟嘌呤,而胸腺嘧啶的互补碱基是腺嘌呤。甲基胞嘧啶当然与多种疾病有关,包括癌症。作为人工序列,本发明衔接体在其实际序列中具有很大程度的灵活性,因此可将功能性构建在所用的序列中。例如,可将衔接体特异性序列构建在每个衔接体中。这使得含有具体衔接体的构建体可与含有不同衔接体的构建体区分。这特别有助于对来源于不同个体源的模板的多重序列分析。所述衔接体可用于测序核酸。所述衔接体优选用于通过生成含有双链核酸模板全部两条链的单链核酸构建体测序所述双链核酸。所述衔接体更优选用于通过生成含有 dsDNA或dsRNA的正义链和反义链的单链核酸构建体测序所述dsDNA或dsRNA。双链核酸区所述衔接体包含双链核酸区。存在此区意味着本发明衔接体能够连接其他双链核酸,例如dsDNA或dsRNA。本发明衔接体还能够连接其自身或其他类型的衔接体。如下文更详细描述的,这种连接会导致完整回文切割位点的形成。使得本发明衔接体可与双链核酸或其自身连接的合适条件在下文讨论。所述双链核酸区可包含任何类型的核酸。核酸是一种包含两个或更多个核苷酸的大分子。所操作的核酸可包含任何核苷酸的任意组合。所述核苷酸可为天然的或人工的。 核苷酸通常含有核碱基、糖和至少一个磷酸基团。所述核碱基通常是杂环。核碱基包括但不限于嘌呤和嘧啶,更具体是腺嘌呤、鸟嘌呤、胸腺嘧啶、尿嘧啶和胞嘧啶。所述糖通常为戊糖。核苷酸糖包括但不限于核糖和脱氧核糖。所述核苷酸通常为核糖核苷酸或脱氧核糖核苷酸。所述核苷酸通常含有单磷酸基、二磷酸基或三磷酸基。磷酸基可连接在核苷酸的5’ 或3’侧。核苷酸包括但不限于单磷酸腺苷(AMP)、二磷酸腺苷(ADP)、三磷酸腺苷(ATP)、 单磷酸鸟苷(GMP)、二磷酸鸟苷(GDP)、三磷酸鸟苷(GTP)、单磷酸胸苷(TMP)、二磷酸胸苷 (TDP)、三磷酸胸苷(TTP)、单磷酸尿苷(UMP)、二磷酸尿苷(UDP)、三磷酸尿苷(UTP)、单磷酸胞苷(CMP)、二磷酸胞苷(CDP)、三磷酸胞苷(CTP)、环单磷酸腺苷(cAMP)、环单磷酸鸟苷(cGMP)、单磷酸脱氧腺苷(dAMP)、二磷酸脱氧腺苷(dADP)、三磷酸脱氧腺苷(dATP)、单磷酸脱氧鸟苷(dGMP)、二磷酸脱氧鸟苷(dGDP)、三磷酸脱氧鸟苷(dGTP)、单磷酸脱氧胸苷(dTMP)、二磷酸脱氧胸苷(dTDP)、三磷酸脱氧胸苷(dTTP)、单磷酸脱氧尿苷(dUMP)、二磷酸脱氧尿苷(dUDP)、三磷酸脱氧尿苷(dUTP)、单磷酸脱氧胞苷(dCMP)、二磷酸脱氧胞苷 (dCDP)和三磷酸脱氧胞苷(dCTP)。所述核苷酸优选是AMP、TMP、GMP、UMP、dAMP、dTMP、dGMP 或 dCMP。所述核酸可为脱氧核糖核酸(DNA)或核糖核酸(RNA)。所述核酸可包括本领域已知的任意合成核酸的两条链,例如肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核酸 (LNA)或其他具有核苷酸侧链的合成聚合物。当测序双链核酸模板时,选择所述衔接体中的核酸,使得所述衔接体能够连接于要测序的双链核酸。所述双链核酸区可为任意长度,只要在两个衔接体连接在一起时所述回文切割位点具有功能。所述区的长度通常为40个或更少的碱基对,例如30个或更少的碱基对,20个或更少的碱基对或者10个或更少的碱基对。所述区的长度优选为5到20个碱基对,更优选6到10个碱基对。所述区可通过杂交两条不同的单链核酸链形成。所述两条不同的链可为相同类型的核酸,也可为不同类型的核酸,只要它们杂交。所述两条不同的链可为上述任何类型的核酸。使得核酸杂交的合适条件在下文更详细地讨论。所述双链核酸区优选通过以下方式形成单链核酸的两个不同区杂交,使得所述衔接体包含发夹环。在本发明文中,I型衔接体包含发夹环。这使得I型衔接体可共价连接双链核酸模板的两条链。II型衔接体可包含发夹环,也可不包含发夹环。II型衔接体优选包含发夹环。发夹环的形成为本领域所知。所述发夹环通常由单链核酸构成。所述发夹环可为与构成所述双链核酸区的核酸相同类型的核酸。或者,所述发夹环可为与构成所述双链核酸区的核酸不同类型的核酸。所述发夹环可为上述任意类型的核酸。如在下文详细讨论的,所述发夹环可参与本发明衔接体的差异选择性。例如,所述发夹环可包含可选择的结合部分。所述发夹环可为任意长度。所述发夹环的长度通常为50个或更少的碱基,例如40 个或更少的碱基,30个或更少的碱基,20个或更少的碱基或者10个或更少的碱基。所述发夹环的长度优选约1-50个、2-40个或6-30个碱基。如果所述环参与所述衔接体的差异选择性,那么所述发夹环优选更长的长度,例如15-50个碱基。类似地,如果所述环不参与所述衔接体的差异选择性,那么所述发夹环优选更短的长度,例如1-5个碱基。在无发夹环的衔接体中,所述双链核酸区具有两个自由末端。这些末端的一个或两个都可连接于双链核酸模板。至少一个末端构成半个回文切割位点。两个末端优选均构成相同半个回文切割位点。一个或两个末端还可参与本发明衔接体的差异选择性。优选地, 所述衔接体的一个末端可连接于双链核酸模板并构成半个回文切割位点,并且另一个末端参与所述衔接体的差异选择性。在有发夹环的衔接体中,所述双链核酸区仅具有一个自由末端。另一末端由所述发夹环闭合。所述自由末端不仅构成半个回文切割位点,而且可连接于双链核酸模板。所述双链核酸区的自由端可以为任意形式。所述末端可为粘性的。换言之,所述末端不必须形成碱基对。所述粘性末端可具有5’或3’悬突。所述末端优选为平端。换言之,所述末端优选形成碱基对。所述区构成半个回文切割位点的末端特别优选为平端。在无发夹环的衔接体中,连接于双链核酸模板并构成半个回文切割位点的末端优选为平端,并且参与所述衔接体的差异选择性的另一个末端为粘性末端。半个回文切割位点回文切割位点是核酸中可以以某种方式进行切割的回文共有序列。多个这类序列为本领域所知并可用于本发明。优选的回文切割位点如下所示。半个回文切割位点就是半个回文共有序列。换言之,半个回文切割位点是与其自身再组合可构成完整回文切割位点时的回文切割位点的量。如上文所讨论的,构成所述半个回文切割位点的末端可为粘性末端或平端。例如,对于具有如下序列的回文切割位点5’ · · · AAAATTTT. · · 3’3,…TTTTAAAA…5,半个回文切割位点可为5,…AAAA…3,3,…TTTT...5,或5,. . . AAAAT. . . 3,3,. . . TTT. . . 5,或5,. . . AAA. . . 3,3,. . . TTTTA. . . 5,在上面实例中,第一个半个回文切割位点具有平端,而第二个和第三个半个回文切割位点具有粘性末端。如上文所讨论的,本发明的衔接体通常成对使用,其中所述对中的一种类型的衔接体与所述对中另一种类型的衔接体可差异地选择。由于所述对中两种类型的衔接体都包含半个回文切割位点,因此当一种类型的衔接体与另一种相同类型或不同类型的衔接体连接时就构成完整回文切割位点。例如,如果I型连接I型(I型1型)、11型连接II型(II 型11型)或I型连接II型(I型11型),那么就该构成完整回文切割位点。形成完整回文切割位点使得可切割所述连接的衔接体。这在下文更详细地讨论。所述完整回文切割位点可为任意长度。例如,回文切割位点的长度通常为8-50个碱基对,例如至少10个碱基对,至少12个碱基对,至少14个碱基对,至少16个碱基对,至少20个碱基对,至少30个碱基对或至少40个碱基对。对于测序目的,所述回文切割位点越长越好,因为这样该序列在生物体基因组中不太可能随机出现。在完全随机的基因组序列中(其当然不可能在自然界中出现),长χ个碱基对的回文切割位点在每4x个碱基对中会出现一次。优选的回文切割位点包括限制性核酸内切酶识别位点。限制性核酸内切酶识别位点是被限制性核酸内切酶切割的位点。适用于本发明的限制性核酸内切酶包括但不限于酶分类(EC)组3. 1. 21. 4和3. 1. 21. 5中的那些。所述限制性核酸内切酶识别位点可为被天然限制性核酸内切酶切割的天然位点。或者,所述限制性核酸内切酶识别位点和/或所述限制性核酸内切酶可为非天然的。设计用于本发明的限制性核酸内切酶识别位点和/或限制性核酸内切酶可提供多种优点。例如,设计切割长和/或稀有位点的核酸内切酶意味着所述核酸内切酶不太可能“偶然地”切割要检测的双链核酸模板内的一个或多个位点。
0112]优选的限制性核酸内切酶识别位点包括但不限于以下这些0113]Sbfl 5’ ...CCTGCAGG. . . 3'0114]3,...GGACGTCC. · ·5,0115]禾口0116]AsiSI 5,. · GCGATCGC. · · 3,0117]3,.. CGCTAGCG. · · 5,0118]优选的这些位点的一半包括但不限于以下这些0119]Sbfl 5’ ...CCTG. ·.3'0120]3'...GGAC. ·.5'0121]Sbfl 5’ ...CCT...3,0122]3'...GGACG...5'0123]Sbfl 5,AGG. . . 3'0124]3,· · ·CGTCC...5'0125]AsiSI 5,. · GCGA...3'0126]3,.. CGCT...5'0127]AsiSI 5,.CGC. . . 30128]3,...TAGCG. . . 5'0129]禾口0130]AsiSI 5,. ·.GCG...3'0131]3,.. CGCTA. · · 5,0132]差异选择性0133]本发明的衔接体可与其他衔接体差异地选择。本发明的衔接
类型衔接体差异地选择。I型衔接体可与I型衔接体差异地选择。差异选择性是指一种类型的衔接体可基于至少一种性质而与另一种类型的衔接体分开或区分。任何性质均可用于差异地选择不同类型的衔接体。通常,不同类型的衔接体可差异地选择,因为其可以被相互分离。当成对使用时, 所述对中每一类型的衔接体均可以与另一类型分离。例如,I型衔接体可与II型衔接体分离,反之亦然。这有助于在下文更详细地讨论的本发明方法。可使用任何分离方式。差异地选择优选包括差异地或选择性地结合于表面。例如,两种类型的本发明衔接体如果仅一种结合于表面A并且仅另一种结合于表面B,那么它们当然可被差异地选择。 因此,如果本发明衔接体特异地结合于表面,那么它们可差异地选择。如果衔接体以远大于不同类型衔接体的程度结合于表面,那么其就特异性结合于该表面。在优选的实施方案中, 所述衔接体结合于没有其他类型的衔接体结合的表面。下文更详细地讨论合适的表面。最优选地,所述衔接体可通过差异结合与其他衔接体分离。例如,如果第一种类型的衔接体(A型)特异性结合于一个表面(表面A)而第二种类型的衔接体(B型)结合于另一表面(表面B),那么就可使所述两种类型的衔接体(例如A型和B型)相互分离。两种类型的衔接体的混合物会含有未连接的两种类型的衔接体,以及A型A型、B型B型、A 型B型的连接构建体。所述混合物与表面A接触会导致A型衔接体和包含A型衔接体的任何构建体结合。类似地,所述混合物与表面B接触会导致B型衔接体和包含B型衔接体的任何构建体结合。连接的构建体当然可使用所述回文切割位点进行切割。所述衔接体优选包含选择性结合部分。选择性结合部分是可基于其结合性质被选择的部分。因此,选择性结合部分优选是特异性结合于表面的部分。如果选择性结合部分以远大于本发明中使用的任何其他部分的程度结合于表面,那么其就特异性结合于该表面。在优选的实施方案中,所述部分结合于没有本发明中使用的其他部分结合的表面。如果存在,所述发夹环优选包含选择性结合部分。合适的选择性结合部分为本领域所知。优选的选择性结合部分包括但不限于生物素、核酸序列、抗体、抗体片段例如Fab和ScSv、抗原、核酸结合蛋白、聚组氨酸尾巴和GST标签。最优选的选择性结合部分是生物素和可选择的核酸序列。生物素特异性结合于抗生物素蛋白包被的表面。可选择的核酸序列与同源序列包被的表面特异性结合(即杂交)。这在下文更详细地讨论。或者,可选择的核酸序列与核酸结合蛋白包被的表面特异性结合。在最优选的实施方案中,衔接体对中一种类型的衔接体包含生物素而另一种类型的衔接体包含可选择的核酸序列。鉴定序列在优选的实施方案中,所述衔接体包含使得所述衔接体可被鉴定的核酸序列。所述核酸序列可存在于所述双链核酸区,或者,如果存在发夹环的话,存在于所述发夹环中。所述核酸序列的长度通常为12个或更少的碱基,例如10个或更少的碱基,8个或更少的碱基或者6个或更少的碱基。当根据本发明测序包含所述衔接体的构建体时,所述核酸序列包含可被鉴定的可识别序列。在包含发夹环的衔接体中,所述序列会在连接要检测的两条核酸链的衔接体部分被测序时被鉴定。在缺少发夹环并能够被切割或缺刻的衔接体中,所述序列通常位于连接所述双链核酸模板的末端与衔接体可被切割或缺刻的点之间。在这些实施方案中,即使在所述衔接体被切割或缺刻的情况下,所述序列仍然与所述双链核酸模板连接。在优选的实施方案中,所述核酸序列可鉴定其连接的两条链的来源。在这些实施方案中,所述衔接体使得可对来源于不同个体源的模板进行多重序列分析。每个模板被分配给不同的衔接体,其中每个衔接体都包含可鉴定所述模板来源的核酸序列。能够被切割或缺刻的衔接体在某些实施方案中,所述衔接体自身能够被切割或缺刻。换言之,所述衔接体不必连接于另一衔接体就可被切割或缺刻。所述双链核酸区能够被切割或缺刻,并且/或者,如果存在发夹环,所述发夹环能够被切割或缺刻。在有发夹环的衔接体中,构成半个回文切割位点的衔接体末端(即连接所述双链序列模板的衔接体末端)优选可与所述可选择的结合部分分离。在无发夹环的衔接体中,所述衔接体的一个或两个末端优选可与所述可选择的结合部分分离。能够被切割或缺刻的衔接体优选含有一个或多个例如两个、三个或更多个切割或缺刻位点。可依照本发明使用任何切割或缺刻位点。这些位点包括但不限于,化学切割或
15缺刻位点、RNA/DNA复合位点、非天然碱基(例如脲嘧啶)以及限制性核酸内切酶识别位点和归巢核酸内切酶识别位点。能够被切割或缺刻的衔接体更优选包含一个或多个限制性或归巢核酸内切酶识别位点。优选所述限制性或归巢核酸内切酶识别位点不是当所述衔接体连接于本发明另一衔接体时所形成的回文切割位点。合适的限制性或归巢核酸内切酶识别位点为本领域所知。优选的归巢核酸内切酶识别位点包括但不限于以下这些I-SceI(SEQ ID NO :9)5,···TAGGGATAACAGGGTAAT. · · 3,3,. . . ATCCCTATTGTCCCATTA. . . 5’衔接体对本发明还提供了本发明的衔接体对。所述对中一种类型的衔接体通过单链核酸的两个不同区之间杂交形成并且包含发夹环(I型)。所述对中另一类型的衔接体可具有发夹环,也可不具有发夹环(II型)。所述II型衔接体优选也通过单链核酸的两个不同区之间杂交形成并且包含发夹环。所述对中每一类型的衔接体均可与另一类型差异地选择。如果所述两种类型的衔接体的任意组合彼此连接,就形成完整回文切割位点。所述衔接体可为上面讨论的任何衔接体。I型衔接体优选可与II型衔接体分离,反之亦然。可使用上文所述的任何分离方法。I型衔接体更优选可通过差异结合与II型衔接体分离。I型衔接体甚至更优选包含与 II型衔接体不同的可选择的结合部分。优选地,I型衔接体包含可选择的核酸而II型衔接体包含生物素。所有这些实施方案都有利于在下文详细讨论的本发明方法。还优选I型衔接体自身不能被切割或缺刻而II型衔接体自身能够被切割或缺刻。 所述II型衔接体可以以上文讨论的任何方式被切割或缺刻。I型衔接体还优选包含使得所述衔接体可被鉴定的核酸序列。本发明最优选的衔接体对总结在下表1中。
权利要求
1.一种用于测序核酸的衔接体,其包含双链核酸区,其中该区的至少一个末端构成半个回文切割位点,并且其中所述衔接体可与另一衔接体差异地选择。
2.权利要求1的衔接体,其中所述区通过单链核酸的两个不同区之间杂交形成并且所述衔接体包含发夹环。
3.权利要求1或2的衔接体,其中所述半个回文切割位点包含平端。
4.前述权利要求任一项的衔接体,其中所述回文切割位点是限制性核酸内切酶识别位点。
5.前述权利要求任一项的衔接体,其中所述衔接体可通过差异结合与另一衔接体分离。
6.前述权利要求任一项的衔接体,其中所述衔接体包含可选择的结合部分。
7.权利要求6的衔接体,其中所述可选择的结合部分是生物素或可选择的核酸序列。
8.前述权利要求任一项的衔接体,其中所述衔接体包含使得所述衔接体可被鉴定的核酸序列。
9.前述权利要求任一项的衔接体,其中所述衔接体自身能够被切割或缺刻。
10.衔接体对,其包含权利要求2中限定的衔接体(I型)和权利要求1中限定的衔接体(II型),其中所述对中每种类型的衔接体可与另一种类型差异地选择,并且其中如果所述两种类型的衔接体的任意组合彼此连接,那么就形成完整的回文切割位点。
11.权利要求10的衔接体对,其中每种类型衔接体中的半个回文切割位点均包含平端。
12.权利要求10或11的衔接体对,其中所述回文切割位点是限制性核酸内切酶识别位点O
13.权利要求10-12任一项的衔接体对,其中所述I型衔接体可通过差异结合与所述 II型衔接体分离。
14.权利要求10-13任一项的衔接体对,其中所述I型衔接体包含与所述II型衔接体可差异选择的结合部分。
15.权利要求10-14任一项的衔接体对,其中所述I型衔接体自身不能被切割或缺刻, 所述II型衔接体自身能够被切割或缺刻。
16.权利要求10-15任一项的衔接体对,其中所述I型衔接体包含使得所述衔接体可被鉴定的核酸序列。
17.包含至少两群权利要求1或2中限定的衔接体的试剂盒,其中每群中的每个衔接体均包含对该群特异的核酸序列。
18.一种用作测序模板的核酸构建体,其包含与至少一个权利要求1的衔接体连接的双链核酸。
19.一种用作测序模板的单链核酸构建体,其包含经权利要求2的衔接体共价连接的两条核酸链。
20.一种用作测序模板的包含两条核酸链的环状核酸构建体,所述两条核酸链在每个末端经权利要求2的衔接体共价连接。
21.权利要求18-20任一项的构建体,其中所述两条链是双链DNA(dsDNA)或双链 RNA(dsRNA)的正义链和反义链。
22.—种制备权利要求1的衔接体的方法,包括(a)提供两个核酸,所述核酸(i)能够彼此杂交形成半个回文切割位点,并且(ii)可与另一种衔接体的核酸差异地选择;以及(b)使所述核酸在使得它们可杂交的条件下接触,从而制备衔接体。
23.一种制备权利要求2的衔接体的方法,包括(a)提供单链核酸,其包含(i)能够彼此杂交的两个区,(ii)可与另一种衔接体的核酸差异地选择的环形成区和(iii) 一起构成半个回文切割位点的两个末端;以及(b)使所述核酸暴露于使得所述两个区可杂交并形成发夹环的条件下,从而制备衔接体。
24.一种制备权利要求18的核酸构建体的方法,包括(a)使至少一个权利要求1的衔接体与两条核酸链在使得所述衔接体与所述链之间可连接的条件下接触;以及(b)使所述衔接体与所述两条链连接,从而制备核酸构建体。
25.一种制备权利要求19的单链核酸构建体的方法,包括(a)使权利要求2的衔接体与两条核酸链在使得所述衔接体与所述链之间可连接的条件下接触;(b)使所述衔接体共价连接所述两条链;以及(c)使所述共价连接的构建体变性,从而制备单链核酸构建体。
26.一种制备权利要求20的环状核酸构建体的方法,包括(a)使权利要求2的至少两个衔接体与两条核酸链在使得所述衔接体与链之间可连接的条件下接触;以及(b)使衔接体与所述两条链在每个末端共价连接,从而制备环状核酸构建体。
27.一种制备测序构建体的方法,包括(a)提供双链核酸;(b)使所述双链核酸与权利要求15的I型和II型衔接体对在使得所述衔接体与所述核酸可连接的条件下接触;(c)使所连接的产物与特异性结合所述II型衔接体的表面接触,并除去任何未结合的产物;(d)使所述表面与识别所述完整回文切割位点的酶接触,并除去任何未结合的产物;(e)切割所述II型衔接体;(f)使在步骤(e)中产生的可溶解产物与特异性结合所述I型衔接体的表面接触,并除去任何未结合的产物;以及(g)从所述表面释放在步骤(f)后剩余的产物,从而产生测序构建体。
28.权利要求27的方法,其中步骤(a)中的提供包括随机片段化模板核酸。
29.权利要求27或观的方法,其中步骤(a)还包括修复所述双链核酸的末端以形成平端。
30.一种测序双链核酸的方法,包括(a)进行权利要求25或27的方法;(b)根据需要,使所述构建体变性以形成单链构建体;以及(C)测序所述单链构建体,从而测序所述双链核酸。
31.权利要求30的方法,其中步骤(c)中的测序通过包括以下步骤的方法进行(i)将所述构建体与共价连接有核酸外切酶和分子衔接体的跨膜孔接触,使得所述核酸外切酶从所述构建体的一个末端消化单个核苷酸;( )使所述核苷酸与所述孔接触,使得所述核苷酸与所述分子衔接体相互作用;(iii)测量在所述相互作用过程中通过所述孔的电流从而确定所述核苷酸的类型;以及(iv)在所述构建体的同一末端重复步骤(i)到(iii),从而确定所述构建体的序列。
32.权利要求30的方法,其中步骤(c)中的测序通过包括以下步骤的方法进行(i)使所述构建体与共价连接有核酸操作酶的跨膜孔接触,使得所述酶将所述构建体推过或拉过所述孔,并且所述构建体中的一部分核苷酸与所述孔相互作用;以及( )测量在每个相互作用过程中通过所述孔的电流从而确定所述构建体的序列。
33.权利要求30-32任一项的方法,其中所述双链核酸含有或怀疑含有甲基胞嘧啶。
34.一种用于测序双链核酸的试剂盒,其包含权利要求10-16任一项的衔接体对和用于切割所述回文切割位点的工具。
全文摘要
本发明涉及用于测序核酸的衔接体。所述衔接体可用于生成用于测序目的的单链核酸构建体。所述构建体可含有双链脱氧核糖核酸(DNA)或核糖核酸(RNA)模板的全部两条链。本发明还涉及使用所述衔接体生成的构建体,制备所述衔接体和构建体的方法,以及测序双链核酸的方法。
文档编号C12Q1/68GK102369298SQ201080015405
公开日2012年3月7日 申请日期2010年1月29日 优先权日2009年1月30日
发明者B·麦克基翁 申请人:牛津纳米孔技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1