专利名称:酶-孔构建体的制作方法
技术领域:
本发明涉及包含跨膜蛋白孔亚基和核酸操作酶(nucleic acid handling enzyme)的构建体。所述孔亚基与所述酶共价结合使得所述亚基与所述酶均保留其活性。 所述构建体可用于产生结合有核酸操作酶的跨膜蛋白孔。这些孔特别可用于核酸测序。所述酶操作核酸的方式使得所述孔可通过随机传感来检测其每个组成核苷酸。
背景技术:
随机传感是一种依赖于对分析物分子与受体之间个体结合事件的观察结果的传感方法。随机传感器可通过如下方式形成将纳米尺寸的单孔置入绝缘膜中,并且在存在分析物分子的情况下测量电压驱动的穿过所述孔的离子转运。电流波动的发生频率可揭示在所述孔中结合的分析物的浓度。分析物的种类通过其特征性的电流特征特别是电流阻断的持续时间和程度而示出(Braha, 0.,Walker, B.,Cheley,S.,Kasianowicz, J. J.,Song, L., Gouaux, J. Ε. , and Bayley, H. (1997) Chem. Biol. 4,497-505 ;and Bayley, H. , and Cremer, P. S. (2001)Nature 413,226-230) 形成细菌孔的毒素α-溶血素(α-HL)的基因工程改造形式已用于对许多类型的分子进行随机传感(Bayley,H.,and Cremer, P. S. (2001)Nature 413,226-230 ;Shin, S. , H. , Luchian, Τ. , Cheley, S. , Braha, 0. , and Bayley, H. (2002)Angew. Chem. Int. Ed. 41,3707-3709 ;Guan, X.,Gu, L. -Q.,Cheley, S.,Braha, 0.,and Bayley, H. (2005) ChemBioChem6,1875-1881).在这些研究的过程中,已发现,试图将α-HL改造以直接结合小的有机分析物的尝试是很费力的,并且鲜有成功的实例(Guan,X.,Gu, L.-Q.,Cheley, S.,Braha, 0.,and Bayley, H. (2005) ChemBioChem 6,1875-1881)。幸运地是,人们发现了一种不同的策略,该策略利用了非共价结合的分子衔接体,特别是环糊精(Gu,L.-Q., Braha, 0. , Conlan, S. , Cheley, S. , and Bayley, H. (1999)Nature 398,686-690)、环肽 (Sanchez-Quesada, J. , Ghadiri, Μ. R. , Bayley, H. , and Braha, 0. (2000) J. Am. Chem. Soc. 122,11758-11766)和葫芦脲(Braha, 0.,Webb, J.,Gu, L. -Q.,Kim, K.,and Bayley, H. (2005)ChemPhysChem 6,889-892) 0环糊精可短暂地进入所述α-HL孔中,并产生很大程度但不完全的通道阻断。有机分析物在环糊精的疏水内部发生结合,它们可加强这种阻断,使得可实现分析物检测(Gu,L. -Q.,Braha, 0.,Conlan, S.,Cheley, S.,and Bayley, H. (1999)Nature 398,686-690)。现在在大范围应用中需要快速且廉价的DNA或RNA测序技术。现有的技术速度慢且价格昂贵,这主要是由于其倚赖于扩增技术产生大量核酸并且需要大量专用的荧光化学物质进行信号检测。随机传感有可能通过减少所需核苷酸和试剂的量提供快速且廉价的 DNA测序。
发明内容
发明人出人意料地证明了跨膜蛋白孔亚基与核酸操作酶的共价结合,可产生既能形成孔又能操作核酸的构建体。发明人还出人意料地证明了所述构建体可用于产生一种既能操作核酸又能通过随机传感测序核酸的跨膜蛋白孔。所述酶与所述孔的固定性质与紧密接近是指靶核酸中的核苷酸的一部分会与所述孔相互作用并以特征性的方式影响流过所述孔的电流。因此,包含这种构建体的跨膜蛋白孔是用于随机传感特别是用于测序核酸的有用工具。因此,本发明提供了一种包含跨膜蛋白孔亚基和核酸操作酶的构建体,其中所述亚基与所述酶共价结合,其中所示亚基保留其形成孔的能力并且其中所述酶保留其操作核酸的能力。本发明还提供了 -一种编码本发明构建体的核酸序列;-一种用于测序核酸的改性孔,包含至少一种本发明构建体;-一种产生用于测序核酸的经改变的孔的试剂盒,包含(a)至少一种本发明构建体;和(b)形成孔所需的任何其他亚基;-一种产生用于测序核酸的经改变的孔的试剂盒,包含(a)至少一种本发明的多核苷酸;和(b)编码形成孔所需的任何其他亚基的多核苷酸序列;-一种产生本发明构建体的方法,包括(a)使核酸操作酶与跨膜蛋白孔亚基共价结合;和(b)确定所得构建体是否能够形成孔和操作核酸;-一种产生本发明的经改变的孔的方法,包括(a)使核酸操作酶与跨膜蛋白孔共价结合;和(b)确定所得孔是否能够操作核酸并检测核酸;-一种产生本发明的经改变的孔的方法,包括(a)使至少一种本发明构建体与其他合适的亚基形成孔;和(b)确定所得孔是否能够操作核酸并检测核苷酸;-一种纯化包含至少一种本发明构建体的跨膜孔的方法,包括(a)提供所述至少一种构建体与形成孔所需的其他亚基;(b)使所述至少一种构建体与其他亚基在合成脂质囊泡上寡聚体化;和(c)使所述囊泡与非离子表面活性剂接触;和(d)回收所述寡聚体化的孔;-一种测序靶核酸序列的方法,包括(a)使所述靶序列与本发明的孔——其包含核酸外切酶——接触,从而使所述核酸外切酶从所述靶序列的一端消化单个核苷酸;(b)使所述核苷酸与所述孔接触从而使所述核苷酸与所述衔接体相互作用;(c)测量在相互作用过程中通过所述孔的电流并且从而确定所述核苷酸的种类; 和(d)在靶序列的同一端重复步骤(a)到(C)从而确定所述靶序列的序列;以及-一种测序靶核酸序列的方法,包括(a)使所述靶序列与本发明的孔接触从而使所述酶将所述靶序列推过或拉过所述孔,所述靶序列中核苷酸的一部分与所述孔相互作用;和(b)测量在每个相互作用过程中通过所述孔的电流并且从而确定所述靶序列的序列。
图1示出了核酸外切酶如何催化磷酸二酯键的水解。在所述核酸外切酶的活性位点内,水分子能够与多核苷酸(DNA)的3’末端的磷酸基反应。磷酸基与糖之间的键向5’ 端的断裂可释放出单磷酸(脱氧)核苷。图2示出了实施例中所用的核酸外切酶的晶体结构,对每种核酸外切酶均示出了 N和C末端及活性位点:i)适应性修改形式的EcoExoIII ;ii)EcoExoI ;iii)TthRecJ-cd ;和 iν)Lambda exo。图3示出了装配有α-HL孔的核酸外切酶的示意图。核酸外切酶与所述七聚体的七个单体之一在基因上融合,其中连接臂足够长以使得核酸外切酶部分和α -HL部分可正确蛋白折叠。图4示出了所产生的蛋白构建体的通式图,其示出了在α-HL基因中的BspEI插入位点。由编码(丝氨酸/甘氨酸)Χ5重复物(显示为阴影)的两段DNA界定的连接物 AfuExoIII可产生一个融合蛋白,其中在所示Τ7启动子的转录控制下会产生64. 5kDa的蛋白。图5示出了 α -HL环1融合构建体与野生型α -HL以不同蛋白比例的寡聚体化。 i)HL-wt-EcoExoIII-L1-H6 ;ii)HL-RQC-EcoExoI-L1-H6 ;禾卩 iii)HL-RQC-TthRecJ-L1-H6。图6示出了通过不同单体比例控制同七聚体和异七聚体的产生。HL-RQ亚基以白色示出,融合亚基以黑色示出。增大融合亚基与野生型亚基的比例可增加2 5、1 6和 O 7的异七聚体和同七聚体的产生。类似地,升高HL-RQ单体的浓度可增加6 1和5 2 的异七聚体的产生。图7示出了含有刚性聚脯氨酸ecoexoiii c末端接头的hl-rqc-Ecoexoiii-l1-h6 融合蛋白的寡聚体化。在纯化的兔红细胞膜的存在下,IVTT表达以5 1的野生型与融合蛋白的比例混合的蛋白。i) HL-RQC-EcoExo 111-Ll- {SG} 5+ {SG} 5-H6 ;ii) HL-RQC-EcoExo111-Ll-{SG} 5+5P-H6 ;iii)HL-RQC-EcoExoIII-L1-4SG+5P-H6 ;和 iv)HL 单体。图8示出了具有成熟七聚体的单α-溶血素亚基的环2区。亚基1以白色示出, 亚基2-7以灰色示出,亚基1的环2区以黑色示出。图9示出了其他环2EC0EX0III融合蛋白的寡聚体化。i)HL-(RQ)7 ;ii) HL- (RQ) 6 (RQC-EcoExoIII-L2a-H6) ! ;iii)HL-(RQ)6(RQc-EcoExoIII-I^a-SP-He)1 ;iv)HL- (RQ) 6 (RQC-EcoExoIII-L2-H48 Δ -Η6) ! ;ν)HL- (RQ) 6 (RQC-EcoExoIII-L2-D45 Δ -Η6) ! ;vi)HL- (RQ) 6 (RQC-EcoExoIII-L2-D45-K46 Δ -Η6) !;和 vii)
HL- (RQ) 6 (RQC-EcoExo 111-L2-D45-N47 Δ -H6)丄。 图10示出了其他环2EC0EX0III融合蛋白的寡聚体化。i)
HL-(RQ)7 ;ii) HL- (RQ) 6 (RQC-EcoExoIII-L2a-H6) ! ;iii)HL- (RQ) 6 (RQC-EcoExoIII-L2-D45-N47 Δ -Η6) ! ;iv)HL- (RQ) 6 (RQC-EcoExoIII-L2-D46-K56 Δ -Η6) ! ;ν)HL- (RQ) 6 (RQC-EcoExoIII-L2-D46 Δ -Η6) ! ;vi)HL- (RQ) 6 (RQC-EcoExoIII-L2-D46-N47 Δ -Η6) ! ;vii)HL- (RQ) 6 (RQC-EcoExoIII-L2-A1-S16 Δ /D46-N47 Δ -Η6) ! ;viii)HL- (RQ) 6 (RQC-EcoExoIII-L2-F42-D46 Δ -Η6) !;和 ix)HL- (RQ) 6 (RQC-EcoExoIII-L2-I43-D46 Δ -Η6)丄。图11示出了 EcoExoIII C末端融合蛋白的寡聚体化。a)指示溶血素和酶融合蛋白单体均被放射性标记,b)指示仅融合蛋白单体被放射性标记。i)HL-(RQ)6(RQC-EC0EX0I -Cter-{SG}8-H6) ! ;ii)HL- (RQ) 6 (RQC-EcoExoI-Cter-DG {SG} 8-H6) ! ;iii)HL- (RQ) 6 (RQC-EcoExoI-Cter-ffPV {SG} 8-H6) ! ;iv)HL- (RQ) 6 (RQC-EcoExoI-Cter-DGS {P} 12-H6) !;禾口 ν)HL- (RQ) 6 (RQC-EcoExoI-Cter-ffPV {P} 12-116)!。图12示出了不同表面活性剂对EcoExoIII活性的效应。左图-十二烷基硫酸钠 (SDS) :a :0 % ;b :0. 1 % ;c :0. 5 %。右图——正十二烷基-D-麦芽糖苷(DDM) :a 0% ;b 0. 1% ;C 0. 25% ;d 0. 5%o图13示出了大肠杆菌(E. coli)BL21(DE3)pLyS表达的α-溶血素单体的寡聚体化,用于优先形成和纯化6 1异七聚体。将His-标签纯化用于在异七聚体和野生型同七聚体之间进行选择,以得到大量过量的6 1异七聚体。图14示出了单体和异七聚体融合蛋白的核酸外切酶活性。左图——野生型和融合单体的活性a,10_2稀释的HL-RQC-EcoExo 111-L1-H6 ;b,1(Γ4 稀释的HL-RQC-EcoExoIII-L1-Η6 ;c,1(Γ6 稀释的HL-RQC-EcoExoIII-L1-H6 ;d,1(Γ2 稀释的 HL-RQ。右图——HL-(RQ) 6 (RQC-EcoExoIII-Ll-H6)的活性a,DDM 粗提取物;b,纯化的 Ni-NTA ;c,纯化的Ni-NTA和缓冲液置换。图15示出——HL-(RQ)6(RQc-EcoExoIII-Ll-He)1异七聚体的碱基检测。上迹线获自与ame-amPDPi- β CD衔接体分子共价结合的异七聚体。可观察到其他阻断事件,所述阻断事件是由进行碱基识别的单个单磷酸核苷造成的。下图表示出了上迹线的DNMP事件的相应直方图。从左到右,峰分别对应G、Τ、A和C。数据在400/400mMKCl、180mV和10 μ M dNMP下获取。序列表说明SEQ ID NO :1示出了编码野生型α -溶血素(α -HL)的一个亚基的多核苷酸序列。SEQ ID NO :2示出了野生型α-HL的一个亚基的氨基酸序列。氨基酸2_6、 73-75,207-209,214-216 和 219-222 构成 α -螺旋。氨基酸 22-30、35-44、52-62、67_71、 76-91、98-103、112-123、137-148、154-159、165-172、229-235、243-261、266-271、285-286 和29H93构成β-链。所有其他非末端氨基酸,即7-21、31-34、45-51、63-66、72、92-97、104-111、124-136、149-153、160-164、173-206、210-213、217、218、223-228、236-242、 262-265,272-274和287-290构成环区。氨基酸1和四4为末端氨基酸。SEQ ID NO :3示出了编码α-HL Ml 13R/N139Q(HL-RQ)的一个亚基的多核苷酸序列。SEQ ID Ν0:4 示出了 α -HL Ml 13R/N139Q(HL-RQ)的一个亚基的氨基酸序列。在野生型α-HL中构成α-螺旋、β _链和环区的相同氨基酸在此亚基中构成相应的区域。SEQ ID NO :5 示出了 ρΤ7 α -HL BspEI 敲除的多核苷酸序列(pT7-SCl_BspEI_K0)。 α -HL编码序列在核苷酸2709和3593之间。BspEI其余部分位于核苷酸3781和3782。SEQ ID NO 6示出了在位置1 (Li)含有BspEI克隆位点的编码野生型α -溶血素的一个亚基的多核苷酸序列。SEQ ID NO 7示出了在位置2(L2a)含有BspEI克隆位点的编码野生型α -溶血素的一个亚基的多核苷酸序列。SEQ ID NO 8示出了在位置2 (L2b)含有BspEI克隆位点的编码野生型α -溶血素的一个亚基的多核苷酸序列。SEQ ID NO :9示出了源于大肠杆菌的xthA基因的密码子优化的多核苷酸序列。其编码大肠杆菌的核酸外切酶III。SEQ ID NO 10示出了大肠杆菌的核酸外切酶III的氨基酸序列。此酶以3’到5’ 方向从双链DNA(dsDNA)的一条链持续消化5’单磷酸核苷。酶在链上的启动需要大约4个核苷酸的 5,突出。氨基酸 11-13、15-25、39-41、44-49、85-89、121-139、158-160、165-174、 181-194、198-202、219-222、235-240 和 248-252 构成 α -螺旋。氨基酸 2-7、29_33、53_57、 65-70、75-78、91-98、101-109、146-151、195-197、229-234和 241-246 构成 β -链。所有其他非末端氨基酸 8-10、洸-28、;34-38、42、43、50-52、58-64、71-74、79-84、90、99、100、110-120、 140-145、152-157、161-164、175-180、203-218、223-228、247 和 253-261 构成环。氨基酸 1和267和268为末端氨基酸。酶活性位点通过连接P1-Cip β3-β4、β5_β6、^111-Q1, β ιν- α π 和 β ν- β νι 的环区(分别由氨基酸 8-10、58-64、90、110-120、152-164、175-180、 223-228和253-261构成)形成。单个二价金属离子结合于残基Ε34并通过和H259 组氨酸-天门冬氨酸催化对辅助对磷酸二酯键的亲核攻击。SEQ ID NO :11示出了源于大肠杆菌的sbcB基因的密码子优化的多核苷酸序列。 其编码大肠杆菌的核酸外切酶I (EcoExoI)。SEQ ID NO :12示出了大肠杆菌的核酸外切酶I (EcoExoI)的氨基酸序列。此酶以 3’到5’方向从单链DNA(ssDNA)持续消化5’单磷酸核苷。酶在链上的启动需要至少12个核苷酸。氨基酸 60-68、70-78、80-93、107-119、1M-U8、137-148、165-172、182-211、213-221、 234-241、268-286、313-324、326-352、362-370、373-391、401-454 和 457-475 构成 α-螺旋。氨基酸 10-18、28-26、47-50、97-101、133-136、2四-232、243-251、258-263、298-302 和 308-311 构成 β-链。所有其他非末端氨基酸 19-27、37-46、51-59、69、79、94-96、102-106、 120-123、129-132、149-164、173-181、212、222-228、233、242、252-257、264-267、287-297、 303-307、312、325、353-361、371、372、392-400、455 和 456 构成环。氨基酸 1-9 为末端氨基酸。所述酶的整体折叠使得三个区域联合以形成一个字母C外形的分子,但无序分布在所述晶体结构中的残基355-358有效地将此C形转化为类0形。氨基末端(1-206)可构成外切酶结构域并与DnaQ超家族具有同源性,如下残基(202-354)构成SH3样结构域并且羧基结构域(359-475)伸出外切酶结构域,以形成该分子的C形。EcoExoI的4个酸性残基与 DnaQ超家族的活性位点残基是保守的(对应于D15、E17、D108和D186)。已经提出,单个金属离子被残基D15和108结合。DNA的水解似乎通过以活性水分子攻击易切断的磷酸基进行催化,以H181为催化残基并比对所述核苷酸底物。SEQ ID NO 13示出了源于嗜热栖热菌(T. thermophilus)的recj基因的密码子优化的多核苷酸序列。其编码嗜热栖热菌的RecJ酶(TthRecJ-cd)。SEQ ID NO :14示出了嗜热栖热菌的RecJ酶(TthRecJ-cd)的氨基酸序列。此酶以5’到3’方向从单链DNA持续消化5’单磷酸核苷。酶在链上的启动需要至少4个核苷酸的链。氨基酸 19-33、44-61、80-89、103-111、136-140、148-163、169-183、189-202、 207-217、223-240、242-252、254-287、302-318、338-350 和 365-382 形成 α -螺旋。氨基酸 36-40、64-68、93-96、116-120、133-135、294-297、321-325、328-332、352-355 和 359-363 构成 β-链。所有其他非末端氨基酸 34、35、41-43、62、63、69-79、90-92、97-102、112-115、 121-132、141-147、164-168、184-188、203-206、218-222、241、253、288-293、298-301、319、 320、326、327、333-337、351-358和364构成环。氨基酸1-18和383-425为末端氨基酸。仅对嗜热栖热菌(Thermus thermophilus)的RecJ的核心结构域(残基40-463)解析了晶体结构。为确保所述RecJ核心结构域的翻译和体内表达的启动,在其氨基末端添加一个甲硫氨酸残基,这不包含在晶体结构信息中。所解析的结构示出了由一个长α -螺旋(254487) 连接的两个结构域氨基区(2-25 和羧基区(观8-46;3)。催化残基(D46、D98、H122和 D183)配位单二价金属离子用于对磷酸二酯键进行亲核攻击。D46和H120被认为是催化对; 然而,大肠杆菌的RecJ中这些保守残基的任一个的突变均显示会完全破坏活性。SEQ ID NO 15示出了源于噬菌体λ的exo (redX)基因的密码子优化的多核苷酸序列。其编码噬菌体λ的核酸外切酶。SEQ ID Ν0:16示出噬菌体λ的核酸外切酶的氨基酸序列。该序列是装配为三聚体的三个相同亚基之一。该酶以3’到5’方向高度持续消化dsDNA的一条链的核苷酸。酶在链上的启动优选地需要大约4个具有5’磷酸基的核苷酸的5’突出。氨基酸3-10、14-16、 22-26、34-40、52-67、75-95、135-149、152-165 和 193-216 构成 α-螺旋。氨基酸 100-101、 106-107、114-116、120-122、127-131、169-175 和 184-190 构成 β -链。所有其他非末端氨基酸 11-13、17-21、27-33、41-51、68-74、96-99、102-105、108-113、117-119、123-126、 132-134、150-151、166-168、176-183、191-192、217-222 构成环。氨基酸 1、2 和 226 为末端氨基酸。λ外切酶是一个同三聚体,其形成具有通过中间的锥形通道的环状体,所述通道明显足够大以使dsDNA在一端进入,并且只有ssDNA在另一端出来。催化残基未确定,但单个二价金属离子似乎通过残基D119、EU9和L130结合在每个亚基上。SEQ ID NO :17示出了编码实施例中所用的HL-wt-EcoExoIII-L1-H6 的多核苷酸序列。SEQ ID NO 18示出了实施例中所用的HL-wt-EcoExoIII-Ll-H6的一个亚基的氨基酸序列。SEQ ID NO 19示出了编码实施例中所用的HL-RQC-EcoExo111-L1-H6 的多核苷酸序列。
SEQ ID NO :20示出了实施例中所用的HL-RQC-EcoExo111-L1-H6的一个亚基的氨基酸序列。SEQ ID NO 21示出了编码实施例中所用的HL-RQC-EcoExo I-L1-H6 的多核苷酸序列。SEQ ID NO 22示出了实施例中所用的HL-RQC-EcoExo I-L1-H6的一个亚基的氨基酸序列。SEQ ID NO :23示出了编码实施例中所用的HL-RQC-TthRecJ-Ll-H6 的多核苷酸序列。SEQ ID NO 24示出了实施例中所用的HL-RQC-TthRecJ-Ll_H6的一个亚基的氨基酸序列。SEQ ID NO :25示出了编码实施例中所用的HL-RQC-EcoExoIII-L2-D45-N47 Δ-H6 的多核苷酸序列。SEQ ID NO :26示出了实施例中所用的HL-RQC-EcoExoIII-L2-D45-N47 Δ-Η6 的一个亚基的氨基酸序列。SEQ ID NO :27示出了编码实施例中所用的HL-RQC-EcoExoI-Cter-{SG}8_H6 的多核苷酸序列。SEQ ID NO :28示出了实施例中所用的HL-RQC-EcoExoI-Cter- {SG} 8-H6 的一个亚基的氨基酸序列。SEQ ID NO :29示出了编码实施例中所用的HL-RQC-EcoExoI-Cter-DG {SG}8_H6 的多核苷酸序列。SEQ ID NO :30示出了实施例中所用的HL-RQC-EcoExoI-Cter-DG {SG} 8-H6 的一个亚基的氨基酸序列。SEQ ID N0:31和SEQ ID NO :32示出了实施例的核酸外切酶测定中所用的寡核苷酸序列。
具体实施例方式应理解,所公开的产物和方法的不同用途可根据本领域内的具体需要进行调整。 还应理解,本文所用的术语只是为了描述本发明的具体实施方案,而非意图进行限制。此外,除非上下文另有清楚的指明,否则本说明书和所附权利要求书中所用的单数形式“一个”、“一种”和“该”也包括复数指代物。因此,例如,提及“一个构建体”也包括 “多个构建体”,提及“一个跨膜蛋白孔”包括两个或更多个这类孔,提及“一个分子衔接体” 包括两个或多个所述衔接体,等等。本文中——无论在上文还是下文——引用的全部出版物、专利和专利申请均以引用的方式全文纳入本文。构建体本发明提供了可用于测序核酸的构建体。所述构建体包含跨膜蛋白孔亚基和核酸操作酶。所述亚基与所述酶共价结合。本发明构建体是形成能够通过随机传感测序核酸的孔的有用工具。本发明构建体特别可用于产生既可操作靶核酸序列又可辨别靶序列中不同核苷酸的跨膜蛋白孔。如下文更详细描述的,所述酶操作靶核酸的方式使得所述孔可识别靶序列中的核苷酸并从而测序所述靶序列。所述亚基保留其形成孔的能力。构建体形成孔的能力可使用本领域任何已知方法测定。例如,可将所述构建体和其他合适的亚基一块插入膜中,并可确定其寡聚体化以形成孔的能力。将构建体和亚基插入膜例如脂质双层的方法为本领域所知。例如,可将构建体和亚基以纯化形式悬浮于含有脂质双层的溶液中,这样使其扩散至所述脂质双层,并且通过结合于所述脂质双层并装配为功能状态而插入。或者,可使用M. A. Holden,H. Bayley. J.Am. Chem. Soc. 2005,127,6502-6503 和国际申请 PCT/GB2006/001057 (以 WO 2006/100484 公开)记载的“拾取放置(Pick and place)”法将构建体和亚基直接插入到所述膜中。构建体形成孔的能力通常可如实施例中所述进行测定。所述酶保留有其操作核酸的能力。这使得所述构建体可形成用于测序如下文所述核酸的孔。构建体操作核酸的能力可使用任何本领域已知的方法测定。例如,可测试构建体或由所述构建体形成的孔操作具体核酸序列的能力。构建体或孔操作核酸的能力通常可如实施例中所述进行测定。本发明的一种构建体可形成孔的一部分。或者,构建体可以是分离的、基本上分离的、纯化的或基本上纯化的。如果构建体完全不含任何其他组分如脂质或其他孔单体,则该构建体是分离的或纯化的。如果构建体与不干扰其预计用途的载体或稀释剂混合,则该构建体是基本分离的。例如,如果构建体以包含小于10%、小于5%、小于2%或小于的其他组分如脂质或其他孔单体的形式存在,则该构建体是基本分离或基本纯化的。本发明的一种构建体可以以脂质双层的形式存在。结合所述亚基与所述酶共价结合。所述亚基可在不止一点例如两点或三点上与所述酶结合。使所述亚基与所述酶在不止一点上结合的方法可用于限制所述酶的可动性。例如, 多点结合可用于限制所述酶转动或离开所述亚基的自由度。当所述亚基与所述酶结合时(表达后修饰),其可以是单体的形式。或者,当所述亚基与酶结合时(寡聚体化后修饰),其可以是寡聚孔的一部分。可使用任何本领域已知的方法使所述亚基与所述酶共价结合。所述亚基和酶可单独产生,然后结合在一起。所述两种组分可以以任意构型结合。例如,它们可通过其末端 (即氨基末端或羧基末端)氨基酸结合。合适的构型包括但不限于所述酶的氨基末端结合于所述亚基的羧基末端,反之亦然。或者,所述两种组分可通过它们序列内部的氨基酸结合。例如,所述酶可结合于所述亚基的环区的一个或多个氨基酸。在一个优选实施方案中, 所述酶的末端氨基酸结合于一个亚基的环区中的一个或多个氨基酸。末端氨基酸和环区如上文所讨论。在一个优选实施方案中,所述亚基与所述酶在基因上融合。如果整个构建体由单个多核苷酸序列表达,则亚基与酶在基因上融合。所述亚基和酶的编码序列可以以任何方式组合以形成编码所述构建体的单个多核苷酸序列。所述亚基和酶可以以任何构型在基因上融合。所述亚基和酶可以通过它们的末端氨基酸在基因上融合。例如,所述酶的氨基末端与所述亚基的羧基末端融合,反之亦然。优选将所述酶的氨基酸序列同框内加入所述亚基的氨基酸序列中。换言之,优选将所述酶插入所述亚基的序列内。在这些实施方案中,所述亚基和酶通常在两点上结合,即经所述酶的氨基末端氨基酸和羧基末端氨基酸结合。如果将所述酶插入所述亚基的序列内,则优选使所述酶的氨基末端氨基酸与羧基末端氨基酸紧密接近,并且使每端均与所述亚基或其变体序列中的邻近氨基酸结合。在一个优选实施方案中,将所述酶插入所述亚基的环区中。在另一个优选实施方案中,所述亚基与所述酶在化学上融合。如果亚基与酶在化学上结合,例如通过一个接头分子结合,则这两部分在化学上融合。所述亚基可通过六-组氨酸标签或Ni-NTA短暂地与所述酶结合。还可对所述亚基和酶进行修饰从而使它们短暂地相互结合。所述构建体保留有所述亚基的形成孔的能力。所述亚基的形成孔的能力通常由其 α-螺旋和链提供。桶状孔包含由链构成的桶状体或通道,而α-螺旋束状孔包含由α-螺旋构成的桶状体或通道。α-螺旋和链通常通过环区连接。为避免影响所述亚基的孔形成能力,优选使所述酶与所述亚基的环区在基因上融合,或插入所述亚基的环区中。下面更详细地讨论具体亚基的环区。类似地,所述构建体保留有所述核酸操作所述酶的能力,所述能力通常由其二级结构元件(α-螺旋和链)和三级结构元件提供。为避免影响所述酶的核酸操作能力, 优选使所述酶与所述亚基在基因上融合,或经不影响其二级或三级结构的残基或区域插入所述亚基中。所述亚基可与所述酶直接结合。优选使用一个或多个例如两个或三个接头使所述亚基与所述酶结合。可设计一个或多个接头以限制所述酶的可动性。所述接头可与所述亚基和/或酶中的一个或多个反应性半胱氨酸残基、反应性赖氨酸残基或非天然氨基酸结合。合适的接头在本领域是公知的。合适的接头包括但不限于化学交联剂和肽接头。优选的接头是氨基酸序列(即肽接头)。通常对所述肽接头的长度、柔性和亲水性进行设计使其不扰乱所述亚基和酶的功能。优选的柔性肽接头为2-20个,例如4、6、8、10或16个丝氨酸和/或甘氨酸的片段。更优选的肽接头包括(SG) ” (SG)2, (SG) 3、(SG)4, (SG) 5和(SG)8,其中S为丝氨酸,G为甘氨酸。优选的刚性肽接头为2-30个,例如4、6、8、16或M个脯氨酸的片段。更优选刚性接头包括(P)12,其中P为脯氨酸。接头可先与所述亚基结合再与所述酶结合,先与所述酶结合再与所述亚基结合, 或者与所述酶和亚基同时结合。当所述接头与所述亚基结合时,其可为单体亚基、两个或多个单体的寡聚体的一部分或完整寡聚孔的一部分。所述接头优选在任何除去任何未结合接头的纯化步骤之前反应。使所述亚基与所述酶结合的一个优选方法是经半胱氨酸连接。这可通过双官能化学接头或通过末端具有半胱氨酸残基的多肽接头介导。α-HL (SEQ ID NO : 无天然半胱氨酸残基,因此将半胱氨酸引入到SEQ ID NO :2的序列中可实现所述酶与所述亚基受控制的共价结合。可在多个位置引入半胱氨酸,例如SEQ ID N0:2的位置K8、T9或附7或在SEQ ID NO :2的羧基末端。可对任何双官能接头的长度、反应性、特异性、刚性和溶解度进行设计以确保所述酶相对所述亚基的位置正确并且所述亚基和所述酶的功能均得以保持。合适的接头包括双马来酰亚胺交联剂,例如1,4_双(马来酰亚胺)丁烷(BMB)或双(马来酰亚胺)己烷。双官能交联剂的一个缺点是需要酶不含其他表面可及的半胱氨酸残基,因为所述双官能接头与这些残基的结合不可控制并可影响底物结合或活性。如果所述酶含有几个可及的半胱氨酸残基,那么可能需要对所述酶进行修饰以除去这些残基同时确保所述修饰不影响所述酶的折叠或活性。在一个优选实施方案中,与所述酶在基因上结合的肽接头上存在一个反应性半胱氨酸。这意味着不需要其他修饰来从所述酶除去其他可及的半胱氨酸残基。半胱氨酸残基的反应性可通过修饰例如在肽接头上的邻近残基进行增强。例如,侧翼精氨酸、组氨酸或赖氨酸残基的碱性基团会将半胱氨酸硫醇基团的PKa改变为更大反应性的S_基团的pKa。半胱氨酸残基的反应性可被巯基保护基团例如dTNB所保护。这些保护基团可在接头结合之前与所述酶或亚基的作为单体或寡聚体的一部分的一个或多个半胱氨酸残基反应。亚基或酶与它们自身的交联可通过保持接头的浓度远过量于所述亚基和/或酶而防止。或者,可使用“锁匙”配置,其中使用了两种接头。每种接头只有一端可一起反应以形成更长的接头并且接头的另一端各自与所述构建体(即亚基或单体)的不同部分反应。选择共价结合的位点以使得当所述构建体用于形成孔时,所述酶操作靶核酸序列的方式使得靶序列中一部分核苷酸与所述孔相互作用。然后基于核苷酸在相互反应过程中影响流过所述孔的电流的不同方式来识别核苷酸。存在多种使用孔来测序核酸分子的方式。一种方式涉及使用核酸外切酶例如脱氧核糖核酸酶。在此方法中,所述核酸外切酶用于使核苷酸从靶核酸链上序贯分离。然后按核苷酸脱离的顺序通过孔检测并辨别所述核苷酸,从而读出原始链的序列。对于这一实施方案,优选使所述核酸外切酶与所述亚基结合从而使从靶核酸上脱离的一部分核苷酸能够进入一种包含所述构建体的孔的桶状体或通道并与其相互作用。优选使所述核酸外切酶与所述亚基在这样的位置结合,即与所述亚基中的某一部分紧密接近的位点,所述部分形成所述孔的桶状体或通道的开口。更优选地,所述核酸外切酶与所述亚基的结合使所述核酸外切酶的核苷酸离去轨线位点朝向所述亚基中的某一部分,所述部分形成所述孔的开口部分。测序核酸的另一种方式涉及使用将所述靶核酸链推过或拉过所述孔的酶。在此方法中,离子电流随着靶链中的核苷酸通过所述孔而波动。所述电流波动指示该链的序列。 对于这一实施方案,优选地,所述酶与所述亚基的结合使所述酶能够将所述靶核酸推过或拉过包含所述构建体的孔的桶状体或通道,并且不干扰通过所述孔的离子电流的流动。优选使所述酶与所述亚基在这样的位点上结合,即与所述亚基中的某一部分紧密接近的位点上,所述部分形成所述孔的桶状体或通道的开口部分。更优选地,所述酶与所述亚基的结合使所述酶的活性位点朝向所述亚基中的某一部分,所述部分形成所述孔的开口部分。第三种测序核酸链的方法是检测与孔检测器紧密接近的聚合酶的副产物 (bi-product) 0在此方法中,对核苷磷酸(核苷酸)进行标记从而使磷酸标记物质在将聚合酶加至核苷酸链后释放,并且通过所述孔检测所述磷酸标记物质。所述磷酸物质含有对每种核苷酸特异的标记物。随着将核苷酸序贯加至所述核酸链,加入碱基的副产物被检测。 所述磷酸标记物质被检测的顺序可用于确定所述核酸链的序列。优选使所述酶与所述亚基的某一部分结合,所述部分形成包含所述构建体的孔的顺面(cis side)部分。在电生理学中,所述顺面为接地面。如果溶血素孔被正确插入电生理学装置中,那么帽区(Cap region)在所述顺面上。公知的是,在正电势下,核苷酸会从用于随机传感的孔的顺面迁移向反面(trans side)。将所述酶置于孔的顺面使得所述酶对靶核酸的操作可将所述序列中的一部分核苷酸进入所述孔的桶状体或通道并与其相互作用。优选地,所述序列中至少20 %、至少40 %、至少50 %、至少80 %或至少90 %的核苷酸进入所述孔的桶状体或通道并与其相互作用。优选地,选择共价结合的位点和方法以使得所述酶的可动性受限。这可帮助确保所述酶以这样的方式操作所述靶核酸序列,即所述方式可以使所述靶序列中的一部分核苷酸与所述孔相互作用。例如,限制酶移动的能力意味着所述酶的活性位点可永远朝向所述亚基的某一部分,所述部分形成所述孔的桶状体或通道的开口部分。所述酶的可动性可通过增加所述酶与所述亚基结合的点的数量和/或使用具体的接头而限制。亚基本发明的构建体包含跨膜蛋白孔的一个亚基。跨膜蛋白孔是一个多肽或一系列多肽,所述多肽允许由外加电势驱动的离子从膜的一面流过。优选地,所述孔允许核苷酸沿外加电势从膜的一面流至另一面。优选地,所述孔可将核酸例如DNA或RNA推过或拉过所述孔。所述亚基是孔的一部分。所述孔可为单体或寡聚体。优选地,所述亚基可构成由几个重复亚基例如6、7或8个亚基构成的孔的一部分。更优选地,所述亚基可构成七聚体孔的一部分。所述亚基通常可构成其中可流过所述离子的桶状体或通道的一部分。所述孔的亚基通常环绕一个中心轴,并促进链进入β桶状体或通道或又跨者膜α-螺旋束状体或通道。当作为本发明构建体的一部分时,所述亚基可为单体或寡聚体孔的一部分。所述亚基通常构成孔的一部分,所述孔的桶状体或通道包含有助于与核苷酸或核酸相互作用的氨基酸。优选地,这些氨基酸的位置靠近所述桶状体或通道的收缩区处。所述亚基通常包含一个或多个带正电的氨基酸,例如精氨酸、赖氨酸或组氨酸。这些氨基酸通常通过与核苷酸或核酸中的磷酸基团相互作用或者通过与核苷酸或核酸中的碱基的η-阳离子相互作用而有助于所述孔与核苷酸或核酸之间的相互作用。衔接体可有助于所述核苷酸检测。适合用于本发明的亚基可源于β -桶状孔或α -螺旋束状孔。β -桶状孔包含由链构成的桶状体或通道。合适的桶状孔包括但不限于毒素例如α-溶血素
和杀白细胞素,细菌的外膜蛋白/孔蛋白例如外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷酸酯酶A和奈瑟球菌属(Neisseria)自转运脂蛋白(NalP)。α-螺旋束状孔包含由 α-螺旋构成的桶状体或通道。合适的α-螺旋束状孔包括但不限于内膜蛋白和α外膜蛋白例如WZA。优选地,所述亚基源于α -溶血素(a -HL)。野生型α -HL孔由7个相同的单体或亚基构成(即,其是七聚体)。α-溶血素的一个野生型单体或亚基的序列示于SEQ ID NO 2。本发明构建体中的亚基优选地包含SEQ ID NO :2中所示的序列或其变体。SEQ ID NO: 2 的氨基酸 1、7-21、31-34、45-51、63-66、72、92-97、104-111、1对-136、149-153、160-164、 173-206、210-213、217、218、223-228、236-242、262-265、272-274、287-290 和 294 构成环区。优选地,所述酶与SEQ ID N0:2的氨基酸8、9、17、18、19、44、45、50和51中的一个或多个结合。更优选地,所述酶插入SEQ ID NO 2的氨基酸18与19、44与45或者50与51之间。SEQ ID NO 2的变体是具有从SEQ ID NO :2变化而来但保留有其孔形成能力的氨基酸序列的亚基。所述变体形成孔的能力可如上文所述进行测定。所述变体可包括有助于与所述核酸操作酶共价结合或与其相互作用的修改。优选地,所述变体包含有助于与所述酶结合的一个或多个反应性半胱氨酸残基。例如,所述变体可在SEQ ID N0:2的8、9、17、 18、19、44、45、50和51位中的一个或多个和/或氨基或羧基末端上包括半胱氨酸残基。优选的变体包含对SEQ ID N0:2的位置8、9或17上的残基的半胱氨酸置换(K8C、T9C或附70。可修饰所述变体以有助于所述酶的基因融合。例如,可修饰例如缺失邻近插入位点的一个或多个残基以有助于所述酶和/或接头的插入。如果将所述酶插入SEQ ID NO 2 的环2中,那么可缺失SEQ IDNO 2的残基D45、K46、N47、H48、N49和K50中的一个或多个。 含有所述缺失的一个优选构建体包含SEQ ID NO :26中所示的序列或其变体。所述变体还可包括有助于与核苷酸的任何相互作用或有助于下文讨论的分子衔接体的取向的修饰。所述变体还可含有有助于分子衔接体的共价结合的修饰。所述亚基可以是要求美国专利申请61/078,687的优先权并与本申请同时提交的共同待决的国际专利申请[J A Kemp&Co Ref :N. 104403A ;Oxford Nanolabs Ref ONL IP 004]中记载的SEQ ID NO :2的变体中的任一种。该申请的所有教导均可同等地适用于本申请。具体地,所述变体优选地在SEQ ID NO :2的139位上具有谷氨酰胺。所述变体优选地在SEQ ID NO 2的113位上具有精氨酸。所述变体优选地在SEQ ID NO 2的119、121或 135位上具有半胱氨酸。在所述共同待决申请的SEQ ID N0:4、6、8、10、12和14中所示的 SEQ ID NO :2变体中的任一种均可用于形成本发明的构建体。所述亚基可以是由生物体例如葡萄球菌属Staphylococcus)细菌表达的天然变体。变体还可包括通过重组技术产生的非天然变体。在SEQ ID NO :2的整个氨基酸序列长度上,基于氨基酸同一性,变体优选与该序列至少50%同源。在SEQ ID NO :2的氨基酸序列的整个序列上,基于氨基酸同一性,所述亚基多肽更优选地可以与该序列至少阳%、至少 60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%并且更优选地至少 95%、97%或99%同源。在200或更多个例如230、250、270或280或更多个连续氨基酸的片段上存在至少80%例如至少85^^90%或95%的氨基酸同一性(“硬同源性”)。除上面讨论的以外,还可对SEQ ID NO :2的氨基酸序列进行氨基酸置换,例如最多多至1、2、3、4、5、10、20或30个置换。保守性置换可例如根据下表1进行。表1.保守性置换第二列同一格中的氨基酸,优选第三列同一行中的氨基酸可相互置换。
非芳香族非极性GAPILV极性、不荷电CSTMNQ极性、荷电DEHKR芳香族HFWY 还可从上文描述的多肽中额外缺失SEQ ID NO :2的氨基酸序列的一个或多个氨基酸残基。可以缺失最多达1、2、3、4、5、10、20或30个残基,或者更多个。变体可为SEQ ID NO 2的片段。这类片段保留了孔形成活性。片段长度可为至少 50、100、200或250个氨基酸。片段优选地包含SEQ ID NO :2的孔形成结构域。片段通常包括 SEQ ID NO 2 的残基 119、121、135、113 和 139。可将一个或多个氨基酸替代地或额外地加至上述的多肽上。在SEQ ID NO 2或其多肽变体或片段的氨基酸序列的氨基端或羧基端,可提供一段延长片段。所述延长片段可以非常短,例如长度为1-10个氨基酸。或者,所述延长物可以较长,例如最多达50或100 个氨基酸。可将载体蛋白融合于亚基或变体。如上面所讨论的,SEQ ID NO 2的变体是是这样的亚基,即该亚基具有不同于SEQ ID NO :2序列的氨基酸序列且保留了其形成孔的能力。变体一般包含SEQ ID NO :2中负责孔形成的区域。包含桶状体的α-HL的孔形成能力由每个亚基的β-链提供。SEQ ID NO 2的变体一般包含SEQ ID NO 2中可形成β -链的区域。上文已讨论SEQ ID NO 2形成β-链的氨基酸。可对SEQ ID NO :2中可形成β-链的区域进行一个或多个修改,条件是所形成的变体保留其形成孔的能力。可对SEQ ID Ν0:2的链区域进行的具体修改在上文中详述。SEQ ID NO 2的变体优选在其α -螺旋和/或环区中包括一个或多个修改,例如置换、添加或缺失。上面讨论了构成α-螺旋和/或环的氨基酸。可以用本领域的标准方法确定同源性。例如UWGCG软件包提供的BESTFIT程序可以用于计算同源性(例如使用它的默认设置)(Devereux et al (1984) Nucleic Acids Research 12,387-395) 例如,如 Altschul S. F. (1993) J Mol Evol 36:290-300; Altschul,S,F et al(1990)J Mol Biol 215 :403-10 中所述,可以使用 PILEUP 和 BLAST 算法计算同源性或者对序列进行比对(例如鉴定等价残基或相应的序列(一般使用它们的默认设置))。进行BLAST分析的软件可以从美国国家生物技术信息中心(National Center for Biotechnology Information) (http://www. ncbi. nlm. nih. gov/)公开获得。所述算法涉及到首先鉴定高分值序列对(HSP),这个步骤是通过如下方式实现在查询序列中鉴定长度为W的短字长,所述短字长当与数据库序列中相同长度的字比对的时候匹配或者满足某个正值的阈值Τ。T是指邻近字值阈值(Altschul et al,见上文)。将这些初始邻近字长匹配作为种子启动检索,以发现包含它们的HSP。在每条序列的两个方向的每个方向进行字长匹配延伸,到达累积比对分值能够增加的极限。在每个方向上的字长匹配的延伸停止的条件是所述累积比对分值从其所达到的最大值下降X量;由于一个或多个负得分残基比对的累计,所述累积分值降到0或小于0 ;或者达到任何一个序列的端点。所述BLAST算法的参数W、T和X决定了比对的敏感度和速度。所述BLAST程序使用的默认字长(W)为 11,BL0SUM62 打分矩阵(见 Henikoff and Henikoff (1992) Proc. Natl. Acad. Sci. USA 89 10915-10919)比对(B)为50,期望(E)为10,M = 5,N = 4,并且是进行双链比较。所述BLAST算法可进行两个序列之间的相似性的统计分析;参见例如Karlin and Altschul (1993) Proc. Natl. Acad. Sci. USA 90 :5873_5787。所述 BLAST 算法提供的一种相似性的量度是最小和概率(P(N)),所述最小和概率表示两个氨基酸序列之间随机出现匹配的概率。例如,如果一个序列与另一个序列比较中的最小和概率小于约1,优选小于约0. 1,更优选小于约0. 01,并且最优选小于约0. 001,那么第一序列被认为与第二序列相似。对所述变体的修改可通过以下方式进行,例如可通过添加组氨酸或天冬氨酸残基以帮助其鉴定或纯化,或者可通过在所述多肽天然地不含信号序列的情况下添加这类序列以促进其从细胞的分泌。可将所述亚基以显示标记物标记。所述显示标记物(revealing label)可以是使所述孔可被检测的任何合适标记物。合适的标记物包括但不限于荧光分子;放射性同位素例如125I、MS ;酶;抗体;抗原;多核苷酸;以及配体例如生物素。此亚基可分离自产生孔的生物体例如金黄色葡萄球菌Staphylococcus aureus),或者可通过合成或通过重组方式制备。例如,所述亚基可通过体外翻译和转录进行合成。所述亚基的氨基酸序列可被修改,以包括非天然氨基酸或者以增加所述亚基的稳定性。如果所述亚基通过合成方式产生,那么这类氨基酸可以在产生亚基的过程中引入。还可以在合成或重组产生后对所述亚基进行改变。所述亚基还可以使用D-氨基酸产生。例如,所述孔可包含L-氨基酸和D-氨基酸的混合物。这类蛋白或肽的生产是本领域中常规的。所述亚基还可含有其他非特异性化学修改,只要这些修改不干扰所述亚基形成孔的能力。许多非特异性侧链修改是本领域中已知的,并且可对所述孔的侧链进行这些修改。 例如,这类修改包括对氨基酸的还原烷基化(按照如下方式进行首先与醛反应,然后以 NaBH4进行还原)、以甲基乙酰亚胺进行脒基化或者以乙酸酸酐进行酰化。对所述亚基的修改可在所述亚基或构建体的表达之后或者已使用所述亚基形成孔之后进行。可以使用本领域中已知的标准方法产生所述亚基。可以使用本领域中的标准方法分离和复制编码亚基的多核苷酸序列。这类序列在下文有更详细的叙述。可以使用本领域中的标准技术将编码亚基的多核苷酸序列在细菌宿主细胞中表达。所述亚基可以通过在细胞中以重组表达载体原位表达所述多肽产生。所述表达载体任选地携带诱导型启动子以控制所述多肽的表达。亚基可通过如下方式大规模产生从产生孔的生物体或者在如下文所述的重组表达后通过任一种蛋白质液相色谱体系进行纯化。一般的蛋白质液相色谱系统包括FPLC、 AKTA 系统、Bio-Cad 系统、Bio-fcid BioLogic 系统和 Gilson HPLC 系统。核酸操作酶本发明的构建体包含核酸操作酶。核酸操作酶是能够与核酸相互作用并改变核酸的至少一种性质的多肽。所述酶可通过将核酸裂解以形成单个核苷酸或更短的核酸链例如二核苷酸或三核苷酸而修改所述核酸。所述酶可通过将核酸取向至具体位置或将其移动至具体位置而修改所述核酸。核酸是一种包含两个或更多个核苷酸的大分子。由所述酶操作的核酸可包含任何核苷酸的任意组合。所述核苷酸可为天然的或人工的。一个核苷酸通常含有一个核碱基、 一个糖和至少一个磷酸基团。所述核碱基通常是杂环。核碱基包括但不限于嘌呤和嘧啶, 更具体是腺嘌呤、鸟嘌呤、胸腺嘧啶、尿嘧啶和胞嘧啶。所述糖通常为戊糖。核苷酸糖包括但不限于核糖和脱氧核糖。所述核苷酸通常为核糖核苷酸或脱氧核糖核苷酸。所述核苷酸通常含有单磷酸基、双磷酸基或三磷酸基。磷酸基可结合在核苷酸的5’或3’侧。核苷酸包括但不限于单磷酸腺苷(AMP)、二磷酸腺苷(ADP)、三磷酸腺苷(ATP)、单磷酸鸟苷酸(GMP)、二磷酸鸟苷(GDP)、三磷酸鸟苷(GTP)、单磷酸胸苷酸(TMP)、二磷酸胸苷(TDP)、三磷酸胸苷(TTP)、单磷酸尿苷(UMP)、二磷酸尿苷(UDP)、三磷酸尿苷(UTP)、 单磷酸胞苷(CMP)、二磷酸胞苷(CDP)、三磷酸胞苷(CTP)、环单磷酸腺苷(cAMP)、环单磷酸鸟苷(cGMP)、单磷酸脱氧腺苷(dAMP)、二磷酸脱氧腺苷(dADP)、三磷酸脱氧腺苷(dATP)、 单磷酸脱氧鸟苷(dGMP)、二磷酸脱氧鸟苷(dGDP)、三磷酸脱氧鸟苷(dGTP)、单磷酸脱氧胸苷(dTMP)、二磷酸脱氧胸苷(dTDP)、三磷酸脱氧胸苷(dTTP)、单磷酸脱氧尿苷(dUMP)、二磷酸脱氧尿苷(dUDP)、三磷酸脱氧尿苷(dUTP)、单磷酸脱氧胞苷(dCMP)、二磷酸脱氧胞苷 (dCDP)和三磷酸脱氧胞苷(dCTP)。所述核苷酸优选是AMP、TMP、GMP、UMP、dAMP、dTMP、dGMP 或 dCMP。由所述酶操作的核酸优选是双链的,例如DNA。由所述酶操作的核酸可以是单链的,例如cDNA或RNA。操作单链核酸的酶可用于测序双链DNA,只要该双链DNA在由该酶操作之前通过化学或加热方式离解为单链。知晓核酸操作酶的三级结构是优选的。知晓所述酶的三维结构使得可对酶进行修改以有助于其在本发明的构建体或孔中发挥功能。所述酶可为任意大小并可具有任何结构。例如,所述酶可为寡聚体,例如二聚体或三聚体。所述酶优选地为由一个单体构成的小的、球状的多肽。这种酶易于操作并且不太可能干扰所述亚基的孔形成能力,特别是在与所述亚基的序列融合或插入所述亚基的序列中时。所述酶的氨基和羧基末端优选紧密接近。所述酶的氨基和羧基末端更优选处于酶的同一面上。这种实施方案有助于所述酶插入到所述亚基的序列中。例如,如果所述酶的氨基和羧基末端紧密接近,那么每端均可通过与所述亚基序列中邻近氨基酸的基因融合而
纟口口。知晓所述酶的活性位点的位置和功能也是优选的。这可避免对活性位点进行破坏所述酶活性的修改。这还使得所述酶可与所述亚基结合,从而使得所述酶以这样方式操作所述靶核酸序列,即所述靶序列中的一部分核苷酸与所述孔相互作用。有利地是,使所述酶的活性位点的位置与所述亚基的某一部分尽可能近,所述部分构成所述孔桶状体或通道的开口部分,而酶自身不呈现对电流流动的阻断。知晓酶以何种方式定向核酸还使得可设计出有效构建体。如在下文更详细讨论的,可能必需纯化本发明的构建体。优选地,所述酶能够承受用于纯化所述构建体的条件。本发明构建体可用于形成孔。这些孔可用于测序核酸。为使靶核苷酸中的大多数核苷酸为随机传感所正确识别,所述酶必需在与辨别核苷酸相适应的缓冲条件下操作所述核酸。所述酶优选地在远高于正常生理水平例如100mM-500mM的盐浓度下至少具有剩余活性。更优选地,对所述酶进行修改以提高其在高盐浓度下的活性。还可对所述酶进行修改以提高其持续操作能力、稳定性和保存期。合适的修改可通过对嗜极微生物例如嗜盐和中度嗜盐细菌、嗜热和中度嗜热生物的核酸操作酶进行表征来确定,以及通过改变嗜温或嗜热核酸外切酶的耐盐性、稳定性和温度依赖性的直接进化方法确定。所述酶还优选在室温下至少保留有部分活性。这使得由所述构建体形成的孔可在室温下测序核酸。
所述核酸操作酶优选溶核酶。所述核酸操作酶更优选是酶分类(EC)组3. 1. 11、 3,3. 1. 14,3. 1. 15,3. 1. 16,3. 1. 21,3. 1. 22,3. 1. 25,3. 1. 26,3. 1. 27,3. 1. 30 和 3. 1. 31的任一组的成员。所述核酸操作酶更优选是以下酶的任一种
3. 1 3. 1
11.-产生5’ -磷酸单酯的脱氧核糖核酸外切酶。
11. 1脱氧核糖核酸外切酶I。
11. 2脱氧核糖核酸外切酶III。
11. 3脱氧核糖核酸外切酶(λ诱导的)。
11. 4脱氧核糖核酸外切酶(噬菌体SP3诱导的)。
11. 5脱氧核糖核酸外切酶V。
11. 6脱氧核糖核酸外切酶VII。
13.-产生5’ -磷酸单酯的核糖核酸外切酶。
13. 1核糖核酸外切酶II。
13. 2核糖核酸外切酶H。
13. 3寡核苷酸酶。
13. 4Poly(A)特异的核糖核酸酶。
13.5核糖核酸酶D。
14.-产生3’-磷酸单酯的核糖核酸外切酶。
14.1酵母核糖核酸酶。
15.-对核糖核酸或脱氧核糖核酸具有产生5’-磷酸J
腊的活性的核酸外切
15.1毒液核酸外切酶。
16.-对核糖核酸或脱氧核糖核酸具有产生3’-磷酸单酯的活性的核酸外切 16. 1脾核酸外切酶。
21.-产生5’ -磷酸单酯的脱氧核糖核酸内切酶。 21. 1脱氧核糖核酸酶I。
21. 2脱氧核糖核酸酶IV(噬菌体T(4)诱导的)。 21. 31型位点特异的脱氧核糖核酸酶。 21. 411型位点特异的脱氧核糖核酸酶。 21. 5ΙΙΙ型位点特异的脱氧核糖核酸酶。 21. 6CC偏爱的脱氧核糖核酸内切酶。
21.7脱氧核糖核酸酶V。
22.-不产生5’-磷酸单酯的脱氧核糖核酸内切酶。 22. 1脱氧核糖核酸酶II。
22.2曲霉(Aspergillus)脱氧核糖核酸酶K(I)。 22. 3转至登记号3. 1. 21. 7。
22. 4跨结(crossover junction)脱氧核糖核酸内切酶。 22. 5脱氧核糖核酸酶X。
3.1.25,
3.1.25,
3.1.25,
3.1.26,
3.1.26,
3.1.26,
3.1.26,
3.1.26,
3.1.26,
3.1.26,
3.1.26,
3.1.26,
3.1.26,
3.1.26,
3.1.26,
3.1.27,
3.1.27,
3.1.27,
3.1.27,
3.1.27,
3.1.27,
3.1.27,
3.1.27,
3.1.27,
3.1.27,
3.1.27,
3.1.30,内切酶。
3.1.30,
3.1.30,
3.1.31,内切酶。
3.1.31,
所述酶.
-对改变的碱基特异的位点特异性脱氧核糖核酸内切酶。 1脱氧核糖核酸酶(嘧啶二聚体)。 2转至登记号4. 2. 99. 18。 沈.-产生5’ -磷酸单酯的核糖核酸内切酶。
1多头绒泡菌(Wiysarum polycephalum)核糖核酸酶。 2核糖核酸酶α。 3核糖核酸酶III。 4核糖核酸酶H。 5核糖核酸酶P。 6核糖核酸酶IV。 7核糖核酸酶Ρ4。 8核糖核酸酶Μ5。 9核糖核酸酶(poly (U)特异的)。 10核糖核酸酶IX。 11核糖核酸酶Z。 27.-不产生5’ -磷酸单酯的核糖核酸内切酶。 1核糖核酸酶T O)。
2枯草芽胞杆菌(Bacillus subtilis)核糖核酸酶。 3核糖核酸酶T(l)。 4核糖核酸酶U O)。 5胰腺核糖核酸酶。 6肠杆菌(Enterbacter)核糖核酸酶。 7核糖核酸酶F。 8核糖核酸酶V。 27. 9tRNA-内含子核酸内切酶。 27. IOrRNA核酸内切酶。
30.-对核糖核酸或脱氧核糖核酸具有产生5’ -磷酸单酯的活性的核糖核酸
1曲霉核酸酶S(I)。
2粘质沙雷氏菌(Serratia marcescens)核酸酶。 31.-对核糖核酸或脱氧核糖核酸具有产生3’ -磷酸J
1微球菌(micrococcal)核酸酶。
丨的活性的核糖核酸
脱氧核糖核酸外切酶的优点在于其对单链和双链DNA均有活性并以5’ -3'方向或3’ -5’ 方向水解碱基。 单个核苷酸是单核苷酸。单个核苷酸是不通过核苷酸键与另一个核苷酸或核酸结合的核苷酸。核苷酸键涉及一个核苷酸的磷酸基团之一结合于另一个核苷酸的糖基。单个核苷酸通常是不通过核苷酸键与另一个至少5、至少10、至少20、至少50、至少100、至少200、至少500、至少1000或至少5000个核苷酸的核酸序列结合的核苷酸。优选的用于所述方法的酶包括大肠杆菌的核酸外切酶III (SEQ ID NO 10)、大肠杆菌的核酸外切酶I (SEQ ID NO: 12)、嗜热栖热菌的RecJ (SEQ ID NO 14)和噬菌体λ核酸外切酶(SEQ ID NO 16)及其变体。所述核酸外切酶优选地包含SEQ ID NO :10、12、14和 16所示的序列的任一个或其变体。SEQ ID NO :16的3个相同亚基相互作用以形成一种三聚体核酸外切酶。SEQ ID NO 10、12、14或16的变体是具有从SEQ ID NO 10、12、14或16 变化而来但保留有其核酸操作能力的氨基酸序列的酶。所述酶可包括有助于操作核酸和/ 或有助于其在高盐浓度和/或室温下的活性的修改。所述酶可包括有助于与所述亚基共价结合或相互作用的修改。如上面所讨论的,可从所述酶中除去可及的半胱氨酸以避免与接头的非特异性反应。或者,可将一个或多个反应性半胱氨酸引入所述酶中——例如作为基因融合的肽接头的一部分——以有利于与所述亚基的结合。变体可与SEQ ID NO 10、12、14和16不同,所述不同程度与上面讨论的SEQ ID NO 2的变体与SEQ ID NO 2的不同程度相同。SEQ ID NO 10、12、14或16的变体保留有其核酸操作活性。变体通常包含SEQ ID NO: 10、12、14或16中负责核酸操作活性的区域。上文讨论了 SEQ ID NO 10、12、14和16的催化结构域。SEQ ID NO: 10、12、14或16的变体优选地包含相关催化结构域。SEQ ID NO: 10、12、14或16的变体通常在所述相关催化结构域之外包括一种或多种修改,例如置换、插入或缺失。优选的能够将所述靶核酸序列推过或拉过所述孔的酶包括聚合酶、核酸外切酶、 解螺旋酶和拓扑异构酶例如促旋酶。所述聚合酶优选酶分类(EC)组2. 7. 7. 6,2. 7. 7. 7、 2. 7. 7. 19,2. 7. 7. 48和2. 7. 7. 49的任一组的成员。所述聚合酶优选依赖DNA的DNA聚合酶、依赖RNA的DNA聚合酶、依赖DNA的RNA聚合酶或依赖RNA的RNA聚合酶。所述解螺旋酶优选酶分类(EC)组3. 6. 1.-和2. 7. 7.-的任一组的成员。所述解螺旋酶优选依赖ATP 的DNA解螺旋酶(EC组3. 6. 1. 8)、依赖ATP的RNA解螺旋酶(EC组3. 6. 1. 8)或不依赖ATP 的RNA解螺旋酶。所述拓扑异构酶优选酶分类(EC)组5. 99. 1. 2和5. 99. 1. 3的任一组的成员。所述酶可被显示标记物所标记。所述显示标记物可为上文所述的显示标记物的任一种。此酶可从产生酶的生物体例如大肠杆菌、嗜热栖热菌或噬菌体分离,或者可通过合成或通过重组方式制备。例如,所述酶可通过上文和下文所述的体外翻译和转录合成。所述酶可在如上文所述的纯化后大规模产生。优选的构建体本发明的优选构建体包含SEQ ID NO :18,20,22,24,26,28和30的任一项所示的序列或其变体。SEQ ID而18、20、22、对、26、观或30的变体必须保留有其孔形成能力和核酸操作能力。变体可与SEQ ID NO :18、20、22、对、26、观和30不同,所述不同的程度和方式可与上文讨论的SEQ ID NO 2的变体以及SEQ ID NO :10、12、14或16的变体相同。多核苷酸序列本发明还提供编码一种构建体的多核苷酸序列,在所述构建体中所述酶与所述亚基基因融合或者插入所述亚基的序列中。容易想到使用标准技术来产生这种多核苷酸序列。编码所述酶的多核苷酸序列与编码所述亚基的多核苷酸序列融合或者插入编码所述亚基的多核苷酸序列中。所述融合或插入通常是框内(in frame)的。如果编码所述酶的多核苷酸序列插入编码所述亚基的多核苷酸序列中,那么编码所述酶的序列的两端通常侧接有限制性内切酶位点,例如为BspEl所识别的位点。其两端还可以侧接有编码接头的多核苷酸序列,例如每个均编码丝氨酸或甘氨酸的5-10个密码子。所述多核苷酸序列优选编码如下构建体,所述构建体包含与SEQ ID NO 2或其变体基因融合或者插入SEQ ID NO :2或其变体中的SEQ ID NO 10、12、14或16或其变体。SEQ ID NO :2、10、12、14和16的变体可为上文所讨论的变体的任一种。SEQ ID N0:10、12、14或 16或其变体可与上文所述的SEQ ID NO 2或其变体基因融合或者插入SEQ ID NO 2或其
变体中。所述多核苷酸序列优选包含与SEQ ID NO 1或其变体基因融合或者插入SEQ ID NO :1或其变体中的SEQ ID NO :9、11、13或15或其变体。因此SEQ ID NO :9、11、13或15 或其变体优选在SEQ ID NO 1的核苷酸2765与2766、2843与观44或者观61与观62之间插入SEQ ID NO :1或其变体中。所述多核苷酸更优选包含SEQ ID NO :17、19、21、23、25、27 或四所示的序列或其变体。基于核苷酸同一性,SEQID NO :1、9、11、13、15、17、19、21、23、25、27 或 29 的变体的序列与 SEQ ID NO :1、9、11、13、15、17、19、21、23、25、27 或 29 的序列在全长上至少 50%、 60%、70%、80%、90%或95%同源。在600或更多个例如700、750、850或900或更多个连续核苷酸的片段上可有至少80%例如至少85^^90%或95%的核酸同一性(“硬同源性”)。 同源性可按上文所述计算。所述多核苷酸序列可包含基于遗传密码的简并性不同于SEQ ID NO :1、9、11、13、15、17、19、21、23、25、27 或 29 的序列。可使用本领域中的标准方法分离和复制多核苷酸序列。可从产生孔的生物例如金黄色葡萄球菌和/或产生酶的生物例如大肠杆菌、嗜热栖热菌或噬菌体提取染色体DNA。可以使用涉及特定引物的PCR来扩增编码所述亚基和酶的基因。然后,可以将所扩增的序列整合至可复制的重组载体例如克隆载体中。所述载体可以用于在相容宿主细胞中复制所述多核苷酸。因此,可以通过如下方式制备编码亚基和/或酶的多核苷酸序列将编码亚基和 /或酶的多核苷酸引入可复制载体中,将所述载体引入相容的宿主细胞中,并在可使所述载体进行复制的条件下培养所述宿主细胞。可以从所述宿主细胞回收所述载体。用于克隆多核苷酸的合适宿主细胞是本领域中已知的,并且将在下文中更详细地叙述。可以将所述多核苷酸克隆至合适的表达载体中。在表达载体中,编码构建体的多核苷酸一般有效连接于能够允许所述宿主细胞表达所述编码序列的控制序列。这类表达载体可用于表达构建体。术语“有效连接”指一种并置关系,在该并置关系中,所描述的组件处于能使它们以预期的方式发挥功能的关系中。“有效连接”到编码序列的控制序列以这样的方式连接, 即在与所述控制序列相适应的条件下可实现所述编码序列的表达。可以将多拷贝的相同或不同孔亚基序列弓I入至所述载体中。然后,可以将所述表达载体引入至合适的宿主细胞中。因此,可以通过如下方式产生构建体将编码构建体的多核苷酸插入表达载体中,将所述载体引入相容的细菌宿主细胞中,并在可使编码所述构建体的多核苷酸进行表达的条件下培养所述宿主细胞。重组表达的构建体可以自组装至所述宿主细胞膜中的孔中。或者,可以将以该方式产生的所述构建体从所述宿主细胞分离并插入至另一膜中。当产生包含本发明构建体与至少一种不同亚基的寡聚体孔时,可以将所述构建体与不同亚基分别在上述不同宿主细胞中表达,从所述宿主细胞中移出并在另外的膜例如兔细胞膜中装配为孔。所述载体可以是例如具有复制起始点的质粒、病毒或噬菌体载体,任选地其具有所述多核苷酸表达所用的启动子,还任选地具有所述启动子的调控子。所述载体可以包含一种或多种筛选标记物基因,例如四环素抗性基因。可以选择启动子和其他表达调节信号, 以使其与这样的宿主细胞相容,即所述表达载体是被设计用于该宿主细胞。一般可使用T7、
trc、lac、ara$ 入 ^^^ζ +ο所述宿主细胞一般以高水平表达所述构建体。选择用编码构建体的多核苷酸转化的宿主细胞作为与用于转化所述细胞的表达载体相容的宿主细胞。所述宿主细胞一般是细菌并优选是大肠杆菌(Escherichia coli)。具有λ DE3溶素原的任何细胞,例如C41 (DE3)、 BL21 (DE3)、JM109(DE3)、B834(DE3)、TUNER、0rigami 和 Origami B 可以表达包含 T7 启动子的载体。修改的孔本发明还提供用于测序核酸的改性孔。所述孔包含至少一个本发明构建体。所述孔可包含不止1个例如2、3或4个本发明构建体。本发明的孔可以是分离的、基本上分离的、纯化的或基本上纯化的。如果本发明的孔完全不含任何其他组分如脂质或其他孔,则该孔是分离的或纯化的。如果孔与不干扰其预期用途的载体或稀释剂混合,则所述孔是基本分离的。例如,如果孔以包含小于10%、小于5%、小于2%或小于的其他组分如脂质或其他孔的形式存在,则所述孔是基本分离或基本纯化的。或者,本发明的孔可以存在于脂质双层或表面活性剂胶束中。与所述构建体结合的酶以这样的方式操作靶核酸,即所述方式使得所述靶序列中的一部分核苷酸与所述孔、优选所述孔的桶状体或通道相互作用。然后基于其中核苷酸在相互反应过程中影响流过所述孔的电流的不同方式来识别核苷酸。所述酶的固有性质是指所述孔以特定的方式操作靶核酸序列。例如,每个核苷酸可以以持续的方式被从所述靶序列的一端消化,或者所述靶序列可被推过或拉过所述孔。 这确保所述靶序列中的一部分核苷酸与所述孔相互作用并被识别。在测序核酸时,信号中无任何中断是重要的。此外,所述酶和所述孔的固有性质是指它们可一起保存,从而可产生即用型传感器。在一个优选实施方案中,核酸外切酶例如脱氧核糖核酸酶与所述孔结合,从而使一部分核苷酸从靶核酸上释放并与所述孔的桶状体或通道相互作用。在另一个优选实施方案中,能够将所述靶核酸序列推过或拉过所述孔的酶与所述孔结合,从而将所述靶核酸序列推过或拉过所述孔的桶状体或通道并且所述靶序列的一部分核苷酸与所述桶状体或通道相互作用。在此实施方案中,所述核苷酸可在不止1个例如2、3或4个区块或组中与孔相互作用。合适的酶包括但不限于聚合酶、核酸外切酶、解螺旋酶和拓扑异构酶例如促旋酶。在每个实施方案中,均优选使所述酶在这样一个位点与所述孔结合,即所述位点与所述孔的桶状体或通道的开口紧密接近。更优选地,所述酶与所述孔的结合使所述酶的活性位点朝向所述孔的桶状体或通道的开口。这意味着所述靶核酸序列的一部分核苷酸进入所述桶状体或通道中。优选地,所述酶与所述孔的顺面结合。所述修改的孔可基于上文详述的跨膜蛋白孔的任一种,包括β-桶状孔和α-螺旋束状孔。对于包含SEQ ID NO :2所示序列或其变体的构建体,所述孔通常包含合适数量的包含SEQ ID NO 2所示序列或其变体的其他亚基。本发明一种优选的孔包含,1个包含SEQ ID NO :2所示序列或其变体的构建体,以及6个包含SEQ ID NO :2所示序列或其变体的亚基。所述孔可包含一个或多个包含SEQ ID NO :4所示序列或其变体的亚基。SEQ ID NO 4 示出了 SEQ ID NO 2的序列,不同之处在于其在113位具有精氨酸(M113R)以及在139位具有谷氨酰胺(N139Q)。SEQ ID NO :4的变体可与SEQ ID NO :4不同,所述不同的方式和程度可与上文对SEQ ID NO :2的讨论相同。本发明一种优选的孔包含1个包含SEQ ID NO 2 所示序列或其变体的构建体,以及6个包含SEQID NO 4所示序列或其变体的亚基。所述孔可包含有助于所述孔与所述核苷酸或所述靶核酸序列之间相互作用的分子衔接体。所述衔接体的存在可改善所述孔与核苷酸的主客体化学(host-guest chemistry),所述核苷酸是从所述靶核酸序列释放的或所述靶核酸序列中存在的。本领域公知主客体化学的原理。所述衔接体对所述孔的物理或化学性质具有提高所述孔与核苷酸相互作用的效应。所述衔接体通常改变所述孔的桶状体或通道的电荷;或特异地与核苷酸相互作用或结合,从而有利于所述核苷酸与所述孔的相互作用。所述衔接体可介导核苷酸与所述孔的相互作用,所述核苷酸是从所述靶核酸序列释放的或所述靶核酸序列中存在的。优选地,所述核苷酸经由所述衔接体或以与所述衔接体连接的方式可逆地结合于所述孔。最优选地,所述核苷酸在穿过跨膜的孔时,经由所述衔接体或者以与所述衔接体连接的方式可逆地结合于所述孔。所述核苷酸还可在穿过跨膜的孔时,经由所述衔接体或者以与所述衔接体连接的方式可逆地结合于所述孔的桶状体或通道。所述衔接体优选使所述桶状体或通道紧缩,使得它可以与所述核苷酸相互作用。所述衔接体通常为环状。优选地,所述衔接体具有与所述孔相同的对称性。如果所述孔为七聚体(例如具有有利于14条链进入跨膜β桶状体的环绕中心轴的七个亚基), 那么通常使用具有七倍对称的衔接体。同样地,如果所述孔为六聚体(例如具有有利于12 条链进入跨膜β桶状体的环绕中心轴的六个亚基,或者为12-链β桶状体),那么通常使用具有六倍对称的衔接体。可使用任何有助于所述孔与所述核苷酸之间相互作用的衔接体。合适的衔接体包括但不限于环糊精、环肽和葫芦脲。所述衔接体优选环糊精或其衍生物。所述衔接体更优选七-6-氨基- β -环糊精(am7- β⑶)、6_单脱氧-6-单氨基-β -环糊精(ami-β⑶)或七-(6-脱氧-6-胍基)_环糊精(gu7_i3⑶)。下表2示出了孔与衔接体的优选组合。表2-孔与衔接体的合适组合
权利要求
1.一种包含跨膜蛋白孔亚基和核酸操作酶的构建体,其中所述亚基与所述酶共价结合,其中所示亚基保留其形成孔的能力并且其中所述酶保留其操作核酸的能力。
2.权利要求1的构建体,其中所述酶与所述亚基在不止一个点上结合。
3.权利要求1或2的构建体,其中所述酶与所述亚基在基因上融合。
4.权利要求3的构建体,其中将所述酶的氨基酸序列同框加入到所述亚基的氨基酸序列中。
5.权利要求1或2的构建体,其中所述酶与所述亚基在化学上融合。
6.前述权利要求任一项的构建体,其中所述酶与所述孔通过一个或多个接头结合。
7.权利要求6的构建体,其中所述一个或多个接头是氨基酸序列。
8.前述权利要求任一项的构建体,其中所述亚基源于α-溶血素(a-HL)。
9.权利要求8的构建体,其中所述亚基包含示于SEQID NO 2的序列或其变体。
10.前述权利要求任一项的构建体,其中所述核酸操作酶是核酸酶。
11.权利要求10的构建体,其中所述核酸酶是酶分类(EC)组3.1. 11,3. 1. 13,3. 1. 14、 3. 1. 15,3. 1. 16,3. 1. 21,3. 1. 22,3. 1. 25,3. 1. 26,3. 1. 27,3. 1. 30 和 3. 1. 31 的任一组的成员O
12.权利要求11的构建体,其中所述核酸操作酶是核酸外切酶。
13.权利要求12的构建体,其中所述酶包含示于SEQID N0:10、12、14和16的任一个的序列或其变体。
14.前述权利要求任一项的构建体,其中所述构建体包含示于SEQID N0:18、20、22、 24,26,28和30的任一个的序列或其变体。
15.权利要求1-9任一项的构建体,其中所述酶是聚合酶、解螺旋酶或拓扑异构酶。
16.权利要求15的构建体,其中(a)所述聚合酶是酶分类(EC)组2. 7. 7. 6,2. 7. 7. 7,2. 7. 7. 19,2. 7. 7. 48 和 2. 7. 7. 49 的任一组的成员;(b)所述解螺旋酶是酶分类(EC)组3.6. 1.-和2. 7. 7.-的任一组的成员;或者(c)所述拓扑异构酶是酶分类(EC)组5.99. 1. 2和5. 99. 1. 3的任一组的成员。
17.权利要求15的构建体,其中所述聚合酶是依赖DNA的DNA聚合酶、依赖RNA的DNA 聚合酶、依赖DNA的RNA聚合酶或依赖RNA的RNA聚合酶。
18.权利要求15的构建体,其中所述解螺旋酶是依赖ATP的DNA解螺旋酶、依赖ATP的 RNA解螺旋酶或不依赖ATP的RNA解螺旋酶。
19.权利要求15的方法,其中所述拓扑异构酶是促旋酶。
20.编码权利要求3、4或14的构建体的多核苷酸序列。
21.权利要求20的多核苷酸,其中所述多核苷酸包含示于SEQID NO :17、19、21、23、 25,27和四的任一个的序列或其变体。
22.一种用于测序核酸的经改变的孔,包含至少一种根据前述权利要求任一项的构建体;
23.权利要求22的孔,其中所述孔包含1个权利要求8或9的构建体以及6个包含示于SEQ ID NO 2的序列或其变体的亚基。
24.权利要求23的孔,其中全部7个亚基均在SEQID NO 2的139位上具有谷氨酰胺并且所述亚基之一在135位上具有半胱氨酸。
25.权利要求25的孔,其中全部7个亚基均在SEQID NO 2的113位上具有精氨酸。
26.权利要求22-25任一项的孔,其中所述孔包含有利于所述孔与一个或多个核苷酸相互作用的分子衔接体。
27.权利要求沈的孔,其中所述分子衔接体是环糊精或其衍生物。
28.权利要求27的孔,其中所述环糊精是七-6-氨基-β-环糊精(3!117-0^)、6-单脱氧-6-单氨基-β -环糊精(_厂β⑶)或七-(6-脱氧-6-胍基)-环糊精(gu7- β⑶)。
29.一种产生用于测序核酸的经改变的孔的试剂盒,包含(a)至少一种权利要求1-19任一项的构建体;和(b)形成孔所需的其余亚基;
30.权利要求四的试剂盒,其中所述试剂盒包含(a)权利要求8或9的构建体;和(b)6个每种均包含示于SEQ ID NO 2的序列或其变体的亚基。
31.一种产生用于测序核酸的经改变的孔的试剂盒,包含(a)至少一种权利要求20的多核苷酸;和(b)编码形成孔所需的任何其余亚基的多核苷酸序列。
32.权利要求31的试剂盒,其中所述试剂盒包含(a)权利要求21的多核苷酸;和(b)6种每种均编码包含示于SEQ ID NO :2的序列或其变体的亚基的多核苷酸。
33.一种产生权利要求1-19任一项的构建体的方法,包括(a)使核酸操作酶与跨膜蛋白孔亚基共价结合;和(b)确定所得构建体是否能够形成孔并操作核酸。
34.权利要求33的方法,其中所述酶与所述亚基的结合是在所述亚基形成部分孔之前 (表达后修饰)或者在所述亚基形成部分孔之后(寡聚体化后修饰)。
35.权利要求33或34的方法,其中步骤(a)包括(a)提供权利要求20的多核苷酸;和(b)表达所述多核苷酸序列。
36.一种产生权利要求22的经改变的孔的方法,包括(a)使核酸操作酶与跨膜蛋白孔共价结合;和(b)确定所得孔是否能够操作核酸并检测核酸。
37.一种产生权利要求22的经改变的孔的方法,包括(a)使至少一种权利要求1-19任一项的构建体与其他合适的亚基形成孔;和(b)确定所得孔是否能够操作核酸并检测核酸。
38.一种纯化包含至少一种权利要求1-19任一项的构建体的跨膜孔方法,包括(a)提供所述至少一种构建体与形成孔所需的其余亚基;(b)使所述至少一种构建体与其他亚基在合成脂质囊泡上寡聚体化;和(c)使所述囊泡与非离子表面活性剂接触;和(d)回收所述寡聚体化的孔。
39.权利要求38的方法,其中所述合成的囊泡包含30%胆固醇、30%磷脂酰胆碱(PC)、20%磷脂酰乙醇胺(PE)、10%鞘磷脂(SM)和10%磷脂酰丝氨酸(PS)。
40.权利要求38或39的方法,其中所述非离子表面活性剂是辛基葡糖苷(OG)或十二烷基麦芽糖苷(DDM)去污剂。
41.一种测序靶核酸序列的方法,包括(a)使所述靶序列与权利要求沈的孔——其包含核酸外切酶——接触,从而使所述核酸外切酶从所述靶序列的一端消化单个核苷酸;(b)使所述核苷酸与所述孔接触,从而使所述核苷酸与所述衔接体相互作用;(c)在相互作用过程中测量通过所述孔的电流,从而确定所述核苷酸的种类;和(d)在所述靶序列的同一端重复步骤(a)到(c),从而确定所述靶序列的序列。
42.一种测序靶核酸序列的方法,包括(a)使所述靶序列与权利要求22的孔接触,从而使所述酶将所述靶序列推过或拉过所述孔,并且所述靶序列中核苷酸的一部分与所述孔相互作用;和(b)在每个相互作用过程中测量通过所述孔的电流,从而确定所述靶序列的序列。
全文摘要
本发明涉及包含跨膜蛋白孔亚基和核酸操作酶的构建体。所述孔亚基与所述酶共价结合,从而所述亚基与所述酶均保留其活性。所述构建体可用于产生其上结合有核酸操作酶的跨膜蛋白孔。这些孔特别可用于测序核酸。所述酶操作核酸的方式使得所述孔可通过随机传感来检测其组成核苷酸。
文档编号C12Q1/68GK102245760SQ200980134886
公开日2011年11月16日 申请日期2009年7月6日 优先权日2008年7月7日
发明者B·麦基翁, H·贝利, J·克拉克, J·怀特, L·贾娅辛格, S·切里 申请人:牛津纳米孔技术有限公司