专利名称:自我组装脱落荧光蛋白系统的制作方法
声明本发明的权利项是在联邦政府资助下进行研究和发展取得的成果。
本发明是加利福尼亚大学董事会在政府支持下,得到来自美国能源部门的DE-FG02-98ER62647资助项目的资助,同时还得到美国能源部门的W-7405-ENG-36合同项目的资助而完成的。政府对本发明拥有一定的所有权。
相关申请本专利申请主张美国临时专利申请号为No.60/514,363的申请日的优先权。
背景技术:
获得足够量的既可溶解又正确折叠的重组蛋白,以应用于下游,这对许多应用蛋白表达技术领域,仍是一个重大的瓶颈(Makrides 1996;Baneyx 1999;Fahnert,Lilieet al.2004),这里包括结构基因组项目(Yokoyama 2003;Goh,Lan et al.2004;Terwilliger 2004)。目前,使可溶性蛋白最佳化的方法包括筛选大量的蛋白突变体(突变异种、片段、融合标签、折叠伴侣)并检测许多表达或折叠的条件(Armstrong,de Lencastre et al.1999;Fahnert,Lilie et 2004)。最近已有方法能筛选可溶性表达蛋白(Waldo 2003),包括免疫印迹法检测多聚组氨酸标签蛋白的抗体(Knaustand Nordlund 2001),但这些方法需要多重步骤,且不能在体内实现。蛋白用lacZα片段标签,再与lacZΩ进行结构互补后能被检测到(Ullmann,Jacob et al.1967;Nixon and Benkovic 2000;Wigley,Stidham et al.2001;Wehrman,Kleaveland etal.2002),但是lacZα片段相对较大(52个氨基酸)(Wigley,Stidham et al.2001),且关于它对融合蛋白的折叠和溶解性能的影响,还没有作出详细研究。利用一种敏感的荧光底物(Kelemen,Klink et al.1999)((FretWorks,Novagen,Madison,WI)与S蛋白(Richards and Vithayathil 1959)互补后,15个氨基酸的S肽标记的蛋白(Kim and Raines 1993)在体外能被定量检测,但这种检测方法不能用于估计大肠杆菌体内表达的可溶性蛋白。
GFP和它的许多相关荧光蛋白目前被广泛用来作为蛋白标签剂(参见Verkhusha等2003,珊瑚纲类GFP类似荧光蛋白和生色蛋白;在蛋白质结构中,结构特性和功能的纷繁复杂,Ch.18,pp.405-439,Research Signpost,Kerala,India)。此外,GFP已经被用作一种末端与试验蛋白融合的可溶性报告蛋白(Waldo et 1999,Nat.17691-695;U.S.Patent No.6,448,087,发明名称为“确定和改变蛋白或肽溶解性的方法”)。GFP类似蛋白是一个同源的、且具有一个保守的β11链桶状结构的25-30kDa多肽的扩大家族。该GFP类似蛋白家族现在包含约100个成员,它们是从各种珊瑚纲和水螅纲动物中克隆得到的,且该蛋白家族目前包括红、黄、绿荧光蛋白及多种非荧光生色蛋白(Verkhusha et supra)。各种各样商业上可利用的荧光蛋白标签的检验和试剂盒包含GFP光谱变异体和GFP类似荧光蛋白的较宽光谱,它包括红荧光蛋白(DsRed)和其他红色荧光蛋白(Clontech,Palo Alto,CA;Amersham,Piscataway,NJ.)。
各种改进GFP和相关蛋白可溶性的策略已备有证明文件,且已产生许多具有改良的折叠、可溶性和扰动耐受特性的突变体。Stemmer和他的同事将人工定向进化方法应用于筛选在大肠杆菌中能增加荧光和折叠域的GFP蛋白的突变体或变异体(Crameriet al.,Nat.Biotechnol.143315-319,1996)。他们确定了一种能增加折叠能力的突变体。该种GFP,称为cycle-3或GFP3,其含有突变位点F99S、M153T和V163A。GFP3对表达环境相对不敏感,且它在各种宿主细胞包括大肠杆菌中都能很好折叠。GFP3在27℃和37℃条件下能一样正确折叠。因此,GFP3的突变也消除了野生型GFP在折叠过程中可能会出现的温度敏感折叠中间状态。
GFP3可能由于和另一个较差折叠的多肽组成的融合蛋白的表达而被错误折叠。GFP3已被用于报告在大肠杆菌中表达的N-末端融合蛋白的“折叠旺盛”(Waldo等1999,见上文)。在这种方法中,报告蛋白的序列,如GFP3结构域,仍然保持连续,且一个较差折叠的上游结构域被突变。X结构域较好折叠的变异体通过增加的荧光被确定。
现有的蛋白标签和检测平台是有效的,但也有缺点。脱落蛋白标签可能会扰乱蛋白溶解性(Ullmann,Jacob et 1967;Nixon and Benkovic 2000;Fox,Kapust et al.2001;Wigley,Stidham et al.2001;Wehrman,et al.2002)或者在活细胞中不工作(Richards and Vithayathil 1959;Kim and Raines 1993;Kelemen,Klink et al.1999)。绿色荧光蛋白的融合蛋白可能会错误折叠(Waldo,Standish et 1999)或出现改变的过程(Bertens,Heijne et al.2003)。双砷化合物FlaSH或ReASH(Adams,Campbell et al.2002)的荧光底物克服了许多这样的限制,但需要一个聚半胱氨酸标签模体、一个还原环境以及细胞转染或通透状态(Adams,Campbell et 2002)。
GFP片段重组系统已被描述过,主要是为检定蛋白与蛋白的相互作用,但没有一个能独力自我组装成正确折叠、可溶的荧光重组GFP,且从这些方法中也没有出现全面的脱落GFP折叠报告蛋白系统。例如,Ghosh等在2000年报道,两个GFP片段,分别是GFP结构的1-157位氨基酸和158-238位氨基酸,当该两个独立的片段与能够形成反向平行亮氨酸拉链的螺旋序列融合时,其能在体外或通过大肠杆菌(E.coli)中共表达被重组产生一荧光产物(Ghosh et 2000,反向平行亮氨酸拉链定向蛋白重组应用于绿色荧光蛋白.J.Am.Chem.Soc.1225658-5659)。同样地,美国专利No.6,780,599描述了能够形成反向平行亮氨酸拉链的螺旋结构加入GFP分子脱落片段的用途。该专利说明书确定GFP片段上不附有互补的螺旋结构,就不可能发生重组。尤其是,说明书指出在对照实验中,没有亮氨酸拉链对的GFP片段“不能显示任何绿色克隆,因此强调需要NZ和CZ亮氨酸拉链的同时存在,以介导GFP在体内和体外组装”。
同样地,Hu等在2002年表明相互作用的蛋白bZIP和Rel,在与GFP的两个片段发生融合时,能通过它们之间的相互作用介导GFP重组(Hu等2002,利用双分子荧光互补呈现活细胞内bZIP和Rel家族蛋白之间的相互作用Mol.Cell 9789-798)。Nagai等在2001年说明黄色荧光蛋白(YFP)片段与钙调素和M13融合后能在有钙的条件下介导YFP重组(Nagai等2001,设计循环序列改变的绿色荧光蛋白来检测Ca2+Proc.Acad.Sci.USA 983197-3202)。作为这种方法的一种变化形式,Ozawa等通过自我剪接内含多肽序列将钙调素和M13与两个GFP片段融合,从而在有钙的条件下介导GFP片段共价重组(Ozawa等2001,基于蛋白剪接检测体内蛋白与蛋白之间相互作用的荧光指示剂Anal.Chem.725151-5157;Ozawa等2002,监控细菌内蛋白与蛋白之间相互作用的脱落绿色荧光蛋白的基于剪接的蛋白重组改良的敏感性及简化的筛选次数Anal.Chem.735866-5874)。这些研究者中有一位随后报道将基于剪接的GFP重组系统应用于培养的哺乳动物细胞中(Umezawa,2003,Chem.Rec.322-28)。最近,Zhang等在2004年表明上文中Ghosh et al.,2000的螺旋状结构剪接GFP系统在线虫C.elegans中共表达时能被用于重组GFP(YFP和CFP也可以)荧光,且证明该系统在体内的有效共表达的用途(Zhang et al.,2004,与重组的荧光蛋白组合标记的细胞和细胞器官Cell 119137-144)。
虽然上述GFP重组系统优于两个明显不同的荧光蛋白标签的使用,但是它们受到以下限制片段大小和相对差的折叠特性(Ghosh et al.,Hu et al.,supra),需要化学连接或融合相互作用的伴侣多肽以促使重组(Ghosh et al.,2000,supra;Ozawaet al.,2001,2002supra;Zhang et al.,2004,supra),共表达或共再折叠以产生可检测的折叠和荧光的GFP(Ghosh et al.,2000;Hu et al.,2001,supra)。较差的折叠特性限制了这些片段用于一起同时表达或同时重折叠的情况。这样的片段不适用于体外检验,因为它要求各片段在互补之前具有长时间的稳定性和可溶性。这种脱落蛋白片段不适用的例子是,标签有一对脱落蛋白片段之一的多肽的定量,然后再通过加入互补片段被检测。
一种理想的蛋白标签应该是遗传编码的,并在体内体外都能工作,且能提供一个灵敏的分析信号,而不需要外在试剂或底物。然而,至今还没有一种脱落荧光蛋白标签系统的描述,该种系统不依赖于使用融合异源多肽结构域去驱使荧光报告蛋白活性的重建。在本发明要求和提出的一种脱落荧光蛋白标签系统中,片段不需要融合的相互作用蛋白的结构域就能自发地进行自我联结,并在联结前能保持可溶状态,且不改变融合目标蛋白的可溶性。
发明概述本发明提供了一种基于荧光蛋白和生色蛋白自行互补片段的蛋白标签和检测系统。本发明的系统以来源于水母(aequorea victoria)的绿色荧光蛋白(GreenFluorescent Protein GFP)的自行互补片段的各种结合为例,所述片段可被用于以多种检验形式检测和定量体内和体外蛋白的溶解性。
在一个特别实施方式中,试验蛋白与GFP的一个16个氨基酸的片段(β11链,氨基酸215-230)融合,并用遗传工程方法使融合蛋白的可溶性不受破坏。当加入GFP互补片段(β1-10链,氨基酸1-214),GFP片段的自发结合导致结构互补、折叠,从而伴随产生GFP荧光。
脱落GFP系统是非常简单的,它不需要外在试剂,并提供一个直接与标签蛋白量成比例的灵敏分析信号,在不到15分钟时间内就能定量工作台上典型相遇的蛋白,也能报告可溶或不可溶蛋白,且在体内和体外都能工作。目前还没有别的蛋白标签和检测系统能结合上述这些功能。如以下实施例所详细描述的,脱落GFP系统已被用于定量多孔板内的蛋白,并被用于监控活的大肠杆菌内蛋白的表达和溶解性。
本发明的脱落GFP系统对于检验蛋白溶解性、定量蛋白以及对报告蛋白的检验是特别有用的,所述报告蛋白检验可监控目的在于改进特殊多肽或蛋白的折叠和溶解性的人工定向进化方法是否成功。此外,本发明的系统可被用于检测抑制和/或促进蛋白不正确折叠的因素,尤其是在高通量药物发展模式中。
本发明还提供了产生报告蛋白自行互补片段的方法。这些方法以产生GFP基因工程片段为例,且这些方法可被用于创造其他GFP类似荧光和非荧光蛋白的自行互补片段。
附图的简要说明
图1A是pTET-SpecR质粒的示意图,它是来自Clontech(Palo Alto,CA)的pPROTet.6*HN载体的修饰形式。氯霉素抗性基因在pPRolar抗性标记的卡那霉素启动子的控制下被奇放线菌素抗性标记所取代(pPROlar来自Clontech,Palo Alto,CA)。在T0转录终止序列的上游,相同的顺反子上编码了四环素抑制基因。抑制基因翻译的量由在Sacl下游的一个弱的Shine-Delgarno序列调节。
图1B展示了设计的pTET-SpecR质粒的不同元件。粗体表示的序列=侧面与NcolCCATGG和KphlGGTACC相接的,表达在tet启动子下基因的v1克隆盒。灰色序列=SpecR-tetR顺反子的T0转录终止子;绿色序列=tetR抑制基因;黄色序列=控制tetR翻译的RBS;品红色序列=奇放线菌素(SpecR)基因;青色序列=来自PROlAR载体(Clontech,Palo Alto,CA)的卡那霉素启动子元件。
图2显示了脱落GFP互补的原理。目的蛋白(X)通过一个可伸缩的接头(L)与一个小的GFP片段(β-链11,215-230个残基)融合。互补的GFP片段(β1-10链,1-214个残基)被分开表达。两片段在单独的情况下均无荧光。当两片段混合时,大小GFP片段会自发结合,发生GFP折叠和形成荧光团。使得小的GFP标签片段难以接近的过程,如错误折叠或聚集,都会阻止片段互补的发生。
图3为11个β-链GFP家族成员的拓扑二级结构示意图。(A)氨基酸的链和编号。被圈起来的数字标记了链之间的转角(是蛋白剪接的优选位点),黑色的圆圈是折叠的报告突变,白色的圆圈是超折叠的GFP突变。(B)显示了11条β-链的编号惯例。(C)显示了通过用一个短的可伸缩的接头连接N末端和C末端而生成的环形GFP突变体,它在173位氨基酸处产生了一个新的起始密码子,在172位氨基酸后产生了终止密码子。
图4显示了在位置157或172处进行GFP片段剪接(如1-156+157-238片段和1-171+172-238片段),然后在培养皿上的大肠杆菌克隆中兼容的质粒共表达两片段,最后在体内互补产生的荧光图像。左列显示了来自于折叠报告蛋白GFP的片段,右列显示了来自于超折叠的GFP的相同片段。和预想的一样,跟折叠报告蛋白GFP相比,超折叠片段的效果更好并且能产生更亮的克隆,被改进的超折叠GFP的折叠也有相同效果。
图5显示了体外GFP1-10变异体的互补效率。在加入180μl含有1mg/ml与野生型GFP11融合的可溶性亚硫酸还原酶的缓冲液后,20μl的1mg/ml重折叠的超折叠GFP1-10(较低的曲线)或相同量的可溶的最优化的GFP1-10 OPT片段(较高的曲线)与其进行互补产生的荧光增强曲线。插图显示了体内GFP1-10变异体的互补,是在硝化纤维膜上共表达与野生型GFP S11融合的亚硫酸还原酶和来自超折叠GFP(上部),或折叠报告GFP(下部)的GFP1-10片段的大肠杆菌BL21(DE3)克隆的荧光图像。
图6显示了单独表达己酮糖磷酸盐合酶蛋白(HPS)或表达HPS的N末端与野生型GFP S11融合的蛋白(WT),或表达与三个GFP S11最优变异体(M1,M2,M3)融合的HPS的大肠杆菌细胞在可溶部分和沉淀部分的SDS聚丙烯酰胺凝胶图谱。结果表明HPS-GFP S11野生型融合蛋白是不可溶的,而单独的HPS是60%可溶。
图7显示了组织培养皿上的体外实验中,在加入过量GFP1-10 OPT(800pmol)后,三个与亚硫酸还原酶融合的GFPS11变异体M1,M2和M3(50pmol)的荧光互补动力曲线。每个检测的最终体积为200μl。
图8显示了运用三个不同的GFP 1-10构体进行连续诱导(左列)或联合诱导操作(右列)的效果。图为三排表达了具有更好效果和溶解性的GFP 1-10构体的大肠杆菌克隆的荧光图像折叠报告蛋白(FR,第一排),超折叠蛋白(SF,第二排),或最优化的GFP 1-10变异体(OPT,第三排)。超折叠GFP 1-10单独表达时是不溶的。第一列在表达亚硫酸还原酶-GFP S11融合蛋白后GFP 1-10的瞬时表达。第二列与亚硫酸还原酶-GFP S11野生型融合蛋白共表达GFP 1-10。超折叠GFP 1-10是不溶的,在进行瞬时诱导操作后细胞出现微弱的荧光,很可能因为超折叠GFP 1-10可以在表达亚硫酸还原酶-GFP S11野生型融合蛋白之前聚集,从而削弱了互补的效率。共表达产生了发光的细胞很可能因为在超折叠GFP 1-10和亚硫酸还原酶-GFP S11融合蛋白之间可发生迅速的结合和互补,从而挽救了GFP 1-10,避免其发生错误折叠和聚集。相反地,不论这些构造是连续表达还是共表达,部分可溶的GFP 1-10 OPT细胞都能发出荧光。
图9显示了运用GFP S11 M3标签片段和GFP1-10 OPT检测片段进行脱落GFP互补的灵敏度。含有0.1-200pmol亚硫酸还原酶-GFP S11 M3融合蛋白片段的20μl等量样本与含有800pmolGFP1-10 OPT片段的180μl等量样本进行混合互补。(A)在加入GFP1-10 OPT片段后15分钟每份溶液的荧光测量值。(B)在加入GFP1-10 OPT片段后1小时每份溶液的荧光测量值。
图10显示了50,25,12.5,6.25,3.13,和1.56pmol亚硫酸还原酶与GFP S11M3融合蛋白样本的互补进程曲线。通过减去一个小的常数并应用一个缩放比例因素(参见图10中插入的表)得出适合50pmol的进程曲线的数据,再应用EXCEL数据分析工具求解器(微软公司)进行非线性最小平方计算。极好的重叠说明了进程曲线的形状并不依赖于标签蛋白的浓度或未连接的GFP1-10 OPT片段层的缺失。
图11显示了C末端GFP S11 M3标签的折叠报告蛋白与结合Talon树脂的6HIS GFP1-10 OPT的结合和互补情况。(1)结合Talon树脂的6HIS GFP 1-10 OPT,(2)与C末端融合有GFP S11 M3的折叠报告GFP的结合小珠荧光迅速增强,(3)基于互补的缓慢的荧光生成。
图12显示了尿素浓度对互补反应的影响。2M以上的尿素会使反应结束。
图13显示了pH值对互补反应的影响。(A)在加入GFP 1-10 OPT后的6小时亚硫酸还原酶-GFP S11 M3融合蛋白的最终荧光具有pH值依赖性。(B)在加入GFP 1-10OPT后的6小时人工合成肽GFP S11的最终荧光具有pH值依赖性。在pH值小于6.5时,荧光互补反应不能有效进行。
图14的柱状图显示了体外应用脱落GFP系统,对带有C末端GFP S11 M3标签的18个试验蛋白(参看之前的表3)的蛋白定量。应用GFP 1-10 OPT与GFP片段互补可检测可溶部分(黑色柱)和非折叠的沉淀部分(灰色柱)的荧光。SDS聚丙烯酰胺凝胶图显示了相应的可溶部分(S),和沉淀部分(P)。应指出,#8蛋白,酒石酸脱水酶β-亚基在ca.13kD处有另一条较低的条带。
图15显示了应用脱落GFP检测系统进行体内蛋白溶解性和表达筛选。来自tet-启动子质粒的N末端6HIS片段和C末端GFP S11 M3片段标签的18个Pyrobaculum试验蛋白(参看之前表3)被克隆入一个大肠杆菌BL21(DE3)菌株中表达,同时该菌株还含有表达GFP 1-10 OPT片段的pET质粒。对带有标签的结构和GFP 1-10 OPT进行联合诱导表达后(上部),或在瞬时表达标签结构后再表达GFP 1-10 OPT(连续诱导,中部),然后观察平板培养基上克隆的荧光图像,以及在液体培养基中连续诱导的细胞的Talon树脂结合小珠的可溶部分(B)和沉淀部分(P)的SDS-聚丙烯酰胺凝胶图像(下部)。箭头指示为偶然结合的GFP 1-10 OPT(易可见分子量为ca.29kD)。需要注意的是核苷二磷酸激酶(蛋白#7)是部分可溶的(在Talon树脂结合部分GFP1-10 OPT的相应条带略微下面可看见一条带)。多硫还原酶-GFP S11 M3融合物(参看之前表3)产生出颜色很深的红色克隆。它吸收488纳米的激发光,并在共表达两片段时削弱整个细胞的荧光,尽管蛋白能够很好表达。
图16显示了应用GFP S10-11 OPT标签片段和GFP 1-9 OPT检测片段进行脱落GFP互补的灵敏度。含有亚硫酸还原酶-GFP S10-11 OPT融合蛋白的20μl等量样本与含有250μM GFP1-9 OPT片段的180μl等量样本进行混合互补。加入GFP1-10 OPT后6小时每份溶液测量荧光值。由于GFP1-9 OPT的浓度是受限的,在亚硫酸还原酶-GFPS10-11大于约250μM时,荧光值达到平稳状态。
图17显示了三明治标签形式的原理,其中试验蛋白X是作为两个GFP结构域(链10和链11)之间的融合蛋白表达,并由第三个GFP结构域(GFP1-9 OPT)检测。(a)当标签链均被完整的目标蛋白X连接时,互补反应有效发生。(b)如果标签链分离,则互补反应不能有效进行。
图18(A)显示了来自用GFP 1-9 OPT作为互补目标的(GFP S10)-L1-Ndel::GGGSGSGG::BamH1-L2-(GFP S11)改进的六个最适结构的序列,该序列后接有起始序列(底部序列)。GFP S10和GFP S11用蓝色区域进行了强调。相对于起始序列的六个最适结构的突变以黄色区域显示。优选第五个最适结构,被称作(GFP S10SM5)-L1-Nde-1::X::BamH1-L2-(GFP S11 SM5),其中X作为目标蛋白。(B)显示了十四个诱导突变的变性引物,用于在GFP S10的目标位点诱导突变。
图19显示了参考序列(GFP S10)-L1-Ndel::GGGSGSGG::BamH1-L2-(GFP S11),来自图18A(GFP S10 SM5)-L1-Nde-1::X::BamH1-L2-(GFP S11 SM5)的最适序列,以及八个最适结构(GFP S10)-L1-Nde-1::HPS::BamH1-L2-(GFP S11 SM5)的序列。在目标链GFP S10中的,可增加起始序列(GFP S10SM5)-L1-Nde-1::HPS::BamH1-L2-(GFP S11 SM5)的溶解度的突变用红色强调显示。这八个最适结构序列的每个序列后面都接有可伸缩的连接序列和GFP S11 SM5(参看列表中第二个序列的末端),通过HPS编码序列继续延伸,并在BamH1位点重新开始。
图20显示了体外和体内十八个Pyrobaculum控制蛋白X的互补检测,它们被克隆到一个带有(GFP S10 A10)-GGGS-Ndel-X-BamHI-GGGS-(GFP S11 SM5)的pTET载体的Ndel/BamHI克隆位点,然后转化到一个BL21(DE3)菌株中,该菌株在以p15为起始点的pET 28载体上含有GFP 1-9 OPT。对于体外检测,液体培养液只能通过AnTET诱导。(a)用GFP 1-10 OPT进行的20μl可溶等量样本的检测。(b)用GFP 1-10OPT进行的10μl尿素增溶的沉淀等量样本的检测。(c)用GFP 1-9 OPT进行的20μl可溶等量样本的检测。(d)用GFP 1-9 OPT进行的10μl尿素增溶的沉淀等量样本的检测。(e)用AnTET试剂瞬时诱导来自pTET的三明治标签结构,然后用IPTG对GFP1-9进行诱导,之后观察大肠杆菌的荧光图像。
图21显示了用GFP 1-10 A4对可溶的亚硫酸还原酶-S11 H7融合蛋白进行互补的灵敏度图像。该检测显示了皮摩尔的灵敏度。在该实验中,不使用0.5%的牛血清(BSA)溶液封闭96孔板。低浓度下(插图)标准曲线的非线性化可能是因为孔板表面的吸收导致标签蛋白的损失。
图22显示了折叠报告蛋白GFP-(GFP-S11 H7)融合蛋白和N6HIS-折叠报告蛋白GFP融合蛋白的粗提液和纯化片段的SDS-聚丙烯酰胺凝胶染色图。
图23是在不同咪唑浓度下,N6-HIS-GFP,折叠报告蛋白GFP-(GFP S11 H7)和折叠报告蛋白GFP-(GFP S11 H9)与Talon树脂小珠结合后被洗脱的片段的荧光强度柱状图。与结合更紧密的(GFP S11 H9)相比,(GFP S11 H7)标签物在更低浓度的咪唑下开始洗脱。而信号强度是与被释放到上清液中的蛋白量相关,信号越强,在指定咪唑浓度下蛋白与树脂的结合越不紧密。
图24显示了几个试验蛋白的小规模纯化,该些试验蛋白来自Pyrobaculum并在C末端带有(GFP S11 H9)标签,且用Talon树脂进行纯化。该图为在TNG缓冲液中加入150mM咪唑的裂解液的可溶部分(S),不结合的部分(U)和被洗脱的蛋白(E)的SDS-聚丙烯酰胺凝胶图像。
发明的详细描述定义除了其他特殊说明外,所有在此运用的技术、符号及其他科学术语所指的含义都是本领域技术人员普遍能理解接受的含义。其中,为了充分清楚地阐述或作为现成的参考,有时会给出一些普遍被理解接受术语的定义,而这些定义所包含的内容与该技术领域通常理解的含义没有实质上的区别。本领域技术人员一般都能明确理解在此被描述或引用的技术方法和步骤,并能用常规的方法实施应用。例如,在Sambrook等分子克隆中描述的已被广泛应用的分子克隆方法纽约Cold Spring Harbor(冷泉港)的Cold Spring Harbor实验室出版的第三版(2001年)实验操作手册和通用分子生物操作规程(2001年John&Sons公司出版)。除其他特殊说明外,合适的情况下,大体可按商业上直接可用的试剂盒和试剂所提供的操作规程和/或参数进行实验操作。
本发明提到的“荧光蛋白”是指一种水母绿色荧光蛋白(GFP),GFP的结构变异体(如环形突变体,单节显性的变体),GFP的折叠变异体(如高可溶性,超折叠性变异体),GFP的光学变异体(如YFP,CFP),以及GFP类似荧光蛋白(如DsRed)。术语“GFP类似荧光蛋白”是指拥有β11链“管式”结构的珊瑚类动物荧光蛋白,GFP的结构变异体、折叠变异体及光学变异体也都拥有β11链“管式”结构。术语“GFP类似非荧光蛋白”和“GFP类似生色蛋白”(简称“生色蛋白”或“色(素)蛋白”)是指珊瑚和水螅纲类动物的生色蛋白,它们含有GFP的β11链“管式”结构及其结构变异体、折叠变异体和光学变异体。GFP类似蛋白都拥有共有的结构和功能特征,除了氧分子,不需要附加的辅因子、外加酶催化剂或底物就能无限形成内在生色蛋白。
一种荧光蛋白的“变异体”来源于一种“母体”荧光蛋白,它保留了β11链的管式结构和内在的荧光性,它还包括氨基酸替代、剔除或插入的结构,该种结构可能会赋予该蛋白新的或改良的生物特性(如更好的稳定性、提高的溶解性,改善的折叠程度与散发或激发光谱中的迁移,减少或消除多聚体的形成等),同时还包括具有被修饰过的N末端和C末端的结构(如环形突变体)。
当涉及报告多肽时使用术语“互补片段”或“补充片段”,它是指独自无活性的多肽片段(如不表达该报告多肽的表型),其中互补片段的结合能恢复报告多肽活性。术语“自行互补”,“自我组装”和“自发结合”在描述两个或更多的荧光(或生色)蛋白片段时,是指在单个片段可溶的情况下,这些片段能够重新组成一个完整的荧光(或生色)蛋白。
本发明中的″MMDB Id5742结构″是指在分子建模数据库(MMDB)中被Ormo和Remington公开的MMDB编号为5742 GFP蛋白结构。PDB编号1EMA PDB作者M.Ormo和S.J.Remington PDB证明书1-Aug-96 PDB分类荧光蛋白PDB题目来自水母的绿色荧光蛋白。蛋白数据库编号参考是PDB编号1EMA PDB作者M.Ormo和S.J.Remington PDB证明书1-Aug-96 PDB分类荧光蛋白PDB题目来自水母的绿色荧光蛋白。(参看Ormo等.“水母绿色荧光蛋白的晶体结构”,科学,1996年九月第六期;273(5280);Yang等,“绿色荧光蛋白的分子结构”,自然生物技术,1996年十月;14(10)1246-51)。
″均方根差″(″RMSD″)是指在埃单位下平方均值叠加的平方根的剩余值。该数在两个结构的最佳叠加后计算得出,作为等价α碳原子间距离的平方平均值的平方根。
当涉及一个核酸的一部分时会使用术语″异源的″,它是指这个核酸由两个或更多个在自然界中未被发现的彼此同一相关的亚序列组成。例如,代表性地重组合成一个核酸,该核酸具有两个或更多的来自不相关基因的序列重组形成了一个新的功能性核酸,一个核酸序列编码一种来源的荧光蛋白,另一个核酸则为编码不同来源的另一个多肽序列。同样地,一个异源蛋白指它由两个或更多个在自然界中没有被发现彼此同一相关的亚序列组成(如融合蛋白)。
在上下文中两个或多个核酸或多肽序列的“同一性的”或“同一性”百分比是指两个或多个序列相同或有特定百分比的氨基酸残基或核苷是相同的(例如,在通过一个比较窗口比较和线性化求最大相关性时的特定区域内,或应用一个以下缺省参数描述的BLAST或BLAST 2.0序列比对运算法则或通过手工校正和观察来测定的指定区域内,序列大概是70%同一性,优选75%,80%,85%,90%,或95%的同一性。这种序列就被认为是“实质上相同的”。这种序列定义也涉及到一个测试序列的优化。优选一个区域的相同在长度上最好至少是大约22个氨基酸或核苷,而30,40或50-100个氨基酸或核苷则更优选。
对序列比对来说,通常需要就相对被测试序列列出一个相应的参考序列。当运用一个序列比对算法时,被测序列和参考序列都被输入到电脑中,必要时需指定匹配的亚序列,并且指定序列比对算法程序中的参数。可以使用缺省的程序参数,也可指定其他的参数值。然后序列比对算法会基于本程序的参数计算出被测序列相对于参考序列的序列同一性百分比。
这里所用的“比对窗口”,包括涉及一种从序列中选取的,具有从20到600,通常为50到200左右,更常见的为100到150之间的任何长度的连续位点的片段。该片段序列可与具有相同长度连续位点的参考序列比较,此比较通常在两序列都被线性优化后进行。在该技术领域中比对序列的线性化方法已广为人知。比对序列的线性优化方法可采用如Smith和Waterman发表在1981年Adv.Appl.Math.2482上的局部同源性运算法则,Needleman和Wunsch在1970年J.Mol.Biol.48443中报道的同源性优化运算法则,Pearson和Lipman在1988年Proc.Acad.Sci.USA中852444发表的相似性方法的探寻中的运算法则等,以及这些匀速阿法则的计算机化(在Wisconsin遗传学软件包中的GAP,BESTFIT,FASTA,和TFASTA,遗传学计算机组,575 Science Dr.,Madison,WI),或通过手工线性化和视觉观察(参看,分子生物学中的通用规程(Ausubel等,eds.1995年,附注))。
在序列同一性百分比的测定中一个合适的首选运算法则为BLAST和BLAST 2.0运算法则,两种方法分别在1997年的Nuc.Acids Res.253389-3402和1990的J.Mol.Biol.215403-410中被Altschul等人所阐述。BLAST和BLAST 2.0用于测定本发明的核酸和蛋白的序列同一性百分比,测定中通常使用本发明描述的缺省参数。进行BLAST分析的软件是由国家生物技术信息中心提供的公众可用软件。该运算法则包括通过鉴定在可疑序列中W长度的短字来第一次确定高分值序列对(HSPs),当用一个数据库序列中相同长度的短字线性化时,它匹配或满足某个正估计阈值T。T是作为邻近字符的分值阈值而言的(Altschul等,见上文)。这些初始的邻近字符的采样被作为样源,从而可开始搜寻包括这些字符的更长的HSP。这些字符样从每个序列的两个方向延伸,因为其累积线性的分值是可以增加的。对于核苷酸序列来说,累积的分值用参数M(一对匹配残基的正反馈分值;通常>0)和N(不配对残基的负反馈分值;通常<0)来计算。对于氨基酸序列来说,用一个分值矩阵来计算其累积分值。以下情况出现时字符样沿两个方向的延伸停止由X的量来反映的累积线性分值从它能达到的最大值下落时;因为一个或更多负分值残基的线性的累加,累积分值下落到零或者负值时;或者是因为已经达到了其中一个序列的末端时。BLAST的算法参数W,T,和X决定了线性化的灵敏度和速度。BLASTN程序(对核苷酸序列来说)使用的缺省参数是一个为11的字符长度(W),一个为10的期望值,M=5,N=-4以及两条链的比对。对氨基酸序列来说,使用的缺省参数是一个为3的字符长度(W)和为10的期望值,以及50的BLOSUM62分值矩阵线性化参数(B)(参看Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA 8910915(1989)),10的期望值,M=5,N=-4以及两条链的比对。
BLAST运算法则也可用于进行两序列间相似性的统计学分析(参看范例Karlin&Altschul,1993,Proc.Acad.Sci.USA 905873-5787)。通过BLAST算法进行的一个相似性测量的标准是测定最小加和概率(P(N)),可指示两核苷酸序列或氨基酸序列之间偶然匹配的概率。比如,在一个被测核苷酸序列和参考核苷酸序列的比对中,如果最小加和概率的可能性小于0.2,更佳的小于0.01,最佳的小于0.001,就认为该被测核苷酸序列和参考序列相似。
本发明中当涉及到一个SEQ ID NO参考时,术语“通过最大相关性决定”指一个序列运用一种算法时,如带有缺省参数的BLAST算法,在参考序列的长度上最大程度地与参考SEQ ID NO一致。本领域技术人员容易做此决定。
本发明中“连接”是既指物理上的连接,也指在生物微粒如噬菌体、细菌、酵母或其他真核细胞中共存而发生的连接。
“物理连接”是指在该领域中已知的连接两个分子的任何方法(被称为“物理地连接”),包括无限制的连接,带有或不带有干扰结构域的重组融合,切除肽-介导的融合,非共价键结合,共价键结合(如双硫键结合和其他共价键结合),氢键结合;静电的键合连接以及构象的键合连接,如抗体-抗原,生物素-抗生物素蛋白结合。
“融合”是指通过共价键结合的连接。
本发明中“接头”或“间隔团”是指连接两个分子如一个荧光连接配体和一个显示蛋白或核苷酸的一个分子或分子基团,通过把两个分子放在首选的构型上起作用。
本发明中交替提到的术语“多肽”,“肽”和“蛋白”指氨基酸残基的聚合物。该术语可用于描述其中有一个或多个氨基酸残基是与天然存在的氨基酸相应的人造化学模仿的氨基酸聚合物,也指天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。
术语“氨基酸”是指天然存在和人工合成的氨基酸,也指氨基酸的类似物和在功能上与天然存在的氨基酸相似的氨基酸模仿物。天然存在的氨基酸包括由遗传密码子编码的氨基酸和后来被修饰的氨基酸,如羟基脯氨酸,γ-羧基谷氨酸和o-磷酸化丝氨酸。氨基酸类似物是指那些与天然氨基酸有着相同基本化学结构的化合物,即一个α碳原子与一个氢原子,一个羧基、一个氨基和一个R基团如高丝氨酸,己氨酸,甲硫氨酸亚砜,甲硫氨酸甲基锍等相连。这些类似物拥有修饰的R基团(如己氨酸)或修饰的多肽骨架,但仍保持天然氨基酸的基本化学结构。氨基酸模仿物是指结构上与氨基酸的常规化学结构不同,但功能上与天然氨基酸相似的一类化合物。
本发明的氨基酸可能是用通常已知的三字母代号或由IUPAC-IUB生物化学命名委员会推荐的单字母代号表示。同样地,核苷酸也可能用已普遍接受的单字母编码表示。
熟语“核苷酸”是指脱氧核糖核酸或核糖核酸以及它们单链或双链形式的聚合物。除非特别限制说明,该术语还包括那些与天然的参考核苷酸有着相似结合特性的,并在代谢形式上与天然核苷酸相似的天然核苷酸的类似物。除非其他说明,一个特殊的核苷酸序列也包括其保守修饰的变异体(如简并密码子取代物)、互补的序列以及明确指明的序列。特别说明的是,简并密码子取代物可能通过将一个或多个选定的(或所有的)密码子的第三个位置的碱基用一个混合碱基和/或脱氧肌苷残基取代而得到(参看Batzer等,1991,Nucleic Acid Res.195081;Ohtsuka等,1985,J.Biol.Chem.2602605-2608;Cassol等,1992;Rossolini等,1994,Mol.Cell.Probes 891-98)。术语核苷酸会与基因,cDNA,和基因编码的mRNA交替使用。
“保守修饰的变异体”既可用于氨基酸序列也可用于核苷酸序列。至于特殊的核苷酸序列,其保守修饰的变异体是指那些编码相同或基本上相同氨基酸序列的核苷酸,或对于基本上相同的序列不编码氨基酸序列的核苷酸。由于遗传密码子的简并性,很多功能上相同的核苷酸编码一个特定的蛋白。比如,密码子GCA,GCC,GCG和GCU都编码丙氨酸。这样,每个由一个特定的密码子编码的丙氨酸的地方,密码子都能转变为相应的不改变被编码多肽的密码子。这种核苷酸的变化为“沉默变异”,是保守修饰变异的一种。本发明编码一个多肽的每个核苷酸序列也用于描述这个核苷酸的每种可能的沉默变异体。一种技术能够辨认出一个核苷酸中的每个密码子(AUG除外,它通常是甲硫氨酸的唯一密码子,以及TGG也除外,它通常是色氨酸的唯一密码子)能被修饰成一个功能上完全相同的分子。相应地,每个编码一个多肽的核苷酸的沉默变异体都默认包括在每个被描述的序列中。
对于氨基酸序列来说,一种技术能够辨认出一个核酸,肽,多肽或蛋白质序列的个别替代,缺失或增加会导致氨基酸被一个化学上相似的氨基酸替代的“保守修饰的变异体”,这些变化为单个氨基酸或编码序列氨基酸一小部分的改变,增加或缺失。提供功能上相似氨基酸的保守替代表是这个领域中广为人知的。这些保守修饰的变异体包括了本发明的多形态的变异体、种间同源体和等位基因。
以下八个组每组包含相互保守替代的氨基酸1)丙氨酸(A),甘氨酸(G);2)天冬酰胺氨酸(D),谷胱酰胺氨酸(E);3)天冬氨酸(N),谷氨酸(Q);4)精氨酸(R),赖氨酸(K);5)异亮氨酸(I),亮氨酸(L),甲硫氨酸(M),缬氨酸(V);6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W);7)丝氨酸(S),苏氨酸(T);8)半胱氨酸(C),甲硫氨酸(M)(参看Creighton,蛋白质(1984))。
像多肽结构这种大分子结构可以用不同的组织水平来描述。关于这种组织的常规讨论参看Alberts等著,细胞的分子生物学(1994年第三版)和Cantor和Schimmel著,生物物理化学第一部分生物大分子的构象(1980)。“一级结构”是指一个特定多肽的氨基酸序列。“二级结构”是指在一个多肽中局部有序的三维结构。这些结构通常被认为是结构域。结构域是一个多肽的一部分,它能够形成该多肽的紧密单元,通常长度约为25到500个氨基酸。典型结构域由较小的组织结构如β-折叠和α-螺旋的扭曲所组成。“三级结构”是指一个多肽单体的完整的三维结构。“四级结构”是指由独立的三级结构单元以非共价键的结合方式形成的三维结构。各向异性项也被称为能量项。
术语“分离的”和“纯化的”是指能充分地或必要地从一个组分中直接得到的物质,该组分通常在天然状态下即含有此物质。不过,“分离的”并不指在一块电泳胶或其他分离介质中存在的组分。一个分离的组分是与这些分离介质脱离的,并将在其他方面应用或已经在新的环境应用。
脱落荧光和生色蛋白系统本发明的一个方面是提供可溶的荧光或生色蛋白的自行互补的片段。这些片段并不分别地显示出荧光或发色的“报告”表型。当物理空间上最接近时,这些片段自发地进行互补,从而重新组成它们所来源的那个蛋白质,重新恢复报告表型。这种互补片段的集合被定义为“脱落荧光”或“脱落生色”蛋白系统。这些系统可由GFP,GFP类似荧光蛋白,GFP类似非荧光蛋白和它们的变异体产生,可有效标记和检测活细胞、细胞裂解液,或其他体外分析形式中的可溶或不溶蛋白。同时也对本发明的脱落荧光和脱落生色系统的其他多种不同用途进行了展望。
本发明的脱落荧光和脱落生色蛋白系统使用简单,而且不需要用于检测报告表型的外源试剂。在一些具体实施方式
中,这些片段不会改变与之融合的试验蛋白的溶解特性。在另一些具体实施方式
中,一个片段可能会扰乱与之融合的试验蛋白的溶解性,但这样该片段即可用于蛋白质的溶解性筛选。
为举例说明本发明的这个方面,一个溶解性增强的GFP(美国专利申请No.10/423,688WO 03/095610)的多个自行互补片段被构建,并应用于一系列蛋白的检测、定量分析及纯化方法,下文中的例6,9,10有进一步的描述。这些“脱落GFP”蛋白检测系统展示了可靠的体内和体外可溶性、不溶性和/或总蛋白含量的定量检测(例如,来自活细胞、未加工的裂解液及在纯化和下游处理中的任何样品中的可溶性表达蛋白)。
任何GFP,GFP类似荧光蛋白,GFP类似生色蛋白均可在本发明的实际应用中使用(参看下文中在副标题荧光和生色蛋白下该家族蛋白的描述)。除此之外,本发明的内容可延伸到其他脱落报告蛋白系统的生成,这些系统中使用任何带有可检测表型的蛋白,例如β内酰胺酶,β半乳糖苷酶((Ullmann,Jacob等.1967;Welply,Fowler等.1981;Worrall and Goss 1989;Jappelli,Luzzago等.1992;Rossi,Blakely等.2000;Wigley,Stidham等.2001;Lopes Ferreira and Alix 2002)),二氢叶酸还原酶(Gegg,Bowers等.1997;lwakura和Nakamura 1998;Pelletier,Campbell-Valois等.1998;Pelletier,Arndt等.1999;Nakamura等.2000;Smith andMatthews 2001;Arai,Maki等.2003),以及抗氯霉素蛋白。
脱落荧光和脱落生色蛋白系统可以实现许多蛋白的检测和定量化分析。相比常规的蛋白检测和定量化技术,如SDS-聚丙烯酰胺凝胶,dot-blots以及类似的方法均耗时且难以自动化,该系统的分析具有更大的优点。。例如,用本发明的脱落GFP系统进行的蛋白检测和定量具有高灵敏度,可用于活细胞中或未加工的细胞裂解液中的蛋白检测(参看下文范例9和10)。另外,此分析系统耐用性好(如对变性剂、pH条件和辅助剂的耐受度,见下文例8),容许将展开的沉淀进行蛋白定量,因此提供了一种总体蛋白表达量的定量方法和一种在筛选蛋白重折叠剂中评估可溶蛋白复原的方法。
以下简要举例说明本发明的脱落荧光蛋白系统的设计。该蛋白检测系统的设计包括该领域技术人员所知的相同的步骤和原理。第一,目为了确定生成单独片段的合适切割位点,目标荧光蛋白被进行结构分析。该领域的技术人员都明白,这可通过在与GFP晶体结构或其他荧光蛋白的晶体结构重叠或不重叠的情况下,参考该荧光蛋白的已知晶体结构来实现,也可通过与GFP一级序列线性化来实现,还可通过预测性的结构建模(参考一个已知的荧光蛋白结构,如GFP)等来实现。
合适的剪切(或“分裂”)位点存在于β-折叠,特别是成环和旋转模体的序列中(见图3A,3B)。在一个简单的两片段系统设计中,一个荧光蛋白可在连续的β-链中(比如在β-链的成环和旋转结构中)的分子内的任何位点被裂分成两个片段,从而生成一个相应于连续的β-链第一部分的第一个片段和相应于连续的β-链第二部分的第二个片段。两个片段结合部分包含β-链所有的互补。例如,可将荧光蛋白裂分为对应于链1-9和10-11的片段或对应于链1-10和11的片段。在片段结合后,荧光(或发色)蛋白的所有的11条β-链都存在。需要注意的是,也可通过将原有的N末端和C末端连起来并引入新的起始和终止密码子也可以创建一个荧光蛋白的环形突变体,然后根据相应的连续的β-链进行片段剪接(如相应裂分为环形突变体的前体链9-1和2-8的片段)(图3C)。可仿效的两片段脱落GFP系统在实施例2,11,13中进行了描述。
同样的,如当这个荧光蛋白被相应的剪接为β-链1-9,10和11片段时,就产生了一个三片段系统。可仿效的三片段脱落GFP系统在实施例12中进行了描述。
一旦完成片段设计,即可运用该领域公知的克隆方法构建编码这些片段的核苷酸(如参见实施例1和实施例2)。
另一种可选择的方法则以互补性的经验为主来评估相同或相关荧光蛋白的不同片段。如实施例2中所描述的,几对GFP片段能在可共存于大肠杆菌的质粒中共表达,并用于互补性和相对荧光的评估。该方法可实现对来自一组荧光蛋白变异体进行有希望片段的初始快速筛选(参看实施例2中的超折叠GFP和环3GFP)。接着,筛选得到的单个片段可在增加溶解性和削弱试验蛋白的溶解性扰动方面做进一步改进(参看下文中副标题脱落蛋白片段设计和实施例3,4)。
使用本发明的脱落荧光或生色蛋白系统检测蛋白需遵循以下应用原则。简要地说,该荧光(或生色)蛋白的一个片段(“标签”片段)要与试验蛋白融合表达。如果试验蛋白是可溶的,那么融合蛋白也可溶,于是可与该报告蛋白的其他片段(“检测”片段)进行互补。通过如在相同细胞中表达此检测片段,或在表达融合蛋白的细胞溶解液中加入此检测片段等方式来实现该试验蛋白和标签片段的融合蛋白的检测。相反地,如果试验蛋白不可溶,或仅仅部分可溶,这些试验蛋白将会聚集,从而把被融合的标签片段“包埋”起来,使得试验蛋白和标签片段的融合蛋白不可溶并且不能与检测片段互补。如果互补发生,就会激活可检测到的报告表型。比如,当用一个荧光蛋白作为报告蛋白时,单独表达片段的自行互补会重建特有的β-管式结构,形成发色团,发出可检测到的荧光。图2显示了一个脱落GFP系统怎样运作的示意图。
脱落荧光蛋白片段可以在应用的特殊分析环境中折叠和溶解。在优选的具体实施方式
中,检测并改进这些单独片段的折叠性/溶解性,以分离出一个可溶的“标签”片段和一个可溶的“检测”片段。在优选的溶解性检测应用中,标签片段在β1和3链之间,在最优选的应用中,标签片段为一个单独的β链。然后试验蛋白与标签片段融合,而在与试验蛋白融合时,标签片段最好是完全不干扰试验蛋白。即,单独存在的试验蛋白的溶解性和折叠性应当和与标签片段融合的试验蛋白的溶解性和折叠性相似。
基于应用脱落GFP系统(参看实施例2)的实验结果,溶解性检测中的最优化形式是通过应用一个相对大的检测片段(例如约8-10个连续β链)和一个相对小的能与试验蛋白融合的标签片断(例如约1-3个连续β链)获得,其中,检测片段是可溶的,且可与标签片段-试验蛋白融合蛋白互补,并且标签片段不干扰试验蛋白的溶解性。对于多数应用的理想情况是,试验蛋白单独存在时的溶解性和与标签片段融合后试验蛋白的溶解性大致相同。检测片段最好是单节显性的,且不会自发聚集或发生错误折叠。
尽管在很多应用中,优选使用不干扰试验蛋白的标签片段,但倘若荧光量和溶解性之间存在固定的比例关系(不必是直接的比例关系),标签片段不过是影响试验蛋白溶解性,它在溶解性筛选分析中仍可使用。在一些具体实施方式
中,使用一个或多个干扰性的标签片段实际上是需要的(参看下文中三明治-形式检测的阐述),例如为筛选高溶解性的蛋白质。在这种情况下,应用干扰性标记片段可在所有蛋白中有效地选出溶解性最好的蛋白或翻译产物。此外,这些应用中的检测片段应是可溶的,因为不溶的翻译产物将不能与可溶的试验蛋白-标签片段融合蛋白互补。
本发明还提供了荧光蛋白片段最优化处理的改进方法,在下文脱落蛋白片段设计中有阐述,并在实施例3和4中进行了举例说明。这些方法也可同样地应用于生色蛋白,以及带有可检测表型的任何蛋白,以生成具有本发明所述的脱落荧光蛋白系统特性的脱落蛋白系统。
当使用本发明的脱落荧光蛋白和脱落生色蛋白系统时,可运用多种检测分析形式来检测和定量蛋白。下文进一步阐述了一些用于蛋白检测和定量的典型分析。此外,下面实施例部分已对大部分检测分析作了实验证明。
本发明的脱落荧光蛋白和脱落生色蛋白系统在蛋白溶解性筛选,蛋白检测和定量,蛋白纯化,蛋白的折叠和聚集,提高蛋白溶解性和产量的人工定向进化方法等方面中有多种应用。现在简要地描述一下这些应用,在下面的实施例部分也能找到这些应用的实施例。
蛋白质检测及定量分析本发明的脱落荧光和脱落生色蛋白系统可以用来在体内或体外检测和定量蛋白,下面的实施例对此进行了详细的描述。在本发明的这一方面,提供可溶的或不可溶的蛋白的检测分析,以及提供可溶的、不可溶的或总的蛋白表达的定量分析。在检测和定量分析中,使用上文描述的脱落荧光和脱落生色蛋白系统。下文将概述作为本发明一方面的利用脱落荧光系统的各种具体实施方式
。然而,应当理解为类似的具体实施方式
同样存在于脱落生色蛋白系统中。
体外检测分析在一个具体实施方式
中,提供了一个检测可溶解蛋白的快速体外分析,其包括裂解细菌(或其它)细胞,该细胞表达第一个荧光蛋白标签片段和试验蛋白X(例如X-GFPS11或GFP S11-X)的融合蛋白,其将裂解产物与第二互补荧光蛋白质检测片段接触,并筛选可检测的荧光。分析中可检测荧光的存在显示试验蛋白是可溶的。该检测系统应当服从能高通过量地从变异体文库中筛选一个蛋白质的可溶解变异体,且能快速辨认那些显示改良的溶解性特征的变异体,允许快速辨别最优化特征,该优化特征可以被进一步改进。如下文实施例9中所述,该检测分析可以直接在液体细胞培养物的天然裂解产物中进行。
下面将简要描述利用一个两片段脱落GFP系统在体外检测可溶解蛋白。试验蛋白被融合于GFP标签片段(例如,X-GFP S11)的N末端,且在大肠杆菌中表达,细胞裂解后的过量的互补GFP检测片段(如GFP 1-10)与裂解产物或裂解产物的样品结合。可检测的荧光表明检测片段和试验蛋白与标签片段的融合蛋白之间的互补,从而显示试验蛋白是可溶解的。此外,如果所用标签片段没有干扰试验蛋白的溶解性,那么所获荧光信号的强度对于可溶解试验蛋白的数量是直接成比例的。因此,在本系统中,荧光的程度提供了裂解产物样品中的可溶解试验蛋白的精确定量(参考校准的蛋白数量曲线,见下文实施例6)。确实,甚至如果标签片段干扰了试验蛋白的溶解性,那么试验蛋白量和荧光强度之间成比例关系。完全或实质上没有可检测的荧光表明标签片段与试验蛋白的融合蛋白是不可溶的,或者实质上是不可溶的,因此不能与可溶的大片段互补,从而表明试验蛋白本身在大肠杆菌中是不可溶的。
在所述的脱落-GFP系统中,试验蛋白的溶解性决定融合蛋白的标签GFP片段成分是否能与其补体结合。如果试验蛋白能正确折叠且是可溶解的,那么融合蛋白也是可溶解的,从而能与可溶的试验片段互补。然而,如果试验蛋白是不可溶的,它会聚集起来,遮蔽或包埋标签结构域,造成融合蛋白不可溶解。通常,试验蛋白与标签片段(试验蛋白-标签)的N末端融合。C末端融合蛋白(标签-试验蛋白)也可以被使用,但在此应用中,标签片段更有可能会反过来影响试验蛋白的折叠。然而,在期望仅仅筛选那些溶解性强的蛋白的应用中,利用C末端融合蛋白(标签-试验蛋白)就可以仅仅选择那些溶解性最高的蛋白。
不同的三片段系统也能被预见。在一个具体实施方式
中,GFP被剪接成3个片段,典型地作为一个更大的检测片段和二个更小的标签片段。试验蛋白被插入到二个标签片段(如S10-X-S11)之间的读码框中,且如果试验蛋白是可溶的,与检测片段(在本例中,GFP1-9)的互补会重新建立GFP荧光。三片段系统(如S1-9+S10-X-S11脱落GFP系统)进一步在名为设计一种(GFP S10)-X-(GFP S11)三明治标签形式和利用检测片段GFP 1-9 OPT进行检测这些分部中得到阐述,见下文中实施例12。这些″三明治″类型的可溶解蛋白检测分析形式在某些应用中有优势,例如筛选变异蛋白质文库得到更高可溶解的蛋白质产量。三明治形式确保仅有的那些全长和完整无缺的试验蛋白被检测。读码框移位或通过突变作用引入试验蛋白的内部核糖体连接位点不会造成完全融合的S10-X-S11,这样互补就不会发生。因此,在人工定向进化方法中使用该系统能有效地筛选出这些异常的克隆。
体内蛋白质检测分析相关的,体内具体实施方式
中,细胞被设计用来表达两个(或所有)互补片段,其中的一个或两个片段被融合到试验蛋白。该片段可以被同时或顺序表达,这依赖试验的目的是否是检测(和定量)总蛋白表达或仅仅可溶的和/或不可溶的部分。一般优选两个片段的顺序表达;因为共同表达可能会掩饰不溶性试验蛋白(见上文)。试验蛋白与标签片段的融合蛋白顺序表达(或添加)之后,紧接着是互补检测片段的表达,其提供时间让不溶的试验蛋白与标签片断的融合蛋白聚集并防止互补。
更明确地,举个例子,试验蛋白的编码序列融合到报告蛋白的自行互补片段的可溶性第一标签片段的读码框(5’->3’)内,然后放置于第一个独立诱导启动子的控制下。自行互补片段的可溶性第二检测片段的编码序列放置于第二个独立诱导启动子的调控下。这两个目的核酸结构可以合并到相同或不同的载体(如一个或两个质粒),假如启动子保持独立诱导,宿主细胞同载体一起被转移或转染。携带结构体的细胞最初在基本条件下进行培养,从而能抑制这两个独立诱导启动子。然后细胞在一段充分可以表达融合蛋白的时间内(如在大肠杆菌中,典型的大约0.5-3.5小时)被诱导表达试验蛋白与标签片段的融合蛋白,之后一段“休止”期内(大肠杆菌中大约0.5-1.5小时)诱导试剂扩散出细胞(或在哺乳动物细胞内,通过主动抑制启动子,如用反义多核苷酸来切断启动子)。然后细胞被诱导表达检测片段,在大肠杆菌中典型的约0.5-4小时。一种对哺乳动物可选择的实施方式是,在“休止”期之后或在主动抑制第一诱导启动子之后利用蛋白转染诱导检测片段蛋白(见下文)。
两个独立的可控制的启动子系统已被描述,且其在本技术领域是公知的。例如,Lutz和Bujard,1997,在大肠肝菌中通过lacR/O,TetR/O和AraC/11-12调控要素独立严格的调控转录单元,核酸研究.25(6)1203-1210)。
在一个实施例中,启动子位于Laclq蛋白和树胶醛糖诱导物/阻抑物的抑制下的载体可以被用来表达检测片段(如从Clontech,Palo Alto,CA得到的pPROLAR载体)。通过供给生长媒介以IPTG和树胶醛糖能减轻抑制,造成克隆检测片段的表达。在该系统中,宿主大肠杆菌细胞的遗传背景提供了araC阻抑物。为了试验蛋白-标签融合蛋白结构的可控表达,采用一个在它内部这种结构受四环素阻抑物蛋白的抑制的载体(如pPROTET载体;Clontech)。在该系统中,通过供给脱水四环素到生长媒介从而减轻抑制,造成试验蛋白-标签的融合蛋白构体的表达。tetR和Laclq阻抑物蛋白可以被提供给第三载体,或可以结合于携带片段的载体(见下文实施例1)。
将上述系统用于试验蛋白-标签融合蛋白和之后检测片段的顺序表达,将脱水四环素添加到同上述构体一起转变的细胞中,该添加取代了tet阻抑物,且试验蛋白-标签融合蛋白的表达被诱导。然后细胞被转移到带有新鲜介质的新培养皿上,经过大约1小时使脱水四环素扩散到媒介中,这之后tet阻抑物再次结合到启动子,关闭表达。然后,通过添加IPTG,独立诱导的T7启动子被激活,诱导检测片段的表达。检测片段的表达经历了一段充分的时间使其与可溶性第一片段-试验蛋白的融合蛋白自行互补。荧光检测(或颜色,在此使用脱落生色蛋白系统)检测出可溶性试验蛋白-标签融合蛋白。见下文实施例4。
体内溶解性检测对于高产量筛选是有责任的,作为表达试验蛋白变异体的大量细胞,其与标签片段融合,能通过在细胞内表达的检测片段或提供给细胞的检测片段的互补产生的荧光来检测溶解性。细胞分选可以被用来分离那些显示可检测荧光的细胞,因此从那些没有显示可检测荧光或仅显示微弱荧光的细胞中表达试验蛋白的可溶解变异体。
体内溶解性检测优选的例子是个体片段被顺序表达,如表达试验蛋白-标签片段的融合蛋白和之后的报告蛋白自行互补片段的表达。顺序表达允许不溶性试验蛋白聚合,从而使得该报告片段无法与其它报告片段互补。因此,通常为了本发明体内溶解性检测的应用,试验蛋白-标签片段融合蛋白的表达应当先于自行互补片段的表达一段充分的时间使不溶性融合蛋白聚集。在一些具体实施方式
中(如使用哺乳动物细胞),在融合蛋白被表达后试验蛋白-标签片段融合蛋白的表达被关闭,然后自行互补片段的表达被激活。按照这种方式,最精确的检测被实施。相反,两个报告片段-试验蛋白融合蛋白与自行互补片段的共同表达可以折衷溶解性检测结果,因为其允许在表达后立刻出现其它不溶性试验蛋白的短暂溶解性,因此允许自行互补。
蛋白定量分析以上两个溶解性检测分析可以扩展到试验蛋白的定量,尤其是可溶解部分,不可溶解部分和总蛋白表达的定量。例如,在一个可溶解和不可溶解蛋白部分的体外定量分析中,表达试验蛋白-标签片段融合蛋白(如x-GFP s11)的细胞被裂解,不可溶解的部分被沉淀。然后,包含可溶解部分的上清液同互补检测片段(如在包含互补片段的一系列微型滴定板孔中)混合,荧光被监控。可选择地,监测片段可以被添加到裂解产物,然后添加到反应容器。荧光度与可溶解的蛋白数量是直接成比例的,可溶解的蛋白数量可以根据标准刻度曲线(下文实施例6所述)决定。通过变性和再次折叠沉淀的蛋白以及通过将该准备与互补检测片段结合,不可溶解的蛋白部分被定量。该方法换一种方式,总蛋白表达被测量且与可溶解物的数量比较用来确定不可溶解的数量。在相关的实施方式中,通过展开的互补片段的共同再次折叠,总蛋白数量(可溶解或不可溶解)可以在体外被定量。
在一个相关的实施方式中,通过试验蛋白-标签片段融合蛋白和互补片段的共同表达,总蛋白数量(可溶解或不可溶解)可以在体内被测试。荧光度与总蛋白的数量是成比例的。见下文实施例9。
三明治形式的脱落荧光蛋白系统报告荧光和生色蛋白可以被剪接成三个(或更多)个体片段,该片段能自行互补而形成重组的报告蛋白。在一个三明治形式蛋白检测分析的实施方式中,荧光或生色蛋白的两个标签片段被融合于试验蛋白,其和片段一起能与第三片段互补而重组荧光表型或生色表型。例如,试验蛋白可以被插入在两个相邻的GFPβ链之间,如GFPS10-x-GFP S11。通过与GFP1-9的可检测互补,可溶性蛋白检测被完成。在本实施方式中,三个片段的互补确定试验蛋白是可溶解的,而且是全长,显示融合于X的GFP两个片段与X官能上连接。尤其在人工定向进化方法的上下文中,该方法提供确保试验蛋白x实际上是全长并完整无缺(反之,X-GFP S11仅互补GFP 1-10,而非GFP 1-9)的优势,并预防截短的试验蛋白,或具体表现为内在核糖体结合位点的试验蛋白,或经蛋白质水解的试验蛋白的出现。
相关的严格的可溶解性检测实施方式利用融合于一个试验蛋白的两个标签片段,其中通过功能性地与独立的可区别的第三互补检测片段重组,每个片段可以被独立地检测。更明确的,例如,在GFPS10-x-GFP S11的融合蛋白中,通过环形突变体GFP11-9δ10(环形突变体11-1-2-3-4-5-6-7-8-9,在这里11和1被连接在一起,10不见了,数字指链,见图3)链10是可检测的,反之,通过1-10δ11(1-2-3-4-5-6-7-8-9-10,在这里11不见了)链11是可检测的。利用在一个或两个互补对中GFP的色彩变化变异体(如GFP11-9δ10可以是蓝绿色变异体(Y66W),而GFP1-10δ11可以是黄色变异体(T203Y)),可以推动两个标签独立地同时检测。可选择地,标签片段可以来自有独特氨基酸序列的荧光蛋白,且和适当的相应检测片段一起被检测。例如,来自GFP的链11能被用来标签试验蛋白X的N末端,也能和GFP的链1-10一起被检测,然而来自红色荧光蛋白DsRed(Matz et 1999,Nat.iotechnol.17969-973)的链11可以同时被使用作为相同试验蛋白X的C末端的融合蛋白,且和DsRed的链1-10一同被检测。
一个可选择的实施方式利用FRET,其在两个重组的与试验蛋白连接的GFP之间被显示。例如,CFP 11-9δ10::10-X-11::YFP 1-10可以被利用。这样一种构体与CFP-x-YFP在官能上是相同的,只要X是完整无缺的,预先显示从CFP原料物质到YFP接受体的FRET,如果X是裂开的,则放松FRET,使CFP和YFP从接近的状态下自由,FRET的效率依赖(1/r6),在这里r是原料物质和接受体之间的距离。
原核和真核细胞培养基的应用本发明的脱落荧光和脱落生色蛋白系统可以应用在实质上的任何细胞类型,非限制地包括细菌细胞(如大肠杆菌)和哺乳动物细胞(如CHO细胞)。有一个限制是GFP和GFP类似蛋白的表达必须在高酸性的环境下(如pH=4.0或更小)。同样地,在pH为6.5或更低的条件下,通常互补率是低效率的(见下文实施例8)。
本领域技术人员欣赏的是,用于表达标签和/或检测片段的载体必须与寄居于载体的宿主细胞相兼容。同样的,多样的启动子系统是可获得的,且应选择和细胞类型、菌株等相兼容的启动子系统。众所周知,密码子的最优化技术可以被用来适应那些在其它细胞中使用的序列。
当使用哺乳动物细胞作为本发明的互补检测时,对于密码子最优化的选择是利用化学转染试剂,如最近描述的“chariot”系统(Morris et 2001,转移生物活性蛋白到哺乳动物细胞的肽载体,自然生物191173-1176)。该chariotTM试剂可以被用来直接转染蛋白到哺乳动物细胞的细胞质。因此,这种方法对于体内蛋白检测分析是有用的,其中通过细胞在表达遗传编码的试验蛋白-标签片段融合蛋白的之前或者之后,检测片段可以被引入细胞。
溶解性增强的蛋白变异体的分离方法上文描述的蛋白溶解性检测可以被用来与人工定向进化方法结合从而分离出相对于亲本没有进化过的蛋白而言增强了溶解性的蛋白变异体。
本技术领域公知的一种产生突变蛋白变异体文库的方法可以被用来产生候选的试验蛋白,该蛋白可以作为标签片段的融合蛋白而被表达。通常通过突变核酸会使目标蛋白或多肽被突变。在本技术领域突变的技术是公知的。这些技术包括易错PCR,化学突变,暗盒突变,但不限于此。可选择的,宿主细胞的突变菌株可以被用来增加突变频率(Greener和Callahan(1995)策略分子生物学732)。例如,易错性PCR(见上文如Ausubel)使用低精确度的聚合条件在一个长序列的任意位置上随机引入低水平的点突变。其它突变的方法包括,例如,重组(WO98/42727);寡核苷酸定向的突变(见Smith发表于遗传学研究年报19423-462(1985)上的的评论;Botsteinand Shortie,科学2291193-1201(1985);Carter,生物化学期刊2371-7(1986);Kunkel,“寡核苷酸定向突变的效率”,在核酸和分子生物,Eckstein and Lilley,eds,Springer Verlag,Berlin(1987),酶学方法100468-500(1983),和酶学方法154329-350(1987));磷脂酸化物修饰的DNA突变(Taylor等,核酸研究.138749-8764(1985);Taylor等,核酸研究.138765-8787(1985);Nakamaye and Eckstein,核酸研究.149679-9698(1986);Sayers等,核酸研究.16791-802(1988);Sayers等,核酸研究.16803-814(1988)),使用含有尿嘧啶的模板的突变(Kunkel,Proc.Nat’l.Acad.Sci.USA 82488-492(1985)和Kunkel等,酶学方法154367-382,1987);使用有缺口的双DNA的突变(Kramer等,核酸研究.129441-9456(1984);Kramer and Fritz,酶学方法,154350-367(1987);Kramer等,核酸研究.167207(1988));Frita等,核酸研究.166987-6999(1988))。附加的方法包括点错配修复(Kramer等,细胞38879-887(1984)),使用修复不足宿主链的突变(Carter等,核酸研究.134431-4443(1985);Carter,酶学方法154382-403(1987)),删除突变(Eghtedarzadeh and Henikoff,核酸研究.145115(1986)),限制选择和限制纯化(Wells等,Phil.Trans.R.Soc.Lond.A 317415-423(1986)),通过总遗传合成的突变(Nambiar等,自然科学2231299-1301(1984);Sakamar and Khorana,核酸研究.146361-6372(1988);Wells等,基因34315-323(1985);和Grundstrom等,核酸研究.133305-3316(1985)。突变试剂盒在商业上是提供的(如Bio-Rad,Amersham International)。更多最近的方法包括基于密码子的突变,在该方法中整个密码子被取代,从而增加了产生的突变体的多样性,例如,在Murakami等2002在自然生物技术,2076-81杂志中描述的RID方法。
在细菌表达系统中,利用上文描述的体内或体外检测,表达变异体的克隆根据溶解度被快速筛选。因此,在一个体内实施方式中,在大肠杆菌中产生克隆文库,在第一个独立的可诱导启动子的控制下,每个克隆都隐藏了编码与标签片段相融合的单个变异体蛋白的表达结构。在第二个分离的可诱导启动子或者检测片段多肽本身的控制下,细胞通常可以隐藏编码互补检测片段的一个可表达构体(引自蛋白转染方法如上文所述的Morris等2001)。
在一个体内实施例中,细胞被诱导用来表达标签片段-蛋白变异体融合蛋白,从而表达细胞中互补片段。在大多数优选的实施方式中,融合蛋白的表达被抑制或关闭一段时间足以使不溶性融合蛋白聚合(如1小时,见下文实施例4和实施例10),之后互补片段表达被诱导。在本方法的另一种变化方式中,细胞仅隐藏融合蛋白构体,优选在可诱导/可抑制启动子的控制下,通过蛋白转染方法引入互补片段。
不同的体外实验是可能的。一般,这些包含如在大肠杆菌内的突变蛋白-标签片段融合蛋白的表达,之后细胞裂解并且与互补检测片段多肽进行反应。
蛋白纯化本发明的另一方面是利用脱落荧光和脱落生色蛋白系统纯化蛋白,该蛋白在上文的溶解性检测中被确定为可溶解的。简单地,标签片段被修饰包含一部分或氨基酸残余物,其使标签被分配结合到底物上,利用标准的纯化技术可以进行分离。在一个实施方式中,标签多肽利用公知且商业可用的化学(如,分子探针公司)被分配结合到玻璃珠上。可选择的,如下文实施例13所述,标签片段被修饰并结合到组氨酸残基,从而分配该标签结合到金属亲和树脂珠。在一个特殊的实施方式中,GFP S11片段被设计出来以使在β-链外围的指示残余物被组氨酸残余物取代。该HIS-标签片段没有扰乱融合的试验蛋白,于是能够检测与GFP 1-10检测片段互补的可溶解蛋白(实施例13)。该HIS-标签片段可以被用来纯化钴类滴柱中的蛋白,不仅能使可溶解和不可溶解的蛋白定量,且不需要其它纯化标签系统就能纯化并洗提蛋白至95%的纯度。见下文实施例13-17。
预先互补相对于那些生色团环化过程从未在其中发生过得片段,通过利用GFP片段内预先形成的带有相当生色氨基酸的生色团,能够使在GFP片段的互补过程中荧光形成的速率得到巨增。简单的,一个非荧光的预先互补的带有生色氨基酸的GFP片段可以通过以下方式形成(1)将片段与不包含生色氨基酸的互补片段混合;(2)完成荧光的互补反应和形成;(3)伸展片段,如通过化学方法产生展开的非荧光GFP片段;(4)恢复含有生色氨基酸的片段且将其与其它片段分离;(5)使显示生色氨基酸的片段恢复原来属性。该片段实质上保持非荧光性,即使其包含环化生色团,因为其实质上已经通过化学或其它方法被展开以至于成为非荧光,当缺乏互补片段时,其仍保持展开的。在没有产生与生色团共价修饰的情况下,仅仅通过再次增加互补、不包含生色团的GFP片段,可以获得荧光的快速恢复。通过这种方法,由于缓慢的生色体环化反应是完全的,互补中荧光的形成仅受互补片段结合速度及折叠β-管本身结构形成的限制。
脱落蛋白片段设计分离可溶性自行互补片段的人工定向进化方法本发明的另一方面涉及通过人工定向进化方法和片段的连续诱导产生理想的脱落蛋白中间体的方法。连续诱导的结合与现有出版的方法相比,详细说明了脱落片段的联合诱导。简单地,在连续诱导方法中,片段1不变,片段2进化。当片段1不变,片段2进化时,片段2首先被表达,然后表达被关闭。片段被允许聚合或保持可溶解。接着,片段1被表达。如果两个片段被同时表达,会导致假阳性,因为互补可以在聚合之前发生。连续表达可以选择真阳性,如可溶解的变异体。在最适宜的片段2变异体选择之后,该变异体保持不变,然后片段1进化。当利用进一步连续诱导时,这个过程可以被持续至得到想要的片段溶解度。利用该方法,目标片段可以在互补前被设计成本身是可溶解的。
削弱溶解度对可检测蛋白的干扰可溶解片段可以被进一步设计用来减小对融合过客区域(试验蛋白)的溶解性的干扰影响。简单的,一种当与片段融合时相对于单独表达时溶解度较低的试验蛋白在人工定向进化方法中被用作为诱饵结构域,用来设计一种片段,这样融合蛋白与非融合蛋白的溶解性是相似的,可以减轻该片段对试验蛋白溶解性的影响。该方法在最优化GFP的一个短小片段中被使用,导致产生一种削弱融合过客蛋白干扰影响的变异体(见下文实施例4)。
试剂盒本发明的另一方面提供脱落荧光和脱落生色蛋白系统试剂盒,该试剂盒用于上文所述的各种检测中。本发明的试剂盒可以使本发明的脱落荧光和脱落生色系统的使用更方便。实施本发明试验的各种材料和试剂可以被提供。试剂盒可以包括不受限制的试剂,多肽或多核苷酸,细胞转换和转染试剂,纯化多肽的试剂和材料,恢复本身属性的蛋白和再次折叠的试剂,还有在本发明的试验和其它方法中使用的其它溶液或缓冲液。试剂盒也可以包括控制样品,用于校准本发明试验的材料,及容器、试管、微型滴定盘等类似物,其中检测反应可以被操作。试剂盒可以在容器中被打包,其可以包含接受试剂盒内容的隔间,操作试验的说明等。
例如,试剂盒可以提供本发明的一个或更多的脱落荧光蛋白片段,编码一个或更多荧光蛋白片段的一个或更多多核苷酸载体,适宜繁殖载体的细菌细胞菌株,预先转换的细胞或与编码一个或多个荧光蛋白片段的构体进行转染的细胞,及用于表达的融合蛋白的纯化试剂。
在试剂盒的一个实施方式中,其便于操作本发明的蛋白测试分析,该试剂盒包含一个易接受的核酸载体,该载体包含标签荧光或生色蛋白片段(如GFP S11)的编码序列,其包括一个多样的克隆位点,该克隆位点用于插入读码框中试验蛋白到标签片段编码序列的N末端。随意地,插入位点可以跟在读码框中连接多肽的编码序列与下游标签序列的编码序列之后。一个特殊的实施方式是pTET-SpecR质粒,其设计在实施例1中被描述且在图1中被说明。pTET-SpecR质粒的完整核苷酸序列如图1B中所示。
该接受体,或“标签载体”被用来提供适用于宿主细胞的试验蛋白-标签融合蛋白。在体外检测实时方式中,该试剂盒还包含一个预先纯化的检测片段(如GFP1-10多肽),其用于检测被标签载体表达的试验蛋白-标签片段融合蛋白。在一个体内检测实施方式中,试剂盒还包含一个“检测载体”,在独立调节启动子的控制下该“检测载体”与标签载体兼容且编码检测片段。在体内检测的替换实施方式中,包含检测载体的细胞(如在可诱导启动子的控制下编码GFP 1-10的载体)与兼容的标签载体一起在试剂盒中被提供,在该标签载体中试验蛋白可以被克隆,其中通过分离的可诱导启动子被控制表达。包含检测载体的细胞可以与标签载体及被监控的细胞荧光一起被转换。
校准本发明溶解性检测的材料可以被提供。在一个实施方式中,试剂盒包含纯化的亚硫酸还原酶GFP S11融合蛋白试剂。
荧光和生色蛋白本发明提供用来设计脱落荧光和脱落生色蛋白系统的方法和原理,在这里以通过用于蛋白检测和定量的最佳脱落GFP系统的产生和分子进化为例。然而,其他GFP类似蛋白可以被用于本发明的实施。
荧光蛋白的基团包括从水母(Aequorea Victoria)(GFP)中分离的绿色荧光蛋白,还包括大量的GFP变异体,如青色荧光蛋白,蓝色荧光蛋白,黄色荧光蛋白等(Zimmer,2002,化学革命.102759-781;Zhang等2002,自然科学评论3906-918)。典型地,这些变异体共享大约80%,或者更多的与SEQ ID NO2(或SEQ ID NO8)一致的序列。这些有色转移的GFP突变异种具有从蓝色到黄绿色的散发颜色、增加的亮度和耐光性(Tsien,1998,生物化学评论年报67509-544)。一个这样的GFP突变异种被称为增强的黄色荧光蛋白,其显示散发的最大值达529nm。通过将色氨酸的非自然变异体合并入青色变异体,产生另一个最近描述的突变异种,即一个黄金变异体,其具有574nm的红色转移散发最大值的特征(Bae等.,2003,分子生物学期刊.3281071-1081)。
其它以GFP为基础的变异体具有改进的激发和散发光谱(Tsien等美国专利申请号U.S.Patent Appn.20020123113A1),其增强了荧光强度和热容量(Thastrup等美国专利申请号U.S.Patent Appn.20020107362A1;Bjorn等美国专利申请号U.S.Patent Appn.20020177189A1),且在减少氧含量的情况下生色团的形成(Fisher,美国专利申请号U.S.Patent No.6,414,119)也已被描述。来自Anthozoans Renillareniformis和Renilla kollikeri的GFP也已被描述(Ward等美国专利申请号U.S.Patent Appn.20030013849)。
此外,超过100个GFP类似荧光蛋白和来自珊瑚类的非荧光生色蛋白现在已被识别(作为参考,见Verkusha等,2003,GFP类似荧光蛋白和珊瑚类的生色蛋白,在蛋白结构结构性质和功能的万花筒,pp.405-439,Ed.V.Uversky.Research SignpostPress,India)。珊瑚蛋白基团包括与Discosoma珊瑚类分离的红色荧光蛋白,DsRed(Matz et 1999,Nat.Biotechnol.17969-973),及不同的DsRed变异体(如DsRed1,DsRed2)。DsRed和其它珊瑚荧光蛋白仅分享大约26-30%的氨基酸序列,其与来自水母的野生型GFP一致,然而所有重要的模体被保藏,显示GFP的β11链管式结构特性的形成。DsRed的晶体结构已被解答,并显示GFP MMDB Id5742的β11链管式结构的保藏。
大量更长波长的红色荧光蛋白DsRed的突变异种已被描述。例如,最近被描述的进一步转移到红色荧光蛋白的具有散发光谱的DsRed突变异种可以在本发明的实施中被使用(Wiehler等,2001,FEBS Letters 487384-389;Terskikh等,2000,Science2901585-1588;Baird等.,2000,Proc.Natl.Acad.Sci.USA 9711984-11989)。最近一个DsRed的单节显性变异体被描述(Campell et al.,2002,Proc.Natl.Acad.Sci USA 997877-7882)。该变异体被称为“mRFP1”,其很快成熟(野生型的DsRed与之相比需要超过30小时时间成熟),没有残留的绿色荧光,有比其它DsRed变异体长大约25nm的激发和散发波长。
来自大量海洋生命形态的日益增加的大量其它荧光蛋白最近被描述,目前蛋白数据库列出大量GFP和GFP突变晶体结构,还有不同的GFP类似物品体结构。推断与来自珊瑚、海鳃、海鞘和海葵的GFP结构相似的相关荧光蛋白已被描述,其可以用于产生本发明脱落荧光蛋白系统(作为参考,见Zimmer,2002,Chem.Rev.102759-781;Zhang等,2002,自然评论3906-918).
此外,来自Anemonia majano,Zoanthus sp.,Discosoma striata,Discosoma sp.和Clavularia sp.的荧光蛋白也已被报道(Matz等,见上文)。克隆自石头珊瑚种类的荧光蛋白,Trachyphyllia geoffroyi,已被报道散发绿色、黄色和红色光,暴露于UV光上从绿色光转变到红色光散发(Ando et al.,2002,Proc.Natl.Acad.Sci.USA 9912651-12656)。近来描述的来自海葵的荧光蛋白包括绿色和桔红色荧光蛋白,其克隆自Anemonia sulcata(Wiedenmann et al.,2000,Proc.Natl.Acad.Sci.USA9714091-14096),一个自然增强的绿色荧光蛋白克隆自Heteractis magnifica的触角(Hongbin et al.,2003,生化研究.Commun.301879-885),一个普通的非荧光紫色生色蛋白显示微弱的红色荧光,其克隆自Anemonia sulcata,及一个显示远红外转移散发光谱(595nm)的突变异种(Lukyanov et al.,2000,J.Chem.27525879-25882)。
最近被描述的与海葵Entacmaea quadricolor,EqFP611分离的红色荧光蛋白是一个具有单一共平面及贯穿生色团的远红外高荧光蛋白(Wiedenmann等,2002,Proc.Natl.Acad.Sci USA 9911646-11651)。EqFP611的晶体结构已被解答,显示GFP MMDBId5742的β11链管式结构的保藏(Petersen et al.,2003,生物化学杂志,August8,2003;M307896200)。
还有更多类型的具有生色和荧光特性的GFP类似蛋白已被描述。这样一个源自珊瑚的蛋白基团,pocilloporins,显示宽范围的光谱和荧光特性(Dove and Hoegh-Guldberg,1999,PCT申请WO 00/46233;Dove等,2001,Coral Reefs 19197-204)。最近,来自暗礁建筑珊瑚Montipora efflorescens的pocilloporin Rtms5的纯化和结晶化已被描述(Beddoe et 2003,Acta Cryst.D59597-599)。Rtms5是深蓝色的,还是弱荧光的。然而,据报道Rtms5和Rtms5同族序列的其它生色蛋白,经过单一氨基酸置换能被互换成远红外荧光蛋白(Beddoe等,2003,见上文;Bulina等.,2002,BMC生化.37;Lukyanov等.,2000,见上文)。
与pocilloporins密切相关的各种其它源自珊瑚的生色蛋白也是已知的(见例如,Lukyanov等2000,生物化学杂志.27525879-82;Gurskaya等,2001,FEBS Letters50716-20)。到此程度,这些生色蛋白包含被保藏的GFP和其它荧光蛋白的β11链管式结构,它们可以被剪接到自行互补片段,且能被使用在此所述的检测系统中。
具有来自MMDB Id5742的β11链管式结构少于5埃,通常少于3或4埃,优先少于2埃的根中间正方形偏离结构的任何荧光蛋白可以在自行互补片段的生长中使用。有些时候,荧光蛋白以多聚的形式存在。例如,DsRed是四聚的(Cotlet et al.,2001,Proc.Natl.Acad.Sci.USA 9814398014403)。值得本领域技术人员欣赏的是,该多聚荧光蛋白与GFP(一个单体)之间的结构偏离在荧光蛋白结构的单节显性单位的基础上被估计。
本领域的普通技术人员欣赏的是,使用本领域公知的对比方法,这样一个适合的荧光蛋白或生色蛋白结构可以被识别。在识别该蛋白中,在MMDB Id5742结构的线性化和对比的关键特性是β-管式结构的保藏(如,典型的包括β11链,但至少在一种情况下,更少的β链(见上文Wiedenmann et al.,2000)和第二结构元素的布局或连接顺序(见如Ormo等“水母绿色荧光蛋白的晶体结构”Yang等,1996,科学2735280,1392-5;Yang等1996自然生物.101246-51)。典型地,在荧光蛋白和GFP结构之间的多数偏离,其长度为关键β链之间的连接链或接头(如见,DsRed和GFP的对比,Yarbrough等.,2001,.Proc Acad Sci USA 98462-7)。在Yarbrough等,DsRed和GFP的线性化如图显示。从该立体图中明显看出β11链管严格被保藏在两个结构之间。尽管与DsRed和GFP相比,序列一致率只有23%,C-α脊椎被线性化在1埃RMSD内超过169个氨基酸。
在对比结构中,使用本技术领域熟知的运算法则,如使用CCP4程序组,合作计算方案,第4.1994。“CCP4组蛋白结晶学程序”,Acta Cryst.D50,760-763,两个被比较的结构被线性化。在使用该程序中,用户输入被线性化的两个结构的PDB坐标文件,该程序产生输出线性化结构的原子坐标,其使用严格的身体转化(旋转和平移)来使位于该两个结构中原子的全部不同点最小化。输出的每一个结构的线性化坐标可以被分别显现,或作为一个重叠,其通过可用的分子制图程序如RASMOL,Sayle和Milner-White,1995年9月,生物化学科学趋势(TIBS),卷20,No.9,p.374)或者Swiss PDB阅读器Guex,N and Peitsch,M.C.,1996 Swiss-Pdb阅读器一个针对微机和PC机蛋白数据库的快速且易使用的PDB阅读器季刊时事通讯77,pp.7。
考虑到RMSD,RMSD的价值衡量与结构线性化是同一程度的,且当使用RMSD作为全部结构相似点的描述符,其大小要被考虑。通过包括氨基酸块缩放比例的RMSD版本典型地被处理,该氨基酸在一定的限度内被线性化。满足特定标准的线性化序列的完整块越长,结构就线性化得越好。在DsRed例子中,c-α碳的164能被线性化在GFP的1埃中。典型地,本领域技术人员会选择一个程序,该程序可以线性化两个基于严格身体转化的试验结构,例如,Dali等分子生物杂志1993,233,123-138.中所述。运算法则的输出是序列块,通过使用严格身体转化,其在两个结构之间可以有层次。具有Z刻痕的区域在Z=2或在Z=2之上被相似报道。对于每个这样的块,全部RMSD被报道。
本发明使用的荧光蛋白或生色蛋白的RMSD在5埃内,至少80%的序列在β11链内。优选的,RMSD在2埃内,至少90%的序列在β11链内(通过如图所示重叠的两个线性化结构的视觉检查及与通过DALI程序输出报道的线性化块的对比,β链被确定)。作为本技术领域人员欣赏的,在β链之间的接头可以相当地变化,且不需要结构之间的重叠。
在优选实施方式中,荧光蛋白或生色蛋白是蛋白的变异版本,或与该蛋白相比改进其折叠或溶解特性的蛋白变异体。通常这种蛋白能被识别,例如通过使用WO0123602中描述的方法和其它方法来选择增加的折叠。
例如,为了获得具有增加折叠特性的荧光蛋白,减少荧光蛋白折叠产量的一个“诱饵”或“过客”肽被连接到荧光蛋白。该过客肽可以是当被插入时减少荧光蛋白折叠产量的任何肽。变异荧光蛋白文库被创造。该诱饵肽被插入荧光蛋白且蛋白的荧光程度被检测。那些克隆显示相对包含诱饵肽的融合蛋白而增加的荧光,且母荧光蛋白被选择(荧光强度反映适当折叠的荧光蛋白的数量)。该过客肽可以在末端被连接到荧光蛋白,或可以在中间位置被插入。
在一个特殊的实施方式中,用于本发明实施的野生型和变异荧光蛋白及生色蛋白可以在实验上被改进而产生非常稳定的“重叠”变异体。结合2003年4月24日申请的共同未决、共有的美国专利申请10/423,688描述的方法的全部作为参考,该方法可以被使用到GFP、DsRed和其它相关荧光蛋白及生色蛋白的人工定向进化中。这种重叠的变异体可以被剪接到自行互补片段中,该片段可以进一步被改进用来单独调节片段的溶解特性或当其融合于试验蛋白时进行调节。
改进脱落荧光或生色蛋白片段的可溶解和非干扰(对试验蛋白溶解性)变异体的特殊方法在上文中副标题脱落蛋白片段设计下面被提出。
实施例发明的各种不同方面将会进一步描述,并且通过下面几个具体实施例的方式进行阐述,但不是为了对发明范围进行限制。
实施例1构建质粒pTET-SpecR商业用tet-启动子PRO细菌表达系统(Clontech,Palo Alto,CA)利用从表达质粒中分离出来的第二次质粒上得到调控蛋白tetR,使得创建巨型质粒库的效率很低。为了克服这个缺陷,我们将控制目标蛋白表达的tet启动子和tetR调控蛋白重组于含有四环素诱导启动子的tet的单个质粒上,tet启动子调控蛋白tetR,以及选择性抗生素标记SpecR,所述抗生素标记对奇放线菌素这种抗生素有抗性。复制起点ColE1允许所述重组质粒在带有像p15起点这样的兼容性起点的质粒在细胞内共存。这样某种标记有GFP片段的蛋白就可以在pTET质粒中表达,而另外一种GFP检测片段的结构互补物蛋白,则可以在另外一种像pET载体(Novagen,Madison,WI)这样的质粒中表达。pTET-SpecR质粒如图1A所示,所述质粒的序列以及遗传单位如图1B所示。
pTET-SpecR质粒通过重叠PCR得到,从商业化pPROTet.6xHN载体,pPROLAR载体,以及BL21-PR菌株(Clontech,PaloAlto,CA)自带的能够自我复制的质粒上重组元件。氯霉素抗性基因用从BL21-PRO菌株自带的能够自我复制的质粒上克隆得到的奇放线菌素抗性标记替代,并且置于pPROLAR载体的卡那霉素抗性标记的启动子的控制之下。我们利用分离自BL21-PRO菌株的奇放线菌素抗性的能够自我复制的质粒,克隆了位于T0转录终止密码子序列上游的四环素抑制(tetR)蛋白。tetR的翻译量由位于SacI下游的弱shine-Delgarno序列调节,通过从小型简并性文库中选择一个shine-Delgarno突变子使得添加脱水四环素(如下所述)之后减少漏检并且得到最大化的诱导。商业化pTET-SpecR质粒上的Spel限制性位点被压制。新质粒“pTET-SpecR”用Ncol和Xbal限制性内切酶(New England Biolabs,Beverly,MA)进行酶切,来接收GFP S11脱落GFP克隆盒。最终的克隆位点结构是Nco-1::6HIS::凝血酶分裂位点::Nde-1::frame shift stuffer::BamHI:(GGGS):Spel::GFP S11(TAAStop)::Kpnl。克隆片段的有义链两边连接Ncol和KpnlNcoI NdeICCATGGGCAGCAGCCATCATCATCATCATCACAGCAGCGGCCTGGTGCCGCGCGGCAGCCATATGBamHI SpeIKpnIGGTGGCGGTTCTGGATCCGGAGGCACTAGTGGTGGCGGCTCAGGTACC[SEQ ID NO23]一段读码框移码(frame shift stuffer)完美地加入到Ndel和BamHI限制性位点之间,从而避免了基于重组载体而产生的背景表达。
读码框移码实施例1FS0序列CATATGTGTTAACTGAGTAGGATCCG[SEQ ID NO24]读码框1H M C * L S R I读码框2I C V N * V G S读码框3Y V L T E * D P读码框移码实施例2FS1序列CATATGTAATTAATTAATTGGATCCG[SEQ ID NO25]读码框1H M * L I N W I读码框2I C N * L I G S读码框3Y V I N * L D PC末端脱落蛋白片段,例如GFP链11或者GFP链10-11,是通过特异性低聚核苷酸引物提供的Spel和Kpnl两侧的限制性位点以及目标编码序列克隆自限制性位点Spel和Kpnl之间的片段。同样片段也可以通过特异性低聚核苷酸引物和PCR扩增包含有限制性位点的模板DNA得到,这是行业内的公知技术。业内人士同样清楚完整的Ncol/Kpnl盒可以通过对目标载体进行设计合适的限制性位点,从而转移到如pET载体等其他表达载体或系统中。
TetR基因由BL21(DE3)PRO细胞(Clontech,Palo Alto,CA)中分离出的质粒上克隆得到。通过利用tetR基因序列的5’和3’端特异性引物扩增完整的基因。上游引物包含一个SacI限制性位点以及之后的tet启动子调控下的优化抑制/诱导重组蛋白Shine-Delgamo序列(本实施例,及如下所述)。下游引物包含一个与PROTet质粒的T0转录终止子序列同原的区域。PCR产物与T0终止子扩增物装配起来,重产物通过PROTetTM6xHN载体(Clontech,Palo Alto,CA)的Sacl/Spel限制性位点克隆得到,之前利用公知技术通过PCR介导位点指向性突变反应静止了共同限制位点从而进行修改。
奇放线菌素抗性基因利用基因特异性引物从BL21DE3PRO的质粒上扩增P1CAGGATGAGGATCGTTTCGCATGGTAACGGCGCAGTGGCG,[SEQ ID NO26]P2CGCCACTGCGCCGTTACCATGCGAAACGATCCTCATCCTG,[SEQ ID NO27]P3GCATTATTTGCCGACTACCTTGGTGATCTCGCC,[SEQ ID NO28]P4ACCCCAGAGTCCCGCATTATTTGCCGACTACCTT,[SEQ ID NO29].
P1和P2引物包含pPROLar载体(Clontech,Palo Alto,CA)的卡那霉素启动子序列,P3和P4引物包含卡那霉素位点末端到SacI之间的连接序列。完整的盒通过AatII/SacI限制性位点插入到新的pTET-SpecR质粒内。插入序列v1CATATGGGTGGCGGTTCTGGATCCGGAGGCACTAGTGGTGGCGGCTCAGGTACCTAACTCGAG[SEQ ID NO30]和v2CATATGGGTGGCACTAGTGGTGGCGGCTCAGGTACCTAACTCGAG[SEQID NO31]来自于重叠引物,并且通过NcoI和Xbal位点克隆到pTET-SpecR质粒上,从而产生pTET-SpecR v1和pTET-SpecR v2质粒。调控tetR蛋白翻译的Shing-Delgamo序列通过突变和选择进行优化。简单来说,折叠报告子GFP基因克隆到插入序列v1pTET-SpecR质粒的Ndel-BamHI之间再转化到DH10B菌株。tetR基因利用简并引物进行扩增,所述简并引物是针对Shine-Delgamo序列的4个核苷酸设计的,并且盒克隆到包含有pTET-SpecR接受载体的GFP的SacI/Spel之间。最终文库转化到BL21 DE3菌株。优化突变子通过计算诱导率(诱导后的GFP荧光细胞除以诱导前的GFP荧光细胞)进行筛选,并且选择在添加0.25μg/ml脱水四环素(anhydrotetracycline,AnTET)(表1)后有最大突变率的突变子。优化的tetR序列的Shine-Delgarno序列显示出最大的诱导率是AATAAA CATTAATG[SEQ ID NO32]。
表1表达于优化pTET-SpecR载体和PROTetCmR商业载体中的GFP全细胞荧光
a诱导前荧光。
b3小时37℃诱导于250ng/ml脱水四环素后的荧光。
实施例2寻找可行的脱落GFP对为了实现脱落GFP蛋白的标签作用和如图2所示的监测作用,我们首先测试了几对片段,分别来自折叠报告GFP和异常稳定的“超级折叠”GFP,折叠报告GFP上面有突变F99S,M153T,V163A(Crameri,Whitehorn et al.1996),F64L,和S65T(Patterson,Knobel et al.1997),“超级折叠”GFP包含折叠报告GFP的突变以及S30R,Y39N,N105T,Y145F,I171V以及A206V。我们分别在兼容性大肠杆菌质粒上共表达了几对GFP片段,包括氨基酸1-145+145-238,1-155+156-238,1-171+171-238,1-195+196-238,1-214+214-238。连接点适应β-链之间的环卡和转角(Tsien 1998;Baird,Zacharias et al.1999)(如图3所示)。从超级折叠GFP得到的片段对呈现出比从折叠报告GFP得到的片段对更亮的菌落。例如,超级折叠GFP在156和172断裂点处的片段要比来自于折叠报告GFP的片段亮(如图4所示)。我们的目标是要最小化片段的尺寸以满足作为一个蛋白标签的作用,所以我们选择了最小片段(1-214+214-238)。为了进一步减小标签结构域的尺寸,我们也检测了1-214(GFP1-10)来与214-230(GFP S11)互补,从小片段中除掉杂乱的残基231-238(Tsien 1998)。表2所示为GFP S11结构的序列包含野生型以及人工突变子。
表2GFP S11变异体序列
a通过直接进化得到的点突变用粗体表示。序列在GFP230位氨基酸处停止,添加的C末端GT氨基酸模体用Kpnl位点编码。
b相应于全长GFP位置的计数。
cC末端GT氨基酸模体来自Kpnl位点,后接TAA终止密码子。
d序列终止于GFP的228位氨基酸,后接来自于Kpnl位点的GT。
e序列开始于GFP的215位氨基酸。230位之后为终止密码子。
从带有兼容性起始位点(Novagen,Madison,WI)的pET载体中共表达的超级折叠GFP片段1-214(GFP 1-10)和214-230(GFP S11野生型)表达生长出了有荧光的大肠杆菌菌落(如图5所示)。没有监测到与相应的折叠报告GFP片段(如图5所示)发生的互补。超级折叠GFP 1-10是不溶性的,但是当再次折叠包含体(实施例9,下述)与C端标记有野生型GFP S11野生型的耐超高温热棒菌(Pyrobaculumaerophilum)(Fitz-Gibbon,Choi et al.1997)来源的可溶性亚硫酸还原酶一同培养之后可以得到亚硫酸还原酶-GFP S11野生型融合蛋白,可以产生时间依赖性的荧光增长(图5,曲线图)。
实施例3设计GFP检测片段GFP 1-10我们通过DNA改组技术(Stemmer 1994)改进了超级折叠GFP 1-10,增强了它的溶解能力以及与亚硫酸还原酶-GFP 11的互补能力。超级折叠GFP 1-10的PCR扩增物参照已经出版了的实验步骤(Stemmer 1994)进行DNA断裂和改组。GFP 1-10cDNA文库质粒转染到pPROTET载体(Clontech,Palo Alto,CA)上的含有亚硫酸还原酶-GFP S11野生型标签蛋白的大肠杆菌BL21(DE3)PRO表达菌株(Clontech,Palo Alto,CA)上。通过2次连续添加1.0 OD600nm冷冻的保存于20%甘油/LB原液的400倍稀释液,使表达文库质粒附着在硝基纤维膜上。经37℃过夜培养后,把硝基纤维膜转移到含有50μg/ml卡那霉素,35μg/ml氯霉素,和50μg/ml奇放线菌素介质的LB/琼脂培养皿上,加入1mM IPTG 37℃3小时,然后转移到新的培养皿内,同样,培养皿内含有上述同样的抗生素和600ng/ml脱水四环素(AnTET)。挑出最快出现荧光反应的菌落,冷冻于-80℃的20%甘油冰冻体系中。使这些菌落生长并用1mM IPTG诱导,利用过量的纯化亚硫酸还原酶-GFP S11野生型融合蛋白进行体外互补效率检测(实施例9),筛选可溶性溶解产物。最佳的候选菌落被集中起来,准备进行另一轮的进化。通过荧光染色终止子DNA测序确定突变。3轮DNA改组并选择最亮的克隆之后,在体外进行最佳突变体的可溶性溶解产物互补,称之为GFP 1-10 OPT,相比于同样量的再次折叠超级折叠GFP 1-10改进了80倍。除了折叠报告GFP的突变体(如上所述),来自于超级折叠GFP的GFP 1-10 OPT包括S30R,Y145F,I171V,A206V,以及7个新的突变体N39I,T105K,E111V,I128T,K166T,I167V,S205T,37℃在大肠杆菌种约50%可溶性表达。10mg/ml非荧光GFP 1-10 OPT溶液的可视紫外线光谱缺少红色移位(red-shift)GFP(Tsien 1998)的480nm吸收条带,表明添加的GFP 11激发了产生环化发色团(Tsien 1998)所需的折叠步骤。纯化的GFP 1-10 OPT,超级折叠GFP,以及折叠报告GFP通过10mg/ml分析凝胶过滤进行研究。GFP 1-10 OPT洗脱出60%二聚体,35%单体,以及5%多聚体,而全长折叠报告子GFP和超级折叠GFP均洗脱出多于95%的单体,和少量二聚体和多聚体。
实施例4设计GFP S11C末端野生型GFP S11融合标签极大的减少了多种耐超高温热棒菌(Pyrobaculumaerophilum,Fitz-Gibbon,Choi et al.1997)试验蛋白(表3)。3-己酮糖6-磷酸盐合酶(3-hexulose 6-phosphate synthase,HPS)单独的溶解度是60%,当和野生型GFP 11(图6,表3)融合时就不可溶。蛋白质的溶解性用之前提到过的SDS-PAGE和凝胶分析检测(Waldo,Standish et al.1999;Waldo 2003)。简单来讲,对高输出筛选而言,1ml培养细胞菌液离心沉淀,加入110μl含有100mM TRIS,PH 7.5,150mM NaCl,和10%v∶v甘油的缓冲液(TNG缓冲液)再次悬浊。同时,3ml培养细胞菌液离心沉淀,加入300μl TNG缓冲液再次悬浊。超声波破壁之后离心就得到可溶性沉淀部分。这些沉淀部分用等体积TNG再次悬浊。15μl可溶性沉淀部分与15μ1含有100mM TRIS,200mM二硫苏糖醇(dithiothreitol,DTT),4%SDS,0.2%溴酚蓝(bromophenol blue),和20%甘油的2xSDS变性缓冲液混合100℃加热15分钟。变性样品用4-20%梯度标准SDS-PAGE(Biorad,Hercules,CA)进行分离。蛋白样品使用凝胶编码蓝色染色试剂(Gel Code Blue stain reagent,Pierce,Rockford,IL)进行染色和使用GS-800校准显像密度计(Calibrated Densitometer,Biorad,Hercules,CA)成像。标准扫描仪提供蛋白质点完整的光学密度D。总表达蛋白含量通过将溶解性蛋白点光学密度(Ds)和沉淀部分(Dp)相加得到,溶解度定义为S=Ds/(Ds+Dp)。我们将HPS作为人工定向进化方法的“诱饵”来寻找大肠杆菌内那些HPS-GFP S11融合溶解度与HPS不融合溶解度相匹配的GFP S11突变体。
表3GFP S11标签对来自耐超高温热棒菌的18个试验蛋白溶解度的影响
a18种来自极端嗜盐的古细菌群的耐超高温热棒菌(Fitz-Gibbon,Choi等1997)的蛋白,表达于37℃大肠杆菌BL21(DE3)。b从氨基酸序列计算得到的理论上的分子重量kD。cSDS-PAGE密度计量决定的片段溶解性。相对不确定度是约5%,各三个重复取平均值。d不融合(non-fusion,NF)溶解度。eC末端与野生型GFP S11(WT)融合。fC末端与GFP S11优化物融合(M1,M2,M3)。
HPS-GFP 11变异体和GFP 1-10 OPT的文库分别通过pTET-SpecR载体(实施例1,上述)和pET 28载体顺序表达。顺序诱导试验过程利用可独立诱导的兼容性质粒,从而避免了共翻译折叠以及不溶性变异体HPS-GFPS11与GFP 1-10 OPT互补时的假阳性。己酮糖磷酸合酶-GFP 11(HPS-GFP S11)融合体用PCR进行扩增,并且用公知技术改组(Stemmer 1994)。GFP S11突变体文库表达成C末端与带有N末端6-HIS标签的诱饵蛋白HPS融合,表达载体是带有AnTET-诱导性tet启动子的pTET质粒(Lutz和Bujard 1997)(如图1和实施例1所示,如上所述),并且质粒转染入在包含有p15复制起点经过修改的pET载体的表达GFP 1-10 OPT的BL21(DE3)菌株里。最优物通过下述连续诱导试验步骤进行筛选。37℃过夜培养后,带有菌落的硝基纤维膜转移到选择性LB/琼脂鲍尔培养皿上,所述培养皿含有300ng/ml AnTet,在37℃培养3小时,表达HPS-GFP S11文库,转移到干净的“静止”培养皿内1小时让AnTet从菌落中弥漫开来切断HPS-GFP S11的表达,最终转移到包含1mM IPTG的LB/琼脂培养皿内2小时从pET质粒中诱导表达互补的GFP 1-10 OPT。由于HPS-GFP S11野生型结构完全是不溶性的,按照连续表达试验步骤表达HPS-GFP S11野生型和GFP 1-10 OPT的菌落仅仅呈现微弱的荧光。较亮的菌落,与溶解性较好的HPS-GFP 11优选物有关,他们被挑选出来放到带有选择性液体培养液的96孔组织培养皿上,-80℃保存于20%甘油冻存液内。菌落在1ml液体培养液内生长并用300ng/ml AnTET诱导。可溶性部分筛选出来在体外与过量的纯化的GFP 1-10 OPT进行互补效率测试(如下所述,实施例9)。互补速率最快的菌落被挑选出来并收集等待下一轮进化与筛选。两轮进化之后得到2个不同的GFP S11突变体,L221H和T225N。我们先研究L221H变异体,命名为GFP 11 M1。这个突变体在体内可以与GFP 1-10 OPT有效的互补,并且与HPS GFPS11野生型相比溶解能力也得到提高,但是不能完全除去GFP S11在融合蛋白溶解能力方面的有害效果(如图6和表3所示)。GFP 11 M2是结合F223S和T225N(表3,如上所述)而得到的,F223S能够惊人地增加不同脱落GFP片段的溶解性(实施例11,如下所述)。HPS-GFP 11 M2的溶解性相比于HPS-GFP11 M1或者HPS-GFP 11野生型都得到了极大改进(图6,表3)。HPS-GFP 11 M2与GFP 1-10 OPT的互补速率相对于HPS-GFP 11 M1与同样量的可溶性融合蛋白减少了约5倍(图7)。我们从GFP S11 M2中移去了K214,K214是GFP 1-10 OPT的C末端残留物的复制体,并且在热点位点223利用一套简并引物筛选得到64倍的简并文库,(公知技术),并且克隆得到C末端与HPS融合的GFP 11 M2结果变异体从而寻找更稳定的突变体。约200克隆的可溶性部分在体外与GFP 1-10 OPT进行筛选(如实施例9所示)。最佳的GFP S11结构(L221H,F223Y,T225N)(命名为GFP S11 M3,氨基酸序列RDHMVLHEYVNAAGIT[SEQ IDNO16],表2,如上所述)用一个合适的互补平衡了融合蛋白溶解度(图6,表2如上所述)的减少的波动(图7)。我们同样尝试了根据上述实施例3的进行人工定向进化方法来改进GFP 1-10 OPT的互补,这种方法利用了GFP S11 M2标签作为互补目标物。由此产生了变异体命名为GFP 1-10 A4,它与GFP S11 M2互补的速率是GFP 1-10OPT的约5倍。GFP 1-10 A4包含超级折叠突变体以及附加突变体R80Q,S99Y,T105N,E111V,I128T,K166T,E172V,以及S205T。A4变异体在大肠杆菌中主要表达成包涵体的形式并且相比于GFP 1-10 OPT,A4在体内测试中不太有用。然而,突变体A4在体外测试中很有用,因为它通过用干净的TNG缓冲液稀释用尿素溶解的沉淀可以很容易的由包涵体再次折叠,并且互补GFP S11 M2或者GFP S11 M3是GFP 1-10 OPT的约4倍速率。
实施例5利用可溶性与不溶性GFP 1-10比较先后连续诱导或者联合诱导的效果为了验证联合诱导会导致不溶性聚合的超级折叠GFP 1-10的互补,我们比较了先后连续诱导方式和联合诱导方式的试验步骤。BL21(DE3)大肠杆菌细胞与巨型GFP1-10片段(折叠报告GFP 1-10,超级折叠GFP 1-10,或者GFP 1-10 OPT)共同转染入带有ColE1启动子的pTET载体,同时亚硫酸还原酶-GFP S11野生型转染入带有p15启动子的pET质粒中,它们被放置在营养琼脂培养皿上的双层硝基纤维膜上,过夜生长直到菌落直径达到1毫米。其中一层硝基纤维膜采用上述的连续诱导处理(如上述实施例4所述)。简单说就是GFP 1-10首先用AnTET表达,然后放置在干净的板上并除去AnTET,之后在另一块干净加有1mM异丙基硫代-β-D-半乳糖苷(IPTG)的培养皿上表达亚硫酸还原酶-GFP S11野生型。另一块培养皿进行同时诱导表达(培养皿同时内含有AnTET和IPTG)。荧光克隆通过光波工具用488nm光波激发(LightToolsResearch,Encinitas,CA),柯达DC290数码相机520nm波长条件下成像。当超级折叠GFP 1-10瞬间表达,并先在体内积累而不是诱导亚硫酸还原酶-GFP S11野生型,细胞的荧光反应很微弱(图8所示)。相反,细胞表达部分可溶性GFP 1-10 OPT及亚硫酸还原酶-GFP S11时无论是共表达还是连续表达都如预期明亮(图8所示)。
实施例6体外脱落GFP敏感性测试我们用微型滴定管培养皿测量了200微升体系下不同量的纯化亚硫酸还原酶-GFPS11 M3的荧光进程曲线(如图9所示)。为了避免可能的高阶动力学效果,我们利用高浓度和大过量的GFP 1-10 OPT(800pmol)启动互补。为这些敏感性试验,96孔板首先用0.5%小牛血清蛋白溶液封闭10分钟,所述小牛血清溶液的溶剂为TNG缓冲液(100mM TRIS PH值为7.5,150mM NaCl,10%的v∶v甘油)。同样的缓冲液2倍连续稀释Talon树脂纯化(Clontech,Palo Alto,CA)的6HIS-亚硫酸还原酶-GFP S11M3溶解蛋白。稀释物范围在每20μl等量样本有200-0.1pmol,等量样本加到96孔板中,然后将大过量(800pmol)的GFP 1-10 OPT(约0.5mg/ml)加入到180μl等量样品进行互补,这样较大片段的浓度不会受到限制。为了检测未加工的大肠杆菌裂解产物对这个反应的敏感性,我们在另外一个试验中,样本先添加20μl表达不相关无标签蛋白的大肠杆菌BL21(DE3)裂解产物,再添加GFP 1-10 OPT。用FL600显微培养皿荧光读数器(FL600 microplate fluorescence reader,Bio-tek,Winooski,VT)监控荧光动力学(λexc=488nm,λem=530nm),记录间隔为3分钟,记录时间为15小时。空白对照(20μl表达不相关蛋白的大肠杆菌裂解产物,100μl 0.5mg/ml GFP1-10 OPT,和100μl TNG缓冲液中0.5%BSA)的背景荧光从最终的荧光值中减去。空白对照少于最低的目标浓度的30%信号(0.1pmol亚硫酸还原酶-GFP S11 M3)。互补荧光是分析物浓度的线性函数(如图9所示)。10到200pmol量的亚硫酸还原酶-GFPS11 M3在添加了GFP 1-10 OPT(图9A所示)之后15分钟内都能被精确定量,并且0.1到10pmol需要约1小时(如图9B所示)。广泛浓度范围的进程曲线都能通过简单的线性缩放比例进行添加(如图10所示),表明反应的动力学不受限于GFP 1-10 OPT的浓度。如图9所示的对应于反应曲线的平滑线条标记了GFP标签结构域的测试样品所需要的蛋白量,只要测试样品的测量条件与用已知浓度样品来做反应曲线时的条件相同即可(例如标准曲线中举例了如图9A所示亚硫酸还原酶-GFP利用同样的GFP1-10 OPT试剂浓度和同样的样品体积)。这样,在图9A中,荧光线性拟合(Y)对应于单位pmol的Y由公式Y=2.46×(pmol)+22.8给出。假设我们要在与标准曲线同样的条件下检测一个未知浓度的标记蛋白,产生出200单位的检测荧光。利用公式pmol=(Y-22.8)/2.46,Y用200代替,就可以计算出pmol=(200-22.8)/2.46=72.0pmol。
实施例7快速连接脱落GFP片段为了区分脱落GFP片段的连接动力学和发色团形成动力学,我们将结合在Talon树脂上的6HIS-GFP 1-10 OPT与N末端折叠报告GFP标记的GFP S11 M3互补。50%v/v的Talon树脂的悬浊液中的100μl等量样本浸满了带有N末端6HIS亲和标签(200μl 2mg/ml的蛋白质)的GFP 1-10 OPT。珠子(50μl容积)用300μl TNG缓冲液洗3次除去未连接的GFP 1-10 OPT,吸起剩下的缓冲液并弃之,并在96孔微量滴定板上进行荧光测试(图11,步骤一)。过量的折叠报告GFP-GFP S11 M3溶解蛋白(200μl 5mg/ml的蛋白质)加上珠子,吹打混合15秒,快速转移到小的0.2μl过滤离心管中,用0.5ml等体积的TNG清洗3次除去未连接的折叠报告GFP-GFP S11 M3蛋白。这一过程需要大约5分钟。珠子转移到干净的微量滴定板(图11,步骤二)并且进行荧光检测,每3分钟检测一次,检测12小时(图11,步骤三)。珠子的荧光显示折叠报告GFP-GFP S11 M3蛋白已迅速连接到6HIS-GFP 1-10 OPT(图11,步骤二)。清洗过的珠子获得附加荧光的速率可以与在溶液中观测的媲美(图11,步骤三),表明荧光反应动力学没有被连接GFP片段的速率所限制。
实施例8互补检测的稳定性和辅助物及PH的影响我们检测了一般化学辅助物和PH对互补反应的影响。10份连续2倍连续稀释的9M尿素与TNG协同作用。10种溶液的100μl等量样本,其浓度范围在9M到0.019M尿素之间,和10μl亚硫酸还原酶-GFP 11 M3,10μl GFP 1-10 OPT测试片段,及80μl TNG缓冲液结合。用FL-600培养皿读数器每3分钟收集一次共收集12小时的荧光数据(BLOTEK,Winooski,VT)。反应在尿素含量超过2M时终止(图12)。另外一个试验,互补速率通过5mM二硫苏糖醇改良了约30%,但是当SDS浓度达到0.1%w/v时停止。我们接着测试了不同PH的溶液对互补反应的效率的影响。10μl等摩尔的亚硫酸还原酶-GFP S11 M3融合蛋白或者S11野生型多肽溶液加入到180μl含有适当量缓冲液MES(pH5-5.6),HEPES(pH6.5-7.5),TRIS(pH7.5-8.5),BICINE(pH8.5-9.0)的0.1M溶液中,pH范围在5.0到9.0之间,每0.5pH为一个单位。通过加入10μlGFP1-10 OPT(4mg/ml)启动互补,并且互补动力学通过FL-600平板读数器(BIOTEK,Winooski,VT)每3分钟监控一下,监控过夜。当低于pH6.5且具有约pH7.3的明显pKa时互补的效率很低(图13)。互补之后在高于5M尿素的情况下一部分荧光GFP显示为慢的,荧光的时间依赖性的降低(t1/2≈20小时),并且约5.5的pKa与“增强的”GFP相似(Patterson,Knobel等,1997)。
实施例9体外蛋白定量为了检测脱落GFP系统是否可以在体外精确定量不同的蛋白质,我们表达了18个热棒菌蛋白(Pyrobaculum)作为pET载体与C末端GFP S11 M3标签共同构建于液体培养液中,再利用SDS-PAGE和脱落GFP互补系统分析可溶性和沉淀部分(图14)。为了pET表达蛋白定量测试我们检测了18个热棒菌(Pyrobaculum)蛋白的可溶部分,并且通过直接估计GFP S11和GFP 1-10突变体进行优化试验,20μl目标蛋白可溶性部分的细胞裂解产物与再次折叠的180μl 0.35mg/ml GFP 1-10 OPT(约600pmol)在96孔微量滴定板中混合(Nunc-lmmunoTMplate,Rochester,NY)。为了检测不溶性沉淀部分,每个再次悬浊不溶性部分的50μl被离心,干燥的沉淀部分用50单位的9M尿素溶解,通过迅速添加190μl溶解于TNG中的0.35mg/ml的GFP 1-10 OPT来检测10μl没有折叠的样品。沉淀部分的荧光值用两个因素之一进行衡量来弥补相对可溶性检测而言较小体积,从而可以与可溶性部分检测进行直接比较。测试中的尿素最终浓度为约0.4M(如上述实施例8和图12所示)。通过SDS-PAGE来定量,15μl可溶性和沉淀部分的样品与15μl2xSDS变性缓冲液混合,缓冲液中有100mM TRIS,200mM二硫苏糖醇,4%SDS,0.2%溴酚蓝,和20%甘油,100℃加热15分钟。变性样品通过4%-20%梯度标准SDS-PAGE(Biorad,Hercules,CA)分离。凝胶上的蛋白斑点用凝胶编码蓝色染色剂(Pierce,rockford,IL)染色并形成图片,蛋白斑点的光学密度用GS-800校准扫描显像密度计(Biorad,Hercules,CA)定量。即使这样,库马斯亮蓝染料(Coomassie dye)染色后在染色效率方面依然呈现了蛋白依赖性差异(Tal,Silberstein et al.1985),完成蛋白的互补和折叠后(约6小时)会发现测量的荧光反应值与通过SDS-PAGE看到的蛋白量之间呈高度相关(图14)。不溶性蛋白溶解于9M的尿素(如前面的实施例所述),并且用含有过量GFP 1-10 OPT的缓冲液稀释20倍之后发出的荧光与通过SDS-PAGE(图14)所呈现的不溶性蛋白质质量呈现出较好的相关性。相反,当可溶性部分先用新鲜缓冲液进行稀释,再等体积添加浓缩的GFP 1-10 OPT后,多种表达地很好的不溶性蛋白(例如,聚硫还原酶和核苷二磷酸激酶,如表3和图14所示)没有出现可检测的互补现象。很有可能这些蛋白质发生了错误折叠,并且通过稀释而发生聚集,使得GFP 11 M3标记物难以接近之后添加的部分GFP 1-10 OPT。
实施例10利用脱落GFP检测系统估算体内可溶性蛋白和总蛋白可操作性脱落蛋白质标签系统能够用来体内标签并且检测可溶性与不可溶性蛋白质。我们理论上论证了可溶性蛋白质能够通过在有限时间内首次表达标签蛋白从而在活的大肠杆菌细胞中被检测到,并且随后关闭表达让标签蛋白能够发展它固有的溶解能力表型,之后再在同样的细胞内表达互补的GFP片段。从我们的体外共再折叠沉淀物测试结果来看(实施例9),我们期望共表达的GFP S11 M3标签蛋白和GFP 1-10OPT会产生结构互补并且先产生GFP荧光,之后才有试验蛋白体内聚集的发生,这样可以对总表达蛋白进行估计。共表达带有N末端6HIS和来自于pTET-SpecR质粒的C末端GFP S11 M3标签的热棒菌试验蛋白(图1),和来自于pET载体的GFP 1-10 OPT(Novagen,Madison,WI)的大肠杆菌BL21(DE3)细胞在含有50μg/ml卡那霉素和70μg/ml奇放线菌素的LB溶液中生长,当OD 600nm=1.0时稀释在20%甘油内-80℃冻存。细胞连续用2次400倍的LB稀释液稀释然后置于硝酸纤维膜上。32℃过夜生长,细胞连续诱导(实施例4)或者联合诱导。对连续诱导而言,带有过夜菌落的膜上的细胞平板在摇床培养1.5小时,平板含有250ng/ml AnTet,放置在静止平板上1小时,最后1小时放置在加有1mM IPTG的平板上(注意相比于实施例4制造GFP S11较短的摇床培养时间)。对共诱导试验步骤而言,带有过夜菌落的膜转移到含有600ng/ml AnTET和1mM IPTG的平板上37℃培养4小时,共表达GFP S11和巨型GFP片段1-10。平板上的培养克隆通过光波照射工具系统(LightTools Research,Encinitas,CA)用488nm激发滤光片进行光照,DC290数码相机(柯达)通过彩色玻璃滤光器(520nm长波滤过,LightTools Research,Encinitas,CA)进行成像。荧光克隆在共表达或者连续表达之后成像,同样构造的可溶性和沉淀部分在液体培养基中连续诱导之后利用SDS-PAGE(图15)进行分析。我们通过连接可溶性部分到过量的Talon树脂(Novagen,Madison,WI)上估计可利用的,非聚合6HIS-标记的蛋白量,之后进行SDS-PAGE检测。简单说来,为了分析用来进行体内全细胞平板互补检测的同样克隆的可溶性和沉淀部分,克隆被分离出来在1ml 96孔板培养板中37℃培养。细胞在指数阶段用250ng/ml AnTET诱导1小时,新鲜LB清洗3次,然后用1mMIPTG诱导1.5小时。诱导之后,培养沉淀部分用110μl TNG缓冲液进行再悬浊,并用超声波降解。裂解产物离心分流得到可溶性和沉淀部分。40μl可溶性连续诱导液体培养菌提取物与等体积50%v/v金属吸附树脂珠(Talon resin,Clontech,PaloAlto,CA)的悬浊液混合至TNG缓冲液中并稍微离心。吸走没有连接上的片段,珠子用过量TNG缓冲液连续冲洗2次。最后一次离心之后,丢弃缓冲液。加入40μl 2×SDS变性缓冲液,并100℃加热15分钟。不溶性部分被变性(实施例4,如上所述)。连接到Talon树脂的变性的样品分离于4-20%梯度标准SDS-PAGE凝胶(Bio-Rad,Hercules,CA)。蛋白质样品用凝胶编码蓝色染色剂(Pierce,Rockford,IL)染色并且用GS-800标准显像密度计(Biorad,Hercules,CA)成像。体内联合诱导克隆荧光报道了和SDS-PAGE一致的全部蛋白,然而连续诱导克隆荧光与Talon连接可溶性蛋白的SDS-PAGE(图15)一致。表达高溶解性蛋白质的克隆无论GFP 1-10是共诱导还是连续诱导都很亮(蛋白质2,4和5,图15)。表达不溶性蛋白质的克隆当共诱导时GFP 1-10更亮(蛋白质8,11,15,16,和18,图15)。蛋白质1,4,5,7,9,12和14的溶解性在pET系统(表3和图14,如上所述)中很强的T7启动子(Studier,Rosenberg等1990)表达时较从pTET质粒(图15)的较弱的tet启动子区(Lutz和Bujard 1997)表达时来得低。启动子区的强弱对蛋白质表达水平和溶解度的影响在之前就已经被注意到了(Makrides 1996;Baneyx 1999;Gerstein,Edwards等2003;Yokoyama 2003;Fahnert,Lilie等2004)。
实施例11设计一种脱落GFP互补对,其由一GFP S10-11标签片段和GFP 1-9检测片段组成按照上文中实施例2的方法,我们定义了一个可行性脱落GFP对,其由一个含有超级折叠GFP氨基酸198-238的标签结构域,(GFP S10-11),和一个带有超级折叠GFP氨基酸1-198的互补检测片段(GFP 1-9)组成,当两个片段在大肠杆菌中共表达时,其产生荧光细胞。GFP 1-9是不溶性单独表达于大肠杆菌。单独表达的片段也不是荧光。按照上文中实施例3的描述,并且利用亚硫酸还原酶-GFP S10-11融合蛋白作为互补标签,我们通过人工定向进化方法改进了GFP 1-9的折叠性和溶解性,产生新的变异体GFP 1-9 OPT,它包含了超级折叠GFP的突变(实施例2,如上所述)和附加突变S2R,T43S,A87V,F114S,和K166T。这个片段在大肠杆菌pET28载体(Novagen,Madison,WI)37℃时约50%可溶性表达。下一步我们根据上文中实施例4,利用改进的GFP 1-9 OPT作为互补目标改进GFP S10-11的溶解性,改善它的融合蛋白折叠性和溶解性的不稳定性。超级折叠GFP S10-11标签有序列NHYLSTQSVLSKDPNEKRDHMVLLEFVTAAGITHGMDELYK[SEQ ID NO35],而优选的GFP S10-11有序列DHYLSTQTILSKDPNEERDHMVLLESVTAAGITHGMDELYK[SEQ ID NO36](突变N198D,S205T,V206I,K214E,F223S)。利用这些片段进行体外脱落GFP测试的敏感性根据上文中实施例6进行检测,但具有有限量的GFP 1-9 OPT(2.5μM GFP 1-9 OPT)。在这些条件下,荧光如预期达到了稳定水平,大于等于2.5μM标签片段浓度(图16)。
实施例12设计一种(GFP S10)-X-(GFP S11)三明治标签形态和利用检测片段GFP 1-9 OPT进行检测为了在目标蛋白的两端共价连接的情况下进行严格的检测,和为了减少潜在的由于仅标签目标蛋白一端所产生的人工物,像蛋白质水解或者内部核糖体连接位点产生的短片段,我们设计了一种三明治形态,此时试验蛋白被表达成融合在GFP的两个小结构域之间,然后与GFP的第三个结构域互补。在本实施例中,试验蛋白X表达成像三明治一样夹在GFP链10和11之间形成(GFP S10)-X-(GFP S11)(图17)。这种类型与GFP的第三结构域互补,即GFP 1-9 OPT,从而产生完整的GFP。我们利用公知技术设计了结构(GFP S10)-L1-X-L2-(GFP S11),在此L1和L2是接头,其中每个接头由氨基酸GGGS组成,通过插入试验蛋白到超级折叠GFP S10-11标签(图18A)中的GFP S11和GFPS11之间。我们利用GFP 1-9 OPT成功地检测到(GFP S10)-L1-亚硫酸还原酶-L2-(GFP S11),尽管互补仅是C末端GFP S11 M3+GFP 1-10 OPT形态的约1/30有效。我们也发现了当其他部分可溶性蛋白以这种三明治形态表达时,其变成了不可溶解的。首先我们改进了互补的效率而不考虑溶解性。我们由一个DNA结构开始,该结构编码(GFP S10)-L1-Ndel::GGGSGSGG::BamHI-L2-(GFP S11),GFPS10链和GFP S11链来自于超级折叠GFP(图18A),并且短氨基酸序列GGGSGSGG[SEQID NO37]提供了两条GFP链之间的可伸缩接头。这是通过DNA重排技术突变得到,并且通过连续诱导来自pTET载体的文库,在体内筛选带有改进的与GFP 1-10 OPT互补的变异体文库,其紧跟在来自作为板上克隆的大肠杆菌细胞内的pET载体的GFP 1-9OPT的表达之后(如实施例4所述)。6个最亮的克隆在三轮进化后被测序(图18A)。我们注意六个中的第五个突变,这个结构被称为(GFP S10SM5)-L1-X-L2-(GFP S11SM5)(SM5=三明治突变第5)。优先序列YTMDLPDNHYLSTQTILLKDLNGTGVGSGGGSHMGGGSGSGGGSGGGSTSEKRDHMVLLEYVTAAGITDAS*,[SEQ ID NO38],其中,GFP S10和GFPS11链用下划线表示,星号是终止密码子。第一个斜体序列来自Ndel克隆位点CATATG,编码氨基酸HM。第二个斜体序列来自BamHI限制性位点GGATCC,编码氨基酸GS。带有框内Ndel和BamHI限制性位点的试验蛋白克隆到包含用本领域公知的方法先前被Ndel和BamHI限制性内切酶消化的结构的载体中。典型地,克隆盒内的Ndel和BamHI位点之间的框内结构域包含了能被带有终止密码子的移码替换的结构,它能够防止由于未消化载体或转移载体带来的假阳性(如上所述的实施例1,典型的移码序列)。这种方式是公知技术。克隆盒由Ncol和Xhol限制性位点包围并克隆到pTET载体中。尽管克隆到Nde-1/BamH-1位点的可溶性亚硫酸还原酶的互补速率与起始链结构想比增长了约20倍,通过检测部分溶解性HPS蛋白发现对蛋白质溶解性的有害影响也增大了(实施例4,如上所述)。接下来,为了同时选择改进的互补和提高的融合蛋白稳定性,我们利用同样的诱饵蛋白己酮糖磷酸盐合成酶,HPS,我们已经在改进GFP S11溶解性和互补时用过这个蛋白(实施例4,如上所述)。HPS是约60%可溶性单独表达自pTET载体(蛋白质#9,图15),但是不溶性表达成(GFP S10SM5)-L1-HPS-L2-(GFP S11 SM5)融合蛋白。我们来看上游(GFP S10 SM5)结构域,在一层14个合成的寡核苷酸的引物中利用重排和引物预测突变发生(图18B)。每条引物都集中在GFP S10 SM5结构域的14个氨基酸之一,包含一个NNN编码简并了中心目标氨基酸和在克隆载体上周围与GFP S10 SM5的同源序列(目标序列如图18B和图19所示)。该层简并引物在重组反应(如实施例4所述的重组)时加入到碎片DNA中。这种引物-预测突变发生技术是公知技术。我们重排并扩增了被Ncol上游和BamHI下游包围的结构域,Ncol:(GFP S10SM5)-L1-Nde-1::HPS::BamH1-L2-(GFP S11 SM5),在通过PCR反应进行片段重排时加入简并引物混合物。我们再次扩增了来自重组突变结构的结构域,然后消化出包含突变(GFP S10)层、利用标准技术纯化的凝胶的Ncol/Nde-1片段,然后克隆到包含Ncol//Ndel::HPS::BamH1-L2-(GFP S11 SM5)的接受载体。利用来自pTET和互补检测)的连续诱导进行3轮选择,8个最好的克隆的序列中的每个序列通过荧光染色中断测序仪测序(图19)。表现最好的克隆,命名为(GFP S10 A10)-L1-Ndel::HPS::BamH1-L2-(GFP S11 SM5)是约45%可溶性表达于大肠杆菌,有标记的改进相对于不溶性起始结构,并且现在互补信号是利用GFP1-10 OPT检测三明治结构中唯一的GFP S11 SM5标签(如上所述)的互补的约1/5到1/4倍。下面我们检测利用18个热棒菌试验蛋白的测试(见上文表3,为明确的非融合的溶解性)。根据先前描述的方法利用本实施例的即时片段检测可溶性沉淀部分(实施例9)。我们利用GFP 1-10 OPT仅特异性检测(GFP S11 SM5)标签作为参考,检测了这些三明治-形态标记的蛋白质,也用到了GFP 1-9 OPT,它需要三明治形态标签蛋白的(GFP S10 A10)和(GFP S11 SM5)链的连接。正如预期,当检测仅需一条链时互补更有效(GFP 1-10 OPT例中),并且利用尿素-溶解的沉淀来检测沉淀部分在GFP 1-10 OPT检测例中是最有效的(图20)。但是,利用GFP 1-9 OPT检测到的三明治的可溶性部分荧光反应与利用GFP 1-10检测的信号密切相关,报告了如预期的可溶性蛋白。相似地,体内连续诱导与可溶性pTET和GFP S11 M3融合表达也相关(图20,实施例9所示,图15)。优化的选择有如下氨基酸序列YTMDLPDDHYLSTQTILSKDLNGTDVGSGGGSHMGGGSGSGGGSGGGSTSEKRDHMVLLEYVTAAGITDAS*,[SEQ ID NO39],GFP S10和GFP S11链用下划线表示,星号代表终止密码子。第一个斜体序列来自Ndel克隆位点CATATG,编码氨基酸HM。第二个斜体序列来自BamHI限制性位点GGATCC,编码氨基酸GS。带有框内Ndel和BamHI限制性位点的试验蛋白质通过公知技术克隆到包含有之前已被Ndel和BamHI限制酶消化的结构的载体上。这个盒子由可以克隆到pTET载体的Ncol和Xhol限制性位点包围。典型地,克隆盒内的Ndel和BamHI位点之间的读码框内区域包含了能被带有终止密码子的读码框移码替换的结构,它能够防止由于未消化载体带来的假阳性(实施例1,如上所述,典型的读码框移码序列)。
实施例13设计GFP S11标签的富含组氨酸的突变子用于检测和纯化我们设计了对金属亲和蛋白纯化珠有强亲和性的GFP S11,从而组合成具有蛋白检测和蛋白纯化双重功能的单个蛋白。我们猜测暴露到溶剂环境下并且侧链伸出GFP结构(Orm,Cubitt等1996;Tsien 1998)外的GFP链11的残基能够改变为另一种氨基酸,且不用破坏具有巨型GFP 1-10检测片段的GFP S11标签的互补。4个指向外部的残基利用特异性引物通过PCR手段突变为组氨酸P1,GATATAACTAGTCATGACCACATGCACCTTCATGAG[SEQ ID NO40];P2,CACATGCACCTTCATGAGCATGTACATGCTCAT[SEQ ID NO41];和P3,GATATAGGTACCCCCATGAGCATGTACATGCTCATGAAGGTGCA[SEQ ID NO42]。结果GFP 11 H7片段KHDHMHLHEHVHAHGGT[SEQ ID NO18]被克隆成C末端带有可溶性控制蛋白亚硫酸还原酶。GFP的X射线晶体结构检测(Orm,Cubitt等1996;Tsien 1998)(PDB ID REF1GFL)(Yang,Moss等1996)显示了2个GFP 11 H7末端附加的残基与GFP 1-10上其他氨基酸没有特异性联系。这些附加的残基在GFP S11 H7标签内突变成组氨酸,从而产生GFP S11 H9,HDHMHLHEHVHAHHHT[SEQ ID NO20]。该18个热棒菌调控蛋白(表3,如上所述)融合到GFP S11H7或者GFP S11 H9并从pET载体中表达(实施例9,如上所述),从而检测这些标签是否能够用来作为新的检测和纯化系统并在体外精确定量和纯化融合蛋白。过夜液体培养物用新鲜LB稀释,当长到600nm下0.5OD时,用1mM IPTG 37℃诱导4小时。可溶性沉淀部分通过超声波分馏并离心。对这18个带有C末端GFP S11 H7或者GFP S11H9融合标签的热棒菌调控蛋白的SDS-PAGE溶解性进行如前所述的评估(实施例9,如上所述)(表4)。先决定这些蛋白的非融合溶解度(实施例9,如上所述)。GFP S11H7和GFP S11 H9标签对蛋白溶解度的影响最小。
表4GFP S11 H7或者H9标签对18种耐超高温热棒菌蛋白溶解度的影响
a18种来自极端嗜盐的古细菌群的耐超高温热棒菌(Fitz-Gibbon,Choi等1997)的蛋白。b从氨基酸序列计算得到的理论上的分子重量kD。SDS-PAGE密度计量(试验手段)决定片段溶解性。相对不确定度是约5%,各三个重复取平均值。d非融合(non-fusion,NF)溶解度和eC末端与野生型GFP S11(WT)融合,如实施例4fC末端与GFP S11组氨酸突变体融合(H7,H9)。
实施例14S11 H7融合蛋白和GFP 1-10 A4之间互补反应的敏感度根据上文描述制得纯化的亚硫酸还原酶-GFP S11 H7融合蛋白稀释物(实施例6,如上所述)。稀释物范围从每100μl等量样本中含有670pmol到0.7pmol,等量样本加到96孔板中,然后用大过量(800pmol)的GFP 1-10 A4(约0.5mg/ml)加入100μl等量体积中,完成互补。GFP 1-10 A4检测片段由于具有比GFP 1-10 OPT更高的互补速率而被用来检测GFP S11 H7。荧光互补动力学印记(λexc=480nm,λem=520nm)通过FL600显微平板荧光阅读器(Bio-Tek,Winooski,VT)被监控过夜。最终荧光值相对于亚硫酸还原酶-GFP S11 H7融合蛋白量作图(图21)。
实施例15通过N-6HIS标签或者C末端GFP S11 H7标签比较GFP的纯化折叠报告GFP克隆到一个N-6HIS pET 28载体中(Novagen,Madison,WI),或者克隆到带有C末端GFP S11 H7标签(没有N-6HIS标签)的pET载体中。表达每一种融合蛋白的200ml BL21(DE3)培养物生长到OD600~0.5时,加入1mM IPTG 37℃诱导4小时。培养物沉淀用2ml TNG悬浊并超声降解。可溶性片段放到Talon树脂纯化珠(TALON,Clonteck,Palo Alto,CA)上。过量TNG缓冲液冲洗两次之后再用加入5ml咪唑的TNG缓冲液冲洗一次,蛋白用TNG缓冲液中添加的150mM咪唑洗提。粗提物和纯化后的片段(150mM咪唑洗提)用SDS-变性缓冲液混合然后100℃加热15分钟,溶解于4-20%梯度标准SDS-PAGE(Biorad,Hercules,CA)。蛋白样本用凝胶编码蓝色试剂(Pierce,Rockford,IL)染色,用GS-800校准的扫描显像密度计(Biorad,Hercules,CA)成像(图22)。
实施例16融合有S11 H7,S11 H9,或者带有N-6HIS标签,结合到Talon树脂上的折叠报告GFP的咪唑洗提属性为了判断Talon纯化树脂(Talon Resin,Clontech,Palo Alto,CA)对6HIS,GFP S11 H7,和GFP S11 H9标签的相对亲和性,绿色荧光蛋白(GFP)克隆到N末端融合有GFP S11 H7或者GFP S11 H9的非-6HIS标签的pET载体和N-6HIS标签的pET载体中。每个融合蛋白在大肠杆菌中的3ml培养物生长到OD600~0.5时,加入1mM IPTG37℃诱导4小时。培养物沉淀用150μl TNG悬浊并超声降解。50μl可溶性片段经过TNG缓冲液预孵后放到200μl Talon树脂纯化珠(TALON,Clonteck,Palo Alto,CA)上。1ml TNG缓冲液冲洗3次后,20μl 50%v∶v珠浆转移到7个含有50μl TNG缓冲液,并分别加有0,5,10,25,50,75,和100mM咪唑的PCR管中,混匀,离心并沉淀珠,然后10μl洗提片段用190μl TNG缓冲液在96孔微型板中稀释(Nunc-ImmunoTMplate,Nunc,Rochester,NY)。利用FL600微型平板荧光阅读器(Bioteck,Winooski,VT)检测荧光(λex=488nm,λem=530nm)(图23)。结果显示GFP S11 H9标签相对于GFP S11 H7标签对Talon树脂有更强的亲和性,也许更适合在蛋白连接之后用高密度咪唑清洗来进行纯化。
实施例17钴纯化几类融合于S11 H9的试验蛋白7种部分可溶(热棒菌试验蛋白)-GFP S11 H9融合蛋白被选择来进行Talon树脂珠纯化,它利用了GFP S11 H9突变体对Talon树脂的亲和性。大肠杆菌BL21(DE3)中每个融合蛋白的3ml培养物生长到OD600~0.5,加入1mM IPTG 37℃诱导4小时。培养物沉淀用150μl TNG悬浊并超声降解。50μl可溶性片段与50μl TNG洗涤过的Talon树脂珠(Talon,Clontech,Palo Alto,CA)混合于300μl eppendorf管中。在周围温度约25℃时孵化10分钟后,悬浊液离心并移去上清液,上清液作为未连接上的片段进行保存。小珠用含有5mM咪唑的1ml TNG缓冲液洗涤,然后用含有10mM咪唑的1ml TNG缓冲液冲洗去掉连接不牢的蛋白。通过旋转0.2u滤筒中的小珠(Pierce,Rockford,IL)移去过量的上清液。连接上的蛋白用75μl含有150mM咪唑的TNG缓冲液孵育10分钟来洗提,悬浊液通过0.2u滤筒进行离心并且过滤得上清液作为洗提片段保存。带有每种蛋白的结合的粗提物(S),未结合部分(U),和洗提部分(E)的Talon树脂用2×SDS缓冲液变性,加载到4-20%标准SDS-PAGE(Biorad,Hercules,CA)(图24)。
参考文献Adams,S.R.,R.E.Campbell等(2002).“新的双砷化合物配体和四巯基丙氨酸小分子在体内体外作为蛋白质标签的合成及生物学应用。”美国化学社会期刊124(21)6063-76.
Arai,M.,K.Maki等(2003).“检测折叠能力与来自大肠杆菌的二氢叶酸还原酶的早期折叠事件的关系。”分子生物学期刊328(1)273-88.
Armstrong,N.,A.de Lencastre等(1999).“一种新的蛋白折叠筛选应用到一种谷氨酸和海人藻酸受体的配体连接结构域和应用到溶菌酶和胰蛋白酶”蛋白质科学8(7)1475-83.
Baird,G.S.,D.A.Zacharias等(1999).“绿色荧光蛋白的循环排列及受体插入”美国科学学术发展96(20)111241-6.
Baneyx,F.(1999).“大肠杆菌中重组蛋白表达”当前生物技术观点10(5)411-21.
Bertens,P.,W.Heijne等(2003).“豇豆花叶病毒转运蛋白的C末端研究”农业滤过性微生物学148(2)265-79.
Crameri,A.,E.A.Whitehorn等(1996).“利用DNA改组技术的分子进化方式得到的改良绿色荧光蛋白”自然生物技术14(3)315-9.
Fahnert,B.,H.Lilie等(2004).“包涵体形成与利用”先进生物化学工程技术8993-142.
Fitz-Gibbon,S.,A.J.Choi等(1997).“基于fosmid的遗传图谱以及定义474个超嗜热菌的基因”嗜特异环境微生物1(1)36-51.
Fox,J.D.,R.B.Kapust等(2001).“大肠杆菌麦芽糖连接蛋白表面的单个氨基酸替代能对融合蛋白的溶解性产生巨大影响”蛋白质科学10(3)622-30.
Gegg,C.V.,K.E.Bowers等(1997).“分子解剖学探针寻找二氢叶酸还原酶上最小的独立折叠单元”蛋白质科学6(9)1885-92.
Gerstein,M.,A.Edwards等(2003).“结构基因组当前进展”科学299(5613)1663.
Goh,C.S.,N.Lan等(2004).“挖掘机构基因组的途径识别影响高输出实验分析的蛋白属性”分子生物学期刊336(1)115-30.
Iwakura,M.and等(1998).“氨基乙酸接头的长度对连接循环排列的二氢叶酸还原酶的N和C端的效果的影响”蛋白质工程11(8)707-13.
Iwakura,M.,T.Nakamura等(2000).“完整蛋白的系统循环排列揭示了基本折叠元素”生物的自然结构7(7)580-5.
Jappelli,R.,A.Luzzago等(1992).“环形突变能够导致铁蛋白羧基端实质性构造改变”分子生物学期刊227(2)532-43.
Kelemen,B.R.,T.A.Klink等(1999).“超敏感的核糖核酸酶培养基”核酸研究27(18)3696-701.
Kim,J.S.and R.T.Raines(1993).“核糖核酸酶S-肽作为融合蛋白的载体”蛋白质科学2(3)348-56.
Knaust,R.K.and P.Nordlund(2001).“在96孔板内筛选可溶性表达的重组蛋白”生物化学年报297(1)79-85.
Lopes Ferreira,N.and J.H.Alix(2002).“伴侣蛋白DnaK对大肠杆菌的β-牛乳糖的α-互补是必须的”细菌学期刊184(24)7047-54.
Lutz,R.and H.Bujard(1997).“大肠杆菌中独立转录调节因子与LacR/O,TetR/O和AraC/I1-I2调节因子”核苷酸研究25(6)1203-10.
Makrides,S.C.(1996).“在大肠杆菌中实现基因高表达的方法”微生物革命60(3)512-38.
Nixon,A.E.and S.J.Benkovic(2000).“苷氨酰胺核苷酸转甲酰酶消化酶的甲酸基转移效果的改进”蛋白质工程13(5)323-7.
Orm,M.,A.B.Cubitt等(1996).“水母绿色荧光蛋白的晶体结构”科学273(5280)1392-1395.
Patterson,G.H.,S.M.Knobel,et al.(1997).在定量荧光显微方法中运用绿色荧光蛋白和他的突变体生物物理学期刊73(5)2782-90.
Pelletier,J.N.,K.M.Arndt等(1999).“体内文库-对-优化的蛋白之间交互作用文库”自然生物技术17(7)683-90.
Pelletier,J.N.,F.X.Campbell-Valois等(1998).“理性设计的二氢叶酸还原酶片断进行寡聚化重组”美国科学学术发展95(21)12141-6.
Richards,F.M.and P.J.Vithayathil(1959).“枯草杆菌蛋白酶修饰的核糖核酸酶的制备和多肽与蛋白成分的分离”生物化学期刊234(6)1459-65.
Rossi,F.M.,B.T.Blakely等(2000).“在活哺乳动物细胞内通过β-牛乳糖互补监控蛋白-蛋白交互反应”酶学方法328231-51.
Smith,V.F.and C.R.Matthews(2001).“检测链连接对于大肠杆菌二氢叶酸还原酶的稳定性和结构的影响片断互补和循环排列揭示稳定性,可选择的折叠形式”蛋白质科学10(1)116-28.
Stemmer,W.P.(1994).“运用随机碎片和重组进行DNA改组分子进化的体外重组”美国科学学术发展91(22)10747-51.
Studier,F.W.,A.H.Rosenberg等(1990).“利用T7 RNA聚合酶直接表达克隆基因”酶方法18560-89.
Tal,M.,A.Silberstein等(1985).“为什么库马斯亮蓝R能够与不同的蛋白发生不同的交互反应?部分答案”生物化学期刊260(18)9976-80.
Terwilliger,T.C.(2004).给生物学家的结构与技术 分子生物自然结构11(4)296-7.
Tsien,R.Y.(1998).绿色荧光蛋白 进化生物化学年报67509-44.
Ullmann,A.,F.Jacob等(1967).“运用与大肠杆菌的β-牛乳糖的结构基因操纵子近侧片段相应的多肽进行体外互补的描述”分子生物学期刊24(2)339-43.
Waldo,G.S.(2003).“蛋白溶解性的基因筛选及人工定向进化方法”生物化学当前观点7(1)33-8.
Waldo,G.S.(2003).“通过人工定向进化方法利用GFP折叠报告来改进蛋白折叠效率”分子生物学方法230343-59.
Waldo,G.S.,B.M.Standish等(1999).“通过绿色荧光蛋白进行快速蛋白-折叠测试”自然生物技术17(#7)691-695.
Wehrman,T.,B.Kleaveland等(2002).“通过β-内酰胺酶片段的互补来调控哺乳动物细胞中蛋白-蛋白交互作用”美国科学学术发展99(6)3469-74.
Welply,J.K.,A.V.Fowler等(1981).“β-牛乳糖α-互补。单个核苷酸替代的效果”生物化学期刊256(13)6811-6.
Wigley,W.C.,R.D.Stidham等(2001).“通过基因标记蛋白进行的结构互补在体内调控蛋白质的可溶性和折叠”自然生物技术19(2)131-6.
Worrall,D.M.and N.H.Goss(1989).“大肠杆菌体内具有生物活性的β-牛乳糖包涵体的形成”澳大利亚生物技术期刊3(1)28-32.
Yang,F.,L.G.Moss(1996).“绿色荧光蛋白的分子结构”自然生物技术14(10)1246-1251.
Yokoyama,S.(2003).“结构基因组和蛋白组学的蛋白质表达系统”生物化学当前观点7(1)39-43.
序列表SEQ ID NO1GFP超级折叠1-10核苷酸序列ATGAGCAAAGGAGAAGAACTTTTCACTGGAGTTGTCCCAATTCTTGTTGAATTAGATGGTGATGTTAATGGGCACAAATTTTCTGTCAGAGGAGAGGGTGAAGGTGATGCTACAAACGGAAAACTCACCCTTAAATTTATTTGCACTACTGGAAAACTACCTGTTCCATGGCCAACACTTGTCACTACTCTGACCTATGGTGTTCAATGCTTTTCCCGTTATCCGGATCACATGAAACGGCATGACTTTTTCAAGAGTGCCATGCCCGAAGGTTATGTACAGGAACGCACTATATCTTTCAAAGATGACGGGACCTACAAGACGCGTGCTGAAGTCAAGTTTGAAGGTGATACCCTTGTTAATCGTATCGAGTTAAAAGGTATTGATTTTAAAGAAGATGGAAACATTCTCGGACACAAACTCGAGTACAACTTTAACTCACACAATGTATACATCACGGCAGACAAACAAAAGAATGGAATCAAAGCTAACTTCAAAATTCGCCACAACGTTGAAGATGGTTCCGTTCAACTAGCAGACCATTATCAACAAAATACTCCAATTGGCGATGGCCCTGTCCTTTTACCAGACAACCATTACCTGTCGACACAATCTGTCCTTTCGAAAGATCCCAACGAAAAGCTAASEQ ID NO2GFP超级折叠1-10氨基酸序列MSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSVLSKDPNEKSEQ ID NO3GFP 1-10 OPT核苷酸序列ATGAGCAAAGGAGAAGAACTTTTCACTGGAGTTGTCCCAATTCTTGTTGAATTAGATGGTGATGTTAATGGGCACAAATTTTCTGTCAGAGGAGAGGGTGAAGGTGATGCTACAATCGGAAAACTCACCCTTAAATTTATTTGCACTACTGGAAAACTACCTGTTCCATGGCCAACACTTGTCACTACTCTGACCTATGGTGTTCAATGCTTTTCCCGTTATCCGGATCACATGAAAAGGCATGACTTTTTCAAGAGTGCCATGCCCGAAGGTTATGTACAGGAACGCACTATATCTTTCAAAGATGACGGGAAATACAAGACGCGTGCTGTAGTCAAGTTTGAAGGTGATACCCTTGTTAATCGTATCGAGTTAAAGGGTACTGATTTTAAAGAAGATGGAAACATTCTCGGACACAAACTCGAGTACAACTTTAACTCACACAATGTATACATCACGGCAGACAAACAAAAGAATGGAATCAAAGCTAACTTCACAGTTCGCCACAACGTTGAAGATGGTTCCGTTCAACTAGCAGACCATTATCAACAAAATACTCCAATTGGCGATGGCCCTGTCCTTTT
ACCAGACAACCATTACCTGTCGACACAAACTGTCCTTTCGAAAGATCCCAACGAAAAGGGTACCTAASEQ ID NO4GFP 1-10 OPT氨基酸序列(additional mutations vs superfolderN39I,T105K,E111V,I 128T,K166T,I167V,S205T)MSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATIGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGKYKTRAVVKFEGDTLVNRIELKGTDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFTVRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQTVLSKDPNEKGTSEQ ID NO5GFP 1-10 A4核苷酸序列ATGAGCAAAGGAGAAGAACTTTTCACTGGAGTTGTCCCAATTCTTGTTGAATTAGATGGAGATGTTAATGGGCACAAATTTTCTGTCAGAGGAGAGGGTGAAGGTGATGCTACAAACGGAAAACTCACCCTTAAATTCATTTGCACTACTGGAAAACTACCTGTTCCATGGCCAACGCTTGTCACTACTCTGACCTATGGTGTTCAATGCTTTTCCCGTTATCCGGATCACATGAAACAGCATGACTTTTTCAAGAGTGCCATGCCCGAAGGTTATGTACAGGAACGCACTATATATTTCAAAGATGACGGGAACTACAAGACGCGTGCTGTAGTCAAGTTTGAAGGTGATACCCTTGTTAATCGTATCGAGTTAAAGGGTACTGATTTTAAAGAAGATGGAAACATTCTCGGACACAAACTCGAGTACAACTTTAACTCACACAATGTATATATCACGGCAGACAAACAAAAGAATGGAATCAAAGCTAACTTCACAATTCGCCACAACGTTGTAGATGGTTCCGTTCAACTAGCAGACCATTATCAACAAAATACTCCAATTGGCGATGGCCCTGTCCTTTTACCAGACAACCATTACTTGTCGACACAAACTGTCCTTTCGAAAGATCCCAACGAAAAGGGTACCTAASEQ ID NO6GFP 1-10 A4氨基酸序列(与超级折叠GFPR80Q,S99Y,T105N,E111V,I128T,K166T,E172V,S205T相对的附加突变)MSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIYFKDDGNYKTRAVVKFEGDTLVNRIELKGTDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFTIRHNVVDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQTVLSKDPNEKGT
SEQ ID NO7GFP S11 214-238核苷酸序列AAGCGTGACCACATGGTCCTTCTTGAGTTTGTAACTGCTGCTGGGATTACACATGGCATGGATGAGCTCTACAAAGGTACCTAASEQ ID NO8GFP S11 214-238氨基酸序列KRDHMVLLEFVTAAGITHGMDELYKGTSEQ ID NO9GFP S11 214-230核苷酸序列AAGCGTGACCACATGGTCCTTCTTGAGTTTGTAACTGCTGCTGGGATTACAGGTACCTAASEQ ID NO10GFP S11 214-230氨基酸序列KRDHMVLLEFVTAAGITGTSEQ ID NO11GFP S11 M1核苷酸序列AAGCGTGACCACATGGTCCTTCATGAGTTTGTAACTGCTGCTGGGATTACAGGTACCTAASEQ ID NO12GFP S11 M1氨基酸序列(与wtL221H相对的附加突变)KRDHMVLHEFVTAAGITGTSEQ ID NO13GFP S11 M2核苷酸序列
AAGCGTGACCACATGGTCCTTCATGAGTCTGTAAATGCTGCTGGGGGTACCTAASEQ ID NO14GFP S11 M2氨基酸序列(与GFP 11 wtL221H,F223S,T225N AA序列17残基相对的附加突变)KRDHMVLHESVNAAGGTSEQ ID NO15GFP S11 M3核苷酸序列CGTGACCACATGGTCCTTCATGAGTCTGTAAATGCTGCTGGGATTACATAASEQ ID NO16GFP S11 M3氨基酸序列(与GFP 11 wtL221H,F223Y,T225N相对的附加突变)RDHMVLHEYVNAAGIT*SEQ ID NO17GFP S11 H7核苷酸序列AAGCATGACCACATGCACCTTCATGAGCATGTACATGCTCATGGGGGTACCTAASEQ ID NO18GFP S11 H7氨基酸序列(与GFP 11 wtR215H,V219H,L221H,F223H,T225H,A227H相对的附加突变)KHDHMHLHEHVHAHGGTSEQ ID NO19GFP S11 H9核苷酸序列CATGACCACATGCACCTTCATGAGCATGTACATGCTCATCACCATACCTAA
SEQ ID NO20GFP S11 H9氨基酸序列(与GFP 11 wtR215H,V219H,L221H,F223H,T225H,A227H,G228H,I229H相对的附加突变)HDHMHLHEHVHAHHHTSEQ ID NO21来自PTET-SPECR载体的单一遗传元素(包含从T0到AatIItet抑制蛋白tetR和在那霉素启动子调控下的奇放线菌素基因,和控制tet抑制蛋白表达的RBS)TTAAGACCCACTTTCACATTTAAGTTGTTTTTCTAATCCGTATATGATCAATTCAAGGCCGAATAAGAAGGCTGGCTCTGCACCTTGGTGATCAAATAATTCGATAGCTTGTCGTAATAATGGCGGCATACTATCAGTAGTAGGTGTTTCCCTTTCTTCTTTAGCGACTTGATGCTCTTGATCTTCCAATACGCAACCTAAAGTAAAATGCCCCACAGCGCTGAGTGCATATAATGCATTCTCTAGTGAAAAACCTTGTTGGCATAAAAAGGCTAATTGATTTTCGAGAGTTTCATACTGTTTTTCTGTAGGCCGTGTACCTAAATGTACTTTTGCTCCATCGCGATGACTTAGTAAAGCACATCTAAAACTTTTAGCGTTATTACGTAAAAAATCTTGCCAGCTTTCCCCTTCTAAAGGGCAAAAGTGAGTATGGTGCCTATCTAACATCTCAATGGCTAAGGCGTCGAGCAAAGCCCGCTTATTTTTTACATGCCAATACAATGTAGGCTGCTCTACACCTAGCTTCTGGGCGAGTTTACGGGTTGTTAAACCTTCGATTCCGACCTCATTAAGCAGCTCTAATGCGCTGTTAATCACTTTACTTTTATCTAATCTGGACATCATTAATGTTTATTGAGCTCTCGAACCCCAGAGTCCCGCATTATTTGCCGACTACCTTGGTGATCTCGCCTTTCACGTAGTGGACAAATTCTTCCAACTGATCTGCGCGCGAGGCCAAGCGATCTTCTTCTTGTCCAAGATAAGCCTGTCTAGCTTCAAGTATGACGGGCTGATACTGGGCCGGCAGGCGCTCCATTGCCCAGTCGGCAGCGACATCCTTCGGCGCGATTTTGCCGGTTACTGCGCTGTACCAAATGCGGGACAACGTAAGCACTACATTTCGCTCATCGCCAGCCCAGTCGGGCGGCGAGTTCCATAGCGTTAAGGTTTCATTTAGCGCCTCAAATAGATCCTGTTCAGGAACCGGATCAAAGAGTTCCTCCGCCGCTGGACCTACCAAGGCAACGCTATGTTCTCTTGCTTTTGTCAGCAAGATAGCCAGATCAATGTCGATCGTGGCTGGCTCGAAGATACCTGCAAGAATGTCATTGCGCTGCCATTCTCCAAATTGCAGTTCGCGCTTAGCTGGATAACGCCACGGAATGATGTCGTCGTGCACAACAATGGTGACTTCTACAGCGCGGAGAATCTCGCTCTCTCCAGGGGAAGCCGAAGTTTCCAAAAGGTCGTTGATCAAAGCTCGCCGCGTTGTTTCATCAAGCCTTACGGTCACCGTAACCAGCAAATCAATATCACTGTGTGGCTTCAGGCCGCCATCCACTGCGGAGCCGTACAAATGTACGGCCAGCAACGTCGGTTCGAG
ATGGCGCTCGATGACGCCAACTACCTCTGATAGTTGAGTCGATACTTCGGCGATCACCGCTTCCCTCATGATGTTTAACTTTGTTTTAGGGCGACTGCCCTGCTGCGTAACATCGTTGCTGCTCCATAACATCAAACATCGACCCACGGCGTAACGCGCTTGCTGCTTGGATGCCCGAGGCATAGACTGTACCCCAAAAAAACATGTCATAACAAGCCATGAAAACCGCCACTGCGCCGTTACCATGCGAAACGATCCTCATCCTGTCTCTTGATCAGATCTTGATCCCCTGCGCCATCAGATCCTTGGCGGCAAGAAAGCCATCCAGTTTACTTTGCAGGGCTTCCCAACCTTACCAGAGGGCGCCCCAGCTGGCAATTCCGACGTCSEQ ID NO22完整的PTET-SPECR载体序列TCGAGTCCCTATCAGTGATAGAGATTGACATCCCTATCAGTGATAGAGATACTGAGCACATCAGCAGGACGCACTGACCGAGTTCATTAAAGAGGAGAAAGATACCCATGGGCAGCAGCCATCATCATCATCATCACAGCAGCGGCCTGGTGCCGCGCGGCAGCCATATGGGTGGCGGTTCTGGATCCGGAGGCACTAGTGGTGGCGGCTCAGGTACCTAACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCTCTAGAGGCATCAAATAAAACGAAAGGCTCAGTCGAAAGACTGGGCCTTTCGTTTTATCTGTTGTTTGTCGGTGAACGCTCTCCTGAGTAGGACAAATCCGCCGCCCTAGACCTAGGCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGACTAGCGCTTGGATTCTCACCAATAAAAAACGCCCGGCGGCAACCGAGCGTTCTGAACAAATCCAGATGGAGTTCTGAGGTCATTACTGGATCTATCAACAGGAGTCCAAGCTTAAGACCCACTTTCACATTTAAGTTGTTTTTCTAATCCGTATATGATCAATTCAAGGCCGAATAAGAAGGCTGGCTCTGCACCTTGGTGATCAAATAATT
CGATAGCTTGTCGTAATAATGGCGGCATACTATCAGTAGTAGGTGTTTCCCTTTCTTCTTTAGCGACTTGATGCTCTTGATCTTCCAATACGCAACCTAAAGTAAAATGCCCCACAGCGCTGAGTGCATATAATGCATTCTCTAGTGAAAAACCTTGTTGGCATAAAAAGGCTAATTGATTTTCGAGAGTTTCATACTGTTTTTCTGTAGGCCGTGTACCTAAATGTACTTTTGCTCCATCGCGATGACTTAGTAAAGCACATCTAAAACTTTTAGCGTTATTACGTAAAAAATCTTGCCAGCTTTCCCCTTCTAAAGGGCAAAAGTGAGTATGGTGCCTATCTAACATCTCAATGGCTAAGGCGTCGAGCAAAGCCCGCTTATTTTTTACATGCCAATACAATGTAGGCTGCTCTACACCTAGCTTCTGGGCGAGTTTACGGGTTGTTAAACCTTCGATTCCGACCTCATTAAGCAGCTCTAATGCGCTGTTAATCACTTTACTTTTATCTAATCTGGACATCATTAATGTTTATTGAGCTCTCGAACCCCAGAGTCCCGCATTATTTGCCGACTACCTTGGTGATCTCGCCTTTCACGTAGTGGACAAATTCTTCCAACTGATCTGCGCGCGAGGCCAAGCGATCTTCTTCTTGTCCAAGATAAGCCTGTCTAGCTTCAAGTATGACGGGCTGATACTGGGCCGGCAGGCGCTCCATTGCCCAGTCGGCAGCGACATCCTTCGGCGCGATTTTGCCGGTTACTGCGCTGTACCAAATGCGGGACAACGTAAGCACTACATTTCGCTCATCGCCAGCCCAGTCGGGCGGCGAGTTCCATAGCGTTAAGGTTTCATTTAGCGCCTCAAATAGATCCTGTTCAGGAACCGGATCAAAGAGTTCCTCCGCCGCTGGACCTACCAAGGCAACGCTATGTTCTCTTGCTTTTGTCAGCAAGATAGCCAGATCAATGTCGATCGTGGCTGGCTCGAAGATACCTGCAAGAATGTCATTGCGCTGCCATTCTCCAAATTGCAGTTCGCGCTTAGCTGGATAACGCCACGGAATGATGTCGTCGTGCACAACAATGGTGACTTCTACAGCGCGGAGAATCTCGCTCTCTCCAGGGGAAGCCGAAGTTTCCAAAAGGTCGTTGATCAAAGCTCGCCGCGTTGTTTCATCAAGCCTTACGGTCACCGTAACCAGCAAATCAATATCACTGTGTGGCTTCAGGCCGCCATCCACTGCGGAGCCGTACAAATGTACGGCCAGCAACGTCGGTTCGAGATGGCGCTCGATGACGCCAACTACCTCTGATAGTTGAGTCGATACTTCGGCGATCACCGCTTCCCTCATGATGTTTAACTTTGTTTTAGGGCGACTGCCCTGCTGCGTAACATCGTTGCTGCTCCATAACATCAAACATCGACCCACGGCGTAACGCGCTTGCTGCTTGGATGCCCGAGGCATAGACTGTACCCCAAAAAAACATGTCATAACAAGCCATGAAAACCGCCACTGCGCCGTTACCATGCGAAACGATCCTCATCCTGTCTCTTGATCAGATCTTGATCCCCTGCGCCATCAGATCCTTGGCGGCAAGAAAGCCATCCAGTTTACTTTGCAGGGCTTCCCAACCTTACCAGAGGGCGCCCCAGCTGGCAATTCCGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTTCACCSEQ ID NO33GFP 1-9 OPT的核苷酸序列ATGCGCAAAGGAGAAGAACTTTTCACTGGAGTTGTCCCAATTCTTGTTGAATTAGATGGTGATGTTAATGGGCACAAATTTTCTGTCCGTGGAGAGGGTGAAGGTGATGCTACAAACGGAAAACTCAGCCTTAAATTTATTTGCAC
TACTGGAAAACTACCTGTTCCATGGCCAACACTTGTCACTACTCTGACCTATGGTGTTCAATGCTTTTCCCGTTATCCGGATCACATGAAACGGCATGACTTTTTCAAGAGTGTCATGCCCGAAGGTTATGTACAGGAACGCACTATATCTTTCAAAGATGACGGGACCTACAAGACGCGTGCTGAAGTCAAGTCTGAAGGTGATACCCTTGTTAATCGTATCGAGTTAAAAGGTATTGATTTTAAAGAAGATGGAAACATTCTCGGACACAAACTCGAGTACAACTTTAACTCACACAATGTATACATCACGGCAGACAAACAAAAGAATGGAATCAAAGCTAACTTCACAATTCGCCACAACGTTGAAGATGGTTCCGTTCAACTAGCAGACCATTATCAACAAAATACTCCAATTGGCGATGGCCCTGTCCTTTTACCAGACAATAASEQ ID NO34GFP 1-9 OPT的氨基酸序列MRKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLSLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKRHDFFKSVMPEGYVQERTISFKDDGTYKTRAEVKSEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFTIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDSEQ ID NO36GFP 10-11 OPT的氨基酸序列DHYLSTQTILSKDPNEERDHMVLLESVTAAGITHGMDELYKSEQ ID NO39NcoI(GFP S10 A4)-KpnI-linker-NdeI-BamHI-linker-SpeI-(GFP S11 SM5)-NheI-XhoI“10-x-11优选三明治”的氨基酸序列YTMDLPDDHYLSTQTILSKDLNGTDVGSGGGSHMGGGSGSGGGSGGGSTSEKRDHMVLLEYVTAAGITDASSEQ ID NO43GFP 1-10 OPT+GFP S11 M3“GFP 1-10 OPT M3”的核苷酸序列ATGAGCAAAGGAGAAGAACTTTTCACTGGAGTTGTCCCAATTCTTGTTGAATTAGATGGTGATGTTAATGGGCACAAATTTTCTGTCAGAGGAGAGGGTGAAGGTGATGCTACAATCGGAAAACTCACCCTTAAATTTATTTGCACTACTGGAAAACTACCTGTTCCATGGCCAACACTTGTCACTACTCTGACCTATGGTGTTCAATGCTTTTCCCGTTATCCGGATCACATGAAAAGGCATGACTTTTTCAAGAGTGCCATGCCCGAAGGTTATGTACAGGAACGCACTA
TATCTTTCAAAGATGACGGGAAATACAAGACGCGTGCTGTAGTCAAGTTTGAAGGTGATACCCTTGTTAATCGTATCGAGTTAAAGGGTACTGATTTTAAAGAAGATGGAAACATTCTCGGACACAAACTCGAGTACAACTTTAACTCACACAATGTATACATCACGGCAGACAAACAAAAGAATGGAATCAAAGCTAACTTCACAGTTCGCCACAACGTTGAAGATGGTTCCGTTCAACTAGCAGACCATTATCAACAAAATACTCCAATTGGCGATGGCCCTGTCCTTTTACCAGACAACCATTACCTGTCGACACAAACTGTCCTTTCGAAAGATCCCAACGAAAAGCGTGACCACATGGTCCTTCATGAGTCTGTAAATGCTGCTGGGATTACATAASEQ ID NO44GFP 1-10 OPT+GFP S11 M3“GFP 1-10 OPT M3”的氨基酸序列MSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATIGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGKYKTRAVVKFEGDTLVNRIELKGTDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFTVRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQTVLSKDPNEKRDHMVLHESVNAAGIT*SEQ ID NO45GFP 1-10 OPT+GFP S11 M3+tail of GFP“GFP 1-10 OPT M3 tailed”的核苷酸序列ATGAGCAAAGGAGAAGAACTTTTCACTGGAGTTGTCCCAATTCTTGTTGAATTAGATGGTGATGTTAATGGGCACAAATTTTCTGTCAGAGGAGAGGGTGAAGGTGATGCTACAATCGGAAAACTCACCCTTAAATTTATTTGCACTACTGGAAAACTACCTGTTCCATGGCCAACACTTGTCACTACTCTGACCTATGGTGTTCAATGCTTTTCCCGTTATCCGGATCACATGAAAAGGCATGACTTTTTCAAGAGTGCCATGCCCGAAGGTTATGTACAGGAACGCACTATATCTTTCAAAGATGACGGGAAATACAAGACGCGTGCTGTAGTCAAGTTTGAAGGTGATACCCTTGTTAATCGTATCGAGTTAAAGGGTACTGATTTTAAAGAAGATGGAAACATTCTCGGACACAAACTCGAGTACAACTTTAACTCACACAATGTATACATCACGGCAGACAAACAAAAGAATGGAATCAAAGCTAACTTCACAGTTCGCCACAACGTTGAAGATGGTTCCGTTCAACTAGCAGACCATTATCAACAAAATACTCCAATTGGCGATGGCCCTGTCCTTTTACCAGACAACCATTACCTGTCGACACAAACTGTCCTTTCGAAAGATCCCAACGAAAAGCGTGACCACATGGTCCTTCATGAGTCTGTAAATGCTGCTGGGATTACACATGGCATGGATGAGCTCTACAAATAASEQ ID NO46
GFP 1-10 OPT+GFP S11 M3+tail of GFP“GFP 1-10 OPT M3 tailed”的氨基酸序列MSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATIGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGKYKTRAVVKFEGDTLVNRIELKGTDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFTVRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQTVLSKDPNEKRDHMVLHESVNAAGITHGMDELYK*SEQ ID NO47GFP 10-11 OPT.的核苷酸序列GACCATTACCTGTCGACACAAACTATCCTTTCGAAAGATCCCAACGAAGAGCGTGACCACATGGTCCTTCTTGAGTCTGTAACTGCTGCTGGGATTACACATGGCATGGATGAGCTCTACAAATSEQ ID NO48NcoI(GFP S10 A4)-KpnI-linker-NdeI-BamHI-linker-SpeI-(GFP S11 SM5)-NheI-XhoI“10-x-11优选三明治”的核苷酸序列GATATACCATGGATTTACCAGACGACCATTACCTGTCGACACAAACTATCCTTTCGAAAGATCTCAACGGTACCGACGTTGGGTCTGGCGGTGGCTCCCATATGGGTGGCGGTTCTGGATCCGGTGGAGGGTCTGGTGGCGGATCAACTAGTGAAAAGCGTGACCACATGGTCCTTCTTGAGTATGTAACTGCTGCTGGGATTACAGGTGCTAGCTAACTCGAGAATAGC
权利要求
1.一种分离的多肽,其特征在于,它是GFP变异蛋白的β11链,该链的氨基酸序列选自SEQ ID NOS12、14和16中的一种。
2.一种分离的多肽,其特征在于,它是GFP变异蛋白的β11链,该链的氨基酸序列选自SEQ ID NOS18和20中的一种。
3.一种分离的多肽,其特征在于,它是GFP变异蛋白的β1-10的肽链,该肽链的氨基酸序列选自SEQ ID NOS4和6中的一种。
4.一种试剂盒,其特征在于,它包含权利要求1至3中任一项所述的分离的多肽。
5.一种分离的核苷酸分子,其特征在于,它编码权利要求1所述的多肽。
6.一种分离的核苷酸分子,其特征在于,它编码权利要求2所述的多肽。
7.一种分离的核苷酸分子,其特征在于,它编码权利要求3所述的多肽。
8.一种分离的核苷酸分子,其特征在于,它具有SEQ ID NO3所示序列。
9.一种分离的核苷酸分子,其特征在于,它具有SEQ ID NO5所示序列。
10.一种分离的核苷酸分子,其特征在于,它具有SEQ ID NO11所示序列。
11.一种分离的核苷酸分子,其特征在于,它具有SEQ ID NO13所示序列。
12.一种分离的核苷酸分子,其特征在于,它具有SEQ ID NO15所示序列。
13.一种分离的核苷酸分子,其特征在于,它具有SEQ ID NO17所示序列。
14.一种分离的核苷酸分子,其特征在于,它具有SEQ ID NO19所示序列。
15.一种表达载体,其特征在于,它包含权利要求5至14中任一项所述的核苷酸分子。
16.一种宿主细胞,其特征在于,它含有权利要求15所述的表达载体。
17.一种分离的核苷酸分子,其特征在于,它具有SEQ ID NO21所示序列。
18.一种载体,其特征在于,它包含权利要求17所述的核苷酸分子。
19.一种pTET-SpecR质粒载体,其特征在于,它具有SEQ ID NO22所示序列。
20.如权利要求19所述的载体,其特征在于,一编码荧光蛋白β1和3相邻肽链之间标签片段的多核苷酸被插入到载体的Spel和Kpnl两个单一限制性酶切位点之间的读码框内,且在所述标签片段的3’末端、Kpnl限制性酶切位点之前的读码框内引入一个终止密码子,以终止标签的翻译。
21.如权利要求19所述的载体,其特征在于,一编码荧光蛋白β1和10相邻肽链之间标签片段的多核苷酸被插入到载体的Spel和Kpnl两个单一限制性酶切位点之间的读码框内,且在所述标签片段的3’末端、Kpnl限制性酶切位点之前的读码框内引入一个终止密码子,以终止标签的翻译。
22.如权利要求20所述的载体,其特征在于,所述标签片段选自SEQ ID NO12、14、16、18和20所示序列。
23.如权利要求20所述的载体,其特征在于,所述编码标签片段的多核苷酸选自SEQ ID NO11、13、15、17和19所示序列。
24.如权利要求20所述的载体,其特征在于,它还包含一段编码异源多肽的多核苷酸,该段多核苷酸插在载体的Ndel和BamHl两个单一限制性酶切位点之间的读码框内。
25.如权利要求21所述的载体,其特征在于,它还包含一段编码异源多肽的多核苷酸,该段多核苷酸插在载体的Ndel和BamHl两个单一限制性酶切位点之间的读码框内。
26.如权利要求22所述的载体,其特征在于,它还包含一段编码异源多肽的多核苷酸,该段多核苷酸插在载体的Ndel和BamHl两个单一限制性酶切位点之间的读码框内。
27.如权利要求23所述的载体,其特征在于,它还包含一段编码异源多肽的多核苷酸,该段多核苷酸插在载体的Ndel和BamHl两个单一限制性酶切位点之间的读码框内。
28.一种包含权利要求19所述载体的大肠杆菌。
29.一种包含权利要求20所述载体的大肠杆菌。
30.一种包含权利要求21所述载体的大肠杆菌。
31.一种包含权利要求22所述载体的大肠杆菌。
32.一种包含权利要求23所述载体的大肠杆菌。
33.一种含有权利要求28所述大肠杆菌的试剂盒。
34.一种含有权利要求29所述大肠杆菌的试剂盒。
35.一种含有权利要求30所述大肠杆菌的试剂盒。
36.一种脱落荧光蛋白系统,其特征在于,它包含荧光蛋白的至少两个多肽片段,所述荧光蛋白选自GFP、GFP类似荧光蛋白及其变异蛋白,所述片段(a)都含有荧光蛋白完全互补的β链,(b)不能自发荧光,(c)自发地自我互补以重新组成荧光蛋白并产生荧光表型。
37.如权利要求36所述的脱落荧光蛋白系统,其特征在于,它包含两个多肽片段。
38.如权利要求36所述的脱落荧光蛋白系统,其特征在于,它包含三个多肽片段。
39.如权利要求37所述的脱落荧光蛋白系统,其特征在于,所述荧光蛋白的一个多肽片段与一条异源性多肽融合,如果该异源多肽是可溶的,所述融合多肽就能自发地与荧光蛋白的另一个多肽片段自行互补。
40.如权利要求39所述的脱落荧光蛋白系统,其特征在于,所述异源性多肽通过一个多肽接头被融合。
41.如权利要求36所述的脱落荧光蛋白系统,其特征在于,所述荧光蛋白是一种环形突变体或变异体。
42.如权利要求37所述的脱落荧光蛋白系统,其特征在于,所述的两个多肽片段为β链对,选自s1-10和s11;s1-9和s10-11;s1-8和s9-11;s1-7和s8-11;s1-6和s7-11;s1-5和s6-11;s1-4和s5-11;s1-3和s4-11;s1-2和s3-11;s1和s2-11。
43.如权利要求42所述的脱落荧光蛋白系统,其特征在于,所述多肽片段来源于具有SEQ ID NO46氨基酸序列的GFP变异蛋白。
44.一种脱落生色蛋白系统,其特征在于,它包含生色蛋白及其变异蛋白的至少两个多肽片段,所述片段(a)都含有生色蛋白完全互补的β链,(b)不能自己生色,(c)自发地自我互补以重新组成生色蛋白并产生生色表型。
45.如权利要求44所述的脱落生色蛋白系统,其特征在于,它包含两个多肽片段。
46.如权利要求44所述的脱落生色蛋白系统,其特征在于,它包含三个多肽片段。
47.如权利要求45所述的脱落生色蛋白系统,其特征在于,所述生色蛋白的一个多肽片段与一条异源性多肽融合,如果该异源性多肽是可溶的,所述融合多肽就能自发地与生色蛋白的另一个多肽片段自行互补。
48.如权利要求47所述的脱落生色蛋白系统,其特征在于,所述异源性多肽通过一个多肽接头被融合。
49.如权利要求44所述的脱落生色蛋白系统,其特征在于,所述生色蛋白是一种环形突变体或变异体。
50.如权利要求45所述的脱落生色蛋白系统,其特征在于,所述的两个多肽片段是β链对,选自s1-10和s11;s1-9和s10-11;s1-8和s9-11;s1-7和s8-11;s1-6和s7-11;s1-5和s6-11;s1-4和s5-11;s1-3和s4-11;s1-2和s3-11;s1和s2-11。
51.一种分离荧光蛋白的可溶性自行互补片段的方法,其特征在于,它包括如下步骤(a)使编码第一检测片段多肽的核酸发生突变并产生一个突变体文库;(b)将第一检测片段多肽的突变体在宿主细胞中进行表达;(c)裂解细胞;(d)使裂解产物与第二检测片段多肽接触,并使第一检测片段多肽的突变体能和第二检测片段多肽产生自行互补;(e)在裂解液中检测荧光,并挑选出一个或更多个最佳突变的第一检测片段多肽;(f)使编码第二检测片段多肽的核酸发生突变并产生一个突变体文库;(g)将第二检测片段多肽的突变体在宿主细胞中进行表达;(h)裂解细胞;(i)使裂解产物与步骤(e)中所述的挑选出的最佳突变体接触,并使第二检测片段多肽的突变体能和第一检测片段多肽的最佳突变体产生自行互补;(j)在裂解液中检测荧光,并挑选出一个或更多个最佳突变的第二检测片段多肽;分离出第一和第二检测片段多肽的最佳突变体。
52.一种分离荧光蛋白的可溶性自行互补片段的方法,其特征在于,它包括如下步骤;(a)使编码第一检测片段多肽的核酸发生突变并产生一个突变体文库;(b)将步骤(a)中的突变体文库克隆到表达载体中;(c)把步骤(b)中表达载体上的突变体文库转化入宿主细胞;(d)在宿主细胞中瞬时表达第一突变体文库;(e)将第二检测片段多肽通过转染或相容表达载体表达导入宿主细胞,从而使第一检测片段多肽的突变体能与第二检测片段自行互补;(f)检定细胞中的荧光,并挑选出一个或更多个第一检测片段多肽的最佳突变体;(g)使编码第二检测片段多肽的核酸发生突变并产生一个突变体文库;(h)将步骤(g)中的突变体文库克隆到表达载体中;(i)把步骤(h)中表达载体上的突变体文库转化入宿主细胞;(j)在宿主细胞中瞬时表达第二突变体文库;(k)将步骤(f)中所述的最佳突变体通过转染或相容表达载体表达导入宿主细胞,从而使第二检测片段多肽的突变体能与第一检测片段多肽的最佳突变体自行互补;(l)检定细胞中的荧光,并挑选出一个或更多个第二检测片段多肽的最佳突变体;分离出第一和第二检测片段多肽的最佳突变体。
53.如权利要求51或52所述的方法,其特征在于,所述第一和第二检测片段多肽为GFPβ链对,选自s1-10和s11;s1-9和s10-11;s1-8和s9-11;s1-7和s8-11;s1-6和s7-11;s1-5和s6-11;s1-4和s5-11;s1-3和s4-11;s1-2和s3-11;s1和s2-11。
54.如权利要求53所述的方法,其特征在于,所述检测片段多肽来源于具有SEQID NO46氨基酸序列的GFP变异蛋白。
55.一种检测体内可溶性试验蛋白的方法,其特征在于,它包括如下步骤(a)提供一个多核苷酸结构,它包含报告蛋白片段的自行互补片段的可溶性第一标签片段的编码序列,该序列与试验蛋白的编码序列融合,且受控于第一独立可诱导启动子;(b)提供一个多核苷酸结构,它包含报告蛋白片段的自行互补片段的可溶性第二检测片段的编码序列,该序列受控于第二独立可诱导启动子;(c)培养同时含有(a)和(b)两个结构的细胞,在基础条件下使其中的两个独立可诱导启动子受抑制;(d)诱导(a)中结构编码的第一片段与试验蛋白的融合蛋白表达,用足够的时间使融合蛋白表达,接着如果融合蛋白不溶,再用足够的时间使表达的融合蛋白聚集;(e)然后诱导(b)中结构编码的第二片段表达,用足够的时间使第二检测片段表达并使其与可溶性第一标签片段和试验蛋白的融合蛋白自行互补;(f)检定细胞中的报告蛋白活性,从而检测到可溶性试验蛋白。
56.如权利要求55所述的方法,其特征在于,所述试验蛋白通过一接头多肽与报告蛋白自行互补片段的标签片段的N末端融合。
57.如权利要求55所述的方法,其特征在于,所述报告蛋白是一种荧光蛋白。
58.如权利要求55所述的方法,其特征在于,所述报告蛋白是一种生色蛋白。
59.如权利要求57所述的方法,其特征在于,所述第一标签片段为β11链,所述第二检测片段为β1-10链。
60.如权利要求59所述的方法,其特征在于,所述第一标签片段选自SEQ ID NOS12、14和16所示序列。
61.如权利要求60所述的方法,其特征在于,所述第二检测片段选自SEQ ID NOS4和6所示序列。
62.如权利要求57所述的方法,其特征在于,所述第一标签片段为β10-11链,所述第二检测片段为β1-9链。
63.如权利要求62所述的方法,其特征在于,所述第一标签片段具有SEQ NO34所示序列。
64.如权利要求62所述的方法,其特征在于,所述第二检测片段具有SEQ NO36所示序列。
65.一种检测体内可溶性试验蛋白的方法,其特征在于,它包括如下步骤(a)提供一个多核苷酸结构,它包含编码报告蛋白的自行互补片段的可溶性第一标签片段的多核苷酸序列,该序列与试验蛋白的编码序列融合;(b)在一定条件下培养含有(a)结构的哺乳动物细胞,并用足够的时间使试验蛋白与标签片段的融合蛋白得到表达,如果该融合蛋白不溶,再用足够的时间使表达的融合蛋白聚集;(c)将报告蛋白的自行互补片段的可溶性第二检测片段通过化学方法转染至哺乳动物细胞中;(d)检定细胞中的报告蛋白活性,从而检测出可溶性试验蛋白。
66.如权利要求65所述的方法,其特征在于,所述试验蛋白通过一接头多肽与报告蛋白自行互补片段的标签片段的N末端融合。
67.如权利要求65所述的方法,其特征在于,所述报告蛋白是一种荧光蛋白。
68.如权利要求65所述的方法,其特征在于,所述报告蛋白是一种生色蛋白。
69.如权利要求67所述的方法,其特征在于,所述第一标签片段为β11链,所述第二检测片段为β1-10链。
70.如权利要求69所述的方法,其特征在于,所述第一标签片段选自SEQ ID NOS12、14和16所示序列。
71.如权利要求70所述的方法,其特征在于,所述第二检测片段选自SEQ ID NOS4和6所示序列。
72.如权利要求67所述的方法,其特征在于,所述第一标签片段为β10-11链,所述第二检测片段为β1-9链。
73.如权利要求72所述的方法,其特征在于,所述第一标签片段具有SEQ NO34所示序列。
74.如权利要求72所述的方法,其特征在于,所述第二检测片段具有SEQ NO36所示序列。
75.一种检测体内可溶性试验蛋白的方法,其特征在于,它包括如下步骤(a)提供一个多核苷酸结构,它包含编码荧光蛋白的β1和3相邻肽链之间的标签片段的多核苷酸序列,在两个相邻β链之间的读码框内插入一段编码试验蛋白的多核苷酸;(b)在一定条件下培养含有(a)结构的哺乳动物细胞,并用足够的时间使试验蛋白与标签片段的融合蛋白得到表达,如果该融合蛋白不溶,再用足够的时间使表达的融合蛋白聚集;(c)将荧光蛋白的自行互补片段的可溶性第二检测片段通过化学方法转染至哺乳动物细胞中;(d)检定细胞中的荧光,从而检测出可溶性试验蛋白。
76.一种检测体内可溶性试验蛋白的方法,其特征在于,它包括如下步骤(a)提供一个多核苷酸结构,它包含编码荧光蛋白的β1和3相邻肽链之间的标签片段的多核苷酸序列,在两个相邻β链之间的读码框内插入一段编码试验蛋白的多核苷酸,且受控于第一独立可诱导性启动子;(b)提供一个多核苷酸结构,它包含不在(a)结构中出现的荧光蛋白β链的可溶性第二检测片段的多核苷酸编码序列,且使该多核苷酸受控于第二独立可诱导性启动子;(c)培养同时含有(a)和(b)结构的细胞,在基础条件下使两个独立可诱导性启动子在此受到抑制;(d)诱导(a)结构编码的第一片段与试验蛋白的融合蛋白表达,并用足够的时间使融合蛋白得到表达,接着如果融合蛋白不溶,再用足够的时间使表达的融合蛋白聚集;(e)诱导(b)结构编码的第二片段表达,并用足够的时间使第二检测片段得到表达,且该表达产物能与可溶性第一标签片段和试验蛋白的融合蛋白进行自行互补;(f)检定细胞中的荧光,从而检测出可溶性试验蛋白。
77.如权利要求55所述的检测方法,其特征在于,所述荧光是被定量检测,且该荧光被用于检测表达的可溶性试验蛋白的数量。
78.如权利要求65所述的检测方法,其特征在于,所述荧光是被定量检测,且该荧光被用于检测表达的可溶性试验蛋白的数量。
79.如权利要求75所述的检测方法,其特征在于,所述荧光是被定量检测,且该荧光被用于检测表达的可溶性试验蛋白的数量。
80.如权利要求76所述的检测方法,其特征在于,所述荧光是被定量检测,且该荧光被用于检测表达的可溶性试验蛋白的数量。
81.一种定量体内总试验蛋白的检测方法,其特征在于,它包括如下步骤(a)提供一个多核苷酸结构,它包含编码荧光蛋白的自行互补片段的可溶性第一标签片段的核苷酸序列,该序列与试验蛋白的编码序列融合;(b)提供一个多核苷酸结构,它包含编码荧光蛋白的自行互补片段的可溶性第二检测片段的核苷酸序列;(c)培养同时含有(a)和(b)结构的细胞,并在一定条件下使(a)结构编码的第一片段和试验蛋白的融合蛋白表达,同时使(b)结构编码的第二片段也表达,且用足够的时间使标签片段和检测片段自行互补;(d)定量检测荧光以确定总蛋白量。
82.如权利要求81所述的方法,其特征在于,所述第一标签片段为β11链,所述第二检测片段为β1-10链。
83.如权利要求82所述的方法,其特征在于,所述第一标签片段选自SEQ ID NOS12、14和16所示序列。
84.如权利要求82所述的方法,其特征在于,所述第二检测片段选自SEQ ID NOS4和6所示序列。
85.如权利要求81所述的方法,其特征在于,所述第一标签片段为β10-11链,所述第二检测片段为β1-9链。
86.如权利要求85所述的方法,其特征在于,所述第一标签片段具有SEQ ID NO34所示序列。
87.如权利要求85所述的方法,其特征在于,所述第二检测片段具有SEQ ID NO36所示序列。
88.一种定量体内总试验蛋白的检测方法,其特征在于,它包括如下步骤(a)提供一个多核苷酸结构,它包含编码荧光蛋白的β1和3相邻肽链之间的标签片段的多核苷酸序列,在两个相邻β链之间的读码框内插入一段编码试验蛋白的多核苷酸;(b)提供一个多核苷酸结构,它包含不在(a)结构中出现的荧光蛋白β链的可溶性第二检测片段的多核苷酸编码序列;(c)培养含有(a)和(b)结构的细胞,并在一定条件下使(a)结构编码的第一片段和试验蛋白的融合蛋白表达,同时使(b)结构编码的第二片段也表达,且用足够的时间使标签片段和检测片段自行互补;(d)定量检测荧光以确定总蛋白量。
89.一种检测体外可溶性试验蛋白的方法,其特征在于,它包括如下步骤(a)提供一个多核苷酸结构,它包含编码报告蛋白的自行互补片段的可溶性第一标签片段的核苷酸序列,该序列与试验蛋白的编码序列融合;(b)培养含有(a)结构的细胞,并在一定条件下使(a)结构编码的标签片段和试验蛋白的融合蛋白表达,且用足够的时间让融合蛋白表达,如果该融合蛋白不溶,接着再用足够的时间使表达的融合蛋白聚集;(c)裂解细胞;(d)让裂解液与报告蛋白的自行互补片段的第二互补检测片段接触;(e)检定报告蛋白活性,而检测到报告蛋白活性就表明该试验蛋白是可溶的。
90.如权利要求89所述的方法,其特征在于,所述试验蛋白通过一个接头多肽与报告蛋白的自行互补片段的标签片段的N末端融合。
91.如权利要求89所述的方法,其特征在于,所述报告蛋白是一种荧光蛋白。
92.如权利要求89所述的方法,其特征在于,所述报告蛋白是一种生色蛋白。
93.如权利要求91所述的方法,其特征在于,所述第一标签片段为β11链,所述第二检测片段为β1-10链。
94.如权利要求93所述的方法,其特征在于,所述第一标签片段选自SEQ ID NOS12、14和16所示序列。
95.如权利要求93所述的方法,其特征在于,所述第二检测片段选自SEQ ID NOS4和6所示序列。
96.如权利要求91所述的方法,其特征在于,所述第一标签片段为β10-11链,所述第二检测片段为β1-9链。
97.如权利要求96所述的方法,其特征在于,所述第一标签片段具有SEQ ID NO34所示序列。
98.如权利要求96所述的方法,其特征在于,所述第二检测片段具有SEQ ID NO36所示序列。
99.一种定量体外不溶性试验蛋白的检测方法,其特征在于,它包括如下步骤(a)提供一个多核苷酸结构,它包含编码报告蛋白的自行互补片段的可溶性第一标签片段的核苷酸序列,该序列与试验蛋白的编码序列融合;(b)培养含有(a)结构的细胞,并在一定条件下使(a)结构编码的第一标签片段和试验蛋白的融合蛋白表达,且用足够的时间让融合蛋白表达,如果该融合蛋白不溶,接着再用足够的时间使表达的融合蛋白聚集;(c)裂解细胞,并从中分离出不溶性成分;(d)用化学变性的方法溶解不溶性成分;(e)将溶解变性的不溶性蛋白成分以适当配比在一种含有报告蛋白自行互补片段的第二互补检测片段的稀释液中进行复性,在一定条件下并用足够的时间使其自行互补;(f)定量检测荧光以确定不溶性蛋白量。
100.如权利要求94所述的方法,其特征在于,所述试验蛋白通过一个接头多肽与报告蛋白自行互补片段的标签片段的N末端融合。
101.如权利要求99所述的方法,其特征在于,所述报告蛋白是一种荧光蛋白。
102.如权利要求99所述的方法,其特征在于,所述报告蛋白是一种生色蛋白。
103.如权利要求101所述的方法,其特征在于,所述第一标签片段为β11链,所述第二检测片段为β1-10链。
104.如权利要求103所述的方法,其特征在于,所述第一标签片段选自SEQ ID NOS12、14和16所示序列。
105.如权利要求103所述的方法,其特征在于,所述第二检测片段选自SEQ ID NOS4和6所示序列。
106.如权利要求101所述的方法,其特征在于,所述第一标签片段为β10-11链,所述第二检测片段为β1-9链。
107.如权利要求106所述的方法,其特征在于,所述第一标签片段具有SEQ ID NO34所示序列。
108.如权利要求106所述的方法,其特征在于,所述第二检测片段具有SEQ ID NO36所示序列。
109.一种定量体外总试验蛋白的检测方法,其特征在于,它包括如下步骤(a)提供一个多核苷酸结构,它包含编码报告蛋白自行互补片段的可溶性第一标签片段的核苷酸序列,该序列与试验蛋白的编码序列融合;(b)培养含有(a)结构的细胞,并在一定条件下使(a)结构编码的第一标签片段和试验蛋白的融合蛋白表达,且用足够的时间让融合蛋白表达,如果该融合蛋白不溶,接着再用足够的时间使表达的融合蛋白聚集;(c)裂解细胞;(d)用化学变性的方式将裂解液中的总蛋白溶解;(e)将裂解液中的溶解蛋白以适当配比在一种含有报告蛋白自行互补片段的第二互补检测片段的稀释液中进行复性,在一定条件下,并用足够的时间使其自行互补;(f)定量检测荧光以确定总蛋白量。
110.一种检测体内可溶性试验蛋白的方法,其特征在于,它包括如下步骤(a)提供一个多核苷酸结构,它包含编码荧光蛋白的β1和3相邻肽链之间的标签片段的多核苷酸序列,在两个相邻β链之间的读码框内插入一段编码试验蛋白的多核苷酸;(b)在一定条件下培养含有(a)结构的细胞,并使(a)结构编码的第一标签片段和试验蛋白的融合蛋白表达,且用足够的时间让融合蛋白表达,如果该融合蛋白不溶,接着再用足够的时间使表达的融合蛋白聚集;(c)裂解细胞;(d)让裂解液与不在(a)结构中出现的荧光蛋白β链的第二互补检测片段多肽接触;(e)检定报告蛋白活性,检测到报告蛋白活性就表明该试验蛋白是可溶的。
全文摘要
本发明公开了一种基于荧光蛋白和生色蛋白自行互补片段的蛋白标签和检测系统。本发明的系统以来源于水母(Aequorea victoria)的绿色荧光蛋白(Green Fluorescent Protein GFP)的自行互补片段的各种结合为例,所述片段可被用于以多种检验形式检测和定量体内和体外蛋白的溶解性。
文档编号C07H21/04GK1886420SQ200480035241
公开日2006年12月27日 申请日期2004年10月23日 优先权日2003年10月24日
发明者杰弗里·S·沃尔多, 斯蒂芬妮·克本特斯 申请人:加利福尼亚大学