专利名称:蛋白质表面重建的制作方法
技术领域:
无
背景技术:
蛋白质是细胞的主要组成成分。蛋白质催化化学反应,在生物系统中转导信号,在 细胞和细胞外基质中提供结构元件,充当信使等。蛋白质不良表现的主要原因之一是聚 集。这不仅是实验室中的问题,而且是诸如阿尔茨海默病(Alzheimer's disease)等许多 疾病的问题。在达到计算设计的蛋白质时,聚集是尤其烦恼的问题。举例来说,TOP7 是具有新颖折叠的计算设计的蛋白质。TOP7的较长形式(延长的TOP7(TOP7 extended)) 极易聚集。TOP7ex主要表达为不可溶的聚集体。
随着更多蛋白质被设计或修饰以用作研究生物系统的工具或随着更多野生型或修 饰蛋白质被用作治疗剂,需要常规上将这些蛋白质修饰为更稳定和/或防止聚集的系统。
发明内容
本发明提供一种修饰蛋白质以使其更稳定的系统。本发明的产生是基于对修饰蛋白 质表面上的疏水性区域可提高蛋白质的超热力学性质的认识。本发明系统尤其适用于提 高所关注蛋白质的溶解性,提高蛋白质的抗聚集性,和/或提高蛋白质的复性能力。所有 这些特性尤其适用于蛋白质生产、蛋白质纯化以及使用蛋白质作为治疗剂和研究工具。
在一方面,本发明提供一种改变蛋白质的一级序列以增加宽范围条件下蛋白质的抗 聚集性、溶解性、重折叠能力和/或总体稳定性的方法。修饰蛋白质的活性优选大致或大 体上与未修饰的蛋白质相同。在某些实施例中,修饰蛋白质保留至少50%、 75%、 90% 或95%的野生型蛋白质的活性。在一实施例中,所述方法包括以下步骤(a)鉴别所关
10注蛋白质的表面残基;(b)鉴别特定表面残基在与所关注蛋白质相关的其它蛋白质中是 非高度保守的(即,确定哪些氨基酸对蛋白质活性或功能来说不是不可缺少的);(c) 确定所鉴别的非保守表面残基的疏水性;以及(e)用在生理pH值下极性更高或带电的 氨基酸置换至少一个或一个以上所鉴别的疏水性非保守残基。各以上步骤均可以使用所 属领域中己知的任何技术、计算机软件、算法、范式等进行。产生修饰蛋白质后,可测 试其活性和/或所寻求的预期性质。在某些实施例中,修饰蛋白质更加稳定。在某些实施 例中,修饰蛋白质不易聚集。本发明方法通常增加在生理pH值下蛋白质的净电荷(正 或负)。
在另一方面,本发明提供一种通过使蛋白质"超带电(s叩ercharging)"来改变蛋白 质的一级序列以增加宽范围条件下蛋白质的抗聚集性、溶解性、重折叠能力和/或总体稳 定性的方法。也就是说,与野生型蛋白质相比,修饰蛋白质上总的净电荷增加(正电荷 或负电荷)。修饰蛋白质的活性优选大致或大体上与未修饰的蛋白质相同。在某些实施 例中,所述方法包括以下步骤(a)鉴别所关注蛋白质的表面残基;(b)鉴别特定表面 残基在与所关注蛋白质相关的其它蛋白质中是非高度保守的(即,确定哪些氨基酸对蛋 白质活性或功能来说不是不可缺少的);(c)确定所鉴别的非保守表面残基的亲水性; 以及(e)用在生理pH值下带电的带电氨基酸置换至少一个或一个以上所鉴别的带电或 极性、溶剂暴露非保守残基。在某些实施例中,为制备带负电的"超带电"蛋白质,使 所鉴别用于修饰的残基突变为天冬氨酸(Asp)或谷氨酸(Glu)残基。在某些其它实施 例中,为制备带正电的"超带电"蛋白质,使所鉴别用于修饰的残基突变为赖氨酸(Lys) 或精氨酸(Arg)残基。各以上步骤都可以使用所属领域中已知的任何技术、计算机软 件、算法、范式等进行。产生修饰蛋白质后,可测试其活性和/或所寻求的预期性质。在 某些实施例中,修饰蛋白质("超带电蛋白质")更加稳定。在某些实施例中,修饰蛋白 质不易聚集。本发明方法通常增加在生理pH值下蛋白质的净电荷(正或负)。
编入蛋白质数据库(Protein Data Bank, PDB)中的超过80%的蛋白质的理论净电 荷在±10范围内。本发明所产生的修饰蛋A质通常具有小于-IO或人于+ 10的净电荷。 在某些实施例中,修饰蛋白质具有小于-20或大于+20的净电荷。在某些实施例中,修 饰蛋白质具有小于-30或大于+30的净电荷。在某些实施例中,修饰蛋白质具有小于-40 或大于+40的净电荷。在某些实施例中,修饰蛋白质具有小于-50或大于+50的净电荷。 修饰蛋白质能够恰当折叠并保留其生物活性。
可使用本发明系统修饰任何蛋白质,并且本发明系统所产生的蛋白质变异体以及编 码变异蛋白质的多核苷酸或载体和表达变异蛋白质的细胞都视为本发明的一部分。已经
11使用本发明系统产生了数种新颖的绿色荧光蛋白(green fluorescent protein, GFP)变异 体。这些变异体保留其荧光性;然而,其在宽范围环境下比GFP的现有形式更稳定。本 发明GFP即使经过很长时间和在诱导聚集的环境中也不会聚集,并且即使通过煮沸变性 后也能够重折叠为荧光蛋白。也已经使用本发明系统产生了新颖的链霉亲和素 (streptavidin)和谷胱甘肽-S-转移酶(glutathione-S-transferase, GST)变异体。这些变 异体保留其生物活性并且在加热时仍可溶。本发明还包括编码本发明GFP、链霉亲和素 以及GST蛋白序列的多核苷酸序列;包括任何这些核苷酸序列的载体;以及包括这样的 多核苷酸序列或载体或表达本发明变异体的细胞。在某些实施例中,本发明包括过度表 达本发明变异体的细菌或其它细胞。本发明变异体可用于所属领域己知的多种生物测定 中。举例来说,超带电GFP可用于目前使用GFP作为报告蛋白的任何测定中。
在另一方面,本发明提供已经由本发明系统修饰的其它蛋白质。这些修饰蛋白质优 选保留其显著比例的初始活性。在某些实施例中,修饰蛋白质保留至少99%、 98%、 95% 或90%的未修饰形式的活性。修饰蛋白质在多种条件可更可溶,抗聚集,重折叠能力增 加和/或稳定性更高。由本发明系统修饰的蛋白质包括疏水性蛋白、重组蛋白、膜蛋白、 结构蛋白、酶、细胞外蛋白、治疗蛋白(例如,胰岛素、细胞激素、免疫球蛋白、免疫 球蛋白片段等)、受体、细胞信号传导蛋白、胞浆蛋白、核内蛋白、转录因子等。在某 些特定实施例中,蛋白质是用于人类或兽医学的治疗蛋白。在某些实施例中,蛋白质是 非天然蛋白质,例如计算设计的蛋白质。在其它实施例中,蛋白质是杂合蛋白、融合蛋 白、变构蛋白、突变蛋白、基因工程蛋白或已经通过人工改变的任何其它蛋白质。
还提供用于实施本发明的试剂盒。试剂盒可包括修饰所关注蛋白质以使其更抗聚 集、增加其复性能力或增加其总体稳定性所需的试剂。这些试剂盒可包括所有或部分以 下各物多核苷酸、计算机软件、核苷酸、引物、载体、细胞系、说明书、培养板、培 养基、缓冲液、酶、艾本德管(Eppendorf tube)、定点诱变试剂盒等。试剂盒优选经简 便包装以供实验室装置使用。研究员通常提供待使用本发明技术修饰的蛋白质的DNA 编码序列。
定义
"氨基酸"术语"氨基酸"是指蛋白质的基本结构亚单元(subunit)。 a-氨基酸由 氨基、羧基、氢原子以及侧链(即,R基团)组成,均键结于中心碳原子。这个屮心碳 原子因为与羧基相邻而称为a碳。存在二十种天然氨基酸,包括甘氨酸、丙氨酸、缬氨 酸、亮氨酸、异亮氨酸、苯丙氨酸、酪氨酸、色氨酸、半胱氨酸、蛋氨酸、丝氨酸、苏 氨酸、赖氨酸、精氨酸、组氨酸、天冬氨酸、谷氨酸、天冬酰胺、谷氨酸以及脯氨酸。疏水性氨基酸包括丙氨酸、缬氨酸、亮氨酸、异亮氨酸以及苯丙氨酸。芳香族氨基酸包 括苯丙氨酸、酪氨酸、色氨酸以及组氨酸。极性氨基酸包括酪氨酸、半胱氨酸、丝氨酸、 苏氨酸、赖氨酸、精氨酸、组氨酸、天冬氨酸、谷氨酸、天冬酰胺以及谷氨酰胺。含硫 氨基酸包括半胱氨酸和蛋氨酸。碱性氨基酸包括赖氨酸、精氨酸以及组氨酸。酸性胺基 酸包括天冬氨酸和谷氨酸。也有蛋白质中被插入非天然氨基酸。在某些实施例中,当使 用术语"氨基酸"时是指二十种天然氨基酸。
"抗体"术语"抗体"是指天然或者完全或部分合成产生的免疫球蛋白。维持特异 性结合能力的所有其衍生物也包括在这一术语内。这一术语也涵盖具有与免疫球蛋白结 合域同源或者基本上同源的结合域的任何蛋白质。这些蛋白质可源自天然来源或者部分 或完全合成产生。抗体可为单克隆抗体或多克隆抗体。抗体可为任何免疫球蛋白类别(包 括人类类别IgG、 IgM、 IgA、 IgD以及IgE中的任一类别)的成员。
"保守"术语"保守"是指多核苷酸序列或氨基酸序列的相应核苷酸或氨基酸残基 在所比较的两个或两个以上相关序列的相同位置未发生变化。相对保守的核苷酸或氨基 酸是在相关序列中比序列中其它地方所出现的核苷酸或氨基酸保守的那些核苷酸或氨 基酸。
"同源"如本文中所使用的术语"同源"是所属领域通晓的术语,是指核酸或蛋白
质在核苷酸或氨基酸序列层面高度相关。彼此同源的核酸或蛋白质称为同源物。同源可 指两个序列(即,核苷酸序列或氨基酸)之间的序列相似性程度。本文屮所提及的同源 性%数字反映两个序列之问的最大可能同源性,即,比对两个序列以具有最大数目的匹 配(同源)位置时的同源性%。同源性可由已知方法容易地加以计算,诸如以下文献中
所述的方法计算分子生物学(Computational Molecular Biology),莱斯克(Lesk, A. M,) 编,牛津大学出版社(Oxford University Press),纽约(New York) ,1988;生物计算 信息学和基因组计划(Biocomputing: Informatics and Genome Projects),史密斯(Smith, D. W.)编,学术出版社(Academic Press),纽约(New York) ,1993;分子生物学中的 序歹U分析(Sequence Analysis in Molecular Biology),凡.海耳卩(von Heinje, G.),学术出 版社(Academic Press) ,1987;序列数据的计算机分析第I部分(Computer Analysis of Sequence Data, Parti),格里菲因(Griffin, A. M.)和格里菲因(Griffin, H. G.)编,胡玛 纳出版社(Humana Press),新泽西州(New Jersey) , 1994;和序列分析引物(Sequence Analysis Primer),吉布考夫(Gribskov, M.)和德夫莱克(Devereux, J.)编,米斯托克 顿出版社(M Stockton Press),纽约(New York) , 1991;各自以引用的方式并入本文 中。测定序列之间同源性的常用方法包括(但不限于)以下文献中所揭示的方法卡里
13罗(Carillo, H.)和里皮曼(Lipman, D.) , SIAM应用数学(SIAM J Applied Math.) , 48:1073 (1988);其以引用的方式并入本文中。测定同源性的技术被编成了公开可用的计算机程 序。测定两个序列之间同源性的示范性计算机软件包括(但不限于)GCG程序包(德夫 莱克(Deve,, J.)等人,核酸研究(Nucleic Acids Research) , 12(1), 387 (1984))、 BLASTP、 BLASTN以及FASTA( P可特舒(Atschul, S. F.)等人,分子生物学杂志(J Molec. Biol.) , 215, 403(1990))。
术语"同源"必定指至少两个序列(核苷酸序列或氨基酸序列)之间的比较。根据 本发明,如果两个核苷酸序列所编码的多肽有至少一段的至少20个氨基酸至少约 50-60%—致,优选约70%—致,那么将其视为同源。同源核苷酸序列的特征优选还在于 编码一段至少4-5个特别指定的氨基酸的能力。关于待考虑同源性的核苷酸序列,必须 考虑这些氨基酸彼此之间的一致性和大致间隔。对于长度小于60个核苷酸的核苷酸序 列,由编码一段至少4-5个特别指定的氨基酸的能力确定同源性。
"肽"或"蛋白质"根据本发明,"肽"或"蛋白质"包含一串通过肽键连接在一 起的至少三个氨基酸。术语"蛋白质"和"肽"可互换使用。本发明的肽优选仅含有天 然氨基酸,但也可使用所属领域已知的非天然氨基酸(即,自然界中不存在但可并入多 肽链中的化合物)和/或氨基酸类似物。同时,可修饰本发明的肽中的一个或一个以上氨 基酸,例如通过添加碳水化合物基团、磷酸根基、法呢基(farnesyl)、异法呢基、脂肪 酸基团、用于连接、官能化或其它修饰(例如,a酰胺化)的连接基团等化学实体来修 饰。在优选实施例中,对肽修饰产生更稳定的肽(例如,活体内半衰期更高)。这些修 饰可包括使肽环化、并入D-氨基酸等。这些修饰均不应对肽的预期生物活性产生实质性 的干扰。在某些实施例中,对肽修饰产生生物学活性更高的肽。
"多核苷酸"或"寡核苷酸"多核苷酸或寡核苷酸是指核苷酸的聚合物。多核苷酸 通常包含至少三个核苷酸。聚合物可包括天然核苷(即,腺苷、胸苷、鸟苷、胞苷、尿 苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷以及脱氧胞苷)、核苷类似物(例如,2-氨基腺苷、 2-硫代胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、C5-丙炔基胞苷、C5-丙炔基尿苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-甲基胞苷、7-脱氮腺苷(7-deazaadenosine)、 7-脱 氣鸟昔(7匿deazaguanosine)、 8-氧代月泉昔(8-oxoadenosine)、 8—氧4戈鸟昔(8-oxoguanosine)、 0(6)-甲基鸟嘌呤以及2-硫代胞苷)、化学修饰碱基、生物修饰碱基(例如,甲基化碱基)、 插入碱基、修饰糖(例如,2'-氟核糖、核糖、2'-脱氧核糖、阿拉伯糖(arabinose)以及 己醣)和/或修饰磷酸根基(例如,硫代磷酸根基和5'-N-亚磷酰胺键联)。
"小分子"如本文中所使用的术语"小分子"是指实验室中制备或自然界中可见的非肽、非寡聚有机化合物。如本文中所使用的小分子可指"天然产物样"化合物,然而 术语"小分子"不限于"天然产物样"化合物。更确切地说,小分子的特征通常在于其 含有数个碳碳键并且具有小于1500的分子量,但出于本发明的目的,这一特征不打算 限制本发明。在某些其它优选实施例中,利用天然产物样小分子。
"稳定"如本文中所使用的术语"稳定"提及蛋A质时是指蛋A质稳定性的任何方 面。与初始野生型蛋白质相比,稳定的修饰蛋白质具有一个或一个以上的以下特征更 可溶、更抗聚集、更抗变性、更抗解折叠、更抗不适当或不希望的折叠、复性能力更强、 热稳定性增加、在多种环境(例如,pH值、盐浓度、存在洗涤剂、存在变性剂等)下 稳定性增加以及非水性环境下稳定性增加。在某些实施例中,稳定的修饰蛋白质显示至 少两个上述特征。在某些实施例中,稳定的修饰蛋白质显示至少三个上述特征。这些特 征可使活性蛋白质在更高水平下生产。举例来说,可在比蛋白质未修饰形式高的水平下 过度表达修饰蛋白质而无聚集。这些特征也可使蛋白质用作治疗剂或研究工具。
激7,超带电绿色荧光蛋白(GFP)。 (a) GFP变异体的蛋白质序列,形成荧光团的 残基突出为绿色、带负电残基突出为红色,而带正电残基突出为蓝色;(b)sfGFP(左)、 GFP(+36)(中)以及GFP(-30)(右)的表面静电势,自-25kT/e (红色)至+25 kT/e (蓝 色)着色。
激2, GFP变异体的分子内性质。(a)纯GFP变异体的染色和紫外荧光。各泳道和 试管含有0.2 ug蛋白质。(b) GFP变异体的圆二色性谱。(c) GFP变异体的热力学稳 定性,由胍盐诱导的解折叠测量。
激丄.超带电蛋白质的分子间性质。(a)纯GFP变异体的紫外照射样品("天然"), 在IO(TC加热1分钟的样品("煮沸")和随后在25。C冷却2小时的样品("冷却")。(b) 在25。C下用40免TFE诱导GFP变异体聚集并通过直角光散射监测。(c)超带电GFP可 逆地粘附于带相反电荷的大分子。样品1:于30pl25mMTris(pH7.0)和100 mM NaCl 中的6貼GFP(+36)。样品2:向样品1中添加6 pg GFP(-30)。样品3:向样品1中添加 30 ng鲑鱼精DNA。样品4:向样品1中添加20^g大肠杆菌(E. coli) tRNA。样品5: 向样品4中添加NaCl达1 M。样品6-8:除使用sfGFP代替GFP(+36)外,分别与样品1、 2以及4相同。使所有样品在微型离心机中短暂旋转并且在紫外光下观察。(d) GST变 异体的酶法测定。反应含有0.5 mg/mLGST变异体、20mM二硝基氯苯、20 mM谷胱甘 肽以及100mM磷酸钾(pH6.5)。在340 nm下监测产物的形成,得到反应速率观察值(k。bs),野生型GST为6 min",GST(-40)为2.2 min"而煮沸和冷却后GST(-40)为0.9 min-1 。 厲4, GFP变异体的(a)激发光谱和(b)发射光谱。各样品含有通过在490nm下 发色团吸光度所定量,等量的蛋白质。
激5,链霉亲和素变异体的生物素结合活性,如先前所述(卡达(Kada)等人,利 用荧光猝灭或荧光偏振快速估算抗生物素蛋白和链霉亲和素(Rapid estimation of avidin and streptavidin by fluorescence quenching or fluorescence polarization). 生物化学与生物 物理学报(Biochim. Biophys. Acta) 1427, 44-48 (1999),其以引用的方式并入本文中) 通过监测生物素-4-荧光素(英杰公司(Invitrogen))依赖性结合而测量。向0.3 生物 素-4-荧光素(B4F)、 100 mM NaCl、 1 mM EDTA、 0.1 mg/mL牛血清白蛋白(bovine serum albumin BSA)、 50 mM磷酸钾(pH 7.5)中滴定蛋白质样品。在470 nm下激发的 Perkin-Elmer LS50B荧光分光光度仪上测量526 nm下的荧光猝灭。相对于含有600倍过 量的无荧光生物素的对照滴定,将测量结果归一化。包括图例下部的二个蛋白质作为阴 性对照。
具体实施例方式
本发明提供一种修饰蛋白质以使其更加稳定的系统。所述系统通过将蛋白质表面上 的非保守氨基酸变成极性更大或带电的氨基酸残基来运行。待修饰的氨基酸残基可以呈 疏水性、亲水性或其组合。可通过使用本发明系统修饰任何蛋白质来产生更稳定的变异 体。已发现对表面残基进行这些修饰可以提高蛋白质的超热力学性质。随着蛋白质日益 用作治疗剂和随着其继续用作研究工具,用于改变蛋白质以使其更加稳定的系统也变得 重要和适用。由本发明方法修饰的蛋白质通常抗聚集,重折叠能力增加,抗不适当折叠, 溶解性提高并且在包括变性条件(诸如热或存在洗涤剂)在内的宽范围条件下通常更加 稳定。
可通过使用木发明系统修饰任何蛋白质来产生更稳定的变异体。可修饰天然和非天 然蛋白质(例如,工程蛋白质)。可被修饰的蛋白质实例包括受体、膜结合蛋白、跨膜 蛋白、酶、转录因子、细胞外蛋白、治疗蛋白、细胞因子、信使蛋白、DNA结合蛋白、 RNA结合蛋白、参与信号转导的蛋白质、结构蛋白、胞浆蛋白、核内蛋白、疏水性蛋白、 亲水性蛋白等。待修饰的蛋白质可源自植物、动物或微生物的任何物种。在某些实施例 中,蛋白质是哺乳动物蛋白质。在某些实施例中,蛋白质是人类蛋白质。在某些实施例 中,蛋白质源自研究中通常使用的生物体。举例来说,待修饰的蛋白质可来自灵长类动 物(例如,猿、猴)、啮齿动物(例如,兔子、仓鼠、沙鼠)、猪、狗、猫、角.(例如,
16斑马鱼(z^ra力'W))、线虫(例如,秀丽线虫(C. e/eg"w))、酵母(例如,酿酒酵母 (Sac由ram戸s cerWw'ae))或细菌(例如,大肠杆菌(£. co/0)。
本发明系统尤其适用于修饰易聚集或具有稳定性问题的蛋白质。本系统也可用于修 饰被过度表达的蛋白质。举例来说,重组产生的治疗蛋白可以从本发明系统的修饰中受 益。这些经过修饰的治疗蛋白不仅更易生产和纯化,而且就蛋白质的保存和使用来说可 能更加稳定。
本发明系统包括鉴别所关注蛋白质的非保守表面残基和用在生理pH值下为亲水 性、极性或带电的残基置换这些残基中的一些。本发明系统不仅包括修饰蛋白质的方法, 而且包括适用于修饰蛋白质以使其更稳定的试剂和试剂盒。
使用所属领域中已知的任何方法鉴别待修饰的蛋白质的表面残基。在某些实施例 中,通过计算机模拟蛋白质鉴别表面残基。在某些实施例中,已知和/或测定蛋白质的三 维结构,并通过观察蛋白质的结构鉴别表面残基。在其它实施例中,使用计算机软件预 测表面残基。在某些特定实施例中,使用每个侧链原子的平均相邻原子(Average Neighbor Atoms per Sidechain Atom, AvNAPSA)预测表面暴露。AvNAPSA是一种已作为计算机 程序实施的自动化表面暴露法。参见附录A。低AvNAPSA值表示表面暴露的残基,而 高值表示位于蛋白质内部的残基。在某些实施例中,使用所述软件预测蛋白质的二级结 构和/或三级结构并基于这一预测鉴别表面残基。在其它实施例中,表面残基的预测是基 于残基的疏水性和亲水性以及其于蛋白质一级序列中的聚类分析。除计算机模拟(in silico)方法外,也可使用多种生物化学技术(例如蛋白酶裂解、表面修饰等)鉴别蛋白 质的表面残基。
然后确定表面残基中哪些是保守的或对蛋白质的功能来说是重要的。可使用所属领 域中已知的任何方法确定保守残基的鉴别。在某些实施例中,通过比对所关注蛋白质的 一级序列与相关蛋白质来鉴别保守残基。这些相关蛋白质可来自同--蛋白质家族。举例 来说,如果蛋白质是免疫球蛋白,那么可使用其它免疫球蛋白序列。相关蛋白质也可以 是来自不同物种的相同蛋白质。举例来说,可通过比对来自不同物种的相同蛋白质的序 列来鉴别保守残基。作为另一实例,可比对具有类似功能或生物活性的蛋白质。优选使 用2、 3、 4、 5、 6、 7、 8、 9或10个不同序列来确定蛋白质的保守氨基酸。在某些实施 例中,如果超过50%、 60%、 70%、 75%、 80%或90%的序列在特定位置具有相同氨基 酸,那么残基就被视为是保守的。在其它实施例中,如果超过50%、 60%、 70%、 75%、 80%或90%的序列在特定位置具有相同或类似(例如,缬氨酸、亮氨酸以及异亮氨酸; 甘氨酸和丙氨酸;谷氨酰胺和天冬酰胺;或天冬氨酸和谷氨酸)氨基酸,那么残基就被视为是保守的。许多软件包可用于比对和比较如本文中所述的蛋白质序列。所属领域的 技术人员应了解可首先确定保守残基或者可首先确定表面残基。顺序并不重要。在某些 实施例中,计算机软件包可同时确定表面残基和保守残基。也可通过诱变蛋白质来鉴别 蛋白质中的重要残基。举例来说,可使用蛋白质的丙氨酸扫描来确定蛋白质中的重要氨 基酸残基。在其它实施例中,可使用定点诱变。
一旦鉴别出蛋白质的非保守表面残基,就将各残基鉴别为呈疏水性或亲水性。在某 些实施例中,给残基指定疏水性评分。举例来说,可给各非保守表面残基指定辛醇/水分 配系数的对数值(logP)。也可使用其它疏水性参数。这些氨基酸标度已论述于以下文献 中:简因(Janin),球状蛋白中的表面和内部体积("Surface and Inside Volumes in Globular Proteins",自然(Wa諫)277:491-92,1979;沃尔芬顿(Wolfenden)等人,氨基酸侧 链对溶剂水的亲和力("Affinities of Amino Acid Side Chains for Solvent Water"),生物化 学(fi/oc/zem^oO 20:849-855, 1981:卡特(Kyte)等人,呈现蛋白质水疗特性的简单 方法("A Simple Method for Displaying the Hydropathic Character of a Protein"),分子生 物学杂志(/. Mo/. 5!'。/.) 157:105-132,1982;罗丝(Rose)等人,球状蛋白中的氨基酸 残基的疏水性("Hydrophobicity of Amino Acid Residues in Globular Proteins"),禾斗学 (Sdewce) 229:834-838,1985;考纳特(Cornette)等人,检测蛋白质中的两亲结构的疏 7K性标度禾卩计算技术("Hydrophobicity Scales and Computational Techniques for Detecting Amphipathic Structures in Proteins"),分子生物学杂志(丄Afo/. ) 195:659-685, 1987; 査顿(Charton)和查顿(Charton),氨基酸疏水性参数的结构依赖性("The Structure Dependence of Amino Acid Hydrophobicity Parameters"),理论生物学杂志( /. 77^6>/-.
99:629-644, 1982;各自以引用的方式并入本文中。本发明方法中可使用任何这 些疏水性参数来确定修饰哪些非保守残基。在某些实施例中,鉴别亲水性或带电残基来 修饰。
然后选择至少一个所鉴别的非保守或非重要表面残基加以修饰。在某些实施例中, 选择疏水性残基加以修饰。在其它实施例中,选择亲水性和/或带电残基加以修饰。在某 些实施例中,选择不止一个残基加以修饰。在某些实施例中,选择l、 2、 3、 4、 5、 6、 7、 8、 9或IO个所鉴别的残基加以修饰。在某些实施例中,选择超过10个、超过15个 或超过20个残基加以修饰。所属领域的技术人员应了解,蛋白质越大,则需要修饰的 残基将越多。同时,蛋白质疏水性越高或者越易聚集或沉淀,则需要修饰的残基将越多。 在某些实施例中,产生多个各具有不同修饰的蛋白质变异体并加以测试以确定就生物活 性和稳定性来说最佳的变异体。
18在某些实施例中,使选择加以修饰的残基突变为更亲水的残基(包括带电残基)。 通常使残基突变为更亲水的天然氨基酸。在某些实施例中,使残基突变为在生理pH值 下带电的氨基酸。举例来说,残基可变为精氨酸、天冬氨酸、谷氨酸、组氨酸或赖氨酸。 在某些实施例中,使待修饰的所有残基变为同一种不同残基。举例来说,使所选择的残 基全部变为谷氨酸残基。在其它实施例中,使所选择的残基变为不同残基;然而,可使 所有最终残基在生理pH值下带正电或带负电。在某些实施例中,为产生带负电的蛋白 质,使待突变的所有残基转化为谷氮酸和/或天冬氨酸残基。在某些实施例中,为产生带 正电的蛋白质,使待突变的所有残基转化为赖氨酸残基。举例来说,所有所选择的待修 饰残基是天冬酰胺、谷氨酰胺、赖氨酸和/或精氨酸,并且使这些残基突变为天冬氨酸或 谷氨酸残基。作为另一实例,所有所选择的待修饰残基是天冬氨酸、谷氨酸、天冬酰胺 和/或谷氨酰胺,并且使这些残基突变为赖氨酸。这种方法允许在最大程度上修饰蛋白质 上的净电荷。
在其它实施例中,蛋白质可在修饰后在修饰蛋白质上保持与未修饰蛋白质上相同的 净电荷。在其它实施例中,蛋白质可在修饰后减少蛋白质上的总净电荷,而增加表面上 带电残基的总数。在某些实施例中,理论净电荷增加至少+1、 +2、 +3、 +4、 +5、 +10、 + 15、 +20、 +25、 +30或+35。在某些实施例中,理论净电荷减少至少-1、 -2、 -3、 -4、 -5、 -10、 -15、 -20、 -25、 -30或-35。在某些实施例中,使所选择的氨基酸变为非离子极性残 基(例如,半胱氨酸、丝氨酸、苏氨酸、酪氨酸、谷氨酰胺、天冬酰胺)。
蛋白质中的这些修饰或突变可使用所属领域中已知的任何技术来实现。所属领域中 熟知在蛋白质序列中引入这些变化的重组DNA技术。在某些实施例中,通过定点诱变 编码所述蛋白质的多核苷酸进行修饰。引入突变的其它技术论述于以下文献中分子克 隆实验室手册(Mo/ecw/ar C/om'wg: A Z^joratory ManwaO ,第2版,山姆布鲁克 (Sambrook),福里茨(Fritsch)以及曼尼亚提斯(Maniatis)编,(冷泉港实验室出版社 (Cold Spring Harbor Laboratory Press) : 1989); 论文酶学中的方法(Mef/zoA ^Tzymo/ogy)(学术出版社(Academic Press, Inc.),纽约(N.Y.));奥苏贝尔(Ausubel) 等人,最新分子生物学实验方法汇编(Cwrenf PTOtoco"Mo/ecw/arBZo/ogy)(约翰威 利父子出版社(John Wiley & Sons, Inc.),纽约(New York) ,1999);各自以引用的方 式并入本文中。表达并测试所述修饰蛋白质。在某些实施例中,制备一系列变异体并测 试各变异体确定其生物活性和其稳定性。选择用于后续使用的变异体可为最稳定的变异 体、最具活性的变异体或者活性和稳定性的组合总体最大的变异体。制备第一组变异体 后,可以基于从第一组变异体学到的知识制备另一组变异体。通常使用所属领域中已知
19的重组技术产生和过度表达变异体。
已使用本发明系统产生了 GFP变异体。已显示这些变异体更加稳定并且保留其荧光 性。来自维多利亚水母Ue《wo/ra v!'cfon'a)的GFP描述于基因库寄存编号P42212屮, 其以引用的方式并入本文中。这一野生型GFP的氨基酸序列如下
MSKGTEELFTGVWILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPWW PTLVTTFSYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVK FEGDTLWRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGKVNFKIRHNI EDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMV1XEFVTAA GriHGMDELYK (SEQ ID NO: 1)
野生型GFP的理论净电荷为-7。使用本发明系统已产生理论净电荷为-29、 -30、 -25、 +36、 +48以及+49的变异体。即使加热+36 GFP到95'C后,100%的变异蛋白质也是可 溶的并且蛋白质保留>70%的荧光性。
已产生的GFP变异体的氨基酸序列包括
GFP-NEG25
MGHH朋HHGGASKGEELFTGVWILVELDGDVNGHEFSVRGEGEGDATEGELTLKF ICTTGELPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTISFKDD GTYKTRAEVKFEGDTLVNR1ELKGIDFKEDGNILGHKLEYNFNSHDVYITADKQENGI KAEFEIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDDHYLSTESALSKDPNEDRDHM VLLEFVTAAGIDHGMDELYK (SEQ ID NO: 2)
GFP-NEG29
MG朋HH朋GGASKGEELFDGEVPILVELDGDVNGHEFSVRGEGEGDATEGELTLKF ICTTGBLPVPWPTLVTTLTYGVQCFSRYPDHMDQHDFFKSAMPEGYV卿TISFKDD GTYKTRAEVKFEGDTLVNR正LKGIDFKEDGNILGHKLEYNFNSHDVY1TADKQENGI KAEFEIRHNVEDGSVQLADHYQQ離IGDGPVLLPDDHYLSTESALSKDPNEDRDHM VLLEFVTAAGIDHGMDELYK (SEQ ID NO: 3)
GFP-NEG30
MGHHHHHHGGASKGEELFDGVVP1LVELDGDVNGHEFSVRGEGEGDATEGELTLKF ICTTGELPVPWPTLVTTLTYGVQCFSDYPDHMDQHDFFKSAMPEGYVQERTISFKDD GTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHDVYITADKQENGI
KAEFEIRHNVEDGSVQLADHY,TPIGDGPVLLPDDHYLSinESALSKDPNEDRD應 VLLEFVTAAGIDHGMDELYK (SEQ ID NO: 4)
GFP-POS36
MGHHHHHHGGASKGERLFRGKVPILVELKGDVNGHKFSVRGKGKGDATRGKLTLK FICTTGKLPVPWPTLVTTLTYGVQCFSRYPKHMKR抑FFKSAMPKGYVQERTISFKK DGKYKTRAEVKFEGRTLVNRIKLKGRDFKEKGNILGHKLRYNFNSHKVYITADKRK NGIKAKFKIRHNVKDGSVQLADHYQQ匿IGRGPVLLPRNHYLSTRSKLSKDPKEKR D顧VLLEFVTAAGIKHGRDERYK (SEQ ID NO: 5)
GFP-POS42
20MGHHHH朋GGRSKGKRLFRGKVPILVELKGDVNGHKFSVRGKGKGDATRGKLTLK FICTTGKXPVPWPTLVTTLTYGVQCFSRYPKHMKRHDFFKSAMPKGYV卿TISFKK DGKYKTRAEVKFEGRTLVNRIKLKGRDFKEKGNILGHKLRYNFNSHKVYITADKRK NGIKAKJFKIRHNVKDGSVC LADHYQQ證KmGPVLLPRKHYLSTRSKLSKDPKEKR DHMVLLEFVTAAGIK恥RKERYK (SEQ ID NO: 6)
GFP-POS49
MGHHHHHHGGRSKGKRLFRGKVPILVKLKGDVNGHKFSVRGKGKGDATRGKLTLK FICTTGKLPVPWPTLVTTLTYGVQCFSRYPKHMKRHDFFKSAMPKGYVQERTISFKK DGKYKTRAEVKFKGRTLVNRIKLKGRDFKEKGNILGHKLRYNFNSHKVYITADKRK NGIKAKFK1RHNVKDGSVQLAKHYQQNTPIGRGPVLLPRKHYLSTRSKLSKDPKEKR DHMVLKEFVTAAGIKHGRKERYK (SEQ ID NO: 7)
所属领域的技术人员应了解,同源蛋白质同样视为在本发明范围内。举例来说,任 何包括一段20、 30、 40、 50或IOO个氨基酸与任何上述序列60%、 70%、 80%、 90%、 95%或100%同源的蛋白质视为本发明的一部分。另外,本发明还涵盖添加和缺失变异体。 在某些实施例中,具有如任何上述序列中所示的突变残基的任何GFP视为本发明的一部 分。在某些实施例中,序列包括2、 3、 4、 5、 6、 7、 8、 9、 10个或10个以上如任何以 上序列中所示的突变。
编码上述G F P变异体的任何D N A序列也包括在本发明范围内。编码以上各变异体 的示范性DNA序列如下
GFP-NEG25
ATGGGGCATCACCATCATCATCATGGCGGTGCGTCTAAGGGGGAGGAGTTATTTA
CGGGTGTGGTGCCGATCCTGGTGGAGCTTGATGGCGATGTTAACGGCCATGAATT
TTCTGTCCGCGGTGAAGGGGAGGGTGATGCCACGGAAGGGGAGCTGACACTTAA
ATTTATTTGCACCACCGGTGAACTCCCGGTCCCGTGGCCGACCCTGGTGACCACC
CTGACCTACGGCGTTCAATGCTTTTCACGTTATCCGGATCACATGAAGCAACACG
ACTTCTTTAAAAGCGCGATGCCTGAAGGCTATGTTCAAGAACGTACAATTAGTTT
TAAAGATGACGGCACCTACAAGACCCGTGCGGAAGTAAAATTTGAAGGGGACAC
TTTAGTGAACCGCATCGAGCTGAAAGGGATCGATTTTAAAGAAGATGGGAATAT
CCTGGGACACAAACTTGAATACAACTTTAATAGTCATGACGTCTATATCACGGCG
GACAAACAGGAAAACGGAATTAAGGCAGAATTTGAGATTCGGCATAATGTCGAA
GATGGCTCGGTACAGTTGGCTGATCACTATCAGCAGAATACGCCGATTGGAGAT
GGTCCGGTTTTATTACCAGACGATCACTATCTGTCCACCGAATCCGCCCTGAGCA
AAGATCCGAATGAAGACCGGGACCATATGGTTCTGCTGGAATTTGTTACGGCGG
CTGGTATTGACCATGGCATGGATGAGCTGTATAAGTAG (SEQ ID NO: 8)
GFP-NEG29<formula>formula see original document page 22</formula><formula>formula see original document page 23</formula>已使用本发明系统产生了链霉亲和素变异体。已显示这些变异体形成结合生物素的 可溶性四聚体。这一野生型链霉亲和素的氨基酸序列如下
AAEAGITGTWYNQLGSTFIVTAGADGALTGTYESAVGNAESRYVLTGRYDSAPATD GSGTALGWTVAWKNNYRNAHSATTWSGQYVGGAEARrNTGWIXTSGTTEANAWK STLVGHDTFTKVKPSAAS (SEQ ID NO: XX)
野生型链霉亲和素的理论净电荷为-4。使用本发明系统已产生理论净电荷为-40禾口 +52的变异体。即使加热变异体到IOO'C后,蛋白质仍可溶。 已产生的链霉亲和素变异体的氨基酸序列包括 SAV-NEG40
MGHHHHHHGGAEAG汀GTWYNQLGSTFIVTAGADGALTGTYESAVGDAESEYVLT GRYDSAPATDGSGTALGWTVAWKNDYENAHSATTWSGQYVGGAEARINTQWLLT SGTTEADAWKSTLVGHDTFTKVEPSAAS (SEQ ID NO: XX)
SAV-POS52
MGHHHHHHGGAKAGITGTWYNQLGSTFIVTAGAKGALTGTYESAVGNAKSRYVLT GRYDSAPATKGSGTALGWTVAWKNKYRNAHSATTWSGQYVGGAKARINTQWLLT SGTTKAKAWKSTLVGHDTFTKVKPSAAS (SEQ ID NO: XX)
所属领域的技术人员应了解,同源蛋白质同样视为在本发明范围内。举例来说,任 何包括一段20、 30、 40、 50或100个氨基酸与任何上述序列60%、 70%、 80%、 90%、 95%或100%同源的蛋白质视为本发明的一部分。另外,本发明还涵盖添加和缺失变异体。 在某些实施例中,具有如任何上述序列中所示的突变残基的任何链霉亲和素视为本发明 的一部分。在某些实施例中,序列包括2、 3、 4、 5、 6、 7、 8、 9、 10个或10个以上如 任何以上序列中所示的突变。
编码上述链霉亲和素变异体的任何DNA序列也包括在本发明范围内。编码上述各 变异体的示范性DNA序列如下
SAV-NEG40
TTTAGGTTGGACCGTAGCGTGGAAGAATGATTATGAAAACGCACATAGCGCAAC AACGTGGTCAGGGCAGTACGTTGGCGGAGCTGAGGCGCGCATTAACACGCAGTG GTTATTAACTAGCGGCACCACTGAAGCTGATGCCTGGAAGAGCACGTTAGTGGG TCATGATACCTTCACTAAAGTGGAACCTTCAGCTGCGTCATAATAATGACTCGAG ACCTGCA (SEQK)NO: XX)
SAV-POS52
G P
c c
A c
c T
c c
A G
c G
c A
d订
c G
A A
S c
T c
A A
c A
G T
G G
丁 G
A T
c c
c c
A T
H c
G c
G A
G A
A G
T c
G G
T G
c a
y c
M G
w G
T G
c K
c 5
G G
G c
c T
c G
c A
G T
G G
c c
A: AGGTTCAGCCATGGGTCATCACCACCACCATCACGGTGGCGCCAAAGCAGGTATT ACCGGTACCTGG丁ATAACCAGTTAGGCTCAACCTTTATTGTGACCGCGGGAGCGA
ACGTATTAACCGGTCGTTATGATAGCGCGCCGGCGACTAAAGGTAGCGGTACTG
CTTTAGGTTGGACCGTAGCGTGGAAGAATAAGTATCGTAATGCGCACAGTGCTAC
CACTTGGTCAGGGCAGTACGTAGGGGGAGCCAAAGCACGTATCAACACGCAGTG
GTTATTAACATCAGGTACCACCAAAGCGAAAGCCTGGAAGAGCACGTTAGTGGG TCATGATACCTTCACTAAAGTGAAACCTTCAGCTGCGTCATAATAATGACTCGAG ACCTGCA (SEQIDNO: XX)
与上述序列同源的多核苷酸序列也在本发明范围内。在某些实施例中,多核苷酸序 列包括与任何一个上述序列60%、 70%、 80%、 90%、 95%、 98%、 99%或100%同源的 一段50、 100或150个核苷酸。本发明也包括一个上述序列中插入或缺失一个或一个以 上核苷酸的序列。任何具有任何上述序列中所示的突变的多核苷酸序列都视为本发明的 一部分。在某些实施例中,序列包括2、 3、 4、 5、 6、 7、 8、 9、 10个或10个以上如任 何以上序列中所示的突变。
本发明也提供包含使用本发明系统修饰的本文中的f壬何本发明序列或任何其它序 列(DNA或蛋白质)的载体(例如,质体、粘粒、病毒等)。在某些实施例中,载体包 括适用于在细胞'l'过度表达本发明链霉亲和素变异体的元件(诸如启动子、增强子、核 糖体结合位点等)序列。本发明也包括包含本发明序列或载体的细胞。在某些实施例中, 细胞过度表达变异链霉亲和素。细胞可为细菌细胞(例如,大肠杆菌)、真菌细胞(例 如,巴斯德毕赤酵母)、酵母细胞(例如,酿酒酵母)、哺乳动物细胞(例如,CHO细胞) 或人类细胞。
已使用本发明系统产生了谷胱甘肽-S-转移酶(glutathione-S-transferase, GST)的变
异体。已显示这些变异体保留野生型GST的催化活性。这一野生型GST的氨基酸序列 如下
MGHHHH冊GGPPYTITYFPVRGRCEAMRMLLADQDQSWKEEVVTMETWPPLKPSC LFRQLPKFQDGDLTLYQS函LRHLGRSFGLYGKDQKEAALVDMVNDGVEDLRCKY ATLIYTNYEAGKEKYVKELPEHLKPFETLLSQNQGGQAFWGSQISFADYNLLDLLRI HQVLNPSCLDAFPLLSAYVARLSARPKIKAFLASPEHVNRPINGNGKQ (SEQ ID NO: XX)
野生型GST的理论净电荷为+2。使用本发明系统已产生理论净电荷为-40的变异体。 这一变异体催化谷胱甘肽添加至二硝基氯苯,其比活性仅为野生型GST的1/2.7。即使 加热变异体到IO(TC后,蛋白质仍可溶,并且经冷却时蛋白质恢复其40%的催化活性。
GST变异体的氨基酸序列包括
GST-NEG40MGHHHHHHGGPPYTITYFPVRGRCEAMRMLLADQDQSWEEEVVTMETWPPLKPSC LFRQLPKFQDGDLTLYQS函LRHLGRSFGLYGEDEEEAALVDMVNDGVEDLRCKY ATLIYTDYEAGKEEYVEELPEHLKPFETLLSENEGGEAFVVGSEISFADYNLLDLLRIH QVLNPSCLDAFPLLSAYVARLSARPE正AFLASPEHVDRPINGNGKQ (SEQ IDNO: XX)
GST-POS50
MGHHHHHHGGPPYTITYFPVRGRCEAMRMLLADQKQSWKEEVVTMKTWPPLKPSC LFRQLPKFQDGKLTLYQS函LRHLGRSFGLYGKKQKEAALV而VNDGVEDLRCKY ATUYTKYKAGKKKYVKKLPKHLKPFETLLSKNKGGKAFVVGSKISFADYNLLDLLR IHQVLNPSCLKAFPLLSAYVARLSARPKIKAFLASPEHVKRPINGNGKQ (SEQ ID NO: XX)
所属领域的技术人员应了解,同源蛋白质同样视为在本发明范围内。举例来说,任 何包括一段20、 30、 40、 50或IOO个氨基酸与任何上述序列60%、 70%、 80%、 90%、 95%或100%同源的蛋白质视为本发明的一部分。另外,本发明还涵盖添加和缺失变异体。 在某些实施例中,具有如任何上述序列中所示的突变残基的任何链霉亲和素视为本发明 的一部分。在某些实施例中,序列包括2、 3、 4、 5、 6、 7、 8、 9、 10个或10个以上如 任何以上序列中所示的突变。
编码上述GST变异体的任何DNA序列也包括在本发明范围内。编码上述各变异体 的示范性DNA序列如下
GST-NEG40
ACCAGTCTAACGCGATCTTACGTCATTTAGGTCGCTCATTTGGTTTATACGGTGA AGATGAAGAAGAAGCAGCCTTAGTGGATATGGTGAATGATGGCGTGGAAGACTT ACGTTGTAAATACGCGACGTTAATTTACACTGATTATGAAGCCGGTAAAGAGGA GTACGTGGAAGAATTACCTGAACACCTGAAGCCGTTTGAAACATTACTGAGCGA
GCTTTCTTAGCGTCACCTGAACACGTAGACCGCCCGATTAACGGAAACGGCAAG CAGTAATAATGAGGTACCACCTGCA (SEQ ID NO: XX)
GST-POS50
c c
A
G
P A
c
T
c T
孤w
2 G
G a
G K
乂 G
t" G
A订
y c
b G
G
t G
1 c
G
T T
G c
G C
c t
A:
G
A t
S c
G t
A: r
K G
T
Ac G
c A
G c
G G
26GGTTCAGCCATGGGTCATCACCACCACCATCACGGTGGCCCGCCGTACACCATTA
CATACTTTCCGGTACGTGGTCGTTGTGAAGCGATGCGTATGTTATTAGCGGACCA
GAAACAATCATGGAAAGAAGAAGTAGTGACAATGAAGACCTGGCCGCCGTTAAA
GCCTAGCTGTTTATTCCGTCAATTACCGAAGTTTCAGGATGGTAAATTAACCTTAT
ACCAGTCTAACGCGATCTTACGTCATTTAGGTCGCTCATTTGGTTTATACGGTAA
GAAGCAGAAAGAAGCAGCCTTAGTGGATATGGTGAATGATGGCGTGGAAGACTT
ACGTTGTAAATACGCGACGTTAATTTACACTAAATATAAAGCCGGTAAAAAGAA
GTACGTGAAAAAATTACCTAAACACCTGAAGCCGTTTGAAACATTACTGAGCAA
AAATAAAGGAGGTAAGGCGTTCGTAGTTGGTAGCAAGATTAGCTTCGCTGATTA丁
TTTCCCGTTACTGAGCGCATATGTAGCGCGCCTGAGCGCCCGTCCGAAGATCAAA GCTTTCTTAGCGTCACCTGAACACGTGAAGCGCCCGATTAACGGAAACGGCAAG CAGTAATAATGAGGTACCACCTGCA (SEQ ID NO: XX)
本发明也提供包含使用本发明系统修饰的本文中的任何本发明序列或任何其它序 列(DNA或蛋白质)的载体(例如,质体、粘粒、病毒等)。在某些实施例中,载体包 括适用于在细胞中过度表达本发明GST变异体的元件(诸如启动子、增强子、核糖体结 合位点等)序列。本发明也包括包含本发明序列或载体的细胞。在某些实施例中,细胞 过度表达变异GST。细胞可为细菌细胞(例如,大肠杆菌)、真菌细胞(例如,巴斯德 毕赤酵母)、酵母细胞(例如,酿酒酵母)、哺乳动物细胞(例如,CHO细胞)或人类细 胞。
本发明也包括用于修饰所关注蛋白质以产生更稳定的蛋白质变异体的试剂盒。这些 试剂盒通常包括产生蛋白质的更稳定变异体所需的所有或大部分试剂。在某些实施例 中,试剂盒包括辅助研究员基于本发明方法设计更稳定变异蛋白质的计算机软件。试剂 盒还可包括以下所有或部分试剂、引物、寡核苷酸、核苷酸、酶、缓冲液、细胞、培 养基、培养板、试管、说明书、载体等。使用本试剂盒的研究通常提供用于突变以产生 更稳定变异体的DNA序列。通常包装这些内含物以便于在实验室中使用。
在考虑下文实例部分后,将会进一步了解本发明的这些和其它方面,这些实例旨在 说明本发明的某些特定实施例,但不打算限制如权利要求书所定义的本发明的范围。
实例
实例1-使蛋白质超带电可赋予极大的恢复力(Resilience)
蛋白质聚集,是人类疾病一个众所周知的原因(考汉(Cohen,F.E.);凯莉(Kelly, J.W.),自然(淑匿)2003, 426, (6968), 905-9;池蒂(Chiti,F.);多伯森(Dobson, C. M),生物化学年鉴U"朋7 ev fl!'oc/ eAnJ 2006,75,333-66;各自以引用的方式并入本 文中),也是使用蛋白质作为治疗或诊断剂所面临的主要问题(福罗克杰(Frokjaer,S.); 奥特珍(Otzen, D. E.),自然.评论药物发现(Waf 7 ev Z)rwg D"cov) 2005, 4, (4), 298-306; 法沃勒(Fowler, S. B.);普恩(Poon, S.);墨佛(Muff, R.);池蒂(Chiti, F,);多伯
27森(Dobson, C. M.);佐多(Zurdo,J.),美国国家科学院院刊(尸rac Waf/Acad Sd f/SA) 2005,102,(29), 10105-10;各自以引用的方式并入本文中)。已经从对天然蛋白质的研究 中获得对蛋白质聚集问题的了解。我们已经知道,蛋白质在携带零净电荷的等电点时可 溶性最小(李伯(Loeb,J.),普通生理学杂志(JGe"/^;^!'o/) 1921,4,547-555,以引 用的方式并入本文中)。新近,已显示净电荷的微小差异(±3电荷单位)可以预测球状 蛋白变异体间(池蒂(Chiti,F.);斯泰法尼(Stefani,M);泰戴(Taddei,N.);雷姆普 尼(Ramponi,G.);多伯森(Dobson, C. M.),自然2003, 424, (6950), 805-8, 以引用的方式并入本文中)以及固有无序肽间(帕瓦(Pawar,A.P.);督拜(Dubay, K. F.); 佐多(Zurdo, J.);池蒂(Chiti, F.);文德斯可罗(Vendruscolo, M.);多伯森(Dobson, C. M),分子生物学杂志(/Mo/别oZ) 2005, 350, (2), 379-92,以引用的方式并入本文 中)的聚集倾向。这些观察结果连同一些蛋白质可忍受净电荷显著变化的最近证据(例 如,发现碳酸酐酶在其表面赖氨酸彻底化学乙酰化后保留催化活性(古迪克森(Gudiksen) 等人,美国化学会志(/A n C7zew Soc) 2005, 127, (13), 4707-14,以引用的方式并入本 文中)) 一起,使我们推断通过使表面大范围突变以显著增加净电荷(我们在本文中称 之为"超带电"的过程)可能会明显增强一些蛋白质的溶解性和抗聚集性而不消除其折 叠或功能。
我们以最近报导的在折叠效率和变性剂抗性方面已高度优化的绿色荧光蛋白(GFP) 的现有技术变异体(称为"超折叠GFP" (sfGFP))(派德拉克(Pedelacq)等人,国家 生物技术(Waffiz'ofec/mo/) 2006, 24, (1), 79-88,以引用的方式并入本文中)开始。超 折叠GFP的净电荷为-7,与野生型GFP类似。根据计算氨基酸的溶剂暴露的简单算法 (参见"#奔*方法"部分),我们通过使29个最溶剂暴露的(most solvent-exposed)残 基突变为带正电的氨基酸而设计出理论净电荷为+36的GFP超带电变异体(图1)。编码 sfGFP或GFP(+36)的基因的表达浓密地产生绿色荧光菌。蛋白质纯化后,测量GFP(+36) 的荧光性质并且发现与sfGFP的荧光性质非常类似。受这一发现鼓励,我们设计和纯化 了净电荷为+48、 -25以及-30的其它超带电GFP,同样发现全部显示类似sfGFP的荧光 性(图2a)。所有超带电GFP变异体显示类似于sfGFP的圆二色性谱,表明蛋白质具有 类似的二级结构内容(图2b)。超带电GFP变异体虽然存在多达36处突变,但其热力 学稳定性仅比sfGFP稍低(1.0-4.1 kcal/mo1,图2c和表1)。
虽然sfGFP是GFP优化的历史悠久的产物(吉普曼斯(Giepmans)等人,科学 (Sc/ence) 2006, 312, (5771), 217-24;以引用的方式并入本文中),但其仍容易受到热或 化学解折叠诱导而聚集。加热sfGFP到10(TC诱导其定量沉淀和荧光性不可逆丧失(图3a)。相反,超带电GFP(+36)和GFP(-30)当加热到IOO'C时仍可溶,而冷却后恢复明显 的荧光性(图3a)。重要的是,407。2,2,2-三氟乙醇(TFE)在25'C下几分钟内就诱导sfGFP 完全聚集,而+36和-30超带电GFP变异体在相同条件下数小时都未经历明显的聚集或 荧光性丧失(图3b)。
除这一显著的抗聚集性之外,超带电GFP变异体显示对具有相反电荷的高度带电的 大分子具有强大的可逆亲合力(图3c)。当GFP(+36)和GFP(-30)以1:1化学计量混合在 一起时立即形成绿色荧光共沉淀,表明折叠蛋白质缔合。GFP(+36)类似地与高浓度RNA 或DNA共沉淀。添加NaCl足以溶解这些复合物,这一点与其形成的静电基础一致。相 反,sfGFP不受添加GFP (-30)、 RNA或DNA影响(图3c)。
我们接着需要确定超带电原理是否可能适用于除GFP以外的蛋白质,GFP是单体并 且具有屏蔽良好的荧光团。为此目的,我们对两种与GFP无关的蛋白质应用超带电过程。 链霉亲和素是总净电荷为-4的四聚体。使用溶剂暴露算法,我们设计出两种净电荷为-40 或+52的超带电链霉亲和素变异体。两种超带电链霉亲和素变异体都能够形成结合生物 素的可溶性四聚体,但亲和力减小。
使谷胱甘肽-S-转移酶(GST)(总净电荷为+2的二聚体)超带电来产生净电荷为-40 的二聚体,其催化谷胱甘肽至二硝基氯苯的加成,比活性仅为野生型GST的1/2.7 (图 3d)。此外,超带电链霉亲和素和超带电GST在加热到IO(TC时仍可溶,这与其野生型 对应物相反,后者类似于sfGFP发生定量且不可逆的沉淀(表l)。另外,GST(-40)冷却 后恢复其催化活性的40% (图3d)。
总之,我们已经证明可通过简单地用带类似电荷的氨基酸置换大多数溶剂暴露的残 基来使具有不同结构和功能的单体和多聚蛋白质"超带电"。超带电可大大改变蛋白质 的分子间性质,赋予明显的抗聚集性和以折叠形式与带相反电荷的大分子(如"分子维 可牢(molecular Vdcro)")缔合的能力。我们注意到这些不寻常的分子间性质是源于高 净电荷,而不是源于带电氨基酸的总数,带电氨基酸的总数并不因超带电过程明显改变 (表1)。
与这些显著的分子间效应相反,此处研究的7种超带电蛋白质的分子内性质(包括
折叠、荧光性、配体结合以及酶促催化)仍基本上完好。因此,超带电可能是一种降低 聚集倾向和提高蛋白质溶解性而不消除其功能的有效方法。这些原理可能尤其适用于新
颖(&加w)蛋白质的设计工作,其中包括聚集在内的不可预测的蛋白质处理性质仍是 一项重大挑战。根据使天然蛋白质超带电的上述结果,人们不禁推测所设计的蛋白质的 抗聚集性亦可能通过使设计过程偏向于增加带类似电荷的氨基酸在预测位于折叠蛋白
29200780027139.3
质外部的位置上的频率来提高。
蛋白质超带电说明蛋白质表面的显著可塑性并突出源于溶剂暴露残基的突变忍受 性(mutational tolerance)的机会。举例来说,最近显示一些蛋白质的热力学稳定性可通 过合理地工程改造电荷-电荷相互作用来增强(斯曲克勒(Strickler)等人,生物化学 (BZoc/iem"f 7) 2006, 45, (9), 2761-6,以引用的方式并入本文中)。蛋白质超带电证明 这种可塑性如何能以不同的方式加以利用从而赋予极强的蛋白质聚集抗性。我们的发现 与补充研究的结果一致,在补充研究中从泛素去除所有电荷,其折叠性保持完好而其溶 解性明显受损(劳拉兹(Loladze)等人,蛋白质科学(PraW"Sd) 2002, ll,(l), 174-7, 以引用的方式并入本文中)。
这些观察结果也可说明天然蛋白质的适度(modest)净电荷分布(卡耐特(Knight) 等人.,美国同家科学院院刊(尸rac淑Mc。"d脂)2004, 101, (22), 8390-5;吉特林 (Gitlin)等人,德国应用化学杂志C/^m/W五d&ig/) 2006, 45, (19), 3022-60, 各自以引用的方式并入本文中)例如,84%的蛋白质数据库(PDB)多肽的净电荷在土10 范围内。我们的结果与高净电荷产生足够的静电推斥从而迫使解折叠的假设相冲突。的 确,GFP(+48)具有高于目前PDB中的任何多肽的正净电荷,但仍保留折叠和发荧光的 能力。实际上,我们的发现提示非特异性分子间粘附可能不赞成太多高电荷天然蛋白质 的演化。几乎所有具有极高净电荷的天然蛋白质(诸如结合RNA的核糖体蛋白L3(+36) 和L15(+44)或结合钙阳离子的肌集钙蛋白(-80))都与带相反电荷的物质缔合,作为其必 需细胞功能的一部分。
鼎/〃方法
设计程序和超带电的蛋白质序列从公开的结构数据鉴别AvNAPSA < 150 (其中 AvNAPSA是每个侧链原子的平均相邻原子(在10 A范围内))的溶剂暴露残基(以下 以灰色显示)(韦伯(Weber, P.C.),奥兰多夫(Ohlendorf, D.H.),文多罗斯奇(Wendoloski, J丄)以及莎勒麦(Salemme, F.R.),与链霉亲和素结合的高亲和力生物素的结构起因 (Structural origins of high-affinity biotin binding to streptavidin).禾斗学(Sc/ewce) 243, 85-88 (1989);迪尔(Dirr,H.),瑞纳默(Reinemer, P.)以及胡伯(Huber,R.) 2.1 A分 辨率下猪类兀谷胱甘肽S-转移酶(pGST PI-1)的细化晶体结构(Refined crystal structure of porcine class Pi glutathione S-transferase (pGST PI-1) at 2.1 A resolution),分子生物学 杂志(/Mo/腺)243, 72-92 (1994);普德拉克(Pedelacq, J.D.),卡班特斯(Cabantous, S.),曲恩(Tran,T.),特威尔格(Terwilliger, T,C.)以及瓦尔多(Waldo, G.S.) 超折 叠绿色荧光蛋白的工程改造禾口表征(Engineering and characterization of a superfolder
30green fluorescent protein).自然生物技术(A^fli'Wec/i"oD 24,79-88 (2006),各自以弓l 用的方式并入本文中)。突变带电或高极性的溶剂暴露残基(DERKNQ):对于超带负电 (红色),突变为Asp或Glu;或对于超带正电(蓝色),突变为Lys或Arg。绿色荧光蛋 白(GFP)变异体中待突变的其它表面暴露位置根据GFP同源物中这些位置的序列变异 性来选择。链霉亲和素(SAV)和谷胱甘肽-S-转移酶(GST)的超带电设计过程是全自 动的首先通过溶剂暴露分选残基,然后突变最溶剂暴露的带电或高极性残基对于超 带正电,突变为Lys;或对于超带负电,突变为Glu (除非开始残基是Asn,在此状况下 突变为Asp)。
SAV(-40〉 wtSAV SAV(+52)
SAV (-40) LGWTVAW,^llAlSMrWSGQYp與辨INTQWLLTSG象驟,W^ST:LVGHD^瞎灘育操; wtSAV IiGWTVAW^(^lA^SATTWSGQ碌離驗INTQWIjliTSG翁磁lwilsTLV。HDlFl^1^^
wtGST GST(+50)
GST(-40) wtGST GST(+50)
GST(-4 0) wtGST (3ST( + 50)
'、-i"c邻;^ZW'一二^i' @ ^ PS^VS" W
船HHHteHGGPg魂TYFgVRGRCEAMRMLLAD趣SW腿每
75 —
ILRHLO一pJLYG^鹏AALVD醒DGVEDLR彈Y竭ill^^^辟0Y^每:L魏HI^PFE旁L]^g^!^F
1:LRHLGR台,gliYG系D.0《^AAIiVDMVNDGVEr)IiR:^^Y、iilLIi^ ^!^^^:一.!^i:扭I^每HX^PFE^;;LI^&k^ -Q^ ILRHLGRg賴LYG纖線AAIiVDMVWDGVEDIiR^yAtL:i;突I^S^^^Yi^2L^HI^PFE^LL^[g^i^^F
151
W@|gl S FADYNIiliDli!iR工
蛋白质的表达和纯化从DNA2.0购得针对大肠杆菌密码子使用进行优化的合成基 因,克隆入pET表达载体(诺瓦杰公司(Novagen))并在15°C下在大肠杆菌BL21 (DE3) pLysS中过度表达5-10小时。通过离心收集细胞并通过超声波作用溶解。通过Ni-NTA 琼脂糖色谱法(凯杰公司(Qiagen)纯化蛋白质,将缓冲液换成100 mM NaCl、 50 mM 磷酸钾(pH 7.5),并通过超滤(密理博公司(Millipore))浓缩。在天然条件下纯化所 有GFP变异体。从普洛麦格公司(Promega)购买野生型链霉亲和素。在变性条件下纯 化超带电的链霉亲和素变异体并且如先前关于野生型链霉亲和素所报导进行重折叠(赛 姆普森(Thompson)等人.合成链霉亲和素编码基因在大肠杆菌中的构建和表达 (Construction and expression of a synthetic streptavidin-encoding gene in Escherichia coli). 基因(Gwe) 136,243-246 (1993),以引用的方式并入本文中),超带电GST也是如此。在天然或变性条件下纯化野生型GST,得到具有可比活性的蛋白质。
表面静电势计算(图lb): -30和+48超带电GFP变异体的模型是基于超折叠GFP 的晶体结构(普德拉克(Pedelacq)等人,超折叠绿色荧光蛋白的工程改造和表征 (Engineering and characterization of a superfolder green fluorescent protein). 自然生物技 术(A^£!Wec/mo/) 24,79-88 (2006),以引用的方式并入本文中)。使用-25 kT/e (红色) 至+25kT/e(蓝色)的标度,使用APBS (贝克(Baker)等人,纳米系统的静电学对微管 蛋白禾卩核糖体的应用 (Electrostatics of nanosystems: application to microtubules and the ribosome).美国国家科学院院刊(尸r。c Ato/Ac"""'眼)98, 10037-10041 (2001), 以引用的方式并入本文中)计算静电势并用PyMol (德拉诺(Delano, W丄.),PyMOL 分子制图系统(The PyMOL Molecular Graphics System) , www.pvmol.org (2002),以引 用的方式并入本文中)表现。
蛋白质染色和紫外光诱导的荧光性(图2a):在10%变性聚丙烯酰胺凝胶中通过电 泳分析0.2微克的各GFP变异体并用考马斯亮蓝(Coomassie brilliant blue)染料染色。 在0.2 mL艾本德管(Eppendorf tube)中放入0.2微克于具有100 mM NaCl的25 mM Tris (pH8.0)中的相同蛋白质样品并在紫外光(360 nm)下拍照。
热变性和聚集(图3a):将纯GFP变异体在25 mM Tris (pH 8.0)、 100 mM NaCl 以及lOmMe-巯基乙醇(BME)中稀释为2 mg/mL,然后在紫外光照射下拍照("天然")。 加热样品到IO(TC持续1分钟,然后再次在紫外光照射下拍照("煮沸")。最后,在室温 下冷却样品2小时并再次在紫外光照射下拍照("冷却")。
化学诱导的聚集(图3b):添加2,2,2-三氟乙醇(TFE)以产生具有1.5 mg/mL蛋白 质、25 mM Tris (pH7.0)、 10 mM BME以及40% TFE的溶液。在25。C下通过直角光散 射监测聚集。
尺寸排阻色谱法(表l):通过在休珀代克斯75 (S叩erdex 75)凝胶过滤柱上分析 20-50微克蛋白质来确定SAV和GST变异体的多聚状态。缓冲液为100 mM NaCl、50 mM 磷酸钾(pH7.5)。通过与一组在相同条件下单独分析的具有已知分子量的单体蛋白质标 准物作比较确定分子量。
表l:计算的和实验确定的蛋白质性质
名称 MW长度n正n负n带屯Q净pi AG 天然MW(kD)b煮沸后
(kD) (aa) (kcal/mol)a 的可溶
百分率e
GFP(-30)27.8 248 19 4968 -30 4.810.2 n.d. 98<formula>formula see original document page 33</formula>#!/usr/local/bin/perl
林#祐弁并#柳祐羅###弁杯杯謹#弁#弁#####祐祐弁弁,嚇弁,扭祐弁祐#弁謹,謹##弁祐#祐, 弁
# ervnapsa
#
# prints list of AvNAPSA values for the specified PDB
#
# Mike Lawrence/Kevin Phillips 3/17/200S
#歸弁##祐弁弁弁弁并括函弁弁祐弁歸弁祐#弁 梓#弁#封弁##幹祐弁##弁弁,祐弁祐#祐弁弁祐#柳,祐 sub show—usage print "\n",
"Usage : avnapsa <sta:rt_jpdb> [params] \n",
"-3use 3-letter aa abbreviations (default》\n",
"-1 use 1-letter abbreviations\n",
"-onecol print one column only only the AvNAPSA results)\n\n
##弁#弁弁#祐#杯祐弁弁弁弁## global variables扭弁杉#杯##杯#弁##弁祐#弁#祐#弁#杯弁弁#祐存##祐弁#
atoms,'
# fields loaded f:rom PDB:
弁type 祐atOTrtNum 弁atomNanie 弁resName 祐chain 祐r&sNura ft x, y, z
# computed fields
祐neighborCcnmt
distances;
residues,*
祐fields copied from PDB
# re幼um (PDB numbering)
弁rssNaiTis 祐 computed fields
转謹麵弁弁弁弁#祐弁弁坊# ,###弁祐卿接#娜弁并######弁羅弁弁弁弁弁弁#括弁弁函#,飼 #杯parse co脚and line
$onec!ol—f lag = 0;
$start_pdb = $ARGV〖0];
for (my $a = 1〖$a < @ARGV; ++$a)
if ($ARGV$a〕 eq "-1") { $use3orl = 1; }
34elsif ($ARGV$a〗eq "-3") { $use3orl = 3; } elsif ($ARGVI$a] eg "-onecol") { $onecol—flag =1; } else { show—usage () ; die "Invalid argument $ARGV[$aj \nn} } 一
unless {1c $start_pdb =~ /\,pdb/) { show—usage () ,' die "No starting pdb specif ied, ; }
read PDB and compute molecular parameters
read—PDB (祭startjdb〉 / tabulate—residues(); $mres - residues/
compute—distances(); compute—neighbor—counts(》; ccompute—residue—avNapsa ();
print—residues();
# print—residues
祐 —
接
sub print—residues
{ _
for <my $r - 0; $r - residues$r++)
my $name - $residues [$rj {resName};
$natne - toggle31 ($name) if ($use3ofl豕碟1);
printf "Sd %s AvNAPSA ", $residues [$r〗{resNum}, $natne unless $onecol—f lag,'
printf "%.0f\n" ,$:residueB [$r〗{avNapsa};
print "\nNum residues - ", $#residLues+!L, "\n\n" unless $onecol—flag
弁 tabulate—residues 井 一
# goes through list of atoms and makes a list of amino acid residues
祐and stores it in global variable接residues
弁
sub tabulate—residues
{ 一
for =0; $a < atoms; $a++)
$resNutn - $atoms I$a] {resNum); if ( ! resNiim—exists ($resNum))
push residues.resName =:> $atoms I$a) {resName}
扭
# resNum—exists
# —
# returns 1 if resNum is contained in residues
sub resNutn—exists ($)
{ 一
my ($resNum) -您—;
foa: ($r - 0; $r < residues,' $r++)
return 1 if ($residues$r〗(resNum) -= $resWutn),'
return 0/
# resNum—to—resindex 杯 一 —
# converts PDB numbering to index in residues 祐
sub rfesNum_to_jresindex ($) tny ($resNum)=您—;
fo;r - 0; $r c residues,' $r++)
return $r if ($residues〖$r].{res:KuTn} -- $resNum》; return "none";
弁
# readTOB(filename) 扭
# reads the atoms from a Pt)B and returns them as an array of hashes 林
sub read PDB《$)
{ 一
my ($filename)@一,'
open $filename》or die("Cou2d not open $filename\ii"),'
$#atoms - —1; # clear atoms storage
36弁read the file
foreach UPD:B>) {
my $type = triTti《substr($—' 0'6) ); # RTyp field is columns 1-6
next unless ($type eg "ATOM" |j $type eq ,'HETATM");
20
my $resNaine = tr:im<substr<$—, 17, 3〉》; my车atomNa顶e - trim(subBtr($—, 12, 4)〉;
next if uc $resName eg "HOH";
next if uc $atomNatne =— /A
*\,
+\
{resNum} ,* my $resNum2 = $residues [$r2〗{aresNum};
my $min—dlst = 100000D
for 0; $al < @atoms,' —$al)
next unless ( $atoms[$al] {resNuni} c= $resNuna ); for ($a2 >= D; $汰2 <通atoms,' ++$a2)
next unless ( $atoms$a2] {resNum} $:resN"UTn2 )z my $dist - $distances$al] t"2〗,
dist e $dist if ($dist - $Tnin—ciist〉;
retum $min—dist;
弁
# compute—distances
# —
祐 computes the distances between all atoms 祐
sub compute—distances
for (my $atoml=0,' $atom;i < @atoms'' $atotni++)
for(Tny $atom2=$atoml; $atom2 < atoms; $atom2++)my ($xl, $yl, $z;l〉 - ($atoms [$atonaJ ->{x}, $atonis [$atoml] ->{y},$atoms$atoml] ->{z})
ray ($x2, "2, $2;2) -《$atoms [$atotu2〗->{x}, $at。ms [$atom2〗->{y},$atoms [$atom2〕 ->{z})-
my $distance = sgrt(($xl-$x2〉**2 + ($yl-$y2)**2 + ($zl-$22);
$distances$atoml〗[$atom2〗 e $distance〖$distances〖$atotn2] [$atoml〗 》 $distance;
#
對 compute—neighbor—counts
# 一 —
# computes the number of neighbors that each atom has.
衫par汰mter is the cutoff, in Angstroms, for atomic neighborhood
转
sub compute—neighbor__co"unts
5D工STANCE—CUTOFF 10,' 祐criterion for neighborhood, in Angstroms
for ($atom:i=0; $atoml <船tonis; $atotnl++)my $count = 0;
for ($atoxn2-D,' $atom2 < atoms; $Eitotri2++)
$count++ if <$dtistances f$atoral〗〖$atoTn2J$DISTAWCE—CUTOFF$atoml Ik $atom2〉,,
$atoras [$atoml〗{neighborCount} ■ $count;
祐 compute—residue—avNapsa弁 "" 一
# for each residue, compute
# Average Neighbor Atoms Per Sidechain Atom 《AvNAPSA)祐 (sidechain atoms axe all those except N, C, O, CA)
# for glycines, just use CA祐
sub com;pute一residue一avNapsa
for (tny $r = 0; $r < residues; $r+ + )
my $numSideChainAtoms k
my* $totalNeighbors - 0;
my $resName = $resiciues$r] {resName},'
my $resKum = $residues I$r〗{resNutn};
39<formula>formula see original document page 40</formula><formula>formula see original document page 41</formula>
权利要求
1. 一种提高所关注蛋白质的稳定性的方法,所述方法包含以下步骤鉴别所关注蛋白质的表面残基在与所关注的所述蛋白质相关的其它蛋白质中是非高度保守的;和用在生理pH值下带正电的氨基酸残基置换多个非保守表面残基。
2. —种提高所关注蛋白质的稳定性的方法,所述方法包含以下步骤鉴别所关注蛋白质的表面残基在与所关注的所述蛋白质相关的其它蛋白质中是非高度保守的;和用在生理pH值下带负电的氨基酸残基置换多个非保守表面残基。
3. 根据权利要求l或2所述的方法,其中所述非保守表面残基是疏水性的。
4. 根据权利要求1所述的方法,其中所述非保守表面残基是亲水性的或带负电的。
5. 根据权利要求2所述的方法,其中所述非保守表面残基是亲水性的或带正电的。
6. —种提高所关注蛋白质的稳定性的方法,所述方法包含以下步骤鉴别所关注蛋白质的表面残基;鉴别所关注的所述蛋白质的表面残基在与所关注的所述蛋白质相关的其它蛋白质中是非高度保守的;给每一个所述所鉴别的非保守表面残基指定疏水性值;和用在生理pH值下带电的氨基酸残基置换至少一个表面残基,其中所述被置换的 残基全部突变为相同类型的残基,其中所述类型的残基是带正电残基或带负电残 基。
7. 根据权利要求6所述的方法,其中所述置换步骤包含置换至少一个疏水性表面残基。
8. 根据权利要求6所述的方法,其中所述置换步骤包含置换至少一个亲水性表面残 基。
9. 根据权利要求6所述的方法,其中所述置换步骤包含置换至少一个带电表面残基。
10. 根据权利要求6所述的方法,其中所述置换步骤包含用赖氨酸残基置换至少一个表 面残基。
11. 根据权利要求6所述的方法,其中所述置换步骤包含用天冬氨酸或谷氨酸残基置换 至少一个表面残基。
12. 根据权利要求l、 2或6所述的方法,其中所述置换步骤包含置换至少两个表面残
13. 根据权利要求l、 2或6所述的方法,其中所述置换步骤包含置换至少五个表面残 基。
14. 根据权利要求l、 2或6所述的方法,其中所述置换步骤包含置换至少十个表面残 基。
15. 根据权利要求1、 2或6所述的方法,其中所述置换步骤包含置换至少二十个表面 残基。
16. 根据权利要求l、 2或6所述的方法,其中所述置换步骤包含置换至少三十个表面
17. 根据权利要求1、 2或6所述的方法,其中所述方法产生在生理pH值下净电荷比 所关注的初始蛋白质高的修饰蛋白质。
18. 根据权利要求2或6所述的方法,其中所述方法产生在生理pH值下所带负电荷比 所关注的初始蛋白质多的所关注的修饰蛋白质。
19. 根据权利要求2或6所述的方法,其中所述方法产生在生理pH值下所带负电荷比 所关注的初始蛋白质多至少-5的所关注的修饰蛋白质。
20. 根据权利要求2或6所述的方法,其中所述方法产生在生理pH值下所带负电荷比 所关注的初始蛋白质多至少-10的所关注的修饰蛋白质。
21. 根据权利要求2或6所述的方法,其中所述方法产生在生理pH值下所带负电荷比 所关注的初始蛋白质多至少-15的所关注的修饰蛋白质。
22. 根据权利要求2或6所述的方法,其中所述方法产生在生理pH值下所带负电荷比 所关注的初始蛋白质多至少-20的所关注的修饰蛋白质。
23. 根据权利要求1或6所述的方法,其中所述方法产生在生理pH值下所带正电荷比 所关注的初始蛋白质多的所关注的修饰蛋白质。
24. 根据权利要求1或6所述的方法,其中所述方法产生在生理pH值下所带正电荷比 所关注的初始蛋白质多至少+5的所关注的修饰蛋白质。
25. 根据权利要求1或6所述的方法,其中所述方法产生在生理pH值下所带正电荷比 所关注的初始蛋白质多至少+ 10的所关注的修饰蛋白质。
26. 根据权利要求1或6所述的方法,其中所述方法产生在生理pH值下所带正电荷比 所关注的初始蛋白质多至少+ 15的所关注的修饰蛋白质。
27. 根据权利要求1或6所述的方法,其中所述方法产生在生理pH值下所带正电荷比 所关注的初始蛋白质多至少+20的所关注的修饰蛋白质。
28. 根据权利要求1、 2或6所述的方法,其中所述所关注蛋白质是易聚集的蛋白质。
29. 根据权利要求1、 2或6所述的方法,其中所述所关注蛋白质是疏水性蛋白质。
30. 根据权利要求l、 2或6所述的方法,其中所述所关注蛋白质是膜蛋白。
31. 根据权利要求l、 2或6所述的方法,其中所述所关注蛋白质是很难过度表达的蛋 白质。
32. 根据权利要求1、 2或6所述的方法,其中所述所关注蛋白质是很难纯化的蛋白质。
33. 根据权利要求l、 2或6所述的方法,其中所述所关注蛋白质是受体。
34. 根据权利要求l、 2或6所述的方法,其中所述所关注蛋白质是转录肉子。
35. 根据权利要求l、 2或6所述的方法,其中所述所关注蛋白质是酶。
36. 根据权利要求l、 2或6所述的方法,其中所述所关注蛋白质是结构蛋白。
37. 根据权利要求l、 2或6所述的方法,其中所述所关注蛋白质是荧光蛋白。
38. 根据权利要求1、2或6所述的方法,其中所述所关注蛋白质是绿色荧光蛋白(GFP)。
39. 根据权利要求l、 2或6所述的方法,其中所述所关注蛋白质是细胞外蛋白。
40. 根据权利要求l、 2或6所述的方法,其中所述所关注蛋白质是链霉亲和素。
41. 根据权利要求1、2或6所述的方法,其中所述所关注蛋白质是谷胱甘肽-S-转移酶。
42. 根据权利要求l、 2或6所述的方法,其中所述鉴别所述表面残基的步骤包含计算 机模拟所述蛋白质的三维结构。
43. 根据权利要求l、 2或6所述的方法,其中所述鉴别所述表面残基的步骤包含使用 算法预测残基是否可见于蛋白质的表面。
44. 根据权利要求l、 2或6所述的方法,其中所述鉴别所述表面残基的步骤包含鉴别 AvNAPSA值小于阈值的残基。
45. 根据权利要求1、 2或6所述的方法,其中所述鉴别所述非高度保守的表面残基的 步骤包含比对所述蛋白质的氨基酸序列与来自同一蛋白质家族的至少--个其它蛋 白质。
46. 根据权利要求1、 2或6所述的方法,其中所述鉴别所述非高度保守的表面残基的 步骤包含比对所述蛋白质的氨基酸序列与来自不同物种的所述蛋白质的至少一个 其它氨基酸序列。
47. 根据权利要求45或46所述的方法,其中所述比对以至少两个其它蛋白质序列进行。
48. 根据权利要求45或46所述的方法,其中所述比对以至少三个其它蛋白质序列进行。
49. 根据权利要求45或46所述的方法,其中所述比对以至少五个其它蛋白质序列进行。
50. 根据权利要求6所述的方法,其中所述指定疏水性值的步骤包含使用辛醇/水分配系数值。
51. 根据权利要求l、 2或6所述的方法,其中所述置换步骤包含诱变所述蛋白质的序 列以用在生理pH值下带电的天然氨基酸残基置换所述鉴别的疏水性表面残基。
52. 根据权利要求51所述的方法,其中所述天然氨基酸残基选自由赖氨酸、谷氨酸、 天冬氨酸、组氨酸以及精氨酸组成的群组。
53. 根据权利要求51所述的方法,其中所述天然氨基酸残基选自由赖氨酸、组氨酸以 及精氨酸组成的群组。
54. 根据权利要求51所述的方法,其中所述天然氨基酸残基是赖氨酸。
55. 根据权利要求51所述的方法,其中所述天然氨基酸残基选自由谷氨酸和天冬氨酸 组成的群组。
56. 根据权利要求1、 2或6所述的方法,其中所述置换步骤包含定点诱变所述鉴别的 表而残基。
57. 根据权利要求1、 2或6所述的方法,其中所述置换步骤包含PCR诱变所述鉴别的 表面残基。
58. —种绿色荧光蛋白(+36GFP),其具有以下氨基酸序列:MG冊朋冊GGASKGERLFRGKVPILVELKGDVNG服FSVRGKGKGDATOGKLTLK FICTTGKLPVPWPTLVTTLTYGVQCFSRYPKHMKRHDFFKSAMPKGYVQERTISFKK DGKYKTRAEVKFEGRTLVNRIKLKGRDFKEKGNILGHKLRYNFNSHKVYITADKRK NGIKAKFKIRHNVKDGSVQLADHYQQNTP1GRGPVLLPRNHYLSTRSKLSKDPKEKR DHMVLLEFVTAAGIKHGRDERYK.
59. —种多核苷酸,其编码根据权利要求58所述的绿色荧光蛋白。
60. 根据权利要求59所述的多核苷酸,其具有以下序列ATGGGGCATCATCATCATCACCACGGCGGGGCGTCTAAGGGAGAGCGCTTGTTTC GCGGCAAAGTCCCGATTCTTGTGGAGCTCAAAGGTGATGTAAATGGTCATAAATT TAGTGTGCGCGGGAAAGGGAAAGGAGATGCTACGCGGGGCAAGCTCACCCTGAACTGACGTACGGTGTTCAGTGCTTTTCTCGCTATCCCAAACACATGAAACGCCATGCCTGGTCAACCGCATTAAACTGAAAGGTCGTGACTTCAAAGAGAAAGGTAATAT TCTTGGTCACAAACTGCGCTATAATTTCAACTCTCACAAAGTTTATATTACGGCGGGTCCAGTGCTGCTGCCGCGTAACCATTATCTGTCGACCCGCAGCAAACTCAGCA CAGGCATTAAACATGGCCGCGATGAACGTTACAAATAG.
61. —种绿色荧光蛋白(+49GFP),其具有以下氨基酸序列MG朋HHHHGGRSKGKRLFRGKVPILVKLKGDVNGHKFSVRGKGKGDATRGKLTLKFICTTGKLPVPWPTLVTILTYGVQCFSRYPKHMKRHDFFKSAMPKGYVQERTISFKKDGKYKTRAEVKFKGRTLVNR1KLKGRDFKEKGNILGHKLRYNFNSHKVYITADKRKNGKAKFKIRHNVKDGSVQLAKHYQQNTPIGRGPVLLPRKHYLSTRSKLSKDPKEKRDHMVLKEFVTAAG腿GRKERYK.
62. —种多核苷酸,其编码根据权利要求61所述的绿色荧光蛋白。
63. 根据权利要求62所述的多核苷酸,其具有以下序列TTAACCTATGGTGTTCAATGCTTCTCACGTTATCCGAAGCATATGAAACGTCATGATTTTTTCAAATCGGCTATGCCGAAAGGTTACGTCCAGGAGCGCACCATCTCATTTAAGAAAGACGGTAAGTATAAAACCCGTGCTGAAGTAAAATTCAAAGGACGCACCCTGGTGAATCGCATTAAACTGAAAGGTCGTGATTTCAAAGAAAAGGGAAATATTTTAGGGCATAAGCTCCGTTATAATTTTAACAGTCATAAGGTGTATATTACCGCTGATAAACGCAAAAACGGAATCAAAGCGAAATTTAAGATCCGTCATAATGTAAAAGGTCCTGTGCTTCTGCCGCGTAAACACTACTTGTCGACCCGGTCAAAATTGAGTA AAGATCCGAAGGAAAAGCGTGATCACATGGTCTTGAAGGAATTTGTAACTGCAG CAGGTATTAAACACGGGCGCAAAGAACGTTACAAATAG.
64. —种绿色荧光蛋白(-29GFP),其具有以下氨基酸序列MGHHH朋恥GASKGEELFDGEVPILVELDGDVNGHEFSVRGEGEGDATEGELTLKF1CTTGELPVPWPTLVTTLTYGVQCFSRYPDHMDQHDFFKSAMPEGYVQERT1SFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKXEYNFNSHDVY1TADKQENGIKAEFEIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDDHYLSTESALSKDPNEDRDHMVLLEFVTAAGIDHGMDELYK.
65. —种多核苷酸,其编码根据权利要求64所述的绿色荧光蛋白。
66. 根据权利要求65所述的多核苷酸,其具有以下序列ATGGTGAAGTGCCGATCCTGGTGGAGCTTGATGGCGATGTTAACGGCCATGAATTTTCTGTCCGCGGTGAAGGGGAGGGTGATGCCACGGAAGGGGAGCTGACACTTAAATTTATTTGCACCACCGGTGAACTCCCGGTCCCGTGGCCGACCCTGGTGACCACCCTGACCTACGGCGTTCAATGCTTTTCACGTTATCCGGATCACATGGACCAACACGACTTCTTTAAAAGCGCGATGCCTGAAGGCTATGTTCAAGAACGTACAATTAGTTTTAAAGATGACGGCACCTACAAGACCCGTGCGGAAGTAAAATTTGAAGGGGACACTTTAGTGAACCGCATCGAGCTGAAAGGGATCGATTTTAAAGAAGATGGGAATATGGTCCGGTTTTATTACCAGACGATCACTATCTGTCCACCGAATCCGCCCTGAGCA AAGATCCGAATGAAGACCGGGACCATATGGTTCTGCTGGAATTTGTTACGGCGG CTGGTATTGACCATGGCATGGATGAGCTGTATAAGTAG.
67. —种链霉亲和素(-40SAV),其具有以下氨基酸序列MGHHHHHHGGAEAGITGTWYNQLGSTFIVTAGADGALTGTYESAVGDAESEYVLT GRYDSAPATDGSGTALGWTVAWKNDYENAHSATTWSGQYVGGAEARINTQWLLT SGTTEADAWKSTLVGHDTFTKVEPSAAS.
68. —种多核苷酸,其编码根据权利要求67所述的链霉亲和素。
69. 根据权利要求68所述的多核苷酸,其具有以下序列ACGGCGCCTTAACCGGTACCTACGAATCAGCTGTAGGTGACGCGGAATCAGAGT ACGTATTAACCGGTCGTTATGATAGCGCGCCGGCGACTGACGGTAGCGGTACTGC TTTAGGTTGGACCGTAGCGTGGAAGAATGATTATGAAAACGCACATAGCGCAAC AACGTGGTCAGGGCAGTACGTTGGCGGAGCTGAGGCGCGCATTAACACGCAGTGACCTGCA.
70. —种链霉亲和素(+52SAV),其具有以下氨基酸序列MG冊H朋HGGAKAGITGTWYNQLGSTFIVTAGAKGALTGTYESAVGNAKSRYVLT GRYDSAPATKGSGTALGWTVAWKNKYRNAHSATTWSGQYVGGAKARINTQWLLT SGTTKAKAWKSTLVGHDTFTKVKPSAAS.
71. —种多核苷酸,其编码根据权利要求70所述的链霉亲和素。
72. 根据权利要求71所述的多核苷酸,其具有以下序列-GGTTCAGCCATGGGTCATCACCACCACCATCACGGTGGCGCCAAAGCAGGTATTACCGGTACCTGGTATAACCAGTTAGGCTCAACCTTTATTGTGACCGCGGGAGCGAAAGGCGCCTTAACCGGTACCTACGAATCAGCTGTAGGAAACGCAAAATCACGCTCACTTGGTCAGGGCAGTACGTAGGGGGAGCCAAAGCACGTATCAACACGCAGTG GTTATTAACATCAGGTACCACCAAAGCGAAAGCCTGGAAGAGCACGTTAGTGGG TCATGATACCTTCACTAAAGTGAAACCTTCAGCTGCGTCATAATAATGACTCGAG ACCTGCA.
73. —种谷胱甘肽-S-转移酶(-40GST),其具有以下氨基酸序列:MGHH冊HHGGPPYTITYFPVRGRCEAMRMLLADQDQSWEBEVVTMETWPPLKPSC LFRQLPKFQDGDLTLYQSNAILRHLGRSFGLYGEDEEEAALVDMVNDGVEDLRCKY ATLIYTDYEAGKEEYVEELPEHLKPFETLLSENEGGEAFWGSESFADYNLLDIXRm QVLNPSCLDAFPLLSAYVARLSARPEIEAFLASPEHVDRPINGNGJCQ.
74. —种多核苷酸,其编码根据权利要求73所述的链霉亲和素。
75. 根据权利要求74所述的多核苷酸,其具有以下序列CATACTTTCCGGTACGTGGTCGTTGTGAAGCGATGCGTATGTTATTAGCGGACCAGGACCAATCATGGGAAGAAGAAGTAGTGACAATGGAAACCTGGCCGCCGTTAAAGCCTAGCTGTTTATTCCGTCAATTACCGAAGTTTCAGGATGGTGATTTAACCTTATACCAGTCTAACGCGATCTTACGTCATTTAGGTCGCTCATTTGGTTTATACGGTGAAGATGAAGAAGAAGCAGCCTTAGTGGATATGGTGAATGATGGCGTGGAAGACTTACGTTGTAAATACGCGACGTTAATTTACACTGATTATGAAGCCGGTAAAGAGGAGTACGTGGAAGAATTACCTGAACACCTGAAGCCGTTTGAAACATTACTGAGCGAAAATGAAGGAGGTGAGGCGTTCGTAGTTGGTAGCGAAATTAGCTTCGCTGATTATAACTTATTAGACTTATTACGCATTCACCAGGTTTTAAATCCTAGCTGTTTAGACGCTTTCCCGTTACTGAGCGCATATGTAGCGCGCCTGAGCGCCCGTCCGGAAATTGAAGCTTTCTTAGCGTCACCTGAACACGTAGACCGCCCGATTAACGGAAACGGCAAGCAGTA ATA ATGAGGT ACC ACCTGC A.
76. —种蛋白质,其由根据权利要求1-57中任一权利要求所述的方法修饰。
77. —种多核苷酸,其编码根据权利要求76所述的蛋白质。
78. —种试剂盒,其用于进行根据权利要求1-57中任一权利要求所述的方法。
全文摘要
聚集是蛋白质不良表现的主要原因。本发明提供一种修饰蛋白质以产生更稳定的变异体的系统。所述方法包括鉴别蛋白质表面上适合于突变为更亲水的残基(例如,带电氨基酸)的非保守疏水性氨基酸残基。可改变表面上任何数目的残基来产生更可溶、抗聚集、重折叠能力更高和/或在多种条件下更稳定的变异体。本发明还提供本发明技术所产生的理论净电荷增加的GFP、链霉亲和素以及GST变异体。还提供用于对任何所关注蛋白质进行所述修饰的试剂盒。
文档编号G01N33/50GK101490548SQ200780027139
公开日2009年7月22日 申请日期2007年6月1日 优先权日2006年6月2日
发明者凯文·约翰·菲利普斯, 大卫·R·刘, 迈克尔·S·劳伦斯 申请人:哈佛大学校长及研究员协会