专利名称:氨酰基-tRNA合成酶的组合物及其用途的制作方法
技术领域:
本发明属于转译生物化学领域。本发明涉及用于生产氨酰基-tRNA合成酶的组合 物的方法和氨酰基-tRNA合成酶的组合物及其用途。本发明也涉及使用所述氨酰基-tRNA合成酶和相关组合物在细胞中生产蛋白质的方法。
背景技术:
从细菌到人类的每种已知生物体的遗传密码编码相同的20种常见氨基酸。相同的20种天然氨基酸的不同组合形成蛋白质,所述蛋白质实际上执行从光合作用到信号转导和免疫反应的生命的所有复杂过程。为了研究和修饰蛋白质结构和功能,科学家已尝试操纵蛋白质的遗传密码和氨基酸序列。然而,仍难以除去由遗传密码施加的约束,其使蛋白质受限于20种遗传编码的标准构造单元(building block)(硒代半胱氨酸(参见(例如)A. Bock 等人,(1991) , Molecular Microbiology 5:515-20)和卩比咯赖氨酸(参见(例如)G. Srinivasan 等人,(2002). Science 296:1459-62)为少有的例外)。对于除去所述约束已经取得了一些进展,尽管所述进展是有限的并且合理地控制蛋白质结构和功能的能力仍处于其初期。举例而言,化学工作者已开发出合成和操纵小分子结构的方法和策略(参见(例如)E. J. Corey和X. -M. Cheng, The Logic ofChemical Synthesis (ffiIey~Interscience. New York, 1995))。全合成(参见(例如)B. Merrifield, (1986), Science232:341-7 (1986))和半合成方法(参见(例如)D. Y. Jackson 等人,(1994) Science266:243-7 ;和 P. E. Dawson 和 S. B. Kent, (2000), Annual Review ofBiochemistry69:923-60),已使合成肽和小蛋白质成为可能,但是所述方法对超过10千道尔顿(kDa)的蛋白质来说,具有有限的实用性。虽然突变方法是有效的,但是其受限于有限数量的结构变化。在许多情况下,已经有可能在整个蛋白质中竞争性地并入常见氨基酸的封闭结构类似物。参见(例如),R. Furter, (1998), Protein Science 7:419-26 ;K. Kirshenbaum 等人,(2002), ChemBioChem 3:235-7 :和 V. Doring 等人,(2001), Science292:501-4。化学肽连接和天然化学连接描述于美国专利第6,184,344号、美国专利公开案第 2004/0138412 号、美国专利公开案第 2003/0208046 号、WO 02/098902 和 WO 03/042235中,所述专利是以引用的方式并入本文中。Lu等人在Mol Cell. 2001年10月;8(4) :759-69中描述了一种方法,其中蛋白质与含有非天然氨基酸的合成肽化学连接(经表达蛋白质连接)。早期的工作证明大肠杆菌(E. coli)的转译机器将容纳结构上与常见20种氨基酸相似的氨基酸。参见,Hortin, G.和 Boime, I. (1983)Methods Enzymol. 96:777-784。所述工作另外通过放宽内源性大肠杆菌合成酶的特异性,以便其活化非天然氨基酸以及其同源天然氨基酸而扩展。此外,展示了编辑域中的突变也可用以扩展内源性合成酶的底物范畴。参见,Doring,V.等人,(2001) Science 292:501-504。然而,所述策略都受限于重新编码遗传密码而不是扩展遗传密码,并且导致常见20种氨基酸中之一者经非天然氨基酸不同程度地取代。新近,展示了非天然氨基酸可通过将经化学氨基酰化的正交琥珀抑制基因tRNA添加到活体外转录/转译反应中,而得以 在活体外部位特异性地并入蛋白质中。参见(例如),Noren, C. J.等人,(1989) Science 244:182-188; Bain, J. D.等人,(1989) T. Am.Chem. Soc. 111: 8013-8014 Dougherty, D. A. (2000) Curr. Opin. Chem. Biol. 4, 645-652 Cornish, V. ff.等人,(1995) Angew. Chem. , Int. Ed. 34:621-633 T. A. Ellman 等人,(1992), Science255:197-200 ;和 D. Mendel 等人,(1995), Annual Review of Biophysicsand Biomolecular Structure 24:435-462。所述研究展不,核糖体和转译因子可与大量非天然氨基酸,甚至是具有异常结构的所述非天然氨基酸相容。不幸地,tRNA的化学氨基酰化是困难的,并且所述工艺的化学计量性质严重地限制可产生的蛋白质的量。已经将非天然氨基酸微量注射到细胞中。举例而言,非天然氨基酸通过微量注射经化学错误酰化的嗜热四膜虫(Tetrahymena thermophila) tRNA (例如,M. E. Saks等人,(1996), An engineered Tetrahymena tRNA Gln for in vivo incorporationof unnatural amino acids into proteins by nonsense suppression,J.Biol.Chem. 271:23169-23175)和相关mRNA而引入爪蟾卵母细胞(Xenopus oocyte)中的烟碱酸乙酸胆喊受体中(例如,M. W. Nowak 等人,(1998), In vivo incorporation of unnaturalamino acids into ion channels in Xenopus oocyte expression system. MethodEnzymoI. 293:504-529)。又参见,D.A. Dougherty(2000),Unnatural amino acids asprobes of protein structure and function, Curr. Opin. Chem. Biol. 4:645-652 和M. ff. Nowak, P. C. Kearney, J. R. Sampson, M. E. Saks, C. G. Labarca, S. K. Silverman, ff.G. Zhong, J. Thorson, J. N. Abelson, N. Davidson, P. G. Schultz, D. A. Dougherty 和 H. A. Lester. Science. 268:439(1995) 0爪蟾卵母细胞与以下活体外制得的两种RNA物质共同注射编码在所关注的氨基酸位置处具有UAG终止密码子的目标蛋白质的mRNA,和经所要的非天然氨基酸氨基酰化的琥珀抑制基因tRNA。然后,卵母细胞的转译机器在规定的位置上通过UAG将非天然氨基酸插入。不幸地,所述方法受限于在细胞中可微量注射的蛋白质,并且因为相关的tRNA经活体外化学酰化并且不能再酰化,所以蛋白质的产量极低。为了克服所述限制,将例如正交tRNA、正交氨酰基-tRNA合成酶及其对的新颖组分添加到原核生物大肠杆菌(Escherichia coli, E. coli)(参见(例如)L. Wang等人,(2001), Science 292:498-500)和真核生物酿酒酵母(Sacchromyces cerevisiae,
S.cerevisiae)(例如,J. Chin 等人,Science 301:964-7 (2003))的蛋白质生物合成机器中,其已使非遗传编码的氨基酸能活体内并入蛋白质中。使用所述方法,响应(例如)琥珀密码子(TAG)已经将具有新颖化学、物理或生物性质,包括光亲和标记和可光致异构氨基酸、光致交联氨基酸(参见(例如),Chin, J. ff.等人(2002) Proc. Natl. Acad. ScLU. S. A. 99:11020-11024 ;和 Chin, J. W.等人(2002) T. Am. Chem. Soc. 124:9026-9027)、酮氨基酸(参见(例如),Wang, L.等人,(2003) Proc. Natl. Acad. Sci. U. S. A. 100:56-61 和Zhang, Z.等人,Biochem. 42(22) :6735-6746 (2003))、含有重原子的氨基酸和经糖基化的氨基酸的大量新颖氨基酸有效地且以高保真度并入大肠杆菌和酵母中的蛋白质中。参见(例如),J. W. Chin 和 P. G. Schultz, (2002). ChemBioChem 3(11) :1135-1137 ;和 L. Wang 和P. G. Schultz, (2002) Chem. Comm. 1:1-11。已经报道了若干其他的正交对。从酿酒酵母tRNA和合成酶得到的谷氨酰胺酰基(参见(例如),Liu,D.R.和 Schultz. P. G. (1999) Proc. Natl. Acad. Sci.U. S. A. ,96:4780-4785)、天冬氨酰基(参见(例如),Pastrnak, M.等人,(2000) Helv.Chim. Acta 83:2277-2286)和酪氨酰基(参见(例如),Ohno, S.等人,(1998) T. Biochem.(Tokyo. Tpn. ) 124:1065-1068 和 Kowal, A. K.等人,(2001) Proc. Natl. Acad. Sci.U- S. A. 98:2268-2273)系统已经被描述用于将非天然氨基酸潜在地并入大肠杆菌中。从大肠杆菌谷氨酰胺酰基(参见(例如),Kowal,A.K.等人,(2001)ProoNatLAcad Sci.U. S. A. 98:2268-2273)和酪氨酰基(参见(例如),Edwards, H.和 Schi_el, P. (1990)Mol.Cell. Biol. 10:1633-1641)合成酶得到的系统已经被描述适用于酿酒酵母。大肠杆菌酪氨酰基系统已经用于将3-碘-L-酪氨酸活体内并入哺乳动物细胞中。参见,Sakamoto,K.等人,(2002)Nucleic Acids Res. 30:4692-4699。通常,所述系统利用琥珀终止密码子。为进一步扩展遗传密码,需要开发生物合成机器的改善和/或其他组分,例如氨酰基-tRNA合成酶。如基于以下揭示案的评述将明显可见,本发明满足所述的和其他的需要。
发明内容
为了扩展遗传密码,本发明提供正交氨酰基-tRNA合成酶的组合物和生产正交氨酰基-tRNA合成酶的方法。本发明的氨酰基-tRNA合成酶用非天然编码的氨基酸氨基酰化tRNA。这些转译组分可用来响应由tRNA识别出的选择密码子(selector codon)而将所选氨基酸并入生长多肽链中的特定位置中(在核酸转译期间))。在细胞中用所选氨基酸在规定位置生产蛋白质的方法也是本发明的特征。举例而言,方法包括在适当培养基中使细胞生长,其中所述细胞包含包括至少一个选择密码子并且编码蛋白质的核酸;和提供所选氨基酸。细胞另外包含在细胞中起作用并且识别选择密码子的正交tRNA (0-tRNA);和用所选氨基酸优先氨基酰化0-tRNA的正交氨酰基-tRNA合成酶(0-RS)。通常,0-tRNA包含在同源合成酶的存在下抑制活性。由所述方法生产的蛋白质也是本发明的特征。
图I-展示具有TWC茎突变部位的J17 tRNA的四叶式交叉(cloverleaf)结构。图2-展示使用J17或J17突变体(F12、F13、F14)和E9RS的人类生长激素的琥珀突变的抑制。各个样品总细胞溶胞产物通过SDS PAGE来分析。图3-展示在不同细胞系中,使用F13和E9 RS的人类生长激素的琥珀突变的抑制。具体实施例方式定义在详细地描述本发明之前,应了解,本发明不受限于具体的生物系统,本发明当然可以变化。也应了解,本文中使用的术语仅是为了描述具体的实施例,并且不希望限制本发明的范畴,本发明的范畴将仅由附加权利要求书来限制。如本文中和附加权利要求书中所使用,除非上下文另外清楚地规定,否则单数形式“一”和“所述”包括复数个参考物。因此,举例而言,提及“一种细胞”包括两种或两种以上细胞的组合并且包括所属领域的技术人员已知的其等价物,等等。提及“细菌”包括细菌的混合物诸如此类。除非在本文中和以下说明书的剩余部分中规定,否则本文中使用的所有技术和科学术语具有与本发明所属领域的技术人员通常所了解的相同的含义。本文中提及的所有公开案和专利是以引用的方式并入本文中,以达到描述和揭示 (例如)公开案中描述的,可能与当前描述的发明联系使用的构筑体和方法的目的。所提供的本文中讨论的公开案仅为在本专利申请案的申请日之前的其揭示案。在此并非解释为允许本发明者由于先前发明或由于任何其他原因而比所述揭示案提前得到授权。同源(Homologous):蛋白质和/或蛋白质序列,当其天然地或人工地从共同的原始蛋白质或蛋白质序列得到时,是“同源的”。同样地,核酸和/或核酸序列,当其天然地或人工地从共同的原始核酸或核酸序列得到时,是同源的。举例而言,任何天然存在的核酸可通过任何可用的突变方法修饰以包括一个或一个以上选择密码子。当被表达时,所述经突变的核酸编码包含一种或一种以上所选氨基酸(例如非天然氨基酸)的多肽。当然,突变处理可另外改变一个或一个以上标准密码子,进而也改变所得突变蛋白质中的一种或一种以上标准氨基酸。所述一种或一种以上标准氨基酸可以变成非天然氨基酸或天然氨基酸。同源性通常从两种或两种以上的核酸或蛋白质(或其序列)之间的序列相似性来推断。适用于建立同源性的序列之间相似性的精确百分比随所讨论的核酸和蛋白质而变化,但仅仅25%的序列相似性通常用以建立同源性。例如30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 或 99% 以上的高水平的序列相似性也可用以建立同源性。用于确定序列相似性百分比的方法(例如,使用缺省参数的BLASTP和BLASTN)描述于本文中并且通常可用。正交^如本文中所使用,术语“正交”指的是通过所关注的系统(例如转译系统,例如细胞)以降低的效率使用的分子(例如正交tRNA (0-tRNA)和/或正交氨酰基tRNA合成酶(0-RS))。正交指的是正交tRNA和/或正交RS在所关注的转译系统中不能起作用或效率降低,例如小于20%有效、小于10%有效、小于5%有效或例如小于1%有效。举例而言,当与内源性tRNA通过内源性RS的氨基酰化相比较时,所关注的转译系统中的正交tRNA是通过所关注的转译系统的任何内源性RS以降低或甚至为零的效率氨基酰化。在另一实例中,当与内源性tRNA通过内源性RS的氨基酰化相比较时,正交RS以降低或甚至为零的效率氨基酰化所关注的转译系统中的任何内源性tRNA。可将与第一正交分子一同起作用的第二正交分子引入细胞中。举例而言,正交tRNA/RS对包括所引入的互补组分,所述互补组分在细胞中以某一效率(例如,约50%效率、约60%效率、约70%效率、约75%效率、约80%效率、约85%效率、约90%效率、约95%效率或约99%或99%以上的效率)一同对对应的tRNA/RS内源性对的组分起作用。“正交性的改善”指的是与起始物质或天然存在的tRNA或RS相比较正交性增强。同源物术语“同源物”指的是一同起作用的组分,例如tRNA和氨酰基-tRNA合成酶。所述组分也可称为互补组分。优先氨基酰化术语“优先氨基酰化”指的是与O-RS氨基酰化天然存在的tRNA或用以产生0-tRNA的起始物质的效率相比较,O-RS用例如非天然氨基酸的所选氨基酸氨基酰化0-tRNA的效率,例如约70%有效、约75%有效、约80%有效、约85%有效、约90%有效、约95%有效或约99%或99%以上有效。因而,非天然氨基酸以高保真度,(例如)以对给定选择密码子来说大于约70%的效率、对给定选择密码子来说大于约75%的效率、对给定选择密码子来说大于约80%的效率、对给定选择密码子来说大于约85%的效率、对给定选择密码子来说大于约90%的效率、对给定选择密码子来说大于约95%的效率或对给定选择密码子来说大于约99%的效率,并入生长多肽链中。诜择密码子术语“选择密码子”指的是在转译过程中通过0-tRNA识别并且不通 过内源性tRNA识别的密码子。0-tRNA反密码子环识别mRNA上的选择密码子并且在多肽中的所述部位处并入其氨基酸,例如所选氨基酸,诸如非天然氨基酸。选择密码子可包括(但不限于)(例如)无义密码子,诸如包括(但不限于)琥珀密码子、赭石密码子和蛋白石密码子的终止密码子;4或4个以上碱基密码子;稀有密码子;由天然或非天然碱基对得到的密码子和/或类似物。对给定系统来说,选择密码子也可包括天然3碱基密码子之一,其中内源性系统不使用(或很少使用)所述天然3碱基密码子。举例而言,内源性系统包括缺乏识别天然3碱基密码子的tRNA的系统和/或其中天然3碱基密码子为稀有密码子的系统。抑制基因tRNA :抑制基因tRNA是在给定转译系统中,(例如)通过提供响应选择密码子而将氨基酸并入多肽链中的机制,来改变信使RNA (mRNA)的读取的tRNA。举例而言,抑制基因tRNA可读遍包括(但不限于)终止密码子、4碱基密码子或稀有密码子的密码子。抑制活件术语“抑制活件”指的是例如抑制基因tRNA的tRNA读遍选择密码子的能力。活性可表示为当与对照物(例如缺乏同源物合成酶)相比时,所观察到的活性的百分比。转译系统术语“转译系统”指的是将天然存在的氨基酸并入牛长多肽链(蛋白质)中所必需的组分。转译系统的组分可包括(例如)核糖体、tRNA、合成酶、mRNA,诸如此类。可将本发明的组分添加到活体外或活体内转译系统中。转译系统的实例包括(但不限于)非真核细胞,例如细菌(诸如大肠杆菌);真核细胞,例如酵母细胞、哺乳动物细胞、植物细胞、藻类细胞、真菌细胞、昆虫细胞;无细胞的转译系统,例如细胞溶胞产物;和/或类似物。转译系统可以是细胞的或无细胞的,并且可以是原核的或真核的。细胞转译系统包括(但不限于)全细胞制剂,诸如透性化细胞或细胞培养物,其中所要的核酸序列可转录成mRNA并且所述mRNA被转译。无细胞转译系统为市售的并且许多不同类型和系统是熟知的。无细胞系统的实例包括(但不限于)原核溶胞产物,诸如大肠杆菌溶胞产物;和真核溶胞产物,诸如小麦胚芽提取物、昆虫细胞溶胞产物、兔网织红细胞溶胞产物、兔卵母细胞溶胞产物和人类细胞溶胞产物。当所得蛋白质经糖基化、磷酸化或另外修饰时,真核提取物或溶胞产物可为优选的,因为许多所述修饰仅在真核系统中为可能的。一些所述提取物和溶胞产物为市售的(Promega;Madison, Wis. ; Stratagene ; La Jolla, Calif ;Amersham; Arlington Heights, 111. ;GIBCO/BRL;Grand Island, N. Y.)。诸如含有微粒体膜的犬胰腺提取物的膜状提取物也可用,其适用于转译分泌蛋白。也可以使用重构转译系统。经纯化的转译因子的混合物以及由诸如起始因子-I(IF-l)、IF-2、IF-3 (a或¢)、延伸因子T (EF-Tu)或末端因子的经纯化的转译因子补充的溶胞产物的组合或溶胞产物也已经成功用以将mRNA转译成蛋白质。无细胞系统也可以是偶联的转录/转译系统,其中将DNA引入系统中,转录成mRNA并且将mRNA如CurrentProtocols in Molecular Biology (F. M. Ausubel 等编,Wiley Interscience, 1993)中所述来转译,该文献在此特别以引用的方式并入。在真核转录系统中转录的RNA可以呈异核RNA ChnRNA)或5’ -末端帽(7-甲基鸟嘌呤核苷)和3’ -末端多聚A有尾成熟mRNA形式,其可为某些转译系统中的优点。举例而言,加帽mRNA以高效率在网织红细胞溶胞产物系统中被转译。所选氨基酸术语“所选氨基酸”指的是任何所要的天然存在的氨基酸或非天然氨基酸。如本文中所使用,术语“非天然氨基酸”或“非天然编码的氨基酸”指的是任何氨基酸、经修饰的氨基酸和/或不为20种常见天然存在的氨基酸之一或硒代半胱氨酸或吡咯赖氨酸的氨基酸类似物。可以与术语“非天然编码的氨基酸”和“非天然氨基酸”同义地使用的其他术语为“非天然的氨基酸”、“非天然存在的氨基酸”和其各种用连字号连接的和未用连字号连接的型式。术语“非天然编码的氨基酸”也包括(但不限于)通过修饰(例如,后转译修饰)天然编码的氨基酸(包括但不限于20种常见氨基酸或吡咯赖氨酸和硒代半胱氨酸)产生的氨基酸,但不为通过转译复合物而将其本身天然地并入生长多肽链的氨基酸。所述非天然存在的氨基酸的实例包括(但不限于)N-乙酰氨基葡萄糖基-L-丝氨酸、N-乙酰氨基葡萄糖基-L-苏氨酸和0-磷酸化酪氨酸。由...得到如本文中所使用,术语“由…得到”指的是从规定分子或生物体分离的组分或使用来自规定分子或生物体信息制得的组分。IH性选择或筛选标记物如本文中所使用,术语“ IH性选择或筛选标记物”指的是当存在时(例如)经表达、经活化等等时使得具有正性选择标记物的细胞从不具有正性选择标记物的细胞鉴别出的标记物。负性选择或筛选标记物如本文中所使用,术语“负性选择或筛选标记物”指的是 当存在时(例如)经表达、经活化等等时容许鉴别出不具有所要性质的细胞(例如,当与具有所要性质的细胞相比时)的标记物。报告基因(Reporter):如本文中所使用,术语“报告基因”指的是可用以选择所关注系统的目标组分的组分。举例而言,报告基因可包括蛋白质,例如给与抗生素抗性或敏感性的酶(包括(但不限于)¢-内酰胺酶、氯霉素乙酰转移酶(CAT),诸如此类)、荧光筛选标记物(包括(但不限于)绿色荧光蛋白质(例如GFP )、YFP、EGFP、RFP )、发光标记物(包括(但不限于)萤火虫荧光素酶蛋白质)、基于亲和力的筛选标记物;或正性或负性可选择标记物基因,诸如 lacZ、3 -gal/lacZ ( ^ -半乳糖苷酶)、ADH (醇脱氢酶)、his3、ura3、leu2、lys2 等等。真核牛物如本文中所使用,术语“真核牛物”指的是属于真核种系发牛域(phylogenetic domain Eucarya)的生物体,诸如动物(包括(但不限于)哺乳动物、昆虫、爬虫、鸟等),纤毛虫,植物(包括(但不限于)单子叶植物、双子叶植物、藻类等),真菌,酵母,鞭毛虫,微粒子虫目,原生生物等。非真核牛物如本文中所使用,术语“非真核牛物”指的是非真核牛物体。举例而言,非真核生物体可属于真细菌类(Eubacteria)(包括(但不限于)大肠杆菌、嗜热细菌(Thermus thermophilics)、嗜热月旨肪芽抱杆菌(Bacillus stearothermophilus)、突光极毛杆菌(Pseudomonas fluorescens)、绿胺杆菌(Pseudomonas aeruginosa)、恶息极毛杆菌(Pseudomonas putida)等)种系发生域,或原生类(Archaea)(例如,詹氏甲烧球菌(Methanococcus jannaschii)、横川病毒(Methanobacterium thermoautotrophicum)、诸如富饶盐菌(Haloferax volcanii)和盐杆菌种(Halobacterium species) NRC-I 的盐杆菌属(Halobacterium)、闪烁古生球菌(Archaeoglobus fulgidus)、火球菌(Pyrococcusfuriosus)、掘越氏热球菌(Pyrococcus horikoshii)、嗜热菌敏捷气热菌(Aeuropyrumpernix)等)种系发生域。 保守变体术语“保守变体”指的是例如保守变体0-tRNA或保守变体O-RS的转译组分,所述转译组分如例如0-tRNA或O-RS的组分(保守变体以其为基础)一样执行功能,但在序列中具有变化。举例而言,尽管0-tRNA和保守变体0-tRNA不具有相同序列,但是O-RS将用例如非天然氨基酸的所选氨基酸氨基酰化互补的0-tRNA或保守变体0-tRNA。同样地,尽管O-RS和保守变体O-RS不具有相同序列,但是tRNA将通过互补的O-RS或保守变体0-RS,经例如非天然氨基酸的所选氨基酸氨基酰化。只要保守变体与对应的0-tRNA或O-RS互补,保守变体就可在序列中具有(例如)I种变化、2种变化、3种变化、4种变化或5种或5种以上的变化。选择或筛选剂如本文中所使用,术语“选择或筛选剂”指的是当存在时,允许从群体中选择/筛选某些组分的试剂。举例而言,选择或筛选剂包括(但不限于)(例如)营养素、抗生素、光的波长、抗体、经表达的多核苷酸等等。选择剂可(例如)因浓度、强度等而变化。术语“未有效地识别出”指的是来自一种生物体的RS氨基酰化0-tRNA的例如小于约10%、小于约5%或小于约1%的效率。
具体实施例方式适于制造包括一种或一种以上例如非天然氨基酸的所选氨基酸的蛋白质的转译系统,描述于标题为 “METHODS AND COMPOSITION FOR THE PRODUCTION OF ORTHOGONALtRNA-AMINOACYL tRNA SYNTHETASE PAIRS” 的美国专利申请案 10/126,931 和标题为 “INVIVO INCORPORATION OF UNNATURAL AMINO ACIDS” 的美国专利申请案 10/126, 927 中。另夕卜,参见标题为“EXPANDING THE EUKARYOTIC GENETIC CODE^USSN 10/825,867。每一所述申请案都以引用的方式全部并入本文中。所述转译系统通常包含,包括正交tRNA( 0-tRNA)、正交氨酰基tRNA合成酶(O-RS)和例如非天然氨基酸的所选氨基酸的细胞,其中O-RS用所选氨基酸氨基酰化0-tRNA。本发明的正交对包含0-tRNA (例如抑制基因tRNA、移码tRNA等等)和0-RS。0-tRNA识别第一选择密码子并且在同源合成酶的存在下响应选择密码子而具有抑制活性。细胞使用所述组分将所选氨基酸并入生长多肽链中。举例而言,包含编码所关注的多肽的多核苷酸的核酸也可存在,其中多核苷酸包含通过0-tRNA识别出的选择密码子。转译系统也可为活体外系统。本发明的RS分子适用于包括在转译中利用核糖体的系统中的任何转译系统。转译系统也可以是无细胞(活体外)转译系统。在可包括mRNA作为模板(活体外转译)或者DNA作为模板(经组合的活体外转录和转译)的所述系统中,活体外合成通过核糖体引导。已经对开发无细胞蛋白质表达系统进行了相当大的努力。参见(例如),Kim, D.M.和 J. R. Swartz, Biotechnology and Bioengineering, 74:309-316 (2001);Kim, D. M.和 J. R. Swartz, Biotechnology Letters, 22, 1537-1542, (2000) ;Kim, D.M.和 J. R. Swartz, Biotechnology Progress, 16, 385-390,(2000) ;Kim, D. M.和J. R. Swartz, Biotechnology and Bioengineering, 66, 180-188,(1999);和 Patnaik, R.和 J. R. Swartz, Biotechniques 24,862-868,(1998);美国专利第 6,337,191 号;美国专利公开案第2002/0081660号;W000/55353 ;W0 90/05785,所述文献是以引用的方式并入本文中。可以应用的另一种方法包括mRNA-肽融合技术。参见(例如),R. Roberts和 J. Szostak, Proc. Natl Acad. Sci. (USA) 94:12297-12302 (1997) ;A. Frankel 等人,Chemistry & Biology 10:1043-1050(2003)。在所述方法中,与嘌呤霉素连接的mRNA模板在核糖体上被转译成肽。如果已经修饰一个或一个以上tRNA分子,那么也可将非天然氨基酸并入肽中。在已经阅读末尾mRNA密码子后,嘌呤霉素俘获肽的C-末端。如果在活体外检定中发现所得mRNA-肽结合物具有所关注的性质,那么其同一性可容易地从mRNA序列展现。这样,所属领域的技术人员可以筛选包含一种或一种以上非天然编码的氨基酸的多肽 的库,以鉴别具有所要性质的多肽。近期,已经报道用经纯化的组分的活体外核糖体转译允许合成经非天然编码的氨基酸取代的肽。参见(例如)A. Forster等人,Proc. Natl Acad.Sci. (USA) 100:6353(2003)。在某些实施例中,包含本发明的RS的大肠杆菌细胞包括所述转译系统。举例而言,本发明的大肠杆菌细胞包括正交tRNA(0-tRNA),其中0-tRNA包含在同源合成酶存在下响应选择密码子的抑制活性;正交氨酰基-tRNA合成酶(O-RS);所选氨基酸;和包含编码所关注的多肽的多核苷酸的核酸,其中多核苷酸包含由0-tRNA识别的选择密码子。本发明也提供在容许并入一种以上所选氨基酸的细胞中的多个0-tRNA/0-RS对。在某些实施例中,细胞可另外包括其他不同的0-tRNA/0-RS对和第二所选氨基酸,其中0-tRNA识别第二选择密码子并且O-RS用第二所选氨基酸优先氨基酰化0-tRNA。举例而言,细胞可另外包含(例如)由詹氏甲烷球菌的酪氨酰基tRNA合成酶得到的琥珀抑制基因tRNA-氨酰基tRNA合成酶对。0-tRNA和/或O-RS可为天然存在的或可通过来自各种生物体的天然存在的tRNA和/或RS的突变而得到,例如所述突变产生tRNA的库和/或RS的库。举例而言,一种生产正交tRNA/氨酰基-tRNA合成酶对的策略涉及将来自(例如)不同于宿主细胞的来源或多个来源的异源性tRNA/合成酶对引进宿主细胞中。异源性合成酶候选者的性质包括,(例如)其不装填任何宿主细胞tRNA,并且异源性tRNA候选者的性质包括,(例如)其不通过任何宿主细胞合成酶而氨基酰化。另外,异源性tRNA与所有宿主细胞合成酶正交。用于产生正交对的第二种策略涉及产生从其筛选和/或选择0-tRNA或O-RS的突变体库。所述策略也可组合。在各种实施例中,0-tRNA和O-RS是由至少一种生物体得到。在另一个实施例中,0-tRNA是由来自第一生物体的天然存在的或经突变的天然存在的tRNA得到,并且O-RS是由来自第二生物体的天然存在的或经突变的天然存在的RS得到。在一个实施例中,第一生物体和第二生物体是不同的。举例而言,正交对可以包括由横川病毒得到的tRNA合成酶和由古细菌tRNA (例如来自盐杆菌种NRC-1)得到的tRNA。或者,第一生物体和第二生物体是相同的。为补充信息,参见本文中标题为“来源和宿主生物体”的部分。在本发明的某些实施例中,本发明的O-RS包含如SEQ ID NO: 4中所述的多核苷酸序列或其互补多核苷酸序列或其保守变化,或通过如SEQ ID N0:4中所述的多核苷酸序列或其互补多核苷酸序列或其保守变化来编码。在某些实施例中,O-RS包含如SEQ ID NO:5中所述的氨基酸序列。又参见本文中标题为“核酸和多肽序列和变体”的部分。tRNA (0-tRNA)正交tRNA (0-tRNA)介导将所选氨基酸(例如)活体内或活体外并入蛋白质中,所述蛋白质通过包含由0-tRNA识别的选择密码子的多核苷酸来编码。0-tRNA可以通过包括(但不限于)化学氨基酰化或酶促氨基酰化的任何方法或技术用所要氨基酸来氨基酰化。经氨基酰化的0-tRNA可以被直接地添加到转译系统中。0-tRNA可以通过本发明的RS用所选氨基酸活体外或活体内氨基酰化。另外,RS可为0-RS。0-tRNA可直接地或通过提供编码 0-tRNA或其部分的多核苷酸而提供到转译系统(例如,活体外转译组分或细胞)中。举例而言,0-tRNA或其部分通过如SEQ ID N0:USEQ ID NO: 2,SEQ ID NO: 3中所述的多核苷酸序列或其互补多核苷酸序列或其保守变化来编码。O-RS可直接地(例如SEQ ID N0:5或SEQID NO: 17或其保守变化)或通过提供编码O-RS或其部分的多核苷酸而提供到转译系统(例如,活体外转译组分或细胞)中。举例而言,O-RS或其部分通过如SEQ ID N0:4中所述的多核苷酸序列、编码氨基酸序列SEQ ID NO: 17的多核苷酸序列或其互补多核苷酸序列或其保守变化来编码。本发明的0-tRNA包含在同源合成酶存在下响应选择密码子的抑制活性。抑制活性可通过所属领域中已知的多种检定中的任何一种来测定。举例而言,可使用¢-半乳糖苷酶报告基因检定。(例如)在IacZ的肽VVLQRRDWEN的Leu_25经例如TAG、TGA、AGGA等密码子的选择密码子或酪氨酸、丝氨酸、白氨酸等的有义密码子(作为对照)置换时,使用在启动子控制下表达IacZ基因的质粒的衍生物。将经衍生的IacZ质粒连同包含本发明的0-tRNA的质粒一起引入来自适当生物体(例如,其中可使用正交组分的生物体)的细胞中。也可引入同源合成酶(作为多肽或者当被表达时编码同源合成酶的多核苷酸)。使细胞在培养基中生长到所要密度,例如生长到0D_为约0. 5,并且(例如)使用BetaFluor ^ -半乳糖苷酶检定试剂盒(Novagen)执行P _半乳糖苷酶检定。抑制百分比是按样本相对于例如从经衍生的IacZ构筑体观察到的值的可比较对照物的活性的百分比来计算,其中构筑体在所要位置具有对应的有义密码子而不是选择密码子。适用于本发明的0-tRNA的实例是揭示于美国专利申请案10/126,931、10/126,927和10/825,867中的0-tRNA分子的任何一种分子。在tRNA分子中,胸苷嘧啶(T)经尿嘧啶(U)置换。另外,可存在对碱基的其他修饰。本发明也包括0-tRNA的保守变化。举例而言,0-tRNA的保守变化包括如0-tRNA —样起作用并且维持tRNA L-形结构,但不具有相同序列(并且不同于野生型tRNA分子)的分子。又参见本文中标题为“核酸和多肽序列和变体”的部分。包含0-tRNA的组合物可另外包括正交氨酰基-tRNA合成酶(0-RS),其中O-RS用所选氨基酸(例如非天然氨基酸)优先氨基酰化0-tRNA。在某些实施例中,包括0-tRNA的组合物可另外包括转译系统(例如,活体外或活体内转译系统)。包含编码所关注的多肽的多核苷酸的核酸也可存在于细胞或其他转译系统中,其中所述多核苷酸包含一个或一个以上由0-tRNA识别的选择密码子,或所述选择密码子的一个或一个以上的组合。又参见,本文中标题为“正交氨酰基-tRNA合成酶(0-RS)”的部分。生产例如0-tRNA的正交tRNA (0-tRNA)的方法也是本发明的特征。通过所述方法生产的例如0-tRNA的tRNA也是本发明的特征。生产正交tRNA的方法包括使tRNA的集合中的每一 tRNA的反密码子环突变以容许识别选择密码子(例如,琥珀密码子、蛋白石密码子、4碱基密码子等),进而提供多个可能的0-tRNA ;且分析多个可能的0-tRNA的成员的二级结构以鉴别二级结构中的非规范碱基对;且视需要使非规范碱基对突变(例如,使非规范碱基对突变成规范碱基对)。非规范碱基对可位于二级结构的茎区。0-tRNA可以具有一种或一种以上特征或活性的改善,诸如与例如多个tRNA序列的起始物质相比,所要生物体的正交性的改善,同时保持其对所要RS的亲和力。或者,0-tRNA可以通过使已知tRNA突变来发展以调节其与一种或一种以上影 响转译或为转译机器的组分的分子的相互作用或对所述分子的结合亲和力。所述组分包括(但不限于)延伸因子。细菌延伸因子EF-Tu在蛋白质合成的延伸步骤中起关键作用。在tRNA通过tRNA合成酶氨基酰化后,EF-Tu结合经氨基酰化的tRNA并且将其带到核糖体的A部位。由于EF-Tu与经氨基酰化的tRNA之间的结合,经装填的氨基酸与tRNA之间的酯键受自发水解作用的保护。Stortchevoi等人研究了在TWC莖中的大肠杆菌起始tRNA 61 U50:G64摆动碱基对的突变体,因为发现所述碱基对为阻断延伸中的tRNA活性的第二负性决定子,估计可能由于EF-Tu. GTP与经氨基酰化的tRNA之间减弱的相互作用(JBC 2003 278(20) : 17672-17679)。同样,LaRiviere 等人在 Science 2001 年 10 月 5日;294 (5540) :165-8中描述了氨基酸和tRNA体对与EF-Tu的总结合亲和力的热力学贡献。他们指出,tRNA体和氨基酸的贡献彼此独立并且当tRNA经正确酰化时,其相互补充。对EF-Tu. GTP与经非天然氨基酸氨基酰化的tRNA之间相互作用的改变可以影响将tRNA加载到核糖体的A部位的效率。可能的突变部位也可以通过分析tRNA与诸如EF-Tu的转译机器的其他组分之间的复合体的晶体结构而发现。举例而言,Nissen等人已指出,EF-Tu.GTP与酵母苯丙氨酰基-转移RNA (Phe-tRNA)的TWC茎的磷酸酯骨架直接结合(Science1995 270(5241):1464-1472)。所述方法视需要包括分析tRNA和/或氨酰基-tRNA合成酶的序列同源性,以确定似乎对特定生物体来说为正交的0-tRNA、0-RS和/或其对的可能候选者。可使用所属领域中已知的和本文中描述的计算机程序进行分析。在一个实例中,为选择适用于原核生物体的可能的正交转译组分,选择对原核生物体不显示异常同源性的合成酶和/或tRNA。tRNA的集合也可通过一致的策略生产。举例而言,tRNA的集合是通过比对多个tRNA序列;确定一致序列;和使用至少一部分、大部分或全部一致序列产生tRNA的库而生产。举例而言,一致序列可用例如GCG程序堆积(GCG program pileup)的计算机程序来编辑。视需要,将通过所述程序确定的简并位置(degenerate position)变成在所述位置处最常见的碱基。库通过所属领域中已知的技术使用一致序列合成。举例而言,寡核苷酸的重叠延伸作用(其中tRNA基因的各部位可被合成为90% —致序列和10%其他3个碱基的混合物的掺杂混合物)可用以提供基于一致序列的库。也可使用其他混合物,例如75%—致序列和25%其他3个碱基的混合物、80% —致序列和20%其他3个碱基的混合物、95% —致序列和5%其他3个碱基的混合物等。突变tRNA的库可使用所属领域中已知的各种突变技术产生。举例而言,突变tRNA可通过部位特异性突变、随机点突变、同源重组、DNA滑移或其他递归突变方法、嵌合建构或其任何组合产生。其他突变可在例如反密码子环、接纳^(acceptor stem)、D臂或环、可变环、TWC臂或环的tRNA的所要环或区域、tRNA分子的其他区域或其组合中的例如非保守位置或保守位置、随机化位置或其组合的特定位置上引入。突变可以包括在茎区中的匹配碱基对。通常,0-tRNA通过使第一物种的细胞群体经受负性选择而获得,其中细胞包含多个可能的0-tRNA的成员。负性选择消除包含多个可能的0-tRNA的成员的细胞,所述0-tRNA通过对细胞来说为内源性的氨酰基-tRNA合成酶(RS)氨基酰化。所述负性选择提供与第一物种的细胞正交的tRNA的集合。
在负性选择的某些实施例中,将选择密码子引入多核苷酸中,所述多核苷酸编码负性选择标记物,例如给与抗生素抗性的酶,例如¢-内酰胺酶;给与可检测产物的酶,例如3半乳糖苷酶;氯霉素乙酰转移酶(CAT),例如在非基本位置处的毒性产物,诸如barnase ;等。筛选/选择可通过在选择剂(例如,抗生素,诸如氨节青霉素(ampicillin))存在下,使细胞群体生长来进行。在一个实施例中,选择剂的浓度是变化的。举例而言,为测量抑制基因tRNA的活性,使用基于例如无义密码子的选择密码子的活体内抑制,或引入编码例如¢-内酰胺酶(bla)的基因的负性选择标记物的多核苷酸中的移码突变的选择系统。举例而言,建构在某个位置上具有(例如)TAG、AGGA和TGA的多核苷酸变体,例如bla变体。例如细菌的细胞经所述多核苷酸转形。在不能通过内源性大肠杆菌合成酶有效地装填的正交tRNA的情况下,例如氨苄青霉素抗性的抗生素抗性应约为或小于不经质粒转形的细菌的抗生素抗性。如果tRNA是非正交的,或如果能够装填tRNA的异源性合成酶在系统中被共表达,那么观察到高水平的例如氨苄青霉素的抗生素的抗性。选择在抗生素浓度约等于不经质粒转形的细胞的LB琼脂培养盘上不能生长的细胞,例如细菌。在毒性产物(例如核糖核酸酶barnase)的情况下,当多个可能的tRNA的成员通过例如大肠杆菌合成酶的内源性宿主氨基酰化(也就是说,其不与例如大肠杆菌合成酶的宿主正交)时,选择密码子被抑制并且所产生的毒性多核苷酸产物导致细胞死亡。怀有正交tRNA或无功能的tRNA的细胞存活。在一个实施例中,随后使与所要生物体正交的tRNA的集合经受正性选择,其中将选择密码子放置在(例如)通过诸如P-内酰胺酶基因的耐药性基因编码的正性选择标记物中。正性选择是在包含编码或包含tRNA的集合的成员的多核苷酸、编码正性选择标记物的多核苷酸和编码同源RS的多核苷酸的细胞上执行。所述多核苷酸在细胞中表达并且细胞在例如氨苄青霉素的选择剂存在下生长。然后,就响应所述选择密码子tRNA通过共表达的同源合成酶氨基酰化的能力和插入氨基酸的能力来选择tRNA。通常,与怀有无功能的tRNA或不能由所关注的合成酶有效识别出的tRNA的细胞相比,所述细胞展示抑制效率的增强。怀有无功能tRNA或通过所关注的合成酶不有效识别出的tRNA的细胞对抗生素敏感。因此,(i )不为内源性宿主(例如大肠杆菌)合成酶的底物;(ii )可通过所关注的合成酶氨基酰化jP(iii)在转译中起作用的tRNA在两种选择中存活。
上述方法中选择(例如正性选择、负性选择或正性和负性选择)的严格性视需要可以变化。举例而言,因为barnase是极具毒性的蛋白质,所以负性选择的严格性可通过将不同数量的选择密码子引入barnase基因中和/或通过使用诱导型启动子而控制。在另一个实例中,选择或筛选剂(例如氨苄青霉素)的浓度是变化的。在一个方面中,因为在早期循环期间,所要活性可为低的,所以严格性是变化的。因此,在早期循环中应用较低严格性的选择准则并且在选择的后期循环中应用更严格的准则。在某些实施例中,负性选择、正性选择或负性和正性选择可重复多次。可使用多种不同的负性选择标记物、正性选择标记物或负性和正性选择标记物。在某些实施例中,正性和负性选择标记物可为相同的。其他类型的选择/筛选可用于本发明以生产例如0-tRNA、O-RS和0-tRNA/O-RS对的正交转译组分。举例而言,负性选择标记物、正性选择标记物或正性和负性选择标记物可包括发荧光或在适合的反应物存在下催化发光反应的标记物。在另一个实 施例中,标记物的产物通过突光活化细胞拣选(FACS)或通过发光来检测。视需要,标记物包括基于亲和力的筛选标记物。参见,Francisco, J. A.等人,(1993)Production andfluorescence-activated cell sorting of Escherichia coli expressing a functionalantibody fragment on the external surface. Proc Natl Acad Sci U S A. 90:10444-8。生产重组正交tRNA的其他方法可见于(例如)标题为“Methods and Compositionsfor the Production of Orthogonal tRNA-Aminoacyl tRNA Synthetase Pairs,,的美国专利申请案 10/126,931 和标题为 “In vivo Incorporation of UnnaturalAmino Acids” 的美国专利申请案 10/126,127,和标题为 “EXPANDING THE EUKARYOTICGENETIC CODE” 的 USSN10/825, 867 中。又参见 Forster 等人,(2003)Programmingpeptidomimetic synthetases by translating genetic codes designed de novo PNAS100 (11):6353-6357 ;和 Feng 等人,(2003),Expanding tRNA recognition of a tRNAsynthetase by a single amino acid chanRe, PNAS100(10):5676-5681。tRNA可以通过包括(但不限于)化学氨基酰化或酶促氨基酰化的任何方法或技术用所要氨基酸氨基酰化。氨基酰化可以通过氨酰基tRNA合成酶或通过包括(但不限于)核糖酶的其他酶促分子完成。术语“核糖酶”可与“催化性RNA”互换。Cech和同事(Cech,1987, Science, 236:1532-1539 ;McCorkle 等人,1987, Concepts Biochem. 64:221-226)证明可担当催化剂(核糖酶)的天然存在的RNA的存在。然而,尽管已经展示所述天然RNA触媒仅对用于裂解和剪接的核糖核酸底物起作用,但是核糖酶的人工进化的近期发展已经将催化作用的清单扩展到各种化学反应。研究已经鉴别可在其自身(2’)3’-末端上催化氨酰基-RNA键的RNA分子(Illangakekare等人,1995 Science 267:643-647)和可将氛基酸从一个RNA分子转移到另一个 RNA 分子的 RNA 分子(Lohse 等人,1996, Nature381:442-444)。以引用的方式并入本文中的美国专利申请公开案2003/0228593,描述建构核糖酶的方法和其在用天然编码的和非天然编码的氨基酸氨基酰化tRNA中的用途。包括(但不限于)核糖酶的可氨基酰化tRNA的酶促分子的底物固定形式,可以使经氨基酰化的产物能够有效亲和力纯化。适合底物的实例包括琼脂糖、琼脂糖凝胶和磁性珠粒。用于氨基酰化的核糖酶的底物固定形式的生产和用途描述于Chemistry and Biology 2003, 10:1077-1084和美国专利申请公开案2003/0228593中,其都以引用的方式并入本文中。
化学氨基酰化方法包括(但不限于)由Hecht和同事(Hecht,S. M. Acc.Chem. Res. 1992,25,545 ;Heckler,T. G. ; Roesser, J. R. ; Xu,C. ; Chang, P. ; Hecht, S.M. Biochemistry 1988, 27,7254 ;Hecht,S. M. ; Alford, B. L. ; Kuroda, Y. ; Kitano, S.J. Biol. Chem. 1978,253,4517)和由 Schultz、Chamberlin、Dougherty 和其他人(Cornish, V. W. ;Mendel, D. ; Schultz, P. G. Angew. Chem. Int. Ed. Engl. 1995,34,621 ;Robertson, S. A. ;Ellman, J. A. ; Schultz, P. G. J. Am. Chem. Soc. 1991,113,2722 ;Noren, C.J. ; Anthony-Cahi 11, S. J. ; Griff ith,M. C. ; Schultz, P. G. Science 1989,244,182 ;Bain,J.D. ; Glabe, C. G. ; Dixj T. A. ; Chamberlin, A. R. J. Am. Chem. Soc. 1989,111,8013 ;Bain,J.D 等人 Nature 1992,356,537 ;Gallivan, J. P. ; Lester, H. A. ;Dougherty, D. A. Chem.Biol. 1997,4,740 ;Turcatti 等人,J. Biol. Chem. 1996,271,19991 ;Nowak, M. W.等人,Science, 1995,268,439 ;Saks,M. E.等人 J. Biol. Chem. 1996,271,23169 ;Hohsaka,T.等人J. Am. Chem. Soc. 1999,121,34)所介绍的避免在氨基酰化中使用合成酶的方法。所述方法或其他化学氨基酰化方法可用以氨基酰化tRNA分子。使用经化学修饰的氨酰基-tRNA的生物合成方法已经用以将若干生物物理学探针活体外并入所合成的蛋白质中。参见以下公开案和其中引用的参考文献Biamner,J.NewPhotolabeling and crosslinking methods,Annu. Rev Biochem,62:483-514(1993);和Krieg,U. C.,Walter, P.,Hohnson,A. E. Photocrosslinking of the signal sequence ofnascent preprolactin of the 54-kilodalton polypeptide of the signal recognitionparticle, Proc. Natl. Acad. Sci. 83 (22) : 8604-8608 (1986)。以前,已经展示,非天然氨基酸可通过将经化学氨基酰化的抑制基因tRNA添加到用含有所要琥珀无义突变的基因程式化的蛋白质合成反应中而在部位特异地活体外并入蛋白质中。使用所述方法,所属领域的技术人员可用封闭结构的同源物取代大量常见的20种氨基酸,例如,氟苯丙氨酸取代苯丙氨酸,使用营养缺陷菌株取代具体的氨基酸。参见(例如),Noren, C. J.,Anthony-Cahi 11,Griffith, M. C.,Schultz, P. G. A generalmethod for site-specific incorporation of unnatural amino acids into proteins,Science 244:182-188 (1989) ;M. W. Nowak 等人,Science 268:439-42 (1995) ;Bain,J.D.,Glabe,C. G.,Dixj T. A.,Chamberlin, A. R.,Diala,E. S. Biosynthetic site-specificIncorporation of a non-natural amino acid into a polypeptide,J. Am ChemSoc, 111:8013-8014(1989) ;N. Budisa 等人,FASEB J. 13:41-51 (1999) ;Ellman,J. A.,Mendel, D.,Anthony-Cahi 11, S.,Noren, C. J.,Schultz, P. G. Biosynthetic method forintroducing unnatural amino acids site-specifically into proteins. Methodsin Enz.,第 202 卷,301-336(1992);和 Mendel,D.,Cornish,V. W.和 Schultz,P.G. Site-Directed Mutagenesis with an Expanded Genetic Code,Annu Rev Biophys.Biomol Struct. 24,435-62(1995)0举例而言,制备识别终止密码子UAG的抑制基因tRNA并且用非天然氨基酸将其化学氨基酰化。惯用的定位突变用以在蛋白质基因中的所关注的部位引入终止密石马子 TAG0 参见(例如),Sayers, J. R.,Schmidt, W. Eckstein, F. 5,-3,Exonucleases inphosphorothioate-based olignoucleotide-directed mutagensis,Nucleic AcidsRes. 16(3) :791-802(1988)。当经酰化的抑制基因tRNA和突变基因在活体外转录/转译系统中组合时,响应UAG密码子将非天然氨基酸并入,得到在规定位置上含有那个氨基酸的蛋白质。使用[3H]_Phe的实验和用a-羧酸的实验证明,仅仅所要氨基酸在规定的位置上通过UAG密码子并入,并且所述氨基酸未在蛋白质中的任何其他部位并入。参见(例如),Noren 等人,同上;Kobayashi 等人,(2003) Nature Structural Biology 10 (6) : 425-432 ;和 Ellman,J.A.,Mendel, D.,Schultz, P. G. Site-specific incorporation of novelbackbone structures into proteins, Science 255 (5041):197-200(1992)。用于产生催化性RNA的方法可以涉及产生随机化的核糖酶序列的分离池、对池执行定位进化、为所需氨基酰化活性而筛选池和选择显示所要氨基酰化活性的所述核糖酶的序列。核糖酶可包含有利于酰化活性的基元和/或区域,诸如GGU基元和U富集区域。举例而言,已经报道U富集区域可促进氨基酸底物的识别,并且GGU-基元可与tRNA的3’末端形成碱基对。在组合时,GGU和基元和U富集区域同时促进氨基酸和tRNA的同时识别,并且进而促进tRNA的3’末端的氨基酰化。、核糖酶可通过使用与tRNAAsnera结合的部分随机化的r24mini进行活体外选择,接着通过见于活性无性系中的一致序列的系统工程化而产生。通过所述方法获得的示范性核糖酶被称为“Fx3核糖酶”并且描述于美国公开申请案第2003/0228593号中,所述专利的内容是以引用的方式并入本文中,所述核糖酶担当多用途催化剂用于合成经同源非天然氨基酸装填的各种氨酰基-tRNA。底物上的固定可用以促成经氨基酰化的tRNA的有效亲和力纯化。适合的底物的实例包括(但不限于)琼脂糖、琼脂糖凝胶和磁性珠粒。核糖酶可通过利用RNA的化学结构固定于树脂上,诸如RNA的核糖上的3’ -顺式二醇可经高碘酸盐氧化以产生对应的二醛以促进RNA在树脂上的固定。可使用包括廉价酰肼树脂的各种类型的树脂,其中还原性胺化作用使树脂与核糖酶之间的相互作用成为不可逆的键。氨酰基-tRNA的合成可通过所述管柱上氨基酰化技术而显著地促进。Kouroukl i s等人Methods 2005; 36:239-4描述基于管柱的氨基酰化系统。经氨基酰化的tRNA的分离可以各种方式完成。一种适合的方法是,从具有诸如含有IOmM EDTA的乙酸钠溶液的缓冲液、含有50mM N-(2-羟乙基)哌嗪-N’ -(3-丙烷磺酸)、pH 7. 0的12. 5mM KClUOmM EDTA的缓冲液或仅为经EDTA缓冲的水(pH 7. 0)的管柱洗提经氨基酰化的tRNA。可将经氨基酰化的tRNA添加到转译反应中,以便并入氨基酸,在通过转译反应制得的多肽中的特别位置上,tRNA被所述氨基酸氨基酰化。可以使用经氨基酰化的tRNA的转译系统的实例,包括(但不限于)细胞溶胞产物。细胞溶胞产物提供为从输入mRNA活体外转译多肽所必需的反应组分。所述反应组分的实例包括(但不限于)核糖体蛋白、rRNA、氨基酸、tRNA、GTP、ATP、转译起始因子和延伸因子和与转译相关的其他因子。另外,转译系统可以是分批转译或隔开转译。分批转译系统在单一隔室中组合反应组分,而隔开转译系统使转译反应组分与可抑制转译效率的反应产物分离。所述转译系统是市售的。、另外,可以使用偶合转录/转译系统。偶合转录/转译系统允许将输入的DNA转录成对应的mRNA,而mRNA又被反应组分转译。市售偶合转录/转译的实例是RapidTranslation System (RTS, Roche Inc.)。系统包括含有用于提供诸如核糖体的转译组分的大肠杆菌溶胞产物和转译因子的混合物。另外,包括RNA聚合酶用于将输入DNA转录成适用于转译的mRNA模板。RTS可通过插入反应隔室(包括供应/消耗隔室和转录/转译隔室)之间的膜使反应组分隔开。tRNA的氨基酰化可以通过包括(但不限于)移转酶、聚合酶、催化性抗体、多官能蛋白质,诸如此类的其他试剂执行。if夺氡酰某-tRNA合成酶(0-RS)本发明的O-RS优先地用所选氨基酸在活体外或活体内氨基酰化0-tRNA。本发明的O-RS可通过包括O-RS的多肽和/或通过编码O-RS或其部分的多核苷酸而提供到转译系统(例如,活体外转译组分或细胞)中。举例而言,O-RS或其部分通过如SEQ ID NO. :4中所述的多核苷酸序列或其互补多核苷酸序列或其保守变化编码。本发明的O-RS可以氨基酰化大量不同的0-tRNA分子,包括(但不限于)本文中揭示的所述0-tRNA分子。用于鉴别供0-tRNA (例如0-tRNA)使用的正交氨酰基-tRNA合成酶(O-RS)(例如 O-RS)的方法也是本发明的特征。举例而言,方法包括使第一物种的细胞群体经受正性选择,其中所述细胞各自包含I)多个氨酰基-tRNA合成酶(RS)的成员,其中多个RS包含突变体RS、由不同于第一物种的物种得到的RS或突变体RS和由不同于第一物种的物种得到的RS两者;2)来自第二物种的正交tRNA (0-tRNA);和3)编码正性选择标记物并且包含至少一个选择密码子的多核苷酸。对于与缺乏多个RS的成员或具有降低量的多个RS的成员的细胞相比,展示抑制效率增强的所述细胞来选择或筛选细胞。具有抑制效率增强的细胞包含氨基酰化0-tRNA的活性RS。将来自第一物种的第一组tRNA的通过活性RS氨基酰化(活体外或活体内)的水平,与来自第二物种的第二组tRNA的通过活性RS氨基酰化(活体外或活体内)的水平相比较。氨基酰化的水平可通过可检测物质(例如,经标记的氨基酸或非天然氨基酸)测定。选择与第一组tRNA相比,更有效地氨基酰化第二组tRNA的活性RS,进而提供供0-tRNA使用的正交氨酰基-tRNA合成酶。通过所述方法鉴别的例如O-RS的O-RS也是本发明的特征。可使用大量检定中的任何检定来测定氨基酰化。所述检定可在活体外或活体内执行。举例而言,活体外氨基酰化检定描述于(例如)Hoben, P.和Soil, D. (1985)MethodsEnzymoI. 113:55-59和美国专利申请公开案第2003/0228593号中。氨基酰化也可通过使用报告基因以及正交转译组分,并且检测在细胞中表达包含至少一个编码蛋白质的选择密码子的多核苷酸的报告基因而测定。又参见,标题为“IN VIVO INCORPORATION OF UNNATURALAMINO ACIDS” 的美国专利申请案 10/126,927 和标题为 “EXPANDING THE EUKARYOTICGENETIC CODE” 的 USSN 10/825,867。经鉴别的O-RS可另外经操纵以改变合成酶的底物特异性以便仅所要非天然氨基酸,而不是常见20种氨基酸的任何氨基酸被装填到0-tRNA中。产生对非天然氨基酸具有底物特异性的正交氨酰基tRNA合成酶的方法包括,使合成酶(例如)在合成酶中的活性部位、在合成酶中的编辑机制部位、在通过组合合成酶的不同域的不同部位等处突变,和应用选择处理。使用基于正性选择接着负性选择的组合的策略。在正性选择中,在正性标记物的非基本位置引入的选择密码子的抑制作用使细胞在正性选择压力下存活。在天然氨基酸和非天然氨基酸存在下,存活者因此编码用天然氨基酸或非天然氨基酸装填正交抑制基因tRNA的活性合成酶。在负性选择中,在负性标记物的非基本位置引入的选择密码子的抑制作用除去具有天然氨基酸特异性的合成酶。负性和正性选择的存活者编码仅用非天然氨基酸氨基酰化(装填)正交抑制基因tRNA的合成酶。所述合成酶可随后经受例如DNA滑移或其他递归突变方法的其他突变。突变体O-RS的库可使用所属领域中已知的各种突变技术产生。举例而言,突变体RS可通过部位特异性突变、随机点突变、同源重组、DNA滑移或其他递归突变方法、嵌合建构或其任何组合产生。举例而言,突变体RS的库可由两个或两个以上的其他(例如更小、较少变化)的“子库”产生。RS的嵌合库也包括在本发明中。应注意,来自各种生物体(例如,诸如真细菌或太古细菌的微生物)的tRNA合成酶的库,诸如包含天然多样性的库(参见(例如),Short等人的美国专利第6,238, 884号;Schallenberger等人的美国专利第5,756, 316号;Petersen等人的美国专利第5,783,431号!Thompson等人的美国专利第5,824,485号; Short等人的美国专利第5,958,672号)视需要经建构且对于正交对筛选。一旦合成酶经受正性和负性选择/筛选策略,所述合成酶就可随后经受进一步突变。举例而言,可分离编码O-RS的核酸;可由所述核酸产生一组编码经突变的0-RS(例如,通过随机突变、部位特异性突变、重组或其任何组合)的多核苷酸;并且,可重复所述单独步骤或所述步骤的组合直到获得用非天然氨基酸优先氨基酰化0-tRNA的经突变的0-RS。在本发明的一个方面中,将所述步骤执行多次,例如至少2次。其他水平的选择/筛选严格性也可用于本发明的方法中,以生产0-tRNA、O-RS或其对。选择或筛选严格性可在用以生产O-RS的方法的一个或两个步骤中变化。其可包括(例如)改变所使用的选择/筛选剂的量等。也可执行正性和/或负性选择的其他循环。选择或筛选也可包含一次或多次包括(例如)氨基酸通透性的改变、转译效率的改变、转译保真度的改变等的正性或负性选择或筛选。通常,所述一种或一种以上改变是基于其中使用正交tRNA-tRNA合成酶对来生产蛋白质的生物体中的一个或一个以上基因的突变。其他类型的选择可用于本发明中,以用于(例如)O-RS、0-tRNA和0_tRNA/0_RS对。正性选择标记物可为包括(但不限于)为生长提供营养补充的产物的各种分子中的任何分子,并且选择是在缺乏营养补充的培养基上执行。编码正性选择标记物的多核苷酸的实例包括(但不限于)(例如)基于补充细胞的营养缺陷氨基酸的报告基因、his3基因(例如,其中通过提供3-氨基三唑(3-AT)所检测,his3基因编码咪唑磷酸甘油脱水酶)、ura3基因、leu2基因、lys2基因、IacZ基因、adh基因等。参见(例如),G. M. Kishore和 D. M. Shah, (1988), Amino acid biosynthesis inhibitors as herbicides, AnnualReview of Biochemistry 57:627-663。在一个实施例中,IacZ生产是通过邻硝基苯基-0-D-吡喃半乳糖苷(ONPG)水解作用检测。参见(例如),I.G. Serebriiskii和 E.A.Golemis, (2000), Uses of IacZ to study gene function: evaluation ofbeta-galactosidase assays employed in the yeast two-hybrid system, AnalyticalBiochemistry 285:1-15。其他正性选择标记物包括(例如)荧光素酶、绿色荧光蛋白质(GFP)、YFP、EGFP, RFP、抗生素抗性基因的产物(例如,氯霉素乙酰转移酶(CAT))、转录调节剂蛋白质(例如GAL4)等。视需要,编码正性选择标记物的多核苷酸包含选择密码子。编码正性选择标记物的多核苷酸可操作性地与反应元素连接。也可存在编码调节从反应元素的转录并且包含至少一个选择密码子的转录调节剂蛋白质的其他多核苷酸。通过经非天然氨基酸氨基酰化的0-tRNA将非天然氨基酸并入转录调节剂蛋白质中,产生编码正性选择标记物的多核苷酸(例如报告基因)的转录。视需要,选择密码子位于或大体上靠近编码转录调节剂蛋白质的DNA结合域的多核苷酸的一部分。编码负性选择标记物的多核苷酸也可操作性地与反应元素连接,从所述反应元素的转录是通过转录调节剂蛋白质介导。参见(例如),A. J. DeMaggio等人,(2000), The yeastsplit-hybrid system, Method Enzymol. 328:128-137 ;H.M. Shih等人,(1996), A positivegenetic selection for disrupting protein-protein interactions: identificationof CREB mutations that prevent association with the coactivator CBP,Proc. Natl.Acad. Sci. U. S. A. 93:13896-13901 ;M. Vidal 等人,(1996),Genetic characterizationof a mammalian protein-protein interaction domain by using a yeast reversetwo-hybrid system, Proc. Natl. Acad. Sci. U. S. A. 93:10321-10326 ;和 M. Vidal 等人,(1996), Reverse two-hybrid and one-hybrid systems to detect dissociationof protein-protein and DNA-protein interactions (Proc.Natl. Acad. Sci.U. S. A. 93:10315-10320)。通过经天然氨基酸氨基酰化的0-tRNA将天然氨基酸并入转录调 节剂蛋白质中,产生负性选择标记物的转录。视需要,负性选择标记物包含选择密码子。本发明的正性选择标记物和/或负性选择标记物可包含至少两个选择密码子,其各自或两者可包含至少两个不同的选择密码子或至少两个相同的选择密码子。转录调节剂蛋白质是(直接地或间接地)与核酸序列(例如反应元件)结合的分子,并且调节操作性地与反应元素连接的序列的转录。转录调节剂蛋白质可为转录活化剂蛋白质(例如,GAL4、核激素受体、API、CREB, LEF/tcf家族成员、SMAD、VP16、SPl等),转录阻遏物蛋白质(例如,核激素受体、Groucho/tle家族、中锯齿家族(Engrailed €&111;[17)等),或视环境而定具有两种活性的蛋白质(例如,LEF/tcf、同盒蛋白质(homobox protein)等)。反应元素通常是由转录调节剂蛋白质识别的核酸序列或起与转录调节剂蛋白质一致的作用的其他试剂。转录调节剂蛋白质的另一个实例是转录活化剂蛋白质,GAL4。参见(例如),A. Laughon 等人,(1984), Identification of two proteins encoded by theSaccharomyces cerevisiae GAL4 gene, Molecular&Cellular Biology 4:268—275;A. Laughon 和 R. F. Gesteland, (1984), Primary structure of the Saccharomycescerevisiae GAL4 gene, Molecular& Cellular Biology 4:260-267 ;L.Keegan 等人,(1986), Separation of DNA binding from the transcription-activating functionof a eukaryotic regulatory protein, Science 231:699-704;和M. Ptashne, (1988), Howeukaryotic transcriptional activators work, Nature 335:683-689。所述 881 氨基酸蛋白质的N-末端147氨基酸形成特异性结合DNA序列的DNA结合域(DBD)。参见(例如),M. Carey 等人,(1989), An amino-terminal fragment of GAL4 binds DNA as a dimer, J.Mol. Biol. 209:423-432 ;和 E. Giniger 等人,(1985),Specif ic DNAbinding of GAL4, apositive regulatory protein of yeast, Cell 40:767-774。DBD 是通过插入蛋白质序列与当与DNA结合时可活化转录的C-末端113氨基酸活化域(AD)连接。参见(例如),J. Ma 和 M. Ptashne,(1987),Deletion analysis of GAL4 defines two transcriptionalactivating segments,CelI 48:847-853;和 J. Ma 和 M.Ptashne,(1987),Thecarboxy-terminal 30 amino acids of GAL4 are recognized by GAL80, CelI50:137-142。通过将琥珀密码子朝向(例如)含有GAL4的N-末端DBD和其C-末端AD的单一多肽的N-末端DBD放置,通过O-tRNA/O-RS对的琥珀抑制作用可与通过GAL4的转录活化联系。经GAL4活化的报告基因可用以执行使用基因的正性和负性选择。用于负性选择的培养基可包含通过负性选择标记物转化为可检测物质的选择或筛选剂。在本发明的一个方面中,可检测物质是毒性物质。编码负性选择标记物的多核苷酸可为(例如)ura3基因。举例而言,URA3报告基因可在含有GAL4 DNA结合部位的启动子控制下放置。当负性选择标记物(例如)通过编码具有选择密码子的GAL4的多核苷酸的转译而生产时,GAL4活化URA3的转录。负性选择是在包含5-氟乳清酸(5-F0A)的培养基上完成,所述5-氟乳清酸通过ura3基因的基因产物转化为可检测物质(例如杀死细胞的毒性物质)。参见(例如),J. D. Boeke 等人,(1984), A positive selection for mutantslacking orotidine-S' -phosphate decarboxylase activity in yeast:5-fluorooroticacid resistance, Molecular & General Genetics 197:345-346) ;M. Vidal 等人,(1996), Genetic characterization of a mammalian protein-protein interactiondomain by using a yeast reverse two-hybrid system.,Proc. Natl. Acad. Sci. U. S. A. 93:10321-10326 ;和 M. Vidal 等人,(1996), Reverse two-hybrid andone-hybrid systems to detect dissociation of protein-protein and DNA-proteininteractions. , Proc. Natl. Acad. Sci. U. S. A. 93:10315-10320。与正性选择标记物一样,负性选择标记物也可为各种分子中的任何分子。正性选择标记物和/或负性选择标记物可以是发荧光或在适合的反应物存在下催化发光反应的多肽。举例而言,负性选择标记物包括(但不限于)(例如)荧光素酶、绿色荧光蛋白质(GFP)、YFP、EGFP, RFP、抗生素抗性基因的产物(例如,氯霉素乙酰转移酶(CAT))、IacZ基因的产物、转录调节剂蛋白质等。正性选择标记物和/或负性选择标记物可以通过荧光活化细胞拣选(FACS)或通过发光来检测。正性选择标记物和/或负性选择标记物可以包含基于亲和力的筛选标记物。相同多核苷酸可编码正性选择标记物和负性选择标记物。举例而言,正性选择步骤、负性选择步骤或正性和负性选择步骤可包括使用报告基因,其中报告基因是通过荧光活化细胞拣选(FACS)检测。举例而言,正性选择可先用例如氯霉素乙酰转移酶(CAT)基因的正性选择标记物进行,其中CAT基因包含在CAT基因中的例如琥珀终止密码子的选择密码子,接着进行负性选择筛选,其是基于在例如I7RNA聚合酶基因的负性标记物中的位置上不能抑制(例如)两个或两个以上的选择密码子来进行。正性选择标记物和负性选择标记物可在例如质粒的相同载体上见到。负性标记物的表达驱动例如绿色荧光蛋白质(GFP)的报告基因的表达。选择和筛选的严格性可以变化,例如,使报告基因发荧光所需要的光的强度可以变化。正性选择可用报告基因作为正性选择标记物来进行,所述报告基因是通过FACS筛选,接着进行负性选择筛选,其是基于在例如barnase基因的负性标记物中的位置上不能抑制(例如)两个或两个以上的选择密码子来进行。视需要,报告基因展示在细胞表面上,例如卩遼菌体展示(phage display)等等上。例如基于OmpA的细胞-表面展示系统的细胞-表面展示依靠例如与大肠杆菌细胞表面上的外膜孔蛋白OmpA融合的脊髓灰白质病毒C3肽的具体抗原決定基的表达。仅当蛋白质信息中的选择密码子在转译期间被抑制时,抗原決定基才展示在细胞表面上。然后,所展示的肽含有由库中的突变体氨酰基-tRNA合成酶之一识别出的氨基酸,并且含有对应合成酶基因的细胞可用抵抗含有特定非天然氨基酸的肽而产生的抗体来分离。基于OmpA的细胞-表面展示系统是由Georgiou等人开发且优化以作为噬菌体展示的替换物° 参见,Francisco, J. A. , Campbell, R. , Iverson, B. L.和 Georgoiu, G. Productionand fluorescence-activated cell sorting of Escherichia coli expressing afunctional antibody fragment on the external surface. Proc. Natl. Acad. Sci. USA90:10444-8(1993)。本发明的其他实施例包括活体外进行一个 或一个以上选择步骤。例如合成酶和/或tRNA的所选组分可随后被引入细胞中以用于活体内并入非天然氨基酸。生产O-RS和改变合成酶的底物特异性的其他细节可见于标题为“Methodsand Compositions for the Production of Orthogonal tRNA-Aminoacyl tRNASynthetase Pairs” 的美国专利申请案 10/126,931 和标题为 “EXPANDING THEEUKARYOTIC GENETIC CODE”的USSN 10/825,867,其是以引用的方式并入本文中。生产 O-RS 的其他细节可见于 Hamano-Takaku 等人,(2000)A mutant Escherichia coliTyrosyl-tRNA Synthetase Utilizes the Unnatural Amino Acid AzatyrosineMore Efficiently than Tyrosine, Journal of Biological Chemistry,275(51):40324-40328 ;Kiga 等人,(2002),An engineered Escherichia colityrosyl-tRNA synthetase for site-specific incorporation of an unnaturalamino acid into proteins in eukaryotic translation and its applicationin a wheat germ cell-free system, PNAS99(15):9715-9723 ;和 Francklyn 等人,(2002), Aminoacyl-tRNA synthetases: Versatile players in the changing theateroftranslation;RNA, 8:1363-1372,各参考文献是以引用的方式并入本文中。来源和宿主牛物体本发明的转译组分通常由非真核生物体得到。举例而言,正交0-tRNA可由例如古细菌,诸如詹氏甲烷球菌、横川病毒、诸如富饶盐菌和盐杆菌种NRC-I的盐杆菌属、闪烁古生球菌、火球菌、掘越氏热球菌、嗜热菌敏捷气热菌等等;或真细菌,诸如大肠杆菌、嗜热细菌、嗜热脂肪芽孢杆菌等等的非真核生物体得到,而正交O-RS可由例如横川病毒、诸如富饶盐菌和盐杆菌种NRC-I的盐杆菌属、闪烁古生球菌、火球菌、掘越氏热球菌、嗜热菌敏捷气热菌等等;或真细菌,诸如大肠杆菌、嗜热细菌、嗜热脂肪芽孢杆菌等等的非真核生物体得到。在一个实施例中,也可使用包括(但不限于)植物、藻类、原生生物、真菌、酵母、动物(例如哺乳动物、昆虫、节肢动物等)等等的真核来源。0-tRNA/0-RS对的个别组分可由相同生物体或不同生物体得到。在一个实施例中,0-tRNA/0-RS对是来自相同的生物体。或者,0-tRNA/0-RS对的0-tRNA和O-RS是来自不同的生物体。举例而言,0-tRNA可由(例如)盐杆菌种NRC-I得到,并且O-RS可由(例如)嗜热自养甲烷杆菌得到。0-tRNA,O-RS或0-tRNA/0-RS对可经活体内或活体外选择或筛选和/或用于例如非真核细胞(诸如大肠杆菌细胞)或真核细胞的细胞中以生产具有所选氨基酸(例如非天然氨基酸)的多肽。非真核细胞可来自各种来源,诸如原生种系发生域,包括(但不限于)詹氏甲烷球菌、横川病毒、诸如富饶盐菌和盐杆菌种NRC-I的盐杆菌属、闪烁古生球菌、火球菌、掘越氏热球菌、嗜热菌敏捷气热菌等等,或可属于真细菌种系发生域,包括(但不限于)大肠杆菌、嗜热细菌、嗜热脂肪芽孢杆菌、荧光极毛杆菌、绿脓杆菌、恶息极毛杆菌等等。真核细胞可来自各种来源,包括(但不限于)植物(例如,诸如单子叶植物或双子叶植物的复杂植物)、藻类、原生生物、真菌、酵母(包括(但不限于)酿酒酵母);动物(包括(但不限于)哺乳动物、昆虫、节肢动物等)等等。具有本发明的转译组分的细胞的组合物也是本发明的特征。对在一种物种中筛选用于另一种物种的0-tRNA和/或O-RS来说,又参见,标题为“Expandingthe Eukaryotic Genetic Code” 的 USSN 10/825,867。为在宿主细胞中表达具有所选氨基酸的所关注的多肽,所属领域的技术人员可以将编码所关注的多肽的多核苷酸亚克隆到表达载体中,该表达载体含有指导转录的启动子、转录/转译终止子和(如果对于编码蛋白质的核酸来说)用于转译起始的核糖体结合部位的。适合的细菌启动子在所属领域中为熟知的并且描述于(例如)Samtoook等人和Ausubel等人中。用于表达所关注的多肽的细菌表达系统可在包括(但不限于)大肠杆菌、芽胞杆菌种、荧光极毛杆菌、绿脓杆菌、恶息极毛杆菌和沙门氏菌(沙门氏菌属)中得到(Palva等人,Gene 22:229-235(1983) ;Mosbach 等人,Nature 302:543-545(1983))。用于所述表达系统的试剂盒是市售的。用于哺乳动物细胞、酵母和昆虫细胞的真核表达系统在所属领域中是熟知的并且也是市售的。本发明的tRNA和/或RS和/或所关注的多肽可以应用于和/或表达于包括(例如)酵母、昆虫细胞、哺乳动物细胞和细菌的许多适合的表达系统中。示范性表达系统的描述提供于下文。酵母如本文所使用,术语“酵母”包括能够表达所关注的多肽的各种酵母中的任何酵母。所述酵母包括(但不限于)产子囊孢子酵母(内孢霉目(Endomycetales))、担子菌有抱子酵母(basidiosporogenous yeast)和属于半知菌(芽生菌(Blastomycetes))群组的酵母。产子囊孢子酵母分成2个科,即蚀精霉科(Spermophthoraceae)和酵母科(Saccharomycetaceae)。后者包含 4 个亚科,即裂殖酵母亚科(Schizosaccharomycoideae)(例如,裂殖酵母属(genus Schizosaccharomyces))> 拿逊酵母亚科(Nadsonioideae)、Lipomycoideae 和 Saccharomycoideae (例如毕赤氏酵母属(genera Pichia)、克卢费氏酵母属(Kluyveromyces)和酵母菌属(Saccharomyces))。担子菌有孢子酵母包括担子菌白冬抱酵母属(genera Leucosporidium)、红冬抱酵母属(Rhodosporidium)、锁掷酵母属(Sporidiobolus)、线黑粉菌属(Filobasidium)和香灰拟锁担菌属(Filobasidiella)。属于半知菌(芽生菌)群组的酵母分成2个科,即掷孢酵母科(Sporobolomycetaceae)(例如,掷孢酵母属(genera Sporobolomyces)和布勒弹孢酵母属(Bullera))和隐球酵母科(Cryptococcaceae)(例如念珠菌属(genus Candida))。供本发明使用的尤其受关注的是以下物种中的物种毕赤氏酵母属、克卢费氏酵母属、酵母菌属、裂殖酵母属、汉逊酵母属(Hansenula)、球拟酵母属(Torulopsis)和念珠菌属,包括(但不限于)巴斯德毕赤酵母(P. pastoris)、P. guiIlerimondii、酿酒酵母、嘉士伯酵母(S. carlsbergensis)、糖化酵母(S. diastaticus)、道格拉斯酵母(S. douglasii)、科鲁维尔酵母(S. kluyveri)、诺本斯酵母(S. norbensis)、卵形酵母(S. oviformis)、乳酸克鲁维酵母(K. lactis)、乳糖酶酵母(K. fragilis)、白色念珠菌(C. albicans)、麦芽糖假 丝酵母(C. maltosa)和汉森酵母(H. polymorpha)。酵母通常可从包括(但不限于)以下来源的各种来源购得Yeast Genetic Stock Center、Department of Biophysics andMedical Physics,University of California (Berkeley, CA)和 American Type CultureCollection (iiATCCO (Manassas, VA)0术语“酵母宿主”或“酵母宿主细胞”包括可用作或已经用作用于重组载体或其他转移DNA的接受者的酵母。术语包括已经接受重组载体或其他转移DNA的原始酵母宿主细胞的子代。应了解,由于意外的或有意的突变,单一亲代细胞的子代可以不必在形态学或补充于原始母体的染色体组或总DNA方面完全相同。足够相似于有待通过诸如编码所关注的多肽的核苷酸序列存在的相关性质表征的母体的亲代细胞的子代包括在所述定义所指的子代中。已经开发包括染色体外复制子或合并载体的表达和转形载体,用于转形到许多酵母宿主中。举例而言,已经开发用于酿酒酵母的 表达载体(Sikorski等人,GENETICS(1989) 122:19 ;Ito 等人,J. Bacteeiol. (1983) 153:163 ;Hinnen 等人,Peoc. Natl.Acad. Sci. USA(1978)75:1929);用于白色念珠菌的表达载体(Kurtz 等人,MOL. CELL.BIOL. (1986)6:142);用于麦芽糖假丝酵母的表达载体(Kunze等人,J-Basic Miceobiol.(1985)25:141);用于汉森酵母的表达载体(Gleeson 等人,J. Gen. Miceobiol. (1986) 132:3459 ;Roggenkamp 等人,MOL. GENETICS AND GENOMICS (1986) 202:302);用于乳糖酶酵母的表达载体(Das等人,J. BACTERI0L. (1984) 158:1165);用于乳酸克鲁维酵母的表达载体(DeLouvencourt 等人,J. BACTERI0L· (1983) 154:737 ;Van den Berg 等人,BIOTECHNOLOGY (NY)(1990)8:135);用于 P. guillerimondii 的表达载体(Kunze 等人,J. BASIC MICROBIOL.(1985)25:141);用于巴斯德毕赤酵母的表达载体(美国专利第5,324, 639 ;4,929,555 ;和 4,837,148 号;Cregg 等人,MOL. CELL. BIOL. (1985)5:3376);用于粟酒裂殖酵母(Schizosaccharomyces pombe)的表达载体(Beach 等人,NATURE (1982) 300:706);和用于解脂耶罗威亚酵母(Y. Iipolytica);构巢曲霉(A. nidulans)的表达载体(Ballance等人,Biochem. Biophys. Res. Commun. (1983) 112:284-89 ;TiIburn 等人,Gene(1983) 26:205-221 ;和 Yelton等人,Proc- Natl. Acad. Sci. USA(1984) 81:1470-74);用于黑霉菌(A. niger)的表达载体(Kelly和 Hynes, EMBO J. (1985)4:475-479);用于里氏木霉(Τ· reesia)的表达载体(EP 0244234);和用于诸如脉孢菌属(Neurospora)、青霉属(Penicillium)、弯颈霉属(Tolypocladium)的丝状真菌的表达载体(WO 91/00357),各个参考文献是以引用的方式并入本文中。酵母载体的控制序列为所属领域的技术人员所知并且包括(但不限于)来自诸如以下基因的基因的启动子区域醇脱氢酶(ADH) (EP 0284044);烯醇酶;葡糖激酶;葡糖-6-磷酸异构酶;甘油醛-3-磷酸-脱氢酶(GAP或GAPDH);己糖激酶;磷酸果糖激酶;3-磷酸甘油酸变位酶;和丙酮酸激酶(PyK) (EP 0329203)。编码酸性磷酸酶的酵母PH05基因也可以提供有效的启动子序列(Miyanohara等人,PR0C. NATL. ACAD. SCI.USA (1983) 80:1)。供酵母宿主使用的其他适合的启动子序列可以包括3-磷酸甘油酸激酶(Hitzeman等人,J.BI0L.CHEM. (1980) 255:12073);和其他糖解酶,诸如丙酮酸脱羧酶、磷酸丙糖异构酶和磷酸葡糖异构酶(Holland等人,Biochemistry (1978) 17:4900;Hess等人,J. AdvEnzyme Reg. (1969) 7:149)的启动子。具有通过生长条件来控制的转录的额外优点的诱导型酵母启动子,可以包括醇脱氢酶2 ;异细胞色素C ;酸性磷酸酶;金属硫蛋白;甘油醛-3-磷酸脱氢酶;与氮代谢相关的降解酶;和担负麦芽糖和半乳糖应用的酶的启动子区域。适用于酵母表达的适合的载体和启动子另外描述于EP 0073657中。酵母强化子也可以与酵母启动子一起使用。另外,合成启动子也可以起酵母启动子的作用。举例而言,酵母启动子的上游活化序列(UAS)可以与另一酵母启动子的转录活化区域接合,产生合成杂交启动子。所述杂交启动子的实例包括与GAP转录活化区域连接的ADH调节序列。参见美国专利第4,880,734和4,876,197号,其是以引用的方式并入本文中。杂交启动子的其他实例所包括的启动子由与诸如GAP或PyK的糖解酶基因的转录活化区域组合的ADH2、GAL4、GALlO或PH05基因的调节序列组成。参见EP 0164556。此外,酵母启动子可以包括具有结合酵母RNA聚合酶并且引发转录的能力的非酵母源的天然存在的启动子。可以包含部分酵母表达载体的其他控制元件包括(例如)来自GAPDH或烯醇酶基因的终止子(Holland等人,J.BI0L.CHEM. (1981)256:1385)。另外,来自2 μ质粒源的复制源适用于酵母。适用于酵母的适合的选择基因是存在于酵母质粒中的trpl基因。参见, Tschumper 等人,GENE (1980) 10:157 ;Kingsman 等人,GENE (1979) 7:141。trpl 基因提供 为没有能力在色氨酸中生长的酵母突变菌株的选择标记物。同样地,缺Leu2的酵母菌株(ATCC20,622或38,626)是通过带有Leu2基因的已知质粒补充。将外原性DNA引入酵母宿主中的方法为所属领域的技术人员所知,并且通常包括(但不限于)用碱性阳离子处理的球形体或完整酵母宿主细胞的转形。举例而言,酵母的转形可根据 Hsiao 等人,PR0C.NATL.ACAD. SCI.USA(1979)76:3829 和 Van Solingen 等人,J.BACT. (1977) 130:946中所述的方法进行。然而,诸如通过核注射、电穿孔或原生质体融合的用于将DNA引入细胞中的其他方法,也可以如SAMBR00K等人,MOLE⑶LAR CLONING:ALAB. MANUAL(2001)中的一般描述使用。然后,可以使用为所属领域的技术人员所知的标准技术培养酵母宿主细胞。用于在酵母宿主细胞中表达异源蛋白质的其他方法为所属领域的技术人员所知。通常参见,美国专利公开案第20020055169号、美国专利第6, 361,969 ;6,312,923 ;6,183,985 ;6,083,723 ;6,017,731 ;5,674,706 ;5,629,203 ;5,602,034 ;和 5,089,398号;美国再审专利第RE37, 343和RE35, 749号;PCT公开专利申请案WO 99/078621 ;W098/37208 ;和 WO 98/26080 ;欧洲专利申请案 EP 0946736 ;EP 0732403 ;EP 0480480 ;W090/10277 ;EP 0340986 ;EP 0329203 ;EP 0324274 ;和 EP 0164556,所述专利是以引用的方式并入本文中。又参见 Gellissen 等人,ANTONIE VAN LEEUWENHOEK(1992)62 (1-2) :79-93 ;Romanos 等人,YEAST(1992)8 (6):423-488 ;Goeddel, METHODS IN ENZYM0L0GY(1990) 185:3-7,各个参考文献是以引用的方式并入本文中。酵母宿主菌株在扩增阶段期间,使用为所属领域的技术人员所知的标准进料分批发酵方法,在发酵罐中生长。发酵方法可以由于具体的酵母宿主的碳利用路径或表达控制的模式的差异而修改。举例而言,酵母菌属酵母宿主的发酵可需要单一葡萄糖进料、复合氮源(例如酪蛋白水解物)和多次维生素增补。相反,甲基营养型酵母巴斯德毕赤酵母可需要甘油、甲醇和痕量矿物质进料,但仅需要简单的铵(氮)盐以达到最佳生长和表达。参见(例如),以引用的方式并入本文中的美国专利第5,324,639号;Elliott等人,J. PROTEINCHEM. (1990)9:95 ;和 Fieschko 等人,BIOTECH. BI0ENG. (1987)29:1113。然而,所述发酵方法可以具有某些独立于所用酵母宿主菌株的共同特征。举例而言,通常为碳的生长限制营养物可在扩增阶段期间被添加到发酵罐中以容许最大生长。另夕卜,发酵方法通常使用经设计以含有足够量的碳、氮、基本盐、磷和其他微量养分(维生素、痕量矿物质和盐等)的发酵培养基。适于供毕赤氏酵母属使用的发酵培养基的实例描述于美国专利第5,324,639和5,231,178号中,所述专利是以弓I用的方式并入本文中。经杆状病毒感染的昆虫细胞术语“昆虫宿主”或“昆虫宿主细胞”指的是可用作或已经用作用于重组载体或其他转移DNA的接受者的昆虫。术语包括已经被转染的原始昆虫宿主细胞的子代。应了解,由于意外的或有意的突变,单一亲代细胞的子代可以不必在形态学或补充到原始母体的染色体组或总DNA方面完全相同。足够相似于有待通过诸如编码所关注的多肽的核苷酸序列存在的相关性质表征的母体的亲代细胞的子代包括在所述定义所指的子代中。用于表达所关注的多肽的适合昆虫细胞的选择为所属领域的技术人员所知。若干昆虫物种充分描述于所属领域中并且是市售的,包括埃及伊蚊(Aedes aegypti)、家蚕(Bombyx mori)、果妮(Drosophila melanogaster)、草地夜蛾(Spodoptera frugiperda) 和粉纹夜蛾(Trichoplusia ni)。在选择用于表达的昆虫宿主时,适合的宿主可以包括展示具有(尤其)良好分泌能力、低蛋白质分解活性和总坚固性的所述宿主。昆虫通常可从包括(但不限于)以下来源的各种来源购得Insect Genetic Stock Center、Departmentof Biophysics and Medical Physics, University of California (Berkeley;CA);和American Type Culture Collection (“ATCC,,)(Manassas, VA)。通常,经杆状病毒感染的昆虫表达系统的组分包括转移载体,通常为细菌质粒,其含有杆状病毒基因组的片段和用于插入待表达的异源基因的适当的限制性部位;具有与转移载体中的杆状病毒特异性片段同源的序列的野生型杆状病毒(其允许异源基因在杆状病毒基因组中的同源重组);和适当的昆虫宿主细胞和生长培养基。用于构建载体、转染细胞、挑选溶菌斑、使细胞在培养物中生长诸如此类的物质、方法和技术在所属领域中为已知的并且描述所述技术的手册是可用的。将异源基因插入转移载体中后,载体和野生型病毒基因组被转染到载体和病毒基因组在其中重组的昆虫宿主细胞中。表达经包装的重组病毒并且鉴别和纯化重组溶菌斑。用于杆状病毒/昆虫细胞表达系统的物质和方法,是以来自(例如)InvitrogenCorp. (Carlsbad, CA)的试剂盒形式市售。所述技术通常为所属领域的技术人员所知并且全部描述于以引用的方式并入本文的SUMMERS和SMITH, TEXAS AGRI⑶LTURALEXPERIMENT STATION BULLETIN 第 1555 号(1987)中。又参见,Richardson, 39METH0DS INMOLECULAR BIOLOGY:BACUL0VIRUS EXPRESSION PROTOCOLS (1995) ;AUSUBEL 等人,CURRENTPROTOCOLS IN MOLECULAR BIOLOGY 16.9-16. 11(1994) ;KING 和 POSSEE, THE BACULOVIRUSSYSTEM:A LABORATORY GUIDE(1992);和 O’REILLY 等人,BACULOVIRUS EXPRESSIONVECTORS:ALAB0RAT0RY MANUAL(1992)。实际上,使用杆状病毒/昆虫细胞表达系统的各种异源蛋白质的生产为所属领域的技术人员所知。参见(例如),美国专利第6,368, 825 ;6,342,216 ;6,338, 846 ;6,261,805 ;6,245,528 ;6,225,060 ;6,183,987 ;6,168,932 ;6,126,944 ;6,096,304 ;6,013,433 ;5,965,393 ;5,939,285 ;5,891,676 ;5,871,986 ;5,861,279 ;5,858,368 ;5,843,733 ;5,762,939 ;5,753,220 ;5,605,827 ;5,583,023 ;5,571,709 ;5,516,657 ;5,290,686 号;WO 02/06305 ;W0 01/90390 ;W0 01/27301 ;W0 01/05956 ;W0 00/55345 ;W0 00/20032 ;WO 99/51721 ;W0 99/45130 ;W0 99/31257 ;W0 99/10515 ;W0 99/09193 ;W0 97/26332 ;WO 96/29400 ;W0 96/25496 ;W0 96/06161 ;W0 95/20672 ;W0 93/03173 ;W0 92/16619 ;WO 92/02628 ;W0 92/01801 ;W0 90/14428 ;W0 90/10078 ;W0 90/02566 ;W0 90/02186 ;W090/01556 ;W0 89/01038 ;W0 89/01037 ;W0 88/07082号,所述专利以引用的方式并入本文中。适用于杆状病毒/昆虫细胞表达系统的载体在所属领域中为已知的并且包括(例如)由杆状病毒苜猜丫纹夜蛾(Autographacalifornica)核型多角体病毒(AcNPV)得到的昆虫表达和转移载体,其为辅助病毒(helper)独立性、病毒表达载体。由所述系统得到的病毒表达载体通常使用强病毒性多角体蛋白基因启动子来驱动异源基因的表达。通常参见,O’Reilly 等人,BACULOVIRUS EXPRESSION VECTORS:A LABORATORYMANUAL(1992)。在将外来基因插入杆状病毒基因组中之前,通常将包含启动子、引子(如果需要)、所关注的编码序列和转录终止序列的上述组分装配成中间错位构筑体(转移载体)。常将中间错位构筑体维持在诸如能够稳定维持在诸如细菌的宿主中的其他染色体元件(例如质 粒)的复制子中。复制子将会具有复制系统,因此容许其被维持在用于克隆和扩增的适合的宿主中。更明确地说,质粒可以含有多角体蛋白多聚腺苷酸化信号(Mi 11 er, Ann. Rev.Microbiol. (1988)42:177)和原核抗氨节青霉素(amp)基因和用于在大肠杆菌中选择和繁殖的复制源。用于将外来基因引入AcNPV中的一种常用转移载体是pAc373。也已经设计了为所属领域的技术人员所知的许多其他载体,包括(例如)pVL985,其将多角体蛋白起始密码子从ATG改变成ATT,并且在ATT下游的32个碱基对处引入BamHI克隆部位。参见,Luckow和 Summers, Virology 170:31(1989)。其他市售载体包括(例如)PBlueBac4. 5/V5_His ;pBlueBacHis2 ;pMelBac ;pBlueBac4. 5 (Invitrogen Corp. , Carlsbad, CA)。在插入异源基因后,将转移载体和野生型杆状病毒基因组共转染到昆虫细胞宿主中。用于将异源DNA引入杆状病毒病毒中的所要部位中的方法在所属领域中为已知的。参见,Summers 和 Smith, Texas Ageicultueal Expeeiment Station BulletinJ^J 1555 可(1987) ;Smith ^人,MOL. CELL. B10L. (1983)3:2156 ; Luckow 和 Summers, Virology (1989) 170:31 举例而言,插入可为通过同源复式转线轨道重组,插入到诸如多角体蛋白基因的基因中;插入也可为插入到被工程化成所要杆状病毒基因的限制性内切酶部位中。参见,Miller等人,Bioessays (1989) 11(4):91。转染可以通过电穿孔完成。参见Trotter And Wood, 39Methods inMolecular Biology(1995) ;Mann 和 King, J. Gen. Virol. (1989)70:3501。或者,月旨质体可用以转染具有重组表达载体和杆状病毒的昆虫细胞。参见(例如),Liebman等人,Biotechniques(1999)26(1) :36 ;Graves 等人,BIOCHEMISTRY(1998) 37:6050 ;Nomura等人,J. B10L. CHEM. (1998) 273 (22) : 13570 ;SCHMIDT 等人,PROTEIN EXPRESSION ANDPURIFICATION(1998) 12:323 ;Siffert 等人,NATURE GENETICS (1998) 18:45 ;TILKINS 等人,CELL BIOLOGY:A LABORATORY HANDBOOK 145-154(1998) ;CAI 等人,PROTEIN EXPRESSIONANDPURIFICATION (1997) 10:263 ;D0LPHIN 等人,NATURE GENETICS (1997) 17:491 ;Kost 等人,GENE (1997) 190:139 JAK0BSS0N 等人,J. BIOL. CHEM. (1996)271:22203 ;Rowles 等人,J. BIOL. CHEM. (1996) 271 (37) :22376 ;Reverey 等人,J. BIOL. CHEM.(1996) 271 (39) : 23607-10 !Stanley 等人,J. BIOL. CHEM. (1995) 270:4121 ;Sisk 等人,J. Virol. (1994) 68 (2) : 766 ;和 Peng 等人,BIOTECHNIQUES (1993) 14 (2) : 274。市售脂质体包括(例如)Cellfectin 和Lipofectin (Invitrogen, Corp. , Carlsbad, CA)。另夕卜,可以使用磷酸钙转染。参见,TROTTER AND WOOD, 39 METHODS IN MOLECULAR BIOLOGY(1995);Kitts, NAR(1990) 18(19) :5667 ;和,Mann 和 King, J. GEN. VIROL. (1989)70:3501。杆状病毒表达载体通常含有杆状病毒启动子。杆状病毒启动子是任何能够结合杆状病毒RNA聚合酶并且弓I发将编码序列(例如结构基因)下游(3’)转录成mRNA的DNA序列。启动子将具有通常位于最接近于编码序列的5’末端的转录起始区域。所述转录起始区域通常包括RNA聚合酶结合部位和转录起始部位。杆状病毒启动子也可以具有称为强化子的第二域,如果存在,那么其通常远离结构基因。此外,表达可为调节性或为构成性的。在感染循环的后期充分转录的结构基因提供尤其有效的启动子序列。实例包括
由编码病毒多面体蛋白质的基因(Friesen等人,The Regulation of Baculovirus GeneExpression, THE MOLECULAR BIOLOGY OF BACULOVIRUSES(1986) ;EP 0127839 和 0155476)和编码plO蛋白质的基因(Vlak等人,J. Gen. Virol. (1988)69:765)得到的序列。将新形成的杆状病毒表达载体包装到感染重组杆状病毒中并且随后,可以通过为所属领域的技术人员所知的技术纯化已生长的溶菌斑。参见,Miller等人,Bioessays(1989)11(4):91 ;SUMMERS和SMITH, TEXAS AGRICULTURAL EXPERIMENT STATIONBULLETIN第1555 号(1987)。已经开发用于感染到若干昆虫细胞中的重组杆状病毒表达载体。举例而言,已经开发尤其用于埃及伊蚊(ATCC第CCL-125号)、家蚕(ATCC第CRL-8910号)、果蝇(ATCC第1963号)、草地夜蛾和粉蚊夜蛾的重组杆状病毒。参见,Wright, NATURE (1986)321:718 ;Carbonell 等人,J. VIROL. (1985)56:153 ;Smith 等人,MOL. CELL. BIOL. (1983)3:2156。通常参见,Fraser等人,InVitkqCELL. DEV. BIOL. (1989)25:225。更明确地说,用于杆状病毒表达载体系统的细胞系通常包括(但不限于)Sf9 (草地夜蛾)(ATCC第CRL-1711号)、Sf21 (草地夜蛾)(Invitrogen Corp. , Cat.第 11497-013 号(Carlsbad, CA))、Tri-368 (粉蚊夜蛾)和 High-Five BTI-TN-5B1-4 (粉蚊夜蛾)。用于在杆状病毒/表达中直接表达和融合表达异源多肽的细胞和培养基是市售的,并且细胞培养技术通常为所属领域的技术人员所知。大肠杆菌、假单胞菌种和其他原核牛物细菌表汰技术为所属领域的技术人员所知。多种载体可得到用于细菌宿主中。载体可以是单拷贝或低或高多拷贝载体。载体可以用于克隆和/或表达。鉴于关于载体、许多载体的工业效用和甚至描述载体和其限制图和特征的手册的丰富的文献,在此不需要广泛讨论。如所熟知的,载体通常涉及允许选择的标记物,所述标记物可以提供细胞毒性剂抗性、原营养或免疫性。常常,存在提供不同特征的多个标记物。细菌启动子是任何能够结合细菌RNA聚合酶和引发将编码序列(例如结构基因)下游(3’)转录成mRNA的DNA序列。启动子将具有通常位于最接近于编码序列的5’末端的转录起始区域。所述转录起始区域通常包括RNA聚合酶结合部位和转录起始部位。细菌的启动子也可以具有称为操纵子的第二域,其可以重叠RNA合成开始处的邻近RNA聚合酶结合部位。操纵子容许负性调节(诱导型)转录,因为基因阻遏蛋白可以结合操纵子并且进而抑制特定基因的转录。构成性表达可以在不存在诸如操纵子的负性调节元件时发生。另外,正性调节可以通过基因活化子蛋白结合序列达成,如果存在,那么其通常最接近于RNA聚合酶结合序列(5’)。基因活化子蛋白质的实例是代谢活化蛋白(CAP),其帮助引发Iac操纵子在大肠杆菌中的转录[Raibaud等人,ANNU. REV. GENET. (1984) 18:173]。经调节的表达因此可以是正性的或负性的,进而增强或者减少转录。编码代谢路径酶的序列提供尤其有效的启动子序列。实例包括由诸如半乳糖、乳糖(lac) [Chang等人,Nature (1977) 198:1056]和麦芽糖的糖代谢酶得到的启动子序列。其他实例包括由诸如色氨酸(trp)的生物合成酶得到的启动子序列[Goeddel等人,Nuc. Acids Res. (1980) 8:4057 ;Yelverton 等人,Nucl. Acids Res. (1981) 9:731 ;美国专利第4,738,921号;欧洲专利公开案第036776和121775号,其是以引用的方式并入本文中]。β -半乳糖苷酶(bla)启动子系统[Weissmann (1981) “The cloning of interferonand other mistakes.,,In Interferon 3 (I. Gresser 编)]、卩遼菌体 λ PL[Shimatake 等人,Nature (1981) 292:128]和T5 [美国专利第4,689,406号]启动子系统也提供有效的启动子·序列。诸如Τ7启动子的强启动子可用以诱导高水平的所关注的多肽。所述载体的实例为所属领域的技术人员所知并且包括来自Novagen的ρΕΤ29系列和描述于以引用的方式并入本文中的W099/05297中的pPOP载体。所述表达系统在宿主中产生高水平的多肽,而不会危害宿主细胞生存性或生长参数。PET19 (Novagen)是在所属领域中已知的另一种载体。另外,非天然存在的合成启动子也起细菌启动子的作用。举例而言,一个细菌启动子或噬菌体启动子的转录活化序列可以与另一个细菌启动子或噬菌体启动子的操纵子序列接合,产生合成杂交启动子[美国专利第4,551,433号,所述专利是以引用的方式并入本文中]。举例而言,tac启动子是通过Iac阻遏物调节的由trp启动子和Iac操纵子序列组成的杂交 trp-lac 启动子[Amann 等人,GENE (1983) 25:167; de Boer 等人,Peoc. Natl. Acad.Sci. (1983)80:21]。此外,细菌启动子可包括具有结合细菌RNA聚合酶并且引发转录的能力的非细菌性源的天然存在的启动子。非细菌性源的天然存在的启动子也可与相容的RNA聚合酶偶合以产生一些基因在原核生物中的高水平表达。细菌磷酸酶(bacteriophase)T7 RNA聚合酶/启动子系统是经偶合的启动子系统的实例[Studier等人,J. Mol. Biol.(1986) 189:113 ;Tabor 等人,Proc Natl. Acad. Sci. (1985)82:1074]。另外,杂交启动子也可由噬菌体启动子和大肠杆菌操纵子区域组成(欧洲专利公开案第267851号)。除功能启动子序列之外,有效的核糖体结合部位也适用于外来基因在原核生物中的表达。在大肠杆菌中,核糖体结合部位称为Shine-Dalgarno (SD)序列并且包括起始密码子(ATG)和定位于起始密码子的3-11个核苷酸上游的长度为3-9个核苷酸的序列[Shine等人,Nature (1975) 254:34]。认为SD序列通过SD序列与大肠杆菌16SrRNA的3’末端之间的碱基的配对,而促进mRNA与核糖体的结合[Steitz等人“Geneticsignals and nucleotide sequences in messenger RNA,,,In Biological Regulationand Development: Gene Expression (Ed. R. F. Goldberger, 1979)]。用弱核糖体结合部位表达真核基因和原核基因[Sambrook 等人 “Expression of cloned genes in Escherichiacoli,,,Molecular Cloning:A Laboratory Manual, 1989]。术语“细菌宿主”或“细菌宿主细胞”指的是可用作或已经用作用于重组载体或其他转移DNA的接受者的细菌。术语包括已经转染的原始细菌宿主细胞的子代。应了解,由于意外的或有意的突变,单一亲代细胞的子代可以不必在形态学或补充于原始母体的染色体组或总DNA方面完全相同。足够相似于有待通过诸如编码hGH的核苷酸序列存在的相关性质表征的母体的亲代细胞的子代包括在所述定义所指的子代中。用于表达多肽的适合寄主细菌的选择为所属领域的技术人员所知。在选择用于表达的细菌宿主时,适合的宿主可以包括展示具有(尤其)良好内含体形成能力、低蛋白质分解活性和总坚固性的所述宿主。细菌宿主通常可从包括(但不限于)以下来源的各种来源购得Bacterial Genetic Stock Center、Department of Biophysics and MedicalPhysics, University of California (Berkeley, CA); 和 American Type CultureCollection (“ATCC”)(Manassas,VA)。工业发酵/医药发酵通常使用由K菌株(例如W3110)得到的细菌或由B菌株(例如BL21)得到的细菌。所述菌株是尤其有效的,因为其生长参数是十分熟知的和稳固的。另外,所述菌株是非病原性的,其在商业上对安全性和环境原因为重要的。适合的大肠杆菌宿主的其他实例包括(但不限于)BL21、DH10B或其衍生物的菌株。在本发明的方法的另一个实施例中,大肠杆菌宿主是包括(但不限于)OMP-和LON-的蛋白酶负菌株。宿主细胞菌株可以是包括(但不限于)荧光极毛杆菌、绿脓杆菌和恶息极毛杆菌的假单胞杆菌种。已知命名为菌株MB 101的荧光极毛杆菌生物变种I适用于重组生产并且可用于治疗性蛋白质生产工艺。假单胞菌表达系统的实例包括可以宿主菌株(可在WorldWide Web, dow. com 上购得的 Midland, MI)购自 Dow Chemical Company 的系统。以引用的方式并入本文中的美国专利第4,755,465和4,859,600号,描述假单胞菌株作为用于hGH生产的宿主细胞的用途。一旦重组宿主细胞菌株已经建立(也就是说,表达构筑体已经被引入宿主细胞中并且具有正确表达构筑体的宿主细胞被分离),就在适于生产所关注的多肽的条件下培养重组宿主细胞菌株。如所属领域的技术人员显而易见的,培养重组宿主细胞菌株的方法将视所利用的表达构筑体的性质和宿主细胞的同一性而定。通常使用所属领域中熟知的方法培养重组宿主菌株。重组宿主细胞通常是在含有碳、氮和无机盐的可吸收源,和(视需要)含有维生素、氨基酸、生长因子和其他为所属领域的技术人员所知的蛋白质培养补充物的液 体培养基中培养。用于培养宿主细胞的液体培养基可以视需要含有防止不良微生物生长的抗生素或抗真菌剂和/或包括(但不限于)选择含有表达载体的宿主细胞的抗生素的化合物。重组宿主细胞可以分批或以连续形式培养,同时细胞收集(在所关注的多肽细胞内积聚的情况下)或培养物上清液的收集以分批或以连续形式进行。为在原核宿主细胞中进行生产,分批培养和细胞收集为优选的。诜择密码子本发明的选择密码子扩展蛋白质生物合成器的遗传密码子框架。举例而言,选择密码子包括(例如)独特的3碱基密码子,无义密码子,诸如包括(但不限于)琥珀密码子(UAG)、赭石密码子或蛋白石密码子(UGA)的终止密码子,非天然密码子,4碱基(或4个以上)密码子,稀有密码子等等。大量选择密码子(例如一个或一个以上、两个或两个以上、3个或3个以上的选择密码子)可被引入所要基因或多核苷酸中。在一个实施例中,方法涉及选择密码子的用途,该选择密码子为用于活体内并入例如非天然氨基酸的所选氨基酸的終止密码子。举例而言,生产识别終止密码子的O-tRNA并且通过O-RS用所选氨基酸氨基酰化。所述Ο-tRNA不能通过天然存在的宿主的氨酰基-tRNA合成酶识别出。惯用定位突变可用以在所关注的多肽中的所关注部位引入终止密码子。參见(例如),Sayers, J. R.等人(1988),5’_3’Exonucleases inphosphorothioate-based oligonucleotide-airected mutagenesis Nucleic AcidsResl6:791-802。当0-RS、0_tRNA和编码所关注的多肽的核酸(例如)活体内组合吋,响应终止密码子并入所选氨基酸以得到在规定位置上含有例如非天然氨基酸的所选氨基酸的多肽。在本发明的一个实施例中,用作选择密码子的终止密码子是琥珀密码子UAG和/或蛋白石密码子UGA。举例而言,就识别琥珀密码子的Ο-tRNA的实例来说,參见SEQ ID NO. :6,并且就识别蛋白石密码子的Ο-tRNA的实例来说,參见SEQ ID NO. :7。UAG和UGA都用作选择密码子的遗传密码可编码22种氨基酸,同时保持为最丰富終止信号的赭石无义密码子UAA。能在活体内并入例如非天然氨基酸的所选氨基酸而不会显著干扰宿主细胞。举例而言,在诸如大肠杆菌的非真核细胞中,因为UAG密码子的抑制效率视例如琥珀抑制基因tRNA的Ο-tRNA与释放因子I (RFl)(其结合于UAG密码子并且引发生长肽从核糖体的释 放)之间的竞争而定,所以抑制效率可通过(例如)增加例如抑制基因tRNA的Ο-tRNA的表达水平或使用缺乏RFl的菌株来调节。在真核细胞中,因为UAG密码子的抑制效率视例如琥珀抑制基因tRNA的Ο-tRNA与真核释放因子(例如eRF)(其结合于终止密码子并且引发生长肽从核糖体的释放)之间的竞争而定,所以抑制效率可通过(例如)増加例如抑制基因tRNA的Ο-tRNA的表达水平来调节。非天然氨基酸也能由稀有密码子编码。举例而言,当活体外蛋白质合成反应中的精氨酸浓度降低吋,已经证明稀有的精氨酸密码子,即AGG对通过由丙氨酸酰化的合成tRNA插入Ala来说为有效的。參见(例如),Ma等人,Biochemistry. 32:7939(1993)。在所述情况下,合成tRNA与作为次要物种存在于大肠杆菌中的天然存在的tRNAArg竞争。ー些生物体不使用所有的三联体密码子。藤黄微球菌(Micrococcus Iuteus)中的未指定的密码子AGA已经被应用于在活体外转录/转译提取物中插入氨基酸。參见(例如),Kowal和Oliver. Nucl. Acid. Res. . 25:4685(1997)。可产生本发明的组分以在活体内使用所述稀有密码子。选择密码子也包含(例如)4个或4个以上碱基密码子的扩展密码子,诸如4个、5个、6个或6个以上碱基密码子。4碱基密码子的实例包括(但不限于)AGGA, CUAG, UAGA,CCCU,诸如此类。5碱基密码子的实例包括(但不限于)AGGAC,CCCCU、CCCUC、CUAGA, CUACU、UAGGC,诸如此类。特征可包括基于移码抑制使用扩展密码子。4个或4个以上碱基密码子可将(例如)ー种或多种包括(但不限干)非天然氨基酸的所选氨基酸插入相同蛋白质中。举例而言,在具有反密码子环,例如具有CU(X)nXXXAA序列(其中n=l)的例如特殊移码抑制基因tRNA的经突变O-tRNA的存在下,4个或4个以上碱基密码子读取为单ー氨基酸。举例而言,就识别出4碱基密码子的O-tRNA来说,參见来自PCT/US0422061的SEQ IDNO. :6、SEQ ID NO. :12。在其他实施例中,反密码子环可解码(例如)至少4-碱基密码子、至少5-碱基密码子或至少6-碱基密码子或至少6个以上碱基密码子。因为存在256种可能的4-碱基密码子,所以可使用4个或4个以上碱基密码子在相同细胞中編码多个非天然氨基酸。參见,Anderson 等人,(2002)Exploring the Limits of Codon and AnticodonSize, Chemistry and Biology,9:237-244 :Magliery, (2001)Expanding the GeneticCode:Selection of Efficient Suppressors of Four-base Codons and Identiiicationof^Shifty^Four-base Codons with a Library Approach in Escherichia coli. I. MoI.Biol.307:755-769o举例而言,使用活体外生物合成方法,4-碱基密码子已经被用以将非天然氨基酸并入蛋白质中。參见(例如),Ma等人,(1993) Biochemistry. 32:7939 :和Hohsaka等人,
(1999)T.Arn. Chem. Soc. 121:34。CGGG和AGGU用以同时将2-萘基丙氨酸和赖氨酸的NBD衍生物与两种经化学酰化的移码抑制基因tRNA—起活体外并入抗生蛋白链菌素中。參见(例如),Hohsaka 等人,(1999) T. Am. Chem. Soc, 121:12194。在活体内研究中,Moore 等人调查了具有NCUA反密码子的tRNALeu衍生物抑制UAGN密码子(N可为U、A、G或C)的能力,并且发现四联体UAGA可通过具有UCUA反密码子的tRNALeu,以13到26%的效率解码,同时在O或-1框中少量解码。參见,Moore等人,(2000) T. Mol. Biol. , 298:195。在一个实施例中, 基于稀有密码子或无义密码子的扩展密码子可用于本发明中,所述扩展密码子可降低在其他不需要的部位上的错义读取和移码抑制。对给定系统来说,选择密码子也可包括天然3碱基密码子之一,其中内源性系统不使用(或很少使用)天然碱基密码子。举例而言,所述系统包括缺乏识别出天然3碱基密码子的tRNA的系统,和/或其中3碱基密码子是稀有密码子的系统。选择密码子视需要包括非天然碱基对。所述非天然碱基对进ー步扩展现存的遗传字母表。ー个额外的碱基对使三联体密码子的数目从64増加到125。第三碱基对的性质包括稳定的和选择性的碱基配对、以高保真度通过聚合酶有效地酶促并入DNA中,和在初生非天然碱基对的合成后有效的连续的引物延伸。可适宜于方法和组合物的非天然碱基对的描述包括(例如)Hirao 等人,(2002) An unnatural base pair for incorporating aminoacid analogues into protein. Nature BiotechnoloRY, 20:177182。又參见,Wu,Y.等人,
(2002)T. Am. Chem. Soc. 124:14626-14630。其他相关公开案列于下文。对活体内使用来说,非天然核苷可渗透膜并且经磷酸化以形成对应的三磷酸盐。另外,増加的遗传信息是稳定的并且不会被细胞酶破坏。Benner和其他人的早先努力利用不同于典型的Watson-Crick对中的所述型式的氢键型式,其中最值得注意的实例是 iso_C: iso_G 对。參见(例如),Switzer 等人,(1989) .1. Am. Chem. Soc, 111:8322 和Piccirilli 等人,(1990)Nature. 343:33;KooI,(2000)Curr. Opin. Chem. Biol.,4:602。所述碱基一般说来在某种程度上与天然碱基错配并且不能酶促地复制。Kool和同事证明,碱基之间的疏水性包装相互作用能置换氢键以驱动碱基对的形成。參见,Kool, (2000)Curr.Opin. Chem. Biol.,4:602 ;和 Guckian 和 Kool, (1998) AnRew. Chem. Int. Ed. EnRl. , 36, 2825。在致カ于开发满足所有上述要求的非天然碱基对的过程中,Schultz、Romesberg和同事系统地合成和研究了一系列非天然疏水性碱基。发现PICS:PICS自身对比天然碱基对更稳定,并且可有效地通过大肠杆菌DNA聚合酶I的克林诺片段(Klenow fragment, KF))并入DNA 中。參见(例如),McMinn 等人,(1999).1. Am. Chem. Soc, 121:11585-6 和 ORawa 等人,
(2000)T. Am. Chem. Soc. 122:3274。3MN:3MN自身对能通过KF,以足够用于生物功能的效率和选择性来合成。參见(例如),Ogawa等人,(2000) T. Am. Chem. Soc. 122:8803。然而,两个碱基担当进ー步复制的链终止剂。最近,已经开发可用以复制Pics自身对的突变DNA聚合酶。另外,可复制7AI自身对。參见(例如),Tae等人,(2001) T. Am. Chem. Soc. 123:7439。也已经开发了新颖的金属碱基对,即Dipic:Py,其在结合铜(II)后形成稳定的对。參见,Meggers等人,(2000) T. Am. Chem. Soc. 122:10714。因为扩展密码子和非天然密码子本质上与天然密码子正交,所以本发明的方法可以利用所述性质来产生其正交的tRNA。转译旁路系统也可用以将例如非天然氨基酸的所选氨基酸并入所要多肽中。在转译旁路系统中,大的序列被插入基因中但不转译成蛋白质。序列含有充当诱导核糖体跳过序列并且在插入物的下游恢复转译的结构。
所选氨基酸和非天然氨基酸如本文中所使用,所选氨基酸指的是任何所要求的天然存在的氨基酸或非天然氨基酸。天然存在的氨基酸包括20种经遗传编码的α-氨基酸中的任何一种丙氨酸、精氨酸、天门冬酰胺、天门冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异白氨酸、白氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。在ー个实施例中,所选氨基酸是以高保真度,以对给定选择密码子来说大于约70%的效率、以对给定选择密码子来说大于约75%的效率、以对给定选择密码子来说大于约80%的效率、以对给定选择密码子来说大于约85%的效率、以对给定选择密码子来说大于约90%的效率、以对给定选择密码子来说大于约95%的效率,或以对给定选择密码子来说大于约99%或99%以上的效率,并入生长多肽链中。如本文中所使用,非天然氨基酸指的是任何氨基酸、经修饰的氨基酸或不同于硒代半胱氨酸和/或吡咯赖氨酸和以下20种经遗传编码的α -氨基酸的氨基酸类似物丙氨酸、精氨酸、天门冬酰胺、天门冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异白氨酸、白氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。α-氨基酸的通用结构由式I说明
I
R
H2NCc^H
O非天然氨基酸通常为具有式I的任何结构,其中R基团是不同于20种天然氨基酸中所用取代基的的任何取代基。就20种天然氨基酸的结构来说,參见(例如)L. Stryer的Biochemistry,第三版· 1988,Freeman and Company, New York。注意,本发明的非天然氨基酸可为不同于上述20种α-氨基酸的天然存在的化合物。因为本发明的非天然氨基酸通常仅在侧链的结构上不同于天然氨基酸,所以非天然氨基酸以与酰胺键在天然存在的蛋白质中形成的相同方式,与包括(但不限于)天然或非天然的其他氨基酸形成酰胺键。然而,非天然氨基酸具有使其区别于天然氨基酸的侧链基团。举例而言,式I中的R可以包含烷基_、芳基_、酰基_、酮基_、叠氮基_、羟基_、肼、氰基-、南基-、酰肼、烯基、炔基、醚、硫醇、硒基_、磺酰基_、硼酸基_、酉朋酸基、磷酸基、膦酰基、膦、杂环基、烯酮、亚胺、醛、酷、硫代酸、羟胺、胺,诸如此类或其任何组合。其他非天然存在的氨基酸包括(但不限干)包含可光活化的交联剂的氨基酸、经自旋标记的氨基酸、发荧光的氨基酸、结合金属的氨基酸、含金属的氨基酸、放射性氨基酸、具有新颖的官能团的氨基酸、共价地或非共价地与其他分子相互作用的氨基酸、光致笼罩和/或光致异构化的氨基酸、包含生物素或生物素类似物的氨基酸、诸如经糖取代的丝氨酸的经糖基化的氨基酸、经其他碳水化合物修饰的氨基酸、含酮的氨基酸、包含聚こニ醇或聚醚的氨基酸、经重原子取代的氨基酸、可化学裂解和/或可光致裂解的氨基酸、当与天然氨基酸比较时具有伸长侧链的氨基酸,所述伸长侧链包括(但不限干)聚醚或(包括(但不限干))大于约5个或大于约10个碳的长链烃、经碳连接的含糖氨基酸、氧化还原活性的氨基酸、含氨基硫代酸的氨基酸和包含ー个或ー个以上毒性部分的氨基酸。又參见,美国专利申请公开案2003/0082575和2003/0108885,其是以引用的方式并入本文中。非天然氨基酸可以具有用以(例如)将蛋白质连接到固体支撑物的可光活化的交联剂。非天然氨基酸可以具有与氨基酸侧链连接的糖类部分。除含有新颖侧链的非天然氨基酸之外,(例如)由式II和III的结构所说明,非天
然氨基酸视需要也包含经修饰的骨架结构
权利要求
1.一种细胞,其包含转译系统,其中所述转译系统包含具有选自由以下序列组成的群组的核酸序列的氨酰基tRNA合成酶(RS):SEQ ID N0:4、编码SEQ ID N0:5的氨基酸序列的多核苷酸序列、编码SEQ ID NO: 17的氨基酸序列的多核苷酸序列、其互补多核苷酸序列和其保守变化;所述细胞另包含一 tRNA,所述tRNA是由选自于SEQ IDNO USEQ ID NO 2以及SEQ ID NO :3所组成的群组中的聚核苷酸序列编码;所述细胞另包含一聚核苷酸,用以编码一所关注的多肽,其中编码所关注多肽的聚核苷酸包含通过所述tRNA识别的选择密码子,且其中所述tRNA是通过所述RS而被氨基酰化。
2.根据权利要求I所述的细胞,其中所述细胞是真核细胞。
3.根据权利要求2所述的细胞,其中所述真核细胞是酵母细胞。
4.根据权利要求2所述的细胞,其中所述真核细胞是真菌细胞。
5.根据权利要求2所述的细胞,其中所述真核细胞是哺乳动物细胞。
6.根据权利要求2所述的细胞,其中所述真核细胞是昆虫细胞。
7.根据权利要求2所述的细胞,其中所述真核细胞是植物细胞。
8.根据权利要求I所述的细胞,其中所述细胞是细菌细胞。
9.根据权利要求8所述的细胞,其中所述非真核细胞是大肠杆菌(E.coli)细胞。
全文摘要
本发明提供生产包括正交tRNA、正交氨酰基-tRNA合成酶和tRNA/合成酶的正交对的蛋白质生物合成器的组分的组合物和方法。本发明也提供用于鉴别所述正交对的方法以及使用所述正交对来生产蛋白质的方法。
文档编号C12N1/19GK102719366SQ20121022024
公开日2012年10月10日 申请日期2005年12月1日 优先权日2004年12月22日
发明者丘霍松, 安德鲁·鲍赛尔 申请人:Ambrx公司