通过脊椎动物细胞位点特异性并入非天然氨基酸的制作方法

文档序号:491992阅读:281来源:国知局
通过脊椎动物细胞位点特异性并入非天然氨基酸的制作方法
【专利摘要】本发明提供用于产生扩充脊椎动物细胞中基因编码的氨基酸的数量的翻译组件的组合物和方法。所述组件包括正交tRNA、正交氨酰基-tRNA合成酶、tRNA/合成酶正交对和非天然氨基酸。还提供具有非天然氨基酸的蛋白质和在脊椎动物细胞中产生具有非天然氨基酸的蛋白质的方法。
【专利说明】通过脊椎动物细胞位点特异性并入非天然氨基酸
[0001] 分案说明
[0002] 本申请案是申请日为2007年9月7日,申请号为200780033055. 0(国际申请号为 PCT/US2007/019654),发明名称为通过脊椎动物细胞位点特异性并入非天然氨基酸的专利 申请的分案申请。

【技术领域】
[0003] 本发明涉及脊椎动物细胞中的翻译生物化学领域。本发明涉及在脊椎动物细胞中 产生正交tRNA、正交合成酶和其对的方法以及正交tRNA、正交合成酶与其对的组合物。本 发明还涉及非天然氨基酸组合物、包括非天然氨基酸的蛋白质以及在脊椎动物细胞中产生 包括非天然氨基酸的蛋白质的方法。

【背景技术】
[0004] 从细菌到人类,每一种已知生物体的遗传密码都编码相同的二十种常见氨基酸。 这二十种相同天然氨基酸的不同组合形成实质上进行生命的所有复杂过程(光合作用 到信号转导和免疫反应)的蛋白质。为研究和修饰蛋白质的结构和功能,科学家们曾尝 试操纵蛋白质的遗传密码和氨基酸序列。然而,难以去除由遗传密码所强加的将蛋白质 局限于二十种基因编码的标准结构单元(其中极少见的特例为,硒代半胱氨酸(例如参 看 A. Bock 等人,(1991), Molecular Microbiology 5:515-20)和批咯赖氨酸(例如参看 G. Srinivasan 等人,(2002). Science 296:1459-62))的约束。
[0005] 已取得一些进展来去除这些约束,但这一进展受到限制并且合理控制蛋白质结构 和功能的能力仍不成熟。举例来说,化学家们已开发出合成和操纵小分子结构的方法和 策略(例如参看 E. J. Corey 和 X. -M. Cheng, The Logic of Chemical Synthesis (ffiley-Interscience, New York, 1995))。全合成(例如参看 B. Merrifield, (1986), Science232 :341-7(1986))和半合成方法(例如参看 D.Y. Jackson 等人,(1994)Science266:243-7; 以及 P. E. Dawson 和 S. B. Kent, (2000),Annual Review of Biochemistry69:923-60)使 得合成肽和小蛋白质成为可能,但这些方法限制了超过10千道尔顿(kiloDalton, kDa) 的蛋白质的效用。诱变方法尽管有效,但也局限于有限数量的结构改变。在多种情况下, 在整个蛋白质中竞争性并入常见氨基酸的极其接近的结构类似物已成为可能。例如参看 R. Furter, (1998), Protein Science 7:419-26 ;K. Kirshenbaum等人,(2002), ChemBioChem 3:235-7 ;和 V.Doring 等人,(2001), Science 292:501-4。
[0006] 在尝试扩大操纵蛋白质结构和功能的能力的过程中,开发出使用经化学酰化的正 交tRNA的活体外方法,其使得能在活体外响应无义密码子选择性并入非天然氨基酸(例如 参看,T.A.Ellman等人,(1992),Science255:197-200)。将具有新颖结构和物理特性的氨 基酸选择性并入蛋白质中,来研究蛋白质折叠和稳定性以及生物分子识别和催化。例如参 看,D. Mendel 等人(1995), Annual Review of Biophysics and Biomolecular Structure 24:435-462 ;和 V. W. Cornish等人(1995年 3 月 31 日),Angewandte Chemie-International Edition in English34:621-633。然而,这一方法的化学计量性质极大限制了能产生的蛋 白质的量。
[0007] 已将非天然氨基酸显微注射到细胞中。举例来说,通过显微注射以化学方式错 醜化的嗜热四膜虫(Tetrahymena thermophila) tRNA (例如,M. E. Saks 等人(1996),An engineered Tetrahymena tRNAGln for in vivo incorporation of unnatural amino acids into proteins by nonsense suppression,J. Biol. Chem.271:23169-23175)和相关 mRNA而将非天然氨基酸引入爪蟾卵母细胞(Xenopus oocyte)中的烟碱型乙酰胆碱受体中 (例如,M. W. Nowak 等人(1998),In vivo incorporation of unnatural amino acids into ion channels in Xenopus oocyte expression system. Method Enzymol. 293:504-529) 〇 这允许通过引入具有独特物理或化学特性的含侧链氨基酸来对卵母细胞中的受体进行详 细生物物理研究。例如参看,D.A. Dougherty (2000),Unnatural amino acids as probes of protein structure and function,Curr. Opin. Chem. Biol.4:645-652。不幸的是,这种 方法局限于细胞中可进行显微注射的蛋白质,并且由于相关tRNA是在活体外以化学方式 酰化并且无法再酰化,故蛋白质的产率极低。
[0008] 为克服这些缺点,将新组件添加到原核生物大肠杆菌(Escherichia coli, E. coil)的蛋白质生物合成机器中(参看L. Wang等人,(2001), Science 292:498-500), 这允许在活体内基因编码非天然氨基酸。已使用这种方法响应琥珀密码子TAG将多 种具有新颖化学、物理或生物特性的新氨基酸有效且高保真地并入大肠杆菌的蛋白 质中,所述新氨基酸包括光亲和标记和光致异构化氨基酸、酮基氨基酸和糖基化氨基 酸。例如参看 J. W. Chin 等人,(2002), Journal of the American Chemical Society 124:9026-9027 ;J. ff. Chin, &P. G. Schultz, (2002), Chem BioChem 11:1135-1137 ;J.ff. Chin 等人,(2002). PNAS United States of America 99:11020-11024;和 L. Wang, &P. G. Schultz, (2002),Chem. Comm.,1-10。然而,原核生物和真核生物的翻译机器并不高度 保守;因此,添加到大肠杆菌中的生物合成机器的组件通常无法用于将非天然氨基酸位 点特异性并入脊椎动物细胞中的蛋白质中。举例来说,用于大肠杆菌中的詹氏甲烷球菌 (Methanococcus jannaschii)酪氨酰-tRNA合成酶/tRNA对在脊椎动物细胞中并不正交。 此外,真核生物而非原核生物中tRNA的转录是通过RNA聚合酶III进行,并且这会限制能 在脊椎动物细胞中转录的tRNA结构基因的一级序列。而且,与原核生物细胞相比,脊椎动 物细胞中的tRNA都是从转录tRNA的细胞核输出到细胞质,以进行翻译。最后,脊椎动物的 80S核糖体与70S原核生物核糖体截然不同。因此,需要开发出经改进的生物合成机器组件 以扩充脊椎动物遗传密码。如在仔细查看以下揭示内容后将显而易见,本发明满足这些要 求和其它要求。


【发明内容】

[0009] 本发明对脊椎动物细胞提供翻译组件,例如正交氨酰基-tRNA合成酶(0-RS)与正 交tRNA(0-tRNA)对和其个别组件,所述翻译组件可用于脊椎动物蛋白质生物合成机器中 以将非天然氨基酸并入脊椎动物细胞中正在生长的多肽链中。
[0010] 本发明的组合物包括包含正交氨酰基-tRNA合成酶(0-RS)(例如,得自非脊椎动 物生物体,诸如大肠杆菌、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)等)的脊椎 动物细胞(例如,哺乳动物细胞、禽类细胞、鱼细胞、爬行动物细胞、两栖动物细胞、得自非 哺乳动物的细胞等),其中0-RS优先在脊椎动物细胞中利用至少一个非天然氨基酸将正交 tRNA(O-tRNA)氨酰化。可任选将指定脊椎动物细胞中的两个或两个以上OtRNA氨酰化。一 方面,0-RS利用非天然氨基酸将0-tRNA氨酰化,这与具有(例如)如SEQ ID NO. :86或45 中所述的氨基酸序列的0-RS例如至少40 %、至少45 %、至少50 %、至少60 %、至少75 %、至 少80 %或者甚至90 %或90 %以上有效。在一个实施例中,本发明的0-RS利用非天然氨基 酸将0-tRNA氨酰化,这比0-RS利用天然氨基酸将0-tRNA氨酰化有效例如至少10倍、至少 20倍、至少30倍等。
[0011] 在一个实施例中,0-RS或其部分是由如SEQ ID N0. :3-35中任一序列所述的 多聚核苷酸序列或其互补多聚核苷酸序列编码。在另一实施例中,0-RS包含如SEQ ID NO. :36-63和/或86中任一序列所述的氨基酸序列,或其保守变异体。在另一实施例中, 0-RS包含例如与天然存在的酪氨酰基氨酰基-tRNA合成酶(TyrRS)的氨基酸序列至少 90%、至少95%、至少98%、至少99%或至少99. 5%或99. 5%以上一致并且包含两个或两 个以上来自A-E组的氨基酸的氨基酸序列。A组包括在与大肠杆菌TyrRS的Tyr37对应的 位置的缬氨酸、异亮氨酸、亮氨酸、甘氨酸、丝氨酸、丙氨酸或苏氨酸。B组包括在与大肠杆菌 TyrRS的Asnl26对应的位置的天冬氨酸。C组包括在与大肠杆菌TyrRS的Aspl82对应的位 置的苏氨酸、丝氨酸、精氨酸、天冬酰胺或甘氨酸。D组包括在与大肠杆菌TyrRS的Phel83对 应的位置的甲硫氨酸、丙氨酸、缬氨酸或酪氨酸;并且E组包括在与大肠杆菌TyrRS的Leu 186对应的位置的丝氨酸、甲硫氨酸、缬氨酸、半胱氨酸、苏氨酸或丙氨酸。
[0012] 在另一实施例中,0-RS具有一种或多种相比天然氨基酸改进或增强的针对非天然 氨基酸的酶特性。举例来说,相比天然氨基酸,改进或增强的针对非天然氨基酸的特性包括 例如较高Km、较低Km、较高kcat、较低kcat、较低kcat/km、较高kcat/km等。
[0013] 脊椎动物细胞还任选包括非天然氨基酸。脊椎动物细胞任选包括正交 tRNA (0-tRNA)(例如,得自非脊椎动物生物体,诸如大肠杆菌、嗜热脂肪芽孢杆菌等),其中 0-tRNA识别选择性密码子且优先通过0-RS利用非天然氨基酸氨酰化。一方面,0-tRNA例如 以至少45 %、至少50 %、至少60 %、至少75 %、至少80 %、至少90 %、至少95 %或99 %的包 含如SEQ ID N0. : 65中所述的多聚核苷酸序列或在细胞中由如SEQ ID N0. : 65中所述的多 聚核苷酸序列加工的tRNA的效率,介导将非天然氨基酸并入蛋白质中。另一方面,0-tRNA 包含SEQ ID NO. : 65的序列,且0-RS包含选自SEQ ID NO. : 36-63和/或86中任一序列中 所述的氨基酸序列的多肽序列和/或其保守变异体。
[0014] 在另一实施例中,脊椎动物细胞包含包括编码所关注多肽的多聚核苷酸的核酸, 其中所述多聚核苷酸包含由0-tRNA所识别的选择性密码子。一方面,包含非天然氨基酸的 所关注多肽的产率例如为从多聚核苷酸缺乏选择性密码子的细胞中获得天然存在的所关 注多肽的产率的至少2. 5%、至少5%、至少10%、至少25%、至少30%、至少40%、50%或 更多。另一方面,细胞在不存在非天然氨基酸的情况下以一定产率产生所关注多肽,所述产 率例如为在存在非天然氨基酸的情况下多肽产率的不到35%、不到30%、不到20%、不到 15%、不到10%、不到5%、不到2. 5%等。
[0015] 本发明还提供一种脊椎动物细胞,其包含正交氨酰基-tRNA合成酶(0-RS)、正交 tRNA (0-tRNA)、非天然氨基酸和包含编码所关注多肽的多聚核苷酸的核酸。所述多聚核苷 酸包含由O-tRNA识别的选择性密码子。此外,在脊椎动物细胞中,0-RS优先利用非天然氨 基酸将正交tRNA(O-tRNA)氨酰化,且所述细胞在不存在非天然氨基酸的情况下以一定产 率产生所关注多肽,所述产率例如为在存在非天然氨基酸的情况下多肽产率的不到30%、 不到20%、不到15%、不到10%、不到5%、不到2. 5%等。
[0016] 包括包含正交tRNA(O-tRNA)的脊椎动物细胞的组合物也为本发明的特征。通常, 0-tRNA介导在活体内将非天然氨基酸并入蛋白质中,所述蛋白质是由包含由0-tRNA识别 的选择性密码子的多聚核苷酸编码。在一个实施例中,0-tRNA例如以至少45 %、至少50 %、 至少60 %、至少75 %、至少80 %、至少90 %、至少95 %或甚至99 %或99 %以上的包含如SEQ ID N0. :65中所述的多聚核苷酸序列或在细胞中由如SEQ ID N0. :65中所述的多聚核苷酸 序列加工的tRNA的效率,介导将非天然氨基酸并入蛋白质中。在另一实施例中,0-tRNA包 含如SEQ ID N0. :65中所述的多聚核苷酸序列或其保守变异体,或者是由如SEQ ID N0. :65 中所述的多聚核苷酸序列或其保守变异体加工。在另一实施例中,0-tRNA包含可重复利用 的 0-tRNA。
[0017] 在本发明一方面中,0-tRNA经转录后修饰。本发明还提供一种在脊椎动物细胞中 编码0-tRNA的核酸,或其互补多聚核苷酸。在一个实施例中,核酸包含A盒和B盒。
[0018] 本发明还涉及产生例如0-RS或O-tRNA/0-RS对等翻译组件的方法(和由这些方 法产生的翻译组件)。举例来说,本发明提供产生正交氨酰基-tRNA合成酶(0-RS)的方法, 所述0-RS在脊椎动物细胞中优先利用非天然氨基酸将正交tRNA氨酰化。所述方法包括例 如(a)在存在非天然氨基酸的情况下,使第一物种的脊椎动物细胞群经历正选择,其中所 述脊椎动物细胞各自包含:i)氨酰基-tRNA合成酶(RS)文库成员,ii)正交tRNA (0-tRNA), iii)编码正选择标记的多聚核苷酸,和iv)编码负选择标记的多聚核苷酸;其中在正选择 下存活的细胞包含在存在非天然氨基酸的情况下将正交tRNA (0-tRNA)氨酰化的活性RS。 使在正选择下存活的细胞在不存在非天然氨基酸的情况下经历负选择,以除去利用天然氨 基酸将0-tRNA氨酰化的活性RS。这提供优先利用非天然氨基酸将0-tRNA氨酰化的0-RS。
[0019] 在某些实施例中,将编码正选择标记的多聚核苷酸可操作性连接到反应元件,并 且所述细胞另外包含一种多聚核苷酸,其a)编码调节由反应元件进行的转录的转录调节 蛋白(例如,脊椎动物转录调节蛋白等);且b)包含至少一个选择性密码子。通过利用非 天然氨基酸氨酰化的0-tRNA将非天然氨基酸并入转录调节蛋白中,将会引起正选择标记 的转录。在一个实施例中,转录调节蛋白为转录活化蛋白(例如GAL4等),且选择性密码子 为琥珀终止密码子,例如其中所述琥珀终止密码子位于编码转录活化蛋白的DNA结合结构 域的多聚核苷酸的一部分中,或实质上邻近编码转录活化蛋白的DNA结合结构域的多聚核 苷酸的一部分。
[0020] 正选择标记可为多种分子中任一者。在一个实施例中,正选择标记包含供生长的 营养补充并且所述选择是在缺乏所述营养补充的培养基上执行。在另一实施例中,编码正 选择标记的多聚核苷酸例如为ura3、leu2、lys2、lacZ基因、his3 (例如,其中his3基因编 码咪唑甘油磷酸酯脱水酶,通过提供3-氨基三唑(3-AT)检测)等。在另一实施例中,编码 正选择标记的多聚核苷酸包含选择性密码子。
[0021] 与正选择标记相同,负选择标记也可为多种分子中的任一者。在某些实施例中,将 编码负选择标记的多聚核苷酸可操作性连接到反应元件,转录调节蛋白通过所述反应元件 介导转录。通过利用天然氨基酸氨酰化的O-tRNA将天然氨基酸并入转录调节蛋白中,将会 引起负选择标记的转录。在一个实施例中,编码负选择标记的多聚核苷酸为例如ura3基 因,且负选择是在包含5-氟乳清酸(5-F0A)的培养基上实现。在另一实施例中,用于负选择 的培养基包含转化成通过负选择标记可检测的物质的选择或筛选剂。在本发明一方面中, 可检测物质为有毒物质。在一个实施例中,编码负选择标记的多聚核苷酸包含选择性密码 子。
[0022] 在某些实施例中,正选择标记和/或负选择标记包含在存在适当反应物的 情况下发荧光或催化发光反应的多肽。在本发明一方面中,通过荧光活化细胞分选 (fluorescence-activated cell sorting, FACS)或通过发光来检测正选择标记和/或负 选择标记。在某些实施例中,正选择标记和/或负选择标记包含基于亲和力的筛选标记或 转录调节蛋白。在一个实施例中,同一多聚核苷酸编码正选择标记和负选择标记。
[0023] 在一个实施例中,编码本发明的正选择标记和/或负选择标记的多聚核苷酸可包 含至少两个选择性密码子,其各自或都可包含至少两个不同选择性密码子或至少两个相同 选择性密码子。
[0024] 其它水平的选择/筛选严格度也可用于本发明方法中。在一个实施例中,所述方 法可例如包含在步骤(a)、(b)或(a)和(b)中提供不同量的无活性合成酶,其中所述不同 量的无活性合成酶提供另一水平的选择或筛选严格度。在一个实施例中,用于产生0-RS的 方法的步骤(a)、(b)或步骤(a)和(b)包括改变例如正和/或负选择标记的选择或筛选严 格度。所述方法任选包括使优先利用非天然氨基酸将〇-tRNA氨酰化的0-RS经历另一回合 选择,例如另一回合(数回合)正选择、另一回合(数回合)负选择或另一回合正和负选择 的组合。
[0025] 在一个实施例中,选择/筛选包含一次或多次例如选自氨基酸渗透性改变、翻译 效率改变、翻译保真度改变等的正或负选择/筛选。所述一种或多种改变是建立在一个或 多个编码用于产生蛋白质的正交tRNA-tRNA合成酶对的组件的多聚核苷酸突变的基础上。
[0026] 通常,RS文库(例如,突变型RS文库)包含由例如来自非脊椎动物生物体的至少 一种氨酰基-tRNA合成酶(RS)得到的RS。在一个实施例中,RS文库是从无活性RS得到, 例如其中所述无活性RS是由使活性RS突变而产生。在另一实施例中,无活性RS包含氨基 酸结合袋并且一个或多个包含所述结合袋的氨基酸经一个或多个不同氨基酸取代,例如所 述经取代氨基酸经丙氨酸取代。
[0027] 在某些实施例中,产生0-RS的方法另外包括对编码RS的核酸执行随机突变、位 点特异性突变、重组、嵌合构建或其任何组合,从而产生突变型RS文库。在某些实施例中, 所述方法另外包括例如(c)分离出编码0-RS的核酸;(d)由所述核酸产生一组编码突变 型0-RS的多聚核苷酸(例如,通过随机诱变、位点特异性诱变、嵌合构建、重组或其任何组 合);和(e)重复步骤(a)和/或(b),直到获得优先利用非天然氨基酸将0-tRNA氨酰化的 突变型0-RS。在本发明一方面中,将步骤(c)-(e)执行至少2次。
[0028] 产生O-tRNA/0-RS对的方法也为本发明的特征。在一个实施例中,如上文所述获 得0-RS,且通过使第一物种的脊椎动物细胞群(其中所述脊椎动物细胞包含tRNA文库成 员)经历负选择以除去包含经对于脊椎动物细胞为内源性的氨酰基-tRNA合成酶(RS)氨 酰化的tRNA文库成员的细胞,来获得0-tRNA。这提供与第一物种的脊椎动物细胞正交的 tRNA池。在本发明一方面中,tRNA文库包含由例如来自非脊椎动物生物体的至少一个tRNA 得到的tRNA。在本发明另一方面中,氨酰基-tRNA合成酶(RS)文库包含由例如来自非脊椎 动物生物体的至少一个氨酰基-tRNA合成酶(RS)得到的RS。在本发明另一方面中,tRNA 文库包含由来自第一非脊椎动物生物体的至少一个tRNA得到的tRNA。氨酰基-tRNA合成 酶(RS)文库任选包含由来自第二非脊椎动物生物体的至少一个氨酰基-tRNA合成酶(RS) 得到的RS。在一个实施例中,第一与第二非脊椎动物生物体相同。或者,第一与第二非脊椎 动物生物体可不同。由本发明方法产生的特定O-tRNA/0-RS对也为本发明的特征。
[0029] 本发明另一特征为用于在一种物种中产生翻译组件并将选择/筛选的翻译组件 引入第二物种中的方法。举例来说,在第一物种(例如,脊椎动物物种,诸如酵母等)中产 生O-tRNA/0-RS对的方法另外包括将编码0-tRNA的核酸和编码0-RS的核酸引入第二物种 (例如,哺乳动物、昆虫、真菌、藻类、植物等)的脊椎动物细胞中。第二物种可使用引入的翻 译组件在活体内例如在翻译期间将非天然氨基酸并入正在生长的多肽链中。
[0030] 在另一实例中,在脊椎动物细胞中产生优先利用非天然氨基酸将正交tRNA氨酰 化的正交氨酰基-tRNA合成酶(0-RS)的方法包括:(a)在存在非天然氨基酸的情况下,使 第一物种(例如,脊椎动物物种,诸如酵母等)的脊椎动物细胞群经历正选择。第一物种的 脊椎动物细胞各自包含:i)氨酰基-tRNA合成酶(RS)文库成员,ii)正交tRNA (0-tRNA), iii)编码正选择标记的多聚核苷酸,和iv)编码负选择标记的多聚核苷酸。在正选择中存 活的细胞包含在存在非天然氨基酸的情况下将正交tRNA (0-tRNA)氨酰化的活性RS。使在 正选择下存活的细胞在不存在非天然氨基酸的情况下经历负选择,以除去利用天然氨基酸 将0-tRNA氨酰化的活性RS,从而提供优先利用非天然氨基酸将0-tRNA氨酰化的0-RS。将 编码0-tRNA的核酸和编码0-RS的核酸引入第二物种(例如,哺乳动物、昆虫、真菌、藻类、 植物等)的脊椎动物细胞中。当在第二物种中翻译时,可使用这些组件将非天然氨基酸并 入第二物种中的所关注蛋白质或多肽中。在一个实施例中,将0-tRNA和/或0-RS引入第 二物种的脊椎动物细胞中。
[0031] 在某些实施例中,通过使第一物种的脊椎动物细胞群(其中所述脊椎动物细胞包 含tRNA文库成员)经历负选择以除去包含经对于脊椎动物细胞为内源性的氨酰基-tRNA 合成酶(RS)氨酰化的tRNA文库成员的细胞,来获得0-tRNA。这提供与第一物种和第二物 种的脊椎动物细胞正交的tRNA池。
[0032] 具有至少一个非天然氨基酸的蛋白质(或所关注多肽)也为本发明的特征。在 本发明某些实施例中,具有至少一个非天然氨基酸的蛋白质包括至少一个翻译后修饰。在 一个实施例中,至少一个翻译后修饰包含通过[3+2]环加成将包含第二反应性基团的分子 (例如,染料、例如聚乙二醇衍生物等聚合物、光交联剂、细胞毒性化合物、亲和标记、生物 素衍生物、树脂、第二蛋白质或多肽、金属螯合剂、辅因子、脂肪酸、碳水化合物、多聚核苷酸 (例如,DNA、RNA等)等)与至少一个包含第一反应性基团的非天然氨基酸连接。举例来 说,第一反应性基团为炔基部分(例如,在非天然氨基酸对-炔丙基氧基苯丙氨酸中)(这 个基团有时也称为乙炔部分),且第二反应性基团为叠氮基部分。在另一实例中,第一反应 性基团为叠氮基部分(例如,在非天然氨基酸对叠氮基-L-苯丙氨酸中)且第二反应性基 团为炔基部分。在某些实施例中,本发明的蛋白质包括至少一个包含至少一个翻译后修饰 的非天然氨基酸(例如,酮基非天然氨基酸),其中所述至少一个翻译后修饰包含糖部分。 在某些实施例中,翻译后修饰是于脊椎动物细胞中在活体内进行。
[0033] 在某些实施例中,蛋白质包括至少一个在活体内由脊椎动物细胞所产生的翻译后 修饰,其中所述翻译后修饰通常不是由原核细胞进行。翻译后修饰的实例包括(但不限于) 乙酰化、酰化、脂质修饰、棕榈酰化、棕榈酸盐加成、磷酸化、糖脂连接修饰等。在一个实施例 中,翻译后修饰包含通过GlcNAc-天冬酰胺键联将寡糖与天冬酰胺连接在一起(例如,寡糖 包含(GlcNAc-Man) 2-Man-GlcNAc-GlcNAc等的情形)。在另一实施例中,翻译后修饰包含通 过GalNAc-丝氨酸、GalNAc-苏氨酸、GlcNAc-丝氨酸或GlcNAc-苏氨酸键联将寡糖(例如, Gal-GalNA C、Gal-GlcNAc等)与丝氨酸或苏氨酸连接在一起。在某些实施例中,本发明的 蛋白质或多肽可包含分泌或定位序列、抗原决定基标签(epitope tag)、FLAG标签、聚组氨 酸标签、GST融合体等。
[0034] 通常,蛋白质与任何可用蛋白质(例如,治疗性蛋白质、诊断性蛋白质、工业酶或 其部分等)例如至少60 %、至少70 %、至少75 %、至少80 %、至少90 %、至少95 %或甚至至 少99 %或99 %以上一致,且其包含一个或多个非天然氨基酸。在一个实施例中,本发明的 组合物包括所关注蛋白质或多肽和赋形剂(例如,缓冲液、医药学上可接受的赋形剂等)。
[0035] 所关注蛋白质或多肽可含有至少一个、至少两个、至少三个、至少四个、至少五个、 至少六个、至少七个、至少八个、至少九个或者十个或十个以上非天然氨基酸。非天然氨基 酸可相同或不同,例如可在蛋白质中1、2、3、4、5、6、7、8、9、10个或更多不同位点包含1、2、 3、4、5、6、7、8、9、10个或更多不同非天然氨基酸。在某些实施例中,天然存在的蛋白质型式 中所存在的至少一个(但少于全部)特定氨基酸经非天然氨基酸取代。
[0036] 蛋白质(或所关注多肽)的实例包括(但不限于)例如,细胞因子、生长因子、 生长因子受体、干扰素、白细胞介素、炎症分子、癌基因产物、肽激素、信号转导分子、类固 醇激素受体、促红细胞生成素(EP0)、胰岛素、人生长激素、ci-1抗胰蛋白酶、血管抑素 (Angiostatin)、抗溶血因子(Antihemolytic factor)、抗体、载脂蛋白、脱辅基蛋白、心房 利钠因子、心房利钠多肽、心房肽、C-X-C趋化因子、T39765、NAP-2、ENA-78、Gro-a、Gro-b、 Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG、降钙素、c-kit 配体、细胞因子、CC 趋化因 子、单核细胞趋化蛋白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎症蛋 白-1 a、单核细胞炎症蛋白-1 p、RANTES、1309、R83915、R91733、HCC1、T58847、D31065、 T64262、CD40、CD40配体、C-kit配体、胶原蛋白、群落刺激因子(CSF)、补体因子5a、补体抑 制剂、补体受体1、细胞因子、DHFR、上皮中性粒细胞活化肽-78、GR〇a /MGSA、GR〇P、GR〇y、 MIP-1 a、MIP-1 S、MCP-1、表皮生长因子(EGF)、上皮中性粒细胞活化肽、促红细胞生成素 (EP0)、脱落毒素、因子IX、因子VII、因子VIII、因子X、成纤维细胞生长因子(FGF)、纤维蛋 白原、纤维粘连蛋白、G-CSF、GM-CSF、葡糖脑苷脂酶、促性腺激素、生长因子、生长因子受体、 刺猬蛋白(hedgehog protein)、血红蛋白、肝细胞生长因子(HGF)、水蛭素(hirudin)、人 血清白蛋白、ICAM-1、ICAM-1受体、LFA-1、LFA-1受体、胰岛素、类胰岛素生长因子(IGF)、 IGF-I、IGF-II、干扰素(IFN)、IFN-a、IFN-P、IFN-y、白细胞介素、IL-l、IL-2、IL-3、IL-4、 IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、角质细胞生长因子(KGF)、乳铁蛋白、 白血病抑制因子、荧光素酶、神经营养因子、中性粒细胞抑制因子(NIF)、抑瘤素M、成骨蛋 白、癌基因产物、甲状旁腺激素、PD-ECSF、H)GF、肽激素、人生长激素、多效生长因子、蛋白质 A、蛋白质G、致热性外毒素A、B或C、松驰素、肾素、SCF、可溶性补体受体I、可溶性I-CAM 1、可溶性白细胞介素受体、可溶性TNF受体、生长调节素、生长抑素、生长激素、链激酶、超 抗原、葡萄球菌肠毒素、SEA、SEB、SEC1、SEC2、SEC3、SED、SEE、类固醇激素受体、超氧化物 歧化酶(SOD)、中毒性休克综合症毒素、胸腺肽a 1、组织型纤溶酶原活化剂、肿瘤生长因子 (TGF)、TGF-a、TGF-0、肿瘤坏死因子、肿瘤坏死因子a、肿瘤坏死因子0、肿瘤坏死因子 受体(TNFR)、VLA-4蛋白、VCAM-1蛋白、血管内皮生长因子(VEGEF)、尿激酶、Mos、Ras、Raf、 Met、p53、Tat、Fos、Myc、Jun、Myb、Rel、雌激素受体、孕酮受体、睾酮受体、醛固酮受体、LDL 受体、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1、透明质酸(hyalurin) /CD44、 皮质酮、存在于Genebank或其它可用数据库中的蛋白质等,和/或其部分。在一个实施例 中,所关注多肽包括转录调节蛋白(例如,转录活化蛋白(诸如GAL4)或转录阻遏蛋白等) 或其部分。
[0037] 本发明的脊椎动物细胞提供合成包含大量有用非天然氨基酸的蛋白质的能力。举 例来说,可产生在细胞提取物、缓冲液、医药学上可接受的赋形剂等中浓度为例如至少10 微克/升、至少50微克/升、至少75微克/升、至少100微克/升、至少200微克/升、至 少250微克/升或至少500微克/升或更多蛋白质的包含非天然氨基酸的蛋白质。在某些 实施例中,本发明的组合物包括例如至少10 U g、至少50 y g、至少75 y g、至少100 y g、至少 200 ii g、至少250 ii g或至少500 ii g或更多包含非天然氨基酸的蛋白质。
[0038] 在某些实施例中,所关注蛋白质或多肽(或其部分)是由核酸编码。通常,核酸包 含至少一个选择性密码子、至少两个选择性密码子、至少三个选择性密码子、至少四个选择 性密码子、至少五个选择性密码子、至少六个选择性密码子、至少七个选择性密码子、至少 八个选择性密码子、至少九个选择性密码子或甚至十个或十个以上选择性密码子。
[0039] 本发明还提供用于在脊椎动物细胞中产生至少一种包含至少一个非天然氨基酸 的蛋白质的方法(以及由所述方法产生的蛋白质)。所述方法包括例如使包含包括至少一 个选择性密码子且编码蛋白质的核酸的脊椎动物细胞在适当培养基中生长。脊椎动物细胞 还包含正交tRNA(O-tRNA),其在细胞中起作用并且识别选择性密码子;和正交氨酰基tRNA 合成酶(0-RS),其优先利用非天然氨基酸将0-tRNA氨酰化;并且所述培养基包含非天然氨 基酸。在一个实施例中,0-RS利用非天然氨基酸将0-tRNA氨酰化,这与具有(例如)如SEQ ID N0. :86或45中所述序列的氨基酸序列的0-RS例如至少45%、至少50%、至少60%、至 少75 %、至少80 %、至少90 %、至少95 %或者甚至99 %或99 %以上有效。在另一实施例中, 0-tRNA包含SEQ ID N0. : 64或65或者其互补多聚核苷酸序列;由SEQ ID N0. : 64或65或 者其互补多聚核苷酸序列加工;或由SEQ ID N0. :64或65或者其互补多聚核苷酸序列编 码。在另一实施例中,CKRS包含如SEQ ID N0. : 36-63和/或86中任一序列所述的氨基酸 序列。
[0040] 在一个实施例中,所述方法另外包括将非天然氨基酸并入蛋白质中,其中所述非 天然氨基酸包含第一反应性基团;和使所述蛋白质与包含第二反应性基团的分子(例如, 染料、例如聚乙二醇衍生物等聚合物、光交联剂、细胞毒性化合物、亲和标记、生物素衍生 物、树脂、第二蛋白质或多肽、金属螯合剂、辅因子、脂肪酸、碳水化合物、多聚核苷酸(例 如,DNA、RNA等)等)接触。第一反应性基团与第二反应性基团反应以通过[3+2]环加成将 所述分子与非天然氨基酸连接。在一个实施例中,第一反应性基团为炔基或叠氮基部分且 第二反应性基团为叠氮基或炔基部分。举例来说,第一反应性基团为炔基部分(例如,在非 天然氨基酸对炔丙基氧基苯丙氨酸中)且第二反应性基团为叠氮基部分。在另一实例中, 第一反应性基团为叠氮基部分(例如,在非天然氨基酸对叠氮基-L-苯丙氨酸中)且第二 反应性基团为炔基部分。
[0041] 在某些实施例中,所编码的蛋白质包含治疗性蛋白质、诊断性蛋白质、工业酶或其 部分。在一个实施例中,由所述方法产生的蛋白质进一步通过非天然氨基酸来得以修饰。 举例来说,例如通过亲核-亲电反应、[3+2]环加成等来修饰非天然氨基酸。在另一实施例 中,在活体内通过至少一个翻译后修饰(例如,N-糖基化、0-糖基化、乙酰化、酰化、脂质修 饰、棕榈酰化、棕榈酸盐加成、磷酸化、糖脂连接修饰等)来修饰由所述方法产生的蛋白质。 [0042] 还提供产生筛选或选择转录调节蛋白的方法(以及由所述方法产生的筛选或选 择转录调节蛋白)。所述方法包括例如选择第一多聚核苷酸序列,其中所述多聚核苷酸序 列编码核酸结合结构域;和使所述第一多聚核苷酸序列突变以包括至少一个选择性密码 子。这将提供筛选或选择多聚核苷酸序列。所述方法还包括例如选择第二多聚核苷酸序 列,其中所述第二多聚核苷酸序列编码转录活化结构域;提供包含可操作性连接到第二多 聚核苷酸序列的筛选或选择多聚核苷酸序列的构建体;和将所述构建体、非天然氨基酸、正 交tRNA合成酶(0-RS)和正交tRNA(O-tRNA)引入细胞中。利用这些组件,0-RS优先利用 非天然氨基酸将0-tRNA氨酰化,且0-tRNA识别选择性密码子,并响应筛选或选择多聚核苷 酸序列中的选择性密码子将非天然氨基酸并入核酸结合结构域中。这将提供筛选或选择转 录调节蛋白。
[0043] 在某些实施例中,本发明的组合物和方法包括脊椎动物细胞。本发明的脊椎动物 细胞包括例如哺乳动物细胞、酵母细胞、真菌细胞、植物细胞、昆虫细胞等中的任一种。本发 明的翻译组件可得自多种生物体,例如非脊椎动物生物体,诸如原核生物体(例如,大肠杆 菌、嗜热脂肪芽孢杆菌等)或古细菌;或例如脊椎动物生物体。
[0044] 本发明的选择性密码子将扩充脊椎动物蛋白质生物合成机器的遗传密码子框架。 多个选择性密码子中的任一个可用于本发明中,包括终止密码子(例如,琥珀密码子、赭石 密码子或蛋白石终止密码子)、无义密码子、稀有密码子、四(或更多)碱基密码子等。 [0045] 可用于本文所述的组合物和方法中的非天然氨基酸的实例包括(但不限于) : 对-乙酰基-L-苯丙氨酸;对-碘-L-苯丙氨酸;0-甲基-L-酪氨酸;对-炔丙基氧基苯 丙氨酸;对-炔丙基-苯丙氨酸;L-3-(2-萘基)丙氨酸;3-甲基-苯丙氨酸;0-4-烯丙 基-L-酪氨酸;4-丙基-L-酪氨酸;三-0-乙酰基-GlcNAc 0 -丝氨酸;L-多巴(L-Dopa); 氟化苯丙氨酸;异丙基-L-苯丙氨酸;对-叠氮基-L-苯丙氨酸;对-酰基-L-苯丙氨酸; 对-苯甲酰基-L-苯丙氨酸;L-磷酸丝氨酸;膦酸丝氨酸;膦酸酪氨酸;对-溴苯丙氨酸; 对-氨基-L-苯丙氨酸;异丙基-L-苯丙氨酸;酪氨酸氨基酸的非天然类似物;谷氨酰胺氨 基酸的非天然类似物;苯丙氨酸氨基酸的非天然类似物;丝氨酸氨基酸的非天然类似物; 苏氨酸氨基酸的非天然类似物;烷基、芳基、酰基、叠氮基、氰基、卤基、肼、酰肼、羟基、烯基、 炔基、醚、硫醇、磺酰基、硒基、酯、硫代酸、硼酸酯基(borate)、硼酸酯基(boronate)、磷酸 基、膦酸基、膦、杂环、烯酮、亚胺、醛、羟胺、酮基或氨基取代的氨基酸,或其任何组合;具有 可光活化交联剂的氨基酸;自旋标记的氨基酸;发荧光氨基酸;结合金属的氨基酸;含金属 氨基酸;放射性氨基酸;光笼蔽(photocaged)和/或光致异构化氨基酸;含生物素或生物 素类似物氨基酸;含酮基氨基酸;包含聚乙二醇或聚醚的氨基酸;重原子取代的氨基酸;化 学可裂解或可光裂解氨基酸;具有伸长侧链的氨基酸;含有毒基团的氨基酸;糖取代的氨 基酸;含碳连接的糖的氨基酸;具有氧化还原活性的氨基酸;含a -羟基的酸;氨基硫代 酸;a,a双取代氨基酸邛-氨基酸;除脯氨酸或组氨酸外的环状氨基酸;除苯丙氨酸、酪 氨酸或色氨酸外的芳香族氨基酸等。
[0046] 本发明还提供多肽(0-RS)和多聚核苷酸,例如0-tRNA、编码0-RS或其部分(例 如,合成酶活性位点)的多聚核苷酸、用于构建氨酰基-tRNA合成酶突变体的寡聚核苷酸、 编码所关注蛋白质或多肽的包含一个或多个选择性密码子的多聚核苷酸等。举例来说,本 发明的多肽包括:包含如SEQ ID N0. :36-63和/或86中任一序列中所述的氨基酸序列的 多肽;包含由如SEQ ID N0. :3-35中任一序列所述的多聚核苷酸序列编码的氨基酸序列的 多肽;以及与对包含如SEQ ID N0. : 36-63和/或86中任一序列中所示的氨基酸序列的多 肽具特异性的抗体特异性免疫反应的多肽;或包含由如SEQ ID N0. :3-35中任一序列所示 的多聚核苷酸序列编码的氨基酸序列的多肽。
[0047] 本发明的多肽中还包括包含与天然存在的酪氨酰基氨酰基-tRNA合成酶(TyrRS) 的氨基酸序列(例如,SEQ ID NO. :2)至少90%-致的氨基酸序列且包含两个或两个以 上A-E组(上文所述)氨基酸的多肽。类似地,本发明的多肽还任选包括包含SEQ ID NO. : 36-63和/或86中任一序列的至少20个相邻氨基酸以及两个或两个以上如上文在A-E 组中所述的氨基酸取代的多肽。还包括包含任一上述多肽的保守变异体的氨基酸序列作为 本发明的多肽。
[0048] 在一个实施例中,组合物包括本发明的多肽和赋形剂(例如,缓冲液、水、医药学 上可接受的赋形剂等)。本发明还提供与本发明的多肽特异性免疫反应的抗体或抗血清。[0049] 本发明中还提供多聚核苷酸。本发明的多聚核苷酸包括具有一个或多个选择性 密码子的编码本发明的所关注蛋白质或多肽的多聚核苷酸。此外,本发明的多聚核苷酸包 括例如:包含如SEQ ID N0. :3-35、64-85中任一序列所述的核苷酸序列的多聚核苷酸;与 其多聚核苷酸序列互补或编码其多聚核苷酸序列的多聚核苷酸;和/或编码包含如SEQ ID NO. : 36-63和/或86中任一序列中所述的氨基酸序列的多肽的多聚核苷酸,或其保守变异 体。本发明的多聚核苷酸还包括编码本发明的多肽的多聚核苷酸。类似地,在高度严格条件 下在实质上整个核酸长度上与上文所述的多聚核苷酸杂交的核酸为本发明的多聚核苷酸。
[0050] 本发明的多聚核苷酸还包括编码多肽的多聚核苷酸,所述多肽包含与天然存在的 酪氨酰基氨酰基-tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQ ID N0. : 2)至少90% - 致的氨基酸序列且包含两个或两个以上如上文在A-E组(上文指出)中所述的突变。本发 明的多聚核苷酸中还包括与上文所述的多聚核苷酸至少70% (或至少75%、至少80%、至 少85 %、至少90 %、至少95 %、至少98 %或至少99 %或更多)一致的多聚核苷酸,和/或包 含任一上文所述的多聚核苷酸的保守变异体的多聚核苷酸。
[0051] 在某些实施例中,载体(例如,质粒、柯斯质粒(cosmid)、噬菌体、病毒等)包含本 发明的多聚核苷酸。在一个实施例中,载体为表达载体。在另一实施例中,表达载体包括可 操作性连接到一个或多个本发明的多聚核苷酸的启动子。在另一实施例中,细胞包含包括 本发明的多聚核苷酸的载体。
[0052] 另一方面,本发明提供化合物的组合物和制造所述化合物的方法。举例来说,化合 物包括例如非天然氨基酸(诸如对_(炔丙基氧基)_苯丙氨酸(例如,图11中的1));叠氮 基染料(诸如化学结构4和化学结构6中所示);炔基聚乙二醇(例如,如化学结构7中所 示),其中n为介于例如50与10, 000之间、75与5, 000之间、100与2, 000之间、100与1,000 之间等的整数等。在本发明的实施例中,炔基聚乙二醇具有例如约5, 000到约100, OOODa、 约 20, 000 到约 50, OOODa、约 20, 000 到约 10, OOODa (例如,20, OOODa)的分子量。
[0053] 还提供包含这些化合物,例如具有蛋白质和细胞的各种组合物。一方面,包括 对_ (炔丙基氧基)_苯丙氨酸非天然氨基酸的组合物进一步包括正交tRNA。可将非天然氨 基酸与正交tRNA键接(例如共价键接),例如通过氨酰基键与正交tRNA共价键接、与正交 tRNA的末端核糖的3' 0H或2' 0H共价键接。
[0054] 试剂盒也为本发明的特征。举例来说,提供在细胞中产生包含至少一个非天然 氨基酸的蛋白质的试剂盒,其中所述试剂盒包括含有编码0-tRNA的多聚核苷酸序列或 0-tRNA以及编码0-RS的多聚核苷酸序列或0-RS的容器。在一个实施例中,试剂盒另外包 括至少一个非天然氨基酸。在另一实施例中,试剂盒另外包含用于产生蛋白质的说明材料。

【专利附图】

【附图说明】
[0055] 图1绘示将对乙酰基苯丙氨酸并入hGH中。
[0056] 图2绘示将各种浓度的对乙酰基苯丙氨酸并入hGH中。
[0057] 图3绘示实例3结果的长条图;其中y轴显示Fc滴定浓度(毫克/毫升),x轴显 示具有不同pAFRS/I21/4xhtRNA比例的CH0细胞。

【具体实施方式】
[0058] 在详细描述本发明之前,应了解,本发明不限于特定装置或生物系统,其当然可以 变化。还应了解,本文所使用的术语只是出于描述特定实施例的目的,并且不打算限制本发 明。除非内容另作明确指示,否则如本说明书和随附权利要求中所使用,单数形式"一"和 "所述"包括多个参考物。因此,例如提及"一细胞"包括两个或两个以上细胞的组合;提及 "细菌"包括细菌混合物等。
[0059] 除非本文或下文说明书的剩余部分中另作定义,否则本文所使用的所有科技术语 都具有与本发明所属领域技术人员通常所了解相同的含义。
[0060] 厘遞:当蛋白质和/或蛋白质序列是天然或以人工方式从共同的祖先蛋白质或蛋 白质序列得到时,其为"同源"的。类似地,当核酸和/或核酸序列是天然或以人工方式从共 同的祖先核酸或核酸序列得到时,其为同源的。举例来说,可通过任何可用的诱变方法来修 饰任何天然存在的核酸以使其包括一个或多个选择性密码子。当表达时,这一经诱变核酸 将编码包含一个或多个非天然氨基酸的多肽。当然,突变方法可另外改变一个或多个标准 密码子,从而也使所得突变蛋白质中的一个或多个标准氨基酸改变。同源性一般是从两种 或两种以上核酸或蛋白质(或其序列)之间的序列相似性推断得出。可用于确定同源性的 序列之间相似性的确切百分比随所讨论的核酸和蛋白质而变化,但通常使用仅25%的序列 相似性来确定同源性。较高的序列相似性水平(例如,30%、40 %、50 %、60 %、70 %、80 %、 90%、95%或99%或更多)也可用于确定同源性。测定序列相似性百分比的方法(例如,使 用默认参数的BLASTP和BLASTN)在本文中得以描述并且一般可用。
[0061] 正交:如本文所使用,术语"正交"是指与对于细胞或翻译系统为内源的相应分子 相比,以降低的效率利用细胞的内源性组件起作用,或者无法利用细胞的内源性组件起作 用的分子(例如,正交tRNA (O-tRNA)和/或正交氨酰基tRNA合成酶(0-RS))。在tRNA和 氨酰基-tRNA合成酶的情况下,正交是指与利用内源性tRNA合成酶起作用的内源性tRNA 相比,正交tRNA无法利用内源性tRNA合成酶起作用或以降低的效率(例如,低于20%的 效率、低于10 %的效率、低于5 %的效率或低于1 %的效率)利用内源性tRNA合成酶起作 用;或者与利用内源性tRNA起作用的内源性tRNA合成酶相比,正交氨酰基-tRNA合成酶无 法利用内源性tRNA起作用或以降低的效率(例如,低于20%的效率、低于10%的效率、低 于5%的效率或低于1 %的效率)利用内源性tRNA起作用。正交分子在细胞中缺乏功能性 内源互补分子。举例来说,当与通过内源性RS将内源性tRNA氨酰化相比较时,细胞中的任 何内源性RS以降低的效率或甚至为零的效率将所述细胞中的正交tRNA氨酰化。在另一实 例中,当与通过内源性RS将内源性tRNA氨酰化相比较时,正交RS以降低的效率或甚至为 零的效率将所关注细胞中的任何内源性tRNA氨酰化。可将第二正交分子引入细胞中从而 与第一正交分子一起作用。举例来说,正交tRNA/RS对包括所引入的在细胞中相对于相应 内源性tRNA/RS对以一定效率(例如,50 %效率、60 %效率、70 %效率、75 %效率、80 %效率、 90 %效率、95 %效率或99 %或更高效率)一起作用的互补组件。
[0062]互补:术语"互补"是指可一起作用的正交对0-tRNA与0-RS的组件,例如其中 0-RS将0-tRNA氨酰化。
[0063]优先氨酰化:术语"优先氨酰化',是指与0-RS将天然存在的tRNA或用于产生 0-tRNA的原材料氨酰化相比,0-RS利用非天然氨基酸将0-tRNA氨酰化的效率,例如70% 效率、75%效率、85%效率、90%效率、95%效率或99%或更高效率。将非天然氨基酸以高保 真度,例如以对指定选择性密码子高于75%的效率、对指定选择性密码子高于约80%的效 率、对指定选择性密码子高于约90%的效率、对指定选择性密码子高于约95%的效率或对 指定选择性密码子高于约99%或更高效率并入正在生长的多肽链中。
[0064]诜择件密码子:术语"选择性密码子"是指在翻译过程中由0-tRNA识别且不被内 源性tRNA识别的密码子。0-tRNA反密码子环识别mRNA上的选择性密码子并且在多肽中的 这一位点并入其氨基酸,例如非天然氨基酸。选择性密码子可例如包括无义密码子,诸如终 止密码子,例如琥珀密码子、赭石密码子和蛋白石密码子;四个或四个以上碱基的密码子; 稀有密码子;从天然或非天然碱基对获得的密码子等。
[0065]抑制件tRNA:抑制性tRNA是(例如)通过提供响应选择性密码子将氨基酸并入多 肽链的机制来改变指定翻译系统中信使RNA (mRNA)的阅读的tRNA。举例来说,抑制性tRNA 可通读例如终止密码子、四碱基密码子或稀有密码子等。
[0066]可重复利用tRNA:术语"可重复利用tRNA"是指在翻译期间经氨酰化且可利用氨 基酸(例如非天然氨基酸)反复地再氨酰化以将所述氨基酸(例如非天然氨基酸)并入一 个或多个多肽链中的tRNA。
[0067]翻译系统:术语"翻译系统"是指将天然存在的氨基酸并入正在生长的多肽链(蛋 白质)的组件集合。翻译系统的组件可包括例如核糖体、tRNA、合成酶、mRNA、氨基酸等。本 发明的组件(例如,0RS、0tRNA、非天然氨基酸等)可添加到活体外或活体内翻译系统中,例 如脊椎动物细胞,例如酵母细胞、哺乳动物细胞、植物细胞、藻类细胞、真菌细胞、昆虫细胞 等。
[0068] 非天然氨基酸:如本文所使用,术语"非天然氨基酸"是指不为20种常见的天然存 在的氨基酸中的一种或者硒代半胱氨酸或吡咯赖氨酸的任何氨基酸、经修饰氨基酸和/或 氨基酸类似物。
[0069] 昼轰:如本文所使用,术语"得自"是指从特定分子或生物体分离或者使用来自特 定分子或生物体的信息制得的组件。
[0070]无活性RS:如本文所使用,术语"无活性RS"是指已突变以致其无法再利用氨基酸 将其天然同源tRNA氨酰化的合成酶。
[0071] if诜择或筛诜标记:如本文所使用,术语"正选择或筛选标记"是指当存在(例如, 经表达、经活化等)时导致将具有正选择标记的细胞从不具有正选择标记的细胞中鉴别出 的标记。
[0072]负诜择或筛诜标记:如本文所使用,术语"负选择或筛选标记"是指当存在(例如, 经表达、经活化等)时使得鉴别出不具有所需特性(例如,当与具有所需特性的细胞相比较 时)的细胞的标记。
[0073] 报告基因:如本文所使用,术语"报告基因"是指可用于选择所关注系统中的革巴 组件的组件。举例来说,报告基因可包括荧光筛选标记(例如,绿色荧光蛋白质);发光标 记(例如,萤火虫荧光素酶蛋白);基于亲和力的筛选标记;或可选择标记基因,诸如his3、 ura3、leu2、lys2、lacZ、0 -gal/lacZ ( 0 -半乳糖苷酶)、Adh (醇脱氢酶)等。
[0074] 脊椎动物:如本文所使用,术语"脊椎动物"是指属于系统发生域真核生物的生物 体,诸如动物,例如哺乳动物、爬行动物、鸟类等。
[0075] 非真核生物:如本文所使用,术语"非真核生物"是指非脊椎动物生物体。举例来 说,非脊椎动物生物体可属于真细菌(例如,大肠杆菌(Escherichia coli)、极端嗜热细菌 (Thermus thermophilics)、嗜热脂肪芽抱杆菌(Bacillus stearothermophilus)等)系统 发生域;或古细菌(例如,詹氏甲烧球菌(Methanococcus jannaschii)、嗜热自养甲烧杆菌 (Methanobacterium thermoautotrophicum)、诸如沃氏嗜盐富饶菌(Haloferax volcanii) 和嗜盐菌属 NRC_l(Halobacterium species NRC-1)的嗜盐菌(Halobacterium)、超嗜热 古菌(Archaeoglobus fulgidus)、强烈嗜热球菌(Pyrococcus furiosus)、极端嗜热古菌 (Pyrococcus horikoshii)、嗜热泉生古细菌(Aeuropyrum pernix)等)系统发生域。
[0076] 抗述:如本文所使用,术语"抗体"包括(但不限于)实质上由一个或多个特异性 结合并识别分析物(抗原)的免疫球蛋白基因或其片段所编码的多肽。实例包括多克隆抗 体、单克隆抗体、嵌合抗体和单链抗体等。如本文所使用的术语"抗体"中也包括免疫球蛋白 的片段,包括Fab片段和由表达文库(包括噬菌体呈现)所产生的片段。有关抗体结构和 技术例如参看 Paul, Fundamental Immunology,第 4 版,1999,Raven Press, New York。 [0077] 保守变异体:术语"保守变异体"是指在功能上与得到保守变异体的组件(例如 0-tRNA或0-RS)类似但序列变异的翻译组件,例如保守变异体0-tRNA或保守变异体0-RS。 举例来说,0-RS将利用非天然氨基酸将互补0-tRNA或保守变异体0-tRNA氨酰化,但所 述0-tRNA和所述保守变异体0-tRNA不具有相同序列。保守变异体的序列可具有例如一 处变异、两处变异、三处变异、四处变异或者五处或五处以上变异,只要保守变异体与相应 0-tRNA或0-RS互补即可。
[0078] 诜择或筛诜剂:如本文所使用,术语"选择或筛选剂"是指当存在时允许从群体中 选择/筛选某些组件的试剂。举例来说,选择或筛选剂例如包括(但不限于)养分、抗生素、 光波长、抗体、经表达多聚核苷酸(例如,转录调节蛋白)等。可例如通过浓度、强度等来改 变选择剂。
[0079]可检测物质:如本文所使用,术语"可检测物质"是指当经活化、改变、表汰等时允 许从群体中选择/筛选出某些组分的试剂。举例来说,可检测物质可为化学剂,例如5-氟 乳清酸(5-F0A),其在某些条件下,例如表达URA3报告基因时,变为例如杀死表达URA3报告 基因的细胞的可检测的有毒产物。
[0080] 除由遗传密码所强加的化学约束外,直接在脊椎动物细胞中基因修饰蛋白质结构 的能力将提供探查和操纵细胞过程的有力的分子工具。本发明提供扩充脊椎动物细胞中基 因编码的氨基酸数量的翻译组件。其包括tRNA (例如,正交tRNA (0-tRNA))、氨酰基-tRNA 合成酶(例如,正交合成酶(0-RS))、0-tRNA/0-RS对和非天然氨基酸。
[0081] 通常,有效地表达和加工本发明的0-tRNA且其在脊椎动物细胞中的翻译过程中 起作用,但不会被宿主的氨酰基-tRNA合成酶有效氨酰化。在mRNA翻译期间,本发明的 0-tRNA响应选择性密码子将不编码常见20种氨基酸中的任一种的非天然氨基酸递送到正 在生长的多肽链中。
[0082] 本发明的0-RS在脊椎动物细胞中优先利用非天然氨基酸将本发明的0-tRNA氨酰 化,但不会将任何细胞质中宿主的tRNA氨酰化。此外,本发明的氨酰基-tRNA合成酶的特 异性使得能接受非天然氨基酸,同时排除任何内源性氨基酸。包括例如0-RS的氨基酸序列 的多肽或其部分也为本发明的特征。此外,编码翻译组件0-tRNA、0-RS和其部分的多聚核 苷酸为本发明的特征。
[0083] 本发明还提供产生所需翻译组件(例如)0-RS和或正交对(正交tRNA和正交氨 酰基-tRNA合成酶)的方法,所述正交对利用非天然氨基酸用于脊椎动物细胞中,(和由所 述方法产生的翻译组件)。举例来说,来自大肠杆菌的酪氨酰-tRNA合成酶/tRNA euA对为本 发明的O-tRNA/0-RS对。此外,本发明还提供在一种脊椎动物细胞中选择/筛选翻译组件 并且当选择/筛选后将这些组件用于不同脊椎动物细胞(未用于选择/筛选的脊椎动物细 胞)中的方法。举例来说,可在酵母(例如酿酒酵母(Saccharomyces cerevisiae))中进 行产生用于脊椎动物细胞的翻译组件的选择/筛选方法,且随后可将这些所选组件用于另 一脊椎动物细胞中,例如另一酵母细胞、哺乳动物细胞、昆虫细胞、植物细胞、真菌细胞等。
[0084] 本发明进一步提供在脊椎动物细胞中产生蛋白质的方法,其中所述蛋白质包含非 天然氨基酸。所述蛋白质是使用本发明的翻译组件产生。本发明还提供包括非天然氨基酸 的蛋白质(和由本发明的方法产生的蛋白质)。所关注蛋白质或多肽还可包括翻译后修饰, 其例如是通过[3+2]环加成或亲核_亲电反应添加,并非由原核细胞所产生等。在某些实 施例中,利用非天然氨基酸产生转录调节蛋白的方法(和由所述方法产生的蛋白质)也都 包括在本发明中。包括包含非天然氨基酸的蛋白质的组合物也为本发明的特征。
[0085] 用于产生具有非天然氨基酸的蛋白质或多肽的试剂盒也为本发明的特征。
[0086] 正交氨酰基-TRNA合成酶(0-RS)
[0087]为了将非天然氨基酸特异性并入脊椎动物细胞中的所关注蛋白质或多肽中,将改 变合成酶的底物特异性,以致仅将所需非天然氨基酸而非常见20种氨基酸中任一种装入 tRNA中。如果正交合成酶混杂,那么其将产生在靶位置具有天然与非天然氨基酸的混合 物的突变蛋白质。本发明提供对特定非天然氨基酸具有经修饰的底物特异性的正交氨酰 基-tRNA合成酶的组合物以及产生所述合成酶的方法。
[0088] 包括正交氨酰基-tRNA合成酶(0-RS)的脊椎动物细胞为本发明的特征。0-RS在 脊椎动物细胞中优先利用非天然氨基酸将正交tRNA(0-tRNA)氨酰化。在某些实施例中, 0-RS利用一个以上非天然氨基酸,例如两个或两个以上、三个或三个以上等。因此,本发明 的0-RS可具有优先利用不同非天然氨基酸将0-tRNA氨酰化的能力。这允许通过选择将何 种非天然氨基酸或非天然氨基酸组合放于细胞中和/或通过选择不同量的放于细胞中的 非天然氨基酸以供其并入来达到另一层面的控制。
[0089] 本发明的0-RS任选具有一种或多种相比天然氨基酸改进或增强的针对非天然氨 基酸的酶特性。这些特性包括例如与天然存在的氨基酸(例如,20种已知常见氨基酸中的 一种)相比较,针对非天然氨基酸的较高Km、较低Km、较高kcat、较低kcat、较低kcat/km、 较高kcat/km等。
[0090] 可任选通过包括0-RS的多肽和/或编码0-RS或其部分的多聚核苷酸将0-RS提 供到脊椎动物细胞中。举例来说,0-RS或其部分是由如SEQ ID N0. :3-35中任一序列所 述的多聚核苷酸序列或其互补多聚核苷酸序列编码。在另一实例中,0-RS包含如SEQ ID NO. : 36-63和/或86中任一序列所述的氨基酸序列,或其保守变异体。关于例示性0-RS分 子的序列,例如参看本文中表5、6和8以及实例6。
[0091] 0-RS还可包含与天然存在的酪氨酰基氨酰基-tRNA合成酶(TyrRS)的氨基酸序 列(例如,如SEQ ID N0. :2中所述)例如至少90%、至少95%、至少98%、至少99%或甚 至至少99. 5 %-致且包含两个或两个以上A-E组的氨基酸的氨基酸序列。A组包括在与大 肠杆菌TyrRS的Tyr37对应的位置的缬氨酸、异亮氨酸、亮氨酸、甘氨酸、丝氨酸、丙氨酸或 苏氨酸;B组包括在与大肠杆菌TyrRS的Asnl26对应的位置的天冬氨酸;C组包括在与大肠 杆菌TyrRS的Asp 182对应的位置的苏氨酸、丝氨酸、精氨酸、天冬酰胺或甘氨酸;D组包括 在与大肠杆菌TyrRS的Phel83对应的位置的甲硫氨酸、丙氨酸、缬氨酸或酪氨酸;且E组包 括在与大肠杆菌TyrRS的Leul86对应的位置的丝氨酸、甲硫氨酸、缬氨酸、半胱氨酸、苏氨 酸或丙氨酸。也例如参看本文中的表4、表6和表8。
[0092] 除0-RS外,本发明的脊椎动物细胞还可包括其它组件,例如非天然氨基酸。脊椎 动物细胞还包括正交tRNA (0-tRNA)(例如,得自非脊椎动物生物体,诸如大肠杆菌、嗜热脂 肪芽孢杆菌等),其中0-tRNA识别选择性密码子且优先通过0-RS利用非天然氨基酸氨酰 化。所述细胞中还可存在包含编码所关注多肽的多聚核苷酸的核酸,其中所述多聚核苷酸 包含由0-tRNA识别的选择性密码子或者一个或多个所述密码子的组合。
[0093] 一方面,0-tRNA例如以至少45%、至少50%、至少60%、至少75%、至少80%、至 少90%、至少95%或99%的包含如SEQ ID N0. :65中所述的多聚核苷酸序列或由如SEQ ID NO. :65中所述的多聚核苷酸序列加工的tRNA的效率,介导将非天然氨基酸并入蛋白质中。 另一方面,0-tRNA 包含 SEQ ID N0. :65,且 0-RS 包含 SEQ ID N0. :36-63 和 / 或 86 中任一 序列中所述的多肽序列和/或其保守变异体。关于例示性0-RS和0-tRNA分子的序列,也 例如参看本文中表5和实例6。
[0094] 在一个实例中,脊椎动物细胞包含正交氨酰基-tRNA合成酶(0-RS)、正交 tRNA (0-tRNA)、非天然氨基酸和包含编码所关注多肽的多聚核苷酸的核酸,所述多聚核苷 酸包含由O-tRNA识别的选择性密码子。在脊椎动物细胞中,0-RS优先利用非天然氨基酸 将正交tRNA(O-tRNA)氨酰化,且所述细胞在不存在非天然氨基酸的情况下以一定产率产 生所关注多肽,所述产率例如为在存在非天然氨基酸的情况下多肽产率的不到30%、不到 20%、不到15%、不到10%、不到5%、不到2. 5%等。
[0095] 用于产生0-RS的方法(其为本发明的特征)任选包括:由野生型合成酶框架产生 突变合成酶池,且随后根据相对于常见20种氨基酸,针对非天然氨基酸的特异性选择突变 RS。为分离出所述合成酶,其选择方法:(i)敏感,因为由最初几回合得到的所需合成酶的 活性较低且群体较小;(ii)"可调",因为需要以不同选择回合改变选择严格度;和(iii)通 用,以致所述方法可用于不同非天然氨基酸。
[0096] 在脊椎动物细胞中产生优先利用非天然氨基酸将正交tRNA氨酰化的正交氨酰 基-tRNA合成酶(0-RS)的方法通常包括应用正选择随后负选择的组合。在正选择过程中, 抑制正标记非必需位置处所引入的选择性密码子将使脊椎动物细胞能在正选择压力下存 活。因此,在存在非天然氨基酸的情况下,存活细胞编码将非天然氨基酸装于正交抑制tRNA 的活性合成酶。在负选择的过程中,抑制负标记非必需位置处所引入的选择性密码子将去 除具有天然氨基酸特异性的合成酶。负选择和正选择的存活细胞编码只能(或至少优先) 利用非天然氨基酸将正交抑制tRNA氨酰化(装入)的合成酶。
[0097] 举例来说,所述方法包括:(a)在存在非天然氨基酸的情况下,使第一物种的脊椎 动物细胞群经历正选择,其中所述脊椎动物细胞各自包含:i)氨酰基-tRNA合成酶(RS)文 库成员,ii)正交tRNA(0-tRNA),iii)编码正选择标记的多聚核苷酸和iv)编码负选择标 记的多聚核苷酸;其中在正选择下存活的细胞包含在存在非天然氨基酸的情况下将正交 tRNA (0-tRNA)氨酰化的活性RS ;和(b)在不存在非天然氨基酸的情况下,使在正选择下存 活的细胞经历负选择,以除去利用天然氨基酸将0-tRNA氨酰化的活性RS,从而提供优先利 用非天然氨基酸将0-tRNA氨酰化的0-RS。
[0098] 正选择标记可为多种分子中任一个。在一个实施例中,正选择标记为提供营 养补充以供生长的产物,并且所述选择是在缺乏所述营养补充的培养基上执行。编码 正选择标记的多聚核苷酸的实例包括(但不限于)例如基于补充细胞的氨基酸营养 缺陷的报告基因、his3基因(例如,其中所述his3基因编码咪唑甘油磷酸酯脱水酶, 通过提供3-氨基三唑(3-AT)检测)、ura3基因、leu2基因、lys2基因、lacZ基因、 adh 基因等。例如参看 G.M.Kishore,&D. M. Shah, (1988),Amino acid biosynthesis inhibitors as herbicides,Annual Review of Biochemistry 57:627-663。 在一 个实施例中,通过邻-硝基苯基-0-D-半乳糖吡喃糖苷(0NPG)水解检测lacZ产 生。例如参看1.6.56代131';[181^;[;[,&£.六.601611118,(2000),118680;1^13。2 1:081:11(17区6116 function:evaluation of beta-galactosidase assays employed in the yeast two-hybrid system. Analytical Biochemistry 285:1-15。其它正选择标记包括例如突光 素酶、绿色荧光蛋白质(6--)、¥--46--、1^\抗生素抗性基因的产物(例如,氯霉素乙酰转 移酶(CAT))、转录调节蛋白(例如GAL4)等。编码正选择标记的多聚核苷酸任选包含选择 性密码子。
[0099] 可将编码正选择标记的多聚核苷酸可操作性连接到反应元件。还可存在另一多 聚核苷酸,其编码调节由反应元件进行的转录的转录调节蛋白且包含至少一个选择性密码 子。通过经非天然氨基酸氨酰化的O-tRNA将非天然氨基酸并入转录调节蛋白中,将引起编 码正选择标记的多聚核苷酸(例如报告基因)的转录。选择性密码子任选位于编码转录调 节蛋白的DNA结合结构域的多聚核苷酸的一部分中或实质上邻近编码转录调节蛋白的DNA 结合结构域的多聚核苷酸的一部分。
[0100] 还可将编码负选择标记的多聚核苷酸可操作性连接到反应元件,转录调节蛋 白将通过所述反应元件介导转录。例如参看A.J.DeMaggio等人,(2000),The yeast split-hybrid system. Method Enzymol. 328:128-137 ;H. M. Shih等人,(1996),A positive genetic selection for disrupting protein-protein interactions:identification of CREB mutations that prevent association with the coactivator CBP. Proc. Natl. Acad. Sci. U. S. A. 93:13896-13901 :M. Vidal 等人,(1996),Genetic characterization of a mammalian protein-protein interaction domain by using a yeast reverse two-hybrid system.「comment"!,Proc. Natl. Acad. Sci. U. S. A.93:10321-10326 :和M. Vidal 等人,(1996), Reverse two-hybrid and one-hybrid systems to detect dissociation of protein-protein and DNA-protein interactions, [comment],Proc. Natl. Acad. Sci. U.S. A.93:10315-10320。通过经天然氨基酸氨酰化的0_tRNA将天然氨基酸并入转录调节 蛋白中,将引起负选择标记的转录。负选择标记任选包含选择性密码子。在一个实施例中, 本发明的正选择标记和/或负选择标记可包含至少两个选择性密码子,其各自或都可包含 至少两个不同选择性密码子或至少两个相同选择性密码子。
[0101] 转录调节蛋白为结合(直接或间接)核酸序列(例如,反应元件)且调节可操作 性连接到反应元件的序列的转录的分子。转录调节蛋白可为转录活化蛋白(例如,GAL4、核 激素受体、API、CREB、LEF/tcf家族成员、SMAD、VP16、SP1等)、转录阻遏蛋白(例如,核激 素受体、Groucho/tle家族、Engrailed家族等)或可视环境而具有两种活性的蛋白质(例 如LEF/tcf、同源异型盒蛋白等)。反应元件通常为转录调节蛋白所识别的核酸序列或与转 录调节蛋白一起作用的额外试剂。
[0102] 转录调节蛋白的另一实例为转录活化蛋白GAL4。例如参看A. Laughon等 人,(1984),Identification of two proteins encoded by the Saccharomyces cerevisiae GAL4gene,Molecular&Cellular Biology 4:268-275 ;A. Laughon, &R. F.Gesteland, (1984),Primary structure of the Saccharomyces cerevisiae GAL4 gene. Molecular&Cellular Biology4:260-267 :L.Keegan 等人,(1986),Separation of DNA binding from the transcription-activating function of a vertebrate regulatory protein. Science 231_. 699-704 ;和 M. Ptashne, (1988), How vertebrate transcriptional activators work, Nature335:683-689 〇 此 881 个氨基酸的蛋白质 的N末端147个氨基酸形成特异性结合DNA序列的DNA结合结构域(DBD)。例如参看 M. Carey 等人,(1989), An amino-terminal fragment of GAL4 binds DNA as a dimer, J. Mol. Biol. 209:423-432 :和 E. Giniger 等人,(1985),Specific DNA binding of GAL4, a positive regulatory protein of yeast,Cel 140:767-774。DBD通过插入蛋白质序列连接 到当结合DNA时可活化转录的C末端113个氨基酸的活化结构域(AD)。例如参看J. Ma,&M. Ptashne,(1987),Deletion analysis of GAL4 defines two transcriptional activating segments,Cell48:847-853 ;和 J. Ma,&M. Ptashne,(1987),The carboxy-terminal 30amino acids of GAL4 are recognized by GAL80, Cell 50:137-142。将玻拍密码子朝向 例如含有GAL4的N末端DBD和其C末端AD的单一多肽的N末端DBD放置,可将由0-tRNA/ 0-RS对执行的琥珀抑制连接到由GAL4执行的转录活化。可使用GAL4活化的报告基因以利 用所述基因执行正选择和负选择。
[0103]用于负选择的培养基可包含转化成通过负选择标记可检测的物质的选择或 筛选剂。在本发明一方面中,可检测物质为有毒物质。编码负选择标记的多聚核苷酸 可例如为ura3基因。举例来说,可将URA3报告基因置于含有GAL4DNA结合位点的启 动子的控制下。当例如通过翻译编码具有选择性密码子的GAL4的多聚核苷酸产生负 选择标记时,GAL4将活化URA3的转录。在包含5-氟乳清酸(5-F0A)的培养基上实现 负选择,所述5-F0A将经ura3基因的基因产物转化成可检测物质(例如,杀死细胞的 有毒物质)。例如参看 J.D.Boeke 等人,(1984),A positive selection for mutants lacking orotidine_5,-phosphate decarboxylase activity in yeast:5-fluoroorotic acid resistance,Molecular&General Genetics 197:345-346 ;M. Vidal 等人, (1996),Genetic characterization of a mammalian protein-protein interaction domain by using a yeast reverse two-hybrid system, fcomment].Proc. Natl. Acad. Sci. U. S. A. 93:10321-10326 :和 M. Vidal 等人,(1996), Reverse two-hybrid and one-hybrid systems to detect dissociation of protein-protein and DNA-protein interactions, [comment], Proc. Natl. Acad. Sci. U. S. A. 93:10315-10320。
[0104] 与正选择标记相同,负选择标记也可为多种分子中的任一个。在一个实施例中,正 选择标记和/或负选择标记为在存在适当反应物的情况下发荧光或催化发光反应的多肽。 举例来说,负选择标记包括(但不限于)例如荧光素酶、绿色荧光蛋白质(GFP)、YFP、EGFP、 RFP、抗生素抗性基因的产物(例如,氯霉素乙酰转移酶(CAT))、lacZ基因的产物、转录调节 蛋白等。在本发明一方面中,通过荧光活化细胞分选(FACS)或通过发光来检测正选择标记 和/或负选择标记。在另一实例中,正选择标记和/或负选择标记包含基于亲和力的筛选 标记。同一多聚核苷酸可编码正选择标记和负选择标记。
[0105] 其它水平的选择/筛选严格度也可用于本发明方法中。在产生0-RS的方法的一 个或两个步骤中可改变选择或筛选严格度。这可包括例如改变编码正选择和/或负选择标 记的多聚核苷酸中反应元件的量;将不同量的无活性合成酶添加到一个或两个步骤中;改 变所使用的选择/筛选剂的量等。还可执行额外回合的正和/或负选择。
[0106] 选择或筛选也可包含一次或多次正或负选择或筛选,所述选择或筛选包括例如氨 基酸渗透性的改变、翻译效率的改变、翻译保真度的改变等。通常,一种或多种改变是建立 在一个或多个包含或编码用于产生蛋白质的正交tRNA-tRNA合成酶对组件的多聚核苷酸 突变的基础上。
[0107] 还可使用模型富集研究从过量无活性合成酶中迅速选择活性合成酶。可进行正和 /或负模型选择研究。举例来说,将包含潜在活性氨酰基-tRNA合成酶的脊椎动物细胞与 不同倍数过量的无活性氨酰基-tRNA合成酶混合。在生长于非选择性培养基中并例如通过 X-GAL覆盖分析的细胞与生长于选择性培养基(例如,在不存在组氨酸和/或尿嘧啶的情况 下)中且能存活并例如通过X-GAL分析的细胞之间进行比率比较。对于负选择模型,将潜 在活性氨酰基-tRNA合成酶与不同倍数过量的无活性氨酰基-tRNA合成酶混合,并利用例 如5-F0A等负选择物质执行选择。
[0108] 通常,RS文库(例如,突变型RS文库)包含由例如来自非脊椎动物生物体的至少 一种氨酰基-tRNA合成酶(RS)得到的RS。在一个实施例中,RS文库是得自无活性RS,例 如其中无活性RS是通过使活性RS例如在所述合成酶的活性位点、所述合成酶的编辑机制 位点、由组合合成酶的不同结构域得到的不同位点等突变而产生。举例来说,使RS活性位 点中的残基突变成例如丙氨酸残基。将编码丙氨酸突变的RS的多聚核苷酸用作模板,以将 丙氨酸残基诱变为所有20种氨基酸。选择/筛选突变型RS的文库以产生0-RS。在另一 实施例中,无活性RS包含氨基酸结合袋并且一个或多个包含所述结合袋的氨基酸经一个 或多个不同氨基酸取代。在一个实例中,经取代氨基酸是经丙氨酸取代。任选将编码丙氨 酸突变的RS的多聚核苷酸用作模板以将丙氨酸残基诱变为所有20种氨基酸,并加以选择 /筛选。
[0109] 产生0-RS的方法可进一步包括通过使用所属领域中已知的各种诱变技术产生RS 文库。举例来说,可通过位点特异性突变、随机点突变、同源重组、DNA改组或其它递归式诱 变方法、嵌合构建或其任何组合产生突变型RS。举例来说,可由两个或两个以上其它(例 如)较小、较少多样性的"子文库"产生突变型RS文库。在使合成酶经历正和负选择/筛 选策略后,可随后使这些合成酶经历进一步诱变。举例来说,可分离出编码0-RS的核酸; 可由所述核酸产生一组编码突变型0-RS的多聚核苷酸(例如,通过随机诱变、位点特异性 诱变、重组或其任何组合);且可重复这些个别步骤或这些步骤的组合,直到获得优先利用 非天然氨基酸将0-tRNA氨酰化的突变型0-RS。在本发明一方面中,将所述步骤执行至少2 次。
[0110] 有关产生0-RS的其它细节可见于题为"Methodsandcompositionsforthe productionoforthogonaltRNA-aminoacyltRNAsynthetasepairs?"的W0 2002/086075 中。还参看 Hamano-Takaku等人,(2000)AmutantEscherichiacoliTyrosyl-tRNA SynthetaseUtilizestheUnnaturalAminoAcidAzatyrosineMoreEfficiently thanTyrosine,JournalofBiologicalChemistry. 275(51):40324-40328:Kiga等人 (2002),AnengineeredEscherichiacolityrosyl-tRNAsynthetaseforsite-specific incorporationofanunnaturalaminoacidintoproteinsinvertebrate translationanditsapplicationinawheatgermcell-freesystem.PNAS 99(15) :9715_9723 ;和Francklyn等人,(2002),Aminoacyl-tRNAsynthetases:Versatile playersinthechangingtheateroftranslation:RNA.8:1363-1372。
[0111]正交 tRNA
[0112] 本发明提供包括正交tRNA (0-tRNA)的真核细胞。正交tRNA介导在活体内将非天 然氨基酸并入蛋白质中,所述蛋白质是由包含由0-tRNA识别的选择性密码子的多聚核苷 酸编码。在某些实施例中,本发明的0-tRNA例如以至少40 %、至少45 %、至少50 %、至少 60%、至少75%、至少80%或甚至90%或更高的包含如SEQ ID N0. :65中所述的多聚核苷 酸序列或在细胞中由如SEQ ID N0. : 65中所述的多聚核苷酸序列加工的tRNA的效率,介导 将非天然氨基酸并入蛋白质中。参看本文中表5。
[0113] 本发明0-tRNA的实例为SEQ ID N0. : 65 (参看本文中实例6和表5)。SEQ ID NO. : 65为剪接前/加工前转录物,其在细胞中任选例如使用标准内源细胞剪接和加工机器 加工,且经修饰以形成活性O-tRNA。通常,所述剪接前转录物群在细胞中形成活性tRNA群。 本发明还包括O-tRNA的保守变异体和其经加工细胞产物。举例来说,O-tRNA的保守变异 体包括功能与SEQ ID NO. : 65的O-tRNA类似且保持经加工形式的tRNA L形结构,但不具 有相同序列的分子(且不为野生型tRNA分子)。通常,由于O-tRNA可在活体内再氨酰化, 从而再次介导响应选择性密码子将非天然氨基酸并入由多聚核苷酸编码的蛋白质中,故本 发明的O-tRNA为可重复利用的O-tRNA。
[0114] 真核生物而非原核生物中tRNA的转录是通过RNA聚合酶III进行,这将限制能在 脊椎动物细胞中转录的tRNA结构基因的一级序列。而且,在脊椎动物细胞中,tRNA需要从 转录tRNA的细胞核输出到细胞质,以进行翻译。编码本发明的O-tRNA或其互补多聚核苷 酸的核酸也为本发明的特征。在本发明一个方面中,编码本发明的O-tRNA的核酸包括内部 启动子序列,例如A盒(例如,TRGCNNAGY)和B盒(例如,GGITCGANTCC,SEQ ID N0:87)。A 盒和 B 盒序列的其它实例可见于 Geiduschek, (1988),Transcription By RNA Polymerase III,Ann-Rev. Biochem.57:873-914。本发明的〇-tRNA也可经转录后修饰。举例来说,真核 生物中tRNA基因的转录后修饰包括分别通过Rnase P和3' -内切核酸酶去除5' -和3' -侧 接序列。添加3' -CCA序列也为真核生物中tRNA基因的转录后修饰。
[0115] 在一个实施例中,通过使第一物种的脊椎动物细胞群(其中所述脊椎动物细胞包 含tRNA文库成员)经历负选择来获得O-tRNA。负选择除去包含如下tRNA文库成员的细 胞,所述tRNA文库成员经对于脊椎动物细胞为内源性的氨酰基-tRNA合成酶(RS)氨酰化。 这提供与第一物种的脊椎动物细胞正交的tRNA池。
[0116] 另外,或者与上文所述其它方法组合,使用反式翻译系统以将非天然氨基酸并入 多肽中。此系统涉及存在于大肠杆菌中的称为tmRNA的分子。这一 RNA分子在结构上与丙 氨酰tRNA相关且经丙氨酰合成酶氨酰化。tmRNA与tRNA之间的差异在于,反密码子环经特 定较大序列置换。这一序列允许核糖体使用tmRNA内编码的开放式阅读框作为模板在已停 止的序列上重新开始翻译。在本发明中,可产生优先经正交合成酶氨酰化且装载有非天然 氨基酸的正交tmRNA。通过所述系统转录基因,核糖体将在特定位点停止;将非天然氨基酸 引入此位点处,并且使用正交tmRNA内编码的序列重新开始翻译。
[0117] 有关产生重组正交tRNA的其它方法可见于例如题为"Methodsand compositionsfortheproductionoforthogonaltRNA-aminoacyltRNAsynthetase pairs. "的国际专利申请案TO2002/086075中。还参看Forster等人,(2003) Programmingpeptidomimeticsynthetasesbytranslatinggeneticcodesdesignedde novoPNAS100 (11) :6353_6357 ;和Feng等人,(2003),ExpandingtRNArecognitionofa tRNAsynthetasebyasingleaminoacidchange.PNAS100(10) :5676-5681。
[0118] 正交TRNA与正交氨酰基-TRNA合成酶对
[0119] 正交对是由例如抑制tRNA、移码tRNA等0-tRNA与0-RS构成。0-tRNA不经内源 性合成酶酰化,且能够在活体内介导将非天然氨基酸并入蛋白质中,所述蛋白质是由包含 由0-tRNA识别的选择性密码子的多聚核苷酸编码。在脊椎动物细胞中,0-RS识别0-tRNA 且优先利用非天然氨基酸将0-tRNA氨酰化。本发明中包括用于产生正交对的方法连同由 所述方法产生的正交对,和用于脊椎动物细胞中的正交对组合物。多种正交tRNA/合成酶 对的开发可允许使用不同密码子将多个非天然氨基酸同时并入脊椎动物细胞中。
[0120] 可通过利用无效跨物种氨酰化输入来自不同生物体的对(例如,无义抑制子对) 在脊椎动物细胞中产生正交O-tRNA/0-RS对。在脊椎动物细胞中有效表达和加工0-tRNA 和0-RS,并且将0-tRNA从细胞核有效地输出到细胞质。举例来说,一种所述对为来自大 肠杆菌的酪氨酰 -tRNA合成酶/tRNA^A对(例如参看,H. M. Goodman等人,(1968),Nature 217:1019-24 ;和 D.G. Barker 等人,(1982). FEBS Lettersl50:419-23) 〇 当在酿酒酵母 细胞质中表达大肠杆菌酪氨酰-tRNA合成酶和其同源大肠杆菌tRNAeuA时,大肠杆菌酪氨 酰-tRNA合成酶有效地将其同源大肠杆菌tRNA euA氨酰化,但不会将酿酒酵母tRNA氨酰化。 例如参看,H. Edwards, &P. Schimmel, (1990), Molecular&Cellular Biology 10:1633-41 ; 和 H. Edwards 等人,(1991),PNAS UnitedStates of America 88:1153-6。此外,大肠杆 菌酪氨酰tRNAeuA为酿酒酵母氨酰基-tRNA合成酶的弱底物(例如参看V. Trezeguet等 人,(1991), Molecular&Cellular Biologyll: 2744-51),但其有效地在酿酒酵母的蛋白质 翻译中起作用。例如参看,H. Edwards, &P. Schimmel, (1990)Molecular&Cellular Biology 10:1633-41 ;H. Edwards 等人,(1991), PNAS United States of America 88:1153-6;和 V. Trezeguet 等人,(1991), Molecular&Cellular Biology 11:2744_51。此外,大肠杆菌 TyrRS不具有校对接合到tRNA的非天然氨基酸的编辑机制。
[0121] 0-tRNA和0-RS可为天然存在的,或可通过使来自多种生物体的天然存在的tRNA 和/或RS突变得到,这将产生tRNA文库和/或RS文库。参看本文中题为"来源和宿主"的 章节。在各个实施例中,0-tRNA和0-RS是得自至少一种生物体。在另一实施例中,0-tRNA 得自第一物种的天然存在或突变的天然存在的tRNA,且0-RS得自第二物种的天然存在或 突变的天然存在的RS。在一个实施例中,第一与第二非脊椎动物生物体相同。或者,第一与 第二非脊椎动物生物体可不同。
[0122] 有关产生0-RS和0-tRNA的方法,参看本文中题为"正交氨酰基-tRNA合成酶 (Orthogonal aminoacyl-tRNA synthetases)" 和"0-tRNA" 的章节。还参看题为"Methods and compositions for the production of orthogonal tRNA-aminoacyltRNA synthetase pairs. "的国际专利申请案W0 2002/086075。
[0123] 保真度、效率和产率
[0124] 保真度是指将所需分子(例如非天然氨基酸或氨基酸)并入正在生长的多肽中的 所需位置的准确度。本发明的翻译组件响应选择性密码子以高保真度将非天然氨基酸并 入蛋白质中。举例来说,与并入正在生长的多肽链中所需位置的特定天然氨基酸的不合需 要的并入相比,使用本发明的组件将所需非天然氨基酸并入正在生长的多肽链中所需位置 (例如响应选择性密码子)的效率为例如大于75%、大于85%、大于95%或甚至大于99% 有效。
[0125] 效率还可以指与相关对照相比,0-RS利用非天然氨基酸将0-tRNA氨酰化的程度。 本发明的0-RS可通过其效率定义。在本发明某些实施例中,将0-RS与另一 0-RS相比较。例 如,本发明的0-RS利用非天然氨基酸将0-tRNA氨酰化,这与具有(例如)如SEQ ID N0. :86 或45中所述的氨基酸序列的0-RS或表5)中另一特定RS将0-tRNA氨酰化相比例如至少 40%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95%或甚至99%或更高 有效。在另一实施例中,本发明的0-RS利用非天然氨基酸将0-tRNA氨酰化,这比0-RS利 用天然氨基酸将0-tRNA氨酰化有效例如至少10倍、至少20倍、至少30倍等。
[0126] 使用本发明的翻译组件,包含非天然氨基酸的所关注多肽的产率例如为从多聚 核苷酸缺乏选择性密码子的细胞中获得天然存在的所关注多肽的产率的至少5%、至少 10%、至少20%、至少30%、至少40%、50%或更多。另一方面,细胞在不存在非天然氨基酸 的情况下以一定产率产生所关注多肽,所述产率例如为在存在非天然氨基酸的情况下多肽 产率的不到30%、不到20%、不到15%、不到10%、不到5%、不到2. 5%等。
[0127] 来源和宿主生物体
[0128] 本发明的正交翻译组件通常得自非脊椎动物生物体从而用于脊椎动物细胞 或翻译系统。举例来说,正交0-tRNA可得自非脊椎动物生物体,例如真细菌,诸如大 肠杆菌、极端嗜热细菌(Thermus thermophilus)、嗜热脂肪芽孢杆菌等;或古细菌,例 如詹氏甲烧球菌、嗜热自养甲烧杆菌(Methanobacterium thermoautotrophicum)、嗜 盐古菌(Halobacterium)(诸如沃氏嗜盐富饶菌(Haloferax volcanii)和嗜盐古菌 NRC_l(Halobacterium species NRC-1))、闪烁古生球菌(Archaeoglobus fulgidus)、强烈 火球菌(Pyrococcus furiosus)、掘越氏热球菌(Pyrococcus horikoshii)、嗜热泉生古细 菌(Aeuropyrum pernix)等,而正交0-RS可得自非脊椎动物生物体,例如真细菌,诸如大肠 杆菌、极端嗜热细菌、嗜热脂肪芽孢杆菌等;或古细菌,例如詹氏甲烷球菌、嗜热自养甲烷杆 菌、嗜盐古菌(诸如沃氏嗜盐富饶菌和嗜盐古菌NRC-1)、闪烁古生球菌、强烈火球菌、掘越 氏热球菌、嗜热泉生古细菌等。另外,还可使用脊椎动物来源,例如植物、藻类、原生生物、真 菌、酵母、动物(例如,哺乳动物、昆虫、节肢动物等)等,例如其中所述组件与所关注细胞或 翻译系统正交,或其中其经修饰(例如,突变)而与所述细胞或翻译系统正交。
[0129] O-tRNA/0-RS对的个别组件可得自相同生物体或不同生物体。在一个实施例中, O-tRNA/0-RS对是来自相同生物体。举例来说,O-tRNA/0-RS对可得自大肠杆菌的酪氨 酰-tRNA合成酶/tRNA euA对。或者O-tRNA/0-RS对的0-tRNA和0-RS任选来自不同生物体。
[0130] 正交0-tRNA、0-RS或O-tRNA/0-RS对可经选择或筛选和/或用于脊椎动物细胞中 以产生具有非天然氨基酸的多肽。脊椎动物细胞可来自各种来源,例如任何脊椎动物(例 如,哺乳动物、两栖动物、鸟类、爬行动物、鱼类等)等。具有本发明的翻译组件的脊椎动物 细胞的组合物也为本发明的特征。
[0131] 本发明还提供在一种物种中有效筛选以任选用于所述物种和/或第二物种(任选 无需额外选择/筛选)中。举例来说,在一种物种(例如,易于操纵的物种,诸如酵母细胞 等)中选择或筛选O-tRNA/0-RS组件,且将其引入第二脊椎动物物种,例如植物(例如复杂 植物,诸如单子叶植物或双子叶植物)、藻类、原生生物、真菌、酵母、动物(例如哺乳动物、 昆虫、节肢动物等)等中,以用于在活体内将非天然氨基酸并入所述第二物种中。
[0132]举例来说,由于酿酒酵母(Saccharomyces cerevisiae,S. cerevisiae)为单 细胞的,具有快速换代时间和相对充分表征的遗传学,故可将其选作脊椎动物第一物 种。例如参看 D. Burke 等人,(2000)Methods in Yeast Genetics. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY。此外,由于真核生物的翻译机器高度保 守(例如参看(1996) Translational Control. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY ;Y.Kwok, &J. T. Wong, (1980),Evolutionary relationship between Halobacterium cutirubrum and eukaryotes determined by use of aminoacyl-tRNA synthetases as phylogenetic probes,Canadian Journal of Biochemistry 58:213-218;和(2001)The Ribosome. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY),故可将在酿酒酵母中发现的用于并入非天然氨基酸的aaRS基因 引入高级脊椎动物生物体中,且与同源tRNA合作(例如参看K. Sakamoto等人,(2002) Site-specific incorporation of an unnatural amino acid into proteins in mammalian cells.Nucleic Acids Res.30:4692-4699 :和 C. Kohrer 等人,(2001),Import of amber and ochre suppressor tRNA's into mammalian celIs:a general approach to site-specific insertion of amino acid analogues into proteins. Proc. Natl. Acad. Sci.U. S. A. 98:14310-14315)用于并入非天然氨基酸。
[0133] 在一个实例中,在如本文所述的第一物种中产生0-tRNA/0-RS对的方法另外包括 将编码0-tRNA的核酸和编码0-RS的核酸引入第二物种(例如,哺乳动物、昆虫、真菌、藻 类、植物等)的脊椎动物细胞中。在另一实例中,产生在脊椎动物细胞中优先利用非天然氨 基酸将正交tRNA氨酰化的正交氨酰基-tRNA合成酶(0-RS)的方法包括:(a)在存在非天 然氨基酸的情况下,使第一物种(例如,酵母等)的脊椎动物细胞群经历正选择。所述脊椎 动物细胞各自包含:i)氨酰基-tRNA合成酶(RS)文库成员,ii)正交tRNA(0-tRNA),iii) 编码正选择标记的多聚核苷酸,和iv)编码负选择标记的多聚核苷酸。在正选择中存活的 细胞包含在存在非天然氨基酸的情况下将正交tRNA (0-tRNA)氨酰化的活性RS。使在正 选择下存活的细胞在不存在非天然氨基酸的情况下经历负选择,以除去利用天然氨基酸将 0-tRNA氨酰化的活性RS。这提供优先利用非天然氨基酸将0-tRNA氨酰化的0-RS。将编码 0-tRNA的核酸和编码0-RS的核酸(或0-tRNA和/或0-RS的组件)引入第二物种(例如, 哺乳动物、昆虫、真菌、藻类、植物等)的脊椎动物细胞中。通常,通过使第一物种的脊椎动 物细胞群经历负选择来获得0-tRNA,其中所述脊椎动物细胞包含tRNA文库成员。负选择标 记除去包含tRNA文库成员的细胞,所述tRNA文库成员经对于脊椎动物细胞为内源性的氨 酰基-tRN合成酶(RS)氨酰化,其提供与第一物种和第二物种的脊椎动物细胞正交的tRNA 池。
[0134] 选择性密码子
[0135] 本发明的选择性密码子将扩充蛋白质生物合成机器的遗传密码子框架。举例来 说,选择性密码子包括例如独特的三碱基密码子、无义密码子(诸如终止密码子,例如琥珀 密码子(UAG)、蛋白石密码子(UGA))、非天然密码子、至少四碱基的密码子、稀有密码子等。 可将多个(例如一个或多个、两个或两个以上、三个以上等)选择性密码子引入所需基因 中。基因可包括多个指定选择性密码子拷贝,或可包括多个不同选择性密码子或其组合。
[0136] 在一个实施例中,所述方法涉及使用作为终止密码子的选择性密码子以在脊椎动 物细胞中于活体内并入非天然氨基酸。举例来说,产生识别终止密码子(例如UAG)且通过 0-RS利用所需非天然氨基酸氨酰化的0-tRNA。天然存在的宿主氨酰基-tRNA合成酶不识别 所述0-tRNA。可使用常规定点诱变将终止密码子(例如TAG)引入所关注多肽中的所关注位 点处。例如参看 Sayers, J.R?等人(1988),5,,3, Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis.Nucleic Acids Res.791-802。当在活体内将 0-RS、0-tRNA和编码所关注多肽的核酸组合时,响应UAG密码子而并入非天然氨基酸从而 得到在指定位置处含有所述非天然氨基酸的多肽。
[0137] 在活体内并入非天然氨基酸可在不显著干扰脊椎动物宿主细胞的情况下进行。举 例来说,由于UAG密码子的抑制效率视O-tRNA (例如,琥珀抑制性tRNA)与脊椎动物释放因 子(例如,eRF)(其与终止密码子结合并且起始正在生长的肽从核糖体释放)之间的竞争 而定,故所述抑制效率可例如通过增加O-tRNA(例如,抑制性tRNA)的表达水平来调节。
[0138] 选择性密码子还包含扩充的密码子,例如四个或四个以上碱基的密码子,诸如四 碱基密码子、五碱基密码子、六碱基密码子或更多个碱基的密码子。四碱基密码子的实例 包括例如AGGA、CUAG、UAGA、CCCU等。五碱基密码子的实例包括例如AGGAC、CCCCU、CCCUC、 CUAGA、CUACU、UAGGC等。本发明的特征包括基于移码抑制使用扩充的密码子。四个或四 个以上碱基的密码子可将例如一个或多个非天然氨基酸插入同一蛋白质中。举例来说,在 存在具有反密码子环、例如具有8-10nt反密码子环的突变O-tRNA(例如,特定移码抑制性 tRNA)的情况下,将四个或四个以上碱基的密码子读作单一氨基酸。在其它实施例中,反密 码子环可解码例如至少四碱基密码子、至少五碱基密码子或至少六碱基密码子或更多碱基 的密码子。由于存在256个可能的四碱基密码子,故可在同一细胞中使用四个或四个以上 碱基的密码子编码多个非天然氨基酸。参看Anderson等人,(2002) Exploring the Limits of Codon and Anticodon Size,Chemistry and Biology. 9:237~244 :Magliery, (2001) Expanding the Genetic Code:Selection of Efficient Suppressors of Four-base Codons and Identification of 〃Shifty〃Four_base Codons with a Library Approach in Escherichia coli. T. Mol. Biol. 307:755-769〇
[0139] 举例来说,已使用四碱基密码子使用活体外生物合成方法将非天然氨基酸并入蛋 白质中。例如参看 Ma 等人,(1993)Biochemistry,32:7939 :和 Hohsaka 等人,(1999) T. Am. Chem. Soc. 121:34。使用CGGG和AGGU利用两个以化学方式酰化的移码抑制性tRNA在活体 外将2-萘基丙氨酸和赖氨酸的NBD衍生物同时并入抗生蛋白链菌素中。例如参看Hohsaka 等人,(1999) T. Am. Chem. Soc. 121:12194。在活体内研究中,Moore等人检查具有NCUA反密 码子的tRNALeu衍生物抑制UAGN密码子(N可为U、A、G或C)的能力,并且发现四联体UAGA 可以通过具有UCUA反密码子的tRNALeu以13%到26%的效率解码且在0或-1框内极少 解码。参看Moore等人,(2000)T. Mol. Biol. ,298:195。在一个实施例中,可将基于稀有密 码子或无义密码子的扩充密码子用于本发明中,其可减少错义通读和其它不合需要的位点 处的移码抑制。
[0140] 对于指定系统来说,选择性密码子也可包括一个天然三碱基密码子,其中内源系 统不使用(或极少使用)天然碱基密码子。举例来说,这包括缺乏识别天然三碱基密码子 的tRNA的系统和/或三碱基密码子为稀有密码子的系统。
[0141] 选择性密码子任选包括非天然碱基对。这些非天然碱基对使现有的遗传代码进一 步扩展。一种额外的碱基对使三联体密码子的数量从64增加到125。第三碱基对的特性 包括稳定且具选择性的碱基配对、通过聚合酶以高保真度有效酶促并入DNA中以及合成新 的非天然碱基对之后有效的持续引物延伸。可适于方法和组合物的非天然碱基对的描述 包括例如 Hirao 等人,(2002) An unnatural base pair for incorporating amino acid analogues into protein.Nature Biotechnology. 20:177-182。其它相关公开案列于下文 中。
[0142] 对于活体内使用来说,非天然核苷可渗透膜并且磷酸化形成相应的三磷酸盐。 此外,增加的遗传信息稳定并且不被细胞酶所破坏。Benner和其它人先前的工作利用不 同于规范Watson-Crick配对的氢键模式,最值得关注的实例为is〇-C:is〇-G配对。例 如参看 Switzer 等人,(1989) T. Am. Chem. Soc, 111 :8322 ;和 Piccirilli 等人,(1990) Nature, 343:33 :Kool, (2000)Curr. Opin. Chem. Biol, 4:602〇 一般说来,这些喊基在某种程 度上与天然碱基错配并且无法酶促复制。Kool和同事证实,碱基之间的疏水堆积相互作 用可替代氢键以驱动碱基对的形成。参看Kool,(2000)Curr. Opin. Chem. Biol. 4:602-M Guckian 及 Kool, (1998)Angew. Chem. Int. Ed. Engl., 36, 2825。在开发满足所有上述需求的 非天然碱基对的工作中,Schultz、Romesberg和同事已系统地合成一系列非天然疏水碱基 并且对其进行研究。已发现,PICS:PICS自身配对比天然碱基对稳定,并且能够通过大肠杆 菌DNA聚合酶I的Klenow片段(KF)有效地并入DNA中。例如参看McMinn等人,(1999) T. Am. Chem. Soc. 121:11586 ;以及 Ogawa 等人,(2000)T. Am. Chem. Soc.122:3274。3MN: 3MN 自 身配对可通过KF以足以用于生物功能的效率和选择性合成。例如参看Ogawa等人,(2000) T. Am. Chem. Soc. 122:8803〇然而,两种碱基都充当用于进一步复制的链终止子。近来已开 发出可用于复制PICS自身配对的突变体DNA聚合酶。此外,可复制7AI自身配对。例如参 看Tae等人,(2001) T. Am. Chem. Soc, 123:7439〇也已开发出新颖的金属碱基对Dipic:Py,其 在结合Cu (II)后形成稳定的配对。参看Meggers等人,(2000).L Am. Chem. Soc, 122:10714。 由于扩充密码子和非天然密码子内在地与天然密码子正交,故本发明的方法可利用这一特 性产生正交tRNA供其使用。
[0143] 也可使用翻译旁路系统将非天然氨基酸并入所需多肽中。在翻译旁路系统中,将 较大序列插入基因中但并不被翻译成蛋白质。所述序列含有充当诱导核糖体越过所述序列 并且在插入下游重新开始翻译的线索的结构。
[0144] 非天然氨基酸
[0145] 如本文所使用,非天然氨基酸是指除硒代半胱氨酸和/或吡咯赖氨酸和以下20种 基因编码的a-氨基酸外的任何氨基酸、经修饰氨基酸或氨基酸类似物:丙氨酸、精氨酸、 天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨 酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。通过式I说明 a _氨基酸的一般结构:
[0146]

【权利要求】
1. 一种脊椎动物细胞或细胞系,其包含正交氨酰基-tRNA合成酶(0-RS),其中所述 0-RS在所述脊椎动物细胞中优先利用对乙酰基-苯丙氨酸(PAF)将正交tRNA(O-tRNA)氨 酰化。
2. 根据权利要求1所述的细胞或细胞系,其中所述0-RS利用PAF将所述0-tRNA氨酰 化,这比所述0-RS利用天然氨基酸将所述0-tRNA氨酰化有效至少10倍。
3. 根据权利要求1所述的细胞或细胞系,其中所述0-RS是得自非脊椎动物生物体。
4. 根据权利要求3所述的细胞或细胞系,其中所述非脊椎动物生物体为大肠杆菌 (Escherichia coli)或嗜热月旨肪芽抱杆菌(Bacillus stearothermophilus) 〇
5. 根据权利要求1所述的细胞或细胞系,其中所述脊椎动物细胞或细胞系为哺乳动物 的。
6. 根据权利要求5所述的细胞系,其中所述脊椎动物细胞系为人类细胞系。
7. 根据权利要求1所述的细胞或细胞系,其中与天然氨基酸相比,所述0-RS具有一个 或多个改进或增强的关于至少一个非天然氨基酸的酶特性,所述特性选自由以下组成的群 组:较高Km、较低Km、较高krat、较低kMt、较低k Mt/km和较高krat/km。
8. 根据权利要求1所述的细胞或细胞系,其中所述0-tRNA是得自非脊椎动物生物体。
9. 根据权利要求8所述的细胞或细胞系,其中所述非脊椎动物生物体为大肠杆菌或嗜 热脂肪芽孢杆菌。
10. 根据权利要求1所述的细胞或细胞系,其另外包含包括编码所关注多肽的多聚核 苷酸的核酸,其中所述多聚核苷酸包含由所述0-tRNA所识别的选择性密码子。
11. 根据权利要求10所述的细胞或细胞系,其中所述选择性密码子选自由以下组成的 群组:琥珀密码子、赭石密码子、蛋白石密码子或者四个或四个以上碱基的密码子。
12. 根据权利要求10所述的细胞或细胞系,其中所述选择性密码子为琥珀密码子。
13. 根据权利要求10所述的细胞或细胞系,其中所述选择性密码子为赭石密码子。
14. 根据权利要求10所述的细胞或细胞系,其中所述选择性密码子为蛋白石密码子。
15. 根据权利要求10所述的细胞或细胞系,其中所述选择性密码子含有四个或四个以 上碱基密码子。
16. 根据权利要求10所述的细胞或细胞系,其中所述包含所述至少一个非天然氨基酸 的所关注多肽的产率为从所述多聚核苷酸缺乏所述选择性密码子的细胞获得所关注天然 存在的多肽的产率的至少5%。
17. 根据权利要求1所述的细胞或细胞系,其中所述细胞在不存在所述至少一个非天 然氨基酸的情况下以一定产率产生所述所关注多肽,所述产率为在存在所述至少一个非天 然氨基酸的情况下所述多肽产率的不到30%。
18. 根据权利要求10所述的细胞或细胞系,其中所述所关注多肽为治疗性蛋白质、诊 断性蛋白质、工业酶或其部分。
19. 根据权利要求10所述的细胞或细胞系,其中所述所关注多肽包含选自由以下组 成的群组的蛋白质或蛋白质的一部分:细胞因子、生长因子、生长因子受体、干扰素、白细 胞介素、炎症分子、癌基因产物、肽激素、信号转导分子、类固醇激素受体、促红细胞生成素 (EP0)、胰岛素、人生长激素、a-1抗胰蛋白酶、血管抑素、抗溶血因子、抗体、载脂蛋白、脱 辅基蛋白、心房利钠因子、心房利钠多肽、心房肽、C-X-C趋化因子、T39765、NAP-2、ENA-78、 Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG、降钙素、c-kit 配体、CC 趋化 因子、单核细胞趋化蛋白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎症蛋 白-1 a、单核细胞炎症蛋白-1 p、RANTES、1309、R83915、R91733、HCC1、T58847、D31065、 T64262、CD40、CD40配体、胶原蛋白、群落刺激因子(CSF)、补体因子5a、补体抑制剂、补体 受体 1、DHFR、上皮中性粒细胞活化肽-78、GRO a /MGSA、GRO P、GRO y、MIP-1 a、MIP-1 S、 MCP-1、表皮生长因子(EGF)、上皮中性粒细胞活化肽、脱落毒素、因子IX、因子VII、因子 VIII、因子X、成纤维细胞生长因子(FGF)、纤维蛋白原、纤维粘连蛋白、G-CSF、GM-CSF、 葡糖脑苷脂酶、促性腺激素、刺猬蛋白(hedgehog protein)、血红蛋白、肝细胞生长因子 (HGF)、水蛭素、人血清白蛋白、I CAM-1、I CAM-1受体、LFA-1、LFA-1受体、类胰岛素生长因子 (IGF)、IGF-I、IGF-II、IFN-a、IFN-P、IFN-y、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、 IL-8、IL-9、IL-10、IL-11、IL-12、角质细胞生长因子(KGF)、乳铁蛋白、白血病抑制因子、 荧光素酶、神经营养因子、中性粒细胞抑制因子(NIF)、抑瘤素M、成骨蛋白、甲状旁腺激素、 H)-ECSF、TOGF、多效生长因子、蛋白质A、蛋白质G、致热性外毒素A、B或C、松驰素、肾素、 SCF、可溶性补体受体I、可溶性I-CAM 1、可溶性白细胞介素受体、可溶性TNF受体、生长调 节素、生长抑素、生长激素、链激酶、超抗原、葡萄球菌肠毒素、SEA、SEB、SEC1、SEC2、SEC3、 SED、SEE、类固醇激素受体、超氧化物歧化酶(SOD)、中毒性休克综合症毒素、胸腺肽a 1、组 织型纤溶酶原活化剂、肿瘤生长因子(TGF)、TGF-a、TGF-0、肿瘤坏死因子、肿瘤坏死因子 a、肿瘤坏死因子3、肿瘤坏死因子受体(TNFR)、VLA-4蛋白、VCAM-1蛋白、血管内皮生长因 子(VEGEF)、尿激酶、Mos、Ras、Raf、Met、p53、Tat、Fos、Myc、Jun、Myb、Rel、雌激素受体、孕 酮受体、睾酮受体、醛固酮受体、LDL 受体、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/ LFA-1、透明质酸/⑶44和皮质酮。
20. -种脊椎动物细胞或细胞系,其包含正交氨酰基-tRNA合成酶(0-RS),其中所述 0-RS在所述脊椎动物细胞中优先利用对乙酰基-苯丙氨酸将正交tRNA(O-tRNA)氨酰化。
21. 根据权利要求20所述的细胞或细胞系,其中所述0-RS利用所述对乙酰基-苯丙 氨酸将所述0-tRNA氨酰化,这比所述0-RS利用天然氨基酸将所述0-tRNA氨酰化有效至少 10倍。
22. 根据权利要求20所述的细胞或细胞系,其中所述0-RS是得自非脊椎动物生物体。
23. 根据权利要求22所述的细胞或细胞系,其中所述非脊椎动物生物体为大肠杆菌或 嗜热脂肪芽孢杆菌。
24. 根据权利要求20所述的细胞或细胞系,其中所述脊椎动物细胞或细胞系为哺乳动 物的。
25. 根据权利要求20所述的细胞系,其中所述脊椎动物细胞系为人类细胞系。
26. 根据权利要求20所述的细胞或细胞系,其中与天然氨基酸相比,所述0-RS具有一 个或多个改进或增强的关于至少一个非天然氨基酸的酶特性,所述特性选自由以下组成的 群组:较高Km、较低Km、较高krat、较低kMt、较低k Mt/km和较高krat/km。
27. 根据权利要求20所述的细胞或细胞系,其中所述0-tRNA是得自非脊椎动物生物 体。
28. 根据权利要求27所述的细胞或细胞系,其中所述非脊椎动物生物体为大肠杆菌或 嗜热脂肪芽孢杆菌。
29. 根据权利要求20所述的细胞或细胞系,其另外包含包括编码所关注多肽的多聚核 苷酸的核酸,其中所述多聚核苷酸包含由所述O-tRNA所识别的选择性密码子。
30. 根据权利要求29所述的细胞或细胞系,其中所述选择性密码子选自由以下组成的 群组:琥珀密码子、赭石密码子、蛋白石密码子或者四个或四个以上碱基的密码子。
31. 根据权利要求29所述的细胞或细胞系,其中所述选择性密码子为琥珀密码子。
32. 根据权利要求29所述的细胞或细胞系,其中所述选择性密码子为赭石密码子。
33. 根据权利要求29所述的细胞或细胞系,其中所述选择性密码子为蛋白石密码子。
34. 根据权利要求29所述的细胞或细胞系,其中所述选择性密码子含有四个或四个以 上碱基密码子。
35. 根据权利要求29所述的细胞或细胞系,其中所述包含所述至少一个非天然氨基酸 的所关注多肽的产率为从所述多聚核苷酸缺乏所述选择性密码子的细胞获得所关注天然 存在的多肽的产率的至少5%。
36. 根据权利要求20所述的细胞或细胞系,其中所述细胞在不存在所述至少一个非天 然氨基酸的情况下以一定产率产生所述所关注多肽,所述产率为在存在所述至少一个非天 然氨基酸的情况下所述多肽产率的不到30%。
37. 根据权利要求29所述的细胞或细胞系,其中所述所关注多肽为治疗性蛋白质、诊 断性蛋白质、工业酶或其部分。
38. 根据权利要求29所述的细胞或细胞系,其中所述所关注多肽包含选自由以下组 成的群组的蛋白质或蛋白质的一部分:细胞因子、生长因子、生长因子受体、干扰素、白细 胞介素、炎症分子、癌基因产物、肽激素、信号转导分子、类固醇激素受体、促红细胞生成素 (EPO)、胰岛素、人生长激素、a-1抗胰蛋白酶、血管抑素、抗溶血因子、抗体、载脂蛋白、脱 辅基蛋白、心房利钠因子、心房利钠多肽、心房肽、C-X-C趋化因子、T39765、NAP-2、ENA-78、 Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG、降钙素、c-kit 配体、CC 趋化 因子、单核细胞趋化蛋白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎症蛋 白-1 a、单核细胞炎症蛋白-1 p、RANTES、1309、R83915、R91733、HCC1、T58847、D31065、 T64262、CD40、CD40配体、胶原蛋白、群落刺激因子(CSF)、补体因子5a、补体抑制剂、补体 受体 1、DHFR、上皮中性粒细胞活化肽-78、GRO a /MGSA、GRO P、GRO y、MIP-1 a、MIP-1 S、 MCP-1、表皮生长因子(EGF)、上皮中性粒细胞活化肽、脱落毒素、因子IX、因子VII、因子 VIII、因子X、成纤维细胞生长因子(FGF)、纤维蛋白原、纤维粘连蛋白、G-CSF、GM-CSF、葡 糖脑苷脂酶、促性腺激素、刺猬蛋白、血红蛋白、肝细胞生长因子(HGF)、水蛭素、人血清白 蛋白、ICAM-1、ICAM-1 受体、LFA-1、LFA-1 受体、类胰岛素生长因子(IGF)、IGF-I、IGF-II、 IFN-a、IFN-P、IFN-y、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、 IL-11、IL-12、角质细胞生长因子(KGF)、乳铁蛋白、白血病抑制因子、荧光素酶、神经营养因 子、中性粒细胞抑制因子(NIF)、抑瘤素M、成骨蛋白、甲状旁腺激素、PD-ECSFJDGF、多效生 长因子、蛋白质A、蛋白质G、致热性外毒素A、B或C、松驰素、肾素、SCF、可溶性补体受体I、 可溶性I-CAM 1、可溶性白细胞介素受体、可溶性TNF受体、生长调节素、生长抑素、生长激 素、链激酶、超抗原、葡萄球菌肠毒素、SEA、SEB、SEC1、SEC2、SEC3、SED、SEE、类固醇激素受 体、超氧化物歧化酶(SOD)、中毒性休克综合症毒素、胸腺肽a 1、组织型纤溶酶原活化剂、 肿瘤生长因子(TGF)、TGF-a、TGF-0、肿瘤坏死因子、肿瘤坏死因子a、肿瘤坏死因子旦、 肿瘤坏死因子受体(TNFR)、VLA-4蛋白、VCAM-1蛋白、血管内皮生长因子(VEGEF)、尿激酶、 Mos、Ras、Raf、Met、p53、Tat、Fos、Myc、Jun、Myb、Rel、雌激素受体、孕酮受体、睾酮受体、醒固 酮受体、LDL 受体、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1、透明质酸 /CD44 和皮质酮。
39. 根据权利要求1所述的脊椎动物细胞系,其中所述细胞系已经瞬时转染。
40. 根据权利要求1所述的脊椎动物细胞系,其中所述细胞系已经稳定转染。
41. 一种脊椎动物细胞或细胞系,其包含正交tRNA(O-tRNA),其中所述O-tRNA介导在 活体内将对乙酰基-苯丙氨酸并入蛋白质中,所述蛋白质是由包含所述〇-tRNA识别的选择 性密码子的多聚核苷酸编码。
42. 根据权利要求41所述的细胞或细胞系,其中所述蛋白质包含至少两个非天然氨基 酸。
43. 根据权利要求41所述的细胞或细胞系,其中所述蛋白质包含至少两个不同的非天 然氨基酸。
44. 根据权利要求41所述的细胞或细胞系,其中所述蛋白质另外包含医药学上可接受 的赋形剂。
45. -种细胞或细胞系,其包含正交tRNA(O-tRNA),其中所述O-tRNA介导在活体内将 对氨基-苯丙氨酸并入蛋白质中,所述蛋白质是由包含所述O-tRNA识别的选择性密码子的 多聚核苷酸编码。
46. 根据权利要求45所述的细胞或细胞系,其中所述蛋白质包含至少两个非天然氨基 酸。
47. 根据权利要求45所述的细胞或细胞系,其中所述蛋白质包含至少两个不同的非天 然氨基酸。
48. 根据权利要求45所述的细胞或细胞系,其中所述蛋白质另外包含医药学上可接受 的赋形剂。
49. 一种用于在细胞中产生包含至少两个非天然氨基酸的蛋白质的试剂盒,所述试剂 盒包含:容器,其含有编码O-tRNA的多聚核苷酸序列;和编码0-RS的多聚核苷酸序列或 0-RS。
50. 根据权利要求49所述的试剂盒,其中所述试剂盒另外包含至少一个非天然氨基 酸。
51. 根据权利要求49所述的试剂盒,其中所述试剂盒另外包含关于产生所述蛋白质的 说明材料。
【文档编号】C12N5/10GK104328086SQ201410578532
【公开日】2015年2月4日 申请日期:2007年9月7日 优先权日:2006年9月8日
【发明者】田锋, 席雅·诺曼, 斯蒂芬妮·周 申请人:Ambrx公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1