专利名称:经修饰胰岛素多肽和其用途的制作方法
技术领域:
本发明涉及任选地经至少一个非天然编码氨基酸修饰的胰岛素多肽。
背景技术:
糖尿病目前影响全世界2. 46亿人且预期到2025年会影响3. 8亿人(国际糖尿病 联盟(International Diabetes Federation)到 2007 年 11 月 15 日为止的统计)。2 型 糖尿病在发达国家占所有糖尿病病例的约85%到95%且在发展中国家占甚至更高的百分 比。糖尿病的流行病性质持续影响全世界越来越多的人,而公众意识仍然很低。糖尿病是任何特征为过量排尿的病症。糖尿病(diabetes)的最常见形式是糖尿 病(diabetes mellitus),它是一种由于胰岛素功能紊乱而无法氧化碳水化合物的代谢紊 乱。糖尿病的特征为血浆中的葡萄糖增多和阶段性酮酸中毒。糖尿病的其它症状包括烦渴、 糖尿、多尿、脂血和饥饿。如果不进行治疗,那么所述疾病会导致致命的酮酸中毒。糖尿病 的其它形式包括尿崩症和脆性糖尿病。尿崩症是缺乏抗利尿激素的结果。尿崩症的主要症 状(过量排尿)由肾无法再吸收水而引起。脆性糖尿病是一种极难控制的形式。其特征为 低血糖与酸中毒之间的无法解释的波动。临床上确定个体罹患糖尿病的标准包括(1)空腹血浆葡萄糖水平超过126mg/ dL(7mmol/L)。正常水平应小于100mg/dL(5. 6mmol/L);或(2)在口服葡萄糖耐量试验 (oral glucose tolerance test ;0GTT)期间的两个时间点,血浆葡萄糖水平超过200mg/ dL(llmm0l/L),其中一个时间点必须在摄取葡萄糖后2小时内。个人越早诊断出患有糖尿病,所述个人越有可能减轻原发性负面后果,所述 后果为由循环问题引起的肾衰竭、失明和截肢。美国糖尿病协会(AmericanDiabetes Association)已讨论建议,如果患者的空腹血糖水平超过100mg/dL但小于125mg/dL且在 口服葡萄糖耐量试验(OGTT)后其葡萄糖水平为至少140mg/dL但小于200mg/dL,那么医生 认为所述患者为糖尿病前期。糖尿病是具有许多病因的不同种类的临床病症。存在两种主要类别的糖尿病,即 特发性和继发性。特发性糖尿病分为两种主要类型;胰岛素依赖性和非胰岛素依赖性。胰 岛素依赖性糖尿病(insulin-d印endent diabetes mellitus ;IDDM)(更通常称为1型糖尿 病)的定义是在不进行胰岛素疗法的情况下发展成酮酸中毒。1型糖尿病最通常出现在儿 童期(因此也称为青少年发病型糖尿病)并且是胰脏b细胞的自体免疫破坏的结果。非胰 岛素依赖性糖尿病(non-insulin-d印endentdiabetes mellitus ;NIDDM)(更通常称为2型 糖尿病)的特征为持续性高血糖,但很少导致酮酸中毒。2型糖尿病通常出现在40岁以后 且因此旧称为成年发病型糖尿病。2型糖尿病可由引起胰岛素抗性和胰岛素缺乏的遗传缺 陷引起。存在两种主要形式的2型糖尿病(1)与肥胖相关的迟发型;和(2)与肥胖无关的 迟发型。忍受2型糖尿病的许多(如果不是所有)负面长期影响归因于持续性高血糖。因 此,对2型糖尿病的治疗性干预的主要目的是降低循环葡萄糖水平。胰岛素的主要功能是对抗多种产生高血糖的激素的协同作用和维持低血糖水平。因为存在多种高血糖激素,所以未经治疗的与胰岛素相关的病症通常导致严重高血糖并且 缩短寿命。胰岛素除了在调节葡萄糖代谢中的作用外,其还刺激脂肪生成,减少脂肪分解,并 且增加氨基酸转运到细胞中。胰岛素还调节转录,从而改变许多mRNA的细胞含量。其刺激 生长、DNA合成和细胞复制,即其与胰岛素样生长因子(insulin-like growth factor ;IGF) 和松弛素共同控制的作用。
发明内容
本发明提供任选地经至少一个非天然编码氨基酸修饰的胰岛素多肽。本说明书将 提供一些实施例,然而,应了解这些实施例是用于说明本发明的目的,且不应理解为限制如 权利要求书所界定的本发明的范围。在非糖尿病个体中,胰脏持续供应低(或基础)水平的胰岛素。当身体处于空腹 状态时,肝脏向身体的其余部分供应葡萄糖。这通常被称为肝脏葡萄糖生成。对膳食作出 反应后,由胰脏释放高水平的胰岛素。胰岛素首先与肝脏相互作用,向肝脏传导信号以停止 肝脏葡萄糖生成并开始吸收作为膳食的一部分而摄取的葡萄糖。一些由胰脏释放的胰岛素 团块穿过肝脏并且与其它体细胞(特别是肌细胞)相互作用,向其传导信号以吸收和使用 葡萄糖。然而,在糖尿病患者中,由胰脏和肝脏完成的这一串联工作可能受到破坏并且需要 向糖尿病患者提供治疗,帮助其将葡萄糖维持在健康界限内而不经历高血糖或低血糖和这 些波动相关的短期与长期影响。因此,胰岛素疗法的目的长期以来一直是模拟正常个体的 内源性胰岛素分泌的模式。对胰岛素的每日生理需求有波动且可分成两个阶段(a)吸收 阶段,其需要一定冲量的胰岛素来处理膳食相关血糖波动;和(b)吸收后阶段,其需要持续 量的胰岛素来调节肝脏葡萄糖排出量以维持最佳空腹血糖。因此,有效疗法通常涉及两种 外源性胰岛素的组合使用通过快速注射提供的速效进餐时间胰岛素和通过每日注射一次 或两次所投与的长效基础胰岛素。在受让于Eli Lilly的专利申请案,以引用的方式并入本文中的美国公开案第 20040242460号中,揭示一类用作长效基础胰岛素疗法的酰化胰岛素。通过用活化的脂肪 酸衍生物选择性酰化单体胰岛素(包括正常胰岛素和某些胰岛素类似物)的游离氨基来制 备酰化胰岛素。适用的脂肪酸衍生物包括链长为至少六(6)个碳原子的反应性脂肪酸型化 合物和尤其那些链中具有8到21个碳原子的脂肪酸衍生物。用棕榈酸衍生物酰化的单酰 化正常人类胰岛素是尤其有前途的候选物。属于这一类别的胰岛素描述于日本专利申请案 1-254,699中。本发明的实施例提供含有一个或一个以上非天然氨基酸的酰化胰岛素。本 发明的另一实施例包括一个或一个以上非天然编码氨基酸与水溶性聚合物(诸如聚乙二 醇(PEG))连接的酰化胰岛素。根据本发明的实施例的方法可使具有健康肝脏(即能够正常吸收和产生葡萄糖 的肝脏,但不存在调节激素胰岛素)的糖尿病个体恢复葡萄糖内稳定。本发明的方法可通 过活化肝脏以调节血糖水平来减少或消除与常规糖尿病治疗方法相关的高血糖和/或低 血糖。根据本发明的实施例的方法还可减少或消除通常与糖尿病相关的微血管并发症(例 如肾病、视网膜病和/或神经病)和/或大血管并发症(例如心肌梗塞和/或中风)的一 些(如果不是所有)疾病。此外,根据本发明的实施例的方法可减少或消除与外周投与(例
4如皮下、肺内、鼻内、口腔粘膜)胰岛素相关的高胰岛素血症。此外,根据本发明的实施例的 方法可通过活化肝脏以改善其脂肪酸代谢来减少或消除与糖尿病相关的高脂质血症。适当 活化肝脏也可恢复其它肝脏细胞,与糖尿病相关并发症有关的基因调控的代谢途径。在一些实施例中,胰岛素多肽包含一个或一个以上翻译后修饰。在一些实施例中, 胰岛素多肽与连接子、聚合物或生物活性分子连接。在一些实施例中,胰岛素多肽与双官能 聚合物、双官能连接子或至少一个其它胰岛素多肽连接。在一些实施例中,非天然编码氨基酸与水溶性聚合物连接。在一些实施例中,所述 水溶性聚合物包含聚(乙二醇)部分。在一些实施例中,非天然编码氨基酸由连接子与水 溶性聚合物连接或与水溶性聚合物键结。在一些实施例中,聚(乙二醇)分子为双官能聚 合物。在一些实施例中,所述双官能聚合物与第二种多肽连接。在一些实施例中,所述第二 种多肽为胰岛素多肽。在一些实施例中,胰岛素多肽包含至少两个与包含聚(乙二醇)部分的水溶性聚 合物连接的氨基酸。在一些实施例中,至少一个氨基酸为非天然编码氨基酸。在一些实施例中,胰岛素多肽包含至少两个与包含聚(乙二醇)部分的水溶性聚 合物连接的氨基酸。在一些实施例中,至少一个氨基酸为非天然编码氨基酸。在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以 下位置处并入胰岛素、胰岛素类似物、赖脯胰岛素(insulin lispro)、赖谷胰岛素 (insulinglulisine)、地特姨岛素(insulin detemir)或甘精姨岛素(insulin glargine) 多肽中的任一种中在A链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22(即在蛋白质的羧基端),和其任何组合(SEQ ID NO :1, 或 SEQ ID NO :3、SEQ ID NO :5、SEQ ID NO :7、SEQ ID NO 9 或 SEQ ID NO 11 中的相应氨 基酸);和 / 或在 B 链中,位置 1(即在 N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、 15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31(SEQ ID NO :2,或SEQ ID NO :4、 SEQ ID N0:6、SEQ ID NO :8、SEQ ID NO :10、SEQ ID NO : 12 中的相应氨基酸)。在一些实施 例中,一个或一个以上非天然编码氨基酸并入胰岛素中的一个或一个以上以下位置处位 置 1(即在 N 端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、 23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、 48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、 73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、 98、99、100、101、102、103、104、105、106、107、108、109、110、111(即在 SEQ ID NO 13 的蛋白 质的羧基端或SEQ ID NO 14中的相应氨基酸)。在一些实施例中,一个或一个以上非天然 编码氨基酸在一个或一个以上以下位置处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰 岛素、地特胰岛素或甘精胰岛素多肽中的任一种中在A链中,1、9、14、15(SEQ ID N0:1,或 SEQ ID N0:3、5、7、9、ll中的相应氨基酸位置)。在一些实施例中,一个或一个以上非天然编 码氨基酸在一个或一个以上以下位置处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰岛 素、地特胰岛素或甘精胰岛素多肽中的任一种中在B链中,1、22、28(SEQ ID NO :2,或SEQ ID NO :2、4、6、8、10、12中的相应氨基酸位置)。在一些实施例中,一个或一个以上非天然编 码氨基酸在一个或一个以上以下位置处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰岛 素、地特胰岛素或甘精胰岛素多肽中的任一种中在A链中,1、4、5、8、9、12、14、15、18(SEQID NO :1,或SEQ ID NO :3、5、7、9、11中的相应氨基酸位置)。在一些实施例中,一个或一个 以上非天然编码氨基酸在一个或一个以上以下位置处并入胰岛素、胰岛素类似物、赖脯胰 岛素、赖谷胰岛素、地特胰岛素或甘精胰岛素多肽中的任一种中在B链中,1、3、4、21、22、 28,29 (SEQ ID NO :2,或 SEQ ID NO :2、4、6、8、10、12 中的相应氨基酸位置)。在一些实施例中,一个或一个以上非天然编码氨基酸在胰岛素或胰岛素类似物的 一个或一个以上以下位置处并入A链位置8、9、10、14(SEQ ID NO =USEQ ID NO :3、SEQ ID N0:5、SEQ ID N0:7、SEQ ID N0:9、SEQ ID NO 11);链位置 1、17、21、25、28 (SEQ ID NO :2、 SEQ ID N0:4、SEQ ID NO :6、SEQID NO :8、SEQ ID N0:10、SEQ ID N0:12)。在一些实施例 中,一个或一个以上非天然编码氨基酸在胰岛素的一个或一个以上以下位置处并入A链 位置 8、9、10、14(SEQ ID NO :1、SEQ ID NO :3、SEQ ID NO :5、SEQ ID NO :7、SEQ ID NO :9、 SEQ ID NO 11);链位置 1、17、21、25、28(SEQ ID NO :2、SEQ ID NO :4、SEQ ID NO :6、SEQ ID N0:8、SEQ ID NO :10, SEQ ID N0:12)。在一些实施例中,一个或一个以上非天然编码氨基 酸在胰岛素类似物的一个或一个以上以下位置处并入A链位置8、9、10、14(SEQ ID NO=U SEQ ID NO :3、SEQ ID NO :5、SEQ ID NO :7、SEQ ID NO :9、SEQ ID NO 11);链位置 1、17、 21、25、28(SEQ ID NO :2、SEQ ID NO :4、SEQ ID NO :6、SEQ ID NO :8、SEQ ID NO 10,SEQ ID NO 12)。在一些实施例中,一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物 连接,所述位置包括(但不限于)以下位置在A链中,位置1(即在N端)之前、1、2、3、4、5、 6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22(即在蛋白质的羧基端),和其任何 组合(SEQ ID NO :1,或 SEQ ID NO :3、SEQ ID N0:5、SEQ ID N0:7、SEQ ID NO :9 或 SEQ ID NO=Il中的相应氨基酸);和/或在B链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、 10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31(SEQ ID NO 2,或 SEQ ID N0:4、SEQ ID NO :6、SEQ ID N0:8、SEQ ID NO: 10、SEQ ID NO : 12 中的相应氨 基酸)。在一些实施例中,一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物连 接,所述位置包括(但不限于)位置1(即在N端)前、1、2、3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、 39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、 64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、 89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、 111 (即SEQ ID N0:13的蛋白质的羧基端或SEQ ID NO 14中的相应氨基酸)。在一些实 施例中,一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物连接,所述位置包 括(但不限于)在 A 链中,1、4、5、8、9、12、14、15、18(SEQ ID N0:1,或 SEQ ID NO :3、5、7、 9、11中的相应氨基酸位置)。在一些实施例中,一个或一个以上这些位置的非天然编码氨 基酸与水溶性聚合物连接,所述位置包括(但不限于)在B链中,1、3、4、21、22、28、29(SEQ ID NO :2,或SEQ ID NO :2、4、6、8、10、12中的相应氨基酸位置)。在一些实施例中,一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物 连接,所述位置包括(但不限于)以下位置A链位置8、9、10、14(SEQ IDNO =USEQ ID NO 3, SEQ ID N0:5、SEQ ID N0:7、SEQ ID N0:9、SEQ ID NO 11);链位置 1、17、21、25、28 (SEQ ID N0:2、SEQ ID NO :4、SEQ ID NO :6、SEQ ID NO :8、SEQ ID NO : 10、SEQ ID N0:12)。在一些实施例中,一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物连接,所述位 置包括(但不限于)以下位置:A链位置8、9、10、14(SEQ ID NO =USEQ ID NO :3、SEQ IDNO 5, SEQ ID N0:7、SEQ ID N0:9、SEQ ID NO 11);链位置 1、17、21、25、28 (SEQ ID N0:2、SEQ ID N0:4、SEQ ID NO :6、SEQ ID NO :8、SEQ ID N0:10、SEQ ID N0:12)。在一些实施例中, 一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物连接,所述位置包括(但不 限于)以下位置A 链位置 8、9、10、14(SEQ ID NO :1、SEQ ID NO :3、SEQ ID NO :5、SEQ ID N0:7、SEQ ID N0:9、SEQ ID NO 11) ;B 链位置 1、17、21、25、28 (SEQ ID NO :2、SEQ ID NO: 4、SEQ ID N0:6、SEQ ID N0:8、SEQ ID NO 10, SEQ ID N0:12)。在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下位置 处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘精胰岛素多肽中 的任一种中B 链位置 1、2、9、10、28、29、30(SEQ ID N0:2、SEQ ID N0:4、SEQ ID N0:6、SEQ ID N0:8、SEQ ID NO : 10、SEQ ID NO: 12)。在一些实施例中,一个或一个以上这些位置的非 天然编码氨基酸与水溶性聚合物连接,所述位置包括(但不限于)以下位置B链位置1、2、 9、10、28、29、30(SEQ ID N0:2、SEQ ID NO :4、SEQ ID NO :6、SEQ ID NO :8、SEQ ID N0:10、 SEQ ID NO 12)。在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下位置 处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘精胰岛素多肽中 的任一种中A链21,或B链位置1、10、13、16、28、29、31或32(即蛋白质的羧基端)(SEQ ID NO :1到SEQ ID N0:12)。在一些实施例中,一个或一个以上这些位置的非天然编码氨基酸 与水溶性聚合物连接,所述位置包括(但不限于)以下位置A链21,或B链位置1、10、13、 16、28、29、31 或 32(即在蛋白质的羧基端)(SEQ ID NO :1 到 SEQ ID N0:12)。在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下位置 处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘精胰岛素多肽中 的任一种中A链位置8、9、10、14(SEQ ID NO =USEQ ID NO :3、SEQ ID NO :5、SEQ ID NO :7、 SEQ ID N0:9、SEQ ID NO :11)。在一些实施例中,一个或一个以上这些位置的非天然编码氨 基酸与水溶性聚合物连接,所述位置包括(但不限于)以下位置A链位置8、9、10、14(SEQ ID N0:1、SEQ IDNO :3、SEQ ID N0:5、SEQ ID NO :7、SEQ ID N0:9、SEQ ID NO: 11)。在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下位置 处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘精胰岛素多肽中 的任一种中:B 链位置 17、21、25、28(SEQ ID N0:2、SEQ IDN0:4、SEQ ID N0:6、SEQ ID NO: 8,SEQ ID NO 10,SEQ ID N0:12)。在一些实施例中,一个或一个以上这些位置的非天然编 码氨基酸与水溶性聚合物连接,所述位置包括(但不限于)以下位置B链位置17、21、25、 28 (SEQ ID NO :2、SEQ ID NO :4、SEQ ID NO :6、SEQ ID NO :8、SEQ ID NO :10、SEQ ID NO 12)。在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下位置 处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘精胰岛素多肽中 的任一种中:A 链位置 4、8、9、10、14、18、21(SEQ ID NO =USEQ ID N0:3、SEQ ID N0:5、SEQ ID N0:7、SEQ ID NO :9、SEQ ID N0:11)。在一些实施例中,一个或一个以上这些位置的非 天然编码氨基酸与水溶性聚合物连接,所述位置包括(但不限于)以下位置A链位置4、8、9、10、14、18、21(SEQ ID NO :1、SEQ ID NO :3、SEQ ID NO :5、SEQ ID NO :7、SEQ ID NO :9、 SEQ ID NO 11)。在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下位置 处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘精胰岛素多肽中 的任一种中B链位置1、5、17、21、25、29、30(SEQ ID NO :2、SEQ ID NO :4、SEQ ID NO :6、SEQ ID N0:8、SEQ ID NO 10, SEQ ID NO: 12)。在一些实施例中,一个或一个以上这些位置的非 天然编码氨基酸与水溶性聚合物连接,所述位置包括(但不限于)以下位置B链位置1、5、 17、21、25、29、30(SEQ ID NO :2、SEQ ID NO :4、SEQ ID NO :6、SEQ ID NO :8、SEQ ID NO :10、 SEQ ID NO 12)。在一些实施例中,一个或一个以上非天然编码氨基酸并入胰岛素的一个或一个以 上以下位置处在A链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、 15、16、17、18、19、20、21、22(即在蛋白质的羧基端),和其任何组合(SEQ ID NO 1);或在B 链中,位置 1(即在 N 端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、 21、22、23、24、25、26、27、28、29、30、31(SEQ ID NO :2)。在一些实施例中,一个或一个以上 非天然编码氨基酸并入赖脯胰岛素的一个或一个以上以下位置处在A链中,位置1(即在 N 端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22(即在蛋白 质的羧基端),和其任何组合(SEQ ID NO 3);或在B链中,位置1(即在N端)之前、1、2、 3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、 31 (SEQ ID NO :4)。在一些实施例中,一个或一个以上非天然编码氨基酸并入门冬胰岛素的 一个或一个以上以下位置处在A链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、 11、12、13、14、15、16、17、18、19、20、21、22(即在蛋白质的羧基端),和其任何组合(SEQ ID NO 5);或在B链中,位置 1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、
17、18、19、20、21、22、23、24、25、26、27、28、29、30、31(SEQID NO :6)。在一些实施例中,一个 或一个以上非天然编码氨基酸并入赖谷胰岛素的一个或一个以上以下位置处在A链中, 位置 1(即在 N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、 22(即在蛋白质的羧基端),和其任何组合(SEQ ID NO 7);或在B链中,位置1 (即在N端) 之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、 28、29、30、31(SEQ ID NO :8)。在一些实施例中,一个或一个以上非天然编码氨基酸并入地 特胰岛素的一个或一个以上以下位置处在A链中,位置1(即在N端)之前、1、2、3、4、5、6、 7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22(即在蛋白质的羧基端),和其任何组 合(SEQ ID NO 9);或在 B 链中,位置 1(即在 N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31(SEQ ID NO :10)。在一些 实施例中,一个或一个以上非天然编码氨基酸并入甘精胰岛素的一个或一个以上以下位置 处在 A 链中,位置 1(即在 N 端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、
18、19、20、21、22(即在蛋白质的羧基端),和其任何组合(SEQID NO=Il);或在B链中,位 置 1(即在 N 端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、 23、24、25、26、27、28、29、30、31(SEQ IDNO 12)。在一些实施例中,在胰岛素、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘精胰岛素 多肽中的任一种中的一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物连接,所述位置包括(但不限于)以下位置在位置1(即在N端)之前,在A链中,位置1(即在 N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22(即在蛋白质 的羧基端),和其任何组合(SEQ ID NO :1,或SEQ ID NO :3、SEQ ID NO :5、SEQ ID NO :7、SEQ ID NO :9或SEQ ID NO :11中的相应氨基酸);或在B链中,位置1 (即在N端)之前、1、2、 3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、 31 (SEQ ID NO :2,或 SEQID N0:4、SEQ ID N0:6、SEQ ID N0:8、SEQ ID NO: 10、SEQ ID NO: 12中的相应氨基酸)。在一些实施例中,胰岛素多肽中的一个或一个以上这些位置的非天然编码氨基酸 与水溶性聚合物连接,所述位置包括(但不限于)以下位置位置1 (即在N端)前,在A链 中,位置 1(即在 N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、
21、22(即在蛋白质的羧基端),和其任何组合(SEQID N0:1);或在B链中,位置1 (即在 N 端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、 26、27、28、29、30、31(SEQ ID NO :2)。在一些实施例中,赖脯胰岛素多肽中的一个或一个以 上这些位置的非天然编码氨基酸与水溶性聚合物连接,所述位置包括(但不限于)以下位 置在 A 链中,位置 1(即在 N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、
18、19、20、21、22(即在蛋白质的羧基端),和其任何组合(SEQID NO 3);或在B链中,位置 1(即在 N 端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、 24、25、26、27、28、29、30、31(SEQID NO :4)。在一些实施例中,门冬胰岛素多肽中的一个或一 个以上这些位置的非天然编码氨基酸与水溶性聚合物连接,所述位置包括(但不限于)以 下位置在 A 链中,位置 1(即在 N 端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22(即在蛋白质的羧基端),和其任何组合(SEQ ID NO 5);或在B链中, 在位置 1(即在 N 端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、
22、23、24、25、26、27、28、29、30、31(SEQID NO :6)。在一些实施例中,赖谷胰岛素多肽中的 一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物连接,所述位置包括(但不 限于)以下位置在A链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22(即在蛋白质的羧基端),和其任何组合(SEQ ID NO 7);或 在 B 链中,位置 1(即在 N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31(SEQ ID NO :8)。在一些实施例中,地特胰岛素多 肽中的一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物连接,所述位置包括 (但不限于)以下位置在A链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22(即在蛋白质的羧基端),和其任何组合(SEQID NO 9); 或在 B 链中,位置 1(即在 N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、
19、20、21、22、23、24、25、26、27、28、29、30、31(SEQID N0:10)。在一些实施例中,甘精胰岛 素多肽中的一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物连接,所述位置 包括(但不限于)以下位置在A链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、 11、12、13、14、15、16、17、18、19、20、21、22(即在蛋白质的羧基端),和其任何组合(SEQ ID NO 11);或在 B 链中,位置 1(即在 N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、 16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31(SEQ ID N0:12)。在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下位置处并入胰岛素、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘精胰岛素多肽中的任一种中 28、36、76、80、107、108、111、8、15、19、36、42、46、48、49、80、108、111、113、155 和其任何组合 (SEQ ID NO :1 禾口 SEQ ID NO 2 ;SEQID NO 3 和 SEQ ID NO 4 ;SEQ ID NO 5 和 SEQ ID NO 6 ;SEQ ID NO 7 和 SEQID NO 8 ;SEQ ID NO 9 和 SEQ ID NO 10 ;或 SEQ ID NO 11 禾口 SEQ ID NO 12)。本发明的方法可用于制造含有一个或一个以上非天然编码氨基酸的胰岛素类似 物晶体。受让于Sanofi-Aventis Deutschland GmbH的美国专利第7,193,035号(以引用 的方式并入本文中)揭示胰岛素类似物晶体的形成和用途。调配物在本发明的广泛实践中,还涵盖调配物可含有胰岛素、胰岛素类似物、酰化胰岛素 或酰化胰岛素类似物中的两种或两种以上的混合物,其中所述混合物的至少一种组分含有 非天然编码氨基酸。在本发明的另一实施例中,含有胰岛素、胰岛素类似物、酰化胰岛素或 酰化胰岛素类似物中的两种或两种以上的混合物(其中所述混合物的至少一种组分含有 非天然编码氨基酸)的调配物还包括至少一种水溶性聚合物与至少一种非天然编码氨基 酸连接。本发明还包括异质混合物,其中通过本发明中所揭示的方法制备胰岛素多肽和胰 岛素类似物且接着混合以致可向有需要的患者投与调配物,所述调配物含有例如25%在聚 乙二醇化的B链位置28含有非天然编码氨基酸的胰岛素多肽;25 %在B链位置10含有非天 然编码氨基酸的胰岛素多肽,所述非天然编码氨基酸与水溶性聚合物偶合;和50%胰岛素 多肽,其中非天然编码氨基酸出现在胰岛素B链的位置31 (SEQ ID NO :2;或者SEQ ID NO 4、6、8、10或12)。不同百分比量的胰岛素多肽变异体的所有不同混合物,其中所述胰岛素 多肽包括具有不同尺寸PEG的变种(1),或(2)在序列中的不同位置包括PEG。此打算作为 实例且决不应视为限制通过本发明变成可能的调配物并对于所属领域的技术人员将显而 易见。在另一实施例中,调配物混合物中所包括的胰岛素多肽变异体将根据其不同分解时 间(dissociation time)来选择以致调配物可向有需要的患者提供持续释放的胰岛素。本发明的调配物可包括胰高血糖素。本发明的包括吸入用调配物的其它实施例在本发明的另一实施例中,有可能使用本文所揭示的技术来制造药物动力学和药 效学性质增加的胰岛素类似物以通过投与肺来用于患者,导致胰岛素的血液水平提高,其 在投与后持续至少6小时,且更通常至少8、10、12、14、18、24小时或更久。本发明的另一实 施例虑及适合于设计成以吸入剂形式投与患者的治疗性调配物的胰岛素类似物的有利混 合物。在本发明的一些实施例中,天然胰岛素分子中的以下位点可经非天然编码氨基酸 取代且任选地进一步通过共价连接水溶性聚合物(诸如PEG)来修饰A与B链的2个C端、 Arg22B、HislOB、His5A、Glu4A、Glul7A、Glul3B 和 Glu21B。除天然胰岛素外,本发明提供一个或一个以上非天然编码氨基酸经取代或插入信 号序列中的非天然胰岛素多肽和胰岛素类似物,其也可提供用于合并一个或一个以上水溶 性聚合物(诸如PEG)的位点。本发明的这一实施例尤其适用于在胰岛素分子中引入其它定 制聚乙二醇化位点,例如形成酶降解抗性增加的PEG-胰岛素。所述方法在设计具有活性、稳定性、溶解性和药理学性质之间的所需平衡的最佳胰岛素结合物方面提供较大灵活性。 可在胰岛素分子中的许多位置进行突变,即通过位点特异性突变诱发。用于本发明的PEG 可具有多种结构线性、叉状、分支、现铃状等等。通常,用适合于偶合胰岛素分子上的所需 位点的合适活化基团使PEG活化。活化PEG将在末端具有反应性基团以与胰岛素反应。代 表性活化PEG衍生物和使这些药剂与药物(诸如胰岛素)结合的方法为所属技术中所已知 且进一步描述于 Zalipsky,S.等人,“Use of Functionalized Poly(EthyleneGlycols) for Modification of Polypeptides" , Polyethylene Glycol Chemistry :Biotechnical and Biomedical Applications,J. M. Harris,Plenus Press,New York(1992),禾口 Advanced Drug Reviews, 16 157-182 (1995)中。在本发明的一特定实施例中,结合物的PEG部分不存在一个或一个以上有效显著 改变聚合物或聚合物_胰岛素结合物的水溶性的亲脂性基团。那就是说,本发明的结合物 的聚合物或非胰岛素部分可含有认为亲脂性高于亲水性的原子的基团(例如具有约2到 8-12个碳原子的碳链),然而,如果所述基团的存在不会有效显著改变聚合物或结合物的 亲水性,那么本发明的结合物中可含有所述部分。也就是说,通过胰岛素、胰岛素多肽和胰 岛素类似物的位点特异性突变,本发明的胰岛素结合物自身可展现亲水性,而非亲脂性或 两亲性。在本发明的可存在亲脂性部分的某些实施例中,所述部分优选不位于PEG链的末 端。用于本发明的结合物中的分支PEG包括国际专利公开案WO 96/21469中所述的 那些PEG,所述专利的内容明确地以全文引用的方式并入本文中。通常,分支PEG可由式 R(PEG--OH). sub. η表示,其中R表示中心“核心”分子且.sub. η表示臂的数目。分支PEG 具有中心核心,从所述中心核心伸出2个或2个以上“PEG”臂。在分支构型中,分支聚合 物核心具有用于连接胰岛素的单个反应性位点。用于本发明的分支PEG通常将包含少于4 个PEG臂,且更优选将包含少于3个PEG臂。分支PEG提供单个反应性位点所偶合的聚合 物云状物比其线性PEG对应物更大且更致密的优点。一种特定类型的分支PEG可表示为 (MeO-PEG-) · sub. pR—X,其中ρ等于2或3,R为连接有2或3个PEG臂的中心核心结构(诸 如赖氨酸或甘油),且X表示任何受到活化或可受到活化以偶合胰岛素的合适官能团。一 种尤其优选的分支PEG为具有结构mPEG2-赖氨酸-丁二酰亚胺的mPEG2_NHS (Shearwater Corporation, Alabama)。在另一种分支结构中,“侧位PEG”具有沿PEG主链而非在PEG链末端安置的用于 偶合蛋白质的反应性基团。从PEG主链伸出以与胰岛素偶合的反应性基团可相同或不同。 侧位PEG结构可为适用的,但通常次优选,尤其对于吸入用组合物来说。或者,PEG-胰岛素结合物的PEG部分可具有叉状结构,其在聚合物链的一端具有 分支部分和两个(或2的任何倍数个)与所述分支部分连接的游离反应性基团以与胰岛素 连接。示范性叉状PEG描述于国际专利公开案第WO 99/45964号中,所述专利的内容明确 地以引用的方式并入本文中。叉状聚乙二醇可任选地在聚合物链的另一端包括烷基或“R” 基团。更具体来说,本发明的叉状PEG-胰岛素结合物具有式=R-PEG-L(Y-胰岛素)n,其中 R为烷基,L为水解稳定的分支点且Y为提供叉状聚合物与胰岛素的化学连接的连接基团, 且η为2的倍数。L可表示单个“核心”基团,诸如“一CH--”,或可包含较长原子链。示范 性L基团包括赖氨酸、甘油、季戊四醇或山梨糖醇。通常,分支部分中的特定分支原子是碳。
在本发明的一特定实施例中,叉状PEG与胰岛素分子的连接(Y)是水解稳定的。在 一优选实施例中,η为2。合适的Y部分在与胰岛素上的反应性位点结合之前包括(但不限 于)活性酯、活性碳酸酯、醛、异氰酸酯、异硫氰酸酯、环氧化物、醇、顺丁烯二酰亚胺、乙烯 砜、酰胼、二硫吡啶和碘乙酰胺。合适的活化基团的选择将视胰岛素分子上的所欲连接位点 而定且可易于由所属领域的技术人员确定。所得PEG-胰岛素结合物中的相应Y基团是由活 化叉状聚合物与胰岛素上的合适反应性位点反应所产生的Y基团。所述最后连接的特定特 性对于所属领域的技术人员将显而易见。举例来说,如果反应性叉状PEG含有活化酯(诸 如丁二酰亚胺或顺丁烯二酰亚胺酯),那么通过胰岛素上的胺位点结合将导致形成相应酰 胺键。这些特定叉状聚合物尤其具有吸引力,因为其提供胰岛素与PEG的摩尔比为2 1 或更大的结合物。所述结合物不太可能阻断胰岛素受体位点,同时仍提供在保护胰岛素以 防酶降解(例如通过胰岛素降解酶)的设计方面的灵活性。在一相关实施例中,叉状PEG-胰岛素结合物可用于本发明中,其由式 R-[PEG-L(Y-胰岛素)2]n表示。在这种情况下,R表示连接有至少一个PEG-二聚胰岛素 结合物的非天然编码氨基酸。具体来说,根据本发明的这一方面的优选叉状聚合物是η选 自由1、2、3、4、5和6组成的群组的那些聚合物。在一替代实施例中,胰岛素、胰岛素多肽或 胰岛素类似物中的非天然氨基酸与聚合物分支点之间的化学键是可降解的(即水解不稳 定)。或者,聚合物骨架中可含有一个或一个以上可降解键以使得活体内产生PEG链比最初 投与的结合物中的PEG链小的PEG-胰岛素结合物。举例来说,可投与大且相对惰性的结合 物(即连接有一个或一个以上高分子量PEG链,例如一个或一个以上分子量超过约10,000 的PEG链,其中结合物基本上不具有生物活性),其随后在肺中或在血流中水解产生具有最 初存在的PEG链的一部分的生物活性结合物。水解可降解键在活体内裂解后,接着释放游 离胰岛素(视可降解键的位置而定)或连接有小聚乙烯标记的胰岛素且其更易吸收穿过肺 和/或在血液中循环。在本发明的这一实施例的一个特征中,在投与后,完整聚合物-结合物在水解之 前最低限度地降解,以致可裂解键的水解有效地控制活性胰岛素进入血流的缓慢释放速 率,这与胰岛素在释放到全身循环中之前的酶降解相反。适当生理学上可裂解的键包括(但不限于)酯、碳酸酯、氨基甲酸酯、硫酸酯、磷酸 酯、酰氧基烷基醚、缩醛和缩酮。所述结合物应具有生理学上可裂解的键,其在贮存后和投 与后是稳定的。举例来说,在制造最终医药组合物后,在溶解于适当传递媒剂(如果使用) 中,和在不管途径投与后,PEG-可裂解键-胰岛素结合物应维持其完整性。单链胰岛素当关注外周胰岛素抗性时,所选药物是噻唑烷二酮,它是一类胰岛素增敏剂。举例 来说,曲格列酮(Troglitazone ;TRG)是噻唑烷二酮化学品系列的口服活性抗糖尿病药。已 显示这种药物逆转患有NIDDM和葡萄糖耐量异常的患者的胰岛素抗性,并且在胰岛素抗性 的许多遗传和获得性啮齿动物模型中可增强胰岛素作用。TRG的抗高血糖作用由其增加胰 岛素依赖性葡萄糖处理和减少肝脏葡萄糖生成的能力引起。相信TRG治疗通过增强胰岛素 作用可在较低循环胰岛素水平下使得血糖正常。在这点上,在正常和糖尿病啮齿动物和人 类临床试验中的研究尚未揭露低血糖是噻唑烷二酮疗法的并发症。另一方面,向正常或胰 岛素缺陷型糖尿病动物投与这些药物无法改变血浆葡萄糖或胰岛素或葡萄糖耐量,尽管胰岛素敏感性仍增加。胰岛素的双链结构使得胰岛素采用多种构型,且数个发现已表明胰岛素具有显著 构型变化的倾向且所述变化的可能性的限制显著降低胰岛素受体对配体的亲和力。胰岛素 原对胰岛素受体的亲和力是天然胰岛素的1/100。阻断胰岛素中的氨基酸残基Al还会导致 弱受体结合,这与胰岛素的A链的游离N端和B链的游离C端对于结合胰岛素受体很重要 的定理一致。胰岛素分子的固有物理和化学稳定性是糖尿病的胰岛素疗法的基础条件。这些基 础性质对于胰岛素调配物和适用胰岛素投药方法,以及医药制剂的存放期和贮存条件是基 本的。在投与胰岛素时使用溶液会使分子暴露于各种因素的组合,例如高温、可变空气-液 体-固体界面(interphase)以及剪切力,这可导致不可逆的构象变化,例如纤维化。这对 于外部穿戴或植入的输注泵中的胰岛素溶液尤其有关,这使分子长时间暴露于这些因素的 组合以及因泵移动而产生的剪切力。因此,当使用输注泵作为胰岛素传递系统时,特别关注 纤维化。此外,胰岛素的溶解性受多种因素影响且显示在4. 2到6. 6的pH值范围内显著降 低。PH值沉淀区通常对调配物有所限制,但也有意用于开发和调配某些类似物。因此,在本发明的另一实施例中,一个或一个以上非天然编码氨基酸并入单链胰 岛素或单链胰岛素类似物中。EP 1,193,272中揭示具有胰岛素活性的单链胰岛素。这 些单链胰岛素具有5-18个氨基酸的经修饰C肽且报道具有高达42%胰岛素活性。EP 1,193,272 揭示连接 B30 与 A21 的以下经修饰 C 肽=Gly-Gly-Gly-Pro-Gly-Lys-Arg, Arg-Arg-Gly-Pro-Gly-Gly-Gly、 Gly-Gly-Gly-Gly-Gly-Lys-Arg、 Arg-Arg-GIy-GIy-GIy-GIy-Gly>Gly-Gly-Ala-Pro-Gly-Asp-Val-Lys-Arg>Arg-Arg-Ala-P ro-Gly-Asp-Val-Gly-Gly>Gly-Gly-Tyr-Pro-Gly-Asp-Val-Lys-Arg>Arg-Arg-Tyr-Pro-Gl y-Asp-Val-Gly-Gly> Gly-Gly-His-Pro-Gly-Asp-Val-Lys-Arg 禾口 Arg-Arg-His-Pro-Gly-A SP-Val-Gly-Gly0 EP741, 188揭示具有经修饰C肽的单链胰岛素,所述C肽具有10-14个氨 基酸残基且具有14%到34%胰岛素活性并具有以下连接肽Gln-Pro-Leu-Ala-Leu-Glu-Gly-Ser-Leu-Gln-Lys-Arg 禾口 Gly-Tyr-Gly-Ser-Ser -Ser-Arg-Arg-Ala-Pro-Gln-Thr。WO 95/16708揭示具有1_15个氨基酸残基的连接肽且无 Lys或Arg作为连接肽中的C端氨基酸残基的单链胰岛素。WO 95/16708揭示以下C肽序 列 Gly-Tyr-Gly-Ser-Ser-Ser-Arg-Arg-Ala-Pro-Gln-Thr 禾口 Gly-Tyr-Gly-Ser-Ser-Ser-A la-Ala-Ala-Pro-Gln-Thr。这些单链胰岛素经报道具有胰岛素活性,而且对IGF-I受体的亲 和力相当高。诺和诺德公司(Novo Nordisk, Inc.)美国专利公开案第20070129284号揭示 在B链与A链之间引入C肽以降低分子柔性且伴随降低纤维化倾向并限制或改变pH值 沉淀区的单链胰岛素类似物。由诺和诺德公司(Novo Nordisk, Inc.)揭示的单链胰岛 素的一个实例包含由连接肽连接的人类胰岛素或其类似物或衍生物的B链和A链,其中 所述连接肽具有5-11个氨基酸残基,但是如果连接肽含有两个相邻碱性氨基酸残基,那 么B链和/或A链中的至少一个天然氨基酸残基经另一个可编码氨基酸残基取代,或A 链、B链或连接肽中的至少一个赖氨酸残基已通过酰化反应以化学方式加以修饰或连接 肽不是以下序列之一 Gly-Gly-Gly-Pro-Gly-Lys-Arg、Arg-Arg-Gly-Pro-Gly-Gly-Gly、 Gly-Gly-Gly-Gly-Gly-Lys-Arg>Arg-Arg-GIy-GIy-GIy-GIy-Gly>Gly-Gly-Ala-Pro-Gly-A
13sp-Val—Lys—Arg、Arg-Arg-Ala-Pro-Gly-Asp-Val-Gly-GlyΛGly-Gly-Tyr-Pro-Gly-Asp-Va 1-Lys—Arg、Arg-Arg-Tyr-Pro-Gly-Asp-Val-Gly-GlyΛGly-Gly-His-Pro-Gly-Asp-Val-Lys -Arg 或 Arg-Arg-His-Pro-Gly-Asp-Val-Gly-Glyο在一些实施例中,本发明的多肽在信号序列中包含一个或一个以上非天然编码氨 基酸取代、添加或缺失。在一些实施例中,本发明的多肽在用于胰岛素或本说明书中所揭示 的胰岛素类似物或多肽中的任一种的信号序列中包含一个或一个以上非天然编码氨基酸 取代、添加或缺失。在一些实施例中,本发明的多肽在信号序列中包含一个或一个以上天然 编码氨基酸取代、添加或缺失,以及在用于胰岛素或本说明书中所揭示的胰岛素类似物或 多肽中的任一种的信号序列中包含一个或一个以上非天然编码氨基酸取代、添加或缺失。 在一些实施例中,一个或一个以上非天然氨基酸并入用于胰岛素或本说明书中所揭示的胰 岛素类似物或多肽中的任一种的前导序列或信号序列中。在一些实施例中,胰岛素多肽包含调节胰岛素多肽对胰岛素多肽受体或结合搭配 物(包括(但不限于)蛋白质、多肽、小分子或核酸)的亲和力的取代、添加或缺失。在一 些实施例中,胰岛素多肽包含取代、添加或缺失,与无取代、添加或缺失的相应胰岛素的稳 定性相比,所述取代、添加或缺失增加胰岛素多肽的稳定性。稳定性和/或溶解性可使用 所属领域的技术人员已知的许多不同测定来测量。所述测定包括(但不限于)SE-HPLC和 RP-HPLC。在一些实施例中,胰岛素多肽包含取代、添加或缺失,与无取代、添加或缺失的相 应胰岛素的免疫原性相比,所述取代、添加或缺失调节胰岛素多肽的免疫原性。在一些实施 例中,胰岛素多肽包含取代、添加或缺失,与无取代、添加或缺失的相应胰岛素的血清半衰 期或循环时间相比,所述取代、添加或缺失调节胰岛素多肽的血清半衰期或循环时间。在一些实施例中,胰岛素多肽包含取代、添加或缺失,与无取代、添加或缺失的相 应胰岛素的水溶性相比,所述取代、添加或缺失增加胰岛素多肽的水溶性。在一些实施例 中,胰岛素多肽包含取代、添加或缺失,与无取代、添加或缺失的相应胰岛素的溶解性相比, 所述取代、添加或缺失增加宿主细胞中所产生的胰岛素多肽的溶解性。在一些实施例中,胰 岛素多肽包含取代、添加或缺失,与无取代、添加或缺失的相应胰岛素的表达或合成相比, 所述取代、添加或缺失增加胰岛素多肽在宿主细胞中的表达或增加活体外合成。包含这一 取代的胰岛素多肽保留激动剂活性且保留或改良在宿主细胞中的表达水平。在一些实施例 中,胰岛素多肽包含取代、添加或缺失,与无取代、添加或缺失的相应胰岛素的蛋白酶抗性 相比,所述取代、添加或缺失增加胰岛素多肽的蛋白酶抗性。在一些实施例中,胰岛素多肽 包含取代、添加或缺失,与和无取代、添加或缺失的相应胰岛素多肽相互作用后的胰岛素受 体的信号转导活性相比,所述取代、添加或缺失调节受体的活性。在一些实施例中,胰岛素 多肽包含取代、添加或缺失,与无取代、添加或缺失的相应胰岛素多肽与另一分子(诸如受 体)的结合相比,所述取代、添加或缺失调节其结合。在一些实施例中,胰岛素多肽包含取 代、添加或缺失,与无取代、添加或缺失的相应胰岛素多肽的抗病毒活性相比,所述取代、添 加或缺失调节其抗病毒活性。在一些实施例中,胰岛素多肽包含取代、添加或缺失,与无取 代、添加或缺失的相应胰岛素多肽的葡萄糖代谢活性相比,所述取代、添加或缺失增强其葡 萄糖代谢活性。在一些实施例中,胰岛素多肽包含取代、添加或缺失,与无取代、添加或缺失的相 应胰岛素与医药防腐剂(例如间甲酚、苯酚、苄醇)的相容性相比,所述取代、添加或缺失增加胰岛素多肽苄醇的相容性。这得到增加的相容性将使得能够制备出维持蛋白质在贮存期 间的生理化学性质和生物活性的防腐医药调配物。在一些实施例中,产生与一个或一个以上非天然氨基酸的一个或一个以上工程改 造键。分子内键可以许多方式产生,包括(但不限于)在合适的条件下于蛋白质中的两个 氨基酸之间反应(一个或两个氨基酸可为非天然氨基酸);在合适的条件下与两个氨基酸 (其中每一个氨基酸可为天然编码或非天然编码氨基酸)、与连接子、聚合物或其它分子反 应;等。在一些实施例中,胰岛素多肽中的一个或一个以上氨基酸取代可用一个或一个以 上天然存在的氨基酸或非天然编码氨基酸进行。在一些实施例中,胰岛素多肽中的氨基酸 取代可用天然存在的氨基酸或非天然编码氨基酸进行,但是至少一个取代是用非天然编码 氨基酸进行。在一些实施例中,胰岛素多肽中的一个或一个以上氨基酸取代可用一个或一 个以上天然存在的氨基酸进行,且另外,至少一个取代是用非天然编码氨基酸进行。在一些实施例中,非天然编码氨基酸包含羰基、乙酰基、氨氧基、胼基、酰胼基、氨 基脲基、叠氮基或炔基。在一些实施例中,非天然编码氨基酸包含羰基。在一些实施例中,非天然编码氨基 酸具有以下结构 其中η为0-10 ;Rl为烷基、芳基、经取代烷基或经取代芳基;R2为H、烷基、芳基、经 取代烷基和经取代芳基;且R3为H、氨基酸、多肽或氨基端修饰基团,且R4为H、氨基酸、多 肽或羧基端修饰基团。在一些实施例中,非天然编码氨基酸包含氨氧基。在一些实施例中,非天然编码氨 基酸包含酰胼基。在一些实施例中,非天然编码氨基酸包含胼基。在一些实施例中,非天然 编码氨基酸残基包含氨基脲基。在一些实施例中,非天然编码氨基酸残基包含叠氮基。在一些实施例中,非天然编 码氨基酸具有以下结构 其中η为0-10 ;Rl为烷基、芳基、经取代烷基、经取代芳基或不存在;X为0、N、S或 不存在;m为0-10 ;R2为H、氨基酸、多肽或氨基端修饰基团,且R3为H、氨基酸、多肽或羧基 端修饰基团。在一些实施例中,非天然编码氨基酸包含炔基。在一些实施例中,非天然编码氨基
酸具有以下结构 其中η为0-10 ;Rl为烷基、芳基、经取代烷基或经取代芳基;X为0、N、S或不存在; m为0-10,R2为H、氨基酸、多肽或氨基端修饰基团,且R3为H、氨基酸、多肽或羧基端修饰基团。在一些实施例中,多肽为胰岛素多肽激动剂、部分激动剂、拮抗剂、部分拮抗剂或 反向激动剂。在一些实施例中,所述胰岛素多肽激动剂、部分激动剂、拮抗剂、部分拮抗剂或 反向激动剂包含与水溶性聚合物连接的非天然编码氨基酸。在一些实施例中,所述水溶性 聚合物包含聚(乙二醇)部分。在一些实施例中,胰岛素多肽激动剂、部分激动剂、拮抗剂、 部分拮抗剂或反向激动剂包含非天然编码氨基酸和一个或一个以上翻译后修饰、连接子、 聚合物或生物活性分子。本发明还提供分离的核酸,其包含在严格条件下与编码SEQ ID NO :1、2、3、4、5、6、 7、8、9、10、11和12的胰岛素多肽的核酸杂交的多核苷酸。本发明还提供分离的核酸,其包 含在严格条件下与编码SEQ ID NO :1和2的胰岛素多肽的核酸杂交的多核苷酸。本发明还 提供分离的核酸,其包含在严格条件下与编码如SEQ ID N0:l、2、3、4、5、6、7、8、9、10、ll和 12所示的多肽的多核苷酸杂交的多核苷酸,其中所述多核苷酸包含至少一个选择密码子。 本发明还提供分离的核酸,其包含在严格条件下与编码如SEQ ID NO :1和2所示的多肽的 多核苷酸杂交的多核苷酸,其中所述多核苷酸包含至少一个选择密码子。本发明提供分离 的核酸,其包含编码如SEQ ID NO. :1和2所示的多肽的多核苷酸。本发明还提供分离的核 酸,其包含编码如SEQ ID NO. :1、2、3、4、5、6、7、8、9、10、11和12所示的多肽的多核苷酸。 本发明提供分离的核酸,其包含编码如SEQ IDN0. :1和2所示且具有一个或一个以上非天 然编码氨基酸的多肽的多核苷酸。本发明还提供分离的核酸,其包含编码如SEQ ID NO. :1、 2、3、4、5、6、7、8、9、10、11和12所示且具有一个或一个以上非天然编码氨基酸的多肽的多 核苷酸。对于所属领域的技术人员显而易见,许多不同多核苷酸可编码本发明的任何多肽。在一些实施例中,所述选择密码子是选自由琥珀密码子、赭石密码子、蛋白石密码 子、独特密码子、稀有密码子、五碱基密码子和四碱基密码子组成的群组。本发明还提供制备与水溶性聚合物连接的胰岛素多肽的方法。在一些实施例中, 所述方法包含使包含非天然编码氨基酸的分离的胰岛素多肽与包含与所述非天然编码氨 基酸反应的部分的水溶性聚合物接触。在一些实施例中,并入胰岛素多肽中的非天然编码 氨基酸对水溶性聚合物具有反应性,另外对20种常见氨基酸中的任一种不具有反应性。在 一些实施例中,并入胰岛素多肽中的非天然编码氨基酸对连接子、聚合物或生物活性分子 具有反应性,另外对20种常见氨基酸中的任一种不具有反应性。在一些实施例中,通过使包含含羰基氨基酸的胰岛素多肽与包含氨氧基、胼基、酰 胼基或氨基脲基的聚(乙二醇)分子反应来制备与水溶性聚合物连接的胰岛素多肽。在一 些实施例中,氨氧基、胼基、酰胼基或氨基脲基通过酰胺键与聚(乙二醇)分子连接。在一 些实施例中,氨氧基、胼基、酰胼基或氨基脲基通过氨基甲酸酯键与聚(乙二醇)分子连接。在一些实施例中,通过使包含羰基的聚(乙二醇)分子与包含含有氨氧基、胼基、 酰胼基或氨基脲基的非天然编码氨基酸的多肽反应来制备与水溶性聚合物连接的胰岛素 多肽。在一些实施例中,通过使包含含炔氨基酸的胰岛素多肽与包含叠氮基部分的聚 (乙二醇)分子反应来制备与水溶性聚合物连接的胰岛素多肽。在一些实施例中,叠氮基或炔基通过酰胺键与聚(乙二醇)分子连接。在一些实施例中,通过使包含含叠氮基氨基酸的胰岛素多肽与包含炔部分的聚 (乙二醇)分子反应来制备与水溶性聚合物连接的胰岛素多肽。在一些实施例中,叠氮基或 炔基通过酰胺键与聚(乙二醇)分子连接。在一些实施例中,聚(乙二醇)分子的分子量介于约0. IkDa与约IOOkDa之间。在 一些实施例中,聚(乙二醇)分子的分子量介于约0. IkDa与50kDa之间。在一些实施例中,聚(乙二醇)分子为分支聚合物。在一些实施例中,聚(乙二 醇)分支聚合物的每一分支的分子量介于IkDa与IOOkDa之间或介于IkDa与50kDa之间。在一些实施例中,与胰岛素多肽连接的水溶性聚合物包含聚烷二醇部分。在一些 实施例中,并入胰岛素多肽中的非天然编码氨基酸残基包含羰基、氨氧基、酰胼基、胼、氨基 脲基、叠氮基或炔基。在一些实施例中,并入胰岛素多肽中的非天然编码氨基酸残基包含羰 基部分且水溶性聚合物包含氨氧基、酰胼、胼或氨基脲部分。在一些实施例中,并入胰岛素 多肽中的非天然编码氨基酸残基包含炔部分且水溶性聚合物包含叠氮部分。在一些实施 例中,并入胰岛素多肽中的非天然编码氨基酸残基包含叠氮部分且水溶性聚合物包含炔部 分。本发明还提供包含含有非天然编码氨基酸的胰岛素多肽和医药学上可接受的载 剂的组合物。在一些实施例中,非天然编码氨基酸与水溶性聚合物连接。本发明还提供包含编码胰岛素多肽且包含选择密码子的多核苷酸的细胞。在一些 实施例中,所述细胞包含正交RNA合成酶和/或正交tRNA以将非天然编码氨基酸取代到胰 岛素多肽中。本发明还提供制备包含非天然编码氨基酸的胰岛素多肽的方法。在一些实施例 中,所述方法包含在允许胰岛素多肽表达的条件下培养包含编码胰岛素多肽的多核苷酸、 正交RNA合成酶和/或正交tRNA的细胞;和从所述细胞和/或培养基中纯化胰岛素多肽。本发明还提供增加胰岛素多肽的治疗半衰期、血清半衰期或循环时间的方法。本 发明还提供调节胰岛素多肽的免疫原性的方法。在一些实施例中,所述方法包含用非天然 编码氨基酸取代天然存在的胰岛素多肽中的任一个或一个以上氨基酸和/或将所述胰岛 素多肽与连接子、聚合物、水溶性聚合物或生物活性分子连接。本发明还提供用有效量的本发明的胰岛素分子治疗需要所述治疗的患者的方法。 在一些实施例中,所述方法包含向所述患者投与治疗有效量的医药组合物,所述组合物包 含含有非天然编码氨基酸的胰岛素多肽和医药学上可接受的载剂。在一些实施例中,非天 然编码氨基酸与水溶性聚合物连接。在一些实施例中,胰岛素多肽经糖基化。在一些实施 例中,胰岛素多肽未经糖基化。本发明还提供包含SEQ ID NO 1和2所示的序列或任何其它胰岛素多肽序列(这 些序列的非限制性实例为SEQ ID N0:3到12)的胰岛素多肽,除了至少一个氨基酸经非天 然编码氨基酸取代。在一些实施例中,非天然编码氨基酸与水溶性聚合物连接。在一些实 施例中,所述水溶性聚合物包含聚(乙二醇)部分。在一些实施例中,非天然编码氨基酸包
含羰基、氨氧基、酰胼基、胼基、氨基脲基、叠氮基或炔基。本发明还提供包含医药学上可接受的载剂和胰岛素多肽的医药组合物,所述胰岛 素多肽包含SEQ ID NO :1到12所示的序列或任何其它胰岛素多肽序列,其中至少一个氨基酸经非天然编码氨基酸取代。本发明还提供包含医药学上可接受的载剂和胰岛素多肽的医 药组合物,所述胰岛素多肽包含A链和B链(例如SEQID NO :1和2将产生胰岛素,SEQ ID NO 3和4将产生赖脯胰岛素等)SEQ ID NO 1到12所示的序列或任何其它胰岛素多肽序 列,其中至少一个氨基酸经非天然编码氨基酸取代。本发明还提供包含医药学上可接受的 载剂和胰岛素多肽的医药组合物,所述胰岛素多肽包含SEQ ID NO :1和2所示的序列。本 发明还提供包含医药学上可接受的载剂和胰岛素多肽的医药组合物,所述胰岛素多肽包含 SEQ IDNO :1到12所示的序列。在一些实施例中,非天然编码氨基酸包含糖部分。在一些 实施例中,水溶性聚合物通过糖部分与多肽连接。在一些实施例中,连接子、聚合物或生物 活性分子通过糖部分与胰岛素多肽连接。本发明还提供一种胰岛素多肽,其包含在单个氨基酸处通过共价键与所述胰岛素 多肽连接的水溶性聚合物。在一些实施例中,所述水溶性聚合物包含聚(乙二醇)部分。在 一些实施例中,与水溶性聚合物共价连接的氨基酸为多肽中所存在的非天然编码氨基酸。本发明提供一种胰岛素多肽,其包含至少一个连接子、聚合物或生物活性分子,其 中所述连接子、聚合物或生物活性分子通过以核糖体形式并入多肽中的非天然编码氨基酸 的官能团与多肽连接。在一些实施例中,多肽经单聚乙二醇化。本发明还提供一种胰岛素 多肽,其包含与一个或一个以上非天然编码氨基酸连接的连接子、聚合物或生物活性分子, 其中所述非天然编码氨基酸以核糖体形式并入多肽中的预选位点。胰岛素前导序列或信号序列包括在本发明的范围内,其实例可视为胰岛素原。所 选的异源前导序列或信号序列应为经识别和处理,例如由宿主细胞分泌系统分泌且可能通 过宿主细胞被信号肽酶裂解的序列。一种用本发明的胰岛素或胰岛素多肽或类似物治疗病 状或病症的方法打算隐含用含有或不含有信号肽或前导肽的胰岛素治疗。本发明还提供诱导葡萄糖代谢增加的方法,所述方法包含向所述细胞投与有效诱 导葡萄糖代谢活性增加的量的胰岛素。在另一实施例中,由于用于与非天然氨基酸结合的独特化学反应,包含一个或一 个以上非天然编码氨基酸的胰岛素多肽与另一分子(包括(但不限于)PEG)的结合提供实 质上纯化的胰岛素。可能在其它纯化技术在结合步骤之前或之后进行的情况下使包含一个 或一个以上非天然编码氨基酸的胰岛素与另一分子(诸如PEG)结合,以提供实质上纯的胰岛素。
图1展示胰岛素的晶体结构的两个模型以及胰岛素的氨基酸序列。图2为胰岛素的晶体结构的模型。展示所选经非天然编码氨基酸取代的位点。图3为一级胰岛素原的图式。图4展示胰岛素、优泌乐(humalog)、诺和乐(novolog)、甘精胰岛素和地特胰岛素 的图式。图5展示胰岛素原表达质粒pVK6-赖脯胰岛素以及赖脯胰岛素插入物的序列。图6展示对本发明的胰岛素多肽的十二烷基硫酸钠-聚丙烯酰胺凝胶电泳 (SDS-PAGE)凝胶分析,其包括在 Q15A 链(SEQ ID NO 3)、Y14A 链(SEQ IDNO 3)、R22B 链 (SEQ ID NO 4)、FlB 链(SEQ ID NO 4)、GlA 链(SEQ IDNO 3)、S9A 链(SEQ ID NO 3)和K28B链(SEQ ID NO 4)处经取代的那些多肽,每一取代各由非天然氨基酸(pAF)进行。图7展示聚乙二醇化和未聚乙二醇化的胰岛素多肽的尺寸排阻色谱-高效液相色 谱(SEC-HPLC)。图8展示用于克隆到毕赤酵母(Pichia)中的质粒的图。图9展示本发明的两种胰岛素多肽A14pAF-PEG-A21N和A14pAF_PEG_A21G的曲线 下面积(Area Under the Curve)柱状图。图10展示如实例36中进一步所论述,A21G胰岛素多肽的再折叠反应的结果的凝 胶。图11展示实例36的QHP纯化和再折叠的胰岛素原的HPLC。图12展示实例36中所述的聚乙二醇化反应的HPLC。
具体实施例方式定义应了解,本发明并不限于本文中所述的特定方法、方案、细胞系、构筑体和试剂,并 且同样可改变。也应了解,本文中使用的术语只是为了描述特定实施例,而并不打算限制本 发明的范围,所述范围应仅由随附权利要求加以限制。除非上下文另外明确指出,否则如本文和随附权利要求中所使用,单数形式“一” 和“所述”包括多个提及物。因此,举例来说,提及“胰岛素”或“胰岛素多肽”和各种带连字 符和不带连字符的形式是提及一种或一种以上所述蛋白质,并且包括所属领域的技术人员 已知的其等效物等。除非另外定义,否则本文中使用的所有科技术语都具有与本发明所属领域的技术 人员通常所了解的含义相同的含义。虽然可将与本文中所述类似或等效的任何方法、装置 和材料用于本发明的实践或测试中,但现仅对优选方法、装置和材料加以描述。本文中所提及的所有公开案和专利都是以引用的方式并入本文中,以达到描述和 揭示例如所述公开案中所述的可能与当前所述的发明结合使用的构筑体和方法的目的。本 文中所讨论的公开案仅提供本申请案的申请日期之前的揭示内容。本文决不应解释为承认 发明者无权由于先前发明或任何其它原因而使所述揭示案的日期提前。术语“实质上经纯化”是指可实质上或基本上不含通常伴随天然存在环境(即天 然细胞,或者在重组产生胰岛素多肽的情况下为宿主细胞)中存在的蛋白质或与天然存在 环境中存在的蛋白质相互作用的组分的胰岛素多肽。可实质上不含细胞物质的胰岛素多肽 包括具有小于约30 %、小于约25 %、小于约20 %、小于约15 %、小于约10 %、小于约5 %、小 于约4%、小于约3%、小于约2%或小于约(以干重计)的污染蛋白的蛋白制剂。当胰 岛素多肽或其变异体是由宿主细胞重组产生时,蛋白质可以细胞干重的约30%、约25%、 约20%、约15%、约10%、约5%、约4%、约3%、约2%或约或以下存在。当胰岛素 多肽或其变异体是由宿主细胞重组产生时,蛋白质可以细胞干重计约5g/L、约4g/L、约3g/ L、约 2g/L、约 lg/L、约 750mg/L、约 500mg/L、约 250mg/L、约 100mg/L、约 50mg/L、约 10mg/L 或 约lmg/L或lmg/L以下存在于培养基中。因此,由本发明方法产生的“实质上经纯化”的胰 岛素多肽可具有如通过适当方法(例如SDS/PAGE分析、反相高效液相色谱(RP-HPLC)、SEC 和毛细管电泳)所测定至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、
19至少约55%、至少约60%、至少约65%、至少约70%的纯度水平,特定来说至少约75%、 80%、85%的纯度水平,并且更特定来说至少约90%的纯度水平、至少约95%的纯度水平、 至少约99%或99%以上的纯度水平。“重组宿主细胞”或“宿主细胞”是指不管何种方法用于插入(例如直接摄取、转导、 f配对(f-mating)或所属领域中已知用于产生重组宿主细胞的其它方法),包括外源多核 苷酸的细胞。外源多核苷酸可保持非整合载体(例如质粒)形式,或者可整合到宿主基因 组中。如本文中所用,术语“培养基”包括可支撑或容纳任何宿主细胞的任何培养基、溶 液、固体、半固体或刚性支撑物,所述宿主细胞包括细菌宿主细胞、酵母宿主细胞、昆虫宿主 细胞、植物宿主细胞、真核宿主细胞、哺乳动物宿主细胞、中国仓鼠卵巢(CHO)细胞、原核宿 主细胞、大肠杆菌(E.coli)或假单胞菌(Pseudomonas)宿主细胞和细胞内含物。因此,所 述术语可涵盖已生长宿主细胞的培养基,例如已分泌胰岛素多肽的培养基,包括在增殖步 骤之前或之后的培养基。诸如在胰岛素多肽已在细胞内产生并且宿主细胞已溶解或破裂以 释放胰岛素多肽的情况下,所述术语也可涵盖含有宿主细胞溶解产物的缓冲液或试剂。如本文中关于蛋白质再折叠所用的“还原剂”是定义为使巯基保持还原状态并还 原分子内或分子间二硫键的任何化合物或物质。合适的还原剂包括(但不限于)二硫苏 糖醇(dithiothreitol ;DTT)、2_巯基乙醇、二硫赤藓糖醇、半胱氨酸、半胱胺(2-氨基乙硫 醇)以及还原型谷胱甘肽。所属领域的技术人员显而易见,多种还原剂适用于本发明的方 法和组合物中。如本文中关于蛋白质再折叠所用的“氧化剂”是定义为能够从所氧化的化合物移 除电子的任何化合物或物质。合适的氧化剂包括(但不限于)氧化型谷胱甘肽、胱氨酸、胱 胺、氧化型二硫苏糖醇、氧化型赤藓糖醇和氧气。所属领域的技术人员显而易见,多种氧化 剂适用于本发明的方法中。如本文中所用,“变性剂”是定义为会造成蛋白质可逆展开的任何化合物或物质。 变性剂的强度将由特定变性剂的性质和浓度决定。合适的变性剂可为离液剂(chaotrope)、 清洁剂、有机溶剂、水可混溶溶剂、磷脂或两种或两种以上所述试剂的组合。合适的离液剂 包括(但不限于)尿素、胍和硫氰酸钠。适用的清洁剂可包括(但不限于)强清洁剂,例 如十二烷基硫酸钠或聚氧乙烯醚(例如吐温(Tween)或曲拉通(Triton)清洁剂)、月桂 酰基肌氨酸钠(Sarkosyl);温和非离子型清洁剂(例如毛地黄皂苷(digitonin));温和阳 离子型清洁剂,例如N-> 2,3-( 二油烯基氧基)-丙基-N,N, N-三甲基铵;温和离子型清 洁剂(例如胆酸钠或脱氧胆酸钠);或两性离子型清洁剂,包括(但不限于)硫代甜菜碱 (Zwittergent)、3_(3_胆酰胺基丙基)二甲基氨基丙烷硫酸盐(CHAPS)以及3-(3-胆 酰胺基丙基)二甲基铵基-2-羟基-1-丙烷磺酸盐(CHAPSO)。可使用例如乙腈、低碳烷醇 (尤其C2-C4烷醇,例如乙醇或异丙醇)或低碳烷二醇(尤其C2-C4烷二醇,例如乙二醇) 等有机、水可混溶溶剂作为变性剂。适用于本发明中的磷脂可为天然存在磷脂,例如磷脂酰 乙醇胺、磷脂酰胆碱、磷脂酰丝氨酸和磷脂酰肌醇;或合成磷脂衍生物或变异体,例如二己 酰基磷脂酰胆碱或二庚酰基磷脂酰胆碱。如本文中所用,“再折叠”描述将含有二硫键的多肽从不当折叠或展开状态转化为 二硫键的天然或适当折叠的构象的任何过程、反应或方法。
如本文中所用,“共折叠”特定是指使用至少两种彼此相互作用的多肽并使得展开 或不当折叠的多肽转化为天然、适当折叠多肽的再折叠过程、反应或方法。如本文中所用,术语“胰岛素原”是下式的适当交联蛋白质(crossline protein) B-C-A其中A为胰岛素的A链或其官能衍生物;B为胰岛素的B链或其官能衍生物,其具有氨基;且C为胰岛素原的连接肽。优选地,胰岛素原为人类胰岛素的A链、人类胰岛素的B 链,且C为天然连接肽。当胰岛素原是天然序列时,胰岛素原具有三个游离氨基苯丙氨酸 (1)(α-氨基)、赖氨酸(29)(ε-氨基)和赖氨酸(64) ( ε -氨基)。如本文中所用,术语“胰岛素类似物”是展现胰岛素活性的下式的适当交联蛋白 质A-B其中A为胰岛素的A链或胰岛素A链的官能衍生物;且B为胰岛素的B链或胰岛素B链的官能衍生物,其具有ε -氨基,且A或B中的至 少一个含有来自天然序列的氨基酸修饰。在本说明书中,无论术语胰岛素以复数或普遍意义使用,都打算涵盖天然存在的 胰岛素与胰岛素类似物和其衍生物。如本文中所用,“胰岛素多肽”意思是具有类似于人类 胰岛素的分子结构的化合物,包括Cys. sup. A7与Cys. sup. B7之间和Cys. sup. A20与Cys. sup. B19之间的二硫桥键以及Cys. sup. A6与Cys. sup. All之间的内部二硫桥键,且其具有
胰岛素活性。如本文中所用,术语“胰岛素”是指人类胰岛素,其氨基酸序列和立体结构是众所 周知的。人类胰岛素由通过二硫键交联的21个氨基酸的A链和30个氨基酸的B链构成。 适当交联胰岛素含有三个二硫桥键一个位于A链的位置7与B链的位置7之间,第二个 位于A链的位置20与B链的位置19之间,且第三个位于A链的位置6与11之间[Nicol, D. S. H. W.和 Smith, L. F.,Nature, 187,483-485 (1960)]。胰岛素肽包括(但不限于)人类胰岛素;猪胰岛素;人类IGF-I ;胰岛素样生 长因子11(69-84);人类胰岛素原样生长因子11(68-102);人类胰岛素原样生长因子 11(105-128);人类[AspB28]_胰岛素;人类[LysB28]_胰岛素;人类[LeuB28]_胰岛素; 人类[ValB28]_胰岛素;人类[AlaB28]_胰岛素;人类[AspB28,ProB29]_胰岛素;人类 [LysB28,ProB29]-胰岛素;人类[LeuB28,ProB29]-胰岛素;人类[ValB28,ProB29]-胰岛 素;人类[AlaB28, ProB29]_胰岛素;人类[GlyA21]_胰岛素;人类[GlyA21 GlnB3]_胰岛 素;人类[AlaA21]_胰岛素;人类[AlaA21 Gin. sup. B3]胰岛素;人类[GlnB3]_胰岛素 ’人 类[GlnB30]_ 胰岛素;人类[GlyA21 GluB30]-胰岛素;人类[GlyA21 GlnB3 GluB30]_ 胰 岛素;人类[GlnB3 GluB30]_胰岛素;人类B22-B30胰岛素;人类B23-B30胰岛素;人类 B25-B30胰岛素;人类B26-B30胰岛素;人类B27-B30胰岛素;人类B29-B30胰岛素;人类胰 岛素的A链和人类胰岛素的B链。术语“胰岛素类似物”意思是如下蛋白质其A链和B链的氨基酸序列分别实质上与人类胰岛素的A链和/或B链的氨基酸序列相同,但与人类胰岛素的A链和B链不同的 是具有不破坏胰岛素类似物的胰岛素活性的一个或一个以上氨基酸缺失、一个或一个以上 氨基酸置换和/或一个或一个以上氨基酸添加。等电点“高于”胰岛素的等电点的胰岛素 类似物是一种类型的胰岛素类似物。另一种类型胰岛素类似物是“单体胰岛素类似物”。“单体胰岛素类似物”是人类胰岛素的速效类似物,其包括例如位置B28的Pro经 Asp,Lys,Leu,Val或Ala取代且位置B29的Lys为Lys或经Pro取代的人类胰岛素。另一 种也称为des (B27)人类胰岛素的单体胰岛素类似物是B链的位置27的Thr缺失的人类胰 岛素。单体胰岛素类似物揭示于以下文献中Chance,R.E.等人,美国专利第5,514,646号, 1996 年 5 月 7 日颁布;Brems,D. N.等人 Protein Engineering, 5, 527-533 (1992) ;Brange, J. J. V.等人,EPO公开案第214,826号(1987年3月18日公开);和Brange,J. J. V.等人, Current Opinion in StructuralBiology,1,934-940 (1991)。用于本发明调配物中的单体 胰岛素类似物在与人类胰岛素中相同的位置适当交联。胰岛素肽包括(但不限于)人类胰岛素;猪胰岛素;人类IGF-I ;胰岛素样生 长因子11(69-84);人类胰岛素原样生长因子11(68-102);人类胰岛素原样生长因子 11(105-128);人类[AspB28]_胰岛素;人类[LysB28]_胰岛素;人类[LeuB28]_胰岛素; 人类[ValB28]_胰岛素;人类[AlaB28]_胰岛素;人类[AspB28,ProB29]_胰岛素;人类 [LysB28,ProB29]-胰岛素;人类[LeuB28,ProB29]-胰岛素;人类[ValB28,ProB29]-胰岛 素;人类[AlaB28, ProB29]_胰岛素;人类[GlyA21]_胰岛素;人类[GlyA21 GlnB3]_胰岛 素;人类[AlaA21]_胰岛素;人类[AlaA21 Gin. sup. B3]胰岛素;人类[GlnB3]_胰岛素 ’人 类[GlnB30]_ 胰岛素;人类[GlyA21 GluB30]-胰岛素;人类[GlyA21 GlnB3 GluB30]_ 胰 岛素;人类[GlnB3 GluB30]_胰岛素;人类B22-B30胰岛素;人类B23-B30胰岛素;人类 B25-B30胰岛素;人类B26-B30胰岛素;人类B27-B30胰岛素;人类B29-B30胰岛素;人类胰 岛素的A链和人类胰岛素的B链。另一方面,本发明提供编码变异蛋白的重组核酸、含有变异核酸的表达载体、包含 变异核酸和/或表达载体的宿主细胞和产生变异蛋白的方法。另一方面,本发明通过向患 者投与治疗有效量的通常与医药载剂一起的变异蛋白治疗胰岛素反应性病症。另一方面, 本发明提供通过改变MHC II类表位调节胰岛素多肽的免疫原性(尤其降低免疫原性)的 方法。术语“胰岛素多肽”还包括天然存在胰岛素的医药学上可接受的盐和前药,以及盐 的前药、多形体、水合物、溶剂化物、生物活性片段、生物活性变异体和立体异构体,以及天 然存在胰岛素和其多肽融合体的激动剂、模拟物和拮抗剂变异体。术语“胰岛素多肽”涵盖 氨基端、羧基端或两个末端处包含其它氨基酸的融合体。示范性融合体包括(但不限于) 例如,由缺乏前导肽或信号肽的胰岛素的成熟形式或其部分重组表达所产生的使蛋氨酸与 胰岛素的N端连接的蛋氨酰基胰岛素(蛋氨酸与胰岛素的N端连接,由重组表达产生);出 于纯化目的而形成的融合体(包括(但不限于)与聚组氨酸或亲和性表位融合);与血清白 蛋白结合肽形成的融合体;和与血清蛋白(例如血清白蛋白)形成的融合体。美国专利第 5,750,373号(其以引用的方式并入本文中)描述一种选择新颖蛋白质(例如生长激素) 和对各别受体分子的结合性质已改变的抗体片段变异体的方法。所述方法包含将编码所关 注蛋白质的基因与丝状噬菌体M13的基因III外壳蛋白的羧基端域融合。嵌合分子包含胰岛素和一个或一个以上其它分子。嵌合分子可含有胰岛素与其它分子中一种或两种分子的 特定区或片段。可通过标准生物化学方法由蛋白质制备任何所述片段,或通过表达编码所 述片段的多核苷酸来制备所述片段。胰岛素或其片段可以包含人类血清白蛋白(HSA)、Fc 或其部分的融合蛋白形式产生。所述融合构筑体适于增强胰岛素或其片段在真核宿主细胞 中的表达。如美国专利第5,766,883号和公开案WO 97/24445 (其以引用的方式并入本文 中)中所揭示,示范性HSA部分包括N端多肽(氨基酸1-369、1-419,以及由氨基酸1开始 的中间长度)。其它嵌合多肽可包括具有与HSA的C端和N端各自连接的胰岛素或其片段 的HSA蛋白。所述HSA构筑体揭示于以引用的方式并入本文中的美国专利第5,876,969号 中。其它融合体可通过融合胰岛素与a)免疫球蛋白的Fc部分、b)免疫球蛋白的Fc部分 的类似物和c)免疫球蛋白的Fc部分的片段来产生。多个参考文献揭示通过聚合物结合或糖基化对多肽进行修饰。术语“胰岛素多肽” 包括与例如PEG等聚合物结合的多肽,并且可包含一种或一种以上由半胱氨酸、赖氨酸或 其它残基进行的其它衍生。另外,胰岛素多肽可包含连接子或聚合物,其中与连接子或聚合 物结合的氨基酸可为本发明的非天然氨基酸,或可利用所属领域中已知的技术(例如与赖 氨酸或半胱氨酸偶合)使所述氨基酸与天然编码氨基酸结合。术语“胰岛素多肽”也包括糖基化胰岛素,例如(但不限于)在任何氨基酸位置处 糖基化的多肽、多肽的N连接或0连接糖基化形式。含有单一核苷酸变化的变异体也被视 为胰岛素多肽的生物活性变异体。另外,也包括剪接变异体。术语“胰岛素多肽”也包括由 化学方式连接或以融合蛋白形式表达的任何一种或一种以上胰岛素多肽或任何其它多肽、 蛋白质、碳水化合物、聚合物、小分子、连接子、配体或任何类型的其它生物活性分子的胰岛 素多肽异源二聚物、同源二聚物、异源多聚物或同源多聚物,以及含有例如特定缺失或其它 修饰但仍保持生物活性的多肽类似物。术语“胰岛素多肽”或“胰岛素”涵盖包含一个或一个以上氨基酸取代、添加或缺失 的胰岛素多肽。本发明的胰岛素多肽可包含一个或一个以上天然氨基酸修饰以及一个或一 个以上非天然氨基酸修饰。已描述在天然存在胰岛素多肽中的多个氨基酸位置中的示范性 取代,其包括(但不限于)调节医药稳定性的取代、调节胰岛素多肽的一种或一种以上生物 活性(例如(但不限于)增加激动剂活性、增加多肽溶解性、降低蛋白酶敏感性、将多肽转 化成拮抗剂等)的取代,并且术语“胰岛素多肽”涵盖所述取代。在一些实施例中,胰岛素 拮抗剂包含与胰岛素分子的受体结合区中存在的水溶性聚合物连接的非天然编码氨基酸。在一些实施例中,胰岛素多肽进一步包含调节胰岛素多肽的生物活性的添加、取 代或缺失。在一些实施例中,胰岛素多肽进一步包含调节胰岛素多肽的抗病毒活性的添加、 取代或缺失。在一些实施例中,胰岛素多肽进一步包含增强胰岛素多肽的抗病毒活性的添 加、取代或缺失。举例来说,添加、取代或缺失可调节胰岛素的一种或一种以上性质或活性。 举例来说,添加、取代或缺失可调节对胰岛素受体的亲和性,调节循环半衰期,调节治疗半 衰期,调节多肽的稳定性,调节由蛋白酶进行的裂解,调节剂量,调节释放或生物可用性,促 进纯化,或改良或改变特定投药途径。类似地,胰岛素多肽可包含蛋白酶裂解序列、反应性 基团、抗体结合域(包括(但不限于)FLAG或poly-His)或其它基于亲和性的序列(包括 (但不限于)FLAG、poly-His、GST等)或改良多肽的检测(包括(但不限于)GFP)、纯化或 其它特性的连接分子(包括(但不限于)生物素)。
术语“胰岛素多肽”也涵盖所连接的同源二聚物、异源二聚物、同源多聚物和异源 多聚物,其包括(但不限于)通过非天然编码氨基酸侧链与相同或不同的非天然编码氨基 酸侧链、与天然编码氨基酸侧链直接连接或通过连接子间接连接者。示范性连接子包括 (但不限于)小的有机化合物、各种长度的水溶性聚合物(例如聚(乙二醇)或葡聚糖)或 各种长度的多肽。“非天然编码氨基酸”是指并非20种常见氨基酸或吡咯赖氨酸或硒代半胱氨酸中 的一种的氨基酸。可与术语“非天然编码氨基酸”同义使用的其它术语为“非天然氨基酸”、 “非天然存在氨基酸”。术语“非天然编码氨基酸”还包括(但不限于)通过修饰(例如翻 译后修饰)天然编码氨基酸(包括(但不限于)20种常见氨基酸或吡咯赖氨酸和硒代半胱 氨酸)而存在,但本身无法通过翻译复合物天然并入正在生长的多肽链中的氨基酸。这些 非天然存在氨基酸的实例包括(但不限于)N-乙酰基葡糖胺基-L-丝氨酸、N-乙酰基葡糖 胺基-L-苏氨酸以及0-磷酸酪氨酸。“氨基端修饰基”是指可与多肽的氨基端连接的任何分子。类似地,“羧基端修饰 基”是指可与多肽的羧基端连接的任何分子。末端修饰基包括(但不限于)各种水溶性聚 合物、肽或蛋白质(例如血清白蛋白),或增加肽的血清半衰期的其它部分。术语“官能团”、“活性部分”、“活化基团”、“离去基”、“反应性位点”、“化学反应性 基团”和“化学反应性部分”在所属领域和本文中是用于指代分子中独特的可限定部分或单 元。这些术语在化学领域中在一定程度上同义,并且在本文中是用于指示执行某种功能或 活性并可与其它分子反应的分子部分。术语“键”或“连接子”在本文中用于指通常由于化学反应而形成并且通常为共价 键的基团或键。水解稳定的键意思是所述键在水中实质上稳定并且在适用的PH值下(包 括(但不限于)在生理条件下)长时间(或许甚至无限期)不与水反应。水解不稳定或可 降解的键意思是所述键可在水或水溶液(包括例如血液)中降解。酶促不稳定或可降解的 键意思是所述键可由一种或一种以上酶降解。所属领域中应了解,PEG和相关聚合物在聚合 物主链中或在聚合物主链与聚合物分子的一个或一个以上末端官能团之间的连接基团中 可包括可降解键。举例来说,由PEG羧酸或活化PEG羧酸与生物活性剂上的醇基反应所形 成的酯键通常在生理条件下水解以释放所述生物活性剂。其它水解可降解的键包括(但不 限于)碳酸酯键;由胺与醛反应所产生的亚胺键;由醇与磷酸酯基反应所形成的磷酸酯键; 作为酰胼与醛的反应产物的腙键;作为醛与醇的反应产物的缩醛键;作为甲酸酯与醇的反 应产物的原酸酯键;由包括(但不限于)例如PEG等聚合物的末端的胺基与肽的羧基形成 的肽键;以及由包括(但不限于)聚合物末端的亚磷酰胺(phosphoramidite)基与寡核苷 酸的5'羟基形成的寡核苷酸键。术语“生物活性分子”、“生物活性部分”或“生物活性剂”在用于本文中时意思是可 影响与生物体(包括(但不限于)病毒、细菌、噬菌体、转位子、朊病毒、昆虫、真菌、植物、动 物以及人类)有关的生物系统、路径、分子或相互作用的任何物理或生物化学性质的任何 物质。具体来说,如本文中所用,生物活性分子包括(但不限于)打算用于诊断、治愈、缓解、 治疗或预防人类或其它动物的疾病或用于以其它方式增强人类或动物的身体或精神健康 状况的任何物质。生物活性分子的实例包括(但不限于)肽、蛋白质、酶、小分子药物、疫苗、 免疫原、硬药(hard drug)、软药(soft drug)、碳水化合物、无机原子或分子、染料、脂质、核
24苷、放射性核素、寡核苷酸、类毒素、毒素、原核和真核细胞、病毒、多糖、从病毒、细菌、昆虫、 动物或任何其它细胞或细胞类型、脂质体、微粒和微胞获得或得到的核酸和其部分。可将胰 岛素多肽加入微胞调配物中;参见美国专利第5,833,948号,其以全文引用的方式并入本 文中。适用于本发明的生物活性剂的种类包括(但不限于)药物、前药、放射性核素、显影 剂、聚合物、抗生素、杀真菌剂、抗病毒剂、消炎药、抗肿瘤药、心血管药、抗焦虑药、激素、生 长因子、类固醇药、微生物产生的毒素等等。“双官能聚合物”是指包含两个能够与其它部分(包括(但不限于)氨基酸侧 基)特异性反应以形成共价或非共价键的不连续官能团的聚合物。具有一个可与特定生 物活性组分上的基团反应的官能团和另一个可与第二生物组分上的基团反应的基团的双 官能连接子可用于形成包括第一生物活性组分、双官能连接子以及第二生物活性组分的结 合物。已知使各种化合物与肽连接的众多程序和连接分子。例如参见欧洲专利申请案第 188,256 号、美国专利第 4,671,958 号、第 4,659,839 号、第 4,414,148 号、第 4,699,784 号、 第4,680,338号和第4,569,789号,其是以引用的方式并入本文中。“多官能聚合物”是指 包含两个或两个以上能够与其它部分(包括(但不限于)氨基酸侧基)特异性反应以形成 共价或非共价键的不连续官能团的聚合物。双官能聚合物或多官能聚合物可具有任何所需 长度或分子量,并且可经选择以在与胰岛素连接的一个或一个以上分子与其受体或胰岛素 之间提供特定所需间隔或构象。当由从左向右书写的常规化学式表示取代基时,同样涵盖由从右向左书写的结构 得到的化学上相同的取代基,例如结构CH20等同于结构-0CH2。术语“取代基”包括(但不限于)“无干扰取代基”。“无干扰取代基”为产生稳定化合 物的基团。合适的无干扰取代基或基团包括(但不限于)卤基、Cl-ClO烷基、C2-C10烯基、 C2-C10炔基、Cl-ClO烷氧基、C1-C12芳烷基、C1-C12烷芳基、C3-C12环烷基、C3-C12环烯基、 苯基、经取代苯基、甲苯酰基、二甲苯基、联苯基、C2-C12烷氧基烷基、C2-C12烷氧基芳基、 C7-C12芳氧基烷基、C7-C12氧基芳基、C1-C6烷基亚磺酰基、Cl-ClO烷基磺酰基、—(CH2) m-0-(Cl-C10烷基)(其中m为1到8)、芳基、经取代芳基、经取代烷氧基、氟烷基、杂环 基、经取代杂环基、硝基烷基、—N02、--CN、-NRC (0) — (C 1 -C 10 烷基)、一C (0) — (C 1 -C 10 烷 基)、C2-C10 烧基硫烧基、—C (0) 0— (CI-C10 烷基)、一OH、一S02、= S、一C00H、一NR2、羰 基、—C (0) --(Cl-ClO 烷基)-CF3、—C (0) —CF3、—C (0) NR2、一 (C 1 -C 10 芳基)-S— (C6-C10 芳基)、一C (0) — (C 1 -C 10 芳基)、一(CH2) m—0— (― (CH2) m—0— (C 1 -C 10 烷基)(其中各 m 为 1 到 8)、—C (0) NR2、—C (S) NR2、—S02NR2、-NRC (0) NR2、-NRC (S) NR2、其盐等。如本文 中所用,各R为H、烷基或经取代烷基、芳基或经取代芳基、芳烷基或烷芳基。术语“卤素”包括氟、氯、碘和溴。除非另外说明,否则术语“烷基”本身或作为另一取代基的一部分时意思是直链或 支链或环状烃基或其组合,其可为完全饱和、单不饱和或多不饱和的并且可包括具有指定 碳原子数目(即Cl-ClO意思是1到10个碳)的二价基团和多价基团。饱和烃基的实例包 括(但不限于)以下基团,例如甲基、乙基、正丙基、异丙基、正丁基、叔丁基、异丁基、仲丁 基、环己基、(环己基)甲基、环丙基甲基;例如正戊基、正己基、正庚基、正辛基等的同系物 和异构体。不饱和烷基为具有一个或一个以上双键或三键的烷基。不饱和烷基的实例包括 (但不限于)乙烯基、2-丙烯基、巴豆基、2-异戊烯基、2-(丁二烯基)、2,4_戊二烯基、3-(1,4-戊二烯基)、乙炔基、1-丙炔基和3-丙炔基、3- 丁炔基以及高级同系物和异构体。除非另 外说明,否则术语“烷基”还打算包括下文更详细定义的烷基的衍生物,例如“杂烷基”。只 限于烃基的烷基被称作“同系烷基(homoalkyl) ”。术语“亚烷基”本身或作为另一取代基的一部分时意思是由烷烃衍生的二价基团, 例如(但不限于)结构-CH2CH2-和-CH2CH2CH2CH2-,并且进一步包括下文描述为“亚杂烷 基”的基团。通常,烷基(或亚烷基)将具有1到24个碳原子,其中具有10个或10个以下 碳原子的基团为本文中所述的方法和组合物的特定实施例。“低碳烷基”或“低碳亚烷基” 为通常具有8个或8个以下碳原子的较短链烷基或亚烷基。术语“烷氧基”、“烷基氨基”和“烷硫基”(或硫烷氧基)是以其常规意义使用,并 且是指分别通过氧原子、氨基或硫原子与分子的其余部分连接的烷基。除非另外说明,否则术语“杂烷基”本身或与另一术语组合时意思是由指定数 目的碳原子以及至少一个选自由0、N、Si和S组成的群组的杂原子组成的稳定直链或 支链或环状烃基或其组合,并且其中氮和硫原子可任选地经氧化且氮杂原子可任选地经 季铵化。杂原子0、N和S以及Si可位于杂烷基的任何内部位置或位于烷基与分子的 其余部分连接的位置。实例包括(但不限于)-CH2-CH2-0-CH3、-CH2-CH2-NH-CH3、-CH2 -CH2-N(CH3)-CH3、-CH2-S-CH2-CH3、-CH2-CH2、-S(0)_CH3、-CH2-CH2-S (0) 2-CH3、-CH = CH-0-CH3、-Si (CH3) 3、-CH2-CH = N-0CH3 和-CH = CH-N (CH3) -CH3。至多两个杂原子可相 邻,例如-CH2-NH-0CH3和-CH2-0_Si (CH3)3。类似地,术语“亚杂烷基”本身或作为另一取 代基的一部分时意思是由杂烷基衍生的二价基团,例如(但不限于)-CH2-CH2-S-CH2-CH2-和-CH2-S-CH2-CH2-NH-CH2-。对于亚杂烷基来说,相同或不同的杂原子也可占据链的一端或 两端(包括(但不限于)亚烷基氧基、亚烷基二氧基、亚烷基氨基、亚烷基二氨基、氨氧基亚 烷基等)。此外,对于亚烷基和亚杂烷基连接基团来说,连接基团的化学式所书写的方向并 不表示连接基团的定向。举例来说,式-C(O) 2R'-表示-C(0)2R'-与-R' C(0)2_。除非另外说明,否则术语“环烷基”和“杂环烷基”本身或与其它术语组合时分别 表示“烷基”和“杂烷基”的环状形式。因此,环烷基或杂环烷基包括饱和、部分不饱和和完 全不饱和的环键。另外,对于杂环烷基来说,杂原子可占据杂环与分子的其余部分连接的 位置。环烷基的实例包括(但不限于)环戊基、环己基、1-环己烯基、3-环己烯基、环庚基 等。杂环烷基的实例包括(但不限于)1-(1,2,5,6-四氢吡啶基)、1-哌啶基、2-哌啶基、 3-哌啶基、4-吗啉基、3-吗啉基、四氢呋喃-2-基、四氢呋喃-3-基、四氢噻吩-2-基、四氢 噻吩-3-基、1-哌嗪基、2-哌嗪基等。另外,所述术语涵盖双环和三环结构。类似地,术语 “亚杂环烷基”本身或作为另一取代基的一部分时意思是由杂环烷基衍生的二价基团,并且 术语“亚环烷基”本身或作为另一取代基的一部分时意思是由环烷基衍生的二价基团。如本文中所用,术语“水溶性聚合物”是指可溶于水性溶剂中的任何聚合物。水溶 性聚合物与胰岛素多肽的连接可产生以下改变,其包括(但不限于)相对于未经修饰形式 增加或经调节的血清半衰期或者增加或经调节的治疗半衰期、经调节的免疫原性、经调节 的物理缔合特性(例如聚集和多聚物形成)、改变的受体结合、改变的与一种或一种以上结 合搭配物的结合,以及改变的受体二聚或多聚。水溶性聚合物可能具有或可能不具有其本 身的生物活性,并且可用作连接胰岛素与其它物质(包括(但不限于)一种或一种以上胰 岛素多肽或一种或一种以上生物活性分子)的连接子。合适的聚合物包括(但不限于)聚乙二醇、聚乙二醇丙醛、其单Cl-ClO烷氧基或芳氧基衍生物(描述于美国专利第5,252,714 号中,所述专利是以引用的方式并入本文中)、单甲氧基-聚乙二醇、聚乙烯吡咯烷酮、聚乙 烯醇、聚氨基酸、二乙烯醚马来酸酐、N-(2_羟基丙基)_甲基丙烯酰胺、葡聚糖、葡聚糖衍生 物(包括硫酸葡聚糖)、聚丙二醇、聚氧化丙烯/氧化乙烯共聚物、聚氧乙烯化多元醇、肝素、 肝素片段、多糖、寡糖、聚糖、纤维素和纤维素衍生物(包括(但不限于)甲基纤维素和羧 甲基纤维素)、淀粉和淀粉衍生物、多肽、聚烷二醇和其衍生物、聚烷二醇和其衍生物的共聚 物、聚乙烯基乙醚以及a-β-聚[(2-羟乙基)-DL-天冬酰胺等,或其混合物。所述水溶性 聚合物的实例包括(但不限于)聚乙二醇和血清白蛋白。如本文中所用,术语“聚烷二醇”或“聚(烷二醇)”是指聚乙二醇(聚(乙二 醇))、聚丙二醇、聚丁二醇和其衍生物。术语“聚烷二醇”涵盖线性和分支聚合物且平均 分子量介于0. IkDa与IOOkDa之间。其它示范性实施例列于例如商业供应商目录中,例如 Shearwater Corporation 的目录"Polyethylene Glycol andDerivatives for Biomedical Applications" (2001)。除非另外说明,否则术语“芳基”意思是可为单环或稠合在一起或共价连接的多环 (包括(但不限于)1到3个环)的多不饱和芳香族烃取代基。术语“杂芳基”是指含有1到 4个选自N、0和S的杂原子的芳基(或环),其中氮和硫原子任选地经氧化,并且氮原子任 选地经季铵化。杂芳基可通过杂原子与分子的其余部分连接。芳基和杂芳基的非限制性实 例包括苯基、1-萘基、2-萘基、4-联苯基、1-吡咯基、2-吡咯基、3-吡咯基、3-吡唑基、2-咪 唑基、4-咪唑基、吡嗪基、2-噁唑基、4-噁唑基、2-苯基-4-噁唑基、5-噁唑基、3-异噁唑基、 4-异噁唑基、5-异噁唑基、2-噻唑基、4-噻唑基、5-噻唑基、2-呋喃基、3-呋喃基、2-噻吩 基、3-噻吩基、2-吡啶基、3-吡啶基、4-吡啶基、2-嘧啶基、4-嘧啶基、5-苯并噻唑基、嘌呤 基、2-苯并咪唑基、5-吲哚基、1-异喹啉基、5-异喹啉基、2-喹喔啉基、5-喹喔啉基、3-喹啉 基和6-喹啉基。上述芳基和杂芳基环系统中的每一个的取代基都选自下文所述的可接受 取代基的群组。为了简便起见,当与其它术语组合使用时(包括(但不限于)芳氧基、芳基硫氧 基、芳基烷基),术语“芳基”包括如上文所定义的芳基与杂芳基环。因此,术语“芳基烷基” 打算包括芳基与烷基连接的基团(包括(但不限于)苄基、苯乙基、吡啶基甲基等),所述 烷基包括碳原子(包括(但不限于)亚甲基)已经例如氧原子置换的烷基(包括(但不限 于)苯氧基甲基、2-吡啶基氧基甲基、3-(1_萘基氧基)丙基等)。以上术语(包括(但不限于)“烷基”、“杂烷基”、“芳基”以及“杂芳基”)各自打 算包括指定基团的经取代与未经取代形式。各类型基团的示范性取代基提供如下。烷基和杂烷基(包括通常被称作亚烷基、烯基、亚杂烷基、杂烯基、炔基、环烷基、 杂环烷基、环烯基以及杂环烯基的基团)的取代基可为选自(但不限于)以下的多种 基团中的一种或一种以上基团-0R'、=0、=NR'、=N-0R' , -NR' R〃、-SR'、-卤 素、-SiR ‘ R 〃 R 〃 ‘、OC(O)R ‘、-C(O)R ‘、-C02R ‘ , -CONR ‘ R “、-OC(O) NR' R"、-NR〃 C(O)R'、NR' -C(O)NR" R〃、-NR〃 C(0)2R'、-NR-C(NR' R〃 R〃 ‘)= NR" “ ,NRC(NR' R〃 ) = NR" ‘、-S(O)R'、-S(0)2R'、-S(0)2NR' R〃、NRS02R'、-CN 以 及-N02,其数目在0到(2m' +1)的范围内,其中m'为此类基团中碳原子的总数。R'、R"、 R"丨和R"“各独立地指代氢、经取代或未经取代杂烷基、经取代或未经取代芳基(其包括(但不限于)经1-3个卤素取代的芳基)、经取代或未经取代烷基、烷氧基或硫烷氧基或 芳基烷基。举例来说,当本发明的化合物包括一个以上R基团时,各R基团是独立地经选 择,而当存在R'、R〃、R〃 ‘和R〃 “基团中的一个以上时,这些基团同样是各独立地经选 择。当R'和R"与同一氮原子连接时,其可与氮原子组合形成5元、6元或7元环。举例来 说,-NR' R"打算包括(但不限于)1_吡咯烷基和4-吗啉基。根据对取代基的上述论述, 所属领域的技术人员应了解术语“烷基”打算包括包含与除氢基之外的基团结合的碳原子 的基团,例如卤烷基(包括(但不限于)_CF3和-CH2CF3)和酰基(包括(但不限于)-C(O) CH3、-C (0) CF3、-C (0) CH20CH3 等)。与对于烷基所述的取代基类似,芳基和杂芳基的取代基存在改变且选自(但不限 于)卤素、OR'、=0、=NR'、=N-0R' , -NR' R〃、-SR'、-卤素、-SiR' R〃 R〃 ‘、 OC (O)R ‘、-C (O)R ‘、-C02R ‘、-CONR ‘ R 〃、-OC (0) NR ‘ R 〃、-NR “ C(O)R ‘、 NR ‘ C (0) NR 〃 R 〃 ‘、-NR “ C (0) 2R ‘、NR-C (NR ‘ R 〃 R 〃 ‘ ) = NR 〃 ‘、NR C (NR ‘ R 〃)= NR 〃 ‘、-S (0) R ‘、-S (0) 2R ‘、-S (0) 2NR ‘ R 〃、NRS02R ‘、-CN 和-N02、-R'、-N3、-CH(Ph) 2、氟(C1-C4)烷氧基和氟(C1-C4)烷基,其数目在0到芳环系 统上开放价态的总数的范围内;并且其中R'、R〃、R〃 ‘和R〃 〃独立地选自氢、烷基、杂 烷基、芳基和杂芳基。举例来说,当本发明的化合物包括一个以上R基团时,各R基团是独 立地经选择,而当存在R'、R〃、R〃 ‘和R〃 ‘‘基团中的一个以上时,这些基团同样是各独 立地经选择。如本文中所用,术语“经调节的血清半衰期”意思是经修饰胰岛素的循环半衰期相 对于其未经修饰形式的正变化或负变化。通过在投与胰岛素后的各个时间点取血样并测定 每一样品中所述分子的浓度来测量血清半衰期。血清浓度与时间的相关性允许计算血清半 衰期。血清半衰期的增加理想地为至少约两倍,但例如当较小增加能够促成令人满意的给 药方案或避免毒性作用时,较小增加也可适用。在一些实施例中,所述增加为至少约3倍、 至少约5倍或至少约10倍。如本文中所用,术语“经调节的治疗半衰期”意思是治疗有效量的胰岛素的半衰期 相对于其未经修饰形式的正变化或负变化。通过在投与后的各个时间点测量分子的药物动 力学和/或药效性质来测量治疗半衰期。增加的治疗半衰期理想地能够促成特定有益的给 药方案、特定有益的总剂量或避免不需要的作用。在一些实施例中,增加的治疗半衰期是由 效力增加、经修饰分子与其标靶的结合增加或降低、酶(例如蛋白酶)对分子的分解增加或 降低或未经修饰分子的另一参数或作用机制增加或降低或者分子的受体介导清除增加或 降低引起。当应用于核酸或蛋白质时,术语“分离”表示所述核酸或蛋白质不含其在天然状态 下缔合的细胞组分中的至少一些组分,或所述核酸或蛋白质已浓缩到高于其活体内或活体 外产生浓度的程度。其可为均质状态。分离的物质可为干燥或半干燥状态,或为溶液(包 括(但不限于)水溶液)形式。其可为包含其它医药学上可接受的载剂和/或赋形剂的医 药组合物的组分。通常使用例如聚丙烯酰胺凝胶电泳或高效液相色谱等分析化学技术来测 定纯度和均质性。作为制剂中存在的主要物质的蛋白质实质上已经纯化。具体来说,分离 的基因是从侧接所述基因并编码除所关注基因之外的蛋白质的开放阅读框分离。术语“经 纯化”表示核酸或蛋白质在电泳凝胶中产生实质上一个条带。具体来说,其意思可能是核酸
28或蛋白质为至少85%纯、至少90%纯、至少95%纯、至少99%纯或更纯。术语“核酸”是指单链或双链形式的脱氧核糖核苷酸、脱氧核糖核苷、核糖核苷或 核糖核苷酸以及其聚合物。除非特定限制,否则所述术语涵盖含有天然核苷酸的已知类似 物的核酸,所述核酸具有与参考核酸相似的结合性质并且是以类似于天然存在核苷酸的方 式代谢。除非另外特定限制,否则所述术语也是指寡核苷酸类似物,其包括PNA (肽核酸)、 反义技术中使用的DNA类似物(硫代磷酸酯、氨基磷酸酯等)。除非另外说明,否则特定核 酸序列也隐含地涵盖其保守修饰变异体(包括(但不限于)简并密码子取代)和互补序列 以及明确指示的序列。具体来说,可通过产生一个或一个以上所选(或所有)密码子的第三 位置是经混合碱基和/或脱氧肌苷残基取代的序列来实现简并密码子取代(Batzer等人, Nucleic Acid Res. 19 :5081 (1991) ;Ohtsuka 等人,J. Biol. Chem. 260 2605-2608 (1985); Rossolini 等人,Mol. Cell. Probes 8 :91_98 (1994))。术语“多肽”、“肽”和“蛋白质”在本文中可互换使用来指代氨基酸残基的聚合物。 也就是说,针对多肽的描述同样适用于对肽的描述以及对蛋白质的描述,并且反之亦然。所 述术语适用于天然存在氨基酸聚合物以及一个或一个以上氨基酸残基为非天然编码氨基 酸的氨基酸聚合物。如本文中所用,所述术语涵盖任何长度的氨基酸链,包括全长蛋白质, 其中氨基酸残基是通过共价肽键连接。术语“氨基酸”是指天然存在和非天然存在氨基酸,以及以与天然存在氨基酸类似 的方式起作用的氨基酸类似物和氨基酸模拟物。天然编码氨基酸为20种常见氨基酸(丙 氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨 酸、亮氨酸、赖氨酸、蛋氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸) 以及吡咯赖氨酸和硒代半胱氨酸。氨基酸类似物是指具有与天然存在氨基酸相同的基本化 学结构(即与氢、羧基、氨基和R基团结合的α碳)的化合物,例如高丝氨酸、正亮氨酸、蛋 氨酸亚砜、蛋氨酸甲基锍。所述类似物具有经修饰R基团(例如正亮氨酸)或经修饰肽主 链,但仍保持与天然存在氨基酸相同的基本化学结构。对氨基酸的提及包括例如天然存在 的蛋白源性L-氨基酸、D-氨基酸;经化学修饰的氨基酸,例如氨基酸变异体和衍生物;天然 存在的非蛋白源性氨基酸,例如β-丙氨酸、鸟氨酸等;以及具有所属领域中已知为氨基酸 特征的性质的化学合成化合物。非天然存在氨基酸的实例包括(但不限于)α-甲基氨基 酸(例如α "甲基丙氨酸)、D_氨基酸、类组氨酸的氨基酸(例如2-氨基-组氨酸、β -羟 基_组氨酸、高组氨酸、α _氟甲基_组氨酸和α _甲基-组氨酸)、侧链中另外具有亚甲基 的氨基酸(“高”氨基酸),以及侧链中的羧酸官能团经磺酸基置换的氨基酸(例如半胱氨 酸)。在本发明蛋白质中并入非天然氨基酸,包括合成非天然氨基酸、经取代氨基酸或一个 或一个以上D-氨基酸宜以若干不同的方式进行。含D-氨基酸肽等与含L-氨基酸对应物 相比展现增加的活体外或活体内稳定性。因此,当期望或需要较高细胞内稳定性时,构筑并 入D-氨基酸的肽等可能尤其适用。更具体来说,D-肽等抗内源肽酶和蛋白酶,从而在期望 改进的分子生物可用性和延长的活体内寿命时,提供这些性质。另外,不能有效处理D-肽 等用于T辅助细胞的主要组织相容性复合体II类限制呈递,且因此不太可能在整个生物体 中引发体液免疫反应。在本文中,氨基酸可由其通常已知的三字母符号或由IUPAC-IUB生物化学命名委 员会(IUPAC-IUB Biochemical Nomenclature Commission)推荐的单字母符号来指代。同样,核苷酸可由其通常接受的单字母代码来指代。“保守性修饰变异体”适用于氨基酸与核酸序列。对于特定核酸序列来说,“保守性 修饰变异体”是指编码一致或基本上一致的氨基酸序列的核酸,或当核酸不编码氨基酸序 列时是指基本上一致的序列。由于遗传密码的简并性,大量功能相同的核酸编码任何给定 蛋白质。举例来说,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此,在丙氨酸由密 码子指定的每一位置处,密码子可改变为所述相应密码子中的任一个而不会改变所编码的 多肽。所述核酸变异为“沉默变异(silent variation)”,其为保守性修饰变异中的一种。 本文中编码多肽的每一核酸序列也描述核酸的每一种可能的沉默变异。所属领域的技术人 员应认识到,核酸中的各密码子(除AUG和TGG之外,AUG通常为蛋氨酸的独特密码子,而 TGG通常为色氨酸的独特密码子)都可经修饰以产生功能相同的分子。因此,编码多肽的核 酸的各沉默变异都隐含在各所述序列中。关于氨基酸序列,所属领域的技术人员应认识到,改变、添加或缺失所编码序列中 的单一氨基酸或少量氨基酸的对核酸、肽、多肽或蛋白质序列的个别取代、缺失或添加为 “保守性修饰变异体”,其中所述改变将导致氨基酸缺失、氨基酸添加或氨基酸经化学上类 似的氨基酸取代。所属领域的技术人员已知提供功能类似氨基酸的保守性取代表。所述保 守性修饰变异体除为多态变异体之外(并且不排除这些变异体),还为种间同源物和本发 明的等位基因。所属领域的技术人员已知提供功能类似胺基酸的保守性取代表。以下八组各自含 有彼此为保守性取代的氨基酸1)丙氨酸(A)、甘氨酸(G);2)天冬氨酸(D)、谷氨酸(E);3)天冬酰胺(N)、谷氨酰胺(Q);4)精氨酸(R)、赖氨酸(K);5)异亮氨酸(I)、亮氨酸(L)、蛋氨酸(M)、缬氨酸(V);6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);7)丝氨酸(S)、苏氨酸(T);和8)半胱氨酸(C)、蛋氨酸(M)(例如参见 Creighton, Proteins !Structures and Molecular Properties (W HFreeman&Co.;第 2 版(1993 年 12 月))。在两个或两个以上核酸或多肽序列的情形中,术语“一致”或“一致性”百分比是 指相同的两个或两个以上序列或子序列。当通过比较窗比较和比对最大对应性时,或如使 用下列序列比较算法(或所属领域的技术人员可用的其它算法)中的一种或通过手工比 对和目测检查来测量指定区时,如果序列具有相同(即,在指定区上具有约60%—致性,约 65 %、约70 %、约75 %、约80 %、约85 %、约90 %或约95 % 一致性)的氨基酸残基或核苷酸 百分比,那么所述序列为“实质上一致”的。此定义也是指测试序列的互补序列。一致性可 存在于长度为至少约50个氨基酸或核苷酸的区上,或长度为75-100个氨基酸或核苷酸的 区上,或(在未指定时)多核苷酸或多肽的整个序列上。可通过包含以下步骤的方法获得 编码本发明多肽的多核苷酸(包括来自非人类物种的同源物)在严格杂交条件下用具有 本发明的多核苷酸序列或其片段的经标记探针筛选文库,以及分离全长cDNA和含有所述多核苷酸序列的基因组克隆。所属领域的技术人员熟知所述杂交技术。对于序列比较来说,通常一个序列充当与测试序列相比较的参考序列。在使用序 列比较算法时,将测试序列与参考序列输入计算机中,必要时指定子序列坐标,并且指定序 列算法程序参数。可使用默认程序参数,或可指定替代参数。随后,序列比较算法根据程序 参数计算测试序列相对于参考序列的序列一致性百分比。如本文中所用,“比较窗”包括参考选自由20到600、通常约50到约200、更通常 约100到约150组成的群组的连续位置数中的任一者的区段,其中可在将序列与具有相同 数目的连续位置的参考序列最佳比对后对两个序列进行比较。所属领域的技术人员已知 用于比较的序列比对方法。可通过以下方法进行用于比较的最佳序列比对,所述方法包括 (但不限于)Smith 和 Waterman (1970) Adv. App 1. Math. 2 :482c 的局部同源算法;Needleman 和 Wunsch (1970) J. Mol. Biol. 48 443 的同源比对算法;搜索 Pearson 和 Lipman (1988) Proc. Nat' 1. Acad. Sci. USA 85 2444的相似方法;所述算法的计算机化实施(Wisconsin Genetics Software Package, Genetics Computer Group,575Science Dr. , Madison, WI 中的GAP、BESTFIT、FASTA和TFASTA);或手工比对和目测检查(例如参见Ausubel等人, CurrentProtocols in Molecular Biology (1995 年增干丨J ))。适用于测定序列一致性百分比和序列相似性百分比的算法的一个实例为BLAST 和 BLAST 2. 0 算法,其分别描述于 Altschul 等人,(1997) Nuc. Acids Res. 25 :3389_3402 和 Altschul等人,(1990) J. Mol. Biol. 215 :403_410中。用于进行BLAST分析的软件可通过经 由万维网在ncbi. nlm. nih. gov上访问的美国国家生物技术信息中心(National Centerfor Biotechnology Information)公开获得。BLAST算法参数W、T和X将决定比对的灵敏性和 速度。BLASTN程序(对于核苷酸序列来说)使用字长(W) 11、期望值(E)10、M = 5、N = -4 以及两条链的比较作为默认值。对于氨基酸序列来说,BLASTP程序使用字长3和期望值 (E) 10 以及 BL0SUM62 得分矩阵(参见 Henikoff 和 Henikoff (1992) Proc. Natl. Acad. Sci. USA 89 10915)比对数(B) 50、期望值(E) 10、M = 5、N = -4以及两条链的比较作为默认值。 通常在“低复杂性”过滤器关闭的情况下进行BLAST算法。BLAST算法也进行两个序列之间相似性的统计学分析(例如参见Kar 1 in和 Altschul (1993) Proc. Natl. Acad. Sci. USA 90 :5873_5787)。由 BLAST 算法提供的相似性的 一个量度为最小和概率(smallest sum probability,P(N)),其提供关于两个核苷酸或氨 基酸序列之间偶然会发生匹配的概率的指标。举例来说,如果在测试核酸与参考核酸的比 较中最小和概率小于约0. 2、或小于约0. 01,或小于约0. 001,那么认为所述核酸与参考序 列相似。短语“与...选择性(或特异性)杂交”是指当复杂混合物(包括(但不限于)总 细胞或文库DNA或RNA)中存在特定核苷酸序列时,在严格杂交条件下分子仅与所述序列结 合、双联或杂交。短语“严格杂交条件”是指在所属领域中已知的低离子强度和高温条件下DNA、 RNA.PNA或其它核酸模拟物或其组合的序列的杂交。通常,在严格条件下,探针会与其在核 酸的复杂混合物(包括(但不限于)总细胞或文库DNA或RNA)中的标靶子序列杂交,但 不与复杂混合物中的其它序列杂交。严格条件具有序列依赖性并且在不同环境下会不同。 较长序列在较高温度下特异性杂交。对核酸杂交的广泛指导可见于Tijssen,LaboratoryTechniques in Biochemistry andMoIecuIar Biology-Hybridization with Nucleic Probes, " Overview of principles ofhybridization and the strategy of nucleic acid assays" (1993)中。通常,选择严格条件为在规定离子强度、pH值下比特异性序列的 热力学熔点(Tm)低约5°C-10°C。Tm为与标靶互补的探针的50%与标靶序列杂交处于平 衡(因为标靶序列过量存在,在Tm下,在平衡时占据50%的探针)时的温度(在指定离子 强度、PH值以及核酸浓度下)。严格条件可为在pH值为7. 0到8. 3下盐浓度小于约1. OM 钠离子、通常约0. OlM到1. OM钠离子浓度(或其它盐)且温度对于短探针(包括(但不限 于)10到50个核苷酸)来说为至少约30°C且对于长探针(包括(但不限于)大于50个 核苷酸)来说为至少约60°C的条件。也可通过添加例如甲酰胺等去稳定剂来实现严格条 件。对于选择性或特异性杂交来说,阳性信号可为至少两倍背景、任选地10倍背景杂交。示 范性严格杂交条件可如下50%甲酰胺、5乂330和SDS,在42°C下培育;或5X SSC、1 % 305,在651下培育,其中在651下用0.2\33(和0. 1% SDS洗涤。所述洗涤可进行5、15、 30、60、120分钟或更长时间。如本文中所用,术语“真核生物”是指属于系统发育域(phylogenetic domain)真 核域(Eucarya)的生物体,例如动物(包括(但不限于)哺乳动物、昆虫、爬行动物、鸟类 等)、纤毛虫、植物(包括(但不限于)单子叶植物、双子叶植物、藻类等)、真菌、酵母、鞭毛 虫、微孢子虫、原生生物等。如本文中所用,术语“非真核生物”是指非真核生物体。举例来说,非真核生 物体可属于真细菌(Eubacteria)(包括(但不限于)大肠杆菌、嗜热栖热菌(Thermus thermophilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、荧光假单胞 菌(Pseudomonas f luorescens)、M 月农杆菌(Pseudomonas aeruginosa)、恶;Μ {[Μ 单 Ifi 菌(Pseudomonas putida)等)系统发育域,或古生菌(Archaea)(包括(但不限于) 詹氏甲烧球菌(Methanococcus jannaschii)、口耆热自养甲;^杆菌(Methanobacterium thermoautotrophicum)、嗜盐菌(Halobacterium)(例如沃氏嗜盐富饶菌(Haloferax volcanii)和嗜盐菌NRC-1)、超嗜热古菌(Archaeoglobusfulgidus)、强烈炽热球菌 (Pyrococcus furiosus)、极端嗜热古菌(Pyrococcushorikoshii)、嗜热泉生古细菌 (Aeuropyrum pernix)等)系统发育域。如本文中所用,术语“个体”是指动物,在一些实施例中为哺乳动物,并且在其它 实施例中为人类,其为治疗、观察或实验的对象。动物可为伴侣动物(例如狗、猫等)、家畜 (例如牛、羊、猪、马等)或实验动物(例如大鼠、小鼠、天竺鼠等)。如本文中所用,术语“有效量”是指所投与的经修饰非天然氨基酸多肽的量,所述 量会在一定程度上减轻所治疗的疾病、病状或病症的一种或一种以上症状。可投与含有本 文中所述的经修饰非天然氨基酸多肽的组合物来进行预防性、增强性和/或治疗性处理。术语“增强”意思是增加或延长所需作用的效力或持续时间。因此,对于增强治疗 剂的作用来说,术语“增强”是指增加或延长其它治疗剂对系统的作用的效力或持续时间的 能力。如本文中所用,“增强有效量”是指足以增强另一治疗剂在所需系统中的作用的量。 当用于患者中时,关于此用途有效的量将视以下因素而定疾病、病症或病状的严重性和病 程、先前疗法、患者的健康状况和对药物的反应以及主治医师的判断。如本文中所用,术语“经修饰”是指对给定多肽作出的任何改变,例如多肽长度、多肽的胺基酸序列、化学结构、共翻译修饰或翻译后修饰的改变。形式“(经修饰)”术语意思 是所讨论的多肽任选地经修饰,也就是说,所讨论的多肽可经修饰或未经修饰。术语“翻译后修饰”是指在天然或非天然氨基酸已并入多肽链中之后相对所述氨 基酸发生的任何修饰。仅举例来说,所述术语涵盖共翻译活体内修饰、共翻译活体外修饰 (例如在不含细胞的翻译系统中)、翻译后活体内修饰以及翻译后活体外修饰。在预防应用中,将含有胰岛素多肽的组合物投与易患特定疾病、病症或病状或者 处于患特定疾病、病症或病状的风险中的患者。所述量是定义为“预防有效量”。在这一用 途中,精确量也视患者的健康状况、体重等而定。认为通过常规实验(例如剂量递增临床试 验)确定所述预防有效量完全在所属领域的技能范围内。术语“经保护”是指存在防止化学反应性官能团在特定反应条件下发生反应的“保 护基”或部分。保护基将视所保护的化学反应性基团的类型而改变。举例来说,如果化学反 应性基团为胺或酰胼,那么保护基可选自叔丁氧羰基(t-Boc)和9-芴基甲氧基羰基(Fmoc) 的群组。如果化学反应性基团为硫醇,那么保护基可为邻吡啶基二硫化物。如果化学反应 性基团为羧酸(例如丁酸或丙酸)或羟基,那么保护基可为苄基或例如甲基、乙基或叔丁基 等烷基。所属领域中已知的其它保护基也可用于本文中所述的方法和组合物中或与所述方 法和组合物一起使用,其包括例如Nvoc和MeNvoc等光不稳定基团。所属领域中已知的其 它保护基也可用于本文中所述的方法和组合物中或与所述方法和组合物一起使用。仅举例来说,封端基/保护基可选自
炼丙基BnCbzallocMe
H3CJ
H2
Et
(H3C)3C 一
叔丁基
H3C. ,CH3
(H3C)3C …、 TBDMS
O
,Si:
Teoc
人
H2
(CH3)3C^0V"f|(C6H5)3C-
0H3COa^一
BocpMBn三苯甲基其它保护基描述于 Greene 禾口 Wuts, Protective Groups in Organic Synthesis, 第3版,John ffiley&Sons,New York,NY,1999中,其是以全文引用的方式并入本文中。在治疗应用中,将足以治愈或至少部分抑制疾病、病症或病状的症状的量的含有 经修饰非天然氨基酸多肽的组合物投与已罹患所述疾病、病状或病症的患者。所述量是定 义为“治疗有效量”,且将视以下因素而定疾病、病症或病状的严重性和病程、先前疗法、患 者的健康状况和对药物的反应以及主治医师的判断。认为通过常规实验(例如剂量递增临
O
H3C人
乙酰基
Fmor.床试验)确定所述治疗有效量完全在所属领域的技能范围内。术语“治疗”是用于指预防性和/或治疗性处理。本文中提出的非天然编码氨基酸多肽可包括一个或一个以上原子经原子质量或 质量数与自然界中通常可见的原子质量或质量数不同的原子置换的经同位素标记的化合 物。可并入本发明化合物中的同位素的实例包括氢、碳、氮、氧、氟和氯的同位素,分别为例 如2H、3H、13C、14C、15N、180、170、35S、18F、36C1。本文中所述的某些经同位素标记的化合 物(例如合并有例如3H和14C等放射性同位素的化合物)可用于药物和/或底物组织分 布测定中。此外,用例如氘(即2H)等同位素取代可提供由较高代谢稳定性产生的某些治 疗优点,例如增加的活体内半衰期或降低的剂量需求。所有异构体(包括(但不限于)非对映异构体、对映异构体和其混合物)都被视 为本文中所述组合物的一部分。在另外或其它的实施例中,非天然编码氨基酸多肽在向需 要产生代谢物的生物体投与之后代谢,所述代谢物随后用于产生所需作用(包括所需治疗 作用)。在其它或另外的实施例中,其为非天然编码氨基酸多肽的活性代谢物。在一些情况下,非天然编码氨基酸多肽可以互变异构体形式存在。另外,本文中所 述的非天然编码氨基酸多肽可以未溶剂化形式以及与医药学上可接受的溶剂(例如水、乙 醇等)形成的溶剂化形式存在。也认为本文中揭示所述溶剂化形式。所属领域的技术人员 应认识到,本文中的一些化合物可以若干互变异构形式存在。所有这种互变异构形式都被 视作本文中所述组合物的一部分。除非另外说明,否则使用所属领域的技能范围内的质谱、核磁共振(NMR)、HPLC、蛋 白质化学、生物化学、重组DNA技术以及药理学的常规方法。I.引言本发明提供包含至少一个非天然氨基酸的胰岛素多肽。在本发明的某些实施例 中,具有至少一个非天然氨基酸的胰岛素多肽包括至少一个翻译后修饰。在一实施例中, 所述至少一个翻译后修饰包含利用所属领域的技术人员已知适用于特定反应性基团的化 学方法,使包含第二反应性基团的分子与至少一个包含第一反应性基团的非天然氨基酸 连接,所述包含第二反应性基团的分子包括(但不限于)标记、染料、聚合物、水溶性聚合 物、聚乙二醇的衍生物、光交联剂、放射性核素、细胞毒性化合物、药物、亲和性标记、光亲和 性标记、反应性化合物、树脂、第二蛋白质或多肽或多肽类似物、抗体或抗体片段、金属螯合 剂、辅因子、脂肪酸、碳水化合物、多核苷酸、DNA、RNA、反义多核苷酸、糖类、水溶性树枝状聚 合物、环糊精、抑制性核糖核酸、生物材料、纳米粒子、自旋标记、荧光团、含金属的部分、放 射性部分、新颖官能团、与其它分子共价或非共价相互作用的基团、光笼化部分、光化辐射 可激发的部分、可光致异构化部分、生物素、生物素衍生物、生物素类似物、结合有重原子的 部分、可化学裂解的基团、可光裂解的基团、延长的侧链、碳连接的糖、氧化还原活性剂、氨 基硫代酸、毒性部分、经同位素标记的部分、生物物理探针、磷光基团、化学发光基团、电子 致密基团、磁性基团、插入基团、发色团、能量转移剂、生物活性剂、可检测标记、小分子、量 子点、纳米传递素、放射性核苷酸、放射性传递素、中子俘获剂或上述物质的任何组合,或任 何其它所需化合物或物质。举例来说,第一反应性基团为炔基部分(包括(但不限于)在 非天然氨基酸对炔丙基氧基苯丙氨酸中,其中炔丙基有时也被称作乙炔部分),并且第二反 应性基团为叠氮基部分,并利用[3+2]环加成化学方法。在另一实例中,第一反应性基团为叠氮基部分(包括(但不限于)在非天然氨基酸对叠氮基-L-苯丙氨酸中),并且第二反应 性基团为炔基部分。在本发明的经修饰胰岛素多肽的某些实施例中,使用至少一种包含至 少一个翻译后修饰的非天然氨基酸(包括(但不限于)含有酮基官能团的非天然氨基酸), 其中所述至少一个翻译后修饰包含糖部分。在某些实施例中,翻译后修饰是在真核细胞或 非真核细胞中活体内进行。连接子、聚合物、水溶性聚合物或其它分子可将所述分子与多肽 连接。分子可与多肽直接连接。在某些实施例中,蛋白质包括至少一个由一种宿主细胞在活体内进行的翻译后修 饰,其中所述翻译后修饰通常无法通过另一种宿主细胞类型进行。在某些实施例中,蛋白质 包括至少一个由真核细胞在活体内进行的翻译后修饰,其中所述翻译后修饰通常无法通过 非真核细胞进行。翻译后修饰的实例包括(但不限于)糖基化、乙酰化、酰化、脂质修饰、棕 榈酰化、棕榈酸盐加成(palmitate addition)、磷酸化、糖脂键修饰等。在一些实施例中,胰岛素多肽包含一个或一个以上用于多肽的糖基化、乙酰化、酰 化、脂质修饰、棕榈酰化、棕榈酸盐加成、磷酸化或糖脂键修饰的非天然编码氨基酸。在一些 实施例中,胰岛素多肽包含一个或一个以上用于多肽糖基化的非天然编码氨基酸。在一些 实施例中,胰岛素多肽包含一个或一个以上用于多肽的糖基化、乙酰化、酰化、脂质修饰、棕 榈酰化、棕榈酸盐加成、磷酸化或糖脂键修饰的天然编码氨基酸。在一些实施例中,胰岛素 多肽包含一个或一个以上用于多肽糖基化的天然编码氨基酸。在一些实施例中,胰岛素多肽包含一个或一个以上增强多肽的糖基化的非天然编 码氨基酸添加和/或取代。在一些实施例中,胰岛素多肽包含一个或一个以上增强多肽的 糖基化的缺失。在一些实施例中,胰岛素多肽包含一个或一个以上增强多肽中不同氨基酸 处的糖基化的非天然编码氨基酸添加和/或取代。在一些实施例中,胰岛素多肽包含一个 或一个以上增强多肽中不同氨基酸处的糖基化的缺失。在一些实施例中,胰岛素多肽包含 一个或一个以上增强多肽中非天然编码氨基酸处的糖基化的非天然编码氨基酸添加和/ 或取代。在一些实施例中,胰岛素多肽包含一个或一个以上增强多肽中天然编码氨基酸处 的糖基化的非天然编码氨基酸添加和/或取代。在一些实施例中,胰岛素多肽包含一个或 一个以上增强多肽中不同氨基酸处的糖基化的天然编码氨基酸添加和/或取代。在一些实 施例中,胰岛素多肽包含一个或一个以上增强多肽中天然编码氨基酸处的糖基化的非天然 编码氨基酸添加和/或取代。在一些实施例中,胰岛素多肽包含一个或一个以上增强多肽 中非天然编码氨基酸处的糖基化的非天然编码氨基酸添加和/或取代。在一个实施例中,翻译后修饰包含通过GlcNAc-天冬酰胺键使寡糖与天冬酰胺连 接(包括(但不限于)其中寡糖包含(GlcNAc-Man)2-Man-GlcNAc-GlcNAc等)。在另一实施 例中,翻译后修饰包含通过GalNAc-丝氨酸、GalNAc-苏氨酸、GlcNAc-丝氨酸或GlcNAc-苏 氨酸键使寡糖(包括(但不限于)Gal-GalNAc^Gal-GlcNAc等)与丝氨酸或苏氨酸连接。在 某些实施例中,本发明的蛋白质或多肽可包含分泌或定位序列、表位标签、FLAG标签、聚组 氨酸标签、GST融合体等。分泌信号序列的实例包括(但不限于)原核生物分泌信号序列、 真核生物分泌信号序列、为进行细菌表达而优化5'的真核生物分泌信号序列、新颖分泌信 号序列、果胶裂解酶分泌信号序列、Omp A分泌信号序列和噬菌体分泌信号序列。分泌信号 序列的实例包括(但不限于)STII (原核生物)、Fd GIII和M13 (噬菌体)、Bgl2 (酵母)和 源自转位子的信号序列bla。任何此类序列都可经修饰以使多肽具有所需结果,包括(但不
35限于)用不同信号序列取代一个信号序列,用不同前导序列取代一个前导序列等。所关注的蛋白质或多肽可含有至少一个、至少两个、至少三个、至少四个、至少五 个、至少六个、至少七个、至少八个、至少九个或十个或十个以上非天然氨基酸。所述非天然 氨基酸可相同或不同,例如在蛋白质中可存在1、2、3、4、5、6、7、8、9、10或10个以上不同位 点,其包含1、2、3、4、5、6、7、8、9、10或10个以上不同的非天然氨基酸。在某些实施例中,蛋 白质的天然存在形式中所存在的至少一个(但少于全部)特定氨基酸是经非天然氨基酸取 代。本发明提供基于包含至少一个非天然编码氨基酸的胰岛素的方法和组合物。将至 少一个非天然编码氨基酸引入胰岛素中可允许应用涉及特定化学反应(包括(但不限于) 与一个或一个以上非天然编码氨基酸反应而不与通常存在的20种氨基酸反应)的结合化 学。在一些实施例中,包含非天然编码氨基酸的胰岛素是通过非天然编码氨基酸的侧链与 水溶性聚合物(例如聚乙二醇(PEG))连接。本发明提供一种用PEG衍生物选择性修饰蛋白 质的高效方法,其涉及响应选择密码子将非遗传编码氨基酸(包括(但不限于)含有在20 种天然并入氨基酸中未发现的官能团或取代基(包括(但不限于)酮、叠氮或乙炔部分)的 氨基酸)选择性并入蛋白质中,并且随后用合适的反应性PEG衍生物修饰所述氨基酸。一 旦并入氨基酸侧链,就可通过利用所属领域的技术人员已知适用于非天然编码氨基酸中存 在的特定官能团或取代基的化学方法来修饰氨基酸侧链。多种已知的化学方法适用于在本 发明中将水溶性聚合物并入蛋白质中。所述方法包括(但不限于)分别与(包括(但不限 于))乙炔或叠氮化物衍生物进行休斯根[3+2]环加成反应(Huisgen[3+2]cycloaddition reaction)(例如参见 Padwa,A. Comprehensive Organic Synthesis,第 4 卷,(1991) Trost, B. Μ.编,Pergamon,Oxford,第 1069-1109 页;以及 Huisgen,R. 1,3-Dipolar Cycloaddition Chemistry, (1984)Padwa, A.编,Wiley,New York,第 1-176 页)。因为休斯根[3+2]环加成方法涉及环加成而非亲核取代反应,所以蛋白质可在极 高选择性下经修饰。通过向反应混合物中添加催化量的Cu(I)盐,可在室温下在水性条 件下以优良区域选择性(1,4 > 1,5)进行此反应。例如参见Tornoe等人,(2002) J. Org. Chem. 67 :3057_3064 ;和 Rostovtsev 等人,(2002) Angew. Chem. Int. Ed. 41 :2596_2599 ;以 及TO 03/101972。可通过[3+2]环加成而加成到本发明蛋白质上的分子包括具有合适的官 能团或取代基(包括(但不限于)叠氮基或乙炔衍生物)的几乎任何分子。这些分子可分 别加成到具有乙炔基的非天然氨基酸(包括(但不限于)对炔丙基氧基苯丙氨酸)或具有 叠氮基的非天然氨基酸(包括(但不限于)对叠氮基_苯丙氨酸)上。由休斯根[3+2]环加成得到的5元环在还原性环境中通常为不可逆的,并且在水 性环境中长时间对水解稳定。因此,可在苛刻水性条件下用本发明的活性PEG衍生物修饰 多种物质的物理和化学特征。甚至更重要的是,因为叠氮部分和乙炔部分彼此具有特异性 (并且例如不与20种常见的遗传编码氨基酸中的任一种反应),所以可在一个或一个以上 特异性位点中以极高的选择性修饰蛋白质。本发明还提供PEG衍生物的水溶性和水解稳定衍生物以及具有一个或一个以上 乙炔或叠氮部分的相关亲水性聚合物。含有乙炔部分的PEG聚合物衍生物以极高选择性 与已响应选择密码子而选择性地引入蛋白质中的叠氮部分偶合。类似地,含有叠氮部分的 PEG聚合物衍生物以极高选择性与已响应选择密码子而选择性地引入蛋白质中的乙炔部分偶A俩口。更具体来说,叠氮部分包含(但不限于)烷基叠氮化物、芳基叠氮化物和这些叠氮 化物的衍生物。烷基和芳基叠氮化物的衍生物可包括其它取代基,只要保持乙炔特异性反 应性即可。乙炔部分包含烷基和芳基乙炔和各自的衍生物。烷基和芳基乙炔的衍生物可包 括其它取代基,只要保持叠氮化物特异性反应性即可。本发明提供具有多种官能团、取代基或部分的物质与其它物质的结合物,所述其 它物质包括(但不限于)标记;染料;聚合物;水溶性聚合物;聚乙二醇的衍生物;光交联 剂;放射性核素;细胞毒性化合物;药物;亲和性标记;光亲和性标记;反应性化合物;树 脂;第二蛋白质或多肽或多肽类似物;抗体或抗体片段;金属螯合剂;辅因子;脂肪酸;碳 水化合物;多核苷酸;DNA ;RNA ;反义多核苷酸;糖类;水溶性树枝状聚合物;环糊精;抑制 性核糖核酸;生物材料;纳米粒子;自旋标记;荧光团;含金属的部分;放射性部分;新颖官 能团;与其它分子共价或非共价相互作用的基团;光笼化部分;光化辐射可激发的部分;可 光致异构化部分;生物素;生物素衍生物;生物素类似物;结合有重原子的部分;可化学裂 解的基团;可光裂解的基团;延长的侧链;碳连接的糖;氧化还原活性剂;氨基硫代酸;毒 性部分;经同位素标记的部分;生物物理探针;磷光基团;化学发光基团;电子致密基团; 磁性基团;插入基团;发色团;能量转移剂;生物活性剂;可检测标记;小分子;量子点;纳 米传递素;放射性核苷酸;放射性传递素;中子俘获剂;或上述物质的任何组合,或任何其 它所需化合物或物质。本发明还包括具有叠氮或乙炔部分的物质与具有相应乙炔或叠氮部 分的PEG聚合物衍生物的结合物。举例来说,含有叠氮部分的PEG聚合物可在蛋白质中含 有带有乙炔官能团的非遗传编码氨基酸的位置处与生物活性分子偶合。使PEG与生物活性 分子偶合的键包括(但不限于)休斯根[3+2]环加成产物。所属领域中已明确确立,PEG可用于修饰生物材料的表面(例如参见美国专利 6,610,281 ;Mehvar, R.,J. Pharm Pharm Sci.,3(1) :125_136 (2000),其是以引用的方式并 入本文中)。本发明还包括包含具有一个或一个以上反应性叠氮基或乙炔位点的表面的生 物材料,和通过休斯根[3+2]环加成键与所述表面偶合的一种或一种以上本发明的含叠氮 基或乙炔的聚合物。生物材料和其它物质也可通过除叠氮基或乙炔键以外的其它键(例如 通过包含羧酸、胺、醇或硫醇部分的键)与由叠氮化物或乙炔活化的聚合物衍生物偶合以 留下叠氮或乙炔部分用于后续反应。本发明包括一种合成本发明的含叠氮基聚合物和含乙炔聚合物的方法。在含叠氮 基的PEG衍生物的情况下,可使叠氮化物与聚合物的碳原子直接键结。或者,可通过将一端 具有叠氮部分的连接剂与常规活化聚合物连接来制备含叠氮基的PEG衍生物,使得所得聚 合物在其末端具有叠氮部分。在含乙炔的PEG衍生物的情况下,可使乙炔与聚合物的碳原 子直接键结。或者,可通过将一端具有乙炔部分的连接剂与常规活化聚合物连接来制备含 乙炔的PEG衍生物,使得所得聚合物在其末端具有乙炔部分。更具体来说,在含叠氮基的PEG衍生物的情况下,具有至少一个活性羟基部分的 水溶性聚合物进行反应以产生具有反应性更强的部分(例如甲磺酸根、三氟乙磺酸根、甲 苯磺酸根或卤素离去基)的经取代聚合物。所属领域的技术人员已知含有磺酰卤、卤素原 子以及其它离去基的PEG衍生物的制备和使用。所得经取代的聚合物随后进行反应以在聚 合物的末端用叠氮部分取代反应性更强的部分。或者,具有至少一个活性亲核或亲电子部分的水溶性聚合物与一端具有叠氮基的连接剂发生反应,使得在PEG聚合物与连接剂之间 形成共价键,并且叠氮部分位于聚合物的末端。所属领域的技术人员已知亲核和亲电子部 分,其包括胺、硫醇、酰胼、胼、醇、羧酸酯、醛、酮、硫酯等。更具体来说,在含乙炔的PEG衍生物的情况下,具有至少一个活性羟基部分的水 溶性聚合物进行反应以从含有乙炔部分的前体置换卤素或其它经活化的离去基。或者,具 有至少一个活性亲核或亲电子部分的水溶性聚合物与一端具有乙炔的连接剂发生反应,使 得在PEG聚合物与连接剂之间形成共价键,并且乙炔部分位于聚合物的末端。所属领域的 技术人员充分确定卤素部分、经活化的离去基、亲核和亲电子部分在有机合成情形中的使 用以及PEG衍生物的制备和使用。本发明还提供一种选择性修饰蛋白质以将其它物质添加到经修饰蛋白质上的方 法,所述其它物质包括(但不限于)水溶性聚合物,例如PEG和含有叠氮或乙炔部分的PEG 衍生物。含叠氮基和含乙炔的PEG衍生物可用于改变表面和分子的性质(其中生物相容性、 稳定性、溶解性和缺乏免疫原性较为重要),并同时提供一种比所属领域中先前已知的选择 性更强的使PEG衍生物与蛋白质连接的方法。本发明中使用的一般重组核酸方法在本发明的众多实施例中,将使用重组方法分离、克隆并通常改变编码所关注的 胰岛素多肽的核酸。所述实施例是用于(包括(但不限于))蛋白质表达或用于源自胰岛 素多肽的变异体、衍生物、表达盒或其它序列的产生期间。在一些实施例中,编码本发明多 肽的序列是可操作地连接到异源启动子上。可以母体多肽的氨基酸序列(包括(但不限于)具有SEQ ID NO :1和SEQ IDNO 2所示的氨基酸序列)为基础来合成编码包含非天然编码氨基酸的胰岛素多肽的核苷酸序 列,并且随后改变所述核苷酸序列以引入(即并入或取代)或移除(即缺失或取代)相关 氨基酸残基。宜根据常规方法通过定点诱变来修饰核苷酸序列。或者,可由化学合成来制 备核苷酸序列,包括(但不限于)通过使用寡核苷酸合成器并且优先选择将产生重组多肽 的宿主细胞中所偏好的密码子来制备核苷酸序列,其中寡核苷酸是根据所需多肽的氨基酸 序列进行设计。本发明利用重组遗传学领域中的常规技术。揭示本发明中使用的一般方法的基 础文章包括 Sambrook 等人,Molecular Cloning, A Laboratory Manual (第 3 版,2001); Kriegler, Gene Transfer and Expression :A Laboratory Manual (1990);以及 Current Protocols in Molecular Biology (Ausubel 等人编,1994)。描述分子生物技术的一般文章包括Berger和Kimmel,Guide to MolecularCloning Techniques, Methods in Enzymology,第 152 卷,Academic Press, Inc. , SanDiego, CA(Berger) ;Sambrook 等 人,Molecular Cloning-Α Laboratory Manual (第 2 版),第 1-3 卷,Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 1989 (" Sambrook")以及Current Protocols in Molecular Biology, F. M. Ausubel 等人编,Current Protocols, Greene Publishing Associates, Inc.与 John Wiley&Sons, Inc.的合资企业,(1999年全年增补)(〃 Ausubel “)。这些文章描述诱变、载体和启动子 的使用以及许多其它相关主题,所述相关主题涉及(包括(但不限于))包括用于制备包括 非天然氨基酸、正交tRNA、正交合成酶以及其对的蛋白质的选择密码子的基因或多核苷酸
38的产生。本发明出于多种目的使用各种类型的诱变,所述目的包括(但不限于)产生新颖 合成酶或tRNA、使tRNA分子突变、使编码合成酶的多核苷酸突变、产生tRNA文库、产生合成 酶文库、产生选择密码子、在所关注的蛋白质或多肽中插入编码非天然氨基酸的选择密码 子。所述诱变包括(但不限于)定点诱变、随机点诱变、同源重组、DNA改组或其它递归诱变 方法、嵌合构建、使用含有尿嘧啶的模板的诱变、寡核苷酸定向诱变、硫代磷酸酯修饰的DNA 诱变、使用带缺口的双螺旋DNA的诱变等、PCT介导的诱变,或其任何组合。其它合适的方 法包括点错配修复、使用修复缺陷型宿主菌株的诱变、限制选择和限制纯化、缺失诱变、通 过总基因合成进行的诱变、双链断裂修复等。(包括(但不限于))涉及嵌合构筑体的诱变 也包括在本发明中。在一实施例中,可由天然存在分子或已改变或突变的天然存在分子的 已知信息(包括(但不限于)序列、序列比较、物理性质、二级、三级或四级结构、晶体结构 等)来指导诱变。本文中可见的文章和实例描述这些程序。其它信息可见于以下公开案和其 中弓I 用的参考文献中:Ling 等人,Approaches to DNA mutagenesis :an overview, AnalBiochem.254 (2) 157-178 (1997) ;Dale 等人,01igonucIeotide-directed randommutagenesis using the phosphorothioate method, Methods Mol.Biol.57 369-374(1996) ;Smith, In vitro mutagenesis, Ann. Rev. Genet. 19 423-462 (1985); Botstein 禾口 Shortle, Strategies and applications of in vitro mutagenesis, Science 229 :1193_1201 (1985) ;Carter,Site-directed mutagenesis,Biochem. J. 237 1-7 (1986) ;Kunkel,Theefficiency of oligonucleotide directed mutagenesis, Nucleic Acids&MolecularBiology (Eckstein, F.禾口 Lilley,D. M. J 编,Springer Verlag, Berlin) (1987) ;Kunkel, Rapid and efficient site-specific mutagenesis-without phenotypic selection, Proc. Natl. Acad. Sci. USA 82:488-492(1985) ;Kunkel 等入, Rapid and efficient site—specificmutagenesis without phenotypic selection, Methods in Enzymol. 154,367-382 (1987) ;Bass 等 人,Mutant Trp repressors with new DNA—binding specificities, Science 242 :240_245(1988) ;Zoller 禾口 Smith, 01igonucleotide—directed mutagenesisusing M13_derived vectors an efficient and general procedure for the production ofpoint mutations in any DNA fragment,Nucleic Acids Res. 10 6487-6500(1982) ;Zoller 禾口 Smith, 01igonucleotide-directed mutagenesis of DNA fragments cloned intoM13 vectors, Methods in Enzymol. 100 468-500(1983) ;Zoller 和 Smith,Oligonucleotide-directed mutagenesis :a simple method using two oligonucleotideprimers and a single-stranded DNA template,Methods in Enzymol. 154 329-350(1987) ;Taylor 等 人,The use of phosphorothioate-modified DNA in restriction enzymereactions to prepare nicked DNA, Nucl. Acids Res. 13 8749-8764(1985) ;Taylor 等 A, The rapid generation of oligonucleotide-directed mutations at high frequency usingphosphorothioate-modif ied DNA, Nucl. Acids Res. 13 :8765_8785 (1985); Nakamaye 禾口 Eckstein, Inhibition of restriction endonuclease Nci I cleavage by phosphorothioategroups and its application to oligonucleotide-directed
39mutagenesis,Nucl. Acids Res. 14:9679-9698(1986) ;Sayers 等人,5' Exonucleases in phosphorothioate-basedo1igonucIeotide-directed mutagenesis,Nuc1. Acids Res. 16 791-802 (1988) ;Sayers 等 人,Strand specific cleavage of phosphor othioate—containing DNA by reaction withrestriction endonucleases in the presence ofethidium bromide,(1988) Nucl. Acids Res. 16 :803_814 ;Kramer 等人,The gapped duplex DNA approach tooligonucIeotide-directed mutation construction, Nucl. Acids Res. 12 9441-9456 (1984) ;Kramer 禾口 Fritz Oligonucleotide—directed construction of mutations via gappedduplex DNA, Methods in Enzymol. 154 350-367 (1987) ;Kramer 等人,Improvedenzymatic in vitro reactions in the gapped duplex DNA approach tooligonucIeotide—directed construction of mutations, Nucl. Acids Res. 16:7207(1988) ;Fritz 等人,01 igonucleotide-directed construction of mutations :a gapped duplex DNAprocedure without enzymatic reactions in vitro, Nucl. Acids Res. 16 6987-6999(1988) ;Kramer 等人,Different base/base mismatches are corrected with differentefficiencies by the methyl-directed DNA mismatch-repair system of E.coli,Cell38 :879_887 (1984) ;Carter 等人,Improved oligonucleotide site-directed mutagenesisusing M13 vectors, Nucl. Acids Res. 13 4431-4443 (1985) ;Carter,ImprovedoligonucIeotide-directed mutagenesis using M13 vectors, Methods in Enzymol. 154 382-403(1987) ;Eghtedarzadeh 禾口 Henikoff, Use of oligonucleotides to generate largedeletions,Nucl.Acids Res. 14 5115(1986) ;Wells 等人,Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin,Phil. Trans. R. Soc. Lond. A 317 :415_423 (1986); Nambiar ^A Total synthesis and cloning of agene coding for the ribonuclease S protein,Science 223 1299-1301(1984) ;Sakamar 禾口 Khorana,Total synthesis and expression of a gene for the alpha-subunit of bovinerod outer segment guanine nucleotide-binding protein (transducin),Nucl. Acids Res. 14 :6361_6372 (1988); Wells 等 人,Cassette mutagenesis :an efficient method forgeneration of multiple mutations at detined sites,Gene 34:315-323 (1985) ;Grundstrom 等 人,Oligonucleotide-directed mutagenesis by microscale ' shot-gun ' genesynt hesis,Nucl. Acids Res. 13 :3305_3316 (1985) ;Mandecki, Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli :amethod for site-specific mutagenesis,Proc. Natl. Acad.Sci. USA,83 :7177-7181 (1986) ;Arnold, Protein engineering for unusual environments, Current Opinion inBiotechnology 4 450-455 (1993) ;Sieber 等 Nature Biotechnology,19 456-460 (2001); W. P. C. StemmeriNature 370,389-91(1994);以及 I. A. Lorimer,I. Pastan,Nucleic Acids Res. 23, 3067-8 (1995) ο关于众多上述方法的其它细节可见于Methods in Enzymology第 154卷中,所述文献也描述对于各种诱变方法带来的故障查找问题的有效控制。
通常根据由 Beaucage 禾口 Caruthers,Tetrahedron Letts. 22(20) 1859-1862, (1981)所描述的固相亚磷酰胺三酯法,例如使用如Needham-VmDevmter等人, Nucleicacids Res.,12 :6159_6168 (1984)中所述的自动合成器以化学方式合成例如用于本发明的诱变(例如使合成酶文库突变或改变tRNA)中的寡核苷酸。本发明也涉及通过正交tRNA/RS对在活体内并入非天然氨基酸的真核宿主细胞、 非真核宿主细胞和生物体。用本发明的多核苷酸或包括本发明多核苷酸的构筑体(包括 (但不限于)本发明的载体,其可为例如克隆载体或表达载体)以遗传学方式工程改造(包 括(但不限于)转化、转导或转染)宿主细胞。举例来说,正交tRNA、正交tRNA合成酶和 欲衍生的蛋白质的编码区可操作地连接到在所需宿主细胞中起作用的基因表达控制元件 上。载体可为例如质粒、粘粒(cosmid)、噬菌体、细菌、病毒、裸多核苷酸或结合多核苷酸的 形式。通过标准方法将载体引入细胞和/或微生物中,所述方法包括电穿孔(Fromm等人, Proc. Natl. Acad. Sci. USA 82,5824 (1985))、通过病毒载体感染、在小珠粒或粒子基质内或 在表面上由具有核酸的小粒子高速弹道渗透(Klein等人,Nature 327,70-73 (1987))等。 适合活体外将核酸转移到细胞中的技术包括使用脂质体、显微注射、细胞融合、DEAE-葡聚 糖、磷酸钙沉淀法等。活体内基因转移技术包括(但不限于)用病毒(通常逆转录病毒) 载体转染和病毒外壳蛋白-脂质体介导的转染[Dzau等人,Trends in Biotechnology 11: 205-210(1993)]。在一些情形下,可能期望给核酸源提供例如对细胞表面膜蛋白或靶细胞 具有特异性的抗体、靶细胞上的受体的配体等靶向靶细胞的因子。当使用脂质体时,可使用 结合与胞吞作用相关的细胞表面膜蛋白的蛋白质来靶向和/或促进摄取例如衣壳蛋白或 其对特定细胞类型具有向性的片段、在循环中经历内化的蛋白质的抗体、靶向细胞内定位 和增加细胞内半衰期的蛋白质。可在经改良适于例如筛选步骤、活化启动子或选择转化株等活动的常规营养培 养基中培养工程改造过的宿主细胞。这些细胞可任选地经培养并进入转基因生物体中。 (包括(但不限于))关于细胞分离和培养(例如关于后续核酸分离)的其它有用参考 文献包括 Freshney (1994)Culture ofAnimal Cells,a Manual of BasicTechnique,第 3版,Wiley-Liss,New York以及其中引用的参考文献;Payne等人,(1992)Plmt Cell and Tissue Culture in Liquid Systems John Wiley&Sons, Inc. NewYork, NY ;Gamborg 禾口 Phillips (编)(1995)Plant Cell,Tissue and Organ Culture ;Fundamental Methods Springer Lab Manual,Springer-Verlag(Berlin Heidelberg NewYork)以及 Atlas 禾口 Parks (编)The Handbook of Microbiological Media (1993) CRCPress,Boca Raton,FL0可使用将标靶核酸引入细胞中的数种熟知方法,其中任一种方法都可用于本 发明中。这些方法包括受体细胞与含有DNA的细菌原生质体融合、电穿孔、基因枪法 (projectile bombardment)以及经病毒载体(在下文中进一步论述)感染等。细菌细胞 可用于扩增含有本发明的DNA构筑体的质粒的数目。使细菌生长到对数生长期并且可通过 所属领域中已知的多种方法分离细菌中的质粒(例如参见Sambrook)。另外,可购得试剂 盒以从细菌中纯化质粒(例如参见来自Pharmacia Biotech的EasyPr印TM、FlexiPi^p ;来 自Stratagene的StrataClean ;以及来自Qiagen的QIApMp )。随后,进一步操纵分离并 纯化过的质粒以产生其它质粒,使用所述质粒来转染细胞或将其并入相关载体中以感染生 物体。典型载体含有转录和翻译终止子、转录和翻译起始序列以及可用于调节特定标靶核 酸的表达的启动子。载体任选地包含通用表达盒,其含有至少一个独立的终止子序列、允许 所述表达盒在真核细胞或原核细胞或两者中复制的序列(包括(但不限于)穿梭载体)以 及用于原核系统与真核系统的选择标记。载体适于在原核细胞、真核细胞或两者中复制和整合。参见 Giliman 和 Smith,Gene 8:81(1979) ;Roberts 等人,Nature. 328 :731 (1987); Schneider,B.等人,Protein Expr. Purif. 6435 10 (1995) ;Ausubel, Sambrook,Berger (都 同上文)。适用于克隆的细菌和噬菌体的目录由例如ATCC提供,例如由ATCC出版的The ATCC Catalogue of Bacteria andBacteriophage (1992), Gherna ^A (H)。 fflflll·、 克隆和分子生物学的其它方面的其它基本程序以及基础理论考虑因素也可见于Watson等 人,(1992)Recombinant DNA 第 2 版 Scientific American Books, NY 中。另外,基本上任 何核酸(以及实际上任何经标记核酸,无论标准或非标准)都可从多种商业来源中的任一 种定制或标准定购,这些商业来源例如Midland Certified Reagent Company (Midland, TX,可通过万维网(World Wide ffeb)在 mere, com 上获得)、The GreatAmerican Gene Company (Ramona, CA,可通过万维网在 Renco. com 上获得)、ExpressGen Inc. (Chicago, IL, 可通过万维网在 expressRen. com 上获得)、OperonTechnologies Inc. (Alameda, CA)以及 许多其它来源。选择密码子本发明的选择密码子扩展蛋白质生物合成机制的遗传密码子框架。举例来说,选 择密码子包括(但不限于)独特三碱基密码子、无义密码子(例如终止密码子,包括(但不 限于)琥珀密码子(UAG)、赭石密码子或蛋白石密码子(UGA))、非天然密码子、四个或四个 以上碱基的密码子、稀有密码子等。所属领域的技术人员显而易见,可引入所需基因或多核 苷酸中的选择密码子的数目范围很广,其包括(但不限于)在编码胰岛素多肽的至少一部 分的单一多核苷酸中存在一个或一个以上、两个或两个以上、三个或三个以上、4个、5个、6 个、7个、8个、9个、10个或10个以上选择密码子。所属领域的技术人员还显而易见,可引 入所需基因或多核苷酸中的选择密码子的数目范围很广,其包括(但不限于)在编码胰岛 素多肽的至少一部分的A链和B链多核苷酸序列中存在总计一个或一个以上、两个或两个 以上、三个或三个以上、4个、5个、6个、7个、8个、9个、10个或10个以上选择密码子。在一实施例中,所述方法涉及使用作为终止密码子的选择密码子以在活体内并 入一个或一个以上非天然氨基酸。举例来说,产生识别终止密码子(包括(但不限于) UAG)的Ο-tRNA,并且通过O-RS利用所需非天然氨基酸使0_tRNA氨酰基化。此0_tRNA无 法由天然存在宿主的氨酰基-tRNA合成酶识别。可使用常规定点诱变在所关注多肽中的 所关注位点处引入终止密码子(包括(但不限于)TAG)。例如参见Sayers,J. R.等人, (1988), 5' _3' Exonuclease inphosphorothioate-based oligonucleotide-directed mutagenesis. Nucleic Acids Res,16 :791_802。当 0-RS、0_tRNA和编码所关注多肽的核酸 在活体内组合时,响应UAG密码子而并入非天然氨基酸以得到在指定位置处含有非天然氨 基酸的多肽。活体内并入非天然氨基酸可在不显著干扰真核宿主细胞的情况下进行。举例来 说,因为对于UAG密码子的抑制效率取决于Ο-tRNA (包括(但不限于)琥珀抑制因子tRNA) 与真核释放因子(包含但不限于eRF)(其与终止密码子结合并起始核糖体释放正在生长的 肽)之间的竞争,所以可通过(包括(但不限于))增加Ο-tRNA和/或抑制因子tRNA的表 达水平来调节抑制效率。也可利用稀有密码子来编码非天然氨基酸。举例来说,当活体外蛋白质合成反应 中的精氨酸浓度降低时,已证明稀有精氨酸密码子AGG有效用于通过经丙氨酸酰化的合成tRNA插入Ala。例如参见Ma等人,Biochemistry,32 :7939 (1993)。在这种情况下,合成tRNA 与在大肠杆菌中作为次要物质存在的天然存在tRNAArg竞争。一些生物体不使用所有三联 体密码子。已利用藤黄微球菌(Micrococcusluteus)中的未指定密码子AGA在活体外转录 /翻译提取物中插入氨基酸。例如参见Kowal和Oliver,Nucl. Acid. Res. ,25 :4685(1997)。 可产生本发明的组分以在活体内使用这些稀有密码子。选择密码子还包含延长密码子,其包括(但不限于)四个或四个以上碱基的密码 子,例如四个、五个、六个或六个以上碱基的密码子。四碱基密码子的实例包括(但不限于) AGGA, CUAG, UAGA, CCCU等。五碱基密码子的实例包括(但不限于)AGGAC、CCCCU, CCCUC, CUAGA、CUACU、UAGGC等。本发明的特征包括使用基于移码抑制(frameshift suppression) 的延长密码子。四个或四个以上碱基的密码子可将(包括(但不限于))一个或多个非天 然氨基酸插入同一蛋白质中。举例来说,在存在具有反密码子环(例如具有至少8-lOnt的 反密码子环)的突变Ο-tRNA(包括(但不限于)特定移码抑制因子tRNA)的情况下,将四 个或四个以上碱基的密码子读作单一氨基酸。在其它实施例中,反密码子环可解码(包括 (但不限于))至少一个四碱基密码子、至少一个五碱基密码子或至少一个六碱基密码子或 更多碱基的密码子。因为存在256种可能的四碱基密码子,所以可使用四个或四个以上碱 基的密码子在同一细胞中编码多个非天然氨基酸。参见Anderson等人,(2002)Exploring the Limits of Codon and Anticodon Size, Chemistry and Biology,9 :237_244 ; Magliery, (2001)Expanding the Genetic Code :Selection of Efficient Suppressors of Four-base Codons and Identification of" Shifty" Four-base Codons with a Library Approach in Escherichia coli, J. Mol. Biol. 307 :755_769。举例来说,使用活体外生物合成方法,已经用四碱基密码子将非天然氨基酸并入 蛋白质中。例如参见 Ma 等人,(1993)Biochemistry,32 :7939 ;以及 Hohsaka 等人,(1999) J. Am. Chem. Soc. 121 :34。使用CGGG和AGGU,从而在活体外利用两个化学酰化的移码抑制 因子tRNA将2-萘基丙氨酸和赖氨酸的NBD衍生物同时并入抗生蛋白链菌素中。例如参见 Hohsaka等人,(1999) J.Am. Chem. Soc, 121 :12194。在活体内研究中,Moore等人研究具有 NCUA反密码子的tRNALeu衍生物抑制UAGN密码子(N可为U、A、G或C)的能力,并且发现 四联体UAGA可由具有UCUA反密码子的tRNALeu以13%到26%的效率解码,其中在O或-1 框架中极少解码。参见Moore等人,(2000) J. Mol. Biol.,298 195。在一实施例中,可在本 发明中使用基于稀有密码子或无义密码子的延长密码子,其可减少在其它不合需要的位点 处的错义通读和移码抑制。对于给定系统来说,选择密码子也可包括一个天然三碱基密码子,其中内源系统 不使用(或很少使用)天然碱基密码子。举例来说,这包括缺乏识别天然三碱基密码子的 tRNA的系统和/或三碱基密码子为稀有密码子的系统。选择密码子任选地包括非天然碱基对。这些非天然碱基对进一步扩展现有遗传代 码。一个额外的碱基对使三联体密码子的数目从64增加到125。第三碱基对的性质包括 稳定且具有选择性的碱基配对、通过聚合酶以高保真性有效地酶促并入DNA中以及在合成 新的非天然碱基对之后有效的持续引物延伸。可适于方法和组合物的非天然碱基对的描 述包括例如 Hirao 等人,(2002) An unnatural basepair for incorporating amino acid analogues into protein, Nature Biotechnology,20 :177-182。还参见Wu,Y.等人,(2002)J.Am. Chem. Soc. 124 14626-14630。其它相关公开案列于下文中。对于活体内使用来说,非天然核苷是膜可渗透的并且经磷酸化以形成相应的三 磷酸盐。另外,增加的遗传信息稳定并且不受细胞酶破坏。Bermer等人先前的工作利用 与规范沃森-克里克(Watson-Crick)配对不同的氢键结模式,其中最值得注意的实例 为 iso-C:iso-G 配对。例如参见 Switzer 等人,(1989).T.Am. Chem. Soclll 8322 以及 Piccirilli 等人,(1990)Nature, 343 33 ;Kool, (2000) Curr. Opin. Chem. Biol. ,4 :602。这 些碱基通常在一定程度上与天然碱基错配且不能酶促复制。Kool和同事证实碱基之间的疏 水性堆积相互作用可代替氢键结来驱动碱基对的形成。参见Kool,(2000) Curr. Opin. Chem. Biol. ,4 602 ;以及Guckian和 Kool,(1998) Angew. Chem. Int. Ed. Engl.,36,2825。在致力于 开发满足所有上述要求的非天然碱基对的过程中,Schultz、Romesberg和同事已系统地合 成并研究了一系列非天然疏水性碱基。发现PICS:PICS自身配对比天然碱基对稳定,并可 通过大肠杆菌DNA聚合酶I的克列诺片段(Klenow fragment, KF)有效地并入DNA中。例 如参见 McMinn 等人,(1999) J.Am. Chem. Soc, 121 :11585-6 ;以及 Ogawa 等人,(2000) J. Am. Chem. Soc, 122 :3274。可通过KF以足以用于生物功能的效率和选择性合成3丽:3丽自身配 对。例如参见Ogawa等人,(2000) J. Am. Chem. Soc, 122 :8803。然而,这两种碱基都充当用于 进一步复制的链终止子。突变DNA聚合酶近来已得到发展,其可用于复制PICS自身配对。 另外,也可复制7AI自身配对。例如参见Tae等人,(2001) J.Am. Chem. Soc, 123 74390也 已开发新颖金属碱基对Dipic :Py,其在结合Cu (II)后形成稳定配对。参见Meggers等人, (2000) J.Am. Chem. Soc, 122 10714。因为延长密码子和非天然密码子固有地与天然密码子 正交,所以本发明的方法可利用这一性质来产生正交tRNA以供其使用。也可使用翻译旁路系统(translational bypassing system)将非天然氨基酸并 入所需多肽中。在翻译旁路系统中,将大序列并入基因中,但并未将其翻译成蛋白质。所述 序列含有充当诱导核糖体跳过所述序列并在插入下游重新开始翻译的提示的结构。在某些实施例中,在本发明的方法和/或组合物中的所关注的蛋白质或多肽(或 其部分)是由核酸编码。通常,核酸包含至少一个选择密码子、至少两个选择密码子、至少 三个选择密码子、至少四个选择密码子、至少五个选择密码子、至少六个选择密码子、至少 七个选择密码子、至少八个选择密码子、至少九个选择密码子、十个或十个以上选择密码 子。可使用所属领域的技术人员已知并且在本文中描述的方法来诱变所关注的蛋白 质或多肽的编码基因,从而使其包括例如一个或一个以上选择密码子以并入非天然氨基 酸。举例来说,诱变所关注蛋白质的核酸以使其包括一个或一个以上选择密码子,从而提供 一个或一个以上非天然氨基酸的并入。本发明包括例如包括至少一个非天然氨基酸的任何 蛋白的任何这种变异体(包括(但不限于)突变体)形式。类似地,本发明还包括相应核 酸,即具有一个或一个以上编码一个或一个以上非天然氨基酸的选择密码子的任何核酸。可容易地使编码所关注蛋白质(例如胰岛素多肽)的核酸分子突变以在多肽的任 何所需位置处引入半胱氨酸。半胱氨酸广泛用于将反应性分子、水溶性聚合物、蛋白质或多 种其它分子引入所关注蛋白质上。所属领域的技术人员已知适于将半胱氨酸并入多肽的所 需位置中的方法,例如美国专利第6,608,183号(其是以引用的方式并入本文中)中所述 的方法,以及标准诱变技术。
非天然编码氨基酸多种非天然编码氨基酸适用于本发明中。可将任何数目的非天然编码氨基酸引入 胰岛素多肽中。一般来说,引入的非天然编码氨基酸实质上对20种常见的遗传编码氨基酸 (即丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异 亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨 酸)呈化学惰性。在一些实施例中,非天然编码氨基酸包括与20种常见氨基酸中不存在的 官能团(包括(但不限于)叠氮基、酮基、醛基以及氨氧基)有效并选择性地反应形成稳定 结合物的侧链官能团。举例来说,包括含有叠氮基官能团的非天然编码氨基酸的胰岛素多 肽可与聚合物(包括(但不限于)聚(乙二醇))或者含有炔部分的第二多肽反应,以形成 由于叠氮基与炔官能团选择性反应形成休斯根[3+2]环加成产物而引起的稳定结合物。α -氨基酸的一般结构说明如下(式I):非天然编码氨基酸通常为具有以上所列结构式(其中R基团为除用于20种天然 氨基酸中的取代基之外的任何取代基)的任何结构,并且可适用于本发明中。因为本发明 的非天然编码氨基酸通常仅关于侧链结构与天然氨基酸存在不同,所以非天然编码氨基酸 以与天然存在多肽中形成酰胺键相同的方式与其它氨基酸(包括(但不限于)天然或非天 然编码氨基酸)形成酰胺键。然而,非天然编码氨基酸具有使其区别于天然氨基酸的侧链基团。举例来说,R任 选地包含烷基_、芳基_、酰基_、酮基_、叠氮基_、羟基_、胼、氰基_、卤基_、酰胼、烯基、炔 基、醚、硫醇、硒基_、磺酰基_、硼酸酯基(borate)、硼酸酯基(boronate)、磷酸基、膦酰基、 膦、杂环基、烯酮、亚胺、醛、酯、硫代酸、羟胺、氨基等或其任何组合。所关注的可适用于本 发明中的其它非天然存在氨基酸包括(但不限于)包含可光活化交联剂的氨基酸、自旋标 记的氨基酸、荧光氨基酸、结合金属的氨基酸、含金属的氨基酸、放射性氨基酸、具有新颖官 能团的氨基酸、与其它分子共价或非共价相互作用的氨基酸、光笼化和/或可光致异构化 的氨基酸、包含生物素或生物素类似物的氨基酸、糖基化氨基酸(例如糖取代丝氨酸)、其 它碳水化合物修饰的氨基酸、含酮基的氨基酸、包含聚乙二醇或聚醚的氨基酸、经重原子取 代的氨基酸、可化学裂解和/或可光裂解的氨基酸、与天然氨基酸相比具有延长侧链(包括 (但不限于)聚醚或长链烃,包括(但不限于)约5个以上或约10个以上碳)的氨基酸、含 碳连接的糖的氨基酸、氧化还原活性氨基酸、含氨基硫代酸的氨基酸以及包含一个或一个 以上毒性部分的氨基酸。可适用于本发明中并且适用于与水溶性聚合物反应的示范性非天然编码氨基酸 包括(但不限于)具有羰基、氨氧基、胼、酰胼、氨基脲、叠氮化物以及炔反应性基团的非天 然编码氨基酸。在一些实施例中,非天然编码氨基酸包含糖部分。所述氨基酸的实例包括 N-乙酰基-L-葡糖胺基-L-丝氨酸、N-乙酰基-L-半乳糖胺基-L-丝氨酸、N-乙酰基-L-葡 糖胺基-L-苏氨酸、N-乙酰基-L-葡糖胺基-L-天冬酰胺和0-甘露糖胺基-L-丝氨酸。这些氨基酸的实例还包括氨基酸与糖之间的天然存在N-或0-连接是由自然界中通常不存在 的共价键(包括(但不限于)烯烃、肟、硫醚、酰胺等)置换的实例。这些氨基酸的实例还 包括天然存在蛋白质中通常不存在的糖,例如2-脱氧_葡萄糖、2-脱氧半乳糖等。本文中提供的多种非天然编码氨基酸可购自例如Sigma-Aldrich (St. Louis, MO, USA)、 Novabiochem(EMD Biosciences 的分公司,Darmstadt, Germany)或 Peptech(Burlington, MA, USA)。不可购得的非天然编码氨基酸是任选地如本文中所提供 而合成,或使用所属领域的技术人员已知的标准方法合成。关于有机合成技术,例如参见 Fessendon禾口 Fessendon, OrRanic Chemistry, (1982,第 2 版,Willard Grant Press, Boston Mass. ) March, Advanced OrRanic Chemistry (第 3 版,1985, Wiley and Sons,New York); 以及 Carey 和 Sundberg, Advanced OrganicChemistry (第 3 版,A 和 B 部分,1990,Plenum Press,New York)。还参见美国专利第7,045,337号和第7,083,970号,其是以引用的方式 并入本文中。除含有新颖侧链的非天然氨基酸之外,可适用于本发明中的非天然氨基酸也 任选地包含经修饰的主链结构,包括(但不限于)如式II和III的结构所说明的结构
X
III
R R其中Z通常包含0H、NH2、SH、NH-R'或S-R' ;X和Y可相同或不同,通常包含S或 0 ;并且R和R‘任选地相同或不同,通常选自上文对于具有式I的非天然氨基酸所述的R 基团的组成部分的相同清单以及氢。举例来说,本发明的非天然氨基酸任选地包含如式II 和III所说明的氨基或羧基中的取代。这种类型的非天然氨基酸包括(但不限于)α-羟 基酸、α-硫代酸、α-氨基硫代羧酸盐,包括(但不限于)具有对应于20种常见天然氨基 酸的侧链或非天然侧链的非天然氨基酸。另外,在α-碳上的取代任选地包括(但不限于) L、D或α - α - 二取代氨基酸,例如D-谷氨酸、D-丙氨酸、D-甲基_0_酪氨酸、氨基丁酸等。 其它结构替代物包括环状氨基酸,例如脯氨酸类似物以及3、4、6、7、8和9元环脯氨酸类似 物;β和Y氨基酸,例如经取代β-丙氨酸和Y-氨基丁酸。多种非天然氨基酸是基于例如酪氨酸、谷氨酰胺、苯丙氨酸等天然氨基酸并且适 用于本发明中。酪氨酸类似物包括(但不限于)对位取代的酪氨酸、邻位取代的酪氨酸以及 间位取代的酪氨酸,其中经取代酪氨酸包含(包括(但不限于))酮基(包括(但不限于)乙 酰基)、苯甲酰基、氨基、胼、羟胺、硫醇基、羧基、异丙基、甲基、C6-C20直链或分支链烃、饱
46和或不饱和烃、0-甲基、聚醚基团、硝基、炔基等。另外,也涵盖多取代芳环。可适用于本发明 中的谷氨酰胺类似物包括(但不限于)a_羟基衍生物、g-取代衍生物、环状衍生物以及酰胺 取代的谷氨酰胺衍生物。可适用于本发明中的示范性苯丙氨酸类似物包括(但不限于)对 位取代的苯丙氨酸、邻位取代的苯丙氨酸和间位取代的苯丙氨酸,其中取代基包含(包括 (但不限于))羟基、甲氧基、甲基、烯丙基、醛、叠氮基、碘基、溴基、酮基(包括(但不限于) 乙酰基)、苯甲酰基、炔基等。可适用于本发明中的非天然氨基酸的特定实例包括(但不限 于)对乙酰基-L-苯丙氨酸、0-甲基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨 酸、0-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、三-0-乙酰基-GlcNAc β -丝氨酸、L-多 巴(L-Dopa)、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对叠氮基-L-苯丙氨酸、对酰基-L-苯 丙氨酸、对苯甲酰基-L-苯丙氨酸、L-磷酸丝氨酸、膦酰基丝氨酸、膦酰基酪氨酸、对碘苯 丙氨酸、对溴苯丙氨酸、对氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸以及对炔丙基氧基-苯 丙氨酸等。可适用于本发明中的多种非天然氨基酸的结构的实例是提供于例如标题为“In vivoincorporation of unnatural amino acids"^ffO 2002/085923 巾。胃^lMMSI 类似物,还参见Kiick等人,(2002) Incorporation of azides into recombinant proteins forchemoselective modification by the Staudinger ligation, PNAS 99:19-24,其是 M弓Iffl 白勺^入*^;巾。fen》“Compositions Containing, Methods Involving, and Usesof Non-natural Amino Acids and Polyp印tides” 的国际申请案第 PCT/US06/47822 号(其以引用的方式并入本文中)描述芳香族胺部分(包括(但不限于)对氨基苯丙氨 酸)的还原性烷基化,和还原性胺化。在一实施例中,提供包括非天然氨基酸(例如对(炔丙基氧基)_苯丙氨酸)的胰 岛素多肽的组合物。还提供包含对(炔丙基氧基)_苯丙氨酸和(包括(但不限于))蛋白 质和/或细胞的各种组合物。一方面,包括对(炔丙基氧基)_苯丙氨酸非天然氨基酸的组 合物进一步包括正交tRNA。非天然氨基酸可与正交tRNA键结(包括(但不限于)共价键 结),其包括(但不限于)通过氨酰基键与正交tRNA共价键结、与正交tRNA的末端核糖的 3' OH或2' OH共价键结等。可借助于非天然氨基酸并入蛋白质中的化学部分提供蛋白质的多种优点和操纵 性。举例来说,酮基官能团的独特反应性允许利用多种含胼或含羟胺试剂中的任一者在活 体外以及活体内选择性修饰蛋白质。举例来说,重原子非天然氨基酸可适用于定相X射线 结构数据。使用非天然氨基酸进行重原子的位点特异性引入还为选择重原子的位置提供选 择性和灵活性。举例来说,光反应性非天然氨基酸(包括(但不限于)具有二苯甲酮和芳 基叠氮化物(包括(但不限于)叠氮基苯)侧链的氨基酸)允许蛋白质的活体内和活体外 有效光交联。光反应性非天然氨基酸的实例包括(但不限于)对叠氮基-苯丙氨酸以及 对苯甲酰基-苯丙氨酸。随后,可通过激发光反应性基团(提供时间控制)使具有光反应 性非天然氨基酸的蛋白质随意交联。在一实例中,(包括(但不限于))在使用核磁共振以 及振动光谱的情况下,可由作为局部结构和动力学的探针的经同位素标记的(包括(但不 限于))甲基取代非天然氨基酸的甲基。举例来说,炔基或叠氮基官能团允许利用分子通过 [3+2]环加成反应选择性修饰蛋白质。并入多肽的氨基端的非天然氨基酸可由R基团(其为除用于20种天然氨基酸中 的取代基之外的任何取代基)和不同于α-氨基酸(参见式I)中通常存在的ΝΗ2基团的 其中A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷基、经
48
第二反应性基团构成。类似的非天然氨基酸可在羧基端并入不同于α-氨基酸(参见式I) 中通常存在的COOH基团的第二反应性基团。可选择或设计本发明的非天然氨基酸以提供20种天然氨基酸中不可获得的其它 特性。举例来说,可任选地设计或选择非天然氨基酸以改良例如并有所述非天然氨基酸的 蛋白质的生物性质。举例来说,可任选地通过在蛋白质中包括非天然氨基酸来改变以下性 质毒性、生物分布(biodistribution)、溶解性、稳定性(例如热稳定性、水解稳定性、氧化 稳定性、酶促降解抗性等)、纯化和加工便利性、结构性质、光谱性质、化学和/或光化学性 质、催化活性、氧化还原电位、半衰期、与其它分子例如共价或非共价反应的能力等。非天然氨基酸的结构与合成羰基、羰基样基团、经掩蔽羰基、经保护羰基和羟胺 基在一些实施例中,本发明提供通过肟键与例如PEG等水溶性聚合物连接的胰岛
ο多种类型的非天然编码氨基酸适用于形成肟键。这些氨基酸包括(但不限于) 含有羰基、二羰基或羟胺基的非天然编码氨基酸。此类氨基酸是描述于美国专利公开案 第 2006/0194256 号、第 2006/0217532 号和第 2006/0217289 号以及标题为 “Compositions containing, methods involving, and uses of non-natural amino acidsand polyp印tides”的WO 2006/069246中,所述文献是以全文引用的方式并入本文中。非天然 编码氨基酸也描述于美国专利第7,083,970号和美国专利第7,045,337号中,所述文献是 以全文引用的方式并入本文中。本发明的一些实施例利用在一个或一个以上位置处经对乙酰基苯丙氨酸氨基酸 取代的胰岛素多肽。对乙酰基-(+/-)_苯丙氨酸和间乙酰基-(+/-)_苯丙氨酸的合成描述 于Zhang,Ζ.等人,Biochemistry 42 =6735-6746 (2003)中,所述文献是以引用的方式并入 本文中。所属领域的技术人员可类似地制备其它含羰基或含二羰基的氨基酸。此外,本文 中所包括的非天然氨基酸的非限制性示范性合成呈现于美国专利第7,083,970号的图4、 24-34和36-39中,所述专利是以全文引用的方式并入本文中。具有亲电子反应性基团的氨基酸允许多种通过亲核加成反应连接分子的反应。所 述亲电子反应性基团包括羰基(包括酮基和二羰基)、羰基样基团(其具有类似于羰基(包 括酮基和二羰基)的反应性并且在结构上与羰基类似)、经掩蔽羰基(其可容易地转化为羰 基(包括酮基和二羰基)),或经保护羰基(其在脱除保护基后具有与羰基(包括酮基和二 羰基)类似的反应性)。所述氨基酸包括具有式(IV)结构的氨基酸
R3取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂烷基、经取代亚杂烷 基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经取代亚芳基、亚杂芳基、经取代亚 杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷基或经取代亚芳烷基;B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子低碳亚烷 基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、经取代低碳亚杂 烷基、-ο-、-ο-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基或经取代亚烷基)_、-S (0) k_(其中k为1、2或3)、-S(0)k(亚烷基或经取代亚烷基)_、-C(O)-, -C(0)-(亚烷基或 经取代亚烷基)_、-C(S)-、-C(S)-(亚烷基或经取代亚烷基)_、_N(R' )-、_NR' _(亚 烷基或经取代亚烷基)-、_C(0)N(R' )-、-C0N(R' )_(亚烷基或经取代亚烷 基)-、-CSN(R' )-、-CSN(R' )_(亚烷基或经取代亚烷基)_、_N(R' )C0_(亚烷基或 经取代亚烷基)_、_N(R' )C(0)0-、-S(0)kN(R' )-、-N(R' )C(0)N(R' )-、_N(R') C(S)N(R ' )-、-N(R' )S(0)kN(R ' )-、-N(R' )-N=、-C(R' ) = N-、-C(R ')= N-N (R' )-、_C(R' )=N-N=、-C(R' ) 2_N = N-禾口-C (R' )2_N(R' )_N(R')-,其中 R'
各独立地为H、烷基或经取代烷基;R为H、烷基、经取代烷基、环烷基或经取代环烷基;R"各独立地为H、烷基、经取代烷基或保护基,或当存在一个以上R"基团时,两 个R"任选地形成杂环烷基;R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并且R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸;R3和R4各独立地为H、卤素、低碳烷基或经取代低碳烷基,或R3和R4或两个R3基 团任选地形成环烷基或杂环烷基;或-A-B-J-R基团合起来形成包含至少一个羰基(包括二羰基)、经保护羰基(包 括经保护二羰基)或经掩蔽羰基(包括经掩蔽二羰基)的双环或三环环烷基或杂环烷基;或-J-R基团合起来形成包含至少一个羰基(包括二羰基)、经保护羰基(包括经 保护二羰基)或经掩蔽羰基(包括经掩蔽二羰基)的单环或双环环烷基或杂环烷基;条件是当A为亚苯基并且R3各为H时,B存在;并且当A为-(CH2)4-并且R3各为 H时,B不为-NHC(O) (CH2CH2)-;并且当A与B都不存在并且R3各为H时,R不为甲基。另外,包括具有式(V)结构的氨基酸
49 其中A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷基、经 取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂烷基、经取代亚杂烧 基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经取代亚芳基、亚杂芳基、经取代亚 杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷基或经取代亚芳烷基;B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子低碳亚烧 基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、经取代低碳亚杂 烧基、-ο-、-ο-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基或经取代亚烷基)-、-S (0) k-(其中k为1、2或3)、-s(0)k(亚烷基或经取代亚烷基)_、-C(O)-, -C(0)-(亚烷基或 经取代亚烷基)_、-C⑶-、-C⑶-(亚烷基或经取代亚烷基)-、-N(R' )-、-NR'-(亚 烧基或经取代亚烷基)-、_C(0)N(R' )-、-C0N(R' )_(亚烷基或经取代亚烷 基)-、-CSN(R' )-、-CSN(R' )_(亚烷基或经取代亚烷基)_、_N(R' )C0_(亚烷基或 经取代亚烷基)_、_N(R' )C(0)0-、-S(0)kN(R' )-、-N(R' )C(0)N(R' )-、_N(R') C(S)N(R ' )-、-N(R' )S(0)kN(R ' )-、-N(R' )-N=、-C(R' ) = N-、-C(R ')= N-N (R' )-、_C(R' )=N-N=、-C(R' ) 2_N = N-禾口-C (R' )2_N(R' )_N(R')-,其中 R' 各独立地为H、烷基或经取代烷基;R为H、烷基、经取代烷基、环烷基或经取代环烷基;R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并且R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸;条件是当A为亚苯基时,B存在;并且当A为-(CH2)4-时,B不为-NHC(O) (CH2CH2)-; 并且当A与B都不存在时,R不为甲基。另外,包括具有式(VI)结构的氨基酸 其中B是选自由以下各基团组成的群组的连接子低碳亚烷基、经取代低碳亚烷 基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、经取代低碳亚杂烷基、-ο-、-o-(亚 烧基或经取代亚烷基)-、-S-、-S-(亚烷基或经取代亚烷基)_、-S(O)k-(其中k 为1、2或3)、-S(O)k(亚烷基或经取代亚烷基)_、-C(O)-, -C(0)_(亚烷基或经取代亚烷基)-、_C⑶-、_C⑶_(亚烷基或经取代亚烷基)-、_N(R' )-、_NR' _(亚 烷基或经取代亚烷基)-、_C(0)N(R ‘ -CON(R ‘ )_(亚烷基或经取代亚烷 基)-、-CSN(R' )-、-CSN(R' )_(亚烷基或经取代亚烷基)_、_N(R' )C0_(亚烷基或 经取代亚烷基)_、_N(R' )C(0)0-、-S(0)kN(R' )-、-N(R' )C(0)N(R' )-、_N(R') C(S)N(R ' )-、-N(R' )S(0)kN(R ' )-、-N(R' )-N=、-C(R' ) = N-、-C(R ')= N-N (R' )-、_C(R' )=N-N=、-C(R' ) 2_N = N-禾口-C (R' )2_N(R' )_N(R')-,其中 R' 各独立地为H、烷基或经取代烷基;R为H、烷基、经取代烷基、环烷基或经取代环烷基;R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并且R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸;Ra是各独立地选自由H、卤素、烷基、经取代烷基、_N(R' )2、_C(0)kR'(其中k为 1、2或3)、-C(0)N(R' )2、-0R'和-S(O)kR'组成的群组,其中R'各独立地为H、烷基或经 取代烷基。另外,包括以下氨基酸
物任选地氨基经保护、羧基经保护,或为其盐。另外,以下非天然氨基酸中的任一者都可并 入非天然氨基酸多肽中。另外,包括以下具有式(VII)结构的氨基酸其中B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子低碳亚烷 基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、经取代低碳亚杂 烷基、-ο-、-0-(亚烷基或经取代亚烷基)_、-S-、-S-(亚烷基或经取代亚烷基)_、-S (0) k_(其中k为1、2或3)、-S(0)k(亚烷基或经取代亚烷基)_、-C(O)-, -C(0)-(亚烷基或 经取代亚烷基)_、-C(S)-、-C(S)-(亚烷基或经取代亚烷基)-、-N(R' )-、-NR'-(亚 烷基或经取代亚烷基)-、_C(0)N(R' )-、-C0N(R' )_(亚烷基或经取代亚烷
51
基)-、-CSN(R' )-、-CSN(R' )_(亚烷基或经取代亚烷基)_、_N(R' )C0_(亚烷基或 经取代亚烷基)_、_N(R' )C(0)0-、-S(0)kN(R' )-、-N(R' )C(0)N(R' )-、_N(R') C(S)N(R ' )-、-N(R' )S(0)kN(R ' )-、-N(R' )-N=、-C(R' ) = N-、-C(R ')= N-N (R' )-、_C(R' )=N-N=、-C(R' ) 2_N = N-禾口-C (R' )2_N(R' )_N(R')-,其中 R' 各独立地为H、烷基或经取代烷基;R为H、烷基、经取代烷基、环烷基或经取代环烷基;R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并且R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸;Ra各独立地选自由H、卤素、烷基、经取代烷基、-N(R' )2,-C (O)kR'(其中k为1、 2或3)、-C(0)N(R' )2、-0 R'和-S(O)k R'组成的群组,其中R'各独立地为H、烷基或经 取代烷基;并且η为0到8;条件是当A 为-(CH2)4-时,B 不为-NHC(O) (CH2CH2)-。另外,包括以下氨基酸
HiN' Y0ii HiN"
Λ
H Γ
NJrVO
H
SJr^S
-NH ,OH
Η Ν ΗHjN人^0H
其中所述化合物任选地氨基经保护、任选地羧基
经保护、任选地氨基经保护并且羧基也经保护,或为其盐。另外,这些非天然氨基酸以及以 下非天然氨基酸中的任一者都可并入非天然氨基酸多肽中。另外,包括以下具有式(VIII)结构的氨基酸
O(vm), 其中A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷
52基、经取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂烷基、经取代 亚杂烷基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经取代亚芳基、亚杂芳基、经 取代亚杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷基或经取代亚芳烷基;B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子低碳亚烷 基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、经取代低碳亚杂 烷基、-ο-、-ο-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基或经取代亚烷基)-、-S (0) k-(其中k为1、2或3)、-s(0)k(亚烷基或经取代亚烷基)_、-C(O)-, -C(0)-(亚烷基或 经取代亚烷基)_、-C(S)-、-C(S)-(亚烷基或经取代亚烷基)-、-N(R' )-、-NR'-(亚 烷基或经取代亚烷基)-、_C(0)N(R' )-、-C0N(R' )_(亚烷基或经取代亚烷 基)-、-CSN(R' )-、-CSN(R' )_(亚烷基或经取代亚烷基)_、_N(R' )C0_(亚烷基或 经取代亚烷基)_、_N(R' )C(0)0-、-S(0)kN(R' )-、-N(R' )C(0)N(R' )-、_N(R') C(S)N(R ' )-、-N(R' )S(0)kN(R ' )-、-N(R' )-N=、-C(R' ) = N-、-C(R ')= N-N (R' )-、_C(R' )=N-N=、-C(R' ) 2_N = N-禾口-C (R' )2_N(R' )_N(R')-,其中 R' 各独立地为H、烷基或经取代烷基;R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并且R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸。另外,包括以下具有式(IX)结构的氨基酸 B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子低碳亚烷 基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、经取代低碳亚杂 烷基、-ο-、-ο-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基或经取代亚烷基)-、-S (0) k-(其中k为1、2或3)、-s(0)k(亚烷基或经取代亚烷基)_、-C(O)-, -C(0)-(亚烷基或 经取代亚烷基)_、-C(S)-、-C(S)-(亚烷基或经取代亚烷基)-、-N(R' )-、-NR'-(亚 烷基或经取代亚烷基)-、_C(0)N(R' )-、-C0N(R' )_(亚烷基或经取代亚烷 基)-、-CSN(R' )-、-CSN(R' )_(亚烷基或经取代亚烷基)_、_N(R' )C0_(亚烷基或 经取代亚烷基)_、_N(R' )C(0)0-、-S(0)kN(R' )-、-N(R' )C(0)N(R' )-、_N(R') C(S)N(R ' )-、-N(R' )S(0)kN(R ' )-、-N(R' )-N=、-C(R' ) = N-、-C(R ')= N-N (R' )-、_C(R' )=N-N=、-C(R' ) 2_N = N-禾口-C (R' )2_N(R' )_N(R')-,其中 R' 各独立地为H、烷基或经取代烷基;R为H、烷基、经取代烷基、环烷基或经取代环烷基;R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并且R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸;其中Ra各独立地选自由H、卤素、烷基、经取代烷基、_N(R' )2、_C(0)kR'(其中k
53为1、2或3)、-C(0)N(R' )2、-0R'和-S(O)kR'组成的群组,其中R'各独立地为H、烷基或 经取代烷基。另外,包括以下氨基酸
其中所述
化合物任选地氨基经保护、任选地羧基经保护、任选地氨基经保护并且羧基也经保护,或为 其盐。另外,这些非天然氨基酸以及以下非天然氨基酸中的任一者都可并入非天然氨基酸 多肽中。另外,包括以下具有式(X)结构的氨基酸 其中B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子低 碳亚烷基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、经取代 低碳亚杂烷基、-0-、-o-(亚烷基或经取代亚烷基)-、-S-、-s-(亚烷基或经取代亚烧 基)-、-S (0) k-(其中k为1、2或3)、-S (0) k (亚烷基或经取代亚烷基)_、-C (0) -、-C (0)-(亚 烧基或经取代亚烷基)_、-C⑶_、-C⑶-(亚烷基或经取代亚烷基)_、-N(R' )-、-N R' _(亚烷基或经取代亚烷基)_、-C(0)N(R' -CON(R' )_(亚烷基或经取代亚烧 基)-、-CSN(R' )-、-CSN(R' )_(亚烷基或经取代亚烷基)_、_N(R' )C0_(亚烷基或 经取代亚烷基)_、_N(R' )C(0)0-、-S(0)kN(R' )-、-N(R' )C(0)N(R' )-、_N(R') C(S)N(R ' )-、-N(R' )S(0)kN(R ' )-、-N(R' )-N=、-C(R' ) = N-、-C(R ')= N-N (R' )-、_C(R' )=N-N=、-C(R' ) 2_N = N-禾口-C (R' )2_N(R' )_N(R')-,其中 R' 各独立地为H、烷基或经取代烷基;R为H、烷基、经取代烷基、环烷基或经取代环烷基;Rl是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并 且R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸;Ra各独立地选自由H、卤素、烷基、经取代烷基、-N(R' )2、_C(0)kR'(其中k为 1、2或3)、-C(0)N(R' )2、-0R'和_S(0)kR'组成的群组,其中R'各独立地为H、烷基或经
R2
O
R-iI
54取代烷基;并且η为0到8。另外,包括以下氨基酸
H2N-V0h 和 0 ,
护并且羧基也经保护,或为其盐。另外,这些非天然氨基酸以及以下非天然氨基酸中的任一 者都可并入非天然氨基酸多肽中。除单羰基结构之外,本文中所述的非天然氨基酸也可包括例如二羰基、二羰基样 基团、经掩蔽二羰基和经保护二羰基等基团。举例来说,包括以下具有式(XI)结构的氨基酸其中A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷 基、经取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂烷基、经取代 亚杂烷基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经取代亚芳基、亚杂芳基、经 取代亚杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷基或经取代亚芳烷基;B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子低碳亚烷 基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、经取代低碳亚杂 烷基、-ο-、-ο-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基或经取代亚烷基)-、-S (0) k_(其中k为1、2或3)、-S(0)k(亚烷基或经取代亚烷基)-、C(O)-, C(0)-(亚烷基或经 取代亚烷基)_、-C(S)-、C(S)-(亚烷基或经取代亚烷基)-、-N(R' )-、NR' _(亚烷基或 经取代亚烷基)_、C(O)N(R' CON(R' )_(亚烷基或经取代亚烷基)_、_CSN(R')-、 CSN(R' )_(亚烷基或经取代亚烷基)_、N(R' )C0-(亚烷基或经取代亚烷基)-、N(R') C(0)0-、S(0)kN(R' )-、N(R' )C(0)N(R' )-、N(R' )C(S)N(R' )-、N(R' )S(0) kN(R')-、 N(R' )-N=、-C(R' )=N-、-C(R' ) = N-N (R' )-、-C(R' )=N_N=、C(R' ) 2_N = N-和-C(R' )2N(R' )N(R')-,其中R'各独立地为H、烷基或经取代烷基;R为H、烷基、经取代烷基、环烷基或经取代环烷基;Rl是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并
(XI),
55且R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸。另外,包括以下具有式(XII)结构的氨基酸B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子低碳亚烷 基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、经取代低碳亚杂 烷基、-ο-、-ο-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基或经取代亚烷基)-、-S (0) k-(其中k为1、2或3)、-s(0)k(亚烷基或经取代亚烷基)_、-C(O)-, -C(0)-(亚烷基或 经取代亚烷基)_、-C(S)-、-C(S)-(亚烷基或经取代亚烷基)-、-N(R' )-、-NR'-(亚 烷基或经取代亚烷基)-、_C(0)N(R' )-、-C0N(R' )_(亚烷基或经取代亚烷 基)-、-CSN(R' )-、-CSN(R' )_(亚烷基或经取代亚烷基)_、_N(R' )C0_(亚烷基或 经取代亚烷基)_、_N(R' )C(0)0-、-S(0)kN(R' )-、-N(R' )C(0)N(R' )-、_N(R') C(S)N(R ' )-、-N(R' )S(0)kN(R ' )-、-N(R' )-N=、-C(R' ) = N-、-C(R ')= N-N (R' )-、_C(R' )=N-N=、-C(R' ) 2_N = N-禾口-C (R' )2_N(R' )_N(R')-,其中 R' 各独立地为H、烷基或经取代烷基;R为H、烷基、经取代烷基、环烷基或经取代环烷基;Rl是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并 且R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸;其中Ra各独立地选自由H、卤素、烷基、经取代烷基、-N(R' )2、_C(0)kR'(其中 k为1、2或3)、-C(0)N(R' )2、-0R'和_S(0)kR'组成的群组,其中R'各独立地为H、烷基 或经取代烷基。另外,包括以下氨基酸
羧基经保护、任选地氨基经保护并且羧基也经保护,或为其盐。另外,这些非天然氨基酸以 及以下非天然氨基酸中的任一者都可并入非天然氨基酸多肽中。另外,包括以下具有式(XIII)结构的氨基酸
和明
其中所述化合物任选地氨基经保护、任选地
56(Χ π),其中B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子低碳 亚烷基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、经取代低碳亚 杂烷基、-0-、-ο-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基或经取代亚烷基)-、-S (0) k-(其中k为1、2或3)、-s(0)k(亚烷基或经取代亚烷基)_、-C(O)-, -C(0)-(亚烷基或 经取代亚烷基)_、-C(S)-、-C(S)-(亚烷基或经取代亚烷基)-、-N(R' )-、-NR'-(亚 烷基或经取代亚烷基)-、_C(0)N(R' )-、-C0N(R' )_(亚烷基或经取代亚烷 基)-、-CSN(R' )-、-CSN(R' )_(亚烷基或经取代亚烷基)_、_N(R' )C0_(亚烷基或 经取代亚烷基)_、_N(R' )C(0)0-、-S(0)kN(R' )-、-N(R' )C(0)N(R' )-、_N(R') C(S)N(R ' )-、-N(R' )S(0)kN(R ' )-、-N(R' )-N=、-C(R' ) = N-、-C(R ')= N-N (R' )-、_C(R' )=N-N=、-C(R' ) 2_N = N-禾口-C (R' )2_N(R' )_N(R')-,其中 R' 各独立地为H、烷基或经取代烷基;R为H、烷基、经取代烷基、环烷基或经取代环烷基;R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并且R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸;Ra各独立地选自由H、卤素、烷基、经取代烷基、-N(R' )2、_C(0)kR'(其中k为1、 2或3)、-C(0)N(R' )2、-0R'和-S(O)kR'组成的群组,其中R'各独立地为H、烷基或经取 代烷基;并且η为0到8。另外,包括以下氨基酸
基经保护、任选地氨基经保护并且羧基也经保护,或为其盐。另外,这些非天然氨基酸以及
其中所述化合物任选地氨基经保护、任选地羧以下非天然氨基酸中的任一者都可并入非天然氨基酸多肽中。另外,包括以下具有式(XIV)结构的氨基酸 其中A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷基、经 取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂烷基、经取代亚杂烧 基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经取代亚芳基、亚杂芳基、经取代亚 杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷基或经取代亚芳烷基; 且
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
Rl是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并
R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸; Xl为C、S或S(O);并且L为亚烷基、经取代亚烷基、N(R')(亚烷基)或N(R')
(经取代亚烷基),其中R'为H、烷基、经取代烷基、环烷基或经取代环烷基。
另外,包括以下具有式(XIV-A)结构的氨基酸
0
(XIV-A)
RtHN C(O)R2其中A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷基、经 取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂烷基、经取代亚杂烧 基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经取代亚芳基、亚杂芳基、经取代亚 杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷基或经取代亚芳烷基;
且
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
Rl是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并
R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸; L为亚烷基、经取代亚烷基、N(R')(亚烷基)或N(R')(经取代亚烷基),其中 R'为H、烷基、经取代烷基、环烷基或经取代环烷基。
另外,包括以下具有式(XIV-B)结构的氨基酸
58
V A
Azs、八
人
R,HN C(O)Ri(XIV-B)其中A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷基、经 取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂烷基、经取代亚杂烷 基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经取代亚芳基、亚杂芳基、经取代亚 杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷基或经取代亚芳烷基;R为H、烷基、经取代烷基、环烷基或经取代环烷基;Rl是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并 且R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸;L为亚烷基、经取代亚烷基、N(R')(亚烷基)或N(R')(经取代亚烷基),其中 R'为H、烷基、经取代烷基、环烷基或经取代环烷基。另外,包括以下具有式(XV)结构的氨基酸
0O
^(CRaR9)n
RiHN C(O)R2其中A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷基、经 取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂烷基、经取代亚杂烷 基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经取代亚芳基、亚杂芳基、经取代亚 杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷基或经取代亚芳烷基;R为H、烷基、经取代烷基、环烷基或经取代环烷基;R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并且R2是任选的,并且当存在时为0Η、酯保护基、树脂、氨基酸、多肽或多核苷酸;X1为C、S或S(O);并且η为0、1、2、3、4或5 ;并且各CR8R9基团上的R8和R9是各 独立地选自由H、烷氧基、烷基胺、卤素、烷基、芳基组成的群组,或任何R8和R9可合起来形 成=0或环烷基,或任何两个相邻R8基团可合起来形成环烷基。另外,包括以下具有式(XV-A)结构的氨基酸
59R,HNC(D)R2(χν_Α)其中A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷基、经 取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂烷基、经取代亚杂烧 基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经取代亚芳基、亚杂芳基、经取代亚 杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷基或经取代亚芳烷基;R为H、烷基、经取代烷基、环烷基或经取代环烷基;R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并且R2是任选的,并且当存在时为0Η、酯保护基、树脂、氨基酸、多肽或多核苷酸;η为0、1、2、3、4或5 ;并且各CR8R9基团上的R8和R9各独立地选自由H、烷氧基、烧 基胺、卤素、烷基、芳基组成的群组,或任何R8和R9可合起来形成=0或环烷基,或任何两个 相邻R8基团可合起来形成环烷基。另外,包括以下具有式(XV-B)结构的氨基酸
V A
乂八Λ
^(CRiRi),
R,HN C(O)R2(XV,B)其中A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷基、经 取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂烷基、经取代亚杂烧 基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经取代亚芳基、亚杂芳基、经取代亚 杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷基或经取代亚芳烷基;R为H、烷基、经取代烷基、环烷基或经取代环烷基;R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并且R2是任选的,并且当存在时为0Η、酯保护基、树脂、氨基酸、多肽或多核苷酸;η为0、1、2、3、4或5 ;并且各CR8R9基团上的R8和R9各独立地选自由H、烷氧基、烧 基胺、卤素、烷基、芳基组成的群组,或任何R8和R9可合起来形成=0或环烷基,或任何两个 相邻R8基团可合起来形成环烷基。另外,包括以下具有式(XVI)结构的氨基酸RiHN C(O)Ri(χν])其中A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷基、经 取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂烷基、经取代亚杂烧 基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经取代亚芳基、亚杂芳基、经取代亚 杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷基或经取代亚芳烷基;R为H、烷基、经取代烷基、环烷基或经取代环烷基;R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并且R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸;X1为C、S或S(O);并且L为亚烷基、经取代亚烷基、N(R')(亚烷基)或N(R') (经取代亚烷基),其中R'为H、烷基、经取代烷基、环烷基或经取代环烷基。另外,包括以下具有式(XVI-A)结构的氨基酸
0. 0
C《0)R2(XVI-A)
其中
A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷基、经 取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂烷基、经取代亚杂烧 基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经取代亚芳基、亚杂芳基、经取代亚 杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷基或经取代亚芳烷基;R为H、烷基、经取代烷基、环烷基或经取代环烷基;R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并且R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸;L为亚烷基、经取代亚烷基、N(R')(亚烷基)或N(R')(经取代亚烷基),其中 R'为H、烷基、经取代烷基、环烷基或经取代环烷基。另外,包括以下具有式(XVI-B)结构的氨基酸
0
A
61
A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷基、经 取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂烷基、经取代亚杂烧 基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经取代亚芳基、亚杂芳基、经取代亚 杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷基或经取代亚芳烷基;R为H、烷基、经取代烷基、环烷基或经取代环烷基;R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并且R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸;L为亚烷基、经取代亚烷基、N(R')(亚烷基)或N(R')(经取代亚烷基),其中 R'为H、烷基、经取代烷基、环烷基或经取代环烷基。
另外,包括具有式(XVII)结构的氨基酸
,O
(XVIT)其中A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷基、经 取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂烷基、经取代亚杂烧 基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经取代亚芳基、亚杂芳基、经取代亚 杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷基或经取代亚芳烷基;M为_C(R3 )_、
㈨(b)
^Cjtt Ki^w/ I
A—cw-l (bJc=cr;
OO^ h R4 (a) % 、
(b)
(fa)
TI S
(b) (b)
(b) ^c-o~| (b)C—S—I (b)
(a) ^ (a) % Rf
、 、 、
(b) Λ/
"pi lb>m其中(a)表示与A基
ΛΑΛ
00 或⑷ ,
团键结,并且(b)表示与各自的羰基键结,R3和R4独立地选自H、卤素、烷基、经取代烷基、环
Rt JSr
(a)
CN 101918026 A
说 明 书60/148页
R
1V0
k
R
A
62烷基或经取代环烷基,或R3和R4或两个R3基团或两个R4基团任选地形成环烷基或杂环烷 基;
R为H、商素、烷基、经取代烷基、环烷基或经取代环烷基;
T3为键、C(R) (R)、0或S,并且R为H、卤素、烷基、经取代烷基、环烷基或经取代环
烧基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并且 R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸。 另外,包括具有式(XVIII)结构的氨基酸
(XVIII),其中M
(a) ^ H, R4
为
(b) ΛΛΛ
I、—
R
:c、一I (b> ^ 、
ιΛ/V f
(b) ιΛΛΛ
I
,Ms-
\z \ (a)、 a
(b> , X—S—S
(b)
R3
“H)、
(b)
C=C—| (b)
R4
ιΛ/V*
(a)
O—C—ξ (b)
ιΛΛΛ (β)
或
—C—ξ (b)
*ΛΛΛ
(a)
其中(a)表示与A基
团键结,并且(b)表示与各自的羰基键结,R3和R4独立地选自H、卤素、烷基、经取代烷基、环 烷基或经取代环烷基,或R3和R4或两个R3基团或两个R4基团任选地形成环烷基或杂环烷 基;
R为H、商素、烷基、经取代烷基、环烷基或经取代环烷基;
T3为键、C(R) (R)、0或S,并且R为H、卤素、烷基、经取代烷基、环烷基或经取代环
烧基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核苷酸;并且 R2是任选的,并且当存在时为0H、酯保护基、树脂、氨基酸、多肽或多核苷酸; Ra是各独立地选自由H、卤素、烷基、经取代烷基、-N(R' )2,-C (O)kR'(其中k为
1、2或3)、-C(0)N(R' )2、-0R'和-S(O)kR'组成的群组,其中R'各独立地为H、烷基或经 取代烷基。另外,包括具有式(XIX)结构的氨基酸
63(XIX),其中R为H、商素、烷基、经取代烷基、环烷基或经取代环烷基;并且T3 为 0 或 S。另外,包括具有式(XX)结构的氨基酸在一些实施例中,以化学方式修饰包含非天然氨基酸的多肽以产生反应性羰基或 二羰基官能团。举例来说,可由具有相邻氨基和羟基的官能团产生可用于结合反应的醛官 能团。当生物活性分子为多肽时,例如可使用N端丝氨酸或苏氨酸(其可正常存在,或可 通过化学或酶促消化而暴露)在温和的氧化裂解条件下使用高碘酸盐产生醛官能团。例 如参见 Gaertner 等人,Bioconjug. Chem. 3 :262_268 (1992) ;Geoghegan, K.禾口 Stroh,J., Biocon jug. Chem. 3 138-146 (1992) ;Gaertner 等人,J. Biol. Chem. 269 :7224_7230 (1994)。 然而,所属领域中已知的方法局限于肽或蛋白质的N端氨基酸。在本发明中,带有相邻羟基和氨基的非天然编码氨基酸可作为“经掩蔽”的醛官能 团并入多肽中。举例来说,5-羟基赖氨酸带有与ε胺相邻的羟基。用于产生醛的反应条件 通常涉及在温和条件下添加摩尔过量的偏高碘酸钠,以避免在多肽内的其它位点处发生氧 化。氧化反应的PH值通常为约7. O。典型反应涉及向多肽的缓冲溶液中添加约1.5摩尔过 量的偏高碘酸钠,接着在黑暗环境中培育约10分钟。例如参见美国专利第6,423,685号。羰基或二羰基官能团可在温和条件下在水溶液中与含羟胺的试剂选择性反应,
(XX),其中R为H、商素、烷基、经取代烷基、环烷基或经取代环烷基。另外,包括以下具有式(XXI)结构的氨基酸从而形成在生理条件下稳定的相应肟键。例如参见Jencks,W. P.,J.Am. Chem. Soc. 81, 475-481(1959) ;Shao, J.和 Tam,J. P.,J. Am. Chem. Soc. 117 :3893_3899 (1995)。此夕卜, 羰基或二羰基的独特反应性允许在存在其它氨基酸侧链的情况下进行选择性修饰。例 如参见 Cornish,V. W.等人,J. Am. Chem. Soc. 118 8150-8151 (1996) ;Geoghegan, K. F.和 Stroh, J. G. , Bioconjug. Chem. 3 138-146 (1992) ;Mahal, L. K.等人,Science 276 1125-1128(1997)。非天然氨基酸的结构与合成含羟胺的氨基酸美国专利申请案第11/316,534号(美国公开案第20060189529号)是以全文引用 的方式并入本文中。因此,美国专利申请案第11/316,534号(美国公开案第20060189529 号)中的第 V 章(标题为 “Non-natural Amino Acids”B 部分(标题为 “Structure and Synthesis of Non-Natural Amino Acids :HydroxyIamine-ContainingAmino Acids,,)中 所提供的揭示内容完全适用于制备、纯化、表征和使用本文中所述的非天然氨基酸、非天 然氨基酸多肽和经修饰的非天然氨基酸多肽的方法、组合物(包括式I-XXXV)、技术和策 略,其应用程度就如同所述揭示内容完全呈现于本文中。美国专利公开案第2006/0194256 号、第 2006/0217532 号和第 2006/0217289 号以及标题为 “Compositions containing, methods involving, and usesof non-natural amino acid s and polypeptides,,白勺 WO 2006/069246也是以全文引用的方式并入本文中。非天然氨基酸的化学合成适用于本发明中的多种非天然氨基酸可购自例如Sigma(USA)或 Aldrich(Milwaukee, WI,USA)。无法购得的非天然氨基酸是任选地如本文中所提供或如各 种公幵案中所提供而合成,或使用所属领域的技术人员已知的标准方法合成。关于有机合 成技术,例如参见 Fessendon 禾口 Fessendon,Organic Chemistry, (1982,第 2 版,Willard Grant Press,Boston Mass. ) ;March,Advanced Organic Chemistry(第 3 片反,1985, Wiley and Sons,New York);以及 Carey 禾口 Sundberg,Advanced OrganicChemistry (第 3版,A和B部分,1990,Plenum Press, New York)。描述非天然氨基酸合成的其它 公开案包括例如标题为“In vivo incorporation of Unnatural AminoAcids,,的 WO 2002/085923 ;Matsoukas 等人,(1995) J. Med. Chem.,38,4660-4669 ;King,F. Ε.和 Kidd, D. Α. Α. (1949) A New Synthesis of Glutamine and of γ -Dipeptides of Glutamic Acid from Phthylated Intermediates,J. Chem. Soc,3315-3319 ;Friedman, 0. M.禾口 Chatterrji,R. (1959)Synthesis of Derivatives ofGlutamine as Model Substrates for Anti-Tumor Agents. J. Am. Chem. Soc. 81,3750-3752 ;Craig, J. C.等 人,(1988)Absolute Configuration of the Enantiomers of7-Chloro_4[[4_(diethy 1amino)-1-methylbutyl]amino]quinoline(Chloroquine). J. Org. Chem. 53,1167-1170 ; Azoulay, Μ. , Vilmont, Μ.禾口 Frappier, F. (1991)Glutamineanalogues as Potential Antimalarials, . Eur. J. Med. Chem. 26,201—5 ;Koskinen,A. M. P.禾口 Rapoport,H. (1989) Synthesis of 4—Substituted Prolines as ConformationallyConstrained Amino Acid Analogues. J. Org. Chem. 54,1859—1866 ;Christie,B. D.禾口 Rapoport, H. (1985) Synthesis of Optically Pure Pipecolates from L-Asparagine. Application to the Total Synthesis of(+)-Apovincamine through Amino AcidDecarbonylation andIminium Ion Cyclization. J. Org. Chem. 50 1239-1246 ;Barton ^ 人,(1987) Synthesis of Novel alpha-Amino—Acids and Derivatives Using RadicalChemistry :Synthesis of L-and D-alpha-Amino—Adipic Acids, L-alpha—aminopimeIicAcid and Appropriate Unsaturated Derivatives. Tetrahedron 43 :4297_4308 ;以及 Subasinghe 等人,(1992) Quisqualic acid analogues -synthesis of beta-heterocyclic2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitizedsite. J. Med. Chem. 35 4602-7 还参见标题为“Protein Arrays”的美国专利公开案第US 2004/0198637 号,其是以引用的方式并入本文中。A.羰基反应性基团具有羰基反应性基团的氨基酸允许多种通过亲核加成或醇醛缩合反应连接分子 (包括(但不限于)PEG或其它水溶性分子)的反应。示范性含羰基的氨基酸可如下表示
(CH2)rtR1COR2 R3HN COR4其中η为0-10 为烷基、芳基、经取代烷基或经取代芳基;R2为H、烷基、芳基、经 取代烷基和经取代芳基;并且R3为H、氨基酸、多肽或氨基端修饰基团,并且R4为H、氨基酸、 多肽或羧基端修饰基团。在一些实施例中,η为1,R1为苯基并且R2为简单烷基(即甲基、 乙基或丙基),并且酮部分位于相对于烷基侧链的对位。在一些实施例中,η为LR1为苯基 并且R2为简单烷基(即甲基、乙基或丙基),并且酮部分位于相对于烷基侧链的间位。对乙酰基-(+/_)-苯丙氨酸和间乙酰基-(+/_)-苯丙氨酸的合成描述于Zhang, Ζ.等人,Biochemistry 42 =6735-6746 (2003)中,其是以引用的方式并入本文中。所属领域 的技术人员可类似地制备其它含羰基的氨基酸。在一些实施例中,以化学方式修饰包含非天然编码氨基酸的多肽以产生反应性 羰基官能团。举例来说,可由具有相邻氨基和羟基的官能团产生可用于结合反应的醛官 能团。当生物活性分子为多肽时,例如可使用N端丝氨酸或苏氨酸(其可正常存在,或可 通过化学或酶促消化而暴露)在温和的氧化裂解条件下使用高碘酸盐产生醛官能团。例 如参见 Gaertner 等人,Bioconjug. Chem. 3 :262_268 (1992) ;Geoghegan, K.禾口 Stroh,J., Bioconjug. Chem. 3 138-146 (1992) ;Gaertner 等人,J. Biol. Chem. 269 :7224_7230 (1994)。 然而,所属领域中已知的方法局限于肽或蛋白质的N端氨基酸。在本发明中,带有相邻羟基和氨基的非天然编码氨基酸可作为“经掩蔽”的醛官能 团并入多肽中。举例来说,5-羟基赖氨酸带有与ε胺相邻的羟基。用于产生醛的反应条件 通常涉及在温和条件下添加摩尔过量的偏高碘酸钠,以避免在多肽内的其它位点处发生氧 化。氧化反应的PH值通常为约7. O。典型反应涉及向多肽的缓冲溶液中添加约1.5摩尔过 量的偏高碘酸钠,接着在黑暗环境中培育约10分钟。例如参见美国专利第6,423,685号, 其是以引用的方式并入本文中。羰基官能团可在温和条件下在水溶液中与含胼、酰胼、羟胺或氨基脲的试剂选择 性反应,以分别形成在生理条件下稳定的相应腙、肟或缩氨基脲(semicarbazone)键。例如 参见 Jencks,W. P.,J. Am. Chem. Soc. 81,475-481 (1959) ; Shao, J.和 Tam,J. P.,J. Am. Chem.
66Soc. 117 :3893-3899 (1995)。此外,羰基的独特反应性允许在存在其它氨基酸侧链的情况下 进行选择性修饰。例如参见 Cornish,V. W.等人,J. Am. Chem. Soc. 118 8150-8151 (1996); Geoghegan, K. F.和 Stroh,J. G.,Bioconjug. Chem. 3 138-146 (1992) ;Mahal, L. K.等人, Science 276:1125-1128(1997)。B.胼、酰胼或氨基脲反应性基团含有亲核基团(例如胼、酰胼或氨基脲)的非天然编码氨基酸允许与多种亲电子 基团反应形成结合物(包括(但不限于)与PEG或其它水溶性聚合物反应)。示范性含胼、酰胼或氨基脲的氨基酸可如下表示 其中η为0-10 为烷基、芳基、经取代烷基或经取代芳基或不存在;X为0、N或 S或不存在;R2为H、氨基酸、多肽或氨基端修饰基团,并且R3为H、氨基酸、多肽或羧基端修 饰基团。在一些实施例中,η为4,R1不存在并且X为N。在一些实施例中,η为2,R1不存 在并且X不存在。在一些实施例中,η为1,R1为苯基,X为0,并且氧原子位于芳环上脂肪 族基团的对位。含酰胼、胼和氨基脲的氨基酸可获自商业来源。举例来说,L-谷氨酸_ □ _酰胼 可获自Sigma Chemical (St. Louis,M0)。无法购得的其它氨基酸可由所属领域的技术人员 制备。例如参见美国专利第6,281,211号,其是以引用的方式并入本文中。含有带有酰胼、胼或氨基脲官能团的非天然编码氨基酸的多肽可与多种含有醛或 具有类似化学反应性的其它官能团的分子有效并选择性地反应。例如参见Shao,J.和Tam, J.,J. Am. Chem. Soc. 117 =3893-3899(1995)。与20种常见氨基酸上存在的亲核基团(包括 (但不限于)丝氨酸或苏氨酸的羟基或赖氨酸的氨基以及N端)相比,酰胼、胼和氨基脲官 能团的独特反应性使其对醛、酮和其它亲电子基团的反应性显著更强。C.含氨氧基的氨基酸含有氨氧基(也被称作羟胺)的非天然编码氨基酸允许与多种亲电子基团反应 形成结合物(包括(但不限于)与PEG或其它水溶性聚合物反应)。如同胼、酰胼以及 氨基脲一样,氨氧基的增强的亲核性使其与多种含有醛或具有类似化学反应性的其它官 能团的分子有效并选择性地反应。例如参见Shao,J.和Tam,J.,J.Am. Chem. Soc. 117 3893-3899(1995) ;H. Hang 和 C. Bertozzi,Acc. Chem. Res. 34 :727_736 (2001)。尽管与胼基 团反应的结果为相应腙,但氨氧基与含羰基的基团(例如酮)的反应通常产生肟。示范性含氨氧基的氨基酸可如下表示 其中η为0-10 为烷基、芳基、经取代烷基或经取代芳基或不存在;X为0、N、S
67或不存在;m为0-10 ;Y = C(O)或不存在;R2为H、氨基酸、多肽或氨基端修饰基团,并且R3 为H、氨基酸、多肽或羧基端修饰基团。在一些实施例中,η为1,礼为苯基,X为0,m为1, 并且Y存在。在一些实施例中,η为2,R1和X不存在,m为0,并且Y不存在。含氨氧基的氨基酸可由可易于获得的氨基酸前体(高丝氨酸、丝氨酸以及苏氨 酸)制备。例如参见 M. Carrasco 和 R. Brown, J. Org. Chem. 68 :8853_8858 (2003)。某些含 氨氧基的氨基酸(例如L-2-氨基-4-(氨氧基)丁酸)已从天然来源分离(Rosenthal,G., Life Sci. 60:1635-1641 (1997))。其它含氨氧基的氨基酸可由所属领域的技术人员来制 备。D.叠氮化物和炔反应性基团叠氮化物和炔官能团的独特反应性使其极适用于多肽和其它生物分子的选择性 修饰。有机叠氮化物(尤其是脂肪族叠氮化物)以及炔通常对常见的反应性化学条件稳 定。具体来说,叠氮化物与炔官能团都对天然存在多肽中可见的20种常见氨基酸的侧链 (即R基团)呈惰性。然而,当叠氮化物和炔基团靠近时,其“弹簧加压(spring-loaded),, 性质显露,并且其通过休斯根[3+2]环加成反应选择性并有效地反应产生相应三唑。例 如参见 Chin J.等人,Science 301 :964_7(2003) ;Wang,Q.等人,J. Am. Chem. Soc. 125, 3192-3193 (2003) ;Chin, J. W.等人,J. Am. Chem. Soc. 124 :9026_9027 (2002)。因为休斯根环加成反应涉及选择性环加成反应(例如参见Padwa,Α., Comprehensive Organic Synthesis, H 4 (Trost, B. Μ. H, 1991),第 1069-1109 M ; Huisgen, R. , 1, 3-Dipolar Cycloaddition Chemistry, (Padwa, A.编,1984),第 1-176 页) 而非亲核取代,所以并入带有含叠氮基和含炔的侧链的非天然编码氨基酸使得所得多肽在 非天然编码氨基酸的位置处经选择性修饰。涉及含叠氮基或含炔的胰岛素多肽的环加成 反应可在室温下在水性条件下通过在催化量的用于将Cu(II)原位还原为Cu(I)的还原 剂存在下添加Cu(II)(包括(但不限于)呈催化量的CuSO4的形式)来进行。例如参见 Wang, Q.等人,J. Am. Chem. Soc. 125,3192-3193 (2003) ;Tornoe, C. W.等人,J. Org. Chem. 67 3057-3064(2002) ;Rostovtsev 等人,Angew. Chem. Int. Ed. 41 :2596_2599 (2002)。示范性还 原剂包括(包括(但不限于))抗坏血酸盐、金属铜、奎宁(quinine)、氢醌、维生素K、谷胱 甘肽、半胱氨酸、Fe2+、Co2+以及外加电位。在一些需要叠氮化物与炔之间的休斯根[3+2]环加成反应的情况下,胰岛素多肽 包含包括炔部分的非天然编码氨基酸并且欲与氨基酸连接的水溶性聚合物包含叠氮部分。 或者,也可进行逆向反应(即在氨基酸上具有叠氮部分并且在水溶性聚合物上存在炔部 分)。叠氮官能团也可与含有芳基酯并且经芳基膦部分适当官能化的水溶性聚合 物选择性地反应以产生酰胺键。芳基膦基团原位还原叠氮基,并且所得胺随后与最接 近的酯键有效反应以产生相应酰胺。例如参见E. Saxon和C.Bertozzi,Science287, 2007-2010(2000)。含叠氮基的氨基酸可为烷基叠氮化物(包括(但不限于)2-氨基-6-叠 氮基-ι-己酸)或芳基叠氮化物(对叠氮基_苯丙氨酸)。含有芳基酯和膦部分的示范性水溶性聚合物可如下表示
其中X可为0、N、S或不存在,Ph为苯基,W为水溶性聚合物并且R可为H、烷基、 芳基、经取代烷基和经取代芳基。示范性R基团包括(但不限于)-CH2、-C(CH3)3、-OR'、-N R' R〃、-SR'、-卤素、-C(O)R' ,-CONR' R" ,-S(O)2R'、-S(O)2NR' R"、-CN 以及 _N02。 R'、R〃、R〃 ‘和R〃 “各独立地指代氢、经取代或未经取代杂烷基、经取代或未经取代芳 基(包括(但不限于)经1-3个卤素取代的芳基)、经取代或未经取代烷基、烷氧基或硫烷 氧基或芳基烷基。举例来说,当本发明的化合物包括一个以上R基团时,各R基团是独立地 经选择,而当存在R'、R〃、R〃 ‘和R〃 ‘‘基团中的一者以上时,这些基团同样是各独立地 经选择。当R'和R"与同一氮原子连接时,其可与氮原子组合形成5元、6元或7元环。举 例来说,-NR' R"打算包括(但不限于)1-吡咯烷基和4-吗啉基。根据对取代基的上述论 述,所属领域的技术人员应了解术语“烷基”打算包括包含与除氢基之外的基团结合的碳原 子的基团,例如卤烷基(包括(但不限于)-CFjn-CH2CF3)和酰基(包括(但不限于)-C(O) CH3、-C (0) CF3、-C (0) CH2OCH3 等)。叠氮官能团也可与含有硫酯并且经芳基膦部分适当官能化的水溶性聚合物选择 性地反应以产生酰胺键。芳基膦基团原位还原叠氮基,并且所得胺随后与硫酯键有效反应 以产生相应酰胺。含有硫酯和膦部分的示范性水溶性聚合物可如下表示
S X Ph2P(H2C)l广 丫、W
O其中η为1-10 ;X可为0、N、S或不存在,Ph为苯基,且W为水溶性聚合物。示范性含炔的氨基酸可如下表示
(CH2)nR1X(CH2)mCCH R2HN ^COR3其中η为0-10 为烷基、芳基、经取代烷基或经取代芳基或不存在;X为0、N、S 或不存在;m为0-10,R2为H、氨基酸、多肽或氨基端修饰基团,并且R3为H、氨基酸、多肽或 羧基端修饰基团。在一些实施例中,η为1,R1为苯基,X不存在,m为0并且乙炔部分位于 相对于烷基侧链的对位。在一些实施例中,η为1,R1为苯基,X为0,m为1并且炔丙基氧 基位于相对于烷基侧链的对位(即0-炔丙基-酪氨酸)。在一些实施例中,η为1,R1和X 不存在且m为0 (即炔丙基甘氨酸)。含炔的氨基酸在市面上有售。举例来说,炔丙基甘氨酸可购自 Peptech(Burlington,MA)。或者,可根据标准方法来制备含炔的氨基酸。举例来说,例如可 如 Deiters,A.等人,J. Am. Chem. Soc. 125 :11782_11783 (2003)中所述来合成对炔丙基氧基 苯丙氨酸,并且可如Kayser,B.等人,Tetrahedron 53(7) =2475-2484 (1997)中所述来合成 4-炔基-L-苯丙氨酸。所属领域的技术人员可制备其它含炔的氨基酸。示范性含叠氮基的氨基酸可如下表示
69 其中η为0-10 为烷基、芳基、经取代烷基、经取代芳基或不存在;X为0、N、S或 不存在;m为0-10 ;R2为H、氨基酸、多肽或氨基端修饰基团,并且R3为H、氨基酸、多肽或羧 基端修饰基团。在一些实施例中,η为1,R1为苯基,X不存在,m为0并且叠氮部分位于烷 基侧链的对位。在一些实施例中,η为0-4并且R1和X不存在,并且m = 0。在一些实施例 中,η为LR1为苯基,X为0,m为2并且β叠氮基乙氧基部分位于相对于烷基侧链的对位。含叠氮基的氨基酸可获自商业来源。举例来说,4-叠氮基苯丙氨酸可获自 Chem-Impex International, Inc. (Wood Dale, IL)。对于无法购得的含叠氮基的氨基酸, 可相对容易地使用所属领域的技术人员已知的标准方法来制备叠氮基,所述方法包括(但 不限于)通过置换合适的离去基(包括(但不限于)卤离子、甲磺酸根、甲苯磺酸根)或通 过打开经适当保护的内酯。例如参见March,AdvancedOrganic Chemistry (第3版,1985, Wiley and Sons, New York)。Ε.氨基硫醇反应性基团β取代的氨基硫醇官能团的独特反应性使其极其适用于通过形成噻唑烷来选择 性修饰含有醛基的多肽和其它生物分子。例如参见J. Shao和J. Tam,J. Am. Chem. Soc. 1995, 117(14)3893-3899。在一些实施例中,β取代的氨基硫醇氨基酸可并入胰岛素多肽中并且 随后与包含醛官能团的水溶性聚合物反应。在一些实施例中,水溶性聚合物、药物结合物或 其它有效负载可通过形成噻唑烷而与包含β取代的氨基硫醇氨基酸的胰岛素多肽偶合。F.其它反应性基团以下专利申请案中描述可并入本发明的胰岛素多肽中的其它反应性基团和非天 然编码氨基酸(包括(但不限于)对氨基-苯丙氨酸),所述专利申请案都是以全文引用 的方式并入本文中美国专利公开案第2006/0194256号;美国专利公开案第2006/0217532 号;美国专利公开案第2006/0217289号;美国临时专利第60/755,338号;美国临时专利 第60/755,711号;美国临时专利第60/755,018号;国际专利申请案第PCT/US06/49397 号;WO 2006/069246 ;美国临时专利第60/743, 041号;美国临时专利第60/743, 040号; 国际专利申请案第PCT/US06/47822号;美国临时专利第60/882,819号;美国临时专利第 60/882,500号;和美国临时专利第60/870,594号。这些申请案还论述可存在于PEG或其 它聚合物上的反应性基团,包括(但不限于)结合用羟胺基(氨氧基)。非天然氨基酸的细胞摄取细胞对非天然氨基酸的摄取为设计并选择(包括(但不限于))用于并入蛋白质 中的非天然氨基酸时通常考虑的一个问题。举例来说,α-氨基酸的高电荷密度表明这些 化合物不可能为细胞可渗透的。通过以蛋白质为基础的转运系统的集合将天然氨基酸吸 收到真核细胞中。可进行快速筛选以评估哪些非天然氨基酸(如果存在)是由细胞吸收。 例如参见例如标题为“Protein Arrays”的美国专利公开案第US 2004/0198637号(其是 以引用的方式并入本文中)以及 Liu,D.R.和 Schultz,P. G. (1999)Progress toward the evolution of an organism with an expanded geneticcode. PNAS United States 96 4780-4785中的毒性测定。尽管通过各种测定可容易地分析摄取,但设计适用于细胞摄取途
70径的非天然氨基酸的替代方案为提供在活体内产生氨基酸的生物合成途径。非天然氨基酸的生物合成许多生物合成途径已存在于细胞中以用于产生氨基酸和其它化合物。自然界(包 括(但不限于)细胞)中可能不存在特定非天然氨基酸的生物合成方法,但本发明提供所 述方法。举例来说,任选地通过添加新酶或改变现有宿主细胞途径而在宿主细胞中产生非 天然氨基酸的生物合成途径。其它新酶任选地为天然存在的酶或人工开发的酶。举例来说, 对氛基苯丙氛酸的生物合成(如在标题为“In vivoincorporation of unnatural amino acids”的WO 2002/085923中的实例中所呈现)依赖来自其它生物体的已知酶的组合的加 入。可通过利用包含这些酶的基因的质粒转化细胞而将所述基因引入真核细胞中。当在细 胞中表达时,所述基因提供合成所需化合物的酶促途径。任选地添加的酶类型的实例提供 于下文实例中。其它酶序列可见于例如Genbank中。人工开发的酶也任选地以相同方式添 加到细胞中。以此方式操纵细胞的细胞机构和资源以产生非天然氨基酸。多种方法可用于产生用于生物合成途径中或用于发展现有途径的新颖酶。举例来 说,任选地使用包括(但不限于)如MaXygen,InC·(可通过万维网在maxygen. com上获得) 所开发的递归重组来开发新颖酶和途径。例如参见Stemmer (1994),Rapid evolution of a protein in vitro by DNA shuffling, Nature370 (4) :389_391 ;以及 Stemmer,(1994), DNA shuffling by random fragmentation andreassembly :In vitro recombination for molecular evolution, Proc. Natl. Acad. Sci. USA.,91 :10747-10751。类似地,任选地将 Genencor (可通过万维网在genencor. com上获得)所开发的DesignPath 用于代谢途径 工程改造,包括(但不限于)工程改造在细胞中产生0-甲基-L-酪氨酸的途径。这项技术 使用新基因(包括(但不限于))经由功能基因组学以及分子进化和设计所鉴别的基因) 的组合在宿主生物体中重建现有途径。Diversa公司(可通过万维网在diversa. com上获 得)还提供快速筛选基因文库和基因途径的技术,从而包括(但不限于)建立新途径。通常,由本发明的工程改造过的生物合成途径产生的非天然氨基酸是以足以进行 有效蛋白质生物合成(包括(但不限于)天然细胞量),但未达到影响其它氨基酸的浓度 或耗尽细胞资源的程度的浓度产生。以此方式在活体内产生的典型浓度为约IOmM到约 0. 05mM。在利用包含用于产生特定途径所需的酶的基因的质粒转化细胞并产生非天然氨基 酸后,任选地使用活体内选择以针对核糖体蛋白质合成和细胞生长进一步优化非天然氨基 酸的产生。具有非天然氨基酸的多肽可出于多种目的并入非天然氨基酸,所述目的包括(但不限于)调整蛋白质结构 和/或功能的改变;改变尺寸、酸度、亲核性、氢键结、疏水性、蛋白酶标靶位点的可接近性; 靶向部分(包括(但不限于)对于蛋白质阵列);添加生物活性分子;连接聚合物;连接放 射性核素;调节血清半衰期;调节组织渗透(例如肿瘤);调节主动转运;调节组织、细胞或 器官特异性或分布;调节免疫原性;调节蛋白酶抗性等。包括非天然氨基酸的蛋白质可具 有增强或甚至全新的催化或生物物合理质。举例来说,任选地通过在蛋白质中包括非天然 氨基酸来改良以下性质毒性、生物分布、结构性质、光谱性质、化学和/或光化学性质、催 化能力、半衰期(包括(但不限于)血清半衰期)、与其它分子反应的能力(包括(但不限 于)共价或非共价)等。包括包含至少一个非天然氨基酸的蛋白质的组合物适用于(包括(但不限于))新颖治疗剂、诊断剂、催化酶、工业酶、结合蛋白(包括(但不限于)抗体)以 及(包括(但不限于))蛋白质结构和功能的研究。例如参见Dougherty,(2000) Unnatural Amino Acids as Probes of Protein Structure and Function, CurrentOpinion in Chemical Biology,4 :645_652。在本发明的一方面,组合物包括至少一种具有至少一个(包括(但不限于)至少 两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个 或十个以上)非天然氨基酸的蛋白质。非天然氨基酸可相同或不同,包括(但不限于)在 蛋白质中可存在1、2、3、4、5、6、7、8、9或10或10个以上不同位点,其包含1、2、3、4、5、6、7、 8、9或10或10个以上不同的非天然氨基酸。另一方面,组合物包括蛋白质中存在的至少一 个(但少于全部)特定氨基酸经非天然氨基酸取代的蛋白质。对于具有一个以上非天然氨 基酸的给定蛋白质来说,非天然氨基酸可相同或不同(包括(但不限于)所述蛋白质可包 括两个或两个以上不同类型的非天然氨基酸,或可包括两个相同的非天然氨基酸)。对于具 有两个以上非天然氨基酸的给定蛋白质来说,非天然氨基酸可相同、不同或为相同种类的 多个非天然氨基酸与至少一个不同的非天然氨基酸的组合。所关注的具有至少一个非天然氨基酸的蛋白质或多肽为本发明的特征。本发明还 包括使用本发明的组合物和方法产生的具有至少一个非天然氨基酸的多肽或蛋白质。赋形 剂(包括(但不限于)医药学上可接受的赋形剂)也可与蛋白质一起存在。通过在真核细胞中利用至少一个非天然氨基酸来产生所关注蛋白质或多肽,蛋白 质或多肽通常应包括真核生物翻译后修饰。在某些实施例中,蛋白质包括至少一个非天然 氨基酸和至少一个由真核细胞在活体内进行的翻译后修饰,其中所述翻译后修饰并非由原 核细胞进行。举例来说,翻译后修饰包括(包括(但不限于))乙酰化、酰化、脂质修饰、 棕榈酰化、棕榈酸盐加成、磷酸化、糖脂键修饰、糖基化等。一方面,翻译后修饰包括通过 GlcNAc-天冬酰胺键使寡糖(包括(但不限于)(GlcNAc-Man) 2-Man-GlcNAc-GlcNAc)与天 冬酰胺连接。参见表1,其列出真核生物蛋白的N-连接寡糖的一些实例(也可存在其它 未绘示的残基)。另一方面,翻译后修饰包括通过GalNAc-丝氨酸或GalNAc-苏氨酸键或 GlcNAc-丝氨酸或GlcNAc-苏氨酸键使寡糖(包括(但不限于)Gal-GalNAc、Gal-GlcNAc 等)与丝氨酸或苏氨酸连接。表1 通过GIcNAC键连接的寡糖的实例
72 另一方面,翻译后修饰包括前体(包括(但不限于)降血钙素前体、降血钙素基因 相关肽前体、前甲状旁腺激素原(pr印roparathyroid hormone)、前胰岛素原、胰岛素原、前 阿黑皮素原(pr印roopiomelanocortin)、阿黑皮素原等)的蛋白水解加工,组装成多亚单 位蛋白或大分子组装物,翻译到细胞中的另一位点中(包括(但不限于)翻译到例如内质 网、高尔基体(Golgi apparatus)、核、溶酶体、过氧化物酶体、线粒体、叶绿体、液泡等细胞 器中,或通过分泌途径)。在某些实施例中,蛋白质包含分泌或定位序列、表位标签、FLAG标 签、聚组氨酸标签、GST融合体等。非天然氨基酸的一个优点在于,其提供可用于添加其它分子的其它化学部分。这 些修饰可在真核细胞或非真核细胞中活体内进行或在活体外进行。因此,在某些实施例 中,翻译后修饰是通过非天然氨基酸进行。举例来说,翻译后修饰可通过亲核-亲电子反 应进行。目前用于蛋白质的选择性修饰的大多数反应涉及亲核与亲电子反应搭配物之间 的共价键形成,包括(但不限于)α -卤代酮与组氨酸或半胱氨酸侧链的反应。在这些情 况下,选择性是由蛋白质中亲核残基的数目和可接近性决定。在本发明的蛋白质中,可在 活体外以及活体内使用其它选择性更大的反应,例如非天然酮基氨基酸与酰胼或氨氧基化 合物的反应。例如参见 Cornish 等人,(1996) J. Am. Chem. Soc,118 :8150_8151 ;Mahal 等 人,(1997)Science,276 :1125-1128;Wang 等人,(2001)Science 292 :498_500 ;Chin 等 人,(2002) J. Am. Chem. Soc. 124 :9026_9027 ;Chin 等人,(2002) Proc. Natl. Acad. Sci. · 99 11020-11024 ;Wang 等人,(2003) Proc. Natl. Acad. Sci.,100 56-61 ;Zhang 等人,(2003) Biochemistry, 42 :6735_6746 ;以及 Chin 等人,(2003) Science, 301 :964_7,所述文献都是 以引用的方式并入本文中。这允许用包括荧光团、交联剂、糖类衍生物以及细胞毒性分子 的大量试剂选择性标记几乎任何蛋白质。还参见标题为“Glycoprotein synthesis"的美 国专利第6,927,042号,其是以引用的方式并入本文中。包括(但不限于)通过叠氮基氨 基酸进行的翻译后修饰也可通过施陶丁格连接反应(Staudinger ligation)(包括(但不 限于)用三芳基膦试剂)进行。例如参见Kiick等人,(2002) Incorporation of azides into recombinant proteins forchemoselective modification by the Staudinger ligation, PNAS 99 :19_24。本发明提供选择性修饰蛋白质的另一种极为有效的方法,其涉及响应选择密码子
73而将非天然氨基酸(包括(但不限于)含有叠氮基或炔基部分)遗传并入蛋白质中。然后, 可通过包括(但不限于)休斯根[3+2]环加成反应(例如参见Padwa,Α.,Comprehensive Organic Synthesis,H 4 (1991)Trost, B. Μ. H, Pergamon, Oxford,H 1069-1109 M ; 禾口 Huisgen, R. ,1,3-Dipolar Cycloaddition Chemistry, (1984)Padwa, A.编,Wiley, New York,第1-176页)分别用包括(但不限于)炔基或叠氮衍生物来修饰这些氨基酸侧链。 因为此方法涉及环加成而非亲核取代,所以可以极高选择性修饰蛋白质。可在室温下在水 性条件下通过向反应混合物中添加催化量的Cu⑴盐而以极佳区域选择性(1,4 > 1,5)进 行此反应。例如参见 Tornoe 等人,(2002) J. Org. Chem. 67 3057-3064 ;以及 Rostovtsev 等 人,(2002) Angew. Chem. Int. Ed. 41 :2596_2599。可使用的另一方法为在双砷化合物上用四 半胱氨酸基元进行配体交换,例如参见Griffin等人,(1998) Science 281:269-272。可通过[3+2]环加成而加成到本发明的蛋白质中的分子包括具有叠氮基或炔基 衍生物的几乎任何分子。这些分子包括(但不限于)染料、荧光团、交联剂、糖类衍生物、聚 合物(包括(但不限于)聚乙二醇的衍生物)、光交联剂、化学毒性化合物、亲和性标记、生 物素衍生物、树脂、珠粒、第二蛋白质或多肽(或更多)、多核苷酸(包括(但不限于)DNA、 RNA等)、金属螯合剂、辅因子、脂肪酸、碳水化合物等。这些分子可分别加成到具有炔基的 非天然氨基酸(包括(但不限于)对炔丙基氧基苯丙氨酸)或具有叠氮基的非天然氨基酸 (包括(但不限于)对叠氮基_苯丙氨酸)中。包含非天然编码氨基酸的胰岛素多肽的活体内产生可使用经修饰的tRNA和tRNA合成酶在活体内产生本发明的胰岛素多肽,以添加 无法在天然存在的系统中编码的氨基酸或用所述氨基酸取代。使用天然存在的系统中无法编码的氨基酸来产生tRNA和tRNA合成酶的方法是描 述于例如美国专利第7,045,337号和第7,083,970号中,所述专利是以引用的方式并入本 文中。这些方法涉及产生独立于翻译系统的内源性合成酶和tRNA起作用(且因此有时被称 作“正交”)的翻译机构。通常,翻译系统包含正交tRNA(O-tRNA)以及正交氨酰基tRNA合 成酶(O-RS)。通常,O-RS在翻译系统中优先利用至少一种非天然存在氨基酸使Ο-tRNA氨 酰化且Ο-tRNA识别至少一个不被系统中的其它tRNA识别的选择密码子。因此,翻译系统 响应经编码的选择密码子而将非天然编码氨基酸插入系统中所产生的蛋白质中,从而“取 代”氨基酸使其进入编码多肽的某一位置中。所属领域中已描述用于将特定合成氨基酸插入多肽中的多种正交tRNA和氨酰基 tRNA合成酶,并且其通常适用于本发明中。举例来说,酮基特异性Ο-tRNA/氨酰基-tRNA 合成酶是描述于 Wang,L.等人,Proc. Natl. Acad. Sci. USA 100:56-61(2003)以及 Zhang, Ζ.等人,Biochem. 42(22) =6735-6746 (2003)中。示范性O-RS或其部分是由多核苷酸序列 编码并且包括美国专利第7,045,337号和第7,083,970号中所揭示的氨基酸序列,所述专 利各以引用的方式并入本文中。与O-RS —起使用的相应Ο-tRNA分子也描述于美国专利第 7,045,337号和第7,083,970号中,所述专利是以引用的方式并入本文中。Ο-tRNA/氨酰 基-tRNA合成酶对的其它实例描述于WO 2005/007870,WO 2005/007624和WO 2005/019415 中。叠氮基特异性Ο-tRNA/氨酰基-tRNA合成酶系统的实例描述于Chin,J. W.等人, J, Am. Chem. Soc. 124 9026-9027 (2002)中。对叠氮基-L-Phe 的示范性 O-RS 序列包括(但不限于)如美国专利第7,083,970号(其以引用的方式并入本文中)中所揭示的核苷酸序 列SEQ ID NO 14-16和29-32以及氨基酸序列SEQ ID NO :46_48和61-64。适用于本发明 中的示范性Ο-tRNA序列包括(但不限于)如美国专利第7,083,970号(其以引用的方式 并入本文中)中所揭示的核苷酸序列SEQ IDNO :1-3。对特定非天然编码氨基酸具特异性 的Ο-tRNA/氨酰基-tRNA合成酶对的其它实例描述于美国专利第7,045,337号(其以引用 的方式并入本文中)中。在酿酒酵母中并入含酮基与含叠氮基的氨基酸的O-RS和0-tRNA 描述于 Chin,J. W.等人,Science 301:964-967(2003)中。已报道若干种其它正交对。已描述用于将非天然氨基酸潜在地并入大肠杆菌 中的来源于酿酒酵母tRNA和合成酶的谷氨酰胺酰基(例如参见Liu,D.R.和Schultz, P. G. (1999) Proc. Natl. Acad. Sci. U. S. Α. 96 :4780_4785)、天冬氨酰基(例如参见 Pastrnak, Μ.等人,(2000) Helv. Chim. Acta 83:2277-2286)和酪氨酰基(例如参见 Ohno, S.等人,(1998) J. Biochem. (Tokyo,Jpn.) 124 1065-1068 ;以及 Kowal,A. K.等人,(2001) Proc. Natl. Acad. Sci. U. S. Α. 98 =2268-2273)系统。已描述用于酿酒酵母的来源于大肠 杆菌谷氨酰胺酰基(例如参见 Kowal,Α. K.等人,(2001) Proc. Natl. Acad. Sci. U. S. Α. 98 2268-2273)和酪氨酰基(例如参见 Edwards,H.和 Schimmel,P. (1990)Mol. Cell. Biol. 10 1633-1641)合成酶的系统。大肠杆菌酪氨酰基系统已用于在哺乳动物细胞中活体内并入 3-碘-L-酪氨酸。参见 Sakamoto. K..等人,(2002) Nucleic Acids Res. 30 :4692_4699。0-tRNA/氨酰基-tRNA合成酶的使用涉及选择编码非天然编码氨基酸的特定密码 子。尽管可使用任何密码子,但通常希望选择在表达Ο-tRNA/氨酰基-tRNA合成酶的细胞 中很少或从未使用的密码子。举例来说,示范性密码子包括无义密码子(例如终止密码子 (琥珀、赭石和蛋白石))、四个或四个以上碱基的密码子以及很少使用或未使用过的其它 天然三碱基密码子。可使用所属领域中已知的诱变方法(包括(但不限于)位点特异性诱变、盒式诱 变、限制选择诱变等)将特定的选择密码子引入胰岛素多核苷酸编码序列的适当位置中。用于产生可用于并入非天然编码氨基酸的蛋白质生物合成机构的组分(例 如O-RS, Ο-tRNA以及正交0-tRNA/0-RS对)的方法描述于Wang,L.等人,Science292 498-500(2001) ; Chin, J. W.等人,J.Am. Chem. Soc. 124 :9026_9027 (2002) ; Zhang, Ζ.等人, Biochemistry 42 :6735_6746 (2003)中。用于活体内并入非天然编码氨基酸的方法和组 合物描述于美国专利第7,045,337号中,所述专利是以引用的方式并入本文中。用于选择 用于生物体的活体内翻译系统中的正交tRNA-tRNA合成酶对的方法也描述于美国专利第 7,045,337号和美国专利第7,083,970号中,所述专利是以引用的方式并入本文中。标题 为 “Site Specific Incorporation of KetoAmino Acids into Proteins,,的 PCT 公幵案 第TO 04/035743号(其是以全文引用的方式并入本文中)描述用于并入酮基氨基酸的正 交 RS 禾Π tRNA 对。标题为“Expanding the Eukaryotic Genetic Code”的 PCT 公开案第 WO 04/094593号(其是以全文引用的方式并入本文中)描述在真核宿主细胞中并入非天然编 码氨基酸的正交RS和tRNA对。用于产生至少一种重组正交氨酰基-tRNA合成酶(O-RS)的方法包含(a)自第 一生物体产生来源于至少一种氨酰基-tRNA合成酶(RS)的(任选地突变)RS的文库,所 述第一生物体包括(但不限于)原核生物体,例如詹氏甲烷球菌、嗜热自养甲烷杆菌、嗜
75盐菌、大肠杆菌、超嗜热古菌、强烈炽热球菌、极端嗜热古菌、嗜热泉生古细菌、极端嗜热菌 (T. thermophilus)等;或真核生物体;(b)在RS (任选地突变RS)的文库中选择(和/或筛 选)在存在非天然编码氨基酸和天然氨基酸的情况下使正交tRNA(O-tRNA)氨酰基化的成 员,从而提供活性(任选地突变)RS的池;和/或(c)在所述池中选择(任选地通过阴性选 择)在不存在非天然编码氨基酸的情况下优先使Ο-tRNA氨酰基化的活性RS (包括(但不 限于)突变RS),从而提供至少一种重组O-RS ;其中所述至少一种重组O-RS利用非天然编 码氨基酸优先使Ο-tRNA氨酰化。在一实施例中,RS为非活性RS。非活性RS可通过使活性RS突变而产生。举例来 说,可通过使至少约1个、至少约2个、至少约3个、至少约4个、至少约5个、至少约6个或 至少约10个或10个以上氨基酸突变为不同氨基酸(包括(但不限于)丙氨酸)来产生非 活性RS。可使用所属领域中已知的各种技术来产生突变RS的文库,所述技术包括(但不限 于)以蛋白质三维RS结构为基础的合理设计或在随机或合理设计技术中RS核苷酸的诱 变。举例来说,可通过位点特异性突变、随机突变、产生多样性的重组突变、嵌合构筑体、合 理设计以及本文中所述或所属领域中已知的其它方法产生突变RS。在一实施例中,在RS (任选地突变RS)的文库中选择(和/或筛选)(包括(但不 限于))在存在非天然编码氨基酸和天然氨基酸的情况下使正交tRNA(O-tRNA)氨酰基化的 活性成员包括将阳性选择或筛选标记(包括(但不限于)抗生素抗性基因等)和(任选 地突变)RS的文库引入多个细胞中,其中阳性选择和/或筛选标记包含至少一个选择密码 子(包括(但不限于)琥珀、赭石或蛋白石密码子);使所述多个细胞在存在选择剂的情况 下生长;通过抑制阳性选择或筛选标记中的至少一个选择密码子来鉴别在存在选择剂和/ 或筛选剂的情况下存活(或显示特异性反应)的细胞,从而提供含有活性(任选地突变)RS 的池的经阳性选择细胞的子集。任选地可改变选择剂和/或筛选剂浓度。一方面,阳性选择标记为氯霉素(chloramphenicol)乙酰基转移酶(CAT)基因并 且在CAT基因中,选择密码子为琥珀终止密码子。任选地,阳性选择标记为β-内酰胺酶基 因且在β-内酰胺酶基因中,选择密码子为琥珀终止密码子。另一方面,阳性筛选标记包含 荧光或发光筛选标记或基于亲和性的筛选标记(包括(但不限于)细胞表面标记)。在一实施例中,在池中阴性选择或筛选在不存在非天然编码氨基酸的情况下优先 使Ο-tRNA氨酰基化的活性RS (任选地突变体)包括将阴性选择或筛选标记与来自阳性 选择或筛选的活性(任选地突变)RS的池引入第二生物体的多个细胞中,其中阴性选择或 筛选标记包含至少一个选择密码子(包括(但不限于)抗生素抗性基因,其包括(但不限 于)氯霉素乙酰基转移酶(CAT)基因);以及鉴别在补充有非天然编码氨基酸和筛选剂或 选择剂的第一培养基中存活或显示特异性筛选反应、但在未补充非天然编码氨基酸和选择 剂或筛选剂的第二培养基中不能存活或显示特异性反应的细胞,从而提供具有至少一种重 组O-RS的存活细胞或筛选细胞。举例来说,CAT鉴别方案在适当O-RS重组体的确定中任选 地充当阳性选择和/或阴性筛选。举例来说,任选地在存在或不存在一个或一个以上非天 然编码氨基酸的情况下在含有CAT (其包含至少一个选择密码子)的生长板上复制克隆池。 因此,认为仅在含有非天然编码氨基酸的平板上生长的菌落含有重组0-RS。一方面,改变选 择(和/或筛选)剂的浓度。在一些方面中,第一生物体与第二生物体不同。因此,第一生物体和/或第二生物体任选地包含原核生物、真核生物、哺乳动物、大肠杆菌、真菌、酵母、 古细菌(archaebacterium)、真细菌(eubacterium)、植物、昆虫、原生生物等。在其它实施 例中,筛选标记包含荧光或发光筛选标记或基于亲和性的筛选标记。在另一实施例中,在池中筛选或选择(包括(但不限于)阴性选择)活性(任选 地突变)RS包括从阳性选择步骤(b)分离活性突变RS的池;将阴性选择或筛选标记和活 性(任选地突变)RS的池引入第二生物体的多个细胞中,其中阴性选择或筛选标记包含至 少一个选择密码子(包括(但不限于)包含至少一个选择密码子的毒性标记基因,其包括 (但不限于)核糖核酸酶barnase基因);以及鉴别在未补充非天然编码氨基酸的第一培养 基中存活或显示特异性筛选反应、但在补充有非天然编码氨基酸的第二培养基中不能存活 或显示特异性筛选反应的细胞,从而提供具有至少一种重组O-RS的存活细胞或筛选细胞, 其中所述至少一种重组O-RS对非天然编码氨基酸具特异性。一方面,所述至少一个选择密 码子包含约两个或两个以上选择密码子。这些实施例任选地可包括所述至少一个选择密码 子包含两个或两个以上选择密码子的情形,以及第一生物体与第二生物体不同(包括(但 不限于)各生物体任选地为(包括(但不限于))原核生物、真核生物、哺乳动物、大肠杆菌、 真菌、酵母、古细菌、真细菌、植物、昆虫、原生生物等)的情形。另外,一些方面包括阴性选 择标记包含核糖核酸酶barnase基因(其包含至少一个选择密码子)的情形。其它方面包 括筛选标记任选地包含荧光或发光筛选标记或基于亲和性的筛选标记的情形。在本文中的 实施例中,筛选和/或选择任选地包括筛选和/或选择严格度的变化。在一实施例中,用于产生至少一种重组正交氨酰基-tRNA合成酶(O-RS)的方法可 进一步包含(d)分离所述至少一种重组O-RS ; (e)产生来源于所述至少一种重组O-RS的 第二组O-RS (任选地突变体);以及(f)重复步骤(b)和(c),直到获得包含优先使0-tRNA 氨酰基化的能力的突变0-RS。任选地,将步骤(d)-(f)重复(包括(但不限于))至少约两 次。一方面,可通过诱变(包括(但不限于)随机诱变、位点特异性诱变、重组或其组合) 产生来源于至少一种重组O-RS的第二组突变0-RS。在上述方法中,选择/筛选步骤(包括(但不限于)阳性选择/筛选步骤(b)、阴性 选择/筛选步骤(c)或阳性与阴性选择/筛选步骤(b)与(C))的严格度任选地包括改变选 择/筛选严格度。在另一实施例中,阳性选择/筛选步骤(b)、阴性选择/筛选步骤(C)或 阳性与阴性选择/筛选步骤(b)与(C)包含使用报告基因,其中报告基因是通过荧光激活 细胞分类(FACS)检测或其中报告基因是通过发光检测。报告基因任选地呈现于细胞表面、 噬菌体呈现上等且根据涉及非天然编码氨基酸或类似物的亲和性或催化活性进行选择。在 一实施例中,突变合成酶是呈现于细胞表面、噬菌体呈现(Phage display)等上。用于产生重组正交tRNA (Ο-tRNA)的方法包括(a)由第一生物体产生来源于至少 一种tRNA(包括(但不限于)抑制银子tRNA)的突变tRNA文库;(b)在所述文库中选择 (包括(但不限于)阴性选择)或筛选在不存在来自第一生物体的RS的情况下由来自第二 生物体的氨酰基-tRNA合成酶(RS)氨酰基化的(任选地突变)tRNA,从而提供tRNA (任选 地突变体)的池;以及(c)在所述tRNA(任选地突变体)池中选择或筛选通过引入的正交 RS(O-RS)氨酰基化的成员,从而提供至少一种重组Ο-tRNA ;其中所述至少一种重组0-tRNA 识别选择密码子且无法由来自第二生物体的RS有效识别且通过O-RS优先氨酰基化。在一 些实施例中,所述至少一种tRNA为抑制因子tRNA和/或包含具有天然和/或非天然碱基的独特三碱基密码子,或为无义密码子、稀有密码子、非天然密码子、包含至少4个碱基的密 码子、琥珀密码子、赭石密码子或蛋白石终止密码子。在一实施例中,重组Ο-tRNA具有正交 性的改良。应了解在一些实施例中,Ο-tRNA无需修饰而任选地从第二生物体引入第一生物 体中。在各种实施例中,第一生物体与第二生物体相同或不同并且任选地选自(包括(但不 限于))原核生物(包括(但不限于)詹氏甲烷球菌、嗜热自养甲烷杆菌、大肠杆菌、嗜盐菌 等)、真核生物、哺乳动物、真菌、酵母、古细菌、真细菌、植物、昆虫、原生生物等。另外,重组 tRNA是由非天然编码氨基酸任选地氨酰基化,其中非天然编码氨基酸是在活体内天然生物 合成或通过基因操纵生物合成。任选地将非天然编码氨基酸添加到至少第一生物体或第二 生物体的生长培养基中。一方面,在所述文库中选择(包括(但不限于)阴性选择)或筛选通过氨酰 基-tRNA合成酶氨酰基化的(任选地突变)tRNA (步骤(b))包括将毒性标记基因和(任 选地突变)tRNA文库引入来自第二生物体的多个细胞中,其中毒性标记基因包含至少一个 选择密码子(或导致产生毒性剂或抑制剂(static agent)的基因或生物体必需的基因,其 中所述标记基因包含至少一个选择密码子);以及选择存活细胞,其中存活细胞含有包含 至少一个正交tRNA或非功能性tRNA的(任选地突变)tRNA的池。举例来说,可通过使用 比较比率细胞密度测定来选择存活细胞。另一方面,毒性标记基因可包括两个或两个以上选择密码子。在所述方法的另一 实施例中,毒性标记基因为核糖核酸酶barnase基因,其中核糖核酸酶barnase基因包含至 少一个琥珀密码子。核糖核酸酶barnase基因任选地可包括两个或两个以上琥珀密码子。在一实施例中,在(任选地突变)tRNA的池中选择或筛选通过引入的正交 RS(O-RS)氨酰基化的成员可包括将阳性选择或筛选标记基因以及O-RS和(任选地突变) tRNA的池引入来自第二生物体的多个细胞中,其中阳性标记基因包含药物抗性基因(其 包括(但不限于)β -内酰胺酶基因,其包含至少一个选择密码子,例如至少一个琥珀终止 密码子)或生物体必需的基因或使得毒性剂解毒的基因;以及鉴别在存在选择剂或筛选剂 (包括(但不限于)抗生素)的情况下生长的存活或筛选细胞,从而提供具有至少一种重组 tRNA的细胞池,其中所述至少一种重组tRNA是通过O-RS氨酰基化且响应所述至少一个选 择密码子而将氨基酸插入由阳性标记基因编码的翻译产物中。在另一实施例中,改变选择 剂和/或筛选剂的浓度。提供用于产生特异性0-tRNA/0-RS对的方法。所述方法包括(a)由第一生物体产 生来源于至少一种tRNA的突变tRNA的文库;(b)在所述文库中阴性选择或筛选在不存在 来自第一生物体的RS的情况下通过来自第二生物体的氨酰基-tRNA合成酶(RS)氨酰基化 的(任选地突变)tRNA,从而提供(任选地突变)tRNA池;(c)在(任选地突变)tRNA池中 选择或筛选通过引入的正交RS(O-RS)氨酰基化的成员,从而提供至少一种重组Ο-tRNA。所 述至少一种重组Ο-tRNA识别选择密码子并且无法由来自第二生物体的RS有效识别且通过 O-RS优先氨酰基化。所述方法还包括(d)由第三生物体产生来源于至少一种氨酰基-tRNA 合成酶(RS)的(任选地突变)RS的文库;(e)在所述突变RS文库中选择或筛选在存在非天 然编码氨基酸和天然氨基酸的情况下优先使所述至少一种重组Ο-tRNA氨酰基化的成员, 从而提供活性(任选地突变)RS池;和(f)在所述池中阴性选择或筛选在不存在非天然编 码氨基酸的情况下优先使所述至少一种重组Ο-tRNA氨酰基化的活性(任选地突变)RS,从而提供至少一个特异性0-tRNA/0-RS对,其中所述至少一个特异性0-tRNA/0-RS对包含至 少一种对非天然编码氨基酸具特异性的重组O-RS和所述至少一种重组Ο-tRNA。包括由所 述方法产生的特异性0-tRNA/0-RS对。举例来说,特异性0-tRNA/0-RS对可包括(包括(但 不限于))mutRNATyr-mutTyrRS 对(例如 mutRNATyr-SS12TyrRS 对)、mutRNALeu_mutLeuRS 对、mutRNAThr-mutThrRS对、mutRNAGlu-mutGluRS对等。另外,所述方法包括第一与第三生 物体相同(其包括(但不限于)詹氏甲烷球菌)的情形。本发明中还包括选择用于第二生物体的活体内翻译系统中的正交tRNA-tRNA 合成酶对的方法。所述方法包括将标记基因、tRNA和从第一生物体分离或获得的氨酰 基-tRNA合成酶(RS)引入来自第二生物体的第一组细胞中;将标记基因和tRNA引入来自 第二生物体的复制细胞组中;以及选择在复制细胞组中不能存活的第一组中的存活细胞或 筛选显示特异性筛选反应但在复制细胞组中不能提供这种反应的细胞,其中第一组与复制 细胞组是在存在选择剂或筛选剂的情况下生长,其中存活或筛选细胞包含用于第二生物体 的活体内翻译系统中的正交tRNA-tRNA合成酶对。在一实施例中,比较和选择或筛选包括 活体内互补测定。可改变选择剂或筛选剂的浓度。本发明的生物体包含多种生物体和多种组合。举例来说,本发明方法的第一生物 体与第二生物体可能相同或不同。在一实施例中,生物体任选地为原核生物体,包括(但不 限于)詹氏甲烷球菌、嗜热自养甲烷杆菌、嗜盐菌、大肠杆菌、超嗜热古菌、强烈炽热球菌、 极端嗜热古菌、嗜热泉生古细菌、极端嗜热菌等。或者,生物体任选地包含真核生物体,包括 (但不限于)植物(包括(但不限于)复杂植物,例如单子叶植物或双子叶植物)、藻类、原 生生物、真菌(包括(但不限于)酵母等)、动物(包括(但不限于)哺乳动物、昆虫、节肢 动物等)等。在另一实施例中,第二生物体为原核生物体,包括(但不限于)詹氏甲烷球菌、 嗜热自养甲烷杆菌、嗜盐菌、大肠杆菌、超嗜热古菌、嗜盐菌、强烈炽热球菌、极端嗜热古菌、 嗜热泉生古细菌、极端嗜热菌等。或者,第二生物体可为真核生物体,包括(但不限于)酵 母、动物细胞、植物细胞、真菌、哺乳动物细胞等。在各个实施例中,第一生物体与第二生物 体不同。非天然存在氨基酸在胰岛素多肽中的位置本发明涵盖将一个或一个以上非天然存在氨基酸并入胰岛素多肽中。可将一个或 一个以上非天然存在氨基酸并入特定位置处而不破坏多肽活性。这可通过进行“保守”取 代来实现,所述取代包括(但不限于)用疏水性氨基酸取代疏水性氨基酸、用庞大氨基酸取 代庞大氨基酸、用亲水性氨基酸取代亲水性氨基酸和/或在活性不需要的位置中插入非天 然存在氨基酸。可使用多种生物化学和结构方法来选择胰岛素多肽内供非天然编码氨基酸取代 所需的位点。所属领域的技术人员显而易见,多肽链的任何位置都适于选择以并入非天 然编码氨基酸,并且选择可基于合理设计或通过随机选择来进行以实现任何目的或无特定 需要的目的。所需位点的选择可用于产生具有任何所需性质或活性的胰岛素分子(包括 (但不限于)激动剂、超激动剂、反向激动剂、拮抗剂、受体结合调节剂、受体活性调节剂)、 二聚物或多聚物形成、与天然分子相比不改变活性或性质,或操纵多肽的任何物理或化学 性质(例如溶解性、聚集或稳定性)。举例来说,可使用所属领域中已知的点突变分析、丙 氨酸扫描、饱和诱变和生物活性筛选或同源物扫描方法来鉴别多肽中为胰岛素多肽的生物
79活性所需的位置。可使用其它方法鉴别用于修饰胰岛素多肽的残基,包括(但不限于)序 列信息分析(sequence profiling) (Bowie 禾口 Eisenberg,Science 253(5016) 164-70, (1991))、旋转异构体文库选择(Dahiyat 和 May ο,Protein Sci 5(5) 895-903 (1996); Dahiyat 禾口 Mayo, Science 278(5335) :82_7(1997) ;Desjarlais 禾口 Handel, Protein Science 4:2006-2018(1995) ;Harbury 等人,PNAS USA 92(18) :8408_8412 (1995) ;Kono 等人,Proteins Structure, Function and Genetics 19 :244_255(1994) ;Hellinga 禾口 Richards, PNAS USA 91:5803-5807(1994));和残基对势(residue pair potential) (Jones, Protein Science 3:567—574,(1994))以及使用 Protein Design Automation 技术合理设计。(参见美国专利第6,188,965号、第6,269,312号、第6,403,312号、 W098/47089,其以引用的方式并入本文中)。对胰岛素生物活性至关重要的残基、与医药 稳定性有关的残基、抗体表位或受体结合残基可发生突变。美国专利第5,580,723号、第 5,834,250号、第6,013,478号、第6,428,954号和第6,451,561号(其是以引用的方式并入 本文中)描述通过用标靶物质鉴别影响多肽活性的活性域来系统分析多肽(诸如胰岛素) 的结构和功能的方法。除通过丙氨酸或同源物扫描诱变被鉴别为对生物活性至关重要的残 基之外的残基可视多肽所追求的所需活性而为供非天然编码氨基酸取代的良好候选者。或 者,经鉴别为对生物活性至关重要的位点也可视多肽所追求的所需活性而为供非天然编码 氨基酸取代的良好候选者。另一替代方法将为在多肽链上的各个位置中利用非天然编码氨 基酸简单地进行连续取代并且观察对多肽活性的影响。所属领域的技术人员显而易见,在 任何多肽中选择供非天然氨基酸取代的位置的任何方式、技术或方法都适用于本发明中。也可检查含有缺失的胰岛素多肽的突变体的结构和活性以确定可能允许用非天 然编码氨基酸进行取代的蛋白质区。可以类似方式使用蛋白酶消化和单克隆抗体来鉴别负 责结合胰岛素受体的胰岛素区。在排除可能不允许经非天然编码氨基酸取代的残基后,可 研究所提出的取代在各剩余位置处的影响。可根据其它胰岛素家族成员和胰岛素受体的三 维晶体结构产生模型。蛋白质数据库(Protein DataBank ;PDB,通过万维网在rcsb. org上 获得)是含有蛋白质和核酸大分子的三维结构数据的集中数据库。如果无法获得三维结构 数据,那么可建立模型来研究多肽的二级和三级结构。因此,所属领域的技术人员可容易地 鉴别可经非天然编码氨基酸取代的氨基酸位置。在一些实施例中,本发明的胰岛素多肽包含位于不破坏多肽的结构的蛋白质区中 的一个或一个以上非天然编码氨基酸。并入非天然编码氨基酸的示范性残基可能为潜在受体结合区中不包括的残基,可 能完全或部分暴露在溶剂中,与附近残基具有最小或无氢键结相互作用,可能最低程度地 受到附近的反应性残基影响,可能位于一个或一个以上暴露面上,可能为一个或一个以上 与第二胰岛素或其它分子或其片段并列的位点,可能处于如根据与受体结合或未结合或者 与另一生物活性分子偶合或未偶合的胰岛素的三维、二级、三级或四级结构所预测的高度 柔性或结构呈刚性的区中,或可能通过按需要改变完整结构的柔性或刚性来调节胰岛素本 身或包含一个或一个以上胰岛素的二聚物或多聚物的构象。所属领域的技术人员认识到,这种对胰岛素的分析使得能够确定哪些氨基酸残基 相比于隐藏在蛋白质三级结构内的氨基酸残基来说是表面暴露的。因此,用非天然编码氨 基酸取代作为表面暴露残基的氨基酸是本发明的一实施例。
在一些实施例中,一个或一个以上非天然编码氨基酸并入胰岛素的一个或一个以 上以下位置处在A链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、
15、16、17、18、19、20、21、22(即在蛋白质的羧基端)和其任何组合(SEQID NO 1);或在B 链中,位置 1(即在 N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、 21、22、23、24、25、26、27、28、29、30、31(SEQ ID NO :2)。关于胰岛素的晶体结构以及其与胰岛素受体的相互作用的研究可指示哪些特定 氨基酸残基具有可完全或部分接近溶剂的侧链。这些位置处的非天然编码氨基酸侧链可远 离蛋白质表面并进入溶剂中。在一些实施例中,一个或一个以上以下位置处的非天然编码氨基酸与水溶性聚合 物连接,包括(但不限于)位置在A链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、 10、11、12、13、14、15、16、17、18、19、20、21、22(即在蛋白质的羧基端)和其任何组合(SEQ ID NO 1);或在 B 链中,位置 1(即在 N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、
16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31(SEQID NO :2)。可用多种非天然编码氨基酸取代胰岛素多肽中的给定位置,或可将多种非天然编 码氨基酸并入胰岛素多肽中的给定位置中。一般来说,根据对胰岛素多肽或其它胰岛素家 族成员或胰岛素类似物与其受体的三维晶体结构的研究来选择供并入的特定非天然编码 氨基酸,其中优选保守取代(即,用基于芳基的非天然编码氨基酸(例如对乙酰基苯丙氨酸 或0-炔丙基酪氨酸)取代Phe、Tyr或Trp)以及希望引入胰岛素多肽中的特异性结合化学 (例如,如果需要利用具有炔部分的水溶性聚合物来实现休根斯[3+2]环加成,或需要利用 具有芳基酯(其又并入膦部分)的水溶性聚合物来形成酰胺键,那么引入4-叠氮基苯丙氨 酸)。在一实施例中,所述方法进一步包括将非天然氨基酸并入蛋白质中,其中所述非 天然氨基酸包含第一反应性基团;以及使蛋白质与包含第二反应性基团的分子(包括(但 不限于)标记、染料、聚合物、水溶性聚合物、聚乙二醇的衍生物、光交联剂、放射性核素、细 胞毒性化合物、药物、亲和性标记、光亲和性标记、反应性化合物、树脂、第二蛋白质或多肽 或多肽类似物、抗体或抗体片段、金属螯合剂、辅因子、脂肪酸、碳水化合物、多核苷酸、DNA、 RNA、反义多核苷酸、糖类、水溶性树枝状聚合物、环糊精、抑制性核糖核酸、生物材料、纳米 粒子、自旋标记、荧光团、含金属的部分、放射性部分、新颖官能团、与其它分子共价或非共 价相互作用的基团、光笼化部分、光化辐射可激发的部分、可光致异构化部分、生物素、生物 素衍生物、生物素类似物、结合有重原子的部分、可化学裂解的基团、可光裂解的基团、延长 的侧链、碳连接的糖、氧化还原活性剂、氨基硫代酸、毒性部分、经同位素标记的部分、生物 物理探针、磷光基团、化学发光基团、电子致密基团、磁性基团、插入基团、发色团、能量转移 齐U、生物活性剂、可检测标记、小分子、量子点、纳米传递素、放射性核苷酸、放射性传递素、 中子俘获剂或上述物质的任何组合,或任何其它所需化合物或物质)接触。第一反应性基 团与第二反应性基团反应以使分子通过[3+2]环加成与非天然氨基酸连接。在一实施例 中,第一反应性基团为炔基或叠氮部分,并且第二反应性基团为叠氮基或炔基部分。举例来 说,第一反应性基团为炔基部分(包括(但不限于)在非天然氨基酸对炔丙基氧基苯丙氨 酸中)并且第二反应性基团为叠氮部分。在另一实例中,第一反应性基团为叠氮部分(包 括(但不限于)在非天然氨基酸对叠氮基-L-苯丙氨酸中)并且第二反应性基团为炔基部分。在一些情况下,将非天然编码氨基酸取代与胰岛素多肽内的其它添加、取代或缺 失组合以影响胰岛素多肽的其它生物特性。在一些情况下,其它添加、取代或缺失可增加胰 岛素多肽的稳定性(包括(但不限于)对蛋白水解降解的抗性)或增加胰岛素多肽对其受 体的亲和性。在一些情况下,其它添加、取代或缺失可增加胰岛素多肽的医药稳定性。在一 些情况下,其它添加、取代或缺失可增强胰岛素多肽的抗病毒活性。在一些情况下,其它添 加、取代或缺失可增加胰岛素多肽的溶解性(包括(但不限于)在大肠杆菌或其它宿主细 胞中表达时)。在一些实施例中,添加、取代或缺失可增加胰岛素多肽在大肠杆菌或其它重 组宿主细胞中表达之后的溶解性。在一些实施例中,除并入非天然氨基酸的位点外还选择 另一位点以供天然编码或非天然氨基酸取代,这使得在大肠杆菌或其它重组宿主细胞中表 达后多肽溶解性增加。在一些实施例中,胰岛素多肽包含另一添加、取代或缺失,其调节对 胰岛素多肽受体、结合蛋白或缔合配体的亲和性,调节与胰岛素受体结合后的信号转导,调 节循环半衰期,调节释放或生物可用性,促进纯化或改良或改变特定投药途径。在一些实施 例中,胰岛素多肽包含增加胰岛素变异体对其受体的亲和性的添加、取代或缺失。类似地, 胰岛素多肽可包含改良多肽的检测(包括(但不限于)GFP)、纯化、通过组织或细胞膜的转 运、前药释放或活化、胰岛素尺寸减小或其它特性的化学或酶裂解序列、蛋白酶裂解序列、 反应性基团、抗体结合域(包括(但不限于)FLAG或poly-His)或其它基于亲和性的序列 (包括(但不限于)FLAG、poly-His、GST等)或连接分子(包括(但不限于)生物素)。在一些实施例中,非天然编码氨基酸的取代产生胰岛素拮抗剂。在一些实施例中, 在与受体结合有关的区中取代或添加非天然编码氨基酸。在一些实施例中,胰岛素拮抗剂 包含至少一个使胰岛素充当拮抗剂的取代。在一些实施例中,胰岛素拮抗剂包含与水溶性 聚合物连接的非天然编码氨基酸,其存在于胰岛素分子的受体结合区中。在一些情况下,用一个或一个以上非天然编码氨基酸取代1、2、3、4、5、6、7、8、9、10 或10个以上氨基酸。在一些情况下,胰岛素多肽进一步包括1、2、3、4、5、6、7、8、9、10或10 个以上用一个或一个以上非天然编码氨基酸对天然存在氨基酸的取代。举例来说,在一些 实施例中,用一个或一个以上非天然编码氨基酸取代胰岛素中的一个或一个以上残基。在 一些情况下,将一个或一个以上非天然编码残基与一个或一个以上较低分子量的线性或分 支PEG连接,从而相对于与单一较高分子量PEG连接的物质增强结合亲和性并且具有相当 的血清半衰期。在一些实施例中,胰岛素的以下残基中至多有两个残基经一个或一个以上非天然 编码氨基酸取代。非真核细胞和真核细胞中的表达为获得克隆胰岛素多核苷酸的高水平表达,通常将编码本发明的胰岛素多肽的多 核苷酸亚克隆到含有指导转录的强启动子、转录/翻译终止子以及(如果就编码蛋白质的 核酸来说)供翻译起始的核糖体结合位点的表达载体中。所属领域的技术人员已知合适的 细菌启动子,并且其例如描述于Sambrook等人以及Ausubel等人中。用于表达本发明的胰岛素多肽的细菌表达系统可在(包括(但不限于))大 肠杆菌、芽孢杆菌(Bacillus sp.)、荧光假单胞菌、绿脓杆菌、恶臭假单胞菌和沙门氏菌 (Salmonella)中获得(Palva 等人,Gene 22 :229_235 (1983) ;Mosbach 等人,Nature 302
82543-545(1983))。用于这些表达系统的试剂盒在市面上有售。所属领域的技术人员已 知哺乳动物细胞、酵母和昆虫细胞的真核表达系统,并且其也在市面上有售。在使用正 交tRNA和氨酰基tRNA合成酶(上述)来表达本发明的胰岛素多肽的情况下,用于表达 的宿主细胞是根据其使用正交组分的能力进行选择。示范性宿主细胞包括革兰氏阳性细 菌(Gram-positive bacteria)(包括(但不限于)短小芽孢杆菌(B. brevis)、枯草杆菌 (B. subtilis)或链霉菌(Sti^ptomyces))和革兰氏阴性细菌(Gram-negative bacteria) (大肠杆菌、荧光假单胞菌、绿脓杆菌、恶臭假单胞菌),以及酵母和其它真核细胞。如本文 中所述,可使用包含0-tRNA/0-RS对的细胞。本发明的真核宿主细胞或非真核宿主细胞提供合成较大有用量的包含非天然氨 基酸的蛋白质的能力。一方面,组合物任选地包括(包括(但不限于))至少10微克、至少 50微克、至少75微克、至少100微克、至少200微克、至少250微克、至少500微克、至少1 毫克、至少10毫克、至少100毫克、至少1克或1克以上包含非天然氨基酸的蛋白质,或可 通过活体内蛋白质制备方法所实现的量的所述蛋白质(关于重组蛋白制备和纯化的细节 提供于本文中)。另一方面,所述蛋白质任选地以在(包括(但不限于))细胞溶菌液、缓 冲液、医药缓冲液或其它液体悬浮液(包括(但不限于)体积(包括(但不限于))约为约 Inl到约100L或100L以上)中(包括(但不限于))每升至少10微克蛋白质、每升至少 50微克蛋白质、每升至少75微克蛋白质、每升至少100微克蛋白质、每升至少200微克蛋 白质、每升至少250微克蛋白质、每升至少500微克蛋白质、每升至少1毫克蛋白质或每升 至少10毫克或10毫克以上蛋白质的浓度存在于组合物中。在真核细胞中产生大量(包括 (但不限于)大于用其它方法(包括(但不限于)活体外翻译)通常可能获得的量)包括 至少一个非天然氨基酸的蛋白质是本发明的特征。本发明的真核宿主细胞或非真核宿主细胞提供生物合成较大有用量的包含非天 然氨基酸的蛋白质的能力。举例来说,可在细胞提取物、细胞溶菌液、培养基、缓冲液等中产 生蛋白质浓度为(包括(但不限于))至少10微克/升、至少50微克/升、至少75微克/ 升、至少100微克/升、至少200微克/升、至少250微克/升或至少500微克/升、至少1 毫克/升、至少2毫克/升、至少3毫克/升、至少4毫克/升、至少5毫克/升、至少6毫 克/升、至少7毫克/升、至少8毫克/升、至少9毫克/升、至少10毫克/升、至少20、30、 40、50、60、70、80、90、100、200、300、400、500、600、700、800、900 毫克 / 升、1 克 / 升、5 克 / 升、10克/升或10克/升以上的包含非天然氨基酸的蛋白质。多种适于表达胰岛素的载体都可购得。有效用于真核生物宿主的表达载体包 括(但不限于)包含来自SV40、牛乳头瘤病毒、腺病毒以及细胞肥大病毒的表达控制 序列的载体。这些载体包括 PCDNA3. 1(+) \Hyg(Invitrogen, Carlsbad, Calif, USA)和 pCI-neo(Stratagene, La Jolla, Calif.,USA)。可使用细菌质粒,例如来自大肠杆菌的质 粒(包括pBR322、pET3a和pET12a)、较宽宿主范围质粒(例如RP4);噬菌体DNA,例如噬菌 体λ (例如ΝΜ989)和其它DNA噬菌体(例如Μ13和丝状单链DNA噬菌体)的多种衍生物。 2μ质粒和其衍生物、POTl载体(美国专利第4,931,373号,其以引用的方式并入本文中)、 (Okkels, Ann. New YorkAced. Sci. 782,202207,1996)中描述的 pJS037 载体以及 pPICZ A、 B或C(Invitrogen)可与酵母宿主细胞一起使用。对于昆虫细胞,载体包括(但不限于) pVL941、pBG311 (Cate等人,〃 Isolation of the Bovine and Human Genes forMullerianInhibiting Substance And Expression of the Human Gene In Animal Cells" , Cell, 45,第 68598 页(1986))、pBluebac 4. 5 以及 pMelbac (Invitrogen, Carlsbad, CA)。编码胰岛素多肽的核苷酸序列还可包括或可不包括编码信号肽的序列。当多肽是 由表达所述多肽的细胞分泌时,存在信号肽。这种信号肽可为任何序列。信号肽可为原核生 物信号肽或真核生物信号肽。Coloma,M(1992)J. Imm. Methodsl52 89104)描述用于哺乳动 物细胞中的信号肽(鼠类Ig κ轻链信号肽)。其它信号肽包括(但不限于)来自酿酒酵母 的α “因子信号肽(美国专利第4,870,008号,其以引用的方式并入本文中)、小鼠唾液淀 粉酶的信号肽(0. Hagenbuchle等人,Nature 289,1981,第643-646页)、经修饰的羧基肽酶 信号肽(L.A. Vails 等人,Cell48,1987,第 887-897 页)、酵母 BARl 信号肽(W0 87/02670, 其以引用的方式并入本文中)以及酵母天冬胺酸蛋白酶3 (yeast aspartic protease 3, YAP3)信号肽(参见 M. Egel-Mitani 等人,Yeast 6,1990,第 127-137 页)。所属领域的技术人员已知合适哺乳动物宿主细胞的实例。这些宿主细胞可为中 国仓鼠卵巢(Chinese hamster ovary, CH0)细胞(例如 CH0-K1 ;ATCC-CCL-61)、绿猴细胞 (Green Monkey cell,COS)(例如COS 1 (ATCC CRL-1650)、C0S 7 (ATCC CRL-1651))、小鼠细 胞(例如 NS/0)、幼仓鼠肾(Baby Hamster Kidney,BHK)细胞系(例如(ATCC CRL-1632 或 ATCC CCL-10)和人类细胞(例如HEK293(ATCC CRL-1573))以及组织培养中的植物细胞。这 些细胞系和其它细胞系可自例如美国典型微生物菌种保藏中心(American Type Culture Collection,Rockville,Md)等公共寄存场所获得。为改进胰岛素多肽的糖基化,可修饰哺 乳动物宿主细胞以表达唾液酸转移酶,举例来说,如例如美国专利第5,047,335号中所述 的1,6-唾液酸转移酶,所述专利以引用的方式并入本文中。将外源DNA引入哺乳动物宿主细胞中的方法包括(但不限于)磷酸钙介导 的转染、电穿孔、DEAE-葡聚糖介导的转染、脂质体介导的转染、病毒载体以及Life Technologies Ltd, Paisley, UK 中所述的使用 Lipofectamine 2000 的转染方法和 Roche Diagnostics Corporation, Indianapolis,USA 中所述的使用 FuGENE 6 的转染方法。这 些方法在所属领域中为众所周知的且由Ausbel等人(编),1996,CurrentProtocols in Molecular Biology, John ffiley&Sons, New York,USA 描述。哺乳动物细胞的培养可根据 例如如(Animal Cell B iotechnology,Methods and Protocols,Nigel Jenkins编,1999, Human Press Inc. Totowa,N. J. ,USA ;Lii1^Harrison Mass.禾口Rae IF,General Techniques of Cell Culture, Cambridge University Press 1997)中所揭示的确定方法来进行。表达系统、培养和分离胰岛素多肽可在任何数目的合适表达系统(例如包括酵母、昆虫细胞、哺乳动物 细胞和细菌)中表达。示范性表达系统的描述提供于下文中。MS如本文中所用,术语“酵母”包括能够表达编码胰岛素多肽的基因的各种酵 母中的任一种。所述酵母包括(但不限于)产子囊酵母(ascosporogenous yeast)(内 孢霉目(Endomycetales))、担孢子酵母(basidiosporogenous)和属于半知菌(芽孢纲 (Blastomycetes))类的酵母。产子囊酵母分为两个科蚀精霉科(Spermophthoraceae) 和酵母菌科(Saccharomycetaceae)。后者包含四个亚科,即裂殖酵母亚科 (Schizosaccharomycoideae)(例如裂殖酵母(Schizosaccharomyces)属)、拿逊酵母亚 科(Nadsonioideae)、脂酵母亚科(Lipomycoideae)以及酵母亚科(Saccharomycoideae)(例如毕赤酵母(Pichia)属、克鲁维酵母(Kluyveromyces)属和酵母菌(Saccharomyces) 属)。担孢子酵母包括白冬孢酵母(Leucosporidium)属、红冬孢酵母(Rhodosporidium) 属、锁掷酵母(Sporidiobolus)属、线黑粉酵母(Filobasidium)属和香灰拟锁担 菌(Filobasidiella)属。属于半知菌(芽孢纲)类的酵母分为两个科掷孢酵母科 (Sporobolomycelaceae)(例如掷孢酵母(Sporoholomyces)属和布勒掷孢酵母(Bullera) 属)和隐球酵母科(Cryptococcaceae)(例如假丝酵母(Candida)属)。尤其受关注的供本发明使用的物种为毕赤酵母属、克鲁维酵母属、酵母菌属、裂 殖酵母属(Schizosaccharomyces)、汉逊酵母属(Hansenula)、球拟酵母属(Torulopsis) 和假丝酵母属内的物种,其包括(但不限于)巴斯德毕赤酵母(P.pastoris)、谷勒氏 酵母(P. guillerimondii)、酿酒酵母、卡尔斯伯酵母(S. carlsbergensis)、糖化酵母 (S. diastaticus)、道格拉斯酵母(S. douglasii)、克鲁维酵母(S. kluyveri)、诺本酵母 (S. norbensis)、卵形酵母(S. oviformis)、乳酸克鲁维酵母(K. Iactis)、脆壁克鲁维酵母 (K. fragilis)、白假丝酵母菌(C. albicans)、麦芽糖假丝酵母(C. maltosa)和汉森酵母 (H. polymorpha)。适用于表达胰岛素多肽的酵母的选择是在所属领域的技术人员的技能范围内。 在选择用于表达的酵母宿主时,合适的宿主可包括显示具有例如良好分泌能力、低蛋白水 解活性、良好分泌能力、良好可溶性蛋白质产生以及总体坚固性的酵母宿主。酵母通常可 获自多种来源,包括(但不限于)加利福尼亚大学生物物理和医学物理系酵母基因保藏 中心(Yeast Genetic Stock Center, Department ofBiophysics and Medical Physics, University of California, Berkeley, CA)和美国典型菌种保藏中心(American Type Culture Collection,"ATCC,,)(Manassas,VA)。术语“酵母宿主”或“酵母宿主细胞”包括可用作或已用作重组载体或其它转移DNA 的接受者的酵母。所述术语包括已接受重组载体或其它转移DNA的原始酵母宿主细胞的后 代。应了解,由于偶发突变或故意突变,单一母体细胞的后代在形态上或在与原始母体互补 的基因组DNA或总DNA方面可能未必完全一致。与将要以相关性质(例如存在编码胰岛素 多肽的核苷酸序列)表征的母体充分类似的母体细胞的后代包括在由此定义所指代的后 代中。已开发包括染色体外复制子或整合载体的表达和转化载体以将其转化到多种 酵母宿主中。举例来说,已开发用于以下各酵母的表达载体酿酒酵母(Sikorski等人, GENETICS (1989) 122 19 ;Ito 等人,J. BACTERIOL. (1983) 153 163 ;Hinnen 等人,PR0C. NATL. ACAD. SCI. USA (1978) 75 1929);白假丝酵母菌(Kurtz 等人,MOL. CELL. BIOL. (1986)6:142);麦芽糖假丝酵母(Kunze 等人,J. BASICMICROBIOL. (1985)25:141);汉 森酵母(Gleeson 等人,J. GEN. MICROBIOL. (1986) 132 3459 ;Roggenkamp 等人,MOL. GENETICS AND GENOMICS (1986) 202 302);脆壁克鲁维酵母(Das 等人,J. BACTERIOL. (1984) 158 1165);乳酸克鲁维酵母(De Louvencourt 等人,J. BACTERIOL. (1983) 154 737 ; Van den Berg 等人,BIOTECHNOLOGY (NY) (1990)8 135);谷勒氏酵母(Kunz e 等人, J. BASICMICROBIOL. (1985) 25 141);巴斯德毕赤酵母(美国专利第5,324,639号;第 4,929,555 号;和第 4,837,148 号;Cregg 等人,MOL. CELL. BIOL. (1985) 5 3376);粟酒裂 殖酵母(Schizosaccharomyces pombe) (Beach 等人,NATURE (1982) 300 706);以及解脂耶氏酵母(Y. Iipolytica);构巢曲霉(A. nidulans) (Ballance 等人,BIOCHEM. BI0PHYS. RES. C0MMUN. (1983) 112 284-89 ;Tilburn 等人,GENE (1983) 26 :205_221 ;和 Yelton 等人, PROC. NATL. ACAD. SCI. USA(1984) 81 1470-74);黑曲霉(A. niger) (Kelly 和 Hynes,EMBO J. (1985)4:475-479);里氏木霉(Τ. reesia) (EP O 244 234);和丝状真菌,例如脉孢菌 (Neurospora)、青霉菌(Penicillium)、弯颈霉(Tolypocladium) (WO 91/00357),其中各文 献是以引用的方式并入本文中。所属领域的技术人员已知用于酵母载体的控制序列,并且所述序列包括(但不 限于)来自以下基因的启动子区例如,醇脱氢酶(ADH) (EP O 284 044);烯醇酶;葡萄糖 激酶;葡萄糖-6-磷酸异构酶;甘油醛-3-磷酸-脱氢酶(GAP或GAPDH);己糖激酶;磷 酸果糖激酶;3-磷酸甘油酸变位酶;和丙酮酸激酶(PyK) (EP O 329 203)。编码酸性磷 酸酶的酵母PH05基因也可提供适用的启动子序列(Miyanohara等人,PROC. NATL. ACAD. SCI. USA(1983) 80 :1)。用于酵母宿主的其它合适的启动子序列可包括3-磷酸甘油酸激酶 (Hitzeman等人,J. BIOL. CHEM. (1980)255 12073)和其它糖解酶(例如丙酮酸脱羧酶、磷酸 丙糖异构酶和磷酸葡萄糖异构酶(Hoiland等人,BIOCHEMISTRY (1978) 17 4900 ;Hess等人, J. ADV. ENZYME REG. (1969) 7 149))的启动子。具有由生长条件控制的转录的其它优点的可 诱导酵母启动子可包括醇脱氢酶2、异细胞色素C、酸性磷酸酶、金属硫蛋白、甘油醛-3-磷 酸脱氢酶、与氮代谢相关的降解酶以及负责麦芽糖和半乳糖利用的酶的启动子区。适用于 酵母表达的载体和启动子进一步描述于EP O 073 657中。酵母增强子也可与酵母启动子一起使用。另外,合成启动子也可充当酵母启动子。 举例来说,酵母启动子的上游活化序列(UAS)可与另一酵母启动子的转录活化区连接,从 而产生合成杂合启动子。所述杂合启动子的实例包括与GAP转录活化区连接的ADH调节序 列。参见美国专利第4,880,734号和第4,876,197号,其是以引用的方式并入本文中。杂合 启动子的其它实例包括由ADH2、GAL4、GALlO或PH05基因的调节序列连接糖解酶基因(例 如GAP或PyK)的转录活化区所组成的启动子。参见EP O 164 556。此外,酵母启动子可包 括具有与酵母RNA聚合酶结合并起始转录的能力的非酵母来源的天然存在启动子。可构成酵母表达载体的一部分的其它控制元件包括例如来自GAPDH或烯醇酶基 因的终止子(Holland等人,J. BIOL. CIIEM. (1981)256:1385)。另外,来自2μ质粒来源 的复制起点适用于酵母。适用于酵母的选择基因为酵母质粒中存在的trpl基因。参见 Tschumper 等人,GENE (1980) 10 157 ;Kingsman 等人,GENE (1979) 7 :141。trpl 基因为缺乏 在色氨酸中生长的能力的酵母的突变菌株提供选择标记。类似地,由带有Leu2基因的已知 质粒补充Leu2缺陷型酵母菌株(ATCC 20, 622或38,626)。所属领域的技术人员已知将外源DNA引入酵母宿主中的方法,并且所述方法通常 包括(但不限于)转化原生质球状体或经碱性阳离子处理的完整酵母宿主细胞。举例来 说,可根据 Hsiao 等人,PROC. NATL. ACAD. SCI. USA (1979) 76 3829 和 Van Solingen 等人, J. BACT. (1977) 130 946中所述的方法来进行酵母的转化。然而,也可如SAMBR00K等人, MOLECULAR CLONING =A LAB. MANUAL(2001)中通常所述来使用将DNA引入细胞中的其它方 法(例如通过核注射、电穿孔或原生质体融合)。随后,可使用所属领域的技术人员已知的 标准技术来培养酵母宿主细胞。所属领域的技术人员已知在酵母宿主细胞中表达异源蛋白的其它方法。通常参见美国专利公开案第20020055169号;美国专利第6,361,969号;第6,312,923号; 第 6,183,985 号;第 6,083,723 号;第 6,017,731 号;第 5,674,706 号;第 5,629,203 号;第5,602,034号;和第5,089,398号;美国复审专利第RE37, 343号和第RE35, 749 号;PCT公开专利申请案WO 99/07862 ;WO 98/37208 ;和WO 98/26080 ;欧洲专利申 请案 EP 0 946 736 ;EP 0 732 403 ;EP 0 480 480 ;WO 90/10277 ;EP 0 340 986 ;EP 0 329 203 ;EP 0 324 274 ;禾口 EP 0 164 556。还参见 Gellissen 等人,ANT0N1EVAN LEEUffENHOEK (1992) 62 (1-2) :79_93 ;Romanos 等人,YEAST (1992) 8 (6) :423_488 ;Goeddel, METHODS IN ENZYM0L0GY(1990) 185 :3_7,其各自以引用的方式并入本文中。在使用所属领域的技术人员已知的标准进料分批发酵方法进行的扩增阶段期间, 可使酵母宿主菌株在发酵罐中生长。所述发酵方法可适用于解释特定酵母宿主的碳利用途 径或表达控制模式的差异。举例来说,酵母菌酵母宿主的发酵可能需要单一葡萄糖进料、 复杂氮源(例如酪蛋白水解产物)和多种维生素补充。相反,甲基营养型酵母巴斯德毕赤 酵母可能需要甘油、甲醇和痕量矿物进料,但仅需要简单铵(氮)盐以进行最佳生长和表 达。例如参见美国专利第 5,324,639 号;Elliott 等人,J. PROTEIN CHEM. (1990)9 95 ;和 Fieschko等人,BIOTECH. BI0ENG. (1987)29 :1113,其是以引用的方式并入本文中。然而,所述发酵方法可具有与所用的酵母宿主菌株无关的某些常见特征。举例来 说,在扩增阶段期间,可将限制生长的营养素(通常为碳)添加到发酵罐中以允许最大生 长。另外,发酵方法通常使用经设计成含有适量碳、氮、基本盐、磷和其它微量营养素(维生 素、痕量矿物和盐等)的发酵培养基。适用于毕赤酵母的发酵培养基的实例描述于美国专 利第5,324,639号和第5,231,178号中,其是以引用的方式并入本文中。感染杆状病毒的昆虫细胞术语“昆虫宿主”或“昆虫宿主细胞”是指可用作或已用 作重组载体或其它转移DNA的接受者的昆虫。所述术语包括已经转染的原始昆虫宿主细胞 的后代。应了解,由于偶发突变或故意突变,单一母体细胞的后代在形态上或在与原始母体 互补的基因组DNA或总DNA方面可能未必完全相同。与将要以相关性质(例如存在编码胰 岛素多肽的核苷酸序列)表征的母体充分类似的母体细胞的后代包括在由此定义所指代 的后代中。胰岛素多肽的杆状病毒表达适用于本发明且因为胰岛素可在包括细菌、哺乳动 物细胞、昆虫细胞、酵母或真菌的许多宿主细胞中生物合成,所以使用rDNA技术、多肽或其 前体。本发明的一实施例包括在细菌、酵母或哺乳动物细胞中生物合成胰岛素、经修饰胰岛 素、胰岛素多肽或胰岛素类似物。本发明的另一实施例包括在大肠杆菌或酵母中进行生物 合成。在哺乳动物细胞和转基因动物中生物合成的实例描述于Hakola,K. [Molecular and Cellular Endocrinology, 127 :59~69, (1997)]中。所属领域的技术人员已知适用于表达胰岛素多肽的昆虫细胞的选择。多种昆虫 物种在所属领域中得到充分描述并且在市面上有售,其包括埃及伊蚊(Aedesaegypti)、 MS (Bombyx mori) > HIl^M (Drosophila melanogaster) >(Spodoptera frugiperda)和粉纹夜蛾(Trichoplusia ni)。在选择用于表达的昆虫宿主时,合适的宿 主可包括显示具有良好分泌能力、低蛋白水解活性和总体稳固性的宿主。昆虫通常可获自 多种来源,包括(但不限于)加利福尼亚大学生物物理和医学物理系昆虫基因保藏中心 (Berkeley, CA);和美国典型菌种保藏中心(“ATCC”)(Manassas, VA)。通常,感染杆状病毒的昆虫表达系统的组分包括转移载体(通常为细菌质粒),其含有杆状病毒基因组的片段和用于插入欲表达的异源基因的便利限制位点;野生型杆状 病毒,其具有与转移载体中的杆状病毒特异性片段同源的序列(这允许将异源基因同源重 组到杆状病毒基因组中);以及适当的昆虫宿主细胞和生长培养基。所属领域中已知用于 构建载体、转染细胞、挑选斑块、使细胞在培养物中生长等的材料、方法和技术并且可使用 描述这些技术的手册。在将异源基因插入转移载体中之后,将载体和野生型病毒基因组转染到昆虫宿主 细胞中,其中载体与病毒基因组重组。表达经包装的重组病毒,并且鉴别和纯化重组体斑 块。用于杆状病毒/昆虫细胞表达系统的材料和方法可以试剂盒形式购自例如Invitrogen Corp. (Carlsbad, CA)。所属领域的技术人员通常已知这些技术,并且所述技术全面描述 于 SUMMERS AND SMITH, TEXAS AGRICULTURALEXPERIMENT STATION BULLETIN,第 1555 期, (1987)中,其是以引用的方式并入本文中。还参见RICHARDSON,39 METHODS IN MOLECULAR BIOLOGY :BACUL0VIRUS EXPRESSION PROTOCOLS (1995) ;AUSUBEL 等人,CURRENTPR0T0C0LS IN MOLECULAR BIOLOGY 16. 9-16. 11(1994) ;KING 禾Π P0SSEE,THE BACUL0VIRUS SYSTEM :A LABORATORY GUIDE(1992);以及 0' REILLY 等人,BACUL0VIRUS EXPRES SION VECTORS :A LABORATORY MANUAL(1992)。实际上,所属领域的技术人员已知使用杆状病毒/昆虫细胞表达系统来制备各种 异源蛋白质。例如参见美国专利第6,368,825号;第6,342,216号;第6,338,846号;第 6,261,805 号;第 6,245,528 号;第 6,225,060 号;第 6,183,987 号;第 6,168,932 号;第 6,126,944 号;第 6,096,304 号;第 6,013,433 号;第 5,965,393 号;第 5,939,285 号;第 5,891,676 号;第 5,871,986 号;第 5,861,279 号;第 5,858,368 号;第 5,843,733 号;第 5,762,939 号;第 5,753,220 号;第 5,605,827 号;第 5,583,023 号;第 5,571,709 号;第 5,516,657 号;第 5,290, 686 号;WO 02/06305 ;WO 01/90390 ;WO 01/27301 ;WO 01/05956 ; WO 00/55345 ;WO 00/20032 ;WO 99/51721 ;WO 99/45130 ;W099/31257;WO 99/10515 ; WO 99/09193 ;WO 97/26332 ;WO 96/29400 ;W096/25496 ;WO 96/06161 ;WO 95/20672 ; WO 93/03173 ;WO 92/16619 ;W092/02628 ;WO 92/01801 ;WO 90/14428 ;WO 90/10078 ;WO 90/02566 ;W090/02186 ;WO 90/01556 ;WO 89/01038 ;WO 89/01037 ;WO 88/07082,其是以引 用的方式并入本文中。所属领域中已知适用于杆状病毒/昆虫细胞表达系统的载体,并且所述载体例 如包括从杆状病毒苜蓿银纹夜蛾(Autographa californica)核型多角体病毒(AcNPV) 获得的昆虫表达和转移载体,其为不依赖于辅助细胞的病毒表达载体。从此系统得到的 病毒表达载体通常使用强病毒多角体蛋白基因启动子来驱动异源基因的表达。通常参见 0' Reilly 等人,BACUL0VIRUS EXPRESSION VECTORS :ALAB0RAT0RY MANUAL(1992)。在将外来基因插入杆状病毒基因组中之前,通常将包含启动子、前导序列(必要 时)、所关注的编码序列和转录终止序列的上述组分组装到中间错位构筑体(intermediate transplacement construct)(转移载体)中。中间错位构筑体通常保持在能够稳定保持在 宿主(例如细菌)中的复制子(例如染色体外元件(例如质粒))中。复制子将具有复制 系统,因此使其保持在适用于克隆和扩增的宿主中。更具体来说,质粒可含有多角体蛋白聚 腺苷酸化信号(Miller,ANN. REV. MICROBIOL. (1988)42:177)和用于在大肠杆菌中选择和 繁殖的原核氨比西林(ampicillin)抗性(amp)基因和复制起点。
88
一种将外来基因引入AcNPV中的常用转移载体为pAc373。也已经对所属领域的 技术人员已知的多种其它载体进行设计,所述载体包括例如PVL985,其将多角体蛋白起 始密码子从ATG改变为ATT,并且其在ATT下游32个碱基对处引入BamHI克隆位点。参 见 Luckow 和 Summers,VIROLOGY 170:31(1989)。其它市售载体例如包括 PBlueBac4. 5/ V5-His ;pBlueBacHis2 ;pMelBac ;pBlueBac4. 5(Invitrogen Corp. , Carlsbad, CA)。在插入异源基因之后,将转移载体和野生型杆状病毒基因组共转染到昆虫细胞宿 主中。所属领域中已知将异源DNA引入杆状病毒的所需位点中的方法。参见SUMMERS和 SMITH, TEXAS AGRICULTURAL EXPERIMENT STATIONBULLETIN,第 1555 期,(1987) ;Smith 等 人,M0L. CELL. BIOL. (1983)3 2156 ;Luckow和 Summers,Virology (1989) 170 :31。举例来说, 可通过同源双交叉重组插入例如多角体蛋白基因等基因中;也可插入所需杆状病毒基因中 工程改造过的限制酶位点中。参见Miller等人,BI0ESSAYS(1989) 11(4) :91。可通过电穿孔来实现转染。参见TROTTER和WOOD,39METH0DS I匪0LECULAR BIOLOGY(1995) ;Mann 和 King,J. GEN. VIROL. (1989)70:3501。或者,可使用脂质体以重组 表达载体和杆状病毒转染昆虫细胞。例如参见Liebman等人,BI0TECHNIQUES (1999) 26(1) 36 ;Graves ^ 人,BIOCHEMISTRY (1998) 37 :6050 ;Nomura 等 A, ]. BIOL. CHEM. (1998)273(22) 13570 ;Schmidt 等人,PROTEIN EXPRESSION AND PURIFICATION(1998) 12 323 ;Siffert 等人,NATURE GENETICS (1998) 18 :45 ;TILK1NS 等人,CELL BIOLOGY ALAB0RAT0RY HANDBOOK 145-154 (1998) ;Cai 等人,PROTEIN EXPRESSI0NAND PURIFICATION(1997) 10 263 ;Dolphin 等人,NATURE GENETICS(1997) 17 491 ;Kost 等 人,GENE (1997) 190 139 Jakobsson 等人,J. BIOL. CHEM. (1996)271 22203 ;Rowles 等 人,J. BIOL. CHEM. (1996)271 (37) 223/6 ;Reverey 等人,J. BIOL. CHEM. (1996)271(39) 23607-10 ;Stanley 等人,J. Biol. Chem. (1995) 270 :4121 ;Sisk 等人,J. Virol. (1994)68(2) :766 ;以及 Peng 等人,BI0TECHNIQUES(1993) 14(2) :274。市售脂质体例如 包括Cellfectin 和LiP0f"ectin (Invitrogen,Corp.,Carlsbad, CA)。另夕卜,也可使用 磷酸钙转染。参见 TROTTER 和 WOOD,39METH0DS IN MOLECULAR BIOLOGY(1995) ;Kitts, NAR(1990) 18(19) 5667 ;以及 Mann 和 King,J. GEN. VIROL. (1989)70:3501。杆状病毒表达载体通常含有杆状病毒启动子。杆状病毒启动子是能够与杆状病毒 RNA聚合酶结合并起始编码序列(例如结构基因)下游(3 ‘)转录进入mRNA中的任何DNA 序列。启动子将具有通常与编码序列的5'端最接近放置的转录起始区。此转录起始区通 常包括RNA聚合酶结合位点和转录起始位点。杆状病毒启动子也可具有被称作增强子的第 二域,当存在所述域时,其通常在结构基因的末梢。此外,表达可经调节或为组成性的。在感染周期的末期大量转录的结构基因提供尤其适用的启动子序列。实例包括 源自编码病毒多面体蛋白的基因(FRIESEN等人,The Regulation of BaculovirusGene Expression, THE MOLECULAR BIOLOGY OF BACULOVIRUSES(1986) ;EPO 127 839 禾Π O 155 476)和编码plO蛋白的基因(Vlak等人,J. GEN. VIR0L. (1988)69 765)的序列。将新近形成的杆状病毒表达载体包装到感染性重组杆状病毒中并且随后 可通过所属领域的技术人员已知的技术来纯化所生长斑块。参见Miller等人, BI0ESSAYS(1989) 11(4) :91 ;SUMMERS 禾口 SMITH,TEXAS AGRICULTURALEXPERIMENT STATION BULLETIN,第 1555 期,(1987)。
已开发用于感染到多种昆虫细胞中的重组杆状病毒表达载体。举例来说,已开 发用于埃及伊蚊(ATCC第CCL-125号)、桑蚕(ATCC第CRL-8910号)、黑腹果蝇(ATCC第 1963号)、草地贪夜蛾和粉纹夜蛾的重组杆状病毒。参见Wright,NATURE (1986) 321 718 ; Carbonell 等人,J. VIROL (1985) 56 153 ;Smith 等人,MOL. CELL. BI0L. (1983)3 :2156。通常 参见Fraser等人,IN VITRO CELL. DEV. BIOL. (1989)25:225。更具体来说,用于杆状病毒 表达载体系统的细胞系通常包括(但不限于)Sf9(草地贪夜蛾)(ATCC第CRL-1711号)、 Sf21(草地贪夜蛾)(Invitrogen Corp.,目录号 11497-013 (Carlsbad,CA))、Tri_368 (粉纹 夜蛾)和 High-Five BTI-TN-5B 1_4(粉纹夜蛾)。用于异源多肽在杆状病毒/表达载体中的直接表达和融合表达的细胞和培养基 在市面上有售,并且所属领域的技术人员通常已知细胞培养技术。大肠杆菌、假单胞菌属和其它原核牛物所属领域的技术人员已知细菌表达技术。 多种载体可用于细菌宿主中。载体可为单拷贝或低或高的多拷贝载体。载体可用于克隆和 /或表达。鉴于关于载体的丰富文献、多种载体的商业可得性以及甚至描述载体和其限制酶 图谱以及特征的手册,在本文中无需广泛讨论。众所周知,载体通常涉及允许选择的标记, 这些标记可提供细胞毒性剂抗性、原营养或免疫性。通常存在多个标记,其提供不同特征。细菌启动子为能够结合细菌RNA聚合酶并起始编码序列(例如结构基因)下游 (3')转录进入mRNA中的任何DNA序列。启动子将具有通常与编码序列的5'端最接近 放置的转录起始区。此转录起始区通常包括RNA聚合酶结合位点和转录起始位点。细菌启 动子也可具有被称作操纵基因的第二域,其可与开始RNA合成的相邻RNA聚合酶结合位点 重叠。操纵基因允许阴性调节(可诱导)转录,这是因为基因抑制蛋白可结合操纵基因并 从而抑制特定基因的转录。在不存在阴性调节元件(例如操纵基因)的情况下可发生组 成性表达。另外,可通过基因活化蛋白结合序列实现阳性调节,当存在所述结合序列时,所 述序列通常最接近RNA聚合酶结合序列的(5‘)。基因活化蛋白的实例为代谢产物活化 蛋白(CAP),其有助于起始大肠杆菌中Iac操纵子的转录[Raibaud等人,ANNU. REV. GENET. (1984) 18 :173]。因此,经调节的表达可为阳性或阴性,从而增强或减弱转录。编码代谢途径酶的序列提供尤其适用的启动子序列。实例包括来源于糖代谢酶 (例如半乳糖、乳糖(lac) [Chang等人,NATURE (1977) 198 1056]以及麦芽糖)的启动子序 列。其它实例包括来源于生物合成酶(例如色氨酸(trp))的启动子序列[Goeddel等人, NUC. ACIDS RES. (1980)8 4057 ;Yelverton 等人,NUCL. ACIDS RES. (1981)9 731 ;美国专利 第4,738,921号;欧洲公开案第036776号以及第121775号,其是以引用的方式并入本文 中]。β-半乳糖苷酶(bla)启动子系统[Weissmann(1981) 〃 The cloning of interferon and other mistakes. " Interferon 3 (I. Gresser 编)]、噬菌体 λ PL[Shimatake 等人, NATURE (1981) 292 128]以及T5 [美国专利第4,689,406号,其是以引用的方式并入本文 中]启动子系统还提供适用的启动子序列。本发明的优选方法利用强启动子(例如Τ7启 动子)来诱导高含量的胰岛素多肽。所属领域的技术人员已知这些载体的实例,并且其包 括来自Novagen的ρΕΤ29系列以及W099/05297(其是以引用的方式并入本文中)中所述的 PPOP载体。这些表达系统在宿主中产生高含量的胰岛素多肽,而不损害宿主细胞生存能力 或生长参数。pET19 (Novagen)是所属领域中已知的另一种载体。另外,在自然界中不存在的合成启动子也充当细菌启动子。举例来说,可将一个细菌或噬菌体启动子的转录活化序列与另一细菌或噬菌体启动子的操纵子序列连接,从而产 生合成杂合启动子[美国专利第4,551,433号,其是以引用的方式并入本文中]。举例来说, tac启动子是包含trp启动子与Iac操纵子序列的杂合trp-lac启动子,其由Iac阻遏物调 节[Amann 等人,GENE (1983) 25 167 ;de Boer 等人,PROC. NATL. ACAD. SCI. (1983)80 :21]。 此外,细菌启动子可包括非细菌来源的天然存在启动子,其具有与细菌RNA聚合酶结合并 起始转录的能力。也可将非细菌来源的天然存在启动子与可相容的RNA聚合酶偶合以产生 一些基因在原核生物中的高水平表达。噬菌体T7RNA聚合酶/启动子系统是偶合启动子系 统的实例[Studier 等人,J. MOL. BI0L. (1986) 189 113 ;Tabor 等人,Proc Natl. Acad. Sci. (1985)82:1074]。另外,杂合启动子也可包含噬菌体启动子和大肠杆菌操纵基因区(欧洲 公开案第267851号)。除功能启动子序列之外,有效核糖体结合位点也适用于在原核生物中表达外来 基因。在大肠杆菌中,核糖体结合位点被称作Shine-Dalgarno(SD)序列并包括起始密码 子(ATG)和位于起始密码子上游3-11个核苷酸处的长度为3-9个核苷酸的序列[Shine 等人,NATURE (1975) 254 34]。认为SD序列通过SD序列与大肠杆菌16S rRNA的3'端 之间的碱基配对来促进mRNA与核糖体的结合[Steitz等人,‘‘Genetic signals and nucleotide sequences in messenger RNA" , BiologicalRegulation and Development Gene Expression (Ed. R. F. Goldberger,1979)]。为表达具有弱核糖体结合位点的真核基因 禾口原核基因[Sambrook 等人,“Expression ofcloned genes in Escherichia coli “, Molecular Cloning :A Laboratory Manual,1989]。术语“细菌宿主”或“细菌宿主细胞”是指可用作或已用作重组载体或其它转移DNA 的接受者的细菌。所述术语包括已经转染的原始细菌宿主细胞的后代。应了解,由于偶发突 变或故意突变,单一母体细胞的后代在形态上或在与原始母体互补的基因组DNA或总DNA 方面可能未必完全相同。与将要以相关性质(例如存在编码胰岛素多肽的核苷酸序列)表 征的母体充分类似的母体细胞的后代包括在由此定义所指代的后代中。所属领域的技术人员已知适用于表达胰岛素多肽的宿主细菌的选择。在选择用 于表达的细菌宿主时,合适的宿主可包括显示具有良好包涵体形成能力、低蛋白水解活性 以及总体稳固性的宿主。细菌宿主通常可获自多种来源,包括(但不限于)加利福尼亚大 学生物物理和医学物理系细菌基因保藏中心(Berkeley,CA);以及美国典型菌种保藏中心 (“ATCC”)(Manassas, VA)。工业/医药发酵通常使用来源于K菌株的细菌(例如W3110) 或来源于B菌株的细菌(例如BL21)。这些菌株因其生长参数为人熟知且稳定而特别适用。 另外,这些菌株为非病原性的,出于安全性和环境原因,其在商业上较为重要。合适的大肠 杆菌宿主的其它实例包括(但不限于)BL21、DH10B或其衍生物的菌株。在本发明方法的另 一实施例中,大肠杆菌宿主为蛋白酶缺乏菌株,其包括(但不限于)0MP-和L0N-。宿主细胞 株可为假单胞菌种,包括(但不限于)荧光假单胞菌、绿脓杆菌以及恶臭假单胞菌。已知荧 光假单胞菌生物型1(命名为菌株MB 101)适用于重组制备且可用于治疗性蛋白质的制备 过程。假单胞菌表达系统的实例包括可以宿主菌株形式获自Dow Chemical Company的系 统(Midland,MI,可通过万维网在dow. com上获得)。在形成重组宿主细胞株(S卩,已将表达构筑体引入宿主细胞中并且分离出具有合 适表达构筑体的宿主细胞)后,在适于产生胰岛素多肽的条件下培养重组宿主细胞株。所
91属领域的技术人员显而易见,重组宿主细胞株的培养方法将依赖于所利用的表达构筑体的 性质以及宿主细胞的特点。通常使用所属领域的技术人员已知的方法来培养重组宿主菌 株。重组宿主细胞通常是在含有可吸收的碳、氮以及无机盐来源并且任选地含有维生素、 氨基酸、生长因子和所属领域的技术人员已知的其它蛋白质培养补充物的液体培养基中培 养。用于培养宿主细胞的液体培养基可任选地含有抗生素或抗真菌剂以防止不合需要的微 生物和/或化合物(包括(但不限于)用于选择含有表达载体的宿主细胞的抗生素)的生 长。重组宿主细胞可以分批或连续模式培养,其中细胞收集(在胰岛素多肽在细胞内 积聚的情况下)或培养物上清液的收集为分批或连续模式。对于原核宿主细胞中的制备来 说,优选分批培养和细胞收集。本发明的胰岛素多肽通常是在重组系统中表达之后纯化。胰岛素多肽可通过所属 领域中已知的多种方法从宿主细胞或培养基中纯化。细菌宿主细胞中所产生的胰岛素多肽 可具有弱溶解性或不可溶(呈包涵体形式)。在本发明的一实施例中,使用本文中揭示的方 法以及所属领域中已知的方法,可容易地在胰岛素多肽中进行为增加重组产生的蛋白质的 溶解性而选择的氨基酸取代。在不溶性蛋白质的情况下,可通过离心从宿主细胞溶菌液收 集蛋白质,并且其后可接着进行细胞的均质化。在具有弱溶解性的蛋白质的情况下,可添加 包括(但不限于)聚乙烯亚胺(PEI)的化合物以诱导部分可溶性蛋白质的沉淀。随后可通 过离心便利地收集沉淀的蛋白。使用所属领域的技术人员已知的多种方法,可使重组宿主 细胞破裂或均质化以从细胞内部释放包涵体。可使用熟知的技术来进行宿主细胞的破裂或 均质化,这些技术包括(但不限于)酶促细胞破裂、超声波降解法、杜恩斯均质化(doimce homogenization)或高压释放破裂。在本发明方法的一实施例中,使用高压释放技术使大肠 杆菌宿主细胞破裂以释放胰岛素多肽的包涵体。在处理胰岛素多肽的包涵体时,最好使重 复过程的均质化时间最小化以使包涵体产率最大化且不会由于例如溶解、机械剪切或蛋白 质水解等因素造成损失。随后,可使用所属领域中已知的多种合适的增溶剂中的任一种来溶解不溶性或沉 淀的胰岛素多肽。可用尿素或盐酸胍溶解胰岛素多肽。应使溶解的胰岛素多肽的体积最小 化,从而可使用可方便操作的批量大小来制备大批量。在重组宿主可以体积为数千升的批 量生长的大规模商业装置中,这个因素可为重要的。另外,当在大规模商业装置中制造胰岛 素多肽时,特别是对于人类医药用途来说,如果可能的话,应避免可损害机器和容器的苛刻 化学品或其蛋白质产物。本发明的方法中已展示,可使用较温和的变性剂尿素代替较苛刻 的变性剂盐酸胍来溶解胰岛素多肽包涵体。尿素的使用显著降低损害胰岛素多肽的制造和 纯化过程中使用的不锈钢设备的风险,同时有效溶解胰岛素多肽包涵体。在可溶性胰岛素蛋白的情况下,可将胰岛素分泌到周质空间或培养基中。另外,可 溶性胰岛素可能存在于宿主细胞的细胞质中。可能需要在进行纯化步骤之前浓缩可溶性胰 岛素。可使用所属领域的技术人员已知的标准技术从例如细胞溶菌液或培养基浓缩可溶性 胰岛素。另外,可使用所属领域的技术人员已知的标准技术来破裂宿主细胞且从宿主细胞 的细胞质或周质空间释放可溶性胰岛素。当制备呈融合蛋白形式的胰岛素多肽时,可去除融合序列。可通过酶促或化学裂 解来实现融合序列的去除。可使用所属领域的技术人员已知的方法来实现融合序列的酶促去除。所属领域的技术人员将显而易见,用于去除融合序列的酶的选择将由融合体的特 点决定,并且反应条件将根据酶的选择进行指定。可使用所属领域的技术人员已知的试剂 (包括(但不限于)溴化氰、TEV蛋白酶和其它试剂)来实现化学裂解。可通过所属领域的 技术人员已知的方法从裂解的融合序列中纯化裂解的胰岛素多肽。所属领域的技术人员将 显而易见,所述方法将由融合序列和胰岛素多肽的特点和性质决定。纯化方法可包括(但 不限于)尺寸排阻色谱、疏水性相互作用色谱、离子交换色谱或透析或其任何组合。也可纯化胰岛素多肽以从蛋白质溶液中去除DNA。虽然可通过所属领域中已知的 任何合适的方法(例如沉淀或离子交换色谱)去除DNA,但也可通过用核酸沉淀剂(例如 (但不限于)硫酸鱼精蛋白)沉淀来去除DNA。可使用包括(但不限于)离心或过滤的熟知 的标准方法使胰岛素多肽与沉淀的DNA分离。在将使用胰岛素多肽来治疗人类的背景中, 宿主核酸分子的去除为重要因素,并且本发明的方法将宿主细胞DNA降到医药学上可接受 的水平。用于小规模或大规模发酵的方法也可用于蛋白质表达中,所述方法包括(但不限 于)发酵罐、振荡烧瓶、流化床生物反应器、中空纤维生物反应器、滚瓶培养系统以及搅拌 槽生物反应器系统。这些方法中的每一种都可以分批、分批馈料或连续模式方法进行。通常,可使用所属领域中的标准方法来回收本发明的人类胰岛素多肽。举例来说, 可离心或过滤培养基或细胞溶菌液以去除细胞碎片。可将上清液浓缩或稀释到所需体积或 透滤到合适的缓冲液中以调节供进一步纯化的制剂。本发明的胰岛素多肽的进一步纯化包 括从完整形式中分离脱除酰胺基和剪短形式的胰岛素多肽变异体。以下示范性程序中的任一种都可用于纯化本发明的胰岛素多肽亲和色谱;阴离 子或阳离子交换色谱(使用(包括(但不限于))DEAE SEPHAR0SE);硅胶色谱;高效液相 色谱(HPLC);反相HPLC ;凝胶过滤(使用(包括(但不限于))SEPHADEX G-75);疏水性相 互作用色谱;尺寸排阻色谱;金属螯合物色谱;超滤/透滤;乙醇沉淀;硫酸铵沉淀;色谱聚 焦;置换色谱;电泳程序(包括(但不限于)制备型等电聚焦);差异溶解度(包括(但不 限于)硫酸铵沉淀);SDS-PAGE ;或萃取。根据所属领域的技术人员已知并使用的标准程序,可将本发明的蛋白质(包括 (但不限于)包含非天然氨基酸的蛋白质、包含非天然氨基酸的肽、包含非天然氨基酸的蛋 白质的抗体、包含非天然氨基酸的蛋白质的结合搭配物等)部分或实质上纯化成均质。因 此,可通过所属领域的技术人员已知的多种方法中的任一种来回收和纯化本发明的多肽, 这些方法包括(但不限于)硫酸铵或乙醇沉淀、酸或碱萃取、柱色谱、亲和柱色谱、阴离子或 阳离子交换色谱、磷酸纤维素色谱、疏水性相互作用色谱、羟基磷灰石色谱、外源凝集素色 谱、凝胶电泳等。在制备正确折叠的成熟蛋白质时,必要时可使用蛋白质再折叠步骤。当需 要高纯度时,在最后纯化步骤中可使用高效液相色谱(HPLC)、亲和色谱或其它合适的方法。 在一实施例中,使用针对非天然氨基酸(或包含非天然氨基酸的蛋白质或肽)形成的抗体 作为纯化试剂,从而(包括(但不限于))用于包含一个或一个以上非天然氨基酸的蛋白质 或肽的以亲和性为基础的纯化。必要时,在部分纯化或纯化成均质后,任选地将所述多肽用 于多种应用,包括(但不限于)用作测定组分、治疗剂、预防剂、诊断剂、研究试剂和/或用 作抗体产生的免疫原。可通过使用常规方案向动物(优选非人类动物)投与本发明的多肽 或带表位的片段或细胞来获得针对本发明的多肽而产生的抗体。所属领域的技术人员可使
93用多种已知技术来产生抗体。此外,可使用转基因小鼠或其它生物体(包括其它哺乳动物) 来表达人源化抗体。可使用上述抗体来分离或鉴别表达多肽的克隆或纯化多肽。也可利用 针对本发明的多肽而产生的抗体来治疗疾病。本发明的多肽和多核苷酸也可用作疫苗。因此,另一方面,本发明涉及一种在哺乳 动物中诱导免疫反应的方法,其包含使哺乳动物接种足以产生抗体和/或T细胞免疫反应 (例如包括产生细胞因子的T细胞或细胞毒性T细胞)的本发明多肽以保护所述动物免患 疾病,而无论个体是否已产生所述疾病。也可用以下方法诱导哺乳动物中的免疫反应,所述 方法包含在活体内通过指导多核苷酸表达并编码多肽的载体传递本发明的多肽,以诱导 所述免疫反应,从而产生抗体来保护所述动物免患本发明的疾病。一种投与载体的方式是 以粒子上的涂层的形式或以其它形式使其加速进入所需细胞中。所述核酸载体可包含DNA、 RNA、经修饰核酸或DNA/RNA杂合体。为用作疫苗,多肽或核酸载体通常将以疫苗调配物(组 合物)形式提供。调配物可进一步包含合适的载剂。因为多肽可在胃中分解,所以其可肠 外(例如皮下、肌肉内、静脉内或皮内注射)投与。适于肠外投与的调配物包括水性和非 水性的无菌注射溶液,其可含有抗氧化剂、缓冲剂、抑菌剂和使调配物与接收者的血液等张 的溶质;以及水性和非水性的无菌悬浮液,其可包括悬浮剂或增稠剂。疫苗调配物也可包括 所属领域的技术人员已知的用于增强调配物的免疫原性的佐剂系统。剂量将视疫苗的特定 活性而定并且可通过常规实验容易地确定。替代系统中的表达已使用多种策略将非天然氨基酸引入非重组宿主细胞、诱变宿主细胞或不含细 胞的系统中的蛋白质中。这些系统也适用于制备本发明的胰岛素多肽。例如Lys、Cys 和Tyr等具有反应性侧链的氨基酸的衍生使得赖氨酸转化为N2-乙酰基-赖氨酸。化 学合成还提供合并非天然氨基酸的直接方法。通过肽片段的酶促连接和天然化学连接 的新近发展,有可能制造较大蛋白质。例如参见P. E.Dawson和S. B. H. Kent,Annu. Rev. Biochem,69 =923(2000)。化学肽连接和天然化学连接描述于美国专利第6,184,344号、 美国专利公开案第2004/0138412号、美国专利公开案第2003/0208046号、WO 02/098902 和TO 03/042235中,所述专利是以引用的方式并入本文中。已使用将利用所需非天然 氨基酸以化学方式酰化的抑制因子tRNA添加到能够支持蛋白质生物合成的活体外提取 物中的通用活体外生物合成方法将超过100个非天然氨基酸位点特异性地并入几乎任何 尺寸的多种蛋白质中。例如参见 V.W.Cornish,D.Mendel 和 P. G. Schultz,Angew. Chem. Int. Ed. Engl. 1995,34 621 (1995) ;C. J. Noren, S. J. Anthony-Cahi 11, M. C. Griffith, P. G. Schultz, A generalmethod for site-specific incorporation of unnatural amino acids into proteins, Science244 182-188 (1989);以及 J. D. Bain, C. G. Glabe, T. A. Dix, A. R. Chamberlin, E. S. Diala, Biosynthetic site-specific incorporation of a unnatural amino acid into apolypeptide,J. Am. Chem. Soc. Ill :8013_8014(1989)。已 经将多种官能团引入蛋白质中以供研究蛋白质稳定性、蛋白质折叠、酶机理和信号转导。除了本文中指出的其它参考文献外,所属领域的技术人员还已知多种纯化/蛋 白质折叠方法,其包括(但不限于)以下文献中列出的那些方法R. Scopes,Protein Purification. Springer-Verlag, N. Y. (1982) ;Deutscher, Methods inEnzymology 第 182 卷Guide to Protein Purification, Academic Press, Inc. N. Y. (1990) ;Sandana,(1997)Bioseparation of Proteins. Academic Press, Inc. ;Bollag 等人,(1996)Protein Methods,第 2 fk, ffiley-Liss, NY ;Walker, (1996)The ProteinProtocols Handbook Humana Press, NJ ;Harris 禾口 Angal, (1990)Protein PurificationApplications :A Practical Approach IRL Press at Oxford, Oxford, England ;Harris 禾口 Angal, Protein Purification Methods :A Practical Approach IRL Press at Oxford, Oxford,England ; Scopes, (1993)Protein Purification :Principles and Practice 第 3 片反 Springer Verlag, NY ;Janson 禾口 Ryden,(1998)Protein Purification Principles,HighResolution Methods and Applications,第 2 版,Wiley-VCH,NY ;以及 Walker(1998),Protein Protocols on CD-ROM Humana Press,NJ ;以及其中引用的参考文献。在真核宿主细胞或非真核宿主细胞中产生所关注的具有非天然氨基酸的蛋白质 或多肽的一个优点在于,所述蛋白质或多肽通常将折叠成其天然构象。然而,在本发明的 某些实施例中,所属领域的技术人员应认识到,在合成、表达和/或纯化之后,蛋白质或肽 可能具有与相关多肽所需的构象不同的构象。在本发明的一方面,任选地使所表达的蛋白 质或多肽变性并且随后使其复性。这是利用所属领域中已知的方法来实现,所述方法包括 (但不限于)向所关注的蛋白质或多肽中添加伴侣蛋白(chaperonin)、将蛋白质溶解于例 如盐酸胍等离液剂中、利用蛋白质二硫化物异构酶等。一般来说,有时需要使所表达的多肽变性和还原并且随后使多肽再折叠成优选构 象。举例来说,可将胍、尿素、DTT、DTE和/或伴侣蛋白添加到所关注的翻译产物中。所属领 域的技术人员已知使蛋白质还原、变性和复性的方法(参见上述参考文献以及Debinski等 人,(1993) J. Biol. Chem.,268 14065-14070 ;Kreitman 禾口 Pastan (1993) Bioconjug. Chem., 4 581-585 ;以及Buchner 等人,(1992) Anal. Biochem.,205 :263_270)。举例来说,Debinski 等人描述胍-DTE中包涵体蛋白质的变性和还原。可在含有(包括(但不限于))氧化型谷 胱甘肽和L-精氨酸的氧化还原缓冲剂中使蛋白质再折叠。可使再折叠试剂流动或以其它 方式移动以与一种或一种以上多肽或其它表达产物接触,或者反之亦然。在原核制备胰岛素多肽的情况下,如此产生的胰岛素多肽可能错误折叠并且因而 缺乏生物活性或者生物活性降低。可通过“再折叠”来恢复蛋白质的生物活性。一般来说, 通过使用例如一种或一种以上离液剂(例如尿素和/或胍)和能够还原二硫键的还原剂 (例如二硫苏糖醇、DTT或2-巯基乙醇(2-ME))溶解(其中胰岛素多肽也不可溶)、展开并 还原多肽链而使错误折叠的胰岛素多肽再折叠。在中等浓度的离液剂下,随后添加氧化剂 (例如氧、胱氨酸或胱胺),这可再形成二硫键。可使用所属领域中已知的标准方法使胰岛 素多肽再折叠,所述方法例如美国专利第4,511,502号、第4,511,503号和第4,512,922号 中所述的方法,所述文献是以引用的方式并入本文中。胰岛素多肽也可与其它蛋白质共折 叠以形成异源二聚体或异源多聚体。在再折叠之后,可进一步纯化胰岛素。可使用所属领域的技术人员已知的多种技 术纯化胰岛素,所述技术包括疏水性相互作用色谱、尺寸排阻色谱、离子交换色谱、反相高 效液相色谱、亲和色谱等或其任何组合。其它纯化也可包括干燥或沉淀经纯化蛋白质的步
马聚ο在纯化后,可将胰岛素交换到不同缓冲液中和/或通过所属领域中已知的多种方 法(包括(但不限于)透滤和透析)中的任一种使其浓缩。以单一纯化蛋白质形式提供的胰岛素可进行聚集和沉淀。经纯化胰岛素可为至少90%纯(如由反相高效液相色谱(RP-HPLC)或十二烷基硫 酸钠_聚丙烯酰胺凝胶电泳(SDS-PAGE)所测量),或至少95%纯,或至少98%纯,或至少 99%或更纯。无论胰岛素的纯度的确切数值如何,胰岛素对于用作医药产品或用于进一步 处理(例如与例如PEG等水溶性聚合物结合)来说都是足够纯的。在不存在其它活性成分或蛋白质(除赋形剂、载剂和稳定剂、血清白蛋白等之外) 的情况下,某些胰岛素分子可用作治疗剂,或其可与另一种蛋白质或聚合物复合。一般纯化方法可以仵何适当顺序对包含胰岛素多肽的细胞溶菌液、提取物、培 养基、包涵体、宿主细胞的周质空间、宿主细胞的细胞质或其它材料或由任何分离步骤得 到的任何胰岛素多肽混合物进行多种分离步骤中的任一种,所述任何分离步骤包括(但 不限于)亲和色谱、离子交换色谱、疏水性相互作用色谱、凝胶过滤色谱、高效液相色谱 (“HPLC”)、反相HPLC( “RP-HPLC”)、膨胀床吸附或其任何组合和/或重复。用于实施本文中所述的技术的设备和其它必要材料在市面上有售。泵、馏分 收集器、监控器、记录器以及整个系统都可获自例如Applied Biosystems (FosterCity, CA)、Bio-Rad Laboratories, Inc. (Hercules, CA)以 及 Amersham Biosciences, Inc. (Piscataway,NJ)0包括(但不限于)交换基质材料、培养基以及缓冲液的色谱材料也可获 自这些公司。使用专用设备(例如泵)可更迅速地实现平衡以及在本文中所述的柱色谱过程 中的其它步骤(例如洗涤和洗提)。市售泵包括(但不限于)HIL0AD 泵P-50、蠕动泵 P-1、栗 P-901 禾口栗 P-903 (Amersham Biosciences, Piscataway, NJ)。馏分收集器的实例包括RediFrac馏分收集器、FRAC-100和FRAC-200馏分收集 器以及SUPERFRAC 馏分收集器(Amersham Biosciences, Piscataway, NJ) 也可使 用混合器来形成PH值和线性浓度梯度。市售混合器包括梯度混合器GM-I和管道混合器 (Amersham Biosciences,Piscataway, NJ)。可使用任何市售监控器来监控色谱过程。这些监控器可用于收集如UV、pH值 和传导率的信息。检测器的实例包括监控器UV-l、UVICORD S II、监控器UV-M II、监控器UV-900、监控器UPC-900、监控器pH/C_900以及传导率监控器(Amersham Biosciences, Piscataway, NJ)。实际上,整个系统都在市面上有售,其包括来自Amersham Biosciences (Piscataway, NJ)的各种AKTA 系统。在本发明的一实施例中,例如,可通过首先在尿素中使所得的经纯化胰岛素多肽 变性,接着在合适的PH值下在含有还原剂(例如DTT)的TRIS缓冲液中稀释来还原胰岛素 多肽并使其变性。在另一实施例中,使胰岛素多肽以约2Μ到约9Μ的浓度范围在尿素中变 性,接着在约5. O到约8. O的范围内的ρΗ值下在TRIS缓冲液中稀释。随后可培育这个实施 例的再折叠混合物。在一实施例中,再折叠混合物在室温下培育4小时到24小时。随后, 可进一步分离或纯化经还原并变性的胰岛素多肽混合物。如本文中所述,在进行任何后续分离步骤之前,可调节第一胰岛素多肽混合物的 PH值。另外,可使用所属领域中已知的技术来浓缩第一胰岛素多肽混合物或其任何后续混 合物。此外,可使用所属领域的技术人员已知的技术将包含第一胰岛素多肽混合物或其任 何后续混合物的洗提缓冲液交换为适用于下个分离步骤的缓冲液。
离子交换饩谱在一实施例中,并目.作为仵诜的额外步骤,可对第一胰岛素多肽 混合物进行离子交换色谱。通常参见ION EXCHANGE CHROMATOGRAPH Y PRINCIPLES AND METHODS (目录号 18-1114-2LAmersham Biosciences (Piscataway,NJ))。市售离子交换柱 包括HITRAP 、HIPREP 和HILOAD 柱(Amersham Biosciences,Piscataway,NJ) 这些柱利用强阴离子交换剂,例如Q SEPHAROSE Fast Flow, Q SEPHAROSE High Performance 和 Q SEPHAROSE XL ;强阳离子交换剂,例如 SP SEPHAROSE High Performance、SP SEPHAROSE Fast Flow 和 SP SEPHAROSE XL ;弱阴离子交换剂, 例如 DEAE SEPHAROSE Fast Flow ;以及弱阳离子交换剂,例如 CM SEPHAROSE Fast Flow(AmershamBiosciences, Piscataway, NJ)。可在纯化过程的任何阶段对胰岛素多肽进 行阴离子或阳离子交换柱色谱以分离实质上经纯化的胰岛素多肽。可使用任何合适的阳离 子交换基质来进行阳离子交换色谱步骤。适用的阳离子交换基质包括(但不限于)纤维状、 多孔、无孔、微粒、珠粒或交联阳离子交换基质材料。这些阳离子交换基质材料包括(但不 限于)纤维素、琼脂糖、葡聚糖、聚丙烯酸酯、聚乙烯、聚苯乙烯、二氧化硅、聚醚或任何上述 物质的复合物。阳离子交换基质可为任何合适的阳离子交换剂,包括强阳离子交换剂和弱阳离子 交换剂。强阳离子交换剂可能在宽PH值范围内保持离子化,并因此可能能够在宽pH值范 围内与胰岛素结合。然而,弱阳离子交换剂可能随着PH值变化而丧失离子化。举例来说, 当PH值降到约pH 4或pH 5以下时,弱阳离子交换剂可能失去电荷。合适的强阳离子交换 剂包括(但不限于)带电官能团,例如磺丙基(SP)、甲基磺酰基⑶或磺乙基(SE)。阳离 子交换基质可为优选具有约2. 5到约6. 0的胰岛素结合pH值范围的强阳离子交换剂。或 者,强阳离子交换剂可具有约PH 2.5到约?!1 5. 5的胰岛素结合pH值范围。阳离子交换基 质可为具有约3. 0的胰岛素结合pH值的强阳离子交换剂。或者,阳离子交换基质可为优选 具有约6. 0到约8. 0的胰岛素结合pH值范围的强阳离子交换剂。阳离子交换基质可为优 选具有约8. 0到约12. 5的胰岛素结合pH值范围的强阳离子交换剂。或者,强阳离子交换 剂可具有约PH 8. 0到约pH 12. 0的胰岛素结合pH值范围。在装载胰岛素之前,例如可使用多个柱体积的稀弱酸(例如4个柱体积的20mM乙 酸,pH 3)来平衡阳离子交换基质。平衡后可添加胰岛素并且在洗提实质上经纯化的胰岛素 之前,也可使用弱酸溶液(例如弱乙酸或磷酸溶液)将柱洗涤一到数次。举例来说,可使用 约2-4个柱体积的20mM乙酸(pH 3)来洗涤柱。举例来说,使用2_4个柱体积的0. 05M乙 酸钠(pH 5. 5)或使用与0. IM氯化钠混合的0. 05M乙酸钠(pH 5. 5)进行其它洗涤。或者, 使用所属领域中已知的方法,可使用多个柱体积的稀弱酸来平衡阳离子交换基质。或者,可通过使阳离子交换剂基质与具有足够低的pH值或离子强度的缓冲液接 触而置换基质中的胰岛素来洗提实质上经纯化的胰岛素。洗提缓冲液的PH值可在约pH 2. 5到约pH 6. 0的范围内。更具体来说,洗提缓冲液的pH值可在约pH 2. 5到约pH 5. 5、 约pH 2.5到约?!1 5.0的范围内。洗提缓冲液可具有约3.0的pH值。另外,洗提缓冲液的 量可在较大范围内改变并且通常将在约2到约10个柱体积的范围内。在使胰岛素多肽吸附到阳离子交换剂基质上之后,可通过使基质与具有足够高的 PH值或离子强度的缓冲液接触而置换基质中的胰岛素多肽来洗提实质上经纯化的胰岛素 多肽。适用于实质上经纯化的胰岛素多肽的高PH值洗提的缓冲液可包括(但不限于)浓度在至少约5mM到至少约IOOmM范围内的柠檬酸盐、磷酸盐、甲酸盐、乙酸盐、HEPES以及MES 缓冲液。反相饩谱可根据所属领域的技术人员已知的合适方案讲行RP-PIPLC以纯化蛋 白质。例如参见 Pearson 等人,ANAL BI0CHEM. (1982) 124:217-230(1982) ;Rivier 等人, J. CHR0M. (1983)268 :112_119 ;Kunitani 等人,J,CHR0M. (1986)359 :391_402。可对胰岛素 多肽进行RP-HPLC以分离实质上经纯化的胰岛素多肽。关于这一点,可使用含有具有多种 长度(包括(但不限于)至少约C3到至少约C30、至少约C3到至少约C20或至少约C3到 至少约C18树脂)的烷基官能团的二氧化硅衍生的树脂。或者,可使用聚合树脂。举例来 说,可使用TosoHaasAmberchrome CGlOOOsd树脂,其为苯乙烯聚合物树脂。也可使用具有 多种烷基链长度的氰基或聚合树脂。此外,可用例如乙醇等溶剂洗涤RP-HPLC柱。Source RP柱是RP-HPLC柱的另一个实例。可使用含有离子配对剂和有机改质剂(例如甲醇、异丙醇、四氢呋喃、乙腈或乙 醇)的合适洗提缓冲液从RP-HPLC柱洗提胰岛素多肽。最常用的离子配对剂包括(但不限 于)乙酸、甲酸、高氯酸、磷酸、三氟乙酸、七氟丁酸、三乙胺、四甲基铵、四丁基铵和乙酸三 乙基铵。可使用一种或一种以上梯度或等度条件来进行洗提,其中优选减少分离时间并降 低峰宽度的梯度条件。另一种方法涉及使用两种具有不同溶剂浓度范围的梯度。适用于本 文中的洗提缓冲液的实例可包括(但不限于)乙酸铵和乙腈溶液。疏水件相互作用饩谱纯化技术可对胰岛素多肽讲行疏水件相互作用饩谱 (HIC)。通常参见 HYDROPHOBIC INTERACTION CHR0MAT0GRAPHYHANDB00K PRINCIPLES AND METHODS (目录号 18-1020-90,AmershamBiosciences (Piscataway, NJ)),其是以引 用的方式并入本文中。合适的HIC基质可包括(但不限于)经烷基或芳基取代的基质, 例如经丁基、己基、辛基或苯基取代的基质,所述基质包括琼脂糖、交联琼脂糖、琼脂糖凝 胶(s印harose)、纤维素、二氧化硅、葡聚糖、聚苯乙烯、聚(甲基丙烯酸酯)基质以及混合 模式树脂(包括(但不限于)聚乙二胺树脂或经丁基或苯基取代的聚(甲基丙烯酸酯) 基质)。疏水性相互作用柱色谱的市售来源包括(但不限于)HITRAP 、HIPREP 和 HILOAD 柱(Amersham Biosciences, Piscataway, NJ)。简单地说,在装载之前,可使用所属领域的技术人员已知的标准缓冲液(例如乙 酸/氯化钠溶液或含有硫酸铵的HEPES)来平衡HIC柱。硫酸铵可用作装载HIC柱的缓冲 液。在装载胰岛素多肽后,随后可使用标准缓冲液和条件来洗涤柱以去除不需要的物质,但 将胰岛素多肽留在HIC柱上。可用约3到约10个柱体积的标准缓冲液(例如含有EDTA和 浓度低于平衡缓冲液的硫酸铵的HEPES缓冲液,或乙酸/氯化钠缓冲液)来洗提胰岛素多 肽。也可使用例如使用磷酸钾梯度的降低的线性盐梯度来洗提胰岛素分子。随后,可例如通 过过滤(例如透滤或超滤)来浓缩洗出液。可利用透滤来去除用于洗提胰岛素多肽的盐。其它纯化技术可对第一胰岛素多肽混合物或其任何后续混合物进行使用例如 凝胶过滤(GEL FILTRATION PRINCIPLES AND METHODS(目录号 18-1022-18,Amersham 8士0叱化11(^8,?化(^切冊7,町),其是以引用的方式并入本文中)、羟基磷灰石色谱(合适的 基质包括(但不限于)HA-Ultrogel、High Resolution (Calbiochem)、CHT陶瓷羟基磷灰石 (BioRad)、Bio-Gel HTP羟基磷灰石(BioRad) )、HPLC、膨胀床吸附、超滤、透滤、冻干等的另 一分离步骤,以去除任何过量盐并且用合适的缓冲液来代替所述缓冲液以用于下个分离步
可使用所属领域的技术人员已知的技术来监控本文中所述的各步骤中胰岛素多 肽(包括实质上经纯化的胰岛素多肽)的产率。所述技术也可用于在最后分离步骤后评估 实质上经纯化的胰岛素多肽的产率。举例来说,可使用多个具有多种烷基链长度的反相高 压液相色谱柱(例如氰基RP-HPLC、C18RP-HPLC以及阳离子交换HPLC和凝胶过滤HPLC)中 的任一种来监控胰岛素多肽的产率。在本发明的特定实施例中,各纯化步骤后胰岛素的产率可为各纯化步骤的起始物 质中的胰岛素的至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约 55 %、至少约60 %、至少约65 %、至少约70 %、至少约75 %、至少约80 %、至少约85 %、至少 约90 %、至少约91%、至少约92 %、至少约93 %、至少约94%、至少约95 %、至少约96 %、至 少约97%、至少约98%、至少约99%、至少约99. 9%或至少约99. 99%。可使用例如SDS-PAGE等标准技术或通过使用Western印迹法和ELISA测定测量 胰岛素多肽来测定纯度。举例来说,可针对从阴性对照酵母发酵和阳离子交换回收分离的 蛋白质产生多克隆抗体。所述抗体也可用于探测污染性宿主细胞蛋白质的存在。RP-HPLC材料Vydac C4 (Vydac)由硅胶粒子组成,其表面带有C4烷基链。胰岛素 多肽与蛋白质杂质的分离是基于疏水性相互作用强度的差异。用稀三氟乙酸中的乙腈梯度 进行洗提。使用不锈钢柱(填充2. 8到3. 2升Vydac C4硅胶)进行制备型HPLC。通过添 加三氟乙酸来酸化羟基磷灰石Ultrogel洗出液并且将其装载于Vydac C4柱上。使用稀三 氟乙酸中的乙腈梯度进行洗涤和洗提。收集洗提部分并且立即用磷酸盐缓冲液中和。汇集 在IPC限度内的胰岛素多肽洗提部分。DEAE Sepharose(Pharmacia)材料由与琼脂糖凝胶珠粒的表面共价结合的二乙基 氨基乙基(DEAE)基团组成。通过离子性相互作用来介导胰岛素多肽与DEAE基团的结合。 乙腈和三氟乙酸无滞留地通过柱。在这些物质被洗掉之后,通过用低PH值的乙酸盐缓冲 液洗涤柱来去除痕量杂质。随后用中性磷酸盐缓冲液洗涤柱并且用具有增加的离子强度 的缓冲液洗提胰岛素多肽。用DEAE Sepharose fastflow填充柱。调节柱体积以确保胰岛 素多肽装载量在每毫升凝胶3-10mg胰岛素多肽的范围内。用水和平衡缓冲液(磷酸钠/ 钾)洗涤柱。装填HPLC洗出液的汇集洗提部分并且用平衡缓冲液洗涤柱。随后用洗涤缓 冲液(乙酸钠缓冲液)洗涤柱,接着用平衡缓冲液洗涤。随后,用洗提缓冲液(氯化钠、磷 酸钠/磷酸钾)从柱中洗提胰岛素多肽并根据主要洗提概况将其收集成单一洗提部分。将 DEAES印harose柱的洗出液调节到指定传导率。将所得药物无菌过滤到特富龙(Teflon)瓶 中并贮存在-70°C下。可使用的其它方法包括(但不限于)去除内毒素的步骤。内毒素为位于革兰氏 阴性宿主细胞(例如大肠杆菌)的外膜上的脂多糖(LPS)。所属领域的技术人员已知用 于降低内毒素含量的方法,并且所述方法包括(但不限于)使用二氧化硅支撑物、玻璃粉 或羟基磷灰石的纯化技术;反相色谱;亲和色谱;尺寸排阻色谱;阴离子交换色谱;疏水性 相互作用色谱;这些方法的组合等。可能需要修改或其它方法以从所关注的多肽中去除污 染物(例如共迁移蛋白质)。所属领域的技术人员已知用于测量内毒素含量的方法,并且 所述方法包括(但不限于)鲎变形细胞溶菌液(Limulus Amebocyte Lysate ;LAL)测定。 EndosafeTM-PTS测定为利用预装载LAL试剂、发色底物和对照标准内毒素的料筒以及手持
99式分光光度计的比色、单管系统。替代方法包括(但不限于)测量浊度并且使用96孔形式 的动力学LAL方法。可使用多种方法和程序来评估包含一个或一个以上非天然编码氨基酸的胰岛 素蛋白质的产率和纯度,所述方法包括(但不限于)Bradford测定、SDS-PAGE、银染色 SDS-PAGE、考马斯(coomassie)染色SDS-PAGE、质谱(包括(但不限于)MALDI-T0F)以及所 属领域的技术人员已知的用于表征蛋白质的其它方法。其它方法包括(但不限于)与蛋白质染色法结合的SDS-PAGE、免疫印迹法、基质 辅助激光解吸附/离子化质谱(MALDI-MS)、液相色谱/质谱、等电聚焦、分析型阴离子交换、 色谱聚焦和圆二色谱。已开发被称作选择性压力并入的活体内方法以使用野生型合成酶的杂乱性。例如 参见 N. Budisa, C. Minks, S. Alefelder, W. Wenger, F. Μ. Dong, L. Moroder 禾口 R. Huber, FASEB J.,13 41 (1999)。使向细胞供应特定天然氨基酸的相关代谢路径关闭的营养缺陷型菌株在 含有有限浓度的天然氨基酸的基本培养基中生长,而靶基因的转录受到抑制。在静止生长 期开始时,天然氨基酸被耗尽并且由非天然氨基酸类似物置换。对重组蛋白表达的诱导使 得含有非天然类似物的蛋白质积聚。举例来说,已使用这种策略将邻氟苯丙氨酸、间氟苯丙 氨酸和对氟苯丙氨酸并入蛋白质中,并且其在UV光谱中显示两个可容易地鉴别的特征肩 峰,例如参见 C. Minks, R. Huber,L. Moroder 和 N. Budisa, Anal. Biochem. , 284 29(2000);已 使用三氟蛋氨酸来代替噬菌体Τ4溶菌酶中的蛋氨酸,从而通过19F NMR研究其与壳寡糖配 体的相互作用,例如参见 H. Duewel,E. Daub, V. Robinson 禾口 J. F. Honek, Biochemistry, 36 3404(1997);并且已并入三氟亮氨酸来代替亮氨酸,从而使亮氨酸拉链蛋白的热稳定性和 化学稳定性增加。例如参见 Y. Tang, G. Ghirlanda, W. A. Petka, Τ. Nakajima,W. F. DeGrado 和 D. A. Tirrell,Angew. Chem. Int. Ed. EngI. ,40 :1494(2001)。此外,将硒代蛋氨酸和碲代 蛋氨酸并入各种重组蛋白中以促进X射线结晶学中的相溶解。例如参见W. A. Hendrickson, J. R. Horton 禾口 D. M. Lemaster, EMBO J.,9 1665 (1990) J. 0. Boles, K. Lewinski,Μ· Kunkle, J. P. Odom,B. Dunlap,L Lebioda 禾口 Μ· Hatada,Nat. Struct. Biol. ,1 283(1994) ;N. Budisa, B.Steipe, P. Demange, C. Eckerskorn, J. Kellermann 禾口 R. Huber, Eur. J. Biochem. ,230 788 (1995);以及 N. Budisa, W. Karnbrock, S. Steinbacher, A. Humm, L. Prade, Τ. Neuefeind, L. Moroder和R. Huber, J. Mol. Biol.,270 =616(1997)。也已有效并入具有烯或炔官能团的 蛋氨酸类似物,从而允许通过化学方式对蛋白质进行其它修饰。例如参见J. C. M. vanHest 和 D. A. Tirrell, FEBS Lett.,428 68 (1998) J. C. M. vanHest, K. L. Kiick 和 D. A. Tirrell, J. Am. Chem. Soc. 122 1282(2000);以及 K. L. Kiick 和 D.A. Tirrell,Tetrahedron, 56 9487(2000);美国专利第6,586,207号;美国专利公开案第2002/0042097号,其是以引用 的方式并入本文中。这种方法的成功取决于氨酰基tRNA合成酶对非天然氨基酸类似物的识别,所述 合成酶通常需要高选择性以确保蛋白质翻译的保真度。一种扩展这种方法的范围的方式在 于放宽氨酰基tRNA合成酶的底物特异性,这已在有限数目的情况下达成。举例来说,在大 肠杆菌苯丙氨酰基tRNA合成酶(PheRS)中由Gly置换Ala294可增加底物结合袋的尺寸,并 且导致对氯苯丙氨酸(p-Cl-Phe)使tRNAPhe酰化。参见M. Ibba, P. Kast和H. Hennecke, Biochemistry, 33 :7107(1994)。带有这种突变PheRS的大肠杆菌菌株允许并入对氯苯丙氨酸或对溴苯丙氨酸来代替苯丙氨酸。例如参见M. Ibba和H. Hennecke, FEBS Lett., 364 272(1995);以及 N. Sharma,R. Furter, P. Kast 禾Π D. A. Tirrell, FEBS Lett. ,467 37 (2000)。类似地,显示接近大肠杆菌酪氨酰基tRNA合成酶的氨基酸结合位点的点突变 Phel30Ser允许氮杂酪氨酸比酪氨酸更有效地并入。参见F. Hamano-Takaku,T. Iwama, S. Saito-Yano, K.Takaku, Y. Monden, M. Kitabatake, D.Soil 禾口 S. Nishimura, J.Biol. Chem. ,275 40324(2000)。在活体内将非天然氨基酸并入蛋白质中的另一种策略是修饰具有校对机制的合 成酶。这些合成酶无法区分在结构上与同源天然氨基酸类似的氨基酸并且因此使其活化。 此错误在单独位点上得到修正,这使来自tRNA的错配氨基酸去酰化以保持蛋白质翻译的 保真度。如果合成酶失去校对活性,那么错误活化的结构类似物可避开编辑功能并且被并 入。目前已用缬氨酰基tRNA合成酶(ValRS)证实这种方法。参见V. Doring,H. D. Mootz, L. A. Nangle, Τ. L. Hendrickson, V. deCrecy-Lagard, P. Schimmel 禾口 P. MarIiere, Science, 292 501 (2001)。ValRS可利用Cys、Thr或氨基丁酸(Abu)使tRNAVal错误氨酰基化;随后, 通过编辑域水解这些非同源氨基酸。在使大肠杆菌染色体随机诱变之后,选择在ValRS的 编辑位点中具有突变的突变大肠杆菌菌株。这种编辑缺陷型ValRS错误地使tRNAVal装有 Cys0因为Abu与Cys在空间上类似(Cys的-SH基团是由Abu中的-CH3置换),所以当这 种突变大肠杆菌菌株在存在Abu的情况下生长时,突变ValRS也将Abu并入蛋白质中。质 谱分析显示在天然蛋白质中的各缬氨酸位置处约24%的缬氨酸由Abu置换。固相合成和半合成方法也已允许合成含有新颖氨基酸的多种蛋白质。举例来 说,参见以下公开案和其中引用的如下参考文献Crick,F. H. C.,Barrett, L. Brenner, S.ffatts-Tobin, R.General nature of the genetic code for proteins. Nature, 192:1227-1232 (1961) ;Hofmann, K. , Bohn, H.Studies on polypeptides. XXXVI, Theeffect of pyrazole—imidazole replacements on the S—protein activating potency of onS-peptide fragment, J. Am Chem,88(24) :5914_5919(1966) ;Kaiser, E. T. Syntheticapproaches to biologically active peptides and proteins including enyzmes,Ace ChemRes,22 :47_54(1989) ;Nakatsuka, Τ. ,Sasaki,Τ. ,Kaiser,Ε.Τ.Peptide segment couplingcatalyzed by the semisynthetic enzyme thiosubtilisin, J Am Chem Soc,109 3808-3810(1987) ;Schnolzer, Μ. , Kent, S B H.Constructing proteins by dovetailing unprotectedsynthetic peptides :backbone_engineered HIV protease, Science,256(5054) :221_225(1992) ;Chaiken, I. M. Semisynthetic peptides and proteins, CRC Crit Rev Biochem,11 (3) 255-301 (1981) ;Offord, R. Ε. Protein engineering by chemical means ? ProteinEng. , 1 (3) : 151-157 (1987);以及 Jackson, D. Y. , Burnier, J. , Quan, C,Stanley,Μ. ,Tom,J., Wells, J. A. A Designed Peptide Ligase for Total Synthes of Ribonuclease A withUnnatural Catalytic Residues, Science, 266(5183) :243(1994)。已使用化学修饰在活体外将包括辅因子、自旋标记和寡核苷酸的多种非 天然侧链引入蛋白质中。例如参见Corey, D. R.,Schultz,P. G. Generation of a hybridsequence-specific single-stranded deoxyribonuclease, Science,238(4832) 1401-1403(1987) ;Kaiser,Ε. T. ,Lawrence D. S. ,Rokita,S. E. The chemical modification
101ofenzymatic specificity, Annu Rev Biochem,54 :565_595(1985) ;Kaiser, Ε. Τ., Lawrence, D. S. Chemical mutation of enyzme active sites, Science,226(4674) 505-511(1984) ;Neet, K. Ε. , Nanci A, Koshland, D. Ε.Properties of thiol-subtilisin, J Biol. Chem,243(24) :6392_6401 (1968) ;Polgar, L. et Μ. L. Bender, A new enzyme containing asynthetically formed active site.Thiol-subtilisin. J. Am Chem Soc, 88 3153-3154(1966);以及 Pollack,S. J.,Nakayama, G. Schultz, P. G. Introduction of nucleophilesand spectroscopic probes into antibody combining sites, Science, 242(4881) : 1038-1040(1988)。或者,使用以化学方式修饰的氨酰基tRNA的生物合成方法已用于将多种生物 物理探针并入在活体外合成的蛋白质中。参见以下公开案和其中所引用的参考文献 Brunner, J. New Photolabeling and crosslinking methods,Annu. Rev Biochem,62 483-514(1993) ; L^^Krieg, U. C. , Walter, P. , Hohnson, Α. Ε. Photocrosslinking ofthe signal sequence of nascent preprolactin of the 54-kilodalton polypeptide of thesignal recognition particle, Proc. Natl. Acad. Sci,83 (22) :8604_8608 (1986)。先前已显示,可通过向利用含有所需琥珀无义突变的基因编程的蛋白质合成反应 中添加以化学方式氨酰基化的抑制因子tRNA而在活体外将非天然氨基酸位点特异性地并 入蛋白质中。使用这些方法,可使用特定氨基酸的营养缺陷型菌株,用密切结构同源物取代 20种常见氨基酸中的多种氨基酸,例如用氟苯丙氨酸取代苯丙氨酸。例如参见Noren,C. J., Anthony-Cahill,Griffith,Μ. C.,Schultz, P. G. Ageneral method for site-specific incorporation of unnatural amino acids into proteins, Science,244 182-188(1989) ;M. W. Nowak 等人,Science 268 :439_42 (1995) ;Bain, J. D.,Glabe,C. G., Dix, Τ. A. , Chamberlin,A. R. ,Diala,E.S.Biosynthetic site-specificlncorporation of a non-natural amino acid into a polypeptide,J. Am Chem Soc,111 :8013_8014 (1989); N. Budisa 等人,FASEB J. 13 :41_51 (1999) ;Ellman,J. A.,Mendel,D.,Anthony-Cahill, S.,Noren, C. J.,Schultz,P. G. Biosynthetic method forintroducing unnatural amino acids site-specifically into proteins, Methods in Enz.,第 202 卷,301-336(1992); 以及 Mendel,D.,Cornish,V. W.禾口 Schultz,P. G. Site-DirectedMutagenesis with an Expanded Genetic Code,Annu Rev Biophvs. Biomol Struct. 24,435-62(1995)。举例来说,制备识别终止密码子UAG的抑制因子tRNA并且用非天然氨基酸以化 学方式使其氨酰基化。使用常规定点诱变在蛋白质基因中的所关注位点处引入终止密 码子 TAG。例如参见 Sayers, J. R. , Schmidt, W. Eckstein, F. 5 ‘ -3 ‘ Exonuclease in phosphorothioate-based olignoucleotide-directed mutagensis, NucleicAcids Res, 16(3) =791-802(1988)。当将酰基化抑制因子tRNA和突变基因组合到活体外转录/翻译 系统中时,回应UAG密码子而并入非天然氨基酸,这得到在指定位置处含有所述氨基酸的 蛋白质。使用[3H]_Phe的实验以及使用α-羟基酸的实验证实,在由UAG密码子指定的位 置处仅并入所需氨基酸且此氨基酸未在蛋白质中的任何其它位点处并入。例如参见Noren 等人,同上文;Kobayashi 等人,(2003)Nature Structural Biology 10(6) :425_432 ;以 及 Ellman, J. A. , Mendel, D. , Schultz, P. G. Site-specific incorporation of novel backbone structures into proteins, Science,255(5041) :197_200(1992)。
可通过任何方法或技术(包括(但不限于)化学或酶促氨酰基化)利用所需氨基 酸使tRNA氨酰基化。可通过氨酰基tRNA合成酶或其它酶促分子(包括(但不限于)核糖酶)来实现氨 酰基化。术语“核糖酶”可与“催化性RNA”互换。Cech和同事(Cech,1987,Science,236 1532-1539 ;McCorkle 等人,1987, Concepts Biochem. 64 221~226)证实存在可充当催化剂 的天然存在RNA (核糖酶)。然而,尽管仅证实这些天然RNA催化剂对核糖核酸底物具有裂 解和剪接作用,但关于核糖酶人工开发的新近发展已将催化谱系扩大到各种化学反应。研 究已鉴别出可催化自身(2' )3'末端的氨酰基RNA键的RNA分子(Illangakekare等人, 1995Science 267 :643_647),以及可将氨基酸从一个RNA分子转移到另一个RNA分子的 RNA 分子(Lohse 等人,1996,Nature 381 :442_444)。美国专利申请公开案2003/0228593(其是以引用的方式并入本文中)描述构建 核糖酶的方法和其在利用天然编码和非天然编码氨基酸使tRNA氨酰基化中的用途。可 使tRNA氨酰基化的酶分子(包括(但不限于)核糖酶)的底物固定形式使得能够有效地 亲和纯化氨酰基化产物。合适的底物的实例包括琼脂糖、琼脂糖凝胶和磁性珠粒。用于氨 酰基化的底物固定形式的核糖酶的制备和使用描述于Chemistry and Biology 2003,10 1077-1084以及美国专利申请公开案2003/0228593中,其是以引用的方式并入本文中。化学氨酰基化方法包括(但不限于)避免在氨酰基化过程中使用合成酶的由 Hecht 禾口同事(Hecht, S. M. Ace. Chem. Res. 1992,25,545 ;Heckler, Τ. G. ;Roesser, J. R.; Xu, C ;Chang, P. ;Hecht, S. Μ. Biochemistry 1988,27,7254 ;Hecht, S. Μ. ;Alford, B. L.; Kuroda, Y. ;Kitano, S. J. Biol. Chem. 1978,253,4517)以及由 Schultz、Chamberlin、 Dougherty 禾口 其它人(Cornish, V. W. ;Mendel, D. ;Schultz, P.G. Angew. Chem. Int. Ed. Engl. 1995, 34, 621 ;Robertson, S. Α. ;Ellman, J. Α. ;Schultz, P. G. J. Am. Chem. Soc. 1991,113,2722 ;Noren, C. J. ;Anthony-Cahi11, S. J. ;Griffith, Μ. C ;Schultz, P. G. Science 1989,244,182 ;Bain, J. D. ;Glabe, C. G. ;Dix, Τ. Α. ; Chamberl in, A. R. J.Am. Chem. Soc. 1989,111,8013 ;Bain, J. D.等人,Nature 1992,356,537 ;Gallivan,J. P.; Lester, H. Α. ;Dougherty, D. A. Chem. Biol. 1997, 4, 740 ;Turcatti 等 K, J. Biol. Chem. 1996,271,19991 ;Nowak, M. W.等 K, Science, 1995, 268,439 ;Saks, Μ. E.等人, J. Biol. Chem. 1996,271,23169 ;Hohsaka,T.等人,J. Am. Chem. Soc. 1999,121,34)(其是以 引用的方式并入本文中)介绍方法。所述方法或其它化学氨酰基化方法可用于使tRNA分 子氨酰基化。产生催化性RNA的方法可涉及产生单独的随机核糖酶序列的池,对所述池进行定 向演化,针对所需氨酰基化活性筛选所述池,并且选择显示所需氨酰基化活性的核糖酶序 列。核糖酶可包含促进酰化活性的基元和/或区,例如GGU基元和富含U的区。举例 来说,已报道富含U的区可促进氨基酸底物的识别,并且GCiU基元可与tRNA的3'末端形成 碱基对。GGU基元和富含U的区的组合促进氨基酸与tRNA的同时识别,并且从而促进tRNA 的3'末端的氨酰基化。可通过使用与tRNAAsn。ra结合的部分随机化r24mini进行活体外选择,接着系统 性工程改造在活性克隆中发现的一致序列来产生核糖酶。由这种方法获得的示范性核糖酶被称作“Fx3核糖酶”并且描述于美国公开申请案第2003/0228593号(其内容是以引用的 方式并入本文中)中,其充当合成各种装载有同源非天然氨基酸的氨酰基tRNA的通用催化 剂。在底物上固定可用于促成氨酰基化tRNA的有效亲和性纯化。合适的底物的实例 包括(但不限于)琼脂糖、琼脂糖凝胶和磁性珠粒。可利用RNA的化学结构将核糖酶固定 在树脂上,例如,可用高碘酸盐氧化RNA核糖上的3'-顺式二醇以产生相应的二醛,从而促 进RNA在树脂上的固定。可使用各种类型的树脂(包括廉价的酰胼树脂),其中还原性胺化 使树脂与核糖酶之间的相互作用产生不可逆连接。可通过这项柱上氨酰基化技术显著促进 氨酰基tRNA的合成。Kourouklis等人,Methods 2005 ;36 :239_4描述一种以柱为基础的 氨酰基化系统。可以多种方式实现氨酰基化tRNA的分离。一种合适的方法是用缓冲液从柱中洗 提氨酰基化tRNA,所述缓冲液例如具有IOmM EDTA的乙酸钠溶液、含有50mM N_(2_羟基乙 基)哌嗪-N' - (3-丙烷磺酸)、12. 5mM KCl (pH 7. 0)、IOmM EDTA的缓冲液或简单经EDTA 缓冲的水(pH 7. 0)。可将氨酰基化tRNA添加到翻译反应中以便将使tRNA氨酰基化的氨基酸并入翻译 反应所产生的多肽中的所选位置中。可使用本发明的氨酰基化tRNA的翻译系统的实例包 括(但不限于)细胞溶菌液。细胞溶菌液提供由所输入的mRNA活体外翻译多肽所必需的 反应组分。所述反应组分的实例包括(但不限于)核糖体蛋白、rRNA、氨基酸、tRNA、GTP、 ATP、翻译起始和延伸因子以及与翻译相关的其它因子。另外,翻译系统可为分批翻译或间 隔翻译(compartmentalizedtranslation)。分批翻译系统将反应组分组合到单一隔室中, 而间隔翻译系统将翻译反应组分与可抑制翻译效率的反应产物分隔开。这些翻译系统在市 面上有售。此外,可使用偶合转录/翻译系统。偶合转录/翻译系统允许将所输入的DNA转 录为相应mRNA,而所述mRNA又由反应组分进行翻译。市售偶合转录/翻译的实例为Rapid Translation System(RTS, Roche Inc.)。所述系统包括含有大肠杆菌溶菌液的混合物以 提供例如核糖体和翻译因子等翻译组分。另外,还包括RNA聚合酶以将所输入DNA转录为 mRNA模板以用于翻译。RTS可经由反应隔室(包括供应/消耗隔室和转录/翻译隔室)之 间插入的膜来分隔反应组分。可由其它试剂(包括(但不限于)转移酶、聚合酶、催化抗体、多功能蛋白质等) 进行tRNA的氨酰基化。Stephan在Scientist,2005年10月10日;第30-33页中描述将非天然编码氨基 酸并入蛋白质中的其它方法。Lu等人在Mol Cell. 2001年10月;8(4) ;759-69中描述一种 以化学方式使蛋白质与含有非天然氨基酸的合成肽化学连接(经表达的蛋白质连接)的方 法。也已使用微注射技术将非天然氨基酸并入蛋白质中。例如参见MW.Nowak, P. C. Kearney, J. R. Sampson, Μ. Ε. Saks, C. G. Labarca, S. K. Silverman, W. G. Zhong, J. Thorson, J. N. Abelson, N. Davidson, P. G. Schultz, D. A. Dougherty 禾口 H. A. Lester, Science, 268 439 (1995);以及 D. A. Dougherty, Curr. Opin. Chem. Biol.,4 645 (2000)。将 爪蟾卵母细胞(Xenopus oocyte)与活体外产生的以下两种RNA物质共同注射在所关注的氨基酸位置处具有UAG终止密码子的编码标靶蛋白的mRNA,和经所需非天然氨基酸氨酰 基化的琥珀抑制因子tRNA。随后,卵母细胞的翻译机构将非天然氨基酸插入由UAG指定的 位置处。这种方法已允许通常不适用于活体外表达系统的整体膜蛋白的活体内结构-功 能研究。实例包括将荧光氨基酸并入速激肽神经激肽_2受体中以通过荧光共振能量转 移来测量距离,例如参见 G. Turcatti, K. Nemeth, M. D. Edgerton, U. Meseth, F. Talabot, M. Peitsch, J. Knowles, H. Vogel 和 A.Chollet,Τ. Biol. Chem.,271 19991(1996);并入生 物素化氨基酸以鉴别离子通道中表面暴露的残基,例如参见J. P. Gallivan, H. A. Lester和 D.A.Dougherty,Chem. Biol.,4 =739(1997);使用笼化的酪胺酸类似物以实时监控离子通 道中的构象变化,例如参见 J. C. Miller, S. K. Silverman, P. Μ. England, D. A. Dougherty 和 H. A. Lester, Neuron, 20 =619(1998);以及使用α羟基氨基酸以改变用于探究其门控机制 的离子通道主链。例如参见 P. Μ. England, Y. Zhang, D. A. Dougherty 和 H. A. Lester, Cell, 96 89 (1999);以及 Τ. Lu, Α. Y. Ting, J. Mainland, L. Y. Jan, P. G. Schultz 和 J. Yang, Nat. Neurosci4 =239(2001)。在活体内直接将非天然氨基酸并入蛋白质中的能力提供多种优点,其包括(但不 限于)突变蛋白的高产率、技术简易性、在细胞中或可能在活生物体中研究突变蛋白的可 能性以及这些突变蛋白在治疗性治疗和诊断使用中的使用。将具有各种尺寸、酸度、亲核 性、疏水性以及其它性质的非天然氨基酸包括在蛋白质中的能力可极大地扩展理性并系统 性地操纵蛋白质结构的能力,从而探究蛋白质功能并且产生具有新颖性质的新蛋白质或生 物体。在位点特异性地并入para-F-Phe的一次尝试中,将酵母琥珀抑制因子 tRNAPheCUA/苯丙氨酰基tRNA合成酶对用于p-F-Phe抗性、Phe营养缺陷型大肠杆菌菌株 中。例如参见 R. Furter, Protein Sci.,7 419 (1998)。使用不含无细胞的(活体外)翻译系统获得本发明的胰岛素多核苷酸的表达也为 是可能的。翻译系统可为细胞或无细胞翻译系统细胞性或不含细胞,并且可为原核或真核 翻译系统。细胞翻译系统包括(但不限于)其中可将所需核酸序列可经转录为mRNA并且 翻译所述mRNA经翻译的全细胞制剂,例如渗透细胞或细胞培养物。不含无细胞的翻译系统 在市面上有售,并且众所周知许多不同的类型和系统。不含无细胞的系统的实例包括(但 不限于)原核细胞溶菌液,例如大肠杆菌溶菌液;以及真核细胞溶菌液,例如麦芽提取物、 昆虫细胞溶菌液、兔网织红细胞网状细胞溶菌液、兔卵母细胞溶菌液和人类细胞溶菌液。当 所得蛋白质经糖基化、磷酸化或以其它方式经修饰时,可优选真核细胞提取物或溶菌液,这 是因为许多所述修饰只可能在真核系统中发生。一些所述提取物和溶菌液在市面上有售 (Promega ;Madison, Wis. ;Stratagene ;La Jolla, Calif. ;Amersham ;ArIingtonHeights, 111. ;GIBC0/BRL ;Grand Island,N. Y.) 0也可用膜提取物(例如含有微粒体膜的犬胰腺提 取物),其适用于翻译分泌蛋白。在可包括mRNA作为模板(活体外翻译)或包括DNA作为模 板(组合型活体外转录和翻译)的这些系统中,由核糖体指导活体外合成。已进行相当多的 尝试来开发无细胞的蛋白质表达系统。例如参见Kim,D.M.和J. R. Swartz,Biotechnology and Bioengineering,74:309-316(2001) ;Kim, D. Μ.禾口 J. R. Swartz, Biotechnology Letters,22,1537-1542, (2000) ;Kim, D. M.禾口 J.R.Swartz,Biotechnology Progress, 16,385-390, (2000) ;Kim, D. M.禾口 J.R.Swartz, Biotechnology and Bioengineering,
10566,180-188, (1999);以 R Patnaik, R.禾口 J. R. Swartz,Biotechniques 24,862—868, (1998);美国专利第6,337,191号;美国专利公开案第2002/0081660号;WO 00/55353 ; WO 90/05785,其是以引用的方式并入本文中。另一种可用于表达包含非天然编码氨基酸 的胰岛素多肽的方法包括mRNA-肽融合技术。例如参见R. Roberts和J. Szostak,Proc. Natl Acad. Sci. (USA) 94 12297-12302 (1997) ;A. Frankel 等人,Chemistry&Biology 10: 1043-1050(2003)。在这种方法中,在核糖体上将与嘌呤霉素(puromycin)连接的mRNA模板 翻译为肽。如果已对一种或一种以上tRNA分子进行修饰,那么也可将非天然氨基酸并入肽 中。在已读取最后一个mRNA密码子之后,嘌呤霉素捕获肽的C端。如果发现所得mRNA-肽 结合物在活体外测定中具有引人关注的性质,那么易于由mRNA序列揭示其特性。用这种方 式,可筛选包含一个或一个以上非天然编码氨基酸的胰岛素多肽的文库,以鉴别具有所需 性质的多肽。最近,已报道利用经纯化组分的活体外核糖体翻译,其允许合成经非天然编码 氨基酸取代的肽。例如参见 A. Forster 等人,Proc. Natl Acad. Sci. (USA) 100 6353(2003)。也可使用重构翻译系统。已成功地使用经纯化翻译因子的混合物以及溶菌液或补 充有经纯化翻译因子(例如起始因子-I(IF-I)、IF-2、IF-3( α或β )、延伸因子T (EF-Tu) 或终止因子)的溶菌液的组合将mRNA翻译为蛋白质。无细胞系统也可为偶合转录/翻译 系统,其中如 Current Protocols in Molecular Biology (F. Μ· Ausubel 等人编辑,Wiley Interscience,1993)(其以引用的方式特别并入本文中)中所述,将DNA引入所述系统中, 转录成mRNA并翻译所述mRNA。在真核转录系统中转录的RNA可为异核RNA(hnRNA)或5' 端戴帽(7-甲基鸟苷)和3'端加聚腺苷酸尾的成熟mRNA的形式,其在某些翻译系统中可 为优点。举例来说,在网织红细胞溶菌液系统中,以高效率翻译戴帽的mRNA。与胰岛素多肽偶合的大分子聚合物可使用本文中所述的组合物、方法、技术和策略来实现对本文中所述的非天然氨 基酸多肽的各种修饰。这些修饰包括将其它官能团并入到多肽的非天然氨基酸组分上,所 述官能团包括(但不限于)标记;染料;聚合物;水溶性聚合物;聚乙二醇的衍生物;光交 联剂;放射性核素;细胞毒性化合物;药物;亲和性标记;光亲和性标记;反应性化合物;树 脂;第二蛋白质或多肽或多肽类似物;抗体或抗体片段;金属螯合剂;辅因子;脂肪酸;碳 水化合物;多核苷酸;DNA ;RNA ;反义多核苷酸;糖类;水溶性树枝状聚合物;环糊精;抑制 性核糖核酸;生物材料;纳米粒子;自旋标记;荧光团;含金属的部分;放射性部分;新颖官 能团;与其它分子共价或非共价相互作用的基团;光笼化部分;光化辐射可激发的部分;可 光致异构化部分;生物素;生物素衍生物;生物素类似物;结合有重原子的部分;可化学裂 解的基团;可光裂解的基团;延长的侧链;碳连接的糖;氧化还原活性剂;氨基硫代酸;毒 性部分;经同位素标记的部分;生物物理探针;磷光基团;化学发光基团;电子致密基团; 磁性基团;插入基团;发色团;能量转移剂;生物活性剂;可检测标记;小分子;量子点;纳 米传递素;放射性核苷酸;放射性传递素;中子俘获剂;或上述物质的任何组合,或任何其 它所需化合物或物质。作为本文中所述的组合物、方法、技术和策略的说明性、非限制性实 例,以下描述将集中在将大分子聚合物添加到非天然氨基酸多肽上,同时应了解,相关的组 合物、方法、技术和策略也适用于(必要时适当修饰,并且所属领域的技术人员可用本文中 的揭示内容进行)添加其它官能团(包括(但不限于)上文列出的官能团)。多种大分子聚合物和其它分子可与本发明的胰岛素多肽连接以调节胰岛素多肽的生物性质和/或对胰岛素分子提供新颖的生物性质。这些大分子聚合物可通过天然编 码氨基酸、通过非天然编码氨基酸或天然或非天然氨基酸的任何官能取代基或添加到天然 或非天然氨基酸中的任何取代基或官能团与胰岛素多肽连接。聚合物的分子量可具有宽 范围,包括(但不限于)介于约IOODa与约100,OOODa或100,OOODa以上之间。聚合物 的分子量可介于约IOODa与约100,OOODa之间,包括(但不限于)100,000Da、95, OOODa、 90,000Da、85, 000Da、80, 000Da、75, 000Da、70, 000Da、65, 000Da、60, 000Da、55,OOODa、 50,000Da、45, 000Da、40, 000Da、35, 000Da、30, 000Da、25, 000Da、20, 000Da、15,OOODa、 10,000Da、9,000Da、8, 000Da、7, 000Da、6, 000Da、5, 000Da、4, 000Da、3, 000Da、2, OOODa、 1,000Da、900Da、800Da、700Da、600Da、500Da、400Da、300Da、200Da 和 100Da。在一些实施例 中,聚合物的分子量介于约IOODa与约50,OOODa之间。在一些实施例中,聚合物的分子量 介于约IOODa与约40,OOODa之间。在一些实施例中,聚合物的分子量介于约1,OOODa与约 40,OOODa之间。在一些实施例中,聚合物的分子量介于约5,OOODa与约40,OOODa之间。在 一些实施例中,聚合物的分子量介于约10,OOODa与约40,OOODa之间。本发明提供实质上均质的聚合物蛋白质结合物的制剂。如本文中所用,“实质上 均质”意思是观察到聚合物蛋白质结合物分子大于总蛋白质的一半。所述聚合物蛋白质 结合物具有生物活性并且本文中提供的本发明的“实质上均质”的聚乙二醇化胰岛素多肽 制剂为足够均质以致显示均质制剂的优点(例如易于在临床应用中预测各批次之间的药 物动力学)的制剂。也可选择制备聚合物蛋白质结合物分子的混合物,并且本文中提供的优点在于 可选择包括在素数混合物中的单一聚合物蛋白质结合物的比例。因此,必要时,可制备各 种蛋白质与各种数目的所连接的聚合物部分(即两个、三个、四个部分等)的混合物,并且 将所述结合物与使用本发明的方法制备的单一聚合物蛋白质结合物组合,并获得具有预 定的单聚合物蛋白质结合物比例的混合物。所选聚合物可为水溶性的,以致其所连接的蛋白质在水性环境(例如生理环境) 中不沉淀。聚合物可为分支或未分支的。对于最终产品制剂的治疗性使用来说,聚合物将 为医药学上可接受的。聚合物的实例包括(但不限于)聚烷基醚和其经烷氧基封端的类似物(例如聚氧 乙二醇(polyoxyethylene glycol)、聚氧乙二醇/丙二醇以及其经甲氧基或乙氧基封端的 类似物,尤其聚氧乙二醇,后者也被称作聚乙二醇(polyethyleneglycol)或PEG);聚乙烯 吡咯烷酮;聚乙烯基烷基醚;聚噁唑啉、聚烷基噁唑啉和聚羟基烷基噁唑啉;聚丙烯酰胺、 聚烷基丙烯酰胺和聚羟基烷基丙烯酰胺(例如聚羟基丙基甲基丙烯酰胺和其衍生物);聚 羟基烷基丙烯酸酯;聚唾液酸和其类似物;亲水性肽序列;聚糖和其衍生物,其包括葡聚糖 和葡聚糖衍生物,例如羧甲基葡聚糖、硫酸葡聚糖、氨基葡聚糖;纤维素和其衍生物,例如羧 甲基纤维素、羟基烷基纤维素;几丁质和其衍生物,例如壳聚糖、丁二酰基壳聚糖、羧甲基几 丁质、羧甲基壳聚糖;透明质酸和其衍生物;淀粉;海藻酸盐;硫酸软骨素;白蛋白;支链淀 粉和羧甲基支链淀粉;聚氨基酸和其衍生物,例如聚谷氨酸、聚赖氨酸、聚天冬氨酸、聚天冬 酰胺;顺丁烯二酸酐共聚物,例如苯乙烯顺丁烯二酸酐共聚物、二乙烯基乙醚顺丁烯二酸酐 共聚物;聚乙烯醇;其共聚物;其三聚物;其混合物;以及上述物质的衍生物。聚乙二醇分子与蛋白质分子的比例将改变,其在反应混合物中的浓度也将改变。一般来说,可通过所选聚乙二醇的分子量和可提供的可用反应性基团的数目来确定最佳比 率(就存在最小过量的未反应蛋白质或聚合物的反应的效率来说)。当涉及分子量时,通常 聚合物的分子量越高,可与蛋白质连接的聚合物分子的数目就越少。类似地,当优化这些参 数时,应将聚合物的分支考虑在内。通常,分子量越高(或支链越多),聚合物蛋白质比率 就越高。如本文中所用,并且当涵盖PEG:胰岛素多肽结合物时,术语“治疗有效量”是指使 患者得到所需益处的量。所述量将随个体而变化并且将视多种因素而定,包括患者的整体 身体状况和欲治疗病状的潜伏病因。用于疗法的胰岛素多肽的量提供可接受的变化速率并 且将所需反应维持在有益水平上。所属领域的技术人员使用可公开获得的材料和程序可容 易地确定本发明组合物的治疗有效量。水溶性聚合物可为任何结构形式,包括(但不限于)线性、分叉或分支形式。水溶 性聚合物通常为聚(烷二醇)(例如聚(乙二醇)(PEG)),但也可使用其它水溶性聚合物。 举例来说,使用PEG来描述本发明的某些实施例。PEG为众所周知的水溶性聚合物,其在市面上有售或可根据所属领域的技术人员 已知的方法(Sandler 禾口 Karo,Polymer Synthesis, Academic Press,New York,第 3 卷,第 138-161页)通过乙二醇的开环聚合来制备。术语“PEG”广泛用于涵盖任何聚乙二醇分子 而不用考虑PEG的尺寸或其末端的修饰,并且可由下式表示为与胰岛素多肽连接XO- (CH2CH2O)n-CH2CH2-Y其中η为2到10,000并且X为H或末端修饰,其包括(但不限于)Ch烷基、保护
基或末端官能团。在一些情况下,本发明中所用的PEG在一端以羟基或甲氧基封端,即X为H或 CH3 (“甲氧基PEG”)。或者,PEG可以反应性基团封端,从而形成双官能聚合物。典型反应 性基团可包括通常用于与20种常见氨基酸中所见的官能团反应的反应性基团(包括(但 不限于)顺丁烯二酰亚胺基、活化碳酸酯(包括(但不限于)对硝基苯酯)、活化酯(包括 (但不限于)N-羟基丁二酰亚胺、对硝基苯酯)和醛)以及对20种常见氨基酸呈惰性、但与 非天然编码氨基酸中存在的互补官能团特异性反应的官能团(包括(但不限于)叠氮基、 炔基)。应注意,PEG的另一端(在上式中由Y表示)将与胰岛素多肽直接连接或通过天然 存在或非天然编码氨基酸间接与胰岛素多肽连接。举例来说,Y可为与多肽的胺基(包括 (但不限于)赖氨酸的ε胺或N端)连接的酰胺键、氨基甲酸酯键或尿素键。或者,Y可为 与硫醇基团(包括(但不限于)半胱氨酸的硫醇基团)连接的顺丁烯二酰亚胺键。或者,Y 可为与通过20种常见氨基酸通常不可接近的残基连接的键。举例来说,PEG上的叠氮基可 与胰岛素多肽上的炔基反应以形成休斯根[3+2]环加成产物。或者,PEG上的炔基可与非 天然编码氨基酸中存在的叠氮基反应以形成类似产物。在一些实施例中,强亲核试剂(包 括(但不限于)胼、酰胼、羟胺、氨基脲)可与非天然编码氨基酸中存在的醛或酮基反应以 形成腙、肟或缩氨基脲,在一些情况下,适当时可通过由适当还原剂处理而进一步还原腙、 肟或缩氨基脲。或者,强亲核试剂可通过非天然编码氨基酸并入胰岛素多肽中并且可用于 优先与水溶性聚合物中存在的酮或醛基反应。可按照实际需要使用任何分子质量的PEG,所述分子质量视需要包括(但不限 于)约100道尔顿(Dalton ;Da)到100, OOODa或100,OOODa以上(包括(但不限于)有时为0. l-50kDa或10-40kDa)。PEG的分子量可具有宽范围,包括(但不限于)介于约 IOODa与约100,OOODa或100,OOODa以上之间。PEG可介于约IOODa与约100,OOODa之 间,包括(但不限于)100,OOODa,95, OOODa,90, OOODa,85, OOODa,80, OOODa,75, OOODa, 70,000Da、65, 000Da、60, 000Da、55, 000Da、50, 000Da、45, 000Da、40, 000Da、35,OOODa、 30,000Da、25,000Da、20,OOODa、15,OOODa、10,000Da、9,000Da、8,000Da、7,000Da、6,OOODa、 5,000Da、4,000Da、3,000Da、2,OOODa、1,000Da、900Da、800Da、700Da、600Da、500Da、400Da、 300Da、200Da和100Da。在一些实施例中,PEG介于约IOODa与约50,OOODa之间。在一些 实施例中,PEG介于约IOODa与约40,OOODa之间。在一些实施例中,PEG介于约1,OOODa 与约40,OOODa之间。在一些实施例中,PEG介于约5,OOODa与约40,OOODa之间。在一些 实施例中,PEG介于约10,OOODa与约40,OOODa之间。也可使用支链PEG,其包括(但不 限于)各链具有在I-IOOkDa(包括(但不限于)l-50kDa或5-20kDa)范围内的MW的PEG 分子。支链PEG的各链的分子量可(包括(但不限于))介于约1,OOODa与约100,OOODa 或100,OOODa之间。支链PEG的各链的分子量可介于约1,OOODa与约100,OOODa之间,包 括(但不限于)100,OOODa,95, OOODa,90, OOODa,85, OOODa,80, OOODa,75, OOODa,70, OOODa、 65,000Da、60, 000Da、55, 000Da、50, 000Da、45, 000Da、40, 000Da、35, 000Da、30, OOODa、 25,000Da、20, OOODa、15,OOODa、10,000Da、9, 000Da、8, 000Da、7, 000Da、6, 000Da、5, OOODa、 4,OOODa、3,OOODa、2,OOODa和1,OOODa。在一些实施例中,支链PEG的各链的分子量介于约 1,OOODa与约50,OOODa之间。在一些实施例中,支链PEG的各链的分子量介于约1,OOODa 与约40,OOODa之间。在一些实施例中,支链PEG的各链的分子量介于约5,OOODa与约 40,OOODa之间。在一些实施例中,支链PEG的各链的分子量介于约5,OOODa与约20,OOODa 之间。多种PEG分子描述于(包括(但不限于))Shearwater Polymers, Inc.目录、Nektar Therapeutics目录中,所述目录以引用的方式并入本文中。通常,PEG分子的至少一个末端可用于与非天然编码氨基酸反应。举例来说,可使 用具有与氨基酸侧链反应的炔基和叠氮部分的PEG衍生物来使PEG与如本文中所述的非天 然编码氨基酸连接。如果非天然编码氨基酸包含叠氮基,那么PEG通常将含有炔部分以实 现[3+2]环加成产物的形成,或含有膦基的活化PEG物质(即酯、碳酸酯)以实现酰胺键形 成。或者,如果非天然编码氨基酸包含炔,那么PEG通常将含有实现叠氮部分以实现[3+2] 休斯根环加成产物的形成。如果非天然编码氨基酸包含羰基,那么PEG通常将分别包含有 效亲核试剂(包括(但不限于)酰胼、胼、羟胺或氨基脲官能团)以实现相应腙、肟和缩氨 基脲键的形成。在其它替代方案中,可使用上述反应性基团的相反定向,即可使非天然编码 氨基酸中的叠氮部分与含有炔的PEG衍生物反应。在一些实施例中,具有PEG衍生物的胰岛素多肽变异体含有可与非天然编码氨基 酸侧链上存在的化学官能团反应的化学官能团。在一些实施例中,本发明提供含叠氮基和乙炔的聚合物衍生物,其包含具有约 800Da到约100,OOODa的平均分子量的水溶性聚合物主链。水溶性聚合物的聚合物主链可 为聚(乙二醇)。然而,应了解包括(但不限于)聚(乙二醇)和其它相关聚合物(包括聚 葡聚糖和聚(丙二醇))的多种水溶性聚合物也适用于实施本发明,并且术语PEG或聚(乙 二醇)的使用打算涵盖并且包括所有这些分子。术语PEG包括(但不限于)呈任何形式的 聚(乙二醇),包括双官能PEG、多臂PEG、衍生PEG、分叉PEG、支链PEG、侧接PEG (即具有一个或一个以上侧接到聚合物主链上的官能团的PEG或相关聚合物)或具有可降解键的PEG。PEG通常为透明、无色、无味的,可溶于水中,对热稳定,对许多化学试剂呈惰性,不 水解或变质,并且通常无毒。认为聚(乙二醇)为生物相容性的,也就是说PEG能够与活组 织或生物体共存而不引起危害。更具体来说,PEG实质上为非免疫原性的,也就是说PEG不 倾向于在体内产生免疫反应。当与体内具有一些所要功能的分子(例如生物活性剂)连 接时,PEG倾向于掩蔽所述试剂并且可减少或消除任何免疫反应,从而使生物体可耐受所述 试剂的存在。PEG结合物倾向于不产生实质免疫反应或引起凝血或其它不需的作用。具有 式--CH2CH2O-(CH2CH2O)n—CH2CH2—(其中 η 为约 3 到约 4000,通常约 20 到约 2000)的 PEG 适用于本发明中。在本发明的一些实施例中,具有约800Da到约100,000Da的分子量的PEG尤其适于用作聚合物主链。PEG的分子量可具有宽范围,包括 (但不限于)介于约IOODa与约100,OOODa或100,OOODa以上之间。PEG的分子量可介于约 IOODa 与约 100,OOODa 之间,包括(但不限于)100,OOODa,95, OOODa,90, OOODa,85, OOODa, 80,000Da、75, 000Da、70, 000Da、65, 000Da、60, 000Da、55, 000Da、50, 000Da、45,OOODa、 40,000Da、35, 000Da、30, 000Da、25, 000Da、20, 000Da、15, OOODaUO, 000Da、9, OOODa、 8,000Da、7,000Da、6,000Da、5,000Da、4,000Da、3,000Da、2,OOODa、1,000Da、900Da、800Da、 700Da、600Da、500Da、400Da、300Da、200Da 和 100Da。在一些实施例中,PEG 的分子量介于约 IOODa与约50,OOODa之间。在一些实施例中,PEG的分子量介于约IOODa与约40,OOODa之 间。在一些实施例中,PEG的分子量介于约1,OOODa与约40,OOODa之间。在一些实施例中, PEG的分子量介于约5,OOODa与约40,OOODa之间。在一些实施例中,PEG的分子量介于约 10,OOODa 与约 40,OOODa 之间。聚合物主链可为线性或分支的。所属领域中通常已知分支聚合物主链。通常,分支 聚合物具有一个中心分支核心部分和多个与中心分支核心连接的线性聚合物链。PEG通常 以分支形式使用,所述形式可通过将氧化乙烯添加到各种多元醇(例如甘油、甘油寡聚物、 季戊四醇以及山梨糖醇)上来制备。中心分支部分也可源自多种氨基酸(例如赖氨酸)。 分支聚(乙二醇)可以一般形式R(-PEG-0H)m表示,其中R是源自例如甘油、甘油寡聚物或 季戊四醇等核心部分,并且m表示臂的数目。多臂PEG分子(例如在美国专利第5,932,462 号;第 5,643,575 号;第 5,229,490 号;第 4,289,872 号;美国专利申请案 2003/0143596 ;WO 96/21469 ;以及W093/21259中所述的多臂PEG分子,所述文献各自以全文引用的方式并入 本文中)也可用作聚合物主链。分支PEG也可为由PEG(_YCHZ2)n表示的分叉PEG形式,其中Y为连接基团并且Z 为通过规定长度的原子链与CH连接的活化末端基团。另一种分支形式侧接PEG沿PEG主链而不是在PEG链的末端处具有例如羧基等反
应性基团。除这些PEG形式之外,也可制备主链中具有弱键或可降解键的聚合物。举例来说, 可制备聚合物主链中具有经受水解作用的酯键的PEG。如下文所示,这一水解作用使聚合物 裂解为较低分子量的片段-PEG-C02-PEG-+H20 — PEG-C02H+H0_PEG-所属领域的技术人员应了解,术语聚(乙二醇)或PEG表示或包括所属领域中已 知的所有形式,其包括(但不限于)在本文中所揭示的形式。
110
许多其它聚合物也适用于本发明中。在一些实施例中,具有2到约300个末端 的水溶性聚合物主链尤其适用于本发明中。合适的聚合物的实例包括(但不限于)其它 聚(烷二醇),例如聚(丙二醇)(“PPG”)、其共聚物(包括(但不限于)乙二醇与丙二醇 的共聚物)、其三聚物、其混合物等。尽管聚合物主链的各链的分子量可改变,但其通常在 约800Da到约100,OOODa、通常约6,OOODa到约80,OOODa的范围内。聚合物主链的各链 的分子量可介于约IOODa与约100,OOODa之间,包括(但不限于)100,000Da、95, OOODa、 90,000Da、85, 000Da、80, 000Da、75, 000Da、70, 000Da、65, 000Da、60, 000Da、55, OOODa、 50,000Da、45, 000Da、40, 000Da、35, 000Da、30, 000Da、25, 000Da、20, 000Da、15, OOODa、 10,000Da、9,000Da、8,000Da、7,000Da、6, 000Da、5, 000Da、4, 000Da、3, 000Da、2, OOODa、 1,000Da、900Da、800Da、700Da、600Da、500Da、400Da、300Da、200Da 和 100Da。在一些实施例 中,聚合物主链的各链的分子量介于约IOODa与约50,OOODa之间。在一些实施例中,聚合 物主链的各链的分子量介于约IOODa与约40,OOODa之间。在一些实施例中,聚合物主链的 各链的分子量介于约1,OOODa与约40,OOODa之间。在一些实施例中,聚合物主链的各链的 分子量介于约5,OOODa与约40,OOODa之间。在一些实施例中,聚合物主链的各链的分子量 介于约10,OOODa与约40,OOODa之间。所属领域的技术人员应认识到,实质上水溶性主链的上述清单无论如何并不详尽 并且仅具有说明性,并且预期具有上述性质的所有聚合物材料都适用于本发明中。在本发明的一些实施例中,聚合物衍生物为“多官能的”,意思是聚合物主链具有 至少两个经官能团官能化或活化的末端并且可能具有多达约300个末端。多官能聚合物衍 生物包括(但不限于)具有两个末端的线性聚合物,其中各末端与可相同或不同的官能团 键结。在一实施例中,聚合物衍生物具有以下结构X-A-POLY-B-N = N = N其中N = N = N为叠氮部分;B为连接部分,其可存在或不存在;POLY为水溶性非抗原聚合物;A为连接部分,其可存在或不存在并且其可与B相同或不同;并且X为第二官能团。A和B的连接部分的实例包括(但不限于)含有多达18个并且可含有1_10个碳 原子的多官能烷基。烷基链中可包括例如氮、氧或硫等杂原子。烷基链也可在杂原子处分 支。A和B的连接部分的其它实例包括(但不限于)含有多达10个并且可含有5-6个碳原 子的多官能芳基。芳基的一个或一个以上碳原子可经氮、氧或硫原子取代。合适的连接基 团的其它实例包括美国专利第5,932,462号;第5,643,575号;以及美国专利申请公开案 2003/0143596中所述的连接基团,所述文献各自以引用的方式并入本文中。所属领域的技 术人员应认识到,连接部分的上述清单无论如何并不详尽并且仅具有说明性,并且预期具 有上述性质的所有连接部分都适用于本发明中。适合用作X的官能团的实例包括(但不限于)羟基、经保护羟基、烷氧基、活性酯 (例如N-羟基丁二酰亚胺酯和1-苯并三唑酯)、活性碳酸酯(例如碳酸N-羟基丁二酰亚胺酯和碳酸ι-苯并三唑酯)、乙缩醛、醛、水合醛、烯基、丙烯酸酯、甲基丙烯酸酯、丙烯酰 胺、活性砜、胺、氨氧基、经保护胺、酰胼、经保护酰胼、经保护硫醇、羧酸、经保护羧酸、异氰 酸酯、异硫氰酸酯、顺丁烯二酰亚胺、乙烯基砜、二硫代吡啶、乙烯基吡啶、碘乙酰胺、环氧化 物、乙二醛、二酮、甲磺酸酯、甲苯磺酸酯、三氟乙磺酸酯、烯烃、酮和叠氮化物。所属领域的 技术人员应了解,所选X部分应与叠氮基相容以使得不与叠氮基发生反应。含叠氮基的聚 合物衍生物可为同双官能的,意思是第二官能团(即X)也是叠氮部分;或为异双官能的,意 思是第二官能团为不同的官能团。术语“经保护”是指存在防止化学反应性官能团在某些反应条件下发生反应的保 护基或保护部分。保护基应视所保护的化学反应性基团的类型而改变。举例来说,如果化 学反应性基团是胺或酰胼,那么保护基可选自叔丁氧羰基(t-Boc)和9-芴基甲氧基羰基 (Fmoc)的群组。如果化学反应性基团为硫醇,那么保护基可为邻吡啶基二硫化物。如果化 学反应性基团为羧酸(例如丁酸或丙酸)或羟基,那么保护基可为苄基或例如甲基、乙基或 叔丁基等烷基。所属领域中已知的其它保护基也可用于本发明中。文献中末端官能团的特定实例包括(但不限于)碳酸N- 丁二酰亚胺酯(例如参 见美国专利第5,281,698号、第5,468,478号)、胺(例如参见Buckmann等人,Makromol. Chem. 182 1379(1981) ;Zalipsky 等人,Eur. Polym. J. 19 1177 (1983))、酰胼(例如参见 Andresz等人,Makromol. Chem. 179 :301 (1978))、丙酸丁二酰亚胺酯和丁酸丁二酰亚胺酯 (例如参见 Olson 等人,Poly (ethylene glycol) Chemistry&Biological Applications, 第 170-181 页,Harris 和 Zalipsky 编,ACS, Washington, D. C.,1997 ;还参见美国专利 第 5,672,662 号)、丁二酸丁二酰亚胺酯(例如参见 Abuchowski 等人,Cancer Biochem. Biophys. 7 175 (1984)以及 Joppich 等人,Makromol. Chem. 180 1381 (1979))、丁二酰 亚胺酯(例如参见美国专利第4,670,417号)、碳酸苯并三唑酯(例如参见美国专利第 5,650,234 号)、缩水甘油醚(例如参见 Pitha 等人,Eur. J Biochem. 94 :11 (1979) ;Elling 等人,Biotech. Appl. Biochem. 13 :354(1991))、氧羰基咪唑(例如参见 Beauchamp 等人, Anal. Biochem. 131 :25 (1983) ;Tondelli 等人,J. Controlled Release 1:251 (1985))、 碳酸对硝基苯酯(例如参见 Veronese 等人,Appl. Biochem. Biotech.,11 141 (1985);以 及 Sartore 等人,Appl. Biochem. Biotech.,27 45 (1991))、酸(例如参见 Harris 等人, J. Polym. Sci. Chem. Ed. 22 341 (1984);美国专利第 5,824,784 号、美国专利第 5,252,714 号)、顺丁烯二酰亚胺(例如参见 Goodson 等人,Biotechnology (NY) 8 =343(1990) ;Romani φ 人,Chemistry of Peptides and Proteins 2:29(1984)) ; VX R Kogan, Synthetic Comm. 22 :2417 (1992))、邻吡啶基二硫化物(例如参见 Woghiren 等人,Bioconj. Chem. 4 314 (1993))、丙烯醇(例如参见 Sawhney 等人,Macromolecules, 26 581 (1993))、乙烯基砜 (例如参见美国专利第5,900,461号)。所有上述参考文献和专利都是以引用的方式并入 本文中。在本发明的某些实施例中,本发明的聚合物衍生物包含具有以下结构的聚合物主 链X-CH2CH2O- (CH2CH2O) n—CH2CH2-N = N = N其中X为如上所述的官能团;并且
112
η 为约 20 到约 4000。在另一实施例中,本发明的聚合物衍生物包含具有以下结构的聚合物主链x-ch2ch2o- (ch2ch2o) n—ch2ch2-o- (ch2) m-ff-n = n = n其中w为包含1-10个碳原子的脂肪族或芳香族连接部分;η为约20到约4000 ;并且x为如上所述的官能团,m介于1与10之间。可通过所属领域中已知和/或本文中所揭示的多种方法来制备本发明的含叠氮 基的peg衍生物。在下文展示的一种方法中,具有约800da到约100,oooda的平均分子量 的水溶性聚合物主链(所述聚合物主链具有与第一官能团键结的第一末端和与合适的离 去基键结的第二末端)与叠氮基阴离子(其可与多种合适的抗衡离子(包括钠、钾、叔丁基 铵等)中的任一种配对)反应。离去基进行亲核置换并且由叠氮部分置换,从而得到所需 的含叠氮基的peg聚合物。x-peg-l+nf — x-peg-n3如上所示,适用于本发明的聚合物主链具有式x-peg-l,其中peg为聚(乙二醇) 并且x为不与叠氮基反应的官能团,并且l为合适的离去基。合适的官能团的实例包括(但 不限于)羟基、经保护羟基、缩醛、烯基、胺、氨氧基、经保护胺、经保护酰胼、经保护硫醇、羧 酸、经保护羧酸、顺丁烯二酰亚胺、二硫代吡啶和乙烯基吡啶以及酮。合适的离去基的实例 包括(但不限于)氯离子、溴离子、碘离子、甲磺酸根、三氟乙磺酸根以及甲苯磺酸根。在另一种制备本发明的含叠氮基的聚合物衍生物的方法中,使具有叠氮基官能团 的连接剂与平均分子量为约sooda到约100,oooda的水溶性聚合物主链接触,其中连接剂 具有将与peg聚合物上的化学官能团选择性反应的化学官能团,以形成含叠氮基的聚合物 衍生物产物,其中叠氮基是通过连接基团与聚合物主链分隔开。示范性反应流程展示如下x-peg-m+n-连接子-n = n = n — pg-x-peg-连接子-n = n = n其中peg为聚(乙二醇)并且x为例如烷氧基等封端基团或如上所述的官能团;并且m为不可与叠氮基官能团反应、但可与n官能团有效且选择性反应的官能团。合适的官能团的实例包括(但不限于)如果n为胺,那么m为羧酸、碳酸酯或活 性酯;如果n为酰胼或氨氧基部分,那么m为酮;如果n为亲核基团,那么m为离去基。可由已知方法(包括(但不限于)沉淀产物,必要时接着进行色谱)实现粗产物 的纯化。下文展示在peg 二胺的情况下的更特定实例,其中一个胺经例如叔丁基-boc等保 护基部分保护并且所得单保护的peg 二胺与具有叠氮基官能团的连接部分反应bochn-peg-nh2+h02c- (ch2) 3_n = n = n在这种情况下,可使用多种活化剂(例如亚硫酰氯或碳化二亚胺试剂以及n-羟基 丁二酰亚胺或n-羟基苯并三唑)使胺基与羧酸基团偶合以在单胺peg衍生物与具有叠氮 基的连接部分之间产生酰胺键。在成功形成酰胺键之后,所得经n-叔丁基-boc-保护的含 叠氮基的衍生物可直接用于修饰生物活性分子,或其可进一步经精细修饰以安装其它适用的官能团。举例来说,可通过用强酸处理使N-t-Boc基团水解以产生ω-氨基-PEG-叠氮 化物。可使用所得胺作为合成把手(synthetichandle)来安装其它适用的官能团(例如顺 丁烯二酰亚胺基团、活化二硫化物、活化酯等)以产生有价值的异双官能试剂。当需要将不同分子与聚合物的各末端连接时,异双官能衍生物尤其有用。举例来 说,ω-N-氨基-N-叠氮基PEG将允许具有活性亲电子基团(例如醛、酮、活性酯、活性碳酸 酯等)的分子与PEG的一个末端连接,并且将允许具有乙炔基团的分子与PEG的另一个末 端连接。在本发明的另一实施例中,聚合物衍生物具有以下结构X-A-POLY-B-C = C-R其中R可为H或烷基、烯烃、烷氧基或芳基或经取代芳基;B为连接部分,其可存在或不存在;POLY为水溶性非抗原性聚合物;A为连接部分,其可存在或不存在且其可与B相同或不同;并且X为第二官能团。A和B的连接部分的实例包括(但不限于)含有多达18个且可含有1-10个碳原 子的多官能烷基。烷基链中可包括例如氮、氧或硫等杂原子。烷基链也可在杂原子处分支。 A和B的连接部分的其它实例包括(但不限于)含有多达10个并且可含有5-6个碳原子的 多官能芳基。芳基的一个或一个以上个碳原子原子可经氮、氧或硫原子取代。合适的连接 基团的其它实例包括美国专利第5,932,462号和第5,643,575号以及美国专利申请公开案 2003/0143596中所述的连接基团,所述文献各自以引用的方式并入本文中。所属领域的技 术人员应认识到,连接部分的上述清单无论如何并不详尽并且仅具有说明性,并且预期具 有上述性质的多种连接部分适用于本发明中。适用作X的官能团的实例包括羟基、经保护羟基、烷氧基、活性酯(例如N-羟基丁 二酰亚胺酯和1-苯并三唑酯)、活性碳酸酯(例如碳酸N-羟基丁二酰亚胺酯和碳酸1-苯 并三唑酯)、乙缩醛、醛、水合醛、烯基、丙烯酸酯、甲基丙烯酸酯、丙烯酰胺、活性砜、胺、氨氧 基、经保护胺、酰胼、经保护酰胼、经保护硫醇、羧酸、经保护羧酸、异氰酸酯、异硫氰酸酯、顺 丁烯二酰亚胺、乙烯基砜、二硫代吡啶、乙烯基吡啶、碘乙酰胺、环氧化物、乙二醛、二酮、甲 磺酸酯、甲苯磺酸酯和三氟乙磺酸酯、烯烃、酮以及乙炔。应了解,所选X部分应与乙炔基相 容以使得不与乙炔基发生反应。含乙炔的聚合物衍生物可为同双官能的,意思是第二官能 团(即X)也是乙炔部分,或异双官能的,意思是第二官能团是不同的官能团。在本发明的另一实施例中,聚合物衍生物包含具有以下结构的聚合物主链X-CH2CH2O- (CH2CH2O) [CH2CH2-O- (CH2) m_C = CH其中X为如上所述的官能团;η为约20到约4000 ;并且m介于1与10之间。各异双官能PEG聚合物的特定实例展示如下。可使用所属领域的技术人员已知和/或本文中所揭示的方法来制备本发明的含乙炔的PEG衍生物。在一种方法中,使具有约800Da到约100,OOODa的平均分子量的水溶 性聚合物主链(所述聚合物主链具有与第一官能团键结的第一末端和与合适的亲核基团 键结的第二末端)与具有乙炔官能团和适于与PEG上的亲核基团反应的离去基的化合物反 应。当具有亲核部分的PEG聚合物与具有离去基的分子组合时,离去基进行亲核置换并且 由亲核部分置换,从而得到所需含乙炔的聚合物。X-PEG-Nu+L-A-C — X-PEG-Nu-A-C = CR'如上所示,用于反应中的优选聚合物主链具有式X-PEG-Nu,其中PEG为聚(乙二 醇),Nu为亲核部分并且X为不与Nu、L或乙炔官能团反应的官能团。Nu的实例包括(但不限于)主要通过SN2型机制反应的胺、烷氧基、芳氧基、巯基、 亚氨基、羧酸酯基、酰胼基、氨氧基。Nu基团的其它实例包括主要通过亲核加成反应来反应 的官能团。L基团的实例包括氯离子、溴离子、碘离子、甲磺酸根、三氟乙磺酸根和甲苯磺酸 根和预期进行亲核置换的其它基团,以及酮、醛、硫酯、烯烃、α -β不饱和羰基、碳酸酯基和 预期进行亲核试剂加成的其它亲电子基团。在本发明的另一实施例中,A为具有1-10个碳原子的脂肪族连接子或具有6-14个 碳原子的经取代芳环。X为不与叠氮基反应的官能团,并且L为合适的离去基。在另一种用于制备本发明的含乙炔的聚合物衍生物的方法中,使具有约SOODa到 约100,OOODa的平均分子量、在一个末端上具有经保护官能团或封端剂并且在另一个末端 上具有合适的离去基的PEG聚合物与乙炔阴离子接触。示范性反应流程展示如下X-PEG-L+-C = CR' — X-PEG-C = CR'其中PEG为聚(乙二醇)并且X为例如烷氧基等封端基团或如上所述的官能团;并且R'为H、烷基、烷氧基、芳基或芳氧基或经取代烷基、烷氧基、芳基或芳氧基。在上文实例中,当与足够浓度的乙炔阴离子接触时,离去基L应充分反应以进行 SN2型置换反应。所属领域的技术人员已知由乙炔阴离子实现离去基的SN2置换所需的反 应条件。通常可由所属领域中已知的方法(包括(但不限于)沉淀产物,必要时接着进行 色谱)来实现粗产物的纯化。水溶性聚合物可与本发明的胰岛素多肽连接。水溶性聚合物可通过并入胰岛素多 肽中的非天然编码氨基酸或非天然编码或天然编码氨基酸的任何官能团或取代基或添加 到非天然编码或天然编码氨基酸中的任何官能团或取代基连接。或者,水溶性聚合物是通 过天然存在氨基酸(包括(但不限于)半胱氨酸、赖氨酸或N端残基的胺基)与并有非天 然编码氨基酸的胰岛素多肽连接。在一些情况下,本发明的胰岛素多肽包含1、2、3、4、5、6、 7、8、9、10个非天然氨基酸,其中一个或一个以上非天然编码氨基酸与水溶性聚合物(包括 (但不限于)PEG和/或寡糖)连接。在一些情况下,本发明的胰岛素多肽进一步包含1、2、 3、4、5、6、7、8、9、10或10个以上与水溶性聚合物连接的天然编码氨基酸。在一些情况下,本 发明的胰岛素多肽包含一个或一个以上与水溶性聚合物连接的非天然编码氨基酸以及一 个或一个以上与水溶性聚合物连接的天然存在氨基酸。在一些实施例中,相对于未结合形 式,本发明中所用的水溶性聚合物增加胰岛素多肽的血清半衰期。
可调节与本发明的胰岛素多肽连接的水溶性聚合物的数目(即聚乙二醇化或糖 基化程度)以提供改变(包括(但不限于)增加或降低)的药理学、药物动力学或药效特 征,例如活体内半衰期。在一些实施例中,胰岛素的半衰期比未经修饰的多肽增加至少约 10%、20%、30%、40%、50%、60%、70%、80%、90%、增加到 2 倍、5 倍、6 倍、7 倍、8 倍、9 倍、 10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍、25倍、30倍、35倍、 40倍、50倍或至少约100倍。★拥無測(艮口酉播、月并、碰前細)^ PEG在本发明的一实施例中,用含有直接与PEG主链连接的末端胼、羟胺、酰胼或氨基 脲部分的PEG衍生物修饰包含含羰基的非天然编码氨基酸的胰岛素多肽。在一些实施例中,羟胺末端PEG衍生物将具有以下结构RO-(CH2CH20)η_0_(CH2)m-0_NH2其中R为简单烷基(甲基、乙基、丙基等),m为2-10并且η为100-1,000 (即平均 分子量介于5-40kDa之间)。在一些实施例中,含胼或含酰胼的PEG衍生物将具有以下结构RO-(CH2CH20)η_0_(CH2)m-X_NH-NH2其中R为简单烷基(甲基、乙基、丙基等),m为2-10并且η为100_1,000并且X 任选地为可存在或不存在的羰基(C = 0)。在一些实施例中,含氨基脲的PEG衍生物将具有以下结构RO-(CH2CH20)η_0_(CH2)m-NH-C(0)-NH-NH2其中R为简单烷基(甲基、乙基、丙基等),m为2-10并且η为100_1,000。在本发明的另一实施例中,用含有借助于酰胺键与PEG主链连接的末端羟胺、酰 胼、胼或氨基脲部分的PEG衍生物修饰包含含羰基的氨基酸的胰岛素多肽。在一些实施例中,羟胺末端PEG衍生物具有以下结构RO-(CH2CH20)η_0_(CH2)2-NH-C(0)(CH2)m-0_NH2其中R为简单烷基(甲基、乙基、丙基等),m为2-10并且η为100-1,000 (即平均 分子量介于5-40kDa之间)。在一些实施例中,含胼或含酰胼的PEG衍生物具有以下结构RO-(CH2CH20)η_0_(CH2)2-NH-C(0)(CH2)m-X-NH_NH2其中R为简单烷基(甲基、乙基、丙基等),m为2-10,η为100_1,000并且X任选 地为可存在或不存在的羰基(C = 0)。在一些实施例中,含氨基脲的PEG衍生物具有以下结构RO-(CH2CH20)η_0_(CH2)2-NH-C(0)(CH2)m-NH-C(0)-NH-NH2其中R为简单烷基(甲基、乙基、丙基等),m为2-10并且η为100_1,000。在本发明的另一实施例中,用含有末端胼、羟胺、酰胼或氨基脲部分的分支PEG衍 生物修饰包含含羰基的氨基酸的胰岛素多肽,其中分支PEG的各链具有在10-40kDa范围内 并且可为5-20kDa的MW。在本发明的另一实施例中,用具有分支结构的PEG衍生物修饰包含非天然编码氨 基酸的胰岛素多肽。举例来说,在一些实施例中,胼或酰胼末端PEG衍生物将具有以下结 构
[R0-(CH2CH20)η_0_(CH2)2-NH-C(0)]2CH(CH2)m-X-NH_NH2其中R为简单烷基(甲基、乙基、丙基等),m为2-10并且η为100_1,000,并且X 任选地为可存在或不存在的羰基(C = 0)。在一些实施例中,含有氨基脲基团的PEG衍生物将具有以下结构[R0-(CH2CH20)η_0_(CH2)2~C(0)-NH-CH2-CH2]2CH-X-(CH2)m-NH-C(0)-NH-NH2其中R为简单烷基(甲基、乙基、丙基等),X任选地为NH、0、S、C(0)或不存在,m 为 2-10 并且 η 为 100-1,000。在一些实施例中,含有羟胺基团的PEG衍生物将具有以下结构[R0-(CH2CH20)η_0_(CH2)2~C(0)-NH-CH2-CH2]2CH-X-(CH2)m-0_NH2其中R为简单烷基(甲基、乙基、丙基等),X任选地为NH、0、S、C(0)或不存在,m 为 2-10 并且 η 为 100-1,000。水溶性聚合物与胰岛素多肽连接的程度和位点可调节胰岛素多肽与胰岛素多肽 受体的结合。在一些实施例中,安置各键,使得胰岛素多肽以通过平衡结合测定(例如在 Spencer 等人,J. Biol. Chem. , 263 7862-7867 (1988)中胰岛素所述)所测量约 400nM 或 400nM以下的KcU以150nM或150nM以下的Kd并且在一些情况下以IOOnM或IOOnM以下的 Kd与胰岛素多肽受体结合。用于聚合物活化以及肽结合的方法和化学描述于文献中并且在所属技术领域中 为已知的。聚合物活化的常用方法包括(但不限于)用溴化氰、高碘酸盐、戊二醛、双环 氧化物(bi印oxide)、表氯醇(印ichlorohydrin)、二乙烯基砜、碳化二亚胺、磺酰卤、三氯 三嗪等活化官能团。(参见 R. F. Taylor,(1991),PROTEINIMMOBILI SAT I ON. FUNDAMENTAL AND APPLICATIONS, Marcel Dekker, N. Y. ;S. S. Wong, (1992),CHEMISTRY OF PROTEIN CONJUGATION ANDCROSSLINKING, CRC Press, Boca Raton ;G. T. Hermanson 等人,(1993), IMMOBILIZED AFFINITY LIGAND TECHNIQUES, N. Y. ;Dunn, R. L.等人编,POLYMERIC DRUGS AND DRUG DELIVERY SYSTEMS, ACS Symposium Series,第 469 卷,American Chemical Society, Washington, D. C. 1991)。可获得关于PEG的官能化和结合的若干评论和专论。例如参见Harris,Macromol. Chem. Phys. C25 325-373(1985) ;Scouten, Methods in Enzymology 135:30-65(1987); Wong^A,Enzyme Microb. Technol 14 866-874 (1992) ;Delgado ^A, Critical Reviews in Therapeutic Drug Carrier Systems 9 249-304 (1992) ;Zalipsky, Bioconjugate Chem. 6 150-165(1995)。活化聚合物的方法也可见于TO 94/17039、美国专利第5,324,844号、 W094/18247、WO 94/04193、美国专利第 5,219,564 号、美国专利第 5,122,614 号、WO 90/13540、美国专利第5,281,698号和WO 93/15189中,且使活化聚合物与酶结合的方 法可见于以下对应不同酶的参考文献中,所述酶包括(但不限于)凝血因子VIII(W0 94/15625)、血红蛋白(W0 94/09027)、载氧分子(美国专利第4,412,989号)、核糖核酸酶 和超氧化物歧化酶(Veronese 等人,App. Biochem. Biotech. 11 141-52 (1985))。所引用的 所有参考文献和专利都是以引用的方式并入本文中。通过任何便利方法来使得含有非天然编码氨基酸(例如对叠氮基-L-苯丙氨酸) 的胰岛素多肽聚乙二醇化(即添加任何水溶性聚合物)。举例来说,用经炔封端的mPEG衍生物使胰岛素多肽聚乙二醇化。简单地说,在室温下在搅拌下向含对叠氮基-L-Phe的胰岛
素多肽的水溶液中添加过量固体mPEG(5000)-0-CH2-C@CH。通常,用pKa接近进行反
应的PH值(通常PH值约为4-10)的缓冲液缓冲水溶液。例如,适于在PH 7. 5下聚乙二醇 化的缓冲液的实例包括(但不限于)HEPES、磷酸盐、硼酸盐、TRIS-HCl、EPPS和TES。必要 时,连续监控并调节PH值。通常使反应持续进行约1-48小时。随后,使反应产物经受疏水性相互作用色谱,以使聚乙二醇化胰岛素多肽变异体 与游离mPEG (5000) -0-CH2-C ε CH以及当在分子的两端使未阻断PEG活化从而使胰岛素多 肽变异体分子交联时可形成的聚乙二醇化胰岛素多肽的任何高分子量复合物分离开来。疏 水性相互作用色谱期间的条件应使得游离mPEG(5000)-0-CH2-C ^ CH流过柱,而任何交联 的聚乙二醇化胰岛素多肽变异体复合物则在实现所需形式后洗提出来,所需形式含有一个 与一个或一个以上PEG基团结合的胰岛素多肽变异体分子。合适的条件视交联复合物相对 于所需结合物的相对大小而改变,并且易于由所属领域的技术人员确定。通过超滤来浓缩 含有所需结合物的洗出液且通过透滤使其脱盐。必要时,可由所属领域的技术人员已知的一种或一种以上程序进一步纯化获自 疏水性色谱的聚乙二醇化胰岛素多肽,所述程序包括(但不限于)亲和色谱;阴离子或阳 离子交换色谱(使用(包括(但不限于))DEAE琼脂糖凝胶);硅胶色谱;反相HPLCJf 胶过滤(使用(包括(但不限于))SEPHADEX G-75);疏水性相互作用色谱;尺寸排阻色 谱;金属螯合物色谱;超滤/透滤;乙醇沉淀;硫酸铵沉淀;色谱聚焦;置换色谱;电泳程 序(包括(但不限于)制备型等电聚焦);差异溶解度(包括(但不限于)硫酸铵沉淀); 或萃取。可通过与球状蛋白质标准物(Preneta,AZ, PROTEIN PURIFICATION METHODS, A PRACTICALAPPROACH (Harris 和 Angal 编)IRL Press 1989,293-306)进行比较由 GPC 来估 算表观分子量。可通过蛋白水解降解(包括(但不限于)胰蛋白酶裂解),接着质谱分析 来评估胰岛素-PEG结合物的纯度。P印insky RB.等人,J,Pharmcol. &Exp. Ther. 297 (3) 1059-66(2001)。与本发明的胰岛素多肽的氨基酸连接的水溶性聚合物可进一步不受限制地衍生 或经取代。含叠氮基的PEG衍生物在本发明的另一实施例中,用含有叠氮部分的PEG衍生物修饰胰岛素多肽,所述 叠氮部分将与非天然编码氨基酸侧链上存在的炔部分反应。一般来说,PEG衍生物将具有 在I-IOOkDa范围内并且在一些实施例中在10-40kDa范围内的平均分子量。在一些实施例中,叠氮基末端PEG衍生物将具有以下结构R0-(CH2CH20)n-0-(CH2)m_N3其中R为简单烷基(甲基、乙基、丙基等),m为2-10并且η为100-1,000 (即平均 分子量介于5-40kDa之间)。在另一实施例中,叠氮基末端PEG衍生物将具有以下结构RO-(CH2CH20)η_0_(CH2)m-NH-C(0)-(CH2)p_N3其中R为简单烷基(甲基、乙基、丙基等),m为2-10,ρ为2_10并且η为 100-1,000 (即平均分子量介于5-40kDa之间)。在本发明的另一实施例中,用含有末端叠氮部分的分支PEG衍生物修饰包含含炔的氨基酸的胰岛素多肽,其中分支PEG的各链具有在10-40kDa范围内并且可为5_20kDa的 MW。举例来说,在一些实施例中,叠氮基末端PEG衍生物将具有以下结构 其中R为简单烷基(甲基、乙基、丙基等),m为2-10,ρ为2_10,并且η为 100-1,000,并且X任选地为0、N、S或羰基(C = 0),在各情况下,X都可存在或不存在。含炔的PEG衍牛物在本发明的另一实施例中,用含有炔部分的PEG衍生物修饰胰岛素多肽,所述炔 部分将与非天然编码氨基酸侧链上存在的叠氮部分反应。在一些实施例中,炔末端PEG衍生物将具有以下结构 其中R为简单烷基(甲基、乙基、丙基等),m为2-10并且η为100-1,000 (即平均 分子量介于5-40kDa之间)。在本发明的另一实施例中,用含有借助于酰胺键与PEG主链连接的末端叠氮部分 或末端炔部分的PEG衍生物修饰包含含炔的非天然编码氨基酸的胰岛素多肽。在一些实施例中,炔末端PEG衍生物将具有以下结构 其中R为简单烷基(甲基、乙基、丙基等),m为2-10,p为2_10并且η为100_1,000。在本发明的另一实施例中,用含有末端炔部分的分支PEG衍生物修饰包含含叠氮 基的氨基酸的胰岛素多肽,其中分支PEG的各链具有在10-40kDa范围内并且可为5_20kDa 的MW。举例来说,在一些实施例中,炔末端PEG衍生物将具有以下结构 其中R为简单烷基(甲基、乙基、丙基等),m为2-10,ρ为2_10,并且η为 100-1,000,并且X任选地为0、N、S或羰基(C = 0)或不存在。含膦的PEG衍牛物在本发明的另一实施例中,用含有活化官能团(包括(但不限于)酯、碳酸酯)的 PEG衍生物修饰胰岛素多肽,所述官能团进一步包含将与非天然编码氨基酸侧链上存在的 叠氮部分反应的芳基膦基团。一般来说,PEG衍生物将具有在I-IOOkDa范围内并且在一些 实施例中在10-40kDa范围内的平均分子量。在一些实施例中,PEG衍生物将具有以下结构
Ph2P(H2C),SY X、W O其中η为1-10 ;X可为0、N、S或不存在,Ph为苯基,并且W为水溶性聚合物。在一些实施例中,PEG衍生物将具有以下结构
119 其中X可为0、N、S或不存在,Ph为苯基,W为水溶性聚合物并且R可为H、烷基、 芳基、经取代烷基和经取代芳基。示范性R基团包括(但不限于)_CH2、-C(CH3)3、-OR'、-NR' R〃、-SR'、-卤素、-C(O)R' ,-CONR' R" ,-S(O)2R'、-S(O)2NR' R〃、-CN 禾口-NO2。 R'、R〃、R〃 ‘和R〃 “各独立地指代氢、经取代或未经取代杂烷基、经取代或未经取代芳 基(包括(但不限于)经1-3个卤素取代的芳基)、经取代或未经取代烷基、烷氧基或硫烷 氧基或芳基烷基。例如,当本发明的化合物包括一个以上R基团时,R基团是各独立地经选 择,而当存在R'、R〃、R〃 ‘和R〃 ‘‘基团中的一者以上时,这些基团同样是各独立地经选 择。当R'和R"与同一氮原子连接时,其可与氮原子组合形成5元、6元或7元环。举例来 说,-NR' R"打算包括(但不限于)1_吡咯烷基和4-吗啉基。根据对取代基的上述论述, 所属领域的技术人员应了解术语“烷基”打算包括包含与除氢基之外的基团结合的碳原子 的基团,例如卤烷基(包括(但不限于)-CF3和-CH2CF3)和酰基(包括(但不限于)-C(O) CH3、-C (0) CF3、-C (0) CH2OCH3 等)。其它PEG衍牛物和一般聚乙二醇化技术例如,可与胰岛素多肽连接的其它示范性PEG分子以及聚乙二醇化方法包括以 下文献中所述的分子和方法美国专利公开案第2004/0001838号;第2002/0052009号; 第 2003/0162949 号;第 2004/0013637 号;第 2003/0228274 号;第 2003/0220447 号; 第 2003/0158333 号;第 2003/0143596 号;第 2003/0114647 号;第 2003/0105275 号; 第 2003/0105224 号;第 2003/0023023 号;第 2002/0156047 号;第 2002/0099133 号; 第 2002/0086939 号;第 2002/0082345 号;第 2002/0072573 号;第 2002/0052430 号; 第 2002/0040076 号;第 2002/0037949 号;第 2002/0002250 号;第 2001/0056171 号;第 2001/0044526 号;第 2001/0021763 号;美国专利第 6,646,110 号;第 5,824,778 号;第 5,476,653 号;第 5,219,564 号;第 5,629,384 号;第 5,736,625 号;第 4,902,502 号; 第 5,281,698 号;第 5,122,614 号;第 5,473,034 号;第 5,516,673 号;第 5,382,657 号; 第 6,552,167 号;第 6,610,281 号;第 6,515,100 号;第 6,461,603 号;第 6,436,386 号; 第 6,214,966 号;第 5,990,237 号;第 5,900,461 号;第 5,739,208 号;第 5,672,662 号; 第 5,446,090 号;第 5,808,096 号;第 5,612,460 号;第 5,324,844 号;第 5,252,714 号; 第 6,420,339 号;第 6,201,072 号;第 6,451,346 号;第 6,306,821 号;第 5,559,213 号; 第 5,747,646 号;第 5,834,594 号;第 5,849,860 号;第 5,980,948 号;第 6,004,573 号;第 6,129,912 ;W0 97/32607、EP 229,108、EP 402,378、WO 92/16555、WO 94/04193、 WO 94/14758、WO 94/17039、W094/18247、WO 94/28024、WO 95/00162、WO 95/11924、 WO 95/13090、W095/33490、WO 96/00080、WO 97/18832、WO 98/41562、WO 98/48837、 W099/32134.W0 99/32139、WO 99/32140、WO 96/40791、WO 98/32466、W095/06058、EP 439 508、WO 97/03106、WO 96/21469、WO 95/13312、EP 921 131、WO 98/05363、EP 809996、 WO 96/41813、WO 96/07670、EP 605 963、EP 510 356、EP 400 472、EP 183 503和 EP 154 316,其是以引用的方式并入本文中。本文中所述的任一种PEG分子都可以包括(但不限 于)单链、分支链、多臂链、单官能、双官能、多官能形式或其任何组合的任何形式使用。
120
其它聚合物和PEG衍生物(包括(但不限于)羟胺(氨氧基)PEG衍生物)描 述于以下专利申请案中,所述专利申请案都是以全文引用的方式并入本文中美国专利 公开案第2006/0194256号;美国专利公开案第2006/0217532号;美国专利公开案第 2006/0217289号;美国临时专利第60/755,338号;美国临时专利第60/755,711号;美国 临时专利第60/755,018号;国际专利申请案第PCT/US06/49397号;WO 2006/069246 ;美 国临时专利第60/743,041号;美国临时专利第60/743,040号;国际专利申请案第PCT/ US06/47822号;美国临时专利第60/882,819号;美国临时专利第60/882,500号;以及美国 临时专利第60/870,594号。异源Fc融合蛋白上述胰岛素化合物可直接或通过肽连接子与免疫球蛋白的Fc部分融合。免疫球 蛋白是含有通过二硫键结合在一起的多肽链的分子,通常具有两个轻链和两个重链。在各 链中,一个域(V)具有取决于分子的抗体特异性的可变氨基酸序列。其它域(C)具有为相 同类别的分子所共有的相当恒定的序列。如本文中所用,免疫球蛋白的Fc部分具有免疫学领域中通常赋予这一术语的含 义。具体来说,这一术语是指通过从抗体中去除两个抗原结合区(Fab片段)获得的抗体片 段。一种去除Fab片段的方法是用木瓜蛋白酶消化免疫球蛋白。因此,Fc部分是由来自两 个重链的大小近似相等的恒定区片段形成,所述片段通过非共价相互作用和二硫键缔合。 Fc部分可包括铰链区且延伸穿过抗体的CH2和CH3域到达C端。人类和小鼠免疫球蛋白的 ^^til^lillK nTjALT AntibodyEngineering, A Practical Guide, Borrebaeck, C. Α. K.编, W. H. Freeman and Co.,1992中,其教示以引用的方式并入本文中。Fc部分可进一步包括一 个或一个以上糖基化位点。所属领域中熟知多种含有铰链区、CH2和CH3域以及一个N-糖 基化位点的代表性Fc蛋白的氨基酸序列。存在五种类型的具有不同效应功能和药物动力学性质的人类免疫球蛋白Fc区 IgG、IgA、IgM、IgD以及IgE。IgG是血清中最丰富的免疫球蛋白。IgG还具有任何免疫球蛋 白中最长的血清半衰期(23天)。不同于其它免疫球蛋白,IgG在与Fc受体结合后可有效 地再循环。存在四个IgG亚类G1、G2、G3以及G4,其各自具有不同的效应功能。G1、G2以及 G3能结合Clq和固定补体,而G4则不能。虽然G3能够比Gl有效地结合Clq,但Gl在介导 补体导向的细胞溶解中更有效。G2以极低效率固定补体。IgG中的Clq结合位点位于CH2 域的羧基端区。所有IgG亚类都能够结合Fc受体(CD16、CD32、CD64),其中Gl和G3比G2和G4 有效。IgG的Fc受体结合区是由位于CH2域的铰链区和羧基端区中的残基形成。IgA可以单体形式和通过J-链结合在一起的二聚物形式存在。IgA是血清中第二 丰富的Ig,但其半衰期仅为6天。IgA具有三种效应功能。其结合巨噬细胞和嗜酸性粒细 胞上的IgA特异性受体,所述受体分别驱动吞噬作用和脱粒作用。其也可经由未知的替代 途径固定补体。IgM表达为通过J-链结合在一起的五聚物或六聚物。IgM具有5天的血清半衰期。 其经由位于CH3域中的结合位点微弱地结合Clq。IgD具有3天的血清半衰期。尚不清楚 哪些效应功能是归因于这种Ig。IgE是单体Ig且具有2. 5天的血清半衰期。IgE结合驱动 脱粒作用且引起促发炎剂释放的两种Fc受体。
取决于期望的活体内效应,本发明的异源融合蛋白可含有任一上述同种型,或可 含有补体和/或Fc受体结合功能已改变的突变Fc区。因此,本发明的异源融合蛋白可含 有与胰岛素化合物融合的免疫球蛋白的整个Fc部分、免疫球蛋白的Fc部分的片段或其类 似物。本发明的融合蛋白可由单链蛋白质组成或呈多链多肽形式。可产生两种或两种以 上Fc融合蛋白,以致其通过天然形成于Fc区之间的二硫键相互作用。这些多聚物就胰岛 素化合物来说可为同源的,或其可含有不同的在融合蛋白的Fc部分的N端处融合的胰岛素 化合物。不管融合蛋白的最终结构如何,Fc或Fc样区可用于延长在N端处融合的胰岛素 化合物的活体内血浆半衰期。同时,融合蛋白化合物的胰岛素组成部分应保持胰岛素的至 少一种生物活性。可使用本文描述或所属领域中已知的比较融合蛋白的半衰期与单独胰岛 素化合物的半衰期的方法证明治疗或循环半衰期增加。生物活性可用所属领域已知的活体 外和活体内方法确定。因为由蛋白水解所产生的IgG的Fc区具有与完整IgG分子相同的活体内半衰期 且Fab片段快速降解,所以认为用于延长半衰期的相关序列驻留在CH2和/或CH3域中。 另外,文献中已显示不结合高亲和力Fc受体或Clq的IgG变异体的分解代谢率与亲本野 生型抗体的清除率很难区分,表明分解代谢位点不同于参与Fc受体或Clq结合的位点。 [Wawrzynczak 等人,(1992)Molecular Immunology29 :221]。使用鼠类 IgGlFc 区的定点诱 变研究提示,控制分解代谢率的IgGlFc区的位点位于CH2-CH3域的界面处。Fc区可在分解 代谢位点处经修饰以优化融合蛋白的半衰期。用于本发明的融合蛋白的Fc区可源自IgGl 或IgG4 Fc区,且可含有CH2和CH3区(包括铰链区)。异源白蛋白融合蛋白本文所述的胰岛素可直接或通过肽连接子、水溶性聚合物或前药连接子与白蛋白 或其类似物、片段或衍生物融合。作为本发明融合蛋白的一部分的白蛋白一般可源自从包 括人类的任何物种克隆的白蛋白。人类血清白蛋白(HSA)由具有585个氨基酸的单个非 糖基化多肽链组成,化学式分子量为66,500。已知人类HSA的氨基酸序列[参见Meloim 等人(1975)FEBS Letters 58 136 ;Behrens 等人,(1975)Fed. Proc. 34 :591 ;Lawn 等人 (1981)Nucleic Acids Research 9 :6102_6114 ;Minghetti 等人(1986) J. Biol. Chem. 261 6747,其各自以引用的方式并入本文中]。已描述白蛋白的多种多形变异体以及类似物和 片段。[参见 Weitkamp 等人,(1973) Ann. Hum. Genet. 37 :219]。举例来说,在 EP 322,094 中,各种较短形式的HSA。已揭示这些HSA片段中的一些,包括HSA (1-373)、HSA (1-388)、 HSA(1-389)、HSA(1-369)和 HSA(1-419)以及 1-369 与 1-419 之间的片段。EP 399,666 揭 示白蛋白片段,包括HSA(1-177)和HSA(1-200)以及HSA(1-177)与HSA(1-200)之间的片 段。应了解,本发明的异源融合蛋白(包括片段、类似物和衍生物)包括与任何白蛋白 偶合的胰岛素化合物,其中所述融合蛋白具有生物活性且血浆半衰期比单独胰岛素化合物 长。因此,融合蛋白的白蛋白部分不必具有与天然人类白蛋白相等的血浆半衰期。片段、类 似物和衍生物是已知的或可产生而具有较长半衰期或具有介于天然人类白蛋白与相关胰 岛素化合物之间的半衰期。
本发明的异源融合蛋白涵盖在融合蛋白的胰岛素化合物和/或Fc或白蛋白部分 中具有保守性氨基酸取代的蛋白质。“保守性取代”是用另一带相同净电荷且具有大致相同 的大小和形状的氨基酸置换氨基酸。当具有脂肪族或经取代脂肪族氨基酸侧链的氨基酸的 侧链中的碳和杂原子总数相差不超过约4时,具有大致相同的大小。当侧链中的分支数相 差不超过1时,具有大致相同的形状。侧链中具有苯基或经取代苯基的氨基酸视为具有大 致相同的大小和形状。除非本文另外特别提供,否则保守性取代优选用天然存在氨基酸进 行。野生型白蛋白和免疫球蛋白可从多种来源获得。举例来说,这些蛋白质可从cDNA 文库获得,该文库又可从以可检测水平表达相关mRNA的组织或细胞制备。可用使用公开 DNA或蛋白质序列针对相关特定蛋白质设计的探针筛选文库。举例来说,以下文献中描述 免疫球蛋白轻链或重链恒定区:Adams等人(1980)Biochemistry 19 :2711_2719 ;Goughet 等人(1980)Biochemistry 19 :2702_2710 ;Dolby 等人(1980)Proc. Natl. Acad. Sci. USA 77 6027-6031 ;Rice 等人(1982)Proc. Natl. Acad. Sci. USA 79 :7862_7862 ;Falkner 等 人(1982)Nature 298 :286_288 ;和 Morrison 等人(1984)Ann. Rev. Immunol. 2 :239_256。 一些揭示白蛋白和DNA序列的参考文献包括Meloun等人(1975)FEBS Letters 58:136; Behrens 等人(1975)Fed. Proc. 34 591 ;Lawn 等人(1981)Nucleic Acids Research 9 6102-6114 ;和 Minghetti 等人(1986) J. Biol. Chem. 261 :6747。表征本发明的异源融合蛋白存在许多表征本发明融合蛋白的方法。一些这类方法包括(但不限于)与蛋白质 染色法结合的SDS-PAGE或使用抗IgG或抗HSA抗体的免疫印迹法。其它方法例如包括基 质辅助激光解吸附/离子化质谱(MALDI-MS)、液相色谱/质谱、等电聚焦、分析型阴离子交 换、色谱聚焦和圆二色谱。增强对血清白蛋白的亲和性也可使各种分子与本发明的胰岛素多肽融合以调节胰岛素多肽在血清中的半衰 期。在一些实施例中,使分子与本发明的胰岛素多肽连接或融合以增强对动物中的内源血 清白蛋白的亲和性。举例来说,在一些情况下,制备胰岛素多肽与白蛋白结合序列的重组融合体。示范 性白蛋白结合序列包括(但不限于)来自链球菌(str印tococcal)蛋白G的白蛋白结合域 (例如参见 Makrides 等人,J. Pharmacol. Exp. Ther. 277 :534_542 (1996);和 s jolander 等 人,J,Immunol. Methods 201 115-123 (1997)),或白蛋白结合肽,例如在例如Dennis等人, J. Biol. Chem. 277 :35035_35043 (2002)中所述的白蛋白结合肽。在其它实施例中,用脂肪酸使本发明的胰岛素多肽酰化。在一些情况下,脂肪酸促 进与血清白蛋白的结合。例如参见Kurtzhals等人,Biochem. J. 312 :725_731 (1995)。在其它实施例中,本发明的胰岛素多肽是直接与血清白蛋白(包括(但不限于) 人类血清白蛋白)融合。所属领域的技术人员应认识到,也可使多种其它分子与本发明的 胰岛素连接以调节与血清白蛋白或其它血清组分的结合。胰岛素多肽的糖基化本发明包括并有一种或一种以上带有糖残基的非天然编码氨基酸的胰岛素多肽。 糖残基可为天然残基(包括(但不限于)N-乙酰基葡糖胺)或非天然残基(包括(但不限于)3_氟半乳糖)。糖可通过N或0-连接的糖苷键(包括(但不限于)N-乙酰基半乳 糖-L-丝氨酸)或非天然键(包括(但不限于)肟或相应的C或S-连接的糖苷)与非天 然编码氨基酸连接。可在活体内或活体外将糖(包括(但不限于)糖基)部分添加到胰岛素多肽中。 在本发明的一些实施例中,用由氨氧基衍生的糖修饰包含含羰基的非天然编码氨基酸的胰 岛素多肽,以产生通过肟键连接的相应糖基化多肽。在糖与非天然编码氨基酸连接后,可通 过用糖基转移酶和其它酶处理来进一步精细修饰糖以产生结合于胰岛素多肽的寡糖。例如 参见 H. Liu 等人,J. Am. Chem. Soc. 125 1702-1703 (2003)。在本发明的一些实施例中,直接用以氨氧基衍生物形式制备的具有规定结构的聚 糖修饰包含含羰基的非天然编码氨基酸的胰岛素多肽。所属领域的技术人员应认识到,可 使用其它官能团(包括叠氮化物、炔、酰胼、胼和氨基脲)使糖与非天然编码氨基酸连接。在本发明的一些实施例中,随后可通过(包括(但不限于))休斯根[3+2]环加成 反应分别用(包括(但不限于))炔基或叠氮基衍生物修饰包含含叠氮基或炔基的非天然 编码氨基酸的胰岛素多肽。这种方法允许以极高选择性修饰蛋白质。■綠二劇勿滅劇勿本发明还提供胰岛素和胰岛素类似物组合,例如同源二聚物、异源二聚物、同源多 聚物或异源多聚物(即三聚物、四聚物等),其中含有一个或一个以上非天然编码氨基酸 的胰岛素直接与多肽主链结合,或通过连接子与另一胰岛素或其胰岛素变异体或非胰岛素 或其胰岛素变异体的任何其它多肽结合。由于与单体相比分子量增加,所以胰岛素二聚物 或多聚物结合物可展现新颖或所需性质,包括(但不限于)相对于单体胰岛素展现不同的 药理学、药物动力学、药效学性质、经调节的治疗半衰期或经调节的血浆半衰期。单体胰 岛素类似物的实例例如参见1992年11月17日颁布的Balschmidt,P.等人,美国专利第 5,164,366号;1997年4月8日颁布的Brange,J.等人,美国专利第5,618,913号;1996年 5月7日颁布的Chance,R. Ε.等人,美国专利第5,514,646号;和Ertl,J.等人,欧洲专利 局公开案第885,961号,1998年12月23日。本发明的一些实施例提供含有一个或一个以 上非天然编码氨基酸残基的单体胰岛素类似物,并且在一些实施例中,这些胰岛素类似物 包括位置B28为Asp、Lys, lie、Leu、Val或Ala且位置B29的氨基酸残基为Lys或Pro的 单体胰岛素类似物;具有Lys(B28)Pr0(B29)的单体胰岛素类似物-人类胰岛素;单体胰岛 素类似物Asp (B28)-人类胰岛素;和单体胰岛素类似物Lys (B3) lie (B28)-人类胰岛素。在 一些实施例中,本发明的胰岛素二聚物将调节胰岛素受体的信号转导。在其它实施例中,本 发明的胰岛素二聚物或多聚物将充当胰岛素受体的拮抗剂、激动剂或调节剂。在一些实施例中,在含有胰岛素的二聚物或多聚物中存在的一个或一个以上胰岛 素分子包含与水溶性聚合物连接的非天然编码氨基酸。在一些实施例中,胰岛素多肽是(包括(但不限于))通过Asn-Lys酰胺键或 Cys-Cys 二硫键直接连接。在一些实施例中,胰岛素多肽和/或连接的非胰岛素分子将包 含不同的非天然编码氨基酸以促进二聚化,其包括(但不限于)第一胰岛素多肽的一个非 天然编码氨基酸中的炔与第二分子的第二非天然编码氨基酸中的叠氮化物将通过休斯根 [3+2]环加成结合。或者,包含含酮的非天然编码氨基酸的胰岛素和/或连接的非胰岛素分 子可与包含含羟胺的非天然编码氨基酸的第二多肽结合,并且所述多肽是通过形成相应肟进行反应。或者,两种胰岛素多肽和/或连接的非胰岛素分子是通过连接子连接。可使用任 何异型双官能连接子或同型双官能连接子来连接两种分子和/或连接的非胰岛素分子,其 可具有相同或不同的一级序列。在一些情况下,用于将胰岛素和/或连接的非胰岛素分子 连接在一起的连接子可为双官能PEG试剂。连接子可具有各种分子量或分子长度。可使用 较大或较小分子量的连接子在胰岛素与连接实体之间或在胰岛素与其受体之间或在连接 实体与其结合搭配物(如果存在的话)之间提供所需空间关系或构象。也可使用具有较长 或较短分子长度的连接子在胰岛素与连接实体之间或在连接实体与其结合搭配物(如果 存在的话)之间提供所需空间或柔性。在一些实施例中,本发明提供具有 铃结构的水溶性双官能连接子,所述结构包 括a)在聚合物主链的至少一个第一末端上的叠氮基、炔、胼、酰胼、羟胺或含羰基的部分; 以及b)至少一个在聚合物主链的第二末端上的第二官能团。第二官能团可与第一官能团 相同或不同。在一些实施例中,第二官能团不与第一官能团反应。在一些实施例中,本发明 提供包含分支分子结构的至少一个臂的水溶性化合物。举例来说,分支分子结构可为树枝 状。在一些实施例中,本发明提供通过与水溶性活化聚合物反应而形成的包含一个或 一个以上胰岛素多肽的多聚物,所述水溶性活化聚合物具有以下结构R-(CH2CH20)n-0-(CH2)m_X其中η为约5到3,000,m为2_10,X可为叠氮基、炔、胼、酰胼、氨氧基、羟胺、乙酰
基或含羰基的部分,并且R为可与X相同或不同的封端基团、官能团或离去基。R可为例如 选自由以下组成的群组的官能团羟基、经保护羟基、烷氧基、N-羟基丁二酰亚胺酯、1-苯 并三唑酯、碳酸N-羟基丁二酰亚胺酯、碳酸1-苯并三唑酯、乙缩醛、醛、水合醛、烯基、丙烯 酸酯、甲基丙烯酸酯、丙烯酰胺、活性砜、胺、氨氧基、经保护胺、酰胼、经保护酰胼、经保护硫 醇、羧酸、经保护羧酸、异氰酸酯、异硫氰酸酯、顺丁烯二酰亚胺、乙烯基砜、二硫代吡啶、乙 烯基吡啶、碘乙酰胺、环氧化物、乙二醛、二酮、甲磺酸酯、甲苯磺酸酯和三氟乙磺酸酯、烯烃 以及酮。测量胰岛素多肽活性和胰岛素多肽对胰岛素受体的亲和性可使用标准或已知活体外或活体内测定确定胰岛素多肽活性。可用所属领 域中已知的合适方法分析胰岛素多肽的生物活性。如Meager,J. Immunol. Meth.,261 21-36(2002)中所述,所述测定包括(但不限于)干扰素应答基因的激活、受体结合测定、抗 病毒活性测定、细胞病变效应抑制测定(Familletti等人,Meth. Enzymol. 78 :387_394)、抗 增殖测定(Aebersold和Sample, Meth. Enzymo 1. 119 :579_582)、免疫调节测定(美国专利 第4,914,033号、第4,753,795号)和监测MHC分子诱发的测定(例如Hokland等人,Meth. Enzymol. 119 :688_693)。3T3-1脂肪细胞中的葡萄糖摄取可使用以下方法评估。从美国典型菌种保藏中 心(ATCC,Rockville, Md.)获得3T3-L1细胞。将细胞培养在含有含10%富铁胎牛血清的 杜尔贝科氏改良伊格尔培养基(Dulbecco' s modified Eagle' s medium)的生长培养 基(growth medium,GM)中。对于标准脂肪细胞分化来说,在细胞汇合(称为第O天)后2 天,使细胞暴露在含有10%胎牛血清、10 μ g/ml胰岛素、1 μ M地塞米松(dexamethasone)和0. 5 μ M异丁基甲基黄嘌呤的分化培养基(differentiation medium, DM)中历时48小时。 随后将细胞维持在含有10%胎牛血清和10μ g/ml胰岛素的分化后培养基中。活体外效能 可使用所属领域的技术人员已知的葡萄糖摄取测定来测量。活体外效能可定义为在基于细 胞的测定中胰岛素化合物的葡萄糖摄取的量度并且是胰岛素化合物的生物效能的量度。其 可表示为EC50,即化合物在单剂量反应实验中产生50%活性的有效浓度。葡萄糖转运测定一胰岛素依赖性一如通过0. ImM 2_脱氧_D_[14C]葡萄糖 的累积所测定,如下测量己醣摄取用升温到37 °C并且含有0.2% BSA的KRP缓冲液 (136mM NaCl、4.7mM KClUOmM NaP04、0. 9mM CaC12、0. 9mM MgS04 (pH7. 4))洗涤 12 孔板 中的3T3-L1脂肪细胞两次,在37°C下在室内空气中在含有0. 2% BSA的莱氏L-15培养基 (Leibovitz' s L-15medium)中培育2小时,再次用含有0. 2% BSA缓冲液的KRP洗涤两次, 并且在37°C下在室内空气中在含有0. 2% BSA缓冲液和不存在渥曼青霉素(wortmarmin) (仅存在Me2S0)或存在渥曼青霉素的KRP中培育30分钟。随后添加胰岛素直到IOOnM的 最终浓度历时15分钟,并且测量2-脱氧-D-[14C]葡萄糖的摄取历时最后4分钟。所有值 减去在1011|1细胞分裂抑素8((^切(^£11£1&11 B)存在下测出的非特异性摄取。使用Pierce 二喹啉甲酸(bicinchoninic acid)测定来确定蛋白质浓度。通常以每一实验一式三份或 一式四份来测量摄取。可研究在胰岛素存在下用FGF-21短期和长期预处理3T3-L1脂肪细 胞的作用。葡萄糖转运测定一胰岛素非依赖性一将3T3-L1纤维母细胞涂在96孔板中并且 分化成脂肪细胞历时2周。分化后,使其在无血清培养基中饥饿并且用本发明的各种胰岛 素多肽处理24小时。处理后,用含有0. 1 % BSA的KRBH缓冲液洗涤细胞两次。在含经标记 葡萄糖的KPBH缓冲液存在下摄取葡萄糖。这允许定性评估通过本发明制造的多种胰岛素 多肽和类似物,和那些经聚乙二醇化的胰岛素多肽和类似物(因为已知聚乙二醇化使得天 然分子的效率降低),并且比较不同胰岛素的功效。另外,本发明的胰岛素多肽显示在离体 组织模型中诱导葡萄糖摄取。在离体葡萄糖转运模型中,葡萄糖转运测定描述如下克-汉二氏缓冲液储备溶 液(Krebs-Henseleit Buffer Stock Solution) — C存物 1 :NaCl (1· 16M) ;KCl (0. 046Μ); ΚΗ2Ρ04 (0. 0116Μ) ;NaHC03 (0. 0253M)。贮存物 2 :CaC12(0. 025M) ;MgS04 (2H20) (0. 0116M)。 BSA 利用ICN科恩分部分离法V (Cohn FractionV),不经透析直接使用的无脂肪酸BSA。培 养基制备将50ml克氏(Krebs)贮存物1添加到395ml dH20和含有95% 02/5% C02的气 体中历时1小时。添加50ml贮存物2并且用dH20使其达到500ml。添加500mg ICN无脂 肪酸BSA。预培育和培育培养基32mM甘露糖醇、SmM葡萄糖。洗涤培养基40mM甘露糖醇、 2mM丙酮酸酯。转运培养基39mM甘露糖醇、ImM 2_DG ;32mM甘露糖醇、8mM 3-0-MG。胰岛 素溶液(猪胰岛素[Lilly] 100,000,000 μ U/ml),最终浓度为2000 μ U/ml或13. 3nM。放射 性标记培养基制备所用的比活性:2DG = 1. 5mCi/ml ;3-0-MG = 437 μ Ci/ml ;或甘露糖醇 =8μ Ci/m。每IOOg体重用0. Icc戊巴比妥钠(Nembutal)使大鼠麻醉。切除肌肉组织且 用0.9%生理食盐水冲洗,随后在29°C下放入预培育培养基(2ml)中1小时。将肌肉组织 转移到培育培养基(2ml ;与预培育相同,除了包括胰岛素或测试化合物)中且培育30分钟 (视实验条件而定)。随后在29°C下将肌肉组织转移到洗涤培养基(2ml)中10分钟,随后 转移到标记培养基(1.5ml)中10分钟(3-0-MG)或20分钟(2DG)。整理肌肉组织,称重并放入干冰上的聚丙烯管中。将Iml IN KOH添加到所述管中,随后放入70°C水浴中10-15分 钟,每隔数分钟使管涡流。在冰上冷却管且添加Iml IN HC1,随后充分混合。随后将200 μ 1 上清液放入两份闪烁瓶中且在闪烁计数器上计数,将其与已知放射性标准品相比较。关于收缩,首先将肌肉在预培育/培育培养基中培育1小时。1小时后,将每一对 肌肉(每只大鼠一对)中的一个肌肉钉在刺激装置上且将另一个肌肉转移到新培育培养基 烧瓶中。通过70Hz的200毫秒(msec)脉冲串来刺激收缩的肌肉,其中串中的每一脉冲是 0.1毫秒。所述脉冲串在10-15V下以Ι/sec传递2X10分钟,其间停止1分钟。在刺激期 结束时,从刺激装置上移除肌肉且放入洗涤培养基中10分钟,随后放入如上文所概述的标 记培养基中。无论用于产生本发明胰岛素类似物的方法如何,都使类似物进行生物活性测定。 可进行氚化胸腺嘧啶测定来确定细胞分裂的程度。然而,可使用其它生物测定来确定期望 活性。可分析胰岛素多肽的抗病毒活性和/或抗增殖活性。所属领域的技术人员已知抗增 殖测定。Basu 等人 Bioconjugate Chem(2006) 17 :618_630 描述使用 A549 细胞和 MTT 测量 增殖的抗增殖测定。例如测定抑制病毒复制的能力的生物测定还指示胰岛素活性。还可使 用所属领域的技术人员已知的测定评估本发明胰岛素多肽的生物活性和潜在的副作用。本发明的胰岛素、胰岛素多肽和/或胰岛素类似物的平均量可变化且尤其应基于 取得资格的医师的推荐和处方。本发明的胰岛素、胰岛素多肽和/或胰岛素类似物的确切 量见仁见智受以下因素影响,例如所治疗的病状的确切类型和/或严重程度、所治疗的患 者的病状以及组合物中的其它成分。本发明还提供治疗有效量的另一活性剂的投药。所给 的量可容易地由所属领域的技术人员基于用胰岛素的疗法、可使用的胰岛素疗法和/或其 它胰岛素类似物确定。可以常规方式制造本发明医药组合物。实例提供下列实例以说明本发明,但不限制本发明。实例1本实例描述选择将非天然编码氨基酸并入胰岛素中的位点的许多组可能标准中 的一种标准。图1展示胰岛素(NP_000198-人类蛋白质登录号)的结构和序列,并且下表包括 具有全长人类胰岛素序列的SEQ ID NO :13、具有全长人类胰岛素序列而无前导序列的SEQ ID NO 14, SEQ ID NO :1_12含有胰岛素、赖脯胰岛素、门冬胰岛素、赖谷胰岛素、地特胰岛素 和甘精的A链和B链序列。通过用非天然编码氨基酸取代天然编码氨基酸来产生胰岛素多 肽。各多肽具有一个经对乙酰基苯丙氨酸或经对氨基苯丙氨酸取代的氨基酸。所产生的多 肽缺乏前导序列并且是A/B链胰岛素多肽(SEQ ID NO. 1-14)。所产生的多肽各在以下位 置处具有非天然编码氨基酸取代SEQ ID而1的1、5、8、9、10、12、14、15、18、19和21以及 SEQ ID NO 2 的 1、2、3、4、17、20、21、22、25、28 和 29。图2展示使用PyMOL软件(DeLano Scientific ;Palo Alto, CA)标记的人类胰岛 素的结构和本发明的胰岛素多肽中的一些对应于那些经对乙酰基苯丙氨酸取代的氨基酸 的氨基酸。图6展示胰岛素与已知胰岛素类似物之间的序列同源性。选择并入非天然编码氨基酸的优选位点的另一组标准包括从蛋白质数据库或其它数据库中使用和比较晶体结构,用于模拟胰岛素的结构并且识别以下残基1)不会干扰 与FGF受体或肝素的结合和2)不存在于蛋白质的内部。在一些实施例中,一个或一个以上 非天然编码编码氨基酸并入胰岛素的一个或一个以上以下位置处SEQ ID NO 1的1、5、8、 9、10、12、14、15、18、19 和 21 以及 SEQ IDNO 2 的 1、2、3、4、17、20、21、22、25、28 和 29。在一 些实施例中,一个或一个以上非天然编码编码氨基酸并入(但不限于)胰岛素的一个或一 个以上以下位置处SEQ ID NO :1 的 1、5、8、9、10、12、14、15、18、19 和 21(或在 SEQID NO :3、 5、7、9、11中的相应氨基酸)。在一些实施例中,一个或一个以上非天然编码编码氨基酸并 入(但不限于)胰岛素的一个或一个以上以下位置处SEQID NO :2的1、2、3、4、17、20、21、 22、25、28和29(或在SEQ ID NO :4、6、8、10、12中的相应氨基酸)。在一些实施例中,一个或 一个以上非天然编码编码氨基酸并入(但不限于)胰岛素的一个或一个以上以下位置处 SEQ ID NO 1 的 1、5、8、9、10 和 12(或在 SEQ ID NO :3、5、7、9、11 中的相应氨基酸)。在一 些实施例中,一个或一个以上非天然编码编码氨基酸并入(但不限于)胰岛素的一个或一 个以上以下位置处SEQ ID NO :2的1、2、3、4、17和20(或在SEQID NO :4、6、8、10、12中的 相应氨基酸)。在一些实施例中,一个或一个以上非天然编码编码氨基酸并入(但不限于) 胰岛素的一个或一个以上以下位置处SEQID N0:1的14、15、18、19和21(或在SEQ ID NO: 3、5、7、9、11中的相应氨基酸)。在一些实施例中,一个或一个以上非天然编码编码氨基酸 并入(但不限于)胰岛素的一个或一个以上以下位置处SEQ ID NO 2的21、22、25、28和 29 (或在SEQ ID NO :4、6、8、10、12中的相应氨基酸)。使用以下标准评估胰岛素和胰岛素类似物的各位置以引入非天然编码氨基酸残 基(a)基于结构分析不应干扰胰岛素受体的结合,b)不应受丙氨酸或同系物扫描诱变影 响,(c)应表面暴露并与周围残基展现最小的范德华力(van derffaals)或氢键相互作用, (d)在胰岛素变异体中应可缺失或可变异,(e)经非天然编码氨基酸取代后将产生保守性 变化,以及(f)可见于高度柔性区域或结构刚性区域中。另外,可使用Cx程序(Pintar等 人(2002)BiOinfOrmatiCS,18,第980页)评估各蛋白质原子的突出程度,来进一步计算胰 岛素分子。在一些实施例中,一个或一个以上非天然编码氨基酸并入胰岛素中的一个或一个 以上以下位置处位置 1(即在 N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22(即在蛋白质的羧基端)(SEQ ID NO :1 或在 SEQ ID NO :3、5、7、9、11 中 的相应氨基酸)。在一些实施例中,一个或一个以上非天然编码氨基酸并入胰岛素中的一 个或一个以上以下位置处位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、 15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32(即在蛋白质的羧基端)(SEQ ID NO :2或在SEQ ID NO :4、6、8、10、12中的相应氨基酸)。在一些实施例中,一个或一个以 上非天然编码氨基酸并入胰岛素中的一个或一个以上以下位置处8、9、10、14(SEQ ID NO 1或在SEQ ID NO :3、5、7、9、11中的相应氨基酸)。在一些实施例中,一个或一个以上非天 然编码氨基酸并入胰岛素中的一个或一个以上以下位置处1、17、25、28(SEQ ID N0:2或在 SEQ ID NO :4、6、8、10、12中的相应氨基酸)。实例2本实例详述包括非天然编码氨基酸的胰岛素多肽在大肠杆菌中的克隆和表达。所属领域的技术人员已知克隆胰岛素的方法。胰岛素的多肽和多核苷酸序列和胰岛素于宿主细胞中的克隆详述于以下文献中美国专利第5,962,267号;美国专利第 4,751,180 号、第 7,105,314 号、第 6,630, 348 号、第 6,777 号和第 7,091,032 号,标题为 "Expression of a human insulin precursor in P. pastoris,,白勺 Armibali 专禾[|,以及美 国专利公开案第 20080268519 号、第 20080255045 号、第 20080227205 号、第 20080207877 号、第 20080207877 号、第 20080213828 号、第 20080261311 号和第 20080227195 号;所有专 利和公开申请案都以引用的方式并入本文中。编码赖脯形式的胰岛素的cDNA如SEQ ID NO 34、35、36和37所示。这一成熟多 肽如SEQ ID NO 3禾口 4所示。使用包含正交tRNA(O-tRNA)和正交氨酰基tRNA合成酶(O-RS)的引入翻译系统 表达含有非天然编码氨基酸的胰岛素或胰岛素类似物。O-RS优先利用非天然编码氨基酸使 Ο-tRNA氨酰化。翻译系统又应答编码的选择密码子将非天然编码氨基酸插入胰岛素或胰岛 素类似物中。合适的O-RS和Ο-tRNA序列描述于标题为"Compositions of Aminoacyl-tRNA Synthetase and Uses Thereof” 的 W02006/068802 中(E9 ;SEQ ID NO 15)和标题为 "Compositions of tRNA and UsesThereof ” 的 WO 2007/021297 中(F13 ;SEQ ID NO 16),
其以全文引用的方式并入本文中。
用含有经修饰胰岛素或胰岛素类似物基因和正交氨酰基tRNA合成酶/tRNA对 (对所需非天然编码氨基酸具有特异性)的质粒转化大肠杆菌使得可将非天然编码氨基酸位点特异性地并入胰岛素多肽中。通过PCR,由使用标准方案的cDNA合成反应扩增野生型成熟胰岛素并且克隆 到pET30 (NcoI-BamHI)中。在序列确定之前或者之后,在来源于大肠杆菌脂蛋白启动子 序列(Miller, J. H.,Gene, 1986)的合成启动子的组成性控制下,将包括N端HHHHHHSGG 序列的胰岛素从詹氏甲烷球菌(Mj tRNATyr/CUA)亚克隆到含有琥珀抑制因子酪氨酰基 tRNATyr/CUA的抑制载体中,以及在大肠杆菌GlnRS启动子的控制下,亚克隆正交酪氨酰基 tRNA合成酶(MjTyrRS)。在T7启动子的控制下表达胰岛素。使用标准快速变化突变方案 (Stratagene ;La Jolla, California)引入琥珀突变。验证构筑体的序列。长效胰岛素化合物的测试可使用STZ糖尿病大鼠模型(PC0 08-400-209)来进行。用对乙酰基-苯丙氨酸(PAcF)抑制将质粒(pVK6-赖辅胰岛素)转化于大肠杆菌的W3110 B2菌株中,其中T7聚合酶 的表达在阿拉伯糖诱导性启动子的控制下。将过夜细菌培养物1 100稀释到含有2XYT 培养基的摇瓶中并且在37°C下生长到OD6tltl为约0. 8。通过添加阿拉伯糖(0. 2%最终)和 对乙酰基-苯丙氨酸(PAcF)到4mM的最终浓度来诱导蛋白质表达。在37°C下培育培养 物5小时。使细胞成球状且再悬浮于100 μ 1/OD/mlB-PER溶解缓冲液(Pierce) +10 μ g/ml DNase中并在37°C下培育30分钟。通过离心移除细胞物质并且移除上清液。将小球再悬 浮于等量SDS-PAGE蛋白质加载缓冲液中。将所有样品都加载到含有MES和DTT的4-12% PAGE凝胶上。所属领域的技术人员已知纯化胰岛素的方法并且通过SDS-PAGE、西方印迹分 析或电喷雾-电离离子阱质谱法等来证实。所用的质粒和序列如图5所示,且N端标记His的胰岛素的表达和7个琥珀位点 处的抑制如图6所示。胰岛素原多肽用箭头标记。图6展示B-PER小球样品-泳道1的 左侧标记物;泳道1 :VK6-胰岛素原-PAF-Q15 ;泳道2 :VK6_胰岛素原-pAF_Y14 ;泳道3 VK6-胰岛素原-pAF-R22 ;泳道4 :VK6_胰岛素原-pAF_Fl ;泳道5 :VK6_胰岛素原-pAF_Gl ; 泳道6 :VK6-胰岛素原-pAF-S9、0. 2%阿拉伯糖;泳道7 :VK6_胰岛素原-pAF_K28。关于泳 道1、2、5和6中的氨基酸取代所示的位置编号是基于赖脯胰岛素A链SEQ ID N0:3,且关 于泳道3、4和7中的氨基酸取代所示的位置编号是基于赖脯胰岛素B链SEQ ID NO :4。标记His的突变胰岛素蛋白可使用所属领域的技术人员已知的方法纯化。可通过 由制造商提供的标准标记His的蛋白质纯化程序来使用ProBond镍螯合树脂(Invitrogen, Carlsbad, CA)。蛋白质的功能性测量可通过所属领域中已知的方法、本申请案和所并入的 参考文献中提供的方法进行,或者,可开发针对活细胞的ELISA来评估本发明的胰岛素多 肽。实例3本实例详述含羰基的氨基酸的引入以及其与含氨氧基的PEG的后续反应。本实例展示一种产生合并有含酮的非天然编码氨基酸的胰岛素多肽的方法,所述 多肽随后与约5,000MW的含氨氧基的PEG反应。在位置1(即在N端)之前、1、2、3、4、5、6、 7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22(即在 SEQ ID NO 1 的蛋白质的羧基端 或在SEQ ID而3、5、7、9、11中的相应氨基酸)处的各残基和在位置1(即在^溝)之前、1、 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、 30、31、32(即在SEQ ID NO :2的蛋白质的羧基端或在SEQ ID NO :4、6、8、10、12中的相应氨基酸)处的各残基分别由具有以下结构的非天然编码氨基酸取代
用于将对乙酰基-苯丙氨酸位点特异性地并入胰岛素中的序列为SEQ ID N0:1和 2 (胰岛素的A链和B链)JPSEQ ID NO :16或17 (muttRNA,詹氏甲烷球菌),以及在上述实 例 2 中所述的 SEQ ID NO :15、29、30 或 31(TyrRS LW1、5 或 6)。包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与以下形式的含氨氧基的 PEG衍生物反应R-PEG(N) -0-(CH2)η_0_ΝΗ2其中R为甲基,η为3并且N为约5,000丽。将含有对乙酰基苯丙氨酸的经纯 化胰岛素以 10mg/mL 溶解于 25mM MES (Sigma Chemical, St. Louis, MO) (pH 6.0)、25mM Hepes (Sigma Chemical, St. Louis, MO) (pH 7.0)或 IOmM 乙酸钠(Sigma Chemical, St. Louis,M0) (pH 4. 5)中,与10倍到100倍过量的含氨氧基的PEG反应,并且随后在室温 下搅拌 10-16 小时(Jencks, W. J. Am. Chem, Soc. 1959,81,第 475 页)。随后,将 PEG-胰岛素 稀释于适当缓冲液中立即进行纯化和分析。实例 4本实例详述含羰基的氨基酸的引入以及其与含氨氧基的PEG的后续反应。本实例展示一种产生合并有含酮的非天然编码氨基酸的胰岛素多肽的方法,所述 多肽随后与约20,000MW的含氨氧基的PEG反应。在位置1 (即在N端)之前、1、2、3、4、5、6、 7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22(即在 SEQ ID NO 1 的蛋白质的羧基端 或在SEQ ID N0:3、5、7、9、11中的相应氨基酸)处的各残基和在位置1(即在N端)之前、1、 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、 30、31、32(即在SEQ ID NO :2的蛋白质的羧基端或在SEQ ID NO :4、6、8、10、12中的相应氨 基酸)处的各残基分别由具有以下结构的非天然编码氨基酸取代 用于将对氨基-苯丙氨酸位点特异性地并入到胰岛素中的序列为SEQ ID N0:1和 2 (胰岛素的A链和B链)JPSEQ ID NO 16或17 (muttRNA,詹氏甲烷球菌),以及以上所述 并且用于位点特异性地并入对氨基_苯丙氨酸所并入的序列。包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与以下形式的含氨氧基的 PEG衍生物反应
其中R为甲基,η为3并且N为约20,000MW。将含有对氨基苯丙氨酸的经纯化胰岛 素以 10mg/mL溶解于 25mM MES (Sigma Chemical, St. Louis,MO) (pH6. 0)、25mM Hepes (Sigma Chemical, St. Louis, MO) (pH 7. 0)或 IOmM 乙酸钠(Sigma Chemical, St. Louis, M0) (pH 4.5)中,与10倍到100倍过量的含氨氧基的PEG反应,并且随后在室温下搅拌10-16小时 (Jencks, W. J. Am. Chem, Soc. 1959,81,第475页)。随后,将PEG-胰岛素稀释于适当缓冲液 中立即进行纯化和分析。实例5本实例详述含羰基的氨基酸的引入以及其与含氨氧基的PEG的后续反应。本实例展示一种产生合并有含酮的非天然编码氨基酸的胰岛素多肽的方法,所述 多肽随后与约20,000MW的含氨氧基的PEG反应。在位置1(即在N端)之前、1、2、3、4、5、 6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、 33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、 58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、 83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、 106、107、108、109、110、111(即在SEQ ID NO :13的蛋白质的羧基端)处的各残基分别由具 有以下结构的非天然编码氨基酸取代用于将对氨基-苯丙氨酸位点特异性地并入到胰岛素中的序列为SEQ ID NO :13, 和SEQ ID NO 16或17 (muttRNA,詹氏甲烷球菌),以及以上所述并且用于位点特异性地并 入对氨基-苯丙氨酸所并入的序列。包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与以下形式的含氨氧基的 PEG衍生物反应R-PEG(N) -0-(CH2)η_0_ΝΗ2其中R为甲基,η为3并且N为约20,OOOMW0将含有对氨基苯丙氨酸的经纯化胰岛 素以 10mg/mL溶解于 25mM MES (Sigma Chemical, St. Louis,MO) (pH6. 0)、25mM Hepes (Sigma Chemical, St. Louis, M0) (pH 7. 0)或 IOmM 乙酸钠(Sigma Chemical, St. Louis, M0) (pH 4.5)中,与10倍到100倍过量的含氨氧基的PEG反应,并且随后在室温下搅拌10-16小时 (Jencks, W. J. Am. Chem, Soc. 1959,81,第475页)。随后,将PEG-胰岛素稀释于适当缓冲液 中立即进行纯化和分析。实例6本实例详述含羰基的氨基酸的引入以及其与含氨氧基的PEG的后续反应。本实例展示一种产生合并有含酮的非天然编码氨基酸的胰岛素多肽的方法,所述 多肽随后与约20,000MW的含氨氧基的PEG反应。在位置1(即在N端)之前、1、2、3、4、5、
1326、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、 33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、 58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、 83、84、85、86、87(即在SEQ ID NO :14的蛋白质的羧基端)处的各残基分别由具有以下结 构的非天然编码氨基酸取代用于将对氨基-苯丙氨酸位点特异性地并入到胰岛素中的序列为SEQ ID NO :14, 和SEQ ID NO 16或17 (muttRNA,詹氏甲烷球菌),以及以上所述并且用于位点特异性地并 入对氨基-苯丙氨酸所并入的序列。包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与以下形式的含氨氧基的 PEG衍生物反应R-PEG(N) -0-(CH2)η_0_ΝΗ2其中R为甲基,η为3并且N为约20,000MW。将含有对氨基苯丙氨酸的经纯化胰岛 素以 10mg/mL溶解于 25mM MES (Sigma Chemical, St. Louis,MO) (pH6. 0)、25mM Hepes (Sigma Chemical, St. Louis, MO) (pH 7. 0)或 IOmM 乙酸钠(Sigma Chemical, St. Louis, M0) (pH 4.5)中,与10倍到100倍过量的含氨氧基的PEG反应,并且随后在室温下搅拌10-16小时 (Jencks, W. J. Am. Chem, Soc. 1959,81,第475页)。随后,将PEG-胰岛素稀释于适当缓冲液 中立即进行纯化和分析。实例 7本实例详述含羰基的氨基酸的引入以及其与含氨氧基的PEG的后续反应。本实例展示一种产生合并有含酮的非天然编码氨基酸的胰岛素多肽的方法,所述 多肽随后与约30,000MW的含氨氧基的PEG反应。在位置1(即在N端)之前、1、2、3、4、5、 6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、 33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、 58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、 83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、 106、107、108、109、110、111(即在 SEQ ID NO :13 的蛋白质的羧基端或在 SEQ ID NO 1-12 和14中的相应位置)处的各残基分别由具有以下结构的非天然编码氨基酸取代 用于将对氨基-苯丙氨酸位点特异性地并入到胰岛素中的序列为SEQ ID NO 13 (或SEQ ID N0:1、2或14),和SEQ ID NO 16或17 (muttRNA,詹氏甲烷球菌),以及以上 所述并且用于位点特异性地并入对氨基_苯丙氨酸所并入的序列。包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与以下形式的含氨氧基的 PEG衍生物反应R-PEG(N) -0-(CH2)η_0_ΝΗ2其中R为甲基,η为3并且N为约30,000MW。将含有对氨基苯丙氨酸的经纯化胰岛 素以 10mg/mL溶解于 25mM MES (Sigma Chemical, St. Louis,MO) (pH6. 0)、25mM Hepes (Sigma Chemical, St. Louis, M0) (pH 7. 0)或 IOmM 乙酸钠(Sigma Chemical, St. Louis, M0) (pH 4.5)中,与10倍到100倍过量的含氨氧基的PEG反应,并且随后在室温下搅拌10-16小时 (Jencks, W. J. Am. Chem, Soc. 1959,81,第475页)。随后,将PEG-胰岛素稀释于适当缓冲液 中立即进行纯化和分析。实例8本实例详述含羰基的氨基酸的引入以及其与含氨氧基的PEG的后续反应。本实例展示一种产生合并有含酮的非天然编码氨基酸的胰岛素多肽的方法,所述 多肽随后与约40,000MW的含氨氧基的PEG反应。在位置1(即在N端)之前、1、2、3、4、5、 6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、 33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、 58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、 83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、 106、107、108、109、110、111(即在 SEQ ID NO :13 的蛋白质的羧基端或在 SEQ ID NO 1-12 和14中的相应位置)处的各残基分别由具有以下结构的非天然编码氨基酸取代用于将对氨基-苯丙氨酸位点特异性地并入到胰岛素中的序列为SEQ ID N0 13 (或SEQ ID N0:1、2或14),和SEQ ID NO 16或17 (muttRNA,詹氏甲烷球菌),以及以上 所述并且用于位点特异性地并入对氨基_苯丙氨酸所并入的序列。包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与以下形式的含氨氧基的 PEG衍生物反应R-PEG(N) -0-(CH2)η_0_ΝΗ2其中R为甲基,η为3并且N为约40,000MW。将含有对氨基苯丙氨酸的经纯化胰岛 素以 10mg/mL溶解于 25mM MES (Sigma Chemical, St. Louis,MO) (pH6. 0)、25mM Hepes (Sigma Chemical, St. Louis, M0) (pH 7. 0)或 IOmM 乙酸钠(Sigma Chemical, St. Louis, M0) (pH 4.5)中,与10倍到100倍过量的含氨氧基的PEG反应,并且随后在室温下搅拌10-16小时 (Jencks, W. J. Am. Chem, Soc. 1959,81,第475页)。随后,将PEG-胰岛素稀释于适当缓冲液
中立即进行纯化和分析。实例 本实例详述含羰基的氨基酸的引入以及其与含氨氧基的PEG的后续反应。本实例展示一种产生合并有含酮的非天然编码氨基酸的胰岛素多肽的方法,所述 多肽随后与约10,000MW的含氨氧基的PEG反应。在位置1(即在N端)之前、1、2、3、4、5、 6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、 33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、 58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、 83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、 106、107、108、109、110、111(即在 SEQ ID NO :13 的蛋白质的羧基端或在 SEQ ID NO 1-12 和14中的相应位置)处的各残基分别由具有以下结构的非天然编码氨基酸取代用于将对氨基-苯丙氨酸位点特异性地并入到胰岛素中的序列为SEQ ID NO 13 (或在SEQ ID NO :1、2或14中的相应位置),和SEQ ID NO 16或17 (muttRNA,詹氏甲烷 球菌),以及以上所述并且用于位点特异性地并入对氨基_苯丙氨酸所并入的序列。包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与以下形式的含氨氧基的 PEG衍生物反应R-PEG(N) -0-(CH2)η_0_ΝΗ2其中R为甲基,η为3并且N为约10,000MW。将含有对氨基苯丙氨酸的经纯化胰岛 素以 10mg/mL溶解于 25mM MES (Sigma Chemical, St. Louis,MO) (pH6. 0)、25mM Hepes (Sigma Chemical, St. Louis, M0) (pH 7. 0)或 IOmM 乙酸钠(Sigma Chemical, St. Louis, M0) (pH 4.5)中,与10倍到100倍过量的含氨氧基的PEG反应,并且随后在室温下搅拌10-16小时 (Jencks, W. J. Am. Chem, Soc. 1959,81,第475页)。随后,将PEG-胰岛素稀释于适当缓冲液 中立即进行纯化和分析。实例10与由通过酰胺键与PEG连接的羟胺基组成的PEG结合。具有以下结构的PEG试剂是使用实例3-9中所述的程序与含酮的非天然编码氨基 酸偶合R-PEG (N) _0_ (CH2) 2_NH_C (0) (CH2) η_0_ΝΗ2其中R为甲基,η = 4并且N为约5,000MW-40, 000MW。反应、纯化和分析条件如所 属领域中所述和已知。实例11本实例详述将两种不同的非天然编码氨基酸引入胰岛素多肽和胰岛素类似物多 肽中。
本实例展示一种产生在以下残基中的两个位置处并入包含酮官能团的非天然编 码氨基酸的胰岛素多肽的方法位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、 38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、 63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、 88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、 110、111(即在SEQ ID NO :13的蛋白质的羧基端或在SEQ ID NO :1_12和14中的相应位 置)。除选择密码子是在核酸内的两个不同位点处引入之外,如以上所述来制备胰岛素多 肽。实例12本实例详述胰岛素多肽或胰岛素类似物多肽与含酰胼的PEG的结合以及后续的 原位还原。合并有含羰基的氨基酸的胰岛素多肽是根据以上所述的程序来制备。具有以下结 构的含酰胼的PEG在经修饰后与胰岛素多肽结合R-PEG(N)-0-(CH2)2-NH-C(0)(CH2)η_Χ_ΝΗ-ΝΗ2其中R 为甲基,η = 2 且 N = 5,000、10,000,20, 000,30, 000 或 40,000MW,并且 X 为
羰基(C = 0)。将含有对乙酰基苯丙氨酸的经纯化胰岛素以介于0. 1-lOmg/mL之间的浓度 溶解于 25mM MES (Sigma Chemical, St. Louis, MO) (pH 6. 0) ,25mM H 印 es(Sigma Chemical, St. Louis, MO) (pH 7. 0)或 IOmM 乙酸钠(SigmaChemical, St. Louis, M0) (pH 4. 5)中,与 1 倍到100倍过量的含酰胼的PEG反应,并且通过加入溶解于H20中直到最终浓度为10-50mM 的贮存物lMNaCNBH3(Sigma Chemical, St. Louis, MO)原位还原相应腙。在黑暗环境中在 4 □ C到室温下反应进行18-24小时。通过加入约pH 7. 6的IM Tris (Sigma Chemical, St. Louis, MO)直到最终Tris浓度为50mM来终止反应或将反应稀释于适当缓冲液中立即 进行纯化。实例13本实例详述胰岛素多肽或胰岛素类似物多肽与含酰胼的PEG的结合以及后续的 原位还原。合并有含羰基的氨基酸的胰岛素多肽是根据以上所述的程序来制备。具有以下结 构的含酰胼的PEG在经修饰后与胰岛素多肽结合R-PEG(N)-0-(CH2)2-NH-C(0)(CH2)η_Χ_ΝΗ-ΝΗ2其中R为甲基,η = 2且N = 20,000丽,并且X为羰基(C = 0)。将含有对乙酰基苯 丙氨酸的经纯化胰岛素以介于0. 1-lOmg/mL之间的浓度溶解于25mMMES (Sigma Chemical, St. Louis, M0) (pH 6. 0)、25mM Hepes (Sigma Chemical, St. Louis, M0) (pH 7. 0)或 IOmM 乙 酸钠(Sigma Chemical, St. Louis, M0) (pH4. 5)中,与1倍到100倍过量的含酰胼的PEG 反应,并且通过加入溶解于H20中直到最终浓度为10-50mM的贮存物IM NaCNBH3 (Sigma Chemical, St. Louis, M0)原位还原相应腙。在黑暗环境中在4°C到室温下反应进行18-24 小时。通过加入约 PH 7. 6 的 IM Tris (Sigma Chemical, St. Louis,MO)直到最终 Tris 浓度 为50mM来终止反应或将反应稀释于适当缓冲液中立即进行纯化。实例14[1011]本实例详述将含炔的氨基酸引入胰岛素多肽或胰岛素类似物多肽中以及用 mPEG-叠氮化物使其衍生化。在位置1(即在 N 端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、 19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、 44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、 69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、 94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111(即在 SEQ ID NO :13的蛋白质的羧基端或在SEQ ID NO 1_12和14中的相应位置)处的残基各自由以下
非天然编码氨基酸取代 用于将对炔丙基-酪氨酸位点特异性地并入胰岛素中的序列为SEQ ID N0:13(或 在SEQ ID NO :1、2或14中的相应位置),SEQ ID NO 16或17 (muttRNA,詹氏甲烷球菌), 和以上所述的SEQ ID N0:22、23或24。在大肠杆菌中表达含有炔丙基酪氨酸的胰岛素多 肽并且使用以上所述的条件进行纯化。将含有炔丙基-酪氨酸的经纯化胰岛素以介于0. 1-lOmg/mL的浓度溶解于PB缓 冲液(IOOmM磷酸钠,0. 15M NaCl, pH = 8)中并且向反应混合物中加入10倍到1000倍过 量的含叠氮基的PEG。随后,将催化量的CuS04和铜丝加入反应混合物中。在混合物经培育 (包括(但不限于)在室温或37°C下约4小时,或在4°C下过夜)后,加入H20并且通过透 析膜过滤混合物。可包括(但不限于)通过实例3中所述的类似程序来分析样品的添加。 在本实例中,PEG将具有以下结构R-PEG(N)_0_(CH2)2-NH-C(0)(CH2)n_N3其中R 为甲基,η 为 4 并且 N 为 5,000、10,000,20, 000,30, 000 或 40,000MW。实例15本实例详述胰岛素多肽中用炔丙基酪氨酸取代大的疏水性氨基酸。存在于胰岛素的一个以下区域中的Phe、Trp或Tyr残基位置1(即在N端)之前、 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、 29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、 54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、 79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、 103、104、105、106、107、108、109、110、111(即在 SEQ ID NO 13 的蛋白质的羧基端或在 SEQ ID N0:l-12和14中的相应氨基酸)如以上所述由以下非天然编码氨基酸取代 PEG在经修饰后连接到包含含炔的氨基酸的胰岛素多肽变异体上。PEG将具有以 下结构Me-PEG (N) _0_ (CH2) 2-N3并且偶合程序将遵循以上实例中的程序。这个过程会产生胰岛素多肽变异体,其 包含大致与一种天然存在的大的疏水性氨基酸等比容的非天然编码氨基酸并且在所述多 肽内的不同位点处经PEG衍生物修饰。实例16本实例详述由一个或一个以上PEG连接子分隔的胰岛素多肽同源二聚物、异源二 聚物、同源多聚物或异源多聚物的产生。胰岛素多肽多聚物可在胰岛素原之间形成或在本 发明的成熟A链与B链胰岛素多肽之间形成。使以上实例中产生的含炔的胰岛素多肽变异体与以下形式的双官能PEG衍生物 反应N3-(CH2)n_C(0)-NH-(CH2)2-0-PEG(N)-0-(CH2)2-NH-C(0)-(CH2)n_N3其中η 为 4 并且 PEG 具有约 5,000、10,000,20, 000,30, 000 或 40,000MW 的平均分 子量,以产生两个胰岛素分子由PEG实体分隔开的相应胰岛素多肽同源二聚物。胰岛素多 肽可以类似方式与一种或一种以上其它多肽偶合以形成异源二聚物、同源多聚物或异源多 聚物。如同以上实例中进行偶合、纯化和分析。实例17本实例详述由一个或一个以上PEG连接子分隔的胰岛素多肽同源二聚物、异源二 聚物、同源多聚物或异源多聚物的产生。胰岛素多肽多聚物可在A链与其它A链或B链与 其它B链之间形成。使以上实例中产生的含炔的胰岛素多肽变异体与以下形式的双官能PEG衍生物 反应N3-(CH2)n_C(0)-NH-(CH2)2-0-PEG(N)-0-(CH2)2-NH-C(0)-(CH2)n_N3其中η 为 4 并且 PEG 具有约 5,000、10,000、20,000、30,000 或 40,000MW 的平均分 子量,以产生两个胰岛素分子由PEG实体分隔开的相应胰岛素多肽同源二聚物。胰岛素多 肽可以类似方式与一种或一种以上其它多肽偶合以形成异源二聚物、同源多聚物或异源多 聚物。如同以上实例中进行偶合、纯化和分析。实例18本实例详述糖部分与胰岛素多肽的偶合。以下位置1(即在 N 端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、 43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、 68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111(即在 SEQ
ID NO 13的蛋白质的羧基端或在SEQ ID NO :1_12和14中的相应位置)处的一个残基如
以上所述由以下非天然编码氨基酸取代。 包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与N-乙酰基葡糖胺 (GlcNAc)的β-连接氨氧基类似物反应。在IOOmM水性乙酸钠缓冲液(ρΗ 5.5)中混合胰 岛素多肽变异体(lOmg/mL)与氨氧基糖(21mM),并且在37°C下培育7小时到26小时。通 过在环境温度下将结合糖的胰岛素多肽(5mg/mL)与UDP-半乳糖(16mM)和β_1,4_半乳 糖基转移酶(0. 4单位/毫升)在150mM HEPES缓冲液(ρΗ 7. 4)中培育48小时而使第二 种糖与第一种糖酶促偶合(Schanbacher 等人,J. Biol. Chem. 1970,245,5057-5061)。实例19本实例详述聚乙二醇化胰岛素多肽拮抗剂的产生。残基(包括(但不限于)与胰岛素受体结合有关的残基)如以上所述由以下非天 然编码氨基酸取代。包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与以下形式的含 氨氧基的PEG衍生物反应R-PEG (N) -0- (CH2) η_0_ΝΗ2其中R 为甲基,η 为 4 并且 N 为 5,000、10,000,20, 000,30, 000 或 40,000MW,以产
生在多肽内的单一位点处经PEG衍生物修饰的包含非天然编码氨基酸的胰岛素多肽拮抗 剂。如以上所述进行偶合、纯化和分析。实例20直接连接胰岛素分子的胰岛素多肽同源二聚物、异源二聚物、同源多聚物或异源 多聚物的产生包含含炔的氨基酸的胰岛素多肽变异体可与另一种包含含叠氮基的氨基酸的胰 岛素多肽变异体直接偶合。胰岛素多肽多肽可以类似方式与一种或一种以上其它多肽偶合 以形成异源二聚物、同源多聚物或异源多聚物。关于可形成的多聚物的更多描述在以上实 例16和17中提供并且如以上所述进行偶合、纯化和分析。实例21PEG-OH+Br- (CH2) n_C 三 CR ‘ — PEG-O- (CH2) n_C = CR ‘AB使聚烷二醇(P-OH)与烷基卤化物㈧反应形成醚⑶。在这些化合物中,η为1 到9的整数并且R'可为直链或支链、饱和或不饱和的Cl到C20烷基或杂烷基。R'也可 为C3到C7饱和或不饱和的环状烷基或环状杂烷基,经取代或未经取代的芳基或杂芳基,或 经取代或未经取代的烷芳基(所述烷基为Cl到C20饱和或不饱和烷基)或杂烷芳基。通 常,PEG-OH为具有800道尔顿到40,000道尔顿(Da)的分子量的聚乙二醇(PEG)或单甲氧基聚乙二醇(mPEG)。实例22mPEG-0H+Br-CH2-C = CH ^ mPEG-0_CH2-C = CH用THF(35mL)中的 NaH(12mg,0. 5mmol)处理具有 20,OOODa 的分子量的 mPEG-0H(mPEG-0H 20kDa ;2. Og, 0. Immol,Sunbiο)。随后,将溶解于二甲苯中的 80 重量%溶 液形式的炔丙基溴溶液(0. 56mL,5mmol,50当量,Aldrich)和催化量的KI加入溶液中并且 将所得混合物加热到回流历时2小时。随后加入水(ImL)并且在真空下移除溶剂。向残余 物中加入CH2C12(25mL)并且分离有机层,用无水Na2S04干燥,并将体积缩减到约2mL。将 此CH2C12溶液逐滴加入乙醚(150mL)中。收集所得沉淀物,用若干份冷乙醚洗涤并干燥, 得到炔丙基-0-PEG。实例23mPEG-OH+Br- (CH2) 3_C 三 CH — mPEG-O- (CH2) 3_C = CH用THF(35mL)中的 NaH(12mg,0. 5mmol)处理具有 20,OOODa 的分子量的 mPEG-0H(mPEG-0H 20kDa ;2. Og, 0. Immol, Sunbiο)。随后,将 50 当量的 5-溴-1-戊炔 (0. 53mL,5mmol,Aldrich)和催化量的KI加入混合物中。将所得混合物加热到回流历时16 小时。随后加入水(ImL)并且在真空下移除溶剂。向残余物中加入CH2C12(25mL)并且分 离有机层,用无水Na2S04干燥,并将体积缩减到约2mL。将此CH2C12溶液逐滴添加到乙醚 (150mL)中。收集所得沉淀物,用若干份冷乙醚洗涤并干燥,得到相应炔。5-氯-1-戊炔可 用于类似反应中。实例24(1) m-H0CH2C6H40H+Na0H+Br-CH2-C = CH ^ m-H0CH2C6H4O-CH2-C = CH(2) m-H0CH2C6H40-CH2-C = CH+MsCl+N (Et) 3 — m-Ms0CH2C6H40_CH2-C = CH(3)m-Ms0CH2C6H40-CH2-C = CH+LiBr — Hi-Br-CH2C6H4O-CH2-C = CH(4) mPEG-0H+m-Br-CH2C6H40-CH2-C = CH ^ mPEG-0_CH2-C6H4O-CH2-C = CH首先向3-羟基苄醇(2. 4g,20mmol)溶于THF(50mL)和水(2. 5mL)中的溶液中加 入粉末状氢氧化钠(1. 5g,37. 5mmol),并且随后加入溶解于二甲苯中的80重量%溶液形式 的炔丙基溴溶液(3.36mL,30mmol)。将反应混合物在回流下加热6小时。向混合物中加入 10%柠檬酸(2. 5mL)并且在真空下移除溶剂。用乙酸乙酯(3X15mL)萃取残余物并且用饱 和NaCl溶液(IOmL)洗涤合并的有机层,用MgS04干燥并浓缩,得到3-炔丙基氧基苄醇。在0°C下,将甲烷磺酰氯(2. 5g,15. 7mmol)和三乙胺(2. 8mL,20mmol)加入化合物 3(2. Og, 11. Ommol)溶于CH2C12中的溶液中,并且将反应液放置到冰箱中达16小时。常用 处理得到呈浅黄色油状的甲磺酸酯。将所述油状物(2.4g,9.2mmol)溶解于THF(20mL)中 并且加入LiBr (2. Og, 23. Ommol)。将反应混合物加热到回流历时1小时并且随后冷却到室 温。向混合物中加入水(2.5mL)并在真空下移除溶剂。用乙酸乙酯(3X15mL)萃取残余物 并且用饱和NaCl溶液(IOmL)洗涤合并的有机层,用无水Na2S04干燥并浓缩,得到所需溴 化物。将mPEG-OH20kDa(l. 0g, 0. 05mmol, Sunbio)溶解于 THF(20mL)中并且在冰浴中冷 却所述溶液。在强烈搅拌下历经数分钟加入NaH(6mg,0. 25mmol),接着加入上文获得的溴 化物(2. 55g,11. 4mmol)和催化量的KI。移除冷却浴并且将所得混合物加热到回流历时12OmL)并在真空下移除溶剂。向残余物中加入CH2C12(25mL) 并且分离有机层,用无水Na2S04干燥,并将体积缩减到约2mL。逐滴加入乙醚溶液(150mL) 中,产生白色沉淀物,收集所述沉淀物以得到PEG衍生物。实例25mPEG-NH2+X-C (0) - (CH2) n_C 三 CR ‘ — mPEG-NH-C (0) - (CH2) n_C = CR ‘如上所示,也可通过使含有末端官能团的聚(乙二醇)聚合物与含有炔官能团的 反应性分子偶合来获得末端含炔的聚(乙二醇)聚合物。η介于1与10之间。R'可为H 或Cl到C4的小烷基。实例26(1) HO2C- (CH2) 2-C = CH+NHS+DCC — NHSO-C (0) - (CH2) 2_C = CH (2) mPEG-NH2+NHS0-C (0) - (CH2) 2_C 三 CH — mPEG-NH-C (0) - (CH2) 2_C = CH将4-戊炔酸(2. 943g,3. Ommo 1)溶解于CH2C12 (25mL)中。加入N-羟基丁二酰亚 胺(3. 80g,3. 3mmol)和DCC (4. 66g,3. Ommol)并且在室温下将溶液搅拌过夜。所得粗NHS
酯7未经进一步纯化即用于下一反应中。将具有5,OOODa 的分子量的 mPEG_NH2 (mPEG_NH2,lg, Sunbiο)溶解于 THF(50mL) 中并且将混合物冷却到4°C。在强烈搅拌下逐份加入NHS酯7 (400mg, 0. 4mmol)。将混合物 搅拌3小时,同时升温到室温。随后加入水(2mL)并在真空下移除溶剂。向残余物中加入 CH2C12 (50mL)并且分离有机层,用无水Na2S04干燥,并将体积缩减到约2mL。将此CH2C12 溶液逐滴加入乙醚(150mL)中。收集所得沉淀物并在真空中干燥。实例27本实例表示聚(乙二醇)的甲烷磺酰基酯(其也可称作聚(乙二醇)的甲烷磺酸 酯或甲磺酸酯)的制备。可通过类似程序来制备相应的甲苯磺酸酯和卤化物。mPEG-0H+CH3S02Cl+N (Et) 3 — mPEG-0_S02CH3 — mPEG_N3在氮气下,将150mL甲苯中的mPEG-OH(丽=3,400,25g,10mmol)共沸蒸馏2小时 并且将溶液冷却到室温。将40mL无水CH2C12和2. ImL无水三乙胺(15mm0l)加入溶液中。 在冰浴中冷却所述溶液并且逐滴加入1.2mL经蒸馏的甲烷磺酰氯(15mm0l)。在氮气下,在 室温下,将溶液搅拌过夜,并且通过加入2mL无水乙醇来中止反应。在真空下蒸发所述混合 物以移除溶剂(主要是除甲苯之外的溶剂),过滤,再次真空浓缩并且随后在IOOmL乙醚中 沉淀。用数份冷乙醚洗涤滤液并在真空下干燥,得到甲磺酸酯。将甲磺酸酯(20g,8mmol)溶解于75ml THF中并且将溶液冷却到4°C。向冷却的 溶液中加入叠氮化钠(1.56g,24mm0l)。在氮气下,将反应加热到回流历时2小时。随后蒸 发溶剂并且用CH2C12(50mL)稀释残余物。用NaCl溶液洗涤有机部分并且用无水MgS04干 燥。将体积缩减到20ml,并通过加入150ml冷的无水乙醚中使产物沉淀。实例28(1) N3-C6H4-CO2H — N3-C6H4CH2OH(2) N3-C6H4CH2OH — Br-CH2-C6H4-N3(3) mPEG-OH+Br-CH2-C6H4-N3 — mPEG-0_CH2-C6H4-N3 可使用美国专利第 5,998, 595 号中所述的方法来制备4-叠氮基苄醇,所述专利是以引用的方式并入本文中。在0°C下 将甲烷磺酰氯(2. 5g,15. 7mmol)和三乙胺(2. 8mL,20mmol)加入4-叠氮基苄醇(1. 75g,
14111. Ommol)的CH2C12溶液中,并且将反应液放置到冰箱中达16小时。常用处理得到呈浅黄 色油状的甲磺酸酯。将所述油状物(9. 2mmol)溶解于THF(20mL)中并且加入LiBr(2. Og, 23.0mmol)。将反应混合物加热到回流历时1小时并且随后冷却到室温。向混合物中加入 水(2.5mL)并在真空下移除溶剂。用乙酸乙酯(3X15mL)萃取残余物并且用饱和NaCl溶 液(IOmL)洗涤合并的有机层,用无水Na2S04干燥并浓缩,得到所需溴化物。用THF(35mL)中的 NaH(12mg,0. 5mmol)处理 mPEG-OH 20kDa(2. 0g,0. Immol, Sunbio)并且向混合物中加入溴化物(3. 32g,15mmol)和催化量的ΚΙ。将所得混合物加热 到回流历时12小时。将水(l.OmL)加入混合物中并在真空下移除溶剂。向残余物中加入 CH2C12(25mL)并且分离有机层,用无水Na2S04干燥,并将体积缩减到约2mL。逐滴加入乙 醚溶液(150mL)中,产生沉淀物,收集所述沉淀物以得到mPEG-0-CH2-C6H4-N3。实例29NH2-PEG-0-CH2CH2C02H+N3-CH2CH2C02-NHS — N3-CH2CH2-C (0) NH-PEG-O-CH2CH2CO2H将NH2-PEG-0-CH2CH2C02H(MW 3,400Da, 2. Og)溶解于 NaHC03 饱和水溶液(IOmL) 中并且将溶液冷却到0°C。在强烈搅拌下加入丙酸3-叠氮基-I-N-羟基丁二酰亚胺酯(5 当量)。3小时后,加入20mL H20并且在室温下再将混合物搅拌45分钟。用0. 5N H2S04 将PH值调节到3并且加入NaCl直到浓度为约15重量%。用CH2C12 (IOOmLX 3)萃取反应 混合物,用Na2S04干燥并浓缩。用冷乙醚沉淀后,通过过滤收集产物并在真空下干燥,得到 ω -羧基-叠氮化物PEG衍生物。实例30mPEG-OMs+HC = CLi — mPEG-0_CH2-CH2-C = C-H在强烈搅拌下,向如所属领域中已知所制备并冷却到_78°C的乙炔锂(4当量)的 THF溶液中逐滴加入溶解于THF中的mPEG-OMs溶液。3小时后,使反应升温到室温并通过加 入ImL 丁醇中止反应。随后加入20mL H20并且在室温下再将混合物搅拌45分钟。用0. 5N H2S04将pH值调节到3并且加入NaCl直到浓度为约15重量%。用CH2C12 (IOOmLX 3)萃 取反应混合物,用Na2S04干燥并浓缩。用冷乙醚沉淀后,通过过滤收集产物并在真空下干 燥,得到1-(丁_3-炔基氧基)-甲氧基聚乙二醇(mPEG)。实例31可使用以下文献中描述的方法将含叠氮基的氨基酸和含乙炔的氨基酸位点选择 性地并入蛋白质中:L. Wang 等人,(2001),Science 292 498-500 J. W. Chin 等人,Science 301 964-7(2003) J. W. Chin ^A, (2002), Journal of the American ChemicalSociety 124 9026-9027 ;J.W.Chin 和 P.G.Schultz, (2002),Chem Bio Cheml1 :1135-1137 ; J. W. Chin 等人,(2002),PNAS United States of America99 :11020-11024 ;以及 L. Wang 和 P. G. Schultz, (2002),Chem. Comm.,1 =I-Il0 并入氨基酸后,随即在 37°C下,在存在 2mM PEG 衍生物、ImM CuS04和约Img铜丝的情况下,用磷酸盐缓冲液(PB) (pH 8)中的0. OlmM蛋白 质进行环加成反应达4小时。实例32本实例描述对乙酰基-D,L-苯丙氨酸(pAF)和m_PEG-羟胺衍生物的合成。使用先前描述于Zhang,Z. ,Smith,B. Α. C,Wang,L. ,Brock,Α.,Cho,C.和 Schultz, P. G.,Biochemistry (2003) 42,6735-6746 中的程序来合成外消旋 pAF。[1095]为合成m-PEG-羟胺衍生物,完成以下程序。向在室温(RT)下搅拌1小时的 (N-t-Boc-氨氧基)乙酸(0. 382g,2. Ommo 1)和 1,3- 二异丙基碳化 二亚胺(0. 16mL, 1. Ommol)的二氯甲烷(DCM,70mL)溶液中加入甲氧基-聚乙二醇胺(m-PEG_NH2,7. 5g, 0. 25mmol,Mt. 30K,来自BioVectra)和二异丙基乙胺(0. ImL,0. 5mmol)。将反应物在室温下 搅拌48小时,并且接着浓缩到约100mL。将混合物逐滴加入冷乙醚(SOOmL)中。经t-Boc保 护的产物沉淀出来并通过过滤收集,用乙醚(3X IOOmL)洗涤。通过再次溶解于DCM(IOOmL) 中并且在乙醚(SOOmL)中沉淀两次使其进一步纯化。在真空中干燥产物,得到7. 2g(96%), 通过NMR和茚三酮试验(Nihydrin test)加以确认。在0°C下在50% TFA/DCM(40mL)中脱除上文获得的经保护产物(7. Og)的Boc达 1小时并且接着在室温下进行1. 5小时。在真空中移除大部分TFA后,通过向残余物中加 入4N HCl的二噁烷(ImL)溶液而使羟胺衍生物的TFA盐转化为盐酸盐。将沉淀物溶解于 DCM(50mL)中并且再次在乙醚(SOOmL)中沉淀。通过过滤收集最终产物(6. 8g,97% ),用乙 醚(3X100mL)洗涤,在真空中干燥,在氮气下贮存。使用相同程序合成其它PEG(5K、20K) 羟胺衍生物。实例33聚乙二醇化胰岛素的活体内研究[779]向小鼠或大鼠投与PEG-胰岛素、未经修饰的胰岛素和缓冲溶液。结果显示, 本发明的聚乙二醇化胰岛素与未经修饰的胰岛素相比具有优良的活性和延长的半衰期。类 似地,向小鼠或大鼠投与经修饰的胰岛素、未经修饰的胰岛素和缓冲溶液。药物动力学分析通过静脉内或皮下途径向小鼠投与本发明的胰岛素多肽。在给药之前和给药之后 的多个时间点对动物采血。采集各样品的血浆并通过放射免疫测定分析。可计算消除半衰 期并且在包含非天然编码氨基酸的胰岛素多肽与野生型胰岛素或本发明的各种胰岛素类 似物多肽之间进行比较。类似地,可向猕猴投与本发明的胰岛素多肽。在给药之前和给药 之后的多个时间点对动物采血。采集各样品的血浆并通过放射免疫测定分析。可向ZDF雄性大鼠(糖尿病肥胖大鼠;在研究开始时为8周龄, CharlesRiver-GMI)投与本发明的多肽。使大鼠随意食用Purina 5008饲料。设置以下测 试组生理食盐水;胰岛素,每天4U ;本发明的胰岛素多肽,每天8U,短期(向短期给药组给 药一次且在给药后T = 0、2、4、8和24小时时采血);本发明的胰岛素多肽,每天6U ;本发明 的胰岛素多肽,每天4U ;本发明的胰岛素多肽,每天3U ;本发明的胰岛素多肽,每天2U ;瘦 组,生理食盐水;瘦组,胰岛素,每天4U ;和接受每天6U、每天4U和每天2U胰岛素多肽的非 糖尿病大鼠组。瘦组表示非糖尿病瘦ZDF大鼠。每天一次皮下注射化合物,且接着通过每隔一天注射来维持具有相同投药量的第 二组。给对照组大鼠注射媒剂(PBS ;0. Iml)。给药7天后,使动物经受口服葡萄糖耐量试 验。通过在无麻醉的情况下截尾放血(tail clip bleeding)来采集用于葡萄糖和三酸甘 油酯测定的血液。胰岛素多肽可以剂量依赖性方式降低血浆葡萄糖水平。也可以相较于给 与野生型胰岛素的大鼠在暴露于本发明的胰岛素多肽后测试瘦ZDF大鼠的低血糖。ob/ob肥胖模型ob/ob小鼠模型是高血糖、胰岛素抗性和肥胖的动物模型。与媒剂和胰岛素对照组相比,可在ob/ob小鼠中测量用胰岛素多肽处理后的血浆葡萄糖水平。在这一肥胖模型中, 给雄性ob/ob小鼠(7周龄)之测试组皮下注射单独媒剂(PBS)、胰岛素(每天4U)或如上 文所述的胰岛素多肽(0. 1ml,每天一次且在其它测试组中每隔一天一次且在其它测试组中 每周一次),历时14天。在第1、3和7、9、11、14天,在第一次化合物注射后1小时,通过截 尾放血来采集血液,并且使用标准方案测量血浆葡萄糖水平。如果与媒剂对照组相比,本发 明的胰岛素多肽降低血浆葡萄糖水平,那么其刺激葡萄糖摄取。可在用本发明的胰岛素多 肽处理后比较与其它分子相比的三酸甘油酯水平。可通过多次剂量、连续输注或单次剂量 等向小鼠投与多肽。实例34使用NoVagen(诱导性T7启动子;以引用的方式并入本文中的pET SystemMaruml (第9版)中详细描述)的胰岛素表达系统、表达载体pET30a和表达菌株 BL21(DE3)。给2mL LB/卡那霉素(10 μ g/ml)培养物接种用所需类似物转化的BL21 (DE3)板 的扫落物(swe印)。此举减少由菌落之间的表达水平变化所引起的影响。在37°C下在剧烈 震荡下使这一培养物生长过夜并且在第二天给IOml LB/卡那霉素培养物接种Iml过夜培 养物(0D600 0. 4-0. 5)。可将剩余几毫升过夜培养物冷冻作为甘油贮存物。将IOmL生长培养物放在37°C和250rpm下30-45分钟直到0D600达到0. 8-0. 9。 随后用ImM IPTG诱导这一物质(其中可留出ImL作为非诱导性培养对照组)并且通常在 诱导后3-4小时收集且在SDS-PAGE上进行分析。也有可能进行一定时间过程的表达(例如诱导后1、2、4、6小时的时间点和0/N) 以确定累积率、蛋白质稳定性等。凝胶分析在诱导后的所需时间点,从培养物收集lmL,将细胞离心,再悬浮于 100 μ 1 2 X SDS-PAGE中,声波处理以降低粘度并且将10 μ 1在SDS-PAGE上过柱。必要时, 可将此与非诱导性对照组和/或已知阳性对照组或标准物相比并且可估计表达水平(例如 良好表达可为> 100 μ g/ml)。也可使用西方印迹分析。也可能留出4ml培养物,制备包涵 体(如果表达不溶性类似物)并且对这些包涵体进行质谱分析以证实过表达的蛋白质的一 致性。对于大规模蛋白质表达来说,给> 250mL LB/卡那霉素(10 μ g/ml)接种250 μ L 冷冻甘油贮存物并且生长过夜。第二天,给10X1L LB/卡那霉素培养物接种25mL过夜培 养物(0D600 0. 1)。在37°C和250rpm下使IL培养物生长约2小时直到0D600达到0. 8-0. 9。随后用 ImM IPTG诱导这一物质并且在诱导后4小时或第二天早晨收集(收集可使用在4,OOOrpm 下离心15分钟)。如果需要减少内毒素并且促进纯化,那么用50mMTriS-HCl (pH 8. 0)(每 一小球50ml+用于冲洗瓶子的50ml)冲洗小球。将小球混合在一起并且再次旋转。实例35毕赤酵母表达研究-DNA制备、电穿孔、表达方案本实例提供一种在毕赤酵母中制备本发明的胰岛素多肽的方案。使用SEQ IDNO 34、35、36和37,且图8展示用于克隆到毕赤酵母中的质粒并且这种或其它经修饰质粒可用 于获得胰岛素多肽在毕赤酵母中的蛋白质表达,使用所属领域中已知的方法对质粒进行修
144饰。在所述方案的第1天,进行过夜消化,通常每微克待消化的DNA使用2U酶并且从 甘油贮存物中将IOmL酵母植物蛋白胨右旋糖(YPhyD)培养物接种于50mL烧瓶中过夜,同 时在260rpm、30°C下震荡。DNA 制备通过首先添加1/10体积的无菌3M NaOAc且接着添加0. 7体积的无菌IPA来使DNA 沉淀且随后有力地混合样品并在-20°C下或在-70°C下继续沉淀过夜直到冻住。随后通过 离心(benchtop离心机,14,000rpm/10分钟)使DNA成球状,移除上清液,并且使用500 μ L 无菌70%乙醇(ETOH)洗涤小球。旋转(bench-top离心机,14,000rpm/10分钟)并且倾析 上清液以及风干小球15-20分钟。用无菌水使DNA小球再悬浮直到1 μ g/ μ 1并且用10 μ g DNA转化毕赤酵母。电穿孔使用OD6tltl过夜培养物,用YPhyD稀释到OD6tltl = 0. 2。在260rpm、30°C下震荡培养 物直到OD600达到0. 8-1. 0。通过离心(4000rpm/5分钟)收集细胞。倾析培养基,用20mL 冰冷无菌水洗涤细胞,再次倾析并且重复。水洗涤后,用20mL冰冷无菌IM山梨糖醇洗涤小 球,倾析,并且将洗过的细胞小球再悬浮于600 μ L IM冷山梨糖醇中,随后将这一悬浮液贮 存在冰上。在无菌1.5mL离心管(印pendorftube)中将来自经洗涤细胞的50 μ L与10 μ g线 性化DNA混合,轻轻地混合并且在冰上培育25分钟。使用长移液管尖将细胞/DNA混合物 转移到预冷却的0. 2cm比色皿中。使用BioRad GenePulsar II装置,在以下设置下对细胞 进行电穿孔2000V、200欧姆、25 μ Fd (使用单脉冲)并且立即将0. 5mL YPhyD培养基添加 到比色皿中并通过移液操作来混合。将全部内容物转移到无菌圆底试管中并且在30°C下轻 轻地震荡(200rpm)30分钟。均勻地涂布和展布细胞并且在30°C下倒置培育培养板3天。培育三天后,用环挑取菌落并且接种到50ml烧瓶中的IOml缓冲酵母植物蛋白胨 右旋糖(BYPhyD)培养基中且在30°C下培育3天。对20 μ 1培养板上的菌落进行计数并且 记录平均数目且接着收集细胞,首先准备2组标有菌株名称和克隆数目、胰岛素(即所表 达的蛋白质)和日期的冷冻管。将培养物转移到15ml锥形管中,获得各培养物的0D·,用 YPhyD培养基以1 50或1 20稀释培养物。保留培养物的等分试样作为甘油贮存物。 随后在4000rpm、室温下使酵母成球状5分钟,将上清液转移到新的有标记的15mL锥形管 中,并且贮存在-20°C或-80°C下直到分析数据需要时。蛋白质表达分析将样品在4-12 % NuPAGE TB凝胶(Novex)上过柱。使用来自Invitrogen的 SDS-PAGE试剂,通过西方印迹法或染色凝胶分析来分析。培养基配方缓冲酵母植物蛋白胨右旋糖(BufferedYeast Phytone Dextrose,BYPhyD)酵母提取物10g/L植物蛋白胨20g/LIM 磷酸钾缓冲液(pH 6) 100ml/L10X 酵母氮源(YNB) 100mL/L[1132]20% 右旋糖100mL/L酵母植物蛋白胨右旋糖(YeastPhytone Dextrose,YPhyD)酵母提取物10g/L植物蛋白胨20g/L20% 右旋糖100ml/L10XYNB(13. 4%含硫酸铵但不含氨基酸的酵母氮源)酵母氮源134g/L实例36胰岛素A2IG制造在本实例中,使4. OL培养物发酵以产生13. 4g湿细胞糊状物并且在有或无 Triton-XlOO的情况下制备包涵体。以此方式制造2. 07g湿包涵体,并且随后进行溶解和 再折叠。每克湿包涵体(IB)用200mL H2O使包涵体再悬浮直到3mM的最终浓度并且将半 胱氨酸添加到再悬浮液中。随后通过在室温下使PH值增加到11. 5历时1小时来溶解IB。 随后通过使所溶解的物质的PH值下降到10. 6士0. 1并且贮存在2-8°C下约72小时来使得 发生再折叠且在图10中展示这些结果。通过添加HCl直到3. 0的最终pH值来中止再折叠 反应,0. 45 μ M过滤并且贮存在2-8 °C下直到进一步处理。通过用Tris基剂使淬灭的再折叠的pH值增加到8. 0并且直接加载到Q HP管柱 上来纯化再折叠的蛋白质(如图11中所示)。在所示情况下加载的传导率为>3. 5mS/ cm。过柱条件是(A)20mM Tris (8. 0) ; (B) 20mM Tris (8. 0) ;200mM NaCl 并且在 30CV 下存在 0-100% B。混合正确再折叠的胰岛素原并且回收79mg胰岛素原。进行超滤/透滤(UF/DF)并且用25mM锌进行沉淀,用20mM NaOAc (4. 0)、30%乙睛 (ACN)、5mM EDTA使所沉淀的蛋白质再悬浮直到2mg/mL的浓度并且添加20K PEG直到PEG 与蛋白质的最终摩尔比为10 1且在28°C下培育48-72小时。用0. 5XPEG缓冲液A以1 10稀释PEG反应物,0. 22 μ M过滤并且在SP 650S 管柱上过柱。过柱条件是(A) IOmM NaOAc (4. 0)、ImM EDTA ; (B) IOmMNaOAc (4. 0)、ImM EDTA, 0. 4Μ NaCl ;在 20CV 下 0-50% B 和用 IOmM 柠檬酸钠(6. 5)调配的 PEG 样品;150mM NaCl, 并且在图12中展示这一情况。使用这些方法制造多种具有非天然氨基酸的胰岛素多肽并且经纯化和聚乙二醇 化的变异体的末端蛋白质含量的范围为0. l-22mg。发现在PEG反应中ACN有助于溶解PEG/ 蛋白质混合物且在Pl下的锌沉淀促进在CAN存在下浓缩。实例37在STZ糖尿病大鼠模型中测试胰岛素多肽利用单独注射本发明的两种不同胰岛素多肽来处理大鼠A14pAF-PEG_A21N赖 脯胰岛素和A14pAF-PEG-A21G赖脯胰岛素,各以四种不同含量;568nmol/kg ;94nmol/kg ; 56. 8nmol/kg ;和9. 4nmol/kg (每千克胰岛素含量3、0. 5,0. 3,0. 05mg)。随后在给药后1、2、 4、8、12、24、48、72、96、120小时测量血糖并且在图9中展示平均曲线下面积,即上述各种情 况的0-120小时的血糖的量度,包括仅注射媒剂的对照组。实例38包含非天然编码氨基酸的聚乙二醇化胰岛素的安全性和/或功效的人类临床试验。目的为了观测经皮下投与的包含非天然编码氨基酸的聚乙二醇化重组人类胰岛 素的安全性和药物动力学。患者在研究中招募18名年龄介于20-40岁之间并且体重介于60_90kg之间的健 康志愿者。所述个体应不会具有临床上显著异常的针对血液学或血清化学以及阴性尿毒物 学筛选、HIV筛选和B型肝炎表面抗原的实验值。其不应具有任何以下迹象高血压;任何 原发性血液病史;严重肝病、肾病、心血管疾病、胃肠疾病、泌尿生殖系统疾病、代谢疾病、神 经病史;贫血或癫痫病史;已知对细菌或哺乳动物来源的产品、PEG或人类血清白蛋白具有 过敏性;含咖啡因的饮料的习惯性和重度消费者;在进入研究的30天内参与任何其它临床 试验或经输血或献血;在进入研究的3个月内曾接触胰岛素;在进入研究的7天内患病;以 及研究前身体检查或在进入研究的14天内临床实验室评估时具有显著异常。可对所有个 体评估安全性,并且定时采集所有血液采集物用于药物动力学分析。所有研究都是在机构 伦理委员会批准和患者同意下进行。研究设计其应为在健康男性志愿者中的第I阶段、单一中心、开放标记、随机性、 两个周期的交叉研究。将18名个体随机分配到两个治疗顺序组中的一组中(每组9名个 体)。使用相等剂量的包含非天然编码氨基酸的聚乙二醇化胰岛素和所选的市售产品,在 大腿上部经两个分开的给药期以皮下团注形式投与胰岛素。投与市售产品的剂量和频率是 按照包装标签中所指示来进行。可通过包括其它个体组而在研究中加入使用市售产品的其 它剂量、给药频率或所需的其它参数。各给药期由14天的清洗期分隔开。对于两个给药期 的每一时期来说,在给药之前至少12小时以及给药后72小时将个体限制在研究中心,但在 给药期之间不必如此。如果也存在其它剂量、频率或其它参数,那么也可加入其它个体组来 测试聚乙二醇化胰岛素。胰岛素的实验调配物为包含非天然编码氨基酸的聚乙二醇化胰岛
ο血液取样在投与胰岛素之前和之后,通过直接静脉穿刺连续取血。在给药之前 约30分钟、20分钟和10分钟(3个基线样品)以及在给药后大致以下时间30分钟和1小 时、2小时、5小时、8小时、12小时、15小时、18小时、24小时、30小时、36小时、48小时、60
小时和72小时,获得胰岛素静脉血样(5mL)用于测定血清胰岛素浓度。将各血清样品分为 两个等分试样。将所有血清样品贮存在-20°C下。以干冰运输血清样品。在第1天初始给 药前即刻、第4天早晨、第16天给药前即刻以及第19天早晨进行空腹临床实验测试(血液 学、血清化学和尿分析)。生物分析方法使用ELISA试剂盒来测定血清胰岛素浓度。安全性测定在每次给药(第1天和第16天)之前以及在每次给药后6小时、24 小时、48小时和72小时即刻记录生命体征。安全性测定是基于不利事件的发生率和类型以 及临床实验测试与基线相比的变化。另外,评估生命体征测量结果(包括血压)和身体检 查结果与研究前相比的变化。数据分析通过从给药后的每一个值减去通过对给药前30分钟、20分钟和10 分钟时采集的三个样品的胰岛素水平取平均值而测定出的平均基线胰岛素浓度而关于给 药前基线胰岛素浓度来修正给药后血清浓度值。如果给药前血清胰岛素浓度低于测定的 定量水平,那么其不包括在平均值的计算中。由关于基线胰岛素浓度所修正的血清浓度数据测定药物动力学参数。使用BIOAVL软件的最新版本,通过利用Digital Equipment Corporation VAX 8600计算机系统的不依赖于模型的方法来计算药物动力学参数。测定 以下药物动力学参数峰值血清浓度(Cmax);到达峰值血清浓度的时间(tmax);通过使用 线性梯形规则计算的从时间零时到最后血液取样时间(AUC0-72)的浓度-时间曲线下面积 (AUC);以及根据消除速率常数计算的末期消除半衰期(tl/2)。在对数-线性浓度-时间曲 线的末期线性区域中,通过连续数据点的线性回归来估算消除速率常数。对于每一次治疗, 计算药物动力学参数的平均标准偏差(SD)和变异系数(CV)。计算参数平均值的比率(经 保存调配物/未经保存调配物)。安全性结果在各治疗组中,不利事件的发生率分布相同。与基线或研究前临床实 验测试或血压相比无临床显著变化,并且身体检查结果和生命体征测量结果与研究前相比 也无显著变化。两个治疗组的安全性概况看来应类似。药物动力学结果在各时间点,测量所有18名个体在接受包含非天然编码氨基酸 的聚乙二醇化胰岛素后的平均血清胰岛素浓度_时间概况(未关于基线胰岛素水平进行修 正)。所有个体都应具有在正常生理学范围内的给药前基线胰岛素浓度。根据关于给药前 平均基线胰岛素浓度所修正的血清数据来测定药物动力学参数,并且测定Cmax和tmax。所 选的任何临床比较物的平均tmax都比包含非天然编码氨基酸的聚乙二醇化胰岛素的tmax 显著更短。与包含非天然编码氨基酸的聚乙二醇化胰岛素的末期半衰期相比,所测试的临 床前比较物的末期半衰期的值显著更短。尽管本发明的研究是在健康男性个体中进行,但预期将在其它患者群体中出现类 似的吸收特征和安全性概况;所述群体例如患有糖尿病的男性或女性患者、患有癌症或慢 性肾衰竭的男性或女性患者、儿童肾衰竭患者、预存自体程序中的患者或计划择期手术的
^^ ο总之,经皮下投与的单一剂量的包含非天然编码氨基酸的聚乙二醇化胰岛素应为 安全的,并且被健康男性个体良好耐受。根据不利事件的相对发生率、临床实验值、生命 体征和身体检查结果,市售形式的胰岛素与包含非天然编码氨基酸的聚乙二醇化胰岛素 的安全性概况应相当。包含非天然编码氨基酸的聚乙二醇化胰岛素向患者和医务工作者 (health care provider)潜在地提供巨大临床效用。应了解,本文所述的实例和实施例仅用于说明性目的且所属领域的技术人员将想 到关于其的各种修改或改变并包括在本申请案的精神和权限以及随附权利要求书的范围 内。本申请案中所引用的所有公开案、专利、专利申请案和/或其它文献都以全文引用的方 式并入本文中以用于所有目的,所引用的程度就如同已个别地指示各个公开案、专利、专利 申请案和/或其它文献以引用的方式并入本文中以用于所有目的。表1 所引用的序列
SEQ序列名称序列IDNO
13具有前导序列的全 长胰岛素氨基酸序 列MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHL VEALYLVCGERGFFYTPKTRREAEDLQVCiQVELGGG PGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN14无前导序列的全长 胰岛素氨基酸序列FVNQHLCGSHLVEALYLVCGERGFFYTPK TRREAEDLQVGQVELGGGPGAGSLQPLAL EGSLQKRGIVEQCCTSICSLYQLENYCN 在毕赤酵母中表达的赖脯胰岛素的DNA序列
权利要求
一种胰岛素多肽,其包含一个或一个以上非天然编码氨基酸。
2.一种胰岛素多肽,其中A链包含一个或一个以上非天然编码氨基酸。
3.一种胰岛素多肽,其中B链包含一个或一个以上非天然编码氨基酸。
4.一种胰岛素类似物,其包含一个或一个以上非天然编码氨基酸。
5.一种治疗患有代谢紊乱的患者的方法,其中向所述患者投与治疗有效量的包含一个 或一个以上非天然编码氨基酸的胰岛素多肽。
全文摘要
本发明提供一种经修饰胰岛素多肽和其用途。
文档编号A61K38/28GK101918026SQ200880117073
公开日2010年12月15日 申请日期2008年11月20日 优先权日2007年11月20日
发明者丹尼斯·克拉维兹, 何莉莲, 安娜玛莉亚·A.·海斯·蒲楠, 尼克·克努森, 毕-陈·辛姆, 瓦迪姆·克赖诺夫, 田锋, 苗振伟, 迈克尔·代古斯曼 申请人:Ambrx公司