组合物和用于植物中n聚糖的人源化和最优化的方法

文档序号:3560833阅读:936来源:国知局
专利名称:组合物和用于植物中n聚糖的人源化和最优化的方法
技术领域
本发明涉及植物分子生物学领域,更特别地涉及在植物中产生重 组哺乳动物蛋白质的领域。
背景技术
许多植物种一直被耙向用于制药目的的哺乳动物蛋白质的"分子 农业(molecular farming)"。这些植物表达系统提供了低成本的生 物学活性哺乳动物蛋白质的生产并且易于顺从地进行快速和经济的扩
大生产(Ma等人(2003) 细.to". 4:794-805; Raskin等人
(2002) 7Ve/7& 5iWec力/70人20: 522-531)。大量的哺乳动物和植物 蛋白质需要翻译后加工以获得正确地折叠、装配和功能。在这些修饰 当中,植物和哺乳动物之间糖基化模式的不同对植物表达系统产生高
质量的用于药物用途的重组哺乳动物蛋白质的可行性提出了挑战。
当肽迁移通过内质网(ER)和高尔基体亚细胞区室时,糖残基链或 聚糖附着至其上,最终导致糖蛋白的形成。糖链和肽之间的连接通过 仅与4种蛋白质氨基酸天冬酰胺、丝氨酸、苏氨酸和羟赖氨酸中的 一种形成化学键而发生。基于该连接模式,糖蛋白中的两种基本类型 的糖残基链被识别AMt苷-连接的糖链(也称为^连接聚糖或#聚糖), 其结合肽上的天冬酰胺残基;和^糖苷连接的糖链,其结合肽上的丝 氨酸、苏氨酸和羟基赖氨酸残基。
〃糖苷连接的糖链,或W聚糖,具有不同的结构(参见,例如, Takahashi, ed.(1989) 52'oc力eyz7/ca7 fjr;7er/边e/2faf/on #e^A<^/ 2J-#e^7od /"or 5Yw(////7^ 67/co/7rofe//7 i^《sr CAa/" (Gakujutsu Shuppan Center),但共有共同的寡甘露糖苷(oligomannosidic )核 心(参见图29A)。导致^聚糖的形成的糖基化途径中的初始步骤在植物和动物中是保守的。然而,参与复杂的^聚糖的形成的最后的步骤
不同(Lerouge等人(1998) A/o/. 38:31-48; Steinkellner
和Strasser (2003) J肌户/a"齡.9: 181-192)。植物产生具有复 杂#聚糖(所述聚糖具有携带2个N乙酰葡糖胺(GlcNAc)残基的核心) 的糖蛋白,所述核心与哺乳动物中观察到的相似。然而,在植物的糖 蛋白中,该核心由P1, 2-连接的木糖残基(核心木糖)(所述残基在人 中不发生)、Lewisa表位和al, 3-连接的岩藻糖(核心a [1, 3]-岩藻糖) 而非哺乳动物中的al,6-连接的核心岩藻糖取代(关于综述,参见,例 如,Lerouge等人(1998) /VsW #o/. A/o/. 38:31-48)(也参见图 29B)。
a(l,3)-岩藻糖和P (1,2)-木糖残基至少部分地负责植物糖蛋 白在哺乳动物中的免疫原性(参见,例如,Ree等人(2000) /. Wo人 C力e迈.15: 11451-11458; Bardor等人(2003) Glycobiol. 13:427-434; Garcia-Casado等人(1996) Glycobiol. 6:471-477)。因此,从在植 物中重组产生的哺乳动物糖蛋白除去这些潜在的变应原糖残基可克服 关于这些蛋白用作用于人的治疗的药物的忧虑。
许多重组产生的糖蛋白目前用作治疗剂或处于临床研究中。实例 包括干扰素(IFNs)、红细胞生成素(EP0)、组织纤溶酶原激活物(tPA)、 抗凝血酶、粒/巨噬细胞集落刺激因子(GM-CSF)和治疗性单克隆抗体 OnABs)。糖蛋白的W聚糖结构的寡糖组分可影响它们的治疗功效以及 它们的物理稳定性、对蛋白酶攻击的抗性、药物动力学、与免疫系统 的相互作用以及特定的生物学活性。参见,例如,Jenkins等人(1996) Ai2"re A/"ec力/zo/. 14:975-981。
需要改变植物表达系统中的糖基化模式,特别地抑制植物特异性 的真核细胞核心结构的糖基化,有利地产生具有人源化糖基化模式的 重组哺乳动物蛋白的方法。
发明概述
提供用于改变高等植物中蛋白质的W糖基化模式的方法。方法包 括用至少一个重组核苷酸构建体稳定地转化植物,所述构建体提供对oc 1, 3-岩藻糖基转移酶(FucT)和p 1,2-木糖基转移酶(XylT)在植 物中的表达的抑制。这些构建体用于抑制或压制这两个酶的一个或两
"人源二的"'iV糖基化模式的蛋白质而不影响植物的i长和^L育。、提 供稳定转化的具有该蛋白质N糖基化模式的高等植物。在一些实施方 案中,植物是作为双子叶植物的成员例如豌豆、苜蓿和烟草的作物植 物;其他实施方案中,植物是作为单子叶植物例如水稻或玉米的作物 植物。在其他实施方案中,植物是浮萍(Lemnaceae)科的成员例如浮 萍属的某一种(Ze咖a s/ )。
本发明的转基因植物具有产生具有^糖基化模式的重组哺乳动物 蛋白质的能力,所述糖基化模式与哺乳动物宿主的糖基化模式更相似。 因此,在一些实施方案,重组产生的哺乳动物蛋白质是包含复杂的^ 聚糖(所述聚糖具有减少的植物特异性oc (1,3)-岩藻糖和P (1,2)-木 糖残基的附着)的糖蛋白。在其他实施方案中,这些重组产生的糖蛋 白包含不含这些植物特异性残基的复杂#聚糖。在其他实施方案中, 这些重组产生的糖蛋白具有作为附着至糖蛋白内的天冬酰胺糖基化位 点的单个聚糖种类的GlcMc2Man3GlcNAc2。
在一些实施方案中,重组产生的糖蛋白是单克隆抗体。通过该方 式,本发明提供了能够产生特异性结合目的靶蛋白的聚糖最优化的单 克隆抗体(包括具有增加的效应子功能的单克隆抗体)的转基因植物。 因此,在一些实施方案中,重组产生的聚糖最优化的单克隆抗体包含 具有减少的oc (1, 3)-连接的岩藻糖残基的附着的复杂^聚糖,从则增 加了这些抗体的ADCC活性。在一些实施方案中,重组产生的单克隆抗 体包含不含这些植物特异性岩藻糖残基的复杂的^连接的聚糖。通过 该方式,本发明提供了单克隆抗体组合物的产生,其中至少90°/。或更 多的完整抗体由单个糖形(glycoform),更特别地GO糖形表示。因 此,在本发明的一些实施方案中,重組产生的单克隆抗体具有增加的 效应子功能,其中ADCC活性增加和/或ADCC/CDC活性的比率增加。在 这些实施方案的一些实施方案中,重组产生的单克隆抗体具有减少的CDC活性,这可有利地减少在施用后与CDC激活相关的不利副作用的 潜能。这些聚糖最优化的单克隆抗体有利地可用于改变目前的给药途 径和目前的治疗方案,因为它们的增加的效应子功能意味着它们能够 以更低的浓度和更低的频率给药,从而减少了抗体毒性和/或抗体耐受 性的发生的潜能。此外,它们的提高的效应子功能产生用于治疗临床 适应症的新方法,所述适应症之前已对使用在其他重组宿主系统中产 生的相应的单克隆抗体的治疗产生了抗性或不显疗效。
提供了用于实施本发明的方法的组合物。组合物包含新的分离的 编码浮萍oc 1, 3-岩藻糖基转移酶和P 1, 2-木糖基转移酶及其变体和片 段的多核苷酸和多肽。还提供了靶向这两种蛋白质的表达或其变体的 表达的重组核苷酸构建体,同样提供了包含这些重组构建体的植物细 胞、植物组织、植物和种子。
附图概述


图1显示浮萍(Lemna minor) oc 1, 3-岩藻糖基转移酶(FucT) 的DNA (SEQ ID NO: 1; SEQ ID NO: 2中所示的编码序列)和氨基酸(SEQ IDN0:3)序列。编码序列以粗体显示。由单下划线(-)指示的核苷酸 相应于设计用于抑制FucT的表达的RNAi表达盒内的FucT正向片段 (参见图5);由双下划线(=)指示的核苷酸相应于RNAi表达盒内的间 隔区序列。RNAi表达盒的FucT反向片段是此处显示的FucT正向片段 的反义片段。
图2显示SEQ ID NO: 3的浮萍FucT与来自其他高等植物的a 1,3-岩藻糖基转移酶的比对。
图3显示了浮萍pi,2-木糖基转移酶(XylT)同种型并l的DNA (SEQ ID NO: 4; SEQ ID NO: 5中所示的编码序列)序列和编码的氨基酸 (SEQ ID N0:6)序列。由单下划线(-)指示的核苷酸相应于设计用于 抑制XylT的表达的RNAi表达盒内的XylT正向片段(参见图6);由双 下划线(=)指示的核苷酸相应于该RNAi表达盒内的间隔区序列。RNAi 表达盒的XylT反向片段是此处显示的XylT正向片段的反义片段。图4显示SEQ ID NO: 6的浮萍XylT与来自其他高等植物的p 1,2-木糖基转移酶的比对。
图5显示一个用于设计浮萍FucT的单基因RMi敲除的策略。
图6显示用于设计基于XylT同种型#1的DNA序列的浮萍XylT 的单基因RNAi敲除的一个策略。
图7显示用于设计浮萍FucT和XylT的双基因RNAi敲除的一个 策略,其中RNAi敲除的XylT部分基于XylT同种型#1的DNA序列。
图8显示包含设计用于浮萍FucT的单基因RNAi敲除的RNAi表 达盒的Fuc02构建体。FucT抑制序列(由FucT正向和FucT反向箭头 指示的;参见图5)的表达由有效连接的表达控制元件(表示为 AocsAocsAocsAmasPmas)驱动,所述表达控制元件包含来源于与来源于 根癌农杆菌(^ro6a"ei7i/迈fw/ne/ac/e/ )甘露碱合酶基因(AmasPmas)
的启动子有效连接的来源于根癌农杆菌章鱼碱合酶基因的3个上游激 活序列(Aocs) 。 RbcS前导序列,核酮糖-l, 5-二磷酸羧化酶/加氧 酶小亚基前导序列;ADH1,玉米醇脱氢酶1基因的内含子;nos-ter, 根癌农杆菌胭脂碱合成酶(nos)终止子序列。
图9显示包含设计用于浮萍XylT的单基因RNAi敲除的RNAi表 达盒的Xyl02构建体。XylT抑制序列(由XylT正向和XylT反向箭头 指示;参见图6)的表达由有效连接的AocsAocsAocsAmasPmas表达控 制元件驱动。RbcS前导序列,核酮糖-1, 5-二磷酸羧化酶/加氧酶小 亚基前导序列;ADH1,玉米醇脱氢酶1基因的内含子;nos-ter,根 癌农杆菌胭脂碱合成酶(nos)终止子序列。
图10显示包含设计用于浮萍FucT/XylT的双基因RNAi敲除的嵌 合RNAi表达盒的XF02构建体。发夹结构RM表示为嵌合序列(嵌合发 夹结构RNA),其中两个基因的片段融合在一起且表达为一个转录物。 FucT/XylT抑制序列(由FucT和XylT的正向箭头以及XylT和FucT的 反向前头指示;参见图7)的表达由有效连接的AocsAocsAocsAmasPmas 表达控制元件驱动。RbcS前导序列,核酮糖-1, 5-二磷酸羧化酶/加 氧酶小亚基前导序列;ADH1,玉米醇脱氬酶l基因的内含子;nos-ter,根癌农杆菌胭脂碱合成酶(nos)终止子序列。
图11显示包含设计用于浮萍FucT/XylT的双基因RNAi敲除的 RMi表达盒的XFQ3构建体。表达盒表达2个RNAi发夹结构, 一个靶 向FucT的表达,另 一个耙向XylT的表达。FucT抑制序列(由FucT正 向和FucT反向箭头指示;参见图5)的表达由有效连接的表达控制元 件驱动,所述表达控制元件包含浮萍泛素(ubiquiUn)启动子和5' UTR (LmUbq启动子)以及内含子(LmUbq内含子)(参见SEQ ID N0: 7) 。 XylT 抑制序列(由XylT正向和XylT反向箭头指示;参见图6)的表达由有 效连接的AocsAocsAocsAmasPmas表达控制元件驱动。RbcS前导序歹", 核酮糖-1, 5-二磷酸羧化酶/加氧酶小亚基前导序列;ADH1,玉米醇脱 氢酶l基因的内含子;nos-ter,根癌农杆菌胭脂碱合成酶(nos)终止 子序列。
图12显示提供IgGi单克隆抗体(此处称为mAbl)以及浮萍FucT 和XylT的双基因敲除的共表达的mAbl04构建体,其中表达靶向FucT 和XylT的表达的嵌合发夹RNA。 FucT/XylT抑制序列(由FucT和XylT 的正向箭头及XylT和FucT的反向箭头指示的;参见图7)的表达由有 效连接的表达控制元件驱动,所述表达控制元件包含紫萍(5^/roc/e/h /70/7rr力yza)泛素启动子和5' UTR (SpUbq启动子)以及内含子(SpUbq 内含子)(参见SEQ ID N0: 8) 。 IgGl轻链的表达由有效连接的表达控 制元件驱动,所述表达控制元件包含浮萍泛素启动子和5' UTR (LmUbq 启动子)以及内含子(LmUbq内含子)。IgGl重链的表达由有效连接的 AocsAocsAocsAmasPmas表达控制元件驱动。RbcS前导序列,核酮糖 -1, 5-二磷酸羧化酶/加氧酶小亚基前导序列;ADH1,玉米醇脱氩酶l 基因的内含子;nos-ter,根癌农杆菌胭脂碱合成酶(nos)终止子序 列。
图13显示提供mAbl以及浮萍FucT和XylT的双敲除的共表达的 mAbl05构建体,其中表达2个发夹结构RNA, 一个靶向FucT的表达, 另一个耙向XylT的表达。FucT抑制序列(由FucT的正向和FucT的反 向箭头指示;参见图5)的表达由有效连接的表达控制元件驱动,所述表达控制元件包含紫萍泛素启动子和UTR (SpUbq启动子)以及内含 子(SpUbq内含子)。XylT抑制序列(由XylT的正向和XylT的反向箭 头指示;参见图6)的表达由有效连接的表达控制元件驱动,所述表达 控制元件包含稀脉萍(Lemna aequinoctialis )泛素启动子和5' UTR (LaUbq启动子)以及内含子(LaUbq内含子)(参见SEQ ID NO: 9) 。 IgGl 轻链的表达由有效连接的表达控制元件驱动,所述表达控制元件包含 浮萍泛素启动子和5' UTR (LmUbq启动子)以及内含子(LmUbq内含子)。 IgGl重链的表达由有效连接的AocsAocsAocsAmasPmas表达控制元件 驱动。RbcS前导序列,核酮糖-1, 5-二磷酸羧化酶/加氧酶小亚基前 导序列;ADH1,玉米醇脱氢酶1基因的内含子;nos-ter,根癌农杆 菌胭脂碱合成酶(nos)终止子序列。
图14显示提供mAbl的表达的mAbIOl构建体,其中不抑制FucT 和XylT的表达。IgGl轻链和IgGl重链的表达独立地由有效连接的 AocsAocsAocsAmasPmas表达控制元件驱动。RbcS前导序列,核酮糖-l, 5-二磷酸羧化酶/加氧酶小亚基前导序列;ADH1,玉米醇脱氢酶1基因 的内含子;nos-ter,根癌农杆菌胭脂碱合成酶(nos)终止子序列。 mAbIOl称为"野生型"mAbIOl构建体,因为表达的mAbl展示野生型
浮萍的糖基化特征。
图15和16显示包含图10的XF02构建体的转基因RNAi浮萍植
物系的初步筛选数据。
图17显示包含图12的DiAbl04构建体和图13的mAbl05构建体 的转基因RNAi浮萍植物系的初步筛选的数据。
图18显示衍生的野生型浮萍mAb ^聚糖的结构和分子量。"GnGn" 表示GlcNAc2Man3GlcNAc2 ^聚糖种类,也称为GO A^聚糖种类"GnGnX,, 表示具有附着的植物特异性P (1,2)-木糖残基的GlcNAc2Man3GlcNAc2 N聚糖种类。"GnGnXF"表示具有附着的植物特异性p(1, 2)木糖残基 和植物特异性oc (1,3)-岩藻糖残基的GlcNAc2Mari3GlcNAc2N聚糖种类。
图19显示在浮萍中提供mAbl单克隆IgGl抗体的表达而无浮萍 FucT和XylT的RNAi抑制的野生型mAbIOl构建体(示于图15),其产生具有3个主要^聚糖种类的Y糖基化特征,包括具有P 1, 2-连接 的木糖的一个种类和具有P 1, 2-连接的木糖以及核心oc 1, 3-连接的岩 藻糖残基的 一个种类;使用液相色镨质i瞽测定法(liquid chromatography mass spectrometry) (LC-MS)(图20)和MALDI (图 21)分析验证该特征。
图22显示在包含mAbIOl构建体(无FucT或XylT的抑制)的野生 型浮萍系中和和在两个包含图12的mAbl04构建体(提供mAbl以及靶 向浮萍FucT和XlT的嵌合RNAi构建体的共表达)的转基因浮萍系中产 生的mAbl的不同^聚糖种类的相对量的概述。注意无附着的P1,2-连接的木糖或核心ccl,3-连接的岩藻糖残基的GnGn (即,GO)聚糖种 类的丰富(enrichment),和不存在具有P 1, 2-连接的木糖或具有P 1, 2-连接的木糖和核心oc 1, 3-连接的岩藻糖残基的种类。"MGn"表示 W聚糖的前体,其中三甘露糖核心结构Man3GlcNAc2具有附着至1, 6甘 露糖臂的1个N乙酰葡糖胺。这些N聚糖的前体表示样品中存在痕量 的总W聚糖。使用质谱测定法(LC-MS)(图23)和MALDI (图24)分析 验证该特征。
图25显示在包含mAbl01构建体的野生型浮萍(系20)中产生的 mAbl组合物的完整的质量分析(intact mass analysis )。当在浮萍 中不抑制XylT和FucT的表达时,重组产生的mAbl组合物是异源的, 包含至少9个不同的糖形,GOXFS糖形是存在的占主体的种类。注意非 常小的峰代表GO糖形。
图26显示在包含图12的mAbl04构建体的转基因浮萍(系15 ) 中产生的mAb I組合物的完整的质量分析。当在浮萍中使用该嵌合RNA i 构建体抑制XylT和FucT表达时,完整的mAbl组合物对于GG W聚糖 而言大体上是均质的,只有痕量的前体^聚糖存在(由GnM和MGn前 体聚糖种类表示)。此外,mAbl组合物对于GO糖形而言大体上是均质 的,其中两个糖基化位点都被GO W聚糖种类占据,3个小峰反映痕量 的前体糖形(一个峰显示具有Fc区域的mAbl,其中一条重链的CH2结 构域具有附着至Asn 297的GO聚糖,另一条重链的CH2结构域未被糖基化;另一个峰显示具有Fc区域的mAbl,其中一条重链的CH2结构域 具有附着至Asn 297的GO聚糖,另一条重链的CH2结构域具有附着至 Asn 297的GnM或MGn前体聚糖;另一个峰显示具有Fc区域的mAbl, 其中各CH2结构域上的Asn 297糖基化位点具有附着的GO聚糖种类, 第三GO聚糖附着至mAbl结构内的额外的糖基化位点)。
图27显示在包含图13的mAbl05构建体的转基因浮萍(系72 ) 中产生的mAbl组合物的完整的质量分析。当在浮萍中使用该构建体 抑制XylT和FucT表达时,完整的mAbl组合物对于GO N聚糖而言大 体上是均质的,只存在痕量的前体W聚糖种类(由GnM和MGn前体聚糖 种类表示)。此外,mAbl组合物对于GO糖形而言大体上是均质的(至 少90°/。),相同的3个小峰反映了使用mAbl04构建体获得的前体糖形。
图28概述了用于耙向单独的FucT和XylT基因的表达的两种可 能的设计。
图29A显示植物和动物中产生的糖蛋白的复杂^聚糖的共同的寡 甘露糖苷核心结构。在哺乳动物中,核心结构可包含其中岩藻糖的1-位点通过oc键在还原性末端与乙酰葡萄糖胺的6-位点连接的岩藻 糖残基(即,a (1,6)-连接的岩藻糖)。图29B显示对这些N聚糖的植 物特异性修饰。哺乳动物R基团可以是下列的一个(a) R-GlcNAcP (1,2); (b)R=Gaip (1,4)-GlcMcP (1,2); (c)R-NeuAc a (2, 3)-Gal P (1,4)-GlcNAcP (1,2); (d) R-NeuGc a (2, 3)-Gal P (1, 4)-GlcNAc P (1,2);和(e)R-Gala (1,3)-Gaip (1, 4) -GlcNAc P (1, 2)。植物的R基 团可以是下列中的一个(a) R-空;(b) R=GlcNAc P (1, 2);
(c), R=Gaip(l,3)-GlcNAcP(l,2) and (d) R=Galp(l,4)-GlcNAcp(l,2). Fuca(1,4) Fuca(1,6). 。
缩写Man,甘露糖;GlcMc, N-乙酰葡糖胺;Xyl,木糖;Fuc, 岩藻糖;Gal,半乳糖;NeuAc (神经氨酸(唾液酸);*,结合天冬酰胺 的糖链的还原末端。
图30显示本发明的说明书和权利要求中提及的糖蛋白的N连接 的聚糖GO、 G0X和G0XFS种类,以及此处所使用的可供替换的术语。
36图31显示了浮萍P 1 ,2-木糖基转移酶(XylT)同种型#2的部 分cDNA (SEQ ID NO: 19; SEQ ID NO: 20中所示的编码序列)序列, 和由其编码的部分氨基酸(SEQ ID N0:21)序列。由单下划线(-)指示 的核苷酸相应于设计用于抑制XylT的表达的RMi表达盒内的XylT 的正向片段(参见图33);由双下划线(-)指示的核苷酸相应于该RNAi 表达盒内的间隔区序列。RNAi表达盒的XylT反向片段是此处显示的 XylT的正向片段的反义片段。
图32显示SEQ ID NO: 6的浮萍XylT同种型#1与SEQ ID NO: 21 的浮萍部分长度的XylT同种型#2的比对。
图33显示用于设计基于XylT同种型#2的部分DNA序列的浮萍 XylT的单基因RNAi敲除的一个策略。
图34显示用于设计浮萍FucT和XylT的双基因RNAi敲除的一个 策略,其中RNAi敲除的XylT部分基于XylT同种型#2的部分DNA序 列。
图35显示CHO来源的和SP2/0来源的针对新分离的人NK细胞上 的Fc yRIIIa的mAbl产物的受体结合活性。
图36显示针对从供体1收集的新分离的人NK细胞上的Fey RIIIa的野生型浮萍来源的mAbl产物和转基因浮萍来源的mAbl产物 的受体结合活性。
图37显示针对从供体2和3收集的新分离的人NK细胞上的Fc yRIIIa的野生型浮萍来源的mAbl产物和转基因浮萍来源的mAbl产 物的受体结合活性。
图38显示针对小鼠FcyRIV的Sp2/0来源的mAbl产物、野生型 浮萍来源的mAbI产物和转基因浮萍来源的mAbI产物的受体结合活性。
图39显示用于浮萍中FucT和XylT活性的RNAi沉默的MDXA04 二元表达载体的图解。阴影线标示的区域显示完全人mAbl k抗体MDX -060的重链(H)和轻链(L)可变区基因序列以及设计用于靶向编码 FucT和XylT的内源性浮萍基因的沉默的嵌合发夹结构RNA (RNAi)。 启动子Pl、 P2和P3;终止子T;选择标记SM;左边界LB;右边界,RB。用于在野生型浮萍中表达MDX-060 mAb的MDXA01表达载 体不包含发夹结构RNA区域。
图40显示浮萍野生型和MDX-060 LEX°ptRNAi系中的糖基转移酶 活性。在包含GDP-Fuc、 UDP-Xyl和GnGn-dabsyl-肽受体的反应緩冲 液存在的情况下温育来自野生型(WT)和MDX-060 LEX°ptRNAi (标示 出系成员)的微粒体膜。通过正反射型模式MALDI-TOFMS (positive reflectron mode MALDI-TOF MS)测量相应于由来自各系的微:粒体合 成的岩藻糖基化(fucosylated )(白色条块)或木糖基化(xylosylated ) (黑色条块)产物的质量峰,将质量峰按百分数对WT阳性对照进行标准 化。煮沸的野生型膜(Boiled wild Type, BWT)表示背景离子计数。
图41显示植物提取物和蛋白A或来自MDX-060 LEXQpt的羟基磷灰 石纯化的样品分别在非还性条件(图41A)和还原性(图41B)条件下的 SDS-PAGE。从CH0细胞系(MDX-060 CH0)纯化的MAb用作阳性对照。 在凝胶上包括Mark12分子量标记。用胶体蓝(Colloidal Blue)对凝 胶进行染色。
图42显示获自2-AA标记的从CH0 (MDX-060 CH0)、野生型浮 萍(MDX-060 LEX)或用XylT/FucT RNAi构建体转化的浮萍(MDX-060 LEX一)中表达的MDX-060 mAb释放的iV聚糖的阴性、反射型模式 MALDI-T0F质i普分析的语。通过相应的质量([M-H]—)鉴定明显的峰。* 表示matrix artefact的位置。
图43显示获自2-AA标记的从CH0 (MDX-060 CH0)、野生型浮萍 (MDX-060 LEX)或用XylT/FucT RNAi构建体转化的浮萍(MDX-060 LEX°pt) 中表达的MDX-060 fflAb释放的#聚糖的NP-HPLC-QT0F MS分析的谱。 通过正相色谱法分离2-AA标记的W聚糖并通过荧光检测。通过在线阴 性模式QT0F MS表征来自各样品(标记为a-i)的最丰富的峰,显示 它们的相应的QT0F质i昝([M-2H广)。
图44显示通过结合L540细胞上表达的CD30的MDX-060 CH0、 LEX或糖最优化的LEX°pt mAb的流式细胞检测分析测量的MDX-060 mAb 的体外活性。用浓度不断增加的本说明书下面的实施例6中概述的指
38定的抗体温育L540细胞。将几何平均荧光强度(GMFI)对所使用的mAb 的不同浓度作图。■: MDX-060 CH0; ▲: MDX-060 LEX; T: MDX-060
LEX0pt。
图45显示糖最优化的mAb和野生型mAb与两种不同的人FcRy Ilia同种异型(Var"或Phe""的平衡结合。作为FcRy Ilia的函数的 结合信号拟合到单位点结合模式(one-site binding model) 。 ■: MDX-060 CHO; ▲: MDX-060 LEX; T: MDX-060 LEX0pt。
图46显示来源于CHO、 LEX(野生型浮萍糖基化)或LEX°pt (RMi 转基因浮萍)的MDX-060 mAb的ADCC活性。在浓度不断增加的指定的 抗体存在的情况下,以50:1的效应子靶比例将来自Fc yRIIIaPhe158 純合子供体和Fc vRIIIaPhe/Val"8杂合子供体的人效应细胞与BATDA 标记的L540细胞一起温育。将各mAb浓度上的特定百分数裂解作图。 不识别L540细胞上的抗原的人mAbl在所有实验中用作同型(isotype) 对照。使用GraphPad Prism 3.0软件计算EC"值(m g/mL)、结合常 数和最大百分比裂解。■: MDX-060 CHO; ▲: MDX- 060 LEX; T: MDX-060 LEX0pt。
图47显示在包含MDXA01构建体的野生型浮萍中产生的 MDX-060 LEX mAb组合物的完整的质量分析。当在浮萍中不抑制XylT 和FucT表达时,重组产生的MDX-060 LEX mAb组合物包含至少7种不 同的糖形,GOXF'糖形为存在的占主体的种类。注意不存在代表GO糖 形的峰。
图48显示在包含MDXA01构建体的野生型浮萍中产生的MDX-060 LEX mAb的重链的聚糖质量分析。当在浮萍中不抑制XylT和FucT表 达时,存在的占主体的^聚糖是G0XF3,额外的主峰反映GOX种类。注 意GO聚糖种类的少量存在。
图49显示在包含MDXA04构建体的转基因浮萍中产生的 MDX-060 LEX°ptmAb组合物的完整的质量分析。当在浮萍中抑制XylT 和FucT表达时,完整的mAb组合物只包含GO W聚糖。此外,组合物 对于GO糖形(峰2)而言大体上是均质的,其中两个糖基化位点被GO #聚糖种类占据,2个小峰反映痕量的前体糖形(峰l,显示具有Fc区域 的mAb,其中一条重链的CH2结构域具有附着至Asn 297的GO聚糖种 类,另一条重链的CH2结构域未被糖基化;峰3,显示具有Fc区域的 mAb,其中各CH2结构域上的Asn 297糖基化位点具有附着的GO聚糖 种类,第三GO聚糖种类附着至mAb结构内的额外的糖基化位点)。
图50显示在包含MDXA04构建体的转基因浮萍中产生的 MDX-060 LEX°ptmAb的重链的聚糖质量分析。当在浮萍中抑制XylT和 FucT表达时,唯一可容易检测的附着至重链的CH2结构域的Asn 297 糖基化位点的^聚糖种类是G0。
图51A (MALDI分析)和51B (HPLC分析)显示在包含mAb104 RMi 构建体的转基因浮萍(系24)中产生的mAbl展示的均质的糖基化特 征与在扩大生产的情况下观察到的一致。该糖基化特征在通过克隆扩 增的转基因系的连续保持的8个月时间中是稳定的。
图52显示l吏用图12的嵌合RNAi mAbl04构建体抑制FucT和 XylT的表达导致具有与重组糖蛋白中观察到的糖基化模式一致的均 质的糖基化模式的内源性糖蛋白。关于该图,用星号指明附着至三甘 露糖核心结构的P 1, 2-连接的木糖残基。
图53显示下面的实施例6中描述的复杂W聚糖的结构。M =甘 露糖;Gn = N-乙酰葡糖胺;A =半乳糖;X =木糖;F -岩藻糖。
发明详述
现将在下文中通过参考附图详细地描述本发明,在所述附图中显 示了一些但非所有本发明的实施方案。事实上,可以以许多不同的形
式体现这些发明,这些发明不应当解释为限定于此处所示的实施方案; 相反,提供这些实施方案以使本公开内容将满足可应用法律要求。相 同的数字在整个说明书中表示相同的元素。
此处所示的本发明的许多改变和其他实施方案将使本领域技术 人员记住这些发明适合具有前述描述和相关附图中所示的教导的益 处。因此,要理解本发明不限定于公开的特定的实施方案以及改变和其他实施方案意欲包括在所附权利要求的范围之内。尽管此处使用特 定的术语,但它们只以一般的和描述性的意义使用而不是为了限定。 本发明提供了用于改变植物(特别是用作目的重组蛋白的表达系
统的植物)中产生的同源和异源多肽的iV糖基化模式的组合物和方法。 方法包括使用核苷酸构建体,所述构建体包含一种或多种能够抑制ot 1,3-岩藻糖基转移酶(FucT)和P 1,2-木糖基转移酶(XylT)在植物 中表达的序列。还提供了用于实施本发明的方法的组合物和包含具有 基本上同源的糖基化特征的糖蛋白(包括具有提高的效应子作用的聚 糖最优化的单克隆抗体)的组合物。
定义
"多肽,,是指任何单体或多聚体蛋白或肽。
"生物活性多肽"是指具有进行在生物学背景中通常归因于多肽
的一种或多种生物学功能或成套的活性的能力多肽。本领域技术人员 将理解,术语"生物活性"包括其中与天然蛋白质相比生物活性性被 改变(例如,被抑制或增强)的多肽,只要蛋白质具有足够的目的活 性以用于工业或化学方法或用作治疗剂、疫苗或诊断剂。可通过本领 域内可获得的任何方法确定生物活性。例如,可通过许多方法中的任 何方法确定蛋白质的干扰素家族成员的生物活性,包括它们与干扰素 特异性抗体的相互作用、它们增加对病毒感染的抗性或它们调节受干 扰素调控的基因靶的转录的能力。通过相似的方式,可通过许多方法 中的任何方法,例如使用用于抗体依赖性细胞毒性(ADCC)和补体依赖 性细胞毒性(CDC)活性的测定法确定单克隆抗体的生物活性,所述方法 包括但不限于,用于测量结合特异性和效应子作用的测定法。
"宿主细胞"意指包含本发明的异源核酸序列的细胞。尽管可将 本发明的核酸序列和其片段及变体导入任何目的细胞,但特定目的的 细胞是植物宿主细胞。在一些实施方案中,植物宿主细胞是用作用于 表达重组蛋白的植物的细胞,例如用于产生在下面提到的目的重組哺 乳动物蛋白质的植物表达系统。"目的异源多肽"意指不由宿主细胞天然表达的多肽。相反地, "同源多肽"意指在宿主的细胞内天然产生的多肽。经历翻译后iV糖 基化的异源和同源多肽此处称为异源或同源糖蛋白。根据本发明的方
法,在植物的细胞内改变异源和同源糖蛋白的N糖基化模式以使这些 糖蛋白具有与使用哺乳动物宿主观察到的糖基化模式更相似的#糖基 化模式。
示例性目的异源多肽序列和异源核苷酸序列包括,但不限于,编 码哺乳动物多肽例如胰岛素、生长激素、ot-干扰素、P-干扰素、p-葡糖脑苷脂酶、p-葡萄糖醛酸酶(glucoronidase)、视网膜母细胞 瘤蛋白(retinoblastoma protein) 、 p53蛋白、制管张素、瘦素、 红细胞生成素(EPO)、粒细胞巨噬细胞集落刺激因子、纤维蛋白溶酶原、 组织纤溶酶原激活物、血液凝血因子例如因子VII、因子VIII、因子 IX和激活蛋白C、 ctl-抗胰蛋白酶、单克隆抗体(mAbs)、 Fab片段、 单链抗体、细胞因子、受体、激素、人疫苗、动物疫苗、肽和血清白 蛋白的序列。
为了本发明的目的,术语"^聚糖"、"萨连接的聚糖"和"聚 糖"可互换使用,是指W连接的寡糖,例如通过与蛋白质中的天冬酰 胺残基的酰胺氮连接的肝乙酰葡糖胺(GlcNAc)残基所附着的寡糖。糖 蛋白上发现的主要的糖是葡萄糖、半乳糖、甘露糖、岩藻糖、沪乙酰 半乳糖胺(GalNAc)、 A^乙酰葡糖胺(GlcNAc)和唾液酸(例如,A^乙酰-神经氨酸(NeuAc))。糖基的加工在ER的内腔中伴随翻译发生且在高尔 基体中继续进行以产生N连接的糖蛋白。
复杂N聚糖的"寡甘露糖苷核心结构"或"三甘露糖核心结构" 示于图29A中,其中核心包含附着至糖蛋白的天冬酰胺残基的3个甘 露糖(Man)和2个f乙酰葡糖胺(GlcNAc)单糖残基。天冬酰胺残基通 常在保守的肽序列Asn-Xxx-Thr或Asn-Xxx-Ser内,其中Xxx是除了 脯氨酸、天冬氨酸或谷氨酸外的任何残基。随后的糖基化步骤产生最 终的复杂的^聚糖结构。三甘露糖核心结构此处表示为"Man3GlcNAc2"。
附着至糖蛋白的^聚糖在包含加至三甘露糖核心结构的外周糖(例如,GlcNAc、半乳糖、岩藻糖和唾液酸)的分支(天线)的数目方 面不同。通常根据它们的分支组成(例如,复杂、高甘露糖或杂交) 对W聚糖分类。"复杂"类型的W聚糖通常具有至少一个附着至1,3 甘露糖臂的GlcNAc和至少一个附着至"三甘露糖"核心的1, 6甘露糖 臂的GlcMc。当1个GlcMc附着至每一个甘露糖臂,N连接的聚糖的 种类此处表示为"GlcNAc2Man3GlcMc2,,或"GnGn"。当只有1个GlcNac 被附着,^聚糖种类此处表示为"GlcNAClMan3GlcNAc2",其中GlcNac 附着至1, 3甘露糖臂(此处表示为"MGn")或1,6甘露糖臂(此处表示 为"GnM")(参见图30)。复杂的^聚糖还可具有任选地用唾液酸或 衍生物(例如,"NeuAc",其中"Neu"表示神经氨酸,"Ac"表示乙 酰基)修饰的半乳糖("Gal")或^乙酰半乳糖胺("GalNAc")糖残基。 当半乳糖残基附着至各甘露糖臂上的每一个GlcMc时,W连接的聚糖 的种类此处表示为"Gal2GlcNAc2Man3GlcNAc2"。复杂的W聚糖还可具 有包含"二等分"GlcNAc和核心岩藻糖("Fuc")的链内取代。复杂 的W聚糖还可在"三甘露糖核心"上具有多个天线,通常称为"多个 天线聚糖(multiple antennary glycans )"。"高甘露糖"类型的 Y聚糖具有5个或更多个甘露糖残基。"杂交"^聚糖在三甘露糖核心 的1, 3甘露糖臂的末端上具有至少一个GlcNAc和在三甘露糖核心的 1, 6甘露糖臂上具有0个或多个甘露糖。
术语"GO聚糖"和"GO聚糖结构"和"GO聚糖种类"可互换使 用且欲意表示具有GlcNAc2Man3GlcMc2结构的复杂的^连接的聚糖, 其中不存在末端唾液酸(NeuAcs)或末端半乳糖(Gal)糖残基。如果GO 聚糖包含附着至三甘露糖核心结构的岩藻糖("Fuc")残基,那么其在 此处称为"G0F3聚糖"(具有植物特异性a1,3-连接的岩藻糖残基) 或"G0F6聚糖,,(具有哺乳动物的otl,6-连接的岩藻糖残基)。在植物 中,包含附着至三甘露糖核心结构的植物特异性P 1, 2-连接的木糖残 基的GO聚糖此处称为"GOX聚糖",包含附着至三甘露糖核心结构的 植物特异性P 1, 2-连接的木糖残基和植物特异性ot 1, 3-连接的岩藻糖 残基的GO聚糖此处称为"G0XF3聚糖"。术语"G1聚糖"和"G1聚糖结构"和"G1聚糖种类"可互换使 用且意欲表示具有GlcNAc2Mari3GlcNAc2结构的复杂的^连接的聚糖, 其中一个末端半乳糖(Gal)残基附着至1,3甘露糖或1,6甘露糖臂,且 不存在末端唾液酸。术语"G2聚糖"和"G2聚糖结构"和"G2聚糖 种类"可互换使用且意欲表示具有GlcNAc2Mari3GlcNAc2结构的复杂的# 连接的聚糖,其中末端半乳糖(Gal)残基附着至1,3甘露糖臂和1,6 甘露糖臂,且不存在末端唾液酸。
此处使用的"糖形"是指包含特定碳水化合物结构的糖蛋白。因 此,例如,"GO糖形"是指只包含附着至其糖基化位点的GO聚糖种 类的糖蛋白。公认地,具有多个糖基化位点的糖蛋白可具有附着至每 一个糖基化位点的相同聚糖种类,或可具有附着至不同糖基化位点的 不同聚糖种类。这样,聚糖附着的不同模式产生不同糖形的糖蛋白。
术语"糖基化特征i普"欲意表示通过酶促或化学作用从糖蛋白组 合物或糖蛋白产品释放的,然后就它们的碳水化合物结构使用例如 LC-HPLC或MALDI-TOF MS等进行分析产生的代表性W聚糖种类的特征 "指纟丈,,。参见,例ft口, f力e re卩/e^Ci/rre/ f j/2ai/"ca/ C力e/z7/sfr/, 第1巻,No. 1 (2005), pp. 28-57;此处通过引用其全文将其纳入 本文。
术语"大体上均一的"、"大体上一致的"和"大体上均质的" 在关于糖蛋白组合物或糖蛋白产物的糖基化特征的背景中可互换使用 且意欲表示糖基化特征,其中至少80%、至少85%、至少90%、 91%、 92%、 93°/。、 94%、 95%、 96%、 97%、 98%或至少99%的总的特征内的N聚 糖种类由一个希望的N聚糖种类代表,痕量的前体W聚糖种类出现在 特征i普中。"痕量"意指存在于糖基化特征傳中的任何给定的前体# 聚糖种类以低于5%,优选低于4%,低于3°/。,低于2%,低于1%和甚至 低于0. 5%或甚至低于0. 1%的特征镨中出现的^聚糖种类的总量存在。 "前体,,W聚糖种类意指未被完全加工的^聚糖种类。以痕量存在于 本发明的糖蛋白组合物或糖蛋白产品中,从而出现在其糖基化特征谱 中的前体 W聚糖种类的实例是上述Man3GlcNAc2 、 MGn(GlcNaclMan3GlcNAc2,其中GlcNacl附着至1,3甘露糖臂)和GnM (GlcNaclMan3GlcNAc2其中GlcNacl附着至1, 6甘露糖臂)前体N聚糖 种类。
因此,例如,当糖蛋白产品或组合物内希望的N聚糖种类是GO 时,该产品或组合物的大体上均一的糖基化特征语是其中至少80%、 至少85%、至少90%、 91%、 92°/。、 93%、 94%、 95%、 96%、 97%、 98°/。或 至少99%的出现在产品或组合物的糖基化物特征谱中的^聚糖种类的 总量由GO聚糖种类代表,痕量前体W聚糖种类出现在糖基化特征谱中 的特征语。对于这样的组合物,出现在其糖基化特征语中的代表性前 体y聚糖种类是上述Man3GlcNAc2、MGn (GlcNacl Man3GlcNAc2, GlcNacl 附着至1, 3甘露糖臂)和GnM (GlcNaclMan3GlcMc2,其中GlcNacl附 着至1,6甘露糖)前体N聚糖种类。
术语"大体上均一的,,、"大体上一致的"和"大体上均质的" 在糖蛋白組合物或糖蛋白产品的背景下可互换使用,且意欲表示其中 至少80%、至少85%、至少90%、 91%、 92°/。、 93%、 94%、 95%、 96%、 97%、 98%或至少99%的存在于产品或组合物中的糖蛋白由一种希望的糖形 代表,痕量的前体或不希望的糖形存在于组合物中的糖蛋白产品或糖 蛋白组合物。"痕量,,意指存在于糖蛋白产品或组合物中的任何给定 的前体或不希望的糖形以少于5%、优选少于4%、少于3%、少于2%、 少于1%和甚至少于0. 5%或甚至少于0. 1%的总糖蛋白存在。"前体" 糖形意指其中至少一个糖基化位点未被糖基化,或被代表希望的^聚 糖种类的前体的iV聚糖种类占据的糖形,或其中一个或多个额外的糖 基化位点存在(相对于希望的糖形),且被希望的^聚糖种类或不希 望的W聚糖种类占据(即,已附着至其上)的糖形。
因此,例如大体上均一的包含GO糖形的糖蛋白组合物或产品是 其中至少80%、 80%、至少85%、至少90%、 91%、 92%、 93%、 94%、 95%、 96°/。、 97%、 98%或至少99%的存在于产品或组合物中的糖蛋白由GO糖 形代表,其中所有预期的糖基化位点由GO聚糖种类占据,痕量的前体 或不希望的糖形存在于組合物中的組合物或产品。在这样的组合物中,代表性前体糖形可以是其中糖基化位点未被占据的糖形,示例性不希
望的糖形是具有G0聚糖和附着至其糖基化位点的G0X或G0XF3聚糖种 类的混合的糖形。
术语"抗体,,以广义的意义使用,包括完全组装的抗体、可结合 抗原的抗体片段(例如,Fab'、 F' (ab)2、 Fv、单链抗体、双抗体)以及 包括前述抗体的重组肽。抗体代表由本发明的方法和组合物涉及的许 多种糖蛋白中的一种。本发明还涉及抗体的衍生物。衍生物包括包含 免疫球蛋白或其部分例如具有Ch2結枸域的Fc区域的融合蛋白。
此处所使用的"单克隆抗体"是指从大体上均一的抗体的群体获 得的抗体,即各个抗体,其包含除了可能可以以极少量存在的天然发 生突变外,是相同的群体。
"天然抗体"和"天然免疫球蛋白"通常是大约150, 000道尔顿、 由2个相同的轻(L)链和2个相同的重(H)链组成的异四聚体糖蛋 白。各轻链通过一个共价二硫键与重链连接,然而二硫键的数目在不 同免疫球蛋白同型的重链之间是变化的。各重链和轻链还具有有规律 地间隔的链内二硫键。各重链在一端具有可变结构域(Vh),之后是 许多恒定结构域。各轻链在一端具有可变结构域(VJ和在其另一端 具有恒定结构域;轻链的恒定结构域与重链的第一恒定结构域对准, 轻链的可变结构域与重链的可变结构域对准。特定的氨基酸残基据认 为形成了轻链和重链可变结构域之间的界面。
术语"可变的,,是指可变结构域的某些部分的序列在抗体之间差 异很大且用于各特定抗体对其特定抗原的结合和特异性。然而,可变 性不是均匀地分布在抗体的整个可变结构域中。其集中在轻链和重链 可变结构域中的称为互补性决定区(CDR)或高变区的3个区段中。可变 结构域的更高度保守的部分称为构架(FR)区。天然重链和轻链的可变 结构域各自包含4个FR区,它们主要采取P折叠片构型,通过3个形 成连接P折叠片结构的环的CDR连接,所述环在一些情况下形成了 P 折叠片结构的部分。各链中的CDR通过FR区紧密相邻地保持在一起, 与来自其他链的CDR —起,促成了抗体的抗原结合位点的形成(参见
46Kabat等人(199D NIH PuM No. 91-3242,第1巻,pages 647—669)。 恒定结构域不直接参与抗体与抗原的结合,但展示不同的效应子 功能,例如Fc受体(FcR)结合、抗体依赖性细胞毒性(ADCC)中的抗体 的沉淀、调理作用、补体依赖性细胞毒性(CDC活性)的起始以及肥大 细胞脱颗粒作用。
"抗体片段"包括完整抗体的部分,优选完整抗体的抗原结合或 可变区。抗本片段的示例包括Fab、 Fab'、 F(aV)2和Fv片段、双抗 体、线性抗体(Zapata等人(1995) /VWe//2 A/^. 8 (10): 1057-1062)、 单链抗体分子以及从抗体片段形成的多特异性抗体。抗体的木瓜蛋白 酶消化产生2个完全相同的抗原结合片段,称为"Fab"片段,其各自 具有单个抗原结合位点和残留的"Fc"片段,其名称反映了其易于结 晶的能力。胃蛋白酶处理产生了具有2个抗原结合位点且仍然能够交 联接抗原的F(ab')2片段。
"Fv"是包含完整的抗原识别和结合位点的最小抗体片段。在双 链Fv种类中,该区域由紧密、非共价结合的一条重链和一条轻链可变 结构域的二聚体组成。在单链Fv种类中, 一条重链和一条轻链的可变 结构域可由易曲的肽连接体共价连接,以使轻链和重链能够在类似于 双链Fv种类中的结构的"二聚体"结构中结合。在该构型中,各可变 结构域的3个CDR相互作用以确定VH-Vt二聚体的表面上的抗原结合位 点。综合起来,6个CDR为抗体提供了抗原结合特异性。然而,甚至 单个可变结构域(或只包含3个对于抗原是特异性的CDR的Fv的一半) 具有识别和结合抗原的能力,尽管以比完整结合位点低的亲和力结合。 Fab片段还包含轻链的恒定区和重链的第一恒定区(CJ)。 Fab片 段与Fab'片段的不同在于,在包含一个或多个来自抗体铰链区的半 胱氨酸的重链CH1结构域的羧基端加入了少数几个残基。Fab'-SH在此 处是其中恒定结构域的半胱氨酸残基具有游离巯基的FaV的名称。 F(aV)2抗体片段最初产生为在它们之间具有铰链区的Fab'片段对。 抗体片段的其他化学偶联也是已知的。
基于它们的恒定结构域的氨基酸序列,可将来年自任何脊推动物物种的抗体(免疫球蛋白)的"轻链"分配至两种不同类型(称为
kappa (k)和lambda (入))中的一种。
取决于它们的重链的恒定结构域的氨基酸序列,免疫球蛋白可分 为不同的种类。存在5个主要类型的人免疫球蛋白IgA、 IgD、 IgE、 IgG、和IgM,这些种类中的几种可进一步分为亚类(同型),例如IgGl、 IgG2、 IgG3、 IgG4、 IgA和IgA2。相应于不同种类的免疫球蛋白的重 链恒定结构域分别称为oc、 5、 s、 y和m。不同为的免疫球蛋白的 亚基结构和三维构象是众所周知的。不同同型具有不同效应子作用。 例如,人I gG 1和I gG 3同型介导抗体依赖性细胞介导的细胞毒性(ADCC) 活性。
免疫球蛋白具有保守的两条重链的各链的Fc区域的N连接糖基 化。因此,例如,IgG类型的免疫球蛋白具有在天冬酰胺297 (Asn-297) 上携带N连接的寡糖的糖基化CH2结构域。取决于附着至这两个糖基 化位点的各位点的特定N聚糖种类和取决于免疫球蛋白组合物内所述 2个位点被糖基化的程度,存在免疫球蛋白的不同糖形。
参照异源多肽的表达,此处所使用的"目的核苷酸序列"是指编 码希望在宿主特别是植物宿主中(例如在高等植物(包括双子叶科和 单子叶科的成员)中)表达的异源多肽的任何多核苷酸序列。例如, 按照本发明,可使用转化的植物宿主例如浮萍表达编码治疗性(例如, 用于兽医或医学用途)或免疫原性(例如,用于接种)多肽的多核苷 酸序列。
术语"多核苷酸"的用途无意将本发明限定于包括DNA的多核苷 酸。本领域技术人员公认,多核苷酸可包括核糖核苷酸以及核糖核苷 酸与脱氧核糖核苷酸的组合。此类脱氧核糖核苷酸和核糖核苷酸包括 天然发生的分子和合成的类似物。本发明的多核苷酸还包括序列的所 有形式,包括但不限于,单链形式、双链形式、发夹结构、茎-环结构 等。
此处所使用的术语"抑制"、"抑制作用"和"禁止"是指靶基 因产物的表达或功能的任何降低,包括表达或功能的任何相对减少直至和包括耙基因产物的表达或功能的完全废除。此处所使用的术语"表 达"在基因产物的背景中是指该基因产物的生物合成,包括基因产物 的转录和/或翻译和/或装配。靶基因产物(即,目的基因产物)的表 达或功能的抑制可以是在任何两个植物之间的比较(例如遗传改变的 植物中的耙基因产物的表达或功能对相应的野生型植物中的该靶基因 的表达或功能)的背景中。可选择地,靶基因产物的表达或功能的抑 制可以在相同植物内的或植物间的植物细胞、细胞器、器官、组织或 植物部分之间的比较,并包括相同植物内的或植物间的发育或时间阶 段之间的比较的背景下。在转录或翻译水平上下调靶基因产物的表达,
-物"表i或功能的抑制:、。、、','p 土 术语"抑制性序列"包括能够在例如在转录或翻译水平上抑制靶 基因产物的表达,或能够抑制靶基因产物的功能的任何多核苷酸或多 肽序列。抑制性序列的实例包括,但不限于,全长多核苷酸或多肽序 列、截短的多核苷酸或多肽序列、多核苷酸或多肽序列的片段、多核 苷酸或多肽序列的变体、有义核苷酸序列、反义核苷酸序列、有义或 反义方向的核普酸序列的互补序列、核苷酸序列的倒转区域、核苷酸 序列的发夹结构、双链核苷酸序列、单链核苷酸序列、其组合等。术
语"多核普酸序列,,包括RNA、 DNA、化学修饰的核酸、核苷酸类似物 的序列、其组合等。
已承认,抑制性多核苷酸包括直接(即,不需要转录)或间接(即, 需要转录或转录及翻译)抑制靶基因产物的表达的核苷酸序列。例如, 抑制性多核苷酸可包括当导入植物细胞、组织或器官时可直接(尽管 短暂地)沉默目的耙基因产物的表达的化学合成的或体外产生的小干 扰RNA(siRNA)或micro RNA (miRM)。可选择地,抑制性多核苷酸可
苷酸序列,例如有义方向的RM、反义RNA、双链RNA (dsRNA)、发夹 结构RNA (hpRM)、包含内含子的hpRNA、催化RNA、 miRM等。在其 他实施方案中,抑制性多核普酸可包括编码mRNA的核苷酸序列,所述mRM的翻译产生抑制目的靶基因产物的表达或功能。这样,当抑制性 多核苷酸包括编码抑制性核苷酸分子或该多肽的mRNA的核苷酸序列 时,编码序列与在植物细胞中驱动表达的启动子有效连接,从而使被 编码的抑制性核苷酸分子或mRNA被表达。
抑制性序列此处以靶基因产物的名称命名。因此,例如,"otl,3-岩藻糖基转移酶(FucT)抑制性序列"是指能够在例如转录和/或翻译水 平上抑制FucT的表达,或能够抑制FucT的功能的抑制性序列。类似 地,"p 1,2-木糖基转移酶(XylT)抑制性序列"是指能够转录和/ 或翻译水平上抑制XylT的表达,或能够抑制XylT的功能的抑制性序 列。当短语"能够抑制"用于多核苷酸抑制性序列的背景中时,其意 指抑制性序列本身产生抑制效应;或,当抑制性序列编码抑制性核苷 酸分子(例如,发夹RNA、 miRNA或双链RNA多核苷酸)或编码抑制性 多肽(即,抑制靶基因产物的表达或功能的多肽)时,在其转录后(例如, 在编码发夹RNA、 miRNA或双链RNA多核苷酸的抑制性序列的情况下) 或在其转录和翻译后(在编码抑制性多肽的抑制性序列的情况下),转 录的或翻译的产物分别对靶基因产物产生了抑制效应(即,抑制靶基 因产物的表达或功能)。
多核苷酸例如目的核苷酸构建体的背景中的术语"导入"意指以
导入一个以上多核苷酸时,可将:些多ii酸装配为单二核苷酸-建
体的部分,或装配为分开的核苷酸构建体,和可位于相同或不同的转 化载体上。因此,可将这些多核苷酸在单个转化事件中、在分开的转 化事件中或例如作为育种方案的部分在植物中导入目的宿主细胞。本 发明的方法不依赖于用于将1个或多个多核苷酸导入植物的特定方 法,只要多核苷酸进入植物的至少一个细胞的内部。用于将多核苷酸 导入植物的方法在本领域内是已知的,包括,但不限于,瞬时转化法、 稳定转化法和病毒介导的方法。
多核苷酸背景中的"瞬时转化"意指多核苷酸被导入植物且不整 合入植物的基因组。
50"稳定导入"或"稳定导入的"在被导入植物的多核苷酸的背景 中意指被导入的多核苷酸被稳定地整合入植物基因组,从而植物稳定 地转化有多核苷酸。
"稳定的转化"或"稳定地转化的"意指被导入植物的多核苷酸 例如此处描述的核普酸构建体整合入植物的基因组且能够通过其后 代,更特别地通过多个连续代的后代遗传。在一些实施方案中,连续 代包括营养生长(即,无性繁殖)例如使用克隆繁殖产生的后代。在其 他实施方案中,连续代包括通过有性生殖产生的后代。用至少一个核
苷酸构建体(所述构建本能够抑制此处描述的FucT和/或XylT的表 达)"稳定地转化"的高等植物宿主是指具有整合入其基因组的核苷 酸构建体且能够通过无性或有性生殖产生后代的高等植物,所述后代 也包含稳定地整合入它们的基因组的抑制性核苷酸构建体,从而该后 代也将展示希望的具有改变的^糖基化模式的表型,所述改变的A糖 基化模式的特征在于oc 1, 3-岩藻糖和/或p 1, 2-木糖残基至在其中产 生的同源或异源糖蛋白的N聚糖的附着的减少。
如此处所使用的,术语"植物"包括提及完整的植物、植物器官 (例如,叶、茎、根等)、种子、植物细胞和其后代。要理解包括例 如源于之前用本发明的DM分子转化的转基因植物或后代从而至少部 分由转基因细胞构成的植物细胞、原生质体、组织、愈伤组织、胚以 及花、胚珠、茎、果实、叶、根、根尖等的转基因植物的部分在本发 明的范围内之内。如此处所使用的,术语"植物细胞"包括但不限于 种子、胚、分生组织区、愈伤组织、叶、根、枝(shoot)、配子体、 孢子体、花粉和小胞子的细胞。
可用于本发明的方法的植物的种类通常与易于进行转化技术的 高等植物的种类一样广泛,包括单子叶的(单子叶植物)和双子叶的(双 子叶植物dicot)植物。双子叶植物的实例包括但不限于豆科植物包括 大豆和苜蓿、烟草、马铃薯、番茄等。单子叶植物的实例包括但不限 于,玉米、水稻、燕麦、大麦、小麦、浮萍科的成员、草等。"低等 植物,,是指不开花(non-flowering)植物,包括厥类、问荆(horsetail )、石松、苫藓、菩类植物(liverwort)、金鱼藻、藻类,例如红藻、褐 藻和绿藻、蕨类植物的配子体、孢子体等。在一些实施方案中,目的 植物是植物的浮萍科的成员。
术语"浮萍"是指浮萍科的成员。该科目前如下分成5个属和38 个浮萍种浮萍属(Lemna )(稀脉萍(Lemna aequinoctialis) 、 L. disperma、 L. ecuadoriensis 、膨胀浮萍(L. gibba)、 L. japonica、 浮萍(L. minor) 、 L. miniscula、 L. obscura、 L. perpusilla、 L tenera、 L trisulca、 L. turionifera, L. valdiviana); 紫萍 属(Spirodela ) (S. intermedia、 紫萍、S. punctata); 芜萍属 (Wolffia ) (Wa. angusta、 Wa. arrhiza、 Wa. australina、 Wa. borealis、 Wa. brasiliensis、 Wa. columbiana、 Wa. elongata、 Wa. globosa、 Wa. microscopica、 Wa. neglecta); Wolfiella属(Wl. caudata 、 Wl. denticulata、 Wl. gladiata 、 Wl. hyalina、 Wl. lingulata、 Wl. repunda、 Wl. rotunda 和 Wl. neotropica)和 Landoltia属(L. punctata)。浮萍科的任何其他属或种,如果存在, 也是本发明的方面。可使用 Landolt (1986) Biosystematic Investigation on the Family of Duckweeds : r力e 尸a迈/J/ of Zeyzw aceae —爿#ono^Ta/7A 5^i/c/7 (Geobatanischen Institut ETH, Stiftung Rubel, Zurich)中描述的分类学方案对浮萍种类进行分类。
此处所使用的术语"浮萍结节(duckweed nodule)"是指包含 其中至少大约50%、 55%、 60%、 65%、 70%、 75%、 80%、 85%、 90%、 95% 或100%的细胞是分化细胞的浮萍细胞的浮萍组织。"分化细胞,,, 如此处所使用的,是具有至少一种将其与未分化细胞或与其他组织类 型中发现的细胞区分的表型特征(例如,不同的细胞形态或标记核酸 或蛋白质的表达)的细胞。此处描述的浮萍结节培养物的分化细胞形 成了在它们的相邻的细胞壁处融合的互连细胞的倾斜的光滑表面,已 开始组织成叶原基的结节分散在整个组织中。节培养物的組织的表面 具有通过胞间连丝相互连接的表皮细胞。通过克隆繁殖产生的浮萍科 的成员,从而所述成员代表了通过克隆繁殖的植物。此处所使用的"浮萍优选的密码子(Duckweed-preferred codons ) 是指在浮萍中具有大约17%的密码子选择的频率的密码子。
此处所使用的"Ze迈/7a优选密码子"是指在Ze/Ma属中具有大约 17%的密码子选择的频率的密码子。
此处所使用的"^^拔浮萍优选密码子"是指在^"應孕萍中具有大 约17%的密码子选择的频率的密码子,其中从密码子选择数据库 (Codon Usage Database ) (GenBank Release 113,0; 于 http: //www. kazusa. or. jp/codon/cgibin/showcodon.cgi species= Lemna+gibba+ [gbpln])获得^"應浮萍中的密码子选择频率。
"翻译起始密码子"是指起始从目的核苷酸序列转录的mRNA的 翻译的密码子。
此处所使用的"翻译起始上下文核苷酸序列(translation initiation context nucleotide sequence),,是指紧挨着翻译起始 密码子的的3个核苷酸的本体。
此处所使用的"分泌"是指多肽穿过宿主植物细胞的质膜和细胞 壁的迁移。
此处所使用的涉及核苷酸序列的"有效连接的"是指按相互之间 的功能关系放置的多个核苷酸序列。 一般地,有效连接的DNA序列是 连续的和,其中必要时,按读框连接2个蛋白质编码序列。
分离的多核苷酸和多肽
本发明提供了参与植物^连接的聚糖(也称为"^聚糖")特别 是浮萍(浮萍科的成员)中鉴定的al,3-岩藻糖基转移酶(FucT)和P 1, 2-木糖基转移酶(XylT)的进一步修饰的分离的多核苷酸和多肽以及 这些多核苷酸和多肽的变体及片段。在表达这些蛋白质的植物中抑制 这两种蛋白质的一种或两种或其生物性变体的表达有益地产生了具有 减少的ctl,3-岩藻糖和pi,2-木糖残基至糖蛋白iV聚糖的附着的W糖 基化模式。在一些实施方案中,此处公开的方法提供了对FucT和XylT 的表达的完全抑制,从而产生了其中^连接的聚糖不含a1,3-岩藻糖和p 1 , 2-木糖残基的植物中产生的糖蛋白的^糖基化模式。
浮萍ocl-3岩藻糖基转移酶(FucT)的全长cDNA序列,包括5'-和3'-UTR,示于图1;也参见SEQ ID NO: 1 (SEQ ID NO: 2中所示的 开放阅读框架)。预测的由此编码的氨基酸序列示于SEQ ID NO: 3。已 鉴定了浮萍FucT基因的至少两个同种型;同种型之间的同源性为大约 90%。编码的蛋白质与来自其他高等植物的其他FucT共有一定的相似 性。参见图2。例如,浮萍FucT序列与图2中显示的拟南芥FucT共 有大约50. 1%的序列同一性。
浮萍Pl-2木糖基转移酶(XylT)(同种型fl)的全长cDNA序列, 包括5'-和3'-UTR,示于图3;也参见SEQ ID NO: 4 (SEQ ID NO: 5中 所示的ORF)。预测的由此编码的氨基酸序列示于SEQ IDN0:6。已鉴 定了浮萍XylT基因的至少两个同种型;同种型之间的同源性为大约 90%。编码的蛋白质与来自其他高等植物的其他XylTs共有一定的相似 性。参见图4。例如,浮萍XylT序列与图4中显示的拟南芥XylT共 有大约56.4%的序列同一性。浮萍P1-2木糖基转移酶(XylT)(同种 型并2)的部分长度的cDNA序列,包括3'-UTR,示于图31;也参见SEQ ID NO: 19 (ORF示于SEQ ID NO: 20中)。预测的由此编码的氨基酸序 列示于SEQ ID NO: 21。部分长度的XylT同种型#2与全长XylT同种型 #1的相应区域共有高度的序列同一性,可从图32中显示的比对看出 这一点。
本发明包括分离的或大体上纯化的多核苷酸或蛋白质组合物。 "分离的"或"纯化的"多核苷酸或蛋白质,或其生物活性部分,大 体上或基本上不含通常伴随或与在其天然发生的环境中发现的多核苷 酸或蛋白质相互作用的组分。因此,分离的或纯化的多核苷酸或蛋白 质大体上不含其他细胞材料或培养基(当通过重组技术产生时)或大 体上不含化学前体或其他化学物质(当化学合成时)。最优地,"分 离的,,多核苷酸不含在所述多核苷酸所来源的生物的基因组DNA中天 然地侧翼所述多核苷酸(即,序列位于所述多核苷酸的5'和3'末端) 的序列(最优地蛋白质编码序列)。例如,在不同的实施方案中,分离的多核苷酸可包含少于大约5 kb、 4 kb、 3 kb、 2 kb、 1 kb、 0.5 kb 或0. 1 kb的在所迷多核苷酸所来源的细胞的基因组DNA中天然地侧翼 所述多核苷酸的核苷酸序列。大体上不含细胞材料的蛋白质包括具有 少于大约30%、 20%、 10%、 5%或1% (按干重计算)的污染蛋白质的蛋白 质制品。当重组产生本发明的蛋白质或其生物活性部分时,最优地培 养基提供少于大约30%、 20%、 10%、 5%或1% (按干重计算)的化学前体 或非目的蛋白质化学物质。
浮萍FucT基因的编码序列示为SEQ ID NO: 1的核苷酸(nt) 243-1715和示为SEQ ID NO: 2,编码的FucT多肽的氨基酸序列示于 SEQ ID NO: 3。浮萍XylT同种型#1基因的编码序列示为SEQ ID NO: 4 的核苷酸63-1592和示为SEQ ID NO: 5,编码的XylT多肽的氨基酸序 列示于SEQ ID NO: 6。部分长度的浮萍XylT同种型#2基因的编码序列 示为SEQ ID NO: 19的核苷酸1-1276和示为SEQ ID NO: 20,编码的 部分长度的XylT多肽的氨基酸序列示于SEQ ID NO: 21。
特别地,本发明提供了包含编码SEQ ID NOS: 3、 6和21中显示 的氨基酸序列的核苷酸序列的分离的多核苷酸。进一步提供了具有由 此处描述的多核苷酸(例如SEQ ID NOS: 1、 2、 4、 5、 19和20中所 示的多核苷酸)编码的氨基酸序列的多肽和其片段及变体。还提供了 包含这些核苷酸序列的互补序列的核酸分子。经验证,FucT和/或 XylT基因的编码序列可在植物中表达以过量表达编码的FucT和/或 XylT。然而,为了压制或抑制这些蛋白质的表达,SEQ ID NO: 1、 2、 4、 5、 19和20的各自的核苷酸序列将用于设计用于抑制各自的FucT 和/或XylT蛋白的表达的构建体。因此,在抑制FucT蛋白的背景中, 多核苷酸是指FucT编码序列和指当表达时例如通过直接或间接的压 制(如本说明书下面所提及的)来压制或抑制FucT基因的表达的多核 苷酸。类似地,多核苷酸,在压制或抑制XylT蛋白的背景中,是指 Xy 1T编码序列和指当表达时例如通过直接或间接的压制(如本说明书 下面所提及的)来压制或抑制XylT基因的表达的多核苷酸。
本发明还包括公开的多核苷酸和由其编码的蛋白质的片段或变体。"片段"意指FucT或XylT多核苷酸的部分或由其编码的FucT 或XylT氨基酸序列的部分。多核苷酸的片段可编码保持天然蛋白质的 生物活性,从而具有本说明书中其他地方提及的FucT活性或XylT活 性的蛋白质片段。可选择地,用作杂交探针的多核苷酸的片段通常不 编码保持生物活性的片段蛋白质。FucT或XylT多核苷酸的片段还可 用于设计用于抑制FucT和/或XylT多肽的表达的抑制性序列。因此, 例如,核苷酸序列的片段可在从至少大约15个核苷酸、大约20个核 苷酸、大约50个核苷酸、大约IOO个核苷酸、大约150个核苷酸、大 约200个核苷酸、大约250个核苷酸、大约300个核苷酸、大约350 个核苷酸、大约400个核苷酸、大约450个核苷酸、大约500个核苷 酸、大约550个核苷酸、大约600个核苷酸、大约650个核苷酸、大 约7Q0个核苷酸、大约750个核苷酸、大约800个核苷酸至编码本发
明的蛋白质的全长多核苷酸的范围内变化。
编码本发明的FucT蛋白的生物活性部分的FucT多核苷酸的片段 将编码至少15、 25、 30、 50、 100、 150、 200、 250、 300、 350、 400、 450、 475、 500个连续氨基酸,或达到存在于本发明的全长FucT蛋白 中的氨基酸的总数(例如,对于SEQ ID NO: 3, 509个氨基酸)。编
编码至少15、 25、 30、 50、 100、 150、 200、 250、 300、 350、 400、 450、 475个连续氨基酸,或达到存在于本发明的全长XylT蛋白中的 氨基酸的总数(例如,对于SEQIDN0:3, 490个氨基酸)。编码本发
编码至少15、 25、 30、 50、 100、 150、 200、 250、 300、 350、 400个 连续氨基酸,或达到存在于本发明的部分长度的XylT蛋白中的氨基酸 的总数(例如,对于SEQ ID NO: 21, 490个氨基酸)。
因此,FucT或XylT多核苷酸的片段可分别编码FucT或XylT蛋 白的生物活性部分,或其可以是可用作杂交探针或PCR引物,或通过 使用下面公开的方法用于设计用于抑制的抑制性序列的片段。可通过 分别分离本发明的FucT或XylT多核苷酸中的一种的部分,表达FucT
56或XylT蛋白的部分(例如,通过体外重组表达),和估计编码的FucT 或XylT多肽的部分的活性来制备FucT或XylT蛋白的生物活性部分。 作为FucT或XylT核苷酸序列的片段的多核苷酸包含至少15、 20、 50、 75、 100、 150、 200、 250、 300、 350、 400、 450、 500、 550、 600、 650、 700、 800、 900、 1, 000、 I,IOO、 1, 200、 1, 300、 1, 400或1450 个连续核苷酸,或达到存在于此处公开的FucT或XylT多核苷酸的核 苷酸的数目(对于SEQ ID NOS: 1、 2、 4、 5、 19和20分别为1865、 1473、 1860、 1530、 1282或1275个核苷酸)。
"变体"意指大体上相似的序列。对于多核苷酸,变体包含在天 然多核苷酸内的1个或多个位点上包含1个或多个核苷酸的缺失和/ 或添加和/或在天然多核苷酸的1个或多个位点上包含1个或多个核苷 酸的置换。如此处所使用的,"天然"多核苷酸或多肽分别包含天然 发生的核苷酸序列或氨基酸序列。对于多核苷酸,保守变体包括因为 遗传密码子的简并性,编码本发明的FucT或XylT多肽中的一种的氨 基酸序列的那些序列。可使用熟知的分子生物学技术例如,使用下面 概述的聚合酶链式反应(PCR )和杂交技术鉴定天然发生的等位基因变 体例如这些变体。变体多核苷酸还包括合成产生的多核苷酸,例如通 过例如使用定向诱变产生的但仍然编码本发明的FucT或XylT蛋白的 多核普酸。通常,如通过本说明书的其他地方描述的序列比对程序和 参数所确定的,本发明的特定多核苷酸的变体(例如,SEQ ID NO: 1、 SEQ ID NO:2、 SEQ ID NO:4、 SEQ ID NO:5、 SEQ ID NO: 19或SEQ ID NO: 20,其片段和这些序列的互补序列)具有与该特定多核苷酸至少大 约40%、 45°/。、 50%、 55%、 60%、 65%、 70%、 75%、 80%、 85%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%、 99°/。或更大的序列同一性。
还可通过由变体多核苷酸编码的多肽和由参照多核苷酸编码的 多肽之间的百分数序列同一性的比较来评估本发明的特定多核苷酸 (即,参照多核苷酸)的变体。因此,例如,公开了编码分别与给定 的SEQ ID NO: 3、 SEQ ID NO: 6或SEQ ID NO: 21的FucT或XylT多肽
具有百分数序列同一性的多肽的分离的多核苷酸。可使用本说明书中其他地方描迷的序列比对程序和参数计算任何2个多肽之间的百分数 序列同一性。当通过由它们编码的2个多肽共有的百分数序列同一性 的比较评估任何给定的本发明的多核苷酸对时,2个被编码的多肽之 间的百分数序列同一性是至少大约40%、 45%、 50%、 55%、 60%、 65%、 70%、 75%、 80%、 85%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%、 99%或更大的序列同一性。
"变体"蛋白意指通过在天然蛋白质的1个或多个位点缺失或添 加1个或多个氨基酸和/或在天然蛋白质的1个或多个位点置换1个或 多个氨基酸而从天然蛋白质产生的蛋白质。本发明包括的变体蛋白是 有生物活性的,即它们继续具有希望的天然蛋白质的生物活性,即, 如此处所描述的在植物中将ocl,3-连接的岩藻糖残基(FucT的活性) 或P 1,2-连接的木糖残基(XylT的活性)附着至糖蛋白的N聚糖的酶促 活性。此类变体可由例如遗传多态性或人工操作产生。如通过本说明 书中其他地方描述的序列比对程序和参数所确定的,本发明的天然 FucT或XylT蛋白的生物活性变体将具有与天然蛋白质的氨基酸序列 至少大约40%、 45%、 50%、 55°/。、 60%、 65%、 70%、 75%、 80%、 85%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98°/" 99°/。或更大的序列同一 性。本发明的蛋白质的生物活性变体可与该蛋白质相异少至1至15 个氨基酸,少至1至10个,例如6至10个,少至5个,少至4、 3、 2或甚至1个氨基酸残基。
可以以不同的方式包括氨基酸置换、缺失、截短和插入改变本发 明的蛋白质。用于此类操作的方法在本领域内是众所周知的。例如, 可通过DNA中的突变制备FucT和XylT蛋白的氨基酸序列变体和片段。
用于诱变和多核苷酸改变的方法在本领域内是熟知的。参见,例如, Kunkel (1985)组/. Jcfl(/.咖82: 488-492; Kunkel等 人(1987)/刀 ,/ 154:367-382;美国专利4, 873, 192; Walker和Gaastra, eds. (1983) 7fec力/72'《wes //7 #o/ecw/<s_r A/c>/o^7 (MacMillan Publishing Company, New York)和此处引用的参考资料。 关于不影响本发明的蛋白质的生物活性的恰当的氨基酸置换的指导可见于Dayhoff等人(1978) J〃a""r"e/",e/zce a/7""u"i/re (Natl. Biomed. Res. Found., Washington, D. C)(通过引用納入 本文)的模型。保守置换,例如将一个氨基本与具有相似性质的另一 个交换,可以是最优的。
因此,本发明的多核苷酸包括天然发生的FucT和XylT序列和突 变形式。同样,本发明的蛋白质包括天然发生的FucT和XylT蛋白质 以及其变体和改性形式。此类变体将继续具有希望的活性。因此,当 希望表达功能性蛋白质时,表达的蛋白质将具有希望的FucT或XylT 的活性,即如此处所描述的,在植物中将al,3-连接的岩藻糖残基 (FucT的活性)或P 1, 2-连接的木糖残基(XylT的活性)附着至糖蛋白 的^聚糖的酶促活性。当目的是抑制FucT和/或XylT多肽的表达或功 能时,变体多核苷酸或多肽的希望的活性是抑制各自的FucT和/或 XylT多肽的表达或功能。很明显,当希望表达功能性FucT或XylT变 体时,在编码变体的DNA上产生的突变一定不能把序列置于读框之外, 最优地将不产生可产生二级mRNA结构的互补区域。参见,欧洲专利申 请公开号75, 444。
当希望功能性蛋白质时,不期望此处包括的蛋白质序列的缺失、 插入和置换在蛋白质的特征方面产生根本改变。然而,当在这样做之 前难以预测置换、缺失或插入的确切效应时,本领域技术人员将认识 到,可通过常规筛选测定法包括在下述实验部分中用于监测FucT和 XylT的活性的测定法来评估效应。
变体多核苷酸和蛋白质还包括通过诱变和重组基因方法例如DM 改组产生的序列和蛋白质。通过这样的方法,可操作l个或多个不同 的FucT或XylT编码序列产生具有希望的性质的新的FucT或XylT蛋 白。通过该方法,从相关的序列多核苷酸的群体产生重组多核苷酸的 文库,所述相关的序列多核苷酸包含具有相当高的序列同一性和可进 行体外或体内同源重组的序列区域。例如,通过使用该方法,可在本 发明的FucT或XylT基因与其他已知的FucT或XylT基因之间分别对
编码目的结构域的序列基序进行改组,从而获得编码具有提高的目的性质的蛋白质的新基因。用于该DNA改组的策略在本领域内是已知的。 参见,例如,Stemmer ( 1994)A^〃. Sc/ 91:
10747-10751; St謹er (1994) 370: 389-391; Crameri等人
(1997) AWwre S/"ec力.15:436—438; Moore等人(1997) /. #0人 Wo/. 272:336—347; Zhang等人(1997)户roc. ^〃. Jca《Sc/ ^S^ 94:4504-4509; Crameri等人(1998) A^""re 391 : 288—291;和美国 专利5' 605,793及5, 837, 458。
可使用数学算法进行两个序列之间的序列比较以及百分数同一 性和百分数相似性的确定。在优选实施方案中,使用Needleman和 Wunsch (1970) /. A/o/. 48: 444-453的算法(该算法整合入
GCG软件包(可在www.accelrys.com上获得)中的GAP程序),使用 BLOSSUM62矩阵或PAM250矩阵以及16、 14、 12、 10、 8、 6或4的缺 口重量(gap weight )和1、2、3、4、5或6的长度重量(length weight ) 确定2个氨基酸序列之间的百分数同一性。在另一个优选实施方案中, 使用GCG软件包中的GAP程序,使用BL0SUM62评分矩阵(参见Hen i kof f 等人(1989)尸roc. y"/. JcacT. 89: 10915)以及40、 50、
60、 70或80的缺口重量和1、 2、 3、 4、 5或6长度重量确定2个核 苷酸序列之间的百分数同一性。特别优选成套参数(和如果实施者不确 定应当使用什么参数来确定分子是否在本发明的序列同 一性的限制内 时应当使用的参数)是使用具有60的缺口重量和3的长度重量的 BLOSUM62评分矩阵。
还可使用Meyers和Miller (1989) CABIOS 4: 11-17的算法(该 算法已整合入ALIGN程序(版本2. 0)),使用PAM120重量残基表、l2 的缺口长度罚分(gap length penalty )和4的缺口罚分(gap penalty ) 确定2个氨基酸或核苷酸序列之间的百分数同一性。
2个核苷酸分子密切相关的可选的标志是2个分子在严格条件下 相互杂交。严格条件是序列依赖性的且在不同的环境参数下是不同的。 通常,选择比特定的序列在确定的离子强度和PH下的热解链温度 (thermal melting point) CL)低大约5。 C至20。 C的严格条件。乙是50%的靶序列对完全匹配的探针杂交时的温度(在确定的离子强度 和pH)。可在例:ft口 Sambrook等人 (2001) #o/eci//ar C/oth'/^.' j Za6or"or/#a"w<s/ (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY)和Tijssen (1993) iy76rWz"/0/2肠7e/c ^c/d户r06es, Part I: Theory and Nucleic Acid Preparation (Laboratory Techniques in Biochemistry and Molecular Biology, Elsevier Science Ltd., NY, NY)中找到用于核酸杂交的条件和严格 性的计算。
为了本发明的目的,"严格条件"包括在其下,只有当杂交分子 与靶序列之间的错配低于25°/ 时才发生杂交的条件。"严格条件"可 被分成特定的用于更精确定义的严格性水平。因此,如此处所使用的, "轻度(moderate)严格性"条件是在其下具有大于25%的序列错配 的分子将不杂交的条件;"中度(medium)严格性,,的条件是在其下 超过15%的错配将不杂交的条件,以及"高度严格性"的条件是在其 下具有超过10%的错配的序列将不杂交的条件。"非常高的严格性" 的条件是在其下具有超过6%的错配的序列将不杂交的条件。
本发明的FucT和XylT多核苷酸可用作用于分离其他生物更特别 地其他植物种中的相应的同源序列的探针。通过该方式,可使用方法 例如PCR、杂交等基于它们对本发明的序列的同源性鉴定此类序列。 参见,例如,Sambrook等人(1989) #o/ecu/ar 67oi3//7f爿Zs60r"or/ 船/ ws7 (第2版,Cold Spring Harbor Laboratory Press, Plainview, New York)和Innis等人(1990),尸C"rofoco/s.. J to e to淑Ao^ 3/2";7;7//^"2'0;^ (Academic Press, New York)。 本发明包括基于 它们与本发明的完整的FucT或XylT多核苷酸(即,对于FucT ,SEQID N0S: 1和2;对于SEQ ID NO: 6的XylT同种型#1, SEQ ID N0S: 4和 5;和对于SEQ ID N0:21的XylT同种型#2, SEQ ID N0S: 19和20)
的序列同一性的分离的多核苷酸序列或其片段和变体。
在PCR方法中,可设计用于PCR反应的寡核苷酸引物,所述PCR 用于扩增来自从任何目的生物提取的cDNA或基因组DNA的相应DNA序列。已知的PCR的方法包括,但不限于,使用成对引物、嵌套引物、 单特异性引物、简并引物、基因特异性引物、载体特异性引物、部分 错配的引物等。用于设计PCR引物和PCR克隆的方法在本领域内是普 遍已知的,且公开于Sambrook等人(1989) "o"//7jv力
Zs6or"or/#a/2f/a/ (第2版,Cold Spring Harbor Laboratory Press, Plainview, New York)。也参见Innis等人,eds. (1990) 尸ro&co/s,.爿6Wt/e fo#ef/ o^y a/2(/J/7/7//c"/0/2s (Academic Press, New York); Innis 和 Gelfand, eds.(1995) 5Yr"eg/es (Academic Press, New York); 以及Innis和Gelfand, eds. (1999) # 2/2i/fl7 (Academic Press, New York)。 在杂交方法中,所有或部分已知的核苷酸序列可用作探针,所述 探针与存在于来自另一个目的生物的克隆的基因组DNA片段或cDNA
片段的群体(即,cDNA或基因组文库)中的其他相应多核苷酸选择性杂 交。所谓的杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或 其他寡核苷酸,和可用可检测基团例如32P或任何其他可检测标记进行 标记。可通过标记基于目的核苷酸序列例如本发明的FucT或XylT多 核苷酸的合成的寡核苷酸来产生用于杂交的探针。另外可使用基于已
简并引物。用于cDNA和基因组文库的构建以及用于制备杂交探针的方 法在本领域内通常是已知的,和公开于Sambrook等人(l989) #o/ecw/ar C7o/2//7f J "60r"or/(第2版,Cold Spring Harbor Laboratory Press, Plainview, New York), 通过引用合并 入本文。
例如,全部或部分明确已知的FucT或XylT多核苷酸序列可用作 与其他FucT或XylT核苷酸和信使RNA选择性杂交的探针。为获得在
不同条件下的特异性杂交,此类探针包括作为独特的且优选长度为至 少大约10个核苷酸,更优地长度为至少大约20个核苷酸的序列。该 技术可用于分离来自希望的生物的其他相应的FucT或XylT核苷酸序 列或用作确定FucT或XylT编码序列在生物中存在的诊断测定。杂交
62技术包括涂板的DNA文库的杂交篩选(噬菌斑或集落;参见,例如, Innis等人,eds. (1990)澄尸r由coh..爿6W(/e fo i4/7/772'c"/o/7S (Academic Press, New York))。
因此,除了天然的FucT和XylT多核苷酸和其片段及变体外,本 发明的分离的多核苷酸还包括同源DNA序列或其变体,所述同源DNA 序列是通过与获自本发明的FucT或XylT多核苷酸的完整的或部分序 列或其变体杂交从其他生物鉴定和分离的DNA序列。可根据本领域内
交的条件。例如,可在本说明书中上面指出^轻度、中度、高度或非 常高的严格性的不同条件下进行此类序列的杂交。
发明方法
技术领域
本发明涉及用于改变高等植物,特别是用作生产生重组蛋白(特 别是制药目的的重組哺乳动物蛋白)的宿主的高等植物中的蛋白质糖 基化模式的方法。方法用于产生高等植物,所述高等植物能够产生具 有与哺乳动物中发现的^糖基化模式更密切相似的W糖基化模式的重
组蛋白。本发明的组合物包括被稳定地转化,从而包含它们的内源的 (即,同源的)和重组产生的异源性蛋白质的改变的W糖基化模式的 高等植物。在一些实施方案中,高等植物是产生抗哺乳动物蛋白的单 克隆抗体(mAb)的转基因植物,所述单克隆抗体与对照植物中产生的 mAb相比具有增强的ADCC活性,所述对照植物还未具有经改变从而减 少ocl, 3-岩藻糖残基至从其产生的同源性和异源性糖蛋白的^聚糖的 植物特异性附着的糖基化机构(machinery)。
本发明的方法靶向对一个或两个在高等植物中参与复杂糖蛋白 的产生的酶的压制(即,抑制)。特别有益的是对岩藻糖基转移酶或 其的一个或多个同种型的抑制,或对木糖基转移酶或其一个或多个同 种型的抑制,或对这两种蛋白两者和其一个或多个同种型的抑制。要 认识到可短暂进行对岩藻糖基转移酶和/或木糖基转移酶和其一个或 多个同种型的抑制。可选择地,通过稳定地抑制岩藻糖基转移酶和/或木糖基转移酶的表达,可能产生转基因高等植物,所述转基因高等 植物代代(无性或有性的世代)具有产生具有与哺乳动物更特别地人
中发现的N糖基化模式更密切相似的^糖基化模式的糖蛋白的能力。 这有利地提供了具有减少的植物P 1, 2-连接的木糖残基和/或a 1, 3-连接的岩藻糖残基至糖蛋白的iV聚糖的附着的重组哺乳动物糖蛋白的 产生。
可使用本领域内已知的任何方法在植物例如双子叶或单子叶植 物例如浮萍植物中进行这两种蛋白质的一种或有利地两种的表达的抑 制。通过该方式,从而将包含FucT、 XylT的抑制性序列或其组合的多 核苷酸导入目的宿主细胞。对于瞬时表达,可以通过化学合成或以体 外产生的小干扰RNA (siRNA)或micro RNA (miRM)的形式产生FucT 或XylT抑制性序列,所述抑制性序列,当导入宿主细胞时,将通过沉 默这些乾基因产物的表达来直接(尽管短暂地)抑制FucT、 XylT或其 组合。
可选择地,如本说明书中上面所指出的,希望稳定地抑制FucT、 XylT或其组合的表达。因此,在一些实施方案中,通过用表达盒转化 植物细胞来减少或消除本发明的FucT或XylT多肽的活性,所述表达 盒表达抑制FucT或XylT或两者的表达的多核苷酸。多核苷酸可通过 阻止FucT或XylT信使RNA的转录或翻译直接地,或通过编码抑制编 码FucT或XylT或两者的基因的转录或翻译的多肽来间接地抑制FucT 或XylT或两者的表达。用于抑制或消除植物中基因的表达在本领域内 是熟知的,且任何这样的方法可用于本发明以抑制FucT或XylT或两 者的表达。
因此,在一些实施方案中,可通过向植物中导入核苷酸构建体例 如包含编码抑制性核苷酸分子的序列的表达盒来抑制FucT和/或XylT 蛋白的表达,所述抑制性核苷酸分子设计用于沉默目的FucT和/或 XylT基基因产物的表达,所述抑制性核苷酸分子是例如有义方向的 RNA、反义RNA、双链RNA (dsRNA)、发夹结构RM (hpRNA)、包含内 含子的hpRM、催化RNA、 miRNA等。在其他实施方案中,核苷酸构建体,例如表达盒,可包含编码mRNA的序列,所述mRNA的翻译产生抑 制目的FucT和/或XylT基因产物的表达或功能的目的多肽。当核苷酸 构建体包含编码目的多肽的抑制性核苷酸分子或mRNA的序列时,将序 列与在植物中驱动表达的启动子有效连接以致可表达编码的抑制性核 苷酸分子或mRNA 。
根据本发明,如果FucT或XylT的蛋白质水平在统计学上低于植 物(所述植物未被遗传改变或诱变以抑制该FucT或XylT的表达)中 相同的FucT或XylT的水平,则FucT或XylT基因的表达被抑制。在 本发明的特定的实施方案中,本发明的改变的植物中的FucT或XylT 或两者的蛋白质水平是植物(所述植物是未突变的或未经遗传改变以 抑制该FucT或XylT的表达、或FucT或XylT两者的表达的植物)中 的相同FucT或XylT的蛋白质水平的低于95°/。、低于90°/。、低于80%、 低于70°/ 、低于60%、低于50%、低于40%、低于30%、低于20%、低于 10%或低于5%。可以例如通过测定在植物细胞或植物中表达的FucT或 XylT的水平直接地,或通过在表型水平上观察转基因植物中的效应, 即通过转基因植物分析(观察为植物中P 1, 2-木糖和/或oc 1, 3-岩藻糖 残基至糖蛋白的N聚糖的附着的减少或消除)来间接地测量FucT或 XylT或两者的表达水平。
在本发明的其他实施方案中,通过用包含编码抑制FucT或XylT
FucT或XylT的活性。如果FucT或XylT的活性在统计学上低于植物 (所述植物未被遗传改变以抑制该FucT或XylT的活性)中相同的 FucT或XylT的活性,则根据本发明FucT或XylT的活性被抑制。在 本发明的特定实施方案中,本发明的改变的植物中的FucT或XylT的 活性是植物(所述植物未经遗传改变以抑制该FucT或XylT的表达) 中的相同的FucT或XylT的活性的低于95%、低于90°/。、低于80%、低 于70%、低于60°/。、低于50%、低于40°/。、低于30%、低于20%、低于 10%或低于5%。当其不能通过本说明书中其他地方描述的测定方法检 测时,FucT或XylT的活性被"消除"。在其他实施方案中,可通过破坏编码FucT或XylT的基因或这两 个基因来减少或消除FucT或XylT或两者的活性。本发明包括诱变的 植物,特别是作为浮萍科的成员的植物,所述植物在FucT或XylT基 因或这两个基因中具有突变,其中该突变减少FucT和/或XylT基因的 表达或抑制编码的FucT和/或XylT的活性。
本发明的方法可包括本领域内已知的用于减少或消除高等植物 的细胞中的FucT和/或XylT的活性或水平的任何方法或机制,其包括 但不限于反义抑制、有义抑制、RNA干扰、定向缺失或突变、显性负 性策略等。因此,此处公开的方法和组合物不限定于作用的任何机制 或理论,其包括其中在目的高等植物的细胞中抑制FucT和/或XylT 的表达或功能,从而改变植物中产生的内源性和异源性糖蛋白的N糖
基化模式的任何方法。
例如,在一些实施方案中,以有义方向表达FucT抑制性序列或
XylT抑制性序列(或两者),其中有义方向的转录物引起这两个酶中 的一个或两个酶的表达的共抑制。可选择地,可以以反义方向表达 FucT和/或XylT抑制性序列(例如,序列的全长序列、截短的序列、 片段、其组合等),从而通过反义机制抑制内源性FucT和/或XIyT 的表达或功能。
在其他实施方案中,以发夹结构RNA表达FucT和/或XylT抑制性序 列,所述发夹结构RNA包含有义序列和反义序列。在包含发夹结构的实 施方案中,环结构可包含任何合适的核苷酸序列,包括例如要抑制的 基因的5'非翻译和/或翻译区,例如SEQ ID NO: l或2的FucT多核苷酸 的5' UTR和/或翻译区,或SEQ ID N0:4、 5、 19或20的XylT多核苷酸 的5' UTR和/或翻译区等。在一些实施方案中,表达为发夹结构的FucT 或XylT抑制性序列由FucT或XylT核苷酸序列的倒转区域编码。在其他 实施方案中,FucT和/或XylT抑制序列表达为双链RNA,其中一个FucT 和/或XylT抑制性序列以有义方向表达,另一个互补序列以反义方向表 达。包含FucT核苷酸序列、XylT核苷酸序列或其组合的双链RNA、发夹 结构和其组合可通过RM干扰、共抑制、反义机制、其任何组合,或通过引起FucT和/或XylT的表达或功能的抑制的任何其他机制来起作用。 因此,许多方法可用于减少或消除FucT或XylT或这两种蛋白两 者以及其任何同种型的活性。"同种型"意指目的FucT或XylT蛋白 的天然发生的蛋白质变体,其中变体由不同的基因编码。通常,特定 的目的FucT或XylT蛋白的同种型由具有与编码目的FucT或XylT蛋 白的核苷酸序列至少90%的序列同一性的核苷酸序列编码。可使用多 种方法减少或消除单个植物FucT或XylT和其同种型的活性。下面提 供减少或消除植物FucT或XylT的活性的方法的非限定性实例。
^^多裙芬^W才法
在本发明的一些实施方案中,用能够表达抑制FucT或XylT或两 者的表达的多核苷酸的表达盒转化植物细胞。此处所使用的术语"表 达"是指基因产物的生物合成,包括基因产物的翻译和/或转录。例如, 为了本发明的目的,能够表达抑制FucT或XylT的至少一种或两者的 表达的多核苷酸的表达盒是能够产生抑制FucT或XylT的至少一种或 两者的转录和/或翻译的RNA分子的表达盒。从DNA分子"表达"或"产 生,,蛋白质或多肽是指转录和翻译编码序列以产生蛋白质或多肽,而 从RNA分子"表达"或"产生"蛋白质或多肽是指翻译RNA编码序列
以产生蛋白质或多肽。
下面给出抑制FucT或XylT或两者的表达的多核苷酸的实例。
才乂押浙/兵押賴
在本发明的一些实施方案中,可通过有义抑制或共抑制获得FucT 或XylT或两者的表达的抑制。关于抑制,设计表达盒以以"有义"方 面表达相应于编码FucT或XylT或两者的信使RM的全部或部分RNA 分子。RNA分子的过表达可导致天然基因的减少的表达。因此,筛选
大抑制的系。
编妈
67分、FucT或XylT转录物的5'和/或3'非翻译区的全部或部分、或编 码FucT或XylT的转录物的编码序列和非翻译区的全部或部分。在其 中多核苷酸包含FucT或XylT蛋白的编码区的全部或部分的一些实施 方案中,设计表达盒以消除多核苷酸的起始密码子以使蛋白质产物不 被转录。
共抑制可用于抑制植物基因的表达,从而产生具有不可检测的由 这些基因编码的蛋白质的蛋白质水平的植物。参见,例如,Broin等 人(2002) Plant Cell 14: 1417-1432。共抑制还可用一抑制相同植 物中多个蛋白质的表达。参见,例如,美国专利5, 942,657。用于使 用共抑制抑制植物中内源基因的表达的方法描述于Flavell等人 (1994) Proc. Natl. Acad. Sci USA 91:3490-3496; Jorgensen等人 (1996) Plant Mol. Biol. 31:957- 973; Johansen和Carrington (2001) Plant Physiol. 126:930-938; Broin等人(2002) Plant Cell 14: 1417-1432; Stoutjesdijk等人(2002) Plant Physiol. 129: 1723-1731; Yu等人(2003) Phytochemistry 63: 753-763;和美国专 利5, 034, 323、 5, 283, 184和5, 942, 657;其各自通过引用包含和本文。 可通过将在表达盒中在有义序列的3'和多腺苷酸化信号的5/位置包 含poly-dT区来增加共抑制的功效。参见,美国专利公开20020048814, 通过引用纳入本文。通常,这样的核苷酸序列具有与内源基因的转录 物的序列的充分的序列同一性,优选大于大约65%的序列同一性,更 优选大于大约85。/。的序列同一生,最优选大于大约95%的序列同一性。 参见,美国专利5, 283,184和5, 034, 323;通过引用纳入本文。
在本发明的一些实施方案中,可通过反义抑制来获得对FucT或 XylT或两者的表达的抑制。关于反义抑制,表达盒经设计用于表达与 编码FucT或XylT的信使RNA的全部或部分互补的RNA分子。反义RNA 分子的过表达可导致减少的天然基因的表达。因此,筛选用反义抑制 共表达盒转化的多个植物系以鉴定显示FucT或XylT表达的最大抑制的系
补序列的全部或部分、FucT或XylT转录物的5'和/或3'非翻译区的 互补序列的全部或部分、或编码FucT或XylT的转录物的编码序列和 非翻译区的全部或部分。此外,反义多核苷酸对于靶序列可以是完全 互补的(即与耙序列的互补序列100%的同一性)或部分互补的(即与 靶序列的互补序列小于100%的同一性)。反义抑制可用于在相同的植 物中抑制多种蛋白质的表达。参见,例如,美国专利5, 942, 657。此 外,反义核苷酸的部分可用于中断乾基因的表达。 一般地,可使用至 少50个核苷酸、IOO个核苷酸、200个核苷酸、300、 400、 450、 500、 550或更多个核苷酸的序列。使用反义抑制抑制内源基因在植物中的 表达的方法描述于例如Liu等人 (2002) Plant Physiol. 129: 1732-1743和美国专利5, 759,829和5, 942, 657,其各自通过引用合 并入本文。可通过在表达盒中在反义序列的3'和多腺苷酸化信号的5' 的位置包含poly-dT来增加反义抑制的功效。参见,美国专利申请号 20020048814,通过引用纳入本文。
双链細f挽
在本发明的一些实施方案中,可通过双链RNA (dsRNA)千扰获得对 FucT或XylT或两者的表达的抑制。关于dsRNA干扰,在相同的细胞 中表达有义RNA分子如上述用于共抑制的RM分子和与有交RNA分子 完全或部分互补的反义RNA分子,从而导致相应的内源信使RNA的表 达的抑制。
反义分子的表达。可选择地,可将分开的表达盒用于有义和反义序列。 然后篩选用dsRNA干扰表达盒转化的多个植物系以鉴定显示对FucT 或XylT的表达最大抑制的系。使用dsRNA千扰抑制内源植物基因的表 达的方法描述于Waterhouse等人(1998)Ais〃 Sc/ 95: 13959-1 3964, Liu等人(2002)户/aW 129: 1732-1743和W0 99/49029、 WO 99/53050、 W099/61631和WO 00/49035,其各自 通过引用纳入本文。
发关错询MX "f挽'和逸含力^f的发关錄^ MX f挽' 在本发明的一些实施方案中,可通过发夹RNA (hpRNA)干扰或包 含内子的发夹MA (ihpRNA)千扰获得对FucT或XylT或两者的表达的 抑制。这些方法在抑制内源基因的表达上高度有效。参见,Waterhouse 和Helliwell (2003) Aer. Ce/7e,. 4:29-38,通过引用纳入本文。
关于hpRNA干扰,设计表达盒以使之表达与其本身杂交从而形成 发夹结构的RNA分子,所夹结构包含单链环区域和碱基对茎。碱基对 茎区域包含相应于编码其表达要被抑制的基因的内源信使RNA的全部 或部分的有义序列和与有义序列完全或部分互补的反义序列。因此,
分子的碱基对茎区域通常确定RNA干扰的特异性。hpRNA分子在抑制 内源基因的表达上高度有效,它们诱导的RNA干扰通过植物的后代得 到遗传。参考,例如,Chuang和Meyerowitz (2000)iVa".爿cacT. Sc/ 〃W 97: 4985-4990; Stout jesdijk等人(2002)户hW户力j^/o人 129: 1723-1731;和Waterhouse和Helliwell (2003)脂.胁. Gei7eL 4:29-38。寸吏用Methods for using hpRM干扰抑制或沉默基 因的表达的方法描述于例如Chuang和Meyerowitz (2000) /Yoc. Wa〃.
5W.咖97: 4985-4990; Stout jesdijk等人(2002) Plant Physiol. 129: 1723-1731; Waterhouse和Hel1iwel1 (2003) M她 4: 29-38; Pandolfini等人"M7 "/Wec力"o7o^r 3: 7,以及美 国专利申请20030175965;其各自通过引用納入本文。由Panstruga 等人(2003) Mol. Biol. Rep. 30: 135-140 (通过引用纳入本文) 描述了测定hpRM构建体在体内沉默基因表达的功效的瞬时测定。
关于ihpRNA,干扰分子具有与,hpRNA相同的一般结构,但RM 分子额外地包含能够在其中表达ihpRNA的细胞中被剪接的内含子。内 含子的使用合使发夹结构RNA分子中的环的大小在剪接后变得最小,这增加了干扰的功效。参见,例如,Smith等人(2000) iVa"re 407: 319-320。事实上,通过使用ihpRNA介导的干扰,Smith等人显 示了对内源基因的100%的抑制。使用ihpMA干扰抑制内源植物基因 的表达的方法描述于例如Smith等人(2000) ya&re 407:319-320; Wesley等人(2001)尸/a/ " 27:581-590; Wang和Waterhouse (2001) Curr. 尸/a/]t 5: 146—150; Waterhouse和Helliwell
(2003) 紋4:29-38; Hel 1 iwel 1和Waterhouse (2003) Methods 30:289-295,以及美国专利申请20030180945,其各自通过 引用纳入本文。
还可设计用于hpRNA干扰的表达盒以使有义和反义序列不相应于 内源RM。在该实施方案中,有义和反义序列侧翼连接包含相应于靶 基因的内源信使RNA的全部或部分的核苷酸序列的环序列。因此,正 是环区域确定了 RNA干扰的特异性。参见,例如WO 02/00904,通过 引用纳入本文。
可通过使用hpRNA构建体实现转录基因沉默(transcriptional gene silencing) (TGS),在所述构建体中,发夹的反转重复顺序与被 沉默的基因的启动子区域共有序列同一性。hpRNA至可与同源启动子 区域相互作用的短RM的加工可触发降解或甲基化,从而导致沉默 (Aufsatz等人(2002)户WS " (Suppl. 4): 16499—16506; Mette 等人(2000)細0/ 19 (19): 5194-5201)。
设计用于表达形成发夹结构的RNA分子的表达盒此处称为RNAi 表达盒。在一些实施方案中,按照图28中概述的策略设计RNAi表达 盒。在此类实施方案中,可设计RNAi表达盒以抑制单个的FucT和XylT 基因的表达(即,各表达盒提供单个基因的基因敲除),或可设计RNAi 表达盒以抑制FucT和XylT基因两者的表达(即,单个RNAi表达盒表 达提供对这两种基因两者的表达的抑制的抑制性分子)。当RMi表达 盒抑制FucT和XylT基因两者的表达时,其在此处称为"嵌合"RMi 表达盒。可设计单个基因和嵌合RNAi表达盒以表达更大的hpRNA结构 或,可选择地,小hpRNA结构,如本说明书中下面所指出的。因此,在一些实施方案中,设计RNAi表达盒以表达更大的hpRNA 结构,所述hpRNA结构具有与靼mRNA转录物充分的同源性,从而提供 FucT和XylT基因中的一个或两者的转录后基因沉默。关于更大的hp RNA结构,设计RNAi表达盒的有义链以使以5'至3'方向包含下列有 效连接的元件目的启动子、分别包含FucT或XylT的有义链链的大 约500至大约800个核苷酸(nt)的FucT或XylT基因序列的正向片段、 包含大约本说明书中下面指出的任何序列的100至大约700 nt的间隔 区序列以及XylT或FucT基因序列的反向片段,其中反向片段包含与 各自(即FucT或XylT)正向片段互补的反义序列。因此,例如,如果 正向片段由核苷酸"...acttg..."表示,那么相应的反向片段由核苷 酸"...caagt..."表示,这样的RNAi表达盒的有义链可包含下列序 歹寸 '5,—. acttg. nimiL , caagt.…一3,, 其中 "imnii "表示间 隔区序列。
要认识到,正向片段可包含与耙FucT或XylT基因序列的有义链 的相应部分100%同一的核苷酸序列,或可选择地,可包含与待沉默的 耙FucT或XylT基因的有义链的相应部分共有至少90%、至少95%或至 少98。/。的序列同一性的序列。通过相似的方式,要理解反向片段不必 与正向片段的互补序列共有100%的序列同一性;相反,其必须足够长 且对正向片段序列具有足够的互补性,这样当表达抑制性RNA分子时,
碱基对茎(即,双链部分)。"足够的长度"意指为正向片段的长度 的至少10%、至少15%、至少20%、至少30%、至少40%,更优选正向 片段的长度的至少50%、至少75%、至少90%或至少95%的长度。"足 够的互补性"意指反向片段的序列与将与反向片段杂交从而形成hp RNA结构的碱基对茎的正向片段的该部分的互补序列共有至少至少 90°/ 、至少95%、至少98%的序列同一性。因此,在一些实施方案中, 反向片段是正向片段的互补序列(即,反义版本)。
在设计这样的RMi表达盒中,选择正向片段的长度、间隔区序约650至大约2500 nt、大约750至大约2500 nt、大约750至大约 2400 nt、大约1000至大约2400 nt、大约1200至大约2300 nt、大 约1250至大约2100nt或大约1500至大约1800。在一些实施方案中, 表达的发夹结构构建体的组合长度为大约650 nt、大约700 nt、大约 750 nt、大约800 nt、大约850 nt、大约900 nt、大约950 nt、大 约1000 nt、大约1050 nt、大约1100 nt、大约1150 nt、大约1200 nt、大约1250 nt、大约1300 nt、大约1350 nt、大约1400 nt、大 约1450 nt、大约1500 nt、大约1550 nt、大约1600 nt、大约1650 nt、大约1700 nt、大约1750 nt、大约1800 nt、大约1850 nt、大 约1900 nt、大约1950 nt、大约2000 nt、大约2050 nt、大约2100 nt、大约2150nt、大约2200 nt、大约2250 nt、大约2300 nt或大 约650 nt和大约2300 nt之间的任何长度。
在一些实施方案中,正向片段包含大约500至大约800 nt,例如, 500、 525、 550、 575、 600、 625、 650、 675、 700、 725、 750、 775或 800 nt的FucT或XylT的有义链,例如SEQ ID NO: l或2 (FucT)或 SEQ IDN0:4、 5、 19或20 (XylT)中所示的有义链;间隔区序列包含 大约IOO至大约700 nt,例如,100、 125、 150、 175、 200、 225、 250、 275、 300、 325、 350、 375、 400、 425、 450、 475、 500、 525、 550、 575、 600、 625、 650、 675或700 nt的下面指出的任何序列,反向片 段包含正向片段序列的反义链,或具有足够长度和对于正向片段序列 具有足够的互补性的序列。
间隔区序列可以是对靶基因即FucT或Xy 1T没有足够的同源性且 对其本身没有足够同源性的任何序列,这样相应于间隔区区域的表达 的抑制性RNA分子的部分就不能自我杂交从而形成了发夹RNA结构的 环。在一些实施方案中,间隔区序列包含内含子,从而表达的抑制性 RNA分子形成本说明书中上面提及的ihpRNA 。在其他实施方案中,间 隔区序列包含待沉默的FucT或XylT基因的有义链的部分,例如SEQ ID NO: l或2 (FucT)或SEQ ID NO: 4、 5、 19或20 (XylT)中所示的有义 链的部分,特别是紧接正向片段序列下游的有义链的部分。
73有效连接的启动子可以是提供目的植物中的有交连接的抑制性 多核苷酸表达的任何目的启动子,包括本说明书中下面公开的任一个 启动子。调控区可包含增强抑制性多核苷酸的表达的额外的调控元件,
包括,但不限于,本说明书中下面讨论的5'前导序列和5'前导序列加 植物内含子。
在一个实施方案中,设计RNAi表达盒以使之抑制SEQ ID NO: 3 的FucT多肽、SEQ ID NO: 3的FucT多肽的生物活性变体或由序列(所 述序列具有与SEQ ID NO: 1或SEQ ID NO: 2的序列至少75%的序列同 一性,例如与SEQ ID NO: 1或SEQ ID NO: 2的序列至少75%、至少 80%、至少85%、至少90%或至少95%的序列同一性)编码的FucT多肽 的表达。通过该方式,设计RNAi表达盒的有义链以使之以5,至3, 的方向包含下列有效连接的元件目的启动子;FucT基因的正向片段, 其中正向片段包含SEQ ID NO: 1的nt 255-985;包含大约100至大 约700 nt的上述任何序列的间隔区序列;和FucT基因序列的反向片 段,其中反向片段包含的SEQ ID NO: 1的nt 255-985的互补序列(即, 反义版本)。在一个这样的实施方案中,间隔区序列由SEQ ID NO: 1 的nt 986-1444表示,相应于hpRNA结构的编码序列的RNAi表达盒的 有义链的该部分的总长度为1918 nt。用包含该RNAi表达盒的核苷酸 构建体例如图8中显示的载体稳定转化植物有效地抑制了 FucT在其中 表达hpRNA结构的植物的植物细胞中的表达。在一个实施方案中,目 的植物是浮萍家族的成员,例如浮萍科的成员,且植物已用图8中显 示的载体稳定地转化。
在本发明的其他实施方案中,RNAi表达盒设计用于抑制SEQ ID NO:
6或SEQ ID NO: 21的XylT多肽、SEQ ID NO: 6或SEQ ID NO: 21的XylT 多肽的生物活性变体或由序列(所述序列具有与SEQ ID NO: 4、 SEQ ID NO: 5、 SEQ ID NO: 19或SEQ ID NO: 20的序列至少75%的序列同一 性,例如与SEQ ID NO: 4、 SEQ ID NO: 5、 SEQ ID NO: 19或SEQ ID NO: 20的序列至少75%、至少80%、至少85%、至少90%或至少95%的序 列同一性)编码的FucT多肽的表达。通过该方式,设计RNAi表达盒的有义链以使之以5,至3,的方向包含下列有效连接的元件目的启 动子;XylT基因序列的正向片段,其中正向片段包含SEQ ID NO: 4 的nt 318-1052;包含大约100至大约700 nt的上述任何序列的间隔 区序列;和XylT基因序列的反向片段,其中反向片段包含SEQ IDNO: 4的nt 318-1052的互补序列(即,反义版本)。在一个这样的实施 方案中,间隔区序列由SEQ ID NO: 4的nt 1053-1599表示,相应于 hpRNA结构的编码序列的RNAi表达盒的有义链的该部分的总长度为 2015 nt。用包含该RNAi表达盒的核苷酸构建体例如图9中显示的载
物细胞中的表达。在一个实施方案中,目的植物是浮萍家族的成员, 例如浮萍科的成员,且植物已用图9中显示的载体稳定地转化。
在其他实施方案中,设计RNAi表达盒的有义链以使之以5,至3, 的方向包含下列有效连接的元件目的启动子;XylT基因序列的正向 片段,其中正向片段包含SEQ ID NO: 19的nt 1-734;包含大约100 至大约700 nt的上述任何序列的间隔区序列;和XylT基因序列的反 向片段,其中反向片段包含SEQ IDNO: 19的nt 1-734的互补序列(即, 反义版本)。在一个这样的实施方案中,间隔区序列由SEQ IDNO: 19 的nt 735-1282表示,相应于hpRNA结构的编码序列的RNAi表达盒的 有义链的该部分的总长度为2015 nt。用包含该RNAi表达盒的核苷酸 构建体例如图9中显示的载体稳定转化植物,有效地抑制了 FucT在其 中表达hpRNA结构的植物的植物细胞中的表达。在一个实施方案中, 目的植物是浮萍家族的成员,例如浮萍科的成员,且植物已用图9中 显示的载体稳定地转化。
在其他实施方案中,可设计更大的hpRNA结构,以使反义和有义 序列处于相对的方向。通过该方式,设计RNAi表达盒的有义链以使之 以5,至3,的方向包含下列有效连接的元件目的启动子;反义方向 的全长FucT或XylT基因序列,和以有义方向包含序列的3'半部分的 FucT或XylT基因序列的正向片段(参见图28,设计1)。在该类型的 构建体中,序列的3'半部分形成了 hpRNA的碱基对茎(即,双链),序列的5'半部分用作间隔区序列。不受任何理论或机制的束縳,选择 FucT或XylT序列的3'区域以形成该构建体的hpRNA的双链区域,因 为与5'区域相比,该区域在不同植物物种之间是相对保守的。
在一个这样的实施方案中,设计RNAi表达盒经以使之抑制SEQ ID N0:3的FucT多肽、SEQ ID NO: 3的FucT多肽的生物活性变体或由序 列(所述序列具有与SEQ ID NO: 1或SEQ ID NO: 2的序列至少754/。的 序列同一性,例如与SEQ ID NO: 1或SEQ ID NO: 2的序列至少75%、 至少80%、至少85%、至少90%或至少95%的序列同一性)编码的FucT 多肽的表达。通过该方式,设计RNAi表达盒的有义链以使之以5,至 3,的方向包含下列有效连接的元件目的启动子;反义方向的SEQID NO: 1的核苷酸1-1865和有义方向的SEQ ID NO: 1的核苷酸950-1865。用包含该RMi表达盒的核苷酸构建体稳定转化植物,有效地抑 制了 FucT在其中表达hpRNA结构的植物的植物细胞中的表达。在一个 实施方案中,目的植物是浮萍家族的成员,例如浮萍科的成员。
在另一个实施方案中,设计RNAi表达盒经以使之抑制SEQ ID NO: 6或SEQ ID NO: 21的XylT多肽、SEQ ID NO: 6或SEQ ID NO: 21 的XylT多肽的生物活性变体或由序列(所述序列具有与SEQ ID NO: 4、 SEQ ID NO: 5、 SEQ ID NO: 19或SEQ ID NO: 20的序列至少75%的序 列同一性,例如与SEQ ID NO: 5、 SEQ ID NO: 19或SEQ ID NO: 20的 序列至少75%、至少80%、至少85%、至少90%或至少95°/。的序列同一 性)编码的XylT多肽的表达。通过该方式,设计RNAi表达盒的有义 链以使之以5,至3,的方向包含下列有效连接的元件目的启动子; 以反义方向排列的SEQ ID NO: 4的核苷酸1-1860和以有义方向排列 的SEQ ID NO: 4的核苷酸950-1860。用包含该RNAi表达盒的核苷酸 构建体稳定转化植物,有效地抑制了 XylT在其中表达hpRM结构的植 物的植物细胞中的表达。在一个实施方案中,目的植物是浮萍家族的 成员,例如浮萍科的成员。
在另一个实施方案中,设计RMi表达盒的有义链以使之以5, 至3,的方向包含下列有效连接的元件目的启动子;以反义方向排列的SEQ ID NO: 19的核苷酸1-1282和以有义方向排列的SEQ ID NO: 19 的核苷酸652-1282。用包含该RNAi表达盒的核苷酸构建体稳定转化 植物,有效地抑制了 XylT在其中表达hpRNA结构的植物的植物细胞中 的表达。在一个实施方案中,目的植物是浮萍家族的成员,例如浮萍 科的成员。
当希望同时抑制FucT和XylT蛋白的表达时,可通过例如在单个 转化载体(例如与图11中显示的载体相似的载体)内装配这些单基因 RNAi表达盒来将这些单基因RNAi表达盒以单个转化事件来导入植物, 或通过在两个转化载体(例如与图8和9中显示的载体相似的载体) 内装配这些单基因RNAi表达盒,使用本领域内已知的任何转化方法 (包括但不限于本书明书中其他地方公开的转化方法),以分开的共 转化事件方式导入植物。
可选择地,可通过向目的高等植物导入本说明书中上面提及的嵌 合RNAi表达盒来获得FucT和XylT蛋白两者的表达的抑制。因此,在本 发明的一些实施方案中,设计嵌合RNAi表达盒的有义链以使之以5,至 3,的方向包含下列有效连接的元件目的启动子;嵌合正向片段,其 包含FucT的有义链的大约500至大约650个核苷酸(nt)和XylT的有义链 的大约500至大约650个核苷酸(nt),其中FucT序列和XylT序列可以任 一顺序排列;包含大约100至大约700 nt的任何序列的间隔区序列;和 嵌合正向片段的反向片段,其中反向片段包含与各自嵌合正向片段互 补的反义序列。
关于单个RNAi表达盒,如之前所指出的,认识到,嵌合正向片段 内的单个FucT或XIyT序列可包含分别与耙FucT和XylT基因序列的有义 链的相应部分100%的同一性的核苷酸序列,或可选择地,可包含与待 沉默的靶FucT或XylT基因的有义链的相应部分共有至少90t至少95% 或至少98。/。的序列同一性的序列。同样,认识到,反向片段不必与嵌合 正向片段的互补序列共有100。/。的序列同一性;相反地,如此处上面所 定义的,其必须足够长且对嵌合正向片段序列具有足够的互补性,这 样当表达抑制性RNA分子时,相应于嵌合正向片段和反向片段的转录的
77区域将杂交以形成hpRNA结构的碱基对茎(即,双链部分)。在设计这 样的RNAi表达盒中,选择正向片段、间隔区序列和反向片段的长度以
大约1250至大约3300 nt、大约1300至大约3300 nt、大约1350至大约 3300 nt、大约1400至大约3300 nt、大约1450 nt至大约3300 nt、大 约1500至大约3300 nt、大约2200至大约3100 nt、大约2250至大约2800 nt、或大约2500至大约2700 nt。在一些实方案中,表达的发夹结构构 建体的组合长度为大约1200 nt、大约1250 nt、大约1300 nt、大约1350 nt、大约1400 nt、大约1450 nt、大约1500 nt、大约1800 nt、大约 2200 nt、大约2250 nt、大约2300 nt、大约2350 nt、大约2400 nt、 大约2450 nt、大约2500 nt、大约2550 nt、大约2600 nt、大约2650 nt、大约2700 nt、大约2750 nt、大约2800 nt、大约2850 nt、大约 2900 nt、大约2950 nt、大约300t) nt、大约305(J nt、大约3100 nt、 大约3150nt、大约3200 nt、大约3250 nt、大约3300 nt或为大约1200 nt至大约3300 nt之间的任何这样的长度。
在一些实施方案中,嵌合正向片段包含大约500至大约650 nt, 例如500、 525、 550、 575、 600、 625或650 nt的FucT的有义链, 例如SEQ ID NO: 1或2中所示的有义链,和大约500至大约650 nt, 例如,500、 525、 550、 575、 600、 625或650 nt的XylT的有义链, 例如SEQ ID NO: 4、 5、 19或20所示的有义链,其中可以以任一顺序 融合FucT和XylT序列;间隔区序列包含大约100至大约700 nt,例 如,100、 200、 225、 250、 275、 300、 325、 350、 375、 400、 425、 450、 475、 500、 525、 550、 575、 600、 625、 650、 675或700 nt的 任何目的序列;和反向序列片段包含嵌合正向片段序列的反义链,或 具有足够的长度和对嵌合正向片段序列足够的互补性的序列。
关于单基因RNAi表达盒,如上面所提及的,间隔区序列可以是 对耙基因即FucT或XylT不具足够的同源性和对其本身不具有足够的 同源性,这样相应间于隔子区域的表达的抑制性RNA分子的部分不能 自我杂交从而形成hpRNA结构的环。在一些实施方案中,间隔区序列包含内含子,从而表达的抑制性RNA分子形成了本说明书中上面提及 的ihpRNA。在其他实施方案中,间隔区序列包含待沉默的FucT或XylT 基因的有义链的部分,例如SEQIDNO: l或2 (FucT)或SEQ ID N0: 4、 5、 19或20 (XylT)所示的有义链的部分。在一个实施方案中,嵌合正 向片段包含以该顺序融合的FucT和XylT序列,间隔区序列包含正好 处于嵌合正向片段内包含的XylT序列下游的XylT有义链的部分。在 另一个实施方案中,嵌合正向片段包含以该顺序融合的XylT和FucT 序列,间隔区序列包含正好处于嵌合正向片段内包含的FucT序列下 游的FucT有义链的部分。
在一些实施方案中,设计嵌合RMi表达盒以抑制SEQ ID NO: 3 的FucT多肽、SEQ ID NO: 3的FucT多肽的生物活性变体或由序列(所 述序列具有与SEQ ID NO: 1或SEQ ID N0:2的序列至少75%的序列同 一性,例如与SEQ ID NO: 1或SEQ ID NO: 2的序列至少75%、至少 80%、至少85%、至少90°/。或至少95%的序列同一性)编码的FucT多 肽的表达,和抑制SEQ ID NO: 6或SEQ ID NO: 21的XylT多肽、SEQ ID NO: 6或SEQ ID NO: 21的XyIT多肽的生物活性变体或由序列(所述序 列具有与SEQ ID NO: 4、 SEQ ID NO: 5、 SEQ ID NO: 19或SEQ ID NO: 20 的序列至少75%的序列同一性,例如与SEQ ID NO: 4、 SEQ ID NO: 5、 SEQ ID NO: 19或SBQ ID NO: 20的序列至少75%、至少80%、至少85%、 至少90°/ 或至少95%的序列同一性)编码的XylT多肽的表达。对于这 些实施方案中的一些实施方案,选择嵌合正向片段内的FucT序列以使 其相应于SEQ ID NO: 1或SEQ ID NO: 2 nt 700至nt 1400,和/或 选择嵌合正向片段内的XylT序列以使其相应于SEQ ID NO: 4或SEQ ID NO: 5的nt 700至nt 1400,或SEQ ID NO: 19或20的nt 383至1083。 不受理论的束缚,据认为该区域(特别是对于FucT)在不同植物种类 中是相对保守的,从而是潜在的良好的靶。
在另一个实施方案中,设计嵌合RNAi表达盒的有义链以使之以 5'至3'的方向包含下列有效连接的元件目的启动子、包含SEQ ID NO: 1 (FucT序列)的nt 254-855和SEQIDNO:4 (XIyT序列)的nt 318-943
7的嵌合正向片段;包含大约100至大约700 nt的上面提及的任《可序 列的间隔区序列;和包含嵌合正向片段的互补序列(即,反义版本) 即包含SEQ ID NO: 4的nt 318-943的互补序列和SEQ ID NO: 1的nt 254-855的互补序列的反向片段。在特定的实施方案中,该嵌合RNAi 表达盒中的间隔区序列由SEQ ID N0:4的nt 944-1443表示,相应于 hpRNA结构的编码序列的RMi表达盒的有义链的该部分的总长度是 2956 nt。
在另一个这样的实施方案中,设计嵌合RNAi表达盒的有义链以 使之以5'至3'的方向包含下列有效连接的元件目的启动子、包含 SEQ ID NO: 4 (XIyT序列)的nt 318-943和SEQ ID NO: 1 (FucT序 列)的nt 254-855的嵌合正向片段;包含大约100至大约700 nt的 上面提及的任何序列的间隔区序列;和包含嵌合正向片段的互补序列 (即,反义版本)即包含SEQ ID N0:1的nt 254-855的互补序列和 SEQ ID NO: 4的nt 318-943的互补序列的反向片段。在特定的实施 方案中,该嵌合RNAi表达盒中的间隔区序列由SEQ ID N0:1的nt 856-1355表示,相应于hpRM结构的编码序列的RNAi表达盒的有义 链的该部分的总长度是2956 nt。
在另一个这样的实施方案中,设计嵌合RNAi表达盒的有义链以 使之以5'至3'的方向包含下列有效连接的元件目的启动子、包含 SEQ ID NO: l(FucT序列)的nt 254-855和SEQ ID NO: 19 (XIyT序列) 的nt 1-626的嵌合正向片段;包含大约100至大约700 nt的上面提 及的任何序列的间隔区序列;和包含嵌合正向片段的互补序列(即, 反义版本)即包含SEQ ID NO: 19的nt 1-626的互补序列和SEQ ID NO: 1的nt 254-855的互补序列的反向片段。在特定的实施方案中,该嵌 合RNAi表达盒中的间隔区序列由SEQ ID N0:19的nt 62卜11"表示, 相应于hpRNA结构的编码序列的RMi表达盒的有义链的该部分的总长 度是2956 nt。
在另一个这样的实施方案中,设计嵌合MAi表达盒的有义链以 使之以5'至3'的方向包含下列有效连接的元件目的启动子、包含SEQ ID NO: 19 (XIyT序列)的nt 1-626和SEQ ID NO: 1 (FucT序列) 的nt 254-855的嵌合正向片段;包含大约100至大约700 nt的上面 提及的任何序列的间隔区序列;和包含嵌合正向片段的互补序列(即, 反义版本)即包含SEQ ID NO: 1的nt 254-855的互补序列和SEQ ID NO: 19的nt 1-626的互补序列的反向片段。在特定的实施方案中,该嵌 合RNAi表达盒中的间隔区序列由SEQ ID NO: 1的nt 856-1355表示, 相应于hpRNA结构的编码序列的RNAi表达盒的有义链的该部分的总长 度是2956 nt。
用包含此处描述的RNAi表达盒的核苷酸构建体稳定转化植物, 例如使用图10中显示的载体的稳定转化,有效地抑制了 FucT和XylT 两者在其中表达hpRNA结构的植物的植物细胞中的表达。在一个实施 方案中,目的植物是浮萍家族的成员,例如浮萍科的成员,植物已用 图10中显示的栽体稳定地转化。
要认识到,可用这些嵌合RNAi表达盒中的至少两个稳定地转化 植物,从而提供非常有效的FucT和XylT蛋白的基因沉默,包括这两 种蛋白质的任何同种型的沉默。参见,例如,图28的"可能的设计2" 中提供的两个方向。通过该方式,可用第一嵌合RNAi表达盒(其中 嵌合正向片段包含以该顺序融合的FucT和XylT序列,和包含正好处
区序列);和第二嵌合RMi表达盒(其中嵌合正向片段包含以该顺序 融合的XylT和FucT序列,和包含正好处于嵌合正向片段内包含的 FucT序列下游的FucT有义链的部分的间隔区序列)稳定地转化植物。
编码大hpRNA结构或大ihpRNA结构的RNAi表达盒中的任一个中 的有效连接的启动子可以是任何目的启动子,包括本说明书中下面公 开的启动子中的一个启动子,所述目的启动子在目的植物中提供有效 连接的抑制性多核苷酸的表达。调控序列可包含增强抑制性多核苷酸 的表达的额外的调控元件,包括但不限于,本说明书中下面讨论的5' 前导序列和5'前导序列+植物内含子。
在其他实施方案中,可设计RNAi表达盒以提供具有包含大约200个碱基对或更少的碱基配对的茎区域的小hpRNA结构的表达。优选通 过由DNA依赖性RNA聚合酶III识别的启动子驱动小hpRNA结构的表 达。参见,例如,美国专利申请20040231016,通过引用其全文将其 纳入本文。
通过该方式,这样设计RNAi表达盒以使转录的DNA区域编码包 含有义和反义核苷酸区域的RNA分子,其中有义核苷酸序列包含大约 19个连续的核苷酸,所述连续的核苷酸具有与来自从目的基因转录的 RNA的大约19个连续核苷酸大约90%至大约100%的序列同一性,和其 中反义核苷酸序列包含大约19个连续核香酸,所述大约19个连续核 苷酸具有与有义序列的大约19个连续核苷酸的互补序列至少大约90% 至大约100°/。的序列同一性。RNA分子的有义和反义核苷酸序列应当能 够形成长度为大约19至大约200个核苷酸,可选择地大约21至大约 90或IOO个核苷酸或可选择地大约40至大约50个核苷酸的RNA碱基 配对(即,双链)的茎区域。然而,RNA分子的碱基配对的茎区域的 长度在长度上可以是大约30、大约60、大约70或大约80个核苷酸。 当RNA分子的碱基配对的茎区域大于19个核苷酸时,只需要存在至少 一个大约19个核苷酸的双链区(其中有义和反义区域之间可存在大约 1个错配),所述双链区的有义链与目的靶FucT或XylT多核苷酸的19 个连续核苷酸是"同一的"(允许一个错配)。该类型的RNAi表达盒 的转录的DM区域可包含位于有义和反义编码核苷酸区域之间的间隔 区序列。间隔区序列与被靶向的FucT或XylT多肽不相关,且可在大 约3至大约100个核苷酸或可选择地大约6至大约40个核苷酸的长度 范围内变化。该类型的RNAi表达盒还可包含位于表达盒的编码反义 序列的核苷酸区域的下游的由RNA聚合酶III识别的终止子序列,该 序列为寡聚dT片段的序列。"寡聚dT片段"是连续的T残基的片段。 其应当包含至少4个T残基,但显然可包含更多的T残基。
要认识到,在设计短hpRNA中,选择被耙各的基因序列的片段(即, FucT或XylT基因序列的片段)和RMi表达盒的hpRM编码部分内包 含的任何间隔区序列,以避免富含GC的序列,特别是具有3个连续
82G/C的序列,和避免4个或更多个连续的T或A的发生,因为片段 "TTTT...,,用作由RM聚合酶III识别的终止子序列。
因此,当想要用短hpRNA沉默基因时,设计RNAi表达盒以^f吏之 以5'至3'的方向包含下列有效连接的元件由植物细胞的DNA依赖性 RNA聚敛酶III识别的启动子,如本说明书中下面所定义的启动子; 包含有义和反义核苷酸序列的DNA片段,其中有义核苷酸序列包含至 少19个连续核苷酸,所述连续核苷酸具有与来自目的FucT或XylT 基因的有义链的至少大约19个连续核苷酸的核苷酸序列大约90%至大 约100%的序列同一性,和其中反义核苷酸序列包含大约19个连续核 苷酸,所述连续核苷酸具有与有义序列的至少19个连续核苷酸的核苷 酸序列的互补序列至少大约90%至大约100%的序列同一性,其中有义 和反义核苷酸序列能够形成长度为大约19至大约200个核苷酸的双链 RNA;和包含至少4个连续T残基的寡聚dT片段。
在本发明的一些实施方案中,设计RNAi表达盒以使之表达抑制 SEQ ID NO: 3的FucT多肽、SEQ ID NO: 3的FucT多肽的生物活性变 体或由序列(所述序列具有与SEQ ID NO: 1或SEQ IDN0:2的序列至 少90。/。的序列同一性)编码的FucT多肽的表达的小hpRNA。通过该方 式,可设计RNAi表达盒以使之以5'至3'的方向包含下列有效连接的 元件由植物细胞的DNA依赖性RM聚敛酶III识别的启动子,如本 说明书中下面所定义的启动子;包含有义和反义核苷酸序列的DNA片 段,其中有义核苷酸序列包含至少19个连续核苷酸,所述连续核苷酸 具有与SEQ ID NO: 1的至少大约19个连续核苷酸的核苷酸序列大约 90%至大约100%的序列同一性,和其中反义核苷酸序列包含大约19个 连续核苷酸,所述连续核苷酸具有与有义序列的至少19个连续核苷酸 的核苷酸序列的互补序列至少大约90%至大约100%的序列同一性,其 中有义和反义核苷酸序列能够形成长度为大约19至大约200个核苷酸 的双链RNA;和包含至少4个连续T残基的寡聚dT片段。
在本发明的其他实施方案中,设计RNAi表达盒以表达抑制SEQ ID NO: 6或SEQ ID NO: 21的XylT多肽、SEQ ID NO: 6或SEQ ID NO: 21的XylT多肽的生物活性变体或由序列(所迷序列具有与SEQ ID NO: 4、 SEQ ID NO: 5、 SEQ ID NO: 19或SEQ ID NO: 20的序列至少90%的序 列同一性)编码的XylT多肽的表达的小hpRNA。通过该方式,设计RNAi 表达盒以使之以5'至3'的方向包含下列有效连接的元件由植物细胞 的DNA依赖性RNA聚敛酶III识别的启动子,如本说明书中下面所定 义的启动子;包含有义和反义核苷酸序列的DM片段,其中有义核苷 酸序列包含至少19个连续核苷酸,所述连续核苷酸具有与SEQ ID NO: 4的至少大约19个连续核苷酸的核苷酸序列大约90%至大约100%的序 列同一性,和其中反义核苷酸序列包含大约19个连续核苷酸,所述连 续核苷酸具有与有义序列的至少19个连续核苷酸的核苷酸序列的互 补序列至少大约90%至大约100%的序列同一性,其中有义和反义核苷 酸序列能够形成长度为大约19至大约200个核苷酸的双链RNA;和包 含至少4个连续T残基的寡聚dT片段。
扩增子介爭W于挽
扩增子表达盒包含植物病毒来源的序列,所述序列包含靶基因的 全部或部分但通常不包含所有的天然病毒的基因。存在于表达盒的转 录产物中的病毒序列允许转录产物指导其自已的复制。由扩增子产生 的转录物相对于靶序列(即,FucT或XylT或两者的信使RNA)可以是 有义的或反义。使用扩增子抑制内源性植物基因的表达的方法描述于 例如Angell和Baul函be (1997)層0 /. 16: 3675-3684, Angell 和Baul函be (1999) /Va/ 〃. 20:357-362,和美国专利6, 646, 805, 其各自通过引用纳入本文。
#錄
在一些实施方案中,由本发明的表达盒表达的多核苷酸是催化性 RNA或具有对于FucT或XylT或两者的信使RNA是特异性的核酶活性。 因此,多核苷酸引起内源性信使RNA的降解,从而导致FucT或XylT 或两者的减少的表达。该方法描述于例如美国专利4, 987,0n,通过引用纳入本文。<formula>formula see original document page 85</formula>
在本发明的一些实施方案中,可通过表达编码micro RNA (miRNA) 的基因通过RNA干扰来获得FucT或XylT或两者的表达的抑制。miRNA 是由大约22个核糖核苷酸组成的调节剂。miRNA在抑制内源性基因的 表达方面是高度有效的。参见,例如Javier等人(2003) y^&re 425: 257-263,通过引用纳入本文。
关于miRNA干扰,设计表达盒以使其表达根据内源性miRNA基因 构建的RNA分子。miRNA基因编码形成包含与另一个内源性基因(耙 序列)互补的22个核苷酸的序列的发夹结构的RM。为了抑制FucT 或XylT表达,22个核苷酸的序列选自FucT或XylT转录物序列和以 有义方向包含所述FucT或XylT序列的22个核苷酸以及相应的与有义 序列互补的反义序列的21个核苷酸。miRNA分子在抑制内源性基因的 表达方面是高度有效的,它们诱导的RNA干扰通过植物的后代得到遗 传。
差于/應的差西衷这^#賴
在一个实施方案中,多核苷酸编码结合编码FucT或XylT或两者 的基因的锌指蛋白,从而导致减少的基因表达。在特定的实施方案中, 锌指蛋白结合FucT或XylT基因的调控区。在其他实施方案中,锌指 蛋白结合编码FucT或XylT的信使RM并且阻止其翻译。选择被锌指 蛋白靼向的位点的方法已描述于例如美国专利6, 453, 242中,使用锌 指蛋白抑制植物中基因的表达的方法描述于例如美国专利申请 20030037355;其各自通过引用纳入本文。
差f多农的蛋W押,/
在本发明的一些实施方案中,多核苷酸编码结合至少一个FucT 或XylT的抗体,和减少FucT或XylT的活性。在另一个实施方案中,抗体的结合通过细胞质量控制机制导致增加的FucT或XylT复合物的 周转。植物细胞中抗体的表达和植物中通过抗体的表达和其对蛋白质 的结合导致的分子途径的抑制在本领域内是熟知的。参见,例如, Conrad和SonnewaId (2003) Wafi/re "2.0fec力.21: 35—36,通过引用 合并入本文。
差厉破银ge刀e i /si7//7〃0/7
在本发明的一些实施方案中,通过破坏编码FucT或XylT或两者 的基因来减少或消除FucT或XylT或两者的活性。可通过本领域内已 知的任何方法破坏编码FucT或XylT或两者的基因。例如,在一个实 施方案中,通过转座子标记技术破坏基因。在另一个实施方案中,通 过使用随机或定向突变诱变处理植物,然后选择具有减少的FucT和/ 或XylT活性的植物来破坏基因。
在本发明的一个实施方案中,使用转座子标记技术减少或消除 FucT或XylT或两者的活性。转座子标记技术包括在内源性FucT或 XylT基因内插入转座子以减少或消除FucT或XylT的表达。"FucT" 或"XylT"基因意指根据本发明分别编码FucT或XylT的基因。
在该实施方案中,通过在调控区或编码FucT或XylT的基因的编 码区内插入转座子来减少或消除FucT或XylT的表达。FucT或XylT 或两者的外显子、内含子、5'或3'非翻译序列、启动子或任何其他调 或活性。、 P 、.-,'、、.-、-, 、、
用于植物中特定基因的转座子标记技术的方法在本领域内是熟 知的。参见,例如,Maes等人(1999) 7>e/j" /VaW 4:90-96; Dhar歸puri和Sonti (1999)尸厕脂ro6/o厶Ze". 179: 53-59; Meissner等人(2000)尸/a/ f /. 22:265-274; Phogat等人(2000) /. "/osc/. 25:57-63; Walbot (2000) 0/ /; .户/a/^5/o厶 2:103-107; Gai 等人 (2000) 肠/e/c Jc油紐 28:94-96; Fitzmaurice等人(1999) Ce/ e〃" 153: 1919-1928)。此外,用于 在选择的基因中选择Mu插入的TUSC方法描述于Bensen等人(1995) 户/a" Ce/": 75-84; Mena等人(1996) Sc/e/2C e 274: 1537-1540;其
各自通过引用纳入本文。
本发明包括用于减少或消除FucT或XylT的活性的其他方法。用
内是已知的,包括但不限于,RNA: DNA载体的使用、RNA:DNA突变的载 体的使用、RNA: DNA修复载体的使用、混合双链体寡核苷酸的使用、 自我互补的RNA: DNA寡核苷酸的使用和重组基因寡核碱基 (oligonucleobases)的使用。使用的此类载体和方法在本领域内是 已知的。参见,例如,美国专利5, 565, 350、 5, 731, 181、 5, 756, 325、 5, 760, 012、 5, 795, 972和5, 871, 984;其各自通过引用纳入本文。也 参见,WO 98/49350、WO 99/07865、WO 99/25821和Beetham等人(1999) 尸roc. ^〃 S"' VW 96:8774-8778;其各自通过引用纳入本文。
因此,可通过前述方法中任一种方法来抑制FucT和/或XylT在 目的高等植物中的表达,以改变在该植物中产生的内源性和异源性糖 蛋白的N糖基化模式,以使这此糖蛋白包含具有减少的Pl,2-连接的 木糖残基和/或al,3-连接的岩藻糖残基的量的复杂#聚糖。Pl,2-连接的木糖残基和/或a 1, 3-连接的岩藻糖残基至糖蛋白的N-聚糖的 附着的程度减少通过XylT和FucT酶的各自表达的抑制程度来控制。
在本发明的一些实施方案中,使用此处描述的靶向XylT表达的 方法稳定地转化的植物宿主中产生的重组糖蛋白具有^连接的聚糖, 所述聚糖包含低于50%、低于40°/。、低于30%的植物宿主(所述植物未 被遗传修饰以抑制XylT酶和其同种型的表达)中产生的糖蛋白的各 个W连接的聚糖中发生的P 1, 2-连接的木糖残基。在其他实施方案中, 这些重组糖蛋白具有W连接的聚糖,所述聚糖包含低于25%、低于20%、 低于15%、低于10%、低于5%或低于1%的植物宿主(所述植物未被遗
87传修饰以抑制XylT酶和其同种型的表达)中产生的糖蛋白的各个A 连接的聚糖中发生的P 1,2-连接的木糖残基。在其他实施方案中,本 发明的方法在稳定转化的植物中提供了 XylT基因和其任何同种型的 完全沉默,这样植物中产生的重组糖蛋白具有不含p 1,2-连接的木糖 残基的^连接的聚糖。
通过类似的方式,当使用此处描述的靶向FucT表达的方法稳定 地转化植物宿主细胞时,植物中产生的重组糖蛋白具有W连接的聚糖, 所述聚糖包含低于50°/。、低于40%、低于30°/。的植物宿主(所述植物未
W连接^聚糖中发生的ct 1 , 藻糖残基。在其他实施方案中,
这些重组蛋白具有y连接的聚糖,所述聚糖包含低于25%、低于20%、 低于15%、低于10%、低于5%或低于1%的植物宿主(所述植物未被遗 传修饰以抑制FucT酶和其同种型的表达)中产生的糖蛋白的各个A 连接的聚糖中发生的ot 1, 3-连接的岩藻糖残基。在其他实施方案中, 本发明的方法在稳定转化的植物中提供了 FucT基因和其任何同种型 的完全沉默,这样植物中产生的重组糖蛋白具有不含ocl, 3-连接的岩 藻糖残基的iV连接的聚糖。
当使用此处描述的耙向XylT和FucT酶两者和其任何同种型的 表达的方法稳定地转化植物宿主时,植物中产生的重组糖蛋白具有^ 连接的聚糖,所述聚糖包含低于50%、低于40%、低于30%的植物宿主 (所述植物宿主未被遗传修饰以抑制Xy 1T和FucT酶及其同种型的表 达)中产生的糖蛋白的各个iV连接的聚糖中发生的P 1,2-连接的木糖 残基和ocl, 3-连接的岩藻糖残基。在其他实施方案中,这些重组蛋白 具有A连接的聚糖,所述聚糖包含低于25%、低于20%、低于15%、低 于10%、低于5%或低于1%的植物宿主(所述植物未被遗传修饰以抑制 XylT和FucT酶和其同种型的表达)中产生的糖蛋白的各个^连接的 聚糖中发生的P 1, 2-连接的木糖残基和a 1, 3-连接的岩藻糖残基。在 其他实施方案中,本发明的方法在稳定转化的植物中提供了 XylT和 FucT基因和其任何同种型的完全沉默,这样植物中产生的重组糖蛋白具有不含p 1, 2-连接的木糖残基和oc 1, 3-连接的岩藻糖残基的#连接 的聚糖。
在本发明的一些实施方案中,使用此处描述的靶向XylT和FucT 酶和其任何同种型的表达的方法稳定地转化的植物宿主能够产生其中 A^连接的聚糖大体上均一的重组糖蛋白。"大体上均一的"意指糖基 化特征镨反映相应于希望的^聚糖种类更特别地GO聚糖种类的单个主 峰的存在,其中至少90%的存在于所述糖蛋白上的W聚糖结构是GO聚 糖种类。
用于监测糖蛋白的N糖基化模式(也称为糖基化特征语)的改变 的方法在本领域内是熟知的,包括,但不限于,基质辅助激光解吸电 离-飞行时间(MALDI-TOF)质镨(例如使用本说明书中下面的实施例3 中公幵的改良的MALDI-TOF测定)、液相色谱质i普(liquid chromatograph mass spectrometry) (LC-MS)、 气相色语、P月离子交 换层析、大小排阻层析、高浓度聚丙烯酰胺凝胶电泳、核磁共振光谱 法和毛细管电泳以及毛细管凝胶电泳、通过高效液相色镨(HPLC)和 QTOF进行的荧光标记和检测等。通过该方式,可通过将从稳定转化的 植物中获得的样品(例如叶组织样品)经历通过MALDI-TOF质谱进行 的总的V聚糖分析,然后将结果与从来自对照植物的可比较的样品获 得的结果进行比较,来监测由于本发明的稳定转化的植物中的XylT 和/或FucT的表达或功能的抑制而导致的N糖基化模式的改变,其中 对照植物未进行遗传修饰以抑制XylT和/或FucT的表达或功能。可通 过各自的峰的质量(mass )的减少来监测^聚糖中木糖和/或岩藻糖残 基的量的减少。参见,例如,Strasser等人(2004) /^AS^eHe" 561 : 132-136。
类似地,已使用本领域技术人员熟知的标准技术容易地确定任何 给定的重组产生的糖蛋白的糖基化特征谱。参见,例如,由Morelle 和Michalski (2005) Cz/rr. J/2a/. C力e迈.1 : 29-57 (通过其全文的 引用纳入本文)提供的综述。因此,可就附着至其的特定A^连接的聚 糖结构的比率分析宿主生物(包括植物宿主)中重组产生的糖蛋白。通过该方式,可将包含分离的重组产生的糖蛋白的样品经历酶促或化 学反应,以从糖蛋白释放单个的聚糖结构。在该去糖基化步骤后,可 使用本说明书中上面描述的分析测定法中的任一种进行糖基化特征谱 的分析。
重组产生的糖蛋白的产物通常以不同的糖形群体存在,所述糖形 以可变的摩尔量在具有不同的位点占有程度的糖基化位点上携带1至 数打不同的聚糖。取决于糖蛋白,不同的糖形可产生不同的功能特征 谱。因此,在本发明的一些实施方案中,希望确定具有^聚糖完整形 式的糖蛋白的糖基化特征语。可使用本领域内已知的用于确定完整糖 蛋白的糖基化特征语的任何技术,包括上面和本说明书的下面的实施 例中提及的质镨法。
通过以此处所示的方式短暂地或稳定地减少或消除岩藻糖基转
移酶和/或木糖基转移酶的表达或功能,可能产生具有产生具有N糖基 化特征谱的糖蛋白的能力的转基因高等植物,所述N糖基化特征i普, 与当这些酶的表达或功能未进行改变(即,植物具有天然的或野生型糖 基化机构)时通常观察到的该植物产生的糖蛋白的N糖基化特征语相 比,具有減少的不均一性。当使用本说明书中上面描述的一种或多种 方法稳定地减少或消除这两种酶中的一种或两种的表达或功能时,由 转基因植物产生的糖蛋白的N糖基化特征镨的不均一性的减少可在植
物的代间得到保持,包括通过无性或有性生殖的传代保持,和可在整 个培养条件下及在扩大生产中得到保持。
通过该方式,本发明提供了用于减少高等植物例如双子叶或单子 叶植物例如浮萍植物中产生的糖蛋白的N糖基化特征语的不均一性的 方法。方法包括向植物中导入此处描述的核苷酸构建体以使在植物中 减少或消除岩藻糖残基转移酶和/或木糖基转移酶的表达或功能。在本 发明的一些实施方案中,用于减少高等植物中产生的糖蛋白的N糖基 化特征语的不均一性的方法包括向目的高等植物中导入至少一个本说 明书中上面描述的核苷酸构建体,其中核苷酸构建体提供了例如使用 本说明书中上面描述的一种或多种方法在植物中抑制岩藻糖残基转移酶和/或木糖基转移酶的表达。
"减少N糖基化特征镨的不均一性"意指N糖基化特征语的特征 在于呈现在特征i普中的不同的^聚糖种类的总数的减少。因此,例如,
:岩藻糖残:转;多酶和木糖i转移酶的表达)的高等植物产生的Jt蛋
白产生具有特征在于5个W聚糖种类的混合存在的N糖基化特征语的 糖蛋白时,本发明的方法可用于减少出现在N糖基化特征谱中的^聚 糖种类的数目。通过该方式,当以此处所示的方式遗传修饰该高等植 物以减少或消除岩藻糖残基转移酶和/或木糖基转移酶的表达或功能 时,该糖蛋白的N糖基化特征镨的特征在于出现在特征镨中的^聚糖 种类的数目的减少,例如少于5个^聚糖种类例如少于4、 3或2个N 聚糖种类的混合,或甚至单个#聚糖种类。当减少N糖基化模式的不 均一性以使特征在于存在单个主要的W聚糖种类,N糖基化特征谱对 于W聚糖种类大体上是均一的。
在一些实施方案中,用于减少高等植物中产生的糖蛋白的N糖基 化特征镨的不均一性导致产生的糖蛋白具有为大体上均一的GO聚糖 种类的N糖基化特征傳。在这样的实施方案中,用于减少高等植物中 产生的糖蛋白的N糖基化特征谱的不均一性的方法导致产生的糖蛋白 具有大体上均一的N糖基化特征语,其中出现在糖蛋白的N糖基化特 征镨中的^聚糖种类的总量的至少80%、至少85%、至少90%, 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98°/。或至少99°/。由GO聚糖种类代表。 在这些实施方案中,如本说明书中其他地方所指出的,痕量的前体^ 聚糖种类可出现在N糖基化特征谱中,其中存在于N糖基化特征谱中 的任何给定的前体^聚糖种类以低于5%,优选低于4%,低于3%,低 于2%,低于1%和甚至低于0. 5%或甚至低于0. 1%的出现在特征谱中的 iV聚糖种类的总量存在。
糖蛋白可以是内源性目的糖蛋白,或可以是由目的高等植物产生 的异源性糖蛋白,例如哺乳动物糖蛋白,包括,例如,本说明书中其 他地方描述的糖蛋白。在一些实施方案中,糖蛋白是单克隆抗体。在其他实施方案中,糖蛋白选自千扰素、红细胞生成素(EPO)、组织纤溶 酶原激活物(tPA)、纤溶酶原、粒细胞巨噬细胞集落刺激因子(GM-CSF) 和治疗性免疫球蛋白。
通过使用本发明的方法,可能在扩大的生产中保持转基因植物中 产生的糖蛋白的N糖基化特征镨中减少的不均一性,从而植物继续产 生糖蛋白以使其N糖基化特征i瞽的特征在于出现在特征镨中的W聚糖 种类的数目减少。"扩大的生产"或"生产规模的增大"意指存在于 培养系统(即在其中培养植物的培养瓶或培养容器)中的植物生物量的 量的增加,所述培养系统用于产生目的蛋白质(在该情况下,是目的 糖蛋白)。因此,例如当从适合于研究目的的规模扩大生产至适合于 中试生产的规模,和进一步至适合于目的糖蛋白的商业生产的规模时, 扩大的生产发生。
在一些实施方案中,转基因高等植物是用作糖蛋白的重组产生的 单子叶植物,例如,浮萍植物,重组产生的糖蛋白的N糖基化特征谱 的减少的不均一性在生产规模的增大中得到保持,其中生产规模增加 为初始起始生物量的至少300倍、至少500倍、至少700倍、至少1, OOO倍、至少1, 500倍或更大倍数。在这些实施方案中的一些中,转 基因植物是重组产生目的糖蛋白的浮萍植物,在N糖基化特征谱的减 少的不均一性在生产规模的扩大中得到保持,其中生产规模增加为初 始起始生物量的至少2, OOO倍、至少3, 000倍、至少4, 000倍、至少 5,000倍、至少6, 000倍、至少6, 500倍或更大倍数。在一个这样的 实施方案中,高等植物是重组产生目的糖蛋白的浮萍,该糖蛋白的N 糖基化特征谱的减少的不均一性在生产规模的扩大中得到保持,其中 生产规模增加为初始起始生物量的至少7, 000倍、8, 000倍、9,000 倍、IO,OOO倍、12, 500倍,15, 000倍、17, 500倍、20,000倍、23, 000 倍、26, 0Q0倍或更大倍数。
此外,当通过连续克隆培养保持目的转基因植物时,所得的转基 因植物持续产生展示它们的N糖基化特征傳中的减少的不均一性的糖 蛋白。使用本领域内已知的任何合适的方法进行持续克隆培养。在一些实施方案中,通过周期性地取出植物培养物的一个或多个次级样本 并且将次级样本转移至新配制的培养基中进行进一步培养。因此,例 如,在一些实施方案中,通过持续克隆培养保持的转基因植物系是已 进行遗传修饰从而减少或消除岩藻糖残基转移酶和/或木糖基转移酶 的表达或功能的浮萍转基因植物系。通过该方式,转基因植物系中产
生的糖蛋白的N糖基化特征i普的减少的不均一性在转基因植物系的持 续克隆培养中保持至少8个月、至少10个月、至少1年、至少1. 5 年、至少2年、至少2. 5年、至少3年、至少3. 5年、至少4年、至 少4. 5年、至少5年或更长时间,和只要转基因植物得到保持就可得 到保持。
异源多农和潜蛋^
高等植物,特别是用作用于药物用途的重组蛋白的表达系统、使 用此处公开的方法稳定地转化以产生具有改变的N糖基化模式的糖蛋 白的高等植物,可进行遗传修饰以产生任何目的重组蛋白。当重组蛋 白是其中可应用翻译后糖基化的蛋白时,本发明的方法有利地提供了 产生具有N糖基化模式的这些糖蛋白的方法,所述N糖基化模式更密 切地反映哺乳动物宿主的糖基化模式,特别是被"人源化,,的糖基化 模式。目的重组蛋白的实例包括,但不限于,胰岛素、生长激素、纤 溶酶原、oc干扰素、p干扰素、P葡糖脑苷脂酶、P-葡糖甘酸酶、视 网膜母细胞瘤蛋白、p53蛋白、制管张素、瘦素、单克隆抗体和其片 段、细胞因子例如红细胞生成素(EPO)、粒细胞巨噬细胞集落刺激因子、 组织纤溶酶原激活物、血液凝血因子例如因子VII、因子VIII、因子 IX和激活蛋白C、 ocl-抗胰蛋白酶、受体、激素、人疫苗、动物疫苗、 肽和血清白蛋白。此外,本发明的转基因高等植物能够产生糖蛋白产 物,所述糖蛋白产物对于GO聚糖种类具有大体上均一的糖基化特征 谱,和特征在于其对于GO糖形的大体上的均一性。这有利地导致植物 宿主表达系统,所述植物宿主表达系统具有增加的生产一致性以及与 这些糖蛋白组合物的产生相关的减少的化学、制造和控制(CMC)风险。包含药学上可接受的载体的组合物包含按照本发明的方法产生 的糖蛋白组合物。这样的组合物用于就疾病或病症(使用糖蛋白的治 疗将给所述疾病或病症提供治疗益处)治疗受试者的方法。通过该方 式,可对需要其的受试者施用已在按照本发明的方法稳定转化的植物 例如浮萍植物中产生的糖蛋白。
本发明的糖蛋白组合物包含主要为GO聚糖结构的^连接的聚糖。 通过该方式,本发明提供了具有糖基化特征语的糖蛋白组合物,所述 特征谱是"大体上均一的"或"大体上一致的"或具有本说明书中上 面所定义的"大体的均一性"。因此,在一些实施方案中,糖蛋白组 合物对于GO聚糖种类大体上是均一的,因而具有大体上均一的糖基化 特征镨,其中,出现在组合物的糖基化特征镨中的^聚糖种类的总量 的至少80°/。、至少85°/。、至少90%、 91%、 92°/。、 93%、 94%、 95%、 96%、 97%、 98%或至少99%由GO聚糖种类代表,痕量的前体^聚糖种类出现 在糖基化特征i瞽中,即存在于糖基化特征中的任何给定的前体^聚糖 种类以低于5%、优选低于4%、低于3%、低于2%、低于1°/ 和甚至低于 0. 5%或甚至低于0. 1%的出现在特征谱中的^聚糖种类的总量存在。对 于该组合物,出现在其糖基化特征谱中的代表性^聚糖种类可以是上 述的Man3GlcNAc2、MGn(GlcNaclMan3GlcNAc2其中GlcNacl附着至1, 3 甘露糖臂)和GnM (GlcNaclMan3GlcNAc2,其中GlcNacl附着至1, 6甘 露糖臂)前体W聚糖种类,其中可以存在任何单个的前体^聚糖种类或 这些前体iV聚糖种类的任何组合。
通过该方式,本发明提供了 "大体上均一的"或"大体上一致的" 的糖蛋白组合物或具有本说明书中上面定义的"大体均一性"的糖蛋 白组合物。在一些实施方案中,本发明提供了大体上均一的糖蛋白组 合物,其中至少80%、至少85%、至少90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或至少99%的存在于组合物中的糖蛋白由G0糖形表示, 其中所有预期的糖基化位点由GO聚糖种类占据,痕量的前体或不希望 的糖形存在于组合物中,即,前体糖形代表低于5%、低于4%、低于 3°/。、低于2%、低于1%或甚至低于0. 5%或甚至低于0. 1%的存在于组合物中的总糖形。在这样的组合物中,代表性前体糖形是其中糖基化位 点被占据的糖形,示例性不希望的糖形是具有附着至其糖基化位点的
GO聚糖和GOX或G0XF3聚糖种类的混合的糖形。
在本发明的一些实施方案中,植物宿主细胞包含提供抗体的表达 的一个或多个多核苷酸,所述抗体特异性结合目的哺乳动物蛋白,特 别是目的人蛋白。因此,在一个方面,本发明提供了用于在高等植物 中产生单克隆抗体的方法,其中单克隆抗体具有反映^连接的聚糖中 的pi,2-连接的木糖残基和al,3-连接的岩藻糖残基的量减少的N糖 基化模式,以及包含使用以此处所示的方式进行遗传修饰的植物宿主 产生的重组单克隆抗体的组合物。在一些实施方案中,目的植物宿主 是浮萍家族的成员。
单克隆抗体日益用作治疗人疾病(包括但不限于癌症和具有自身 免疫或炎症性组分的疾病)的治疗剂。参见,例如,King (1999) Ci/rr. O;7//7. / r"g "yscwe/y齡.2: 110-17; Vaswani和Hamilton (1998) 力7/ei^/ Js^ /Z7a 7iZ7迈i//70/. 81 : 105—19; k乂及Hollige和 Hoogenboom, A/ofec/wo/o^r 16: 1015-16;其各自通过引用纳
入本文。尽管这些抗体中的一些具有只由抗原结合引起的治疗效应, 例如结合受体或配体以阻止配体-受体相互作用的抗体,其他抗体需要 效应子作用例如杀死靶细胞以获得治疗性活性的免疫系统的募集反 应。参见,例如,Clynes等人(2000) WW 6:443-46; Clynes
等人(1998)尸roc. Ai3〃.」caA " &丄95: 652- 56,和Anderson 等人(1997) Woc力e瓜7><3/^. 25:705-8;其各自通过引用纳 入本文。
抗体的抗原识别活性和效应子作用存在于抗体分子的不同部分。 抗体的Fab'部分提供抗原识别活性,而Fc部分提供效应子作用例如 副效应细胞(accessory effector cell)包括吞嗟细胞(phagocytic cell)(巨噬细胞和嗜中性粒细胞)、天然杀伤细胞和肥大细胞的激活。 抗体通过Fc区域结合细胞,抗体Fc区域上的Fc受体位点结合细胞上 的Fc受体(FcR)。存在许多对于不同类型的抗体是特异性的Fc受体,所述抗体包括IgG (Y受体)、IgE (Ti受体)、IgA (oc受体)和IgM (ja 受体)。抗体与细胞表面上的Fc受体的结合触发了许多重要的各种生 物反应,包括抗体包被的颗粒的吞食和破坏、免疫复合物的清除、通 过杀伤细胞(称为抗体依赖性细胞介导的细胞毒性,或ADCC)进行的抗 体包被的靶细胞的裂解、补体依赖性细胞毒性(CDC)的引发、炎症介 质的释放和免疫球蛋白产量的控制。用于测定抗体的效应子作用的方 法在本领域内是熟知的且包括用于CDC、 ADCC和细胞凋亡的测定法。 参见,例如,Subbramanian等人 (2002) /. 紙ro6/oA 40:2141- 2146; Ahman等人(1994) /. /画/ o/. 36: 243-254;
Brezicka等人(2000) C雄er /边迈,Mer. 49:235-242;
Gazzano-Santoro等人(1997) /. /迈迈W7oA #e^ oc^ 202: 163—171; Prang等人(2005) ^7〃M/. Cer 92: 342-349; Shan等人(1998) 3756-3771; Ghetie等人(2001) Wooc/ 97: 1392-1398;和 Mathas等人(2000) C痕er hearc/ 60: 7170-7176;其全部通过引 用纳入本文。
本领域内已知,抗体分子的Fc部分的糖基化状态在确定抗体是 否具有效应子作用中起着关键作用。参见,例如,Tao和Morrison (1987) /. 143: 2595- 601; Wright和Morrison (1997) 7>e/2crs 2'/
"/"ec/ . 15:26-32; Wright 和 Morrison (1998) /. 160:3393-402; Mimura等人 (2000) /迈边MO厶37:697-706;
Jefferis和Lund (2002) /迈迈,/. Ze". 82:57-65; Krapp等人 (2003) /. #。人325:979-89;和Jefferis (2005) 5/otec/wo厶 ,rog. 21 : 11-16;其各自通过引用纳入本文。取决于所使用的表达 系统,重组产生的抗体的糖基化可以变化。参见,例如,Raju等人 (2000) 67/co6/o7o^r 10: 477-86; Wright和Morrison (1997) 7>ei3f/5" // "/Wec力.15: 26-32。此外,当改变哺乳动物产生的单克隆抗体的 N糖基化形式以减少或消除oc (1,6)-连接的核心岩藻糖残基时,单克 隆抗体展示增加的效应子作用,特别是增加的ADCC活性。参见,例如, 美国专利6, 946, 292。对于一些哺乳动物产生的单克隆抗体,当改变N糖基化形式以减少或消除附着至1,3和/或1,6甘露糖臂的P (1,4)-半乳糖残基时,可减少抗携带抗原的靶细胞的补体依赖性细胞毒性 (CDC)的激活而不改变抗体的其他功能活性包括ADCC活性。参见,例 如,Boyd等人(1995) /迈迈w o厶32:1311-1318。
可通过高等植物宿主例如浮萍来产生具有抗原识别活性和在一 些实施方案中具有提高的效应子作用的抗体,所述浮萍已通过此处所 示的方式进行了稳定的转化,从而改变了其糖基化机构。因此,本发 明提供了用于产生重组单克隆抗体的方法,所述抗体包括具有提高的 效应子作用的单克隆抗体,其中在植物中重组产生抗体,所述植物具 有在其中产生的内源性和异源性糖蛋白的改变的N糖基化模式,以使 这些糖蛋白展示减少的附着至其W聚糖的植物特异性P 1, 2-连接的木 糖残基和/或oc 1, 3-连接的岩藻糖的量。当抗体具有减少量的附着至其 #聚糖的al, 3-连接的岩藻糖残基时,与未进行遗传修饰以抑制FucT 的表达或功能的对照植物中产生的抗体相比,抗体具有增加的ADCC 活性。
还包括具有效应子作用(在一些实施方案,提高的效应子作用) 的重组单克隆抗体,其中在已进行了遗传修饰从而抑制SEQ ID NO: 3 的FucT和/或SEQ ID NO: 6的XylT和其任何同种型例如,包含SEQ ID NO: 21中所示的序列(由SEQ ID NO:20编码)的XylT同种型#2的表达 或功能的浮萍表达系统中产生抗体。因此,在一些实施方案中,用作 用于单克隆抗体的重组产生的宿主的植物是本说明书中其他地方提及 的浮萍科的成员,例如浮萍植物,所述浮萍植物包含例如上面描述的 稳定地整合入其基因组的XylT RMi表达盒和/或FucT RNAi表达盒。 通过该方式,本发明提供了用于产生具有糖基化模式和具有提高的效 应子作用的重组单克隆抗体,所述N糖基化模式与在哺乳动物表达系 统中发现的N糖基化模式更密切相似。其中方法包括在已进行了遗传
:的1条或多糸,链,以使重组产生"单克隆抗:展示减少的植物P 1, 2-连接的木糖残基和/或a 1, 3-连接的岩藻糖残基至其W聚糖的附
97着,和在适合于单克隆抗体表达的条件下,培养浮萍植物或浮萍细胞 或浮萍结节。
因此本发明提供了新的抗体组合物,其中抗体包含主要为GO聚 糖结构的^连接的聚糖。通过该方式,本发明提供了具有糖基化特征 镨的抗体组合物,例如单克隆抗体组合物,所述特征镨是"大体上均 一的"或"大体上一致的,,或具有本说明书中上面定义的"大体均一 性"。因此,在一些实施方案中,抗体组合物对于GO聚糖种类大体上 是均一的,从而具有大体上均一的糖基化特征i普,其中出现在组合物 的糖基化特征谱中的W聚糖种类的总量的至少80%、至少85%、至少 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或至少99%由GO聚
糖种类代表,痕量前体^聚糖出现在糖基化特征谱中,即存在于糖基 化特征谦中的任何给定的前体W聚糖种类以低于5%、优选低于4%、 低于3%、低于2%、低于1%和甚至低于0. 5%或甚至低于0. 1%的出现在 特征镨上的W聚糖种类的总量存在。对于这样的组合物,出现在其糖 基化特征谱中的代表性^聚糖种类可以是例如上述的Man3GlcMc2、 MGn(GlcNaclMan3GlcNAc2,其中GlcNacl附着至1, 3甘露糖臂)和GnM (GlcNaclMan3GlcNAc2,其中GlcNacl附着至1, 6甘露糖臂)前体樣 糖种类,其中可以存在任何单个的前体A聚糖种类或这些前体#聚糖 种类的任何组合。
在一个这样的实施方案中,单克隆抗体组合物具有大体上均一的 糖基化特征谱,其中出现在组合物的糖基化特征谱中的^聚糖种类的 总量的95. 8%由GO聚糖种类(GlcNAc2Mari3GlcNAc2)代表,下列前体# 聚糖种类出现在糖基化特征谱中的Man3GlcNAc2 (0. 67%)、 GlcNAcMan3GlcNAc2 (1.6%)、 GalGlcNAc2Man3GlcNAc2 (1.2%)、 Man6GlcNAc2 (0.21%)、 Man7GlcNAc2 (0. 30%)和Man8GlcNAc2 (0.28%)。 可将这与从"野生型"浮萍植物表达系统(其中表达相同的单克隆抗 体但其中浮萍植物的糖基化机构未进行遗修饰以抑制XylT或FucT的 表达)获得的单克隆抗体组合物比较。这样的"野生型"来源的单克 隆抗体组合物具有更不均一的糖基化特征谱,所述牲特征谱的特征在于两个主要的W聚糖种类即GOXF'和GOX以及以痕量存在的几个前体W 聚糖种类。在一个这样的实施方案中,"野生型"来源的单克隆抗体 组合物具有特征语,所述特征镨具有示于其中的下列^聚糖种类 GO(GlcNAc2Man3GlcNAc2) (8.4%)、 GOX (GlcNAc2 [Xyl] Man3 GlcMc2) (17.2%)、 GOXF3 (GlcNAc2[Xyl]Man3[Fuc]GlcNAc2) (67.4%)、 Man3GlcNAc2(0. 26%) 、 GlcMcMan3GlcNAc2 (0.40%)、 (Xyl)Man3(Fuc)GlcNAc2(0. 76%) 、 GlcNAc2Man3 (Fuc) GlcNAc2 (2. 1%)、 GlcNAc(Xyl)Man3(Fuc)GlcNAc2 (1. 4%) 、 Man6GlcNAc2 (0. 21%)、 Man7GlcNAc2(0. 63%)、
Gal (Fuc) GlcNAc2 (Xyl)Man3 (Fuc) GlcNAc2 (0. 26%) 、 Man8GlcNAc2 (0. 61%) 和Maii9GlcNAc2 (0.40%)。
通过该方式,本发明提供了 "大体上均一的"或"大体上一致的" 的具有本说明中上面定义的"大体均一性"的抗体组合物。在一些实
施方案中,本发明提供了大体上均一的抗体组合物,例如单克隆抗体 组合物,其中至少80%、至少85%、至少90%、 91%、 92%、 93°/。、 94%、 95%、 96%、 97%、 98%或至少99%的存在于组合物中的抗体由GO糖形代 表,其中所有预期的糖基化位点(例如,IgG型抗体的重链的CH2结构 域的Asn-297残基的各残基)都被GO聚糖种类占据,痕量前体聚糖存 在于组合物中。在一种这样的组合物中,前体糖形选自具有Fc区域的 抗体,其中一条重链的CH2结构域具有附着至Asn 297的GO聚糖种类, 另一条重链的Ch2結枸域未被糖基化;具有Fc区域的抗体,其中一条 重链的CH2结构域具有附着至Asn 297的GO聚糖种类,另 一条重链的 CH2结构域具有附着至Asn 297的GnM或MGn前体聚糖;和具有Fc区 域的抗体,其中各"2结构域上的Asn 297糖基化位点具有附着的GO 聚糖种类,笫三G0聚糖种类附着至mAb结构内的另外的糖基化位点; 其中存在痕量的这些前体糖形,即前体糖形代表低于5%、低于4%、低 于3%、低于2%、低于1%或甚至低于0. 5°/ 或低于0. 1%的存在于抗体组 合物中的总糖形。
本发明的大体上均一的抗体组合物(其中至少80%、至少85%、至少90%、 91°/。、 92%、 93°/。、 94%、 95%、 96%、 97%、 98%或至少99%的 存在于组合物中的抗体由GO糖形代表)代表了 "聚糖最优化的抗体"。 "聚糖最优化的抗体"意指本发明的抗体在它们的糖基化模式方面已 进行了基因工程改造,从而使它们对于GO糖形是大体上均一的,这产 生了具有提高的Fc效应子作用的抗体。"提高的Fc效应子作用"意 指这些抗体与由于产物加工的原因而具有更多不均一的糖基化特征的 相同序列的抗体(即,具有相同氨基酸序列的抗体)相比,具有增加的 ADCC活生。因此,例如,哺乳动物宿主表达系统例如CHO细胞、昆虫 宿主细胞、酵母细胞或未进行遗传修饰以抑制XylT和FucT表达的其 他植物细胞中产生的抗体倾向于具有更不均一的糖基化特征谱,从而 具有可影响抗体产物的总体效应子作用的糖形的混合。本发明的抗体 组合物的GO糖形有利地提供了具有与岩藻糖残基的不存在相关的增 加的ADCC活性的抗体组合物。在一些实施方案中,与具有不均一的糖 基化特征(即,多种糖形以主要糖形的形式存在于抗体组合物中)的 相同序列的抗体相比,ADCC活性增加为其的25倍、50倍、75倍、100 倍、150倍、200倍、250倍、300倍、400倍、500倍或甚至1000倍。 此外,G0糖形缺乏存在于具有G2糖形的抗体中的末端Gal残基。这 样,主要具有G0糖形的本发明的这些大体上均 一 的抗体组合物具有增 加的ADCC/CDC比。此外,主要具有GO糖形的本发明的这些大体上均 一的抗体组合物具有增加的对FcyRIII例如FcyRIIIa的结合,其中 结合亲和力与对于具有不均一的糖基化特征谱(从而具有糖形的混合) 的相同序列的抗体组合物所观察到的亲和力相比,增加为其的大约20 倍、30倍、40倍、50倍、75倍至100倍。对于肺瘤学和自身免疫性 疾病,具有增加的对Fc受体,例如Fc yRIII的结合亲和力的治疗性 抗体与增加的功效和对治疗的提高的反应强烈相关。
在本发明的一些实施方案中,主要具有GO糖形的本发明的大体 上均一的抗体组合物,当与对于具有不均一的糖基化特征i普(从而具 有糖形的混合)的相同序列的抗体组合物所观察到的CDC活性相比, 具有改变的CDC活性。例如,在一个这样的实施方案中,本发明的大
满体上均一的抗体组合主要具有GO糖形和当与对于具有不均一的糖基 化特征镨(从而具有糖形的混合)的相同序列的抗体组合物所观察到 的CDC活性相比,具有减少的CDC活性。因此,在一些实施方案中, 本发明提供了主要具有GO糖形和具有CDC活性(当与具有不均一糖基 化特征i瞽的相同序列的抗体组合物相比时,减少了 5%、 10°/ 、 15%、 20%、 25%、 30%、 35%、 40%、 45%、 50%、 55%、 60%、 65%、 70%、 75%、 80%、 85%、 90%、 95%或甚至100%)的大体上均一的抗体组合物。在这些实 施方案中的一些实施方案中,主要具有G0糖形和减少的CDC活性的大 体上均一的抗体组合物的进一步特征在于,当与具有不均一糖基化特 征谱的相同序列的抗体组合物相比时具有增加的ADCC活性。
不受任何作用理论或机制的束縛,具有减少的CDC活性和相似的 或增加的ADCC活性(以上述方式)的本发明的大体上均一的G0糖形 抗体组合物可以有利地提供增加的抗靶细胞的细胞毒性,同时减少潜 在的不利的副作用(所述副作用可与其施用后引起的补体激活相关)。 通过减少这些不利副作用的概率,可以有利地以更快速的输注速度施 用大体上均一的主要具有G0糖形的抗体组合物,从而在任何给定的施 用时减少给药时间,和/或如果得到保证,可以以更高的初始浓度剂量 给药,减少对引发与补体激活相关的不利副作用的担心。
例如,补体激活在发病机理中对緩和使用嵌合型抗CD20单克隆 抗体 IDEC-C2B8 (IDEC Pharmaceuticals Corp., San Diego, California;可以商品名Rituxan (也称为利妥昔单抗)商购获得) 的治疗的严重首次剂量副效应起着中枢作用。参见,例如,van der Kolk 等人(2001) Sr/〃W /. ^e迈"o/. 115: 807-811。 Rituxan⑧产品 中的利妥昔单抗在中国仓鼠卵巢(CHO)细胞中表达,从而抗体组合物包 含不均一的糖基化特征镨(即,糖形的混合)。已显示利妥昔单抗的 CDC活性与半乳糖含量相关。通过该方式,随着半乳糖残基的数目从0 增加至2摩尔/摩尔重链,CDC活性的水平从对于具有1摩尔半乳糖/ 摩尔重链的抗体(参见, 网址 fda.gov/Cder/biologics/review/ritugen112697 上的 IDEC BLA97-0260,可在互联网上获得)观察到的最大值的80% (p-半乳糖苷酶 处理以从附着至重链的CH2结构域的Asn 297的N聚糖的1, 3和1, 6 甘露糖臂除去所有P-(1,4)半乳糖残基)增加至150% (UDP半乳糖基 转移酶处理以确保P-(1,4)半乳糖残基附着至附着至Asn 297位点的 #聚糖的1,3和1, 6甘露糖臂)。包含抗CD20抗体(所述抗体具有与 利妥昔单抗(rituximab)相同的序列和主要具有GO糖形)的大体上 均一的抗CD20抗体组合物有利地具有减少的CDC活性,从而减少,当 抗体组合物包含不均一的糖基化特征镨(即,糖形的混合)时,通常 与抗体施用后的补体激活相关的不利副作用的可能。
因此,本发明的具有减少的CDC活性和相同的或增加的ADCC活 性的大体上均一的GO糖形抗体组合物可有利地用于治疗应用,作为因 通常与相同序列的抗体的组合物(所述抗体组合物包含不均一的糖基 化特征镨(即,糖形的混合))施用后的补体激活相关的不利副作用 而引起的并发症的结果,所述治疗应用对于一个或多个患者群体迄今 仍然是不合适的、不可取的或无效。此类副作用包括,但不限于,可 与抗体的第一次和/或快速施用相关的中度至严重的副作用,包括,例 如发烧和/或受寒、恶心、呼吸困难、潮红等。参见,例如,vander Kolk 等人(2001) B"7/s力/. ^婦"o7. 115: 807-811和其中引用的参考 文献;Winkler等人(1999) A/ood 94: 2217-2224)。通过该方式,本 发明提供了减少一种或多种与抗体例如单克隆抗体施用后的补体激活 相关的不利副作用的方法,方法包括施用本说明书中上面定义的大体 上均一的抗体组合物,从而至少80%、至少85%、至少90%、 91°/。、 92%、 93°/。、 94%、 95%、 96%、 97%、 98%或至少99%的存在于组合物中的抗体 由G0糖形代表,痕量的前体糖形存在于组合物中。在一些实施方案中, 至少90%、至少95%或至少99%的存在于组合物中的抗体由G0糖形代 表,痕量的前体糖形存在于组合物中。
作为它们的增加的Fc效应子作用的结果,本发明的大体上均一 的主要具有GQ糖型的抗体组合物提供了新的和改进的给药途径的机 会,例如,将已知的治疗性抗体的可能的给药途径扩展至除了输注和
102静脉内给药外的其他给药途径,例如扩展至皮下给药。此外,作为它 们的增加的潜能的结果,本发明的抗体组合物可以以更低的剂量给药, 或以更小的体积给药,和以更低的频率给药。施用的抗体组合物的体 积的减少在其中由与单克隆抗体的输液反应引起的不利事件是体积相 关的情况下是特别有利的。本发明的抗体的增加的效率也为现有的
mAb靶(所述靶可以不对使用更不均一的糖形抗体组合物的抗体治疗 产生反应)打开了新临床适应症,和提供了重访之前未开发的mAb靶 的能力。
按照本发明的方法产生的单克隆抗体可包含在含有药学上可接 受的载体的组合物中。这样的组合物用于治疗需要抗体(所述抗体具 有效应子作用和在一些实施方案中提高的效应子作用)的受试者的方 法,其中FucT的表达被靶向抑制。通过该方式,可以对需要其的受试 者施用按照本发明的方法稳定转化的植物例如浮萍植物中产生的单克 隆抗体。
可按照本发明的方法在经遗传修饰的植物宿主内产生任何抗体。 在一个实施方案中,抗体是治疗性抗体。已批准抗体用于治疗许多病 症,许多另外的治疗性抗体正在开发中。参见,Brekke和Sandlie (2003)
Wer. "77/f Z j'scor. 2 (3) :240,通过引用纳入本文。可通过本 发明的方法表达的治疗性抗体的实例包括,但不限于,靶向CD3抗原 的抗CD3抗体(例如,0KT⑧3);抗血小板gpIIb/IIIa抗体(例如阿昔 单抗(之前称为c7E3 Fab),以ReoPro⑧配销);抗EpCAM抗体(例如, Panorex );耙向CD2Q抗原的抗CD2Q抗体(例如利妥昔单抗,以 Rituxan⑧配销;参见美国专利5, 736, 137,通过引用纳入本文);抗 IL-2受体(例如Zenapax , Simulect );抗ERBB2 (例如曲妥单抗, 以Herceptin⑧配销;参见美国专利6, 165, 464,通过引用纳入本文); 抗TNF-ct (例如,英夫利昔单抗,以Remicade⑧配销)、抗F蛋白(例 如Synagis );耙向CD30抗原的抗C謂抗体(参见,例如,Borchmann 等人(2003) "/oocT 102: 3737-3742和本说明书中下面描述的实施例 6中描述的5F11抗体,也参见W0 03/059282和美国专利申请公开号2004/0006215,通过引用纳入本文;Wahl等人(2002) Ca/ cer紐 61: 3736-3742中描述的SGN-30抗体,AC10抗CD30抗体的嵌合形式, 也参见美国专利申请公开号20040018194和美国专利7, 090, 843,通过 引用纳入本文);靶向抗CD33抗原的CD33抗体(例如Mylotarg⑧;参 见美国专利5, 733,001,通过引用纳入本文);靶向抗CD25抗原的抗 CD52抗体(例如,阿仑单抗,以Campath(B)配销;参见美国专利 5,846, 534,通过引用纳入本文);抗CD20 (例如,Zevalin );抗IgE Fc (例如,omalizumab,在Xolair⑧下销售);抗VEGF (例如,贝伐 单抗,以Avastin⑥酉己4肖;参见,Presta等人.(1997) 57:4593- 9;通过引用纳入本文);抗EGF-R (例如,西妥昔单抗,以 Erbitux⑧西己4肖);抗CDlla (食寸:ft口 efalizumab,在Raptiva⑧下4肖售), 抗IL-8;抗C5;抗TNF-a (例如阿达木单抗,以Humira⑧配销);抗 TGF-P2;抗IL2受体(例如达(克)珠单抗(赛尼哌)和巴利昔单抗 (Simulect));抗ot -4-整联蛋白;抗CD4;抗CD2;抗CD19 (例如MT103, 双特异性抗体);靶向CD22抗原的抗CD22抗体(例如单克隆抗体 BL-22);耙向恶性B细胞上的CD23抗原的抗CD23抗体(例如 IDEC-152);耙向CD80抗原的抗CD80抗体(例如IDEC-114);靶向恶 性B细胞上的CD38抗原的抗CD38抗体;靶向巨噬细胞集落刺激因子 的oc-M-CSF抗体;靶向在多发性骨髓瘤中过度表达的核因子-kB的受 体激活物(RANK)和其配体(RANKL)的抗体;靶向抗恶性B细胞上的 CD40抗原的CD40抗体(例如SGN-40);靼向肺瘤坏死因子相关细胞凋 亡诱导的配体受体l(TRAIL-Rl)的抗体(例如拮抗人单克隆抗体 HGS-ETR1)和在许多实体瘤和造血源的肺瘤上表达的TRAIL-R2)抗HBV 抗体;或抗MHC类型1I抗体。已知这些抗体中的许多抗体需要效应子 活性以进行CDC和/或ADCC功能,例如Herceptin 、 Rituxan 、 Mylotarg⑧和Campath 。
在一些实施方案中,以此处所示方式进行遗传修饰从而改变基糖 基化机构的植物宿主例如浮萍可表达生物活性ot-2b干扰素,例如人 oc-2b-干扰素前体(NCBI蛋白质登录号AAB59402)或成熟人a-2b-干扰素(NCBI蛋白质登录号AAB9402的氨基酸24-188)或其生物活性变 体。人ct-2b-干扰素的生物活性变体的实例在本领域内是已知的。参 见,例如,W0 2005/035767,公开了 ot-2卜干扰素的截短的形式;欧 洲专利EP211148B1;和美国专利4, 748, 233、 4, 801, 685、 4, 816, 566、 4,973, 479 、 4, 975, 276 、 5, 089,楊、5,098, 703 、 5, 231, 176和 5, 869,293;通过引用纳入本文。在其他实施方案中,植物宿主例如浮 萍可表达具有或不具有其伴随信号肽的生物活性成熟人生长激素。植 物宿主也可表达人生长激素的生物活性变体。参见,例如,WO 02/10414, 涉及使用浮萍表达系统表达生物活性多肽。
在其他实施方案中,植物宿主例如浮萍可表达纤溶酶原、微小纤 溶酶原或其生物活性变体。有待植物宿主中表达的纤溶酶原、微小纤 溶酶原可来自任何哺乳动物来源。在一些实施方案中,纤溶酶原、微 小纤溶酶原是人或猪的。参见,例如,W0 2005/078109,涉及使用浮 萍表达系统表达这些蛋白质。
这些异源性多肽的"生物活性变体"意指通过对天然蛋白质的N 末端和/或C末端缺失(所谓的截断)或添加1个或多个氨基酸;通过 在天然蛋白质的1个或多个位点缺失或添加1个或多个氨基酸;或通 过在天然蛋白质的1个或多个位点置换1个或多个氨基酸来从天然多 肽产生的多肽。本发明包括的异源性多肽的变体保持天然多肽的生物 活性。
例如,oc-2b-干扰素的生物活性变体持续具有天然a-2b-干扰素 的希望的生物活性,包括增加对病毒感染的抗性的能力,或调控a-2b-干扰素调控的基因靶的转录的能力。这样的生物活性变体可由例如遗 传多态性或人工操作产生。目的异源性蛋白的生物活性变体具有与目 的异源性蛋白的氨基酸序列至少大约50%、 60%、 65°乂、 70%、通常至少 大约75%、 80%、 85%,优选至少大约90y。、 91%、 92%、 93%、 94%、 95%、 96%、 97%,和更优选至少大约98。/。、 99%或更大的序列同一性。因此, 例如,天然ot-2b-干扰素的生物活性变体具有与人a-2b-干扰素前体 (NCBI蛋白质登录号AAB59402)或成熟人ot-2b-干扰素(NCBI蛋白质登录号AAB9402的氨基酸24-188)的氨基酸序列至少大约50%, 60%, 65%, 70°/。,通常至少大约75%, 80%, 85%,优选至少大约90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,和更优选至少大约98%, 99%或更大的序列 同一性,其中使用本说明书中上面鉴定的参数确定序列同一性。因此, 目的天然异源性蛋白南的生物活性变体可以与该蛋白相异少至1-15 个氨基酸残在,少至1至10个,例如6至10个,少至5个,少至4、 3、 2或甚至1个氨基酸残基。
在一个实施方案中,已以此处所示的方式进行遗传修饰从而改变 其糖基化机构的植物宿主是表达生物活性多肽的稳定地转化的浮萍植 物或浮萍细胞或浮萍结节,因为成本或物流限制或两者,不能通过现 有的基因表达系统有效地商业化生产所述多肽。例如,因为蛋白质干 扰细胞的生活力、细胞增殖、细胞分化或哺乳动物细胞中的蛋白质装 配,因而一些蛋白质不能在哺乳动物系统中表达。这样的蛋白质包括, 但不限于,视网膜母细胞瘤蛋白(retinoblastoma protein) 、 p53、
制管张素和瘦素。本发明可有利地用于产生哺乳动物调控蛋白;不可 能假定高等植物和哺乳动物之间存在巨大的进化距离,因为这些蛋白 质将在浮萍中干扰调控过程。转基因浮萍还可用于生产大量蛋白质例 如挑战现有表达系统的生产能力的血清白蛋白(特别地,人血清白蛋 白)、血红蛋白和胶原蛋白。
最后,高等植物系统可进行基因工程改造以能够远比哺乳动物系 统更容易地产生生物活性多聚体蛋白(例如单克隆抗体、血红蛋白、 P450氧化酶和胶原等)。用于在浮萍中生产生物活性多聚体蛋白的一 个示例性方法使用包含编码所有多肽亚基的表达载体。参见,例如 During等人(1990) "/oA 15:281和van Engelen等人
(1994)户/s/^亂A/o/. 26: 1701。可将包含XylT和/或FucT抑 制性多核苷酸的表达盒导入这样的载体。然后使用任何已知的方法例 如基因枪轰击或农杆菌介导的转化将该载体导入浮萍细胞。该方法导 致产生表达装配多聚体蛋白所必需的所有多肽以及改变糖蛋白的N聚 糖的糖基化模式的XylT和/或FucT抑制性序列的克隆性细胞系。因此,1个或多个编码单克隆抗体或Fat/ 抗体片段的重链和轻链的表达载体,和包含XylT和/或FucT抑制性多 核苷酸的表达栽体,在浮萍中从表达的重链和轻链装配单克隆抗体或 抗体片段。
关于该方法的变型是产生单基因构建体,将来自这些构建体的 DNA混合在一起,然后使用基因枪轰击或农杆菌介导的转化将该DNA 混合物递送入植物细胞。作为进一步的变型, 一些或所有的载体可编 码多聚休蛋白的多于1个的亚基(即,以使存在比多聚体蛋白中的亚 基数目更少的浮萍克隆杂交)。在可选择的实施方案,各浮萍克隆已进 行了遗传修饰,从而改变其糖基化机构和表达多聚体蛋白的至少l个 亚基,将分泌各亚基的浮萍克隆在一起培养,从而在培养基中从不同 的分泌亚基装配多聚体蛋白。在一些情况下,可以希望在转化的浮萍 植物或浮萍结节培养物中产生少于多聚体蛋白的所有亚基,或甚至单 个蛋白质亚基,例如以进行工业或化学加工或用于诊断、治疗或接种 目的。
在本发明的一些实施方案中,目的转基因植物宿主是此处描述的 糖蛋白的"高表达子",包括,例如,包含主要为GO聚糖结构的N 连接的聚糖的糖蛋白。"高表达子"意指已进行基因工程改造从而产 生此处描述的糖蛋白的转基因植物宿主能够以这样的水平(即以使目 的糖蛋白代表至少5%或更多的转基因植物宿主中产生的总的可溶性 蛋白的水平)产生目的糖蛋白。在一些实施方案中,"高表达子"是 已进行基因工程改造从而产生此处描述的糖蛋白以使目的糖蛋白代表 至少5%、 6°/。、 7%、 8%、 9%、 10%、 11%、 12%、 13%、 14%、 15%或更多的 转基因植物宿主中产生的总的可溶性蛋白。因此,例如,在一个实施 方案,转基因植物宿主是已进行基因工程改造从而抑制XylT和FucT 的表达的转基因浮萍,转基因浮萍是此处描述的糖蛋白的高表达子。 在这些实施方案中的一些实施方案中,转基因浮萍是主要具有本说明 书中上面描述的GO糖形的聚糖最优化的单克隆抗体的高表达子。在其 他实施方案,转基因浮萍表达聚糖最优化的单克隆抗体以使该糖蛋白代表大约5°/。、 6°/。、 7%、 8°/。、 9°/。、 10%、 11%、 12%、 13%、 14%、 15%或更 多的总的可溶性蛋白。
潜蛋^W速一步乂源^
在一些实施方案,可以希望本发明的糖蛋白包含具有附着至1,3 和/或1,6甘露糖臂的末端p (1,4)-半乳糖残基的复杂N聚糖。不受理 论束缚,这些末端半乳糖残基可促成糖蛋白的治疗性功能和/或药物代 谢动力学活性。要认识到,可将本发明的方法与本领域内已知的其他 方法配对以进一步修饰本发明的糖蛋白,以使附着至其的l个或多个 N聚糖包含l个或多人末端半乳糖残基,即,其中N聚糖的1个或多 个由Gl或G2聚糖种类代表。通过该方式,可以例如使用糖基转移酶 酶促修饰本发明的糖蛋白组合物,包括此处描述的单克隆抗体以获得 具有对于Gl,优选G2聚糖种类大体上均一的糖基化特征i普的糖蛋白。 参见,例如,美国专利申请公开号2004/0191256,通过以其全文引用 纳入本文,其教导通过糖基化转移酶修饰底物糖蛋白(substrate glycoprotein)以获得其中基本上所有N连接的聚糖种类为G2形式的 糖蛋白。通过该方式,目的糖蛋白可以在半乳糖基转移酶和金属盐存 在的情况下与活化的半乳糖反应。半乳糖基转移酶可以是哺乳动物P 1,4半乳糖基转移酶(GalT),例如人GalT,活化的半乳糖可以是例如 UDP半乳糖。
可选择地,可就它们的糖基化机构进一步修饰具有以此处所示的 方式沉默的FucT和XylT的表达的本发明的转基因植物,以使它们表
达半乳糖基转移酶和有效地将末端半乳糖残基附着至其中产生的内源 性和异源性糖蛋白的N聚糖。通过该方式,可通过导入提供半乳糖基 转移酶的表达的核苷酸构建体例如表达盒来进一步修饰本发明的转基 因植物。半乳糖基转移酶可以是哺乳动物P 1,4半乳糖基转移酶 (GalT),例如,人GalT (参见,例如,美国专利6, 998, 267,通过引用 其全文纳入本文)或杂交体GalT (参见,例如,W0 03/078637,通过引 用其全文纳入本文),其包含至少部分第一糖基化转移酶(例如植物糖基化转移酶例如木糖基转移酶、N乙酰氨基葡萄糖转移酶或岩藻糖基 转移酶)的细胞质尾-跨膜区-茎区域和至少部分第二糖基转移酶(例如 哺乳动物糖基转移酶,例如人GalT)的催化区域。通过在植物例如浮 萍中沉默XylT和FucT的表达,和在植物例如浮萍中提供GalT的表达, 例如人GalT或包含GalT例如人GalT的催化结构域的部分的杂交酶的 表达,可能获得产生具有改变的糖基化模式的内源性和异源性糖蛋白 的转基因植物,其中附着至其的N连接的聚糖具有减少的植物特异性 木糖或植物特异性岩藻糖残基的附着,并包含末端半乳糖残基(即, G2聚糖种类)。通过该方式,可从本发明的转基因植物获得对于G2 聚糖种类具有大体上均一的特征语和/或对G2糖形大体上均一的糖蛋 白。
在其他实施方案,可以希望进一步修饰本发明的糖蛋白的糖基化 模式,其中附着至其的N连接的聚糖进一步包含附着至一个或两个半 乳糖残基(该残基附着至1, 3和1, 6甘露糖臂)的末端唾液酸残基。 末端唾液酸残基的加入可以是一些治疗性蛋白的持续稳定性和在一些 情况下发挥功能所必需的。
取决于转基因植物系统,糖蛋白的天然唾液酸化可发生。因此, 文献中已报导培养的拟南芥、烟草和苜蓿属培养细胞合成唾液酸化的 糖蛋白(Shah等人(2003)艇.WofecA. 21 (12): 1470-1471; Joshi 和Lopez (2005) Cwrr. 戶7a;2f8 (2): 223-226)。更特别
地,报导了日本水稻表达活性唾液酸转移酶样蛋白(Takashima等人 (2006) /. (Tokyo) 139 (2): 279-287)。因此,现有正交报
导,植物具有唾液酸化糖蛋白所必需的机构。
当希望进一步修饰本发明的糖蛋白糖基化模式时,其中附着至其 的N连接的聚糖进一步包含附至1个或2个半乳糖残基(所述半乳糖 残基附着至1, 3和1, 6甘露糖臂)的末端唾液酸残基,本发明的转基 因植物可进行改变以表达P-1,4半乳糖基转移酶,例如,人P-1,4
半乳糖基转移酶,和表达或过量表达唾液酸转移酶。因此,例如,转 基因植物可进一步进行改变以表达唾液酸转移酶例如oc-2, 3-和/或ct-2, 6-唾液酸转移酶。参见,例如W0 2004/071177;和Wee等人 (1998)尸/a/2f Ce// 10: 1759-1768;通过引用其全文纳入本文。可选 择地,本发明的转基因植物可进行改变以表达P -1, 4半乳糖转移酶, 例如,人P-1,4半乳糖转移酶,和表达植物宿主的唾液酸途径中缺乏 的任何其他酶。可在初步观察特定植物宿主例如浮萍是否表达天然或 重组产生的糖蛋白上的包含唾液酸的N聚糖后,确定所使用的策略。 例如,如果没有关于转基因植物宿主特别是经基因工程改造表达P -1,4半乳糖基转移酶的转基因植物宿主内产生的糖蛋白的N聚糖上存 在末端唾液酸残基的证据,那么可使用这两种策略中的1个或2个来 获得目的转基因植物宿主内产生的糖蛋白的N聚糖的末端唾液酸化。
可选择地,可通过体外酶的加工来修饰对于G2聚糖种类或G2糖 形大体上均一的本发明的糖蛋白组合物;参见,例如,美国专利申请
发明者C·G·皮勒, K·M·寇克斯, L·F·迪凯, 王明波 申请人:比洛克西治疗公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1