专利名称:表达靶向内腔的蛋白质的转质体植物的制作方法
表达耙向内腔的蛋白质的转质体植物本发明涉及在植物细胞的类囊体内腔(thylakoid lumen)中表达重组蛋白质的 构建物和方法。植物质体(plastid)(叶绿体、淀粉体、黄化质体、色质体等)源自称为前质体的 共同前体,这些植物质体负责重要化合物,例如氨基酸、复杂的碳水化合物、脂肪 酸和色素的产生。植物细胞通常含有500-10,000个拷贝的120-160千碱基的小环状 质体基因组,其含有单拷贝和复制的DNA区段。因此,可工程改造植物细胞使 之含有最多达20,000个拷贝的特定感兴趣基因,从而可能极高水平地表达外来 基因并累积重组蛋白质最高达细胞可溶性总蛋白质的40y。(DeCosa等,2001, Nat.Biotechnol.19, 71-74)。此外,叶绿体转基因品系中未见基因沉默的报道, 虽然转录物的累积水平比细胞核转基因植物高169倍(Lee等,2003, Mol. Breeding, 11, 1-13)。另外,大多数植物的质体是母体遗传的。所以与细胞核 中表达的异源基因不同,质体中表达的异源基因不能经花粉传播。因而极大限 制了此种转基因在环境中的散播和传播至毗邻植物的风险。就结构而言,叶绿体是复杂的细胞器,其包含三种不同的可溶相(soluble phase)。叶绿体为双层膜的包膜(double-membrane envelope)所包围,该包膜封闭 形成膜间隙(intermembrane space)。主要的可溶相是间质,这是(发生)碳固定、氨 基酸合成和许多其它途径的部位。主膜(dominant membrane)是捕捉光并合成ATP 的广泛交联的类囊体网络。类囊体的膜封闭第三可溶相,形成类囊体内腔,其中容 纳了许多外源性光合成蛋白质以及许多其它蛋白质(C. Robinson等,2001, Traffic 2:245-251)。只有少数叶绿体蛋白质在该细胞器内编码与合成。大多数叶绿体蛋白质在细 胞核中编码,在细胞质中合成为前体蛋白并在翻译后转运入叶绿体亚区室之一。由 于必须通过所存在的不同膜系统,因而需要特定的可能特别复杂的细胞分选信号。已表征了使蛋白质靶向叶绿体的类囊体内腔的两种不同分泌途径。第一条途 径是涉及细菌中SecYEG输出机制的Sec-依赖性途径。第二条途径是pH-依赖性机制,其特征在于转运肽(transitpeptide)中有两个连续的保守性精氨酸,即Tat(双生 精氨酸转运酶)途径。经Sec途径靶向内腔的蛋白质通常以未折叠的状态转运,而 经Tat途径输入的蛋白质可以折叠状态转运。类囊体的加工蛋白酶加工通过任一途 径输入内腔的蛋白质,切除所转运肽的羧基端部分(C. Robinson等,traffic2001, 2:245-251)。叶绿体的类囊体内腔可能是累积某些重组蛋白质的最佳植物细胞区室,因为 其氧化稳定性高并含有特定蛋白酶(Z. Adams等,TRENDS in Plant science,第7 巻,No 10, 2002)。尽管如此,很少考虑将其用于重组蛋白质的靶向和累积。美国专利US 6,512,162将抑肽酶编码序列与petA基因融合,从而使融合的 petA::抑肽酶蛋白能耙向植物细胞的类囊体膜。尸e"是编码细胞色素f(petA)蛋 白的叶绿体基因组的基因,已有报道说该蛋白是含有位于叶绿体类囊体膜中的 跨膜区的多肽,其N-末端区域在类囊体内部空间(intrathylakoidspace)中,而15 个氨基酸的C末端序列在基质中(SJ. Rothstein等,Proc. Natl. Acad. Sci. USA, 第82巻,第7955-7959页,1985)。因此,petA::抑肽酶融合蛋白中的抑肽酶应 位于基质中,其中抑肽酶编码序列与细胞色素f(petA)编码序列的3'末端相连。因此,仍需要能明确将感兴趣肽定位于叶绿体类囊体内腔中的方法和手段。本发明首次提供利用细胞核所编码蛋白质的内腔靶向信号序列,使由整合入 叶绿体基因组中的转基因编码的重组蛋白质耙向叶绿体类囊体内腔的有用核酸序 列。这种方案利用整合入叶绿体基因组中的转基因的高水平表达,从而使大量重 组蛋白质累积在具有特定特征,特别是氧化还原特性、含有蛋白酶和折叠活性的细 胞区室中。此外,采用此方案可能在植物叶绿体中产生具有非甲硫氨酸N-末端的重组蛋 白质。附图简述 '
图1:质粒pAPR20的图谱本发明的主题是一种嵌合型基因,其包含按照转录方向以功能方式彼此相连的a) 在植物质体中有功能的启动子,b) 细胞核所编码蛋白质的甲硫氨酸N-末端内腔靶向信号肽的编码核酸序列, 其翻译性融合于,C)编码某肽的异源核酸序列,d)任选在植物细胞的质体中具有活性的终止子。靶向叶绿体类囊体内腔区室的细胞核编码蛋白质具有特征性的二连转运肽(bipartite transit peptide),其由基质靶向信号肽和内腔靶向信号肽构成。基质靶向 信息位于该转运肽的氨基端部分。内腔靶向信号肽位于该转运肽的羧基端部分,其 含有靶向内腔的所有信息。内腔靶向信号肽显示与细菌信号肽极其相似,可分成荷 电的N-末端结构域、疏水核心和极性更高的C-末端结构域,其结束于相对此末端 切割位点的-3位和-1位含有的短链残基(von Heijne等,Eur. J. Biochem. 80, 535-545, 1989)。本领域技术人员熟知根据蛋白质的氨基酸序列或相应基因的核酸序列来预测 细胞核所编码蛋白质的内腔耙向信号肽。作为非限制性例子的SignalP (Nielsen等,Int. J. Neural Syst 8:581-599, 1997) 是预测二连转运肽和内腔蛋白质(lumenal protein)的内腔靶向信号肽的合适工 具。可实施的另一方法是利用软件TargetP (Emanuelsson等,J Mol Biol 300:1005-1016, 2000),从而能大规模预测细胞核所编码蛋白质的亚细胞定位和 通过手工筛检TargetP-预测的叶绿体蛋白质中的双生-精氨酸基序进行研究 (Kieselbach等,Photosynthesis research, 78:249-264,2003)。近年来高等植物叶绿体的蛋白质组学研究成功鉴定了本发明可能使用的许多 细胞核编码的内腔蛋白质(Kieselbach等,FEBS LETT 480:271-276, 2000; Peltier 等,Plant Cell 12:319-341 , 2000; Bricker等,Biochim. Biophys Acta 1503:350-356, 2001)、其内腔耙向信号肽。Kieselbach等,Photosynthesis research, 78:249-264, 2003报道了鼠耳芥属04m6Wo;w^)的约80种蛋白质以及菠菜和豌豆的同源蛋白 质。具体地说,纳入本说明书作为参考的该出版物的表2披露了以登录号鉴别 的85种叶绿体内腔蛋白质。此外,近来发表的大米基因组草图(Goff等,Science 296:92-100, 2002)是可能用于本发明的内腔靶向信号肽合适来源。技术人员熟知质体中的正常翻译始于甲硫氨酸。细胞核所编码蛋白质的内腔 靶向信号肽可能含有甲硫氨酸作为N-末端氨基酸,或不含。按照本发明,编码甲硫氨酸的ATG翻译起始密码子框内融合于编码内腔耙向 信号肽的核酸分子的5'端,或将这种内腔靶向信号肽替换为没有起始甲硫氨酸的 N-末端氨基酸。可以从,例如植物来源产生的基因组DNA或DNA文库分离编码内腔靶向信 号肽的核酸分子。或者,可采用重组DNA技术(例如,PCR)或化学合成方法制备 它们。可利用本发明的分子或这些分子的各部分或这些分子的逆向互补链(视情况 而定),例如通过标准方法杂交(参见,例如Sambrook等,1989,《分子克隆, 实验室手册》(Molecular Cloning, A Laboratory Manual),第二版,冷泉港实验 室出版社(Cold Spring Harbor Laboratory Press),冷泉港(Cold Spring Harbor),纽 约州)来鉴定和分离这种核酸分子。可采用本领域技术人员熟悉的技术,特别是例 如Sambrook等(1989,《分子克隆,实验室手册》(Molecular Cloning, a Laboratory Manual), Nolan C编,纽约冷泉港实验室出版社(Cold Spring Harbor Laboratory Press))所述的那些技术从细胞核编码的蛋白质获得本发明的甲硫氨酸 N-末端内腔靶向信号肽。细胞核编码的蛋白质可经由两种不同的分泌途径通过类囊体膜耙向进入叶绿 体类囊体内腔区室。第一条途径是Sec-依赖性途径,第二条途径是Tat途径 (Robinson等,Plant Mol Biol 38, 209-221, 1998; Cline等,Annu. Rev. Cell dev. Biol. 12, 1-26, 1996)。本发明人已证明来自利用Sec依赖性途径的细胞核所编码 蛋白质,或利用Tat途径的细胞核所编码蛋白质的内腔靶向信号肽均适合于本发 明。因此,本发明涉及上述嵌合型基因,其中编码内腔靶向信号肽的核酸序列来 自利用Sec依赖性途径或利用Tat途径的细胞核所编码蛋白质,从而能转运通过类 囊体膜。 .、在本发明的一个实施方式中,编码甲硫氨酸N-末端内腔靶向信号肽的核酸序 列选自以下组a) 编码含有SEQ ID NO: 2或4所示氨基酸序列的肽的核酸分子;b) 编码氨基酸序列与SEQ ID NO: 2或4所示氨基酸序列有至少70%、至少80%、至少90%、 95%或99%相同性的肽的核酸分子;c) 含有SEQIDNo: 1或3所示核苷酸序列的核酸分子;d) 其核酸序列与a)或c)所述核酸序列有至少50%、至少60%、至少70%、 80%或90%相同性的核酸分子;e) 其核苷酸序列因遗传密码的简并性而不同于a)、 b)、 c)或d)所示核酸分子的核酸分子;和f) 代表a)、 b)、 c)、 d)或e)所示核酸分子的片段、等位基因变体和/或衍生物 的核酸分子。按照本发明,术语"相同性"应理解为表示与其它蛋白质/核酸的氨基酸/核苷 酸相对应的氨基酸/核苷酸数目,以百分比表示。最好借助计算机程序通过比较SEQ IDNO:l、 SEQIDNO:2、 SEQ. ID NO: 3或SEQ ID NO: 4与其它蛋白质/核酸 来测定相同性。如果与另一序列作比较的序列长度不同,相同性的测定方法是 比较较短序列与较长序列中相同氨基酸的数目来确定相同性百分比。优选利用 熟知且公众可获得的计算机程序ClustalW (Thompson等,Nucleic Acids Research 22 (1994), 4673-4680)测定相同性。通过欧洲分子生物学实验室 (Meyerhofstrasse 1 , D 69117 海德堡,德国)的 Julie Thompson (Thompson@EMBL-Heidelberg.DE) 禾卩 Toby Gibson(Gibson⑨EMBL-Heidelberg.DE)可以获得已公开的ClustalW。还可以从不同的 因特网址,包括IGBMC (遗传学与分子及细胞生物学研究所(Institut de Genetique et de Biologie Moleculaire et Cellulaire), B.P.163, 67404 Illkirch Cedex , 法 国 ; ftp:〃ftp-igbmc.u-strasbg.fr/pub/) 禾B EBI (ftp:〃ftp.ebi.ac.uk/pub/software/)以及EBI的所有镜像因特网址(欧洲生物信息 学研究院(European Bio informatics Institute),威尔克姆特拉斯特基因组园区 (Wellcome Trust Genome Campus),辛克斯顿(Hinxton),剑桥CB 10 ISD ,英国) 下载ClustalW。优选利用1.8版本的ClustalW计算机程序测定本发明蛋白质和其它蛋白质 之间的相同性。如此操作时,以下参数必须设定为KTUPLE=1, TOPDIAG=5, WINDOW=5, PAIRGAP=3, GAPOPEN=10, GAPEXTEND=0.05, GAPDIST=8, MAXDIV-40, MATRIX=GONNET, ENDGAPS(OFF), NOPGAP, NOHGAP。优选利用1.8版本的ClustalW计算机程序测定,例如本发明核酸分子的核苷酸序列和其它核酸分子的核苷酸序列之间的相同性。如此操作时,以下参数必须设定为KTUPLE=4, TOPDIAGS=4, PAIRGAP=5, DNAMATRIX: IUB, GAPOPEN=10, GAPEXT=5, MAXDIV=40, TRANSITIONS:未加权的。按照本发明,术语"以功能方式彼此连接"或"操作性连接"表示组成性嵌 合型基因(component chimeric gene)的特定元件彼此相连的方式使得它们作为一个 单位起作用,从而能表达编码序列。例如,如果某启动子能促进某编码序列表达, 则称该启动子以功能方式连接于该编码序列。按照本发明,术语"以功能方式彼此连接"包括了多顺反子排列的情况,其 中启动子不直接与编码序列相连。可采用本领域技术人员熟悉的技术,尤其是例如Sambrook等(1989,《分子克隆,实验室手册》,Nolan C编,纽约冷泉港实验室出版社)所述的方法 将各种组件装配成本发明的嵌合型基因。确切地说,该嵌合型基因中要包含哪种调 节元件取决于它们要在其中起作用的植物和质体的类型本领域技术人员能选择哪 种调节元件可在给定的植物中起作用并提高蛋白质产量。例如,可将 Shine-Dalgarno (SD)共有序列GGAGG置于该基因上游。或者,可将5'非翻译 区(UTR)插入启动子和基因之间(Staub J.M.和Maliga P., 1993, EMBO J. 12, 601-606)。本领域技术人员知道在质体中较高水平地表达转基因需要利用5'非 翻译区(5,UTR)和3'非翻译区(3,UTR)的调控信号(De Cosa B., Moar W., Lee S.B., Miller M.和Daniell H., 2001, Nat. Biotechnol. 19, 71-74)。本领域技术 人员熟知可能的5'UTR和3,UTR。例如,基因的启动子(Genbank Z00044 的核苷酸1596-1819)包含内源性5,UTR。可使16S核糖体操纵子Prm的启动子 与r6c丄基因的核糖体结合位点区域(5'UTRrbcL)相连。例如,在植物细胞的质体中具有功能的启动子中,特别述及的是编码PSII的 Dl多肽的戸M基因(Staub等,1993 EMBO Journal 12(2):601-606)和调节核糖体 RNA操纵子的组成型/Vt"启动子(Staub等,1992 Plant Cell 4:39-45)。原则上 说,得自质体植物基因或细菌基因的任何启动子均能起作用,本领域技术人员 知道选择哪种可用的启动子来获得所需表达模式(组成型或可诱导型)。本发明的合适启动子是烟草的iVm启动子,该启动子与Ad基因中提供核糖体结合位点的5'非翻译序列部分相连(Svab等,1993, Proc. Natl. Acad. Sci. 90:913-917)。另一合适启动子是编码psn的Di多肽的基因的光依赖性(light-dependent)启动子(StaubJ.M.和Maliga P. , 1993, EMBO J. 12, 601-606)。例如,在植物细胞质体中具有活性的终止子中,特别述及的是戸W基因、r6c丄 基因(编码RuBisCO的大亚基)和基因(编码烟草核糖体蛋白质) (Shinozaki等,1986, EMBO J. 5:2043-2049; Staub J旦禾口 Maliga P., 1993, EMBO J. 12, 601-606)的终止子。按照本发明,术语"翻译性融合于"应表示核酸序列的融合方式使它们代表 一个开放读框,从而在转录后产生一种信使RNA,其在翻译时编码一种多肽。按照本发明,编码细胞核所编码蛋白质的甲硫氨酸N-末端内腔靶向信号肽的 核酸序列翻译性融合于异源核酸序列,这表示第二核酸序列不是天然融合于编码内 腔靶向信号肽的第一核酸序列。在本发明的一个实施方式中,编码某种肽的异源核酸序列衍生自真核生物, 其融合于编码内腔靶向信号肽的核酸序列。在本发明的另一实施方式中,根据烟草(iWcoaam7 ^6fl^m)的叶绿体密码子选 择,设计的编码甲硫氨酸N-末端内腔靶向信号肽的核酸序列和/或异源核酸分子能 优化叶绿体表达。烟草的叶绿体密码子选择见www.Kazusa.or.jp/codon,根据叶 绿体密码子选择表中的频率,在整个编码序列上将密码子随机分配给各氨基酸 残基(Nakamura等,2000, Nucl. Acids Res. 28, 292)。在本发明还有另一实施方式中,编码某肽的异源核酸序列编码含有非甲硫 氨酸N-末端的肽。可以从,例如真核生物或其它来源产生的基因组DNA或DNA文库分离编码 某肽的异源核酸分子。或者,可采用重组DNA技术(例如,PCR)或化学合成方法 制备它们。可利用本发明分子或这些分子的各部分或这些分子的逆向互补链(视情 况而定),例如通过标准方法杂交(参见,例如Sambrook等,1989,《分子克隆, 实验室手册》,第二版,冷泉港实验室出版社,冷泉港,纽约州)来鉴定和分离 这种核酸分子。在本发明还有另一实施方式中,编码某肽的异源核酸序列编码抑肽酶蛋白质。抑肽酶是可从牛的器官或组织,例如胰腺、肺或肝脏提取的一种蛋白酶抑制剂。已 知抑肽酶能抑制各种丝氨酸蛋白酶,包括胰蛋白酶、胰凝乳蛋白酶、纤溶酶和激肽 释放酶,其可治疗性用于治疗心肌梗塞、中风综合征、超溶纤维蛋白的 (hyperfibrinolytic)和急性胰腺炎,以及用于减少心脏外科手术相关的血液损失 (Bidstmp等,1989, Cardiovasc Surg. 44:640-645)。抑肽酶的核酸序列和氨基酸 序列可见Swiss-Prot/TrEMBL数据库(瑞士生物信息学研究院(Swiss Institute of Bioinformatics)与欧洲生物信息学研究院EMBL分院(the EMBL outstation - the European Bioinformatics Institute)合<乍;http:〃us.expasy.org/sprot), 登录号为 P00974。按照本发明,鉴定的抑肽酶蛋白为SEQIDNO:6。本发明另一实施方式的嵌 合型基因中的异源核酸序列编码含有抑肽酶蛋白片段的肽,该肽显示具有与抑肽酶 蛋白相当的生物学活性,或其所编码肽的氨基酸序列与SEQ IDNO:6有至少70。/。、 至少80%、至少卯%、, 95%或99%的相同性。在本发明的其它实施方式中,所述异源核酸序列的核酸序列与SEQ ID NO: 5 有至少50%、至少60%、至少70%或至少75%的相同性。与其它分子同源的核酸分子或多肽及这些分子的组成型衍生物通常是这些分 子的变体,这些变体包含修饰但能执行相同的生物学功能。为此目的,可以修饰不 参与酶活性的氨基酸残基。在本发明中,可釆用体外检验,例如Nct-苯甲酰基-D,L-精氨酸-对硝基苯胺 盐酸盐试验(Lavens等,1993, J. Immunol. Methods, 166(1), 93-102;西格玛 -阿尔德里奇公司(Sigma-Aldrich),产品号B 4875,按照生产商手册进行试验), 根据所述多肽或所述核酸分子所编码多肽抑制丝氨酸蛋白酶的能力来评估该核酸 分子或其所编码多肽的生物学功能。所述变异,例如突变可以是天然方式发生的或 通过诱变引入的。所述变体还可以是合成制备的序列。等位变体可以是天然产生的 变体,也可以是合成制备的变体或通过重组DNA技术产生的变体。因遗传密码简 并性而与本发明核酸分子不同的核酸分子构成了特定形式的衍生物。包含编码抑肽酶的异源核酸分子和因遗传密码简并性而与天然分子的核苷酸 序列不同的序列的嵌合型基因也是本发明的主题。包含编码酶活性有所不同的抑肽酶变体的异源核酸分子的嵌合型基因也是本发明的主题。本发明还涉及指定用于转化植物质体的载体,其特征在于含有至少两条与待 转化植物原质体系中序列的同源序列,所述同源序列侧接至少一个本发明嵌合型基 因。这些序歹i」(组成性嵌合型基因的上游(LHRR)和另一下游(RHRR)元件)能双重 同源重组在含毗连区域LHRR和RHRR的原质体系的基因间区域中。本发明的两条同源重组序列可以毗连,从而能将此嵌合型基因插在原质体系 的非编码(基因间)序列处。在一具体实施方式
中,该序列是质体核糖体RNA操纵 子的一部分。在另一具体实施方式
中,所述非编码序列包含^c丄基因的3'端(编码 mBisCO的大亚基),另一同源序列包含""D基因的5,端(编码乙酰辅酶A羧化酶 的亚基之一)。更具体地说,LHRR片段对应于烟草原质体系的核苷酸 57764-59291(Shinozaki等,1986 -Genbank Z00044)。 RHRR片段对应于烟草原 质体系的核苷酸59299-60536。为获得质体转化,转化DNA必需先通过细胞壁、质膜和细胞器的双层膜然后 到达基质。在这方面,转化质体基因组的最常用技术是粒子轰击(Svab和Maliga, 1993, Proc. Natl. Acad. Sci. USA, 2月1日,90(3):913-917)。在单细胞藻类莱茵衣藻(C7 /am>^owowcw re&/zflW"/)中首次进行了利用高速 微粒的质体转染(Boynton等,1988)。目前,在高等植物中,通常在烟草(Nicotiana tabacum)中进行稳定的质体转化(Svab和Maliga, 1990,Proc. Natl. Acad. Sci. USA 87, 8526-8530; Svab禾口 Maliga, 1993, Proc. Natl. Acad. Sci. USA, 2月1日, 90(3):913-917)。转化大米(Khan M.S.禾口 Maliga, 1999, Nat. Biotechnol. 17, 910-915)、拟南芥04m6Wo;x^ Aa/Z謹)(Sikdar等,1998, Plant Cell Reports 18:20-24)、马铃薯(Sidorov等,1999, Plant J. 19(2):209-216)、欧洲油菜(&a^/ca "a; ^) (Chaudhuri等,1999, WO 00/39313)和番茄(Ruf等,2001, Nat. Biotechnol. 19, 870-875)的质体已见报道。己获得了烟草、番茄、马铃薯和大豆的高产转质体 植物(WO 04/053133)。近年来,转化浮萍(duckweed)质体已见报道(WO 05/005643)。可利用选择性标记来选择转化的质体和细胞,即将嵌合型基因掺入它们原质 体系中的那些细胞(即转质体细胞),还可能获得高产、同质的转质体植物。术语"同质"表示所有细胞含有相同类型的原质体系,并且只含该原质体系。当转质伴植物 的所有细胞只含转化原质体系的拷贝时,它们是同质的。例如,在可用作选择性标记的基因中,特别述及的是两种嵌合型基因,即编 码赋予壮观霉素和链霉素抗性的氨基糖苷3"腺苷转移酶的基因(Svab等, 1993, Proc. Natl. Acad. Sci. 90:913-917)和编码赋予卡那霉素抗性的新霉素磷酸 转移酶的基因(Carrer等,1993, Mol. Gen. Genet. 241:49-56)。其它合适的 候选选择性标记包括赋予甜菜碱醛抗性的基因,例如编码甜菜碱醛脱氢酶的基 因(Daniell等,2001, Curr. Genet. 39:109-116),赋予除草剂耐受性的基因,例 如赋予双丙氨膦(bialaphos)抗性的6ar基因(White等,1990, Nucleic Acid Res. 18(4):1062),和赋予草甘磷抗性的EPSPS基因(US 5 188 642)。或者可利用报道 基因,即编码易于鉴定的酶,例如GUS (P-葡糖醛酸酶)(Staub J.M.和MaligaP., 1993, EMBOJ. 12, 601-606)或绿色荧光蛋白(GFP, Sidorov等,1999, Plant J. 19(2):209-216)的基因,编码色素的基因,或编码调节色素产生的酶的基因。专 利申请WO 91/02071、 WO 95/06128、 WO 96/38567、 WO 97/04130和WO 01/64023描述了这种基因。编码选择性标记的基因可以是编码赋予壮观霉素和链霉素抗性的氨基糖苷3" 腺苷转移酶的基因(Svab等,1993, Proc. Natl. Acad. Sci. 90:913-917)。因此,本发明还涉及将核酸分子整合入它们的原质体系中的转质体植物细胞, 或转质体植物和/或其后代,所述核酸分子包含按照转录方向以功能方式彼此相连的以下部分在质体中具有活性的启动子序列,细胞核所编码蛋白质的甲硫氨酸 N-末端内腔靶向信号肽的编码核酸序列,所述核酸序列翻译融合于编码某肽的异 源核酸序列,和任选在植物细胞质体中具有活性的终止子。在本发明的一个实施方式中,编码某肽的异源核酸序列衍生自真核生物,其 融合于编码内腔靶向信号肽的核酸序列。本发明还涉及属于浮萍科(Lemnaceae)、烟草属植物、马铃薯植物、番琉植物、大豆植物或藻类的转质体植物和/或后代。在一具体实施方式
中,本发明的转质体植物是烟草植物。 在另一实施方式中,本发明涉及本发明植物的可收获植物部分,例如叶片,其中这些可收获部分含有本发明的植物细胞。本发明还涉及制备本发明转质体植物的方法,其中a) 用至少一种嵌合型基因转化植物细胞,所述嵌合型基因包含按照转录方向 以功能方式彼此相连的以下部分在质体中具有活性的启动子序列,细胞核所编码 蛋白质的甲硫氨酸N-末端内腔靶向信号肽的编码核酸序列,所述核酸序列翻译融 合于编码某肽的异源核酸序列,和任选的在植物细胞质体中具有活性的终止子;b) 从步骤a)获得的植物细胞再生植物,和c) 如果需要,从步骤b)获得的植物产生其它植物。按照技术人员已知的方法,例如采用《植物细胞培养方法》(Plant Cell Culture Protocols) 1999, R.D. Hall编,休玛娜出版社(Humana Press), ISBN 0-89603-549-2所述的方法,可再生步骤a)获得的植物细胞产生完整的植物。例如,可通过无性繁殖(例如,利用插枝、块茎或愈伤组织培养和全植物再生) 或有性繁殖,按照本发明方法中步骤c)产生其它植物。为此,优选在受控条件下进 行有性繁殖,即使具有特定特征的所选择植物彼此杂交和繁殖。本发明还涉及在植物细胞中制备感兴趣蛋白质的方法,所述方法包括以下步 骤用本发明嵌合型基因转化质体,在适合于表达该嵌合型基因以及随后信号肽切除的条件下培养含有所述转化质体的植物细胞。本发明还涉及在植物质体中产生非甲硫氨酸N-末端肽的方法,所述方法包括 以下步骤a) 用嵌合型基因转化质体,所述嵌合型基因包含按照转录方向以功能方式彼此相连的以下部分在质体中具有活性的启动子序列,细胞核所编码蛋白质的甲硫氨酸N-末端内腔靶向信号肽的编码核酸序列,所述核酸序列翻译融合于编码某肽、的异源核酸序列,和任选的在植物细胞质体中具有活性的终止子,其中所述异源核酸序列编码非甲硫氨酸N-末端肽;b) 在适合于表达该嵌合型基因以及随后信号肽切除的条件下培养含有所述转 化质体的植物细胞。本发明还涉及在植物质体中产生非甲硫氨酸N-末端肽的上述方法,其中所述 非甲硫氨酸N-末端蛋白质是抑肽酶。本发明还涉及制备感兴趣肽的方法,所述方法包括以下步骤从本发明转质 体植物细胞,或本发明转质体植物和/或其后代,或本发明转质体植物的可收获部分提取感兴趣的肽。这种方法还优选包括先收获所培养的植物和/或这种植物的各部分,例如叶片,再提取感兴趣肽的步骤。该方法还最优选包括先培养本发明植物再收获的步骤。 本发明还涉及制备感兴趣肽的上述方法,其中所述感兴趣肽是抑肽酶。 技术人员知道提取抑肽酶的方法。可采用许多方法分离抑肽酶, 一般包括沉淀方法和/或利用DEAE-纤维素或亲和技术的层析步骤。美国专利US 5,164,482和 J.D. Altman等,1991, Protein Eng, 4(5):593-600描述了这种方法的实例。 以下非限制性实施例具体说明了本发明。实施例1:编码利用Sec-依赖性途径转运通过类囊体膜的甲硫氨酸-N-末端内 腔靶向信号肽的核酸序列在Kieselbach等,2003, Photosynthesis research, 78:249-264所鉴定的内腔 蛋白质中,选择功能未知拟南芥AT5g52970基因,其编码经Sec-依赖性途径分 泌至内腔的蛋白质。在信号肽切除后氨基末端带正电(精氨酸或赖氨酸)的内腔 蛋白质中选择该基因。进行这种预选能提高进一步精确加工融合蛋白并除去抑 肽酶(以精氨酸打头的氨基酸序列)的概率。根据翻译融合于甲硫氨酸N-末端内 腔靶向信号肽的编码核酸序列的异源核酸序列,也可以不预选或依据其它标准 预选。利用SignalP软件(Nielsen等,Int. J. Neural Syst. 8:581-599, 1997)预测 AT5g52970所编码蛋白质的二连转运肽。删除能输入叶绿体的该二连转运肽的 预测氨基末端序列,加入甲硫氨酸作为翻译起始、点,从而获得SEQ ID NO: 2 所示的LSP1序列。实施例2:编码利用Tat途径转运通过类囊体膜的甲硫氨酸-N-末端内腔耙向 信号肽的核酸序列在Kieselbach等,2003, Photosynthesis research, 78:249-264所鉴定的内腔 蛋白质中,选择编码经Tat途径分泌至内腔的亲免素样(immunophilin-like)蛋白 质的拟南芥ATlg20810基因。在信号肽切除后在氨基末端带正电(精氨酸或赖 氨酸)的内腔蛋白质中选择该基因。进行这种预选能提高进一步精确加工融合蛋白并除去抑肽酶(以精氨酸打头的氨基酸序列)的概率。根据翻译融合于编码甲 硫氨酸N-末端内腔靶向信号肽的核酸序列的异源核酸序列,也可以不预选或依 据其它标准预选。利用SignalP软件(Nielsen等,Int. J. Neural Syst. 8:581-599, 1997)预测 ATlg20810所编码蛋白质的二连转运肽。删除能输入叶绿体的该二连转运肽的 预测氨基末端序列,加入甲硫氨酸作为翻译起始点,从而获得SEQ ID NO: 4 所示的LSP2序列。实施例3: LSP/抑肽酶融合蛋白的编码序列根据烟草质体密码子选择(www.kazusa.or.ip/codon),设计能编码与抑肽酶在 氨基末端相融合的LSP1或LSP2(即分别是LSP1::抑肽酶和LSP2:邻肽酶)的合成序 列,从而能优化叶绿体表达。根据叶绿体密码子选择表中的频率,将密码子随机 分配给各氨基酸残基。实施例4:叶绿体转化载体pAPR20和pAPR21将LSP1::抑肽酶和LSP2::抑肽酶编码序列引入衍生自pBluescript质粒(斯特 拉特基因公司(Stratagene))的叶绿体转化载体,分别是载体pAPR20和pAPR21。 pAPR20如图1所示。pAPR21与pAPR20相同,除了 LSP2取代了 LSP1。这些载体含有烟草基因组,LHRR-Nt(l)和RHRR-Nt(l)的区域,从而能将转 基因靶向整合在Ac丄和flccD基因之间。LHRR片段对应于烟草原质体系的核苷酸 57764-59291(Shinozaki等,1986 - Genbank Z00044)。 RHRR片段对应于烟草原质 体系的核苷酸59299-60536。如Svab和Maliga (1993)所述,嵌合型可选择标记基因aa^4编码大观霉素抗 性。将其表达置于16S核糖体操纵子的启动子(Prrn(p)-Nt: Genbank Z00044的核 苷酸102561-102677)控制下,该启动子后是AA基因的核糖体结合位点 (5'UTRrbcL-Nt: Genbank Z00044的核苷酸57569-57584)。转录终止子 3'psbA-Nt(2)来自戸M基因(反向的Genbank Z00044的核苷酸146-533)。将LSP::抑肽酶融合(蛋白)编码序列置于戸W基因启动子(PpsbA-Nt(2): 反向的Genbank Z00044的核苷酸1596-1819)的控制下。转录终止子3'rbcL-Nt(2)来自Ac丄基因(反向的Genbank Z00044的核苷酸59036-59246)。 此载体的其余元件衍生自pBluescript载体。实施例5:叶绿体转化无菌条件下用补加了蔗糖(3。/o)和植物凝胶(phytagar)(7 g/l)的MS培养基 (Murashige和Skoog, 1962)培养烟草(var. PBD6)植物。按照Finer等(1992)所述 技术用实验室构建的粒子枪(particle gun)轰击3-5 cm的叶片远轴侧(abaxial side)。在CaCl2(0.8-1.0 M)和亚精胺(14-16 mM)存在下,用金微粒吸附载体 pAPR23的DNA(每次轰击5微克)。将处理的叶片置于补加了萘乙酸(naphtalene acetic acid) (ANA; 0.05 mg/l)、 6-苄基氨基嘌呤(BAP; 2 mg/l)的相同MS培养 基中2天。然后将叶片切成平均长5mm见方的方块,用补加了 500 mg/1盐酸 壮观霉素的上述含激素培养基培养来选择转质体植物。每10天用新鲜选择培 养基再次培养叶片。4-6周后,分离无色外植体(bleachedexplant)上出现的绿化 愈伤组织或小植株,转移至补加了 500 mg/l盐酸壮观霉素且不含激素的MS培 养基(3。/。蔗糖和7g/l植物凝胶)中。再生的枝条一旦生根,即转移至温室中。实施例6:所选品系的PCR分析采用PCR分析用壮观霉素选择的pAPR20和pAPR21所产生的第一种植物来 检测转基因是否存在于烟草叶绿体基因组的预定位置。该分析利用两种不同的引物 对(1)和(2)。第一对(l)引物能证实(转基因)整合在预定位点,其中一个引物位于转化载体 pAPR20或pAPR21中存在的LHRR片段前的Ac丄基因中(orbcL52F: 5'-atgtcaccacaaacagagactaaagc-3'),第二个引物以反向位于AADA编码区开始处 (aadA10R: 5'- gttgatacttcggcgatcaccgcttc-3')。观察到约1.8 kb的扩增产物证实已 整合。第二对(2)引物能扩增包含LSP::抑肽酶融合(基因)的片段,其中一个引物位于 戸M启动子的末端(psbA230F: 5'-tttgtagaaaactagtgtgcttggg-3'),第二个引物以反 向位于终止子3'rbcL中(5'-atgtcaccacaaacagagactaaagc-3')。观察到约550 bp的扩增产物证实烟草叶绿体基因组中存在LPS::抑肽酶表达盒。扩增包括30轮循环(94°C、 45秒,54°C、 60秒,72。C120秒)。对于该两对引物之一,3种所选植物(APR20-1-2、 APR21-19-1和APR21-19-2)的PCR反应呈阳性,证明它们是转质体,如预计的一样整合了 pAPR20和pAPR21的表达盒。实施例7:抑肽酶的Western印迹分析在变性条件下通过SDS-PAGE分析抑肽酶的表达,然后进行Western印迹。 将Tris-HCl 25mM、 NaCl 100 mM、 Triton X100 0.5%、甘油10%, pH8用作提 取缓冲液,从转基因植物的液氮研磨叶片中提取可溶性总蛋白。然后通过 SDS-PAGE(12y。丙烯酰胺)分离各提取物的20微克可溶性蛋白(以布拉德福德试验 (Bradford assay)定量测定),并转移至PVDF膜。该实验还包括标准量的抑肽酶(200 ng;西格玛公司(Sigma))以及野生烟草提取物。转移后,根据生产商的使用说 明书(罗氏公司(Roche))用封闭试剂封闭膜,然后在4T:用抗抑肽酶的小鼠单克 隆抗体温育过夜。洗涤后,用抗小鼠免疫球蛋白并与碱性磷酸酶偶联的第二单 克隆抗体(西格玛公司A3562)温育膜。利用拜尔莱得公司(Biorad)(免疫星公司 (Immim-Star))的试剂盒显示免疫复合物,用胶片记录所产生的化学光 (chimioluminescence)。该实验的结果明确显示对于两种类型的构建物(pAPR20 禾口pAPR21),可加工和切割LSP::抑肽酶融合蛋白,因为western印迹观察到一 条独特条带精确迁移到与真品标准抑肽酶相同的位置。因此,能高效切除通过 Sec(pAPR20品系)或Tat途径(pAPR21品系)将抑肽酶定位于内腔的所选择信号 肽。对于pAPR21品系,估计表达水平约是可溶性总蛋白质的0.1-0.2%,对于 pAPR20品系约是0.5%。实施例8:重组抑肽酶的电喷雾LC/MS分析用PBS缓冲液从pAPR20和pAPR21载体所产生植物的转基因叶片提取重组 抑肽酶,利用单克隆抗体免疫纯化。分离的蛋白质经Ziptip层析柱处理(ziptiped) 以除去盐,用Ionics EP- 10+ LC/MS/MS仪器分析。将分别对应于pAPR20和pAPR21的样品的LC/MS电喷雾图谱与抑肽酶标准品的电喷雾图谱作比较。对应于pAPR20的样品的LC/MS电喷雾图谱显示一个保留时间为3.31分 钟的峰。该多电荷离子获得的平均分子量是6532 ±2道尔顿。与标准抑肽酶相 比,质量的差异有16道尔顿或一个氧原子的质量。分离的抑肽酶看来被氧化。 对应于pAPR21的样品的LC/MS电喷雾图谱显示一个保留时间为3.36分钟的 峰。该多电荷离子获得的平均分子量是6516±1道尔顿。其质谱就像标准抑肽 酶。这些实验明确显示植物中(planta)切割发生在信号肽与成熟抑肽酶之间的预计 位点,在N-末端精氮酸开始,还显示其在氨基酸水平对应于真品抑肽酶。样品 pAPR20中的增补质量(supplementary mass)是16,可能对应于一个残基的氧化, 可能是独特的所编码甲硫氨酸。实施例9:重组抑肽酶预与胰蛋白酶结合为检测转基因叶绿体中所产生的重组抑肽酶是否处于活性构象,用PBS缓 冲液制备载体pAPR20和pAPR21所产生品系的叶片提取物,37'C使对应于20 微克可溶性总蛋白质的样品与各种用量的胰蛋白酶(O、 28、 112、 450或1800 纳克)温育30分钟。然后在非还原条件下采用SDS-PAGE分离样品,利用抗抑 肽酶的单克隆抗体进行western分析。对于两种类型的提取物,该分析显示一 旦向样品中加入胰蛋白酶,即出现较高分子量的条带。该新条带对应于抑肽酶 与胰蛋白酶的复合物。当加入足够胰蛋白酶时,没有残留游离的抑肽酶,只检 测到该复合物。该实验显示含有载体pAPR20和pAPR21的质体转化体中产生的所有重组 抑肽酶处于活性构象,从而能结合胰蛋白酶。
权利要求
1. 一种嵌合型基因,其包含按照转录方向以功能方式彼此相连的a)在植物质体中具有功能的启动子,b)细胞所核编码蛋白质的甲硫氨酸N-末端内腔靶向信号肽的编码核酸序列,其翻译融合于,c)编码某肽的异源核酸序列,d)任选在植物细胞质体中具有活性的终止子。
2. 如权利要求1所述的嵌合型基因,其特征在于,编码内腔靶向信号肽的所 述核酸序列来自利用Sec-依赖性途径或Tat途径转运通过类囊体膜的细胞核编码蛋 白质。
3. 如权利要求1-2中任一项所述的嵌合型基因,其特征在于,编码某肽的 所述异源核酸序列编码抑肽酶蛋白质。
4. 一种指定用于转化植物质体的载体,其特征在于,所述载体含有至少两条 与待转化植物原质体系中序列同源的序列,所述同源序列侧接至少一个如权利要求 1-3中任一项所述的嵌合型基因。
5. —种转质体植物细胞,其特征在于,所述植物细胞含有至少一个如权利 要求1-3中任一项所述的嵌合型基因。
6. —种包含如权利要求5所述转质体植物细胞的转质体植物和/或其后代。
7. 如权利要求6所述的转质体植物和/或其后代,其特征在于,它们为藻类、 浮萍科、烟草属植物、马铃薯、番茄或大豆植物。
8. 如权利要求6-7中任一项所述植物的可收获部分,所述部分包含如权利 要求5所述的植物细胞。
9. 一种在植物细胞中制备感兴趣蛋白质的方法,所述方法包括以下步骤a) 用如权利要求1-2中任一项所述的嵌合型基因转化质体;b) 在适合于表达该嵌合型基因以及随后信号肽切除的条件下培养含有所述转 化质体的植物细胞。
10. —种在植物质体中产生非甲硫氨酸N-末端肽的方法,所述方法包括以下步骤a) 用如权利要求1-2中任一项所述的嵌合型基因转化质体,其中所述异源核酸序列编码非甲硫氨酸N-末端肽;b) 在适合于表达该嵌合型基因以及随后信号肽切除的条件下培养含有所述转 化质体的植物细胞。. '
11. 如权利要求IO所述的方法,其特征在于,所述非甲硫氨酸N-末端蛋白质是抑肽酶。
12. —种制备感兴趣肽的方法,所述方法包括以下步骤从如权利要求5所述转质体植物细胞,或如权利要求6-7中任一项所述转质体植物和/或其后代,或 如权利要求8所述转质体植物的可收获部分提取感兴趣的肽。
13. 如权利要求12所述的方法,其特征在于,所述感兴趣的肽是抑肽酶。
全文摘要
本发明涉及在转质体植物细胞的类囊体内腔中表达重组蛋白质的构建物和方法。此外,本发明涉及能在类囊体内腔中表达感兴趣基因的转质体植物细胞和植物。
文档编号C12N15/82GK101263229SQ200680033582
公开日2008年9月10日 申请日期2006年9月14日 优先权日2005年9月16日
发明者G·提索特-莱库埃勒, H·嗄纳德, M·杜巴尔德 申请人:拜尔农科股份有限公司