专利名称:用解脂亚罗威阿酵母转化株表达和分泌异源蛋白质的制作方法
技术领域:
本发明涉及酵母蛋白的分泌技术。更具体地说,涉及重组解脂亚罗威阿酵母(Yarrowia lipolytica)克隆载体,包括为哺乳动物蛋白质(例如凝乳酶原)和其他多肽的表达和分泌编码的异源DNA;涉及表达载体,包括解脂亚罗威阿酵母基因启动子(例如XPR2或LEU2)、碱性蛋白酶信号(或前顺序)、酶原区(pro region)、XPR2终止区,以及由于遗传密码简并性或使用其它解脂亚罗威阿酵母基因成分产生的变异体及其功能等同物。此外,本发明还涉及携带所述表达载体和分泌载体的酵母转化株,它们在产生天然功能状态的异源蛋白质中的应用;以及完成上述各项的方法。
稳定而又充分地提供对工业(例如凝乳酶原、牛生长激素)或医用(例如尿抑胃激素、组织纤维蛋白溶酶原激活剂、人过敏毒素C5a)有着重要价值的各种蛋白质或多肽,特别是提供易于获得的功能态优质产品的原料,这种经济上的诱惑力,导致许多研究人员把DNA重组技术应用于作为生产异源蛋白质“工厂”的微生物。
由于从重组宿主细胞特别是大肠杆菌的胞内积累中回收具有生物活性的外源或异源(外来的)蛋白质时遇到一些困难,所以,作为有可能解决困难的方法,广泛的研究集中在蛋白质的分泌上。在大肠杆菌中,异源蛋白质往往是以可折射光的包涵体的状态在细胞内产生的。该蛋白质通常水溶性很低,而且很少有或者没有生物活性。从可折射光的包涵体中提取该蛋白质通常包括苛刻的化学处理,这种处理可能花费昂贵而回收到的所需的有生物活性的天然蛋白质微乎其微或者一无所获。此外,为了释放可折射光的包涵体,需要破坏细胞,因而所述蛋白被大肠杆菌产生的不良物质污染的可能性也随之加剧。除了大肠杆菌外,其它微生物也能产生不溶性胞内状态的异源蛋白质,例如1982年7月28日公布的英国专利2,091,271号,公开了用DNA重组技术对啤酒酵母进行遗传改造以表达牛犊凝乳酶。鉴于这些困难,从宿主微生物分泌该种蛋白质已转向力图产生具有天然活性构型的蛋白质。
一种特定蛋白质,包括异源蛋白质或多肽,是否可由特定的微生物分泌,看来似乎决定于蛋白质。在大多数真核细胞中,有的蛋白质合成装置与内质网膜相连,初生多肽链氨基端附近的氨基酸顺序(称为“信号顺序”)的作用是引导蛋白穿过内质网膜。接着在提供活性成熟蛋白质的分泌过程中,经蛋白质水解切除信号顺序。已经做出的某些尝试,目的是为了在包括枯草杆菌、啤酒酵母的微生物中和培养哺乳动物细胞中,用信号顺序建立分泌异源蛋白质的方法。然而所述的这些微生物尚未证明是理想的。
枯草杆菌的固有特性,例如分泌许多蛋白质,包括易降解分泌的异源蛋白质的许多蛋白酶;转化株由于失去异源DNA而造成的不稳定性也阻碍了它的发展。
已经成功地对哺乳动物细胞进行了遗传改造使其表达和分泌异源蛋白质,但是,这些系统都有技术上的要求,并且费用很高,要把大多数蛋白质作为产品进行商业生产仍然是不切实际的。
虽然啤酒酵母作为蛋白质分泌系统似乎有某些固有的局限性,但蛋白质分泌研究在啤洒酵母上取得的成功超过枯草杆菌。1984年10月31日公布的欧洲专利申请0123544号,介绍了啤酒酵母α因子基因的分离,并且将启动子和/或其信号肽部分与位于某个质粒上编码相对于酵母而言的异源蛋白质的DNA相结合,用于转化能够在细胞培养物中产生成熟的单一蛋白质的酵母细胞。1983年9月14日公布的欧洲专利申请0088632号,介绍了在啤酒酵母中表达和分泌异源蛋白质的方法。可是啤酒酵母以这些或另一些分泌系统能有效分泌的蛋白质的大小看来似乎限于20,000道尔顿左右。正如Smith等所介绍的,克服啤酒酵母作为分泌微生物的这种普遍的低效率要求多重突变(Science 229,1219~1224(1985))。这种趋势的一个例外就是观察到大于20000道尔顿的曲霉属酶类明显可以由啤酒酵母分泌,但是这些酶被啤酒酵母高度糖基化,这可能影响分泌的效率。
特殊的兴趣在于解脂亚罗威阿酵母,一种用来产生柠檬酸和单细胞蛋白质的工业上重要的酵母菌种。它也可用于产生赤藓糖醇、甘露糖醇和异丙基苹果酸。与啤酒酵母相反,解脂亚罗威阿酵母由于能够有效地把高分子量蛋白(碱性蛋白酶、酸性蛋白酶和核糖核酸酶)分泌到生长培养基中,由此有可能回收天然状态的异源蛋白质而无需破坏生产细胞,所以特别令人感兴趣并具有特殊的意义。此外,解脂亚罗威阿酵母能分泌很少量的几种蛋白质,因而有可能在生长培养基中产生作为主要蛋白质的所需异源蛋白质,并且简化所述的异源蛋白质产物的回收。
解脂亚罗威阿酵母产生高水平的胞外蛋白酶,这是由解脂亚罗威阿酵母分泌的主要蛋白质。特定的蛋白酶(碱性的、酸性的或中性的)取决于所用的解脂亚罗威阿酵母菌株(Ogrydziak等,J.Gen.Microbiol.(1982)128,1225~1234)。碱性胞外蛋白酶的N-末端氨基酸顺序的部分顺序分析已由Ogrydziak等人作了报导(在上述引文中)。
1984年7月25日提交的共同未决专利申请634,505号,介绍了通过突变互补作用转化解脂亚罗威阿酵母和克隆解脂亚罗威阿酵母基因的方法,公开了通过解脂亚罗威阿酵母的xpr2突变的互补作用,克隆编码分泌的碱性蛋白酶的XPR2基因。该方法包括用在载体pLD40上的解脂亚罗威阿酵母基因库的Bgl II部分消化产物来转化解脂亚罗威阿酵母的宿主菌株,已在1985年4月24日公布的欧洲专利申请0138508号即上述美国专利申请的相应申请中作了介绍。
本发明提供制备载体的方法,这类载体在被引入解脂亚罗威阿酵母宿主时,使宿主能够产生和分泌由异源DNA编码的特异蛋白质于培养基中,这类异源DNA可以来自任何来源,但特别是来自真核DNA和合成DNA;提供重组解脂亚罗威阿酵母克隆载体,包括编码表达哺乳动物蛋白质和其他多肽的异源DNA,其中包括适合转化解脂亚罗威阿酵母宿主的质粒,特别是整合表达载体,包括LEU2基因启动子、XPR2基因启动子、碱性蛋白酶前原区(prepro region)和XPR2终止区;提供具有异源编码顺序的表达质粒,所述异源编码顺序带有位于LEU2启动子下游的XPR2分泌信号,使得在用所说表达质粒转化的解脂亚罗威阿酵母中能表达和分泌异源蛋白。
本发明说明成熟异源蛋白质的表达和分泌,特别是从经过遗传改造的解脂亚罗威阿酵母细胞培养物表达和分泌凝乳酶原和人过敏毒素C5a。解脂亚罗威阿酵母细胞外碱性蛋白酶精确氨基酸顺序和DNA顺序的发现使人们有可能确定,异源蛋白质可以通过重组DNA技术来表达和分泌,以供细胞培养生产。就凝乳酶原而言,表达和分泌成熟的酶原(凝乳酶的前体)。
现在已经发现解脂亚罗威阿酵母可通过重组DNA技术进行遗传改造,使产生的转化株能够表达和分泌天然状态的异源蛋白质。这可通过构建携带XPR2基因信号或XPR2基因信号和第一个酶原顺序(pro1)或两个酶原顺序(pro1+pro2)的载体来完成,XPR2基因是与需要分泌的异源蛋白质的结构基因顺序相连接的。
通过在DNA载体的XPR2位点上的整合产生的转化株,包括一段在基因两端丧失调节或结构成分的XPR2基因而不再产生碱性蛋白酶,这一特征不仅为异源蛋白质的分泌所需而且也能用于筛选转化株。
此外,携带XPR2启动子和编码碱性蛋白酶分泌信号顺序的顺序的载体能够在转化的解脂亚罗威阿酵母细胞中实现分泌成熟的异源蛋白质。这种类型的有些重组DNA载体能够实现表达/分泌,而与酵母基因组的整合位点无关。一般说来,含有足够的5′和3′侧翼DNA的载体能够表达与整合位点无关的产物。
此外还令人惊奇和出乎意料地发现,将pBR322衍生质粒整合到解脂亚罗威阿酵母染色体DNA提供了能够进一步促进位点特异性整合转化的同源区,因此pBR322的整合拷贝可以作为新来的转化DNA的“连接台”("docking plat form")。将pBR322的驻留拷贝整合到解脂亚罗威阿酵母染色体DNA中,尽管pBR322不是天然的解脂亚罗威阿酵母DNA,然而为整合提供了一个已知的靶。包括这样一个位点的解脂亚罗威阿酵母转化受体在两个主要方面能够超过不含这样位点的受体,即存在一个具有已知顺序和已知限制图可作为位点特异性整合的靶区;通过用pBR322作为整合的靶位可以确定插入的质粒是否含有完整的功能单位或是仅相对于所需基因的一部分的基因。例如,仅含XPR2基因3′片段的质粒就能转化XPR2-1002受体,如果它含有野生型密码子并在XPR2位点上整合的话。然而,同一个质粒如果被整合到pBR322中的话,也许不能把XPR2-1002宿主转化为蛋白酶阳性的表现型,因为它缺少完整的功能单位。
因此,在解脂亚罗威阿酵母转化株中包括一个与异源载体DNA同源的区域,所述同源区包括该解脂亚罗威阿酵母整合转化期间作为受体位点的外源DNA。除了pBR322及其衍生物外,还有粘粒、像M13和λ一类的噬菌体、合成衍生DNA和像pUC13一类的普通质粒都可用于产生具有“连接台”的解脂亚罗威阿酵母转化株。
“LEU2”启动子顺序指的是位于ATG上游的上游非翻译区,它含有进行表达所需的大多数(如果不是全部的话)特征。
“XPR2”启动子顺序指的是位于信号(或前信号)顺序之前的上游非翻译区,它是进行表达所必需的。此外,有或没有pro顺序的XPR2基因的信号,在解脂亚罗威阿酵母启动子而不是XPR2基因的表达控制下,可用于分泌蛋白质。因此,携带LEU2启动子和碱性蛋白酶分泌信号顺序的载体,在已经转化的解脂亚罗威阿酵母细胞中能成功地分泌成熟的异源蛋白质。
人过敏毒素C5a也称为补体蛋白质C5a(人C5a),它是体内作为补体激活作用的结果产生的具有生物活性的多肽片段。它在调节体液免疫反应和细胞免疫反应的某些方面起着免疫调节剂的作用,其一级结构和其它过敏毒素的一级结构都已清楚。它的生物学和理化特征在由H.J.Muller-Eberhard和P.A.Miescher合编的《补体》(Complement)一书中,已由Hugli作了概述(纽约Springer-Verlag出版社出版,1985年73~99页)。
本领域专业人员都会理解,在本发明中可以采用编码实际上任何已知氨基酸顺序的异源DNA。这里所公开的方法在细节上作必要的修正后可以用来产生和分泌任何已知的异源蛋白质,其中有代表性的在1985年7月30日公布的美国专利4,532,207号中已一一列举。此外,任何其他解脂亚罗威阿酵母分泌蛋白质基因,如核糖核酸酶和酸性蛋白酶基因,可以用来代替XPR2基因,也可以用由所述的2个或更多的基因相连的片段所组成的杂种基因,例如XPR2基因的信号顺序和核糖核酸酶基因的启动子顺序结合的杂种基因来代替。
包括在本发明范围内的还有这里所述的DNA顺序或核苷酸顺序的功能等同物。遗传密码的简并性容许由其他的密码子代替某些密码子,两者指代的是相同的氨基酸,因此产生相同的蛋白质。事实上,DNA或核苷酸顺序在很大程度上是可以改变的,因为除了蛋氨酸和色氨酸外,已知的各种氨基酸都可以由一个以上的密码子进行编码。因此,部分或全部XPR2基因都可以人工合成,产生出与图3的DNA顺序具有明显差别的DNA顺序。但其编码的氨基酸顺序可以保持。给定的DNA或核苷酸顺序这种功能上的更替提供了用融合的外来DNA顺序促进分泌和/或加工所编码的异源蛋白的机会。因此凡是因遗传密码所致的XPR2基因及其片段的核苷酸顺序的所有变化都包括在本发明内。此外,也可能除去一些密码子或由除了简并码子外的密码子取代一个或更多的密码子,产生结构上改变的多肽,但与由未改变的DNA分子产生的多肽相比,在实用性和活性方面基本上是相同的。所述这两种多肽的功能都是相同的,如同两种DNA分子产生两种多肽,尽管所述的两种DNA分子之间差别与遗传密码的简并性无关。其最简单的例子就是凝乳酶原A和凝乳酶原B,它们是凝乳酶原的两种等位基因形式,其区别仅在于,在凝乳酶原A的286位上是天冬氨酸残基,而在凝乳酶原B的286位上是甘氨酸残基。
利用这个方法,通过应用得自解脂亚罗威阿酵母XPR2基因和/或LEU2基因的表达和分泌信号,表达和分泌哺乳动物的异源蛋白质凝乳酶原和人过敏毒素C5a已经在解脂亚罗威阿酵母中取得成功。凝乳酶原和人过敏毒素C5a的DNA顺序通过合成的寡核苷酸连接到XPR2基因顺序上假定为编码碱性磷酸酶信号肽的位点或蛋白酶前体加工位点以产生基因构建体,上述两个位点被命名为pro1和pro2,所产生的基因构建体然后经整合转化插入到解脂亚罗威阿酵母中。重组培养物表达具有凝乳酶原和人过敏毒素C5a的分子量和免疫反应活性的异源蛋白质并输出到生长培养基中。如此产生的凝乳酶原可以认为是其天然构型的折叠形式,因为除去前肽后它具有完全的酶活性。
此处所用的“重组DNA材料”一词包括含有至少下列材料之一的任何材料解脂亚罗威阿酵母的XPR2基因、信号(或前信号)、por1和pro2(共同构成pro区)、启动子或其终止顺序;LEU2启动子;以及可能由于遗传密码的简并性所产生的功能与上述顺序相同的顺序。所述重组DNA材料中具有代表性的材料为DNA片段、质粒或载体,或含有上述顺序中任一个或者全部顺序的转化株。
材料New England Biolabs供给的限制性核酸内切酶和T4连接酶,Bethesda Research Laboratories供给的细菌碱性磷酸酶,PL-biochemicals供给的T4多核苷酸激酶,和New EnglandNuclear供给的[γ-32P]ATP。所有的酶都是在提供者所推荐的条件下使用的。
培养基GPP培养基-(甘油/ -蛋白胨培养基),(每升)含有6.7克甘油、1.6克Difco -蛋白胨、1.7克不含氨基酸和硫酸铵的Difco酵母含氮碱基化合物、30毫克尿嘧啶、和0.5毫升/升分子量为2000的聚丙二醇(Polysciences)溶于40mM磷酸缓冲液(pH6.8)。(聚丙二醇为进行凝乳酶分析进行培养时省略不用)。 -蛋白胨在磷酸缓冲液中单独进行高压灭菌。YEPD(酵母提取物/蛋白胨/右旋糖培养基),(每升)含有5克酵母提取物、10克蛋白胨和20克右旋糖。
大肠杆菌生长在37℃的LB培养基中。LB培养基(每升)含有10克细菌胰酶解蛋白胨(Bactotryptone)、10克细菌酵母提取物、10克氯化钠;用氢氧化钠将pH调至7.5。
DNA顺序分析这里所描述的来自各种质粒的DNA片段都是在聚丙烯酰胺凝胶上进行分离并用Maxam等人的方法(Methods inEnzymology,65,499(1980))测序。
连接方法DNA片段,包括被切割的载体质粒,都是用T4 DNA连接酶通过混合所需要的组分进行连接(带有适宜的构建末端的DNA片段以提供正确的配对)。微克量的载体和插入片段需加约10单位的连接酶。将所得的连接反应物转化到大肠杆菌K12菌株MM294(ATCC-33625)或HB101(ATCC-33694)的感受态细胞中。
化学合成DNA的制备为构建用于表达和分泌凝乳酶的杂种基因,用改进的Phosphoramidite方法(Sinha等,Tetrahedron Letters24,5843(1983))通过Genetic Design 6500(Watertown,MA)DNA自动合成仪合成8个寡核苷酸,并且从6M尿素-20%聚丙烯酰胺凝胶中进行纯化。将互补寡核苷酸的等分部分在TE(10mMTris-HCl,pH8.0,1mM NaEDTA)中在4℃条件下互相混合和退火过夜。双股寡核苷酸的等分部分(约2微克)在37℃下用T4多核苷酸激酶在反应混合物中进行磷酸化,该反应混合物20μl含有70mM Tris(pH7.6)、10mM氯化镁、5mM二硫苏糖醇、5mM ATP。
质粒DNA制备质粒DNA的大量制备采用Holmes等人的方法(Anal.Biochem.,114,195~197(1981)),然后用溴乙锭-氯化铯浮力密度梯度离心。质粒DNA的小量制备采用Birnooim等人的碱性SDS方法(NAR1,1513(1979))。
凝乳酶原的表达/分泌载体的构建进行一系列不同的构建体的制备是为了获得最终表达载体。所有各个步骤都在附图中予以说明。一般说来,DNA片段是用凝胶电泳分离,并与另一些片段,或者被切割的DNA质粒,于4℃的20微升50mM Tris-HCl(pH7.5)、10mM氯化镁、20mM二硫苏糖醇、1mM ATP和200单位的T4连接酶中进行连接。如果需要用限制性核酸内切酶进行DNA的部分消化,则需要通过实验确定最佳的切割时间。
培养液中凝乳酶原的鉴定含有表达载体的酵母转化株在GPP培养基(同上)中生长过夜。离心去除酵母细胞后,将1毫升的50%TCA加到每个5毫升等分的培养液中,在4℃下保持60分钟。离心得到沉淀,再用2毫升冷丙酮洗两次。将沉淀的蛋白质溶于100微升的SDS样品缓冲液,等分部分在10%SDS-聚丙烯酰胺凝胶上进行电泳(Laemmli,U.K.,(1970)Nature227,680)。凝胶分辨的蛋白质通过电泳转移到硝化纤维素(Schleicher和Schuell,0.22微米),用凝胶片经免疫印迹分析法(Hawkes,R.等,(1982)Anal.Biochem.119,142)进行凝乳酶原的鉴定。滤纸涂上家兔抗凝乳酶原抗体,然后与结合羊抗兔IgG抗体的过氧化物酶(Cappel,Malvern,Pa)保温。结合抗体用4-氯-1-萘酚和过氧化氢染色检测。
培养液中凝乳酶原的凝乳活性各种解脂亚罗威阿酵母转化株的培养液按照Ernstrom改进方法(J.Dairy Sci.41,1664(1958))测定凝乳活性。简言之,测定包括测量凝乳酶在活化的培养上清液中凝结缓冲过的脱脂乳所需的时间长度并与纯化凝乳酶标准物比较这些数值。酵母培养物(25毫升)在GPP培养基中生长过夜。离心后去除细胞,将5毫升培养上清液的等分部分在真空条件下冷冻干燥。把每份经冷冻干燥的上清液再悬浮于300微升蒸馏水中。还要制备一组纯化的牛犊凝乳酶原稀释液作为对照参考标准。在培养基中和对照条件下的凝乳酶原的活化是通过加入大约5~10微升的浓盐酸,使pH值达到大约2左右,在22℃下保温1小时。脱脂乳的制备是将60克干燥的脱脂奶粉(Difco)加到500毫升的41.5mM醋酸钠(pH6.3)和13.6mM氯化钙中,在4℃条件下搅拌20分钟。制备后立即进行底物测定。将每个制备的酶以60微升为一等分(相当于1毫升的培养上清液),在37℃下加到1毫升等分的脱脂乳中,记录凝结时间。
用于C5a基因的合成寡核苷酸的制备用于C5a结构基因合成的寡脱氧核苷酸的化学制备是采用改进的Phosphoramidite方法(Sinha等,在上述引文中)在一个DNA自动合成仪Genetic Design6500(Watertown,MA)上用可控多孔玻璃载体进行的。用3%(重量/体积)二氯乙酸的二氯甲烷溶液进行脱三苯甲基作用,用饱和四唑的乙腈溶液加以Phosphoramidites线性激活,以二乙氧基膦四唑化物封端,用含水碘/THF氧化(Matteucci等,1981,J.Amer.Chem.Soc.105,3183)。每个加入周期的总时间是14分钟。得到图9中的10个47聚体A-J片段,每个步骤的平均得率为98.8%(用三苯甲基分析),用Matteucci等人(在上述引文中)的方法解封,从0.3M醋酸钠中经乙醇沉淀出并在退火前先在10%聚丙烯酰胺-尿素变性凝胶上用制备性凝胶电泳进行分离。
人C5a基因的组装、克隆和顺序测定图9表示所需蛋白质的氨基酸顺序和制备编码人C5a蛋白质的基因所需的合成寡核苷酸的排列。除A和F外的所有低聚物,都是在它们的5′末端用T4多核苷酸激酶进行磷酸化。基因的组装包括退火和连接两个主要反应,两个反应含有低聚物A、B、I和J,以及低聚物C、D、E、F、G和H。最终得到的94碱基对和141碱基对双股DNA片段都是在10%聚丙烯酰胺凝胶上电泳后进行分离,相互共同连接,他们的235碱基对产物用凝胶电泳分离。含有编码C5a的结构基因的235碱基对DNA片段插在pBR322 DNA载体的EcoRI和Hind III两个位点之间并转化大肠杆菌K-12菌株HB101感受态细胞。从6个转化株分离得到的DNA质粒的限制性酶切分析表明6个克隆中有5个含有大小合适的EcoRI/Hind III片段。这些质粒中每个质粒的C5a基因区的核苷酸顺序都用Maxam等人的方法(Methods Enzymol.65,499(1980))测定。
用于大肠杆菌的C5a表达质粒的构建和特性鉴定DNA片段分离的方法和连接反应的条件采用1982年Maniatis等发表的方法(Molecular CloningA Laboratory Manual,Cold Spring Harbor)。大肠杆菌trp启动子-操纵子,开始是从ptrpL1得到的(Edman等,(1981)Nature 291,503),含有用于C5a表达质粒(pC5a-48)的trp启动子-操纵子顺序的360碱基对EcoRI片段,是由凝乳酶原表达质粒pPFZ-R2中分离得到的,关于这一点在1985年7月3日公布的欧洲专利申请0147178号中已作了介绍。
解脂亚罗威阿酵母培养液中C5a的鉴定除了羊抗C5a和兔抗羊免疫球蛋白G(Cappel)用于免疫印迹外,采用如上介绍的鉴定凝乳酶原方法。羊抗人C5a抗体的制备采用Manderino等人的方法(J.Immunol.Methods 53,41-50(1982))。
载体pLD40已在1985年4月24日公布的欧洲专利申请0138508号中作了介绍。微生物名称ATCC 20774(CCTCC 86-142)解脂亚罗威阿酵母 PC30869ATCC 20781(CCTCC 86-149)解脂亚罗威阿酵母 DL112-PC-30869,带XPR2的转化株ATCC 20776(CCTCC 86-144)解脂亚罗威阿酵母 DL-148。
解脂亚罗威阿酵母 ATCC20688(CCTCC 86-152)的转化株,带由SnaBI消化的pLS-3ATCC 20775(CCTCC 86-143)解脂亚罗威阿酵母 DL-144。
解脂亚罗威阿酵母 ATCC20688(CCTCC 86-152)的转化株,带未切割的pLS-3ATCC 20777(CCTCC 86-145)解脂亚罗威阿酵母PC-30869的转化株,带由SnaBI切割的pC5aX-3ATCC 20778(CCTCC 86-146)解脂亚罗威阿酵母PC-30869的转化株,带由SnaBI消化的pXX-11ATCC 20779(CCTCC 86-147)解脂亚罗威阿酵母PC-30869的转化株,带由SnaBI切割的pXX-22ATCC 20780(CCTCC 86-148)解脂亚罗威阿酵母PC-30869的转化株,带由SnaBI切割的pXX-33ATCC 20794(CCTCC 86-150)解脂亚罗威阿酵母PC-30869的转化株,带pLD56ATCC 20795(CCTCC 86-151)解脂亚罗威阿酵母ATCC 20794(CCTCC 86-150)的转化株,带由NruI切割的pLX-34上述载体根据布达佩斯条约的规定都保藏在美国马里兰州洛克维尔美国典型培养物保藏中心,这是一个公认的承担永久性保存样品的保藏机构。如果本申请被授予专利,该中心将随时准备接待公众。在本申请未决期间,这些样品可以提供给美国专利和商标局授权去那里的官员进行测定,项目编号为37CFR1.14和35USC122;根据外国专利法,在向这些国家提交过本申请副本或其成果的,也可以使用这些样品。由于授予了专利,对于公众利用所保藏的微生物的全部限制措施将不可避免地予以撤消。
解脂亚罗威阿酵母ATCC20774(CCTCC 86-142)(Pfizer公司培养物保藏所鉴定编号为PC30869)的分类学研究是由J.R.DeZeeuw博士负责的,他提供了下述说明。所用的方法是由J.L.Eodder在《酵母菌》(第二版)(N.Holland Publishing Co.,
Amsterdam,1970)一书中推荐的那些方法。
CBS599是解脂假丝酵母典型培养物(《酵母菌》,第二版,N.Holland Publishing Co.,Amsterdam,1970),CBS6124在《酵母菌》(第三版)一书中是解脂复膜孢子酵母的典型培养物,对两者进行了比较。较早还称为解脂拟内孢霉。其无性状态是解脂假丝酵母。确定这个种的分类学地位的是van der Walt和von Arx(Antonie vanLeeuwenhoek,46,517~512(1980))。现时较佳的名称为解脂亚罗威阿酵母。
菌株PC-30869的培养、形态和生理特征与由Kreger-van Rij编的《酵母菌》(第三版,第406~408页,Elsevier Science PublishersB.V.,Amsterdam,1984)一书中所列的解脂复膜孢子酵母的规范介绍是一致的。
表1 解脂亚罗威阿酵母菌株的比较Pfizer公司资料来源 基因型登记号PC-30265NRRL YB-423(即CBS 6124), 野生型,二倍体《酵母菌》(第三版)中的典型培养物PC-30286CBS 599,《酵母菌》MATA野生型,单倍(第二版)中的典型 体培养物PC-30869参阅下面的介绍 MATB bio-6,leu2-40,xpr2-1002PC-30869是由遗传上适于重组的解脂亚罗威阿酵母PC-22208的突变体构建的,解脂亚罗威阿酵母PC-22208是由Pfizer公司从土壤中分离的,解脂亚罗威阿酵母PC-30026则是NRRL Y-1094的次代培养物。PC-30869在表型上与其野生型亲代的差异在于①不产生具有活性的胞外碱性蛋白酶;②生长需要生物素;③要求L-亮氨酸作为营养来源。
PC-30869在酵母提取物-蛋白胨-葡萄糖(YEPD)培养基中的对数期生长期间,芽细胞呈卵圆形,平均大小为2.6×5.5微米。在YEPD琼脂上,真假菌丝体都突起,有胚泡孢子,两侧大多数为单个的。没有明显的类胡萝卜素色素。该物是作为“B”交配型单倍体与测定微生物种的有权碱性的测交品系进行杂交(表5)。典型的子囊孢子的形成是V8琼脂上进行观察的。碳同化的模式见附表2。没有进行发酵试验。铵离子和尿素(无硝酸盐)是可以被利用的唯一氮源(表3)。菌株PC-30869要求维生素B1和D-生物素(表4)。只有维生素B1是该培养物的野生型亲本所需要的。在37℃下未看到生长。
表2碳同化作用*碳 源 参考列表介绍** 培养物3026530286 308691.L-阿拉伯糖 - -- -2.纤维二糖- -- -3.赤藓醇 + +++ ++++++4.D-半乳糖- -- -5.D-葡萄糖- +++ ++++++6.肌醇- -- -7.乳糖- -- -8.麦芽糖 - -- -9.D-甘露糖醇 + +++ ++++++10.棉子糖 - -- -11.核糖醇 - -- -12.D-核糖 -(+) -- ++13.L-鼠李糖 - -- -14.可溶性淀粉 - -- -15.蔗糖 - -- -16.海藻糖 - -- -17.D-木糖 - -- -18.琥珀酸 + +++ ++++++19.柠檬酸 + +++ ++++++*基础培养基是细菌酵母氮基质补加10微克/升的D生物素和149毫克/升的L-亮氨酸乙酯盐酸盐,以提供100毫克/升的L-亮氨酸。
**Kreger-van Rij.(在上述引文中)。
表3 氮同化作用*氮源 参考列表介绍** 培 养 物3026530286 308691.(NH4)2SO4+ +++ ++++++2.KNO3- -- -3.尿素 + +++ ++++++*基础培养基是细菌酵母碳基质补加116毫克/升的酮异己酸钠,以提供对应的100毫克/升的L-亮氨酸,再补加10微克/升的D-生物素。
**Kreger-van Rij.(在上述引文中)表4 需要的维生素*补加内容***参考结论** 培 养 物30265 30286 308691.缺 -极微 极微 -2.维生素B1.HCl+++++++-3.D-生物素-极微 极微 极微4.维生素B1+++++++++++生物素*基础培养基是无细菌维生素酵母基质加149毫克/升的L-亮氨酸乙酯盐酸盐,以提供100毫克/升的L-亮氨酸。
**Kreger-van Rij.(在上述引文中)。
***如所述基础培养基再补加200微克/升维生素B1。HCl和/或10微克/升的D-生物素。
表5 子囊孢子的形成测交菌株交配培养物30265 30286 30869缺号(自交配培养物) ++ - -30264 (A交配型)++ - +++30267 (B交配型)++ +++ -①培养物30264和30267是由L.J.Wickerham博士惠供的异性交配型单倍体菌株,已在Science(167,141(1970))上作了正式介绍。
②30264是Wickerham的解脂亚罗威阿酵母YB-421③30267是Wickerham的解脂亚罗威阿酵母YB-423-12表6 其他特征参考数据* 培养物30265 30286 30869细胞形状卵圆形 卵圆形卵圆形卵圆形细胞的平均体积(微米)(2~4.5)×(4-22) 3.3×9.1 3.0×8.2 2.6×5.5营养繁殖芽殖 芽殖 芽殖 芽殖发酵缺 缺 缺 缺37℃时生长 不生长 不生长 不生长 不生长菌落生长三个培养物生长相似并与文献介绍一致。真假菌丝体都突起,有胚孢子,两侧大多数是单个的。没有明显的类胡萝卜素色素。*Kreger-van Rij.(在上述引文中)。
PC-30689不同于专利文献所介绍的解脂亚罗威阿酵母的其他菌株,是基于将其表型进行比较的结果(表7和8)。
ATCC20228(Nubel等,美国专利4,155,811)的特征在于具有像这个种的典型菌株CBS599和CBS6124的野生型营养。尤其是它不需要尿嘧啶、亮氨酸或为生长用的生物素,以及使明胶液化。
ATCC 20628(DeZeeuw等,美国专利4,407,953)不像ATCC20228需要补加生长用的亮氨酸。像ATCC20228一样,它也不需要尿嘧啶或生物素。它也液化明胶。
ATCC20688(CCTCC 86-152)(欧洲专利申请0138508)即使培养基中补加了尿嘧啶和亮氨酸,也只是仅仅能够生长。这种对尿嘧啶的需要就使ATCC20688(CCTCC 86-152)跟ATCC20228和ATCC20628得以区别。ATC C20688(CCTCC 86-152)不需要生物素,而能使明胶液化。
培养物PC-30869不同于上述所有菌株,它需要生物素和亮氨酸,但不需要生长用的尿嘧啶,它也不能使明胶液化。
表7 营养要求从所列培养基中去掉的营养物培养物 无亮氨酸 尿嘧啶 生物素CBS599 +++++++++ +++CBS6124 +++++++++ +++ATCC20228 +++++++++ +++ATCC20628 +++- +++ +++ATCC20688(CCTCC 86-152) +++- - +++PC-30869+++- +++ -完全培养基含有16.7克/升的无细菌维生素酵母基质加100毫克/升的尿嘧啶、100毫克/升的L-亮氨酸、10微克/升的D-生物素,和200微克/升的维生素B1盐酸盐。
表8 明胶液化作用培养物液化作用CBS599+CBS6124 +ATCC20228 +ATCC20628 +ATCC20688(CCTCC 86-152) +PC-30869 -培养基含有120克/升的明胶、16.7克/升的无细菌维生素酵母基质加100毫克/升的尿嘧啶 、100毫克/升的L-亮氨酸、10微克/升的D-生物素和200微克/升的维生素B1盐酸盐。
图1由解脂亚罗威阿酵母菌株DL112分离得到的重叠质粒pLD57、pLD58和pLD62的部分线性限制图。*即图1是关于从XPR2转化株DL112回收质粒的图解说明。各个标记区是(从左到右)解脂亚罗威阿酵母未排列成顺序,EcoRI部位与连接解脂亚罗威阿酵母DNA(以前为BamHI部位)之间的小片段pBR322,解脂亚罗威阿酵母LEU 2基因,pBR322的大片段和排列成顺序的XPR2的突变等位基因。“B”是BglII部位,“E”是EcoRI部位。用线条表示回收的3个质粒它们在BglII部位的末端连接成环形分子。
图2为XPR2基因合成寡核苷酸探针。从已经发表的成熟蛋白酶的前25个氨基酸残基中大多数残基的顺序(Ogsydziak等,在上述引文中),标有I和II的两个区为构建32倍或不足32倍简并的14聚体寡核苷酸探针提供了可能性。两个区分别在7和18位氨基酸起始。为每个区制备了4个不同的8倍简并的混合探针并指定了图中所示的170~186之间的编号。在所示的预期核酸顺序中,“X”表示所有四种碱基,U表示两种嘌呤,Y表示两种嘧啶。
图3 XPR2基因的核苷酸顺序启动子、pre(-157~-136),pro1(-135~-98),pro2(-97~-1),碱性细胞外蛋白酶和终止顺序。
图4构建终止密码子载体pterm4的顺序。
图5构建质粒pLS-3的顺序和限制性图。
图6构建质粒pXX-33的顺序和限制性图。
图7构建质粒pXX-22的顺序和限制性图。
图8构建质粒pXX-11的顺序和限制性图。
图9人过敏毒素C5a氨基酸顺序。
图10质粒pC5a-48的限制性图。
图11构建质粒pC5aX-3的顺序和限制性图。
图12LEU2基因的核苷酸顺序。
图13构建质粒pLX-34的顺序和限制图。
XPR2基因的顺序分析克隆的XPR2基因的DNA顺序分析是用化学降解法(Maxam等,1980,Methods Enzymol.65,499)在由质粒pLD57、pLD58、pLD62(图1)和pLD84、pLD86(参阅下面所述)制备的重叠限制性片段上完成的。结果表明克隆的酵母基因组DNA实际上含有胞外碱性蛋白酶的基因。XPR2基因的核苷酸顺序和由核苷酸顺序推测的带有信号顺序的碱性蛋白酶前体的氨基酸顺序在图3中给出。胞外蛋白酶的氨基酸顺序中的大部分顺序过去都是未知的(Ogrydziak等,在上述引文中),这里是第一次提出。此外,需要胞外蛋白酶表达和分泌的顺序这里也是第一次予以介绍。编码碱性蛋白酶、它的前体和信号顺序的DNA顺序由1362碱基对组成(图3)。这些多肽链的一级结构是由核苷酸顺序推断得到的,共有454个氨基酸残基。碱性蛋白酶是以前体的形式在细胞内合成的,这种前体形式经过蛋白水解加工形成被分泌的状态或成熟状态。分析由核苷酸顺序推断得到的氨基末端氨基酸顺序表明假定的信号肽存在于前体分子中。所述信号肽含有22个氨基酸残基,其结构特点类似于高等真核生物和原核生物信号肽的结构(Perlman等,1983,J.Mol.Biol.167,391)。通常与已知的成熟碱性蛋白酶(Ogrydziak等,1982,J.Gen.Microbiol.128,1225)的25个氨基末端氨基酸相一致的所指示的氨基酸顺序中的一个区之前是含有信号肽和2个胰蛋白酶型的切割位点(Lys-Arg)的157个氨基酸残基。用所述切割位点把pro区分为pro1(-135~-98)和pro2(-97~-1),参见图3。成熟碱性蛋白酶有由核苷酸推断出的297个氨基酸。预示来自核苷酸顺序的各种蛋白酶形式的氨基酸顺序是与纯化形式的酶的大小一致的。除了碱性蛋白酶前体结构顺序外,还测定了5′端侧翼顺序片段大约700碱基对和3′端侧翼顺序的600碱基对。这些区的分析,说明它们含有类似于其他真核启动子和终止密码子的顺序,而且对碱性蛋白酶的表达来说多半是不可缺少的。
如上所述,转化解脂亚罗威阿酵母的方法和通过突变的互补作用克隆解脂亚罗威阿酵母基因的方法,包括通过xpr2突变的互补作用克隆编码分泌的碱性蛋白酶的XPR 2基因,已在欧洲专利0138508中作了报导。该报导中所述方法包括通过用Bgl II部分消化载体pLD40中的解脂亚罗威阿酵母基因库后转化解脂亚罗威阿酵母宿主菌株,所述载体的特征是它携有含有解脂亚罗威阿酵母LEU2区的小片段和3个EcoR I、4个EcoR V、6个Ava I、1个Bgl II、1个Nco I、1个ApaI、2个Xho I和1个BstXI核酸内切酶的限制性位点。解脂亚罗威阿酵母XPR2转化株中的一个转化株用来回收来自解脂亚罗威阿酵母NRRL Y-1094中的野生型基因(pLD84和pLD86),解脂亚罗威阿酵母NRRL Y-1094如实施例一所述供表达/分泌载体构建时用。
LEU2基因的顺序分析pLD25(欧洲专利0138508)中克隆的LEU2基因的DNA顺序分析是在重叠限制性片段上用化学降解法(Maxam等,1980,Methods Enzymol.65,499)测定的。为了对β-异丙基苹果酸(IPM)脱氢酶密码区和恰当的阅读框架进行定位,利用了以前测定的啤酒酵母LEU2基因所示的氨基酸顺序(Andreadis等,1984,J.Biol.Chem.259,8059)。鉴定出了解脂亚罗威阿酵母基因组顺序区,该基因组顺序编码同源于啤酒酵母蛋白质顺序区的氨基酸顺序。2.8Kb LEU2基因的核苷酸顺序和由核苷酸顺序推断得到的β-IPM脱氢酶氨基酸顺序在图12中给出。此外,表达解脂亚罗威阿酵母β-IPM脱氢酶需要的顺序这里是第一次予以介绍。编码这405个氨基酸蛋白质的DNA顺序是由1215碱基对组成的(图12)。除了β-IPM脱氢酶编码顺序外,测定了5′端顺序的大约798碱基对和3′端顺序的797碱基对(包括TAA转译终止密码子)。对这些区的分析表明它们包括类似于其他真核生物的启动子和终止密码子的顺序,而且是表达时必不可少的。
解脂亚罗威阿酵母LEU2基因的5′上游区在转译起点前78碱基对和在所说mRNA起点前30碱基对含有TATATATA顺序。对于真核生物中转录的启始具有重要意义的第2个顺序是CAAT盒,在LEU2基因中,这部分顺序定位在假定的转录起始位点前74碱基对,假定的转录起始位点自ATG起-48碱基对(图12)。
Zaret等(Cell 28,563(1982))认为3′下游区在终止密码(TAA)之后的72至120核苷酸上有一段顺序与5′-TAG…TA(T)GT…TTT-3′顺序同源,这对啤酒酵母中的转录终止很重要。
实施例一所用宿主菌株是ATCC 20774(CCTCC 86-142)(MATBleu2-40 bio-6 xpr 2-1002)。XPR2转化株-解脂亚罗威阿酵母ATCC 0781是在脱脂乳指示平板上形成区带的一个菌落,然后从缺亮氨酸平板上进行平板影印培养。用欧洲专利申请0138508中的方法从转化株中制备染色体DNA并用来回收被分泌的蛋白酶的基因。染色体DNA用Bgl II酶进行部分消化,并连接到含有大肠杆菌复制子和来自载体的氨苄菁霉素抗性基因的环化片段上,用以转化大肠杆菌。染色体DNA也用Sal I酶消化并用于在Southern实验中指示转化株正常LEU2区未曾受到干扰。(LEU2区的Sal I到EcoR I间的520bp片段即是包含于pLD40中的5′至LEU2片段间的顺序用作探针)。为此,由于同源性对于把质粒库整合到解脂亚罗威阿酵母中是必需的,所以XPR2区肯定是整合位点。三个重叠但不同的质粒pLD57、pLD58和pLD62开始是从解脂亚罗威阿酵母ATCC 20781(CCTCC 86-149)回收的。它们在图1中给出。与基于已知的成熟分泌性蛋白酶蛋白质的前25个氨基酸残基顺序(图2和3)合成的针对XPR2基因的合成寡核苷酸探针杂交表明分泌性蛋白酶的基因已被克隆。为了测定回收的基因是代表野生型拷贝还是突变型拷贝,用pLD58转化受体解脂亚罗威阿酵母菌株。由于没有从任何依赖于亮氨酸的转化株产生蛋白酶阳性转化株,所以结论是pLD58含有该基因的等位基因突变。
存在于野生型菌株NRRL Y-1094中的XPR2基因形式是通过大肠杆菌菌落的杂交试验得到的。探针用的是由测序数据预计含有整个结构基因的2Kb Pvu I-EcoR I片段。正如欧洲专利申请0138508所介绍的,从pLD 40中NRRL Y-1094 DNA的Sau 3A部分消化的片段的原始库中,获得与本探针杂交的一些克隆。其中两个克隆含有非常相似于被命名为pLD 84和pLD 86的质粒,他们被用来构建表达载体。两种质粒含有相同的XPR2密码子的5′末端即Sau3A位点(被结合重新产生载体的BamH I位点),图3中的顺序就是从此开始的。每个都含有蛋白酶的全部结构基因和假定的转录终止密码子,并且包括来自NRRL Y-1094菌株的XPR2密码子大约4至5Kb的整个插入片段。pLD 86中的插入片段3′端含有额外的几百碱基对。为了构建表达载体,我们用的是3′扩展到Bgl II位点的顺序(碱基对2655),所以两个质粒供应了相同的DNA,其作用是与图3的顺序相等的。
表达/分泌载体的构建为了实现表达和分泌解脂亚罗威阿酵母中的凝乳酶原而设计的一个计划采用在整合性克隆载体中的各种杂交基因的构建体。这样一个途径创造出几个具有广泛的共同DNA顺序区域的不同的质粒。事实上,用于组装质粒的标准构建方案是用凝乳酶原基因插入到所示的XPR2信号肽加工位点假定的pro1加工位点和已知能产生成熟碱性蛋白酶的裂解位点的3′端。一般说来对异源基因而言,理想的是插在用于表达的酵母启动子和终止顺序之间。已认识到杂交基因顺序的氨基末端顺序部分随着不同的质粒构建体而变化,但是凝乳酶原结构基因顺序、XPR2终止密码子顺序和穿梭载体DNA在各个表达质粒构建体中则是相同的。于是计划把相同的凝乳酶原结构基因片段和终止密码子/载体质粒用于如下所述的各个表达质粒构建中。不同的凝乳酶原表达/分泌质粒构建体在紧接着XPR2基因启动子顺序下游的N末端碱性蛋白酶前体顺序的长度范围内有所变化,所说的前体顺序在凝乳酶原基因顺序之前。为此,在XPR2凝乳酶原接合区内,把各个表达质粒的启动子片段的组分设计成可变的顺序。所有表达/分泌载体都用含有三个组成片段的相似的连接反应进行组装。
用于构建终止密码子载体pterm4的实验步骤见图4所示。首先将合成连接子与含有XPR2基因3′末端的片段连接,后者包括转录终止和多聚腺苷酸化信号。简单地说,用核酸内切酶Kpn I切割质粒pLD 84,再用合成连接子双股DNA连接(图4)。用核酸内切酶Hind III和Bgl II切割连接产物并将一个760碱基对片段插入到用相同的两个核酸内切酶进行线性化的质粒pLD 41中,得到pterm4。质粒pterm4用它的限制制性图来鉴定。对用EcoR V、EcoR I、KpnI、Bgl II-Hind III和Bgl II-Bcl I等一系列限制性核酸内切酶消化的结果进行分析。消化提供了合适的片段,证明在如欧洲专利0138508所述的穿梭质粒pLD41中存在着合成连接子和XPR2基因的“完整”3′末端。图4给出了这个7.3Kb终止密码子载体的部分图。
表达/分泌质粒pLS-3的构建图5概述了用于解脂亚罗威阿酵母中分泌凝乳酶原的起始质粒的构建。其限制性图在图5中给出。凝乳酶原分泌质粒的构建是从制备含有大部分凝乳酶原结构基因顺序的片段着手的。从大肠杆菌凝乳酶原表达质粒pPFZ-84A中分离出含有编码凝乳酶原的6-365残基密码顺序的1080碱基对BclI-BamH I(部分)DNA片段。(质粒pPFZ-84A是凝乳酶原表达质粒pPFZ-R2的衍生物,它的构建在1985年7月3日公布的欧洲专利申请0147178号中已作了介绍,并且已用限制性片段置换法通过合成寡核苷酸指导的诱变制成。具体地说,pPFZ-84A不同于pPFZ-R2仅有两处,即在凝乳酶原氨基酸残基214(天冬酰胺→天冬氨酸)286(天冬氨酸→甘氨酸)两个碱基对,从而编码所谓的凝乳酶原A等位基因,但两个质粒都含有凝乳酶原的理想顺序并且在这个实施例中作用是相等的)。含有编码碱性蛋白酶前体和凝乳酶原1至5的密码顺序的XPR2启动子组成片段按下述方法制备。从XPR2亚克隆质粒pLD 90分离出含有启动子区和碱性蛋白酶基因5′末端的870碱基对Hind III-Ava I DNA片段,它与具有下述结构的人工合成片段连接5′CCGAGATTCCTGCTTCTTCTAATGCCAAGCGAGCTGAGATCACTAG3′3′CTAAGGACGAAGAAGATTACGGTTCGCTCGACTCTAGTGATCCTG 5′译读方向——→这个顺序含有Ava I粘性末端,然后是对碱性蛋白酶前肽的最后9个密码子进行编码的顺序,接着对凝乳酶原的前4个氨基酸进行编码的,最后在BamH I位点终止。启动子组成片段是通过标准连接反应,借助T4连接酶将人工合成片段和870bp Hind III-Ava I片段连接后再用Hind III和BamH I切割而得到的。最后得到的连接顺序通过聚丙烯酰胺凝胶电泳进行纯化,选出916碱基对HindIII-BamH I DNA片段。如上所述,杂交基因的3′末端是由终止密码子/载体质粒pterm4得到的。质粒pterm4用Hind III-Bcl I消化,并从琼脂糖凝胶中分离出大约7.3Kb Hind III-Bcl I终止密码子/载体DNA片段,该片段含有XPR2终止密码子、LEU2可选择标记物和pBR322。
凝乳酶原表达/分泌质粒pLD-3通过对3个组成DNA片段(用Hind III-Bcl I切割的pterm4质粒、以及916碱基对HindIII-BamH I启动子和1080碱基对BamH I-Bcl I凝乳酶原基因的片段)的保温而结合在一起,构建如上所述有连接酶T4参加(见图5)。连接的混合物采用Dagert等人(Gene 6,23-28(1979))的氯化钙方法转化大肠杆菌K12菌株MM294。从选择出的氨苄菁霉素抗性转化株中分离质粒,质粒pLS-3用其限制性图进行鉴定(图6A)。这个质粒的XPR2-凝乳酶区经测序,肯定为人工合成DNA的适合顺序和理想片段的恰当的结合。
pLD 90的制备。这种质粒含有源自pLD84的亚克隆。如下所述,将自XPR2启动子区的Pvu I位点至终止 区的EcoR I位点的DNA区亚克隆到pBR322的Hind III位点。用上述的两个限制性酶消化几微克pLD84。然后,被消化的DNA分子的“粘性”末端用DNA聚合酶I的克列诺夫(Klenow)片段填平。将激酶处理过的HindIII连接子(由New England Biolabs供应的CAAGCTTG)用T4 DNA连接酶加到末端。去除多余的连接子,用Hind III酶进行连续消化,形成Hind III粘性末端。将DNA分子的混合物在制备性琼脂糖凝胶上电泳,切下所需的2Kb带,进行纯化,与经Hind III消化过的并经细菌碱性磷酸酶处理过的载体pBR322一起加到连接反应中。连接混合物用于转化感受态大肠杆菌。带有靠近pBR322的EcoR I位点的XPR2终止密码子的EcoR I位点的方向取名为pLD90,相反方向的则取名为pLD91。
包括在pLS-3中的XPR2启动子区的5′末端是PvuI位点,大约是从图3所列顺序区开始起的280碱基对。发现含有野生型蛋白酶基因的质粒在这样大量启动子控制下,当被整合到基因组在远离固有的xpr2座位的位点时,不能使转化株产生大量的蛋白酶(在脱脂乳平板上的透明区作出的鉴定)。
我们注意到,如果pLS-3含有缩短的因而是“有缺陷”的启动子,那么从质粒与固有的野生型XPR2基因重组的整合结果,产生完整的启动子,它控制凝乳酶原融合产物的表达,但有缺陷的启动子则是控制蛋白酶的表达。类似基因破碎型的试验是用Shortle等人(Science 217371~373,1982)的啤酒酵母活性基因来完成的。与我们的预料相一致的是,有些带有pLS-3不依赖亮氨酸的转化株,现在知道实际上就是有缺陷的蛋白酶。有缺陷的蛋白酶转化株与不希望要的副产品如在leu2上的基因转化株相比,更可能是所需要的在XPR2座位上的整合株。关于受体菌株ATCC20688(CCTCC 86-152),我们发现未切割的pLS-3产生6.5%蛋白酶缺陷的转化株,反之,用Sna BI切割的质粒所产生的蛋白酶缺陷的转化株约为70%。就这种转化而言,基因破碎都可回避为了从所有转化株中证实合适的整合而需要进行大量的Southern印迹试验。
含有在XPR2启动子控制下的野生型蛋白酶结构基因的质粒(位于图3所列顺序的起始处),当其被整合到解脂亚罗威阿酵母细胞除xpr2座位外的位点上时,可以表达大量的蛋白酶。可是,从这类整合株中有效地表达异源基因可能要求进一步改进这个控制区DNA。
凝乳酶原的分泌用未切割pLS-3 DNA和用SnaB I消化的pLS-3 DNA转化解脂亚罗威阿酵母菌株ATCC20688(CCTCC86-152),可分别获得xpr-leu+转化株ATCC20775(CCTCC86-143)(DL144)和ATCC20776(CCTCC 86-144)(DL148)。将这些转化菌株接种到含有YEPD培养基的试管中。细胞在28℃下生长过夜。将这些培养物的等分试样(250微升)以1∶100稀释到每份为25毫升的GPP培养基中。在28℃下细胞在摇瓶中生长16~18小时,测得600nm处吸光率为5.0-7.0,然后经离心收获细胞,通过浓缩上清液并将浓缩物进行SDS-PAGE,测定所得到的培养液或上清液中的凝乳酶原。通过电泳把板状凝胶转移到硝化纤维素纸上,电泳在20mM Tris碱、150mM甘氨酸、20%甲醇存在下以,500毫安在4℃下进行2小时。板状凝胶中移出的蛋白质是用考马斯蓝染色来鉴定的。
硝酸纤维素纸在37℃下干燥,在65℃烘烤1小时,然后在TBS(200mM NaCl,50mM Tris-HCl,pH7.5)中漂洗。将硝酸纤维素纸置于含有10%马血清(Gibco,Chagrin Falls,饿亥饿)的TBS中,在室温下保温30分钟,然后在含有10%马血清和经适当稀释的凝乳酶原抗体的TBS中在室温条件下保温16小时。再将硝酸纤维素纸放在TBS中漂洗三次,10分钟,接着在含有10%马血清的TBS中保温,然后在含有10%马血清和经适当稀释的结合了辣限过氧化物酶的羊抗兔IgG抗体的TBS中保温2小时。再将硝化纤维素纸在TBS中漂洗3次,10分钟,在4-氯-1-萘酚(3毫克/毫升的甲醇溶液)中显色,然后加到含有0.01%过氧化氢的TBS中至浓度为0.5毫克/毫升。测定两个上清液中存在分子量为40,000的凝乳酶原。
在酸活化浓缩培养上清液(见上)后,在从含有pLS-3转化培养物ATCC20775和20776制备的样品中存在着明显的凝乳活性。正如所预料的,在受体解脂亚罗威阿酵母ATCC20688的对照培养上清液中没有得到凝乳活性。
表达/分泌质粒pXX-33的构建为了把pLS-3转入改进的表达质粒pXX-33所作出的改进已在图6中作了概述。这种改进增加了XPR2启动区280碱基对,就pLS-3而言,表达质粒pXX-33含有一个编码完整的碱性蛋白酶前肽原(prepro-peptide)(157个氨基酸残基)的杂交基因,碱性蛋白酶被连接到整个凝乳酶原的结构基因顺序上。
在以比pLS-3中多280bp的XPR2启动子构建凝乳酶原表达/分泌质粒之前,有必要将含有完整碱性蛋白酶基因的一个限制性片段亚克隆到Hind III位点。这个亚克隆是通过把合成连接子加到由XPR2基因组文库克隆pLD86分离得到的限制性片段中组装而成。构建这种带有上游区Hind III位点的XPR2亚克隆是从制备含有所有碱性蛋白酶基因的DNA片段着手的。XPR2克隆pLD-86的基因组区中的2.3Kb EcoR I-BamH I(部分)片段是通过琼脂糖凝胶电泳进行纯化的,用合成片段进行连接,其顺序为5′GATCGAAGCTTG3′3′ TTCGAACTTAA5′这种连接子顺序含有一个BamH I粘性末端(但不再重新产生BamH I位点),然后先后为Hind III位点和EcoR I粘性末端。连接产物用Hind III消化,然后插入到pBR322的Hind III位点。质粒pXHP-24通过它的限制性图予以鉴定,成为用于未来表达构建体的XPR2启动子片段的来源。
在质粒pXHP-24中,亚克隆的XPR2基因含有的5′XPR2启动子顺序比pLS-3中所含有XPR2启动子顺序多大约280碱基对。首先,启动子组成片段通过标准连接反应,用合成DNA片段(如上面所述的pLS-3)和pXHP-24中的1 150碱基对Hind III-Ava I片段借助T4连接酶进行连接,然后用Hind III及BamH I切割后得到。将所得到的连接顺序通过凝胶电泳纯化,选出大约1196碱基对Hind III-BamH I片段。第二个片段含有编码6~151个凝乳酶原氨基酸残基的顺序,是从经BamH I和Xma I切割的pLS-3以及凝胶纯化所得到的440碱基对BamH I-Xma I DNA片段进行制备的。第三个含有凝乳酶原基因的剩余部分、XPR2终止密码子和载体顺序的片段是由用Hind III和Xma I切割的pLS-3,以及凝胶纯化大约8.0Kb Hind III-Xma I载体片段进行制备的。然后将三个片段用上述标准方法进行连接。将连接反应产物用于转化大肠杆菌K12菌株MM294。从根据氨苄青霉素抗性选出的转化株中分离出质粒,质粒pXX-33用它的限制性图进行鉴定(图6)。对这种质粒的蛋白酶-凝乳酶原区测序证实了所需片段的正确连接。
然后用经SnaB I切割的pXX-33转化解脂亚罗威阿酵母ATCC 20774提供解脂亚罗威阿酵母ATCC20780,通过如上面所述的pLS-3的情况测定转化培养物分泌到培养基中的凝乳酶原。结果证明在培养上清液中存在凝乳酶原。
在酸活化浓缩的培养上清液后(见上),在由转化培养物解脂亚罗威阿酵母ATCC20780中制备的样品中观察到明显的凝乳活性。
表达/分泌质粒pXX-22的构建构建表达/分泌质粒pXX-22的实验步骤已在图7中给出。表达载体在两个方面不同于pLS-3。如同pXX-33一样,它含有附加的280碱基对片段的XPR2启动子顺序。其次,它含有编码碱性蛋白酶信号肽的顺序和仅仅38个前肽(pro1)的氨基酸残基。
构建pXX-22的计划与pXX-33相创似。首先,启动子组成片段是通过标准的连接反应,用pXHP-24中的890碱基对HindIII-Bgl II片段以及合成片段借助T4连接酶进行连接,再用HindIII和BamH I消化之后得到的,合成片段的顺序为5′GATCTTGCTGAGATCACTAG 3′3′AACGACTCTAGTGATCCTAG 5′得到的连接顺序通过凝胶电泳分离920碱基对Hind III-BamH IDNA片段进行纯化。另一个编码凝乳酶原6~151残基的片段,是由pLS-3经BamH I和Xma I切割以及凝胶纯化所得到的440碱基对BamH I-Xma I DNA片段而分离出来的。第三个含有凝乳酶原基因其余部分、XPR2终止区和载体顺序的片段是通过用Hind III和Xma I切割pLS-3以及凝胶纯化大约8.0Kb载体片段进行制备的。然后将3个DNA片段用上述标准方法进行连接。将连接反应物用来转化大肠杆菌K12菌株MM294。从所选择的转化株中分离出质粒,质粒pXX-22是用它的限制性图进行鉴定的(图7)。
然后用经SnaB I切割的pXX-22转化解脂亚罗威阿酵母ATCC20774,以提供解脂亚罗威阿酵母ATCC20779,通过如上面所述的pLS-3的情况测定转化培养物在培养液中分泌的凝乳酶原。按照上述方法确定在培养上清液中存在着凝乳酶原。在酸活化浓缩的培养上清液后(见上),在由转化培养物解脂亚罗威阿酵母ATCC20779中制备的样品中观察到显著的凝乳活性。
表达/分泌质粒pXX-11的构建构建凝乳酶原表达/分泌质粒pXX-11的实验步骤在图8中作了概述。这种质粒含有XPR2启动子顺序和连接编码凝乳酶原顺序的22个氨基酸残基信号肽。用于pXX-11的构建计划与用于pXX-22和pXX-33的构建计划相类似。简单说来,启动子组成片段是通过标准的连接反应,用pXHP-24中大约750碱基对Hind III-Bgl II DNA片段和合成片段在T4连接酶存在下连接,再经Hind III和BamH I切割后获得的,其中合成片段的顺序为5′ TGGCCGCTCCCCTGGCCGCCCCTGCCGCTGAGATCACTAG 3′3′AAGACCGGCGAGGGGACCGGCGGGGACGGCGACTCTAGTGATCCTAG 5′——→所得连接顺序通过凝胶电泳纯化,选出790碱基对Hind III-BamHI DNA片段。编码凝乳酶原残基6~151的另一个片段则是从pLS-3中经BamH I和Xma I切割并经凝胶纯化所得到的440碱基对BamH I-Xma I DNA片段分离出来。第3个含有凝乳酶原结构基因其余部分、XPR2终止密码子和穿梭载体顺序的片段则是通过用Hind III和Xma I切割pLS-3并经凝胶纯化的大约8.0Kb载体片段进行制备的。然后将3个DNA片段用上述标准方法进行连接。连接反应物用于转化大肠杆菌K12菌株MM294。从所选择的转化株中分离出质粒,质粒pXX-11用它的限制性图进行鉴定(图8)。质粒的XPR2-凝乳酶原部分的测序证实了合适的合成DNA顺序及所需片段的正确连接。
然后用经过SnaB I切割的pXX-11转化解脂亚罗威阿酵母ATCC20774产生解脂亚罗威阿酵母20778,通过如上面所述的pLS-3方法测定转化培养物分泌在培养基中的凝乳酶原。按照上述方法,确定在培养上清液中存在着凝乳酶原。
凝乳测定(见上)表明,在含有pXX-11的转化株ATCC20778的培养上清液中存在着明显的凝乳活性。
实施例二 连接台的构建对应于ATCC20774中的bio-6等位基因的野生型BIO基因按如下方法通过互补进行克隆。经Sau3A部分消化插入pLD40的BamH I位点(这是在EcoR I位点上的pBR322+LEU2)的解脂亚罗威阿酵母染色体DNA构建了基因文库,制备了大量文库DNA作为混合培养大肠杆菌质粒制备物(这是与用于克隆XPR2基因相同的文库)。用酶Apa I(在LEU2区进行一次切割)消化几微克的文库DNA,通过将转化混合物涂覆在缺亮氨酸的合成培养基上,用该DNA转化ATCC 20774(leu2 xpr2 bio)。获得几万个不依赖亮氨酸的转化株。为了搞清哪些菌落含有包括BIO基因的文库质粒(如果有的话),把不依赖亮氨酸的转化株平板影印转移到含有生物素选择培养基的琼脂平板上(每升配方25毫克脱硫生物素、20克葡萄糖、5克硫酸铵、1克KH2PO4、0.5克MgSO4·7H2O、0.1克CaCl2、0.1克NaCl、500微克硼酸、400微克硫胺素·HCl、400微克ZnSO4·7H2O、400微克MnSO4·H2O、200微克Na2MoO4·2H2O、200微克FeCl3·6H2O、100微克KI和40微克CuSO4·5H2O)。
一种生长在生物素选择培养基上的解脂亚罗威阿酵母BIO+转化株,取名为DL31。我们着手从解脂亚罗威阿酵母菌株DL31中回收含有BIO基因的基因文库质粒。从培养菌株DL31中制备染色体DNA。用限制性酶Apa I消化几微克这种染色体DNA就能切除文库质粒。将被消化的DNA的等分部份用于连接反应,使未知的文库质粒环化。然后将连接混合物用来转化氨苄青霉素抗性大肠杆菌培养物,以回收进入大肠杆菌的含有BIO的未知质粒。获得了少量的氨苄青霉素抗性大肠杆菌转化株。用大肠杆菌转化株进行小规模的质粒制备。这样得到的质粒DNA的限制性消化物表明含BIO的未知质粒,正如所预料的那样等同于在BamHI位点带有插入片段的pLD40。这种质粒一定源于我们的基因文库,取名为pLD51。
质粒pLD56是通过去除pLD51中的LEU2基因作为pLD51的亚克隆而产生的,介绍如下。用酶EcoR I消化质粒pLD51的等分部分,以去除LEU区。被消化的DNA用于DNA的连接反应,使质粒环化。然后完成大肠杆菌的转化,以克隆含有BIO的较小质粒。有一种氨苄青霉素抗性大肠杆菌转化株表明含有所期望的较小质粒,取名pLD56。完成了pLD56的一些限制性消化。含有BIO的pLD56片段,作为在pBR322的BamH I位点存在的一个插入片段,长约3.6Kb。
一张非常粗略的解脂亚罗威阿酵母DNA的3.6Kb插入片段插入pBR322的BamH I位点(包括pLD56)的限制性图将在下面介绍,从插入开始的大约距离以bp数示于括号内。量值的估计是从几决琼脂糖凝胶得出的,量值的误差相当大Pvu II(800),Pvu II(1200),Pst I(1800),Mlu I(2000),Pst I(2300),EcoR V(2700),Nco I(3200)(取向pBR322的Sal I位点居于所述各位点之先,Hind III位点在各位点之后)。
菌株ATCC20774(MATB leu2-40 bio-6 xpr2-1002)用完整的pLD56(pBR322+含有BIO基因的约3.6Kb解脂亚罗威阿酵母染色体DNA)转化。对3个不依赖生物素的不同转化株与其亲代菌株作比较,进行Nru I切割(以pBR322为目标)pLD40(在pBR322上的LEU2)的高频转化试验,以测定哪些含有整合到BIO区的固有pBR322。因为pLD40都整合到固有的pBR322中,所以3个转化株都显示出高频转化。这已由Southern印迹杂交试验所确认。3个原始的解脂亚罗威阿酵母BIO转化株中有一株取名为DL118并进一步用作DNA受体。上述的限制性图需要确定(1)以什么作为BIO特异性杂交探针(一个Nco I-Pvu II片段);(2)需要用哪种酶来正确地切除pLD56质粒(Mlu I);(3)哪个酶只在pBR322部分中进行一次切割(Cla I);(4)哪种酶完全不能切割质粒(Apa I)。ATCC20774和DL118(已用BIO片段探测)中DNA的Cla I和ApaI消化物的Southern杂交表明,正如预料的一样,DL118的生物素区(在与ATCC20774的BIO区相比较时)是被附加的近似于pLD56大小的DNA破坏了。DL118 DNA的Mlu I消化片段(已用pBR322进行探测)进一步表明附加的DNA与完整的pLD56同样大小。
表达/分泌质粒pLX-34的构建构建的表达质粒是把带有XPR2分泌信号(157个氨基酸前原顺序)的凝乳酶密码顺序置于LEU2启动子的下游。这种表达质粒显示出除了XPR2启动子外的启动子可用来成功地分泌异源蛋白质。此外,这种表达载体能够实现与解脂亚罗威阿酵母基因组中整合位点无关的表达/分泌。成功地分泌带有除了XPR启动子外的其他启动子的凝乳酶原说明为了鉴定解脂亚罗威阿酵母中另外新的更强的启动子构建表达载体的可能性。此外,这种方法能够用来获得表达培养物,该培养物具有两个分离的杂交凝乳酶原基因,一个由LEU2启动子表达,另一个由XPR2启动子表达,被分别整合在宿主基因组中不同的位点上。
构建表达载体的试验步骤在图13中已作了概述,该载体含有凝乳酶原基因,带有用LEU2启动子顺序表达的碱性蛋白酶分泌信号(157个氨基酸的XPR2前原顺序)。构建这种质粒是从制备LEU2启动子片段起始的,该片段含有上述β-异丙基苯果酸脱氢酶基因的ATG转译起始密码子前的5′非转译顺序大约300碱基对(图12)。从穿梭载体pLD40中分离出为LEU2启动子顺序的270碱基对部分编码的300碱基对Hind III-Fok I DNA片段。这个片段用T4连接酶与54碱基对具有下列顺序的合成连接子连接,----------Leu2-------FokI5′-ATACAACCACACACATCCACAATG3′-TTGGTGTGTGTAGGTGTTAC-----------------Xpr2----------------BglIAAGCTCGCTACCGCCTTTACTATTCTCACTGCCGTTC-3′TTCGAGCGATGGCGGAAATGATAAGAGTGACGGC -5′然后用Hind III进行消化。所得连接顺序再用凝胶电泳分离大约360碱基对的Hind III-Bgl I DNA片段进行纯化。编码XPR2前原顺序的剩余部分和凝乳酶原的前152个氨基酸残基的另一个组成片段是从表达质粒pXX-33(图6)经Bgl I和Xam I切割分离出来的,再用凝胶纯化得到887碱基对DNA片段。第三个片段含有凝乳酶原基因的剩余部分、XPR2终止密码子和载体顺序,它是通过HindIII和Xma I切割pXX-33,再经切割大约8.0Kb载体片段再经凝胶纯化制备得到的。将这三个DNA片段用上述标准方法连接。连接反应物用于转化大肠杆菌K12菌株HB101。从选出的氨苄青霉素抗性转化株中分离质粒,质粒pLX-34用它的限制性图(图13)进行鉴定。
用经Nru I切割的pLX-34 DNA来转化解脂亚罗威阿酵母ATCC20794(DL118),以提供解脂亚罗威阿酵母ATCC 20795(DL251),并按上述pLS-3时的方法测定由不依赖亮氨酸的转化株培养物分泌到培养液中的凝乳酶原。这种转化方法指导pLX-34整合到预先引入宿主染色体bio座位上的pBR322顺序中(如上所述)。pLX-34在这个位点上的整合是用Southern分析法予以证实的。
用DL118作为受体Southern杂交实验按下述方法进行DL118转化株DNA的Nru I消化片段(例如当参入质粒是凝乳酶原表达质粒时,就与凝乳酶原探针杂交)精确地切割了参入质粒。用几毫微克经Nru I消化的转化质粒检查杂交带的正确大小,这些转化株DNA(已用32P标记的pBR322进行探测)的Mlu I消化片段(在转化质粒中Mlu I不切割)也表明DL118固有的pBR322顺序由于加入了一个或更多个转化质粒的分子而受到破坏。这证明整合是在所需位点上发生的。
将转化株培养物解脂亚罗威阿酵母ATCC20795(DL251)置于YEPD培养基中于22℃培养,以利于由LEU2启动子表达。在培养上清液中存在的凝乳酶原用酸活化培养上清液的凝乳测定(见上)予以证实并经免疫印迹分析(见上)确认。上述结果表明,这个杂交基因是一个独立的表达单位,当在除了XPR2或LEU2外的位点上整合时,能够表达/分泌。这个特点使人们能够用多重杂交基因构建表达培养物,它具有产生高水平的细胞外凝乳酶原的潜在能力。
实施例三 人C5a的合成基因的顺序实现由细菌产生人过敏毒素C5a而设计的计划,类似于如在欧洲专利申请0147178号中所述的用于合成和表达表皮生长因子(EGF)的先前方法。采用构建的一个基因,其中用于编码激活的补体成分C5a的顺序是人工合成的。给出已知的人C5a的氨基酸顺序,我们设计了一个编码其74个氨基酸信息的DNA片段(图9)。选择合成基因顺序以扩大大肠杆菌和啤酒酵母优选密码子的利用,并可使限制性核酸内切酶的若干位点便于鉴定。这项方案可以通过在编码C5a多肽第一个氨基酸的三联体之前引入蛋白质合成的ATG起始密码子,使得过敏毒素在大肠杆菌内直接表达。为便于在所需的取向上插入到质粒pBR322中,设计的合成C5a基因在其末端含有EcoR I和Hind III限制性核酸内切酶识别位点。为了获得C5a基因顺序,通过phosporamidite方法合成10个47聚体并且组装成235bp双股DNA片段。将C5a基因片段插入到被适当切割的pBR322中,并从随机挑选的转化株中通过质粒DNA的限制性切割分析来鉴定克隆基因。然后采用DNA顺序测定法分析若干C5a克隆,鉴别出带有正确顺序的克隆。在被检查的5个克隆中有2个找到了预期的C5a基因区的核苷酸顺序。
人C5a的细菌表达构建C5a表达质粒是从用限制性核酸内切酶EcoR I切割C5a亚克隆起始的,然后用细菌碱性磷酸酶处理脱磷酸化。用含有trp启动子—操纵子和核糖体结合位点顺序的pPFZ-R2中的360bp EcoR I DNA片段,构建C5a表达质粒。用连接反应物转化大肠杆菌菌株HB101的感受态细胞。对各个转化中的一些抗药性菌落进行纯化,并对它们的质粒DNA进行限制性核酸内切酶图谱分析,以鉴定在能导致C5a基因转录的取向上带有trp启动子的那些表达质粒。从上述连接反应中得到的多重分离物与含有过敏毒素基因的质粒相一致,所说的过敏毒素基因邻近直接表达C5a所需的构型中的细菌启动子顺序。C5a表达质粒p C5a-48的限制性图见图10。
人过敏毒素在解脂亚罗威阿酵母中的表达和分泌编码分泌人过敏毒素C5a的表达/分泌载体pC5a X-3的制备技术如实施例一对pXX-33所述。然后将解脂亚罗威阿酵母ATCC20774用这个分泌载体转化,并测定由转化培养物产生的人C5a,除了在免疫印迹步骤中用羊抗C5a和兔抗羊IgG,其余如上所述。对本实施例所述的质粒,证实了C5a存在于培养上清液中。
表达/分泌质粒pC5aX-3的构建构建过敏毒素表达/分泌质粒pC5a X-3的实验步骤在图11中概述。这个质粒含有“完整”XPR2启动子的顺序、以及与编码74个C5a氨基酸残基的合成顺序连接的157个氨基酸残基信号和肽原。pC5aX-3的构建计划类似于pXX-33。首先,用Hind III和Ava I切割质粒pXHP-24(或含有所需顺序的另一个质粒),凝胶纯化含有XPR2启动子的1150碱基对片段。另一个片段含有XPR2肽原的3′端和C5a结构基因顺序,是借助T4连接酶通过标准连接反应,用大肠杆菌表达质粒pC5a-48中的约220碱基对Hinf I-Hind III DNA片段和带有下列顺序的合成片段连接,,然后再用Ava I和Hind III进行切割得到的。
5′ CCGAGATTCCTGCTTCTTCTAATGCCAAGCGA3′3′ CTAAGGACGAAGAAGATTACGGTTCGCTTGA 5′所得的连接顺序通过凝胶电泳纯化,选择出大约250碱基对的AvaI-Hind III片段。含有启动子的Hind III-Ava I片段和编码C5a的Ava I-Hind III片段用T4连接酶连接,然后用Hind III消化。约1.4Kb片段进行凝胶纯化并且用经Hind III切割的pterm4(如上所述)连接。连接反应物用来转化大肠杆菌K12菌株MM294。从所选的转化株中分离出氨苄青霉素抗性质粒,质粒pC5aX-3用其限制图进行鉴定。然后将解脂亚罗威阿酵母菌株PC-30869(ATCC20774)用经Sna B I切割的pC5a X-3进行转化,并按上述方法测定由转化培养物分泌在培养基中的过敏毒素。用上述方法证实培养上清液中存在C5a。人们认为由与内质网结合的核糖体合成的许多蛋白质是以糖蛋白形式产生的。实际上,糖基化可影响给定蛋白质的分泌。真核蛋白质的N连接糖基化作用发生在三肽顺序天冬酰胺-X-苏氨酸和天冬酰胺-X-丝氨酸,其中X可以是除了可能的天冬氨酸外的任何氨基酸(Hubbard,S.等,1981,Ann.Rev.Biochem.50;555)。凝乳酶原的氨基酸顺序包括这样两个三肽顺序,但对分泌在解脂亚罗威阿酵母培养物中的凝乳酶原进行凝胶电泳分析证明没有糖基化的迹象。在另一些分泌的真核蛋白质中,也并不是所有的天冬酰胺-X-苏氨酸/丝氨酸位点都被糖基化。很可能三肽顺序内的某些天冬酰胺并不糖基化,因为它们难以接近糖基化酶。
关于人C5a,氨基酸顺序包括单个糖基化位点或三肽顺序(天冬酰胺-异亮氨酸-丝氨酸),该顺序通常具有与天冬酰胺相连的复合低聚糖(Fernandez,H.等,1976,J.Immunol.117,1688)。分泌到解脂亚罗威阿酵母培养基中的部分C5a分子似乎被糖基化,因为抗原活性的宽区是在免疫印迹的高分子量部分。这种不均一的电泳迁移率与所观察到的其他分泌蛋白质类似,可能是由于糖基化程度不同所致。在本发明中,某些分泌的异源蛋白质的表观糖基化启示人们,解脂亚罗威阿酵母的表达和分泌对产生许多正常的糖基化真核蛋白质将是有用的。
*从XPR2转化株DL112回收质粒的图解说明(参阅图1)。各个标记区是(从左到右)解脂亚罗威阿酵母未经测序部分、pBR322、EcoR I位点与连接解脂亚罗威阿酵母DNA(以前为BamH I位点)之间的小片段、解脂亚罗威阿酵母LEU2基因、pBR322的大片段、和已测序的XPR2的突变等位基因。“B”是Bgl II位点,“E”是EcoR I位点。用线条表示回收的3个质粒,它们在Bgl II位点的末端连接成环形分子。
权利要求
1.产生异源蛋白质的方法,该方法包括,培养一个解脂亚罗威阿酵母转化株,与异源载体DNA同源的同源区,所述同源区包含在所述解脂亚罗威阿酵母整合转化期间用作受体位点的外源DNA。
2.根据权利要求1的产生异源蛋白质的方法,其中同源区是由pBR322或其衍生物衍生的。
全文摘要
解脂亚罗威阿酵母的XPR2和LEU2基因顺序的排列,重组解脂亚罗威阿酵母克隆载体,包括编码表达哺乳动物蛋白质和其他多肽的异源DNA;用XPR2基因启动子、碱性蛋白质前原区和XPR2终止密码子区等整合的表达载体,能够在已转化的解脂亚罗威阿酵母的细胞培养物中表达异源蛋白质并将异源蛋白质分泌到细胞外;解脂亚罗威阿酵母转化株包括所述的载体和质粒;并提供制备载体的方法。
文档编号C12N9/60GK1138632SQ9610152
公开日1996年12月25日 申请日期1996年1月15日 优先权日1985年10月18日
发明者L·S·达维多, J·R·德齐, A·E·弗兰克 申请人:美国辉瑞有限公司