专利名称:淀粉制品在利用发酵的生物生产中的应用的制作方法
技术领域:
本发明涉及分子生物学领域。更具体地,它描述了含有能表达酶的基因的微生物宿主,所述酶能有效地将淀粉制品转化成发酵产物。
背景技术:
发酵是将可再生的原料生物催化地转化成理想产物的重要技术。碳水化合物是发酵工业的传统原料。经常见到的情况是,用作底物的碳水化合物在生产成本中的比重比任何其它的单一组分都大。根据具体的工艺,25~70%的总发酵成本可以归因于碳水化合物源(Crueger和Crueger,BiotechnologyA Textbook of Industrial Microbiology,Sinauer AssociatesSunderland,MA.,第124-174页(1990);Atkinson和Mavituna,Biochemical Engineering andBiotechnology Handbook,第2版;Stockton PressNew York,第243-364页(1991))。出于这样的经济原因,很少用高纯化的葡萄糖或蔗糖作为底物。
淀粉(碳水化合物)是两种不同多糖的混合物,每一种多糖由连接的重复单糖(葡萄糖)单元的链组成。该混合物由两种分离的多糖组成,即直链淀粉和支链淀粉。直链淀粉是线性多糖,含有专有地通过α(1,4)糖苷键连接的葡萄糖单元。支链淀粉中的葡萄糖单元也是通过α(1,4)糖苷键连接,另外还通过α(1,6)糖苷键连接,每30个葡萄糖残基约有一个。淀粉中的支链淀粉与直链淀粉的比例根据植物物种的不同而变化,但是其范围通常是3-4至1(Kainuma,Starch第125-150页;Whistler,Bemiller和Pashcall编,Academic Press,Orlando,FL(1984))。
商业淀粉主要是通过湿磨法生产的。但是,湿磨的终产物包括非常少的未加工的淀粉。到目前为止,生产的大多数产品是完全加工的淀粉(单糖,包括葡萄糖)或源自淀粉的更小的降解产物的形式。一般地,用淀粉酶将淀粉分解成更小的链(Blanchard,Technology of Cornwet Milling(1992),Elseiver,Amsterdam,荷兰,第174-215页)。存在各种商业化的α-淀粉酶源,但是,无论酶源如何,反应产物关于大小和键合类型通常是相同的。已知淀粉的淀粉酶消化产物是极限糊精,其包含含有2-10个葡萄糖单元(寡糖)的小淀粉链。因为淀粉酶不能水解支链淀粉中的α(1,6)糖苷键,所以极限糊精含有α(1,4)-和α(1,6)-连接的葡萄糖寡糖。或者,可以通过非酶法(例如,通过酸水解)处理粗淀粉,生产基本上类似于极限糊精的淀粉制品。
在湿磨工业中,极限糊精被进一步加工成葡萄糖,其用作发酵的碳源,以生产各种化学制剂、商业酶或抗生素。当流行的生物催化剂大肠杆菌(Escherichia coli)用在发酵工艺中时,相对较纯的葡萄糖是优选的碳水化合物源。这是因为,大肠杆菌不能利用极限糊精组分(即,潘糖、异麦芽糖和链长超过约10个α(1,4)-连接的葡萄糖单元的高分子量的寡糖),它们通常包含在备用的廉价发酵培养基中(Lin,Escherichia coli and Salmonella typhimuium,第245-265页,Neidhardt,编;American Society for Microbiology,Washington,D.C.(1987))。含有α(1,6)-键的葡萄糖寡聚体不能运输到细胞中,当胞外地供给该材料时,大肠杆菌不能生成能降解它的酶(Palmer等,Eur.J.Biochem.39601-612(1973))。
能从适合于大肠杆菌使用的淀粉生产出相对较纯的葡萄糖,这需要许多工艺步骤和其它的酶,它们显著地增加了产品的生产成本。
因而,要解决的问题是,缺少一种能在大规模发酵生产工艺中利用廉价的淀粉制品的方法。如果能更彻底地发酵廉价的、部分地降解的淀粉,将会降低通过发酵生产的产品的生产成本。
发明概述申请人已经提供了一种分离的编码α(1,6)-连接的葡萄糖寡糖水解酶的选自下述的核酸分子(a)分离的核酸分子,其编码选自SEQ IDNO2、4和6的氨基酸序列;(b)核酸分子,其能在下述杂交条件下与(a)杂交0.1X SSC,0.1%SDS,65℃,以及用2X SSC,0.1%SDS洗涤,然后用0.1X SSC,0.1%SDS洗涤;和(c)核酸分子,其与(a)或(b)互补。
申请人已经提供了核酸组合物,其包含信号肽和α(1,6)-连接的葡萄糖寡糖水解酶的编码区,所以能表达指导细胞质外的(胞外的)水解活性的嵌合蛋白。分离的核酸分子可以编码如SEQ ID NO24或SEQID NO25所述信号肽。信号序列的核酸序列是SEQ ID NO26或SEQID NO27。分离的核酸分子可以编码如SEQ ID NO2、4、6、17或31所述能水解α(1,6)-连接的葡萄糖寡糖的多肽。
申请人已经提供了重组生物,其包含α(1,6)-连接的葡萄糖寡糖水解酶,它能利用外源地添加的α(1,6)-连接的葡萄糖寡糖(例如,异麦芽糖和潘糖),以发酵生产有用产物。能水解α(1,6)-连接的葡萄糖寡糖的多肽可以选自SEQ ID NO2、SEQ ID NO6、SEQ ID NO17或SEQ ID NO31。本发明还包括SEQ ID NO1、3、5、16或30所述核酸分子编码的能水解α(1,6)-连接的葡萄糖寡糖的多肽。本发明还包括选自SEQ ID NO3、SEQ ID NO28、SEQ ID NO32、SEQ IDNO34、SEQ ID NO36、SEQ ID NO38、SEQ ID NO40或SEQ IDNO42的分离的核酸分子。本发明还包括多肽SEQ ID NO4、SEQ IDNO29、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ IDNO39、SEQ ID NO41和SEQ ID NO43。
本发明还包括嵌合基因,其包含可操作地连接到合适的调控序列的本文所述分离的核酸分子。合适的调控序列选自 CYC1,HIS3,GAL1,GAL10,ADH1,PGK,PHO5,GAPDH,ADC1,TRP1,URA3,LEU2,ENO,TPI,AOX1,lac,ara,tet,trp,IPL,IPR,T7,tac,trc,apr,npr,nos和GI。本发明包括转化的宿主细胞,其中嵌合基因整合在染色体中或是质粒-携带的。
申请人还已经提供了一种降解极限糊精的方法,其包括(a)使转化的宿主细胞在合适的生长条件下接触有效量的极限糊精底物,所述宿主细胞包含(i)核酸分子,其编码选自SEQ ID NO2、6、17和31的酶;(ii)核酸分子,其能在下述杂交条件下与(i)杂交0.1X SSC,0.1%SDS,65℃,用2X SSC,0.1%SDS洗涤,然后用0.1X SSC,0.1%SDS洗涤;或(iii)核酸分子,其与(i)或(ii)互补;和
(b)任选地回收步骤(a)的产物。
本发明还包括一种在重组宿主细胞中生产靶分子的方法,其包括在存在极限糊精、在合适的条件下使转化的宿主细胞与用于将单糖转化成靶分子的嵌合基因接触,所述宿主细胞包含(i)分离的核酸分子,其编码由连接到能水解α(1,6)-连接的葡萄糖寡糖的多肽的信号肽组成的嵌合蛋白;(ii)核酸分子,其能在下述杂交条件下与(i)杂交0.1X SSC,0.1%SDS,65℃,用2X SSC,0.1%SDS洗涤,然后用0.1XSSC,0.1%SDS洗涤;或(iii)核酸分子,其与(i)或(ii)互补,由此生成靶分子;和任选地回收生成的靶分子。信号肽可以选自SEQ ID NO24或SEQ ID NO25。能水解α(1,6)-连接的葡萄糖寡糖的多肽可以选自SEQ ID NO2、SEQ ID NO6、SEQ ID NO17或SEQ ID NO31。转化的宿主细胞可以选自细菌、酵母或丝状真菌。本发明包括从极限糊精生产1,3丙二醇、甘油和细胞因(Cell Mass)本发明还包括多肽,当在BLASTP比对方法的基础上与具有SEQ IDNO17所述序列的多肽(具有α(1,6)-连接的葡萄糖寡糖水解活性的多肽)相比较时,其氨基酸序列具有至少69%的相同性。
附图简述,生物保藏和序列说明
图1a至1d显示了大肠杆菌菌株DH5α的结果,该菌株含有质粒pUC18(图1a)(阴性对照)和含有来自克隆j20(图1b)、k1(图1c)或h12(图1d)的成熟编码序列的pUC18。从超声处理的细胞分离出总蛋白提取物,与潘糖(250μg/ml)在37℃温育2小时。显示了消化后的产物的高效阴离子交换层析谱。
根据布达佩斯条约中关于用于专利程序的微生物保藏的国际认可的条款,申请人在美国典型培养物保藏中心(American Type CultureCollection)(ATCC)10801 University Boulevard,Manassas,VA20110-2209进行了下述生物保藏保藏人鉴别参考国际保藏编码保藏日期大肠杆菌RJ8n ATCC PTA-4216 2002年4月9日列出的保藏物将在指定的国际保藏单位保藏至少30年,并且在公开它的专利授权后可以由公众获得。该保藏物的可获得性并不构成对实施主题发明的许可,所述实施会损害通过政府行为授予的专利权。
申请人提供了含有43个序列的序列表。这些序列能满足37 C.F.R.1.821-1.825(“对含有核苷酸序列和/或氨基酸序列公开内容的专利申请的要求——序列规则”),并且与世界知识产权组织(WIPO)标准ST.25(1998)和EPO和PCT(细则5.2和49.5(a-bis)和管理规程208部分和附件C)以及相应的美国专利商标局细则37 C.F.R.§1.822所述的序列表要求相一致。
SEQ ID NO1-6是从短双岐杆菌(Bifidobacterium breve)ATCC15700得到的3种基因/基因产物的核酸和氨基酸序列。
SEQ ID NO7-15和18-23是用于PCR的引物。
SEQ ID NO16-17是公开数据文库中公开的变异链球菌(Streptococcus mutans)(ATCC 25175D)的核酸和氨基酸序列。
SEQ ID NO24是来自短双岐杆菌基因mbc2g.pk018.j20(也包含在SEQ ID NO3中)的天然信号肽的氨基酸序列。
SEQ ID NO25是用于靶向由短双岐杆菌mbc1g.pk026.k1和变异链球菌dexB基因编码的酶的非天然的信号肽的氨基酸序列。
SEQ ID NO26是短双岐杆菌基因mbc2g.pk018.J20信号肽的核酸序列。
SEQ ID NO27是枯草芽孢芽孢杆菌(Bacillus subtilis)中性蛋白酶基因信号肽的核酸序列。
SEQ ID NO28是短双岐杆菌基因mbc2g.pk018.j20信号肽的核酸序列,其连接到短双岐杆菌mbc2g.pk018.h12基因的编码序列。
SEQ ID NO29是短双岐杆菌基因mbc2g.pk018.j20信号肽的氨基酸序列,其连接到短双岐杆菌mbc2g.pk018.h12基因的氨基酸序列。
SEQ ID NO30是没有其天然信号肽序列的短双岐杆菌基因mbc2g.pk018.j20的核酸序列。
SEQ ID NO31是没有其天然信号肽序列的短双岐杆菌基因mbc2g.pk018.j20的氨基酸序列。
SEQ ID NO32是短双岐杆菌基因mbc2g.pk018.j20信号肽的核酸序列,其连接到短双岐杆菌mbc2g.pk018.k1基因的编码序列。
SEQ ID NO33是短双岐杆菌基因mbc2g.pk018.j20信号肽的氨基酸序列,其连接到短双岐杆菌mbc2g.pk018.k1基因的氨基酸序列。
SEQ ID NO34是短双岐杆菌基因mbc2g.pk018.j20信号肽的核酸序列,其连接到变异链球菌dexB基因的编码序列。
SEQ ID NO35是短双岐杆菌基因mbc2g.pk018.j20信号肽的氨基酸序列,其连接到变异链球菌dexB基因的氨基酸序列。
SEQ ID NO36是枯草芽孢杆菌中性蛋白酶基因信号肽的核酸序列,其连接到短双岐杆菌mbc2g.pk018.h12基因的编码序列。
SEQ ID NO37是枯草芽孢杆菌中性蛋白酶基因信号肽的氨基酸序列,其连接到短双岐杆菌mbc2g.pk018.h12基因的氨基酸序列。
SEQ ID NO38是枯草芽孢杆菌中性蛋白酶基因信号肽的核酸序列,其连接到短双岐杆菌mbc2g.pk018.j20基因的编码序列。
SEQ ID NO39是枯草芽孢杆菌中性蛋白酶基因信号肽的氨基酸序列,其连接到短双岐杆菌mbc2g.pk018.j20基因的氨基酸序列。
SEQ ID NO40是枯草芽孢杆菌中性蛋白酶基因信号肽的核酸序列,其连接到短双岐杆菌mbc2g.pk018.k1基因的编码序列。
SEQ ID NO41是枯草芽孢杆菌中性蛋白酶基因信号肽的氨基酸序列,其连接到短双岐杆菌mbc2g.pk018.k1基因的氨基酸序列。
SEQ ID NO42是枯草芽孢杆菌中性蛋白酶基因信号肽的核酸序列,其连接到变异链球菌dexB基因的编码序列。
SEQ ID NO43是枯草芽孢杆菌中性蛋白酶基因信号肽的氨基酸序列,其连接到变异链球菌dexB基因的氨基酸序列。
发明详述申请人已经解决了所述问题。本发明提供了几种酶,当在生产宿主中表达时,它们能使宿主利用α(1,6)-连接的葡萄糖寡糖,该寡糖是廉价的淀粉制品组分。本发明还提供了信号序列,它能使α(1,6)-连接的葡萄糖寡糖水解酶靶向胞外。
可以得到廉价的淀粉制品,例如通过市场上可买到的淀粉酶对粗淀粉和其它含有α(1,6)-连接的葡萄糖寡糖的原料的作用,该作用会生成极限糊精。廉价淀粉制品的有效利用需要对宿主生物(例如大肠杆菌)进行基因工程处理,从而使该重组生物生产能降解α(1,6)-连接的葡萄糖寡糖的酶。能降解α(1,6)-连接的葡萄糖寡糖的酶是已知的(Vihinen和Mantsala Crit.Rev.in Biochem.Mol.Biol.4329-427(1989))。而且,已知能降解这些键的酶以其天然状态细胞内地(在细胞质内)和胞外地(在细胞质外)存在。
当宿主生物缺少运输系统时,通过添加天然的或非天然的信号肽,可以对细胞内酶进行工程处理以使其可接近极限糊精(或其它含有α(1,6)-连接的葡萄糖寡糖的原料)。信号肽使能降解α(1,6)-连接的葡萄糖寡糖的蛋白被导向到胞外位置(细胞质外),并接近没有摄入到细胞中的底物(Nagarajan等,Gene 114121-126(1992))。能将蛋白穿过细胞膜移位的信号肽的实例包括但不限于SEQ ID NO24和25。含有信号肽的蛋白指向分泌途径,然后穿过细胞膜移位。蛋白分泌的普通机制在所有革兰氏阴性的和革兰氏阳性的细菌都是保守的(Simonen和Palva(1993)Microbiol.Rev.57109-137;Fekkes和Driessen(1999)Microbiol.Rev.63161-173)。所有细菌的信号肽都包含13~20个疏水氨基酸串(Bae和Schneewind,J.Bacteriol.,1852910-2919(2003))。
天然的大肠杆菌不能水解α(1,6)-糖苷键,因而在发酵中不能利用含有(1,6)-键的化合物。(1,6)-键能被“异淀粉酶”和“葡糖苷酶”所水解(异麦芽糖和潘糖是(1,6)-连接的寡糖的模型化合物)。含有非天然的胞外“异淀粉酶”或“葡糖苷酶”的重组大肠杆菌能在发酵中利用含有(1,6)-键的化合物(例如,异麦芽糖和潘糖)来生产有用的产物。而且,含有非天然的胞外“异淀粉酶”或“葡糖苷酶”的任何重组生物都能更有效地利用含有(1,6)-键的化合物。提高的使用效率将会贯穿重组的“异淀粉酶”或“葡糖苷酶”基因的组成型表达或改变的定时。重组基因的表达也会提高活性水平,使其超过可能存在的任何内源“异淀粉酶”或“葡糖苷酶”基因的水平,从而提高对(1,6)-连接的底物的利用。
本发明可以用于生产各种生物发酵产物,包括但不限于有机酸、抗生素、氨基酸、酶、维生素、醇(例如生物醇(bioethanol))和细胞物质(cell mass)。通过使用信号肽,用极限糊精作为宿主微生物的碳源来生物生产甘油、1,3-丙二醇和细胞物质,这是本发明的示例。
多元醇1,3-丙二醇是对生产聚酯纤维和生产聚氨基甲酸酯和环状化合物有用的单体。通过单一生物从碳底物(例如葡萄糖或其它糖)生物生产1,3-丙二醇的方法已经描述在美国专利号5,686,276中,它在这里引作参考。
淀粉是葡萄糖的同多糖。它在高等植物中合成为含有两种组分的颗粒,即直链淀粉和支链淀粉(Vihinen和Mantsala,Crit.Rev.Biochem.Mol.Biol.,24329-418(1989))。直链淀粉是通过α(1,4)-连接的葡萄糖残基形成的基本上线性的多糖,占颗粒的15-25%(含量根据植物物种不同而异)。相反地,支链淀粉是高度分支的,约4~5%的糖苷键是α(1,6)-连接的葡萄糖残基。已经深入地研究了能降解淀粉的淀粉分解酶。高等植物物种中的淀粉代谢是通过首先将聚合物降解成单个的葡萄糖残基,这需要几种淀粉分解酶的相互作用。
淀粉分解酶在单独作用时,通常仅能将淀粉部分地降解为更小的直链或支链。可以用淀粉分解酶的组合或者与酸处理一起的酶组合来提高淀粉的解聚。
酶和酶组合可以将淀粉部分地降解成更小的直链或支链,或完全降解成葡萄糖。α-葡糖苷酶能水解寡糖中的(1,4)-和(1,6)-键,所述寡糖是通过其它淀粉分解酶(例如α-淀粉酶、β-淀粉酶、葡糖淀粉酶、异淀粉酶和支链淀粉酶)或通过酸和热处理的作用形成的。
α-葡糖苷酶(α-D-葡糖苷葡糖水解酶;例如,EC 3.2.1.20)广泛地分布在微生物中。它们能水解(1,4)-和(1,6)-键,并从非还原末端释放出α-D-葡萄糖单元。已经在下述物种中发现了这些具有不同的(和广泛的)底物特异性的酶的不同类型细菌例如芽孢杆菌属(Bacillus),链球菌属(Streptococcus),埃希氏菌属(Escherichia),假单胞菌属(Pseudomonas),超嗜热古细菌例如火球菌属(Pyrococcus)、热球菌属(Thermococcus)和栖热孢菌病(Thermotoga),和真菌物种例如青霉属(Penicillium)、四膜虫属(Tetrahymena)、糖酵母属(Saccharomyces)和曲霉属(Aspergillus)。
已经广泛地研究了来自黑曲霉(Aspergillus niger)的酶多年,其具有广泛的底物特异性。其水解这样的底物,例如麦芽糖、曲二糖、黑曲糖、异麦芽糖、苯基-α-葡糖苷、苯基-α-麦芽糖苷、寡糖、麦芽糖糊精和可溶性的淀粉。来自米曲霉(A.oryzae)、枯草芽孢杆菌和蜡状芽孢杆菌(B.cereus)和超嗜热古细菌的α-葡糖苷酶表现出类似的性质。
寡-(1,6)-葡糖苷酶或异麦芽糖酶(糊精6-α-D-葡聚糖水解酶,EC3.2.1.10;dexB基因编码)是类似于α-葡糖苷酶的酶(Krasikov等,Biochemistry(Moscow).66332-348(2001))。它能催化由α-淀粉酶水解淀粉和糖原生成的异麦芽糖和糊精中的(1,6)-α-D-葡糖苷键(Enzyme Nomenclature,C.Webb,编(1984)Academic Press,SanDiego,CA.)。该酶比α-葡糖苷酶更少地分布,但是在生物中有所发现,例如芽孢杆菌属物种,包括热葡糖苷芽孢杆菌(B.thermoglucosidius)KP1006、蜡状芽孢杆菌ATCC 7064和可能的解淀粉芽孢杆菌(B.amyloliquefaciens)ATCC 23844(Vihinen和Mantsala,Critical Reviews in Biochemistry.24329-418(1989)),以及凝结芽孢杆菌(Bacillus coagulans)(Suzuki和Tomura,Eur.J.Biochem.,15877-83(1986))。芽孢杆菌酶的大小一般是60-63kDa。还已经从热厌氧菌属(Thermoanaerobium)Tok6-B1分离出寡-(1,6)-α-葡糖苷酶(EC 3.2.1.10),报道其分子量为30-33kDa。
来自变异链球菌的dexB酶的活性模式类似于葡聚糖酶(EC3.2.1.11),后者能催化葡聚糖中的(1,6)-α-D-葡糖苷键的内水解(endohydolysis)。dexB酶和芽孢杆菌属物种寡-(1,6)-葡糖苷酶之间有较高程度的相似性(Whiting等,J.Gen.Microbiol.,1392019-2026(1993))。DexB大小约是62kDa(Aduse-Opoku等,J.GenMicrobiol.,137757-764(1991))。
具有α(1,6)水解酶活性的酶属于超过81种鉴别出的葡糖基水解酶家族的非常宽的种类(Henrissat,Biochem.J.,280309-316(1991);Henrissat和Bairoch,Biochem.J.,293781-788(1993))。通过使用少至69%氨基酸序列的相同性的酶证实本发明的用途,进一步强调了广分类的能利用α(1,6)连接的葡萄糖单元作为发酵底物的酶。已知能解聚含有α(1,6)-连接的葡萄糖残基的寡糖的酶,包括葡糖淀粉酶(EC 3.2.1.3,也称作淀粉葡糖苷酶),它在序列中的下一键是α(1,4)-α-D-葡糖苷键时能快速地水解(1,6)-α-D-葡糖苷键或连接;α-糊精内-(1,6)-α-葡聚糖苷酶(glucanosidase)(EC3.2.1.41,也称作支链淀粉酶),它能降解支链淀粉、支链淀粉、糖原和支链淀粉和糖原的α-和β-淀粉酶极限糊精中的(1,6)-α-D-葡糖苷键;蔗糖酶(EC 3.2.1.48),它分离自肠粘膜,且具有抗异麦芽糖的活性;异淀粉酶(EC 3.2.1.68),它能水解糖原、支链淀粉和它们的β-极限糊精中的(1,6)-α-D-葡糖苷键;和葡聚糖(1,6)-α-葡糖苷酶(EC3.2.1.70),它能水解来自(1,6)-α-D-葡聚糖和衍生的寡糖的连续葡萄糖残基。
在本公开内容的上下文中,使用了许多术语。
术语“淀粉”是指由通过糖苷键连接的D-葡萄糖单元组成的同多糖,其形成植物中的营养储存文库。淀粉存在2种形式,即直链淀粉和支链淀粉。在直链淀粉中,D-葡萄糖单元专有地通过α(1,4)糖苷键连接。认为由多个α(1,4)糖苷键组成的链是线性的或未分支的。在支链淀粉中,尽管主要的连接是通过α(1,4)糖苷键,但偶尔存在的α(1,6)糖苷键形成了另外的线性部分的分支点。支链淀粉在每30个α(1,4)键中含有约1个α(1,6)键。
术语“单糖”是指经验式(CH2O)n的化合物,其中n≥3,碳骨架是未分支的,除了1个碳原子外的每个碳原子都含有羟基,剩余的碳原子是在碳原子2上的醛或酮。术语“单糖”还指细胞内的环状半缩醛或半酮缩醇形式。最熟悉的单糖是D-葡萄糖。环状形式的D-葡萄糖涉及碳原子5的羟基与碳原子1的醛形成半缩醛的反应,其中羰基碳被称为异头碳。
术语“糖苷键”和“糖苷连接”是指通过异头碳与醇羟基的反应形成的缩醛。1个D-葡萄糖分子的异头碳与第2个D-葡萄糖分子的碳原子4上的羟基的反应产生α(1,4)糖苷键或连接。类似地,1个D-葡萄糖分子的异头碳与第2个D-葡萄糖分子的碳原子6上的羟基的反应产生α(1,6)糖苷键或连接。本领域的技术人员能够认识到,糖苷键可以是α或β构型。糖苷键构型通过例如α(1,4)和α(1,6)命名。
术语“α”是指键在环平面之上的构象。相反地,“β”是指键在环平面之下的构象。
术语“寡糖”是指含有2~10个通过糖苷键连接的单糖单元的化合物。术语“多糖”是指含有超过10个通过糖苷键连接的单糖单元的化合物,且通常是指大分子量种类的混合物。由单一单体单元组成的多糖由术语“同多糖”表示。
术语“异麦芽糖(isomaltosaccharide)”是指具有至少一个α(1,6)-键的寡糖。
术语“(1,4)键”是指两个糖之间的关系,其中1个糖单元的C1结合到第2个糖单元的C4。
术语“(1,6)键”是指两个糖之间的关系,其中1个糖单元的C1结合到第2个糖单元的C6。
术语“淀粉酶”和“α-淀粉酶”是指能催化α(1,4)糖苷键的水解的酶。α(1,4)糖苷键的水解活性是通过术语“淀粉酶活性”或“淀粉分解活性”表示的。淀粉酶包括但不限于IUBMB分类EC 3.2.1.1(淀粉酶)、EC 3.2.1.60((1,4)-α-maltotetraohydrolase)和EC 3.2.1.98((1,4)-α-(maltohexaosidase))。
术语“异淀粉酶”和“α-异淀粉酶”是指能催化α(1,6)糖苷键的水解的酶。α(1,6)糖苷键的水解活性是通过术语“异淀粉酶活性”或“异淀粉分解活性”表示。异淀粉酶包括但不限于IUBMB分类EC 3.2.1.10(寡-(1,6)-葡糖苷酶)、EC 3.2.1.11(葡聚糖酶)、EC 3.2.1.41(支链淀粉酶)和EC 3.2.1.68(异淀粉酶)。
术语“葡糖苷酶”和“α-葡糖苷酶”是指能催化α(1,4)糖苷键和α(1,6)糖苷键的水解并从寡糖的非还原末端释放出α-D-葡萄糖单元的酶。葡糖苷酶具有淀粉分解活性和异淀粉分解活性。葡糖苷酶包括但不限于IUBMB分类EC 3 2.1.3(淀粉葡糖苷酶)和EC 3.2.1.20(α-葡糖苷酶)。
术语“α(1,6)-连接的葡萄糖寡糖水解酶”是指具有催化α(1,6)糖苷键水解的功能活性的酶。具有这样的功能活性的酶的具体实例包括异淀粉酶、α-异淀粉酶、葡糖苷酶和α-葡糖苷酶。
术语“异麦芽糖酶”或“寡-(1,6)-葡糖苷酶”或“糊精6-α-D-葡聚糖水解酶”是指酶(EC 3.2.1.10),它仅能水解寡糖的非还原末端的α(1,6)-键。
术语“DexB”是指由变异链球菌的dexB基因(GenBank登记号M77351)编码的(1,6)-α-葡糖苷酶,它从α(1,6)-连接的异麦芽糖和葡聚糖的非还原末端释放出葡萄糖。
术语“极限糊精”是指含有单糖和寡糖的淀粉的淀粉分解降解产物。淀粉酶对支链淀粉的作用会生成单糖(D-葡萄糖)、二糖(α(1,4)连接的麦芽糖和α(1,6)连接的异麦芽糖)和更高的寡糖的混合物。更高的寡糖可以是线性的(专有地含有α(1,4)键)或分支的(主要含有α(1,4)键和α(1,6)键)。
术语“聚合度”或“DP”是指在糖混合物的各组分中的单体单元的数目;例如,单糖例如D-葡萄糖)的DP为1,二糖(例如麦芽糖)的DP为2,三糖(例如潘糖)的DP为3,等。当应用到多糖混合物或寡糖混合物时,DP是指每个分子中的单体的平均数目。
术语“葡萄糖当量”(″DE″)是指通过Lane-Eynon滴定测定的“表示为干物质的葡萄糖百分比的还原糖含量”(Handbook of StarchHydrolysis Products and their Derivatives,M.W.Kearsely和S.Z.Dziedzic,编,Blackie Academic&Professional,第86页)。DE大小表示了淀粉的水解度,淀粉具有0DE标称值而最终水解产物具有100DE值。
淀粉酶和异淀粉酶活性可以是胞内的或胞外的。为了本发明的目的,术语“胞内活性”是指当提供底物时能从破碎的细胞或细胞提取物观察到、但是当胞外地提供底物时不能从完整细胞观察到的酶活性。术语“胞外活性”是指当胞外地提供底物时能从完整细胞(包括生长的细胞)观察到的活性。酶底物不能被动扩散或主动运输进细胞,由术语“胞内活性”和“胞外活性”暗示。
“靶分子”是指生物催化地生成的产物。这可以是通过生物催化剂自然地生成的化合物,或者非天然的基因可以进行基因工程处理进入微生物中,以用于它们在生物发酵中的功能表达。在本上下文中的“靶分子”还指生物发酵的任何副产物,它们可以理想地从生物发酵系统中选择性地除去,以消除反馈抑制和/或使生物催化剂活性最大化。
“体积生产率”是指单位时间内在给定体积的生物发酵罐中生成的靶分子质量,其单位为克/(升·小时)(缩写为g/(L·hr))。该度量是通过生物催化剂的特异性活性和生物催化剂的浓度测定的。它从效价、运行时间和生物发酵罐的工作体积计算出。
“效价”是指靶分子的浓度,其单位为克/升(缩写为g/L)。
术语“多核苷酸”或“多核苷酸序列”、“寡核苷酸”、“核酸序列”和“核酸片段”或“分离的核酸片段”在本文中互换地使用。这些术语包括核苷酸序列等。多核苷酸可以是单链的或双链的RNA或DNA的聚合物,所述RNA或DNA任选地含有合成的、非自然的或改变的核苷酸碱基。DNA聚合物形式的多核苷酸可以由cDNA、基因组DNA、合成的DNA的一个或多个片段或它们的混合物组成。
术语“分离的”是指诸如核酸分子和/或蛋白的材料基本上不含有通常在自然环境中伴随该材料或与其相互作用的组分,或者已经从其中分离出。分离的多核苷酸可以是从它们自然存在的宿主细胞中纯化出的。可以使用本领域技术人员已知的常规核酸纯化方法来获取分离的多核苷酸。该术语还包括重组多核苷酸和化学合成的多核苷酸。
如本文所使用的,“分离的核酸分子”或“分离的核酸片段”是单链的或双链的RNA或DNA的聚合物,所述RNA或DNA任选地含有合成的、非自然的或改变的核苷酸碱基。DNA聚合物形式的分离的核酸片段可以由cDNA、基因组DNA或合成的DNA的一个或多个片段组成。
术语“互补”用于描述能与另一个核苷酸碱基杂交的核苷酸碱基之间的关系。例如,关于DNA,腺嘌呤与胸腺嘧啶互补,胞嘧啶与鸟嘌呤互补。因此,本发明还包括能与所附序列表报道的完整序列以及基本上类似的核酸序列互补的分离的核酸片段。
如本文所使用的,“基本上类似的”是指核酸片段,其中的一个或多个核苷酸碱基的变化造成了一个或多个氨基酸的替代,但是不影响该核苷酸序列编码的多肽功能性质。因此可以明白,本发明不仅包括具体示例的核苷酸或氨基酸序列,还包括它们的功能等同物。术语“基本上类似的”和“基本上对应的”在本文中互换地使用。
而且,本领域熟知能导致在指定的位点生成化学上等同的氨基酸、但是不影响编码的多肽的功能性质的核酸片段中的改变。因此,氨基酸丙氨酸(一种疏水氨基酸)的密码子可以替代为编码另一个更少疏水性残基(例如甘氨酸)的密码子或编码另一个更多疏水性残基(例如缬氨酸、亮氨酸或异亮氨酸)的密码子。类似地,可以预期能导致一个带负电荷的残基替代另一个(例如天冬氨酸替代谷氨酸)或一个带正电荷的残基替代另一个(例如赖氨酸替代精氨酸)的变化也能生成功能上的等价产物。还可以预期,能导致多肽分子的N-端和C-端部分的改变的核苷酸变化不会改变多肽的活性。每一种推定的修饰都是本领域的常规技术,保持编码产物的生物学活性的测定也是如此。
而且,基本上类似的核酸片段还可以通过它们的杂交能力来表征。这种同源性是通过严格条件下的DNA-DNA或DNA-RNA杂交来估计的,如本领域的技术人员所熟知的(Hames和Higgins,编(1985)NucleicAcid Hybridisation,IRL Press,Oxford,英国)。可选择严格条件以用于筛选中等相似的片段,例如来自关系较远的生物的同源序列,至高度相似的片段,例如能加倍来自密切相关的生物的功能酶的基因。杂交后的洗涤决定了严格条件。一组优选的条件使用一系列的洗涤开始是6X SSC,0.5%SDS,在室温进行15分钟,然后重复2XSSC,0.5%SDS,在45℃进行30分钟,然后重复2次0.2X SSC,0.5%SDS,在50℃进行30分钟。一组更优选的严格条件使用更高的温度,其中的洗涤与上面相同,只是最后2次在0.2X SSC,0.5%SDS中的30分钟洗涤的温度提高到了60℃。另一个优选的高度严格的条件使用两次在0.1X SSC,0.1%SDS中、在65℃的最终洗涤。
本发明的基本上类似的核酸片段还可以通过它们编码的氨基酸序列与本文所公开的氨基酸序列的百分比相同性来表征,如通过本领域的技术人员通常采用的算法所测定的。合适的核酸片段(本发明的分离的多核苷酸)编码的多肽与本文所报道的氨基酸序列至少70%相同、优选地至少80%相同。优选的核酸片段编码的氨基酸序列与本文所报道的氨基酸序列至少85%相同。更优选的核酸片段编码的氨基酸序列与本文所报道的氨基酸序列至少90%相同。最优选的核酸片段编码的氨基酸序列与本文所报道的氨基酸序列至少95%相同。合适的核酸片段不仅具有上述的相同性,一般还编码具有至少50氨基酸、优选地至少100氨基酸、更优选地至少150氨基酸、再优选地至少200氨基酸和最优选地至少250氨基酸的多肽。
本领域的技术人员熟知,序列相同性的许多水平可以用于鉴别相关的多肽序列。百分比相同性的有用实例是50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或55%至100%之间的任何整数百分比。如本领域所知的,术语“%相同性”是指两个或多个多肽序列或两个或多个多核苷酸序列之间的关系,如通过序列比较所测定的。在本领域“相同性”还指多肽或多核苷酸序列之间的序列关联性程度,根据具体情况而定,如通过这些序列串之间的匹配所测定的。“相同性”和“相似性”可以容易地通过已知方法计算出,包括但不限于下面所述Computational Molecular Bioloay(Lesk,A.M.,编)OxfordUniversity Press,New York(1988);BiocomputingInformaticsand Genome Projects(Smith,D.W.,编)Academic Press,New York(1993);Computer Analysis of Sequence Data,Part I(Griffin,A.M.和Griffin,H.G.,编)Humana Press,New Jersey(1994);Sequence Analysis in Molecular Biology(von Heinje,G.,编)Academic Press(1987);和Sequence Analysis Primer(Gribskov,M.和Devereux,J.,编)Stockton Press,New York(1991)。测定相同性的优选方法能能在测试的序列之间产生最佳匹配。测定相同性和相似性的方法已经编程成公众可获得的计算机程序。可以使用LASERGENE生物信息计算组件(DNASTAR Inc.,Madison,WI)的Megalign程序进行序列比对和百分比相同性计算。使用Clustal比对方法(Higgins和Sharp(1989)CABIOS.5151-153)、默认参数(GAP PENALTY=10,GAP LENGTH PENALTY=10)进行了多次序列比对。使用Clustal方法进行逐对比对的默认参数是KTUPLE 1,GAPPENALTY=3,WINDOW=5和DIAGONALS SAVED=5。
合适的核酸片段(本发明的分离的多核苷酸)编码的多肽与本文报道的氨基酸序列有至少约60%的相同、优选地至少约80%的相同。优选的核酸片段编码的氨基酸序列与本文报道的氨基酸序列有至少约85%的相同。更优选的核酸片段编码的氨基酸序列与本文报道的氨基酸序列有至少约90%的相同。最优选的核酸片段编码的氨基酸序列与本文报道的氨基酸序列有至少约95%的相同。
氨基酸或核苷酸序列的“基本部分”包含足以提供氨基酸或核苷酸序列含有的蛋白或基因的推定鉴别的氨基酸或核苷酸序列。通过本领域的技术人员手工地或通过使用基于计算机的序列对比和鉴别工具,可以评价氨基酸或核苷酸序列,所述工具采用算法例如BLAST(BasicLocal Alignment Search Tool;Altschul等(1993)J.Mol.Biol.215403-410;还参见国家健康研究所国家医药图书馆的国家生物技术信息中心(National Center for Biotechnology Information atthe National Library of Medicine of the National Institutesof Health)的环球网站点上的对BLAST算法的解释)。通常,为了推定地鉴别多肽或核酸序列与已知蛋白或基因的相同性,10个或更多的连续氨基酸或30个或更多的连续核苷酸的序列是必须的。而且,关于核苷酸序列,含有30个或更多的连续核苷酸的基因-特异性的寡核苷酸探针可以用于依赖于序列的基因鉴别(例如,DNA杂交)和分离(例如,细菌菌落或噬菌体噬斑的原位杂交)方法。另外,含有12个或更多的核苷酸的短寡核苷酸可以用作PCR的扩增引物,以得到含有该引物的特定核酸片段。因此,核苷酸序列的“基本部分”包含能提供含有该序列的核酸片段的特异性的鉴别和/或分离的核苷酸序列。本说明书教导了编码含有一个或多个特定植物蛋白的多肽的氨基酸和核苷酸序列。利用本文报道的序列,本领域的技术人员现在可以使用公开的序列的全部或基本部分用于本领域的技术人员已知的目的。因此,本发明包含所附序列表报道的完整序列以及上面定义的那些序列的基本部分。
“密码子简并性”是指能允许核苷酸序列变化而不影响编码的多肽的氨基酸序列的遗传密码的趋异。因此,本发明涉及含有编码本文所述氨基酸序列的全部或基本部分的核苷酸序列的任何核酸片段。本领域的技术人员熟知特定的宿主细胞在使用核苷酸密码子以指定特定的氨基酸时表现出来的“密码子偏倚”。因此,当合成用于提高宿主细胞中的表达的核酸片段时,需要设计核酸片段,使其密码子的使用频率接近宿主细胞的优选密码子的使用频率。
从使用本领域的技术人员已知的方法化学合成的寡核苷酸结构单元可以装配出“合成的核酸片段”或“合成的基因”。连接和退火这些结构单元以形成更大的核酸片段,然后可以将它们酶切地装配,构建完整的理想的核酸片段。与核酸片段相关的“化学合成的”是指组分核苷酸是体外装配的。使用充分确立的方法可以手工地化学合成核酸片段,或者使用许多市场上可买到的装置之一来自动地化学合成。因此,可以将核酸片段裁剪以进行最佳的基因表达,其基于核苷酸序列的最优化以反映宿主细胞的密码子偏倚。如果密码子使用偏倚于宿主偏好的密码子,本领域的技术人员能够明白成功的基因表达的可能性。优选密码子的确定可以以调查源自宿主细胞的基因为基础,该基因的序列信息是可获得的。
术语“序列分析软件”是指能用于核苷酸或氨基酸序列分析的任何计算机算法或软件程序。可以从市场上买到或独立地开发出“序列分析软件”。一般的序列分析软件包括但不限于GCG程序套(WisconsinPackage Version 9.0,Genetics Computer Group(GCG),Madison,WI),BLASTP,BLASTN,BLASTX(Altschul等,J.Mol.Biol.215403-410(1990)和DNASTAR(DNASTAR,Inc.1228 S.Park St.Madison,WI 53715美国)和采用Smith-Waterman算法的FASTA程序(W.R.Pearson,Comput.Methods Genome Res.,[Proc.Int.Symp.](1994),Meeting Date 1992,111-20.Editor(s)Suhai,Sandor.PublisherPlenum,New York,NY)。在本申请的上下文中应当明白,在用序列分析软件进行分析时,除非另有说明,分析的结果是基于使用的程序的“默认值”的。如本文所使用的,“默认值”是指当初次启动时在软件中原始调用的数值或参数的任何设置。
“基因”是指能表达特定蛋白的核酸片段,其包括在编码序列之前(5′非编码序列)和之后(3′非编码序列)的调控序列。“天然基因”是指具有其自己的调控序列的自然存在的基因。“嵌合基因”是指非天然基因的任何基因,其含有非自然地一起存在的调控序列和编码序列。因此,嵌合基因可以含有不同来源或相同来源、但是以不同于自然存在的方式排列的调控序列和编码序列。“嵌合蛋白”是由嵌合基因编码的蛋白。“内源基因”是指在生物的基因组中的自然位置的天然基因。“外源基因”是指在宿主生物中通常不存在的基因,但是它通常经基因转移导入了宿主生物。外源基因可以包含插入到非天然的生物中的天然基因、重组DNA构建体或嵌合基因。“转基因”是已经通过转化方法导入基因组中的基因。
“编码序列”是指编码特定的氨基酸序列的核苷酸序列。
“调控序列”和“合适的调控序列”是指位于编码序列的上游(5′非编码序列)、之中或下游(3′非编码序列)的核苷酸序列,其影响相关的编码序列的转录、RNA加工或稳定性或翻译。调控序列可以包含启动子、翻译前导序列、内含子和多腺苷酸化识别序列。
“启动子”是指能够控制编码序列或功能性RNA的表达的核苷酸序列。通常,编码序列是位于启动子序列的3’。启动子可以整体地源自天然基因,或者可以由源自不同的自然存在的启动子的不同元件组成,或者可以甚至包含合成的核苷酸片段。本领域的技术人员能够明白,不同的启动子可以指导不同组织或细胞类型、或不同发育阶段,或者作为对不同环境条件的反应的基因表达。能使核酸片段在大多数细胞类型中在大多时间表达的启动子通常称作“组成型启动子”。还认识到,由于在大多数情况下尚未完整地定义调控序列的精确边界,不同长度的核酸片段可以具有相同的启动子活性。
有许多能用于驱动本发明的基因在理想宿主细胞中的表达的启动子,且该启动子是本领域的技术人员所熟悉的。实际上,能驱动这些基因的任何启动子都是适用于本发明的,包括但不限于CYC1,HIS3,GAL1,GAL10,ADH1,PGK,PHO5,GAPDH,ADC1,TRP1,URA3,LEU2,ENO,TPI(用于糖酵母属中的表达);AOX1(用于毕赤酵母属(Pichia)中的表达);和lac,ara,tet,trp,IPL,IPR,T7,tac和trc(用于大肠杆菌中的表达),Streptomyces lividins GI,以及amy,apr和npr启动子和用于在芽孢杆菌属中表达的不同噬菌体启动子。
“翻译前导序列”是指位于基因的启动子序列和编码序列之间的核苷酸序列。翻译前导序列位于翻译起始序列的完全加工的mRNA的上游。翻译前导序列会影响mRNA初级转录物的加工、mRNA稳定性或翻译效率。翻译前导序列的实例已经描述在(Turner和Foster(1995)Mol.Biotechnol.3225-236)。
“3′非编码序列”是指位于编码序列下游的DNA序列,其包括多腺苷酸化识别序列和编码能影响mRNA加工或基因表达的调节信号的其它序列。多腺苷酸化信号的特征通常是影响多腺苷酸序列段向mRNA前体的3′端的添加。不同的3′非编码序列的使用由Ingelbrecht等((1989)Plant Cell 1671-680)示例。
“RNA转录物”是指RNA聚合酶-催化的DNA序列的转录产物。当RNA转录物是DNA序列的完全互补拷贝时,它称作初级转录物,或者它可以是源自初级转录物的转录后加工的RNA序列,此时它称作成熟的RNA。“信使RNA(mRNA)”是指不含有内含子且可以被细胞翻译成多肽的RNA。“cDNA”是指与mRNA模板互补且来自它的DNA。cDNA可以是单链形式,或者使用例如DNA聚合酶I的Klenow片段转化成双链形式。“有义-RNA”是指包括mRNA且因而可以由细胞翻译成多肽的RNA转录物。“反义RNA”是指与全部或部分目标初级转录物或mRNA互补的RNA转录物,其能阻止目标基因的表达(见,美国专利号5,107,065,本文中引作参考)。反义RNA的互补性可以是特定核苷酸序列的任何部分的,即在5′非编码序列、3′非编码序列、内含子或编码序列。“功能性的RNA”是指有义RNA、反义RNA、核酶RNA或其它的不能被翻译但是仍然对细胞过程有影响的RNA。
术语“可操作地连接”是指位于一个多核苷酸上且彼此相连的2个或更多的核酸片段,所以一个的功能会影响其它的功能。例如,当它能影响编码序列的表达时,该启动子是可操作地连接到该编码序列(即,该编码序列是在该启动子的转录控制下)。编码序列可以以有义的或反义的方向可操作地连接到调控序列。
如本文所使用的,术语“表达”是指源自本发明的核酸片段的有义(mRNA)或反义RNA的转录和稳定积累。表达还可以指mRNA向多肽的翻译。“反义抑制”是指能抑制目标蛋白的表达的反义RNA转录物的产生。“超表达”是指在转基因生物中的基因产物的产生超过了在正常的或非转化的生物中的产生水平。“共抑制”是指能抑制相同的或基本上类似的外源或内源基因的表达的有义RNA转录物的产生(美国专利号5,231,020,本文中引作参考)。
“蛋白”或“多肽”是以编码多肽的多核苷酸中的编码序列决定的特定顺序排列的氨基酸链。每一种蛋白或多肽具有独特的功能。
“信号序列”是指编码信号肽的核苷酸序列。
“转化”是指核酸片段向宿主生物或宿主生物的基因组中的转移,其导致遗传上稳定的遗传。含有转化的核酸片段的宿主生物称作“重组的”、“转基因的”或“转化的”生物。因此,本发明的分离的多核苷酸可以整合进能导入宿主细胞并在其中复制的重组构建体中,一般是DNA构建体。这样的构建体可以是包括复制系统和能在给定的宿主细胞中转录和翻译编码多肽的序列的序列的载体。一般地,表达载体包括例如一个或多个在5′和3′调控序列和选择性标记转录控制下的克隆基因。这样的载体还可以含有启动子调节区(例如,控制诱导型的或组成型的、环境地或发育地调节的或位置特异性的表达的调节区)、转录起始位点、核糖体结合位点、转录终止位点和/或多腺苷酸化信号。
术语“宿主细胞”或“宿主生物”是指能接受外源基因或异源基因或内源基因的多个拷贝并表达这些基因以生成有活性的基因产物的微生物。
术语“DNA构建体”或“构建体”是指人工构建的DNA片段。这样的构建体可以单独使用或者与载体结合使用。
术语“质粒”、“载体”和“盒”是指通常携带基因的染色体外的元件,所述基因不是细胞中心代谢的部分,其通常是环状双链DNA分子的形式。这样的元件可以是自主复制序列、整合入基因组的序列、噬菌体或任何来源的单链的或双链的DNA或RNA的线性的或环状的核苷酸序列,其中许多核苷酸序列已经插入或重组进独特的构建体中,该构建体能将选定的基因产物的启动子片段和DNA序列与合适的3′非翻译序列一起导入细胞中。“转化盒”是指含有外源基因的特定载体,除了外源基因以外,其还含有能促进特定宿主细胞的转化的元件。“表达盒”是指含有外源基因的特定载体,除了外源基因以外,其还含有能增强该基因在外源宿主中的表达的元件。
术语“编码”是指基因通过转录和翻译机制生产氨基酸序列的过程。编码特定氨基酸序列的过程包括这样的DNA序列,其可以含有不造成编码的氨基酸变化的碱基变化,或者其含有可以改变一个或多个氨基酸、但是不影响该DNA序列编码的蛋白的功能性质的碱基变化。因此应当明白,本发明不只包括具体的示例性序列。
“PCR”或“聚合酶链反应”是本领域的技术人员熟知的用于扩增特定DNA片段的技术(美国专利号4,683,195和4,800,159)。
“ORF”或“可读框”是编码肽或蛋白的DNA分子中的核苷酸序列。在已经确定了DNA片段的序列、但是不知道编码的蛋白的功能时,经常使用该术语。
术语“可发酵的碳底物”是指能被本发明的宿主生物代谢的碳源,更具体地是选自单糖、寡糖、多糖和一碳底物或其混合物的那些碳源。
同系物的分离本发明的核酸片段可以用于从相同的或其它微生物物种中分离编码同源蛋白的基因。使用序列依赖性的方法分离同源基因是本领域熟知的。序列依赖性的方法的例子包括但不限于核酸杂交方法、DNA和RNA扩增方法,如通过核酸扩增技术的各种应用所示例的(例如,聚合酶链反应(PCR),Mullis等,美国专利4,683,202),连接酶链反应(LCR),Tabor等,Proc.Acad.Sci.USA 82,1074,(1985))或链置换扩增(SDA,Walker等,Proc.Natl.Acad.Sci.U.S.A.,89,392,(1992))。
一般地,在PCR-类扩增技术中,引物具有不同的序列,且彼此不互补。根据所需的实验条件,引物序列应该设计成能有效地和正确地复制目标核酸。PCR引物设计的方法是常见的和本领域熟知的(Thein和Wallace,″The use of oligonucleotide as specifichybridization probes in the Diagnosis of Genetic Disorders″,in Human Genetic DiseasesA Practical Approach,K.E.Davis编,(1986)第33-50页IRL PRESS,Herndon,Virginia);Rychlik,W.(1993)In White,B.A.(ed.),Methods in Molecular Biology,Vol.15,第31-39页,PCR ProtocolsCurrent Methods andApplications.Humania Press,Inc.,Totowa,NJ.)。
杂交方法被充分地详细说明了。一般地,必须将探针和样品在能允许核酸杂交的条件下混合。这包括在有无机盐或有机盐存在的情况下、在合适的浓度和温度条件下使探针与样品接触。探针和样品核酸必须接触足够长的时间,使探针和样品核酸之间能够发生任何可能的杂交。混合物中的探针或目标的浓度会决定发生杂交所需的时间。探针或目标的浓度越高,所需的杂交温育时间越短。
可以采用各种杂交溶液。一般地,它们包括约20~60%体积、优选地30%的极性有机溶剂。常用的杂交溶液含有约30-50%v/v甲酰胺、约0.15~1M氯化钠、约0.05~0.1M缓冲液例如柠檬酸钠、Tris-HCl、PIPES或HEPES(pH范围约6-9)、约0.05~0.2%去污剂例如十二烷基硫酸钠或0.5-20mM之间的EDTA、FICOLL(Pharmacia Inc.)(约300-500千道尔顿)聚乙烯吡咯烷酮(约250-500千道尔顿)和血清清蛋白。一般的杂交溶液还包括约0.1~5mg/mL未标记的载体核酸,片段化的核DNA(例如小牛胸腺或鲑鱼精子DNA)或酵母RNA和任选地约0.5~2%重量/体积的甘氨酸。还可以包括其它的添加剂,例如体积排阻剂,其包括多种极性的水溶性的或可膨胀的试剂例如聚乙二醇,阴离子聚合物例如聚丙烯酸酯或聚丙烯酸甲酯,和阴离子糖类聚合物例如葡聚糖硫酸酯。
重组表达-微生物本发明的序列的基因和基因产物可以导入到微生物宿主细胞中。用于表达本发明的基因和核酸分子的优选宿主细胞是微生物宿主,其可以广泛发现于真菌或细菌家族中,且可以在广范围的温度、pH值和溶剂耐受性生长。在光合的或化能自养的宿主的情况下,大规模的微生物生长和功能基因的表达可以使用广范围的简单的或复杂的碳水化合物、有机酸和醇、饱和烃(例如甲烷)或二氧化碳。但是,功能基因可以由特定的生长条件所调节、抑制或降低,所述条件可以包括氮、亚磷、硫、氧、碳或任何痕量微量营养物(包括小无机离子)的形式和量。另外,功能基因的调节可以通过存在或不存在特定的调节分子来实现,所述调节分子是加入到培养物中但是一般不认为是营养物或能源。生长速率也可以是基因表达的重要调节因子。合适的宿主菌株的示例包括但不限于真菌或酵母物种例如曲霉属、木霉菌属(Trichoderma)、糖酵母属、毕赤酵母属、假丝酵母属(Candida)、汉逊酵母属(Hansenula),或细菌物种例如多变细菌(Proteotacteria)和放线菌以及特定的红球菌属(Rhodococcus)、不动杆菌属(Acinetobacter)、节杆菌属(Arthrobacter)、短杆菌属(Brevitacterium)、食酸菌属(Acidovorax)、芽孢杆菌属、链霉菌属(Streptomyces)、埃希氏菌属、沙门氏菌属(Salmonella)、假单胞菌属和棒杆菌属(Corynebacterium)的成员。
大肠杆菌特别适用于用作本发明的发酵工艺中的宿主微生物。大肠杆菌不能代谢含有α(1,6)键的寡糖,也难以代谢DP>7的任何寡糖。
本领域的技术人员熟知含有能指导外源蛋白的高水平表达的调控序列的微生物表达系统和表达载体。它们中的任意一个都可以用于构建嵌合基因,以生成本发明的任何基因产物。然后可以通过转化技术将这些嵌合基因导入合适的微生物中,以高水平地表达酶。
用于转化合适的宿主细胞的载体或盒是本领域熟知的。一般地,载体或盒含有能指导相关基因、选择性标记和使得能进行自主复制或染色体整合的序列转录和翻译的序列。合适的载体包含含有转录起始控制的基因的5′区域和控制转录终止的DNA片段的3′区域。当两个控制区都源自与转化的宿主细胞同源的基因时是最优选的,尽管能够明白,这样的控制区不需要源自对于选择的作为生产宿主的特定物种而言是天然的基因。
起始控制区或启动子用于驱动基因产物的表达。终止控制区也可以源自对于优选的宿主而言是天然的基因。任选地,终止位点可以是非必须的,但是,如果包括则是最优选的。
对于一些应用,可以有益地指导本发明的蛋白进入不同的细胞隔室。因而可以想象,通过改变编码序列使其编码具有合适的胞内导向序列(例如转运序列)的酶,可以进一步补充上述的嵌合基因。
具有提高的活性的酶可以预期,本发明的序列可以用于生产具有提高的或改变的活性的基因产物。已知用于突变天然基因序列、生产具有改变的或提高的活性的基因产物的多种方法,包括但不限于易错的PCR(Melnikov等,Nucleic Acids Research,(Feb.15,1999)Vol.27,No.4,第1056-1062页);定点诱变(Coombs等,Proteins(1998),259-311,1plate.Editor(s)Angeletti,Ruth Hogue.PublisherAcademic,San Diego,CA)和″基因改组(gene shuffling)″(US 5,605,793;US 5,811,238;US 5,830,721;和US 5,837,458,本文中引作参考)。
途径调控关于本发明的基因序列的知识将用于操作具有这样的途径的任何生物中的糖代谢途径。操纵遗传途径的方法是常见的,也是本领域熟知的。特定途径中的选定的基因可以通过多种方法上调或下调。另外,竞争途径的生物可以通过基因破坏和类似技术消除或升华。
一旦已经鉴别出了关键的遗传途径并进行了测序,就可以上调具体基因以增加该途径的输出。例如,可以将目标基因的其它拷贝在多拷贝质粒例如pBR322上导入到宿主细胞中。或者可以修饰目标基因,使其在非天然的启动子的控制下。当需要使途径在细胞周期的特定点或在发酵过程中运行时,可以用受调节的或诱导型启动子替换目标基因的天然启动子。类似地,在一些情况下,可以修饰天然的或内源的启动子来提高基因的表达。例如,可以通过突变、缺失和/或替代来体内地改变内源启动子(见,Kmiec,美国专利5,565,350;Zarling等,PCT/US93/03868)。
在本发明的上下文中,可以通过许多熟知方法(例如,反义、辐射-或化学-诱导的突变、基因改组等)中的任一种来有益地调控糖代谢途径的表达。例如,本发明提供了许多基因,它们编码糖代谢途径中的关键酶、从而生产简单的糖。分离的基因包括α-葡糖苷酶和异麦芽糖酶基因。当例如需要积累葡萄糖或麦芽糖时,上述方法中的任一种都可以用于超表达本发明的α-葡糖苷酶和异麦芽糖酶基因。类似地,可以通过上述的任一种方法破坏下游基因(例如糖酵解途径中的基因)来影响葡萄糖或麦芽糖的生物合成基因的积累。
生物发酵本发明适用于多种生物发酵方法,特别是适用于大规模工业方法的那些。本发明可以使用分批、补料-分批或连续工艺来实现,但是优选地以补料-分批模式来实现。这些生物发酵方法是常见的,且是本领域熟知的(Brock,T.D.;BiotechnologyA Textbook of IndustrialMicrobiology,第2版;Sinauer AssociatesSunderland,MA(1989);或Deshpande,Appl.Biochem.Biotechnol.36227(1992))。
“生物发酵系统”或“生物发酵”是指使用生物催化剂来催化底物和产物之间的反应的系统。
生物催化剂生物催化剂能启动或改变底物和产物之间的化学反应的速率。生物催化剂可以是整个的生物或者是分离的酶催化剂的形式。整个的微生物细胞可以不经任何预处理(例如透化)地用作生物催化剂。或者,可以通过本领域的技术人员熟悉的方法使整个细胞透化(例如,用甲苯、去污剂或冻-融处理),以提高材料扩散进出细胞的速率。
用于本发明的微生物可以包括但不限于细菌(例如肠细菌埃希氏菌属和沙门氏菌属,例如,以及芽孢杆菌属、不动杆菌属、链霉菌属、甲基细菌属(Methylobacter)、红球菌属和假单胞菌属);蓝细菌(例如红细菌属(Rhodobacter)和集胞蓝细菌属(synechocystis);酵母(例如糖酵母属、接合酵母属(Zygosaccharomyces)、克鲁维酵母属(Klayveromyces)、假丝酵母属、汉逊酵母属、德巴利酵母属(Debaryomyces)、毛霉菌属(Mucor)、毕赤酵母属和球拟酵母属(Torulopsis));丝状真菌(例如曲霉属和节丛孢属(Arthrobotrys));和藻类。为了本申请的目的,“微生物”还包括来自昆虫、动物或植物的细胞。
培养条件用于微生物培养物的维持和生长的材料和方法是微生物学或生物发酵科学领域技术人员熟知的(Bailey和Ollis,BiochemicalEngineering Fundamentals,第2版;McGraw-HillNY(1986))。根据微生物进行理想的功能基因的表达的具体需要,必须考虑合适的培养基、pH、温度和对需氧、微好氧或厌氧条件的要求。
培养基和碳底物用于本发明的生物发酵培养基(液体培养基或溶液)必须含有合适的碳底物,其根据生物催化剂的需要进行选择。合适的底物可以包括但不限于单糖(例如葡萄糖和果糖),二糖(例如乳糖或蔗糖),寡糖和多糖(例如淀粉或纤维素或其混合物)或来自可再生的原料的未纯化的混合物(例如干酪乳清渗透物、玉米浆、甜菜糖蜜和大麦芽)。碳底物还可以是一碳底物(例如二氧化碳、甲醇或甲烷)。
除了合适的碳源外,生物发酵培养基必须含有本领域的技术人员已知的合适的矿物质、盐、微生物、辅因子、缓冲剂和其它组分(Bailey和Ollis,Biochemical Engineering Fundamentals,第2版;第383-384和620-622页;McGraw-HillNew York(1986))。这些补充物必须适合于生物催化剂的生成,并促进生成生物发酵目标产物所必须的酶途径。
最后,能表达工业上有用的产物的功能基因可以由特定的生长条件(例如氮、亚磷、硫、氧、碳或任何痕量微量营养物(包括小无机离子)的形式和量)所调节、抑制或降低。功能基因的调节可以通过存在或不存在特定的调节分子(例如安慰诱导物)来实现,所述调节分子是加入到培养物中但是一般地不认为是营养物或能源。生长速率也可以是基因表达的重要调节因子。
实施例在下面的实施例中进一步定义了本发明。应当明白,尽管这些实施例显示了本发明的优选实施方案,但它们仅仅用于解释目的。从上面的讨论和这些实施例,本领域的技术人员可以明白本发明的基本特征,并且可以在不背离其精神和范围的情况下作出本发明的各种变化和修饰,使其适用于各种用途和条件。
缩写的含义如下″h″代表小时,″min″代表分钟,″sec″代表秒,″d″代表天,″mL″代表毫升,″L″代表升,″mM″代表毫摩尔,″nm″代表纳米,″g″代表克,且″kg″代表千克,″HPLC″代表高效液相层析,″RI″代表折射率。
一般方法适用于细菌培养物的维持和生长的材料和方法是本领域熟知的。适用于下面的实施例的技术可以参见Manual of Methods for GeneralBacteriology;Phillipp Gerhardt,R.G.E.Murray,Ralph N.Costilow,Eugene W.Nester,Willis A.Wood,Noel R.Krieg和G.Briggs Philips,编,American Society for MicrobiologyWashington,D.C.(1994)或BiotechnologyA Textbook ofIndustrial Microbiology;Brock,T.D.,第2版;SinauerAssoeiatesSunderland,MA(1989)。
通过HPLC监控甘油向1,3-丙二醇的转变。使用层析领域的技术人员可获得的标准技术和物质进行分析。一种合适的方法使用WatersMaxima 820 HPLC系统,其采用UV(210nm)和RI检测。将样品注射到Shodex SH-1011柱(8mm×300mm,购自Waters,Milford,MA),其配备有Shodex SH-1011P前置柱(6mm×50mm),温度控制在50℃,使用0.01N H2SO4作为流动相,流速0.5mL/分钟。当需要定量分析时,使用已知量的三甲基乙酸作为外标物制备样品。一般地,葡萄糖(RI检测)、甘油、1,3-丙二醇(RI检测)和三甲基乙酸(UV和RI检测)的保留时间分别是15.27分钟、20.67分钟、26.08分钟和35.03分钟。
实施例1短双岐杆菌ATCC 15700的基因组测序短双岐杆菌(ATCC 15700)购自美国典型培养物保藏中心(American Type Culture Collection),P.O.Box 1549,Manassas,VA 20108,美国。得到细胞沉淀并悬浮在含有10mM Na-EDTA和50mMTris-HCl、pH 7.5的溶液中。根据标准方法从短双岐杆菌(ATCC 15700)中分离出基因组DNA。根据公开的方法制备基因组DNA和文库构建(Fraser等,Science 270(5235)397-403(1995))。
基因组DNA的制备悬浮后,在0.2%肌氨酸、20mM β-巯基乙醇和150单位/mL溶细胞酶中温和地裂解细胞,并在37℃温育30分钟。用Tris-平衡的苯酚提取DNA两次,再用氯仿提取两次。使DNA在70%乙醇中沉淀,再悬浮到含有1mM Na-EDTA和10mM Tris-HCl、pH 7.5的溶液中。用核糖核酸酶的混合物处理DNA溶液,然后用Tris-平衡的苯酚提取两次,再用氯仿提取两次。然后在乙醇中沉淀,并悬浮到1mM Na-EDTA和10mM Tris-HCl、pH 7.5中。
文库构建将50~100μg染色体DNA悬浮到含有30%甘油、300mM醋酸钠、1mM Na-EDTA,和10mM Tris-HCl、pH 7.5的溶液中,在Aeromist Downdraft Nebulizer室(IBI Medical products,Chicago,IL)中在12psi剪切60秒。沉淀、悬浮DNA,并用BAL-31核酸酶处理。在低熔点的琼脂糖凝胶上进行大小分级后,将一个级分(2.0kb或5.0kb)切离、清洁,并使用T4 DNA连接酶(New England Biolabs,Inc.,Beverly,MA)连接到pUC18(Amersham Biosciences)的磷酸酶处理过的Sma I位点。将连接混合物上凝胶,切离代表了载体+一个插入的连接产物的DNA带,用T4 DNA聚合酶(New England Biolabs)处理,然后重新连接。用该两步连接方法生产高效价的文库,其具有超过99%的单一插入物。
测序采用鸟枪测序方法进行整个微生物基因组的测序(Fleischmann,R.等,Science 269(5223)496-512(1995))。组合使用载体和插入物-特异性的引物,使用染料终止子技术(U.S.5,366,860;EP 272,007),在ABI自动测序仪(Applied Biosystems,Foster City,CA)上进行测序。在DNAStar(DNA Star Inc.,Madison,WI)或Wisconsin GCG程序(Wisconsin Package 9.0版,GeneticsComputer Group(GCG),Madison,WI)和CONSED包(7.0版)中进行序列编辑。所有序列代表在两个方向上至少2倍的覆盖度。使用Phred/Phrap软件包(版本为0.961028.m/0.990319)进行序列装配。
实施例2碳水化合物降解基因的鉴别通过进行BLAST(Basic Local Alignment Search Tool;Altschul等,J.Mol.Biol.215403-410(1993);还参见,www.ncbi.nlm.nih.gov/BLAST/)搜索与包含在BLAST″nr″数据文库中的序列(含有全部非多余的GenBank CDS翻译,源自3-维结构Brookhaven Protein Data Bank,SWISS-PROT蛋白序列数据文库、EMBL和DDBJ数据文库的序列)的相似性,鉴别出了编码异淀粉酶活性的基因。使用国家生物技术信息中心(NCBI)提供的BLASTN算法,分析得到的序列与所有可公开获得的包含在″nr″数据文库中的DNA序列的相似性。将DNA序列翻译成所有可读框,并使用NCBI提供的BLASTP算法(Gish和States,Nature Genetics 3266-272(1993)),对比与所有可公开获得的包含在″nr″数据文库中的蛋白序列的相似性。
使用BLASTN或BLASTP算法进行所有对比。BLAST对比的结果如表1所示,其总结了它们具有最大相似性的序列。表1显示了基于BLASTP算法的数据,其含有以期望值表示的值。期望值(E-值)是不同比对的数目,所述比对的分数等同于或高于在随机数据文库搜索中预期得到的特定分数S。E-值越小,分数的显著性越大。
表1
a%相同性定义为两种蛋白之间相同的氨基酸的百分比。
b%相似性定义为两种蛋白之间相同的或保守的氨基酸的百分比。
c期望值。该期望值估计了与给定分数的匹配的统计显著性,说明了匹配的数目,该分数是在绝对随机地搜索该大小的数据文库时所预期的。
实施例3含有变异链球菌dexB基因的大肠杆菌中的胞内异淀粉酶的活性为了克隆dexB基因,使用Jagusztyn等(J.Gen.Microbiol.1281135-1145(1982))所述方法从变异链球菌(ATCC 25175D)分离出基因组DNA。
在变异链球菌(dexB)DNA序列(Ferretti等,Infection andImmunity 561585-1588(1988))的基础上设计了寡核苷酸引物(SEQID NO7和SEQ ID NO8),且包括BamHI和SalI限制位点。使用包含在HotStartTaqTM试剂盒(Qiagen,Valencia,CA)中的标准PCR方法扩增dexB基因。反应物含有1ng基因组DNA和1μm每种引物。用BamHI和SalI酶消化得到的1.6kb DNA片段。将消化的片段直接克隆进质粒pTRC99a(ampR)(Amersham-Pharmacia,Amersham,英国),得到与LacZ基因的翻译融合体。该命名为pTRC99-dexB的质粒还含有LacZ基因的前10个氨基酸的编码序列,其在表达后融合到天然DexB蛋白的N-末端。使用生产商的方法(Invitrogen,Carlsbad,CA),将pTRC99-dexB质粒转化进大肠杆菌DH5α细胞中,并涂布到含有100μg/mL氨苄青霉素的Luria Broth(LB)培养基上。
在大肠杆菌中表达后,从粗蛋白提取物估计异淀粉酶活性。在LB培养基中过夜培养大肠杆菌DH5α/pTRC99-dexB的单一菌落,然后在新鲜的LB培养基(3.0mL)中以1∶100稀释,在37℃再培养2小时。该培养后,通过加入异丙基β-D-1-硫代吡喃半乳糖苷(IPTG)至1mM的终浓度诱导DexB基因。另外培养2小时后,从诱导的细胞提取粗蛋白。为了分离粗蛋白提取物,通过离心(1×8000g)收集细胞,然后悬浮到0.5mL磷酸盐缓冲液(10mM,pH 6.8)中。超声处理悬浮液,以释放出总细胞蛋白,离心(1×14,000g)除去细胞碎片。通过与异麦芽糖、或分开地与潘糖在10mM磷酸盐缓冲液(pH 6.8)中在37℃温育2小时,检测上清液中的总蛋白的异淀粉酶活性。通过高效阴离子交换层析(HPAEC)表征反应产物。
为了进行HPAEC,以下述方式制备和分析样品。与异麦芽糖或潘糖温育2小时后,通过0.22μM Spin-X(R)离心管过滤器(Costar,Corning,NY)过滤总蛋白提取物,并用无菌过滤水稀释。使用PA10柱以100mM氢氧化钠作为洗脱剂和0-150mM醋酸钠线性梯度,通过HPAEC(Dionex,Sunnyvale,CA)分析样品。使用pTRC99-dexB细胞提取物降解异麦芽糖的结果如表2所示。通过与pTRC99-dexB细胞提取物温育降解潘糖和形成的产物如表3所示。
表2DexB粗蛋白提取物与异麦芽糖的活性(250μg/mL)
ND=未检出表3DexB粗蛋白提取物与潘糖的活性(150μg/mL)
ND=未检出实施例4短双岐杆菌异淀粉分解基因在大肠杆菌中的表达将来自短双岐杆菌(ATCC 15700)文库的几个可读框鉴别为推定的备选基因,其具有针对α(1,6)-连接的葡萄糖寡糖的活性(实施例2)。使用含有α(1,6)-连接的葡萄糖的寡糖,选择了3个推定的克隆mbc1g.pk007.h12(h12)、mbc1g.pk026.k1(k1)和mbc2g.pk018.j20(j20)来详细表征异淀粉分解活性。
将含有克隆的在来自实施例1的pUC18中的推定的异淀粉分解双歧杆菌属基因的全长编码序列的大肠杆菌DH5α菌株接种到LB培养基中,在37℃培养。20小时后,将培养物在新鲜LB培养基中稀释(1∶100),并在37℃另外培养3-4小时。如实施例3所述从细胞中制备总蛋白提取物。通过与异麦芽糖、或分开地与潘糖在10mM磷酸盐缓冲液(pH 6.8)中在37℃温育2小时,检测上清液中的总蛋白的异淀粉分解活性。如实施例3所述,制备样品并通过高效阴离子交换层析(HPAEC)表征反应产物。结果表明,从克隆h12、k1和j20生成的酶将异麦芽糖降解成了葡萄糖(表4)。
表4短双歧杆菌粗提取物与异麦芽糖的活性(150μg/mL)
ND=未测出将总蛋白提取物与潘糖(250μg/mL)温育2小时,然后通过0.22μM Spin-X(R)离心管过滤器(Costar,Corning,NY)过滤。如实施例3所述通过HPAEC分析样品。温育后的潘糖的消失表明,从克隆h12、k1和j20生成的酶能降解潘糖。图1表明,克隆h12能将潘糖彻底降解为葡萄糖(还显示了阴性对照,大肠杆菌DH5α中的质粒pUC18)。图1还表明,来自k1和j20克隆的酶能将潘糖降解成葡萄糖和麦芽糖。
实施例5天然短双歧杆菌j20异淀粉酶基因在大肠杆菌中的表达天然短双岐杆菌基因j20(从实施例1得到)似乎在成熟编码序列的NH-端具有信号肽(通过pSort预测软件检测;Nakai和Kanehisa,Expert,PROTEINSStructure,Function and Genetics 1195-110(1991))。编码α(1,6)-连接的葡萄糖寡糖水解活性的短双岐杆菌j20基因的核酸和氨基酸序列分别是SEQ ID NO30和SEQ ID NO31。
因此,使用完整的全细胞测试了异麦芽糖的代谢。这是通过将能表达j20基因的大肠杆菌DH5α细胞的单一菌落在含有异麦芽糖(500μg/mL)的LB培养基中、在37℃培养24小时来实现的。培养后,从培养基中除去细胞,并通过实施例3所述HPAEC方法制备和分析培养基。通过与阴性对照(只含有原始pUC18质粒的大肠杆菌DH5α细胞)相比异麦芽糖降低的水平,证实了在能表达短双歧杆菌j20基因的细胞中存在胞外的异淀粉酶活性。表5中的结果表明,能表达天然j20基因的大肠杆菌细胞降解了胞外供给的异麦芽糖。
表5天然的j20基因代谢的异麦芽糖
实施例6变异链球菌dexB和短双歧杆菌异淀粉酶的胞外导向因为短双岐杆菌k1和变异链球菌dexB基因似乎不合有天然的信号肽(pSort预测软件;Nakai和Kanehisa,Expert,PROTEINSStructure,Function and Genetics 1195-110(1991)),通过PCR方法将成熟的编码序列在翻译融合体中连接到信号肽上,以进行胞外表达。
在从质粒pBE505(Borehert和Nagarajan,J.Bacteriol.173276-282(1991))和pBE311(Nagarajan和Borchert,Res.Microbiol.142787-792(1991))开始的一系列步骤中,构建了含有枯草芽孢芽孢杆菌碱性和中性蛋白酶基因的模块表达载体。用限制酶KpnI和NruI消化质粒。分离得到的来自pBE505的969个碱基对的KpnI-NruI片段,并连接到来自pBE311的7.2kb的大KpnI-NruI片段中,生成pBE559。
然后用限制酶KpnI和EcoRV消化质粒pBE559和pBE597(Chen和Nagarajan,J.Bacteriol.1755697-5700(1993))。将来自pBE559的941个碱基对的KpnI-EcoRV片段连接到来自pBE597的8.9kb的KpnI-EcoRV片段,生成质粒pBE592。
将质粒pBE26(Ribbe和Nagarajan,Mol.Gen.Genet.235333-339(1992))用作扩增解淀粉芽孢杆菌碱性蛋白酶(apr)启动子区域的模板,其中使用实施例3所述PCR方法。设计并合成了寡核苷酸引物SEQ ID NO9,以在碱性蛋白酶信号断裂位点导入NheI限制位点,并紧邻该断裂位点在下游导入EcoRV限制位点。寡核苷酸引物SEQID NO10用于退火到pBE26中的apr启动子区域的上游的5′多接头区。使用所述引物和质粒pBE26模板DNA进行PCR反应。用KpnI和EcoRV消化得到的1.2kb的PCR产物,并连接到来自pBE592的大KpnI-EcoRV片段,生成质粒pBE92。
将质粒pBE80(Nagarajan等,Gene 11412-126(1992))用作扩增解淀粉芽孢杆菌中性蛋白酶(npr)启动子区域的模板,其中使用实施例3所述PCR方法。设计并合成了下游引物SEQ ID NO11,以在中性蛋白酶信号断裂位点导入NheI限制位点,并紧邻该断裂切位点在下游导入EcoRV限制位点。引物SEQ ID NO12用于退火到pBE80中的Npr启动子的5′区。使用所述引物和DNA模板进行PCR反应。用KpnI和EcoRV酶促地消化得到的350个碱基对的PCR产物,并连接到来自pBE592的大KpnI-EcoRV片段,生成质粒pBE93。
使用表6所述寡核苷酸引物,将k1和dexB基因翻译地融合到在载体pBE92和pBE93中的枯草芽孢杆菌碱性和中性蛋白酶基因的信号肽。通过实施例3所述方法,使用分别来自短双岐杆菌(ATCC 15700)或pTRC99-dexB质粒的基因组DNA作为模板,进行PCR扩增。
用工程地加入了NheI和BamHI位点的寡核苷酸引物SEQ ID NO14和SEQ ID NO15扩增1.8kb的k1基因DNA片段。含有NheI和SalI限制酶位点的寡核苷酸引物SEQ ID NO13和SEQ ID NO8扩增了1.6kb的dexB基因DNA片段。用合适的酶消化该片段,并克隆进模块载体pBE92和pBE93中。
得到的质粒(分别命名为pBE92-dexB、pBE93-dexB、pBE92-k1和pBE93-k1)含有翻译地融合到信号肽的天然酶,所以该信号肽断裂位点(Ala Ser Ala)是保守的。连接到短双岐杆菌k1基因的枯草芽孢杆菌中性蛋白酶信号肽的核酸和氨基酸序列分别是SEQ ID NO40和41。连接到变异链球菌dexB基因的枯草芽孢杆菌中性蛋白酶信号肽的核酸和氨基酸序列分别是SEQ ID NO42和43。使用生产商的方法(Invitrogen,Carlsbad,CA),将质粒转化进大肠杆菌DH5α细胞中,并涂布到含有氨苄青霉素(100μg/mL)的Luria Broth(LB)培养基上。
通过接种3.0mL含有氨苄青霉素(100μg/mL)和异麦芽糖(0.250mg/mL)的LB培养基,研究了含有pBE93(阴性对照)、pBE93-dexB或pBE93-k1质粒的大肠杆菌DH5α细胞的活性特征。该细胞在37℃生长20小时。培养后,从培养基中除去细胞,并通过实施例3所述方法制备和分析。通过与阴性对照(只含有原始pBE92质粒的大肠杆菌DH5α细胞)相比异麦芽糖降低的水平,证实了在含有pBE93、pBE93-dexB或pBE93-k1质粒的细胞中存在胞外的异淀粉酶活性。表6中的结果表明,Npr-基因融合蛋白降解了胞外供给的异麦芽糖。
表6大肠杆菌DH5α细胞中的DexB和K1胞外融合蛋白的活性
含有pBE93-dexB或pBE93-k1质粒的大肠杆菌DH5α细胞降解了异麦芽糖;但是,在含有异麦芽糖作为唯一碳源的基本培养基中的细胞生长是对异淀粉酶活性的更严格的测试。因此,将pBE93-dexB和pBE93-k1质粒转化进了大肠杆菌菌株FM5。与DH5α不同,FM5菌株具有在基本培养基中生长的能力,该培养基除了碳源以外仅含有盐和痕量金属(Maniatis等(1982)Molecular Cloning;LaboratoryManual.Cold Spring Harbor Laboratory,Cold Spring Harbor,N.Y;Neidhardt(1987)Escherichia coli and Salmonellatyphimurium,ASM Press,Washington,DC)。与DH5α菌株类似,天然的FM5细胞不能利用异麦芽糖作为碳源。为了证实这一点,将用质粒pBE93转化的FM5细胞接种到含有葡萄糖(1mg/mL)或异麦芽糖(1mg/mL)的M9培养基(Maniatis等,同上;Neidhardt,同上)中,在37℃培养至少20小时。20小时后,在含有葡萄糖的烧瓶中观察到细胞生长,但是即使培养60小时后也未在含有异麦芽糖的烧瓶中观察到细胞生长。
与阴性对照不同,含有Npr-DexB和Npr-k1融合蛋白(分别是pBE93-dexB和pBE93-k1)的FM5细胞在含有异麦芽糖的M9培养基中培养20小时后生长良好。为此实验,将FM5/pBE93、FM5/pBE93-dexB和FM5/pBE93-k1菌株接种到2.0mL M9培养基中,其中补充了葡萄糖或异麦芽糖(1mg/mL)作为唯一碳源。表7所示的结果表明,当翻译融合地连接到Npr信号肽上的dexB或k1基因在FM5细胞中表达时,异麦芽糖被代谢,且支持细胞的生长。
表7大肠杆菌FM5细胞中的DexB和K1胞外融合蛋白的活性
实施例7Npr-dexB和Npr-k1融合基因在大肠杆菌中的表达增强了各种发酵产物的合成当提供糖类混合物作为碳源时,生产宿主的代谢含有α(1,6)-连接的葡萄糖残基的寡糖的能力会提高发酵产物的产量。通过首先将质粒pBE93-dexB和pBE93-k1转化进工程化的生产甘油的细胞系中,测试了Npr-dexB和Npr-k1融合蛋白的降解α(1,6)-键的能力。
用1微克质粒DNA转化大肠杆菌菌株RJ8n(ATCC PTA-4216),其还含有质粒pSYCO101(specR)(描述于美国专利申请10/420,587,在本文中引作参考),其编码来自酿酒糖酵母(Saccharomycescerevisiase)的DAR1和GPP2基因和来自肺炎克雷伯氏菌(Klebsiella pneumoniae)的dhaB和orf操纵子。当加入维生素B12时,转化的大肠杆菌菌株能从葡萄糖生产甘油和1,3-丙二醇。从葡萄糖生产甘油和1,3-丙二醇的方法详细地描述在美国专利号6,358,716和美国专利号6,013,494中,它们在本文中引作参考。将转化的RJ8n细胞涂布到含有50μg/mL壮观霉素和100μg/mL氨苄青霉素的LB培养基上。将单一菌落接种到2.0mL TM2培养基(磷酸钾7.5g/L;柠檬酸2.0g/L;硫酸铵3.0g/L;硫酸镁2.0g/L;氯化钙0.2g/L;柠檬酸铁铵0.33g/L;酵母提取物(Difco-BD,Sparks,MD)5.0g/L;痕量元素(硫酸锌、硫酸铜、氯化钴、硫酸锰、硫酸铁、氯化钠);氢氧化铵调pH至6.5;还含有葡萄糖或异麦芽糖(1mg/mL)。培养物在37℃生长24小时。通过实施例3所述方法制备和分析细胞。
在用葡萄糖作为碳源的TM2培养基中在37℃培养24小时时,在仅含有质粒pSYCO101的大肠杆菌RJ8n细胞中表现出甘油积累(表8)。但是,当用异麦芽糖替代培养基中的葡萄糖时,该阴性对照系生产了可忽略水平的甘油,这表明α(1,6)-连接的葡萄糖不支持发酵产物的积累。相反地,当提供异麦芽糖或葡萄糖作为唯一碳源时,在含有质粒pSYCO101和pBE93-dexB或pBE93-k1的大肠杆菌RJ8n中生产了甘油(表8)。当异麦芽糖用作碳源时,与阴性对照系、只含有pSYCO101的RJ8n相比,含有pBE93-dexB和pSYCO101质粒的大肠杆菌RJ8n生产的甘油高8~9倍。与阴性对照相比,利用异麦芽糖的含有pSYCO101和pBE93-k1的系的甘油积累是6~10倍。表8中的数据表明,Npr-dexB或Npr-k1基因的表达使供给了异麦芽糖的培养物生产甘油。该数据还表明,无论碳源是葡萄糖还是异麦芽糖,积累的产物的水平都与含有融合蛋白的培养物相当。
表8Npr-DexB或Npr-K1的表达造成的甘油积累
通过在含有潘糖(1mg/mL)的TM2培养基中进行培养并与使用葡萄糖作为底物(1mg/mL)的相同系的结果进行对比,进一步表征了含有质粒pSYCO101和pBE93-k1的大肠杆菌系RJ8n使用α(1,6)-连接的葡萄糖作为底物生产发酵产物的能力。
表9中的数据还表明,当提供潘糖作为TM2培养基中的唯一碳水化合物源时,仅含有质粒pSYCO101的大肠杆菌菌株RJ8n(阴性对照)不能合成甘油。但是,当该相同菌株中存在质粒pBE93-k1且在含有潘糖的TM2培养基中培养时,能生产甘油。当提供葡萄糖或潘糖作为碳水化合物源时,含有质粒pSYCO101和pBE93-k1的大肠杆菌RJ8n中的甘油积累是相当的。
表9Npr-K1的表达造成的甘油积累
上述数据表明,当异麦芽糖或潘糖代表了培养基中的唯一碳水化合物源时,Npr-dexB或Npr-k1融合蛋白在大肠杆菌中的表达会增强甘油的生产。通过使用相同的融合蛋白表达系统合成另一种发酵产物(1,3-丙二醇)证实了,该结果不只是限于甘油的生产。
将用质粒pSYCO101和pBE93-dexB或pBE93-k1转化的RJ8n细胞接种到2.0mL TM2培养基(如上所述)中,其还含有葡萄糖(1mg/mL)或异麦芽糖(1mg/mL)和维生素B12(100ng/L)。培养物在37℃生长20小时。通过实施例3所述方法制备和分析细胞。
表10中的数据表明,当在仅含有异麦芽糖作为碳水化合物源的培养基中生长时,阴性对照系(RJ8n/pSYCO101)不能合成1,3-丙二醇。但是,当Npr-dexB或Npr-k1融合蛋白在RJ8n细胞中表达时,表现出异麦芽糖的代谢。这导致了发酵产物1,3-丙二醇的积累。该数据还表明,当提供葡萄糖或异麦芽糖作为唯一的碳水化合物时,能表达Npr-dexB或Npr-k1融合蛋白的RJ8n细胞合成的1,3-丙二醇水平是相当的。
表10Npr-dexB或Npr-k1的表达造成的1,3-丙二醇积累
ND=未测出实施例8短双歧杆菌k1基因在使用可变启动子的大肠杆菌中的表达用可变启动子来指导优选基因的表达通常是非常理想的。可变启动子可以用于改变基因表达的水平或定时,从而提高优选底物的利用。
通过将质粒pBE93-k1(实施例6)中的中性蛋白酶启动子替换为葡萄糖异构酶(GI)启动子和GI-启动子的变体,证实了使用可变启动子的短双歧杆菌k1异淀粉酶基因的有效表达。Streptomyces lividinsGI-启动子的分离和变体启动子的产生描述在美国专利申请10/420,587中。在替换NPR-启动子之前,对中性蛋白酶信号肽的非编码核苷酸序列和k1基因进行了修饰。该序列修饰产生了限制酶位点,它们将用于随后的克隆步骤。
通过使用引物SEQ ID NO.18和SEQ ID NO.19的PCR,将限制酶位点SacI和PacI分别加入到中性蛋白酶信号肽和k1基因序列的5′和3′-端。通过实施例3所述方法进行PCR扩增。分离1919个碱基对的PCR产物,并连接到如美国专利申请10/420,587所公开的pSYCO109mcs野生型GI yqhD质粒,其也用酶SacI和PacI消化过。得到的质粒含有野生型GI启动子和翻译融合地连接到k1基因的NPR-信号序列。该构建体命名为WTGI-ss-K1。还用变体GI启动子指导NPR-信号肽/K1融合体的表达。使用SacI和PacI限制酶位点,将从使用引物SEQ ID NO18和SEQ ID NO19的反应得到的1919个碱基对的PCR产物置入pSYCO109mcs-短1.6 GI yqhD质粒。得到的质粒命名为LowGI-ss-K1。当可操作地连接到yqhD基因时,与野生型GI启动子-yqhD构建体相比,该变体启动子以前表现出指导低水平的基因表达(美国专利申请10/420,587)。
通过活性实验,证实了使用野生型和变体GI启动子的k1基因的有效表达。用质粒WTGI-ss-K1和LowGI-ss-K1转化了大肠杆菌细胞(菌株DH5α,Invitrogen,Carlsbad,CA),在LB培养基中生长过夜。通过离心回收细胞沉淀,悬浮到1/10体积的磷酸钠缓冲液(10mM,pH7.0)中。用弗氏压碎器裂解悬浮液中的细胞,通过离心除去细胞碎片。通过Bradford实验(Bio-Rad,Hercules,CA)检测总蛋白浓度。使用4-硝基苯基-α-D-吡喃葡糖苷(PNPG,Sigma,ST.Louis,MO)检测总蛋白分离物中的k1基因产物的活性。将来自含有质粒WTGI-ss-K1、LowGI-ss-K1、NPR-ss-K1(阳性对照)和pSYCO109(阴性对照)的细胞的总蛋白提取物在10mM磷酸钠缓冲液(含有10mM PNPG)中在30℃温育多达30分钟。从PNPG释放出的葡萄糖残基导致PNP积累,其吸收400nm光。通过在400nm波长的吸光度,监控了k1酶活性直接导致的PNP积累随时间的变化。下面的表11表明,除了中性蛋白酶启动子之外的启动子可以用于指导有活性的K1基因的表达。该结果还表明,可变启动子可以用于改变K1表达水平,且K1活性与相关的启动子强度水平相对应。
表11K1酶活性导致的PNP生产速率
实施例9短双歧杆菌k1基因向大肠杆菌基因组的整合所需DNA向细胞基因组中的整合可以增强基因表达随时间过去和在各种发酵条件下的稳定性。但是,整合位置会影响基因表达水平,并最终影响所需酶活性的有效性。
通过首先克隆进质粒pKD3(Datsenko和Wanner,Proc.Natl.Acad.Sci.976640-6645(2000))中,完成了k1表达盒(NPR启动子-信号肽-k1基因)向大肠杆菌(菌株FM5)基因组的整合,并证实了使用α(1,6)-连接的葡萄糖底物的利用。选择了宿主的aldA(醛脱氢酶A)和aldB(醛脱氢酶B)基因组位点用于整合。将PCR引物设计成与质粒pKD3、aldA或aldB和k1基因序列(SEQ ID NO20至23)同源。
通过实施例3所述方法进行PCR扩增。分离从引物SEQ ID NO.21-23的反应得到的PCR产物和含有k1表达盒的质粒pKD3,连接并转化进大肠杆菌(FM5)。通过在含有氯霉素的LB培养基上生长,选择含有整合的k1表达盒的细胞。使用引物SEQ ID NO7和SEQ ID NO8,通过PCR反应检测氯霉素阳性菌落中k1基因的存在。
通过在含有异麦芽糖作为唯一碳水化合物源的培养基中的生长分析,进一步检测了含有整合的k1表达盒的FM5系的活性。将氯霉素和PCR阳性的菌落接种到含有0.5%异麦芽糖(w/v)的TM2培养基(见实施例7)中,在35℃生长。在各个时间点取样,通过光密度(A600nm)和异麦芽糖消耗(通过HPLC,参考一般方法)表征细胞物质积累。
下面的表12表明,FM5细胞本身不能代谢作为唯一碳水化合物源提供的异麦芽糖。当在含有0.5%异麦芽糖的TM2培养基中生长时,低水平的细胞物质积累证实了这一点。观察到了阴性系FM5的低水平生长,但仅仅是由于小量的可发酵的麦芽糖污染了异麦芽糖源材料(Sigma,St.Louis,MO)。含有整合的K1表达盒的细胞于高得多的速率生长,并在培养25小时后达到更高的最终光密度。将含有整合在aldA位点的k1表达盒的PCR-阳性的菌落命名为A2-3。将含有整合在aldB位点的k1表达盒的PCR阳性的菌落命名为B1-1和B1-2。
表12细胞物质积累(A600nm)
还通过HPLC分析,将含有整合的k1表达盒的细胞对异麦芽糖的消耗与FM5阴性对照系进行了对比。表13中的数据表明,与不能利用该碳水化合物的阴性对照相比,整合后的k1表达盒是有活性的,并且能使细胞彻底利用可获得的含有α(1,6)-连接的葡萄糖的糖。该数据还表明,在基因已经整合进aldA位点的系中,异麦芽糖的消耗速率与整合进aldB位点的不同。
表13异麦芽糖消耗(g/L)
权利要求
1.一种分离的核酸分子,其编码能水解α(1,6)-连接的葡萄糖寡糖的多肽,该核酸分子选自(a)分离的核酸分子,其编码SEQ ID NO2、4或6的氨基酸序列;(b)核酸分子,其能在下述杂交条件下与(a)杂交0.1X SSC,0.1%SDS,65℃,用2X SSC,0.1%SDS洗涤,然后用0.1X SSC,0.1% SDS洗涤;和(c)核酸分子,其与(a)或(b)互补。
2.根据权利要求1的分离的核酸分子,其选自SEQ ID NO1、3和5的核酸分子。
3.权利要求1的分离的核酸分子编码的多肽。
4.根据权利要求3的多肽,其选自SEQ ID NO2、4和6。
5.一种分离的核酸分子,其编码能水解α(1,6)-连接的葡萄糖寡糖的多肽,该核酸分子选自(a)分离的核酸分子,其编码由可操作地连接到能水解α(1,6)-连接的葡萄糖寡糖的多肽的信号肽组成的嵌合蛋白;(b)核酸分子,其能在下述杂交条件下与(a)杂交0.1X SSC,0.1%SDS,65℃,用2X SSC,0.1%SDS洗涤,然后用0.1X SSC,0.1% SDS洗涤;和(c)核酸分子,其与(a)或(b)互补。
6.根据权利要求5的分离的核酸分子,其中所述信号肽是SEQ ID NO24或SEQ ID NO25。
7.根据权利要求5的分离的核酸分子,其中所述能水解α(1,6)-连接的葡萄糖寡糖的多肽是SEQ ID NO2、4、6、17或31。
8.根据权利要求5的分离的核酸分子,其中所述信号肽是SEQ ID NO24或SEQ ID NO25,且其中所述能水解α(1,6)-连接的葡萄糖寡糖的多肽是SEQ ID NO2、4、6、17或31。
9.根据权利要求5的分离的核酸分子,其中所述信号肽由SEQ ID NO26或SEQ ID NO27所述信号序列编码。
10.根据权利要求5的编码能水解α(1,6)-连接的葡萄糖寡糖的多肽的分离的核酸分子,所述分离的核酸分子具有SEQ ID NO1、SEQ IDNO5、SEQ ID NO16或SEQ ID NO30所述序列。
11.根据权利要求5的分离的核酸分子,其选自SEQ ID NO3、SEQ ID NO28、SEQ ID NO32、SEQ ID NO34、SEQ ID NO36、SEQ ID NO38、SEQ ID NO40或SEQ ID NO42。
12.权利要求5的核酸分子编码的多肽。
13.权利要求9、10或11的分离的核酸分子编码的多肽。
14.根据权利要求13的多肽,其选自SEQ ID NO4、SEQ ID NO29、SEQ ID NO33、SEQ ID NO35、SEQ ID NO37、SEQ ID NO39、SEQ ID NO41和SEQ ID NO43。
15.嵌合基因,其含有可操作地连接到合适的调控序列的权利要求1或5的分离的核酸分子。
16.权利要求15的嵌合基因,其中所述合适的调控序列选自CYC1,HIS3,GAL1,GAL10,ADH1,PCK,PHO5,GAPDH,ADC1,TRP1,URA3,LEU2,ENO,TPI,AOX1,lac,ara,tet,trp,IPL,IPR,T7,tac,trc,apr,npr,nos和GI。
17.载体,其含有权利要求15的嵌合基因。
18.转化的宿主细胞,其含有权利要求15的嵌合基因。
19.根据权利要求18的转化的宿主细胞,其中所述嵌合基因整合在染色体中或是质粒-携带的。
20.根据权利要求18的转化的宿主细胞,其中所述宿主细胞选自细菌、酵母和丝状真菌。
21.根据权利要求20的转化的宿主细胞,其中所述转化的宿主细胞选自曲霉属、木霉菌属、糖酵母属、毕赤酵母属、假丝酵母属、汉逊酵母属、红球菌属、不动杆菌属、节杆菌属、短杆菌属、食酸菌属、芽孢杆菌属、链霉菌属、埃希氏菌属、沙门氏菌属、假单胞菌属和棒杆菌属。
22.根据权利要求20的转化的宿主细胞,其中所述转化的宿主细胞是大肠杆菌。
23.一种在重组宿主细胞中生产靶分子的方法,其包括(a)在存在极限糊精、在合适的条件下接触转化的宿主细胞,所述宿主细胞包含(i)分离的核酸分子,其编码由可操作地连接到能水解α(1,6)-连接的葡萄糖寡糖的多肽的信号肽组成的嵌合蛋白;(ii)核酸分子,其能在下述杂交条件下与(i)杂交0.1X SSC,0.1% SDS,65℃,用2X SSC,0.1%SDS洗涤,然后用0.1XSSC,0.1% SDS洗涤;或(iii)核酸分子,其与(i)或(ii)互补;和(iv)至少一种用于将单糖转化成靶分子的嵌合基因,由此生成靶分子;和(b)任选地回收(a)中生成的靶分子。
24.一种在重组宿主细胞中生产甘油的方法,其包括(a)在存在极限糊精、在合适的条件下接触转化的宿主细胞,所述宿主细胞包含(i)分离的核酸分子,其编码由可操作地连接到能水解α(1,6)-连接的葡萄糖寡糖的多肽的信号肽组成的嵌合蛋白;(ii)核酸分子,其能在下述杂交条件下与(i)杂交0.1X SSC,0.1%SDS,65℃,用2X SSC,0.1%SDS洗涤,然后用0.1XSSC,0.1% SDS洗涤;或(iii)核酸分子,其与(i)或(ii)互补;和(iv)至少一种用于将单糖转化成甘油的嵌合基因,由此生成甘油;和(b)任选地回收(a)中生成的甘油。
25.一种在重组宿主细胞中生产1,3-丙二醇的方法,其包括(a)在存在极限糊精、在合适的条件下接触转化的宿主细胞,所述宿主细胞包含(i)分离的核酸分子,其编码由可操作地连接到能水解α(1,6)-连接的葡萄糖寡糖的多肽的信号肽组成的嵌合蛋白;(ii)核酸分子,其能在下述杂交条件下与(i)杂交0.1X SSC,0.1%SDS,65℃,用2X SSC,0.1%SDS洗涤,然后用0.1XSSC,0.1% SDS洗涤;或(iii)核酸分子,其与(i)或(ii)互补;和(iv)至少一种用于将单糖转化成1,3-丙二醇的嵌合基因,由此生成1,3-丙二醇;和(b)任选地回收(a)中生成的1,3-丙二醇。
26.一种在重组宿主细胞中生产细胞物质的方法,其包括(a)在存在极限糊精、在合适的条件下接触转化的宿主细胞,所述宿主细胞包含(i)分离的核酸分子,其编码由可操作地连接到能水解α(1,6)-连接的葡萄糖寡糖的多肽的信号肽组成的嵌合蛋白;(ii)核酸分子,其能在下述杂交条件下与(i)杂交0.1X SSC,0.1%SDS,65℃,用2X SSC,0.1%SDS洗涤,然后用0.1XSSC,0.1% SDS洗涤;或(iii)核酸分子,其与(i)或(ii)互补;和(b)任选地回收(a)中生成的细胞物质。
27.根据权利要求23、24、25或26的方法,其中所述信号肽包含SEQ ID NO24或SEQ ID NO25。
28.一种在重组宿主细胞中生产靶分子的方法,其包括(a)在存在极限糊精、在合适的条件下接触转化的宿主细胞,所述宿主细胞包含(i)分离的核酸分子,其编码选自SEQ ID NO2、6、17和31的氨基酸序列;(ii)核酸分子,其能在下述杂交条件下与(i)杂交0.1X SSC,0.1%SDS,65℃,用2X SSC,0.1%SDS洗涤,然后用0.1XSSC,0.1% SDS洗涤;或(iii)核酸分子,其与(i)或(ii)互补;和(iv)至少一种用于将单糖转化成靶分子的嵌合基因,由此生成靶分子;和(b)任选地回收(a)中生成的靶分子。
29.一种在重组宿主细胞中生产1,3-丙二醇的方法,其包括(a)在存在极限糊精、在合适的条件下接触转化的宿主细胞,所述宿主细胞包含(i)分离的核酸分子,其编码选自SEQ ID NO2、6、17和31的氨基酸序列;(ii)核酸分子,其能在下述杂交条件下与(i)杂交0.1X SSC,0.1%SDS,65℃,用2X SSC,0.1%SDS洗涤,然后用0.1XSSC,0.1% SDS洗涤;或(iii)核酸分子,其与(i)或(ii)互补;和(iv)至少一种用于将单糖转化成1,3-丙二醇的嵌合基因,由此生成1,3-丙二醇;和(b)任选地回收(a)中生成的1,3-丙二醇。
30.一种在重组宿主细胞中生产甘油的方法,其包括(a)在存在极限糊精、在合适的条件下接触转化的宿主细胞,所述宿主细胞包含(i)分离的核酸分子,其编码选自SEQ ID NO2、6、17和31的氨基酸序列;(ii)核酸分子,其能在下述杂交条件下与(i)杂交0.1X SSC,0.1%SDS,65℃,用2X SSC,0.1%SDS洗涤,然后用0.1XSSC,0.1% SDS洗涤;或(iii)核酸分子,其与(i)或(ii)互补;和(iv)至少一种用于将单糖转化成甘油的嵌合基因,由此生成甘油;和(b)任选地回收(a)中生成的甘油。
31.一种在重组宿主细胞中生产细胞物质的方法,其包括(a)在存在极限糊精、在合适的条件下接触转化的宿主细胞,所述宿主细胞包含(i)分离的核酸分子,其编码选自SEQ ID NO2、6、17和31的氨基酸序列;(ii)核酸分子,其能在下述杂交条件下与(i)杂交0.1X SSC,0.1% SDS,65℃,用2X SSC,0.1%S DS洗涤,然后用0.1XSSC,0.1% SDS洗涤;或(iii)核酸分子,其与(i)或(ii)互补;由此生成细胞物质;和(b)任选地回收(a)中生成的细胞物质。
32.根据权利要求28、29、30或31的方法,其中所述信号肽包含SEQ ID NO24或SEQ ID NO25。
33.一种降解极限糊精的方法,其包括(a)使转化的宿主细胞在合适的生长条件下接触有效量的极限糊精底物,所述宿主细胞包含(i)核酸分子,其编码选自SEQ ID NO2、6、17和31的酶;(ii)核酸分子,其能在下述杂交条件下与(i)杂交0.1X SSC,0.1% SDS,65℃,用2X SSC,0.1% SDS洗涤,然后用0.1X SSC,0.1% SDS洗涤;或(iii)核酸分子,其与(i)或(ii)互补;和(b)任选地回收步骤(a)的产物。
34.多肽,当在BLASTP比对方法的基础上与具有SEQ ID NO17所述序列的多肽相比较时,其氨基酸序列具有至少69%的相同性,所述多肽具有α(1,6)-连接的葡萄糖寡糖水解活性。
全文摘要
本发明涉及在发酵工艺中使用低纯化的淀粉的方法。一个实例是,具有外源性胞外异淀粉酶活性的重组大肠杆菌能在发酵中利用含有(1,6)键的小寡聚体(包括但不限于异麦芽糖和潘糖)来生产有用的产物。通过降低底物碳水化合物的成本,本发明可以用于大规模的工业生物发酵。
文档编号C12P7/20GK1705750SQ03824541
公开日2005年12月7日 申请日期2003年8月25日 优先权日2002年8月23日
发明者P·G·凯米 申请人:纳幕尔杜邦公司