来自木糖氧化无色杆菌的丁醇脱氢酶的制作方法

文档序号:580444阅读:570来源:国知局
专利名称:来自木糖氧化无色杆菌的丁醇脱氢酶的制作方法
技术领域
本发明涉及分子生物学和微生物学领域。更具体地讲,该领域与用于在微生物 中生产丁醇的丁醇脱氢酶相关。
背景技术
丁醇是一种重要的工业化学品,其可用作燃料添加剂、塑料工业中的化学原料 以及食品和香料工业中的食品级萃取剂。每年通过石油化学手段生产100至120亿磅的 丁醇,并且对该日用化学品的需求可能还会增加。可对微生物进行工程化以表达生物合成途径用于丁醇生产。共有的和共同未决 的美国专利申请公布US 20070092957A1公开了对重组微生物进行工程化以用于生产异丁 醇(2-甲基-1-丙醇)。共有的和共同未决的美国专利申请公布US20080182308A1公 开了工程化重组微生物用于生产1-丁醇。共有的和共同未决的美国专利申请公布US 20070259410A1和US 20070292927A1公开了对重组微生物进行工程化以用于生产2- 丁 醇。描述了用于异丁醇和2-丁醇生产的多个途径。在用于全部三个产物的所有所述途径 中的最终步骤是通过具有丁醇脱氢酶活性的酶将氧化程度较高的部分还原成醇部分。已 知的醇脱氢酶能够进行这些转化。期望具有丁醇脱氢酶活性的附加酶在具有工程化丁醇生物合成途径的重组宿 主微生物中用于生产丁醇。申请人通过以下方法已经解决了该问题在环境细菌分 离蛋白中发现具有丁醇脱氢酶活性的酶、分离该酶、并且从鉴定的木糖氧化无色杆菌 (Achromobacterxylosoxidans)分离蛋白中鉴定编码的核酸序列。发明概述本文所述的是具有丁醇脱氢酶活性的新酶以及编码分离的核酸分子。本发明提供分离的核酸分子,所述分离的核酸分子包含编码至少约250个氨基 酸的多肽的第一核苷酸序列,所述多肽基于Smith-Waterman比对方法在与具有如SEQ ID NO 2所示的序列的多肽进行比较时具有至少约70%的同一性,或者所述分离的核酸分 子包含所述第一核苷酸序列的互补序列的第二核苷酸序列,其中所述酶具有丁醇脱氢酶 活性。在另一方面,本发明提供编码丁醇脱氢酶的分离的核酸分子,所述分离的核酸 分子选自a)编码如SEQ IDNO 2所示的氨基酸序列的分离的核酸分子;b)在如下杂交条件下与(a)杂交的分离的核酸分子0.1XSSC、0.1% SDS, 65°C 以及用 2XSSC、0.1% SDS 洗涤,之后用 0.1XSSC、0.1% SDS 洗涤;或与(a)或(b)互补的分离的核酸分子。此外本发明提供由所述核酸分子以及包含可操作地连接至少一种调控元件的核 酸分子的嵌合基因编码的多肽,以及包含所述核酸分子的转化的宿主细胞。在一个实施方案中,本发明提供了生产2-丁醇的方法,所述方法包括a)提供包含本发明的分离的核酸分子的重组微生物生产宿主细胞,所述分离的核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供2- 丁酮来源;b)使(a)的微生物宿主细胞在表达分离的核酸分子并将2-丁酮转化成2-丁醇的 条件下生长;以及C)任选地回收所述2-丁醇。在另一个实施方案中,本发明提供了生产异丁醇的方法,所述方法包括a)提供包含本发明的分离的核酸分子的重组微生物生产宿主细胞,所述分离的 核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供异丁醛来源;b)使(a)的微生物宿主细胞在表达分离的核酸分子并将异丁醛转化成异丁醇的 条件下生长;以及c)任选地回收所述异丁醇。在另一个实施方案中,本发明提供了生产1-丁醇的方法,所述方法包括a)提供包含本发明的分离的核酸分子的重组微生物生产宿主细胞,所述分离的 核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供丁醛来源;以及b)使(a)的微生物宿主细胞在中表达分离的核酸分子并将丁醛转化成1- 丁醇的 条件下生长;c)并且任选地回收所述1- 丁醇。序列描述通过下面的发明详述、附图
和随附的序列描述可以更全面地理解本发明,这些 详细描述、附图和序列描述形成了本专利申请的一部分。下面的序列遵照37C.F.R.1.821-1.825 ( "Requirements for Patent Applications Containing Nucleotide Sequences and/or Amino Acid Sequence Disclosures-the Sequence Rules"(对含有核酸序列和/或氨基酸序列公开的专利申请的要求-序列规则)),并且符 合 World Intellectual Property Organization (世界知识产权组织,WIPO) ST.25 标准(1"8)以 及 EPO 和 PCT 的序列清单要求(规则 5.2 和 49.5 (a-bis)以及 Administrative Instructions (行 政指令)的第208节和附录C)。用于核苷酸和氨基酸序列数据的符号和格式遵循在37C. F.R. § 1.822中示出的规则。SEQ ID NO 1是来自木糖氧化无色杆菌的丁醇脱氢酶(sadB)的鉴定编码区。SEQ ID NO 2是来自木糖氧化无色杆菌的鉴定的丁醇脱氢酶的蛋白序列。SEQ ID NO 3是木糖氧化无色杆菌丁醇脱氢酶的编码区,其密码子经优化以在 啤酒糖酵母(Saccharomycescerevisiae)中表达。SEQ ID NO 4和5是用于菌株BUTCON-516S rRNA的PCR扩增的引物。SEQ ID NO 6 是菌株 BUTCON-5 的 16S rDNA 序列。SEQ ID NO 7是木糖氧化无色杆菌丁醇脱氢酶的N_末端肽序列。SEQIDNO 8 是简并引物 N331。SEQIDNO 9-26是木糖氧化无色杆菌丁醇脱氢酶编码区的测序引物。SEQID NO 27和28是用于sadB编码区的PCR扩增的引物,该编码区具有用于空隙修复克隆的 延伸部分。SEQ ID NO 29 是酵母 GPM 启动子。SEQ ID NO 30 是酵母 ADHl 终止子。
SEQ ID NO 31 是乳酸乳球菌(Lactococcus lactis) kivD 编码区。SEQ ID NO 32 和 33 是用于确认 pRS425::GPM_sadB 的测序引物。SEQ ID NO 34和35是用于增加NheI位点的定点诱变引物。发明详述本文所述的是从细菌的环境分离蛋白中分离得到的新型丁醇脱氢酶,该细菌经 鉴定为木糖氧化无色杆菌。本发明提供了该蛋白的氨基酸序列和具有至少约70%的氨 基酸同一性并具有丁醇脱氢酶活性的蛋白。此外,提供了编码这些蛋白的分离的核酸分 子,它们可用于嵌合基因以在微生物中表达丁醇脱氢酶。可使用木糖氧化无色杆菌丁醇 脱氢酶和相关序列的酶在重组微生物中从2- 丁酮中生产2- 丁醇、从异丁醛中生产异丁 醇、或者从丁醛中生产1-丁醇,所述重组微生物具有其中一种这些底物的来源。丁醇是一种具有多种应用的重要工业日用化学品,其中其作为燃料或燃料添加 剂的潜力尤为重要。尽管丁醇仅仅是一种四碳醇,但是其具有与汽油相似的能含量,并 且可以与任何化石燃料共混。丁醇是优选的燃料或燃料添加剂,因为它在标准内燃机中 燃烧时仅生成CO2并且几乎不产生或根本不产生SOx或NOx。另外,丁醇的腐蚀性不及 乙醇,是目前为止最优选的燃料添加剂。丁醇除了可用作生物燃料或燃料添加剂之外,在新兴的燃料电池工业中还具有 影响氢分配问题的潜力。如今,由于氢的运输和分配存在安全隐患,燃料电池饱受困 扰。可以容易地对丁醇重整其氢含量,并且可以通过现有的加油站以燃料电池或汽车中 的内燃机所需的纯度进行分配。以下缩写和定义将用于说明书和权利要求的判读。如本文所用,术语“包含”、“由...组成”、“包括”、“涵盖”、“具有”、
“含有”、“包容”或“容纳”或其任何其它变型旨在包括非排他的包含物。例如,包 含一系列元素的组合物、混合物、工艺、方法、制品或设备不必仅限于那些元素,而可 以包括其它未明确列出的元素,或此类组合物、混合物、工艺、方法、制品或设备固有 的元素。此外,除非有相反的明确说明,“或”是指包含性的“或”,而不是指排他性 的“或”。例如,以下任何一种情况均满足条件A或B: A是真的(或存在的)且B是 假的(或不存在的)、A是假的(或不存在的)且B是真的(或存在的)、以及A和B都 是真的(或存在的)。同样,涉及元素或组分例证(即出现)次数的位于本发明元素或组分前的不定冠 词“一个”或“一种”旨在是非限制性的。因此,应将“一个”或“一种”理解为包 括一个或至少一个,并且元素或组分的词语单数形式也包括复数形式,除非有数字明显 表示单数。如本文所用,术语“发明”或“本发明”是非限制性的术语,并且不旨在指 本方面的任何单个实施方案,而是涵盖如说明书和权利要求中所述的所有可能的实施方案。如本文所用,修饰本发明使用的成分或反应物的量的术语“约”是指可以通过 例如以下方式而发生的用数字表示的量的变化在真实世界中用于制备浓缩物或使用溶 液的一般测量和液体处理操作;这些操作中非故意的误差;用于制备组合物或执行方法 的成分的制造、来源或纯度中的差异;等等。术语“约”还包括由于对于起因于特定起始混合物的组合物的不同平衡条件而不同的量。无论是否通过术语“约”来修饰,权利 要求包括量的等同量。在一个实施方案中,术语“约”指在报告数值的10%范围内,优 选地在报告数值的5%范围内。 如本文所用,术语“丁醇”指1-丁醇、2-丁醇、异丁醇、或它们的混合物。术语术语
的酶途径。
‘丁醇生物合成途径”指制备1-丁醇、2-丁醇、或异丁醇的酶途径。 ‘1-丁醇生物合成途径”指从乙酰-辅酶A(乙酰-CoA)中制备1-丁醇
‘2- 丁醇生物合成途径”指从丙酮酸中制备2- 丁醇的酶途径。
‘异丁醇生物合成途径”指从丙酮酸中制备异丁醇的酶途径。
‘兼性厌氧菌”指既能在有氧环境下生长又能在无氧环境下生长的微生术语术语术语物。术语“碳底物”或“可发酵碳底物”指能够被本发明的宿主生物体代谢的碳 源,并且特别是选自由下列的碳源单糖、低聚糖、多糖和一碳底物或它们的混合物。术语“基因”指能够被表达为特定蛋白质的核酸片段,其任选包括编码序列前 的调节序列(5'非编码序列)和编码序列后的调节序列(3'非编码序列)。“天然基因” 是指天然存在的具有其自己的调控序列的基因。“嵌合基因”是指不是天然基因的任何 基因,包含在天然情况下不是一起存在的调控序列和编码序列。因此,嵌合基因可包括 源于不同来源的调控序列和编码序列,或者包括源于同一来源但以不同于天然存在的方 式排列的调控序列和编码序列。“内源性基因”指位于生物基因组内它的天然位置的天 然基因。“外源”或“异源”基因指通常不存在于宿主生物中的基因,它通过基因转 移导入宿主生物。外来基因可以包含插入到非天然生物体内的天然基因,或嵌合基因。
“转基因”是已通过转化方法导入基因组内的基因。如本文所用的,“分离的核酸片段”或“分离的核酸分子”将可互换使用,并 且将指单链或双链的,任选含有合成的、非天然的或改变了的核苷酸碱基的RNA或DNA 聚合物。DNA聚合物形式的分离的核酸片段可由cDNA、基因组DNA或合成DNA的一 个或多个片段构成。当在合适的温度和溶液离子强度条件下单链形式的核酸片段可以退火至另一核 酸片段时,核酸片段“可杂交”至另一核酸片段,例如cDNA、基因组DNA或RNA分 子。杂交条件和洗涤条件是众所周知的,并在Sambrook,J.,Fritsch, E.F.和Maniatis, T.Molecular Cloning A Laboratory Manual,第 2 版,Cold Spring Harbor Laboratory Cold Spring Harbor, NY(1989)中有举例说明,尤其是其中的第11章和表11.1 (将其全部内容 以引用的方式并入本文)。温度和离子强度条件确定了杂交的“严格性”。可以调节严 格性条件以筛选中度相似的片段(例如来自远缘生物的同源序列),到筛选高度相似的片 段(例如从近缘生物复制功能性酶的基因)。杂交后的洗涤确定严格性条件。一组优选 的条件采用一系列如下洗涤开始采用6X SSC、0.5% SDS在室温下持续洗涤15分钟, 然后再使用2XSSC、0.5% SDS在45°C下洗涤30分钟,最后使用0.2X SSC、0.5% SDS 在50°C下重复洗涤30分钟两次。更优选的一组严格性条件采用更高的温度,其中洗涤与 上述洗涤相同,不同的是最后两次在0.2XSSC、0.5% SDS中洗涤30分钟时的温度被增 加到60°C。另一组优选的高严格性条件是最后两次洗涤是在65°C下用0.1X SSC、0.1%SDS进行。例如,另一组严格性条件包括在0.1X SSC、0.1% SDS中于65°C下杂交,并 用 2XSSC、0.1% SDS 洗涤,随后用 0.1XSSC、0.1% SDS 洗涤。杂交需要两种核酸含有互补序列,但是取决于杂交的严格性,碱基之间可能会 发生错配。用于使核酸杂交的合适严格性取决于核酸的长度和互补的程度,所述长度 和互补程度是本领域内所熟知的变量。两条核苷酸序列之间的相似性或同源性程度越 高,具有那些序列的核酸的杂交体的Tm值就越大。核酸杂交的相对稳定性(对应较高 的Tm)按以下顺序依次降低RNA:RNA、DNA:RNA、DNA:DNA。对于长度超过100 个核苷酸的杂交体,已经推导出了用于计算Tm的公式(请参见Sambrook等人,同上, 9.50-9.51)。对于较短核酸(即寡核苷酸)的杂交,错配的位置变得更重要,而且寡核 苷酸的长度决定了其特异性(参见Sambrook等人,同上,11.7-11.8)。在一个实施方案 中,可杂交核酸的长度为至少约10个核苷酸。优选地,可杂交核酸的最小长度为至少约 15个核苷酸;更优选至少约20个核苷酸;并且最优选地,长度为至少约30个核苷酸。 此外,技术人员将认识到,可根据需要根据诸如探针长度之类的因素来调节温度和洗涤 溶液盐浓度。术语“互补的”用于描述核苷酸碱基之间能够彼此杂交的关系。例如,对于 DNA,腺嘌呤与胸腺嘧啶互补,而胞嘧啶与鸟嘌呤互补。如本领域所熟知的,术语“百分比同一性”是两条或更多条多肽序列之间或两 条或更多条多核苷酸序列之间的关系,该关系通过对序列进行比较确定。在本领域中,
“同一性”还表示多肽或多核苷酸序列之间序列关联的程度,根据具体情况,它由这些 序列的序列串之间的匹配程度确定。“同一性”和“相似性”可容易地通过已知方法计 算出来,所述的方法包括但不限于以下文献中所描述的那些DComputational Molecular Biology (Lesk, A.M.编辑)Oxford University NY (1988) ; 2.) Biocomputing Informatics and Genome Projects (Smith, D.W.编辑)Academic NY (1993) ; 3.) Computer Analysis of Sequence Data, Part I (Griffin, A.M.和 Griffin,H.G.编辑)Humania NJ (1994) ; 4.) Sequence Analysis in Molecular Biology (von Heinje, G.编辑)Academic (1987);禾口 5.) Sequence Analysis Primer (Gribskov, M.禾口 Devereux, J.编辑)Stockton NY (1991)。设定确定同一性的优选方法来用于给出待测试序列之间的最佳匹配。确定同 一性和相似性的方法在可公开获得的计算机程序中编成了代码。序列比对和同一性 百分比计算可以用LASERGENE生物信息学计算软件包(LASERGENE bioinformatics computing suite(DNASTAR Inc., Madison, WI))中的 MegAlign 程序进行。序 列的多重比对采用包括几种改变形式的算法在内的“Clustal比对方法”进行,包括
"Clustal V比对方法”,该方法相当于称为Clustal V(在Higgins和Sharp,CABIOS.5 151-153(1989) ; Higgins, D.G.等人,Comput.AppLBiosci., 8 189-191(1992)),并且 可以在LASERGENE生物信息学计算软件包(DNASTAR Inc.)中的MegAlign 程序中 找到的比对方法。对于多重比对,默认值对应于缺口罚分(GAP PENALTY) = 10和缺 口长度罚分(GAP LENGTH PENALTY) =10。用Clustal方法进行成对比对和蛋白质 序列的百分比同一性计算的默认参数为KTUPLE = 1、缺口罚分=3、窗口(WINDOW) =5和DIAGONALS SAVED = 5。对于核酸,这些参数为KTUPLE = 2,缺口罚分= 5,窗口 = 4和DIAGONALS SAVED = 4。在用Clustal V程序进行序列比对后,有可能通过观察相同程序中的“序列距离”表来获得“百分比同一性”。此外,也可以使用 “Clustal W比对方法”,该方法相当于称为Clustal W(在Higgins和Sharp, CABIOS.5 151-153(1989) ; Higgins, D.G.等人,Comput.Appl.Biosci.8 189-191(1992)中有所描 述)和可以在LASERGENE生物信息学计算软件包(DNASTAR Inc.)中的MegAlign v6.1程序中找到的比对方法。用于多重比对的默认参数(缺口罚分=10、缺口长度罚分 =O.2、延迟发散序列(DelayDivergenSeqs) (% ) = 30, DNA 转换权重(DNATransition Weight) =0.5、蛋白质权重矩阵(ProteinWeightMatrix) = Gonnet 系列和 DNA 权重矩阵 (DNAWeight Matrix) = IUB)。在使用Clustal W程序对序列进行比对之后,可通过查看 同一程序中的“序列距离”表来获得“百分比同一性”。本领域的技术人员非常清楚,多种程度的序列同一性可用于从其他物种中鉴定 多肽,其中这类多肽具有相同或相似的功能或活性。可用的同一性百分比的实例包括但 不限于70%、75%, 80%, 85%, 90%,或95%、或者从70%至100%的任何整数百 分比都可用于描述本发明,例如70%、71%, 72%, 73%, 74%, 75%, 76%, 77%, 78 79 80 81 82 83 84 85 86 87 88 89 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%或 99%。合适的核酸片段编 码具有以上同一性并且通常编码具有至少约250个氨基酸,优选至少300个氨基酸,并且 最优选至少约348个氨基酸的多肽。术语“序列分析软件”指可用于分析核苷酸或氨基酸序列的任何计算机算法 或软件程序。“序列分析软件”可商购获得或独立开发。典型的序列分析软件包括但 不限于1.)GCG 程序包(Wisconsin Package 9.0 版,Genetics Computer Group(GCG), Madison, WI) ; 2.)BLASTP、BLASTN、BLASTX (Altschul 等人,J.Biol., 215 403-410(1990)) ; 3.) DNASTAR (DNASTAR 有限公司,Madison,WI) ; 4.) Sequencher (Gene Codes Corporation, Ann Arbor, MI);禾口 5.)整合了 Smith-Waterman 算 法的 FASTA 程序(W.R.Pearson, Comput.Methods Genome Res.,[Proc.Int.Symp.] (1994), 公开时间1992,111-20.编辑Suhai,Sandor.Plenum New York, NY)。在本专利申 请的上下文中应当理解,使用序列分析软件进行分析时,除非另外指明,否则分析结果 将基于所参考程序的“默认值”。在此所用的“默认值”将指在首次初始化软件时软件 最初加载的任何值或参数集。氨基酸或核苷酸序列的“基本部分”指这样的部分,该部分包括的多肽的氨 基酸序列或基因的核苷酸序列足以推定鉴定所述多肽或基因,所述鉴定或者可以由本领 域技术人员通过人工评价序列来完成,或者可以利用诸如BLAST (Altschul,S.F.等人, J.Mol.Bio., 215 403-410(1993))之类的算法通过计算机自动化序列比较和鉴定来完 成。一般来讲,为了推测鉴定多肽或核酸序列是否与已知的蛋白质或基因同源,需要有 10个或更多邻接氨基酸或者30个或更多核苷酸的序列。此外,对于核苷酸序列,包含 20-30个邻接核苷酸的基因特异性寡核苷酸探针可用于序列依赖性的基因鉴定(如DNA 杂交)和基因分离(如细菌菌落或噬斑的原位杂交)的方法中。此外,12-15个碱基的短 寡核苷酸可在PCR中用作扩增引物,以便获得包含该引物的特定核酸片段。因此,核苷 酸序列的“基本部分”所包含的序列应足以特异性地鉴定和/或分离包含该序列的核酸 片段。本说明书教导了编码特定醇脱氢酶蛋白的完整的氨基酸和核苷酸序列。利用本文所公开的序列,技术人员现在可以利用本发明所公开序列的全部或基本部分,以用于本 领域技术人员已知的目的。因此,本发明包括如随附的序列表中所示的完整序列,以及 如上文定义的这些序列的基本部分。本发明涵盖的不仅仅是具体的示例性序列,因为本领域熟知的是不影响编码 蛋白的功能特性的氨基酸序列或编码区中的改变(其中一个化学上等同的氨基酸在给定 位点上被取代)是常见的。为了本发明的目的,取代定义为在下述5组之一内的交换1.小的脂族非极性残基或微极性的残基Ala、Ser、Thr(Pro> Gly);2.极性的、带负电荷的残基和它们的酰胺Asp、Asn, Glu、Gln ;3.极性的、带正电荷的残基His、Arg、Lys ;4.大的脂族非极性残基Met、Leu、lie、Val(Cys);以及5.大的芳族残基Phe、Tyr、Trp。因此,关于氨基酸丙氨酸-一种疏水性氨基酸的密码子可以被编码另一个疏水 性更弱的残基(例如甘氨酸)或疏水性更强的残基(例如缬氨酸、亮氨酸或异亮氨酸)取 代。类似地,导致用一个带负电荷的残基替换另一个带负电荷的残基(例如天冬氨酸替 代谷氨酸)或者一个带正电荷的残基替换另一个带正电荷的残基(例如赖氨酸替换精氨 酸)的改变也可以预期产生功能上等价的产物。在许多情况下,导致蛋白质分子的N-末 端和C-末端部分改变的核苷酸变化也预期不改变蛋白质的活性。因此本发明涵盖具有所 述密码子变异的编码区和具有所述氨基酸变异的蛋白。如本文所用,术语“编码序列”或“CDS”是指编码特定氨基酸序列的DNA 序列。“合适的调控序列”指位于编码序列的上游(5'非编码序列)、中间或下游(3' 非编码序列)的核苷酸序列,其可影响转录、RNA加工或稳定性,或者相关编码序列的 翻译。调节序列可包括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加 工位点、效应子结合位点和茎环结构。术语“启动子”指能够控制编码序列或功能性RNA表达的DNA序列。一般来 讲,编码序列位于启动子序列的3'端。启动子可整个源于天然基因,或者由源于不同的 天然存在的启动子的不同元件组成,或者甚至包含合成的DNA片段。本领域内的技术人 员应当理解,不同的启动子可以在不同的组织或细胞类型中,或者在不同的发育阶段, 或者响应不同的环境条件或生理条件而引导基因的表达。导致基因在大部分时间内在大 多数细胞类型中表达的启动子通常称为“组成型启动子”。还应当进一步认识到,由于 在大多数情况下调节序列的确切边界尚未完全确定,因此不同长度的DNA片段可能具有 相同的启动子活性。术语“可操作地连接”指单个核酸片段上的核酸序列的关联,使得其中一个核 酸序列的功能受到另一个核酸序列的影响。例如,当启动子能够影响编码序列的表达 (即,该编码序列受到该启动子的转录控制)时,则该启动子与该编码序列可操作地连 接。编码序列可以以有义或反义的取向可操作地连接至调节序列。如本文所用,术语“表达”指源于本发明核酸片段的有义RNA(mRNA)或反义 RNA的转录和稳定积聚。表达也可指将mRNA翻译成多肽。如本文所用,术语“转化”指将核酸片段转移至宿主生物体内,导致在基因上 稳定遗传。含有转化核酸片段的宿主生物被称为“转基因”或“重组”或“转化”生物体。术语“质粒”和“载体”指通常携带有不属于细胞中心代谢的部分的基因的染 色体外元件,并且常常是环状双链DNA片段的形式。这类元件可为源自任何来源的自主 复制序列、基因组整合序列、噬菌体或单链或双链DNA或RNA的核苷酸序列(线性或 环状),其中多个核苷酸序列已连接或重组进入一种独特构建体中,该独特构建体能够将 所选基因产物的启动子片段和DNA序列与相应的3'末端非翻译序列一起引入细胞中。
“转化载体”指含有外来基因并且除了该外来基因外还含有有利于转化特定宿主细胞转 化的元件的特定载体。如本文所用,术语“密码子简并性”指允许核苷酸序列在不影响所编码的多肽 的氨基酸序列的情况下发生变化的遗传密码的性质。技术人员非常了解具体宿主细胞在 使用核苷酸密码子确定给定氨基酸时所表现出的“密码子偏好性”。因此,当合成基因 用以改善在宿主细胞中的表达时,希望对基因进行设计,使得其密码子使用频率接近该 宿主细胞优选的密码子使用频率。术语“经密码子优化的”在其涉及用于转化不同宿主的核酸分子的基因或编码 区时是指在不改变由DNA编码的多肽的情况下,改变核酸分子的基因或编码区中的密码 子以反映宿主生物体通常的密码子使用。本文使用的标准重组DNA和分子克隆技术是本领域熟知的并且已经在如下文 献中有所描述Sambrook, J., Fritsch, E.F.禾口 Maniatis, T.的 Molecular Cloning A Laboratory Manual,第二版,Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY(1989)(下文称为 “Maniatis,,);以及 Silhavy,T.J., Bennan, Μ.L.和 Enquist, L.W.,Experiments with Gene Fusions, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1984);以及 Ausubel,F.M.等人,Current Protocols in Molecular Biology, Greene Publishing Assoc.and Wiley-Interscience (1987)。该处使用的附加方法是在 Methods in Enzymology,第 194 卷,Guide to Yeast Genetics and Molecular and Cell Biology (Part A, 2004, Christine Guthrie 禾口 Gerald R.Fink (编辑),Elsevier Academic Press,San Diego, CA)中的方法。通过在包含1-丁醇的培养基上的连续培养富集环境污泥样本,申请人能分离能 够利用1-丁醇作唯一碳源的微生物。一种分离蛋白通过其16SrRNA序列鉴定为属于菌 种木糖氧化无色杆菌。申请人发现该分离蛋白有丁醇脱氢酶活性,它可相互转化丁醛和 1-丁醇。申请人也发现该丁醇脱氢酶活性也催化异丁醛和异丁醇、以及2-丁酮和2-丁醇 的相互转化。令人惊讶地是,该酶对替代底物的动力学常数与对用于富集培养基的1-丁 醇底物的动力学常数相当或比其更高。这些结果指示可使用该木糖氧化无色杆菌丁醇脱 氢酶在分别具有丁醛、异丁醛或2-丁酮底物来源的重组微生物宿主细胞中生产1-丁醇、 异丁醇、或2-丁醇。丁醇脱氢酶蛋白和编码序列在木糖氧化无色杆菌中鉴定的核苷酸序列编码具有丁醇脱氢酶活性(称为sadB) 的酶,该序列如SEQ ID NO: 1所示。全长蛋白的氨基酸序列如SEQIDNO : 2所示。 该氨基酸序列与公开数据库中的序列的比较结果揭示该蛋白具有与已知醇脱氢酶的令人惊讶的低相似性。使用具有计分矩阵BLOSUM62的BLAST,期望临界值(cutoff)为 10并且定序列长度(word size)为3,测得最相似的已知序列与SEQ ID NO 2在其长度 为348个氨基酸的部分上具有67%的同一性。使用的空位开放罚分为11,空位延伸为 1。发现与脑膜炎奈瑟氏球菌(Neisseria meningitidis) MC58(Accession#AAF41759.1)含锌 醇脱氢酶的最高相似度为67%的氨基酸同一性,与无乳支原体(Mycoplasma agalactiae) (Accession#A5IY63)含锌醇脱氢酶的最高相似度为67%的氨基酸同一性。其氨基酸序列 与木糖氧化无色杆菌丁醇脱氢酶的序列(SEQ ID NO: 2)具有大于67%的同一性的蛋白 是本发明的蛋白,它在本文中被鉴定并分离。本发明蛋白的氨基酸序列与SEQ ID NO: 2具有至少约70%-75%,约75%-80%,约80%-85%,或者约85%-90%的同一性, 其中更优选约90% -95%的同一性。最优选的氨基酸序列与SEQ ID NO 2具有至少约 95%的同一性。使用BLAST默认参数与公开序列进行比较时,编码木糖氧化无色杆菌丁醇 脱氢酶的核酸序列(SEQ ID NO: 1)与编码脑膜炎奈瑟氏球菌MC58含锌醇脱氢酶 (Accession#NC003112)的序列具有最高的同一性(约65% )。本发明的核酸分子是那些 能够编码至少约250个氨基酸并且具有丁醇脱氢酶活性的多肽,它具有与SEQ ID NO 2至少约70%的同一性。核酸分子可编码至少约300个氨基酸或者约348个氨基酸的多 肽。核酸分子可编码与SEQ IDNO 2具有至少约75%-80%、80%-85%、85%-90%、 90% -95%,或95%-100%的同一性的多肽。本发明的附加核酸分子可通过与编码丁醇脱氢酶的SEQ ID NO 2的核酸分子 在以下条件下杂交进行鉴定0.1XSSC,0.1% SDS, 65°C并且用2X SSC,0.1% SDS洗 涤,随后用0.1XSSC,0.1%SDS洗涤。在本发明的方面中附加地包括与任何上述核酸分 子互补的核酸分子。最合适的是编码SEQ ID NO: 2的多肽的核酸分子,其实例是SEQ IDNO 1和3。由于遗传密码的简并性,多个核酸序列可编码SEQ IDNO 2的多肽, 这是本领域的技术人员熟知的。例如编码序列可经密码子优化用于在特定宿主中的最大 化表达,如序列经密码子经优化以在啤酒糖酵母中表达,即SEQ ID NO: 3。同源物的分离编码木糖氧化无色杆菌丁醇脱氢酶的核酸分子,例如SEQ ID NO: 1可用于分离 编码同源蛋白的核酸分子,所述核酸分子与来自相同或其他微生物菌种的这种核酸片段 具有至少 70%-75%、75% -80%, 80% -85%, 85% -90%, 90% -95%,或 95%_100% 的序列同一性。可如下评估编码的同源蛋白的丁醇脱氢酶活性。使用序列依赖性规程分 离同源物是本领域熟知的。序列依赖型规程的实例包括但不限于核酸杂交方法、DNA和 RNA扩增方法例如核酸扩增技术的多种应用(例如聚合酶链反应(PCR),Mullis等人, 美国专利公开 4,683,202 ;连接酶链反应(LCR),Tabor, S.等人,Proc.Natl.Acad.Sci.USA 82,1074,(1985 ;或链置换扩增反应(SDA),Walker 等人,Proc.Natl.Acad.Sci.U.S.A., 89 392, (1992))。例如,本发明的核酸片段可通过使用所有或部分SEQ ID NO: 1的核酸片段作 为DNA杂交探针,使用本领域的技术人员熟知的方法来筛选来自任何所需细菌的文库而 得以直接分离。基于SEQ ID NO: 1的特异性,寡核苷酸探针可通过本领域已知的方法 (Maniatis,同上)设计和合成。此外序列可直接用于通过熟练技术人员已知的方法,例如随机引物DNA标记、切口平移或末端标记技术,来合成DNA探针,或使用可获得的 体外转录体系来合成RNA探针。此外,能设计特异性引物并用于扩增SEQ ID NO: 1 同源物的部分或全长。所得的扩增产物可在扩增反应过程中直接标记或在扩增反应后标 记,并用作探针以在合适的严格条件下分离全长的DNA片段。通常在PCR类型的扩增技术中,引物具有不同的序列而且彼此之间不互补。 取决于期望的检测条件,应当设计引物序列以提供既有效又可靠的靶核酸的复制。 PCR引物设计方法是常见的,并且是本领域熟知的。(Thein和Wallace,"The use of oligonucleotide as specific hybridization probes in the Diagnosis of Genetic Disorders”, Human Genetic Diseases APractical Approach, K.E.Davis 编辑(1986)第 33-50 页,IRL Press, Herndon, Virginia) ; Rychlik,W. (1993),White, B.A.(编辑),Methodsin Molecular Biology,第 15 卷第 31-39 页,PCR Protocols Current Methods and Applications. HumaniaPress, Inc., Totowa, NJ。)通常可使用本发明核酸序列的两个短片段设计引物用于聚合酶链反应规程以扩 增较长的核酸片段,该核酸片段编码来自DNA或RNA的同源编码区。可使用包含与SEQ IDNO 1同源的核酸序列的任何DNA作模板进行PCR,包括例如用基因组DNA、cDNA 或质粒DNA作模板。当使用克隆cDNA的文库时,一个引物的序列来源于SEQ ID NO: 1,并且其他引物的序列利用在编码微生物基因的mRNA前体的3'末端存在的多腺苷酸 片。作为另一种选择,第二个引物序列可以基于来源于克隆载体的序列。例如技术人员 可按照 RACE 规程,使用 mRNA 作模板(Frohman 等人,Proc.Natl.Acad.Sci.USA,85: 8998(1988)),通过用PCR扩增在转录物内单个位点与3 ‘或5'端之间的区域的拷贝来 产生cDNA。以3'和5'方向取向的引物可用本发明的核酸序列设计。使用可商购获 得的 3' RACE 或 5' RACE 体系(Life Technologies,Rockville, MD),可以分离特异性 的 3'或 5' cDNA 片段(Ohara 等人,Proc.Natl.Acad.Sci.USA 86 5673(1989) ; Loh 等 人,Science 243 217(1989))。作为另外一种选择,可使用SEQ ID NO: 1的核酸分子或其互补序列作为杂交试 剂用于同源物的鉴定。核酸杂交试验的基本组成包括探针、怀疑含有目的基因或基因片 段的样本及特定的杂交方法。本发明的探针通常是与待检测的核酸序列互补的单链核酸 序列。探针与待检测的核酸序列是“可杂交的”。探针长度可从5个碱基至数万个碱基 不等,这将取决于具体待完成的测试。通常约15个碱基至约30个碱基的探针长度是合 适的。只需要探针分子的部分与待检测的核酸序列互补。另外,探针和靶序列之间不需 要完全互补。杂交确实可以在并不完全互补的分子之间发生,结果是杂交区内的一定比 率的碱基未与适当的互补碱基配对。杂交方法是有严格规定的。通常探针和样本必须在允许核酸杂交的条件下混 合。这涉及在适当浓度和温度条件下在存在无机或有机盐时使探针和样品接触。探针和 样品核酸必须接触足够长的时间,使探针和样品核酸之间的任何可能的杂交均可发生。 混合物中的探针或标记的浓度将决定杂交发生所需的时间。探针或靶标的浓度越高,所 需的杂交孵育时间就越短。任选地,可以加入离液剂。离液剂通过抑制核酸酶活性来 稳定核酸。此外,离液剂允许短寡核苷酸探针在室温下的敏感和严格杂交(Van Ness和 Chen, NucLAcids Res. 19 5143-5151(1991))。合适的离液剂包括氯化胍、硫氰酸胍、硫氰酸钠、四氯乙酸锂、高氯酸钠、四氯乙酸铷、碘化钾和三氟乙酸铯等。通常,离液 剂的终浓度将为约3M。如果需要,可以将甲酰胺加入到杂交混合物中,通常为30-50% (ν/ν)ο可以采用多种杂交溶液。通常,这些杂交溶液包含约20%至60%体积,优 选30%体积的极性有机溶剂。通常的杂交溶液采用约30-50% ν/ν甲酰胺、约0.15 至IM氯化钠、约0.05至0.1Μ缓冲液(如柠檬酸钠、Tris-HCl、PIPES或HEPES (pH 范围约6-9))、约0.05至0.2 %的去污剂(如十二烷基硫酸钠)或0.5-20mM的 EDTA、FICOLL (Pharmacia Inc.)(约 300-500 千道尔顿(kD))、聚乙烯吡咯烷酮(约 250-500kD)、和血清白蛋白。一般的杂交溶液还将包含约0.1至5mg/mL未经标记的载 体核酸、片段化的核酸DNA(如小牛胸腺或鲑精DNA或酵母RNA),以及任选约0.5%至 2%重量/体积的甘氨酸。还可以包含其他添加剂,例如包括多种极性水溶性或可膨胀试 剂如聚乙二醇、阴离子聚合物如聚丙烯酸酯或聚甲基丙烯酸酯和阴离子糖类聚合物如硫 酸葡聚糖在内的体积排阻剂。核酸杂交可适用于多种测定形式。最合适的形式之一是夹心测定形式。夹心测 定尤其适用于在非变性条件下杂交。夹心型测定的主要成分是固体支持体。固体支持 体具有吸附或共价连接至其上的固定核酸探针,该探针未经标记并且与序列的一部分互 补。此外,因为微生物基因组序列迅速变成公开可获得的,可单独使用生物信息学 方法鉴定同源物,这是本领域技术人员熟知的。丁醇脱氢酶活性本发明的蛋白与SEQ ID NO: 2具有至少约70%或更高的氨基酸同一性,并且 具有丁醇脱氢酶活性。本发明的核酸分子编码与SEQIDNO 2具有至少约70%或更高 的氨基酸同一性并具有丁醇脱氢酶活性的蛋白。本领域的技术人员能够容易地评估蛋白 中的丁醇脱氢酶活性。如下所述在微生物细胞中表达蛋白,并且测定细胞提取物、粗制 酶制剂、或者纯化酶制剂中的丁醇脱氢酶活性。例如如本文实施例1所述测定纯化酶和 粗制酶制剂。1-丁醇脱氢酶活性的检测分析法用分光光度计在340nm监控NADH氧化成 NAD+的情况,该检测法在35°C下,使用在包含50mM 丁醛和0.2mMNADH的50mM磷 酸钾缓冲液中(PH6.2)的合适量的酶。具有醇底物的替代检测分析法在35°C下,在pH8.5 的包含3mM NAD+和不同浓度醇的TRIS缓冲液中进行,或者具有酮或醛底物的检测分析 法在35°C下,在pH6.0的包含200 μ m NADH和不同浓度的酮或醛的50mM MES缓冲液 中进行。通过这些或其他可容易地执行的检测分析法,将丁醇脱氢酶功能与由分离的核 酸分子编码的鉴定蛋白的结构相关联,两种均具有经鉴定的序列。重组表达本发明的核酸片段可在微生物宿主细胞中表达,如在细菌、蓝细菌、丝状真菌 和酵母中表达,导致表达编码的丁醇脱氢酶。宿主菌株的实例包括但不限于梭菌属、 发酵单胞菌属、埃希氏菌属、沙门氏菌属、红球菌属、假单胞菌属、芽孢杆菌属、乳酸 杆菌属、肠球菌属、片球菌属、产碱杆菌属、克雷白氏杆菌属、类芽胞杆菌属、节杆菌 属、棒状杆菌属、短杆菌属、假丝酵母属、汉逊酵母属、克鲁维酵母属和糖酵母属。含有引导外来蛋白质高水平表达的调控序列的微生物表达系统和表达载体是本领域技术人员熟知的。可使用任何这些系统和载体来构建嵌合基因,用于生产本发明的 核酸分子编码的蛋白。然后可以将这些嵌合基因通过转化导入合适的微生物中以提供酶 的高水平表达。可用于转化多种宿主细胞的载体是常见的并且可以从一些公司商购获得,例如 EPICENTRE (Madison, WI)、Invitrogen Corp. (Carlsbad, CA)、Stratagene (LaJolla, CA)和New England Biolabs,Inc. (Beverly, MA)。使用大肠杆菌_酵母穿梭载体克隆嵌
合基因用于酵母表达。通常载体含有选择标记和允许在期望宿主中自主复制或染色体整 合的序列。此外,合适的载体可包含启动子区域,该区域包含转录启动控制和转录终止 控制区,在它们之间可插入编码区DNA片段以提供插入编码区的表达。这两种控制区均 可来源于与转化的宿主细胞同源的基因,但是应当理解,这种控制区也可能来源于对被 选择作生产宿主的特定物种来说是非天然的基因。可用于驱动本发明丁醇脱氢酶编码区在所需宿主细胞中表达的起始控制区或启 动子有很多,并且是本领域技术人员熟悉的。合适的启动子包括但不限于来源于以下基 因的启动子CYC1、HIS3、GALU GAL10、ADHU PGK、PH05、GAPDH> ADCU TRPU URA3、LEU2、ENO> TPK CUPU FBA、GPD> 和 GPM (用于在糖酵母属中表 达);AOXl (可用于在毕赤酵母菌属中的表达);以及lac、ara、tet、trp、IPL> 1PR、 T7、tac、和trc启动子(用于在大肠杆菌、产碱杆菌、和假单胞菌中表达);amy、apr、 和npr启动子、以及用于在枯草芽孢杆菌、地衣芽孢杆菌、和浸麻类芽孢杆菌中表达的多 种噬菌体启动子;nisA(用于在革兰氏阳性细菌中表达,Eichenbaum等人,Appl.Environ. Microbiol.64(8) 2763-2769(1998));和合成Pll启动子(用于在植物乳杆菌中表达 (Rud等人,Microbiology 152 1011-1019(2006))。终止控制区也可以源于对优选宿主 天然的多种基因。任选地,终止位点可为非必需的;然而,如果包括则是最优选的。某些载体能够在广泛的宿主细菌中复制并可通过接合进行转移。pRK404和三 个相关载体pRK437、pRK442、和pRK442(H)的完全注解序列是可用的。这些衍生 物已被证明是在革兰氏阴性菌中进行遗传操纵的有用工具(Scott等人,Plasmid 50(1) 74-79(2003))。也可获得广宿主范围的Inc P4质粒RSF1010的几种衍生质粒,其具有在 一系列革兰氏阴性菌中发挥功能的启动子。质粒pAYC36和pAYC37具有连同多个克隆 位点一起的活性启动子,使得在革兰氏阴性菌中的异源基因能够表达。适于革兰氏阳性细菌的载体的一些实例包括ρΑΜ β 1及其衍生物 (Renault 等人,Gene 183 175-182 (1996);和 O,Sullivan 等人,Genel37 227-231 (1993)) ; pMBBl 和 pHW800, pMBBl 的衍生物(Wyckoff 等人,Appl. Environ.Microbiol.62 1481-1486(1996)) ; pMGl,接合质粒(Tanimoto 等人, J.Bacteriol.184 5800-5804(2002)) ; pNZ9520 (Kleerebezem 等人,Appl.Environ. Microbiol.63 4581-4584(1997)) ; pAM401 (Fujimoto 等人,Appl.Environ.Microbiol.67: 1262-1267 (2001));禾Π pAT392 (Arthur 等人,Antimicrob.AgentsChemother.38 1899-1903 (1994))。也已经报道了几种来源于植物乳杆菌的质粒(van Kranenburg等人, Appl.Environ.Microbiol.71 (3) 1223-1230(2005))。用于酵母中基因表达的方法是本领域已知的(参见例如Enzymology,Volume 194, Guide to Yeast Genetics and Molecular and Cell Biology, PartA, 2004, ChristineGuthrie 禾口 Gerald R.Fink(编辑),ElsevierAcademic Press, San Diego, CA 中的方法)。
酵母中通常使用的质粒是穿梭载体pRS423、pRS424、pRS425、和pRS426 (美国典型培 养物保藏中心,Rockville,MD),它们包含大肠杆菌复制起点(例如pMBl)、酵母2 μ 复制起点、和营养选择标记。这四个载体的选择标记是His3(载体pRS423)、Trpl (载体 pRS424)、Leu2 (载体pRS425)和Ura3 (载体pRS426)。用编码本发明丁醇脱氢酶的嵌 合基因构建表达载体可通过在大肠杆菌中的标准分子克隆技术或通过在酵母中的空隙修 复重组方法进行。这些载体可以在大肠杆菌和酵母菌株中繁殖。本发明的嵌合基因可从稳定复制的质粒中表达,或者可被整合进宿主基因组 中。用于DNA整合的质粒可包括转座子、与在宿主基因组中的整合靶位点同源的核酸序 列区域、或者参与整合的其他序列。可使用例如可从EPICENTRE 商购获得的体系转 座制备其他类型的载体。如何选择适用于期望靶宿主和期望功能的合适载体是熟知的。 此外,可将编码本发明的丁醇脱氢酶的核酸分子以可操作地连接的方式邻近整合进宿主 基因组中的内源启动子。丁醇微牛物牛产宿主表达本发明的分离的核酸分子提供靶向转化的重组微生物宿主细胞,它具有丁 醇脱氢酶活性,以此在存在丁醛、异丁醛、或2-丁酮的情况下制备丁醇。这些底物中 的每一种可在宿主细胞中被天然制备,或者作为宿主细胞中的工程化生物合成途径的 产物而被制备。可在微生物中进行工程化以生产异丁醇、2-丁醇、或1-丁醇的生物 合成途径在美国专利申请公布20070092957A1、20070259410AU 20070292927AU和 US20080182308A1中进行了描述,它们全文以引用方式并入本文。当忽略每个所述途径 中的最终步骤时,产物是丁醛、异丁醛、或2-丁酮。因此经工程化具有其中一个这些缺 失最终步骤的所述途径的重组微生物宿主细胞有丁醛、异丁醛、或2-丁酮来源。本发明 的分离的核酸分子在细胞中的附加表达导致存在丁醇脱氢酶活性,该酶活性将丁醛转化 成1- 丁醇、将异丁醛转化成异丁醇、或者将2- 丁酮转化成2- 丁醇。生长以生产丁醇包含本发明的分离的核酸分子并具有丁醛、异丁醛、或2-丁酮的重组微生物生 产宿主在包含合适碳底物的发酵培养基中生长。合适的底物可包括但不限于单糖, 例如葡萄糖和果糖;低聚糖,例如乳糖或蔗糖;多糖,例如淀粉、纤维素或它们的混合 物;以及来自可再生原料的未纯化混合物,例如干酪乳清渗透物、玉米浆、甜菜糖蜜及 大麦麦芽。另外,碳底物也可以为已证明可以被代谢转化为关键生化中间产物的诸如二 氧化碳之类的一碳底物或甲醇。甲基营养生物体也已知可以利用多种其他含碳化合物, 例如甲胺、葡糖胺及用于代谢活动的多种氨基酸。例如,甲基营养酵母已知可利用来自 甲胺的碳来形成海藻糖或甘油(Bellion等人,Microb.Growth ClCompd.,[Int.Symp.], 第 7 界(1993),415-32,编辑Murrell,J.Collin; Kelly, Don P.出版社Intercept, Andover, UK)。类似地,假丝酵母属的多种物种将会代谢丙氨酸或油酸(Suiter等人, Arch.Microbiol.153 485-489(1990))。因此,预期本发明中所利用的碳源可涵盖各种含 碳底物并且将仅受限于生物体的选择。尽管预期所有上述碳底物及它们的混合物都适用于本发明,但优选的碳底物为 葡萄糖、果糖和蔗糖。蔗糖可来源于可再生的糖源如甘蔗、糖用甜菜、木薯、甜高粱、以及它们的混合物。葡萄糖和右旋糖可来源于可再生的谷物来源,经由糖化淀粉基的原 料包括谷物如玉米、小麦、裸麦、大麦、燕麦、以及它们的混合物。此外,可发酵糖可 通过预处理和糖化过程来源于可再生的纤维质或木质纤维质生物质,这在例如共有的和 共同未决的美国专利申请公布2007/0031918A1中进行了描述,该专利以引用方式并入本 文。生物质指任何纤维质或木质纤维质材料,包括包含纤维素的材料,并且任选地还包 含半纤维素、木质素、淀粉、低聚糖和/或单糖的材料。生物质也可包括附加组分如蛋 白质和/或脂质。生物质可来源于单一来源,或者生物质可包括来源于一种以上来源的 混合物;例如,生物质可包括玉米芯和玉米秸秆的混合物,或草和叶片的混合物。生物 质包括但不限于生物能作物、农业残余物、市政固体垃圾、工业固体垃圾、来自造纸业 的淤渣、庭院垃圾、木材和林业垃圾。生物质的实例包括但不限于玉米粒、玉米芯、 作物残余如玉米壳、玉米秸秆、草、小麦、小麦秸秆、大麦、大麦秸秆、干草、稻秆、 柳枝稷、废纸、蔗渣、高粱、大豆、获取自谷物、树、枝、根、叶、木屑、锯末、灌木 及矮树丛、蔬菜、水果、花、动物粪肥、以及它们的混合物的研磨物的组分。除了合适的碳源外,发酵培养基还必须含有本领域技术人员已知的适于培养物 生长并促进生产2-丁酮所必需的酶途径的矿物质、盐、辅因子、缓冲剂及其他组分。培养条件通常,使细胞在约20°C至约40°C的温度范围下在合适的培养基中生长。本发明 中的合适培养基是普通的商业制备的培养基,例如Luria Bertani(LB)肉汤、沙氏葡萄糖 肉汤(SD)肉汤、酵母培养基(YM)肉汤、或者包括酵母氮基、硫酸铵、和右旋糖(作为 碳源/能源)的肉汤或YPD培养基,它是蛋白胨、酵母提取物、和右旋糖的最佳比例共 混物,用于培养啤酒糖酵母菌株。也可以使用其他确定的或合成的生长培养基,微生物 学或发酵科学领域的技术人员将知道用于具体微生物生长的合适培养基。已知可以直接 或间接调节分解代谢物阻遏的试剂,如环腺苷酸2',3'-单磷酸,也可以掺入发酵培 养基中。适于酵母发酵的pH范围介于pH 5.0至pH 9.0之间,其中优选将pH6.0至pH 8.0
作为初始生长条件的范围。适于其他微生物发酵的pH范围介于pH 3.0至pH 7.5之间, 其中优选将pH 4.5.0至pH 6.5作为初始生长条件的范围。发酵可以在有氧或厌氧条件下进行,厌氧或微氧条件是优选的。工业分批发酵和连续发酵发酵可为分批发酵方法。经典的分批发酵是封闭系统,其中培养基的组成在发 酵开始时设定并且在发酵过程中不进行人工改变。因此在发酵开始时,用所需生物体对 培养基进行接种,在不向系统添加任何物质的情况下进行发酵。然而,通常来说,“分 批”发酵是指碳源的添加是成批的,但经常试图控制诸如pH和氧浓度之类的因素。在 分批发酵系统中,代谢产物和生物质组成持续改变直至发酵结束时。在分批培养物内, 细胞缓慢通过静态延滞期到达高速生长对数期,并最后达到稳定期,此时生长速率减缓 或终止。如果不加以处理,稳定期中的细胞将最终死亡。通常,对数期中的细胞负责产 生大部分终产物或中间产物。标准分批式系统的一种变型是补料分批系统。_补料分批发酵工艺也适用于本 发明,并且包括典型的分批式系统,不同的是随着发酵进程递增地添加底物。在代谢产物往往抑制细胞的代谢作用,以及其中期望培养基中具有有限量的底物时,补料-分批 式系统是有用的。补料分批式系统中的实际底物浓度难于测量并因而可根据一些可测量 因素(例如pH、溶解的氧以及废气例如CO2的分压)进行评估。分批发酵和补料-分 批发酵在本领域内是常用的且众所周知,并且实例可见于如下文献Thomas D.Brock, Biotechnology A Textbook of Industrial Microbiology,第二版,Sinauer Associates, Inc., Sunderland, MA(1989)或 Deshpande,Mukund V., Appl.Biochem.Biotechnol.36 227, (1992),该文献以引用方式并入本文。发酵培养物可适应连续发酵方法。连续发酵是一种开放式系统,其中将设定好 的发酵培养基连续加入生物反应器中,并同时移出等量条件培养基用于加工。连续发酵 一般保持恒定高密度的培养物。连续发酵允许调节一种因素或任意数目的因素,这些因素影响细胞生长或终产 物浓度。例如,一种方法将以固定的速率维持限制性营养物质例如碳源或氮水平并且允 许所有其他参数适度。在其他系统中,影响生长的许多因素可以连续改变,而通过培养 基浊度测量的细胞浓度保持不变。连续系统力求维持稳态的生长条件,并因而在发酵过 程中由于培养基被取出而导致的细胞损失必须与细胞的生长率保持平衡。用于调节连续 发酵工艺中的营养物质和生长因子的方法以及使产物形成速率保持最高水平的方法是工 业微生物领域众所周知的,并且多种方法已由Brack(同上)详细描述。预期分批、补料-分批、连续方法、或任何已知模式的发酵适于所述的重组微 生物宿主细胞的生长。另外,预期可以将细胞固定在底物上而作为完整的细胞催化剂并 让其经受发酵条件以生产2- 丁醇。可使用发酵领域已知的方法如ABE从发酵培养基中分离生物生产的丁醇(参 见例如 Durre,Appl.Microbiol.Biotechnol.49 639-648(1998),Groot 等人,Process Biochem.27 61-75(1992),以及本文参考)。例如,可通过离心、过滤、滗析等方法从
发酵培养基中移除固体。然后,可使用诸如蒸馏、共沸蒸馏、液液萃取、吸附、汽提、 膜蒸发、或全蒸发的方法从发酵培养基中分离丁醇。因为丁醇与水形成低沸点的共沸混合物,可使用蒸馏分离混合物及其共沸组合 物。可将蒸馏与另一种分离方法联合使用以分离共沸物。可与蒸馏联合使用以分离并 纯化丁醇的方法包括但不限于滗析、液液萃取、吸附、和基于膜的技术。此外,可使 用共沸蒸馏,用夹带剂(参见例如 Doherty 和 Malone,Conceptual Design of Distillation Systems, McGraw Hill, New York, 2001)分离丁醇。丁醇-水混合物形成非均相共沸物,以便蒸馏可与滗析联合使用以分离并纯化 丁醇。用这种方法,将包含发酵液的丁醇蒸馏至接近共沸组合物。然后冷凝共沸混合 物,并且通过滗析从发酵培养基中分离丁醇。可将滗析的含水相作为回流返回第一蒸馏 塔。可在第二蒸馏塔中通过蒸馏进一步纯化富含丁醇的滗析有机相。也可联合使用液-液萃取和蒸馏从发酵培养基中分离丁醇。用这种方法,用合 适的溶剂通过液_液萃取从发酵液中提取丁醇。然后蒸馏包含丁醇的有机相以从溶剂中 分离丁醇。也可组合使用蒸馏和吸附以从发酵培养基中分离丁醇。用这种方法,将包含丁醇的发酵液蒸馏至接近共沸组合物,然后使用吸附剂除去剩余的水如分子筛(Aden等 人,Lignocellulosic Biomass to Ethanol Process Design and Economics Utilizing Co-Current Dilute Acid Prehydrolysis and Enzymatic Hydrolysis for Corn Stover, Report NREL/ TP-510-32438,National Renewable Energy Laboratory, 2002 年 6 月)。此外,蒸馏与全蒸发联合使用可从发酵培养基中分离并纯化丁醇。用这种方 法,将包含丁醇的发酵液蒸馏至接近共沸组合物,然后通过全蒸发用亲水膜除去剩余的 水(Guo 等人,J.Membr.Sci.245,199-210(2004))。
实施例本发明将在下面的实施例中进一步限定。应该理解,这些实施例尽管说明了本 发明的优选实施方案,但仅是以例证的方式给出的。根据上面的论述和这些实施例,本 领域的技术人员能确定本发明的基本特征,并在不脱离本发明的精神和范围的情况下, 能够对本发明做出多种改变和修饰,以使其适用于多种用法和条件。一般方法实施例中所述的标准重组DNA技术和分子克隆技术在领域内是众所周知的, 并且在下列文献中有所描述Sambrook,J.,Fritsch, E.F.和 Maniatis,T.Molecular Cloning A Laboratory Manual ; Cold Spring Harbor Laboratory Press Cold Spring Harbor, NY, (1989) (Maniatis)禾Π T.J.Silhavy, M丄.Bennan 禾Π L.W.Enquist,Experiments with Gene Fusions, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1984) 以及 Ausubel,F.M 等人,Current Protocols in Molecular Biology,出版Greene Publishing Assoc.and Wiley-Interscience (1987),以及 Methods in Yeast Genetics,2005, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY适合细菌培养物维持及生长的材料和方法在本领域内是众所周知的。适用于 下面实施例的技术可参见 Manual of Methods for General Bacteriology (Phillipp Gerhardt, R.G.E.Murray, Ralph N.Costilow, Eugene W.Nester, Willis A.Wood, Noel R.Krieg 禾口 G.Briggs Phillips 编辑),American Society for Microbiology, Washington, DC. (1994)), 或者 Thomas D.Brock, Biotechnology A Textbook of Industrial Microbiology,第二版, SinauerAssociates, Inc., Sunderland, MA(1989)。除非另外指明,使用的用于细菌细 胞生长和维持的所有试剂、限制性内切酶和材料均得自Aldrich Chemicals (Milwaukee, WI) > BD Diagnostic Systems (Sparks, MD)、Life Technologies (Rockville, MD)或 Sigma Chemical Company (St.Louis, MO)。除非另外指明,微生物菌株获取自美国典型培养物保藏中心(ATCC), Manassas, VA。缩写的含义如下“S”指秒,“min”指分钟,“h”指小时,“psi”指磅每 平方英寸,“nm”指纳米,“d”指天,“PL”指微升,“mL”指毫升,“L”指 升,“mm”指毫米,“nm”指纳米,“mM”指毫摩尔每升,“ μ M”指微摩尔的,
“Μ”指摩尔的,“mmol”指毫摩尔,“ μ mol”指微摩尔,“g”指克,“ μ g”指 微克而“ng”指纳克,“PCR”指聚合酶链反应,“OD”指光密度,“OD_”指在 600nm波长下测量的光密度,“kDa”指千道尔顿,“g”指引力常数,“bp”指碱基对,“kbp”指千碱基对,H指重量/体积百分比,“%v/v”指体积/体积 百分比,“HPLC”指高效液相色谱,“GC”指气相色谱。术语“摩尔选择性”是消 耗的每摩尔糖底物制备的产物摩尔数,用百分比表示。"Km"是在给定酶浓度的酶反应中导致产物生产速率等于Vmax的二分之一的底 物浓度。"Vmax”是在给定酶浓度的酶反应中生产产物的最大速率。一般单位是产物微 摩尔数每分钟反应时间。实施例1从木糖氧化无饩杆菌的环境分离蛋白中分离并表征丁醇脱氢酶使用富集方法以测定从环境废水污泥样本中分离能够利用1-丁醇作为唯一碳 源的微生物是否是可能的。通过以下方法获取富集培养物将ImL活化污泥接种到 10mLS12 培养基中(0.01M硫酸铵,0.05M 磷酸钾,pH7.0, 2mM MgCl2, OJmMCaCl2, 50 μ M MnCl2, 1 μ M FeCl3, 1 μ M ZnCl2, 1.72 μ M CuSO4, 2.53 μ M CoCl2, 2.42 μ M Na2MoO4, 2 μ M硫胺素盐酸盐),该培养基在125mL锥形瓶中包含酵母提取物(终浓度 0.001% )禾Π 0.1 % (w/v)的1- 丁醇。从DuPont废水处理设备中获取活化污泥。富集培 养物在37°C下往复振荡培养。培养物最初每隔1至2天通过用9mL的培养基置换相同体 积的培养物来稀释培养物。随后,将更高的稀释液转入包含0.1-0.4% (w/v)的初始1-丁 醇浓度的相同培养基中导致生长速率(34°C,250rpm)接近Ο.δδ!^1。将富集培养物的样本(IOyL)平铺在LB琼脂或胰酪胨大豆琼脂上,并且在35°C 培养大约20小时。通过在相同培养基上划线接种并在35°C培养该培养物纯化代表性的菌 落。选择分离物进行进一步检查。将一个分离物命名为BUTCON-5。通过rRNA表征 分析BUTCON-5菌株的同一性。通过PCR扩增菌株BUTC0N-5的16S rRNA并如下进行分析。菌株BUTC0N-5 在LB中,在37 °C下振荡生长16小时。使用Ultracleiin Microbial DNA分离试剂盒 (MoBio, part#12224),按照制造商的说明书从菌株BUTCON-5中提取DNA。 使用 商购获得的试剂盒,按照制造商的说明书(Perkin Elmer,Norwalk, CT),通过PCR扩 增 16S rRNA 基因序列,引物为 JCR14(ACGGGCGGTGTGTAC ; SEQ ID NO 4)和 JCRl5 (GCCAGCAGCCGCGGTA ; SEQ ID NO 5)。在 Perkin Elmer GeneAmp 9600 中 进行PCR。样本在94°C下培养2分钟,然后如下循环30次在94°C下1分钟,接着在 55°C下1分钟,72°C下1分钟,并在72°C下保持5分钟。使用商购获得的试剂盒,按照 制造商的说明书(QIAquick PCR Purification Kit,Valencia, CA)纯化扩增的 16S rRNA 序 列片段,并且在自动ABI测序仪(Applied Biosystems,Foster City, CA)上测序。测序 反应的起始引物是 JCR14 (SEQ ID NO 4)禾Π JCRl5 (SEQ ID NO 5)。用 16S rRNA 基 因序列作为查询序列进行GenBank中可利用序列的BLAST搜索(Altschul等人,Nucleic Acids Res.25 3389-3402 (1997))以获取相似序列。来自菌株 BUTCON-5 (SEQ IDNO 6)的16S rRNA基因序列与若干个属于菌种木糖氧化无色杆菌的细菌16S rRNA基因序列 具有高序列同一性。BUTC0N-5序列与从木糖氧化无色杆菌菌株NFRI-Al (GenBank登 陆号AB161691)中分离的16SrRNA基因序列具有最高的同一性(99% )。 纯化来自木糖氧化无色杆菌的丁醇脱氧酶活性
来自木糖氧化无色杆菌BUTCON-5菌株的丁醇脱氢酶的纯化从在上述培养 基中生长菌株的500mL过夜培养物开始进行。沉淀细胞(Sorvall RC5B,FlO转子, 6000RPM, 20分钟,10°C)并用pH7.0的25mL20mM磷酸钾洗涤两次。将洗涤后的沉 淀物重悬在pH7.0的30mL20mM磷酸钾中,并且在冰上冷冻。超声波降解(Heat Systems Ultrasonics, Cell Disrupter model W375,Power level 50, Pulsed Mode, 70% 占空比,5 分钟)细胞。通过离心(Sorvall RC5B,SS34转子,18000RPM,20分钟,10°C )细胞 降解产物制备细胞游离提取物。将上清液以等分试样贮存在-80°C。解冻两份等分试 样(9.12mL),将它们混合并用硫酸鱼精蛋白沉淀。在15分钟内四次逐滴加入IOOyL 的50mg/mL硫酸鱼精蛋白溶液(总计15% w/w蛋白)。离心(Beckman冷冻离心机, 20,000RCF,4°C, 10分钟)移除沉淀。Superdexprep 200 柱用 20mM 磷酸钾,20mM KCl,pH7.0 平衡。用 Centriprep
浓缩机将来自硫酸鱼精蛋白沉淀的上清液浓缩至约1.3mL,装入柱中并用相同缓冲液以 l.OOmL/分钟等度洗脱。收集组分并测定1-丁醇脱氢酶活性。该检测分析法用分光光 度计在340nm监控NADH氧化成NAD+的情况,该检测法在35°C下,使用在包含50mM 丁醛和0.2mMNADH的50mM磷酸钾缓冲液中(pH6.2)的合适量的酶。收集具有高比活 性的组分并浓缩以提供高纯度组分,该组分具有19μιη01/分钟/毫克蛋白的比活性。来自木糖氧化无饩杆菌的分离丁醇脱氢酶的活件染饩使用非变性聚丙烯酰胺凝胶(8-16% Tris-甘氨酸梯度凝胶,Invitrogen)对纯化酶 和分子量标准品进行电泳。在电泳后,除去凝胶并对其进行蛋白染色(Simply Blue Protein Stain, Invitrogen)或活性染色,染色通过耦合1_ 丁醇加NAD+变成丁醛加NADH的转化 与3[4,5-二甲基-2-噻唑基|-2,5-二苯基四氮唑溴盐(MTT)变成深色甲臜(formazan) 的转化进行,使用吩嗪硫酸二甲酯(PMS)作调节剂(Tang等人,等人,J.Bacteriol.140, 182(1997))。活性溶液包含 0.5mgPMS,5mg MTT, 20mg NAD+和 ImL 1_ 丁醇,总体 积为25mL。所得活性染色与介于B-藻红蛋白(242千道尔顿)和乳酸脱氢酶(146千道 尔顿)蛋白标准品之间的中间条带一起迁移。随后使用2- 丁醇(生成2- 丁酮)或异丁 醇(生成异丁醛)进行的活性染色生成具有相同分子量的条带,指示相同蛋白对这些丁醇 异构体具有活性。来自木_氧补,于肩,杆菌的丁醇脱颜j 的云力力学表征用1-丁醇、2-丁醇、丁醛、2-丁酮(甲基乙基酮)、和异丁醛作底物测定还 原(酮和醛)或氧化(醇)的木糖氧化无色杆菌丁醇脱氢酶动力学参数。用醇底物进 行的反应在35°C的TRIS缓冲液中进行,该缓冲液pH8.5,包含3mM NAD+和不同浓度 的醇。用酮或醛底物进行的反应在35°C用pH6.0的50mM MES缓冲,200 μ m NADH 和不同浓度的酮或醛进行。使用获取自木糖氧化无色杆菌或重组大肠杆菌菌株Machl/ pTrc99a::sadB(如下文实施例3所述)的粗制酶制剂。根据结果计算每种底物的Vmax和 Km,这些数据在表1中提供。表1氧补,于肩,fflTTgS脱颜的云力力学常数。
权利要求
1.分离的核酸分子,所述分离的核酸分子包含编码至少约250个氨基酸的多肽的第一 核苷酸序列,所述多肽基于Smith-Waterman比对方法在与具有如SEQ ID NO 2所示序 列的多肽进行比较时具有至少约70%的同一性,或者所述分离的核酸分子包含第二核苷 酸序列,所述第二核苷酸序列包含第一核苷酸序列的互补序列,其中所述酶具有丁醇脱 氢酶活性。
2.编码丁醇脱氢酶的分离的核酸分子,所述分离的核酸分子选自a)编码如SEQID NO 2所示的氨基酸序列的分离的核酸分子;b)在如下所述的杂交条件下与(a)杂交的分离的核酸分子0.1XSSC、0.1%SDS, 65°C 以及用 2XSSC、0.1% SDS 洗涤,之后用 0.1XSSC、0.1% SDS 洗涤;或与(a)或(b)互补的分离的核酸分子。
3.权利要求1或2的分离的核酸分子,所述分离的核酸分子具有选自SEQIDNO 1 和SEQ ID NO: 3的序列。
4.具有如SEQID NO 2所示的氨基酸序列的多肽。
5.包含权利要求1或2的分离的核酸分子的嵌合基因,所述分离的核酸分子可操作地 连接至合适的调控序列。
6.包含权利要求1或2的核酸分子的转化的宿主细胞。
7.权利要求6的转化的宿主细胞,其中所述宿主细胞选自细菌、蓝细菌、丝状真菌和 酵母。
8.权利要求7的转化的宿主细胞,其中所述宿主细胞为选自下组的属的成员梭菌 属、发酵单胞菌属、埃希氏菌属、沙门氏菌属、红球菌属、假单胞菌属、芽孢杆菌属、 乳杆菌属、肠球菌属、产碱杆菌属、克雷伯氏菌属、类芽胞杆菌属、节杆菌属、棒状杆 菌属、短杆菌属、毕赤酵母属、假丝酵母属、汉逊酵母属、克鲁维酵母属和糖酵母属。
9.生产2-丁醇的方法,所述方法包括a)提供包含权利要求1或2中任一项的分离的核酸分子的重组微生物生产宿主细胞, 所述分离的核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供2-丁酮来源;b)使(a)的微生物宿主细胞在表达所述分离的核酸分子并将所述2-丁酮转化成2-丁 醇的条件下生长;以及C)任选地回收所述2-丁醇。
10.生产异丁醇的方法,所述方法包括a)提供包含权利要求1或2中任一项的分离的核酸分子的重组微生物生产宿主细胞, 所述分离的核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供异丁醛来源;b)使(a)的微生物宿主细胞在表达所述分离的核酸分子并将所述异丁醛转化成异丁 醇的条件下生长;以及c)任选地回收所述异丁醇。
11.生产1-丁醇的方法,所述方法包括a)提供包含权利要求1或2中任一项的分离的核酸分子的重组微生物生产宿主细胞, 所述分离的核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供丁醛来源;以及b)使(a)的微生物宿主细胞在表达所述分离的核酸分子并将所述丁醛转化成1-丁醇 的条件下生长;C)并且任选地回收所述1-丁醇。
12.根据权利要求9、10、或11的方法,其中(a)的重组微生物宿主细胞选自细菌、 蓝细菌、丝状真菌和酵母。
13.根据权利要求12的方法,其中所述重组微生物宿主细胞为选自下组的属的成员 梭菌属、发酵单胞菌属、埃希氏菌属、沙门氏菌属、红球菌属、假单胞菌属、芽孢杆菌 属、乳杆菌属、肠球菌属、产碱杆菌属、克雷伯氏菌属、类芽胞杆菌属、节杆菌属、棒 状杆菌属、短杆菌属、毕赤酵母属、假丝酵母属、汉逊酵母属、克鲁维酵母属和糖酵母 jM ο
全文摘要
从分离自环境样本的细菌菌株中,在包含1-丁醇作碳源的培养基中富集后,鉴定了具有丁醇脱氢酶活性的新酶。该酶能够将丁醛转化成1-丁醇、将异丁醛转化成异丁醇、以及将2-丁酮转化成2-丁醇,并且因此对在生产这些底物的重组微生物宿主中的丁醇生物合成是有用的。从经鉴定为木糖氧化无色杆菌的分离蛋白的菌株中分离称为sadB的编码基因。
文档编号C12P7/16GK102016013SQ200980114986
公开日2011年4月13日 申请日期2009年4月28日 优先权日2008年4月28日
发明者A·C·埃利奥特, C·E·纳卡穆拉, L·A·马吉奥-霍尔, M·G·布拉穆奇 申请人:布特马斯先进生物燃料公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1