产烃基因及其使用方法

文档序号:570266阅读:935来源:国知局

专利名称::产烃基因及其使用方法产烃基因及其使用方法交叉引用的相关申请本专利申请请求2007年5月22日提交的美国临时专利申请第60/931,370号、2007年5月25日提交的美国临时专利申请第60/931,939号、2007年7月25日提交的美国临时专利申请第60/951,944号以及2007年9月24日提交的美国临时专利申请第60/974,810号的权益,上述临时专利申请通过引用,并入本文。通过引用并入的以电子方式提交的材料同此提交的计算机可读形式的核苷酸/氨基酸序列表通过引用全文并入本文,确定如下一名称为“702724_ST25.TXT”的、1,359,078字节的ASCII(文本)文件,制作于2008年5月22日。
背景技术
:技术的发展伴随着对燃料来源依赖的增加,这类燃料的来源正变得日益有限和难以获得。随着化石燃料的燃烧正以空前的速度发生,很有可能不久以后世界上的燃料需求就将超过现在的燃料供给。大多数目前产生的燃料来源来自石油或来自植物油的化学加工。石油来源面临许多问题它们是非再生性资源,它们的形成需要漫长的时期(年),且形成限于特定的区域。随着石油作为能源被消耗,地质石油资源最终将枯竭。因此,现在的发展集中于利用诸如目光、水、风和生物质(biomass)的再生性能源。利用生物质产生新的燃料来源(即生物燃料)是一种替代方案,这类燃料不是来自于石油。生物燃料(如生物柴油)是一种由长链烷烃和酯构成的可生物降解的、可燃燃料。在大部分内燃柴油发动机中,生物柴油的使用可以采用纯的形式(被称为“纯”生物柴油),或者按照任何浓度与常规的石化柴油混合。理论上,生物燃料可以由任何生物碳源产生。到目前为止,最常见的生物碳源是吸收太阳能的光合植物。许多不同的植物以及植物来源的材料被用于制造生物燃料。最大的技术挑战之一是研发将生物质能量专门转化为用于运输的液体燃料的方法。最常用的产生生物燃料的策略是种植糖类作物(如甘蔗或糖用甜菜)或淀粉作物(例如玉米(corn或maize)),然后利用酵母发酵产生乙醇(ethanol即ethylalcohol)0另一种常用的产生生物燃料的策略是种植天然产油的植物,如油椰子、大豆或麻疯树(jatropha)。天然产生的油的可选来源是来自诸如藻类的生物的油。当加热这些油时,它们的粘度降低,因此它们可以在柴油发动机中直接燃烧。可选地,可以将这些油化学加工来产生诸如生物柴油的燃料。目前制备生物柴油的方法涉及三酰甘油(如植物油或动物脂)的转酯作用,这个过程产生脂肪酯与不需要的副产物甘油的混合物。这导致异质产物和无经济效率的无用副产品(wasteproduct)0植物油仍然是具有吸引力的化石燃料的替代品,因为它们是再生性资源。然而,植物油是食物链的重要部分。不可能种植足够的农作物,既满足食物需要又满足诸如燃料和多聚体的工业化学品的需要。另外,产油植物受到其生长环境的制约。而且,植物油不是烃(例如烷烃或烯烃)。确切地说,植物油主要是含有氧分子的三酰甘油,当其在内燃机中燃烧时,会使得发动机累积焦炭。从上述来看,为了提供产生生物燃料的改进的方法,需要由替代来源产生燃料。本发明提供了编码参与烃和烃中间体的生物合成的多肽的核酸序列。另外本发明提供了利用所述核酸序列产生生物燃料的方法。本文描述的发明克服了与烃资源有限、不可再生有关的难题,并且提供了可以用来产生生物燃料的改进的方法。本发明的这些和其他优势通过本文提供的详细描述将变得显而易见。发明概述本发明提供了编码多肽的分离的核酸,所述多肽包含OleA、OleB,OleC或OleD氨基酸基元序列。本发明提供了编码多肽的分离的核酸,所述多肽包含选自下述的氨基酸序列(a)OleA、OleB,OleC、OleD或OleBC氨基酸序列;(b)OleA、OleB,OleC,OleD或OleBC氨基酸序列的同源物;(c)OleA、OleB,OleC、OleD或OleBC氨基酸序列的保守变体,其包含一个或多个保守氨基酸取代,以及(d)与OleA、OleB、OleC、OleD或OleBC氨基酸序列具有至少约35%的序列同一性的氨基酸序列。本发明提供了产生脂肪酮的方法,包括在足以产生脂肪酮的条件下,孵育底物与OleA。本发明也提供了产生烃的方法,包括在足以产生烃的条件下,孵育底物与01eA、01eB、OleC、OleBC、OleD或其组合。本发明提供了包含编码OleA的氨基酸序列的分离的多肽,其中氨基酸序列包含一个或多个氨基酸的取代、添加、插入或缺失。本发明提供了包含编码OleC的氨基酸序列的分离的多肽,其中,氨基酸序列包含一个或多个氨基酸的取代、添加、插入或缺失。本发明提供了包含编码OleD的氨基酸序列的分离的多肽,其中,氨基酸序列包含一个或多个氨基酸的取代、添加、插入或缺失。本发明提供了编码多肽的分离的核酸,所述多肽与包含编码01eA、01eC或OleD的氨基酸序列的多肽具有相同的生物学活性。本发明还提供了包含外源核酸序列的基因工程生物,所述外源核酸序列稳定地整合到生物基因组的基因组核酸序列的上游,所述基因组核酸序列(a)与编码OleA、OleB、OleC或OleD的核酸序列具有至少约35%的序列同一性,且(b)编码多肽。本发明提供了通过下述方式制备的基因工程生物(a)提供具有核酸序列的生物,所述核酸序列与OleC或OleD具有至少约35%的序列同一性,以及(b)将该核酸序列缺失或突变。本发明还提供了鉴定用于产生烃的酶的方法,包括用编码疑似有能力产生烃的酶的核酸转化细胞,所述细胞包含选自(a)01eA和OleD,(b)OleA和OleC,以及(c)OleC和OleD的多肽;测定细胞是否产生烃,其中存在细胞产生的烃,则表示核酸编码可用于产生烃的多肽。本发明提供了δ13C约-28或更大的烃。本发明还提供了pMC至少约50的烃。附图简要说明图1是从产生蛋白OleA(SEQIDNO:2)、OleC(SEQIDNO6)以及01eD(SEQIDNO8)的E.coliC41(DE3)ΔfadE中提取的烃的总离子色谱。图2A-2J是图1中所示烃的一系列10个MS谱图。图2A显示了C27三烯的MS谱图数据。图2B显示了C27二烯的MS谱图数据。图2C显示了C27单烯的MS谱图数据。图2D显示了C28二烯的MS谱图数据。图2E显示了C29三烯的MS谱图数据。图2F显示了C29二烯的MS谱图数据。图2G显示了C29单烯的MS谱图数据。图2H显示了C30二烯的MS谱图数据。图21显示了C31三烯的MS谱图数据。图2J显示了C31二烯的MS谱图数据。图4A-4E是多种嗜麦芽窄食单胞菌(Stenotrophomonasmaltophilia)培养物的甲醇己烷提取物的一系列总离子色谱。图4A表示在野生型嗜麦芽窄食单胞菌ATCC17679提取物中检测到的烯烃。图4B表示在嗜麦芽窄食单胞菌AoleA菌株(oleA缺失)的提取物中未检测到较大波峰。图4C表示在野生型嗜麦芽窄食单胞菌ATCC17679提取物中检测到的烯烃。图4D表示在麦芽窄食单胞菌AoleCkleC缺失)提取物中检测到的脂肪酮。图4E表示在麦芽窄食单胞菌AoleDkleD缺失)提取物中检测到的脂肪酮。图5A-5C是从产生蛋白01eA(SEQIDNO2)的E.coliC41(DE3)中提取的脂肪酮的一系列总离子色谱。图5A表示从产生蛋白01eA(SEQIDN02)的E.coliC41(DE3)中提取的脂肪酮。图5B表示覆盖了16-卅一酮(16-hentriacontone)(饱和C31酮)的图5A的提取物。图5C表示覆盖了14-二十七酮(饱和C27酮)的图5A的提取物。图6A-6H是图5A所示的每个脂肪酮的一系列MS谱图。图6A表示C272酮(具两个不饱和键)。图6B表示C27:l酮(具一个双键)。图6C表示C27酮(饱和的)。图6D表示C29:2酮(具两个不饱和键)。图6E表示C29:l酮(具一个双键)。图6F表示C29酮(饱和的)。图6G表示C31:2酮(具两个不饱和键)。图6H表示C31:l酮(具一个双键)。图7A-7C证明在混合了表达oleA(SEQIDNO1)的大肠杆菌细胞裂解物与酰基辅酶A(CoA)底物的体外测定中,检测到了脂肪酮。图7A是含有Ole-A裂解物的样品提取物和十四酰基辅酶A底物的总离子色谱。图7B是含有OleA裂解物没有加入十四酰基辅酶A底物的对照提取物的总离子色谱。图7C表示比较每个样品中发现的酮的量的图表。Y轴表示曲线下的面积,X轴表示所示的脂肪酮。阴影线条形图表示仅含有OleA细胞提取物的样品,黑色条形图表示混合有十四酰基辅酶A底物的OleA细胞提取物。图8A和8B图示由体外测定得到的提取物的GC/MS数据,所述提取物含有纯化的OleA蛋白、十四酰基辅酶A底物以及E.coliC41(DE3)细胞裂解物。图8A是总离子色谱,显示总离子色谱上保留时间13.95分钟时洗脱的波峰,表明存在饱和的C27脂肪酮。图8B图示了C27脂肪酮的MS谱图。图9是在E.coliC41(DE3)AfadE发酵液提取物中检测到的脂肪酮的GC曲线下的面积的图表,E.coliC41(DE3)AfadE含有各种表达oleA蛋白序列的载体。黑色条形图表示在表达含有基于聚集绿曲挠丝状菌(Chloroflexusaggregans)基因组的oleA的质粒的菌株提取物中观察到的脂肪酮的量。斜纹条形图表示在表达含有基于地毯草黄单胞菌(Xanthomonasaxonopodis)基因组的oleA的质粒的菌株提取物中观察到的脂肪酮的量,白色条形图表示菌株提取物中观察到的脂肪酮的量,所述菌株表达含有编码来自嗜麦芽窄食单胞菌ATCC17679的OleA多肽的天然核苷酸序列的质粒,以及阴影条形图表示菌株提取物中观察到的脂肪酮的量,所述菌株表达含有合成的、密码子优化的核苷酸序列的质粒,所述核苷酸序列编码来自嗜麦芽窄食单胞菌R551-3(嗜麦芽窄食单胞菌CO)的OleA多肽。嗜麦芽窄食单胞菌CO指表达密码子优化的合成DNA,其编码来自嗜麦芽窄食单胞菌R551-3的OleA的氨基酸序列(SEQIDNO:4)。图10表示由于oleA在fadE、fadD和/或tesA发生变异的E.coliC41(DE3)菌株中的表达而导致的脂肪酮产量增加的图表。白色条形图表示C27酮,阴影条形图表示C29酮,黑色条形图表示C31酮。(-)符号表示敲除了基因活性,(+)表示目的基因超表达。图11是由于oleA、oleC和oleD在fadE、fadD和/或tesA发生变异的E.coliC41(DE3)菌株中的表达而导致的烯烃产量增加的图表。白色条形图表示C27烯烃,阴影条形图表示C29烯烃,黑色条形图表示C31烯烃。(_)表示敲除了基因活性,(+)表示目的基因的超表达。图12A-12E表示OleA和OleD酶与十四酰基辅酶A组合进行的体外反应的有机提取物,经GC/MS色谱观察到的十四烷醛、14-二十七酮和二十七烷异构体。图12A是十四烷醛的总离子色谱。图12B是表示二十七烷异构体的两个波峰的总离子色谱。图12C是图12B中波峰1的MS谱图。图12D是图12B中波峰2的谱图。图13A-13C是一系列总离子色谱,其描述通过混合有十四酰基辅酶A的Ole酶的两个体外反应的有机提取物,经GC/MS所观察到的十四烷醛、14-二十七酮和二十七烷异构体。一个反应包含OleA和OleD酶,另一个包含OleA、OleD和OleB酶。图13A是十四烷醛的总离子色谱。图13B是表示二十七烷异构体的两个波峰的总离子色谱。图13C是14-二十七酮的总离子色谱。箭头表示OleA+OleD+OleB的反应,以及OleA+OleD的反应。OleB的存在增加了十四烷醛和二十七烷的形成,并降低14-二十七酮的水平。图14是证明酿酒酵母(S.cerevisiae)可以产生功能OleA的总离子色谱。图14表示酿酒酵母PESC-HIS-OleA的细胞裂解物加入十四酰基辅酶A后反应提取物的总离子色谱。观察到豆蔻酸、14-二十七酮和二十七烷对照峰(controlspike)。图15A-15H是一系列总离子色谱和MS谱图,其证明在含有纯化的OleA、含有OleD的细胞裂解物以及氚代NADPH的体外测定的有机提取物中观察到氚代醛和烯烃。图15A表示在提取包含OleA、含有OleD的细胞裂解物、十四酰基辅酶A和R-(4_2H)NADPH的体外反应后观察到的十四烷醛的总离子色谱。图15B是图15A的十四烷醛的MS图谱。图15C是在提取包含OleA、含有OleD的细胞裂解物、十四酰基辅酶A以及S-(4_2H)NADPH的体外反应后观察到的十四烷醛的总离子色谱。图15D是图15C的十四烷醛的MS谱图。图15E是OleA和含有OleD的细胞裂解物与R-(4_2H)NADPH的反应所形成的二十七烷异构体的总离子色谱。图15F是图15E的二十七烷异构体的MS谱图。图15G是在提取包含OleA、含有OleD的细胞裂解物、十四酰基辅酶A以及S-(4-2H)NADPH的体外反应后所观察到的二十七烷异构体的总离子色谱。图15H是图15G的二十七烷的MS谱图。图16A-16C是一系列总离子色谱,其证明体外合成脂族烯烃的能力。图16A是反应提取物的总离子色谱,所述反应是以细胞裂解物进行的,所述细胞裂解物是由带有表达oleA、oleB、oleC和oleD的质粒的E.coliC41(DE3)AfadE菌株和十四酰基辅酶A制备的。箭头表示C27:1、C27:2以及C27:3二十七烷。图16B是反应提取物的总离子色谱,所述反应是以细胞裂解物进行的,所述裂解物是由带有表达oleA、oleB、oleC和oleD的质粒的E.coliC41(DE3)ΔfadE菌株加入十四酰基辅酶A制备的。箭头表示C27:1、C27:2以及C27:3二十七烷。图16C是反应提取物的总离子色谱,所述反应是以细胞裂解物进行的,所述细胞裂解物是由带有表达oleA、oleB、oleC和oleD的质粒的E.coliC41(DE3)AfadE菌株加入十四酰基-ACP制备的。箭头表示C27:1、C27:2以及C27:3二十七烷。图17A-17J是烃的所选离子的一系列总离子色谱和MS谱图,所述烃是由巨大芽孢杆菌(B.megaterium)WH320;pWH1520_01eCDAB的发酵物提取的。图17A是具有质/荷比为350的母离子(parentalion)的25碳烯烃的总离子色谱。图17B是在3.093分钟的保留时间时洗脱的化合物的质谱,是分支的C25单不饱和烯烃的特征。图17C是具有质/荷比为364的母离子的26碳烯烃的总离子色谱。图17D是在3.390分钟的保留时间时洗脱的化合物的质谱,并且是分支的C26单不饱和烯烃的特征。图17E是具有质/荷比为378的母离子的27碳烯烃的总离子色谱。图17F是在3.567分钟的保留时间时洗脱的化合物的质谱,并且是分支的C27单不饱和烯烃的特征。图17G是具有质/荷比为392的母离子的28碳烯烃。图17H是在3.893分钟的保留时间时洗脱的化合物的质谱,并且是分支的C28单不饱和烯烃的特征。图171是具有质/荷比为406的母离子的28碳烯烃。图17J是在4.013分钟的保留时间时洗脱的化合物的质谱,并且是分支的C28单不饱和烯烃的特征。图18A-18E是枯草芽孢杆菌(B.subtilis)提取物的一系列总离子色谱和MS谱图。图18A是从枯草芽孢杆菌IHA01;PHT01_01eA提取的脂肪酮的总离子色谱。图18B是不产生任何脂肪烃的枯草芽孢杆菌IHA01(pHTOl)提取物的总离子色谱。图18C是在3.584分钟的保留时间时洗脱的化合物的质谱,并且是分支的脂肪C25酮的特征。图18D是在4.036分钟的保留时间时洗脱的化合物的质谱,并且是分支的脂肪C27酮的特征。图18E是在4.485分钟的保留时间时候洗脱的化合物的质谱,并且是分支的脂肪C29酮的特征。图19A-19B是金黄节杆菌(Arthrobacteraurescens)TCI提取物的总离子色谱和质谱。图19A是从金黄节杆菌TC1提取的烃的总离子色谱。三个峰表示单不饱和C29烯烃的各种分枝形式。图19B是在13.6分钟的保留时间时洗脱的化合物的质谱,并且是单不饱和C29烯烃的特征。图20图解利用01eA、01eB、01eC和OleD,生物合成分枝菌酸和合成烯烃的提议的途径。X可以是CoA或ACP。图21图解在表达oleC和oleD的产分枝菌酸生物内用于产生长链烯烃的提议的途径。图22是在表达oleC的产分枝菌酸生物内产生长链烯烃的提议的途径。发明的详细描述本发明至少部分基于对编码参与烃的生物合成的蛋白的几个基因的发现。用编码本文鉴定的一种或多种蛋白的一种或多种核酸序列转化的生物,可用于产生诸如烯烃的烃,以及诸如脂肪酮的烃中间体。术语“烯烃”和“链烯”在本文中可交换使用。如本文所述,这些核酸序列已经被鉴定为参与烃的生物合成的基因。因此,用这些基因中的一种或多种转化的细胞,可以用作烃包括烯烃以及它们的前体(如脂肪酮)产生的来源。该发现为可替代有限的、非再生性烃资源(如基于石油的燃料)作为燃料的烃提供了来源。另外,其允许产生适用于特殊应用的种类繁多的特定烯烃和脂肪酮产物。通过控制宿主生物和/或反应底物(如控制链的长度、分支、饱和度和/或双键的位置),可以制备产生包括具有特定分支或不饱和点烃产物的种类繁多的烃的生物。在嗜麦芽窄食单胞菌中,鉴定了4种基因,每种基因都编码参与诸如烯烃的烃和诸如脂肪酮的烃中间体的生物合成的蛋白。这4种基因称为oleA、oleB、oleC和oleD,由这些基因编码的蛋白分别称为OleA、OleB、OleC和OleD。另外,在其他生物中也成对地发现了这些基因。这种成对包括文中称为oleBC的oleB和oleC之间的融合,由这种基因编码的蛋白称为OleBC。这5种蛋白一起代表参与烃和烃中间体的生物合成的01e蛋白家族。单个来讲,OleA指具有OleA活性的蛋白家族,OleB指具有OleB活性的蛋白家族,OleC指具有OleC活性的蛋白家族,OleBC指具有OleBC活性的蛋白家族,OleD指具有OleD活性的蛋白家族。本领域谱普通技术人员应当理解,利用本文提供的有关嗜麦芽窄食单胞菌ole基因序列的结构和功能的信息,可以获得编码具有相似活性的蛋白的其他基因序列。鉴于这些教导,本领域普通技术人员应当理解,可以很容易地克隆其他oleA、oleB、oleC、oleBC和oleD序列,并用来制备烃和烃中间体。因此,在整个说明书中,提到Ole蛋白应当理解为意指表现出与Ole家族蛋白(包括OleA、OleB、OleC、OleBC和OleD)中的任何蛋白有相似的活性的所有蛋白。同样,提到OleA、OleB、OleC、OleBC或OleD应当理解为意指表现出每个Ole蛋白的各自活性的所有蛋白,包括,例如,表1和2中所列的所有OleA、OleB、OleC、OleBC和OleD蛋白,以及可以通过各种生物信息学方法或诸如抗体结合、核酸杂交、PCR的分子技术以及其他适宜方法鉴定或改造的其他Ole蛋白。另外,在整个说明书中,提到ole基因应当理解为意指编码表现出与Ole家族蛋白中任何蛋白包括OleA、OleB、OleC、OleBC和OleD有相似活性的蛋白的所有基因。同样,提到oleA、oleB、oleC、oleBC或oleD应当理解为意指编码表现出每个Ole蛋白各自活性的蛋白的所有基因,所述Ole蛋白包括,例如表1和2中所列的所有OleA、OleB、OleC、OleBC和OleD,以及可以通过各种生物信息学方法或诸如抗体结合、核酸杂交、PCR的分子技术以及其他适宜方法鉴定或改造的其他Ole蛋白。本发明提供了编码Ole蛋白的分离的核酸。有关核酸的术语“分离的”指核酸脱离其天然环境。而且,“分离的核酸”意指包括这样的核酸片段,其不是天然作为片段存在的,且在自然界找不到。术语“分离的”在本文中也用来指多肽,其是与其他细胞蛋白分离的,并意在涵盖纯化的和重组的多肽。本文所用术语“分离的”也指当通过重组DNA技术产生时,基本上不含细胞物质、病毒物质或培养基的核酸或肽。本文所用术语“分离的”也指当化学合成时基本上不含化学前体或其他化学品的核酸或肽。术语“核酸”和“核酸序列”意欲涵盖DNA或RNA的多聚体(即多核苷酸),其可以是单链或双链的,并且可以含有非天然或改变的核苷酸。该术语也可以理解为包括作为等同物的由核苷酸类似物构成的RNA或DNA的类似物以及适用于所述实施方案的单链(有义或反义)和双链多核苷酸、ESTs、染色体、cDNAs、mRNAs以及rRNAs。表1和表2提供了Ole蛋白的示例性列表。在表1中,#/#*表示生物含有具有各自同源性的两种同源物。以粗体表示的生物具有证实的基因活性或证实的烯烃产生。百分比同一性是通过设置为缺省参数的BLAST,与来自嗜麦芽窄食单胞菌ATCC17679的OleA、OleB、OleC或OleD(如表1和2所示)的氨基酸序列进行比较确定的。例如,利用缺省参数(期望值(expect)=10,矩阵(matrix)=BL0SUM62,过滤(filter)=DUST(TatusovandLipmann,未发表的数据;以及HancockandArmstrong,Comput.Appl.Biosci.,1067-70(1994)),缺口存在罚分(gapexistencecost)=11,每个残基的缺口罚分(perresiduegapcost)=1,且入比值=0.85),blastn(版本2.0)软件可用来测定两条核酸序列间的序列同一性。为了比较两种多肽,可利用blastp(版本2.0)软件,参数为缺省(期望值10,过滤=SEG(Woottonetal.,ComputersinChemistry,17149-163(1993)),矩阵=BL0SUM62,缺口存在罚分=11,每个残基缺口罚分=1,A=0.85)。表1<table>tableseeoriginaldocumentpage25</column></row><table><table>tableseeoriginaldocumentpage26</column></row><table><table>tableseeoriginaldocumentpage27</column></row><table><table>tableseeoriginaldocumentpage28</column></row><table><table>tableseeoriginaldocumentpage29</column></row><table><table>tableseeoriginaldocumentpage30</column></row><table><table>tableseeoriginaldocumentpage31</column></row><table><table>tableseeoriginaldocumentpage32</column></row><table><table>tableseeoriginaldocumentpage33</column></row><table><table>tableseeoriginaldocumentpage34</column></row><table><table>tableseeoriginaldocumentpage35</column></row><table><table>tableseeoriginaldocumentpage36</column></row><table><table>tableseeoriginaldocumentpage37</column></row><table><table>tableseeoriginaldocumentpage38</column></row><table><table>tableseeoriginaldocumentpage39</column></row><table><table>tableseeoriginaldocumentpage40</column></row><table>表2<table>tableseeoriginaldocumentpage40</column></row><table>本发明提供了5种参与烃的生物合成的蛋白家族,即OleA、OleB,OleC,OleBC和OleD蛋白家族,它们共同称为Ole蛋白家族。利用生物信息学程序,如BLAST程序(由NIH,Bethesda,MD提供),鉴定属于OleA、OleB,OleC,OleBC和OleD蛋白家族的蛋白和核苷酸序列。为了鉴定非常可能参与烃生物合成1的蛋白,给生物信息学分析附加其他的约束条件。烃生物合成不是由单个Ole蛋白进行。因此,含有所有4种Ole蛋白的生物,更可能产生烃。因此,对940多个细菌基因组以及超过100个古细菌和真核基因组进行生物信息学分析。该研究显示了67个含有所有4种ole烃合成基因的细菌基因组嗜麦芽窄食单胞菌R551-3、嗜麦芽窄食单胞菌K279a、金黄节杆菌TC1、氯酚节杆菌A6、BlastopirellulamarinaDSM3645、亚麻短杆菌BL2、食油脱硫球菌Hxd3、聚集绿曲挠丝状菌DSM9485、橙色绿曲挠丝状菌J-10-fl、密执安棒形杆菌密执安亚种NCPPB382、密执安棒形杆菌坏腐亚禾中、Colwelliapsychrerythraea34H、CongregibacterlitoralisKT71、DesulfotaleapsychrophilaLSv54>^i^MMM^-fkMDSM684>GemmataobscuriglobusUQM2246、GeobacterbemidjiensisBem、GeobacterlovleyiSZ、地杆菌FRC_32、GeobacteruraniumreducensRf4>KineococcusradiotoleransSRS30216、LentisphaeraaraneosaHTCC2155、藤黄微球菌NCTC2665、莫里特拉氏菌PE36、OpitutusterraePB90-1、产丙酸粘土杆菌DSM2379、深海发光杆菌3TCK、深海发光杆菌SS9、PlanctomycesmarisDSM8797、PlesiocystispacificaSIR-1、Psychromonasingrahamii37、冷单胞菌CNPT3、RhodopirellulabalticaSH1、亚马逊希瓦氏菌SB2B、波罗的海希瓦氏菌OS155、波罗的海希瓦氏菌0S185、波罗的海希瓦氏菌0S195、波罗的海希瓦氏菌0S223、海底希瓦菌KT99、反硝化希瓦氏菌0S217、冷海希瓦氏菌NCIMB400、ShewanellahalifaxensisHAW-EB4、ShewanellaloihicaPV—4、ShewanellaoneidensisMR—1、ShewanellapealeanaATCC700345、腐败希瓦氏菌200、腐败希瓦氏菌CN-32、ShewanellasediminisHAW-EB3、希瓦氏菌(Shewanellasp.)ANA_3、希瓦氏菌(Shewanellasp.)MR_4、希瓦氏菌(Shewanellasp.)MR-7、希瓦氏菌(Shewanellasp.)W3_18_1、ShewanellawoodyiATCC51908、产二素链霉菌ATCC23877、地毯草黄单胞菌柑橘致病变种菌株306、野油菜黄单胞菌野油菜致病变种菌株8004、野油菜黄单胞菌野油菜致病变种菌株B100、野油菜黄单胞菌野油菜致病变种菌株ATCC33913、野油菜黄单胞菌野油菜致病变种菌株85-10、水稻黄单胞菌水稻白叶枯病致病变种KACC10331、水稻黄单胞菌水稻白叶枯病致病变种MAFF311018、水稻黄单胞菌水稻细菌性条斑病致病变种BLS256、苛养木杆菌9a5c、苛养木杆菌Ann_l、苛养木杆菌Dixon、苛养木杆菌M12、苛养木杆菌M23和苛养木杆菌Temeculal。以前的报道试图表征各种生物产生烃的能力,但是这些报道未得到证实(参阅,例如Jonesetal.,J.Gen.Microbiol.,59145-152(1969),Ladyginaetal.,ProcessBiochemistry,41:1001_1014(2006))。尽管对于生物产生非类异戊二烯烃的能力的报道很少,但是已有文献显示,有4种生物产生本文所述类型的烯烃嗜麦芽窄食单胞菌、Kineococcusradiotolerans、绿曲挠丝状菌属(Chloroflexus)的种、以及各种微球菌属(Micrococcus)的种,包括最近已测序的藤黄微球菌(Tornabeneetal.,Can.J.Microbiol.,24525-532(1978);Suenetal.,JournalofIndustrialMicrobiology,2:337—348(1988);Morrisonetal.,J.Bacteriol.,108353-358(1971);vanderMeeretal.,Org.Geochem.,30:1585-1587(1999);Albroetal.,Biochemistry,8394-404(1969);Philipsetal.,Int.J.Syst.Evol.Microbiol.,52:933_938(2002))。生物信息学搜索在嗜麦芽窄食单胞菌(R551-3和K279a)、Kineococcusradiotolerans、聚集绿曲挠丝状菌、橙色绿曲挠丝状菌以及藤黄微球菌中独立地鉴定了4个ole基因。另外,已经证实,这些生物产生烃(如烯烃)。特别是,检测了来自这些生物中几个生物的Ole蛋白产生烃的能力。选择已知产生烃的两种生物以及并未报导产生烃但在生物信息学分析中得以鉴定的两种生物,并检测它们在Ε.coli中表达时产生烃的能力。实例6表明,嗜麦芽窄食单胞菌、Xanothomonasaxonopodis和聚集绿曲挠丝状菌的OleA、OleC和OleD蛋白序列当在宿主如E.coli或巨大芽孢杆菌中表达时,发挥作用产生烃。另外,当与oleA和oleD一起在E.coli中表达时,Plesiocystispacifica的OleC蛋白序列也产生烃。为了证实这些基因赋予在嗜麦芽窄食单胞菌中产生烃的能力,在产生烃的嗜麦芽窄食单胞菌菌株中进行0leA、0leC和oleD的缺失突变。丢失oleA的嗜麦芽窄食单胞菌缺失突变体不产生任何烃。丢失oleC或oleD的嗜麦芽窄食单胞菌缺失突变体不产生烃,但改为产生脂肪酮。利用生物信息学,Ole氨基酸基元可通过鉴定每种Ole蛋白的保守区来设计。这些氨基酸基元可通过蛋白比对随后进行蛋白序列的目测来设计。随后用这些氨基酸基元鉴定具有与Ole蛋白相似生物学功能的蛋白。本领域公知的几个程序可利用氨基酸基元鉴定属于功能蛋白家族的蛋白。例如,一个这类公众可利用的程序是http://motif,genome,jp/motif2.html(参阅实施例7)。基于实验数据,预测含有所有4种ole基因的生物非常有可能具有产生烃的能力。因此,通过编辑来自67种含有所有4种Ole蛋白的生物(参阅例如表1)的所有01eA、0leB、OleC和OleD蛋白序列,产生氨基酸基元。对于诸如OleBC蛋白的蛋白融合物,用OleB蛋白序列比对OleB部分,用OleC蛋白序列比对OleC部分。具有部分基因组序列或可能基因组重组的生物未包括于表1中,因此,未用来设计这些氨基酸基元。基于这些含有所有4种ole基因的67种生物的保守区,预测含有这些氨基酸基元的其他多肽序列可能是有功能的Ole蛋白。由含有4种ole基因的67种生物设计的氨基酸基元显示于表3-6中。在所有描述的基元中,下标编号表示氨基酸在基元中的位置。X表示任何氨基酸(例如任何天然存在的氨基酸),括号内的项目表示所示位置氨基酸的选择。例如[⑶^意指在残基位置1是L或F。表3<table>tableseeoriginaldocumentpage42</column></row><table>表4<table>tableseeoriginaldocumentpage42</column></row><table>表5<table>tableseeoriginaldocumentpage43</column></row><table>通过进一步考虑确定生物产生烃的已出版的文献,结合显示这些生物也含有所有4种ole基因的生物信息学数据,建立了其他氨基酸基元。而且,利用证明所检测的含有所有4种ole基因的特定生物能够产生烃的实验数据,建立了这些基元。这些氨基酸基元显示于表7-9中。表7<table>tableseeoriginaldocumentpage43</column></row><table>表8<table>tableseeoriginaldocumentpage44</column></row><table>最后,通过比对来自生物的Ole蛋白序列序列,建立了其他氨基酸基元,所述生物的ole基因在E.coli中异源表达且证实具有产生烃的作用(参阅,例如实施例6)。这些氨基酸基元显示于表10-12中。表10<table>tableseeoriginaldocumentpage44</column></row><table>表11<table>tableseeoriginaldocumentpage44</column></row><table>表12<table>tableseeoriginaldocumentpage45</column></row><table>本发明涉及分离的核酸,其编码包含OleA、OleB、OleC或OleD氨基酸基元序列的多肽。例如,分离的核酸可以编码包含选自SEQIDNOs:64-74和91-133的氨基酸序列的多肽。分离的核酸可以编码包含OleA氨基酸基元序列的多肽。例如,分离的核酸编码包含选自SEQIDNOs:64-69、98-102和116-120的氨基酸序列的多肽。分离的核酸可以编码包含OleB氨基酸基元序列的多肽。例如,分离的核酸可以编码包含选自SEQIDNOs:91_97的氨基酸序列的多肽。分离的核酸可以编码包含OleC氨基酸基元序列的多肽。例如,分离的核酸可以编码包含选自SEQIDNOs:72-74、103-108和121-126的氨基酸序列的多肽。分离的核酸可以编码包含OleD氨基酸基元序列的多肽。例如,分离的核酸可以编码选自SEQIDNOs:70、71、109-115和127-133的氨基酸序列的多肽。分离的核酸可以编码包含多于一种01eA、01eB、01eC或OleD氨基酸基元序列的多肽。例如,分离的核酸可以编码包含1种、2种、3种或4种氨基酸基元序列的多肽。例如,分离的核酸可以编码包含OleB氨基酸基元序列以及OleC氨基酸基元序列的多肽。可选地,分离的核酸可以编码多于一种包含01e氨基酸基元序列的多肽。例如,分离的核酸可以编码第一多肽和第二多肽,其中第一和第二多肽中的每一个都包含01e氨基酸基元序列,或其中第一和第二多肽中的每一个都包含选自SEQIDNOs:64-74和91-133的氨基酸序列。分离的核酸可以编码第一多肽、第二多肽以及第三多肽,其中第一、第二、第三多肽中的每一个都包含01e氨基酸基元序列。例如,分离的核酸可以编码第一多肽、第二多肽和第三多肽,其中第一、第二以及第三多肽中的每一个都包含选自SEQIDNOs64-74和91-133的氨基酸序列。分离的核酸可以编码第一多肽、第二多肽、第三多肽和第四多肽,其中第一、第二、第三和第四多肽的每一个都包含01e氨基酸基元序列。例如,分离的核酸可以编码第一多肽、第二多肽、第三多肽和第四多肽,其中第一、第二、第三和第四多肽的每一个都包含选自SEQIDNOs:64-74和91-133的氨基酸序列。优选地,分离的核酸编码包含01e氨基酸基元序列的、不超过1500个氨基酸残基的多肽。例如,分离的核酸编码包含选自SEQIDNOs:64-74和91-133的氨基酸序列的、不超过1500个氨基酸残基的多肽。在另一个实施方案中,第一和第二多肽中的每一个都不超过1500个氨基酸残基,第一、第二和第三多肽中的每一个都不超过1500个氨基酸残基,或第一、第二、第三和第四多肽中的每一个都不超过1500个氨基酸残基。ole基因的生物信息学分析表明,所述基因经常发现于以相同方向转录的5000-10000个碱基对内,如同在一个操纵子中。所述基因也成对地发现于生物中。这种成对包括OleB和OleC之间的蛋白融合(本文称为OleBC)。例如,已经在上文所述67种生物内的7种中发现了oleBC基因融合金黄节杆菌、密执安棒形杆菌的两个种、Kineococcusradiotolerans^Mj^^iiff|if>Congregibacterlitoralis以U^H■王求lif。鉴定含有一种或多种ole基因的生物表明,所述生物也可以天然地产生烃。利用生物信息学技术鉴定含有属于这些基因家族的基因的其他已测序的生物(参阅,例如表1和2)。这些基因可以用来赋予它们的宿主生物产生烃的能力,以及当在其他宿主生物中表达时,赋予其他宿主产生烃的能力。本领域普通技术人员应当意识到,其他oleA、oleB、oleC、oleD和oleBC序列可以很容易地克隆,并用来产生烃和烃中间体。利用本文公开的方法鉴定的OleA、OleB、OleC、OleD和OleBC蛋白的示例性名单,可见于表1和2中。本领域普通技术人员应当能由表1和2列出的OleA、OleB、OleC、OleD和OleBC蛋白序列确定或推断出基因序列。本发明针对编码多肽的分离的核酸,所述多肽包含、组成基本上为或组成为选自下述的氨基酸序列(a)OleA、OleB、OleC、OleD或OleBC氨基酸序列;(b)OleA、OleB、OleC、OleD或OleBC氨基酸序列的同源物;(c)OleA、OleB、OleC、OleD或OleBC氨基酸序列的保守变体,包含一个或多个保守氨基酸取代;以及⑷与OleA、OleB、OleC、OleD或OleBC氨基酸序列具有至少约35%(例如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)序列同一性的氨基酸序列。例如,分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列选自(a)SEQIDN0:2、SEQIDNO:4、SEQIDN0:6、SEQIDNO:8、SEQIDNO:10、SEQIDN0:12、SEQIDN0:14、SEQIDN0:16、SEQIDN0:18、SEQIDN0:20、SEQIDNO:22、SEQIDNO88,SEQIDNOs:135-464以及SEQIDNOs478-487;(b)SEQIDN0:2、SEQIDN0:4、SEQIDN0:6、SEQIDNO:8、SEQIDN0:10、SEQIDN0:12、SEQIDN0:14、SEQIDNO:16、SEQIDN0:18、SEQIDNO20,SEQIDNO22,SEQIDNO88,SEQIDNOs135-464以及SEQIDNOs478-487的同源物;(c)SEQIDN0:2、SEQIDN0:4、SEQIDN0:6、SEQIDN0:8、SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16,SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:88、SEQIDNOs135-464以及SEQIDNOs478-487的保守变体,包含一个或多个保守氨基酸取代;以及(d)与SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:88、SEQIDNOs135-464以及SEQIDNOs478-487具有至少约35%(例如,至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)序列同一性的序列。分离的核酸可以编码包含、组成基本上为或组成为OleA、OleB、OleC、OleD或OleBC氨基酸序列的多肽。例如,分离的核酸编码包含、组成基本上为或组成为选自SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO14,SEQIDN0:16、SEQIDNO18,SEQIDNO:20、SEQIDNO:22、SEQIDNO:88、SEQIDNOs:135-464和SEQIDNOs478-487的氨基酸序列的多肽。优选,分离的核酸编码包含、组成基本上为或组成为选自SEQIDN0:2、SEQIDNO:4、SEQIDN0:6、SEQIDN0:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO22和SEQIDNO88的氨基酸序列的多肽。分离的核酸可以编码包含、组成基本上为或组成为OleA氨基酸序列的多肽。例如,分离的核酸可以编码包含、组成基本上为或组成为选自SEQIDN0:2、SEQIDNO:4、SEQIDNO12,SEQIDN0:18和SEQIDNOs:150-229的氨基酸序列的多肽。优选,分离的核酸编码包含、组成基本上为或组成为选自SEQIDNO:2、SEQIDNO:4、SEQIDNO12和SEQIDNO18的氨基酸序列的多肽。分离的核酸可以编码包含、组成基本上为或组成为OleB氨基酸序列的多肽。例如,分离的核酸可以编码包含、组成基本上为或组成为选自SEQIDN0:10和SEQIDNOs230-326的氨基酸序列的多肽。优选,分离的核酸编码包含、组成基本上为或组成为这样的氨基酸序列,其包含、组成基本上为或组成为SEQIDN0:10。分离的核酸可以编码包含、组成基本上为或组成为OleC氨基酸序列的多肽。例如,分离的核酸可以编码包含、组成基本上为或组成为选自SEQIDN0:6、SEQIDNO:14、SEQIDNO20,SEQIDNO88以及SEQIDNOs:327_402的氨基酸序列的多肽。优选,分离的核酸编码包含、组成基本上为或组成为选自SEQIDN0:6、SEQIDNO14,SEQIDNO20和SEQIDNO88的氨基酸序列的多肽。分离的核酸可以编码包含、组成基本上为或组成为OleD氨基酸序列的多肽。例如,分离的核酸可以编码包含、组成基本上为或组成为选自SEQIDN0:8、SEQIDNO:16、SEQIDN0:22、SEQIDNOs:142-149和SEQIDNOs:403_464的氨基酸序列的多肽。优选,分离的核酸编码包含、组成基本上为或组成为选自SEQIDN0:8、SEQIDN0:16和SEQIDN022的氨基酸序列的多肽。分离的核酸可以编码包含、组成基本上为或组成为OleBC氨基酸序列的多肽。例如,分离的核酸可以编码包含、组成基本上为或组成为选自SEQIDNOs:135-141的氨基酸序列的多肽。分离的核酸可以编码包含、组成基本上为或组成为OleA、OleB、OleC、OleD或OleBC氨基酸序列的同源物的氨基酸序列的多肽。例如,分离的核酸可以编码包含、组成基本上为或组成为选自SEQIDN0:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO22,SEQIDNO:88、SEQIDNOs:135-464和SEQIDN0s478_487的同源物的氨基酸序列的多肽。优选,分离的核酸编码包含、组成基本上为或组成为选自SEQIDN0:2、SEQIDNO4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDN016,SEQIDNO:18、SEQIDNO20,SEQIDNO22和SEQIDNO88的同源物的氨基酸序列的多肽。分离的核酸可以编码包含、组成基本上为或组成为为OleA同源物的氨基酸序列的多肽。例如,分离的核酸可以编码包含、组成基本上为或组成为选自SEQIDN0:2、SEQIDNO:4、SEQIDNO:12、SEQIDNO18和SEQIDNOs150-229的同源物的氨基酸序列的多肽。优选,分离的核酸编码包含、组成基本上为或组成为选自SEQIDN0:2、SEQIDNO:4、SEQIDNO12和SEQIDNO18的同源物的氨基酸序列的多肽。分离的核酸可以编码包含、组成基本上为或组成为,为OleB同源物的氨基酸序列的多肽。例如,分离的核酸可以编码包含、组成基本上为或组成为选自SEQIDN0:10和SEQIDNOs230-326的同源物的氨基酸序列的多肽。优选,分离的核酸编码包含、组成基本上为或组成为选自SEQIDNO10的同源物的氨基酸序列的多肽。分离的核酸可以编码包含、组成基本上为或组成为为OleC同源物的氨基酸序列的多肽。例如,分离的核酸可以编码包含、组成基本上为或组成为选自SEQIDN0:6、SEQIDNO:14、SEQIDNO20,SEQIDNO88和SEQIDNOs327-402的同源物的氨基酸序列的多肽。优选,分离的核酸编码包含、组成基本上为或组成为选自SEQIDN0:6、SEQIDNO14,SEQIDNO20和SEQIDNO88的同源物的氨基酸序列的多肽。分离的核酸可以编码包含、组成基本上为或组成为为OleD同源物的氨基酸序列的多肽。例如,分离的核酸可以编码包含、组成基本上为或组成为选自SEQIDN0:8、SEQIDNO:16、SEQIDNO:22、SEQIDNOs142-149和SEQIDNOs403-464的同源物的氨基酸序列的多肽。优选,分离的核酸编码包含、组成基本上为或组成为选自SEQIDN0:8、SEQIDN016和SEQIDNO22的同源物的氨基酸序列的多肽。分离的核酸可以编码包含、组成基本上为或组成为,为OleBC同源物的氨基酸序列的多肽。例如,分离的核酸可以编码包含、组成基本上为或组成为选自SEQIDNOs135-141的同源物的氨基酸序列的多肽。01eA、01eB、OleC、OleD或OleBC蛋白的同源物为,在功能上基本上与01eA、01eB、OleC、OleD或OleBC蛋白一样的蛋白,例如,在具有烃合酶活性方面。例如,OleA、OleB、01eC、01eD或OleBC蛋白和01eA、01eB、01eC、01eD或OleBC蛋白同源物不一定具有相似的氨基酸序列。然而,它们具有相似的烃合酶活性。两条序列间“同源性”的计算,可以如下进行按最佳比较(如可以在第一和第二氨基酸或核酸序列之一或两者中引入缺口,进行最佳比对,为了比较,可以忽略非同源序列),比对序列。在优选的实施方案中,为了比较而比对的参照序列的长度为参照序列长度的至少约30%、优选至少约40%、更优选至少约50%、甚至更优选至少约60%,且甚至更优选至少约70%、至少约80%、至少约90%或约100%。随后比较相应氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一序列中的位置被与第二序列相应位置中相同的氨基酸残基或核苷酸占据时,则分子在该位置相同(如本文所用的,氨基酸或核酸的同一性等同于氨基酸或核酸的“同源性”)。两条序列间百分比同一性是序列共有的相同位置数目的函数,要考虑为了进行两条序列的最佳比对需要引入空缺的数目和每个空缺的长度。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列是OleA、OleB、OleC、OleD或OleBC氨基酸序列的保守变体。例如,分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列选自SEQIDN0:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDN0:14、SEQIDNO16,SEQIDNO18,SEQIDNO20,SEQIDNO22,SEQIDNO88,SEQIDNOs135-464和SEQIDNOs478-487的保守变体。优选,分离的核酸编码包含、组成基本上为或组成为选自SEQIDN0:2、SEQIDN0:4、SEQIDN0:6、SEQIDN0:8、SEQIDNO10,SEQIDN0:12、SEQIDN0:14、SEQIDN0:16、SEQIDN0:18、SEQIDNO:20、SEQIDNO:22禾口SEQIDNO:88的保守变体的氨基酸序列的多肽。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列是OleA氨基酸序列的保守变体。例如,分离的核酸可以编码包含、组成基本上为或组成为选自SEQIDNO:2、SEQIDNO:4、SEQIDNO:12、SEQIDNO18和SEQIDNOs150-229的保守变体的氨基酸序列的多肽。优选,分离的核酸编码包含、组成基本上为或组成为选自SEQIDNO:2、SEQIDNO:4、SEQIDNO12和SEQIDNO18的保守变体的氨基酸序列的多肽。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列是OleB氨基酸序列的保守变体。例如,分离的核酸可以编码包含、组成基本上为或组成为选自SEQIDNO:10和SEQIDNOs:230_326的保守变体的氨基酸序列的多肽。优选,分离的核酸编码包含、组成基本上为或组成为SEQIDNO:10的保守变体的氨基酸序列的多肽。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列是OleC氨基酸序列的保守变体。例如,分离的核酸可以编码包含、组成基本上为或组成为选自SEQIDNO:6、SEQIDNO:14、SEQIDNO:20、SEQIDNO88和SEQIDNOs327-402的保守变体的氨基酸序列的多肽。优选,分离的核酸编码包含、组成基本上为或组成为选自SEQIDN0:6、SEQIDNO14、SEQIDN0:20和SEQIDNO:88的保守变体的氨基酸序列的多肽。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列是OleD氨基酸序列的保守变体。例如,分离的核酸可以编码包含、组成基本上为或组成为选自SEQIDNO:8、SEQIDNO:16、SEQIDNO:22、SEQIDNOs:142-149和SEQIDNOs403-464的保守变体的氨基酸序列的多肽。优选,分离的核酸编码包含、组成基本上为或组成为选自SEQIDNO:8、SEQIDNO16和SEQIDNO22的保守变体的氨基酸序列的多肽。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列是OleBC氨基酸序列的保守变体。例如,分离的核酸可以编码包含、组成基本上为或组成为选自SEQIDNOs135-141的保守变体的氨基酸序列的多肽。如本文所用的,多肽X的“变体”指具有肽X的氨基酸序列的多肽,其中,一个或多个氨基酸残基发生了改变。变体可以具有保守变化或非保守变化。利用本领域公知的计算机程序,如LASERGENE软件(DNASTAR),可指导确定哪个氨基酸残基可以被取代、插入、缺失而不影响生物学活性。当用于多核苷酸序列的语境时,术语“变体”可以包括与基因的多核苷酸序列有关的多核苷酸序列,或其编码序列。该定义也可以包括例如“等位基因”变体、“剪接”变体、“物种”变体(“specieWariant)或“多态性”变体。剪接变体与参照多核苷酸可以具有显著同一性,但由于mRNA加工过程中外显子的可选剪接,通常会具有数量更多或更少的多核苷酸。相应的多肽可以具有额外的功能结构域或缺少功能结构域。物种变体是一个物种和另一物种间不同的多核苷酸序列。所得的多肽相互之间通常会具有显著的氨基酸同一性。多态性变体是既定物种的个体间特定基因的多核苷酸序列中的变异。保守氨基酸取代可以是表13中所示的任何氨基酸取代。特别是氨基酸取代可以选自丙氨酸取代为D-Ala、Gly、^-Ala、L_Cys、D-Cys;精氨酸取代为D_Arg、Lys、D_Lys、高Arg、D-高Arg、Met、11e、D_Met、D_11e、Orn、D-0rn;天冬酰胺取代为D-Asn、Asp、D-Asp、Glu、D-Glu、Gin、D-Gln;天冬氨酸取代为D_Asp、D_Asn、Asn、Glu、D_Glu、Gin、D-Gln;半胱氨酸取代为D-Cys、S-Me-Cys、Met、D_Met、Thr、D-Thr;谷氨酸取代为D_Glu、D_Asp、Asp、Asn、D-Asn、Gln、D-Gln;甘氨酸取代为Ala、D-Ala、Pro、D-Pro、b_Ala、Acp;异亮氨酸取代为D-Ile、Val、D-Val、Leu、D_Leu、Met、D_Met;亮氨酸取代为D_Leu、Val、D_Val、Leu、D_Leu、Met、D-Met;赖氨酸取代为D_Lys、Arg、D_Arg、高Arg、D_高Arg、Met、D_Met、Ile、D_Ile、0rn、D-Orn;蛋氨酸取代为D-Met、S-Me_Cys、lie、D_Ile、Leu、D_Leu、Val、D_Val;苯丙氨酸取代为D-Phe、Tyr、D_Thr、L-Dopa、His、D_His、Trp、D-Trp、反式_3,4,或5-苯基脯氨酸、顺式_3,4,或5-苯基脯氨酸;脯氨酸取代为D-Pro、L-l-噻唑烷-4-羧酸、D-或L-1-噁唑烷-4-羧酸;丝氨酸取代为D-Ser、Thr、D-Thr、别-Thr、Met、D_Met、Met(0)、D_Met(0)、L_Cys、D_Cys;苏氨酸取代为D-Thr、Ser、D_Ser、别-Thr、Met、D_Met、Met(0)、D-Met(0)、Val、D-Val;酪氨酸取代为D-Tyr、Phe、D-Phe、L-Dopa、His、D-His;以及缬氨酸取代为D_Val、Leu、D_Leu、Ile、D-Ile、Met、D_Met。表13<table>tableseeoriginaldocumentpage50</column></row><table><table>tableseeoriginaldocumentpage51</column></row><table>Ole蛋白的保守变体可以包含一个或多个保守氨基酸取代。例如,保守变体可以具有约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40或50个保守氨基酸取代。在优选的实施方案中,保守变体具有不多于约50个保守氨基酸取代。例如,保守变体可以包含不多于约3、5、10、15、20、25、30、35、40或50个保守氨基酸取代。SEQIDNO:2、SEQIDNO:4、SEQIDN0:6、SEQIDN0:8、SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16,SEQIDN0:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:88、SEQIDNOs:135-464和SEQIDN0s478-487的保守变体是功能上与无氨基酸取代的各自氨基酸序列基本上相同的变体。本文提供的任一测定可用来评估活性。在一些实例中,可以测定OleA蛋白保守变体的烃合酶活性,诸如酰基缩合活性、脂肪酮合酶活性,和/或烯烃合酶活性。如本文所用的,术语“合酶”指催化合成过程的酶。如本文所用的,术语合酶包括合酶、合成酶和连接酶。在其他实例中,可以如本文所述测定OleC和OleD保守变体的活性。保守变体可以在氨基酸序列中具有例如,约1个保守氨基酸取代、2个氨基酸取代、3个氨基酸取代、4个氨基酸取代或5个或更多个氨基酸取代,只要维持蛋白的活性。优选,分离的核酸编码包含、组成基本上为或组成为选自SEQIDNO:2SEQIDNO4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDN0:12、SEQIDNO:14、SEQIDNO16,SEQIDNO:18、SEQIDNO20,SEQIDNO22和SEQIDNO88的保守变体的氨基酸序列的多肽,所述保守变体具有选自下述的一个或多个保守氨基酸取代Ala取代为Cys、Gly或Ser;Arg取代为Ile、Lys、Met或Orn;Asn取代为Asp、Gln、Glu或His;Asp取代为Asn、Gin或Glu;Cys取代为Met、Ser或Thr;Gin取代为Asn、Asp或Glu;Glu取代为Asn、Asp或Gin;Gly取代为Acp、Ala或Pro;His取代为Asn或Gin;lie取代为Leu、Met或Val;Leu取代为lie、Met或Val;Lys取代为Arg、Gin、Glu、lie、Met或Orn;Met取代为Cys、lie、Leu或Val;Phe取代为His、L_Dopa、Leu、Met、Thr、Trp、Tyr、3_苯基脯氨酸、4-苯基脯氨酸或5-苯基脯氨酸;Pro取代为L-1-噻唑烷-4-羧酸或D-或L-1-噁唑烷_4_c羧酸;Ser取代为Cys,Met或Thr;Thr取代为Met,Ser或Val;Trp取代为Tyr;Tyr取代为L_Dopa、His或Phe;以及Val取代为lie、Leu或Met。在一些实施方案中,保守变体与衍生它的序列相比,包括一个或多个保守氨基酸取代,且仍然保留其各自活性。例如,保守变体可以保留衍生它的亲本蛋白的生物学活性的至少约10%,或可选地,亲本蛋白生物学活性的至少约20%、至少约30%或至少约40%。在一些优选的实施方案中,保守变体保留了衍生它的亲本蛋白生物学活性的至少约50%。保守变体的保守氨基酸取代可以发生于蛋白的任何结构域。在另一个实施方案中,与亲本蛋白相比,保守氨基酸取代可以导致生物学活性提高。例如,保守变体可以具有衍生它的亲本蛋白生物学活性的至少约100%,或可选地,衍生它的亲本蛋白生物学活性的至少约110%、至少约120%、至少约150%、至少约200%或至少约1000%。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列与01eA、01eB、01eC、01eD或OleBC具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)序列同一性的氨基酸序列的多肽。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列选自与SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDN0:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO88,SEQIDNOs:135_464和SEQIDNOs478-487具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性的序列。优选,分离的核酸编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列选自与SEQIDN0:2、SEQIDN0:4、SEQIDN0:6、SEQIDN0:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO22和SEQIDNO:88具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性的序列。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列与OleA具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列选自与SEQIDN0:2、SEQIDN0:4、SEQIDNO12,SEQIDN0:18禾口SEQIDNOs:150-229具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性的序列。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列与OleB具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列选自与SEQIDN0:10和SEQIDNOs:230_326具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性的序列。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列与OleC具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列选自与SEQIDN0:6、SEQIDN0:14、SEQIDNO:20、SEQIDNO88和SEQIDNOs:327_402具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性的序列。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列与OleD具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列选自与SEQIDN0:8、SEQIDN016,SEQIDNO:22、SEQIDNOs:142_149和SEQIDNOs403-464具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性的序列。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列与OleBC具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性。分离的核酸可以编码包含、组成基本上为或组成为氨基酸序列的多肽,所述氨基酸序列选自与SEQIDNOs:135-141具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性的序列。本文也提供了编码多肽的分离的核酸,所述多肽包含、组成基本上为或组成为与编码01e蛋白的氨基酸具有介于约35%和约100%序列之间的同一性的氨基酸序列。例如,分离的核酸可以编码多肽,所述多肽包含、组成基本上为或组成为与编码01e蛋白的氨基酸序列具有至少约35%、至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%的序列同一性的氨基酸序列。尽管公开了形成烃和烃中间体的核酸和氨基酸序列的具体实施方案,但是,可以理解,可以从其他生物中分离具有相似结构特征的序列。可以测定这些新分离的序列的烃合酶活性(相关序列的具体的非限制性实例的名录,参阅表1和表2)。另外,可以理解,可以利用常规分子生物学技术,包括例如,定点突变、M13引物诱变突变、易错PCR(err0rpronePCR)、有性PCR(sexualPCR)、DNA合成或DNA改组(DNAshuffling),可以很容易地鉴定和/或产生本文公开的核酸和氨基酸序列的其他功能等同形式。Sambrooketal.,MolecularCloning:ALaboratoryManual(分子克隆实验室手册),第三版,1-3卷,ColdSpringHarbor,NewYork(2000)中提供了许多这些技术的详情。因此,除了结构上相关的序列和同源序列外,本发明也包括与SEQIDN0:2、SEQIDN0:4、SEQIDN0:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO12,SEQIDNO:14、SEQIDNO:16,SEQIDN0:18、SEQIDNO:20、SEQIDNO:22、SEQIDN0:88禾口/或SEQIDNOs135-464具有至少约30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%序列同一性的氨基酸序列。在其他实施方案中,本发明包括与SEQIDN0:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO88和/或SEQIDNOs135-464具有至少约96%、97%、98%、99%或99.5%序列同一性的氨基酸序列。保留了与OleA、OleB、OleC、OleBC禾口OleD相似的结构和功能的序列可以通过许多已知方法进行鉴定。一种此类方法涉及筛选与已知序列进行序列比对的基因组序列。比对序列进行比较的方法在本领域内是公知的。各种程序和比对算法描述于Smithetal.,Adv.Appl.Maat.,2482(1981);Needlemanetal.,J.Mol.Biol.,48:443(1970);Pearsonetal.,Proc.Natl.Acad.Sci.USA,852444(1988);Higginsetal.,Gene,73237-244(1988);Higgins&Sharp,CABI0S,5:151—153(1989);Corpetetal.,NucleicAcidsResearch,1610881-10890(1988);Huangetal.,CABI0S,8:155-165(1992);以及Pearsonetal.,MethodsinMolecularBiology,24307-331(1994)。Altschuletal.,J.Mol.Biol.,215:403_410(1990)对序列比对方法禾口同源性计算做了详细描述。在优选的实施方案中,利用已经并入GCG软件包中GAP程序的Needleman(同上)算法测定两条氨基酸序列间的百分比同源性,所述算法利用BL0SUM62矩阵或PAM250矩阵且缺口权重为16、14、12、10、8、6或4以及长度权重为1、2、3、4、5或6。在再一个优选的实施方案中。利用GCG软件包中的GAP程序,利用NWSgapdna.CMP矩阵和缺口权重为40、50、60、70或80以及长度权重为1、2、3、4、5或6,测定两条核苷酸序列间的百分比同源性。特别优选的一组参数(以及如果专业人员不确定应该用哪个参数测定一个分子是否位于要求的同源性限制内,应该使用的参数)是BL0SUM62评分矩阵,缺口罚分为12,缺口延伸罚分为4,移码缺口罚分为5。本发明也提供了编码多于一种多肽的分离的核酸,其中每种多肽包含、组成基本上为或组成为选自下述的氨基酸序列仏)01^、01动、01化、01劝或01动(氨基酸序列;03)01eA、01eB、01eC、01eD、或OleBC氨基酸序列的同源物;(c)OleA,OleB,OleC,OleD或OleBC氨基酸序列的保守变体,包含一个或多个氨基酸取代;以及(d)与OleA、OleB、OleC、OleD或OleBC的氨基酸序列具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性的氨基酸序列。分离的核酸可以编码第一多肽和第二多肽,其中第一和第二多肽中的每一个都包含、组成基本上为或组成为选自下述的氨基酸序列(a)OleA、OleB、OleC、OleD或OleBC氨基酸序列;(b)OleA、OleB、OleC、OleD或OleBC氨基酸序列的同源物;(c)OleA、OleB、OleC、OleD或OleBC氨基酸序列的保守变体,包含一个或多个氨基酸取代;以及⑷与OleA、OleB、OleC、OleD或OleBC的氨基酸序列具有至少约(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性的氨基酸序列。例如,分离的核酸可以编码第一多肽和第二多肽,其中第一和第二多肽中的每一个都包含、组成基本上为或组成为选自下述的氨基酸序列(a)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO22,SEQIDNO88,SEQIDNOs:135-464和SEQIDNOs478-487;(b)SEQIDNO:2、SEQIDN0:4、SEQIDN0:6、SEQIDNO:8、SEQIDN0:10、SEQIDNO:12、SEQIDN0:14、SEQIDNO16,SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:88、SEQIDNOs135-464合SEQIDNOs478-487;c)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO22,SEQIDNO88,SEQIDNOs:135-464和SEQIDNOs478-487的保守变体,其包含一个或多个氨基酸取代;以及(d)与SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDN0:8、SEQIDNO10,SEQIDNO:12、SEQIDNO14,SEQIDNO16,SEQIDNO18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:88、SEQIDNOs135-464和SEQIDNOs478-487具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)序列同一性的序列。分离的核酸可以编码第一多肽、第二多肽以及第三多肽,其中第一、第二和第三多肽中的每一个都包含、组成基本上为或组成为选自下述的氨基酸序列(a)01eA、OleB,OleC,OleD或OleBC氨基酸序列;(b)01eA、OleB,OleC,OleD或OleBC氨基酸序列的同源物;(c)OleA,OleB,OleC,OleD或OleBC氨基酸序列的保守变体,包含一个或多个保守氨基酸取代;以及(d)与01eA、01eB、01eC、01eD或OleBC氨基酸序列具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)序列同一性的氨基酸序列。例如,分离的核酸可以编码第一多肽、第二多肽以及第三多肽,其中第一、第二和第三多肽中的每一个都包含、组成基本上为或组成为选自下述的氨基酸序列(a)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:88、SEQIDNOs135-464和SEQIDNOs478-487;(b)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDN0:18、SEQIDNO20、SEQIDNO22、SEQIDNO88、SEQIDNOs135-464和SEQIDNOs478-487;(c)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO20,SEQIDNO:22、SEQIDNO88,SEQIDNOs:135-464和SEQIDNOs478-487的保守变体,包含一个或多个保守氨基酸取代;以及(d)与SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO8,SEQIDNO10,SEQIDNO12、SEQIDNO14、SEQIDNO16,SEQIDNO18,SEQIDN0:20、SEQIDNO:22、SEQIDNO:88、SEQIDNOs:135_464和SEQIDNOs478-487具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)序列同一性的序列。分离的核酸可以编码第一多肽、第二多肽、第三多肽和第四多肽,其中第一、第二、第三和第四多肽中的每一个都包含、组成基本上为或组成为选自下述的氨基酸序列(a)OleA,OleB,OleC,OleD或OleBC氨基酸序列;(b)OleA,OleB,OleC,OleD或OleBC氨基酸序列的同源物;(c)01eA、01eB、01eC、01eD或OleBC氨基酸序列的保守变体,包含一个或多个保守氨基酸取代;以及(d)与01eA、01eB、01eC、01eD或OleBC氨基酸序列具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)序列同一性的氨基酸序列。例如,分离的核酸可以编码第一多肽、第二多肽、第三多肽和第四多肽,其中第一、第二、第三和第四多肽中的每一个都包含、组成基本上为或组成为选自下述的氨基酸序列(a)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDN0:10、SEQIDN0:12、SEQIDNO14、SEQIDN0:16、SEQIDN0:18、SEQIDNO:20、SEQIDNO22,SEQIDNO88,SEQIDNOs:135-464和SEQIDN0s478_487;(b)SEQIDNO:2、SEQIDN0:4、SEQIDN0:6、SEQIDN0:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO16,SEQIDNO18,SEQIDNO20,SEQIDNO22,SEQIDNO:88、SEQIDNOs135-464和SEQIDNOs478-487;(c)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDN0:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:88、SEQIDNOs135-464和SEQIDNOs478-487的保守变体,包含一个或多个保守氨基酸取代;以及(d)与SEQIDNO:2、SEQIDNO:4、SEQIDN0:6、SEQIDN0:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDN0:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:88、SEQIDNOs:135-464和SEQIDNOs478-487具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)序列同一性的序列。分离的核酸可以编码具有约1500个氨基酸残基、约1400个氨基酸残基、约1300氨基酸残基、约1200个氨基酸残基、约1100个氨基酸残基、约1000个氨基酸残基、约900个氨基酸残基、约800个氨基酸残基、约700个氨基酸残基、约600个氨基酸残基、约500个氨基酸残基、约400个氨基酸残基或约300个氨基酸残基的多肽。在优选的实施方案中,分离的核酸编码具有不超过约1500(如不超过约1500、1400、1300、1200、1100、1000、900、800、700、600、500、400、300或200)个氨基酸残基的多肽。分离的核酸可以编码具有至少约100个氨基酸残基的多肽。例如,分离的核酸可以编码具有至少约200个氨基酸残基、至少约250个氨基酸残基或至少约300个氨基酸残基的多肽。可选地,分离的核酸可以编码具有不少于100(如不少于100、150、200或250)个氨基酸残基的多肽。分离的核酸可以编码介于约200个氨基酸残基和约1500个氨基酸残基之间、介于约300个氨基酸残基和约1000个氨基酸残基之间、介于约500个氨基酸残基和约800氨基酸残基之间或介于约600个氨基酸残基和约1000氨基酸残基之间的多肽。分离的核酸可以从细菌、植物、昆虫、酵母、真菌或动物(例如哺乳动物)中分离。当从细菌中分离核酸时,细菌可以是任何属的细菌。例如,细菌可以是选自以下的属feJt^M(Anaeromyxobacter)>^M(Arthrobacter)、虫至弓iH胃M(Bdellovibrio)、胃^|ifM(Blastopirellula)>^Eitf|ifM(Brevibacterium)、白克氏菌属(Burkholderia)>Candidatus、绿曲挠丝状菌属(Chloroflexus)、棒形杆菌属(Clavibacter)、梭菌属(Clostridium)、科尔韦尔氏菌属(Colwellia)、聚集杆菌属(Congregibacter)、脱硫杆菌属(Desulfatibacillum)、脱硫球菌属(Desulfococcus)、脱硫小杆菌属(Desulfotalea)、脱硫单胞菌属(Desulfuromonas)、黄杆菌目(Flavobacteriales)、出芽菌属(Gemmata)、地杆菌属(Geobacter)、河氏菌属(Hahella)、Jannaschia、动球菌属(Kineococcus)、粘Ji^tMMM(Lentisphaera)>#ff^M(Maricaulis)>^ff^M(Marinobacter)>微球菌属(Micrococcus)、微颤菌属(Microscilla)、莫里特拉氏菌属(Moritella)、分枝杆菌属(Mycobacterium)、奈瑟菌属(Neisseria)、诺卡氏菌属(Nocardia)、丰佑菌科(Opitutaceae)、丰佑菌属(Opitutus)、类芽胞杆菌属(Paenibacillus)、粘土杆菌属(Pelobacter)、发光杆菌属(Photobacterium)、光杆状菌属(Photorhabdus)、浮霉菌属(Planctomyces)、Plesiocystis、假交替单胞菌属(Pseudoalteromonas)、7令单胞菌属(Psychromonas)、劳尔氏菌属(Ralstonia)、红球菌属(Rhodococcus)、红小梨形菌属(Rhodopirellula)、玫瑰变色菌属(Roseovarius)、希瓦氏菌属(Shewanella)、寡养单胞菌属(Stenotrophomonas)、链霉菌属(Streptomyces)、黄单胞菌属(Xanthomonas)以及木杆菌属(Xylella)。更具体来说,核酸可以从选自下述的任何细菌中分离粘球菌(Anaeromyxobacter)、金黄节杆菌、氯酚节杆菌、节杆菌FB24、噬菌蛭弧菌、Blastopirellulamarina、亚麻短杆菌、须芒草伯克氏菌、洋葱伯克氏菌、Burkholderiaoklahomensis、类鼻疽伯克氏菌、伯克氏菌383、CandidatusKueneniastuttgartiensis、聚集绿曲挠丝状菌、橙色绿曲挠丝状菌、密执安棒形杆菌密执安亚种、密执安棒形杆菌坏冑亚禾中、^_lif、Colwelliapsychrerythraea>Congregibacterlitoralis、L—U兑硫菌、食油脱硫球菌、Desulfotaleapsychrophila、氧化乙酸脱硫单胞菌、黄杆菌目细菌、Gemmataobscuriglobus、Geobacterbemidjiensis、Geobacterlovleyi、地杆菌FRC-32、Geobacteruraniumreducens、Hahellachejuensis、Jannaschiasp.CCS1、Kineococcusradiotolerans>Lentisphaeraaraneosa>Maricaulismaris、Marinobacteralgicola>Marinobacteraquaeo1ei>j^H^Sjc|if>Microscillamarina>^M#fel5|if杆菌、海分枝杆菌、分枝杆菌GP1、结核分枝杆菌、Mycobacteriumvanbaalenii、淋病奈瑟菌、皮诺卡菌、丰佑菌科细菌、Opitutusterrae、类芽孢杆菌JDR-2、产丙酸粘土杆菌、深海发光杆菌、深海发光杆菌、发光光杆状菌(Photorhabdusluminescens)、Planctomycesmaris、Plesiocystispacifica>M^IfIfi|if>Psychromonasingrahamii>冷单胞菌CNPT3、皮氏罗尔斯顿菌、紫红红球菌、红球菌、Rhodopirellulabaltica、RoseovariusnubinhibensISM、亚马逊希瓦氏菌SB2B、波罗的海希瓦氏菌0S155、波罗的海希瓦氏菌、海底希瓦菌、反硝化希瓦氏菌、冷海希瓦氏菌、Shewanellahalifaxensis、Shewanellaloihica、Shewanellaoneidensis、Shewanellapealeana、腐败希瓦氏菌、Shewanellasediminis、希瓦氏菌(Shewanellasp.)ANA-3、希瓦氏菌(Shewanellasp.)MR_4、希瓦氏菌(Shewanellasp.)MR_7、希瓦氏菌(Shewanellasp.)W3-18_l、Shewanellawoodyi、嗜麦芽窄食单胞菌、产二素链霉菌、地毯草黄单胞菌、野油菜黄单胞菌、水稻黄单胞菌和苛养木杆菌。在优选的实施方案中,核酸分离于嗜麦芽窄食单胞菌(如嗜麦芽窄食单胞菌ATCC17679、嗜麦芽窄食单胞菌ATCC17674、嗜麦芽窄食单胞菌ATCC17445、嗜麦芽窄食单胞菌ATCC17666、嗜麦芽窄食单胞菌K279a或嗜麦芽窄食单胞菌R551-3)菌株。对于特定目的物种,当没有基因组序列可以利用时,利用标准PCR方法,可以从基因组DNA中扩增相关的序列。简而言之,通过许多公知方法中的任何一种从目的细胞中提取DNA0Sambrooketal.,同上,禾口Ausubeletal.,CurrentProtocolsinMolecularBiology,GreenePubl.Assoc.&Wiley_Intersciences(1989),提供了DNA分离方法的描述。通常,任何生物可以用作此类DNA的来源。提取的DNA随后用作进行聚合酶链式反应的模板。PCR中可能需要使用简并引物。PCR的方法和条件描述于例如PCRProtocols,AGuidetoMethodsandApplications(PCR实验方案,方法和应用指南),Innisetal.(eds.),AcademicPress,Inc.,SanDiego,California,1990中。根据待扩增的具体基因,选择扩增引物。所用引物的具体实例显示于下文的表14中。然而,这些引物仅是说明性的。本领域普通技术人员应该理解,由oleA、0leB、0leC、oleBC和oleD核酸序列可以衍生出许多不同的引物。为了适应不同长度和组成的引物和扩增子,需要改变扩增条件。此类考虑在本领域内是公知的,并且在例如PCRProtocols,AGuidetoMethodsandApplications(PCR实验方案,方法和应用指南),Innisetal.(eds.),AcademicPress,Inc.,SanDiego,California,1990中做了讨论。对通过这些扩增程序获得的PCR产物进行测序,可以用来协助证实扩增的序列,并提供有关这种序列在不同物种中的天然变异。衍生于所提供的OleA、OleB,OleC,OleBC和OleD序列的寡核苷酸,可用于这类测序方法中。紧密相关的直系同源的OleA、OleB,OleC,OleBC和OleD序列与公开的OleA、OleB,OleC,OleBC和OleD序列可以共享至少约30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,98%,99%或99.5%的序列同一性(参阅例如表1和2)。在优选的实施方案中,核酸选自SEQIDNO=USEQIDNO3,SEQIDNO:5、SEQIDN0:7、SEQIDN0:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO19,SEQIDNO:21、SEQIDNO:23禾口SEQIDNO:87。本文也公开了重组的核酸构建体,其包括一个或多个分离的核酸,所述分离的核酸编码Ole蛋白、Ole蛋白同源物、Ole蛋白保守变体和/或与Ole蛋白具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)序列同一性的序列。示例性的重组核酸构建体包括克隆载体、表达载体、或合成的操纵子。本文所用的术语“载体”指能转运与其连接的另一个核酸的核酸分子。一种类型的可用载体是附加体(即能进行染色体外复制的核酸)。可用的载体是能自主复制和/或表达与其连接的核酸的载体。能指导与其可操作地连接的基因表达的载体在本文中称为“表达载体”。通常,重组DNA技术中所用的表达载体经常采用“质粒”的形式,其通常指环状双链DNA环,其处于载体形式时不与染色体结合。本文所用“质粒”和“载体”可以交换使用,因为质粒是最常用的载体形式。然而,也包括发挥等同功能且随后在本领域内目前已知的其他形式的表达载体。克隆载体和表达载体都含有允许载体在一种或多种适宜的重组生物中复制的核苷酸序列。在克隆载体中,这种序列通常是能使载体不依赖于重组生物的染色体复制的序列,且还包括复制起点或自主复制序列。各种细菌和病毒的复制起点是公知的,包括但不限于pBR322来源的ColEl复制子、P15A复制子、pCloDF13复制子、pKN402复制子、pMBl(pUC)复制子、PSClOl复制子和SV40、多瘤病毒、腺病毒、VSV以及BPV病毒复制起点。利用包含分离核酸的重组表达载体,可以用本文公开的核酸产生蛋白。可以使用种类繁多的表达载体。例如,质粒、染色体、附加体和病毒来源的载体,包括衍生于细菌质粒、细菌噬菌体、酵母附加体、酵母染色体元件、病毒的载体,所述病毒是诸如杆状病毒、乳多空病毒(诸如SV40)、疫苗病毒、腺病毒、禽痘病毒、伪狂犬病病毒和逆转录病毒,以及衍生于上述组合的载体,诸如衍生于质粒和细菌噬菌体基因元件的载体,如粘粒和噬菌粒。通常,适宜维持、增殖、或表达多核苷酸以便在重组生物中表达多肽的任何载体,就此而言可以用于表达。因此,可以使用在重组生物中能复制且存活的任何其他载体。细菌表达载体的非限制性实例包括PKK223-3和pTrc99A,其携带trp-lac启动子;pUC、pTZ、PSK和pGEM,其携带Iac启动子;pET载体及其衍生物,其含有T7启动子;以及pHUB系列载体、pPLc系列载体、pKC30、pASl、pRMl/pRM9以及pTrxFus,它们都含有细菌噬菌体λ启动子。其他的示例性载体包括PATH系列载体、pBAD系列载体、pBEc系列载体、pCAL系列载体、PCRT7系列载体、pGAL、pGEX和其衍生物、pLEX系列载体、pMAL系列载体、pOSEX系列载体、PQE系列载体、pRSET系列载体以及TriEx系列载体。适宜在酿酒酵母中表达核酸的载体包括,例如PAD-GAL4和其衍生物、pBridge、pCM和其衍生物、pEMBLY系列载体、pESC和其衍生物、PFL系列载体、pSZ62、pYC2和pYC6系列载体以及YIP系列质粒。通过多种公知的常规技术中的任何一种,将适当的核酸序列插入载体。通常,通过用一种或多种限制核酸内切酶切割核酸序列和表达载体,随后利用T4-DNA连接酶将限制片段连接在一起,将待表达的核酸序列连接于表达载体。用于限制性切割和连接的方法在本领域内是公知的。有关此的适宜方法以及利用替代技术构建表达载体的适宜方法,所述替代技术在本领域内也是公知的,在Sambrooketal.(同上)中有非常详细的描述。这些替代技术的非限制性实例包括,例如,借助重组酶或拓扑异构酶并入核酸序列。利用诸如SOEPCR、DNA合成、平末端连接、或在限制酶位点连接的常规技术,可以修饰核酸序列或将其连接在一起。如果没有适宜的限制位点,则可以利用合成的寡核苷酸适体或连接子(参阅,例如Sambrooketal.,同上;Ausubeletal.,同上)。本领域普通技术人员应该意识到,许多启动子可以在细胞中发挥功能,并在文献中已有描述,包括组成性、诱导性、发育调节以及环境调节启动子。使用在适当重组生物中发挥功能的启动子(也称为转录起始区)特别有利。例如,如果用E.coli作为重组生物,可以使用的示例性的启动子包括但不限于噬菌体λPL启动子、E.colilac、trp、trc和tac启动子、SV40早期和晚期启动子、反转录病毒LTRs启动子以及CaMV35S启动子。如果酿酒酵母是宿主,则目的序列通常受酵母启动子的调控。可用的酵母启动子的非限制性实例包括GAL/CYC启动子。本文中未曾提及的、本领域普通技术人员已知的任何适宜的启动子,都可以很容易地用于本文所述的本发明中。例如,可以使用已知调控原核或真核细胞中基因表达的其他启动子。表达载体也可以含有翻译起始的核糖体结合位点和转录终止位点。载体也可以含有可用于扩增基因表达的序列。本发明提供了包含启动子的分离的核酸,所述启动子可操作地连接于编码多肽的核酸。优选地,其启动子是诱导型启动子、组成型启动子或细胞特异性启动子。在优选的实施方案中,启动子是T7启动子。在另一个优选的实施方案中,启动子是pTrc启动子、PxylA启动子、Pgrac启动子、GALl启动子或GALlO启动子。本文所用术语“可操作地连接”意指所选的核苷酸序列(如编码本文所述的多肽)紧密接近启动子,以允许启动子调节所选DNA的表达。另外,在转录和翻译方向上,启动子位于所选核苷酸序列的上游。所谓“可操作地连接”意指,当适当的分子(如转录激活蛋白)结合于调控序列时,核苷酸序列和该调控序列的连接方式使得基因被表达。也可以在表达构建体中提供调节转录终止区。转录终止区可由编码Ole蛋白序列的载体序列提供,或使用与转录起始区天然相关的转录终止区。能在重组生物中终止转录的任何便利的转录终止区,都可以用于本文公开的构建体中。表达载体和克隆载体可以,且通常的确含有具有用于在重组生物中表达的必要调节区的结构基因或选择标记,以便选择转化细胞。基因可以提供对细胞毒性剂(如抗生素、重金属、或毒素)的抗性、为营养缺陷型宿主提供原养型性的互补性、病毒免疫性等。取决于引入了表达构建体或其组分的不同宿主物种的数量,可使用一种或多种标记,其中对于不同的宿主,采用不同的选择条件。适宜的选择标记的具体、非限制性实例包括赋予针对下述物质的抗性的基因博来霉素、红霉素、庆大霉素、草甘膦、潮霉素、卡那霉素、甲氨蝶呤、萘啶酸、腐草霉素、草铵膦(phosphinotricin)、壮观霉素、链霉素、磺胺药物、磺酰脲、氨苄青霉素/羧苄青霉素、氯霉素、链霉素/壮观霉素或四环素。适宜的选择标记的另一个实例是营养缺陷型选择标记基因,诸如组氨酸选择标记基因。标记的具体、非限制性实例包括但不限于,碱性磷酸酶(AP)、myc、血凝素(HA)、13葡糖苷酸酶(GUS)、荧光素酶以及绿色荧光蛋白(GFP)。优选,分离的核酸还包含与编码多肽的核酸偶联的选择标记。选择标记可以是氨苄青霉素/羧苄青霉素抗性、卡那霉素抗性、氯霉素抗性、红霉素抗性、链霉素/壮观霉素抗性或组氨酸营养缺陷型选择标记基因。另外,表达载体也可以含有可操作地连接于蛋白的核苷酸序列的标记序列,所述蛋白的核苷酸序列编码用作标记的其他蛋白。结果就是包含两个连接且不同的蛋白的杂交或融合蛋白。标记蛋白可以为表达载体产生的重组蛋白提供例如免疫学或酶标记。另外,可以通过加入一个序列来修饰多核苷酸的末端,所述序列编码的氨基酸可用于纯化所产生的蛋白。例如,可以包括上这样的DNA序列,所述DNA序列编码的氨基酸序列赋予对特定色谱方法的亲和性。为了向蛋白加入此类亲和纯化部分,已经设计了各种方法。代表性的实例可见于美国专利第4,703,004,4,782,137,4,845,341,5,935,824和5,594,115号中。可以使用用于加入编码纯化部分的核苷酸序列的本领域中已知的任何方法(参阅,例如Sambrooketal.,同上)ο特别是,本发明提供了重组构建体,其包括一种或多种编码Ole蛋白或其变体和同源物的分离的核酸。构建体可以包括已经正向或反向插入序列的载体,诸如质粒或病毒载体。重组构建体还可以包括调节序列,包括例如,可操作地连接于序列的启动子。大量适宜的载体和启动子是已知的,并且可购买获得。在一个实施方案中,使用pET-21b(+)、pC0LADuet-l、pCDFDuet-l、pcDNA3.1(+)、pCMVSP0RT6.1(Invitrogen)载体,或本文所述的任何载体。然而,可以使用任何适宜的质粒或载体,只要它们在宿主中可以复制和存活。本发明提供了包含分离的核酸的载体。例如,载体可以是质粒。优选,载体是选自pET21b(+)、pCOLADuet-1、pCDFDuet-1、pACYCDuet-1、pACYCpTrc、pCL1920pTrc、pESC-HIS、pSUP104、pMM1522、pWH1520和pHTOl的质粒。在优选的实施方案中,载体是选自pET21b(+)、pC0LADuet-l、pCDFDuet-l、pWH1520、pHT01、pESC-HIS、pET-21d(+)、pETDuet_l、pACYCDuet-1、pTrcHis2A、pMAL_c2X或pCL1920pTrc的质粒。使各自核酸整合至任何有生命的生物的染色体的重组DNA技术,可以导致各自蛋白的表达和产生,所述核酸分别编码OleA(例如SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDN0:8、SEQIDNO:10、SEQIDN0:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:88、SEQIDNOs135-464和SEQIDN0s478-487)、01eB(例如SEQIDNO10和SEQIDNOs:230_326)、01eC(例如SEQIDNO6、SEQIDNO:14、SEQIDNO20,SEQIDNO:88禾口SEQIDNOs:327_402)、OleD(例如SEQIDNO:8、SEQIDNO:16、SEQIDNO:22、SEQIDNOs142-149和SEQIDNOs403-464)、OleBC(例如SEQIDNOs:135_141)和/或这些序列的变体和同源物。分离的核酸也可以是表达盒(expressioncassette)的一部分,所述表达盒最低包括启动子、一个或多个编码01eA、01eB、01eC、01eD或OleBC的分离的核酸以及在重组生物中发挥功能的转录终止信号序列。启动子可以是本文所讨论的任何类型,例如,诱导型启动子或组成型启动子。表达盒还可以包括能指导所产生的蛋白转运的可操作地连接的靶向序列或转运或分泌肽编码区。表达盒还可以包括编码选择标记和/或纯化部分的核酸序列。可以将调节序列、编码序列或其组合引入宿主菌株基因组或在其中进行改变。在一些实例中,将所需重组序列整合到重组生物的基因组序列中,不需要使用选择标记,如抗生素。在一些实例中,基因组改变包括通过用对调节不敏感的启动子代替天然启动子来改变靶基因(如0leA、0leB、0leC、0leBC或oleD)的调控序列。有许多方法可实现这种操作。例如,ValleandFlores,MethodsMol.Biol.267:113_122(2006)描述了在Ε.coli中超表达染色体基因的基于PCR的方法。另一个方法是利用Costantinoetal.,Proc.Nat.Acad.Sci.10015748-15753(2003)研发的技术,基于使用直接在染色体中产生特异性突变的单链寡核苷酸。这种技术基于利用来自细菌噬菌体λ的β蛋白的超表达,增加基因重组。这种方法的优势是,可以使用长度为70或更多个碱基的合成的寡核苷酸产生点突变、插入和缺失。这种方法排除了克隆步骤。此外,该系统非常有效,以至于不需要标记来分离期望的突变。此外,这种方法还可以用于超表达内源性编码序列,诸如编码01eA、01eB、01eC、01eD、OleBC或脂肪酸生物合成途径酶的内源性编码序列。本发明提供了还包括至少一种其他核酸序列的分离的核酸,所述其他核酸序列选自(a)可操作地偶联于编码多肽的核酸的调节序列;(b)可操作地偶联于编码多肽的核酸的选择标记;(c)可操作地偶联于编码多肽的核酸的纯化部分;(d)可操作地偶联于编码多肽的核酸的分泌序列;以及(e)可操作地偶联于编码多肽的核酸的靶向序列。本发明也提供了包含分离的核酸的细胞。特别是,细胞可以包含分离的核酸或包含分离的核酸的载体。利用本领域已知的任何适宜的方法,可以用分离的核酸转化细胞。可选地,利用本领域已知的任何适宜的方法,用载体转染细胞。本文所用术语“转染”意指通过核酸介导的基因转移将核酸(例如经由表达载体)引入受体细胞。本文所用的“转化”指由于细胞吸收外源性DNA或RNA,细胞基因型被改变的过程。这可以导致表达重组形式的RNA或多肽的转化细胞。在被转移基因反义表达的情况下,天然存在形式的多肽的表达被破坏。细胞可以是酵母细胞、真菌细胞、藻类细胞、动物细胞、昆虫细胞、细菌细胞或植物细胞。细胞可以是古细菌细胞(Archaeacell)。在一个实施方案中,细胞是细菌细胞。细胞可以是选自以下属的任何细胞埃希氏菌属(Escherichia)、芽孢杆菌属(Bacillus)、乳杆菌属(Lactobacillus)、红球菌属(Rhodococcus)、假单孢菌属(Pseudomonas)、曲霉属(Aspergillus)、木霉属(Trichoderma)、脉抱菌属(Neurospora)、镰孢属(Fusarium)、腐质霉属(Humicola)、根毛霉属(Rhizomucor)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、毛霉属(Mucor)、毁丝霉属(Myceliophtora)、青霉属(Penicillium)、平革菌属(Phanerochaete)、侧耳属(Pleurotus)、栓菌属(Trametes)、金孢属(Chrysosporium)、酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、寡养单胞菌属(Stenotrophamonas)、动球菌属(Kineococcus)、耶罗威雅属(Yarrowia)或链霉菌属(Streptomyces)。具体来说,细胞可以是迟缓芽孢杆菌(Bacilluslentus)细胞、短芽孢杆菌(Bacillusbrevis)细胞、嗜热酯肪芽孢杆菌(Bacillusstearothermophilus)细胞、地衣芽包杆菌(Bacilluslicheniformis)细胞、嗜碱芽孢杆菌(Bacillusalkalophilus)细胞、凝结芽孢杆菌(Bacilluscoagulans)细胞、环状芽孢杆菌(Bacilluscirculans)细胞、短小芽孢杆菌(Bacilluspumilis)细胞、苏云金芽孢杆菌(Bacillusthuringiensis)细胞、克劳氏芽孢杆菌(Bacillusclausii)细胞、巨大芽孢杆菌(Bacillusmegaterium)细胞、枯草芽孢杆菌(Bacillussubtilis)细胞或解淀粉芽孢杆菌(Bacillusamyloliquefaciens)细胞。另外,细胞可以是康宁木霉(Trichodermakoningii)细胞、绿色木霉(Trichodermaviride)细Jl££^Κβ(Trichodermareesei)细|fi、长枝τΚβ(Trichodermalongibrachiatum)^ffl^^ffiβ(Aspergillusawamori)^ftβ(Aspergillusfumigates)M胞、臭曲霉(Aspergillusfoetidus)细胞、构巢曲霉(Aspergillusnidulans)细胞、黑曲霉(Aspergillusniger)细胞、米曲霉(Aspergillusoryzae)细胞、特异腐质霉(Humicolainsolens)细胞、疏棉状嗜热丝孢菌(Humicolalanuginose)细胞、米黑根毛霉(Rhizomucormiehei)细胞或米黑毛霉(Mucormichei)细胞。在优选的实施方案中,细胞是变铅青链霉菌(Str印tomyceslividans)细胞、鼠灰链霉菌(Sti^ptomycesmurinus)细胞、放线菌(Actinomycetes)细胞或大肠杆菌(Escherichiacoli)细胞。大肠杆菌细胞可以是菌株B、菌株C、菌株K或菌株W大肠杆菌细胞。细胞也可以是嗜麦芽窄食单胞菌细胞、(Kineococcusradiotolerans)细胞、巨大芽孢杆菌细胞或酿酒酵母细胞。具体来说,细胞可以是下述物种的任何菌株粘球菌Fwl09_5、金黄节杆菌、氯酚节杆菌、节杆菌FB24、噬菌蛭弧菌、Blastopirellulamarina、亚麻短杆菌、须芒草伯克氏菌、洋葱伯克氏菌、Burkholderiaoklahomensis、类鼻疽伯克氏菌、伯克氏菌383、CandidatusKueneniastuttgartiensis、聚集绿曲挠丝状菌、橙色绿曲挠丝状菌、密执安棒形杆菌密执安亚种、密执安棒形杆菌坏腐亚种、肉毒梭菌、Colwelliapsychrerythraea、Congregibacterlitoralis、*—月兑矹胃、*油脱矹求胃、Desulfotaleapsychrophila、氧化乙酸脱硫单胞菌、黄杆菌目细菌、GemmataobscuriglobusλGeobacterbemidjiensis、Geobacterlovleyi、地杆菌FRC-32、Geobacteruraniumreducens、Hahellachejuensis、Jannaschiasp.CCSlΛKineococcusradiotolerans、Lentisphaeraaraneosa、Maricaulismaris、Marinobacteralgicola、Marinobacteraquaeolei、藤黄微球菌、Microscillamarina、莫里特拉氏菌PE36、鸟分枝杆菌、鸟分枝杆菌副结核亚种、海分枝杆菌、分枝杆菌GP1、结核分枝杆菌、Mycobacteriumranbaalenii、淋病奈瑟菌、皮诺卡菌、丰佑菌科细菌、Opitutusterrae、类芽孢杆菌JDR-2、产丙酸粘土杆菌、深海发光杆菌、深海发光杆菌、Photorhabdusluminescenssubsp.Laumondii、Planctomycesmaris、Plesiocystispacifica、大西洋假交替单胞菌、Psychromonasingrahamii、冷单胞菌CNPT3、皮氏罗尔斯顿菌、紫红红球菌、红球菌、Rhodopirellulabaltica、Roseovariusnubinhibens、亚马逊希瓦氏菌、波罗的海希瓦氏菌、海底希瓦菌、反硝化希瓦氏菌、冷海希瓦氏菌、Shewanellahalifaxensis、Shewanellaloihica、Shewanellaoneidensis>Shewanellapealeana、Shewanellasediminis>#Eft^(Shewanellasp.)ANA-3>#Eft(Shewanellasp.)MR_4、希瓦氏菌(Shewanellasp.)MR_7、希瓦氏菌(Shewanellasp.)W3-18-UShewanellawoodyi、嗜麦芽窄食单胞菌、产二素链霉菌、地毯草黄单胞菌、野油菜黄单胞菌、水稻黄单胞菌和苛养木杆菌。任选地,细胞可以是动物细胞。例如,动物细胞可以选自CHO细胞、COS细胞、VERO细胞、BHK细胞、HeLa细胞、Cvl细胞、MDCK细胞、293细胞、3T3细胞以及PC12细胞。本发明也提供了在参与脂肪酸生物合成途径的基因中包含变异的细胞。本文所用的术语“脂肪酸生物合成途径”意指产生脂肪酸的生物合成途径。脂肪酸生物合成途径包括脂肪酸酶,所述脂肪酸酶可如本文所述进行改造产生脂肪酸,并且在一些实施方案中可以与其他的酶一起表达,产生具有期望的碳链特征的脂肪酸。本文所用“脂肪酸酶”意指参与脂肪酸合成的任何酶。脂肪酸酶可以在宿主细胞中表达或超表达,产生脂肪酸。脂肪酸酶的非限制性实例包括脂肪酸合酶以及硫酯酶。例如,细胞可以超表达酰基-CoA合酶(EC6.2.1.3,2.3.1.86)、硫酯酶(EC3.1.2.-,3.1.1.15,3.1.2.14)、乙酰-CoA羧化酶(EC6.4.1.2,6.3.4.14)、酰基载体蛋白、丙酮酸脱氢酶(EC1.2.4.1)、乙醛脱羧酶(EC4.1.99.5)、β-羟癸酰硫酯脱水酶(EC4.2.1.60)、3-氧酰基-[酰基载体蛋白]合酶I(EC2.3.1.41),[酰基载体蛋白]S_丙二酰基转移酶(EC2.3.1.39)、3-氧酰基-[酰基载体蛋白]还原酶(EC1.1.1.100)、3_氧酰基_[酰基载体蛋白]合酶III(EC2.3.1.180)、烯酰基-[酰基载体蛋白]还原酶(EC1.3.1.9)、(3R)_羟十四酰酰基载体蛋白脱水酶(EC4.2.1.-)、脂酶(EC3.1.1.3)、丙二酰-CoA脱羧酶(EC4.1.1.9,4.1.1.41)、天冬氨酸1_脱羧酶(EC4.1.1.11)、泛酰酸激酶(EC2.7.1.33)、丙酮酸脱氢酶(EC1.2.4.1)、吡啶核苷酸转氢酶(EC1.6.1.1)以及其组合。除了超表达一种或多种肽从而产生含有脂酰链的底物外,细胞还可以具有一种或多种功能上发生缺失、突变、或弱化的肽。本文所用术语“弱化”意指减弱、减少或变小。例如,通过修饰多肽减少其活性(例如通过修饰编码多肽的核苷酸序列),可以使多肽弱化。例如,下述酶中的一种或多种可以被缺失、突变或弱化乙酸激酶(EC2.7.2.1)、醇脱氢酶(EC1.1.1.1,1.2.1.10)、3-氧酰基-[酰基载体蛋白]合酶II(EC2.3.1.179)、FabR转录阻抑物(登录号NP_418398)、酰基-CoA脱氢酶(EC1.3.99.3,1.3.99.-)、生物合成sn-3-磷酸甘油脱氢酶(EC1.1.1.94)、乳酸脱氢酶(EC1.1.1.28)、甲酸乙酰基转移酶(EC2.3.1.54)、酰基转移酶(EC2.3.1.15)、丙酮酸氧化酶(EC1.2.2.2)以及磷酸转乙酰酶(EC2.3.1.8)。在一些实例中,细胞可以产生分支的产物,包括含有脂酰链的底物、烃以及烃中间体。因此,可以改造细胞,以利用超表达肽增加分支,所述肽选自支链酮酸脱氢酶复合物(EC1.2.4.4)的一种或多种成分、支链氨基酸转氨酶(EC2.6.1.42)、二氢硫辛酰胺脱氢酶(E3)(EC1.8.1.4)、巴豆酰-CoA还原酶(EC1.6.5.5,1.1.1.1)、异丁酰-CoA变位酶亚基A(EC5.4.99.2)、异丁酰-CoA变位酶亚基B(5.4.99.2)、β-酮脂酰-ACP合酶III(EC2.3.1.180)、β-酮脂酰-ACP合酶II(EC2.3.1.179)、酰基载体蛋白(NP_823468)、烯酰-CoA还原酶(EC1.3.1.34)、烯酰-CoA异构酶(EC4.2.1.-)和其组合。含有脂酰链的底物、烃以及烃中间体的饱和水平,可以通过改造细胞使之超表达肽来改变,所述肽选自3_氧酰基_[酰基载体蛋白]合酶I(EC2.3.1.41)、反式-2-烯酰-ACP还原酶II(EC1.3.1.9)、烯酰-(酰基载体蛋白)还原酶(EC1.3.1.9)、反式-2、顺式-3-癸烯酰-ACP异构酶(4.2.1.17)、酰基-CoA脱氢酶(EC1.3.99.3,1.3.99.-)和其组合。除了改造细胞产生烃或烃中间体外,也可以调节环境条件诸如温度来改变所产烃的类型。例如,较低的温度可以用来在烃中产生更高数量的双键,较高的温度可以导致更高的饱和度。1962年,Marr和Ingraham出版了一篇文章,证明温度影响e.coli产生的脂质的饱和程度(Marretal.,JBacteriol.,841260-7(1962))。低温可导致具有更高不饱和程度的脂质的产生,而较高温度则导致更高数量饱和脂质的产生(参阅,例如实施例14)。因此,在生产过程中降低温度,可以改变产物,导致烃或烃中间体中不饱和程度更高。优选,细胞在编码酰基-CoA脱氢酶的基因中包含变异。这种变异可以是编码酰基-CoA脱氢酶基因的缺失、突变或弱化。在另一个优选的实施方案中,细胞在编码硫酯酶的基因中包含变异。这种变异可以是编码硫酯酶基因的超表达。在一些实例中,超表达具有酰基-CoA合酶活性的肽。例如,可以表达、缺失、变异或弱化酰基-CoA合酶,诸如fadD(NP_416319)、fadK(NP_416216)、fadD(YP_045024)、fadD(NP_438551)、BH3103(NP_243969)、yhfL(NP_388908)、Pfl_4354(YP_350082)、fadDl(NP_251989)、fadD2(NP_251990)、fatdD(YP_533919)、RPC_4074(YP_533919)、fadDl(NP_520978)、fadD35(NP_217021)、fadD22(NP_217464)和其组合。酰基-CoA合酶的另一个实例是来自嗜麦芽窄食单胞菌的fadD同源物(ZP_01644857.1)。另外,可以调控硫酯酶的表达,以改变产物的量和/或产物碳链包括脂酰链的长度。例如,可以表达、缺失、变异或弱化硫酯酶,诸如无先导序列的tesA(AAC73596)、tesB(AAC73555)、UcfatB(Q41635,AAA34215)、ChfatB2(Q39513,AAC49269)、ChfatB3(AAC49269,AAC72881)、CcfatB(Q39473,AAC49151)、AtfatB[M141T](CAA85388)、AtfatA(NP189147,NP193041)、ChfatA(AAC72883)、HafatAl(AAL79361)或其组合。任选地,细胞可以包含酰基-CoA合酶或硫酯酶。例如,细胞可以用编码酰基-CoA合酶或硫酯酶的分离的核酸转化。可选地,细胞可以用包含编码酰基-CoA合酶或硫酯酶的分离的核酸的载体转染。可以利用本文公开的分离的核酸和蛋白来改造重组生物,产生具有限定结构特征(如分支程度、饱和度或碳链长度)的烃和脂肪酮。制备烃的一种方法涉及增加一种或多种酰基缩合酶的表达,表达更具活性形式的一种或多种酰基缩合酶(缩合多于一种酰基-CoA、酰基-ACP、酰基-AMP、酰基-酯、脂肪酸或其混合物的酶)。本领域普通技术人员应当理解,此类缩合反应产生的产物随着缩合的酰基链而变化。可以产生的产物包括,例如,烃和烃中间体,如脂肪酮。本领域普通技术人员应当理解,利用体外反应,包括化学和酶促转化,以及通过体内反应,可以产生含有脂酰链和其中间体的底物。另外,可以利用体内和体外转化的组合。而且,通过选择性地提供用于转化的所选底物,诸如脂肪酸、酰基-ACP或酰基-CoA,可以产生特定脂肪酮。可选地,通过选择性地提供用于转化的所选底物,诸如脂肪酸、酰基-ACP、酰基-CoA、脂肪酮、α-烷基-β-酮酸或α-烷基-β-酮酯,可以产生烃。本文所用术语“脂肪酸”意指具有通式RCOOH的羧酸。R代表脂肪基,优选烷基。R可以包含约4到约22个碳原子。脂肪酸可以是饱和的、单不饱和的或多不饱和的。在优选的实施方案中,脂肪酸是有脂肪酸生物合成途径制备的。术语“转化(convert)”或“转化(conversion)”指利用化学手段或生物手段(如反应中的多肽)将第一中间体或底物变为第二中间体或产物。术语“化学转化”指不是由多肽主动促进的反应。术语“生物转化”指由多肽主动促进的反应。转化可以发生于体外、体内或者体外和体内。当利用生物转化时,肽和/或细胞可以固定于支持体上,例如通过化学方式粘附于多聚体支持体上。利用本领域普通技术人员已知的任何反应器,如在批量反应器或连续反应器中,可实现转化。重组生物可以将几种中间体转化为随后的中间体,或者可以供应重组生物将被转化为产物的中间体或使之与将被转化为产物的中间体接触。在某些实例中,使重组生物与诸如酰基-CoA分子的中间体接触,随后该酰基-CoA分子转化成产物。鉴于本文提供的公开内容,Ole蛋白(如OleA,OleB,OleC,OleD和OleBC)和其同源物的大规模酶生产如今是可能的。简而言之,将这些肽或这些肽的同源物中任一种的编码序列(参见,例如图1和2)克隆至高表达质粒,诸如pET-21b(+)、pC0LADuet-l(EMDChemicals,Inc.,Germany)、pWHl520(MoBiTec,Germany)或pHT01(MoBiTec,Germany)中。可以将质粒引入宿主细胞,用于产生酶。随后纯化所得的肽,并在批量生产中使用。当利用体外方法时,供应给反应的肽依赖于起始材料。例如,当需要烃时,将酰基-ACP和/或酰基CoA底物加入含有OleA、OleC和OleD的体外反应混合物中。同样,当起始材料是脂肪酮、α_烷基_β_酮酸或α-烷基-β-酮酯时,体外反应可以使用肽OleC和01eD。当用第一肽将第一中间体转化为第二中间体,且随后用第二肽将第二中间体转化为第三中间体时,可以同时或顺序地将这些肽加入到反应中。在一些顺序加入肽的实例中,可以在加入第二肽之前,移除第一肽。另外,可以利用化学转化和生物转化的组合,产生期望的产物。例如,本领域普通技术人员应当理解,可以经由化学转化将两个脂肪酸缩合产生脂肪酮,随后利用生物转化,可以将所得脂肪酮转化为烃。鉴于本文提供的公开内容,可以在重组细胞中产生脂肪酮、烃和其中间体。重组细胞可以产生一种或多种由OleA、OleB,OleC,OleD,OleBC和其相关序列编码的肽。本领域普通技术人员应当理解,在重组细胞中表达的肽的选择,取决于期望的产物和提供给该细胞的起始材料。例如,如果供应细胞脂肪酮,且期望的产物是烃,则可以用编码OleC和OleD的核苷酸对重组细胞进行改造。本文所述的体内方法也可以与化学转化和体外生物转化组合使用。例如,利用肽,可以将第一中间体体外转化为第二中间体;随后将第二中间体供应给表达将第二中间体转化为第三中间体所需的肽的细胞。在另一个实例中,可以将第一中间体经化学转化转化为第二中间体,随后将第二中间体供应给编码随后转化所需的肽的重组细胞。另外,产物可以利用两个或多个体内反应步骤产生。例如,第一重组细胞可以用来将第一中间体转化为第二中间体。通过例如被动运输、主动运输或细胞裂解,从细胞中释放第二中间体,随后将第二中间体供应给将第二中间体转化为第三中间体的第二重组细胞。在一些实例中,第三中间体是期望的产物。本发明允许大规模产生具有限定碳链长度、饱和水平和分支点的脂肪酮、烃和烃中间体。此类工程分子的产生,提供了多种可用作燃料和特殊化学品的产物。本发明提供了用本文公开的任何核酸(例如编码任何本文公开的多肽序列的核酸序列)转化的或本文公开的任何载体转染的细胞。优选地,细胞产生烃或脂肪酮。烃可以是烯烃。在一个实施方案中,烃或脂肪酮被细胞分泌出来。在优选的实施方案中,细胞包含编码OleA的分离的的核酸。具体来说,包含编码OleA的分离的核酸的细胞可以是酿酒酵母细胞。本发明提供了产生烃的方法,包括用底物在足以产生烃的条件下,培养包含本文公开的任何分离的核酸(如编码本文公开的任何多肽序列的核酸序列)的任何细胞。例如,底物可以是碳源、脂肪酸、酰基-CoA、酰基-AMP、酰基-ACP、α-烧基-β-酮酸、α-烷基-β-酮酯或脂肪酮。优选地,细胞的生产率是至少约5mg/L/0D_、至少约8mg/L/0D_、至少约15mg/L/0D6QQ、至少约20mg/L/0D6QQ或至少约30mg/L/0D6(1。。本发明还提供了产生烃的方法,包括用底物在足以产生烃的条件下,培养包含本文公开的分离的核酸(如编码本文公开的任何多肽序列的核酸序列)的任何细胞,并包括分离烃。可以从细胞或从培养细胞的培养基中分离烃。底物可以是,例如,碳源、脂肪酸、酰基-CoA、酰基-AMP、酰基-ACP、α-酰基1-β-酮酸、α-酰基-β-酮酯或脂肪酮。本发明提供了产生烃的方法,包括用底物(例如碳源、脂肪酸、酰基-CoA、酰基-AMP。酰基-ACP、α-烧基-β-酮酸、α-烧基-β-酮酯或脂肪酮)在足以产生烃的添加下培养含有本文公开的分离的核酸(如编码本文公开的任何多肽序列的核酸序列)的任何细胞,还包括裂化或提纯烃。所述方法可以产生单不饱和或多不饱和(如双不饱和、三不饱和等)的烃。烃的碳链长度可以是约10-约40个碳。例如,烃链的长度可以是介于约15至约35、约17-约34、18至约33、约19-约33个碳,介于约27至约33个碳,介于约29至约31个碳或约19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个碳。本发明提供了产生脂肪酮的方法,包括用底物在足以产生脂肪酮的条件下培养包含本文公开的分离的核酸(如编码本文公开的人恶化多肽序列的核酸序列)的任何细胞。例如,底物可以是碳源、脂肪酸、酰基-CoA、酰基-AMP、酰基-ACP、α-烷基-β-酮酸或α-烧基-β-酮酯。优选地,细胞的产率为至少约0.lmg/L/0D6(1(1、至少约lmg/L/0D_、至少约3mg/L/0D6QQ、至少约6mg/L/0D6QQ、至少约9mg/L/0D6(1(1或至少约12mg/L/0D6(1。。本发明还提供了产生脂肪酮的方法,包括用底物在足以产生脂肪酮的条件下培养包含本文公开的分离的核酸的任何细胞,并包括分离脂肪酮。脂肪酮可以从细胞或从培养细胞的培养基中分离。所述方法可以产生饱和的、单不饱和或多不饱和(如双不饱和、三不饱和等)脂肪酮。脂肪酮的碳链长度可以是约10至约40个碳。例如,脂肪酮的碳链长度可以是介于约15至约35、约17至34、18至约33、约19至约33个碳,介于约23至约29个碳、介于约25至约27个碳或约19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个碳。本发明还提供了产生纯化的多肽的方法,包括在足以产生分离的核酸编码的多肽的条件下培养包含本文公开的分离的核酸的任何细胞。多肽特别是01eA、01eB、01eC、01eD或OleBC。本文所用术语“纯化(purify)”、“纯化的(purified),,或“纯化(purification),,意指通过分离或隔离从分子的环境中移出或分离该分子。“基本上纯化的”分子是至少约60%、优选至少约75%、并更优选至少约90%不合与其相关的其他组分。本文所用的这些术语也指从样品中除去污染物。例如,除去污染物可以导致样品中烯烃百分比的增加。例如,当在宿主细胞中产生烯烃时,可以通过除去宿主细胞蛋白来纯化烯烃。纯化后,样品中烯烃的百分比得以提高。本文所用术语“纯化(purify)”、“纯化的(purified),,或“纯化(purification),,不需要绝对的纯度。它们是相对的术语。因此,例如,当在细胞中产生多肽时,纯化的多肽是基本上与其它细胞组分(如核酸、脂质、碳水化合物或烃)分开的肽。在另一个实例中,纯化的烯烃制品是基本上不含污染物(诸如发酵后可能存在的污染物)的烯烃。在一些实施方案中,样品重量百分比的至少约50%是由烯烃组成时,烯烃是纯化的。在其他实施方案中,当样品重量百分比至少约60%、70%、80%、85%、90%、92%、95%、98%或99%或更多由烯烃组成时,烯烃是纯化的。本发明提供了产生脂肪酮的方法,包括在足以产生脂肪酮的条件下孵育底物和OleA0特别是,底物可以包含酰基_CoA、酰基-AMP或酰基-ACP。本发明提供了产生烃的方法,包括在足以产生烃的条件下孵育底物与01eA、01eB、OleC,OleD,OleBC或其组合。底物可以包含酰基_CoA、酰基-AMP或酰基-ACP。用于产生烃的OleA、OleB,OleC,OleD或OleBC蛋白,可以是纯化的或未纯化的蛋白。例如,可以向来自表达ole基因的生物的细胞裂解物中加入酰基-CoA底物,以便产生烃。产生烃的方法可以包括在足以产生烃的条件下孵育底物与OleA和OleD。任选地,所述方法可以包含OleB。所述方法可以包括在足以产生烃的条件下孵育底物与01eA、01eC和OleD。任选地,所述方法可以包含OleB。酰基缩合肽包括利用本文所述方法,能催化酰基-ACP、酰基-CoA、酰基-AMP、脂肪酸和其混合物的缩合的肽。在一些实施方案中,这些酰基缩合肽具有高、中或低底物特异性。在一些实例中,酰基缩合肽底物特异性更高且仅接受特定链长度的底物。另外,本领域普通技术人员应当理解,一些酰基缩合肽还催化其他反应。例如,一些酰基缩合肽除了酰基-CoA、酰基-ACP、酰基-AMP、酰基酯、脂肪酸或其混合物外,还接受其他底物。因此也包括此类非特异性酰基缩合肽。除了表1中提供的OleA序列外,公众可以获得其他酰基缩合酶的实例。在可选的实施方案中,可以用OleC和OleD产生烯烃,而不用OleA。在另一个实施方案中,可以用OleC而不用OleA和OleD产生烯烃。分枝菌酸是细菌(如分支杆菌(Mycobacterium)禾口棒杆菌(Corynebacterium))产生的2-烷基-3-羟基脂肪酸。分枝菌酸经常被整合到细菌细胞壁中。这些2-烷基-3-羟基脂肪酸衍生于克莱森缩合反应(Claisencondensation)和随后的酮基还原反应。这种反应与本文所述的烃合成过程中由OleA和OleD进行的酶促反应类似。因此,分枝菌酸途径中的第一步可以用来产生OleC或OleC和OleD组合产生烃所需的底物。另外,对分枝菌酸途经的其他基因修饰可以提高链烯产生水平。图20概括了提议的分枝菌酸生物合成(参阅,例如Lea-Smithetal.,JournalofBiologicalChemistry,28211000-11008(2007)和Portevinetal.,ProceedingsoftheNationalAcademyofScience,101:314_319(2004))以及ole基因合成烯烃的合成途径。对这两种途径进行检查显示了相似的中间体。两种途径中脂肪酸缩合反应的产物都是2-烷基-3-酮脂酰基-CoA或2-烷基-3-酮脂酰基-ACP。因此,在产生分枝菌酸的生物如谷氨酸棒杆菌(C.glutamicum)中oleC和oleD的超表达可以“劫持(hijack)”分枝菌酸生物合成途径,导致烯烃的产生。在第一个方案中,在产生分枝菌酸的生物中超表达oleC和oleD。适当的宿主生物是谷氨酸棒杆菌,其是很成熟的工业宿主,已有有效的基因工具,能够耐受分枝菌酸产生的丧失。谷氨酸棒杆菌分枝菌酸基因的脂肪酸特异性与所观察的0leA、0leB、0leC和oleD的特异性特征相似。oleC和oleD的超表达指导pksl3的产物合成烯烃,如图21所示。在第二个方案中,在产生分枝菌酸的生物中,仅超表达oleC。这种提议的途径假定OleC可以不依赖于2-烷基-3-羟基脂酰基中间体起作用,产生烯烃。所示途径在图22中尚壳显不。在表达oleC和oleD的产分枝菌酸菌株中,提高烯烃的产生可通过完成下述基因修饰实现。为了防止OleA和OleD底物被消耗掉,可以敲除cmrA或其功能同源物,以便防止分枝菌酸的产生,同时允许OleD底物2-烷基-3-酮脂酰基-ACP的聚集。另外,fadD32、accA3,accD4,accD5或pksl3的超表达会增加所需的分枝菌酸中间体的产生,导致随着超表达oleC和oleD,产生更多的烯烃。通常,有几种鉴定具有酰基缩合活性的肽的方法。利用这些方法中的一种或多种形成产物表明,肽具有酰基缩合活性。除了实施例3中提供的体外测定外,肽可在细胞中由外源核酸表达,随后制备细胞裂解物。可以向裂解物中加入各种底物,诸如酰基_CoA、酰基-ACP、酰基-AMP、酰基酯、脂肪酸或其混合物,并可以利用本文所述GC/MS或GC/FID法检测产物。在另一个实例中,可以纯化肽,并与来自不表达该肽的细胞的细胞裂解物(下文中称为野生型裂解物)一起孵育。可以孵育纯化的肽、野生型裂解物以及各种底物。所得的产物可以利用本文所述的GC/MS或GC/FID法表征。在再一个实例中,酰基缩合活性可以通过在已被加热使蛋白变性的细胞裂解物存在的情况下,孵育纯化的酶和底物来表征。在另一个实例中,可以孵育纯化的肽和各种底物,并利用本文所述的GC/MS或GC/FID法表征所得的产物。将具有酰基缩合活性的肽确定为产生脂肪酮的肽。本领域普通技术人员应当理解,当使用已经含有脂肪酮的细胞裂解物时,与未加入底物的裂解物相比,通过脂肪酮的增加(如增加至少约10%、至少约20%、至少约50%或至少约90%)可以识别具有缩合活性的肽。在某些情况下,缩合反应可以导致衍生于一种或多种底物的分子的产生。例如,两个酰基-CoA分子的缩合反应可以产生至少一分子的CoA。因为CoA具有游离的硫醇部分(RSH),其是强活性的,因此这种分子可以通过多种方法检测。一种此类方法是与硫辛酸(Ellman试剂)反应,在411nm用分光光度跟踪。可选地,可以使CoA与单溴二胺(monobromobimane)反应,并通过HPLC检测(Fahey,etal.,MethodsEnzymol.143:85_96,(1987))。生物信息学方法可以用于发现酰基缩合肽。酰基缩合反应通过称为“克莱森缩合反应”的公知化学反应发生。克莱森缩合反应是形成碳-碳键的反应,所述反应在存在强碱的情况下发生于两个酯或一个酯和另一个羰基化合物之间,产生酮酯或二酮。酰基缩合肽通常含有由Cys-His-Asn构成的催化三分体(catalytictriad)。尽管缩合酶在氨基酸水平有很少的相似性,但它们拥有共同的三维折叠。然而,它们的活性部位具有显著的相似性(Heathetal,Nat.Prod.Rep.,19581-596,(2002))。示例性的酰基缩合肽包括本文公开的OleA序列,例如SEQIDNO:2、SEQIDNO4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO16,SEQIDNO18,SEQIDNO20,SEQIDNO22,SEQIDNO88,SEQIDN0s:135_464和SEQIDN0s478-487,这些序列的同源物,具有一种或多种本文提供的OleA结构基元的酶,以及其显示酰基缩合活性的活性片段/变体。利用本文公开的肽,可以对重组生物进行改造,以便产生具有限定结构特征(如分支、饱和和碳链长度程度)的烃和烃中间体。制备烃中间体的一种方法涉及表达一种或多种酶、增加其表达或表达其活性更高的形式,例如烃合酶活性、腺苷酸化肽、脱氢酶、脱水酶或酰基缩合酶。可以操作以便增加烃的产生的示例性的酶包括,OleA,OleB,OleC,OleBC和OleD,以及增加或修饰脂肪酸产生的其他酶。本领域普通技术人员应当理解,此类酶所产生的产物随着底物酰基链而变化。腺苷酸化肽包括能催化向烃中间体加入一磷酸腺苷的肽,所述烃中间体是诸如β-酮酸,包括α取代的β-酮酸,特别时在α位包括脂肪烃的那些中间体。如上文所述,此类中间体中的α-脂肪基通常是任选分支的烃链,任选地在烃链中包括一个或多个不饱和位点,如1个、2个或3个不饱和位点。此类腺苷酸化肽也能催化向羟基酮酸加入一磷酸腺苷,形成酮酯。本文提供了鉴定此类活性的方法。在一些实例中,腺苷酸化肽更具有底物特异性,且仅接受例如CoA或ACP激活的β-酮酯。另外,本领域普技术人员应当理解,某些腺苷酸化肽也催化其他反应。例如,一些腺苷酸化肽除了α取代的酮酸,还接受其他底物。因此也包括此类相对非特异性的腺苷酸化肽。公众可以获得腺苷酸化肽的实例(参阅,例如表1和2)。腺苷酸化肽经常催化额外的其他反应,诸如腺苷酸化的化合物与其他活化基团如CoA的酯基转移。这种活性被认为是合酶活性。实例为下述的一组反应1)R+ATP—R-OPO3-腺苷+焦磷酸盐<formula>formulaseeoriginaldocumentpage70</formula>有几种鉴定具有腺苷酸化活性的肽的方法。利用这些方法中的一种或多种形成产物表明,肽具有腺苷酸化活性。除了本文提供的体内测定外,肽可以在细胞中由外源核酸表达,随后制备细胞裂解物。可以向裂解物中加入诸如ATP的各种底物,并可以利用本文所述的方法检测产物。在另一个实例中,可以纯化肽,并且与来自不表达该肽的细胞的细胞裂解物一起孵育。可以孵育纯化的肽、野生型裂解物和各种底物。所得的产物可以利用本文所述的方法表征。本领域普通技术人员应当理解,当利用已经含有腺苷酸化的产物的细胞裂解物时,与未加入底物的裂解物相比,游离PPi、AMPα-取代的β-酮酯或AMPα-取代的β-羟基酯的增加可以识别出具有腺苷酸化活性的肽。示例性的腺苷酸化肽包括OleC(如SEQIDNO6)、表1所列的OleC蛋白、及其显示腺苷酸化活性的活性片段/变体。脱氢酶肽包括能催化脂肪酮、脂肪β-酮酸或脂肪β“酮酯分子中的酮基还原为相应羟基(在碳_氧双键上加入H2)的肽。本文提供了鉴定此类活性的方法。在一些实例中,脱氢酶肽更具有底物特异性,且仅接受例如α-脂肪-β-酮酯的CoA或ACP酯。另夕卜,本领域普通技术人员应当理解,一些脱氢酶肽也催化其他反应。例如,除了酮酯外,一些脱氢酶肽还接受其他底物。因此,也包括此类非特异性脱氢酶肽。脱氢酶肽的实例是OleD(例如SEQIDNO8)和表1提供的公众可获得的脱氢酶肽。有几种鉴定具有脱氢酶活性的肽的方法。利用这些方法中的一种或多种形成产物表明,肽具有脱氢酶活性。除了本文提供的体内测定外,肽也可以在细胞中由外源核酸表达,随后进行含有细胞裂解物或纯化的肽的体外测定。可以向测定中加入各种底物如NADPH和/或NADH,并利用本文所述的GC/MS法检测产物。在另一个实例中,可以纯化肽并与来自不表达该肽的细胞的细胞裂解物一起孵育。可以孵育纯化的肽、野生型裂解物和各种底物(如脂肪酸、酰基_CoA、酰基-AMP、酰基-ACP、α-烷基-β-酮酸、α-烷基-β-酮酯或脂肪酮)。所得产物可以利用本文所述方法表征(参阅,例如实施例1)。在再一个实例中,在酮底物存在的情况下,通过分光光度监测NADPH或NADH的脱氢酶依赖性氧化,测定脱氢酶活性。脱氢酶活性检测为340nm下反应溶液吸光度的降低。在又一个实例中,在有已被加热使蛋白变性的细胞裂解物的情况下,通过孵育纯化的酶和底物(例如NAD(P)H、α-脂肪-β-酮酯和/或α-脂肪-β-酮酸)来表征脱氢酶活性。具有脱氢酶活性的肽鉴定为由一种或多种上述反应产生羟酸或酯(特别是激活的酯)分子的肽。本领域普通技术人员应当理解,当利用已经含有羟酸和/或酯产物的细胞裂解物时,与未加入底物的裂解物相比,NADP,β-羟酸和/或酯分子的增加可以识别出具有脱氢酶活性的肽。示例性的脱氢酶肽包括OleD(例如SEQIDNO8)和表1所示的相关酶。通过利用本文提供的OleD基元和本文所述方法,搜索各种数据库,可以鉴定到其他的OleD酶。本文还公开了编码具有水解酶活性的肽的核酸。特别是,肽具有β-酮或β-羟基酯水解活性。此类肽可能催化上文所述的所有底物的酯的水解,产生相应的羧酸。通过利用HPLC(或其他公知的技术)监测产物,诸如酮酸或羟酸的产生,可以检测酯水解酶。在另一个实施方案中,可以监测由于游离酸的形成而导致的PH下降。可选地,通过测量脂肪酯释放的部分(如CoASH、AMP或磷酸盐)的聚集,可以监测酯水解。对本领域技术人员而言,监测这些化合物的方法是公知的,且这些方法中的一些在上文做了描述。通过例如与钼酸盐和孔雀石绿的反应,监测磷酸盐。可以商业(如从BioVision,Inc.,MountainView,CA)购买到其他测定法。本发明提供了包含、组成基本上为或组成为编码OleA的氨基酸的分离的多肽,所述氨基酸序列包含一个或多个(如约1个、约2个、约3个、约4个、约5个、约10个、约15个、约20个、约25个、约30个、约35个、约40个、约45个或约50个)氨基酸取代、添加、插入或缺失。例如,分离的多肽可以包含选自SEQIDN0:2、SEQIDNO:4、SEQIDNO12和SEQIDNO18的氨基酸序列,其中氨基酸序列包含一个或多个(如约1个、约2个、约3个、约4个、约5个、约10个、约15个、约20个、约25个、约30个、约35个、约40个、约45个或约50个)氨基酸取代、添加、插入或缺失。本发明提供了包含生物学活性的多肽。多肽的生物学活性可以是克莱森缩合反应活性。特别是,多肽的生物学活性可以是两个酰基硫酯的缩合。本发明提供了包含、组成基本上为或组成为编码OleD的氨基酸的分离的多肽,所述氨基酸序列包含一个或多个(如约1个、约2个、约3个、约4个、约5个、约10个、约15个、约20个、约25个、约30个、约35个、约40个、约45个或约50个)氨基酸取代、添加、插入或缺失。例如,分离的多肽包含选自SEQIDN0:8、SEQIDN0:16和SEQIDNO:22的氨基酸序列,其中氨基酸序列包含一个或多个(如约1个、约2个、约3个、约4个、约5个、约10个、约15个、约20个、约25个、约30个、约35个、约40个、约45个或约50个)氨基酸取代、添加、插入或缺失。本发明提供了编码与OleA蛋白具有相同生物学活性的多肽的分离的核酸。例如,本发明提供了编码多肽的分离的核酸,所述多肽与包含、组成基本上为或组成为选自SEQIDN0:2、SEQIDNO:4、SEQIDNO:8、SEQIDNO12,SEQIDNO:16、SEQIDN0:18禾口SEQIDNO:22的氨基酸序列的多肽具有相同的生物学活性。优选,分离的核酸可以包含(i)选自SEQIDNO:1、SEQIDNO:3、SEQIDNO:7、SEQIDNO:11、SEQIDNO:15、SEQIDNO17和SEQIDNO:21或其片段的核酸序列,或(ii)与选自SEQIDNO=USEQIDNO:3、SEQIDN0:7、SEQIDNO=IUSEQIDNO15,SEQIDN0:17禾口SEQIDNO:21的核酸序列的互补物或其片段杂交的核酸序列。有关实施杂交反应的指导可见于MolecularBiology,JohnWiley&Sons,N.Y.(1989),6.3.1-6.3.6中。水性和非水性方法描述于该参考文献中,且可以使用任何一种方法。本文涉及的具体杂交条件如下约45°C下、6X氯化钠/柠檬酸钠(SSC)的低严格杂交条件,随后至少50°C下0.2XSSC、0.1%SDS中洗涤两次(对于低严格条件,洗涤温度可以增加到55°C);2)约45°0下、6父55(的中度严格条件,随后601下,0.2\55(、0.1%SDS中洗涤一次或多次;3)约45°C下、6XSSC中的高度严格条件,随后65°C下,0.2XSSC、0.1%SDS中洗涤一次或多次;4)非常高的严格杂交条件是0.5M磷酸钠、7%SDS、65°C,随后65°C下,0.2XSSCU%SDS中洗涤一次或多次。除非另有说明,非常高的严格条件(4)是优选的条件。本文所用术语“杂交”通常指低严格、中度严格、高度严格或非常高度严格条件。本发明提供了包含生物学活性的多肽。生物学活性可以是氧化还原酶活性。特别是,生物学活性可以是还原酮基(例如酮、脂肪酮、α-烧基-β-酮酸、α-烧基-β-酮酯)。烃合酶活性是一种或多种肽的活性,所述活性使诸如酰基-CoA、酰基-ACP或脂肪酸这样含有脂酰链的底物转化为烃或烃中间体。具有烃合酶活性的肽的实例包括OleA、OleB,OleC,OleD和OleBC0利用例如互补测定(参阅下文实施例6),可以检测烃合酶活性。已知在表达OleA、OleB,OleC和OleD的情况下可以产生烃的生物可以用作检测宿主。例如,如果检测候选OleC的烃合酶活性,则检测宿主经改造仅表达oleA和oleD,而不表达oleC。候选oleC随后在缺少oleC的检测宿主中表达。如果检测宿主产生烃,则认为候选OleC具有烃合酶活性。利用本文提供的01eA、01eBC或OleC和OleD序列,以及实施例6描述的互补测定,可以鉴定其他的烃和烃中间体形成基因。通过在E.coli中表达OleA、OleBC或OleC以及OleD,可以形成烃和其中间体。因此,当待检测的具体DNA序列不在宿主细胞中表达时,经改造产生烃的E.coli或天然产生烃的其他生物(嗜麦芽窄食单胞菌、聚集绿曲挠丝状菌、地毯草黄单胞菌或金黄节杆菌)可以用来测定所述具体DNA序列或蛋白的烃合酶活性。本文所用“宿主细胞”是用来产生本文所述产物(如本文所述烯烃)的细胞。可以修饰宿主细胞,表达或超表达所选的基因或使所选的基因弱化表达。作为实例,当待检测的DNA序列编码OleA蛋白序列的同源物时,其在已表达oleC和oleD序列但不表达oleA序列的宿主中表达。如果表达oleA同源物时宿主产生烃或烃中间体,则认为OleA同源物是有活性的(即具有烃合酶活性)。本发明提供了鉴定可用于产生烃的酶的方法,包括(i)用编码疑似能产生烃的酶的核酸转化包含多肽的细胞,所述多肽选自(a)OleA和OleD,(b)OleA和OleC,以及(c)OleC和OleD;以及(ii)测定细胞是否产生烃,其中存在细胞产生的烃表示,核酸编码可用于产生烃的多肽。例如,所述方法可以包括(i)用编码疑似能产生烃的酶的核酸转化包含多肽的细胞,所述多肽选自(a)OleA和OleD,(b)OleA和OleC,(c)OleC和OleD,(d)OleA和OleBC以及(e)OleBC和OleD,其中OleA与SEQIDNO:2、SEQIDNO:4、SEQIDN0:12或SEQIDNO18共享至少约35%(例如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性;其中OleC与SEQIDNO:6、SEQIDNO14、SEQIDN0:20或SEQIDNO:88共享至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性;且其中OleD与SEQIDNO:8、SEQIDNO:16或SEQIDNO22共享至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性;以及(ii)测定细胞是否产生烃,其中存在细胞产生的烃表示,核酸编码可用于产生烃的多肽。天然产生烃的生物(无基因工程),通过如上文所述改变脂肪酸生物合成途径,经改造过度产生烃或产生具有特定碳链特征的烃。已知产生烃且可以利用本文提供的教导进行改造而改变烃产生的示例性生物包括但不限于,不动杆菌属的种类(Acinetobacterspp.)、绿曲挠丝状菌属的禾中类(Chloroflexusspp.)、Kineococcusradiotolerans、嗜麦芽窄食单胞菌、微球菌属的种类(Micrococcusspp.)、节杆菌属的种类(Arthrobacterspp.)、弗尼斯弧菌(Vibriofurnissii)以及蓝细菌(cyanobacteria)。这些基因工程重组生物可用于产生烃。基因工程重组生物也可以用于产生脂肪酮。例如,具有0leA、0leC和oleD的生物可以通过使编码oleC和oleD的基因缺失或弱化经改造产生脂肪酮。当oleC和oleD缺失或弱化时,作为外源OleA表达的结果,所得的基因工程生物产生酮。通过使编码oleC的基因缺失或弱化,可以改造具有OleA和oleC的生物,产生脂肪酮。同样,通过使编码oleD的基因缺失或弱化,可以改造具有oleA和oleD的生物,产生脂肪酮。当oleC或oleD缺失或弱化时,作为外源oleA表达的结果,所得的基因工程生物产生酮。在其他实例中,产生烃的重组生物经改造,超表达一种或多种选自OleA、OleB,01eC、01eD和OleBC以及其组合的肽。这些基因可以在天然产生烃的生物如上文所述的那些生物中超表达,或它们可以在不天然产生烃的生物中超表达。本文所用“超表达”意指以比在相应野生型细胞中通常所表达的浓度高的浓度表达或导致表达核酸、多肽或烃。例如,当多肽在重组细胞中的存在浓度比其在相同物种的非重组细胞中的浓度高时,多肽在该重组细胞中“超表达”。超表达肽的重组生物的实例包括,表达编码OleA、OleB、OleC、OleD、OleBC或其组合的基因的生物。其他实例包括已将外源启动子序列引入OleA、OleB、OleC、OleD、OleBC或其组合的内源编码序列的上游的生物。在有些实例中,一种或多种改变脂肪酸生物合成途径的基因的超表达可以与OleA、OleB、OleC、OleBC或OleD联合超表达。提供了用一种或多种核酸分子进行基因工程(例如转化、转导或转染)的重组生物(例如细菌、真菌或真核细胞),所述核酸分子编码下述序列中的一种或多种01eA(如SEQIDNO:2、SEQIDNO:4、SEQIDNO12和SEQIDNO18)、OleB(如SEQIDNO10)、OleC(如SEQIDN0:6、SEQIDNO:14、SEQIDNO20和SEQIDNO:88)、OleD(如SEQIDN0:8、SEQIDN0:16和SEQIDNO22)或这些序列中的一种或多种的变体或同源物。这些序列可以由载体构建体、基因整合后直接由染色体或由染色体外阵列(extrachromosomalarrays)表达。例如,OleA(如SEQIDNO:2)、OleC(如SEQIDNO6)或OleD(如SEQIDNO8)由可操作地连接于基因表达调控元件的核酸编码,所述基因表达调控元件在期望的重组生物中发挥功能,例如E.coli中的T7启动子。本文所用的“调控元件”意指转录调控元件。调控元件包括启动子和增强子。术语“启动子元件”、“启动子”或“启动子序列”指发挥激活基因表达开关功能的DNA序列。如果基因被激活,则称其被转录或在参与转录。转录涉及由基因合成mRNA。因此,启动子作为转录调节元件,并且提供了基因转录为mRNA的起始位点。调控元件与参与转录的细胞蛋白特异性地相互作用(Maniatisetal.,Science236:1237(1987))。在异源表达系统中表达蛋白的方法在本领域内是公知的。通常,通过天然转化、电穿孔、接合或转导,转化细菌或酵母重组生物。所得的表达构建体可以是染色体外的,例如质粒的情形,或重组后整合到染色体中。在真核细胞中,通常利用适宜特定重组生物的任何方法,用表达载体转染(或用含有表达载体的病毒感染)重组生物。此类转染方法在本领域内也是公知的,非限制性的示例性实例在本文中作了描述。转化的重组生物能表达表达盒中的核酸编码的蛋白。在另一个实例中,也可以用一个或多个表达载体实施重组生物的瞬时或稳定转染。可以用许多不同类型的重组生物产生本文提供的蛋白,诸如细菌、酵母、藻类、真菌、昆虫、脊椎动物细胞(诸如哺乳动物细胞),以及植物细胞,包括(如果需要)原代细胞和永生细胞系。每个细胞类型有许多常用的代表,并且可以从各种各样的商业来源获得,包括例如ATCC、Pharmacia以及Invitrogen。通常利用各种酵母菌株和酵母衍生的载体产生异源蛋白。例如,适宜的酵母细胞的具体非限制性实例包括酿酒酵母细胞、曲霉属的细胞、木霉属(Trichoderma)的细胞、脉孢菌属(Neurospora)的细胞、镰刀菌属(Fusarium)的细胞或平革菌属(Chrysosporium)的细胞。在一具体、非限制性实例中,从Invitrogen(Carlsbad,California)获得的巴斯德毕赤酵母(Pichiapastoris)表达系统,可以用来产生OleA、OleB、OleC、OleBC或OleD肽。此类系统包括适宜的巴斯德毕赤酵母菌株、载体、试剂、转化体、测序引物和培养基。例如,可以利用的菌株包括但不限于KM71H(原养型菌株)、SMD1168H(原养型菌株)和SMDl168(ρ印4突变菌株)(Invitrogen)。酿酒酵母是另一个常用作宿主的酵母种。在不能产生色氨酸的酵母属突变体中,MI4YRp7(Stinchcombetal.,Nature,28239,(1979);Kingsmanetal.,Gene,7141,(1979);Tschemperetal.,Gene,10:157,(1980))通常用作表达载体。这种质粒含有trpl基因,当转化到酵母突变菌株中时,所述基因允许酵母突变菌株产生色氨酸,并在没有色氨酸的情况下生长。Trpl基因可用作选择标记的宿主菌株的实例包括但不限于ATCCNo.44,076*PEP4-l(Jones,Genetics,2312,(1977))。酵母重组生物基因组中存在的trpl损伤(trpllesion)提供了通过在缺少色氨酸的情况下的生长来检测转化的有效特征。如Hinnen,Proc.Natl.Acad.Sci.USA,751929,(1978)所述,可以利用聚乙二醇法转化酵母重组生物。其他的酵母转化实验方案阐述于Gietzetal.,Nucl.AcidsRes.,20(17):1425,(1992)和Reevesetal.,FEMS,99(2-3)193-197,(1992)中。许多细胞生物,诸如酵母、动物和细菌,产生作为其细胞膜基本组分的脂质。这些生物产生用来作为脂质的脂酰基的方法是高度保守的。然而,这些途径中存在能够影响某些脂质中间体(诸如酰基-coA和酰基-ACP)的有效性的变化。这些脂质中间体也是Ole蛋白产生脂肪酮和烃的关键底物。在酿酒酵母中,酰基-coA与酰基辅酶A结合蛋白(acyl-coenzymeA-bindingprotein,ACBP)结合,ACBP保护酰基-CoA免受硫酯酶的水解(参阅,例如Roseetal.,PNAS,8911287-11291(1992),Feddersenetal.,Biochem.J.,407:219-230(2007))。Ole蛋白与ACBP竞争酰基-coA,用作烃或脂肪酮合成的底物。因此,可能有必要对ACBP进行修饰以减少它对酰基-CoA的竞争。文献显示,在酿酒酵母中,ACBP的条件突变释放了酰基-CoA集合(参阅,例如Gaiggetal.,Mol.Biol.Cell,121147-1160(2001))。因此,在可利用的游离酰基-CoA的量受到控制的那些菌株(诸如酿酒酵母Y700PGAL1-ACB1,参见例如Gaiggetal.同上)中,ole基因的表达将导致更高水平的脂肪酮或烃产生。在构建适宜的表达载体的过程中,也将与这些基因关联的终止序列连接到期望表达的序列的3’区。含有能转录编码原核tRNA的核酸序列的酵母兼容启动子、复制起点和终止序列的任何质粒载体都是适宜的。其他适宜的重组生物是细菌细胞。可以作为重组生物的适宜细菌门的具体非特异性实例包括酸杆菌纲(Acidobacteria)、放线菌纲(Actinobacteria)、产水菌纲(Aquificae)、拟杆菌门(Bacteroidetes)、衣原体科(Chlamydiae)、绿菌门(Chlorobi)、绿弯菌门(Chloroflexi)、产金菌纲(Chrysiogenetes)、蓝细菌(Cyanobacteria)、脱铁杆菌纲(Deferribacteres)、异常球菌属(Deinococcus)、栖热菌属(Thermus)、团菌纲(Dictyoglomi)、纤维杆菌纲(Fibrobacteres)、壁厚菌门(Firmicutes)、梭杆菌纲(Fusobacteria)、芽单胞菌门(Gemmatimonadetes)、粘胶球形菌门(Lentisphaerae)、螺方宠菌门(Nitrospira)、浮霉菌门(Planctomycetes)、变形杆菌纲(Proteobacteria)、螺旋体(Spirochaetes)、软壁菌门(Tenericutes)、热脱硫杆菌门(Thermodesulfobacteria)、热微菌门(Thermomicrobia)、热袍菌纲(Thermotogae)禾口抚微菌门(Verrucomicrobia)0可以用作重组生物的细菌物种的具体非限制性实例包括,大肠杆菌、极端嗜热菌(Thermusthermophilus)、嗜麦芽窄食单胞菌、KineococcusradiotoleransΛ嗜热月旨肪芽包If胃(Bacillusstearothermophilus)、詹氏甲;求胃(Methanococcusjannaschii)、甲烷八叠球古菌(Methanosarcinamazei)、嗜热自养甲烷杆菌(Methanobacteriumthermoautotrophicum)、Methanococcusmaripaludis、Methanopyruskandleri、盐杆菌属(Halobacterium)如沃氏盐富饶菌(Haloferaxvolcanii)、盐杆菌NRC_i(HalobacteriumspeciesNRC_i)、Archaeoglobusfulgidus、Pyrococcusfitriosus、极端嗜热古菌(Pyrococcushorikoshii)、嗜气菌(Pyrobaculumaerophilum)、Pyrococcusabyssi、硫磺矿硫化叶菌(Sulfolobussolfataricus)、嗜酸热硫化叶菌(Sulfolobustokodaii)、(Aeuropyrumpernix)、嗜酸热原体(Thermoplasmaacidophilum)禾口火山热原体(Thermoplasmavolcanium)0在一个实施方案中,重组生物是Ε.coli细胞、嗜麦芽窄食单胞菌细胞、假单胞菌(Pseudomonassp.)细胞、芽孢杆菌(Bacillussp.)细胞、放线菌(Actinomycetes)细胞或属于红球菌属(Rhodococcus)的细胞。将构建体引入重组生物可以通过多种方法实现,包括但不限于,磷酸钙转染、DEAE-葡聚糖介导的转染、聚乙烯介导的转染、原生质体融合(protoplastfusion)、脂质体介导的转染、接合、天然转化、电穿孔和其他本领域内已知的方法。再其他适宜的重组生物是植物细胞(如石松、蕨类植物、被子植物或裸子植物)。其他适宜的重组生物包括但不限于,藻类、苔藓和地衣。任何已知的方法可以用于植物细胞的转化、培养和再生。将外来DNA引入植物细胞的方法包括但不限于,涉及使用根癌农杆菌(Agrobacteriumtumefaciens)和合适的Ti载体,包括二元载体的转移;化学诱导的转移(例如用聚乙二醇);基因枪法(biolistics);以及显微注射。参阅,例如Anetal.,PlantMolecularBiologyManual,A3:1_19(1988)。适宜在植物细胞中表达异源基因的各种启动子在本领域内是已知的,包括组成型启动子,例如在许多植物组织中表达的花椰菜花叶病毒(CaMV)35S启动子,器官或组织特异特异性启动子和可被诸如茉莉酮酸甲酯、水杨酸或安全剂(safeners)的化学品诱导的启动子。在适当的条件下将重组生物培养至适宜的细胞浓度。如果目的序列可操作地连接于诱导型启动子,则使环境适当改变来诱导表达。如果产物(例如烃)在重组生物中聚集,则通过例如离心或过滤收获细胞。可以进行全细胞提取,以从完整细胞纯化产物。在可选的实施方案中,当生物、培养基和产物一起收集时,可以进行全培养物提取以便回收期望的产物。如果重组生物将产物分泌于培养基中,则分离细胞和培养基。随后保留培养基,用于纯化期望的产物。本发明提供了包含外源核酸序列的基因工程生物,所述外源核酸稳定地整合到生物基因组的基因组核酸序列的上游,所述基因组核酸序列(a)与ole基因的核酸序列具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性,且(b)编码多肽。例如,基因工程生物可以包含稳定地整合到生物基因组的基因组核酸序列上游的外源核酸序列,所述基因组核酸序列与选自SEQIDN0:1、SEQIDN0:3、SEQIDNO5,SEQIDN0:7、SEQIDN0:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDN0:21、SEQIDNO:87和编码任何SEQIDNOs135-464的核酸序列的核酸序列具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性。优选,基因工程生物可以包含稳定地整合到生物基因组的基因组核酸序列上游的外源核酸序列,所述基因组核酸序列与选自SEQIDN0:1、SEQIDNO3,SEQIDN0:5、SEQIDN0:7、SEQIDN0:9、SEQIDNO=IUSEQIDNO13,SEQIDNO15,SEQIDNO17,SEQIDNO:19、SEQIDNO21和SEQIDNO87的核酸序列具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性。在优选的实施方案中,基因工程生物包含稳定地整合到生物基因组的基因组核酸序列上游的外源核酸序列,所述基因组核酸序列包含、组成基本上为或组成为选自SEQIDNO=USEQIDN0:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO=IUSEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO21和SEQIDNO87的核酸序列本发明提供了基因工程生物,其是通过如下方式制备的(a)提供具有核酸序列的生物,所述核酸序列与ole基因的核酸序列具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性,以及(b)使该核酸序列缺失或突变。例如,通过使核酸序列缺失或突变,制备基因工程生物,所述核酸序列与选自SEQIDN0:1、SEQIDN0:3、SEQIDN0:5、SEQIDN0:7、SEQIDN0:9、SEQIDN0:11、SEQIDNO13,SEQIDNO15,SEQIDNO17,SEQIDNO:19、SEQIDNO:21、SEQIDNO:87和编码任何SEQIDNOs:135-464的核酸序列的核酸序列具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性。优选地,通过使核酸序列缺失或突变,制备基因工程生物,所述核酸序列与选自SEQIDN0:5、SEQIDNO:7、SEQIDNO13,SEQIDNO15,SEQIDNO19,SEQIDN0:21禾口SEQIDNO:87的核酸序列具有至少约35%(如至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%)的序列同一性。在优选的实施方案中,通过使核酸序列缺失或突变制备基因工程生物,所述核酸序列包含、组成基本上为或组成为选自SEQIDNO:5、SEQIDNO:7、SEQIDNO:13、SEQIDNO:15、SEQIDNO:19、SEQIDNO21和SEQIDNO87的核酸序列。基因工程生物可以是任何适宜进行基因工程的生物。优选,基因工程生物选自粘球菌Fwl09-5、金黄节杆菌、氯酚节杆菌、节杆菌FB24、噬菌蛭弧菌、Blastopirellulamarina、亚麻短杆菌、须芒草伯克氏菌、洋葱伯克氏菌、Burkholderiaoklahomensis、类鼻疽伯克氏菌、伯克氏菌383、CandidatusKueneniastuttgartiensis、聚集绿曲挠丝状菌、橙色绿曲挠丝状菌、密执安棒形杆菌密执安亚种、密执安棒形杆菌坏腐亚种、肉毒梭菌A、肉毒梭菌A3、肉毒梭菌Bi、肉毒梭菌Bf、肉毒梭菌F、肉毒梭菌、Colwelliapsychrerythraea^Congregibacterlitoralis、*—脱Ij^liiM油脱求胃、Desulfotaleapsychrophila>氧化乙酸脱硫单胞菌、黄杆菌目细菌、Gemmataobscuriglobus>Geobacterbemidjiensis、Geobacterlovleyi>iiil|fIsfFRC~32>Geobacteruraniumreducens、Hahellachejuensis、Jannaschiasp.CCS1、Kineococcusradiotolerans、Lentisphaeraaraneosa、Maricaulismaris>Marinobacteralgicola>Marinobacteraquaeolei>M^lii>Microscillamarina、莫里特拉氏菌PE36、鸟分枝杆菌、乌分枝杆菌副结核亚种、海分枝杆菌、分枝杆菌GP1、结核分枝杆菌、Mycobacteriumvanbaalenii、淋病奈瑟菌、皮诺卡菌、丰佑菌科细菌、Opitutusterrae、类芽孢杆菌JDR-2、产丙酸粘土杆菌、深海发光杆菌、深海发光杆菌、Photorhabdusluminescenssubsp.Iaumondii、Planctomycesmaris、Plesiocystispacifica、大西洋假交替单胞菌、Psychromonasingrahamii、冷单胞菌CNPT3、皮氏罗尔斯顿菌、紫红红球菌、红球菌、Rhodopirellulabaltica、Roseovariusnubinhibens、亚马逊希瓦氏菌、波罗的海希瓦氏菌、海底希瓦菌、反硝化希瓦氏菌、冷海希瓦氏菌、Shewmellahalifaxensis、Shewanellaloihica、Shewane11aoneidensisΛShewanellapealeana、腐败希瓦氏菌、Shewanellasediminis、Shewanellasp.ANA-3、希瓦氏菌Shewanellasp.MR-4、希瓦氏菌Shewanellasp.R-7、希瓦氏菌Shewanellasp.W3-18-KShewanellawoodyi、嗜麦芽窄食单胞菌、产二素链霉菌、地毯草黄单胞菌、野油菜黄单胞菌、水稻黄单胞菌和苛养木杆菌。在优选的实施方案中,稳定地整合到基因工程生物基因组的外源核酸序列,相对于相同条件下基因组核酸序列编码的多肽在生物整合该外源核酸序列前的表达,增加了同一多肽的表达。。优选地,相对于相同条件下野生型生物中烃的产生,基因工程生物的烃产量增加。在优选的实施方案中,核酸序列在基因工程生物中的缺失或突变导致该核酸序列编码的多肽的产生相对于相同多肽在相同条件下、在该核酸序列缺失或突变前的生物中的产生降低。优选地,基因工程生物产生酮。例如,基因工程生物产生酮的量比相同条件下、在该核酸序列缺失或突变前的生物中酮的产生增加了。本发明提供了产生酮、烃和其中间体的方法。提供了可用于产生具有改造的碳链长度、不饱和位点和分支位点的产物的各种重组生物。还提供了产生长链产物的方法以及通过诸如裂化进一步修饰产物产生高质量生物燃料和特殊化学品的方法。通过在重组生物中表达各种酶以及使各种酶的表达弱化,可以改造脂肪酮、烃和烃中间体,以便使其具有特定碳链特征。例如,碳链长度可以通过在重组生物中表达各种硫酯酶同时使内源硫酯酶的表达弱化来调控。同样,各种分支位点可以通过表达各种支链α-酮酸脱羧酶/脱氢酶基因(如bkd基因)引入碳链中,且饱和程度也可以通过表达各种基因进行调控,例如,通过超表达β-酮-ACP-合酶基因(如fabB)。有关可以包括于重组生物中以提供特定碳链特征并增加脂肪生物合成途径产生的各种修饰的详细描述提供于国际专利申请公开W02007/136762中,在此通过引用将其全文并入。本发明提供了产生生物燃料的方法,其包括本文所述的任何方法。本文所用术语“生物燃料”指来源于生物质的任何燃料。生物燃料可以取代基于石油的燃料。例如,生物燃料包括运输用燃料(如汽油、柴油、喷气燃料(jetfuel)等)、加热用燃料以及产电燃料。生物燃料是再生性能源。特别是,产生的生物燃料可以是汽油、生物柴油或喷气燃料。还没有由再生性来源产生包含以生物学方式产生的烃,特别是利用脂肪酸生物合成途径以生物学方式产生的烃的生物燃料,因此其是新的组合物。基于双碳同位素指纹或14C年代测定,可以将这些新燃料与来源于石化碳的燃料区分开来。另外,生物来源的碳的具体来源(例如葡萄糖相对于甘油),可以通过双碳同位素指纹测定(参阅美国专利第7,169,588,在此将其通过引用并入)。能区分生物燃料和基于石油的燃料,对在商业上追踪这些材料是有利的。例如,同时包含基于生物学方式的和石油的碳同位素特征的燃料和化学品,可以与仅由基于石油的材料构成的燃料和化学品区分开来。因此,基于它们独特的碳同位素特征,可以在商业上追踪所述材料。通过比较每种燃料中的稳定碳同位素比(13C/12C),可以区分生物燃料和基于石油的燃料。给定的基于生物材料中的13C/12C比值是二氧化碳固定时大气二氧化氮中13c/12c比值的结果。它也反映了准确的代谢途径。也存在地区变化。石油、C3植物(阔叶树)、c4植物(禾本科植物)以及海洋碳酸盐在13c/12c和相应δ13C值方面均显示出显著不同。此夕卜,作为代谢途径的结果,C3和C4植物的脂类物质的分析不同于来源于相同植物的碳水化合物组分的物质。在测量精确范围内,13C由于同位素分馏效应而表现出很大的变化,对于生物燃料而言,其中最显著的是光合机制。植物碳同位素比值差异的主要原因与植物光合碳代谢途径的差异密切相关,特别是与原初羧化作用(primarycarboxylation)(即大气CO2的初始固定)过程中发生的反应密切相关。两大类别的植物是并入“C/’(或Calvin-Benson)光合循环的植物和并入“C4”(Hatch-Slack)光合循环的植物。在C3植物中,初始CO2固定或羧化反应涉及酶核酮糖-1,5-二磷酸羧化酶,且第一个稳定的产物是3-碳化合物。诸如阔叶树和针叶树的C3植物,在温带地区占优势。在C4植物中,涉及另一种酶即磷酸烯醇式丙酮酸羧化酶的另外一个羧化反应是初始的羧化反应。第一个稳定的碳产物是4-碳酸,其随后被脱羧化。由此释放的CO2被C3循环再次固定。C4植物的实例是热带草本科植物、玉米和甘蔗。C3植物和C4植物都表现出一系列13C/12C同位素比值,但典型比值,对C4植物而言为约-7%0至约-13%。,对C3植物而言为约-19%。至约-27%。(参阅,例如Stuiveretal.,Radiocarbon,19=355(1977))0碳和石油通常落于后一范围内。13C测量标准最初是将PBD(PeeDeeBelemnite,PDB)石灰石设定为0,数值表示为与该材料的千分之几偏差。“δ13C”值为千分之几(%。),缩写为%。,计算如下δ13C(%。)=[(13C/12C)样品-(13C/12C)标准]/(13C/12C)标准X1000因为PDB参照材料(RM)已被耗尽,与IAEA、USGS,NIST以及其他挑选的国家同位素实验室合作,已经研发了一系列替代的RMs。与PDB的每mil偏差的符号是δ13C。通过对质量为44、45和46的分子离子进行高准确稳定比值质谱(IRMS),对CO2进行测量。本发明提供了通过本文公开的任何方法产生的烃和生物燃料。特别是,烃或生物燃料的S13为约-28或更大、约-27或更大、-20或更大、-18或更大、-15或更大、-13或更大、-10或更大以及-8或更大。例如烃的δ13为约-30至约-15、约-27至约-19、约-25至约-21、约-15至约-5、约-13至约-7,约-13至约-10。本发明也提供了δ13C为约-10、-11、-12或-12.3的烃或生物燃料。还可以通过比较每种燃料中14C的量,区分生物燃料和基于石油的燃料。因为14C的核半衰期是5730年,因此含有更古老的碳的基于石油的燃料可以与含有“较新”的碳的生物燃料区分开(参阅,例如Currie,“SourceApportionmentofAtmosphericParticles(^ΗΜ^Μ-^ΜΜ·^)"CharacterizationofEnvironmentalParticles(i^f境颗粒物的表征),J.BuffleandH.P.vanLeeuwen,Eds.,1ofVol.IoftheIUPACEnvironmentalAnalyticalChemistrySeries(LewisPublishers,Inc)(1992)3-74)放射性碳年代测定的基本假设是,大气中14C浓度的恒定导致有生命的生物中14C的恒定。然而,由于1950年以来的大气核试验和1850年以来燃烧化石燃料,14C已经获得了第二个地球化学时间特征。其在大气CO2中的浓度,且因此在有生命的生物圈中,在20世纪60年代中期的核试验高峰期,几乎加倍。之后,其逐渐返回约1.2x10_12的稳定态宇宙(大气)基准同位素比值,张弛“半衰期”(relaxation"half-life")约为7-10年。(不必照字面意思理解后一个半衰期;相反,必须用详细的大气核输入/衰变函数,追踪核能年代开始以来大气和生物圈14的变化)。正是后一个生物圈14C时间特征保证能每年对近期生物圈碳进行年代测定。14C可以通过加速器质谱(acceleratormassspectrometry,AMS)测量,结果以“现代碳分数(fractionofmodemcarbon)”(fM)单位给出。fM是由国家标准技术研究院标准参考物质(NationalInstituteofStandardsandTechnology(NIST)StandardReferenceMaterials(SRMs))4990B和4990C定义的。本文所用的“现代碳分数”或“fM”与美国国家标准技术研究院标准参考物质4990B和4990C(分别称为草酸标准HOxI和HOxII)定义的具有相同的含义。基本定义涉及0.95倍的14C/12C同位素比值HOxI(指AD1950)。这粗略等于经过衰变校正的工业革命前的木材。对于目前有生命的生物圈(植物材料)而言,fM约为1.1。本发明提供了fM14C至少为约1的烃或生物燃料。例如,烃或生物燃料的fM14C为至少约1.01,fM14C为约1至约1.5,fM14C为约1.04至约1.18或fM14C为约1.111至约1.124。14C的另一个测量法被称为现代碳的百分比即pMC。对于利用14C定年法的考古学家或地质学家而言,公元1950等于“0岁”。这也表示100pMC。在热核武器高峰的1963年时,大气中“炸弹碳(bombcarbon)”达到了正常水平的几乎2倍。对其自出现以来在大气中的分布进行了估计,表现出大于公元1950年以来活着的植物和动物的IOOpMC的值。其随时间逐渐降低,目前的值接近107.5pMC。这意味着新的生物质材料,如玉米,会产生107.5pMC附近的14C特征。基于石油的化合物的pMC值为0。混合化石碳和当前碳将稀释当前的pMC含量。假定107.5pMC表示当前生物质材料的14C含量,OpMC表示基于石油产品的14C的含量,则该材料的测量PMC值将反映两种组分类型的比例。例如,100%来源于当前大豆的材料将产生接近107.5pMC的放射碳特征。如果以基于石油的产品将该材料稀释50%,则其产生约54pMC的放射碳特征。通过指定100%等于107.5pMC,0%等于OpMC,推导出基于生物的碳含量。例如,测量为99pMC的样品将产生等同于93%的基于生物的碳含量。该值称为平均的基于生物的碳结果,且认为所分析的材料中所有的组分来自于当前的生物材料或基于石油的材料。本发明提供了pMC为至少约50、60、70、75、80、85、90、95、96、97、98、99或100的烃或生物燃料。本发明还提供了烃或生物燃料,其PMC介于约50至约100、约60至约100、约70至约100、约80至约100、约85至约100以及约87至约98、约90至约95之间。本发明还提供了pMC为约90、91、92、93、94或94.2的烃或生物燃料。烃可以是烯烃。烯烃可以是单不饱和的或多不饱和的(如双不饱和、三不饱和等)。烯烃的碳链长度可以介于约10至约40个碳之间。例如,烯烃的碳链长度可以介于约15至约35、约17至约34、18至约33、约19至约33碳之间,介于约27至约33个烃,介于约29至约31个烃或约27、28、29、30、31、32或33个烃。烃可以是直链烃或支链烃。烃可以包含环状部分。本发明提供了包含本文公开的烃的生物燃料。生物燃料可以是汽油、生物柴油或喷气燃料。生物燃料可以来源于碳源。本文所用短语“碳源”指适宜用作原核或简单真核细胞生长的碳源的底物或化合物。碳源可以处于各种形式,包括但不限于,多聚体、碳水化合物、酸、醇、醛、酮、氨基酸、肽和气体(例如CO和C02)。它们包括,例如,各种单糖,诸如葡萄糖、果糖、甘露糖和半乳糖;寡糖,诸如低聚果糖和低聚半乳糖;多糖,诸如木糖和阿拉伯糖;二糖,诸如蔗糖、麦芽糖和松二糖;纤维素材料,诸如甲基纤维素和羧甲基纤维素;饱和或不饱和的脂肪酸酯,诸如琥珀酸酯、乳酸酯和乙酸酯;醇,诸如乙醇;或它们的混合物。碳源也可以是光合作用的产物,包括但不限于葡萄糖。优选的碳源是生物质。本文所用术语“生物质”指来自生物材料的碳源。生物质可以转化为生物燃料。一示例性的生物质来源是植物物质。例如,玉米、甘蔗或柳枝稷(switchgrass)可以用作生物质。生物质的另一个非限制性实例是动物物质,如牛粪肥(cowmanure)。生物质也包括工业、农业、林业和家庭废料。可以用作生物质的此类废料的实例是,发酵废料、禾杆、木材、污水、垃圾以及残羹剩菜。生物质也包括碳源,如碳水化合物(例如单糖、二糖或多糖)。另一优选的碳源是葡萄糖。优选,碳源是再生性能源。再生性能源可以是生物质。下列实施例进一步说明本发明,但任何意义上都不应理解为对其范围的限定。实施例1本实施例描述了执行本专利内实施例所用的材料和方法。尽管描述了具体的方法,但是,本领域内普通技术人员应当理解,也可以使用其他相似的方法。通常,除非另有规定,使用的是标准的实验操作。例如,标准的实验操作用于克隆、核酸序列的操作和测序;蛋白的纯化和分析以及其他分子生物学和生物化学技术。标准的实验室手册,如Sambrooketal.(同上)和Ausubeletal.(同上),对此类技术作了详细解释。基因组序列公众可以获得嗜麦芽窄食单胞菌两种不同菌株的完整基因组序列。嗜麦芽窄食单胞菌R551-3的全基因组序列可见于http://genome,oml.gov/microbial/smal/(最后一次访问在2007年5月16日)中。嗜麦芽窄食单胞菌菌株K279a的全基因组序列可见于http//www,sanger.ac.uk/Proiects/Smaltophilia/(最后一次访问在2007年5月16)中。在这两种测序的基因组中都发现了编码本文所述蛋白的核酸序列,且在来自ATCC17679的嗜麦芽窄食单胞菌菌株中以实验的方式进行了证实。另外,利用本文所述的核酸序列和密码子优化的核酸序列,在E.coli、枯草芽孢杆菌、巨大芽孢杆菌和酿酒酵母中证实了某些蛋白活性。微生物菌株本文所用的微生物菌株如下嗜麦芽窄食单胞菌(ATCC菌株号17674,17679,17445,17666);嗜麦芽窄食单胞菌ATCC17679ΔoleA嗜麦芽窄食单胞菌ATCC17679ΔoleC嗜麦芽窄食单胞菌ATCC17679ΔoleDΕ.coleT7ExpresslysY/Iq(NewEnglandBiolabs,Ipswich,MA01938-2723)E.coliC41(DE3)(LucigenCorporation,Middleton,WI53562)E.coliC41(DE3)ΔfadE(来自LucigenCorporation,Middleton,WI53562的Ε.coliC41(DE3)菌株,缺失fadE基因EC1.3.99.3(酰基-CoA脱氢酶),Klein.K.etal.,Eur.J.Biochem.III19:442-450(1971))。E.coliC41(DE3)AfadE;pET_21b(+)_01eA,pC0LADuet_l_01eC,pCDFDuet_l_OleDΕ.coliC41(DE3);pET_21b(+)_01eAΕ.coliC41(DE3);pET_21b(+)_01eBΕ.coliC41(DE3);pET_21b(+)_01eDΕ.coliC41(DE3);pETDuet_l_01eAB,pC0LADuet_l_01eCDΕ.coliMG1655AfadE(Ε.coliMG1655,缺失fadE基因)Ε.coliMG1655AfadE,fadD(+)(Ε.coliMG1655菌株,缺失fadE基因,fadD上游有T5启动子序列)酿酒酵母有性型BY4741(ATCC201388)酿酒酵母BY4741;pESC_HIS_01eA巨大芽孢杆菌WH320(来自德国MoBiTec的菌株)巨大芽孢杆菌WH320;pffH1520_01eCDAB巨大芽孢杆菌WH320;pWH1520枯草芽孢杆菌IHAOlIacA:spec16仙811^{851~(-)111(+)5(来自芽孢杆菌基因保藏中心(BacillusGeneticStockCenter,Columbus,OH)的菌株,菌株号BGSC1A785)枯草芽孢杆菌IHAOl,pHT01_01eA金黄节杆菌TCl(来自ATCCBAA-1386的菌株)抗性标记AmpR,氨苄青霉素/羧苄青霉素(100μg/mL);KanR,卡那霉素(30μg/mL);CamR,氯霉素(34yg/mL);SmR,链霉素/壮观霉素(50yg/mL);以及四环素(15yg/mLE.coli,巨大芽孢杆菌,50i!g/mL嗜麦芽窄食单胞菌)抗性标记用于本文所述样品中。聚合酶链式反应(PCR)利用PCR由DNA扩增指定的核酸序列,产生许多本文所述的表达构建体。用于本文所述PCR反应的引物列于表14中。质粒列于表15中。表14<table>tableseeoriginaldocumentpage82</column></row><table><table>tableseeoriginaldocumentpage83</column></row><table><table>tableseeoriginaldocumentpage84</column></row><table><table>tableseeoriginaldocumentpage85</column></row><table><table>tableseeoriginaldocumentpage86</column></row><table><table>tableseeoriginaldocumentpage87</column></row><table><table>tableseeoriginaldocumentpage88</column></row><table><table>tableseeoriginaldocumentpage89</column></row><table><table>tableseeoriginaldocumentpage90</column></row><table><table>tableseeoriginaldocumentpage91</column></row><table>克隆方法利用标准的分子生物学克隆方法(参阅,例如,Sambrooketal.,同上)将DNA克隆至表15中所示的载体中。从NewEnglandBiolabs(Ipswich,MA01938)购买限制酶Aatll、AflII、Avrll、BarnHI、BglII、HindllI、Ncol、Ndel、Nhel、Nrul、PciI、Seal、SfoI、SpeI、XbaI、XhoI和Zral。表达实验方案进行各种规模的发酵,以便检测产物的表达或产生。这些实验方案在下文作了描述,在各实施例中称为5mL发酵、25mL发酵或可选的发酵技术。5mL发酵在具有5mLLuriaBrothMiller(LB)(EMD,Chemicals,Inc.,SanDiego,CA)的15mL试管中进行这些发酵。将培养物培养至0D■介于0.1和1之间,并用终浓度为ImM的IPTG诱导。根据实验,诱导后6-48的任何时间提取培养物。发酵物在25°C、30°C或37°C振荡孵育。25mL发酵在具有培养基终体积25mL的125mL培养瓶(flask)中进行这些发酵。通过在15ml试管中用从冷冻保藏管(freezerstock)刮下的碎屑中的细胞接种5mLLB培养基,制备种子培养物。冷冻保藏管的制备是在LB培养基中加入甘油至终浓度为20%,并在-80°C保藏该培养物。37°C下振荡孵育种子培养物,直到培养物的0D■达到0.15-0.6之间。随后用该培养物接种发酵物。用2mL细胞密度为0.150D■单位的LB培养基接种含有2%葡萄糖的22mLM9培养基(6g/LNa2HP04、3g/LKH2P04、0.5g/LNaClUg/LNH4Cl、lmg/L硫胺、ImMMgS04、0.lmMCaCl2)。随后振荡孵育培养物,直到OD600介于0.3和0.6单位之间,此时,用终浓度为ImM的IPTG诱导培养物。在供应脂肪酸的实验中,在诱导培养物的相同时间点加入脂肪酸。根据实验,在诱导后2-48小时的任何时间,提取培养物。在25°C、30°C或37°C振荡孵育发酵物。细胞裂解物实验方案使用标准细胞裂解实验方案。简而言之,利用超声或利用BugBusterplusBenzonase核酸酶试剂盒(产品目录#70750NovagenofEMDChemicals,Inc.,SanDiego,CA)破裂细胞。例如,将10mL培养物3500rpm离心15分钟(AllegraX-15R离心机,带有SX-4750A转子,BeckmanCoulter,Fullerton,CA),所得沉淀重悬浮于2mLBugBuster和2u1Benzonase核酸酶中。蛋白纯化实验方案利用标准程序,纯化His-标记的蛋白。根据UserprotocolTB054Rev.F0106(NovagenofEMDChemicals,Inc.,SanDiego,CA)中的说明,纯化蛋白。烃提取方法提取方法1:5ml沉淀提取利用甲醇己烷提取实验方案,从细菌细胞沉淀中提取有机化合物(烯烃、脂肪酮和烃)。简而言之,5mL培养物/发酵液在玻璃试管中3500rpm离心15分钟(AllegraX-15R离心机,具有SX-4750A转子,BeckmanCoulter,Fullerton,CA),轻轻倒出上清液,将所得的沉淀重悬浮于100yL无菌蒸馏水中,在旋涡混合器上混合至均勻。接下来,加入1ML甲醇,利用旋涡混合器混合样品。随后在超声水浴(Bransonic,TabletopUltrasonicCleaners,模型5510,Danbury,CT)中对样品进行15分钟至1.5小时的超声波降解。超声波降解后,加入4mL己烷,在旋涡混合器上混合样品。随后将样品3500rpm离心15分钟(AllegraX-15R离心机,带有转子SX-4750A,BeckmanCoulter,Fullerton,CA)移出上层(已烷层),并加入干净的玻璃管中。随后在离心机(Vacufuge5301,Eppendorf,ffestbury,NY)中真空下干燥样品约30分钟,直到基本上不存在溶剂。随后将样品重悬浮于lOOuL乙酸乙酯或氯仿中。接着根据下文所述的检测方法,在/MS上分析lyL样品。提取方法2用于体外测定的方法对于体外测定而言,利用乙酸乙酯/1%乙酸提取实验方案,从体外样品中提取有机化合物(烯烃、脂肪酮以及烃)。在体外测定中,加入500yL含有乙酸的乙酸乙酯,提取样品。将样品在涡旋混合器上混合,随后3500rpm离心5分钟,以分离含水层和有机层(具有FA-45-24-11转子的离心机5424,Eppendorf,Westbury,NY)。将上层(乙酸乙酯层)转移入干净的小管。随后将样品在离心机(Vacufuge5301,Eppendorf,Westbury,NY)中真空干燥约30分钟,直到基本上不存在溶剂。随后将样品重悬浮于50μL乙酸乙酯中,并用GC/MS和/或GC/FID分析。根据下文所述的检测方法,取1到10μL在GC/MC或GC/FID上分析烃含量。提取方法3小规模全细胞培养物提取法将介于0.5-lmL的发酵培养物加入1.7mLEppendorf管中。随后用0.25-0.5mL含有适当的烃峰(如对于烯烃而言,10mg/L顺式-9-二十三烯或10mg/L二十六烷;对于脂肪酮而言,10mg/L14-二十七酮,等)的乙酸乙酯提取该培养物。将培养物-乙酸乙酯混合物在涡旋混合器上高速混合10分钟。随后在Eppendorf离心机(具有转子FA_45_24_11的离心机5424,Eppendorf,Westbury,NY)中13,OOOrpm离心5分钟。移出有机层(上层),用于利用下文所述的GC/MS或GC/FID检测方法进行分析。烃检测方法检测方法1:20分钟GC/MS对于GC/MS检查,利用下述实验方案,观察并确认烃和脂肪酮运行时间20分钟柱HP-5_MS(5%二苯基硅氧烷,95%二甲基硅氧烷)PartNo.19091S-433E,长度(米)30,内径(mm)0.25窄径柱(narrowbore),膜(Film)(μΜ)0.25MSD扫描范围50-800Μ/Ζ注射1μLAgilent6850入口入口300°C无分流(splitless)运载气体氦炉温保持100°C5分钟;25°C/分钟到320°C;保持320°C5分钟检测Agilent5975BVLMSD检测温度300°C检测方法25分钟GC/MS对于GC/MS检查,利用下述实验方案检测并确认烃和脂肪酮运行时间4.9分钟柱HP-5_MS(5%二苯基硅氧烷,95%二甲基硅氧烷)PartNo.19091S-433E,长度(米)30,内径(mm)0·25窄径柱,膜(μΜ)0.25MSD扫描范围50-140Μ/Ζ注射1μLAgilent6850入口入口300°C无分流运载气体氦炉温225°C无停留;25°C/分钟到320°C;保持320°C1.1分钟检测=Agilent5975BVLMSD检测温度300°C检测方法3:GC/FID对于GC/FID检测,利用下述方案检测并确认烃和脂肪酮运行时间2.75-4分钟,取决于有意观察的烃的长度。较长的烃需要更长的时间。柱ThermoElectronCorporation(PartNo.UFMC00200000000):Ph5,膜厚0.4mm,长度(米)5,内径0.Imm,注射的样品体积1_10μ1,取决于实验入口无分流运载气体氦炉温保持IOO0C1分钟;2000C/分钟到350°C;保持350°C0.50分钟检测ThermoFID检测器。检测方法4:5.8分钟GC/MS对于GC/MS检测,利用下述实验方案观察并确认烃和脂肪酮运行时间5.83分钟柱DB-1HT(100%二甲基聚硅氧烷)PartNo.122-1111(AgilentTechnologies,Inc),长度(米)15,内径(mm)0.25窄径柱,膜(μM)0.1MSD扫描范围50-550m/z注射IyLAgilent6890N入口入口300°C无分流运载气体氦(流速1·3mL/分钟)炉温160°C保持0.3分钟;300C/分钟到320°C;320°C保持0.2分钟检测=Agilent5975BXLEI/CIMSD检测温度250°C质粒构建构建了许多质粒,用于在任何目的细胞中表达oleA、oleB、oleC和oleD,包括Ε.coli、枯草芽孢杆菌、巨大芽孢杆菌以及酿酒酵母。这些构建体可以分为含有单个基因的质粒和含有处于操纵子中的基因组合的质粒。含有单个oleA、oleB、oleC和oleD基因的质粒oleA、oleB、oleC、oleD基因序列来源于由含有这些基因序列的宿主菌株的基因组DNA经PCR扩增,或者是按照合约(DNA2.OInc.,MenloPark,CA94025)设计和制备的合成基因。简而言之,按照下述,由分离自嗜麦芽窄食单胞菌ATCC17679的基因组DNA扩增oleA、oleB、oleC、oleD:oleA(SEQIDNO1)利用引物LBl18(SEQIDNO29)和LB119(SEQIDNO30)扩增;oleB(SEQIDNO:9)利用引物LB151(SEQIDNO:35)和LB152(SEQIDNO:36)扩增;oleC(SEQIDNO5)利用引物LB155(SEQIDNO31)^PLB159(SEQIDNO32)扩增;oleD(SEQIDNO7)利用引物LB157(SEQIDNO33)和LB158(SEQIDNO:34)扩增。利用限制酶NdeI和XholJfoleA(SEQIDNO1),oleB(SEQIDNO:9)、oleC(SEQIDNO5)和oleD(SEQIDNO7)扩增产物插入pET-21b(+)、pCDFDuet-1、pCOLADuet-1、pETDuet-1或pACYCDuet-1中。从所得的转化体中选择正确的质粒克隆,并利用DNA消化和测序进行证实。相似的克隆方法可以用来将oleA(SEQIDNO:1)、oleB(SEQIDNO:9)、oleC(SEQIDNO5)和oleD(SEQIDNO:7)插入任何目的载体中。利用上文所述的标准克隆技术,通过将来自pET21b(+)_01eA质粒的oleA核苷酸序列克隆至细菌表达载体pCL1920pTrc中,构建质粒pCL1920pTrc01eA,所述pET21b(+)_OleA质粒含有来自嗜麦芽窄食单胞菌ATCC17679的天然oleADNA序列。载体骨架pCL1920pTrc(SEQIDNO24)是在LS9,Inc.构建的。简而言之,利用LF302(SEQIDNO76)和LF303(SEQIDNO:77),从质粒pTrcHis2A(Invitrogen,Carlsbad,CA)DNA中扩增含有IacIq序列、pTrc启动子和多克隆位点的PCR产物。用AflII和消化所得的PCR产物,并利用标准的DNA连接,克隆至用AflII和SfoI切割的质粒pCL1920(NCCBNr3176Nucl.AcidsRes.,18:4631,(1990))中。所得的克隆含有处于错误方向的插入片段,且AflII限制位点未被保留。所得质粒称为pCL1920pTrc(SEQIDNO:24)。为了构建质粒pCL1920pTrc01eA,利用引物LB189(SEQIDNO:45)和LF304(SEQIDNO:44),PCR扩增οIeA(SEQIDN0:1)。利用限制酶PciI和Xhol,将OleA扩增产物克隆至pCL1920pTrc,产生质粒pCL1920pTrc01eA。为了构建在枯草芽孢杆菌中表达oleA的质粒pHT01_01eA,利用引物LB388(SEQIDNO491)和LB386(SEQIDNO490),从DNA模板pCL1920pTre01eCDAB中PCR扩增oleA(SEQIDNO:3),所述模板含有基于嗜麦芽窄食单胞菌氨基酸序列的核苷酸序列,所述核苷酸序列已经进行了密码子优化,用于在E.coli中表达。利用限制酶BamHI和XbaIJfOleA扩增产物克隆于pHTOl中,产生质粒pHT01_01eA。含有烯烃合酶操纵子的质粒构建含有各种顺序的4种基因即0leA、0leB、0leC和oleD的多种质粒。用表达来自这些操纵子的基因的菌株进行的所有发酵物检测都产生了烯烃。合成的操纵子中基因的顺序不影响生物产生烃的能力。这些质粒中有许多可以在下文所述的实施例中交换使用。每个实施例中实际所用的质粒描述于相关实施例中。在含有基于来自嗜麦芽窄食单胞菌的氨基酸序列的ole基因的质粒中,质粒的命名取决于DNA序列中基因的顺序,例如以OleA、OleB,OleC、OleD、OleAB、OleBC、OleCD、OleABCD等命名。当ole基因来自另一个生物的基因组时,基因名称后跟有括弧,标注了基因所来源的生物的前三个字母。例如,OleA(Xan)表示在地毯草黄单胞菌基因组序列中发现的编码OleA氨基酸序列的基因。制备了含有oleA、oleB、oleC和oleD基因的合成操纵子,所述基因编码基于嗜麦芽窄食单胞菌的蛋白序列。在DNA2.0,Inc.(MenIoPark,CA94025)通过程序修饰,对ole基因进行密码子优化,用于在E.coli中表达。用合成的基因序列(SEQIDNO:23)构建质粒pCL1920pTrc01eABpTrcL01eCD。将DNA2.O提供的合成的烯烃操纵子(SEQIDNO:23)亚克隆至质粒pCL1920pTrc中。通过PciI和HindIII消化,分离操纵子片段,并连接于用NcoI和HindIII切割的质粒pCL1920pTrc质粒中。所得克隆称为pCL1920pTrc01eABpTrcL01eCD(SEQIDNO:78)。构建另一个质粒pCL1920pTrC01eCDAB,其含有以不同顺序排列的4种烯烃合酶基因(0leA、0leB、0leC和oleD),并用于下述实施例中的一些。这种质粒如下进行构建首先,将含有IacItl序列的PCR产物克隆至NheI和spel消化的pCL1920pTrc01eABpTrcL01eCD载体骨架,构建质粒pCL1920pTrC01eCD。所得质粒含有oleC和oleD基因上游的IacItl序列。利用LB270(SEQIDNO79)和LB271(SEQIDNO80),由pCL1920pTrc,扩增含有Iac阻抑物的PCR产物,通过NheI和SpeI消化,制备用于克隆的PCR产物和载体。其次,随后通过将含有oleA和oleB的PCR片段克隆到pCL1920pTrC01eCD质粒中的oleC和oleD下游,构建操纵子质粒pCL1920pTrc01eCDAB。所述oleABPCR产物是利用LB272(SEQIDNO81)和LB275(SEQIDNO:82),从pCL1920pTrc01eABpTrcL01eCD中扩增得到的。用BamHI和BglII消化所得的PCR产物,并通过标准DNA连接,克隆至用BamHI和BglIIffl^^ffiltieSIBI(AntarcticPhosphatase,NewEnglandBiolabs,Ipswich,MA01938)处理过的pCL1920pTrc01eCD中。所得质粒称为pCL1920pTrc01eCDAB。可用相似的方法将合成的烯烃操纵子插入任何目的载体中。为了构建在巨大芽孢杆菌中表达的质粒pWH1520_01eCDAB,利用引物LB402(SEQIDNO488)和LB387(SEQIDNO:489),从DNA模板pCL1920pTrc01eCDAB中PCR扩增oleC、oleD、oleA和oleB,所述模板含有基于来自嗜麦芽窄食单胞菌的氨基酸序列的核苷酸序列,所述核苷酸序列已经进行了密码子优化,用于在E.coli表达。用SpeI和BglII消化含有oleC、oleD、oleA和oleB的PCR产物,并利用限制酶SpeI和BamHI将其克隆至pWH1520中,产生质粒pWH1520_01eCDAB。含有硫酯酶基因的质粒构建多种质粒,其含有不同硫酯酶编码区,包括UcFatBUCcFatBUChFatB2和‘tesA。通过Ε.coliMG1655基因组DNA的PCR扩增,获得E.coli‘tesA的基因序列。加州月桂(Umbellulariacalifornica)FatBl(UcFatBl)、樟树(Cinnamomumcamphora)FatBl(CeFatBl)禾口萼距花(Cupheahookeriana)FatB2(ChFatB2)的基因序列是按照合约,设计和产生的合成基因(CodonDevices,Cambridge,MA02139)ο简而言之,‘tesA(SEQIDNO:25)利用引物TesA_F(SEQIDNO:50)和TesA_R(SEQIDNO:51)扩增。利用PCR扩增和标准消化连接实验方案,将合成的基因再克隆至表达质粒中。CcFatBl(SEQIDNO26)利用引物CcFatB_F(SEQIDNO52)和CcFatB_R(SEQIDNO:53)扩增。ChFatB2(SEQIDNO:27)利用引物ChFatB2_F(SEQIDNO:54)和ChFatB2_R(SEQIDNO55)扩增。UcFatBl(SEQIDNO28)利用引物UcFatB1_F(SEQIDNO56)和UcFatB1_R(SEQIDNO57)扩增。利用限制酶NdeI和AvrIlJf‘tesA(SEQIDNO25)和CcFatBl(SEQIDNO26)的扩增产物克隆至pETDuet-1中。利用限制酶XbaI和Hindlll,将ChFatB2(SEQIDNO27)和UcFatBl(SEQIDNO28)扩增产物克隆至pMAL_c2X(NEB,Ipswich,MA)中,与malE基因处于同一阅读框。含有酰基-CoA合酶的质粒从许多不同构建体,包括两个不同的载体即pETDuet-Ι和pACYCpTrc中,以及由直接整合于E.coli宿主菌株的组成型启动子,表达fadD基因。这些构建体在下文做了描述。pETDuet-l_fadD将来自E.coli编码酰基-CoA合酶的fadD基因克隆至NcoI/HindIII消化的pETDuet-Ι载体中。利用引物fadD_F(SEQIDNO46)和fadD_R(SEQIDNO:47),从Ε.coliC41(DE3)基因组DNA中扩增fadD核酸序列(SEQIDNO:492)。利用限制酶NcoI和HindIIIdffadD扩增产物克隆至pETDuet-Ι产生pETDuet_l_fadD。pACYCpTrcfadD为了构建pACYCpTrcfadD,首先构建载体质粒pACYCpTrc。利用引物pTrc_F(SEQIDNO493)禾口pTrc_R(SEQIDNO:494),从pTrcHis2A(Invitrogen,Calrsbad,CA)中PCR扩增IacItl和pTrc启动子和终止子区。随后用AatII和NruI消化PCR产物。接着将PCR产物克隆至用AatII和ScaI消化的pACYC177中。利用引物fadD_F(SEQIDNO46)和fadD_R(SEQIDNO47),从E.coliC41(DE3)基因组DNA中PCR扩增fadD核酸序列,并通过用NcoI和EcoRI消化克隆至pACYCpTrc中,产生质粒pACYCpTrcFadD。酰基-CoA合酶的组成性表达通过利用同源重组(等位基因交换),用含有T5启动子序列(SEQIDNO496)的合成DNA序列取代fadD基因(SEQIDNO495)上游5,侧翼区,随后除去CreIox抗微生物抗性标记,组成性地表达FadD(有关详细的实验方案,参阅,例如Valle,FernandoandNoemiFlores,OverexpressionofChromosomalGenesinEscherichiacoli.Vol.267,RecombinantGeneExpression:ReviewsandProtocols.Totowa:HumanaPress,2004禾口Palmerosetal.,Gene,247:255_64(2000))。简而言之,利用引物LB284(SEQIDNO83)和LB285(SEQIDNO84)从pLoxCat2(SEQIDNO:89;GenBank登录号#AJ401047)扩增IoxPcat盒。随后将扩增产物转化入含有质粒pKD46(GenBank登录号#AY048746)的MG1655ΔfadE。在选择IoxPcat盒的整合后,从菌株除去pKD46,随后利用质粒pJW168除去氯霉素抗性(Palmerosetal.,Gene,247:255_64(2000))。在证实T5启动子取代fadD启动子后,除去菌株的PJW168。所得菌株即为E.coliMG1655ΔfadE,fadD(+)。实施例2本实施例证明,OleA,OleC和OleD在细菌中的表达,导致烯烃的产生。利用PCR,从嗜麦芽窄食单胞菌中扩增oleA、oleC和oleD核酸序列。如实施例1所述,利用标准克隆技术,将这些序列插入细菌表达载体。随后用含有oleA、oleC和oleD的质粒转化E.coliC41(DE3)AfadE0利用5mL发酵试验方案,检测具有基因型Ε.coliC41(DE3)AfadE;pET_21b(+)_01eA;pC0LADuet_l_01eC,pCDFDuet_l_01eD的所得细菌菌株,并利用提取方法1提取。随后利用检测方法1,如实施例1所述,通过GC/MS分析提取物,检测烃(例如烯烃)和脂肪酮。通过GC/MC所观察到的烃是单、双和三不饱和烯烃,其碳链长度在C27至C31之间(参阅,例如图1和2A-J)。这表明,oleA、oleC和oleD在E.coli中的表达导致烯烃的产生。可用相似的方法在任何目的细胞中表达oleA、oleC和oleD。另夕卜,可用相似的方法分析脂肪酮或烃的产生。为了证明oleA、oleB、oleC和oleD的表达导致烃在各种各样细菌中的产生,制备质粒pWH1520_01eCDAB,用于在巨大芽孢杆菌中表达oleA、oleB、oleC和oleD(参阅实施例1)。用pWH1520_01eCDAB转化预先制备的巨大芽孢杆菌WH320原生质体(来自德国的MoBiTec),产生菌株巨大芽孢杆菌WH320;pWH1520_01eCDAB。用pWH1520转化预先制备的巨大芽孢杆菌WH320原生质体,制备巨大芽孢杆菌WH320;pWH1520,用作空载体对照。利用含有嗜麦芽窄食单胞菌的E.coli密码子优化的序列,通过PCR扩增oleC、oleD、oleA和oleB的核酸序列。利用标准的E.coli克隆技术(参阅实施例1),将这些序列插入细菌质粒中。随后用含有oleA、oleB、oleC和oleD的质粒(pWH1520_01eCDAB)以及空载体对照质粒(PWH1520)转化巨大芽孢杆菌WH320。利用与原生质体一起提供的实验方案(参阅例如BacillusmegateriumproteinexpressionsystemHandbook2007(巨大芽孢杆菌蛋白表达系统手册2007)),用上述质粒转化巨大芽孢杆菌WH320的原生质体(MoBiTec,Germany),该方案是对Puyetetal.,FEMSMicrobiol.Lett.,40:1_5.(1987)方法的改良。所得的细菌菌株具有基因型巨大芽孢杆菌WH320;pffH1520_01eCDAB和巨大芽孢杆菌WH320;PWH1520,利用改良为利用0.5%的木糖而不是IPTG诱导培养物的5mL发酵试验方案(15mg/L四环素用于选择转化了质粒的细胞),对其进行检测。所用的提取方法为提取方法1。利用实施例1所述的检测方法4,通过GC/MS分析,分析烃的存在。对于质/荷比为350、364、378、392和406的不同母离子,将GC/MS数据进行离子提取,表明产生了分别含有25、26、27、28和29个碳的单不饱和烯烃(参阅图17A-J)。相同条件分析时,这些化合物比相同碳数的直链烯烃洗脱的稍早。这表明巨大芽孢杆菌产生支链烯烃。因为巨大芽孢杆菌天然产生支链脂酰底物,所观察的烯烃可能就是支链烯烃。在来自巨大芽孢杆菌WH320;pffH1520的对照提取物中,未检测到烃。本实施例所反映的实验结果证明,多种细菌可以进行改造,表达oleA、oleB、oleC和oleD并产生烃。此外,本实施例表明,可以改造革兰氏阳性菌以表达0leA、0leB、0leC和oleD并产生烃。而且,本实施例证明,可以改造来自芽孢杆菌属的细菌以表达oleA、oleB、oleC和oleD并产生烃。另外,本实施例证明,宿主生物天然产生的脂酰链的类型影响所产生的烃的类型。还从嗜麦芽窄食单胞菌的细菌细胞沉淀中提取了脂肪酮和烃(例如烯烃),并利用检测方法1进行了GC/MS分析。嗜麦芽窄食单胞菌所产生的烯烃(参阅图3、4A和4C)不同于E.coli的0leA、0leC和oleD所产生的烯烃(参阅图1)。因此,烯烃的结构(例如饱和程度、链的长度以及分支或不分支链的存在)取决于宿主。这些差异是生物产生各种类型的脂酰链能力的直接反映。这证明,如果改变脂肪酸生物合成途径,则产生不同类型的烯烃。为了确定在嗜麦芽窄食单胞菌中产生烯烃是否需要oleA,利用导致基因缺失的基于自杀载体的同源重组方法(等位基因交换),产生oleA敲除的嗜麦芽窄食单胞菌菌株。简而言之,利用Hoangetal.,Gene,212=77-86,(1998)所述的基因取代法,产生oleA基因区的缺失。更具体来说,利用S0EPCR技术(参阅,例如Hortonetal.,Gene,7761-8(1989)),扩增oleA基因区的上游和下游区域并将其放置于一起。用Xbal和Hindlll切割S0EPCR产物,并克隆至用Xbal和Hindlll消化的pEX18Tc自杀载体(参阅Hoangetal.,同上)中。5,侧翼区使用PCR引物LB200(SEQIDNO58)和LB203(SEQIDNO61)。3,侧翼区使用PCR引物LB201(SEQIDN059)和LB205(SEQIDNO63)。利用PCR引物LB202(SEQIDNO60)和LB204(SEQIDNO:62),通过PCR扩增5,和3,PCR产物的组合,产生克隆于pEX18Tc中的、组合的PCR缺失产物(SEQIDNO75)。利用检测方法2,通过GC/MS分析来自野生型嗜麦芽窄食单胞菌和突变体嗜麦芽窄食单胞菌AoleA(缺乏oleA的嗜麦芽窄食单胞菌)的提取物。在野生型嗜麦芽窄食单胞菌中观察到烯烃(参阅图4A)。在嗜麦芽窄食单胞菌AoleA中未观察到烯烃(参阅图4B)。这些结果证明,oleA基因的缺失导致嗜麦芽窄食单胞菌中烯烃产生的丧失。为了确定在嗜麦芽窄食单胞菌中产生烯烃是否需要oleC,利用导致基因缺失的基于自杀载体的同源重组方法(等位基因交换),产生oleC敲除的嗜麦芽窄食单胞菌菌株。简而言之,利用Hoangetal.,Gene,212=77-86,(1998)所述的基因取代法,产生oleC基因区的缺失。更具体来说,利用SOEPCR技术(参阅,例如Hortonetal.,Gene,7761-8(1989)),扩增oleC基因区的上游和下游区域,并将其放置在一起。用Xbal和Hindlll切割SOEPCR产物,并克隆于Xbal和Hindlll消化的pEX18Tc自杀载体(参阅Hoangetal.,同上)中。5,侧翼区使用PCR引物LB110(SEQIDNO:465)和LB112(SEQIDNO:467)。3,侧翼区使用PCR引物LB111(SEQIDNO466)和LB114(SEQIDNO469)。利用PCR引物LB113(SEQIDNO468)和LB115(SEQIDNO:470),通过PCR扩增5,和3,PCR产物的组合,产生克隆于pEX18Tc中的、组合的PCR缺失产物(SEQIDNO:471)。利用检测方法2,通过GC/MS,分析来自野生型嗜麦芽窄食单胞菌和突变体嗜麦芽窄食单胞菌AoleC(缺少oleC的嗜麦芽窄食单胞菌)的提取物。在野生型嗜麦芽窄食单胞菌中观察到烯烃(参阅图4A)。在嗜麦芽窄食单胞菌AoleC中未观察到烯烃(参阅图4D)。在嗜麦芽窄食单胞菌AoleC中观察到脂肪酮(参阅图4D)。这些结果证明,oleC基因的缺失,导致嗜麦芽窄食单胞菌中烯烃产生的丧失。为了确定在嗜麦芽窄食单胞菌中产生烯烃是否需要oleD,利用导致基因缺失的基于自杀载体的同源重组方法(等位基因交换),产生oleD敲除的嗜麦芽窄食单胞菌菌株。简而言之,利用Hoangetal.,Gene,212=77-86,(1998)所述的基因取代法,产生oleD基因区的缺失。更具体来说,利用SOEPCR技术(参阅,例如Hortonetal.,Gene,7761-8(1989)),扩增oleC基因区的上游和下游区,并将其放置在一起。用Xbal和Hindlll切割SOEPCR产物,并克隆于Xbal和Hindlll消化的pEX18Tc自杀载体中(参阅Hoangetal.,同上)中。5,侧翼区使用PCR引物LB122(SEQIDNO:472)和LB124(SEQIDNO:474)。3,侧翼区使用PCR引物LB123(SEQIDNO:473)和LB127(SEQIDNO:476)。利用PCR引物LB125(SEQIDNO475)和LB127(SEQIDNO:476),通过PCR扩增5,和3,PCR产物的组合,产生克隆于pEX18Tc中的、组合的PCR缺失产物(SEQIDNO:477)。利用检测方法2,通过GC/MS,分析来自野生型嗜麦芽窄食单胞菌和突变体嗜麦芽窄食单胞菌△oleD(缺少oleD的嗜麦芽窄食单胞菌)的提取物。在野生型嗜麦芽窄食单胞菌中观察到烯烃(参阅图4C)。在嗜麦芽窄食单胞菌△oleD中未观察到烯烃。在嗜麦芽窄食单胞菌AoleD中观察到脂肪酮(参阅图4E)。这些结果证明,oleD基因的缺失,导致嗜麦芽窄食单胞菌中烯烃产生的丧失。本实施例所反映的实验结果证明,oelA、oleC和oleD在细菌中的表达,导致烯烃的产生。取决于宿主,所产生的烯烃在结构上可能不同。另外,本实施例所反映的实验结果证明,OleA.OleC和OleD是在嗜麦芽窄食单胞菌中产生烯烃所必需的。实施例3本实施例证明,oleA在细菌中表达导致脂肪酮的产生。如实施例1和2所述,在E.coli中表达oleA。用含有oleA的质粒转化E.coliC41(DE3)。利用5mL发酵实验方案检测带有基因型E.coliC41(DE3);pET-21b(+)_01eA的所得细菌菌株。利用实施例1中所示检测方法1,通过利用提取方法1随后进行GC/MC分析,分析脂肪酮和烃(如烯烃)的产生。通过GC/MS所观察的脂肪酮是饱和的、单不饱和以及双不饱和的脂肪酮。脂肪酮碳链长度的变化范围为C27至C31(参阅图5A-C以及6A-H)。为了证明oleA的表达导致广泛多种细菌产生脂肪酮,制备质粒pHT01_01eA,用于在枯草芽孢杆菌中表达oleA(参阅实施例1)。用pHT01_01eA转化枯草芽孢杆菌IHA01,产生菌株枯草芽孢杆菌IHA01;pHT01_01eA。用pHTOl转化枯草芽孢杆菌IHA01,产生作为对照的枯草芽孢杆菌IHA01;pHTOl。利用含有嗜麦芽窄食单胞菌的E.coli密码子优化的oleA序列,扩增所述核酸序列。利用标准的E.coli克隆技术(参阅例如实施例1),将这些序列插入细菌表达载体中。随后用含有oleA的质粒(pHT01_01eA)和空载体对照质粒转化枯草芽孢杆菌IHA01。根据Spizizen,Proc.Natl.Acad.Sci.USA,44:1072_1078(1958)的实验方案,通过自然转化,转化枯草芽孢杆菌。利用5mL发酵实验方案,检测具有基因型枯草芽孢杆菌IHA01;pHT01_01eA和枯草芽孢杆菌IHA01;pHTOl的所得细菌菌株。所用的提取方法是提取方法1。利用实施例1中所述的检测方法4,通过GC/MS,分析脂肪酮和烃(如烯烃)的存在。观察到含有25、27和29个碳的饱和脂肪酮。每个单个C25、C27和C29的脂肪酮的多个波峰表明,存在脂肪酮的许多不同支链异构体(参阅图18A-E)。本实施例所反映的实验结果证明,多种细菌可以进行改造,表达oleA并产生脂肪酮。此外,本实施例证明,革兰氏阳性菌可以进行改造,表达oleA并产生脂肪酮。而且,本实施例证明,来自芽孢杆菌属的细菌可以进行改造,表达oleA并产生脂肪酮。另外,本实施例证明,宿主生物天然产生的脂酰链的类型影响所产生的烃的类型。实施例4本实施例证明,利用体外测定联合来自由酰基-CoA底物表达oleA(SEQIDNO2)的E.coli的裂解物,能观察脂肪酮的产生。如实施例1和3所述,在E.coli中表达oleA。如实施例1中所述培养、诱导、沉淀所得的重组细菌,并用来制备含有OleA(OleA细胞裂解物)的细胞裂解物。体外测定混合物由10iiL悬浮于pH7.0,0.1M磷酸盐缓冲液中的10mM十四酰-CoA锂盐储备溶液(底物)、1yL500mM三(羟丙基)膦(THP)还原剂、50uLOleA细胞裂解物和39yLpH7.0、0.1M磷酸盐缓冲液组成。还制备了含有具有或不具有底物或OleA细胞提取物的组合物的对照样品。将样品在37°C孵育1小时。孵育后,在提取前,向每个反应中加入10yL0.lmg/mL二十六烷溶液,作为对照峰。利用500yL含有乙酸的乙酸乙酯提取样品。在涡旋混合器上混合混合物,随后离心。将上层(乙酸乙酯层)转移到干净的玻璃管中,并在离心机(Vacufuge5301,Eppendorf,ffestbury,NY)中真空干燥。将样品重悬浮于50yL乙酸乙酯中。根据实施例1中所示方法,通过GC/MS或GC/FID分析1-lOyL。在足以产生脂肪酮的条件下,可以用相似的方法孵育任何OleA细胞裂解物和底物,随后分析脂肪酮的产生。通过GC/MS和GC/FID所观察到的所得脂肪酮是饱和的、单不饱和的和双不饱和的。脂肪酮的碳链长度在c27至C31之间变动(参阅图7A和7B)。将含有底物和OleA提取物的样品与所有的其他对照样品组合进行比较。相对于所有对照样品,C27脂肪酮产生的量增加表明OleA具有酰基缩合活性(参阅图7C)。本实施例中反映的实验结果证明,酰基辅酶A在体外测定中是产生脂肪酮的底物,且脂肪酮的产生需要OleA的表达。实施例5本实施例证明,利用体外测定联合纯化的酶(如OleA蛋白)与pH7.O的0.IM磷酸盐缓冲液中的纯化的底物(如酰基辅酶A、酰基-ACP等),能观察脂肪酮。如实施例1和3所述,在E.coli中表达oleA。如实施例1中所述培养、诱导、沉淀所得的重组细菌,并用来制备纯化的OleA蛋白。体外测定混合物由稀释为0.ImM至ImM终浓度的底物(如酰基辅酶A、酰基-ACP或酰基辅酶A和酰基-ACP的混合物)、20μL0.6mg/mL纯化的OleA蛋白溶液组成,所述蛋白溶于含有500mM氯化镁、pH7.0,0.IM磷酸盐缓冲液中。将每个测定混合物在37°C孵育1小时。孵育后,将250μL乙酸乙酯加入每个测定混合物,并且将每个测定混合物在涡旋混合器上混合10分钟。通过在微量离心机中13000rpm离心5分钟,将测定混合物的乙酸乙酯组分与水相分开。将15μL乙酸乙酯组分(上层)转移至GC/MS瓶,在利用本领域公知的化学电离检测法(chemicalionizationdetectionmethods)在GC/MS上分析每个乙酸乙酯组分前,向每个乙酸乙酯组分中加入作为对照峰的1.5μL0.lmg/mL二十六烷溶液(参阅图8A-B)。观察到饱和的、单不饱和的以及双不饱和的脂肪酮,其碳链长度在C19到C31之间变动。任何对照测定混合物(测定混合物含有纯化的酶,而无底物,或者测定混合物含有纯化的底物而无纯化的酶)中都未观察到脂肪酮。表16-18显示了所检测的底物的组合以及所产生的脂肪酮的类型。通过下述底物组合,形成脂肪酮酰基-CoA与酰基-CoA、酰基-ACP与酰基-ACP以及酰基-CoA与酰基-ACP(每个组合的数据分别显示于表16、17和18中)。底物显示于表左上方,每个条目表示碳链长度,其后是所形成的每个脂肪酮的双键数目(如C271指具有27个碳和单个双键的脂肪酮;C23指具有23个碳的完全饱和脂肪酮,等。)。表16酰基-CoA/酰基ClOC12C14C16C16:l-CoAClOC19N/AC23Ν/ΑΝ/ΑC12-C23C25C27:lC14--C27C29C29:lC16-C31C31:lC16:l----C31:2N/A=未被检测。表17酰基-ACP/酰基-ACPClOC12C14C14:lC16:lClOC19N/AC23N/AN/AC12-C23C25N/AC27:lC14--C27C27:lC29:lC14:l---C27:2N/AC16:l----C31:2N/A=未被检测。表18<table>tableseeoriginaldocumentpage102</column></row><table>本实施例中所反映的实验结果证明,通过脂肪酮的存在,可以用体外测定来检测OleA活性。另外,本实施例中所反映的实验结果证明,酰基辅酶A和酰基-ACP都可以单独或组合用作OleA的底物,产生脂肪酮。底物的链长和饱和程度可以变化,产生多种的脂肪酮产物。实施例6本实施例描述利用本文所述嗜麦芽窄食单胞菌的核酸序列和氨基酸序列,鉴定其他oleA、oleC和oleD核酸和氨基酸序列。利用NCBIBLAST蛋白比对程序搜索nr数据库以及其他公众可及的数据库,确定与嗜麦芽窄食单胞菌OleA、OleC和OleD序列有关的蛋白的氨基酸序列。为了展示如何鉴定和检测0leA、0leC和oleD基因家族其他成员的活性,按如下克隆和检测来自密切相关生物地毯草黄单胞菌的基因(0leA、0leC和oleD),和来自两个隐约相关生物聚集绿曲挠丝状菌(oleA、oleC和oleD)和Plesiocystispacifica(oleC)的基因。利用实施例1中所述的细菌菌株、抗性标记和PCR技术,制备本实施例中所用的质粒。对于质粒更详细的描述,参阅表15。同样,用实施例1中所述的5mL发酵试验方案、烃提取方法1以及GC/MS烃检测方法1鉴定烃和烃中间体。利用蛋白-2-DNA软件(参阅,例如,Gustafssonetal.,TrendsBiotechnol.22346-353(2004)),选择模拟天然高表达的E.coli蛋白的密码子分布(参阅,例如Henautetal.,AnalysisandpredictionsfromΕ.colisequences,InΕ.coliandSalmonellatyphimuriumCellularandMolecularBiology,Volume2,Neidhardtetal.编辑,WashingtonDC,ASM出版社,pp.2047-2066(1996))设计目的基因,优化用于在Ε.coli中表达。通过与文献中已描述的相似的非模板PCR,合成基因(参阅,例如Dillonetal.,Biotechniques,9:298_300(1990))。基因合成由DNA2.O完成(MenloPark,CA)。将合成的可读框克隆于质粒pJ201(DNA2.0,MenloPark,CA)中。将这些基因亚克隆于pET21d中NcoI和HindIII之间的多克隆位点内T7启动子上游。设计引物,使蛋白序列的5,和3,末端不变。利用LF305(SEQIDNO37)和LF306(SEQIDNO38)引物(引物序列参阅表14),,从DNA2.O质粒中扩增基于来自嗜麦芽窄食单胞菌的氨基酸序列(SEQIDNO3)的oleA密码子优化形式。PCR产物用PciI和HindIII消化,并克隆至pET21d载体。利用引物LF307(SEQIDNO:39)和LF308(SEQIDNO:40),从DNA2.O质粒中扩增基于地毪草黄单胞菌的氨基酸序列GenBank登录号#NP_640589.1GI21241007(SEQIDNO12)的oleA可读框(SEQIDN0:11)。PCR产物用PciI和HindIII消化并克隆至pET21d载体。利用引物LF313(SEQIDNO41)和LF314(SEQIDNO:42),从DNA2.O质粒中扩增基于聚集绿曲挠丝状菌DSM9485的氨基酸序列的oleA可读框(SEQIDNO17),所述氨基酸序列的NCBIGenBank登录号为ZP_01515932.1GI118047293(SEQIDN0:18)。PCR产物用PciI和HindIII消化并克隆至pET21d载体。利用NcoI和Hindlll,将来自地毯草黄单胞菌的oleC(SEQIDNO:13)和oleD(SEQIDNO:15)基因、来自聚集绿曲挠丝状菌的oleC(SEQIDNO19)和oleD(SEQIDNO21)基因以及来自PlesiocystispacificaoleC的基因(SEQIDNO87)的合成形式直接从DN2.0pJ201载体中亚克隆到pCOLADuet和pET21d载体中T7启动子之前。当各个OleA在E.coli中表达时,通过检测脂肪酮,评估来自嗜麦芽窄食单胞菌和聚集绿曲挠丝状菌的OleA的脂肪酮产生活性。用目的质粒转化E.coliC41(DE3)细胞,并利用所述T7表达实验方案诱导。接下来,用提取方法1提取沉淀,并通过GC/MS检测方法1观察脂肪酮。相似的方法可以用来表达来自任何目的生物的OleA,并随后通过GC/MS检测脂肪酮。通过GC/MS所观察的脂肪酮是饱和的、单不饱和的和双不饱和的,其碳链长度的变化范围为C27至C33(参阅图9和表19)。利用检测烯烃产生的互补测定,评估来自地毯草黄单胞菌和聚集绿曲挠丝状菌的OleA、OleC和OleD以及来自Plesiocystispacifica的OleC的烃合酶活性。在同时表达来自嗜麦芽窄食单胞菌的OleC和OleD的E.coli菌株中,评估来自地毯草黄单胞菌和聚集绿曲挠丝状菌的OleA的活性。在同时表达来自嗜麦芽窄食单胞菌的OleA和OleD的E.coli菌株中,评估OleC活性。具体来说,为了检测OleA烃合酶活性,用携带来自目标生物的oleA、olec(嗜麦芽窄食单胞菌)以及oleD(嗜麦芽窄食单胞菌)的三种质粒转化细胞。随后对转化细胞进行发酵、提取和GC/MS检测。为了检测OleC烃合酶活性,用携带oleAB(嗜麦芽窄食单胞菌)、来自目的生物的oleC以及oleD(嗜麦芽窄食单胞菌)的三种质粒转化细胞。任选地向E.coli加入OleB。对转化的细胞进行发酵、提取和GC/MS检测。为了检测OleD烃合酶活性,用携带oleAB(嗜麦芽窄食单胞菌)、oleC(嗜麦芽窄食单胞菌)以及来自目的生物的oleD的三种质粒转化细胞。任选地向E.coli加入OleB。随后对细胞进行发酵、提取和GC/MS检测。例如,用于评估来自聚集绿曲挠丝状菌、地毯草黄单胞菌和P.pacifica的oleC活性的菌株是下述基因型E.coliC41(DE3)AfadE,pC0LADuet_01eAB,pCDFDuet_OleD,pET21d_01eC(Chl);Ε.coliC41(DE3)AfadE,pC0LADuet_01eAB,pCDFDuet_01eD,pET21d_01eC(Xan);E.coliC41(DE3)AfadE,pC0LADuet_01eAB,pCDFDuet_01eD,pET21d_OleC(Ple)。用于评估来自聚集绿曲挠丝状菌和地毯草黄单胞菌的oleD活性的菌株是下述基因型:E.coliC41(DE3)AfadE,pC0LADuet_01eAB,pCDFDuet_01eC,pET21d_01eD(Chl);Ε.coliC41(DE3)AfadE,pC0LADuet_01eAB,pCDFDuet_01eC,pET21d_01eD(Xan)。用于评估来自聚集绿曲挠丝状菌和地毯草黄单胞菌的oleA活性的菌株是下述基因型E.coliC41(DE3);ΔfadE;pET21d_01eA(Chl);pACYCDuet_01eCD;pCDFDuet_fadD禾口E.coliC41(DE3);ΔfadE;pET21d_01eA(Xan);pACYCDuet_01eCD;pCDFDuet_fadD。为了证明Ε.coli中烃的产生不需要仅基于嗜麦芽窄食单胞菌氨基酸序列的ole基因,用具有编码三种地毯草黄单胞菌蛋白序列的oleA、oleC和oleD基因的菌株检测E.coli中烃的产生。制备E.coliC41(DE3)ΔfadE;pET21d_01eA(Xan),pCOLADuet_OleD(Xan),pCDF_Duet_01eC(Xan),并评估其产生烃的能力。随后提取沉淀,并通过GC/MS分析烃的产生。通过GC/MS所观察到的烃是单、双和三不不饱和烯烃,其碳链长度变化范围为C27至C31(表19)。本实施例中所反映的实验结果证明,当在E.coliC41(DE3)AfadE中表达时,来自嗜麦芽窄食单胞菌、地毯草黄单胞菌和聚集绿曲挠丝状菌的3种相关OleA蛋白序列的功能都是产生脂肪酮。本实施例中所反映的实验结果还证明,当在表达已知功能的OleC和OleD基因的E.coliC41(DE3)AfadE中表达时,来自嗜麦芽窄食单胞菌、地毯草黄单胞菌和聚集绿曲挠丝状菌的OleA蛋白序列的功能都是产生烃。另外,本实施例中所反映的实验结果证明,当在表达已知功能的oleA和oleD基因的E.coliC41(DE3)AfadE中表达时,来自地毯草黄单胞菌、聚集绿曲挠丝状菌和Plesiocystispacifica的3种相关OleC蛋白序列的功能都是产生烯烃。同样,当在表达已知的功能oleA和oleC基因的E.coliC41(DE3)AfadE中表达时,来自地毯草黄单胞菌和聚集绿曲挠丝状菌的2种相关OleD蛋白序列的功能都是产生烯烃。另外,与其他功能ole基因组合表现活性的ole基因产生烃,无论它们是否来源于同一个生物。例如,来自地毯草黄单胞菌的ole基因与来源于嗜麦芽窄食单胞菌的ole基因一起发挥作用产生烃。表19<table>tableseeoriginaldocumentpage104</column></row><table>*在存在来自嗜麦芽窄食单胞菌ATCC17679的OleA和OleD时,检测OleC。在存在来自嗜麦芽窄食单胞菌ATCC17679的OleA和OleC时,检测OleD。在存在来自嗜麦芽窄食单胞菌ATCC17679的OleC和OleD时,检测OleA。本实验展示了鉴定具有脂肪酮活性的OleA蛋白的体外测定方法。另外,本实验展示了鉴定具有烃合酶活性的OleA、OleC和OleD蛋白的体外测定方法。实施例7本实施例证明,氨基酸基元可用来在公众可及的数据库中鉴定其他的01eA、01eB、OleC和OleD蛋白序列。简而言之,可通过互联网获得搜索特定氨基酸模式(基元)的蛋白数据库。一种此类程序是京都大学生物信息学中心(KyotoUniversityBioinformaticsCenter)的GenomeNet服务中心(GenomeNetservice)提供的。截止到2007年8月1日,网址为http://motif,genome.jp/M0TIF2.html0这种基元搜索程序给用户提供搜索下述数据库的能力Swiss-Prot、PDBSTR、PIR、PRF、GENES和NR-AA。用户以PR0SITE格式(参阅,例如Hofmannetal.,NucleicAcidsRes.27:215_219(1999))输入具体氨基酸模式。例如,每个残基必须由_(减号)隔开;χ代表任何氨基酸;[DE]意指D或E;{FWY}意指除F、W和Y外的任何氨基酸;A(2,3)意指A连续地出现2至3次;模式串(patternstring)必须以句点(period)终止。用户选择“搜索序列数据库中的给定模式”,向模式框(patternbox)中输入上文所述的特定氨基酸模式,并选择待搜索的数据库。表3、7和10中提供的基元可用来鉴定其他的OleA蛋白。例如,将[LF]-X_X_[IVLM]-[ATSV]-G-[IV]-X-[EAHS]-R-R-X-W(SEQIDNO64)输入上文所述的基元搜索程序,所述序列是限定OleA蛋白群的基元。该查询的示例性搜索结果显示于以下表20中。表20<table>tableseeoriginaldocumentpage106</column></row><table><table>tableseeoriginaldocumentpage107</column></row><table><table>tableseeoriginaldocumentpage108</column></row><table><table>tableseeoriginaldocumentpage109</column></row><table>同样表4、9和12中提供的基元可以用来鉴定其他具有烃合酶活性的OleD酶。这些基元也可以用来鉴定具有脱氢酶活性的OleD酶。表5、8和11中提供的基元可以用来鉴定具有烃合酶活性的其他OleC酶。表6中提供的基元可以用来鉴定具有烃合酶活性的其他OleB酶。本实施例的结果证明,OleA,OleB,OleC和OleD的氨基酸基元可以用来鉴定其他01eA、01eB、01eC和OleD氨基酸序列。本领域普通技术人员利用OleA、OleB、OleC和OleD氨基酸序列,也能鉴定编码相应氨基酸序列的相应oleA、0leB、0leC和oleD基因。更具体地说,这些结果证明SEQIDNOs:64-74和91-133可以用来搜索数据库,以便鉴定其他OleA、OleB、OleC和OleD酶。实施例8本实施例证明,在脂肪酸生物合成途径改变的细胞中表达OleA导致脂肪酮的产生增加。如实施例1和3所述,在多种E.coli细胞中表达OleA。利用发酵方法2、提取方法1和检测方法1,对所得重组细菌进行培养、诱导、沉淀并提取。通过GC/MS所观察到的脂肪酮是饱和的、单不饱和的以及双不饱和的,其碳链长度范围为C27至C31。检测了8种不同的Ε.coli宿主(1)野生型E.coliC41(DE3);(2)E.coliC41(DE3)ΔfadE,其完全缺失酰基-CoA脱氢酶faddE;(3)E.coliC41(DE3),带有一旦用IPTG诱导则表达fadD的质粒;(4)E.coliC41(DE3)ΔfadE,带有一旦用IPTG诱导则表达fadD的质粒;(5)E.coliC41(DE3),带有一旦用IPTG诱导则表达‘tesA的质粒,‘tesA是截断形式的tesA硫酯酶A基因;(6)E.coliC41(DE3)ΔfadE,带有一旦用IPTG诱导则表达‘tesA的质粒,‘tesA是截断形式的tesA硫酯酶A基因;(7)E.coliC41(DE3),具有包含于各自质粒上的、一旦用IPTG诱导则表达的‘tesA和fadD两者;以及(8)E.coliC41(DE3)ΔfadE,具有包含于各自质粒上的、一旦用IPTG诱导则表达的‘tesA和fadD两者。利用标准分子生物学方法,制备改变脂肪酸途径中间体产生的质粒(如fadD和‘tesA)。将所有的克隆基因都置于IPTG可诱导的启动子(例如T7、tac或Iac启动子)的调控下。将E.coli的'tesA基因(SEQIDNO:25;硫酯酶A基因登录号NP415027,无前导序歹Ij(Choetal.,J.Biol.Chem.,270:4216_9(1995),EC:3,1,1,5,3.1.2,-))克隆于Ndel/Avrll消化的pETDuet-Ι(本文所述pETDuet-Ι可从EMDChemicals,Inc.,SanDiego,CA获得)中。将来自Ε.coli的编码酰基-CoA合酶的fadD基因(SEQIDNO492)克隆于NcoI/HindIII消化的ρ⑶FDuet-I中。表15概括了用来制备几个示例性生产菌株的质粒。本领域普通技术人员应当理解,可用不同的质粒和基因组修饰得到相似的菌株。当在每个带有上文所述的fadE、fadD和/或tesA的不同变异的E.coli菌株中表达oleA时,脂肪酮的产生增加(参阅图10)。例如,Ecoli'tesA(pETDuet-1-'tesA)在一种系统内的超表达,与表达OleA蛋白的E.coliC41(DE3)相比,脂肪酮的产生增加了2.6倍。在另一个实例中,在组合了E.coli‘tesA和fadD超表达和fadE缺失的菌株中表达oleA,与表达OleA蛋白的E.coliC41(DE3)相比,脂肪酮的产生增加了5倍。本实施例的结果证明了能够观察到细菌细胞所产生的脂肪酮增加,所述细菌细胞联合参与细胞脂肪酸生物合成途径的基因的改变,表达oleA。实施例9本实施例证明,0leA、0leC和oleD在脂肪酸生物合成途径已经改变的细胞中的表达,导致烯烃的产生增加。在实施例8所述的E.coli菌株中表达0leA、0leC和oleD。利用发酵方法2、提取方法1以及检测方法1,对所得重组细菌进行培养、诱导、沉淀和提取。通过GC/MS所观察到的所得烯烃是单不饱和的、双不饱和的以及三不饱和的,其碳链长度变化范围为C27至C31。oleA、oleC和oleD在联合‘tesA和fadD的超表达和fadE缺失的E.coli中的表达,与在野生型E.coli背景中表达oleA、oleC和oleD的E.coli菌株相比,所观察到的烯烃的量增加了4倍(参阅图11)。本实施例中所反映的实验结果证明,在联合改变脂肪酸生物合成途径表达oleA、oleC和oleD的细胞中,观察到烯烃的量显著增加。实施例10本实施例证明,在含有OleA和OleD的体外测定中观察到醛、脂肪酮和烯烃。根据制造商的实验方案(Novagen,CA),利用过夜快速表达TB培养基(overnightexpressinstantTBmedium),在Ε·coliC41(DE3)ΔfadE中表达His-标记的OleA禾口OleD蛋白。利用500mMNaCl、20mMTris_HCl、5mM咪唑(pH7.9)以及ImMTris(羟丙基)膦(THP)(IX结合缓冲液)用HisBind株层析纯化蛋白。随后根据UserprotocolTB054Rev.FO106(NovagenofEMDChemicals,Inc.,SanDiego,CA)的说明书,用500mMNaCl、60mM咪唑、20mMTris-HCKpH7.9)以及ImMTHP(1X洗涤缓冲液)洗涤。利用IM咪唑、0.5MNaCl以及20mMTris-HCl(pH7.9),从His-结合柱中洗脱OleD蛋白。根据制造商的实验方案(GEHealthcare,NJ),利用PD-10柱,将所有的蛋白缓冲交换至50mMTris(pH7.5)、IOOmMNaClUmMTHP禾口10%甘油中。在体外测定中,使用纯化的His标记的OleA和OleD蛋白。体外测定反应含有总体积为ΙΟΟμL的ImM十四酰基辅酶A、10mMMgCl2,2.3μM01eA、2.4μΜOleDUOmMNADPH和IOOmM磷酸盐缓冲液(ρΗ7.0)。测定中所用的NADPH从Sigma(Ν7505,StLouisMO)获得,且制备为溶于PH7.5的50mMTris中的IOOmM储备溶液。将样品在37°C下孵育1小时。用500yL含有乙酸的乙酸乙酯使反应淬火。通过涡旋混合混合物,随后离心。将上层(乙酸乙酯层)转移至干净的玻璃管中,并在离心机(Vacufuge5301,Eppendorf,ffestbury,NY)中真空干燥。将样品重悬浮于40μL乙酸乙酯和10μL0.lmg/mL二十六烷溶液(在乙酸乙酯中制备)中,所述二十六烷溶液充当对照峰,并通过GC/MS(运行时间37.33分钟;柱HP-5-MS(5%二苯基硅氧烷,95%苯基硅氧烷)PartNo.19091S-433E,长度(米)30,内径(mm)0.25窄径柱;膜(μΜ)0.25;MSD扫描范围50_550m/z;注射1μLAgilent6890N入口;入口:300°C无分流;运载气体氦(流速1.3mL/分钟);炉温3分钟保持在60°C;15°C/分钟至320°C;17分钟保持320°C;检测=Agilent5975BXLEI/CIMSD;检测温度300°C)分析。分析1和10μL间烃的含量。通过GC/MS所检测的所得醛、脂肪酮和烯烃是十四烷醛、14-二十七酮和二十七烷的异构体(参阅图12Α-Ε)。基于保留时间和MS谱图,鉴定化合物。本实施例中所反映的实验结果证明能在体外测定中利用OleA和OleD观察醛、月旨肪酮和烯烃。具体来说,这些结果证明在体外测定中,在十四酰辅酶A、MgCl2*NADPH存在的情况下,孵育OleA和OleD后,观察到醛、脂肪酮和烯烃。实施例11本实施例证明,当将纯化的OleB蛋白加入体外测定时,在包含酰基辅酶A底物、OleA和OleD的体外测定中所观察到的醛和烯烃的量显著增加。表达His标记的OleA和OleD蛋白并利用实施例10中所述的HisBind柱层析纯化。利用实施例10中所述方法,表达并纯化His标记的OleB蛋白。利用0.5MNaCl,IOOmMEDTA和20mMTris-HCl(pH7.9),从His结合柱中洗脱OleD蛋白。根据制造商的实验方案(GEHealthcare,NJ),利用PD-10柱,将所有蛋白缓冲交换于50mMTris(pH7.5)、IOOmMNaClUmMTHP以及10%甘油中。在体外测定中,使用纯化的His标记的OleA、OleD和OleB蛋白。体外测定反应含有总体积为100口1^的11111十四酰辅酶六、10111^%(12、2.3口]\1OleA,2.4μM01eD、2.3μΜOleBUOmMNADPH以及IOOmM磷酸盐缓冲液(pH7.0)。将样品在37°C下孵育1小时。用500μL含有乙酸的乙酸乙酯将反应淬火。通过涡旋混合混合物,随后离心。将上层(乙酸乙酯层)转移至干净的玻璃管中,并在离心机(Vacufuge5301,Eppendorf,Westbury,NY)中真空干燥。将样品重悬浮于40μL乙酸乙酯和10μL0.lmg/mL二十六烷溶液(在乙酸乙酯中制备)中,所述二十六烷溶液充当对照峰,并通过GC/MS进行分析。取1到IOyL分析存在的醛、脂肪酮和烯烃的量。通过GC/MS检测到的所得醛、脂肪酮和烯烃是十四烷醛、14-二十七酮和二十七烷的异构体(参阅图13A-C)。基于保留时间和MS谱图,鉴定化合物。利用MSDChemStation软件(Agilenttechnologies),评估每个化合物的波峰下面积(AP)。通过将OleA/OleD产生的各反应产物标准化为1.0(例如01eA+01eD+01eB所产生的醛=AP(01eA+01eD+01eB反应)/AP(01eA+01eD反应)),计算相对值。01eA+01eD和01eA+01eD+01eB所产生的醛、烯烃和脂肪酮的相对值,显示于表21中。表21<table>tableseeoriginaldocumentpage112</column></row><table>本实施例所反映的实验结果证明,在包含01eA、01eD和OleB的体外测定中所观察到的醛或烯烃的量高于包含OleA和OleD的体外测定中所观察到的醛或烯烃的量。实施例12本实施例证明,表达酰基-CoA合酶基因,联合烯烃合酶基因(0leA、0leB、0leC和oleD)的细菌,可以将脂肪酸转化成烯烃。酰基-CoA合酶将游离脂肪酸转化成激活的脂酰-CoAs,其是烯烃合酶基因的一个底物。用酰基-CoA合酶基因转化许多不同的宿主菌株。在一系列生物转化实验中使用烯烃合酶基因。所有宿主菌株产生了相似结果,并用实施例1中所示质粒,通过标准分子生物学技术产生。利用下述宿主菌株产生本实施例中所示数据宿主1用烯烃合酶操纵子pCL1920pTrc01eABpTrc01eCD(SEQIDNO78)和酰基-CoA合酶FadD超表达质粒pACYCpTrcFadD转化的E.coliMG1655AfadE。宿主2:用烯烃合酶操纵子pCL1920pTrc01eABpTrc01eCD(SEQIDNO78)和酰基-CoA合酶FadD超表达质粒PETDuetFadD转化的E.coliC41(DE3)ΔfadE。利用实施例1中所示25mL发酵方法,进行生物转化实验。在诱导时,向培养基中加入游离脂肪酸,至脂肪酸终浓度为体积比0.01%和0.5%。用ImL全细胞培养方法提取烃。利用实施例1中所述GC/MS分析产物。通过GC/MS检测到的烃是变化范围为C19至C33的单、双和三不饱和链。加入发酵物的脂肪酸底物类型和所检测的烯烃产物显示于表22中。检测到的烯烃的类型和数量基于加入培养基的脂肪酸底物的类型而变化。当菌株产生的烯烃在未被供应的对照菌株中未检测到时,这特别明显。例如,表22显示,ClO脂肪酸转化成C19:l烯烃,这可能反映了两个ClO脂酰-CoA分子的缩合。也形成C23:l和C23:2烯烃。这反映了由E.coli宿主菌株天然产生的ClO脂酰-CoA与C14:0或C14:1脂酰激活的酯的缩合。当细胞将C16:1脂肪酸转化为烯烃时,形成更长链的烯烃,如C313。当供应非天然脂肪酸底物时,如奇数链脂肪酸C13、C15以及C17,检测到独特的C26、C28和C30偶数链烯烃。这表明,外源脂肪酸被转化为烯烃。表22<table>tableseeoriginaldocumentpage113</column></row><table>脂肪酸的生物转化在大多数实验中增加了烯烃的总产量。例如,供应C13、C14、C14:l和C16:l脂肪酸后产生的烯烃的总量,与未被供应所述脂肪酸的对照菌株中所产生的烯烃的量相比,增加了2倍多(参阅表23)。表23"<table>tableseeoriginaldocumentpage113</column></row><table>本实施例中所反映的实验结果证明,OleA,OleB,OleC,OleD以及FadD在E.coli中的表达导致来源于外源和内源脂肪酸的烯烃的产生。另外,本实施例中所反映的实验结果证明,01eA、01eB、01eC、01eD以及FadD在供应了脂肪酸的细菌中的表达导致脂肪酸向烯烃的生物转化,以及烯烃总产量的显著增加。而且,本实施例证明,生物转化可以用来控制宿主所产生的烯烃的类型。实施例13本实施例证明,脂肪酸可以被表达酰基-CoA合酶基因的细菌联合酰基_缩合酶OleA转化为脂肪酮。酰基-CoA基因将游离脂肪酸转化为激活的脂酰-CoAs,其是OleA酰基-CoA缩合反应的一个底物。利用下述宿主菌株,产生本实施例中所示的数据E.coliMG1655AfadE,具有通过用T5组成型启动子(参阅实施例1)替代天然启动子产生的组成性表达的fadD基因,并转化了表达OleA的pCL1920pTrC01eA质粒(对于该质粒的描述,参阅实施例1)转化。根据实施例12中所述的方法,培养宿主菌株、用IPGT诱导以及供应不同碳链长度的脂肪酸。用ImL全细胞培养方法提取烃。利用实施例1中所述GC/MS分析产物。GC/MS检测到的烃是饱和的以及单和双不饱和的脂肪酮,其变化范围为C19至C31(参阅表24)。加入发酵物中的脂肪酸类型以及所观察的脂肪酮显示于表18中。在供应非天然脂肪酸如C13、C15以及C17后,产生偶数编号的碳链脂肪酮。表24<table>tableseeoriginaldocumentpage114</column></row><table>脂肪酸的生物转化在所有检测的样品中提高了脂肪酮的产生,当供应优选的底物如C14:1时,脂肪酮的产生增加了50多倍(参阅表25)。表25<table>tableseeoriginaldocumentpage114</column></row><table>本实施例中所反映的实验结果证明,OleA和FadD在E.coli中的表达导致衍生于外源和内源脂肪酸的脂肪酮的产生。另外,本实施例中所反映的实验结果证明,OleA和FadD在供应了脂肪酸的细菌中的表达,导致脂肪酸向脂肪酮的生物转化,以及总脂肪酮产量的显著增加。本实施例证明,可以用生物转化控制宿主菌株所产生的脂肪酮的类型,以及提高所产生的脂肪酮的量。实施例14本实施例证明调控细菌中可以产生的烯烃类型的方式。为了在细菌中产生不同碳链长度的酰基-CoAs(脂肪酮和烯烃合成的底物),产生不同的硫酯酶,包括UcFatBl(Voelkeretal.,Science,257:72_74(1992))、ChFatB2(Deheshetal.,PlantJ.,9167-72(1996))>iTesA(Choetal.,同上)或CcFatBl(Yuanetal.,Proc.Natl.Acad.Sci.USA,9210639-43(1995)),和酰基-CoA合酶(FadD;EC6.2.1.3)。为了产生不同碳链长度的烯烃,将所产生的酰基-CoA底物类型的变化(即表达不同硫酯酶的细菌)与烯烃合酶基因oleA、oleB、oleC和oleD联合起来。制备的许多菌株显示产生具有不同碳链长度的多种烯烃的能力(参阅表26)。利用诸如电穿孔或化学转化的标准转化方法,在E.coliC41(DE3)ΔfadE宿主中制备所有菌株。为了在菌株中维持每个质粒,在整个实验中应用适当的抗生素选择。制备了不含有硫酯酶质粒的对照菌株(0S333)。另外,制备了表达硫酯酶、脂酰-CoA合酶和烯烃合酶基因组合的菌株。构建每个质粒的详细描述可以见于实施例1。本实验所用的菌株名单列于表26中。表26<table>tableseeoriginaldocumentpage115</column></row><table>如实施例1所述,进行标准25mL发酵和标准ImL全细胞培养提取。通过实施例1中所述GC/MS方法分析样品。二十六烷内标(internalstandard)用于测定所产生的每种烯烃的量(参阅表27)。1962年,Marr和Ingraham出版了一篇文章,证明温度影响E.coli产生的脂质的饱和程度(Marretal.,JBacteriol.,841260-7(1962))。低温导致具有更高不饱和程度的脂质产生,而高温则导致更高数量的饱和脂质。为了测定温度是否影响饱和程度,在两种不同温度即37°C和25°C下,进行发酵。表27的上部表示37°C下进行的发酵的结果,而表27的下半部表示在25°C下进行的发酵的结果。表27<table>tableseeoriginaldocumentpage116</column></row><table>烯烃的长度和不饱和程度表示为CX:Y,其中X表示烯烃中碳的数目,而Y表示双键的数目。表27所反映的结果证明,硫酯酶联合脂酰-CoA合酶和烯烃合酶基因的表达,取决于所用的硫酯酶,产生不同碳链长度的烯烃。硫酯酶,诸如被认为是具有C12:0脂酰-ACPs特异性的十二烷酰载体蛋白硫酯酶的UCFatBl,以及ChFatB2,可以用来产生C23和C25长度的烯烃,所述烯烃未在对照菌株中观察到。这些结果还证明,加入C14脂酰-ACPs特异性的硫酯酶(如CcFatBl)可以提高特定烯烃(如C27烯烃)的量。可选地,通过加入对C14和C16链长脂酰-ACPs特异性的‘TesA,可以提高C27和C29的量。表27中所阐述的结果也证明,进行发酵时的温度影响细菌所产生的烯烃的类型。特别是,温度影响所产生的烯烃的饱和水平。具有单个双键的烯烃由两个饱和脂肪酸的缩合形成。37°C下进行的发酵,与25°C下进行的发酵相比,导致更高饱和程度的烯烃产生。本实施例所反映的实验结果证明,通过联合烯烃合酶基因与产生不同链长度的脂酰-CoAs基因,可以控制产生的烯烃的长度。另外,本实施例所反映的实验结果证明,细菌所产生的烯烃的饱和程度可通过改变诸如发酵温度的环境条件来控制。实施例15本实施例证明,oleA在酿酒酵母中的功能表达导致体外产生脂肪酮。利用标准方法,从含有嗜麦芽窄食单胞菌ATCC17679oleA基因序列的质粒中,PCR扩增oleA核酸序列(SEQIDNO:1),并利用如本文所述的标准技术,将其克隆至酵母表达载体。简而言之,利用引物LB217(SEQIDNO:43)和LF304(SEQIDNO:44)扩增oleA(SEQIDNO:1)。利用限制酶ApaI和XhoI,将oleA扩增产物克隆于pESC-HIS中,产生质粒pESC-His-oleA(SEQIDN0:134)。随后,用含有oleA的质粒(SEQIDNO134)或不含有oleA的质粒,转化酿酒酵母(BY4741)酵母细胞。培养转化的酵母细胞,允许oleA表达。将细胞沉淀随后利用YeastBuster(Novagen,Madison,WI)裂解。向细胞裂解物中加入十四酰-CoA。利用溶于乙酸乙酯中的的乙酸,从反应中提取脂肪酮,并利用实施例1所述的GC/MS进行分析。在来自用ο1eA质粒pESC-His_o1eA转化的酵母细胞的细胞裂解物中,通过GC/MS,鉴定到脂肪酮14-二十七酮,其是C27脂肪酮(参阅图14A)。这表明,可以在酿酒酵母中表达oleA,产生脂肪酮。相似的方法可以用来在任何目的细胞中表达oleA,制备细胞裂解物、随后分析脂肪酮的产生。本实施例所反映的实验结果证明,OleA可以在酿酒酵母中表达,导致脂肪酮的体外产生。实施例16本实施例证明,在含有纯化的OleA、含有OleD的细胞裂解物以及含重氢的NADPH的体外测定中观察到含重氢的醛和烯烃。通过发酵用pET_21b(+)_01eA转化的E.coliC41(DE3),产生用于这些实验的OleA蛋白。如实施例10所述,纯化His-标记的OleA。根据制造商的实验方案(Novagen,CA),利用过夜快速表达TB培养基,通过发酵用pET-21b(+)_01eD转化的Ε.coliC41(DE3),产生用于这些实验的OleD细胞裂解物。用IOmL过夜培养物制备细胞裂解物。离心培养物,将细胞浓缩成沉淀。除去上清液。将沉淀重悬浮于2mL50mM磷酸钠缓冲液(pH7.0)中。随后利用超声波处理(0.5功率,5秒脉冲,5次),裂解细胞悬浮液。向细胞裂解物中加入2μLBenzonase(Novagen,CA),并将样品在室温下保持20分钟。这种细胞裂解物用作OleD蛋白的来源。根据下述实验方案,制备重氢NADPH。向2.5mL50mM的磷酸钠缓冲液(pH7.0)加入5mgNADp+和3.6mgD-葡萄糖-l_d。启动酶促产生标记NADPH时,要产生R-(4_2H)NADPH,加入5个单位来自巨大芽孢杆菌的葡萄糖脱氢酶;要产生S-(4-2H)NADPH,则加入5个单位来自嗜酸热原体的葡萄糖脱氢酶。反应在37°C孵育15分钟,利用IOKDaMWCOAmiconUltra离心过滤器(Millipore)进行离心过滤,在冰上进行快速冷冻,并储存于_80°C。体外测定反应含有0.ImM十四酰辅酶A、10mMMgCl2UOyLl/1001eD裂解物稀释物、50μL重氢-NADPH(按上文所述制备)、2.ΙμΜOleA以及IOOmM磷酸盐缓冲液(pH7.0),总体积为0.lmL。所用的十四酰辅酶A是从Sigma(M4414,StLouisMO)获得的,并且制备成0.1Μ、ρΗ7.0的磷酸盐缓冲液中的IOmM储备溶液。将样品在37°C孵育1小时。用500μL含有乙酸/0.15%蚁酸的乙酸乙酯将反应淬火。通过涡旋混合混合物,随后离心。将上层(乙酸乙酯层)转移至干净的玻璃管中,并在离心机(Vacufuge5301,Eppendorf,ffestbury,NY)中真空干燥。将样品重悬浮于40μL乙酸乙酯和10μL0.Img/mL二十六烷溶液中(在乙酸乙酯中制备),其充当对照峰,并通过GC/MS进行分析。取1到10μL分析特定烃。利用GC/MS检测的所得的醛和烯烃是十四烷和二十七烷的异构体(参阅图15Α-Η)。因为NADPH氢化物的转移是立体定向的,所以合成了R-(4_2H)NADPH和S-(4_2Η)NADPH两者。仅用R-(4-2H)NADPH时,观察到增加1个单位质量的醛和烯烃。醛和烯烃都得以标记这一事实表明,重氢已经从标记的NADPH转移至标记的醛或烯烃。这表明酶促反应所用的是NADPH。氢化物转移是立体定向的这一事实可以指示酶促反应。本实施例所反映的实验结果证明,OleD编码嘧啶核苷酸氧化还原酶。而且,这些结果证明,OleD在烯烃生物合成中催化氢化物从NADPH向中间体转移,以致转移的氢化物保留于烯烃产物中。在OleA和十四酰CoA存在时发生的氢化物转移导致检测到Cl-重氢_十四烷和C14-重氢、Δ-13二十七烷。实施例17本实施例表明能体外合成脂肪烯烃。蛋白表达和制备评估OleA/A/B/C/D蛋白活性的裂解物的实验方案利用用pETDuet_01eAB和pC0LADuet_01eCD转化的E.coliC41(DE3)细胞产生含有4种Ole蛋白(01eA、01eB、01eC和OleD)的细菌裂解物。在37°C,将用pETDuet_01eAB和pC0LADuet_01eCD转化的E.coliC41(DE3)细胞培养于含有卡那霉素(50μg/mL终浓度)和羧苄青霉素(100μg/mL终浓度),至0D_为0.5-1.0。随后将培养物用ImMIPTG诱导,37°C培养过夜。将过夜培养的培养物3000rpm离心20分钟。弃掉上清液。将沉淀-80°C储存,供以后使用。将由IOmL诱导的过夜培养物获得的细胞沉淀重悬浮于2mL缓冲液中,并利用超声波处理裂解(0.5功率,5秒脉冲,5次)。在超声波降解的裂解物中,力卩入2μLBeiizanase(Novagen,CA),随后将样品在室温下保持20分钟。这种裂解物用作01eA、01eB、01eC和OleD蛋白的来源。制备十四酰-ACP的实验方案如Rocketal.,MethodsEnzymol.,72:397_403(1981)中所述,进行适当改良,合成十四酰-ACP。简而言之,将反应混合物在37°C下孵育3小时,随后30°C孵育过夜,所述反应混合物含有5mMATP、2mMDTT,2%TritonX-IOOUOmMLiCl、160μM十四酸钠盐、65μMACP-SH,IOmMMgCl2^O.IMTris-HClpH8.0和1.5-3μg/mL酰基-ACP合酶,终体积为l-4mL。所用的酰基-ACP合酶自Invitrogen购买。用三倍体积的水稀释反应混合物,并用乙酸将PH滴定至6.0。将溶液上样到HiTrapDEAEFF5mL柱(GEHealthcare)中。将柱用三个柱体积的PH6.0、10mMbis-Tris-HCl洗涤,除去大部分TritonX-100。通过用三个柱体积的80%2-正丙醇洗脱柱,除去残余的TritonX_100和游离脂肪酸。用三个柱体积的pH6.OUOmMbis-Tris-HCl清除2-正丙醇。用含于pH6.OlOmMbis-Tris-HCl中的IOmL0.6MLiCl将十四酰-ACP和未反应的ACP-SH从柱中洗脱。将含有十四酰-ACP的洗脱液缓冲交换至50mMpH7.0的磷酸钠缓冲液中,并利用MWCO3kDa浓缩器(Millipore)浓缩为lmL。利用Bradford测定(BioRad)和光密度分析(densitometryanalysis)在NuPAGE12%Bis-TrisSDS-PAGE凝胶(Invitrogen)上测定十四酰-ACP的浓度,分两步进行首先,通过Bradford测定(BioRad蛋白测定)确定C14-ACP/ACP-SH组分的总蛋白浓度;其次,基于SDS-PAGE随后光密度分析,将C14-ACP的浓度计算为总蛋白浓度的百分比。将C14-ACP在_20°C存储于pH7.0的50mM磷酸钠缓冲液,保持稳定最多3个月。产生烯烃的方法如上文所述,利用以pETDuetOleAOleB和pCOLADuetOleCOleD转化的E.coliC41(DE3)产生含有01eA、01eB、01eC和OleD蛋白的细胞裂解物。体外测定反应含有0.ImM十四酰辅酶A或0.ImM十四酰-ACPUOmMMgCl2、360μL来自用pETDuetOleAOleB和pCOLADuetOleCOleD转化的E.coliC41(DE3)的细胞裂解物、ImMNADPH(Sigma,M0)、lmMATP(Sigma,M0)UmMHSCoA(Sigma,MO)以及IOOmM磷酸盐缓冲液(pH7.0),总体积为ImL0所用的十四酰辅酶A自Sigma(M4414,StLouisMO)获得,并且制备成pH7.00.IM磷酸盐缓冲液中的IOmM储备溶液。将样品在37°C孵育1小时。用5mL含有乙酸/0.蚁酸的乙酸乙酯将反应淬火。通过涡旋混合混合物,随后离心。将4mL上层(乙酸乙酯层)转移至干净的玻璃管中,并在离心机(Vacufuge5301,Eppendorf,Westbury,NY)中真空干燥。将样品重悬浮于40μL乙酸乙酯和10μL0.lmg/mL的二十六烷溶液中(在乙酸乙酯中制备),其充当对照峰,并通过GC/MS进行分析。分析1μL中的特定烃。利用GC/MS检测到的所得烯烃是C27:1、C27:2和C27:3(参阅图16A-C)。表28显示了,在存在C14-CoA或C14-ACP时,来自用pETDuetOleAOleB和pCOLADuetOleCOleD转化的E.coliC41(DE3)的细胞裂解物所产生的C27:1烯烃的百分比。利用[C27:1波峰面积/(C271波峰面积+C272波峰面积+C273波峰面积)]X100,计算C271烯烃的百分比。表28所示结果表明,向来自用pETDuetOleAOleB和pCOLADuetOleCOleD转化的E.coliC41(DE3)细胞裂解物中加入CH-CoA或C14-ACP,导致C27:1烯烃的量增加。这表明,用存在于裂解物中的pETDuetOleAOleB和pCOLADuetOleCOleD转化的E.coliC41(DE3)可以禾Ij用C14-CoA或C14-ACP形成C27:1-烯烃。表28<table>tableseeoriginaldocumentpage119</column></row><table>本实施例所反映的实验结果证明,包含十四酰-ACP或十四酰辅酶A的体外测定联合OleA、OleB,OleC和OleD,可以用来合成烯烃。实施例18本实施例证明,OleA、OleB、OleC和OleD蛋白序列可以用来鉴定天然产生烃的生物。用pBLAST生物信息学程序鉴定属于OleA、OleB、OleC和OleD蛋白家族的蛋白序列。鉴定到少数含有聚集在一起的全部4种Ole蛋白序列的生物(参阅例如表1)。在这些生物中,已有文献表明下列4种菌株产生本文所述的烯烃类型嗜麦芽窄食单胞菌、Kineococcusradiotolerans、绿曲挠丝状菌属种类以及多种微球菌属种类,包括最近测序的藤黄微球菌(Tornabeneetal.,同上,Suenetal.,同上,Morrisonetal.,同上;vanderMeeretal.,|1]±;Albroetal.,|1]±;Philipsetal.,同±)。力了OleA、OleB、OleC和OleD的其他生物天然产生烯烃,选择表1中的金黄节杆菌TCl(ATCCBAA-1386),检测烯烃的产生。文献并未报道金黄节杆菌TCl产生烯烃。将金黄节杆菌TCl在IOOmL棒杆菌(Corynebacterium)培养液中,于30°振荡培养48小时,该培养液在500mL培养瓶中每1升由IOg酪蛋白蛋白胨(胰蛋白酶消化)、5g葡萄糖、5g酵母提取物和5gNaCl构成。48小时后,根据改良的提取方法1,提取5mL培养液。特别是,在将细胞培养物初始沉淀后,将沉淀重悬浮于ImL水中,再离心除去残余的培养液。将最终的沉淀重悬浮于100μL水中。继续提取方法1的剩余步骤(参阅实施例1)。利用检测方法1,通过GC/MS分析提取物。利用GC/MS检测到的烯烃是C29单不饱和烯烃(参阅图19Α-Β)。本实施例所反映的结果证明,具有OleA、OleB、OleC和OleD蛋白序列的生物产生烯烃。另外,本实施例证明,可以利用生物信息学通过鉴定在蛋白序列中具有OleA、OleB、OleC和OleD的生物,鉴定产生烯烃的生物。更具体来说,本实施例证明,具有OleA、OleB,OleC和OleD蛋白序列的金黄节杆菌TCl,产生C29单不饱和烯烃。实施例19本实施例证明,基于生物学方式产生的烯烃不同于基于石油的烯烃。特别是,本实施例证明,生物,诸如表达ο1eA、ο1eB、ο1eC和ο1eD基因的E.C01i所产生的烯烃,可以与基于石油的烯烃区分开。利用标准的碳定年技术,将通过E.coliC41(DE3);pETDuet_l_01eAB;pC0LADuet-l_01e⑶发酵产生的、经纯化的基于生物学方式的烯烃,与基于石油的烯烃(Z)-9-二十三烯(97%,Sigma-Aldrich,CAS号27519_02_4)进行比较。将样品送往BetaAnalytic,Inc.(Miami,FL,USA)检测。利用基于ASTMD6866的加速器质谱(AMS),测量样品的基于生物学方式的碳含量。AMS测量来源于样品粉末的石墨中13C与12C和14C的碳同位素比值。随后由13C与12C的碳同位素比值和存在的14C的量,计算样品的基于生物学方式的碳含量。利用下述方法产生和纯化所分析的烯烃样品。将E.coliC41(DE3);pETDuet-l_OleAB;pC0LADuet-l_01eCD在5mLLB培养基中培养12小时,该培养基补充了100mg/L羧苄青霉素和50mg/L卡那霉素。该12小时培养物用来接种由200mLFl振荡培养瓶(shakeflask)培养基构成的更多培养物,所述培养基含有3g/LKH2PO4、6.62g/LK2HPO4,4g/L(NH4)2SO4^O.15g/LMgS04、5g/L葡萄糖(葡萄糖DX0145_5EMDChemicals,Inc.NJ)、1·25mL/L痕量矿物溶液,以及补充了100mg/L羧苄青霉素和50mg/L卡那霉素的1.25mL/L痕量维生素溶液。痕量矿物溶液每升含有27gFeCl3·6H20、2gZnCl2·4H20、2gCaCl2·6H20、2gNa2Mo04·2H20、1.9gCuSO4·5H20、0.5gH3BO3和IOOmL浓缩HCl。痕量维生素溶液每升含有0.42g核黄素、5.4g泛酸、6g烟酸、1.4g吡哆醇、0.06g生物素以及0.04g叶酸。用50mL种子培养物接种2LBiostatAplus生物反应器(SartoriusBBI),其最初含有IL灭菌的Fl发酵培养基。灭菌的Fl发酵培养基含有1.5g/LKH2PO4,4.34g/LK2HPO4三水合物、4g/L(NH4)2SO4^O.150g/LMgSO4七水合物、5g/L无菌过滤葡萄糖(dextroseEMDChemicals,Inc.NJ)U.25mL/L痕量矿物溶液、1.25mL/L痕量维生素溶液以及与振荡培养瓶中所用的浓度相同的抗生素。利用IMH2SO4和30NH4OH将培养物的pH维持在7.2。温度维持在37°C,通风速度为21pm(2v/v/m),利用与DO控制器(DOcontroller)级联的搅拌环(agitationloop)使溶氧浓度为饱和时的30%。通过自动加入高压灭菌的Antifoam204(Sigma-AldrichSt.Louis,M0)溶液,控制泡沫的形成。在有氧发酵条件下向发酵罐提供48小时营养料(nutrientfeed),其由60g/L(NH4)2S04、3.9g/LMgSO4七水合物、430g/L葡萄糖、10mL/L痕量矿物溶液以及10mL/L维生素溶液构成。发酵的葡萄糖糖源来自玉米。当初始培养基中的葡萄糖耗尽时(接种后约6小时),提供60g/L(NH4)2S04、3.9g/LMgSO4七水合物、430g/L葡萄糖、10mL/L痕量矿物溶液以及10mL/L维生素溶液构成的营养料。在发酵过程中,逐渐地增加或减少营养料,以维持培养基中的葡萄糖水平小于10g/L。当培养物的OD6tltl达到30AU时(接种后约8-9小时),加入IMIPTG储备溶液,至ImM的终浓度,诱导烯烃在生物反应器中产生。诱导时,将发酵温度也降低至30°C。诱导后约48小时,收获生物反应器。48小时后,将发酵培养物3500rpm离心20分钟(AllegraX-15R离心机,带有转子SX-4750A,BeckmanCoulter,Fullerton,CA)。将细胞沉淀重悬浮于50mL无菌蒸馏水中。向样品中加入IOOmL甲醇,随后将样品在超声波水浴(sonicatingwaterbath)中进行60分钟超声波降解处理。将混合物转移至IL分液漏斗,向分液漏斗中加入η-己烷,至终体积为750mL。温和振荡,充分混合样品,之后,将混合物静置,以便使己烷层和含水层分离。一旦形成双层,将较下的含水层从分液漏斗中吸出来。向剩余的有机层加入Na2SO4,以除去有机相中任何过量吐0。随后在不施加真空的情况下,将有机层通过Whatman#4150mm过滤器过滤2次。将经两次过滤的有机相转移至与蒸馏柱连接的圆底培养瓶。通过以设置为56°C随后66-68°C的温度蒸馏除去己烷和丙酮。剩余的样品为黑色。为了进一步纯化样品,将样品经200mL硅胶60(微粒大小0.063-0.300mm,目数70-230ASTM)柱过滤。通过用己烷洗脱,从柱中除去样品。在环境温度下,通过旋转蒸发器,从含有洗提液的烯烃中除去己烷。最后的纯化过程使用MagnesolD-sol(DallasGroupofAmerican,Inc)。将样品重悬浮于甲基叔丁基醚(MTBE)中,终体积为8mL。以酸式硅酸镁样品(w/v)为101的比值,向样品中加入酸式硅酸镁。在旋转震荡器上,将样品_酸式硅酸镁混合物37°C混合1小时。将混合物通过0.2μmPTFE过滤器滤入20mL闪烁计数瓶中。用2.5mLMTBE洗涤剩余的固体。将洗涤和过滤的混合物合并于闪烁计数瓶中。环境温度下,在化学通风橱中蒸发MTBE。利用ASTMD6866方法B,在BetaAnalytic,Inc.通过AMS测定14C0通过推导样品中14C与现代参考标准的14C的比值,获得基于生物学方式的碳含量。比值报告为单位为PMC(现代碳百分比)的百分比。放射性碳年代测定中所用的现代参考标准是NIST(NationalInstituteofStandardsandTechnology,国家标准技术研究院)标准,其具有已知的等同于约公元1950年的放射性碳含量。之所以选择公元1950年是因为其代表热核武器试验之前的时间段,每次试验,热核武器试验都将大量过量的14C(过量14C被认为是“炸弹碳”)引入大气中。对于利用14C测定年代的考古学家或者地质学家而言,公元1950年等于“0岁”。它也代表100pMC。在热核武器高峰时的1963年,“炸弹碳”达到了正常水平的几乎2倍。对其自出现以来在大气中的分布进行了估计,表现出大于公元1950年以来活着的植物和动物表现的IOOpMC的数值。随着时间,其逐渐降低,目前的值接近107.5pMC。这意味着新的生物质材料,如玉米,会产生107.5pMC附近的14C特征。基于石油的化合物的pMC值为0。混合化石碳和当前碳将稀释当前PMC含量。假定107.5pMC表示当前生物质材料的14C含量且OpMC表示基于石油产品的14C含量,则该材料的测量pMC值将反映两种组分类型的比例。例如,100%来源于当前大豆的材料将产生接近107.5pMC的放射碳特征。如果以基于石油的产品将该材料稀释50%,则其产生约54pMC的放射碳特征。通过指定100%等于107.5pMC且0%等于OpMC,推导出基于生物学方式的碳含量。例如,测量为99pMC的样品将产生等同于93%的基于生物的碳含量。该值称为平均的基于生物的碳结果,且认为所分析的材料中所有的组分来自于当前生物材料或基于石油的材料。给定的生物来源的材料中稳定的同位素比值(13C/12C)是二氧化碳固定时大气二氧化碳中13c/12c比值的结果。这也反映了植物固定二氧化碳的精确代谢途径。13c/12c比值通常表示为S13C,其按如下进行计算δ13C(%。)=[(13C/12C)样品-(13C/12C)标准]/(13C/12C)标准X1000石油和C4植物(玉米、高粱等)的S13C具有相似的范围(从-7到_13ppt),而仏植物(小麦、燕麦、水稻等)的13C/12C落在-19至-27ppt的范围内(参阅,例如Stuiveretal.,同上,以及Gupta,etal.,RadiocarbondatingpracticesatANU.Handbook,RadiocarbonDatingLaboratory,ResearchSchoolofPacificStudies,ANU,Canberra(1985))。C4和C3植物δ13C值的差异归因于每种植物的光合循环不同。基于生物学方式的烯烃产品和基于石油的9-二十三烯的pMC和δ13C值列于表29中。表29<table>tableseeoriginaldocumentpage122</column></row><table>基于14C的结果,Ε.coli产生的基于生物学方式的烯烃的碳含量至少88%来源于基于生物学方式的碳。有可能残余ΜΤΒΕ,即纯化过程中所用的基于石油的产品,降低了烯烃样品中基于生物学方式的碳的含量。而且,基于生物学方式的烯烃产品的S13C值,提供了额外的证据证明烯烃产品和其中所含有的碳主要来源于生物来源。本实施例所反映的实验结果证明,基于生物学方式的烃区别于基于石油的烃。具体来说,本实施例证明,生物(诸如表达ο1eA、ο1eB、ο1eC和ο1eD基因的Ε.C01i)所产生的烯烃,可以与基于石油的烯烃区别开来。本文引用的所有参考文献、出版物、专利申请和专利通过引用并入本文,如同每一参考文献均单独且特别指出通过引用的方式并入,且全文并入。在描述本发明的语境中(特别是在下述权利要求的语境中)所用术语“一种(a\an))”和“这种(the)”以及相似的代词,除非另有说明或者上下文另有明确相反说明,都应当理解为涵盖单数和复数。术语“包含”、“具有”、“包括”以及“含有”,除非另有说明,都理解为开放术语(即意思是“包括但不限于”)。本文涉及的数值范围,除非本文另有说明,仅仅意图作为单独提及每个独立数值的简化方法,并且将每个单独的数值并入说明书中,如同其在文中单独引用。除非本文另有说明或者上下文另有明确相反的说明,可以以任何适宜的顺序实施本文所述的所有方法。使用的任何或所有实例或者本文提供的示例性语言(例如“诸如”),除非有相反说明,仅意图更好地说明本发明,而非限制本发明的范围。说明书中的语言不应当理解为表明任何没有请求保护的元素对于实施本发明是必须的。整个说明书中,可能在提及时使用了简化的基因名称或多肽名称,但可以理解的是,此类简化的基因或多肽名称代表基因或多肽的类别。此类基因名称包括编码相同多肽和具有相同生理功能的同源多肽的所有基因。多肽名称包括具有相同活性(例如催化相同的基本化学反应)的所有多肽。本文引用的登录号来自美国国立卫生研究院(NationalInstituteofHealth,U.S.Α)维护的NCBI(NationalCenterforBiotechnologyInformation,国家生物技术信息中心)数据库。登录号与2007年4月15目的数据库中提供的一样。EC号是由生物化学和分子生物学国际联盟命名委员会(NomenclatureCommitteeoftheInternationalUnionofBiochemistryandMolecularBiology,NC-IUBMB)石角定的(可从http://www,chem.qmul.ac.uk/iubmb/enzyme/获得)。本文引用的EC号来自京都基因与基因组百科(KyotoEncyclopediaofGenesandGenomics)维护的KEGG配体数据库(KEGGLiganddatabase),其由东京大学(UniversityofTokyo)部分赞助。EC号与2007年4月的数据库中提供的一样。本文描述了本发明的优选实施方案,包括发明人知道的实施本发明的最佳模式。通过阅读前述描述,可以对这些优选实施方案进行的变动对本领域普通技术人员将变得显而易见。本发明人预期技术人员将在合适的情况下采用此类变动,并且发明人意图以本文特别描述之外的方式实施本发明。因此,本发明包括对所附权利要求涉及的主体在适用法律允许的情况下,进行的所有修改及其等同物。而且,除非另有说明或者上下文另有明确相反指示,所有可能的变化中,上述元素的任何组合,都涵盖于本发明中。权利要求分离的核酸,编码包含选自SEQIDNOs64-74和91-133的氨基酸序列的、不超过1500个氨基酸残基的多肽。2.如权利要求1所述的分离的核酸,其中所述核酸编码第一多肽和第二多肽,其中所述第一和第二多肽中的每一个都不超过1500个氨基酸残基,且其中所述第一和第二多肽中的每一个都包含选自SEQIDNOs:64-74和91-133的氨基酸序列。3.如权利要求1所述的分离的核酸,其中所述核酸编码第一多肽、第二多肽和第三多肽,其中第一、第二和第三多肽中的每一个都不超过1500个氨基酸残基,且其中第一、第二和第三多肽中的每一个都包含选自SEQIDNOs:64-74和91-133的氨基酸序列。4.如权利要求1所述的分离的核酸,其中所述核酸编码第一多肽、第二多肽、第三多肽和第四多肽,其中第一、第二、第三和第四多肽中的每一个都不超过1500个氨基酸残基,且其中第一、第二、第三和第四多肽中的每一个都包含选自SEQIDNOs:64-74和91-133的氨基酸序列。5.分离的核酸,编码包含选自下述氨基酸序列的多肽(a)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO12,SEQIDNO14,SEQIDNO16、SEQIDNO18,SEQIDNO20、SEQIDNO22和SEQIDNO88;(b)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO12,SEQIDNO14,SEQIDNO16、SEQIDNO18,SEQIDNO20、SEQIDNO22禾口SEQIDNO88的同源物;(c)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO12,SEQIDNO14,SEQIDNO16,SEQIDNO18,SEQIDNO20、SEQIDNO:22JPSEQIDNO88的保守变体,包含选自下述的一个或多个保守氨基酸取代Ala取代为Cys、Gly或Ser;Arg取代为Ile、Lys、Met或Orn;Asn取代为Asp、Gln、Glu或His;Asp取代为Asn、Gln或Glu;Cys取代为Met、Ser或Thr;Gln取代为AsruAsp或Glu;Glu取代为AsruAsp或Gln;Gly取代为Acp、Ala或Pro;His取代为Asn或Gln;Ile取代为Leu、Met或Val;Leu取代为lie、Met或Val;Lys取代为Arg、Gln、Glu、lie、Met或Orn;Met取代为Cys、lie、Leu或Val;Phe取代为His、L-Dopa,Leu、Met、Thr,Trp,Tyr,3-苯基脯氨酸、4-苯基脯氨酸或5-苯基脯氨酸;Pro取代为L-I-噻唑烷-4-羧酸或D-或L-I-噁唑烷-4-羧酸;Ser取代为Cys,Met或Thr;Thr取代为Met,Ser或Val;Trp取代为Tyr;Tyr取代为L-Dopa,His或Phe;以及Val取代为lie、Leu、或Met;以及(d)与SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO14、SEQIDNO:16、SEQIDNO:18、SEQIDNO20,SEQIDNO22禾口SEQIDNO:88具有至少约35%序列同一性的序列。6.如权利要求5所述的分离的核酸,其中所述核酸编码包含选自SEQIDN0:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO22和SEQIDNO88的氨基酸序列的多肽。7.如权利要求5所述的分离的核酸,其中所述核酸编码包含选自SEQIDN0:2、SEQIDNO:4、SEQIDNO12和SEQIDNO18的氨基酸序列的多肽。8.如权利要求5所述的分离的核酸,其中所述核酸编码包含SEQIDN0:10的多肽。9.如权利要求5所述的分离的核酸,其中所述核酸编码包含选自SEQIDN0:6、SEQIDNO:14、SEQIDNO20和SEQIDNO88的氨基酸序列的多肽。10.如权利要求5所述的分离的核酸,其中所述核酸编码包含选自SEQIDN0:8、SEQIDNO16和SEQIDNO22的氨基酸序列的多肽。11.如权利要求5所述的分离的核酸,其中所述核酸编码包含氨基酸序列的多肽,所述氨基酸序列选自SEQIDN0:2、SEQIDN0:4、SEQIDN0:6、SEQIDN0:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO20,SEQIDNO22和SEQIDNO88的同源物。12.如权利要求5所述的分离的核酸,其中所述核酸编码包含氨基酸序列的多肽,所述氨基酸序列选自SEQIDN0:2、SEQIDNO:4、SEQIDN0:12和SEQIDN0:18的同源物。13.如权利要求5所述的分离的核酸,其中所述核酸编码包含SEQIDN0:10的同源物的多肽。14.如权利要求5所述的分离的核酸,其中所述核酸编码包含氨基酸序列的多肽,所述氨基酸序列选自SEQIDN0:6、SEQIDNO14,SEQIDNO20禾PSEQIDNO:88的同源物。15.如权利要求5所述的分离的核酸,其中所述核酸编码包含氨基酸序列的多肽,所述氨基酸序列选自SEQIDNO:8、SEQIDNO16和SEQIDNO22的同源物。16.如权利要求5所述的分离的核酸,其中所述核酸编码包含氨基酸序列的多肽,所述氨基酸序列选自SEQIDN0:2、SEQIDN0:4、SEQIDN0:6、SEQIDN0:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO20,SEQIDNO:22和SEQIDNO:88的保守变体,所述保守变体包含选自下述的一个或多个保守氨基酸取代Ala取代为Cys、Gly或Ser;Arg取代为lie、Lys、Met或Orn;Asn取代为Asp、Gin、Glu或His;Asp取代为Asn、Gln或Glu;Cys取代为Met、Ser或Thr;Gln取代为Asn、Asp或Glu;Glu取代为Asn、Asp或Gln;Gly取代为Acp、Ala或Pro;His取代为Asn或Gln;Ile取代为Leu、Met或Val;Leu取代为lie,Met或Val;Lys取代为Arg、Gln、Glu、Ile、Met或Orn;Met取代为Cys、lie、Leu或Val;Phe取代为His、L-Dopa,Leu、Met、Thr,Trp,Tyr,3-苯基脯氨酸、4-苯基脯氨酸或5-苯基脯氨酸;Pro取代为L-I-噻唑烷-4-羧酸或D-或L-I-噁唑烷-4-羧酸;Ser取代为Cys、Met或Thr;Thr取代为Met、Ser或Val;Trp取代为Tyr;Tyr取代为L-Dopa、His或Phe;以及Val取代为lie、Leu或Met。17.如权利要求5所述的分离的核酸,其中所述核酸编码包含氨基酸序列的多肽,所述氨基酸序列选自SEQIDNO:2、SEQIDNO:4、SEQIDNO12和SEQIDNO18的保守变体,所述保守变体包含选自下述的一个或多个保守氨基酸取代Ala取代为Cys、Gly或Ser;Arg取代为lie、Lys、Met或Orn;Asn取代为Asp、Gin、Glu或His;Asp取代为Asn、Gln或Glu;Cys取代为Met、Ser或Thr;Gln取代为Asn、Asp或Glu;Glu取代为Asn、Asp或Gln;Gly取代为Acp、Ala或Pro;His取代为Asn或Gln;Ile取代为Leu、Met或Val;Leu取代为lie、Met或Val;Lys取代为Arg,Gin、Glu、lie、Met或Orn;Met取代为Cys、lie、Leu或Val;Phe取代为His、L_Dopa、Leu、Met、Thr,Trp,Tyr、3_苯基脯氨酸、4-苯基脯氨酸或5-苯基脯氨酸;Pro取代为L-I-噻唑烷-4-羧酸或D-或L-I-噁唑烷-4-羧酸;Ser取代为Cys,Met或Thr;Thr取代为Met,Ser或Val;Trp取代为Tyr;Tyr或L-Dopa,His或Phe;以及Val取代为lie、Leu或Met。18.如权利要求5所述的分离的核酸,其中所述核酸编码包含SEQIDN0:10的保守变体的多肽,所述保守变体包含选自下述的一个或多个保守氨基酸取代Ala取代为Cys、Gly或Ser;Arg取代为Ile、Lys、Met或Orn;Asn取代为Asp、Gln、Glu或His;Asp取代为Asn、Gln或Glu;Cys取代为Met、Ser或Thr;Gln取代为AsruAsp或Glu;Glu取代为AsruAsp或Gln;Gly取代为Acp、Ala或Pro;His取代为Asn或Gln;Ile取代为Leu、Met或Val;Leu取代为lie、Met或Val;Lys取代为Arg、Gin、Glu、lie、Met或Orn;Met取代为Cys,lie、Leu或Val;Phe取代为His、L-Dopa,Leu、Met、Thr,Trp,Tyr,3-苯基脯氨酸、4-苯基脯氨酸或5-苯基脯氨酸;Pro取代为L-I-噻唑烷-4-羧酸或D-或L-I-噁唑烷-4-羧酸;Ser取代为Cys,Met或Thr;Thr取代为Met,Ser或Val;Trp取代为Tyr;Tyr或L-Dopa,His或Phe;以及Val取代为lie、Leu或Met。19.如权利要求5所述的分离的核酸,其中所述核酸编码包含氨基酸序列的多肽,所述氨基酸序列选自SEQIDNO:6、SEQIDNO:14、SEQIDNO20和SEQIDNO88的保守变体,所述保守变体包含一个或多个选自下述的保守氨基酸取代Ala取代为Cys、Gly或Ser;Arg取代为lie、Lys、Met或Orn;Asn取代为Asp、Gin、Glu或His;Asp取代为Asn、Gln或Glu;Cys取代为Met、Ser或Thr;Gln取代为Asn、Asp或Glu;Glu取代为Asn、Asp或Gln;Gly取代为Acp、Ala或Pro;His取代为Asn或Gln;Ile取代为Leu、Met或Val;Leu取代为lie、Met或Val;Lys取代为Arg、Gin、Glu、lie、Met或Orn;Met取代为Cys,lie、Leu或Val;Phe取代为His、L-Dopa,Leu、Met、Thr,Trp,Tyr,3-苯基脯氨酸、4-苯基脯氨酸或5-苯基脯氨酸;Pro取代为L-I-噻唑烷-4-羧酸或D-或L-I-噁唑烷-4-羧酸;Ser取代为Cys,Met或Thr;Thr取代为Met,Ser或Val;Trp取代为Tyr;Tyr或L-Dopa,His或Phe;以及Val取代为lie、Leu或Met。20.如权利要求5所述的分离的核酸,其中所述核酸编码包含氨基酸序列的多肽,所述氨基酸序列选自SEQIDN0:8、SEQIDN0:16和SEQIDNO:22的保守变体,所述保守变体包含一个或多个选自下述的保守氨基酸取代Ala取代为Cys、Gly或Ser;Arg取代为lie、Lys、Met或Orn;Asn取代为Asp、Gin、Glu或His;Asp取代为Asn、Gln或Glu;Cys取代为Met、Ser或Thr;Gln取代为Asn、Asp或Glu;Glu取代为Asn、Asp或Gln;Gly取代为Acp、Ala或Pro;His取代为Asn或Gln;Ile取代为Leu、Met或Val;Leu取代为Ile、Met或Val;Lys取代为Arg、Gln、Glu、Ile、Met或Orn;Met取代为Cys、Ile、Leu或Val;Phe取代为His、L-Dopa,Leu,Met,Thr,Trp>Tyr,3-苯基脯氨酸、4-苯基脯氨酸或5-苯基脯氨酸;Pro取代为L-I-噻唑烷-4-羧酸或D-或L-I-噁唑烷-4-羧酸;Ser取代为Cys、Met或Thr;Thr取代为Met、Ser或Val;Trp取代为Tyr;Tyr或L_Dopa、His或Phe;以及Val取代为lie,Leu或Met。21.如权利要求5所述的分离的核酸,其中所述核酸编码包含氨基酸序列的多肽,所述氨基酸序列选自与SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO22和SEQIDNO88具有至少约35%序列同一性的序列。22.如权利要求5所述的分离的核酸,其中所述核酸编码包含氨基酸序列的多肽,所述氨基酸序列选自与SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO`10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO22和SEQIDNO88具有至少50%序列同一性的序列。23.如权利要求5所述的分离的核酸,其中所述核酸编码包含氨基酸序列的多肽,所述氨基酸序列选自与SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO22和SEQIDNO88具有至少80%序列同一性的序列。24.如权利要求5所述的分离的核酸,其中所述核酸编码第一多肽和第二多肽,其中所述第一和第二多肽中的每一个都包含选自下述的氨基酸序列(a)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO12,SEQIDNO14,SEQIDNO16、SEQIDNO18,SEQIDNO20、SEQIDNO22禾口SEQIDNO88;(b)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO12,SEQIDNO14,SEQIDNO16、SEQIDNO18,SEQIDNO20、SEQIDNO22禾口SEQIDNO88的同源物;(c)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO12,SEQIDNO14、SEQIDNO16、SEQIDNO18,SEQIDNO20、SEQIDNO22禾口SEQIDNO88的保守变体,包含选自下述的一个或多个保守氨基酸取代Ala取代为Cys、Gly或Ser;Arg取代为Ile、Lys、Met或Orn;Asn取代为Asp、Gln、Glu或His;Asp取代为Asn、Gln或Glu;Cys取代为Met、Ser或Thr;Gln取代为AsruAsp或Glu;Glu取代为AsruAsp或Gln;Gly取代为Acp、Ala或Pro;His取代为Asn或Gln;Ile取代为Leu、Met或Val;Leu取代为lie、Met或Val;Lys取代为Arg、Gin、Glu、lie、Met或Orn;Met取代为Cys、lie、Leu或Val;Phe取代为His、L-Dopa、Leu、Met、Thr,Trp,Tyr、3_苯基脯氨酸、4-苯基脯氨酸或5-苯基脯氨酸;Pro取代为L-I-噻唑烷-4-羧酸或D-或L-I-噁唑烷-4-羧酸;Ser取代为Cys,Met或Thr;Thr取代为Met,Ser或Val;Trp取代为Tyr;Tyr或L-Dopa,His或Phe;以及Val取代为lie、Leu或Met;以及(d)与SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDN0:12、SEQIDNO14、SEQIDN0:16、SEQIDNO:18、SEQIDNO20,SEQIDNO22禾口SEQIDNO:88具有至少约35%序列同一性的序列。25.如权利要求5所述的分离的核酸,其中所述核酸编码第一多肽、第二多肽和第三多肽,其中所述第一、第二和第三多肽中的每一个都包含选自下述的氨基酸序列(a)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO12,SEQIDNO14,SEQIDNO16、SEQIDNO18,SEQIDNO20、SEQIDNO22禾口SEQIDNO88;(b)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO12,SEQIDNO14,SEQIDNO16、SEQIDNO18,SEQIDNO20、SEQIDNO22禾口SEQIDNO88的同源物;(c)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO12,SEQIDNO14,SEQIDNO16、SEQIDNO18,SEQIDNO20、SEQIDNO22禾口SEQIDNO88的保守变体,包含选自下述的一个或多个保守氨基酸取代Ala取代为Cys、Gly或Ser;Arg取代为Ile、Lys、Met或Orn;Asn取代为Asp、Gln、Glu或His;Asp取代为Asn、Gln或Glu;Cys取代为Met、Ser或Thr;Gln取代为AsruAsp或Glu;Glu取代为AsruAsp或Gln;Gly取代为Acp、Ala或Pro;His取代为Asn或Gln;Ile取代为Leu、Met或Val;Leu取代为lie、Met或Val;Lys取代为Arg、Gin、Glu、lie、Met或Orn;Met取代为Cys,lie、Leu或Val;Phe取代为His、L-Dopa,Leu、Met、Thr,Trp,Tyr,3-苯基脯氨酸、4-苯基脯氨酸或5-苯基脯氨酸;Pro取代为L-I-噻唑烷-4-羧酸或D-或L-I-噁唑烷-4-羧酸;Ser取代为Cys,Met或Thr;Thr取代为Met,Ser或Val;Trp取代为Tyr;Tyr或L-Dopa,His或Phe;以及Val取代为lie、Leu或Met;以及(d)与SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO14、SEQIDNO:16、SEQIDNO:18、SEQIDNO20,SEQIDNO22禾口SEQIDNO:88具有至少约35%序列同一性的序列。26.如权利要求5所述的分离的核酸,其中所述核酸编码第一多肽、第二多肽、第三多肽和第四多肽,其中所述第一、第二、第三和第四多肽中的每一个都包含选自下述的氨基酸序列(a)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO12,SEQIDNO14、SEQIDNO16、SEQIDNO18,SEQIDNO20、SEQIDNO22禾口SEQIDNO88;(b)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO12,SEQIDNO14,SEQIDNO16、SEQIDNO18,SEQIDNO20、SEQIDNO22禾口SEQIDNO88的同源物;(c)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO12,SEQIDNO14,SEQIDNO16、SEQIDNO18,SEQIDNO20、SEQIDNO22禾口SEQIDNO88的保守变体,包含一个或多个选自下述的保守氨基酸取代Ala取代为Cys、Gly或Ser;Arg取代为Ile、Lys、Met或Orn;Asn取代为Asp、Gln、Glu或His;Asp取代为Asn、Gln或Glu;Cys取代为Met、Ser或Thr;Gln取代为AsruAsp或Glu;Glu取代为AsruAsp或Gln;Gly取代为Acp、Ala或Pro;His取代为Asn或Gln;Ile取代为Leu、Met或Val;Leu取代为lie、Met或Val;Lys取代为Arg、Gin、Glu、lie、Met或Orn;Met取代为Cys、lie、Leu或Val;Phe取代为His、L-Dopa、Leu、Met、Thr,Trp,Tyr、3_苯基脯氨酸、4-苯基脯氨酸或5-苯基脯氨酸;Pro取代为L-I-噻唑烷-4-羧酸或D-或L-I-噁唑烷-4-羧酸;Ser取代为Cys,Met或Thr;Thr取代为Met,Ser或Val;Trp取代为Tyr;Tyr或L-Dopa,His或Phe;以及Val取代为lie、Leu或Met;以及(d)与SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:88具有至少约35%序列同一性的序列。27.如权利要求1-26中任一项所述的分离的核酸,其中所述多肽具有不超过1000个氨基酸残基。28.如权利要求1-27中任一项所述的分离的核酸,其中所述多肽具有不超过800个氨基酸残基。29.如权利要求1-28中任一项所述的分离的核酸,其中所述多肽具有不超过600个氨基酸残基。30.如权利要求1-29中任一项所述的分离的核酸,其中所述多肽具有至少约100个氨基酸残基。31.如权利要求30所述的分离的核酸,其中所述多肽具有至少约200个氨基酸残基。32.如权利要求31所述的分离的核酸,其中所述多肽具有至少约250个氨基酸残基。33.如权利要求1-32中任一项所述的分离的核酸,其中所述核酸分离自细菌、植物、昆虫、酵母、真菌、藻类或动物。34.如权利要求1-33中任一项所述的分离的核酸,其中所述核酸分离自细菌。35.如权利要求1-34中任一项所述的分离的核酸,其中所述细菌是选自下述属的细菌粘球菌属(Anaeromyxobacter)^iiffliiM(Arthrobacter)、蛭弧菌属(Bdellovibrio)、浮微菌属(Blastopirellula)、短杆菌属(Brevibacterium)、伯克氏菌属(Burkholderia)、Candidatus,绿曲挠丝状菌属(Chloroflexus)、棒形杆菌属(Clavibacter)、梭菌属(Clostridium)、科尔韦尔氏菌属(Colwellia)、聚集杆菌属(Congregibacter)、脱硫杆菌属(Desulfatibacillum)、脱硫球菌属(Desulfococcus)、脱硫小杆菌属(Desulfotalea)、脱硫单胞菌属(Desulfuromonas)、黄杆菌目(Flavobacteriales)、出芽菌属(Gemmata)、地杆菌属(Geobacter)、河氏菌属(Hahella)、Jannaschia、动球菌属(Kineococcus)、粘月交球形菌属(Lentisphaera)、海洋杆状菌属(Maricaulis)、海杆菌属(Marinobacterr)>微球菌属(Micrococcus)、微颤菌属(Microscilla)、莫里特拉氏菌属(Moritella)、分枝杆菌属(Mycobacterium)、奈瑟菌属(Neisseria)、诺卡氏菌属(Nocardia)、丰佑菌科(Opitutaceae)、丰佑菌属(Opitutus)、类芽胞杆菌属(Paenibacillus)、粘土杆菌属(Pelobacter)、发光杆菌属(Photobacterium)、光杆状菌属(Photorhabdus)、浮霉菌属(Planctomyces)、Plesiocystis、假交替单胞菌属(Pseudoalteromonas)、7令单胞菌属(Psychromonas)、劳尔氏菌属(Ralstonia)、红球菌属(Rhodococcus)、红小梨形菌属(Rhodopirellula)、玫瑰变色菌属(Roseovarius)、希瓦氏菌属(Shewanella)、寡养单胞菌属(Stenotrophomonas)、链霉菌属(Streptomyces)、黄单胞菌属(Xanthomonas)禾口木杆菌属(Xylella)。36.如权利要求1-35中任一项所述的分离的核酸,其中所述细菌选自粘球菌(Anaeromyxobactersp.)Fwl09_5、金黄节杆菌(Arthrobacteraurescens)、氯酷节杆菌(Arthrobacterchlorophenolicus)、节杆菌(Arthrobactersp.)FB24、BM胃虫至i胃(Bdellovibriobacteriovorus)>Blastopirellulamarina、亚g短If菌(Brevibacteriumlinens)、须芒草伯克氏菌(Burkholderiaambifaria)、洋葱伯克氏胃(Burkholderiacenocepacia)、Burkholderiaoklahomensis>¥鼻Ι·{白克氏菌(Burkholderiapseudomallei)>·{白克氏菌(Burkholderiasp.)383>CandidatusKueneniastuttgartiensis>聚集绿曲挠丝状菌(Chloroflexusaggregans)、橙色绿曲挠丝状菌(Chloroflexusaurantiacus)、密执安棒形杆菌密执安亚种(Clavibactermichiganensissubsp.michiganensis)>密i安棒形If菌坏腐亚禾中(Clavibactermichiganensissubsp.Sepedonicus)、肉毒梭菌(Clostridiumbotulinum)A>肉毒梭菌(Clostridiumbotulinum)A3、肉毒梭菌(Clostridiumbotulinum)Bl、肉毒梭菌(Clostridiumbotulinum)Bf、肉毒梭菌(Clostridiumbotulinum)F、肉毒梭菌(Clostridiumbotulinum)、Colwel1iapsychrerythraea、Congregibacterlitoralis、食烯烃脱硫杆菌(Desulfatibacillumalkenivorans)、食油脱硫球菌(Desulfococcusoleovorans)^Desulfotaleapsychrophila、氧化乙酸月兑硫单胞菌(Desulfuromonasacetoxidans)、黄杆菌目细菌(Flavobacterialesbacterium)、Gemmataobscuriglobus、Geobacterbemidjiensis、Geobacterlovleyi、地杆菌(Geobactersp.)FRC_32、Geobacteruraniumreducens、Hahellachejuensis、Jannaschiasp.、Kineococcusradiotolerans、Lentisphaeraaraneosa、Maricaulismaris、Marinobacteralgicola、Marinobacteraquaeolei、藤黄微球菌(Micrococcusluteus)、Microscillamarina、莫里特拉氏菌(Moritellasp.)PE36、鸟分枝杆菌(Mycobacteriumavium)、鸟分枝杆菌副结核亚禾中(Mycobacteriumaviumsubsp.paratuberculosis)、海分枝杆菌(Mycobacteriummarinum)、分枝杆菌(Mycobacteriumsp.)GP1、结核分枝杆菌(Mycobacteriumtuberculosis)、Mycobacteriumvanbaalenii、淋病奈瑟菌(Neisseriagonorrhoeae)、皮诺卡菌(Nocardiafarcinica)、丰佑菌禾斗细菌(Opitutaceaebacterium)、Opitutusterrae、类芽孢杆菌(Paenibacillussp.)JDR-2、产丙酸粘土杆菌(Pelobacterpropionicus)、深海发光杆菌(Photobacteriumprofundum)、深海发光杆菌(Photobacteriumprofundum)、Photorhabdusluminescenssubsp.laumondii、Planctomycesmaris^Plesiocysitspacifica、大西洋假交替单胞菌(Pseudoalteromonasatlantica)、Psychromonasingrahamii、冷单胞菌(Psychromonassp.)CNPT3、皮氏罗尔其if顿菌(Ralstoniapickettii)、紫红红球菌(Rhodococcusrhodochrous)、红球菌(Rhodococcussp.)、Rhodopirellulabaltica、Roseovariusnubinhibens、亚马逊希瓦氏菌(Shewanellaamazonensis)、波罗的海希瓦氏菌(Shewanellabaltica)、海底希瓦菌(Shewanellabenthica)、反石肖化希瓦氏菌(Shewanelladenitrificans)、冷海希瓦氏菌(Shewanellafrigidimarina)、Shewanellahalifaxensis、Shewanellaloihica、Shewanellaoneidensis、Shewanellapealeana、腐败希瓦氏菌(Shewanellaputrefaciens)、Shewanellasediminis、希瓦氏菌(Shewanellasp.)ANA_3、希瓦氏菌(Shewanellasp.)MR_4、希瓦氏菌(Shewanellasp.)MR_7、希瓦氏菌(Shewanellasp.)W3-18-1、Shewanellawoodyi、嗜麦芽窄食单胞菌(Stenotrophomonasmaltophilia)、产二素链霉菌(Streptomycesambofaciens)、地僅草黄单胞菌(Xanthomonasaxonopodis)、野油菜黄单胞菌(Xanthomonascampestris)、水禾S黄单胞菌(Xanthomonasoryzae)以及昔养木杆菌(Xylellafastidiosa)。37.如权利要求5所述的分离的核酸,其中所述核酸选自SEQIDN0:1、SEQIDNO:3、SEQIDN0:5、SEQIDN0:7、SEQIDN0:9、SEQIDN0:11、SEQIDNO13.SEQIDN0:15、SEQIDNO17.SEQIDNO19.SEQIDN0:21、SEQIDN0:23禾口SEQIDNO:87。38.如权利要求1-37中任一项所述的分离的核酸,还包括可操作地连接于编码所述多肽的核酸的启动子。39.如权利要求38所述的分离的核酸,其中所述启动子是诱导型启动子、组成型启动子或细胞特异性启动子。40.如权利要求39所述的分离的核酸,其中所述启动子是T7启动子、PxylA启动子、Pgrac启动子、GAL1启动子、GAL10启动子或pTrc启动子。41.如权利要求1-40中任一项所述的分离的核酸,还包含至少一种选自下述的其他核酸序列(a)可操作地偶联于编码所述多肽的核酸的调控序列;(b)可操作地偶联于编码所述多肽的核酸的选择标记;(c)可操作地偶联于编码所述多肽的核酸的用于纯化部分;(d)可操作地偶联于编码所述多肽的核酸的分泌序列;(e)可操作地偶联于编码所述多肽的核酸的靶向序列。42.如权利要求1-40中任一项所述的分离的核酸,还包含可操作地偶联于编码所述多肽的所述核酸的选择标记,其中所述选择标记是氨苄青霉素/羧苄青霉素抗性、卡那霉素抗性、氯霉素抗性、红霉素抗性、链霉素/壮观霉素抗性或组氨酸营养缺陷型选择标记基因。43.载体,包含权利要求1-42中任一项所述的分离的核酸。44.如权利要求43所述的载体,其中所述载体是质粒。45.如权利要求43所述的载体,其中所述质粒是pET21b⑴、pCOLADuet-1、pCDFDuet-1、pWHl520、pHTO1、pESC-HIS、pET-21d(+)、pETDuet-1、pACYCDuet-1、pTrcHis2A、pMAL-c2X或pCL1920pTrc。46.细胞,包含权利要求1-42中任一项所述的分离的核酸或权利要求43-45中任一项所述的载体。47.用权利要求1-42中任一项所述的分离的核酸转化的细胞。48.用权利要求43-45中任一项所述的载体转染的细胞。49.如权利要求46-48中任一项所述的细胞,其中所述细胞是酵母细胞、真菌细胞、动物细胞、昆虫细胞、细菌细胞、藻类细胞或植物细胞。50.如权利要求49所述的细胞,其中所述细胞是细菌细胞。51.如权利要求49所述的细胞,其中所述细胞选自以下属埃希氏菌属(Escherichia)、芽孢杆菌属(Bacillus)、乳杆菌属(Lactobacillus)、红球菌属(Rhodococcus)、假单孢菌属(Pseudomonas)、曲霉属(Aspergillus)、木霉属(Trichoderma)、脉孢菌属(Neurospora)、镰孢属(Fusarium)、腐质霉属(Humicola)、根毛霉属(Rhizomucor)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、毛霉属(Mucor)、毁丝霉属(Myceliophtora)、青霉属(Penicillium)、平革菌属(Phanerochaete)、侧耳属(Pleurotus)、栓菌属(Trametes)、金抱属(Chrysosporium)、酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、寡养单胞菌属(Stenotrophamonas)、动球菌属(Kineococcus)、耳口罗威雅属(Yarrowia)或链霉菌属(Streptomyces)。52.如权利要求51所述的细胞,其中所述细胞是迟缓芽孢杆菌(Bacilluslentus)细胞、短芽孢杆菌(Bacillusbrevis)细胞、嗜热酯肪芽孢杆菌(Bacillusstearothermophilus)细胞、地衣芽孢杆菌(Bacilluslicheniformis)细胞、嗜碱芽孢杆菌(Bacillusalkalophilus)细胞、凝结芽孢杆菌(Bacilluscoagulans)细胞、环状芽孢杆菌(Bacilluscirculans)细胞、短小芽孢杆菌(Bacilluspumilis)细胞、苏云金芽孢杆菌(Bacillusthuringiensis)细胞、克劳氏芽孢杆菌(Bacillusclausii)细胞、巨大芽孢杆菌(Bacillusmegaterium)细胞、枯草芽孢杆菌(Bacillussubtilis)细胞或解淀粉芽孢Iflif(Bacillusamyloliquefaciens)细胞。53.如权利要求51所述的细胞,其中所述细胞是康宁木霉(Trichodermakoningii)细胞、绿色木霉(Trichodermaviride)细胞、里氏木霉(Trichodermareesei)细胞、长枝(Trichodermalongibrachiatum)罾(Aspergillusawamori)^f^.'M曲霉(Aspergillusfumigates)细胞、臭曲霉(Aspergillusfoetidus)细胞、构巢曲霉(Aspergillusnidulans)(Aspergillusniger)(Aspergillusoryzae)细胞、特异腐质霉(Humicolainsolens)细胞、疏棉状嗜热丝孢菌(Humicolalanuginose)细胞、米黑根毛霉(Rhizomucormiehei)细胞或米黑毛霉(Mucormichei)细胞。54.如权利要求51所述的细胞,其中所述细胞是变铅青链霉菌(Str印tomyceslividans)细胞或鼠灰链霉菌(Streptomycesmurinus)细胞。55.如权利要求50所述的细胞,其中所述细胞是放线菌(Actinomycetes)细胞。56.如权利要求51所述的细胞,其中所述细胞是大肠杆菌细胞(Escherichiacoli)。57.如权利要求56所述的细胞,其中所述大肠杆菌细胞(Escherichiacoli)是菌株B、菌株C、菌株K或菌株W大肠杆菌(Escherichiacoli)细胞。58.如权利要求49所述的细胞,其中所述细胞选自嗜麦芽窄食单胞菌(Stenotrophomonasmaltophilia)细胞、Kineococcusradiotolerans细胞、巨大芽抱杆菌(Bacillusmegaterium)细胞禾口酉良酒酵母(Saccharomycescerevisiae)细胞。59.如权利要求50所述的细胞,其中所述细胞选自粘球菌(Anaeromyxobactersp.)Fwl09_5、金黄节杆菌(Arthrobacteraurescens)、氯酷节杆菌(Arthrobacterchlorophenolicus)>木干胃(Arthrobactersp.)FB24>Bl胃虫至Μ胃(Bdellovibriobacteriovorus)>Blastopirellulamarina>Mj#fe.|flif(Brevibacteriumlinens)、须芒胃白胃氏lif(Burkholderiaambifaria)>M{β15lif(Burkholderiacenocepacia)>Burkholderiaoklahomensis、类鼻痕伯克氏菌(Burkholderiapseudomallei)、伯克氏菌(Burkholderiasp.)383、CandidatusKueneniastuttgartiensis、聚集绿曲接丝状菌(Chloroflexusaggregans)、橙色绿曲挠丝状菌(Chloroflexusaurantiacus)、密执安棒形杆菌密i安亚禾中(Clavibactermichiganensissubsp.michiganensis)、密i安棒形杆菌坏腐亚禾中(Clavibactermichiganensissubsp.Sepedonicus)、肉毒梭菌(Clostridiumbotulinum)Α、肉毒梭菌(Clostridiumbotulinum)A3、肉毒梭菌(Clostridiumbotulinum)B1、肉毒梭菌(Clostridiumbotulinum)Bf、肉毒梭菌(Clostridiumbotulinum)F>肉毒梭菌(Clostridiumbotulinum)>Colwelliapsychrerythraea>Congregibacterlitoralis、食烯烃脱硫杆菌(Desulfatibacillumalkenivorans)、食油脱硫球菌(Desulfococcusoleovorans)>Desulfotaleapsychrophila>氧化乙酸月兑硫单胞菌(Desulfuromonasacetoxidans)、黄杆菌目细菌(Flavobacterialesbacterium)、Gemmataobscuriglobus、Geobacterbemidjiensis、Geobacterlovleyi、地杆菌(Geobactersp.)FRC-32、Geobacteruraniumreducens、Hahellachejuensis、Jannaschiasp.CCSl、Kineococcusradiotolerans、Lentisphaeraaraneosa、Maricaulismaris、Marinobacteralgicola>Marinobacter已quaeolei、·Jt—i求胃(Micrococcusluteus)、Microscillamarina、莫里特拉氏菌(Moritellasp.)PE36、鸟分枝杆菌(Mycobacteriumavium)、鸟分枝杆菌副结核亚禾中(Mycobacteriumaviumsubsp.paratuberculosis)、海分枝杆菌(Mycobacteriummarinum)、分枝杆菌(Mycobacteriumsp.)GP1、结核分枝杆菌(Mycobacteriumtuberculosis)、Mycobacteriumvanbaalenii、淋病奈瑟菌(Neisseriagonorrhoeae)、皮诺卡菌(Nocardiafarcinica)、丰佑菌禾斗细菌(Opitutaceaebacterium)、Opitutusterrae、类芽孢杆菌(Paenibacillussp.)JDR-2、产丙酸粘土杆菌(Pelobacterpropionicus)、深海发光杆菌(Photobacteriumprofundum)、深海发光杆菌(Photobacteriumprofundum)>Photorhabdusluminescenssubsp.Iaumondii>Planctomycesmaris>Plesiocystispacifica>Hfy^-^-Ifelif(Pseudoalteromonasatlantica)>Psychromonasingrahamii>74"Ifilif(Psychromonassp.)CNPT3>氏罗尔其i顿菌(Ralstoniapickettii)、紫红红球菌(Rhodococcusrhodochrous)、红球菌(Rhodococcussp.)、Rhodopirellulabaltica、Roseovariusnubinhibens、亚马逊希瓦氏菌(Shewanellaamazonensis)、波罗的海希瓦氏菌(Shewanellabaltica)、海底希瓦菌(Shewanellabenthica)、反硝化希瓦氏菌(Shewanelladenitrificans)>冷海希瓦氏菌(Shewanellafrigidimarina)、Shewanellahalifaxensis>Shewanellaloihica、Shewanellaoneidensis、Shewanellapealeana、腐败希瓦氏菌(Shewanellaputrefaciens)>Shewanellasediminis、希瓦氏菌(Shewanellasp.)ANA-3、希瓦氏菌(Shewanellasp.)MR_4、希瓦氏菌(Shewanellasp.)MR_7、希瓦氏菌(Shewanellasp.)W3-18-1、Shewanellawoodyi、嗜麦芽窄食单胞菌(Stenotrophomonasmaltophilia)、产二素链霉菌(Streptomycesambofaciens)、地種草黄单胞菌(Xanthomonasaxonopodis)、野油菜黄单胞菌(Xanthomonascampestris)、7_K禾S黄单胞菌(Xanthomonasoryzae)禾口昔养木杆菌(Xylellafastidiosa)。60.如权利要求49所述的细胞,其中所述细胞选自CHO细胞、COS细胞、VERO细胞、BHK细胞、HeLa细胞、Cvl细胞、MDCK细胞、293细胞、3T3细胞和PC12细胞。61.如权利要求46-60中任一项所述的细胞,其中所述细胞包含参与脂肪酸生物合成途径的基因的变异。62.如权利要求61所述的细胞,其中所述细胞包含编码酰基-CoA脱氢酶的基因的缺失。63.如权利要求61所述的细胞,其中所述细胞包含编码酰基-CoA脱氢酶的基因的突变。64.如权利要求61所述的细胞,其中所述细胞包含编码硫酯酶的基因的缺失。65.如权利要求61所述的细胞,其中所述细胞包含编码硫酯酶的基因的突变。66.如权利要求46-65中任一项所述的细胞,其中所述细胞还包含酰基-CoA合酶。67.如权利要求46-66中任一项所述的细胞,其中所述细胞还包含硫酯酶。68.如权利要求46-67中任一项所述的细胞,其中所述细胞产生烃。69.如权利要求68所述的细胞,其中所述烃是烯烃。70.如权利要求68所述的细胞,其中所述烃是由所述细胞分泌的。71.如权利要求46-67中任一项所述的细胞,其中所述细胞产生脂肪酮。72.细胞,包含权利要求7、12或17中任一项所述的分离的核酸。73.如权利要求72所述的细胞,其中所述细胞是酿酒酵母(Saccharomycescerevisiae)细胞。74.产生烃的方法,包括用底物在足以产生烃的条件下培养权利要求46-70中任一项所述细胞。75.如权利要求74所述的方法,其中所述底物是碳源、脂肪酸、酰基-CoA、酰基-AMP、酰基-ACP、a-烧基酮酸、a-烷基酮酯或脂肪酮。76.如权利要求74或75所述的方法,其中所述细胞的生产率是至少约3mg/L/0D_。77.如权利要求74或75所述的方法,其中所述细胞的生产率是至少约5mg/L/0D_。78.如权利要求74或75所述的方法,其中所述细胞的生产率是至少约8mg/L/0D_。79.如权利要求74或75所述的方法,其中所述细胞的生产率是至少约15mg/L/0D_。80.如权利要求74或75所述的方法,其中所述细胞的生产率是至少约20mg/L/0D_。81.如权利要求74或75所述的方法,其中所述细胞的生产率是至少约30mg/L/0D_。82.如权利要求74-81中任一项所述的方法,还包括分离烃。83.如权利要求82所述的方法,其中从所述细胞中分离所述烃。84.如权利要求82所述的方法,其中从培养所述细胞的培养基中分离所述烃。85.如权利要求74-84中任一项所述的方法,还包括裂化或提纯所述烃。86.如权利要求74-85中任一项所述的方法,其中所述烃的碳链长度为约10至约40个碳。87.如权利要求86所述的方法,其中所述烃的碳链长度为约17至约34个碳。88.如权利要求74-87中任一项所述的方法,其中所述烃是单不饱和的或多不饱和的。89.产生脂肪酮的方法,包括用底物在足以产生脂肪酮的条件下培养权利要求46-67或71-73中任一项所述的细胞。90.如权利要求89所述的方法,其中所述底物是碳源、脂肪酸、酰基-CoA、酰基-AMP或酰基-ACP。91.如权利要求89或90所述的方法,其中所述细胞的生产率是至少约0.lmg/L/0D_。92.如权利要求89或90所述的方法,其中所述细胞的生产率是至少约lmg/L/0D_。93.如权利要求89或90所述的方法,其中所述细胞的生产率是至少约3mg/L/0D_。94.如权利要求89或90所述的方法,其中所述细胞的生产率是至少约6mg/L/0D_。95.如权利要求89或90所述的方法,其中所述细胞的生产率是至少约9mg/L/0D_。96.如权利要求89或90所述的方法,其中所述细胞的生产率是至少约12mg/L/0D_。97.如权利要求89-96中任一项所述的方法,还包括分离脂肪酮。98.如权利要求97所述的方法,其中从所述细胞中分离所述脂肪酮。99.如权利要求97所述的方法,其中从培养所述细胞的培养基中分离所述脂肪酮。100.如权利要求89-99中任一项所述的方法,其中所述脂肪酮的碳链长度为约10至约40个碳。101.如权利要求100所述的方法,其中所述脂肪酮的碳链长度为约19至约31个碳。102.如权利要求89-101中任一项所述的方法,其中脂肪酮是饱和的、单不饱和的或多不饱和的。103.产生纯化的多肽的方法,包括在足以产生分离的核酸编码的多肽的条件下,培养权利要求46-73中任一项所述细胞。104.如权利要求103所述的方法,其中所述多肽是OleA、OleB、OleC、OleD或OleBC。105.产生脂肪酮的方法,包括在足以产生脂肪酮的条件下孵育底物与OleA。106.如权利要求105所述的方法,其中所述底物包含酰基-CoA、酰基-AMP或酰基-ACP。107.产生烃的方法,包括在足以产生烃的条件下孵育底物与OleA、OleB、OleC、OleBC、OleD或其组合。108.如权利要求107所述的方法,包括在足以产生烃的条件下孵育底物与OleA和OleD。109.如权利要求107所述的方法,包括在足以产生烃的条件下孵育底物与OleA、OleC和OleD。110.如权利要求108或109所述的方法,还包括OleB。111.如权利要求107-110中任一项所述的方法,其中所述底物包含酰基-CoA、酰基-AMP或酰基-ACP。112.产生生物燃料的方法,包括权利要求74-102和105-110中任一项所述的方法。113.如权利要求112所述的方法,其中所述生物燃料是汽油、生物柴油或喷气燃料。114.烃,其是由权利要求74-88和107-110中任一项所述的方法产生的。115.烃,其中所述烃的S13C为约-28或更大。116.如权利要求115所述的烃,其中所述烃的S13C为约-27至约-24。117.如权利要求115所述的烃,其中所述烃的S13C为约-15至约-5或更大。118.如权利要求117所述的烃,其中所述烃的S13C为约-30至约-15。119.烃,其中所述烃的pMC为至少约50。120.如权利要求119所述的烃,其中所述烃的pMC为至少约80。121.如权利要求119所述的烃,其中所述烃的pMC为至少约90。122.如权利要求121所述的烃,其中所述烯烃的pMC为至少约92。123.如权利要求122所述的烃,其中所述烃的pMC为至少约50至约100。124.如权利要求114-123中任一项所述的烃,其中所述烃是烯烃。125.如权利要求124所述的烃,其中所述烯烃是单不饱和的。126.如权利要求124所述的烃,其中所述烯烃是多不饱和的。127.如权利要求124所述的烃,其中所述烯烃是双不饱和的。128.如权利要求124所述的烃,其中所述烯烃是三不饱和的。129.如权利要求124-128中任一项所述的烃,其中所述烯烃的碳链长度为约10至约40个碳。130.如权利要求129所述的烃,其中所述烯烃的碳链长度为约19至约33个碳。131.如权利要求114-130中任一项所述的烃,其中所述烃是直链烃。132.如权利要求114-130中任一项所述的烃,其中所述烃是支链烃。133.如权利要求114-130中任一项所述的烃,其中所述烃包含环状部分。134.生物燃料,包含权利要求114-133中任一项所述的烃。135.如权利要求134所述的生物燃料,其中所述生物燃料是汽油、生物柴油或喷气燃料。136.如权利要求134或135所述的生物燃料,其中所述生物燃料来源于碳源。137.如权利要求136所述的生物燃料,其中所述碳源是再生性能源。138.如权利要求137所述的生物燃料,其中所述再生性能源是生物质。139.分离的多肽,包含选自SEQIDNO:2、SEQIDNO:4、SEQIDN012和SEQIDNO18的氨基酸序列,其中,所述氨基酸序列包含一个或多个氨基酸的取代、添加、插入或缺失。140.如权利要求139所述的分离的多肽,其中所述多肽具有克菜森缩合反应活性。141.如权利要求140所述的分离的多肽,其中所述多肽催化两个酰基硫酯的缩合反应。·141.分离的多肽,包含选自SEQIDN0:8、SEQIDN0:16禾口SEQIDNO:22的氨基酸序列,其中所述氨基酸序列包含一个或多个氨基酸的取代、添加、插入或缺失。142.如权利要求141所述的分离的多肽,其中所述多肽具有氧化还原活性。143.如权利要求142所述的分离的多肽,其中所述多肽催化酮的还原。144.分离的核酸,编码与包含选自SEQIDN0:2、SEQIDNO:4、SEQIDN0:8、SEQIDNO:12、SEQIDNO:16、SEQIDNO18和SEQIDNO22的氨基酸序列的多肽具有相同生物学活性的多肽。145.如权利要求144所述的分离的核酸,其中所述分离的核酸包含(i)选自SEQIDNO:1、SEQIDNO:3、SEQIDNO:7、SEQIDNO:11、SEQIDNO:15、SEQIDNO17和SEQIDNO21的核酸序列或其片段或(ii)与选自SEQIDNO:1、SEQIDNO:3、SEQIDNO:7、SEQIDNO:11、SEQIDNO:15、SEQIDNO17和SEQIDNO21的核酸序列的互补物或其片段杂交的核酸序列。146.如权利要求144或145所述的分离的核酸,其中所述生物学活性是克莱森缩合反应活性。147.如权利要求144或145所述的分离的核酸,其中所述生物学活性是两个酰基硫酯的合反应活性。148.如权利要求144或145所述的分离的核酸,其中所述生物学活性是氧化还原活性。149.如权利要求144或145所述的分离的核酸,其中所述生物学活性是还原酮。150.基因工程生物,包含稳定地整合到生物基因组的基因组核酸序列之上游的外源核酸序列,所述基因组核酸序列(a)与选自SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDN0:7、SEQIDN0:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO21和SEQIDNO87的核酸序列具有至少约35%的序列同一性,以及(b)编码多肽。151.如权利要求150所述的基因工程生物,其中所述基因组核酸序列与选自SEQIDNO:USEQIDN0:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO21和SEQIDNO87的核酸序列具有至少80%的序列同一性。152.如权利要求151所述的基因工程生物,其中所述基因组核酸序列与选自SEQIDNO:USEQIDN0:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO21和SEQIDNO87的核酸序列具有至少90%的序列同一性。153.如权利要求152所述的基因工程生物,其中所述基因组核酸序列与选自SEQIDN0:1、SEQIDN0:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO21和SEQIDNO87的核酸序列具有至少95%的序列同一性。154.如权利要求153所述的基因工程生物,其中所述基因组核酸序列包含选自SEQIDN0:1、SEQIDN0:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDN0:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO21和SEQIDNO87的核酸序列。155.如权利要求150-154中任一项所述的生物,其中所述生物选自粘球菌(Anaeromyxobactersp.)Fwl09_5、金黄节杆菌(Arthrobacteraurescens)、氯酷节杆菌(Arthrobacterchlorophenolicus)、节杆菌(Arthrobactersp.)FB24、唾菌蛭弧菌(Bdellovibriobacteriovorus)、Blastopirellulamarina、亚麻短杆菌(Brevibacteriumlinens)、须芒草伯克氏菌(Burkholderiaambifaria)、洋葱伯克氏菌(Burkholderiacenocepacia)、Burkholderiaoklahomensis、类鼻疽伯克氏菌(Burkholderiapseudomallei)、伯克氏菌(Burkholderiasp.)383、CandidatusKueneniastuttgartiensis、聚集绿曲搔丝状菌(Chloroflexusaggregans)、橙色绿曲挠丝状菌(Chloroflexusaurantiacus)、密执安棒形杆菌密执安亚种(Clavibactermichiganensissubsp.michiganensis)、密执安棒形杆菌坏腐亚禾中(Clavibactermichiganensissubsp.Sepedonicus)、肉毒梭菌(Clostridiumbotulinum)A、肉毒梭菌(Clostridiumbotulinum)A3、肉毒梭菌(Clostridiumbotulinum)Bl、肉毒梭菌(Clostridiumbotulinum)Bf、肉毒梭菌(Clostridiumbotulinum)F、肉毒梭菌(Clostridiumbotulinum)、Colwel1iapsychrerythraea、Congregibacterlitoralis、食烯烃脱硫杆菌(Desulfatibacillumalkenivorans)、食油脱硫球菌(Desulfococcusoleovorand)^Desulfotaleapsychrophila、氧化乙酸月兑硫单胞菌(Desulfuromonasacetoxidans)、黄杆菌目细菌(Flavobacterialesbacterium)、Gemmataobscuriglobus、Geobacterbemidjiensis、Geobacterlovleyi、地杆菌(Geobactersp.)FRC_32、Geobacteruraniumreducens、Hahellachejuensis、Jannaschiasp.CCS1、Kineococcusradiotolerans、Lentisphaeraaraneosa、Maricaulismaris、Marinobacteralgicola、Marinobacteraquaeolei、藤黄微球菌(Micrococcusluteus)、Microscillamarina、莫里特拉氏菌(Moritellasp.)PE36、鸟分枝杆菌(Mycobacteriumavium)、鸟分枝杆菌副结核亚禾中(Mycobacteriumaviumsubsp.Paratuberculosis)、海分枝杆菌(Mycobacteriummarinum)、结核分枝杆菌(Mycobacteriumsp.)GP1、结核分枝杆菌(Mycobacteriumtuberculosis)、Mycobacteriumvanbaalenii、淋病奈瑟菌(Neisseriagonorrhoeae)、皮诺卡菌(Nocardiafarcinica)、丰佑菌禾斗细菌(Opitutaceaebacterium)、Opitutusterrae、类芽孢杆菌(Paenibaci1lussp.)JDR—2、产丙酸粘土杆菌(Pelobacterpropionicus)、深海发光杆菌(Photobacteriumprofundum)、深海发光杆菌(Photobacteriumprofundum)、Photorhabdusluminescenssubsp.laumondii、Planctomycesmaris、Plesiocystispacifica、大西洋假交替单胞菌(Pseudoalteromonasatlantica)、Psychromoansingrahamii、冷单胞菌(Psychromonassp.)CNPT3、皮氏罗尔其if顿菌(Ralstoniapickettii)、紫红红球菌(Rhodococcusrhodochrous)、红球菌(Rhodococcussp.)、Rhodopirellulabaltica、Roseovariusnubinhibens、亚马逊希瓦氏菌(Shewanellaamazonensis)、波罗的海希瓦氏菌(Shewanellabaltica)、海底希瓦菌(Shewanellabenthica)、反石肖化希瓦氏菌(Shewanelladenitrificans)、冷海希瓦氏菌(Shewanellafrigidimarina)、Shewanellahalifaxensis、Shewanellaloihica、Shewanellaoneidensis、Shewanellapealeana、腐败希瓦氏菌(Shewanllaputrefaciens)、Shewanellasedimini、希瓦氏菌(Shewanellasp.)ANA_3、希瓦氏菌(Shewanellasp.)MR_4、希瓦氏菌(Shewanellasp.)MR_7、希瓦氏菌(Shewanellasp.)W3-18-1^Shewanellawoodyi、嗜麦芽窄食单胞菌(Stenotrophomonasmaltophilia)、产二素链霉菌(Streptomycesambofaciens)、地僅草黄单胞菌(Xanthomonasaxonopodis)、野油菜黄单胞菌(Xanthomonascampestris)、水禾S黄单胞菌(Xanthomonasoryzae)禾口昔养木杆菌(Xylellafastidiosa)0156.如权利要求150-155中任一项所述的基因工程生物,其中所述外源核酸序列,相对于相同条件下基因组核酸序列编码的多肽在生物整合该外源核酸序列前的表达,增加了同一多肽的表达。157.如权利要求150-156中任一项所述的基因工程生物,其中所述生物相对于相同条件下野生型生物所产生的烃,增加了烃的量。158.鉴定可用于产生烃的酶的方法,包括用编码疑似能产生烃的酶的核酸,转化包含多肽的细胞,所述多肽选自(a)OleA和OleD,(b)OleA和OleC,以及(c)OleC和OleD;以及测定细胞是否产生烃,其中存在所述细胞产生的烃表示所述核酸编码用于产生烃的多肽。159.如权利要求158所述的方法,其中所述OleA与SEQIDNO:2、SEQIDNO:4、SEQIDN0:12或SEQIDNO:18共有至少约35%的序列同一性;其中所述OleC与SEQIDNO:6、SEQIDNO14,SEQIDNO:20或SEQIDNO:88具有至少约35%的序列同一性;且其中所述OleD与SEQIDNO:8、SEQIDNO16或SEQIDNO22共有至少约35%的序列同一性。160.如权利要求158所述的方法,其中所述OleA与SEQIDNO:2、SEQIDNO:4、SEQIDN0:12或SEQIDNO:18共有至少50%的序列同一性;其中所述OleC与SEQIDNO:6、SEQIDNO:14、SEQIDNO20或SEQIDNO88共有至少50%的序列同一性;且其中所述OleD与SEQIDN0:8、SEQIDNO16或SEQIDNO22共有至少50%的序列同一性。161.如权利要求158所述的方法,其中所述OleA与SEQIDNO:2、SEQIDNO:4、SEQIDNO12或SEQIDNO18共有至少80%的序列同一性;其中所述OleC与SEQIDNO:6、SEQIDNO:14、SEQIDNO20或SEQIDNO88共有至少80%的序列同一性;且其中所述OleD与SEQIDN0:8、SEQIDN0:16或SEQIDNO:22共有至少80%的序列同一性。162.分离的多肽,包含选自SEQIDN0:6、SEQIDNO14、SEQIDN0:20禾口SEQIDNO:88的氨基酸序列,其中所述氨基酸序列包含一个或多个氨基酸取代、添加、插入或缺失。163.如权利要求162所述的分离的多肽,其中所述多肽具有腺苷酸化活性。164.通过下述制备的基因工程生物(a)提供具有核酸序列的生物,所述核酸序列与选自SEQIDN0:5、SEQIDNO:7、SEQIDNO:13、SEQIDN0:15、SEQIDN0:19、SEQIDNO:21和SEQIDNO87的核酸序列具有至少约35%的序列同一性,以及(b)使所述核酸序列缺失或突变。165.如权利要求164所述的基因工程生物,其中所述生物通过使核酸序列缺失或突变来制备,所述核酸序列与选自SEQIDN0:5、SEQIDNO:7、SEQIDNO:13、SEQIDNO15,SEQIDNO:19、SEQIDNO21和SEQIDNO87的核酸序列具有至少约80%的序列同一性。166.如权利要求165所述的基因工程生物,其中所述生物通过使核酸序列缺失或突变来制备,所述核酸序列与选自SEQIDN0:5、SEQIDNO7、SEQIDNO:13、SEQIDNO15,SEQIDNO19,SEQIDNO21和SEQIDNO87的核酸序列具有至少约90%的序列同一性。167.如权利要求166所述的基因工程生物,其中所述生物通过使核酸序列缺失或突变来制备,所述核酸序列与选自SEQIDN0:5、SEQIDNO7、SEQIDNO:13、SEQIDNO15,SEQIDNO19,SEQIDNO21和SEQIDNO87的核酸序列具有至少约95%的序列同一性。168.如权利要求167所述的基因工程生物,其中所述生物通过使选自SEQIDNO:5、SEQIDN0:7、SEQIDN0:13、SEQIDN0:15、SEQIDN0:19、SEQIDNO:21禾口SEQIDNO:87的核酸序列缺失或突变来产生。169.如权利要求164-168中任一项所述的生物,其中所述生物选自粘球菌(Anaeromyxobactersp.)Fwl09_5、金黄节杆菌(Arthrobacteraurescens)、氯酷节杆菌(Arthrobacterchlorophenolicus)、节杆菌(Arthrobactersp.)FB24>BM|if|if(Bdellovibriobacteriovorus)>Blastopirellulamarina、亚g短If菌(Brevibacteriumlinens)、须芒草伯克氏菌(Burkholderiaambifaria)、洋葱伯克氏胃(Burkholderiacenocepacia)、Burkholderiaoklahomensis>¥鼻lil白克氏菌(Burkhokderiapseudomallei)>白克氏菌(Burkholderiasp.)383>CandidatusKueneniastuttgartiensis、聚集绿曲挠丝状菌(Chloroflexusaggregans)、橙色绿曲挠丝状菌(Chloroflexusaurantiacus)、密执安棒形杆菌密执安亚种(Clavibactermichiganensissubsp.Michiganensis)>密i安棒形If菌坏腐亚禾中(Clavibactermichiganensissubsp.Sepedonicus)、肉毒梭菌(Clostridiumbotulinum)A>肉毒梭菌(Clostridiumbotulinum)A3、肉毒梭菌(Clostridiumbotulinum)Bl、肉毒梭菌(Clostridiumbotulinum)Bf>肉毒梭菌(Clostridiumbotulinum)F>肉毒梭菌(Clostridiumbotulinum)、Colwelliapsychrerythraea、Congregibacterlitoralis、食烯烃脱硫杆菌(Desulfatibacillumalkenivorans)、食油脱硫球菌(Desulfococcusoleovorans)>Desulfotaleapsychrophila>氧化乙酸月兑硫单胞菌(Desulfuromonasacetoxidans)、黄杆菌目细菌(Flavobacterialesbacterium)、Gemmataobscuriglobus、Geobacterbemidjiensis、Geobacterlovleyi、地杆菌(Geobactersp.)FRC_32、Geobacteruraniumreducens、Hahellachejuensis、Jannaschiasp.CCS1、Kineococcusradiotolerans、Lentisphaeraaraneosa、Maricaulismaris、Marinobacteralgicola>Marinobacteraquaeolei>Jt'll^S^lif(Micrococcusluteus)、Microscillamarina>^M#fel5:|if(Moritellasp.)PE36、鸟干胃(Mycobacteriumavium)、鸟分枝杆菌苜ll结核亚禾中(Mycobacteriumaviumsubsp.Paratuberculosis)、海分枝杆菌(Mycobacteriummarinum)、分枝杆菌(Mycobacteriumsp.)GP1、结核分枝杆菌(Mycobacteriumtuberculosis)、Mycobacteriumvanbaalenii、淋病奈瑟菌(Neisseriagonorrhoeae)、皮诺卡菌(Nocardiafarcinica)、丰佑菌禾斗细菌(Opitutaceaebacterium)、Opitutusterrae、类芽孢杆菌(Paenibacillussp.)JDR-2、产丙酸粘土杆菌(Pelobacterpropionicus)、深海发光杆菌(Photobacteriumprofundum)、深海发光杆菌(Photobacteriumprofundum)、Photorhabdusluminescenssubsp.Laumondii、Planctomycesmaris、Plesiocystispacifica、大西洋假交替单胞菌(Pseudoalteromonasatlantica)、Psychromonasingrahamii、冷单胞菌(Psychromonassp.)CNPT3、皮氏罗尔其J顿菌(Ralstoniapickettii)、紫红红球菌(Rhodococcusrhodochrous)、红球菌(Rhodococcussp.)、Rhodopirellulabaltica、Roseovariusnubinhibens、亚马逊希瓦氏菌(Shewanellaamazonensis)、波罗的海希瓦氏菌(Shewanellabaltica)、海底希瓦菌(Shewanellabenthica)、反石肖化希瓦氏菌(Shewanelladenitrificans)Λ冷海希瓦氏菌(Shewanellafrigidimarina)、Shewane11ahalifaxensisΛShewanellaloihica、Shewanellaoneidensis、Shewanellapealeana、腐败希瓦氏菌(Shewanellaputrefaciens)、Shewanellasediminis、希瓦氏菌(Shewanellasp.)ANA-3、希瓦氏菌(Shewanellasp.)MR_4、希瓦氏菌(Shewanellasp.)MR_7、希瓦氏菌(Shewanellasp.)W3-18-1、Shewanellawoodyi、嗜麦芽窄食单胞菌(Stenotrophomonasmaltophilia)、产二素链霉菌(Streptomycesambofaciens)、地僅草黄单胞菌(Xanthomonasaxonopodis)、野油菜黄单胞菌(Xanthomonascampestris)、水禾S黄单胞菌(Xanthomonasoryzae)禾口昔养木杆菌(Xylellafastidiosa)。170.如权利要求164-169中任一项所述的基因工程生物,其中所述核酸序列在所述生物中的缺失或突变,相对于所述核酸序列编码的多肽在相同条件下、在所述核酸序列的缺失或突变前的生物中的产生,降低相同多肽的产生。171.如权利要求164-170中任一项所述的基因工程生物,其中所述基因工程生物产生酮。全文摘要本发明提供了参与烃和烃中间体合成的分离的核酸和分离的多肽。还提供了参与烃和烃中间体合成的核酸的同源物、保守变体以及与所述核酸具有至少约35%的序列同一性的序列。本发明还提供了产生脂肪酮或烃的方法,以及鉴定用于产生烃的酶的方法。文档编号C12N1/15GK101809146SQ200880014194公开日2010年8月18日申请日期2008年5月20日优先权日2007年5月22日发明者伯纳多·达克斯塔,利萨·弗里德曼申请人:Ls9公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1