专利名称:产生碳氢化合物的方法和组合物的制作方法
产生碳氢化合物的方法和组合物
相关申请的交叉引用
本申请要求2008年5月16日提交的美国临时申请第61/053955号的优先权,在 此将其内容全部并入。
发明背景
石油是地球上发现的、液体、气体或固体形式的有限的天然资源。石油主要由 碳氢化合物组成,碳氢化合物主要由碳和氢组成。石油还含有大量的处于不同形式的其 他元素,例如氮、氧或硫。
石油是宝贵资源,但是以相当大的金融和环境代价对石油产品进行开发。首 先,必须发现石油资源。石油勘探是耗资并有风险的投资。勘探深水井的费用可以超过 1亿美元。此外,不能保证这些井会含有石油。据估计,仅40%的钻井成为产生商业碳 氢化合物的生产井。除经济费用外,石油勘探存在严重的环境代价。例如近海勘探扰乱 周围海洋环境。
发现生产井后,必须以巨大代价从地球开采石油。在初次采收(primary recovery)中,地下的自然压力足以开采约20%的井中石油。当该自然压力降低时,如果 经济上合算,则使用二次采收(secondrecovery)。通常,二次采收涉及通过例如水注射、 天然气注射或气举等增加井压。使用二次采油,采收到另外5%至15%的石油。一旦二 次采收方法不起作用,如果经济上合算,可以使用三次采收方法。三次方法涉及降低石 油的粘度以使其更易开采。使用三次采收方法,采收到另外5%至15%的石油。因此, 即使在最佳条件下,仅可以开采50%的井中石油。石油开采也存在环境代价。例如,石 油开采可以导致大量石油渗漏上升至表面。此外,近海钻井涉及挖掘河床,这扰乱或破 坏周围海洋环境。
因为石油矿藏不是在地球各处均勻发现的,所以石油必须从石油产生区长距离 运输到石油消耗区。除运输费用外,还存在大规模油泄漏的环境风险。
从地球开采的原油在天然形式时具有少数商业用途。其是具有不同长度和复 杂性的碳氢化合物(例如,石蜡(或烷)、烯烃(或烯)、炔、环烷(napthenes)(或环烷 (cylcoalkanes))>脂肪族化合物、芳香族化合物等)的混合物。此外,原油含有其他有机 化合物(例如含有氮、氧、硫等的有机化合物)和杂质(例如硫磺、盐、酸、金属等)。
因此,在商业上可以使用前,必须提炼并纯化原油。由于其高能量密度及其便 利的可运输性,大部分石油被提炼为燃料,例如运输燃料(例如汽油、柴油、航空燃料 等)、燃用油、液化石油气等。
原油还是用于产生石化产品的原材料的主要来源。两类主要的来自石油的原材 料是短链烯烃(例如乙烯和丙烯)和芳香族化合物(例如苯和二甲苯异构体)。这些原材 料来源于原油中较长链的碳氢化合物,这是通过以相当大的费用使用各种方法,例如催 化裂化、蒸汽裂化或催化重整,裂化原油。这些原材料用于制造不能直接从原油提炼的 石化产品,例如单体、溶剂、去垢剂或粘合剂。
来源于原油的原材料的一个实例是乙烯。乙烯被用于生产石化产品,例如聚乙烯、乙醇、氧化乙烯、乙二醇、聚酯、乙二醇醚、乙氧基化物、乙酸乙烯酯、1,2-二 氯乙烷、三氯乙烯、四氯乙烯、氯乙烯和聚氯乙烯。原材料的其他实例是丙烯,丙烯用 于生产异丙醇、丙烯腈、聚丙烯、氧化丙烯、丙烯二醇、乙二醇醚、丁烯、异丁烯、1, 3-丁二烯、合成橡胶、聚烯烃、α-烯烃、脂肪醇、丙烯酸、丙烯聚合物、氯化丙烯、 环氧氯丙烷和环氧树脂。
然后,这些石化产品可以用于制造特种化学品,例如塑料、树脂、纤维、橡 胶、药品、润滑剂或凝胶。可以产自石化材料的具体特种化学品为脂肪酸、碳氢化合 物(例如长链、支链、饱和的、不饱和的等)、脂肪醇、酯、脂肪醛、酮、润滑剂等。
特种化学品具有很多商业用途。脂肪酸在商业上被用作表面活性剂,例如在去 垢剂和肥皂中。它们还可以被用作燃料中的添加剂、润滑油、涂料、漆、蜡烛、色拉 油、起酥油、化妆品和乳化剂。此外,在橡胶产品中脂肪酸被用作促进剂活性剂。脂肪 酸还可以被用作生产甲基酯、酰胺、胺、酰基氯、酐、乙烯酮二聚物以及过氧酸和酯的 原料。
碳氢化合物具有很多商业用途。例如链较短的烷被用作燃料。甲烷和乙烷是天 然气的主要成分。链较长的烷(例如5至16个碳)被用作运输燃料(例如汽油、柴油或航 空燃料)。具有多于16个碳原子的烷是燃油和润滑油的重要组分。即使在室温下为固体 的较长的烷也可以被用作,例如石蜡。含有约35个碳的烷见于用于路面(road surfacing) 的浙青中。此外,可以裂化较长链的烷以生产商业上有用的较短链的碳氢化合物。
与短链烷类似,短链烯被用于运输燃料中。较长链的烯被用于塑料、润滑剂和 合成润滑剂中。此外,烯被用作生产醇类、酯、增塑剂、表面活性剂、叔胺、增强型采 油剂(enhanced oil revovery iigent)、脂肪酸、硫醇、烯基琥珀酸酐、环氧化物、氯化烷、 氯化烯、蜡、燃油添加剂和粘性流减阻剂。
脂肪醇具有很多商业用途。链较短的脂肪醇在化妆品和食品工业中,用作乳化 剂、润滑剂和增稠剂。由于其两性分子属性,脂肪醇起非离子表面活性剂的作用,所述 非离子表面活性剂可用作去垢剂。此外,脂肪醇被用于蜡、树胶、树脂、药物软膏和 洗剂、润滑油添加剂、纺织品抗静电和整理剂、增塑剂、化妆品、工业溶剂和脂肪溶剂 中。
酯具有很多商业用途。例如作为替代燃料的生物柴油是由酯(例如脂肪酸甲基 酯、脂肪酸乙基酯等)组成。一些低分子量的酯是挥发性的,具有令人愉悦的气味,这 使得它们可用作芳香剂或调味剂。另外,酯被用作漆、涂料和清漆的溶剂。此外,一 些天然存在的物质,例如蜡、脂肪和油是由酯组成的。酯还被用作树脂和塑料中的软化 剂、增塑剂、灭火剂以及汽油和油中的添加剂。此外,酯可以用于制造聚合物、胶片、 纺织品、染料和药品。
醛用于生产很多特种化学品。例如,醛用于生产聚合物、树脂(例如胶木 (Bakelite))、染料、调味剂、增塑剂、香水、药品和其他化学品。一些被用作溶剂、防 腐剂或消毒剂。一些天然和合成的化合物,例如维生素和激素是醛。此外,很多糖含有酸基。
酮在商业上被用作溶剂。例如,丙酮常常被用作溶剂,但其也是制造聚合物的 原材料。酮还用于漆、涂料、爆炸物、香水和纺织品加工中。此外,酮用于生产醇、烯、烷、亚胺和烯胺。
此外,原油是润滑剂的来源。来自石油的润滑剂通常由烯烃组成,特别是聚烯 烃和α-烯烃。润滑剂可以从原油提炼或使用提炼自原油的原材料生产。
从原油获得这些特种化学品需要大量的金融投资以及大量的能量。因为原油中 的长链碳氢化合物常常被裂化以产生较小的单体,其也是低效的过程。这些单体然后被 用作生产更复杂的特种化学品的原材料。
除勘探、开采、运输和提炼石油的问题外,石油是有限的并逐渐减少的资源。 估计世界石油消耗为每年300亿桶。据估计,以现有生产水平,世界石油储量预计在 2050年前会耗竭。
最后,基于石油的燃料的燃烧释放温室气体(例如二氧化碳)和其他形式的空气 污染(例如一氧化碳、二氧化硫等)。随着世界对燃料需求的增加,温室气体和其他形式 的空气污染的排放也增加。大气中温室气体的累积导致增加全球变暖。因此,除局部破 坏环境外(例如油泄漏、海洋环境的挖掘等),燃烧石油还破坏全球环境。
由于石油所引起的内在挑战,存在对于不需要像石油一样被勘探、开采、长距 离运输或大量提炼的可再生石油资源的需要。存在对于可以经济地生产而不会产生石油 工业和基于石油的燃料的燃烧所产生的类型的环境破坏的可再生石油资源。基于相似原 因,还存在对于通常来自石油的化学品的可再生资源的需要。
发明_既述
本发明至少部分基于编码碳氢化合物生物合成多肽的蓝细菌基因的鉴定。因 此,在一方面,本发明特征为产生醛的方法,所述方法包括在宿主细胞中产生包含SEQ ID NO 66、68、70、72、74、76、78、80或82的氨基酸序列的多肽或其变体,并从所 述宿主细胞分离所述醛。
在一些实施方案中,所述多肽包含与SEQ ID NO 66、68、70、72、74、76、 78、80或82具有至少约70%、至少约80%、至少约85%、至少约90%、至少约91%、 至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至 少约98%或至少约99%的同一性的氨基酸序列。
在一些实施方案中,所述多肽包含具有一个或多个氨基酸取代、添加、插入或 缺失的SEQ ID NO: 66、68、70、72、74、76、78、80或82的氨基酸序列。在一些实 施方案中,所述多肽具有还原酶活性。在其他实施方案中,所述多肽包含具有一个或多 个保守型氨基酸取代的SEQIDNO 66、68、70、72、74、76、78、80或82的氨基酸序 列。例如,所述多肽包含一个或多个以下保守型氨基酸取代例如丙氨酸、缬氨酸、亮 氨酸和异亮氨酸的脂肪族氨基酸被另一脂肪族氨基酸替换;丝氨酸被苏氨酸替换;苏氨 酸被丝氨酸替换;例如天冬氨酸和谷氨酸的酸性残基被另一酸性残基替换;诸如天冬酰 胺和谷氨酰胺的携带酰胺基的残基被另一携带酰胺基的残基替换;诸如赖氨酸和精氨酸 的碱性残基被另一碱性残基交换;以及诸如苯丙氨酸和酪氨酸的芳香族残基被另一芳香 族残基替换。在一些实施方案中,所述多肽具有约1、2、3、4、5、6、7、8、9、10、 15、20、30、40、50、60、70、80、90、100或更多的氨基酸取代、添加、插入或缺失。 在一些实施方案中,所述多肽具有还原酶活性。
在其他实施方案中,所述多肽包含SEQ ID NO 54、55、56、57、58、59、60、61、62、63或64的氨基酸序列。在某些实施方案中,所述多肽具有还原酶活性。
在另一方面,本发明特征为产生醛的方法,所述方法包括在宿主细胞中表达多 核苷酸,所述多核苷酸包含与SEQ IDNO 65、67、69、71、73、75、77、79或81具有 至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至 少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少 约98%或至少约99%的序列同一性的核苷酸序列。在一些实施方案中,所述核苷酸序列 是SEQ ID NO: 65、67、69、71、73、75、77、79或81。在一些实施方案中,所述方法 还包括从所述宿主细胞分离所述醛。
在其他实施方案中,所述核苷酸序列与SEQ ID NO 65、67、69、71、73、75、77、79或81的互补物或其片段杂交,例如,在低严紧性、中严紧性、高严紧性或非 常高的严紧性条件下。
在其他实施方案中,所述核苷酸序列编码包含以下的多肽(i)SEQIDNO: 66、68、70、72、74、76、78、80或82的氨基酸序列;或(ii)具有一个或多个氨基酸取 代、添加、插入或缺失的SEQ ID NO 66、68、70、72、74、76、78、80或82的氨基 酸序列。在一些实施方案中,所述多肽包含具有一个或多个保守型氨基酸取代的SEQ ID NO: 66、68、70、72、74、76、78、80或82的氨基酸序列。在一些实施方案中,所述 多肽具有还原酶活性。
在其他实施方案中,所述核苷酸序列编码与包含SEQ ID NO: 66、68、70、 72、74、76、78、80或82的氨基酸序列的多肽具有相同生物活性的多肽。在一些实施 方案中,所述核苷酸序列是SEQ IDNO 65、67、69、71、73、75、77、79或81,或其 片段。在其他实施方案中,所述核苷酸序列与SEQ ID NO: 65、67、69、71、73、75、 77、79或81的互补物或其片段杂交,例如在低严紧性、中严紧性、高严紧性或非常高的 严紧性条件下。在一些实施方案中,所述生物活性是还原酶活性。
在一些实施方案中,所述方法包括用重组载体转化宿主细胞,所述重组载体 包含与 SEQ ID NO: 65、67、69、71、73、75、77、79 或 81 具有至少约 70 %、至少 约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少 约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约 99%的序列同一性的核苷酸序列。在一些实施方案中,所述重组载体还包含可操作地连 接到所述核苷酸序列的启动子。在一些实施方案中,所述启动子是发育调节性、细胞器 特异性、组织特异性、诱导型、组成型或细胞特异性启动子。在具体实施方案中,所述 重组载体包含至少一个选自以下的序列(a)可操作地连接到所述核苷酸序列的调节序 列;(b)可操作地连接到所述核苷酸序列的选择标记;(C)可操作地连接到所述核苷酸序 列的标记序列;(d)可操作地连接到所述核苷酸序列的纯化部分;(e)可操作地连接到所 述核苷酸序列的分泌序列;和(f)可操作地连接到所述核苷酸序列的引导序列(targeting sequence) 在某些实施方案中,所述核苷酸序列被稳定并入所述宿主细胞的基因组 DNA,并且所述核苷酸序列的表达受可调型启动子区的控制。
在本文所述的任何方面中,所述宿主细胞可以选自哺乳动物细胞、植物细胞、 昆虫细胞、酵母细胞、真菌细胞、丝状真菌细胞和细菌细胞。
在一些实施方案中,所述宿主细胞是革兰氏阳性细菌细胞。在其他实施方案中,所述宿主细胞是革兰氏阴性细菌细胞。
在一些实施方案中,所述宿主细胞选自以下属埃希氏菌属CEscherichia)、 芽孢杆菌属(Bacillus)、乳酸杆菌属(Lactcybacillus)、红球菌属(Rhodococcus)、假 单胞菌属(Pseudomonas)、曲霉属(Aspergillus)、木霉属(Trichoderma)、脉孢菌属 (Neurospora)、镰刀菌属(Fusarium)、腐质霉属(Humicola)、根毛霉属(Rhizomucor) > 克鲁维酵母菌属(Kluyveromyces)、毕赤酵母属(Pichia)、毛霉菌属(Mucor)、蚀丝霉属 (Myceliophtora)、青霉属(Penicillium)、平革菌属(Phanerochaete)、侧耳属(Pleurotus)、 栓菌属(Trametes)、金黄孢子菌属(Chrysosporium)、酵母属Maccharomyces)、寡养单胞 菌属(Stenotrophamonas)、裂殖酵母属(Schizosaccharomyces)、耳口 氏酵母属(Yarrowia)或 链霉菌属(Streptomyces)。
在具体实施方案中,所述宿主细胞为迟缓芽孢杆菌(Bacillus lentus)细胞、短芽 孢杆菌(Bacillusbrevis)细胞、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)细胞、地衣 芽孢杆菌(Bacilluslicheniformis)细胞、嗜碱芽孢杆菌(Bacillusalkalophilus)细胞、凝结 芽孢杆菌(Bacillus coagulans)细胞、环状芽孢杆菌(Bacillus circulans)细胞、短小芽孢杆 菌(Bacilluspumilis)细胞、苏云金芽孢杆菌(Bacillusthuringiensis)细胞、克劳氏芽孢杆菌 (Bacillus clausii)细胞、巨大芽孢杆菌(Bacillusii^gaterium)细胞、枯草芽孢杆菌(Bacillus subtilis)细胞或解淀粉芽孢杆菌(Bacillusamyloliquefaciens)细胞。
在其他实施方案中,宿主细胞为康氏木霉(Trichodermakoningii)细胞、绿色木 霉(Trichoderma viride)细胞、里氏木霉(Trichodermareesei)细胞、长枝木霉(Trichoderma longibrachiatum)细胞、泡盛曲霉(Aspergillus awamori)细胞、烟曲霉(Aspergillus fomigates)细胞、臭曲霉(Aspergillus foetidus)细胞、构巢曲霉(Aspergillus nidulans) 细胞、黑曲霉(Aspergillus niger)细胞、米曲霉(Aspergillus oryzae)细胞、特异腐质 霉(Humicola insolens)细胞、棉毛状腐质霉(Humicola lanuginose)细胞、混浊红球菌 (Rhodococcusopacus)细胞、米黑根毛霉(Rhizomucormiehei)细胞或米黑毛酶(Mucor michei)细胞。
仍然在其他实施方案中,所述宿主细胞是浅青紫链霉菌Mtreptomyceslividans) 细胞或鼠灰链霉菌Mtreptomycesmurimis)细胞。在其他实施方案中,宿主细胞是放线菌 (Actinomycetes)细胞。
在一些实施方案中,所述宿主细胞是CHO细胞、COS细胞、VERO细胞、BHK 细胞、HeLa细胞、Cvl细胞、MDCK细胞、293细胞、3T3细胞或PC12细胞。
在具体实施方案中,所述宿主细胞是大肠杆菌(E.coli)细胞、例如菌株B、菌株 C、菌株K或菌株W大肠杆菌细胞。
在其他实施方案中,所述宿主细胞是蓝细菌宿主细胞。在具体实施方案中,所 述蓝细菌宿主细胞是表1中列出的细胞。
在一些实施方案中,所述醛是由所述宿主细胞分泌的。
在某些实施方案中,所述宿主细胞超表达本文所述的底物。在一些实施方案 中,所述方法还包括用编码本文所述酶的核酸转化宿主细胞,并且所述宿主细胞超表达 本文所述的底物。在其他实施方案中,所述方法还包括在至少一种本文所述的底物的存 在下培养所述宿主细胞。在一些实施方案中,所述底物是脂肪酸衍生物、酰基ACP、脂肪酸、酰基CoA(酰基辅酶A)、脂肪醛、脂肪醇或脂肪酯。
在一些实施方案中,所述脂肪酸衍生物底物是不饱和脂肪酸衍生物底物、单不 饱和脂肪酸衍生物底物或饱和脂肪酸衍生物底物。在其他实施方案中,所述脂肪酸衍生 物底物是直链脂肪酸衍生物底物、支链脂肪酸衍生物底物或包括环状部分的脂肪酸衍生 物底物。
在一些实施方案中,所述脂肪酸衍生物是C3-C2Jg肪酸衍生物。例如,所述脂 肪酸衍生物是 c3、c4、c5、c6、c7、c8、c9、 ClO、Cn、Ci2、Ci3、Ci4、Ci5、Ci6、Ci7、 C18、C19、C20> C21 > C22> C23、Q4或<^5脂肪酸衍生物。在具体实施方案中,所述脂肪 酸衍生物底物是十四烷酰-ACP、十六烷酰-ACP、十六烯酰-ACP或十八烯酰-ACP。
在本文所述方面的某些实施方案中,所述醛是C3-Cm醛。例如,所述醛是C3、 C4、C5、C6 Λ C7、C8 Λ C9、ClO、Cn、Ci2、Ci3、C14 Λ Ci5、Ci6、Ci7、Ci8、C19 Λ C2o、 C21 > C22> C23、Q4或Q5醛。在一些实施方案中,所述醛是十四烷醛、十六烷醛、十六 烯醛、十八烷醛、十八烯醛、甲基十四烷醛、甲基十四烯醛、甲基十六烷醛、甲基十六 烯醛、甲基十八烷醛或甲基十八烯醛。
在一些实施方案中,所述醛是直链醛、支链醛或环状醛。
在一些实施方案中,所述方法还包括从宿主细胞或从培养基分离所述醛。
在另一方面,本发明特征为遗传改造的微生物,其包含稳定并入所述微生物的 基因组DNA的外源控制序列。在一个实施方案中,所述控制序列被整合到多核苷酸的上 游,该多核苷酸包含与SEQ IDNO 65、67、69、71、73、75、77、79或81具有至少约 70%的序列同一性的核苷酸序列。在一些实施方案中,所述核苷酸序列与SEQ ID NO: 65、67、69、71、73、75、77、79 或 81 具有至少约 75%、至少约 80%、至少约 85%、 至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至 少约96%、至少约97%、至少约98%或至少约99%的序列同一性。在一些实施方案中, 所述核苷酸序列是 SEQIDNO 65、67、69、71、73、75、77、79 或 81。
在一些实施方案中,所述多核苷酸对于所述微生物来说是内源的。在一些实施 方案中,所述微生物相对于野生型微生物表达水平增高的醛。在一些实施方案中,所述 微生物是蓝细菌(cyanobacterium)。
在另一方面,本发明特征为制造醛的方法,所述方法包括在适于基因表达的条 件下,培养本文所述的遗传改造的微生物,并分离所述醛。
在另一方面,本发明特征为制造醛的方法,所述方法包括使底物与以下接触 ⑴与SEQ ID NO: 66、68、70、72、74、76、78、80或82的氨基酸序列具有至少70% 的同一性的多肽或其变体;(ii)与 SEQIDNO: 65、67、69、71、73、75、77、79 或 81 具有至少70%的同一性的核苷酸序列所编码的多肽或其变体;或(iii)包含SEQ ID NO 54, 55、56、57、58、59、60、61、62、63或64的氨基酸序列的多肽。在一些实施方案 中,所述多肽具有还原酶活性。
在一些实施方案中,所述多肽与SEQ ID NO 66、68、70、72、74、76、78、 80或82具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少 约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约 99%的同一性。在一些实施方案中,所述多肽具有SEQ IDNO 66、68、70、72、74、76、78、80或82的氨基酸序列。
在一些实施方案中,所述多肽由与SEQ ID NO 65、67、69、71、73、75、77、79或81具有至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、 至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至 少约98%或至少约99%的序列同一性的核苷酸序列编码。在一些实施方案中,所述多肽 由具有SEQ ID NO: 65、67、69、71、73、75、77、79或81的核苷酸序列编码。
在一些实施方案中,所述生物底物是脂肪酸衍生物、酰基ACP、脂肪酸、酰基 CoA,脂肪醛、脂肪醇或脂肪酯。
在一些实施方案中,所述脂肪酸衍生物是C3-C2Jg肪酸衍生物。例如,所述脂 肪酸衍生物是 c3、c4、c5、c6、c7、c8、c9、 ClO、Cn、Ci2、Ci3、Ci4、Ci5、Ci6、Ci7、 C18、C19、C20> C21 > C22> C23、Q4或<^5脂肪酸衍生物。在具体实施方案中,所述脂肪 酸衍生物底物是十四烷酰-ACP、十六烷酰-ACP、十六烯酰-ACP或十八烯酰-ACP。
在某些实施方案中,所述醛是C3-Q5醛。例如,所述醛是C3、C4、C5、C6、 C7、C8 λ C9、Cio、C11 Λ Ci2、Ci3、Ci4、Ci5、Ci6、Ci7、Ci8、C19 Λ C2o、C2I Λ C22、C23、C24 或(^5醛。在一些实施方案中,所述醛是十四烷醛、十六烷醛、十六烯醛、十八烷醛、 十八烯醛、甲基十四烷醛、甲基十四烯醛、甲基十六烷醛、甲基十六烯醛、甲基十八烷 醛或甲基十八烯醛。
在一些实施方案中,所述醛是直链醛、支链醛或环状醛。
在另一方面,本发明特征为由本文所述的任何方法或微生物所产生的醛。在 具体实施方案中,所述醛的S "C为约-15.4或更高。例如,所述醛的δ "C为约-15.4 至约-10.9,例如约-13.92至约-13.84。在其他实施方案中,所述醛的fMMC为至少约 1.003。例如,所述醛的至少约1.01或至少约1.5。在一些实施方案中,所述醛 的fMwC为约1.111至约1.124。
在另一方面,本发明特征为产生脂肪醇的方法,所述方法包括在宿主细胞中产 生包含SEQ ID NO: 66、68、70、72、74、76、78、80或82的氨基酸序列的多肽或其变 体,并且从所述宿主细胞分离所述脂肪醇。在一些实施方案中,所述脂肪醇由所述细胞 分泌。
在一些实施方案中,所述多肽包含与SEQ ID NO 66、68、70、72、74、76、78、80或82具有至少约70%、至少约80%、至少约85%、至少约90%、至少约91%、 至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至 少约98%或至少约99%的同一性的氨基酸序列。
在一些实施方案中,所述多肽包含具有一个或多个氨基酸取代、添加、插入或 缺失的SEQ ID NO: 66、68、70、72、74、76、78、80或82的氨基酸序列。在一些实 施方案中,所述多肽具有还原酶活性。在其他实施方案中,所述多肽包含具有一个或多 个保守型氨基酸取代的SEQIDNO 66、68、70、72、74、76、78、80或82的氨基酸序列。例如,所述多肽包含一个或多个以下保守型氨基酸取代诸如丙氨酸、缬氨酸、亮 氨酸和异亮氨酸的脂肪族氨基酸被另一脂肪族氨基酸替换;丝氨酸被苏氨酸替换;苏氨 酸被丝氨酸替换;诸如天冬氨酸和谷氨酸的酸性残基被另一酸性残基替换;诸如天冬酰 胺和谷氨酰胺的携带酰胺基的残基被另一携带酰胺基的残基替换;诸如赖氨酸和精氨酸的碱性残基被另一碱性残基交换;以及诸如苯丙氨酸和酪氨酸的芳香族残基被另一芳香 族残基替换。在一些实施方案中,所述多肽具有约1、2、3、4、5、6、7、8、9、10、 15、20、30、40、50、60、70、80、90、100或更多个氨基酸取代、添加、插入或缺失。 在一些实施方案中,所述多肽具有还原酶活性。
在其他实施方案中,所述多肽包含SEQ ID NO 54、55、56、57、58、59、 60、61、62、63或64的氨基酸序列。在某些实施方案中,所述多肽具有还原酶活性。
在另一方面,本发明特征为产生脂肪醇的方法,所述方法包括在宿主细胞中表 达多核苷酸,所述多核苷酸包含与SEQ IDNO 65、67、69、71、73、75、77、79或 81具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约 91%,至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约 97%,至少约98%或至少约99%的序列同一性的核苷酸序列。在一些实施方案中,所述 核苷酸序列是SEQ ID NO 65、67、69、71、73、75、77、79或81。在一些实施方案 中,所述方法还包括从所述宿主细胞分离所述脂肪醇。
在其他实施方案中,所述核苷酸序列与SEQ ID NO 65、67、69、71、73、75、77、79或81的互补物或其片段杂交,例如,在低严紧性、中严紧性、高严紧性或非 常高的严紧性条件下。
在其他实施方案中,所述核苷酸序列编码包含以下的多肽(i)SEQIDNO: 66、68、70、72、74、76、78、80或82的氨基酸序列;或(ii)具有一个或多个氨基酸取 代、添加、插入或缺失的SEQ ID NO 66、68、70、72、74、76、78、80或82的氨基 酸序列。在一些实施方案中,所述多肽包含具有一个或多个保守型氨基酸取代的SEQ ID NO: 66、68、70、72、74、76、78、80或82的氨基酸序列。在一些实施方案中,所述 多肽具有还原酶活性。
在其他实施方案中,所述核苷酸序列编码与包含SEQ ID NO: 66、68、70、 72、74、76、78、80或82的氨基酸序列的多肽具有相同生物活性的多肽。在一些实施 方案中,所述核苷酸序列是SEQ IDNO 65、67、69、71、73、75、77、79或81,或其 片段。在其他实施方案中,所述核苷酸序列与SEQ ID NO: 65、67、69、71、73、75、 77、79或81的互补物或其片段杂交,例如,在低严紧性、中严紧性、高严紧性或非常高 的严紧性条件下。在一些实施方案中,所述生物活性是还原酶活性。
在一些实施方案中,所述方法包括用重组载体转化宿主细胞,所述重组载体 包含与 SEQ ID NO: 65、67、69、71、73、75、77、79 或 81 具有至少约 70 %、至少 约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少 约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约 99%的序列同一性的核苷酸序列。在一些实施方案中,所述重组载体还包含可操作地连 接到所述核苷酸序列的启动子。在一些实施方案中,所述启动子是发育调节性、细胞器 特异性、组织特异性、诱导型、组成型或细胞特异性启动子。在具体实施方案中,所述 重组载体包含至少一个选自以下的序列(a)可操作地连接到所述核苷酸序列的调节序 列;(b)可操作地连接到所述核苷酸序列的选择标记;(C)可操作地连接到所述核苷酸序 列的标记序列;(d)可操作地连接到所述核苷酸序列的纯化部分;(e)可操作地连接到所 述核苷酸序列的分泌序列;和(f)可操作地连接到所述核苷酸序列的引导序列。在某些实施方案中,所述核苷酸序列被稳定地并入所述宿主细胞的基因组DNA,并且所述核苷 酸序列的表达受可调型启动子区的控制。
在一些实施方案中,所述方法还包括在所述宿主细胞中表达编码重组醇脱氢酶 的基因。
在本文所述的本发明的任何方面中,所述方法可以产生包含C6-C26脂肪醇的脂 肪醇。在一些实施方案中,所述脂肪醇包含C6、C7、C8> C9> c10> cn、c12、c13、c14、 C15、C16、C17、C18、C19、C2Q、C21 > C22> C23、C24、Q5 或 C26 脂肪醇。在具体实施方 案中,所述脂肪醇是1-癸烷醇、1-十二烷醇、1-肉豆蔻醇、1-十六烷醇、十八烯醇、 十四烯醇或十六烯醇。
在其他实施方案中,所述脂肪醇包含直链脂肪醇。在其他实施方案中,所述脂 肪醇包含支链脂肪醇。在其他实施方案中,所述脂肪醇包含环状部分。
在一些实施方案中,所述脂肪醇是不饱和脂肪醇。在其他实施方案中,所述脂 肪醇是单不饱和脂肪醇。在其他实施方案中,所述脂肪醇是饱和脂肪醇。
在另一方面,本发明特征为由本文所述的任何方法或任何微生物所产生的脂肪 醇,或包含本文所述的任何方法或任何微生物所产生的脂肪醇的表面活性剂。
在一些实施方案中,所述脂肪醇的δ "C为约-15.4或更高。在某些实施方案 中,所述脂肪醇的δ 13C为约-15.4至约-10.9,或δ 13C为约-13.92至约-13.84。
在一些实施方案中,所述脂肪醇的fMWC为至少约1.003。在某些实施方案中, 所述脂肪醇的fMwC为至少约1.01或至少约1.5。在一些实施方案中,所述脂肪醇的fMwC 为约1.111至约1.124。
在另一方面,本发明特征为由SEQ ID NO 65、67、69、71、73、75、77、79或81的不多于约500个核苷酸组成分离的核酸。在一些实施方案中,所述核酸由SEQ ID NO: 65、67、69、71、73、75、77、79或81的不多于约300个核苷酸、不多于约350个 核苷酸、不多于约400个核苷酸、不多于约450个核苷酸、不多于约550个核苷酸、不多 于约600个核苷酸或不多于约650个核苷酸组成。在一些实施方案中,所述核酸编码具 有还原酶活性的多肽。
在另一方面,本发明特征为由不多于约99%、不多于约98%、不多于约97%、 不多于约96%、不多于约95%、不多于约94%、不多于约93%、不多于约92%、不多于 约91%、不多于约90%、不多于约85%或不多于约80%的SEQ ID NO 65、67、69、71、73、75、77、79或81的核苷酸组成的分离的核酸。在一些实施方案中,所述核酸编 码具有还原酶活性的多肽。
在另一方面,本发明特征为由SEQ ID NO 66、68、70、72、74、76、78、80 或82的不多于约200、不多于约175、不多于约150或不多于约100个氨基酸组成的分离的多肽。在一些实施方案中,所述多肽具有还原酶活性。
在另一方面,本发明特征为由不多于约99%、不多于约98%、不多于约97%、 不多于约96%、不多于约95%、不多于约94%、不多于约93%、不多于约92%、不多于 约91%、不多于约90%、不多于约85%或不多于约80%的SEQ ID NO 66、68、70、72、74、76、78、80或82的氨基酸组成的分离的多肽。在一些实施方案中,所述多肽具 有还原酶活性。
定义
在整个本说明书中,可以使用缩写基因名称或多肽名称进行引用,但是应当理 解到,该缩写基因或多肽名称表示基因或多肽的种类。这些基因名称包括编码相同多肽 和具有相同生理功能的同源多肽的所有基因。多肽名称包括具有相同活性(例如催化相 同基础化学反应活性)的所有多肽。
本文引用的登录号来自美国国立卫生研究院(National Institute ofHealth, U.S.Α)所维护的NCBI数据库(国家生物技术信息中心(NationalCenter for Biotechnology hiformation))。除非另作说明,登录号按照截止到2009年四月的数据库中提供的。
EC号由国际生物化学和分子生物学联盟命名委员会(NomenclatureCommittee of the International Union of Biochemistry and Molecular Biology (NC-IUBMB))(可获取自 http://www.chem.qmul.ac.uk/iubmb/enzvme/)制定。本文引用的EC号来自由东京大学 部分资助的京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomics)所维 护的KEGG配体数据库。除非另作说明,EC号按照截止到2008年三月的数据库中提供 的。
本文所用冠词“a”和“an”是指该冠词的一个或多于一个(即至少一个)语 法对象。作为实例,“元件(an element)”表示一个元件或多于一个元件。
本文所用术语“约”表示给定数值的士20%的值。因此,“约60%”表示在 60士 (60 ^ 20% )之间的值(即48至70)。
如本文所用术语“醛”表示具有通式RCHO的碳氢化合物,所述RCHO特征为 不饱和羰基(C = O)。在优选的实施方案中,所述醛是产生自脂肪酸或脂肪酸衍生物的 任何醛。在一个实施方案中,R基长度为至少约1、2、3、4、5、6、7、8、9、10、11、 12、13、14、15、16、17、18、19 或 20 个碳。
如本文所用的“醛生物合成基因”或“醛生物合成多核苷酸”是编码醛生物合 成多肽的核酸。
如本文所用的“醛生物合成多肽”是作为醛的生物合成途径的部分的多肽。这 些多肽可以作用于生物底物以产生醛。在一些情况下,所述醛生物合成多肽具有还原酶 活性。
如本文所用的术语“烷”表示仅含有单一碳-碳键的碳氢化合物。
如本文所用的“烷生物合成基因”或“烷生物合成多核苷酸”是编码烷生物合 成多肽的核酸。
如本文所用的“烷生物合成多肽”是作为烷的生物合成途径的部分的多肽。这 些多肽可以作用于生物底物以产生烷。在一些情况下,所述烷生物合成多肽具有脱羰酶 活性。
如本文所用的“烯生物合成基因”或“烯生物合成多核苷酸”是编码烯生物合 成多肽的核酸。
如本文所用的“烯生物合成多肽”是作为烯的生物合成途径的部分的多肽。这 些多肽可以作用于生物底物以产生烯。在一些情况下,所述烯生物合成多肽具有脱羰酶 活性。
如本文所用的术语“减弱”表示削弱、降低或缩小。例如,可以通过修饰多肽来减弱多肽以降低其活性(例如,通过修饰编码所述多肽的核苷酸序列)。
如本文所用的术语“生物柴油”表示可以作为来源于石油的柴油的替代品的生 物燃料。生物柴油可以以被称为“纯(neat)”生物柴油的纯品形式或作为以任何浓度与 基于石油的柴油的混合物用于内燃柴油发动机。生物柴油可以包括酯或碳氢化合物,例 如醛和烷。
如其中所用的术语“生物燃料”是指来源于生物量的任何燃料。生物燃料可以 替代基于石油的燃料。例如,生物燃料包括运输工具燃料(例如汽油、柴油、喷气燃料 (jet fuel)等)、燃用燃料和发电燃料。生物燃料是可再生能源。
如本文使用,术语“生物量”是指来源于生物材料的碳源。生物量可以被转变 为生物燃料。生物量的一个示例性来源是植物物质。例如,玉米、甘蔗或柳枝稷可以 用作生物量。生物量的另一非限制性实例是动物物质,例如牛粪。生物量还包括来自工 业、农业、林业和家庭的废品。可以用作生物量的这些废品的实例是发酵废渣、秸秆、 无用杂物、污水、垃圾和剩余食物。生物量还包括例如碳水化合物(例如单糖、二糖或 多糖)的碳源。
如本文所用的短语“碳源”是指适于用作原核或简单真核细胞生长的碳的来源 的底物或化合物。碳源可以是不同形式的,包括但不限于聚合物、碳水化合物、酸、 醇、醛、酮、氨基酸、肽和气体(例如CO和CO2)。这些包括,例如各种单糖,例如葡 萄糖、果糖、甘露糖和半乳糖;寡糖,例如低聚果糖和低聚半乳糖;多糖,例如木糖和 阿拉伯糖;二糖,例如蔗糖、麦芽糖和松二糖;纤维素原料,例如甲基纤维素和羧甲基 纤维素钠;饱和或不饱和脂肪酸酯,例如琥珀酸酯、乳酸酯和醋酸酯;醇,例如乙醇或 其混合物。碳源还可以是光合作用的产物,包括但不限于葡萄糖。优选的碳源是生物 量。另一优选的碳源是葡萄糖。
如本文所用的“降低浊点的添加剂”是添加到组合物以减少或降低溶液的浊点 的添加剂。
如本文所用的短语“液体的浊点”表示溶解的固体不再完全可溶的温度。在该 温度下,固体开始作为第二相沉淀,给予液体浑浊的外观。在石油工业中,浊点是指这 样的温度在该温度下固化物质或其他重碳氢化合物在原油、提炼油或燃料中结晶以形 成浑浊的外观。固化物质的存在影响该液体的流动特性、该液体堵塞燃料过滤器、喷嘴 的倾向等、固化物质在冷表面(例如管道或热交换器污垢)上的聚积以及该液体与水的乳 化特性。
如果两个序列的每个碱基都匹配(即能够形成Watson Crick碱基对),则核苷酸 序列与另一核苷酸序列是“互补的”。术语“互补链”在本文中与术语“互补物”互 换使用。核酸链的互补物可以是编码链的互补物或非编码链的互补物。
如本文所用的术语“足以允许表达的条件”表示允许宿主细胞产生诸如本文所 述的多肽、醛或烷的所需产物的任何条件。合适的条件包括,例如发酵条件。发酵条件 可以包含很多参数,例如温度范围、通气水平和培养基组分。这些条件中每一个单独地 并联合地允许宿主细胞生长。示例性培养基包括培养液或胶。通常,所述培养基包括诸 如葡萄糖、果糖、纤维素等的碳源,该碳源可以直接被宿主细胞代谢。此外,培养基中 可以使用酶以便于动员(例如淀粉或纤维素的解聚为可发酵的糖) 和随后碳源的代谢。
为了确定条件是否足以允许表达,可以将宿主细胞培养例如约4、8、12、24、 36或48小时。培养中和/或培养后,可以获取样品并分析样品以确定该条件是否允许表 达。例如,可以测试样品或宿主细胞在其中生长的培养基中的宿主细胞的所需产物的存 在。当测试产物的存在时,可以使用诸如但不限于TLC、HPLC> GC/FID、GC/MS、 LC/MS、MS的检测。
应当理解到,本文所述的多肽可以具有另外的对于多肽功能没有本质影响的保 守型或非必需氨基酸取代。特定取代是否会被允许(即不会不利地影响例如脱羧酶活性 的所需生物性质),可以按照Bowie et al.,Science(1990) 247 13061310中所述进行测 定。“保守型氨基酸取代”是氨基酸残基被具有相似侧链的氨基酸残基所替代的取代。 具有相似侧链的氨基酸残基的家族在本领域中已有定义。这些家族包括具有以下侧链的 氨基酸碱性侧链(例如赖氨酸、精氨酸、组氨酸)、酸性侧链(例如天冬氨酸、谷氨 酸)、不带电荷的极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨 酸、半胱氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙 氨酸、甲硫氨酸、色氨酸)、β-分枝侧链(例如苏氨酸、缬氨酸、异亮氨酸)和芳香族 侧链(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。
如本文所用的“控制元件”表示转录控制元件。控制元件包括启动子和增强 子。术语“启动子元件”、“启动子”或“启动子序列”是指作为激活基因表达的开 关发挥功能的DNA序列。如果基因被激活,认为其被转录或参与转录。转录涉及由基 因合成mRNA。因此,启动子充当转录调节元件并且还提供基因转录为mRNA的起始 位点。控制元件与参与转录的细胞蛋白特异性相互作用(Maniatis etal,Science 236 1237, 1987)。
如本文所用的术语“酯合酶”表示能够产生脂肪酯的肽。更具体而言,酯合酶 是将硫酯转变为脂肪酯的肽。在优选的实施方案中,所述酯合酶将硫酯(例如酰基CoA) 转变为脂肪酯。
在可选的实施方案中,酯合酶使用硫酯和醇作为底物产生脂肪酯。酯合酶能够 使用短和长链硫酯作为底物。此外,酯合酶能够使用短和长链醇作为底物。
酯合酶的非限制性实例是蜡合酶、蜡酯合酶、酰基CoA:醇转酰酶、酰基转移 酶和脂肪酰辅酶A 脂肪醇酰基转移酶。示例性的酯合酶被分在酶分类号EC 2.3.1.75 中。示例性的GenBank登录号提供于图40中。
如本文使用,术语“脂肪酸”表示具有通式RCOOH的羧酸。R表示脂肪族基 团,优选地表示烷基。R可以包含约4到约22个碳原子。脂肪酸可以为饱和的、单不 饱和的或多不饱和的。在优选的实施方案中,所述脂肪酸由脂肪酸生物合成途径产生。
如本文所用的术语“脂肪酸生物合成途径”表示产生脂肪酸的生物合成途径。 所述脂肪酸生物合成途径包括脂肪酸酶,所述脂肪酸酶可以按照本文所述经改造产生脂 肪酸,并且在一些实施方案中可以与其他酶一起表达以产生具有所需碳链特征的脂肪 酸。
如本文所用的术语“脂肪酸衍生物”表示部分地产生于生产宿主生物体的脂肪 酸生物合成途径的产物。“脂肪酸衍生物”还包括部分地产生于酰基ACP或酰基ACP 衍生物的产物。所述脂肪酸生物合成途径包括脂肪酸合酶酶类,所述脂肪酸合酶酶类可以按照本文所述经改造产生脂肪酸衍生物,并且在一些实施例中可以与其他酶一起表达 以产生具有所需碳链特征的脂肪酸衍生物。示例性的脂肪酸衍生物包括,例如脂肪酸、 酰基CoA、脂肪醛、短和长链醇、碳氢化合物、脂肪醇和酯(例如蜡、脂肪酸酯或脂肪 酯)。
如本文所用的术语“脂肪酸衍生酶”表示在脂肪酸衍生物的产生中可以被表达 或超表达的所有酶。这些酶在本文统称为脂肪酸衍生酶。这些酶可以是脂肪酸生物合 成途径的一部分。脂肪酸衍生酶的非限制性实例包括脂肪酸合酶、硫酯酶、酰基CoA合 酶、酰基CoA还原酶、醇脱氢酶、醇酰基转移酶、脂肪醇形成酰基CoA还原酶、酯合 酶、醛生物合成多肽和烷生物合成多肽。脂肪酸衍生酶将底物转变为脂肪酸衍生物。在 一些实施例中,所述底物可以是被脂肪酸衍生酶转变为不同的脂肪酸衍生物的脂肪酸衍 生物。
如本文所用的术语“脂肪醇形成肽”表示能够催化酰基CoA转变为脂肪醇的 肽,包括脂肪醇形成酰基CoA还原酶(FAR,EC111.*)、酰基CoA还原酶(EC 1.2丄50) 或醇脱氢酶(EC1.L1.1)。此外,本领域技术人员应当理解到,一些脂肪醇形成肽还会催 化其他反应。例如,除脂肪酸外,一些酰基CoA还原酶肽会接受其他底物。因此,还 包括这些非特异性肽。编码脂肪醇形成肽的核酸序列是本领域已知的,并且这些肽是可 公开获取的。示例性的GenBank登录号提供于图40中。
如本文所用的“脂肪酸酶”表示参与脂肪酸生物合成的任何酶。脂肪酸酶可以 在宿主细胞中表达或超表达以产生脂肪酸。脂肪酸酶的非限制性实例包括脂肪酸合酶和 硫酯酶。
如本文所用的术语“脂肪酯”表示酯。在优选的实施方案中,脂肪酯是产生自 脂肪酸的任何酯,例如脂肪酸酯。在一个实施方案中,脂肪酯含有A侧(即连接于羧基 氧的碳链)和B侧(即包含母体羧基的碳链)。在优选的实施方案中,当所述脂肪酯来 源于脂肪酸生物合成途径时,A侧由醇贡献,并且B侧由脂肪酸贡献。任何醇可以用于 形成脂肪酯的A侧。例如,所述醇可以来自脂肪酸生物合成途径。可选地,所述醇可以 通过非脂肪酸生物合成途径产生。此外,所述醇可以是外源提供的。例如,在脂肪酯是 由生物体产生的情况下,所述醇可以提供在发酵液(fermentation broth)中。可选地,例 如在脂肪酯是由还产生醇的生物体产生的情况下,诸如脂肪酸或乙酸的羧酸可以是外源 提供的。
包含A侧或B侧的碳链可以是任何长度。在一个实施方案中,酯的A侧的长度 为至少约1、2、3、4、5、6、7、8、10、12、14、16或18个碳。酯的B侧的长度为至 少约4、6、8、10、12、14、16、18、20、22、对或洸个碳。A侧和/或B侧可以是直 链或支链。支链可以具有一个或多个分支点。此外,支链可以包括环状分支。而且, A侧和/或B侧可以是饱和的或不饱和的。如果是不饱和的,A侧和/或B侧可以具有 一个或多个不饱和点。
在一个实施方案中,脂肪酯是生物合成产生的。在该实施方案中,首先脂肪酸 被“活化”。“活化的”脂肪酸的非限制性实例是酰基CoA、酰基ACP和酰基磷酸盐。 酰基CoA可以是脂肪酸生物合成或降解的直接产物。此外,酰基CoA可以由游离脂肪 酸、CoA或三磷酸腺苷(ATP)合成。产生酰基CoA的酶的实例是酰基CoA合酶。
在脂肪酸被活化后,其可以被容易地转移到接受体亲核体。示例性的亲核体为 醇、硫醇或磷酸盐。
在一个实施方案中,脂肪酯是蜡。蜡可以来自长链醇和长链脂肪酸。在另一实 施方案中,所述脂肪酯可以来自脂肪酰基硫酯和醇。在另一实施方案中,所述脂肪酯是 脂肪酸硫酯,例如脂肪酰辅酶A(CoA)。在其他实施方案中,所述脂肪酯是脂肪酰基泛 酸酯、酰基载体蛋白(ACP)或脂肪磷酸酯。脂肪酯具有很多用途。例如,脂肪酯可以 被用作生物燃料。
如本文所用的“现代碳比例(fraction of modern carbon)”或“fM”与分别由 称为草酸标准HOxI和HOxII的国家标准技术研究院(Nationalhistitute of Standards and Technology(NIST))标准参考物6RMs) 4990B和4990C所定义的具有相同意义。基本定 义涉及0.95倍的WC/12C同位素比例HOxI (参考AD 1950)。这粗略地等于衰变校正的工 业革命前树木(!decay-corrected pre-Industrial Revolution wood)。对于现今生命生物圈(植 物物质)而言,fM约为1.1。
可以按照以下计算两个序列之间“同源性”。序列以最佳比较目的进行比对 (例如,可以在第一和第二氨基酸或核酸序列之一或两者中引入空位用于最佳比对,并且 为了比较目的可以忽略非同源序列)。在优选的实施方案中,用于比较目的的而比对的参 考序列长度为参考序列长度的至少约30%、优选地至少约40%、更优选地至少约50%、 更优选地至少约60%并且更优选地至少约70%、至少约80%、至少约90%或约100%。 然后比较位于对应氨基酸位置或核苷酸位置的氨基酸残基或核苷酸。当第一序列中的位 置被与第二序列中对应位置相同的氨基酸残基或核苷酸占据时,则分子在该位置是相同 的(如本文所用的,氨基酸或核酸“同一性”等同于氨基酸或核酸“同源性”)。两个 序列之间的同一性百分比是序列所共享的相同位置数的函数,这考虑到空位数和每个空 位的长度,为了两个序列的最佳比对需要引入空位。
可以使用数学算法完成序列的比较和两个序列之间同源性百分比的测定。在 优选的实施方案中,使用以下测定两个氨基酸序列之间的同源性百分比Needleman和 Wunsch(1970)、J.Mol.Biol.48 444 453的算法,其被并入GCG软件包中的GAP程序 中,使用Blossum 62矩阵或PAM250矩阵,以及16、14、12、10、8、6或4的空位权重 和1、2、3、4、5或6的长度权重。在另一优选的实施方案中,使用以下测定两个核苷酸 序列之间的同源性百分比GCG软件包中的GAP程序,使用NW^apdna.CMP矩阵以及 40、50、60、70或80的空位权重和1、2、3、4、5或6的长度权重。特别优选的参数组 (和如果操作者不确定应当应用哪些参数确定分子是否在要求的同源性限制内而应该使用 的参数组)是具有12的空位罚分、4的空位延伸罚分和5的移码空位罚分的Blossum 62 评分矩阵。
如本文所用的“宿主细胞”是用于产生本文所述的产物(例如本文所述的醛或 烷)的细胞。可以改造宿主细胞以表达或超表达所选择的基因或具有所选择的基因的减 弱的表达。宿主细胞的非限制性实例包括植物、动物、人、细菌、酵母或丝状真菌细 胞。
如本文所用的术语“在低严紧性、中严紧性、高严紧性或非常高的严紧性条件 下杂交”描述用于杂交和洗涤的条件。进行杂交反应的指导可以见于Current Protocols19in Molecular Biology (现代分子牛物学实验技术),John Wiley & Sons,N.Y. (1989), 6.3.1-6.3.6。该参考资料中描述了水性和非水性方法并且可以使用任一方法。本文涉 及的具体杂交条件如下1)低严紧性杂交条件在约45°C下、在6X氯化钠/柠檬酸钠 6SC)中,然后是在至少50°C下、在0.2XSSC、0.1% SDS中洗涤两次(对于低严紧性条 件,洗涤温度可以升至55°C) ; 2)中严紧性杂交条件在约45°C下在、在6XSSC中,然 后是在60°C的0.2XSSC、0.1% SDS中洗涤一次或多次;3)高严紧性杂交条件在约45°C 的6XSSC中,然后是在65°C下、在0.2XSSC、0.1 % SDS中洗涤一次或多次;以及优 选地4)非常高严紧性杂交条件为65°C的0.5M磷酸钠、7%SDS,然后是在65°C下、在 0.2XSSC、1% SDS中洗涤一次或多次。除非另作规定,非常高的严紧性条件(4)是优 选的条件。
本文中涉及诸如DNA或RNA的核酸所用的术语“分离的”是指分别从所述核 酸的天然来源中存在的其他DNA或RNA中隔离的分子。此外,“分离的核酸”包括核 酸片段,例如不是天然存在的片段。本文所用的术语“分离的”还指从其他细胞蛋白分 离的多肽,并且包括纯化的内源多肽和重组多肽两者。当核酸或多肽是通过重组DNA技 术产生时,本文使用的术语“分离的”还指基本上游离于细胞物质、病毒物质或培养基 的核酸或多肽。当核酸或多肽是化学合成时,本文所用的术语“分离的”还指基本上游 离于化学前体或其他化学品的核酸或多肽。
如本文所用的“细胞中的基因表达水平”是指由所述细胞中基因编码的 mRNA、前体mRNA新生转录物、转录加工中间体、成熟mRNA和/或降解产物的水平。
如本文所用的术语“微生物”表示来自古菌域、细菌域和真核域的原核和真核 微生物种类,后者包括酵母和丝状真菌、原生动物、藻类或高等原生生物。如本文所用 的术语“微生物细胞”表示来自微生物的细胞。
如本文所用的术语“核酸”是指多核苷酸,例如脱氧核糖核酸(DNA)以及适当 情况下,指核糖核酸(RNA)。该术语还包括产生自核苷酸类似物的RNA或DNA的类 似物,以及适用于所述实施方案的单链(有义或反义)和双链多核苷酸、EST、染色体、 cDNA、mRNA 禾口 rRNA。
如本文所用的术语“可操作地连接”表示所选择的核苷酸序列(例如编码本文 所述的多肽)与启动子接近以允许所述启动子调节该选择的核苷酸序列的表达。此外, 按照转录和翻译的方向,所述启动子位于所述选择的核苷酸序列的上游。“可操作地连 接”表示将核苷酸序列和调节序列连接以便当合适的分子(例如转录激活蛋白)与调节序 列结合时允许基因表达。
本文所用术语“或”表示术语“和/或”并且与术语“和/或”交换使用,除 非上下文明确表示并非如此。
如本文所用的“超表达”表示在细胞中以高于对应野生型细胞中正常表达浓度 的浓度表达核酸、多肽或碳氢化合物或使之被表达。例如,当在重组宿主细胞中多肽以 与其在相同种类的非重组宿主细胞中的浓度相比更高的浓度存在时,所述多肽在所述重 组宿主细胞中能够“超表达”。
如本文所用的“分配系数”或“P”定义为化合物在有机相中的平衡浓度除以在水相中(例如发酵液)平衡时的浓度。在本文所述的两相系统的一个实施方案中,生 产过程中所述有机相是由醛或烷形成的。但是,在一些实施例中,可以例如通过提供辛 烷层来提供有机相以便于产物分离。当描述两相系统时,化合物的分配特性可以描述为 logP。例如,IogP为1的化合物会10 1分配到有机相。IogP为-1的化合物会1 10 分配到有机相。通过选择合适的发酵液和有机相,具有高IogP值的醛或烷在发酵容器中 也会分离到有机相中,即使处于很低的浓度。
如本文所用的术语“纯化(purify),,、“纯化的(purified),,或“纯化 (purification) ”表示通过例如分离或隔离从分子的环境中移除或分离所述分子。“基本 上纯化的”分子为至少约60%、优选地至少约75%以及更优选地至少约90%游离于与其 相关的其他组分。如本文所用的这些术语还指从样品中去除污染物。例如,污染物的去 除可以导致样品中醛或烷的百分比增加。例如,当醛或烷在宿主细胞中产生时,可以通 过去除宿主细胞蛋白纯化醛或烷。纯化后,样品中醛或烷的百分比增加。
术语“纯化(purify),,、“纯化的(purified),,或“纯化(purification),,不需要绝 对纯。它们是相对的术语。因此,例如当醛或烷在宿主细胞中产生时、纯化的醛或纯化 的烷是基本与其他细胞组分(例如核酸、多肽、脂质、碳水化合物或其他碳氢化合物)隔 离的醛或烷。在另一实施例中,纯化的醛或纯化的烷制剂是这样的制剂,在该制剂中, 所述醛或烷基本游离于例如可能存在于后续发酵的那些污染物。在一些实施方案中,当 样品重量的至少约50%是由醛或烷组成时,所述醛或烷是纯化的。在其他实施方案中, 当样品重量的至少约60%、70%, 80%, 85%, 90%, 92%, 95%, 98%或99%或更多 是由醛或烷组成时,所述醛或烷是纯化的。
如本文使用,术语“重组多肽”是指通过重组DNA技术产生的多肽,其中通常 将编码所表达的多肽或RNA的DNA插入合适的表达载体,并且所述表达载体接下来用于 转化宿主细胞以产生所述多肽或RNA。
如本文所用的术语“基本相同”(或“基本同源”)是用于指含有足够数量的 与第二氨基酸或核苷酸序列相同或等同的(例如具有相似侧链,例如保守氨基酸取代)氨 基酸残基或核苷酸的第一氨基酸或核苷酸序列,这样所述第一和第二氨基酸或核苷酸序 列具有相似活性。
如本文所用的术语“合酶”表示催化合成过程的酶。如本文所用的术语合酶包 括合酶、合成酶和连接酶。
如本文所用的术语“转染”表示将核酸(例如通过表达载体)通过核酸介导的 基因转移引入到受体细胞。
如本文所用的“转化”是指这样的过程,在该过程中,细胞的基因型由于细胞 摄入外源核酸而改变。这可以导致表达重组形式的RNA或多肽的转化的细胞。在由转 移的基因反义表达的情况下,天然存在形式的多肽的表达被破坏。
如本文使用,“转运蛋白”是便于一种或多种化合物移入和/或移出细胞器和/ 或细胞的多肽。
如本文所用,多肽X的“变体”是指具有多肽X的氨基酸序列的多肽,其中一 个或多个氨基酸残基被改变。所述变体可以具有保守型改变或非保守型改变。使用本领 域熟知的计算机程序,例如LASERGENE软件(DNASTAR),可以找到确定哪些氨基酸残基可以被取代、插入或缺失而不影响生物活性的指导。
在用于多核苷酸序列的情况下,术语“变体”可以包括与基因或其编码序列的 多核苷酸序列相关的多核苷酸序列。该定义还可以包括,例如“等位基因”变体、“剪 接”变体、“物种”变体或“多态性”变体。剪接变体可以与参考多核苷酸具有显著的 同一性,但是由于在mRNA加工中的可选的外显子剪接,会通常具有更多或更少的多核 苷酸数。对应的多肽可以具有另外的功能结构域或结构域缺失。物种变体是在物种之间 彼此不同的多核苷酸序列。得到的多肽通常会具有显著的相对于彼此的氨基酸同一性。 多态性变体是在给定物种的个体之间特定基因的多核苷酸序列中的变异。
如本文所用,术语“载体”是指能够转运另一核酸的核酸分子,所述核酸分子 连接到所述另一核酸。一种有用的载体是附加体(即能够染色体外的复制的核酸)。有 用的载体是能够自主复制和/或表达与其连接的核酸的那些载体。能够指导基因的表达 的载体在本文被称为“表达载体”,所述载体被可操作地连接到所述基因。通常,在重 组DNA技术中有用的表达载体经常是“质粒”的形式,所述“质粒”通常是指在其载 体形式时不与染色体结合的环状双链DNA环。在本说明书中,因为质粒是最通常使用的 载体形式,所以“质粒”和“载体”是交换使用的。但是,还包括发挥等同功能并随 后至今成为本领域已知的表达载体的这些其他形式。
除非另外限定,本文使用的所有技术和科学术语与本发明所属领域技术人员通 常理解的具有相同的意义。尽管与本文所述的那些方法和材料相似或等同的方法和材料 可以用于本发明的实践或测试,仍然在下文描述了合适的方法和材料。本文提及的所有 出版物、专利申请、专利和其他参考资料通过引用全文并入。如有冲突,以包括定义在 内的本说明书为准。此外,材料、方法和实施例仅是举例说明并不意图限制。
根据下文的详细描述和权利要求,本发明的其他特征和优势会清晰。
附图简述
图IA是海洋原绿球菌(Prochlorococcus marinus) CCMP1986细胞产生的碳氢化合 物的GC/MS追踪。图IB是图IA的7.55分钟时的峰的质量裂解谱(mass fragmentation pattern)。
图2A是点状念珠蓝细菌(Nostoc punctiforme)PCC73102细胞产生的碳氢化合物 的GC/MS追踪。图2B是图2A的8.73分钟时的峰的质量裂解谱。
图3A是无类囊体蓝细菌(Gloeobaceter violaceus) ATCC29082细胞产生的碳氢化 合物的GC/MS追踪。图3B是图3A的8.72分钟时的峰的质量裂解谱。
图4A是集胞蓝细菌Mynechocystic sp.)PCC6803细胞产生的碳氢化合物的GC/ MS追踪。图4B是图4A的7.36分钟时的峰的质量裂解谱。
图5A是集胞蓝细菌Mynechocystis sp.) PCC6803野生型细胞产生的碳氢化合物的 GC/MS追踪。图5B是具有S110208和sll0209基因缺失的集胞蓝细菌PCC6803细胞产生 的碳氢化合物的GC/MS追踪。
图6A是大肠杆菌MG1655野生型细胞产生的碳氢化合物的GC/MS追踪。图 6B 是表达细长聚球蓝细菌 Mynechococcus elongatus) PCC7942YP_400611 (Synpcc7942_l5 94) (SEQ ID NO 65)的大肠杆菌MG1655细胞产生的碳氢化合物的GC/MS追踪。
图7 是表达蓝丝菌(Cyanothece sp.) ATCC51142 cce_1430 (ΥΡ_001802846) (SEQID NO 69)的大肠杆菌细胞产生的碳氢化合物的GC/MS追踪。
图8A 是表达细长聚球蓝细菌 PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO 65)和细长聚球蓝细菌 PCC7942YP_40061(KSynpcc7942_1593) (SEQ ID NO 1)的 大肠杆菌细胞产生的碳氢化合物的GC/MS追踪。图8B描述图8A在6.98分钟时的峰和 十五烷的质量裂解谱。图8C描述图8A在8.12分钟时的峰和8-十七烯的质量裂解谱。
图9 是表达细长聚球蓝细菌 PCC7942 YP_4006lKSynpcc7942_1594) (SEQ ID NO 65)和点状念珠蓝细菌 PCC73102 Npun02004178 (ZP00108838) (SEQ ID NO 5)的 大肠杆菌MG1655细胞产生的碳氢化合物的GC/MS追踪。
图10 是表达细长聚球蓝细菌 PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO 65)和集胞蓝细菌 PCC6803 sll0208 (NP 442147) (SEQ IDNO 3)的大肠杆菌 MG1655细胞产生的碳氢化合物的GC/MS追踪。
图11 是表达细长聚球蓝细菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO 65)和念珠蓝细菌(Nostoc sp.)PCC7210 alr5283 (NP 489323) (SEQ ID NO 7)的大肠 杆菌MG1655细胞产生的碳氢化合物的GC/MS追踪。
图12 是表达细长聚球蓝细菌 PCC7942 YP_4006lKSynpcc7942_1594) (SEQ ID NO 65)和密码子优化的海滨蓝藻菌(Acaryochloris marina) MBICl 1017 AM1_4041 (YP_001518340) (SEQ ID NO 46)的大肠杆菌MG1655细胞产生的碳氢化合 物的GC/MS追踪。
图13 是表达细长聚球蓝细菌 PCC7942 YP_4006lKSynpcc7942_1594) (SEQ ID NO: 65)和密码子优化的细长嗜热聚球蓝细菌(Thermosynechococcuselongatus)BP-I tlll313(NP_682103) (SEQ IDNO 47)的大肠杆菌MG1655细胞产生的碳氢化合物的GC/MS追踪。
图14 是表达细长聚球蓝细菌 PCC7942 YP_4006lKSynpcc7942_1594) (SEQ ID NO 65)和密码子优化的聚球蓝细菌Mynechococcus sp.) JA-3-3AbCYA_0415 (YP_473897) (SEQ ID NO 48)的大肠杆菌 MG1655 细胞产生的碳氢 化合物的GC/MS追踪。
图15 是表达细长聚球蓝细菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO 65)和无类囊体蓝细菌 PCC7421 gll3146 (NP 926092) (SEQ IDNO 15)的大肠杆菌 MG1655细胞产生的碳氢化合物的GC/MS追踪。
图16 是表达细长聚球蓝细菌 PCC7942 YP_4006lKSynpcc7942_1594) (SEQ ID NO 65)和密码子优化的海洋原绿球菌MIT9313 PMT1231 (NP895059) (SEQ ID NO 49) 的大肠杆菌MG1655细胞产生的碳氢化合物的GC/MS追踪。
图17 是表达细长聚球蓝细菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO 65)和海洋原绿球菌 CCMP1986 PMM0532 (NP 892650) (SEQID NO 19)的大肠杆 菌MG1655细胞产生的碳氢化合物的GC/MS追踪。
图18 是表达细长聚球蓝细菌 PCC7942 YP_4006lKSynpcc7942_1594) (SEQ ID NO 65)和密码子优化的海洋原绿球菌NATL2A PMN2A_1863 (YP_293054) (SEQ ID NO: 51)的大肠杆菌MG1655细胞产生的碳氢化合物的GC/MS追踪。
图19 表达细长聚球蓝细菌 PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID23NO 65)和密码子优化的聚球蓝细菌 RS9917 RS9917_09941 (ΖΡ_01079772) (SEQ ID NO: 52)的大肠杆菌MG1655细胞产生的碳氢化合物的GC/MS追踪。
图20 是表达细长聚球蓝细菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO 65)和密码子优化的聚球蓝细菌 RS9917 RS9917_12945 (ΖΡ_01080370) (SEQ ID NO 53)的大肠杆菌MG1655细胞产生的碳氢化合物的GC/MS追踪。
图21 是表达细长聚球蓝细菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO: 65)和蓝丝菌 ATCC51142 cce_0778(YP_001802195MSEQ IDNO : 27)的大肠杆菌 MG1655细胞产生的碳氢化合物的GC/MS追踪。
图22 是表达细长聚球蓝细菌 PCC7942 YP_4006lKSynpcc7942_1594) (SEQ ID NO 65)和蓝丝菌 PCC7425 Cyan7425_0398 (YP_002481151) (SEQID NO 29)的大肠杆 菌MG1655细胞产生的碳氢化合物的GC/MS追踪。
图23 是表达细长聚球蓝细菌 PCC7942 YP_4006lKSynpcc7942_1594) (SEQ ID NO 65)和蓝丝菌 PCC7425 Cyan7425_2986 (YP_002483683) (SEQID NO 31)的大肠杆 菌MG1655细胞产生的碳氢化合物的GC/MS追踪。
图 24A 是表达海洋原绿球菌 CCMP1986 PMM0533 (NP_892651) (SEQID NO 71)的大肠杆菌MG1655细胞产生的碳氢化合物的GC/MS追踪。图MB是表达海洋原 绿球菌 CCMP1986 PMM0533(NP_892651) (SEQ IDNO 71)和海洋原绿球菌 CCMP1986 PMM0532 (NP_892650) (SEQ IDNO 19)的大肠杆菌MG1655细胞产生的碳氢化合物的 GC/MS追踪。
图25A是大肠杆菌MG1655 Δ fadE lacZ::Ptrc ‘tesA-fadD细胞产生的碳氢化合物 的GC/MS追踪。图25B是表达细长聚球蓝细菌PCC7942YP_400611 6ynpcc7942_1594) (SEQ ID NO 65)和海滨蓝藻菌 MBIC11017AM1_4041 (YP_001518340) (SEQ ID NO 9) 的大肠杆菌MG1655 Δ fadElacZ::Ptrc ‘tesA-fadD细胞产生的碳氢化合物的GC/MS追踪。
图26A 是表达集胞蓝细菌 PCC6803 sll0209 (NP_442146) (SEQ IDNO 67)的 大肠杆菌MG1655 Δ fadE lacZ::Ptrc ‘tesA-fadD细胞产生的碳氢化合物的GC/MS追 踪。图 ^B 是表达集胞蓝细菌 PCC6803 sll0209(NP_442146) (SEQ ID NO 67)和集 胞蓝细菌 PCC6803 sll0208 (NP_442147) (SEQ ID NO 3)的大肠杆菌 MG1655 Δ fadE lacZ::Ptrc ‘tesA-fadD细胞产生的碳氢化合物的GC/MS追踪。
图27A是表达耻垢分枝杆菌(M.sn^gmatis)菌株MC2 155MSMEG_5739 (YP_889972) (SEQ ID NO 85)的大肠杆菌 MG1655 Δ fadElacZ::Ptrc ‘tesA-fadD细胞产生的碳氢化合物的GC/MS追踪。图27B 是表达耻垢分枝杆菌菌株MC2 155 MSMEG_5739 (YP_889972) (SEQ IDNO 85)和点 状念珠蓝细菌 PCC73102 Npun02004178 (ΖΡ_00108838) (SEQID NO 5)的大肠杆菌 MG1655 Δ fadE lacZ::Ptrc ‘tesA-fadD细胞产生的碳氢化合物的GC/MS追踪。
图观是大肠杆菌MG1655AfadElacZ::Ptrc ‘tesA-fadD细胞产生的碳氢化合 物的图示,所述细胞单独表达耻垢分枝杆菌菌株MC2 155MSMEG_5739 (YP_889972) (SEQ ID NO : 85)或表达耻垢分枝杆菌菌株 MC2 155 MSMEG_5739 (YP_889972) (SEQ ID NO : 85)与以下的组合念珠蓝细菌 PCC7120 alr5283 (SEQ ID NO : 7)、点 状念珠蓝细菌 PCC73102Npun02004178 (SEQ ID NO : 5)、海洋原绿球菌 CCMP1986PMM0532 (SEQID NO 19)、无类囊体蓝细菌 PCC7421 gll3146 (SEQ ID NO 15)、聚球 蓝细菌 RS9917_0994KSEQ IDNO 23)、聚球蓝细菌 RS9917_12945 (SEQ IDNO 25)或 海滨蓝藻菌 MBIC11017AM1_404KSEQIDNO 9)。
图^A是I型核糖核酸酶还原酶亚基β蛋白RNRi^的三维结构展示。图^B 是海洋原绿球菌ΜΙΤ9313 PMT1231 (NP_895059) (SEQ ID NO 17)的三维结构的展示。 图^C是海洋原绿球菌MIT9313 PMT1231 (NP_895059) (SEQ ID NO 17)的活性位点三维结构的展示。
图 30A 是表达点状念珠蓝细菌 PCC73102 Npun02004178 (ΖΡ_00108838) (SEQ ID NO 5)的大肠杆菌MG1655细胞产生的碳氢化合物的GC/MS追踪。图30B是表达点 状念珠蓝细菌 PCC73102Npun02004178(ZP 00108838) Y123F 变体的大肠杆菌 MG1655 细 胞产生的碳氢化合物的GC/MS追踪。图30C是表达点状念珠蓝细菌PCC73102Npun020 04178 (ΖΡ_00108838) Y126F变体的大肠杆菌MG1655细胞产生的碳氢化合物的GC/MS追S示ο
图31 描述了使用点状念珠蓝细菌 PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO 6)和十八烷醛(A) ; Npun02004178(ZP_00108838) (SEQ ID NO 6)、十八烷 醛、菠菜铁氧还蛋白还原酶和NADPH(B);十八烷醛、菠菜铁氧还蛋白、菠菜铁氧还蛋 白还原酶和 NADPH(C);或 Npun02004178(ZP_00108838MSEQ ID NO 6)、菠菜铁氧 还蛋白和菠菜铁氧还蛋白(D),体外产生的碳氢化合物的GC/MS追踪。
图32 描述了 使用点状念珠蓝细菌 PCC73102 Npun02004178 (ΖΡ_00108838) (SEQ ID NO 6), NADPH、十八烷醛和(A)菠菜铁氧还蛋白和菠菜铁氧还蛋白还 原酶;(B)点状念珠蓝细菌 PCC73102Npun020036^ (ΖΡ_00109192) (SEQ ID NO 88)和点状念珠蓝细菌 PCC73102 Npun02001001 (ZP_00111633) (SEQ ID NO 90); (C)Npun02003626(ZP_00109192) (SEQ ID NO 88)和点状念珠蓝细菌 PCC73102 Npun02003530(ZP_00109422) (SEQ ID NO 92);或(D)Npun020036^ (ZP_00109192) (SEQ ID NO 88)和点状念珠蓝细菌 PCC73102 Npun02003123 (ZP_00109501) (SEQ ID NO 94),体外产生的碳氢化合物的GC/MS追踪。
图33A是使用十八酰CoA、 细长聚球蓝细菌PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO 66)、NADH 和 Mg2+ 体外产生的碳氢化合物 的GC/MS追踪。图33B是使用十八酰CoA、细长聚球蓝细菌PCC7942YP_400611 Myn pcc7942_1594) (SEQ ID NO 66)、NADPH 和 Mg2+ 体外产生的碳氢化合物的 GC/MS 追 踪。图33C是使用十八酰CoA、细长聚球蓝细菌卩07942¥ _40061167叩(^7942_1594) (SEQ ID NO 66)和NADPH体外产生的碳氢化合物的GC/MS追踪。
图34A是使用十八酰CoA、标记的NADPH、细长聚球蓝细菌PCC7942 YP_400611 (Synpcc7942_l 594) (SEQ ID NO 66)和未标记的 NADPH 体外产生的碳氢 化合物的GC/MS追踪。图34B是使用十八酰CoA、标记的NADPH、细长聚球蓝细菌 PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO 66)禾Π S44」H)NADPH 体外产生 的碳氢化合物的GC/MS追踪。图34C是使用十八酰CoA、标记的NADPH、细长聚球 蓝细菌 PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO 66)和 R-0」H) NADPH 体 外产生的碳氢化合物的GC/MS追踪。
图35是由Che-9培养基中的表达细长聚球蓝细菌PCC7942YP_400611 6ynpcc7 942_1594) (SEQ IDNO 65)的大肠杆菌MG1655 Δ fadE细胞所产生的无细胞上清中碳氢 化合物的GC/MS追踪。
图36是由Che-9培养基中的表达细长聚球蓝细菌PCC7942YP_400611 6ynpcc7 942_1594) (SEQ ID NO 65)和点状念珠蓝细菌 PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO 5)的大肠杆菌MG1655 Δ fadE细胞所产生的无细胞上清中碳氢化合物的 GC/MS追踪。
图37 是表达念珠蓝细菌 PCC7120 alr5283 (NP_489323) (SEQ IDNO 7)和念珠蓝 细菌 PCC7120 alr5284 (NP_489324) (SEQ ID NO 81)的大肠杆菌 MG1655 细胞产生的碳 氢化合物的GC/MS追踪。
图38是来自宏基因组数据库的细长聚球蓝细菌PCC7942 YP_400610 (Synpcc7942_1593) (SEQ ID NO 1)的同系物的实例列表。
图39是来自宏基因组数据库的细长聚球蓝细菌PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO 65)的同系物的实例列表。
图40是鉴定出可以被表达、超表达或减弱以增加特定底物的产生的各种基因的 表。
详细描述
本发明提供了从例如酰基ACP、脂肪酸、酰基CoA、脂肪醛的底物或脂肪醇底 物(例如PCT/US08/058788中所述的,在此通过引用特别并入)产生醛、脂肪醇和碳氢 化合物(例如烷、烯和炔)的组合物和方法。此类醛、烷和烯作为生物燃料(例如汽油、 柴油、喷气燃料等的替代品)、特种化学品(例如润滑剂、燃料添加剂等)或用于后续化 学转变(例如,燃料、聚合物、塑料、纺织品、溶剂、粘合剂等)的原料是有用的。本 发明部分地基于参与醛、烷和烯生物合成的基因的鉴定。
这些烷和烯生物合成基因包括,例如细长聚球蓝细菌 PCC7942Synpcc7942_1593 (SEQ ID NO 1)、集胞蓝细菌 PCC6803 sll0208 (SEQ IDNO 3)、点状念珠蓝细菌 PCC73102 Npun02004178 (SEQ ID NO 5)、念珠蓝细菌 PCC 7120 alr5283 (SEQ ID NO : 7)、海滨蓝藻菌 MBICl 1017AM 1_4041 (SEQ ID NO : 9)、细长嗜 热聚球蓝细菌 BP-I tlll313 6EQ IDNO : 11)、聚球蓝细菌 JA-3-3A CYA_0415 (SEQ ID NO: 13),无类囊体蓝细菌 PCC7421 gll3146(SEQ IDNO : 15),海洋原绿球菌 MIT9313 PM 123 (SEQ ID NO 17)、狭义的海洋原绿球菌 pastoris 亚种(Prochlorococcusmarinus subsp.pastoris str.) CCMP1986 PMM0532 (SEQ ID NO 19)、狭义的海洋原绿球菌 (Prochlorococcus marinus str.)NATL2A PMN2A_1863 (SEQ ID NO 21)、聚球蓝细菌 RS9917 RS9917_09941 (SEQ ID NO : 23)、聚球蓝细菌 RS9917 RS9917_12945 (SEQ ID NO 25)、蓝丝菌 ATCC51142cce_0778 6EQ ID NO : 27)、蓝丝菌 PCC7245 Cyan7425DRAFT_1220(SEQIDNO 29)、蓝丝菌 PCC7245 cce_0778 NEQ ID NO : 31)、 多变鱼腥蓝细菌(Anabaena variabilis) ATCC29413 YP_323043 (Ava_2533) (SEQ ID NO 33)和细长聚球蓝细菌 PCC6301 YP_170760 (syc0050_d) (SEQ ID NO 35)。其他烷和烯 生物合成基因在表1和图38中列出。
醛生物合成基因包括,例如细长聚球蓝细菌PCC7942Synpcc7942_1594(SEQID NO 65)、集胞蓝细菌 PCC6803 sll0209 (SEQ IDNO 67),蓝丝菌 ATCC51142 cce_1430 (SEQ ID NO 69)、狭义的海洋原绿球菌 pastoris 亚种 CCMP1986 PMM0533 (SEQ ID NO 71)、无类囊体蓝细菌 PCC7421 NP_96091 (gll3145) (SEQ ID NO 73)、点状念珠蓝细菌PCC73102 ΖΡ_00108837 (Npun02004176) (SEQ ID NO 75)、 多变鱼腥蓝细菌ATCC29413 YP_323044 (Ava_2534) (SEQ ID NO 77)、细长聚球蓝细菌 PCC6301 YP_170761 (syc0051_d) (SEQ ID NO 79)和念珠蓝丝菌 PCC7120 alr5284 (SEQ ID NO 81)。其他醛生物合成基因在表1和图39中列出。
使用本文所述的方法,使用一个或多个本文所述的醛、烷和/或烯生物合成基 因或多肽或所述基因或多肽的变体,利用宿主细胞或无细胞方法,可以制备醛、脂肪 醇、烷和烯。
表1.蓝细菌基因组中醛和烷生物合成基因同系物
蓝细菌烷生物合成基因醛生物合成基因登录号%ID登录号%ID细长聚球蓝细菌PCC 7942YP_400610100YP—400611100细长聚球蓝细菌PCC 6301ΥΡ_170760100YP_170761100原型彳效稍蓝细菌(Microcoleus chthonoplastes)FCC 7420EDX7501977EDX7497870极大节旋蓝细菌04厂iArcw/^.ra maxima) CS-328EDZ9496378EDZ9496868林氏蓝细菌(丄ywg^ya sp.) PCC 8106ΖΡ_0161957577ΖΡ0161957469泡沐节球蓝细菌{Nodularia spumigena) CCY9414ΖΡ_0162809677ΖΡ_0162809570红海束毛蓝细菌(Thichodesmium erythraeum) IMSlOlΥΡ—72197976ΥΡ_72197869铜绿微囊蓝细菌(MicracjKyto aeruginosa) NIES-843ΥΡ00166032375ΥΡ00166032268铜绿微囊蓝细菌PCC 7806CA09078074CA09078167念珠蓝细菌(iVostoc sp.) PCC 7120ΝΡ_48932374ΝΡ_48932472Nostoc azollae 0708EEG0569273EEG0569370多变鱼月星蓝细菌ATCC 29413ΥΡ32304374ΥΡ_32304473Crocosphaera watsonii WH 8501ΖΡ_0051470074ΖΡ0051692067集胞蓝细菌PCC 6803ΝΡ—44214772ΝΡ_44214668聚球蓝细菌PCC 7335EDX8680373EDX8787067蓝丝菌ATCC 51142ΥΡ_00180219573ΥΡ_00180284667蓝丝菌CCYOl 10ΖΡ_0172857872ΖΡ_0172862068点状念珠蓝细菌PCC 73102ΖΡ—0010883872ΖΡ_0010883771海滨蓝藻菌MBIC11017ΥΡ00151834071ΥΡ00151834166蓝丝菌PCC 7425ΥΡ00248115171ΥΡ00248115270蓝丝菌PCC 8801ΖΡ—0294145970ΖΡ0294271669细长嗜热聚球蓝细菌BP-1ΝΡ_68210370ΝΡ_68210270聚球蓝细菌JA-2-3B’a(2-13)ΥΡ47863968ΥΡ—47863863聚球蓝细菌RCC307YPOO122784267YPOO122784164聚球蓝细菌WH 7803ΥΡ_00122437768YPOO122437865聚球蓝细菌WH 8102ΝΡ 89782970NP一89782865聚球蓝细菌WH 7805ΖΡ_0112321468ΖΡ_0112321565未培养的海洋A型聚球蓝细菌GOM 3012ABD9637670ABD9637565聚球蓝细菌JA-3-3AbΥΡ_47389768YP 一4 73 8 9662
28
权利要求
1.产生醛的方法,所述方法包括在宿主细胞中产生包含SEQIDNO 66、68、70、 72、74、76、78、80或82的氨基酸序列的多肽或其变体,并从所述宿主细胞分离所述醛。
2.产生醛的方法,所述方法包括在宿主细胞中产生多肽并从所述宿主细胞分离所述 醛,所述多肽包含与SEQ ID NO 66、68、70、72、74、76、78、80或82具有至少约 70%同一性的氨基酸序列。
3.产生醛的方法,所述方法包括在宿主细胞中产生多肽,所述多肽包含具有一个或 多个氨基酸取代、添加、插入或缺失的SEQ ID NO 66、68、70、72、74、76、78、80 或82的氨基酸序列,其中所述多肽具有还原酶活性。
4.如权利要求3所述的方法,其中所述多肽包含具有一个或多个保守型氨基酸取代的 SEQ ID NO 66、68、70、72、74、76、78、80 或 82 的氨基酸序列。
5.产生醛的方法,所述方法包括在宿主细胞中表达多核苷酸并从所述宿主细胞分离 所述醛,所述多核苷酸包含与SEQ IDNO 65、67、69、71、73、75、77、79或81具有 至少约70%的序列同一性的核苷酸序列。
6.产生醛的方法,所述方法包括在宿主细胞中表达多核苷酸,所述多核苷酸与SEQ ID NO 65、67、69、71、73、75、77、79或81的核苷酸序列的互补物或其片段杂交, 其中所述多核苷酸编码与包含IDNO : 66、68、70、72、74、76、78、80或82的多肽具 有相同生物活性的多肽。
7.如权利要求1-6中任一项权利要求所述的方法,其中所述多肽或所述多核苷酸来自 蓝细菌。
8.产生醛的方法,所述方法包括用重组载体转化宿主细胞并从所述宿主细胞分离所 述醛,所述重组载体包含与SEQ ID NO 65、67、69、71、73、75、77、79或81具有至 少约70%的序列同一性的核苷酸序列。
9.如权利要求8所述的方法,其中所述重组载体还包含可操作地连接到所述核苷酸序 列的启动子。
10.如权利要求1-9中任一项权利要求所述的方法,其中所述宿主细胞选自哺乳动物 细胞、植物细胞、昆虫细胞、酵母细胞、真菌细胞、丝状真菌细胞和细菌细胞。
11.如权利要求10所述的方法,其中所述宿主细胞是大肠杆菌(E.coli)细胞。
12.如权利要求11所述的方法,其中所述大肠杆菌细胞是菌株B、菌株C、菌株K或 菌株W大肠杆菌细胞。
13.如权利要求8所述的方法,其中所述宿主细胞产生由所述重组载体的核苷酸序列 所编码的多肽。
14.如权利要求10所述的方法,其中所述醛由所述宿主细胞分泌。
15.如权利要求14所述的方法,其中所述醛包含C13-C21醛。
16.如权利要求14所述的方法,其中所述醛选自十四烷醛、十六烷醛、十六烯醛、 十八烷醛、十八烯醛、甲基十四烷醛、甲基十四烯醛、甲基十六烷醛、甲基十六烯醛、 甲基十八烷醛和甲基十八烯醛。
17.如权利要求1-16中任一项权利要求所述的方法,还包括在至少一种所述多肽或所 述核苷酸序列编码的多肽的生物底物的存在下,培养所述宿主细胞。
18.如权利要求17所述的方法,其中所述底物是脂肪酸衍生物。
19.如权利要求18所述的方法,其中所述脂肪酸衍生物是C14-C22脂肪酸衍生物。
20.如权利要求17所述的方法,其中所述脂肪酸衍生物选自十四烷酰-ACP、十六烷 酰-ACP、十六烯酰-ACP、十八烯酰-ACP及它们的衍生物。
21.遗传改造的微生物,其包含稳定并入所述微生物的基因组DNA中位于多核苷酸 的上游的外源控制序列,所述多核苷酸包含与SEQ IDNO 65、67、69、71、73、75、 77、79或81具有至少约70%的序列同一性的核苷酸序列,其中所述微生物相对于野生型 微生物产生水平增高的醛。
22.如权利要求21所述的微生物,其中所述微生物是蓝细菌。
23.产生醛的方法,所述方法包括在适于基因表达的条件下培养权利要求21所述的微 生物。
24.通过权利要求1-20和23所述方法的任一方法产生的醛。
25.如权利要求24所述的醛,其中所述醛的δ13C为约-15.4或更大。
26.如权利要求24所述的醛,其中所述醛的fM14C为至少约1.003。
27.制造醛的方法,所述方法包括使底物与以下接触(i)包含SEQIDNO : 66、 68、70、72、74、76、78、80或82的氨基酸序列的多肽或其变体;或者(ii)与SEQ ID NO: 65、67、69、71、73、75、77、79或81具有至少70 %的同一性的核苷酸序列所编 码的多肽或其变体。
28.如权利要求27所述的方法,其中所述醛包含C13-C21醛。
29.如权利要求27所述的方法,其中所述醛选自十四烷醛、十六烷醛、十六烯醛、 十八烷醛、十八烯醛、甲基十四烷醛、甲基十四烯醛、甲基十六烷醛、甲基十六烯醛、 甲基十八烷醛和甲基十八烯醛。
30.如权利要求29所述的方法,其中所述底物选自十四烷酰-ACP、十六烷酰-ACP、 十六烯酰-ACP、十八烯酰-ACP及它们的衍生物。
31.产生醛的方法,所述方法包括在宿主细胞中产生包含SEQIDNO 54、55、56、 57、58、59、60、61、62、63或64的氨基酸序列的多肽,其中所述多肽具有还原酶活 性。
32.如权利要求31所述的方法,其中所述多肽来自蓝细菌。
33.如权利要求31或32所述的方法,其中所述宿主细胞选自哺乳动物细胞、植物细 胞、昆虫细胞、酵母细胞、真菌细胞、丝状真菌细胞和细菌细胞。
34.如权利要求33所述的方法,其中所述宿主细胞是大肠杆菌细胞。
35.如权利要求31所述的方法,其中所述醛由所述宿主细胞分泌。
36.如权利要求31所述的方法,其中所述醛包含C13-C21醛。
37.如权利要求36所述的方法,其中所述醛选自十四烷醛、十六烷醛、十六烯醛、 十八烷醛、十八烯醛、甲基十四烷醛、甲基十四烯醛、甲基十六烷醛、甲基十六烯醛、 甲基十八烷醛和甲基十八烯醛。
38.如权利要求31-37中任一项权利要求所述的方法,还包括在至少一种所述多肽的 生物底物的存在下,培养所述宿主细胞。
39.如权利要求38所述的方法,其中所述底物是脂肪酸衍生物。
40.如权利要求39所述的方法,其中所述脂肪酸衍生物选自十四烷酰-ACP、十六烷 酰-ACP、十六烯酰-ACP、十八烯酰-ACP及它们的衍生物。
41.制造醛的方法,所述方法包括使底物与包含SEQID NO 54、55、56、57、58、 59、60、61、62、63或64的氨基酸序列的多肽接触,其中所述多肽具有还原酶活性。
42.如权利要求41所述的方法,其中所述醛包含C13-C21醛。
43.如权利要求42所述的方法,其中所述醛选自十四烷醛、十六烷醛、十六烯醛、 十八烷醛、十八烯醛、甲基十四烷醛、甲基十四烯醛、甲基十六烷醛、甲基十六烯醛、 甲基十八烷醛和甲基十八烯醛。
44.如权利要求41所述的方法,其中所述底物是脂肪酸衍生物。
45.如权利要求44所述的方法,其中所述底物选自十四烷酰-ACP、十六烷酰-ACP、 十六烯酰-ACP、十八烯酰-ACP及它们的衍生物。
46.产生脂肪醇的方法,所述方法包括在宿主细胞中产生包含SEQIDNO 66、68、 70、72、74、76、78、80或82的氨基酸序列的多肽或其变体,并从所述宿主细胞分离所 述脂肪醇。
47.产生脂肪醇的方法,所述方法包括在宿主细胞中产生多肽并且从所述宿主细胞分 离所述脂肪醇,所述多肽包含与SEQ IDNO 66、68、70、72、74、76、78、80或82具 有至少约70%的同一性的氨基酸序列。
48.产生脂肪醇的方法,所述方法包括在宿主细胞中表达多核苷酸并从所述宿主细胞 分离所述脂肪醇,所述多核苷酸包含与SEQ ID NO : 65、67、69、71、73、75、77、79 或81具有至少约70%的序列同一性的核苷酸序列。
49.产生脂肪醇的方法,所述方法包括用重组载体转化宿主细胞并从所述宿主细胞分 离所述脂肪醇,所述重组载体包含与SEQ ID NO : 65、67、69、71、73、75、77、79或 81具有至少约70%的序列同一性的核苷酸序列。
50.如权利要求46-49中任一项权利要求所述的方法,还包括在所述宿主细胞中表达 编码重组醇脱氢酶的基因。
51.如权利要求50所述的方法,其中所述脂肪醇由所述宿主细胞分泌。
52.如权利要求50所述的方法,其中所述脂肪醇包含C6-C26脂肪醇。
53.如权利要求50所述的方法,其中所述脂肪醇是1-癸烷醇、1-十二烷醇、1-肉豆 蔻醇、1-十六烷醇、十八烯醇、十四烯醇或十六烯醇。
54.如权利要求50所述的方法,其中所述脂肪醇包含直链脂肪醇。
55.如权利要求50所述的方法,其中所述脂肪醇包含支链脂肪醇。
56.如权利要求50所述的方法,其中所述脂肪醇包含环状部分。
57.如权利要求50所述的方法,其中所述脂肪醇是不饱和脂肪醇。
58.如权利要求50所述的方法,其中所述脂肪醇是单不饱和脂肪醇。
59.如权利要求50所述的方法,其中所述脂肪醇是饱和脂肪醇。
60.分离的核酸,其由SEQ ID NO: 65、67、69、71、73、75、77、79 或 81 的不多 于500个核苷酸组成。
61.分离的核酸,其由不多于90%的 SEQ IDNO 65、67、69、71、73、75、77、79 或81的核苷酸组成。
62.如权利要求60或61所述的核酸,其中所述核酸编码具有还原酶活性的多肽。
63.分离的多肽,其由SEQ ID NO: 66、68、70、72、74、76、78、80 或 82 的不多 于200个氨基酸组成。
64.分离的多肽,其由不多于90%的 SEQ IDNO 66、68、70、72、74、76、78、80 或82的氨基酸组成。
65.如权利要求63或64所述的分离的多肽,其中所述多肽具有还原酶活性。
全文摘要
本为描述了用于产生诸如醛、烷和烯的碳氢化合物的组合物和方法。某些碳氢化合物可用于生物燃料。
文档编号C12N9/88GK102027109SQ200980117664
公开日2011年4月20日 申请日期2009年5月18日 优先权日2008年5月16日
发明者安德里亚斯·席尔默, 谢恩·布鲁贝克, 马修·路德 申请人:Ls9公司