用于乙醇生产的氮利用提高的微生物的制作方法

文档序号:26359990发布日期:2021-08-20 20:36阅读:138来源:国知局
用于乙醇生产的氮利用提高的微生物的制作方法

序列表的引用

本申请含有处于计算机可读形式的序列表,将其通过引用并入本文。

发明背景

从含淀粉材料和含纤维素材料生产乙醇是本领域中熟知的。

对于含淀粉材料,工业上最常使用的商业方法(通常被称作“传统方法”)包括在高温(约85℃)下典型地使用细菌α-淀粉酶液化经糊化的淀粉,随后典型地在葡糖淀粉酶和酿酒酵母(saccharomycescerevisae)的存在下厌氧进行同时糖化和发酵(ssf)。

在本领域中存在若干种用于糖化纤维素和半纤维素以及用于发酵含有葡萄糖、甘露糖、木糖和阿拉伯糖的水解产物的方法。葡萄糖和甘露糖在天然无氧代谢过程中有效地转化为乙醇。为了以工业规模获得经济上相关的方法,在改善水解产物中的发酵木糖方面已经取得了进展。

用于生产用作燃料的乙醇的酵母,如在玉米乙醇工业中,要求若干特性,以确保乙醇有效生产的成本。这些特性包括乙醇耐受性、低副产品产量、快速发酵、和限制残留在发酵中的剩余糖量的能力。这些特性对工业方法的可行性具有明显的作用。

酵母属的酵母表现出生产乙醇所需的许多特性。具体地,酿酒酵母的菌株在燃料乙醇工业中广泛用于乙醇生产。酿酒酵母的菌株被广泛用于燃料乙醇工业,具有在发现于,例如,玉米醪发酵中的发酵条件下生产高产量乙醇的能力。这种菌株的实例是在称为ethanol的可商购乙醇酵母产品中使用的酵母。

向玉米醪中添加外源蛋白酶已成为增加氨基氮的可用性且加快乙醇发酵的速率的战略方法(参见,例如biomass[生物质]16(1988)2,第77-87页;us5,231,017;wo2003/066826;wo2007/145912;wo2010/008841;wo2014/037438;wo2015/078372)。我们还描述了在酿酒酵母用于乙醇发酵中的异源蛋白酶的表达(wo2018/222990,其内容通过引用并入本文)。

尽管在过去数十年乙醇生产方法有显著的改善,但是仍然希望并需要以经济和商业相关的规模,提供改善的从含淀粉材料和含纤维素材料发酵乙醇的方法。



技术实现要素:

本文尤其描述了从含淀粉材料或含纤维素材料生产发酵产物(如乙醇)的方法,以及适用于此类方法的酵母。

第一方面涉及酵母细胞(例如重组酵母细胞),其包含增加或减少转运蛋白或其调节物表达的遗传修饰。

在一个实施例中,酵母细胞是酿酒酵母细胞,其包含:(1)编码转运蛋白的异源多核苷酸,和(2)编码葡糖淀粉酶、α-淀粉酶或蛋白酶的异源多核苷酸;其中所述转运蛋白与seqidno:163或seqidno:164的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性。

在一个实施例中,酵母细胞包含编码转运蛋白的异源多核苷酸,其中该转运蛋白与seqidno:163或seqidno:164的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性,并且其中该酵母细胞包含增加转运蛋白表达的重组遗传修饰。

在一个实施例中,酵母细胞包含编码转运蛋白的异源多核苷酸,其中该转运蛋白与seqidno:163或seqidno:164的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性,并且其中该酵母进一步包含对内源转运蛋白基因的破坏。

在一个实施例中,酵母细胞是包含编码转运蛋白的异源多核苷酸的酿酒酵母细胞,其中该转运蛋白与seqidno:163或seqidno:164的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性;并且条件是酵母细胞不是:酿酒酵母mbg4851(在澳大利亚维多利亚州国家计量研究所以登录号v14/004037保藏)或其衍生物,酿酒酵母mbg4911(在澳大利亚维多利亚州国家计量研究所以登录号v15/001459保藏)或其衍生物,酿酒酵母mbg4913(在澳大利亚维多利亚州国家计量研究所以登录号v15/001460保藏)或其衍生物,酿酒酵母mbg4914(在澳大利亚维多利亚州国家计量研究所以登录号v15/001461保藏)或其衍生物,酿酒酵母mbg4930(在澳大利亚维多利亚州国家计量研究所以登录号v15/004035保藏)或其衍生物,酿酒酵母mbg4931(在澳大利亚维多利亚州国家计量研究所以登录号v15/004036保藏)或其衍生物,酿酒酵母mbg4932(在澳大利亚维多利亚州国家计量研究所以登录号v15/004037保藏)或其衍生物。

第二方面涉及从含淀粉材料或含纤维素材料生产发酵产物的方法,这些方法包括:(a)糖化所述含淀粉材料或含纤维素材料;和(b)用第一方面的酵母细胞发酵步骤(a)的经糖化的材料。

在一个实施例中,该方法包括在糖化前在α-淀粉酶和蛋白酶存在下,在高于初始糊化温度的温度下液化含淀粉的材料。在一个实施例中,该发酵产物是乙醇。

第三方面涉及生产第一方面的酵母菌株的衍生物的方法,其包括在允许第一和第二酵母菌株之间的dna结合的条件下,将第一方面的酵母菌株与第二酵母菌株一起培养,并筛选或选择包含编码转运蛋白的异源多核苷酸的衍生酵母菌株。

第四方面涉及包含第一方面的酵母菌株以及一种或多种天然存在的和/或非天然存在的组分的组合物,所述组分例如选自由以下组成的群:表面活性剂、乳化剂、树胶、溶胀剂和抗氧化剂。

附图说明

图1显示了在玉米醪乙醇发酵过程中,在24小时处,与ethanol相比,mbg4994的三肽和四肽摄取的改善。

图2显示了使用表7中列出的菌株对工业制备的玉米醪发酵52小时后的最终乙醇滴度。

图3显示了使用工业制备的玉米醪和表7中列出的菌株发酵29小时后残留的三肽。

图4显示了使用工业制备的玉米醪和表7中列出的菌株发酵29小时后残留的四肽。

图5显示了使用表8中列出的菌株用工业制备的醪发酵53小时后的最终乙醇滴度。

图6显示了实例2中描述的pmbin369的质粒图。

图7显示了使用ethanol(er)和mbg4994在具有不同氮浓度的玉米醪中发酵68小时后的最终乙醇滴度。

定义

除非由上下文以另外的方式定义或清楚表明,本文使用的所有技术术语和科学术语具有如本领域普通技术人员所通常理解的相同的含义。

等位基因变体:术语“等位基因变体”意指占据同一染色体基因座的基因的两种或更多种替代形式中的任一种。等位基因变异通过突变而自然产生,并且可以导致群体内部的多态性。基因突变可以是沉默的(所编码的多肽无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。

辅助活性9:术语“辅助活性9”或“aa9”意指分类为溶解性多糖单加氧酶(quinlan等人,2011,proc.natl.acad.sci.usa[美国国家科学院院刊]208:15079-15084;phillips等人,2011,acschem.biol.[acs化学生物学]6:1399-1406;lin等人,2012,structure[结构]20:1051-1061)的多肽。根据henrissat,1991,biochem.j.[生物化学杂志]280:309-316以及henrissat和bairoch,1996,biochem.j.[生物化学杂志]316:695-696,aa9多肽之前被分类为糖苷水解酶家族61(gh61)。

aa9多肽通过具有纤维素分解活性的酶增强含纤维素材料的水解。可以通过测量在以下条件下来自由纤维素分解酶水解含纤维素材料的还原糖的增加或纤维二糖与葡萄糖总量的增加来确定纤维素分解增强活性:1-50mg总蛋白/g预处理的玉米秸秆(pcs)中的纤维素,其中总蛋白包括50%-99.5%w/w纤维素分解酶蛋白和0.5%-50%w/waa9多肽蛋白,在适合的温度(例如40℃-80℃,如50℃、55℃、60℃、65℃、或70℃)和适合的ph(例如,4-9,如4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、或8.5)下持续1-7天,与不具有纤维素分解增强活性的相等的总蛋白负载的对照水解(1-50mg纤维素分解蛋白/gpcs中的纤维素)进行比较。

可以使用celluclasttm1.5l(诺维信公司(novozymesa/s),巴格斯瓦德(bagsvaerd),丹麦)和β-葡糖苷酶的混合物作为纤维素分解活性的来源来确定aa9多肽增强活性,其中该β-葡糖苷酶是以纤维素酶蛋白负载的至少2%-5%蛋白质的重量存在的。在一个实施例中,该β-葡糖苷酶是米曲霉(aspergillusoryzae)β-葡糖苷酶(例如,根据wo02/095014,在米曲霉中重组产生的)。在另一个实施例中,该β-葡糖苷酶是烟曲霉(aspergillusfumigatus)β-葡糖苷酶(例如,如在wo02/095014中所述的,在米曲霉中重组产生的)。

aa9多肽增强活性还可以通过以下来确定:在40℃,将aa9多肽与0.5%磷酸溶胀纤维素(pasc)、100mm乙酸钠(ph5)、1mmmnso4、0.1%没食子酸、0.025mg/ml的烟曲霉β-葡糖苷酶,以及0.01%x-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)一起孵育24-96小时,随后确定从pasc释放的葡萄糖。

还可以根据wo2013/028928确定高温组合物的aa9多肽增强活性。

aa9多肽通过将达到相同的水解程度所需要的纤维素分解酶的量降低优选至少1.01倍,例如至少1.05倍、至少1.10倍、至少1.25倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍、或至少20倍,来增强由具有纤维素分解活性的酶催化的含纤维素材料的水解。

β-葡糖苷酶:术语“β-葡糖苷酶”意指β-d-葡糖苷葡糖水解酶(beta-d-glucosideglucohydrolase)(e.c.3.2.1.21),其催化末端非还原β-d-葡萄糖残基的水解,并释放β-d-葡萄糖。可以根据venturi等人,2002,j.basicmicrobiol.[基础微生物学杂志]42:55-66的程序使用对硝基苯基-β-d-吡喃葡萄糖苷作为底物来确定β-葡糖苷酶活性。一个单位的β-葡糖苷酶定义为在25℃、ph4.8下,在含有0.01%20的50mm柠檬酸钠中从作为底物的1mm对硝基苯基-β-d-吡喃葡萄糖苷每分钟产生1.0微摩尔的对硝基酚根阴离子。

β-木糖苷酶:术语“β-木糖苷酶”意指β-d-木糖苷木糖水解酶(β-d-xylosidexylohydrolase)(e.c.3.2.1.37),其催化短β(1→4)-低聚木糖的外切水解,以将连续的d-木糖残基从非还原端移除。可以在含有0.01%20的100mm柠檬酸钠中,在ph5、40℃下,使用1mm对硝基苯基-β-d-木糖苷作为底物来确定β-木糖苷酶活性。一个单位的β-木糖苷酶定义为在40℃、ph5下,在含有0.01%20的100mm柠檬酸钠中从1mm对硝基苯基-β-d-木糖苷每分钟产生1.0微摩尔的对硝基酚根阴离子。

过氧化氢酶:术语“过氧化氢酶”意指过氧化氢:过氧化氢氧化还原酶(ec1.11.1.6),该酶催化2h2o2转化为o2+2h2o。出于本发明的目的,根据美国专利号5,646,025确定过氧化氢酶活性。一个单位的过氧化氢酶活性等于在测定条件下催化1微摩尔的过氧化氢氧化的酶的量。

催化结构域:术语“催化结构域”意指含有该酶的催化机构的酶的区域。

纤维二糖水解酶:术语“纤维二糖水解酶”意指1,4-β-d-葡聚糖纤维二糖水解酶(e.c.3.2.1.91和e.c.3.2.1.176),其催化纤维素、纤维寡糖、或任何含β-1,4-连接的葡萄糖的聚合物中的1,4-β-d-糖苷键的水解,从该链的还原端(纤维二糖水解酶i)或非还原端(纤维二糖水解酶ii)释放纤维二糖(teeri,1997,trendsinbiotechnology[生物技术趋势]15:160-167;teeri等人,1998,biochem.soc.trans.[生化学会会刊]26:173-178)。可以根据由以下所述的程序来确定纤维二糖水解酶活性:lever等人,1972,anal.biochem.[分析生物化学]47:273-279;vantilbeurgh等人,1982,febsletters[欧洲生化学会联合会快报]149:152-156;vantilbeurgh和claeyssens,1985,febsletters[欧洲生化学会联合会快报]187:283-288;和tomme等,1988,eur.j.biochem.[欧洲生物化学杂志],170:575-581。

纤维素分解酶或纤维素酶:术语“纤维素分解酶”或“纤维素酶”意指水解含纤维素材料的一种或多种(例如,两种,若干种)酶。此类酶包括一种或多种内切葡聚糖酶、一种或多种纤维二糖水解酶、一种或多种β-葡糖苷酶、或其组合。用于测量纤维素分解酶活性的两种基本方法包括:(1)测量总纤维素分解酶活性,以及(2)测量个体纤维素分解酶活性(内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶),如在zhang等人,2006,biotechnologyadvances[生物技术进展]24:452-481中所述的。可使用不溶性底物,包括沃特曼(whatman)№1滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、预处理的木质纤维素等,测量总纤维素分解酶活性。最常见的总纤维素分解活性测定是将沃特曼№1滤纸用作底物的滤纸测定。该测定是由国际纯粹与应用化学联合会(iupac)建立的(ghose,1987,pureappl.chem.[纯粹与应用化学]59:257-68)。

可以通过测量在以下条件下与未添加纤维素分解酶蛋白的对照水解相比,在一种或多种纤维素分解酶对含纤维素材料的水解过程中产生/释放的糖的增加来确定纤维素分解酶活性:1-50mg纤维素分解酶蛋白/g于预处理的玉米秸秆(pcs)中的纤维素(或其他预处理的含纤维素材料),在适合的温度(如40℃-80℃,例如50℃、55℃、60℃、65℃、或70℃)和适合的ph(如4-9,例如,5.0、5.5、6.0、6.5、或7.0)下持续3-7天。典型条件为:1ml反应,洗涤或未洗涤的pcs,5%不溶性固体(干重),50mm乙酸钠(ph5),1mmmnso4,50℃、55℃、或60℃,72小时,通过hpx-87h柱层析(伯乐实验室有限公司(bio-radlaboratories,inc.),赫拉克勒斯,加利福尼亚州,美国)进行糖分析。

编码序列:术语“编码序列”或“编码区”意指指定一个多肽的氨基酸序列的多核苷酸序列。该编码序列的边界一般由开放阅读框决定,该开放阅读框通常以atg起始密码子或替代起始密码子(如gtg和ttg)开始,并且以终止密码子(如taa、tag、和tga)结束。该编码序列可以是基因组dna、cdna、合成的多核苷酸、和/或重组多核苷酸的一个序列。

控制序列:术语“控制序列”意指多肽表达所必需的核酸序列。控制序列对于编码多肽的多核苷酸可以是天然的或外源的,并且彼此可以是天然的或外源的。此类控制序列包括但不限于,前导子序列、多腺苷酸化序列、前肽序列、启动子序列、信号肽序列及转录终止子序列。出于引入有利于将控制序列与编码多肽的多核苷酸的编码区连接的特异性限制位点的目的,这些控制序列可以提供有多个接头。

破坏:术语“破坏”意指参照基因的编码区和/或控制序列被部分或完全修饰(如通过缺失、插入和/或取代一个或多个核苷酸),从而使得编码的多肽的表达不存在(失活)或降低,和/或编码的多肽的酶活性不存在或降低。可以使用本领域已知的技术来测量破坏的效果,例如使用本文引用的无细胞提取物测量来检测酶活性的缺乏或降低;或相应mrna的不存在或减少(例如,减少至少25%、减少至少50%、减少至少60%、减少至少70%、减少至少80%或减少至少90%);具有酶活性的相应多肽的量的不存在或减少(例如,减少至少25%、减少至少50%、减少至少60%、减少至少70%、减少至少80%或减少至少90%);或具有酶活性的相应多肽的比活性的不存在或减少(例如,减少至少25%、减少至少50%、减少至少60%、减少至少70%、减少至少80%或减少至少90%)。可以通过本领域已知的方法破坏具体目的基因,例如通过定向同源重组(directedhomologousrecombination)(参见methodsinyeastgenetics[酵母遗传学方法](1997版),adams,gottschling,kaiser和stems,冷泉港出版社(coldspringharborpress),(1998))。

内源基因:术语“内源基因”意指对参照宿主细胞而言天然的基因。“内源基因表达”意指内源基因的表达。

内切葡聚糖酶:术语“内切葡聚糖酶”意指4-(1,3;1,4)-β-d-葡聚糖4-葡聚糖水解酶(e.c.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣多糖中的1,4-β-d-糖苷键,混合β-1,3-1,4葡聚糖如谷类β-d-葡聚糖或木葡聚糖以及含有纤维素组分的其他植物材料中的β-1,4键的内切水解。可以通过测量底物粘度的降低或通过还原糖测定所确定的还原性末端的增加来确定内切葡聚糖酶活性(zhang等人,2006,biotechnologyadvances[生物技术进展]24:452-481)。还可以根据ghose,1987,pureandappl.chem.[纯粹与应用化学]59:257-268的程序,在ph5、40℃下,使用羧甲基纤维素(cmc)作为底物来确定内切葡聚糖酶活性。

表达:术语“表达”包括在多肽的生产中涉及的任何步骤,包括但不限于,转录、转录后修饰、翻译、翻译后修饰、以及分泌。可以对表达进行测量—例如,来检测增加的表达—通过本领域已知的技术,如测量mrna和/或翻译的多肽的水平。

表达载体:术语“表达载体”意指直链或环状dna分子,其包含编码多肽的多核苷酸并且可操作地连接至提供用于其表达的控制序列。

可发酵的培养基:术语“可发酵的培养基”或“发酵培养基”是指包含一种或多种(例如,两种、若干种)糖的培养基,如葡萄糖、果糖、蔗糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶性低聚糖,其中该培养基能够部分地被宿主细胞转化(发酵)为希望的产物,如乙醇。在一些情况下,该发酵培养基衍生自天然来源,如甘蔗、淀粉、或纤维素;并且可以来自这种来源的酶水解(糖化)的预处理。术语发酵培养基在本文理解为指在添加发酵生物之前的介质,例如,由糖化过程产生的介质,以及在同时糖化和发酵过程(ssf)中使用的介质。

半纤维素分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”意指可对半纤维素材料进行水解的一种或多种(例如,两种,若干种)酶。参见,例如shallom和shoham,2003,currentopinioninmicrobiology[微生物学当前观点]6(3):219-228)。半纤维素酶是植物生物质降解中的关键组分。半纤维素酶的实例包括但不限于:乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶、以及木糖苷酶。这些酶的底物(半纤维素)是支链和直链多糖的异质性组,这些多糖经由氢键与植物细胞壁中的纤维素微纤维相结合,从而将它们交联成稳健的网络。半纤维素还共价附接至木质素,从而与纤维素一起形成高度复杂的结构。半纤维素的可变结构和组织要求许多酶的协同作用以使其完全降解。半纤维素酶的催化模块是水解糖苷键的糖苷水解酶(gh),或是水解乙酸或阿魏酸侧基团的酯键的碳水化合物酯酶(ce)。这些催化模块基于其一级序列的同源性,可以分配到gh和ce家族。一些家族,具有总体上类似的折叠,可进一步归类为宗族(clan),以字母标记(例如,gh-a)。在碳水化合物活性酶(cazy)数据库中可得到这些以及其他碳水化合物活性酶的最翔实和最新的分类。半纤维素分解酶活性可根据ghose和bisaria,1987,pure&appi.chem.[理论与应用化学]59:1739-1752,在适宜温度例如40℃-80℃,例如50℃、55℃、60℃、65℃或70℃,以及适宜ph例如4-9,例如5.0、5.5、6.0、6.5或7.0下进行测量。

异源多核苷酸:术语“异源多核苷酸”在本文定义为对宿主细胞不是天然的多核苷酸;天然多核苷酸,其中对编码区已进行了结构修饰;天然多核苷酸,其表达由于通过重组dna技术(例如不同的(外源)启动子)操纵dna而被定量改变;或宿主细胞中的一种天然多核苷酸,该宿主细胞具有该多核苷酸的一个或多个额外拷贝以定量改变表达。“异源基因”是包含异源多核苷酸的基因。

高严格条件:术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准dna印迹程序,在42℃在5xsspe、0.3%sds、200微克/ml剪切并变性的鲑鱼精子dna和50%甲酰胺中预杂交和杂交12至24小时。运载体材料最终使用0.2xssc、0.2%sds,在65℃下洗涤三次,每次15分钟。

宿主细胞:术语“宿主细胞”意指易于用包含本文所述的多核苷酸(例如,编码转运蛋白或其调节物的多核苷酸)的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不完全相同的任何亲本细胞子代。术语“重组细胞”在本文中定义为包含使用重组技术引入的一个或多个(例如,两个、若干个)异源多核苷酸的非天然存在的宿主细胞。

低严格条件:术语“低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准dna印迹程序,在42℃、于5xsspe、0.3%sds、200微克/ml剪切并变性的鲑鱼精子dna和25%甲酰胺中预杂交和杂交12至24小时。运载体材料最终使用0.2xssc、0.2%sds,在50℃下洗涤三次,每次15分钟。

成熟多肽:术语“成熟多肽”在本文中定义为在翻译和任何翻译后修饰(如n-末端加工、c-末端截短、糖基化、磷酸化等)之后处于其最终形式的具有生物活性的多肽。

中严格条件:术语“中严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准dna印迹程序,在42℃、于5xsspe、0.3%sds、200微克/ml剪切并变性的鲑鱼精子dna和35%甲酰胺中预杂交和杂交12至24小时。运载体材料最终使用0.2xssc、0.2%sds,在55℃下洗涤三次,每次15分钟。

中-高严格条件:术语“中-高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准dna印迹程序,在42℃、于5xsspe、0.3%sds、200微克/ml剪切并变性的鲑鱼精子dna和35%甲酰胺中预杂交和杂交12至24小时。运载体材料最终使用0.2xssc、0.2%sds,在60℃下洗涤三次,每次15分钟。

核酸构建体:术语“核酸构建体”意指包含一个或多个(例如,两个、若干个)控制序列的多核苷酸。多核苷酸可以是单链的或双链的,并且可以分离自天然存在的基因、可以被修饰成以另外的不会在自然界中存在的方式包含核酸的区段,或可以是合成的。

可操作地连接:术语“可操作地连接”意指如下构型,在所述构型中,控制序列被放置在相对于多核苷酸的编码序列适当的位置处,使得所述控制序列指导所述编码序列的表达。

预处理的玉米秸秆:术语“预处理的玉米秸秆”或“pcs”意指通过热和稀硫酸处理、碱预处理、中性预处理、或本领域已知的任何预处理从玉米秸秆得到的含纤维素材料。

蛋白酶:术语“蛋白酶”在本文中定义为水解肽键的酶。它包括属于ec3.4酶组的任何酶(包括其13个亚类中的每一个)。ec编号参考加利福尼亚州(california)的圣迭戈(sandiego)的nc-iubmb,学术出版社(academicpress)的1992年酶命名法,分别包括出版于以下中的增刊1-5:eur.j.biochem.[欧洲生物化学杂志]223:1-5(1994);eur.j.biochem.[欧洲生物化学杂志]232:1-6(1995);eur.j.biochem.[欧洲生物化学杂志]237:1-5(1996);eur.j.biochem.[欧洲生物化学杂志]250:1-6(1997);和eur.j.biochem.[欧洲生物化学杂志]264:610-650(1999)。术语“枯草杆菌酶”是指根据siezen等人,1991,proteinengng.[蛋白质工程]4:719-737和siezen等人,1997,proteinscience[蛋白质科学]6:501-523的丝氨酸蛋白酶亚组。丝氨酸蛋白酶或丝氨酸肽酶是蛋白酶亚组,其特征为在活性位点上具有丝氨酸,与底物形成了共价加合物。另外,枯草杆菌酶(和丝氨酸蛋白酶)的特征为除了丝氨酸以外,还具有两个活性位点氨基酸残基,即组氨酸和天冬氨酸残基。枯草杆菌酶可以被划分为6个亚类,即,枯草杆菌蛋白酶家族、嗜热蛋白酶家族、蛋白酶k家族、羊毛硫氨酸抗生素肽酶家族、kexin家族和pyrolysin家族。术语“蛋白酶活性”意指蛋白水解活性(ec3.4)。蛋白酶可以是内肽酶(ec3.4.21)。蛋白酶活性可以使用本领域已知的(例如,us2015/0125925)本文所述的方法(参见实例)或使用可商购的测定试剂盒(例如,西格玛奥德里奇公司(sigma-aldrich))来确定。

序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的关联度通过参数“序列同一性”来描述。

出于本文描述的目的,使用尼德曼-翁施算法(needleman-wunschalgorithm)(needleman和wunsch,j.mol.biol.[分子生物学杂志]1970,48,443-453)来确定两个氨基酸序列之间的序列同一性的程度,该算法如emboss软件包(emboss:欧洲分子生物学开放软件套件(theeuropeanmolecularbiologyopensoftwaresuite),rice等人,trendsgenet.[遗传学趋势]2000,16,276-277)(优选3.0.0版或更新版本)的尼德尔(needle)程序中所实施的。所使用的任选参数是空位开放罚分10、空位延伸罚分0.5、以及eblosum62(blosum62的emboss版本)取代矩阵。使用尼德尔标记的“最长同一性”的输出(使用非简化(-nobrief)选项获得)作为同一性百分比并且如下计算:

(相同的残基x100)/(参照序列的长度-比对中的空位总数)

出于本文描述的目的,使用尼德曼-翁施算法(needleman和wunsch,1970,见上文)来确定两个脱氧核糖核苷酸序列之间的序列同一性的程度,该算法如emboss软件包(emboss:欧洲分子生物学开放软件套件,rice等人,2000,见上文)(优选3.0.0版或更新版本)的尼德尔程序中所实施的。所使用的任选参数是空位开放罚分10、空位延伸罚分0.5、以及ednafull(ncbinuc4.4的emboss版本)取代矩阵。使用尼德尔标记的“最长同一性”的输出(使用非简化(-nobrief)选项获得)作为同一性百分比并且如下计算:

(相同的脱氧核糖核苷酸x100)/(参照序列的长度-比对中的空位总数)

信号肽:术语“信号肽”在本文中定义为以符合阅读框的方式连接(融合)至具有生物活性的多肽的氨基末端且指导该多肽进入细胞的分泌途径的肽。

非常高严格条件:术语“非常高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准dna印迹程序,在42℃在5xsspe、0.3%sds、200微克/ml剪切并变性的鲑鱼精子dna和50%甲酰胺中预杂交和杂交12至24小时。运载体材料最终使用0.2xssc、0.2%sds,在70℃下洗涤三次,每次15分钟。

非常低严格条件:术语“非常低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准dna印迹程序,在42℃、于5xsspe、0.3%sds、200微克/ml剪切并变性的鲑鱼精子dna和25%甲酰胺中预杂交和杂交12至24小时。运载体材料最终使用0.2xssc、0.2%sds,在45℃下洗涤三次,每次15分钟。

木聚糖酶:术语“木聚糖酶”意指1,4-β-d-木聚糖-木糖水解酶(1,4-β-d-xylan-xylohydrolase)(e.c.3.2.1.8),其催化木聚糖中1,4-β-d-木糖苷键的内水解。木聚糖酶活性可以在37℃在0.01%x-100和200mm磷酸钠(ph6)中用0.2%azcl-阿拉伯糖基木聚糖作为底物来确定。一个单位的木聚糖酶活性定义为在37℃、ph6,在200mm磷酸钠(ph6)中从作为底物的0.2%azcl-阿拉伯糖基木聚糖每分钟产生1.0微摩尔天青蛋白(azurine)。

木糖异构酶:术语“木糖异构酶”或“xi”意指可以在体内将d-木糖催化为d-木酮糖,并且在体外将d-葡萄糖转化为d-果糖的酶。木糖异构酶也称为“葡萄糖异构酶”,并且被分类为e.c.5.3.1.5。

本文提及“约”值或参数包括指向该值或参数本身的实施例。例如,提及“约x”的描述包括实施例“x”。当与测量值组合使用时,“约”包括涵盖至少与测量该具体数值的方法相关的不确定性的范围,并且可以包括在给定的数值附近正或负两个标准差的范围。

同样,提及“衍生自”另一个基因或多肽x的基因或多肽包括该基因或多肽x。

如本文和所附权利要求书中所用的,单数形式“一种/个(a/an)”、“或”以及“该(the)”包括复数指代物,除非上下文另外清楚表明。

应该理解的是本文所述的实施例包括“由……实施例组成”和/或“基本由……实施例组成”。如本文所用的,除了由于表达语言或必需含义情况下另有要求外,词语“包含(comprise)”或变形如“包含了(comprises)”或“包含着(comprising)”以包容性意义使用,即指定所述特征的存在,但不排除各种实施例中存在或加入了其他特征。

具体实施方式

本文尤其描述了从含淀粉材料或含纤维素材料生产发酵产物如乙醇的方法。

在工业规模发酵期间,酵母遇到各种各样的生理挑战,这些挑战包括可变浓度的糖,高浓度的酵母代谢产物如乙醇、甘油、有机酸、渗透胁迫、以及来自污染微生物(如野生酵母和细菌)的潜在竞争。因此,许多酵母不适合用于工业发酵。酵母属的最广泛使用的可商购的工业菌株(即,用于工业规模发酵)是,例如,在产品ethanol中所使用的酿酒酵母菌株。该菌株非常适合工业乙醇生产;然而,它需要加入大量氮,例如尿素和氨,以促进酵母生长。

申请人已经开发出用于乙醇发酵的酵母菌株,其能够提高发酵培养基中氮的利用,例如来自肽(例如三肽/四肽)的氮。申请人所得的酵母可用于发酵方法中,这些发酵方法可提供高速率和高产率,而无需依赖大量外源添加的蛋白酶和/或补充氮源。

在一方面是从含淀粉材料或含纤维素材料生产发酵产物的方法,该方法包括:

(a)糖化所述含淀粉材料或含纤维素材料;和

(b)用发酵生物发酵步骤(a)的经糖化的材料;

其中所述发酵生物包括提高或降低转运蛋白/通透酶或其调节物的表达的遗传修饰。

步骤a)和b)顺序或同时进行(ssf)。在一个实施例中,步骤a)和b)同时进行(ssf)。在另一实施例中,步骤a)和b)顺序进行。

发酵生物

本文所述的发酵生物可以衍生自本领域技术人员已知的能够生产发酵产物(如乙醇)的任何宿主细胞。如本文所用的,菌株的“衍生物”衍生自参照菌株,如通过诱变、重组dna技术、交配、细胞融合、或在酵母菌株之间的胞导。本领域的技术人员应该理解,遗传改变(包括本文示例的代谢修饰)可以参考适合的宿主生物及其相应的代谢反应或用于希望的遗传材料(如希望的代谢途径的基因)的适合的来源生物加以描述。然而,考虑到多种多样的生物的全基因组测序以及基因组学领域中高水平的技能,本领域的技术人员可以将本文提供的教导和指导应用于其他生物中。例如,可以通过掺入相同的或来自不同于参照物种的物种的类似编码核酸而容易地将本文示例的代谢改变应用于其他物种中。

用于制备本文所述的遗传修饰细胞的宿主细胞可以来自任何适合的宿主,如酵母菌株,包括但不限于,酵母属、红酵母属、裂殖酵母属、克鲁维酵母属、毕赤酵母属、汉逊酵母属、伊萨酵母属、红冬孢酵母属、假丝酵母属、耶氏酵母属、油脂酵母属、隐球菌属或德克拉酵母属细胞。在一些实施例中,酵母细胞是东方伊萨酵母、郎比可假丝酵母、博伊丁酵母或酿酒酵母细胞。具体地,考虑了酵母属宿主细胞,如酿酒酵母、贝酵母或卡尔酵母细胞。在一个实施例中,酵母细胞是酿酒酵母细胞。

合适的细胞可以例如衍生自商业上可获得的菌株和多倍体或非整倍性工业菌株,包括但不限于来自superstarttmc5fueltm等(拉曼公司(lallemand));redstar和ethanol(fermentis/lesaffre,美国);fali(abmauri);贝克最佳酵母、贝克压缩酵母等(fleishmann的酵母);biofermaft、xp、cf和xr(北美生物制品公司(northamericanbioproductscorp.));turbo酵母(gertstrandab);和(帝斯曼专业公司(dsmspecialties))的那些。其他可用的酵母菌株可获自生物保藏,例如美国典型培养物保藏中心(americantypeculturecollection,atcc)或德国微生物和细胞培养物保藏中心(deutschesammlungvonmikroorganismenundzellkulturengmbh,dsmz),如例如by4741(例如atcc201388);y108-1(atccpta.10567)和nrrlyb-1952(ars培养物保藏中心(arsculturecollection))。还有其他适合作为宿主细胞的酿酒酵母菌株dby746、[alpha][eta]22、s150-2b、gpy55-15ba、cen.pk、usm21、tmb3500、tmb3400、vtt-a-63015、vtt-a-85068、vtt-c-79093及其衍生物以及酵母属菌种1400、424a(lnh-st)、259a(lnh-st)及其衍生物。在一个实施例中,该重组细胞是菌株酿酒酵母cibts1260(在美国伊利诺伊州61604农业研究服务菌种保藏中心(nrrl)登录号nrrly-50973下保藏)的衍生物。

可以使用本领域已知的和本文描述的方法来引入遗传修饰,例如重组技术,以及非重组育种技术(例如,美国专利号8,257,959中描述和涉及的方法)。

该菌株也可以是酿酒酵母菌株nmiv14/004037(参见,wo2015/143324和wo2015/143317,各自通过引用并入本文),菌株号v15/004035、v15/004036和v15/004037(参见,wo2016/153924,通过引用并入本文),菌株号v15/001459、v15/001460、v15/001461(参见,wo2016/138437,通过引用并入本文),或描述于wo2017/087330(通过引用并入本文)中的任何菌株的衍生物。

已经产生了根据本发明的发酵生物,以通过降低酶的成本来提高发酵产率并改善工艺经济性,因为提高方法性能所需的部分或全部必需酶是由发酵生物产生的。

本文所述的发酵生物可以利用以下表达载体,这些表达载体包含一个或多个(例如,两个、若干个)异源基因的编码序列,这些编码序列被连接至一个或多个控制序列,这一个或多个控制序列指导在与这一个或多个控制序列相容的条件下在适合的细胞中的表达。可以在任何本文所述的细胞和方法中使用此类表达载体。本文所述的多核苷酸可以按多种方式操纵,以提供希望的多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操作可以是理想的或必需的。用于利用重组dna方法修饰多核苷酸的技术是本领域熟知的。

可以将构建体或载体(或多个构建体或载体)引入细胞中,这样使得该构建体或载体被维持作为染色体整合体或作为自主复制的染色体外载体,如早前所述;该构建体或载体(或这些构建体或载体)包含一个或多个(例如,两个、若干个)异源基因。

各种核苷酸和控制序列可以连接在一起以产生重组表达载体,该重组表达载体可以包括一个或多个(例如,两个、若干个)合宜的限制位点以允许在此类位点插入或取代该多核苷酸。可替代地,可以通过将一种或多种多核苷酸或者包含该序列的核酸构建体插入用于表达的适当载体中而表达该一种或多种多核苷酸。在产生表达载体时,编码序列如此位于载体中,使得编码序列与用于表达的适当控制序列可操作地连接。

该重组表达载体可以是可以方便地经受重组dna程序并且可以引起该多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是直链或闭合环状质粒。

该载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微染色体或人工染色体。载体可以含有用于确保自我复制的任何手段。可替代地,载体可以是这样的载体,当它引入宿主细胞中时整合入基因组中并与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单一载体或质粒或两个或更多个载体或质粒(这些载体或质粒共同含有待引入到细胞的基因组中的总dna)或转座子。

该表达载体可以含有任何适合的启动子序列,该启动子序列可被细胞识别以表达本文所述的基因。该启动子序列含有转录控制序列,这些转录控制序列介导该多肽的表达。该启动子可以是在选择的细胞中显示出转录活性的任何多核苷酸,包括突变型、截短型及杂合型启动子,并且可以是由编码与该细胞同源或异源的细胞外或细胞内多肽的基因获得。

本文所述的每种异源多核苷酸都可以被可操作地连接至对于该多核苷酸而言外源的启动子上。例如,在一个实施例中,编码转运蛋白的异源多核苷酸被可操作地连接至对于该多核苷酸而言外源的启动子上。这些启动子可以与所选的天然启动子相同或与其具有高度序列同一性(例如,至少约80%、至少约85%、至少约90%、至少约95%或至少约99%)。

用于指导核酸构建体在酵母细胞中的转录的适合的启动子的实例包括但不限于获得自以下的基因的启动子:烯醇酶(例如,酿酒酵母烯醇酶或东方伊萨酵母烯醇酶(eno1))、半乳糖激酶(例如,酿酒酵母半乳糖激酶或东方伊萨酵母半乳糖激酶(gal1))、醇脱氢酶/甘油醛-3磷酸脱氢酶(例如,酿酒酵母醇脱氢酶/甘油醛-3磷酸脱氢酶或东方伊萨酵母醇脱氢酶/甘油醛-3磷酸脱氢酶(adh1、adh2/gap))、磷酸甘油醛异构酶(例如,酿酒酵母磷酸甘油醛异构酶或东方伊萨酵母磷酸甘油醛异构酶(tpi))、金属硫蛋白(例如,酿酒酵母金属硫蛋白或东方伊萨酵母金属硫蛋白(cup1))、3-磷酸甘油酸激酶(例如,酿酒酵母3磷酸甘油酸激酶或东方伊萨酵母3-磷酸甘油酸激酶(pgk))、pdc1、木糖还原酶(xr)、木糖醇脱氢酶(xdh)、l-(+)-乳酸-细胞色素c氧化还原酶(cyb2)、翻译延长因子-1(tef1)、翻译延长因子-2(tef2)、甘油醛-3-磷酸脱氢酶(gapdh)、和乳清酸核苷5'-磷酸脱羧酶(ura3)基因。酵母宿主细胞的其他有用的启动子由romanos等人,1992,yeast[酵母]8:423-488描述。

该控制序列也可以是被宿主细胞识别以终止转录的适合的转录终止子序列。该终止子序列被可操作地连接至编码该多肽的多核苷酸的3’-末端。可以使用在选择的酵母细胞中具有功能的任何终止子。该终止子可以与所选的天然终止子相同或与其具有高度序列同一性(例如,至少约80%、至少约85%、至少约90%、至少约95%或至少约99%)。

酵母宿主细胞的适合的终止子可以获得自以下的基因:烯醇酶(例如,酿酒酵母或东方伊萨酵母烯醇酶)、细胞色素c(例如,酿酒酵母或东方伊萨酵母细胞色素(cyc1))、甘油醛-3磷酸脱氢酶(例如,酿酒酵母或东方伊萨酵母甘油醛-3-磷酸脱氢酶(gpd))、pdc1、xr、xdh、转醛醇酶(tal)、转酮醇酶(tkl)、核糖5-磷酸-酮醇异构酶(rki)、cyb2、以及半乳糖基因家族(尤其是gal10终止子)。酵母宿主细胞的其他有用的终止子由romanos等人(1992,同上)描述。

控制序列还可以是启动子下游和基因的编码序列上游的mrna稳定子区域,其增加所述基因的表达。

适合的mrna稳定子区域的实例从以下获得:苏云金芽孢杆菌(bacillusthuringiensis)cryiiia基因(wo94/25612)和枯草芽孢杆菌(bacillussubtilis)sp82基因(hue等人,1995,journalofbacteriology[细菌学杂志]177:3465-3471)。

该控制序列也可以是适合的前导子序列,其中转录时,该前导子序列是对由宿主细胞翻译重要的mrna的非翻译区。该前导子序列可操作地连接至编码该多肽的多核苷酸的5’-末端。可以使用在选择的酵母细胞中具有功能的任何前导子序列。

酵母宿主细胞的适合的前导子获得自以下的基因:烯醇酶(例如,酿酒酵母或东方伊萨酵母烯醇酶(eno-1))、3-磷酸甘油酸激酶(例如,酿酒酵母或东方伊萨酵母3-磷酸甘油酸激酶)、α-因子(例如,酿酒酵母或东方伊萨酵母α-因子)、以及醇脱氢酶/甘油醛-3-磷酸脱氢酶(例如,酿酒酵母或东方伊萨酵母醇脱氢酶/甘油醛-3磷酸脱氢酶(adh2/gap))。

该控制序列还可以是多腺苷酸化序列;与多核苷酸3’末端可操作地连接并在转录时由宿主细胞识别为向转录的mrna添加聚腺苷酸残基的信号的序列。可以使用在选择的宿主细胞中具有功能的任何多腺苷酸化序列。对于酵母细胞有用的多腺苷酸化序列描述于以下文献:guo和sherman,1995,mol.cellularbiol.[分子细胞生物学]15:5983-5990。

也可能令人希望的是添加调节序列,该调节序列允许相对于宿主细胞的生长而调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵子系统。在酵母中,可以使用adh2系统或gal1系统。

这些载体可以含有一个或多个(例如,两个、若干个)允许方便地选择转化细胞、转染细胞、转导细胞等细胞的选择性标记。选择性标记是一种基因,其产物提供了杀生物剂抗性或病毒抗性、对重金属抗性、对营养缺陷型的原养型等。酵母宿主细胞的适合的标记包括但不限于:ade2、his3、leu2、lys2、met3、trp1和ura3。

这些载体可以含有一个或多个(例如,两个、若干个)允许将该载体整合进宿主细胞的基因组中或在该细胞中独立于基因组而自主复制的元件。

对于整合到宿主细胞基因组中,该载体可以依靠编码该多肽的多核苷酸序列或用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,所述载体可以含有用于指导通过同源重组而整合入宿主细胞基因组中的染色体中的精确位置处的另外的多核苷酸。为了增加在精确位置处整合的可能性,整合元件应当含有足够数目的核酸,例如100至10,000个碱基对、400至10,000个碱基对和800至10,000个碱基对,所述核酸与相应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组内的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的多核苷酸。另一方面,载体可以通过非同源重组整合入宿主细胞的基因组中。潜在整合位点包括本领域所描述的那些(例如,参见us2012/0135481)。

对于自主复制,该载体可以进一步包含使该载体能够在酵母细胞中自主复制的复制起点。复制起点可以是在细胞中发挥作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ars1、ars4、ars1与cen3的组合、及ars4与cen6的组合。

可以将本文所述的多核苷酸的超过一个的拷贝插入到宿主细胞中以增加多肽的产生。通过将序列的至少一个另外的拷贝整合到酵母细胞基因组中或者通过包括与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择含有选择性标记基因的经扩增的拷贝的细胞、以及由此该多核苷酸的另外的拷贝。

用于连接以上所描述的元件以构建在此描述的重组表达载体的程序是本领域的普通技术人员熟知的(参见例如,sambrook等人,1989,见上文)。

本领域已知的用于制备用于乙醇发酵的重组细胞的另外的程序和技术描述于例如wo2016/045569中,将其内容通过引用特此并入。

该发酵生物可以呈组合物的形式,该组合物包含发酵生物(例如,本文所述的酵母菌株)和天然存在和/或非天然存在的组分。

本文所述的发酵生物可以是任何活的形式,包括粉碎的、干燥的,包括活性干燥和速溶的、压缩的、膏状(液体)形式等。在一个实施例中,发酵生物(例如,酿酒酵母菌株)是干酵母,例如活性干酵母或速溶酵母。在一个实施例中,该发酵生物(例如,酿酒酵母菌株)是粉碎酵母。在一个实施例中,该发酵生物(例如,酿酒酵母菌株)是压缩酵母。在一个实施例中,该发酵生物(例如,酿酒酵母菌株)是膏状酵母。

在一个实施例中是组合物,该组合物包含本文所述的发酵生物(例如,酿酒酵母菌株)和选自下组的一种或多种组分,该组由以下组成:表面活性剂、乳化剂、树胶、溶胀剂、以及抗氧化剂和其他加工助剂。

本文所述的组合物可包含本文所述的发酵生物(例如,酿酒酵母菌株)和任何适合的表面活性剂。在一个实施例中,该一种或多种表面活性剂是阴离子表面活性剂、阳离子表面活性剂、和/或非离子表面活性剂。

本文所述的组合物可包含本文所述的发酵生物(例如,酿酒酵母菌株)和任何适合的乳化剂。在一个实施例中,该乳化剂是山梨聚糖的脂肪酸酯。在一个实施例中,该乳化剂选自下组:山梨聚糖单硬脂酸酯(sms)、单双甘酯的柠檬酸酯、聚甘油酯、丙二醇的脂肪酸酯。

在一个实施例中,该组合物包含本文所述的发酵生物(例如,酿酒酵母菌株)和olindronalsms、olindronalsk、或olindronalspl,包括欧洲专利号1,724,336(将其通过引用特此并入)中涉及的组合物。针对活性干酵母,这些产品可以从布塞蒂,奥地利商购获得。

本文所述的组合物可包含本文所述的发酵生物(例如,酿酒酵母菌株)和任何适合的树胶。在一个实施例中,该树胶选自下组:槐树豆胶、瓜尔胶、黄芪胶、阿拉伯胶、黄原胶和阿拉伯树胶,具体地针对膏状、压缩和干酵母。

本文所述的组合物可包含本文所述的发酵生物(例如,酿酒酵母菌株)和任何适合的溶胀剂。在一个实施例中,该溶胀剂是甲基纤维素或羧甲基纤维素。

本文所述的组合物可包含本文所述的发酵生物(例如,酿酒酵母菌株)和任何适合的抗氧化剂。在一个实施例中,该抗氧化剂是丁羟茴醚(bha)和/或丁羟甲苯(bht)、或抗坏血酸(维生素c),具体地针对活性干酵母。

转运蛋白/通透酶

在一些实施例中,发酵生物(例如重组酵母细胞)包含增加或减少转运蛋白/通透酶表达的遗传修饰。转运蛋白可以是适于提高发酵生物的氮利用的任何转运蛋白,例如天然存在的转运蛋白(例如,来自另一物种的天然转运蛋白或由修饰的表达载体表达的内源转运蛋白)或其保留转运蛋白活性的变体。

转运蛋白/通透酶包括例如氨基酸转运蛋白、肽转运蛋白(例如能够转运二肽、三肽和/或寡肽(n>3)的任何多肽)、线粒体转运蛋白、液泡转运蛋白和铵通透酶。

转运蛋白/通透酶活性可以使用本领域已知的任何合适的测定来测量。

在一些实施例中,遗传修饰是编码转运蛋白/通透酶的异源多核苷酸。

在一些实施例中,当在相同条件下培养时,与不具有遗传修饰的发酵生物相比,发酵生物具有增加的转运蛋白活性水平。在一些实施例中,当在相同条件下培养时,与不具有遗传修饰的发酵生物相比,发酵生物具有增加至少5%,例如至少10%、至少15%、至少20%、至少25%、至少50%、至少100%、至少150%、至少200%、至少300%或至少500%的转运蛋白活性水平。

在一些实施例中,在相同条件下,与酿酒酵母菌株ethanol(在澳大利亚维多利亚州国家计量研究所以登录号v14/007039保藏)相比,发酵生物增加或减少转运蛋白表达。在一些实施例中,在相同条件下(例如,在文中所述的条件下,例如发酵53小时或之后),与酿酒酵母菌株ethanol(在澳大利亚维多利亚州国家计量研究所以登录号v14/007039保藏)相比,发酵生物增加表达至少5%,例如至少10%、至少15%、至少20%、至少25%、至少50%、至少100%、至少150%、至少200%、至少300%或至少500%。

可以用本文所述的发酵生物和使用方法表达的示例性转运蛋白包括但不限于表1中所示的转运蛋白(或其衍生物)。

表1.

编码适合的转运蛋白的另外的多核苷酸可以衍生自任何适合属的微生物,包括在uniprotkb数据库(www.uniprot.org)内可容易获得的那些。

转运蛋白可以是细菌转运蛋白。例如,该转运蛋白可以衍生自革兰氏阳性细菌,如芽孢杆菌属、梭菌属(clostridium)、肠球菌属(enterococcus)、土芽孢杆菌属(geobacillus)、乳杆菌属(lactobacillus)、乳球菌属(lactococcus)、海洋芽孢杆菌属(oceanobacillus)、葡萄球菌属(staphylococcus)、链球菌属(streptococcus)或链霉菌属;或者革兰氏阴性细菌,如弯曲杆菌属(campylobacter)、大肠杆菌(e.coli)、黄杆菌属(flavobacterium)、梭杆菌属(fusobacterium)、螺杆菌属(helicobacter)、泥杆菌属(ilyobacter)、奈瑟氏菌属(neisseria)、假单胞菌属(pseudomonas)、沙门氏菌属(salmonella)或脲原体属(ureaplasma)。

在一个实施例,该转运蛋白衍生自嗜碱芽孢杆菌(bacillusalkalophilus)、解淀粉芽孢杆菌(bacillusamyloliquefaciens)、短芽孢杆菌(bacillusbrevis)、环状芽孢杆菌(bacilluscirculans)、克劳氏芽孢杆菌(bacillusclausii)、凝结芽孢杆菌(bacilluscoagulans)、坚强芽孢杆菌(bacillusfirmus)、灿烂芽孢杆菌(bacilluslautus)、迟缓芽孢杆菌(bacilluslentus)、地衣芽孢杆菌(bacilluslicheniformis)、巨大芽孢杆菌(bacillusmegaterium)、短小芽孢杆菌(bacilluspumilus)、嗜热脂肪芽孢杆菌(bacillusstearothermophilus)、枯草芽孢杆菌(bacillussubtilis)、或苏云金芽孢杆菌(bacillusthuringiensis)。

在另一个实施例中,该转运蛋白衍生自似马链球菌(streptococcusequisimilis)、酿脓链球菌(streptococcuspyogenes)、乳房链球菌(streptococcusuberis)、或马链球菌兽疫亚种(streptococcusequisubsp.zooepidemicus)。

在另一个实施例中,该转运蛋白衍生自不产色链霉菌(streptomycesachromogenes)、除虫链霉菌(streptomycesavermitilis)、天蓝链霉菌(streptomycescoelicolor)、灰色链霉菌(streptomycesgriseus)或浅青紫链霉菌(streptomyceslividans)。

转运蛋白可以是真菌转运蛋白。例如,该转运蛋白可以衍生自酵母,如假丝酵母属(candida)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母、耶氏酵母属或伊萨酵母属(issatchenkia);或者衍生自丝状真菌,如枝顶孢霉属(acremonium)、伞菌属(agaricus)、链格孢属(alternaria)、曲霉属、短梗霉属(aureobasidium)、葡萄座腔菌属(botryospaeria)、拟蜡菌属(ceriporiopsis)、毛喙壳属(chaetomidium)、金孢子菌属(chrysosporium)、麦角菌属(claviceps)、旋孢腔菌属(cochliobolus)、鬼伞属(coprinopsis)、乳白蚁属(coptotermes)、棒囊壳属(corynascus)、隐丛赤壳菌属(cryphonectria)、隐球菌属(cryptococcus)、色二孢属(diplodia)、黑耳属(exidia)、线黑粉酵母属(filibasidium)、镰孢属(fusarium)、赤霉属(gibberella)、全鞭毛虫属(holomastigotoides)、腐质霉属(humicola)、耙齿菌属(irpex)、香菇属(lentinula)、小腔球菌属(leptospaeria)、梨孢菌属(magnaporthe)、黑果菌属(melanocarpus)、亚灰树花菌属、毛霉属(mucor)、毁丝霉属(myceliophthora)、新美鞭菌属(neocallimastix)、链孢菌属(neurospora)、拟青霉属(paecilomyces)、青霉菌属、平革菌属(phanerochaete)、瘤胃壶菌属(piromyces)、poitrasia、假黑盘菌属(pseudoplectania)、假披发虫属(pseudotrichonympha)、根毛霉属(rhizomucor)、裂褶菌属(schizophyllum)、柱顶孢属(scytalidium)、篮状菌属(talaromyces)、嗜热子囊菌属(thermoascus)、梭孢壳霉属(thielavia)、弯颈霉属(tolypocladium)、木霉属(trichoderma)、长毛盘菌属(trichophaea)、轮枝孢属(verticillium)、小包脚菇属(volvariella)、或炭角菌属(xylaria)。

在另一个实施例中,该转运蛋白衍生自卡尔酵母、酿酒酵母、糖化酵母(saccharomycesdiastaticus)、道格拉氏酵母(saccharomycesdouglasii)、克鲁弗酵母(saccharomyceskluyveri)、诺地酵母(saccharomycesnorbensis)、或卵形酵母(saccharomycesoviformis)。

在一个实施例中,该转运蛋白衍生自球孢酵母属(torulaspora),例如seqidno:163或seqidno:164的小捕有胞圆酵母(torulasporamicroellipsoides)转运蛋白。

在另一个实施例中,该转运蛋白衍生自解纤维枝顶孢霉(acremoniumcellulolyticus)、棘孢曲霉(aspergillusaculeatus)、泡盛曲霉(aspergillusawamori)、臭曲霉(aspergillusfoetidus)、烟曲霉、日本曲霉(aspergillusjaponicus)、构巢曲霉(aspergillusnidulans)、黑曲霉、米曲霉、狭边金孢子菌(chrysosporiuminops)、嗜角质金孢子菌(chrysosporiumkeratinophilum)、卢克诺文思金孢子菌(chrysosporiumlucknowense)、粪状金孢子菌(chrysosporiummerdarium)、毡金孢子菌(chrysosporiumpannicola)、昆士兰金孢子菌(chrysosporiumqueenslandicum)、热带金孢子菌(chrysosporiumtropicum)、带纹金孢子菌(chrysosporiumzonatum)、杆孢状镰孢(fusariumbactridioides)、谷类镰孢(fusariumcerealis)、库威镰孢(fusariumcrookwellense)、大刀镰孢(fusariumculmorum)、禾谷镰孢(fusariumgraminearum)、禾赤镰孢(fusariumgraminum)、异孢镰孢(fusariumheterosporum)、合欢木镰孢(fusariumnegundi)、尖孢镰孢(fusariumoxysporum)、多枝镰孢(fusariumreticulatum)、粉红镰孢(fusariumroseum)、接骨木镰孢(fusariumsambucinum)、肤色镰孢(fusariumsarcochroum)、拟分枝孢镰孢(fusariumsporotrichioides)、硫色镰孢(fusariumsulphureum)、圆镰孢(fusariumtorulosum)、拟丝孢镰孢(fusariumtrichothecioides)、镶片镰孢(fusariumvenenatum)、灰腐质霉(humicolagrisea)、特异腐质霉(humicolainsolens)、疏棉状腐质霉(humicolalanuginosa)、白耙齿菌(irpexlacteus)、米黑根毛霉(mucormiehei)、嗜热毁丝霉(myceliophthorathermophila)、粗糙链孢菌(neurosporacrassa)、绳状青霉菌(penicilliumfuniculosum)、产紫青霉菌(penicilliumpurpurogenum)、黄孢原毛平革菌(phanerochaetechrysosporium)、无色梭孢壳霉(thielaviaachromatica)、成层梭抱壳菌(thielaviaalbomyces)、白毛梭孢壳霉(thielaviaalbopilosa)、澳洲梭孢壳霉(thielaviaaustraleinsis)、菲美蒂梭抱壳菌(thielaviafimeti)、小孢梭孢壳霉(thielaviamicrospora)、卵孢梭孢壳霉(thielaviaovispora)、秘鲁梭孢壳霉(thielaviaperuviana)、毛梭孢壳霉(thielaviasetosa)、瘤孢梭孢壳霉(thielaviaspededonium)、耐热梭孢壳(thielaviasubthermophila)、土生梭孢壳霉(thielaviaterrestris)、哈茨木霉(trichodermaharzianum)、康宁木霉(trichodermakoningii)、长枝木霉(trichodermalongibrachiatum)、里氏木霉、或绿色木霉(trichodermaviride)。

应理解的是对于前述的种,本发明涵盖完全和不完全阶段(perfectandimperfectstates),和其他分类学的等同物(equivalent),例如无性型(anamorph),而与它们已知的种名无关。本领域的技术人员会容易地识别适当等同物的身份。

这些物种的菌株可容易地在许多培养物保藏中心为公众所获得,例如美国典型培养物保藏中心(atcc)、德国微生物菌种保藏中心(deutschesammlungvonmikroorganismenundzellkulturengmbh,dsmz)、荷兰菌种保藏中心(centraalbureauvoorschimmelcultures,cbs)和美国农业研究服务专利培养物保藏中心北方地区研究中心(agriculturalresearchservicepatentculturecollection,northernregionalresearchcenter,nrrl)。

可以使用本文描述或参照的转运蛋白编码序列或其子序列,以及本文描述或参照的转运蛋白或其片段来设计核酸探针以根据本领域熟知的方法来鉴定并克隆编码来自不同属或物种的菌株的转运蛋白的dna。特别地,可以遵循标准dna印迹程序,使用此类探针来与目的细胞的基因组dna或cdna杂交,以便鉴定和分离其中的相应基因。此类探针可明显短于完整序列,但是长度应为至少15,例如至少25、至少35、或至少70个核苷酸。优选地,该核酸探针长度为至少100个核苷酸,例如长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸。dna和rna探针两者都可使用。典型地将探针进行标记(例如,用32p、3h、35s、生物素、或抗生物素蛋白),用于检测相应的基因。

可以针对与上文所述的探针杂交并编码亲本的dna来筛选由此类其他菌株制备的基因组dna或cdna文库。来自此类其他菌株的基因组dna或其他dna可通过琼脂糖或聚丙烯酰胺凝胶电泳或其他分离技术来分离。可将来自文库的dna或分离的dna转移到并固定在硝化纤维素或其他适合的运载体材料上。为了鉴定与编码序列或其子序列杂交的克隆或dna,在dna印迹中使用该运载体材料。

在一个实施例中,该核酸探针是编码seqidno:86-170中任一个的转运蛋白或其片段的多核苷酸或其子序列。

出于上述探针的目的,杂交是指,在非常低至非常高严格条件下,多核苷酸杂交至标记的核酸探针或其全长互补链或前述各项的子序列。可使用例如x射线片(x-rayfilm)检测在这些条件下与核酸探针杂交的分子。严格性和洗涤条件如上述所定义。

在一个实施例中,该转运蛋白由多核苷酸编码,该多核苷酸在至少低严格条件下,例如中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与本文描述或参照的转运蛋白中任一种的编码序列(例如,seqidno:1-85)的全长互补链杂交。(sambrook等人,1989,molecularcloning,alaboratorymanual[分子克隆:实验室手册],第2版coldspringharbor,newyork[冷泉港,纽约])。

也可以使用以上提到的探针从其他来源,包括从自然界(例如,土壤、堆肥、水、青贮等)分离的微生物或直接从天然材料(例如,土壤、堆肥、水、青贮等)获得的dna样品鉴定并获得转运蛋白。用于从天然生境中直接分离微生物和dna的技术是本领域熟知的。随后可以通过类似地筛选另一种微生物的基因组或cdna文库或混合dna样品衍生出编码转运蛋白的多核苷酸。

一旦用如本文所述的适合探针检测到编码转运蛋白的多核苷酸,就可以通过使用本领域普通技术人员已知的技术来分离或克隆该序列(参见例如,sambrook等人,1989,见上文)。用于分离或克隆编码转运蛋白的多核苷酸的技术包括从基因组dna分离、从cdna制备或其组合。可以例如通过使用熟知的聚合酶链式反应(pcr)或表达文库的抗体筛选来检测具有共有结构特征的克隆dna片段,实现从这样的基因组dna克隆多核苷酸(参见,例如,innis等人,1990,pcr:aguidetomethodsandapplication[pcr:方法和应用指南],academicpress[学术出版社],纽约)。还可以使用其他核酸扩增程序,如连接酶链式反应(lcr)、连接激活转录(lat)和基于核苷酸序列的扩增(nasba)。

在一个实施例中,转运蛋白包含seqidno:86-170中任一个(例如seqidno:129、seqidno:163或seqidno:164)的氨基酸序列或由其组成。在另一实施例中,转运蛋白是seqidno:86-170中任一个的转运蛋白的片段,例如seqidno:129、seqidno:163或seqidno:164(例如,其中该片段具有转运蛋白活性)。在一个实施例中,片段中的氨基酸残基数目是参照全长转运蛋白(例如,seqidno:86-170中任一个;例如seqidno:129、seqidno:163或seqidno:164)中氨基酸残基数目的至少75%,例如至少80%、85%、90%或95%。在其他实施例中,该转运蛋白可包含本文描述或参照的任何转运蛋白的催化结构域(例如,seqidno:86-170中任一个的催化结构域;例如seqidno:129、seqidno:163或seqidno:164)。

该转运蛋白可以是上述转运蛋白中任一种(例如,seqidno:86-170中任一个;例如seqidno:129、seqidno:163或seqidno:164)的变体。在一个实施例中,该转运蛋白与上述转运蛋白中任一种具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性(例如,seqidno:86-170中任一个;例如seqidno:129、seqidno:163或seqidno:164)。

在一个实施例中,该转运蛋白序列与上述转运蛋白中任一种(例如,seqidno:86-170中任一个;例如seqidno:129、seqidno:163或seqidno:164)的氨基酸序列相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸、或相差一个氨基酸的成熟多肽序列。在一个实施例中,该转运蛋白具有上述转运蛋白中任一种(例如,seqidno:86-170中任一个;例如seqidno:129、seqidno:163或seqidno:164)的氨基酸序列的一个或多个(例如,两个,若干个)的氨基酸取代、缺失和/或插入。在一些实施例中,氨基酸取代、缺失和/或插入的总数不超过10,例如不超过9、8、7、6、5、4、3、2或1。

氨基酸改变的性质通常较小,也就是说不会显著影响蛋白质折叠和/或活性的保守氨基酸取代或插入;典型地为一个至约30个氨基酸的小缺失;小氨基末端或羧基末端延伸,如氨基末端甲硫氨酸残基;多至约20-25个残基的小接头肽;或小的延伸,其通过改变净电荷或另一官能(例如聚组氨酸段、抗原表位或结合结构域)来促进纯化。

保守取代的实例在下组之内:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸(苯丙氨酸、色氨酸和酪氨酸)、以及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。一般不会改变比活性的氨基酸取代是本领域已知的并且例如由h.neurath和r.l.hill,1979,于theproteins[蛋白质],academicpress[学术出版社],纽约中描述。最普遍发生的交换是ala/ser、val/ile、asp/glu、thr/ser、ala/gly、ala/thr、ser/asn、ala/val、ser/gly、tyr/phe、ala/pro、lys/arg、asp/asn、leu/ile、leu/val、ala/glu和asp/gly。

可替代地,所述氨基酸改变具有这样一种性质:改变多肽的物理化学特性。例如,氨基酸改变可以改善转运蛋白的热稳定性、改变底物特异性、改变最适ph等。

可以根据本领域已知的程序来鉴定必需氨基酸,如定点诱变或丙氨酸扫描诱变(cunningham和wells,1989,science[科学]244:1081-1085)。在后一项技术中,在该分子中的每个残基处引入单个丙氨酸突变,并且对所得突变体分子的活性进行测试以鉴定对于该分子的活性至关重要的氨基酸残基。还参见,hilton等人,1996,j.biol.chem.[生物化学杂志]271:4699-4708。活性部位或其他生物学相互作用还可通过对结构的物理分析来确定,如由下述技术确定:核磁共振、晶体学(crystallography)、电子衍射、或光亲和标记,连同对推定的接触位点氨基酸进行突变(参见,例如,devos等人,1992,science[科学]255:306-312;smith等人,1992,j.mol.biol.[分子生物学杂志]224:899-904;wlodaver等人,1992,febslett.[欧洲生化学会联合会快报]309:59-64)。还可以从与参照转运蛋白相关的其他转运蛋白的同一性分析推断必需氨基酸的身份。

可以使用本领域熟知的多重序列比对(msa)技术来确定另外的有关本文的转运蛋白的结构-活性关系的指导。基于本文的教导,本领域的技术人员可以与本文所述的或本领域已知的任何数目的转运蛋白做相似的比对。此类比对帮助本领域的技术人员确定潜在相关的结构域(例如,结合结构域或催化结构域),并且在不同的转运蛋白序列中确定哪些氨基酸残基是保守的和不是保守的。本领域中应理解的是,改变在所披露的多肽之间的特定位置处是保守的氨基酸将更有可能导致生物活性的改变(bowie等人,1990,science[科学]247:1306-1310:“residuesthataredirectlyinvolvedinproteinfunctionssuchasbindingorcatalysiswillcertainlybeamongthemostconserved[直接涉及到蛋白功能如结合或催化的残基将一定是在最保守的残基中]”)。相比之下,取代在多肽之间不是高度保守的氨基酸将不太可能或不显著地改变生物活性。

本领域的技术人员可以在本领域已知的公开的x射线晶体学研究中找到甚至另外的关于结构-活性关系的指导。

使用已知的诱变、重组和/或改组方法,随后进行相关的筛选程序可以做出单或多氨基酸取代、缺失和/或插入并对其进行测试,所述相关的筛选程序例如由reidhaar-olson和sauer,1988,science[科学]241:53-57;bowie和sauer,1989,proc.natl.acad.sci.usa[美国国家科学院院刊]86:2152-2156;wo95/17413;或wo95/22625披露的那些。其他可以使用的方法包括易错pcr、噬菌体展示(例如lowman等人,1991,biochemistry[生物化学]30:10832-10837;美国专利号5,223,409;wo92/06204)以及区域定向诱变(derbyshire等人,1986,gene[基因]46:145;ner等人,1988,dna7:127)。

诱变/改组方法可以与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(ness等人,1999,naturebiotechnology[自然生物技术]17:893-896)。可以从宿主细胞回收编码活性转运蛋白的诱变的dna分子,并使用本领域的标准方法对其进行快速测序。这些方法允许快速确定多肽中各个氨基酸残基的重要性。

在另一个实施例中,编码转运蛋白的异源多核苷酸包含如下编码序列,该编码序列与上述转运蛋白中任一种的编码序列(例如,seqidno:1-85中任一个;例如seqidno:44、seqidno:78或seqidno:79)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

在一个实施例中,编码转运蛋白的异源多核苷酸包含上述转运蛋白中任一种的编码序列或由其组成(例如,seqidno:1-85中任一个;例如seqidno:44、seqidno:78或seqidno:79)。在另一实施例中,编码转运蛋白的异源多核苷酸包含上述转运蛋白中任一种的编码序列(例如,seqidno:1-85中任一个;例如seqidno:44、seqidno:78或seqidno:79)的子序列,其中该子序列编码具有转运蛋白活性的多肽。在另一个实施例中,该编码子序列中的核苷酸残基的数目是参照编码序列的数目的至少75%,例如至少80%、85%、90%或95%。

本文所述的任何相关方面或实施例的参照编码序列可以是天然编码序列或简并序列,例如设计用于特定宿主细胞的密码子优化的(例如,针对在酿酒酵母中表达而优化的)编码序列。

该转运蛋白可以是一种融合多肽或可切割的融合多肽,其中另一个多肽融合在该转运蛋白的n-末端或c-末端处。通过将编码另一种多肽的多核苷酸与编码转运蛋白的多核苷酸融合而产生融合多肽。用于产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列,使得它们在阅读框中,并且使该融合多肽的表达在相同的一个或多个启动子和终止子的控制下。还可使用内含肽技术构建融合多肽,其中在翻译后产生融合物(cooper等人,1993,emboj.[欧洲分子生物学学会杂志]12:2575-2583;dawson等人,1994,science[科学]266:776-779)。

在一些实施例中,发酵生物(例如,重组酵母细胞)包含对内源转运蛋白基因(例如,表1中所示的转运蛋白基因中任一个,例如seqidno:1-85中任一个)的破坏。在一些实施例中,破坏的内源转运蛋白基因是失活的。在另一个实施例中,内源基因的编码序列与上述转运蛋白中任一种的编码序列(例如,seqidno:1-85中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在另一个实施例中,内源基因编码转运蛋白,该转运蛋白与上述转运蛋白中任一种(例如,seqidno:86-170中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

可以使用本领域熟知的方法(包括本文描述的那些方法)构建包含基因破坏的发酵生物。可以破坏该基因的一部分,如编码区或为编码区的表达所需的控制序列。该基因的这样一种控制序列可以是启动子序列或其功能部分,即足以影响该基因的表达的部分。例如,可以将启动子序列失活从而无表达或可以将天然启动子替换为较弱的启动子以减少编码序列的表达。可修饰的其他控制序列包括但不限于前导子、前肽序列、信号序列、转录终止子以及转录激活因子。

可以通过基因缺失技术来构建包含基因破坏的发酵生物,以消除或减少该基因的表达。基因缺失技术使得可以部分或完全除去该基因,从而消除其表达。这类方法中,使用已经构建为邻接地含有侧翼于该基因的5'和3'区的质粒,通过同源重组完成该基因的缺失。

还可以通过引入、取代和/或除去该基因中的或为其转录或翻译所需的其控制序列中的一个或多个(例如,两个、若干个)核苷酸来构建包含基因破坏的发酵生物。例如,可以插入或除去核苷酸,用于引入终止密码子、除去起始密码子或移码开放阅读框。可以根据本领域已知的方法,通过定点诱变或pcr产生的诱变完成这样的修饰。参见,例如botstein和shortle,1985,science[科学]229:4719;lo等人,1985,proc.natl.acad.sci.u.s.a.[美国国家科学院院刊]81:2285;higuchi等人,1988,nucleicacidsres[核酸研究]16:7351;shimada,1996,meth.mol.biol.[分子生物学方法]57:157;ho等人,1989,gene[基因]77:61;horton等人,1989,gene[基因]77:61;以及sarkar和sommer,1990,biotechniques[生物技术]8:404。

还可以通过将破坏性核酸构建体插入该基因中而构建包含基因破坏的发酵生物,该破坏性核酸构建体包含与该基因同源的核酸片段,该片段将产生具有同源性的区域的重复并且在重复的区域之间掺入构建体dna。这样的一种基因破坏可以消除基因表达,如果插入的构建体将该基因的启动子与编码区分离或打断编码序列,这样使得产生无功能性基因产物。破坏构建体可以简单地是伴有与该基因同源的5’和3’区的选择性标记基因。该选择性标记使得可以鉴定含有破坏的基因的转化株。

还可以通过基因转化过程构建包含基因破坏的发酵生物(参见,例如iglesias和trautner,1983,moleculargeneralgenetics[分子普通遗传学]189:73-76)。例如,在基因转化方法中,将对应于该基因的核苷酸序列体外诱变,以产生缺陷核苷酸序列,然后将其转化进重组菌株中以产生缺陷基因。通过同源重组,该缺陷核苷酸序列替换该内源基因。该缺陷核苷酸序列还包含用于选择含有缺陷基因的转化株的标记可以是令人希望的。

可以使用本领域熟知的方法(包括但不限于化学诱变),通过随机或特异诱变进一步构建包含基因破坏的发酵生物(参见,例如hopwood,theisolationofmutantsinmethodsinmicrobiology[微生物学方法中的突变体分离](j.r.norris和d.w.ribbons,编辑)第363-433页,academicpress[学术出版社],纽约,1970)。可以通过使亲本菌株经受诱变并筛选其中该基因的表达已经被减少或失活的突变菌株来修饰该基因。诱变可以是特异的或随机的,例如通过使用适合的物理或化学诱变剂、使用适合的寡核苷酸或使dna序列经受pcr产生的诱变来进行。此外,诱变可以通过使用这些诱变方法的任何组合来进行。

适合本发明目的的物理或化学诱变剂的实例包括紫外线(uv)照射,羟胺,n-甲基-n'-硝基-n-亚硝基胍(mnng),n-甲基-n'-亚硝基胍(ntg)邻甲基羟胺,亚硝酸,乙基甲磺酸(ems),亚硫酸氢钠,甲酸和核苷酸类似物。当使用此类试剂时,诱变典型地是在适合条件下在所选的诱变剂的存在下通过孵育有待诱变的亲本菌株并选择展现出该基因的减少表达或无表达的突变体来进行的。

可以使用来自其他微生物来源的与本文所述的基因同源或互补的核苷酸序列来破坏所选的重组菌株中的对应基因。

在一实施例中,重组细胞中的基因修饰未用选择性标记加以标记。可以通过将突变体在反向选择培养基中进行培养来除去选择性标记基因。在该选择性标记基因含有侧翼于其5'和3'端的重复序列的情况下,当该突变体菌株经受反向选择时,这些重复序列将有助于该选择性标记基因通过同源重组而环出。还可以通过向该突变体菌株中引入核酸片段,该核酸片段包含缺陷基因的5'和3'区但是缺乏该选择性标记基因,随后在反向选择培养基上进行选择,通过同源重组来除去该选择性标记基因。通过同源重组,含有该选择性标记基因的缺陷基因被缺乏该选择性标记基因的核酸片段替换。还可以使用本领域已知的其他方法。

调节物

在一些实施例中,发酵生物(例如重组酵母细胞)包含增加或减少调节物如转运蛋白调节物表达的遗传修饰。调节物可以是适合于提高发酵生物的氮利用的任何调节物,例如天然存在的调节物(例如,来自另一物种的天然调节物或由修饰的表达载体表达的内源调节物)或其变体。

在一些实施例中,遗传修饰是编码调节物的异源多核苷酸。

在一些实施例中,在相同条件下,与酿酒酵母菌株ethanol(在澳大利亚维多利亚州国家计量研究所以登录号v14/007039保藏)相比,发酵生物增加或减少调节物表达。在一些实施例中,在相同条件下,与酿酒酵母菌株ethanol(在澳大利亚维多利亚州国家计量研究所以登录号v14/007039保藏)相比,发酵生物增加表达至少5%,例如至少10%、至少15%、至少20%、至少25%、至少50%、至少100%、至少150%、至少200%、至少300%或至少500%。

可以用本文所述的发酵生物和使用方法表达的调节物的示例性调节物包括但不限于下表2中所示的调节物(或其衍生物)。

表2.调节物

编码适合的调节物的另外的多核苷酸可以衍生自任何适合属的微生物,包括在uniprotkb数据库(www.uniprot.org)内可容易获得的那些。

调节物可以是来自任何细菌或真菌物种的调节物,如上所述。

可以使用本文描述或参照的调节物编码序列或其子序列,以及本文描述或参照的调节物或其片段来设计核酸探针以如上所述来鉴定并克隆编码来自不同属或物种的菌株的调节物的dna。在一个实施例中,该核酸探针是编码seqidno:231-290中任一个的调节物或其片段的多核苷酸或其子序列。

在一个实施例中,该调节物由多核苷酸编码,该多核苷酸在至少低严格条件下,例如中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与本文描述或参照的调节物中任一种的编码序列(例如,seqidno:171-230)的全长互补链杂交。(sambrook等人,1989,molecularcloning,alaboratorymanual[分子克隆:实验室手册],第2版coldspringharbor,newyork[冷泉港,纽约])。

也可以如上所述从其他来源,包括从自然界(例如,土壤、堆肥、水、青贮等)分离的微生物或直接从天然材料(例如,土壤、堆肥、水、青贮等)获得的dna样品鉴定并获得该调节物。

一旦用如本文所述的适合探针检测到编码调节物的多核苷酸,就可以通过使用本领域普通技术人员已知的技术来分离或克隆该序列,如上所述。

在一个实施例中,调节物是一种调节表1中转运蛋白中任一种的多肽。

在一个实施例中,该调节物包括seqidno:231-290中任一个的氨基酸序列或由其组成。在另一个实施例中,转运蛋白是seqidno:231-290中任一个的调节物的片段。在一个实施例中,片段中的氨基酸残基数目是参照全长调节物(例如,seqidno:231-290中任一个)中氨基酸残基数目的至少75%,例如至少80%、85%、90%或95%。

该调节物可以是上述调节物中任一种(例如,seqidno:231-290中任一个)的变体。在一个实施例中,该调节物与上述调节物中任一种(例如,seqidno:231-290中任一个)具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性。

在一个实施例中,该调节物与上述调节物中任一种(例如,seqidno:231-290中任一个)的氨基酸序列相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸、或相差一个氨基酸。在一个实施例中,该调节物具有上述调节物中任一种(例如,seqidno:231-290中任一个)的氨基酸序列的一个或多个(例如,两个,若干个)的氨基酸取代、缺失和/或插入。在一些实施例中,氨基酸取代、缺失和/或插入的总数不超过10,例如不超过9、8、7、6、5、4、3、2或1。

在另一个实施例中,编码调节物的异源多核苷酸包含如下编码序列,该编码序列与上述调节物中任一种的编码序列(例如,seqidno:171-230中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

在一个实施例中,编码调节物的异源多核苷酸包含上述调节物中任一种的编码序列(例如,seqidno:171-230中任一个)或由其组成。在另一个实施例中,编码调节物的异源多核苷酸包含上述调节物中任一种的编码序列(例如,seqidno:171-230中任一个)的子序列。在另一个实施例中,该编码子序列中的核苷酸残基的数目是参照编码序列的数目的至少75%,例如至少80%、85%、90%或95%。

本文所述的任何相关方面或实施例的参照编码序列可以是天然编码序列或简并序列,例如设计用于特定宿主细胞的密码子优化的(例如,针对在酿酒酵母中表达而优化的)编码序列。

该调节物可以是一种融合多肽或可切割的融合多肽,如上所述。1993,emboj.12:2575-2583;dawson等人,1994,science[科学]266:776-779)。

在一些实施例中,发酵生物(例如,重组酵母细胞)包含对内源调节基因(例如,表2中所示的调节基因中任一个,例如seqidno:171-230中任一个)的破坏。在一些实施例中,破坏的内源调节基因是失活的。在另一个实施例中,内源基因的编码序列与上述调节物中任一种的编码序列(例如,seqidno:171-230中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在另一个实施例中,内源基因编码调节物,该调节物与上述调节物中任一种(例如,seqidno:231-290中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。基因破坏的方法如上所述。

额外的基因破坏

本文所述的发酵生物还可以包含一个或多个(例如,两个、若干个)基因破坏,例如以将糖代谢从不希望的产物转移至乙醇。在一些方面,当在相同条件下培养时,与没有这一个或多个破坏的细胞相比,重组宿主细胞产生更大量的乙醇。在一些方面,使被破坏的内源基因中的一个或多个失活。

在某些实施例中,本文提供的重组细胞包含一个或多个内源基因的破坏,这一个或多个内源基因编码在生产替代发酵产物(例如甘油)或其他副产物(例如乙酸或二醇)中涉及的酶。例如,本文提供的细胞可以包含以下一个或多个中的破坏:甘油3-磷酸脱氢酶(gpd,催化二羟丙酮磷酸反应为甘油3-磷酸)、甘油3-磷酸酶(gpp,催化甘油-3磷酸转化为甘油)、甘油激酶(催化甘油3-磷酸转化为甘油)、二羟丙酮激酶(催化二羟丙酮磷酸转化为二羟丙酮)、甘油脱氢酶(催化二羟丙酮转化为甘油)、和醛脱氢酶(ald,例如,将乙醛转化为乙酸)。在例如wo2014/180820中讨论了对gpd1/gpd2和gpp1/gpp2的破坏(其序列通过引用并入本文)。在一些实施例中,本文提供的重组细胞包含对醛糖还原酶的破坏(催化木糖或木酮糖向木糖醇的转化;例如,gre3或ypr1;参见,traff等人,2001,appl.environ.microbiol.[应用与环境微生物学]67:5668-74)。

可以使用模型分析来设计另外的优化途径利用的基因破坏。用于鉴定并设计有利于生物合成希望的产物的代谢改变的一种示例性计算方法是optknock计算框架(optknockcomputationalframework),burgard等人,2003,biotechnol.bioeng.[生物技术与生物工程]84:647-657。

可以使用本领域熟知的方法(例如上述那些方法)构建包含基因破坏的发酵生物。

使用含淀粉材料的方法

在一些方面,本文所述的方法从含淀粉材料生产发酵产物。含淀粉材料在本领域中是熟知的,其含有两种类型的同聚多糖(直链淀粉和支链淀粉)并且通过α-(1-4)-d-糖苷键连接。可以使用任何适合的含淀粉起始材料。通常基于希望的发酵产物(如乙醇)来选择起始材料。含淀粉起始材料的实例包括谷类、块茎或谷物。具体地,该含淀粉材料可以是玉米、小麦、大麦、黑麦、买罗高粱、西米、木薯(cassava)、树薯(tapioca)、高粱、燕麦、水稻、豌豆、豆类、或甘薯、或其混合物。还考虑了糯型(waxytype)与非糯型(non-waxytype)的玉米与大麦。

在一个实施例中,该含淀粉起始材料是玉米。在一个实施例中,该含淀粉起始材料是小麦。在一个实施例中,该含淀粉起始材料是大麦。在一个实施例中,该含淀粉起始材料是黑麦。在一个实施例中,该含淀粉起始材料是买罗高粱。在一个实施例中,该含淀粉起始材料是西米。在一个实施例中,该含淀粉起始材料是木薯。在一个实施例中,该含淀粉起始材料是树薯。在一个实施例中,该含淀粉起始材料是高粱。在一个实施例中,该含淀粉起始材料是水稻。在一个实施例中,该含淀粉起始材料是豌豆。在一个实施例中,该含淀粉起始材料是豆类。在一个实施例中,该含淀粉起始材料是甘薯。在一个实施例中,该含淀粉起始材料是燕麦。

使用含淀粉材料的方法可以包括常规方法(例如,包括以下更详细描述的液化步骤)或粗淀粉水解方法。在使用含淀粉材料的一些实施例中,该含淀粉材料的糖化在高于初始糊化温度的温度下进行。在使用含淀粉材料的一些实施例中,该含淀粉材料的糖化在低于初始糊化温度的温度下进行。

液化

在使用含淀粉材料的方面,这些方法可以进一步包括液化步骤,该液化步骤是通过在高于初始糊化温度的温度下使含淀粉材料经受α-淀粉酶和任选地蛋白酶和/或葡糖淀粉酶来进行的。液化中还可以存在和/或添加其他酶,例如支链淀粉酶、内切葡聚糖酶、半纤维素酶(例如,木聚糖酶)、磷脂酶c和植酸酶。在一些实施例中,在所述方法的步骤a)和b)之前进行该液化步骤。

液化步骤可以进行0.5-5小时,如1-3小时,如典型地约2小时。

术语“起始糊化温度”意指含淀粉材料糊化开始的最低温度。通常,在水中加热的淀粉在约50℃与75℃之间开始糊化;糊化的准确温度依赖于具体的淀粉,并能够由本领域的技术人员容易地确定。因此,初始糊化温度可以根据植物物种、植物物种的具体品种、以及生长条件而变化。给定的含淀粉材料的初始糊化温度可以是使用gorinstein和lii,1992,[淀粉]44(12):461-466所述的方法,使5%的淀粉颗粒丧失双折射的温度所确定的。

液化典型地是在从70℃-100℃范围内的温度下进行的。在一个实施例中,液化中的温度是在75℃-95℃之间,如在75℃-90℃之间,在80℃-90℃之间,或在82℃-88℃之间,如约85℃。在一个实施例中,液化中的温度大于85℃,如约88℃、约89℃、约90℃、约91℃、约92℃、约93℃、约94℃或约95℃。

喷射蒸煮步骤可以在液化步骤之前进行,例如,在110℃-145℃、120℃-140℃、125℃-135℃之间、或约130℃的温度下进行约1-15分钟,进行约3-10分钟,或约5分钟。

液化期间的ph可以例如在4至7之间,如ph4.5-6.5,ph5.0-6.5,ph5.0-6.0,ph5.2-6.2,或约5.2、约5.4、约5.6或约5.8。

在一个实施例中,在液化之前,该方法进一步包括以下步骤:

i)优选地通过干磨来减小该含淀粉材料的粒度;

ii)形成包含该含淀粉材料和水的浆料。

该含淀粉起始材料(如全谷物)可(例如通过磨制)减少粒度以打开结构、增大表面积并且允许进一步加工。通常存在两种类型的方法:湿磨和干磨。在干式碾磨中,整个谷粒被碾磨并且使用。湿磨使胚芽与粗粉(淀粉颗粒和蛋白质)良好分离。湿磨常常应用于使用淀粉水解物产生例如糖浆的场合(location)。干磨和湿磨在淀粉加工领域中都是众所周知的。在一个实施例中,使该含淀粉材料经受干磨。在一个实施例中,将粒度减小至在0.05至3.0mm之间、例如0.1-0.5mm,或使得至少30%、至少50%、至少70%、或至少90%的含淀粉材料适合通过具有0.05至3.0mm筛网、例如0.1-0.5mm筛网的筛子。在另一个实施例中,至少50%,例如至少70%、至少80%、或至少90%的含淀粉材料适合通过具有#6筛网的筛子。

该水性浆料可以包含含淀粉材料的从10-55w/w-%干固体(ds),例如25-45w/w-%干固体(ds),或30-40w/w-%干固体(ds)。

最初,可以将α-淀粉酶,任选地蛋白酶和任选地葡糖淀粉酶添加到该水性浆料中来开始液化(稀化)。在一个实施例中,这些酶中仅有一部分(例如,约1/3)被添加到该水性浆料中,而这些酶中的剩余部分(例如,约2/3)在液化步骤过程中被添加。

液化中使用的α-淀粉酶的非穷尽性列表可以在下面的“α-淀粉酶”部分中找到。液化中使用的适合的蛋白酶的实例包括“蛋白酶”部分中描述的任何蛋白酶。液化中使用的适合的葡糖淀粉酶的实例包括在“液化中的葡糖淀粉酶”部分中找到的任何葡糖淀粉酶。

α-淀粉酶

α-淀粉酶可任选地与蛋白酶、植酸酶、内切酶、磷脂酶c、木聚糖酶、葡糖淀粉酶和/或支链淀粉酶一起存在于和/或添加到液化中,例如,如wo2012/088303(诺维信公司)或wo2013/082486(诺维信公司)中所披露,将参考文献都通过引用并入。

在一些实施例中,该发酵生物包含编码α-淀粉酶的异源多核苷酸,例如,如wo2017/087330中所披露,将其内容通过引用特此并入。考虑本文描述或参照的任何α-淀粉酶用于在发酵生物中表达。

该α-淀粉酶可以是适合宿主细胞和/或本文所述的方法的任何α-淀粉酶,如天然存在的α-淀粉酶或其保留α-淀粉酶活性的变体。

在一些实施例中,当在相同条件下培养时,与不具有编码α-淀粉酶的异源多核苷酸的宿主细胞相比,包含编码该α-淀粉酶的异源多核苷酸的发酵生物具有增加的α-淀粉酶活性水平。在一些实施例中,当在相同条件下培养时,与不具有编码α-淀粉酶的异源多核苷酸的发酵生物相比,该发酵生物具有增加至少5%,例如至少10%、至少15%、至少20%、至少25%、至少50%、至少100%、至少150%、至少200%、至少300%或至少500%的α-淀粉酶活性水平。

可以与本文所述的宿主细胞和/或方法一起使用的示例性α-淀粉酶包括细菌、酵母或丝状真菌α-淀粉酶,例如,衍生自本文描述或参照的任何微生物。

术语“细菌α-淀粉酶”意指在ec3.2.1.1项下分类的任何细菌α-淀粉酶。本文所用的细菌α-淀粉酶可例如衍生自芽孢杆菌属(有时也称作地芽孢杆菌属)的菌株。在一个实施例中,该芽孢杆菌属α-淀粉酶衍生自解淀粉芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌的菌株,但是也可以衍生自其他芽孢杆菌属菌种。

细菌α-淀粉酶的具体实例包括wo99/19467中的seqidno:3的嗜热脂肪芽孢杆菌α-淀粉酶(bsg),wo99/19467中的seqidno:5的解淀粉芽孢杆菌α-淀粉酶(ban),以及wo99/19467中的seqidno:4的地衣芽孢杆菌α-淀粉酶(bla)(所有序列都通过引用特此并入)。在一个实施例中,该α-淀粉酶可以是分别与wo99/19467中的seqidno:3、4或5所示的任何序列具有至少60%,例如至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一性程度的酶。

在一个实施例中,该α-淀粉酶可以是与wo99/19467中的seqidno:3所示的任何序列具有至少60%,例如至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性程度的酶。

在一个实施例中,该α-淀粉酶衍生自嗜热脂肪芽孢杆菌。该嗜热脂肪芽孢杆菌α-淀粉酶可为成熟野生型或其成熟变体。该成熟嗜热脂肪芽孢杆菌α-淀粉酶可为在重组产生过程中天然地截短的。例如,该嗜热脂肪芽孢杆菌α-淀粉酶可以在c-末端处被截短,使得其为480-495个氨基酸长,如约491个氨基酸长,例如使得其缺乏功能性淀粉结合结构域(与wo99/19467中的seqidno:3相比)。

该芽孢杆菌α-淀粉酶还可为变体和/或杂合体。这样的变体的实例可见于以下任一者中:wo96/23873、wo96/23874、wo97/41213、wo99/19467、wo00/60059和wo02/10355(各自通过引用特此并入)。具体的α-淀粉酶变体在美国专利号6,093,562、6,187,576、6,297,038和7,713,723中披露(通过引用特此并入)并包括具有以下改变的嗜热脂肪芽孢杆菌α-淀粉酶(常常称作bsgα-淀粉酶)变体:在位置r179、g180、i181和/或g182处的一个或两个氨基酸的缺失,优选wo96/23873中披露的双缺失-参见例如第20页,第1-10行(通过引用特此并入),如与wo99/19467中披露的seqidno:3所示的嗜热脂肪芽孢杆菌α-淀粉酶的氨基酸序列相比对应于位置i181和g182的缺失,或使用wo99/19467(该参考文献通过引用特此并入)中的seqidno:3用于编号的氨基酸r179和g180的缺失。在一些实施例中,该芽孢杆菌α-淀粉酶(如嗜热脂肪芽孢杆菌α-淀粉酶)具有与在wo99/19467中披露的seqidno:3所示的野生型bsgα-淀粉酶氨基酸序列相比对应于位置181和182的缺失的双缺失,并且还任选地包含n193f取代(也表示为i181*+g182*+n193f)。该细菌α-淀粉酶还可以在对应于wo99/19467中的seqidno:4所示的地衣芽孢杆菌α-淀粉酶、或wo99/19467中的seqidno:3的嗜热脂肪芽孢杆菌α-淀粉酶的s242和/或e188p变体中的s239的位置处具有取代。

在一个实施例中,该变体是嗜热脂肪芽孢杆菌α-淀粉酶的s242a、e或q变体,例如s242q变体。

在一个实施例中,该变体是嗜热脂肪芽孢杆菌α-淀粉酶的位置e188变体,例如e188p变体。

在一个实施例中,该细菌α-淀粉酶可以是截短的芽孢杆菌属α-淀粉酶。在一个实施例中,截短是这样的,例如,以使得wo99/19467中的seqidno:3所示的嗜热脂肪芽孢杆菌α-淀粉酶是约491个氨基酸长,如从480至495个氨基酸长,或者使得其缺乏功能性淀粉结合结构域。

该细菌α-淀粉酶也可以是杂合细菌α-淀粉酶,例如包含地衣芽孢杆菌α-淀粉酶(wo99/19467的seqidno:4中所示)的445个c-末端氨基酸残基和衍生自解淀粉芽孢杆菌的α-淀粉酶(wo99/19467的seqidno:5中所示)的37个n-末端氨基酸残基的α-淀粉酶。在一个实施例中,该杂合体具有以下取代中的一个或多个,尤其是全部:g48a+t49i+g107a+h156y+a181t+n190f+i201f+a209v+q264s(使用wo99/19467的seqidno:4中的地衣芽孢杆菌编号方式)。在一些实施例中,这些变体具有以下突变(或在其他芽孢杆菌α-淀粉酶中的对应突变)中的一个或多个:h154y、a181t、n190f、a209v以及q264s和/或在位置176与179之间的两个残基的缺失,例如e178和g179的缺失(使用wo99/19467的seqidno:5进行位置编号)。

在一个实施例中,该细菌α-淀粉酶是嵌合α-淀粉酶的成熟部分,其披露于richardson等人(2002),thejournalofbiologicalchemistry[生化杂志],277卷,29期,7月19日发表,267501-26507页中,称作bd5088或其变体。此α-淀粉酶与wo2007/134207中的seqidno:2所示的相同。成熟酶序列在位置1处的起始“met”氨基酸之后开始。

该α-淀粉酶可以是热稳定α-淀粉酶,如热稳定细菌α-淀粉酶,例如来自嗜热脂肪芽孢杆菌。在一个实施例中,如wo2018/098381的实例1中所述确定的,在本文所述的方法中使用的α-淀粉酶在ph4.5、85℃、0.12mmcacl2下具有至少10的t1/2(min)。在一个实施例中,该热稳定α-淀粉酶在ph4.5、85℃、0.12mmcacl2下具有至少15的t1/2(min)。在一个实施例中,该热稳定α-淀粉酶在ph4.5、85℃、0.12mmcacl2下具有至少20的t1/2(min)。在一个实施例中,该热稳定α-淀粉酶在ph4.5、85℃、0.12mmcacl2下具有至少25的t1/2(min)。在一个实施例中,该热稳定α-淀粉酶在ph4.5、85℃、0.12mmcacl2下具有至少30的t1/2(min)。在一个实施例中,该热稳定α-淀粉酶在ph4.5、85℃、0.12mmcacl2下具有至少40的t1/2(min)。

在一个实施例中,该热稳定α-淀粉酶在ph4.5、85℃、0.12mmcacl2下具有至少50的t1/2(min)。在一个实施例中,该热稳定α-淀粉酶在ph4.5、85℃、0.12mmcacl2下具有至少60的t1/2(min)。在一个实施例中,该热稳定α-淀粉酶在ph4.5、85℃、0.12mmcacl2下具有在10-70之间的t1/2(min)。在一个实施例中,该热稳定α-淀粉酶在ph4.5、85℃、0.12mmcacl2下具有在15-70之间的t1/2(min)。在一个实施例中,该热稳定α-淀粉酶在ph4.5、85℃、0.12mmcacl2下具有在20-70之间的t1/2(min)。在一个实施例中,该热稳定α-淀粉酶在ph4.5、85℃、0.12mmcacl2下具有在25-70之间的t1/2(min)。在一个实施例中,该热稳定α-淀粉酶在ph4.5、85℃、0.12mmcacl2下具有在30-70之间的t1/2(min)。在一个实施例中,该热稳定α-淀粉酶在ph4.5、85℃、0.12mmcacl2下具有在40-70之间的t1/2(min)。在一个实施例中,该热稳定α-淀粉酶在ph4.5、85℃、0.12mmcacl2下具有在50-70之间的t1/2(min)。在一个实施例中,该热稳定α-淀粉酶在ph4.5、85℃、0.12mmcacl2下具有在60-70之间的t1/2(min)。

在一个实施例中,该α-淀粉酶是细菌α-淀粉酶,例如衍生自芽孢杆菌属,如嗜热脂肪芽孢杆菌的菌株,例如,如在wo99/019467中披露为seqidno:3的嗜热脂肪芽孢杆菌,其中在位置r179、g180、i181和/或g182处具有一个或两个氨基酸缺失,特别是r179和g180缺失、或具有i181和g182缺失,具有如下突变列表中的突变。

在一些实施例中,该嗜热脂肪芽孢杆菌α-淀粉酶具有双缺失i181+g182,以及任选的取代n193f,进一步包含以下取代或取代的组合中的一个:

v59a+q89r+g112d+e129v+k177l+r179e+k220p+n224l+q254s;

v59a+q89r+e129v+k177l+r179e+h208y+k220p+n224l+q254s;

v59a+q89r+e129v+k177l+r179e+k220p+n224l+q254s+d269e+d281n;

v59a+q89r+e129v+k177l+r179e+k220p+n224l+q254s+i270l;

v59a+q89r+e129v+k177l+r179e+k220p+n224l+q254s+h274k;

v59a+q89r+e129v+k177l+r179e+k220p+n224l+q254s+y276f;

v59a+e129v+r157y+k177l+r179e+k220p+n224l+s242q+q254s;

v59a+e129v+k177l+r179e+h208y+k220p+n224l+s242q+q254s;

v59a+e129v+k177l+r179e+k220p+n224l+s242q+q254s;

v59a+e129v+k177l+r179e+k220p+n224l+s242q+q254s+h274k;

v59a+e129v+k177l+r179e+k220p+n224l+s242q+q254s+y276f;

v59a+e129v+k177l+r179e+k220p+n224l+s242q+q254s+d281n;

v59a+e129v+k177l+r179e+k220p+n224l+s242q+q254s+m284t;

v59a+e129v+k177l+r179e+k220p+n224l+s242q+q254s+g416v;

v59a+e129v+k177l+r179e+k220p+n224l+q254s;

v59a+e129v+k177l+r179e+k220p+n224l+q254s+m284t;

a91l+m96i+e129v+k177l+r179e+k220p+n224l+s242q+q254s;

e129v+k177l+r179e;

e129v+k177l+r179e+k220p+n224l+s242q+q254s;

e129v+k177l+r179e+k220p+n224l+s242q+q254s+y276f+l427m;

e129v+k177l+r179e+k220p+n224l+s242q+q254s+m284t;

e129v+k177l+r179e+k220p+n224l+s242q+q254s+n376*+i377*;

e129v+k177l+r179e+k220p+n224l+q254s;

e129v+k177l+r179e+k220p+n224l+q254s+m284t;

e129v+k177l+r179e+s242q;

e129v+k177l+r179v+k220p+n224l+s242q+q254s;

k220p+n224l+s242q+q254s;

m284v;

v59a+q89r+e129v+k177l+r179e+q254s+m284v;和

v59a+e129v+k177l+r179e+q254s+m284v;

在一个实施例中,该α-淀粉酶选自下组:嗜热脂肪芽孢杆菌α-淀粉酶变体,其具有双缺失i181*+g182*,以及任选的取代n193f,并且进一步具有以下取代或取代的组合中的一个:

e129v+k177l+r179e;

v59a+q89r+e129v+k177l+r179e+h208y+k220p+n224l+q254s;

v59a+q89r+e129v+k177l+r179e+q254s+m284v;

v59a+e129v+k177l+r179e+q254s+m284v;和

e129v+k177l+r179e+k220p+n224l+s242q+q254s(使用本文的seqidno:1进行编号)。

应理解的是,当提及嗜热脂肪芽孢杆菌α-淀粉酶及其变体时,它们通常以截短的形式产生。具体地,截短可以是这样的,以使得wo99/19467中的seqidno:3所示的嗜热脂肪芽孢杆菌α-淀粉酶或其变体在c-末端处截短并且典型地是约从480-495个氨基酸长,如约491个氨基酸长,例如使得其缺乏功能性淀粉结合结构域。

在一个实施例中,该α-淀粉酶变体可以是与wo99/19467中的seqidno:3所示的序列具有至少60%,例如至少70%、至少80%、至少90%、至少95%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%,但小于100%同一性程度的酶。

在一个实施例中,将该细菌α-淀粉酶,例如芽孢杆菌属α-淀粉酶,如尤其是嗜热脂肪芽孢杆菌α-淀粉酶或其变体,以在0.01-10knu-a/gds之间的浓度给出到液化中,例如,在0.02和5knu-a/gds之间,如0.03和3knu-a,优选地0.04和2knu-a/gds,如尤其是0.01和2knu-a/gds。在一个实施例中,将该细菌α-淀粉酶,例如芽孢杆菌属α-淀粉酶,如尤其是嗜热脂肪芽孢杆菌α-淀粉酶或其变体,以在0.0001-1mgep(酶蛋白)/gds之间的浓度给出到液化中,例如0.0005-0.5mgep/gds,如0.001-0.1mgep/gds。

在一个实施例中,该细菌α-淀粉酶衍生自枯草芽孢杆菌α-淀粉酶(wo2018/222990的seqidno:76、83或84)、枯草芽孢杆菌α-淀粉酶(wo2018/222990的seqidno:82)、地衣芽孢杆菌α-淀粉酶(wo2018/222990的seqidno:85)、植物发酵梭菌α-淀粉酶(wo2018/222990的seqidno:89-94)、热纤梭菌α-淀粉酶(wo2018/222990的seqidno:95)、褐色嗜热裂孢菌α-淀粉酶(wo2018/222990的seqidno:96或97)、褐色嗜热裂孢菌α-淀粉酶(wo2018/222990的seqidno:97)、嗜热厌气菌(wo2018/222990的seqidno:98、99或100)或除虫链霉菌α淀粉酶(wo2018/222990的seqidno:88或101)。

在一个实施例中,该α-淀粉酶衍生自酵母α-淀粉酶,例如扣囊复膜酵母α-淀粉酶(wo2018/222990的seqidno:77)、西方德巴利酵母α-淀粉酶(wo2018/222990的seqidno:78或79)或桔林油脂酵母α-淀粉酶(wo2018/222990的seqidno:80或81)。

在一个实施例中,该α-淀粉酶衍生自丝状真菌α-淀粉酶,例如黑曲霉α-淀粉酶(wo2018/222990的seqidno:86或87)。

考虑与本发明一起使用的另外的α-淀粉酶可以在wo2011/153516(将其内容并入本文)中找到。

编码适合的α-淀粉酶的另外的多核苷酸可以获得自任何属的微生物,包括在uniprotkb数据库(www.uniprot.org)内可容易获得的那些。

α-淀粉酶编码序列也可用于设计核酸探针以鉴定和克隆编码来自不同属或种的菌株的α-淀粉酶的dna,如上文所述的。

还可以从其他来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等)获得的dna样品鉴定和获得编码α-淀粉酶的多核苷酸,如上文所述的。

用于分离或克隆编码α-淀粉酶的多核苷酸的技术在上文中描述。

在一个实施例中,该α-淀粉酶与本文描述或参照的任何α-淀粉酶(例如,wo2018/222990的seqidno:79所示的西方德巴利酵母α-淀粉酶)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一方面,该α-淀粉酶序列与本文描述或参照的任何α-淀粉酶(例如,wo2018/222990的seqidno:79所示的西方德巴利酵母α-淀粉酶)相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸、或相差一个氨基酸。在一个实施例中,该α-淀粉酶包含以下或由其组成:本文描述或参照的任何α-淀粉酶(例如,wo2018/222990的seqidno:79所示的西方德巴利酵母α-淀粉酶)的氨基酸序列、等位基因变体、或其具有α-淀粉酶活性的片段。在一个实施例中,该α-淀粉酶具有一个或多个(例如,两个、若干个)氨基酸的氨基酸取代、缺失和/或插入。在一些实施例中,氨基酸取代、缺失和/或插入的总数不超过10,例如不超过9、8、7、6、5、4、3、2或1。

在一些实施例中,该α-淀粉酶在相同条件下具有本文描述或参照的任何α-淀粉酶(例如,wo2018/222990的seqidno:79所示的西方德巴利酵母α-淀粉酶)的α-淀粉酶活性的至少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%。

在一个实施例中,该α-淀粉酶编码序列在至少低严格条件下,例如中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与来自本文描述或参照的任何α-淀粉酶(例如,wo2018/222990的seqidno:79所示的西方德巴利酵母α-淀粉酶)的编码序列的全长互补链杂交。在一个实施例中,该α-淀粉酶编码序列与来自本文描述或参照的任何α-淀粉酶(例如,wo2018/222990的seqidno:79所示的西方德巴利酵母α-淀粉酶)的编码序列具有至少65%,例如至少70%、至少75%、至少80%、至少85%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

在一个实施例中,编码该α-淀粉酶的多核苷酸包含本文描述或参照的任何α-淀粉酶(例如,wo2018/222990的seqidno:79所示的西方德巴利酵母α-淀粉酶)的编码序列。在一个实施例中,编码该α-淀粉酶的多核苷酸包含来自本文描述或参照的任何α-淀粉酶的编码序列的子序列,其中该子序列编码具有α-淀粉酶活性的多肽。在一个实施例中,子序列中的核苷酸残基的数目是参照编码序列的数目的至少75%,例如至少80%、85%、90%或95%。

该α-淀粉酶还可以包括融合多肽或可切割的融合多肽,如上文所述的。

蛋白酶

在本文所述的方法中,蛋白酶可以任选地与α-淀粉酶和任选的葡糖淀粉酶、磷脂酶c、木聚糖酶、内切葡聚糖酶、植酸酶和/或支链淀粉酶一起存在和/或添加于浆液和/或液化中。

蛋白酶根据其催化机制分为以下几组:丝氨酸蛋白酶(s)、半胱氨酸蛋白酶(c)、天冬氨酸蛋白酶(a)、金属蛋白酶(m)以及未知或还未分类的蛋白酶(u),参见handbookofproteolyticenzymes[蛋白水解酶手册],a.j.barrett,n.d.rawlings,j.f.woessner(编辑),academicpress[学术出版社](1998),特别是概述部分。

在一些实施例中,该发酵生物包含编码蛋白酶的异源多核苷酸,例如,如wo2018/222990中所披露,将其内容通过引用特此并入。考虑本文描述或参照的任何蛋白酶用于在发酵生物中表达。

该蛋白酶可以是适合宿主细胞和/或本文所述的方法的任何蛋白酶,如天然存在的蛋白酶或其保留蛋白酶活性的变体。

在一些实施例中,当在相同条件下培养时,与不具有编码蛋白酶的异源多核苷酸的宿主细胞相比,包含编码该蛋白酶的异源多核苷酸的发酵生物具有增加的蛋白酶活性水平。在一些实施例中,当在相同条件下培养时,与不具有编码蛋白酶的异源多核苷酸的发酵生物相比,该发酵生物具有增加至少5%,例如至少10%、至少15%、至少20%、至少25%、至少50%、至少100%、至少150%、至少200%、至少300%或至少500%的蛋白酶活性水平。

可以与本文所述的宿主细胞和/或方法一起使用的示例性蛋白酶包括细菌、酵母或丝状真菌蛋白酶,例如,衍生自本文描述或参照的任何微生物。

在一个实施例中,根据本文描述的方法使用的热稳定蛋白酶是“金属蛋白酶”,其定义为属于ec3.4.24的蛋白酶(金属内肽酶);优选为ec3.4.24.39(酸性金属蛋白酶)。

为了确定给定的蛋白酶是否是金属蛋白酶,参照上述“handbookofproteolyticenzymes[蛋白水解酶手册]”以及其中指示的原则。可以对所有类型的蛋白酶进行这样的确定,而不论其是天然存在的或野生型蛋白酶;还是基因工程化的或合成的蛋白酶。

可以使用任何适合的测定来测量蛋白酶活性,其中采用一种底物,所述底物包括与所讨论的蛋白酶的特异性相关的肽键。测定ph值和测定温度同样适用于所讨论的蛋白酶。测定ph值的实例是ph6、7、8、9、10或11。测定温度的实例是30℃、35℃、37℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃或80℃。

蛋白酶底物的实例为酪蛋白,例如azurine-crosslinkedcasein(天青精-交联的酪蛋白,azcl-酪蛋白)。

在一个实施例中,该热稳定性蛋白酶具有蛋白酶196变体或蛋白酶pfu的蛋白酶活性的至少20%,例如至少30%,例如至少40%,例如至少50%,例如至少60%,例如至少70%,例如至少80%,例如至少90%,例如至少95%,例如至少100%。

对于在文中所述的方法中使用的蛋白酶的来源没有限制,只要其满足下文定义的热稳定性特性。

在一个实施例中,该蛋白酶是真菌来源的。

蛋白酶可以是例如野生型蛋白酶的变体,只要所述蛋白酶具有本文定义的热稳定性特性。在一个实施例中,所述热稳定的蛋白酶是如上定义的金属蛋白酶的变体。在一个实施例中,在本文所述的方法中使用的热稳定蛋白酶是真菌来源的,如真菌金属蛋白酶,如衍生自嗜热子囊菌属的菌株,优选橙色嗜热子囊菌的菌株,尤其是橙色嗜热子囊菌cgmccno.0670(分类为ec3.4.24.39)的真菌金属蛋白酶。

在一个实施例中,该热稳定蛋白酶是披露于以下的变体:wo2003/048353中披露的seqidno:2所示的金属蛋白酶的成熟部分或wo2010/008841中的seqidno:1(文中seqidno:292)的成熟部分,该变体进一步具有以下取代或取代的组合中的一个:

s5*+d79l+s87p+a112p+d142l;

d79l+s87p+a112p+t124v+d142l;

s5*+n26r+d79l+s87p+a112p+d142l;

n26r+t46r+d79l+s87p+a112p+d142l;

t46r+d79l+s87p+t116v+d142l;

d79l+p81r+s87p+a112p+d142l;

a27k+d79l+s87p+a112p+t124v+d142l;

d79l+y82f+s87p+a112p+t124v+d142l;

d79l+y82f+s87p+a112p+t124v+d142l;

d79l+s87p+a112p+t124v+a126v+d142l;

d79l+s87p+a112p+d142l;

d79l+y82f+s87p+a112p+d142l;

s38t+d79l+s87p+a112p+a126v+d142l;

d79l+y82f+s87p+a112p+a126v+d142l;

a27k+d79l+s87p+a112p+a126v+d142l;

d79l+s87p+n98c+a112p+g135c+d142l;

d79l+s87p+a112p+d142l+t141c+m161c;

s36p+d79l+s87p+a112p+d142l;

a37p+d79l+s87p+a112p+d142l;

s49p+d79l+s87p+a112p+d142l;

s50p+d79l+s87p+a112p+d142l;

d79l+s87p+d104p+a112p+d142l;

d79l+y82f+s87g+a112p+d142l;

s70v+d79l+y82f+s87g+y97w+a112p+d142l;

d79l+y82f+s87g+y97w+d104p+a112p+d142l;

s70v+d79l+y82f+s87g+a112p+d142l;

d79l+y82f+s87g+d104p+a112p+d142l;

d79l+y82f+s87g+a112p+a126v+d142l;

y82f+s87g+s70v+d79l+d104p+a112p+d142l;

y82f+s87g+d79l+d104p+a112p+a126v+d142l;

a27k+d79l+y82f+s87g+d104p+a112p+a126v+d142l;

a27k+y82f+s87g+d104p+a112p+a126v+d142l;

a27k+d79l+y82f+d104p+a112p+a126v+d142l;

a27k+y82f+d104p+a112p+a126v+d142l;

a27k+d79l+s87p+a112p+d142l;和

d79l+s87p+d142l。

在一个实施例中,该热稳定蛋白酶是披露为以下的金属蛋白酶的变体:wo2003/048353中披露的seqidno:2的成熟部分或wo2010/008841中seqidno:1(文中seqidno:292)的成熟部分,该变体具有以下取代或取代的组合中的一个:

d79l+s87p+a112p+d142l;

d79l+s87p+d142l;和

a27k+d79l+y82f+s87g+d104p+a112p+a126v+d142l。

在一个实施例中,蛋白酶变体与披露于wo2003/048353中的seqidno:2的多肽的成熟部分或披露于wo2010/008841中的seqidno:1(本文的seqidno:292)的成熟部分具有至少75%的同一性,优选至少80%,更优选至少85%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%,例如甚至至少96%、至少97%、至少98%、至少99%但小于100%的同一性。

该热稳定蛋白酶还可以衍生自任何细菌,只要该蛋白酶具有热稳定性特性。

在一个实施例中,热稳定蛋白酶衍生自火球菌菌株,例如激烈火球菌菌株(pfu蛋白酶),例如seqidno:291的激烈火球菌蛋白酶或与其具有至少80%同一性,例如至少85%、例如至少90%、例如至少95%、例如至少96%、例如至少97%、例如至少98%、例如至少99%同一性的其变体。

在一个实施例中,该蛋白酶是如美国专利号6,358,726-b1(宝酒造公司(takarashuzocompany))的seqidno:1所示的一种。

在一个实施例中,该热稳定蛋白酶是如下蛋白酶,该蛋白酶与美国专利号6,358,726-b1中的seqidno:1具有至少80%同一性、如至少85%、如至少90%、如至少95%、如至少96%、如至少97%、如至少98%、如至少99%同一性。激烈火球菌蛋白酶可以购买自日本宝酒造生物公司(takarabio,japan)。

激烈火球菌蛋白酶是一种热稳定蛋白酶。发现商用产品激烈火球菌蛋白酶(pfus)在ph4.5下具有110%(80℃/70℃)和103%(90℃/70℃)的热稳定性。

在一个实施例中,在文中所述方法中使用的热稳定蛋白酶具有确定为在80℃/70℃下的相对活性的、超过20%的热稳定性值。

在一个实施例中,该蛋白酶具有确定为在80℃/70℃下的相对活性的,超过30%、超过40%、超过50%、超过60%、超过70%、超过80%、超过90%、超过100%,如超过105%,如超过110%如超过115%,如超过120%的热稳定性。

在一个实施例中,蛋白酶具有确定为在80℃/70℃下的相对活性的,在20%与50%之间,如在20%与40%之间,如20%与30%的热稳定性。在一个实施例中,该蛋白酶具有确定为在80℃/70℃下的相对活性的,在50%与115%之间,如在50%与70%之间,如在50%与60%之间,如在100%与120%之间,如在105%与115%之间的热稳定性。

在一个实施例中,该蛋白酶具有确定为在85℃/70℃下的相对活性的、超过10%的热稳定性值。

在一个实施例中,该蛋白酶具有确定为在85℃/70℃下的相对活性的,超过10%,如超过12%、超过14%、超过16%、超过18%、超过20%、超过30%、超过40%、超过50%、超过60%、超过70%、超过80%、超过90%、超过100%、超过110%的热稳定性。

在一个实施例中,该蛋白酶具有确定为在85℃/70℃下的相对活性的,在10%与50%之间,如在10%与30%之间,如在10%与25%之间的热稳定性。

在一个实施例中,该蛋白酶具有超过20%、超过30%、超过40%、超过50%、超过60%、超过70%、超过80%、超过90%的测定为在80℃下的残余活性;和/或该蛋白酶具有超过20%、超过30%、超过40%、超过50%、超过60%、超过70%、超过80%、超过90%的测定为在84℃下的残余活性。

“相对活性”以及“残余活性”的测定是如本领域(例如,wo2018/098381)所描述的进行的。

在一个实施例中,蛋白酶在85℃下可以具有高于90,例如高于100的热稳定性,如使用zein-bca测定法确定的。

在一个实施例中,蛋白酶在85℃下具有高于60%,例如高于90%,例如高于100%,例如高于110%的热稳定性,如使用zein-bca测定法确定的。

在一个实施例中,蛋白酶在85℃下具有在60-120之间,例如在70%-120%之间,例如在80%-120%之间,例如在90%-120%之间,例如在100%-120%之间,例如110%-120%的热稳定性,如使用zein-bca测定法确定的。

在一个实施例中,通过azcl-酪蛋白测定法确定的,该热稳定性蛋白酶具有jtp196蛋白酶变体或蛋白酶pfu的至少20%,例如至少30%,例如至少40%,例如至少50%,例如至少60%,例如至少70%,例如至少80%,例如至少90%,例如至少95%,例如至少100%的活性。

考虑与本发明一起使用的另外的蛋白酶可以在wo2018/222990(将其内容并入本文)中找到。

编码适合的蛋白酶的另外的多核苷酸可以获得自任何属的微生物,包括在uniprotkb数据库(www.uniprot.org)内可容易获得的那些。

蛋白酶编码序列也可用于设计核酸探针以鉴定和克隆编码来自不同属或种的菌株的蛋白酶的dna,如上文所述的。

还可以从其他来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等)获得的dna样品鉴定和获得编码蛋白酶的多核苷酸,如上文所述的。

用于分离或克隆编码蛋白酶的多核苷酸的技术在上文中描述。

该蛋白酶还可以包括融合多肽或可切割的融合多肽,如上文所述的。

在一个实施例中,热稳定蛋白酶是丝氨酸蛋白酶,例如s8蛋白酶,例如2018年10月3日提交的pct/us2018/054212中披露的一种,其通过引用整体并入本文。

在一个实施例中,s8蛋白酶衍生自古球菌属,例如嗜铁古球菌,例如seqidno:293的嗜铁古球菌s8蛋白酶,或与seqidno:293的氨基酸序列具有至少60%同一性、优选地至少65%同一性、优选地至少70%同一性、至少75%同一性、优选地至少80%、更优选地至少85%、更优选地至少90%、更优选地至少91%、更优选地至少92%、甚至更优选地至少93%、最优选地至少94%、以及甚至最优选地至少95%、例如甚至至少96%、至少97%、至少98%或至少99%但小于100%同一性的其变体。

在一个实施例中,s8蛋白酶衍生自热球菌属,例如海栖热球菌或嗜硫耐热球菌,例如seqidno:294的海栖热球菌s8蛋白酶,或与seqidno:294的氨基酸序列具有至少60%同一性、优选地至少65%同一性、优选地至少70%同一性、至少75%同一性、优选地至少80%、更优选地至少85%、更优选地至少90%、更优选地至少91%、更优选地至少92%、甚至更优选地至少93%、最优选地至少94%、以及甚至最优选地至少95%、例如甚至至少96%、至少97%、至少98%或至少99%但小于100%同一性的其变体,或seqidno:295的嗜硫耐热球菌s8蛋白酶,或与seqidno:295的氨基酸序列具有至少60%同一性、优选地至少65%同一性、优选地至少70%同一性、至少75%同一性、优选地至少80%、更优选地至少85%、更优选地至少90%、更优选地至少91%、更优选地至少92%、甚至更优选地至少93%、最优选地至少94%、以及甚至最优选地至少95%、例如甚至至少96%、至少97%、至少98%或至少99%但小于100%同一性的其变体。

液化中的葡糖淀粉酶

在任选的喷射蒸煮和/或液化之前,可在液化步骤和/或浆液中任选地存在和/或添加葡糖淀粉酶。在一个实施例中,将葡糖淀粉酶与α-淀粉酶和/或任选的蛋白酶、内切葡聚糖酶、磷脂酶c、木聚糖酶、植酸酶和/或支链淀粉酶一起或单独添加。

在一些实施例中,该发酵生物包含编码葡糖淀粉酶的异源多核苷酸,例如,如wo2017/087330中所披露,将其内容通过引用特此并入。考虑本文描述或参照的任何葡糖淀粉酶用于在发酵生物中表达。

该葡糖淀粉酶可以是适合宿主细胞和/或本文所述的方法的任何葡糖淀粉酶,如天然存在的葡糖淀粉酶或其保留葡糖淀粉酶活性的变体。液化中的葡糖淀粉酶可以是本节中描述的任何葡糖淀粉酶和/或以下所述的“糖化和/或发酵中的葡糖淀粉酶”中描述的任何葡糖淀粉酶。

在一些实施例中,当在相同条件下培养时,与不具有编码葡糖淀粉酶的异源多核苷酸的宿主细胞相比,包含编码该葡糖淀粉酶的异源多核苷酸的发酵生物具有增加的葡糖淀粉酶活性水平。在一些实施例中,当在相同条件下培养时,与不具有编码葡糖淀粉酶的异源多核苷酸的发酵生物相比,该发酵生物具有增加至少5%,例如至少10%、至少15%、至少20%、至少25%、至少50%、至少100%、至少150%、至少200%、至少300%或至少500%的葡糖淀粉酶活性水平。

可以与本文所述的宿主细胞和/或方法一起使用的示例性葡糖淀粉酶包括细菌、酵母或丝状真菌葡糖淀粉酶,例如,获得自本文描述或参照的任何微生物,如上文所描述的。

在一个实施例中,该葡糖淀粉酶在85℃下具有至少20%、至少30%、或至少35%的相对活性热稳定性,如wo2018/098381的实例4(热稳定性)中描述的进行测定。

在一个实施例中,如wo2018/098381的实例4(ph最佳值)中所述确定的,该葡糖淀粉酶在ph5.0下具有至少90%,例如至少95%、至少97%、或100%的相对活性ph最佳值。

在一个实施例中,如wo2018/098381的实例4(ph稳定性)中所述确定的,该葡糖淀粉酶在ph5.0下具有至少80%、至少85%、至少90%的ph稳定性。

在一个实施例中,在液化中使用的葡糖淀粉酶,如草酸青霉菌葡糖淀粉酶变体,具有在ph4.0下如wo2018/098381的实例15中所描述的确定为dsctd的至少70℃,优选地至少75℃、如至少80℃、如至少81℃、如至少82℃、如至少83℃、如至少84℃、如至少85℃、如至少86℃、如至少87%、如至少88℃、如至少89℃、如至少90℃的热稳定性。在一个实施例中,该葡糖淀粉酶(如草酸青霉菌葡糖淀粉酶变体)具有在ph4.0下如wo2018/098381的实例15中所描述的确定为dsctd的在70℃和95℃之间范围内的(如在80℃和90℃之间)热稳定性。

在一个实施例中,液化中使用的葡糖淀粉酶(如草酸青霉菌葡糖淀粉酶变体)在ph4.8下具有确定为dsctd的至少70℃,优选地至少75℃、如至少80℃、如至少81℃、如至少82℃、如至少83℃、如至少84℃、如至少85℃、如至少86℃、如至少87%、如至少88℃、如至少89℃、如至少90℃、如至少91℃的热稳定性,如wo2018/098381的实例15中所述。在一个实施例中,该葡糖淀粉酶(如草酸青霉菌葡糖淀粉酶变体)在ph4.8下具有确定为dsctd的在70℃和95℃之间范围内(如在80℃和90℃之间)的热稳定性,如wo2018/098381的实例15中所述。

在一个实施例中,液化中使用的葡糖淀粉酶,如草酸青霉菌葡糖淀粉酶变体,具有如wo2018/098381的实例16中描述所确定的至少100%,如至少105%、如至少110%、如至少115%、如至少120%、如至少125%的残余活性。在一个实施例中,该葡糖淀粉酶(如草酸青霉菌葡糖淀粉酶变体)具有如wo2018/098381的实例16中所描述的确定为残余活性的在100%和130%之间范围内的热稳定性。

在一个实施例中,该葡糖淀粉酶(例如真菌来源的,如丝状真菌)是来自青霉属的菌株,例如草酸青霉菌的菌株,特别是在wo2011/127802(将其通过引用特此并入)中披露为seqidno:2的以及本文的seqidno:9或14中所示的草酸青霉菌葡糖淀粉酶。

在一个实施例中,该葡糖淀粉酶与wo2011/127802中的seqidno:2所示的成熟多肽具有至少80%,例如至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性。

在一个实施例中,该葡糖淀粉酶是wo2011/127802中披露为seqidno:2的以及本文的seqidno:9和14所示的草酸青霉菌葡糖淀粉酶的变体,具有k79v取代(使用本文的seqidno:14中所示的成熟序列进行编号)。如wo2013/036526(将其通过引用特此并入)中披露的,该k79v葡糖淀粉酶变体相对于亲本对蛋白酶降解具有降低的敏感度。

在一个实施例中,该葡糖淀粉酶衍生自草酸青霉菌。

在一个实施例中,该葡糖淀粉酶是wo2011/127802中披露为seqidno:2的草酸青霉菌葡糖淀粉酶的变体。在一个实施例中,该草酸青霉菌葡糖淀粉酶是wo2011/127802中作为seqidno:2披露的,在位置79处具有val(v)。

涵盖的草酸青霉菌葡糖淀粉酶变体披露于wo2013/053801(其通过引用由此并入)中。

在一个实施例中,这些变体对蛋白酶降解具有降低的敏感度。

在一个实施例中,这些变体与亲本相比具有改善的热稳定性。

在一个实施例中,该葡糖淀粉酶具有对应于pe001变体的k79v取代(使用wo2011/127802的seqidno:2进行编号),并且进一步包含以下改变之一或改变的组合:

t65a;q327f;e501v;y504t;y504*;t65a+q327f;t65a+e501v;t65a+y504t;t65a+y504*;q327f+e501v;q327f+y504t;q327f+y504*;e501v+y504t;e501v+y504*;t65a+q327f+e501v;t65a+q327f+y504t;t65a+e501v+y504t;q327f+e501v+y504t;t65a+q327f+y504*;t65a+e501v+y504*;q327f+e501v+y504*;t65a+q327f+e501v+y504t;t65a+q327f+e501v+y504*;e501v+y504t;t65a+k161s;t65a+q405t;t65a+q327w;t65a+q327f;t65a+q327y;p11f+t65a+q327f;r1k+d3w+k5q+g7v+n8s+t10k+p11s+t65a+q327f;p2n+p4s+p11f+t65a+q327f;p11f+d26c+k33c+t65a+q327f;p2n+p4s+p11f+t65a+q327w+e501v+y504t;r1e+d3n+p4g+g6r+g7a+n8a+t10d+p11d+t65a+q327f;p11f+t65a+q327w;p2n+p4s+p11f+t65a+q327f+e501v+y504t;p11f+t65a+q327w+e501v+y504t;t65a+q327f+e501v+y504t;t65a+s105p+q327w;t65a+s105p+q327f;t65a+q327w+s364p;t65a+q327f+s364p;t65a+s103n+q327f;p2n+p4s+p11f+k34y+t65a+q327f;p2n+p4s+p11f+t65a+q327f+d445n+v447s;p2n+p4s+p11f+t65a+i172v+q327f;p2n+p4s+p11f+t65a+q327f+n502*;p2n+p4s+p11f+t65a+q327f+n502t+p563s+k571e;p2n+p4s+p11f+r31s+k33v+t65a+q327f+n564d+k571s;p2n+p4s+p11f+t65a+q327f+s377t;p2n+p4s+p11f+t65a+v325t+q327w;p2n+p4s+p11f+t65a+q327f+d445n+v447s+e501v+y504t;p2n+p4s+p11f+t65a+i172v+q327f+e501v+y504t;p2n+p4s+p11f+t65a+q327f+s377t+e501v+y504t;p2n+p4s+p11f+d26n+k34y+t65a+q327f;p2n+p4s+p11f+t65a+q327f+i375a+e501v+y504t;p2n+p4s+p11f+t65a+k218a+k221d+q327f+e501v+y504t;p2n+p4s+p11f+t65a+s103n+q327f+e501v+y504t;p2n+p4s+t10d+t65a+q327f+e501v+y504t;p2n+p4s+f12y+t65a+q327f+e501v+y504t;k5a+p11f+t65a+q327f+e501v+y504t;p2n+p4s+t10e+e18n+t65a+q327f+e501v+y504t;p2n+t10e+e18n+t65a+q327f+e501v+y504t;p2n+p4s+p11f+t65a+q327f+e501v+y504t+t568n;p2n+p4s+p11f+t65a+q327f+e501v+y504t+k524t+g526a;p2n+p4s+p11f+k34y+t65a+q327f+d445n+v447s+e501v+y504t;p2n+p4s+p11f+r31s+k33v+t65a+q327f+d445n+v447s+e501v+y504t;p2n+p4s+p11f+d26n+k34y+t65a+q327f+e501v+y504t;p2n+p4s+p11f+t65a+f80*+q327f+e501v+y504t;p2n+p4s+p11f+t65a+k112s+q327f+e501v+y504t;p2n+p4s+p11f+t65a+q327f+e501v+y504t+t516p+k524t+g526a;p2n+p4s+p11f+t65a+q327f+e501v+n502t+y504*;p2n+p4s+p11f+t65a+q327f+e501v+y504t;p2n+p4s+p11f+t65a+s103n+q327f+e501v+y504t;k5a+p11f+t65a+q327f+e501v+y504t;p2n+p4s+p11f+t65a+q327f+e501v+y504t+t516p+k524t+g526a;p2n+p4s+p11f+t65a+v79a+q327f+e501v+y504t;p2n+p4s+p11f+t65a+v79g+q327f+e501v+y504t;p2n+p4s+p11f+t65a+v79i+q327f+e501v+y504t;p2n+p4s+p11f+t65a+v79l+q327f+e501v+y504t;p2n+p4s+p11f+t65a+v79s+q327f+e501v+y504t;p2n+p4s+p11f+t65a+l72v+q327f+e501v+y504t;s255n+q327f+e501v+y504t;p2n+p4s+p11f+t65a+e74n+v79k+q327f+e501v+y504t;p2n+p4s+p11f+t65a+g220n+q327f+e501v+y504t;p2n+p4s+p11f+t65a+y245n+q327f+e501v+y504t;p2n+p4s+p11f+t65a+q253n+q327f+e501v+y504t;p2n+p4s+p11f+t65a+d279n+q327f+e501v+y504t;p2n+p4s+p11f+t65a+q327f+s359n+e501v+y504t;p2n+p4s+p11f+t65a+q327f+d370n+e501v+y504t;p2n+p4s+p11f+t65a+q327f+v460s+e501v+y504t;p2n+p4s+p11f+t65a+q327f+v460t+p468t+e501v+y504t;p2n+p4s+p11f+t65a+q327f+t463n+e501v+y504t;p2n+p4s+p11f+t65a+q327f+s465n+e501v+y504t;和p2n+p4s+p11f+t65a+q327f+t477n+e501v+y504t。

在一个实施例中,该草酸青霉菌葡糖淀粉酶变体具有对应于pe001变体的k79v取代(使用wo2011/127802的seqidno:2进行编号),并且进一步包含以下取代或取代的组合中的一个:

p11f+t65a+q327f;

p2n+p4s+p11f+t65a+q327f;

p11f+d26c+k33c+t65a+q327f;

p2n+p4s+p11f+t65a+q327w+e501v+y504t;

p2n+p4s+p11f+t65a+q327f+e501v+y504t;和

p11f+t65a+q327w+e501v+y504t。

该葡糖淀粉酶能以从0.1-100微克ep/g,如0.5-50微克ep/g,如1-25微克ep/g,如2-12微克ep/gds的量添加。

编码适合的葡糖淀粉酶的另外的多核苷酸可以获得自任何属的微生物,包括在uniprotkb数据库(www.uniprot.org)内可容易获得的那些。

葡糖淀粉酶编码序列也可用于设计核酸探针以鉴定和克隆编码来自不同属或种的菌株的葡糖淀粉酶的dna,如上文所述的。

还可以从其他来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等)获得的dna样品鉴定和获得编码葡糖淀粉酶的多核苷酸,如上文所述的。

用于分离或克隆编码葡糖淀粉酶的多核苷酸的技术在上文中描述。

在一个实施例中,该葡糖淀粉酶与本文描述或参照的任何葡糖淀粉酶具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一方面,该葡糖淀粉酶序列与本文描述或参照的任何葡糖淀粉酶相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸、或相差一个氨基酸。在一个实施例中,该葡糖淀粉酶包含以下或由其组成:本文描述或参照的任何葡糖淀粉酶的氨基酸序列、等位基因变体、或其具有葡糖淀粉酶活性的片段。在一个实施例中,该葡糖淀粉酶具有一个或多个(例如,两个、若干个)氨基酸的氨基酸取代、缺失和/或插入。在一些实施例中,氨基酸取代、缺失和/或插入的总数不超过10,例如不超过9、8、7、6、5、4、3、2或1。

在一些实施例中,该葡糖淀粉酶在相同条件下具有本文描述或参照的任何葡糖淀粉酶的葡糖淀粉酶活性的至少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%。

在一个实施例中,该葡糖淀粉酶编码序列在至少低严格条件下,例如中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与来自本文描述或参照的任何葡糖淀粉酶的编码序列的全长互补链杂交。在一个实施例中,该葡糖淀粉酶编码序列与本文描述或参照的任何葡糖淀粉酶的编码序列具有至少65%,例如至少70%、至少75%、至少80%、至少85%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

在一个实施例中,编码该葡糖淀粉酶的多核苷酸包含本文描述或参照的任何葡糖淀粉酶的编码序列。在一个实施例中,编码该葡糖淀粉酶的多核苷酸包含来自本文描述或参照的任何葡糖淀粉酶的编码序列的子序列,其中该子序列编码具有葡糖淀粉酶活性的多肽。在一个实施例中,子序列中的核苷酸残基的数目是参照编码序列的数目的至少75%,例如至少80%、85%、90%或95%。

该葡糖淀粉酶还可以包括融合多肽或可切割的融合多肽,如上文所述的。

支链淀粉酶

在一些实施例中,在任选的喷射蒸煮和/或液化之前,在液化步骤和/或糖化步骤或同时糖化和发酵(ssf)中,在浆料中存在和/或添加支链淀粉酶。

普鲁兰酶(e.c.3.2.1.41,普鲁兰糖6-葡聚糖-水解酶)是去分支酶,其特征在于它们在例如支链淀粉和普鲁兰糖中水解α-1,6-糖苷键的能力。

在一些实施例中,该发酵生物包含编码支链淀粉酶的异源多核苷酸。考虑本文描述或参照的任何支链淀粉酶用于在发酵生物中表达。

该支链淀粉酶可以是适合宿主细胞和/或本文所述的方法的任何支链淀粉酶,如天然存在的支链淀粉酶或其保留支链淀粉酶活性的变体。

在一些实施例中,当在相同条件下培养时,与不具有编码支链淀粉酶的异源多核苷酸的宿主细胞相比,包含编码该支链淀粉酶的异源多核苷酸的发酵生物具有增加的支链淀粉酶活性水平。在一些实施例中,当在相同条件下培养时,与不具有编码支链淀粉酶的异源多核苷酸的发酵生物相比,该发酵生物具有增加至少5%,例如至少10%、至少15%、至少20%、至少25%、至少50%、至少100%、至少150%、至少200%、至少300%或至少500%的支链淀粉酶活性水平。

可以与本文所述的宿主细胞和/或方法一起使用的示例性支链淀粉酶包括细菌、酵母或丝状真菌支链淀粉酶,例如,获得自本文描述或参照的任何微生物,如上文描述的。

考虑的支链淀粉酶包括来自美国专利号4,560,651(通过引用特此并入)中披露的淀粉脱支芽孢杆菌(bacillusamyloderamificans)的支链淀粉酶、wo01/151620(通过引用特此并入)中披露为seqidno:2的支链淀粉酶、wo01/151620(通过引用特此并入)中披露为seqidno:4的脱支芽孢杆菌(bacillusderamificans)的支链淀粉酶,以及来自wo01/151620(通过引用特此并入)中披露为seqidno:6的嗜酸性支链淀粉芽孢杆菌(bacillusacidopullulyticus)的支链淀粉酶,以及还有描述于femsmic.let.[fems微生物学通讯](1994)115,97-106中的支链淀粉酶。

考虑的另外的支链淀粉酶包括来自沃斯氏热球菌(pyrococcuswoesei)、特别是来自wo92/02614中披露的沃斯氏热球菌dsm号3773的支链淀粉酶。

在一个实施例中,该支链淀粉酶是gh57家族支链淀粉酶。在一个实施例中,该支链淀粉酶包括x47结构域,如披露于作为wo2011/087836公开的us61/289,040(将其通过引用特此并入)中。更具体地,该支链淀粉酶可以衍生自热球菌属的菌株,包括嗜热高温球菌(thermococcuslitoralis)和热水高温球菌(thermococcushydrothermalis),如热水高温球菌支链淀粉酶刚好在x47结构域之后的x4位点截短(即,氨基酸1-782)。该支链淀粉酶还可以是嗜热高温球菌和热水高温球菌支链淀粉酶的杂合体或具有截短位点x4的、披露于作为wo2011/087836公开的us61/289,040(将其通过引用特此并入)中的热水高温球菌/嗜热高温球菌杂合酶。

在另一个实施例中,该支链淀粉酶是包含披露于wo2011/076123(诺维信公司)中的x46结构域的支链淀粉酶。

该支链淀粉酶能以有效量添加,包括约0.0001-10mg酶蛋白/克ds的优选量,优选0.0001-0.10mg酶蛋白/克ds,更优选0.0001-0.010mg酶蛋白/克ds。支链淀粉酶活性可以确定为npun。用于确定npun的测定描述于wo2018/098381中。

适合的可商购支链淀粉酶产品包括promozymed、promozymetmd2(诺维信公司,丹麦)、optimaxl-300(杜邦-丹尼斯克(dupont-danisco),美国)、以及amano8(安能满公司,日本)。

在一个实施例中,该支链淀粉酶衍生自2018年10月3日提交的pct/us2018/054212所披露的seqidno:114的枯草芽孢杆菌支链淀粉酶。在一个实施例中,该支链淀粉酶衍生自pct/us2018/054212所披露的seqidno:115的地衣芽孢杆菌支链淀粉酶。在一个实施例中,该支链淀粉酶衍生自pct/us2018/054212所披露的seqidno:116的水稻支链淀粉酶。在一个实施例中,该支链淀粉酶衍生自pct/us2018/054212所披露的seqidno:117的小麦支链淀粉酶。在一个实施例中,该支链淀粉酶衍生自pct/us2018/054212所披露的seqidno:118的发酵植物多糖梭菌支链淀粉酶。在一个实施例中,该支链淀粉酶衍生自pct/us2018/054212所披露的seqidno:119的除虫链霉菌支链淀粉酶。在一个实施例中,该支链淀粉酶衍生自pct/us2018/054212所披露的seqidno:120的肺炎克雷柏氏菌(klebsiellapneumoniae)支链淀粉酶。

考虑与本发明一起使用的另外的支链淀粉酶可以在wo2011/153516(将其内容并入本文)中找到。

编码适合的支链淀粉酶的另外的多核苷酸可以获得自任何属的微生物,包括在uniprotkb数据库(www.uniprot.org)内可容易获得的那些。

支链淀粉酶编码序列也可用于设计核酸探针以鉴定和克隆编码来自不同属或种的菌株的支链淀粉酶的dna,如上文所述的。

还可以从其他来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等)获得的dna样品鉴定和获得编码支链淀粉酶的多核苷酸,如上文所述的。

用于分离或克隆编码支链淀粉酶的多核苷酸的技术在上文中描述。

在一个实施例中,该支链淀粉酶与本文描述或参照的任何支链淀粉酶具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一方面,该支链淀粉酶序列与本文描述或参照的任何支链淀粉酶相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸、或相差一个氨基酸。在一个实施例中,该支链淀粉酶包含以下或由其组成:本文描述或参照的任何支链淀粉酶的氨基酸序列、等位基因变体、或其具有支链淀粉酶活性的片段。在一个实施例中,该支链淀粉酶具有一个或多个(例如,两个、若干个)氨基酸的氨基酸取代、缺失和/或插入。在一些实施例中,氨基酸取代、缺失和/或插入的总数不超过10,例如不超过9、8、7、6、5、4、3、2或1。

在一些实施例中,该支链淀粉酶在相同条件下具有本文描述或参照的任何支链淀粉酶的支链淀粉酶活性的至少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%。

在一个实施例中,该支链淀粉酶编码序列在至少低严格条件下,例如中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与来自本文描述或参照的任何支链淀粉酶的编码序列的全长互补链杂交。在一个实施例中,该支链淀粉酶编码序列与本文描述或参照的任何支链淀粉酶的编码序列具有至少65%,例如至少70%、至少75%、至少80%、至少85%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

在一个实施例中,编码该支链淀粉酶的多核苷酸包含本文描述或参照的任何支链淀粉酶的编码序列。在一个实施例中,编码该支链淀粉酶的多核苷酸包含来自本文描述或参照的任何支链淀粉酶的编码序列的子序列,其中该子序列编码具有支链淀粉酶活性的多肽。在一个实施例中,子序列中的核苷酸残基的数目是参照编码序列的数目的至少75%,例如至少80%、85%、90%或95%。

该支链淀粉酶还可以包括融合多肽或可切割的融合多肽,如上文所述的。

含淀粉材料的糖化和发酵

在使用含淀粉材料的方面,在糖化步骤a)和/或发酵步骤b)或同时糖化和发酵(ssf)中可存在和/或添加葡糖淀粉酶。糖化步骤a)和/或发酵步骤b)或同时糖化和发酵(ssf)的葡糖淀粉酶典型地不同于任选地在上述任何液化步骤中添加的葡糖淀粉酶。在一个实施例中,该葡糖淀粉酶是与真菌α-淀粉酶一起存在和/或添加的。

在一些方面,该发酵生物包含编码葡糖淀粉酶的异源多核苷酸,例如,如wo2017/087330中所披露,将其内容通过引用特此并入。

葡糖淀粉酶的实例可以在以下的“糖化和/或发酵中的葡糖淀粉酶”部分中找到。

当依序进行糖化和发酵时,糖化步骤a)可以在本领域中熟知的条件下进行。例如,糖化步骤a)可持续长达从约24至约72小时。在一个实施例中,进行预糖化。预糖化在30℃-65℃,典型地约60℃的温度典型地进行40-90分钟。在一个实施例中,在同时糖化和发酵(ssf)中,预糖化之后是发酵过程中的糖化。糖化典型地在从20℃-75℃、优选地从40℃-70℃,典型地约60℃的温度下并且典型地在4与5之间的ph下、如约ph4.5下进行。

如本领域已知并且例如如本文所述,在发酵培养基中进行发酵。发酵培养基包括发酵底物,即被发酵生物代谢的碳水化合物源。利用本文所述的方法,该发酵培养基可以包含用于一种或多种发酵生物的营养素和一种或多种生长刺激剂。营养素和生长刺激剂在发酵领域中广泛使用,并且包括氮源例如氨;尿素、维生素和矿物质或其组合。

在一些实施例中,使用相同的工艺设置和条件(例如文中所述的条件),与酿酒酵母菌株ethanol(在澳大利亚维多利亚州国家计量研究所以登录号v14/007039保藏)相比,发酵生物增加乙醇产率大于1.0%、例如大于2.0%、大于2.5%、大于3.0%、大于3.5%、大于4.0%、大于4.5%、大于5.0%、大于5.5%、大于6.0%、大于6.5%、大于7.0%、大于7.5%、大于8.0%、大于8.5%、大于9.0%、大于9.5%、或大于10.0%。可以在发酵约10、20、30、40、50、60或70小时或之后测量提高的乙醇产率。

在一些实施例中,使用相同的工艺设置和条件(例如文中所述的条件),与缺少增加或减少调节物表达的遗传修饰而在其他方面相同的发酵生物相比,发酵生物增加(能够增加)乙醇产率大于1.0%、例如大于2.0%、大于2.5%、大于3.0%、大于3.5%、大于4.0%、大于4.5%、大于5.0%、大于5.5%、大于6.0%、大于6.5%、大于7.0%、大于7.5%、大于8.0%、大于8.5%、大于9.0%、大于9.5%、或大于10.0%。可以在发酵约10、20、30、40、50、60或70小时或之后测量提高的乙醇产率。

通常,发酵生物如酵母(包括酿酒酵母)需要充分的氮源用于增殖和发酵。如果必要的话,可以使用许多补充氮源,且这些氮源是本领域熟知的。该氮源可以是有机的,如尿素、ddg、湿滤饼(wetcake)或玉米醪,或无机的,如氨或氢氧化铵。在一个实施例中,该氮源是尿素。

在一些实施例中,与缺少增加或减少转运蛋白或其调节物表达的遗传修饰而在其他方面相同的发酵生物相比,发酵生物在发酵期间需要较少的补充氮(例如尿素、氨、氢氧化铵)以维持相同或更高产率的发酵产物(例如乙醇)。在一些实施例中,与缺少增加或减少转运蛋白或其调节物表达的遗传修饰而在其他方面相同的发酵生物相比,发酵生物在发酵期间需要小于95%、小于90%、小于85%、小于80%、小于75%、小于70%、小于65%、小于60%、小于55%、小于50%、小于45%、小于40%、小于35%、小于30%、小于25%、小于20%、小于15%、小于10%、小于5%的补充氮(例如尿素、氨、氢氧化铵)以维持相同产率的发酵产物(例如乙醇)。在一些实施例中,与缺少增加或减少转运蛋白或其调节物表达的遗传修饰而在其他方面相同的发酵生物相比,发酵生物在发酵期间不需要补充氮(例如尿素、氨、氢氧化铵)以维持相同产率的发酵产物(例如乙醇)。发酵产物产率可以在发酵约10、20、30、40、50、60或70小时或之后测量。

在一些实施例中,发酵生物有效利用发酵培养基中的三肽和/或四肽,从而降低发酵后的残留浓度。测定发酵培养基中三肽和四肽的量(例如浓度)的方法是本领域已知的,并在本文的实例中描述。在一些实施例中,与缺少增加或减少转运蛋白或其调节物表达的遗传修饰而在其他方面相同的发酵生物相比,发酵生物在发酵29小时后(例如,在本文所述的条件下)将发酵培养基中的残留三肽和/或四肽的量减少(或能够减少)至少5%,例如,10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%。

同时糖化和发酵(“ssf”)广泛地用于工业规模的发酵产物生产方法中,尤其是乙醇生产方法中。当进行ssf时,同时进行糖化步骤a)和发酵步骤b)。不存在针对糖化的保持阶段,意指可以将发酵生物(如酵母)以及一种或多种酶一同添加。然而,还考虑了分开添加发酵生物以及一种或多种酶。ssf典型地在从25℃至40℃、如从28℃至35℃、如从30℃至34℃、或约32℃的温度下进行。在一个实施例中,发酵进行6至120小时,特别是24至96小时。在一个实施例中,该ph在4-5之间。

在一个实施例中,在糖化、发酵或同时糖化和发酵(ssf)中存在和/或添加纤维素分解酶组合物。此类纤维素分解酶组合物的实例可以在以下的“纤维素分解酶组合物”部分中找到。该纤维素分解酶组合物可以与葡糖淀粉酶一起存在和/或添加,如以下“糖化和/或发酵中的葡糖淀粉酶”部分中所披露的葡糖淀粉酶。

糖化和/或发酵中的葡糖淀粉酶

在糖化、发酵或同时糖化和发酵(ssf)中可以存在和/或添加葡糖淀粉酶。

如上文所述,在一些实施例中,该发酵生物包含编码葡糖淀粉酶的异源多核苷酸,例如,如wo2017/087330中所披露,将其内容通过引用特此并入。考虑本文描述或参照的任何葡糖淀粉酶用于在发酵生物中表达。

该葡糖淀粉酶可以是适合宿主细胞和/或本文所述的方法的任何葡糖淀粉酶,如天然存在的葡糖淀粉酶或其保留葡糖淀粉酶活性的变体。

在一些实施例中,当在相同条件下培养时,与不具有编码葡糖淀粉酶的异源多核苷酸的宿主细胞相比,包含编码该葡糖淀粉酶的异源多核苷酸的发酵生物具有增加的葡糖淀粉酶活性水平。在一些实施例中,当在相同条件下培养时,与不具有编码葡糖淀粉酶的异源多核苷酸的发酵生物相比,该发酵生物具有增加至少5%,例如至少10%、至少15%、至少20%、至少25%、至少50%、至少100%、至少150%、至少200%、至少300%或至少500%的葡糖淀粉酶活性水平。

可以与本文所述的宿主细胞和/或方法一起使用的示例性葡糖淀粉酶包括细菌、酵母或丝状真菌葡糖淀粉酶,例如,获得自本文描述或参照的任何微生物,如上文所描述的。

该葡糖淀粉酶可以衍生自任何适合的来源,例如衍生自微生物或植物。优选的葡糖淀粉酶是真菌或细菌来源的,选自下组,该组由以下组成:曲霉属葡糖淀粉酶,特别是黑曲霉g1或g2葡糖淀粉酶(boel等人,1984,emboj.[欧洲分子生物学学会杂志]3(5),第1097-1102页),或其变体,如wo92/00381、wo00/04136和wo01/04273中披露的那些(来自丹麦诺维信公司,(novozymes,denmark));wo84/02921中披露的泡盛曲霉(a.awamori)葡糖淀粉酶;米曲霉葡糖淀粉酶(agric.biol.chem.[农业与生物化学](1991),55(4),第941-949页),或它们的变体或片段。其他曲霉属葡糖淀粉酶变体包括具有增强的热稳定性的变体:g137a和g139a(chen等人,(1996),prot.eng.[蛋白质工程]9,499-505);d257e和d293e/q(chen等人,(1995),prot.eng.[蛋白质工程]8,575-582);n182(chen等人,(1994),biochem.j[生物化学杂志]301,275-281);二硫键、a246c(fierobe等人,(1996),biochemistry[生物化学],35,8698-8704);以及在a435和s436位置导入pro残基(li等人,(1997),proteineng.[蛋白质工程]10,1199-1204)。

其他葡糖淀粉酶包括罗耳阿太菌(atheliarolfsii)(以前命名为罗尔伏革菌(corticiumrolfsii))葡糖淀粉酶(参见美国专利号4,727,026和nagasaka等人(1998)“purificationandpropertiesoftheraw-starch-degradingglucoamylasesfromcorticiumrolfsii[来自罗尔伏革菌的粗淀粉降解葡萄糖淀粉酶的纯化及性质]”appl.microbiol.biotechnol.[应用微生物学与生物技术]50:323-330),篮状菌属葡糖淀粉酶,特别是源自埃默森篮状菌(wo99/28448)、雷塞氏篮状菌(美国专利号re.32,153)、杜氏篮状菌(talaromycesduponti)、以及嗜热篮状菌(美国专利号4,587,215)。在一个实施例中,糖化和/或发酵过程中使用的葡糖淀粉酶是wo99/28448中披露的埃默森篮状菌葡糖淀粉酶。

涵盖的细菌葡糖淀粉酶包括来自梭菌属(clostridium),特别是热解淀粉梭菌(c.thermoamylolyticum)(ep135,138)和热硫化氢梭菌(c.thermohydrosulfuricum)(wo86/01831)的葡糖淀粉酶。

涵盖的真菌葡糖淀粉酶包括均在wo2006/069289中披露的瓣环栓菌,纸质大纹饰孢(pachykytosporapapyracea);和大白桩蘑(leucopaxillusgiganteus);或wo2007/124285中披露的红边隔孢伏革菌(peniophorarufomarginata);或其混合物。还考虑了杂合葡糖淀粉酶。实例包括wo2005/045018中披露的杂合葡糖淀粉酶。

在一个实施例中,该葡糖淀粉酶衍生自密孔菌属的菌株,特别是如描述于wo2011/066576中的密孔菌属的菌株(其中的seqidno:2、4或6),包括血红密孔菌葡糖淀粉酶,或者衍生自粘褶菌属的菌株,如篱边粘褶菌或密粘褶菌的菌株,特别是如描述于wo2011/068803中的粘褶菌属的菌株(其中的seqidno:2、4、6、8、10、12、14或16)。在一个实施例中,该葡糖淀粉酶是wo2011/068803中的seqidno:2(即,篱边粘褶菌葡糖淀粉酶)。

在一个实施例中,该葡糖淀粉酶是密粘褶菌葡糖淀粉酶(在wo2014/177546中披露为seqidno:3)。在另一个实施例中,该葡糖淀粉酶衍生自黑层孔属(nigrofomes)的菌株,特别是披露于wo2012/064351中的黑层孔属物种的菌株(其中的seqidno:2)。

还考虑了如下葡糖淀粉酶,这些葡糖淀粉酶与上述葡糖淀粉酶中的任一种显示高同一性,即,与上述成熟酶序列中的任一个显示至少60%,如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或甚至100%同一性。

葡糖淀粉酶能以如下量添加到糖化和/或发酵中:0.0001-20agu/gds,优选0.001-10agu/gds,尤其是在0.01-5agu/gds之间,如0.1-2agu/gds。

葡糖淀粉酶能以如下量添加到糖化和/或发酵中:1-1,000μgep/gds,优选10-500μg/gds,尤其是在25-250μg/gds之间。

该葡糖淀粉酶作为进一步包含α-淀粉酶的共混物添加。在一个实施例中,该α-淀粉酶是真菌α-淀粉酶,尤其是酸性真菌α-淀粉酶。该α-淀粉酶典型地是副活性。

在一个实施例中,该葡糖淀粉酶是共混物,其包含wo99/28448中披露为seqidno:34的埃默森篮状菌葡糖淀粉酶和wo06/069289中披露为seqidno:2的瓣环栓菌葡糖淀粉酶。

在一个实施例中,该葡糖淀粉酶是共混物,其包含wo99/28448中披露的埃默森篮状菌葡糖淀粉酶(本文的seqidno:19)、wo06/69289中披露为seqidno:2的瓣环栓菌葡糖淀粉酶、以及α-淀粉酶。

在一个实施例中,该葡糖淀粉酶是共混物,其包含披露于wo99/28448中的埃默森篮状菌葡糖淀粉酶、披露于wo06/69289中的瓣环栓菌葡糖淀粉酶、以及在wo2006/069290的表5中披露为v039的具有黑曲霉葡糖淀粉酶接头和sbd的微小根毛霉(rhizomucorpusillus)α-淀粉酶。

在一个实施例中,该葡糖淀粉酶是共混物,其包含如在wo2011/068803中的seqidno:2所示的篱边粘褶菌葡糖淀粉酶和α-淀粉酶,特别是wo2013/006756中的seqidno:3披露的、具有黑曲霉葡糖淀粉酶接头和淀粉结合结构域(sbd)的微小根毛霉α-淀粉酶(特别地具有以下取代:g128d+d143n)。

在一个实施例中,该α-淀粉酶可以是衍生自根毛霉属的菌株,优选微小根毛霉的菌株,如wo2013/006756中的seqidno:3所示的,或亚灰树花菌属(meripilus),优选大型亚灰树花菌的菌株。在一个实施例中,该α-淀粉酶衍生自在wo2006/069290的表5中披露为v039的具有黑曲霉葡糖淀粉酶接头和淀粉结合结构域(sbd)的微小根毛霉。

在一个实施例中,该微小根毛霉α-淀粉酶或具有黑曲霉葡糖淀粉酶接头和淀粉结合结构域(sbd)的微小根毛霉α-淀粉酶具有以下取代或取代组合中的至少一个:d165m;y141w;y141r;k136f;k192r;p224a;p224r;s123h+y141w;g20s+y141w;a76g+y141w;g128d+y141w;g128d+d143n;p219c+y141w;n142d+d143n;y141w+k192r;y141w+d143n;y141w+n383r;y141w+p219c+a265c;y141w+n142d+d143n;y141w+k192rv410a;g128d+y141w+d143n;y141w+d143n+p219c;y141w+d143n+k192r;g128d+d143n+k192r;y141w+d143n+k192r+p219c;和g128d+y141w+d143n+k192r;或g128d+y141w+d143n+k192r+p219c(使用wo2013/006756中的seqidno:3进行编号)。

在一个实施例中,该葡糖淀粉酶共混物包含篱边粘褶菌葡糖淀粉酶(例如,wo2011/068803中的seqidno:2)和微小根毛霉α-淀粉酶。

在一个实施例中,该葡糖淀粉酶共混物包含如在wo2011/068803中的seqidno:2所示的篱边粘褶菌葡糖淀粉酶以及wo2013/006756的seqidno:3披露的、具有黑曲霉葡糖淀粉酶接头和淀粉结合结构域(sbd)的微小根毛霉(具有以下取代:g128d+d143n)。

包含葡糖淀粉酶的可商购组合物包括amg200l;amg300l;santmsuper、santmextral、spirizymetmplus、spirizymetmfuel、spirizymetmb4u、spirizymetmultra、spirizymetmexcel、spirizymeachievetm和amgtme(来自诺维信公司);optidextm300、gc480、gc417(来自杜邦-丹尼斯克(dupont-danisco));amigasetm和amigasetmplus(来自dsm);g-zymetmg900、g-zymetm和g990zr(来自杜邦-丹尼斯克(dupont-danisco))。

在一个实施例中,该葡糖淀粉酶衍生自wo2018/222990中seqidno:102所示的西方德巴利酵母葡糖淀粉酶。在一个实施例中,该葡糖淀粉酶衍生自wo2018/222990的seqidno:103所示的扣囊复膜酵母菌葡糖淀粉酶。在一个实施例中,该葡糖淀粉酶衍生自wo2018/222990的seqidno:104所示的扣囊复膜酵母菌葡糖淀粉酶。在一个实施例中,该葡糖淀粉酶衍生自wo2018/222990的seqidno:105所示的酿酒酵母葡糖淀粉酶。在一个实施例中,该葡糖淀粉酶衍生自wo2018/222990的seqidno:106所示的黑曲霉葡糖淀粉酶。在一个实施例中,该葡糖淀粉酶衍生自wo2018/222990的seqidno:107所示的米曲霉葡糖淀粉酶。在一个实施例中,该葡糖淀粉酶衍生自wo2018/222990的seqidno:108所示的米根霉(rhizopusoryzae)葡糖淀粉酶。在一个实施例中,该葡糖淀粉酶衍生自wo2018/222990的seqidno:109所示的热纤维梭菌葡糖淀粉酶。在一个实施例中,该葡糖淀粉酶衍生自wo2018/222990的seqidno:110所示的热纤维梭菌葡糖淀粉酶。在一个实施例中,该葡糖淀粉酶衍生自wo2018/222990的seqidno:111所示的arxulaadeninivorans葡糖淀粉酶。在一个实施例中,该葡糖淀粉酶衍生自wo2018/222990的seqidno:112所示的树脂枝孢霉(hormoconisresinae)葡糖淀粉酶。在一个实施例中,该葡糖淀粉酶衍生自wo2018/222990的seqidno:113所示的出芽短梗霉菌(aureobasidiumpullulans)葡糖淀粉酶。

考虑与本发明一起使用的另外的葡糖淀粉酶可以在wo2011/153516(将其内容并入本文)中找到。

编码适合的葡糖淀粉酶的另外的多核苷酸可以获得自任何属的微生物,包括在uniprotkb数据库(www.uniprot.org)内可容易获得的那些。

葡糖淀粉酶编码序列也可用于设计核酸探针以鉴定和克隆编码来自不同属或种的菌株的葡糖淀粉酶的dna,如上文所述的。

还可以从其他来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等)获得的dna样品鉴定和获得编码葡糖淀粉酶的多核苷酸,如上文所述的。

用于分离或克隆编码葡糖淀粉酶的多核苷酸的技术在上文中描述。

在一个实施例中,该葡糖淀粉酶与本文描述或参照的任何葡糖淀粉酶(例如,wo2018/222990的seqidno:103或104所示的扣囊复膜酵母菌葡糖淀粉酶)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一方面,该葡糖淀粉酶序列与本文描述或参照的任何葡糖淀粉酶(例如,wo2018/222990的seqidno:103或104所示的扣囊复膜酵母菌葡糖淀粉酶)相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸、或相差一个氨基酸。在一个实施例中,该葡糖淀粉酶包含以下或由其组成:本文描述或参照的任何葡糖淀粉酶(例如,wo2018/222990的seqidno:103或104所示的扣囊复膜酵母菌葡糖淀粉酶)的氨基酸序列、等位基因变体、或其具有葡糖淀粉酶活性的片段。在一个实施例中,该葡糖淀粉酶具有一个或多个(例如,两个、若干个)氨基酸的氨基酸取代、缺失和/或插入。在一些实施例中,氨基酸取代、缺失和/或插入的总数不超过10,例如不超过9、8、7、6、5、4、3、2或1。

在一些实施例中,该葡糖淀粉酶在相同条件下具有本文描述或参照的任何葡糖淀粉酶(例如,wo2018/222990的seqidno:103或104所示的扣囊复膜酵母菌葡糖淀粉酶)的葡糖淀粉酶活性的至少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%。

在一个实施例中,该葡糖淀粉酶编码序列在至少低严格条件下,例如中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与来自本文描述或参照的任何葡糖淀粉酶(例如,wo2018/222990的seqidno:103或104所示的扣囊复膜酵母菌葡糖淀粉酶)的编码序列的全长互补链杂交。在一个实施例中,该葡糖淀粉酶编码序列与本文描述或参照的任何葡糖淀粉酶(例如,wo2018/222990的seqidno:103或104所示的扣囊复膜酵母菌葡糖淀粉酶)的编码序列具有至少65%,例如至少70%、至少75%、至少80%、至少85%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

在一个实施例中,编码该葡糖淀粉酶的多核苷酸包含本文描述或参照的任何葡糖淀粉酶(例如,wo2018/222990的seqidno:103或104所示的扣囊复膜酵母菌葡糖淀粉酶)的编码序列。在一个实施例中,编码该葡糖淀粉酶的多核苷酸包含来自本文描述或参照的任何葡糖淀粉酶的编码序列的子序列,其中该子序列编码具有葡糖淀粉酶活性的多肽。在一个实施例中,子序列中的核苷酸残基的数目是参照编码序列的数目的至少75%,例如至少80%、85%、90%或95%。

该葡糖淀粉酶还可以包括融合多肽或可切割的融合多肽,如上文所述的。

使用含纤维素材料的方法

在一些方面,本文所述的方法从含纤维素材料生产发酵产物。生物质的初生细胞壁中的主要多糖是纤维素,第二丰富的是半纤维素,而第三丰富的是果胶。细胞停止生长后产生的次生细胞壁也含有多糖,并且它通过与半纤维素共价交联的聚合木质素得到强化。纤维素是脱水纤维二糖的均聚物,因此是线性β-(1-4)-d-葡聚糖,而半纤维素包括多种化合物,例如具有一系列取代基以复杂支链结构的木聚糖、木葡聚糖、阿拉伯糖基木聚糖、以及甘露聚糖。尽管纤维素一般为多形态的,但发现其在植物组织中主要作为平行葡聚糖链的不溶性晶体基质存在。半纤维素通常氢键结合至纤维素以及其他半纤维素,这有助于稳定细胞壁基质。

纤维素通常见于例如植物的茎、叶、壳、皮和穗轴或树的叶、枝和木材(wood)中。该含纤维素材料可以是,但不限于:农业废弃物、草本材料(包括能量作物)、城市固体废物、纸浆和造纸厂废弃物、废纸、和木材(包括林业废弃物)(参见,例如wiselogel等人,1995,于handbookonbioethanol[生物乙醇手册](charlese.wyman编辑),第105-118页,taylor&francis[泰勒-弗朗西斯出版集团],华盛顿特区;wyman,1994,bioresourcetechnology[生物资源技术]50:3-16;lynd,1990,appliedbiochemistryandbiotechnology[应用生物化学与生物技术]24/25:695-719;mosier等人,1999,recentprogressinbioconversionoflignocellulosics[木质纤维素的生物转化的最近进展],advancesinbiochemicalengineering/biotechnology[生物化学工程/生物技术的进展],t.scheper主编,第65卷,第23-40页,纽约斯普林格出版社(springer-verlag),纽约)。在本文中应理解的是,纤维素可为任何形式的木质纤维素,在混合基质中含有木质素、纤维素和半纤维素的植物细胞壁材料。在一个实施例中,该含纤维素材料是任何生物质材料。在另一个实施例中,该含纤维素材料是木质纤维素,该木质纤维素包含纤维素、半纤维素、以及木质素。

在一个实施例中,该含纤维素材料是农业废弃物、草本材料(包括能源作物)、城市固体废物、纸浆和造纸厂废弃物、废纸、或木材(包括林业废弃物)。

在另一个实施例中,该含纤维素材料是芦竹、甘蔗渣、竹子、玉米芯、玉米纤维、玉米秸秆、芒属、稻秸、柳枝稷或麦秸。

在另一个实施例中,该含纤维素材料是山杨、桉树、冷杉、松树、白杨、云杉或柳树。

在另一个实施例中,该含纤维素材料是海藻纤维素、细菌纤维素、棉短绒、滤纸、微晶纤维素(例如,)、或经磷酸处理的纤维素。

在另一个实施例中,该含纤维素材料是水生生物质(aquaticbiomass)。如本文所用的,术语“水生生物质”意指在水生环境中通过光合作用过程产生的生物质。水生生物质可以是藻类、挺水植物、浮叶植物、或沉水植物。

该含纤维素材料可按原样使用或可使用本领域已知的常规方法进行预处理,如本文所述的。在一个优选的实施例中,该含纤维素材料进行了预处理。

可以使用本领域常规的方法来完成使用含纤维素材料的方法。此外,这些方法可以使用配置为实施这些方法的任何常规生物质加工装置来执行。

纤维素预处理

在一个实施例中,在步骤(a)中的糖化之前对含纤维素材料进行预处理。

在实践文中所述的工艺中,可以使用本领域中已知的任何预处理工艺来破坏纤含维素材料的植物细胞壁组分(chandra等人,2007,adv.biochem.engin./biotechnol.[生化工程/生物技术进展]108:67-93;galbe和zacchi,2007,adv.biochem.engin./biotechnol.[生化工程/生物技术进展]108:41-65;hendriks和zeeman,2009,bioresourcetechnology[生物资源技术]100:10-18;mosier等人,2005,bioresourcetechnology[生物资源技术]96:673-686;taherzadeh和karimi,2008,int.j.mol.sci.[国际分子科学杂志]9:1621-1651;yang和wyman,2008,biofuelsbioproductsandbiorefining-biofpr.[生物燃料、生物产品与生物精炼]2:26-40)。

该含纤维素材料也可以在预处理之前使用本领域中已知的方法进行粒度减小、筛分、预浸泡、润湿、洗涤和/或调理。

常规预处理包括但不限于:蒸汽预处理(伴随或不伴随爆破)、稀酸预处理、热水预处理、碱预处理、石灰预处理、湿氧化、湿爆破、氨纤维爆破、有机溶剂预处理、以及生物预处理。另外的预处理包括氨渗滤、超声、电穿孔、微波、超临界co2、超临界h2o、臭氧、离子液体、以及γ辐射预处理。

在一个实施例中,在糖化(即水解)和/或发酵之前对该含纤维素材料进行预处理。预处理优选在水解前进行。可替代地,预处理可以与酶水解同时进行,以释放可发酵糖,如葡萄糖、木糖、和/或纤维二糖。在多数情况下,预处理步骤自身导致将生物质转化为可发酵糖(甚至在不存在酶的情况下)。

在一个实施例中,将该含纤维素材料用蒸汽预处理。在蒸汽预处理中,加热该含纤维素材料以破坏植物细胞壁组分,包括木质素、半纤维素、以及纤维素,以使纤维素和其他级分(例如半纤维素)可接近酶。该含纤维素材料经过或穿过反应容器,将蒸汽注入该反应容器以增加温度至所需温度和压力,并且将蒸汽保持在其中持续希望的反应时间。优选在140℃-250℃(例如,160℃-200℃或170℃-190℃)进行蒸汽预处理,其中最佳温度范围取决于化学催化剂的任选添加。蒸汽预处理的停留时间优选是1-60分钟,例如1-30分钟、1-20分钟、3-12分钟、或4-10分钟,其中最佳停留时间取决于温度和化学催化剂的任选添加。蒸汽预处理允许相对高的固体加载量,这样使得该含纤维素材料在预处理过程中通常仅变得潮湿。蒸汽预处理经常与预处理后的材料的爆发放料(explosivedischarge)合并,这被称为蒸汽爆炸,即,快速急骤蒸发至大气压和材料的湍流,以通过破碎增加可接触的表面积(duff和murray,1996,bioresourcetechnology[生物资源技术]855:1-33;galbe和zacchi,2002,appl.microbiol.biotechnol.[应用微生物学与生物技术]59:618-628;美国专利申请号2002/0164730)。在蒸汽预处理过程中,半纤维素乙酰基基团被切割,并且所得的酸自催化半纤维素部分水解成单糖和低聚糖。仅在有限的程度上去除木质素。

在一个实施例中,使该含纤维素材料经受化学预处理。术语“化学处理”是指能促进纤维素、半纤维素和/或木质素分离和/或释放的任何化学预处理。这种预处理可以将结晶纤维素转化为无定形纤维素。适合的化学预处理方法的实例包括例如稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆破(afex)、氨渗滤(apr)、离子液体、以及有机溶剂预处理。

有时在蒸汽预处理之前添加化学催化剂(如h2so4或so2)(典型地是0.3至5%w/w),该化学催化剂减少时间并降低温度、增加回收率、并改善酶水解(ballesteros等人,2006,appl.biochem.biotechnol[应用生物化学与生物技术]129-132:496-508;varga等人,2004,appl.biochem.biotechnol.[应用生物化学与生物技术]113-116:509-523;sassner等人,2006,enzymemicrob.technol.[酶与微生物技术]39:756-762)。在稀酸预处理中,该含纤维素材料与稀酸(典型地是h2so4)和水混合,以形成浆料,由蒸汽加热至希望的温度,并且在停留时间后闪变至大气压。可以用许多反应器设计来进行稀酸预处理,例如,活可采用多种反应器设计来进行稀酸预处理,例如活塞流反应器、逆流反应器或连续逆流收缩床反应器(duff和murray,1996,bioresourcetechnology[生物资源技术]855:1-33;schell等人,2004,bioresourcetechnology[生物资源技术]91:179-188;lee等人,1999,adv.biochem.eng.biotechnol.[生物化学工程/生物技术的进展]65:93-115)。在一个具体实施例中,在180℃下使用4%w/w硫酸持续5分钟来进行该含纤维素材料的稀酸预处理。

还可以使用碱性条件下的若干种预处理方法。这些碱性预处理包括但不限于:氢氧化钠、石灰、湿氧化、氨渗滤(apr)、以及氨纤维/冷冻爆破(afex)预处理。用氧化钙或氢氧化钙在85-150℃的温度下进行石灰预处理,并且停留时间从1小时到若干天(wyman等人,2005,bioresourcetechnology[生物资源技术]96:1959-1966;mosier等人,2005,bioresourcetechnology[生物资源技术]96:673-686)。wo2006/110891、wo2006/110899、wo2006/110900、和wo2006/110901披露了使用氨的预处理方法。

湿氧化是一种热预处理,其典型地在添加氧化剂(如过氧化氧或过压氧)的情况下在180℃-200℃下持续5-15分钟进行(schmidt和thomsen,1998,bioresourcetechnology[生物资源技术]64:139-151;palonen等人,2004,appl.biochem.biotechnol.[应用生物化学与生物技术]117:1-17;varga等人,2004,biotechnol.bioeng.[生物技术与生物工程]88:567-574;martin等人,2006,j.chem.technol.biotechnol.[化工技术与生物技术杂志]81:1669-1677)。预处理优选以1%-40%干物质,例如2%-30%干物质,或5%-20%干物质进行,并且由于添加碱如碳酸钠,初始ph经常会增加。

被称为湿爆破(湿氧化和蒸汽爆炸的组合)的湿氧化预处理方法的修改方案能够处理高达30%的干物质。在湿爆破中,在某一停留时间后,在预处理期间引入氧化剂。然后通过闪变至大气压结束预处理(wo2006/032282)。

氨纤维爆炸(afex)涉及在温和温度如90℃-150℃和高压如17-20巴,用液体或气体氨将含纤维素材料处理5-10分钟,其中干物质含量可以高达60%(gollapalli等人,2002,appl.biochem.biotechnol.[应用生物化学与生物技术]98:23-35;chundawat等人,2007,biotechnol.bioeng.[生物技术与生物工程]96:219-231;alizadeh等人,2005,appl.biochem.biotechnol.[应用生物化学与生物技术]121:1133-1141;teymouri等人,2005,bioresourcetechnology[生物资源技术]96:2014-2018)。在afex预处理期间,纤维素和半纤维素保持相对完整。木质素-碳水化合物复合物被切割。

有机溶剂预处理通过用含水乙醇(40%-60%乙醇)在160℃-200℃提取30-60分钟而将含纤维素材料去木质素化(pan等人,2005,biotechnol.bioeng.[生物技术与生物工程]90:473-481;pan等人,2006,biotechnol.bioeng.[生物技术与生物工程]94:851-861;kurabi等人,2005,appl.biochem.biotechnol.[应用生物化学与生物技术]121:219-230)。通常添加硫酸作为催化剂。在有机溶剂预处理中,大部分半纤维素和木质素被去除。

适合的预处理方法的其他实例由schell等人,2003,appl.biochem.biotechnol.[应用生物化学与生物技术]105-108:69-85,和mosier等人,2005,bioresourcetechnology[生物资源技术]96:673-686,以及美国专利申请2002/0164730进行了描述。

在一个实施例中,化学预处理作为稀酸处理,并且更优选作为连续稀酸处理进行。酸典型地是硫酸,但也可以使用其他酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢、或其混合物。弱酸处理优选在1至5,例如1至4或1至2.5的ph范围中进行。在一方面,酸浓度优选地在从0.01重量%至10重量%酸(例如,0.05重量%至5重量%酸或0.1重量%至2重量%酸)的范围内。使酸与该含纤维素材料相接触,并且保持在优选地140℃-200℃(例如165℃-190℃)范围内的温度下,持续从1至60分钟范围内的时间。

在另一个实施例中,预处理在水性浆料中进行。在优选方面,在预处理过程中该含纤维素材料以优选在10重量%-80重量%之间,例如20重量%-70重量%或30重量%-60重量%,如约40重量%的量存在。预处理的含纤维素材料可以不洗涤或使用本领域已知的任何方法洗涤,例如,用水洗涤。

在一个实施例中,使该含纤维素材料经受机械或物理预处理。术语“机械预处理”或“物理预处理”是指促进颗粒粒度减小的任何预处理。例如,这样的预处理可以涉及不同类型的研磨或碾磨(例如,干磨、湿磨或振动球磨)。

该含纤维素材料可以物理地(机械地)且化学地预处理。机械或物理预处理可以与蒸汽/蒸汽爆炸、水热解(hydrothermolysis)、稀酸或弱酸处理、高温、高压处理、辐射(例如,微波福射)或其组合相结合。在一方面,高压意指在优选约100至约400psi(例如约150至约250psi)的范围内的压力。在另一方面,高温意指在约100℃至约300℃(例如约140℃至约200℃)的范围内的温度。在一个优选方面中,机械或物理预处理在分批过程中使用蒸汽枪水解器系统,例如从顺智公司(sundsdefibratorab),瑞典可获得的顺智水解器(sundshydrolyzer)来进行,该系统使用如上所定义的高压和高温。根据需要,可以顺序或同时进行物理和化学预处理。

因此,在一个实施例中,使该含纤维素材料经受物理(机械)或化学预处理、或其任何组合,以促进纤维素、半纤维素和/或木质素的分离和/或释放。

在一个实施例中,使该含纤维素材料经受生物预处理。术语“生物预处理”是指促进纤维素、半纤维素、和/或木质素从该含纤维素材料中分离和/或释放的任何生物预处理。生物预处理技术可以包括应用溶解木质素的微生物和/或酶(参见,例如,hsu,t.-a.,1996,pretreatmentofbiomass[生物质的预处理],handbookonbioethanol:productionandutilization[生物乙醇手册:生产和利用],wyman,c.e.,编著,taylor&francis,washington,dc[泰勒-弗朗西斯出版集团华盛顿特区],179-212;ghosh和singh,1993,adv.appl.microbiol.[应用微生物学进展]39:295-333;mcmillan,j.d.,1994,pretreatinglignocellulosicbiomass:areview[预处理木质纤维素生物质:综述],enzymaticconversionofbiomassforfuelsproduction[生物质的酶促转化用于燃料生产],himmel,m.e.,baker,j.o.,和overend,r.p.,编著,acssymposiumseries566,americanchemicalsociety,washington,dc,chapter15[acs研讨会系列566,美国化学会,华盛顿特区,第15章];gong,c.s.,cao,n.j.,du,j.以及tsao,g.t.,1999,ethanolproductionfromrenewableresources[利用可再生资源生产乙醇],于advancesinbiochemicalengineering/biotechnology[生化工程/生物技术进展],scheper,t.编,海德堡,德国,65:207-241;olsson和hahn-hagerdal,1996,enz.microb.tech.[酶微生物技术]18:312-331;以及vallander和eriksson,1990,adv.biochem.eng./biotechnol.[生物化学工程/生物技术的进展]42:63-95)。

含纤维素材料的糖化和发酵

分开或同时的糖化(即,水解)和发酵包括但不限于:分开水解和发酵(shf);同时糖化和发酵(ssf);同时糖化和共发酵(sscf);杂合的水解和发酵(hhf);分开水解和共发酵(shcf);杂合的水解和共发酵(hhcf)。

shf使用分开的处理步骤,以首先将该含纤维素材料酶促水解为可发酵糖(例如,葡萄糖、纤维二糖、以及戊糖单体),并且然后将可发酵糖发酵为乙醇。在ssf中,该含纤维素材料的酶水解和糖发酵成乙醇被组合在一个步骤中(philippidis,g.p.,1996,cellulosebioconversiontechnology[纤维素生物转化技术],于handbookonbioethanol:productionandutilization[生物乙醇手册:生产和利用],wyman,c.e.,编著,taylor&francis,washington,dc[泰勒-弗朗西斯出版集团华盛顿特区],179-212)。sscf涉及多种糖的共发酵(sheehan和himmel,1999,biotechnol.prog.[生物技术进展]15:817-827)。hhf涉及分离的水解步骤并且另外涉及同时的糖化和水解步骤,其可在同一反应器中进行。hhf过程中的步骤可以在不同的温度下进行,即高温酶糖化,随后在发酵生物耐受的更低温度下进行ssf。本文应理解的是,本领域中已知的包含预处理、酶水解(糖化)、发酵、或其组合的任何方法,可以用于实施本文所述的方法。

常规装置可包括补料分批搅拌反应器、分批搅拌反应器、具有超滤作用的连续流搅拌反应器、和/或连续活塞流柱式反应器(decastilhoscorazza等人,2003,actascientiarum.technology[科学技术学报]25:33-38;gusakov和sinitsyn,1985,enz.microb.technol.[酶学与微生物学技术]7:346-352)、研磨反应器(ryu和lee,1983,biotechnol.bioeng.[生物技术和生物工程]25:53-65)。另外的反应器类型包括:用于水解和/或发酵的流化床、升流式(upflowblanket)反应器、固定化反应器、以及挤出机型反应器。

在糖化步骤(即,水解步骤)中,该含纤维素材料和/或含淀粉材料(例如预处理的)被水解,来分解纤维素、半纤维素和/或淀粉为可发酵糖,如葡萄糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖、和/或可溶性低聚糖。水解由例如纤维素分解酶组合物酶促进行。这些组合物的酶可以同时或顺序添加。

酶水解可以在易于由本领域技术人员确定的条件下,在适合的含水环境中进行。在一方面,水解在适于一种或多种酶的活性的条件,即对于这种或这些酶来说最佳条件下进行。水解能以分批补料或连续的过程进行,其中将该含纤维素材料和/或含淀粉材料逐渐补入,例如,含有酶的水解溶液中。

糖化通常在搅拌釜反应器或发酵罐中,在受控的ph、温度、和混合条件下进行。适合的处理时间、温度以及ph条件可以由本领域技术人员容易地确定。例如,糖化可以持续长达200小时,但是典型地进行优选约12至约120小时,例如约16至约72小时或约24至约48小时。温度优选约25℃至约70℃,例如约30℃至约65℃,约40℃至约60℃,或约50℃至55℃的范围。ph优选约3至约8,例如约3.5至约7,约4至约6,或约ph4.5至约ph5.5的范围。干燥固体含量优选约5至约50wt%,例如约10至约40wt%,或约20至约30wt%。

可以使用纤维素分解酶组合物进行在步骤(a)中的糖化。这样的酶组合物在以下的“纤维素分解酶组合物”部分中进行了描述。这些纤维素分解酶组合物可包含有用于降解该含纤维素材料的任何蛋白质。在一方面,该纤维素分解酶组合物包含或进一步包含选自下组的一种或多种(例如,两种,若干种)蛋白质,该组由以下组成:纤维素酶、aa9(gh61)多肽、半纤维素酶、酯酶、棒曲霉素、木质素分解酶、氧化还原酶、果胶酶、蛋白酶、以及膨胀素。

在另一个实施例中,该纤维素酶优选是选自下组的一种或多种(例如,两种,若干种)酶,该组由以下组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。

在另一个实施例中,该半纤维素酶优选是选自下组的一种或多种(例如,两种,若干种)酶,该组由以下组成:乙酰基甘露聚糖酯酶、乙酰基木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡萄糖醛酸酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶、以及木糖苷酶。在另一个实施例中,该氧化还原酶是选自下组的一种或多种(例如,两种,若干种)酶,该组由以下组成:过氧化氢酶、漆酶、以及过氧化物酶。

在本发明的方法中使用的酶或酶组合物可以是以任何适于使用的形式存在的,例如像发酵液配制品或细胞组合物、具有或不具有细胞碎片的细胞裂解物、半纯化或纯化的酶制剂、或作为酶的来源的宿主细胞。该酶组合物可以是干粉或颗粒、无粉尘的颗粒、液体、稳定化液体或稳定化受保护的酶。可以根据已建立的方法例如通过添加稳定剂(如糖、糖醇或其他多元醇)、和/或乳酸或另一种有机酸,对液体酶制剂进行稳定化。

在一个实施例中,纤维素分解酶组合物或半纤维素分解酶组合物对于该含纤维素材料的有效量是约0.5mg至约50mg,例如,约0.5mg至约40mg、约0.5mg至约25mg、约0.75mg至约20mg、约0.75mg至约15mg、约0.5mg至约10mg、或约2.5mg至约10mg/g的该含纤维素材料。

在一个实施例中,以这样一种化合物对纤维素的葡糖基单元的以下摩尔比添加该化合物:约10-6至约10,例如约10-6至约7.5、约10-6至约5、约10-6至约2.5、约10-6至约1、约10-5至约1、约10-5至约10-1、约10-4至约10-1、约10-3至约10-1、或约10-3至约10-2。在另一方面,这样一种化合物的有效量是约0.1μm至约1m,例如约0.5μm至约0.75m、约0.75μm至约0.5m、约1μm至约0.25m、约1μm至约0.1m、约5μm至约50mm、约10μm至约25mm、约50μm至约25mm、约10μm至约10mm、约5μm至约5mm、或约0.1mm至约1mm。

术语“液体(liquor)”意指在如wo2012/021401中所述的条件下,由处理浆料中的木质纤维素和/或半纤维素材料、或其单糖(例如,木糖、阿拉伯糖、甘露糖等)所产生的溶液相(水相、有机相或其组合)、及其可溶性内容物。可以通过对木质纤维素或半纤维素材料(或原料)加热和/或加压进行处理,任选地是在催化剂例如酸的存在下、任选地是在有机溶剂的存在下、和任选地与材料的物理破坏相结合,然后将溶液与残余固形物分离,来产生用于加强aa9多肽(gh61多肽)纤维素分解的液体。在由纤维素分解酶制剂对纤维素底物的水解期间,从液体与aa9多肽的组合中可得到纤维素分解增强的程度是由此类条件确定的。可以使用本领域的标准方法,如过滤、沉淀或离心,而将液体与经过处理的材料进行分离。

在一个实施例中,对于纤维素来说的液体的有效量是约10-6至约10g/g的纤维素,例如约10-6至约7.5g、约10-6至约5g、约10-6至约2.5g、约10-6至约1g、约10-5至约1g、约10-5至约10-1g、约10-4至约10-1g、约10-3至约10-1g、或约10-3至约10-2g/g的纤维素。

在发酵步骤中,例如作为预处理和酶水解步骤的结果由该含纤维素材料释放的糖,由发酵生物(如本文所述的酵母)发酵为乙醇。水解(糖化)和发酵可以是分开的或同时的。

在实施本文所述的方法的发酵步骤中可以使用任何适合的经水解的含纤维素材料。这类原料包括但不限于碳水化合物(例如,木质纤维素、木聚糖、纤维素、淀粉等)。该材料通常是基于经济学,即,每当量糖势的成本,以及对酶致转变的难降解性而进行选择。

使用含纤维素材料通过发酵生物生产乙醇是由糖(单糖)的代谢产生的。经水解的含纤维素材料的糖组成和发酵生物利用不同糖的能力对工艺产率具有直接影响。

发酵培养基的组成和发酵条件取决于发酵生物,并且可以由本领域技术人员容易地确定。通常,发酵在已知适于产生发酵产物的条件下进行。在一些实施例中,发酵过程在有氧或微需氧条件下(即,氧气浓度小于空气中的氧气浓度)或厌氧条件下进行。在一些实施例中,发酵在厌氧条件下(即,没有可检测的氧气)或小于约5、约2.5或约1mmol/l/h的氧气中进行。在没有氧的情况下,糖酵解中产生的nadh不能通过氧化磷酸化氧化。在厌氧条件下,宿主细胞可利用丙酮酸或其衍生物作为电子和氢受体以产生nad+。

发酵过程通常在对重组真菌细胞最佳的温度下进行。例如,在一些实施例中,发酵过程在约25℃至约42℃的范围内的温度下进行。通常,该方法在低于约38℃,低于约35℃,低于约33℃,或低于约38℃,但至少约20℃、22℃或25℃的温度下进行。

发酵刺激剂可以用在本文所描述的方法中,以进一步改善发酵,并且特别是改善发酵生物的性能,例如速率增加和产物产率(例如乙醇产率)。“发酵刺激剂”是指用于发酵生物(特别是酵母)生长的刺激剂。用于生长的优选发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯酸、叶酸、核黄素、以及维生素a、b、c、d和e。例如,参见alfenore等人,improvingethanolproductionandviabilityofsaccharomycescerevisiabyavitaminfeedingstrategyduringfed-batchprocess[通过在进料分批方法过程中的一种维生素进料策略改进乙醇产生和酿酒酵母(saccharomycescerevisiae)的存活力],springer-verlag[施普林格出版社](2002),将其通过引用由此并入。矿物质的实例包括可以供应包含p、k、mg、s、ca、fe、zn、mn、和cu营养素的矿物质和矿物盐。

纤维素分解酶和组合物

在步骤(a)的糖化过程中可以存在和/或添加纤维素分解酶或纤维素分解酶组合物。纤维素分解酶组合物是包含水解含纤维素材料的一种或多种(例如,两种,若干种)酶的酶制剂。此类酶包括内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、和/或其组合。

在一些实施例中,该发酵生物包含编码可水解含纤维素材料的酶(例如,内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶或其组合)的一种或多种(例如,两种,若干种)异源多核苷酸。考虑本文描述或参照的任何酶(可水解含纤维素材料)用于在发酵生物中表达。

该纤维素分解酶可以是适合宿主细胞和/或本文所述的方法的任何纤维素分解酶(例如,内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶),如天然存在的纤维素分解酶或其保留纤维素分解酶活性的变体。

在一些实施例中,当在相同条件下培养时,与不具有编码纤维素分解酶的异源多核苷酸的宿主细胞相比,包含编码该纤维素分解酶的异源多核苷酸的发酵生物具有增加的纤维素分解酶(例如,增加的内切葡聚糖酶、纤维二糖水解酶、和/或β-葡糖苷酶)活性水平。在一些实施例中,当在相同条件下培养时,与不具有编码纤维素分解酶的异源多核苷酸的发酵生物相比,该发酵生物具有增加至少5%,例如至少10%、至少15%、至少20%、至少25%、至少50%、至少100%、至少150%、至少200%、至少300%或至少500%的纤维素分解酶活性水平。

可以与本文所述的宿主细胞和/或方法一起使用的示例性纤维素分解酶包括细菌、酵母或丝状真菌纤维素分解酶,例如,获得自本文描述或参照的任何微生物,如上文描述的。

该纤维素分解酶可以是任何来源的。在一个实施例中,该纤维素分解酶衍生自木霉属的菌株,如里氏木霉的菌株;腐质霉属的菌株,如特异腐质霉的菌株,和/或金孢子菌属的菌株,如卢克诺文思金孢子菌的菌株。在一个优选的实施例中,该纤维素分解酶衍生自里氏木霉的菌株。

该纤维素分解酶组合物可进一步包含以下多肽(如酶)中的一种或多种:具有纤维素分解增强活性的aa9多肽(gh61多肽)、β-葡糖苷酶、木聚糖酶、β-木糖苷酶、cbhi、cbhii、或其两种、三种、四种、五种、或六种的混合物。

另外的一种或多种多肽(例如,aa9多肽)和/或一种或多种酶(例如,β-葡糖苷酶、木聚糖酶、β-木糖苷酶、cbhi和/或cbhii)对于该纤维素分解酶组合物生产生物(例如,里氏木霉)可以是外源的。

在一个实施例中,该纤维素分解酶组合物包含具有纤维素分解增强活性的aa9多肽和β-葡糖苷酶。

在另一个实施例中,该纤维素分解酶组合物包含具有纤维素分解增强活性的aa9多肽、β-葡糖苷酶、以及cbhi。

在另一个实施例中,该纤维素分解酶组合物包含具有纤维素分解增强活性的aa9多肽、β-葡糖苷酶、cbhi以及cbhii。

其他酶(如内切葡聚糖酶),还可以包含在该纤维素分解酶组合物中。

如以上提到的,该纤维素分解酶组合物可以包含多种不同的多肽,包括酶。

在一个实施例中,该纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包含具有纤维素分解增强活性的橙色嗜热子囊菌aa9(gh61a)多肽(例如,wo2005/074656),以及米曲霉β-葡糖苷酶融合蛋白(例如,披露于wo2008/057637中的一种,特别是如seqidno:59和60中所示)。

在另一个实施例中,纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包括具有纤维素分解增强活性的金黄色嗜热子囊菌aa9(gh61a)多肽(例如,wo2005/074656中的seqidno:2)以及烟曲霉β-葡糖苷酶(例如,wo2005/047499的seqidno:2)。

在另一个实施例中,该纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包含具有纤维素分解增强活性的埃默森青霉菌(penicilliumemersonii)aa9(gh61a)多肽,特别是披露于wo2011/041397中的一种,以及烟曲霉β-葡糖苷酶(例如,wo2005/047499的seqidno:2)。

在另一个实施例中,该纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包含具有纤维素分解增强活性的埃默森青霉菌aa9(gh61a)多肽,特别是披露于wo2011/041397中的一种,以及烟曲霉β-葡糖苷酶(例如,wo2005/047499的seqidno:2),或披露于wo2012/044915(通过引用特此并入)的变体,特别是包含一个或多个(例如所有)的以下取代的变体:f100d、s283g、n456e、f512y。

在一个实施例中,该纤维素分解酶组合物是里氏木霉纤维素分解组合物,该里氏木霉纤维素分解酶组合物进一步包含具有纤维素分解增强活性的aa9(gh61a)多肽,特别是衍生自埃默森青霉菌菌株的一种(例如,wo2011/041397中的seqidno:2),烟曲霉β-葡糖苷酶(例如,wo2005/047499中的seqidno:2)变体,该变体具有一个或多个(特别是所有)的以下取代:f100d、s283g、n456e、f512y且披露于wo2012/044915中;烟曲霉cel7acbh1,例如在wo2011/057140中披露为seqidno:6的一种和烟曲霉cbhii,例如在wo2011/057140中披露为seqidno:18的一种。

在一个实施例中,该纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包含半纤维素酶或半纤维素分解酶组合物,如烟曲霉木聚糖酶和烟曲霉β-木糖苷酶。

在一个实施例中,纤维素分解酶组合物还包括木聚糖酶(例如,衍生自曲霉属,特别是棘孢曲霉或烟曲霉的菌株;或篮状菌属,特别是talaromycesleycettanus的菌株)和/或β-木糖苷酶(例如,衍生自曲霉属,特别是烟曲霉,或篮状菌属,特别是埃默森篮状菌(talaromycesemersonii)的菌株)。

在一个实施例中,该纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包含具有纤维素分解增强活性的橙色嗜热子囊菌aa9(gh61a)多肽(例如,wo2005/074656),米曲霉β-葡糖苷酶融合蛋白(例如,披露于wo2008/057637中的一种,特别是如seqidno:59和60),以及棘孢曲霉木聚糖酶(例如,在wo94/21785中的xylii)。

在另一个实施例中,该纤维素分解酶组合物包含里氏木霉纤维素分解制剂,该里氏木霉纤维素分解制剂进一步包含具有纤维素分解增强活性的橙色嗜热子囊菌gh61a多肽(例如,wo2005/074656中的seqidno:2)、烟曲霉β-葡糖苷酶(例如,wo2005/047499的seqidno:2)、以及棘孢曲霉木聚糖酶(披露于wo94/21785中的xylii)。

在另一个实施例中,该纤维素分解酶组合物包含里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包含具有纤维素分解增强活性的橙色嗜热子囊菌aa9(gh61a)多肽(例如,wo2005/074656中的seqidno:2)、烟曲霉β-葡糖苷酶(例如,wo2005/047499的seqidno:2)、以及棘孢曲霉木聚糖酶(例如,披露于wo94/21785中的xylii)。

在另一个实施例中,该纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包含具有纤维素分解增强活性的埃默森青霉菌aa9(gh61a)多肽(特别是披露于wo2011/041397中的一种)、烟曲霉β-葡糖苷酶(例如,wo2005/047499的seqidno:2)、以及烟曲霉木聚糖酶(例如,wo2006/078256中的xyliii)。

在另一个实施例中,该纤维素分解酶组合物包含里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包含具有纤维素分解增强活性的埃默森青霉菌aa9(gh61a)多肽,特别是披露于wo2011/041397中的一种、烟曲霉β-葡糖苷酶(例如,wo2005/047499的seqidno:2)、烟曲霉木聚糖酶(例如,wo2006/078256中的xyliii)、以及来自烟曲霉的cbhi,特别是在wo2011/057140中披露为seqidno:2的cel7acbh1。

在另一个实施例中,该纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包含具有纤维素分解增强活性的埃默森青霉菌aa9(gh61a)多肽,特别是披露于wo2011/041397中的一种、烟曲霉β-葡糖苷酶(例如,wo2005/047499的seqidno:2)、烟曲霉木聚糖酶(例如,wo2006/078256中的xyliii)、来自烟曲霉的cbhi,特别是在wo2011/057140中披露为seqidno:2的cel7acbh1,以及衍生自烟曲霉的cbhii,特别是在wo2013/028928中披露为seqidno:4的一种。

在另一个实施例中,该纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包含具有纤维素分解增强活性的埃默森青霉菌aa9(gh61a)多肽(特别是披露于wo2011/041397中的一种)、烟曲霉β-葡糖苷酶(例如,wo2005/047499的seqidno:2)或其变体,该变体具有一个或多个(特别是所有)的以下取代:f100d、s283g、n456e、f512y;烟曲霉木聚糖酶(例如,wo2006/078256中的xyliii)、来自烟曲霉的cbhi(特别是在wo2011/057140中披露为seqidno:2的cel7acbhi),以及衍生自烟曲霉的cbhii(特别是在wo2013/028928中披露的一种)。

在另一实施例中,纤维素分解酶组合物是一种里氏木霉纤维素分解酶组合物,包括cbhi(genseqp登录号azy49536(wo2012/103293);cbhii(genseqp登录号azy49446(wo2012/103288);β-葡糖苷酶变体(genseqp登录号azu67153(wo2012/44915)),特别是具有一种或多种,特别是所有的,以下取代:f100d、s283g、n456e、f512y;以及aa9(gh61多肽)(genseqp登录号bal61510(wo2013/028912))。

在另一实施例中,纤维素分解酶组合物是一种里氏木霉纤维素分解酶组合物,包括cbhi(genseqp登录号azy49536(wo2012/103293));cbhii(genseqp登录号azy49446(wo2012/103288);gh10木聚糖酶(genseqp登录号bak46118(wo2013/019827));以及β-木糖苷酶(genseqp登录号azi04896(wo2011/057140))。

在另一实施例中,纤维素分解酶组合物是一种里氏木霉纤维素分解酶组合物,包括cbhi(genseqp登录号azy49536(wo2012/103293));cbhii(genseqp登录号azy49446(wo2012/103288));以及aa9(gh61多肽;genseqp登录号bal61510(wo2013/028912))。

在另一实施例中,纤维素分解酶组合物是一种里氏木霉纤维素分解酶组合物,包括cbhi(genseqp登录号azy49536(wo2012/103293));cbhii(genseqp登录号azy49446(wo2012/103288)),aa9(gh61多肽;genseqp登录号bal61510(wo2013/028912)),以及过氧化氢酶(genseqp登录号bac11005(wo2012/130120))。

在一个实施例中,纤维素分解酶组合物是一种里氏木霉纤维素分解酶组合物,包括cbhi(genseqp登录号azy49446(wo2012/103288));cbhii(genseqp登录号azy49446(wo2012/103288)),β-葡糖苷酶变体(genseqp登录号azu67153(wo2012/44915)),具有一种或多种,特别是所有的,以下取代:f100d、s283g、n456e、f512y;以及aa9(gh61多肽;genseqp登录号bal61510(wo2013/028912)),gh10木聚糖酶(genseqp登录号bak46118(wo2013/019827)),以及β-木糖苷酶(genseqp登录号azi04896(wo2011/057140))。

在一个实施例中,该纤维素分解组合物是里氏木霉纤维素分解酶制剂,该里氏木霉纤维素分解酶制剂包含egi(swissprot登录号p07981)、egii(embl登录号m19373)、cbhi(见上文);cbhii(见上文);具有以下取代的β-葡糖苷酶变体(见上文):f100d、s283g、n456e、f512y;aa9(gh61多肽;见上文),gh10木聚糖酶(见上文);以及β-木糖苷酶(见上文)。

也考虑披露于wo2013/028928中的所有的纤维素分解酶组合物并且通过引用特此并入。

该纤维素分解酶组合物包含或可以进一步包含选自下组的一种或多种(若干种)蛋白质,该组由以下组成:纤维素酶、具有纤维素分解增强活性的aa9(即gh61)多肽、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶、以及膨胀素。

在一个实施例中,该纤维素分解酶组合物是商业纤维素分解酶组合物。适合用于本发明的方法的商业纤维素分解酶组合物的实例包括:ctec(诺维信公司)、ctec2(诺维信公司)、ctec3(诺维信公司)、celluclasttm(诺维信公司)、spezymetmcp(杰能科国际公司(genencorint.))、accellerasetm1000、accellerase1500、accellerasetmtrio(杜邦公司(dupont))、nl(dsm);s/l100(dsm)、rohamenttm7069w(罗姆公司(gmbh))、或cmax3tm(并矢国际公司(dyadicinternational,inc.))。可以按从约0.001重量%至约5.0重量%的固体,例如,约0.025重量%至约4.0重量%的固体、或约0.005重量%至约2.0重量%的固体的有效量添加纤维素分解酶组合物。

另外的酶及其组合物可在wo2011/153516和wo2016/045569(将其内容并入本文)中找到。

编码适合的纤维素分解酶的另外的多核苷酸可以获得自任何属的微生物,包括在uniprotkb数据库(www.uniprot.org)内可容易获得的那些。

纤维素分解酶编码序列也可用于设计核酸探针以鉴定和克隆编码来自不同属或种的菌株的纤维素分解酶的dna,如上文所述的。

还可以从其他来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等)获得的dna样品鉴定和获得编码纤维素分解酶的多核苷酸,如上文所述的。

用于分离或克隆编码纤维素分解酶的多核苷酸的技术在上文中描述。

在一个实施例中,该纤维素分解酶与本文描述或参照的任何纤维素分解酶(例如,任何内切葡聚糖酶、纤维二糖水解酶、或β-葡糖苷酶)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一方面,该纤维素分解酶序列与本文描述或参照的任何纤维素分解酶相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸、或相差一个氨基酸。在一个实施例中,该纤维素分解酶包含以下或由其组成:本文描述或参照的任何纤维素分解酶的氨基酸序列、等位基因变体、或其具有纤维素分解酶活性的片段。在一个实施例中,该纤维素分解酶具有一个或多个(例如,两个、若干个)氨基酸的氨基酸取代、缺失和/或插入。在一些实施例中,氨基酸取代、缺失和/或插入的总数不超过10,例如不超过9、8、7、6、5、4、3、2或1。

在一些实施例中,该纤维素分解酶在相同条件下具有本文描述或参照的任何纤维素分解酶(例如,任何内切葡聚糖酶、纤维二糖水解酶、或β-葡糖苷酶)的纤维素分解酶活性的至少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%。

在一个实施例中,该纤维素分解酶编码序列在至少低严格条件下,例如中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与来自本文描述或参照的任何纤维素分解酶(例如,任何内切葡聚糖酶、纤维二糖水解酶、或β-葡糖苷酶)的编码序列的全长互补链杂交。在一个实施例中,该纤维素分解酶编码序列与本文描述或参照的任何纤维素分解酶的编码序列具有至少65%,例如至少70%、至少75%、至少80%、至少85%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

在一个实施例中,编码该纤维素分解酶的多核苷酸包含文描述或参照的任何纤维素分解酶(例如,任何内切葡聚糖酶、纤维二糖水解酶、或β-葡糖苷酶)的编码序列。在一个实施例中,编码该纤维素分解酶的多核苷酸包含来自本文描述或参照的任何纤维素分解酶的编码序列的子序列,其中该子序列编码具有纤维素分解酶活性的多肽。在一个实施例中,子序列中的核苷酸残基的数目是参照编码序列的数目的至少75%,例如至少80%、85%、90%或95%。

该纤维素分解酶还可以包括融合多肽或可切割的融合多肽,如上文所述的。

木糖代谢

在一方面,该发酵生物(例如,酵母细胞)进一步包含编码木糖异构酶(xi)的异源多核苷酸。该木糖异构酶可以是适合宿主细胞和本文所述的方法的任何木糖异构酶,如天然存在的木糖异构酶或其保留木糖异构酶活性的变体。在一个实施例中,该木糖异构酶存在于宿主细胞的胞液中。

在一些实施例中,当在相同条件下培养时,与不具有编码木糖异构酶的异源多核苷酸的宿主细胞相比,包含编码该木糖异构酶的异源多核苷酸的发酵生物具有增加的木糖异构酶活性水平。在一些实施例中,当在相同条件下培养时,与不具有编码木糖异构酶的异源多核苷酸的宿主细胞相比,发酵生物具有增加至少5%,例如至少10%、至少15%、至少20%、至少25%、至少50%、至少100%、至少150%、至少200%、至少300%或至少500%的木糖异构酶活性水平。

可以与本文所述的重组宿主细胞和使用方法一起使用的示例性木糖异构酶包括但不限于,来自真菌瘤胃壶菌属菌种(wo2003/062430)或其他来源(madhavan等人,2009,applmicrobiolbiotechnol.[应用微生物学与生物技术]82(6),1067-1078)的xi,已在酿酒酵母宿主细胞中表达。适用于酵母中表达的另外的其他xi已在us2012/0184020(来自黄化瘤胃球菌(ruminococcusflavefaciens)的xi)、wo2011/078262(来自黄胸散白蚁(reticulitermessperatus)和达尔文澳白蚁(mastotermesdarwiniensis)的若干种xi)、以及wo2012/009272(含有来自软弱贫养菌(abiotrophiadefectiva)的xi的构建体和真菌细胞)中描述。us8,586,336描述了表达通过牛瘤胃液获得的xi的酿酒酵母宿主细胞。

编码适合的木糖异构酶的另外的多核苷酸可以获得自任何属的微生物,包括在uniprotkb数据库(www.uniprot.org)内可容易获得的那些。在一个实施例中,该木糖异构酶是细菌、酵母或丝状真菌木糖异构酶,例如,获得自本文描述或参照的任何微生物,如上文所述的。

木糖异构酶编码序列也可用于设计核酸探针以鉴定和克隆编码来自不同属或种的菌株的木糖异构酶的dna,如上文所述的。

还可以从其他来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等)获得的dna样品鉴定和获得编码木糖异构酶的多核苷酸,如上文所述的。

用于分离或克隆编码木糖异构酶的多核苷酸的技术在上文中描述。

在一个实施例中,木糖异构酶与本文描述或参照的任何木糖异构酶具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一个方面,木糖异构酶序列与本文描述或参照的任何木糖异构酶相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸或相差一个氨基酸。在一个实施例中,木糖异构酶包含以下或由其组成:本文描述或参照的任何木糖异构酶的氨基酸序列、等位变体、或其具有木糖异构酶活性的片段。在一个实施例中,该木糖异构酶具有一个或多个(例如,两个、若干个)氨基酸的氨基酸取代、缺失和/或插入。在一些实施例中,氨基酸取代、缺失和/或插入的总数不超过10,例如不超过9、8、7、6、5、4、3、2或1。

在一些实施例中,该木糖异构酶在相同条件下具有本文描述或参照的任何木糖异构酶的木糖异构酶活性的至少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%。

在一个实施例中,该木糖异构酶编码序列在至少低严格条件下,例如中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与来自本文描述或参照的任何木糖异构酶的编码序列的全长互补链杂交。在一个实施例中,该木糖异构酶编码序列与本文描述或参照的任何木糖异构酶的编码序列具有至少65%,例如至少70%、至少75%、至少80%、至少85%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

在一个实施例中,编码该木糖异构酶的异源多核苷酸包含本文描述或参照的任何木糖异构酶的编码序列。在一个实施例中,编码该木糖异构酶的异源多核苷酸包含来自本文描述或参照的任何木糖异构酶的编码序列的子序列,其中该子序列编码具有木糖异构酶活性的多肽。在一个实施例中,子序列中的核苷酸残基的数目是参照编码序列的数目的至少75%,例如至少80%、85%、90%或95%。

这些木糖异构酶还可以包括融合多肽或可切割的融合多肽,如上文所述的。

在一方面,该发酵生物(例如,酵母细胞)进一步包含编码木酮糖激酶(xk)的异源多核苷酸。如本文所用的,木酮糖激酶提供了将d-木酮糖转化为木酮糖5-磷酸的酶活性。该木酮糖激酶可以是适合宿主细胞和本文所述的方法的任何木酮糖激酶,如天然存在的木酮糖激酶或其保留木酮糖激酶活性的变体。在一个实施例中,该木酮糖激酶存在于宿主细胞的胞液中。

在一些实施例中,当在相同条件下培养时,与不具有编码木酮糖激酶的异源多核苷酸的宿主细胞相比,包含编码该木酮糖激酶的异源多核苷酸的发酵生物具有增加的木酮糖激酶活性水平。在一些实施例中,当在相同条件下培养时,与不具有编码木酮糖激酶的异源多核苷酸的宿主细胞相比,宿主细胞具有增加至少5%,例如至少10%、至少15%、至少20%、至少25%、至少50%、至少100%、至少150%、至少200%、至少300%或至少500%的木糖异构酶活性水平。

可以与本文所述的发酵生物和使用方法一起使用的示例性木酮糖激酶包括但不限于,酿酒酵母木酮糖激酶(例如,wo2018/222990的seqidno:75所述的木酮糖激酶)。编码适合的木酮糖激酶的另外的多核苷酸可以获得自任何属的微生物,包括在uniprotkb数据库(www.uniprot.org)内可容易获得的那些。在一个实施例中,该木酮糖激酶是细菌、酵母或丝状真菌木酮糖激酶,例如,获得自本文描述或参照的任何微生物,如上文所述的。

木酮糖激酶编码序列也可用于设计核酸探针以鉴定和克隆编码来自不同属或种的菌株的木酮糖激酶的dna,如上文所述的。

还可以从其他来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等)获得的dna样品鉴定和获得编码木酮糖激酶的多核苷酸,如上文所述的。

用于分离或克隆编码木酮糖激酶的多核苷酸的技术在上文中描述。

在一个实施例中,该木酮糖激酶与本文描述或参照的任何木酮糖激酶具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一个实施例中,该木酮糖激酶序列与本文描述或参照的任何木酮糖激酶相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸、或相差一个氨基酸。在一个实施例中,该木酮糖激酶包含以下或由其组成:本文描述或参照的任何木酮糖激酶的氨基酸序列、等位基因变体、或其具有木酮糖激酶活性的片段。在一个实施例中,该木酮糖激酶具有一个或多个(例如,两个、若干个)氨基酸的氨基酸取代、缺失和/或插入。在一些实施例中,氨基酸取代、缺失和/或插入的总数不超过10,例如不超过9、8、7、6、5、4、3、2或1。

在一些实施例中,该木酮糖激酶在相同条件下具有本文描述或参照的任何木酮糖激酶的木酮糖激酶活性的至少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%。

在一个实施例中,该木酮糖激酶编码序列在至少低严格条件下,例如中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与来自本文描述或参照的任何木酮糖激酶的编码序列的全长互补链杂交。在一个实施例中,该木酮糖激酶编码序列与本文描述或参照的任何木酮糖激酶的编码序列具有至少65%,例如至少70%、至少75%、至少80%、至少85%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

在一个实施例中,编码该木酮糖激酶的异源多核苷酸包含本文描述或参照的任何木酮糖激酶的编码序列。在一个实施例中,编码该木酮糖激酶的异源多核苷酸包含来自本文描述或参照的任何木酮糖激酶的编码序列的子序列,其中该子序列编码具有木酮糖激酶活性的多肽。在一个实施例中,子序列中的核苷酸残基的数目是参照编码序列的数目的至少75%,例如至少80%、85%、90%或95%。

这些木酮糖激酶还可以包括融合多肽或可切割的融合多肽,如上文所述的。

在一方面,该发酵生物(例如,酵母细胞)进一步包含编码核酮糖5磷酸3-差向异构酶(rpe1)的异源多核苷酸。如本文所用的,核酮糖5磷酸3-差向异构酶提供了将l-核酮糖5-磷酸转化为l-木酮糖5-磷酸的酶活性(ec5.1.3.22)。该rpe1可以是适合宿主细胞和本文所述的方法的任何rpe1,如天然存在的rpe1或其保留rpe1活性的变体。在一个实施例中,该rpe1存在于宿主细胞的胞液中。

在一个实施例中,该重组细胞包含编码核酮糖5磷酸3-差向异构酶(rpe1)的异源多核苷酸,其中该rpe1是酿酒酵母rpe1,或者是与酿酒酵母rpe1具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的rpe1。

在一方面,该发酵生物(例如,酵母细胞)进一步包含编码核酮糖5磷酸异构酶(rki1)的异源多核苷酸。如本文所用的,核酮糖5磷酸异构酶提供了将核糖-5-磷酸转化为核酮糖-5-磷酸的酶活性。该rki1可以是适合宿主细胞和本文所述的方法的任何rki1,如天然存在的rki1或其保留rki1活性的变体。在一个实施例中,该rki1存在于宿主细胞的胞液中。

在一个实施例中,发酵生物包含编码核酮糖5磷酸异构酶(rki1)的异源多核苷酸,其中该rki1是酿酒酵母rki1,或者是与酿酒酵母rki1具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的rki1。

在一方面,该发酵生物(例如,酵母细胞)进一步包含编码转酮酶(tkl1)的异源多核苷酸。该tkl1可以是适合宿主细胞和本文所述的方法的任何tkl1,如天然存在的tkl1或其保留tkl1活性的变体。在一个实施例中,该tkl1存在于宿主细胞的胞液中。

在一个实施例中,发酵生物包含编码转酮酶(tkl1)的异源多核苷酸,其中该tkl1是酿酒酵母tkl1,或者是与酿酒酵母tkl1具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的tkl1。

在一方面,该发酵生物(例如,酵母细胞)进一步包含编码转醛酶(tal1)的异源多核苷酸。该tal1可以是适合宿主细胞和本文所述的方法的任何tal1,如天然存在的tal1或其保留tal1活性的变体。在一个实施例中,该tal1存在于宿主细胞的胞液中。

在一个实施例中,发酵生物包含编码转醛酶(tal1)的异源多核苷酸,其中该tal1是酿酒酵母tal1,或者是与酿酒酵母tal1具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的tal1。

发酵产物

发酵产物可以是由发酵得到的任何物质。发酵产物可以是但不限于醇(例如,阿拉伯糖醇、正丁醇、异丁醇、乙醇、甘油、甲醇、乙二醇、1,3-丙二醇[丙二醇]、丁二醇、甘油、山梨醇和木糖醇);烷烃(例如戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷和十二烷)、环烷烃(例如环戊烷、环己烷、环庚烷和环辛烷)、烯烃(例如戊烯、己烯、庚烯和辛烯);氨基酸(例如天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);气体(例如甲烷、氢气(h2)、二氧化碳(co2)和一氧化碳(co));异戊二烯;酮(例如丙酮);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-d-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸);和聚酮化合物。

在一个实施例中,该发酵产物是一种醇。术语“醇”涵盖含有一个或多个羟基部分的物质。该醇可以是但不限于:正丁醇、异丁醇、乙醇、甲醇、阿拉伯糖醇、丁二醇、乙二醇、甘油、丙三醇、1,3-丙二醇、山梨醇、木糖醇。参见例如,gong等人,1999,ethanolproductionfromrenewableresources[由可再生资源生产乙醇],在biochemicalengineering/biotechnology[生化工程/生物技术进展]中,scheper,t.,编辑,springer-verlagberlinheidelberg,germany[施普林格出版社柏林海德堡,德国],65:207-241;silveira和jonas,2002,appl.microbiol.biotechnol.[应用微生物学与生物技术]59:400-408;nigam和singh,1995,processbiochemistry[生物化学工艺]30(2):117-124;ezeji等人,2003,worldjournalofmicrobiologyandbiotechnology[世界微生物学和生物技术杂志]19(6):595-603。在一个实施例中,该发酵产物是乙醇。

在另一个实施例中,该发酵产物是一种烷烃。该烷烃可以是非支链或支链烷烃。该烷烃可以是但不限于:戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷、或十二烷。

在另一个实施例中,该发酵产物是一种环烷烃。该环烷烃可以是但不限于:环戊烷、环己烷、环庚烷或环辛烷。

在另一方面,该发酵产物是烯烃。该烯烃可以是非支链或支链烯烃。该烯烃可以是但不限于:戊烯、己烯、庚烯或辛烯。

在另一方面,该发酵产物是氨基酸。该有机酸可以是但不限于:天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸、或苏氨酸。参见,例如richard和margaritis,2004,biotechnologyandbioengineering[生物技术和生物工程]87(4):501-515。

在另一个实施例中,该发酵产物是一种气体。该气体可以是但不限于:甲烷、h2、co2、或co。参见,例如kataoka等人,1997,waterscienceandtechnology[水科学与技术]36(6-7):41-47;以及gunaseelan,1997,biomassandbioenergy[生物质与生物能源]13(1-2):83-114。

在另一个实施例中,该发酵产物是异戊二烯。

在另一个实施例中,该发酵产物是一种酮。术语“酮”涵盖含有一个或多个酮部分的物质。该酮可以是但不限于:丙酮。

在另一个实施例中,发酵产物是一种有机酸。该有机酸可以是但不限于:乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-d-葡糖酸、甲酸、富马酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸、或木糖酸。参见,例如chen和lee,1997,appl.biochem.biotechnol.[应用生物化学与生物技术]63-65:435-448。

在另一个实施例中,该发酵产物是聚酮化合物。

回收

可以使用本领域已知的任何方法,任选地从发酵培养基中回收发酵产物(例如,乙醇),该方法包括但不限于:层析法、电泳程序、差别溶解度、蒸馏或萃取。例如,通过常规蒸馏方法从发酵的纤维素材料中分离和纯化醇。可以获得纯度高达约96vol.%的乙醇,其能用作,例如,燃料乙醇、饮用乙醇(即,可饮用的中性含酒精饮料),或工业乙醇。

在这些方法的一些实施例中,回收后的发酵产物是基本上纯的。关于本文的这些方法,“基本上纯的”意指回收的制剂包含不超过15%的杂质,其中杂质意指除发酵产物(例如,乙醇)以外的化合物。在一种变体中,提供了基本上纯的制剂,其中该制剂包含不超过25%的杂质、或不超过20%的杂质、或不超过10%的杂质、或不超过5%的杂质、或不超过3%的杂质、或不超过1%的杂质、或不超过0.5%的杂质。

可以使用本领域已知的方法实施适合的测定来测试乙醇和污染物的产生以及糖消耗。例如,可以通过方法(如hplc(高效液相层析法)、gc-ms(气相层析-质谱法)和lc-ms(液相层析-质谱法))或使用本领域熟知的常规程序的其他适合的分析方法对乙醇产物以及其他有机化合物进行分析。还可以用培养上清液测试发酵液中的乙醇的释放。可以使用例如针对葡萄糖和醇类的折光率检测器、以及针对有机酸的uv检测器通过hplc(lin等人,biotechnol.bioeng.[生物技术与生物工程]90:775-779(2005))、或使用本领域熟知的其他适合的测定和检测方法量化在发酵培养基中的副产物和残余的糖(例如,葡萄糖或木糖)。

可在以下编号的段落中进一步描述本发明:

段落[1].一种从含淀粉材料或含纤维素材料生产发酵产物的方法,所述方法包括:

(a)糖化所述含淀粉材料或含纤维素材料;和

(b)用发酵生物发酵步骤(a)的经糖化的材料;

其中所述发酵生物包含增加或减少转运蛋白或其调节物表达的遗传修饰。

段落[2].根据段落[1]所述的方法,其中在相同条件下,与酿酒酵母菌株ethanol(在澳大利亚维多利亚州国家计量研究所以登录号v14/007039保藏)相比,所述发酵生物具有增加或减少(例如,至少5%,例如至少10%、至少15%、至少20%、至少25%、至少50%、至少100%、至少150%、至少200%、至少300%或至少500%)的转运蛋白或其调节物表达。

段落[3].根据段落[1]或[2]所述的方法,其中与缺少增加或减少转运蛋白或其调节物表达的遗传修饰而在其他方面相同的发酵生物相比,所述发酵生物在发酵期间需要较少的补充氮(例如尿素、氨、氢氧化铵)以维持相同产率的发酵产物。

段落[4].根据段落[1]-[3]中任一项所述的方法,其中所述发酵生物包括增加或减少转运蛋白如表1中所示的转运蛋白中的任一种(例如,seqidno:86-170中任一个)的表达的遗传修饰。

段落[5].根据段落[1]-[4]中任一项所述的方法,其中所述发酵生物包含编码与表1中所示的转运蛋白中的任一种(例如,seqidno:86-170中任一个)的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸。

段落[6].根据段落[1]-[5]中任一项所述的方法,其中所述发酵生物包含编码与seqidno:129、seqidno:163或seqidno:164的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸。

段落[7].根据段落[1]-[6]中任一项所述的方法,其中所述发酵生物包含编码与表1中所示的转运蛋白中的任一种(例如,seqidno:86-170中任一个)相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸、或相差一个氨基酸的转运蛋白的异源多核苷酸。

段落[8].根据段落[1]-[7]中任一项所述的方法,其中所述发酵生物包含编码包含表1中所示的转运蛋白中的任一种(例如,seqidno:86-170中任一个)的氨基酸序列或由其组成的转运蛋白的异源多核苷酸。

段落[9].根据段落[1]-[8]中任一项所述的方法,其中所述发酵生物包括对内源转运蛋白基因的破坏,例如表1中所示的转运蛋白基因中的任一种(例如,seqidno:1-85中任一个)。

段落[10].根据段落[9]所述的方法,其中所述破坏的内源转运蛋白基因是失活的。

段落[11].根据段落[9]或[10]所述的方法,其中所述内源转运蛋白基因的所述编码序列与表1中所示的转运蛋白中的任一种(例如,seqidno:1-85中任一个)的编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

段落[12].根据段落[9]-[11]中任一项所述的方法,其中所述内源转运蛋白基因编码与表1中所示的转运蛋白中的任一种(例如,seqidno:86-170中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的转运蛋白。

段落[13].根据段落[1]-[12]中任一项所述的方法,其中所述发酵生物包括增加或减少调节物如表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)的表达的遗传修饰。

段落[14].根据段落[1]-[13]中任一项所述的方法,其中所述发酵生物包含编码调节物的异源多核苷酸,其中所述调节物与表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性。

段落[15].根据段落[1]-[14]中任一项所述的方法,其中所述发酵生物包含编码调节物的异源多核苷酸,其中所述调节物与表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸、或相差一个氨基酸。

段落[16].根据段落[1]-[15]中任一项所述的方法,其中所述发酵生物包含编码调节物的异源多核苷酸,其中所述调节物具有包含表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)的氨基酸序列或由其组成的氨基酸序列。

段落[17].根据段落[1]-[16]中任一项所述的方法,其中所述发酵生物包括对内源调节基因的破坏,例如表2中所示的调节基因中的任一种(例如,seqidno:171-230中任一个)。

段落[18].根据段落[17]所述的方法,其中所述破坏的内源调节基因是失活的。

段落[19].根据段落[17]或[18]所述的方法,其中所述内源调节基因的所述编码序列与表2中所示的调节基因中的任一种(例如,seqidno:171-230中任一个)的编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

段落[20].根据段落[17]-[19]中任一项所述的方法,其中所述内源调节基因编码与表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的调节物。

段落[21].根据段落[1]-[20]中任一项所述的方法,所述方法包括在糖化前在α-淀粉酶存在下,在高于初始糊化温度的温度下液化所述含淀粉材料。

段落[22].根据段落[21]所述的方法,所述方法包括在液化中添加蛋白酶。

段落[23].根据段落[22]所述的方法,其中所述蛋白酶是丝氨酸蛋白酶,例如s8蛋白酶。

段落[24].根据段落[23]所述的方法,其中所述蛋白酶是细菌蛋白酶,特别是衍生自火球菌属、古球菌属、或热球菌属,更特别是激烈火球菌、嗜铁古球菌、海栖热球菌、嗜硫耐热球菌的蛋白酶。

段落[25].根据段落[21]-[24]中任一项所述的方法,其中所述蛋白酶选自由以下组成的群:seqidno:291、seqidno:292、seqidno:293、seqidno:294和seqidno:295、或seqidno:291、seqidno:292、seqidno:293、seqidno:294和seqidno:295中任一个与其具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的变体。

段落[26].根据段落[1]-[25]中任一项所述的方法,其中发酵和糖化在同时糖化和发酵(ssf)中同时进行。

段落[27].根据段落[1]-[26]中任一项所述的方法,其中发酵和糖化是顺序进行的(shf)。

段落[28].根据段落[1]-[27]中任一项所述的方法,所述方法包括从所述发酵中回收所述发酵产物。

段落[29].根据段落[28]所述的方法,其中从所得发酵中回收所述发酵产物包括蒸馏。

段落[30].根据段落[1]-[29]中任一项所述的方法,其中所述发酵产物是乙醇。

段落[31].根据段落[30]所述的方法,其中在相同条件下(例如在文中所述的条件下,例如发酵53小时后),与酿酒酵母菌株ethanol(在澳大利亚维多利亚州国家计量研究所以登录号v14/007039保藏)相比,所述乙醇产率增加大于1.0%、例如大于2.0%、大于2.5%、大于3.0%、大于3.5%、大于4.0%、大于4.5%、大于5.0%、大于5.5%、大于6.0%、大于6.5%、大于7.0%、大于7.5%、大于8.0%、大于8.5%、大于9.0%、大于9.5%、或大于10.0%。

段落[32].根据段落[30]或[31]所述的方法,其中在相同条件下(例如在文中所述的条件下,例如发酵53小时后),与缺少增加或减少调节物表达的遗传修饰而在其他方面相同的发酵生物相比,所述乙醇产率增加大于1.0%、例如大于2.0%、大于2.5%、大于3.0%、大于3.5%、大于4.0%、大于4.5%、大于5.0%、大于5.5%、大于6.0%、大于6.5%、大于7.0%、大于7.5%、大于8.0%、大于8.5%、大于9.0%、大于9.5%、或大于10.0%。

段落[33].根据段落[1]-[32]中任一项所述的方法,其中对含淀粉材料进行步骤(a)的糖化,其中所述含淀粉材料是糊化或未糊化淀粉。

段落[34].根据段落[1]-[33]中任一项所述的方法,其中所述发酵生物包含编码葡糖淀粉酶的异源多核苷酸。

段落[35].根据段落[34]所述的方法,其中所述葡糖淀粉酶是密孔菌属葡糖淀粉酶(例如,文中所述的血红密孔菌葡糖淀粉酶)、粘褶菌属葡糖淀粉酶(例如,文中所述的篱边粘褶菌或密粘褶菌葡糖淀粉酶)、或复膜孢酵母属葡糖淀粉酶(例如,文中所述的扣囊复膜酵母菌葡糖淀粉酶)。

段落[36].根据段落[1]-[35]中任一项所述的方法,其中所述发酵生物包含编码α-淀粉酶的异源多核苷酸。

段落[37].根据段落[21]或[36]所述的方法,其中所述α-淀粉酶是芽孢杆菌属α-淀粉酶(例如,文中所述的嗜热脂肪芽孢杆菌、解淀粉芽孢杆菌或地衣芽孢杆菌α-淀粉酶)、或德巴利酵母属α-淀粉酶(例如,文中所述的西方德巴利酵母α-淀粉酶)。

段落[38].根据段落[1]-[37]中任一项所述的方法,其中所述发酵生物包含编码蛋白酶的异源多核苷酸。

段落[39].根据段落[38]所述的方法,其中所述蛋白酶是大型亚灰树花菌、变色栓菌、污叉丝孔菌、漏斗大孔菌、三株白腐菌、灵芝真菌、虎皮新香菇、或芽孢杆菌属19138蛋白酶(例如,具有wo2018/222990的seqidno:9-73中任一个的蛋白酶)。

段落[40].根据段落[1]-[39]中任一项所述的方法,其中对含纤维素材料进行步骤(a)的糖化,其中对所述含纤维素材料进行预处理。

段落[41].根据段落[36]所述的方法,其中所述预处理是烯酸预处理。

段落[42].根据段落[1]-[41]中任一项所述的方法,其中对含纤维素材料进行糖化,并且其中所述酶组合物包含选自以下的一种或多种酶:纤维素酶、aa9多肽、半纤维素酶、cip、酯酶、棒曲霉素、木质素分解酶、氧化还原酶、果胶酶、蛋白酶和膨胀素。

段落[43].根据段落[42]所述的方法,其中所述纤维素酶是选自内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶的一种或多种酶。

段落[44].根据段落[42]所述的方法,其中所述半纤维素酶是选自木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶的一种或多种酶。

段落[45].根据段落[1]-[44]中任一项所述的方法,其中所述发酵生物是酵母属、红酵母属、裂殖酵母属、克鲁维酵母属、毕赤酵母属、伊萨酵母属、汉逊酵母属、红冬孢酵母属、假丝酵母属、球孢酵母属、接合酵母属、耶氏酵母属、油脂酵母属、隐球菌属或德克拉酵母属细胞。

段落[46].根据段落[1]-[45]中任一项所述的方法,其中所述发酵生物是东方伊萨酵母、郎比可假丝酵母、博伊丁酵母或酿酒酵母细胞。

段落[47].根据段落[1]-[46]中任一项所述的方法,其中所述发酵生物是酿酒酵母细胞。

段落[48].一种酵母细胞,所述酵母细胞包含增加或减少转运蛋白或其调节物表达的遗传修饰。

段落[49].根据段落[48]所述的酵母细胞,其中在相同条件下,与酿酒酵母菌株ethanol(在澳大利亚维多利亚州国家计量研究所以登录号v14/007039保藏)相比,所述细胞具有增加或减少(例如,至少5%,例如至少10%、至少15%、至少20%、至少25%、至少50%、至少100%、至少150%、至少200%、至少300%或至少500%)的转运蛋白或其调节物表达。

段落[50].根据段落[48]或[49]所述的酵母细胞,其中与缺少增加或减少转运蛋白或其调节物表达的遗传修饰而在其他方面相同的发酵生物相比,所述细胞在发酵期间需要较少的补充氮(例如尿素、氨、氢氧化铵)就能够维持相同产率的发酵产物。

段落[51].根据段落[48]-[50]中任一项所述的酵母细胞,其中所述细胞包含增加或减少转运蛋白如表1中所示的转运蛋白中的任一种(例如,seqidno:86-170中任一个)的表达的遗传修饰。

段落[52].根据段落[48]-[51]中任一项所述的酵母细胞,其中所述细胞包含编码与表1中所示的转运蛋白中的任一种(例如,seqidno:86-170中任一个)的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸。

段落[53].根据段落[48]-[52]中任一项所述的酵母细胞,其中所述细胞包含编码与seqidno:129、seqidno:163或seqidno:164的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸。

段落[54].根据段落[48]-[53]中任一项所述的酵母细胞,其中所述细胞包含编码与表1中所示的转运蛋白中的任一种(例如,seqidno:86-170中任一个)相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸、或相差一个氨基酸的转运蛋白的异源多核苷酸。

段落[55].根据段落[48]-[54]中任一项所述的酵母细胞,其中所述细胞包含编码包含表1中所示的转运蛋白中的任一种(例如,seqidno:86-170中任一个)的氨基酸序列或由其组成的转运蛋白的异源多核苷酸。

段落[56].根据段落[48]-[55]中任一项所述的酵母细胞,其中所述细胞包括对内源转运蛋白基因的破坏,例如表1中所示的转运蛋白基因中的任一种(例如,seqidno:1-85中任一个)。

段落[57].根据段落[56]所述的酵母细胞,其中所述破坏的内源转运蛋白基因是失活的。

段落[58].根据段落[57]所述的酵母细胞,其中所述内源转运蛋白基因的所述编码序列与表1中所示的转运蛋白中的任一种(例如,seqidno:1-85中任一个)的编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

段落[59].根据段落[57]或[58]所述的酵母细胞,其中所述内源转运蛋白基因编码与表1中所示的转运蛋白中的任一种(例如,seqidno:86-170中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的转运蛋白。

段落[60].根据段落[48]-[59]中任一项所述的酵母细胞,其中所述细胞包括增加或减少调节物如表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)的表达的遗传修饰。

段落[61].根据段落[48]-[60]中任一项所述的酵母细胞,其中所述细胞包含编码调节物的异源多核苷酸,其中所述调节物与表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性。

段落[62].根据段落[48]-[61]中任一项所述的酵母细胞,其中所述细胞包含编码调节物的异源多核苷酸,其中所述调节物与表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸、或相差一个氨基酸。

段落[63].根据段落[48]-[62]中任一项所述的酵母细胞,其中所述细胞包含编码调节物的异源多核苷酸,其中所述调节物具有包含表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)的氨基酸序列或由其组成的氨基酸序列。

段落[64].根据段落[48]-[63]中任一项所述的酵母细胞,其中所述细胞包括对内源调节基因的破坏,其中所述调节基因是表2中所示的调节基因中的任一种(例如,seqidno:171-230中任一个)。

段落[65].根据段落[64]所述的酵母细胞,其中所述破坏的内源调节基因是失活的。

段落[66].根据段落[64]或[65]所述的酵母细胞,其中所述内源调节基因的所述编码序列与表2中所示的调节基因中的任一种(例如,seqidno:171-230中任一个)的编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

段落[67].根据段落[64]-[66]中任一项所述的酵母细胞,其中所述内源基因编码与表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的调节物。

段落[68].根据段落[48]-[67]中任一项所述的酵母细胞,其中所述细胞包含编码葡糖淀粉酶的异源多核苷酸。

段落[69].根据段落[68]所述的酵母细胞,其中所述葡糖淀粉酶是密孔菌属葡糖淀粉酶(例如,文中所述的血红密孔菌葡糖淀粉酶)、粘褶菌属葡糖淀粉酶(例如,文中所述的篱边粘褶菌或密粘褶菌葡糖淀粉酶)、或复膜孢酵母属葡糖淀粉酶(例如,扣囊复膜酵母菌葡糖淀粉酶,例如wo2018/222990的seqidno:102或103)。

段落[70].根据段落[48]-[69]中任一项所述的酵母细胞,其中所述细胞包含编码α-淀粉酶的异源多核苷酸。

段落[71].根据段落[70]所述的酵母细胞,其中所述α-淀粉酶是芽孢杆菌属α-淀粉酶(例如,文中所述的嗜热脂肪芽孢杆菌、解淀粉芽孢杆菌或地衣芽孢杆菌α-淀粉酶)、或德巴利酵母属α-淀粉酶(例如,文中所述的西方德巴利酵母α-淀粉酶)。

段落[72].根据段落[48]-[71]中任一项所述的酵母细胞,其中所述细胞包含编码蛋白酶的异源多核苷酸。

段落[73].根据段落[72]所述的酵母细胞,其中所述蛋白酶是大型亚灰树花菌、变色栓菌、污叉丝孔菌、漏斗大孔菌、三株白腐菌、灵芝真菌、虎皮新香菇、或芽孢杆菌属19138蛋白酶(例如,具有wo2018/222990的seqidno:9-73中任一个的序列的蛋白酶)。

段落[74].根据段落[48]-[73]中任一项所述的酵母细胞,其中所述细胞是酵母属、红酵母属、裂殖酵母属、克鲁维酵母属、毕赤酵母属、伊萨酵母属、汉逊酵母属、红冬孢酵母属、假丝酵母属、球孢酵母属、接合酵母属、耶氏酵母属、油脂酵母属、隐球菌属或德克拉酵母属细胞。

段落[75].根据段落[48]-[74]中任一项所述的酵母细胞,其中所述细胞是东方伊萨酵母、郎比可假丝酵母、博伊丁酵母或酿酒酵母细胞。

段落[76].根据段落[48]-[75]中任一项所述的酵母细胞,其中所述细胞是酿酒酵母细胞。

段落[77].一种酿酒酵母细胞,所述酿酒酵母细胞包含:

(1)编码转运蛋白的异源多核苷酸,和

(2)编码葡糖淀粉酶、α-淀粉酶或蛋白酶的异源多核苷酸;

其中所述转运蛋白与seqidno:163或seqidno:164的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性。

段落[78].根据段落[77]所述的酵母细胞,其中所述细胞包含编码与seqidno:163的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸;和编码与seqidno:164的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸。

段落[79].根据段落[77]所述的酵母细胞,其中所述转运蛋白与seqidno:163或seqidno:164的氨基酸序列相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸、或相差一个氨基酸。

段落[80].根据段落[77]所述的酵母细胞,其中所述转运蛋白包含seqidno:163或seqidno:164的氨基酸序列或由其组成。

段落[81].根据段落[77]-[80]中任一项所述的酵母细胞,其中使用重组技术将编码所述转运蛋白的所述异源多核苷酸引入所述细胞中。

段落[82].根据段落[77]-[81]中任一项所述的酵母细胞,其中编码所述转运蛋白的所述异源多核苷酸可以被可操作地连接至对于所述多核苷酸而言外源的启动子上。

段落[83].根据段落[77]-[80]中任一项所述的酵母细胞,其中使用非重组育种技术将编码所述转运蛋白的所述异源多核苷酸引入所述细胞中。

段落[84].根据段落[77]-[83]中任一项所述的酵母细胞,其中与缺少编码所述转运蛋白的所述异源多核苷酸而在其他方面相同的发酵生物相比,所述细胞在发酵期间需要较少的补充氮(例如尿素、氨、氢氧化铵)就能够维持相同产率的发酵产物。

段落[85].根据段落[77]-[84]中任一项所述的酵母细胞,其中与缺少编码所述转运蛋白的所述异源多核苷酸而在其他方面相同的发酵生物相比,在文中所述条件下,所述细胞能够增加三肽或四肽的消耗(例如,在发酵29小时后减少发酵培养基中的残留三肽或四肽)。

段落[86].根据段落[77]-[85]中任一项所述的酵母细胞,其中所述细胞包含编码葡糖淀粉酶的异源多核苷酸。

段落[87].根据段落[86]所述的酵母细胞,其中编码所述葡糖淀粉酶的所述异源多核苷酸可以被可操作地连接至对于所述多核苷酸而言外源的启动子上。

段落[88].根据段落[86]或[87]所述的酵母细胞,其中所述葡糖淀粉酶是密孔菌属葡糖淀粉酶(例如,文中所述的血红密孔菌葡糖淀粉酶)、粘褶菌属葡糖淀粉酶(例如,文中所述的篱边粘褶菌或密粘褶菌葡糖淀粉酶)、或复膜孢酵母属葡糖淀粉酶(例如,扣囊复膜酵母菌葡糖淀粉酶,例如wo2018/222990的seqidno:102或103)。

段落[89].根据段落[77]-[88]中任一项所述的酵母细胞,其中所述细胞包含编码α-淀粉酶的异源多核苷酸。

段落[90].根据段落[89]所述的酵母细胞,其中编码所述α-淀粉酶的所述异源多核苷酸可以被可操作地连接至对于所述多核苷酸而言外源的启动子上。

段落[91].根据段落[89]或[90]所述的酵母细胞,其中所述α-淀粉酶是芽孢杆菌属α-淀粉酶(例如,文中所述的嗜热脂肪芽孢杆菌、解淀粉芽孢杆菌或地衣芽孢杆菌α-淀粉酶)、或德巴利酵母属α-淀粉酶(例如,文中所述的西方德巴利酵母α-淀粉酶)。

段落[92].根据段落[77]-[91]中任一项所述的酵母细胞,其中所述细胞包含编码蛋白酶的异源多核苷酸。

段落[93].根据段落[92]所述的酵母细胞,其中编码所述蛋白酶的所述异源多核苷酸可以被可操作地连接至对于所述多核苷酸而言外源的启动子上。

段落[94].根据段落[92]或[93]所述的酵母细胞,其中所述蛋白酶是大型亚灰树花菌、变色栓菌、污叉丝孔菌、漏斗大孔菌、三株白腐菌、灵芝真菌、虎皮新香菇、或芽孢杆菌属19138蛋白酶(例如,具有wo2018/222990的seqidno:9-73中任一个的序列的蛋白酶)。

段落[95].根据段落[77]-[94]中任一项所述的酵母细胞,其中所述细胞进一步包含编码与seqidno:86-162和165-170的转运蛋白中任一种的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸。

段落[96].根据段落[77]-[95]中任一项所述的酵母细胞,其中所述细胞进一步包含编码与seqidno:129、seqidno:130或seqidno:161的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸。

段落[97].根据段落[77]-[96]中任一项所述的酵母细胞,其中所述细胞包含对内源转运蛋白基因的破坏。

段落[98].根据段落[97]所述的酵母细胞,其中所述破坏的内源转运蛋白基因是失活的。

段落[99].根据段落[97]或[98]所述的酵母细胞,其中所述内源转运蛋白基因的所述编码序列与表1中所示的转运蛋白中的任一种(例如,seqidno:1-85中任一个)的编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

段落[100].根据段落[97]-[99]中任一项所述的酵母细胞,其中所述内源转运蛋白基因编码与表1中所示的转运蛋白中的任一种(例如,seqidno:86-170中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的转运蛋白。

段落[101].根据段落[77]-[100]中任一项所述的酵母细胞,其中所述细胞进一步包含编码调节物的异源多核苷酸,其中所述调节物与表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性。

段落[102].根据段落[77]-[101]中任一项所述的酵母细胞,其中所述细胞包含对内源调节基因的破坏。

段落[103].根据段落[102]所述的酵母细胞,其中所述破坏的内源调节基因是失活的。

段落[104].根据段落[102]或[103]所述的酵母细胞,其中所述内源调节基因的所述编码序列与表2中所示的调节基因中的任一种(例如,seqidno:171-230中任一个)的编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

段落[105].根据段落[102]-[104]中任一项所述的酵母细胞,其中所述内源基因编码与表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的调节物。

段落[106].根据段落[77]-[105]中任一项所述的酵母细胞,其中所述细胞是重组细胞。

段落[107].一种酿酒酵母细胞,所述酿酒酵母细胞包含编码转运蛋白的异源多核苷酸,

其中所述转运蛋白与seqidno:163或seqidno:164的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性;

并且条件是所述酵母细胞不是:

酿酒酵母mbg4851(在澳大利亚维多利亚州国家计量研究所以登录号v14/004037保藏)或其衍生物,

酿酒酵母mbg4911(在澳大利亚维多利亚州国家计量研究所以登录号v15/001459保藏)或其衍生物,

酿酒酵母mbg4913(在澳大利亚维多利亚州国家计量研究所以登录号v15/001460保藏)或其衍生物,

酿酒酵母mbg4914(在澳大利亚维多利亚州国家计量研究所以登录号v15/001461保藏)或其衍生物,

酿酒酵母mbg4930(在澳大利亚维多利亚州国家计量研究所以登录号v15/004035保藏)或其衍生物,

酿酒酵母mbg4931(在澳大利亚维多利亚州国家计量研究所以登录号v15/004036保藏)或其衍生物,

酿酒酵母mbg4932(在澳大利亚维多利亚州国家计量研究所以登录号v15/004037保藏)或其衍生物。

段落[108].根据段落[107]所述的酵母细胞,其中所述细胞包含编码与seqidno:163的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸;和编码与seqidno:164的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸。

段落[109].根据段落[107]所述的酵母细胞,其中所述转运蛋白与seqidno:163或seqidno:164的氨基酸序列相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸、或相差一个氨基酸。

段落[110].根据段落[107]所述的酵母细胞,其中所述转运蛋白包含seqidno:163或seqidno:164的氨基酸序列或由其组成。

段落[111].根据段落[107]-[110]中任一项所述的酵母细胞,其中使用重组技术将编码所述转运蛋白的所述异源多核苷酸引入所述细胞中。

段落[112].根据段落[107]-[111]中任一项所述的酵母细胞,其中编码所述转运蛋白的所述异源多核苷酸可以被可操作地连接至对于所述多核苷酸而言外源的启动子上。

段落[113].根据段落[107]-[110]中任一项所述的酵母细胞,其中使用非重组育种技术将编码所述转运蛋白的所述异源多核苷酸引入所述细胞中。

段落[114].根据段落[107]-[113]中任一项所述的酵母细胞,其中与缺少编码所述转运蛋白的所述异源多核苷酸而在其他方面相同的发酵生物相比,所述细胞在发酵期间需要较少的补充氮(例如尿素、氨、氢氧化铵)就能够维持相同产率的发酵产物。

段落[115].根据段落[107]-[114]中任一项所述的酵母细胞,其中与缺少编码所述转运蛋白的所述异源多核苷酸而在其他方面相同的发酵生物相比,在文中所述条件下,所述细胞能够增加三肽或四肽的消耗(例如,在发酵29小时后减少发酵培养基中的残留三肽或四肽)。

段落[116].根据段落[107]-[115]中任一项所述的酵母细胞,其中所述细胞进一步包含编码葡糖淀粉酶的异源多核苷酸。

段落[117].根据段落[116]所述的酵母细胞,其中编码所述葡糖淀粉酶的所述异源多核苷酸可以被可操作地连接至对于所述多核苷酸而言外源的启动子上。

段落[118].根据段落[116]或[117]所述的酵母细胞,其中所述葡糖淀粉酶是密孔菌属葡糖淀粉酶(例如,文中所述的血红密孔菌葡糖淀粉酶)、粘褶菌属葡糖淀粉酶(例如,文中所述的篱边粘褶菌或密粘褶菌葡糖淀粉酶)、或复膜孢酵母属葡糖淀粉酶(例如,扣囊复膜酵母菌葡糖淀粉酶,例如wo2018/222990的seqidno:102或103)。

段落[119].根据段落[107]-[118]中任一项所述的酵母细胞,其中所述细胞进一步包含编码α-淀粉酶的异源多核苷酸。

段落[120].根据段落[119]所述的酵母细胞,其中编码所述α-淀粉酶的所述异源多核苷酸可以被可操作地连接至对于所述多核苷酸而言外源的启动子上。

段落[121].根据段落[119]或[120]所述的酵母细胞,其中所述α-淀粉酶是芽孢杆菌属α-淀粉酶(例如,文中所述的嗜热脂肪芽孢杆菌、解淀粉芽孢杆菌或地衣芽孢杆菌α-淀粉酶)、或德巴利酵母属α-淀粉酶(例如,文中所述的西方德巴利酵母α-淀粉酶)。

段落[122].根据段落[107]-[121]中任一项所述的酵母细胞,其中所述细胞进一步包含编码蛋白酶的异源多核苷酸。

段落[123].根据段落[122]所述的酵母细胞,其中编码所述蛋白酶的所述异源多核苷酸可以被可操作地连接至对于所述多核苷酸而言外源的启动子上。

段落[124].根据段落[122]或[123]所述的酵母细胞,其中所述蛋白酶是大型亚灰树花菌、变色栓菌、污叉丝孔菌、漏斗大孔菌、三株白腐菌、灵芝真菌、虎皮新香菇、或芽孢杆菌属19138蛋白酶(例如,具有wo2018/222990的seqidno:9-73中任一个的序列的蛋白酶)。

段落[125].根据段落[107]-[124]中任一项所述的酵母细胞,其中所述细胞进一步包含编码与seqidno:86-162和165-170的转运蛋白中任一种的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸。

段落[126].根据段落[107]-[125]中任一项所述的酵母细胞,其中所述细胞进一步包含编码与seqidno:129、seqidno:130或seqidno:161的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸。

段落[127].根据段落[107]-[126]中任一项所述的酵母细胞,其中所述细胞包含对内源转运蛋白基因的破坏。

段落[128].根据段落[127]所述的酵母细胞,其中所述破坏的内源转运蛋白基因是失活的。

段落[129].根据段落[127]或[128]所述的酵母细胞,其中所述内源转运蛋白基因的所述编码序列与表1中所示的转运蛋白中的任一种(例如,seqidno:1-85中任一个)的编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

段落[130].根据段落[127]-[129]中任一项所述的酵母细胞,其中所述内源转运蛋白基因编码与表1中所示的转运蛋白中的任一种(例如,seqidno:86-170中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的转运蛋白。

段落[131].根据段落[107]-[130]中任一项所述的酵母细胞,其中所述细胞进一步包含编码调节物的异源多核苷酸,其中所述调节物与表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性。

段落[132].根据段落[107]-[131]中任一项所述的酵母细胞,其中所述细胞包含对内源调节基因的破坏。

段落[133].根据段落[132]所述的酵母细胞,其中所述破坏的内源调节基因是失活的。

段落[134].根据段落[132]或[133]所述的酵母细胞,其中所述内源调节基因的所述编码序列与表2中所示的调节基因中的任一种(例如,seqidno:171-230中任一个)的编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

段落[135].根据段落[132]-[134]中任一项所述的酵母细胞,其中所述内源基因编码与表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的调节物。

段落[136].根据段落[107]-[135]中任一项所述的酵母细胞,其中所述细胞是重组细胞。

段落[137].根据段落[107]-[135]中任一项所述的酵母细胞,其中所述细胞是非重组细胞。

段落[138].一种酵母细胞,所述酵母细胞包含编码转运蛋白的异源多核苷酸,其中所述转运蛋白与seqidno:163或seqidno:164的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性,并且其中所述酵母细胞包含增加所述转运蛋白表达的重组遗传修饰。

段落[139].根据段落[138]所述的酵母细胞,其中所述细胞包含编码与seqidno:163的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸;和编码与seqidno:164的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸。

段落[140].根据段落[138]所述的酵母细胞,其中所述转运蛋白与seqidno:163或seqidno:164的氨基酸序列相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸、或相差一个氨基酸。

段落[141].根据段落[138]所述的酵母细胞,其中所述转运蛋白包含seqidno:163或seqidno:164的氨基酸序列或由其组成。

段落[142].根据段落[138]-[141]中任一项所述的酵母细胞,其中编码所述转运蛋白的所述异源多核苷酸可以被可操作地连接至对于所述多核苷酸而言外源的启动子上。

段落[143].根据段落[138]-[142]中任一项所述的酵母细胞,其中所述细胞包含编码所述转运蛋白的所述异源多核苷酸的多个拷贝。

段落[144].根据段落[143]所述的酵母细胞,其中所述多个拷贝的编码序列是相同的。

段落[145].根据段落[143]所述的酵母细胞,其中所述多个拷贝的编码序列是不同的。

段落[146].根据段落[138]-[145]中任一项所述的酵母细胞,其中与缺少编码所述转运蛋白的所述异源多核苷酸而在其他方面相同的发酵生物相比,所述细胞在发酵期间需要较少的补充氮(例如尿素、氨、氢氧化铵)就能够维持相同产率的发酵产物。

段落[147].根据段落[38]-[146]中任一项所述的酵母细胞,其中与缺少编码所述转运蛋白的所述异源多核苷酸而在其他方面相同的发酵生物相比,在文中所述条件下,所述细胞能够增加三肽或四肽的消耗(例如,在发酵29小时后减少发酵培养基中的残留三肽或四肽)。

段落[148].根据段落[138]-[147]中任一项所述的酵母细胞,其中所述细胞进一步包含编码葡糖淀粉酶的异源多核苷酸。

段落[149].根据段落[148]所述的酵母细胞,其中编码所述葡糖淀粉酶的所述异源多核苷酸可以被可操作地连接至对于所述多核苷酸而言外源的启动子上。

段落[150].根据段落[148]或[149]所述的酵母细胞,其中所述葡糖淀粉酶是密孔菌属葡糖淀粉酶(例如,文中所述的血红密孔菌葡糖淀粉酶)、粘褶菌属葡糖淀粉酶(例如,文中所述的篱边粘褶菌或密粘褶菌葡糖淀粉酶)、或复膜孢酵母属葡糖淀粉酶(例如,扣囊复膜酵母菌葡糖淀粉酶,例如wo2018/222990的seqidno:102或103)。

段落[151].根据段落[138]-[150]中任一项所述的酵母细胞,其中所述细胞进一步包含编码α-淀粉酶的异源多核苷酸。

段落[152].根据段落[151]所述的酵母细胞,其中编码所述α-淀粉酶的所述异源多核苷酸可以被可操作地连接至对于所述多核苷酸而言外源的启动子上。

段落[153].根据段落[151]或[152]所述的酵母细胞,其中所述α-淀粉酶是芽孢杆菌属α-淀粉酶(例如,文中所述的嗜热脂肪芽孢杆菌、解淀粉芽孢杆菌或地衣芽孢杆菌α-淀粉酶)、或德巴利酵母属α-淀粉酶(例如,文中所述的西方德巴利酵母α-淀粉酶)。

段落[154].根据段落[138]-[153]中任一项所述的酵母细胞,其中所述细胞进一步包含编码蛋白酶的异源多核苷酸。

段落[155].根据段落[154]所述的酵母细胞,其中所述细胞进一步包含编码蛋白酶的异源多核苷酸。

段落[156].根据段落[154]或[155]所述的酵母细胞,其中所述蛋白酶是大型亚灰树花菌、变色栓菌、污叉丝孔菌、漏斗大孔菌、三株白腐菌、灵芝真菌、虎皮新香菇、或芽孢杆菌属19138蛋白酶(例如,具有wo2018/222990的seqidno:9-73中任一个的序列的蛋白酶)。

段落[157].根据段落[138]-[156]中任一项所述的酵母细胞,其中所述细胞进一步包含编码与seqidno:86-162和165-170的转运蛋白中任一种的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸。

段落[158].根据段落[138]-[157]中任一项所述的酵母细胞,其中所述细胞进一步包含编码与seqidno:129、seqidno:130或seqidno:161的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸。

段落[159].根据段落[138]-[158]中任一项所述的酵母细胞,其中所述细胞包含对内源转运蛋白基因的破坏。

段落[160].根据段落[159]所述的酵母细胞,其中所述破坏的内源转运蛋白基因是失活的。

段落[161].根据段落[159]或[160]所述的酵母细胞,其中所述内源转运蛋白基因的所述编码序列与表1中所示的转运蛋白中的任一种(例如,seqidno:1-85中任一个)的编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

段落[162].根据段落[159]-[161]中任一项所述的酵母细胞,其中所述内源转运蛋白基因编码与表1中所示的转运蛋白中的任一种(例如,seqidno:86-170中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的转运蛋白。

段落[163].根据段落[138]-[162]中任一项所述的酵母细胞,其中所述细胞进一步包含编码调节物的异源多核苷酸,其中所述调节物与表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性。

段落[164].根据段落[138]-[163]中任一项所述的酵母细胞,其中所述细胞包含对内源调节基因的破坏。

段落[165].根据段落[164]所述的酵母细胞,其中所述破坏的内源调节基因是失活的。

段落[166].根据段落[164]或[165]所述的酵母细胞,其中所述内源调节基因的所述编码序列与表2中所示的调节基因中的任一种(例如,seqidno:171-230中任一个)的编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

段落[167].根据段落[164]-[166]中任一项所述的酵母细胞,其中所述内源基因编码与表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的调节物。

段落[168].根据段落[138]-[167]中任一项所述的酵母细胞,其中所述细胞是酵母属、红酵母属、裂殖酵母属、克鲁维酵母属、毕赤酵母属、伊萨酵母属、汉逊酵母属、红冬孢酵母属、假丝酵母属、球孢酵母属、接合酵母属、耶氏酵母属、油脂酵母属、隐球菌属或德克拉酵母属细胞。

段落[169].根据段落[168]所述的酵母细胞,其中所述细胞是东方伊萨酵母、郎比可假丝酵母、博伊丁酵母或酿酒酵母细胞。

段落[170].根据段落[169]所述的酵母细胞,其中所述细胞是酿酒酵母细胞。

段落[171].一种酵母细胞,所述酵母细胞包含编码转运蛋白的异源多核苷酸,其中所述转运蛋白与seqidno:163或seqidno:164的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性,并且其中所述酵母进一步包含对内源转运蛋白基因的破坏。

段落[172].根据段落[171]所述的酵母细胞,其中所述细胞包含编码与seqidno:163的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸;和编码与seqidno:164的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸。

段落[173].根据段落[171]所述的酵母细胞,其中所述转运蛋白与seqidno:163或seqidno:164的氨基酸序列相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸、或相差一个氨基酸。

段落[174].根据段落[171]所述的酵母细胞,其中所述转运蛋白包含seqidno:163或seqidno:164的氨基酸序列或由其组成。

段落[175].根据段落[171]-[174]中任一项所述的酵母细胞,其中使用重组技术将编码所述转运蛋白的所述异源多核苷酸引入所述细胞中。

段落[176].根据段落[171]-[175]中任一项所述的酵母细胞,其中编码所述转运蛋白的所述异源多核苷酸可以被可操作地连接至对于所述多核苷酸而言外源的启动子上。

段落[177].根据段落[171]-[174]中任一项所述的酵母细胞,其中使用非重组育种技术将编码所述转运蛋白的所述异源多核苷酸引入所述细胞中。

段落[178].根据段落[171]-[177]中任一项所述的酵母细胞,其中所述破坏的内源转运蛋白基因是失活的。

段落[179].根据段落[171]-[178]中任一项所述的酵母细胞,其中所述内源转运蛋白基因的所述编码序列与表1中所示的转运蛋白中的任一种(例如,seqidno:1-85中任一个)的编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

段落[180].根据段落[171]-[179]中任一项所述的酵母细胞,其中所述内源转运蛋白基因编码与表1中所示的转运蛋白中的任一种(例如,seqidno:86-170中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的转运蛋白。

段落[181].根据段落[171]-[180]中任一项所述的酵母细胞,其中与缺少编码所述转运蛋白的所述异源多核苷酸而在其他方面相同的发酵生物相比,所述细胞在发酵期间需要较少的补充氮(例如尿素、氨、氢氧化铵)就能够维持相同产率的发酵产物。

段落[182].根据段落[171]-[181]中任一项所述的酵母细胞,其中与缺少编码所述转运蛋白的所述异源多核苷酸而在其他方面相同的发酵生物相比,在文中所述条件下,所述细胞能够增加三肽或四肽的消耗(例如,在发酵29小时后减少发酵培养基中的残留三肽或四肽)。

段落[183].根据段落[171]-[182]中任一项所述的酵母细胞,其中所述细胞进一步包含编码葡糖淀粉酶的异源多核苷酸。

段落[184].根据段落[183]所述的酵母细胞,其中编码所述葡糖淀粉酶的所述异源多核苷酸可以被可操作地连接至对于所述多核苷酸而言外源的启动子上。

段落[185].根据段落[183]或[184]所述的酵母细胞,其中所述葡糖淀粉酶是密孔菌属葡糖淀粉酶(例如,文中所述的血红密孔菌葡糖淀粉酶)、粘褶菌属葡糖淀粉酶(例如,文中所述的篱边粘褶菌或密粘褶菌葡糖淀粉酶)、或复膜孢酵母属葡糖淀粉酶(例如,扣囊复膜酵母菌葡糖淀粉酶,例如wo2018/222990的seqidno:102或103)。

段落[186].根据段落[171]-[185]中任一项所述的酵母细胞,其中所述细胞进一步包含编码α-淀粉酶的异源多核苷酸。

段落[187].根据段落[186]所述的酵母细胞,其中编码所述α-淀粉酶的所述异源多核苷酸可以被可操作地连接至对于所述多核苷酸而言外源的启动子上。

段落[188].根据段落[186]或[187]所述的酵母细胞,其中所述α-淀粉酶是芽孢杆菌属α-淀粉酶(例如,文中所述的嗜热脂肪芽孢杆菌、解淀粉芽孢杆菌或地衣芽孢杆菌α-淀粉酶)、或德巴利酵母属α-淀粉酶(例如,文中所述的西方德巴利酵母α-淀粉酶)。

段落[189].根据段落[171]-[188]中任一项所述的酵母细胞,其中所述细胞进一步包含编码蛋白酶的异源多核苷酸。

段落[190].根据段落[189]所述的酵母细胞,其中编码所述蛋白酶的所述异源多核苷酸可以被可操作地连接至对于所述多核苷酸而言外源的启动子上。

段落[191].根据段落[189]或[190]所述的酵母细胞,其中所述蛋白酶是大型亚灰树花菌、变色栓菌、污叉丝孔菌、漏斗大孔菌、三株白腐菌、灵芝真菌、虎皮新香菇、或芽孢杆菌属19138蛋白酶(例如,具有wo2018/222990的seqidno:9-73中任一个的序列的蛋白酶)。

段落[192].根据段落[171]-[191]中任一项所述的酵母细胞,其中所述细胞进一步包含编码与seqidno:86-162和165-170的转运蛋白中任一种的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸。

段落[193].根据段落[171]-[192]中任一项所述的酵母细胞,其中所述细胞进一步包含编码与seqidno:129、seqidno:130或seqidno:161的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的转运蛋白的异源多核苷酸。

段落[194].根据段落[171]-[193]中任一项所述的酵母细胞,其中所述细胞进一步包含编码调节物的异源多核苷酸,其中所述调节物与表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)的氨基酸序列具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性。

段落[195].根据段落[171]-[194]中任一项所述的酵母细胞,其中所述细胞包含对内源调节基因的破坏。

段落[196].根据段落[195]所述的酵母细胞,其中所述破坏的内源调节基因是失活的。

段落[197].根据段落[195]或[196]所述的酵母细胞,其中所述内源调节基因的所述编码序列与表2中所示的调节基因中的任一种(例如,seqidno:171-230中任一个)的编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

段落[198].根据段落[195]-[197]中任一项所述的酵母细胞,其中所述内源基因编码与表2中所示的调节物中的任一种(例如,seqidno:231-290中任一个)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的调节物。

段落[199].根据段落[171]-[199]中任一项所述的酵母细胞,其中所述细胞是酵母属、红酵母属、裂殖酵母属、克鲁维酵母属、毕赤酵母属、伊萨酵母属、汉逊酵母属、红冬孢酵母属、假丝酵母属、球孢酵母属、接合酵母属、耶氏酵母属、油脂酵母属、隐球菌属或德克拉酵母属细胞。

段落[200].根据段落[199]所述的酵母细胞,其中所述细胞是东方伊萨酵母、郎比可假丝酵母、博伊丁酵母或酿酒酵母细胞。

段落[201].根据段落[200]所述的酵母细胞,其中所述细胞是酿酒酵母细胞。

段落[202].一种组合物,所述组合物包含根据段落[77]-[201]中任一项所述的酵母菌株,以及一种或多种天然存在的和/或非天然存在的组分,所述组分例如选自由以下组成的群:表面活性剂、乳化剂、树胶、溶胀剂和抗氧化剂。

段落[203].一种生产根据段落[77]-[201]所述的酵母菌株的衍生物的方法,所述方法包括:

(a)提供:

(i)第一酵母菌株;和

(ii)第二酵母菌株,其中所述第二酵母菌株是根据段落[77]-[201]中任一项所述的菌株;

(b)在允许组合所述第一和第二酵母菌株之间的dna的条件下,培养所述第一酵母菌株和该第二酵母菌株;

(c)筛选或选择包含编码所述转运蛋白的所述异源多核苷酸的衍生酵母菌株。

段落[204].一种生产乙醇的方法,所述方法包括用包括可发酵糖的底物在允许可发酵糖发酵生成乙醇的条件下孵育根据段落[77]-[201]中任一项所述的菌株。

段落[205].根据段落[77]-[201]中任一项所述的菌株在乙醇生产中的用途。

段落[206].一种从含淀粉材料或含纤维素材料生产发酵产物的方法,所述方法包括:

(a)糖化所述含淀粉材料或含纤维素材料;和

(b)用根据段落[77]-[201]中任一项所述的酵母细胞发酵步骤(a)的经糖化的材料。

段落[207].根据段落[206]所述的方法,所述方法包括在糖化前在α-淀粉酶存在下,在高于初始糊化温度的温度下液化所述含淀粉材料。

段落[208].根据段落[207]所述的方法,所述方法包括在液化中添加蛋白酶。

段落[209].根据段落[208]所述的方法,其中所述蛋白酶是丝氨酸蛋白酶,例如s8蛋白酶。

段落[210].根据段落[208]或[209]所述的方法,其中所述蛋白酶是细菌蛋白酶,特别是衍生自火球菌属、古球菌属、或热球菌属,更特别是激烈火球菌、嗜铁古球菌、海栖热球菌、嗜硫耐热球菌的蛋白酶。

段落[211].根据段落[208]-[210]中任一项所述的方法,其中所述蛋白酶选自由以下组成的群:seqidno:291、seqidno:292、seqidno:293、seqidno:294和seqidno:295、或seqidno:291、seqidno:292、seqidno:293、seqidno:294和seqidno:295中任一个与其具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的变体。

段落[212].根据段落[206]-[211]中任一项所述的方法,其中发酵和糖化在同时糖化和发酵(ssf)中同时进行。

段落[213].根据段落[206]-[211]中任一项所述的方法,其中发酵和糖化是顺序进行的(shf)。

段落[214].根据段落[206]-[213]中任一项所述的方法,所述方法包括从所述发酵中回收所述发酵产物。

段落[215].根据段落[214]所述的方法,其中从所得发酵中回收所述发酵产物包括蒸馏。

段落[216].根据段落[206]-[215]中任一项所述的方法,其中所述发酵产物是乙醇。

段落[217].根据段落[216]所述的方法,其中在相同条件下(例如在文中所述的条件下,例如发酵53小时后),与酿酒酵母菌株ethanol(在澳大利亚维多利亚州国家计量研究所以登录号v14/007039保藏)相比,所述乙醇产率增加大于1.0%、例如大于2.0%、大于2.5%、大于3.0%、大于3.5%、大于4.0%、大于4.5%、大于5.0%、大于5.5%、大于6.0%、大于6.5%、大于7.0%、大于7.5%、大于8.0%、大于8.5%、大于9.0%、大于9.5%、或大于10.0%。

段落[218].根据段落[216]或[217]所述的方法,其中与缺少编码转运蛋白的异源多核苷酸而在其他方面相同的发酵生物相比,所述乙醇产率增加大于1.0%、例如大于2.0%、大于2.5%、大于3.0%、大于3.5%、大于4.0%、大于4.5%、大于5.0%、大于5.5%、大于6.0%、大于6.5%、大于7.0%、大于7.5%、大于8.0%、大于8.5%、大于9.0%、大于9.5%、或大于10.0%。

段落[219].根据段落[206]-[218]中任一项所述的方法,其中对含淀粉材料进行步骤(a)的糖化,其中所述含淀粉材料是糊化或未糊化淀粉。

段落[220].根据段落[206]-[219]中任一项所述的方法,其中对含纤维素材料进行步骤(a)的糖化,其中对所述含纤维素材料进行预处理。

段落[221].根据段落[220]所述的方法,其中所述预处理是烯酸预处理。

段落[222].根据段落[206]-[221]中任一项所述的方法,其中对含纤维素材料进行糖化,并且其中所述酶组合物包含选自以下的一种或多种酶:纤维素酶、aa9多肽、半纤维素酶、cip、酯酶、棒曲霉素、木质素分解酶、氧化还原酶、果胶酶、蛋白酶和膨胀素。

段落[223].根据段落[222]所述的方法,其中所述纤维素酶是选自内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶的一种或多种酶。

段落[224].根据段落[222]所述的方法,其中所述半纤维素酶是选自木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶的一种或多种酶。

生物材料保藏

根据布达佩斯条约的规定,下列生物材料已经保藏在澳大利亚维多利亚州国家计量研究所,并具有以下登录号:

该菌株于下述条件下保藏:确保在本专利申请未决期间,由专利与商标委员依据37c.f.r.§1.14和35u.s.c.§122授权的人能够获得该培养物。这些保藏物代表所保藏菌株的基本上纯的培养物。需要按一些国家的国外专利法要求提供保藏物,在这些国家提交该主题申请的副本,或其后续文本。然而应理解,保藏物的可用性不构成将本发明主题用于由政府行为批准的专利权的实践的许可。

本文描述和要求保护的本发明不限于本文披露的具体方面的范围,因为这些方面旨在作为本发明若干方面的说明。任何等同方面旨在处于本发明的范围之内。实际上,除了本文所示和描述的那些之外,本发明的各种修改对于本领域的技术人员会从前述说明变得清楚。此类修改也旨在落入所附权利要求的范围内。在冲突的情况下,以包括定义的本披露为准。所有参考文献针对描述通过引用具体结合。

提供以下实例以说明本发明的某些方面,但不旨在以任何方式限制所要求保护的本发明的范围。

实例

实例1:肽摄取

在玉米醪乙醇发酵过程中,在24小时(相对于时间0小时)处测定菌株mbg4994(其包含fotx和fot2基因的表达盒;并根据美国专利号8,257,959所述的育种程序制备)相对于ethanol(fermentis/lesaffre,美国)的肽摄取。使用amp(可从诺维信公司商购的含有α-淀粉酶和蛋白酶的酶)在乙醇工厂中工业上生产玉米醪。在含有50克接种有1千万个细胞/g并加入葡糖淀粉酶的混合物的玉米醪的125ml烧瓶中进行发酵。玉米醪中不加入尿素。将试管在32℃下孵育。图1显示,与ethanol相比,mbg4994的三肽和四肽摄取的显著改善。

实例2:酵母菌株中转运蛋白基因的缺失

该实例描述了酵母菌株的构建,该酵母菌株含有编码转运蛋白的基因或其他参与氮代谢的基因的缺失。首先,将原间隔序列添加到crispr/cas9基础载体中,以将双链断裂引导至目的基因座。然后将通过添加原间隔子产生的质粒与修复dna一起转化到酵母中。该修复dna与修复dna的5’端的目的基因的起始密码子的5’区域同源,并且与修复dna的3’端的目的基因的终止密码子的3’区域同源。因此,质粒载体中编码的cas9蛋白基于与目的基因座的原间隔序列的同源性切割所需的dna,然后修复dna用缺少目的基因的编码区的dna修复切口,导致缺失目的基因。

所用的crispr/cas9基础载体是pmbin369(参见图6):酵母附加型质粒,其包含用于在酵母中选择的诺尔丝菌素抗性标记,cas9-nls的表达盒以及trna启动子和结构性crrna编码序列之间的pmei限制位点。为了靶向被cas9切割的基因,对于每个目的基因,发现了与ngg序列相邻的原间隔子。获得了线性寡核苷酸,其包含与pmbin369中pmei位点的5’同源的dna序列(5-attcccagctcgcccc-3’;seqidno:296),如表3所示的原间隔子序列和与pmbin369中pmei位点的3’同源的dna序列(5-gttttagagctagaaa-3’;seqidno:297)。然后根据制造商的说明,使用hifidnaassemblymastermix(新英格兰实验室(newenglandbiolabs))将线性单链寡核苷酸添加到pmei消化的pmbin369中。

为了靶向每个目的基因的缺失,设计了修复寡核苷酸以去除目的基因的整个开放阅读框。修复寡核苷酸中的一种位于目的基因的正向方向,并包含目标基因5’端的45个碱基,终止于目的基因的atg起始密码子前的核苷酸,直接与目的基因3’端的45个碱基融合,起始于目的基因的终止密码子的3’核苷酸。另一种修复寡核苷酸是正向修复寡核苷酸的反向互补序列。所用修复寡核苷酸的序列可在表4中找到。在用于酵母转化之前,通过将两种寡核苷酸混合在一起,将混合物加热至98℃,然后缓慢冷却至室温,以使寡核苷酸退火来将目的基因的两种寡核苷酸退火成双链修复dna。

为了产生具有目的基因缺失的期望的酵母菌株,按照酵母电穿孔方案(参见,thompson等人yeast[酵母].1998年4月30日;14(6):565-71),将表3所示的crispr/cas9质粒和适当的修复dna转化到目的酵母菌株中。在ypd+clonnat上选择转化体以选择含有crispr/cas9质粒的转化体。将单个转化体菌落挑到新的ypd+clonat平板上,然后使用pcr用基因座特异性引物筛选目的基因的缺失。

表3.

表4.

实例3:已经含有一个或多个缺失基因的酵母菌株中其他基因的缺失

该实例描述了酵母菌株中编码转运蛋白的额外基因或参与氮代谢的其他基因的缺失,所述酵母菌株包含编码转运蛋白的基因或参与氮代谢的其他基因的现有缺失。

为了从实例2中构建的缺失菌株中去除crispr/cas9质粒,将目的酵母菌株在ypd平板上进行单菌落划线。一旦形成菌落,就挑出一些,同时将其贴到ypd平板和ypd+clonnat平板上。选择在ypd上生长但在ypd+clonnat上不能生长的分离菌落,因为在ypd+clonnat上缺乏生长表明crispr/cas9质粒已经丢失。

然后,将刚刚描述的缺失菌株用新的crispr/cas9质粒和退火的修复寡核苷酸进行转化,并按照实例2中的描述分离出正确缺失的分离物。

反复使用这个过程;例如,如实例2中所述,将含有三个缺失的菌株转化三次以缺失基因,其中两个插入的质粒去除步骤。

实例4:将转运蛋白基因重组添加到酿酒酵母中

以下实例描述了酵母菌株的构建,所述酵母菌株包含fot2或fotx的表达盒,或同时包含fot2和fotx基因的表达盒。从酵母菌株mbg4994(单独或成对)pcr扩增fot基因,然后整合到酿酒酵母菌株ethanol的x-3基因座(如mikkelsen等人2012所述)中或整合到具有opt1δopt2δygl114wδ的ethanol衍生菌株的x-3基因座中。

为了从mbg4994扩增每个fot基因的启动子,编码区和终止子,设计pcr引物以从目的基因起始密码子5’的约1,000个碱基扩增到目的基因终止密码子3’的约500个碱基。将x-3基因座的侧翼dna添加到每个寡核苷酸的5’末端,以使扩增子靶向ethanol的x-3整合位点。所得的引物序列显示在表3中。为了制备fot2整合dna,按照制造商的说明,使用mbg4994基因组dna,引物1229007和1229008(表5)以及taqdna聚合酶(新英格兰实验室(newenglandbiolabs))进行pcr。为了制备fotx整合dna,按照制造商的说明,使用mbg4994基因组dna,引物1229009和1229010(表5)和taqdna聚合酶(新英格兰实验室(newenglandbiolabs))进行pcr。由于fot2和fotx在mbg4994基因组上彼此相邻,因此可以使用单个pcr以制备包含两种基因的扩增子:为了制备fot2+fotx整合dna,按照制造商的说明,使用mbg4994基因组dna,引物1229007和1229010(表5)和taqdna聚合酶(新英格兰实验室(newenglandbiolabs))进行pcr。

为了产生具有异位fot表达盒的所需的ethanol衍生的酵母菌株,按照酵母电穿孔方案,用上述含有fot的扩增子中的一种和pmcts442(用于酵母的具有含cas9-nls的质粒,对x-3具有特异性的指导rna,以及诺尔丝菌素选择标记的crispr/cas9质粒)转化酵母菌株ethanol在ypd+clonnat上选择转化体以选择含有crispr/cas9质粒的转化体。将单个转化体菌落挑到新的ypd+clonnat平板上,然后使用pcr用x-3基因座特异性引物筛选x-3的整合。

为了产生具有异位fot表达盒的所需的ethanolopt1δopt2δygl114wδ衍生的酵母菌株,按以上关于ethanol菌株的描述,将酵母菌株ethanolopt1δopt2δygl114wδ转化,并筛选转化体。

表5

为了确定酵母基因组中的fot2,fotx或fot2和fotx插入是否包含预期的dna序列,使用pcr扩增在x-3基因座整合的表达盒。使用的引物是1218018和1218019(表5)。对所得的pcr扩增产物进行dna测序。转化物不同于fot2(seqidno:163)和fotx(seqidno:164),如表6所示。

表6:在x-3基因座具有fot2,fotx或fot2和fotx表达盒的酵母菌株的蛋白质序列信息。变化前的前缀“het_”表明该变化是杂合的(变化发生在分离的二倍体转化物中的表达盒的两个拷贝中的一个上)。没有“het_”前缀的突变是纯合的。

实例5:使用通过液化共混物在工业上生产的玉米醪,在乙醇发酵期间,肽转运蛋白的缺失对乙醇和肽摄取的影响

该实例描述了对含有一个或多个编码转运蛋白或参与氨基氮摄取和代谢的转运蛋白的基因的缺失的酵母菌株的评估。特别是,在表7中列出的酵母菌株中,比较了用工业上制备的玉米醪进行乙醇发酵过程中对乙醇动力学,最终乙醇滴度和肽摄取的影响。

表7

种子培养物:

首先将冷冻保存的菌株培养物在液体ypd培养基(酵母提取物,10g;蛋白胨,20g;右旋糖,60g;溶于1l蒸馏水中)中生长。培养在无菌的125ml锥形瓶中无菌地进行,该锥形瓶装有50mlypd培养基并接种100μl冷冻保存的培养物。将烧瓶在振荡培养箱中于32℃在150rpm下振荡孵育16小时。将ypd生长的种子培养物(40ml)在22℃下以3,500rpm离心10分钟,并将所得的细胞沉淀洗涤并重悬于自来水中。在同时糖化和发酵(ssf)开始时,将重悬的细胞用于接种玉米醪。

玉米醪:

从乙醇工厂获得用amp(可从诺维信公司商购的含有α-淀粉酶和蛋白酶的酶)液化的工业上制备的玉米醪。通过mettler-toledohb43-s水分天平测定,该玉米醪包含34.5%的干燥固体。用3ppm的抗生素lactroltm补充该玉米醪,并在用于ssf之前将其ph值调节至5.0。

同时糖化和发酵(ssf):

所有发酵均在具有带0.5mm孔的螺帽的125ml挡板式烧瓶中进行。将烧瓶装有40-50g玉米醪,并以每克醪1千万个细胞用重悬的种子培养物进行接种。将市售的葡糖淀粉酶共混物(excell)以0.06重量%的干燥玉米固体添加到烧瓶中。发酵进行52小时,在此期间定期取样以分析发酵的玉米醪中的残留肽和乙醇。

肽分析:

将在发酵过程中从烧瓶中取出的样品(5g)转移到装有50μl40体积%h2so4的15ml锥形管中,涡旋,并在22℃下以3,500rpm离心10分钟。将所得的上清液通过0.2μm注射器过滤器进行过滤。在制备用于lcms分析之前,将过滤的样品储存在-20℃下。根据以下程序,使用accqtagtmultraderivatizationkit(沃特斯有限公司(watersinc))将肽衍生化:将10μl样品与70μlaccqtagultra硼酸盐缓冲液和20μlaccqtagultra试剂在微量离心管中混合。等待1分钟,然后添加10μl100mmdtt溶液并混合。在60摄氏度下孵育20分钟。冷却样品。加入5μl碘乙酰胺(500mm)。等待30分钟,使样品在黑暗中冷却。随后在反相lcmsorbitrap(thermoqexactive)上以正离子化扫描模式分析衍生样品。随后在配备有反相柱(acquityuplccshc18柱,1.7μm,2.1mmx150mm)的accelalc系统上分析样品,该系统与qexactivehybridquadrupole-orbitrap质谱仪(赛默飞世尔科技(thermoscientific))耦合。将质谱仪以正电离扫描模式设置为200至1500m/z。lc系统设置有两个流动相:含0.1%甲酸的mq水(a洗脱液)和含0.1%甲酸的乙腈(b洗脱液)。lc流速设置为0.25ml/min,在25分钟内运行从99%a洗脱液到65%a洗脱液的标准梯度。注释所有峰(保留时间和精确质量),并在lcms峰挑选软件(genedata)中整合。基于观察到的峰与a)具有理论肽的肽数据库或b)具有已知底物的可能水解产物的数据库之间的匹配来鉴定肽。

乙醇分析:

将在发酵过程中从烧瓶中取出的样品(5g)转移到装有50μl40体积%h2so4的15ml锥形管中,涡旋,并在22℃下以3,500rpm离心10分钟。将所得的上清液通过0.2μm注射器过滤器进行过滤。在进行hplc分析之前和期间,将过滤的样品储存在4℃下。使用配备有保护柱(bio-rad,micro-guardcationh+柱,30x4.6mm)和分析柱(bio-rad,aminexhpx-87h,300x7.8mm)的hplc(agilent1100/1200系列)机器,进行乙醇分析,使用5mm硫酸作为流动相,流速为0.8ml/min来进行乙醇分析。将柱温保持在65℃,并使用折射率检测器在55℃下检测乙醇。

结果:

图2显示了表7中列出的突变菌株及其相应的亲本菌株的玉米醪发酵的最终乙醇滴度。与mbg4994相比,mbg4994中fotx和fot2基因的缺失不影响4994δfot2δfotx的发酵性能,这可能是由于opt1,opt2和wgl114w编码的其他寡肽转运蛋白的补偿活性。与mbg4994的相应敲除菌株相比,编码寡肽转运蛋白的基因的三重缺失(opt1,opt2和ygl114w)对ethanol的乙醇发酵动力学和最终滴度具有更大的负面影响。如图2所示,4994δopt1δopt2δygl114w菌株的最终乙醇滴度高于erδopt1δopt2δygl114w。后两种菌株之间的动力学和最终乙醇滴度的差异归因于mbg4994和4994δopt1δopt2δygl114w中存在fotx和fot2基因。4994δopt1δopt2δygl114w菌株中fotx和fot2的额外缺失进一步减缓了发酵动力学,并将最终乙醇滴度降低至更接近erδopt1δopt2δygl114w菌株的水平,这表明fot2和fotx通过使酵母在玉米醪发酵期间接近和吸收更多的氨基氮而改善了发酵性能。

图3和4分别显示了使用工业上制备的玉米醪和表7中列出的菌株发酵29小时后残留的三肽和残留的四肽。发酵29小时后,与mbg4994相比,ethanol具有更多的残留三肽和四肽,这表明mbg4994在玉米醪发酵过程中可以摄取更多的三肽和四肽。mbg4994中fotx和fot2的缺失会导致增加的残留三肽和四肽,类似于ethanol的残留三肽和四肽水平。当缺失opt1,opt2和ygl114w基因时,mbg4994对三肽和四肽的摄取比ethanol受影响较小,这可能归因于fot2和fotx转运蛋白补偿了肽摄取活性。将fot2和fotx基因进一步缺失至mbg4994-三重敲除菌株(4994δopt1δopt2δygl114w)导致酵母菌株4994δopt1δopt2δygl114wδfot2δfotx表现出与ethanol三重缺失菌株(erδopt1δopt2δygl114w)相似的表型(即不能摄取三肽和四肽),这表明fot2和fotx基因改善了三肽和四肽的摄取,并使mbg4994接近扩大范围的肽,从而改善了发酵性能。

实例6:重组酵母菌株中真菌寡肽肽转运蛋白(fotx和fot2)的表达对乙醇发酵的影响

该实例描述了对含有一个或多个编码真菌寡肽转运蛋白或参与氨基氮摄取和代谢的fotx或fot2编码的转运蛋白的异源基因的重组酵母菌株的评估。特别地,在表8列出的酵母菌株中比较了用工业制备的玉米醪进行乙醇发酵期间对乙醇最终乙醇滴度的影响。

表8.

种子培养物:

首先将冷冻保存的菌株培养物在液体ypd培养基(酵母提取物,10g;蛋白胨,20g;右旋糖,60g;溶于1l蒸馏水中)中生长。培养在无菌的125ml锥形瓶中无菌地进行,该锥形瓶装有50mlypd培养基并接种100μl冷冻保存的培养物。将烧瓶在振荡培养箱中于32℃在150rpm下振荡孵育16小时。将ypd生长的种子培养物(40ml)在22℃下以3,500rpm离心10分钟,并将所得的细胞沉淀洗涤并重悬于自来水中。在同时糖化和发酵(ssf)开始时,将重悬的细胞用于接种玉米醪。

玉米醪:

从乙醇工厂获得用amp(可从诺维信公司商购的含有α-淀粉酶和蛋白酶的酶)液化的工业上制备的玉米醪。通过mettler-toledohb43-s水分天平测定,该玉米醪包含34.5%的干燥固体。用3ppm的抗生素lactroltm补充该玉米醪,并在用于ssf之前将其ph值调节至5.0。

同时糖化和发酵(ssf):

发酵在具有带0.5mm孔的螺帽的125ml挡板式烧瓶中进行。将烧瓶装有40-50g玉米醪,并以每克醪1千万个细胞用重悬的种子培养物进行接种。将市售的葡糖淀粉酶共混物(excell)以0.06重量%的干燥玉米固体添加到烧瓶中。发酵进行53小时,在此期间定期取样以分析发酵的玉米醪中的乙醇。

乙醇分析

将在发酵过程中从烧瓶中取出的样品(5g)转移到装有50μl40体积%h2so4的15ml锥形管中,涡旋,并在22℃下以3,500rpm离心10分钟。将所得的上清液通过0.2μm注射器过滤器进行过滤。在进行hplc分析之前和期间,将过滤的样品储存在4℃下。使用配备有保护柱(bio-rad,micro-guardcationh+柱,30x4.6mm)和分析柱(bio-rad,aminexhpx-87h,300x7.8mm)的hplc(agilent1100/1200系列)机器,进行乙醇分析,使用5mm硫酸作为流动相,流速为0.8ml/min来进行乙醇分析。将柱温保持在65℃,并使用折射率检测器在55℃下检测乙醇。

结果:

图5显示了工业上制备的玉米醪通过表8中列出的突变菌株及其相应的亲本菌株发酵53小时后的最终乙醇滴度。mbg4994产生的乙醇滴度比ethanol更高,并在ethanol中表达fotx或fot2导致比ethanol亲本菌株更高的乙醇滴度,这表明fotx或fot2的表达改善玉米醪乙醇发酵过程中酵母的性能。

实例7:酵母对氨基氮的有效利用使得玉米醪发酵中尿素显著减少而不影响乙醇产量

该实例描述了对在没有任何蛋白酶下,利用不同外源氮(即尿素)浓度制备的玉米醪发酵中,与ethanol(其缺乏fotx和fot2的表达)相比,酵母菌株mbg4994(其表达fotx和fot2)的评估。特别地,研究了有限的氮利用率对玉米醪发酵中最终乙醇滴度的影响。

种子培养物:

首先将冷冻保存的菌株培养物在液体ypd培养基(酵母提取物,10g;蛋白胨,20g;右旋糖,60g;溶于1l蒸馏水中)中生长。培养在无菌的125ml锥形瓶中无菌地进行,该锥形瓶装有50mlypd培养基并接种100μl冷冻保存的培养物。将烧瓶在振荡培养箱中于32℃在150rpm下振荡孵育16小时。将ypd生长的种子培养物(40ml)在22℃下以3,500rpm离心10分钟,并将所得的细胞沉淀洗涤并重悬于自来水中。在同时糖化和发酵(ssf)开始时,将重悬的细胞用于接种玉米醪。

玉米醪:

从乙醇工厂获得用amp(含有α-淀粉酶和蛋白酶的市售液化酶)或lph(含有α-淀粉酶并不含有蛋白酶的市售液化酶)液化的工业上制备的玉米醪样品。通过mettler-toledohb43-s水分天平测定,该玉米醪样品包含34%-35%的干燥固体。用2ppm的抗生素lactroltm补充该玉米醪,并在用于ssf之前将其ph值调节至5.0。使用lph(此处称为lph)制备的玉米醪用0、200、400和800ppm尿素增强,而使用amp制备的玉米醪未补充任何尿素。

同时糖化和发酵(ssf):

所有发酵均在具有带0.5mm孔的盖的15ml翻盖式试管中进行。将试管装有4-5g玉米醪,并以每克醪1千万个细胞用重悬的种子培养物进行接种。将市售的葡糖淀粉酶共混物(excel)以0.04重量%的干燥玉米固体添加到烧瓶中。发酵进行68小时。发酵68小时后取样以分析发酵的玉米醪中的乙醇。

乙醇分析:

对于每个样品,将50μl40体积%h2so4添加到玉米醪中。将样品涡旋并在22℃下以3,500rpm离心10分钟。将所得的上清液通过0.2μm注射器过滤器进行过滤。在进行hplc分析之前和期间,将过滤的样品储存在4℃下。使用配备有保护柱(bio-rad,micro-guardcationh+柱,30x4.6mm)和分析柱(bio-rad,aminexhpx-87h,300x7.8mm)的hplc(agilent1100/1200系列)机器,进行乙醇分析,使用5mm硫酸作为流动相,流速为0.8ml/min来进行乙醇分析。将柱温保持在65℃,并使用折射率检测器在55℃下检测乙醇。

结果:

图7显示了具有不同尿素浓度的玉米醪发酵68小时后,ethanol和mbg4994的最终乙醇滴度。结果表明,mbg4994乙醇产率并未因尿素减少而如ethanol一样受到显著影响。与ethanol相比,mbg4994所需的尿素减少了多达50%就能达到最大乙醇滴度。与ethanol相比,在低尿素浓度下的较高乙醇产率表明mbg4994中的fot基因允许接近扩大范围的氨基氮。

pct/ro/134表

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1