β-葡糖苷酶及其用途的制作方法

文档序号:16044817发布日期:2018-11-24 10:46阅读:479来源:国知局

本申请涉及具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸。本申请还包括包含所述多核苷酸的核酸构建体、载体和宿主细胞。本申请还涉及生产所述多肽的方法以及使用所述多肽的方法。

背景技术

碳水化合物组成地球上最丰量的有机化合物。然而,许多这类碳水化合物隐蔽在复杂聚合物中,包括淀粉和已知为木质纤维素的碳水化合物与木质素的集合。木质纤维素的主要碳水化合物组分是纤维素、半纤维素和果胶。这些复杂的聚合物通常被统称为木质纤维素。

从由于opec减少石油输出而导致石油危机爆发的20世纪70年代开始,木质纤维素生物质成为糖的生物转化吸引了研究人员强烈的注意力,所述糖随后被发酵产生醇,作为液体燃料的替代品。在过去二十年间,乙醇已被广泛使用,在美国作为与汽油的10%的掺合物,或在巴西作为车辆的纯燃料。更近期,实现了e85(85%乙醇掺合物)的使用,特别是用于清洁城市应用。

生物燃料的重要性将会随着油价的提高及其来源的逐渐耗尽而提高。另外,可发酵糖被用于生产塑料、聚合物和其他基于生物的制品,并且预期这一工业将大幅增长,从而提高对丰富的低成本可发酵糖的需求,所述可发酵糖可以被用作原料来代替基于石油的原料。

大量碳水化合物的隐蔽提供了糖(五碳糖以及六碳糖)形式的大量潜在的能量来源,所述糖能够被用于大量工业方法。然而,这些碳水化合物的大量能源潜力目前利用不足,因为糖封闭在复杂聚合物中并因此不容易进行发酵。

无论何种纤维素原料,酶的成本和水解效率是限制生物质生物转化方法商业化的主要因素。微生物生产的酶的生产成本与产酶菌株的生产力、酶的比活性、酶的作用模式和发酵液中最终的活性产率密切相关。

尽管过去几十年为了理解酶促木质纤维素生物质降解和纤维素酶生产而进行了持续的研究,但是仍然期望开发新的有高度活性的纤维素酶。

本申请满足了这种需求,因为其提供了包含β-葡糖苷酶活性的新多肽和编码该多肽的多核苷酸。

概述

本申请涉及变体多肽,其在对应于seqidno:2的多肽的第27、105、358、432、452、491、641、686、691、696、709、729、758、760和819位的一个或多个位置处包含替换。在一个实施方式中,所述变体多肽具有β-葡糖苷酶活性。

本申请涉及本文所述的变体多肽,其是亲本多肽的变体,所述亲本多肽具有β-葡糖苷酶活性并且与seqidno:2的多肽具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。

本申请涉及本文所述的变体多肽,其与seqidno:2的多肽具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。

本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第27位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第105位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第358位的位置被替换为a。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第358位的位置被替换为s。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第432位的位置被替换为p。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第452位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第491位的位置被替换为h。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第641位的位置被替换为f。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第686位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第691位的位置被替换为f。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第696位的位置被替换为q。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第709位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第729位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第758位的位置被替换为m。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第760位的位置被替换为i。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第819位的位置被替换为s。本申请还涉及本文所述的变体多肽,其包含这些替换中的一个或多个。

本申请涉及本文所述的变体多肽,其包含p27c替换。本申请涉及本文所述的变体多肽,其包含a105c替换。本申请涉及本文所述的变体多肽,其包含d358a替换。本申请涉及本文所述的变体多肽,其包含d358s替换。本申请涉及本文所述的变体多肽,其包含s432p替换。本申请涉及本文所述的变体多肽,其包含f452c替换。本申请涉及本文所述的变体多肽,其包含q491h替换。本申请涉及本文所述的变体多肽,其包含y641f替换。本申请涉及本文所述的变体多肽,其包含a686c替换。本申请涉及本文所述的变体多肽,其包含y691f替换。本申请涉及本文所述的变体多肽,其包含e696q替换。本申请涉及本文所述的变体多肽,其包含t709c替换。本申请涉及本文所述的变体多肽,其包含p729c替换。本申请涉及本文所述的变体多肽,其包含a758m替换。本申请涉及本文所述的变体多肽,其包含v760i替换。本申请涉及本文所述的变体多肽,其包含n819s替换。

本申请还涉及编码本文所述的变体多肽的多核苷酸。

本申请还涉及包含本文所述的多核苷酸的核酸构建体或载体。

本申请还涉及包含本文所述的多核苷酸或本文所述的核酸构建体或载体的宿主细胞。所述宿主细胞可以是真菌细胞。

本申请还涉及生产本文所述的变体多肽的方法,所述方法包括以下步骤:(a)在有助于生产变体多肽的条件下培养本文所述的宿主细胞,和(b)任选地,回收所述变体多肽。

本申请还涉及组合物,所述组合物包含(i)本文所述的变体多肽,和(ii)纤维素酶和/或半纤维素酶和/或果胶酶。所述纤维素酶可选自溶解性多糖单加氧酶(lyticpolysaccharidemonooxygenase)、纤维二糖水解酶i、纤维二糖水解酶ii、内切-β-1,4-葡聚糖酶、β-葡糖苷酶和β-(1,3)(1,4)-葡聚糖酶或其任何组合,所述半纤维素酶可选自内切木聚糖酶、β-木糖苷酶、α-l-阿拉伯呋喃糖苷酶、α-d-葡糖醛酸酶、乙酰木聚糖酯酶、阿魏酰酯酶、香豆酰酯酶、α-半乳糖苷酶、β-半乳糖苷酶、β-甘露聚糖酶、β-甘露糖苷酶或其任何组合。该组合物可以是完整发酵液。

本申请还涉及处理包含纤维素和/或半纤维素的底物的方法,该方法包括使底物与本文所述的变体多肽和/或本文所述的组合物接触的步骤。

本申请还涉及生产发酵产物的方法,该方法包括以下步骤:(a)使用本文所述的处理包含纤维素和/或半纤维素的底物的方法处理底物,和(b)发酵所得材料以生产发酵产物。

附图简介

图1:用于在a.niger中表达基因的pgbtop图谱。示出了从葡糖淀粉酶启动子(pglaa)表达的感兴趣的基因(goi)。另外,示出了表达盒的葡糖淀粉酶侧翼(3'-glaa)。在本申请中,感兴趣的基因是本文所述的多肽的编码序列。

详细说明

在本说明书和所附权利要求书通篇中,词语“包含”、“包括”和“具有”以及变化形式应被解释为包含性的。也就是说,在上下文允许时,这些词语旨在表达可能包括未明确指出的其他要素或整体。

不使用数量词修饰时在本文中指代一个/种或多于一个/种(即一个/种或至少一个/种)的语法对象。举例来说,“要素”可意指一个/种要素或多于一个/种要素。

术语“来源于”也涵盖术语“源自”、“获自”、“能够获自”、“分离自”和“由……产生”,其通常表示一种特定材料来源于另一种特定材料或者具有可以参照另一种特定材料描述的特征。在本文中使用时,“来源于”微生物的物质(例如,多核苷酸或多肽)优选表示该物质对于该微生物是原生的。

本申请涉及变体多肽,其在对应于seqidno:2的多肽的第27、105、358、432、452、491、641、686、691、696、709、729、758、760和819位的一个或多个位置处包含替换。在一个实施方式中,所述变体多肽具有β-葡糖苷酶活性。本申请涉及变体多肽,其在对应于seqidno:2的多肽的第27+729、105+452、358、432、491、641、686+709、691、696、758、760和819位的一个或多个位置处包含替换。在一个实施方式中,所述变体多肽具有β-葡糖苷酶活性。

本申请涉及本文所述的变体多肽,其是亲本多肽的变体,所述亲本多肽具有β-葡糖苷酶活性并且与seqidno:2的多肽具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。

本申请涉及本文所述的变体多肽,其与seqidno:2的多肽具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一个实施方式中,本文所述的变体多肽与seqidno:2的多肽具有少于100%的序列同一性。

本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第27位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第105位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第358位的位置被替换为a。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第358位的位置被替换为s。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第432位的位置被替换为p。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第452位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第491位的位置被替换为h。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第641位的位置被替换为f。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第686位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第691位的位置被替换为f。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第696位的位置被替换为q。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第709位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第729位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第758位的位置被替换为m。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第760位的位置被替换为i。本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第819位的位置被替换为s。本申请还涉及本文所述的变体多肽,其包含这些替换中的一个或多个。例如,本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第27位的位置被替换为c,并且对应于seqidno:2的多肽的第729位的位置被替换为c。例如,本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第686位的位置被替换为c,并且对应于seqidno:2的多肽的第709位的位置被替换为c。例如,本申请涉及本文所述的变体多肽,其中对应于seqidno:2的多肽的第105位的位置被替换为c,并且对应于seqidno:2的多肽的第452位的位置被替换为c。

本申请涉及本文所述的变体多肽,其包含p27c替换。本申请涉及本文所述的变体多肽,其包含a105c替换。本申请涉及本文所述的变体多肽,其包含d358a替换。本申请涉及本文所述的变体多肽,其包含d358s替换。本申请涉及本文所述的变体多肽,其包含s432p替换。本申请涉及本文所述的变体多肽,其包含f452c替换。本申请涉及本文所述的变体多肽,其包含q491h替换。本申请涉及本文所述的变体多肽,其包含y641f替换。本申请涉及本文所述的变体多肽,其包含a686c替换。本申请涉及本文所述的变体多肽,其包含y691f替换。本申请涉及本文所述的变体多肽,其包含e696q替换。本申请涉及本文所述的变体多肽,其包含t709c替换。本申请涉及本文所述的变体多肽,其包含p729c替换。本申请涉及本文所述的变体多肽,其包含a758m替换。本申请涉及本文所述的变体多肽,其包含v760i替换。本申请涉及本文所述的变体多肽,其包含n819s替换。

本申请还涉及本文所述的变体多肽,其包含这些替换中的一个或多个。例如,本申请涉及本文所述的变体多肽,其包含p27c和p729c替换。例如,本申请还涉及本文所述的变体多肽,其包含a686c和t709c替换。例如,本申请还涉及本文所述的变体多肽,其包含a105c和f452c替换。

本申请涉及本文所述的变体多肽,其与其亲本多肽的氨基酸序列另外有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65个氨基酸的不同。在一个实施方式中,亲本多肽具有β-葡糖苷酶活性并且与seqidno:2的多肽具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。

在一个实施方式中,亲本多肽是真菌多肽。在一个实施方式中,亲本多肽是真菌β-葡糖苷酶。在一个实施方式中,亲本多肽是gh3β-葡糖苷酶。在一个实施方式中,亲本多肽是rasamsoniaβ-葡糖苷酶。在一个实施方式中,亲本多肽是rasamsoniaemersoniiβ-葡糖苷酶。在一个实施方式中,亲本多肽包含seqidno:2的氨基酸序列。在一个实施方式中,亲本多肽由seqidno:2的氨基酸序列组成。seqidno:2的氨基酸序列公开了野生型(即未突变的)rasamsoniaemersoniiβ-葡糖苷酶的氨基酸序列。rasamsoniaemersoniiβ-葡糖苷酶也可被称为talaromycesemersoniiβ-葡糖苷酶。seqidno:2的氨基酸序列与wo2011/098577中公开的seqidno:5的氨基酸序列相同。本文所述的变体多肽可以是这种β-葡糖苷酶的变体。

此外,本申请提供了编码本文所述的变体多肽的多核苷酸。seqidno:1的核苷酸序列编码seqidno:2的氨基酸序列。seqidno:1的核苷酸序列与wo2011/098577中公开的seqidno:6的核苷酸序列相同。wo2011/098577中公开的seqidno:6的核苷酸序列编码wo2011/098577中公开的seqidno:5的氨基酸序列。

本申请还提供了包含本文所述的多核苷酸的核酸构建体或载体。

包含本文所述的多核苷酸或本文所述的核酸构建体或载体的宿主细胞也是本申请的一部分。在一个实施方式中,本文所述的宿主细胞是真菌细胞,优选选自acremonium,agaricus,aspergillus,aureobasidium,chrysosporium,coprinus,cryptococcus,filibasidium,fusarium,humicola,magnaporthe,mucor,myceliophthora,neocallimastix,neurospora,paecilomyces,penicillium,piromyces,panerochaete,pleurotus,schizophyllum,talaromyces,rasamsonia,saccharomyces,thermoascus,thielavia,tolypocladium和trichoderma属的真菌细胞。在本文所述的宿主细胞中,可以全部或部分缺失、敲除或破坏一个或多个基因。

本申请还提供了生产本文所述的变体多肽的方法,所述方法包括在允许变体多肽表达的条件下培养本文所述的宿主细胞和任选地回收表达的变体多肽。本申请还涉及生产本文所述的变体多肽的方法,所述方法包括以下步骤:(a)在有益于生产变体多肽的条件下培养本文所述的宿主细胞,和(b)任选地,回收所述变体多肽。

此外,本申请还提供了组合物,所述组合物包含(i)本文所述的变体多肽,和(ii)纤维素酶和/或半纤维素酶和/或果胶酶。在一个实施方式中,纤维素酶选自溶解性多糖单加氧酶、纤维二糖水解酶i、纤维二糖水解酶ii、内切-β-1,4-葡聚糖酶、β-葡糖苷酶和β-(1,3)(1,4)-葡聚糖酶或其任何组合,半纤维素酶选自内切木聚糖酶、β-木糖苷酶、α-l-阿拉伯呋喃糖苷酶、α-d-葡糖醛酸酶、阿魏酰酯酶、香豆酰酯酶、α-半乳糖苷酶、β-半乳糖苷酶、β-甘露聚糖酶、β-甘露糖苷酶或其任何组合。

本文所述的变体多肽可用于如本文更详细描述的工业方法中。

另外,本申请提供了处理包含纤维素和/或半纤维素的底物的方法,该方法包括使底物与本文所述的变体多肽和/或本文所述的组合物接触的步骤。在一个实施方式中,底物是纤维素材料。在另一个实施方式中,底物是木质纤维素材料。在任一情况下,处理都导致糖的产生。

本申请的另一个方面涉及本文所述的变体多肽和/或本文所述的组合物用于从木质纤维素材料生产糖的用途。

本申请还提供了从纤维素材料生产糖的方法,该方法包括使纤维素材料与本文所述的变体多肽和/或本文所述的组合物接触并从纤维素材料生产糖。

本申请还提供了从木质纤维素材料生产糖的方法,该方法包括使木质纤维素材料与本文所述的变体多肽和/或本文所述的组合物接触并从木质纤维素材料生产糖。

所产生的糖可以用于本文所述的发酵方法中。因此,本申请提供了生产发酵产物的方法,该方法包括以下步骤:使用上述方法处理底物,和发酵所得物质以产生发酵产物。所述所得物质可以包含糖。

本文所述的多肽或本文所述的组合物还可用于例如食品的制备,去污剂的制备,动物饲料的制备,纸浆的处理,造纸或者织物或纺织品的制备或其清洁中。

本申请还提供了通过使植物材料或木质纤维素材料与本文所述的变体多肽和/或本文所述的组合物接触能够获得的材料;包含本文所述的变体多肽和/或本文所述的组合物的食物或饲料;以及包含本文所述的多核苷酸、变体多肽、核酸构建体、载体或宿主细胞的植物或其部分。

如果本文所述的变体多肽在对应于seqidno:2的多肽的第27、105、358、432、452、491、641、686、691、696、709、729、758、760和819位的一个或多个位置处包含替换,则这意味着变体多肽在这些位置中的一个包含替换,但也包括在这些位置中的多于一个包含替换的变体多肽。例如,本文所述的变体多肽可以在对应于seqidno:2的多肽的第691、758和819位的位置处包含替换。所列位置的任何组合都是可行的。这样的组合可具有协同效应。

如上所述,当本文所述的变体多肽与其亲本多肽的氨基酸序列另外有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65个氨基酸的不同时,这些另外不同的氨基酸不选自对应于seqidno:2多肽的第27、105、358、432、452、491、641、686、691、696、709、729、758、760和819位的位置。

在一个实施方式中,本申请涉及在对应于seqidno:2的第27位的位置处包含替换的变体多肽,其中所述多肽具有β-葡糖苷酶活性并且所述多肽与亲本β-葡糖苷酶的氨基酸序列具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一个实施方式中,多肽在第27位处包含成为c的替换。在一个实施方式中,变体多肽包含p27c替换。

在一个实施方式中,本申请涉及在对应于seqidno:2的第105位的位置处包含替换的变体多肽,其中所述多肽具有β-葡糖苷酶活性并且所述多肽与亲本β-葡糖苷酶的氨基酸序列具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一个实施方式中,多肽在第105位处包含成为c的替换。在一个实施方式中,变体多肽包含a105c替换。

在一个实施方式中,本申请涉及在对应于seqidno:2的第358位的位置处包含替换的变体多肽,其中所述多肽具有β-葡糖苷酶活性并且所述多肽与亲本β-葡糖苷酶的氨基酸序列具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一个实施方式中,多肽在第358位处包含成为a的替换。在一个实施方式中,变体多肽包含d358a替换。在一个实施方式中,多肽在第358位处包含成为s的替换。在一个实施方式中,变体多肽包含d358s替换。

在一个实施方式中,本申请涉及在对应于seqidno:2的第432位的位置处包含替换的变体多肽,其中所述多肽具有β-葡糖苷酶活性并且所述多肽与亲本β-葡糖苷酶的氨基酸序列具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一个实施方式中,多肽在第432位处包含成为p的替换。在一个实施方式中,变体多肽包含s432p替换。

在一个实施方式中,本申请涉及在对应于seqidno:2的第452位的位置处包含替换的变体多肽,其中所述多肽具有β-葡糖苷酶活性并且所述多肽与亲本β-葡糖苷酶的氨基酸序列具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一个实施方式中,多肽在第452位处包含成为c的替换。在一个实施方式中,变体多肽包含f452c替换。

在一个实施方式中,本申请涉及在对应于seqidno:2的第491位的位置处包含替换的变体多肽,其中所述多肽具有β-葡糖苷酶活性并且所述多肽与亲本β-葡糖苷酶的氨基酸序列具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一个实施方式中,多肽在第491位处包含成为h的替换。在一个实施方式中,变体多肽包含q491h替换。

在一个实施方式中,本申请涉及在对应于seqidno:2的第641位的位置处包含替换的变体多肽,其中所述多肽具有β-葡糖苷酶活性并且所述多肽与亲本β-葡糖苷酶的氨基酸序列具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一个实施方式中,多肽在第641位处包含成为f的替换。在一个实施方式中,变体多肽包含y641f替换。

在一个实施方式中,本申请涉及在对应于seqidno:2的第686位的位置处包含替换的变体多肽,其中所述多肽具有β-葡糖苷酶活性并且所述多肽与亲本β-葡糖苷酶的氨基酸序列具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一个实施方式中,多肽在第686位处包含成为c的替换。在一个实施方式中,变体多肽包含a686c替换。

在一个实施方式中,本申请涉及在对应于seqidno:2的第691位的位置处包含替换的变体多肽,其中所述多肽具有β-葡糖苷酶活性并且所述多肽与亲本β-葡糖苷酶的氨基酸序列具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一个实施方式中,多肽在第691位处包含成为f的替换。在一个实施方式中,变体多肽包含y691f替换。

在一个实施方式中,本申请涉及在对应于seqidno:2的第696位的位置处包含替换的变体多肽,其中所述多肽具有β-葡糖苷酶活性并且所述多肽与亲本β-葡糖苷酶的氨基酸序列具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一个实施方式中,多肽在第696位处包含成为q的替换。在一个实施方式中,变体多肽包含e696q替换。

在一个实施方式中,本申请涉及在对应于seqidno:2的第709位的位置处包含替换的变体多肽,其中所述多肽具有β-葡糖苷酶活性并且所述多肽与亲本β-葡糖苷酶的氨基酸序列具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一个实施方式中,多肽在第709位处包含成为c的替换。在一个实施方式中,变体多肽包含t709c替换。

在一个实施方式中,本申请涉及在对应于seqidno:2的第729位的位置处包含替换的变体多肽,其中所述多肽具有β-葡糖苷酶活性并且所述多肽与亲本β-葡糖苷酶的氨基酸序列具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一个实施方式中,多肽在第729位处包含成为c的替换。在一个实施方式中,变体多肽包含p729c替换。

在一个实施方式中,本申请涉及在对应于seqidno:2的第758位的位置处包含替换的变体多肽,其中所述多肽具有β-葡糖苷酶活性并且所述多肽与亲本β-葡糖苷酶的氨基酸序列具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一个实施方式中,多肽在第758位处包含成为m的替换。在一个实施方式中,变体多肽包含a758m替换。

在一个实施方式中,本申请涉及在对应于seqidno:2的第760位的位置处包含替换的变体多肽,其中所述多肽具有β-葡糖苷酶活性并且所述多肽与亲本β-葡糖苷酶的氨基酸序列具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一个实施方式中,多肽在第760位处包含成为i的替换。在一个实施方式中,变体多肽包含v760i替换。

在一个实施方式中,本申请涉及在对应于seqidno:2的第819位的位置处包含替换的变体多肽,其中所述多肽具有β-葡糖苷酶活性并且所述多肽与亲本β-葡糖苷酶的氨基酸序列具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一个实施方式中,多肽在第819位处包含成为s的替换。在一个实施方式中,变体多肽包含n819s替换。

在一个实施方式中,变体多肽与亲本β-葡糖苷酶的氨基酸序列具有小于100%的序列同一性。在一个实施方式中,亲本β-葡糖苷酶的氨基酸序列包含seqidno:2。在一个实施方式中,亲本β-葡糖苷酶的氨基酸序列由seqidno:2组成。

本申请还涉及在seqidno:4的第27位处包含替换的变体多肽。在一个实施方式中,变体多肽在seqidno:4的第27位处包含成为c的替换。在一个实施方式中,变体多肽在seqidno:4中包含p27c替换。该变体多肽是在对应于seqidno:2的第27位的位置处包含替换的变体多肽的实例。

本申请还涉及在seqidno:4的第105位处包含替换的变体多肽。在一个实施方式中,变体多肽在seqidno:4的第105位处包含成为c的替换。在一个实施方式中,变体多肽在seqidno:4中包含a105c替换。该变体多肽是在对应于seqidno:2的第105位的位置处包含替换的变体多肽的实例。

本申请还涉及在seqidno:4的第358位处包含替换的变体多肽。在一个实施方式中,变体多肽在seqidno:4的第358位处包含成为a的替换。在一个实施方式中,变体多肽在seqidno:4中包含d358a替换。该变体多肽是在对应于seqidno:2的第358位的位置处包含替换的变体多肽的实例。

本申请还涉及在seqidno:4的第358位处包含替换的变体多肽。在一个实施方式中,变体多肽在seqidno:4的第358位处包含成为s的替换。在一个实施方式中,变体多肽在seqidno:4中包含d358s替换。该变体多肽是在对应于seqidno:2的第358位的位置处包含替换的变体多肽的实例。

本申请还涉及在seqidno:4的第432位处包含替换的变体多肽。在一个实施方式中,变体多肽在seqidno:4的第432位处包含成为p的替换。在一个实施方式中,变体多肽在seqidno:4中包含s432p替换。该变体多肽是在对应于seqidno:2的第432位的位置处包含替换的变体多肽的实例。

本申请还涉及在seqidno:4的第452位处包含替换的变体多肽。在一个实施方式中,变体多肽在seqidno:4的第452位处包含成为c的替换。在一个实施方式中,变体多肽在seqidno:4中包含f452c替换。该变体多肽是在对应于seqidno:2的第452位的位置处包含替换的变体多肽的实例。

本申请还涉及在seqidno:4的第491位处包含替换的变体多肽。在一个实施方式中,变体多肽在seqidno:4的第491位处包含成为h的替换。在一个实施方式中,变体多肽在seqidno:4中包含q491h替换。该变体多肽是在对应于seqidno:2的第491位的位置处包含替换的变体多肽的实例。

本申请还涉及在seqidno:4的第642位处包含替换的变体多肽。在一个实施方式中,变体多肽在seqidno:4的第642位处包含成为f的替换。在一个实施方式中,变体多肽在seqidno:4中包含y642f替换。该变体多肽是在对应于seqidno:2的第641位的位置处包含替换的变体多肽的实例。

本申请还涉及在seqidno:4的第687位处包含替换的变体多肽。在一个实施方式中,变体多肽在seqidno:4的第687位处包含成为c的替换。在一个实施方式中,变体多肽在seqidno:4中包含a687c替换。该变体多肽是在对应于seqidno:2的第686位的位置处包含替换的变体多肽的实例。

本申请还涉及在seqidno:4的第692位处包含替换的变体多肽。在一个实施方式中,变体多肽在seqidno:4的第692位处包含成为f的替换。在一个实施方式中,变体多肽在seqidno:4中包含y692f替换。该变体多肽是在对应于seqidno:2的第691位的位置处包含替换的变体多肽的实例。

本申请还涉及在seqidno:4的第697位处包含替换的变体多肽。在一个实施方式中,变体多肽在seqidno:4的第697位处包含成为q的替换。在一个实施方式中,变体多肽在seqidno:4中包含e697q替换。该变体多肽是在对应于seqidno:2的第696位的位置处包含替换的变体多肽的实例。

本申请还涉及在seqidno:4的第710位处包含替换的变体多肽。在一个实施方式中,变体多肽在seqidno:4的第710位处包含成为c的替换。在一个实施方式中,变体多肽在seqidno:4中包含t710c替换。该变体多肽是在对应于seqidno:2的第709位的位置处包含替换的变体多肽的实例。

本申请还涉及在seqidno:4的第730位处包含替换的变体多肽。在一个实施方式中,变体多肽在seqidno:4的第730位处包含成为c的替换。在一个实施方式中,变体多肽在seqidno:4中包含p730c替换。该变体多肽是在对应于seqidno:2的第729位的位置处包含替换的变体多肽的实例。

本申请还涉及在seqidno:4的第759位处包含替换的变体多肽。在一个实施方式中,变体多肽在seqidno:4的第759位处包含成为m的替换。在一个实施方式中,变体多肽在seqidno:4中包含a759m替换。该变体多肽是在对应于seqidno:2的第758位的位置处包含替换的变体多肽的实例。

本申请还涉及在seqidno:4的第761位处包含替换的变体多肽。在一个实施方式中,变体多肽在seqidno:4的第761位处包含成为i的替换。在一个实施方式中,变体多肽在seqidno:4中包含v761i替换。该变体多肽是在对应于seqidno:2的第760位的位置处包含替换的变体多肽的实例。

本申请还涉及在seqidno:4的第820位处包含替换的变体多肽。在一个实施方式中,变体多肽在seqidno:4的第820位处包含成为s的替换。在一个实施方式中,变体多肽在seqidno:4中包含n820s替换。该变体多肽是在对应于seqidno:2的第819位的位置处包含替换的变体多肽的实例。

本申请还涉及在对应于seqidno:4的多肽的第27、105、358、432、452、491、642、687、692、697、710、730、759、761和820位的一个或多个位置处包含替换的变体多肽。在一个实施方式中,所述变体多肽具有β-葡糖苷酶活性。

本申请涉及本文所述的变体多肽,其是亲本多肽的变体,所述亲本多肽具有β-葡糖苷酶活性并且与seqidno:4的多肽具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。

本申请涉及本文所述的变体多肽,其与seqidno:4的多肽具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。

本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第27位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第105位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第358位的位置被替换为a。本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第358位的位置被替换为s。本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第432位的位置被替换为p。本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第452位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第491位的位置被替换为h。本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第642位的位置被替换为f。本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第687位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第692位的位置被替换为f。本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第697位的位置被替换为q。本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第710位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第730位的位置被替换为c。本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第759位的位置被替换为m。本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第761位的位置被替换为i。本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第820位的位置被替换为s。本申请还涉及本文所述的变体多肽,其包含这些替换中的一个或多个。例如,本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第27位的位置被替换为c,并且对应于seqidno:4的多肽的第730位的位置被替换为c。例如,本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第687位的位置被替换为c,并且对应于seqidno:4的多肽的第710位的位置被替换为c。例如,本申请涉及本文所述的变体多肽,其中对应于seqidno:4的多肽的第105位的位置被替换为c,并且对应于seqidno:4的多肽的第452位的位置被替换为c。

本申请涉及本文所述的变体多肽,其包含p27c替换。本申请涉及本文所述的变体多肽,其包含a105c替换。本申请涉及本文所述的变体多肽,其包含d358a替换。本申请涉及本文所述的变体多肽,其包含d358s替换。本申请涉及本文所述的变体多肽,其包含s432p替换。本申请涉及本文所述的变体多肽,其包含f452c替换。本申请涉及本文所述的变体多肽,其包含q491h替换。本申请涉及本文所述的变体多肽,其包含y642f替换。本申请涉及本文所述的变体多肽,其包含a687c替换。本申请涉及本文所述的变体多肽,其包含y692f替换。本申请涉及本文所述的变体多肽,其包含e697q替换。本申请涉及本文所述的变体多肽,其包含t710c替换。本申请涉及本文所述的变体多肽,其包含p730c替换。本申请涉及本文所述的变体多肽,其包含a759m替换。本申请涉及本文所述的变体多肽,其包含v761i替换。本申请涉及本文所述的变体多肽,其包含n820s替换。本申请还涉及本文所述的变体多肽,其包含这些替换中的一个或多个。例如,本申请涉及本文所述的变体多肽,其包含p27c和p730c替换。例如,本申请还涉及本文所述的变体多肽,其包含a687c和t710c替换。例如,本申请还涉及本文所述的变体多肽,其包含a105c和f452c替换。

本申请涉及本文所述的变体多肽,其与其亲本多肽的氨基酸序列另外有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65个氨基酸的不同。在一个实施方式中,亲本多肽具有β-葡糖苷酶活性并且与seqidno:4的多肽具有至少60%、至少65%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。

在一个实施方式中,亲本β-葡糖苷酶选自包含seqidno:2的氨基酸序列的多肽;包含seqidno:4的氨基酸序列的多肽;来自aspergillus、例如aspergillusoryzae的β-葡糖苷酶,例如wo02/095014中公开的β-葡糖苷酶;wo2008/057637中公开的具有β-葡糖苷酶活性的融合蛋白;来自aspergillus、例如aspergillusfumigatus的β-葡糖苷酶,例如wo2005/047499中的seqidno:2或wo2014/130812中的seqidno:5所公开的β-葡糖苷酶;aspergillusfumigatusβ-葡糖苷酶变体,例如wo2012/044915中公开的β-葡糖苷酶变体;具有以下替换的β-葡糖苷酶:f100d、s283g、n456e、f512y(使用wo2014/130812中的seqidno:5进行编号);来自aspergillus例如aspergillusaculeatus、aspergillusniger或aspergilluskawachi的β-葡糖苷酶;来自penicillium,例如penicilliumbrasilianum的β-葡糖苷酶,如wo2007/019442中的seqidno:2所公开的;来自trichoderma,例如trichodermareesei的β-葡糖苷酶,例如us6,022,725、us6,982,159、us7,045,332、us7,005,289、us2006/0258554、us2004/0102619中所述的β-葡糖苷酶;来自thielaviaterrestris的β-葡糖苷酶(参见wo2011/035029);和来自trichophaeasaccata的β-葡糖苷酶(参见wo2007/019442)。在一个实施方式中,亲本β-葡糖苷酶甚至可以是细菌β-葡糖苷酶。

在一个实施方式中,本文所述的变体多肽对高温的敏感性低于其亲本多肽(例如野生型多肽),因此具有比亲本多肽(例如野生型多肽)更高的热稳定性。“具有更高的热稳定性”意指:与亲本多肽相比,本文所述的变体多肽在热休克温度处理之后具有更高的余留催化活性。在处理条件下更高的稳定性可以通过测定水解反应时间(例如72小时)后多肽的余留催化活性来确定。最适温度是当在特定时间段内测量时多肽具有最佳活性时的水解温度。野生型多肽是例如包含seqidno:2的氨基酸序列的多肽或包含seqidno:4的氨基酸序列的多肽。

本申请提供了新颖的多肽,例如具有修饰(例如降解)碳水化合物材料的能力的酶。碳水化合物材料是包含一种或多种碳水化合物、由一种或多种碳水化合物组成或基本上由一种或多种碳水化合物组成的材料。本申请还提供了编码所述多肽的多核苷酸。在一个实施方式中,本文所述的变体多肽是分离的。在一个实施方式中,本文所述的变体多肽是酶。在一个实施方式中,本文所述的变体多肽是碳水化合物降解酶。在一个实施方式中,本文所述的变体多肽是碳水化合物水解酶。在一个实施方式中,本文所述的变体多肽包含β-葡糖苷酶活性。

在一个实施方式中,本文所述的变体多肽有利地包含一个或多个另外的替换,其中所述一个或多个另外的替换优选提供另外的效果,其甚至可以进一步改善本文所述的变体多肽的有利性质,或者可以为本文所述的变体多肽提供另外的有利特性。

在一个实施方式中,本文所述的变体多肽具有β-葡糖苷酶活性。在一个实施方式中,本文所述的变体多肽是β-葡糖苷酶。在一个实施方式中,本文所述的变体多肽是gh3β-葡糖苷酶。

β-葡糖苷酶(ec3.2.1.21)是能够催化末端、非还原性β-d-葡萄糖残基水解并释放β-d-葡萄糖的任何多肽。这种多肽可具有针对β-d-葡糖苷的广泛特异性,并且也可以水解以下一种或多种:β-d-半乳糖苷、α-l-阿拉伯糖苷、β-d-木糖苷或β-d-岩藻糖苷。这种酶也可以被称作苦杏仁苷酶、β-d-葡糖苷葡糖水解酶、纤维二糖酶或龙胆二糖酶。

“在对应于seqidno:y的多肽的第x位的位置处包含替换的变体多肽”是指由变体多肽的氨基酸序列与seqidno:y的多肽的氨基酸序列的氨基酸序列比对确定的位置x。这意味着关于seqidno:y的氨基酸序列中的第x位所述的特定替换可以在变体多肽的氨基酸序列中的不同位置处存在。例如,seqidno:2的氨基酸序列的第641位处的成为f的替换可以在变体多肽的氨基酸序列中具有不同的位置。例如,seqidno:2的氨基酸序列中的y641f替换对应于seqidno:4的氨基酸序列中的y642f突变。另外,变体多肽的亲本中的原始氨基酸可以不同来自seqidno:2的氨基酸序列中的原始氨基酸。变体多肽的亲本中对应于seqidno:2的氨基酸序列中的第641位的位置处的氨基酸可以不同于在seqidno:2的氨基酸序列中的第641位处发现的y。它可以是任何氨基酸(除f外)。可以通过将亲本多肽的氨基酸序列与seqidno:2进行比对来发现亲本多肽中待替换的氨基酸的位置和类型。可以使用clustalomega计算机程序(clustalomega计算机程序是一个多序列比对程序,其使用种子引导树和hmm谱-谱(hmmprofile-profile)技术来生成比对http://www.ebi.ac.uk/tools/msa/clustalo/)进行比对。

在一个实施方式中,与变体多肽的亲本多肽相比,本文所述的一个或多个替换提高了变体多肽的热稳定性。在一个实施方式中,与变体多肽的亲本多肽相比,本文所述的一个或多个替换提高了变体多肽的葡萄糖耐受性。在一个实施方式中,与变体多肽的亲本多肽相比,本文所述的一个或多个替换提高了变体多肽的热稳定性并提高了变体多肽的葡萄糖耐受性。

如上所述,本文所述的变体多肽优选为多肽,例如酶,更优选为碳水化合物降解酶和/或碳水化合物水解酶,最优选包含β-葡糖苷酶活性。本文所述的变体多肽可具有一种或多种替代性的和/或额外的活性,例如本文提到的其他氧化还原酶、转移酶、水解酶、裂解酶、异构酶或连接酶活性中的一种。

本申请提供了本文所述的变体多肽和包含本文所述的变体多肽的组合物在本文更详细描述的工业方法中的用途。

根据一个优选的实施方式,本文所述的变体多肽是“热稳定的”多肽。在另一个优选的实施方式中,本文所述的多核苷酸编码具有高热稳定性的本文所述的变体多肽,其在木质纤维素原料水解条件下更稳定。在本文中,“热稳定的”多肽意指:该多肽与热稳定性更低的多肽(例如不具有相应替换的多肽,即其亲本多肽)相比,在热休克温度处理后具有更高的残余催化活性。可以通过测定水解反应时间(例如72小时)后多肽的残余催化活性来确定工艺条件下的更高稳定性。

根据一个优选的实施方式,本文所述的变体多肽的最适ph介于ph2和ph8之间。优选地,所述多肽的最适ph为6或更低,5或更低,4.5或更低,4或更低,或甚至3.5或更低。优选地,多肽的最适ph为2或更高,优选2.5或更高。优选地,所述多肽的最适ph为3-5。所述最适ph是水解期间的ph,在该ph下,当在某一时间段内测量时,所述多肽具有最佳活性。

多核苷酸序列

本申请还涉及编码本文所述的变体多肽的多核苷酸。在一个实施方式中,本文所述的多核苷酸是分离的。

在一个实施方式中,本文所述的多核苷酸与seqidno:1的核苷酸序列具有至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%,至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%的序列同一性。

在一个实施方式中,本文所述的多核苷酸与seqidno:3的核苷酸序列具有至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%,至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%的序列同一性。

在一个实施方式中,本文所述的多核苷酸与seqidno:1的核苷酸序列具有小于100%的序列同一性。在一个实施方式中,本文所述的多核苷酸与seqidno:3的核苷酸序列具有小于100%的序列同一性。

可以使用标准分子生物学技术和本文提供的序列信息来分离本文所述的多核苷酸。例如,通过使用sambrook,j.,fritsh,e.f.和,t.molecularcloning:alaboratorymanual.,第2版,coldspringharborlaboratory,coldspringharborlaboratorypress,coldspringharbor,ny,1989中描述的标准杂交和克隆技术。

此外,可以使用基于多核苷酸序列中包含的序列信息设计的合成寡核苷酸引物,通过聚合酶链反应(pcr)来分离多核苷酸。

可以根据标准pcr扩增技术,使用cdna、mrna或基因组dna作为模板和合适的寡核苷酸引物来扩增本文所述的多核苷酸。如此扩增的多核苷酸可被克隆到合适的载体中并通过dna序列分析来表征。

此外,可以通过标准合成技术,例如使用自动化dna合成仪来制备与本文所述核苷酸序列相对应或杂交的寡核苷酸。

与核苷酸序列互补的多核苷酸是这样的多核苷酸,其与另一核苷酸序列足够互补,从而能够与所述另一核苷酸序列杂交进而形成稳定的双链体。术语“cdna”(互补dna)在本文中被定义为可以从mrna分子通过反转录来制备的dna分子。来源于mrna的cdna仅含有编码序列,并可以直接翻译成相应的多肽产物。术语“互补链”可以与术语“互补物”互换使用。核苷酸链的互补物可以是编码链的互补物或非编码链的互补物。当涉及双链多核苷酸时,编码多肽的多核苷酸的互补物是指编码氨基酸序列的链的互补链或含有其的任何多核苷酸。

在本文中使用时,术语“杂交”意为寡聚化合物的基本互补的链的配对。一种配对机制涉及寡聚化合物链的互补核苷酸碱基(核苷酸)之间的氢键结合,其可为watson-crick、hoogsteen或反向hoogsteen氢键结合。例如,腺嘌呤和胸腺嘧啶是通过形成氢键而配对的互补核酸。可在不同环境下发生杂交。“严格性杂交”或“在低严格性、中等严格性、高严格性或极高严格性条件下杂交”在本文中用于描述杂交和洗涤条件,更特别地为寡聚化合物与其靶序列杂交但与最少量的其他序列杂交的条件。所以,寡聚化合物与靶序列杂交的程度比与其他序列的可检测到地更高。在currentprotocolsinmolecularbiology,johnwiley&sons,n.y.(1989),6.3.1-6:3.6中可找到进行杂交反应的指导。该参考文献中描述了水性方法和非水性方法,可以使用任何一种。严格性条件是序列依赖性的并且在不同环境下会不同。通常,将严格性条件选为在特定的离子强度和ph下,比寡聚化合物的热熔点(tm)低约5℃。tm为50%寡聚化合物与完美匹配探针杂交的温度(在特定离子强度和ph下)。也可通过添加去稳定剂例如甲酰胺来获得严格性条件。

具体的杂交条件的实例如下:1)低严格性杂交条件,在约45℃的6×氯化钠/柠檬酸钠(ssc)中,接着在至少50℃的0.2×ssc、0.1%sds中洗涤两次(对于低严格性条件,洗涤温度可增加到55℃);2)中等严格性杂交条件,在约45℃的6×ssc中,接着在60℃的0.2×ssc、0.1%sds中洗涤一次或更多次;3)高严格性杂交条件,在约45℃的6×ssc中,接着在65℃的0.2×ssc、0.1%sds中洗涤一次或更多次;和4)极高严格性杂交条件为65℃的0.5m磷酸钠、7%sds,接着在65℃的0.2×ssc、0.1%sds中洗涤一次或更多次。

通常,高严格性条件(例如高杂交温度和任选的低盐浓度)仅允许高度相似的序列之间的杂交,而低严格性条件(例如低杂交温度和任选的高盐浓度)允许较不相似的序列之间的杂交。

本申请的一个方面涉及编码本文所述的变体多肽的经分离的多核苷酸以及足以用作杂交探针以鉴定编码本文所述变体多肽的多核苷酸的多核苷酸。

在本文中使用时,术语“天然存在的”是指以其在自然界中的相关形式存在的方法、事件或事物。相比之下,“非天然存在的”是指其存在或形式涉及人工操作的方法、事件或事物。通常,关于多肽或多核苷酸的术语“天然存在的”可以与术语“野生型”或“原生的”互换使用。其是指分别具有与自然界中发现的氨基酸序列或核苷酸序列相同的氨基酸序列或核苷酸序列的多肽或编码多肽的多核苷酸。天然存在的多肽包括原生多肽,例如在特定宿主中天然表达或发现的那些多肽。天然存在的多核苷酸包括原生多核苷酸,例如在特定宿主的基因组中天然发现的那些多核苷酸。此外,野生型序列或天然存在的序列可以指变体或合成序列所来源于的序列。

在一个实施方式中,本文所述的变体多肽和本文所述的多核苷酸不是天然存在的。

在本文中使用时,通过体外化学或酶促合成来产生“合成”分子。其包括但不限于用针对所选择的宿主生物体而言最佳的密码子使用来制备的多核苷酸。

关于宿主细胞、多核苷酸、多肽、核酸构建体或载体使用时,术语“重组”表示宿主细胞、多核苷酸、多肽或载体已经通过引入异源多核苷酸或多肽或者改变原生多核苷酸或多肽而被修饰,或表示宿主细胞来源于如此修饰的宿主细胞。因此,例如,重组宿主细胞表达在宿主细胞的原生(非重组)形式中未发现的多核苷酸或表达原本异常表达的、低表达的或根本不表达的天然基因。术语“重组”与“遗传修饰”同义。

在本文中使用时,术语“经分离的多肽”是指从与其天然相关联的至少一种组分(例如其他多肽材料)移出的多肽。因此,经分离的多肽可以含有至多10%、至多8%、更优选至多6%、更优选至多5%、更优选至多4%、更优选至多3%、甚至更优选至多2%、甚至更优选至多1%、最优选至多0.5%的如通过sds-page所测定的与其天然相关联的其他多肽材料。经分离的多肽可以不含任何其他杂质。如通过sds-page或适合此目且本领域技术人员已知的任何其他分析方法所测定的,经分离的多肽可以是至少50%纯,至少60%纯、至少70%纯、至少75%纯、至少80%纯、至少85%纯、至少90%纯、至少95%纯、至少96%纯、至少97%纯、至少98%纯、至少99%纯、至少99.5%纯、至少99.9%纯。

“经分离的多核苷酸”或“经分离的核酸”是从与其天然相关联的其他多核苷酸移出的多核苷酸。因此,经分离的多核苷酸可以含有至多10%、至多8%、更优选至多6%、更优选至多5%、更优选至多4%、更优选至多3%、甚至更优选至多2%、甚至更优选至多1%、最优选至多0.5%重量的与其天然相关联的其他多核苷酸材料。经分离的多核苷酸可以不含任何其他杂质。以重量计,经分离的多核苷酸可以是至少50%纯,至少60%纯、至少70%纯、至少75%纯、至少80%纯、至少85%纯、至少90%纯或至少95%纯、至少96%纯、至少97%纯、至少98%纯、至少99%纯、至少99.5%纯、至少99.9%纯。

关于多肽,术语“基本上纯”指的是多肽制品含有至多50重量%的其他多肽材料。本文所公开的多肽优选是基本上纯的形式。特别地,本文所公开的多肽优选是“实质上纯的形式”,即多肽制品实质上不含有其他多肽材料。任选地,所述多肽也可以实质上不含非多肽材料例如核酸、脂质、培养基组分等。在本文中,术语“基本上纯的多肽”与术语“经分离的多肽”和“分离形式的多肽”是同义的。关于多核苷酸,术语“基本上纯”是指多核苷酸制品含有至多50重量%的其他多核苷酸材料。本文所公开的多核苷酸优选是基本上纯的形式。特别地,本文所公开的多核苷酸优选是“实质上纯的形式”,即多核苷酸制品实质上不含其他多核苷酸材料。任选地,所述多核苷酸也可以实质上不含非多核苷酸材料例如多肽、脂质、培养基组分等。在本文中,术语“基本上纯的多核苷酸”与术语“经分离的多核苷酸”和“分离形式的多核苷酸”是同义的。

在本申请中使用时,术语“核酸”是指包含至少5个核苷酸单元的核苷酸聚合物。核酸是指核糖核苷酸聚合物(rna)、脱氧核苷酸聚合物(dna)或任一类型的核酸的修饰形式或其合成形式或任意上述的混合聚合物。核酸可包括通过天然存在和/或非天然存在的核酸键连接在一起的天然存在的核酸和经修饰的核酸中的任一者或两者。核酸分子可被化学或生物化学修饰或可含有非天然或衍生化的核酸碱基,如本领域的技术人员所容易了解的。此类修饰包括例如标记、甲基化、以类似物替换一个或多个天然存在的核酸、核苷酸间修饰如不带电键联(例如,膦酸甲酯、磷酸三酯、氨基磷酸酯、氨基甲酸酯等)、带电键联(例如,硫代磷酸酯、二硫代磷酸酯等)、悬垂(pendent)部分(例如,多肽)、嵌入剂(例如,吖啶、补骨脂素等)、螯合剂、烷基化剂以及经修饰的键联(例如,α异头核酸等)。术语核酸还旨在包括任何拓扑构象,包括单链(有义链和反义链)、双链、部分双链体、三链体、发夹、环形和挂锁构象。还包括在经由氢键合和其他化学相互作用结合至指定序列的能力方面模拟核酸的合成分子。此类分子在本领域中是已知的并且包括例如其中肽键联替换分子骨架中的磷酸酯键的那些分子。提及核酸序列涵盖其互补物,除非另有说明。因此,提及具有特定序列的核酸分子应被理解为涵盖其互补链及其互补序列。互补链也是有用的,用于例如反义疗法、杂交探针和pcr引物。术语“核酸”、“核酸分子”和“多核苷酸”在本文中可互换使用。术语“核酸序列”和“核苷酸序列”在本文中也可互换使用。

在本文中关于多肽或多核苷酸使用时,“替换”表示多肽序列中的一个或多个氨基酸或核苷酸序列中的一个或多个核苷酸分别被不同的氨基酸或核苷酸置换。

本申请的另一个实施方式提供了与本文所述的多核苷酸(例如,本文所述的多核苷酸的编码链)反义的经分离的多核苷酸。本申请范围内还包括本文所述多核苷酸的互补链。

除非另有说明,否则通过对本文中的dna分子进行测序而测定的所有核苷酸序列均是使用自动化dna测序仪测定的,并且由本文测定的dna分子编码的多肽的所有氨基酸序列均通过翻译如上测定的dna序列预测的。因此,如本领域所已知的,对于通过这种自动化方法测定的任何dna序列而言,本文中测定的任何核苷酸序列都可能包含一些错误。通过自动化测定的核苷酸序列通常与测序的dna分子的实际核苷酸序列至少约90%相同,更典型地至少约95%到至少约99.9%相同。

可以通过其它方法(包括本领域公知的手动dna测序法)更精确地测定实际序列。又如本领域所已知的,与实际序列相比,被测定的核苷酸序列中的单个插入或缺失会引起核苷酸序列翻译中的移码,从而由被测定的核苷酸序列编码的预测氨基酸序列会与由被测序的dna分子实际编码的氨基酸序列完全不同(从该插入或缺失的点开始)。

在本文中使用时,术语“缺失”表示:与亲本(通常为天然存在的)氨基酸或核苷酸序列相比,其中分别缺少一个或多个氨基酸或核苷酸的氨基酸或核苷酸序列的变化。

术语“插入”(也称为术语“添加”)表示:与亲本(通常为天然存在的)氨基酸或核苷酸序列相比,分别导致添加一个或多个氨基酸或核苷酸的氨基酸或核苷酸序列的变化。

本领域技术人员能够识别这类错误识别的碱基并知道如何纠正这类错误。

本文所述的多核苷酸可以仅编码本文所述的变体多肽的部分。

探针/引物通常包含基本上纯化的寡核苷酸,其通常包含这样的核苷酸序列,所述核苷酸序列优选在高度严格条件下与核苷酸序列的至少约12个至约15个、优选约18个至约20个、优选约22个至约25个、更优选约30个、约35个、约40个、约45个、约50个、约55个、约60个、约65个或约75个或更多个连续核苷酸杂交。

探针可用于检测编码相同的或同源的多肽(例如,其它生物中的)的核苷酸序列。在一些优选的实施方式中,探针还包含与其连接的标记基团,例如,标记基团可以是放射性同位素、荧光化合物、酶或酶辅因子。这样的探针还可被用作诊断检测试剂盒的一部分,以鉴定表达本文所述变体多肽的细胞。

本文所述的多核苷酸可以是合成的多核苷酸。合成的多核苷酸可在密码子使用方面进行优化,优选根据wo2006/077258和/或pct/ep2007/055943(通过引用并入本文)中描述的方法进行优化。pct/ep2007/055943解决了密码子对优化。密码子对优化是这样的方法,其中已针对其密码子使用、尤其是使用的密码子对修饰了编码多肽的核苷酸序列,以获得编码多肽的核苷酸序列的改进的表达和/或编码的多肽的改进的生成。将密码子对定义为编码序列中前后两个三联体(密码子)的组。本领域技术人员知道密码子使用需要根据宿主物种进行调整,从而可能导致与给定核苷酸序列具有显著同源性偏差,但仍然编码本文所述的变体多肽的变体。

术语“表达”包括涉及产生多肽的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。

核酸构建体

本申请还涉及包含本文所述的多核苷酸的核酸构建体或载体。术语“核酸构建体”在本文中被称为核酸分子,其是单链或双链的,其从天然存在的基因中分离或已经被修饰以含有以否则将不会在自然中存在的方式组合和并置的核酸的区段。当核酸构建体含有表达编码序列所需要的所有控制序列时,术语核酸构建体与术语“表达盒”的含义相同,其中所述控制序列可操作地连接到所述编码序列。

本文所定义的术语“编码序列”是被转录成mrna并翻译成多肽的序列。编码序列的边界通常由mrna5'-端的atg起始密码子和mrna3'-端的终止开放阅读框的翻译终止密码子序列决定。编码序列可以包括但不限于dna、cdna和重组核苷酸序列。优选地,核酸具有高gc含量。本文中的gc含量表示构建体中g和c核苷酸的数目除以核苷酸总数,以%表示。gc含量优选为56%或更高、57%或更高、58%或更高、59%或更高、60%或更高、或在56-70%的范围内或58-65%的范围内。优选地,核酸构建体包含启动子序列,与所述启动子序列可操作地相关联的编码序列和控制序列,例如(a)以5'朝向3'方向定向的翻译终止序列,和/或(b)以5'朝向3'方向定向的翻译起始子(initiator)编码序列,和/或(c)翻译起始子序列。

在本申请的上下文中,术语“翻译起始子编码序列”被定义为紧邻编码序列的开放阅读框的起始子或起始密码子下游的核苷酸。起始子或起始密码子编码aa甲硫氨酸。起始子密码子通常是atg,但也可以是任何功能性起始密码子,例如gtg。

在本申请的上下文中,术语“翻译终止序列”被定义为从开放阅读框或核苷酸编码序列的3'末端的翻译终止密码子开始并且以5'朝向3'方向定向的核苷酸。

在本申请的上下文中,术语“翻译起始子序列”被定义为紧邻编码多肽的序列的开放读码框的起始子或起始密码子的上游的核苷酸。

在一个实施方式中,核酸构建体是载体,诸如表达载体,其中本文所述的多核苷酸可操作地连接到至少一个控制序列以在宿主细胞中表达所述多核苷酸。

表达载体包含编码多肽的多核苷酸,其可操作地连接到合适的控制序列(例如启动子,以及转录和翻译终止信号)以在体外或在宿主细胞中表达和/或翻译。某些载体能够指导与它们可操作地连接的基因的表达。这种载体在本文中被称为“表达载体”。通常,在重组dna技术中有用的表达载体通常为质粒的形式。

表达载体可为任何载体(例如,质粒或病毒),其可方便地进行重组dna程序并且可引起多核苷酸表达。载体的选择通常取决于载体与要向其中引入载体的细胞的相容性。载体可以是线性或闭环质粒。载体可以是自主复制载体,即作为染色体外实体存在的其复制不依赖于染色体复制的载体,例如质粒、染色体外元件、微型染色体或人工染色体。或者,载体可为引入宿主细胞时整合到基因组中并且与已经将其整合的染色体一起复制的载体。整合性克隆载体可随机整合或整合在宿主细胞染色体内预定的靶基因座处。

载体系统可为单个载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组中的总dna,或转座子。

载体优选含有一个或更多个允许容易地选择转化细胞的选择标记。

本申请的另一方面涉及包含本文所述多核苷酸的载体,包括克隆和表达载体,以及编码这些载体和在合适的宿主细胞中例如在本文所述的变体多肽进行表达的条件下生长、转化或转染这些载体的方法。

在本文中使用时,术语“载体”是指能够转运已与其连接的另一核酸的核酸分子。因此,在另一个实施方式中,本申请提供了制备本文所述多核苷酸的方法,所述方法包括:将本文所述的多核苷酸引入可复制载体中,将该载体引入相容的宿主细胞中,并使宿主细胞在引起载体复制的条件下生长。可以从宿主细胞中回收载体。以下描述合适的宿主细胞。

一种类型的载体是“质粒”,其是指其中可以连接额外的dna区段的环状双链dna环。另一种类型的载体是病毒载体,其中额外的dna区段可以连接到病毒基因组中。术语“质粒”和“载体”在本文中可互换使用,因为质粒是最常用的载体形式。然而,本申请旨在包括具有等价功能的其他形式的表达载体,例如粘粒、病毒载体(例如复制缺陷型逆转录病毒、腺病毒和腺相关病毒)和噬菌体载体。

本文所述的载体可以体外使用,例如用于产生rna或用于转染或转化宿主细胞。

本文所述的载体可以包含两种或更多种,例如三种、四种或五种本文所述的多核苷酸,例如用于过表达。

本文所述的重组表达载体以适合于在宿主细胞中表达多核苷酸的形式包含本文所述的多核苷酸,这意味着重组表达载体包含基于要用于表达的宿主细胞选择的一个或多个调控序列,所述调控序列与待表达的核苷酸序列可操作地连接。

在本文中使用时,术语“可操作地连接”或“可操作地相关联”是指物理地连接并且彼此有功能性关系的两个或多个核苷酸序列元件。例如,如果启动子能够起始或调控编码序列的转录或表达,则启动子可操作地连接到编码序列,在这种情况下,所述编码序列应被理解为受启动子的“控制”。通常,当两个核苷酸序列可操作地连接时,它们处于相同的定向并且通常也在同一阅读框中。它们通常是实质上连续的,尽管这可以不是必需的。

因此,针对给定宿主细胞的载体或核酸构建体可包含以下元件,所述元件以相对于编码本文所述的变体多肽的序列的编码链从5'-端至3'-端的连续顺序彼此可操作地连接:(1)能够指导编码本文所述的变体多肽的核苷酸序列在给定宿主细胞中转录的启动子序列,(2)任选地,能够指导多肽从给定宿主细胞分泌到培养基中的信号序列,(3)编码本文所述的变体多肽的成熟、优选活性形式的本文所述的核苷酸序列,和优选地还有(4)能够终止编码本文所述变体多肽的核苷酸序列下游转录的转录终止区(终止子)。

本文所述的核苷酸序列的下游可以是含有一个或多个转录终止位点(例如终止子)的3'-非翻译区。终止子可以例如对编码多肽的核苷酸序列而言是原生的。然而,优选地在酵母宿主细胞中使用酵母终止子以及在丝状真菌宿主细胞中使用丝状真菌终止子。更优选地,终止子对宿主细胞(其中要表达编码多肽的核苷酸序列)而言是内源的。在被转录的区域中,可存在用于翻译的核糖体结合位点。构建体所表达的成熟转录本的编码部分会包括位于要翻译的多肽起点处的翻译起始aug和适当地位于结尾处的终止密码子。

本文所述的多核苷酸的增强的表达也可以通过对异源调控区(例如启动子、分泌前导肽和/或终止子区)的选择来实现,所述异源调控区可发挥以下作用:提高表达宿主对本文所述变体多肽的表达和期望时的分泌水平,和/或提供本文所述变体多肽表达的诱导型控制。

本领域技术人员应当知道:对表达载体的设计可取决于下述因素,例如待转化的宿主细胞的选择、多肽的表达水平等。

本文所述的载体(例如表达载体)可被引入宿主细胞中以产生本文所述的变体多肽。可以设计本文所述的载体(例如重组表达载体)以在原核或真核细胞中表达多肽。

重组表达载体也可以在体外转录和翻译,例如使用t7启动子调控序列和t7聚合酶。

对于大多数丝状真菌和酵母而言,载体或核酸构建体优选被整合进宿主细胞的基因组中以获得稳定的转化体。然而,对某些酵母而言还可获得合适的附加体载体,可以向其中整合入表达构建体进行稳定和高水平的表达。其例子包括分别来源于saccharomyces和kluyveromyces的2μ和pkd1质粒的载体,或含有ama序列(例如来自aspergillus的ama1)的载体。将表达构建体整合进宿主细胞基因组中的情况下,所述构建体被整合进基因组中随机基因座处,或者使用同源重组整合进预定的靶基因座处,在这种情况下靶基因座优选包含高度表达的基因。

因此,可用于本申请的表达载体包括来自染色体、附加体和来源于病毒的载体,例如来自细菌质粒、噬菌体、酵母附加体、酵母染色体元件、病毒(如杆状病毒、乳多空病毒、痘苗病毒、腺病毒、禽痘病毒、假狂犬病病毒和反转录病毒)的载体和来自其组合的载体,如来自质粒和噬菌体遗传元件的载体(如粘粒和噬菌粒)。

术语“控制序列”或“调控序列”可以与术语“表达调控型核酸序列”互换使用。本文所用的该术语是指特定宿主生物体内或体外可操作连接的编码序列的表达所必需的和/或影响该表达的核苷酸序列。当两个核酸序列可操作地连接时,它们通常将处于相同的定向并且也在相同的读码框中。它们通常实质上是连续的,但这可以不是必需的。表达调控型核酸序列,例如尤其是适当的转录起始,终止,启动子,前导序列,信号肽,前肽,前原肽或增强子序列;shine-dalgarno序列,抑制子或激活子序列;有效的rna加工信号如剪接和聚腺苷酸化信号;稳定细胞质mrna的序列;增强翻译效率的序列(例如,核糖体结合位点);增强蛋白质稳定性的序列;以及当期望时,增强蛋白质分泌的序列,可以是在选择的宿主生物体中显示活性的任何核苷酸序列,并且可以来源于编码对宿主生物体而言同源或异源的蛋白质的基因。每个控制序列对于编码多肽的核苷酸序列可以是原生的或外源的。当期望时,可以为控制序列提供接头,用于引入特异性限制性位点,以便于将控制序列与编码多肽的核酸序列的编码区连接。可以根据其特定目的优化控制序列。

控制序列可以是合适的启动子序列,其是被宿主细胞识别以表达核苷酸序列的核苷酸序列。启动子序列含有介导多肽表达的转录控制序列。启动子可以是在细胞中显示转录活性的任何核苷酸序列,包括突变的、截短的和杂合的启动子,并且可以从编码细胞外或细胞内多肽的基因获得,所述多肽对细胞而言是同源的或异源的。

术语“启动子”在本文中被定义为结合rna聚合酶并将聚合酶引导至编码生物化合物的核苷酸序列的正确下游转录起始位点以起始转录的核苷酸序列。rna聚合酶有效地催化与编码区的适当dna链互补的信使rna的组装。术语“启动子”还应被理解为包括用于在转录成mrna之后用于翻译的5'-非编码区(介于启动子和翻译起始之间),顺式作用转录控制元件例如增强子,以及能够与转录因子相互作用的其他核苷酸序列。启动子可以是显示转录活性的适合于真核或原核宿主细胞的任何合适的启动子序列,包括突变的、截短的和杂合的启动子,并且可以从编码细胞外或细胞内多肽的多核苷酸获得,所述多肽对细胞而言是同源的(原生的)或异源的(外源的)。

启动子可以是组成型启动子或诱导型启动子。优选地,启动子是诱导型启动子。更优选地,启动子是碳水化合物诱导型启动子。碳水化合物诱导型启动子在本领域中是已知的。在一个优选的实施方式中,启动子适用于丝状真菌中。这样的启动子在本领域中是已知的。在一个优选实施方式中,启动子是rasamsonia启动子。优选地,启动子序列来自高度表达的基因。高度表达的基因在本领域中是已知的。

如果期望,可以修饰本文所述的宿主细胞中使用的启动子以影响其控制特性。本文中合适的启动子包括本领域技术人员公知的组成型和诱导型天然启动子以及工程化启动子。

可通过将增强子序列插入载体中而增加高等真核生物对编码本文所述的变体多肽的核苷酸序列的转录。增强子是dna的顺式作用元件,通常约10-300个碱基对,其在给定宿主细胞类型中起到增加启动子转录活性的作用。合适增强子的例子是本领域技术人员公知的。

控制序列也可以是合适的转录终止子序列,即被宿主细胞识别以终止转录的序列。终止子序列可操作地连接到编码多肽的核苷酸序列的3'-末端。本申请中可以使用在细胞中有功能的任何终止子。合适的转录终止子序列的例子是本领域技术人员公知的。

控制序列还可以包括合适的前导序列,即对于宿主细胞翻译重要的mrna的非翻译区。前导序列可操作地连接到编码多肽的核苷酸序列的5'-末端。本申请中可以使用在细胞中有功能的任何前导序列。合适的前导序列的例子是本领域技术人员公知的。

控制序列还可以是聚腺苷酸化序列,即可操作地连接到核苷酸序列的3'-末端并且在转录时被宿主细胞识别为将聚腺苷酸残基添加到转录的mrna的信号的序列。本申请中可以使用在细胞中有功能的任何聚腺苷酸化序列。合适的聚腺苷酸化序列的例子是本领域技术人员公知的。

当本文所述的变体多肽要从宿主细胞分泌到培养基中,可以将合适的信号序列添加到多肽以将从头合成的多肽导向宿主细胞的分泌途径。本领域技术人员知道为特定宿主选择适当的信号序列。信号序列可以对于宿主细胞而言是原生的,或者可以对于宿主细胞而言是外源的。作为例子,可以使用来自对于宿主细胞而言是原生的蛋白质的信号序列。优选地,所述原生蛋白质是高度分泌的蛋白质。合适的信号序列的例子是本领域技术人员公知的。

作为信号序列的替代方式,本文所述的变体多肽可与分泌的携载体蛋白(carrierprotein)或其部分融合。此类嵌合构建体借助于携载体蛋白或其部分的信号序列而被导向分泌途径。另外,携载体蛋白会为本文所述的多肽提供稳定化效应,和/或可以增强溶解性。此类携载体蛋白可以是任何蛋白质。优选地,使用高度分泌的蛋白质作为携载体蛋白。携载体蛋白对于本文所述的变体多肽而言可以是原生的或外源的。携载体蛋白对于宿主细胞而言可以是原生的或外源的。本文所述的携载体蛋白和变体多肽可含有特定的氨基酸基序,以便于多肽的分离。本文所述的变体多肽可通过专用的释放剂被释放。释放剂可以是蛋白水解酶或化学试剂。合适的携载体蛋白的例子是本领域技术人员公知的。

作为将本文所述的变体多肽分泌到培养基中的替代方式,可以将本文所述的变体多肽与定位序列融合以使本文所述的变体多肽靶向期望的细胞区室、细胞的细胞器或膜。这些序列是本领域技术人员已知的,包括细胞器靶向序列。

或者,将本文所述的变体多肽与具有碳水化合物降解活性的另一种蛋白质融合。任选地,本文所述的变体多肽在c-末端和/或n-末端侧的侧翼是便于鉴定、分离和/或纯化的氨基酸基序。

同源性和同一性

术语“序列同源性”或“序列同一性”在本文中可互换使用。出于本申请的目的,在此定义为了确定两个氨基酸序列或两个核苷酸序列的序列同源性或序列同一性的百分比,出于最佳比较目的比对所述序列。为了优化两个序列之间的比对,可在比较的两个序列中的任一个中引入空位。这种比对可在所比较的序列的全长上进行。或者,比对可在更短的长度上进行,例如在约20、约50、约100或更多个核苷酸或氨基酸上进行。序列同一性是在所报告的比对区域上两个序列之间的相同匹配的百分比。

两个序列之间的序列比较和序列同一性百分比的确定可使用数学算法来完成。本领域的技术人员将意识到以下事实:若干不同的计算机程序可用于比对两个序列并确定两个序列之间的同一性(kruskal,j.b.(1983)anoverviewofsequencecomparison.d.sankoff和j.b.kruskal,(编辑),timewarps,stringeditsandmacromolecules:thetheoryandpracticeofsequencecomparison,第1-44页addisonwesley)。两个氨基酸序列之间或两个核苷酸序列之间的序列同一性百分比可使用用于两个序列的比对的needleman和wunsch算法来确定(needleman,s.b.和wunsch,c.d.(1970)j.mol.biol.48,443-453)。氨基酸序列和核苷酸序列两者均可通过所述算法进行比对。needleman-wunsch算法已在计算机程序needle中实现。出于本申请的目的,使用了来自emboss包的needle程序(2.8.0版或更高版本,emboss:theeuropeanmolecularbiologyopensoftwaresuite(2000)rice,p.longden,i.和bleasby,a.trendsingenetics16,(6)第276-277页,http://emboss.bioinformatics.nl/)。对于氨基酸序列而言,eblosum62用于替换矩阵。对于核苷酸序列而言,使用ednafull。所使用的任选参数是空位开放罚分为10,以及空位延伸罚分为0.5。技术人员将理解的是,所有这些不同的参数将产生稍微不同的结果,但是当使用不同的算法时,两个序列的总体同一性百分比没有显著改变。

在通过如上所述的程序needle进行比对后,查询序列与本文所述的序列之间的序列同一性的百分比计算如下:在两个序列中显示相同氨基酸或相同核苷酸的比对中的相应位置的数目除以在减去比对中的总空位数后比对的总长度。如本文定义的同一性可通过使用nobrief选项从needle获得,并且在程序的输出中标记为“最长同一性”。

本文所述的核苷酸和氨基酸序列可进一步用作“查询序列”以进行针对序列数据库的搜索,以例如鉴定其它家族成员或相关序列。此类搜索可使用altschul等人(1990)j.mol.biol.215:403—10的nblast和xblast程序(2.0版)进行。blast核苷酸搜索可用nblast程序(得分=100、字长=12)来进行,以获得与本文所述的多核苷酸分子同源的核苷酸序列。blast蛋白质搜索可用xblast程序(得分=50、字长=3)来进行,以获得与本文所述的多肽同源的氨基酸序列。为了获得用于比较目的的空位化比对,可利用如在altschul等人,(1997)nucleicacidsres.25(17):3389-3402中描述的空位blast。当利用blast和空位blast程序时,可使用相应程序(例如xblast和nblast)的默认参数。

宿主细胞

在一个实施方式中,宿主细胞包含本文所述的变体多肽、本文所述的多核苷酸或本文所述的核酸构建体或载体。

在本文中使用时,术语“宿主细胞”是指易于用本文所述的多核苷酸或本文所述的核酸构建体或载体转化、转染、转导等的任何类型的细胞。其涵盖由于复制期间发生的突变而与亲本细胞不相同的亲本细胞的任何后代。在一个实施方式中,宿主细胞是重组宿主细胞。

本文所述的变体多肽可以在原核细胞和真核细胞两者中表达。

原核宿主细胞包括但不限于细菌宿主细胞。术语“细菌细胞”包括革兰氏阴性微生物和革兰氏阳性微生物。细菌的例子包括但不限于属于以下属的细菌:bacillus(例如b.subtilis,b.amyloliquefaciens,b.licheniformis,b.puntis,b.megaterium,b.halodurans,b.pumilus),acinetobacter,nocardia,xanthobacter,escherichia(例如e.coli),streptomyces,erwinia,klebsiella,serratia(例如s.marcessans),pseudomonas(例如p.aeruginosa),salmonella(例如s.typhimurium,s.typhi)。细菌还包括但不限于光合细菌(例如绿色非硫细菌(例如choroflexus,chloronema)、绿色硫细菌(例如chlorobium,pelodictyon)、紫色硫细菌(例如chromatium)和紫色非硫细菌(例如rhodospirillum,rhodobacter和rhodomicrobium)。

真核宿主细胞包括但不限于酵母宿主细胞、线虫宿主细胞、真菌宿主细胞、阿米巴宿主细胞、禽类宿主细胞、两栖动物宿主细胞、爬行类宿主细胞、藻类宿主细胞、哺乳动物宿主细胞和昆虫宿主细胞。

goeddel,geneexpressiontechnology:methodsinenzymology185,academicpress,sandiego,ca(1990)中进一步讨论了合适的宿主细胞。下面描述合适宿主细胞的代表性例子。下面描述的宿主细胞的合适的培养基和条件是本领域已知的。

在一个优选的实施方式中,宿主细胞是真菌细胞,优选丝状真菌细胞,更优选rasamsonia细胞,最优选rasamsoniaemersonii细胞。

“丝状真菌”在本文中定义为包括真菌(eumycotina)和卵菌(oomycota)亚门的所有丝状形式的真核微生物(如由hawksworth等人,1995所定义)。丝状真菌菌株包括但不限于以下的菌株:acremonium,aspergillus,agaricus,aureobasidium,cryptococcus,corynascus,chrysosporium,filibasidium,fusarium,humicola,magnaporthe,monascus,mucor,myceliophthora,mortierella,neocallimastix,neurospora,paecilomyces,penicillium,piromyces,phanerochaetepodospora,pycnoporus,rhizopus,schizophyllum,sordaria,talaromyces,rasamsonia,thermoascus,thielavia,tolypocladium,trametes和trichoderma。可充当宿主细胞的优选丝状真菌菌株属于以下物种:aspergillusniger,aspergillusoryzae,aspergillusfumigatus,penicilliumchrysogenum,penicilliumcitrinum,acremoniumchrysogenum,trichodermareesei,rasamsoniaemersonii(先前称为talaromycesemersonii),aspergillussojae,chrysosporiumlucknowense,myceliophtorathermophyla。

优选的酵母宿主细胞可以选自下列属:saccharomyces(例如s.cerevisiae,s.bayanus,s.pastorianus,s.carlsbergensis),kluyveromyces,candida(例如c.revkaufi,c.pulcherrima,c.tropicalis,c.utilis),pichia(例如p.pastoris),schizosaccharomyces,hansenula,kloeckera,schwanniomyces,和yarrowia(例如y.lipolytica(先前归类为candidalipolytica))。

昆虫细胞的例子包括但不限于drosophila、spodoptera和trichoplusa。线虫细胞的例子包括但不限于c.elegans细胞。两栖动物细胞的例子包括但不限于xenopuslaevis细胞。哺乳动物细胞的实例包括但不限于nih3t3、293、cho、cos、vero、c127、bhk、per-c6、bowes黑色素瘤和hela细胞。

在本申请的上下文中,“亲本宿主细胞”和“突变宿主细胞”可以是任何类型的宿主细胞。下面描述了突变宿主细胞的一些具体实施方式。本领域技术人员清楚的是,除非另有说明,否则适用于突变宿主细胞的实施方式也适用于亲本宿主细胞。

多核苷酸对于宿主细胞的基因组而言可以是异源的。在本文中使用时,术语“异源的”是指并非天然存在于宿主细胞中的核苷酸或氨基酸序列。换句话说,核苷酸或氨基酸序列与宿主细胞中天然发现的核苷酸或氨基酸序列不同。在本文中使用时,术语“内源的”或“同源的”是指宿主中天然存在的核苷酸或氨基酸序列。

在另一个实施方式中,本申请以宿主细胞为特征,例如含有本申请所涵盖的核酸的重组宿主细胞或转化的宿主细胞。“转化的细胞”或“重组细胞”是通过重组dna技术将本文所述的多核苷酸、本文所述的核酸构建体和/或本文所述的载体引入其(或其祖先)中的细胞。

在本文中使用时,关于细胞的术语“转化的”或“转基因的”意指该细胞具有整合到其基因组中的非原生(异源)核苷酸序列或具有维持多代的附加型质粒。该术语与术语“重组的”或“经遗传修饰的”同义。

可以选择调节插入序列的表达或以特定、期望的方式修饰和加工基因产物的宿主细胞。多肽产物的这种修饰(例如糖基化)和加工(例如切割)可以促进多肽发挥最佳功能。

多种宿主细胞具有特征性的和具体的翻译后加工以及修饰多肽和基因产物的机制。可选择分子生物学和/或微生物学领域的技术人员熟知的恰当的细胞系或宿主系统,以确保表达的外源多肽被按照期望地正确修饰和加工。为此,可以使用具有适当加工原初转录物、使基因产物糖基化和磷酸化的细胞机制的真核宿主细胞。这类宿主细胞在本领域是公知的。

本文所定义的宿主细胞是适合于遗传操作的生物体,并且可以在可用于工业生产靶标产物的细胞密度下培养。合适的生物体可以是微生物,例如可以保持在发酵装置中的微生物。宿主细胞可以是在自然界中发现的宿主细胞或在遗传操作或经典诱变后源自亲本宿主细胞的宿主细胞。

根据一个实施方式,当本文所述的突变宿主细胞是丝状真菌宿主细胞时,突变宿主细胞可在其基因组中包含一种或多种修饰,使得所述突变宿主细胞如果与亲本宿主细胞相比并且在相同条件下测量时在至少一种选自以下的产物的生成方面有缺陷:葡糖淀粉酶(glaa)、酸稳定性α-淀粉酶(amya)、中性α-淀粉酶(amybi和amybii)、草酸水解酶(oaha)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调节子prtt、pepa、基因hdfa和/或hdfb编码的产物、非核糖体肽合酶npse。

因此,当本文所述的突变微生物宿主细胞是丝状真菌宿主细胞时,宿主细胞可以在其基因组中包含一种或多种修饰以导致主要细胞外天冬氨酸蛋白酶pepa生成缺陷。例如,本文所述的宿主细胞可以进一步包含编码主要细胞外天冬氨酸蛋白酶pepa的pepa基因的破坏。

当本文所述的突变微生物宿主细胞是丝状真菌宿主细胞时,本文所述的宿主细胞可以在其基因组中另外包含一种或多种修饰以导致由hdfa(ku70)和/或hdfb(ku80)基因编码的产物生成缺陷。例如,本文所述的宿主细胞可以进一步包含hdfa和/或hdfb基因的破坏。

当本文所述的突变宿主细胞是丝状真菌宿主细胞时,本文所述的宿主细胞可以在其基因组中另外包含导致非核糖体肽合酶npse产生缺陷的修饰。

本文所述的宿主细胞包括植物细胞,因此本申请延伸至包含一种或多种本文所述的细胞的转基因生物体,例如植物及其部分。所述细胞可异源表达本文所述的变体多肽或可异源含有一种或多种本文所述的多核苷酸。因此,转基因(或经遗传修饰的)植物可以在其基因组中(例如稳定地)插入编码一种或多种本文所述的变体多肽的序列。植物细胞的转化可以使用已知技术进行。

在一个实施方式中,以使得本文所述的宿主细胞不再产生内源和/或亲本β-葡糖苷酶多肽的方式缺失或修饰编码内源和/或亲本β-葡糖苷酶的基因。因此,宿主细胞可产生本文所述的变体多肽,而非内源和/或亲本β-葡糖苷酶。换句话说,本申请还提供了一种宿主细胞,其中编码包含seqidno:2的氨基酸序列的β-葡糖苷酶的基因已被缺失或修饰,使得宿主细胞不再产生β-葡糖苷酶多肽。此类宿主细胞可以包含编码本文所述的变体多肽的多核苷酸,并产生所述变体β-葡糖苷酶。

本申请还提供了一种宿主细胞,其中编码包含seqidno:4的氨基酸序列的β-葡糖苷酶的基因已被缺失或修饰,使得宿主细胞不再产生β-葡糖苷酶多肽。此类宿主细胞可以包含编码本文所述的变体多肽的多核苷酸,并产生所述变体β-葡糖苷酶。

多肽生产

本申请还涉及产生本文所述的变体多肽的方法,所述方法包括以下步骤:(a)在有助于生产本文所述的变体多肽的条件下培养本文所述的宿主细胞,和(b)任选地,回收本文所述变体多肽。

可以使用本领域已知的程序培养本文所述的宿主细胞。对于启动子和宿主细胞的每种组合,可获得有助于编码本文所述的变体多肽的多核苷酸序列表达的培养条件。在达到期望的细胞密度或多肽滴度之后停止培养,并利用已知程序回收多肽。或者,可以不回收多肽,而是以杀灭的或未杀灭的完整发酵液的形式使用。除了本文所述的变体多肽之外,发酵液可以包含其它成分,例如细胞或其部分、培养基组分等等。

发酵培养基可以包含含有碳源、氮源和无机营养源的已知培养基。任选地,可以包括诱导物。

适当培养基的选择可以基于表达宿主的选择并/或基于核酸构建体的调控需求。这种培养基是本领域技术人员已知的。如果期望的话,培养基可含有额外的组分,所述组分相对于其它可能的污染微生物有利于经转化的宿主细胞。

发酵可进行约0.5天至约30天的时间。发酵可以是分批、连续或补料分批方法,适当地在0℃至100℃或0℃至80℃(例如0℃至50℃)的温度下和/或在2至10的ph下。优选的发酵条件是20℃至45℃范围内的温度和/或3-9的ph。通常基于待表达的多肽和宿主细胞的选择来选择适当的条件。

发酵后,如果需要,可以通过离心或过滤从发酵液中移除细胞。发酵停止后或移除细胞后,可以回收本文所述的变体多肽,并且如果期望,可以通过常规方法进行纯化和分离。

可以通过本领域已知的方法从重组宿主细胞培养物中回收和纯化本文所述的变体多肽。最优选地,使用高效液相色谱法(“hplc”)进行纯化。

如果期望,如上所述的宿主细胞可被用于制备本文所述的变体多肽。这种方法通常包括:在一定条件下培养(例如用上述核酸构建体转化或转染的)宿主细胞以提供编码多肽的编码序列的表达,并任选地回收表达的多肽。本文所述的多核苷酸可被整合到重组可复制载体(例如,表达载体)中。载体可用于在相容的宿主细胞中复制核酸。因此,在另一个实施方式中,本申请提供了生产本文所述的多核苷酸的方法,其通过将本文所述的多核苷酸引入可复制载体中,将该载体引入相容的宿主细胞中,和使宿主细胞在引起载体复制的条件下生长。可以从宿主细胞中回收载体。

优选地,多肽作为分泌蛋白产生,在这种情况下,表达构建体中编码多肽的核苷酸序列与编码信号序列的核苷酸序列可操作地连接。优选地,信号序列对于编码多肽的核苷酸序列而言是原生的(同源的)。或者,信号序列对于编码多肽的核苷酸序列而言是外源的(异源的),在这种情况下,信号序列优选对于其中表达本文所述的核苷酸序列的宿主细胞而言是内源的。

在一个实施方式中,本文所述的变体多肽可以在宿主细胞中过表达,这是与其中所述多肽不过表达的亲本宿主细胞相比。多肽的过表达在本文中被定义为导致宿主细胞中多肽的活性是其中多肽不过表达的亲本宿主中多肽的活性的至少1.1倍、至少1.25倍或至少1.5倍的多肽的表达。

优选地,多肽的活性是亲本宿主中多肽的活性的至少2倍,更优选至少3倍,更优选至少4倍,更优选至少5倍,甚至更优选至少10倍,最优选至少20倍。

宿主细胞的转化可以通过任何合适的已知方法进行,包括电穿孔方法、粒子轰击或微粒轰击、原生质体方法和agrobacterium介导的转化(amt)。

为了增加突变宿主细胞内编码多肽或编码由细胞产生多肽所涉及的化合物的多核苷酸的拷贝量,可需要多次转化宿主细胞。以这种方式,可以影响宿主细胞产生的不同多肽的比例。此外,表达载体可包含多个表达盒以增加待转化多核苷酸的拷贝量。

另一种方式可以是为不同多核苷酸选择不同控制序列,取决于选择,这可引起所期望多肽更高产或更低产。

可以基于选择标记物的存在来选择用选择标记物转化的宿主细胞。

为了稳定转染哺乳动物细胞,已知:取决于所使用的表达载体和转染技术,只有小部分细胞可将外源多核苷酸整合到其基因组中。为了鉴定和选择这些整合体,通常将编码选择标记物(例如抗生素抗性)的基因与感兴趣的多核苷酸一起引入宿主细胞中。优选的选择标记物包括但不限于赋予药物抗性或回补宿主细胞缺陷的那些。选择标记物可在表达载体上作为表达盒引入细胞中或可在单独的表达载体上被引入。

优选的选择标记物包括但不限于赋予药物抗性或回补宿主细胞缺陷的那些。或者,可以使用特定的选择标记物,例如需要相应突变宿主细胞的营养缺陷型标记。在一个优选的实施方式中,在引入表达构建体之后,从经转化的宿主细胞中缺失选择标记物,以获得不含选择标记物基因的经转化的宿主细胞。如所指出的,表达载体优选含有选择标记物。例如wo2004/074468中公开了优选用于细菌中的载体。其他合适的载体对于本领域技术人员而言是明显的。

组合物

本文所述的变体多肽可以包含在组合物中。优选地,组合物富含多肽。“富含”是指:与不含过表达的本文所述变体多肽的组合物相比,组合物中的多肽在蛋白质水平上增加,例如增加至少1.1倍、优选1.5倍、更优选2倍。组合物可以包含本文所述的变体多肽作为主要的酶组分,例如单组分组合物。或者,组合物可以包含多种酶活性。多肽组合物可以根据本领域已知的方法制备并且可以呈液体或干燥组合物的形式。例如,多肽组合物可以呈颗粒或微粒的形式。可以根据本领域已知的方法使待包含在组合物中的多肽稳定。本文所述的组合物的剂量和使用该组合物的其它条件取决于组合物的最终用途。

本申请涉及组合物,其包含(a)本文所述的变体多肽和(b)纤维素酶和/或半纤维素酶和/或果胶酶。

在一个实施方式中,纤维素酶选自溶解性多糖单加氧酶、纤维二糖水解酶i、纤维二糖水解酶ii、内切-β-1,4-葡聚糖酶、β-葡糖苷酶、β-(1,3)(1,4)-葡聚糖酶及其任何组合。在一个实施方式中,半纤维素酶选自内切木聚糖酶、β-木糖苷酶、α-l-阿拉伯呋喃糖苷酶、α-d-葡糖醛酸酶、乙酰木聚糖酯酶、阿魏酰酯酶、香豆酰酯酶、α-半乳糖苷酶、β-半乳糖苷酶、β-甘露聚糖酶、β-甘露糖苷酶及其任何组合。当然,组合物还可以包含多于一种纤维素酶和/或多于一种半纤维素酶和/或多于一种果胶酶。例如,两种纤维素酶,两种半纤维素酶和一种果胶酶或五种纤维素酶,一种半纤维素和三种果胶酶。任何组合都是可以的。本文描述了合适的纤维素酶和/或半纤维素酶和/或果胶酶。

多肽可以通过不同的方法生产并混合成最佳组合物,或者组合物可以通过一次发酵直接以混合物的形式制得。

本文所述的组合物可以包含一种、两种或三种或更多种纤维素酶,例本文所述的多肽、内切-1,4-β-葡聚糖酶(eg)、外切纤维二糖水解酶(cbh)和溶解性多糖单加氧酶(lpmo)。

本文所述的组合物可以包含具有与本文所述的变体多肽所提供的酶活性相同的酶活性的多肽,所述酶活性例如相同类型的纤维素酶活性和/或半纤维素酶活性和/或果胶酶活性。

本文所述的组合物可以包含具有与由本文所述的变体多肽提供的相比不同类型的纤维素酶活性和/或半纤维素酶活性和/或果胶酶活性的多肽。例如,本文所述的组合物可包含一种由本文所述的变体多肽提供的纤维素酶活性和/或半纤维素酶活性和/或果胶酶活性,和由额外的纤维素/半纤维素酶/果胶酶提供的第二种纤维素酶活性和/或半纤维素酶活性和/或果胶酶活性。

在本文中,纤维素酶是能够降解和/或水解纤维素或增强纤维素的降解和/或水解的任何多肽。能够降解纤维素的多肽是能够催化下述过程的多肽:将纤维素降解成更小的单元,部分地降解例如成纤维素糊精,或者完全降解成葡萄糖单体。降解将典型地通过水解反应而发生。

在本文中,半纤维素酶是能够降解和/或水解半纤维素或增强半纤维素的降解和/或水解的任何多肽。也就是说,半纤维素酶可以能够降解木聚糖、葡糖醛酸木聚糖、阿拉伯木聚糖、葡甘露聚糖和木葡聚糖的一种或多种。能够降解半纤维素的多肽是能够催化下述过程的多肽:将半纤维素降解成更小的多糖,部分地降解例如成寡糖,或者完全降解成糖单体,例如己糖或戊糖单体。半纤维素酶可产生寡糖与糖单体的混合群体。降解将典型地通过水解反应而发生。

在本文中,果胶酶是能够降解果胶的任何多肽。能够降解果胶的多肽是能够催化下述过程的多肽:将果胶降解成更小的单元,部分地降解例如成寡糖,或者完全降解成糖单体。本文所述的果胶酶可产生寡糖与糖单体的混合群体。降解将典型地通过水解反应而发生。

所述组合物可以包含来自rasamsonia或不同于rasamsonia的来源的纤维素酶和/或半纤维素酶和/或果胶酶。它们可以与一种或多种rasamsonia酶一起使用,或者它们可以在不存在另外的rasamsonia酶的情况下使用。

本文所述的组合物可以包含β-葡糖苷酶。例如,本文所述的组合物可包含来自以下的β-葡糖苷酶(bg):aspergillus如aspergillusoryzae,如在wo02/095014中公开的或在wo2008/057637中公开的具有β-葡糖苷酶活性的融合蛋白,或aspergillusfumigatus,如在wo2005/047499中的seqidno:2或在wo2014/130812中的seqidno:5所公开的或aspergillusfumigatusβ-葡糖苷酶变体,如在wo2012/044915中公开的,如具有下列替换的:f100d,s283g,n456e,f512y(使用wo2014/130812中的seqidno:5进行编号)或aspergillusaculeatus,aspergillusniger或aspergilluskawachi。在另一种实施方式中,β-葡糖苷酶源自penicillium,如penicilliumbrasilianum,如wo2007/019442中的seqidno:2所公开的,或来自trichoderma,如trichodermareesei,,如在us6,022,725、us6,982,159、us7,045,332、us7,005,289、us2006/0258554、us2004/0102619中描述的那些。在一个实施方式中,甚至可使用细菌β-葡糖苷酶。在另一种实施方式中,β-葡糖苷酶源自thielaviaterrestris(wo2011/035029)或trichophaeasaccata(wo2007/019442)。在一个优选的实施方式中,酶组合物包含来自rasamsonia,例如rasamsoniaemersonii的β-葡糖苷酶(参见wo2012/000886)。

本文所述的组合物可以包含内切葡聚糖酶。例如本文所述的组合物可以包含来自以下的内切葡聚糖酶(eg):trichoderma,例如trichodermareesei;humicola,例如humicolainsolens的菌株;aspergillus,例如aspergillusaculeatus或aspergilluskawachii;erwinia,例如erwiniacarotovara;fusarium,例如fusariumoxysporum;thielavia,例如thielaviaterrestris;humicola,例如humicolagriseavar.thermoidea或humicolainsolens;melanocarpus,例如melanocarpusalbomyces;neurospora,例如neurosporacrassa;myceliophthora,例如myceliophthorathermophila;cladorrhinum,例如cladorrhinumfoecundissimum和/或chrysosporium,例如chrysosporiumlucknowense的菌株。在一个实施方式中,甚至可使用细菌内切葡聚糖酶,其包括但不限于acidothermuscellulolyticus内切葡聚糖酶(参见wo91/05039;wo93/15186;us5,275,944;wo96/02551;us5,536,655,wo00/70031,wo05/093050);thermobifidafusca内切葡聚糖酶iii(参见wo05/093050);以及thermobifidafusca内切葡聚糖酶v(参见wo05/093050)。在一个优选的实施方式中,内切葡聚糖酶来自rasamsonia,例如rasamsoniaemersonii(参见wo01/70998)。

本文所述的组合物可以包含纤维二糖水解酶i。例如,本文所述的组合物可以包含来自以下的纤维二糖水解酶i:aspergillus,如aspergillusfumigatus,如在wo2011/057140中seqidno:6或wo2014/130812中seqidno:6公开的cel7acbhi,或trichoderma,如trichodermareesei。在一个优选的实施方式中,酶组合物包含来自rasamsonia,例如rasamsoniaemersonii的纤维二糖水解酶i(参见wo2010/122141)。

本文所述的组合物可以包含纤维二糖水解酶ii。例如,本文所述的组合物可以包含来自以下的纤维二糖水解酶ii:aspergillus,如aspergillusfumigatus,如在wo2014/130812中seqidno:7,或trichoderma,如trichodermareesei,或thielavia,如thielaviaterrestris,如来自thielaviaterrestris的纤维二糖水解酶iicel6a。在一个优选的实施方式中,酶组合物包含来自rasamsonia,例如rasamsoniaemersonii的纤维二糖水解酶ii(参见wo2011/098580)。

例如,本文所述的组合物可以包含具有增强纤维素分解的活性的多肽,例如溶解性多糖单加氧酶,其来自thermoascus,如thermoascusaurantiacus,如在wo2005/074656中作为seqidno:2和在wo2014/130812中seqidno:1和wo2010/065830所述的;或来自thielavia,如thielaviaterrestris,如在wo2005/074647中作为seqidno:8或在wo2014/130812中的seqidno:4,wo2008/148131和wo2011/035027中所述的;或来自aspergillus,如aspergillusfumigatus,如在wo2010/138754作为seqidno:2或在wo2014/130812中的seqidno:3所述的;或来自penicillium,如penicilliumemersonii,如作为wo2011/041397中的seqidno:2或在wo2014/130812中的seqidno:2所述的。另一些合适的具有增强纤维素分解的活性的多肽例如溶解性多糖单加氧酶包括但不限于trichodermareesei(参见wo2007/089290)、myceliophthorathermophila(参见wo2009/085935、wo2009/085859、wo2009/085864、wo2009/085868)、penicilliumpinophilum(参见wo2011/005867)、thermoascussp.(参见wo2011/039319)和thermoascuscrustaceous(参见wo2011/041504)。在一个优选的实施方式中,溶解性多糖单加氧酶来自rasamsonia,例如rasamsoniaemersonii(参见wo2012/000892)。在一个方面,根据wo2008/151043在存在可溶的活化二价金属阳离子(例如硫酸锰)的情况下使用具有增强纤维素分解的活性的多肽,例如溶解性多糖单加氧酶。在一个方面中,在存在二氧基化合物、双环化合物、杂环化合物、含氮化合物、醌化合物、含硫化合物或从预处理的纤维素材料如预处理的玉米秸秆获得的液体的情况下使用具有增强纤维素分解的活性的多肽,例如溶解性多糖单加氧酶。

可包含在本文所述的组合物中的另一些纤维素分解酶在wo98/13465、wo98/015619、wo98/015633、wo99/06574、wo99/10481、wo99/025847、wo99/031255、wo2002/101078、wo2003/027306、wo2003/052054、wo2003/052055、wo2003/052056、wo2003/052057、wo2003/052118、wo2004/016760、wo2004/043980、wo2004/048592、wo2005/001065、wo2005/028636、wo2005/093050、wo2005/093073、wo2006/074005、wo2006/117432、wo2007/071818、wo2007/071820、wo2008/008070、wo2008/008793、us5,457,046、us5,648,263和us5,686,593等等中描述。

另外,本文所述的组合物可以包含内切木聚糖酶。可包含在本文所述组合物中的内切木聚糖酶的实例包括但不限于来自aspergillusaculeatus(参见wo94/21785)、aspergillusfumigatus(参见wo2006/078256)、penicilliumpinophilum(参见wo2011/041405)、penicilliumsp.(参见wo2010/126772)、thielaviaterrestrisnrrl8126(参见wo2009/079210)和trichophaeasaccatagh10(参见wo2011/057083)的内切木聚糖酶。在一个优选的实施方式中,酶组合物包含来自rasamsonia,例如rasamsoniaemersonii(参见wo02/24926)的内切木聚糖酶。

另外,本文所述的组合物可以包含β-木糖苷酶。可包含在本文所述的组合物中的β-木糖苷酶的实例包括但不限于来自neurosporacrassa和trichodermareesei的β-木糖苷酶。在一个优选的实施方式中,酶组合物包含来自rasamsonia,例如rasamsoniaemersonii(参见wo2014/118360)的β-木糖苷酶。

另外,本文所述的组合物可以包含乙酰木聚糖酯酶。可包含在酶组合物中的乙酰木聚糖酯酶的实例包括但不限于来自aspergillusaculeatus(参见wo2010/108918)、chaetomiumglobosum,chaetomiumgracile,humicolainsolensdsm1800(参见wo2009/073709)、hypocreajecorina(参见wo2005/001036)、myceliophterathermophila(参见wo2010/014880)、neurosporacrassa,phaeosphaerianodorum和thielaviaterrestrisnrrl8126(参见wo2009/042846)的乙酰木聚糖酯酶。可包含在酶组合物中的阿魏酸酯酶的实例包括但不限于来自humicolainsolensdsm1800(参见wo2009/076122)、neosartoryafischeri,neurosporacrassa,penicilliumaurantiogriseum(参见wo2009/127729)和thielaviaterrestris(参见wo2010/053838和wo2010/065448)的阿魏酸酯酶。可以包含在酶组合物中的阿拉伯呋喃糖苷酶的实例包括但不限于来自aspergillusniger,humicolainsolensdsm1800(参见wo2006/114094和wo2009/073383)和m.giganteus(参见wo2006/114094)的阿拉伯呋喃糖苷酶。可以包含在酶组合物中的α-葡糖醛酸酶的实例包括但不限于来自aspergillusclavatus,aspergillusfumigatus,aspergillusniger,aspergillusterreus,humicolainsolens(参见wo2010/014706)、penicilliumaurantiogriseum(参见wo2009/068565)和trichodermareesei的α-葡糖醛酸酶。

本文所述的组合物可包含一种、两种、三种、四种或更多种纤维素酶,例如溶解性多糖单加氧酶(lpmo)、内切葡聚糖酶(eg)、一种或两种外切纤维二糖水解酶(cbh)和β-葡糖苷酶(bg)中的一种、两种、三种或四种或全部。本文所述的酶组合物可包含两种或更多种任何这些种类的纤维素酶。

本文所述的组合物可包含由本文所述的组合物提供的一种纤维素酶活性和/或半纤维素酶活性和/或果胶酶活性,和由额外的纤维素酶/半纤维素酶/果胶酶提供的第二种纤维素酶活性和/或半纤维素酶活性和/或果胶酶活性。

因此,本文所述的组合物可包含任何纤维素酶,例如溶解性多糖单加氧酶、纤维二糖水解酶、内切-β-1,4-葡聚糖酶、β-葡糖苷酶或β-(1,3)(1,4)-葡聚糖酶。

在一个实施方式中,本文所述的组合物包含本文所述的变体多肽、内切葡聚糖酶、β-葡糖苷酶、纤维二糖水解酶i、纤维二糖水解酶ii、内切木聚糖酶、β-木糖苷酶和溶解性多糖单加氧酶。

在本文中使用时,纤维二糖水解酶(ec3.2.1.91)是能够催化纤维素或纤维四糖中1,4-β-d-葡糖苷键水解、从链末端释放纤维二糖的任何多肽。这种酶也可以被称作纤维素酶1,4-β-纤维二糖苷酶(1,4-β-cellobiosidase),1,4-β-纤维二糖水解酶,1,4-β-d-葡聚糖纤维二糖水解酶,微晶纤维素酶(avicelase),外切-1,4-β-d-葡聚糖酶,外切纤维二糖水解酶或外切葡聚糖酶。

在本文中使用时,内切-β-1,4-葡聚糖酶(ec3.2.1.4)是能够催化纤维素、地衣淀粉或谷类β-d-葡聚糖中1,4-β-d-葡糖苷键内切水解的任何多肽。这种多肽也可以能够水解也含有1,3-键的β-d-葡聚糖中的1,4-键。这种酶也可以被称作纤维素酶、微晶纤维素酶、β-1,4-内切葡聚糖水解酶、β-1,4-葡聚糖酶、羧甲基纤维素酶、纤维糊精酶、内切-1,4-β-d-葡聚糖酶、内切-1,4-β-d-葡聚糖水解酶、内切-1,4-β-葡聚糖酶或内切葡聚糖酶。

在本文中使用时,β-葡糖苷酶(ec3.2.1.21)是能够催化末端、非还原性β-d-葡萄糖残基水解并释放β-d-葡萄糖的任何多肽。这种多肽可具有针对β-d-葡糖苷的广泛特异性,并且也可以水解以下一种或多种:β-d-半乳糖苷、α-l-阿拉伯糖苷、β-d-木糖苷或β-d-岩藻糖苷。这种酶也可以被称作苦杏仁苷酶、β-d-葡糖苷葡糖水解酶、纤维二糖酶或龙胆二糖酶。

在本文中使用时,β-(1,3)(1,4)-葡聚糖酶(ec3.2.1.73)是能够催化含有1,3-和1,4-键的β-d-葡聚糖中1,4-β-d-葡糖苷键水解的任何多肽。这种多肽可作用于地衣淀粉和谷类β-d-葡聚糖,但不作用于仅含1,3-或1,4-键的β-d-葡聚糖。这种酶也可以被称作地衣淀粉酶(licheninase),1,3-1,4-β-d-葡聚糖4-葡聚糖水解酶,β-葡聚糖酶,内切-β-1,3-1,4葡聚糖酶,地衣多糖酶(lichenase)或混合键β-葡聚糖酶。这种酶的替代物是被描述为内切-1,3(4)-β-葡聚糖酶的ec3.2.1.6。当其还原基团参与待水解的键的葡萄糖残基自身在c-3处被替换时,这种酶水解β-d-葡聚糖中的1,3-键或1,4-键。替代性名称包括内切-1,3-β-葡聚糖酶,昆布多糖酶,1,3-(1,3;1,4)-β-d-葡聚糖3(4)葡聚糖水解酶。底物包括昆布多糖,地衣淀粉和谷类β-d-葡聚糖。

本文所述的组合物可以包含任何半纤维素酶,例如内切木聚糖酶、β-木糖苷酶、α-l-阿拉伯呋喃糖苷酶、α-d-葡糖醛酸酶、乙酰木聚糖酯酶、阿魏酸酯酶、香豆酸酯酶、α-半乳糖苷酶、β-半乳糖苷酶、β-甘露聚糖酶或β-甘露糖苷酶。

在本文中使用时,内切木聚糖酶(ec3.2.1.8)是能够催化木聚糖中1,4-β-d-木糖苷键内切水解的任何多肽。这种酶也可以被称作内切-1,4-β-木聚糖酶或1,4-β-d-木聚糖木聚糖水解酶。供替代的选择是ec3.2.1.136葡糖醛酸阿拉伯木聚糖内切木聚糖酶(glucuronoarabinoxylanendoxylanase),其能够水解葡糖醛酸阿拉伯木聚糖中1,4木糖苷键。

在本文中使用时,β-木糖苷酶(ec3.2.1.37)是能够催化1,4-β-d-木聚糖的水解,从非还原性末端去除相继的d-木糖残基的任何多肽。这种酶也可以水解木二糖。这种酶也可以被称作木聚糖1,4-β-木糖苷酶、1,4-β-d-木聚糖木糖水解酶、外切-1,4-β-木糖苷酶或木二糖酶。

在本文中使用时,α-l-阿拉伯呋喃糖苷酶(ec3.2.1.55)是能够作用于α-l-阿拉伯呋喃糖苷、含(1,2)和/或(1,3)-和/或(1,5)-键的α-l-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖的任何多肽。这种酶也可以被称作α-n-阿拉伯呋喃糖苷酶、阿拉伯呋喃糖苷酶或阿拉伯糖苷酶。

在本文中使用时,α-d-葡糖醛酸酶(ec3.2.1.139)是能够催化以下形式反应的任何多肽:α-d-葡糖醛酸苷+h(2)o=醇+d-葡糖醛酸(d-glucuronate)。这种酶也被称作α-葡糖醛酸酶或α-葡糖苷酸酶(alpha-glucosiduronase)。这些酶也可水解可作为木聚糖中替换基存在的4-o-甲基化的葡糖醛酸。供替代的选择是ec3.2.1.131:木聚糖α-1,2-葡糖醛酸酶,其催化α-1,2-(4-o-甲基)葡糖醛酸基连接的水解。

在本文中使用时,乙酰基木聚糖酯酶(ec3.1.1.72)是能够催化木聚糖和木寡糖脱乙酰化的任何多肽。这种多肽可催化来自多聚木聚糖、乙酰化木糖、乙酰化葡萄糖、α-萘基乙酸酯或对硝基苯基乙酸酯的乙酰基水解,但是一般不催化来自于三乙酰基丙三醇的乙酰基水解。这种多肽一般不作用于乙酰化的甘露聚糖或果胶。

在本文中使用时,阿魏酸酯酶(ec3.1.1.73)是能够催化以下形式反应的任何多肽:阿魏酸基-糖+h2o=阿魏酸(ferulate)+糖。糖可以是例如寡糖或多糖。其典型地可以催化来自酯化的糖的4-羟基-3-甲氧基肉桂酰(阿魏酰)基的水解,所述糖通常是“天然”底物中的阿拉伯糖。对硝基苯酚乙酸酯和阿魏酸甲基酯是典型地更弱的底物。这种酶也可以被称作肉桂酰基酯水解酶,阿魏酸酯酶或羟基肉桂酰基酯酶。也可以被称作半纤维素酶辅助酶,因为其可帮助木聚糖酶和果胶酶分解植物细胞壁半纤维素和果胶。

在本文中使用时,香豆酰基酯酶(ec3.1.1.73)是能够催化以下形式反应的任何多肽:香豆酰基-糖+h(2)o=香豆酸(coumarate)+糖。糖可以是例如寡糖或多糖。这种酶也可以被称作反式-4-香豆酰基酯酶、反式-对香豆酰基酯酶、对香豆酰基酯酶或对香豆酸酯酶。这种酶也落入ec3.1.1.73中,从而也可以被称作阿魏酸酯酶。

在本文中使用时,α-半乳糖苷酶(ec3.2.1.22)是能够催化α-d-半乳糖苷(包括半乳糖寡糖、半乳甘露聚糖、半乳聚糖和阿拉伯半乳聚糖)中末端、非还原性α-d-半乳糖残基水解的任何多肽。这种多肽也可以能够水解α-d-岩藻糖苷。所述酶也可以被称作蜜二糖酶。

在本文中使用时,β-半乳糖苷酶(ec3.2.1.23)是能够催化β-d-半乳糖苷中末端非还原性β-d-半乳糖残基水解的任何多肽。这种多肽也可以能够水解α-l-阿拉伯糖苷。这种酶也可以被称作外切-(1->4)-β-d-半乳聚糖酶或乳糖酶。

在本文中使用时,β-甘露聚糖酶(ec3.2.1.78)是能够催化甘露聚糖、半乳甘露聚糖和葡甘露聚糖中1,4-β-d-甘露糖苷键随机水解的任何多肽。这种酶也可以被称作甘露聚糖内切-1,4-β-甘露糖苷酶或内切-1,4-甘露聚糖酶。

在本文中使用时,β-甘露糖苷酶(ec3.2.1.25)是能够催化β-d-甘露糖苷中末端非还原性β-d-甘露糖残基水解的任何多肽。这种酶也可以被称作甘露聚糖酶或甘露糖酶。

本文所述的组合物可包含任何果胶酶,例如内切多聚半乳糖醛酸酶,果胶甲基酯酶,内切-半乳聚糖酶,β-半乳糖苷酶,果胶乙酰基酯酶,内切-果胶裂解酶,果胶酸裂解酶,α-鼠李糖苷酶,外切-半乳糖醛酸酶,外切多聚半乳糖醛酸裂解酶,鼠李半乳糖醛酸聚糖水解酶,鼠李半乳糖醛酸聚糖裂解酶,鼠李半乳糖醛酸聚糖乙酰基酯酶,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶,木半乳糖醛酸酶。

在本文中使用时,内切-多聚半乳糖醛酸酶(ec3.2.1.15)是能够催化果胶酸酯和其它半乳糖醛酸聚糖中1,4-α-d-半乳糖醛酸键的随机水解的任何多肽。这种酶也可以被称作多聚半乳糖醛酸酶果胶解聚酶,果胶酶(pectinase),内切多聚半乳糖醛酸酶,果胶酶(pectolase),果胶水解酶,果胶多聚半乳糖醛酸酶,多聚-α-1,4-半乳糖醛酸苷聚糖水解酶,内切半乳糖醛酸酶;内切-d-半乳糖醛酸酶或多聚(1,4-α-d-半乳糖醛酸苷)聚糖水解酶。

在本文中使用时,果胶甲基酯酶(ec3.1.1.11)是能够催化下述反应的任何酶:果胶+nh2o=n甲醇+果胶酸(pectate)。这种酶也被称为果胶酯酶(pectinesterase),果胶脱甲氧基酶,果胶甲氧基酶,果胶甲基酯酶,果胶酶,果胶酯酶(pectinoesterase)或果胶果基水解酶(pectinpectylhydrolase)。

在本文中使用时,内切-半乳聚糖酶(ec3.2.1.89)是能够催化阿拉伯半乳聚糖中1,4-β-d-半乳糖苷键的内切水解的任何酶。这种酶也被称为阿拉伯半乳聚糖内切-1,4-β-半乳糖苷酶,内切-1,4-β-半乳聚糖酶,半乳聚糖酶,阿拉伯半乳聚糖酶或阿拉伯半乳聚糖4-β-d-半乳聚糖水解酶。

在本文中使用时,果胶乙酰基酯酶在本文中被定义为下述任何酶,所述酶具有催化果胶gaiua残基羟基处的乙酰基的脱乙酰的乙酰基酯酶活性。

在本文中使用时,内切-果胶裂解酶(ec4.2.2.10)是能够催化(1→4)-α-d-半乳糖醛酸聚糖甲基酯的清除性切割,得到在其非还原末端具有4-脱氧-6-o-甲基-α-d-半乳-4-糖醛酰基的寡糖的任何酶。所述酶也可被称为果胶裂解酶,果胶反式消除酶(trans-eliminase),内切果胶裂解酶,多聚甲基半乳糖醛酸反式消除酶,果胶甲基反式消除酶,果胶溶解酶,pl,pnl或pmgl或(1→4)-6-o-甲基-α-d-半乳糖醛酸聚糖裂解酶。

在本文中使用时,果胶酸裂解酶(ec4.2.2.2)是能够催化(1→4)-α-d-半乳糖醛酸聚糖的消除性切割,得到在其非还原性末端具有4-脱氧-α-d-半乳-4-糖醛酸基的寡糖的任何酶。这种酶也可被称为多聚半乳糖醛酸反式消除酶,果胶酸反式消除酶,多聚半乳糖醛酸酯裂解酶,内切果胶甲基反式消除酶,果胶酸反式消除酶,内切半乳糖醛酸反式消除酶,果胶酸裂解酶,果胶裂解酶,α-1,4-d-内切多聚半乳糖醛酸裂解酶,pga裂解酶,ppase-n,内切-α-1,4-多聚半乳糖醛酸裂解酶,多聚半乳糖醛酸裂解酶,果胶反式消除酶,多聚半乳糖醛酸反式消除酶或(1→4)-α-d-半乳糖醛酸聚糖裂解酶。

在本文中使用时,α-鼠李糖苷酶(ec3.2.1.40)是能够催化α-l-鼠李糖苷或替代地鼠李半乳糖醛酸聚糖中末端非还原性α-l-鼠李糖残基水解的任何多肽。这种酶也可被称为α-l-鼠李糖苷酶t,α-l-鼠李糖苷酶n或α-l-鼠李糖苷鼠李糖水解酶。

在本文中使用时,外切-半乳糖醛酸酶(ec3.2.1.82)是能够从非还原性末端水解果胶酸,释放二半乳糖醛酸的任何多肽。所述酶也可被称为外切-多聚-α-半乳糖醛酸苷酶(exo-poly-α-galacturonosidase)、外切多聚半乳糖醛酸苷酶(exopolygalacturonosidase)或外切多聚聚半乳糖醛酸苷酶(exopolygalacturanosidase)。

在本文中使用时,外切-半乳糖醛酸酶(ec3.2.1.67)是能够催化以下的任何多肽:(1,4-α-d-半乳糖醛酸苷)n+h2o=(1,4-α-d-半乳糖醛酸苷)n-1+d-半乳糖醛酸(d-galacturonate)。这种酶也可被称为半乳糖醛1,4-α-半乳糖醛酸苷酶(galacturan1,4-α-galacturonidase),外切多聚半乳糖醛酸酶,多聚(半乳糖醛酸)水解酶,外切-d-半乳糖醛酸酶,外切-d-半乳糖醛酸聚糖酶,外切多聚-d-半乳糖醛酸酶或多聚(1,4-α-d-半乳糖醛酸苷)半乳糖醛酸水解酶。

在本文中使用时,外切多聚半乳糖醛酸裂解酶(ec4.2.2.9)是能够催化从果胶酸(即脱酯化的果胶)的还原末端消除性切割4-(4-脱氧-α-d-半乳-4-糖醛酸基)-d-半乳糖醛酸的任何多肽。这种酶也可被称为果胶酸二糖裂解酶,果胶酸外切裂解酶,外切果胶酸反式消除酶,外切果胶酸裂解酶,外切多聚半乳糖醛酸-反式-消除酶,pate,外切-pate,外切-pgl或(1→4)-α-d-半乳糖醛酸聚糖还原末端二糖裂解酶。

在本文中使用时,鼠李半乳糖醛酸聚糖水解酶是能够在由二糖[(1,2-α-l-鼠李糖基-(1,4)-α-半乳糖醛酸]组成的严格交替的鼠李半乳糖醛酸聚糖结构中以内切方式水解半乳基糖醛酸和吡喃鼠李糖基之间键的任何多肽。

在本文中使用时,鼠李半乳糖醛酸聚糖裂解酶是能够以内切方式在鼠李半乳糖醛酸聚糖中通过β-消除切割α-l-rhap-(1→4)-α-d-galpa键的任何多肽。

在本文中使用时,鼠李半乳糖醛酸聚糖乙酰基酯酶是能够催化鼠李半乳糖醛酸聚糖中交替的鼠李糖和半乳糖醛酸残基主链的脱乙酰化的任何多肽。

在本文中使用时,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶是能够以外切方式,从严格交替的鼠李半乳糖醛酸聚糖结构的非还原性末端水解半乳糖醛酸的任何多肽。

在本文中使用时,木半乳糖醛酸酶是通过以内切方式切割β-木糖替换的半乳糖醛酸主链而作用于木半乳糖醛酸聚糖的任何多肽。这种酶也可被称为木半乳糖醛酸聚糖水解酶。

在本文中使用时,内切阿拉伯聚糖酶(ec3.2.1.99)是能够催化1,5-阿拉伯聚糖中1,5-α-阿拉伯呋喃糖苷键内切水解的任何多肽。这种酶也可被称为内切阿拉伯糖酶,阿拉伯聚糖内切-1,5-α-l-阿拉伯糖苷酶,内切-1,5-α-l-阿拉伯聚糖酶,内切-α-1,5-阿拉伯聚糖酶;内切-阿拉伯聚糖酶或1,5-α-l-阿拉伯聚糖1,5-α-l-阿拉伯聚糖水解酶。

另外,本文所述的组合物中可以存在淀粉酶、蛋白酶、脂肪酶、木质酶、己糖基转移酶、葡糖醛酸酶、扩展蛋白(expansin)、纤维素诱导蛋白或纤维素整合蛋白或类似蛋白质中的一种或多种(例如两种、三种、四种或所有)。

“蛋白酶”包括水解肽键的酶(肽酶),以及水解肽和其它部分(如糖)之间键的酶(糖肽酶)。许多蛋白酶归类为ec3.4,它们适合在本文所述的方法中使用。一些特定类型的蛋白酶包括半胱氨酸蛋白酶(包括胃蛋白酶,木瓜蛋白酶)和丝氨酸蛋白酶(包括糜蛋白酶,羧肽酶和金属内切蛋白酶)。

“脂肪酶”包括水解脂质、脂肪酸和酰基甘油酯(包括磷酸甘油酯)、脂蛋白、二酰基甘油等等的酶。在植物中,脂质被用作结构组分,来限制水损失和病原体感染。这些脂质包括来自脂肪酸的蜡质,以及角质和木栓素(suberin)。

“木质酶”包括能够水解或分解木质素聚合物结构的酶。能够分解木质素的酶包括木质素过氧化物酶、锰过氧化物酶、漆酶和阿魏酸酯酶,和在本领域中已知解聚或以其它方式分解木质素聚合物的描述的其它酶。还包括在内的是能够水解在半纤维素糖(主要是阿拉伯糖)和木质素之间形成的键的酶。木质酶包括但不限于以下组的酶:木质素过氧化物酶(ec1.11.1.14)、锰过氧化物酶(ec1.11.1.13)、漆酶(ec1.10.3.2)和阿魏酸酯酶(ec3.1.1.73)。

“己糖基转移酶”(2.4.1-)包括能够催化转移酶反应,但是也能够催化例如纤维素和/或纤维素降解产物的水解反应的酶。可以在本申请中使用的己糖基转移酶的例子是β-葡聚糖基转移酶。这种酶可以能够催化(1,3)(1,4)葡聚糖和/或纤维素和/或纤维素降解产物的降解。

“葡糖醛酸酶”包括催化葡糖醛酸苷(例如β-葡糖醛酸苷)水解得到醇的酶。许多葡糖醛酸酶已被表征,并可适合在本申请中使用,例如β-葡糖醛酸酶(ec3.2.1.31),透明质酸酶葡糖醛酸酶(ec3.2.1.36),葡糖醛酰基-二硫葡糖胺葡糖醛酸酶(3.2.1.56),甘草酸β-葡糖醛酸酶(3.2.1.128)或α-d-葡糖醛酸酶(ec3.2.1.139)。

本文所述的组合物可包含扩展蛋白或扩展蛋白样蛋白质,如膨胀因子(swollenin)(参见salheimoetal.,eur.j.biohem.269,4202-4211,2002)或膨胀因子样蛋白质。

扩展蛋白参与植物细胞生长期间细胞壁结构的松弛。已经提出扩展蛋白破坏纤维素和其它细胞壁多糖之间的氢键,但不具有水解活性。认为它们通过这种方式允许纤维素纤维的滑动和细胞壁的扩大。一种扩展蛋白样蛋白质膨胀因子含有n端碳水化合物结合模块家族1结构域(cbd)和c端扩展蛋白样结构域。为了本申请的目的,扩展蛋白样蛋白质或膨胀因子样蛋白质可包含这种结构域中的一种或两种和/或可破坏细胞壁的结构(如破坏纤维素结构),任选地不生产可检测量的还原糖。

本文所述的组合物可以包含纤维素诱导的蛋白质,例如cip1或cip2基因或类似基因的多肽产物(参见foreman等人,j.biol.chem.278(34),31988-31997,2003),纤维素/纤维体(cellulosome)整合蛋白质,例如cipa或cipc基因的多肽产物,或支架蛋白或支架蛋白样蛋白质。支架蛋白和纤维素整合蛋白是多功能整合亚基,其可将纤维素分解亚基组织成多酶复合体。这通过两类互补结构域(即支架蛋白上的内聚结构域(cohesiondomain)和每个酶单元上的锚定结构域(dockerindomain))的相互作用完成。支架蛋白亚基还带有介导纤维体与其底物结合的纤维素结合模块(cbm)。用于本申请的目的,支架蛋白或纤维素整合蛋白可包含这种结构域中的一种或两种。

本文所述的组合物还可包含过氧化氢酶。术语“过氧化氢酶”表示过氧化氢:过氧化氢氧化还原酶(ec1.11.1.6或ec1.11.1.21),其催化两个过氧化氢至氧和两个水的转化。过氧化氢酶活性可通过基于下列反应监控在240nm的过氧化氢的降解而确定:2h2o2→2h2o+o2。该反应是在25℃下ph为7.0的50mm磷酸盐中以10.3mm底物(h2o2)和每ml大约为100单位的酶而进行的。在16-24秒内用分光光度法监控吸光度,这应对应于0.45至0.4的吸光度减少。一个过氧化氢酶活性单位可被表达为在ph为7.0且25℃下每分钟降解的一微摩尔的h2o2。

在本文中使用时,术语“淀粉酶”是指水解淀粉(直链淀粉和支链淀粉)中的α-1,4-糖苷键的酶,例如α-淀粉酶(ec3.2.1.1)、β-淀粉酶(ec3.2.1.2)、葡聚糖1,4-α-葡糖苷酶(ec3.2.1.3)、葡聚糖1,4-α-麦芽四糖水解酶(ec3.2.1.60)、葡聚糖1,4-α-麦芽六糖苷酶(ec3.2.1.98)、葡聚糖1,4-α-麦芽三糖水解酶(ec3.2.1.116)和葡聚糖1,4-α-麦芽糖水解酶(ec3.2.1.133);以及水解α-1,6-糖苷键(即支链淀粉中的分支点)的酶,例如支链淀粉酶(ec3.2.1.41)和极限糊精酶(ec3.2.1.142)。

本文所述的组合物可由上文提到的每种酶种类的成员、一个酶种类的若干成员、或这些酶种类或辅助蛋白(即本文提到的本身不具有酶活性,但是帮助木质纤维素降解的那些蛋白质)的任何组合构成。

本文所述的组合物可以由来自以下的酶构成:(1)供应商;(2)经克隆的表达酶的基因;(3)培养液(例如由培养基中微生物菌株的生长得到的,其中所述菌株向培养基中分泌蛋白质和酶);(4)如(3)中培养的菌株的细胞裂解物;和/或(5)表达酶的植物材料。本文所述的组合物中不同的酶可获自不同的来源。

在本文所述的用途和方法中,上述组合物的组分可以同时(即本身作为单一组合物)或分别或顺次提供。

酶可以在微生物、酵母、真菌、细菌或植物中外源产生,然后分离并加入例如纤维素或木质纤维素材料中。或者,酶可以在下述发酵中生产,所述发酵使用(预处理的)木质纤维素材料(例如玉米秆或麦秸)对生产酶的生物提供营养。通过这种方式,生产酶的植物自身可以作为木质纤维素材料,并且被添加进木质纤维素材料中。

在一个实施方式中,组合物是完整发酵液。在一个实施方式中,组合物是真菌、优选rasamsonia的完整发酵液的形式。完整发酵液可通过非重组和/或重组丝状真菌的发酵而制备。在一种实施方式中,丝状真菌是包含可以与丝状真菌同源或异源的一个或多个基因的重组丝状真菌。在一种实施方式中,丝状真菌是包含可以与丝状真菌同源或异源的一个或多个基因的重组丝状真菌,其中一个或多个基因对可降解纤维素底物的酶进行编码。完整发酵液可包含任何上述多肽或其任何组合。

优选地,组合物为完整发酵液,其中细胞被杀死。完整发酵液可包含有机酸(用于杀死细胞)、被杀死的细胞和/或细胞碎片和培养基。

一般地,在适于产生能够水解纤维素底物的酶的细胞培养基中培养丝状真菌。培养是使用在本领域中已知的程序在包括碳和氮源以及无机盐的合适的营养培养基中进行。合适的培养基、温度范围和适于生长和纤维素酶和/或半纤维素酶和/或果胶酶生产的其他条件在本领域中是已知的。完整发酵液可通过使丝状真菌生长至稳定期并在碳限制条件下将丝状真菌保持足以表达本文所述的变体多肽和/或一种或多种纤维素酶和/或半纤维素酶和/或果胶酶的时间段而制备。一旦丝状真菌将酶如本文所述的变体多肽和/或纤维素酶和/或半纤维素酶和/或果胶酶分泌至发酵培养基中,则可使用完整发酵液。本文所述的完整发酵液可包含丝状真菌。在一些实施方式中,完整发酵液包含源自发酵结束时的发酵材料的未分级物质。通常,完整发酵液包含已经利用过的培养基和在丝状真菌生长至饱和、在碳限制性条件下孵育以允许蛋白质合成(特别地,表达纤维素酶和/或半纤维素酶和/或果胶酶)后存在的细胞碎片。在一些实施方式中,完整发酵液包含已经利用过的细胞培养基、细胞外酶和丝状真菌。在一些实施方式中,存在于完整发酵液中的丝状真菌可使用本领域中已知的方法进行裂解、透化或杀灭以产生细胞经杀灭的完整发酵液。在一种实施方式中,完整发酵液是细胞经杀灭的完整发酵液,其中含有丝状真菌细胞的完整发酵液进行了裂解或杀灭。在一些实施方式中,通过化学和/或ph处理裂解丝状真菌而杀死细胞,从而生成丝状真菌的细胞经杀灭的完整发酵液。在一些实施方式中,通过化学和/或ph处理裂解丝状真菌而杀死细胞并将细胞经杀灭的发酵混合物的ph调整为合适的ph。在一种实施方式中,完整发酵液包含第一有机酸成分,其包括至少一个1-5碳有机酸和/或其盐,以及第二有机酸成分,其包括至少6个或更多碳的有机酸和/或其盐。在一种实施方式中,第一有机酸成分为醋酸、甲酸、丙酸、其盐或其任意组合,第二有机酸成分为苯甲酸、环己烷羧酸、4-甲基戊酸、苯乙酸、其盐或其任意组合。

在本文中使用时,术语“完整发酵液”指通过未进行或进行了最少回收和/或纯化的细胞发酵而产生的制备物。例如,完整发酵液是当微生物培养物生长至饱和并在碳限制性条件下孵育以允许蛋白质合成(例如,通过宿主细胞表达酶)以及分泌至细胞培养基中而产生的。通常,完整发酵液是未分级的且包括已经使用过的细胞培养基、细胞外酶和微生物,优选为非存活的细胞。

如果需要的话,完整发酵液可以是分级的且可使用经分级物质中的一种或更多种。例如,可从完整发酵液去除杀死的细胞和/或细胞碎片以提供不含这些成分的组合物。

完整发酵液可进一步地包括防腐剂和/或抗微生物剂。这种防腐剂和/或试剂是本领域中是已知的。

通常,如本文所述的完整发酵液为液体,但可含有不溶性成分,如杀死的细胞、细胞碎片、培养基成分和/或不溶性酶。在一些实施方式中,可去除不溶性成分以提供澄清的完整发酵液。

在一种实施方式中,完整发酵液可补充有一种或多种未内源性表达的或丝状真菌以相对低水平表达的酶活性,以提高纤维素底物降解例如为可发酵糖,如葡萄糖或木糖。补充酶可作为完整发酵液的补充剂而进行添加,酶可以是另外的完整发酵液的成分或可被纯化或最低程度地被回收和/或纯化。

在一种实施方式中,完整发酵液包括过表达一种或多种酶以提高纤维素底物的降解的重组丝状真菌的发酵的完整发酵液。或者,完整发酵液可包括非重组丝状真菌和过表达一种或多种酶以提高纤维素底物的降解的重组丝状真菌的发酵的完整发酵液的混合物。在一种实施方式中,完整发酵液包括过表达本文所述的变体多肽的丝状真菌的发酵的完整发酵液。在一个实施方式中,完整发酵液包括过表达另一种β-葡糖苷酶的丝状真菌的发酵的完整发酵液。或者,用于本发明方法和组合物中的完整发酵液可包括表达β-葡糖苷酶的非重组丝状真菌的发酵的完整发酵液和过表达本文所述变体多肽的重组丝状真菌的发酵的完整发酵液的混合物。或者,用于本发明方法和组合物中的完整发酵液可包括不表达任何β-葡糖苷酶的重组丝状真菌的发酵的完整发酵液和过表达本文所述变体多肽的重组丝状真菌的发酵的完整发酵液的混合物。

多肽和组合物的用途

本文所述的多肽和组合物可用于许多不同的应用中。例如,它们可以用来生产可发酵糖。然后作为生物燃料方法的一部分,可发酵糖可被转化为沼气或乙醇、丁醇、异丁醇,2-丁醇或其他合适的物质。所以,可发酵糖是指可以被微生物消耗或者被微生物转化为另一种产品的糖。或者,本文所述的变体多肽可(例如在食品的生产中,在洗涤剂组合物中,在造纸工业和制浆工业中,和在抗菌制剂中,在药物制品例如润喉片、牙膏和漱口水中)用作酶。所述用途中的一些将在下文中更详细地阐述。

在下文所述的用途和方法中,上述组合物的组分可以同时(即本身作为单一组合物)或分别或顺次提供。

本申请还涉及本文所述的变体多肽和组合物在工业方法中的用途。

原则上,本文所述的多肽或组合物可用于需要处理包含多糖的材料的任何方法中。因此,本文所述的多肽和/或组合物可用于多糖材料的处理。本文中,多糖材料是包含一种多糖或更典型地多于一种多糖或基本由一种多糖或更典型地多于一种多糖组成的材料。

典型地,植物和源自其的材料包含大量非淀粉的多糖材料。因此,本文所述的变体多肽可用于处理植物或真菌材料或源自其的材料。

纤维素材料

“底物”用于指包含碳水化合物材料的物质,其可以用本文所述的多肽处理,以使碳水化合物材料被改性。底物可以是预处理或未预处理的底物。除了碳水化合物材料之外,底物可以含有任何其他组分,包括但不限于非碳水化合物材料和淀粉。底物可以是纤维素材料。底物也可以是木质纤维素材料。

纤维素和木质纤维素材料在自然界中丰富,作为替代性能源具有巨大价值。第二代生物燃料(也被称为先进生物燃料)是可以由各种类型的这些材料制造的燃料。所述材料可以来源于植物,但也可以包括动物材料。材料的组成各不相同。主要组分是纤维素(通常为35-50%),其次是木聚糖(一种半纤维素,通常为20-35%)。一些材料还包含木质素(通常为10-25%)。所述材料还可以包含少量组分,如蛋白质、油和灰分(或无机化合物)。

所述材料包含各种碳水化合物。术语碳水化合物在生物化学中最常见,它是糖类的同义词。碳水化合物被分成四种化学分组:单糖,二糖,寡糖和多糖。一般而言,单糖和二糖是较小(较低分子量)的碳水化合物,它们通常被称为糖。在共同作用的不同酶的作用下,发生多糖向可溶性糖的酶促转化(例如水解),所述可溶性糖例如葡萄糖、葡萄糖酸、木糖、阿拉伯糖、半乳糖、果糖、甘露糖、鼠李糖、核糖、d-半乳糖醛酸以及其他己糖和戊糖。

可以根据待使用的特定底物来调整本文所述的组合物。也就是说,本文所述的组合物中的活性谱可以因所讨论的底物而异。

可以在微生物(例如酵母、真菌、细菌或植物)中外源性产生用于水解底物的酶,然后分离并添加到底物中。或者,可以产生酶,但不分离,并且可以将完整发酵液添加到底物中。或者,可以处理完整发酵液以防止进一步的微生物生长(例如,通过加热或添加抗微生物剂),然后添加到底物中。完整发酵液可以包括产生酶的生物体。或者,酶可以在使用底物向产生酶的生物体提供营养的发酵中产生。以这种方式,产生酶的植物可以充当底物并被添加到底物中。

合适的纤维素和/或木质纤维素材料的实例包括但不限于原始生物质(virginbiomass)和/或非原始生物质如农业生物质,草本材料,农业残余物,林业残余物,商业有机物,建筑和拆除碎片,市政固体废弃物,废纸,庭院废弃物以及浆和造纸厂残余物。常见的生物质形式包括树木,灌木丛(shrubs)和草,小麦,麦秸,甘蔗渣,玉米,玉米壳,玉米芯(corncobs),玉米粒(包括来自玉米粒的纤维),来自谷物如玉米、小麦和大麦研磨(包括湿磨和干磨)的通常称作“麸或纤维”的产物和副产物,以及市政固体废弃物,废纸和庭院废弃物。“农业生物质”包括树枝,灌木(bushes),藤蔓(canes),玉米和玉米壳,能量作物,森林,水果,花,谷物,草,草本作物,树叶,树皮,针叶,原木,根,树苗,短期轮种木本作物(short-rotationwoodycrops),灌木丛,柳枝稷,树木,蔬菜,水果皮,蔓藤(vines),甜菜浆,小麦麸皮(wheatmidlings),燕麦壳,和硬木材和软木材(不包括带有有害材料的木材)。另外,农业生物质包括由农业方法产生的有机废弃物材料,所述农业方法包括农业和林业活动,尤其包括林业木材废弃物。农业生物质可以是前述任一或其任何组合或混合物。合适的生物质的其它实例是果园底料,树丛,磨坊废弃物,城市木材废弃物,市政废弃物,伐木废弃物,森林疏伐废弃物,短期轮种木本作物,工业废弃物,小麦秸,燕麦秸,水稻秸,甘蔗秸,大麦秸,黑麦秸,亚麻秸,大豆壳,稻壳,水稻秸,玉米谷蛋白饲料,燕麦壳,甘蔗,玉米秸秆,玉米杆,玉米芯,玉米纤维,玉米壳,牧场草,磨擦禾,狐尾草;甜菜浆,柑橘果实浆,种子壳,纤维素动物粪便,草坪修剪废弃物,棉花,海藻,树木,灌木丛,草,小麦,小麦秸,甘蔗渣,玉米,玉米壳,玉米棒,玉米粒,来自玉米粒的纤维,来自谷物湿磨或干磨的产物和副产物,市政固体废弃物,废纸,庭院废弃物,草本材料,农业残余物,林业残余物,市政固体废弃物,废纸,纸浆,造纸厂残余物,树枝,灌木,甘蔗,玉米,玉米壳,能源作物,森林,水果,鲜花,谷物,草,草本作物,树叶,树皮,针叶,原木,根,树苗,灌木丛,柳枝稷,树木,蔬菜,水果皮,藤蔓,甜菜浆,小麦麸皮,燕麦壳,硬木材或软木材,由农业方法产生的有机废弃物材料,林业木材废弃物,或其中任意两种或更多的组合。

除了在食品和饲料或造纸和制浆工业中已被加工的原始生物质或原料之外,可额外用热、机械和/或化学改性或这些方法的任意组合来预处理生物质/原料以增强酶促降解。

预处理

在酶处理之前,可任选地以本领域已知的任何方式用热、机械和/或化学改性或这些方法的任意组合来预处理原料以增强底物对酶促水解的可及性和/或水解半纤维素和/或溶解半纤维素和/或纤维素和/或木质素。预处理可以包括使木质纤维素材料暴露于(热)水,蒸汽(蒸汽爆炸),酸,碱,溶剂,热,过氧化物,臭氧,机械粉碎,碾磨,研磨或快速释压,或者其中任两种或更多种的组合。这种化学预处理通常与热预处理(例如,在150-220℃下持续1-30分钟)相组合。

在一种实施方式中,在酶促水解之前和/或期间对木质纤维素材料进行预处理。预处理方法是本领域中已知的,其包括但不限于热、机械、化学修饰、生物修饰及其任意组合。通常,进行预处理以提高木质纤维素材料中木质纤维素材料对酶促水解的可接近性和/或水解半纤维素和/或使半纤维素和/或纤维素和/或木质素溶解。在一种实施方式中,预处理包括用蒸汽爆破、热水处理或稀酸或稀碱处理来处理木质纤维素材料。预处理方法的示例包括但不限于,蒸汽处理(例如,在100-260℃、7-45巴的压力和中性ph下处理1-10分钟)、稀酸处理(例如,在存在或不存在蒸汽的情况下在120-200℃、2-15巴的压力和酸性ph下用0.1-5%的h2so4和/或so2和/或hno3和/或hcl处理2-30分钟)、有机溶剂处理(例如,在存在有机溶剂和蒸汽的情况下在160-200℃、7-30巴的压力和酸性ph下用1-1.5%的h2so4处理30-60分钟)、石灰处理(例如,在存在水/蒸汽的情况下在60-160℃、1-10巴的压力和碱性ph下用0.1-2%的naoh/ca(oh)2处理60-4800分钟)、arp处理(例如,在150-180℃、9-17巴的压力和碱性ph下用5-15%的nh3处理10-90分钟)、afex处理(例如,在60-140℃、8-20巴的压力和碱性ph下用>15%的nh3处理5-30分钟)。

水解

本申请还涉及降解底物的方法,所述方法包括使底物与本文所述的变体多肽和/或本文所述的组合物接触的步骤。所述降解可导致产生糖。

本申请还涉及处理底物的方法,所述方法包括使底物与本文所述的变体多肽和/或本文所述的组合物接触的步骤。所述处理可导致产生糖。

本申请还涉及由底物生产糖的方法,所述方法包括以下步骤:(a)使用本文所述的变体多肽和/或本文所述的组合物酶促水解底物以获得酶促水解的底物,和(b)任选地回收所述酶促水解的底物。酶促水解的底物可以包含糖。

本申请还涉及从木质纤维素材料制备糖的方法,所述方法包括以下步骤:(a)用本文所述的变体多肽和/或本文所述的酶组合物水解木质纤维素材料以获得糖,和任选地,回收所述糖。

在一个实施方式中,底物包含碳水化合物材料。在一个实施方式中,底物包含纤维素和/或半纤维素。在一个实施方式中,底物包含纤维素材料。在一个实施方式中,底物包含木质纤维素材料。

在一个实施方式中,上述方法的ph在3.0和6.5之间,优选在3.5和5.5之间,更优选在4.0和5.0之间。

在进行所述方法之后,可使所得材料经受至少一次固/液分离。固/液分离的方法和条件取决于所用底物的类型,并且完全在本领域技术人员的能力范围内。实例包括但不限于离心、旋流分离、过滤、倾析、筛分和沉降。在一个优选的实施方式中,通过离心或沉降进行固体/液体分离。在固/液分离期间,可以使用用于改善分离的手段和/或辅助物。

在一个实施方式中,在上述方法之前,使底物经受预处理步骤。在一个实施方式中,在上述方法之前,使底物经受洗涤步骤。在一个实施方式中,在上述方法之前,使底物经受至少一次固/液分离。因此,在使底物经受任何上述方法之前,可使其经受至少一次固/液分离。固/液分离可以在预处理步骤之前和/或之后进行。上文已经描述了用于固/液分离的合适方法和条件。

在一个实施方式中,本申请涉及这样的方法,其中使酶促水解的底物经受固/液分离步骤,然后经受解毒步骤和/或浓缩步骤。

在本文所述的方法中,可以将底物加入一个或多个容器中。在一个实施方式中,在加入底物之前,本文所述的变体多肽和/或本文所述的组合物已经存在于一个或多个容器中。在另一个实施方式中,可以将本文所述的变体多肽和/或本文所述的组合物加入一个或多个容器中。在一个实施方式中,在加入本文所述的变体多肽和/或本文所述的组合物之前,底物已经存在于一个或多个容器中。在一个实施方式中,将底物和本文所述的变体多肽和/或本文所述的组合物同时添加到一个或多个容器中。一个或多个容器中存在的组合物可以是水性组合物。

上述方法可以包括其中底物被液化的液化步骤,以及其中液化的底物被糖化的糖化步骤。液化步骤有时称为预糖化步骤。在一个实施方式中,所述方法包括至少一个液化步骤,其中底物在至少第一容器中被液化,和糖化步骤,其中液化的底物在所述至少第一容器中和/或至少第二容器中被糖化。糖化可以在与液化相同的容器(即所述至少第一容器)中进行,它还可以在单独的容器(即至少第二容器)中进行。因此,在本文所述的方法中,可以将液化和糖化合并。或者,液化和糖化可以是单独的步骤。液化和糖化可以在不同的温度下进行,但是也可以在单一温度下进行。在一种实施方式中,液化的温度高于糖化的温度。液化优选地在60℃-75℃的温度下进行,并且糖化优选地在50℃-65℃的温度下进行。

所述方法可以在一个或多个容器中进行,但也可以在一个或多个管或任何其它连续系统中进行。当上述方法包括液化步骤和糖化步骤时也是如此。液化步骤可以在一个或多个容器中进行,但也可以在一个或多个管或任何其它连续系统中进行且/或糖化步骤可以在一个或多个容器中进行,但也可以在一个或多个管或任何其它连续系统中进行。待用于本发明中的容器的实例包括但不限于补料分批搅拌容器、分批搅拌容器、具有超滤作用的连续流搅拌容器和连续活塞流柱反应器。搅拌可以通过一个或多个叶轮、泵和/或静态混合器进行。

上述方法中使用的多肽和/或组合物可以在所述方法之前和/或期间加入。如上所述,当在上述方法之前使底物经受固/液分离时,可以在固/液分离之前加入上述方法中使用的多肽和/或组合物。或者,它们也可以在固/液分离之后或固/液分离之前和之后添加。也可以在上述方法期间加入多肽和/或组合物。在上述方法包括液化步骤和糖化步骤的情况下,可以在液化步骤期间和/或之后添加额外的多肽和/或组合物。额外的多肽和/或组合物可以在糖化步骤之前和/或期间加入。额外的多肽和/或组合物也可以在糖化步骤之后加入。

在一个实施方式中,总方法时间为10小时或更长,12小时或更长,14小时或更长,16小时或更长,18小时或更长,20小时或更长,30小时或更长,40小时或更长,50小时或更长,60小时或更长,70小时或更长,80小时或更长,90小时或更长,100小时或更长,110小时或更长,120小时或更长,130小时或更长,140小时或更长,150小时或更长,160小时或更长,170小时或更长,180小时或更长,190小时或更长,200小时或更长。

在一个实施方式中,总方法时间为10-300小时,16-275小时,优选20-250小时,更优选30-200小时,最优选40-150小时。

用于上述方法的一个或多个容器中的底物的粘度保持在10-4000cp之间,10-2000cp之间,优选10-1000cp之间。

在上述条件下孵育底物导致从底物释放或释出大量的糖。大量表示可用糖的至少20%、30%、40%、50%、60%、70%、80%、90%、95%或更多。

在所述方法包括液化步骤和糖化步骤的情况下,液化步骤中底物的粘度保持在10-4000cp之间、10-2000cp之间、优选10-1000cp之间,且/或糖化步骤中底物的粘度保持在10-1000cp之间、10-900cp之间、优选10-800cp之间。

可以使用brookfielddviii流变仪在上述方法所用的温度下测定粘度。

显著地,上述方法可使用高水平的(底物的)干物质进行。在一种实施方式中,在上述方法结束时的干物质含量为5wt%或更高、6wt%或更高、7wt%或更高、8wt%或更高、9wt%或更高、10wt%或更高、11wt%或更高、12wt%或更高、13wt%或更高、14wt%或更高、15wt%或更高、16wt%或更高、17wt%或更高、18wt%或更高、19wt%或更高、20wt%或更高、21wt%或更高、22wt%或更高、23wt%或更高、24wt%或更高、25wt%或更高、26wt%或更高、27wt%或更高、28wt%或更高、29wt%或更高、30wt%或更高、31wt%或更高、32wt%或更高、33wt%或更高、34wt%或更高、35wt%或更高、36wt%或更高、37wt%或更高、38wt%或更高或39wt%或更高。在一种实施方式中,在上述方法结束时的干物质含量为5wt%至40wt%、6wt%至40wt%、7wt%至40wt%、8wt%至40wt%、9wt%至40wt%、10wt%至40wt%、11wt%至40wt%、12wt%至40wt%、13wt%至40wt%、14wt%至40wt%、15wt%至40wt%、16wt%至40wt%、17wt%至40wt%、18wt%至40wt%、19wt%至40wt%、20wt%至40wt%、21wt%至40wt%、22wt%至40wt%、23wt%至40wt%、24wt%至40wt%、25wt%至40wt%、26wt%至40wt%、27wt%至40wt%、28wt%至40wt%、29wt%至40wt%、30wt%至40wt%、31wt%至40wt%、32wt%至40wt%、33wt%至40wt%、34wt%至40wt%、35wt%至40wt%、36wt%至40wt%、37wt%至40wt%、38wt%至40wt%、39wt%至40wt%。

在一种实施方式中,在上述方法的液化步骤结束时的干物质含量为5wt%或更高、6wt%或更高、7wt%或更高、8wt%或更高、9wt%或更高、10wt%或更高、11wt%或更高、12wt%或更高、13wt%或更高、14wt%或更高、15wt%或更高、16wt%或更高、17wt%或更高、18wt%或更高、19wt%或更高、20wt%或更高、21wt%或更高、22wt%或更高、23wt%或更高、24wt%或更高、25wt%或更高、26wt%或更高、27wt%或更高、28wt%或更高、29wt%或更高、30wt%或更高、31wt%或更高、32wt%或更高、33wt%或更高、34wt%或更高、35wt%或更高、36wt%或更高、37wt%或更高、38wt%或更高或39wt%或更高。在一种实施方式中,在上述方法的液化步骤结束时的干物质含量为5wt%至40wt%、6wt%至40wt%、7wt%至40wt%、8wt%至40wt%、9wt%至40wt%、10wt%至40wt%、11wt%至40wt%、12wt%至40wt%、13wt%至40wt%、14wt%至40wt%、15wt%至40wt%、16wt%至40wt%、17wt%至40wt%、18wt%至40wt%、19wt%至40wt%、20wt%至40wt%、21wt%至40wt%、22wt%至40wt%、23wt%至40wt%、24wt%至40wt%、25wt%至40wt%、26wt%至40wt%、27wt%至40wt%、28wt%至40wt%、29wt%至40wt%、30wt%至40wt%、31wt%至40wt%、32wt%至40wt%、33wt%至40wt%、34wt%至40wt%、35wt%至40wt%、36wt%至40wt%、37wt%至40wt%、38wt%至40wt%、39wt%至40wt%。

在一种实施方式中,在上述方法的糖化步骤结束时的干物质含量为5wt%或更高、6wt%或更高、7wt%或更高、8wt%或更高、9wt%或更高、10wt%或更高、11wt%或更高、12wt%或更高、13wt%或更高、14wt%或更高、15wt%或更高、16wt%或更高、17wt%或更高、18wt%或更高、19wt%或更高、20wt%或更高、21wt%或更高、22wt%或更高、23wt%或更高、24wt%或更高、25wt%或更高、26wt%或更高、27wt%或更高、28wt%或更高、29wt%或更高、30wt%或更高、31wt%或更高、32wt%或更高、33wt%或更高、34wt%或更高、35wt%或更高、36wt%或更高、37wt%或更高、38wt%或更高或39wt%或更高。在一种实施方式中,在上述方法的糖化步骤结束时的干物质含量为5wt%至40wt%、6wt%至40wt%、7wt%至40wt%、8wt%至40wt%、9wt%至40wt%、10wt%至40wt%、11wt%至40wt%、12wt%至40wt%、13wt%至40wt%、14wt%至40wt%、15wt%至40wt%、16wt%至40wt%、17wt%至40wt%、18wt%至40wt%、19wt%至40wt%、20wt%至40wt%、21wt%至40wt%、22wt%至40wt%、23wt%至40wt%、24wt%至40wt%、25wt%至40wt%、26wt%至40wt%、27wt%至40wt%、28wt%至40wt%、29wt%至40wt%、30wt%至40wt%、31wt%至40wt%、32wt%至40wt%、33wt%至40wt%、34wt%至40wt%、35wt%至40wt%、36wt%至40wt%、37wt%至40wt%、38wt%至40wt%、39wt%至40wt%。

在一种实施方式中,在上述方法期间添加氧。在一种实施方式中,在上述方法的至少部分期间添加氧。可以在上述方法期间连续或不连续地添加氧。在一种实施方式中,在上述方法期间一次或多次添加氧。在一种实施方式中,可以在上述方法之前、在将纤维素材料加入用于上述方法的容器中期间、在将酶加入用于上述方法的容器中期间、在上述方法的部分期间、在整个方法期间或其任何组合添加氧。将氧添加到用于上述方法的一个或多个容器中。

可用几种方式添加氧。例如,氧可作为氧气、富氧气体如富氧空气或空气而添加。也可以通过原位生成氧来添加氧。例如,可以通过电解生成氧,可以通过酶法(例如,通过添加过氧化物)产生氧,或可以通过化学方法(例如,通过氧生成系统例如khso5)产生氧。例如,通过过氧化氢酶由过氧化物产生氧。过氧化物可以以溶解的过氧化物的形式添加或通过酶促反应或化学反应生成。如果使用过氧化氢酶作为用于产生氧的酶,则可以使用存在于用于水解的酶组合物中的过氧化氢酶或者可以添加过氧化氢酶用于该目的。

如何添加氧的实例包括但不限于通过喷射、电解添加氧,化学添加氧,从顶部填充上述方法中使用的一个或多个容器(将水解物投入罐中,然后将氧引入到水解物)和向所述一个或多个容器的顶部空间添加氧。将氧添加到容器的顶部空间时,可以供应水解反应所需的充足氧。通常,可以控制和/或改变添加到容器中的氧的量。通过仅在所述容器中的部分水解时间期间添加氧来限制供应的氧是可行的。另一种选择是通过例如使用空气和循环空气(离开反应器的空气)的混合物或通过用惰性气体“稀释”空气来添加低浓度的氧。可以通过在更长的水解时间段期间添加氧、通过添加更高浓度的氧或通过添加更多的空气来增加添加的氧的量。控制氧浓度的另一种方法是添加耗氧物和/或产氧物。可以将氧引入例如吹入底物的液体水解容器内容物中。也可以将其吹入容器的顶部空间。

在一种实施方式中,在将底物添加到上述方法中使用的一个或多个容器之前和/或期间和/或之后,将氧添加到所述一个或多个容器中。氧可以与进入水解容器的底物一起引入。氧可被引入将进入容器的材料流中,或者与经过容器外环的部分容器内容物一起被引入。

在一种实施方式中,上述方法和/或多肽生产方法中所用的容器的容积为至少1m3。优选地,所述容器的容积为至少1m3、至少2m3、至少3m3、至少4m3、至少5m3、至少6m3、至少7m3、至少8m3、至少9m3、至少10m3、至少15m3、至少20m3、至少25m3、至少30m3、至少35m3、至少40m3、至少45m3、至少50m3、至少60m3、至少70m3、至少75m3、至少80m3、至少90m3、至少100m3、至少200m3、至少300m3、至少400m3、至少500m3、至少600m3、至少700m3、至少800m3、至少900m3、至少1000m3、至少1500m3、至少2000m3、至少2500m3。通常,容器小于3000m3或5000m3。如果上述方法中使用几个容器,则这些容器可以具有相同的容积,但也可以具有不同的容积。如果上述方法包括分开的液化步骤和糖化步骤,则用于液化步骤的容器和用于糖化步骤的容器可以具有相同的容积,但也可以具有不同的容积。

单独或同时进行的水解和发酵(参见下文)包括但不限于分步水解和发酵(shf)、同时糖化和发酵(ssf)、同时糖化和共发酵(sscf)、混合水解和发酵(hhf)、分步水解和共发酵(shcf)、混合水解和共发酵(hhcf)以及直接微生物转化(dmc)(有时也称为联合生物加工(cbp))。

发酵

本发明还涉及生产发酵产物的方法,所述方法包括以下步骤:(a)通过使底物与本文所述的变体多肽和/或本文所述的组合物接触来处理底物,和(b)发酵所得材料以生产发酵产物。所得材料可包含糖。

本申请还涉及生产发酵产物的方法,所述方法包括以下步骤:(a)用本文所述的变体多肽和/或本文所述的组合物酶促水解底物,(b)发酵所述酶促水解的纤维素底物以生产发酵产物,和(c)任选地回收所述发酵产物。

本申请还涉及由木质纤维素材料生产发酵产物的方法,所述方法包括以下步骤:(a)用本文所述的变体多肽和/或本文所述的组合物水解木质纤维素材料以获得糖,(b)通过使所获得的糖与发酵微生物接触来发酵所获得的糖,以生产发酵产物,和(c)任选地回收所述发酵产物。

例如,在本文所述的方法中,本文所述的变体多肽和/或本文所述的组合物作用于底物,以便将该底物转化为用于生产发酵产物的糖和寡糖。

因此,本申请还提供了生产发酵产物的方法,所述方法包括(a)使用本文所述的方法降解底物,和(b)发酵所得材料,从而制备发酵产物。生产发酵产物的上述方法可以任选地包括回收发酵产物。

在一个实施方式中,在一个或多个容器中进行发酵(即步骤b)。在一个实施方式中,通过产醇的微生物进行发酵以生产醇。在一个实施方式中,通过产有机酸的微生物进行发酵以生产有机酸。通过产醇的微生物进行发酵以生产醇可以在进行步骤(a)的同一容器中进行。或者,通过产醇的微生物进行发酵以生产醇和通过产有机酸的微生物进行发酵以生产有机酸可以在一个或多个单独的容器中进行,但也可以在一个或多个相同的容器中进行。

在一个实施方式中,通过酵母进行发酵。在一个实施方式中,产醇的微生物和/或产有机酸的微生物是酵母。在一个实施方式中,产醇的微生物能够发酵至少c5糖和至少c6糖。在一个实施方式中,产有机酸的微生物能够发酵至少c6糖。在一个实施方式中,产醇的微生物和产有机酸的微生物是不同的微生物。在另一个实施方式中,产醇的微生物和产有机酸的微生物是同一种微生物,即产醇的微生物也能够产有机酸如琥珀酸。

在另一个方面中,本申请因而包括这样的发酵方法,其中微生物被用于发酵包含糖(例如葡萄糖、l-阿拉伯糖和/或木糖)的碳源。碳源可包括包含l-阿拉伯糖、木糖或葡萄糖单元的任何碳水化合物寡聚体或多聚体,例如木质纤维素、木聚糖、纤维素、淀粉、阿拉伯聚糖等等。为了从这种碳水化合物释放木糖或葡萄糖单元,可将适宜的碳水化合物酶(例如木聚糖酶、葡聚糖酶、淀粉酶等等)添加至发酵培养基或可通过经修饰的宿主细胞对其进行生产。在后者的情况下,经修饰宿主细胞可被遗传工程改造,以生产并分泌这种碳水化合物酶。使用葡萄糖的寡聚体或多聚体来源的另外优势是,其能在发酵期间保持低的(较低的)游离葡萄糖浓度,例如通过使用限制速率的碳水化合物酶的量。这继而会防止对非葡萄糖的糖(例如木糖)代谢和运送所需体系的抑制。在一个优选的方法中,经修饰宿主细胞发酵l-阿拉伯糖(任选地木糖)和葡萄糖二者,优选地同时发酵,这种情况下优选地使用经改造的宿主细胞,所述宿主细胞对葡萄糖抑制不敏感,以防止二次生长(diauxicgrowth)。除了l-阿拉伯糖来源,任选地木糖(和葡萄糖)作为碳源之外,发酵培养基将进一步包含经修饰宿主细胞生长所需的适宜成分。用于微生物(例如酵母或丝状真菌)生长的发酵培养基的组成在本领域众所周知。

发酵时间可比在相同条件下的常规发酵中更短,其中部分酶促水解仍需在发酵期间进行。在一种实施方式中,就50g/l葡萄糖和来自纤维素材料的相应其它糖(例如50g/l木糖,35g/l的l-阿拉伯糖和10g/l的半乳糖)的糖组合物而言,发酵时间是100小时或更短,90小时或更短,80小或更短,70小时或更短,或60小时或更短。对于更稀的糖组合物,可相应减少发酵时间。在一种实施方式中,乙醇生产步骤的发酵时间对于由c6糖制造乙醇而言为10-50小时,对于由c5糖制造乙醇而言为20-100小时。在一种实施方式中,琥珀酸生产步骤的发酵时间为20-70小时。

发酵方法可以是需氧或厌氧发酵方法。厌氧发酵方法在本文中被定义为下述发酵方法,所述发酵方法在没有氧或基本上没有氧被消耗的情况下进行,优选地少于5、2.5或1mmol/l/h、更优选地0mmol/l/h(即氧消耗未被检测出)的氧被消耗,并且其中有机分子既作为电子供体又作为电子受体。没有氧时,在糖酵解和生物质形成中产生的nadh不可被氧化磷酸化所氧化。为解决该问题,许多微生物使用丙酮酸盐或其衍生物之一作为电子和氢受体,从此再产生nad+。因而,在一个优选的厌氧发酵方法中,丙酮酸盐被用作电子(和氢受体)并被还原为发酵产物,例如乙醇、乳酸、3-羟基丙酸、丙烯酸、乙酸、琥珀酸、柠檬酸、苹果酸、延胡索酸、氨基酸、1,3-丙烷-二醇、乙烯、甘油、丁醇、β-内酰胺抗生素和头孢菌素。在一个优选的实施方式中,发酵方法是厌氧的。厌氧方法是有利的,因为其比需氧方法更便宜:需要较少专门的设备。而且,预计厌氧方法给出比需氧方法更高的产品产出。在需氧条件下,通常生物质产率比在厌氧条件下更高。结果,通常在需氧条件下,期望的产物产率比在厌氧条件下低。

在另一实施方式中,发酵方法在限氧条件下。更优选地,发酵方法是需氧的并在限氧条件下。限氧发酵方法是这样的方法,其中氧消耗被氧从气体至液体的转移所限制。氧限制的程度由进入气流的量和组成以及使用的发酵设备的实际的混合/质量转移特性确定。优选地,在限氧条件下的方法中,氧消耗速率为至少5.5,更优选地至少6和甚至更优选地至少7mmol/l/h。

在一种实施方式中,醇发酵方法是厌氧的,而有机酸发酵方法是需氧的,但在限氧条件下进行。

发酵方法优选地在对于所用微生物而言最佳的温度下运行。因而,对于大多数酵母或真菌细胞而言,发酵方法在低于42℃,优选地38℃或更低的温度下进行。对于酵母或丝状真菌宿主细胞而言,发酵方法优选地在低于35℃、33℃、30℃或28℃的温度下并在高于20℃、22℃或25℃的温度下进行。在一种实施方式中,醇发酵步骤和有机酸发酵步骤在25℃至35℃之间进行。

在本申请的一种实施方式中,利用发酵微生物进行发酵。在本申请的一种实施方式中,利用发酵c5的微生物进行c5糖的醇(例如乙醇)发酵。在本申请的一种实施方式中,利用发酵c5的微生物或商业的发酵c6的微生物进行c6糖的醇(例如乙醇)发酵。适用于乙醇生产的市售酵母包括但不限于biofermtmaft和xr(nabc—northamericanbioproductscorporation,ga,usa)、ethanolredtm酵母(fermentis/lesaffre,usa)、falitm(fleischmann'syeast,usa)、fermioltm(dsmspecialties)、gertstrandtm(gertstrandab,瑞典)以及superstarttm和thermosacctm鲜酵母(ethanoltechnology,wi,usa)。

在一种实施方式中,在一个或多个增殖容器中进行产醇的微生物和/或产有机酸的微生物的增殖。增殖后,可以将产醇的微生物和/或产有机酸的微生物加入一个或多个发酵容器中。或者,将产醇的微生物和/或产有机酸的微生物的增殖分别与通过产醇的微生物和/或产有机酸的微生物的发酵组合以生产醇和/或有机酸。

在一种实施方式中,产醇的微生物是能够发酵至少一种c5糖的微生物。优选地,其还能够发酵至少一种c6糖。在一种实施方式中,本申请涉及从纤维素材料制备乙醇的方法,所述方法包括以下步骤:(a)进行如上所述的从纤维素材料制备糖产物的方法,(b)发酵酶促水解的纤维素材料以生产乙醇;和(c)任选地回收乙醇。可以用能够发酵至少一种c5糖的微生物进行发酵。

在一种实施方式中,产有机酸的微生物是能够发酵至少一种c6糖的微生物。在一种实施方式中,本申请涉及从纤维素材料制备琥珀酸的方法,所述方法包括以下步骤:(a)进行如上所述的从纤维素材料制备糖产物的方法,(b)发酵酶促水解的纤维素材料以生产琥珀酸;和(c)任选地回收琥珀酸。可以用能够发酵至少一种c6糖的微生物进行发酵。

产醇的微生物可以是原核或真核生物。用于所述方法中的微生物可以是经遗传改造的微生物。合适的产醇生物的实例为酵母,例如saccharomyces例如saccharomycescerevisiae,saccharomycespastorianus或saccharomycesuvarum,hansenula,issatchenkia,例如issatchenkiaorientalis,pichia,例如pichiastipites或pichiapastoris,kluyveromyces,例如kluyveromycesfagilis,candida,例如candidapseudotropicalis或candidaacidothermophilum,pachysolen,例如pachysolentannophilus或细菌,例如lactobacillus,例如lactobacilluslactis,geobacillus,zymomonas,例如zymomonasmobilis,clostridium,例如clostridiumphytofermentans,escherichia,例如e.coli,klebsiella,例如klebsiellaoxytoca。在一种实施方式中,能发酵至少一种c5糖的微生物是酵母。在一种实施方式中,酵母属于saccharomyces属,优选地是saccharomycescerevisiae种。本文所述的方法中使用的酵母(例如saccharomycescerevisiae)能够转化己(c6)糖和戊(c5)糖。本文所述的方法中使用的酵母(例如saccharomycescerevisiae)能够厌氧发酵至少一种c6糖和至少一种c5糖。例如,除了葡萄糖之外,酵母能够厌氧利用l-阿拉伯糖和木糖。在一种实施方式中,酵母能够将l-阿拉伯糖转化为l-核酮糖和/或木酮糖5-磷酸和/或转化为期望的发酵产物,例如转化为乙醇。可通过引入来自合适来源的araa(l-阿拉伯糖异构酶)、arab(l-核酮乙醛酸(l-ribuloglyoxalate))和arad(l-核酮糖-5-p4-差向异构酶)基因来修饰宿主酵母从而产生能够从l-阿拉伯糖生产乙醇的生物体(例如saccharomycescerevisiae菌株)。可向宿主细胞中引入所述基因以使它能够利用阿拉伯糖。wo2003/095627中描述给出了这种方式。可以使用来自lactobacillusplantarum的araa、arab和arad基因,其被公开于wo2008/041840中。可以使用来自bacillussubtilis的araa基因和来自escherichiacoli的arab和arad基因,其被公开于ep1499708中。在另一种实施方式中,如wo2009011591中所公开,araa、arab和arad基因可来来自clavibacter、arthrobacter和/或gramella属中的至少一种,特别地clavibactermichiganensis、arthrobacteraurescens和/或gramellaforsetii中的至少一种。在一种实施方式中,酵母还可包含木糖异构酶基因的一个或多个拷贝和/或木糖还原酶和/或木糖醇脱氢酶的一个或多个拷贝。

酵母可包含一种或多种遗传修饰以允许酵母发酵木糖。遗传修饰的实例是引入一个或多个xyla-基因、xyl1基因和xyl2基因和/或xks1-基因,缺失醛糖还原酶(gre3)基因,过表达ppp-基因tal1、tkl1、rpe1和rki1以允许细胞中通过戊糖磷酸途径的流量(flux)增加。基因工程酵母的实例被描述于ep1468093和/或wo2006009434中。

合适的商业酵母的实例是rn1016,rn1016是来自荷兰dsm的发酵木糖和葡萄糖的saccharomycescerevisiae菌株。

在一种实施方式中,用于生产乙醇的发酵方法是厌氧的。厌氧已在本文上文定义过。在另一优选的实施方式中,用于生产乙醇的发酵方法是需氧的。在另一优选的实施方式中,用于生产乙醇的发酵方法在限氧条件下,更优选地所述方法是需氧的并在限氧条件下。限氧条件已在本文上文定义过。

乙醇体积生产率优选地为至少0.5、1.0、1.5、2.0、2.5、3.0、5.0或10.0g乙醇/升/小时。方法中基于l-阿拉伯糖和任选的木糖和/或葡萄糖的乙醇产率优选地为至少20、25、30、35、40、45、50、60、70、80、90、95或98%。乙醇产率在本文中被定义为理论最大产率的百分比,对于葡萄糖、l-阿拉伯糖和任选的木糖,理论最大产率为0.51g乙醇/g葡萄糖或木糖。

在一个方面中,与已知乙醇发酵方法相比,导致乙醇生产的发酵方法具有若干优势:厌氧方法是可行的;限氧条件是可行的;能够获得更高的乙醇产率和乙醇生产速率;使用的菌株可以能够使用l-阿拉伯糖和任选地木糖。

替代上述发酵方法,可使用至少两种不同的细胞,这表示该方法是共发酵方法。如上所述的发酵方法的所有优选实施方式也是该共发酵方法的优选实施方式:发酵产物类别、l-阿拉伯糖来源和木糖来源类别、发酵条件(需氧或厌氧条件、限氧条件、方法进行的温度、乙醇生产力、乙醇产率)。

产有机酸的微生物可以是原核生物或真核生物。所述方法中使用的微生物可以是遗传工程微生物。合适的产有机酸的生物的实例是酵母,例如saccharomyces,例如saccharomycescerevisiae;真菌例如aspergillus菌株,例如aspergillusniger和aspergillusfumigatus,byssochlamysnivea,lentinusdegener,paecilomycesvarioti和penicilliumviniferum;和细菌,例如anaerobiospirillumsucciniciproducens,actinobacillussuccinogenes,mannheisucciniciproducersmbel55e,escherichiacoli,propionibacterium物种,pectinatussp.,bacteroidessp.,例如bacteroidesamylophilus,ruminococcusflavefaciens,prevotellaruminicola,succcinimonasamylolytica,succinivibriodextrinisolvens,wolinellasuccinogenes和cytophagasuccinicans。在一种实施方式中,能够发酵至少一种c6糖的产有机酸的微生物是酵母。在一种实施方式中,酵母属于saccharomyces属,优选为saccharomycescerevisiae种。本文所述的有机酸生产方法中使用的酵母(例如saccharomycescerevisiae)能够转化己(c6)糖。本文所述的方法中使用的酵母(例如saccharomycescerevisiae)酵母能够厌氧发酵至少一种c6糖。

可减少总反应时间(或水解步骤和发酵步骤合起来的反应时间)。在一种实施方式中,90%葡萄糖产率下的总反应时间为300小时或更少,200小时或更少,150小时或更少,140小时或更少,130小时或更少,120小时或更少,110小时或更少,100小时或更少,90小时或更少,80小时或更少,75小时或更少,或约72小时。相应地,在更低的葡萄糖产率下可达到更少总反应时间。

可通过本文所述方法生产的发酵产物可以是源自发酵的任何物质。其包括但不限于醇(如阿拉伯糖醇、丁醇、乙醇、甘油、甲醇、1,3-丙二醇、山梨糖醇和木糖醇);有机酸(如乙酸、丙酮酸、己二酸、抗坏血酸、丙烯酸、柠檬酸、2,5-二酮-d-葡糖酸、甲酸、富马酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、马来酸、苹果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸);酮(如丙酮);氨基酸(如天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸、色氨酸和苏氨酸);烷烃(如戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷和十二烷)、环烷烃(如环戊烷、环己烷、环庚烷和环辛烷)、烯烃(如戊烯、己烯、庚烯和辛烯);和气体(如甲烷、氢气(h2)、二氧化碳(co2)和一氧化碳(co))。发酵产物还可以是蛋白质、维生素、药物、动物饲料补充剂、特殊化学品、化学原料、塑料、溶剂、乙烯、酶如蛋白酶、纤维素酶、淀粉酶、葡聚糖酶、乳糖酶、脂肪酶、裂解酶、氧化还原酶、转移酶或木聚糖酶。在一个优选的实施方式中,在本文所述的发酵方法中制备有机酸和/或醇。在一个优选的实施方式中,在本文所述的发酵方法中制备琥珀酸和/或乙醇。

本文所述的多肽和组合物的用途

本文所述的变体多肽和组合物可用于许多不同的应用中。例如,它们可以用来生产可发酵糖。然后作为生物燃料方法的一部分,可发酵糖可被转化为沼气或乙醇、丁醇、异丁醇,2-丁醇或其他发酵产物。上文给出了一个非扩展性列表。

“可发酵糖”是指可被微生物消耗或被微生物转化成发酵产物的糖。

或者,本文所述的变体多肽和/或本文所述的组合物可被用在在食品的生产中,洗涤剂组合物中,造纸工业和制浆工业中,抗菌制剂中,药物制品中等。这些用途中的一些将在下文中更详细地阐述。

在下文所述的用途和方法中,上述组合物的组分可以同时(即本身作为单一组合物)或分别或顺次提供。

原则上,本文所述的变体多肽和/或本文所述的组合物可用于需要处理包含多糖的材料的任何方法中。因此,本文所述的变体多肽和/或本文所述的组合物可用于多糖材料的处理。本文中,多糖材料是包含一种多糖或更典型地多于一种多糖或基本由一种多糖或更典型地多于一种多糖组成的材料。

本申请还提供了本文所述的多肽和/或组合物在制备沼气的方法中的用途。沼气通常是指:在不存在氧的条件下,通过有机物质(例如纤维素材料)的生物降解产生的气体。沼气源自生物源材料,并且是一种生物燃料。一种沼气是通过可生物降解的材料(例如生物质、粪便或污水、市政废弃物和能源作物)的厌氧消化或发酵产生的。这种沼气主要由甲烷和二氧化碳组成。甲烷气体可以用氧燃烧或氧化。空气含有21%的氧。这种能量释放允许沼气被用作燃料。在任何国家中,沼气均可被用作低成本燃料,用于任何加热目的,例如烹饪。其也可以被用在现代废弃物管理设备中,在那里其可以被用于运行任何类型的热引擎,从而产生机械力或电力。微生物沼气生产中的第一步由聚合物和复合底物的酶促降解组成。因此,本申请提供了制备沼气的方法,其中使纤维素底物与本文所述的多肽和/或组合物接触,从而产生可发酵的材料,所述可发酵的材料可被生物体(例如微生物)转化成沼气。在此类方法中,可以通过表达本文所述的多肽和/或组合物的生物体(例如微生物)提供本文所述的多肽和/或组合物。

本文所述的多肽和/或组合物可用于处理材料以降解或改性材料的纤维素和/或半纤维素和/或果胶物质成分的方法。这些方法可用于制备食品。因此,本申请提供了制备食品的方法,所述方法包括在制备食品期间掺入本文所述的变体多肽和/或组合物。本申请还提供了加工纤维素材料的方法,所述方法包括使纤维素材料与本文所述的变体多肽和/或组合物接触以降解或改性材料中的纤维素。本申请还提供了用于降低纤维素材料的粘度、透明度和/或过滤性的方法,所述方法包括使材料与本文所述的变体多肽和/或组合物接触,量能够有效降解材料中的纤维素和/或半纤维素和/或果胶物质。在这方面,纤维素材料包括但不限于植物浆体、植物的部分和植物提取物。在本申请的上下文中,来自植物材料的提取物是可通过提取(机械和/或化学)、加工或其他分离技术从植物材料获得的任何物质。提取物可以是汁液、花蜜、碱或由其制成的浓缩物。植物材料可包含或源自蔬菜(例如胡萝卜、芹菜、洋葱、豆类或豆科植物(大豆、黄豆、豌豆))或水果,例如梨果(pome)或带种子的水果(seedfruit)(苹果、梨、榅桲等)、葡萄、西红柿、柑橘(橙、柠檬、枸橼、蜜桔)、甜瓜、洋李、樱桃、黑醋栗、红醋栗、覆盆子、草莓、蔓越莓、菠萝和其他热带水果,树及其部分(例如花粉,来自松树),或谷物(燕麦、大麦、小麦、玉米、水稻)。(要被水解的)材料也可以是农业残余物,例如甜菜浆、玉米芯、小麦秸、(粉碎的)坚果壳,或可再生材料,例如(废)纸。因此,本文所述的变体多肽可用于处理植物材料,包括植物浆体和植物提取物。它们也可用于处理液体或固体食品或可食用的食品成分,或用于提取咖啡、植物油、淀粉或用作食品中的增稠剂。通常,本文所述的变体多肽以如上所述的组合物的形式使用。通常将组合物加入可通过例如机械加工(如粉碎或碾磨)植物材料获得的植物浆体中。通常将组合物与植物一起孵育10分钟至5小时。处理温度优选为约10℃至约55℃,并且每吨待处理材料可以使用约10g至约300g酶。本文所述的变体多肽或组合物可以被先后或同时添加至植物浆体中。根据酶制品的组成,植物材料可首先被浸渍(例如至纯净)或液化。使用本文所述的变体多肽,可以改进加工参数,例如提取产率、提取物粘度和/或提取物品质。或者,或除上文以外,本文所述的变体多肽和/或组合物可以被添加至通过压榨或液化植物浆体而获得的粗制汁液中。在剂量、温度和持续时间方面,粗制汁液的处理与植物浆体以类似的方式进行。同样,可以包括其他酶,例如先前讨论的酶。典型的孵育条件如上文中所述。一旦用本文所述的变体多肽或组合物孵育了粗制汁液,则随后离心或过滤(超滤)汁液以生产最终产物。用本文所述的变体多肽和/或组合物处理后,可以对(终)产物进行热处理,例如在约100℃下进行约1分钟到约1小时,在使本文所述的变体多肽和/或组合物部分或完全失活的条件下进行。本文所述的变体多肽和/或组合物也可以在水果泥或蔬菜泥的制备期间使用。本文所述的变体多肽和/或组合物还可用在酿造、葡萄酒制造、蒸馏或烘焙中。其因而可用于制备酒精饮料,比如葡萄酒和啤酒。例如,其可改进例如啤酒、麦芽汁(例如含大麦和/或高粱麦芽)或葡萄酒的过滤性或透明度。另外,本文所述的变体多肽和/或组合物可用于酒糟(brewersspentgrain)(即来自啤酒麦芽汁生产的、含有大麦或发芽的大麦或其他谷物的残余物)的处理,以改进残余物的利用,例如用于动物饲料。本文所述的变体多肽和/或组合物可帮助从发酵液或培养基中去除溶解的有机物质,例如其中来自有机来源的蒸馏废弃物被生物转化为微生物生物质。本文所述的变体多肽和/或组合物可改进比如来自由(例如用α-淀粉酶)液化产生的谷物的葡萄糖浆的过滤性和/或降低其粘度。在烘焙中,本文所述的变体多肽和/或组合物可改善面团结构,改变其粘性或柔韧性,改进面包体积和/或碎屑结构,或赋予更好的质地特征,例如断裂品质、成条品质或碎屑品质。因此,本申请涉及制备面团或基于谷物的食品的方法,所述方法包括将本文所述的变体多肽和/或组合物掺入面团中。这可以改进面团或从面团获得的基于谷物的食品的一种或多种性质,这是相对于其中未掺入所述变体多肽和/或组合物的面团或基于谷物的食品而言。基于谷物的食品的制备还可以包括本领域已知的步骤,例如所得面团的煮、干燥、炸、蒸或烘焙。由煮过的面团制成的产品是例如煮过的面条、饺子,由炸过的面团制成的产品是例如甜甜圈、贝奈特饼、油炸面条,由蒸过的面团制成的制品是例如蒸馒头和蒸面,由干燥的面团制成的产品的例子是意大利面和干面条,由烘焙的面团制成的制品是面包、曲奇、蛋糕。术语“经改进的性质”在本文中被定义为相对于其中未掺入根据本文所述的变体多肽和/或组合物的面团或产品而言,通过根据本文所述的变体多肽和/或组合物的作用改进的面团和/或由面团获得的产品、尤其是基于谷物的食品的任何性质。经改进的性质可包括但不限于,提高的面团强度,提高的面团弹性,提高的面团稳定性,经改进的面团可加工性,经改进的面团醒发抗性,降低的面团粘度,经改进的面团延伸性,提高的基于谷物的食品体积,降低的基于谷物的食品发泡性,经改进的烘焙产品碎屑结构,经改进的基于谷物的食品的柔软性,经改进的基于谷物的食品的风味,经改进的基于谷物的食品的抗老化性(anti-staling)。与意大利面和面条类型的基于谷物的产品相关的经改进的性质是例如经改进的硬度,降低的粘度,经改进的凝聚性和降低的烹调损失。非淀粉多糖(nsp)能够提高食糜(digesta)的粘度,这可进而降低营养可用度和动物表现。对饲料添加特定的养分会改进动物消化并从而降低饲料成本。非淀粉多糖(nsp)基本上存在于植物来源的所有饲料成分中。nsp利用较差,并且在溶解时能够显示对消化的不良影响。外源酶能够有助于更好地利用这些nsp,并因此降低任何抗营养效应。本文所述的变体多肽和/或组合物可在基于谷物的家禽膳食中被用于该目的,或者在更小的程度上用于猪和其他物种。

本文所述的变体多肽和/或组合物可在洗涤剂工业中使用,例如用于从洗的衣物中去除基于碳水化合物的污点。洗涤剂组合物可包含本文所述的变体多肽和/或组合物,另外包含一种或多种纤维素,半纤维素酶,果胶酶,蛋白酶,脂肪酶,角质酶,淀粉酶或碳水化合物酶。包含本文所述的变体多肽和/或组合物的洗涤剂组合物可以呈任何方便的形式,例如糊剂、凝胶、粉末或液体。液体洗涤剂可以是水性的,通常含有多达约70%的水和约0至约30%的有机溶剂或非水性材料。此类洗涤剂组合物可例如被配制成手洗洗涤剂组合物或机洗洗涤剂组合物,包括适用于预处理脏污织物的洗衣添加组合物和漂洗添加的织物柔软剂组合物,或者被配制成用于一般居家硬表面清洁操作的洗涤剂组合物,或者被配制用于手洗或机洗的餐具洗涤操作。一般而言,本文所述的变体多肽和/或组合物的性质应该与所选择的洗涤剂相容(例如,ph-最适,与其他酶和/或非酶成分的相容性等),并且变体多肽和/或组合物应该以有效量存在。洗涤剂组合物可包含表面活性剂,例如阴离子或非离子型表面活性剂,洗涤剂增洁剂(builder)或络合剂,一种或多种聚合物,漂白体系(例如h2o2源)或酶稳定剂。洗涤剂组合物也可以包含任何其他常规的洗涤剂成分,例如调节剂包括粘土,泡沫增强剂,sud抑制剂,防腐蚀剂,土壤悬浮剂,土壤再沉淀剂,染料,杀菌剂,光学增亮剂,助水溶物,晦暗抑制剂或香料。

本文所述的变体多肽和/或组合物可用于造纸和制浆工业,尤其是漂白过程中,以增强被漂白的浆体的亮度,从而可以降低漂白阶段中使用的氯的量,并且提高浆体在再循环造纸方法中的自由度。此外,本文所述的变体多肽和/或组合物可用于处理木质纤维素浆体,从而改进其可漂白性。因此可以降低获得令人满意的浆体漂白所需要的氯量。

本文所述的变体多肽和/或组合物可用于下述方法中,所述方法降低含纤维素的织物变得粗糙的速率,或降低含纤维素的织物的粗糙度,所述方法包括用上文所述的变体多肽和/或组合物处理含纤维素的织物。本申请还涉及为有色的含纤维素的织物提供色彩澄清的方法,所述方法包括用上文所述的变体多肽和/或组合物处理有色的含有纤维素的织物,本发明还涉及在有色的含纤维素的织物中提供局部颜色变化的方法,所述方法包括用上文所述的变体多肽和/或组合物处理有色的含纤维素的织物。本文所述的方法可以通过在洗涤期间处理含纤维素的织物来进行。然而,如果期望,织物的处理也可以在浸泡或漂洗期间进行,或简单地通过将上文所述的多肽和/或组合物添加至浸渍或要浸渍织物的水中来进行。

另外,本文所述的变体多肽和/或组合物也可用于抗菌制剂以及药物产品例如润喉糖、牙膏和漱口水中。

实施例

实验信息

菌株

wt1:aspergillusniger菌株于1988年8月10日保藏在荷兰真菌培养物保藏中心(centraalbureauvoorschimmelcultures),uppsalalaan8,邮箱85167,nl-3508ad乌特勒支,荷兰,保藏号为cbs513.88。

wt2:该a.niger菌株是包含编码葡糖淀粉酶(glaa)的基因的缺失的wt1菌株。通过使用ep0635574b1中所述的“无标记基因”方法来构建wt2。在本专利中,广泛描述了如何缺失cbs513.88基因组中的glaa特异性dna序列。该程序导致无标记基因的δglaa重组a.nigercbs513.88菌株,最终完全没有外源dna序列。

wt3:该a.niger菌株是包含编码主要细胞外天冬氨酸蛋白酶pepa的pepa基因的缺失的wt2菌株,如vandenhombergh等人所述(vandenhomberghjp,sollewijngelpkemd,vandevondervoortpj,buxtonfp,visserj.(1997)-disruptionofthreeacidproteasesinaspergillusniger-effectsonproteasespectrum,intracellularproteolysis,anddegradationoftargetproteins-eurjbiochem.247(2):605-13)。该程序导致无标记基因的wt3菌株,其在wt2菌株背景中具有失活的pepa基因。

显示本文所述的效果和优点的合适rasamsonia(talaromyces)emersonii菌株有例如tec-101、tec-147、tec-192、tec-201或tec-210。它们在wo2011/000949中有描述。wo2011/098577中已经描述了含有cbhi、cbhii、eg4和β-葡糖苷酶(分别为30wt%、25wt%、28wt%和8wt%,wt%基于干物质蛋白质)的“4e混合物”或“4e组合物”。

rasamsonia(talaromyces)emersonii菌株tec-101(也称为fbg101)于2010年6月30日保藏在荷兰真菌培养物保藏中心,uppsalalaan8,邮箱85167,nl-3508ad乌特勒支,荷兰,保藏号为cbs127450。

分子生物学技术

在上述菌株中,使用本领域技术人员已知的分子生物学技术(参见sambrook和russell,molecularcloning:alaboratorymanual,第3版,cshlpress,coldspringharbor,ny,2001),如下文所述使几个基因过表达并使其它基因下调。用于基因过表达的表达载体和用于下调的破坏载体的一般设计、转化、标记物和选择性培养基的使用的实例可见于wo1998/46772、wo1999/32617、wo2001/121779、wo2005/095624、wo2006/040312、ep0635574b、wo2005/100573、wo2011/009700、wo2012/001169和wo2011/054899中。所有的基因置换载体都包含各开放阅读框(orf)序列的约1-2kb侧翼区,以在预定的基因组基因座靶向同源重组。另外,a.niger载体在直接重复之间含有a.nidulans双向amds选择标记物用于转化。应用于基因缺失的方法使用线性dna,其通过双交换在侧翼序列的同源基因座处整合到基因组中,从而用amds基因替换待缺失的基因。转化后,直接重复允许通过(第二)同源重组事件移除选择标记物。通过在氟乙酰胺培养基上铺板来移除amds标记,从而导致选择无标记基因的菌株。使用这种转化和随后的反选择策略,其在ep0635574中也被描述为“无标记基因”的方法。amds标记可以无限地用于菌株修饰程序中。

培养基和溶液

马铃薯葡萄糖琼脂,pda(fluka,目录号70139):每升:4g马铃薯提取物;20g葡萄糖;15g细菌用琼脂;ph5.4;在120℃下灭菌20分钟。

rasamsonia琼脂培养基:每升:15g3号盐级分;30g纤维素;7.5g细菌蛋白胨;15g谷物粉;5gkh2po4;1gcacl2.2aq;20g细菌用琼脂;ph6.0;在120℃下灭菌20分钟。

盐级分组成:“3号盐级分”符合wo98/37179的表1的公开内容。与该表的组成的差异为1.0g/lcacl2.2aq,1.8g/lkcl,0.45g/l一水柠檬酸(螯合剂)。

rasamsonia摇瓶培养基1:每升:20g葡萄糖;20g酵母提取物(difco);4滴clerolfba3107(af);30gmes;ph6.0;在120℃下灭菌20分钟。

rasamsonia摇瓶培养基2:每升:10g3号盐级分;10g葡萄糖;5gkh2po4;2gnah2po4;5g(nh4)2so4;30gmes;ph5.4;在120℃下灭菌20分钟。

rasamsonia摇瓶培养基3:每升:10g3号盐级分;20g纤维素;5gkh2po4;2gnah2po4;5g(nh4)2so4;30gmes;ph5.4;在120℃下灭菌20分钟。

rasamsonia摇瓶培养基4:每升:10g3号盐级分;15g纤维素;5g葡萄糖;5gkh2po4;2gnah2po4;5g(nh4)2so4;30gmes;ph5.4;在120℃下灭菌20分钟。

rasamsonia的孢子分批制备

使菌株在直径10cm的培养皿中在40℃下自rasamsonia琼脂培养基上从贮备物生长5-7天。对于mtp发酵,使菌株在含有rasamsonia琼脂培养基的96孔板中生长。将菌株贮备物在-80℃下储存在10%甘油中。

染色体dna分离

使菌株在ygg培养基(每升:8gkcl,16g葡萄糖.h2o,20ml10%酵母提取物,10ml100×青霉素/链霉素,6.66gynb+氨基酸,1.5g柠檬酸和6gk2hpo4)中在42℃、250rpm下生长16小时,并使用dneasy植物小型试剂盒(qiagen,hilden,德国)分离染色体dna。

rasamsonia的摇瓶生长方案

将孢子接种到含有20mlrasamsonia摇瓶培养基1的100ml摇瓶中,并在培养摇床中在45℃、250rpm下孵育1天(预培养物1),然后将来自预培养物1的1ml或2ml生物质转移到含有20mlrasamsonia摇瓶培养基2的100ml摇瓶中并在如上所述的条件下生长1天(预培养物2)。随后,将来自预培养物2的1ml或2ml生物质转移到含有20mlrasamsonia摇瓶培养基3或4的100ml摇瓶中并在上述条件下生长3天。蛋白质分析

将蛋白质样品在还原条件下在nupage4-12%bis-tris凝胶(invitrogen,breda,荷兰)上分离并染色。使用instantblue(expedeon,cambridge,英国)、simplybluesafestain(invitrogen,breda,荷兰)或syproruby(invitrogen,breda,荷兰),根据制造商的说明对凝胶进行染色。

利用tca-双缩脲法测定总蛋白质浓度

用水将浓缩蛋白质样品(上清液)稀释至浓度在2-8mg/ml之间。制备牛血清白蛋白(bsa)稀释物(0mg/ml、1mg/ml、2mg/ml、5mg/ml、8mg/ml和10mg/ml)并作为样品包括以生成校准曲线。对于每种经稀释的蛋白质样品,将270μl转移到含有830μl12%(w/v)三氯乙酸的丙酮溶液的10ml管中并充分混合。随后,将管在冰水中孵育1小时,并在4℃和6000rpm下离心30分钟。丢弃上清液,通过将管倒置在纸巾上并在室温下放置30分钟来干燥沉淀物。接下来,将3mlbioquantbiuret试剂混合物加入管中的沉淀物中,并通过混合使沉淀物溶解。接下来,将1ml水加入管中,将管充分混合并在室温下孵育30分钟。在546nm处测量混合物的吸收,其中使用水样品作为空白测量,并通过bsa校准线计算蛋白质浓度。

纤维素酶活性试验

为了测量纤维素酶活性,进行玉米秆活性试验。在空菌株和转化体的上清液(于其中培养细胞的培养液的液体部分)中测量纤维素酶活性:

制备预处理的玉米秸秆底物

如schell,d.j.,appliedbiochemistryandbiotechnology(2003),第105-108卷,第69-85页中所述获得稀酸预处理的玉米秸秆。使用中试规模预处理反应器,并在190℃、1分钟停留时间和液相中1.45%(重量/重量)的有效h2so4酸浓度的稳态条件下操作。

试验1:微量滴定板(mtp)2%未洗涤的酸预处理的玉米秸秆糖释放试验,其中除了tec-210或4e混合物之外还加入上清液

对于每种(半)纤维素酶试验,分析储存的样品两次;将100μl样品(例如摇瓶上清液)和100μl(半)纤维素酶基础混合物(3.5mg/gdmtec-210或总剂量为3.5mg/gdm的4种酶的混合物,其由0.3mg/gdmbg(总蛋白4e混合物的9%)、1mg/gdmcbhi(总蛋白4e混合物的30%)、0.9mg/gdmcbhii(总蛋白4e混合物的25%)和1.3mg/gdmgh61(总蛋白4e混合物的36%)组成)转移到两个合适的小瓶中:一个小瓶含有800μl在50mm柠檬酸盐缓冲液(缓冲在ph4.5)中的2.5%(w/w)干物质的酸预处理的玉米秸秆。另一个小瓶由空白组成,其中800μl2.5%(w/w)干物质的酸预处理的玉米秸秆被800μl50mm柠檬酸盐缓冲液(缓冲在ph4.5)代替。在65℃下孵育试验样品72小时。孵育试验样品之后,加入含有内标(马来酸(20g/l)和edta(40g/l))的固定体积的d2o(含0.5g/ldss)。释放的糖的量基于相对于dss在4.65-4.61ppm之间的信号,并借助于在500mhz质子频率下运行的1d1hnmr,使用具有水抑制的脉冲程序,在27℃的温度下进行测定。

(半)纤维素酶溶液可含有残余的糖。因此,针对酶溶液孵育后测量的糖含量校正试验结果。

试验2:在mtp中的2%未洗涤的酸预处理的玉米秸秆糖释放试验的剂量应答

由于纤维素酶的葡萄糖释放不是组合物中酶的量的线性函数,换句话说,在固定的时间点两倍的酶量不自动产生两倍的葡萄糖量。因此,在基于剂量应答的试验中评价了纤维素酶混合物的活性,其中剂量是基于每所检测纤维素混合物相等量的蛋白。

用未洗涤的酸预处理的玉米秸秆作为底物测量混合物的总纤维素酶活性。将冷冻的酶样品解冻,在ph4.5的50mm柠檬酸盐缓冲液中逐步按两倍进行范围从未稀释至高达32倍的一系列6个稀释。

将200μl样品转移到含有800μl在50mm柠檬酸盐缓冲液(缓冲在ph4.5)中的2.5%(w/w)干物质的酸预处理的玉米秸秆的小瓶中。将另外200μl样品转移到含有800μl50mm柠檬酸盐缓冲液(缓冲在ph4.5)的称为空白的小瓶中。另外,通过将800μl在50mm柠檬酸盐缓冲液(缓冲在ph4.5)中的2.5%(w/w)干物质的酸预处理的玉米秸秆与200μl50mm柠檬酸盐缓冲液一起孵育来测定玉米秸秆的糖背景。所有小瓶均在65℃下孵育72小时。

孵育后,将100μl内标溶液(d2o中的40g/ledta,20g/l马来酸)加入小瓶中。将含有预处理的玉米秸秆的所有小瓶在5300xg下离心30分钟,随后将600μl上清液转移到含有400μl9:1的h2o/d2o的新小瓶中。

使用具有水抑制的脉冲程序,在27℃的温度下,在于500mhz的质子频率下运行的avanceiiibruker上记录1d1h-nmr谱。相对于与6.30ppm处的内标信号有关的4,4-二甲基-4-硅杂戊烷磺酸,基于5.20ppm处的信号进行葡萄糖量化(任意单位)。通过酶溶液中存在的残余糖(由空白测量)和酸预处理的玉米秸秆中存在的残余糖来校正在样品中测量的葡萄糖,从而计算相对葡萄糖释放(△glc)。

由于样品的蛋白质浓度是已知的,因此糖释放可描述为所检测的稀释样品的蛋白质(mg/ml)相对于在时间点72小时的相对葡萄糖释放的函数。

β-葡糖苷酶基本活性试验

使用对硝基苯基-β-d-吡喃葡萄糖苷作为底物,在mtp规模活性试验中分析变体多肽的β-葡糖苷酶活性。使用具有seqidno:2的氨基酸序列的rasamsoniaemersoniiβ-葡糖苷酶(野生型/亲本β-葡糖苷酶)作为参照物。在100μl的总体积中,将表达变体多肽和野生型β-葡糖苷酶的a.nigermtp发酵物的上清液与3mm对硝基苯基-β-d-吡喃葡萄糖苷一起在50mm乙酸盐缓冲液(ph4.5)中在60℃下孵育10分钟。孵育时间之后,加入100μl终止溶液(1m碳酸钠),并通过测量405nm处的吸光度来测定水解的游离对硝基苯酚。作为空白,在相同条件(不含酶)下在100μl50mm乙酸盐缓冲液(ph4.5)中孵育底物对硝基苯基-β-d-吡喃葡萄糖苷,并在加入终止溶液后测定405nm处的吸光度。

β-葡糖苷酶热稳定性试验

首先,将本文所述的变体多肽在对4-硝基苯基-β-d-吡喃葡萄糖苷底物的催化活性方面归一化。因此,基于4-硝基苯基-β-d-吡喃葡萄糖苷底物测量本文所述的变体多肽的β-葡糖苷酶活性。通常,将50μl预稀释的a.nigermtp发酵材料与50μl在100mm乙酸钠缓冲液中的底物溶液一起在ph4.5和60℃温度下孵育。孵育时间为15分钟。15分钟后,通过加入100μl1m碳酸钠终止溶液来终止水解转化。对于变体多肽的每个样品,基于孵育过程中每mg孵育中存在的蛋白质形成的4-硝基苯酚的量来确定催化活性。4-硝基苯酚可以通过在碱性ph下测量405nm处的吸光度来确定。使用每mg蛋白质的活性值将本文所述的变体多肽归一化为相同的活性水平。在ph4.5的100mm乙酸钠缓冲液中制备稀释物。

然后,将50μl的每种归一化的样品的等分试样转移到pcr-mtp板中呈一个连续行的11个小瓶中。对于热休克,将每个小瓶加热并在具有通常设定在56-80℃范围内的温度梯度的pcr加热块中孵育10分钟。10分钟后,使用与上述相同的流程,基于4-硝基苯基-β-d-吡喃葡萄糖苷底物再次测定每种孵育的余留催化活性。对于每种变体多肽,未被孵育的样品也包括在活性试验中。

在活性试验之前,将每个小瓶中的样品在100mm乙酸钠缓冲液中稀释,以使测得的405nm处的吸光度在4-硝基苯酚标准校准曲线所确定的线性范围内。

使用11种温度孵育的余留活性来产生s形拟合,由所述s形拟合可以确定表观(aparent)熔融温度(t50)。与seqidno:2(野生型/亲本β-葡糖苷酶)的氨基酸序列相比展示出更高表观熔融温度的变体多肽被归类为热稳定性命中(hit)。

实施例1

a.niger表达载体的构建和变体多肽的表达

该实施例描述了用于在a.niger中过表达变体多肽的表达构建体的构建以及变体多肽的表达。

表达质粒的构建

将以下实施例2中所详述的野生型和一组多肽变体的序列合成为dna片段,亚克隆并通过序列分析核实序列。随后,利用ecori和paci位点将所有变体克隆到pgbtop载体(参见图1的总体布局)中,pgbtop载体包含葡糖淀粉酶启动子和终止子序列。已将葡糖淀粉酶glaa启动子的翻译起始序列修饰成5’-caccgtcaaaatg-3’,并在表达构建体的生成中使用最佳翻译终止序列5’-taaa-3’(也如wo2006/077258中所详述)。wo1999/32617中详细描述了此类载体的构建、总体布局和使用。在转化

a.nigerwt3之前通过noti消化除去e.coli部分。

a.niger转化和摇瓶发酵

根据例如wo1999/32617和wo2011/009700(及其中的参考文献)中描述的方法,用pgbtop表达构建体和含有pgbaas-1选择标记物(但可以使用任何合适的选择标记物-见上文:amds、潮霉素或腐草霉素或替代性标记物)的质粒共转化a.niger菌株wt3,并基本上如wo98/46772和wo99/32617以及其中的参考文献中和在本文的实验信息部分中所述,根据标准程序在含乙酰胺的培养基上选择并纯化菌落。通过pcr选择含有表达构建体的菌株以核实pgbtop表达盒的存在。在含有编码变体多肽的多核苷酸的重组菌株和对照a.niger菌株中,通过将孢子或菌丝体涂布在根据制造商的说明制备的pda板(马铃薯葡萄糖琼脂,oxoid)上来生成大批孢子。在30℃下生长3-7天后,于向板上加入0.01%tritonx-100后收集孢子。用无菌水洗涤后,将所选择的转化体和对照菌株的约107个孢子接种到带挡板的100ml摇瓶中,所述摇瓶含有20ml液体预培养基,每升所述预培养基由以下物质组成:30g麦芽糖.h2o;5g酵母提取物;10g水解酪蛋白;1gkh2po4;0.5gmgso4.7h2o;0.03gzncl2;0.02gcacl2;0.01gmnso4.4h2o;0.3gfeso4.7h2o;3gtween80;10ml青霉素(5000iu/ml)/链霉素(5000ug/ml);ph5.5。使这些培养物在34℃下生长16-24小时。将10ml这种培养物接种到带挡板的500ml摇瓶中,所述摇瓶含有100ml发酵培养基,每升所述发酵培养基由以下物质组成:70g葡萄糖.h2o;25g水解酪蛋白;12.5g酵母提取物;1gkh2po4;2gk2so4;0.5gmgso4.7h2o;0.03gzncl2;0.02gcacl2;0.01gmnso4.4h2o;0.3gfeso4.7h2o;10ml青霉素(5000iu/ml)/链霉素(5000ug/ml);调节至ph5.6。使这些培养物在34℃下生长直至耗尽所有葡萄糖(通常在4-7天后)。在悬桶式离心机中离心(在5000xg下10分钟)取自发酵液的样品,然后收集上清液并经0.2μm滤器(nalgene)过滤。

通过sds-page和总蛋白质测量分析上清液中变体多肽的表达。除了tec-210或4e混合物之外还加入含有变体多肽的a.niger上清液,并在玉米秸秆活性试验中进行分析。与其中未加入本文所述的变体多肽的上清液的对照相比,加入变体多肽的上清液显示出玉米秸秆的水解增加。如实施例2中所述对上清液进行热稳定性试验,以鉴定与亲本多肽相比具有更高热稳定性的变体多肽。

实施例2

鉴定具有较高热稳定性的变体多肽

所有变体多肽在a.niger中表达,并在摇瓶培养物中生长。在mtp规模活性试验中分析变体多肽的β-葡糖苷酶活性,其中使用3mm对硝基苯基-β-d-吡喃葡萄糖苷作为底物。使用具有seqidno:2的氨基酸序列的rasamsoniaemersoniiβ-葡糖苷酶(野生型/亲本β-葡糖苷酶)作为参照物。通常,将50μl预稀释的a.niger摇瓶发酵物质与50μl6mm对硝基苯基-β-d-吡喃葡萄糖苷底物溶液一起在100mm乙酸钠缓冲液中在ph4.5和60℃温度下孵育。选择发酵物质的稀释度以允许在4-硝基苯酚标准校准曲线的线性范围内在405nm处进行吸光度测量。上清液和底物的孵育时间为15分钟。15分钟后,通过添加100μl1m碳酸钠终止溶液来停止水解转化,并通过测量405nm处的吸光度来测定水解的游离对硝基苯酚。作为空白,在相同条件(不含酶)下在100μl50mm乙酸盐缓冲液(ph4.5)中孵育底物对硝基苯基-β-d-吡喃葡萄糖苷,并在加入终止溶液后测定405nm处的吸光度。对于每个发酵样品,基于每mg孵育中存在的蛋白质在孵育期间形成的4-硝基苯酚的量来确定催化活性。通过下述方法来确定形成的4-硝基苯酚的浓度:在碱性ph下测量405nm处的吸光度并通过4-硝基苯酚标准校准曲线计算浓度。使用每毫克蛋白质的活性值将变体多肽归一化为相同的活性值,这允许在后续实验的4-硝基苯酚校准曲线的线性范围内的活性测量。

在后续实验中,将50μl的每种归一化的样品的等分试样转移到pcr-mtp板中呈一个连续行的11个小瓶中。对于热休克,将每个小瓶加热并在跨越各个孔具有56.6、58.1、59.8、62.6、66、70、73.4、76.2、78.1、79.5和80℃的温度梯度的pcr加热块中孵育10分钟。10分钟后,使用与上述相同的流程,基于4-硝基苯基-β-d-吡喃葡萄糖苷底物再次测定每种孵育的余留催化活性。对于每种变体多肽,未被孵育的样品也包括在活性试验中。对于每个样品,计算所有12种温度孵育的β-葡糖苷酶活性。接下来,基于活性数据拟合逻辑函数(logisticfunction)以确定熔融温度(t50),其为s形的中点。结果如表1所示。

结果显示:变体多肽相较于其亲本多肽(包含seqidno:2的氨基酸序列的野生型多肽)展示出更高的熔融温度。因此,表1所示的变体多肽相较于亲本多肽具有更高的热稳定性。

表1:变体多肽的熔融温度

序列表

<110>帝斯曼知识产权资产管理有限公司

<120>β-葡糖苷酶及其用途

<130>31729-wo-pct

<150>ep15198954.8

<151>2015-12-10

<150>ep15198958.9

<151>2015-12-10

<150>ep15198789.8

<151>2015-12-10

<150>ep15198795.5

<151>2015-12-10

<150>ep15198803.7

<151>2015-12-10

<150>ep15199044.7

<151>2015-12-10

<150>ep15199086.8

<151>2015-12-10

<150>ep15199108.0

<151>2015-12-10

<150>ep15199109.8

<151>2015-12-10

<150>ep15199145.2

<151>2015-12-10

<150>ep15199152.8

<151>2015-12-10

<150>ep15198844.1

<151>2015-12-10

<150>ep15199030.6

<151>2015-12-10

<160>4

<170>patentinversion3.5

<210>1

<211>2574

<212>dna

<213>talaromycesemersonii

<220>

<221>cds

<222>(1)..(2574)

<400>1

atgcgcaacggtctgctcaaggttgctgctcttgctgctgcctccgcc48

metargasnglyleuleulysvalalaalaleualaalaalaserala

151015

gtcaacggcgagaacctggcctactctcctcccttctacccctccccc96

valasnglygluasnleualatyrserproprophetyrproserpro

202530

tgggccaacggccagggtgactgggctgaggcctaccagaaggccgtc144

trpalaasnglyglnglyasptrpalaglualatyrglnlysalaval

354045

cagttcgtcagccagctcaccctggctgagaaggtcaacctgaccact192

glnphevalserglnleuthrleualaglulysvalasnleuthrthr

505560

ggtactggctgggagcaggaccgctgcgttggccaggtcggctccatc240

glythrglytrpgluglnaspargcysvalglyglnvalglyserile

65707580

ccccgtcttggtttccccggtctttgcatgcaggactctcctcttggt288

proargleuglypheproglyleucysmetglnaspserproleugly

859095

gtccgtgacaccgactacaactctgctttccctgctggtgtcaacgtc336

valargaspthrasptyrasnseralapheproalaglyvalasnval

100105110

gctgccacctgggaccgcaacctggcctaccgccgtggtgttgccatg384

alaalathrtrpaspargasnleualatyrargargglyvalalamet

115120125

ggtgaggagcaccgtggcaagggtgttgatgtccagctcggtcctgtt432

glyglugluhisargglylysglyvalaspvalglnleuglyproval

130135140

gctggtcctctgggccgctctcccgatgctggccgcaactgggagggt480

alaglyproleuglyargserproaspalaglyargasntrpglugly

145150155160

ttcgctcctgaccccgtcctcactggtaacatgatggcctccaccatc528

phealaproaspprovalleuthrglyasnmetmetalaserthrile

165170175

cagggtatccaggatgctggtgtcattgcctgcgccaagcacttcatc576

glnglyileglnaspalaglyvalilealacysalalyshispheile

180185190

ctgtacgagcaggagcacttccgccagggtgctcaggatggctacgat624

leutyrgluglngluhispheargglnglyalaglnaspglytyrasp

195200205

atatctgactccatctccgccaacgccgatgacaagaccatgcacgag672

ileseraspserileseralaasnalaaspasplysthrmethisglu

210215220

ctctacctctggcccttcgccgatgccgtccgtgctggtgttggctcc720

leutyrleutrpprophealaaspalavalargalaglyvalglyser

225230235240

gtcatgtgctcctacaaccaggtcaacaactcctacgcctgctccaac768

valmetcyssertyrasnglnvalasnasnsertyralacysserasn

245250255

agctacaccatgaacaagctcttgaaatcagagcttggtttccagggt816

sertyrthrmetasnlysleuleulyssergluleuglypheglngly

260265270

ttcgtcatgactgactggggtggtcaccactctggtgttggttccgct864

phevalmetthrasptrpglyglyhishisserglyvalglyserala

275280285

cttgctggtcttgacatgagcatgcccggtgacattgctttcgactcc912

leualaglyleuaspmetsermetproglyaspilealapheaspser

290295300

ggtacctccttctggggtaccaacctgaccgttgccgtcctcaacggc960

glythrserphetrpglythrasnleuthrvalalavalleuasngly

305310315320

agcatccccgaatggcgtgtcgatgacatggccgtccgtatcatgtct1008

serileproglutrpargvalaspaspmetalavalargilemetser

325330335

gcctactacaaggtcggtcgtgaccgctactccgtccccatcaacttc1056

alatyrtyrlysvalglyargaspargtyrservalproileasnphe

340345350

gacagctggaccctcgacacctacggccctgagcactacgccgtcggc1104

aspsertrpthrleuaspthrtyrglyprogluhistyralavalgly

355360365

cagggtcagaccaagatcaacgagcacgttgatgtccgtggcaaccac1152

glnglyglnthrlysileasngluhisvalaspvalargglyasnhis

370375380

gctgagatcatccacgagatcggtgctgcctccgccgtcctcctcaag1200

alagluileilehisgluileglyalaalaseralavalleuleulys

385390395400

aacaagggtggtctgcccttgactggtactgagcgcttcgtcggtgtg1248

asnlysglyglyleuproleuthrglythrgluargphevalglyval

405410415

ttcggcaaggatgccggttccaacccctggggtgtcaacggctgctcc1296

pheglylysaspalaglyserasnprotrpglyvalasnglycysser

420425430

gaccgtggctgcgacaacggcaccctcgccatgggctggggcagcggt1344

aspargglycysaspasnglythrleualametglytrpglysergly

435440445

actgccaacttcccctacctggtcacccccgagcaggccatccagcgt1392

thralaasnpheprotyrleuvalthrprogluglnalaileglnarg

450455460

gaggtcctttctcgcaacggcaccttcactggtatcaccgacaacggt1440

gluvalleuserargasnglythrphethrglyilethraspasngly

465470475480

gctcttgctgagatggctgctgctgcctcccaggccgacacctgcctg1488

alaleualaglumetalaalaalaalaserglnalaaspthrcysleu

485490495

gtctttgccaacgccgacagcggtgagggctacatcaccgttgacggc1536

valphealaasnalaaspserglygluglytyrilethrvalaspgly

500505510

aacgagggtgaccgcaagaacctgaccctctggcagggtgccgaccag1584

asngluglyasparglysasnleuthrleutrpglnglyalaaspgln

515520525

gtcatccacaacgtttccgccaactgcaacaacactgttgttgtcctc1632

valilehisasnvalseralaasncysasnasnthrvalvalvalleu

530535540

cacaccgtcggtcctgtcctgattgatgactggtacgaccaccccaac1680

histhrvalglyprovalleuileaspasptrptyrasphisproasn

545550555560

gtcactgccatcctctgggctggtctgcccggtcaggagtccggcaac1728

valthralaileleutrpalaglyleuproglyglngluserglyasn

565570575

tcgctagttgatgtcctctacggccgtgtcaaccccggcaagactccc1776

serleuvalaspvalleutyrglyargvalasnproglylysthrpro

580585590

ttcacctggggtcgtgctcgtgatgactacggtgctcctctgattgtc1824

phethrtrpglyargalaargaspasptyrglyalaproleuileval

595600605

aagcccaacaacggcaagggtgctcctcagcaggacttcaccgagggt1872

lysproasnasnglylysglyalaproglnglnaspphethrglugly

610615620

atcttcattgactaccgccgcttcgacaagtacaacatcacccccatc1920

ilepheileasptyrargargpheasplystyrasnilethrproile

625630635640

tacgagttcggtttcggtctgagctacaccaccttcgagttctcccag1968

tyrglupheglypheglyleusertyrthrthrphegluphesergln

645650655

ctcaacgtccagcccatcaacgctcctccctacactcccgcctccggt2016

leuasnvalglnproileasnalaproprotyrthrproalasergly

660665670

ttcaccaaggctgctcagtccttcggccagccctccaacgcctccgac2064

phethrlysalaalaglnserpheglyglnproserasnalaserasp

675680685

aacctctacccctccgacattgagcgtgttcctctgtacatctacccc2112

asnleutyrproseraspilegluargvalproleutyriletyrpro

690695700

tggctcaacagcactgacctcaaggcctctgccaacgaccccgactac2160

trpleuasnserthraspleulysalaseralaasnaspproasptyr

705710715720

ggccttcctactgagaagtacgtgcctcccaacgccaccaacggtgac2208

glyleuprothrglulystyrvalproproasnalathrasnglyasp

725730735

ccccagcccattgaccctgctggtggtgctcctggtggcaacccctcc2256

proglnproileaspproalaglyglyalaproglyglyasnproser

740745750

ctctacgagcctgttgctcgtgtcaccaccatcatcaccaacactggc2304

leutyrgluprovalalaargvalthrthrileilethrasnthrgly

755760765

aaggtcactggtgatgaggttcctcagctctacgtcagccttggtggt2352

lysvalthrglyaspgluvalproglnleutyrvalserleuglygly

770775780

cccgatgatgctcccaaggtcctccgtggtttcgaccgtatcaccctg2400

proaspaspalaprolysvalleuargglypheaspargilethrleu

785790795800

gctcctggccagcagtacctctggaccaccaccctcacccgccgtgac2448

alaproglyglnglntyrleutrpthrthrthrleuthrargargasp

805810815

atctccaactgggaccccgtcacccagaactgggttgtcaccaactac2496

ileserasntrpaspprovalthrglnasntrpvalvalthrasntyr

820825830

accaagaccatctacgtcggcaacagctctcgcaacctgcccctccag2544

thrlysthriletyrvalglyasnserserargasnleuproleugln

835840845

gctcctctcaagccctaccccggcatataa2574

alaproleulysprotyrproglyile

850855

<210>2

<211>857

<212>prt

<213>talaromycesemersonii

<400>2

metargasnglyleuleulysvalalaalaleualaalaalaserala

151015

valasnglygluasnleualatyrserproprophetyrproserpro

202530

trpalaasnglyglnglyasptrpalaglualatyrglnlysalaval

354045

glnphevalserglnleuthrleualaglulysvalasnleuthrthr

505560

glythrglytrpgluglnaspargcysvalglyglnvalglyserile

65707580

proargleuglypheproglyleucysmetglnaspserproleugly

859095

valargaspthrasptyrasnseralapheproalaglyvalasnval

100105110

alaalathrtrpaspargasnleualatyrargargglyvalalamet

115120125

glyglugluhisargglylysglyvalaspvalglnleuglyproval

130135140

alaglyproleuglyargserproaspalaglyargasntrpglugly

145150155160

phealaproaspprovalleuthrglyasnmetmetalaserthrile

165170175

glnglyileglnaspalaglyvalilealacysalalyshispheile

180185190

leutyrgluglngluhispheargglnglyalaglnaspglytyrasp

195200205

ileseraspserileseralaasnalaaspasplysthrmethisglu

210215220

leutyrleutrpprophealaaspalavalargalaglyvalglyser

225230235240

valmetcyssertyrasnglnvalasnasnsertyralacysserasn

245250255

sertyrthrmetasnlysleuleulyssergluleuglypheglngly

260265270

phevalmetthrasptrpglyglyhishisserglyvalglyserala

275280285

leualaglyleuaspmetsermetproglyaspilealapheaspser

290295300

glythrserphetrpglythrasnleuthrvalalavalleuasngly

305310315320

serileproglutrpargvalaspaspmetalavalargilemetser

325330335

alatyrtyrlysvalglyargaspargtyrservalproileasnphe

340345350

aspsertrpthrleuaspthrtyrglyprogluhistyralavalgly

355360365

glnglyglnthrlysileasngluhisvalaspvalargglyasnhis

370375380

alagluileilehisgluileglyalaalaseralavalleuleulys

385390395400

asnlysglyglyleuproleuthrglythrgluargphevalglyval

405410415

pheglylysaspalaglyserasnprotrpglyvalasnglycysser

420425430

aspargglycysaspasnglythrleualametglytrpglysergly

435440445

thralaasnpheprotyrleuvalthrprogluglnalaileglnarg

450455460

gluvalleuserargasnglythrphethrglyilethraspasngly

465470475480

alaleualaglumetalaalaalaalaserglnalaaspthrcysleu

485490495

valphealaasnalaaspserglygluglytyrilethrvalaspgly

500505510

asngluglyasparglysasnleuthrleutrpglnglyalaaspgln

515520525

valilehisasnvalseralaasncysasnasnthrvalvalvalleu

530535540

histhrvalglyprovalleuileaspasptrptyrasphisproasn

545550555560

valthralaileleutrpalaglyleuproglyglngluserglyasn

565570575

serleuvalaspvalleutyrglyargvalasnproglylysthrpro

580585590

phethrtrpglyargalaargaspasptyrglyalaproleuileval

595600605

lysproasnasnglylysglyalaproglnglnaspphethrglugly

610615620

ilepheileasptyrargargpheasplystyrasnilethrproile

625630635640

tyrglupheglypheglyleusertyrthrthrphegluphesergln

645650655

leuasnvalglnproileasnalaproprotyrthrproalasergly

660665670

phethrlysalaalaglnserpheglyglnproserasnalaserasp

675680685

asnleutyrproseraspilegluargvalproleutyriletyrpro

690695700

trpleuasnserthraspleulysalaseralaasnaspproasptyr

705710715720

glyleuprothrglulystyrvalproproasnalathrasnglyasp

725730735

proglnproileaspproalaglyglyalaproglyglyasnproser

740745750

leutyrgluprovalalaargvalthrthrileilethrasnthrgly

755760765

lysvalthrglyaspgluvalproglnleutyrvalserleuglygly

770775780

proaspaspalaprolysvalleuargglypheaspargilethrleu

785790795800

alaproglyglnglntyrleutrpthrthrthrleuthrargargasp

805810815

ileserasntrpaspprovalthrglnasntrpvalvalthrasntyr

820825830

thrlysthriletyrvalglyasnserserargasnleuproleugln

835840845

alaproleulysprotyrproglyile

850855

<210>3

<211>2577

<212>dna

<213>talaromycesemersonii

<220>

<221>cds

<222>(1)..(2577)

<400>3

atgaggaacgggttgctcaaggtcgccgcccttgcggccgcttcggtc48

metargasnglyleuleulysvalalaalaleualaalaalaserval

151015

gtcaatggcgagaacctggcttattcacctcccttctacccttcgccg96

valasnglygluasnleualatyrserproprophetyrproserpro

202530

tgggccaatggacagggcgactgggcagaggcctacgagaaggccgtc144

trpalaasnglyglnglyasptrpalaglualatyrglulysalaval

354045

aagtttgtctcccaactcacgctggccgaaaaggtcaacctgaccacc192

lysphevalserglnleuthrleualaglulysvalasnleuthrthr

505560

ggaactggttgggagcaggaccgatgcgtcggccaagtgggtagcatc240

glythrglytrpgluglnaspargcysvalglyglnvalglyserile

65707580

ccaagattgggcttcccaggactttgcatgcaggactctccgctgggt288

proargleuglypheproglyleucysmetglnaspserproleugly

859095

gttcgagacactgactacaactcggccttcccggcgggtgtcaatgtc336

valargaspthrasptyrasnseralapheproalaglyvalasnval

100105110

gctgctacctggaacagggacctcgcctaccgtcgcggccaagcgatg384

alaalathrtrpasnargaspleualatyrargargglyglnalamet

115120125

ggcgaggagcatcgcggaaaaggtgtcgacgttcagctgggccctgtg432

glyglugluhisargglylysglyvalaspvalglnleuglyproval

130135140

gccggcccgctgggcaggtctcccgatgctggcagaaactgggaaggt480

alaglyproleuglyargserproaspalaglyargasntrpglugly

145150155160

ttcgccccggatcccgtgctgaccggaaacatgatggcgtccaccatc528

phealaproaspprovalleuthrglyasnmetmetalaserthrile

165170175

cagggtattcaagatgctggtgtcattgcttgcgccaagcatttcatc576

glnglyileglnaspalaglyvalilealacysalalyshispheile

180185190

ctctacgagcaggagcatttccgtcagggcgctcaagatggctacgat624

leutyrgluglngluhispheargglnglyalaglnaspglytyrasp

195200205

atctccgacagtatcagtgccaacgccgatgacaagactatgcacgag672

ileseraspserileseralaasnalaaspasplysthrmethisglu

210215220

ttgtacttgtggccttttgccgatgctgttcgcgctggcgttggttca720

leutyrleutrpprophealaaspalavalargalaglyvalglyser

225230235240

atcatgtgctcctacaaccaggtgaacaacagctacgcctgctccaac768

ilemetcyssertyrasnglnvalasnasnsertyralacysserasn

245250255

agctacaccatgaacaagctgctcaagagcgaattgggcttccaaggc816

sertyrthrmetasnlysleuleulyssergluleuglypheglngly

260265270

ttcgtcatgaccgactggggtggccaccacagtggtgtgggttccgct864

phevalmetthrasptrpglyglyhishisserglyvalglyserala

275280285

ctcgctggtttggacatgtcgatgcccggagacattgccttcgacagt912

leualaglyleuaspmetsermetproglyaspilealapheaspser

290295300

ggcacctccttctggggcactaacctcacggttgccgtgctcaatgga960

glythrserphetrpglythrasnleuthrvalalavalleuasngly

305310315320

agtgttcctgagtggcgtgttgatgacatggctgtccgtatcatgtcc1008

servalproglutrpargvalaspaspmetalavalargilemetser

325330335

gcttattacaaggtcggccgcgaccgctacagcgtccccatcaacttt1056

alatyrtyrlysvalglyargaspargtyrservalproileasnphe

340345350

gactcgtggaccctggatacctatggtcccgagcactatgcggtgggc1104

aspsertrpthrleuaspthrtyrglyprogluhistyralavalgly

355360365

cagggcaacaccaagatcaacgagcacgttgatgttcgcggcaaccat1152

glnglyasnthrlysileasngluhisvalaspvalargglyasnhis

370375380

gcagaaatcatccatgaaatcggtgctgccagcgccgtccttctcaag1200

alagluileilehisgluileglyalaalaseralavalleuleulys

385390395400

aacaagggtgggcttcctttgactggcaccgaacggtttgtcggtgtt1248

asnlysglyglyleuproleuthrglythrgluargphevalglyval

405410415

ttcggagaggatgccggatccaacccttggggtgtgaacggctgcagt1296

pheglygluaspalaglyserasnprotrpglyvalasnglycysser

420425430

gaccgaggctgcgacaatggtacattggccatgggctggggcagtggt1344

aspargglycysaspasnglythrleualametglytrpglysergly

435440445

actgctaacttcccctacttggtgacgccggagcaggcgatcgagaga1392

thralaasnpheprotyrleuvalthrprogluglnalailegluarg

450455460

gaagtcgtgtcccgaaatggaaccttcaccgccatcacggacaatggc1440

gluvalvalserargasnglythrphethralailethraspasngly

465470475480

gctcttgagcagatggcggctgtcgcctctcaggctgatgtttgcctg1488

alaleugluglnmetalaalavalalaserglnalaaspvalcysleu

485490495

gtcttcgccaacgccgactccggagaaggctacatcaacgtcgacggc1536

valphealaasnalaaspserglygluglytyrileasnvalaspgly

500505510

aatgagggtgaccggaagaatctgaccctgtggcaaggggcggatcaa1584

asngluglyasparglysasnleuthrleutrpglnglyalaaspgln

515520525

gtcatccacaacgtcactgccaactgcaacaacaccgtcgtggtgttg1632

valilehisasnvalthralaasncysasnasnthrvalvalvalleu

530535540

cacactgtcggccccgttttgatcgatgattggtatgaccaccccaac1680

histhrvalglyprovalleuileaspasptrptyrasphisproasn

545550555560

gtcactgccattctctgggctggtcttccgggccaggagagcggtaac1728

valthralaileleutrpalaglyleuproglyglngluserglyasn

565570575

tcgctcgtcgatgtcctctacggccgtgtcaaccctggcggaaagact1776

serleuvalaspvalleutyrglyargvalasnproglyglylysthr

580585590

ccgttcacctggggacggacccgggaggattacggtgctcctctggtc1824

prophethrtrpglyargthrarggluasptyrglyalaproleuval

595600605

ctgaagccgaacaatggcaagggcgccccgcagcaggacttcactgag1872

leulysproasnasnglylysglyalaproglnglnaspphethrglu

610615620

ggtatcttcatcgactaccgtcggtttgacaagtacaacatcaccccc1920

glyilepheileasptyrargargpheasplystyrasnilethrpro

625630635640

atctacgaattcggattcggtctgagctacactacctttgagttttct1968

iletyrglupheglypheglyleusertyrthrthrpheglupheser

645650655

gagctcaatgtgcagcctatcaatacgccgccgtacactcccgcttct2016

gluleuasnvalglnproileasnthrproprotyrthrproalaser

660665670

ggcttcaccaaggcggcgcagtcattcggcccgtcgtccaatgcttct2064

glyphethrlysalaalaglnserpheglyproserserasnalaser

675680685

gacaacctgtaccccagcgacattgagcgggtcccgttgtacatctac2112

aspasnleutyrproseraspilegluargvalproleutyriletyr

690695700

ccatggctcaactccaccgatttgaaggcgtccgccaatgaccctgac2160

protrpleuasnserthraspleulysalaseralaasnaspproasp

705710715720

tatgggttgcctaacgacaaatacgttcctcccaacgccacgaacggt2208

tyrglyleuproasnasplystyrvalproproasnalathrasngly

725730735

aacccgcagcccattaacccggctggcggtgctcctggtggcaaccct2256

asnproglnproileasnproalaglyglyalaproglyglyasnpro

740745750

agtctctatgagcctgttgctcgggtctcagccatcatcaccaacacc2304

serleutyrgluprovalalaargvalseralaileilethrasnthr

755760765

ggtaaggttacgggtgacgaggttcctcaactgtatgtctctcttggc2352

glylysvalthrglyaspgluvalproglnleutyrvalserleugly

770775780

ggtcccgatgatgcccccaaggttcttcgtggcttcgaccgtatcaca2400

glyproaspaspalaprolysvalleuargglypheaspargilethr

785790795800

cttgcgcctggtcagcagaccttgtggacgaccaccctgacgaggcga2448

leualaproglyglnglnthrleutrpthrthrthrleuthrargarg

805810815

gacatctcgaactgggaccctgtcacccagaactgggttgtgaccaac2496

aspileserasntrpaspprovalthrglnasntrpvalvalthrasn

820825830

tacaccaagacggtgtatgttggcaactcctcccgcaacctgcctttg2544

tyrthrlysthrvaltyrvalglyasnserserargasnleuproleu

835840845

caggcaccccttaagccatatcctggaatctaa2577

glnalaproleulysprotyrproglyile

850855

<210>4

<211>858

<212>prt

<213>talaromycesemersonii

<400>4

metargasnglyleuleulysvalalaalaleualaalaalaserval

151015

valasnglygluasnleualatyrserproprophetyrproserpro

202530

trpalaasnglyglnglyasptrpalaglualatyrglulysalaval

354045

lysphevalserglnleuthrleualaglulysvalasnleuthrthr

505560

glythrglytrpgluglnaspargcysvalglyglnvalglyserile

65707580

proargleuglypheproglyleucysmetglnaspserproleugly

859095

valargaspthrasptyrasnseralapheproalaglyvalasnval

100105110

alaalathrtrpasnargaspleualatyrargargglyglnalamet

115120125

glyglugluhisargglylysglyvalaspvalglnleuglyproval

130135140

alaglyproleuglyargserproaspalaglyargasntrpglugly

145150155160

phealaproaspprovalleuthrglyasnmetmetalaserthrile

165170175

glnglyileglnaspalaglyvalilealacysalalyshispheile

180185190

leutyrgluglngluhispheargglnglyalaglnaspglytyrasp

195200205

ileseraspserileseralaasnalaaspasplysthrmethisglu

210215220

leutyrleutrpprophealaaspalavalargalaglyvalglyser

225230235240

ilemetcyssertyrasnglnvalasnasnsertyralacysserasn

245250255

sertyrthrmetasnlysleuleulyssergluleuglypheglngly

260265270

phevalmetthrasptrpglyglyhishisserglyvalglyserala

275280285

leualaglyleuaspmetsermetproglyaspilealapheaspser

290295300

glythrserphetrpglythrasnleuthrvalalavalleuasngly

305310315320

servalproglutrpargvalaspaspmetalavalargilemetser

325330335

alatyrtyrlysvalglyargaspargtyrservalproileasnphe

340345350

aspsertrpthrleuaspthrtyrglyprogluhistyralavalgly

355360365

glnglyasnthrlysileasngluhisvalaspvalargglyasnhis

370375380

alagluileilehisgluileglyalaalaseralavalleuleulys

385390395400

asnlysglyglyleuproleuthrglythrgluargphevalglyval

405410415

pheglygluaspalaglyserasnprotrpglyvalasnglycysser

420425430

aspargglycysaspasnglythrleualametglytrpglysergly

435440445

thralaasnpheprotyrleuvalthrprogluglnalailegluarg

450455460

gluvalvalserargasnglythrphethralailethraspasngly

465470475480

alaleugluglnmetalaalavalalaserglnalaaspvalcysleu

485490495

valphealaasnalaaspserglygluglytyrileasnvalaspgly

500505510

asngluglyasparglysasnleuthrleutrpglnglyalaaspgln

515520525

valilehisasnvalthralaasncysasnasnthrvalvalvalleu

530535540

histhrvalglyprovalleuileaspasptrptyrasphisproasn

545550555560

valthralaileleutrpalaglyleuproglyglngluserglyasn

565570575

serleuvalaspvalleutyrglyargvalasnproglyglylysthr

580585590

prophethrtrpglyargthrarggluasptyrglyalaproleuval

595600605

leulysproasnasnglylysglyalaproglnglnaspphethrglu

610615620

glyilepheileasptyrargargpheasplystyrasnilethrpro

625630635640

iletyrglupheglypheglyleusertyrthrthrpheglupheser

645650655

gluleuasnvalglnproileasnthrproprotyrthrproalaser

660665670

glyphethrlysalaalaglnserpheglyproserserasnalaser

675680685

aspasnleutyrproseraspilegluargvalproleutyriletyr

690695700

protrpleuasnserthraspleulysalaseralaasnaspproasp

705710715720

tyrglyleuproasnasplystyrvalproproasnalathrasngly

725730735

asnproglnproileasnproalaglyglyalaproglyglyasnpro

740745750

serleutyrgluprovalalaargvalseralaileilethrasnthr

755760765

glylysvalthrglyaspgluvalproglnleutyrvalserleugly

770775780

glyproaspaspalaprolysvalleuargglypheaspargilethr

785790795800

leualaproglyglnglnthrleutrpthrthrthrleuthrargarg

805810815

aspileserasntrpaspprovalthrglnasntrpvalvalthrasn

820825830

tyrthrlysthrvaltyrvalglyasnserserargasnleuproleu

835840845

glnalaproleulysprotyrproglyile

850855

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1