包含多支架的人造多纤维素酶体及其在生物质降解中的用图
【专利摘要】本申请提供包含为有效整合多个碳水化合物?活性酶设计的支架亚基阵列的多酶复合物。
【专利说明】包含多支架的人造多纤维素酶体及其在生物质降解中的用途 发明领域
[0001] 本发明设及包含为有效整合多个碳水化合物-活性酶设计的支架亚基阵列的人造 多纤维素酶体复合物。运样的复合物对于纤维素生物质的水解是特别有利的。
[0002] 发明背景 植物细胞壁是地球上生物聚合物的最丰富的可再生资源。它是由各种多糖(主要是纤 维素和半纤维素)和木质素组成。它降解为可溶性糖对于转化为所需的化学品和生物燃料, 如乙醇具有重大意义。由于纤维素的高度有序的、不溶性的、结晶性质,极少数的微生物具 有必需的酶系统W有效地降解纤维素底物为可溶性糖。
[0003] 纤维素的水解是由一组称为纤维素酶的酶进行的。它们典型地分为几类:1)外切 葡聚糖酶,其只能在线性纤维素链的末端顺序地裂解(一次2-4个葡萄糖单位),且因此具有 隧道样的活性位点;2)内切葡聚糖酶,其裂解纤维素链的中间(暴露新的个别链末端),通 常具有沟或裂口,其可适合线性链的任何部分;和3)加工性内切葡聚糖酶,被认为是一个 中间类,其像内切葡聚糖酶,可在纤维素链中间裂解,但在初步裂解后,可类似外切葡聚糖 酶继续依次降解纤维素链。另一个典型类是e-葡糖巧酶,其将纤维糊精的末端非-还原性e-D-葡萄糖残基(特别是纤维二糖,其是纤维素降解的主要末端产物之一)水解为单糖。
[0004] 半纤维素被一类称为半纤维素酶的酶降解,半纤维素酶可细分成两个主要类型: 裂解主链骨架的那些(木聚糖酶,其随机裂解木聚糖的e-l,4连键W产生木寡糖,其被0-1,4 木糖巧酶进一步水解为木糖);和降解侧链取代基或短端产物的那些(例如阿拉伯巧喃糖巧 酶和乙酷醋酶)。需要两种类型的酶(纤维素酶和半纤维素酶)W达到完全的植物细胞壁降 解。
[0005] 植物细胞壁-降解微生物采用两种主要策略:需氧真菌和细菌通常产生大量的游 离植物细胞壁-降解酶,然而几种厌氧细菌通常分泌称为多纤维素酶体的多酶复合物。多纤 维素酶体复合物的基本结构包括称为支架蛋白的非-催化亚基,所述支架蛋白经由纤维素-特异性碳水化合物-结合模块(CBM)结合不溶性底物。支架蛋白亚基也作为复合物中各种酶 促亚基的整合剂起作用-它通常含有一组亚基-结合模块,称为黏结蛋白(COhesin),其通 过与存在于各个酶促亚基中的称为错定蛋白(dockerin)的互补结合模块相互作用,介导酶 促亚基特异性结合和组织到复合物中。
[0006] 多纤维素酶体首先在热纤梭菌(Clostridium thermocelIum)中被发现,其提出了 基于主要支架蛋白分子的基本结构,主要支架蛋白分子经由CBM附接于底物并经由特异性 高-亲和性黏结蛋白-错定蛋白相互作用结合不同的酶。热纤梭菌(C. thermocellum)的多 纤维素酶体经由主要支架蛋白和错定支架蛋白之间的黏结蛋白-错定蛋白相互作用结合到 细胞表面。介导酶结合到复合物中的黏结蛋白-错定蛋白配偶体不同于介导细胞错定的那 些,W致在它们之间基本上没有交叉特异性,从而确保细胞表面附着和多纤维素酶体装配 的可靠机制。错定支架蛋白经由化H (S-层同源性)模块,连接复合物至细胞(Bayer等, 2004, Annual Review of Microbiology, 58: 21-554)。
[0007] 在过去二十年间,更复杂的多纤维素酶体结构的存在被发现,例如在解纤维素醋 弧菌(Acetivibrio cellulolyticus) (Xu等,2003, J Bacteriol, 185(15): 4548-57; Xu等,2004, J Bacteriol, 186(17): 5782-9;Ding等,1999, J Bacteriol, 181(21): 6720-9)、黄色瘤胃球菌(Ruminococcus flavefaciens) (Saluzzi等,2001, FEMS Microbiol Ecol, 36(2-3): 131-137;Rincon等,2004, J Bacteriol,186(9): 2576-85)、溶纤维素拟杆菌(Bacteroides cellulosolvens) (Xu等,2004, J Bacteriol, 186: 968-977;Ding 等,2000,J Bacteriol, 182:4915-4925)中和最近在 Clostridium clariflavum (Izquierdo等,2012, Stand Genomic Sci, 6(1): 104-15)中的多纤维素 酶体。
[0008] 各种支架蛋白模块组织成功能性多肤通过互连不同的长度和组成的接头完成。自 然存在的接头长度表现出极大的多样性,范围从几个氨基酸至多达数百个氨基酸。在一些 支架蛋白中,相邻的黏结蛋白可完全不被接头分开,例如来自溶纤维素拟杆菌(B. cellulosolvens)的ScaB中的第一和第二或第S和第四黏结蛋白(Bayer等,2009,我们可 结晶多纤维素酶体吗?(Can we crys化Ilize a cellulosome?)在:木质纤维素降解和生 物质利用的生物技术(In: Biotechnology of Ii即ocellulose degradation and biomass utilization).由Sakka K, Karita S, Kimura T, Sakka M, Matsui H, Miyake H, Tanaka A编辑:Ito Print Publishing Division;183-205)〇Molinie;r等, 2011,JMol Biol, 405:143-157描述含有支架蛋白的混合多纤维素酶体的协同效应、结 构和构象灵活性,所述支架蛋白由两个黏结蛋白模块组成,显示各种黏结蛋白间接头。
[0009] 设计者(Designer)多纤维素酶体是允许植物细胞壁降解酶的受控制结合的人造 纳米器件,因此代表加工生物质为生物燃料的潜在平台。它是W来自相同物种的黏结蛋白 和错定蛋白模块之间极高的亲和性和特异性相互作用为基础的。设计者多纤维素酶体典型 地包括含有CBM和源自不同物种的具有趋异特异性的几个黏结蛋白模块的嵌合体支架蛋 白。所述复合物还包括植物细胞壁-降解酶,每个具有介导选择性结合于趋异黏结蛋白之一 的互补性和特异性错定蛋白模块。
[0010] 使用设计者支架蛋白的先前报告导致各种顽固底物降解的活性增强(例如,Caspi 等,2008, Journal of Biotechnology, 135: 351-357;Caspi等,2009, Applied and Elnveronmental Microbiology,75: 7335-7342;Morai:s等,2010, mBio, I: e00285-10; Morals等,2011,mBio, 2: e00233-ll)。在大多数的运些报告中,设计者多纤维素酶体的 构象模仿热纤梭菌的简单的整体构造。更复杂的结构描述于例如Mingardon等,2007, Applied and Environmental Microbiology, 73: 7138-7149中。
[0011] 迄今报道的最大形式的同源人造多纤维素酶体之一描述于Morais等,2012, MBio, 3(6)中,其含有具有6个趋异黏结蛋白的嵌合体支架蛋白,整合了6个携带错定蛋白 的纤维素分解酶(木聚糖酶和纤维素酶)。
[0012] Fan等,2012,PNAS U.S.A,109(33): 13260-13265,描述酵母的工程改造 W通 过在酿酒酵母(Saccharomyces cereviSiae)细胞表面上呈现由两个独立的微小-支架蛋白 组成的微小-多纤维素酶体,直接转化纤维素(特别是微晶纤维素)为生物乙醇。
[0013] Tsai等,2013,ACS Synth. Biol., 2:14-21,描述在酵母表面通过自适应装配 的复合多纤维素酶体的功能显示。
[0014] 化en等的US 2011/0306105公开用于纤维素物质的有效水解和更特别是用于生成 乙醇的设计者多纤维素酶体。
[0015] Fierobe等的WO 2012/055863公开共价多纤维素酶体及其用途。特别是公开了具 有增加的酶促活性的酶构建体(基于互连催化模块的间隔基的使用),和编码运些构建体的 多核酸。
[0016] 化zana等,2013, Biotechnol Biofuels. 6(1):182,由本发明的一些发明人,在 本申请的优先权日后发表,研究了支架蛋白亚基的空间组织及其通过设计重组=价设计者 支架蛋白的组合文库对纤维素水解的影响,所述=价设计者支架蛋白含有碳水化合物-结 合模块(CBM)和3个趋异黏结蛋白模块。
[0017] 对改进纤维素生物质的降解的组合物和方法仍有需求。例如,具有允许整合大量 的协同和有效地工作的纤维素分解酶,W达到更有效地水解纤维素物质的多酶复合物,将 是非常有益的。
[001引发明概述 本发明提供用于有效降解纤维素生物质的人造多酶复合物。更特别地,本发明提供包 含支架亚基阵列的人造多酶复合物,其允许整合与先前描述的复合物比较的增加数目的 酶,同时维持复合物中各个酶的有效活性,并实现整体协同作用和邻近效应。
[0019] 本发明还提供包含多酶复合物的组合物,和利用所述组合物水解纤维素物质的方 法和系统。
[0020] 本发明的多酶复合物包含至少两个支架亚基,其中每个亚基包含用于整合多个携 带匹配错定蛋白模块的碳水化合物活性酶的多个黏结蛋白模块。每个亚基的黏结蛋白模块 由至少5个氨基酸,优选5-50个氨基酸的接头隔开,运被发现导致复合物的活性增加,如在 本文下面所举例说明的。支架亚基也经由具有不同于连接各个支架及其酶的结合特异性的 结合特异性的黏结蛋白-错定蛋白相互作用,彼此相互作用,从而生成结合大量的酶的精制 结构。
[0021] 有利地,复合物中各个酶的精确位置可通过使用包含不同特异性的黏结蛋白模块 (其可与酶上的它们的匹配错定蛋白模块相互作用)的支架控制。
[0022] 具有趋异结合特异性的黏结蛋白-错定蛋白对的数量有所限制。使用由如本文描 述的多支架亚基组成的结构可克服此种限制:相同特异性的黏结蛋白模块可在不同的支架 上使用。各个支架在支架本身经反应W形成完整复合物之前,可分别地与其酶相互作用。一 旦形成单独的复合物,则它们就是稳定的,因此,各个酶的特定位置得到维持。本文公开的 多酶复合物在黏结蛋白模块的选择和酶组成和装配的控制中允许较高的灵活性。生成的复 合物在允许最佳活性和协同作用的构象中结合多个酶。
[0023 ]根据一个方面,本发明提供人造纤维素分解的多酶复合物,其包含: 第一支架多肤,其包含多个被包含5-50个氨基酸的接头隔开的黏结蛋白模块,至少两 个所述黏结蛋白模块具有对错定蛋白模块的不同结合特异性;和错定蛋白模块; 第二支架多肤,其包含多个被包含5-50个氨基酸的接头隔开的黏结蛋白模块,至少两 个所述黏结蛋白模块具有对错定蛋白模块的不同结合特异性,其中至少一个黏结蛋白模块 具有对第一支架多肤的错定蛋白的结合特异性;和 多个碳水化合物活性酶,每个碳水化合物活性酶包含具有对第一支架、第二支架或两 者的黏结蛋白的结合特异性的错定蛋白模块, 其中第一和第二支架经由第一支架的错定蛋白和具有对所述错定蛋白的结合特异性 的第二支架的黏结蛋白结合,和 其中多个碳水化合物活性酶经由具有相互结合特异性的错定蛋白-黏结蛋白模块,结 合于第一和第二支架多肤,和 其中第一支架、第二支架或两者还包含碳水化合物结合模块(CBM)。
[0024] 如本文所用的,术语"不同特异性",当指黏结蛋白模块的结合特异性时,可与"趋 异特异性"互换使用并表示各个黏结蛋白模块识别不同的错定蛋白模块。在一些实施方案 中,不同结合特异性的黏结蛋白模块源自不同的微生物物种。依据运些实施方案,源自一个 物种的黏结蛋白模块识别(结合)源自相同物种的错定蛋白模块,但不识别源自不同的物种 的错定蛋白模块。
[0025] 类似地,当术语"不同特异性"和"趋异特异性"指错定蛋白模块的结合特异性时, 它们表示各个错定蛋白模块识别不同的黏结蛋白模块。
[0026] 如本文所用的,术语"相互的",当指错定蛋白-黏结蛋白相互作用时,表示两个模 块是彼此互补的,即彼此具有结合特异性。
[0027] 在一些实施方案中,第一和第二支架多肤的每一个包含3-10个黏结蛋白模块。在 一些实施方案中,第一和第二支架多肤的每一个包含3-6个黏结蛋白模块。
[0028] 在一些实施方案中,第一支架多肤的所有黏结蛋白模块具有不同结合特异性。在 另外的实施方案中,第二支架多肤的所有黏结蛋白模块具有不同结合特异性。依据运些实 施方案,第一支架具有一组趋异黏结蛋白模块,和第二支架具有另一组趋异性黏结蛋白模 块。在一些实施方案中,在两组中的所有黏结蛋白彼此不同。在其它实施方案中,每组包括 趋异黏结蛋白,但一个(或多个)黏结蛋白在两组中可被发现。因此,在一些实施方案中,第 一支架的至少一个黏结蛋白模块与第二支架的黏结蛋白模块具有相同结合特异性。如上所 述的,酶的位置可通过分别形成各个支架-酶复合物,并且然后混合预形成的复合物W生成 完整复合物,依然维持在各个支架内。
[0029] 在其它实施方案中,第一支架多肤或第二支架多肤包含二个或更多个具有相同结 合特异性的黏结蛋白模块。在一些实施方案中,两个支架多肤均包含二个或更多个具有相 同特异性的黏结蛋白模块,即每个支架多肤包含二个或更多个具有相同结合特异性的黏结 蛋白模块。运样的实施方案对于例如在复合物内多个位置的特定酶的整合可W是有用的。
[0030] 在一些实施方案中,黏结蛋白模块源自一种或多种产生多纤维素酶体的微生物。 在一些实施方案中,产生多纤维素酶体的微生物选自热纤梭菌(Clostridium thermocel Ium)、解纤维素醋弧菌(Acetivibrio CeIluloIytiCUS )、黄色瘤胃球菌 (Ruminococcus f Iavefaciens)、溶纤维素拟杆菌(Bacteroides CeIlulosolvens)、闪烁古 生球菌(Archaeoglobus fulgidus)和解纤维梭菌(Clostridium cellulol}fticum)。依据运 些实施方案,黏结蛋白模块选自来自热纤梭菌的黏结蛋白、来自解纤维素醋弧菌(A. celIulolyticus)的黏结蛋白、来自黄色瘤胃球菌(R. fIavefaciens)的黏结蛋白、来自溶 纤维素拟杆菌的黏结蛋白、来自闪烁古生球菌(A. fulgidus)的黏结蛋白、来自解纤维梭菌 (C. celIulol^ic皿)的黏结蛋白及其组合。
[0031] 在一些实施方案中,黏结蛋白模块源自一种或多种无-多纤维素酶体的微生物。
[0032] 在一些实施方案中,错定蛋白模块源自一种或多种产生多纤维素酶体的微生物。 在一些实施方案中,产生多纤维素酶体的微生物选自热纤梭菌、解纤维素醋弧菌、黄色瘤胃 球菌、溶纤维素拟杆菌、闪烁古生球菌和解纤维梭菌。依据运些实施方案,错定蛋白模块选 自来自热纤梭菌的错定蛋白、来自解纤维素醋弧菌的错定蛋白、来自黄色瘤胃球菌、溶纤维 素拟杆菌的错定蛋白,来自闪烁古生球菌的错定蛋白、来自解纤维梭菌的错定蛋白及其组 厶 1=1 O
[0033] 在一些实施方案中,错定蛋白模块源自一中或多中无-多纤维素酶体的微生物。
[0034] 在一些实施方案中,第一和第二支架多肤均包含CBM。
[0035] 在一些实施方案中,第一支架多肤、第二支架多肤或两者的CBM是内部的。在一些 实施方案中,第一支架多肤、第二支架多肤或两者的CBM位于支架多肤的末端。
[0036] 在一些实施方案中,当两个支架多肤包含CBM时,第一和第二支架多肤的CBM是相 同的。在其它实施方案中,第一和第二支架多肤的CBM是不同的。
[0037] 在一些实施方案中,接头包含5-40个氨基酸。在一些实施方案中,接头包含15-35 个氨基酸。
[0038] 在一些实施方案中,多个碳水化合物活性酶包含糖巧水解酶、多糖裂解酶、糖醋酶 或其组合。
[0039] 在一些实施方案中,糖巧水解酶选自纤维素酶、木聚糖酶、0-葡糖巧酶及其组合。
[0040] 在一些实施方案中,碳水化合物-活性酶源自非-多纤维素酶体的酶。
[0041] 在一些实施方案中,碳水化合物-活性酶源自多纤维素酶体的酶。
[0042] 在一些实施方案中,碳水化合物-活性酶是细菌酶。在一些实施方案中,细菌选自 Thermobifidafusca和热纤梭菌。依据运些实施方案,多酶复合物包含多个来自T. fUsca、 热纤梭菌或两者的碳水化合物-活性酶。
[0043] 在一些实施方案中,多酶复合物还包含一个或多个支架多肤,其中多个碳水化合 物结合酶与其结合,所述多个碳水化合物结合酶结合于第一支架多肤、第二支架多肤或两 者。
[0044] 依据另一方面,本发明提供一种降解纤维素物质的组合物,其包含本发明的多酶 复合物。
[0045] 依据又一方面,本发明提供一种降解纤维素物质的系统,所述系统包含本发明的 多酶复合物。
[0046] 依据又一方面,本发明提供一种降解纤维素物质的方法,该方法包括使所述纤维 素物质暴露于本发明的多酶复合物。
[0047] 本发明的运些和其它方面和特征将从下文的附图、详细描述、实施例和权利要求 书而变得显而易见。
[004引附图简述 图1.为检查模块间接头的长度对支架-酶复合物活性的影响而构建的支架库的示意 图。黏结蛋白模块(Ac、Bc和Ct)和碳水化合物结合模块(CBM)的二十四(24)种不同的排列在 3个子库中示出:给定的嵌合体支架的无-接头、短-接头和长-接头版本。左边的栏目表示各 个支架组的编号及其组成(CBM和趋异黏结蛋白的位置)。十四(14)个全组,表示42个克隆和 表达的支架,被成功地克隆和表达,并用于进一步的研究。包括在最终库中的42个成功克隆 和表达的支架蛋白显示为灰度色标示意图。
[0049] 图2.微晶纤维素(Avicel) (A)和预处理的富含纤维素的麦杆(B)经14组设计者 多纤维素酶体的比较水解。每一组模块组成和支架蛋白编号在X-轴上指示。上面的小图:设 计者支架蛋白的CBM模块是在内部位置。下面的小图:设计者支架蛋白的CBM模块是在N-或 C-末端位置。各个设计者-多纤维素酶体组用长模块间接头支架蛋白、短模块间接头支架蛋 白和无模块间接头支架蛋白的任何一种装配。对照:"游离":对应于Cel48S-ct、Cel9K-ac 和Cel8A-bc的合并活性。"CBM-Coh":对应于前巧巾酶的活性,每个独立地附接于融合于CBM 的其匹配黏结蛋白模块。反应对微晶纤维素(Avicel)进行72 h和对预处理的富含纤维素的 麦杆进行3 h。酶促活性用mM还原糖定义,如通过葡萄糖标准曲线确定的。所有的反应按一 式=份进行并重复3次。至少3次实验的标准误差被显示。
[0050] 图3.对微晶纤维素(Avicel)比较a-9A、b-48A和5A-t的活性分析为:(i)结合于 衔接子支架CBM-黏结蛋白A-B-T-DockII ("Scad ABT"); (ii)结合于衔接子支架DockII-A-B-T,其还结合于匹配黏结蛋白-CBM微小-支架("Ad ABT");(iii)游离酶("游离")的混 合物;和(iv)结合于匹配黏结蛋白-CBM微小-支架的酶的混合物("CBM-恢复的")。
[0051] 图4.含有六价主要支架、=价衔接子支架和8个酶促亚基的多酶复合物的示意 图。
[0052] 图5.于50°C用不同的嵌合体酶促合剂和多纤维素酶体的构型溫育48小时后的麦 杆降解。各个组分在各种反应溶液中的存在在表中指定。
[0053] 图6.在0葡糖巧酶(来自T. fusca的BglC)的存在或不存在下,麦杆经W下物质降 解的动力学(5(TC):(i)提取的热纤梭菌的天然多纤维素酶体;(ii)设计者多纤维素酶 体,其含有附接于具有总共8个嵌合体酶的六价支架的衔接子支架;和(iii)对应8种野生 型酶的混合物。
[0054] 发明详述 本发明设及具有由两个(并且可能更多个)相互作用的支架亚基组成的精制结构的设 计者多纤维素酶体。本发明的支架亚基被设计W使得它们允许有效整合酶促亚基至复合 物,并促进接近纤维素底物和有效降解纤维素底物的祀向效应。
[0055] 在一些实施方案中,本文提供人造纤维素分解的多酶复合物,其包含:(i)第一多 种碳水化合物活性酶,每个包含结合于第一支架多肤的错定蛋白模块,其中所述第一支架 多肤包含多个被包含5-50个氨基酸的接头隔开并具有对酶的错定蛋白模块的结合特异性 的黏结蛋白模块、碳水化合物结合模块(CBM)和错定蛋白模块;(ii)第二多种碳水化合物 活性酶,每个包含结合于第二支架多肤的错定蛋白模块,其中所述第二支架多肤包含多个 被包含5-50个氨基酸的接头隔开的黏结蛋白模块,其中至少一个黏结蛋白模块具有对第一 支架的错定蛋白的结合特异性,而剩余的黏结蛋白模块具有对第二多种酶的错定蛋白模块 的结合特异性,其中第一和第二支架经由第一支架的错定蛋白和具有对所述错定蛋白的结 合特异性的第二支架的黏结蛋白结合。
[0056] 如本文所用的,术语"人造的",当指本发明的酶促复合物时,表示复合物经人造 地/合成地制得且不在自然界中出现。要理解天然存在的多纤维素酶体复合物从本发明的 范围排除。
[0057] 如本文所用的,术语"酶"指具有对某个底物或某些底物的催化活性的多肤。
[0058] 如本文所用的,术语"模块"描述在一种蛋白质内的单独折叠部分。如本文所用的" 酶的催化模块"或"酶促-活性模块"指将催化活性赋予蛋白质的模块。所述术语指它们对模 块酶的常规解释,对此催化模块可容易地在酶多肤序列内鉴定。运样的模块酶在本发明的 范围内。
[0059] 如本文所用的术语"复合物"指优选通过非-共价相互作用,或通过共价键连接的 组分的协调或关联性。
[0060] 如本文所用的术语"多酶复合物"表示包含多种酶的复合物,即至少两种酶且优选 更多的酶。本发明的多酶复合物还包括非-催化组分,例如结构组分和底物-结合组分。
[0061] 如本文所用的,术语"多个"表示至少两个。
[0062] 如本文所用的,术语"支架多肤"或"支架亚基"可互换使用并指提供对酶促和/或 非-酶促蛋白组分的多个结合位点的骨架亚基。因此,支架多肤作为整合组分(酶和非-酶促 蛋白组分)的平台起作用。支架多肤通常是非-催化的。支架多肤可包括一个或多个底物-结 合模块。
[0063] 如本文所用的,术语"碳水化合物活性酶"指催化碳水化合物和糖缀合物的分解的 酶。该术语涵盖催化碳水化合物和糖缀合物的分解的酶的酶促-活性部分。一组广泛的碳水 化合物活性酶被分成酶类并根据标准分类系统进一步分类为酶家族(Cantarel等2009 Nucleic Acids Res 37:0233-238)。根据运个分类系统,定义了3类设及碳水化合物和糖缀 合物的分解的酶,即(i)糖巧水解酶,其水解两个或更多个碳水化合物之间或碳水化合物 和非-碳水化合物部分之间的糖巧键,包括例如,纤维素酶、木聚糖酶、CtA-阿拉伯巧喃糖巧 酶、纤维素二糖水解酶、e-葡糖巧酶、e-木糖巧酶、e-甘露糖巧酶和甘露聚糖酶;(ii)多糖 裂解酶,其催化多糖中的碳-氧键的裂解,导致不饱和的产物并除去醇,例如,果胶酸裂解酶 和褐藻酸裂解酶;和(ii)糖醋酶,其催化取代的糖的de-0或de-N-酷基化,例如,乙酷基木 聚糖醋酶、果胶甲基醋酶、果胶乙酷醋酶和阿魏酸醋酶。碳水化合物活性酶的信息和更新的 分类可在碳水化合物-活性酶(CA巧)服务器(WWW. cazy. org)上获得。
[0064] 随同分类系统一起,指定不同的催化模块和不同的碳水化合物活性酶的统一方案 被提出并已得到广泛采用。催化模块是由其酶类和家族编号指定的。例如,具有分类在家族 10中的催化模块的糖巧水解酶被指定为"GH10"。酶由活性的类型、它所属的家族和通常附 加的字母指定。例如,来自某些生物的、具有分类为家族5糖巧水解酶的催化模块的纤维素 酶,其是首先报告的来自该生物的G册纤维素酶,被指定为"Cel5A"。
[0065] 术语"多肤"、"肤"和"蛋白"在本文可互换使用,指氨基酸残基的聚合物。
[0066] 术语"多核巧酸"或"寡核巧酸"在本文可互换使用,指核酸的聚合物。
[0067] 如本文所用的,术语"野生型"指天然存在的DNA/蛋白。术语"衍生物"、"变体"、"修 饰的"可互换使用并指由于引入序列的一个或多个氨基酸取代,和/或一个或多个缺失/添 加而不同于野生型氨基酸序列的多肤。要理解为了类似的目的,衍生物/变体一般保留野生 型中观察到的特性或活性至衍生物可用作野生型形式的程度。例如,当该术语指黏结蛋白 或错定蛋白时,它们表示野生型序列已得到修饰,而无不利地影响其分别识别匹配黏结蛋 白/错定蛋白的能力。通常,相关对应物的识别位点,也称为结合位点,得到维持。当指酶时, 所述术语表示野生型序列已被修饰,而没有不利地影响其催化活性。通常,催化结构域被维 持。
[006引多酶复合物 黏结蛋白和错定蛋白 根据本发明的实施方案,多酶复合物的装配通过两个模块-黏结蛋白和错定蛋白之间 的蛋白-蛋白相互作用介导。
[0069] 在天然多纤维素酶体系统中,黏结蛋白和错定蛋白模块控制整合酶进入支架蛋白 亚基,W及多纤维素酶体附着于产生多纤维素酶体的微生物(在一些产生多纤维素酶体的 微生物中)的表面。
[0070] 黏结蛋白是大约140个氨基酸残基的模块,其通常作为结构支架蛋白亚基的部分 重复出现。有3个主要类型的黏结蛋白模块,i、n和HI型,其基于氨基酸序列同源性和蛋白 拓扑结构分类。给定的黏结蛋白的分类可通过与已知的黏结蛋白序列的序列比对来进行。 II型黏结蛋白结构域的序列W在I型黏结蛋白结构域中未发现的两个插入为特征。在拓扑 学上,所有黏结蛋白类型分享共同的具有薄卷饼型拓扑结构的9-链0-夹层的结构。I型黏结 蛋白仅包括基础薄卷饼型结构。n型黏结蛋白模块的结构具有类似于I型结构的整体折叠, 但包括特有的添加:两个中断链4和8的'0-瓣(flaps)'和在蛋白模块顶上的a-螺旋。III型 黏结蛋白模块的结构类似于II型的结构,即它包含两个中断链4和8的'0-瓣'和a-螺旋,但 Ct-螺旋的位置不同于II型的位置。此外,III型W广泛的N-末端环为特征。
[0071] 错定蛋白是大约60-70个氨基酸残基的模块,W两个双复制的C. 22-残基区段,通 常由9-18个残基的接头隔开为特征。两个重复包括巧-结合环和"F-螺旋"基序。错定蛋白根 据与它们相互作用的黏结蛋白被分类为各种类型,并类似地包括1、11和III型。错定蛋白的 系统发生图在很大程度上反映了它们的黏结蛋白对应物的系统发生图,W致与I型黏结蛋 白相互作用的错定蛋白被严密地分组,而与II型黏结蛋白相互作用的错定蛋白也被分组并 与第一组相差甚远。
[0072] 在I型模块中的相互作用一般观察到黏结蛋白-错定蛋白系统的交叉物种严格性, W致不能期望一个微生物物种的I型黏结蛋白识别来自不同的微生物物种的I型错定蛋白。 然而,在给定的物种内,I型相互作用倾向于为非-特异性的,W致在主要支架蛋白上的所有 黏结蛋白趋向于类似地结合于携带不同酶的错定蛋白。因此,在给定的物种内,用于酶结合 的黏结蛋白模块一般具有类似的特异性。在II型模块中相互作用的物种间特异性似乎是比 对I型观察到的特异性的严格性要低得多,且交叉物种相互作用有时被观察到。基本不存在 I和II型黏结蛋白-错定蛋白配偶体之间的交叉-特异性。
[0073] 黏结蛋白模块构成支架亚基。对于要整合进复合物的酶,选择具有对应的结合特 异性的错定蛋白模块。为了整合酶至精确位置的支架亚基的构建,应选择趋异特异性的黏 结蛋白。例如,每个黏结蛋白可源自不同的微生物。作为另一个实例,可选择来自相同物种, 但不同类型的黏结蛋白。
[0074] 关于黏结蛋白和错定蛋白模块的分类的信息可例如,在Albar等( 2009) Proteins, 77:699-709;Noach等(2005) J. Mol. Biol. :348, 1-12, Xu等(2003) J. Bacteriol. 185: 4548-4557;Baye;r等(2004) Annu. Rev. Microbiol. 58:521-54;Peer 等(2009) FEMS Microbiol Lett.,291(1): 1-16中发现。
[0075] 关于在I型和II型黏结蛋白和错定蛋白中物种间或物种内的特异性的信息可例 如,在化imovitz等(2008) Proteomics, 8, 968-979中发现。
[0076] 根据本发明的实施方案,可用于构建多酶复合物的、具有相互的结合特异性的黏 结蛋白-错定蛋白对的非-限制性实例详细说明于下表A中:
另外的黏结蛋白-错定蛋白对的实例可在科学文献中获得并是本领域技术人员已知 的。
[0077] 相互作用的黏结蛋白和错定蛋白对可从天然产生多纤维素酶体的细菌,例如,从 热纤梭菌、解纤维梭菌、嗜纤维梭菌(C. Ce 1 Iulovorans)、约氏梭菌(C. josui)、溶纸莎草 梭菌(C. papy;rosolvens)、C. cla;r;Lflavum、溶纤维素拟杆菌、解纤维醋弧菌 (A. cel Iulolyticus)中发现的支架蛋白和/或酶获得。
[0078] 相互作用的黏结蛋白和错定蛋白对也可从无-多纤维素酶体的细菌和古细菌获 得。无-多纤维素酶体的黏结蛋白-错定蛋白相互作用首次描述于Bayer等,1999, FEBS Lett. 463: 277-280中。运样的无-多纤维素酶体的黏结蛋白和错定蛋白模块的非-限制性 列表可在化er等,2009,FEMS Microbiol Lett. 291: 1-16的支持信息中发现。
[0079] 在一些实施方案中,本发明的支架多肤包括2-10个黏结蛋白模块,例如2-8个黏结 蛋白模块,例如3-8,例如3-6个。在一些实施方案中,整合酶并附接于主要支架(第二支架) 的衔接子支架(第一支架)包含3-4个黏结蛋白模块。衔接子支架典型地还包含用于附着于 主要支架上的黏结蛋白的错定蛋白模块。在一些实施方案中,主要支架多肤,其整合酶和/ 或衔接子支架,包含4-6个黏结蛋白模块。支架之间的结合特异性不同于支架和酶的结合特 异性。
[0080] 在一些实施方案中,衔接子支架包含多个黏结蛋白模块,其中至少两个黏结蛋白 模块具有对错定蛋白模块的不同结合特异性。依据运些实施方案,衔接子支架包含两个趋 异黏结蛋白模块,每个识别不同的错定蛋白。可存在于衔接子支架中的其它黏结蛋白模块 可具有不同或相同结合特异性。在一些实施方案中,衔接子支架的所有黏结蛋白模块具有 不同的结合特异性,意味着衔接子支架上的各个黏结蛋白识别不同的错定蛋白。
[0081] 本发明的主要支架包含多个黏结蛋白模块,其中至少一个黏结蛋白模块具有对衔 接子支架的错定蛋白的结合特异性。
[0082] 在一些典型的实施方案中,本发明的主要支架还包含一个或多个用于整合酶的黏 结蛋白模块。那些黏结蛋白模块通常W不同于用于结合衔接子支架的黏结蛋白模块的结合 特异性的结合特异性为特征。在一些实施方案中,用于酶整合的黏结蛋白模块具有不同结 合特异性,W致各个黏结蛋白识别不同的错定蛋白。
[0083] 在一些实施方案中,主要支架包含多个黏结蛋白模块,其中多个黏结蛋白模块包 含具有对衔接子支架的错定蛋白的结合特异性的黏结蛋白模块,和具有对并非衔接子支架 的错定蛋白的错定蛋白的结合特异性的黏结蛋白模块。
[0084] 在一些实施方案中,衔接子支架的至少一个黏结蛋白模块具有与主要支架的黏结 蛋白模块相同的结合特异性,意味着具有特定的结合特异性的至少一个黏结蛋白模块在主 要支架和衔接子支架二者上发现。
[0085] 在一些实施方案中,本发明的支架多肤还包含一个或多个碳水化合物结合模块 (CBM)。在一些实施方案中,CBM是纤维素-结合CBM。在其它实施方案中,CBM是木聚糖-结合 CBM。在一些实施方案中,CBM分类在选自家族1、2和3的CBM家族中,如在CAZY服务器和/或如 上所详述的CAZYpedia中所定义的。在一些实施方案中,CBM源自热纤梭菌CBM。在一些示例 性实施方案中,热纤梭菌CBM是支架亚基CipA的CBM3a (GenBank登录号ABN54273)。
[0086] 在一些实施方案中,本发明的多酶复合物包含用于整合酶的主要和衔接子支架的 阵列,其中衔接子支架是结合各种酶并且还附接于主要支架的中间支架。
[0087] 在一些实施方案中,提供多酶复合物,其含有:主要支架、结合于主要支架的第一 组酶,和具有第二组酶的衔接子支架,衔接子支架结合于主要支架。
[0088] 在一些示例性实施方案中,本发明的第一(衔接子)支架多肤包含来自热纤梭菌的 II型错定蛋白、来自解纤维素醋弧菌的黏结蛋白、来自溶纤维素拟杆菌的黏结蛋白、来自热 纤梭菌的黏结蛋白和来自热纤梭菌的CBM。在一些实施方案中,运些模块由15-40个氨基酸, 例如25-40个氨基酸的接头隔开。
[0089] 在一些示例性实施方案中,本发明的第二(主要)支架多肤包含来自解纤维梭菌的 黏结蛋白、来自解纤维素醋弧菌的黏结蛋白、来自热纤梭菌的I型黏结蛋白、来自闪烁古生 球菌的黏结蛋白、来自黄色瘤胃球菌(R. flavefacien)的黏结蛋白、来自热纤梭菌的II型黏 结蛋白和来自热纤梭菌的CBM。在一些实施方案中,运些模块由15-40个氨基酸,例如25-40 个氨基酸的接头隔开。
[0090] 在一些实施方案中,衔接子支架包含与SEQ ID NO: 31中提出的序列具有至少80% 的同一性的序列,例如,与SEQ ID NO: 31中提出的序列具有至少85%、至少90、至少95%、至 少97%的同一性。在一些示例性实施方案中,衔接子支架包含在SEQ ID NO: 31中提出的序 列。
[0091] 在一些实施方案中,主要支架包含与SEQ ID NO: 43中提出的序列具有至少80%的 同一性的序列,例如,与SEQ ID NO: 43中提出的序列具有至少85%、至少90%、至少95%、至少 97%的同一性。在一些示例性实施方案中,主要支架包含SEQ ID NO: 43中提出的序列。
[0092] 要理解,引入在SEQ ID NOs. 31和43中提出的序列中的变化不应在对应于黏结蛋 白与它们各自的错定蛋白的结合位点的区域中进行,所述区域对于运种相互作用是重要 的。
[0093] 接头 本发明的支架多肤的不同模块通过包含5个氨基酸或更多,通常为5-50个氨基酸,例如 5-35个氨基酸、15-50个氨基酸、20-50个氨基酸、25-50个氨基酸、20-40个氨基酸、25-45个 氨基酸、25-40U5-35个氨基酸的接头互连。各种可能性代表本发明的一个单独的实施方 案。
[0094] 在一些实施方案中,与特定的支架多肤的模块互连的接头是相同的。在一些实施 方案中,不同的接头在一个支架多肤内不同组分之间使用。
[00M]接头区域一般由一组的限制性氨基酸组成一一通常脯氨酸和苏氨酸是普遍的,其 中另外类型的氨基酸不太丰富。
[0096] 可选择用于接头的氨基酸组成,例如,W包括邻近用来构成嵌合体支架亚基的模 块(即,黏结蛋白、CBM等)的接头序列(或其部分)。用于构建本发明的支架多肤的接头序列 可例如源自在Bayer等,2009,我们可结晶多纤维素酶体吗?(Can we C巧Stallize a cellulosome?)在:木质纤维素降解和生物质利用的生物技术(In: Biotechnology of Iignocellulose degradation and biomass utilization). Sakka K, Karita S, Kimura T, Sakka M, Matsui H, Miyake H, Tanaka A编车茸:Ito Print Publishing Division; 183-205)中评述的列表。示例性接头序列在W下的实施例章节中提供。
[0097] 產 根据^些实施方案,本发明的支架多肤介导多个碳水化合物活性酶或其酶促-活性部 分整合到复合物中。各个酶,或其酶促-活性部分,包含用于整合到特异性匹配黏结蛋白中 的错定蛋白模块。
[0098] 在一些实施方案中,整合到复合物中的酶包含异源性错定蛋白模块。异源性错定 蛋白模块表示不同于天然存在的酶的错定蛋白的错定蛋白,或引入并非天然包括错定蛋白 的多肤的错定蛋白,即它是一种工程改造的源自不包含错定蛋白模块的野生型序列的酶。 因此,野生型不能结合到复合物例如多纤维素酶体中。然而,工程改造的酶,被设计为包括 错定蛋白模块,因而能够整合到本发明的复合物中。
[0099] 通常,碳水化合物活性酶W多-模块组织为特征,其中催化模块与一个或多个调节 酶活性的辅助性(ancillary)的辅助化elper)模块相结合。每个模块包含连续部分的多肤 链并形成独立折叠、结构和功能上不同的单位。主要辅助性模块之一是碳水化合物-结合模 块。在一些实施方案中,异源性错定蛋白结构域替代至少一个最初在酶结构中发现的辅助 性模块。在其它实施方案中,除了原始辅助性模块,还引入异源性错定蛋白结构域。
[0100] 在一些实施方案中,碳水化合物活性酶选自糖巧水解酶、多糖裂解酶和糖醋酶。在 一些实施方案中,使用糖巧水解酶、多糖裂解酶和糖醋酶的组合。
[0101] 如上所述的"糖巧水解酶"是水解二个或更多个碳水化合物之间或碳水化合物和 非-碳水化合物部分之间的糖巧键的酶。糖巧水解酶可催化0-、N-和/或S-连接的糖巧的水 解。糖巧水解酶有时被称为糖巧酶和糖基水解酶。糖巧水解酶的非-限制性实例包括纤维素 酶、木聚糖酶、Q-L阿拉伯巧喃糖巧酶、纤维素二糖水解酶、0-葡糖巧酶、0-木糖巧酶、0-甘露 糖巧酶和甘露聚糖酶。有关在碳水化合物分子中发现的糖巧键和其它类型的键的信息可例 如,在M. L. Sinnott (2007)碳水化合物化学和生物化学:结构和机制(Carbohydrate Chemistry and Biochemistry: Structure and mechanism),第一片反,Royal Society of Qiemistry 中找到。
[0102] 在一些特定实施方案中,本发明的复合物的糖巧水解酶选自纤维素酶、木聚糖酶 和e-葡糖巧酶。在一些实施方案中,使用纤维素酶、木聚糖酶和e-葡糖巧酶的组合。
[0103] 如上文进一步指出的,"多糖裂解酶"指一组催化多糖中的碳-氧键的裂解,导致不 饱和的产物和除去醇的碳氧裂解酶。通常,多糖裂解酶经由e-消除机制裂解含糖醒酸多糖 链,W生成不饱和的己締糖醒酸残基和新的还原端。多糖裂解酶的非-限制性实例包括果胶 酸裂解酶和褐藻酸裂解酶。
[0104] 如上文进一步指出的,"糖醋酶"指水解糖醋的酶。通常,糖醋酶催化取代的糖的 de-o或de-N-酷基化。糖醋酶的非-限制性实例包括乙酷基木聚糖醋酶、果胶甲基醋酶、果胶 乙酷基醋酶和阿魏酸醋酶。
[0105] 在一些实施方案中,碳水化合物-活性酶是多纤维素酶体的酶。术语"多纤维素酶 体的酶"指在自然界中通常作为多纤维素酶体复合物的部分发现的酶。
[0106] 在一些实施方案中,碳水化合物-活性酶是非-多纤维素酶体的酶。术语"非-多纤 维素酶体的酶"指在自然界中作为游离酶,通常分泌到环境中的活性酶。运样的酶通常不具 有错定蛋白模块。
[0107] 在一些实施方案中,碳水化合物-活性酶是细菌酶。在一些实施方案中,细菌选自 T. fUsca和热纤梭菌。在其它实施方案中,碳水化合物-活性酶是真菌酶。
[0108] 碳水化合物活性酶的类型已在上文描述。在一些实施方案中,碳水化合物活性酶 包括木聚糖酶。木聚糖酶被分类为例如糖巧水解酶家族5、8、10、11、26和43。在一些实施方 案中,木聚糖酶是细菌木聚糖酶。
[0109] 在一些实施方案中,碳水化合物活性酶包括纤维素酶。纤维素酶可选自外切葡聚 糖酶、内切葡聚糖酶和加工性内切葡聚糖酶。纤维素酶被分类为例如糖巧水解酶家族5、6、 7、8、9、12、26、44、45、48、51、61和74。在一些实施方案中,纤维素酶是细菌纤维素酶。
[0110] 在一些实施方案中,碳水化合物活性酶包括0-葡糖巧酶。0-葡糖巧酶被分类为例 如糖巧水解酶家族1、3、9、30和116。在一些实施方案中,0-葡糖巧酶是细菌0-葡糖巧酶。
[0111] 在一些示例性实施方案中,结合于支架多肤的多个碳水化合物活性酶包含外切葡 聚糖酶、内切葡聚糖酶和加工性内切葡聚糖酶。
[0112] 在一些实施方案中,本发明的多酶复合物包含至少两个纤维素酶,例如=个纤维 素酶、四个纤维素酶或更多个纤维素酶。各个可能性代表本发明的一个独立的实施方案。
[0113] 在一些实施方案中,本发明的多酶复合物包含至少两个木聚糖酶,例如木聚糖酶 纤维素酶、木聚糖酶纤维素酶,或更多。各个可能性代表本发明的一个独立的实施方案。
[0114] 在一些示例性实施方案中,本发明的多酶复合物包含4个纤维素酶和4个木聚糖 酶。
[0115] 在一些特定的示例性实施方案中,多个碳水化合物活性酶包含来自热纤梭菌的外 切葡聚糖酶Cel48S、来自热纤梭菌的内切葡聚糖酶CelSA和来自热纤梭菌的加工性内切葡 聚糖酶Cel9K的至少一个。
[0116] 在另外的特定示例性实施方案中,多个碳水化合物活性酶包含来自T. fusca的外 切葡聚糖酶Cel48A、来自T. fusca的内切葡聚糖酶Cel5A和来自T. fusca的加工性内切葡 聚糖酶Cel9A的至少一个。
[0117] 在另外的特定示例性实施方案中,多个碳水化合物活性酶包含来自T. fusca的木 聚糖酶乂711434心711114心711108和乂711104的至少一个。
[0118] 在一些示例性实施方案中,结合于支架多肤的多个碳水化合物活性酶包含木聚糖 酶和外切葡聚糖酶。
[0119] 在一些特定的示例性实施方案中,多个碳水化合物活性酶包含来自T. fusca的木 聚糖酶Xyn43A、XynllA、XynlOB和XynlOA,和来自T. fusca的外切葡聚糖酶Cel5A。
[0120] 具有合适的错定蛋白的示例性酶促亚基在W下实施例章节中提供。
[0121] 对于某些酶的组合,在复合物内的排列或相对次序具有对整体活性的影响。复合 物活性的排列的作用可由本领域技术人员容易地确定。
[0122] 在一些典型的实施方案中,支架多肤和存在于本发明的多酶复合物中的各个碳水 化合物活性酶是非-共价连接的。在另外的典型实施方案中,它们经由黏结蛋白和错定蛋白 之间的相互作用连接。在其它实施方案中,支架多肤和各个纤维素分解酶是共价连接的。在 另外的或备选的实施方案中,支架多肤和各个纤维素分解酶是交联的。
[0123] 典型地,多酶复合物的不同组分在宿主细胞中重组地和分别地生产、纯化,并且然 后在溶液中混合在一起W形成复合物。
[0124] 因此,多酶复合物通常未附接于微生物细胞的外层表面。
[01巧]本文描述的多肤可通过如本领域已知的重组方法产生。例如: 重组表达 本发明的多肤可通过在宿主细胞(例如,用核酸分子转化的微生物细胞)中表达编码多 肤的多核巧酸分子来合成。
[0126]编码所需的多肤的多核巧酸的合成可如在W下实施例中所述的进行。编码野生型 多肤的DNA序列可从产生它们的微生物的任何株或亚型,使用本领域熟知的各种方法分离 (见例如Sambrook等,分子克隆:实验室手册(Molecular Cloning: A LaboratoiT Manual),第S版,Cold Spring化rbor, N.Y.,(2001))。例如,编码野生型多肤的DNA可 通过聚合酶链反应(PCR),使用在已知野生型序列的核巧酸序列的基础上构建的特异性引 物,从适宜的微生物的基因组DNA扩增。基因组DNA可从细菌细胞提取,然后使用本领域已知 的各种方法扩增,见例如,Marek P. M等,"Cloning and expression in Escherichia coli of Clostridium thermocellum DNA encoding p-glucosidase activity", Enzyme and Microbial Technology Volume 9,Issue 8,1987年8月,474-478页。编码野生型多肤 的分离的多核巧酸可被克隆到载体中,例如祀T28a质粒。
[0127]用所需序列产生多核巧酸的一种可供选择的方法是使用合成的基因。编码本发明 的多肤的多核巧酸可W例如使用亚氨基憐酸醋方法经合成制备(见,Beaucage等,Curr Protoc Nucleic Acid Chem. 2001 年5 月;第3 章:3.3 单元;Caruthers 等,Methods Enzymol.1987, 154:287-313)。
[01%]如此产生的多核巧酸然后可经受进一步的处理,包括W下的一个或多个处理:纯 化、复性、连接、扩增、通过限制性内切酶消化并克隆到适宜的载体中。多核巧酸可首先连接 进入克隆载体,或直接进入适合于其在特定的宿主细胞类型中表达的表达载体。
[0129] 多核巧酸可包括非-编码序列,包括例如,非-编码5'和3'序列,例如转录的非-翻 译序列、终止信号、核糖体结合位点、稳定mRNA的序列、内含子和多聚腺巧酸化信号。多核巧 酸可包含与变体多肤异源的另外氨基酸的编码序列,特别是标记序列,例如多聚-His标签, 其促进呈融合蛋白形式的多肤的纯化。
[0130] 多肤可生产为带标签的蛋白,例如W帮助提取和纯化。标签构建体的非-限制性实 例是化S-标签(6个连续的组氨酸残基),其可通过常规方法分离和纯化。包括在标签部分和 目的蛋白序列之间的蛋白水解的裂解位点W允许除去标签,例如凝血酶裂解位点,也可W 是方便的。
[0131] 编码多肤的多核巧酸可结合到各种类型的表达载体中,其可转化到各种类型的宿 主细胞中。宿主细胞可W是原核或真核的。
[0132] 将多核巧酸引入宿主细胞可通过熟知的方法,例如化学转化(如氯化巧处理)、电 穿孔、接合、转导、憐酸巧转染、DEAE-葡聚糖介导的转染、转介、微注射、阳离子脂质-介导的 转染、刮装、弹道导入和感染来进行。
[0133] 在一些实施方案中,细胞是原核细胞。适宜的原核宿主的代表性的、非-限制性实 例包括细菌细胞,例如大肠杆菌化scherictabia col i )和枯草芽胞杆菌(Baci 1 Ius SUbt i 1 i S)的细胞。在其它实施方案中,细胞是真核细胞。在一些示例性实施方案中,细胞是 真菌细胞,例如酵母。适宜的酵母细胞的代表性的、非-限制性实例包括酿酒酵母 (Saccharomyces cerevisiae)和己斯德毕赤酵母(Pichia pastoris)。在另外的示例性实 施方案中,细胞是植物细胞。
[0134] 多肤可W在适合于表达的任何载体中表达。适宜的载体根据选择的宿主细胞确 定。用于在大肠杆菌化.coli)中表达蛋白的载体,例如,包括,但不限于,pET、pK233、pT7和 入pSKF。其它表达载体系统是基于0-半乳糖巧酶(pEX);麦芽糖结合蛋白(pMAL);和谷脫甘肤 S-转移酶(pGST)。
[0135] 用所需载体转化的宿主细胞的选择可使用包括在对非-转化的细胞有毒的选择培 养基中生长的标准选择方案实现。例如,大肠杆菌可在含有抗生素选择剂的培养基中生长; 用还提供抗生素抗性基因的表达载体转化的细胞,将在选择培养基中生长。
[0136] 在合适的宿主细胞转化,和在适宜于蛋白表达的条件下繁殖时,可在转化的细胞 的细胞提取物中鉴定所需多肤。表达目的多肤的转化的宿主可通过使用SDS-PAGE分析由宿 主表达的蛋白,并比较该凝胶与从用相同载体转化但不含编码目的蛋白的核酸序列的宿主 获得的SDS-PAGE凝胶来鉴定。
[0137] 目的蛋白也可通过其它已知的方法例如使用合适的抗体的免疫印迹分析、总细胞 提取物的斑点印迹、有限的蛋白水解、质谱分析及其组合来鉴定。
[0138] 目的蛋白可通过常规方法,包括硫酸锭或乙醇沉淀、酸提取、盐分级、离子交换色 谱、疏水性相互作用色谱、凝胶渗透色谱、亲和色谱及其组合来分离和纯化。
[0139] 可使用本领域已知的方法,其中一些在下文描述,分析分离的目的蛋白的各种特 性,例如特异性活性和热稳定性。
[0140] 进行上述程序W及其它有用的方法的条件由本领域普通技术人员容易地确定(见 例女曰,Current Protocols in Protein Scienc, 1995 John Wiley & Sons)。
[0141] 在特定实施方案中,本发明的多肤可在没有它们的起始密码子(甲硫氨酸或鄉氨 酸)和/或没有它们的前导(信号)肤的情况下被生产和/或使用,W利于重组多肤的生产和 纯化。已知在没有编码前导肤的序列的情况下克隆基因将限制多肤于宿主细胞的胞浆并将 促进它们的回收(见例如,Glick, B. R.和化Sternak, J. J. (1998)在"分子生物技术:重 组DNA的原理和应用(Molecular biotechnology : Principles and applications of recombinant DNA)",第2版,ASM Press, Washington D.C., p. 109-143中)。
[0142] 本发明还提供包含本发明的多酶复合物的组合物,用于生物质降解。
[0143] 本发明还提供能够生产本发明的多酶复合物的基因修饰细胞。运些细胞能够生 产,并且通常分泌复合物的不同组分。
[0144] 在一些实施方案中,基因修饰细胞选自原核和真核细胞。各个可能性代表本发明 的一个独立的实施方案。
[0145] 本发明提供用于生物转化纤维素物质的系统,该系统包含本发明的多酶复合物。
[0146] 方法和用途 本发明的多酶复合物,包含所述多酶复合物的组合物和生产所述多酶复合物的细胞可 用于将纤维素物质生物转化为降解产物。
[0147] "纤维素物质"和"纤维素生物质"指含有纤维素的材料,特别是自含有纤维素的植 物来源获得的材料。纤维素物质涵盖含有纤维素、半纤维素和木质素的木质-纤维素物质。 纤维素物质可包括自然植物生物质并且还包括废纸等。合适的纤维素物质的实例包括,但 不限于,麦杆、柳枝稷、玉米棒、玉米賴杆、高梁賴杆、棉花賴杆、甘薦渣、能源甘薦、硬木纸、 软木纸,或其组合。
[0148] 生成的糖可用于醇例如乙醇、丙醇、下醇和/或甲醇的生产;燃料如,生物燃料例如 合成液体或气体,如合成气的生产;和其它发酵产物,如班巧酸、乳酸或乙酸的生产。
[0149] 根据本发明的一个方面,本文提供一种将纤维素物质转化为降解产物的方法,该 方法包括使所述纤维素物质暴露于本发明的多酶复合物。
[0150] 在一些实施方案中,多酶复合物在与纤维素物质接触之前的装配包括W下步骤: (i)在第一溶液中使第一支架多肤与其对应的酶混合,得到第一支架-酶复合物;(ii)在 第二溶液中使第二多肤与其对应的酶混合,形成第二支架-酶复合物;和(iii)混合第一和 第二溶液,得到第一和第二支架的结合,从而获得本发明的多酶复合物。
[0151] 根据本发明的另外的方面,本文提供一种将纤维素物质转化为降解产物的方法, 该方法包括使所述纤维素物质暴露于能够生产本发明的多酶复合物的基因修饰细胞。
[0152] 降解产物通常包含单糖、二糖和寡糖,包括,但不限于葡萄糖、木糖、纤维二糖、木 二糖、纤维=糖、纤维四糖、阿拉伯糖、木=糖。
[0153] 本发明的多酶复合物可加入到生物转化和其它工业过程,例如,连续、分批或补料 分批方法中。备选地或另外地,本发明的多酶复合物可重复利用。通过缓解木聚糖内切酶和 夕F/内切葡聚糖酶的终产物抑制(例如木二糖和纤维二糖),它可W能够进一步提高纤维素 物质的水解。
[0154] 提出W下实施例W更全面地举例说明本发明的某些实施方案。然而,它们决不应 该被解释为限制本发明的广泛范围。本领域技术人员可容易地设计本文公开的原理的许多 变化和修饰,而不背离本发明的范围。 实施例
[0155] 实施例1 -支架多肤中接头长度的影响 支架多肤的组合文库的制备: 制备重组=价设计者支架多肤的组合文库。从W下4个模块制备支架库: -碳水化合物结合模块(称为"CBM"):来自热纤梭菌的CipA的CBM3a (GenBank登录号 ABN54273)(沈Q ID NO: 1) -=个(3)不同特异性的趋异黏结蛋白模块: (i) 来自热纤梭菌的黏结蛋白(来自热纤梭菌的CipA的第二黏结蛋白,称为"Ct"或" T") (GenBank登录号ABN54273)(沈Q ID NO: 2) (ii) 来自溶纤维素拟杆菌的黏结蛋白(来自溶纤维素拟杆菌的ScaB的第S黏结蛋白, 称为"Be"或"B") (GenBank登录号AAT79550)(沈Q ID NO: 3) (iii) 来自解纤维素醋弧菌的黏结蛋白(来自解纤维素醋弧菌的ScaC的第S黏结蛋 白,称为"Ac"或"A") (GenBank登录号AAP48996)(沈Q ID NO: 4) 设计库W使不同的模块被0 ("无接头")、5 ("短")或27-35 ("长")个氨基酸的接头隔 开。用于该工作的不同接头的氨基酸含量示于表1。 邮]表1 -用于克隆的模块间接头的组 指示各个接头的在前模块。
[0157] 原则上,4个模块可被改组W产生24个不同的排列,每个具有隔开模块的3个不同 长度的接头。因此,从基础支架模板,可潜在地产生72个可能的组合。十四(14)个全组,表示 42个克隆和表达的支架蛋白,被成功地克隆和表达,且被用于进一步的研究。图1指定72个 可能的组合。只有完全的组在模块示意图中示出。
[0158] 关于在库中不同支架多肤的克隆、表达和纯化的细节在下文("材料和方法")中给 出。
[0159] 设计者多纤维素酶体的装配: 为装配设计者多纤维素酶体,使用W下来自热纤梭菌的3个模型纤维素酶:与其天然错 定蛋白一起的外切葡聚糖酶Cel48S (称为"48S-t")、融合至来自溶纤维素拟杆菌的ScaA的 错定蛋白模块的内切葡聚糖酶CelSA (称为"8A-b"),和融合至来自解纤维素醋弧菌的ScaB 的错定蛋白模块的加工性内切葡聚糖酶Cel9K (称为"9K-a")。
[0160] 重组酶的构建在下文描述。
[0161] 48S-t的氨基酸序列在SEQ ID NO: 13中提出。错定蛋白模块对应于该序列的残基 652-715。编码48S-t的多核巧酸序列在沈Q ID NO: 14中提出。
[0162] 8A-b的氨基酸序列在SEQ ID NO: 15中提出。错定蛋白模块对应于该序列的残基 389-459。编码8A-b的多核巧酸序列在沈Q ID NO: 16中提出。
[0163] 9K-a的氨基酸序列在SEQ ID NO: 17中提出。错定蛋白模块对应于该序列的残基 808-878。编码9K-a的多核巧酸序列在沈Q ID NO: 18中提出。
[0164] 简言之,测试W下多-酶构型: -支架包含: 来自热纤梭菌、溶纤维素拟杆菌和解纤维素醋弧菌的黏结蛋白模块; CBM; 其中不同的模块由O (无接头)、5或27-35个氨基酸的接头隔开。
[01化]-酶; Cel48S (热纤梭菌)+来自热纤梭菌的错泊(称为"48S-t") CelSA (热纤梭菌)+来自溶纤维素拟杆菌的错泊(称为"8A-b") Cel9K (热纤梭菌)+来自解纤维素醋弧菌的错泊(称为"9K-a") 黏结蛋白-错定蛋白相互作用的特异性通过如将于下文详述的基于亲和力的化ISA验 证。嵌合体支架被发现与它们的匹配错定蛋白特异性地相互作用。同样地,纤维素酶与它们 的匹配黏结蛋白特异性地相互作用。
[0166] 设计者-多纤维素酶体复合物的形成首先通过非-变性PAGE分析。各个酶的完全相 互作用的摩尔比用来自支架组的几个代表性支架确定。运些预定的摩尔比被用于3种酶与 完整的42个支架蛋白组相互作用,非-变性PAGE被用来评价生成的复合物。每个复合物作为 一个主要的带在凝胶上迁移,从设计者多纤维素酶体的各个组分的带迁移,指示在每一种 情况下的有生产力的接近完成或完全的相互作用。此外,设计者多纤维素酶体复合物用尺 寸排阻色谱法分析,由此各个单一组分被分开评价,和它们的保留体积被用作分析设计者 多纤维素酶体复合物的标记物。多纤维素酶体复合物洗脱比单一酶和支架更快,作为一个 主要的峰出现。合并来自设计者多纤维素酶体复合物的各部分,浓缩,然后经SDS-PAGE分 析。显示主要峰由所有巧巾酶与嵌合体支架一起组成。
[0167] 活性分析: 在一个初步分析中,对重组酶降解憐酸溶胀纤维素(PASC)或微晶纤维素(Avicel)的能 力进行测试,并将们的活性与野生型酶的活性进行比较。
[0168] 设计者多纤维素酶体的活性使用微晶纤维素 (Avicel)作为纯微晶纤维素底物和 含有90%纤维素、5%半纤维素和5%木质素的预处理的富含纤维素的麦杆作为自天然来源获 得的模型底物来检查。
[0169] 进行一种代表性支架组的初步动力学分析,W确定在任一底物上的纤维素水解反 应的终点。
[0170] 其次,在单一时间点(通过动力学分析预先确定的),测试由库中各个支架组成的 设计者多纤维素酶体的纤维素水解。对于微晶纤维素 (Avicel),在72小时测试活性,因为较 短溫育时间具有低于5%的转化率。对于预处理的麦杆,3小时后动力学反应达到约20%的转 化,因此较长的溫育时间是不必要的。
[0171] 测试W下组合的活性: a.巧巾游离状态的酶的混合物。
[0172] b.巧中游离状态的酶的混合物,其中各个酶结合于由匹配黏结蛋白模块和CBM (" CBM-Coh")组成的微小-支架。因此,酶未整合到一个复合物中,但各个酶分别祀向底物。
[0173] C.结合于来自库的支架的3个酶的复合物。测试了 14个不同的支架排列(组)与3 种纤维素酶组合对微晶纤维素 (Avicel)和预处理的麦杆的活性;对于各个排列,对模块间 接头的长度(即无接头、5个氨基酸或平均30.5 (27-35)个氨基酸)变化的3个支架进行了测 试。
[0174] 结果示于图2A (微晶纤维素)和图2B (预处理的麦杆)。在A和B二者中,上面的小 图显示具有支架组与内部CBM的多纤维素酶体的活性,和下面的小图提供多纤维素酶体与 在末端携带CBM的支架的结果。
[0175] 设计者支架的模块排列和模块间接头长度的所有组合在两种底物上产生活性的 =价设计者多纤维素酶体装配。设计者多纤维素酶体显示出一种协同作用并具有比游离酶 W及祀向酶(经由CBM-Cohs)更高的活性。
[0176] 结果也掲示随着模块间接头长度从完全无接头至5个残基的短接头,和从短的接 头至长的接头的增加,对两种底物呈现增加活性的趋势。相互作用的双向ANOVA被用于统计 学验证,长度和14个支架蛋白排列作为因子;对任一底物[微晶纤维素 (P = 0.16)、预处理 的麦杆(P = 0.0595)]未发现有相互作用,指示接头长度对活性确实具有显著的作用。因 此,由长接头、短接头和无-接头支架显示的活性对于两种底物,在大多数组中观察到彼此 显著不同。
[0177] 用于=价设计者支架蛋白的优选的模块排列对于用于该研究的巧巾酶未观察到, 指示运巧巾酶可在设计者多纤维素酶体的任何位置整合,而对纤维素-降解活性没有显著作 用。
[017引材料和方法 1.纤维素酶的克隆 重组野生型家族-48外切型纤维素酶Cel48S-ct,分别用W下正向和反向引物从热纤梭 菌ATCC 27405基因组DNA扩增:5' CAGTCCATGGGTCCTACAAAGGCACCTAC 3'(沈Q ID NO: 19) 和5' CGCGAAGCTTTTAATGGTGATGGTGATGGTGG 3'(沈Q ID NO: 20) (Nco巧口HindIII限制性 位点W黑体表示),运允许结合到pET28a中。类似地,重组野生型家族-8内切型纤维素酶 Cel8A-bc CelSA,分别用W下正向和反向引物从热纤梭菌的基因组DNA克隆:5' CAGTCCATGGGTGTGCCTTTTAACACAAA 3' (SEQ ID NO: 21)和5' CACGCTCGAGATAAGGTAGGTGGGGTATGC 3'(沈Q ID NO: 22),(化01和化01 限制性位点 W黑体 表示)。同样地,重组野生型家族-9内切型纤维素酶Cel9K-ct,分别使用无限制性(RF)方法 (Unger等,2010, J Struct Biol, 172:34-44),用W下正向和反向引物,从热纤梭菌基因 组DNA扩增并克隆到祀T28a载体中:5' GTTTAACTTTAAGAAGGAGATATACCATGGGCCATCACCATCAC CATCACTTAGAAGACAAGTCTCCAAAGTTGCCGGAT 3,(SEQ ID NO: 23)和5, GAGTGCGGCCGCAAGCTTGTCGACGGAGCTCTTATTTATGTGGCAATACATCTATCTCTTTAAG 3' (沈Q ID NO: 24),(基因特异性序列加下划线,质粒特异性序列用普通字体显示,His-标签W黑体表 示)。对于具有来自解纤维素醋弧菌的趋异错定蛋白的Cel9K-ac的克隆,从解纤维素醋弧菌 的基因组DNA扩增错定蛋白并用于使用RF克隆方法,分别用W下正向和反向引物,同时插入 趋异错定蛋白和缺失野生型错定蛋白进入野生型Cel9K-ct质粒:5' CTCGATGAAATTGACTTAATAACACCGCCAGGTACCAAATTTATATATGGTGATGTTGATGGTAATG 3' (SEQ ID NO: 25)和5' GAGTGCGGCCGCAAGCTTGTCGACGGAGCTCTTATTCTTCTTTCTCTTCAACAGGGAATAAA AATATC 3' (SEQ ID NO: 26)(基因特异性序列加下划线,质粒特异性序列用普通字体显 示)。对于具有热纤梭菌CelSA催化模块和来自溶纤维素拟杆菌的趋异错定蛋白的嵌合体酶 Cel8A-bc的克隆,CelSA的催化模块分别用W下正向和反向引物,从热纤梭菌ATCC 27405基 因组DNA扩增:5' ATTCAACCATGGGTGTGCCTTTTAACACAAAATAC 3'(SEQ ID NO: 27)和5' ATATTGCTCGAGTAATGTGGTACCAATGAAGGTGTCGGATTCGACG 3' (沈Q ID NO: 28) (NcoI、KpnI 和化Ol限制性位点W黑体表示)dPCR产物被克隆到用NcoI和趾Ol限制性酶线性化的祀T28a 质粒中,得到P8A-CD。错定蛋白分别用W下正向和反向引物,从溶纤维素拟杆菌基因组DNA 扩增:5' ACTTTAGGTACCTCCAAAAGGCACAGCTAC 3' (SEQ ID NO: 29)和5' ATTAATCTCGAGCGCTTTTTGTTCTGCTGG 3'(沈Q ID NO: 30)化pnl和化01 限制性位点W黑体 表示)。生成的DNA被克隆到用KpnI和化01线性化的P8A-CD中,得到p8A-bc。
[0179] 2.短接头和无-接头支架的高-通量计算机辅助克隆 一种用于组合DNA库设计和生产的计算机辅助自动方法被用于失去模块间接头或者含 有短的(5 aa)模块间接头的支架的构建和克隆。使用运种途径的支架的设计和合成使用计 算机辅助方法进行W指定、可视化和规划和执行所需DNA文库的实际生产化inshiz等, 2008,Mol Syst Biol, 4:191;和Siabi等,2010,Syst Synth Biol, 4:227-236)。
[0180] 在运种方法中的核屯、递归构建步骤需要4个基础酶促反应:憐酸化、延伸、PCR和入 核酸外切,并如由上面提到的Linshiz先前描述的,使用为此目的设计的一组引物进行。
[0181] 通过第二组引物,根据位于各个支架构建体的5'和3'的模块,扩增PCR产物W产生 足够量的DNA用于随后的克隆。扩增的产物经NcoI和趾OI消化,并与NcoI-XhoI线性化 祀T28a载体连接(Novagene,Madison, WI)。阳性克隆通过菌落PCR选择并通过测序验证。
[0182] 3.长-接头支架的无限制性(RF)克隆 第二途径,设及DNA区段的无限制性多-组分装配(Unger等,2010,J Struct Biol, 172:34-44),被用于克隆具有长(27-35 aa)模块间接头的支架。为构建各个支架,设计8个 引物对。His-标签被加入到各个构建体的C末端用于使用Ni-次氮基S乙酸(NTA)柱(Qiagen GmbH,化den, Germany)进一步纯化。4个模块通过PCR在对应于连接区域(或者用另一个连 接插入基因或者在需要时用表达载体)的5'和3'两个末端上,用25-至30-bp突出端扩增。接 着,PCR产物作为特大-引物用于同时装配载体(pET28a质粒)和通过线性扩增插入,生成含 有编码重组支架多肤(带有4个模块)的序列的线性质粒(pET28a)。
[0183] 设计用于PCR扩增的引物组并使用化usion聚合酶(Thermo Scientific)进行随后 的RF反应。
[0184] 4.纤维素酶和设计者支架的表达和纯化 于37°C,使过度生产祀T28a-支架基因或纤维素酶的大肠杆菌化21 (DE3)细胞在补充 有50 g/ml 卡男 P 霉素(Sigma-Aldrich Chemical Co, St. Louis , Missouri)的Luria-Bertani肉汤中生长至Asoo = 0.8-1.0。使培养物冷却至16°C,并基于预定的最佳实验的结 果,通过添加0-1 mM异丙基-1-硫代-D-半乳糖巧-IPTG (Fermentas UAB Vilnius, Lithuania),诱导蛋白表达。于16°C溫育培养物另外16 h,细胞通过离屯、(3500 g, 15 min) 收获,再次悬浮于补充有5 mM咪挫(Merck KGaA, Darmsta化,Germany)的IYis-缓冲盐水 (TBS、137 ml化Cl、2.7 mM KCl、25 mM IYis-肥1,抑7.4)中并通过超声破裂。加热超声裂 解物 20 min 至 60°C 并离屯、(20 ,OOOg, 30 min)。于 4°C,使上清液与 4 ml Ni-NTA 珠在 20-ml Econo-装填柱中混合1 h用于批纯化。柱用100 ml洗涂缓冲液(TBS、50 mM咪挫)的重力流洗 涂并用14 ml洗脱缓冲液(TBS, 250 mM咪挫)进行洗脱。为了纯化支架,应用另外的亲和-纯 化步骤:于4°C,使洗脱的部分与10 ml憐酸溶胀纤维素(PASC) (0.75 mg/ml),在50-ml试管 中解育1 h,W允许结合CBM。基质用含有1 M NaCl的TBS洗涂3次,并用不加盐的TBS洗涂3 次。支架用1%S乙胺洗脱并用1 M 2-(N-吗嘟代)乙烧横酸(MES)缓冲液(pH 5)中和。对于支 架和纤维素酶二者,缓冲液通过对TBS透析进行交换,支架样品使用Amicon叫化a 15 ml 50,000 MWCO浓缩器浓缩(Millipore, Be壯ord, MA)。蛋白浓缩物通过在280 nm处的吸光 度估算。消光系数根据已知的各个蛋白的氨基酸组成,使用Pro证aram工具在EXPASY服务器 (http : //www. expasy. org/tools/protparam. html)上测定(Gasteiger等,2005 ,在 ExPASy服务器上的蛋白鉴定和分析工具(Protein Identification and Analysis Tools on the ExPASy Server))。
[0185] 5.黏结蛋白-错定蛋白特异性分析 对Barak等,2005,J Mol Recogit, 18:491-501 的程序进行微小修改。Maxisorp ELISA板(Nunc A/S, Roskilde, Denmark)用1 g/ml的各自含有错定蛋白的酶Cel48S-ct、 Cel9K-ac和Cel8A-bc包被,然后与0.1-1000 ng/1 的其匹配CBM-黏结蛋白(CBM-CohCt A2、 CBM-CoMc C3和CBM-Coh-Bc B3)对应物相互作用。兔抗-CBM (在封闭缓冲液中按1:3000稀 释)被用作检测相互作用的第一抗体。为分析嵌合体支架,Maxiso巧ELISA板用1 g/ml嵌合 体支架包被,然后与0.1-1000 ng^的匹配Xyn-Doc蛋白(其如在上文注明的Barak等,2005 中所述制备)相互作用。运些蛋白包含融合于适宜特异性的错定蛋白模块的来自嗜热脂肪 上芽抱杆菌(Geobaci 1 Ius Stearothermophi Ius)的木聚糖酶T-6。兔抗-木聚糖酶T-6抗体 (在封闭缓冲液中按1:10,〇〇〇稀释)被用作检测相互作用的第一抗体。加入按1:10,〇〇〇稀释 的山羊-皿P-标记的抗兔抗体的第二抗体制剂。相互作用使用TMB底物-色原体(Dako A/S, Glostrup, DK)检测,反应通过添加1 M出S化终止。吸光度于450皿处测量。
[0186] 6.非-变性PAGE 将等摩尔浓度的支架蛋白和匹配酶(各蛋白4-8 yg)混合并加入到类似的体积的相互 作用缓冲液(含10 HiM CaCb和0.05%吐溫20的TBS)中。将DDW加入至最终体积30iil。使蛋白 于37°C解育2 hW允许复合物形成。加入非-变性样品缓冲液(192 mM甘氨酸、25 ml Tris), 且使用Bio-Rad power pack 300,使总共15 yl/道经受PAGE (7.5-9%丙締酷胺凝胶)。使用 单一组分(支架和酶)作为标记物。剩余的15 被用于在SDS-PAGE上分析。
[0187] 7.尺寸排阻高效液相色谱化PLC) 等摩尔蛋白浓缩物(450皮摩尔支架或酶)在300 的加样缓冲液(Tris缓冲盐水pH = 7.4 (TBS),补充有2 ml化CI2)中稀释。为形成设计者多纤维素酶体复合物,将等摩尔浓度 的支架和酶与类似体积的相互作用缓冲液(含10 ml CaCb和0.05%吐溫20的TBS)于37°C解 育2 h,并将加样缓冲液加入至最终体积300 yl。使用AKTA快速高效液相色谱系统(GE Healthcare, Uppsula, Sweden)并Wo.5 ml 的流速的加样缓冲液,将反应物注入分 析型Superdex 200皿10/30柱中。于280皿检测洗脱的蛋白,浓缩各部分(0.5 ml)并使用 SDS-PAGE凝胶分析。
[0188] 8.富含纤维素(预处理)麦杆的准备 将麦杆切成碎片并磨碎,得到具有平均粒径1-3 mm的粉末。于115°C,将生成的粉末样 品(20 g)用85 ml 5% (v/v)硝酸处理1 h。酸-处理的生物质用DDW洗涂并于100°C用150 ml 1.5% v/v NaOH进一步处理1 h,用孤W洗涂,得到富含纤维素的底物。
[0189] 9.麦杆底物化学组成的测定 样品的化学组成根据W下改进的TAPPI-方法测定。对于半纤维素含量,使样品与2% HCl -起沸腾2 h,用DDW和乙醇洗涂并于105°C干燥至恒定重量(约2-3 h)。对于纤维素含 量,使样品与乙醇HN03溶液一起沸腾I h,用孤W和乙醇洗涂,并于105°C干燥至恒定重量(约 2-3 h)。对于木质素含量,于室溫下,使样品在72%此S化中溶胀2 h,用DDW稀释至8-10%的 酸,用沸腾的稀出S化(8-10%)水解2 h,用孤W和乙醇洗涂,并于105°C干燥至恒定重量(约2-3 h)。总固体含量通过于105°C干燥样品2 h测定。
[0190] 10.活性分析 水解反应W总体积200 进行,并由反应缓冲液(100 ml乙酸钢缓冲液抑5.5,24 mM CaCl2、4 mM EDTA)、0.5 yM的各个蛋白和2% w/v微晶纤维素(Sigma-Aldrich 化emical Co, St. Louis, Missouri)或3.5 gr/L预处理(富含纤维素)的麦杆组成。在添加底物之 前,于37°C使每个支架用等摩尔量的3种酶与类似体积的相互作用缓冲液(含10 mM化C12 和0.05%吐溫20的TBS)解育2 h。反应于50°C进行24-72 h (微晶纤维素)或3-24小时(预处 理的麦杆)并通过浸没在冰水中终止。底物经W最大速度(20,800 X g,10-15 min)离屯、沉 淀,并将100 上清液转移至新的试管中。加入二硝基水杨酸(DNS, 150 yl),并将样品沸 腾10 min。于540 nm测量吸光度并根据葡萄糖校准曲线测定还原糖。各个测定法按一式S 份重复3次。
[0191] 实施例2 -由主要和衔接子支架多肤组成的人造多纤维素酶体复合物的构建和 测试 衔接子支架的构建 制备包含由27-35个氨基酸的接头隔开的W下模块的衔接子支架:3种用于整合酶的来 自解纤维素醋弧菌(上文所述的ScaC的第S黏结蛋白,称为"A")、溶纤维素拟杆菌(上文所 述的ScaB的第S黏结蛋白,称为"B")和热纤梭菌(上文所述的CipA的第二黏结蛋白,称为" T")的趋异黏结蛋白模块;用于附着于主要支架的来自热纤梭菌(C. thermocelum)(来自 01口4,化1?'〇1邸/5*133斗'〇1登录号946453,称为"0〇。411")的11型错定蛋白模块;和来自 热纤梭菌的CBM (上文所述的CipA的CBM3a,称为"CBM")。衔接子支架的氨基酸序列在SEQ ID NO: 31中提出。编码衔接子支架的多核巧酸序列在SEQ ID NO: 32中提出。
[0192] 衔接子支架被设计为与W下巧巾酶相互作用: -具有来自解纤维素醋弧菌的错定蛋白(ScaA的错定蛋白)的Cel9A (T.化sea)(加工 性内切葡聚糖酶)(称为"a-9A") -具有来自溶纤维素拟杆菌的错定蛋白的Cel48A (T.化sea)(外切葡聚糖酶)(称 为"b-48A") -具有来自热纤梭菌的错定蛋白(热纤梭菌木聚糖酶XynlOZ的错定蛋白)的Cel5A (T. fusca)(内切葡聚糖酶)(称为"5A-t")。
[0193] 重组Cel48A和Cel5A的构建描述于等,2008, Journal of Biotechnology, 135: p. 351-357;和Caspi等,2009, Applied and Environmental Microbiology, 75: p. 7335-7342。重组Cel9A通过移除野生型酶C-末端的CBM2和在N-末端添加来自解纤维素 醋弧菌(来自ScaB)的错定蛋白模块来构建。His-标签在序列的开始添加。蛋白使用常规的 儀珠纯化方案纯化。
[0194] a-9A的氨基酸序列在SEQ ID NO: 33中提出。错定蛋白模块对应于序列的残基16-86。编码a-9A的多核巧酸序列在SEQ ID NO: 34中提出。
[0195] b-48A的氨基酸序列在SEQ ID NO: 35中提出。错定蛋白模块对应于序列的残基 18-88。编码b-48A的多核巧酸序列在SEQ ID NO: 36中提出。
[0196] 5A-t的氨基酸序列在SEQ ID NO: 37中提出。错定蛋白模块对应于序列的残基 313-376。编码5A-t的多核巧酸序列在沈Q ID NO: 38中提出。
[0197] 进行描述于实施例1中的使用九(9)个来自库的支架多肤的初步实验,其包括选择 的上文所述的黏结蛋白和CBM模块的不同排列,W确定提供更好的整体纤维素分解活性的 模块排列。经检查的9个支架示于表2。各个支架与上文所述的巧巾酶相互作用并测试对微晶 纤维素的活性。另外的试验用包括来自热纤梭菌(C. thermocellum)的错定蛋白II型和来 自解纤维素醋弧菌、溶纤维素拟杆菌和热纤梭菌的黏结蛋白I型,但缺乏CBM的衔接子支架 (称为"Dockll-A-B-T")进行。运种支架经由与含有融合于II型黏结蛋白的CBM的微小-支架 相互作用祀向底物,所述II型黏结蛋白与衔接子支架的II型错定蛋白匹配。
[0198] 不同的衔接子-酶复合物的活性与游离酶的混合物和其中各个酶结合于黏结蛋 白-CBM微小-支架(匹配携带酶的错定蛋白)的酶的混合物的活性比较。
[0199] 亲2
在初步实验后,选择具有在SEQ ID NO: 31中提出的序列的衔接子支架用于进一步研 究。在运种衔接子支架中,模块排列如下:CBM -黏结蛋白A-B-T - DockII (称为"CBM-A-B-T-Dockll")。运种衔接子整合巧巾酶,W致Cel9A邻近于位于支架一个末端的CBM,Cel48A在 中部,而Cel5A位于该支架蛋白的另一端,邻近于II型错定蛋白。
[0200] 关于微晶纤维素的活性分析显示祀向和邻近效应,导致与游离酶的混合物、结合 于匹配黏结蛋白-CBM微小-支架的酶的混合物、和结合于衔接子DockII-A-B-T (缺乏CBM) 的酶(其还结合于匹配黏结蛋白-CBM微小-支架)比较的改进的纤维素水解活性(图3)。 [020。含有主要和衔接子支架的多酶复合物 制备主要支架,其能够与上文描述的衔接子支架CBM-A-B-T-DockII相互作用。主要支 架被制备为含有可整合携带6个错定蛋白的亚基的6个黏结蛋白模块的六价支架。特别是, 六价支架被制备用于整合五(5)个碳水化合物活性酶和一个衔接子支架。总而言之,衔接子 和主要支架的复合物可整合八(8)个碳水化合物活性酶(5个在主要支架上和3个在衔接子 支架上)。
[020。主要六价支架: -支架: 支架从W下模块制备: *来自解纤维梭菌的黏结蛋白(来自支架蛋白CipC的黏结蛋白I ,GenBank登录号 U40345.3)(称为"C")(沈Q ID NO: 39); *来自解纤维素醋弧菌的黏结蛋白(来自上文所述的支架蛋白C的黏结蛋白3)(称为" A"); *来自热纤梭菌的黏结蛋白(来自上文所述的多纤维素酶体的支架亚基CipA的黏结蛋 白3)(称为"T"); *来自闪烁古生球菌的黏结蛋白(黏结蛋白2375, GenBank登录号AE001112.1)(称为" G")(沈Q ID NO: 40); *来自黄色瘤胃球菌(Ruminococcus化ve化ciens)的黏结蛋白(来自株17的支架蛋白B 的黏结蛋白!,GenBank登录号AJ278969.4)(称为"F") (SEQ ID NO: 41); *来自OlpB的热纤梭菌的黏结蛋白II型(NCBI参照序列:YP_001039467 YP001039467 或UniProtKB登录号Q06852)(称为"Cohn")(沈Q ID NO: 42); * CBM (热纤梭菌,上文所述的CipA的CBM3a)(称为"CBM")。
[0203] 主要支架的氨基酸序列在SEQ ID NO: 43中提出。编码主要支架的多核巧酸序列 在沈Q ID NO: 44中提出。在运种主要支架中,模块排列如下:CohII-C-A-CBM -T -G- F。
[0204] -產; * Xyn43A (木聚糖酶)(T.化sea) +来自解纤维梭菌的错定蛋白(来自支架蛋白A的 错定蛋白)(称为"Xyn43A-c") * XynllA (木聚糖酶)(T.化sea) +来自解纤维素醋弧菌的错定蛋白(上文所述的 ScaB的错定蛋白模块)(称为"XynllA-a") * XynlOB (木聚糖酶)(T.化sea) +来自热纤梭菌的错定蛋白(上文所述的Cel48S 的错定蛋白)(称为"XynlOB-t") * Cel6A (内切葡聚糖酶)(T.化sea) +来自闪烁古生球菌的错定蛋白2375 (称为" 6A-g") * XynlOA (木聚糖酶)(T.化sea) +来自黄色瘤胃球菌的错定蛋白(来自ScaA的错 定蛋白)(称为"XynlOA-f")。
[0205] Xyn43A-c、XynllA-a、XynlOB-t和XynlOA-f 的构建描述于Morais, S.等,2012, MBio, 3(6)中。重组6A-g通过用来自细菌闪烁古生球菌的错定蛋白(蛋白源:2375)替代野 生型酶的CBM2而获得。His-标签被加入到该序列的末端。蛋白使用常规儀珠纯化方案纯化。
[0206] Xyn43A-c的氨基酸序列在SEQ ID NO: 45中提出。错定蛋白模块对应于该序列的 残基564-623。编码Xyn43A-c的多核巧酸序列在沈Q ID NO: 46中提出。
[0207] XynllA-a的氨基酸序列在SEQ ID NO: 47中提出。错定蛋白模块对应于该序列的 残基329-399。编码XynllA-a的多核巧酸序列在沈Q ID NO: 48中提出。
[0208] XynlOB-t的氨基酸序列在SEQ ID NO: 49中提出。错定蛋白模块对应于该序列的 残基397-460。编码XynlOB-t的多核巧酸序列在沈Q ID NO: 50中提出。
[0209] 6A-g的氨基酸序列在SEQ ID NO: 51中提出。编码6A-g的多核巧酸序列在SEQ ID NO: 52中提出。
[0210] XynlOA-f的氨基酸序列在SEQ ID NO: 53中提出。错定蛋白模块对应于该序列的 残基368-444。编码XynlOA-f的多核巧酸序列在沈Q ID NO: 54中提出。
[0211] 衔接子S价支架(上文描述的CBM-A-B-T-DockII): -支架: *来自热纤梭菌的II型错定蛋白模块; *来自解纤维素醋弧菌、溶纤维素拟杆菌、热纤梭菌的黏结蛋白模块; * CBM (热纤梭菌,CipA的CBM3a); -酶: * Cel9A +来自解纤维素醋弧菌(A. Cellulolyticus)的错定蛋白 * Cel48A +来自溶纤维素拟杆菌(B .cellulosolvens)的错定蛋白 * Cel5A +来自热纤梭菌的错定蛋白 生成的多酶复合物的示意图示于图4。
[0212] 衔接子支架附着于主要支架的贡献通过使用广泛种类的对照得到证实,所述对照 清楚地显示,两个支架之间的接近对于复合物纤维素底物的最佳降解确实是重要的。
[0213]图5提出不同的嵌合体酶促合剂的麦杆降解能力,运种能力作为于50°C溫育48小 时后释放的还原糖的量来测量。试验程序如在Morais等,2012, MBio., 3(6): e00508-12 中所述。酶浓度0.3 iiM (各个)。
[0214] 测试W下组合: -6个重组酶结合于六价支架的复合物:Xyn43-c、Xyn 11 A-a、Xyn 1 OB-t、Xyn 1 OA-f、6A-g 和b-48a (图5的栏1)。
[0215] -游离的8种重组酶的混合物:Xyn43-c、XynllA-a、XynlOB-t、XynlOA-f、6A-g、b-48a、a-9A和5A-t (图5的栏2)。
[0216] - 8种重组酶与匹配微小-支架的复合物,即由碳水化合物结合模块(CBM)和单一 黏结蛋白模块(匹配相互作用的酶的错定蛋白模块)组成的支架多肤(图5的栏3)。
[0217] - 6个重组酶Xyn43-c、XynllA-a、XynlOB-t、XynlOA-f、6A-g和b-48a结合于六价支 架的复合物,和各自结合于含有匹配黏结蛋白的微小-支架的a-9A和5A-t的复合物的混合 物(图5的栏4)。
[021 引-6个重组酶Xyn43-c、XynllA-a、XynlOB-t、XynlOA-f、6A-g和b-48a结合于六价支 架的复合物,和a-9A和5A-t结合于含有匹配a-9A和5A-t的错定蛋白模块的两个黏结蛋白模 块的二价支架的复合物的混合物(图5的栏5)。
[0219] - 5个重组酶乂71143-。心711114-日^711108-1、64-旨和乂711104寸结合于六价支架 CohII-C-A-CBM-T-G-F的复合物(其含有一个与衔接子支架整合的黏结蛋白,因而仅整合5 个酶促亚基),和3个重组酶a-9A、b-48a和5A-9结合于S价支架的复合物(所述支架含有匹 配巧中酶的错定蛋白模块的黏结蛋白模块)的混合物(图5的栏6)。
[0220] -主要和衔接子支架与它们的结合酶的复合物:结合于主要支架蛋白CohII-C-A-CBM-T-G-F 的 5 个重组酶 Xyn43-c、Xynl lA-a、Xyn 1 OB-t、6A-g 和 Xyn lOA-f,和结合于衔接子支 架CBM-A-B-T-Dockn 的 3个重组酶a-9A、b-48a和5A-9 (图 5 的栏7)。
[0221] -游离野生型酶乂71143心711114^711108心711104、〔6164、〔61484、〔6194和〔615八的 混合物(图5的栏8)。
[0222] 通过比较栏4和6与栏7,有可能观察到主要支架和衔接子支架之间的相互作用的 重要性。整合两个支架导致与非-结合的主要和衔接子支架(各自具有其酶)的混合物比较 的显著增加(大约2-倍增加)的活性。与单价支架-酶复合物(微小支架)混合的六价支架-酶 复合物比较,活性也得到提高。
[0223] 还在0葡糖巧酶(来自T. fusca的BglC)的存在或不存在下,在与热纤梭菌的提取 的天然多纤维素酶体的比较中,评价了设计者多纤维素酶体复合物的效力。如在Morais等, 2012, MBio (上文所述的)中所述测试麦杆降解。于50°C进行溫育。
[0224] 结果概述于图6。含有附接于主要支架蛋白的衔接子支架与总共8个嵌合体酶的设 计者多纤维素酶体显示与天然多纤维素酶体比较的有利的降解动力学:虽然热纤梭菌多纤 维素酶体的活性似乎在48小时后达到饱和,设计者多纤维素酶体甚至在72小时后保持其线 性增加。
[0225] 除了改进动力学外,进一步的分析显示,与迄今已知的设计者多纤维素酶体,例 如,在Morais等,2012, MBio.(上文指出的)中描述的设计者多纤维素酶体比较,具有本 文描述的结合衔接子-主要支架的设计者多纤维素酶体显示出改进的降解能力。在Morais 等中描述的设计者多纤维素酶体由六价支架与总共6个嵌合体酶Xyn43-c、XynllA-a、 XynlOB-t、XynlOA-f、g-5A和b-48a组成。当运种六价设计者多纤维素酶体与热纤梭菌的天 然多纤维素酶体比较时,它仅显示天然多纤维素酶体的约40%的活性,而本文描述的设计者 多纤维素酶体显示天然多纤维素酶体的大约70%的活性(与在0-葡糖巧酶的存在下,在溫育 72小时后的麦杆降解比较)。
[0226] 因此,前面描述的具体实施方案充分地掲示了本发明的一般本质,其他人应用当 前的知识,可W容易地修饰和/或修改运样的具体实施方案的各种应用,而不进行过度的实 验和不背离一般概念,因此,运样的修改和修饰应该和意欲包括在所公开的实施方案的等 价物的意义和范围内。要理解本文采用的措辞或术语是为了描述而不是限制的目的。用于 进行各种公开的功能的工具、材料和步骤可采取各种可供选择的形式而不背离本发明。
【主权项】
1. 一种人造纤维素分解的多酶复合物,其包含: (i) 第一支架多肽,其包含多个被包含5-50个氨基酸的接头隔开的黏结蛋白模块,至 少两个所述黏结蛋白模块具有对锚定蛋白模块的不同结合特异性;和锚定蛋白模块; (ii) 第二支架多肽,其包含多个被包含5-50个氨基酸的接头隔开的黏结蛋白模块,至 少两个所述黏结蛋白模块具有对锚定蛋白模块的不同结合特异性,其中至少一个黏结蛋白 模块具有对第一支架多肽的锚定蛋白的结合特异性;和 (i i i)多个碳水化合物活性酶,每个碳水化合物活性酶包含具有对第一支架、第二支 架或两者的黏结蛋白的结合特异性的锚定蛋白模块, 其中第一和第二支架经由第一支架的锚定蛋白和具有对所述锚定蛋白的结合特异性 的第二支架的黏结蛋白结合, 其中所述多个碳水化合物活性酶经由具有相互结合特异性的锚定蛋白-黏结蛋白模 块,结合于第一和第二支架多肽,和 其中第一支架、第二支架或两者还包含碳水化合物结合模块(CBM)。2. 权利要求1的多酶复合物,其中第一和第二支架多肽的每一个包含3-10个黏结蛋白 丰旲块。3. 权利要求2的多酶复合物,其中第一和第二支架多肽的每一个包含3-6个黏结蛋白模 块。4. 权利要求1的多酶复合物,其中黏结蛋白模块源自一种或多种产生多纤维素酶体的 微生物。5. 权利要求4的多酶复合物,其中产生多纤维素酶体的微生物选自热纤梭菌 (Clostridium thermocellum)、解纤维素醋弧菌(Acetivibrio cellulolyticus)、黄色瘤 胃球菌(Ruminococcus flavefaciens)、溶纤维素拟杆菌(Bacteroides cellulosolvens)、 闪烁古生球菌(Archaeoglobus fulgidus)和解纤维梭菌(Clostridium cellulolyticum) 〇6. 权利要求1的多酶复合物,其中黏结蛋白模块源自一种或多种无-多纤维素酶体的微 生物。7. 权利要求1的多酶复合物,其中锚定蛋白模块源自一种或多种产生多纤维素酶体的 微生物。8. 权利要求7的多酶复合物,其中产生多纤维素酶体的微生物选自热纤梭菌(C. thermocellum)、解纤维素醋弧菌(A. cellulolyticus)、黄色瘤胃球菌(R. flavefaciens)、溶纤维素拟杆菌(B. cellulosolvens)、闪烁古生球菌(A. fulgidus)和解 纤维梭菌(C. cellulolyticum)。9. 权利要求1的多酶复合物,其中锚定蛋白模块源自一种或多种无-多纤维素酶体的微 生物。10. 权利要求1的多酶复合物,其中第一和第二支架多肽均包含CBM。11. 权利要求1的多酶复合物,其中所述接头包含5-40个氨基酸。12. 权利要求1的多酶复合物,其中所述接头包含15-35个氨基酸。13. 权利要求1的多酶复合物,其中多个碳水化合物活性酶包含糖苷水解酶、多糖裂解 酶、糖酯酶或其组合。14. 权利要求13的多酶复合物,其中糖苷水解酶选自纤维素酶、木聚糖酶、β-葡糖苷酶 及其组合。15. 权利要求1的多酶复合物,其中碳水化合物-活性酶是细菌酶。16. 权利要求15的多酶复合物,其包含来自T. fusca、热纤梭菌(C. thermocellum)或 两者的碳水化合物-活性酶。17. 权利要求1的多酶复合物,其还包含一个或多个支架多肽,其中多个碳水化合物结 合酶与其结合,所述多个碳水化合物结合酶结合于第一支架、第二支架或两者。18. -种降解纤维素物质的组合物,其包含权利要求1的多酶复合物。19. 一种降解纤维素物质的系统,所述系统包含权利要求1的多酶复合物。20. -种降解纤维素物质的方法,该方法包括使所述纤维素物质暴露于权利要求1的多 酶复合物。
【文档编号】C12N9/42GK105874064SQ201480054636
【公开日】2016年8月17日
【申请日】2014年8月3日
【发明人】E.A.巴耶, Y.瓦扎纳, Y.巴拉克, J.斯特恩, H.吉拉里, S.莫拉伊斯
【申请人】耶达研究及发展有限公司