与木质素结合降低的碳水化合物结合组件的制作方法

文档序号:406640阅读:269来源:国知局
专利名称:与木质素结合降低的碳水化合物结合组件的制作方法
技术领域
本发明涉及经修饰的碳水化合物结合组件(carbohydrate binding module)。更具体地,本发明涉及表现出与木质素结合降低的经修饰的第I家族碳水化合物结合组件。 本发明还涉及包含经修饰的第I家族碳水化合物结合组件的经修饰的糖苷酶、包含编码经修饰第I家族碳水化合物结合组件或经修饰糖苷酶的核苷酸序列的基因构建体,以及包含经修饰的第I家族碳水化合物结合组件的经修饰的糖苷酶在木质素的存在下水解纤维素或半纤维素底物的用途。
背景技术
地球上多于50%的有机碳发现于植物的细胞壁中。植物细胞壁主要由以下化合物组成纤维素、半纤维素和木质素。这些化合物总称为“木质纤维素”,它们是发酵成乙醇或其他高值产品的糖和其他有机分子的潜在来源。
由于纤维素乙醇在环境方面的有利且可持续的性质,将木质纤维素(或木质纤维素类生物质)转化为乙醇已成为新兴能源政策的关键特征。针对纤维素转化开发了数种技术。本文关注的方法是对木质纤维素类生物质进行增加其对水解酶的敏感性的预处理, 然后使预处理过的木质纤维素经酶促水解成糖并且将这些糖发酵成乙醇或其他高值的有机分子(如丁醇)。常用的预处理方法包括稀 酸蒸汽爆破(美国专利No. 4,461,648)、氨冷冻爆破(AFEX ;Holtzapple等,1991)和有机溶剂萃取(美国专利No. 4,409,032)。水解和发酵系统可以是分开的(顺次水解和发酵;SHF)或者同时发生的(同时糖化和发酵;SSF)。 在所有情况下,半纤维素和纤维素都被分解成可发酵的糖,同时将木质素分离并且可用作固体燃料或其他有机分子的来源。
经预处理的木质纤维素的酶促水解用纤维素酶进行。术语纤维素酶广义上指催化纤维素聚合物中连接单个葡萄糖单元之β-1,4-糖苷键的水解的一类糖苷水解酶(或糖苷酶)。催化机制涉及内切葡聚糖酶(酶学委员会编号Ε. C. 3. 2.1. 4)、纤维二糖水解酶 (E. C. 3. 2.1. 91)和β -葡糖苷酶(E. C. 3. 2.1. 21)的协同作用。内切葡聚糖酶水解纤维素链中部可及的糖苷键,而纤维二糖水解酶从这些链末端逐步释放纤维二糖。β -葡糖苷酶将纤维二糖水解为葡萄糖,并且从而使得纤维二糖水解酶的产物抑制最小化。所述酶共同作为可以水解纤维素底物的系统来运作。
纤维素酶和水解多糖或寡糖的其他糖苷水解酶或糖苷酶通常具有相似的组件结构,其由通过柔性接头肽连接起来的一个或更多个催化结构域和一个或更多个碳水化合物结合组件(CBM)组成。已知许多半纤维素酶(如木聚糖酶(E. C. 3. 2.1. 8)、甘露聚糖酶 (E. C. 3. 2.1. 78)和阿拉伯呋喃糖苷酶(E. C. 3. 2.1. 55))具有通过柔性接头连接催化结构域与CBM的相似组件结构。半纤维素酶是催化以下键的水解的酶半纤维素的木聚糖骨架多糖中的糖苷键,或木聚糖骨架中的木糖单元与骨架所连接的其他糖之间的糖苷键。
催化结构域是催化底物中糖苷键水解的独立结构域。已分离和表征了许多糖苷水解酶催化结构域。催化结构域通常(但不一定总是)是两个结构域中较大的一个。将具有相同的三维结构和催化机制(但不一定具有相同的底物特异性)的糖苷水解酶划分为家族(Davies和Henrissat, 1995)。迄今为止,已有超过150个糖苷水解酶(Glycoside Hydrolase,GH)家族。纤维素酶存在于许多GH家族中,包括但不限于第5、6、7、8、9、12、44、 45、48、51、61和74家族;在第5、8、10、11和43家族中有木聚糖酶;在第5、26和113家族中有甘露聚糖酶;在第3、43、51、54和62家族中有阿拉伯呋喃糖苷酶;在第I和3家族中有 β-葡糖苷酶。
此外,接头肽是伸长且具柔性的结构,其保持催化结构域相对于CBM的空间定向 (Shen等,1991 ;Receveur等,2002 ;Boisset等,1995)。不论是细菌还是真菌来源,纤维素酶和半纤维素酶中天然接头肽的长度为6至60个氨基酸不等。这些肽的化学性质和氨基酸组成相似(如果不是具体序列相似),其中在接头肽的氨基酸中,氨基酸丝氨酸、苏氨酸和脯氨酸所占比例大于50% (综述见Gilkes等,1991)。接头还包含几个常见类型的带电残基,它们都带负电(如Glu或Asp)或都带正电(如Lys、Arg或His)。丝氨酸和苏氨酸残基可被O-连接聚糖修饰,在真菌中所述O-连接聚糖主要为甘露糖(Fagerstam等,1984)。小角X射线或动态光散射的结果表明,接头肽的糖基化有利于较伸长的构象,其改变催化结构域和CBM的相对位置。
碳水化合物结合组件(CBM)通常(但不一定总是)小于催化结构域。CBM的作用是使酶与碳水化合物底物接近并且长时间接触,以及增加底物降解的速率。在参与碳水化合物底物降解的多种酶(包括纤维素酶、半纤维素酶、葡聚糖酶、淀粉酶、葡糖淀粉酶、壳多糖酶等)中发现了 CBM。因此,CBM能够识别并结合结晶纤维素、非结晶纤维素、壳多糖、β-1, 3-葡聚糖、混合的β -1,3-1,4葡聚糖、木聚糖、甘露聚糖、半乳聚糖和淀粉。
正如催化结构域那样,CBM采用多种结构来控制其底物结合亲和性,从而也可根据其结构与功能关系划分为家族。迄今为止已有59种已知的CBM家族(参见URL cazy. org/fam/acc CDM.html)。在过去的二十年中已进行了许多研究来阐明CBM的功能和结构 (Boraston 等,2004 ;Hashimoto 2006 和 Shoseyov 等,2006 综述)。·
本申请涉及第I家族CBM。这些CBM几乎仅发现于真菌酶中,其包括由以下生产的纤维素酶和半纤维素酶木霉属(Trichoderma ssp·)、曲霉属(Aspergillus ssp.) > 肉座菌属(Hypocrea ssp·)、腐质霉属(Humicola ssp·)、脉抱菌属(Neurospora ssp·)、 Orpinomyces ssp.、赤霉菌属(Gibberella ssp·)、裸胞壳属(Emericella ssp·)、毛壳属 (Chaetomium ssp·)、金抱属(Chrysosporium ssp·)、键刀菌属(Fusarium ssp·)、青霉菌属(Penicillium ssp. )、Magnaporthe ssp.、原毛平革菌属(Phanerochaete ssp·)、栓菌属(Trametes ssp.)、埃杜拉香 (Lentinula edodes)、Gleophyllum trabeiu>Ophiostoma piliferum、Corpinus cinereus、Geomyces pannorum、罗伦隐球酵母(Cryptococcus laurentii)、出芽短梗霉(Aureobasidium pullulans)、煤油霉菌(Amorphotheca resinae)、白冬抱酵母(Leucosporidium scotti)、雅致小克银汉霉(Cunninghamella elegans)、疏棉状嗜热丝抱菌(Thermomyces lanuginosa)、嗜热侧抱霉(Sporotrichum thermophile)和嗜热毁丝霉(Myceliophthora thermophilum)。
最初第I家族CBM被鉴定为真菌纤维素酶的纤维素结合结构域(或CBD)。第I 家族CBM包含约40个氨基酸并且可存在于酶的N端或C端。第I家族CBM具有小的楔形 β-夹心结构,具有包含以约10埃的距离间隔开的三个芳香族氨基酸(通常为色氨酸)的平坦结合表面(Kraulis等,1989 ;Mattinen等,1997)。这些芳香族残基有助于通过与底物表面的范德华接触来与结晶底物(如纤维素和壳多糖)的表面结合(Mattinen等,1997 ; Reinikainen 等,1992, Tormo 等,1996)。
经预处理的木质纤维素原料的酶促水解在纤维素乙醇生产中是低效步骤,并且其成本是商业可行性的主要障碍之一。广泛认为提高纤维素酶的酶活性或者增加纤维素酶生产效率可能显著地节约成本。
木质素对纤维素酶系统的负面影响已被大量记载。已证明从硬木(白杨)中移除木质素增加酶促水解的产糖率(Kong等,1992)。相似地,已证明从软木(花旗松)中移除木质素改善纤维素的酶促水解,该作用是由于酶对纤维素的可及性提高(Mooney等,1998)。 其他小组已证实从里氏木霉(Trichoderma reesei)纯化的纤维素酶与分离的木质素结合(Chernoglazov等,1988),并且已推测出酶-木质素相互作用中不同结合结构域的作用 (Palonen等,2004)。当将木质素加回到纯纤维素系统中时,观察到里氏木霉纤维素酶与木质素结合并且失活(Escoffier等,1991)。另一研究表明木质素对纤维素酶无任何显著影响(Meunier-Goddik和Penner, 1999)。而另外的报道提出,一些半纤维素酶可以抵抗木质素及木质素分解产物,甚至被其活化(Kaya等,2000)。尽管如此,通常公认木质素严重限制纤维素的酶促水解。
已证明从里氏木霉纯化的纤维素酶结合分离的木质 素(Chernoglazov等,1988)。 进一步的工作表明所有的三个结构域(催化核心、接头和CBM)都结合木质素(Palonen等, 2004)。例如,天然状态下仅有催化结构域而无CBM的来自于腐质霉属的Cel7B与木质素完全结合(Berlin等,2005)。相似地,没有CBM的木霉Cel5A核心不结合酶促产生的木质素而结合碱提取的木质素,其程度小于与全长蛋白质的结合(Palonen等,2004)。据报道,CBM 参与木质素结合。例如,从木霉Cel7A中去除CBM基本上消除了与碱提取的木质素和通过酶促水解制备的木质素剩余物的结合(Palonen等,2004)。
木质素抗性纤维素酶的缺乏是将纤维素转化为可溶性糖(包括葡萄糖)从而生产乙醇和其他产品进行工业化的巨大障碍。木质素抗性酶的开发必须保留其分解纤维素的活性。已提出多种方法以降低木质素对纤维素酶系统的负面影响。已证明非特异性结合蛋白质(如牛血清白蛋白;BSA)阻止纤维素酶与木质素表面的相互作用(Yang和Wyman, 2006,美国公开 No. 2004/0185542A1、美国公开 No. 2006/0088922A1、W005024037A2、A3, W009429474A1)。其他化学阻断剂和表面活性剂表现出相似的作用(Tu等,2007 ;美国专利 No. 7,354,743)。
经修饰的糖苷酶和修饰方法已有广泛描述。在大多数情况下,突变被特异性地针对酶的催化结构域。例如,已报道里氏木霉Cel7A和Cel6A催化结构域的变体具有提高的热稳定性(美国专利 No. 7,375,197、W02005/028636、美国公开 No. 2007/0173431、 公开 No. 2008/167214、TO2006/074005、公开 No. 2006/0205042、美国专利 No. 7,348,168、 W02008/025164)。特别地,在第6家族纤维素酶中用脯氨酸替换相当于里氏木霉CelA6第 413位的位置上的氨基酸(如,黄抱原毛平革菌(Phanerochaete chrysosporium)Cel6A中的S407P突变)使热稳定性增加(W0 2008/025164)。已证明相当于里氏木霉Cel6A和其他第6家族纤维素酶催化结构域内第103、136、186、365和410位的位置上的突变引起葡萄糖抑制降低(美国公开No. 2009/0186381A1)。针对纺织应用,已产生了抵抗蛋白酶和用于洗涤剂之表面活性剂的变体(W0 99/01544、WO 94/07998和美国专利No. 6,114,296)。
最近,已报道表现出与木质素相互作用减少或者由木质素引起的失活降低的经修饰纤维素酶。例如,W02010/012102报道了相当于里氏木霉Cel6A(TrCel6A)和其他第6家族纤维素酶催化结构域中129、322、363、365和410位的位置上的突变使木质素存在下的水解活性增加。相似地,W02009/149202公开了带有突变的纤维素酶变体,其在相当于红褐肉座菌(Hypocrea jecorina) Cel6A 接头肽和催化结构域的 63、77、129、147、153、161、194、 197、203、237、247、254、281、285、289、294、327、339、344、356、378 和 382 位的位置上移除正电荷或引入负电荷。这种纤维素酶变体表现出与乙醇或热处理的木质素亲和力降低。
仅在很少的情况下,接头肽被鉴定为发挥关键作用或作为修饰目标。对腐质霉的第45家族内切葡聚糖酶的接头肽进行修饰以降低蛋白质水解(W0 94/07998、美国专利No. 6,114,296),对木霉Cel7A的接头肽进行修饰以提高热稳定性(美国专利 No. 7,375,197)。美国公开No. 2010/0221778A1报道,降低接头肽的等电点和/或增加其 Ser/Thr比的突变也可增加木质素的存在下的水解活性。
对经修饰的CBM的报道相对较少。在一个例子中,Linder等(1995)证明里氏木霉Cel7A的第I家族CBM中结合表面上酪氨酸残基的突变显著降低其与纤维素的结合,而结合表面上其他高度保守但非芳香族的氨基酸的突变所导致的纤维素结合降低程度较小。 在另一个例子中,报道了将楔形结构“尖端”的酪氨酸(相当于TrCel6A-CBM中的Tyr33)替换为组氨酸引起与纤维素的PH依赖性结合(Linder等,1999)。然而,尽管已观察到第I家族CBM与木质素相互作用,但未有开发与木质素结合降低之经修饰的第I家族CBM的报道。
发明概述本发明涉及经修饰的碳水化合物结合组件。更具体地,本发明涉及表现出与木质素结合降低的经修饰的第I家族碳水化合物结合组件。本发明还涉及包含经修饰的第I家族碳水化合物结合组件的经修饰的糖苷酶、包含编码经修饰第I家族碳水化合物结合组件或经修饰糖苷酶的核苷酸序列的基因构建体,以及包含经修饰的第I家族碳水化合物结合组件的经修饰的糖苷酶在木质素的存在下水解纤维素或半纤维素底物的用途。
本发明提供了经修饰的第I家族碳水化合物结合组件,其与木质素的结合降低, 并且不仅能使包含经修饰第I家族碳水化合物结合组件的经修饰糖苷酶对木质素的结合降低,还能使所述酶在木质素的存在下的底物水解活性增加。这种经修饰的糖苷酶还可以更容易地从水解反应结束时存在的任何剩余木质素中回收并再利用。
本发明还涉及经修饰的第I家族碳水化合物结合组件,其在选自10、11、12、14、 17、21、24、29、31、33和37的一个或更多个位置上包含氨基酸替换。包含氨基酸替换的一个或更多个位置通过将第I家族碳水化合物结合组件的氨基酸序列与SEQ ID NO 30所示的里氏木霉Cel6A碳水化合物结合组件(TrCel6A-CBM)的氨基酸序列进行比对来确定。本发明的经修饰的第I家族碳水化合物结合组件包含与SEQ ID NO 30约50%至约99. 9%相同的氨基酸序列,并且能够与结晶纤维素结合。例如,本发明的经修饰的第I家族碳水化合物结合组件包含与SEQ ID NO :30约60%至约99. 9%相同、或与SEQ ID NO :30约75%至约 99. 9%相同的氨基酸序列。
在一个替代实施方案中,本发明的经修饰的第I家族碳水化合物结合组件包含将选自11、12、14、17、24、29和31的一个或更多个位置上的碱性或电中性氨基酸替换为酸性氨基酸,并且与SEQ ID NO :30有约50%至约99. 9%的同一性且具有与结晶纤维素结合的能力。例如,11、12、14、17、24、29和31中的一个或更多个位置上的氨基酸被替换为天冬氨酸。
此外,本发明的经修饰的第I家族碳水化合物结合组件包含选自10、21、33和37 的一个或更多个位置上的氨基酸替换,并且与SEQ ID NO :30有约50%至约99. 9%的同一性且具有与结晶纤维素结合的能力。例如,将第10位上氨基酸替换为丝氨酸,将第21位的氨基酸替换为芳香族氨基酸如酪氨酸,将第33位的氨基酸替换为天冬酰胺,将第37位的氨基酸替换为芳香族氨基酸如酪氨酸。
本发明还涉及包含由一个或更多个接头肽功能性连接的一个或更多个催化结构域和一个或更多个碳水化合物结合组件的经修饰的糖苷酶,所述一个或更多个碳水化合物结合组件中至少一个是以上限定的经修饰的第I家族碳水化合物结合组件。经修饰的糖苷酶相对于亲本糖苷酶表现出在木质素的存在下水解活性的增加和/或木质素结合的减少, 所述亲本糖苷酶包含经由相同的一个或更多个接头肽连接的衍生出所述经修饰的碳水化合物结合组件的亲本第I家族碳水化合物结合组件、相同的一个或更多个催化结构域和相同的一个或更多个碳水化合物结合组件。
本发明经修饰的糖苷酶中的一个或更多个催化结构域可以是纤维素酶催化结构域、半纤维素酶催化结构域、β -葡糖苷酶催化结构域和辅助成分催化结构域。本发明经修饰的糖苷酶中的一个或更多个催化结构域可以是野生型催化结构域或相对于野生型催化结构域包含氨基酸替换、插入或缺失的经修饰催化结构域。
本发明经修饰的糖苷酶中的一个或更多个催化结构域可以是第5、6、7、8、9、12、 44、45、48、51、61 和74家族糖苷水解酶的纤维素酶催化结构域。例如,纤维素酶催化结构域可包含里氏木霉Cel7A第1-436位氨基酸(SEQ ID NO :124)、里氏木霉Cel6A第83-447位氨基酸(SEQ IDNO :1)、特异腐质霉(Humicola insolens) Avi2 第 97-460 位氨基酸(SEQID NO 2)、黄孢原毛平革菌Cel6A第81-440位氨基酸(SEQ ID NO 3)。例如,纤维素酶催化结构域可以包含具有一个或更多个氨基酸替换的里氏木霉Cel6A第83-447位氨基酸(TrCel6A, SEQ ID NO 1),所述氨基酸替换选自 Y103H、Y103K、Y103R、Y103A、Y103V、Y103L、Y103P、 K129E、L136V、L1361、S186K、S186T、S186Y、Q204K、G2131D、A322D、Q363E、G365D、G365E、 G365Q、G365S、R410A、R410F、R410L、R410Q、R410S 和 S413P。
本发明经修饰的糖苷酶中的一个或更多个催化结构域还可以是第5、8、10、11、26、 43、51、54、62或113家族糖苷水解酶的半纤维素酶催化结构域,第I或3家族糖苷水解酶的 β_葡糖苷酶催化结构域,或者是辅助成分催化结构域如膨胀因子(swollenin)、CIP或扩展蛋白(expansin)催化结构域。例如,β -葡糖苷酶催化结构域可以是具有一个或更多个氨基酸替换的SEQ ID No :100的里氏木霉Cel3A,所述氨基酸替换选自V43X、V66X、S72X、 V101X、T235X、N248X、F260X、N369X、A386X 和 I543X。
本发明经修饰的糖苷酶中,除经修饰的第I家族碳水化合物结合组件外的一个或更多个碳水化合物结合组件可以是野生型碳水化合物结合组件,或者是相对于野生型催化结构域包含氨基酸替换、插入或缺失的经修饰碳水化合物结合组件。相似地,本发明经修饰的糖苷酶中的一个或更多个接头肽可以是野生型接头肽,或者是相对于野生型接头肽包含氨基酸替换、插入或缺失的经修饰接头肽。例如,一个或更多个接头肽可以是约6至约60个氨基酸长的经修饰接头肽,其中至少50%的氨基酸为脯氨酸、丝氨酸或苏氨酸,而且所述接头肽包含一个或更多个氨基酸替换、插入或缺失,以使得与衍生出经修饰接头肽的亲本接头肽相比,其计算等电点减小和/或酪氨酸丝氨酸比例增加。这种经修饰接头肽使得经修饰的糖苷酶与包含亲本接头肽的亲本糖苷酶相比,在木质素的存在下水解活性增加和 /或木质素结合降低。
经修饰的第I家族碳水化合物结合组件、催化结构域、其他碳水化合物结合组件或接头肽中的任一个或全部都可以来源于一种或更多种真菌糖苷酶,产生所述真菌糖苷酶的生物包括但不限于木霉属、曲霉属、肉座菌属、腐质霉属、脉孢菌属、Orpinomyces ssp.、 赤霉菌属、裸胞壳属、毛壳属、金孢属、镰刀菌属、青霉菌属、Magnaporthe ssp.、原毛平革菌属、栓菌属、埃杜·拉香 、Gleophyllum trabeiu、Ophiostoma piliferum、Corpinus cinereus、Geomyces pannorum、罗伦隐球酵母、出芽短梗霉、煤油霉菌、白冬孢酵母、雅致小克银汉霉、疏棉状嗜热丝孢菌、嗜热毁丝霉和嗜热侧孢霉。
本发明还涉及包含编码上述经修饰第I家族碳水化合物结合组件或经修饰糖苷酶的核苷酸序列的基因构建体,并且涉及包含用于表达和分泌第I家族碳水化合物结合组件或经修饰糖苷酶的基因构建体的遗传修饰微生物。所述遗传修饰微生物可以是细菌、 酵母菌或丝状真菌,如链霉菌属(Streptomyces)、酵母属(Saccharomyces)、毕赤酵母属 (Pichia)、汉逊酵母属(Hansenula)、肉座菌属(Hypocrea)、木霉属(Trichoderma)、曲霉属 (Aspergillus)、键刀菌属(Fusarium)、脉抱菌属(Neurospora)、金抱霉属(Chrysoporium) 或毁丝霉属(Myceliophthora)。
本发明还涉及生产上述经修饰的第I家族碳水化合物结合组件或经修饰的糖苷酶的方法,其包括以下步骤在诱导经修饰的第I家族碳水化合物结合组件或经修饰的糖苷酶表达和分泌的条件下,对包含编码经修饰第I家族碳水化合物结合组件或经修饰糖苷酶的基因构建体的遗传修饰微生物进行培养,以及从培养基中回收经修饰的第I家族碳水化合物结合组件或经修饰的糖苷酶。生产上述经修饰的第I家族碳水化合物结合组件或经修饰的糖苷酶的方法可包括用编码经修饰纤维素酶的基因构建体转化宿主细胞的步骤。
本发明还涉及将纤维素或半纤维素底物水解成糖的方法,其包括使底物与上述经修饰的糖苷酶接触。在该方法的一个实施方案中,纤维素或半纤维素底物可以是预处理过的木质纤维素底物。在该方法的另一个实施方案中,经修饰的糖苷酶与亲本糖苷酶相比表现出从该方法所得回收率的改善,所述亲本糖苷酶包含相同的一个或更多个催化结构域、 一个或更多个接头肽和一个或更多个碳水化合物结合组件,其中一个或更多个碳水化合物结合组件中的至少一个是衍生出经修饰糖苷酶中的经修饰第I家族碳水化合物结合组件的亲本第I家族碳水化合物结合组件。
将纤维素或半纤维素底物水解成糖的方法可以以连续、半连续或分批补料方法进行。此外,将纤维素或半纤维素底物水解成糖的方法后可进行糖到醇或糖醇的微生物发酵。


图1是从里氏木霉中纯化的纤维素酶成分的SDS-PAGE和Western印迹分析。图 A示出SDS-PAGE后经纯化的Cel7A、Cel6A、Cel7B和Cel5A的考马斯亮蓝染色。平行分析木霉纤维素酶混合物以进行比较。图B示出在SDS-PAGE分离和电转移到PVDF膜之后,这些样品的成分特异性Western印迹(在每个印迹图的左下角或右下角标明)。
图2示出木质素对含有和不含有CBM的里氏木霉Cel7A(Cel7A和Cel7A核心 (Cel7Acore))的作用。图A示出50°C在木质素的存在下里氏木霉Cel7A蛋白质和Cel7A活性的损失,图B示出50°C在木质素的存在下,Cel7Acore蛋白质和Cel7Acore活性的损失。 将Cel7A和木瓜蛋白酶处理过的Cel7A(Cel7AC0re)与酸提取的木质素一起孵育长达96小时。在整个实验中的不同时间点取样测量上清液(不含木质素)中的Cel7A和Cel7ACore 蛋白质浓度。还在木质素浆液中测量了剩余Cel7A和Cel7ACore对预处理过的小麦秸杆随时间的活性。
图3示出将里氏木霉Cel7A的CBM添加到里氏木霉Cel3A中增加Cel3A的木质素结合和与木质素相关的失活。50°C下,将Cel3A(图A)和Cel3A_CBM(图B)与酸提取的木质素一起孵育长达96小时。在整个实验中的不同时间点取样测量各自上清液(不含木质素)中这些蛋白质的浓度。还在它们各自的木质素浆液中测量其随时间的剩余活性。
图4示出木质素对含有和不含有CBM的里氏木霉Cel6A(Cel6A和Cel6Acore)的作用。图A示出30°C在木质素的存在下,Cel6A蛋白质和Cel6A活性的损失,图B示出30°C在木质素的存在下 Cel6ACore蛋白质和Cel6ACore活性的损失。30°C下,将Cel6A(图A)和用木瓜蛋白酶处理产生的Cel6ACore(图B)与酸提取的木质素一起孵育长达96小时。随时间测量各自的上清液中这些蛋白质的浓度以及它们对预处理过的小麦秸杆的剩余活性。
图5绘出分别指导从重组酿酒酵母(Saccharomyces cerevisiae)中表达和分泌天然和经修饰 HiAvi2 和 PcCel6A 的质粒载体 YEp352/PGK91_l_ a ss_NKE_HiAvi2 (图 A)和 YEp352/PGK91-l-a ss-NKE-PcCel6A-S407P(图 B)。
图6绘出指导从重组酿酒酵母中表达和分泌亲本和经修饰的TrCel6A的质粒载体 YEp352/PGK91-l ANhel-a ss-TrCel6A-S413P。
图7包括两个散点图。图A是实施例1Ob中描述的高通量测定中,经BSA处理的木质素的存在下的酶活性(+BSA活性)相对于未处理木质素的存在下的酶活性(-BSAS 性)的散点图。数据涉及对以下滤液的筛选包含亲本和经修饰HiAvi2纤维素酶的微孔板培养物(实施例9)的滤液,或空载体转化体的滤液。图B是实施例1Oc中描述的高通量测定中,经BSA处理的木质素的存在下的酶活性(+BSA)相对于未处理木质素的存在下的酶活性(-BSA活性)的散点图。数据涉及对以下滤液的筛选包含亲本(PcCel6A-S407P)和经修饰PcCel6A纤维素酶的微孔板培养物(实施例9)的滤液,或空载体转化体的滤液。
图8示出实施例1Oa中描述的高通量测定中,经BSA处理的木质素的存在下的酶活性(+BSA活性)相对于未处理的木质素的存在下的酶活性(-BSA活性)的散点图。数据涉及对以下滤液的筛选包含亲本(TrCel6A-S413P)和经修饰TrCel6A纤维素酶的微孔板培养物(实施例9)的滤液,或者空载体转化体的滤液。
图9绘出指导从重组里氏木霉表达和分泌天然和经修饰TrCel7A糖苷酶的载体 pTrCe17A-pyr4-TV。
图10绘出来自TrCel6A、HiAvi2和PcCel6A_S407P易错PCR文库的两类经修饰糖苷酶(即木质素抗性“命中(hits)”和非选择性但具活性的糖苷酶)中CBM结构域内氨基酸替换的分布。将氨基酸改变分为引入正电荷的那些变化(即将中性氨基酸转化为碱性氨基酸,如His、Lys或Arg)或引入负电荷的那些变化(即将中性氨基酸转化为Glu或Asp)。
图11证明通过移除或封闭原位木质素,从预处理过的木质纤维素中回收的野生型TrCel7A糖苷酶增加。将具有增加水平的TrCel3A β -葡糖苷酶的里氏木霉纤维素酶混合物与预处理过的小麦秸杆(WS)、经次氯酸盐漂白预处理的小麦秸杆(bWS)和用牛血清白蛋白预孵育以封闭木质素的预处理过的小麦秸杆(BSA-WS) —起孵育。在整个水解时程中收集样品上清液并且测定葡萄糖和TrCe17A的浓度。在转化率为O. 98时,与WS对照相比, 涉及bWS和BSA-WS的反应中上清液中存在更多的TrCel7A。
图12示出TrCel7A(PCB entry laz6)中第I家族CBM的结构,以及根据 TrCe17A(PDB entry laz6)中第 I 家族 CBM 的结构计算的 TrCe16A, HiAvi2 和 PcCel6A 中 CBM的结构。β-折叠结构显示为带。相当于在TrCel7A CBM中观察到的参与纤维素结合之氨基酸的氨基酸用灰色棍结构绘出,而与木质素相互作用的那些氨基酸用黑色球棍结构示出。与木质素和纤维素相互作用的残基也用黑色球棍结构示出。
图 13 不出从 ProSite URL expasy. ch/cg1-bin/aligner psa = PS00562&color-l&maxinsert = 10&linelen = O 中获得的 34 种第 I 家族 CBM 的 Clustal W比对。
图14示出图13中CBM序列对之间的氨基酸序列同一性。
图15示出TrCel6A、HiAvi2、PcCel6A和TrCe17A中第I家族CBM的比对。使用实施例4的方法发现的在木质素结合降低的经修饰第I家族CBM中被替换的氨基酸用粗体表/Jn ο
图16示出如实施例4中所述,在与木质素一起孵育24小时之后,亲本(WT)和经修饰PcCel6A糖苷酶的相对剩余活性。
图17示出如实施例4中所述测定的亲本(WT)和经修饰TrCel6A糖苷酶的相对木质素解离常数(K1)。
图18示出如实施例4中所述测定的亲本(WT)和经修饰TrCel7A糖苷酶的相对木质素解离常数(K1)。
发明详述
本发明涉及经修饰的碳水化合物结合组件。更具体地,本发明涉及表现出与木质素结合降低的经修饰的第I家族碳水化合物结合组件。本发明还涉及包含经修饰的第I家族碳水化合物结合组件的经修饰的糖苷酶、包含编码经修饰第I家族碳水化合物结合组件或经修饰糖苷酶的核苷酸序列的基因构建体、以及包含经修饰的第I家族碳水化合物结合组件的经修饰的糖苷酶在木质素的存在下水解纤维素或半纤维素底物的用途。
本发明提供了经修饰的第I家族碳水化合物结合组件,其与木质素的结合降低, 并且不仅能使包含经修饰第I家族碳水化合物结合组件的经修饰糖苷酶对木质素的结合降低,还能使所述酶在木质素的存在下的底物水解活性增加。
以下描述是只是通过举例的方式描述本发明的一个优选实施方案,而不限制实施本发明所必需的特征的组合。提供的标题并非意在限制本发明的多个实施方案。术语如 “包含”、“包括”、“含有”并非意于限制。此外,除非另有说明,不使用数量词时包括复数的情况,并且“或”是指“和/或”。除非本文中另有限定,本文中所使用的所有技术和科学术语的含义与本领域普通技术人员通常理解的相同。
第I家族碳水化合物结合组件
碳水化合物结合组件或CBM是糖苷水解酶和识别并结合多糖的其他蛋白质的非催化结构域。CBM常常发现于含有降解不可溶多糖的糖苷水解酶的真菌和细菌蛋白中。但是,在不包含糖苷水解酶结构域但是参与不可溶多糖(如纤维素)降解的蛋白质中也鉴定到CBM0这些包括但不限于Cipl (Foreman等,2003)和膨胀因子(Saloheimo等,2002)。根据氨基酸序列相似性将CBM划分成家族;目前有59个CBM家族(http://www. cazy. org/ Carbohydrate-Binding-Modules. html)。在这些CBM中,已证明不同成员识别结晶纤维素、 非结晶纤维素、壳多糖、β_葡聚糖、木聚糖、甘露聚糖、半乳聚糖和淀粉。有时将与纤维素结合的CBM称为术语“纤维素结合结构域”或“CBD”。第I家族CBM对于结晶纤维素具有高结合亲和力,而其他家族的CBM对于非晶纤维素或单链多糖具有高结合亲和力(Boraston等, 1004)。
正如Shoseyov等(2006)归纳的,已研究了 CBM的碳水化合物结合活性以用于许多应用。例如,已证明分离的CBM在纤维素纤维的非水解性破坏和纤维性质的改变中发挥作用。此外,CBM已用于生物技术应用中,其作为亲和标签用于重组的融合蛋白的生物特异性亲和纯化,或用于使通常不包含CBM的酶靶向天然纤维(例如使氧化酶靶向织物表面)。 CBM还用作表征纤维表面或检测植物细胞壁中的多糖的分析工具。已开发CBM 二聚体作为新的纤维素交联蛋白,已证实其有效增强纸的机械性质或改变其表面性质。最后,当在转基因植物中表达时,已证明CBM增加纤维素生物合成和/或生长的速率。
在真菌中,CBM是同源的并且是第I家族CBM(CBMl)的成员。里氏木霉纤维素酶、 半纤维素酶和相关蛋白质中的CBM序列见表I。四个半胱氨酸是高度保守的并且形成两个二硫键。三个芳香族氨基酸(色氨酸、酪氨酸或苯丙氨酸)也是保守的,它们形成平面并且经由范德华相互作用与纤维素聚合物的葡萄糖单元直接相互作用。第I家族CBM对结晶纤维素有高结合亲和力。
第I家族CBM在本文中被定义为根据CAZy系统(参见http://www. cazy. org/ Carbohydrate-Binding-Modules. html作为参考)划分为第I家族CBM的任何蛋白质序列。 第I家族CBM可与SEQ ID NO :30所示里氏木霉Cel6A (也称作纤维二糖水解酶II或CBH 2) CBM的氨基酸序列有约50%的氨基酸序列同一性。例如,第I家族CBM可与SEQ ID NO 30 所提供的里氏木霉TrCel6A有约50%、60%、70%、80%、90%或95%的氨基酸同一性。本领域技术人员公认给定CBM的氨基酸序列可通过添加、缺失或替换一个或更多个氨基酸进行修饰并且仍被认为是CBM。
当CBM位于分泌的糖苷酶的N端时,本领域技术人员公认当给CBM的氨基酸编号时,不考虑构成分泌信号肽的氨基酸。本文中,第I家族CBM中氨基酸的编号从相当于 TrCel6A(SEQ ID NO 1)中第一个谷氨酰胺(Q)的位置上开始。
表1:里氏木霉蛋白质中第I家族CBM的序列
酶CBM 序列(缺失SEQ ID No ) kE氏木霉Cel 6Λ CBM (a a 3-39) 的同一性%CBHl (Tr€el7A)PTQSHYGQCGGIGYSGPTVCASGTTCQVLNPY YSQCL (SEQ ID NO: 27)63.9CBH2 (TrCeMA)QACSSVWGQCGGQNWSGPTCCASGSTCVYSN DYYSQCL(SEQ ID N0:30)100.0EGl (TrCel7B)CTQTHWGQCGGIGYSGCKTCTSGTTCQYSND YYSQCL(SEQIDNOrll)63.9E02 (TrCelSA)AQQTVWGQCGGIGWSGPTNCAPGSACSTLNP YYAQCI(SEQ ID NO:12)61.1HG4 (TrCel61A)PTQTLYGQCGGSGYSGPTRCAPPATCSTLNPY YAQCL(SEQ ID NO: 14)52.8EG5 (TrCeMSA)GQQTLYGQCGGAGWTGPrrCQAPGTCKVQN QWYSQCL(SEQ ID NO: 15)50.0TrCeI74AGHYAQCGGIGWTGPTQCVAPYVCQKQNDYY YQ (SEQ ID NO: 40)56 0CiplHYGQCGGIGYSGPTVCASGTTCQVLNPYYSQC L(SEQIDNO:42)61 ICip2WGQCGG1GWSGPTTCVGGAYCVSYNPYY (SEQ ID NO: 43)64.0膨胀因子ALFGQCGGIGWSGTTCCVAGAQCSFVNDWYS QCL (SEQ ID NO44)58.3ManDALYGQCGGSGYTGPTCCAQGTCIYSNTWTSQCL (SEQ ID No: 41)65.0AxelPTQTHWGOCGGQGW^rGPTQCESGTTCQVISQ WYSQCL (SEO ID NO: 7)70.0
如图13所示,第I家族纤维结合域中的一级氨基酸序列高度保守。目前已知的 34种真菌来源第I家族CBM氨基酸序 列的多重比对表明,大多数天然第I家族CBM与包含 TrCe16A第I家族CBM的3_39位氨基酸有约45%至约100%的氨基酸序列同一性,并且与至少一个其他第I家族CBM有约40%至约95%的氨基酸序列同一性(图14)。
使用人工比对或本领域技术人员已知的任何序列比对算法,可以容易地通过比对两种序列的氨基酸来确定序列同一性。图13和14中分别示出的比对和同一性计算使用在BioEdit软件版本7. O. 9.0(2007年6月27日)中提供的具有缺省设置的ClustalW 多重比对工具来确定。本领域技术人员已知的其他比对算法包括但不限于BLAST算法 (BLAST 和 BLAST 2. O ;Altschul 等,1997 和 1990)、Smith&ffaterman(1981)公开的算法、 Needleman&ffunsch (1970)的同源比对算法、Pearson&Lipman (1988)的\搜索相似性方法、 计算机执行的这些算法(在 Wisconsin Genetics Software Package, Genetics ComputerGroup, 575Science Dr.,Madison, ffis.中的 GAP、BESTFIT、FASTA 和 TFASTA),或者人工比对和目测。
“经修饰的第I家族碳水化合物结合组件”或“经修饰的第I家族CBM”意指结合结晶纤维素并且在选自10、11、12、14、17、21、24、29、31、33和37的一个或更多个位置上包含氨基酸替换的第I家族CBM,所述位置通过将第I家族碳水化合物结合组件的氨基酸序列与SEQ ID NO 30中所示里氏木霉Cel6A碳水化合物结合组件的氨基酸序列进行比对来确定。本文中所用的经修饰的第I家族CBM不包括天然CBM。
正如本领域技术人员已知的,蛋白质(如CBM)与其配体或底物(如纤维素)的结合可以通过建立结合等温线进行定量。在这些实验中,添加到包含恒量底物或配体的溶液或悬液中的蛋白质的吸收率会随着所添加蛋白质量的增加而增加,直至底物被蛋白质饱和为止。在 Linder 等(1995 和 1999)、Mattinen 等(1997)和 Reinikainen 等(1992)中描述了使用结合等温线来评价和定量第I家族CBM与纤维素结合的方法。可以使用Nidetzky 等(1994)的方法或者使用实施例4和14中提供的方法评价和定量包含亲本或经修饰的第 I家族CBM的糖苷酶与纤维素底物的结合。
例如,经修饰的第I家族CBM可以在选自11、12、14、17、24、29和31的一个或更多个位置上包含将碱性或电中性氨基酸替换为酸性氨基酸的替换。本文中所限定的“碱性氨基酸”是指组氨酸、赖氨酸或精氨酸中的任何一种,“酸性氨基酸”是指天冬氨酸或谷氨酸中的任何一种,“电中性氨基酸”是指不是碱性或酸性氨基酸的任何一种氨基酸。
经修饰的第I家族CBM还在选自10、21、33和37的一个或更多个位置上包含氨基酸替换。例如,将第10位的氨基酸替换为丝氨酸,将第21位的氨基酸替换为芳香族氨基酸如酪氨酸,将第33位的氨基酸替换为天冬酰胺,将第37位的氨基酸替换为芳香族氨基酸如酪氨酸。
经修饰的第I家族碳水化合物结合组件的氨基酸序列与SEQ ID NO 30有约50% 至约99. 9%或其间任何量的氨基酸序列同一性。例如,经修饰的第I家族CBM的氨基酸序列可以与 SEQ ID NO :30 有约 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或 9 9. 9%的氨基酸序列同一性。“野生型”或“天然”第I家族CBM是指在自然界发现的没有任何氨基酸替换、插入或缺失的第I家族CBM。
应理解的是,经修饰的第I家族CBM可来源于野生型第I家族CBM或已包含另外的氨基酸替换的第I家族CBM。
本发明的经修饰的第I家族CBM由核酸序列编码,该核酸序列可以使用遗传物质或期望的经修饰第I家族CBM或相应亲本第I家族CBM特有的核酸或氨基酸序列信息生成。正如本领域技术人员所已知的,使用改变氨基酸序列的一种或更多种分子生物学技术, 这种遗传物质或序列信息可以用于生成编码期望的经修饰第I家族CBM的核酸序列,所述分子生物学技术包括但不限于定点诱变、盒式诱变、随机诱变、合成寡核苷酸构建体、克隆、 亚克隆、PCR扩增、体外合成和本领域技术人员已知的其他基因工程技术。应理解的是,经修饰第I家族可来源于任何亲本第I家族CBM,即其可来源于天然或“野生型”第I家族CBM 或已包含另外的氨基酸替换的第I家族CBM。
例如,经修饰的第I家族CBM可表现出与木质素结合的降低。在另一个实施方案中,经修饰的第I家族碳水化合物结合组件可以使糖苷酶与木质素的结合降低或者木质素存在下的底物水解活性增加,所述糖苷酶包含由一个或更多个接头肽连接的经修饰的第 I家族碳水化合物结合组件、一个或更多个催化结构域和一个或更多个碳水化合物结合组件。
为了本发明的目的,“亲本第I家族CBM”或“亲本第I家族碳水化合物结合组件” 是不包含经修饰第I家族CBM中的氨基酸替换的第I家族CBM。因此,亲本第I家族CBM可以是在另外的位置包含通过基因工程或其他技术引入的氨基酸替换且能够与纤维素结合的第I家族CBM。亲本第I家族CBM还可以是野生型第I家族CBM。或者,在生产经修饰的第I家族CBM之后,随后经修饰的第I家族CBM可进一步被修饰为包含另外的氨基酸替换。
经修饰的糖苷酶
本文所用的糖苷酶包含一个或更多个催化结构域和一个或更多个碳水化合物结合组件(CBM),它们由定位在结构域之间的一个或更多个接头肽连接。一个或更多个催化结构域、一个或更多个CBM和一个或更多个接头肽彼此可以是同源的(即属于自然界中分离的同一种糖苷酶),或者与至少一个其他结构域是异源的(即从相同或不同生物来源的两种或更多种不同的天然糖苷酶中分离)。一个或更多个催化结构域、一个或更多个CBM和一个或更多个接头肽的氨基酸序列可以是“天然的”或“野生型”(即与自然界中产生的未经修饰的糖苷酶中所发现的一样),或者它们可以通过修饰其氨基酸序列“来源”于的天然或野生型糖苷酶。术语“糖苷酶”可以与术语“糖苷水解酶”互换使用。
糖苷酶可包含另外的功能结构域(如黏结蛋白、对接素(dockeri n)或纤连蛋白样 (Fn3)结构域)并且仍然被认为是糖苷酶。
可从其分离或衍生一个或更多个催化结构域、一个或更多个CBM和一个或更多个接头肽的糖苷酶的实例包括来自于多种微生物的糖苷酶,所述微生物如木霉属、曲霉属、肉座菌属、腐质霉属、脉孢菌属、Orpinomyces ssp.、赤霉菌属、裸胞壳属、毛壳属、金孢属、镰刀菌属、青霉菌属、Magnaporthe ssp.、原毛平革菌属、栓菌属、埃杜拉香燕、Gleophyllum trabeiu>Ophiostoma piliferum、Corpinus cinereus>Geomyces pannorum、罗伦隐球酵母、 出芽短梗霉、煤油霉菌、白冬孢酵母、雅致小克银汉霉、疏棉状嗜热丝孢菌、嗜热侧孢霉或嗜热毁丝霉。本发明的实施不限于可从其得到一个或更多个催化结构域、一个或更多个CBM 和一个或更多个接头肽的糖苷酶。
本文所用的“经修饰的糖苷酶”是包含一个或更多个催化结构域、一个或更多个 CBM和一个或更多个接头肽的糖苷酶,其中一个或更多个CBM中的至少一个是在选自10、 11、12、14、17、21、24、29、31、33和37的一个或更多个位置上包含氨基酸替换的经修饰的第 I家族CBM并且表现为结合结晶纤维素且与SEQ ID NO :30有约50%至约99. 9%同一性。 一个或更多个催化结构域可以是野生型或经修饰的催化结构域,一个或更多个接头肽可以是野生型或经修饰的接头肽。本文所用术语“经修饰的糖苷酶”不包括天然糖苷酶。
本文所用“亲本糖苷酶”是除至少一个或更多个CBM是衍生出经修饰糖苷酶中的经修饰第I家族CBM的亲本第I家族CBM之外,包含与经修饰的糖苷酶相同的一个或更多个催化结构域、一个或更多个CBM和一个或更多个接头肽的糖苷酶。此外,除亲本糖苷酶中的亲本第I家族CBM在选自10、11、12、14、17、21、24、29、31、33和37的一个或更多个位置上不包含氨基酸替换之外,其与经修饰的糖苷酶中的经修饰的第I家族CBM相同。本领域技术人员公认的是,相对于天然催化结构域、CBM或接头肽,一个或更多个催化结构域、一个或更多个CBM、亲本第I家族CBM和一个或更多个接头肽可以包含氨基酸替换、插入或缺失, 前提是这些氨基酸替换也存在于经修饰的糖苷酶中。
在本发明的经修饰的糖苷酶中,一个或更多个催化结构域可以是纤维素酶催化结构域、半纤维素酶催化结构域、β -葡糖苷酶催化结构域或辅助蛋白催化结构域。
“纤维素酶催化结构域”被定义为能够切割纤维素聚合物中的β -1,4_糖苷键的任何结构域。纤维素酶催化结构域可以是内切葡聚糖酶(EC3. 2.1. 4),其切割纤维素聚合物中的内部β_1,4-糖苷键以降低聚合物的聚合度和/或释放寡糖。纤维素酶催化结构域还可以是外切葡聚糖酶或纤维二糖水解酶(EC 3. 2.1. 91),其从纤维素聚合物的末端释放小的寡糖,主要是纤维二糖。纤维素聚合物可以是天然纤维素,如由植物或藻类或其他生物产生的纤维素,并且可以是纯的或者是植物生物质中的几种成分之一,其也包含木质素和半纤维素。纤维素聚合物还可以是纤维素衍生物,如羧甲基纤维素或羟乙基纤维素。纤维素酶催化结构域可以是第5、6、7、8、9、12、44、45、48、51、61和74家族GH的成员。例如,纤维素酶催化结构域可包含里氏木霉Cel7A第1-436位氨基酸(SEQ ID NO :124)、里氏木霉Cel6A的 83-447位氨基酸(SEQ ID NO :1)、特异腐质霉Avi2的97-460位氨基酸(SEQ ID N0:2),或黄孢原毛平革菌Cel6A的81-440位氨基酸(SEQ ID NO :3)。例如,纤维素酶催化结构域可包含用一个或更多个氨基酸替换的里氏木霉Cel6A的83-447位氨基酸(SEQ ID NO :1),其中一个或更多个氨基酸替换选自 Y103H、Y103K、Y103R、Y103A、Y103V、Y103L、Y103P、K129E L136V、L1361、S186K、S186T、S186Y、Q204K、G231D、A322D、Q363E、G365D、G365E、G365Q、 G3 65S、R410A、R410F、R410L、R410Q 和 R410S。
“半纤维素酶催化结构域”被定义为能够切割半纤维素聚合物中的β -1,4_糖苷键的任何结构域。例如,半纤维素酶催化结构域可以是木聚糖酶(E. C. 3. 2.1. 8)、β-甘露聚糖酶(E. C. 3. 2.1. 78)或阿拉伯呋喃糖苷酶(E. C. 3. 2.1. 55)。或者,半纤维素酶催化结构域可以是第5、8、10、11、26、43、51、54、62或113家族糖苷水解酶的成员。
“ β -葡糖苷酶”催化结构域被定义为能够从小的β -1,4-连接寡糖(如纤维二糖) 产生葡萄糖的任何结构域。β -葡糖苷酶(E. C. 3. 2.1. 21)可以是第I或3家族糖苷水解酶的成员。例如,3-葡糖苷酶催化结构域可以是具有选自¥43乂、¥66乂、572乂、¥10以、了235父、 Ν248Χ、F260X、Ν369Χ、Α386Χ和Ι543Χ的一个或更多个氨基酸替换的里氏木霉Cel3A(SEQ ID NO :100),它使得TrCel3A β -葡糖苷酶的稳定性和/或催化效率提高(美国公开 No. 2010/0093040Α1 和美国公开 No. 2010/0304438Α1)。
最后,“辅助蛋白催化结构域”包括与纤维素相互作用以利于纤维素水解的蛋白质,其包括但不限于Cipl、Cip2、膨胀因子和扩展蛋白。辅助蛋白催化结构域还包含有助于水解木质纤维素的其他蛋白质,如乙酰木聚糖酯酶(E. C. 3.1.1. 72)、阿魏酸酯酶 (E. C. 3.1.1. 73)和纤维二糖脱氢酶(E. C.1.1. 99. 18)。
本领域技术人员公认的是,给定催化结构域的氨基酸序列可以通过插入、缺失或替换一个或更多个氨基酸进行修饰并且仍然被认为是纤维素酶催化结构域。
CBM和催化结构域常常通过接头肽分隔开。术语“接头肽”应理解为位于两个功能结构域之间并且包含约6至约60个氨基酸的氨基酸段。可以使用如Bae等(2008)和 Suyama等(2003)描述的模型从氨基酸序列信息中鉴定接头肽。Gilkes等(1991)介绍了该定义中涵盖的多种纤维素酶以及其他细菌和真菌蛋白质的接头序列。相对于非接头序列,接头肽通常是碱性肽,特别是富含丝氨酸、苏氨酸和脯氨酸。如Gilkes等(1991)的表I中所示,在细菌和真菌糖苷水解酶(木聚糖酶、内切葡聚糖酶、外切葡聚糖酶)的全部接头肽序列中,脯氨酸、丝氨酸和苏氨酸占氨基酸的50%以上。为了本文中限定的目的,接头肽可被定义为天然的、发现于催化结构域与CBM、两个催化结构域、两个CBM之间或另一个功能域与催化结构域或CBM之间的约6至约60个氨基酸的段,其中至少50%为脯氨酸、丝氨酸或苏氨酸。在接头肽中,脯氨酸、丝氨酸和苏氨酸可以占氨基酸的501601701801 90%或100% ((脯氨酸+苏氨酸+丝氨酸数)/接头中的氨基酸数X 100%)。本领域技术人员公认的是,给定接头的氨基酸序列可以通过插入、缺失或替换一个或更多个氨基酸进行修饰并且仍然被认为是接头肽。
除以上定义的经修饰的第I家族CBM之外,经修饰的糖苷酶可包含另外的CBM。这些另外的CBM可来源于使用CAZy系统(参见http://www. cazy. org/ Carbohydrate-Binding-Modules. html)确定的 59 个 CBM 家族中的任一个。
最后,经修饰的糖苷酶可包含其他结构域,包括但不限于纤连蛋白样(Fn3)结构域、黏结蛋白、对接素或其他碳水化合物(例如淀粉酶、葡糖淀粉酶、壳多糖酶等)活性结构域。
测量木质素结合
上述亲本或经修饰的第I家族CBM或者亲本和经修饰的糖苷酶与木质素的结合程度可以通过下述过程测定将CBM或糖苷酶与纯化的木质素一起预孵育一段时间,然后使用本领域技术人员已知的测定方法测量溶液和/或木质素-蛋白质浆液中的剩余蛋白质浓度和/或酶活性。图16中示出包含第6家族纤维素酶催化结构域和亲本或经修饰第I家族CBM的亲本和经修饰糖苷酶在与木质素一起孵育24小时之后的相对剩余活性。
如果纯化的木质素不可溶,那么通过离心或过滤可以很容易地将蛋白质-木质素复合物从包含未结合蛋白质的溶液主体中分离出来。可以通过酸提取、碱提取、有机溶剂提取或用水解酶酶促消化木质纤维素来从木质纤维素原料(下面描述的)中纯化木质素。对亲本和经修饰的第I家族CBM或·糖苷酶的相对结合的测定不依赖于木质素纯化方法、木质素来源或用于检测溶液中蛋白质的测定方法。实施例4中提供了测量亲本和经修饰第I家族CBM,以及亲本和经修饰糖苷酶的相对结合的方法。
亲本和经修饰的第I家族CBM或亲本和经修饰的糖苷酶与木质素的相对结合可以这样测定如实施例4中所述,计算经修饰的第I家族CBM或糖苷酶的木质素解离常数 Og,然后除以对亲本CBM或糖苷酶计算的木质素解离常数Og。图17和18中示出包含第6或7家族纤维素酶催化结构域的经修饰糖苷酶的相对&值。
经修饰的糖苷酶因木质素而失活的减少可以这样测定在存在和不存在木质素的情况下,测量底物(如偶氮键葡聚糖或纤维素)的降解,然后得到木质素存在时的活性与木质素不存在时的活性之比。这种水解反应中存在的木质素可以是不溶底物的一部分(如预处理过的木质纤维素中),或者是以可溶或不可溶形式分离。如果木质素被分离或纯化,那么木质素对经修饰或亲本糖苷酶的失活通过测量等价水解反应的活性来测定,其中反应之一包含足够量的木质素以降低糖苷酶活性。或者,通过包被非特异性蛋白质(如牛血清白蛋白(BSA))、表面活性剂或其他化学品将分离的木质素处理灭活能力降低,它们可以以与未处理木质素相同的量加入到对照反应中。如果木质素是不可溶底物的一部分,那么木质素对经修饰或亲本糖苷酶的失活这样测定得到对漂白底物(从其中移除木质素,例如,通过氧化剂如二氧化氯)的糖苷酶活性与对包含木质素之未漂白底物的糖苷酶活性的比例。 与亲本糖苷酶相比,经修饰的糖苷酶因木质素而失活的降低表现出更高的活性比(未处理的分离的木质素无木质素或处理的木质素)。实施例10中提供了在存在木质素酶的情况下,分别包含亲本和经修饰第I家族CBM的亲本和经修饰糖苷酶的相对活性的测量方法。
有几种本领域技术人员已知的测量经修饰和亲本糖苷酶的底物水解活性的测定法。例如,纤维素或半纤维素的水解可以通过测量还原糖的酶依赖性释放来监测,还原糖在随后进行的本领域技术人员已知的化学或化学酶促测定(如二硝基水杨酸(DNS)反应)中定量。多糖的水解还可以通过色谱方法来监测,该色谱方法对通过酶作用释放的可溶性单糖、二糖和寡糖进行分离和定量。此外,可以将可溶性比色底物掺入琼脂培养基中,在该培养基中培养表达并分泌亲本或经修饰纤维素酶的宿主微生物。在这种琼脂板测定中,纤维素酶的活性通过在表达和分泌活性纤维素酶的单个微生物菌落周围的有色或无色环来检测。然而应理解的是,本发明的实施并不限于评价经修饰糖苷酶的活性的方法。
在木质素浆液中预孵育之后,可以测定第I家族CBM的存在和不存在对纤维素酶催化结构域(例如第7家族和第6家族催化结构域)或第3家族β-葡糖苷酶催化结构域的蛋白质稳定性和底物水解活性的影响。图2、3和4的数据表明,第I家族CBM的存在大大增加了水解反应中木质素对溶液中蛋白质的截留,但是对其附接的催化结构域的水解活性影响很小。此外,图11表明带有野生型第I家族CBM的Cel7A从其中底物不含木质素或者木质素被非特异性蛋白质“封闭”的水解反应中更易回收。在存在未处理木质素(-BSA)和经处理木质素(+BSA)的情况下,通过实施例10所述的亲本与经修饰糖苷酶的对比研究来测定包含亲本或经修饰第I家族CBM的亲本和经修饰糖苷酶的纤维素水解活性。结果示于下表2中。包含第I家族CBM的所有经修饰的糖苷酶均表现出木质素结合至少20%的降低(I高出20% ),和/或在存在未处理木质素的情况下的活性与存在BSA处理之木质素的情况下的活性之比高出11% (土BSA活性比增加 10% )。
表2 :包含经修饰的第I家族CBM并且在木质素的存在下表现出增强的水解活性 (相对于亲本糖苷酶)的经修饰糖苷酶
权利要求
1.经修饰的第I家族碳水化合物结合组件,其在选自10、11、12、14、17、21、24、29、31、33和37的一个或更多个位置上包含氨基酸替换,所述位置通过比对第I家族碳水化合物结合组件的氨基酸序列与SEQID N0:30所示里氏木霉(Trichoderma reesei) Cel6A碳水化合物结合组件的氨基酸序列来确定,其中所述经修饰的第I家族碳水化合物结合组件显示出与结晶纤维素结合并且包含与SEQ ID NO :30具有约50%至约99. 9%同一性的氨基酸序列。
2.经修饰的第I家族碳水化合物结合组件,其在选自11、12、14、17、24、29和31的一个或更多个位置上包含替换为酸性氨基酸的氨基酸替换,所述位置通过比对第I家族碳水化合物结合组件的氨基酸序列与SEQ ID N0:30所示里氏木霉Cel6A碳水化合物结合组件的氨基酸序列来确定,其中所述经修饰的第I家族碳水化合物结合组件显示出与结晶纤维素结合并且包含与SEQ ID NO :30具有约50%至约99. 9%同一性的氨基酸序列。
3.权利要求2所述的经修饰的第I家族碳水化合物结合组件,其中所述酸性氨基酸是天冬氨酸。
4.经修饰的第I家族碳水化合物结合组件,其在选自10、21、33和37的一个或更多个位置上包含氨基酸替换,所述位置通过比对第I家族碳水化合物结合组件的氨基酸序列与SEQ ID NO :30所示里氏木霉Cel6A碳水化合物结合组件的氨基酸序列来确定,其中所述经修饰的第I家族碳水化合物结合组件显示出与结晶纤维素结合并且包含与SEQ IDNO :30具有约50 %至约99. 9 %同一性的氨基酸序列。
5.权利要求4所述的经修饰的第I家族碳水化合物结合组件,其中将所述第10位上的氨基酸替换为丝氨酸,将所述第21位上的氨基酸替换为芳族氨基酸,将所述第33位上的氨基酸替换为天冬酰胺,以及将所述第37位上的氨基酸替换为芳族酸性氨基酸。
6.权利要求5所述的经修饰的第I家族碳水化合物结合组件,其中将所述第21位上的氨基酸替换为酪氨酸,以及将所述第37位上的氨基酸替换为酪氨酸。
7.权利要求1至6中任一项所述的经修饰的第I家族碳水化合物结合组件,其中所述经修饰的第I家族碳水化合物结合组件的氨基酸序列与SEQ ID NO 30具有约60%至约99. 9% 同一性。
8.权利要求1至6中任一项所述的经修饰的第I家族碳水化合物结合组件,其中所述经修饰的第I家族碳水化合物结合组件的氨基酸序列与SEQ ID NO 30具有约75%至约99. 9% 同一性。
9.权利要求1至8中任一项所述的经修饰的第I家族碳水化合物结合组件,其中所述经修饰的第I家族碳水化合物结合组件显示出对木质素的结合降低。
10.权利要求1至9中任一项所述的经修饰的第I家族碳水化合物结合组件,其中所述经修饰的第I家族碳水化合物结合组件使糖苷酶对木质素的结合降低,所述糖苷酶包含由一个或更多个接头肽连接的所述经修饰的第I家族碳水化合物结合组件、一个或更多个催化结构域和一个或更多个碳水化合物结合组件。
11.经修饰的糖苷酶,其包含一个或更多个催化结构域和一个或更多个碳水化合物结合组件,其中 (a)所述一个或更多个催化结构域和一个或更多个碳水化合物结合组件通过一个或更多个接头肽功能性连接;以及(b)所述一个或更多个碳水化合物结合组件中的至少一个是权利要求1至8中任一项所述的经修饰的第I家族碳水化合物结合组件, 与亲本糖苷酶相比,所述经修饰的糖苷酶显示出木质素存在下的水解活性升高和/或对木质素的结合降低,所述亲本糖苷酶包含由相同的一个或更多个接头肽连接的衍生出所述经修饰的碳水化合物结合组件的亲本第I家族碳水化合物结合组件、相同的一个或更多个催化结构域和相同的一个或更多个碳水化合物结合组件。
12.权利要求11所述的经修饰的糖苷酶,其中所述一个或更多个催化结构域选自纤维素酶催化结构域、半纤维素酶催化结构域、β -葡糖苷酶催化结构域和辅助成分催化结构域。
13.权利要求12所述的经修饰的糖苷酶,其中所述纤维素酶催化结构域是第5、6、7、8、9、12、44、45、48、51、61和74家族糖苷水解酶的成员;所述半纤维素酶催化结构域是第5、8、10、11、26、43、51、54、62或113家族糖苷水解酶的成员,所述β-葡糖苷酶催化结构域是第I或3家族糖苷水解酶的成员;以及所述辅助成分催化结构域是膨胀因子、CIP或扩展蛋白催化结构域。
14.权利要求13所述的经修饰的糖苷酶,其中所述纤维素酶催化结构域是第6或7家族糖苷水解酶的成员。
15.权利要求14所述的经修饰的糖苷酶,其中所述纤维素酶催化结构域包含SEQIDNO :1(里氏木霉Cel6A)第83-447位氨基酸、SEQ ID NO :124(里氏木霉Cel7A)第1-436位氨基酸、SEQ ID N0:2(特异腐质霉(Humicola insolens) Avi2)第 97-460 位氨基酸,或 SEQID No :3(黄抱原毛平革菌(Phanerochaete chrysosporium) Cel6A)第 81-440 位氛基酸。
16.权利要求15所述的经修饰的糖苷酶,其中所述纤维素酶催化结构域包含含有选自以下的一个或更多个氨基酸替换的SEQ ID NO :1(里氏木霉Cel6A)第83-447位氨基酸Y103H、Y103K、Y103R、Y103A、Y103V、Y103L、Y103P、K129E、L136V、L1361、S186K、S186T、S186Y、Q204K、G2131D、A322D、Q363E、G365D、G365E、G365Q、G365S、R410A、R410F、R410L、R410Q 和 R410S。
17.权利要求12所述的经修饰的糖苷酶,其中所述β-葡糖苷酶催化结构域是包含选自以下的一个或更多个氨基酸替换的SEQ ID No :100的里氏木霉Cel3A :V43X、V66X、S72X、V101X、T235X、N248X、F260X、N369X、A386X 和 I543X。
18.权利要求12所述的经修饰的糖苷酶,其中所述一个或更多个催化结构域来自真菌糖苷酶。
19.权利要求18所述的经修饰的糖苷酶,其中所述真菌糖苷酶来自木霉属(Trichoderma ssp.)、曲霉属(Aspergillus ssp.)、肉座菌属(Hypocrea ssp.)、腐质霉属(Humicola ssp.)、脉抱菌属(Neurospora ssp. )、Orpinomyces ssp.、赤霉菌属(Gibberella ssp·)、裸胞壳属(Emericella ssp.)、毛壳属(Chaetomium ssp·)、金抱属(Chrysosporium ssp·)、键刀菌属(Fusarium ssp·)、青霉菌属(Penicillium ssp·)、Magnaporthe ssp.、原毛平革菌属(Phanerochaete ssp.)、检菌属(Trametes ssp.)、埃杜拉香 (Lentinula edodes)、Gleophyllum trabeiu、Ophiostoma piliferum、Corpinus cinereus、Geomyces pannorum、罗伦隐球酵母(Cryptococcus laurentii)、出芽短梗霉(Aureobasidium pullulans)、煤油霉菌(Amorphotheca resinae)、白冬抱酵母(Leucosporidium scotti)、雅致小克银汉霉(Cunninghamella elegans)、疏棉状嗜热丝抱菌(Thermomyces lanuginosa)、嗜热毁丝霉(Myceliophthora thermophilum)或嗜热侧抱霉(Sporotrichum thermophile)。
20.权利要求19所述的经修饰的糖苷酶,其中所述真菌糖苷酶来自里氏木霉。
21.权利要求11至20中任一项所述的经修饰的糖苷酶,其中所述一个或更多个催化结构域是野生型催化结构域,或相对于野生型催化结构域包含氨基酸替换、插入或缺失的经修饰的催化结构域。
22.权利要求11至20中任一项所述的经修饰的糖苷酶,其中除所述经修饰的第I家族碳水化合物结合组件之外的所述一个或更多个碳水化合物结合组件是野生型碳水化合物结合组件,或相对于野生型催化结构域包含氨基酸替换、插入或缺失的经修饰的碳水化合物结合组件。
23.权利要求11至20中任一项所述的经修饰的糖苷酶,其中所述一个或更多个接头肽是野生型接头肽,或相对于野生型催化结构域包含氨基酸替换、插入或缺失的经修饰的接头妝。
24.权利要求23所述的经修饰的糖苷酶,其中所述一个或更多个接头肽是约6至约60个氨基酸长的经修饰的接头肽,并且其中至少约50%的氨基酸是脯氨酸、丝氨酸或苏氨酸,所述经修饰的接头肽相对于衍生出所述经修饰的接头肽的亲本接头肽包含一个或更多个导致以下结果的氨基酸替换、插入或缺失, (a)所述接头肽的计算等电点降低;或 (b)所述接头肽中苏氨酸丝氨酸的比例增加;或 (c)(a)和(b) 二者; 所述经修饰的接头肽使所述经修饰的糖苷酶与亲本糖苷酶相比,木质素存在下的水解活性升高和/或对木质素的结合降低,所述亲本糖苷酶包含位于相同纤维素酶催化结构域与碳水化合物结合组件之间的所述亲本接头。
25.基因构建体,其包含编码权利要求1至10中任一项所述之经修饰的第I家族碳水化合物结合组件的核酸序列。
26.基因构建体,其包含编码权利要求11至24中任一项所述之经修饰的糖苷酶的核酸序列。
27.分离的经遗传修饰的微生物,其包含权利要求23所述的基因构建体。
28.分离的经遗传修饰的微生物,其包含权利要求24所述的基因构建体。
29.权利要求27或28所述的分离的经遗传修饰的微生物,其中所述微生物是细菌、酵母或丝状真菌物种。
30.权利要求29所述的分离的经遗传修饰的微生物,其中所述微生物是链霉菌属(Streptomyces)、酵母属(Saccharomyces)、毕赤酵母属(Pichia)、汉逊酵母属(Hansenula)、肉座菌属(Hypocrea)、木霉属(Trichoderma)、曲霉属(Aspergillus)、键刀菌属(Fusarium)、金孢霉属(Chysoporium)或毁丝霉属(Myceliophthora)的物种。
31.用于产生权利要求1至10中任一项所述的经修饰的第I家族碳水化合物结合组件的 方法,其包括以下步骤在诱导所述经修饰的第I家族碳水化合物结合组件的表达和分泌的条件下,培养权利要求27所述的经遗传修饰的微生物,并且从培养基中回收所述经修饰的第I家族碳水化合物结合组件。
32.用于产生权利要求11至24中任一项所述的经修饰的糖苷酶的方法,其包括以下步骤在诱导所述经修饰的糖苷酶的表达和分泌的条件下,培养权利要求28所述的经遗传修饰的微生物,并且从培养基中回收所述经修饰的糖苷酶。
33.用于将纤维素或半纤维素底物水解成糖的方法,其包括在木质素存在下使所述底物接触权利要求11至24中任一项所述的经修饰的糖苷酶。
34.权利要求33所述的方法,其中所述纤维素或半纤维素底物是经预处理的木质纤维素底物。
35.权利要求33或34所述的方法,其中所述经修饰的糖苷酶与亲本糖苷酶相比在所述方法中显示出提高的回收率,所述亲本糖苷酶包含相同的一个或更多个催化结构域、一个或更多个接头肽和一个或更多个碳水化合物结合组件,其中所述一个或更多个碳水化合物结合组件中至少一个是衍生出所述经修饰的糖苷酶中的所述经修饰的第I家族碳水化合物结合组件的亲本第I家族碳水化合物结合组件。
36.权利要求35所述的方法,其中所述方法以连续、半连续或补料分批方法进行。
37.权利要求33所述的方法,其还包括糖到醇或糖醇的微生物发酵。
全文摘要
本发明提供了经修饰的第1家族碳水化合物结合组件(carbohydrate binding module,CBM),其在10、11、12、14、17、21、24、29、31、33和37位中的一个或更多个上包含氨基酸替换,所述位置通过第1家族CBM的氨基酸序列与SEQ ID NO30的比对来确定,并且与SEQ ID NO30有约50%至约99.9%的氨基酸序列同一性。还提供了包含经修饰的第1家族CBM的经修饰的糖苷酶、用于表达经修饰的第1家族CBM或经修饰的糖苷酶的基因构建体和遗传修饰微生物。在木质素的存在下,经修饰的第1家族CBM使得经修饰的糖苷酶与木质素的结合降低和/或水解活性增加,其可用于在木质素的存在下水解纤维素或半纤维素的方法。
文档编号C12N15/56GK103003421SQ201180009399
公开日2013年3月27日 申请日期2011年2月11日 优先权日2010年2月11日
发明者约翰·J·托马舍克, 布赖恩·R·斯克特, 丹尼尔·科尔钦斯基 申请人:艾欧基能源公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1