木聚糖酶变体及编码其的多核苷酸的制作方法

文档序号:406913阅读:359来源:国知局
专利名称:木聚糖酶变体及编码其的多核苷酸的制作方法
技术领域
本发明涉及木聚糖酶的变体,编码所述变体的多核苷酸,产生所述变体的方法和使用所述变体的方法。
背景技术
木聚糖,植物半纤维素的一种主要成分,是D-木糖通过β -I, 4-木糖苷键连接的聚合物。木聚糖可通过酸或酶水解降解为木糖和木糖寡聚物。木聚糖的酶水解产生游离糖,而不产生用酸形成的副产物(例如呋喃)。木聚糖酶可用于多种用途,如酶降解农业废物以供产生醇燃料,酶处理动物饲料以释放游离糖,酶处理以供在纤维素的制备中溶解纸浆(pulp),以及在纸浆的生物漂白中的酶处理。具体而言,木聚糖酶可用于纸和纸浆工业以增强漂白的纸浆的亮度,改善纸浆的品质,减少化学纸浆漂白步骤中使用的氯的量,以及增加回收纸工艺中纸浆的游离度(freeness)。Dumon 等,2008,Journal of Biological Chemistry 283:22557-22564 描述了将超热稳定性工程改造入GHll木聚糖酶。Wang和Tao, 2008, Biotechnology Letters30:937-944公开了通过定向进化增强Thermobifida fusca木聚糖酶A的活性和碱性pH稳定性。美国专利号5,759,840公开了修饰家族11木聚糖酶以改善嗜热性、嗜碱性和热稳定性。美国专利号7,060,482公开了修饰的木聚糖酶,其包含在对应于里氏木霉(Trichoderma reesei)木聚糖酶(TrX)氨基酸序列的位置162处,或在其它木聚糖酶分子中的其等同位置处的碱性氨基酸,至少一个二硫桥,或其组合。美国专利号7,314,743公开了修饰的木聚糖酶,其具有在对应于里氏木霉木聚糖酶II氨基酸序列的位置处的至少一个取代的氨基酸残基。W02007/115391公开了修饰的家族11木聚糖酶,其包含在对应于里氏木霉木聚糖酶II氨基酸序列的位置99和118处的半胱氨酸残基以形成分子内二硫键。本发明提供了与其亲本酶相比具有改善的特性的木聚糖酶的变体。

发明内容
本发明涉及亲本木聚糖酶的分离的变体,其在一个或多个(几个)对应于SEQ IDN0:2 或 SEQ ID NO:4 的成熟多肽的位置 2,17,21,28,38,41,55,56,57,60,62,74,81,104,111,121,151,159,161,183,186,188,和192的位置处包含取代,其中所述变体具有木聚糖
酶活性。本发明还涉及编码所述变体的分离的多核苷酸;包含所述多核苷酸的核酸构建体、载体和宿主细胞;和产生所述变体的方法。本发明进一步涉及降解含木聚糖材料的方法,其包括用此种变体处理所述材料。本发明还涉及处理纸浆的方法,其包括将纸浆与此种变体相接触。本发明进一步涉及降解含木聚糖材料的方法,其包括用此种变体处理所述材料。本发明进一步涉及产生木糖的方法,其包括将含木聚糖材料与此种变体相接触。


图I显示质粒pTH025的限制性图。图2显示质粒pTH153的限制性图。 图3显示一个合成多核苷酸片段的DNA序列和推导的氨基酸序列,所述片段包含克劳氏芽孢杆菌(Bacillus clausii)丝氨酸蛋白酶核糖体结合位点(PBS)和与582bp的编码去除纤维素结合域的T. fusca GHll木聚糖酶的密码子优化的基因融合的克劳氏芽孢杆菌丝氨酸蛋白酶信号序列(下划线表示)。图4A和4B显示T. fusca木聚糖酶变体136的分光光度法和kappa数测量与野生型T. fusca GHll木聚糖酶在70。。和pH 9. 5的比较。图5A和5B显示T. fusca木聚糖酶变体370的分光光度法和kappa数测量与野生型T. fusca GHll木聚糖酶在70。。和pH 9. 5的比较。图6A和6B显示T. fusca木聚糖酶变体566的分光光度法和kappa数测量与野生型T. fusca GHll木聚糖酶在80。。和pH 9. 5的比较。图7A和7B显示T. fusca木聚糖酶变体564的分光光度法和kappa数测量与野生型T. fusca GHll木聚糖酶在80。。和pH 9. 5的比较。定义木聚糖酶活性术语“木聚糖酶”在本文中定义为催化木聚糖中1,4-β-D-木糖苷键的内水解的1,4-β -D-木聚糖-木聚糖水解酶(E. C. 3. 2. I. 8)。就本发明而言,木聚糖酶活性用 O. 1%AZCL_木聚糖燕麦(Megazyme Wicklow, Ireland)作为底物在 O. 01%TWEEN 20-125mM硼酸钠pH 8. 8中在50°C在595nm确定。变体术语“变体”意指具有木聚糖酶活性的多肽,其在一个或多个位置包含一个或多个(例如几个)氨基酸残基的改变,即取代、插入和/或缺失。取代意指用不同的氨基酸替代占据某位置的氨基酸;缺失意指去除占据某位置的氨基酸;而插入意指邻接于占据某位置的氨基酸添加1-3个氨基酸。突变体术语“突变体”意指编码变体的多核苷酸。野生型术语“野生型”木聚糖酶意指由天然存在的微生物,如见于自然界的细菌、酵母或丝状真菌表达的木聚糖酶。亲本或亲本木聚糖酶术语“亲本”或“亲本木聚糖酶”意指对其进行了改变以产生本发明的酶变体的木聚糖酶。所述亲本可为天然存在的(野生型)多肽或其变体。分离的或纯化的术语“分离的”和“纯化的”意指从与其天然相关的至少一种组分移出的多肽或多核苷酸。例如,如通过SDS-PAGE测定的,变体可为至少1%纯,例如至少5%纯,至少10%纯,至少20%纯,至少40%纯,至少60%纯,至少80%纯,至少90%纯,和至少95%纯;而多核苷酸如通过琼脂糖电泳测定的,可为至少1%纯,例如至少5%纯,至少10%纯,至少20%纯,至少40%纯,至少60%纯,至少80%纯,至少90%纯,和至少95%纯。成熟多肽术语“成熟多肽”意指以其在翻译和任何翻译后修饰之后的最终形式存在的多肽,所述修饰例如N-末端加工、C-末端截短、糖基化、磷酸化等。在一个方面,根据预测SEQ ID NO: 2的氨基酸-I至-27是信号肽的SignalP程序(Nielsen等,1997,ProteinEngineering 10:1_6),成熟多肽是SEQ ID NO: 2的氨基酸I至194。在另一个方面,根据预测SEQ ID NO:4的氨基酸-I至-42是信号肽的SignalP程序(Nielsen等,1997,见上),成熟多肽是SEQ ID NO:4的氨基酸I至296。成熟多肽编码序列术语“成熟多肽编码序列”意指编码具有木聚糖酶活性的成熟多肽的多核苷酸。在一个方面,根据预测SEQ ID NO: I的核苷酸I至81编码信号肽的SignalP程序(Nielsen等,1997,见上),成熟多肽编码序列是SEQ ID NO: I的核苷酸82至663。在另一个方面,根据预测SEQ ID NO: 3的核苷酸I至126编码信号肽的SignalP程序(Nielsen等,1997,见上),成熟多肽编码序列是SEQ ID NO:3的核苷酸127至1014。
序列同一性参数“序列同一性”描述两个氨基酸序列之间或两个脱氧核糖核苷酸序列之间的相关性。就本发明而言,两个氨基酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS: The European Molecular Biology Open Software Suite,Rice等,2000, Trends Genet. 16:276-277),优选3. 0. 0版或更高版本的Needle程序中所执行的 Needleman-Wunsch 算法(Needleman 和 Wunsch, 1970, J. Mol. Biol. 48:443-453)来测定。使用的参数为缺口开放罚分(gap open penalty) 10,缺口延伸罚分(gap extensionpenalty) 0. 5 和 EBL0SUM62 (BL0SUM62 的 EMBOSS 版)取代矩阵。使用 Needle 标记为“最长同一'I"生(longest identity) ”的输出结果(使用-nobrief选项获得)作为百分比同一'生,并计算如下(同样的残基X100)/(比对长度一比对中缺口的总数)就本发明而言,两个脱氧核苷酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite, Rice 等,2000,见上文),优选3. 0. 0版或更高版本的Needle程序中所执行的Needleman-Wunsch算法(Needleman和Wunsch, 1970,见上文)来测定。使用的参数为缺口开放罚分10,缺口延伸罚分0. 5和EDNAFULL (NCBINUC4. 4的EMBOSS版)取代矩阵。使用Needle标记为“最长同一性”的输出结果(使用-nobrief选项获得)作为百分比同一性,并计算如下(同样的脱氧核糖核苷酸X100)/(比对长度一比对中缺口的总数)多肽片段术语“多肽片段”意指从成熟多肽的氨基和/或羧基末端缺失一个或多个(几个)氨基酸的多肽;其中所述片段具有木聚糖酶活性。在一个方面,片段含有至少160个氨基酸残基,例如至少170个氨基酸残基,或至少180个氨基酸残基。在另一个方面,片段含有至少255个氨基酸残基,例如至少270个氨基酸残基,或至少285个氨基酸残基。亚序列术语“亚序列(subsequence) ”意指从成熟多肽编码序列的5’和/或3’端缺失一个或多个(几个)核苷酸的多核苷酸序列;其中所述亚序列编码具有木聚糖酶活性的多肽片段。在一个方面,亚序列含有至少480个核苷酸,例如至少510个核苷酸或至少540个核苷酸。在另一个方面,亚序列含有至少765个核苷酸,例如至少810个核苷酸或至少855个核苷酸。
等位变体(allelic variant):术语“等位变体”表示占据相同染色体基因座的基因的任何两种或更多种可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。编码序列术语“编码序列”意指直接指定其多肽产物氨基酸序列的多核苷酸。编码序列的边界通常由开读框决定,所述开读框通常以ATG起始密码子或其他起始密码子例如GTG和TTG开始,并且以终止密码子例如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的或重组的多核苷酸。cDNA :术语“cDNA”在本文中定义为能够通过反转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少可能存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的包括剪接的步骤加工然后作为成熟的已剪接的mRNA出现。核酸构建体术语“核酸构建体”意指单链或双链的核酸分子,其分离自天然存在 的基因,或受修饰以本来不存在于(not otherwise exist)自然界中的方式含有核酸的区段,或是合成的。当所述核酸构建体含有表达本发明的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。调控序列(control sequence):术语“调控序列”意指对编码本发明变体的多核苷酸表达是必需的核酸序列。各个调控序列对于编码所述变体的多核苷酸可以是天然的(即,来自相同基因)或外源的(即,来自不同基因),或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码变体的多核苷酸编码区的连接。可操作地连接术语“可操作地连接”意指这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的适当位置,使得调控序列指导多肽的编码序列的表达。表达术语“表达”包括涉及变体产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。表达载体术语“表达载体”意指线性的或环状的DNA分子,其包含编码变体的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。宿主细胞术语“宿主细胞”意指任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。术语“宿主细胞”涵盖亲本细胞的任何后代,所述后代由于在复制中发生的突变与亲本细胞不完全相同。改善的特性术语“改善的特性”意指与变体相关并相对于亲本改善的特征。此类改善的特性包括但不限于热活性、热稳定性、PH活性、pH稳定性、底物/辅因子特异性、改善的表面特性、产物特异性、在预处理的生物质存在下增加的稳定性或溶解性、在储藏条件下改善的稳定性和化学稳定性。改善的热稳定性术语“改善的热稳定性”意指变体在一定温度下在缓冲液中或在如那些在产物储藏/运输过程中存在的条件或类似于在变体的产业应用过程中存在的那些条件下温育一段时间之后相对于亲本显示木聚糖酶活性的保持。所述温度可为任何合适的温度,其中可观察到变体和亲本之间的热稳定性差异,例如,40°C,45°C,50°C,55°C,60 V,65 °C,70 V,75 °C,80 V,85 °C,90 V,95 °C,或任何其它合适温度。用于确定改善的热稳定性的 pH 可为任何合适的 pH,例如 3,3. 5,4,4. 55,5. 5,6,6. 5,7,7. 5,8,8. 5,9,9. 5,10,10. 5,11,或任何其它合适的pH。具有改善的热稳定性的变体相对于亲本可能会或不会显示改变的热活性概貌。举例而言,变体在升高的温度温育之后相对于亲本可具有改善的重新折叠的能力。在一个方面,当使用合适的测定如实施例7中所述的测定比较剩余活性时,具有木聚糖酶活性的变体的热稳定性与亲本相比具有至少I. 05倍,例如至少I. I倍,至少I. 2倍,至少I. 3倍,至少I. 4倍,至少I. 5倍,至少2倍,至少2. 5倍,至少3倍,至少3. 5倍,至少4倍,至少4. 5倍,和至少5倍的热稳定性。改善的热活性术语“改善的热活性”意指变体在特定温度范围相对于亲本的温度依存性活性概貌显示改变的温度依存性活性概貌。所述温度范围可为任何合适的温度范 围,其中可观察到变体和亲本之间的热活性差异。用于确定改善的热活性的PH可为任何合适的 pH,例如 3,3. 5,4,4. 55,5. 5,6,6. 5,7,7. 5,8,8. 5,9,9. 5,10,10. 5,11,或任何其它合适的pH。热活性值提供了变体在一定范围温度内在增强水解反应的催化方面的有效性的量度。变体在特定温度范围内是稳定的,并保持其活性,但随着温度增加变得较不稳定,从而活性较低。此外,由变体催化的反应的起始速率可通过温度的增加进行加速,这是通过确定变体的热活性进行测量的。热活性更高的变体会导致增强酶组合物水解底物速率方面的增力口,由此减少所需的时间和/或减少活性所需的酶浓度。或者,具有较少的热活性的变体会在低于由亲本的温度依存性活性概貌所定义的亲本的最适温度的温度增强酶反应。在一个方面,当使用合适的测定如实施例8中所述的测定比较剩余活性时,变体的热活性与亲本相比具有至少I. 05倍,例如至少I. I倍,至少I. 2倍,至少I. 3倍,至少I. 4倍,至少I. 5倍,至少2倍,至少3倍,至少4倍,至少5倍,至少10倍,至少20倍,至少30倍,至少40倍,至少50倍,至少60倍,至少70倍,至少80倍,至少90倍,至少100倍,至少125倍,至少150倍,至少175倍,和至少200倍的热活性。改善的漂白剂增强性能术语“改善的漂白剂增强性能”意指变体与亲本相比生成更高的Kappa数减少和从纸浆释放更多的280nm吸收材料。所述温度可为任何合适的温度,其中可观察到变体和亲本之间的漂白剂增强性能的差异,例如40°C,45°C,50°C,55°C,60 V,65 °C,70 V,75 °C,80 V,85 °C,90 V,95 °C,或任何其它合适的温度。用于确定改善的漂白剂增强性能的pH可为任何合适的pH,例如3,3. 5,4,4. 55,5. 5,6,6. 5,7,7. 5,8,8. 5,9,9. 5,10,10. 5,11,或其它任何合适的pH。在一个方面,使用合适的测定如实施例13中所述的测定,基于纸浆Kappa数减少,用本发明的变体处理纸浆与用亲本处理相比增加漂白剂增强性能至少O. 5%,例如至少1%,至少I. 5%,至少2%,至少2. 5%,至少3%,至少3. 5%,至少4%,至少4. 5%,至少5%,至少7. 5%,和至少10%。在另一个方面,基于从纸浆释放280nm吸收材料(参见实施例13),用本发明的变体处理纸浆与用亲本处理相比增加漂白剂增强性能至I. 05倍,例如至少I. I倍,至少I. 2倍,至少I. 3倍,至少I. 4倍,至少I. 5倍,至少2倍,至少3倍,至少4倍,至少5倍,和至少10倍。含木聚糖材料术语“含木聚糖材料”在本文中定义为任何包含含有β -(1-4)连接的木糖残基骨架的植物细胞壁多糖的材料。陆生植物的木聚糖是具有i3-(l_4)-D-吡喃木糖骨架(其具有短糖链分支)的杂聚物。其包含D-葡糖醛酸或其4-0-甲基醚、L-阿拉伯糖和/或多种寡糖,由D-木糖、L-阿拉伯糖,D-或L-半乳糖和D-葡萄糖组成。木聚糖类型的多糖可分为同木聚糖(homoxylan)和杂木聚糖(heteroxylan),其包括葡糖醒酸木聚糖,(阿拉伯)葡糖醛酸木聚糖,(葡糖醛酸)阿拉伯木聚糖,阿拉伯木聚糖和复合杂木聚糖(complex heteroxylan)。参见例如 Ebringerova 等,2005,Adv. Polym. Sci. 186:1-67。在本发明的方法中,可使用任何含木聚糖材料。在一个优选的方面,所述含木聚糖材料是 8myl8chyma8ydes。发明详述本发明涉及亲本木聚糖酶的分离的变体,其在一个或多个(几个)对应于SEQ IDN0:2 或 SEQ ID NO:4 的成熟多肽的位置 2,17,21,28,38,41,55,56,57,60,62,74,81,104,111,121,151,159,161,183,186,188,和192的位置处包含取代,其中所述变体具有木聚糖
酶活性。变体命名规则就本发明而言,使用公开于SEQ ID N0:2或SEQ ID N0:4中的成熟多肽以确定在其他木聚糖酶中对应的氨基酸残基。将其他木聚糖酶的氨基酸序列与公开于SEQ ID NO:2和SEQ ID NO:4中的成熟多肽进行比对,并基于该比对,可以使用Needleman-Wunsch算法(Needleman 和 Wunsch, 1970,J. Mol. Biol. 48 :443-453)(如用 EMBOSS 软件包(EMB0SS 欧洲分子生物开放软件套件(The European Molecular Biology Open Software Suite), Rice 等,2000,Trends Genet 16:276-277)的 Needle 程序执行,优选为 3. 0. 0 版或之后的版本)确定SEQ ID N0:2或SEQ ID NO:4所公开的成熟多肽中任何氨基酸残基对应的氨基酸位置编号。在另一个木聚糖酶中对应氨基酸残基的鉴定可通过使用“ClustalW” (Larkin等,2007,Bioinformatics 23:2947-2948)进行的多个多肽序列的比对来确证。当其他酶与SEQ ID N0:2或SEQ ID N0:4的成熟多肽歧异到传统的基于序列的比较无法检测出其关系时(Lindahl 和 Elofsson, 2000,J. Mol. Biol. 295:613-615),可使用其他配对序列比较算法。在基于序列的搜索中较高的敏感度可使用采用多肽家族的概率表现(probabilistic representation)(序型)搜索数据库的搜索程序来获得。例如,PSI-BLAST程序通过迭代的(iterative)数据库搜索过程来产生序型,并能够检测出较远的同源物(Atschul 等,1997,Nucleic Acids Res. 25:3389-3402)。当多肽的家族或超家族在蛋白质结构数据库中具有一个或多个代表时,甚至可达成更高的敏感度。程序如 GenTHREADER(Jones 1999, J. Mol. Biol. 287:797-815;McGuffin 和Jones, 2003, Bioinformatics 19:874-881)使用来自不同来源(PSI-BLAST、二级结构预测(secondary structure prediction)、结构I匕对序型(structural alignment profile)以及 9myl9chym 势(9myl9chym potential))的信息作为预测所查询序列(query sequence)结构折叠(structural fold)的神经网络的输入。类似地,Gough等,2000,J. Mol.Biol. 313:903-919的方法可用于将未知结构的序列与存在于SCOP数据库中的超家族模型进行比对。这些比对可接着用于生成所述多肽的同源性模型,且上述模型可就其准确度使用多种为此目的开发的工具加以评价。对于已知结构的蛋白质,可获取数种工具和资源以供找回(retrieve)和生成结构比对。例如,已将SCOP超家族的蛋白质进行了结构比对,且这些比对是可获取并可下载的。两个或更多蛋白质结构可使用多种算法,如距离比对矩阵(distance alignmentmatrix)(Holm 和 Sander, 1998,Proteins 33:88-96)或组合延伸(combinatorialextension) (Shindyalov 和 Bourne, 1998, Protein Engineering. 11:739-747)进行比对,且这些算法的实施可另外用于查询具有目标结构的结构数据库,以发现可能的结构同源物(例如 Holm 和 Park, 2000, Bioinformatics 16:566-567)。在描述本发明的木聚糖酶变体时,为了参照方便起见,采用了下面所述的命名法。使用通用的IUPAC单字母或三字母氨基酸缩写。座也。对于氨基酸取代,使用下述命名法初始氨基酸,位置,取代氨基酸。相应地,在226位用丙氨酸取代苏氨酸命名为“Thr226Ala”或“T226A”。多重突变可以用加号 (“ +,,)分开,例如,“Gly205Arg+Ser411Phe” 或 “G205R+S411F”,分别代表 205 和 411 位用精氨酸I取代甘氨酸(G),以及用苯丙氨酸(F)取代丝氨酸(S)。篮失。对于氨基酸缺失,使用了如下命名法初始氨基酸,位置*。相应地,在位置195缺失甘氨酸命名为“Glyl95*”或“G195*”。多个缺失通过加号(“ + ”)分开,例如,“Glyl95*+Ser411*,,或 “G195*+S411*,,。通A。对于氨基酸插入,使用了如下的命名法初始氨基酸,位置,初始氨基酸,新插入的氨基酸。因此,在位置195的甘氨酸之后插入赖氨酸命名为“Glyl95GlyLys”或“G195GK”。多个氨基酸的插入命名为[初始氨基酸,位置,初始氨基酸,插入的氨基酸#1,新插入的氨基酸#2 ;等等]。例如,在位置195的甘氨酸之后插入赖氨酸和丙氨酸记为“Glyl95GlyLysAla” 或 “G195GKA”。在此情况下,通过在插入的氨基酸残基前的氨基酸残基的位置号添加小写字母而对插入的氨基酸残基进行编号。因此,在上一例子中序列为
亲本~ 变体
~195195195a 195b~
~GG-K-A多重改变。包含多重改变的变体由加号(“ + ”)分隔,例如“Argl70Tyr+Glyl95Glu”或“R170Y+G195E”代表分别在位置170用酪氨酸取代精氨酸,和在位置195用谷氨酸取代
甘氨酸。不同的改变。当可在一个位置引入不同的改变时,所述不同改变由逗号分隔,例如“Argl70Tyr,Glu”代表在位置170用酪氨酸或谷氨酸取代精氨酸。因此,“Tyrl67Gly,Ala+Argl70Gly,Ala” 指下述变体“Tyrl67Gly+Argl70Gly”、“Tyrl67Gly+Argl70Ala”、“Tyrl67Ala+Argl70Gly”和“Tyrl67Ala+Argl70Ala”。亲本木聚糖酶
所述亲本木聚糖酶可为(a)多肽,其与SEQ ID N0:2或SEQ ID N0:4的成熟多肽具有至少60%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件下与以下杂交SEQ ID N0:1或SEQ ID NO:3的成熟多肽编码序列,或其全长互补链;或(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQ ID NO: I或SEQ ID NO: 3的成熟多肽编码序列具有至少60%序列同一性。在第一个方面,所述亲本与SEQ ID NO: 2或SEQ ID NO:4的成熟多肽具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性,并具有木聚糖酶活性。在一个方面,亲本的氨基酸序列与SEQ ID N0:2或SEQ ID NO:4的成熟多肽相差不超过十个氨基酸,例如九个氨基酸,八个氨基酸,七个氨基酸,六个氨基酸,五个氨基酸,四个氨基酸,三个氨基酸,两个氨基酸,和一个氨基酸。所述亲本优选包含或组成为SEQ ID NO: 2或SEQ ID NO:4的氨基酸序列。在另一个方面,所述亲本包含或组成为SEQ ID N0:2或SEQ ID N0:4的成熟多肽。在另一个方面,所述亲本包含或组成为SEQ ID NO: 2的氨基酸I至194,或SEQ ID NO: 4的氨基酸I至296。 在一个实施方案中,所述亲本为SEQ ID NO:2的成熟多肽含有至少160个氨基酸残基,例如至少165个,至少170个,至少175个,至少180个,至少185个,或至少190个氨基酸的片段。在另一个实施方案中,所述亲本为SEQ ID NO:4的成熟多肽含有至少250个氨基酸残基,例如至少255个,至少260个,至少265个,至少270个,至少275个,至少280个,至少285个,至少290个,或至少295个氨基酸的片段。在另一个实施方案中,所述亲本是SEQ ID N0:2或SEQ ID N0:4的成熟多肽的等位变体。在第二个方面,所述亲本由多核苷酸编码,所述多核苷酸在非常低严格条件、低严格条件、中等严格条件、中-高严格条件、高严格条件或非常高严格条件下,与以下杂交SEQ ID N0:1或SEQ ID NO:3的成熟多肽编码序列,或其全长互补链(全长互补物)(J. Sambrook, E. F. Fritsch,和 T. Maniatis, 1989,Molecular Cloning, A LaboratoryManual,第 2 版,Cold Spring Harbor, New York) 0SEQ ID NO: I或SEQ ID NO:3的多核苷酸或其亚序列,以及SEQ ID N0:2或SEQID N0:4的多肽或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码亲本的DNA。具体而言,根据标准的Southern印迹方法,可将这些探针用于与感兴趣的属或种的基因组或cDNA杂交,以鉴定和从其中分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少14,例如至少25,至少35,或至少70个核苷酸。优选地,所述核酸探针是至少100个核苷酸的长度,例如,至少200个核苷酸,至少300个核苷酸,至少400个核苷酸,至少500个核苷酸,至少600个核苷酸,至少700个核苷酸,至少800个核苷酸,或至少900个核苷酸的长度。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。这些探针涵盖于本发明中。可从由这些其它生物体制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码亲本。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它生物体的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQID NO: I或SEQ ID NO: 3或其亚序列杂交的克隆或DNA,将所述载体材料用在Sounthern印迹中。就本发明而言,杂交表示多核苷酸在低至非常高的严格条件下与标记的核苷酸探针杂交,所述核苷酸探针对应于SEQ ID NO: I或SEQ ID NO: 3所示的多肽,其成熟多肽编码序列,其全长互补链,或它们的亚序列。可使用例如X射线片(X-ray film)或其他任何本领域中已知的检测手段检测与探针杂交的分子。在一个方面,核酸探针是SEQ ID NO: I或SEQ ID NO:3的成熟多肽编码序列。在另一个方面,核酸探针是SEQ ID NO: I的核苷酸82至663或SEQ IDNO: 3的核苷酸127至1014。在另一个方面,所述核酸探针是编码SEQ ID NO: 2或SEQ ID NO:4的多肽,或它们的片段的多核苷酸。在另一个方面,所述核酸探针是SEQ ID NO: I或SEQ ID NO: 3。对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在 42°C,在5X SSPE、0. 3%SDS、200微克/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严格性为25%的甲酰胺、对于中和中-高严格性为35%的甲酰胺、或对于高和非常高严格性为50%的甲酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。使用2X SSC、0. 2%SDS在45°C (非常低严格性),50°C (低严格性),55°C (中严格性),60 0C (中-高严格性),65V (高严格性),或70°C (非常高严格性)将载体材料最终洗涤三次,每次15分钟。对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严格条件定义为在比使用根据 Bolton 和 McCarthy 计算法(1962, Proc. Natl. Acad. Sci. USA48:1390)计算的Tni 低大约 5 至大约 1(TC,在 O. 9M NaCl, O. 09M Tris-HCl pH7. 6,6mM EDTA,O. 5%NP_40,
IXDenhardt 溶液,ImM 焦憐酸钠(sodium pyrophosphate), ImM 憐酸二氢钠(sodiummonobasic phosphate), O. ImM ATP 和 O. 2mg 每 ml 的酵母 RNA 中,根据标准的 Southern 印迹步骤进行预杂交和杂交最佳12至24小时。将所述载体材料在6X SSC加O. 1%SDS中最终洗涤一次15分钟,并用6XSSC在比计算的Tm低5°C至I (TC的温度洗涤两次,每次15分钟。在第三个方面,所述亲本由多核苷酸编码,所述多核苷酸与SEQ ID NO: I或SEQ IDNO: 3的成熟多肽编码序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%的序列同一性,并编码具有木聚糖酶活性的多肽。在一个方面,所述成熟多肽编码序列是SEQ ID NO: I的核苷酸82至663或SEQ ID NO: 3的核苷酸127至1014。在一个实施方案中,所述亲本由多核苷酸编码,所述多核苷酸包含或组成为SEQ ID NO: I或SEQ ID NO:3。所述亲本可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思应为由多核苷酸编码的亲本由所述来源产生,或由其中插入了来自所述来源的多核苷酸的细胞产生。在一个方面,所述亲本是胞外分泌的。所述亲本可以是细菌木聚糖酶。例如,所述亲本可为革兰氏阳性细菌多肽例如芽抱杆菌属(Bacillus)、梭菌属(Clostridium)、肠球菌属(Enterococcus)、地芽抱杆菌属(Geobacillus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、海洋芽抱杆菌属(Oceanobacillus)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)、或链霉菌属(Streptomyces)木聚糖酶;或革兰氏阴性细菌多肽,如弯曲杆菌属(Campylobacter)、网球菌属(Dictyoglomus)、大肠杆菌(E. coli)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、螺杆菌属(Helicobacter)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、栖热袍菌属(Thermotoga)或脲原体属(Ureaplasma)木聚糖酶。在一个方面,所述亲本是嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽抱杆菌(Bacillus brevis)、环状芽抱杆菌(Bacillus circulans)、克劳氏芽抱杆菌(Bacillus clausii)、凝结芽抱杆菌(Bacilluscoagulans)、坚强芽抱杆菌(Bacillus f irmus)、Bacillus halodurans、灿烂芽抱杆菌(Bacillus lautus)、迟缓芽抱杆菌(Bacillus lentus)、地衣芽抱杆菌(Bacilluslicheniformis)、巨大芽抱杆菌(Bacillus megaterium)、短小芽抱杆菌(Bacilluspumilus)、嗜热脂肪芽抱杆菌(Bacillus stearothermophilus)、枯草芽抱杆菌(Bacillus subtilis)或苏云金芽孢杆菌(Bacillus thuringiensis)木聚糖酶。在另一个方面,所述亲本是似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)或马链球菌兽痕亚种(Streptococcus equi subsp. Zooepidemicus)木聚糖酶。在另一个方面,所述亲本是不产色链霉菌(Streptomyces achromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)或浅青紫链霉菌(Streptomyces Iividans)木聚糖酶。在另一个方面,所述亲本是嗜热网球菌(Dictyoglomus thermophilum)或Thermotoga 14myll4chy 木聚糖酶。所述亲本可为真菌木聚糖酶。例如,所述亲本可为酵母木聚糖酶如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓄霉属(Yarrowia)木聚糖酶。例如,所述亲本可为丝状真菌木聚糖酶如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格抱属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟錯菌属(Ceriporiopsis)、毛 _ 壳属(Chaetomidium)、金抱子菌属(Chrysosporium)、Claviceps、Cochliobolus、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、奉巴齿菌属(Irpex)、蘑燕属(Lentinula)、Leptospaeria、梨抱菌属(Magnaporthe)、Melanocarpus、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉抱菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂糟菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、嗜热霉属(Thermomyces)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、包脚燕属(Volvariella)或炭角菌属(Xylaria)木聚糖酶。在另一个方面,所述亲本是卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)木聚糖酶。在另一个方面,所述亲本是解纤维枝顶孢霉(Acremonium cellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillusfoetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillusoryzae)、Chrysosporium inops、嗜角质金抱子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、Chrysosporium merdarium、租金抱子菌(Chrysosporium pannicola)、Chrysosporium queenslandicum、热带金抱子菌(Chrysosporium tropicum)、Chrysosporium zonatum、嗜热网球菌(Dictyoglomus thermophilum)、杆抱状德抱(Fusarium bactridioides)、禾谷德抱(Fusarium cerealis)、库威德抱(Fusariumcrookwellense)、大刀德抱(Fusarium culmorum)、禾本科德抱(Fusarium graminearum)、禾赤德抱(Fusarium graminum)、异抱德抱(Fusarium heterosporum)、合欢木德抱(Fusarium negundi)、尖德抱(Fusarium oxysporum)、多枝德抱(Fusarium reticulatum)、粉红德抱(Fusarium roseum)、接骨木德抱(Fusarium sambucinum)、肤色德抱(Fusariumsarcochroum)、拟分枝抱德抱(Fusarium sporotrichioides)、硫色德抱(Fusariumsulphureum)、圆德抱(Fusarium torulosum)、拟丝抱德抱(Fusarium trichothecioides)、壤片德抱(Fusarium venenatum)、灰腐质霉(Humicola grisea)、特异腐质霉(Humicolainsolens)、Humicola 14myll4chyma、白奉巴齿菌(Irpex Iacteus)、米黑毛霉(Mucormiehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糖脉抱菌(Neurospora crassa)、绳状青霉(Penicillium funiculosum)、产紫青霉(Penicillium purpurogenum)、黄抱平革菌(Phanerochaete chrysosporium)、细毛嗜热霉(Thermomyces Ianuginosus)、无色梭抱壳(Thielavia achromatica)、Thielavia albomyces、Thielavia albopilosa、澳洲梭抱壳(Thielavia australeinsis)、Thielavia fimeti、小抱梭抱壳(Thielavia microspora)、卵抱梭抱壳(Thielavia ovispora)、Thielavia peruviana、毛梭抱壳(Thielaviasetosa)、瘤抱梭抱壳(Thielavia spededonium)、Thielavia subthermophila、土生梭抱霉(Thielavia terrestris)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichoderma Iongibrachiarum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)木聚糖酶。在另一个方面,所述亲本是Thermobifida fusca木聚糖酶,并优选为SEQID NO: 2或SEQ ID NO:4的Thermobifida fusca木聚糖酶或其成熟多肽。可理解的是对于前述的种,本发明包含完全和不完全阶段(perfect andimperfect states),和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域技术人员将容易地识别适合的等同物的身份。
这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection) (ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismenund Zellkulturen GmbH) (D SM)、真菌菌种保藏中心(Centraalbureau VoorSchimmelcultures) (CBS)和农业研究机构专利培养物保藏中心北区研究中心(Agricultural Research Service Patent Culture Collection, Northern RegionalResearch Center)(NRRL)。可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接获得自自然材料(例如,土壤、堆肥、水等)的DNA样品鉴定和获得所述亲本。用于直接从天然生境(habitat)分离微生物和DNA的技术是本领域内公知的。随后可通过相似地筛选另一种微生物的基因组或cDNA文库或混合的DNA样品来得到编码所述亲本的多核苷酸。一旦用探针检测到编码亲本的多核苷酸,就可以使用本领域普通技术人员已知的技术将所述多核苷酸分离或克隆(参见,例如,Sambrook等,1989,见上文)。所述亲本可为杂合多肽,其中一个多肽的一部分融合于另一个多肽的一部分的N 端或C端。所述亲本亦可为融合多肽或可切割的融合多肽,其中一个多肽融合于另一个多肽的N端或C端。通过将编码一个多肽的多核苷酸融合于编码另一个多肽的多核苷酸来产生融合多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们处于同一阅读框(in frame),并且使融合多肽的表达在相同启动子和终止子的控制下。融合蛋白亦可使用内蛋白(intein)技术构建,其中融合物在翻译后产生(Cooper等,1993,EMBO J. 12:2575-2583;Dawson 等,1994,Science 266:776-779)。融合多肽还可以在两个多肽之间包含切割位点。一旦分泌了融合多肽,就切割所述位点,释放所述两个多肽。切割位点的实例包括,但不限于,公开于Martin等,2003, J. Ind.Microbiol. Biotechnol. 3:568-76;Svetina 等,2000, J. Biotechnol. 76:245-251;Rasmussen-Wilson 等,1997,Appl. Environ. Microbiol. 63:3488-3493;Ward等,1995, Biotechnology 13:498-503;和 Contreras 等,1991, Biotechnology 9:378-381 ;Eaton 等,1986,Biochem. 25:505-512) ;Collins-Racie 等,1995,Biotechnology13:982-987 ;Carter 等,1989,Proteins: Structure, Function, and Genetics 6:240-248;以及 Stevens, 2003,Drug Discovery World 4:35-48 中的位点。变体的制备本发明还涉及用于获得具有木聚糖酶活性的变体的方法,所述方法包括(a)将在对应于 SEQ ID N0:2 或 SEQ ID NO:4 的成熟多肽的位置 2,17,21,28,38,41,55,56,57,60,62,74,81,104,111,121,151,159,161,183,186,188,和 192 的一个或多个(几个)位置将取代引入亲本木聚糖酶,其中所述变体具有木聚糖酶活性;和(b)回收所述变体。所述变体可使用本领域任何已知的任何诱变方法,如定位诱变、合成基因构建(synthetic gene construction)、半合成基因构建(semi synthetic geneconstruction)、随机诱变、改组(shuffling)等来制备。定位诱变是在编码亲本的多核苷酸上的一个或多个确定位点创建一个或多个(几个)突变的技术。
定位诱变可在体外通过PCR达成,涉及使用含有所期望突变的寡核苷酸引物。定位诱变亦可在体外通过表达盒诱变进行,涉及用限制酶在包含编码亲本的多核苷酸的质粒中的位点进行切割,然后将含有突变的寡核苷酸连接到所述多核苷酸中。通常在质粒上和在寡核苷酸上进行消化的限制酶是相同的,使所述质粒和插入物的粘性末端能够彼此连接。参见,例如,Scherer 和 Davis, 1979,Proc. Natl. Acad. Sci. USA 76:4949-4955 ;以及Barton 等,1990,Nucleic Acids Res. 18:7349-4966。定位诱变亦可在体内通过本领域已知方法达成。参见,例如,美国专利申请
发明者J.林, J.叶, A.琼斯, S.奥塔尼, T.许, P.卡斯兰德, E.弗里斯 申请人:诺维信股份有限公司, 诺维信公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1