具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸的制作方法

文档序号:571457阅读:763来源:国知局

专利名称::具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸的制作方法
技术领域
:本发明涉及具有纤维素分解增强活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及用于产生和使用所述多肽的方法。相关领域描述纤维素是单糖葡萄糖通过β-1,4-键共价连接的聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。内切葡聚糖酶在随机位置消化纤维素聚合物,将其打开(openingit)以受到纤维二糖水解酶攻击(attack)。纤维二糖水解酶继而从纤维素聚合物的末端释放纤维二糖的分子。纤维二糖是水溶性的β-1,4-连接的葡萄糖二聚体。葡糖苷酶将纤维二糖水解成葡萄糖。将含木质纤维素原料(lignocellulosicfeedstock)转化为乙醇具有以下优势大量原料现成可用,避免燃烧或填埋材料的合意性和乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将纤维素转化成葡萄糖,葡萄糖将容易地由酵母发酵成乙醇。本领域中有利的是改进的转化含纤维素原料的能力。WO2005/074647公开了具有纤维素分解增强活性的分离的多肽和它的来自土生梭孢霉(Thielaviaterrestris)的多核苷酸。WO2005/074656公开了具有纤维素分解增强活性的分离的多肽和它的来自嗜热子囊菌(Thermoascusaurantiacus)的多核苷酸。WO2007/089290公开了具有纤维素分解增强活性的多肽和它的来自里氏木霉(Trichodermareesei)的多核苷酸。本发明涉及具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸。发明概述本发明涉及具有纤维素分解增强活性的分离的多肽,所述多肽选自下组(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQIDNO2或SEQIDNO4的成熟多肽具有至少60%同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少中严紧条件下与以下杂交(i)SEQIDNO1或SEQIDNO3的成熟多肽编码序列,(ii)包含于SEQIDNO1或SEQIDNO3的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含核苷酸序列的多核苷酸编码,所述核苷酸序列与SEQIDNO=I或SEQIDNO3的成熟多肽编码序列具有至少60%同一性;和(d)SEQIDNO:2或SEQIDNO:4的包含取代、缺失和/或插入一个或多个(数个)氨基酸的成熟多肽的变体。本发明还涉及编码具有纤维素分解增强活性的多肽的分离的多核苷酸,所述多核苷酸选自下组(a)多核苷酸,其编码包含氨基酸序列的多肽,所述氨基酸序列与SEQIDNO2或SEQIDNO4的成熟多肽具有至少60%同一性;(b)多核苷酸,其在至少中严紧条件下与以下杂交(i)SEQIDNO:1或SEQIDNO3的成熟多肽编码序列,(ii)包含于SEQIDNO:1或SEQIDNO3的成熟多肽编码序列中的cDNA序列或(iii)⑴或()的全长互补链;(c)多核苷酸,其包含核苷酸序列,所述核苷酸序列与SEQIDNO:1或SEQIDNO3的成熟多肽编码序列具有至少60%同一性;和(d)多核苷酸,其编码SEQIDNO:2或SEQIDNO4的成熟多肽的包含取代、缺失和/或插入一个或多个(数个)氨基酸的变体。本发明还涉及包含所述多核苷酸的核酸构建体、重组表达载体和重组宿主细胞,和产生具有纤维素分解增强活性的多肽的方法。本发明还涉及抑制多肽在细胞中表达的方法,所述多肽具有纤维素分解增强活性,方法包括对细胞施用双链RNA(dsRNA)分子或在细胞中表达双链RNA(dsRNA)分子,其中dsRNA包括本发明的多核苷酸的亚序列。本发明还涉及这种双链抑制性RNA(dsRNA)分子,其中任选地dsRNA是siRNA或miRNA分子。本发明还涉及用于降解或转化纤维素材料的方法,其包括在存在具有纤维素分解增强活性的多肽的情况下,用纤维素分解酶组合物处理纤维素材料,其中与不存在具有纤维素分解增强活性的多肽相比,具有纤维素分解增强活性的多肽的存在增加纤维素材料的降解。本发明还涉及产生发酵产物的方法,其包括(a)在存在具有纤维素分解增强活性的多肽的情况下用纤维素分解酶组合物糖化纤维素材料,其中与不存在具有纤维素分解增强活性的多肽相比,具有纤维素分解增强活性的多肽的存在增加纤维素材料的降解;(b)用一种或多种发酵微生物发酵步骤(a)的糖化的纤维素材料以产生发酵产物;和(C)从发酵回收发酵产物。本发明还涉及发酵纤维素材料的方法,其包括用一种或多种发酵微生物发酵纤维素材料,其中在存在本发明的具有纤维素分解增强活性的多肽的情况下,用纤维素分解酶组合物水解纤维素材料,并且与不存在具有纤维素分解增强活性的多肽相比,具有纤维素分解增强活性的多肽的存在增加纤维素材料的水解。本发明还涉及包含分离的多核苷酸的植物,所述多核苷酸编码具有纤维素分解增强活性的多肽。本发明还涉及用于产生具有纤维素分解增强活性的多肽的方法,其包括(a)在有益于产生该多肽的条件下培养包含多核苷酸的转基因植物或植物细胞,所述多核苷酸编码具有纤维素分解增强活性的多肽;和(b)回收所述多肽。本发明进一步涉及包含编码蛋白质的基因的核酸构建体,其中将所述基因可操作地连接于编码信号肽的核苷酸序列,所述信号肽包含SEQIDNO2的氨基酸1至17或SEQIDNO4的氨基酸1至15,或由SEQIDNO2的氨基酸1至17或SEQIDNO4的氨基酸1至15组成,其中所述基因对于核苷酸序列是外源的。附图简述图1显示具有纤维素分解增强活性的嗜热毁丝霉CBS202.75GH61A多肽的基因组DNA序列和推定的氨基酸序列(分别为SEQIDNO=I和2)。图2显示pSMail90的限制图谱。图3显示具有纤维素分解增强活性的嗜热毁丝霉CBS202.75GH61F多肽的基因组DNA序列和推定的氨基酸序列(分别为SEQIDNO3和4)。图4显示pSMail92的限制图谱。图5显示pSMail85的限制图谱。图6显示pSMail98的限制图谱。图7显示具有纤维素分解增强活性的嗜热毁丝霉CBS202.75GH61A和GH61F多肽对经过预处理的玉米秸秆的酶水解的影响。定义纤维素分解增强活性术语“纤维素分解增强活性”在本文中定义为增强具有纤维素分解活性的蛋白质对纤维素材料的水解的生物学活性。就本发明而言,通过测量由纤维素酶蛋白在下述条件下水解纤维素材料所导致的还原糖增加或纤维二糖与葡萄糖的总量增加来确定纤维素分解增强活性l_50mg总蛋白/gPCS中的纤维素,其中总蛋白包含80-99.5%w/w的纤维素酶蛋白/gPCS中的纤维素,及0.5-20%w/w的具有纤维素分解增强活性的蛋白质,在50°C历时1-7天,与用等量的总蛋白加载量而无纤维素分解增强活性(l-50mg纤维素酶蛋白/gPCS中的纤维素)所进行的对照水解相比。在一个优选的方面,在总蛋白重量的3%的米曲霉β-葡糖苷酶(根据WO02/095014在米曲霉中重组产生)或者总蛋白质量的3%的烟曲霉β-葡糖苷酶(根据WO02/095014的实施例22在米曲霉中重组产生)存在下使用CELLUCLASI1.5L(NovozymesA/S,Bagsvaerd,Denmark)的混合物作为纤维素分解活性的来源。本发明的具有纤维素分解增强活性的多肽具有SEQIDNO2或SEQIDNO4的成熟多肽的纤维素分解增强活性的优选至少20%,更优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%。具有纤维素分解增强活性的多肽通过降低达到相同水解水平所需的纤维素分解酶的量而增强由具有纤维素分解活性的蛋白质催化的纤维素材料的水解,优选降低至少0.1倍,更优选至少0.2倍,更优选至少0.3倍,更优选至少0.4倍,更优选至少0.5倍,更优选至少1倍,更优选至少3倍,更优选至少4倍,更优选至少5倍,更优选至少10倍,更优选至少20倍,甚至更优选至少30倍,最优选至少50倍,并且甚至最优选至少100倍。纤维素分解活性术语“纤维素分解活性”在本文中定义为可以水解纤维素材料的生物活性。纤维素分解蛋白可以水解羧甲基纤维素(CMC),从而降低温育混合物的粘度。通过振动粘度计(例如,来自Sofraser,France的MIVI3000)可以测定粘度的降低。纤维素酶活性的测定,其以纤维素酶粘度单位(CEVU)测定,可以通过测定样品的降低羧甲基纤维素(CMC)溶液粘度的能力而将样品中存在的催化活性的量定量。在适于纤维素分解蛋白和底6物的温度和PH进行实验。对于CELLUCLAST(NovozymesA/S,Bagsvaerd,Denmark),实验在40°C在0.IM磷酸盐pH9.O缓冲液中进行30分钟,以CMC为底物(33.3g/L羧甲基纤维素Hercules7LFD),并且酶浓度约3.3-4.2CEVU/ml。相对于确定的酶标准品,如CELLUZYME标准品17-1194(获得自NovozymesA/S,Bagsvaerd,Denmark)计算CEVU活性。就本发明而言,通过测定下述条件下由于纤维素分解混合物对纤维素材料水解的增加而确定纤维素分解活性=I-IOmg纤维素分解蛋白/gPCS中的纤维素,在50°C5-7天,与不加纤维素分解蛋白的对照水解相比较。内切葡聚糖酶术语“内切葡聚糖酶”在本文中定义为内切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(endo-l,4-0-D-glucan4-glucanohydrolase)(Ε.C.No.3.2.1.4),其催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣淀粉(Iichenin)中的1,4_β-D-糖苷键、混合的β_1,3葡聚糖例如谷类β-D-葡聚糖或木葡聚糖和含有纤维素成分的其它植物材料中的β_1,4键的内水解(endohydrolysis)。就本发明而言,根据Ghose,1987,PureandApp1.Chem.59:257_268的方法,使用羧甲基纤维素(CMC)水解来测定内切葡聚糖酶活性。纤维二糖水解酶术语“纤维二糖水解酶”在本文中定义为l,4-i3_D-葡聚糖纤维二糖水解酶(1,4-beta-D-glucancellobiohydrolase)(Ε.C.No.3.2.1.91),其催化纤维素、纤维素寡糖,或任何包含β-1,4-连接葡萄糖的聚合物中的l,4-i3-D-糖苷键的水解,从链的还原或非还原末端释放纤维二糖。就本发明而言,根据Lever等,1972,Anal.Biochem.47273-279禾口vanTilbeurgh等,1982,FEBSLetters149152—156;vanTilbeurgh和Claeyssens,1985,FEBSLetters187:283_288描述的方法测定纤维二糖水解酶活性。在本发明中,使用Lever等的方法评价玉米秸秆中纤维素的水解,而使用vanTilbeurgh等的方法确定对于荧光二糖衍生物的纤维二糖水解酶活性。β-葡糖苷酶术语“β-葡糖苷酶”在本文中定义为β-D-葡糖苷葡糖水解酶(beta-D-glucosideglucohydrolase)(Ε.C.No.3.2.1.21),其催化末端非还原β-D-葡萄糖残基的水解,并释放β-D-葡萄糖。就本发明而言,根据Venturi等,2002,J.BasicMicrobiol.42:55_66描述的基本方法测定β_葡糖苷酶活性,只是使用于本文所述不同的条件。一个单位的β-葡糖苷酶活性定义为在50°C,pH5,以4mM对硝基苯基-β-D-葡糖吡喃糖苷酶为底物,在IOOmM柠檬酸钠,0.01%TWEEN20中每分钟产生1.O微摩尔对硝基苯。家族61糖苷水解酶术语“家族61糖苷水解酶”或“家族GH61”在本文中定义为根据HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309_316,及HenrissatB·,禾口BairochΑ.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316695-696属于糖苷水解酶家族61的多肽。目前,Henrissat将GH61家族列为未分类,这说明性质,如机制、催化亲和试剂/碱、催化质子受体和3-D结构对于属于此家族的多肽而言是未知的。纤维素材料纤维素材料可以是包含纤维素的任何材料。生物质初生细胞壁(primarycellwall)中的主要多糖是纤维素,其次最丰富的是半纤维素,而第三是果胶。次生细胞壁(secondarycellwall)在细胞停止生长后产生,其同样含有多糖并通过共价交联至半纤维素的聚合木质素而加强。纤维素是脱水纤维二糖的均聚物,并且因此是线性β-(l-4)-D-葡聚糖,而半纤维素包括多种化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,具有系列取代基的复杂分支结构。尽管通常是多形的,存在于植物组织中的纤维素主要作为平行葡聚糖链的不溶晶体基质。半纤维素通常与纤维素以及其它半纤维素以氢键相连,其帮助稳定细胞壁基质。纤维素通常在,例如,植物的茎、叶、壳、皮和穗轴,或树的叶、枝和木材。纤维素材料可以是,但不限于,草本材料、农业残余物、林业残余物、城市固体废物、废纸和纸浆与造纸厂残余物。纤维素材料可以是任何类型的生物质,包括,但不限于,木材资源、城市固体废物、废纸、作物和作物残余物(参见,例如,Wiselogel等,1995,于HandbookonBioethanol(CharlesΕ·Wyman编),pp.105-118,Taylor&Francis,WashingtonD.C.;ffyman,1994,BioresourceTechnology503-16;Lynd,1990,AppliedBiochemistryandBiotechnology24/25:695_719;Mosier等,,1999,RecentProgressinBioconversionofLignocellulosics,于AdvancesinBiochemicalEngineering/Biotechnology,T.Sch印er主编,Volume65,pp.23-40,Springer-Verlag,NewYork)。在本文中应理解的是,纤维素可以是任何形式的木质纤维素,在混合基质中包含木质素、纤维素和半纤维素的植物细胞壁。在一个优选的方面,纤维素材料是木质纤维素。在一个方面,纤维素材料是草本材料。在另一个方面,纤维素材料是农业残余物。在另一个方面,纤维素材料是林业残余物。在另一个方面,纤维素材料是城市固体废物。在另一个方面,纤维素材料是废纸。在另一个方面,纤维素材料是纸浆和造纸厂残余物。在另一个方面,纤维素材料是玉米秸秆。在另一个优选的方面,纤维素材料是玉米纤维。在另一个方面,纤维素材料是玉米穗轴。在另一个方面,纤维素材料是橙皮。在另一个方面,纤维素材料是稻谷秸杆。在另一个方面,纤维素材料是小麦秸杆。在另一个方面,纤维素材料是柳枝稷(switchgrass)。在另一个方面,纤维素材料是芒草属。在另一个方面,纤维素材料是甘蔗渣。在另一个方面,纤维素材料是微晶纤维素。在另一个方面,纤维素材料是细菌纤维ο纤维素材料可以直接使用或进行预处理,使用本领域已知的传统方法,如本文所述。在一个优选的方面,预处理纤维素材料。预处理的玉米秸秆术语“PCS”或“预处理的玉米秸秆“在本文中定义为通过用热和稀酸处理而源自玉米秸秆的纤维素材料。分离的多肽术语“分离的多肽”用于本文中指从来源分离的多肽。在一个优选的方面,多肽如通过SDS-PAGE测定的,为至少纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,并且最优选至少90%纯。基本上纯的多肽术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备物含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然或重组结合的(associated)的其它多肽材料。因此,优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%纯,最优选至少99.5%纯,并且甚至最优选100%纯。本发明的多肽优选是基本上纯的形式。具体而言,优选所述多肽是“基本上(essentially)纯的形式”,即,所述多肽制备物基本上(essentially)不合与其天然或重组结合的其它多肽材料。例如,这能够通过以下实现通过公知的重组方法或由经典纯化方法制备多肽。成熟多肽术语“成熟多肽”在本文中定义为以其在翻译和任何翻译后修饰之后的最终形式存在的多肽,所述修饰例如N-末端加工、C-末端截短、糖基化、磷酸化等。在一个优选的方面,SignalP软件(Nielsen等,1997,ProteinEngineering10:1_6)预测SEQIDNO2的氨基酸1至17是信号肽,根据该预测,成熟多肽是SEQIDNO2的氨基酸18至232。在另一个优选的方面,SignalP软件预测SEQIDNO4的氨基酸1至15是信号肽,根据该预测,成熟多肽是SEQIDNO4的氨基酸16至235。成熟多肽编码序列术语“成熟多肽编码序列”在本文中定义为编码具有纤维素分解增强活性的成熟多肽的核苷酸序列。在一个优选的方面,SignalP软件预测SEQIDNO=I的核苷酸1至51编码信号肽,根据该预测,成熟多肽编码序列是SEQIDNO1的核苷酸52至921。在另一个优选的方面,SignalP软件预测SEQIDNO3的核苷酸1至45编码信号肽,根据该预测,成熟多肽编码序列是SEQIDNO3的核苷酸46至851。同一性参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。就本发明而言,两个氨基酸序列之间的同一性程度通过Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48443-453)使用EMBOSS软件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsinGenetics16276-277)的Needle程序来测定,优选3.0.0版或更高版本。使用的可选参数为缺口罚分(gappenalty)10,缺口延伸罚分(gapextensionpenalty)0·5和EBL0SUM62(BL0SUM62的EMBOSS版)取代矩阵。使用Needle标记为“最高同一性(longestidentity)”的输出结果(使用-nobrief选项获得)作为同一性百分比,并计算如下(同样的残基X100)/(比对长度-比对中缺口的总数)就本发明而言,两个核苷酸序列之间的同一性程度通过Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)使用EMBOSS软件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,见上文)的Needle程序来测定,优选3.0.0版或更高版本。使用的可选参数为缺口罚分10,缺口延伸罚分0.5和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩阵。使用Needle标记为“最高同一性”的输出结果(使用-nobrief选项获得)作为同一性百分比,并计算如下(同样的脱氧核糖核苷酸X100)/(比对长度-比对中缺口的总数)同源序列术语“同源序列”在本文中定义为在用SEQIDNO2或SEQIDNO4的具有纤维素分解增强活性的嗜热毁丝霉多肽进行的tfasty搜索(Pearson,W.R.,1999,于BioinformaticsMethodsandProtocols中,S.Misener禾口S.A.Krawetz编,pp.185-219)中E值(或期望值)小于0.001的预测蛋白质。多肽片段术语“多肽片段”在本文中定义为从SEQIDNO:2或SEQIDNO:4的成熟多肽或其同源序列的氨基和/或羧基末端缺失一个或多个(数个)氨基酸的多肽;其中所述片段具有纤维素分解增强活性。在一个优选方面,片段含有SEQIDNO:2的成熟多肽或其同源序列的至少185个氨基酸残基,更优选至少195个氨基酸残基,并且最优选至少205个氨基酸残基。在另一个优选的方面,片段含有SEQIDNO:4的成熟多肽或其同源序列的至少190个氨基酸残基,更优选至少200个氨基酸残基,并且最优选至少210个氨基酸残基。亚序列术语“亚序列(subsequence)”在本文中定义为从SEQIDNO:1或SEQIDNO3或其同源序列的5’和/或3’端缺失一个或多个(数个)核苷酸的核苷酸序列;其中所述亚序列编码具有纤维素分解增强活性的多肽片段。在一个优选方面,亚序列含有SEQIDNO1的成熟多肽编码序列或其同源序列的至少555个核苷酸,更优选至少585个核苷酸,并且最优选至少615个核苷酸。在另一个优选方面,亚序列含有SEQIDNO3的成熟多肽编码序列或其同源序列的至少570个核苷酸,更优选至少600个核苷酸,并且最优选至少630个核苷酸。等位变体(allelicvariant)术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。分离的多核苷酸术语“分离的多核苷酸”用于本文中指从来源分离的多核苷酸。在一个优选的方面,多核苷酸如通过琼脂糖电泳测定的,为至少纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,并且最优选至少90%纯。基本上纯的多核苷酸术语“基本上纯的多核苷酸”用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物,并且所述多核苷酸制备物处于适合于在遗传工程的蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然或重组结合的其它多核苷酸材料。然而,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最优选至少99.5%纯的。本发明所述多核苷酸优选为基本上纯的形式。具体而言,优选在本文公开的多核苷酸是“基本上(essentially)纯的形式”,即,所述多核苷酸制备物基本上不含与其天然或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任何组合。编码序列当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定,所述开读框通常以ATG起始密码子或可供选择的起始密码子例如GTG和TTG开始,并且以终止密码子例如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA或重组核苷酸序列。cDNA:术语“cDNA,,在本文中定义为能够通过反转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自mRNA的cDNA没有任何内含子序列。核酸构建体术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分子分离自天然存在的基因,或将所述核酸分子以本来不存在于(nototherwiseexist)自然界中的方式修饰以含有核酸的区段。当所述核酸构建体含有表达本发明的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。调控序列(controlsequence)术语“调控序列”在本文定义为包括对编码本发明多肽的多核苷酸表达是必需的或有利的所有成分。各个调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的,或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。可操作地连接术语“可操作地连接”在本文表示这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的适当位置,使得调控序列指导多肽编码序列的表达。表达术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。表达载体术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。宿主细胞如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。修饰术语“修饰”在本文的意思是,对由SEQIDNO2或SEQIDNO4的成熟多肽组成的多肽或其同源序列的任何化学修饰,以及对编码所述多肽的DNA的遗传操作。所述修饰可以是一个或多个(数个)氨基酸的取代、缺失和/或插入,以及一个或多个(数个)氨基酸侧链的置换。人工变体当用在本文时,术语“人工变体”的意思是具有纤维素分解增强活性的多肽,所述多肽由表达SEQIDNO:1或SEQIDNO:3的成熟多肽编码序列或其同源序列的修饰的核苷酸序列的生物体产生。所述修饰的核苷酸序列通过人为干预(humanintervention),通过修饰公开于SEQIDNO:1或SEQIDNO:3或它们的同源序列的核苷酸序列来获得。发明详述具有纤维素分解增强活性的多肽在第一个方面,本发明涉及包含氨基酸序列的分离的多肽,所述氨基酸序列与SEQIDNO:2或SEQIDNO:4的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、至少97%、至少98%或至少99%的同一性程度,所述多肽具有纤维素分解增强活性(下文中的“同源多肽”)。在一个优选的方面,所述同源多肽具有氨基酸序列,其与SEQIDNO:2或SEQIDNO:4的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。本发明的多肽优选包含SEQIDNO2的氨基酸序列或其等位变体;或它们的具有纤维素分解增强活性的片段。在一个优选的方面,多肽包含SEQIDNO:2的氨基酸序列。在另一个优选方面,多肽包含SEQIDNO:2的成熟多肽。在另一个优选方面,多肽包含SEQIDNO2的氨基酸18至232,或其等位变体;或它们的具有纤维素分解增强活性的片段。在另一个优选方面,多肽包含SEQIDNO2的氨基酸18至232。在另一个优选方面,多肽由SEQIDNO2的氨基酸序列或其等位变体;或它们的具有纤维素分解增强活性的片段组成。在另一个优选方面,多肽由SEQIDNO:2的氨基酸序列组成。在另一个优选方面,多肽由SEQIDNO2的成熟多肽组成。在另一个优选方面,多肽由SEQIDNO2的氨基酸18至232或其等位变体;或它们的具有纤维素分解增强活性的片段组成。在另一个优选方面,多肽由SEQIDNO2的氨基酸18至232组成。本发明的多肽优选还包含SEQIDNO4的氨基酸序列或其等位变体;或它们的具有纤维素分解增强活性的片段。在一个优选的方面,多肽包含SEQIDNO:4的氨基酸序列。在另一个优选方面,多肽包含SEQIDNO:4的成熟多肽。在另一个优选方面,多肽包含SEQIDNO4的氨基酸16至235,或其等位变体;或它们的具有纤维素分解增强活性的片段。在另一个优选方面,多肽包含SEQIDNO4的氨基酸16至235。在另一个优选方面,多肽由SEQIDNO4的氨基酸序列或其等位变体;或它们的具有纤维素分解增强活性的片段组成。在另一个优选方面,多肽由SEQIDNO:4的氨基酸序列组成。在另一个优选方面,多肽由SEQIDNO:4的成熟多肽组成。在另一个优选方面,多肽由SEQIDNO:4的氨基酸16至235或其等位变体;或它们的具有纤维素分解增强活性的片段组成。在另一个优选方面,多肽由SEQIDNO4的氨基酸16至235组成。在第二个方面,本发明涉及具有纤维素分解增强活性的分离的多肽,所述分离的多肽由多核苷酸编码,所述多核苷酸在优选非常低严紧条件下,优选低严紧条件下,更优选中严紧条件下,更优选中_高严紧条件下,甚至更优选高严紧条件下,并且最优选非常高严紧条件下,与以下杂交(i)SEQIDNO:1或SEQIDNO:3的成熟多肽编码序列,(ii)包含于SEQIDNO:1或SEQIDNO3的成熟多肽编码序列中的cDNA序列,(iii)⑴或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。SEQIDNO:1或SEQIDNO3的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有纤维素分解增强活性的多肽片段。在一个优选的方面,所述互补链是SEQIDNO:1或SEQIDNO:3的成熟多肽编码序列的全长互补链。SEQIDNO:1或SEQIDNO3的核苷酸序列或其亚序列,以及SEQIDNO2或SEQIDNO:4的氨基酸序列或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属和种的菌株鉴定和克隆编码具有纤维素分解增强活性的多肽的DNA。具体而言,根据标准的Southern印迹方法,可将这些探针用于与感兴趣的属或种的基因组或cDNA杂交,以鉴定和从其中分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少14,优选至少25,更优选至少35,并且最优选至少70个核苷酸。然而,优选所述核酸探针是至少100个核苷酸长度。例如,所述核酸探针的长度可为至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可以使用更长的探针,例如,长度是至少600个核苷酸,至少优选至少700个核苷酸,更优选至少800个核苷酸,或最优选至少900个核苷酸的核酸探针。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。将这些探针包含于本发明中。因而,可从由这些其它生物体制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码具有纤维素分解增强活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它生物体的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQIDNO:1或SEQIDNO:3或其亚序列同源的克隆或DNA,将所述载体材料优选用在Sounthern印迹中。就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQIDNO1或SEQIDNO3的成熟多肽编码序列;包含于SEQIDNO:1或SEQIDNO3的成熟多肽编码序列中的cDNA序列;其全长互补链;或它们的亚序列。可使用例如X射线片(X-rayfilm)检测在这些条件下与核酸探针杂交的分子。在一个优选的方面,核酸探针是SEQIDNO:1的成熟多肽编码序列。在另一个优选方面,核酸探针是SEQIDNO:1的核苷酸52至921。在另一个优选方面,核酸探针是编码SEQIDNO:2的多肽的多核苷酸序列,或其亚序列。在另一个优选方面,核酸探针是SEQIDNO:1。在另一个优选方面,核酸探针是包含在大肠杆菌(E.coli)NRRLB-50083中的质粒pSMail90中含有的多核苷酸序列,其中所述其多核苷酸序列编码具有纤维素分解增强活性的多肽。在另一个优选方面,核酸探针是包含在大肠杆菌NRRLB-50083中的质粒pSMail90中含有的成熟多肽编码区。在另一个优选的方面,核酸探针是SEQIDNO:3的成熟多肽编码序列。在另一个优选方面,核酸探针是SEQIDNO:3的核苷酸46至851。在另一个优选方面,核酸探针是编码SEQIDNO:4的多肽的多核苷酸序列,或其亚序列。在另一个优选方面,核酸探针是SEQIDNO:3。在另一个优选方面,核酸探针是包含在大肠杆菌NRRLB-50085中的质粒pSMail92中含有的多核苷酸序列,其中所述其多核苷酸序列编码具有纤维素分解增强活性的多肽。在另一个优选方面,核酸探针是包含在大肠杆菌NRRLB-50085中的质粒pSMail92中含有的成熟多肽编码区。对于长度至少100个核苷酸的长探针,将非常低至非常高的严紧条件定义为在42°C,在5XSSPE、0.3%SDS、200yg/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严紧性为25%的甲酰胺、对于中和中-高严紧性为35%的甲酰胺、或对于高和非常高严紧性为50%的甲酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。对于长度为至少100个核苷酸的长探针,使用2XSSC、0.2%SDS优选至少在450C(非常低严紧性),更优选至少在50°C(低严紧性),更优选至少在55°C(中严紧性),更优选至少在60°C(中-高严紧性),甚至更优选至少在65°C(高严紧性),并且最优选至少在70°C(非常高严紧性)将载体材料最终洗涤三次,每次15分钟。对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严紧条件定义为在比牛艮据Bolton禾口McCarthy计算法(1962,ProceedingsoftheNationalAcademyofSciencesUSA481390)得出的Tm低大约5°C至大约10°C,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,1XDenhardt溶液,ImM焦磷酸钠(sodiumpyrophosphate),ImM舞酸二fiil^l(sodiummonobasicphosphate),0.ImMATP禾口0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小时。对于长度大约15个核苷酸至大约70个核苷酸的短探针,将所述载体材料在6XSSC加0.1%SDS中洗涤一次15分钟,并用6XSSC在比计算的Tm低5°C至10°C的温度洗涤两次,每次15分钟。在第三个方面,本发明涉及由包含核苷酸序列或由核苷酸序列组成的多核苷酸编码的分离的多肽,所述核苷酸序列与SEQIDNO:1或SEQIDNO3的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,至少97%,至少98%,或者至少99%的同一性程度,其编码具有纤维素分解增强活性的多肽。参见本文的多核苷酸部分。在第四个方面,本发明涉及SEQIDNO2或SEQIDNO4的成熟多肽或其同源序列的包含取代、缺失和/或插入一个或多个(数个)氨基酸的人工变体。优选地,氨基酸改变对性质是较不重要的(ofaminornature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)或结合域(bindingdomain)。保守取代的实例是在以下组之内碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specificactivity)的氨基酸取代是本领域已知的,并且由例如H.Neurath和R.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu禾口Asp/Gly。除了20个基本氨基酸,非基本氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上能够获得的,包括六氢吡啶羧酸(pipecolicacid)、噻唑烧羧酸(thiazolidinecarboxylicacid)、脱氢脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。可供选择的是,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适PH等。能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science244:1081_1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的生物活性(即,纤维素分解增强活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699_4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来测定。参见例如deVos等,1992,Science255306-312;Smith等,1992,J.Mol.Biol.224:899_904;Wlodaver等,1992,FEBSLett.30959-64。必需氨基酸的身份(identity)也能够从与多肽的同一性分析来推断,所述多肽与根据本发明的多肽相关。能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,例如那些由Reidhaar-Olson禾ΠSauer,1988,Science241:53_57;Bowie禾ΠSauer,1989,Proc.Natl.Acad.Sci.USA86:2152_2156;WO95/17413;或W095/22625公开的那些方法来进行并测试单个或多个氨基酸取代。能够使用的其它方法包括易错PCR、噬菌体展示(例如,Lowman等,1991,Biochem.3010832-10837;美国专利No.5,223,409;WO92/06204)和区域定向的诱变(Derbyshire等,1986,Gene46145;Ner等,1988,DNA7127)。诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多肽。SEQIDNO2或SEQIDNO4的成熟多肽的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。具有纤维素分解增强活性的多肽的来源本发明的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思是核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。在一个优选的方面,获得自给定来源的多肽是胞外分泌的。本发明具有纤维素分解增强活性的多肽可以是细菌多肽。例如,所述多肽可以是革兰氏阳性细菌多肽例如芽孢杆菌属(Bacillus)、链球菌属(Str印tococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳酸菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或海洋芽孢杆菌属(Oceanobacillus)多肽,所述多肽具有纤维素分解增强活性;或革兰氏阴性细菌多肽,如大肠杆菌(E.coli)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)ffifflifM(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)>iMlfliiM(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)属多肽,其具有纤维素分解增强活性。在一个优选方面,所述多肽是具有纤维素分解增强活性的嗜碱芽孢杆菌(Bacillusalkalophilus)、!军定^1Ur包!f胃(Bacillusamyloliquefaciens)菌(Bacillusbrevis)、环状芽孢杆菌(Bacilluscirculans)、克劳氏芽孢杆菌(Bacillusclausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillusfirmus)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacilluslentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillusmegaterium)、短小芽孢杆菌(Bacilluspumilus)、嗜热月旨肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌(Bacillussubtilis)或苏云金芽孢杆菌(Bacillusthuringiensis)多肽。在另一个优选的方面,所述多肽是具有纤维素分解增强活性的似马链球菌(Streptococcusequisimilis)、酉良月农链球菌(Streptococcuspyogenes)、乳房链球菌(Streptococcusuberis)或马链球菌兽痕亚禾中(Streptococcusequisubsp.Zooepidemicus)多月太。在另一个优选的方面,所述多肽是具有纤维素分解增强活性的不产色链霉菌(Streptomycesachromogenes)、除虫链霉菌(Streptomycesavermitilis)、天蓝链霉菌(Streptomycescoelicolor)、灰色链霉菌(Streptomycesgriseus)或浅青紫链霉菌(Streptomyceslividans)多月太。本发明具有纤维素分解增强活性的多肽也可以是真菌多肽,并且更优选酵母多肽如念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽,其具有纤维素分解增强活性;或更优选丝状真菌多肽如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟赌菌属(Ceriporiopsis)、毛_壳属(Chaetomidium)、金抱子菌属(Chrysosporium)、Claviceps、Cochliobolus、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium,镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)>ΜM(Lentinula)>Leptospaeria>^cifelifM(Magnaporthe)>Melanocarpus>多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimasix)、脉抱菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、包脚菇属(Volvariella)或炭角菌属(Xylaria)多肽,其具有纤维素分解增强活性。在一个优选的方面,所述多肽是具有纤维素分解增强活性的卡尔酵母(Saccharomycescarlsbergensis)、酉良酒酵母(Saccharomycescerevisiae)、糖化酵16母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多月太。在另一个优选的方面,所述多肽是具有纤维素分解增强活性的解纤维枝顶孢霉(Acremoniumcellulolyticus)、棘孢曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、烟曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillusfoetidus)、曰本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、热带金抱子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、租金抱子菌(Chrysosporiumpannicola)、ChrysosporiumqueenslandicumΛChrysosporiumzonatum、杆抱状德抱(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、库威,廉抱(Fusariumcrookwellense)、大刀,廉抱(Fusariumculmorum)、禾本禾斗德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、异抱德抱(Fusariumheterosporum)、合欢木德抱(Fusariumnegundi)、尖德抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉红德抱(Fusariumroseum)、接骨木德抱(Fusariumsambucinum)、肤色德抱(Fusariumsarcochroum)、拟分枝抱德抱(Fusariumsporotrichioides)、硫色,廉抱(Fusariumsulphureum)、圆德抱(Fusariumtorulosum)、拟丝抱,廉抱(Fusariumtrichothecioides)、壤片德抱(Fusariumvenenatum)、灰腐质霉(Humicolagrisea)、特异腐质毒(Humicolainsolens)、疏棉状腐质毒(Humicolalanuginosa)、白奉巴齿菌(Irpexlacteus)、米黑毛霉Mucormiehei)、嗜热毁丝霉、粗糙脉孢菌(Neurosporacrassa)、绳状青霉(Penicilliumfuniculosum)、产紫青霉(Penicilliumpurpurogenum)、黄抱平革菌(Phanerochaetechrysosporium)、哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或绿色木霉(Trichodermaviride)多月太。在另外的优选方面,所述多肽是具有纤维素分解增强活性的黄褐毁丝霉(Myceliophthorahinnulea)、黄毁丝霉(Myceliophthoralutea)、嗜热毁丝霉或绵毛毁丝M(Myceliophthoravellerea)多月太。在更优选的方面,所述多肽是具有纤维素分解增强活性的嗜热毁丝霉(Myceliophthorathermophila)多肽。在一个最优选的方面,所述多肽是具有纤维素分解增强活性的嗜热毁丝霉CBS202.75多肽,例如包含SEQIDNO:2或SEQIDNO:4的成熟多肽的多肽。可理解的是对于前述的种,本发明包含完全和不完全阶段(perfectandimperfectstates),和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域熟练技术人员将容易地识别适合的等同物的同一性。这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和细胞培养物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌种保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就能够使用本领域普通技术人员熟知的技术将所述多核苷酸分离或克隆(参见,例如,Sambrook等,1989,见上文)。本发明的多肽还包括融合多肽或可切割的融合多肽,其中将另外的多肽融合到所述多肽或其片段的N末端或C末端。通过将编码另一个多肽的核苷酸序列(或其部分)融合于本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的控制下。融合多肽还可以包括切割位点。一旦分泌了融合多肽,就切割所述位点,从融合蛋白质释放具有内切葡聚糖酶活性的多肽。切割位点的实例包括,但不限于,编码二肽Lys-Arg的Kex2位点(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568_76;Svetina,2000,J.Biotechnol.76245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488_3493;Ward等,1995,Biotechnology13:498_503;和Contreras等,1991,Biotechnology9:378_381);Ile_(Glu或Asp)-Gly-Arg位点,其在精氨酸残基后通过FactorXa蛋白酶切割(Eaton等,1986,Biochem.25:505_512);Asp-Asp-Asp-Asp-Lys位点,其在赖氨酸后通过肠激酶切割(Collins-Racie等,1995,Biotechnology13:982_987);His-Tyr-Glu位点或His-Tyr-Asp位点,其通过GenenaseI切割(Carter等,1989,ProteinsStructure,Function,andGenetics6:240_248);Leu-Val-Pro-Arg-Gly-Ser位点,其在Arg后通过凝血酶切割(Stevens,2003,DrugDiscoveryWorld435-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点,其在Gln后通过TEV蛋白酶切割(Stevens,2003,见上文);和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位点,其在Gln后通过基因工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,见上文)。多核苷酸本发明还涉及分离的多核苷酸,其包含编码本发明具有纤维素分解增强活性的多肽的核苷酸序列,或由编码本发明具有纤维素分解增强活性的多肽的核苷酸序列组成。在一个优选的方面,核苷酸序列包含SEQIDNO1或由SEQIDNO1组成。在另一个更优选的方面,核苷酸序列包含大肠杆菌NRRLB-50083中所含质粒pSMail90中所含的序列,或由大肠杆菌NRRLB-50083中所含质粒pSMail90中所含的序列组成。在另一个优选方面,核苷酸序列包含SEQIDNO1的成熟多肽编码序列或由SEQIDNO=I的成熟多肽编码序列组成。在另一个优选方面,核苷酸序列包含SEQIDNO:1的核苷酸52至921或由SEQIDNO1的核苷酸52至921组成。在另一个更优选的方面,核苷酸序列包含大肠杆菌NRRLB-50083中所含质粒pSMail90中含有的成熟多肽编码序列或由大肠杆菌NRRLB-50083中所含质粒pSMail90中含有的成熟多肽编码序列组成。在一个优选的方面,核苷酸序列包含SEQIDNO3或由SEQIDNO3组成。在另一个更优选的方面,核苷酸序列包含大肠杆菌NRRLB-50085中所含质粒pSMail92中含有的序列,或由大肠杆菌NRRLB-50085中所含质粒pSMail92中含有的序列组成。在另一个优选方面,核苷酸序列包含SEQIDNO3的成熟多肽编码序列或由SEQIDNO3的成熟多肽编码序列组成。在另一个优选方面,核苷酸序列包含SEQIDNO:3的核苷酸46至851或由SEQIDNO3的核苷酸46至851组成。在另一个更优选的方面,核苷酸序列包含大肠杆菌NRRLB-50085中所含质粒pSMail92中含有的成熟多肽编码序列或由大肠杆菌NRRLB-50085中所含质粒pSMail92中含有的成熟多肽编码序列组成。本发明还包含编码多肽的核苷酸序列,所述多肽包含SEQIDNO:2或SEQIDNO4的氨基酸序列或其成熟多肽,或由SEQIDNO:2或SEQIDNO:4的氨基酸序列或其成熟多肽组成;由于遗传密码的简并性,所述核苷酸序列分别不同于SEQIDNO:1或SEQIDNO3或其成熟多肽编码序列。本发明还涉及SEQIDNO:1或SEQIDNO:3的亚序列,所述亚序列分别编码具有纤维素分解增强活性的SEQIDNO2或SEQIDNO4的片段。本发明还涉及突变多核苷酸,所述突变多核苷酸在SEQIDNO:1或SEQIDNO3的成熟多肽编码序列中包含至少一个突变,或由在SEQIDNO1或SEQIDNO3的成熟多肽编码序列中具有至少一个突变的核苷酸组成,其中所述突变核苷酸序列分别编码SEQIDNO2或SEQIDNO4的成熟多肽。用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆本发明的多核苷酸。参见,例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活化转录(ligatedactivatedtranscription;LAT)和基于核苷酸序列的扩增(NASBA)。可以从毁丝霉属菌株,或其它或相关生物体克隆多核苷酸,并且因此可以是例如所述核苷酸序列的多肽编码区的等位基因变体或种变体(speciesvariant)。本发明还涉及包含核苷酸序列或由核苷酸序列组成的分离的多核苷酸,所述核苷酸序列与SEQIDNO:1或SEQIDNO:3的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,至少97%,至少98%,或者至少99%同一性的同一性程度,其编码具有纤维素分解增强活性的多肽。修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可为必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适PH等方面不同的人工变体。可以在作为SEQIDNO1或SEQIDNO3的多肽编码序列存在的核苷酸序列,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建变体序列所述取代不产生由核苷酸序列编码的多肽的另外的氨基酸序列,但是符合意欲产生酶的宿主生物体的密码子选择;或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述,参见,例如,Ford等,1991,ProteinExpressionandPurification2:95_107。对于本领域技术人员显而易见的是,这些取代能够在对于分子功能重要的区域之外进行,并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性关键的并且因此优选不进行取代的氨基酸残基,可以根据本领域公知的方法,例如定位诱变或丙氨酸分区诱变法(参见,例如,Cunningham和Wells,1989,见上文)来鉴定。在后一技术中,将突变引入到分子中的每个荷正电的残基处,并且测试所得突变分子的纤维素分解增强活性,以鉴定对于所述分子的活性关键的氨基酸残基。底物_酶相互作用的位点也能够通过分析三维结构测定,通过如核磁共振分析、晶体学或光亲和标记这样的技术来测定(参见,例如,deVos等,1992,见上文;Smith等,1992,见上文;Wlodaver等,1992,见上文)。本发明还涉及编码本发明多肽的分离的多核苷酸,所述分离的多核苷酸在非常低严紧条件下,优选低严紧条件,更优选中等严紧条件,更优选中_高严紧条件,甚至更优选高严紧条件,并且最优选非常高的严紧条件下,与以下序列杂交(i)SEQIDNO:1或SEQIDNO:3的成熟多肽编码序列,(ii)包含于SEQIDNO:1或SEQIDNO:3的成熟多肽编码序列中的cDNA序列,或(iii)⑴或(ii)的全长互补链;或它们的等位变体和亚序列(Sambrook等,1989,见上文),如本文所定义的。在一个优选的方面,互补链是SEQIDNO:1或SEQIDNO3的成熟多肽编码序列的全长互补链。本发明还涉及分离的多核苷酸,所述分离的多核苷酸通过以下方法获得(a)在非常低、低、中、中-高、高或非常高严紧条件下,将DNA群体与以下杂交(i)SEQIDNO=I或SEQIDNO3的成熟多肽编码序列,(ii)包含于SEQIDNO:1或SEQIDNO3的成熟多肽编码序列中的cDNA序列,或(iii)⑴或(ii)的全长互补链;和(b)分离杂交的多核苷酸,其编码具有纤维素分解增强活性的多肽。在一个优选的方面,互补链是SEQIDN0:1或SEQIDNO:3的成熟多肽编码序列的全长互补链。核酸构建体本发明还涉及包含本发明的分离的多核苷酸的核酸构建体,所述分离的多核苷酸与一个或多个(数个)调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。可以用许多方式操作编码本发明多肽的分离的多核苷酸以提供多肽的表达。依赖于表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。调控序列可以是适当的启动子序列,其是由用于表达编码本发明多肽的多核苷酸的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。用于指导本发明的核酸构建体转录,特别是在细菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子大肠杆菌Iac操纵子、天蓝链霉菌琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽孢杆菌α_淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727-3731),\)JsRtac(DeBoerφ,1983,ProceedingsoftheNationalAcademyofSciencesUSA80:21—25)。另外的启动子在〃Usefulproteinsfromrecombinantbacteria"于ScientificAmerican,1980,242:74_94中;和在Sambrook等,1989,见上文中描述。用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(W000/56900)、镶片镰孢Daria(WC)00/56900)、镶片镰孢Quirm(W000/56900)、尖镰孢胰蛋白酶样蛋白酶(W096/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变的、截短的和杂合的启动子。在酵母宿主中,有用的启动子从如下酶的基因获得酿酒酵母烯醇化酶(ΕΝ0-1)、酿酒酵母半乳糖激酶(GALl)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUPl)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast8:423_488描述。调控序列也可以是合适的转录终止子序列,是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。对于酵母宿主细胞优选的终止子从如下酶的基因获得酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYCl)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上文描述。调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。对于酵母宿主细胞合适的前导序列从如下酶的基因获得酿酒酵母烯醇化酶(ΕΝ0-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。调控序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3,末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,MolecularCellularBiology15:5983_5990描述。调控序列还可以是信号肽编码区,其编码与多肽的氨基末端相连的氨基酸序列,并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码区,其与编码分泌多肽的编码区片段一起天然地连接在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列异源的信号肽编码区。异源信号肽编码区在编码序列不天然地含有信号肽编码区时可为必需的。或者,外源信号肽编码区可以简单地取代天然信号肽编码区以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径(即,分泌至培养基中)的任何信号肽编码区可在本发明中使用。对于细菌宿主细胞有效的信号肽编码区是从如下酶的基因获得的信号肽编码区芽孢杆菌属NCIB11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,MicrobiologicalReviews57109-137描述。对于丝状真菌宿主细胞有效的信号肽编码区是从如下酶的基因获得的信号肽编码区米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V和疏棉状腐质霉脂肪酶。对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码区由Romanos等,1992,见上文描述。在一个优选的方面,信号肽包含SEQIDNO:2的氨基酸1至17,或者由SEQIDΝ0:2的氨基酸1至17组成。在另一个优选方面,信号肽编码序列包含SEQIDNO1的核苷酸1至51,或者由SEQIDNO1的核苷酸1至51组成。在另一个优选方面,信号肽包含SEQIDNO:4的氨基酸1至15,或者由SEQIDN0:4的氨基酸1至15组成。在另一个优选方面,信号肽编码序列包含SEQIDNO3的核苷酸1至45,或者由SEQIDNO3的核苷酸1至45组成。调控序列还可以是前肽编码区,其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolyp印tide)(或在某些情况下称为酶原(zymogen))0前多肽通常是无活性的并且能够通过前肽的催化或自催化切割从前多肽转化为成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(W095/33836)的基因获得前肽编码区。当信号肽和前肽区二者均出现在多肽的氨基末端时,将前肽区置于紧接着(nextto)多肽氨基末端,并且将信号肽区置于紧接着前肽区的氨基末端。同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中,可以使用ADH2系统或GALl系统。在丝状真菌中,可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(withheavymetal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列将与调节序列可操作地连接。表达载体本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。本文所述的多种核酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个(数个)方便的限制位点以允许在这些位点插入或取代编码多肽的核苷酸序列。可供选择的是,可以通过在适当的用于表达的载体中插入包含所述序列的核苷酸序列或核酸构建体来表达本发明的核苷酸序列。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的表达调控序列可操作地连接。重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(totalDNA),或可以使用转座子(transposon)。本发明的载体优选地含有一个或多个(数个)选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophytoauxotrophs)等。细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitratereductase)、pyrG(乳清酸核苷-5,-磷酸脱羧酶)(orotidine-5,-phosphatedecarboxylase),sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilatesynthase))以及它们的等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因禾口吸水链霄菌(Streptomyceshygroscopicus)的bar基因。本发明的载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应优选含有足够数量的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的目标序列具有高度同一性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序23列同源。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(r印licator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体体内复制的核苷酸序列。细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUBllO、pE194、pTA1060和ρΑΜβ1的复制起点。用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARSl,ARS4,ARSl和CEN3的组合,和ARS4和CEN6的组合。在丝状真菌细胞中有用的复制起点的实例是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsResearch159163-9175;WO00/24883)。分离AMAl基因和构建包含该基因的质粒或载体能够根据公开于WO00/24883中的方法完成。可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加基因产物的产生。多核苷酸拷贝数的增加可通过如下方法获得将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂(selectableagent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,且由此含有多核苷酸的额外拷贝的细胞。用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,1989,见上文)。宿主细胞本发明还涉及重组宿主细胞,其包含本发明的分离的多核苷酸,可有利地用于多肽的重组生产中。将包含本发明多核苷酸的载体导入宿主细胞,使载体如前所述作为染色体整体或者作为自复制的染色体外载体维持。术语“宿主细胞”包括母体细胞的任何后代,其由于复制过程中发生的突变而不同于母体细胞。宿主细胞的选择将在很大程度上依赖于编码多核苷酸的基因及其来源。宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞,例如,原核或真核细胞。原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于,芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳酸菌属、乳球菌属、梭菌属、地芽孢杆菌属和海洋芽孢杆菌属。革兰氏阴性细菌包括但不限于,大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属和脲原体属。细菌宿主细胞可以是任何芽孢杆菌属细胞。在本发明的实施中有用的芽孢杆菌属细胞包括但不限于,嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。在一个优选的方面,细菌宿主细胞是解淀粉芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在更优选的方面,细菌宿主细胞是解淀粉芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是克劳氏芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是地衣芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是枯草芽孢杆菌细胞。细菌宿主细胞还可以是任何链球菌属细胞。在本发明的实施中有用的链球菌属细胞包括但不限于,似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种细胞。在一个优选的方面,细菌宿主细胞是似马链球菌细胞。在另一个优选的方面,细菌宿主细胞是酿脓链球菌细胞。在另一个优选的方面,细菌宿主细胞是乳房链球菌细胞。在另一个优选的方面,细菌宿主细胞是马链球菌兽瘟亚种细胞。细菌宿主细胞还可以是任何链霉菌属细胞。在本发明的实施中有用的链霉菌属细胞包括但不限于,不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌细胞。在一个优选的方面,细菌宿主细胞是不产色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是除虫链霉菌细胞。在另一个优选的方面,细菌宿主细胞是天蓝链霉菌细胞。在另一个优选的方面,细菌宿主细胞是灰色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是浅青紫链霉菌细胞。可通过如下方法实现将DNA引入到芽孢杆菌属细胞例如原生质体转化(参见,例如,Chang和Cohen,1979,MolecularGeneralGenetics168:111_115),使用感受态细胞(参见,例如,Young禾口Spizizen,1961,JournalofBacteriology81:823_829或Dubnau和Davidooff-Abelson,1971,JournalofMolecularBiology56:209_221),电穿孔(参见,例如,Shigekawa和Dower,1988,Biotechniques6:742_751)或接合(参见,例如,Koehler和Thorne,1987,JournalofBacteriology169:5771—5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞例如原生质体转化(参见,例如,Hanahan,1983,J.Mol.Biol.166557-580)或电穿孔(参见,例如,Dower等,1988,NucleicAcidsRes.166127-6145)。可通过如下方法实现将DNA引入到链霉菌属细胞例如原生质体转化和电穿孔(参见,例如,Gong等,2004,FoliaMicrobiol.(Praha)49:399_405),接合(参见,例如,Mazodier等,1989,J.Bacteriol.171:3583_3585),或转导(参见,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98=6289-6294)。可通过如下方法实现将DNA引入到假单胞菌属细胞例如电穿孔(参见,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(参见,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51_57)。可通过如下方法实现将DNA引入到链球菌属细胞例如天然感受态(naturalcompetence)(参见,例如,Perry和Kuramitsu,1981,Infect.Immun.321295-1297),原生质体转化(参见,例如,Catt和Jollick,1991,Microbios.68189-2070),电穿孔(参见,例如,Buckley等,1999,Appl.Environ.Microbiol.653800-3804)或接合(参见,例如,Clewell,1981,Microbiol.Rev.45409-436)。然而,可以使用本领域已知的将DNA引入宿主细胞的任何方法。宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。在一个优选的方面,宿主细胞是真菌细胞。“真菌”用在本文包括以下门子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)禾口接合菌门(Zygomycota)(如由Hawksworth等,于AinsworthandBisby'sDictionaryofTheFungi,第8版,1995,CABInternational,UniversityPress,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用),和所有有丝分裂孢子真菌(mitosporicfungi)(Hawksworth等,1995,见上文)。在一个更优选的方面,真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenousyeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenousyeast)禾口属于半知菌类(FungiImperfecti)(芽抱纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,将酵母定义为如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.,禾口Davenport,R.R.编,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。在一个甚至更加优选的方面,酵母宿主细胞是念珠菌属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞。在最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyceslactis)细胞。在另一个最优选的方面,酵母宿主细胞是解脂西洋蓍霉(Yarrowialipolytica)细胞。在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。在甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。在最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个最优选方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在另一个最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkanderaadusta)>zFifaIif(Ceriporiopsisaneirina)>zFifa|1>Ceriporiopsiscaregiea>Ceriporiopsisgilvescens>Ceriporiopsispannocinta>Ceriporiopsisrivulosa、Ceriporiopsissubrufa、虫拟M菌(Ceriporiopsissubvermispora)、B誉角质金包子菌、Chrysosporiumlucknowense、热带金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、|£金包子菌、Chrysosporiumqueenslandicum>Chrysosporiumzonatum、灰盖鬼伞(Coprinuscinereus)、毛革盖菌(Coriolushirsutus)、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌(Phanerochaetechrysosporium),辐射射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotuseryngii)、土生梭孢霉、长绒毛栓菌(Trametesvillosa)、变色栓菌(Trametesversicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023和Yelton等,1984,ProceedingsoftheNationalAcademyofSciencesUSA811470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene78:147_156和WO96/00787描述。可以使用由如下文献描述的方法转化酵母=Becker和Guarente,于Abelson,J.N.禾口Simon,Μ.I.编,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,pp182—187,AcademicPress,Inc.,NewYork;Ito等,1983,JournalofBacteriology153:163;禾口Hinnen等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:1920o产生方法本发明还涉及用于产生本发明多肽的方法,其包括(a)在有益于产生多肽的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。在一个优选的方面,所述细胞是毁丝霉属的细胞。在更优选的方面,所述细胞是嗜热毁丝霉。在最优选的方面,所述细胞是嗜热毁丝霉CBS202.75。在另一个最优选的方面,所述细胞是嗜热毁丝霉CBS117.65。本发明还涉及用于产生本发明的多肽的方法,其包括(a)如本文所述,在有益于产生多肽的条件下培养重组宿主细胞;和(b)回收所述多肽。本发明还涉及用于产生本发明的多肽的方法,包括(a)在有益于产生多肽的条件下培养重组宿主细胞,其中所述宿主细胞包含突变核苷酸序列,其在SEQIDNO:1或SEQIDNO:3的成熟多肽编码序列中具有至少一个突变,其中所述突变核苷酸序列编码多肽,该多肽包含SEQIDNO2或SEQIDNO4的成熟多肽或由SEQIDNO2或SEQIDNO4的成熟多肽组成,和(b)回收所述多肽。在本发明的产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌到培养基中,其能够从细胞裂解物(Iysate)回收。可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzymeassay)可用于测定如本文所述的多肽的活性。所得多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。本发明的多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(pr印arative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,ProteinPurification,J.-C.Janson禾口LarsRyden,editors,VCHPublishers,NewYork,1989)。植物本发明还涉及植物,例如,转基因植物、植物部分或植物细胞,其包含分离的多核苷酸,所述多核苷酸编码本发明具有纤维素分解增强活性的多肽,从而以可回收的量表达和产生所述多肽。多肽可从植物或植物部分回收。或者,同样可以将含有该重组多肽的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性质(rheologicalproperties),或用于破坏抗营养因子。转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses),如草地早熟禾(meadowgrass)(蓝草(bluegrass),早熟禾属(Poa));饲用牧草(foragegrass)如羊茅属(Festuca)、黑麦草属(Lolium);寒地型牧草(temperategrass),如Agrostis(剪股颖属);和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜籽(rapeseed)和紧密相关的模型生物体拟南芥(Arabidopsisthaliana)。植物部分的实例是茎(stem)、愈伤组织(calIus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vasculartissue)、分生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质夕卜体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)禾口细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如分离以促进本发明的应用的具体组织和细胞也被认为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seedcoat)。同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的子代。表达本发明多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下方法构建所述植物或植物细胞将编码本发明多肽的一个或多个(几个)表达构建体并入植物宿主基因组或叶绿体基因组,并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。表达构建体便利地是包含编码本发明多肽的多核苷酸的核酸构建体,所述多核苷酸与在选择的植物或植物部分中表达该多核苷酸序列所需的适当的调节序列可操作地连接。此外,表达构建体可以包含对于鉴定宿主细胞有用的选择性标记,在所述宿主细胞中整合了表达构建体和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及如何表达多肽而确定。例如,编码本发明多肽的基因28的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如Tague等,1988,PlantPhysiology86:506所述。对于组成性表达,可以使用35S_CaMV、玉米泛素1和稻肌动蛋白1启动子(Franck等,1980,Cell21:285_294,Christensen等,1992,PlantMo.Biol.18:675_689;Zhang等,1991,PlantCell3:1155_1165)。器官特异性启动子可以是例如来自贮藏库组织(storagesinktissue)例如种子、马铃薯块莲和果实的启动子(Edwards&Coruzzi,1990,Ann.Rev.Genet.24:275_303),或来自代谢库组织(metabolicsinktissue)例如分生组织的启动子(Ito等,1994,PlantMol.Biol.24:863_878),种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,PlantandCellPhysiology39:885_889),来自豆球蛋白(Iegumin)B4和蚕豆(Viciafaba)的未知的种子蛋白基因的蚕豆启动子(Conrad等,1998,JournalofPlantPhysiology152:708_711)、来自种子油体蛋白(oilbodyprotein)的启动子(Chen等,1998,PlantandCellPhysiology39:935_941),来自欧洲油菜(Brassicanapus)的贮藏蛋白napA启动子,或本
技术领域
公知的任何其他种子特异性的启动子,例如,在W091/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子(Kyozuka等,1993,PlantPhysiology102:991_1000),小球藻病毒(chlorellavirus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(Mitra和Higgins,1994,PlantMolecularBiology26:85_93),或来自稻的aldP基因启动子(Kagaya等,1995,Molecularandgeneralgenetics248:668_674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等,1993,PlantMolecularBiology22:573_588)。同样地,所述启动子可通过非生物的处理诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源施加的激活所述启动子的物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脱落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金属。启动子增强子元件也可以用于实现本发明多肽在植物中的较高表达。例如,启动子增强子元件可以是内含子,其置于启动子和编码本发明多肽的核苷酸序列之间。例如Xu等,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science2441293;Potrykus,1990,Bio/Technology8535;Shimamoto等,1989,Nature338274)。目前,根癌土壤杆菌(Agrobacteriumtumefaciens)介导的基因转移(genetransfer),是产生转基因双子叶植物的优选方法(为了参考,见Hooykas和Schilperoort,1992,PlantMolecularBiology19:15_38),而且它也可以用于转化单子叶植物,虽然对于这些植物其他的转化方法是常用的。目前,产生转基因单子叶植物的优选的方法,是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryoniccalli)或发育中的胚(developingembryos)(Christou,1992,PlantJournal2275-281;Shimamoto,1994,CurrentOpinionBiotechnology5158-162;Vasilφ,1992,Bio/Technology1029667-674)。转化单子叶植物的可供选择的方法是基于原生质体转化,如由Omirulleh等,1993,PlantMolecularBiology21:415_428所描述的。转化之后,根据本领域熟知的方法选择具有并入的表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因例如,使用带有两个独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。本发明还涉及用于产生本发明多肽的方法,其包括(a)在有益于产生多肽的条件下培养包含多核苷酸的转基因植物或植物细胞,所述多核苷酸编码本发明具有纤维素分解增强活性的多肽;和(b)回收所述多肽。去除或减少纤维素分解增强活性本发明还涉及用于产生亲本细胞突变体的方法,其包括破坏或缺失编码本发明的多肽的多核苷酸序列或其部分,所述方法导致在相同条件下培养时,与亲本细胞相比突变的细胞产生较少的所述多肽。可以使用本领域熟知的方法(例如,插入、破坏、替代或缺失)通过减少或消除编码本发明多肽的核苷酸序列的表达来构建突变细胞。在一个优选的方面,所述核苷酸序列是失活的。待修饰或失活的核苷酸序列可以是,例如,编码区或其对活性关键的部分,或表达编码区所需的调节元件。这种调节或调控序列的实例可以是启动子序列或其功能部分,即,足以影响核苷酸序列表达的部分。用于可能的修饰的其它调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录激活子。可以通过向亲本细胞施以诱变,并且选择其中已将所述核苷酸序列的表达减少或消除的突变细胞来进行核苷酸序列的修饰或失活。诱变可能是特异性的或随机的,可以通过例如使用合适的物理或化学诱变剂进行,通过使用合适的寡核苷酸进行,或通过将所述DNA序列进行PCR产生的诱变。此外,可以通过使用这些诱变剂的任何组合来进行诱变。适合于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、0_甲基羟胺、亚硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。当使用这些试剂时,通常通过如下方法来进行所述诱变在合适条件下存在优选的诱变剂时温育待诱变的亲本细胞,并筛选和/或选择显示基因表达减少的或无基因表达的突变体细胞。通过导入、取代或去除基因中的一个或多个(数个)核苷酸或其转录或翻译所需的调控元件可以实现所述核苷酸序列的修饰或失活。例如,可以插入或去除核苷酸从而导致引入终止密码子,去除起始密码子,或改变开放阅读框。按照本领域已知的方法通过定位诱变或PCR产生的诱变可以实现这种修饰或失活。尽管在理论上所述修饰可以在体内进行,即,直接在表达待修饰核苷酸序列的细胞上进行,但优选如下面所示例的那样在体外进行所述修饰。消除或减少核苷酸序列通过细胞表达的便利方式的例子是基于基因取代,基因缺失,或基因破坏的技术。例如,在基因破坏方法中,将相应于内源核苷酸序列的核酸序列在体外进行诱变以产生缺陷性的核酸序列,随后将其转化入亲本细胞中以产生缺陷基因。通过同源重组,所述缺陷性核酸序列替代了内源性核苷酸序列。理想的是所述缺陷性核苷酸序列还编码标记,其可用于选择其中核苷酸序列被修饰或破坏的转化子。在特别优选的方面,用可选择的标记(如本文所述的那些)来破坏所述核苷酸序列。或者,可以使用与所述核苷酸序列互补的序列通过确定的反义或RNAi技术来进行所述核苷酸序列的修饰或失活。更具体地,通过导入与所述基因的核苷酸序列互补的序列可以减少或消除所述核苷酸序列通过细胞的表达,所述序列可以在细胞中转录并且能够与细胞中产生的mRNA杂交。由此在允许所述互补反义核苷酸序列与mRNA杂交的条件下,减少或消除翻译的蛋白质的量。本发明进一步涉及亲本细胞的突变体细胞,其包含编码多肽的核苷酸序列或其调控序列的破坏或缺失,这导致与亲本细胞相比突变体细胞产生更少的多肽或不产生多肽。这样生成的多肽缺陷型突变细胞作为表达天然和/或异源多肽的宿主细胞特别有用。所以,本发明进一步涉及生产天然或异源多肽的方法,其包括(a)在有益于生产多肽的条件下培养突变细胞;和(b)回收所述多肽。术语“异源多肽”在本文中定义为对宿主细胞不是天然的多肽,进行了修饰以改变天然序列的天然蛋白,或作为通过重组DNA技术对宿主细胞操作的结果其表达在量上改变的天然蛋白。在另一方面,本发明涉及通过发酵可产生本发明的多肽以及目标蛋白产物的细胞来生产基本上无纤维素分解增强活性的蛋白质产品的方法在发酵之前、之中或发酵完成之后向发酵液(fermentationbroth)中添加有效量的能够抑制纤维素分解增强活性的试剂,从发酵液中回收目标产物,并且任选地将回收的产物进行进一步纯化。在另一方面,本发明涉及如下生产基本上无纤维素分解增强活性的蛋白质产品的方法在允许产物表达的条件下培养细胞,将得到的培养液进行组合的PH和温度处理以基本上减少纤维素分解增强活性,和从发酵液中回收产物。或者,可以将从培养液回收的酶制备物进行组合的PH和温度处理。所述组合的pH和温度处理可任选地与用纤维素分解增强抑制剂处理组合使用。依照本发明的这个方面,可能去除至少60%,优选至少75%,更优选至少85%,还更优选至少95%,并且最优选至少99%的纤维素分解增强活性。可使用此方法获得纤维素分解增强活性的完全去除。组合的pH和温度处理优选在2-4或9-11范围内的pH和至少60_70°C范围内的温度进行一段足够的时间以达到期望的效果,通常30至60分钟是足够的。用于培养和纯化感兴趣的产物的方法可以通过本领域已知的方法进行。本发明用于产生基本上无纤维素分解增强活性的产物的方法在真核多肽,特别是真菌蛋白质例如酶的产生中是特别令人有兴趣的。所述酶可以选自,例如,淀粉分解酶(anxiolyticenzyme)、脂肪分解酶、蛋白水解酶、纤维素分解酶(cellulolyticenzyme)、氧化还原酶或植物细胞壁降解酶。这些酶的实例包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶(chitinase)、角质酶(cutinase)、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖氧化酶、葡糖苷酶、商素过氧化酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转移酶、转谷氨酰胺酶或木聚糖酶。纤维素分解增强-缺陷细胞也可以用于表达在制药上感兴趣的异源蛋白质例如激素、生长因子、受体等。可理解的是术语“真核多肽”不仅包括天然多肽,也包括多肽例如酶,其通过氨基酸取代、缺失或添加或其它这样的修饰而被修饰以增强活性、热稳定性、PH耐受性等。在另外的方面,本发明涉及基本上无纤维素分解增强活性的蛋白质产物,其通过本发明的方法产生。抑制具有纤维素分解增强活性的多肽表达的方法本发明还涉及抑制具有纤维素分解增强活性的多肽在细胞中表达的方法,其包括对细胞施用双链RNA(dsRNA)分子或者在细胞中表达双链RNA(dsRNA)分子,其中dsRNA包含本发明多核苷酸的亚序列。在一个优选的方面,dsRNA长约15、16、17、18、19、20、21、22、23、24、25或更多的双链体核苷酸。dsRNA优选是小干扰RNA(siRNA)或微RNA(miRNA)。在一个优选的方面,dsRNA是用于抑制转录的小干扰RNA(SiRNA)。在另一个优选的方面,dsRNA是用于抑制翻译的小RNA(miRNA)。本发明还涉及用于抑制细胞中多肽表达的这些双链RNA(dsRNA)分子,其包含SEQIDNO:1或SEQIDNO:3的成熟多肽编码序列的部分。本发明不受限于任何特定作用机制,dsRNA能进入细胞,并引起相似或相同序列的单链RNA(SSRNA)的降解,所述RNA包括内源mRNA。当细胞接触dsRNA时,来自同源基因的mRNA选择性地受到称为RNA干扰(RNAi)的过程的降解。本发明的dsRNA可以用于基因沉默疗法。在一个方面,本发明提供使用本发明的dsRNAi选择性地降解RNA的方法。所述过程可以在体外、在活体外(exvivo)或在体内进行。在一个方面,dsRNA分子能够用于产生细胞、器官或动物中的功能缺失突变(loss-of-functionmutation)。制备或使用选择性降解RNA的dsRNA分子的方法在本领域中公知,参见,例如,美国专利No.6,506,559;美国专利No.6,511,824;美国专利No.6,515,109;和美国专利No.6,489,127。组合物本发明还涉及包含本发明的多肽的组合物。优选地,所述组合物富含这种多肽。术语“富含”表示所述组合物的纤维素分解增强活性,例如,以至少1.1的富集因数(enrichmentfactor)增力口。所述组合物可以包含本发明的多肽作为主要酶成分,例如,单成分组合物。或者,所述组合物可以包含多种酶活性,如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶(peptidoglutaminase)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。额外的酶可以通过例如属于以下属或种的微生物产生曲霉属,优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉;镰孢属,优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢;腐质霉属,优选特异腐质霉或疏棉状腐质霉;或木霉属,优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉。32可以依照本领域内已知的方法制备多肽组合物,并且可以是液体或干组合物的形式。例如,所述多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以依照本领域内已知方法将包括于所述组合物中的多肽稳定化。下面给出的是本发明多肽组合物的优选的用途的实例。本发明的多肽组合物的剂量和使用该组合物的其它条件可以基于本领域内已知的方法确定。纤维素材料的加工本发明还涉及降解或转化纤维素材料的方法,其包括在存在本发明的具有纤维素分解增强活性的多肽的情况下,用纤维素分解酶组合物处理纤维素材料。在一个优选方面,所述方法还包括回收已降解或转化的纤维素材料。本发明还涉及产生发酵产物的方法,其包括(a)在存在本发明的具有纤维素分解增强活性的多肽的条件下,用纤维素分解酶组合物糖化纤维素材料;(b)用一种或多种发酵微生物发酵步骤(a)的糖化纤维素材料以产生发酵产物;和(c)从发酵回收发酵产物。本发明还涉及发酵纤维素材料的方法,其包括用一种或多种发酵微生物发酵纤维素材料,其中在存在具有纤维素分解增强活性的多肽的条件下,用纤维素分解酶组合物水解纤维素材料,并且与不存在具有纤维素分解增强活性的多肽相比,具有纤维素分解增强活性的多肽的存在增加纤维素材料的水解。在一个优选的方面,纤维素材料的发酵产生发酵产物。在另一个优选的方面,方法进一步包括从发酵回收发酵产物。包含具有纤维素分解增强活性的多肽的组合物可以是去除或不去除细胞的粗发酵液形式,或是半纯化或纯化的酶制剂形式,或者,组合物可以包含本发明的宿主细胞,所述宿主细胞在使用生物质的发酵方法中作为具有纤维素分解增强活性的多肽的来源。本发明的方法可以用于将纤维素材料糖化成可发酵糖,并且将可发酵糖转化成很多有用的物质,例如,化学品和燃料。从纤维素材料产生期望的发酵产物通常涉及预处理、酶水解(糖化)和发酵。根据本发明的纤维素材料的处理可以使用本领域的常规过程完成。此外,本发明的方法能使用经配置以依照发明操作的任何常规生物质处理设备进行。水解(糖化)和发酵,分别或同时,包括但不限于,分离的水解和发酵(SHF)、同步糖化和发酵(SSF)、同步糖化和共发酵(SSCF)、混合的水解和发酵(HHF)、SHCF(分离的水解和共发酵)、HHCF(混合的水解和共发酵),和直接微生物转化(DMC)。SHF使用分离的处理步骤以首先将木质纤维素酶水解为可发酵糖,例如,葡萄糖,纤维二糖、纤维三糖和戊糖,然后将可发酵糖发酵成为乙醇。在SSF中,木质纤维素的酶水解和糖变为乙醇的发酵在一个步骤中组合(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,于HandbookonBioethanolProductionandUtilization,ffyman,C.E编,Taylor&Francis,Washington,DC,179-212)。SSCF包括多种糖的共发酵(Sheehan,J.,和Himmel,Μ.,1999,Enzymes,energyandtheenvironment:AstrategicperspectiveontheU.S.DepartmentofEnergy'sresearchanddevelopmentactivitiesforbioethanol,Biotechnol.Prog.15=817-827)0HHF在同步糖化和水解步骤之外,还涉及单独的水解步骤,所述步骤可以在同一个反应器中进行。HHF过程中的步骤可以在不同的温度,S卩,高温酶糖化,然后在发酵菌株能够耐受的较低温度进行SSF。DMC在一个或多个步骤中组合了所有三个过程(酶产生、木质纤维素水解和发酵),其中使用相同的生物体产生用于将木质纤维素转化成可发酵糖并将可发酵糖转化成终产物的酶(Lynd,L.R.,ffeimer,P.J.,vanZyl,W.H.,禾口Pretorius,I.S.,2002,Microbialcelluloseutilization!Fundamentalsandbiotechnology,Microbiol.Mol.Biol.Reviews66:506_577)。在本文可以理解的是,本领域中任何已知的方法,包括预处理、酶水解(糖化)、发酵,或它们的组合,可用于实施本发明的方法。常规设备包括补料批式搅拌反应器、批式搅拌反应器、具有超滤的连续流搅拌反应器和/或连续活塞流柱式反应器(FernandadeCastilhosCorazza,FlavioFariadeMoraes,GisellaMariaZanin禾口IvoNeitzel,2003,Optimalcontrolinfed-batchreactorforthecellobiosehydrolysis,ActaScientiarum.Technology25:33_38;Gusakov,A.V.,禾口Sinitsyn,A.P.,1985,Kineticsoftheenzymatichydrolysisofcellulose:1.Amathematicalmodelforabatchreactorprocess,Enz.Microb.Technol.7:346_352)、研磨反应器(Ryu,S.K.,和Lee,J.Μ.,1983,Bioconversionofwastecellulosebyusinganattritionbioreactor,Biotechnol.Bioeng.25:53_65),或者具有由电磁场引起的强烈搅拌的反应器(Gusakov,Α.V.,Sinitsyn,Α.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,0.V.,1996,Enhancementofenzymaticcellulosehydrolysisusinganoveltypeofbioreactorwithintensivestirringinducedbyelectromagneticfield,Appl.Biochem.Biotechnol.56:141-153)。其它反应器类型包括流化床、升流层、固定化和用于水解和/或分解的挤出机型的反应器。预处理。在本发明的方法的实施中,可以使用本领域已知的任何预处理过程破坏植物细胞壁成分。纤维素材料也可以在预处理之前使用本领域中已知的方法进行预浸泡、润湿或调节。常规的预处理包括,但不限于,蒸汽预处理(具有或不具有爆炸)、稀酸预处理、热水预处理、石灰预处理、湿氧化、湿爆炸、氨纤维爆炸、有机溶剂预处理和生物预处理。其它预处理包括超声、电穿孔、微波、超临界CO2、超临界H2O和氨渗滤预处理。可以在水解和/或发酵之前预处理纤维素材料。预处理优选在水解前进行。或者,预处理可以与水解同时进行,如与用一种或多种纤维素分解酶或者其它酶活性处理纤维素材料同时进行以释放可发酵糖,如葡萄糖和/或麦芽糖。在大多数情况下,预处理步骤本身使一些生物质转化成可发酵糖(甚至在不存在酶的情况下)。蒸汽预处理。在蒸汽预处理中,加热纤维素材料以破坏植物细胞壁成分,包括木质素、半纤维素和纤维素,使酶可以到达纤维素和其它部分,例如,半纤维素。将木质纤维素物质通过或穿过反应容器,其中注入蒸汽以增加温度至需要的温度和压力,并且在其中保持期望的反应时间。蒸汽预处理优选在140-230°C,更优选160-200°C,并且最优选170-190°C进行,其中最优的温度和范围依赖于加入的任何化学催化剂。蒸汽预处理的停留时间优选1-15分钟,更优选3-12分钟,并且最优选4-10分钟,其中最优的停留时间依赖于温度范围和加入的任何化学催化剂。蒸汽预处理允许相对较高的固体加载量,使纤维素材料在预处理过程中通常仅仅变得潮湿。蒸汽预处理经常与预处理后对物质的爆炸放料(explosivedischarge)组合,这称为蒸汽爆炸,即,快速闪变至大气压和物质的湍流,以通过破碎增加可接触的表面积(Duff禾口Murray,1996,BioresourceTechnology8551-33;Galbe和Zacchi,2002,Appl.Microbiol.Biotechnol.59:618_628;美国专利申请No.20020164730)。在蒸汽预处理过程中,切割半纤维素乙酰基团,并且得到的酸自催化纤维素部分水解成单糖和寡糖。去除木质素至有限的程度。经常在蒸汽预处理之前加入催化剂如H2SO4或SO2(通常0.3至3%w/w),其可减少时间,降低温度,增加回收率,并促进酶水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132496-508;Varga^,2004,Appl.Biochem.Biotechnol.113-116509-523;Sassner等·,2006,EnzymeMicrob.Technol.39:756_762)。化学预处理术语“化学处理“指能促进纤维素、半纤维素和/或木质素分离和/或释放的任何化学处理。合适的化学预处理步骤的实例包括例如稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆炸(AFEX)、氨渗滤(APR)和有机溶剂预处理。在稀酸预处理中,将纤维素材料与稀酸(通常是H2SO4)和水混合以形成浆料,由蒸汽加热至期望的温度,并在一段停留时间后闪变至大气压。可以用很多反应器设计进行稀酸预处理,例如,活塞流式反应器、逆流反应器或连续逆流收缩床反应器(Duff和Murray,1996,supra;Schell等,2004,BioresourceTechnol.91179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93_115)。还可以使用碱性条件下的几种预处理方法。这些碱预处理包括,但不限于,石灰预处理、湿氧化、氨渗滤(APR)和氨纤维/冷冻爆炸(AFEX)。用碳酸钙、氢氧化钠或氨,在85_150°C的低温进行石灰预处理,停留时间从1小时到几天(Wyman等,2005,BioresourceTechnol.961959-1966;Mosier等,2005,BioresourceTechnol.96:673_686)。WO2006/11089UW02006/11899,WO2006/11900和WO2006/110901公开了使用氨的预处理方法。湿法氧化是热预处理,通常在180-220°C进行5_15分钟,加入氧化剂如过氧化氢或过压氧(Schmidt禾口Thomsen,1998,BioresourceTechnol.64139-151;Palonen等,2004,Appl.Biochem.Biotechnol.1171-17;Varga^,2004,Biotechnol.Bioeng.88567-574;Matin等,2006,J.Chem.Technol.Biotechnol.811669-1677)。预处理以优选1-40%干物质,更优选2-30%干物质,并且最优性5-20%干物质进行,并且由于加入碱如碳酸钠,初始PH经常会增加。湿法氧化预处理方法的修改方法,称为湿爆炸(湿氧化和蒸汽爆炸的组合),能够处理高达30%的干物质。在湿爆炸中,在预处理过程中,在一定的停留时间后引入氧化剂。然后通过闪变至大气压而结束预处理(W02006/032282)。氨纤维爆炸(AFEX)涉及在温和温度如90-100°C和高压如17_20bar,用液体或气体氨处理纤维素材料5-10分钟,其中干物质含量可以高达60%(Gollapalli等,2002,Appl.Biochem.Biotechnol.98:23_35;Chundawat等,2007,Biotechnol.Bioeng.96219-231;Alizadeh等,2005,Appl.Biochem.Biotechnol.121:1133_1141;Teymouri等,2005,BioresourceTechnol.96:2014_2018)。AFEX预处理导致纤维素解聚,和半纤维素的部分水解。木质素_糖复合物得到切割。有机溶剂预处理通过用含水乙醇(40-60%乙醇)在160_200°C提取30-60分钟而将纤维素材料去木质素化(Pan等,2005,Biotechnol.Bioeng.90:473_481;Pan等,2006,Biotechnol.Bioeng.94:851_861;Kurabi等,2005,Appl.Biochem.Biotechnol.121219-230)。经常加入硫酸作为催化剂。在有机溶剂预处理中,去除大部分半纤维素。合适的预处理方法的其他实例如Schell等,2003,Appl.BiochemandBiotechn.105-108:69-85,禾口Mosier等,2005,BioresourceTechnology96:673_686,禾口美国专利公开申请2002/0164730所述。在一个方面,化学预处理优选作为酸处理,并且更优选作为连续稀酸和/或弱酸(mildacid)处理进行。酸通常是硫酸,但也可以使用其它酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢或其混合物。弱酸处理在优选1-5,更优选1-4,并且最优选1-3的PH范围内进行。在一个方面,酸浓度在优选0.01至20wt%酸,更优选0.05至IOwt%酸,甚至更优选0.1至5衬%酸,并且最优选0.2至2.Owt%酸的范围内。酸与纤维素材料接触,并在优选160-220°C,和更优选165-195°C范围内的温度保持数秒到数分钟,例如1秒-60分钟的时间。在另一个方面,预处理作为氨纤维爆炸步骤(AFEX预处理步骤)进行。在另一个方面,预处理发生在含水浆料中。在优选的方面,在预处理过程中纤维素材料以优选10-80wt%,更优选20-70wt%,并且最优性30-60wt%,如约50wt%的量存在。预处理的纤维素材料可以不洗涤或者使用本领域任何已知的方法洗涤,例如,用水洗涤。机械预处理术语“机械预处理”指各种类型的研磨或碾磨(例如,干磨、湿磨或振动球磨)。物理预处理术语“物理预处理”指促进纤维素、半纤维素和/或木质素从纤维素材料分离和/或释放的任何处理。例如,物理预处理可涉及辐射(例如,微波辐射)、汽蒸/蒸汽爆炸、水热解(hydrothermolysis)和它们的组合。物理预处理可以涉及高压和/或高温(蒸汽爆炸)。在一个方面,高压指优选约300至约600psi,更优选约350至约550psi,并且最优选约400至约500psi,如约450psi的压力。在另一个方面,高温指约100至300°C,优选约140至235°C的温度。在一个优选的方面,机械预处理在使用如上所定义的高温和高压的分批过程、蒸汽枪水解器系统,例如来自SundsDefibratorAB,Sweden的SundsHydrolyzer中进行。组合的物理和化学预处理可以对纤维素材料进行物理和化学预处理。例如,预处理步骤可以涉及稀酸或弱酸处理和高的温度和/或压力处理。根据需要,可以顺序或同时进行物理和化学预处理。还可以包括机械预处理。因此,在一个优选的方面,对纤维素材料进行机械、化学或物理预处理,或者它们的任何组合,以促进纤维素、半纤维素和/或木质素的分离和/或释放。生物预处理术语“生物预处理”指可以促进纤维素、半纤维素和/或木质素从纤维素材料分离和/或释放的任何生物预处理。生物预处理技术可以包括应用溶解木质素的微生物(参见,例如,Hsu,1996,Pretreatmentofbiomass,于HandbookonBioethanolProductionandUtilization,Wyman,C.E编,Taylor&Francis,Washington,DC,179-212;Ghosh禾口Singh,1993,Physicochemicalandbiologicaltreatmentsforenzymatic/microbialconversionoflignocellulosicbiomass,Adv.App1.Microbiol.39295-333;McMillan,1994,Pretreatinglignocellulosicbiomass:areview,于EnzymaticConversionofBiomassforFuelsProduction,Himmel,Baker禾口Overend编,ACSSymposiumSeries566,AmericanChemicalSociety,Washington,DC,chapter15;Gong,Cao,Du禾口Tsao,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper编,Springer-VerlagBerlinHeidelberg,Germany,65:207_241;Olsson禾口Hahn-Hagerdal,1996,Fermentationoflignocellulosichydrolysatesforethanolproduction,Enz.Microb.Tech.18312—331;禾口Vallander禾口Eriksson,1990,Productionofethanolfromlignocellulosicmaterials:Stateoftheart,Adv.Biochem.Eng./Biotechnol.42:63_95)0MM。在水解(也称作糖化)步骤中,将预处理的纤维素材料水解以将纤维素和任选地也将半纤维素分解成可发酵糖,如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖,或可溶的寡糖。水解由纤维素分解酶组合物以酶法进行,所述组合物包含本发明具有纤维素分解增强活性的多肽,其可以进一步包含一种或多种半纤维素分解酶。组合物的酶还可以顺序加入。酶水解优选在易于由本领域技术人员确定的条件下,在合适的含水环境中进行。在一个优选的方面,水解在适于酶的活性,即对于酶最优的条件下进行。水解可以以补料批式或连续的过程进行,其中将预处理的纤维素材料(底物)逐渐补入,例如,含酶的水解溶液中。糖化通常在搅拌釜反应器或发酵罐中,在受控的pH、温度和混合条件下进行。合适的处理时间、温度和PH条件可以由本领域技术人员容易地确定。例如,糖化可以持续长达200小时,但是通常优选进行约12至约96小时,更优选约16至约72小时,并且最优选约24至约48小时。温度优选约25°C至约70°C,更优选约30°C至约65°C,并且最优选约40°C至约60°C,特别是约50°C。pH优选约3至约8,更优选约3.5至约7,并且最优选约4至约6,特别是约pH5。干燥固体含量优选约5至约50wt%,更优选约10至约40wt%,并且最优选约20至约30wt%。除了本发明具有纤维素分解增强活性的多肽之外,组合物的纤维素分解酶成分优选是具有内切葡聚糖酶、纤维二糖水解酶,和β-葡糖苷酶活性的酶。在一个优选的方面,纤维素分解酶组合物包含一种或多种(几种)选自下组的纤维素分解酶纤维素酶、内切葡聚糖酶、纤维二糖水解酶,和葡糖苷酶。在另一个优选的方面,纤维素分解酶制剂可补充有选自下组的一种或多种其它酶活性半纤维素酶、酯酶(例如,脂肪酶、磷脂酶,和/或角质酶)、蛋白酶、漆酶、过氧化物酶,或它们的混合物。在本发明的方法中,可以在发酵前或过程中(包括在发酵微生物的繁殖的过程中或之后)加入其它酶。酶可以源自或获得自任何合适的来源,包括细菌、真菌、酵母、植物或哺乳动物来源。术语“获得”在本文中表示酶可以从天然地产生所述酶作为天然酶的生物体分离。术语“获得”在本文中还表示酶可以在采用本文所述方法的宿主生物体中重组产生,其中重组产生的酶对宿主生物体是天然或外源的,或具有修饰的氨基酸序列,例如,具有缺失的、插入的和/或取代的一个或多个氨基酸,即,重组产生的酶,其为天然氨基酸序列的片段和/或突变体;或由本领域已知的核苷酸改组方法产生的酶。天然酶的意义中包含天然变体,而外源酶的意义中包含通过重组获得的变体,如通过定向诱变或改组获得的变体。本发明使用的酶可以是示于本文所述方法的任何形式,如含有或者不含细胞的粗发酵液或基本上纯的多肽。酶可为干粉或颗粒、无尘颗粒,液体、稳定化的液体或受保护的酶。颗粒可以通过,例如美国专利No.4,106,991和4,661,452中公开的方法产生,或者可任选地通过本领域已知的方法包覆。可以,例如,根据已确立的方法通过加入稳定剂(如糖、糖醇或另一种多元醇(polyol),和/或乳酸或另一种有机酸)将液体酶制剂稳定化。受保37护的酶可以根据EP238,216中公开的方法制备。具有纤维素分解增强活性的酶和多肽的最适量取决于几个因素,其包括但不限于,组分纤维素分解酶的混合物、含纤维素底物、含纤维素底物的浓度、含纤维素底物的预处理、温度、时间、PH和包括发酵生物体(例如,同步糖化和发酵的酵母)。在一个优选的方面,纤维素分解酶对于纤维素材料的有效量是约0.5至约50mg,优选约0.5至约40mg,更优选约0.5至约25mg,更优选约0.75至约20mg,更优选约0.75至约15mg,甚至更优选约0.5至约10mg,并且最优选约2.5至约IOmg每g纤维素材料。在另一个优选的方面,具有纤维素分解增强活性的多肽对于纤维素材料的有效量是约0.01至约50mg,优选约0.5至约40mg,更优选约0.5至约25mg,更优选约0.75至约20mg,更优选约0.75至约15mg,甚至更优选约0.5至约10mg,并且最优选约2.5至约IOmg每g纤维素材料。在另一个优选的方面,具有纤维素分解增强活性的多肽对于纤维素材料的有效量是约0.01至约50.Omg,优选约0.01至约40mg,更优选约0.01至约30mg,更优选约0.01至约20mg,更优选约0.01至约10mg,更优选约0.01至约5mg,更优选约0.025至约1.5mg,更优选约0.05至约1.25mg,更优选约0.075至约1.25mg,更优选约0.1至约1.25mg,甚至更优选约0.15至约1.25mg,并且最优选约0.25至约1.Omg每g纤维素材料。在另一个优选的方面,具有纤维素分解增强活性的多肽对于纤维素分解酶的有效量是约0.005至约1.Og,优选约0.01至约1.Og,更优选约0.15至约0.75g,更优选约0.15至约0.5g,更优选约0.1至约0.5g,甚至更优选约0.1至约0.5g,并且最优选约0.05至约0.2g每g纤维素分解酶。发酵。通过能将糖直接或间接发酵成期望发酵产物的发酵微生物,发酵获得自预处理和水解的纤维素材料的可发酵糖。“发酵”或“发酵方法”指任何发酵方法或包含发酵步骤的任何方法。发酵方法还包括用于消费品醇工业(例如,啤酒和葡萄酒)、乳品业(例如,发酵乳制品)、皮革业和烟草业的发酵方法。发酵条件依赖于期望的发酵产物和发酵生物体,并且能由本领域的技术人员容易地确定。在发酵步骤中,作为预处理和酶水解步骤的结果从纤维素材料释放的糖,通过发酵生物体(如酵母)发酵成为产物,例如,乙醇。水解(糖化)和发酵可以是单独或同时的。这种方法包括,但不限于,单独的水解和发酵(SHF);同时糖化和发酵(SSF);同时糖化和共发酵(SSCF);混合的水解和发酵(HHF);SHCF(单独的水解和共发酵)、HHCF(混合的水解和共发酵),和直接微生物转化(DMC)。在本发明的发酵步骤中可以使用任何合适的含纤维素底物或原材料。通常根据理想的发酵产品(即,要从发酵获得的物质)和使用的方法来选择底物,如本领域中所公知。适用于本发明的方法中的底物的实例包括纤维素材料,如木材或植物残余物或获得自能够由发酵微生物代谢的经处理的纤维素材料的低分子量糖DP1-3,所述物质可以通过直接向发酵培养基中加入而提供。术语“发酵培养基”在本文中可理解为指加入发酵微生物之前的培养基,如,由糖化过程产生的培养基,以及同步的糖化和发酵方法(SSF)中使用的培养基。“发酵微生物”指适用于理想的发酵方法产生发酵产物的任何微生物,包括细菌和真菌生物体。发酵生物体可以是(;和/或C5发酵生物体,或它们的组合。C6和C5发酵生物体均在本领域公知。合适的发酵微生物能将糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖或寡糖)直接或间接地发酵(即,转化)成理想的发酵产品。可产生乙醇的细菌和真菌发酵生物体的实例如Lin等,2006,Appl.Microbiol.Biotechnol.69:627_642所述。能发酵C6糖的发酵微生物的实例包括细菌和真菌生物体,如酵母。优选的酵母包括酵母属菌种,优选酿酒酵母。能发酵C5糖的发酵生物体的实例包括细菌和真菌生物体,如酵母。优选的C5发酵酵母包括毕赤酵母属,优选树干毕赤酵母(Pichiastipitis)的菌株,如树干毕赤酵母CBS5773;念珠菌属,优选博伊丁念珠菌(Candidaboidinii)、芸薹念珠菌(Candidabrassicae)、休哈塔念珠菌(Candidasheatae)、迪丹斯念珠菌(Candidadiddensii)、伪热(Candidapseudotropicalis)(Candidautilis)的其它发酵生物体包括发酵单胞菌属(Zymomonas),如运动发酵单胞菌(Zymomonasmobilis);汉逊酵母属,如异常汉逊酵母(Hansenulaanomala);克鲁维酵母属,如脆壁克鲁维酵母;裂殖酵母属,如粟酒裂殖酵母(S.pombe);和大肠杆菌的菌株,特别是已经经过遗传修饰而提高乙醇产量的大肠杆菌菌株。在一个优选的方面,酵母是酵母属菌种。在一个更优选的方面,酵母是酿酒酵母。在另一个更优选的方面,酵母是糖化酵母(Saccharomycesdistaticus)0在另一个更优选的方面,酵母是葡萄汁酵母(Saccharomycesuvarum)。在另一个优选的方面,酵母是克鲁维酵母属。在另一个更优选的方面,酵母是马克斯克鲁维酵母(Kluyveromycesmarxianus)0在另一个更优选的方面,酵母是脆壁克鲁维酵母。在另一个优选的方面,酵母是念珠菌属。在另一个更优选的方面,酵母是博伊丁念珠菌。在另一个更优选的方面,酵母是芸薹念珠菌。在另一个更优选的方面,酵母是迪丹斯念珠菌。在另一个更优选的方面,酵母是假热带念珠菌。在另一个更优选的方面,酵母是产朊念珠菌。在另一个优选的方面,酵母是棒孢酵母属(Clavispora)。在另一个更优选的方面,酵母是葡萄牙棒孢酵母(Clavisporalusitaniae)。在另一个更优选的方面,酵母是Clavisporaopuntiae。在另一个优选的方面,酵母是管囊酵母属(Pachysolen)。在另一个更优选的方面,酵母是嗜鞣管囊酵母(Pachysolentarmophilus)。在另一个优选的方面,酵母是毕赤酵母属。在另一个更优选的方面,酵母是树干毕赤酵母。在另一个优选的方面,酵母是酒香酵母属(Bretarmomyces)。在另一个更优选的方面,酵母是克劳森酒香酵母(Bretannomycesclausenii)(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,于HandbookonBioethanolProductionandUtilization,ffyman,C.E.编,Taylor&Francis,Washington,DC,179-212)。能有效地将己糖和戊糖发酵成乙醇的细菌包括,例如,运动发酵单胞菌和热纤维梭菌(Clostridiumthermocellum)(Philippidis,1996,见上文)。在一个优选的方面,细菌是发酵单胞菌属。在更优选的方面,细菌是运动发酵单胞菌。在另一个优选的方面,细菌是梭菌属。在另一个更优选的方面,细菌是热纤维梭菌。商业上可得到的适合乙醇产生的酵母包括,例如ETHAN0LRED酵母(可从RedStar/Lesaffre,USA获得)、FALI(可从Fleischmann,sYeast,BumsPhilpFoodInc.,USA部门获得)、SUPERSTART和THERM0SACC新鲜酵母(可从EthanolTechnology,WI,USA获得)、BIOFERMAFT和XR(可从NABC-NorthAmericanBioproductsCorporation,GA,USA获得)、GERTSTRAND(可从GertStrandAB,Sweden获得)和FERMIOL(可从DSMSpecialties获得)。在一个优选的方面,发酵微生物已经经过遗传修饰,提供发酵戊糖的能力,如利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物。通过将异源基因克隆入多种发酵微生物已经构建了能将己糖和戊糖转化成乙醇(共发酵)的生物体(Chen禾口Ho,1993,CloningandimprovingtheexpressionofPichiastipitisxylosereductasegeneinSaccharomycescerevisiae,Appl.Biochem.Biotechnol.39-40135-147;Ho等,1998,GeneticallyengineeredSaccharomycesyeastcapableofeffectivelycofermentingglucoseandxylose,Appl.Environ.Microbiol.64:1852-1859;Kotter禾口Ciriacy,1993,XylosefermentationbySaccharomycescerevisiae,Appl.Micrbiol.Biotechnol.38:776_783;Walfridsson等,1995,Xylose-metabolizingSaccharomycescerevisiaestrainsoverexpressingtheTKLlandTALIgenesencodingthepentosephosphatepathwayenzymestransketolaseandtransaldolase,Appl.Environ.Microbiol.61:4184_4190;Kuyper等,2004,MinimalmetabolicengineeringofSaccharomycescerevisiaeforefficientanaerobicxylosefermentation:aproofofprinciple,FEMSYeastResearch4655-664;Beall1991,ParametricstudiesofethanolproductionfromxyloseandothersugarsbyrecombinantEscherichiacoli,Biotech.Bioeng.38296~303;Ingram等,1998,Metabolicengineeringofbacteriaforethanolproduction,Biotechnol.Bioeng.58204~214;Zhang等,1995,MetabolicengineeringofapentosemetabolismpathwayinethanologenicZymomonasmobilis,Science267:240_243;Deanda等,1996,Developmentofanarabinose-fermentingZymomonasmobilisstrainbymetabolicpathwayengineering,Appl.Environ.Microbiol.624465-4470)。在一个优选的方面,经过遗传修饰的发酵微生物是酿酒酵母。在另一个优选的方面,经过遗传修饰的发酵微生物是运动发酵单胞菌。在另一个优选的方面,经过遗传修饰的发酵微生物是大肠杆菌。在另一个优选的方面,经过遗传修饰的发酵微生物是产酸克雷伯氏菌(Klebsiellaoxytoca)0本领域中公知的是,上述生物体还能用于产生其它物质,如本文所述。通常向降解的木质纤维素或水解物加入发酵微生物,并进行约8至约96小时,如约24至约60小时发酵。温度通常为约26°C至约60°C,特别是约32°C或50°C,并且在约pH3至约pH8,如约pH4-5,6或7。在一个优选的方面,对降解的木质纤维素或水解物施用酵母和/或另一种微生物,并进行约12至约96小时,如通常为24-60小时发酵。在一个优选的方面,温度优选为约20°C至约60°C,更优选约25°C至约50°C,并且最优选约32°C至约50°C,特别是约32°C或50°C,并且pH通常为约pH3至约pH7,优选约pH4_7。然而,一些细菌发酵生物体,例如,具有更高的最适发酵温度。酵母或另一种微生物优选以约IO5-IO12,优选约IO7-IOltl,特别是约2xl08活细胞计数每ml发酵液的量施用。关于使用酵母进行发酵的进一步指导可以在例如"TheAlcoholTextbook,,(K.Jacques,Τ.P.Lyons禾口D.R.Kelsall编,NottinghamUniversityPress,UnitedKingdom1999)中找到,其通过提述并入本文。本领域最广泛使用的方法是同步的糖化和发酵(SSF)方法,其中没有糖化的保持阶段,意味着酵母和酶一起添加。对于乙醇生产,在发酵后蒸馏浆料以提取乙醇。根据本发明的方法获得的乙醇可以用作,例如燃料乙醇;饮料乙醇,即,中性饮料酒,或工业乙醇。发酵刺激剂可以与本文所述的任何酶方法组合使用,以进一步改进发酵工艺,而且特定地,改进发酵微生物的性能,如,速率增加和乙醇得率。“发酵刺激剂”指用于发酵微生物(特别是酵母)生长的刺激剂。优选的用于生长的发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸(盐)、烟酸、内消旋肌醇(meso-inositol)、硫胺素、吡哆醇(pyridoxine)、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D禾口E。参见,例如,Alfenore等,ImprovingethanolproductionandviabilityofSaccharomycescerevisiaebyavitaminfeedingstrategyduringfed-batchprocess,Springer-Verlag(2002),其通过提述并入本文。矿物质的实例包括能够提供营养物的矿物质和矿物质盐,所述营养物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。发酵产物发酵产物可以是源自发酵的仵何物质。发酵产物可以是,不限于,醇(例如,阿拉伯醇、丁醇、乙醇、甘油、甲醇、1,3_丙二醇、山梨醇和木糖醇);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸和木糖酸);酮(例如,丙酮);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);和气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)和一氧化碳(C0))。发酵产物还可以是作为高价值产品的蛋白质。在一个优选的方面,发酵产物是醇。可理解的是,术语“醇”包括包含一个或多个羟基基团的物质。在更优选的方面,所述醇是阿拉伯醇。在另一个更优选的方面,所述醇是丁醇。在另一个更优选的方面,所述醇是乙醇。在另一个更优选的方面,所述醇是甘油。在另一个更优选的方面,所述醇是甲醇。在另一个更优选的方面,所述醇是1,3_丙二醇。在另一个更优选的方面,所述醇是山梨醇。在另一个更优选的方面,所述醇是木糖醇。参见,例如,Gong,C.S.,Cao,N.J.,Du,J.,禾口Tsao,G.Τ.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.编,Springer-VerlagBerlinHeidelberg,Germany,65207-241;Silveira,Μ.M.,禾口Jonas,R.,2002,Thebiotechnologicalproductionofsorbitol,Appl.Microbiol.Biotechnol.59400-408;Nigam,P.,禾口Singh,D.,1995,Processesforfermentativeproductionofxylitol-asugarsubstitute,ProcessBiochemistry30(2):117_124;Ezeji,T.C.,Qureshi,N.禾口Blaschek,H.P.,2003,Productionofacetone,butanolandethanolbyClostridiumbeijerinckiiBA101andinsiturecoverybygasstripping,WorldJournalofMicrobiologyandBiotechnology19(6):595_603o在另一个优选的方面,所述物质是有机酸。在另一个更优选的方面,所述有机酸是乙酸。在另一个更优选的方面,所述有机酸是醋酮酸。在另一个更优选的方面,所述有机酸是己二酸。在另一个更优选的方面,所述有机酸是抗坏血酸。在另一个更优选的方面,所述有机酸是柠檬酸。在另一个更优选的方面,所述有机酸是2,5-二酮-D-葡糖酸。在另一个更优选的方面,所述有机酸是甲酸。在另一个更优选的方面,所述有机酸是反丁烯二酸。在另一个更优选的方面,所述有机酸是葡糖二酸。在另一个更优选的方面,所述有机酸是葡糖酸。在另一个更优选的方面,所述有机酸是葡糖醛酸。在另一个更优选的方面,所述有机酸是戊二酸。在另一个优选的方面,所述有机酸是3-羟基丙酸。在另一个更优选的方面,所述有机酸是衣康酸。在另一个更优选的方面,所述有机酸是乳酸。在另一个更优选的方面,所述有机酸是苹果酸。在另一个更优选的方面,所述有机酸是丙二酸。在另一个更优选的方面,所述有机酸是草酸。在另一个更优选的方面,所述有机酸是丙酸。在另一个更优选的方面,所述有机酸是琥珀酸。在另一个更优选的方面,所述有机酸是木糖酸。参见,例如,Chen,R.,禾口Lee,Y.Y.,1997,Membrane-mediatedextractivefermentationforlacticacidproductionfromcellulosicbiomass,Appl.Biochem.Biotechnol.63—65:435_4480在另一个优选的方面,所述物质是酮。可理解的是术语“酮”包括含有一个或多个酮基的物质。在另一个更优选的方面,所述酮是丙酮。参见,例如,Qureshi和Blaschek,2003,见上文。在另一个优选的方面,所述物质是氨基酸。在另一个更优选的方面,所述有机酸是天冬氨酸。在另一个更优选的方面,所述氨基酸是谷氨酸。在另一个更优选的方面,所述氨基酸是甘氨酸。在另一个更优选的方面,所述氨基酸是赖氨酸。在另一个更优选的方面,所述氨基酸是丝氨酸。在另一个更优选的方面,所述氨基酸是苏氨酸。参见,例如,Richard,Α·,禾口Margaritis,Α·,2004,Empiricalmodelingofbachfermentaionkineticsforpoly(glutamicacid)productionandothermicrobialbiopolymers,BiotechnologyandBioengineering87(4):501_515o在另一个优选的方面,所述物质是气体。在另一个更优选的方面,所述气体是甲烷。在另一个更优选的方面,所述气体是H2。在另一个更优选的方面,所述气体是C02。在另一个更优选的方面,所述气体是CO。参见,例如,Kataoka,N.,A.Miya,和K.Kiriyama,1997,Studiesonhydrogenproductionbycontinuousculturesystemofhydrogen-producinganaerobicbacteria,WaterScienceandTechnology36(6-7)41-47;禾口GunaseelanV.N.于BiomassandBioenergy,Vol.13(1-2),pp.83-114,1997,Anaerobicdigestionofbiomassformethaneproduction:Areview。_可以使用本领域已知的任何方法,任选地从发酵培养基回收发酵产物,所述方法包括,但不限于,层析、电泳方法、差示溶解度(例如,硫酸铵沉淀)、蒸馏或提取。例如,通过常规蒸馏方法从发酵的纤维素材料分离并纯化醇。可以获得纯度高达约96vol%的乙醇,其能用作,例如,燃料乙醇、饮料乙醇,即,中性饮料酒,或工业乙醇。纤维素分解酶组合物在本发明的方法中,纤维素分解酶组合物可以包含任何酶,所述酶参与将含纤维素材料加工为葡萄糖,或者将半纤维素加工为木糖、甘露糖、半乳糖和阿拉伯糖,它们的聚合物,或者如下所述源自它们的产物。在一个方面,纤维素分解酶组合物包含选自下组的一种或多种酶内切葡聚糖酶、纤维二糖水解酶,和β-葡糖苷酶。在另一个方面,纤维素分解酶组合物进一步包一种或多种其它酶活性,以促进含纤维素材料的降解。优选的其它酶是半纤维素酶、酯酶(例如,脂肪酶、磷脂酶,和/或角质酶)、蛋白酶、漆酶、过氧化物酶,或它们的混合物。纤维素分解酶组合物可以是单成分制备物,例如,内切葡聚糖酶,多成分制备物,例如,内切葡聚糖酶、纤维二糖水解酶,和葡糖苷酶,或多成分和单成分蛋白制备物的组合。纤维素分解蛋白可以具有活性,即,在酸性、中性或碱性PH范围中水解含纤维素材料。如上所述,本发明中使用的纤维素分解蛋白可以是单成分制备物,即,基本不含其它纤维素分解成分的成分。单成分可以是重组成分,即,通过克隆编码单成分的DNA序列,然后用所述DNA序列转化细胞,并在宿主中表达而产生(参见,例如,WO91/17243和WO91/17244)。宿主细胞可以是异源细胞(酶对于宿主是异源的)或者宿主还可以是野生型宿主(酶对于宿主是天然的)。单成分纤维素分解蛋白还可以通过从发酵液纯化这种蛋白而制备。本发明使用的酶可以是示于本文所述方法的任何形式,如,例如,含有或者不含细胞的粗发酵液、干粉或颗粒、无尘颗粒、液体、稳定化的液体或受保护的酶。颗粒可以通过,例如美国专利No.4,106,991和4,661,452中公开的方法产生,或者可任选地通过本领域已知的方法包覆。可以,例如,根据已确立的方法通过加入稳定剂(如糖、糖醇或另一种多元醇(polyol),和/或乳酸或另一种有机酸)将液体酶制剂稳定化。受保护的酶可以根据EP238,216中公开的方法制备。本发明具有纤维素酶分解活性的多肽可以是细菌多肽。例如,所述多肽可以是革兰氏阳性细菌多肽例如芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属或海洋芽孢杆菌属多肽,所述多肽具有纤维素分解酶活性;或革兰氏阴性细菌多肽,如大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属多肽,其具有纤维素分解酶活性。在一个优选方面,所述多肽是具有纤维素分解酶活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌多肽。在另一个优选的方面,所述多肽是具有纤维素分解酶活性的似马链球菌、酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种多肽。在另一个优选的方面,所述多肽是具有纤维素分解酶活性的不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌或浅青紫链霉菌多肽。本发明具有纤维素分解酶活性的多肽也可以是真菌多肽,并且更优选酵母多肽如念珠菌属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属多肽,其具有纤维素分解酶活性;或更优选丝状真菌多肽如枝顶孢霉属、伞菌属、链格孢属、曲霉属、短梗霉属、Botryospaeria、拟M菌属、毛_壳属、金包子菌属、Claviceps>Cochliobolus、鬼伞属、Coptotermes、棒囊壳属、隐丛赤壳菌属、隐球菌属、色二孢属、黑耳属、Filibasidium、镰孢属、赤霉属、全鞭毛虫属、腐质霉属、耙齿菌属、蘑菇属、L印tospaeria、梨孢菌属、Melanocarpus、多孔菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、瘤胃壶菌属、Poitrasia、假黑盘菌属、Pseudotrichonympha、根毛霉属、裂褶菌属、柱顶孢属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、木霉属、长毛盘菌属、轮枝孢43属、包脚菇属或炭角菌属多肽,其具有纤维素分解酶活性。在一个优选的方面,所述多肽是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母多肽,其具有纤维素分解酶活性。在另一个优选的方面,所述多肽是解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌、Chrysosporiumlucknowense、热带金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、粗金抱子菌、Chrysosporiumqueenslandicum>Chrysosporiumzonatum>ffJfe^lftJfeJfe^库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰腐质霉、特异腐质霉、疏棉状腐质霉、白耙齿菌、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状胄胃、,胃胄胃、胃―胃胃、Thielaviaachromatica>Thielaviaalbomyces>Thielaviaalbopilosa、澳洲梭孢壳(Thielaviaaustraleinsis)、Thielaviafimeti、小孢梭孢壳(Thielaviamicrospora)、卵包梭包壳(Thielaviaovispora)>Thielaviaperuviana、Thielaviaspededonium、^;—;^(Thielaviasetosa)>Thielaviasubthermophila>i生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或Trichophaeasaccata多肽,其具有纤维素分解酶活性。还可以使用纤维素分解蛋白的化学修饰或蛋白质工程改造突变体。纤维素酶组合物的一个或多个成分可以是重组成分,S卩,通过克隆编码单成分的DNA序列,然后用所述DNA序列转化细胞,并在宿主中表达而产生(参见,例如,WO91/17243和WO91/17244)。宿主细胞优选为异源细胞(酶对于宿主是异源的),但在某些条件下,宿主还可以是同源宿主(酶对于宿主是天然的)。多成分纤维素分解蛋白还可以通过从发酵液纯化这种蛋白而制备。适用于本发明的商业纤维素分解蛋白制备物的实例包括,例如,CELLUCLAST(可从NovozymesA/S获得)和N0V0ZYM188(可从NovozymesA/S获得)。可以使用的其它包含纤维素酶的商业可提供的制备物包括CELLUZYME、CEREFLO和ULTRAFLO(NovozymesA/S)、LAMINEX禾ΠSPEZYMECP(GenencorInt.)、ROHAMENT7069ff(RohmGmbH),和FIBREZYMELDI、FIBREZYMELBR,或VISCOSTAR150L(DyadicInternational,Inc.,Jupiter,FL,USA)。以固体重量的约0.001%至约5.0%,更优选固体重量的约0.025%至约4.0%,并且最优选固体重量的约0.005%至约2.0%的有效量加入纤维素酶。能用于本发明的方法中的细菌内切葡聚糖酶的实例,包括,但不限于,Acidothermuscellulolyticus内切葡聚糖酶(WO91/05039;WO93/15186;美国专利No.5,275,944;WO96/02551;美国专利No.5,536,655、WO00/70031、WO05/093050);Thermobifidafusca内切葡聚糖酶III(W005/093050)JPThermobifidafusca内切葡聚糖酶V(W005/093050)。可以在本发明的方法中使用的真菌内切葡聚糖酶的实例,包括,但不限于,里氏木霉内切葡聚糖酶I(Penttila等,1986,Gene45:253_263;GENBANK登录号M15665);里氏木霉内切葡聚糖酶II(Saloheimo等,1988,Gene6311~22;GENBANK登录号M19373);里氏木霉内切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64555-563;GENBANK登录号AB003694);里氏木霉内切葡聚糖酶IV(Saloheimo等,1997,44Eur.J.Biochem.249:584_591;GENBANK登录号Yl1113);和里氏木霉内切葡聚糖酶V(Saloheimo等,1994,MolecularMicrobiology13:219_228;GENBANK登录号Z33381);棘孢曲霉内切葡聚糖酶(Ooi等,1990,NucleicAcidsResearch18:5884);川地曲霉(Aspergilluskawachii)内切葡聚糖酶(Sakamoto等,1995,CurrentGenetics27435-439);胡萝卜软腐欧文氏菌(Erwiniacarotovara)内切葡聚糖酶(Saarilahti等,1990,Gene90:9-14);尖镰孢内切葡聚糖酶(GENBANK登录号L29381);灰腐质霉高温变种(Humicolagriseavar.thermoidea)内切葡聚糖酶(GENBANK登录号AB003107);Melanocarpusalbomyces内切葡聚糖酶(GENBANK登录号MAL515703);粗糙脉孢菌内切葡聚糖酶(GENBANK登录号XM_324477);特异腐质霉内切葡聚糖酶V(SEQIDNO25);嗜热毁丝霉CBS117.65内切葡聚糖酶(SEQIDNO27);担子菌CBS495.95内切葡聚糖酶(SEQIDNO29);担子菌CBS494.95内切葡聚糖酶(SEQIDNO31);土生梭孢霉NRRL8126CEL6B内切葡聚糖酶(SEQIDNO33);土生梭孢霉NRRL8126CEL6C内切葡聚糖酶(SEQIDNO35);土生梭孢霉NRRL8126CEL7C内切葡聚糖酶(SEQIDNO37);土生梭孢霉NRRL8126CEL7E内切葡聚糖酶(SEQIDNO39);土生梭孢霉NRRL8126CEL7F内切葡聚糖酶(SEQIDNO41);CladorrhinumfoecundissimumATCC62373CEL7A内切葡聚糖酶(SEQIDNO43)和里氏木霉菌株VTT-D-80133内切葡聚糖酶(SEQIDNO45;GENBANK登录号M15665)。上述SEQIDNO25,SEQIDNO27,SEQIDNO29,SEQIDN0:31、SEQIDNO:33、SEQIDNO35,SEQIDNO37,SEQIDNO39,SEQIDN0:41、SEQIDNO:43禾口SEQIDNO45的内切葡聚糖酶分别由SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO42和SEQIDNO44的成熟多肽编码序列编码。可以在本发明的方法中使用的纤维二糖水解酶的实例,包括,但不限于,里氏木霉纤维二糖水解酶I(SEQIDNO47);里氏木霉纤维二糖水解酶II(SEQIDNO49);特异腐质霉纤维二糖水解酶I(SEQIDNO51),嗜热毁丝霉纤维二糖水解酶II(SEQIDNO53和SEQIDNO:55),土生梭孢霉纤维二糖水解酶II(CEL6A)(SEQIDNO57),嗜热毛壳菌纤维二糖水解酶I(SEQIDNO59)和嗜热毛壳菌纤维二糖水解酶II(SEQIDNO:61)。上述SEQIDNO47,SEQIDNO49、SEQIDNO:51、SEQIDNO53、SEQIDNO55、SEQIDNO57、SEQIDNO:59禾口SEQIDNO61的纤维二糖水解酶分别由SEQIDNO46,SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO58和SEQIDNO60的成熟多肽编码序列编码。可以在本发明的方法中使用的葡糖苷酶的实例,包括,但不限于,米曲霉β-葡糖苷酶(SEQIDNO63);烟曲霉β-葡糖苷酶(SEQIDNO65);巴西青霉IBT20888β-葡糖苷酶(SEQIDNO67);黑曲霉β-葡糖苷酶(SEQIDNO69);和棘孢曲霉β-葡糖苷酶(SEQIDNO71)。上述SEQIDNO:63、SEQIDNO:65、SEQIDNO:657、SEQIDNO69和SEQIDNO71的纤维二糖水解酶分别由SEQIDNO:64、SEQIDNO:66、SEQIDNO68和SEQIDNO70的成熟多肽编码序列编码。可以根据WO2002/095014获得具有β-葡糖苷酶活性的米曲霉多肽。可以根据TO2005/047499获得具有β-葡糖苷酶活性的烟曲霉多肽。可以根据WO2002/019442获得具有β-葡糖苷酶活性的巴西青霉多肽。可以根据Dan等,2000,J.Biol.Chem.2754973-4980获得具有β-葡糖苷酶活性的黑曲霉多肽。可以根据Kawaguchi等,1996,Gene173287-288获得具有β-葡糖苷酶活性的棘孢曲霉多肽。β-葡糖苷酶可以是融合蛋白。在一个方面,β-葡糖苷酶是SEQIDNO:73的米曲霉β-葡糖苷酶变体BG融合蛋白或SEQIDΝ0:75的米曲霉β-葡糖苷酶融合蛋白。在另一个方面,米曲霉β-葡糖苷酶变体BG融合蛋白由SEQIDNO:72的多核苷酸编码或者米曲霉β-葡糖苷酶融合蛋白由SEQIDNO74的多核苷酸编码。使用根据HenrissatB·,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309_316,禾口HenrissatB禾口BairochΑ.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316695-696的分类,在很多糖基水解酶家族中公开了其它内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。其它可以在本发明中使用的纤维素分解酶在EP495,257、EP531,315、ΕΡ531,372,WO89/09259、WO94/07998、WO95/24471、WO96/11262、W096/29397、WO96/034108、WO97/14804、WO98/08940、WO98/012307、W098/13465、WO98/015619、WO98/015633、WO98/028411、WO99/06574、W099/10481、WO99/025846、WO99/025847、WO99/031255、WO2000/009707,WO2002/050245、WO2002/0076792、WO2002/101078、WO2003/027306、WO2003/052054、WO2003/052055、WO2003/052056、WO2003/052057、W02003/052118,WO2004/016760,WO2004/043980,WO2004/048592,W02005/001065,WO2005/028636、WO2005/093050,WO2005/093073,W02006/074005,WO2006/117432、WO2007/071818,WO2007/071820,W02008/008070,WO2008/008793、美国专利No.4,435,307、美国专禾IjNo.5,457,046、美国专利No.5,648,263、美国专利No.5,686,593、美国专利No.5,691,178、美国专利No.5,763,254和美国专利No.5,776,757中描述。本发明的方法中使用的纤维素分解酶可以使用本领域已知的方法,通过在营养培养基上发酵上述微生物菌株而产生,所述营养培养基包含碳源和氮源和无机盐(参见,例如,Bennett,J.W.禾口LaSure,L.编,MoreGeneManipulationsinFungi,AcademicPress,CA,1991)。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。适合于生长和纤维素分解酶产生的温度范围和其它条件在本领域中已知(参见,例如,Bailey,J.Ε.和Ollis,D.F.,BiochemicalEngineeringFundamentals,McGraw-HillBookCompany,NY,1986)。发酵可以是导致纤维素分解酶表达或分离的细胞的任何培养方法。因此,发酵可以理解为包括在合适培养基中和允许表达和/或分离所述纤维素分解酶的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。由上述方法产生的纤维素分解酶可以从发酵培养基中回收,并通过常规方法纯化。信号月太本发明还涉及核酸构建体,所述核酸构建体包含编码蛋白质的基因,其中所述基因与编码信号肽的核苷酸序列可操作地连接,所述信号肽包含SEQIDN0:2的氨基酸1至17或SEQIDNO:4的氨基酸1至15,或者由SEQIDNO:2的氨基酸1至17或SEQIDN0:4的氨基酸1至15组成,其中基因对于核苷酸序列是外源的。46在一个优选的方面,核苷酸序列包含SEQIDNO1的核苷酸1至51或SEQIDNO3的核苷酸1至45,或者由SEQIDNO1的核苷酸1至51或SEQIDNO3的核苷酸1至45组成。本发明还涉及包含这种核酸构建体的重组表达载体和重组宿主细胞。本发明还涉及用于产生蛋白质的方法,包括(a)在适合于产生所述蛋白质的条件下培养这样的重组细胞;和(b)回收所述蛋白质。所述蛋白质对于宿主细胞可以是天然的或异源的。术语“蛋白质”在本文的意思不是指特定长度的编码产物,并且因此包含肽、寡肽和蛋白质。术语“蛋白质”还包含组合以形成编码产物的两种或两种以上多肽。所述蛋白质还包括杂合多肽,其包含部分或全部多肽序列的组合,所述多肽序列从至少两种不同的蛋白质获得,其中一个或多个(数个)对于宿主细胞可以是异源或天然的。蛋白质进一步包括上述蛋白质和杂合蛋白质天然存在的等位基因变异和工程的变异。优选蛋白质是激素或其变体、酶、受体或其部分、抗体或其部分,或报告蛋白(r印orter)。在更优选的方面,所述蛋白质是氧化还原酶、转移酶、水解酶、裂合酶(lyase)、异构酶或连接酶。在更加优选的方面,所述蛋白质是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α"半乳糖苷酶、β"半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、另外的脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。基因可以从任何原核、真核或其它来源获得。通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。实施例材料作为缓冲液和底物使用的化学品是至少试剂等级的商业产品。培养基BA培养基由下述物质组成每升IOg玉米浆干物质、IOgNH4NO3UOgKH2P04、0.75gMgSO4·7H20、0.Iml普卢兰尼克(pluronic)和0.5gCaC03。高压灭菌前将pH调至6.5。YEG培养基由下述物质组成每升20g右旋糖和5g酵母提取物。基本培养基平板由下述物质组成每升6gNaNO3>0.52gKC1、1.52gKH2P04、ImlCOVE痕量元素溶液、20gNoble琼脂、20ml50%葡萄糖、2.5mlMgSO4·7Η20和20ml0.02%生物素溶液。Cove痕量金属溶液由如下物质组成每升0.04gNa2B4O7·10Η20、0·4gCuS04·5Η20、1.2gFeSO4·7Η20、0·7gMnSO4·H20,0.8gNa2MoO2·2H20和IOgZnSO4·7H20。M410培养基由如下物质组成每升50g麦芽糖、50g葡萄糖、2gMgS04·7H20、2gKH2P04、4g无水柠檬酸、8g酵母提取物、2g脲、0.5gCaCl2和0.5mlAMG痕量金属溶液。AMG痕量金属由如下物质组成每升14.3gZnSO4·7H20、2.5gCuS04·5H20、0.5gNiCl2·6H20、13.8gFeSO4·7H20、8.5gMnSO4·7H20和3g柠檬酸。实施例1家族61肽的鉴定SDS-PAGE分析。用水以110稀释商业产品。根据制造商建议的条件,在CRITERION8-16%Tris-HClSDS-PAGE凝胶上分离20μ1(Bio-RadLaboratories,Inc.,Hercules,CA,USA)。使用PRECISIONPLUSPROTEIN标准品(Bio-RadLaboratories,Inc.,Hercules,CA,USA)作为分子量标记。用BIO-SAFE考马斯染料(Bio-RadLaboratories,Inc.,Hercules,CA,USA)将凝胶染色,并用剃刀片切下可见条带进行蛋白鉴定分析。为肽测序而进行的多肽的凝胶内消化。使用MultiPROBEII液体处理机器人(PerkinElmerLifeandAnalyticalSciences,Boston,MA,USA)进行凝胶内消化。用50μ1在IOOmM碳酸氢铵ρΗ8.0中的IOmM二硫苏糖醇(DTT)将包含蛋白的凝胶条带还原30分钟。还原后,用50μ1在IOOmM碳酸氢铵ρΗ8.0中的55mM碘乙酰胺将凝胶片烷基化20分钟。使干燥的凝胶片在25μ1胰蛋白酶消化溶液(eng/μ1测序级胰蛋白酶(Promega,Madison,WI,USA)于50mM碳酸氢铵ρΗ8溶液中)室温膨胀30分钟,然后在40°C消化8小时。上述每个反应步骤之后都用合适的溶液,按照制造商的标准规程进行多次洗涤和预洗涤。使用50μ1乙腈在反应之间使凝胶片脱水,并且在各步骤之间将凝胶片风干。用HPLC级水中的1%甲酸/2%乙腈提取肽两次,共30分钟。将肽提取溶液转移至已冷却至10-15°C的96孔有裙边PCR型板(ABGene,Rochester,NY,USA),并用96孔板盖(PerkinElmerLifeandAnalyticalSciences,Boston,MA·USA)覆盖以防止蒸发。在4°C进一步保存板直至可进行质谱分析。蛋白鉴定。为了通过串联质谱从头进行肽测序,使用Q-T0FMICR0(WatersMicromassMSTechnologies,Milford,MA,USA),混合正交四极飞行时间质谱仪进行LC/MS/MS分析。Q-TOFMICRO是使用4.1版MASSLYNX软件(WatersMicromassMSTechnologies,Milford,MA,USA)完全控制的微处理器。Q-T0FMICRO适合于ULTIMATE毛细管和纳米流HPLC系统,其与FAM0S微型自动进样器和SWITCH0SII柱切换设备(LCPackings/Dionex,Sunnyvale,CA,USA)偶联,用于浓缩样品并将其脱盐。样品载入保护柱(300μmIDX5cm,PEPMAPC18),其已装配好注射环并用0.1%甲酸的水溶液以40μ1每分钟的速度使用SwitchosII泵洗涤2分钟。使用ΝΑΝ-75校准器(Dionex,Sunnyvale,CA,USA)以来自175μ1/分钟的分流中的175nl/分钟的流速,在75μπιIDχ15cm,C18,3μm,100APEPMAP(LCPackings,SanFrancisco,CA,USA)纳米流融合毛细管柱上分离肽。在45分钟的间隔中,使用0.甲酸中的乙腈的分布洗脱梯度。在215nm检测柱洗脱液,并经由配备纳米喷雾接口的电喷雾离子源导入Q-TOFMICRO。以探测扫描模式获取数据,m/z的质量范围为400-1990,将针对MS的标准切换至MS/MS以包括高于10.0次计数每秒的离子强度,并且电荷状态为+2、+3和+4。可以1.9秒的扫描时间和0.1秒的扫描间隔时间获得多达4种共洗脱物质的分析光谱。通常使用45伏特的锥孔电压,并且对碰撞能量编程以根据洗脱肽的质量和电荷状态而变化,并且在10-60伏特的范围内。合并获取的光谱,平滑处理,并以自动的方式放在中央,并产生峰列表。使用PR0TEINLYNX全局服务器2.2.05软件(WatersMicromassMSTechnologies,Milford,MA,USA)和PEAKSStudio4.5版(SPl)(BioinformaticSolutionsInc.,Waterloo,Ontario,Canada)针对所选数据库搜索峰列表。评价来自PR0TEINLYNX和PEAKSStudio搜索的结果,并进一步通过评价每个目的离子的MS/MS光谱而分析未鉴定蛋白质,并且通过鉴定y和b离子系列和将质量差异与合适的氨基酸相匹配来确定从头序列。从凝胶内消化的约24kDa多肽凝胶条带的几种多电荷离子获得肽序列。将871.56m/z序列的双电荷胰蛋白酶肽离子确定为[Leu]-Pro-Ala-Ser-Asn-Ser-Pro-Val-Thr-Asp-Val-Thr-Ser-Asn-Ala-[Leu]-Arg(SEQIDNO:5)。将615.84m/z序列的双电荷胰蛋白酶肽离子确定为Val-Asp-Asn-Ala-Ala-Thr-Ala-Ser-Pro-Ser-Gly-[Leu]-Lys(SEQIDNO:6)。将715.44m/z序列的双电荷胰蛋白酶肽离子确定为[Leu]-Pro-Ala-Asp-[Leu]-Pro-Ser-Gly-Asp-Tyr-[Leu]-[Leu]-Arg(SEQIDNO:7)。将988.58m/z序列的双电荷胰蛋白酶肽离子确定为Gly-Pro-[Leu]-[Gin]-Val-Tyr-[Leu]-Ala-Lys(SEQIDNO:8)。将1272.65m/z序列的双电荷胰蛋白酶肽离子确定为Val-Ser-Val-Asn-Gly-[Gin]-Asp-[GIn]-Gly-[Gin]-[Leu]-Lys(SEQIDNO:9)。上述的[Leu]可以是lie或Leu,并且上述的[Gin]可以是Gln或Lys,因为它们由于质量相等而无法区分。实施例2嗜热毁丝霉CBS117.65cDNA汇集物的制备在30°C在200rpm,在200mlBA培养基中培养嗜热毁丝霉CBS117.65五天。通过用衬有MIRACL0THTM(CalBiOChem,SanDiego,CA,USA)的漏斗过滤内容物而收获摇瓶培养物的菌丝体。然后将菌丝体夹在两片MIRACL0TH中间,并用吸水纸巾吸干。然后将菌丝体转移至塑料离心管,并在液氮中冷冻。将冷冻的菌丝体在-80°C冰箱中保存待用。用硫氰酸胍进行总RNA的提取,然后通过5.7MCsCl缓冲超速离心,并通过oligo(dT)-纤维素亲和色谱使用WO94/14953中所述方法进行poly(A)+RNA的分离。通过RNaseH方法(Gubler和Hoffman,1983,Gene25:263_269,Sambrook等,1989,Molecularcloning:Alaboratorymanual,ColdSpringHarborlab.,ColdSpringHarbor,NY,USA),由5μgpoly(A)+RNA合成双链cDNA。将poly(A)+RNA(5μg于5μ1用DEPC(0.焦磷酸二乙酯)处理的水中)在预硅化处理的、不含RNase的EPPENDORF管中在70°C加热8分钟,在冰上淬灭,并与反转录酶缓冲液组合于终体积50μ1,所述缓冲液由50mMTris-HCl,pH8.3,75mMKCl、3mMMgCl2、IOmM二硫苏糖醇(DTT)(BethesdaResearchLaboratories,Bethesda,MD,USA)、ImMdATP、dGTP和dTTP,和0.5mM5-甲基_dCTP(GEHealthcare,Piscataway,NJ,USA),40单位人胎盘核糖核酸酶抑制剂(RNasin;Promega,Madison,WI,USA),1.45μg寡聚(dT)18-NotI引物(GEHealthcare,Piscataway,NJ,USA),禾口1000单位SuperScriptIIRNaseH反转录酶(BethesdaResearchLaboratories,Bethesda,MD,USA)0通过在45°C将反应混合物温育1小时而合成第一链cDNA。合成后,根据生产商的说明,通过MICR0SPINS-400HR旋转柱(GEHealthcare,Piscataway,NJ,USA)将mRNA:cDNA杂合混合物凝胶过滤。凝胶过滤后,在250μ1第二链缓冲液(20mMTris-HCl,pH7.4,90mMKC1,4.6mMMgCl2,10mM(NH4)2S04,0.16mMNAD)中稀释杂合物,缓冲液中包含200μM各种dNTP,60单位大肠杆菌DNA聚合酶I(GEHealthcare,Piscataway,NJ,USA),5.25单位RNaseH(Promega,Madison,WI,USA),和15单位大肠杆菌DNA连接酶(BoehringerMannheim,Manheim,Germany)。通过在16°C温育反应管2小时和在25°C再温育15分钟而进行第二链cDNA合成。通过加入EDTA至终浓度20mM而停止反应,然后进行苯酚和氯仿提取。通过加入2倍体积的96%乙醇和0.2倍体积的IOM乙酸铵,在-20V沉淀双链cDNA12小时,以13,OOOxg离心回收,在70%乙醇中洗涤,干燥,并重悬于30μ1绿豆核酸酶缓冲液(30mM乙酸钠pH4.6,300mMNaCl,ImMZnSO4,0.35mMDTT,2%甘油)中,所述缓冲液包49含25单位绿豆核酸酶(GEHealthcare,Piscataway,NJ,USA)通过在30°C温育反应物30分钟而剪切单链发夹DNA,然后加入70μ1IOmMTris-HCl-ImMEDTApH7.5,苯酚提取,并用2倍体积的96%乙醇和0.1倍体积的3Μ乙酸钠ρΗ5.2在冰上沉淀30分钟。通过在13,OOOxg离心而回收双链cDNA,并通过将反应混合物在16°C温育1小时,而在30μ1Τ4DNA聚合酶缓冲液(20mMTris-乙酸,ρΗ7.9,IOmM乙酸镁,50mM乙酸钾,ImMDTT)中进行平端化,所述缓冲液包含0.5mM各种dNTP和5单位T4DNA聚合酶(NewEnglandBiolabs,Ipswich,MA,USA)ο通过加入EDTA至终浓度20mM而停止反应,然后进行苯酚和氯仿提取,并在_20°C通过加入2倍体积的96%乙醇和0.1倍体积的3M乙酸钠pH5.2而沉淀12小时。在填补反应后,通过在13,OOOxg离心而回收cDNA,在70%乙醇中洗涤,并干燥。实施例3嗜热毁丝霉CBS202.75和嗜热毁丝霉CBS117.65的基因组DNA提取使嗜热毁丝霉CBS202.75和嗜热毁丝霉CBS117.65菌株在45°C和200rpm,在带挡板的摇瓶中的100mlYEG培养基中生长2天。使用MIRACLOTH(Calbiochem,LaJolla,CA,USA)通过过滤收获菌丝体,在去离子水中洗涤两次,并在液氮下冷冻。通过研钵和杵将冷冻的菌丝体研磨成细粉,并使用DNEASYPlantMaxi试剂盒(QIAGENInc.,Valencia,CA,USA)分离总DNA0实施例4从嗜热毁丝霉进行家族61基因的分子筛选根据实施例1中所述通过串联质谱术所获得的肽序列设计简并引物,如下所示。引物061562(CI61A有义)5,-GCCTCCAACTCGCCCGTCACNGAYGTNAC-3,(SEQIDNO10)引物061563(CI61A反义)5,-GAGGTAGTCGCCGGANGGGATRTCNGCNGG-3,(SEQIDNO11)在PCR反应中使用CI61A有义和CI61A反义引物各五十皮摩尔,所述反应物在终体积25μ1中包括IOOng嗜热毁丝霉CBS117.65cDNA汇集物,或者嗜热毁丝霉CBS117.65基因组DNA,1XADVANTAGEGC-MeItLA缓冲液(ClontechLaboratories,Inc.,MountainView,CA,USA),dATP、dTTP、dGTP和dCTP各0.4mM,和1.25单位ADVANTAGEGC基因组聚合酶混合物(ClontechLaboratories,Inc.,MountainView,CA,USA)。使用EPPENDORFMASTERCYCLER.5333(EppendorfScientific,Inc.,Westbury,NY,USA)进行扩增,程序为94°C1分钟的1个循环;30个循环,每个循环为94°C30秒,56.5°C30秒,和72°C30秒;然后是72°C5分钟的最终延伸。在40mMTris碱-20mM乙酸钠-ImMEDTA二钠(TAE)缓冲液中,通过1%琼脂糖凝胶将反应产物分级分离,并切下大于400bp的条带,根据制造商的说明使用MiniElute凝胶提取试剂盒(QIAGENInc.,Valencia,CA,USA)纯化,并使用Τ0Ρ0⑩TA试剂盒(Invitrogen,Carlsbad,CA,USA)亚克隆。从多个大肠杆菌转化体提取质粒DNA并测序。大肠杆菌克隆的序列分析表明,序列包含家族61基因的编码区(gh61a)。在不同条件下进行的单独PCR反应中分离第二种gh61基因。在PCR反应中使用(16认有义和(16认反义引物各三十皮摩尔,所述反应物在终体积3(^1中包括200ng嗜热毁丝霉CBS202.75基因组DNA,IXTHERM0P0L缓冲液(NewEnglandBioLabs,Ipswich,MA,USA),dATP、dTTP、dGTP和dCTP各0.28mM,和1.0单位TaqDNA聚合酶(NewEnglandBioLabs,Ipswich,MA,USA)。使用R0B0CYCLER40(Strategene,LaJolla,CA,USA)进行扩增,程序为96°C3分钟的1个循环,72°C3分钟的1个循环,其间加入DNA聚合酶;30个循环,每个循环为94°C50秒,52°C50秒,和72°C90秒;然后是72°C7分钟的最终延伸。在40mMTris碱-20mM乙酸钠-ImMEDTA二钠(TAE)缓冲液中,通过1%琼脂糖凝胶将反应产物分级分离,并切下大于400-500bp的条带,根据制造商的说明使用QIAEXII⑧凝胶提取试剂盒(QIAGENInc.,Valencia,CA,USA)纯化,并使用TOPOTA试剂盒(Invitrogen,Carlsbad,CA,USA)亚克隆。从多个大肠杆菌转化体提取质粒DNA并测序。序列分析表明,几个克隆包含命名为gh61f的一个家族61基因的编码区。实施例5从嗜热毁丝霉CBS202.75分离全长家族61基因(gh61a)根据制造商的说明,使用GEN0MEWALKER通用试剂盒(ClontechLaboratories,Inc.,MountainView,CA,USA)从嗜热毁丝霉CBS202.75分离全长61家族基因(gh61a)。简而言之,分别用留下平末端的四种不同的限制酶(DraI,EcoRV,PvuII和StuI)消化嗜热毁丝霉CBS202.75的总基因组DNA。然后分别将各批消化的基因组DNA连接至GEN0MEWALKER衔接头(ClontechLaboratories,Inc.,MountainView,CA,USA)以产生四个文库。然后使用这些文库作为PCR反应中的模板,所述反应使用对于嗜热毁丝霉家族61gh61a基因的四个基因特异性引物。根据实施例4中获得的部分家族gh61a基因序列设计如下所示的引物。上游区域引物MtCel61A-Rl:5,-CCGTTCGGGCCGTCTTGGTAGATCTTGAACC-3,(SEQIDNO12)MtCel61A-R2:5,-CCGATGGAGGGATCCACGCTGAAGGTGAATT-3,(SEQIDNO13)下游区域引物MtCel61A-Fl:5,-CAGGTCAAGGCGGGCTCCCAATTCACCTT-3,(SEQIDNO14)MtCel61A-F2:5,-ACGGCACGGGAGCCGTGTGGTTCAAGATCTA-3,(SEQIDNO15)进行两次一级PCR扩增,一次分离嗜热毁丝霉gh61a基因的上游区域,另一次分离下游区域。每个PCR扩增物(25μ1)包括每种文库各μ(约6ng)作为模板,dATP、dTTP、dGTP和dCTP各0.4mM,IOpmol衔接头引物1(ClontechLaboratories,Inc.,MountainView,CA,USA),IOpmol引物MtCel61A_Rl或引物MtCel61A_Fl,IXADVANTAGEGC-MeltLA缓冲液,和1.25单位ADVANTAGEGC基因组聚合酶混合物。使用EPPEND0RFMASTERCYCLER.5333进行扩增,程序为94°C预变性1分钟;7个循环,每个循环为在94°C的变性温度30秒,在72°C退火和延伸5分钟;和32个循环,每个循环为在94°C的变性温度30秒,67°C退火和延伸5分钟;然后是67V7分钟的最终延伸。二级PCR扩增物在终体积25μ1中包括一级PCR产物各1μ1作为模板,dATP、dTTP、dGTP和dCTP各0.4mM,IOpmol衔接头引物2(ClontechLaboratories,Inc.,MountainView,CA,USA),IOpmol引物MtCel61A_R2或引物MtCel61A_F2,IXADVANTAGE(g)GC-MeltLA缓冲液,和1.25单位ADVANTAGEGC基因组聚合酶混合物。使用EPPEND0RFMASTERCYCLER5333进行扩增,程序为94°C预变性1分钟;5个循环,每个循环为在94°C的变性温度30秒,在72°C退火和延伸5分钟;和20个循环,每个循环为在94°C的变性温度30秒,在67°C退火和延伸5分钟;然后是67V7分钟的最终延伸。在TAE缓冲液中,通过1.0%琼脂糖凝胶电泳分离反应产物,其中从凝胶切下来自EcoRV文库的1.7kb产物条带(上游区域)和来自StuI文库的1.6kb条带(下游区域),根据制造商的说明使用MiniElute凝胶提取试剂盒(OIAGENInc.,Valencia,CA,USA)纯化。将PCR产物直接测序或使用TOPOTA试剂盒(Invitrogen,Carlsbad,CA,USA)亚克隆然后测序。实施例6编码具有纤维素分解增强活性的家族GH61A多肽的嗜热毁丝霉CBS202.75基因组序列的表征使用染料-终止子化学(Giesecke等,1992,J.Virol.Methods38:47_60)和引物步移策略,用Perkin-ElmerAppliedBiosystemsModel377XL自动DNA测序仪(Perkin-Elmer/AppliedBiosystems,Inc.,FosterCity,CA,USA)进行PCR片段的DNA测序。审核核苷酸序列数据的质量,并且在PHRED/PHRAP软件(UniversityofWashington,Seattle,WA,USA)的辅助下,将所有序列互相比较。根据编码蛋白与来自土生梭孢霉(登录号GENESEQP:ADM97933,GENESEQP:AEB90517)、球毛壳菌(Chaetomiumglobosum)(UNIPR0TQ2HGH1,UNIPR0T:Q2GW98)和粗糙脉孢菌(UNIPR0T:Q7S439)的同源糖苷水解酶家族61蛋白质的相似性,构建具有纤维素分解增强活性的嗜热毁丝霉GH61A多肽的基因模型。为了确认获得的嗜热毁丝霉gh61a基因的序列信息,使用一对基因特异性引物(如下所示)进行进一步的PCR反应,其包括完整基因。引物MtGH61A_F35'-ACTGGATTTACCATGAAGTTCACCTCGTCCCTCGCT-3'(SEQIDNO16)引物MtGH61A-R35,-tcacctctagttaattaa.tTAGCAAGAGACGGGGGCCG-3,(seqidno:17)黑体字代表编码序列。其余序列与pAILo2(W02004/099228)的插入位点同源。PCR由PCR反应物中的五十皮摩尔正向和反向引物组成,所述反应物在终体积50μ1中包含IOOng嗜热毁丝霉CBS202.75基因组DNA,Pfx扩增缓冲液(Invitrogen,Carlsbad,CA,USA),dATP、dTTP、dGTP和dCTP各0.4mM,ImMMgCl2,,禾口2·5单位PfxDNA聚合酶(Invitrogen,Carlsbad,CA,USA)。使用EPPENDORFMASTERCYCLER5333进行扩增,程序为98°C3分钟的1个循环;和30个循环,每个循环为98°C30秒,60°C30秒,和720C1分钟;然后是72°C15分钟的最终延伸。然后使加热块进入4°C浸入循环。在TAE缓冲液中通过1.0%琼脂糖凝胶电泳分离反应产物,并根据制造商的说明使用MiniElute凝胶提取试剂盒(QIAGENInc.,Valencia,CA,USA)纯化。为了将PCR片段克隆入pCR.:2·1-T0P0载体(Invitrogen,Carlsbad,CA,USA)中,使用TaqDNA聚合酶(NewEnglandBiolabs,Ipswich,MA,USA)加入3,A-突出部分。使用Τ0Ρ0TA克隆试剂盒将958bp嗜热毁丝霉gh61a基因片段克隆入pCR2.1-T0P0载体(Invitrogen,Carlsbad,CA,USA)以产生pSMail90(图2)。通过DNA测序确认嗜热毁丝霉gh61a插入。将大肠杆菌pSMail90于2007年12月5日保藏在农业研究机构专利培养物保藏中心北区研究中心(Peoria,IL,USA),并指定登录号B-50083。图1中显示了具有纤维素分解增强活性的嗜热毁丝霉GH61A多肽的核苷酸序列(SEQIDNO1)和推定的氨基酸序列(SEQIDNO:2)。基因组多核苷酸编码232个氨基酸的多肽,中间插入88和137bp的2个内含子。全长编码序列和成熟编码序列的%G+C分别是61.和66.5%。使用SignalP软件(Nielsen等,1997,ProteinEngineering10:1_6)预测了17个残基的信号肽。预测的成熟蛋白质包含215个氨基酸,分子量为22.BkDa0使用如EMBOSS的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48443-453)及缺口开放罚分10、缺口延伸罚分0.5和EBL0SUM62矩阵来确定氨基酸序列的比较配对全局比对。比对显示,嗜热毁丝霉GH61A成熟多肽的推定的氨基酸序列与来自土生梭孢霉的家族61糖基水解酶蛋白的推定的氨基酸序列(GeneSeqP登录号为ADM97933)具有76.6%的同一性(缺口除外)。实施例7从嗜热毁丝霉CBS202.75分离全长家族61基因(gh61f)根据制造商的说明,使用GEN0MEWALKER通用试剂盒(ClontechLaboratories,Inc.,MountainView,CA,USA)从嗜热毁丝霉CBS202.75分离全长家族61基因(gh61f)。简而言之,分别用留下平末端的四种不同的限制酶(DraI,EcoRV,PvuII和StuI)消化嗜热毁丝霉CBS202.75的总基因组DNA。然后分别将各批消化的基因组DNA连接至GEN0MEWALKER衔接头(ClontechLaboratories,Inc.,MountainView,CA,USA)以产生四个文库。然后使用这些文库作为PCR反应中的模板,所述反应使用嗜热毁丝霉家族61基因(gh61f)的基因特异性引物。根据实施例4中获得的部分家族61gh61f基因序列设计如下所示的引物。上游区域引物MtGH6IF-Rl:5’-CCCTTGTGGCTGGCGTCCATGACATCGTC-3,(SEQIDNO18)MtGH61F-R2:5,-GTGCCTCCAGATGGCCTTGACCGTGGTG-3,(SEQIDNO19)下游区域引物MtGH61F-F6:5’-GGCGGCGAGCACTACATGTGAGCCATTCCT-3’(SEQIDNO20)MtGH61F-F7:5’-TGACGATCTCGCTGACCCGTGCAACAAGTG-3,(SEQIDNO21)进行两次一级PCR扩增,一次分离嗜热毁丝霉gh61f基因的上游区域,另一次分离下游区域。每个PCR扩增物(25μ1)包括每种文库各μ(约6ng)作为模板,dATP、dTTP、dGTP和dCTP各0.4mM,IOpmol衔接头引物1(ClontechLaboratories,Inc.,MountainView,CA,USA),IOpmol引物MtCel61F_Rl或引物MtCel61F_F6,IXADVANTAGEGC-MeltLA缓冲液,和1.25单位ADVANTAGEGC基因组聚合酶混合物。使用EPPEND0REMASTERCYCLER5333进行扩增,程序为94°C预变性1分钟;7个循环,每个循环为在94°C的变性温度30秒,在72°C退火和延伸5分钟;和32个循环,每个循环为在94°C的变性温度30秒,67°C退火和延伸5分钟;然后是67V7分钟的最终延伸。二级PCR扩增物在终体积25μ1中包括一级PCR产物各1μ1作为模板,dATP、dTTP、dGTP和dCTP各0.4mM,IOpmol衔接头引物2(ClontechLaboratories,Inc.,MountainView,CA,USA),IOpmol引物MtCel61F_R2或引物MtCel61F_F7,IXADVANTAGEGC-MeltLA缓冲液,和1.25单位ADVANTAGEGC基因组聚合酶混合物。使用EPPEND0RFMASTERCYCLER.5333进行扩增,程序为94°C预变性1分钟;5个循环,每个循环为在94°C的变性温度30秒,在72°C退火和延伸5分钟;和20个循环,每个循环为在94°C的变性温度30秒,在67°C的退火和延伸5分钟;然后是67。C7分钟的最终延伸。在TAE缓冲液中,通过1.0%琼脂糖凝胶电泳分离反应产物,其中从凝胶切下来自PuvII文库的1.3kbPCR产物条带(上游区域)和来自PuvII文库的1.2kb条带(下游区域),根据制造商的说明使用MiniElute凝胶提取试剂盒(QIAGENInc.,Valencia,CA,USA)纯化。并将PCR产物直接测序或使用TOPOTA试剂盒(Invitrogen,Carlsbad,CA,USA)亚克隆然后测序。实施例8编码具有纤维素分解增强活性的家族GH61F多肽的嗜热毁丝霉基因组序列的表征使用染料-终止子化学(Giesecke等,1992,J.Virol.Methods38:47_60)和引物步移策略,用AppliedBiosystemsModel377XL自动DNA测序仪(AppliedBiosystems,FosterCity,CA,USA)进行PCR片段的DNA测序。审核核苷酸序列数据的质量,并且在PHRED/PHRAP软件(UniversityofWashington,Seattle,WA,USA)的辅助下,将所有序列互相比较。根据编码蛋白与来自土生梭孢霉(登录号GENESEQP:ADM97933,GENESEQP:AEB90517)、球毛壳菌(UNIPR0T:Q2HGH1,UNIPR0T:Q2GW98)和粗糙脉孢菌(UNIPR0T:Q7S439)的同源糖苷水解酶家族61蛋白质的相似性,构建具有纤维素分解增强活性的嗜热毁丝霉GH61F多肽的基因模型。为了确认获得的嗜热毁丝霉gh61f基因的序列信息,使用基因特异性引物(如下所示)进行进一步的PCR反应,其包括完整基因。引物MtGH61F_F85,-ACTGGATTTACCATGAAGGCCCTCTCTCTCCTTGCG.-3,(SEQIDNO22)引物MtGH61F_R35'-TCACCTCTAGTTAATTAACTAGCACTTGAAGACGGGCG-3'(SEQIDNO:23)黑体字代表编码序列。其余序列与pAILo2(W02004/099228)的插入位点同源。PCR由PCR反应物中的五十皮摩尔正向和反向引物组成,所述反应物在终体积50μ1中包含IOOng嗜热毁丝霉CBS202.75基因组DNA,Pfx扩增缓冲液(Invitrogen,Carlsbad,CA,USA),dATP、dTTP、dGTP和dCTP各0.4mM,ImMMgCl2,,禾口2·5单位PfxDNA聚合酶(Invitrogen,Carlsbad,CA,USA)。使用EPPENDORFMASTERCYCLER5333进行扩增,程序为98°C3分钟的1个循环;和30个循环,每个循环为98°C30秒,60°C30秒,和720C1分钟;然后是72°C15分钟的最终延伸。然后加热块进入4°C浸入循环。在TAE缓冲液中通过1.0%琼脂糖凝胶电泳分离反应产物,并根据制造商的说明使用MiniElute凝胶提取试剂盒(QIAGENInc.,Valencia,CA,USA)纯化。为了将PCR片段克隆入pCR2·1-T0P0载体(Invitrogen,Carlsbad,CA,USA)中,使用TaqDNA聚合酶(NewEnglandBiolabs,Ipswich,MA,USA)加入3,A-突出部分。使用Τ0Ρ0TA克隆试剂盒将884bp嗜热毁丝霉gh61f基因片段克隆入pCR2.1-T0P0载体(Invitrogen,Carlsbad,CA,USA)以产生pSMail92(图2)。通过DNA测序确认嗜热毁丝霉gh61f插入。将大肠杆菌pSMail92于2007年12月5日保藏在农业研究机构专利培养物保藏中心北区研究中心(1815UniversityStreet,Peoria,IL,USA),并指定登录号B-50085。图1中显示了具有纤维素分解增强活性的嗜热毁丝霉GH61F多肽的核苷酸序列(SEQIDNO3)和推定的氨基酸序列(SEQIDNO4)。基因组多核苷酸编码235个氨基酸的多肽,中间插入62和84bp的2个内含子。全长编码序列和成熟编码序列的%G+C分别是64.1%和65.4%。使用SignalP软件(Nielsen等,1997,ProteinEngineering10:1-6)54预测了15个残基的信号肽。预测的成熟蛋白质包含220个氨基酸,分子量为23kDa。使用如EMBOSS的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48443-453)及缺口开放罚分10、缺口延伸罚分0.5和EBL0SUM62矩阵来确定氨基酸序列的比较配对全局比对。比对显示,嗜热毁丝霉GH61F成熟多肽的推定的氨基酸序列与来自球毛壳菌的家族61糖基水解酶蛋白的推定的氨基酸序列(UniProt登录号Q2HGH1)具有83.8%的同一性(缺口除外)。实施例9米曲霉表达载体的构建,所述载体包含编码具有纤维素分解增强活性的家族GH61A多肽的嗜热毁丝霉CBS202.75基因组序列使用Infusion克隆试剂盒(BDBiosciences,PaloAlto,CA,USA),将实施例6中产生的相同的958bp嗜热毁丝霉gh61aPCR片段克隆入NcoI和PacI消化的pAILo2(W02004/099228),得到pSMail85(图5),其中嗜热毁丝霉gh6Ia基因的转录在来自黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸异构酶的杂合启动子(NA2_tpi启动子)的控制下。连接反应物(50μ1)包括IXInFusion缓冲液(BDBiosciences,PaloAlto,CA,USA),IXBSA(BDBiosciences,PaloAlto,CA,USA),1μ1Infusion酶(110稀释)(BDBiosciences,PaloAlto,CA,USA),IOOng用NcoI和PacI消化的pAILo2,和50ng嗜热毁丝霉gh61a纯化PCR产物。在室温温育反应物30分钟。使用1μ1反应物转化大肠杆菌XL10S0L0PACKGold超感受态细胞(Stratagene,LaJolla,CA,USA)0通过限制性消化检测包含pSMail85的大肠杆菌转化体,并使用BI0R0B0T9600(QIAGENInc.,Valencia,CA,USA)制备质粒DNA。通过DNA测序确认pSMail85中的嗜热毁丝霉gh61a插入。实施例10米曲霉表达载体的构建,所述载体包含编码具有纤维素分解增强活性的家族GH61F多肽的嗜热毁丝霉CBS202.75基因组序列使用Infusion克隆试剂盒(BDBiosciences,PaloAlto,CA,USA),将实施例8中产生的相同的884bp嗜热毁丝霉gh61fPCR片段克隆入NcoI和PacI消化的pAILo2(TO2004/099228),得到pSMail98(图6),其中嗜热毁丝霉gh6If基因的转录在来自黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸异构酶的杂合启动子(NA2_tpi启动子)的控制下。连接反应物(50μ1)包括IXInFusion缓冲液(BDBiosciences,PaloAlto,CA,USA),IXBSA(BDBiosciences,PaloAlto,CA,USA),1μ1Infusion酶(110稀释)(BDBiosciences,PaloAlto,CA,USA),IOOng用NcoI和PacI消化的pAILo2,和50ng嗜热毁丝霉gh61f纯化PCR产物。在室温温育反应物30分钟。使用1μ1反应物转化大肠杆菌XL10S0L0PACKGold超感受态细胞(Stratagene,LaJolla,CA,USA)0通过限制性消化检测包含pSMail98的大肠杆菌转化体,并使用BI0R0B0T9600(QIAGENInc.,Valencia,CA,USA)制备质粒DNA。通过DNA测序确认pSMail98中的嗜热毁丝霉gh61f插入。实施例11嗜热毁丝霉家族61糖基水解酶基因(gh61a和gh61f)分别在米曲霉JaL355中的表达根据Christensen等,1988,Bio/Technology6:1419_1422的方法制备米曲霉JaL355(W02002/40694)原生质体。各自将3ygpSMail85(gh61a)或pSMail98(gh61f)转化入米曲霉JaL355。从每次转化实验分离二十个转化体到各个基本培养基平板。用5ml0.01%TffEEN20洗涤每个转化体的汇合的基本培养基平板,并各自接种到125ml玻璃摇瓶中的25mlM410培养基中,并在34°C,250rpm温育。接种5天后,根据制造商的说明,用CRITERIONCell(Bio-RadLaboratories,Inc.,Hercules,CA,USA)在CRITERION8-16%Tris-HCl凝胶上分析来自每种培养物的5μ1上清。用ΒΙΟ-SAFE考马斯染料将得到的凝胶染色。培养物的SDS-PAGE谱表明,大多数转化体具有期望的条带大小GH61A为23KDa,GH61F为23KDa。用IOml0.01%TffEEN20洗涤各一个高蛋白表达GH61A和GH61F转化体,并接种到包含500mlM410培养基的2升Fernbach中,产生用于表征蛋白的培养液。在第5天收获培养物,并使用0.22μmEXPRESSPlus膜(Millipore,Bedford,MA,USA)过滤。实施例12嗜热毁丝霉GH61A和GH61F多肽对于预处理的玉米秸酶水解的影响如实施例11中所述制备培养液并使用Amicon超滤设备(Millipore,Bedfored,ΜΑ.,IOkDa聚乙醚砜膜,40psi,4°C)浓缩约20倍。通过密度测定然后SDS-PAGE和考马斯蓝染色来估计蛋白浓度。如WO2005/074647所述将玉米秸预处理并制备为测定底物,以产生预处理的玉米秸(PCS)。从里氏木霉菌株SMA135(W02008/057637)制备用于测定增强活性的基础纤维素酶混合物。使用1.6ml深孔板(Axygen,SantaClara,CA.),使用1.Oml的总反应体积和ImM硫酸镁_50mM乙酸钠,pH5.0中50mg/ml的PCS浓度,进行PCS的水解。以基础纤维素酶混合物的蛋白浓度为0-25%的浓度向基础纤维素酶混合物加入嗜热毁丝霉多肽(GH61A和GH61F)。在50°C温育168小时。实验进行三次重复。离心等分试样,并通过使用板式离心机(S0RVALLRT7,ThermoFisherScientific,ffaltham,MA,USA)以3000rpm离心(MULTISCREENHV0.45μm,Millipore,Billerica,MA,USA)10分钟而过滤上清液。不立即使用时,在-20°C冷冻过滤的水解物等分试样。在65°C,以0.6ml/分钟的流Ι/Λ4.6x250mmAMINEXHPX-87Hft(Bio-RadLaboratories,Inc.,Inc.,Hercules,CA,USA)通过包含0.05%w/w苯甲酸的0.005MH2SO4洗脱,然后测定在包含0.05%w/w苯甲酸的0.005MH2SO4中稀释的样品的糖浓度,通过积分来自折射率检测(CHEMSTATI0N_,AGILENT1100HPLC,AgilentTechnologies,SantaClara,CA,USA)的葡萄糖和纤维二糖信号而定量,所述检测由纯糖样品(AbsoluteStandardsInc.,Hamden,CT,USA)校准。使用得到的当量计算每次反应的纤维素转化百分比。使用下式计算对葡萄糖加纤维二糖的纤维素转化率程度(转化率,%)转化率(%)=(葡萄糖+纤维二糖xl.053)(mg/ml)xl00xl62/(纤维素(mg/ml)xl80)=(葡萄糖+纤维二糖xl.053)(mg/ml)xlOO/(纤维素(mg/ml)xl.Ill)在这个等式中,因数1.111反映将纤维素转化成葡萄糖中的重量增加,而因数1.053反映将纤维二糖转化成葡萄糖中的重量增加。通过有限消化PCS而释放葡萄糖和纤维二糖,来确定PCS中的纤维素。向基础纤维素酶混合物中加入渐增量的嗜热毁丝霉多肽的结果如图7所示。加入嗜热毁丝霉GH61A多肽在25%的加入水平提供1.26的刺激因子。在相同的加入百分比,嗜热毁丝霉GH61F提供1.13的刺激因子。将刺激因子定义为在存在加入的GH61蛋白时观察到的转化率与在不存在加入的GH61蛋白时的转化率的比值。生物材料的保藏权利要求具有纤维素分解增强活性的分离的多肽,其选自下组(a)包含氨基酸序列的多肽,所述氨基酸序列与SEQIDNO2或SEQIDNO4的成熟多肽具有至少60%同一性;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交(i)SEQIDNO1或SEQIDNO3的成熟多肽编码序列,(ii)包含于SEQIDNO1或SEQIDNO3的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;(c)由包含核苷酸序列的多核苷酸编码的多肽,所述核苷酸序列与SEQIDNO1的成熟多肽编码序列具有至少60%同一性;和(d)SEQIDNO2或SEQIDNO4的成熟多肽的包含取代、缺失和/或插入一个或多个(数个)氨基酸的变体。2.权利要求1的多肽,其包含SEQIDNO2或SEQIDNO4的氨基酸序列或其具有纤维素分解增强活性的片段,或由SEQIDNO:2或SEQIDNO:4的氨基酸序列或其具有纤维素分解增强活性的片段组成。3.权利要求1的多肽,所述多肽由下述质粒中所含的多核苷酸编码包含在大肠杆菌NRRLB-50083中的质粒pSMai190,或者包含在大肠杆菌NRRLB-50085中的质粒pSMai192。4.分离的多核苷酸,其包含编码权利要求1-3中任一项的多肽的核苷酸序列。5.核酸构建体,其包含权利要求4的多核苷酸,所述多核苷酸与一个或多个(数个)调控序列可操作地连接,所述调控序列指导多肽在表达宿主中产生。6.重组宿主细胞,其包含权利要求5的核酸构建体。7.用于产生权利要求1-3中任一项的多肽的方法,其包括(a)在有益于所述多肽产生的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。8.用于产生权利要求1-3中任一项的多肽的方法,其包括(a)在有益于所述多肽产生的条件下培养包含核酸构建体的宿主细胞,所述核酸构建体包含编码所述多肽的核苷酸序列;和(b)回收所述多肽。9.用于产生亲本细胞的突变体的方法,所述方法包括破坏或缺失编码权利要求1-3中任一项的多肽的核苷酸序列,其导致突变体与亲本细胞相比产生较少的所述多肽。10.用于产生权利要求1-3中任一项的多肽的方法,其包括(a)在有益于所述多肽产生的条件下培养转基因植物或植物细胞,所述转基因植物或植物细胞包含编码多肽的多核苷酸;和(b)回收所述多肽。11.转基因植物、植物部分或植物细胞,其已经用编码权利要求1-3中任一项的多肽的多核苷酸转化。12.包含权利要求4的多核苷酸的亚序列的双链抑制RNA(dsRNA)分子,其中任选地所述dsRNA是siRNA或miRNA分子。13.用于抑制具有纤维素分解增强活性的多肽在细胞中表达的方法,其包括对所述细胞施用双链RNA(dsRNA)分子,或者在所述细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包括权利要求4的多核苷酸的亚序列。14.核酸构建体,其包含编码蛋白质的基因,所述基因与编码信号肽的核苷酸序列可操作地连接,所述信号肽包含SEQIDNO2的氨基酸1至17或SEQIDNO4的氨基酸1至15,或由SEQIDNO:2的氨基酸1至17或SEQIDNO:4的氨基酸1至15组成,其中所述基因对于所述核苷酸序列是外源的。15.重组表达载体,其包含权利要求14的核酸构建体。16.用于产生蛋白质的方法,其包括(a)在有益于所述蛋白质产生的条件下培养权利要求15的重组宿主细胞;和(b)回收所述蛋白质。17.降解或转化纤维素材料的方法,其包括在权利要求1-3中任一项的具有纤维素分解增强活性的多肽存在下,用纤维素分解酶组合物处理纤维素材料,其中与不存在具有纤维素分解增强活性的多肽相比,具有纤维素分解增强活性的多肽的存在增加纤维素材料的降解。18.权利要求17的方法,还包括回收已降解的纤维素材料。19.产生发酵产物的方法,其包括(a)在权利要求1-3中任一项的具有纤维素分解增强活性的多肽存在下,用纤维素分解酶组合物糖化纤维素材料,其中与不存在具有纤维素分解增强活性的多肽相比,具有纤维素分解增强活性的多肽的存在增加纤维素材料的降解;(b)用一种或多种发酵微生物发酵步骤(a)的糖化的纤维素材料以产生发酵产物;和(c)从发酵中回收所述发酵严物。20.发酵纤维素材料的方法,其包括用一种或多种发酵微生物发酵纤维素材料,其中在权利要求1-3中任一项的具有纤维素分解增强活性的多肽的存在下用纤维素分解酶组合物水解所述纤维素材料,并且与不存在具有纤维素分解增强活性的多肽相比,具有纤维素分解增强活性的多肽的存在增加纤维素材料的水解。全文摘要本发明涉及具有纤维素分解增强活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及用于制备和使用所述多肽的方法。文档编号C12N9/42GK101952420SQ200880127123公开日2011年1月19日申请日期2008年12月18日优先权日2007年12月19日发明者保罗·哈里斯,苏钦德拉·梅尤兰,金伯利·布朗申请人:诺维信公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1