具有纤维素分解增强活性的多肽及编码其的多核苷酸的制作方法

文档序号:1413533阅读:419来源:国知局

专利名称::具有纤维素分解增强活性的多肽及编码其的多核苷酸的制作方法
技术领域
:本发明涉及具有纤维素分解增强活性的多肽和编码所述多肽的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞以及产生和使用所述多肽的方法。
背景技术
:纤维素是单糖葡萄糖通过¢-1,4-键共价连接的聚合物。许多微生物产生水解连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和¢-葡糖苷酶。内切葡聚糖酶在随机位置消化纤维素聚合物,使其暴露于纤维二糖水解酶攻击(attack)。纤维二糖水解酶继而从纤维素聚合物的末端释放纤维二糖的分子。纤维二糖是水溶性的^-I,4-连接的葡萄糖二聚体。P-葡糖苷酶将纤维二糖水解成葡萄糖。将含木素纤维素原料(lignocellulosicfeedstock)转化为乙醇具有以下优势大量原料现成可用,避免燃烧或填埋材料的合意性和乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将纤维素转化成葡萄糖,葡萄糖容易地由酵母发酵成乙醇。WO2005/074647公开了来自土生梭抱壳(Thielaviaterrestris)的具有纤维素分解增强活性的多肽。WO2005/074656公开了来自橙橘嗜热子囊菌(Thermoascusaurantiacus)的具有纤维素分解增强活性的多肽。W02007/089290公开了来自里氏木霉(Trichodermareesei)的具有纤维素分解增强活性的多肽。WO2009/085935;WO2009/085859;W02009/085864;和W02009/085868公开了来自嗜热毁丝霉(Myceliophthorathermophila)的的具有纤维素分解增强活性的多肽。本领域中有对于供用于降解纤维素材料、具有改善性质的具有纤维素分解增强活性的多肽的需要。本发明提供了具有纤维素分解增强活性的多肽的编码所述多肽的多核苷酸。
发明内容本发明涉及具有纤维素分解增强活性的分离的多肽,其选自下组(a)多肽,其具有与SEQIDNO:2,SEQIDN0:6,或SEQIDNO:12的成熟多肽至少60%序列同一性;与SEQIDN0:4的成熟多肽至少65%序列同一性;与SEQIDN0:18的成熟多肽至少70%序列同一性;与SEQIDNO:10,SEQIDN0:16,或SEQIDN0:22的成熟多肽至少75%序列同一性;与SEQIDNO:8的成熟多肽至少80%序列同一性;与SEQIDNO:14的成熟多肽至少85%序列同一性;或者与SEQIDNO:20的成熟多肽至少90%序列同;性;(b)多肽,其由多核苷酸编码,所述多核苷酸在中等-高,高或非常高严格条件下与以下杂交(i)SEQIDNO:I,SEQIDNO:3,SEQIDNO:5,SEQIDNO:11,或SEQIDNO:17的成熟多肽编码序列,(ii)包含于SEQIDN0:1,SEQIDNO:3,SEQIDNO:5,SEQIDN0:11,或SEQIDNO:17的成熟多肽编码序列中的cDNA序列,或(iii)⑴或(ii)的全长互补链;在高或非常高严格条件下与以下杂交(i)SEQIDN0:7,SEQIDN0:9,SEQIDNO:13,SEQIDNO:15,或SEQIDN0:21的成熟多肽编码序列,(ii)包含于SEQIDNO:7,SEQIDN0:9,SEQIDNO:13,SEQIDN0:15,或SEQIDN0:21的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;或者在非常高严格条件下与以下杂交i)SEQIDNO:19的成熟多肽编码序列,(ii)包含于SEQIDNO:19的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;(c)多肽,其由多核苷酸编码,所述多核苷酸具有与SEQIDN0:1,SEQIDN0:5,或SEQIDNO:11的成熟多肽编码序列至少60%序列同一性;与SEQIDN0:3的成熟多肽编码序列至少65%序列同一性;与SEQIDNO:17的成熟多肽编码序列至少70%序列同一性;与SEQIDN0:9,SEQIDNO:15,或SEQIDN0:21的成熟多肽编码序列至少75%序列同一性;与SEQIDN0:7的成熟多肽编码序列至少80%序列同一性;与SEQIDNO:13的成熟多肽编码序列至少85%序列同一性;或者与SEQIDNO:19的成熟多肽编码序列至少90%序列同一性;或者其cDNA序列;(d)变体,其包含SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,或SEQIDNO:22的成熟多肽的一个或多个(几个)取代,缺失,和/或插入;和(e)(a),(b),(C),或⑷的多肽具有纤维素分解增强活性的片段。本发明还涉及编码本发明的多肽的分离的多核苷酸;包含所述多核苷酸的核酸构建体,重组表达载体和重组宿主细胞;以及产生所述多肽的方法。本发明还涉及降解或转化纤维素材料的方法,包括在本发明具有纤维素分解增强活性的多肽的存在下用酶组合物处理所述纤维素材料。本发明还涉及产生发酵产物的方法,包括(a)在本发明具有纤维素分解增强活性的多肽的存在下用酶组合物糖化所述纤维素材料;(b)用一种或多种(几种)发酵微生物发酵糖化的纤维素材料以产生发酵产物;和(C)从发酵回收所述发酵产物。本发明还涉及发酵纤维素材料的方法,包括用一种或多种(几种)发酵微生物发酵所述纤维素材料,其中所述纤维素材料经在本发明具有纤维素分解增强活性的多肽的存在下用酶组合物的糖化。本发明还涉及编码信号肽的多核苷酸,所述信号肽包含或组成为(consistingof)SEQIDNO:2的氨基酸I至17,SEQIDNO:4的氨基酸I至19,SEQIDNO:6的氨基酸I至17,SEQIDNO:8的氨基酸I至19,SEQIDNO:10的氨基酸I至21,SEQIDNO:12的氨基酸I至24,SEQIDNO:14的氨基酸I至16,SEQIDNO:16的氨基酸I至18,SEQIDNO:18的氨基酸I至22,SEQIDNO:20的氨基酸I至16,或SEQIDNO:22的氨基酸I至19,其可操作地连接于编码蛋白的基因;涉及包含所述多核苷酸的核酸构建体,表达载体,和重组宿主细胞;和产生蛋白的方法。图I显示编码具有纤维素分解增强活性的土生梭孢壳NRRL8126GH61J多肽的基因的不含内含子的基因组DNA序列和推导的氨基酸序列。含有内含子的全长基因组DNA序列示于SEQIDNO:I,而推导的氨基酸序列示于SEQIDNO:2。图2显示编码具有纤维素分解增强活性的土生梭孢壳NRRL8126GH61K多肽的基因的不含内含子的基因组DNA序列和推导的氨基酸序列。含有内含子的全长基因组DNA序列不于SEQIDNO:3,而推导的氨基酸序列不于SEQIDNO:4。图3显示编码具有纤维素分解增强活性的土生梭孢壳NRRL8126GH61L多肽的基因的不含内含子的基因组DNA序列和推导的氨基酸序列。含有内含子的全长基因组DNA序列不于SEQIDNO:5,而推导的氨基酸序列不于SEQIDNO:6。图4显示在不同浓度的具有纤维素分解增强活性的土生梭孢壳NRRL8126GH61J,GH61K和GH61L多肽的存在下用里氏木霉纤维素酶混合物水解经预处理的玉米秸杆(PCS)。图5显示pSMail97的限制图。图6显示编码具有纤维素分解增强活性的土生梭孢壳NRRL8126GH61M多肽的基因的基因组DNA序列和推导的氨基酸序列(分别为SEQIDN0:7和8)。图7显示在不同浓度的具有纤维素分解增强活性的土生梭孢壳NRRL8126GH61M多肽的存在下用里氏木霉纤维素酶混合物水解经预处理的玉米秸杆(PCS)。图8显示编码具有纤维素分解增强活性的土生梭孢壳NRRL8126GH61N多肽的基因的基因组DNA序列和推导的氨基酸序列(分别为SEQIDN0:9和10)。图9显示在不同浓度的具有纤维素分解增强活性的土生梭孢壳NRRL8126GH61N多肽的存在下用里氏木霉纤维素酶混合物水解经预处理的玉米秸杆(PCS)。图10显示编码具有纤维素分解增强活性的土生梭孢壳NRRL8126GH610多肽的基因的基因组DNA序列和推导的氨基酸序列(分别为SEQIDN0:11和12)。图11显示编码具有纤维素分解增强活性的土生梭孢壳NRRL8126GH61P多肽的基因的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:13和14)。图12显示编码具有纤维素分解增强活性的土生梭孢壳NRRL8126GH61R多肽的基因的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:15和16)。图13显示编码具有纤维素分解增强活性的土生梭孢壳NRRL8126GH61S多肽的基因的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:17和18)。图14显示编码具有纤维素分解增强活性的土生梭孢壳NRRL8126GH61T多肽的基因的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:19和20)。图15显示编码具有纤维素分解增强活性的土生梭孢壳NRRL8126GH61U多肽的基因的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:21和22)。定义具有纤维素分解增强活性的多肽术语“具有纤维素分解增强活性的多肽”意指增强具有纤维素分解活性的酶水解纤维素材料的GH61。就本发明而言,通过测量由纤维素分解酶在下述条件下水解纤维素材料所导致的还原糖增加或纤维二糖与葡萄糖的总量增加来确定纤维素分解增强活性l_50mg总蛋白/gPCS中的纤维素,其中总蛋白包含50-99.5%w/w的纤维素分解酶蛋白,及0.5-50%w/w的具有纤维素分解增强活性的GH61多肽的蛋白质,在50°C历时1-7天,与用等量的总蛋白加载量而无纤维素分解增强活性(l-50mg纤维素分解蛋白/gPCS中的纤维素)所进行的对照水解相比。在一个优选的方面,使用在总蛋白重量的2-3%的米曲霉(Aspergillusoryzae)P-葡糖苷酶(根据W002/095014在米曲霉中重组产生)或者总蛋白重量的2-3%的烟曲霉(Aspergillusfumigatus)¢-葡糖苷酶(如WO2002/095014所述在米曲霉中重组产生)的纤维素酶蛋白加载量存在下的CELLUCLASTI.5L(NovozymesA/S,Bagsvaerd,Denmark)的混合物作为纤维素分解活性的来源。具有纤维素分解增强活性的GH61多肽通过降低达到相同水解程度所需的纤维素分解酶的量而增强由具有纤维素分解活性的酶催化的纤维素材料的水解,优选降低至少I.01倍,更优选至少I.05倍,更优选至少I.10倍,更优选至少I.25倍,更优选至少I.5倍,更优选至少2倍,更优选至少3倍,更优选至少4倍,更优选至少5倍,甚至更优选至少10倍,并且最优选至少20倍。本发明的多肽具有SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16,SEQIDNO18,SEQIDN0:20,或SEQIDNO22的成熟多肽的纤维素分解增强活性的至少20%,例如,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少95%,和至少100%。家族61糖苷水解酶术语“家族61糖苷水解酶”或“家族GH61”或“GH61”意指根据HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309-316,及HenrissatB.,和BairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695-696属于糖苷水解酶家族61的多肽。纤维素分解酶或纤维素酶术语“纤维素分解酶”或“纤维素酶”意指一种或多种(几种)水解纤维素材料的酶。此类酶包括内切葡聚糖酶、纤维二糖水解酶、3-葡糖苷酶或其组合。测量纤维素分解活性的两种基本方法包括(I)测量总纤维素分解活性,和(2)测量单独的纤维素分解活性(内切葡聚糖酶、纤维二糖水解酶和3-葡糖苷酶),如Zhang等,Outlookforcellulaseimprovement-Screeningandselectionstrategies,2006,BiotechnologyAdvances24:452-481所综述的。总纤维素分解活性通常是使用不溶性底物来测定的,所述底物包括WhatmanNo.I滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、经预处理的木素纤维素等。最常见的总纤维素分解活性测定法是使用WhatmanNo.I滤纸作为底物的滤纸测定法。该测定法是由InternationalUnionofPureandAppliedChemistry(IUPAC)(Ghose,1987,Measurementofcellulaseactivities,PureAppI.Chem.59:257-68)确立的。就本发明而言,纤维素分解酶活性通过测量在下述条件下由纤维素分解酶进行的纤维素材料水解的增加来确定l_20mg的纤维素分解酶蛋白/g的PCS中纤维素在50°C进行3-7日,与未添加纤维素分解酶蛋白的对照水解相比较。典型条件为1ml反应液,经洗涤或未洗涤的PCS,5%不溶性固形物,50mM乙酸钠pH5,ImMMnSO4,50°C,72小时,通过AMINEXHPX-87H柱(Bio-RadLaboratories,Inc.,Hercules,CA,USA)进行糖分析。内切葡聚糖酶术语“内切葡聚糖酶”意指内切-1,4-(1,3;1,4)-P-D-葡聚糖4-葡聚糖水解酶(endo-1,4-3-D-glucan4-glucanohydrolase)(E.C.3.2.I.4),其催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣淀粉(Iichenin)中的1,4-^-D-糖苷键、混合的P-I,3葡聚糖例如谷类P-D-葡聚糖或木葡聚糖和含有纤维素组分的其它植物材料中的P-1,4键的内水解(endohydrolysis)。内切葡聚糖酶活性可通过测量底物粘度的减少或由还原糖测定法(Zhang等,2006,BiotechnologyAdvances24:452-481)确定的还原端增加来确定。就本发明而言,根据Ghose,1987,PureandAppI.Chem.59:257-268的方法,在pH5,40°C,使用羧甲基纤维素(CMC)作为底物来确定内切葡聚糖酶活性。纤维二糖水解酶术语“纤维二糖水解酶”意指1,4-P-D-葡聚糖纤维二糖水解酶(I,4-beta-D-glucancellobiohydrolase)(E.C.No.3.2.I.91),其催化纤维素、纤维素寡糖,或任何包含¢-1,4-连接的葡萄糖的聚合物中的1,4-P-D-糖苷键的水解,从链的还原或非还原末端释放纤维二糖(Teeri,1997,Crystallinecellulosedegradation:Newinsightintothefunctionofcellobiohydrolases,TrendsinBiotechnology15:160-167;Teeri等,1998,Trichodermareeseicellobiohydrolases:whysoefficientoncrystallinecellulose,Biochem.Soc.Trans.26:173-178)。就本发明而言,根据Lever等,1972,Anal.Biochem.47:273-279;vanTilbeurgh等,1982,FEBSLetters,149:152-156;vanTilbeurgh和Claeyssens,1985,FEBSLetters,187:283-288;以及Tomme等,1988,Eur.J.Biochem.170:575-581描述的方法确定纤维二糖水解酶活性。在本发明中,可采用Lever等的方法来评价玉米稻杆中的纤维素水解,而vanTilbeurgh等和Tomme等的方法可用于确定对突光二糖衍生物4-甲基伞形基-D-乳糖苷(4-methylumbelliferyl-&-D-Iactoside)的纤维二糖水解酶活性。P-葡糖苷酶术语“3-葡糖苷酶”意指P-D-葡糖苷葡糖水解酶(beta-D-glucosideglucohydrolase)(E.C.No.3.2.I.21),其催化末端非还原3-D-葡萄糖残基的水解,并释放P-D-葡萄糖。就本发明而言,¢-葡糖苷酶活性是根据由Venturi等,2002,Extracellularbeta-D-glucosidasefromChaetomiumthermophilumvar.coprophilum:production,purificationandsomebiochemicalproperties,J.BasicMicrobiol.42:55-66所述的基本步骤确定的。一单位的P-葡糖苷酶定义为在25°C,pH4.8从作为底物的ImM对硝基苯基-P-D-葡糖吡喃糖苷在含有0.01%TWEEN20的50mM柠檬酸钠中每分钟产生I.0微摩尔的对硝基苯酚阴离子。半纤维素分解酶或半纤维素酶术语“半纤维素分解酶”或“半纤维素酶”意指一种或多种(几种)水解半纤维素材料的酶。参见,例如Shallom,D.和Shoham,Y.Microbialhemicellulases.CurrentOpinionInMicrobiology,2003,6(3):219-228)。半纤维素酶是植物生物质降解中的关键成分。半纤维素酶的实例包括但不限于乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。这些酶的底物,半纤维素,是支化和直链多糖的混杂集团,这些多糖通过氢键键合于植物细胞壁中的纤维素微纤维,将其交联为鲁棒(robust)的网络。半纤维素亦共价地附于木质素,与纤维素一同形成高度复杂的结构。半纤维素的可变的结构和组织形式需要许多酶的协同作用使其完全降解。半纤维素酶的催化模块为水解糖苷键的糖苷水解酶(GH),或水解乙酸或阿魏酸侧基酯连接的糖酯酶(CE)。这些催化模块,基于其一级结构的同源性,可指派为以数字标记的GH和CE家族。一些家族,具有总体上类似的折叠,可进一步归类为宗族(clan),以字母标记(例如,GH-A)。最具信息性和最新的这些和其他糖活性酶的分类可在Carbohydrate-ActiveEnzymes(CAZy)数据库获得。半纤维素分解酶活性可根据Ghose和Bisaria,1987,Pure&Appl.Chem.59:1739-1752测量。木聚糖降解活性或木聚糖分解活性术语“木聚糖降解活性”或“木聚糖分解活性”意指水解含木聚糖材料的生物学活性。两种测定木聚糖分解活性的基础方法包括(I)测定总木聚糖分解活性,和(2)测定单独的木聚糖分解活性(例如,内切木聚糖酶、¢-木糖苷酶、阿拉伯呋喃糖苷酶、a-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶和a-葡糖醒酸酯酶(a-glucuronylesterase))。最近在木聚糖分解酶测定法的进展总结于几个公开文献中,包括Biely和Puchard,Recentprogressintheassaysofxylanolyticenzymes,2006,JournaloftheScienceofFoodandAgriculture86(11):1636-1647;Spanikova和Biely,2006,Glucuronoylesterase-NovelcarbohydrateesteraseproducedbySchizophyllumcommune,FEBSLetters580(19):4597-4601;Herrmann,Vrsanska,Jurickova,Hirsch,Biely和Kubicek,1997,Thebeta-D-xylosidaseofTrichodermareeseiisamultifunctionalbeta—D—xylanxylohydrolase,BiochemicalJournal321:375-381。总木聚糖降解活性可通过确定从多种类型的木聚糖形成的还原糖来测量,所述木聚糖包括例如燕麦小麦(oatspelt)、山毛榉木(beechwood)和落叶松木(Iarchwood)木聚糖,或者可通过光度法确定从多种共价染色的木聚糖释放出的染色的木聚糖片段来测量。最常见的总木聚糖分解活性测定法基于从多聚的4-0-甲基葡糖醛酸木聚糖产生还原糖,如Bailey,Biely,Poutanen,1992,Interlaboratorytestingofmethodsforassayofxylanaseactivity,JournalofBiotechnology23(3):257-270中所述。木聚糖酶活性亦可用0.2%AZCL-阿拉伯木聚糖作为底物在0.01%TRITONX-100和200mM磷酸钠缓冲液PH6在37°C中确定。一单位的木聚糖酶活性定义为在37°C,pH6从作为底物的0.2%AZCL阿拉伯木聚糖在200mM磷酸钠pH6缓冲液中每分钟产生I.0微摩尔的天青精。就本发明而言,木聚糖降解活性是通过测量由木聚糖降解酶在下述典型条件下造成的桦木木聚糖(SigmaChemicalCo.,Inc.,St.Louis,MO,USA)水解的增加来确定的1ml反应,5mg/ml底物(总固形物),5mg木聚糖分解蛋白/g底物,50mM乙酸钠,pH5,50°C,24小时,如Lever,1972,Anewreactionforcolorimetricdeterminationofcarbohydrates,Anal.Biochem47:273-279所述使用对轻基苯甲酸酸餅(PHBAH)测定法进行糖分析。木聚糖酶术语“木聚糖酶”意指催化木聚糖中1,4-P-D-木糖苷连接的内水解的1,4-&-D-木聚糖-木糖水解酶(E.C.3.2.I.8)。就本发明而言,木聚糖酶活性是使用0.2%AZCL-阿拉伯木聚糖作为底物在37°C在0.01%TRITONX-100和200mM磷酸钠缓冲液PH6中进行确定的。一个单位的木聚糖酶活性定义为在37°C,pH6从200mM磷酸钠pH6缓冲液中的0.2%AZCL-阿拉伯木聚糖作为底物每分钟产生I.0微摩尔的天青精(azurine)。^-木糖苷酶术语“^-木糖苷酶”意指P-D木糖苷木糖水解酶(P-D-xyIosidexylohydrolase)(E.C.3.2.I.37),其催化短3(I—4)木寡糖(xylooIigosaccharide)的外水解以从非还原端去除连续的D-木糖残基。就本发明而言,一个单位的¢-木糖苷酶定义为在40°C,pH5从ImM对硝基苯基-P-D-木糖苷作为底物在含有0.01%TWEEN20的IOOmM柠檬酸钠中每分钟产生I.0微摩尔对硝基苯酚阴离子。乙酰木聚糖酯酶术语“乙酰木聚糖酯酶”意指羧基酯酶(EC3.I.I.72),其催化乙酰基从聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、乙酸a-萘酯(alpha-napthylacetate)和乙酸对硝基苯酯(p-nitrophenylacetate)的水解。就本发明而言,乙酰木聚糖酯酶活性是使用0.5mM乙酸对硝基苯酯作为底物,在含有0.01%TWEEN20的50mM乙酸钠pH5.0中确定的。一个单位的乙酰木聚糖酯酶定义为能够在pH5,25°C每分钟释放I微摩尔对硝基苯酹阴离子(p-nitrophenolateanion)的酶量。阿魏酸酯酶术语“阿魏酸酯酶(feruloylesterase)”意指4_轻基_3_甲氧基肉桂酰-糖水解酶(EC3.I.I.73),其催化4-羟基-3-甲氧基肉桂酰(阿魏酰)基团从酯化的糖(其在“天然”底物中通常为阿拉伯糖)的水解,以产生阿魏酸(4-羟基-3-甲氧基肉桂酸)。阿魏酸酯酶也称作阿魏酸酯酶(ferulicacidesterase)、轻基肉桂酸酯酶(hydroxycinnamoylesterase)>FAE-III>肉桂酸酯水解酶、FAEA、cinnAE、FAE_I或FAE-II。就本发明而言,阿魏酸酯酶是使用50mM乙酸钠pH5.0中的0.5mM阿魏酸对硝基苯酯作为底物确定的。一个单位的阿魏酸酯酶活性等于能够在pH5,25°C每分钟释放出I微摩尔对硝基苯酚阴离子的酶量。a-葡糖醛酸糖苷酶术语“a-葡糖醛酸糖苷酶”意指a_D_葡糖苷酸葡糖醛酸水解酶(alpha-D-glucosiduronateglucuronohydrolase)(EC3.2.I.139),其催化a-D_葡糖醛酸糖苷水解为D-葡糖醛酸和醇。就本发明而言,a-葡糖醛酸糖苷酶活性是根据deVries,1998,J.Bacteriol.180:243-249确定的。一个单位的a_葡糖醒酸糖苷酶等于能够在pH5,40°C每分钟释放出I微摩尔葡糖醛酸或4-0-甲基葡糖醛酸的酶量。a-L-阿拉伯呋喃糖苷酶术语“a_L_阿拉伯呋喃糖苷酶活性”意指a_L_阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC3.2.I.55),其催化对a-L-阿拉伯糖苷中的末端非还原性a-L-阿拉伯呋喃糖苷残基的水解。该酶对a-L-阿拉伯呋喃糖苷、含有(1,3)_和/或(1,5)-键的a-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖起作用。a-L-阿拉伯呋喃糖苷酶也称为阿拉伯糖苷酶、a-阿拉伯糖苷酶、a-L-阿拉伯糖苷酶、a-阿拉伯呋喃糖苷酶、多糖a-L-阿拉伯呋喃糖苷酶、a-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶或a-L-阿拉伯聚糖酶。就本发明而言,a-L-阿拉伯呋喃糖苷酶活性是使用总体积200V-I中的每ml的IOOmM乙酸钠pH5中5mg的中等粘性小麦阿拉伯木聚糖(MegazymeInternationalIreland,Ltd.,Bray,Co.Wicklow,Ireland)在4CTC进行30分钟,接着通过AMINEX.HPX-87H柱层析(Bio-RadLaboratories,Inc.,Hercules,CA,USA)的阿拉伯糖分析来确定的。纤维素材料术语“纤维素材料”意指包含纤维素的任何材料。生物质的初生细胞壁(primarycellwall)中的主要多糖是纤维素,其次最丰富的是半纤维素,而第三是果胶。次生细胞壁(secondarycellwall)在细胞停止生长后产生,其同样含有多糖并通过共价交联至半纤维素的聚合木质素而加强。纤维素是脱水纤维二糖的均聚物,并且因此是直链3_(l-4)-D-葡聚糖,而半纤维素包括多种化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,具有系列取代基的复杂分支结构。尽管通常是多形的,存在于植物组织中的纤维素主要是平行葡聚糖链的不溶晶体基质。半纤维素通常与纤维素以及其它半纤维素以氢键键合,其帮助稳定细胞壁基质。纤维素通常见于例如植物的茎、叶、壳、皮和穗轴,或树的叶、枝和木材。纤维素材料可以是,但不限于,草本材料、农业残余物、林业残余物、城市固体废物、废纸和纸浆与造纸厂残余物(参见,例如,Wiselogel等,1995,于HandbookonBioethanol(CharlesE.Wyman编),pp.105-118,Taylor&Francis,WashingtonD.C.;Wyman,1994,BioresourceTechnology50:3-16;Lynd,1990,AppliedBiochemistryandBiotechnology24/25:695-719;Mosier等,,1999,RecentProgressinBioconversionofLignocelIulosics,于AdvancesinBiochemicalEngineering/Biotechnology,T.Scheper主编,Volume65,pp.23-40,Springer-Verlag,NewYork)。在本文中应理解的是,纤维素可以是任何形式的木素纤维素,在混合基质中包含木质素、纤维素和半纤维素的植物细胞壁材料。在一个优选的方面,纤维素材料是木素纤维素,其包含纤维素、半纤维素和木质素。在一个方面,纤维素材料是草本材料。在另一个方面,纤维素材料是农业残余物。在另一个方面,纤维素材料是林业残余物。在另一个方面,纤维素材料是城市固体废物。在另一个方面,纤维素材料是废纸。在另一个方面,纤维素材料是纸浆和造纸厂残余物。在另一个方面,纤维素材料是玉米秸杆。在另一个方面,纤维素材料是玉米纤维。在另一个方面,纤维素材料是玉米穗轴。在另一个方面,纤维素材料是橙皮。在另一个方面,纤维素材料是稻杆。在另一个方面,纤维素材料是麦杆。在另一个方面,纤维素材料是柳枝稷(switchgrass)。在另一个方面,纤维素材料是芒草属(miscanthus)。在另一个方面,纤维素材料是甘蔗渣。在另一个方面,纤维素材料是微晶纤维素。在另一个方面,纤维素材料是细菌纤维素。在另一个方面,纤维素材料是藻类纤维素。在另一个方面,纤维素材料是棉线头(cottonlinter)。在另一个方面,纤维素材料是无定形的磷酸处理的纤维素。在另一个方面,纤维素材料是滤纸。纤维素材料可以直接使用或进行预处理,使用本领域已知的常规方法,如本文所述。在一个优选的方面,预处理纤维素材料。预处理的玉米秸杆术语“PCS”或“预处理的玉米秸杆”意指通过用热和稀硫酸处理的源自玉米秸杆的纤维素材料。含木聚糖材料术语“含木聚糖材料”意指任何包含含有3-(1-4)连接木糖残基骨架的植物细胞壁多肽的材料。陆生植物的木聚糖是具有¢-(14)-D-吡喃木糖骨架、具有短糖链分支的杂聚物。其包含D-葡糖醛酸或其4-0-甲基醚、L-阿拉伯糖和/或多种寡糖,由D-木糖、L-阿拉伯糖,D-或L-半乳糖和D-葡萄糖组成。木聚糖类型的多糖可分为同木聚糖(homoxylan)和杂木聚糖(heteroxylan),其包括葡糖醒酸木聚糖,(阿拉伯)葡糖醛酸木聚糖,(葡糖醛酸)阿拉伯木聚糖,阿拉伯木聚糖和复合杂木聚糖(complexheteroxylan)参见例如Ebringerova等,2005,Adv.Polym.Sci.186:167。在本发明的方法中,可使用任何含木聚糖材料。在一个优选的方面,所述含木聚糖材料是木素纤维素。分离的或纯化的术语“分离的”和“纯化的”意指从与其天然联系的至少一种组分移出的多肽或多核苷酸。举例而言,多肽如通过SDS-PAGE测定的,可为至少1%纯,例如至少5%纯,至少10%纯,至少20%纯,至少40%纯,至少60%纯,至少80%纯,至少90%纯,或至少95%纯,而多核苷酸如通过琼脂糖电泳测定的,可为至少1%纯,例如至少5%纯,至少10%纯,至少20%纯,至少40%纯,至少60%纯,至少80%纯,至少90%纯,或至少95%纯。成熟多肽术语“成熟多肽”意指以其在翻译和任何翻译后修饰之后的最终形式存在的多肽,所述修饰例如N-末端加工、C-末端截短、糖基化、磷酸化等。在一个方面,根据预测SEQIDNO:2的氨基酸I至17是信号肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1_6),成熟多肽是SEQIDN0:2的氨基酸18至246。在另一个方面,根据预测SEQIDNO:4的氨基酸I至19是信号肽的SignalP程序,成熟多肽是SEQIDNO:4的氨基酸20至334。在另一个方面,根据预测SEQIDNO:6的氨基酸I至17是信号肽的SignalP程序,成熟多肽是SEQIDN0:6的氨基酸18至227。在另一个方面,根据预测SEQIDNO:8的氨基酸I至19是信号肽的SignalP程序,成熟多肽是SEQIDNO:8的氨基酸20至223。在另一个方面,根据预测SEQIDNO:10的氨基酸I至21是信号肽的SignalP程序,成熟多肽是SEQIDNO:10的氨基酸22至368。在另一个方面,根据预测SEQIDNO:12的氨基酸I至24是信号肽的SignalP程序,成熟多肽是SEQIDNO:12的氨基酸25至330。在另一个方面,根据预测SEQIDNO:14的氨基酸I至16是信号肽的SignalP程序,成熟多肽是SEQIDNO:14的氨基酸17至236。在另一个方面,根据预测SEQIDNO:16的氨基酸I至18是信号肽的SignalP程序,成熟多肽是SEQIDNO:16的氨基酸19至250。在另一个方面,根据预测SEQIDNO:18的氨基酸I至22是信号肽的SignalP程序,成熟多肽是SEQIDNO:18的氨基酸23至478。在另一个方面,根据预测SEQIDNO:20的氨基酸I至16是信号肽的SignalP程序,成熟多肽是SEQIDNO:20的氨基酸17至230。在另一个方面,根据预测SEQIDNO:22的氨基酸I至19是信号肽的SignalP程序,成熟多肽是SEQIDNO:22的氨基酸20至257。本领域中已知宿主细胞可产生两种或更多种由相同多核苷酸表达的不同成熟多肽(即,具有不同的C端和/或N端氨基酸)的混合物。成熟多肽编码序列术语“成熟多肽编码序列”意指编码具有纤维素分解增强活性的成熟多肽的多核苷酸。在一个方面,根据预测SEQIDNO:I的核苷酸I至51编码信号肽的SignalP程序(Nielsen等,1997,见上),成熟多肽编码序列是SEQIDN0:1的核苷酸52至875。在另一个方面,成熟多肽编码序列是包含于SEQIDNO:I的核苷酸52至875中的cDNA序列。在另一个方面,根据预测SEQIDNO:3的核苷酸I至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQIDNO:3的核苷酸58至1250。在另一个方面,成熟多肽编码序列是包含于SEQIDNO:3的核苷酸58至1250中的cDNA序列。在另一个方面,根据预测SEQIDNO:5的核苷酸I至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQIDNO:5的核苷酸52至795。在另一个方面,成熟多肽编码序列是包含于SEQIDN0:5的核苷酸52至795中的cDNA序列。在另一个方面,根据预测SEQIDNO:7的核苷酸I至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQIDNO:7的核苷酸58至974。在另一个方面,成熟多肽编码序列是包含于SEQIDNO:7的核苷酸58至974中的cDNA序列。在另一个方面,根据预测SEQIDNO:9的核苷酸I至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQIDN0:9的核苷酸64至1104。在另一个方面,成熟多肽编码序列是包含于SEQIDNO:9的核苷酸64至1104中的cDNA序列。在另一个方面,根据预测SEQIDNO:11的核苷酸I至72编码信号肽的SignalP程序,成熟多肽编码序列是SEQIDNO:11的核苷酸73至990。在另一个方面,成熟多肽编码序列是包含于SEQIDNO:11的核苷酸73至990中的cDNA序列。在另一个方面,根据预测SEQIDNO:13的核苷酸I至48编码信号肽的SignalP程序,成熟多肽编码序列是SEQIDNO:13的核苷酸49至1218。在另一个方面,成熟多肽编码序列是包含于SEQIDNO:13的核苷酸49至1218中的cDNA序列。在另一个方面,根据预测SEQIDNO:15的核苷酸I至54编码信号肽的SignalP程序,成熟多肽编码序列是SEQIDNO:15的核苷酸55至930。在另一个方面,成熟多肽编码序列是包含于SEQIDNO:15的核苷酸55至930中的cDNA序列。在另一个方面,根据预测SEQIDNO:17的核苷酸I至66编码信号肽的SignalP程序,成熟多肽编码序列是SEQIDNO:17的核苷酸67至1581。在另一个方面,成熟多肽编码序列是包含于SEQIDNO:17的核苷酸67至1581中的cDNA序列。在另一个方面,根据预测SEQIDNO:19的核苷酸I至48编码信号肽的SignalP程序,成熟多肽编码序列是SEQIDNO:19的核苷酸49至865。在另一个方面,成熟多肽编码序列是包含于SEQIDNO:19的核苷酸49至865中的cDNA序列。在另一个方面,根据预测SEQIDNO:21的核苷酸I至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQIDNO:21的核苷酸58至1065。在另一个方面,成熟多肽编码序列是包含于SEQIDNO:21的核苷酸58至1065中的cDNA序列。序列同一性参数“序列同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。就本发明而言,两个氨基酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsGenet.16:276-277),优选3.0.0版或更高版本的Needle程序中所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)来测定。使用的可选参数为缺口开放罚分(gapopenpenalty)10,缺口延伸罚分(gapextensionpenalty)0.5和EBL0SUM62(BL0SUM62的EMBOSS版)取代矩阵。使用Needle标记为“最高同一I"生(longestidentity)”的输出结果(使用-nobrief选项获得)作为同一丨生百分比,并计算如下(同样的残基X100)/(比对长度一比对中缺口的总数)就本发明而言,两个脱氧核苷酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,见上文),优选3.0.0版或更高版本的Needle程序中所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来测定。使用的可选参数为缺口开放罚分10,缺口延伸罚分0.5和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩阵。使用Needle标记为“最高同一性”的输出结果(使用-nobrief选项获得)作为同一性百分比,并计算如下(同样的脱氧核糖核苷酸X100)/(比对长度一比对中缺口的总数)片段术语“片段”意指从成熟多肽的氨基和/或羧基末端缺失一个或多个(几个)氨基酸的多肽;其中所述片段具有纤维素分解增强活性。在一个方面,片段含有SEQIDNO:2的成熟多肽的至少190个氨基酸残基,例如至少200个氨基酸残基,或至少210个氨基酸残基。在另一个方面,片段含有SEQIDNO:4的成熟多肽的至少265个氨基酸残基,例如至少280个氨基酸残基,或至少295个氨基酸残基。在另一个方面,片段含有SEQIDNO:6的成熟多肽的至少180个氨基酸残基,例如至少190个氨基酸残基,或至少200个氨基酸残基。在另一个方面,片段含有SEQIDNO:4的成熟多肽的至少265个氨基酸残基,例如至少280个氨基酸残基,或至少295个氨基酸残基。在另一个方面,片段含有SEQIDNO:8的成熟多肽的至少170个氨基酸残基,例如至少180个氨基酸残基,或至少190个氨基酸残基。在另一个方面,片段含有SEQIDNO:10的成熟多肽的至少305个氨基酸残基,例如至少320个氨基酸残基,或至少335个氨基酸残基。在另一个方面,片段含有SEQIDNO:12的成熟多肽的至少255个氨基酸残基,例如至少270个氨基酸残基,或至少285个氨基酸残基。在另一个方面,片段含有SEQIDNO:14的成熟多肽的至少190个氨基酸残基,例如至少200个氨基酸残基,或至少210个氨基酸残基。在另一个方面,片段含有SEQIDNO:16的成熟多肽的至少200个氨基酸残基,例如至少210个氨基酸残基,或至少220个氨基酸残基。在另一个方面,片段含有SEQIDNO:18的成熟多肽的至少390个氨基酸残基,例如至少410个氨基酸残基,或至少430个氨基酸残基。在另一个方面,片段含有SEQIDN0:20的成熟多肽的至少180个氨基酸残基,例如至少190个氨基酸残基,或至少200个氨基酸残基。在另一个方面,片段含有SEQIDNO:22的成熟多肽的至少210个氨基酸残基,例如至少220个氨基酸残基,或至少230个氨基酸残基。亚序列术语“亚序列(subsequence)”意指从成熟多肽编码序列的5’和/或3’端缺失一个或多个(几个)核苷酸的多核苷酸;其中所述亚序列编码具有纤维素分解增强活性的片段。在一个方面,亚序列含有SEQIDNO:I的成熟多肽编码序列的至少560个核苷酸,例如至少600个核苷酸,或至少630个核苷酸。在另一个优选的方面,亚序列含有SEQIDNO:3的成熟多肽编码序列的至少795个核苷酸,例如至少840个核苷酸,或至少885个核苷酸。在另一个优选的方面,亚序列含有SEQIDNO:5的成熟多肽编码序列的至少540个核苷酸,例如至少570个核苷酸,或至少600个核苷酸。在另一个优选的方面,亚序列含有SEQIDNO:7的成熟多肽编码序列的至少510个核苷酸,例如至少540个核苷酸,或至少570个核苷酸。在另一个优选的方面,亚序列含有SEQIDN0:9的成熟多肽编码序列的至少915个核苷酸,例如至少960个核苷酸,或至少1005个核苷酸。在另一个优选的方面,亚序列含有SEQIDN0:11的成熟多肽编码序列的至少765个核苷酸,例如至少810个核苷酸,或至少855个核苷酸。在另一个优选的方面,亚序列含有SEQIDNO:3的成熟多肽编码序列的至少795个核苷酸,例如至少840个核苷酸,或至少885个核苷酸。在另一个优选的方面,亚序列含有SEQIDNO:13的成熟多肽编码序列的至少570个核苷酸,例如至少600个核苷酸,或至少630个核苷酸。在另一个优选的方面,亚序列含有SEQIDNO:15的成熟多肽编码序列的至少600个核苷酸,例如至少630个核苷酸,或至少660个核苷酸。在另一个优选的方面,亚序列含有SEQIDNO:17的成熟多肽编码序列的至少1170个核苷酸,例如至少1230个核苷酸,或至少1290个核苷酸。在另一个优选的方面,亚序列含有SEQIDNO:19的成熟多肽编码序列的至少540个核苷酸,例如至少570个核苷酸,或至少600个核苷酸。在另一个优选的方面,亚序列含有SEQIDNO:21的成熟多肽编码序列的至少630个核苷酸,例如至少660个核苷酸,或至少690个核苷酸。等位变体(allelicvariant):术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或更多种可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。编码序列术语“编码序列”意指直接指定多肽氨基酸序列的多核苷酸。编码序列的边界通常由开读框决定,所述开读框通常以ATG起始密码子或其他起始密码子例如GTG和TTG开始,并且以终止密码子例如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的或重组的多核苷酸。cDNA:术语“cDNA”意指能够通过反转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的包括剪接的步骤加工然后作为成熟的已剪接的mRNA出现。核酸构建体术语“核酸构建体”意指分离自天然存在的基因的,或受修饰以本来不存在于(nototherwiseexist)自然界中的方式含有核酸的区段的,或是合成的单链或双链的核酸分子。当所述核酸构建体含有表达本发明的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。调控序列(controlsequence):术语“调控序列”意指对编码本发明多肽的多核苷酸表达是必需的所有成分。各个调控序列对于编码所述多肽的多核苷酸可以是天然的或外源的,或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的多核苷酸编码区的连接。可操作地连接术语“可操作地连接”意指这样的构型,其中将调控序列置于相对于多核苷酸的编码序列的适当位置,使得调控序列指导编码序列的表达。表达术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。表达载体术语“表达载体”意指线性的或环状的DNA分子,其包含编码多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。宿主细胞“宿主细胞”意指任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。术语“宿主细胞”涵盖亲本细胞的任何后代,所述后代由于在复制中发生的突变与亲本细胞不完全相同。变体术语“变体”意指具有纤维素分解增强活性的多肽,其包含改变,即在一个或多个(几个)位置的取代、插入和/或缺失一个或多个(几个)氨基酸残基。取代意指用别的氨基酸取代占据某位置的氨基酸;缺失意指去除占据某位置的氨基酸;而插入意指邻接于占据某位置的氨基酸添加一个或多个(几个)氨基酸,例如1-5个氨基酸。发明详述具有纤维素分解增强活性的多肽本发明涉及具有纤维素分解增强活性的分离的多肽,其选自下组(a)多肽,其具有与SEQIDNO:2,SEQIDNO:6,或SEQIDNO:12的成熟多肽至少60%序列同一性;与SEQIDN0:4的成熟多肽至少65%序列同一性;与SEQIDN0:18的成熟多肽至少70%序列同一性;与SEQIDNO:10,SEQIDN0:16,或SEQIDN0:22的成熟多肽至少75%序列同一性;与SEQIDNO:8的成熟多肽至少80%序列同一性;与SEQIDNO:14的成熟多肽至少85%序列同一性;或者与SEQIDNO:20的成熟多肽至少90%序列同;性;(b)多肽,其由多核苷酸编码,所述多核苷酸在中等-高,高或非常高严格条件下与以下杂交(i)SEQIDNO:I,SEQIDNO:3,SEQIDNO:5,SEQIDNO:11,或SEQIDNO:17的成熟多肽编码序列,(ii)包含于SEQIDN0:1,SEQIDNO:3,SEQIDNO:5,SEQIDN0:11,或SEQIDNO:17的成熟多肽编码序列中的cDNA序列,或(iii)⑴或(ii)的全长互补链;在高或非常高严格条件下与以下杂交(i)SEQIDNO:7,SEQIDNO:9,SEQIDNO:13,SEQIDNO:15,或SEQIDN0:21的成熟多肽编码序列,(ii)包含于SEQIDNO:7,SEQIDN0:9,SEQIDNO:13,SEQIDN0:15,或SEQIDNO:21的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;或者在非常高严格条件下与以下杂交i)SEQIDNO:19的成熟多肽编码序列,(ii)包含于SEQIDNO:19的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;(C)多肽,其由多核苷酸编码,所述多核苷酸具有与SEQIDNO:I,SEQIDN0:5,或SEQIDNO:11的成熟多肽编码序列至少60%序列同一性;与SEQIDN0:3的成熟多肽编码序列至少65%序列同一性;与SEQIDNO:17的成熟多肽编码序列至少70%序列同一性;与SEQIDN0:9,SEQIDNO:15,或SEQIDN0:21的成熟多肽编码序列至少75%序列同一性;与SEQIDN0:7的成熟多肽编码序列至少80%序列同一性;与SEQIDNO:13的成熟多肽编码序列至少85%序列同一性;或者与SEQIDNO:19的成熟多肽编码序列至少90%序列同一性;或者其cDNA序列;(d)变体,其包含SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,或SEQIDNO:22的成熟多肽的一个或多个(几个)取代,缺失,和/或插入;和(e)(a),(b),(C),或(d)的多肽具有纤维素分解增强活性的片段。本发明涉及分离的多肽,其具有与SEQIDNO:2,SEQIDN0:6,或SEQIDN0:12的成熟多肽至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;与SEQIDNO:4的成熟多肽至少65%,例如,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;与SEQIDNO:18的成熟多肽至少70%,例如,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;与SEQIDNO:10,SEQIDNO:16,或SEQIDNO:22的成熟多肽至少75%,例如,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;与SEQIDNO:8的成熟多肽至少80%,例如,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;与SEQIDNO:14的成熟多肽至少85%,例如,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;或者与SEQIDNO:20的成熟多肽至少90%,例如,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性,并具有纤维素分解增强活性。在一个方面,所述多肽与SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDN0:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,或SEQIDNO:22的成熟多肽相差不超过十个氨基酸,例如相差五个氨基酸,相差四个氨基酸,相差三个氨基酸,相差两个氨基酸,和相差一个氨基酸。本发明的多肽优选包含或组成为SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDN0:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,或SEQIDNO:22的氨基酸序列,或其等位变体;或为它们具有纤维素分解增强活性的片段。在另一个方面,多肽包含或组成为SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDN0:20,或SEQIDN0:22的成熟多肽。在另一个优选的方面,多肽包含或组成为SEQIDNO:2的氨基酸18至246。在另一个优选的方面,多肽包含或组成为SEQIDN0:4的氨基酸20至334。在另一个优选的方面,多肽包含或组成为SEQIDNO:6的氨基酸18至227。在另一个优选的方面,多肽包含或组成为SEQIDN0:8的氨基酸20至223。在另一个优选的方面,多肽包含或组成为SEQIDNO:10的氨基酸22至368。在另一个优选的方面,多肽包含或组成为SEQIDNO:12的氨基酸25至330。在另一个优选的方面,多肽包含或组成为SEQIDNO:14的氨基酸17至236。在另一个优选的方面,多肽包含或组成为SEQIDNO:16的氨基酸19至250。在另一个优选的方面,多肽包含或组成为SEQIDNO:18的氨基酸23至478。在另一个优选的方面,多肽包含或组成为SEQIDNO:20的氨基酸17至230。在另一个优选的方面,多肽包含或组成为SEQIDNO:22的氨基酸20至257。本发明还涉及具有纤维素分解增强活性的分离的多肽,其由多核苷酸编码,所述多核苷酸在中等-高,高或非常高严格条件下与以下杂交(i)SEQIDN0:1,SEQIDN0:3,SEQIDN0:5,SEQIDN0:11,或SEQIDNO:17的成熟多肽编码序列,(ii)包含于SEQIDNO:I,SEQIDNO:3,SEQIDNO:5,SEQIDN0:11,或SEQIDNO:17的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;在高或非常高严格条件下与以下杂交(i)SEQIDNO:7,SEQIDNO:9,SEQIDNO:13,SEQIDNO:15,或SEQIDNO:21的成熟多肽编码序列,Qi)包含于SEQIDNO:7,SEQIDNO:9,SEQIDNO:13,SEQIDNO:15,或SEQIDNO:21的成熟多肽编码序列中的cDNA序列,或(iii)⑴或(ii)的全长互补链;或者在非常高严格条件下与以下杂交i)SEQIDN0:19的成熟多肽编码序列,(ii)包含于SEQIDNO:19的成熟多肽编码序列中的cDNA序列,或(iii)⑴或(ii)的全长互补链(J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。SEQIDNO:I,SEQIDN0:3,SEQIDN0:5,SEQIDN0:7,SEQIDN0:9,SEQIDNO:11,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDN0:19,或SEQIDNO:21的多核苷酸,或其亚序列,以及SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,或SEQIDNO:22的氨基酸序列,或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有纤维素分解增强活性的多肽的DNA。具体而言,根据标准的Southern印迹方法,可将这些探针用于与感兴趣的属或种的基因组DNA或cDNA杂交,以鉴定和分离其中相应的基因。这些探针可明显短于完整序列,但长度上应为至少14,例如至少25,至少35,或至少70个核苷酸。优选地,所述核酸探针是至少100个核苷酸的长度,例如,至少200个核苷酸,至少300个核苷酸,至少400个核苷酸,至少500个,至少600个核苷酸,至少700个核苷酸,至少800个核苷酸,或至少900个核苷酸的长度。DNA和RNA探针二者均可使用。通常将探针标记以检测相应的基因(例如,用32p、3h、35s、生物素或抗生物素蛋白(avidin)标记)。这些探针涵盖于本发明中。可从由这些其它株(strain)制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码具有纤维素分解增强活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQIDNO:I,SEQIDNO:3,SEQIDNO:5,SEQIDNO:7,SEQIDN0:9,SEQIDNO:11,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,或SEQIDN0:21,或其亚序列同源的克隆或DNA,将所述载体材料优选用在Sounthern印迹中。就本发明而言,杂交表示多核苷酸在非常低至非常高的严格条件下与标记的核酸探针杂交,所述核酸探针对应于SEQIDNO:1,SEQIDNO:3,SEQIDNO:5,SEQIDNO:7,SEQIDN0:9,SEQIDNO:11,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,或SEQIDN0:21;SEQIDN0:1,SEQIDN0:3,SEQIDN0:5,SEQIDN0:7,SEQIDN0:9,SEQIDN0:11,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,或SEQIDNO:21的成熟多肽编码序列;包含于SEQIDNO:I,SEQIDNO:3,SEQIDNO:5,SEQIDNO:7,SEQIDN0:9,SEQIDNO:11,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,或SEQIDN0:21的成熟多肽编码序列中的cDNA序列;其全长互补链;或它们的亚序列。可使用例如X射线片(X-rayfilm)检测在这些条件下与核酸探针杂交的分子。在一个方面,核酸探针是的成熟多肽编码序列SEQIDN0:1,SEQIDNO:3,SEQIDN0:5,SEQIDN0:7,SEQIDN0:9,SEQIDNO:11,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDN0:19,或SEQIDNO:21,或其cDNA序列。在另一个方面,核酸探针是SEQIDNO:I的核苷酸52至875,SEQIDNO:3的核苷酸58至1250,SEQIDNO:5的核苷酸52至795,SEQIDNO:7的核苷酸58至974,SEQIDN0:9的核苷酸64至1104,SEQIDN0:11的核苷酸73至990,SEQIDNO:13的核苷酸49至1218,SEQIDNO:15的核苷酸55至930,SEQIDNO:17的核苷酸67至1581,SEQIDNO:19的核苷酸49至865,或SEQIDNO:21的核苷酸58至1065。在另一个方面,核酸探针是多核苷酸,其编码SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,或SEQIDNO:22的多肽,或其成熟多肽;或其片段。在另一个优选的方面,核酸探针是SEQIDNO:I,SEQIDNO:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQIDNO:11,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,或SEQIDN0:21,或其cDNA序列。在另一个方面,核酸探针是包含在大肠杆菌(E.coli)NRRLB-50301中的质粒pSMai216中含有的多核苷酸,其中所述多核苷酸序列编码具有纤维素分解增强活性的多肽。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50301中的质粒pSMai21中含有的成熟多肽编码区。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50302中的质粒pSMAi217中含有的多核苷酸,其中所述多核苷酸序列编码具有纤维素分解增强活性的多肽。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50302中的质粒pSMai217中含有的成熟多肽编码区。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50303中的质粒pSMai218中含有的多核苷酸,其中所述多核苷酸序列编码具有纤维素分解增强活性的多肽。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50303中的质粒pSMai218中含有的成熟多肽编码区。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50300中的质粒pSMai213中含有的多核苷酸,其中所述多核苷酸序列编码具有纤维素分解增强活性的多肽。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50300中的质粒pSMai213中含有的成熟多肽编码区。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50320中的质粒pAG68中含有的多核苷酸,其中所述多核苷酸序列编码具有纤维素分解增强活性的多肽。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50320中的质粒pAG68中含有的成熟多肽编码区。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50321中的质粒pAG69中含有的多核苷酸,其中所述多核苷酸序列编码具有纤维素分解增强活性的多肽。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50321中的质粒pAG69中含有的成熟多肽编码区。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50322中的质粒pAG75中含有的多核苷酸,其中所述多核苷酸序列编码具有纤维素分解增强活性的多肽。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50322中的质粒pAG75中含有的成熟多肽编码区。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50323中的质粒pAG76中含有的多核苷酸,其中所述多核苷酸序列编码具有纤维素分解增强活性的多肽。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50323中的质粒pAG76中含有的成熟多肽编码区。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50324中的质粒pAG77中含有的多核苷酸,其中所述多核苷酸序列编码具有纤维素分解增强活性的多肽。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50324中的质粒pAG77中含有的成熟多肽编码区。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50325中的质粒pAG78中含有的多核苷酸,其中所述多核苷酸序列编码具有纤维素分解增强活性的多肽。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50325中的质粒pAG78中含有的成熟多肽编码区。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50326中的质粒pAG79中含有的多核苷酸,其中所述多核苷酸序列编码具有纤维素分解增强活性的多肽。在另一个方面,核酸探针是包含在大肠杆菌NRRLB-50326中的质粒PAG79中含有的成熟多肽编码区。对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42°C,在5XSSPE、0.3%SDS、200毫克/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严格性为25%的甲酰胺、对于中和中-高严格性为35%的甲酰胺、或对于高和非常高严格性为50%的甲酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。使用2XSSC、0.2%SDS在45。。(非常低严格性),在50°C(低严格性),在55°C(中严格性),在60°C(中-高严格性),在65°C(高严格性),和在70°C(非常高严格性)将载体材料最终洗涤三次,每次15分钟。对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严格条件定义为在比使用根据Bolton和McCarthy计算法(1962,Proc.Natl.Acad.Sci.USA48:1390)计算的Tni低大约5°C至大约1(TC,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP_40,IXDenhardt溶液,ImM焦憐酸钠(sodiumpyrophosphate),ImM憐酸二氢钠(sodiummonobasicphosphate),0.ImMATP和0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交和杂交最佳12至24小时。将所述载体材料在6XSSC加0.1%SDS中最终洗涤一次15分钟,并用6XSSC在比计算的Tm低5°C至I(TC的温度洗涤两次,每次15分钟。本发明还涉及由多核苷酸编码的具有纤维素分解增强活性的分离的多肽,所述多核苷酸具有与SEQIDN0:1,SEQIDN0:5,或SEQIDNO:11的成熟多肽编码序列至少60%,至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;与SEQIDNO:3的成熟多肽至少65%,例如,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;与SEQIDNO:17的成熟多肽至少70%,例如,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;与SEQIDNO:9,SEQIDNO:15,或SEQIDNO:21的成熟多肽至少75%,例如,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;与SEQIDNO:7的成熟多肽至少80%,例如,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;与SEQIDNO:13的成熟多肽至少85%,例如,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;或者与SEQIDNO:19的成熟多肽至少90%,例如,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。本发明还涉及SEQIDN0:2,SEQIDNO:4,SEQIDN0:6,SEQIDN0:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDN0:18,SEQIDNO:20,或SEQIDNO:22的成熟多肽或其同源序列的包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。优选地,氨基酸改变对性质是较不重要的(ofaminornature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为I至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)或结合域(bindingdomain)。保守取代的实例是在以下组之内碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specificactivity)的氨基酸取代是本领域已知的,并且由例如H.Neuratl^PR.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。可供选择的是,氨基酸改变具有这样的性质使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适PH等。能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的纤维素分解增强活性以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来测定。参见例如deVos等,1992,Science255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBSLett.309:59-64。必需氨基酸的身份(identity)也能够从与多肽的同一丨I"生分析来推断,所述多肽与亲本多肽相关。能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,例如那些由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.AcadSci.USA86:2152-2156;W095/17413;或W095/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失和/或插入。能够使用的其它方法包括易错PCR、卩遼菌体展不(例如,Lowman等,1991,Biochemistry30:10832-10837;美国专利No.5,223,409;W092/06204)和区域定向的诱变(Derbyshire等,1986,Gene46:145;Ner等,1988,DNA7:127)。诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许快速测定多肽中单个氨基酸残基的重要性。SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,或SEQIDNO:22的成熟多肽的氨基酸取代、缺失和/或插入的总数不多于10,例如1,2,3,4,5,6,7,8或9。所述多肽可为杂合多肽,其中一种多肽的一部分融合于另一种多肽的一部分的N端或C端。所述多肽可为融合多肽或可切割的融合多肽,其中另一种多肽融合于本发明多肽的N端或C端。通过将编码另一个多肽的多核苷酸融合于本发明的多核苷酸来产生融合的多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的控制下。融合蛋白亦可使用内蛋白(intein)技术构建,其中融合物在翻译后产生(Cooper等,1993,EMBOJ.12:2575-2583;Dawson等,1994,Science266:776-779)。融合多肽还可以包含在两个多肽之间的切割位点。一旦分泌了融合多肽,就切割所述位点,释放所述两个多肽。切割位点的实例包括,但不限于,公开于Martin等,2003,J.IndMicrobiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology13:498-503;和Contreras等,1991,Biotechnology9:378-381;Eaton等,1986,Biochem.25:505-512);Collins_Racie等,1995,Biotechnology13:982-987;Carter等,1989,Proteins:Structure,Function,andGenetics6:240-248;以及Stevens,2003,DrugDiscoveryWorld4:35-48中的位点。具有纤维素分解增强活性的多肽的来源本发明的具有纤维素分解增强活性的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思应为多核苷酸编码的多肽由所述来源产生,或由其中插入了来自所述来源的多核苷酸的菌株产生。在一个方面,获得自给定来源的多肽是胞外分泌的。所述多肽可以是细菌多肽。例如,所述多肽可以是具有纤维素分解增强活性的革兰氏阳性细菌多肽例如芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、肠球菌属(Enterococcus)、地芽抱杆菌属(Geobacillus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、海洋芽抱杆菌属(Oceanobacillus)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)、或链霉菌属(Streptomyces)多肽;或革兰氏阴性细菌多肽,如弯曲杆菌属(Campylobacter)、大肠杆菌(E.coli)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、螺杆菌属(Helicobacter)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)或脲原体属(Ureaplasma)多妝。在一个方面,所述多肽是嗜碱芽孢杆菌(Bacillusalkalophilus)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、短芽抱杆菌(Bacillusbrevis)、环状芽抱杆菌(Bacilluscirculans)、克劳氏芽抱杆菌(Bacillusclausii)、凝结芽抱杆菌(Bacilluscoagulans)、坚强芽抱杆菌(Bacillusfirmus)、灿烂芽抱杆菌(Bacilluslautus)、迟缓芽抱杆菌(Bacilluslentus)、地衣芽抱杆菌(Bacilluslicheniformis)、巨大芽抱杆菌(Bacillusmegaterium)、短小芽孢杆菌(Bacilluspumilus)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽抱杆菌(Bacillussubtilis)或苏云金芽抱杆菌(Bacillusthuringiensis)多月太。在另一个方面,所述多肽是似马链球菌(Streptococcusequisimilis)、酿脓链球菌(Streptococcuspyogenes)、乳房链球菌(Streptococcusuberis)或马链球菌兽痕亚种(Streptococcusequisubsp.Zooepidemicus)多月太。在另一个方面,所述多肽是不产色链霉菌(Streptomycesachromogenes)、除虫链霉菌(Streptomycesavermitilis)、天蓝链霉菌(Streptomycescoelicolor)、灰色链霉菌(Streptomycesgriseus)或浅青紫链霉菌(StreptomycesIividans)多月太。所述多肽可以是真菌多肽。例如,所述多肽可为酵母多肽如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓄霉属(Yarrowia)多肽;或丝状真菌多肽如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria^拟錯菌属(Ceriporiopsis)、毛_壳属(Chaetomidium)、金抱子菌属(Chrysosporium)、Claviceps^Cochliobolus、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cyphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、德抱属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、把齿菌属(Irpex)、蘑燕属(Lentinula)、Leptospaeria、梨抱菌属(Magnaporthe)、Melanocarpus、多孑L菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha^根毛霉属(Rhizomucor)、裂糟菌属(Schizophyllum)、柱顶抱属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、包脚燕属(Volvariella)或炭角菌属(Xylaria)多肽。在另一个方面,所述多肽是卡尔酵母(Saccharomycescarlsbergensis)、酿酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多月太。在另一个优选的方面,所述多肽是解纤维枝顶孢霉(Acremoniumcellulolyticus)、棘抱曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、臭曲霉(Aspergillusfoetidus)、烟曲霉(Aspergillusfumigatus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、Chrysosporiuminops、嗜角质金抱子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、Chrysosporiummerdarium、租金抱子菌(Chrysosporiumpannicola)、Chrysosporiumqueenslandicum^热带金抱子菌(Chrysosporiumtropicum)、Chrysosporiumzonatum、杆抱状德抱(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、库威德抱(Fusariumcrookwellense)、大刀德抱(Fusariumculmorum)、禾本科德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、异抱德抱(Fusariumheterosporum)、合欢木德抱(Fusariumnegundi)、尖德抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉红德抱(Fusariumroseum)、接骨木德抱(Fusariumsambucinum)、肤色德抱(Fusariumsarcochroum)、拟分枝抱德抱(Fusariumsporotrichioides)、硫色德抱(Fusariumsulphureum)、圆德抱(Fusariumtorulosum)、拟丝抱德抱(Fusariumtrichothecioides)、壤片德抱(Fusariumvenenatum)、灰腐质霉(Humicolagrisea)、特异腐质霉(Humicolainsolens)、疏棉状腐质霉(Humicolalanuginosa)、白把齿菌(Irpexlacteus)、米黑毛霉(Mucormiehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糖脉抱菌(Neurosporacrassa)、绳状青霉(Penicilliumfuniculosum)、产紫青霉(Penicilliumpurpurogenum)、黄抱平革菌(Phanerochaetechrysosporium)、无色梭抱壳(Thielaviaachromatica)、Thielaviaalbomyces^Thielaviaalbopilosa、澳洲梭抱壳(Thielaviaaustraleinsis)、Thielaviafimeti、小抱梭抱壳(Thielaviamicrospora)、卵抱梭抱壳(Thielaviaovispora)'Thielaviaperuviana、毛梭抱壳(Thielaviasetosa)、瘤抱梭抱壳(Thielaviaspededonium)、Thielaviasubthermophila、哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichodermakoningi)、长枝木霉(TrichodermaIongbrachiatum)、里氏木霉(Trichodermareesei)或绿色木霉(Trichodermaviride)多妝。在另一个方面,所述多肽是具有纤维素分解增强活性的土生梭孢壳多肽。在另一个方面,所述多肽是具有纤维素分解增强活性的棘孢曲霉NRRL8126多肽,例如包含SEQIDNO:2,SEQIDN0:4,SEQIDNO:6,SEQIDN0:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDN0:20,或SEQIDNO:22的成熟多肽的多肽。可理解的是对于前述的种,本发明包含完全和不完全阶段(perfectandimperfectstates),和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域技术人员将容易地识别适合的等同物的身份。这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和细胞培养物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSMZ)、真菌菌种保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得所述多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选另一种微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码所述多肽的多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸,就能够使用本领域普通技术人员熟知的技术将所述多核苷酸分离或克隆(参见,例如,Sambrook等,1989,见上文)o多核苷酸本发明还涉及编码本发明多肽的分离的多核苷酸。用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆多核苷酸。参见,例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活化转录(ligatedactivatedtranscription;LAT)和基于多核苷酸的扩增(NASBA)。可以从土生梭孢壳菌株,或相关生物体克隆所述多核苷酸,并且因此可为例如所述多核苷酸的多肽编码区的等位基因变体或种变体(speciesvariant)。本发明还涉及分离的多核苷酸,所述多核苷酸具有与SEQIDNO:I,SEQIDN0:5,或SEQIDNO:11的成熟多肽编码序列至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;与SEQIDNO:3的成熟多肽至少65%,例如,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;与SEQIDNO:17的成熟多肽至少70%,例如,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;与SEQIDNO:9,SEQIDN0:15,或SEQIDNO:21的成熟多肽至少75%,例如,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;与SEQIDNO:7的成熟多肽至少80%,例如,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;与SEQIDNO:13的成熟多肽至少85%,例如,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%;或者与SEQIDNO:19的成熟多肽至少90%,例如,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%,其编码具有纤维素分解增强活性的多肽。修饰编码本发明多肽的多核苷酸对于合成与所述多肽基本上相似的多肽可为必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适PH等方面不同的变体。可以在作为SEQIDNO:3,SEQIDN0:5,SEQIDNO:7,SEQIDNO:9,SEQIDNO:11,SEQIDNO:13,SEQIDN0:15,SEQIDNO:17,SEQIDNO:19,或SEQIDNO:21的成熟多肽编码序列或其cDNA序列存在的多核苷酸,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建变体所述取代不导致多肽氨基酸序列的改变,但是符合意欲产生酶的宿主生物体的密码子选择;或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述,参见,例如,Ford等,1991,PoteinExpssionandPurification〗95-107。本发明还涉及编码本发明多肽的分离的多核苷酸,所述分离的多核苷酸在中等-高,高或非常高严格条件下与以下杂交(i)SEQIDNO:I,SEQIDNO:3,SEQIDN0:5,SEQIDN0:11,或SEQIDNO:17的成熟多肽编码序列,(ii)包含于SEQIDNO:I,SEQIDNO:3,SEQIDNO:5,SEQIDN0:11,或SEQIDNO:17的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;在高或非常高严格条件下与以下杂交(i)SEQIDN0:7,SEQIDNO:9,SEQIDNO:13,SEQIDNO:15,或SEQIDN0:21的成熟多肽编码序列,(ii)包含于SEQIDNO:7,SEQIDNO:9,SEQIDNO:13,SEQIDNO:15,或SEQIDNO:21的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;或者在非常高严格条件下与以下杂交i)SEQIDNO:19的成熟多肽编码序列,(ii)包含于SEQIDN0:19的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;或它们的等位变体和亚序列(Sambrook等,1989,见上文),如本文所定义的。在一个方面,所述多核苷酸包含SEQIDNO:I,SEQIDNO:3,SEQIDNO:5,SEQIDN0:7,SEQIDN0:9,SEQIDNO:11,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,或SEQIDNO:21,或SEQIDN0:1,SEQIDNO:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQIDN0:11,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,或SEQIDN0:21的亚序列,其分别编码SEQIDN0:2,SEQIDNO:4,SEQIDN0:6,SEQIDN0:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,或SEQIDNO:22具有纤维素分解增强活性的片段,如SEQIDNO:I的核苷酸52至875,SEQIDNO:3的核苷酸58至1250,SEQIDNO:5的核苷酸52至795,SEQIDNO:7的核苷酸58至974,SEQIDN0:9的核苷酸64至1104,SEQIDNO:11的核苷酸73至990,SEQIDNO:13的核苷酸49至1218,SEQIDNO:15的核苷酸55至930,SEQIDNO:17的核苷酸67至1581,SEQIDNO:19的核苷酸49至865,或SEQIDNO:21的核苷酸58至1065。在另一个方面,所述多核苷酸包含或组成为SEQIDNO:I或其成熟多肽编码序列,其包含于质粒pSMai216,所述质粒包含于大肠杆菌NRRLB-50301,其中所述多核苷酸编码具有纤维素分解增强活性的多肽。在另一个方面,所述多核苷酸包含或组成为SEQIDNO:3或其成熟多肽编码序列,其包含于质粒pSMAi217,所述质粒包含于大肠杆菌NRRLB-50302,其中所述多核苷酸编码具有纤维素分解增强活性的多肽。在另一个方面,所述多核苷酸包含或组成为SEQIDNO:5或其成熟多肽编码序列,其包含于质粒pSMai218,所述质粒包含于大肠杆菌NRRLB-50303,其中所述多核苷酸编码具有纤维素分解增强活性的多肽。在另一个方面,所述多核苷酸包含或组成为SEQIDN0:7或其成熟多肽编码序列,其包含于质粒pSMai213,所述质粒包含于大肠杆菌NRRLB-50300,其中所述多核苷酸编码具有纤维素分解增强活性的多肽。在另一个方面,所述多核苷酸包含或组成为SEQIDN0:9或其成熟多肽编码序列,其包含于质粒PAG68,所述质粒包含于大肠杆菌NRRLB-50320,其中所述多核苷酸编码具有纤维素分解增强活性的多肽。在另一个方面,所述多核苷酸包含或组成为SEQIDNO:11或其成熟多肽编码序列,其包含于质粒pAG69,所述质粒包含于大肠杆菌NRRLB-50321,其中所述多核苷酸编码具有纤维素分解增强活性的多肽。在另一个方面,所述多核苷酸包含或组成为SEQIDNO:13或其成熟多肽编码序列,其包含于质粒pAG75,所述质粒包含于大肠杆菌NRRLB-50322,其中所述多核苷酸编码具有纤维素分解增强活性的多肽。在另一个方面,所述多核苷酸包含或组成为SEQIDNO:15或其成熟多肽编码序列,其包含于质粒PAG76,所述质粒包含于大肠杆菌NRRLB-50323,其中所述多核苷酸编码具有纤维素分解增强活性的多肽。在另一个方面,所述多核苷酸包含或组成为SEQIDNO:17或其成熟多肽编码序列,其包含于质粒PAG77,所述质粒包含于大肠杆菌NRRLB-50324,其中所述多核苷酸编码具有纤维素分解增强活性的多肽。在另一个方面,所述多核苷酸包含或组成为SEQIDNO:19或其成熟多肽编码序列,其包含于质粒pAG78,所述质粒包含于大肠杆菌NRRLB-50325,其中所述多核苷酸编码具有纤维素分解增强活性的多肽。在另一个方面,所述多核苷酸包含或组成为SEQIDNO:21或其成熟多肽编码序列,其包含于质粒pAG79,所述质粒包含于大肠杆菌NRRLB-50326,其中所述多核苷酸编码具有纤维素分解增强活性的多肽。核酸构建体本发明还涉及包含本发明的多核苷酸的核酸构建体,所述多核苷酸与一个或多个(几个)调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。可以用许多方式操作所述多核苷酸以提供多肽的表达。依赖于表达载体,在将多核苷酸插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸的技术是本领域熟知的。调控序列可为启动子序列,其是由用于表达编码本发明多肽的多核苷酸的宿主细胞所识别的多核苷酸。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何多核苷酸,包括突变的、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。用于在细菌宿主细胞中指导本发明的核酸构建体转录的合适启动子的实例是从下述获得的启动子解淀粉芽孢杆菌a-淀粉酶基因(amyQ)、地衣芽孢杆菌a-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、大肠杆菌Iac操纵子、天蓝链霉菌琼脂糖酶基因(dagA)和原核3-内酰胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727-3731),以及tac启动子(DeBoer等,1983,Proc.Natl.Acad.Sci.USA80:21-25)o另夕卜的启动子在〃Usefulproteinsfromrecombinantbacteria〃于Gilbert等,1980,ScientificAmerican,242:74-94中;和在Sambrook等,1989,见上文中描述。用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子构巢曲霉乙酰胺酶、黑曲霉中性a-淀粉酶、黑曲霉酸稳定性a-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶样蛋白酶(W096/00787)、镶片镰孢淀粉葡糖苷酶(W000/56900)、镶片镰孢Daria(W000/56900)、镶片镰孢Quinn(W000/56900)、曼赫根毛霉(Rhizomucormiehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉P-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉P-木糖苷酶,以及NA2_tpi启动子(一种修饰的启动子,其来自在曲霉属中编码中性a-淀粉酶的基因,其中未翻译的前导序列由在曲霉属(Aspergilli)中编码丙糖磷酸异构酶的基因的未翻译的前导序列所替代;非限制性实例包括修饰的启动子,其来自在黑曲霉中编码中性a-淀粉酶的基因,其中未翻译的前导序列由在构巢曲霉或米曲霉中编码丙糖磷酸异构酶的基因的未翻译的前导序列所替代);和它们的突变的、截短的和杂合的启动子。在酵母宿主中,有用的启动子从如下酶的基因获得酿酒酵母烯醇化酶(EN0-1)、酿酒酵母半乳糖激酶(GALl)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUPl)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast8:423-488描述。调控序列也可以是合适的转录终止子序列,其由宿主细胞识别以终止转录。所述终止子序列与编码所述多肽的多核苷酸的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉a-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶样蛋白酶。对于酵母宿主细胞优选的终止子从如下酶的基因获得酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYCl)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上文描述。调控序列还可以是合适的前导序列,当被转录时其为对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的多核苷酸的5’-末端。可使用在所选宿主细胞中有功能的任何前导序列。对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。对于酵母宿主细胞合适的前导序列从如下酶的基因获得酿酒酵母烯醇化酶(EN0-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母a因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。调控序列也可以是聚腺苷酸化序列,其是与多核苷酸的3’末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可使用在所选宿主细胞中有功能的任何聚腺苷酸化序列。对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉a-葡糖苷酶。对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBiol.15:5983-5990描述。调控序列还可以是信号肽编码区,其编码与多肽的N端相连的信号肽,并且指导所述多肽进入细胞分泌途径。多核苷酸的编码序列5’端可固有地包含信号肽编码序列,其与编码所述多肽的编码序列的区段一起天然地连接在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列异源的信号肽编码序列。异源信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者,外源信号肽编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而,可使用指导表达的多肽进入所选宿主细胞的分泌途径的任何信号肽编码序列。对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列芽孢杆菌属NCIB11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶(subtilisin)、地衣芽孢杆菌¢-内酰胺酶、嗜热脂肪芽孢杆菌a-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,MicrobiologicalReviews57:109-137描述。对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。对于酵母宿主细胞有用的信号肽从酿酒酵母a因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码序列由Romanos等,1992,见上文描述。调控序列还可以是前肽编码序列,其编码位于多肽N端的前肽。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的,并且能够通过前肽的催化或自催化切割从前多肽转化为活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(W095/33836)、曼赫根毛霉天冬氨酸蛋白酶和酿酒酵母a因子的基因获得前肽编码序列。当信号肽和前肽序列二者均出现在多肽的N端时,将前肽序列置于紧接着(nextto)多肽N端,并且将信号肽序列置于紧接着前肽序列的N端。同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中,可使用ADH2系统或GALl系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAa-淀粉酶启动子和米曲霉葡糖淀粉酶启动子。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(withheavymetal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的多核苷酸将与调节序列可操作地连接。表达载体本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。多种核苷酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个(几个)方便的限制位点以允许在这些位点插入或取代编码多肽的多核苷酸。可供选择的是,可以通过在适当的用于表达的载体中插入包含所述序列的多核苷酸或核酸构建体来表达所述多核苷酸。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的表达调控序列可操作地连接。重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生多核苷酸的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(totalDNA),或可以使用转座子(transposon)。所述载体优选地含有一个或多个(几个)选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophytoauxotrophs)等。细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性例如氨苄青霉素、氯霉素、卡那霉素或四环素抗性。对于酵母宿主细胞合适的标记是八0£2、11133、1^似、1^32、1^了3、了1^1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitratereductase)、pyrG(乳清酸核苷_5’_憐酸脱羧酶)(orotidine_5’-phosphatedecarboxylase)>sC(硫酸腺苷酸转移酶)和trpC(邻氨基苯甲酸合酶(anthranilatesynthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyceshygroscopicus)的bar基因。所述载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的多核苷酸,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应含有足够数量的核酸,如100至10,000碱基对,400至10,000碱基对,和800至10,000碱基对,其与相应的目标序列具有高度序列同一性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列同源。此夕卜,整合元件可以是非编码或编码的多核苷酸。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”意指能够使质粒或载体体内复制的多核苷酸。细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUBllO、pE194、pTA1060和PAM^I的复制起点。用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARS1,ARS4,ARSI和CEN3的组合,和ARS4和CEN6的组合。在丝状真菌细胞中有用的复制起点的实例是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsRes.15:9163-9175;W000/24883)。分离AMAl基因和构建包含该基因的质粒或载体能够根据公开于WO00/24883中的方法完成。可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加多肽的产生。多核苷酸拷贝数的增加可通过如下方法获得将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂(selectableagent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,且由此含有多核苷酸的额外拷贝的细胞。用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,1989,见上文)。宿主细胞本发明还涉及重组宿主细胞,其包含本发明的多核苷酸可操作地连接于一个或多个(几个)指导本发明多肽的产生的调控序列。将包含多核苷酸的构建体或载体导入宿主细胞,使所述构建体或载体如前所述作为染色体整体或者作为自复制的染色体外载体维持。术语“宿主细胞”包括亲本细胞的任何后代,其由于复制过程中发生的突变而不同于亲本细胞。宿主细胞的选择将在很大程度上依赖于编码多肽的基因及其来源。宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞,例如,原核或真核细胞。原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于,芽孢杆菌属、梭菌属、肠球菌属、地芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属和链霉菌属。革兰氏阴性细菌包括但不限于,弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属和脲原体属。细菌宿主细胞可以是任何芽孢杆菌属细胞,包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。细菌宿主细胞还可以是任何链球菌属细胞,包括但不限于,似马链球菌、酿脓链球菌、乳房链球菌(Streptococcusuberis)和马链球菌兽痕亚种细胞。细菌宿主细胞还可以是任何链霉菌属细胞,包括但不限于,不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌细胞。可通过如下方法实现将DNA引入到芽孢杆菌属细胞例如原生质体转化(参见,例如,Chang和Cohen,1979,Mol.Gen.Genet.168:111-115),使用感受态细胞(参见,例如,Young和Spizizen,1961,J.Bacteriol.81:823-829或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.56:209-221),电穿孔(参见,例如,Shigekawa和Dower,1988,Biotechniques6:742-751)或接合(参见,例如,Koehler和Thorne,1987,J.Bacteriol.169:5771-5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞例如原生质体转化(参见,例如,Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见,例如,Dower等,1988,NucleicAcidsRes.16:6127-6145)。可通过如下方法实现将DNA引入到链霉菌属细胞例如原生质体转化和电穿孔(参见,例如,Gong等,2004,FoliaMicrobiol.(Praha)49:399-405),接合(参见,例如,Mazodier等,1989,J.Bacteriol.171:3583-3585),或转导(参见,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98:6289-6294)。可通过如下方法实现将DNA引入到假单胞菌属细胞例如电穿孔(参见,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(参见,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通过如下方法实现将DNA引入到链球菌属细胞例如天然感受态(naturalcompetence)(参见,例如,Perry和Kuramitsu,1981,Infect.Immun.32:1295-1297),原生质体转化(参见,例如,Catt和Jollick,1991,Microbios.68:189-207),电穿孑L(参见,例如,Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(参见,例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可以使用本领域已知的将DNA引入宿主细胞的任何方法。宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。宿主细胞可为真菌细胞。“真菌”用在本文包括以下门子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等,于AinsworthandBisbyjsDictionaryofTheFungi,第8版,1995,CABInternational,UniversityPress,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用),和所有有丝分裂孢子真菌(mitosporicfungi)(Hawksworth等,1995,见上文)。真菌宿主细胞可为酵母细胞。“酵母”用在本文包括产子囊酵母(ascospOTogenousyeast)(内抱霉目(Endomycetales))、产担子酵母(basidiosporogenousyeast)和属于半知菌类(FungiImperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,将酵母定义为如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.编,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。酵母宿主细胞可为假丝酵母属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞,如乳酸克鲁维酵母(Kluyveromyceslactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、或解脂西洋蓍霉(YarrowiaIipolytica)细胞。真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。丝状真菌宿主细胞可为枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂裙菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。例如,丝状真菌宿主细胞可为泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkanderaadusta)、干拟腊菌(Ceriporiopsisaneirina)、Ceriporiopsiscaregiea、Ceriporiopsisgilvescens、Ceriporiopsispannocinta、Ceriporiopsisrivulosa、Ceriporiopsissubrufa、虫拟錯菌(Ceriporiopsissubvermispora)、Chrysosporiuminops、嗜角质金抱子菌、Chrysosporiumlucknowense、Chrysosporiummerdarium、租金抱子菌、Chrysosporiumqueenslandicum、热带金抱子菌、Chrysosporiumzonatum、灰盖鬼伞(Coprinuscinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌(Phanerochaetechrysosporium)、福射射脉菌(Phlebiaradiata)、刺芳:侧耳(Pleurotuseryngii)、土生梭孢壳、长绒毛栓菌(Trametesvillosa)>变色栓菌(Trametesversicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023,Yelton等,1984,Proc.Natl.Acad.Sci.USA81:1470-1474,和Christensen等,1988,Bio/Technology6:1419-1422中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文献描述的方法转化酵母Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,pp182—187,AcademicPress,Inc.,NewYork;Ito等,1983,J.Bacteriol.153:163;和Hinnen等,1978,Proc.Natl.Acad.Sci.USA75:1920。产生方法本发明还涉及用于产生本发明多肽的方法,其包括(a)在有助于产生所述多肽的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。在一个优选的方面,所述细胞是土生梭孢壳的细胞。在一个更优选的方面,所述细胞是棘孢曲霉。在一个最优选的方面,所述细胞是土生梭孢壳NRRL8126。本发明还涉及用于产生本发明的多肽的方法,其包括(a)在有助于产生所述多肽的条件下培养本发明的重组宿主细胞;和(b)回收所述多肽。使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌,则其能够从细胞裂解物(lysate)回收。可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzymeassay)可用于测定多肽的活性。多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS_PAGE或提取(参见,例如,ProteinPurification,J._C.Janson和LarsRyden,editors,VCHPublishers,NewYork,1989)。在可选的方面,不回收多肽,而将表达所述多肽的本发明宿主细胞作为多肽的来源。植物本发明还涉及分离的植物,例如,转基因植物、植物部分或植物细胞,其包含本发明的分离的多核苷酸,从而以可回收的量表达和产生所述多肽。多肽可从植物或植物部分回收。或者,同样可以将含有所述多肽的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性质(rheologicalproperties),或用于破坏抗营养因子。转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses),如草地早熟禾(meadowgrass)(蓝草(bluegrass),早熟禾属(Poa));饲用牧草(foragegrass)如羊茅属(Festuca)、黑麦草属(Lolium);寒地型牧草(temperategrass),如Agrostis(翦股颖属);和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜杆(rapeseed)和紧密相关的模型生物体拟南芥(Arabidopsisthaliana)。植物部分的实例是莖(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块莖(tuber),以及包含这些部分的独立组织,例如,表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vasculartissue)、分生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如分离以促进本发明的应用的具体组织和细胞也被认为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seedcoat)。同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的子代。表达多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下方法构建所述植物或植物细胞将编码多肽的一个或多个(几个)表达构建体并入植物宿主基因组或叶绿体基因组,并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。表达构建体便利地是包含编码多肽的多核苷酸的核酸构建体,所述多核苷酸与在选择的植物或植物部分中表达该多核苷酸所需的适当的调节序列可操作地连接。此外,表达构建体可以包含对于鉴定宿主细胞有用的选择性标记,在所述宿主细胞中整合了表达构建体和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及如何表达多肽而确定。例如,编码多肽的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如Tague等,1988,PlantPhysiology86:506所述。对于组成性表达,可以使用35S_CaMV、玉米泛素I和稻肌动蛋白I启动子(Franck等,1980,Cell21:285-294,Christensen等,1992,PlantMo.Biol.18:675-689;Zhang等,1991,PlantCell3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storagesinktissue)例如种子、马铃薯块莖和果实的启动子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303),或来自代谢库组织(metabolicsinktissue)例如分生组织的启动子(Ito等,1994,PlantMol.Biol.24:863-878),种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,PlantCellPhysiol.39:885-889),来自豆球蛋白(Iegumin)B4和蚕豆(Viciafaba)的未知的种子蛋白基因的蚕豆启动子(Conrad等,1998,J.ofPlantPhysiol.152:708-711)、来自种子油体蛋白(oilbodyprotein)的启动子(Chen等,1998,PlantCellPhysiol.39:935-941),来自欧洲油菜(Brassicanapus)的忙藏蛋白napA启动子,或本
技术领域
公知的任何其他种子特异性的启动子,例如,在WO91/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番爺的rbcs启动子(Kyozuka等,1993,PlantPhysiology102:991-1000),小球藻病毒(chlorellavirus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(Mitra和Higgins,1994,PlantMol.Biol.26:85-93),来自稻的aldP基因启动子(Kagaya等,1995,Mol.Gen.genet.248:668-674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等,1993,PlantMol.Biol.22:573-588)。同样地,所述启动子可通过非生物的处理诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源施加的激活所述启动子的物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脱落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金属。启动子增强子元件也可以用于实现多肽在植物中的较高表达。例如,启动子增强子元件可以是内含子,其置于启动子和编码多肽的多核苷酸之间。例如Xu等,1993,见上,公开了使用稻肌动蛋白I基因的第一内含子以增强表达。选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science244:1293;Potrykus,1990,Bio/Technology8:535;Shimamoto等,1989,Nature338:274)。目前,根癌土壤杆菌(Agrobacteriumtumefaciens)介导的基因转移(genetransfer),是产生转基因双子叶植物的优选方法(为了参考,见Hooykas和Schilperoort,1992,PlantMol.Biol.19:15-38),而且它也可以用于转化单子叶植物,虽然对于这些植物其他的转化方法是常用的。目前,产生转基因单子叶植物的优选的方法,是用粒子(用转化DNA涂覆的微观的金或鹤粒子)轰击胚愈伤组织(embryoniccalli)或发育中的胚(developingembryos)(Christou,1992,PlantJ.2:275-281;Shimamoto,1994,CurrentOpin.Biotech.5:158-162;VasiI等,1992,Bio/Technology10:667-674)。转化单子叶植物的可供选择的方法是基于原生质体转化,如由Omirulleh等,1993,PlantMol.Biol.21:415-428所描述的。其他用于依照本公开使用的转化方法包括那些描述于美国专利6,395,966和7,151,204的那些(两者均通过全文提述并入本文)。转化之后,根据本领域熟知的方法选择具有并入的表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因例如,使用带有两个独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。除了用根据本发明制备的构建体直接转化具体植物基因型之外,还可通过将具有所述构建体的植物与缺乏该构建体的第二植物杂交来制备转基因植物。举例而言,可将编码多肽的构建体通过杂交而引入特定植物品种,而根本无需直接转化该给定品种的植物。因此,本发明不仅涵盖从依照本发明经转化的细胞直接再生的植物,还包括此类植物的后裔(progeny)。如用于本文,后裔可指依照本发明制备的亲本植物任何世代的后代(offspring)。此种后裔可包含依据本发明制备的DNA构建体,或依据本发明制备的DNA构建体的一部分。杂交导致转基因通过将起始种系与供体植物种系交叉授粉而引入植物种系。此类步骤的非限制性实例进一步阐述于美国专利7,151,204号。植物可通过回交转化方法生成。举例而言,植物包括称作回交转化的基因型、种系、近交体(inbred)或杂交体(hybrid)的植物。可使用遗传标记以协助本发明的一种或多种转基因从一个遗传背景基因渗入(introgression)至另一个。标记协助的选择提供了相对于常规育种的优势,在于其可用于避免由表型变异导致的错误。进一步,遗传标记可在特定杂交的个体后裔中提供有关良种种质相对程度的数据。举例而言,当具有所需性状但除此之外(otherwise)具有非农艺学所需的遗传背景的植物与良种亲本杂交时,可使用遗传标记来选择不仅具有该目标性状,还具有相对较大比例所需种质的后裔。以此方式,使一种或多种性状基因渗入特定遗传背景所需的世代数得到最小化。本发明还涉及产生本发明多肽的方法,包括(a)在有助于产生所述多肽的条件下培养包含编码所述多肽的多核苷酸的转基因植物或植物细胞;和(b)回收所述多肽。去除或减少纤维素分解增强活性本发明还涉及用于产生亲本细胞突变体的方法,其包括破坏或缺失编码本发明的多肽的多核苷酸或其部分,所述方法导致在相同条件下培养时,与亲本细胞相比突变的细胞产生较少的所述多肽。可以使用本领域熟知的方法(例如,插入、破坏、替代或缺失)通过减少或消除多核苷酸的表达来构建突变体细胞。在一个优选的方面,所述多核苷酸是失活的。待修饰或失活的多核苷酸可以是,例如,编码区或其对活性关键的部分,或表达编码区所需的调节元件。这种调节或调控序列的实例可以是启动子序列或其功能部分,即,足以影响多核苷酸表达的部分。用于可能的修饰的其它调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录激活子。可以通过向亲本细胞施以诱变,并且选择其中已将多核苷酸的表达减少或消除的突变体细胞来进行多核苷酸的修饰或失活。诱变可能是特异性的或随机的,可以通过例如使用合适的物理或化学诱变剂进行,通过使用合适的寡核苷酸进行,或通过将所述DNA序列进行PCR产生的诱变。此外,可以通过使用这些诱变剂的任何组合来进行诱变。适合于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、0_甲基羟胺、亚硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。当使用这些试剂时,通常通过如下方法来进行所述诱变在合适条件下存在优选的诱变剂时温育待诱变的亲本细胞,并筛选和/或选择显示基因表达减少的或无基因表达的突变体细胞。通过导入、取代或去除基因中的一个或多个(几个)核苷酸或其转录或翻译所需的调节元件可以实现所述多核苷酸的修饰或失活。例如,可以插入或去除核苷酸从而导致引入终止密码子,去除起始密码子,或改变开放阅读框。按照本领域已知的方法通过定位诱变或PCR产生的诱变可以实现这种修饰或失活。尽管在理论上所述修饰可以在体内进行,即,直接在表达待修饰的多核苷酸的细胞上进行,但优选如下面所示例的那样在体外进行所述修饰。消除或减少多核苷酸表达的便利方式的例子是基于基因取代,基因缺失,或基因破坏的技术。例如,在基因破坏方法中,将相应于内源多核苷酸的核酸序列在体外进行诱变以产生缺陷性的核酸序列,然后将其转化入亲本细胞中以产生缺陷基因。通过同源重组,所述缺陷性核酸序列替代了内源性多核苷酸。可能理想的是所述缺陷性多核苷酸还编码标记,其可用于选择其中多核苷酸被修饰或破坏的转化体。在特别优选的方面,用选择性标记(如本文所述的那些)来破坏所述多核苷酸。本发明还涉及在细胞中抑制具有纤维素分解增强活性的多肽的表达的方法,包括施于细胞或在细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含本发明的多核苷酸的亚序列。在一个优选的方面,所述dsRNA长度为约15、16、17、18、19、20、21、22、23、24、25或更多个双链核苷酸。所述dsRNA优选为小干扰RNA(siRNA)或微小RNA(miRNA)。在一个优选的方面,所述dsRNA是供抑制转录的小干扰RNA(siRNA)。在另一个优选的方面,所述dsRNA是供抑制翻译的微小RNA(miRNA)。本发明还涉及这样的双链RNA(dsRNA)分子,其包含SEQIDNO:I,SEQIDN0:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQIDNO:11,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDN0:19,或SEQIDN0:21的成熟多肽编码序列的一部分,以供在细胞中抑制所述多肽的表达。尽管本发明并不限于任何具体的作用机制,但dsRNA可进入细胞并导致类似或相同序列的单链RNA(ssRNA)包括内源mRNA的降解。当细胞暴露于dsRNA时,来自同源基因的mRNA通过称作RNA干扰(RNAi)的过程受选择性降解。本发明的dsRNA可用于基因沉默。在一个方面,本发明提供了使用本发明的dsRNAi选择性降解RNA的方法。该过程可在体外、离体或体内实施。在一个方面,所述dsRNA分子可用于在细胞、器官或动物中生成功能缺失(loss-of-function)的突变。用于制备和使用dsRNA分子以选择性降解RNA的方法在本领域是公知的;参见,例如美国专利6489127,6506559,6511824和6515109号。本发明进一步涉及亲本细胞的突变体细胞,其包含编码多肽的多核苷酸或其调控序列的破坏或缺失,或沉默的编码该多肽的基因,这导致与亲本细胞相比突变体细胞产生更少的多肽或不产生多肽。多肽缺陷型突变体细胞作为表达天然和异源多肽的宿主细胞特别有用。所以,本发明进一步涉及生产天然或异源多肽的方法,其包括(a)在有助于产生所述多肽的条件下培养突变体细胞;和(b)回收所述多肽。术语“异源多肽”意指对宿主细胞不是天然的多肽,例如天然蛋白质的变体。宿主细胞可包含多于一个拷贝的编码天然或异源多肽的多核苷酸。用于培养和纯化感兴趣的产物的方法可以通过本领域已知的方法进行。本发明用于产生基本上无纤维素分解增强活性的产物的方法在真核多肽,特别是真菌蛋白质例如酶的产生中是特别令人有兴趣的。纤维素分解增强-缺陷细胞也可以用于表达在制药上感兴趣的异源蛋白质例如激素、生长因子、受体等。术语“真核多肽”不仅包括天然多肽,也包括多肽例如酶,其通过氨基酸取代、缺失或添加或其它这样的修饰而被修饰以增强活性、热稳定性、pH耐受性等。在另外的方面,本发明涉及通过本发明方法产生的基本上无纤维素分解增强活性的蛋白质产物。组合物本发明还涉及包含本发明的多肽的组合物。优选地,所述组合物富含这种多肽。术语“富含”表示所述组合物的纤维素分解增强活性,例如,以至少I.I的富集因数(enrichmentfactor)增力口。所述组合物可以包含本发明的多肽作为主要酶成分,例如,单成分组合物。或者,所述组合物可以包含多种酶活性,如一种或多种(几种)选自下组的酶纤维素酶、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。可以依照本领域内已知的方法制备多肽组合物,并且可以是液体或干组合物的形式。例如,所述多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以依照本领域内已知方法使纳入所述组合物中的多肽稳定化。下面给出本发明的多肽组合物的优选用途。本发明的多肽组合物的剂量和其他使用所述组合物的条件可基于本领域已知方法来确定。用途本发明还涉及下述使用具有纤维素分解增强活性的多肽或其组合物的方法。本发明还涉及降解或转化纤维素材料的方法,包括在本发明的具有纤维素分解增强活性的多肽的存在下用酶组合物处理纤维素材料。在一个方面,所述方法还包括回收经降解或转化的纤维素材料。纤维素材料的降解或转化的可溶性产物可从不溶性纤维素材料使用本领域中公知的技术如例如离心、过滤和重力沉降来分离。本发明还涉及产生发酵产物的方法,其包括(a)在存在本发明的具有纤维素分解增强活性的多肽的条件下,用酶组合物糖化纤维素材料;(b)用一种或多种(几种)发酵微生物发酵经糖化的纤维素材料以产生发酵产物;和(C)从发酵回收发酵产物。本发明还涉及发酵纤维素材料的方法,其包括用一种或多种(几种)发酵微生物发酵纤维素材料,其中在存在本发明的具有纤维素分解增强活性的多肽的条件下,用酶组合物糖化纤维素材料。在一个方面,纤维素材料的发酵产生发酵产物。在另一个方面,所述方法进一步包括从发酵回收发酵产物。本发明的方法可用于将纤维素材料糖化为可发酵的糖,并将可发酵的糖转化为许多有用的物质,例如燃料,饮用乙醇,和/或发酵产物(例如酸、醇、酮、气体等)。从纤维素材料产生所需的发酵产物通常涉及预处理,酶水解(糖化),和发酵。根据本发明的纤维素材料的处理可以使用本领域的常规过程完成。此外,本发明的方法能使用经配置以依照发明操作的任何常规生物质处理设备进行。水解(糖化)和发酵,分别或同时,包括但不限于,分开的水解和发酵(SHF)、同步糖化和发酵(SSF)、同步糖化和共发酵(SSCF)、混合的水解和发酵(HHF)、分开的水解和共发酵(SHCF)、混合的水解和共发酵(HHCF),和直接微生物转化(DMC)。SHF使用分开的处理步骤以首先将纤维素材料酶水解为可发酵糖,例如,葡萄糖,纤维二糖、纤维三糖和戊糖,然后将可发酵糖发酵成为乙醇。在SSF中,纤维素材料的酶水解和糖变为乙醇的发酵组合在一个步骤中(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,于HandbookonBioethanol:ProductionandUtilization,Wyman,C.E编,Taylor&Francis,Washington,DC,179-212)。SSCF包括多种糖的共发酵(Sheehan,J.,和Himmel,M.,1999,Enzymes,energyandtheenvironment:AstrategicperspectiveontheU.S.DepartmentofEnergy’sresearchanddevelopmentactivitiesforbioethanol,Biotechnol.Prog.15:817-827)。HHF在同步糖化和水解步骤之外,还涉及单独的水解步骤,所述步骤可以在同一个反应器中进行。HHF过程中的步骤可以在不同的温度进行,即,高温酶糖化,然后在发酵菌株能够耐受的较低温度进行SSF。DMC在一个或多个(几个)步骤中组合了所有三个过程(酶产生、水解和发酵),其中使用相同的生物体产生用于将纤维素材料转化成可发酵糖并将可发酵糖转化成终产物的酶(Lynd,L.R.,Weimer,P.J.,vanZyljW.H.,和Pretorius,I.S.,2002,Microbialcelluloseutilization:Fundamentalsandbiotechnology,Microbiol.Mol.Biol.Reviews66:506-577)o在本文可以理解的是,本领域中任何已知的方法,包括预处理、酶水解(糖化)、发酵,或它们的组合,可用于实施本发明的方法。常规设备包括补料分批搅拌反应器、分批搅拌反应器、具有超滤的连续流搅拌反应器和/或连续活塞流柱式反应器(FernandadeCastilhosCorazza,FlavioFariadeMoraes,GisellaMariaZanin和IvoNeitzel,2003,Optimalcontrolinfed—batchreactorforthecellobiosehydrolysis,ActaScientiarum.TechnoIogy25:33-38;Gusakov,A.V.,和Sinitsyn,A.P.,1985,Kineticsoftheenzymatichydrolysisofcellulose:I.Amathematicalmodelforabatchreactorprocess,Enz.Microb.Technol.7:346-352)、研磨反应器(Ryu,S.K.,和Lee,J.M.,1983,Bioconversionofwastecellulosebyusinganattritionbioreactor,Biotechnol.Bioeng.25:53-65),或者具有由电磁场引起的强烈搅拌的反应器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,0.V.,1996,Enhancementofenzymaticcellulosehydrolysisusinganoveltypeofbioreactorwithintensivestirringinducedbyelectromagneticfield,Appl.Biochem.Biotechnol.56:141-153)。其它反应器类型包括流化床、升流层(upflowblanket)、固定化和挤出机型反应器以供水解和/或发酵。预处理。在本发明的方法的实施中,可以使用本领域已知的任何预处理过程破坏植物细胞壁的纤维素材料组分(Chandra等,2007,Substratepretreatment:ThekeytoeffectiveenzymatichydrolysisoflignocellulosicsAdv.Biochem.Engin./Biotechnol.108:67-93;Galbe和Zacchi,2007,Pretreatmentoflignocellulosicmaterialsforefficientbioethanolproduction,Adv.Biochem.Engin./Biotechnol.108:41-65;Hendriks和Zeeman,2009,Pretreatmentstoenhancethedigestibilityoflignocellulosicbiomass,BioresourceTechnol.100:10-18;Mosier等,2005,Featuresofpromisingtechnologiesforpretreatmentoflignocellulosicbiomass,BioresourceTechnol.96:673-686;Taherzadeh和Karimi,2008,Pretreatmentoflignocellulosicwastestoimproveethanolandbiogasproduction:Areview,Int.J.ofMol.Sci.9:1621-1651;Yang和Wyman,2008,Pretreatment:thekeytounlockinglow-costcellulosicethanol,BiofuelsBioproductsandBiorefining-Biofpr2:26-40)。纤维素材料也可以在预处理之前使用本领域中已知的方法进行粒度减小、预浸泡、润湿、洗涤和/或调节。常规的预处理包括但不限于,蒸汽预处理(伴随或不伴随爆炸)、稀酸预处理、热水预处理、碱性预处理、石灰预处理、湿氧化、湿爆炸、氨纤维爆炸、有机溶剂预处理和生物预处理。其它预处理包括氨渗滤、超声、电穿孔、微波、超临界CO2、超临界1120、臭氧和Y辐射预处理。可以在水解和/或发酵之前预处理纤维素材料。预处理优选在水解前进行。或者,预处理可以与酶水解同时进行以释放可发酵糖,如葡萄糖、木糖和/或纤维二糖。在大多数情况下,预处理步骤本身使一些生物质转化成可发酵糖(甚至在不存在酶的情况下)。蒸汽预处理在蒸汽预处理中,加热纤维素材料以破坏植物细胞壁成分,包括木质素、半纤维素和纤维素,使酶可接触纤维素和其它部分,例如,半纤维素。使纤维素材料通过或穿过反应容器,其中注入蒸汽以增加温度至需要的温度和压力,并且在其中保持期望的反应时间。蒸汽预处理优选在140-230°C,更优选160-200°C,并且最优选170-190°C进行,其中最优的温度范围依赖于加入的任何化学催化剂。蒸汽预处理的停留时间优选1-15分钟,更优选3-12分钟,并且最优选4-10分钟,其中最优的停留时间依赖于温度范围和加入的任何化学催化剂。蒸汽预处理允许相对较高的固体加载量,使纤维素材料在预处理过程中通常仅仅变得潮湿。蒸汽预处理经常与预处理后的物质的爆炸放料(explosivedischarge)组合,这称为蒸汽爆炸,即,快速闪变至大气压和物质的瑞流,以通过破碎增加可接触的表面积(Duff和Murray,1996,BioresourceTechnology855:1-33;Galbe和Zacchi,2002,Appl.Microbiol.Biotechnol.59:618-628;美国专利申请No.20020164730)。在蒸汽预处理过程中,切割半纤维素乙酰基团,并且得到的酸自催化半纤维素部分水解成单糖和寡糖。去除木质素至有限的程度。经常在蒸汽预处理之前加入催化剂如H2SO4或SO2(通常0.3至3%w/w),其可减少时间,降低温度,增加回收率,并改进酶水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132:496-508;Varga等,2004,Appl.Biochem.Biotechnol.113-116:509-523;Sassner等,2006,EnzymeMicrob.Technol.39:756-762)。化学预处理术语“化学处理”指促进纤维素、半纤维素和/或木质素分离和/或释放的任何化学预处理。合适的化学预处理过程的实例包括例如稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆炸(AFEX)、氨渗滤(APR)和有机溶剂预处理。在稀酸预处理中,将纤维素材料与稀酸(通常是&504)和水混合以形成浆料,由蒸汽加热至期望的温度,并在一段停留时间后闪变至大气压。可以用很多反应器设计进行稀酸预处理,例如,活塞流式反应器、逆流反应器或连续逆流收缩床反应器(Duff和Murray,1996,supra;Schell等,2004,BioresourceTechnol.91:179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93-115)。还可以使用碱性条件下的几种预处理方法。这些碱预处理包括,但不限于,石灰预处理、湿氧化、氨渗滤(APR)和氨纤维/冷冻爆炸(AFEX)。用碳酸钙、氢氧化钠或氨,在85-150V的低温进行石灰预处理,停留时间从I小时到几天(Wyman等,2005,BioresourceTechnol.96:1959-1966;Mosier等,2005,BioresourceTechnol.96:673-686)。WO2006/110891,WO2006/110899,WO2006/110900和WO2006/110901公开了使用氨的预处理方法。湿法氧化是热预处理,通常在180-20(TC进行5-15分钟,加入氧化剂如过氧化氧或过压氧(Schmidt和Thomsen,1998,BioresourceTechnol.64:139-151;Palonen等,2004,Appl.Biochem.Biotechnol.117:1-17;Varga等,2004,Biotechnol.Bioeng.88:567-574;Matin等,2006,J.Chem.Technol.Biotechnol.81:1669-1677)。预处理以优选1-40%干物质,更优选2-30%干物质,并且最优性5-20%干物质进行,并且由于加入碱如碳酸钠,初始PH经常会增加。湿法氧化预处理方法的修改方法,称为湿爆炸(湿氧化和蒸汽爆炸的组合),能够处理高达30%的干物质。在湿爆炸中,在预处理过程中,在一定的停留时间后引入氧化剂。然后通过闪变至大气压而结束预处理(W02006/032282)。氨纤维爆炸(AFEX)涉及在温和温度如90-100°C和高压如17_20bar,用液体或气体氨将纤维素材料处理5-10分钟,其中干物质含量可以高达60%(Gollapalli等,2002,Appl.Biochem.Biotechnol.98:23-35;Chundawat等,2007,Biotechnol.Bioeng.96:219-231;Alizadeh等,2005,Appl.Biochem.Biotechnol.121:1133-1141;Teymouri等,2005,BioresourceTechnol.96:2014-2018)。AFEX预处理导致纤维素解聚,和半纤维素的部分水解。木质素-糖复合物得到切割。有机溶剂预处理通过用含水乙醇(40-60%乙醇)在160-200°C提取30_60分钟而将纤维素材料去木质素化(Pan等,2005,Biotechnol.Bioeng.90:473-481;Pan等,2006,BiotechnoIBioeng.94:851-86I;Kurabi等,2005,Appl.Biochem.Biotechnol.121:219-230)。经常加入硫酸作为催化剂。在有机溶剂预处理中,去除大部分半纤维素。合适的预处理方法的其他实例如Schell等,2003,Appl.BiochemandBiotechn.Vol.105-108:69-85,和Mosier等,2005,BioresourceTechnology96:673-686,和美国已公开的申请2002/0164730所述。在一个方面,化学预处理优选作为酸处理,并且更优选作为连续稀酸和/或弱酸(mildacid)处理进行。酸通常是硫酸,但也可以使用其它酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢或其混合物。弱酸处理在优选1-5,更优选1-4,并且最优选1-3的pH范围内进行。在一个方面,酸浓度在优选0.01至20wt%酸,更优选0.05至10wt%酸,甚至更优选0.I至5wt%酸,并且最优选0.2至2.0wt%酸的范围内。酸与纤维素材料接触,并在优选160-220°C,和更优选165-195°C范围内的温度保持数秒到数分钟,例如I秒-60分钟的时间。在另一个方面,预处理作为氨纤维爆炸步骤(AFEX预处理步骤)进行。在另一个方面,预处理发生在含水浆料中。在优选的方面,在预处理过程中纤维素材料以优选10-80wt%,更优选20-70wt%,并且最优性30-60wt%,如约50wt%的量存在。预处理的纤维素材料可以不洗涤或者使用本领域任何已知的方法洗涤,例如,用水洗涤。机械预处理术语“机械预处理”指各种类型的磨制(grinding)或粉碎(milling)(例如,干磨、湿磨或振动球磨)。物理预处理术语“物理预处理”指促进纤维素、半纤维素和/或木质素从纤维素材料分离和/或释放的任何预处理。例如,物理预处理可涉及辐射(例如,微波辐射)、汽蒸/蒸汽爆炸、水热解(hydrothermolysis)和它们的组合。物理预处理可以涉及高压和/或高温(蒸汽爆炸)。在一个方面,高压指范围在优选约300至约600psi,更优选约350至约550psi,并且最优选约400至约500psi,如约450psi的压力。在另一个方面,高温指范围在约100至约300°C,优选约140至约235°C的温度。在一个优选的方面,机械预处理在使用如上所定义的高温和高压的分批过程、蒸汽枪水解器系统,例如来自SundsDefibratorAB,Sweden的SundsHydrolyzer中进行。组合的物理和化学预处理可以对纤维素材料进行物理和化学预处理。例如,预处理步骤可以涉及稀酸或弱酸处理和高的温度和/或压力处理。根据需要,可以顺序或同时进行物理和化学预处理。还可以包括机械预处理。因此,在一个优选的方面,对纤维素材料进行机械、化学或物理预处理,或者它们的任意组合,以促进纤维素、半纤维素和/或木质素的分离和/或释放。生物预处理术语“生物预处理”指促进纤维素、半纤维素和/或木质素从纤维素材料分离和/或释放的任何生物预处理。生物预处理技术可以包括应用溶解木质素的微生物(参见,例如,Hsu,T.-A.,1996,Pretreatmentofbiomass,于HandbookonBioethanol:ProductionandUtilization,Wyman,C.E编,Taylor&Francis,Washington,DC,179-212;Ghosh和Singh,1993,Physicochemicalandbiologicaltreatmentsforenzymatic/microbialconversionoflignocellulosicbiomass,Adv.Appl.Microbiol.39:295_333;McMillan,J.D.,1994,Pretreatinglignocellulosicbiomass:areview,于EnzymaticConversionofBiomassforFuelsProduction,HimmeI,M.E.,Baker,J.0.,和Overend,R.P.,编,ACSSymposiumSeries566,AmericanChemicalSociety,Washington,DC,第15章;Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.,编,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;Olsson和Hahn-Hagerdal,1996,Fermentationoflignocellulosichydrolysatesforethanolproduction,Enz.Microb.Tech.18:312-331;和Vallander和Eriksson,1990,Productionofethanolfromlignocellulosicmaterials:Stateoftheart,Adv.Biochem.Eng./Biotechnol.42:63-95)。趣化。在水解(也称作糖化)步骤中,将纤维素材料(例如经预处理的)水解以将纤维素或亦将半纤维素分解成可发酵糖,如葡萄糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶的寡糖。水解由酶组合物以酶法在本发明的具有纤维素分解增强活性的多肽的存在下进行。组合物的酶可以顺序加入。酶水解优选在易于由本领域技术人员确定的条件下,在合适的含水环境中进行。在一个方面,水解在适于酶的活性,即对于酶最优的条件下进行。水解可以以补料分批或连续的过程进行,其中将纤维素材料逐渐补入,例如,含酶的水解溶液中。糖化通常在搅拌釜反应器或发酵罐中,在受控的pH、温度和混合条件下进行。合适的处理时间、温度和PH条件可以由本领域技术人员容易地确定。例如,糖化可以持续长达200小时,但是通常优选进行约12至约96小时,更优选约16至约72小时,并且最优选约24至约48小时。温度的范围优选约25°C至约70°C,更优选约30°C至约65°C,并且更优选约40°C至约60°C,特别是约50°C。pH的范围优选约3至约8,更优选约3.5至约7,并且最优选约4至约6,特别是约pH5。干燥固体含量优选约5至约50wt%,更优选约10至约40wt%,并且最优选约20至约30wt%。酶组合物可包含任何可用于降解或转化纤维素材料的蛋白。在一个方面,酶组合物包含或进一步包含一种或多种(几种)选自下组的酶纤维素酶、具有纤维素分解增强活性的多肽,半纤维素酶,棒曲霉素(expansin),酯酶,漆酶,木质素分解酶(ligninolyticenzyme),果胶酶,过氧化物酶,蛋白酶和膨胀素。在另一个方面,所述纤维素酶优选为一种或多种(几种)选自下组的酶内切葡聚糖酶,纤维二糖水解酶和3-葡糖苷酶。在另一个方面,所述半纤维素酶优选为一种或多种(几种)选自下组的酶乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。在另一个方面,酶组合物包含一种或多种(几种)纤维素分解酶。在另一个方面,酶组合物包含或进一步包含一种或多种(几种)半纤维素分解酶。在另一个方面,酶组合物包含一种或多种(几种)纤维素分解酶和一种或多种(几种)半纤维素分解酶。在另一个方面,酶组合物包含一种或多种(几种)选自下组的酶纤维素分解酶和半纤维素分解酶。在另一个方面,酶组合物包含内切葡聚糖酶。在另一个方面,酶组合物包含纤维二糖水解酶。在另一个方面,酶组合物包含3-葡糖苷酶。在另一个方面,酶组合物包含具有纤维素分解增强活性的多肽。在另一个方面,酶组合物包含内切葡聚糖酶和纤维二糖水解酶。在另一个方面,酶组合物包含内切葡聚糖酶和3-葡糖苷酶。在另一个方面,酶组合物包含纤维二糖水解酶和3-葡糖苷酶。在另一个方面,酶组合物包含内切葡聚糖酶,纤维二糖水解酶,和¢-葡糖苷酶。在另一个方面,酶组合物包含内切葡聚糖酶,纤维二糖水解酶,和¢-葡糖苷酶,和具有纤维素分解增强活性的多肽。在另一个方面,酶组合物包含乙酰甘露聚糖酯酶。在另一个方面,酶组合物包含乙酰木聚糖酯酶。在另一个方面酶组合物包含阿拉伯聚糖酶(例如a-L-阿拉伯聚糖酶)。在另一个方面,酶组合物包含阿拉伯呋喃糖苷酶(例如a-L-阿拉伯呋喃糖苷酶)。在另一个方面,酶组合物包含香豆酸酯酶。在另一个方面,酶组合物包含阿魏酸酯酶。在另一个方面,酶组合物包含半乳糖苷酶(例如,a-半乳糖苷酶和/或¢-半乳糖苷酶)。在另一个方面,酶组合物包含葡糖醛酸糖苷酶(例如,a-D-葡糖醛酸糖苷酶)。在另一个方面,酶组合物包含葡糖醛酸酯酶。在另一个方面,酶组合物包含甘露聚糖酶。在另一个方面,酶组合物包含甘露糖苷酶(例如3-甘露糖苷酶)。在另一个方面,酶组合物包含木聚糖酶。在一个优选的方面,所述木聚糖酶为家族10木聚糖酶。在另一个方面,酶组合物包含木糖苷酶(例如3-木糖苷酶)。在另一个方面,酶组合物包含棒曲霉素。在另一个方面,酶组合物包含酯酶。在另一个方面,酶组合物包含漆酶。在另一个方面,酶组合物包含木质素分解酶。在一个优选的方面,所述木质素分解酶是锰过氧化物酶。在另一个优选的方面,所述木质素分解酶是木质素过氧化物酶。在另一个优选的方面,所述木质素分解酶是H2O2产生酶。在另一个方面,酶组合物包含果胶酶。在另一个方面,酶组合物包含过氧化物酶。在另一个方面,酶组合物包含蛋白酶。在另一个方面,酶组合物包含膨胀素。在本发明的方法中,酶可在发酵之前或过程中添加,例如在糖化过程中或在发酵微生物繁殖过程中或之后添加。所述酶组合物的一种或多种(几种)组分可为野生型蛋白、重组蛋白或野生型蛋白和重组蛋白的组合。举例而言,一种或多种(几种)组分可为细胞的天然蛋白,其用作宿主细胞以重组表达一种或多种(几种)酶组合物的其他组分。酶组合物的一种或多种(几种)组分可作为单组分产生,然后将其组合以形成酶组合物。所述酶组合物可为多组分和单组分蛋白制备物的组合。用于本发明方法中的酶可为任何适用的形式,如例如去除或未去除细胞的粗发酵液,含或不含细胞碎片的细胞裂解物,半纯化或纯化的酶制备物,或宿主细胞,作为酶的来源。所述酶组合物可为干粉或颗粒,无粉尘的颗粒,液体,稳定化液体或稳定化受保护的酶。液体酶制备物可根据确立的工艺,例如通过添加稳定剂如糖、糖醇或其他多元醇,和/或乳酸或其他有机酸来稳定化。具有纤维素分解增强活性的酶和多肽的最适量取决于几个因素,其包括但不限于,组分纤维素分解酶的混合物、纤维素材料、纤维素材料的浓度、纤维素材料的预处理、温度、时间、pH和包括发酵生物体(例如,同步糖化和发酵的酵母)。在一个优选的方面,纤维素分解酶对于纤维素材料的有效量是约0.5至约50mg,优选约0.5至约40mg,更优选约0.5至约25mg,更优选约0.75至约20mg,更优选约0.75至约15mg,甚至更优选约0.5至约IOmg,并且最优选约2.5至约IOmg每g纤维素材料。在另一个优选的方面,具有纤维素分解增强活性的多肽对于纤维素材料的有效量是约0.01至约50.Omg,优选约0.01至约40mg,更优选约0.01至约30mg,更优选约0.01至约20mg,更优选约0.01至约IOmg,更优选约0.01至约5mg,更优选约0.025至约I.5mg,更优选约0.05至约I.25mg,更优选约0.075至约I.25mg,更优选约0.I至约I.25mg,甚至更优选约0.15至约I.25mg,并且最优选约0.25至约I.Omg每g纤维素材料。在另一个优选的方面,具有纤维素分解增强活性的多肽对于纤维素分解酶蛋白的有效量是约0.005至约I.Og,优选约0.01至约I.Og,更优选约0.15至约0.75g,更优选约0.15至约0.5g,更优选约0.I至约0.5g,甚至更优选约0.I至约0.25g,并且最优选约0.05至约0.2g每g纤维素分解酶。具有纤维素分解酶活性或半纤维素分解酶活性的多肽以及其他可用于降解纤维素材料的蛋白/多肽,例如具有纤维素分解增强活性的多肽(在下文中称为“具有酶活性的多肽”)可源自或获得自任何合适的来源,包括细菌、真菌、酵母、植物或哺乳动物来源。术语“获得”在本文中意指该酶可从天然产生该酶作为天然酶的生物分离。术语“获得”在本文中还意指该酶可在宿主生物中使用本文中所述的方法重组产生,其中经重组产生的酶对于宿主生物是天然的或异源的,或具有修饰的氨基酸序列,例如,具有一个或多个(几个)4^,v4iUfl14,Vt4§RK.ffir^N4H-ffiUfl11卜年禅uffiUfl1fl庄Qffir^NRhd,ffi細琛錤,!!It评磨,Sd艮UOlPJJpopnasj,!I細朝義筚,13TsOJ,11細■醚锲,11細柵屮,!I嫌#,1|#锫,1|細迴篱,1|靼成妒,1|划龅,1|评,1|細€蛾,sndjsouejas,!I揋猶,!I細^HJrlllt呜,铒评韙剞,lllt4fe,ll迴靡,Spiqls,1IW義,ll^M^,!!細ir_rll細岷墘¥煙,!I岷蘭#,slso^03,m每域,snI-Hoqo*rHI-HLP03vg&JPP-PV1I悔rf^^v§*rHp*rHip3p^p,!I悔塑^,p*rHJ§ds〇7CJ4〇g,11靼崁,llltffi,!!迴途!rll細每,1|迴罔遛袞怒蛾細彰划轺趄迆盤蚺赋银每蛾1|_秕肢韬1|掛勸劁錤,!I掛勸,1|掛勸墘进,1|掛勸缴_梂,1|掛勸划筚〔Sg〕。怒蛾細遛歆#愁韬細遛铂梃,細遛_H<,細遛铒缠,細嫌遛铂^^轺趄迆盤蚺赋喇怒蛾闳1职坩〔S32。怒蛾:_■_細莆遛pirM細莆遛赃Wv,細莆遛茑饉,細莆ilpir荽轺趄迆盤蚺赋喇怒蛾闳MTH柃轺银每<-1职坩〔063S。怒蛾細志迴肽斓俏枪韬細志崁,細H-I迴肽粲躬邀,細H-I迴肽馨轡轺趄迆盤蚺赋喇怒蛾闳irH柃轺银每<-1坩〔683S。4<叫饿(cdUIScdI-Hdcd2B11拉IJmM(T3JJassJas11細迟胸恢,(JaCPeqOAn)11細H-I蓉,(EnJJaCPeqOSry)11細H-I奪,(EnJJa:PT3qoAT3J&11細H-lw,(Ja:PT3q8二aH)11細',(.Ifncn3qoJAdET3s11細ffiIIP,(3ieT13s)11細迟U急,(SUOEOPnaSJ)11細驾時筚,細H-lfK^4<Ef蛾細親趄医迟川柵轺趄迆盤蚺赋^^怒蛾(SnnTgqOUeSO)11細H-I迴肽秕避韬(SnnTgqOae11細H-Ilf执,(§TPTtsoJs11細奪,(3。。8。#。^)11細翁蘇,(snnTOT3qo:PT3q)11¢^,(snoooooJHoq^11悔徵礙,(snoooooI-Hhndcdq^)1|悔徵癖,(S0O旨〇^0J4S)11細Itil,(sn88cnda^s)11細莆!I,(SnnTgS11細H-I迴肽袞怒蛾細親趄埕迟川柵轺趄迆盤蚺IT喇蛾闳MT袞孽。怒蛾細親喇蛾轺趄迆盤蚺IT〔8832。拉制轺鲣磘(觉_韬#{辉扫収扫頰袞)!?_喇轺_圈發8如轺盤来右m。盤S胡t想柃轫崧氍稍MS呆IlJ筠騒将扫頰韬拉/issiM/蔣¥魃,水堪Xs/3^<寸SOZZSTZo霉、粗糙脉孢菌、绳状青霉、产紫青霉、黄孢平革菌、Thielaviaachromatica、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭抱壳、Thielaviafimeti、小抱梭抱壳、卵抱梭抱壳、Thielaviaperuviana、瘤抱梭抱壳、毛梭抱壳、Thielaviasubthermophila、土生梭孢壳、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或Trichophaeasaccata多肽。还可以使用具有酶活性的多肽经化学修饰或蛋白质工程改造的突变体。所述酶组合物的一种或多种(几种)组分可以是重组组分,亦即,通过克隆编码所述单独组分的DNA序列并随后用该DNA序列转化细胞并在宿主中表达(参见,例如,W091/17243和W091/17244)产生。所述宿主优选是异源宿主(酶对宿主是异源的),但该宿主在一定条件下也可以是同源宿主(酶对宿主是天然的)。单组分纤维素分解蛋白还可以通过从发酵液中提纯这样的蛋白质来制备。在一个方面,所述一种或多种(几种)纤维素分解酶包括商业性纤维素分解酶制备物。适用于本发明的商业的纤维素分解蛋白制备物的实例包括,例如,CELLICCtec(NovozymesA/S)>CELLUCLAST(NovozymesA/S)、N0V0ZYM188(NovozymesA/S)、CELLUZYME(NovozymesA/S)、CEREFLO(NovozymesA/S)和ULTRAFLO(NovozymesA/S),ACCELERASE(GenencorInt.)、LAMINEX(GenencorInt.)、SPEZYMECP(GenencorInt.),ROHAMENT7069ff(RohmGmbH),FlBREZYME_LDI(DyadicInternational,Inc.)>FIBREZYMECI.I5R(DyadicInternational,Inc.)或VISCOSTAR150L(DyadicInternational,Inc.)。所述纤维素酶以固体的约0.001到约5.Owt%,更优选固体的约0.025到约4.Owt%,且最优选固体的约0.005到约2.Owt%的有效量添加。可以用于本发明的方法的细菌内切葡聚糖酶的实例包括但不仅限于,解纤维热酸菌(Acidothermuscellulolyticus)内切葡聚糖酶(WO91/05039;W093/15186;美国专利5,275,944;W096/02551;美国专利5,536,655,W000/70031,WO05/093050);Thermobifidafusca内切葡聚糖酶III(W005/093050)jPThermobifidafusca内切葡聚糖酶V(W005/093050)。可以用于本发明的真菌内切葡聚糖酶的实例包括但不仅限于,里氏木霉内切葡聚糖酶I(Penttila等,1986,Gene45:253-263;里氏木霉Cel7B内切葡聚糖酶I,GENBANK登录号M15665);里氏木霉内切葡聚糖酶II(Saloheimo等,1988,Gene63:11-22;里氏木霉Cel5A,GENBANK登录号M19373);里氏木霉内切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64:555-563;GENBANK登录号AB003694);以及里氏木霉内切葡聚糖酶V(Saloheimo等,1994,MolecularMicrobiology13:219-228;GENBANK登录号Z33381);棘抱曲霉内切葡聚糖酶(Ooi等,1990,NucleicAcidsResearch18:5884);川地曲霉(Aspergilluskawachii)内切葡聚糖酶(Sakamoto等,1995,CurrentGenetics27:435-439);胡萝卜软腐欧文氏菌(Erwiniacarotovara)内切葡聚糖酶(Saarilahti^,1990,Gene90:9-14);尖镰孢内切葡聚糖酶(GENBANK登录号L29381);灰腐质霉thermoidea变种内切葡聚糖酶(GENBANK登录号AB003107);Melanocarpusalbomyces内切葡聚糖酶(GENBANK登录号MAL515703);粗糙脉孢菌内切葡聚糖酶(GENBANK登录号XM324477);特异腐质霉内切葡聚糖酶V;嗜热毁丝霉CBS117.65内切葡聚糖酶;担子菌纲(basidiomycete)CBS495.95内切葡聚糖酶;担子菌纲CBS494.95内切葡聚糖酶;土生梭孢壳NRRL8126CEL6B内切葡聚糖酶;土生梭孢壳NRRL8126CEL6C内切葡聚糖酶;土生梭孢壳NRRL8126CEL7C内切葡聚糖酶;土生梭孢壳NRRL8126CEL7E内切葡聚糖酶;土生梭抱壳NRRL8126CEL7F内切葡聚糖酶;CladorrhinumfoecundissimumATCC62373CEL7A内切葡聚糖酶;以及里氏木霉菌株VTT-D-80133内切葡聚糖酶(GENBANK登录号M15665)。可用于本发明的纤维二糖水解酶的示例包括但不仅限于,里氏木霉纤维二糖水解酶I;里氏木霉纤维二糖水解酶II;特异腐质霉纤维二糖水解酶I、嗜热毁丝霉纤维二糖水解酶II、土生梭孢壳纤维二糖水解酶II(CEL6A)、嗜热毛壳菌(Chaetomiumthermophilum)纤维二糖水解酶I以及嗜热毛壳菌纤维二糖水解酶II、烟曲霉纤维二糖水解酶I和烟曲霉纤维二糖水解酶II。可用于本发明的¢-葡糖苷酶的实例包括但不仅限于米曲霉¢-葡糖苷酶;烟曲霉@-葡糖苷酶;巴西青霉(Penicilliumbrasilianum)IBT20888P-葡糖苷酶;黑曲霉葡糖苷酶;以及棘孢曲霉¢-葡糖苷酶。米曲霉¢-葡糖苷酶活性可根据WO2002/095014获取。具有P-葡糖苷酶活性的烟曲霉多肽可根据WO2005/047499获取。具有P-葡糖苷酶活性的巴西青霉多肽可根据TO2007/019442获取。具有P-葡糖苷酶的黑曲霉多肽可根据Dan等,2000,J.Biol.Chem.275:4973-4980获取。具有P-葡糖苷酶活性的棘孢曲霉多肽可根据Kawaguchi等,1996,Gene173:287-288获取。所述P-葡糖苷酶可为融合蛋白。在一个方面,所述P-葡糖苷酶为米曲霉P-葡糖苷酶变体BG融合蛋白,或根据WO2008/057637获得的米曲霉P-葡糖苷酶融合蛋白。其它可用的内切葡聚糖酶、纤维二糖水解酶和¢-葡糖苷酶使用根据HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309-316和HenrissatB.和BairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695-696的分类公开于许多糖基水解酶家族中。其它可用于本发明的纤维素分解酶描述于EP495,257、EP531,315、EP531,372、WO89/09259、WO94/07998、TO95/24471、TO96/11262、W096/29397、TO96/034108、WO97/14804、WO98/08940、WO98/012307、W098/13465、WO98/015619、WO98/015633、WO98/028411、WO99/06574、WO99/10481、WO99/025846、WO99/025847、WO99/031255、W02000/009707,WO2002/050245,WO2002/0076792,WO2002/101078,W02003/027306,WO2003/052054,WO2003/052055,WO2003/052056,W02003/052057,WO2003/052118、WO2004/016760,WO2004/043980,W02004/048592,WO2005/001065,WO2005/028636、WO2005/093050,W02005/093073,WO2006/074005,WO2006/117432,WO2007/071818、W02007/071820、WO2008/008070、WO2008/008793、美国专利No.4,435,307、美国专利No.5,457,046、美国专利No.5,648,263、美国专利No.5,686,593、美国专利No.5,691,178、美国专利No.5,763,254以及美国专利No.5,776,757。在一个方面,所述一个或多个(几个)半纤维素分解酶包含商业性半纤维素分解酶制备物。适用于本发明的商业性半纤维素分解酶制备物的实例包括,例如SHEARZYME(NovozymesA/S)、CELLICHTec(NovozymesA/S)、V丨SCOZYME(NovozymesA/S)、ULTRAFLO(NovozymesA/S)、PULPZYME.HC(NovozymesA/s)、MULTIFECTXylanase(Genencor)、ECOPULPTX-200A(ABEnzymes)、HSP6000Xylanase(DSM)、DEP0L333P(BiocatalystsLimit,Wales,UK)、DEPOL740L.(BiocatalystsLimit,Wales,UK)和DEPOL762P(BiocatalystsLimit,Wales,UK)可用于本发明方法的木聚糖酶的实例包括但不限于棘孢曲霉(Aspergillusaculeatus)木聚糖酶(GeneSeqP:AAR63790;WO94/21785)、烟曲霉(Aspergillusfumigatus)木聚糖酶(W02006/078256)和土生梭抱壳(Thielaviaterrestris)NRRL8126木聚糖酶(W02009/079210)。可用于本发明方法的P-木糖苷酶的实例包括但不限于里氏木霉(Trichodermareesei)0-木糖苷酶(UniProtKB/TrEMBL登录号Q92458),埃默森踩节菌(Talaromycesemersonii)(SwissProt登录号Q8X212)和粗糖脉抱菌(Neurosporacrassa)(SwissProt登录号Q7S0W4)。可用于本发明方法的乙酰木聚糖酯酶的实例包括但不限于红褐肉座菌(Hypocreajecorina)乙酰木聚糖酯酶(W02005/001036)、粗糙脉孢菌乙酰木聚糖酯酶(UniProt登录号q7s259)、土生梭孢壳NRRL8126乙酰木聚糖酯酶(W02009/042846)、球毛壳菌(Chaetomiumglobosum)乙酰木聚糖酯酶(Uniprot登录号Q2GWX4)、细丽毛壳菌(Chaetomiumgracile)乙酰木聚糖酯酶(GeneSeqP登录号AAB82124)、颖枯壳针孢(Phaeosphaerianodorum)乙酰木聚糖酯酶(Uniprot登录号Q0UHJ1)和特异腐质霉(Humicolainsolens)DSM1800乙酰木聚糖酯酶(W02009/073709)。可用于本发明方法的阿魏酸酯酶的实例包括但不限于特异腐质霉DSM1800阿魏酸酯酶(W02009/076122)、粗糙脉孢菌阿魏酸酯酶(UniProt登录号Q9HGR3)和费希新萨托菌(Neosartoryafischer)阿魏酸酯酶(UniProt登录号A1D9T4)。可用于本发明方法的阿拉伯呋喃糖苷酶的实例包括但不限于特异腐质霉(Humicolainsolens)DSM1800阿拉伯呋喃糖苷酶(W02009/073383)和黑曲霉(Aspergillusniger)阿拉伯呋喃糖苷酶(GeneSeqP登录号AAR94170)。可用于本发明方法的a-葡糖醛酸糖苷酶的实例包括但不限于棒曲霉(Aspergillusclavatus)a-葡糖醒酸糖苷酶(UniProt登录号alccl2)、里氏木霉(Trichodermareesei)a-葡糖醒酸糖苷酶(Uniprot登录号Q99024)、埃默森踝节菌(Talaromycesemersonii)a-葡糖醒酸糖苷酶(UniProt登录号Q8X211)、黑曲霉(Aspergillusniger)a-葡糖醒酸糖苷酶(Uniprot登录号Q96WX9)、土曲霉(Aspergillusterreus)a-葡糖醒酸糖苷酶(SwissProt登录号Q0CJP9)和烟曲霉(Aspergillusfumigatus)a-葡糖醒酸糖苷酶(SwissProt登录号Q4WW45)。用于本发明方法的酶和蛋白可通过使用本领域已知方法(参见,例如Bennett,J.W和LaSure,L(编),MoreGeneManipulationsinFungi,AcademicPress,CA,1991),在含有合适碳源和氮源和无机盐的营养培养基上发酵上述指出的微生物菌株来产生。合适的培养基可从供应商获得,或可根据已公开的组成制备(例如美国典型培养物保藏中心的目录)。适于生长和酶产生的温度范围和其他条件在本领域是已知的(参见,例如Bailey,J.E.和Ollis,D.F.,BiochemicalEngineeringFundamentals,McGraw-HillBookCompany,NY,1986)。所述发酵可以是任何其结果为酶或蛋白表达或分离的培养细胞的方法。因此,发酵可以理解为包括在合适的培养基中并在允许所述酶得以表达或分离的条件下进行的摇瓶培养,或在实验室或工业发酵罐中的小-或大规模发酵(包括连续、分批、补料分批或固态发酵)。通过上述方法产生的所得的酶可从发酵培养基回收并通过常规方法纯化。发璧。可通过一种或多种(几种)能将糖直接或间接发酵成所需发酵产物的发酵微生物发酵自经水解的纤维素材料获得可发酵糖。“发酵”或“发酵方法”指任何发酵方法或包含发酵步骤的任何方法。发酵方法还包括用于消费品醇工业(例如,啤酒和葡萄酒)、乳品业(例如,发酵乳制品)、皮革业和烟草业的发酵方法。发酵条件依赖于期望的发酵产物和发酵生物体,并且能由本领域的技术人员容易地确定。在发酵步骤中,作为预处理和酶水解步骤的结果从纤维素材料释放的糖,通过发酵生物体(如酵母)发酵成为产物,例如,乙醇。如上所述,水解(糖化)和发酵可以是分开的或同时的。在本发明的发酵步骤中可以使用任何合适的经水解的纤维素材料。通常根据所需的发酵产品(即,要从发酵获得的物质)和使用的方法来选择所述材料,如本领域中所公知的。术语“发酵培养基”在本文中可理解为指加入发酵微生物之前的培养基,如,由糖化过程产生的培养基,以及同步的糖化和发酵方法(SSF)中使用的培养基。“发酵微生物”指适用于理想的发酵方法产生发酵产物的任何微生物,包括细菌和真菌生物体。发酵生物体可以是(6和/或(5发酵生物体,或它们的组合。Cf^PC5发酵生物体均在本领域公知。合适的发酵微生物能将糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖或寡糖)直接或间接地发酵(即,转化)成所需的发酵产品。产生乙醇的细菌和真菌发酵生物体的实例如Lin等,2006,Appl.Microbiol.Biotechnol.69:627-642所述。能发酵C6糖的发酵微生物的实例包括细菌和真菌生物体,如酵母。优选的酵母包括酵母属菌种,优选酿酒酵母。能发酵C5糖的发酵生物体的实例包括细菌和真菌生物体,如酵母。优选的C5发酵酵母包括毕赤酵母属,优选树干毕赤酵母(Pichiastipitis)的菌株,如树干毕赤酵母CBS5773;假丝酵母属,优选博伊丁假丝酵母(Candidaboidinii)、芸薹假丝酵母(Candidabrassicae)、休哈塔假丝酵母(Candidasheatae)、迪丹斯假丝酵母(Candidadiddensii)、假热带假丝酵母(Candidapseudotropicalis)或产朊假丝酵母(Candidautilis)的菌株。其它发酵生物体包括发酵单胞菌属(Zymomonas),如运动发酵单胞菌(Zymomonasmobilis);汉逊酵母属,如异常汉逊酵母(Hansenulaanomala);克鲁维酵母属,如脆壁克鲁维酵母;裂殖酵母属,如粟酒裂殖酵母(S.pombe);大肠杆菌,特别是已经经过遗传修饰而改进乙醇产量的大肠杆菌;梭菌属(Clostridium),如丙酮丁醇梭菌(Clostridiumacetobutylicum),Chlostridiumthermocellum,和Chlostridiumphytofermentans;地芽孢杆菌属菌种(Geobacillussp.);热厌氧杆菌属(Thermoanaerobacter),如解糖热厌氧杆菌(ThermoanaerobactersaccharoIyticum);和芽抱杆菌属(Bacillus),如凝结芽抱杆菌(Bacilluscoagulans)。在一个优选的方面,酵母是酵母属菌种。在一个更优选的方面,酵母是酿酒酵母。在另一个更优选的方面,酵母是糖化酵母(Saccharomycesdistaticus)。在另一个更优选的方面,酵母是葡萄汁酵母(Saccharomycesuvarum)。在另一个优选的方面,酵母是克鲁维酵母属。在另一个更优选的方面,酵母是马克斯克鲁维酵母(Kluyveromycesmarxianus)。在另一个更优选的方面,酵母是脆壁克鲁维酵母。在另一个优选的方面,酵母是假丝酵母属。在另一个更优选的方面,酵母是博伊丁假丝酵母。在另一个更优选的方面,酵母是芸薹假丝酵母。在另一个更优选的方面,酵母是迪丹斯假丝酵母。在另一个更优选的方面,酵母是假热带假丝酵母。在另一个更优选的方面,酵母是产朊假丝酵母。在另一个优选的方面,酵母是棒孢酵母属(Clavispora)。在另一个更优选的方面,酵母是葡萄牙棒孢酵母(ClavisporaIusitaniae)。在另一个更优选的方面,酵母是仙人掌棒孢酵母(Clavisporaopuntiae)。在另一个优选的方面,酵母是管囊酵母属(Pachysolen)。在另一个更优选的方面,酵母是嗜鞋管囊酵母(Pachysolentannophilus)。在另一个优选的方面,酵母是毕赤酵母属。在另一个更优选的方面,酵母是树干毕赤酵母。在另一个优选的方面,酵母是酒香酵母属(Bretannomyces)。在另一个更优选的方面,酵母是克劳森酒香酵母(Bretannomycesclausenii)(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,于HandbookonBioethanolProductionandUtilization,Wyman,C.E.编,Taylor&Francis,Washington,DC,179-212)。能有效地将己糖和戊糖发酵成乙醇的细菌包括,例如,运动发酵单胞菌和丙酮丁醇梭菌,Clostridiumthermocellum,Chlostridiumphytofermentans,地芽抱杆菌属菌种,解糖热厌氧杆菌和凝结芽孢杆菌(Philippidis,1996,见上文)。在一个优选的方面,细菌是发酵单胞菌属。在更优选的方面,细菌是运动发酵单胞菌。在另一个优选的方面,细菌是梭菌属。在另一个更优选的方面,细菌是热纤维梭菌。商业上可得到的适合乙醇产生的酵母包括,例如ETHANOLRED酵母(RedStar/Lesaffre,USA)、FALI(Fleischmann,sYeast,USA)、SUPERSTART和THERMOSACC新鲜酵母(EthanolTechnology,WI,USA)、BIOFERMAFT和XR(NABC-NorthAmericanBioproductsCorporation,GA,USA),GERTSTRAND(GertStrandAB,Sweden)和FERMIOL(DSMSpecialties)。在一个优选的方面,发酵微生物已经经过遗传修饰,提供发酵戊糖的能力,如利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物。通过将异源基因克隆入多种发酵微生物已经构建了能将己糖和戊糖转化成乙醇(共发酵)的生物体(Chen和Ho,1993,CloningandimprovingtheexpressionofPichiastipitisxylosereductasegeneinSaccharomycescerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho等,1998,GeneticalIyengineeredSaccharomycesyeastcapableofeffectivelycofermentingglucoseandxylose,Appl.Environ.Microbiol.64:1852-1859;Kotter和Ciriacy,1993,XylosefermentationbySaccharomycescerevisiae,Appl.Microbiol.Biotechnol.38:776-783;Walfridsson等,1995,Xylose-metabolizingSaccharomycescerevisiaestrainsoverexpressingtheTKLlandTALIgenesencodingthepentosephosphatepathwayenzymestransketolaseandtransaldolase,Appl.Environ.Microbiol.61:4184-4190;Kuyper等,2004,MinimalmetabolicengineeringofSaccharomycescerevisiaeforefficientanaerobicxylosefermentation:aproofofprinciple,FEMSYeastResearch4:655_664;Beall等,1991,ParametricstudiesofethanolproductionfromxyloseandothersugarsbyrecombinantEscherichiacoli,Biotech.Bioeng.38:296-303;Ingram等,1998,Metabolicengineeringofbacteriaforethanolproduction,Biotechnol.Bioeng.58:204-214;Zhang等,1995,MetabolicengineeringofapentosemetabolismpathwayinethanologenicZymomonasmobilis,Science267:240-243;Deanda等,1996,Developmentofanarabinose-fermentingZymomonasmobilisstrainbymetabolicpathwayengineering,Appl.Environ.Microbiol.62:4465-4470;WO2003/062430,xyloseisomerase)。在一个优选的方面,经过遗传修饰的发酵微生物是酿酒酵母。在另一个优选的方面,经过遗传修饰的发酵微生物是运动发酵单胞菌。在另一个优选的方面,经过遗传修饰的发酵微生物是大肠杆菌。在另一个优选的方面,经过遗传修饰的发酵微生物是产酸克雷伯氏菌(Klebsiellaoxytoca)。在另一个优选的方面,所述经遗传修饰的发酵微生物是克鲁维酵母菌种。本领域中公知的是,上述生物体还能用于产生其它物质,如本文所述。通常向降解的木素纤维素或水解物加入发酵微生物,并进行约8至约96小时,如约24至约60小时发酵。温度通常为约26°C至约60°C,特别是约32°C或50°C,并且在约pH3至约pH8,如约pH4-5,6或7。在一个优选的方面,对降解的纤维素材料施用酵母和/或另一种微生物,并进行约12至约96小时,如通常为24-60小时发酵。在一个优选的方面,温度优选为约20°C至约60°C,更优选约25°C至约50°C,并且最优选约32°C至约50°C,特别是约32°C或50°C,并且pH通常为约pH3至约pH7,优选约pH4-7。然而,一些发酵生物体例如细菌,具有更高的最适发酵温度。酵母或另一种微生物优选以约IO5-IO12,优选约IO7-IOltl,特别是约2xl08活细胞计数每ml发酵液的量施用。关于使用酵母进行发酵的进一步指导可以在例如“TheAlcoholTextbook,,(K.Jacques,T.P.Lyons和D.R.Kelsall编,NottinghamUniversityPress,UnitedKingdom1999)中找到,其通过提述并入本文。对于乙醇生产,在发酵后蒸馏发酵的浆料以提取乙醇。根据本发明的方法获得的乙醇可以用作,例如燃料乙醇;饮料乙醇,即,中性饮料酒,或工业乙醇。发酵刺激剂可以与本文所述的任何方法组合使用,以进一步改进发酵工艺,而且特定地,改进发酵微生物的性能,如,速率增加和乙醇得率。“发酵刺激剂”指用于发酵微生物(特别是酵母)生长的刺激剂。优选的用于生长的发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸(盐)、烟酸、内消旋肌醇(meso-inositol)、硫胺素、卩比唆醇(pyridoxine)、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D^PE。参见,例如,Alfdnore等,ImprovingethanolproductionandviabilityofSaccharomycescerevisiaebyavitaminfeedingstrategyduringfed—batchprocess,Springer-Verlag(2002),其通过提述并入本文。矿物质的实例包括能够提供营养物的矿物质和矿物质盐,所述营养物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。发酵产物发酵产物可以是源自发酵的任何物质。发酵产物可以是,不限于,醇(例如,阿拉伯醇、丁醇、乙醇、甘油、甲醇、1,3_丙二醇、山梨醇和木糖醇);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸);酮(例如,丙酮);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);和气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)和一氧化碳(CO))。发酵产物还可以是作为高价值产品的蛋白质。在一个优选的方面,发酵产物是醇。可理解的是,术语“醇”包括包含一个或多个羟基基团的物质。在更优选的方面,所述醇是阿拉伯醇。在另一个更优选的方面,所述醇是丁醇。在另一个更优选的方面,所述醇是乙醇。在另一个更优选的方面,所述醇是甘油。在另一个更优选的方面,所述醇是甲醇。在另一个更优选的方面,所述醇是1,3-丙二醇。在另一个更优选的方面,所述醇是山梨醇。在另一个更优选的方面,所述醇是木糖醇。参见,例如,Gong,C.S.,Cao,N.J.,DujJ.,和Tsao,G.T.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.编,Springer-VerlagBerlinHeidelberg,Germany,65:207_241;Silveira,M.M.,和Jonas,R.,2002,Thebiotechnologicalproductionofsorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.,和Singh,D.,1995,Processesforfermentativeproductionofxylitol-asugarsubstitute,ProcessBiochemistry30(2):117-124;Ezeji,T.C.,Qureshi,N.和Blaschek,H.P.,2003,Productionofacetone,butanolandethanolbyClostridiumbeijerinckiiBAlOlandinsiturecoverybygasstripping,WorldJournalofMicrobiologyandBiotechnology19(6):595-603。在另一个优选的方面,所述发酵产物是有机酸。在另一个更优选的方面,所述有机酸是乙酸。在另一个更优选的方面,所述有机酸是醋酮酸。在另一个更优选的方面,所述有机酸是己二酸。在另一个更优选的方面,所述有机酸是抗坏血酸。在另一个更优选的方面,所述有机酸是朽1檬酸。在另一个更优选的方面,所述有机酸是2,5-二酮-D-葡糖酸。在另一个更优选的方面,所述有机酸是甲酸。在另一个更优选的方面,所述有机酸是反丁烯二酸。在另一个更优选的方面,所述有机酸是葡糖二酸。在另一个更优选的方面,所述有机酸是葡糖酸。在另一个更优选的方面,所述有机酸是葡糖醛酸。在另一个更优选的方面,所述有机酸是戊二酸。在另一个优选的方面,所述有机酸是3-羟基丙酸。在另一个更优选的方面,所述有机酸是衣康酸。在另一个更优选的方面,所述有机酸是乳酸。在另一个更优选的方面,所述有机酸是苹果酸。在另一个更优选的方面,所述有机酸是丙二酸。在另一个更优选的方面,所述有机酸是草酸。在另一个更优选的方面,所述有机酸是丙酸。在另一个更优选的方面,所述有机酸是琥珀酸。在另一个更优选的方面,所述有机酸是木糖酸。参见,例如,Chen,R.,和Lee,Y.Y.,1997,Membrane-mediatedextractivefermentationforlacticacidproductionfromcellulosicbiomass,Appl.Biochem.Biotechnol.63-65:435—448。在另一个优选的方面,所述发酵产物是酮。可理解的是术语“酮”涵盖含有一个或多个酮基的物质。在另一个更优选的方面,所述酮是丙酮。参见,例如,Qureshi和Blaschek,2003,见上文。在另一个优选的方面,所述发酵产物是氨基酸。在另一个更优选的方面,所述有机酸是天冬氨酸。在另一个更优选的方面,所述氨基酸是谷氨酸。在另一个更优选的方面,所述氨基酸是甘氨酸。在另一个更优选的方面,所述氨基酸是赖氨酸。在另一个更优选的方面,所述氨基酸是丝氨酸。在另一个更优选的方面,所述氨基酸是苏氨酸。参见,例如,Richard,A.,和Margaritis,A.,2004,Empiricalmodelingofbatchfermentationkineticsforpoly(glutamicacid)productionandothermicrobialbiopolymers,BiotechnologyandBioengineering87(4):501-515。在另一个优选的方面,所述发酵产物是气体。在另一个更优选的方面,所述气体是甲烷。在另一个更优选的方面,所述气体是H2。在另一个更优选的方面,所述气体是C02。在另一个更优选的方面,所述气体是CO。参见,例如,Kataoka,N.,A.Miya,和K.Kiriyama,1997,Studiesonhydrogenproductionbycontinuousculturesystemofhydrogen-producinganaerobicbacteria,WaterScienceandTechnology36(6-7):41-47;和GunaseelanV.N.于BiomassandBioenergy,Vol.13(1~2),pp.83-114,1997,Anaerobicdigestionofbiomassformethaneproduction:Areview。通|。可以使用本领域已知的任何方法,任选地从发酵培养基回收发酵产物,所述方法包括,但不限于,层析、电泳方法、差示溶解度、蒸馏或提取。例如,通过常规蒸馏方法从发酵的纤维素材料分离并纯化醇。可以获得纯度高达约96vol%的乙醇,其能用作,例如,燃料乙醇、饮用乙醇,即,中性饮料酒,或工业乙醇。洗涤剂组合物本发明具有纤维素分解增强活性的多肽可添加至洗涤剂组合物而成为洗涤剂组合物的组分。本发明的洗涤剂组合物可配制为例如手洗或机洗的洗衣洗涤剂组合物,其包含适于预处理玷污的织物的洗衣添加剂组合物和漂洗添加的织物柔软剂(softener)组合物,或可配制为用于一般家用硬表面清洁操作的洗涤剂组合物,或可配制为用于手动或机械洗碗操作。因此,本发明还涉及用于清洗或洗涤硬表面或衣物的方法,包括将所述硬表面或衣物与本发明的洗涤剂组合物相接触。在一个具体方面,本发明提供了包含本发明多肽的洗涤剂添加剂。所述洗涤剂添加剂以及所述洗涤剂组合物还可包含一种或多种选自下组的酶淀粉酶、阿拉伯糖酶、纤维素酶、角质酶、半乳聚糖酶、半纤维素酶、漆酶、脂质酶、甘露聚糖酶、氧化酶、果胶酶、蛋白酶、和木聚糖酶。一般而言所选酶的性质应与所选洗涤剂相容(即最适pH,与其他酶或非酶成分的相容性等),且所述酶应以有效量存在。纤维素酶合适的纤维素酶包括那些细菌或真菌起源的。包括化学修饰的或蛋白质工程改造的突变体。合适的纤维素酶包括来自芽孢杆菌属、假单胞菌属、腐质霉属、镰孢属、梭孢壳属、枝顶孢霉属的纤维素酶,例如US4,435,307,US5,648,263,US5,691,178,US5,776,757号和WO89/09259中公开的,由特异腐质酶、嗜热毁丝霉和尖镰孢产生的真菌纤维素酶。特别合适的纤维素酶是具有色彩维护(colourcare)益处的碱性或中性纤维素酶。此类纤维素酶的例子有EP0495257、EP0531372、WO96/11262、WO96/29397、WO98/08940中记载的纤维素酶。其它例子有纤维素酶变体,如WO94/07998、EP0531315、US5,457,046、US5,686,593、US5,763,254、WO95/24471、WO98/12307和PCT/DK98/00299中记载的那些。商业性使用的纤维素酶包括CELLUZYME和CAREZYME(NovozymesA/S)、CLAZINASE和PURADAXHA(GenencorInternationalInc.)和KAC-500(B)(KaoCorporation)。蛋总塵:合适的蛋白酶包括动物、植物或微生物来源的那些。优选微生物来源。包括化学修饰或蛋白质工程改造的突变体。蛋白酶可以是丝氨酸蛋白酶或金属蛋白酶,优选碱性微生物蛋白酶或胰蛋白酶样蛋白酶。碱性蛋白酶的实例是枯草杆菌蛋白酶,特别是源自芽孢杆菌属的那些,例如,枯草杆菌蛋白酶Novo,枯草杆菌蛋白酶Carlsberg,枯草杆菌蛋白酶309,枯草杆菌蛋白酶147和枯草杆菌蛋白酶168(在WO89/06279中描述)。胰蛋白酶样蛋白酶的实例是胰蛋白酶(例如猪或牛来源的)和WO89/06270和WO94/25583中所述的镰孢属蛋白酶。有用的蛋白酶的实例是WO92/19729,WO98/20115,WO98/20116和WO98/34946中所述的变体,特别是在下述一个或多个位置有取代的变体27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235和274。优选的商业上可获得的蛋白酶包括ALCALASE、SAVINASE、PRIMASE、DURALASE、ESPERASE和KANNASE(NovozymesA/S)、MAXATASE、MAXACAL、MAXAPEM、PROPERASE,PURAFECT,PURAFECT0XP、FN2和FN3(GenencorInternationalInc.)。脂肪酶合适的脂肪酶包括那些细菌或真菌起源的。包括化学修饰的或蛋白质工程改造的突变体。有用的脂肪酶的例子包括来自腐质霉属(同物异名嗜热霉属(Thermomyces))的脂肪酶,例如记载于EP258068和EP305216的来自疏棉状腐质霉(H.lanuginosa)(细毛嗜热霉(T.Ianuginosus))或来自记载于WO96/13580的特异腐质霉的脂肪酶,假单胞菌属脂肪酶,例如来自产碱假单胞菌(P.alcaligenes)和类产碱假单胞菌(P.pseudoalcaligenes)(EP218272)、洋葱假单胞菌(EP331376)、施氏假单胞菌(P.stutzeri)(GB1,372,024)、荧光假单胞菌(P.fIuorescens)、假单胞菌属菌种菌株SD705(W095/06720和W096/27002)、威斯康星假单胞菌(P.wisconsinensis)(W096/12012)的脂肪酶,或芽孢杆菌属的脂肪酶,例如来自枯草芽孢杆菌(Dartois等,(1993),BiochemicaetBiophysicaacta1131,253-260),嗜热脂肪芽抱杆菌(JP64/744992)或短小芽孢杆菌(W091/16422)的脂肪酶。其它实例为脂肪酶变体,如WO92/05249、WO94/01541、EP407225、EP260105、WO95/35381、WO96/00292、WO95/30744、WO94/25578、WO95/14783、WO95/22615、WO97/04079和WO97/07202中记载的那些。优选的商业上可获得的脂肪酶包括LIP0LASE和LIP0LASEULTRA(NovozymesA/S)。淀粉酶:合适的淀粉酶(a和/或P)包括那些细菌或真菌起源的。包括化学修饰的或蛋白质工程改造的突变体。淀粉酶包括例如得自芽孢杆菌属例如在GBI,296,839中更详细所述的地衣芽孢杆菌特定菌株的a-淀粉酶。有用的淀粉酶的实例为WO94/02597,WO94/18314,WO96/23873和WO97/43424中所述的变体,尤其是在一个或多个以下位置具有取代的变体15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444。商业上可获得的淀粉酶有DURAMYL、TERMAMYL、FUNGAMYL和BAN(NovozymesA/S)、RAPIDASE和PURASTAR(来自GenencorInternationalInc.)。过氧化物酶/氧化酶:合适的过氧化物酶/氧化酶包括那些植物、细菌或真菌起源的。包括化学修饰的或蛋白质工程改造的突变体。有用的过氧化物酶的例子包括来自鬼伞属(Coprinus)的过氧化物酶,例如来自灰盖鬼伞(C.cinereus)的过氧化物酶及其变体,如WO93/24618、WO95/10602、和W098/15257中记载的那些。商业上可获得的过氧化物酶包括GUARDZYME(NovozymesA/S)。可以通过添加分开的、含有一种或多种酶的添加剂或通过添加组合的、包含所有这些酶的添加剂将洗涤剂酶包含于洗涤剂组合物中。本发明的洗涤剂添加剂,即单独的添加剂或组合的添加剂,可配制为例如颗粒、液体、浆料等。优选的洗涤剂添加剂配制物是颗粒,特别是无粉尘的颗粒、液体特别是稳定化的液体,或浆料。无粉尘的颗粒可以例如如US4,106,991和4,661,452中公开的产生,并且可以任选地通过本
技术领域
已知的方法进行包覆。蜡质包覆材料的实例是具有1000至20000的平均摩尔重量的聚(环氧乙烷)产品(聚乙二醇,PEG);具有16至50个环氧乙烷单元的乙氧基化壬基酚;乙氧基化脂肪醇,其中所述醇含有12至20个碳原子且其中存在15至80个环氧乙烷单元;脂肪醇;脂肪酸;和脂肪酸的甘油一酯、甘油二酯和甘油三酯。适于通过流化床技术施用的成膜包覆材料的实例在GB1483591中给出。例如,可以通过根据已确立的方法添加多元醇如丙二醇、糖或糖醇、乳酸或硼酸来使液体酶制备物稳定。受保护的酶可根据EP238,216中公开的方法来制备。本发明的洗涤剂组合物可以是任何方便的形式,例如,条、片剂、粉末、颗粒(granule)、糊剂(paste)或液体。液体洗涤剂可以是水性的,通常含有多至70%水和0_30%有机溶剂,或是非水性的。洗涤剂组合物包含一种或多种表面活性剂,所述表面活性剂可以是非离子的(包括半-极性的)和/或阴离子的和/或阳离子的和/或两性离子的。表面活性剂通常以按重量计0.1%至60%的水平存在。当包含于其中时,洗涤剂通常会含有约1%至约40%的阴离子表面活性剂,例如直链烧基苯磺酸酯(linearalkylbenzenesulfonate)>a-链烯烃磺酸酯、烧基硫酸酯(脂肪醇硫酸酯)、醇乙氧基硫酸酯(alcoholethoxysulfate)、仲烧基磺酸酯(secondaryalkanesulfonate)、a-磺基脂肪酸甲酯、烧基-或烯基琥拍酸或阜类(soap)。当包含于其中时,洗涤剂将通常含有约0.2%至约40%的非离子表面活性剂,例如醇乙氧基化物、壬基酹乙氧基化物、烧基聚苷(alkylpolyglycoside)、烧基二甲胺氧化物(alkyldimethylamineoxide)、乙氧基化脂肪酸单乙醇酸胺(ethoxylatedfattyacidmonoethanolamide)、脂肪酸单乙醇酰胺、多羟基烷基脂肪酸酰胺,或葡糖胺的N-酰基N-烷基衍生物(“葡糖酰胺(glucamides)”)。洗涤剂可以含有0-65%的洗涤剂增效剂(builder)或络合剂例如沸石、二磷酸盐/酯、三磷酸盐/酯、膦酸盐/酯(phosphonate)、碳酸盐/酯、柠檬酸盐/酯、氮川三乙酸(nitrilotriaceticacid)、乙二胺四乙酸、二亚乙基三胺五乙酸、烧基-或烯基琥拍酸、可溶性硅酸盐或层状硅酸盐(例如来自Hoechst的SKS-6)。洗涤剂可包含一种或多种聚合物。实例是羧甲基纤维素、聚(乙烯基吡咯烷酮)、聚(乙二醇)、聚(乙烯基醇)、聚(乙烯基吡啶-N-氧化物)、聚(乙烯基咪唑)、聚羧酸盐/酯(polycarboxylate)例如聚丙烯酸盐/酯、马来酸/丙烯酸共聚物和甲基丙烯酸月桂酯/丙烯酸共聚物。洗涤剂可含有漂白体系,所述体系可包含H2O2源例如过硼酸盐或过碳酸盐,可将其与形成过酸的漂白活化剂例如四乙酰乙二胺或壬酰氧苯磺酸酯(nonanoyIoxybenzenesulfonate)组合。或者,漂白体系可包含过氧酸,例如酰胺、二酰亚胺或砜型的过氧酸。可以使用常规稳定剂使本发明的洗涤剂组合物中的酶稳定化,所述稳定剂例如,多元醇如丙二醇或甘油,糖或糖醇,乳酸,硼酸或硼酸衍生物,例如,芳族硼酸酯,或苯基硼酸(phenylboronicacid)衍生物例如4_甲酰苯基硼酸,并且所述组合物可按例如WO92/19709和WO92/19708中所述配制。洗涤剂也可含有其它常规洗涤剂成分例如织物调节剂,包括粘土、泡沫促进剂(foambooster)、抑泡剂(sudssuppressor)、抗腐蚀剂、悬污剂(soil-suspendingagent)、防污物再沉积剂(anti-soilredepositionagent)、染料、杀菌剂、光学增亮剂、助水溶物(hydrotrope)、晦暗抑制剂(tanishinhibitors)或香料。在洗涤剂组合物中,可以以相当于0.Ol-IOOmg酶蛋白每升洗涤液,优选0.05_5mg酶蛋白每升洗涤液,特别是0.I-Img酶蛋白每升洗涤液的量添加任何酶。在洗涤剂组合物中,可以以相当于每升洗涤液0.OOl-IOOmg蛋白、优选0.005_50mg蛋白,更优选0.01_25mg蛋白,甚至更优选0.05_10mg蛋白,最优选0.05_5mg蛋白,且甚至最优选0.Ol-Img蛋白的量添加本发明具有纤维素分解增强活性的多肽。还可将本发明具有纤维素分解增强活性的多肽并入WO97/07202中公开的洗涤剂配制物,将WO97/07202通过提述并入本文。信号肽本发明还涉及编码信号肽的多核苷酸,所述信号肽包含或组成为SEQIDN0:2的氨基酸I至17,SEQIDNO:4的氨基酸I至19,SEQIDNO:6的氨基酸I至17,SEQIDNO:8的氨基酸I至19,SEQIDNO:10的氨基酸I至21,SEQIDNO:12的氨基酸I至24,SEQIDNO:14的氨基酸I至16,SEQIDNO:16的氨基酸I至18,SEQIDNO:18的氨基酸I至22,SEQIDNO:20的氨基酸I至16,或SEQIDNO:22的氨基酸I至19。所述多核苷酸还可包含编码蛋白质的基因,其可操作地连接于所述信号肽。所述蛋白质优选对于所述信号肽是外源的。本发明还涉及包含此种多核苷酸的核酸构建体、表达载体和重组宿主细胞。本发明还涉及产生蛋白质的方法,包括(a)培养包含此种多核苷酸的重组宿主细胞;和(b)回收所述蛋白质。所述蛋白质对于宿主细胞可以是天然的或异源的。术语“蛋白质”在本文的意思不是指特定长度的编码产物,并且因此包含肽、寡肽和多肽。术语“蛋白质”还包含组合以形成编码产物的两种或更多种多肽。所述蛋白质还包括杂合多肽和融合多肽。优选地,所述蛋白质是激素或其变体、酶、受体或其部分、抗体或其部分,或报道蛋白(reporter)。例如,所述蛋白质可为氧化还原酶、转移酶、水解酶、裂合酶(lyase)、异构酶或连接酶,如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、a-半乳糖苷酶、¢-半乳糖苷酶、葡糖淀粉酶、a-葡糖苷酶、¢-葡糖苷酶、转化酶、漆酶、另外的脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。基因可以从任何原核、真核或其它来源获得。通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。实施例材料用作缓冲液和底物的化学品为至少试剂级的商品。菌株将土生梭孢壳NRRL8126用作具有纤维素分解增强活性的家族61多肽的来源。将米曲霉JaL355菌株(W02002/40694)用于表达编码具有纤维素分解增强活性的多肽的土生梭孢壳家族61基因。培养基和溶液PDA平板包含39g的马铃薯右旋糖琼脂,和蒸馏水加至I升。NNCYP培养基包含5.Og的NaNO3,3.Og的NH4Cl,2.Og的MES,2.5g的柠檬酸,0.2g的CaCl22H20,I.Og的BactoP印tone,5.Og的酵母提取物,0.2g的MgSO47H20,4.0g的K2HPO4,1.Oml的COVE微量元素溶液,2.5g的葡萄糖,和蒸馏水加至I升。基本培养基(MM)平板包含6g的NaNO3,0.52g的KCl,I.52g的KH2PO4,Iml的COVE微量元素溶液,20g的Noble琼脂,20ml的50%葡萄糖,2.5ml的MgSO4*7H20,20ml的0.02%生物素溶液,和蒸馏水加至I升。COVE微量元素溶液包含0.04g的Na2B4O7IOH20,0.4g的CuSO45H20,I.2g的FeSO47H20,0.7g的MnSO4H20,0.8g的Na2MoO22H20,IOg的ZnSO47H20,和蒸馏水加至I升°M410培养基包含50g的麦芽糖,50g的葡萄糖,2g的MgSO4.IW2Q,4g的无水柠檬酸粉末,2g的KH2PO4,8g的酵母提取物,2g的尿素,0.5g的CaCl2,0.5ml的AMG微量金属溶液,和蒸馏水加至I升。AMG微量金属溶液包含14.3g的ZnSO47H20,2.5g的CuSO45H20,0.5g的NiCl26H20,13.8g的FeSO47H20,8.5g的MnSO47H20,3g的柠檬酸,和蒸馏水加至I升。实施例I:关于土生梭孢壳NRRL8126的DNA序列信息的来源基因组序列信息由U.S.DepartmentofEnergyJointGenomeInstitute(JGI)生成。从JGI下载基因组的初级汇编(assembly),并使用Pedant-ProSequenceAnalysisSuite(BiomaxInformaticsAG,Martinsried,Germany)分析。使用通过软件构建的基因模型作为起始点以供检测基因组中的GH61同源物。使用多种已知的GH61蛋白序列作为指引构建更精确的基因模型。实施例2:土生梭孢壳NRRL8126基因组DNA提取为了生成供PCR扩增的基因组DNA,将土生梭孢壳NRRL8126在42°C和200rpm在带挡板的摇瓶中的补充1%葡萄糖的50ml的NNCYP培养基中生长24小时。菌丝体通过过滤收获,在TE(IOmMTris-ImMEDTA)中洗涤两次,并在液氮下冻结。将豌豆大小的冻结的菌丝体块悬于0.7ml的TE中的1%十二烧基硫酸锂,并通过在FastPrepFP120(ThermoSavant,Holbrook,NY,USA)中用等体积的0.Imm二氧化错/二氧化娃珠(BiospecProducts,Inc.,Bartlesville,OK,USA)揽拌45秒来破坏。通过以13,OOOxg离心10分钟来去除碎块,并将经清除的上清配至2.5M乙酸铵,并在冰上温育20分钟。在温育期之后,通过添加2体积的乙醇来沉淀核酸。在4°C在微型离心机中离心15分钟之后,将沉淀在70%乙醇中洗涤,并风干。将DNA重悬于120ill的0.IXTE,并在37°C用I的不含DNase的RNaseA温育20分钟。添加乙酸铵至2.5M,并用2体积的乙醇沉淀DNA。将沉淀在70%乙醇中洗涤,风干,并重悬于TE缓冲液。实施例3:含有编码具有纤维素分解增强活性的家族GH61J多肽的土生梭孢壳NRRL8126基因组序列的米曲霉表达载体的构建设计了如下所示的两种合成的寡核苷酸引物以从实施例2中制备的基因组DNA来PCR扩增土生梭孢壳NRRL8126gh6j基因。使用IN-FUSIONCloningKit(BDBiosciences,PaloAlto,CA,USA)以将片段直接克隆入表达载体pAlLo2(TO2004/099228),而无需进行限制性消化和连接。Ttghlj-F(065367):5,-actggatttaccATGAAGTTCTCACTGGTGTC3J(SEQIDNO:23)Ttgh6Ij-R(065368)5,-TCACCTCTAGTTAATTAATCAGCAGGAGATCGGGGCGG-3,(SEQIDNO:24)粗体字母代表编码序列。剩余序列同源于PAlLo2的插入位点。将五十皮摩尔的上述每种引物用于PCR反应,所述反应包含IOOng的土生梭抱壳NRRL8126基因组DNA,PfxAmplificationBuffer(Invitrogen,Carlsbad,CA,USA),各0.4mM的dATP,dTTP,dGTP,和dCTP,ImMMgCl2,和2.5单位的PfxDNA聚合酶(Invitrogen,Carlsbad,CA,USA),最终体积为50yI。使用EPPENDORFMASTERCYCLER5333(EppendorfScientific,Inc.,Westbury,NY,USA)进行扩增,其程序为1个循环,在98°C进行3分钟;和30个循环,每循环在98°C进行30秒,60°C进行30秒,和72°C进行I.5分钟。然后加热块进入4°C浸没循环。将反应产物在I.0%琼脂糖凝胶上使用40mMTris碱-20mM乙酸钠-ImMEDTA二钠盐(TAE)缓冲液分离,其中将908bp的产物条带从凝胶切出,并使用MINELUTEGelExtractionKit(QIAGENInc.,Valencia,CA,USA)根据生产商的指示纯化。然后将片段使用IN-FUSIONCloningKit克隆入NcoI和PacI消化的pAlLo2,得到pSMai207,其中土生梭孢壳gh61j基因的转录处于NA2_tpi启动子(一种来自编码黑曲霉中中性a-淀粉酶的基因的启动子,其中未翻译的先导序列由来自编码构巢曲霉中的丙糖磷酸异构酶的未翻译的先导序列所取代)的调控之下。连接反应(50iU)包含IXIN-FUSIONBuffer(BDBiosciences,PaloAlto,CA,USA),IXBSA(BDBiosciences,PaloAlto,CA,USA),IUIofIN-FUSION酶(I:10稀释)(BDBiosciences,PaloAlto,CA,USA),IOOng用NcoIandPacI消化的PAlLo2,和50ng的土生梭孢壳gh61j纯化的PCR产物。将反应在室温温育30分钟。使用一UI的反应物转化大肠杆菌XLlOSOLOPACKGoldSupercompetent细胞(Stratagene,LaJolla,CA,USA)。含有pSMai207的大肠杆菌转化体通过限制性消化检测,而质粒DNA使用BIOROBOT9600(QIAGENInc.,Valencia,CA,USA)制备。pSMai207中的土生梭孢壳gh61j插入通过DNA测序来确认。亦将相同的908bp土生梭孢壳gh61jPCR片段使用TOPOTACLONINGKit(Invitrogen,Carlsbad,CA,USA)克隆入pCR2.1-T0P0载体(Invitrogen,Carlsbad,CA,USA),以生成pSMai216。土生梭孢壳gh61j插入通过DNA测序确认。大肠杆菌pSMai216于2009年8月3日保藏于农业研究机构专利培养物保藏中心北区石开究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter,Peoria,IL,USA),并分配登录号NRRLB-50301。实施例4:编码具有纤维素分解增强活性的GH61J多肽的土生梭孢壳NRRL8126基因组序列的表征土生梭抱壳NRRL8126gh61j基因组克隆的DNA测序用AppliedBiosystemsModel3700AutomatedDNASequencer使用版本3.IBIG-DYE终止子化学(AppliedBiosystems,Inc.,FosterCity,CA,USA)和dGTP化学(AppliedBiosystems,Inc.,FosterCity,CA,USA)和引物步移策略进行。就品质审视核苷酸序列数据,并以PHRED/PHRAP软件(UniversityofWashington,Seattle,WA,USA)的协助将所有序列互相比较。获得的序列与来自JGI的序列相同。土生梭孢壳gh61j基因的核苷酸序列(SEQIDNO:I)和推导的氨基酸序列(SEQIDNO:2)示于图I。编码序列为878bp,包含终止密码子,并由66和71bp的内含子间隔。编码的预测的蛋白为246个氨基酸。基因编码序列(包含内含子)的%G+C为63%G+C,而成熟多肽编码序列为63%。使用SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),预测了17个残基的信号肽。预测的成熟蛋白含有229个氨基酸,具有24.5kDa的预测的分子量和7.85的等电点pH。如EMBOSS的Needle程序中,以缺口开放罚分为10,缺口延伸罚分为0.5,和EBL0SUM62矩阵执行的,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)确定了氨基酸序列的比较性逐对全局比对。比对显示编码具有纤维素分解增强活性的GH61J多肽的土生梭孢壳基因的推导的氨基酸序列与来自特异腐质霉的预测的GH61家族蛋白的推导的氨基酸序列(登录号geneSeqp:ADM97935)分享57.7%的同一性(排除间隔)。实施例5:在米曲霉JaL355中表达土生梭孢壳NRRL8126家族61糖基水解酶61j基因米曲霉JaL355(TO2002/40694)原生质体根据Christensen等,1988,Bio/Technology6:1419-1422的方法制备。将大约2yg的pSMai207转化入米曲霉JaL355。用pSMai207转化米曲霉JaL355产生约30个转化体。将十个转化体分离至单个基本培养基平板。用5ml的0.01%TWEEN20洗涤每个转化体的汇合的基本培养基平板,并分别接种入125ml玻璃摇瓶中的25ml的M410培养基,并在34°C,250rpm温育。在5日温育之后,用CRITERIONCell(Bio-RadLaboratories,Hercules,CA,USA)在CRITERIONTris-HCl凝胶(Bio-RadLaboratories,Hercules,CA,USA)上根据生产商的指不分析5iil的来自每个培养的上清。将所得的凝胶用BIO-SAFECoomassieStain(Bio-RadLaboratories,Hercules,CA,USA)染色。培养物的SDS-PAGE概貌显示多数转化体具有预期的24KDA条带大小。用IOml的0.01%TWEEN80洗涤转化体3的汇合的平板,并接种入含有500ml的M410培养基的2升Fernbach以生成用于表征酶的培养液。在第5日收获培养物,并使用0.22umEXPRESSPLUSMembrane(Mi11ipore,Billerica,MA,USA)过滤。实施例6:含有编码具有纤维素分解增强活性的家族GH61K多肽的土生梭孢壳NRRL8126基因组序列的米曲霉表达载体的构建设计了如下所示的两种合成的寡核苷酸引物以从实施例2中制备的基因组DNA来PCR扩增土生梭孢壳NRRL8126gh61k基因。使用IN-FUSI0NCloningKit以将片段直接克隆入表达载体PAlLo2,而无需进行限制性消化和连接。Ttghlk-F(065465)5,-actggatttaccATGAGGACGACATTCGCCGCCGCGT3J(SEQIDNO:25)Ttgh6Ik-R(065466)5,-TCACCTCTAGTTAATTAACTAAGAAGAAGGGGCGCACT_3,(SEQIDNO:26)粗体字母代表编码序列。剩余序列同源于PAlLo2的插入位点。将五十皮摩尔的上述每种引物用于PCR反应,所述反应包含IOOng的土生梭孢壳NRRL8126基因组DNA,PfxAmplificationBuffer,各0.4mM的dATP,dTTP,dGTP,和dCTP,ImMMgCl2,和2.5单位的PfxDNA聚合酶,最终体积为50yl。使用EPPENDORFMASTERCYCLER5333进行扩增,其程序为I个循环,在98°C进行3分钟;和30个循环,每循环在98°C进行30秒,60°C进行30秒,和72°C进行I.5分钟。然后加热块进入4°C浸没循环。将反应产物在I.0%琼脂糖凝胶上使用TAE缓冲液分离,其中将1283bp的产物条带从凝胶切出,并使用MINELliTE⑧GelExtractionKit根据生产商的指示纯化。然后将片段使用IN-FUSIONCloningKit克隆入NcoI和PacI消化的pAlLo2,得到pSMai208,其中土生梭孢壳gh61k基因的转录处于NA2-tpi启动子的调控之下。连接反应(50ill)包含IXIN-FUSIONBuffer,IXBSA,IuIofIN-FUSI0N酶(I10稀释),IOOng用NcoIandPacI消化的pAlLo2,和50ng的土生梭孢壳gh61k纯化的PCR产物。将反应在室温温育30分钟。使用一的反应物转化大肠杆菌XLlOSOLOPACKGoldSupercompetent细胞。含有pSMai208的大肠杆菌转化体通过限制性消化检测,而质粒DNA使用BIOROBOT9600制备。pSMai208中的土生梭孢壳gh61k插入通过DNA测序来确认。亦将相同的1283bp土生梭孢壳gh61kPCR片段使用T0P0TACLOMNGKit克隆入pCR2.1-T0P0载体,以生成pSMai217。土生梭孢壳gh61k插入通过DNA测序确认。大肠杆菌pSMai217于2009年8月3日保藏于农业研究机构专利培养物保藏中心北区石开究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter,Peoria,IL,USA),并分配登录号NRRLB-50302。实施例7:编码具有纤维素分解增强活性的GH61K多肽的土生梭孢壳NRRL8126基因组序列的表征土生梭抱壳NRRL8126gh61k基因组克隆的DNA测序用AppliedBiosystemsModel3700AutomatedDNASequencer使用版本3.1BIG-DYE终止子化学和dGTP化学和引物步移策略进行。就品质审视核苷酸序列数据,并以PHRED/PHRAP软件的协助将所有序列互相比较。获得的序列与来自JGI的序列相同。土生梭孢壳gh61k基因的核苷酸序列(SEQIDNO:3)和推导的氨基酸序列(SEQIDNO:4)示于图2。编码序列为1253bp,包含终止密码子,并由96,84,和68bp的内含子间隔。编码的预测的蛋白为334个氨基酸。基因编码序列(包含内含子)的%G+C为66.6W+C,而成熟多肽编码序列为69.3%。使用SignalP程序(Nielsen等,1997,见上),预测了19个残基的信号肽。预测的成熟蛋白含有315个氨基酸,具有31.7kDa的预测的分子量和6.68的等电点pH。如EMBOSS的Needle程序中,以缺口开放罚分为10,缺口延伸罚分为0.5,和EBL0SUM62矩阵执行的,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上)确定了氨基酸序列的比较性逐对全局比对。比对显示编码具有纤维素分解增强活性的GH61K多肽的土生梭孢壳基因的推导的氨基酸序列与来自巴西青霉的预测的¢-葡糖苷酶蛋白的推导的氨基酸序列(登录号geneseqpAWW27060)分享64.8%的同一丨丨生(排除间隔)。实施例8:在米曲霉JaL355中表达土生梭孢壳NRRL8126家族61糖基水解酶61k基因米曲霉JaL355(TO2002/40694)原生质体根据Christensen等.,1988,见上的方法制备。将其用大约2iig的pSMai208转化。转化产生约25个转化体。将十个转化体分离至单个基本培养基平板。用5ml的0.01%TWEEN20洗涤每个转化体的汇合的基本培养基平板,并分别接种入125ml玻璃摇瓶中的25ml的M410培养基,并在34°C,250rpm温育。在5日温育之后,用CRITERIONCell在CRITERIONTris-HCl凝胶上根据生产商的指示分析5ill的来自每个培养的上清。将所得的凝胶用BIO-SAFECoomassieStain染色。培养物的SDS-PAGE概貌显示多数转化体具有预期的32KDA条带大小。用IOml的0.01%TWEEN80洗涤转化体5的汇合的平板,并接种入含有500ml的M410培养基的2升Fernbach以生成用于表征酶的培养液。在第5日收获培养物,并使用.22umEXPRESSPLUSMembrane过滤。实施例9:含有编码具有纤维素分解增强活性的家族GH61L多肽的土生梭孢壳NRRL8126基因组序列的米曲霉表达载体的构建设计了如下所示的两种合成的寡核苷酸引物以从实施例2中制备的基因组DNA来PCR扩增土生梭孢壳NRRL8126gh611基因。使用IN-FUSI0NCloningKit以将片段直接克隆入表达载体PAlLo2,而无需进行限制性消化和连接。Ttghll-Fl(066276)5,-actggatttaccATGAAGCTGAGCGTTGCCATCGCC-3,(SEQIDNO:27)Ttgh611-R(065736)5,-TCACCTCTAGTTAATTAATTAGCACGTCTCAGCCGGCG-3,(SEQIDNO:28)粗体字母代表编码序列。剩余序列同源于PAlLo2的插入位点。将五十皮摩尔的上述每种引物用于PCR反应,所述反应包含IOOng的土生梭孢壳NRRL8126基因组DNA,PfxAmplificationBuffer,各0.4mM的dATP,dTTP,dGTP,和dCTP,ImMMgCl2,和2.5单位的PfxDNA聚合酶,最终体积为50yl。使用EPPENDORFMASTERCYCLER5333进行扩增,其程序为I个循环,在98°C进行3分钟;和30个循环,每循环在98°C进行30秒,60°C进行30秒,和72°C进行I.5分钟。然后加热块进入4°C浸没循环。将反应产物在I.0%琼脂糖凝胶上使用TAE缓冲液分离,其中将828bp的产物条带从凝胶切出,并使用VnNE.LUTEGelExtractionKit根据生产商的指示纯化。然后将片段使用IN-FUSIONCloningKit克隆入NcoI和PacI消化的pAlLo2,得到pSMai209,其中土生梭孢壳gh611基因的转录处于NA2-tpi启动子的调控之下。连接反应(50iil)包含IXIN-FUSIONBuffer,IXBSA,IuIofIN-FUSI0N酶(I10稀释),IOOng用NcoIandPacI消化的PAlLo2,和50ng的土生梭孢壳gh611纯化的PCR产物。将反应在室温温育30分钟。使用一UI的反应物转化大肠杆菌XLlOSOLOPACICGoldSupercompetent细胞。含有pSMai212的大肠杆菌转化体通过限制性消化检测,而质粒DNA使用BIOROBOT9600制备。pSMai212中的土生梭孢壳gh611插入通过DNA测序来确认。亦将相同的828bp土生梭孢壳gh61IPCR片段使用T0P0TACLONINGKit克隆入pCR:2.1-T0P0载体,以生成pSMai218。土生梭孢壳gh611插入通过DNA测序确认。大肠杆菌pSMai218于2009年8月3日保藏于农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter,Peoria,IL,USA),并分配登录号NRRLB-50303。实施例10:编码具有纤维素分解增强活性的GH61L多肽的土生梭孢壳NRRL8126基因组序列的表征土生梭抱壳NRRL8126gh611基因组克隆的DNA测序用AppliedBiosystemsModel3700AutomatedDNASequencer使用版本3.1BIG-DYE终止子化学和dGTP化学和引物步移策略进行。就品质审视核苷酸序列数据,并以PHRED/PHRAP软件的协助将所有序列互相比较。获得的序列与来自JGI的序列相同。土生梭孢壳gh611基因的核苷酸序列(SEQIDNO:5)和推导的氨基酸序列(SEQIDNO:6)示于图3。编码序列为798bp,包含终止密码子,并由55和59bp的内含子间隔。编码的预测的蛋白为227个氨基酸。基因编码序列(包含内含子)的%G+C为60.8%G+C,而成熟多肽编码序列为62.6%。使用SignalP程序(Nielsen等,1997,见上),预测了17个残基的信号肽。预测的成熟蛋白含有210个氨基酸,具有22.6kDa的预测的分子量和8.84的等电点pH。如EMBOSS的Needle程序中,以缺口开放罚分为10,缺口延伸罚分为0.5,和EBL0SUM62矩阵执行的,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上)确定了氨基酸序列的比较性逐对全局比对。比对显示编码具有纤维素分解增强活性的GH61L多肽的土生梭孢壳基因的推导的氨基酸序列与来自土生梭孢霉的预测的¢-葡糖苷酶蛋白的推导的氨基酸序列(登录号geneseqpADM97933)分享59.2%的同一丨丨生(排除间隔)。实施例11:在米曲霉JaL355中表达土生梭孢壳NRRL8126家族61糖基水解酶611基因米曲霉JaL355(TO2002/40694)原生质体根据Christensen等.,1988,见上的方法制备。将其用大约2iig的pSMai212转化。转化产生约17个转化体。将十七个转化体分离至单个基本培养基平板。用5ml的0.01%TWEEN20洗涤每个转化体的汇合的基本培养基平板,并分别接种入125ml玻璃摇瓶中的25ml的M410培养基,并在34°C,250rpm温育。在5日温育之后,用CRITERIONCell在CRlTER丨ONTris-HCl凝胶上根据生产商的指示分析5ill的来自每个培养的上清。将所得的凝胶用BIO-SAFECoomassieStain染色。培养物的SDS-PAGE概貌显示多数转化体具有预期的23KDA条带大小。用IOml的0.01%TWEEN80洗涤转化体14的汇合的平板,并接种入含有500ml的M410培养基的2升Fernbach以生成用于表征酶的培养液。在第5日收获培养物,并使用.22umEXPRESSPLUSMembrane过滤。实施例12:经预处理的玉米秸杆的水解由具有纤维素分解增强活性的土生梭孢壳NRRL8126GH61J,GH61K,和GFH61L多肽增强培养液如实施例5,8,和11中所述制备,并使用Amicon超滤装置(Mi11ipore,Bedford,MA,USA,IOkDa聚醚砜膜,40psi,4°C)浓缩大约20倍。在SDS-PAGE和考马斯蓝染色之后通过光密度法估计蛋白浓度。如W02005/074647中所述预处理玉米秸杆并将其作为测定底物制备,以生成经预处理玉米秸杆(PCS)。用于测定增强活性的基础(base)纤维素酶混合物从里氏木霉菌株SMA135(W02008/057637)制备。PCS的水解使用I.6ml深孔板(Axygen,SantaClara,CA,USA)使用I.Oml的总反应体积和ImM硫酸锰_50mM乙酸钠pH5.0中的50mg/ml的PCS浓度来进行。将土生梭孢壳多肽(GH61J,GH61K和GFH61L)以0至25%或0至32%浓度范围的基础纤维素酶混合物的蛋白浓度分别添加至基础纤维素酶混合物。温育在50°C进行72小时。测定重复进行三次。离心等分试样,并通过使用平板离心机(SORVALLRT7,ThermoFisherScientific,Waltham,MA,USA)以3000rpm离心10分钟(MULTISCREENHV0.45um,Mi11ipore,Billerica,MA,USA)来过滤上清液体。当不立即使用时,将过滤的水解物等分试样冻结于_20°C。稀释于含0.05%w/w苯甲酸的0.005MH2SO4中的样品的糖浓度在用含0.05%w/w苯甲酸的0.005MH2SO4在60°C以0.6ml/分钟的流速从4.6x250mmAM丨NEXHPX-87H柱(Bio-RadLaboratories,Inc.,Hercules,CA,USA)洗脱之后测量,其中通过将从纯糖样品(AbsoluteStandardsInc.,Hamden,CT,USA)校准的折光率检测(CHEMSrAl.ION,AG丨LENT1100HPLC,AgilentTechnologies,SantaClara,CA,USA)所得的葡萄糖和纤维二糖信号进行积分来进行定量。所得的当量用于计算对于每个反应的纤维素转化百分比。纤维素转化为葡萄糖加上纤维二糖的程度(转化,%)使用下式计算转化(%)=(葡萄糖+纤维二糖xl.053)(mg/ml)xl00xl62/(纤维素(mg/ml)xl80)=(葡萄糖+纤维二糖xl.053)(mg/ml)xlOO/(纤维素(mg/ml)xl.Ill)在该式中,因子I.Ill反映了在纤维素转化为葡萄糖中的重量增加,而因子1.053反映了在纤维二糖转化为葡萄糖中的重量增加。PCS中的纤维素通过PCS的限制消化以释放葡萄糖和纤维二糖来确定。将增加量的土生梭孢壳多肽分别添加至基础纤维素酶混合物的结果示于图4。土生梭孢壳GH61J和GH61K在25%添加水平的添加分别提供了I.14和I.13的刺激因子。土生梭孢壳GH61L多肽在32%添加水平提供了I.13的刺激因子。实施例13:含有编码具有纤维素分解增强活性的家族GH61M多肽的土生梭孢壳NRRL8126基因组序列的米曲霉表达载体的构建设计了如下所示的两种合成的寡核苷酸引物以从实施例2中制备的基因组DNA来PCR扩增土生梭孢壳NRRL8126gh61m基因。使用IN-FUSIONCloningKit以将片段直接克隆入表达载体pAlLo2(W02004/099228),而无需进行限制性消化和连接。Ttghlm-Fl(063567)5,-actggatttaccATGAAGCTGTCATCCCAGCTCGCC-3,(SEQIDNO:29)Ttgh61m-Rl(063568)5,-TCACCTCTAGTTAATTAACTAGCACTGAAAGACCGCCG'-3J(SEQIDNO:30)粗体字母代表编码序列。剩余序列同源于PAlLo2的插入位点。将五十皮摩尔的上述每种引物用于PCR反应,所述反应包含IOOng的土生梭孢壳NRRL8126基因组DNA,PfxAmplificationBuffer,各0.4mM的dATP,dTTP,dGTP,和dCTP,ImMMgCl2,和2.5单位的PfxDNA聚合酶,最终体积为50yl。使用EPPENDORFMASTERCYCLER5333进行扩增,其程序为I个循环,在98°C进行3分钟;和30个循环,每循环在98°C进行30秒,60°C进行30秒,和72°C进行I.5分钟。然后加热块进入4°C浸没循环。将反应产物在I.0%琼脂糖凝胶上使用TAE缓冲液分离,其中将1007bp的产物条带从凝胶切出,并使用MINELUTEGelExtractionKit根据生产商的指示纯化。然后将片段使用IN-FUSIONCloningKit克隆入NcoI和PacI消化的pAlLo2,得到pSMail97(图5),其中土生梭孢壳gh61m基因的转录处于NA2-tpi启动子的调控之下。连接反应(50uI)包含IXIN-FUSIONBuffer,IXBSA,IuIofIN-FUSIONSI(I:10稀释),IOOng用NcoIandPacI消化的pAlLo2,和50ng的土生梭抱壳gh61m纯化的PCR产物。将反应在室温温育30分钟。使用一iiI的反应物转化大肠杆菌XLlOSOLOPACKGoldSupercompetent细胞。含有pSMail97的大肠杆菌转化体通过限制性消化检测,而质粒DNA使用BIOROBOT9600制备。pSMail97中的土生梭孢壳gh61m插入通过DNA测序来确认。亦将相同的1007bp土生梭孢壳gh61mPCR片段使用T0P0TACLONINGKit克隆入pCR_2.1-T0P0载体,以生成pSMai213。土生梭孢壳gh61m插入通过DNA测序确认。大肠杆菌pSMai213于2009年8月3日保藏于农业研究机构专利培养物保藏中心北区石开究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter,Peoria,IL,USA),并分配登录号NRRLB-50300。实施例14:编码具有纤维素分解增强活性的GH61M多肽的土生梭孢壳NRRL8126基因组序列的表征土生梭抱壳NRRL8126gh61m基因组克隆的DNA测序用AppliedBiosystemsModel3700AutomatedDNASequencer使用版本3.1BIG-DYE终止子化学和dGTP化学和引物步移策略进行。就品质审视核苷酸序列数据,并以PHRED/PHRAP软件的协助将所有序列互相比较。获得的序列与来自JGI的序列相同。土生梭孢壳gh61m基因的核苷酸序列(SEQIDNO:7)和推导的氨基酸序列(SEQIDNO:8))示于图6。编码序列为977bp,包含终止密码子,并由85,96,和124bp的内含子间隔。编码的预测的蛋白为223个氨基酸。基因编码序列(包含内含子)的%G+C为62.6%G+C,而成熟多肽编码序列为62.2%。使用SignalP程序(Nielsen等,1997,见上),预测了19个残基的信号肽。预测的成熟蛋白含有204个氨基酸,具有22.2kDa的预测的分子量和6.58的等电点pH。如EMBOSS的Needle程序中,以缺口开放罚分为10,缺口延伸罚分为0.5,和EBL0SUM62矩阵执行的,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上)确定了氨基酸序列的比较性逐对全局比对。比对显示编码具有纤维素分解增强活性的GH61M多肽的土生梭孢壳基因的推导的氨基酸序列与来自Podosporaanserina的预测的¢-葡糖苷酶蛋白的推导的氨基酸序列(登录号UniProtB2ADY5)分享76.5%的同一性(排除间隔)。实施例15:在米曲霉JaL355中表达土生梭孢壳NRRL8126家族61糖基水解酶61m基因米曲霉JaL355(TO2002/40694)原生质体根据Christensen等,1988,见上的方法制备。将其用大约2iig的pSMail97转化。转化产生约17个转化体。将十个转化体分离至单个基本培养基平板。用5ml的0.01%TWEEN20洗涤每个转化体的汇合的基本培养基平板,并分别接种入125ml玻璃摇瓶中的25ml的M410培养基,并在34°C,250rpm温育。在5日温育之后,用CRITERIONCell在CRITERIONTris-HCl凝胶上根据生产商的指示分析5ill的来自每个培养的上清。将所得的凝胶用BIO-SAFECoomassieStain染色。培养物的SDS-PAGE概貌显示多数转化体具有预期的22KDA条带大小。用IOml的0.01%TWEEN80洗涤转化体9的汇合的平板,并接种入含有500ml的M410培养基的2升Fernbach以生成用于表征酶的培养液。在第5日收获培养物,并使用.22umEXPRESSPLUSMembrane过滤。实施例16:经预处理的玉米秸杆的水解由具有纤维素分解增强活性的土生梭孢壳NRRL8126GH61M多肽增强培养液如实施例15中所述制备,并使用Amicon超滤装置(Mi11ipore,Bedford,MA,USA,IOkDa聚醚砜膜,40psi,4°C)浓缩大约20倍。在SDS-PAGE和考马斯蓝染色之后通过光密度法估计蛋白浓度。如W02005/074647中所述预处理玉米秸杆并将其作为测定底物制备,以生成经预处理玉米秸杆(PCS)。用于测定增强活性的基础纤维素酶混合物从里氏木霉菌株SMA135(W02008/057637)制备。PCS的水解使用1.6ml深孔板(Axygen,SantaClara,CA,USA)使用I.0ml的总反应体积和ImM硫酸锰_50mM乙酸钠pH5.0中的50mg/ml的PCS浓度来进行。将土生梭孢壳多肽(GH61M)以O至25%浓度范围的基础纤维素酶混合物的蛋白浓度分别添加至基础纤维素酶混合物。温育在50°C进行72小时。测定重复进行三次。离心等分试样,并通过使用平板离心机(SORVALLThermoFisherScientific,Waltham,MA,USA)以3000rpm离心10分钟(MULT丨SCREENHV0.45ym)来过滤上清液体。当不立即使用时,将过滤的水解物等分试样冻结于_20°C。稀释于含0.05%w/w苯甲酸的0.005MH2SO4中的样品的糖浓度在用含0.05%w/w苯甲酸的0.005MH2SO4在60°C以0.6ml/分钟的流速从4.6x250mmAMINEXHPX-87H柱洗脱之后测量,其中通过将从纯糖样品(AbsoluteStandardsInc.,Hamden,CT,USA)校准的折光率检测所得的葡萄糖和纤维二糖信号进行积分来进行定量。所得的当量用于计算对于每个反应的纤维素转化百分比。纤维素转化为葡萄糖加上纤维二糖的程度(转化,%)使用下式计算转化(%)=(葡萄糖+纤维二糖xl.053)(mg/ml)xIOOx162/(纤维素(mg/ml)xl80)=(葡萄糖+纤维二糖xl.053)(mg/ml)xlOO/(纤维素(mg/ml)xl.Ill)在该式中,因子I.Ill反映了在纤维素转化为葡萄糖中的重量增加,而因子1.053反映了在纤维二糖转化为葡萄糖中的重量增加。PCS中的纤维素通过PCS的限制消化以释放葡萄糖和纤维二糖来确定。将增加量的土生梭孢壳GH61M多肽添加至基础纤维素酶混合物的结果示于图7。土生梭孢壳GH61M多肽在25%添加水平的添加提供了I.27的刺激因子。实施例17:含有用于土生梭孢壳家族GH61N基因的米曲霉表达载体的构建设计了如下所示的两种合成的寡核苷酸引物以从实施例2中制备的基因组DNA来PCR扩增土生梭孢壳家族GH61N基因。使用IN-FUSIONCloningKit以将片段直接克隆入表达载体PA1L02,而无需进行限制性消化和连接。正向引物5’-ACTGGATTTACCATGCCTTCTTTCGCCTCCAA3(SEQIDNO:31)反向引物5,-TCACCTCTAGTTAATTAATCAGTTTGCCTCCTCAGCCC-3,(SEQIDNO:32)粗体字母代表编码序列。剩余序列同源于PAlLo2的插入位点。将五十皮摩尔的上述每种引物用于PCR反应,所述反应含有Iyg的土生梭孢壳基因组DNA,1XADVANTAGEGC-MeltLABuffer(BDBiosciences,PaloAlto,CA,USA),Iul的dATP,dTTP,dGTP,和dCTP的IOmM混合物,和I.25单位的ADVANTAGEGCGenomicLAPolymeraseMix(BDBiosciences,PaloAlto,CA,USA),最终体积为25yl。扩增条件为一个循环,在94°C进行I分钟;和30个循环,每循环在94°C进行30秒,60.5°C进行30秒,和72°C进行I分钟。然后将加热块维持在72°C进行5分钟,接着进行4°C浸没循环。将反应产物通过使用TAE缓冲液的I.0%琼脂糖凝胶电泳分离,其中将大约I.Ikb的产物条带从凝胶切出,并使用MINELUTEGelExtractionKit根据生产商的指示纯化。然后将片段使用IN-FUSIONCloningKit克隆入pAlLo2。用NcoI和PacI消化载体。将片段通过使用TAE缓冲液的1.0%琼脂糖凝胶电泳纯化,从凝胶切出,并使用QiAQU丨CK_GelExtractionKit(QIAGENInc.,Valencia,CA,USA)纯化。在反应中将基因片段和消化的载体合并在一起,得到表达质粒PAG66,其中家族GH61N基因的转录处于NA2-tpi启动子的调控之下。重组反应物(20ill)包含IXIN-FUSIONBuffer,IXBSA,I的IN-FUSION酶(1:10稀释),186叩用叱0I和PacI消化的pAlLo2,和96.6ng的土生梭孢壳GH6IN纯化PCR产物。反应在37°C温育15分钟,然后在50°C温育15分钟用40yl的TE缓冲液稀释反应物,并使用2.5iiI的稀释反应物转化大肠杆菌ToplOCompetent细胞(Stratagene,LaJolla,CA,USA)。通过限制酶消化鉴定了含有pAG66(GH61N基因)的大肠杆菌转化体,并使用BIOROBOT9600制备质粒DNA。亦使用TOPOTACLONINGKit将相同的I.Ikb土生梭孢壳gh61nPCR片段克隆入pCR'2.1-T0P0载体,以生成pAG68。通过DNA测序确认了土生梭孢壳gh61n插入。大肠杆菌PAG68于2009年9月18日保藏于农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter,Peoria,IL,USA),并分配登录号NRRLB-50320。实施例18:编码具有纤维素分解增强活性的家族GH61N多肽的土生梭孢壳基因组序列的表征具有纤维素分解增强活性的土生梭孢壳GH61N多肽的核苷酸序列(SEQIDNO:9)和推导的氨基酸序列(SEQIDNO:10)示于图8。基因组多核苷酸为1107bp,包含终止密码子,并编码368个氨基酸的多肽。全长编码序列和成熟编码序列的%G+C分别为68.1%和68.3%。使用SignalP软件程序(Nielsen等,1997,见上),预测了21个残基的信号肽。预测的成熟的蛋白含有347个氨基酸,具有35.OkDa的分子量。用Interproscan程序(Mulder等,2007,NucleicAcidsRes.35:D224_D228)分析具有纤维素分解增强活性的GH61N多肽的推导的氨基酸序列显示所述GH61N多肽含有糖基水解酶家族61的特征序列(InterPro登录号IPR005103)。该特征序列见于成熟多肽(Pfam登录号PF03443)的大约残基I至221。如EMBOSS的Needle程序中,以缺口开放罚分为10,缺口延伸罚分为0.5,和EBL0SUM62矩阵执行的,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上)确定了氨基酸序列的比较性逐对全局比对。比对显示土生梭孢壳GH61N多肽的推导的氨基酸序列与来自黑曲霉的另一种预测的家族61糖基水解酶的推导的氨基酸序列(UniProt登录号A2QZE1)分享72.3%的同一性(排除间隔)。实施例19:在米曲霉JaL355中表达编码具有纤维素分解增强活性的GH61N多肽的土生梭孢壳基因组DNA。根据Christensen等,1988,见上的方法制备米曲霉JaL355原生质体,将其用5yg的pAG43转化。将三个转化体分离至单独的PDA平板。从三个转化体每一个的起始转化平板取栓,并分别添加至24孔板中的Iml的M410培养基,将其在34°C温育。在温育之后五日,使用CRITERION无染色,8-16%梯度SDS-PAGE,(Bio-RadLaboratories,Inc.,Hercules,CA,USA)根据生产商的指不分析来自每个培养的7.5ill的上清。培养物的SDS-PAGE概貌显示几个转化体具有大约70kDa和35kDa的新的主要条带。用5ml的0.01%JWEEN20洗涤两个转化体的汇合的PDA平板,并接种入五个含有IOOml的M410培养基的500mlErlenmeyer烧瓶,并温育以生成用于表征酶的培养液。在第3日和第5日收获烧瓶,并使用0.22iimstericup吸滤器(Mi11ipore,Bedford,MA,USA)过滤。实施例20:经预处理的玉米秸杆的水解由具有纤维素分解增强活性的土生梭孢壳GH61N多肽增强培养液如实施例19中所述制备,并使用Amicon超滤装置(Mi11ipore,Bedford,MA,USA,10kDa聚醚砜膜,40psi,4°C)浓缩大约20倍。在SDS-PAGE和考马斯蓝染色之后通过光密度法估计蛋白浓度。如W02005/074647中所述预处理玉米秸杆并将其作为测定底物制备,以生成经预处理玉米秸杆(PCS)。用于测定增强活性的基础纤维素酶混合物从里氏木霉菌株SMA135(W02008/057637)制备。PCS的水解使用I.6ml深孔板(Axygen,SantaClara,CA)使用I.Oml的总反应体积和ImM硫酸锰_50mM乙酸钠pH5.0中的50mg/ml的PCS浓度来进行。将土生梭孢壳多肽(GH61N)分别以0至100%浓度范围的基础纤维素酶混合物的蛋白浓度分别添加至基础纤维素酶混合物。温育在50°C进行72小时。测定重复进行三次。离心等分试样,并通过使用平板离心机(SORVAT,T,(R)RT7,ThermoFisherScientific,Waltham,MA,USA)以3000rpm离心10分钟(MULTISCREENHV0.45um,Millipore,Billerica,MA,USA)来过滤上清液体。当不立即使用时,将过滤的水解物等分试样冻结于_20°C。稀释于含0.05%w/w苯甲酸的0.005MH2SO4中的样品的糖浓度在用含0.05%w/w苯甲酸的0.005MH2SO4在600C以0.6ml/分钟的流速从4.6x250mmAMINEXHPX-87H柱(Bio-RadLaboratories,Inc.,Hercules,CA,USA)洗脱之后测量,其中通过将从纯糖样品(AbsoluteStandardsInc.,Hamden,CT,USA)校准的折光率检测(CHE.MSTATK)N_,AGILENTI则HPLC,AgilentTechnologies,SantaClara,CA,USA)所得的葡萄糖和纤维二糖信号进行积分来进行定量。所得的当量用于计算对于每个反应的纤维素转化百分比。纤维素转化为葡萄糖加上纤维二糖的程度(转化,%)使用下式计算转化(%)=(葡萄糖+纤维二糖xl.053)(mg/ml)xl00xl62/(纤维素(mg/ml)xl80)=(葡萄糖+纤维二糖xl.053)(mg/ml)xlOO/(纤维素(mg/ml)xl.Ill)在该式中,因子I.Ill反映了在纤维素转化为葡萄糖中的重量增加,而因子1.053反映了在纤维二糖转化为葡萄糖中的重量增加。PCS中的纤维素通过PCS的限制消化以释放葡萄糖和纤维二糖来确定。将增加量的土生梭孢壳多肽分别添加至基础纤维素酶混合物的结果示于图9。土生梭孢壳GH61N在50%添加百分比的添加提供了I.30的最大刺激优势(maximumstimulatorybenefit)。实施例21:含有用于土生梭孢壳家族GH610基因的米曲霉表达载体的构建设计了如下所示的两种合成的寡核苷酸引物以从实施例2中制备的基因组DNA来PCR扩增土生梭孢壳家族GH610基因。使用IN-FUSIONCloningKit以将片段直接克隆入表达载体PA1L02,而无需进行限制性消化和连接。正向引物5’-ACTGGATTTACCATGCCGCCCGCACTCCCTCA.-3'(SEQIDNO:33)反向引物5,-TCACCTCTAGTTAATTAACTAACCCCGCCGATCATACC-3,(SEQIDNO:34)粗体字母代表编码序列。剩余序列同源于PAlLo2的插入位点。将五十皮摩尔的上述每种引物用于PCR反应,所述反应含有IUg的土生梭孢壳基因组DNA,IXADVANTAGE(;C-MeltLABuffer,IiiI的dATP,dTTP,dGTP,和dCTP的IOmM混合物,和I.25单位的ADVANTAGEGCGenomicLAPolymeraseMix,最终体积为25iU。扩增条件为一个循环,在94°C进行I分钟;和30个循环,每循环在94°C进行30秒,60.5°C进行30秒,和72°C进行I分钟。然后将加热块维持在72°C进行5分钟,接着进行4°C浸没循环。将反应产物在I.0%琼脂糖凝胶上使用TAE缓冲液分离,其中将大约Ikb的产物条带从凝胶切出,并使用M丨NELUTE(S)GelExtractionKit根据生产商的指示纯化。然后将片段使用IN-FUSIONCloningKit克隆入pAlLo2。用NcoI和PacI消化载体。将片段通过琼脂糖凝胶电泳和QIAQUIC_IC_GelExtractionKit纯化。在反应中将基因片段和消化的载体合并在一起,得到表达质粒PAG67,其中家族GH610基因的转录处于NA2-tpi启动子的调控之下。重组反应物(20ill)包含IXIN-FUSIONBuffer,IX85八,1111的爪4旧1(^111酶(1:10稀释),1861^用叱0I和PacI消化的pAlLo2,和90.6ng的土生梭孢壳GH610纯化PCR产物。反应在37°C温育15分钟,然后在50°C温育15分钟用40ill的TE缓冲液稀释反应物,并使用2.5ill的稀释反应物转化大肠杆菌ToplOCompetent细胞。通过限制酶消化鉴定了含有pAG67(GH610基因)的大肠杆菌转化体,并使用BIOROBOT9600制备质粒DNA。亦使用TOPOTACLONINGKit将相同的Ikb土生梭孢壳gh61oPCR片段克隆入pCR2.1-T0P0载体,以生成pAG69。通过DNA测序确认了土生梭孢壳gh61o插入。大肠杆菌PAG69于2009年9月18日保藏于农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter,Peoria,IL,USA),并分配登录号NRRLB-50321。实施例22:编码具有纤维素分解增强活性的家族GH610多肽的土生梭孢壳基因组序列的表征具有纤维素分解增强活性的土生梭孢壳GH610多肽的核苷酸序列(SEQIDNO:11)和推导的氨基酸序列(SEQIDNO:12)示于图10。基因组多核苷酸为993bp,包含终止密码子,并编码330个氨基酸的多肽。全长编码序列和成熟编码序列的%G+C均为69.4%。使用SignalP软件程序(Nielsen等,1997,见上),预测了24个残基的信号肽。预测的成熟的蛋白含有306个氨基酸,具有32.IkDa的分子量。用Interproscan程序(Mulder等,2007,见上)分析具有纤维素分解增强活性的GH610多肽的推导的氨基酸序列显示所述GH610多肽含有糖基水解酶家族61的特征序列(InterPro登录号IPR005103)。该特征序列见于成熟多肽(Pfam登录号PF03443)的大约残基I至245。如EMBOSS的Needle程序中,以缺口开放罚分为10,缺口延伸罚分为0.5,和EBL0SUM62矩阵执行的,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上)确定了氨基酸序列的比较性逐对全局比对。比对显示土生梭孢壳GH610成熟多肽的推导的氨基酸序列与来自Podosporaanserina的另一种预测的家族61糖基水解酶的推导的氨基酸序列(UniProt登录号B2AVC8)分享56.5%的同一性(排除间隔)。实施例23:含有用于土生梭孢壳家族GH61P基因的米曲霉表达载体的构建设计了如下所示的两种合成的寡核苷酸引物以从实施例2中制备的基因组DNA来PCR扩增土生梭孢壳家族GH61P基因。使用IN-FUSIONCloningKit以将片段直接克隆入表达载体pAlLo2(WO2005/074647),而无需进行限制性消化和连接。正向引物5,-ACTGGATTTACCATGAAGACATTCACCGCCCTCCTG-3,(SEQIDNO:35)反向引物5,-TCACCTCTAGTTAATTAATCAGCAAGTAAAGACCGCCG_3,(SEQIDNO:36)粗体字母代表编码序列。剩余序列同源于PAlLo2的插入位点。将五十皮摩尔的上述每种引物用于PCR反应,所述反应含有Iyg的土生梭孢壳基因组DNA,IXADVANTAGE'GC-MeltLABuffer,IiiI的dATP,dTTP,dGTP,和dCTP的IOmM混合物,和I.25单位的ADVANTAGE_GCGenomicLAPolymeraseMix,最终体积为25iU。扩增条件为一个循环,在94°C进行I分钟;和30个循环,每循环在94°C进行30秒,58.5°C进行30秒,和72°C进行5分钟。然后将加热块维持在72°C进行5分钟,接着进行4°C浸没循环。将反应产物在I.0%琼脂糖凝胶上使用TAE缓冲液分离,其中将大约I.2kb的产物条带从凝胶切出,并使用MINE.LUTEGelExtractionKit根据生产商的指示纯化。然后将片段使用IN-FUSIONCloningKit克隆入pAlLo2。用NcoI和PacI消化载体。将片段通过琼脂糖凝胶电泳和Q丨AQUlCK⑧GelExtractionKit纯化。在反应中将基因片段和消化的载体合并在一起,得到表达质粒PAG70,其中家族GH61P基因的转录处于NA2-tpi启动子的调控之下。重组反应物(IOiU)包含IXIN-FUSIONBuffer,IXBSA,0.5uI的IN-FUSI0N酶(1:10稀释),93耶用叱0I和PacI消化的pAlLo2,和2yI的土生梭孢壳GH6IP纯化PCR产物。反应在37°C温育15分钟,然后在50°C温育15分钟用40yl的TE缓冲液稀释反应物,并使用2.I的稀释反应物转化大肠杆菌ToplOCompetent细胞。通过限制酶消化鉴定了含有pAG70(GH61P基因)的大肠杆菌转化体,并使用BIOROBOT9600制备质粒DNA。亦使用TOPOTACLONINGKit将相同的I.2kb土生梭孢壳gh61pPCR片段克隆入pCR2.1-T0P0载体,以生成pAG75。通过DNA测序确认了土生梭孢壳gh61p插入。大肠杆菌PAG75于2009年9月18日保藏于农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter,Peoria,IL,USA),并分配登录号NRRLB-50322。实施例24:编码具有纤维素分解增强活性的家族GH61P多肽的土生梭孢壳基因组序列的表征具有纤维素分解增强活性的土生梭孢壳GH61P多肽的核苷酸序列(SEQIDNO:13)和推导的氨基酸序列(SEQIDNO:14)示于图11。基因组多核苷酸为1221bp,包含终止密码子,且编码序列由231,75,和96bp的三个内含子间隔。预测的编码序列编码236个氨基酸的多肽。全长编码序列(包含内含子)和成熟编码序列的%G+C分别为60.2%和59.8%。使用SignalP软件程序(Nielsen等,1997,见上),预测了16个残基的信号肽。预测的成熟的蛋白含有220个氨基酸,具有23.6kDa的分子量。用Interproscan程序(Mulder等,2007,见上)分析具有纤维素分解增强活性的GH61P多肽的推导的氨基酸序列显示所述GH61P多肽含有糖基水解酶家族61的特征序列(InterPro登录号IPR005103)。该特征序列见于成熟多肽(Pfam登录号PF03443)的大约残基I至212。如EMBOSS的Needle程序中,以缺口开放罚分为10,缺口延伸罚分为0.5,和EBL0SUM62矩阵执行的,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上)确定了氨基酸序列的比较性逐对全局比对。比对显示土生梭孢壳GH61P成熟多肽的推导的氨基酸序列与来自粗糙脉孢霉的另一种预测的家族61糖基水解酶的推导的氨基酸序列(UniProt登录号Q7SA19)分享80.3%的同一性(排除间隔)。实施例25:含有用于土生梭孢壳家族GH61R基因的米曲霉表达载体的构建设计了如下所示的两种合成的寡核苷酸引物以从基因组DNA来PCR扩增土生梭孢壳家族GH61R基因。使用IN-FUSIONCloningKit以将片段直接克隆入表达载体pAlLo2(W02005/074647),而无需进行限制性消化和连接。正向引物5,-ACTGGATTTACCATGGCCTTGCTGCTCTTGGCAGGC-3,(SEQIDNO:37)反向引物5,-TCACCTCTAGTTAATTAATCACCCATCCCATATCGGCC_3,(SEQIDNO:38)粗体字母代表编码序列。剩余序列同源于PAlLo2的插入位点。将五十皮摩尔的上述每种引物用于PCR反应,所述反应含有Iyg的土生梭孢壳基因组DNA,IXADVANTAGEGC-MeltLABuffer,Iyl的dATP,dTTP,dGTP,和dCTP的IOmM混合物,和I.25单位的ADVANTAGEGCGenomicLAPolymeraseMix,最终体积为25Ul。扩增条件为一个循环,在94°C进行I分钟;和30个循环,每循环在94°C进行30秒,59.4°C进行30秒,和72°C进行5分钟。然后将加热块维持在72°C进行5分钟,接着进行4°C浸没循环。将反应产物在I.0%琼脂糖凝胶上使用TAE缓冲液分离,其中将大约Ikb的产物条带从凝胶切出,并使用MINELUTEGelExtractionKit根据生产商的指示纯化。然后将片段使用IN-FUSIONCloningKit克隆入pAlLo2。用NcoI和PacI消化载体。将片段通过琼脂糖凝胶电泳和Q丨AQU丨CKGelExtractionKit纯化。在反应中将基因片段和消化的载体合并在一起,得到表达质粒PAG71,其中家族GH61R基因的转录处于NA2-tpi启动子的调控之下。重组反应物(IOiU)包含IXIN-FUSIONBuffer,IXBSA,0.5uI的IN-FUSI0N酶(1:10稀释),93耶用叱0I和PacI消化的pAlLo2,和2yI的土生梭孢壳GH6IR纯化PCR产物。反应在37°C温育15分钟,然后在50°C温育15分钟用40yl的TE缓冲液稀释反应物,并使用2.I的稀释反应物转化大肠杆菌ToplOCompetent细胞。通过限制酶消化鉴定了含有pAG71(GH61R基因)的大肠杆菌转化体,并使用BIOROBOT9600制备质粒DNA。亦使用TOPOTACLONINGKit将相同的Ikb土生梭孢壳gh61rPCR片段克隆入pCR2.1-T0P0载体,以生成pAG76。通过DNA测序确认了土生梭孢壳gh61r插入。大肠杆菌PAG76于2009年9月18日保藏于农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter,Peoria,IL,USA),并分配登录号NRRLB-50323。实施例26:编码具有纤维素分解增强活性的家族GH61R多肽的土生梭孢壳基因组序列的表征具有纤维素分解增强活性的土生梭孢壳GH61P多肽的核苷酸序列(SEQIDNO:15)和推导的氨基酸序列(SEQIDNO:16)示于图12。基因组多核苷酸为933bp,包含终止密码子,且编码序列由72,53,和55bp的三个内含子间隔。预测的编码序列编码250个氨基酸的多肽。全长编码序列(包含内含子)和成熟编码序列的%G+C分别为61.8%和61.6%。使用SignalP软件程序(Nielsen等,1997,见上),预测了18个残基的信号肽。预测的成熟的蛋白含有232个氨基酸,具有26.OkDa的分子量。用Interproscan程序(Mulder等,2007,见上)分析具有纤维素分解增强活性的GH61R多肽的推导的氨基酸序列显示所述GH61R多肽含有糖基水解酶家族61的特征序列(InterPro登录号IPR005103)。该特征序列见于成熟多肽(Pfam登录号PF03443)的大约残基I至224。如EMBOSS的Needle程序中,以缺口开放罚分为10,缺口延伸罚分为0.5,和EBL0SUM62矩阵执行的,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上)确定了氨基酸序列的比较性逐对全局比对。比对显示土生梭孢壳GH61R成熟多肽的推导的氨基酸序列与来自ChrysosporiumIucknowense的另一种预测的家族61糖基水解酶的推导的氨基酸序列(GeneSeqP登录号AWI36233)分享72.8%的同一性(排除间隔)。实施例27:含有用于土生梭孢壳家族GH61S基因的米曲霉表达载体的构建设计了如下所示的两种合成的寡核苷酸引物以从实施例2中制备的基因组DNA来PCR扩增土生梭孢壳家族GH61S基因。使用IN-FUSIONCloningKit以将片段直接克隆入表达载体PA1L02,而无需进行限制性消化和连接。正向引物5,-ACTGGATTTACCATGATGCCGTCCCTTGTTCGCTTC_3'(SEQIDNO:39)反向引物5’-TCACCTCTAGTTAATTAATCAACCATGTCTCCTGTCCC_3’(SEQIDNO:40)粗体字母代表编码序列。剩余序列同源于PAlLo2的插入位点。将五十皮摩尔的上述每种引物用于PCR反应,所述反应含有Iyg的土生梭孢壳基因组DNA,IXADVANTAGEGC-MeltLABuffer,IiiI的dATP,dTTP,dGTP,和dCTP的IOmM混合物,和I.25单位的ADVANTAGE.GCGenomicLAPolymeraseMix,最终体积为25Ul。扩增条件为一个循环,在94°C进行I分钟;和30个循环,每循环在94°C进行30秒,58.5°C进行30秒,和72°C进行5分钟。然后将加热块维持在72°C进行5分钟,接着进行4°C浸没循环。将反应产物在I.0%琼脂糖凝胶上使用TAE缓冲液分离,其中将大约I.3kb的产物条带从凝胶切出,并使用MINELUTEGelExtractionKit根据生产商的指示纯化。然后将片段使用IN-FUSIONCloningKit克隆入pAlLo2。用NcoI和PacI消化载体。将片段通过琼脂糖凝胶电泳和Q丨AQUICKGelExtractionKit纯化。在反应中将基因片段和消化的载体合并在一起,得到表达质粒PAG72,其中家族GH61S基因的转录处于NA2-tpi启动子的调控之下。重组反应物(IOiU)包含IXIN-FUSIONBuffer,IXBSA,0.5uI的IN-FUSI0N酶(1:10稀释),93耶用叱0I和PacI消化的pAlLo2,和2yI的土生梭孢壳GH6IS纯化PCR产物。反应在37°C温育15分钟,然后在50°C温育15分钟用40yl的TE缓冲液稀释反应物,并使用2.I的稀释反应物转化大肠杆菌ToplOCompetent细胞。通过限制酶消化鉴定了含有pAG72(GH61S基因)的大肠杆菌转化体,并使用BIOROBOT9600制备质粒DNA。亦使用TOPOTACLONINGKit将相同的I.3kb土生梭孢壳gh61sPCR片段克隆入pCR.2.1-T0P0载体,以生成pAG77。通过DNA测序确认了土生梭孢壳gh61s插入。大肠杆菌PAG77于2009年9月18日保藏于农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter,Peoria,IL,USA),并分配登录号NRRLB-50324。实施例28:编码具有纤维素分解增强活性的家族GH61S多肽的土生梭孢壳基因组序列的表征具有纤维素分解增强活性的土生梭孢壳GH61S多肽的核苷酸序列(SEQIDNO:17)和推导的氨基酸序列(SEQIDNO:18)示于图13。基因组多核苷酸为1584bp,包含终止密码子,且编码序列由64和83bp的两个内含子间隔。预测的编码序列编码478个氨基酸的多肽。全长编码序列(包含内含子)和成熟编码序列的%G+C分别为63.9%和64.0%。使用SignalP软件程序(Nielsen等,1997,见上),预测了信号肽,但其确切位置不明确。绝大多数GH61成熟多肽以组氨酸残基起始,因此最可能的信号肽是残基I至22。预测的成熟的蛋白含有456个氨基酸,具有48.7kDa的分子量。用Interproscan程序(Mulder等,2007,见上)分析具有纤维素分解增强活性的GH61S多肽的推导的氨基酸序列显示所述GH61S多肽含有糖基水解酶家族61的特征序列(InterPro登录号IPR005103)。该特征序列见于成熟多肽(Pfam登录号PF03443)的大约残基108至222。如EMBOSS的Needle程序中,以缺口开放罚分为10,缺口延伸罚分为0.5,和EBL0SUM62矩阵执行的,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上)确定了氨基酸序列的比较性逐对全局比对。比对显示土生梭孢壳GH61S成熟多肽的推导的氨基酸序列与来自球毛壳菌的另一种预测的家族61糖基水解酶的推导的氨基酸序列(UniProt登录号Q2GZM2)分享65.1%的同一性(排除间隔)。实施例29:含有用于土生梭孢壳家族GH61T基因的米曲霉表达载体的构建设计了如下所示的两种合成的寡核苷酸引物以从实施例2中制备的基因组DNA来PCR扩增土生梭孢壳家族GH61T基因。使用IN-FUSIONCloningKit以将片段直接克隆入表达载体PA1L02,而无需进行限制性消化和连接。正向引物5’-ACTGGATTTACCATGCAGCTCCTCGTGGGCTT3(SEQIDNO:41)反向引物5,-TCACCTCTAGTTAATTAATCAGCCACTCCACACCGGCG—3,(SEQIDNO:42)粗体字母代表编码序列。剩余序列同源于PAlLo2的插入位点。将五十皮摩尔的上述每种引物用于PCR反应,所述反应含有Iyg的土生梭孢壳基因组DNA,IXADVANTAGEGC-MeltLABuffer,IiiI的dATP,dTTP,dGTP,和dCTP的IOmM混合物,和I.25单位的ADVANTAGE.GCGenomicLAPolymeraseMix,最终体积为25Ul。扩增条件为一个循环,在94°C进行I分钟;和30个循环,每循环在94°C进行30秒,60.5°C进行30秒,和72°C进行5分钟。然后将加热块维持在72°C进行5分钟,接着进行4°C浸没循环。将反应产物在I.0%琼脂糖凝胶上使用TAE缓冲液分离,其中将大约900bp的产物条带从凝胶切出,并使用MiNELUTEGelExtractionKit根据生产商的指示纯化。然后将片段使用IN-FUSIONCloningKit克隆入pAlLo2。用NcoI和PacI消化载体。将片段通过琼脂糖凝胶电泳和QIAQUICIC_GelExtractionKit纯化。在反应中将基因片段和消化的载体合并在一起,得到表达质粒PAG73,其中家族GH61T基因的转录处于NA2-tpi启动子的调控之下。重组反应物(IOiU)包含IXIN-FUSIONBuffer,IXBSA,0.5iiI的IN-FUSI0N酶(1:10稀释),93ng用NcoI和PacI消化的pAlLo2,和2uI的土生梭孢壳GH61T纯化PCR产物。反应在37°C温育15分钟,然后在50°C温育15分钟用40ill的TE缓冲液稀释反应物,并使用2.5ill的稀释反应物转化大肠杆菌ToplOCompetent细胞。通过限制酶消化鉴定了含有pAG73(GH61T基因)的大肠杆菌转化体,并使用BIOROBOT9600制备质粒DNA。亦使用TOPOTACLONINGKit将相同的900bp土生梭孢壳gh61tPCR片段克隆入pCR'2.1-T0P0载体,以生成PAG78。通过DNA测序确认了土生梭孢壳gh61t插入。大肠杆菌PAG78于2009年9月18日保藏于农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter,Peoria,IL,USA),并分配登录号NRRLB-50325。实施例30:编码具有纤维素分解增强活性的家族GH61T多肽的土生梭孢壳基因组序列的表征具有纤维素分解增强活性的土生梭孢壳GH61T多肽的核苷酸序列(SEQIDNO:19)和推导的氨基酸序列(SEQIDNO:20)示于图14。基因组多核苷酸为868bp,包含终止密码子,且编码序列由76和99bp的两个内含子间隔。预测的编码序列编码230个氨基酸的多肽。全长编码序列(包含内含子)和成熟编码序列的%G+C分别为61.5%和61.4%。使用SignalP软件程序(Nielsen等,1997,见上),预测了16个残基的信号肽。预测的成熟的蛋白含有214个氨基酸,具有23.IkDa的分子量。用Interproscan程序(Mulder等,2007,见上)分析具有纤维素分解增强活性的GH61T多肽的推导的氨基酸序列显示所述GH61T多肽含有糖基水解酶家族61的特征序列(InterPro登录号IPR005103)。该特征序列见于成熟多肽(Pfam登录号PF03443)的大约残基71至197。如EMBOSS的Needle程序中,以缺口开放罚分为10,缺口延伸罚分为0.5,和EBL0SUM62矩阵执行的,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上)确定了氨基酸序列的比较性逐对全局比对。比对显示土生梭孢壳GH61T成熟多肽的推导的氨基酸序列与来自球毛壳菌的另一种预测的家族61糖基水解酶的推导的氨基酸序列(UniProt登录号Q2GUT0)分享87.4%的同一性(排除间隔)。实施例31:含有用于土生梭孢壳家族GH61U基因的米曲霉表达载体的构建设计了如下所示的两种合成的寡核苷酸引物以从实施例2中制备的基因组DNA来PCR扩增土生梭孢壳家族GH61U基因。使用IN-FUSIONCloningKit以将片段直接克隆入表达载体PA1L02,而无需进行限制性消化和连接。正向引物5,-ACTGGATTTACCATGAAGCTGTACCTGGCGGCCTTT-3'(SEQIDNO:43)反向引物5,-TCACCTCTAGTTAATTAATCAACCAGTCCACAGCGCTG_3,(SEQIDNO:44)粗体字母代表编码序列。剩余序列同源于PAlLo2的插入位点。将五十皮摩尔的上述每种引物用于PCR反应,所述反应含有Iyg的土生梭孢壳基因组DNA,IXADVANTAGEGC-MeltLABuffer,Iyl的dATP,dTTP,dGTP,和dCTP的IOmM混合物,和I.25单位的ADVANTAGE'GCGenomicLAPolymeraseMix,最终体积为25Ul。扩增条件为一个循环,在94°C进行I分钟;和30个循环,每循环在94°C进行30秒,58.5°C进行30秒,和72°C进行5分钟。然后将加热块维持在72°C进行5分钟,接着进行4°C浸没循环。将反应产物在I.0%琼脂糖凝胶上使用TAE缓冲液分离,其中将大约Ikb的产物条带从凝胶切出,并使用MINELUTEGelExtractionKit根据生产商的指示纯化。然后将片段使用IN-FUSIONCloningKit克隆入pAlLo2。用NcoI和PacI消化载体。将片段通过琼脂糖凝胶电泳和QIAQUICKGelExtractionKit纯化。在反应中将基因片段和消化的载体合并在一起,得到表达质粒PAG74,其中家族GH6IU基因的转录处于NA2-tpi启动子的调控之下。重组反应物(IOiU)包含IXIN-FUSIONBuffer,IXBSA,0.5iiI的IN-FUSI0N酶(1:10稀释),93ng用NcoI和PacI消化的pAlLo2,和2ill的土生梭孢壳GH61U纯化PCR产物。反应在37°C温育15分钟,然后在50°C温育15分钟用40ill的TE缓冲液稀释反应物,并使用2.5ill的稀释反应物转化大肠杆菌ToplOCompetent细胞。通过限制酶消化鉴定了含有pAG74(GH61U基因)的大肠杆菌转化体,并使用BIOROBOT9600制备质粒DNA。亦使用TOPOTACLONINGKit将相同的Ikb土生梭孢壳gh61uPCR片段克隆入pCR2.1-T0P0载体,以生成pAG79。通过DNA测序确认了土生梭孢壳gh61j插入。大肠杆菌PAG79于2009年9月18日保藏于农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter,Peoria,IL,USA),并分配登录号NRRLB-50326。实施例32:编码具有纤维素分解增强活性的家族GH61U多肽的土生梭孢壳基因组序列的表征具有纤维素分解增强活性的土生梭孢壳GH61U多肽的核苷酸序列(SEQIDNO:21)和推导的氨基酸序列(SEQIDNO:22)示于图15。基因组多核苷酸为1068bp,包含终止密码子,且编码序列由64,52,96和82bp的四个内含子间隔。预测的编码序列编码257个氨基酸的多肽。全长编码序列(包含内含子)和成熟编码序列的%G+C分别为59.7%和59.3%。使用SignalP软件程序(Nielsen等,1997,见上),预测了19个残基的信号肽。预测的成熟的蛋白含有238个氨基酸,具有26.6kDa的分子量。用Interproscan程序(Mulder等,2007,见上)分析具有纤维素分解增强活性的GH61T多肽的推导的氨基酸序列未显示所述GH61U多肽含有糖基水解酶家族61的特征序列(InterPro登录号IPR005103)。然而,针对Pfam数据库的直接检索产生了与GH61家族(Pfam登录号PF03443)的明显命中(significanthit)(4.3xl(T8的e值)。如EMBOSS的Needle程序中,以缺口开放罚分为10,缺口延伸罚分为0.5,和EBL0SUM62矩阵执行的,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上)确定了氛基酸序列的比较性逐对全局比对。比对显示土生梭孢壳GH61U成熟多肽的推导的氨基酸序列与来自球毛壳菌的另一种预测的家族61糖基水解酶的推导的氨基酸序列(UniProt登录号Q2HHT1)分享74.4%的同一性(排除间隔)。生物材料的保藏下述的生物材料已经依据布达佩斯条约的条款保藏于农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter),Peoria,IL,USA,并给予下述的登录号保藏登录号保藏日期大肠杆菌(pSMai216)NRRLB-503012009年7月15日大肠杆菌(pSiV1ai217)NRRLB-503022009年7月15日大肠杆菌(pSiV1ai218)NRRLB-503032009年7月15日大肠杆菌(pSiV1ai213)NRRLB-503002009年7月15日大肠杆菌(pAG68)NRRLB-503202009年9月18日大肠杆菌(pAG69)NRRLB-503212009年9月18日大肠杆菌(pAG75)NRRLB-503222009年9月18日大肠杆菌(pAG76)NRRLB-503232009年9月18日大肠杆菌(pAG77)NRRLB-503242009年9月18日大肠杆菌(pAG78)NRRLB-503252009年9月18日大肠杆菌(pAG79)NRRLB-503262009年9月18日所述菌株于下述条件下保藏确保在本专利申请未决期间,依据该外国专利法律的授权的人能够获得所述培养物。所述保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本,或其后续文本的国家,依据该外国专利法律可以获得所述保藏物。然而,应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予的专利权的侵犯。通过下述段落进一步描述本发明[I]一种具有纤维素分解增强活性的分离的多肽,其选自下组(a)多肽,其具有与SEQIDNO:2,SEQIDNO:6,或SEQIDNO:12的成熟多肽至少60%序列同一性;与SEQIDN0:4的成熟多肽至少65%序列同一性;与SEQIDNO:18的成熟多肽至少70%序列同一性;与SEQIDNO:10,SEQIDN0:16,或SEQIDN0:22的成熟多肽至少75%序列同一性;与SEQIDNO:8的成熟多肽至少80%序列同一性;与SEQIDNO:14的成熟多肽至少85%序列同一性;或者与SEQIDNO:20的成熟多肽至少90%序列同;性;(b)多肽,其由多核苷酸编码,所述多核苷酸在中等-高,高或非常高严格条件下与以下杂交(i)SEQIDNO:I,SEQIDNO:3,SEQIDNO:5,SEQIDNO:11,或SEQIDNO:17的成熟多肽编码序列,(ii)包含于SEQIDN0:1,SEQIDNO:3,SEQIDNO:5,SEQIDN0:11,或SEQIDNO:17的成熟多肽编码序列中的cDNA序列,或(iii)⑴或(ii)的全长互补链;在高或非常高严格条件下与以下杂交(i)SEQIDN0:7,SEQIDN0:9,SEQIDNO:13,SEQIDNO:15,或SEQIDN0:21的成熟多肽编码序列,(ii)包含于SEQIDNO:7,SEQIDN0:9,SEQIDNO:13,SEQIDN0:15,或SEQIDNO:21的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;或者在非常高严格条件下与以下杂交i)SEQIDNO:19的成熟多肽编码序列,(ii)包含于SEQIDNO:19的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;(C)多肽,其由多核苷酸编码,所述多核苷酸具有与SEQIDNO:I,SEQIDN0:5,或SEQIDNO:11的成熟多肽编码序列至少60%序列同一性;与SEQIDN0:3的成熟多肽编码序列至少65%序列同一性;与SEQIDNO:17的成熟多肽编码序列至少70%序列同一性;与SEQIDN0:9,SEQIDNO:15,或SEQIDN0:21的成熟多肽编码序列至少75%序列同一性;与SEQIDN0:7的成熟多肽编码序列至少80%序列同一性;与SEQIDNO:13的成熟多肽编码序列至少85%序列同一性;或者与SEQIDNO:19的成熟多肽编码序列至少90%序列同一性;或者其cDNA序列;(d)变体,其包含SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,或SEQIDNO:22的成熟多肽的一个或多个(几个)氨基酸的取代,缺失,和/或插入;和(e)(a),(b),(C),或(d)的多肽具有纤维素分解增强活性的片段。[2]段I的多肽,其与SEQIDNO:2,SEQIDNO:6,或SEQIDNO:12的成熟多肽具有至少60%序列同一性。[3]段2的多肽,其与SEQIDNO:2,SEQIDNO:6,或SEQIDNO:12的成熟多肽具有至少65%序列同一性。[4]段3的多肽,其与SEQIDNO:2,SEQIDNO:6,或SEQIDNO:12的成熟多肽具有至少70%序列同一性。[5]段4的多肽,其与SEQIDNO:2,SEQIDN0:6,或SEQIDN0:12的成熟多肽具有至少75%序列同一性。[6]段5的多肽,其与SEQIDNO:2,SEQIDNO:6,或SEQIDNO:12的成熟多肽具有至少80%序列同一性。[7]段6的多肽,其与SEQIDNO:2,SEQIDNO:6,或SEQIDNO:12的成熟多肽具有至少85%序列同一性。[8]段7的多肽,其与SEQIDNO:2,SEQIDN0:6,或SEQIDNO:12的成熟多肽具有至少90%序列同一性。[9]段8的多肽,其与SEQIDNO:2,SEQIDN0:6,或SEQIDN0:12的成熟多肽具有至少95%序列同一性。[10]段9的多肽,其与SEQIDN0:2,SEQIDN0:6,或SEQIDNO:12的成熟多肽具有至少97%序列同一性。[11]段I的多肽,其与SEQIDNO:4的成熟多肽具有至少65%序列同一性。[12]段11的多肽,其与SEQIDNO:4的成熟多肽具有至少70%序列同一性。[13]段12的多肽,其与SEQIDNO:4的成熟多肽具有至少75%序列同一性。[14]段13的多肽,其与SEQIDNO:4的成熟多肽具有至少80%序列同一性。[15]段14的多肽,其与SEQIDNO:4的成熟多肽具有至少85%序列同一性。[16]段15的多肽,其与SEQIDNO:4的成熟多肽具有至少90%序列同一性。[17]段16的多肽,其与SEQIDNO:4的成熟多肽具有至少95%序列同一性。[18]段17的多肽,其与SEQIDNO:4的成熟多肽具有至少97%序列同一性。[19]段I的多肽,其与SEQIDNO:18的成熟多肽具有至少70%序列同一性。[20]段19的多肽,其与SEQIDNO:18的成熟多肽具有至少75%序列同一性。[21]段20的多肽,其与SEQIDNO:18的成熟多肽具有至少80%序列同一性。[22]段21的多肽,其与SEQIDNO:18的成熟多肽具有至少85%序列同一性。[23]段22的多肽,其与SEQIDNO:18的成熟多肽具有至少90%序列同一性。[24]段23的多肽,其与SEQIDNO:18的成熟多肽具有至少95%序列同一性。[25]段24的多肽,其与SEQIDNO:18的成熟多肽具有至少97%序列同一性。[26]段I的多肽,其与SEQIDNO:10,SEQIDNO:16,或SEQIDNO:22的成熟多肽具有至少75%序列同一丨丨生。[27]段26的多肽,其与SEQIDNO:10,SEQIDNO:16,或SEQIDNO:22的成熟多肽具有至少80%序列同一性。[28]段27的多肽,其与SEQIDNO:10,SEQIDNO:16,或SEQIDNO:22的成熟多肽具有至少85%序列同一性。[29]段28的多肽,其与SEQIDNO:10,SEQIDNO:16,或SEQIDNO:22的成熟多肽具有至少90%序列同一性。[30]段29的多肽,其与SEQIDNO:10,SEQIDNO:16,或SEQIDNO:22的成熟多肽具有至少95%序列同一性。[31]段30的多肽,其与SEQIDNO:10,SEQIDNO:16,或SEQIDNO:22的成熟多肽具有至少97%序列同一性。[32]段I的多肽,其与SEQIDNO:8的成熟多肽具有至少80%序列同一性。[33]段32的多肽,其与SEQIDNO:8的成熟多肽具有至少85%序列同一性。[34]段33的多肽,其与SEQIDNO:8的成熟多肽具有至少90%序列同一性。[35]段34的多肽,其与SEQIDNO:8的成熟多肽具有至少95%序列同一性。[36]段35的多肽,其与SEQIDNO:8的成熟多肽具有至少97%序列同一性。[37]段I的多肽,其与SEQIDNO:14的成熟多肽具有至少85%序列同一性。[38]段37的多肽,其与SEQIDNO:14的成熟多肽具有至少90%序列同一性。[39]段38的多肽,其与SEQIDNO:14的成熟多肽具有至少95%序列同一性。[40]段39的多肽,其与SEQIDNO:14的成熟多肽具有至少97%序列同一性。[41]段I的多肽,其与SEQIDNO:20的成熟多肽具有至少90%序列同一性。[42]段41的多肽,其与SEQIDNO:20的成熟多肽具有至少95%序列同一性。[43]段42的多肽,其与SEQIDNO:20的成熟多肽具有至少97%序列同一性。[44]段I的多肽,其由多核苷酸编码,所述多核苷酸在中等-高严格条件下与以下杂交(i)SEQIDNO:1,SEQIDNO:3,SEQIDNO:5,SEQIDNO:11,或SEQIDNO:17的成熟多肽编码序列,(ii)包含于SEQIDNO:I,SEQIDNO:3,SEQIDNO:5,SEQIDNO:11,或SEQIDNO:17的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链。[45]段44的多肽,其由多核苷酸编码,所述多核苷酸在高严格条件下与以下杂交(i)SEQIDNO:1,SEQIDNO:3,SEQIDNO:5,SEQIDNO:11,或SEQIDNO:17的成熟多肽编码序列,(ii)包含于SEQIDNO:I,SEQIDN0:3,SEQIDNO:5,SEQIDNO:11,或SEQIDNO:17的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链。[46]段45的多肽,其由多核苷酸编码,所述多核苷酸在非常高严格条件下与以下杂交(i)SEQIDNO:1,SEQIDNO:3,SEQIDNO:5,SEQIDNO:11,或SEQIDNO:17的成熟多肽编码序列,(ii)包含于SEQIDNO:I,SEQIDNO:3,SEQIDNO:5,SEQIDNO:11,或SEQIDNO:17的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链。[47]段I的多肽,其由多核苷酸编码,所述多核苷酸在高严格条件下与以下杂交(i)SEQIDNO:7,SEQIDNO:9,SEQIDNO:13,SEQIDNO:15,或SEQIDNO:21的成熟多肽编码序列,(ii)包含于SEQIDNO:7,SEQIDNO:9,SEQIDNO:13,SEQIDNO:15,或SEQIDN0:21的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链。[48]段47的多肽,其由多核苷酸编码,所述多核苷酸在非常高严格条件下与以下杂交(i)SEQIDNO:7,SEQIDNO:9,SEQIDNO:13,SEQIDNO:15,或SEQIDNO:21的成熟多肽编码序列,(ii)包含于SEQIDNO:7,SEQIDNO:9,SEQIDNO:13,SEQIDNO:15,或SEQIDN0:21的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链。[49]段I的多肽,其由多核苷酸编码,所述多核苷酸在非常高严格条件下与以下杂交(i)SEQIDNO:19的成熟多肽编码序列,(ii)包含于SEQIDNO:19的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链。[50]段I的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:I,SEQIDNO:5,或SEQIDNO:11的成熟多肽编码序列,或其cDNA序列具有至少60%序列同一性。[51]段50的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:I,SEQIDN0:5,或SEQIDNO:11的成熟多肽编码序列,或其cDNA序列具有至少65%序列同一性。[52]段51的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:I,SEQIDN0:5,或SEQIDNOill的成熟多肽编码序列,或其cDNA序列具有至少70%序列同一性。[53]段52的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:I,SEQIDN0:5,或SEQIDNOill的成熟多肽编码序列,或其cDNA序列具有至少75%序列同一性。[54]段53的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:I,SEQIDN0:5,或SEQIDN0:11的成熟多肽编码序列,或其cDNA序列具有至少80%序列同一性。[55]段54的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:I,SEQIDN0:5,或SEQIDNOill的成熟多肽编码序列,或其cDNA序列具有至少85%序列同一性。[56]段55的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:I,SEQIDN0:5,或SEQIDN0:11的成熟多肽编码序列,或其cDNA序列具有至少90%序列同一性。[57]段56的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:I,SEQIDN0:5,或SEQIDNOill的成熟多肽编码序列,或其cDNA序列具有至少95%序列同一性。[58]段57的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:I,SEQIDN0:5,或SEQIDNOill的成熟多肽编码序列,或其cDNA序列具有至少97%序列同一性。[59]段I的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDN0:3的成熟多肽编码序列,或其cDNA序列具有至少65%序列同一性。[60]段59的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:3的成熟多肽编码序列,或其cDNA序列具有至少70%序列同一性。[61]段60的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:3的成熟多肽编码序列,或其cDNA序列具有至少75%序列同一性。[62]段61的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:3的成熟多肽编码序列,或其cDNA序列具有至少80%序列同一性。[63]段62的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:3的成熟多肽编码序列,或其cDNA序列具有至少85%序列同一性。[64]段63的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:3的成熟多肽编码序列,或其cDNA序列具有至少90%序列同一性。[65]段64的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:3的成熟多肽编码序列,或其cDNA序列具有至少95%序列同一性。[66]段65的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:3的成熟多肽编码序列,或其cDNA序列具有至少97%序列同一性。[67]段I的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:17的成熟多肽编码序列,或其cDNA序列具有至少70%序列同一性。[68]段67的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:17的成熟多肽编码序列,或其cDNA序列具有至少75%序列同一性。[69]段68的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDN0:17的成熟多肽编码序列,或其cDNA序列具有至少80%序列同一性。[70]段69的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDN0:17的成熟多肽编码序列,或其cDNA序列具有至少85%序列同一性。[71]段70的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDN0:17的成熟多肽编码序列,或其cDNA序列具有至少90%序列同一性。[72]段71的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:17的成熟多肽编码序列,或其cDNA序列具有至少95%序列同一性。[73]段72的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDN0:17的成熟多肽编码序列,或其cDNA序列具有至少97%序列同一性。[74]段I的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:9,SEQIDN0:15,或SEQIDN0:21的成熟多肽编码序列,或其cDNA序列具有至少75%序列同一性。[75]段74的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:9,SEQIDN0:15,或SEQIDN0:21的成熟多肽编码序列,或其cDNA序列具有至少80%序列同一性。[76]段75的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:9,SEQIDN0:15,或SEQIDN0:21的成熟多肽编码序列,或其cDNA序列具有至少85%序列同一性。[77]段76的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:9,SEQIDN0:15,或SEQIDN0:21的成熟多肽编码序列,或其cDNA序列具有至少90%序列同一性。[78]段77的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:9,SEQIDN0:15,或SEQIDN0:21的成熟多肽编码序列,或其cDNA序列具有至少95%序列同一性。[79]段78的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:9,SEQIDNO:15,或SEQIDN0:21的成熟多肽编码序列,或其cDNA序列具有至少97%序列同一性。[80]段I的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDN0:7的成熟多肽编码序列,或其cDNA序列具有至少80%序列同一性。[81]段80的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:7的成熟多肽编码序列,或其cDNA序列具有至少85%序列同一性。[82]段81的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:7的成熟多肽编码序列,或其cDNA序列具有至少90%序列同一性。[83]段82的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:7的成熟多肽编码序列,或其cDNA序列具有至少95%序列同一性。[84]段83的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:7的成熟多肽编码序列,或其cDNA序列具有至少97%序列同一性。[85]段I的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:13的成熟多肽编码序列,或其cDNA序列具有至少85%序列同一性。[86]段85的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDN0:13的成熟多肽编码序列,或其cDNA序列具有至少90%序列同一性。[87]段86的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDN0:13的成熟多肽编码序列,或其cDNA序列具有至少95%序列同一性。[88]段87的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDN0:13的成熟多肽编码序列,或其cDNA序列具有至少97%序列同一性。[89]段I的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDNO:19的成熟多肽编码序列,或其cDNA序列具有至少90%序列同一性。[90]段89的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDN0:19的成熟多肽编码序列,或其cDNA序列具有至少95%序列同一性。[91]段90的多肽,其由多核苷酸编码,所述多核苷酸与SEQIDN0:19的成熟多肽编码序列,或其cDNA序列具有至少97%序列同一性。[92]段1-91任一项的多肽,包含或组成为SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,或SEQIDNO:22。[93]段1-91任一项的多肽,包含或组成为SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,或SEQIDNO:22的成熟多肽。[94]段93的多肽,其中所述成熟多肽是SEQIDNO:2的氨基酸18至246,SEQIDNO:4的氨基酸20至334,SEQIDNO:6的氨基酸18至227,SEQIDN0:8的氨基酸20至223,SEQIDNO:10的氨基酸22至368,SEQIDNO:12的氨基酸25至330,SEQIDNO:14的氨基酸17至236,SEQIDNO:16的氨基酸19至250,SEQIDNO:18的氨基酸23至478,SEQIDNO:20的氨基酸17至230,或SEQIDNO:22的氨基酸20至257。[95]段I的多肽,其为SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,或SEQIDNO:22的片段,其中所述片段具有纤维素分解增强活性。[96]段I的多肽,其由多核苷酸编码,所述多核苷酸包含于pSMai216,其包含于大肠杆菌NRRLB-50301;所述多核苷酸包含于pSMai217,其包含于大肠杆菌NRRLB-50302;所述多核苷酸包含于pSMai218,其包含于大肠杆菌NRRLB-50303;所述多核苷酸包含于pSMai213,其包含于大肠杆菌NRRLB-50300;所述多核苷酸包含于pAG68,其包含于大肠杆菌NRRLB-50320;所述多核苷酸包含于pAG69,其包含于大肠杆菌NRRLB-50321;所述多核苷酸包含于PAG75,其包含于大肠杆菌NRRLB-50322;所述多核苷酸包含于pAG76,其包含于大肠杆菌NRRLB-50323;所述多核苷酸包含于pAG77,其包含于大肠杆菌NRRLB-50324;所述多核苷酸包含于PAG78,其包含于大肠杆菌NRRLB-50325;或所述多核苷酸包含于pAG79,其包含于大肠杆菌NRRLB-50326。[97]一种组合物,其包含段1-96任一项的多肽。[98]一种分离的多核苷酸,其编码段1-96任一项的多肽。[99]一种核酸构建体或表达载体,其包含段98的多核苷酸,所述多核苷酸可操作地连接于一个或多个(几个)调控序列,所述调控序列指导所述多肽在表达宿主中的产生。[100]一种重组宿主细胞,其包含段98的多核苷酸,所述多核苷酸可操作地连接于一个或多个调控序列,所述调控序列指导所述多肽的产生。[101]一种产生段1-96任一项的多肽的方法,其包括(a)在有助于所述多肽产生的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。[102]一种产生具有纤维素分解增强活性的多肽的方法,其包括(a)在有助于所述多肽产生的条件下培养包含段98的多核苷酸的重组宿主细胞;和(b)回收所述多肽。[103]一种转基因植物、植物部分或植物细胞,其用编码段1-96任一项的多肽的多核苷酸转化。[104]一种产生具有纤维素分解增强活性的多肽的方法,其包括(a)在有助于所述多肽产生的条件下培养段103的转基因植物或植物细胞;和(b)回收所述多肽。[105]一种产生亲本细胞的突变体的方法,包括使编码段1-96任一项的多肽的多核苷酸失活,其导致所述突变体与亲本细胞相比较产生较少的多肽。[106]一种突变体细胞,其由段105的方法产生。[107]段106的突变体细胞,进一步包含编码天然或异源蛋白的基因。[108]一种产生蛋白的方法,其包括(a)在有助于所述蛋白产生的条件下培养段106或107的突变体细胞;和(b)回收所述蛋白。[109]一种双链抑制RNA(dsRNA)分子,其包含段98的多核苷酸的亚序列,其中dsRNA任选地为siRNA或miRNA分子。[110]段109的双链抑制RNA(dsRNA)分子,其为长约15、16、17、18、19、20、21、22、23、24、25或更长的双链体核苷酸。[111]一种抑制具有纤维素分解增强活性的多肽在细胞中表达的方法,其包括对细胞施用或在细胞中表达段109或110的双链RNA(dsRNA)分子。[112]一种通过段111的方法产生的细胞[113]段111的细胞,进一步包含编码天然或异源蛋白的基因。[114]一种产生蛋白的方法,其包括(a)在有助于蛋白产生的条件下培养段112或113的细胞;和(b)回收所述蛋白。[115]一种分离的多核苷酸,其编码信号肽,所述信号肽包含或组成为SEQIDNO:2的氨基酸I至17,SEQIDNO:4的氨基酸I至19,SEQIDNO:6的氨基酸I至17,SEQIDNO:8的氨基酸I至19,SEQIDNO:10的氨基酸I至21,SEQIDNO:12的氨基酸I至24,SEQIDNO:14的氨基酸I至16,SEQIDNO:16的氨基酸I至18,SEQIDNO:18的氨基酸I至22,SEQIDNO:20的氨基酸I至16,或SEQIDNO:22的氨基酸I至19。[116]一种核酸构建体或表达载体,其包含编码蛋白的基因,所述基因可操作地连接于段115的多核苷酸,其中所述基因对于编码信号肽的多核苷酸是外源的。[117]一种重组宿主细胞,其包含段115的多核苷酸,其中所述基因对于编码信号肽的多核苷酸是外源的。[118]一种产生蛋白的方法,其包括(a)在有助于所述蛋白产生的条件下培养包含段115的多核苷酸的重组宿主细胞,其中所述基因对于编码信号肽的多核苷酸是外源的;和(b)回收所述蛋白。[119]一种用于降解或转化纤维素材料的方法,其包括在段1-96任一项的具有纤维素分解增强活性的多肽的存在下用酶组合物处理所述纤维素材料。[120]段119的方法,其中所述纤维素材料经预处理。[121]段119或120的方法,其中所述酶组合物包含一种或多种(几种)选自下组的酶纤维素酶、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。[122]段121的方法,其中所述纤维素酶是一种或多种(几种)选自下组的酶内切葡聚糖酶、纤维二糖水解酶和3-葡糖苷酶。[123]段121的方法,其中所述半纤维素酶是一种或多种(几种)选自下组的酶木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。[124]段119-123任一项的方法,进一步包括回收经降解的纤维素材料。[125]段124的方法,其中所述经降解的材料是糖。[126]段125的方法,其中所述糖选自下组葡萄糖、木糖、甘露糖、半乳糖和阿拉伯糖。[127]一种用于产生发酵产物的方法,包括(a)在段1_96任一项具有纤维素分解增强活性的多肽的存在下用酶组合物糖化纤维素材料;(b)用一种或多种发酵微生物发酵糖化的纤维素材料以产生发酵产物;和(C)从发酵回收所述发酵产物。[128]段127的方法,其中所述纤维素材料经预处理。[129]段127或128的方法,其中所述酶组合物包含一种或多种(几种)选自下组的酶纤维素酶、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。[130]段129的方法,其中所述纤维素酶是一种或多种(几种)选自下组的酶内切葡聚糖酶、纤维二糖水解酶和3-葡糖苷酶。[131]段129的方法,其中所述半纤维素酶是一种或多种(几种)选自下组的酶木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。[132]段127-131任一项的方法,其中步骤(a)和(b)在同时糖化和发酵中同时进行。[133]段127-132任一项的方法,其中发酵产物是醇、有机酸、酮、氨基酸或气体。[134]一种发酵纤维素材料的方法,包括用一种或多种发酵微生物发酵所述纤维素材料,其中所述纤维素材料经在段1-96任一项的具有纤维素分解增强活性的多肽的存在下用酶组合物的糖化。[135]段134的方法,其中所述纤维素材料的发酵产生发酵产物。[136]段135的方法,进一步包括从发酵回收发酵产物。[137]段134-136任一项的方法,其中所述纤维素材料在糖化之前经预处理。[138]段134-137任一项的方法,其中所述酶组合物包含一种或多种(几种)选自下组的酶纤维素酶、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。[139]段138的方法,其中所述纤维素酶是一种或多种(几种)选自下组的酶内切葡聚糖酶、纤维二糖水解酶和3-葡糖苷酶。[140]段138的方法,其中所述半纤维素酶是一种或多种(几种)选自下组的酶木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。[141]段134-140任一项的方法,其中发酵产物是醇、有机酸、酮、氨基酸或气体。[142]一种洗涤剂组合物,其包含段1-96任一项的多肽,和表面活性剂。[143]段142的组合物,进一步包含一种或多种(几种)选自下组的酶淀粉酶、阿拉伯糖酶、糖酶、纤维素酶、角质酶、半乳聚糖酶、半纤维素酶、漆酶、脂质酶、甘露聚糖酶、氧化酶、果胶酶、蛋白酶和木聚糖酶。[144]段142或143的方法,其配制为棒型或条形剂(bar)、片剂、散剂、颗粒剂、糊剂或液体。[145]一种用于清理或洗涤硬表面或衣物的方法,所述方法包括将所述硬表面或所述引物与段142-144任一项的组合物相接触。本文描述和要求保护的本发明并不局限于本文公开的具体方面的范围内,因为这些方面旨在作为本发明几个方面的说明。旨在将任何等同的方面包含于本发明的范围内。实际上,从前面的说明中,除本文所显示和描述的之外,本发明的多种修改对于本领域的技术人员来说是显而易见的。这些修改也旨在落入所附的权利要求的范围内。在冲突的情况下,将以包括定义部分的本公开为准。权利要求1.一种分离的多肽,其具有纤维素分解增强活性,选自下组(a)多肽其具有与SEQIDNO:2,SEQIDN0:6,或SEQIDNO:12的成熟多肽至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;与SEQIDNO:4的成熟多肽至少65%,例如,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;与SEQIDNO:18的成熟多肽至少70%,例如,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;与SEQIDNO:10,SEQIDNO:16,或SEQIDNO:22的成熟多肽至少75%,例如,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;与SEQIDNO:8的成熟多肽至少80%,例如,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;与SEQIDNO:14的成熟多肽至少85%,例如,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;或者与SEQIDNO:20的成熟多肽至少90%,例如,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一I"生;(b)多肽,其由多核苷酸编码,所述多核苷酸在中等-高,高或非常高严格条件下与以下杂交(i)SEQIDNO:1,SEQIDNO:3,SEQIDNO:5,SEQIDNO:11,或SEQIDNO:17的成熟多肽编码序列,(ii)包含于SEQIDNO:1,SEQIDNO:3,SEQIDNO:5,SEQIDNO:11,或SEQIDNO:17的成熟多肽编码序列中的cDNA序列,或(iii)⑴或(ii)的全长互补链;在高或非常高严格条件下与以下杂交(i)SEQIDNO:7,SEQIDNO:9,SEQIDNO:13,SEQIDNO:15,或SEQIDN0:21的成熟多肽编码序列,(ii)包含于SEQIDNO:7,SEQIDNO:9,SEQIDNO:13,SEQIDNO:15,或SEQIDN0:21的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;或者在非常高严格条件下与以下杂交i)SEQIDNO:19的成熟多肽编码序列,(ii)包含于SEQIDNO:19的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;(c)一种多肽,其由多核苷酸编码,所述多核苷酸具有与SEQIDN0:1,SEQIDN0:5,或SEQIDNO:11的成熟多肽编码序列至少60%,至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;与SEQIDNO:3的成熟多肽编码序列至少65%,例如,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;与SEQIDNO:17的成熟多肽编码序列至少70%,例如,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;与SEQIDNO:9,SEQIDNO:15,或SEQIDNO:21的成熟多肽编码序列至少75%,例如,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性’与SEQIDNO:7的成熟多肽编码序列至少80%,例如,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;与SEQIDNO:13的成熟多肽编码序列至少85%,例如,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性;或者与SEQIDNO:19的成熟多肽编码序列至少90%,例如,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;或其cDNA序列;(d)变体,其包含SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDN0:20,或SEQIDNO:22的成熟多肽的一个或多个(几个)氨基酸的取代,缺失,和/或插入;和(e)(a),(b),(c),或(d)的多肽具有纤维素分解增强活性的片段。2.权利要求I的多肽,其由多核苷酸编码,所述多核苷酸包含于pSMai216,其包含于大肠杆菌NRRLB-50301;所述多核苷酸包含于pSMai217,其包含于大肠杆菌NRRLB-50302;所述多核苷酸包含于pSMai218,其包含于大肠杆菌NRRLB-50303;所述多核苷酸包含于pSMai213,其包含于大肠杆菌NRRLB-50300;所述多核苷酸包含于pAG68,其包含于大肠杆菌NRRLB-50320;所述多核苷酸包含于pAG69,其包含于大肠杆菌NRRLB-50321;所述多核苷酸包含于PAG75,其包含于大肠杆菌NRRLB-50322;所述多核苷酸包含于pAG76,其包含于大肠杆菌NRRLB-50323;所述多核苷酸包含于pAG77,其包含于大肠杆菌NRRLB-50324;所述多核苷酸包含于PAG78,其包含于大肠杆菌NRRLB-50325;或所述多核苷酸包含于pAG79,其包含于大肠杆菌NRRLB-50326。3.一种组合物,其包含权利要求I或2的多肽。4.一种分离的多核苷酸,其编码权利要求I或2的多肽。5.一种重组宿主细胞,其包含权利要求4的多核苷酸,所述多核苷酸可操作地连接于一个或多个调控序列,所述调控序列指导所述多肽在表达宿主中的产生。6.—种产生权利要求I或2的多肽的方法,其包括(a)在有助于所述多肽产生的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。7.—种产生具有纤维素分解增强活性的多肽的方法,其包括(a)在有助于所述多肽产生的条件下培养包含权利要求4的多核苷酸的重组宿主细胞;和(b)回收所述多肽。8.—种转基因植物、植物部分或植物细胞,其用编码权利要求I或2的多肽的多核苷酸转化。9.一种产生具有纤维素分解增强活性的多肽的方法,其包括(a)在有助于所述多肽产生的条件下培养权利要求8的转基因植物或植物细胞;和(b)回收所述多肽。10.一种产生亲本细胞的突变体的方法,包括使编码权利要求I或2的多肽的多核苷酸失活,其导致所述突变体与亲本细胞相比较产生较少的多肽。11.一种双链抑制RNA(dsRNA)分子,其包含权利要求4的多核苷酸的亚序列,其中dsRNA任选地为siRNA或miRNA分子。12.—种抑制具有纤维素分解增强活性的多肽在细胞中表达的方法,其包括对细胞施用或在细胞中表达权利要求11的双链抑制RNA(dsRNA)分子。13.一种分离的多核苷酸,其编码信号肽,所述信号肽包含或组成为SEQIDNO:2的氨基酸I至17,SEQIDNO:4的氨基酸I至19,SEQIDNO:6的氨基酸I至17,SEQIDNO:8的氨基酸I至19,SEQIDNO:10的氨基酸I至21,SEQIDNO:12的氨基酸I至24,SEQIDNO:14的氨基酸I至16,SEQIDNO:16的氨基酸I至18,SEQIDNO:18的氨基酸I至22,SEQIDNO:20的氨基酸I至16,或SEQIDNO:22的氨基酸I至19。14.一种产生蛋白的方法,其包括(a)在有助于所述蛋白产生的条件下培养包含权利要求13的多核苷酸的重组宿主细胞,其中所述基因对于编码信号肽的多核苷酸是外源的;和(b)回收所述蛋白。15.一种用于降解或转化纤维素材料的方法,其包括在权利要求I或2的具有纤维素分解增强活性的多肽的存在下用酶组合物处理所述纤维素材料。16.权利要求15的方法,进一步包括回收经降解的纤维素材料。17.一种用于产生发酵产物的方法,包括(a)在权利要求I或2的具有纤维素分解增强活性的多肽的存在下用酶组合物糖化纤维素材料;(b)用一种或多种发酵微生物发酵糖化的纤维素材料以产生发酵产物;和(C)从发酵回收所述发酵产物。18.—种发酵纤维素材料的方法,包括用一种或多种发酵微生物发酵所述纤维素材料,其中所述纤维素材料经在权利要求I或2的具有纤维素分解增强活性的多肽的存在下用酶组合物的糖化。19.权利要求18的方法,其中所述纤维素材料的发酵产生发酵产物。20.权利要求19的方法,进一步包括从发酵回收发酵产物。21.一种洗涤剂组合物,其包含权利要求I或2的多肽,和表面活性剂。全文摘要本发明涉及具有纤维素分解增强活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞以及产生和使用所述多肽的方法。文档编号C11D3/386GK102770534SQ201080052019公开日2012年11月7日申请日期2010年9月16日优先权日2009年9月17日发明者P.哈里斯,R.克雷默,S.梅于兰申请人:诺维信股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1