专利名称::具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸的制作方法具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸涉及序列表本申请含有计算机可读形式的序列表。将所述计算机可读形式通过提述并入本文。发明背景发明领域本发明涉及具有葡糖苷酶活性的分离的多肽和编码该多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及产生和使用所述多肽的方法。相关技术描述纤维素是单糖葡萄糖通过β_1,4-键连接的聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。内切葡聚糖酶在随机位置消化所述纤维素聚合物,使其开放以受到纤维二糖水解酶的攻击。纤维二糖水解酶按顺序自所述纤维素聚合物末端释放纤维二糖分子。纤维二糖是葡萄糖的水溶性β-1,4"连接的二聚体。β“葡糖苷酶将纤维二糖水解为葡萄糖。将纤维素原料转化为乙醇具有如下优点大量原料现成可得,期望避免焚烧或填埋所述材料,以及乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物已经被考虑作为供乙醇产生的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦纤维素转化为葡萄糖,葡萄糖即容易地由酵母发酵为乙醇。由于葡萄糖容易通过各种酵母发酵成乙醇,而纤维二糖则不能,因此在水解结束时残余的任何纤维二糖都代表着乙醇产量的损失。更重要的是,纤维二糖是内切葡聚糖酶和纤维二糖水解酶的强力抑制剂。纤维二糖在水解过程中的累积不利于乙醇生产。纤维二糖的累积在酶促水解中已经成为一个主要问题,因为产生纤维素酶的微生物可能几乎不产生β_葡糖苷酶。β_葡糖苷酶的量少导致将纤维二糖水解成葡萄糖的能力不足。已有几种方法用于在将纤维素转化成葡萄糖时增加β“葡糖苷酶的量。一种方案是使用几乎不产生纤维素酶的微生物产生葡糖苷酶,且向内切葡聚糖酶和纤维二糖水解酶外源添加β-葡糖苷酶,从而增强水解。第二种方案是在进行纤维素水解的同时通过酵母进行葡萄糖发酵。这个过程称为同步糖化和发酵(SSF)。在SSF系统中,葡萄糖发酵从溶液中除去了葡萄糖。然而SSF系统在商业上尚不可行,因为对于所需要的50°C条件而言,28°C的酵母操作温度太低了。克服β-葡糖苷酶不足的第三种方案是在宿主中过表达β-葡糖苷酶,从而增加β-葡糖苷酶的产量。J0rgensen等,2003,EnzymeandMicrobialTechnology32851-861,Thygesen等,2003,EnzymeandMicrobialTechnology32606-615,以及J0rgensen和Olsson,2006,EnzymeandMicrobialTechnology38381-390公开了来自巴西青霉(Penicilliumbrasilianum)IBT20888的纤维素降解酶。对本领域有利的是,提供具有改善性能的新型葡糖苷酶用于将纤维素材料转化成单糖、二糖、和多糖。本发明提供具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸。
发明内容本发明涉及选自下组的具有β“葡糖苷酶活性的分离的多肽(a)一种包含如下氨基酸序列的多肽,所述氨基酸序列包含与SEQIDNO2的氨基酸20到267的部分氨基酸序列具有至少75%同一性的部分氨基酸序列;(b)一种由包含如下核苷酸序列的多核苷酸编码的多肽,所述核苷酸序列包含在至少高严紧条件下与以下杂交的部分核苷酸序列(i)SEQIDNO:1的核苷酸58到1081的部分核苷酸序列,(ii)包含于SEQIDNO:1的核苷酸58到1081的部分核苷酸序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;(c)一种由包含如下核苷酸序列的多核苷酸编码的多肽,所述核苷酸序列包含与SEQIDNO1的核苷酸58到1081的部分核苷酸序列具有至少75%同一性的部分核苷酸序列;和(d)—种包含如下氨基酸序列的变体,所述氨基酸序列包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQIDNO2的氨基酸20到267的部分氨基酸序列。本发明还涉及选自下组的分离的多核苷酸,其编码具有葡糖苷酶活性的多肽(a)一种编码包含如下氨基酸序列的多肽的多核苷酸,所述氨基酸序列包含与SEQIDNO2的氨基酸20到267的部分氨基酸序列具有至少75%同一性的部分氨基酸序列;(b)一种包含如下核苷酸序列的多核苷酸,所述核苷酸序列包含在至少高严紧条件下与以下杂交的部分核苷酸序列(i)SEQIDNO1的核苷酸58到1081的部分核苷酸序列,(ii)包含于SEQIDNO1的核苷酸58到1081的部分核苷酸序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;(c)一种包含如下核苷酸序列的多核苷酸,所述核苷酸序列包含与SEQIDNO1的核苷酸58到1081的部分核苷酸序列具有至少75%同一性的部分核苷酸序列;和(d)一种编码包含如下氨基酸序列的变体的多核苷酸,所述氨基酸序列包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQIDNO2的氨基酸20到267的部分氨基酸序列。本发明还涉及包含所述多核苷酸的核酸构建体、重组表达载体、重组宿主细胞,和产生具有葡糖苷酶活性的多肽的方法。本发明还涉及抑制细胞中具有葡糖苷酶活性的多肽表达的方法,包括向所述细胞施用或在所述细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含本发明的多核苷酸的亚序列。本发明还涉及这样的双链抑制性RNA(dsRNA)分子,其中任选地所述dsRNA是siRNA或miRNA分子。本发明还涉及在纤维素转化为葡萄糖和各种物质中使用具有β-葡糖苷酶活性的多肽的方法。本发明还涉及包含编码具有葡糖苷酶活性的多肽的分离的多核苷酸的植物。本发明还涉及产生具有葡糖苷酶活性的多肽的方法,包括(a)在有益于所述多肽产生的条件下,培养转基因植物或植物细胞,所述转基因植物或植物细胞包含编码所述具有葡糖苷酶活性的多肽的多核苷酸;和(b)回收所述多肽。本发明另外还涉及编码信号肽的分离的多核苷酸,所述信号肽包含SEQIDNO2的氨基酸1到19或由SEQIDNO2的氨基酸1到19组成;还涉及包含所述多核苷酸的核酸构建体、表达载体和重组宿主细胞;以及产生蛋白质的方法。附图简述图1显示巴西青霉IBT20888家族3β-葡糖苷酶的部分基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO1和2)。定义β-葡糖苷酶术语“β-葡糖苷酶”在本文中定义为一种β-D-葡糖苷葡糖水解酶(E.C.3.2.1.21),其催化水解末端非还原性β-D-葡萄糖残基,并释放β-D-葡萄糖。就本发明而言,β-葡糖苷酶活性是根据Venturi等,2002,J.BasicMicrobiol.4255-66记载的基本方法来测定的,除非如本文所述使用了不同的条件。一个单位的葡糖苷酶活性定义为在50mM柠檬酸钠中,在25°C、pH4.8条件下每分钟从作为底物的ImM4-硝基苯基-β-D-吡喃葡萄糖苷产生1.0微摩尔4-硝基苯酚。如实施例中所述,亦可使用甲基_伞形酸葡糖苷(metro-umbelliferylglucoside)作为底物。本发明的多肽具有包含如下氨基酸序列的多肽的葡糖苷酶活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,以及甚至最优选至少100%,所述氨基酸序列包含SEQIDNO2的氨基酸20到267的部分氨基酸序列。内切葡聚糖酶术语“内切葡聚糖酶”在本文中定义为内-1,4-i3_D-葡聚糖4-葡聚糖水解酶(E.C.No.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣淀粉中的1,4-i3-D_糖苷联结,混合型β_1,3-葡聚糖如谷物β-D-葡聚糖或木葡聚糖,以及其他含有纤维素成分的植物材料中β-1,4-键的内水解。就本发明而言,内切葡聚糖酶活性使用羧甲基纤维素(CMC)水解根据Ghose,1987,PureandAppl.Chem.59257-268的方法加以确定。一单位内切葡聚糖酶活性定义为在50°C,pH4.8每分钟产生l.Oymol还原糖。纤维二糖水解酶术语“纤维二糖水解酶”在本文中定义为一种1,4-i3-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91),其催化水解纤维素、纤维寡糖、或任何含β-1,4_连接的葡萄糖的聚合物中1,4-β-D-葡糖苷联结,从链的还原端或非还原端释放纤维二糖。就本发明而言,纤维二糖水解酶活性是依照Lever等,1972,Anal.Biochem.47273-279禾ΠvanTilbeurgh等,1982,FEBSLetters149152-156;vanTilbeurgh和Claeyssens,1985,FEBSLetters187283-288记载的程序加以测定的。在本发明中,所述Lever等的方法用于估计玉米秸秆中纤维素的水解,而vanTilbeurgh等的方法用于依靠荧光性的二糖衍生物来确定纤维二糖水解酶活性。家族3糖苷水解酶或家族GH3或GH3术语“家族3糖苷水解酶”或“家族GH3,,或“GH3,,在本文中定义为根据HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280309—316,禾口HenrissatB.,andBairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316695-696归为糖苷水解酶家族3的多肽。家族61糖苷水解酶或家族61或GH61:术语“家族61糖苷水解酶”或“家族GH61”或“GH61”在本文中定义为根据HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280309-316,禾口HenrissatB.,andBairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695-696归为糖苷水解酶家族61的多肽。目前,Henrissat将GH61家族列为未分类的,这指明对属于该家族的多肽,如机理,催化性亲核体/碱以及催化性质子供体等性质尚在未知之数。纤维素材料生物质的初生细胞壁(primarycellwall)中主要的多糖是纤维素,第二丰富的是半纤维素,第三是果胶。在细胞停止生长后产生的次生细胞壁也含有多糖,并且通过与半纤维素共价交联的多聚体木质素而加强。纤维素是脱水纤维二糖的均聚物,并因此为直链β-(1_4)"0-葡聚糖,而半纤维素包括多种化合物,如木聚糖、木葡聚糖、阿拉伯木聚糖和甘露聚糖,具有复杂的分枝结构和一系列取代基。虽然纤维素通常是无定形的,但在植物组织中纤维素主要作为平行葡聚糖链的不溶性晶体基质存在。半纤维素通常通过氢键键合于纤维素以及其他半纤维素上,这有益于细胞壁基质的稳定化。纤维素材料可以是含有纤维素的任何材料。纤维素通常存在于例如植物的茎、叶、果/种壳(hulls)、果/种皮(husks)和穗轴(cobs),或者树的叶、枝、和木材等之中。纤维素材料可以是,但不限于,草本材料(herbaceousmaterial)、农业残余物(agriculturalresidues)、林业残余物(forestryresidues)、城市固体废物(municipalsolidwastes)、废纸(wastepaper),以及纸菜和造纸厂残余物(pulpandpapermillresidue)。纤维素材料可以是任何类型的生物质,包括但不限于木材资源、城市固体废物、废纸、作物和作物残余物(见例如Wiselogel等,1995,于HandbookonBioethanol(CharlesE.Wyman编),第105-118页,Taylor&Francis,WashingtonD.C.;Wyman,1994,BioresourceTechnology503-16;Lynd,1990,AppliedBiochemistryandBiotechnology24/25695-719;Mosier等,1999,RecentProgressinBioconversionofLignocellulosics,于AdvancesinBiochemicalEngineering/Biotechnology,T.Scheper主编,第65卷,第23—40页,Springer-Verlag,NewYork)。在本文中应当理解,纤维素可为木素纤维素的形式,即在混合的基质中包含木质素、纤维素和半纤维素的植物细胞壁材料。在一方面,所述纤维素材料为草本材料。在另一方面,所述纤维素材料为农业残余物。在另一方面,所述纤维素材料为林业残余物。在另一方面,所述纤维素材料为城市固体废物。在另一方面,所述纤维素材料为废纸。在另一方面,所述纤维素材料为纸浆和造纸厂残余物。在另一方面,所述纤维素材料为玉米秸秆。在另一优选的方面,所述纤维素材料为玉米纤维。在另一方面,所述纤维素材料为玉米穗轴。在另一方面,所述纤维素材7料为桔/橙皮。在另一方面,所述纤维素材料为稻草/秆。在另一方面,所述纤维素材料为麦秸。在另一方面,所述纤维素材料为柳枝稷(switchgrass)。在另一方面,所述纤维素材料为芒草属(miscanthus)。在另一方面,所述纤维素材料为甘蔗渣。纤维素材料可以直接使用,或者可以使用本领域已知的常规方法对其进行预处理。例如,物理预处理技术可包括各种类型的粉碎/磨制(milling)、辐射(irradiation)、汽蒸/蒸汽爆炸(steaming/steamexplosion)禾口/K热角军(hydrothermolysis);化学预处理技术可包括稀酸、碱、有机溶剂、氨、二氧化硫、二氧化碳、和pH受控的水热解;而生物预处理技术可涉及施用溶解木质素的微生物(参见,例如Hsu,T-A.,1996,Pretreatmentofbiomass,于HandbookonBioethanolProductionandUtilization,Wyman,C.Ε.编,Taylor&Francis,Washington,DC,179-212;Ghosh,P.禾ΠSingh,Α.,1993,Physicochemicalandbiologicaltreatmentsforenzymatic/microbialconversionoflignocellulosicbiomass,Adv.Appl.Microbiol.39295-333;McMillan,J.D.,1994,Pretreatinglignocellulosicbiomassareview,于EnzymaticConversionofBiomassforFuelsProduction,Himmel,M.E.,Baker,J.O.禾口Overend,R.P.编,ACSSymposiumSeries566,AmericanChemicalSociety,Washington,DC,第15章;Gong,C.S.,Cao,N.J.,Du,J.禾口Tsao,G.T.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.编,Springer-VerlagBerlinHeidelberg,Germany,65207-241;Olsson,L.和Hahn-Hagerdal,B.,1996,Fermentationoflignocellulosichydrolysatesforethanolproduction,Enz.Microb.Trch.18312-331;禾口Vallander,L.禾口Eriksson,K.-E.L.,1990,ProductionofethanolfromlignocellulosicmaterialsStateoftheart,Adv.Biochem.Eng./Biotechnol.4263-95)。预处理玉米秸秆术语“PCS”或“预处理的玉米秸秆”在本文中定义为通过用热和稀酸处理源自玉米秸秆的纤维素材料。分离的多肽术语“分离的多肽”用于本文中指从来源分离的多肽。在一个优选的方面,如通过SDS-PAGE测定的,所述多肽为至少纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,并且最优选至少90%纯。基本上纯的多肽术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备物含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然或重组结合(associated)的其他多肽材料。因此,优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%纯,最优选至少99.5%纯,并且甚至最优选100%纯。本发明的多肽优选是基本上纯的形式(substantiallypureform),即所述多肽制备物基本上(essentially)不含与其天然或重组结合的其他多肽材料。例如,这能够通过如下实现通过公知的重组方法或通过经典纯化方法制备多肽。成熟多肽术语“成熟多肽”在本文中定义为以其在翻译和任何翻译后修饰(如N-末端加工、C-末端截断断、糖基化、磷酸化等)之后的最终形式存在的具有葡糖苷酶活性的多肽。成熟多肽编码序列术语“成熟多肽编码序列”在本文中定义为编码具有β"葡糖苷酶活性的成熟多肽的核苷酸序列。同一性两个氨基酸序列之间或两个核苷酸序列之间的相关性由参数“同一性”来描述。就本发明而言,两个氨基酸序列之间的同一性程度是使用如EMBOSS程序包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsinGenetics16276-277)(优选版本3.0.0或更新的版本)的Needle程序中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48443-453)来测定的。使用的可选参数是缺口产生罚分(gapopenpenalty)为10,缺口延伸罚分为0.5,和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作百分比同一性并且是如下计算的(相同的残基xlOO)/(比对的长度-比对中的缺口总数)就本发明而言,两个脱氧核糖核苷酸序列之间的同一性程度使用如EMBOSS程序包(EMBOSSTheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,见上)(优选版本3.0.0或更新的版本)的Needle程序中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上)测定。使用的可选参数是缺口产生罚分为10,缺口延伸罚分为0.5,禾ΠEDNAFULL(NCBINUC4.4的EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作百分比同一性并且是如下计算的(相同的脱氧核糖核苷酸χ100)/(比对的长度_比对中的缺口总数)同源序列术语“同源序列”在本文中定义为用SEQIDN0:2的氨基酸20到267的部分氨基酸序列,在tfasty检索(Pearson,W.R.,1999,于BioinformaticsMethodsandProtocols,S.Misener和S.A.Krawetz编,185-219页)中给出小于0.001的E值(或预期分数)的预测蛋白质。多肽片段术语“多肽片段”在本文定义为从包含SEQIDNO:2的氨基酸20到267的部分氨基酸序列的氨基酸序列或其同源序列的氨基和/或羧基末端缺失了一个或多个(几个)氨基酸的多肽;其中所述片段具有葡糖苷酶活性。亚序列术语“亚序列(subsequence)”在本文中定义为从包含SEQIDNO1的核苷酸58到1081的部分核苷酸序列的核苷酸序列或其同源序列的5'和/或3'端缺失了一个或多个(几个)核苷酸的核苷酸序列;其中所述亚序列编码具有葡糖苷酶活性的多肽片段。等位变体(allelicvariant)术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。分离的多核苷酸术语“分离的多核苷酸”用于本文中指从来源分离的多核苷酸。在一个优选的方面,如通过琼脂糖电泳测定的,所述多核苷酸为至少纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少960%纯,甚至更优选至少80%纯,并且最优选至少90%纯。基本上纯的多核苷酸术语“基本上纯的多核苷酸”用于本文指多核苷酸制备物,其不含其他外来的或不期望的核苷酸,并且处于适合于在遗传工程蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然或重组结合的其他多核苷酸材料。然而,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%纯,并且甚至最优选至少99.5%纯的。本发明的多核苷酸优选为基本上纯的形式,即所述多核苷酸制备物基本上(essentially)不含与其天然或重组结合的其他多核苷酸材料。所述多核苷酸可以是基因组、cDNA、RNA,半合成、合成来源的,或它们的任何组合。编码序列当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定,所述开读框通常以ATG起始密码子或可供选择的起始密码子如GTG和TTG开始,并且以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的或重组的核苷酸序列。cDNA术语“cDNA”在本文中定义为能够通过反转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少可能存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自mRNA的cDNA没有任何内含子序列。核酸构建体术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分子分离自天然存在的基因,或将所述核酸分子经修饰而以本来不存在于(nototherwiseexist)自然界中的方式含有核酸的区段,或所述核酸分子是合成的。当核酸构建体含有表达本发明的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。调控序列(controlsequence)术语“调控序列”在本文定义为包括对编码本发明多肽的多核苷酸表达是必需的所有组分。各个调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的,或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。可操作地连接术语“可操作地连接”在本文表示这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的适当位置,使得调控序列指导多肽编码序列的表达。表达术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。表达载体术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。宿主细胞如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。修饰术语“修饰”在本文的意思是,对包含如下氨基酸序列的多肽或包含其同源序列的多肽的任何化学修饰,所述氨基酸序列包含SEQIDNO:2的氨基酸20到267的部分氨基酸序列,以及对编码这样的多肽的DNA的遗传操作。所述修饰可以是一个或多个(几个)氨基酸的取代、缺失和/或插入,以及一个或多个(几个)氨基酸侧链的置换。人工变体当用在本文时,术语“人工变体”的意思是具有葡糖苷酶活性的多肽,所述多肽由表达包含如下核苷酸序列的修饰的多核苷酸序列或其同源序列的生物体产生,所述核苷酸序列包含SEQIDNO:1的核苷酸58到1081的部分核苷酸序列。所述修饰的核苷酸序列通过人为干预(humanintervention),通过修饰包含SEQIDNO1的核苷酸58到1081的部分核苷酸序列的多核苷酸序列或其同源序列来获得。发明详述具有β_葡糖苷酶活性的多肽在第一个方面,本发明涉及包含如下氨基酸序列的分离的多肽,所述氨基酸序列包含与SEQIDNO2的氨基酸20到267的部分氨基酸序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、至少97%、至少98%或至少99%的同一性程度的部分氨基酸序列,所述多肽具有葡糖苷酶活性(下文中的“同源多肽”)。在一个优选的方面,所述同源多肽包含的氨基酸序列包含与SEQIDNO2的氨基酸20到267的部分氨基酸序列相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸的部分氨基酸序列。在一个优选的方面,所述多肽包含如下的氨基酸序列,所述氨基酸序列包含SEQIDNO2的氨基酸20到267的部分氨基酸序列,或其等位变体,或其具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含如下的氨基酸序列,所述氨基酸序列包含SEQIDNO2的氨基酸20到267的部分氨基酸序列。在第二个方面,本发明涉及具有葡糖苷酶活性的分离的多肽,其由包含如下核苷酸序列的多核苷酸编码,所述核苷酸序列包含部分核苷酸序列,所述部分核苷酸序列在优选非常低严紧条件、更优选低严紧条件、更优选中严紧条件、更优选中-高严紧条件、甚至更优选高严紧条件、和最优选非常高严紧条件下与下列杂交(i)SEQIDNO:1的核苷酸58到1081的部分核苷酸序列,(ii)包含于SEQIDNO1的核苷酸58到1081的部分核苷酸序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch禾口T.Maniatis,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。SEQIDNO1的核苷酸58到1081的部分核苷酸序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可以编码具有β-葡糖苷酶活性的多肽片段。在一个优选的方面,所述互补链是SEQIDNO1的核苷酸58到1081的部分核苷酸序列的全长互补链。SEQIDNO1的核苷酸58到1081的核苷酸序列或其亚序列;以及SEQIDNO2的氨基酸20到267的氨基酸序列或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有葡糖苷酶活性的多肽的DNA。具体而言,可将这些探针用于根据标准的Southern印迹方法与感兴趣的属或种的基因组或cDNA杂交,以从其中鉴定并分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少14个,优选至少25个,更优选至少35个,并且最优选至少70个核苷酸。然而,优选所述核酸探针长度上是至少100个核苷酸。例如,所述核酸探针长度上可以是至少200个核苷酸。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如,用32p、3H、35S、生物素或抗生物素蛋白(avidin)标记)。将这些探针包含于本发明中。因而,可从由这些其他菌株制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码具有葡糖苷酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其他分离技术分离来自这些其他菌株的基因组或其他DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其他合适的载体材料并且固定于其上。为了鉴定与SEQIDNO1的核苷酸58到1081或其亚序列同源的克隆或DNA,将所述载体材料优选用在Scmnthem印迹中。就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQIDNO:1的核苷酸58到1081的部分核苷酸序列;包含于SEQIDNO1的核苷酸58到1081的部分核苷酸序列中的cDNA序列;其全长互补链;或其亚序列。可使用例如X射线片(X-rayfilm)检测在这些条件下与核酸探针杂交的分子。在一个优选的方面,核酸探针是SEQIDNO1的核苷酸58到1081的部分核苷酸序列或其亚序列。在另一优选的方面,核酸探针是SEQIDNO:1的核苷酸58到1081的部分核苷酸序列。在另一优选的方面,核酸探针是编码SEQIDNO2的氨基酸20到267的部分氨基酸序列的核苷酸序列或其亚序列。在另一优选的方面,核酸探针是编码SEQIDNO2的氨基酸20到267的部分氨基酸序列的核苷酸序列。对于长度为至少100个核苷酸的长探针,将非常低至非常高严紧条件定义为在5XSSPE、0.3%SDS>200μg/ml经剪切并且变性的鲑精DNA以及对于非常低和低严紧性25%甲酰胺、对于中和中-高严紧性35%甲酰胺或对于高和非常高严紧性50%甲酰胺中在42°C根据标准Southern印迹步骤预杂交和杂交最佳12至24小时。对于长度为至少100个核苷酸的长探针,使用2XSSC、0.2%SDS优选在45°C(非常低严紧性),更优选在50°C(低严紧性),更优选在55°C(中严紧性),更优选在60°C(中-高严紧性),甚至更优选在65°C(高严紧性),并且最优选在70°C(非常高严紧性)将载体材料最终洗涤三次,每次15分钟。对于长度约15个核苷酸至约70个核苷酸的短探针,将严紧条件定义为在比使用根据Bolton禾ΠMcCarthy计算法(1962,ProceedingsoftheNationalAcademyofSciencesUSA481390)计算得出的Tm低约5°C至约10°C,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,IXDenhardt溶液,ImM焦磷酸钠(sodiumpyrophosphate),ImM磷酸二氢钠(sodiummonobasicphosphate),0.ImMATP和0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小时。对于长度约15个核苷酸至约70个核苷酸的短探针,将所述载体材料在6XSSC加0.1%SDS中洗涤一次15分钟,并用6XSSC在比计算得出的T1JS5°C至10°C的温度洗涤两次,每次15分钟。在第三个方面,本发明涉及由如下多核苷酸编码的具有葡糖苷酶活性的分离的多肽,所述多核苷酸包含如下核苷酸序列,所述核苷酸序列包含与SEQIDNO:1的核苷酸58到1081的部分核苷酸序列具有优选至少60%、更优选至少65%、更优选至少70%,更优选至少75%、更优选至少80%、更优选至少85%、甚至更优选至少90%、最优选至少95%、并且甚至最优选至少96%、至少97%、至少98%、或至少99%同一性程度的部分核苷酸序列,其编码具有葡糖苷酶活性的多肽。参见本文多核苷酸部分。在第四个方面,本发明涉及包含如下氨基酸序列的人工变体,所述氨基酸序列在SEQIDNO2的氨基酸20到267的部分氨基酸序列或其同源序列中包含一个或多个(或几个)氨基酸的取代、缺失和/或插入。优选地,氨基酸改变对性质是较不重要的(ofaminornature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至约30个氨基酸的小缺失;小的氨基或羧基末端延伸,如氨基末端甲硫氨酸残基;多至约20-25个残基的小接头肽;或通过改变净电荷或其他功能来促进纯化的小延伸,如多组氨酸序列(poly-histidinetract)、抗原表位(antigenicepitope)或结合域(bindingdomain)。保守取代的实例是在以下组之内碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specificactivity)的氨基酸取代是本领域已知的,并且由例如H.Neurath和R.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn>Ala/VaLSer/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn>Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。除了20个基本氨基酸,非基本氨基酸(如4-羟脯氨酸、6-N-甲基赖氨酸、2_氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上可得到的,包括六氢吡啶羧酸(pipecolicacid)、噻唑烷羧酸(thiazolidinecarboxylicacid)、脱氢脯氨酸、3-和4_甲基脯氨酸,和3,3-二甲基脯氨酸。可供选择的是,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适pH等。能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science2441081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的生物活性(即,葡糖苷酶活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.2714699-4708。酶的活性部位或其他的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术来测定如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变。参见例如deVos等,1992,Science255306—312;Smith等,1992,J.Mol.Biol.224899—904;Wlodaver等,1992,FEBSLett.309:59-64。必需氨基酸的身份(identity)也能够从与多肽的同一性分析来推断,所述多肽与根据本发明的多肽相关。能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,例如那些由Reidhaar-Olson和Sauer,1988,Science24153-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA862152-2156;WO95/17413;或W095/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失、和/或插入。能够使用的其他方法包括易错PCR、噬菌体展示(例如,Lowman等,1991,Biochem.3010832-10837;美国专利5,223,409号;WO92/06204)和区域定向的诱变(Derbyshire等,1986,Gene46:145;Ner等,1988,DNA7127)。诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,NatureBiotechnology17893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多肽。SEQIDNO2的氨基酸20到267的部分氨基酸序列的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。具有β_葡糖苷酶活性的多肽的来源本发明的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思是核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。在一个优选的方面,获得自给定来源的多肽是胞外分泌的。本发明具有葡糖苷酶活性的多肽可以是细菌多肽。例如,所述多肽可以是革兰氏阳性细菌多肽如芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或海洋芽孢杆菌属(Oceanobacillus)多肽,所述多肽具有β-葡糖苷酶活性;或革兰氏阴性细菌多肽,如大肠杆菌、假单胞菌属(Peudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)多肽,所述多肽具有β-葡糖苷酶活性。在一个优选的方面,所述多肽是具有β-葡糖苷酶活性的嗜碱芽孢杆菌(Bacillus14alkalophilus)、角军淀粉芽孢杆菌(Bacillusamyloliquefaciens)、短芽孢杆菌(Bacillusbrevis)>环状芽孢杆菌(Bacilluscirculans)、克劳氏芽孢杆菌(Bacillusclausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillusfirmus)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacilluslentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillusmegaterium)、短小芽孢杆菌(Bacilluspumilus)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、才古草芽孢杆菌(Bacillussubtilis)或苏云金芽孢杆菌(Bacillusthuringiensis)多肽。在另一个优选的方面,所述多肽是具有葡糖苷酶活性的似马链球菌(Streptococcusequisimilis)、酉良脓链球菌(Streptococcuspyogenes)、乳房链球菌(Streptococcusuberis)或马链球菌兽癌亚禾中(Streptococcusequisubsp.Zooepidemicus)多肽。在另一个优选的方面,所述多肽是具有β-葡糖苷酶活性的不产色链霉菌(Streptomycesachromogenes)、除虫链霉菌(Streptomycesavermitilis)、天蓝链霉菌(Streptomycescoelicolor)、灰色链霉菌(Streptomycesgriseus)或浅青紫链霉菌(Streptomyceslividans)多月太。本发明具有葡糖苷酶活性的多肽也可以是真菌多肽,并且更优选酵母多肽如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽,其具有β-葡糖苷酶活性;或更优选丝状真菌多肽如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟赌菌属(Ceriporiopsis)、毛壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、Claviceps、Cochliobolus、鬼伞属(Coprinopsis)、Coptotermes>棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、蘑燕属(Lentinula)、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus>多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、/[叚黑盘菌属(Pseudoplectania)、Pseudotrichonympha、t艮毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、包脚菇属(Volvariella)或炭角菌属(Xylaria)多肽,其具有β-葡糖苷酶活性。在一个优选的方面,所述多肽是具有β_葡糖苷酶活性的卡尔酵母(Saccharomycescarlsbergensis)、酉良酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多肽。在另一优选的方面,所述多肽是具有β-葡糖苷酶活性的解纤维枝顶孢霉(Acremoniumcellulolyticus)、棘孢曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、烟曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillusnidulans)、漂曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、热带金孢子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、金孢子菌(Chrysosporiumpannicola)、Chrysosporiumqueenslandicum、Chrysosporiumzonatum、杆孢状镰孢(Fusariumbactridioides)、禾谷镰孢(Fusariumcerealis)、库威镰孢(Fusariumcrookwellense)、大刀镰孢(Fusariumculmoram)、禾本禾斗镰孢(Fusariumgraminearam)、禾赤镰孢(Fusariumgraminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusariumnegundi)、尖镰孢(Fusariumoxysporam)、多枝镰孢(Fusariumreticulatum)、粉红镰孢(Fusariumroseum)、接骨木镰孢(Fusariumsambucinum)、肤色镰孢(Fusariumsarcochroum)、拟分枝孢镰孢(Fusariumsporotrichioides)、硫色镰孢(Fusariumsulphureum)、圆镰孢(Fusariumtorulosum)、拟丝孢镰孢(Fusariumtrichothecioides)、镶片镰孢(Fusariumvenenatum)λ灰腐质霉(Humicolagrisea)、特异腐质霉(Humicolainsolens)、疏棉状腐质霉(Humicolalanuginosa)、白奉巴齿菌(Irpexlacteus)、米M毛霉(Mucormiehei)、嗜热毁丝霉、粗糙脉孢菌(Neurosporacrassa)、黄孢平革菌(Phanerochaetechrysosporium)、Thielaviaachromatica、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭孢壳(Thielaviaaustraleinsis)、Thielaviafimeti、小孢梭孢壳(Thielaviamicrospora)、,P孢梭孢壳(Thielaviaovispora)、Thielaviaperuviana、瘤孢梭孢壳(Thielaviaspededonium)、毛梭孢壳(Thielaviasetosa)、Thielaviasubthermophila、土生梭孢壳(Thielaviaterrestris)、哈茨木霉(Trichodermaharzianum)λ康宁木霉(Trichodermakoningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或绿色木霉(Trichodermaviride)多肽。在另一优选的方面,所述多肽是具有β_葡糖苷酶活性的巴西青霉、沙门桕干酪青霉(Penicilliumcamembertii)、胶囊青霉(Penicilliumcapsulatum)、产黄青霉(Penicilliumchrysogenum)、黄暗青霉(Penicilliumcitreonigrum)、桔青霉(Penicilliumcitrinum)、棒形青霉(Penicilliumclaviforme)、顶青霉(Penicilliumcorylophilum)、皮落青霉(Penicilliumcrastosum)、旨状青霉(Penicilliumdigitatum)、扩展青霉(Penicilliumexpansum)、绳状青霉(Penicilliumfuniculosum)、光孢青霉(Penicilliumglabram)、粒状青霉(Penicilliumgranulatum)、灰黄青霉(Penicilliumgriseofulvum)、岛青霉(Penicilliumislandicum)、意大禾lJ青霉(Penicilliumitalicum)、微紫青霉(Penicilliumjanthinellum)、铅色青霉(Penicilliumlividum)、大孢青霉(Penicilliummegasporam)、梅林青霉(Penicilliummelinii)、特异青霉(Penicilliumnotatum)、草酸青霉(Penicilliumoxalicum)、软毛青霉(Penicilliumpiiberahim)、变紫青霉(Penicilliumpurpurescens)、产紫青霉(Penicilliumpurpurogenum)、娄地青霉(Penicilliumroquefortii)、自皮糟青霉(Penicilliumragulosum)、小剌青霉(Penicilliumspinulosum)、瓦克曼青霉(Penicilliumwaksmanii)或青霉属菌种(Penicilliumsp.)多肽。在一个更优选的方面,所述多肽是具有葡糖苷酶活性的巴西青霉多肽,且最优选具有β“葡糖苷酶活性的巴西青霉IBT20888多肽。可理解的是对于前述的种,本发明包含完全和不完全阶段(perfectandimperfectstates),和其他分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域熟练技术人员会容易地识别适合的等同物的身份(identity)。这些种的菌株在许多培养物保藏机构对于公众能够容易地取得,所述保藏机构如美国典型培养物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和细胞培养物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌种保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。此外,可以使用上述的探针从其他来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就能够使用本领域普通技术人员熟知的技术将所述多核苷酸分离或克隆(参见,例如,Sambrook等,1989,见上)。本发明的多肽还包括融合多肽或可切割的融合多肽,其中将另外的多肽融合到所述多肽或其片段的N末端或C末端。通过将编码另一个多肽的核苷酸序列(或其部分)融合于本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的控制下。融合多肽还可以包括切割位点。一旦分泌了融合多肽,就切割所述位点,从融合蛋白释放具有葡糖苷酶活性的多肽。切割位点的实例包括,但不限于,编码二肽Lys-Arg的Kex2位点(Martin等,2003,J.Ind.Microbiol.Biotechnol.3568-576;Svetina等,2000,J.Biotechnol.76245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.633488-3493;Ward等,1995,Biotechnology13498-503;和Contreras等,1991,Biotechnology9378-381);lie-(Glu或Asp)-Gly-Arg位点,其在精氨酸残基后通过因子Xa蛋白酶切割(Eaton等,1986,Biochem.25505-512);Asp-Asp-Asp-Asp-Lys位点,其在赖氨酸后通过肠激酶切割(Collins-Racie等,1995,Biotechnology13982—987);His—Tyr—Glu位点、或His—Tyr—Asp位点、,其通过GenenaseI切害Ij(Carter等,1989,ProteinsStructure,Function,andGenetics6240-248);Leu-VaHPro-Arg-Gly-Ser位点,其在Arg后通过凝血酶切割(Stevens,2003,DrugDiscoveryWorld435-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点,其在Gln后通过TEV蛋白酶切割(Stevens,2003,见上);禾ΠLeu-Glu-VaHLeu-Phe-Gln-Gly-Pro位点,其在Gln后通过遗传工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,见上)。多核苷酸本发明还涉及分离的多核苷酸,其包含编码本发明具有葡糖苷酶活性的多肽的核苷酸序列。17在一个优选的方面,所述多核苷酸包含如下核苷酸序列或其亚序列,所述核苷酸序列包含编码具有β-葡糖苷酶活性的多肽片段的SEQIDNO1的核苷酸58到1081的部分核苷酸序列。在另一优选的方面,所述多核苷酸包含如下核苷酸序列,所述核苷酸序列包含SEQIDNO1的核苷酸58到1081的部分核苷酸序列。本发明还涵盖了包含如下氨基酸序列的多肽的编码核苷酸序列,所述氨基酸序列包含SEQIDNO:2的氨基酸20到267的部分氨基酸序列,所述核苷酸序列与SEQIDNO1的核苷酸58到1081的部分核苷酸序列的区别来源于遗传密码的简并性。本发明还涉及包含如下核苷酸序列的突变的多核苷酸,所述核苷酸序列包含在SEQIDNO1的核苷酸58到1081的部分核苷酸序列中包含至少一个突变的部分核苷酸序列,其中突变的核苷酸序列编码包含如下氨基酸序列的多肽,所述氨基酸序列分别包含SEQIDNO2的氨基酸20到267的部分氨基酸序列。用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,且包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆本发明的多核苷酸。参见,例如,Innis等,1990,PCRAGuidetoMethodsandApplication,AcademicPress,NewYork。可以使用其他核酸扩增方法,如连接酶链式反应(LCR)、连接活化转录(ligatedactivatedtranscription;LAT)和基于核苷酸序列的扩增(NASBA)。可以从青霉属菌株,或另外的或相关的生物体克隆所述多核苷酸,并且因此可以是例如所述核苷酸序列的多肽编码区的等位变体或种变体(speciesvariant)。本发明还涉及分离的多核苷酸,其包含如下核苷酸序列,所述核苷酸序列包含与SEQIDNO1的核苷酸58到1081的部分核苷酸序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、至少97%、至少98%或至少99%的同一性的部分核苷酸序列,所述多核苷酸编码具有葡糖苷酶活性的多肽。修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可为必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适ρΗ等方面不同的人工变体。可以在包含SEQIDNO:1的部分核苷酸序列或SEQIDNO3的部分核苷酸序列的核苷酸序列,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建变体序列所述取代不产生由核苷酸序列编码的多肽的另外的氨基酸序列,但是符合意欲产生酶的宿主生物体的密码子选择;或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述,参见,例如,Ford等,1991,ProteinExpressionandPurification295—107。对于本领域技术人员显而易见的是,这些取代能够在对于分子功能重要的区域之外进行,并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性关键的并且因此优选不进行取代的氨基酸残基,可以根据本领域公知的方法,如定位诱变或丙氨酸分区诱变法(参见,例如,Cunningham和Wells,1989,见上)来鉴定。在后一技术中,将突变引入到分子中的每个荷正电的残基处,并且测试所得突变分子的葡糖苷酶活性,以鉴定对于所述分子的活性关键的氨基酸残基。底物-酶相互作用的位点也能够通过分析三维结构测定,通过如核磁共振分析、晶体学或光亲和标记这样的技术来测定(参见,例如,deVos等,1992,见上;Smith等,1992,见上;Wlodaver等,1992,见上)。本发明还涉及编码本发明多肽的分离的多核苷酸,其包含核苷酸序列,所述核苷酸序列包含在非常低严紧条件下,优选低严紧条件,更优选中严紧条件,更优选中-高严紧条件,甚至更优选高严紧条件,并且最优选非常高的严紧条件下,与以下杂交的部分核苷酸序列(i)SEQIDNO1的核苷酸58到1081的部分核苷酸序列,(ii)包含于SEQIDNO1的核苷酸58到1081的部分核苷酸序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链,或它们的等位变体和亚序列(Sambrook等,1989,同上),如本文所定义的。在一个优选的方面,互补链包含SEQIDNO:1的核苷酸58到1081的部分核苷酸序列的全长互补链。本发明还涉及包含如下核苷酸序列的分离的多核苷酸,所述核苷酸序列包含通过如下获得的部分核苷酸序列(a)在非常低、低、中、中-高、高或非常高严紧条件下,将DNA的群体与以下杂交(i)SEQIDNO:1的核苷酸58到1081的部分核苷酸序列,Gi)包含于SEQIDNO1的核苷酸58到1081的部分核苷酸序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;和(b)分离杂交的多核苷酸,其编码具有β-葡糖苷酶活性的多肽。核酸构建体本发明还涉及包含本发明的分离的多核苷酸的核酸构建体,所述分离的多核苷酸与一个或多个(几个)调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。可以用许多方式操作编码本发明多肽的分离的多核苷酸以供多肽的表达。依赖于表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。调控序列可以是适当的启动子序列,其是由用于表达编码本发明多肽的多核苷酸的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截断的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。用于指导本发明的核酸构建体转录,特别是在细菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子大肠杆菌Iac操纵子、天蓝链霉菌琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核β_内酰胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA753727-3731),以及tac启动子(DeBoer等,1983,ProceedingsoftheNationalAcademyofSciencesUSA8021-25)。另外的启动子在〃Usefulproteinsfromrecombinantbacteria“于ScientificAmerican,1980,24274—94中;禾口在Sambrook等,1989,见上中描述。用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO00/56900)、镶片镰孢Daria(WO00/56900),镶片镰孢Quinn(WO00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2_tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变的、截断的和杂合的启动子。在酵母宿主中,有用的启动子从如下酶的基因获得酿酒酵母烯醇化酶(ENO-I)、酿酒酵母半乳糖激酶(GALl)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUPl)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其他有用的启动子由Romanos等,1992,Yeast8423-488描述。调控序列也可以是合适的转录终止子序列,其是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。对于酵母宿主细胞优选的终止子从如下酶的基因获得酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYCl)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其他有用的终止子由Romanos等,1992,见上描述。调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。对于酵母宿主细胞合适的前导序列从如下酶的基因获得酿酒酵母烯醇化酶(ENO-I)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。调控序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3’末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为向转录的mRNA添加聚腺苷残基的信号。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,MolecularCellularBiology155983-5990描述。调控序列还可以是信号肽编码序列,其编码与多肽的氨基末端相连的信号肽,并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码序列,该信号肽编码序列与编码分泌多肽的编码序列区段一起天然地连接在翻译阅读框中。或者,编码序列5’端可含有对于所述编码序列为外源的信号肽编码序列。外源信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者,外源信号肽编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径(即,分泌至培养基中)的任何信号肽编码序列可在本发明中使用。对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列芽孢杆菌属NCIB11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α_淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,:nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,MicrobiologicalReviews57109-137描述。对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V和疏棉状腐质霉脂肪酶。对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其他有用的信号肽编码序列由Romanos等,1992,见上描述。调控序列还可以是前肽编码序列,其编码位于多肽氨基末端的前肽。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前肽通常是无活性的并且能够通过前肽的催化或自催化切割从前多肽转化为成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(WO95/33836)的基因获得前肽编码序列。当信号肽和前肽序列二者均出现在多肽的氨基末端时,将前肽序列置于紧接着(nextto)多肽氨基末端,并且将信号肽序列置于紧接着前肽序列的氨基末端。同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中,可以使用ADH2系统或GALl系统。在丝状真菌中,可以使用TAKAa-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其他实例是那些允许基因扩增的序列。在真核系统中,这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(withheavymetal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列与调节序列可操作地连接。表达载体本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。本文所述的多种核酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个(几个)方便的限制位点以允许在这些位点插入或取代编码多肽的核苷酸序列。可供选择的是,可以通过在适当的用于表达的载体中插入包含所述序列的核苷酸序列或核酸构建体来表达本发明的多核苷酸序列。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的表达用调控序列可操作地连接。重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(totalDNA),或可以使用转座子(transposon)。本发明的载体优选地含有一个或多个(几个)选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophytoauxotrophs)等。细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性如氨苄青霉素、卡那霉素、氯霉素或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRPl和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitratereductase)、pyrG(乳清酸核苷_5’-磷酸脱羧酶)(orotidine-5,-phosphatedecarboxylase)、sC(硫酸腺苷酰转移酶)禾ΠtrpC(邻氨基苯甲酸合酶(anthranilatesynthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyceshygroscopicus)的bar基因。本发明的载体优选含有允许载体整合入宿主细胞基因组或在细胞中独立于基因组自主复制的元件。为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其他载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应优选含有足够数量的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的目标序列具有高度同一性以增强同源重组的概率。整合元件可以是任何与宿主细胞基因组中的目标序列同源的序列。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。为了自主复制,载体可以还包含复制起点,其使载体能够在所述的宿主细胞中22自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为使质粒或载体能够体内复制的核苷酸序列。细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUBllO、pE194、pTA1060和ρΑΜβ1的复制起点。用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARS1,ARS4,ARSl和CEN3的组合,和ARS4和CEN6的组合。在丝状真菌细胞中有用的复制起点的实例是AMAl和ANSI(Gems等,1991,Gene9861-67;Cullen等,1987,NucleicAcidsResearch159163-9175;WO00/24883)。分离AMAl基因和构建包含该基因的质粒或载体能够根据公开于WO00/24883中的方法完成。可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加基因产物的产生。多核苷酸拷贝数的增加可通过如下方法获得将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂(selectableagent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,从而也含有多核苷酸的额外拷贝的细胞。用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,I989,见上)。宿主细胞本发明还涉及重组宿主细胞,其包含本发明的分离的多核苷酸,将所述重组宿主细胞有利地用于具有葡糖苷酶活性的多肽的重组产生。将包含本发明的多核苷酸的载体引入宿主细胞从而将所述载体作为染色体整合体或作为自复制的染色体外载体保持,如前文所述。术语“宿主细胞”包含亲本细胞的任何子代,其因为在复制过程中发生的突变而与该亲本细胞不同。宿主细胞的选择在很大程度上会依赖于编码多肽的基因及其来源。宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞,例如,原核或真核细胞。原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于,芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属和海洋芽孢杆菌属。革兰氏阴性细菌包括但不限于,大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属和脲原体属。细菌宿主细胞可以是任何芽孢杆菌属细胞。在本发明的实施中有用的芽孢杆菌属细胞包括但不限于,嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。在一个优选的方面,细菌宿主细胞是解淀粉芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在一个更优选的方面,细菌宿主细胞是解淀粉芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是克劳氏芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是地衣芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是枯草芽孢杆菌细胞。细菌宿主细胞还可以是任何链球菌属细胞。在本发明的实施中有用的链球菌属细胞包括但不限于,似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种细胞。在一个优选的方面,细菌宿主细胞是似马链球菌细胞。在另一个优选的方面,细菌宿主细胞是酿脓链球菌细胞。在另一个优选的方面,细菌宿主细胞是乳房链球菌细胞。在另一个优选的方面,细菌宿主细胞是马链球菌兽瘟亚种细胞。细菌宿主细胞还可以是任何链霉菌属细胞。在本发明的实施中有用的链霉菌属细胞包括但不限于,不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌细胞。在一个优选的方面,细菌宿主细胞是不产色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是除虫链霉菌细胞。在另一个优选的方面,细菌宿主细胞是天蓝链霉菌细胞。在另一个优选的方面,细菌宿主细胞是灰色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是浅青紫链霉菌细胞。可通过如下方法实现将DNA引入到芽孢杆菌属细胞例如原生质体转化(参见,例如,Chang和Cohen,1979,MolecularGeneralGenetics168111-115),使用感受态细胞(参见,例如,Young禾ΠSpizizen,1961,JournalofBacteriology81823-829或Dubnau和Davidoff-Abelson,1971,JournalofMolecularBiology56209-221),电穿孔(参见,例如,Shigekawa和Dower,1988,Biotechniques67^-75I)或接合(参见,例如,Koehler和Thome,1987,JournalofBacteriologyl695271-5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞例如原生质体转化(参见,例如,Hanahan,1983,J.Mol.Biol.166557-580)或电穿孔(参见,例如,Dower等,1988,NucleicAcidsRes.166127-6145)。可通过如下方法实现将DNA引入到链霉菌属细胞例如原生质体转化和电穿孔(参见,例如,Gong等,2004,FoliaMicrobiol.(Praha)49399-405),接合(参见,例如,Mazodier等,1989,J.Bacteriol.1713583-3585),或转导(参见,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA986289-6294)。可通过如下方法实现将DNA引入到假单胞菌属细胞例如电穿孔(参见,例如,Choi等,2006,J.Microbiol.Methods64391-397)或接合(参见,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.7151-57)。可通过如下方法实现将DNA引入到链球菌属细胞例如天然感受态(naturalcompetence)(参见,例如,PerryfPKuramitsu,1981,Infect.Immun.321295-1297),原生质体转化(参见,例如,Catt和Jollick,1991,Microbios.68189-207),电穿孔(参见,例如,Buckley等,I"9,Appl.Environ.Microbiol.653800-3804)或接合(参见,例如,Clewell,1981,Microbiol.Rev.45409-436)。然而,可以使用任何已知的将DNA引入宿主细胞的方法。宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。在一个优选的方面,宿主细胞是真菌细胞。“真菌”用在本文包括以下门子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)禾口接合菌门(Zygomycota)(如由Hawksworth等,于AinsworthandBisby,sDictionaryofTheFungi,第八版,1995,CABInternational,UniversityPress,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用),和所有有丝分裂孢子真菌(mitosporicfungi)(Hawksworth等,1995,见上)。在一个更优选的方面,真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenousyeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenousyeast)禾口属于半知菌类(FungiImperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,会将酵母定义为如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.,禾口Davenport,R.R.编,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。在一个甚至更优选的方面,酵母宿主细胞是假丝酵母属、汉逊酵母属(Hansenula)>克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞。在一个最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyceslactis)细胞。在另一个最优选的方面,酵母宿主细胞是解脂西洋蓍霉(Yarrowialipolytica)细胞。在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其他复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。在一个甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprimis)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。在一个最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个最优选方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在另一个最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkanderaadusta)、干拟蜡菌(Ceriporiopsisaneirina)、干拟赌菌、Ceriporiopsiscaregiea、Ceriporiopsisgilvescens、Ceriporiopsispannocinta、Ceriporiopsisrivulosa、Ceriporiopsissubrafa、虫拟赌菌(Ceriporiopsissubvermispora)、嗜角质金孢子菌、Chrysosporiumlucknowense>热带金孢子菌、Chrysosporiummerdarium、Chrysosporiuminops、租金孢子菌、Chrysosporiumqueenslandicum、Chrysosporiumzonatum、灰盖鬼伞(Coprinuscinereus)、毛革盖菌(Coriolushirsutus)、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌(Phanerochaetechrysosporium)、福身寸身寸脉菌(Phlebiaradiata)、朿Ijff侧耳(Pleurotuseryngii)、土生梭孢壳、长绒毛栓菌(Trametesvillosa)、变色栓菌(Trametesversicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023和Yelton等,1984,ProceedingsoftheNationalAcademyofSciencesUSA811470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文献描述的方法转化酵母Becker和Guarente,于Abelson,J.N.禾口Simon,M.I.编,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,182-187页,AcademicPress,Inc.,NewYork;Ito等,1983,JournalofBacteriology153163;禾口Hinnen等,1978,ProceedingsoftheNationalAcademyofSciencesUSA751920。产生方法本发明还涉及产生本发明多肽的方法,其包括(a)在有益于产生所述多肽的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。在一个优选的方面,所述细胞是青霉属的。在一个更优选的方面,所述细胞是巴西青霉。在一个最优选的方面,所述细胞是巴西青霉IBT20888。本发明还涉及产生本发明的多肽的方法,其包括(a)在有益于产生所述多肽的条件下培养如本文所述的重组宿主细胞;和(b)回收所述多肽。本发明还涉及产生本发明的多肽的方法,包括(a)在有益于产生所述多肽的条件下培养重组宿主细胞,其中所述宿主细胞包含突变多核苷酸,其包含核苷酸序列,所述核苷酸序列在SEQIDNO1的核苷酸58到1081的部分核苷酸序列中包含至少一个突变,其中所述突变多核苷酸编码包含如下氨基酸序列的多肽,所述氨基酸序列包含SEQIDNO2的氨基酸20-267的部分氨基酸序列,和(b)回收所述多肽。在本发明的产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌到培养基中,其能够从细胞裂解物(Iysate)回收。可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzymeassay)可用于测定如本文所述的多肽的活性。所得多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。本发明的多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,ProteinPurification,J.-C.Janson和LarsRyden编,VCHPublishers,NewYork,1989)。植物本发明还涉及植物,例如,转基因植物、植物部分或植物细胞,其包含分离的多核苷酸,所述多核苷酸编码本发明具有葡糖苷酶活性的多肽,从而以可回收的量表达和产生所述多肽。多肽可从植物或植物部分回收。或者,可以将含有该重组多肽的植物或植物部分按原样用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性质(rheologicalproperties),或用于破坏抗营养因子。转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses),如草地早熟禾(meadowgrass)(蓝草(bluegrass),早熟禾属(Poa));饲用牧草(foragegrass)如羊茅属(Festuca)>黑麦草属(Lolium);寒地型牧草(temperategrass),如Agrostis(剪股颖属);和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜籽(rapeseed)和紧密相关的模式生物拟南芥(Arabidopsisthaliana)。植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮(epidermis)>叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vasculartissue)、分生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(ρeroxisome)禾口细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如为了促进本发明的应用而分离的具体组织和细胞也被认为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seedcoat)。同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的后代。表达本发明多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下方法构建所述植物或植物细胞将编码本发明多肽的一个或多个(几个)表达构建体并入植物宿主基因组或叶绿体基因组,并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。表达构建体便利地是包含编码本发明多肽的多核苷酸的核酸构建体,所述多核苷酸与在选择的植物或植物部分中表达该多核苷酸序列所需的适当的调节序列可操作地连接。此外,表达构建体可以包含对于鉴定整合了该表达构建体的宿主细胞有用的选择性标记和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及如何表达多肽而确定。例如,编码本发明多肽的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如Tague等,1988,PlantPhysiology86506所述。对于组成性表达,可以使用35S_CaMV、玉米泛素1和稻肌动蛋白1启动子(Franck等,1980,Cell21285-294,Christensen等,1992,PlantMo.Biol.18675-689;Zhang等,1991,PlantCell31155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storagesinktissue)例如种子、马铃薯块茎和果实的启动子(Edwards和Corazzi,1990,Ann.Rev.Genet.24275-303),或来自代谢库组织(metabolicsinktissue)例如分生组织的启动子(Ito等,1994,PlantMol.Biol.24863-878),种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,PlantandCellPhysiology39885-889),来自豆球蛋白(Iegumin)B4和蚕豆(Viciafaba)的未知种子蛋白基因的蚕豆启动子(Conrad等,1998,JournalofPlantPhysiology152708-711)、来自种子油体蛋白(oilbodyprotein)的启动子(Chen等,I"8,PlantandCellPhysiology39935-941),来自欧洲油菜(Brassicanapus)的贮藏蛋白napA启动子,或本
技术领域:
公知的任何其他种子特异性的启动子,例如,在WO91/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子(Kyozuka等,1993,PlantPhysiology102991-1000),小球藻病毒(chlorellavirus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(Mitra和Higgins,1994,PlantMolecularBiology2685-93),或来自稻的aldP基因启动子(Kagaya等,1995,MolecularandGeneralGenetics248668-674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等,1993,PlantMolecularBiology22573-588)。同样地,所述启动子可通过非生物的处理诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源施加的激活所述启动子的物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脱落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金属。启动子增强子元件也可以用于实现本发明多肽在植物中的较高表达。例如,启动子增强子元件可以是内含子,其置于启动子和编码本发明多肽的核苷酸序列之间。例如Xu等,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。选择性标记基因和表达构建体的任何其他部分可以选自本领域内可用的那些。将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science2441293;Potrykus,1990,Bio/Technology8535;Shimamoto等,1989,Nature338274)。目前,根癌土壤杆菌(Agrobacteriumtumefaciens)介导的基因转移(genetransfer)是产生转基因双子叶植物的优选方法(为了参考,见Hooykas和Schilperoort,1992,PlantMolecularBiology1915-38),而且它也可以用于转化单子叶植物,虽然对于这些植物其他的转化方法是常用的。目前,产生转基因单子叶植物的优选的方法,是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryoniccalli)或发育中的胚(developingembryos)(Christou,1992,PlantJournal2275-281;Shimamoto,1994,CurrentOpinionBiotechnology5158-162;Vasil等,1992,Bio/Technology10667-674)。转化单子叶植物的可供选择的方法是基于原生质体转化,如由Omiralleh等,1993,PlantMolecularBiology21415-428所描述的。转化之后,根据本领域熟知的方法选择并入了表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因例如,使用带有两种独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。本发明还涉及产生本发明多肽的方法,其包括(a)在有益于产生所述多肽的条件下培养包含多核苷酸的转基因植物或植物细胞,所述多核苷酸编码本发明具有葡糖苷酶活性的多肽;和(b)回收所述多肽。去除或减少β-葡糖苷酶活性本发明还涉及产生亲本细胞突变体的方法,其包括破坏或缺失编码本发明的多肽的多核苷酸或其部分,所述方法导致在相同条件下培养时,与亲本细胞相比突变的细胞产生较少的所述多肽。可以使用本领域熟知的方法(例如,插入、破坏、替代或缺失)通过减少或消除编码本发明多肽的核苷酸序列的表达来构建突变细胞。在一个优选的方面,所述核苷酸序列是失活的。待修饰或失活的核苷酸序列可以是,例如,编码区或其对活性关键的部分,或表达编码区所需的调节元件。这种调节或调控序列的实例可以是启动子序列或其功能部分,即,足以影响核苷酸序列表达的部分。用于可能的修饰的其他调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录激活子。可以通过向亲本细胞施以诱变,并且选择其中已将所述核苷酸序列的表达减少或消除的突变细胞来进行核苷酸序列的修饰或失活。诱变可能是特异性的或随机的,可以通过例如使用合适的物理或化学诱变剂进行,通过使用合适的寡核苷酸进行,或通过将所述DNA序列进行PCR产生的诱变来进行。此外,可以通过使用这些诱变剂的任何组合来进行诱变。适合于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、O-甲基羟胺、亚硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)>亚硫酸氢钠、甲酸和核苷酸类似物。当使用这些试剂时,通常通过如下方法来进行所述诱变在合适条件下存在优选的诱变剂时温育待诱变的亲本细胞,并筛选和/或选择显示基因表达减少的或无基因表达的突变体细胞。通过导入、取代或去除基因中的一个或多个(几个)核苷酸或其转录或翻译所需的调节元件可以实现所述核苷酸序列的修饰或失活。例如,可以插入或去除核苷酸从而导致引入终止密码子,去除起始密码子,或改变开放阅读框。按照本领域已知的方法通过定位诱变或PCR产生的诱变可以实现这种修饰或失活。尽管在理论上所述修饰可以在体内进行,即,直接在表达待修饰核苷酸序列的细胞上进行,但优选如下面所示例的那样在体外进行所述修饰。29消除或减少核苷酸序列通过细胞表达的便利方式的例子是基于基因替代,基因缺失,或基因破坏的技术。例如,在基因破坏方法中,将相应于内源核苷酸序列的核酸序列在体外进行诱变以产生缺陷性的核酸序列,随后将其转化入亲本细胞中以产生缺陷基因。通过同源重组,所述缺陷性核酸序列替代了内源性核苷酸序列。可能理想的是所述缺陷性核苷酸序列还编码标记,其可用于选择其中核苷酸序列被修饰或破坏的转化体。在特别优选的方面,用可选择的标记(如本文所述的那些)来破坏所述核苷酸序列。或者,可以使用与所述核苷酸序列互补的序列通过确定的反义或RNAi技术来进行所述核苷酸序列的修饰或失活。更具体地,通过导入与所述基因的核苷酸序列互补的序列可以减少或消除所述核苷酸序列通过细胞的表达,所述互补的序列可以在细胞中转录并且能够与细胞中产生的mRNA杂交。由此在允许所述互补反义核苷酸序列与mRNA杂交的条件下,减少或消除翻译的蛋白质的量。本发明进一步涉及亲本细胞的突变体细胞,其包含编码多肽的核苷酸序列或其调控序列的破坏或缺失,这导致与亲本细胞相比突变体细胞产生更少的多肽或不产生多肽。这样生成的多肽缺陷型突变细胞作为表达天然和/或异源多肽的宿主细胞特别有用。所以,本发明进一步涉及产生天然或异源多肽的方法,其包括(a)在有益于产生所述多肽的条件下培养突变细胞;和(b)回收所述多肽。术语“异源多肽”在本文中定义为对宿主细胞不是天然的多肽,进行了修饰以改变天然序列的天然蛋白,或作为通过重组DNA技术对宿主细胞操作的结果其表达在量上改变的天然蛋白。在另一方面,本发明涉及通过发酵产生本发明的多肽以及目标蛋白产物的细胞来生产基本上无β-葡糖苷酶活性的蛋白质产物的方法,该方法通过如下进行在发酵之前、之中或发酵完成之后向发酵液(fermentationbroth)中添加有效量的能够抑制β-葡糖苷酶活性的试剂,从发酵液中回收目标产物,并且任选地将回收的产物进行进一步纯化。在另一方面,本发明涉及如下生产基本上无葡糖苷酶活性的蛋白质产物的方法在允许产物表达的条件下培养细胞,将得到的培养液进行组合的ρΗ和温度处理以实质上(substantially)减少β-葡糖苷酶活性,和从发酵液中回收产物。或者,可以将从培养液回收的酶制备物进行组合的ρΗ和温度处理。所述组合的ρΗ和温度处理可任选地与葡糖苷酶抑制剂处理组合使用。依照本发明的这个方面,可能去除至少60%,优选至少75%,更优选至少85%,还更优选至少95%,并且最优选至少99%的β-葡糖苷酶活性。可使用此方法获得葡糖苷酶活性的完全去除。组合的ρΗ和温度处理优选在2-4或9-11范围内的ρΗ和至少60_70°C范围内的温度进行一段足够的时间以达到期望的效果,通常30至60分钟是足够的。用于培养和纯化感兴趣的产物的方法可以通过本领域已知的方法进行。本发明用于产生基本上无葡糖苷酶的产物的方法在真核多肽,特别是真菌蛋白质例如酶的产生中是特别令人有兴趣的。所述酶可以选自,例如,淀粉分解酶(amylolyticenzyme)、脂肪分解酶、蛋白水解酶、纤维素分解酶(cellulolyticenzyme)、氧化还原酶或植物细胞壁降解酶。这些酶的实例包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶(chitinase)、角质酶(cutinase)、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖氧化酶、葡糖苷酶、卤素过氧化酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转移酶、转谷氨酰胺酶或木聚糖酶。β-葡糖苷酶缺陷细胞也可以用于表达在制药上引起兴趣的异源蛋白质如激素、生长因子、受体等。可理解的是术语“真核多肽”不仅包括天然多肽,也包括多肽例如酶,其通过氨基酸取代、缺失或添加或其他这样的修饰而被修饰以增强活性、热稳定性、ρΗ耐受性寸。在另外的方面,本发明涉及基本上无葡糖苷酶活性的蛋白质产物,其通过本发明的方法产生。抑制具有β-葡糖苷酶活性的多肽表达的方法本发明还涉及抑制具有葡糖苷酶活性的多肽在细胞中表达的方法,其包括对细胞施用或者在细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含本发明多核苷酸的亚序列。在一个优选的方面,dsRNA长约15、16、17、18、19、20、21、22、23、24、25或更多个双链体核苷酸。dsRNA优选是小干扰RNA(siRNA)或微小RNA(miRNA)。在一个优选的方面,dsRNA是用于抑制转录的小干扰RNA(siRNA)。在另一优选的方面,dsRNA是用于抑制翻译的微小RNA(miRNA)。本发明还涉及用于抑制细胞中多肽表达的这些包含SEQIDNO1的核苷酸58到1081的部分核苷酸序列的部分的双链RNA(dsRNA)分子。虽然本发明不受限于任何特定作用机制,但dsRNA能进入细胞,并引起相似或相同序列的单链RNA(ssRNA)的降解,所述RNA包括内源mRNA。当细胞接触dsRNA时,来自同源基因的mRNA选择性地受到称为RNA干扰(RNAi)的过程的降解。本发明的dsRNA可以用于基因沉默疗法。在一个方面,本发明提供使用本发明的dsRNAi选择性地降解RNA的方法。所述方法可以在体外、回体(exvivo)或在体内进行。在一个方面,dsRNA分子能够用于在细胞、器官或动物中产生功能丧失突变(loss-of-functionmutation)。制备和使用选择性降解RNA的dsRNA分子的方法在本领域中公知,参见,例如,美国专利号6,506,559;美国专利号6,511,824;美国专利号6,515,109;和美国专利号6,489,127。组合物本发明还涉及包含本发明的多肽的组合物。优选地,所述组合物富含这种多肽。术语“富含”表示所述组合物的葡糖苷酶活性有所增加,例如,以至少1.1的富集因数(enrichmentfactor)增加。所述组合物可以包含本发明的多肽作为主要酶成分,例如,单成分组合物。或者,所述组合物可以包含多种酶活性,例如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶(peptidoglutaminase)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。额外的酶可以通过例如属于以下属或种的微生物产生曲霉属,优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉;镰孢属,优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢;腐质霉属,优选特异腐质霉或疏棉状腐质霉;或木霉属,优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木毒ο可以依照本领域内已知的方法制备多肽组合物,并且可以是液体或干组合物的形式。例如,所述多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以依照本领域内已知方法将包括于所述组合物中的多肽稳定化。下面给出的是本发明多肽组合物的优选的用途的实例。本发明的多肽组合物的剂量和使用该组合物的其他条件可以基于本领域内已知的方法确定。纤维素材料的加工本发明还涉及供降解或转化纤维素材料的方法,包括用纤维素分解酶组合物在本发明的具有葡糖苷酶活性的多肽存在下处理所述纤维素材料。在一个优选的方面,所述方法进一步包括回收经降解或转化的纤维素材料。本发明还涉及产生发酵产物的方法,包括(a)用纤维素分解酶组合物在本发明的具有β_葡糖苷酶活性的多肽存在下糖化纤维素材料;(b)用一种或多种发酵微生物发酵步骤(a)的经糖化的纤维素材料以产生发酵产物;以及(c)从发酵回收发酵产物。本发明还涉及发酵纤维素材料的方法,包括用一种或多种发酵微生物发酵所述纤维素材料,其中将所述纤维素材料用纤维素分解酶组合物在本发明的具有葡糖苷酶活性的多肽存在下糖化,且所述具有葡糖苷酶活性的多肽的存在与所述具有葡糖苷酶活性的多肽不存在时相比增加了所述纤维素材料的降解。在一个优选的方面,所述纤维素材料的发酵产生了发酵产物。在另一优选的方面,所述方法另外还包括将所述发酵产物从发酵回收。所述组合物和所述具有β-葡糖苷酶活性的多肽可以以移除或不移除细胞的粗发酵液的形式,或以半纯化的或纯化的酶制备物的形式存在,或者所述组合物可包含本发明的宿主细胞作为在用所述生物质进行的发酵工艺中的具有葡糖苷酶活性的多肽的来源。本发明的方法可用于将纤维素材料糖化成为可发酵的糖,并将该可发酵的糖转化为多种有用的物质,例如,化学品与燃料。自所述纤维素材料产生所期望的发酵产物通常涉及预处理,酶水解(糖化)与发酵。根据本发明对所述纤维素材料的加工可使用本领域常规方法完成。此外,本发明的方法可使用任何经配置以依照本发明操作的常规生物质加工装置加以实施。分别或同时的水解(糖化)与发酵包括但不仅限于分别水解与发酵(SHF);同时糖化与发酵(SSF);同时糖化与共发酵(SSCF);混合水解与发酵(HHF);SHCF(分别水解与共发酵);HHCF(混合水解与发酵(hybridhydrolysisandfermentation)),以及直接微生物转化(DMC)。SHF使用分别的过程步骤以首先将木素纤维素酶法水解为可发酵的糖,例如,葡萄糖,纤维二糖,纤维三糖与戊糖,并随即将所述可发酵的糖发酵为乙醇。在SSF中,木素纤维素的酶法水解,以及糖发酵为乙醇合并为一步(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,于HandbookonBioethanolProductionandUtilization,Wyman,C.Ε.编,Taylor&Francis,Washington,DC,179-212)。SSCF涉及多种糖类的共发酵(Sheehan,J.禾口Himmel,M.,1999,Enzymes,energyandtheenvironmentAstrategicperspectiveontheU.S.Departmentoffinergy’sresearchanddevelopmentactivitiesforbioethanol,Biotechnol.Prog.15817—827)。HHF涉及分别的水解分离步骤,并另外涉及同时的糖化与水解步骤,其可在同一个反应器中进行。在HHF过程中的步骤可在不同温度下进行,S卩,高温酶法糖化继之以在较低的、发酵菌株可容忍的温度的SSF。DMC将所有三个过程(酶产生,木素纤维素水解与发酵)合并于一个或多个步骤,其中使用相同生物体来产生酶用于将木素纤维素转化为可发酵的糖并将所述可发酵的糖转化为终产物(Lynd,L.R.,Weimer,PJ.,vanZyl,W.H.和Pretorius,I.S.,2002,MicrobialcelluloseutilizationFundamentalsandbiotechnology,Microbiol.Mol.Biol.Reviews66506-577)在本文中应理解,包括预处理,酶水解(糖化),发酵或其组合的本领域已知的任何方法可用于实施本发明的方法。常规装置可包括补料分批搅拌反应器(fed-batchstirredreactor),分批搅拌反应器(batchstirredreactor),带超滤的连续、流搅拌反应器(continuousflowstirredreactorwithultrafiltration)禾口/或连续白勺舌塞、流柱式反应器(continuousplug-flowcolumnreactor)(FernandadeCastilhosCorazza,FlavioFariadeMoraes,GisellaMariaZanin禾口IvoNeitzel,2003,Optimalcontrolinfed-batchreactorforthecellobiosehydrolysis,ActaScientiaram.Technology2533—38;Gusakov,A.V.禾口Sinitsyn,A.P.,1985,Kineticsoftheenzymatichydrolysisofcellulose1.Amathematicalmodelforabatchreactorprocess,Enz.Microb.Technol.7346-352),磨耗反应器(anattritionreactor)(Ryu,S.K.和Lee,J.M.,1983,Bioconversionofwastecellulosebyusinganattritionbioreactor,Biotechnol.Bioeng.2553-65),或者带有由电磁场诱导的强搅拌的反应器(areactorwithintensivestirringinducedbyanelectromagneticfield)(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,O.V.,1996,Enhancementofenzymaticcellulosehydrolysisusinganoveltypeofbioreactorwithintensivestirringinducedbyelectromagneticfield,Appl.Biochem.Biotechnol.56141-153)。其他类型的反应器包括流化床(fluidizedbed)、上流床(upflowblanket)、固定化的以及挤出机(extruder)型反应器以供水解和/或发酵。预处理在实施本发明的方法时,本领域已知的任何预处理过程可用于破坏植物细胞壁组分。所述纤维素材料还可在使用本领域已知方法进行预处理之前进行预浸(pre-soaking),润湿(wetting),或调理(conditioning)。常规预处理包括但不限于,蒸汽预处理(爆炸或不爆炸),稀酸预处理,热水预处理,石灰预处理,湿氧化,湿爆炸,氨纤维爆炸,有机溶剂预处理以及生物预处理。其他预处理包括超声,电穿孔,微波,超临界CO2,超临界H2O和氨渗滤。所述纤维素材料可在水解和/或发酵前进行预处理。预处理优选在水解前进行。或者,所述预处理可与水解同时进行,如与用一种或多种纤维素分解酶或其他酶活性处理纤维素材料同时进行,以释放可发酵的糖,如葡萄糖和/或麦芽糖。在多数情况下,所述预处理步骤本身导致生物质部分转化为可发酵的糖(甚至酶不存在时亦如此)。蒸汽预处理。在蒸汽预处理中,将纤维素材料加热以破坏其植物细胞壁组分(包括木质素、半纤维素和纤维素),以使纤维素与其他部分(例如,半纤维素)易受酶作用(accessibletoenzymes)。使木素纤维素材料传至或经过反应容器,在该反应容器中注入蒸汽以增加温度至所需温度和压力,并在其中保持到所期望的反应时间。蒸汽预处理优选在140-230°C,更优选160-200°C,且最优选170-190°C进行,其中最佳温度范围取决于任何化学催化剂的添加。蒸汽预处理的停留时间优选为1-15分钟,更优选为3-12分钟,且最优选为4-10分钟,其中最佳停留时间取决于温度范围和任何化学催化剂的添加。蒸汽预处理允许相对较高的固体装载(量),从而使得纤维素材料通常仅在预处理过程中为潮湿的。所述蒸汽预处理常常与预处理之后材料的爆炸性排出(explosivedischarge)组合,其称为蒸汽爆炸,即,所述材料迅速闪蒸至大气压力和湍流以通过碎裂增加其可接触表面积(Duff和Murray,1996,BioresourceTechnology8551-33;Galbe和Zacchi,2002,Appl.Microbiol.Biotechnol.59618-628;美国专利申请No.20020164730)。在蒸汽预处理过程中,半纤维素乙酰基团遭剪切,且所得的酸自催化半纤维素部分水解为单糖与寡糖。仅有限程度地移除木质素。常常在蒸汽预处理前添加催化剂如H2SO4或SO2(通常为0.3到3%w/w),其减少时间与温度,增加回收(率),并改善酶水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132496-508;Varga等,2004,Appl.Biochem.Biotechnol.l13-116509-523;SasOTer等,2006,EnzymeMicrob.Technol.39756-762)。化学预处理术语“化学预处理”指任何促进纤维素、半纤维素和/或木质素分离和/或释放的化学预处理。合适的化学预处理过程的实例包括,例如,稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆炸(ammoniafiber/freezeexplosion,AFEX)、氨渗滤(APR)以及有机溶剂预处理。在稀酸预处理中,将所述纤维素材料与稀酸,通常为H2SO4,以及水混合以形成浆料,由蒸汽加热至所期望的温度,并在停留时间后闪蒸至大气压力。所述稀酸预处理可用多种设计的反应器来实施,例如,活塞流反应器,逆流反应器(counter-currentreactor)或连续逆、流收缩床反应器(continuouscounter-currentshrinkingbedreactor)(Duff禾口Murray,1996,见上文;Schell等,2004,BioresourceTechnol.91179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.6593-115)。亦可使用数种碱性条件下的预处理方法。这些碱性预处理方法包括但不限于,石灰预处理、湿氧化、氨渗滤(APR)与氨纤维/冷冻爆炸(AFEX)。石灰预处理使用碳酸钙,氢氧化钠或氨在85-150°C的低温以及1小时到数日的停留时间进行(Wyman等,2005,BioresourceTechnol.961959-1966;Mosier等,2005,BioresourceTechnol.96673-686)。WO2006/110891、W02006/11899、WO2006/11900和WO2006/110901公开了使用氨的预处理方法。湿氧化为如下的热预处理,即其通常在180-200°C进行5-15分钟,加以氧化剂如过氧化氢或氧气超压(over-pressure)(Schmidt和Thomsen,1998,BioresourceTechnol.64139-151;Palonen等,2004,Appl.Biochem.Biotechnol.1171-17;Varga等,2004,Biotechnol.Bioeng.88567-574;Martin等,2006,J.Chem.Technol.Biochnol.811669-1677)。该预处理优选以1_40%干物质,更优选2-30%干物质,且最优选5-20%干物质进行,且起始pH常常通过添加碱性物质,例如碳酸钠来增加。所述湿氧化预处理方法的改进,称为湿爆炸(湿氧化与蒸汽爆炸的组合),可处理多达30%的干物质。在湿爆炸中,氧化剂在预处理过程中在一定停留时间后导入。所述预处理随即通过闪蒸至大气压力来终止(WO2006/032282)。氨纤维爆炸(AFEX)涉及用液态或气态氨在中等温度(如90-100°C)以及高压(如17-20巴)对纤维素材料处理5-10分钟,其中干物质含量可高达60%(Gollapalli等,2002,Appl.Biochem.Biotechnol.9823-35;Chundawat等,2007,Biotechnol.Bioeng.96219-231;Alizadeh等,2005,Appl.Biochem.Biotechnol.1211133-1141;Teymouri等,2005,BioresourceTechnol.962014-2018)。AFEX预处理导致纤维素的解聚和半纤维素的部分水解。木质素_碳水化合物复合物遭剪切。有机溶剂预处理通过用乙醇水溶液(40-60%乙醇)在160-200°C提取30-60分钟而使纤维素材料脱木质化(Pan等,2005,Biotechnol.Bioeng.90473-481;Pan等,2006,Biotechnol.Bioeng.94851-861;Kurabi等,2005,Appl.Biochem.Biotechnol.121219-230)。通常添加硫酸作为催化剂。在有机溶剂预处理中,大部分半纤维素得到移除。合适的预处理方法的其他实例由Schell等,2003,Appl.Biochem.andBiotechnol.Vol.105-108,p.69-85与Mosier等,2005,BioresourceTechnology96673-686,以及公布的美国申请2002/0164730描述。在一方面,所述化学预处理优选作为酸处理来进行,且更优选作为连续性稀酸和/或弱酸(mildacid)处理进行。所述酸通常为硫酸,但亦可使用其他酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、盐酸或其混合物。弱酸处理在pH范围优选为1-5,更优选为1-4,且最优选为1-3进行。所述酸浓度范围为优选0.01到20wt%的酸,更优选0.05到10wt%的酸,甚至更优选0.1到5wt%的酸,且最优选0.2到2.0wt%的酸。所述酸与纤维素材料接触,并在范围优选为160-220°C,且更优选为165-195°C的温度保持数秒至数分钟范围的时间,例如,1秒到60分钟。在另一方面,预处理作为氨纤维爆炸步骤(AFEX预处理步骤)进行。在另一方面,预处理在水性浆料中进行。在优选的方面,所述纤维素材料在预处理过程中以优选为10-80wt%,更优选为20-70wt%,且最优选为30-60wt%,例如约50wt%的量存在。所述经预处理的纤维素材料可不经洗涤,或使用任何本领域已知的方法洗涤,例如,用水洗涤。机械预处理术语“机械预处理”指不同类型的碾磨或磨制(grindingormilling)(例如,干磨、湿磨或振动球磨(vibratoryballmilling))。物理预处理术语“物理预处理”指任何促进自纤维素材料分离和/或释放纤维素,半纤维素和/或木质素的预处理。举例而言,物理预处理可涉及辐射(例如,微波辐射)、汽蒸/蒸汽爆炸、水热解以及其组合。物理预处理可涉及高压和/或高温(蒸汽爆炸)。在一方面,高压意为范围在优选约300到约600psi,更优选约350到约550psi,且最优选约400到约500psi,例如约35450psi的压力。在另一方面,高温意为范围在约100到约300°C,优选约140到约235°C的温度。在一个优选方面,机械预处理以分批过程在蒸汽枪水解仪系统中进行,所述系统使用如上所述定义的高压与高温,例如,可自SundsDefibratorAB,Sweden得到的SundsHydrolyzer。组合的物理和化学预处理纤维素材料可经物理与化学方法两者预处理。举例而言,所述预处理步骤可涉及稀酸或弱酸处理以及高温和/或高压处理。物理与化学预处理可视需要顺序或同时进行。亦可包含机械预处理。因此,在一个优选方面,可对纤维素材料进行机械、化学或物理预处理,或其任意组合以促进纤维素、半纤维素和/或木质素的分离和/或释放。生物预处理术语“生物预处理”指任何促进自纤维素材料分离和/或释放纤维素、半纤维素和/或木质素的生物预处理。生物预处理技术可涉及施用溶解木质素的微生物(参见,例如,Hsu,T-A.,1996,Pretreatmentofbiomass,于HandbookonBioethanolProductionandUtilization,Wyman,C.E.编,Taylor&Francis,Washington,DC,179-212;Ghosh禾口Singh,1993,Physicochemicalandbiologicaltreatmentsforenzymatic/microbialconversionofcellulosicbiomass,Adv.Appl.Microbiol.39295-333;McMillan,J.D.,1994,Pretreatinglignocellulosicbiomassareview,于EnzymaticConversionofBiomassforFuelsProduction,Himmel,M.E.,Baker,J.O.禾口Overend,R.P.编,ACSSymposiumSeries566,AmericanChemicalSociety,Washington,DC,第15章;Gong,C.S.,Cao,N.J.,Du,J.禾口Tsao,G.T.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.编,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;Olsson禾口Hahn—Hagerdal,1996,Fermentationoflignocellulosichydrolysatesforethanolproduction,Enz.Microb.Tech.18312—331;禾口Vallander禾口Eriksson,1990,ProductionofethanolfromlignocellulosicmaterialsStateoftheart,Adv.Biochem.Eng./Biotechnol.4263-95)。趣化在亦称为糖化的水解步骤中,将所述经预处理的纤维素材料水解以将纤维素和可选地还有半纤维素分解为可发酵的糖,例如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖或可溶性寡糖。所述水解用酶法通过纤维素分解酶组合物在本发明具有葡糖苷酶活性的多肽存在下进行。该组合物中的一种或多种酶亦可顺序添加。酶水解优选在合适的水溶液环境中在本领域技术人员可容易地确定的条件下进行。在一个优选方面,水解在适于所述酶活性,即,对于所述酶为最佳的条件下进行。所述水解可作为分批补料或连续工艺进行,在后者中将经预处理的纤维素材料(底物)逐渐进料至,例如,含有酶的水解溶液中。所述糖化通常在搅拌釜式反应器或发酵罐中在受控的ρΗ、温度和混合条件下进行。合适的过程时间、温度与ρΗ条件可由本领域技术人员容易地确定。举例而言,所述糖化可持续长达200小时,但通常优选进行约12到约96小时,更优选约16到约72小时,且最优选约24到约48小时。温度范围优选约25°C到约70°C,更优选约30°C到约65且最优选约40°C到60°C,特别是约50°C。ρΗ范围优选约3到约8,更优选约3.5到约7,且最优选约4到约6,特别为约pH5。干固体含量范围优选约5到约50wt%,更优选约10到约40wt%,且最优选约20到约30wt%。除本发明具有葡糖苷酶活性的多肽之外,所述纤维素分解酶组合物可包含任何参与将含纤维素材料加工为葡萄糖,和/或将半纤维素加工为木糖、甘露糖、半乳糖和阿拉伯糖,其聚合物,或如下所述由其衍生的产物的蛋白质。在一个方面,所述纤维素分解酶组合物包含一种或多种选自下组的酶纤维素酶、内切葡聚糖酶、纤维二糖水解酶和葡糖苷酶。在另一方面,所述纤维素分解酶组合物另外还或甚至还包含具有纤维素分解增强活性的多肽。参见,例如,WO2005/074647,WO2005/074656和WO2007/089290。在另一方面,所述纤维素分解酶组合物另外还或甚至还包含一种或多种其他的酶活性以改进含纤维素材料的降解。优选的其他酶为半纤维素酶、酯酶(例如,脂肪酶、磷脂酶和/或角质酶)、蛋白酶、漆酶、过氧化物酶或其混合物。所述酶可源自或得自任何合适的来源,包括细菌、真菌、酵母、植物或哺乳动物来源。在本文中术语“获得”指该酶可分离自天然产生该酶作为天然酶的生物。在本文中术语“获得”也指所述酶可在宿主生物中使用本文所描述的方法重组产生,其中所述重组产生的酶对于所述宿主生物可为天然的或外源的,或具有修饰的氨基酸序列,例如,具有一个或多个缺失、插入和/或取代的氨基酸的修饰的氨基酸序列,即,重组产生的酶为天然氨基酸序列的突变体和/或片段,或者其为通过本领域已知的核酸改组过程(nucleicacidshufflingprocess)产生的酶。天然酶含意中涵盖天然变体,而外源酶含意中涵盖重组获得的变体,例如,通过定位诱变或改组获得的变体。所述纤维素分解酶组合物可为单组分制备物,例如,内切葡聚糖酶,可为多组分制备物,例如,内切葡聚糖酶、纤维二糖水解酶和葡糖苷酶,或多组分和单组分蛋白质制备物的组合。所述纤维素分解蛋白可具有活性,亦即,可于酸性、中性或碱性ρΗ范围水解所述含纤维素材料。所述纤维素分解酶组合物的一个或多个组分可为重组组分,亦即,通过克隆编码单一组分的DNA序列,并随后用该DNA序列转化细胞并在宿主中表达来产生(参见,例如,W091/17243和W091/17244)。所述宿主优选为异种宿主(酶对宿主是外源的),但在一些情况下所述宿主亦可为同种宿主(酶对宿主是内源的)。单组分纤维素分解蛋白亦可通过从发酵液中纯化上述蛋白质来制备。用于本发明中的酶可为任何适用于本文所述方法的形式,例如,有或无细胞的粗发酵液,或基本上纯的多肽。所述酶可为干粉或颗粒、无尘颗粒、液体、稳定化的液体或受保护的酶。液体酶制备物可,例如,通过添加稳定剂如糖、糖醇或其他多元醇,和/或乳酸或另一种有机酸根据已经确立的方法加以稳定化。受保护的酶可根据公开于EP238,216中的方法制备。适用于本发明的商业性的纤维素分解蛋白制备物的实例包括,举例而言,CELLUCLAST(可自NovozymesA/S获得)和N0V0ZYM188(可自NovozymesA/S获得)。其他包含纤维素酶的可以使用的可市购的制备物包括CELLUZYME、CEREFL0和ULTRAFLO(NovozymesA/S),LAMINEX和SPEZYMECP(GenencorInt.),R0HAMENT7069W(RohmGmbH)以及FIBREZYMELDI、FIBREZYMELBR或VISCOSTAR150L(DyadicInternational,Inc.,Jupiter,FL,USA)。所述纤维素酶以从固体的约0.001%到约5.0%wt更优选从固体的约0.025%到约4.0%wt.,且最优选从固体的约0.005%到约2.0%wt.的有效量添加。可以用于本发明的方法的细菌内切葡聚糖酶的实例包括但不仅限于,解纤维热酸菌(Acidothermuscellulolyticus)内切葡聚糖酶(WO91/05039;W093/15186;美国专利5,275,944;WO96/02551;美国专利5,536,655,W000/70031,WO05/093050);Thermobifidafusca内切葡聚糖酶III(W005/093050);和Thermobifidafusca内切葡聚糖酶V(WO05/093050)。可以用于本发明的方法的真菌内切葡聚糖酶的实例包括但不仅限于,里氏木霉内切葡聚糖酶I(Penttila等,1986,Gene45253-263;GENBANK登录号M15665);里氏木霉内切葡聚糖酶II(Saloheimo等,1988,Gene6311-22;GENBANK登录号M19373);里氏木霉内切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64555-563;GENBANK登录号AB003694);里氏木霉内切葡聚糖酶IV(Saloheimo等,1997,Eur.J.Biochem.249584-591;GENBANK登录号Yl1113);以及里氏木霉内切葡聚糖酶V(Saloheimo等,1994,MolecularMicrobiology13219-228;GENBANK登录号Z33381);棘孢曲霉内切葡聚糖酶(Ooi等,1990,NucleicAcidsResearch185884);川地曲霉(Aspergilluskawachii)内切葡聚糖酶(Sakamoto等,I"5,CurrentGenetics27435-439);Erwiniacarotovara内切葡聚糖酶(Saarilahti等,1990,Gene90:9-14);尖镰孢内切葡聚糖酶(GENBANK登录号L29381);灰腐质霉thermoidea变种内切葡聚糖酶(GENBANK登录号AB003107);Melanocarpusalbomyces内切葡聚糖酶(GENBANK登录号MAL515703);粗糙脉孢菌内切葡聚糖酶(GENBANK登录号XM_324477);特异腐质霉内切葡聚糖酶V;嗜热毁丝霉CBS117.65内切葡聚糖酶;担子菌纲(basidiomycete)CBS495.95内切葡聚糖酶;担子菌纲CBS494.95内切葡聚糖酶;土生梭孢壳NRRL8126CEL6B内切葡聚糖酶;土生梭孢壳NRRL8126CEL6C内切葡聚糖酶;土生梭孢壳NRRL8126CEL7C内切葡聚糖酶;土生梭孢壳NRRL8126CEL7E内切葡聚糖酶;土生梭孢壳NRRL8126CEL7F内切葡聚糖酶;CladorrhinumfoecundissimumATCC62373CEL7A内切葡聚糖酶;以及里氏木霉菌株VTT-D-80133号内切葡聚糖酶(GENBANK登录号M15665)。可用于本发明的方法的纤维二糖水解酶的示例包括但不仅限于,里氏木霉纤维二糖水解酶I;里氏木霉纤维二糖水解酶II;特异腐质霉纤维二糖水解酶I、嗜热毁丝霉纤维二糖水解酶II、土生梭孢壳纤维二糖水解酶II(CEL6A)、嗜热毛壳(Chaetomiumthermophilum)纤维二糖水解酶I以及嗜热毛壳纤维二糖水解酶II。可用于本发明的方法的葡糖苷酶的实例包括但不仅限于米曲霉葡糖苷酶;烟曲霉β-葡糖苷酶;巴西青霉(Penicilliumbrasilianum)IBT20888β-葡糖苷酶;黑曲霉β-葡糖苷酶;以及棘孢曲霉β-葡糖苷酶。具有β-葡糖苷酶活性的米曲霉多肽可根据WO2002/095014获取。具有β-葡糖苷酶活性的烟曲霉多肽可根据WO2005/047499获取。具有β-葡糖苷酶活性的巴西青霉多肽可根据WO2007/019442获取。具有β_葡糖苷酶活性的黑曲霉多肽可根据Dan等,2000,J.Biol.Chem.2754973-4980获取。具有β-葡糖苷酶活性的棘孢曲霉多肽可根据Kawaguchi等,1996,Gene173287-288获取。所述β-葡糖苷酶可以是融合蛋白。在一个方面,所述β-葡糖苷酶是根据WO2008/057637获取的米曲霉β-葡糖苷酶变体BG融合蛋白或米曲霉β_葡糖苷酶融合蛋白。其他内切葡聚糖酶、纤维二糖水解酶和葡糖苷酶公开于许多使用根据HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280309—316禾口HenrissatB.,andBairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316695—696的分类法的糖基水解酶家族中。其他可用于本发明的纤维素分解酶描述于EP495,257、EP531,315、EP531,372,WO89/09259,WO94/07998,WO95/24471,WO96/11262,W096/29397、WO96/034108、WO97/14804、WO98/08940、WO98/012307、WO98/13465、WO98/015619、WO98/015633、WO98/028411、WO99/06574、WO99/10481、WO99/025846、WO99/025847、WO99/031255、W02000/009707、WO2002/050245,WO2002/0076792,WO2002/101078,W02003/027306,WO2003/052054,WO2003/052055,WO2003/052056,W02003/052057,WO2003/052118,WO2004/016760,WO2004/043980,W02004/048592,WO2005/001065,WO2005/028636,WO2005/093050,W02005/093073,WO2006/074005,WO2006/117432,WO2007/071818,W02007/071820,WO2008/008070、WO2008/008793、美国专利4435307、美国专利5457046、美国专利5648263、美国专利5686593、美国专利5691178、美国专利5763254以及美国专利5776757。在本发明的方法中,可使用任何具有纤维素分解增强活性的多肽。在第一方面,所述具有纤维素分解增强活性的多肽可具有下述基序[ILMV]-P-X(4,5)-G_X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]禾口[FW]-[TF]-K-[AIV],其中X是任何氨基酸,X(4,5)是任何在4或5个连续位置上的氨基酸,而X(4)是任何在4个连续位置上的氨基酸。具有上述指明基序的多肽可另外还包含H-X(l,2)-G-P-X(3)-[YW]-[AILMV],[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X_[ILV],或H-X(1,2)-G-P-X(3)-[YW]_[AILMV]禾Π[EQ]-X-Y_X(2)-C_X-[EHQN]-[FILV]-X-[ILV],其中X是任何氨基酸,X(l,2)是任何在1个位置或2个连续位置上的氨基酸,X(3)是任何在3个连续位置上的氨基酸,而X(2)是任何在2个连续位置上的氨基酸。在上述基序中,使用公认的IUPAC单字母氨基酸缩写。在一个优选的方面,具有纤维素分解增强活性的多肽另外还包含H-X(l,2)-G-P-X(3)-[YW]-[AILMV]。在另一优选的方面,具有纤维素分解增强活性的分离多肽另外还包含[EQ]-X-Y-X⑵-C-X-[EHQN]-[FILV]-X_[ILV]。在另一优选的方面,具有纤维素分解增强活性的多肽另外还包含H-X(1,2)-G-P-X(3)_[YW]_[AILMV]和[EQ]-Χ"Υ-Χ(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在第二个方面,具有纤维素分解增强活性的多肽包含下述基序[ILMV]-P-x(4,5)-G-x_Y-[ILMV]-x-R-x-[EQ]-x(3)-A_[HNQ],其中X是任何氨基酸,x(4,5)是任何在4或5个连续位置上的氨基酸,而x(3)是任何在3个连续位置上的氨基酸。在上述基序中,使用公认的IUPAC单字母氨基酸缩写。可用于本发明方法的具有纤维素分解增强活性的多肽的实例包括但不仅限于,来自土生梭孢壳的具有纤维素分解增强活性的多肽(W02005/074647);来自橙色嗜热子囊菌(Thermoascusaurantiacus)的具有纤维素分解增强活性的多肽(WO2005/074656);和来自里氏木霉的具有纤维素分解增强活性的多肽(WO2007/089290)。可用于本发明方法的纤维素分解酶和蛋白质可以通过在含有合适的碳源和氮源以及无机盐的营养培养基上,使用本领域已知的步骤,对上面指出的微生物菌株进行发酵而产生(参见,例如,Bennett,J.W.和LaSure,L.编,MoreGeneManipulationsinFungi,AcademicPress,CA,1991)。合适的培养基可从供应商获取或可根据已公开的组成(例如,公开于美国典型培养物保藏中心的目录中的)来制备。适于生长和纤维素分解酶产生的温度范围和其他条件在本领域是已知的(参见,例如,Bailey,J.E.,和Ollis,D.F.,BiochemicalEngineeringFundamentals,McGraw-HillBookCompany,NY,1986)。所述发酵可以是任何其结果为纤维素分解酶的表达或分离的细胞培养方法。因此,发酵可以理解为包括在合适的培养基中并在允许所述纤维素分解酶得以表达或分离的条件下进行的摇瓶培养,或在实验室或工业发酵罐中的小-或大规模发酵(包括连续、分批、补料分批或固态发酵)。由上述方法所得的纤维素分解酶可从发酵介质中回收并用常规方法纯化。所述具有葡糖苷酶活性的酶和多肽的最佳量取决于多种因素,包括但不限于,组分纤维素分解蛋白质的混合物、纤维素底物、纤维素底物的浓度、纤维素底物的预处理、温度、时间、ρΗ以及发酵生物的包括(例如,供同时糖化与发酵的酵母)。在一个优选方面,对于纤维素材料的纤维素分解酶的有效量为每g纤维素材料约0.5到约50mg,优选约0.5到约40mg,更优选约0.5到约25mg,更优选约0.75到约20mg,更优选约0.75到约15mg,甚至更优选约0.5到约10mg,且最优选约2.5到约IOmg0在另一个优选方面,对于纤维素材料具有葡糖苷酶活性的多肽的有效量是每g纤维素材料约0.01到约50mg,优选约0.5到约40mg,更优选约0.5到约25mg,更优选约0.75到约20mg,更优选约0.75到约15mg,甚至更优选约0.5到约10mg,且最优选约2.5到约IOmg0在另一个优选方面,对于纤维素分解酶具有葡糖苷酶活性的多肽的有效量为每g纤维素分解酶约0.005到约l.Og,优选约0.01到约l.Og,更优选约0.15到约0.75g,更优选约0.15到约0.5g,更优选约0.1到约0.5g,甚至更优选约0.1到约0.5g,且最优选约0.05到约0.2g。发酵得自所述经预处理与水解的纤维素材料的可发酵的糖可由一种或多种能够将所述糖直接或间接发酵为所期望的发酵产物的发酵微生物进行发酵。“发酵”或“发酵方法”指任何发酵过程或任何包含发酵步骤的方法。发酵方法亦包括用于醇类消费品工业(例如,啤酒与葡萄酒)、乳制品工业(例如,发酵的乳制品)、皮革工业与烟草工业的发酵方法。发酵条件取决于所期望的发酵产物以及发酵生物,且可由本领域技术人员简单地确定。在所述发酵步骤中,作为预处理与酶水解步骤的结果自所述纤维素材料释放的糖由发酵生物(如酵母)发酵为产物,例如乙醇。可分别或同时进行水解(糖化)与发酵。上述方法包括但不限于,分别水解与发酵(SHF);同时糖化与发酵(SSF);同时糖化与共发酵(SSCF);混合水解与发酵(HHF);SHCF(分别水解与共发酵);HHCF(混合水解与发酵),以及直接微生物转化(DMC)。任何合适的经水解的纤维素材料可在实施本发明时用于所述发酵步骤。所述材料通常基于所期望的发酵产物(即,自发酵获得的物质),以及所用的方法而选择,如本领域所公知的。适用于本发明方法的底物的实例包括纤维素材料,如木材或植物残余物或得自经处理的纤维素材料的低分子糖DP1-3,所述纤维素材料可由发酵微生物进行代谢,且其可通过直接添加至发酵培养基中进行供应。在本文中术语“发酵培养基”应理解为指在添加发酵微生物之前的培养基,如,由糖化方法产生的培养基,以及用于同时糖化与发酵方法(SSF)的培养基。“发酵微生物”指任何微生物,包括细菌与真菌生物,其适用于所期望的发酵方法以产生发酵产物。所述发酵生物可为<:6和/或C5发酵生物,或其组合。C6与<:5发酵生物均是本领域所公知的。合适的发酵微生物能够将糖,如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖或寡糖直接或间接发酵(即转化)为所期望的发酵产物。产生乙醇的细菌与真菌发酵生物的实例描述于Lin等,2006,Appl.Microbiol.Biotechnol.69627-642。可发酵C6糖的发酵微生物的实例包括细菌与真菌生物,如酵母。优选的酵母包括酵母属菌种(Saccharomycesspp.),优选酿酒酵母(Saccharomycescerevisiae)的菌株。可发酵C5糖的发酵生物的实例包括细菌与真菌生物,如酵母。优选的C5发酵酵母包括毕赤酵母属(Pichia),优选树干毕赤酵母(Pichiastipitis)的菌株,如树干毕赤酵母CBS5773;假丝酵母属(Candida),优选博伊丁氏假丝酵母(Candidaboidinii),芸薹假丝酵母(Orndidabrassicae),休哈塔假丝酵母(Cimdidashehatae),迪丹氏假丝酵母(Candidadiddensii),假热带假丝酵母(Candidapseudotropicalis)或产朊假丝酵母(Cimdidautilis)的菌株。其他发酵生物包括发酵单胞菌属(Zymomonas),如运动发酵单胞菌(Zymomonasmobilis)的菌株;汉逊氏酵母属(Hansenula),如异常汉逊氏酵母(Himsenulaimomala)的菌株;克鲁维酵母属(Kluyveromyces),如脆壁克鲁维酵母(Kluyveromycesfragilis)的菌株;裂殖酵母属(Schizosaccharomyces),如粟酒裂殖酵母(Schizosaccharomycespombe)的菌株;以及大肠杆菌(E.coli),特别是经遗传修饰而改善了乙醇产量的大肠杆菌菌株。在一个优选方面,酵母是酵母属菌种。在一个更优选方面,酵母为酿酒酵母。在另一个更优选方面,酵母为糖化酵母(Saccharomycesdistaticus)。在另一个更优选方面,酵母为葡萄汁酵母(Saccharomycesuvarum)。在另一个优选方面,酵母为克鲁维酵母属。在另一个更优选方面,酵母为马克斯克鲁维酵母(Kluyveromycesmarxianus)。在另一个更优选方面,酵母为脆壁克鲁维酵母。在另一个优选方面,酵母为假丝酵母属。在另一个更优选方面,酵母为博伊丁氏假丝酵母。在另一个更优选方面,酵母为芸薹假丝酵母。在另一个更优选方面,酵母为迪丹氏假丝酵母。在另一个更优选方面,酵母为假热带假丝酵母。在另一个更优选方面,酵母为产朊假丝酵母。在另一个优选方面,酵母为棍孢属(Clavispora)。在另一个更优选方面,酵母为葡萄牙棍孢(Clavisporalusitaniae)。在另一个更优选方面,酵母为仙人掌棍孢(Clavisporaopuntiae)。在另一个优选方面,酵母属于管囊酵母属(Pachysolen)。在另一个更优选方面,酵母为嗜鞣管囊酵母(Pachysolentannophilus)。在另一个优选方面,酵母属于毕赤酵母属。在另一个更优选方面,酵母为树干毕赤酵母。在另一个优选方面,酵母属于酒香酵母属(Bretannomyces)。在另一个更优选方面,酵母为克劳森酒香酵母CBretannomycesclausenii)(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,于HandbookonBioethanolProductionandUtilization,Wyman,C.Ε.编,Taylor&Francis,Washington,DC,179-212)。可有效将己糖与戊糖发酵为乙醇的细菌包括,例如,运动发酵单胞菌与热纤维梭菌(Clostridiumthermocellum)(Philippidis,1996,见上)。在一个优选方面,所述细菌为发酵单胞菌属。在一个更优选方面,所述细菌为运动发酵单胞菌。在另一个优选方面,所述细菌为梭菌属(Clostridium)。在另一个更优选方面,所述细菌为热纤维梭菌。适用于产生乙醇的商业上可得到的酵母包括,例如,ETHANOLRED酵母(可得自Fermentis/Lesaffre,USA),FALI(可得自Fleischmann,sYeast,USA),SUPERSTART与THERMOSACC新鲜酵母(可得自EthanolTechnology,WI,USA),BIOFERMAFT与XR(可得自NABC-NorthAmericanBioproductsCorporation,GA,USA),GERTSTRAND(可得自GertStrandAB,Sweden),以及FERMI0L(可得自DSMSpecialties)。在一个优选的方面,所述发酵微生物经遗传修饰以提供发酵戊糖的能力,例如利用木糖,禾_阿拉伯糖以及共同利用木糖与阿拉伯糖的微生物。将异源基因克隆入多种发酵微生物导致能够将己糖与戊糖转化为乙醇(共发酵)的生物的构建(Chen和Ho,1993,CloningandimprovingtheexpressionofPichiastipitisxylosereductasegeneinSaccharomycescerevisiae,Appl.Biochem.Biotechnol.39-40135—147;Ho等,1998,GeneticallyengineeredSaccharomycesyeastcapableofeffectivelycofermentingglucoseandxylose,Appl.Environ.Microbiol.641852-1859;Kotter禾口Ciriacy,1993,XylosefermentationbySaccharomycescerevisiae,Appl.Microbiol.Biotechnol.38776—783;Walfridsson等,1995,Xylose-metabolizingSaccharomycescerevisiaestrainsoverexpressingtheTKLlandTALIgenesencodingthepentosephosphatepathwayenzymestransketolaseandtransaldolase,Appl.Environ.Microbiol.614184—4190;Kuyper等,2004,MinimalmetabolicengineeringofSaccharomycescerevisiaeforefficientanaerobicxylosefermentationaproofofprinciple,FEMSYeastResearch4655-664;Beall等,1991,ParametricstudiesofethanolproductionfromxyloseandothersugarsbyrecombinantEscherichiacoli,Biotech.Bioeng.38296-303;Ingram等,1998,Metabolicengineeringofbacteriaforethanolproduction,Biotechnol.Bioeng.58204-214;42Zhang等,1995,MetabolicengineeringofapentosemetabolismpathwayinethanologenicZymomonasmobilis,Science267240-243;Deanda等,1996,Developmentofanarabinose-fermentingZymomonasmobilisstrainbymetabolicpathwayengineering,Appl.Environ.Microbiol.624465-4470)。在一个优选方面,所述经遗传修饰的发酵微生物为酿酒酵母。在另一个优选方面,所述经遗传修饰的发酵微生物为运动发酵单胞菌。在另一个优选方面,所述经遗传修饰的发酵微生物为大肠杆菌。在另一个优选方面,所述经遗传修饰的发酵微生物为产酸克雷伯氏菌(Klebsiellaoxytoca)。在本领域众所周知上述生物亦可用于产生其他物质,如本文所述。所述发酵微生物通常添加至经降解的木素纤维素或其水解物,且将所述发酵进行约8到约96小时,例如约24到约60小时。温度通常为约26°C到约60°C之间,特别是约32°C或50°C,且在约pH3到约pH8,如约pH4_5、6或7。在一个优选方面,将所述酵母和/或另一微生物施用于经降解的木素纤维素或其水解物,且所述发酵进行约12到约96小时,例如通常24-60小时。在一个优选方面,温度优选为约20°C-约60°C,更优选约25°C到约50°C,且最优选约32°C到约50°C,特别是约32°C或50°C,且pH通常为约pH3-约pH7,优选约pH4_7。然而,其中一些,例如细菌发酵生物具有较高的最适发酵温度。酵母或其他微生物优选以每ml发酵液约IO5到IO12,优选约IO7到101(1,特别是约2xl08活细胞计数的量施用。关于使用酵母以供发酵的进一步指导可见于,例如“TheAlcoholTextbook”(K.Jacques,T.P.Lyons和D.R.Kelsall编,NottinghamUniversityPress,UnitedKingdom1999),其通过提述并入本文。对于乙醇产生,在发酵之后,蒸馏经发酵的浆料以提取乙醇。根据本发明的方法获得的乙醇可用作,例如,燃料乙醇,饮用乙醇(即,可饮用的中性酒精),或工业乙发酵刺激剂(fermentationstimulator)可与任何本文所述的酶方法组合以进一步改善所述发酵方法,以及特别是所述发酵微生物的性能,例如,增强速率与乙醇产量。“发酵刺激剂”指针对发酵微生物(具体而言,酵母)生长的刺激剂。优选的对于生长的发酵刺激剂包括维生素与矿物质。维生素的实例包括多种维生素、生物素、泛酸(盐)、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D及E。参见,例如,Alfenore等,ImprovingethanolproductionandviabilityofSaccharomycescerevisiaebyavitaminfeedingstrategyduringfed-batchprocess,Springer-Verlag(2002),其通过提述并入本文。矿物质的实例包括矿物质与无机盐,其可供应包含P、K、Mg、S、Ca、Fe、Zn、Mn和Cu的营养物。发酵产物发酵产物可为任何源自发酵的物质。发酵产物可为,但不限于醇(例如,阿拉伯糖醇、丁醇、乙醇、甘油、甲醇、1,3-丙二醇、山梨醇与木糖醇);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡萄糖酸、蚁酸、富马酸、葡萄糖二酸、葡萄糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸与木质酸);酮(例如,丙酮);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);以及气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)和一氧化碳(CO))。所述发酵产物亦可为作为高价值产物的蛋白质。在一个优选方面,发酵产物为醇。应理解术语“醇”涵盖下述物质,即其包含一个或多个羟基部分(moiety)。在一个更优选方面,醇为阿拉伯糖醇。在另一个更优选方面,醇为丁醇。在另一个更优选方面,醇为乙醇。在另一个更优选方面,醇为甘油。在另一个更优选方面,醇为甲醇,在另一个更优选方面,醇为1,3-丙二醇。在另一个更优选方面,醇为山梨醇。在另一个更优选方面,醇为木糖醇。参见,例如Gong,C.S.,Cao,N.J.,Du,J.禾口Tsao,G.T.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotcchnology,Scheper,T.编,Springer-VerlagBerlinHeidelberg,Germany,65207—241;Silveira,M.M.禾口Jonas,R.,2002,Thebiotechnologicalproductionofsorbitol,Appl.Microbiol.Biotechnol.59400-408;Nigam,P.禾口Singh,D.,1995,Processesforfermentativeproductionofxylitol-asugarsubstitute,ProcessBiochemistry30(2)117-124;Ezeji,T.C.,Qureshi,N.禾口Blaschek,H.P.,2003,Productionofacetone,butanolandethanolbyClostridiumbeijerinckiiBAlOlandinsiturecoverybygasstripping,WorldJournalofMicrobiologyandBiotechnology19(6)595-603。在另一个优选方面,发酵产物为有机酸。在另一个更优选方面,有机酸为乙酸。在另一个更优选方面,有机酸为醋酮酸。在另一个更优选方面,有机酸为己二酸。在另一个更优选方面,有机酸为抗坏血酸。在另一个更优选方面,有机酸为柠檬酸。在另一个更优选方面,有机酸为2,5-二酮-D-葡萄糖酸。在另一个更优选方面,有机酸为蚁酸。在另一个更优选方面,有机酸为富马酸。在另一个更优选方面,有机酸为葡萄糖二酸。在另一个更优选方面,有机酸为葡萄糖酸。在另一个更优选方面,有机酸为葡糖醛酸。在另一个更优选方面,有机酸为戊二酸。在另一个更优选方面,有机酸为3_羟基丙酸。在另一个更优选方面,有机酸为衣康酸。在另一个更优选方面,有机酸为乳酸。在另一个更优选方面,有机酸为苹果酸。在另一个更优选方面,有机酸为丙二酸。在另一个更优选方面,有机酸为草酸。在另一个更优选方面,有机酸为丙酸。在另一个更优选方面,有机酸为琥珀酸。在另一个更优选方面,有机酸为木糖酸。参见,例如,Chen,R.禾口Lee,Y.Y.,1997,Membrane-mediatedextractivefermentationforlacticacidproductionfromcellulosicbiomass,Appl.Biochem.Biotechnol.63-65435—448。在另一个优选方面,发酵产物为酮。应理解术语“酮”涵盖含有一个或多个酮部分的物质。在另一个更优选方面,酮为丙酮。参见,例如,Qureshi和Blaschek,2003,见上。在另一个优选方面,发酵产物为氨基酸。在另一个更优选方面,氨基酸为天冬氨酸。在另一个更优选方面,氨基酸为谷氨酸。在另一个更优选方面,氨基酸为甘氨酸。在另一个更优选方面,氨基酸为赖氨酸。在另一个更优选方面,氨基酸为丝氨酸。在另一个更优选方面,氨基酸为苏氨酸。参见,例如,Richard,Α.和Margaritis,Α.,2004,Empiricalmodelingofbatchfermentationkineticsforpoly(glutamicacid)productionandothermicrobialbiopolymers,BiotechnologyandBioengineering87(4)501-515。在另一个优选方面,发酵产物为气体。在另一个更优选方面,气体为甲烷。在另一个更优选方面,气体为H2。在另一个更优选方面,气体为co2。在另一个更优选方面,气体为CO。参见,例如,Kataoka,N.,A.Miya和K.Kiriyama,1997,Studiesonhydrogenproductionbycontinuousculturesystemofhydrogen-producinganaerobicbacteria,WaterScienceandTechnology36(6-7)41-47;禾口GunaseelanV.N.于BiomassandBioenergy,Vol.13(1—2),pp.83-114,1997,AnaerobicdigestionofbiomassformethaneproductionAreview。Ml发酵产物可任选地自发酵培养基使用任何本领域已知方法加以回收,方法包括但不仅限于层析、电泳方法、差示溶解度、蒸馏或提取。举例而言,醇自经发酵的纤维素材料分离并通过常规蒸馏方法纯化。可获取纯度高至约96vol.%的乙醇,其可用作,例如燃料乙醇、饮用乙醇(即,可饮用的中性酒精)或工业乙醇。信号月太本发明还涉及编码信号肽的分离的多核苷酸,所述信号肽包含SEQIDNO2的氨基酸1到19,或者由SEQIDNO2的氨基酸1至19组成。本发明还涉及核酸构建体,所述核酸构建体包含编码蛋白质的基因,其中所述基因与所述编码信号肽的多核苷酸可操作地连接,所述信号肽包含SEQIDNO2的氨基酸1到19,或者由SEQIDNO2的氨基酸1至19组成,其中所述基因对于所述多核苷酸是外源的。在优选的方面,所述多核苷酸的核苷酸序列包含SEQIDNO1的核苷酸1_57或由SEQIDNO1的核苷酸1-57组成。本发明还涉及包含这样的核苷酸构建体的重组表达载体和重组宿主细胞。本发明还涉及产生蛋白质的方法,包括(a)在适合于产生所述蛋白质的条件下培养这样的重组宿主细胞;和(b)回收所述蛋白质。所述蛋白质对于宿主细胞可以是天然的或异源的。术语“蛋白质”在本文的意思不是指特定长度的编码产物,并因此包括肽、寡肽和蛋白质。术语“蛋白质”还包括组合以形成编码产物的两种或更多种多肽。所述蛋白质还包括杂合多肽,其包含部分或全部从至少两种不同的蛋白质获得的多肽序列的组合,其中一种或多种(几种)对于宿主细胞可以是异源或天然的。蛋白质进一步包括上述蛋白质和杂合蛋白质天然存在的等位基因变异和工程化变异。蛋白质优选是激素或其变体、酶、受体或其部分、抗体或其部分,或报告蛋白(reporter)。在更优选的方面,所述蛋白质是氧化还原酶、转移酶、水解酶、裂合酶(lyase)>异构酶或连接酶。在更加优选的方面,所述蛋白质是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、另外的脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。基因可以获得自任何原核、真核或其他来源。通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。实施例材料用作缓冲液和底物的化学品是至少试剂级的商业产品。DNA测序DNA测序使用AppliedBiosystemsModel3130XGeneticAnalyzer(AppliedBiosystems,FosterCity,CA,USA)利用染料终止子化学(dyeterminatorchemistry)(Giesecke等,1992,JournalofVirol.Methods3847-60)进行。使用phred/phrap/consed程序(UniversityofWashington,Seattle,WA,USA)用序列特异性引物装配序列。菌株使用巴西青霉IBT20888(IBTCultureCollectionofFungi,TechnicalUniversityofDenmark,Copenhagen,Denmark)作为β-葡糖苷酶的来源。培养基和溶液TE由IOmMTris-ImMEDTA组成。LB培养基由每升IOg胰蛋白胨、5g酵母提取物和5g氯化钠组成。LB平板由每升IOg胰蛋白胨、5g酵母提取物、5g氯化钠和15g细菌琼脂组成。STC由1.2M山梨醇、IOmMTris-HCl和IOmMCaCl2,pH7.5组成。PEG溶液由60%PEG4000、IOmMTris-HCl和IOmMCaCl2,pH7.5组成。YPM培养基由每升IOg酵母提取物、20g蛋白胨和2%麦芽糖组成。实施例1从巴西青霉分离基因组DNA将巴西青霉菌株IBT20888的孢子根据Carlsen,1994,Ph.D.thesis,DepartmentofBiotechnology,TheTechnicalUniversityofDenmark在稻米上繁殖。所述孢子用2Oml0.1%Tween20回收,并以每mlIxlO6个孢子的浓度接种于500ml带挡板的摇瓶中的IOOrnl含有1%葡萄糖的Mandels和Weber培养基(Mandels和Webcr,1969,Adv.Chem.Ser.95394-414),其每升补充以0.25g酵母提取物和0.75g细菌蛋白胨。真菌菌丝体在30°C,150rpm有氧生长24小时后收获。菌丝体经由通过NALGENEDS0281-5000过滤器(NalgeNuncInternationalCorporation,Rochester,NY,USA)过滤至干燥来收集,并在液氮中冷冻。将冻结的菌丝体在经干冰冷却的钵中磨为粉末,并分配至螺旋帽试管中。将所述粉末悬浮于总体积40ml含0.5%十二烷基硫酸锂和0.5mMEDTA的50mMCAPS(3-(环己基氨基)-1-丙磺酸)-NaOHpHll缓冲液。将悬浮液置于60°C2小时,并通过颠倒定期重悬。向所述悬浮液添加等体积用0.1MTris碱中和的酚氯仿(11ν/ν),并将所述试管在旋转轮(rotatingwheel)上在37°C混合2小时。在SorvallH1000B转子中在2500rpm离心10分钟后,将水相(上层相)用酚氯仿(1lv/v)再次萃取,并在15000xg下离心5分钟。将来自第二次萃取的水相配为2.5M乙酸铵(母液10M),并置于_20°C直至冻结。解冻后,将萃取物在15000xg下在冷转子中离心20分钟。舍弃沉淀(主要是rRNA),并将上清中的核酸通过添加0.7体积异丙醇来沉淀。在15000xg离心15分钟后,将沉淀用5ml70%乙醇润洗三次(不进行重悬),空气干燥到近乎完全,并在1.0ml0.1XTE中溶解。将溶解的沉淀转移至两个1.5ml微离心管中。所述核酸通过添加乙酸铵(0.125ml)到2.0M和添加乙醇到63%(1.07ml)并在SorvallMCI2V微离心机(KendroLaboratoryProducts,Asheville,NC,USA)中以最大速度离心10分钟来沉淀。所述沉淀用70%乙醇润洗两次,空气干燥至完全,并溶解于500μ10.1ΧΤΕ中。实施例2制备基因组DNA文库基因组文库使用ΤΟΡΟShotgunSubcloningKit(Invitrogen,Carlsbad,CA,USA)构建。简言之,将总细胞DNA通过在IOpsi氮气下喷雾(nebulization)15分钟来剪切(shear),并在1%琼脂糖凝胶上使用40mMTris碱_20mM乙酸钠-ImMEDTA二钠盐(TAE)缓冲液进行大小分级(size-fractionate)。将以3_6kb范围大小迁移的DNA片段切出,并使用MINIELUTEGelExtractionKit(QIAGENInc,Valencia,CA,USA)洗脱。将洗脱的片段重新使用琼脂糖凝胶如上所述进行大小分级,并将以3-6kb范围大小迁移的DNA片段切出,并使用MINIELUTEGelExtractionKit洗脱。对洗脱出的DNA片段进行平端修复(bluntendrepair),并使用虾碱性磷酸酶(RocheAppliedScience,Manheim,Germany)脱磷酸。将所述平端DNA片段根据供应商的说明克隆入pCR4Blunt_TOPO载体(Invitrogen,Carlsbad,CA,USA),通过电穿孔转化入电感受态(electrocompetent)的大肠杆菌TOPlO细胞,并在补充了每mlIOOyg氨苄西林的LB平板上铺板。电穿孔得到了15300个克隆。实施例3纯化巴西青霉β-葡糖苷酶巴西青霉菌株IBT20888在5升生物反应器中的4升Mandels和Weber培养基中生长,所述培养基每升补充有Ig酵母提取物、3g细菌蛋白胨、30g纤维素和IOg木聚糖。将孢子在稻米上根据Carisen(1994,见上文)繁殖。以每mllxlO6个孢子的浓度接种所述生物反应器。通过添加2MNH4OH或2MHC1将pH维持在5.0。将温度维持在30°C。以每分钟4升和300-500rpm通气。111小时后,终止培养,并将发酵液通过玻璃纤维过滤器(GD120,Advantec,Japan)过滤。β-葡糖苷酶活性在室温在50mM柠檬酸钠ρΗ4.8中测定。底物为在50mM柠檬酸钠pH4.8中的ImM4-硝基苯基-β-D-吡喃葡萄糖苷。所述β-葡糖苷酶水解4-硝基苯酚和葡萄糖之间的葡萄糖配基键(agluconicbond)。释放出的4-硝基苯酚在碱性溶液中是黄色的并可在405nm通过分光光度法确定。一个国际单位的活性(U)定义为每分钟在pH4.8,25°C释放出1μιηο14-硝基苯酚的酶量。蛋白质浓度通过SDS-PAGE确定。将十五μ1的样品添加到在EPPENDORF管中的15μ1SDS-PAGE样品缓冲液(1.17Μ蔗糖,lMTris-HCl,pH8.5,278mMSDS,2.05mMEDTA,0.88mMBrilliantBlueG,和0.2M二硫苏糖醇)中,并加热至70°C10分钟。在加热后,将稀释的样品上样到预制的4-12%BisTris预制凝胶(Invitrogen,Groningen,TheNetherlands)上。此外,将MARK12蛋白质标准混合物(Invitrogen,Carlsbad,CA,USA)上样到凝胶上。将所述凝胶在XcellSURELOCK凝胶装置(Invitrogen,Carlsbad,CA,USA)中在200V运行50分钟。运行缓冲液通过将标准缓冲液(1MMOPS,IMTRIS和1%SDS)稀释20倍来制备。将0.5ml体积NuPAGEAntioxidant(Invitrogen,Carlsbad,CA,USA)添加到上面的(阴极)缓冲液室(bufferchamber)中。在电泳后将凝胶在染色溶液中温育60分钟,所述染色溶液由0.1%(w/v)溶解于10%乙酸,40%甲醇和50%水的考马斯亮蓝R-250组成。所述凝胶的脱色在10%乙酸,30%甲醇和60%水中进行。在纯化前,将滤过物浓缩,并使用装备有具有IOkDa截断值(cut-off)的PMlO膜(Millipore,Bedford,MA,USA)的超滤装置(ultrafiltrationunit)缓冲液更换至20mM三乙醇胺(TEA)-HClpH7.5中。酶纯化在室温使用FPLC系统(AmershamBioscience,Uppsala,Sweden)进行。在每步纯化之间,将汇集的级分中的缓冲液使用具有IOkDa截断值的Amicon超滤装置或3.5mlMICROSEP超滤装置(PallLifeSciences,AnnArbor,MI,USA)交换为样品缓冲液。在280nm监视β-葡糖苷酶的洗脱。将渗余物(38.5ml)上样至填充了75mlQSEPHAROSEHP(AmershamBioscience,Uppsala,Sweden)的XK26柱上。所述柱用180ml样品缓冲液洗涤。所述样品缓冲液为20mMTEA-HClpH7.5。所述酶用高至50%(超过800ml)的含IM的20mMTEA-HClpH7.5梯度洗脱。收集IOml级分,分析其β-葡糖苷酶活性,并汇集级分81到85。将来自前述步骤的渗余物(2.0ml)上样至SUPERDEX7510/300GL柱(AmershamBioscience,Uppsala,Sweden),使用含200mMNaCl的100mMNaCH3C02pH4.8作为样品缓冲液。用60ml该缓冲液洗脱所述酶。收集2ml级分,分析其β-葡糖苷酶活性,并基于活性和纯度(SDS-PAGE)汇集级分6到9。将来自SUPERDEX75步骤的渗余物(14ml)上样至6mlRESOURCEQ柱(AmershamBioscience,Uppsala,Sweden),使用10mMNaCH3C02pH4.8作为样品缓冲液。所述柱用30ml样品缓冲液洗涤。所述酶用高至50%(超过180ml)的500mMNaCH3C02pH4.8梯度洗脱。收集2ml级分,分析其葡糖苷酶活性,并通过SDS-PAGE基于活性和表向相对纯度(appearingrelativelypure)选取级分75以供N-端测序。实施例4N-端测序将经纯化的巴西青霉β-葡糖苷酶(实施例3)的100μ1等分试样添加至在EPPENDORF管中的100μ1SDS-PAGE样品缓冲液(4ml0.5MTris_HClpH6.8,20ml10%SDS,20ml甘油(87%),56mlMILLI-Q过滤的H2O,和15粒溴酚蓝)并加热至95°C4分钟。在加热后,将稀释样品的四个20μ1等分试样分别上样至预制的4-20%SDS聚丙烯酰胺凝胶(Invitrogen,Carlsbad,CA,USA)。除了四个含有样品的泳道外,还将MARK12蛋白质标准混合物上样至所述凝胶。将凝胶在XcellSURELOCK凝胶装置中运行90分钟,起始电源设定为40mA,最大135V。在电泳后,将所述凝胶在印迹溶液(blottingsolution)中温育5分钟,所述印迹溶液由含6%甲醇的1OmMCAPSpH11组成。将PROBLOTT膜(AppliedBiosystems,FosterCity,CA,USA)在纯甲醇中润湿1分钟,然后置于印迹溶液中5分钟以用含6%甲醇的IOmMCAPSpH11饱和所述膜。电印迹在SemiDryBlotterII装置(KemEnTec,Copenhagen,Denmark)中如下所述进行。将6片在所述印迹溶液中润湿的Whatmanno.l纸置于所述印迹装置阳极上,继以ProBlott膜,聚丙烯酸凝胶,和六片在印迹溶液中润湿的Whatmanno.l纸。由此将所述印迹装置组装,将阴极与Whatmanno.l纸垛的上层相接触。将11.3kg的重量置于所述印迹装置顶上。电印迹在175mA的电流下进行180分钟。在电印迹后,将PROBLOTT膜在溶解于60%甲醇,乙酸,39%H2O的0.1%(w/v)考马斯亮蓝R-250中染色1分钟。所述ProBlott膜的脱色在40%甲醇水溶液中进行5分钟,然后将膜在去离子水中润洗。最后将PROBLOTT膜风干。对于N-端氨基酸测序,将两片由105kDa条带组成的PROBLOTT膜切出,并置于PROCISEProteinSequencer(AppliedBiosystems,FosterCity,CA,USA)的印迹盒(blottingcartridge)中。N_端测序使用用于膜样品的方法运行档案(methodranfile)(PulsedliquidPVDF)根据生产商的指示进行。N-端氨基酸序列自所得的色谱图通过将色谱图中峰的保留时间与标准色谱图中PTH-氨基酸的保留时间相比较来推导。经纯化的巴西青霉β-葡糖苷酶的N-端氨基酸序列使用PROCISE494HTSequencingSystem(AppliedBiosystems,FosterCity,CA,USA)直接确定。N-端序列石角定为Lys-Asp-Leu-Ala-Tyr-Ser-Pro-Pro-Tyr-Tyr-Pro-Ser-Pro-Trp-Ala-Thr-Gly-Glu-GIy-Asp(SEQIDNO2的氨基酸20到39)。实施例5PCR扩增基于经纯化的巴西青霉β-葡糖苷酶(实施例4)的N-端氨基酸序列,如下所示使用CODEHOP策略(Rose等,1998,NucleicAcidsRes.261628-35)设计了正向引物。从关于其他β-葡糖苷酶的数据库信息,使用CODEHOP策略设计了两个反向引物。正向引物5'-TCTCCTCCTTACTACCCTTCTCCNTGGGCNAC-3'(SEQIDNO3)反向引物5‘-GTCGGTCATGACGAAGCCNKGRAANCC-3‘(SEQIDNO4)其中R=A或G,Y=C或T,K=G或Τ,而Ν=Α、C、G或T扩增反应物(30μ1)使用大约Iyg巴西青霉基因组DNA作为模板制备。此外,每个反应物含有下述组分30pmol正向引物,30pmol反向引物,dATP、dCTP、dGTP和dTTP各200μΜ,IXAMPLITAQDNA聚合酶(AppliedBiosystems,FosterCity,CA,USA)。将反应物在ROBOCYCLER温度循环仪(Stratagene,LaJolla,CA,USA)中温育,其程序为1个循环,96°C3分钟,和72°C3分钟;34个循环,每个循环950C0.5分钟,56°C0.5分钟和72°C1.5分钟;1个循环,72°C7分钟;和6°C的浸泡循环。在第一个循环中在72°C添加Taq聚合酶。PCR反应产物使用TAE缓冲液在2%琼脂糖凝胶(Amresco,Solon,OH,USA)上来分离。将大约950bp的条带从凝胶切出,并使用MINIELUTEGelExtractionKit(QIAGENInc.,Valencia,CA,USA)根据生产商的指示纯化。将纯化的PCR产物随后根据生产商的指示克隆入PCR2.1TOPO载体(Invitrogen,Carlsbad,CA,USA)以产生命名为PCR2.1GH3B的载体(图2),并通过DNA测序分析以确证其作为家族3糖基水解酶的部分序列的身份(identity)。实施例6筛选基因组文库进行菌落转移(colonylift)(Maniatis等,I982,MolecularCloning,ALaboratoryManual,ColdSpringHarborPress,ColdSpringHarbor,NewYork),并将DNA在80°C交联至HYBONDN+膜(Amersham,ArlingtonHeights,IL)上2小时。将来自菌落转移的膜使用0.2XSSC(0.03MNaCl,0.003M柠檬酸钠),0.2%SDS预润湿。将经预润湿的滤纸置于具有每张滤纸7.5ml杂交溶液(6XSSPE,7%SDS)的烧杯中,在68°C振荡水浴0.5小时。将实施例5中所述经亚克隆的PCR扩增产物从pCR2.1GH3A通过PCR扩增进行扩增,使用与载体同源的引物,如下所示5‘-CTTGGTACCGAGCTCGGATCCACTA-3‘(SEQIDNO5)5‘-ATAGGGCGAATTGGGCCCTCTAGAT-3‘(SEQIDNO6)扩增反应物(30μ1)使用大约50ngpCR2.1GH3B作为模板制备。此外,每个反应物含有下列组分每种引物五十皮摩尔,IXTaq缓冲液(NewEnglandBiolabs,Beverly,ΜΑ),dATP、dTTP、dGTP和dCTP各15pmol和0.5单位TaqDNA聚合酶(NewEnglandBiolabs,Beverly,ΜΑ)。将反应物在ROBOCYCLER中温育,其程序为1个循环,94°C,1分钟;和20个循环,每个循环94°C,30秒,55°C,60秒和72°C,1分钟。然后使加热块进入4°C浸泡循环。反应产物在2.0%琼脂糖凝胶上使用TAE缓冲液分离,并从凝胶上切出Ikb产物条带再使用QIAQUICKGelExtractionKit(QIAGENInc.,Valencia,CA,USA)根据生产商的指示纯化。将大约40ng使用PRIME-ITΠKit(Stratagene,LaJolla,CA,USA)根据生产商的指示用随机引物标记。将经放射性标记的基因片段自未掺入的核苷酸使用MINIELUTEPCRPurificationKit(QIAGENInc.,Valencia,CA,USA)分离。放射性探针通过添加5.0MNa()H至终浓度0.5M来变性,并以大约每ml杂交溶液大约0.5xl06cpm的活性添加至杂交溶液。将混合物在68°C在振荡水浴中温育10小时。在温育后,在68°C在0.2XSSC,0.2%SDS中将所述膜洗涤三次。然后将所述膜在印迹用纸(blottingpaper)上干燥15分钟,包裹在SARANWRAP中,并在_80°C用增感屏(intensifyingscreen)(Kodak,Rochester,NY,USA)暴露于X-射线胶片过夜。将与探针产生杂交信号的菌落接种至ImlLB培养基中并在37°C培养过夜,所述培养基补充以每mlIOOyg氨苄西林。制备每种溶液的稀释,并将100μ1涂布到补充以每ml100μg氨苄西林的LB琼脂板上。选取产生每平板约40个菌落的每个阳性的稀释以供二次转移(secondarylift)。所述转移如上所述进行准备,杂交并探测(probe)。将每个阳性平板的两个克隆接种至3ml的LB培养基上并在37°C培养过夜,所述培养基补充以每mlIOOyg的氨苄西林。从每个菌落使用BIOROBOT9600(QIAGENInc,Valencia,CA,USA)根据生产商的指示制备小量制备DNACminiprepDNA)。每个插入的大小通过EcoRI消化和琼脂糖凝胶电泳来确定。一个命名为AF的克隆包含大约1.7kb的插入。测序表明所述克隆编码在实施例4中确定的预期的N-端氨基酸序列,并在下文中称为pKKAF(图3)。实施例7表征编码β-葡糖苷酶的巴西青霉基因组序列来自pKKAF的巴西青霉β-葡糖苷酶基因的DNA测序用AppliedBiosystemsModel3700AutomatedDNASequencer(AppliedBiosystems,FosterCity,CA,USA)使用引物步移(primerwalking)技术用染料终止子化学确定(Gieseckeetal.,1992,J.Virol.Methods3847-60)。基因组编码序列(SEQIDNO1)和推导的氨基酸序列(SEQIDNO2)示于图IA和IB。1081bp的基因组编码序列编码267个氨基酸的部分多肽,由4个92bp、63bp、72bp和54bp的内含子分断。所述部分基因的%G+C含量是54.2%。使用SignalP软件程序(Nielsen等,1997,ProteinEngineering101-6),预测出19个残基的信号肽,对应于由N-端氨基酸测序确定的信号肽。用FASTA程序包,版本3.4(Pearson和D.J.Lipman,1988,PNAS852444,andPearson,1990,MethodsinEnzymology18363)使用缺省参数在公共数据库中搜索相似序列。使用如在EMBOSS的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48443-453)用缺口产生罚分10、缺口延伸罚分0.5和EBLOSUM62矩阵来确定最相似氨基酸序列的比较配对全局比对。比对显示巴西青霉GH3B成熟部分多肽的推导的氨基酸序列与来自橙色嗜热子囊菌(UniProt登录号Q0ZUL0)和埃默森踝节菌(Talaromycesemersonii)(UniProtQ8TGI8)的家族3糖苷水解酶的推导的氨基酸序列分别共享83.1%和79.6%同一性(排除缺口)。本发明进一步由下述编号的段落描述[1]具有葡糖苷酶活性的分离的多肽,其选自下组(a)—种包含如下氨基酸序列的多肽,所述氨基酸序列包含与SEQIDNO:2的氨基酸20到267的部分氨基酸序列具有至少85%同一性的部分氨基酸序列;(b)—种由包含如下核苷酸序列的多核苷酸编码的多肽,所述核苷酸序列包含在至少高严紧条件下与以下杂交的部分核苷酸序列(i)SEQIDNO1的核苷酸58到1081的部分核苷酸序列,(ii)包含于SEQIDNO1的核苷酸58到1081的部分核苷酸序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;(c)一种由包含如下核苷酸序列的多核苷酸编码的多肽,所述核苷酸序列包含与SEQIDNO1的核苷酸58到1081的部分核苷酸序列具有至少85%同一性的部分核苷酸序列;和(d)一种包含如下氨基酸序列的变体,所述氨基酸序列包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQIDNO2的氨基酸20到267的部分氨基酸序列。[2]段落1的多肽,其包含氨基酸序列,所述氨基酸序列包含与SEQIDNO:2的氨基酸20到267具有至少85%同一性的部分氨基酸序列。[3]段落2的多肽,其包含氨基酸序列,所述氨基酸序列包含与SEQIDNO:2的氨基酸20到267具有至少90%同一性的部分氨基酸序列。[4]段落3的多肽,其包含氨基酸序列,所述氨基酸序列包含与SEQIDNO:2的氨基酸20到267具有至少95%同一性的部分氨基酸序列。[5]段落4的多肽,其包含氨基酸序列,所述氨基酸序列包含与SEQIDNO:2的氨基酸20到267具有至少97%同一性的部分氨基酸序列。[6]段落1的多肽,其包含含有SEQIDNO2的氨基酸20到267的部分氨基酸序列的氨基酸序列或其具有葡糖苷酶活性的片段。[7]段落6的多肽,其包含含有SEQIDNO2的氨基酸20到267的部分氨基酸序列的氨基酸序列。[8]段落1的多肽,其由包含如下核苷酸序列的多核苷酸编码,所述核苷酸序列包含在至少高严紧条件下与以下杂交的部分核苷酸序列(i)SEQIDNO:1的核苷酸58到1081的部分核苷酸序列,(ii)包含于SEQIDNO1的核苷酸58到1081的部分核苷酸序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;[9]段落1的多肽,其由包含如下核苷酸序列的多核苷酸编码,所述核苷酸序列包含与SEQIDNO1的核苷酸58到1081的核苷酸序列具有至少85%同一性的部分核苷酸序列。[10]段落9的多肽,其由包含如下核苷酸序列的多核苷酸编码,所述核苷酸序列包含与SEQIDNO1的核苷酸58到1081的核苷酸序列具有至少90%同一性的部分核苷酸序列。[11]段落10的多肽,其由包含如下核苷酸序列的多核苷酸编码,所述核苷酸序列包含与SEQIDNO1的核苷酸58到1081的核苷酸序列具有至少95%同一性的部分核苷酸序列。[12]段落11的多肽,其由包含如下核苷酸序列的多核苷酸编码,所述核苷酸序列包含与SEQIDNO1的核苷酸58到1081的核苷酸序列具有至少97%同一性的部分核苷酸序列。[13]段落1的多肽,其由包含如下核苷酸序列的多核苷酸编码,所述核苷酸序列包含SEQIDNO1的核苷酸58到1081的部分核苷酸序列,或其编码具有β-葡糖苷酶活性的片段的亚序列。[14]段落13的多肽,其由包含如下核苷酸序列的多核苷酸编码,所述核苷酸序列包含SEQIDNO1的核苷酸58到1081的部分核苷酸序列。[15]段落1的多肽,其中所述多肽是包含如下氨基酸序列的变体,所述氨基酸序列包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQIDNO2的氨基酸20到267的部分氨基酸序列。[16]分离的多核苷酸,其包含编码段落1-15任一项所述的多肽的核苷酸序列。[17]段落16的分离的多核苷酸,其包含核苷酸序列,所述核苷酸序列在SEQIDNO1的核苷酸58到1081的部分核苷酸序列中包含至少一个突变,其中所述突变的部分核苷酸序列编码SEQIDNO2的氨基酸20到267的部分氨基酸序列。[18]核酸构建体,其包含段落16或17的多核苷酸,所述多核苷酸可操作地连接于一个或多个(几个)调控序列,所述调控序列指导该多肽在表达宿主中产生。[19]重组表达载体,其包含段落18的核酸构建体。[20]重组宿主细胞,其包含段落18的核酸构建体。[21]产生段落1-15任一项所述多肽的方法,包括(a)在有益于该多肽产生的条件下培养细胞,所述细胞以其野生型形式产生该多肽;和(b)回收所述多肽。[22]产生段落1-15任一项所述多肽的方法,包括(a)在有益于该多肽产生的条件下培养包含核酸构建体的宿主细胞,所述核酸构建体包含编码该多肽的核苷酸序列;和(b)回收所述多肽。[23]产生亲本细胞的突变体的方法,包括破坏或缺失编码段落1-15任一项所述多肽的核苷酸序列,其导致所述突变体与所述亲本细胞相比产生较少的该多肽。[24]通过段落23的方法产生的突变体细胞。[25]段落24的突变体细胞,另外还包含编码天然或异源蛋白质的基因。[26]产生蛋白质的方法,包括(a)在有益于产生所述蛋白质的条件下培养段落25的突变体细胞;和(b)回收该蛋白质。[27]段落16或17所述的分离的多核苷酸,通过下述方法获得(a)在至少高严紧度的条件下将DNA群体与下述杂交(i)SEQIDNO:1的核苷酸58到1081的部分核苷酸序列;Gi)包含于SEQIDNO1的核苷酸58到1081的部分核苷酸序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;和(b)分离所述杂交的多核苷酸,其编码具有β-葡糖苷酶活性的多肽。[28]产生包含突变体核苷酸序列的多核苷酸的方法,所述突变体核苷酸序列编码具有β-葡糖苷酶活性的多肽,该方法包括(a)将至少一个突变导入SEQIDNO1的核苷酸58到1081的部分核苷酸序列中,其中所述突变体核苷酸序列编码包含如下氨基酸序列的多肽,所述氨基酸序列包含SEQIDNO:2的氨基酸20到267的部分氨基酸序列;和(b)回收包含所述突变体核苷酸序列的多核苷酸。[29]通过段落28的方法产生的突变体多核苷酸。[30]产生多肽的方法,包括(a)在有益于产生所述多肽的条件下培养包含编码所述多肽的段落29的突变体多核苷酸的细胞;和(b)回收所述多肽。[31]产生段落1-15任一项所述多肽的方法,包括(a)在有益于产生所述多肽的条件下培养转基因植物或植物细胞,所述转基因植物或植物细胞包含编码所述多肽的多核苷酸;和(b)回收所述多肽。[32]转基因植物、植物部分或植物细胞,其用编码段落1-15任一项所述的多肽的多核苷酸转化。[33]双链抑制性RNA(dsRNA)分子,其包含段落16或17的多核苷酸的亚序列,其中所述dsRNA任选地为SiRNA或miRNA分子。[34]段落33的双链抑制性RNA(dsRNA)分子,其在长度上为约15、16、17、18、19、20、21、22、23、24、25或更多个双链体核苷酸。[35]在细胞中抑制具有β-葡糖苷酶活性的多肽表达的方法,其包括对所述细胞施用或在所述细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含段落16或17的多核苷酸的亚序列。[36]段落35的方法,其中所述dsRNA在长度上为约15、16、17、18、19、20、21、22、23、24、25或更多个双链体核苷酸。[37]降解或转化纤维素材料的方法,包括在段落1-15任一项所述的具有β-葡糖苷酶活性的多肽存在下用纤维素分解酶组合物处理所述纤维素材料,其中所述具有β-葡糖苷酶活性的多肽的存在与所述具有β-葡糖苷酶活性的多肽不存在时相比增加纤维素材料的降解。[38]段落37的方法,所述纤维素材料经预处理。[39]段落37或38的方法,其中所述纤维素分解酶组合物包含一种或多种纤维素分解酶,其选自下组纤维素酶、内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。[40]段落37-39任一项所述的方法,其中所述纤维素分解酶组合物另外还包括具有纤维素分解增强活性的多肽。[41]段落37-40任一项所述的方法,其中所述纤维素分解酶组合物另外还包括一种或更多选自下组的酶半纤维素、酯酶、蛋白酶、漆酶或过氧化物酶。[42]段落37-41任一项所述的方法,另外还包括回收降解的纤维素材料。[43]段落42的方法,其中所述降解的纤维素材料是糖。[44]段落43的方法,其中所述糖选自下组葡萄糖、木糖、甘露糖、半乳糖和阿拉伯糖。[45]产生发酵产物的方法,包括(a)用纤维素分解酶组合物在段落1-15任一项所述的具有β-葡糖苷酶活性的多肽存在下糖化纤维素材料,其中所述具有葡糖苷酶活性的多肽的存在与所述具有β“葡糖苷酶活性的多肽不存在时相比增加纤维素材料的降解;(b)用一种或多种发酵微生物发酵步骤(a)的经糖化的纤维素材料以产生发酵产物;以及(c)从发酵回收发酵产物。[46]段落45的方法,其中所述纤维素材料经预处理。[47]段落45或46的方法,其中所述纤维素分解酶组合物包含一种或多种选自下组的纤维素分解酶纤维素酶、内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。[48]段落45-47任一项所述的方法,其中所述纤维素分解酶组合物另外还包含具有纤维素分解增强活性的多肽。[49]段落45-48任一项所述的方法,其中所述纤维素分解酶组合物另外还包含一种或多种选自下组的酶半纤维素酶、酯酶、蛋白酶、漆酶或过氧化物酶。[50]段落45-49任一项所述的方法,其中步骤(a)和(b)同时在同时糖化和发酵中进行。[51]段落45-50任一项所述的方法,其中所述发酵产物是醇、有机酸、酮、氨基酸或气体。[52]发酵纤维素材料的方法,包括用一种或多种发酵微生物发酵所述纤维素材料,其中将所述纤维素材料用纤维素分解酶组合物在段落1-15任一项所述的具有β-葡糖苷酶活性的多肽存在下糖化,且所述具有葡糖苷酶活性的多肽的存在与所述具有β_葡糖苷酶活性的多肽不存在时相比增加纤维素材料的降解。[53]段落52的方法,其中所述纤维素材料的发酵产生发酵产物。[54]段落53的方法,另外还包含从发酵回收发酵产物。[55]段落52-54任一项所述的方法,其中所述纤维素材料在糖化前经预处理。[56]段落52-55任一项所述的方法,其中所述纤维素分解酶组合物包含一种或多种选自下组的纤维素分解酶纤维素酶、内切葡聚糖酶、纤维二糖水解酶和葡糖苷酶。[57]段落52-56任一项所述的方法,其中所述纤维素分解酶组合物另外还包含具有纤维素分解增强活性的多肽。[58]段落52-57任一项所述的方法,其中所述纤维素分解酶组合物另外还包含一种或多种选自下组的酶半纤维素酶、酯酶、蛋白酶、漆酶或过氧化物酶。[59]段落52-58任一项所述的方法,其中所述发酵产物是醇、有机酸、酮、氨基酸或气体。[60]编码信号肽的分离的多核苷酸,所述信号肽包含SEQIDNO2的氨基酸1到19,或由SEQIDNO2的氨基酸1到19组成。[61]核酸构建体,其包含编码蛋白质的基因,所述基因可操纵地连接于段落60的多核苷酸的,其中所述基因对于所述多核苷酸是外源的。[62]重组表达载体,其包含段落61的核酸构建体。[63]重组宿主细胞,其包含段落61的核酸构建体。[64]产生蛋白质的方法,包括(a)在有益于所述蛋白质产生的条件下培养段落63的重组宿主细胞;和(b)回收所述多肽。在本文中描述和要求保护的发明并不局限于本文公开的特定方面的范围,因为这些方面的意欲作为本发明的几个方面的说明。任何等同的方面意欲在本发明的范围之内。事实上,从前述的说明中,除本文中显示和描述的那些之外,本发明的多种修改对本领域技术人员是显而易见的。这样的修改亦意欲落入所附权利要求的范围内。在冲突的情况下,以包括定义的本公开为准。权利要求1.具有β-葡糖苷酶活性的分离的多肽,其选自下组(a)包含如下氨基酸序列的多肽,所述氨基酸序列包含与SEQIDNO:2的氨基酸20到267的部分氨基酸序列具有至少85%同一性的部分氨基酸序列;(b)由包含如下核苷酸序列的多核苷酸编码的多肽,所述核苷酸序列包含在至少高严紧条件下与以下杂交的部分核苷酸序列(i)SEQIDNO:1的核苷酸58到1081的部分核苷酸序列,(ii)包含于SEQIDNO1的核苷酸58到1081的部分核苷酸序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;(C)由包含如下核苷酸序列的多核苷酸编码的多肽,所述核苷酸序列包含与SEQIDNO1的核苷酸58到1081的部分核苷酸序列具有至少85%同一性的部分核苷酸序列;和(d)包含如下氨基酸序列的变体,所述氨基酸序列包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQIDNO2的氨基酸20到267的部分氨基酸序列。2.权利要求1的多肽,其包含含有SEQIDNO2的氨基酸20到267的部分氨基酸序列的氨基酸序列;或其具有葡糖苷酶活性的片段。3.分离的多核苷酸,其包含编码权利要求1或2所述的多肽的核苷酸序列。4.核酸构建体,其包含权利要求3的多核苷酸,所述多核苷酸可操作地连接于一个或多个(几个)调控序列,所述调控序列指导该多肽在表达宿主中产生。5.重组宿主细胞,其包含权利要求4的核酸构建体。6.产生权利要求1或2所述的多肽的方法,包括(a)在有益于所述多肽产生的条件下培养细胞,所述细胞以其野生型形式产生该多肽;和(b)回收所述多肽。7.产生权利要求1或2所述的多肽的方法,包括(a)在有益于所述多肽产生的条件下培养包含核酸构建体的宿主细胞,所述核酸构建体包含编码该多肽的核苷酸序列;和(b)回收所述多肽。8.产生亲本细胞的突变体的方法,包括破坏或缺失编码权利要求1或2所述的多肽的核苷酸序列,其导致所述突变体与所述亲本细胞相比产生较少的该多肽。9.产生权利要求1或2所述的多肽的方法,包括(a)在有益于所述多肽产生的条件下培养转基因植物或植物细胞,所述转基因植物或植物细胞包含编码所述多肽的多核苷酸;和(b)回收所述多肽。10.转基因植物、植物部分或植物细胞,其用编码权利要求1或2所述的多肽的多核苷酸转化。11.双链抑制性RNA(dsRNA)分子,其包含权利要求3的多核苷酸的亚序列,其中所述dsRNA任选地为SiRNA或miRNA分子。12.在细胞中抑制具有葡糖苷酶活性的多肽表达的方法,其包括对所述细胞施用或在所述细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含权利要求3的多核苷酸的亚序列。13.降解或转化纤维素材料的方法,包括在权利要求1或2所述的具有β-葡糖苷酶活性的多肽存在下用纤维素分解酶组合物处理所述纤维素材料,其中所述具有葡糖苷酶活性的多肽的存在与所述具有β“葡糖苷酶活性的多肽不存在时相比增加纤维素材料的降解。14.权利要求13的方法,其中所述纤维素分解酶组合物包含一种或多种选自下组的纤维素分解酶纤维素酶、内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。15.权利要求13或14所述的方法,还包括回收降解的纤维素材料。16.产生发酵产物的方法,包括(a)在权利要求1或2所述的具有β-葡糖苷酶活性的多肽存在下用纤维素分解酶组合物糖化纤维素材料,其中所述具有葡糖苷酶活性的多肽的存在与所述具有葡糖苷酶活性的多肽不存在时相比增加纤维素材料的降解;(b)用一种或多种发酵微生物发酵步骤(a)的经糖化的纤维素材料以产生发酵产物;和(c)从所述发酵回收发酵产物。17.权利要求16的方法,其中所述纤维素分解酶组合物包含一种或多种选自下组的纤维素分解酶纤维素酶、内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。18.发酵纤维素材料的方法,包括用一种或多种发酵微生物发酵所述纤维素材料,其中将所述纤维素材料在权利要求1或2所述的具有β-葡糖苷酶活性的多肽存在下用纤维素分解酶组合物糖化,且所述具有葡糖苷酶活性的多肽的存在与所述具有葡糖苷酶活性的多肽不存在时相比增加纤维素材料的降解。19.权利要求18的方法,其中所述纤维素材料的发酵产生发酵产物。20.编码信号肽的分离的多核苷酸,所述信号肽包含SEQIDNO2的氨基酸1到19,或由SEQIDNO2的氨基酸1到19组成。全文摘要本发明涉及具有β-葡糖苷酶活性的分离的多肽和编码该多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞以及产生和使用所述多肽的方法。文档编号C12P19/02GK102016016SQ200980116406公开日2011年4月13日申请日期2009年3月6日优先权日2008年3月6日发明者保罗·哈里斯,克里斯琴·克罗申请人:诺维信公司