专利名称::具有α-葡糖醛酸糖苷酶活性的多肽和编码该多肽的多核苷酸的制作方法
技术领域:
:本发明涉及具有α-葡糖醛酸糖苷酶活性的分离的多肽以及编码该多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞以及制备和使用所述多肽的方法。
背景技术:
:植物细胞壁多糖构成植物细胞壁的90%并且可以被分成三组纤维素、半纤维素和果胶。纤维素代表细胞壁多糖的主要成分。半纤维素是植物细胞壁的第二丰富的成分。主要的半纤维素聚合物是木聚糖。植物细胞壁内发现的木聚糖的结构可以根据其来源而显著不同,但是它们都含有β-1,4-连接的D-木糖主链。这种β-1,4-连接的D-木糖主链可以被多种侧基取代,如L-阿拉伯糖(L-arabinose)、D_半乳糖、乙酰基、阿魏酰基(feruloyl)、对_香豆酰基和葡萄糖醛酸残基。半纤维素的完全水解需要包括乙酰木聚糖酯酶、阿魏酸酯酶、木聚糖酶、阿拉伯呋喃苷糖酶、木糖苷酶和α-葡糖醛酸糖苷酶的酶复合物的作用。α-葡糖醛酸糖苷酶是负责水解木糖与D-葡萄糖醛酸或其4-0-甲基醚之间的α-1,2-糖苷键的酶。本发明的目的是提供适合于工业方法中使用的具有α-葡糖醛酸糖苷酶活性的新的多肽,所述工业方法例如,包括将纤维素生物质(cellulosicbiomass)转变为有用的产物(包括乙醇)的方法。deWet等人已经披露了67.3%相同的来自出芽短梗霉菌(Aureobasidiumpullulans)白勺α-罾(EnzymeMicrob.Technol.38649-656,2006)。
发明内容本发明涉及α-葡糖醛酸糖苷酶,且具体而言涉及具有与源自桔灰青霉(Penicillumaurantiogriseum)并在SEQIDNO:2中公开的α-葡糖醛酸糖苷酶同源的或相同的氨基酸序列的α-葡糖醛酸糖苷酶。本发明的第一方面提供具有α-葡糖醛酸糖苷酶活性的分离的多肽,其选自下组(a)包含与SEQIDNO:2的成熟多肽具有至少75%、更优选至少80%、更优选至少85%、甚至更优选至少85%、最优选至少90%、和甚至最优选至少95%同一性的氨基酸序列的多肽;(b)由在至少高严紧性条件下与(i)SEQIDN0:1的成熟多肽编码序列,(ii)包含SEQIDNO:1的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链杂交的多核苷酸编码的多肽;(c)由包含与SEQIDNO1的成熟多肽编码序列具有至少75%、更优选至少80%、更优选至少85%、甚至更优选至少85%、最优选至少90%、和甚至最优选至少95%同一性的核苷酸序列的多核苷酸编码的多肽;(d)SEQIDNO:2的成熟多肽包含一个或多个(数个)氨基酸的取代、缺失和/或插入的变体。在第二方面本发明提供包含编码第一方面的多肽的核苷酸序列的分离的多核苷酸。在第三方面本发明提供包含与一种或多种(数种)控制序列可操作地连接的第二方面的多核苷酸的核酸构建体,所述控制序列在宿主表达中指导所述多肽的产生。在第四方面本发明提供包含第三方面的核酸构建体的重组表达载体。在第五方面本发明提供包含第三方面的核酸构建体的重组宿主细胞。在第六方面本发明提供产生第一方面的多肽的方法,其包括(a)在有益于产生所述多肽的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。在第七方面本发明提供产生第一方面的多肽的方法,其包括(a)在有益于产生所述多肽的条件下培养包含核酸构建体的宿主细胞,所述核酸构建体包含编码所述多肽的核苷酸序列;和(b)回收所述多肽。在第八方面本发明提供产生第一方面的多肽的方法,其包括(a)在有益于产生所述多肽的条件下培养包含编码所述多肽的多核苷酸的转基因植物或植物细胞;和(b)回收所述多肽。在第九方面本发明提供用编码第一方面的多肽的多核苷酸转化的转基因植物、植物部分或植物细胞的方法。在第十方面本发明提供产生蛋白质的方法,其包括(a)在有益于产生所述蛋白质的条件下培养第五方面的重组宿主细胞;和(b)回收所述蛋白质。在第11方面本发明提供用于降解或转变生物质材料的方法,其包括用第一方面的多肽处理所述材料。在第12方面本发明提供组合物,其包含第一方面的多肽,和选自乙酰木聚糖酯酶、阿魏酸酯酶、木聚糖酶、阿拉伯呋喃苷糖酶和木糖苷酶中的一种或多种酶。在第13方面本发明提供第一方面的多肽或第12方面的组合物在用于生物质材料水解的方法中的用途,包括将所述生物质与所述多肽或所述组合物接触。定义a-葡糖醛酸糖苷酶活性术语“a-葡糖醛酸糖苷酶活性”在此定义为催化a-D-葡糖醛酸苷+H20=醇+D-葡糖醛酸的反应的EC3.2.1.139活性。就本发明而言,a-葡糖醛酸糖苷酶活性是根据deVries所描述的步骤(J.Bacterid,1998,Vol.180,p.243-249)来测定的。一单位的a_葡糖醛酸糖苷酶活性等于在标题为“测定a-葡糖醛酸糖苷酶活性”的部分中所描述的标准测定条件下每分钟能够1微摩尔葡萄糖醛酸或4-0-甲基葡萄糖醛酸的酶的量。本发明的多肽具有SEQIDNO:2的成熟多肽的a-葡糖醛酸糖苷酶活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,和甚至最优选至少100%。分离的多肽本文所用的术语“分离的多肽”是指从来源分离的多肽。在优选的方面,所述多肽如通过SDS-PAGE测定为至少纯、优选至少5%纯、更优选至少10%纯、更优选至少20%纯、更优选至少40%纯、更优选至少60%纯、甚至更优选至少80%纯、和最优选至少90%纯。基本上纯的多肽术语“基本上纯的多肽”在本文是指多肽制备物,其含有以重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,和甚至最优选至多0.5%的与其天然地或重组地相伴随的(associated)其它多肽物质。因此,优选的是,基本上纯的多肽以制备物中存在的总多肽物质的重量计是至少92%纯、优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少96%纯、更优选至少97%纯、更优选至少98%纯、甚至更优选至少99%、最优选至少99.5%纯、和甚至最优选100%纯。本发明的多肽优选是基本上纯的形式,即,所述多肽制备物实质上不含与其天然地或重组地相伴随的其它多肽物质。这可以通过例如用公知的重组方法或通过经典的纯化方法制备所述多肽来实现。成熟多肽术语“成熟多肽”在本文中定义为在翻译和任何翻译后修饰(如N末端加工、C末端截断、糖基化、磷酸化等)之后,处于其最终形式的具有a-葡糖醛酸糖苷酶活性的多肽。在优选的方面,所述成熟多肽是SEQIDNO:2的氨基酸1至835。成熟多肽编码序列术语“成熟多肽编码序列”在本文中定义为编码具有a-葡糖醛酸糖苷酶活性的成熟多肽的核苷酸序列。在优选的方面,成熟多肽编码序列是SEQIDNO1的核苷酸1至2508。同一性两个氨基酸序列之间或者两个核苷酸序列之间的相关性用参数“同一性”来描述。就本发明而言,两个氨基酸序列之间的同一性程度是使用如EMBOSS软件包(EMBOSSTheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsinGenetics16:276_277)(优选3.0.0或更新的版本)中的Needle程序所执行的Needleman-ffunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48443-453)来测定的。所用的可选参数为缺口形成罚分(gapopenpenalty)10、缺口延伸罚分(gapextensionpenalty)0.5、和EBL0SUM62(BL0SUM62的EMBOSS版本)取代矩阵。将Needle的标记为"longestidentity”(“最长同一性”)(使用-nobrief(无简述)选项获得)的输出结果作为百分比同一性使用,且它是如下计算出来的(相同的残基数xl00)/(比对长度-比对中的缺口总数)就本发明而言,两个脱氧核糖核苷酸序列之间的同一性程度是使用如EMBOSS软(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice^,2000,同上)(优选3.0.0或更新的版本)中的Needle程序所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,同上)来测定的。所用的可选参数为缺口形成罚分10、缺口延伸罚分0.5、禾口EDNAFULL(NCBINUC4.4的EMBOSS版本)取代矩阵。将Needle的标记为"longestidentity"(“最长同一性”)(使用-nobrief选项获得)的输出结果作为百分比同一性使用,且它是如下计算出来的(相同的脱氧核糖核苷酸数XlOO)/(比对长度-比对中的缺口总数)同源序列术语“同源序列”在本文中定义为在用SEQIDNO:2的成熟多肽的tfasty(Pearson,W.R.,1999,TBioinformaticsMethodsandProtocols,S.Misener和S.A.Krawetz,185-219页)得到小于0.001的E值(或称期望得分)的预测蛋白质。或者,术语“同源序列”定义为与SEQIDNO2的成熟多肽具有优选至少75%、更优选至少80%、更优选至少85%、甚至更优选至少90%、最优选至少95%、和甚至最优选至少96%、至少97%、至少98%或至少99%同一性程度的氨基酸序列,所述氨基酸序列具有α-葡糖醛酸糖苷酶活性。多肽片段术语“多肽片段”在本文中定义为从SEQIDNO2的成熟多肽的氨基末端和/或羧基末端缺失一个或多个(数个)氨基酸的多肽;或其同源序列;其中所述片段具有α-葡糖醛酸糖苷酶活性。在优选的方面,片段含有SEQIDNO:2的成熟多肽或其同源序列的至少500个氨基酸残基、更优选至少600个氨基酸残基,且最优选至少700个氨基酸残基,如至少800个氨基酸残基。亚序列术语“亚序列”在本文中定义为从SEQIDNO:1的成熟多肽编码序列的5’端和/或3’端缺失一个或多个(数个)核苷酸的核苷酸序列;或者其同源序列;其中所述亚序列编码具有α-葡萄糖醛酸活性的多肽片段。等位变体(allelicvariant)术语“等位变体”在本文是指基因的占据同一染色体基因座的两种或更多种可选形式中的任一种。等位变异通过突变天然产生,并可导致群体中的多态性。基因突变可以是沉默的(编码的多肽中没有变化),或者可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体所编码的多肽。分离的多核苷酸本文中所用的术语“分离的多核苷酸”是指从来源分离的多核苷酸。在一个优选的方面,所述多核苷酸如通过琼脂糖电泳测定为至少纯、优选至少5%纯、更优选至少10%纯、更优选至少20%纯、更优选至少40%纯、更优选至少60%纯、甚至更优选至少80%纯、和最优选至少90%纯。基本上纯的多核苷酸本文中所用的术语“基本上纯的多核苷酸”是指多核苷酸制备物,其不含其它外来的或不需要的核苷酸,并且处于适合在经基因工程改造的蛋白质的生产系统中使用的形式。因此,基本上纯的多核苷酸含有以重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,和甚至最优选至多0.5%的与其天然地或重组地相伴随的其它多核苷酸物质。但是,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,如启动子和终止子。优选的是,所述基本上纯的多核苷酸以重量计为至少90%纯、优选至少92%纯、更优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少97%纯、甚至更优选至少98%纯、最优选至少99%纯、甚至最优选至少99.5%纯。本发明的多核苷酸优选是基本上纯的形式,即所述多核苷酸制备物实质上不含与其天然地或重组地相伴随的其它多核苷酸物质。多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任意组合。编码序列当用于本文时,术语“编码序列”是指这样的核苷酸序列,它直接规定其蛋白质产物的氨基酸序列。编码序列的边界一般是由可读框决定的,后者通常以ATG起始密码子或其它可选的起始密码子如GTG及TTG开始,并以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的、或重组的核苷酸序列。cDNA:术语“cDNA”在本文中定义为这样的DNA分子,它能够从获自真核细胞的成熟的、经剪接的mRNA分子通过逆转录制备。cDNA缺少在对应的基因组DNA中通常存在的内含子序列。最初的初级RNA转录物是mRNA的前体,它经历一系列步骤被加工之后作为成熟的、经剪接的mRNA出现。这些步骤包括通过一个称为剪接的过程去除内含子序列。因此,从mRNA衍生而来的cDNA缺少任何内含子序列。核酸构建体术语“核酸构建体”在用于本文时是指这样的单链或双链核酸分子,其是从天然存在的基因分离的,或者其经过修饰而以原本不会存在于自然界中的方式(inamannerthatwouldnototherwiseexistinnature)包含核酸的片段,或者其是合成的。当核酸构建体含有本发明的编码序列的表达所需的控制序列时,术语核酸构建体与术语“表达盒”是同义的。控制序列术语“控制序列”在本文中定义为包括编码本发明多肽的多核苷酸的表达所必需的所有组件。每个控制序列对于编码所述多肽的核苷酸序列而言可以是天然的或外来的,或者对于彼此而言可以是天然的或外来的。这样的控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽(prop印tide)序列、启动子、信号肽序列和转录终止子。在最低程度上,控制序列包括启动子以及转录和翻译终止信号。控制序列可以提供有接头,用来引入特异性限制性位点以帮助将控制序列与编码多肽的核苷酸序列的编码区连接。可操作地连接术语“可操作地连接”在本文中是指这样一种构型,其中控制序列相对于多核苷酸序列的编码序列置于合适的位置上,使得该控制序列指导多肽编码序列的表达。表达术语“表达”包括多肽产生中涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。表达载体术语“表达载体”在本文中定义为线型或环状DNA分子,其包含编码本发明多肽的多核苷酸,且可操作地连接于为其表达所提供的其它核苷酸。宿主细胞术语“宿主细胞”在用于本文时包括任何对于使用包含本发明的多核苷酸的核酸构建体或表达载体的转化、转染、转导等易感的细胞类型。修饰术语“修饰”在本文中意指对由SEQIDNO2的成熟多肽组成的多肽或其同源序列的任何化学修饰;以及对编码这样的多肽的DNA的遗传操作。修饰可以是一个或多个(数个)氨基酸的取代、缺失和/或插入,以及一个或多个(数个)氨基酸侧链的替换。人工变体当在本文中使用时,术语“人工变体”是指由下述生物体所产生的具有α-葡糖醛酸糖苷酶活性的多肽,所述生物体表达SEQIDNO:1的成熟多肽编码序列的修饰的多核苷酸序列;或其同源序列。所述修饰的核苷酸序列是通过修饰SEQIDΝ0:1中公开的多核苷酸序列或其同源序列加以人工干预而获得的。糖苷水解酶(GH)家族应用于本公开的GH家族的编号遵循在URL=http://afmb.cnrs-mrs.fr/cazy/CkTi/index,html的Coutinho,P.Μ.&Henrissat,B.(1999)CAZy-Carbohydrate-ActiveEnzymesserver或者Coutinho,P.Μ.&Henrissat,B.1999;Themodularstructureofcellulasesandothercarbohydrate-activeenzymesanintegrateddatabaseapproach,-f"Genetics,BiochemistryandEcologyofCelluloseDegradation".,编者K.Ohmiya,K.Hayashi,K.Sakka,Y.Kobayashi,S.Karita禾口T.Kimura,UniPublishersCo.,Tokyo,15—23页禾口Bourne,Y.&Henrissat,B.2001;Glycosidehydrolasesandglycosyltransferases:familiesandfunctionalmodules,CurrentOpinioninStructuralBiology11:593_600中的概念。本发明中的多肽优选为GH家族67。发明详述具有a-葡糖醛酸糖苷酶活性的多肽在优选的方面,本发明涉及包含与SEQIDNO:2的成熟多肽具有优选至少75%、更优选至少80%、更优选至少85%、甚至更优选至少90%、最优选至少95%、和甚至最优选至少96%、至少97%、至少98%或至少99%同一性程度的氨基酸序列的分离的多肽,所述多肽具有a-葡糖醛酸糖苷酶活性(下文中的“同源多肽”)。在优选的方面,所述同源多肽具有的氨基酸序列与SEQIDN02的成熟多肽有十个氨基酸、优选五个氨基酸、更优选四个氨基酸、甚至更优选三个氨基酸、最优选两个氨基酸、且甚至最优选一个氨基酸的不同。本发明的多肽优选包含SEQIDNO2的氨基酸序列或其等位变体;或它们的具有a-葡糖醛酸糖苷酶活性的片段。在优选的方面,多肽包含SEQIDNO:2的氨基酸序列。在另一优选的方面,多肽包含SEQIDNO:2的成熟多肽。在另一优选的方面,多肽包含SEQIDNO2的氨基酸1至835,或其等位变体;或它们的具有a-葡糖醛酸糖苷酶活性的片段。在另一优选的方面,多肽包含SEQIDNO:2的氨基酸序列1至835。在另一优选方面,多肽由SEQIDN02的氨基酸序列或其等位变体组成;或由其具有a_葡糖醛酸糖苷酶活性的片段组成。在另一优选方面,多肽由SEQIDNO:2的氨基酸序列组成。在另一优选方面,多肽由SEQIDNO2的成熟多肽组成。在另一优选的方面,多肽由SEQIDNO2的氨基酸1至835或其等位变体组成;或由其具有a_葡糖醛酸糖苷酶活性的片段组成。在另一优选的方面,多肽由SEQIDN02的氨基酸1至835组成。在优选的方面,本发明涉及具有a-葡糖醛酸糖苷酶活性的分离的多肽,其是由在优选非常低严紧性条件、更优选低严紧性条件、更优选中严紧性条件、更优选中_高严紧性条件、甚至更优选高严紧性条件、且最优选非常高严紧性条件下与以下杂交的多核苷酸编码的(i)SEQIDNO1的成熟多肽编码序列,(ii)包含SEQIDNO1的成熟多肽编码序列的基因组DNA序列,(iii)⑴或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch,andT.Maniatis,1989,MolecularCloning,ALaboratoryManual,2dedition,ColdSpringHarbor,NewYork)。SEQIDNO1的成熟多肽编码序列的亚序列含有至少100个连续核苷酸或优选至少200个连续核苷酸。而且,所述亚序列可编码具有a-葡糖醛酸糖苷酶活性的多肽片段。在优选的方面,所述互补链是SEQIDNO1的成熟多肽编码序列的全长互补链。根据本领域已知的方法,SEQIDNO1的核酸序列;或其亚序列;以及SEQIDNO2的氨基酸序列;或其片段;可用于设计核酸探针以从不同属或种的菌株鉴定和克隆编码具有a-葡糖醛酸糖苷酶活性的多肽的DNA。具体而言,按照标准Southern印迹步骤,这种探针可用于与感兴趣的属或种的基因组或cDNA的杂交,从而从其中鉴定并分离相应的基因。这些探针可以显著短于全序列,但是其长度应为至少14,优选至少25,更优选至少35,且最优选至少70个核苷酸。然而,核酸探针长度优选至少100个核苷酸。例如,核酸探针长度可以是至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可以用更长的探针,如,长度为优选至少600个核苷酸,更优选至少700个核苷酸,甚至更优选至少800个核苷酸,或最优选至少900个核苷酸的核酸探针。也可以使用DNA和RNA探针。通常对所述探针进行标记以检测对应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin))。将这些探针包含于本发明中。因此,可从由这些其它菌株制备的基因组DNA或cDNA文库筛选与上述探针杂交并且编码具有a-葡糖醛酸糖苷酶活性的多肽的DNA。通过琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术可以分离来自这些其它菌株的基因组或其它DNA。来自文库的DNA或分离的DNA可以被转移并固定到硝酸纤维素(nitrocellulose)或其它适宜的载体材料上。为了鉴定与SEQIDNO1同源的克隆或DNA;或其亚序列;优选将所述载体材料用在Southern印迹中。就本发明而言,杂交指在非常低至非常高严紧性条件下,核苷酸序列与标记的核酸探针杂交,所述核酸探针对应于SEQIDNO1的成熟多肽编码序列;包含SEQIDNO:1的成熟多肽编码序列的基因组DNA序列;其全长互补链;或其亚序列。可使用例如X射线片(X-rayfilm)检测在这些条件下与核酸探针杂交的分子。在优选的方面,核酸探针是SEQIDNO:1的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQIDNO:1的核苷酸1至2508。在另一优选的方面,核酸探针是编码SEQIDNO:2的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQIDNO1。对于长度至少100个核苷酸的长探针,非常低至非常高的严紧性条件定义为在42°C在5XSSPE、0.3%SDS,200ug/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严紧性为25%甲酰胺,对于中和中-高严紧性为35%的甲酰胺、或对于高和非常高严紧性为50%的甲酰胺,根据标准的Southern印迹步骤进行预杂交和杂交最佳12至24小时。对于长度至少100个核苷酸的长探针,载体材料最终用2XSSC,0.2%SDS洗涤3次每次15分钟,优选在45°C(非常低严紧性)、更优选在50°C(低严紧性)、更优选在55°C(中严紧性)、更优选在60°C(中-高严紧性)、甚至更优选在65°C(高严紧性)、且最优选在70°C(非常高严紧性)。对于长度约为15至约70个核苷酸的短探针,严紧性条件定义为在比使用根据Bolton禾口McCarthy的计算法(1962,ProceedingsoftheNationalAcademyofSciencesUSA48:1390)计算得出的Tm低大约5°C至大约10°C,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,IXDenhardt溶液,ImM焦磷酸钠(sodiumpyrophosphate),ImM磷酸二氢钠(sodiummonobasicphosphate),0.ImMATP和0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小时。对于长度为约15个核苷酸至约70个核苷酸的短探针,将载体材料在6XSSC加0.1%SDS中洗涤一次15分钟,并用6XSSC在比计算得出的Tm低5°C至10°C的温度洗涤两次,每次15分钟。在另一方面,本发明涉及具有a-葡糖醛酸糖苷酶活性的分离的多肽,其由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码,所述核苷酸序列与SEQIDNO1的成熟多肽编码序列具有优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,且甚至最优选至少96%、97%、98%或99%的同一性程度,其编码活性的多肽。参见本文中的多核苷酸部分。在另一方面,本发明涉及人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(数个)氨基酸的SEQIDNO2的成熟多肽;或其同源序列。优选的,氨基酸改变对性质是较不重要的(ofaminornature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至约30个氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(poly-histidinetract)、抗原表位(antigenicepitope)或结合域(bindingdomain)。保守取代的实例是在以下组之内碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specificactivity)的氨基酸取代是本领域已知的,并且由例如H.Neuratt^PR.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu禾口Asp/Gly。除了20个基本氨基酸,非基本氨基酸(如4-羟脯氨酸、6-N-甲基赖氨酸、2_氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上能够获得的,包括六氢吡啶羧酸(pipecolicacid)、噻唑烧羧酸(thiazolidinecarboxylicacid)、脱氢脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。可供选择的是,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适PH等。能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science244:1081_1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的生物学活性(即,α-葡糖醛酸糖苷酶活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271=4699-4708酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来测定。参见例如deVos等,1992,Science255306-312;Smith等,1992,J.Mol.Biol.224899-904;Wlodaver等,1992,FEBSLett.309:59-64。必需氨基酸的同一性也能够从与多肽的同一性分析来推断,所述多肽与根据本发明的多肽相关。能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,例如那些由Reidhaar-Olson和Sauer,1988,Science241:53_57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152_2156;WO95/17413;或W095/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失和/或插入。能够使用的其它方法包括易错PCR、噬菌体展示(例如,Lowman等,1991,Biochem.3010832-10837;美国专利5,223,409号;W092/06204)和区域定向的诱变(Derbyshire等,1986,Gene46145;Ner等,1988,DNA7127)。诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多肽。SEQIDN02的成熟多肽(如SEQIDN02的氨基酸1至835)的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,且甚至最优选1。具有a-葡糖醛酸糖苷酶活性的多肽的来源本发明的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思应是核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。在优选的方面,获得自给定来源的多肽是胞外分泌的。本发明的具有a-葡糖醛酸糖苷酶活性的多肽优选是真菌多肽,并且更优选是酵母多肽例如具有葡糖醛酸糖苷酶活性的念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽;或更优选是丝状真菌多肽例如具有a-葡糖醛酸糖苷酶活性的枝顶孢霉属(Acremonium)、蘑菇属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、葡萄座腔菌属(Botryospaeria)、拟赌菌属(Ceriporiopsis)、毛壳菌属(Chaetomidium)、金抱子菌属(Chrysosporium)、麦角属(Claviceps)、方宠抱腔菌属(Cochliobolus)、Coprinopsis、Coptotermes、棒囊壳属(Corynascus)、栗疫病菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、网孢菌属(Filibasidium)、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、奉巴菌属(Irpex)>M(Lentinula)、小球腔菌属(Leptospaeria)、梨孢菌属(Magnaporthe)、Melanocarpus、多孑L菌属(Meripilus)、毛霄属(Mucor)、毁丝霄属(Myceliophthora)、新考玛月旨霄属(Neocallimastix)、脉抱菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia>H|ifM(Pseudoplectania)、Pseudotrichonympha>根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、Trichophaea、轮枝抱属(Verticillium)、小包脚菇属(Volvariella)、或炭角菌属(Xylaria)多肽。在优选的方面,所述多肽是具有a-葡糖醛酸糖苷酶活性的卡尔酵母(Saccharomycescarlsbergensis)、酉良酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多月太。在另一个优选的方面,所述多肽是具有α-葡糖醛酸糖苷酶活性的解纤维枝丁页?包霉(Acremoniumcellulolyticus)、棘抱曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、烟曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillusfoetidus)、曰本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillusnidulans)、■ffiβ、^ffiβ(Aspergillusoryzae)、口f_Mt包菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、热带金抱子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、ChrysosporiumpannicoIaλChrysosporiumqueenslandicum、Chrysosporiumzonatum、杆孢状镰孢(Fusariumbactridioides)、禾谷镰孢(Fusariumcerealis)、库威镰孢(Fusariumcrookwellense)、大刀德抱(Fusariumculmorum)、禾本禾斗德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、异抱德抱(Fusariumheterosporum)、合欢木德抱(Fusariumnegundi)、尖德抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉红德抱(Fusariumroseum)、接骨木德抱(Fusariumsambucinum)、肤色德抱(Fusariumsarcochroum)、拟分枝抱德抱(Fusariumsporotrichioides)、硫色,廉抱(Fusariumsulphureum)、圆德抱(Fusariumtorulosum)、拟丝抱,廉抱(Fusariumtrichothecioides)、壤片德抱(Fusariumvenenatum)、灰色腐质酶(Humicolagrisea)、特异腐质霉(Humicolainsolens)、疏棉状腐质霉(Humicolalmuginosa)、乳白耙菌(Irpexlacteus)、米赫毛霉(Mucormiehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙脉孢菌(Neurosporacrassa)、绳状青霉(Penicilliumfuniculosum)、产紫青霉(Penicilliumpurpurogenum)、黄抱平革菌(Phanerochaetechrysosporium)、无色梭包壳(Thielaviaachromatica)、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭抱壳(Thielaviaaustraleinsis)、Thielaviafimeti、小抱子梭抱壳(Thielaviamicrospora)、Thielaviaovispora、Thielaviaperuviana、Thielaviaspededonium、€包冑(Thielaviasetosa)ΛThielaviasubthermophila、zht—冑(Thielaviaterrestris)Λ哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或绿色木霉(Trichodermaviride)多月太。在另一优选方面,多肽是青霉属多肽,并且优选是桔灰青霉多肽。可理解的是对于前述的种,本发明包含完全和不完全阶段(perfectandimperfectstates)二者,和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域熟练技术人员会容易地识别适合的等同物的身份(identity)。这些种的菌株在许多培养物保藏机构对于公众能够容易地取得,所述保藏机构如美国典型培养物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物禾口细胞培养物保藏中心(DeutscheSamlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌种保藏中心(CentraalbureauVoorSchimelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物,鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选另一微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就能够通过使用本领域普通技术人员熟知的技术将所述多核苷酸分离或克隆(参见,例如,Sambrook等,1989,同上文)。多核苷酸本发明还涉及包含编码本发明的具有葡糖醛酸糖苷酶活性的多肽的核苷酸序列或由该核苷酸序列组成的分离的多核苷酸。在优选的方面,核苷酸序列包含SEQIDNO1或由SEQIDN0:1组成。在另一优选的方面,核苷酸序列包含SEQIDNO1的成熟多肽编码序列或由SEQIDNO1的成熟多肽编码序列组成。在另一优选的方面,核苷酸序列包含SEQIDNO1的核苷酸1至2508或由SEQIDN0:1的核苷酸1至2508组成。本发明还包括编码下述多肽的核苷酸序列,所述多肽包含SEQIDNO:2的氨基酸序列或其成熟多肽或由SEQIDNO:2的氨基酸序列或其成熟多肽组成,由于遗传密码的简并性,所述核苷酸序列不同于SEQIDNO:1或其成熟多肽编码序列。本发明还涉及编码具有a-葡糖醛酸糖苷酶活性的SEQIDN0:2的片段的SEQIDNO1的亚序列。本发明还涉及突变的多核苷酸,其包含或其组成为在SEQIDNO1的成熟多肽编码序列中的至少一个突变,其中突变的核苷酸序列编码SEQIDNO:2的成熟多肽。用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,且包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆本发明的多核苷酸。参见,例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活化转录(ligatedactivatedtranscription;LAT)和基于核苷酸序列的扩增(NASBA)。可以从青霉属(优选桔灰青霉)菌株,或另外的或相关的生物体克隆所述多核苷酸,并且因此可以是例如所述核苷酸序列的多肽编码区的等位基因变体或种变体(speciesvariant)0本发明也涉及包含如下核苷酸序列或由如下核苷酸序列组成的分离的多核苷酸,所述核苷酸序列与SEQIDNO:1的成熟多肽编码序列具有至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%、最优选至少95%,且甚至最优选至少96%、至少97%,至少98%或至少99%同一性程度,所述多核苷酸编码活性多肽。修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可为必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适PH等方面不同的人工变体。可以在作为SEQIDN01的成熟多肽编码区存在的核苷酸序列,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建变体序列所述取代不产生由核苷酸序列编码的多肽的另外的氨基酸序列,但是符合意欲产生酶的宿主生物体的密码子选择;或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述,参见,例如Ford等A1991,ProteinExpressionandPurification2一107。对于本领域技术人员显而易见的是,这些取代能够在对于分子功能重要的区域之外进行,并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性关键的并且因此优选不进行取代的氨基酸残基,可以根据本领域公知的方法,如定位诱变或丙氨酸分区诱变法(参见,例如,Cunningham和Wells,1989,同上文)来鉴定。在后一技术中,将突变引入到分子中的每个荷正电的残基处,并且测试所得突变分子的α_葡糖醛酸糖苷酶活性,以鉴定对于所述分子的活性关键的氨基酸残基。底物_酶相互作用的位点也能够通过分析三维结构测定,通过如核磁共振分析、晶体学或光亲和标记这样的技术来测定(参见,例如deVos等,1992,同上文;Smith等,1992,同上文;Wlodaver等,1992,同上文)。如在本文中所限定,本发明还涉及编码本发明的多肽的分离的多核苷酸,其在非常低严紧性条件、优选低严紧性条件、更优选中严紧性条件,更优选中_高严紧性条件、甚至更优选高严紧性条件,且最优选非常高严紧性条件下与(i)SEQIDNO:1的成熟多肽编码序列,()包含SEQIDNO1的成熟多肽编码序列的基因组DNA序列,或(iii)⑴或(ii)的全长互补链杂交;或其等位变体和亚序列(Sambrook等,1989,同上文)。在优选的方面,互补链为SEQIDNO1的成熟多肽编码序列的全长互补链。本发明还涉及通过(a)将DNA群体在非常低、低、中、中-高、高或非常高严紧性条件下与(i)SEQIDNO1的成熟多肽编码序列,(ii)包含SEQIDNO1的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链杂交;和(b)分离杂交的多核苷酸,所述多核苷酸编码具有α-葡糖醛酸糖苷酶活性的多肽而获得的分离的多核苷酸。在优选的方面,互补链是SEQIDNO:1的成熟多肽编码序列的全长互补链。核酸构建体本发明还涉及核酸构建体,其包含与一种或多种(数种)控制序列可操作地连接的本发明的分离的多核苷酸,所述控制序列指导编码序列在与所述控制序列相容的条件下在合适的宿主细胞中表达。可以用许多方式操作编码本发明多肽的分离的多核苷酸以供多肽的表达。依赖于表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(W000/56900)、镶片镰孢Daria(WC)00/56900)、镶片镰孢Quirm(W000/56900)、尖镰孢胰蛋白酶样蛋白酶(W096/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变的、截断的和杂合的启动子。在酵母宿主中,有用的启动子是从酿酒酵母烯醇化酶(EN0-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1、ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶的基因获得的。对酵母宿主细胞有用的其它启动子由Romanos等,1992,Yeast8:423_488描述。控制序列也可以是合适的转录终止子序列,其是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉a-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。控制序列也可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。优选的用于丝状真菌宿主细胞的前导序列是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得的。控制序列还可以是聚腺苷酸化序列,其是与核苷酸序列的3,末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为向转录的mRNA添加聚腺苷残基的信号。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。优选的用于丝状真菌宿主细胞的聚腺苷酸化序列是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉a-葡糖苷酶的基因获得的。控制序列还可以是信号肽编码序列,其编码与多肽的氨基末端相连的氨基酸序列,并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地含有信号肽编码序列,该信号肽编码序列与编码分泌多肽的编码序列的区段一起天然地连接在翻译阅读框中。或者,编码序列5’端可含有对于所述编码序列为外源的信号肽编码序列。外源信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者,外源信号肽编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径的任何信号肽编码序列可在本发明中使用。对丝状真菌宿主细胞有效的信号肽编码序列是从米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、和疏棉状腐质霉脂肪酶的基因获得的信号肽编码序列。对酵母宿主细胞有用的信号肽是从酿酒酵母a“因子和酿酒酵母转化酶的基因获得的。其它有用的信号肽编码序列由Romanos等,1992,同上文描述。控制序列还可以是前肽编码序列,其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolyp印tide)(或在某些情况下称为酶原(zymogen))0前肽通常是无活性的并且能够通过前肽的催化或自催化切割从前多肽转化为成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母a因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(W095/33836)的基因获得前肽编码区。在信号肽和前肽序列都存在于多肽氨基末端的场合,将前肽序列置于紧接着(nextto)多肽氨基末端,并且将信号肽序列置于紧接着前肽序列的氨基末端。表达载体本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。本文所述的多种核酸和控制序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个(数个)方便的限制位点以允许在这些位点插入或取代编码多肽的核苷酸序列。可供选择的是,可以通过在适当的用于表达的载体中插入包含所述序列的核苷酸序列或核酸构建体来表达本发明的多核苷酸序列。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的表达用控制序列可操作地连接。重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线型或闭合环状质粒。载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或共同含有待引入宿主细胞基因组的完整DNA(totalDNA)的两个或更多个载体或质粒,或可以使用转座子(transposon)。本发明的载体优选含有一个或多个(数个)选择标记,这些标记容许容易地选择经过转化、转染、转导等的细胞。选择标记是这样的基因,其产物可提供杀生物剂或病毒抗性、对重金属的抗性,对营养缺陷型的原养性,等等。用于丝状真菌宿主细胞的选择标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5’-磷酸脱羧酶)、sC(硫酸腺苷转移酶)和trpC(邻氨基苯甲酸合酶),以及它们的等同物。优选用于曲霉细胞的是构巢曲霉或米曲霉的amdS禾口pyrG基因,以及吸水链霄菌(Streptomyceshygroscopicus)的bar基因。本发明的载体优选含有容许载体整合到宿主细胞的基因组或者容许载体在细胞中不依赖基因组自主复制的元件。为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应优选含有足够数量的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的目标序列具有高度同一性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列同源。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。在丝状真菌细胞中有用的复制起点的例子有AMA1和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsResearch159163-9175;WO00/24883)。AMA1基因的分离,以及包含该基因的质粒或载体的构建,可以根据WO00/24883中公开的方法来实现。可以向宿主细胞中插入本发明的多核苷酸的多于一个拷贝以增加基因产物的生产。可以通过下述方法获得多核苷酸的拷贝数的增加将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择标记基因包括于多核苷酸,其中可通过在合适的选择剂(selectableagent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,从而也含有多核苷酸的额外拷贝的细胞。用于连接上述元件来构建本发明的重组表达载体的方法是本领域技术人员公知的(参见例如Sambrook等,1989,同上文)。宿主细胞本发明还涉及重组宿主细胞,其包含本发明的分离的多核苷酸,将所述重组宿主细胞有利地用于多肽的重组产生。将包含本发明的多核苷酸的载体引入宿主细胞从而将所述载体作为染色体整合体或作为自复制的染色体外载体保持,如前文所述。术语“宿主细胞”包含亲本细胞的任何子代,其因为在复制过程中发生的突变而与该亲本细胞不同。宿主细胞的选择在很大程度上会依赖于编码多肽的基因及其来源。宿主细胞可以是真核生物,诸如哺乳动物、昆虫、植物、或真菌细胞。在优选的方面,所述宿主细胞是真菌细胞。“真菌”用在本文包括以下门子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)禾口接合菌门(Zygomycota)(如由Hawksworth等,于AinsworthandBisby'sDictionaryofTheFungi,第八版,1995,CABInternational,UniversityPress,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,同上文,171页中所引用),和所有有丝分裂孢子真菌(mitosporicfungi)(Hawksworth等,1995,同上文)。在更优选的方面,真菌宿主细胞是酵母细胞。本文所用的“酵母”包括产子囊酵母(ascosporogenousyeast)(内抱霉目(Endomycetales))、产担子抱子囊酵母(basidiosporogenousyeast)禾口属于半知菌类(FungiImperfecti)(芽抱纲(Blastomycetes))的酵母。由于酵母的分类在将来可能有所改变,就本发明而言,酵母将如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.禾口Davenport,R.R.编,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述加以定义。在甚至更优选的方面,酵母宿主细胞是念珠菌属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞。在最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳克鲁维酵母(Kluyveromyceslactis)细胞。在另一个最优选的方面,酵母宿主细胞是解脂西洋蓍霉(Yarrowialipolytica)细胞。在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌(Eumycota)和卵菌(Oomycota)亚门的所有丝状形式(如Hawksworth等,1995,同上文定义)。丝状真菌的一般特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其它复杂多糖组成的菌丝壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。在一个甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、网孢菌属、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)、或木霉属细胞。在一个更优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个更优选的方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在另一个最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkanderaadusta)、干拟赌菌(Ceriporiopsisaneirina)、干拟赌菌(Ceriporiopsisaneirina)>Ceriporiopsiscaregiea>Ceriporiopsisgilvescens>Ceriporiopsispannocinta>Ceriporiopsisrivulosa、Ceriporiopsissubrufa>虫拟赌菌(Ceriporiopsissubvermispora)、嗜角质金抱子菌、Chrysosporiumlucknowense、热带金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、Chrysosporiumpannicola>Chrysosporiumqueenslandicum^Chrysosporiumzonatum^^cimJ^^(Coprinuscinereus)、毛革盖菌(Coriolushirsutus)、特异腐质霉、疏棉状腐质霉、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotuseryngii)、土生梭孢壳、长绒毛栓菌(Trametesvillosa)、杂色栓菌(Trametesversicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023和Yelton1984,ProceedingsoftheNationalAcademyofSciencesUSA811470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene78:147-156和W096/00787描述。可以使用由如下文献描述的方法转化酵母Becker和Guarente,于Abelson,J.N.禾口Simon,M.I.(编者),GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,182-187页,AcademicPress,Inc.,NewYork;Ito等,1983,JournalofBacteriology153:163;禾口Hinnen等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:1920o生产方法本发明还涉及用于产生本发明的多肽的方法,包括(a)在有益于产生所述多肽的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。在优选的方面,所述细胞是青霉菌属的。在更优选的方面,所述细胞是桔灰青霉。本发明还涉及产生本发明的多肽的方法,包括(a)在有益于产生所述多肽的条件下培养如本文所述的重组宿主细胞;和(b)回收所述多肽。本发明还涉及生产本发明的多肽的方法,包括(a)在有益于产生所述多肽的条件下培养重组宿主细胞,其中所述宿主细胞包含突变核苷酸序列,其在SEQIDN0:1的成熟多肽编码序列中具有至少一个突变,其中所述突变核苷酸序列编码包含SEQIDN0:2的成熟多肽或由SEQIDNO:2的成熟多肽组成的多肽,和(b)回收所述多肽。在本发明的产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌至培养基中,其能够从细胞裂解物(lysate)回收。可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzymeassay)可用于测定如本文所述的多肽的活性。所得多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。本发明的多肽可以通过多种本领域已知的方法纯化,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,ProteinPurification,编者J.-C.Janson禾口LarsRyden,VCHPublishers,NewYork,1989),以获得基本上纯的多肽。植物本发明还涉及植物,例如转基因植物、植物部分或植物细胞,其包含本发明的编码具有a-葡糖醛酸糖苷酶活性的多肽的分离的多核苷酸,从而以可回收的量表达和产生所述多肽。所述多肽可从植物或植物部分回收。或者,也可以将含有该重组多肽的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性质(rheologicalproperties),或用于破坏抗营养因子。转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses),如草地早熟禾(meadowgrass)(蓝草(bluegrass),早熟禾属(Poa));饲用牧草(foragegrass)如羊茅属(Festuca)、黑麦草属(Lolium),寒地型牧草(temperategrass),如剪股颖属(Agrostis);和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean),和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜籽(rapeseed)和紧密相关的模式生物体拟南芥(Arabidopsisthaliana)0植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vasculartissue)、分生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质夕卜体(apoplast)、线粒体(mitochondria)(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如为了促进本发明的应用而分离的具体组织和细胞也被认为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seedcoat)0这些植物、植物部分和植物细胞的子代也包括在本发明的范围内。表达本发明的多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下方法构建所述植物或植物细胞将编码本发明多肽的一个或多个(数个)表达构建体并入植物宿主基因组或叶绿体基因组,并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。表达构建体便利地是包含编码本发明多肽的多核苷酸的核酸构建体,所述多核苷酸与在选择的植物或植物部分中表达该核苷酸序列所需的适当的调节序列可操作地连接。此外,表达构建体可以包含对于鉴定整合了表达构建体的宿主细胞有用的选择标记,和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及期望如何表达多肽而确定。例如,编码本发明多肽的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如Tague等,1988,PlantPhysiology86506描述。对于组成型表达,可以使用35S_CaMV、玉米泛素1和稻肌动蛋白1启动子(Franck等,1980,Cell21:285-294,Christensen等,1992,PlantMo.Biol.18:675_689;Zhang等,1991,PlantCell3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storagesinktissue)例如种子、马铃薯块莲和果实的启动子(Edwards&Coruzzi,1990,Ann.Rev.Genet.24:275_303),或来自代谢库组织(metabolicsinktissue)例如分生组织的启动子(Ito等,1994,PlantMol.Biol.24:863_878),种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,PlantandCellPhysiology39:885_889),来自豆球蛋白(legumin)B4和蚕豆(Viciafaba)的未知种子蛋白基因的蚕豆启动子(Conrad等,1998,JournalofPlantPhysiologyl52:708_711)、来自种子油体蛋白(oilbodyprotein)的启动子(Chen等,1998,PlantandCellPhysiology39:935_941),来自欧洲油菜(Brassicanapus)的贮藏蛋白napA启动子,或本
技术领域:
公知的任何其它种子特异性的启动子,例如,在TO91/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子(Kyozuka等,1993,PlantPhysiology102:991_1000),小球藻病毒(chlorellavirus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(Mitra和Higgins,1994,PlantMolecularBiology26:85_93),或来自稻的aldP基因启动子(Kagaya等,1995,MolecularandGeneralGenetics248:668_674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等,1993,PlantMolecularBiology22:573-588)。同样地,所述启动子可通过非生物的处理诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源施加的激活所述启动子的物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脱落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金属。启动子增强子元件也可以用于实现本发明多肽在植物中的较高表达。例如,启动子增强子元件可以是内含子,其置于启动子和编码本发明多肽的核苷酸序列之间。例如Xu等,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。可选择的标记基因和表达构建体的任何其它部分可以从本领域中那些可得的部分中选择。根据本领域已知的常规技术(包括土壤杆菌(Agrobacterium)-介导的转化、病毒-介导的转化、显微注射、粒子轰击、生物弹射转化和电穿孔)将核酸构建体并入植物基因组(Gasser等,1990,Science2441293;Potrykus,1990,Bio/Technology8535;Shimamoto等,1989,Nature338274)。目前,根癌土壤杆菌(Agrobacteriumtumefaciens)介导的基因转移(genetransfer),是产生转基因双子叶植物的优选方法(为了参考,见Hooykas和Schilperoort,1992,PlantMolecularBiology19:15_38),而且它也可以用于转化单子叶植物,虽然对于这些植物其它的转化方法是常用的。目前,用于产生转基因单子叶植物的优选的方法,是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryoniccalli)或发育中白勺胚(developingembryos)(Christou,1992,PlantJournal2275-281;Shimamoto,1994,CurrentOpinionBiotechnology5158-162;Vasil等,1992,Bio/Technology10=667-674)。转化单子叶植物的可供选择的方法是基于原生质体转化,如由Omirulleh等,1993,PlantMolecularBiology21:415_428所描述的。转化之后,根据本领域熟知的方法选择并入了表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因例如,使用带有两种单独的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。本发明还涉及产生本发明的多肽的方法,包括(a)在有益于产生所述多肽的条件下培养包含本发明的编码具有a-葡糖醛酸糖苷酶活性的多肽的多核苷酸的转基因植物或植物细胞;和(b)回收所述多肽。组合物本发明还涉及包含本发明的多肽的组合物。所述组合物可以包含本发明的多肽作为主要酶组分,如单组分组合物。或者,所述组合物可以包含多种酶活性,如乙酰木聚糖酶、阿拉伯呋喃苷糖酶、氨基肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、阿魏酸酯酶、a-半乳糖苷酶、0-半乳糖苷酶、葡糖淀粉酶、a-葡糖苷酶、0-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶(peptidoglutaminase)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶或木糖苷酶。其它的酶可以通过例如属于以下属或种的微生物产生曲霉属,优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉;镰孢属,优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢;腐质霉属,优选特异腐质霉或疏棉状腐质霉;或木霉属,优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉。可以依照本领域内已知的方法制备多肽组合物,并且可以是液体或干组合物的形式。例如,所述多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以依照本领域内已知方法将包括于所述组合物中的多肽稳定化。下面给出的是本发明多肽组合物的优选的用途的实例。本发明的多肽组合物的剂量和使用该组合物的其它条件可以基于本领域内已知的方法确定。用途本发明还涉及使用具有a-葡糖醛酸糖苷酶活性的多肽或其组合物的方法。本发明的具有a-葡糖醛酸糖苷酶活性的多肽可以用在许多应用中通过用有效量的所述多肽处理生物质材料来降解或转变所述生物质材料(即包含葡萄糖醛酸取代的木聚糖的材料)。在必需降解木聚糖的方法中,本发明的多肽优选与其它木聚糖降解酶(如乙酰木聚糖酯酶、阿魏酸酯酶、木聚糖酶、阿拉伯呋喃苷糖酶和木糖苷酶)联合使用。具有a-葡糖醛酸糖苷酶活性的多肽在许多应用中是有用的修饰含有葡萄糖醛酸取代的木聚糖的动物饲料以改善消化性;在产生例如燃料和/或可饮用酒精的过程中由生物质降解或转化为可发酵的糖产生的一般应用;用于浆和纸的去木质化作用中的处理助剂;纺织品的酶洗练系统的成分;食品应用,如焙烤,其中与其它的酶的功能组合以改善焙烤物的物理性质;以及与其它的酶功能组合用于洗衣洗涤剂的应用。多肽或组合物可以用于产生或修饰营养的/饮食的纤维和/或用于产生木糖、阿拉伯糖和/或直链木糖或用于通过发酵、酶的加工或化学合成产生木糖的衍生物、阿拉伯糖。优选的生物质材料,即包含葡糖醛酸取代的木聚糖的材料选自下组,草本和/或木质的能源作物、农产品和饲料作物、动物饲料产品、块茎、根、茎、豆类、木薯皮(cassavapeel)、可可豆(cocoapod)、米禾比和/或谷壳(ricehusksand/orhulls)、米糖、種轴(cob)、秆(straw)、壳(hull)、秕(husk)、甜菜渣(sugarbeetpulp)、槐豆浆(locustbeanpulp)、蔬菜渔(vegetablepomace)、农作物废料、秆、柄(stalk)、叶、玉米糠(cornbran)、秕、穗轴、外皮(rind)、壳(shell)、豆荚(pod)、木材废料(woodwaste)、树皮(bark)、刨花(shaving)、锯屑(sawdust)、木菜(woodpulp)、菜液(pulpingliquor)、废纸(wastepaper)、纸板(cardboard)、木材废料、工业或市政废水固体(industrialormunicipalwastewatersolids)、粪肥(manure)、酿造和/或发酵过程的副产物、湿酒糟(wetdistillersgrain)、干酒糟(drieddistillersgrain)、酒糟(spentgrain)、酒糟(vinasse)禾口甘蔴渔(bagasse)。在一个实施方式中,具有a-葡糖醛酸糖苷酶活性的多肽用于包括纤维素生物质水解的方法中,所述方法包括将所述生物质与所述多肽接触,例如从纤维素生物质中产生乙醇或提高动物饲料的营养价值的方法。在优选的实施方式中,具有a-葡糖醛酸糖苷酶活性的多肽用于降解主要由淀粉组成的底物的纤维素部分,例如在包括产生淀粉水解的过程(例如基于淀粉的发酵过程,例如乙醇过程)中的磨碎的谷浆。测定a-葡糖醛酸糖苷酶活性就本发明而言,a-葡糖醛酸糖苷酶活性根据由deVries(J.Bacterid,1998,Vol.180,243-249页)描述的步骤来测定。一个a-葡糖醛酸糖苷酶单位是在下述标准测定条件下每分钟释放1微摩尔葡糖醛酸或4-0-甲基葡糖醛酸的酶量。a-葡糖醛酸糖苷酶测定法的温育混合物(总体积0.2ml)含有0.16ml底物(0.05M乙酸钠缓冲液[pH5.0]中2mg醛糖三醛酸-双己糖醛酸(aldotriouronicacid-aldobiuronicacid)[8020])和0.04ml待测定的酶溶液。通过加入酶来起始温育。在40°C下温育30分钟以后,通过煮沸样品4分钟来终止反应。通过离心(10,000Xg)去除沉淀物,其后将上清液转移至新试管中。向每一个试管中加入0.6ml的按Milner和Avigad(Carbohydr.Res.1967.4:359_361)的描述制备的铜试剂,然后将样品煮沸10分钟并在冰上冷却。接着加入0.4ml按Nelson(Biol.Chem.1944,153:375_380)的描述制备的砷钼酸盐试剂。轻柔地混合样品,加入0.8ml水,并且在600nm处针对水测量的吸光率。在40°C下温育前,通过在零时刻煮沸完整的测定混合物来制备对照。底物对照是通过加水而不是酶溶液来制备的。标准曲线是用D-葡糖醛酸得到的。a-葡糖醛酸糖苷酶的特异性来自桔灰青霉的a-葡糖醛酸糖苷酶的特异性是由1HNMR的手段来研究的。在pH5.5(50mMNaOAc)下将酶(0.7ygEP/mg底物)与寡聚物(10mg/ml)在30°C温育过夜,然后在95°C下失活20分钟。将样品冷冻干燥并溶解在D20(lml)中。在VarianMercury400MHz上在30°C和80°C分别记录咕NMR谱。收集超过100次扫描的数据,并将HD0信号用作参考信号(4.67ppm)。未附谱图。发现a-葡糖醛酸糖苷酶对由GH10木聚糖酶产生4_0Me-a-葡糖醛酸吡喃糖基取代白勺木—寡聚物(4-OMe-alpha-glucuronopyranosylsubstitutedxylo-oligomer)具有活性。其对由GH11木聚糖酶形成的寡聚物或对木聚糖聚合物质未显示任何活性。这表明所述a“葡糖醛酸糖苷酶仅对4-OMe-GlcA的末端木糖单元有活性,而对“内部”的葡糖醛酸苷残基无活性。权利要求具有α-葡糖醛酸糖苷酶活性的分离的多肽,其选自下组(a)包含与SEQIDNO2的成熟多肽具有至少75%、更优选至少80%、更优选至少85%、甚至更优选至少85%、最优选至少90%、和甚至最优选至少95%同一性的氨基酸序列的多肽;(b)由在至少高严紧性条件下与(i)SEQIDNO1的成熟多肽编码序列,(ii)包含SEQIDNO1的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链杂交的多核苷酸编码的多肽;(c)由包含与SEQIDNO1的成熟多肽编码序列具有至少75%、更优选至少80%、更优选至少85%、甚至更优选至少85%、最优选至少90%、和甚至最优选至少95%同一性的核苷酸序列的多核苷酸编码的多肽;(d)SEQIDNO2的成熟多肽包含一个或多个(数个)氨基酸的取代、缺失和/或插入的变体。2.权利要求1的多肽,其包含SEQIDNO:2的氨基酸序列,或其具有a-葡糖醛酸糖苷酶活性的片段;或者由SEQIDNO:2的氨基酸序列,或其具有a-葡糖醛酸糖苷酶活性的片段组成。3.权利要求1或2任一项的多肽,其包含SEQIDNO2的成熟多肽或由SEQIDNO2的成熟多肽组成。4.权利要求13中任一项的多肽,其由多核苷酸编码,所述多核苷酸包含SEQIDNO1的核苷酸序列,或其编码具有a-葡糖醛酸糖苷酶活性的片段的亚序列;或者由SEQIDN0:1的核苷酸序列,或其编码具有a-葡糖醛酸糖苷酶活性的片段的亚序列组成。5.权利要求14中任一项的多肽,其由包含SEQIDN0:1的成熟多肽编码序列或由SEQIDN0:1的成熟多肽编码序列组成的多核苷酸编码。6.权利要求15中任一项的多肽,其中所述成熟多肽是SEQIDNO2的氨基酸1至835。7.权利要求16中任一项的多肽,其中所述成熟多肽编码序列是SEQIDN01的核苷酸1至2508。8.分离的多核苷酸,其包含编码权利要求17中任一项的多肽的核苷酸序列。9.核酸构建体,其包含与一种或多种(数种)控制序列可操作地连接的权利要求8的多核苷酸,所述控制序列在表达宿主中指导多肽的产生。10.包含权利要求9的核酸构建体的重组表达载体。11.包含权利要求9的核酸构建体的重组宿主细胞。12.产生权利要求17中任一项的多肽的方法,其包括(a)在有益于产生所述多肽的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。13.产生权利要求17中任一项的多肽的方法,其包括(a)在有益于产生所述多肽的条件下培养包含核酸构建体的宿主细胞,所述核酸构建体包含编码所述多肽的核苷酸序列;和(b)回收所述多肽。14.产生权利要求17中任一项的多肽的方法,其包括(a)在有益于产生所述多肽的条件下培养包含编码所述多肽的多核苷酸的转基因植物或植物细胞;和(b)回收所述多肽。15.用编码权利要求17中任一项的多肽的多核苷酸转化的转基因植物、植物部分或植物细胞。16.产生蛋白质的方法,其包括(a)在有益于产生所述蛋白质的条件下培养权利要求11的重组宿主细胞;和(b)回收所述蛋白质。17.降解或转变生物质材料的方法,其包括用权利要求17中任一项的多肽处理所述材料。18.权利要求17的方法,其进一步包括用选自下组的酶处理包含阿魏酰基的生物质材料木聚糖酶、阿拉伯呋喃糖苷酶、木糖苷酶、葡糖醛酸糖苷酶及其组合。19.权利要求1618中任一项的方法,其中所述生物质材料是动物饲料。20.权利要求1619中任一项的方法,其中所述生物质材料是纤维素生物质。21.组合物,其包含权利要求17中任一项的多肽,和一种或多种选自下组的酶乙酰木聚糖酯酶、阿魏酸酯酶、木聚糖酶、阿拉伯呋喃糖苷酶和木糖苷酶。22.权利要求17中任一项的多肽或权利要求21的组合物在用于生物质材料水解的方法中的用途,包括将所述生物质与所述多肽或所述组合物接触。23.根据权利要求22的在产生乙醇的方法中的用途。24.根据权利要求22的在产生动物饲料的方法中的用途。全文摘要本发明涉及具有α-葡糖醛酸糖苷酶活性的分离多肽以及编码该多肽的分离多核苷酸。本发明还涉及核酸构建体、载体和包含所述多核苷酸的宿主细胞以及制备和使用所述多肽的方法。文档编号C12N9/24GK101878299SQ200880118022公开日2010年11月3日申请日期2008年11月26日优先权日2007年11月27日发明者伊娃·H·汉森,多米尼克·A·斯科夫伦德,汉恩·R·索伦森申请人:诺维信公司