专利名称:纯化的pH中性丝核菌属漆酶及编码该酶的核酸的制作方法
技术领域:
本发明涉及分离的编码真菌氧化还原酶的核酸片段及由此产生的纯化的酶。更具体地说,本发明涉及编码在中性pH下发挥功能的酚氧化酶(特别是漆酶)的核酸片段。
背景技术:
漆酶(苯二酚氧氧化还原酶)是催化酚醛塑料氧化的含多个铜离子的酶。漆酶介导的氧化导致以合适的酚底物产生芳氧基-基团中间体;所产生的中间体最终偶联而提供一种二聚体-寡聚体和多聚体反应产物的组合物。这类反应在自然界导致黑色素,生成碱,毒素,木质素和腐殖酸形成的生物合成途径中是重要的。漆酶可由很多种真菌产生,包括子囊菌类(如曲霉属、链孢霉属和柄孢壳菌属)、半知菌类葡萄孢属和担子菌类(如金线菌属,屈孔菌属,香茹属,灰侧耳菌属,栓菌属)以及丝核菌属的有性生殖菌形式。漆酶表现出大范围的底物特异性,每种不同的真菌漆酶通常只能按其氧化酚底物的能力以定量的方式来互相区别。由于具有底物多样性,人们普遍发现了漆酶的许多有潜力的工业应用。其中有木质素修饰、纸强化、在去污剂中的染料转移抑制、酚聚合、汁液加工,酚树脂生产和废水处理。
尽管催化能力相似,但不同真菌种类产生的漆酶具有不同的温度和pH最适值,这些也可以根据特异性底物来区别。已分离出许多这类真菌漆酶,其中一些基因已被克隆。例如,Choi等(Mol.Plant-Microbe Interactions 5:119-128,1992)描述了编码栗树枯萎病真菌(Cryphonectria parasitica)漆酶的基因的分子特征和克隆。Kojima等(J.Biol,Chem.265:15224-15230,1990;JP2-238885)提供了对白色腐烂病担子菌毛革盖菌漆酶两种等位形式的描述。Germann和Lerch(Experientia 41:801,1985;PNAS USA83:8854-8858,1986)报道了粗糙链孢霉漆酶基因的克隆和部分测序。Saloheimo等(J.Gen.Microbiol.137:1537-1544,1985;WO92/01046)公布了对真菌射脉菌漆酶基因的结构分析。然而,实际上所有已知的真菌漆酶都在酸性pH(例如在pH3.0和6.0之间)下发挥最佳功能,且在中性和碱性pH下一般无活性。由于许多前述有潜力的工业方法优选在中性或碱性pH下进行,在这类方法中大多数真菌漆酶利用效果较差。因此,在许多重要商用方法的应用中,可得到的真菌漆酶是不充足的。
这一常规的一个例外是丝核菌属的某些种类所产生的胞外漆酶。Bouag等报道了Rhizoctonia praticola产生的最适pH大约为7.0的漆酶。这种类型的漆酶与以前已知的漆酶相比在需要中性pH的工业方法上更为有用。然而,这种R.Praticola酶既未纯化,也未进一步鉴定,而且到现在为止没有任何其它具有该特征的漆酶被纯化或鉴定。而且,尽管已分离出了其它的漆酶基团(如上所述),但这些基因编码的酶在酸性pH下发挥最佳功能。因此还不能达到对pH中性或碱性漆酶的重组生产和足够的商用产量,因为该酶本身和编码该酶的漆酶基因以前尚未被分离和/或纯化及测序过。本发明现在提供了对这些问题的解决方法。
本发明概述本发明涉及分离的含有编码在pH6.0到8.5之间发挥最佳功能的丝核菌属漆酶的核酸序列的核酸片段。“发挥最佳功能”是指酶在pH范围为大约6.0到8.5之间时表现出明显的(即,至少是最大值的大约30%,优选至少大约50%,最优选从50%到最大值)活性,以诸如丁香醛连氮、ABTS、2,6-二甲氧基酚或4antiaminopy-rine+N-乙基-N-磺基丁基-m-甲苯胺的底物的一种或多种标准漆酶试验中的活性来确定。本发明的漆酶优选的底物是丁香醛连氮。在一个优选的实施例中,漆酶是茄丝核菌漆酶。本发明还涉及由新核酸序列编码的基本上纯的漆酶。“基本上纯的”指基本上(即≥90%)无其它非漆酶蛋白质的漆酶。
为了便于生产新的漆酶,本发明还提供了包含所要求保护的核酸片段的载体和宿主细胞,该载体和宿主细胞在漆酶的重组生产中有用处。该核酸片段与触指导漆酶蛋白质在选择的宿主细胞中表达的转录和翻译信号以可操纵的方式相连。优选的宿主细胞是真菌细胞,最优选的是曲霉属。本发明的漆酶的重组生产通过在适于漆酶蛋白质表达的条件下培养用于本发明的核酸片段转化或转染的宿主细胞或其子代并从培养物中回收漆酶蛋白质来实现。
本发明的漆酶在许多需要氧化酚醛塑料的工业方法中有用。这些方法包括木质素修饰,汁液加2,酚聚合和酚树脂的生产。在优选的实施例中,本发明的酶用于为达到最大效率而需要中性或略带碱性pH的方法中。
图1显示了RSlac1的核苷酸和氨基酸顺序。核苷酸序列中的小写字母表示内含子位置。
图2显示了RSlac2的核苷酸和氨基酸顺序。核苷酸序列中的小写字母表示内含子位置。
图3显示了质粒pMWR-1的限制性图谱。
图4显示了RSlac3翻译区的核苷酸和氨基酸序列。
图5显示了RSlac1的丁香醛连氮氧化酶活性(90mM缓冲液,20μm丁香醛连氮,20℃)。
图6显示了RSlac2的丁香醛连氮氧化酶活性(93mM缓冲液,20μm丁香醛连氮,20℃)。
已报道了生产漆酶的丝核菌属的某些种类;因此,起始研究集中于鉴定在各种茄丝核菌属分离物中这些酶的存在。培养样品并以ABTS方法(在下面描述)定期分析上清液中漆酶的存在。在全部丝核菌属培养物中观察到漆酶。收获的漆酶经电泳分离并用ABTS染色,一种分离物RS22产生具有碱性pI的漆酶,选来进行进一步的研究。
后续研究集中于对来自RS22的酶进行纯化和鉴定。简单地说,过滤发酵培养基并用具有以大约10,000倍浓缩的膜的UF进行浓缩。在pH4.5下在乙酸缓冲液中进行第一步离子交换层析步骤,使用NaCl进行洗脱步骤。然后洗脱物经过滤并再进行层析,用NaCl梯度洗脱。汇集活性部分以备进一步研究。
首先对由此分离和纯化的完整蛋白质(下文称为RSlac3)进行部分测序,获得的N末端顺序如下
AVRNYKFDIKNVNVAPDGFQRPIVSV(SEQ.ID.NO.:5)用赖氨酸或谷氨酸特异性蛋白酶对该蛋白质进行进一步消化,从该蛋白质获得的其它的肽具有下列序列,可与毛革盖菌中的序列进行序列对比肽1:
SQYVDGLRGPLVIYDPDDDH(SEQ.ID.NO:6)肽2:
GLALVFAEAPSQIRQGVQSVQPDDA(SEQ.ID.NO:7)肽3:
SRYBVBBASTVVMLEBWYHTPAXVLE(SEQ.ID.NO:8)肽4:
SLGPTPNYVNPXIRDVVRVGGTTVV(SEQ.ID.NO:9)还发现了下列多肽,但与革盖菌属序列不相关。肽5:
IRYVGGPAVX(N?)RSVI(SEQ.ID.NO:10)肽6:
ILANPPA(SEQ.ID.NO:11)肽7:
YEAPSLPT(SEQ.ID.NO:12)在上面序列中,B代表天冬氨酸或天冬酰胺的,X代表未确定的残基。
为了起动丝核菌属漆酶基因的筛选,制备了茄丝核菌基因组文库。用限制性酶Sau3A部分消化总DNA,在琼脂糖凝胶上光电泳以分离大小,在8和21kb之间的DNA片段。分离的片段以BammHⅠ末端连接到入噬菌体EMBL3臂上,所得的噬菌体进行体外包装。这些噬菌体用作文库以在大肠杆菌中产生170,000噬菌斑的文库并扩增100倍备用。
为了形成用于分离茄丝核菌漆酶基因的探针,分析了5个已知漆酶的蛋白质序列以确定相同序列,根据得到的相同序列构建了2个简并寡聚核苷酸(Choi et al.出处同上;Germann and Lerch,出处同上;saloheimo etal出处同上;Kojima et al,出处同上)。将这些寡聚核苷酸与茄丝核菌基因组DNA混合,使用Taq聚合酶链式反应(PCR)扩增出220核苷酸片段的DNA片段。然后将220核苷酸片段克隆进质粒载体中。
PCR片段用作探针以便以扩增的基因组文库中筛选25,000个噬菌斑。将这些筛选的阳性克隆分成随后经DNA序列分析显示为编码2种不同漆酶基因(RSlac1和RSlac2)的两种类型。图1和图2分别列出了每个基因的核苷酸序列(SEQ ID.NO:1和3)和预测的每种蛋白质的氨基酸序列(SEQ ID,NO:2和4)。两序列之间的同源性大约为63%。与来自毛革盖菌,辐射射脉菌,构巢曲霉,Cryphonectria parasitica和粗糙链孢霉的已知漆酶序列相比,RS漆酶表现出大约在30-40%之间的同源性。将2种编码序列分别与米曲霉高峰氏淀粉酶转录和翻译信号以可操纵的方式相连克隆进表达载体中(见图3)。分别将2种漆酶表达载体转化进米曲霉和黑色曲霉宿主细胞中,筛选存在漆酶的宿主细胞。
为了分离RSlac3基因,以在菌香胺存在的条件下生长的茄丝核菌菌丝体中纯化ployA RNA。该RNA用作cDNA合成的模板。分离cDNA并收集1.7-3.5kb之间的片段,经过将分离的DNA克隆进酵母载体中来制备cDNA文库。在ABTS上从该文库中筛选出3000转化子。24小时后,只有单个菌落出现阳性。从该菌落中分离质粒并测序插入片段。部分预测的氨基酸顺序与从RS22获得的片段的序列(描述同上)相对应。图4SEQ.ID.NOs:13和14分别描述了完整的核苷酸和氨基酸序列。RSlac3与RSlac1显示出48%的同源性,与RSlac2显示出50%同源性。RSlac3与毛革盖菌漆酶基因也表现出48%的同源性。
根据本发明,使用本文提供的信息,以上述方法或作为选择的本领域任意已知方法可获得编码pH中性或碱性的丝核菌属基因。使用一种表达载体可以活性形式表达该基因。有用的表达载体含有一种能使载体稳定地整合进宿主细胞基因组或使载体在宿主细胞中独立于宿主细胞基因组进行自主复制的成份,和优选一个或多个使转化的宿主细胞易于选择的表型标记。表达载体也可包括编码启动子、核糖体结合位点、翻译起始信号和可任选的一种阻遏物或各种激活物基因的控制序列。为了使表达蛋白质得以分泌,可在该基因的编码序列之前插入编码一段信号序列的核苷酸。为了在控制序列的指导下表达,根据本发明处理的漆酶基因在合适的阅读框中与控制基因以可操作的方式相连。可掺入质粒载体并能指导漆酶基因转录的启动子序列包括但不仅限于原核β-内酰胺酶启动子(Viua-Kamaroff,et al.1978,Proc.Natl.Acad.Sci,U.SA.75:3727-3731)和tac启动子(DeBoer,et al,1983,Proc.Natl.Acad.Sci.U.S.A.80:21-25)。进一步的资料可见“Useful proteins fromvecombinant bacteria”in Scientific American,1980,242:74-94;和见Sanmbrook et al.,Molecular Cloning.1989。
携带本发明的DNA构建体的表达载体可以是常规用于重组DNA方法的任意载体,载体的选择一般取决于用于导入载体的宿主细胞。因此,载体可以是一种自主复制的载体,即作为染色体外突体存在的载体,其复制不依赖于染色体复制,例如一种质粒、一种染色体外成份、极微染色体或一种人工染色体。作为选择、载体可以是一种导入宿主细胞时整合进宿主细胞基因组并与其整合进去的染色体一起复制的载体。
在载体中,DNA序列应以可操作的方式与合适的启动子序列相连。启动子可以是在选定的宿主细胞中表现出转录活性的任意DNA序列并可来自编码与宿主细胞同源或异源的蛋白质的基因。指导本发明的DNA构建体转录的合适的启动子例子,特别是在细菌宿主中有大肠杆菌lac操纵子的启动子,天蓝色链霉菌琼脂酶基因dagA启动子,地衣形芽孢杆菌α淀粉酶基因(amyL)启动子,嗜热脂肪芽孢杆菌麦芽淀粉酶基因(amyM)启动子,解淀粉芽孢杆菌α-淀粉酶(amyQ)启动子或枯草芽孢杆菌xylA和xylB基因启动子。在酵母宿主中,有用的启动子是eno-1启动子。为了在真菌宿主中转录,有用的启动子的例子是那些来自编码米曲霉高峰氏淀粉酶。Rhizomucor miehei天冬氨酸蛋白酶,黑色曲霉中性α-淀粉酶,黑色曲霉酸性稳定α-淀粉酶,黑色曲霉或A,awamsii葡糖淀粉酶(gluA),Rhizomucor miehei脂酶,米曲霉碱性蛋白霉,米曲霉磷酸丙糖异构酶或构巢曲霉乙酰胺酶的基因的启动子。优选高峰氏淀粉酶和gluA启动子。
本发明的表达载体也可包含合适的转录终止子和在真核生物中与编码本发明的漆酶的DNA序列以可操纵的方式相连的多聚腺苷酸化序列。终止和多聚腺苷酸化序列可适当源于启动子相同的来源。载体可进一步包含使载体在其宿主细胞中复制的DNA序列。这类序列的例子是质粒pUC19,pACYC177,pUB110,pE194,pAMB1和pIJ702的复制起点。
载体也可包含可选择的标记,例如,其产物弥补宿主细胞缺陷的基因,如枯草芽孢杆菌或地衣形芽孢杆菌的dal基因,或提供抗生素抗性(如氮苄青霉素、卡那霉素,氯霉素或四环素的基因。曲霉属选择标记的例子包括amdS,pyrG,argB,niaD和sC和一种产生潮霉素抗性的标记。优选用于曲霉属宿主细胞的是构巢曲霉或米曲霉amdS和pyrG标记。常用的哺乳动物标记是二氢叶酸还原酶(DHFR)基因。而且可经共转化完成选择,例如,如WO 91/17243所述。
一般优选细胞外表达。因此,本发明的漆酶可包含允许将表达蛋白质分泌进培养基的前区肽。如果需要,该前区肽可以是本发明漆酶的天然存在或常规经编码各自前区肽的DNA序列取代完成的用不不同前区肽或信号序列的取代。例如,前区可以来自曲霉属种类的葡糖淀粉酶或淀粉酶基因、芽孢杆菌属种类的淀粉酶基因、Rhizomucor miehei的脂酶或蛋白酶基因、啤酒糖酵母的α-因子基因成小牛凝乳酶原基因。特别优选的是,当宿主是真菌细胞时,前区是米曲霉高峰氏淀粉酶、黑色曲霉中性淀粉酶、芽孔杆菌NCIB11837的麦芽淀粉酶,嗜热脂肪芽孢杆菌α-淀粉酶,或地衣形芽孢杆菌枯草杆菌蛋白酶的前区。有效的信号序列是米曲霉高峰氏淀粉酶信号,Rhizomucor miehei天冬氨酸蛋白酶信号和Rhizomu-cor miehei脂酶信号。
用于分别连接本发明的DNA构建体、启动子、终止子或其它成份以及用于将它们插入含有复制所必需的信息的合适载体中的方法是本领域的技术人员所熟知的(参见,例如Sambrook etal.Molecular Cloning,1989)。
包含上面限定的本发明的DNA构建体或表达载体的本发明的细胞可优先应用作本发明的酶的重组生产中的宿主细胞。可用本发明的DNA构建体转化该细胞,通常经过将DNA构建体整合进宿主染色体中。一般认为这种整合对于DNA序列可能更稳定地保留于细胞中是一种优点。可根据常规方法实现将DNA构建体整合进宿主染色体中,例如经过同源或异源重组。作为选择,可用上面所述的与不同类型宿主细胞相连系的表达载体来转化细胞。
宿主细胞可选自原核细胞,如细菌细胞。合适的细菌例子是革兰氏阳性细菌、如枯草芽孢杆菌、地衣形芽孢杆菌、缓慢芽孢杆菌、短芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、BaciUus lautus、巨大芽孢杆菌,苏云金芽孢杆菌、或变青链霉菌或鼠灰链霉菌,或革兰氏阴性细菌,如大肠杆菌。细菌的转化可用诸如原生质体转化或用本身已知方式的感受态细胞来实现。
宿主细胞也可以是真核生物,如哺乳动物细胞、昆虫细胞、植物细胞或优选真菌细胞(包括酵母和丝状真菌)。例如,有用的哺乳动物细胞包括CHO或COS细胞。酵母宿主细胞可选自糖酵母属或裂殖糖酵母属的种类,例如啤酉酵母。有用的丝状真菌可选自曲霉属种类,例如米曲霉或黑色曲霉。作为选择,镰孢属种类的菌株(例如尖孢镰孢)可用作宿主细胞。真菌细胞的转化方法包含原生质体形成和原生质体的转化及随后以本身已知的方式再生细胞壁。转化曲霉属宿主细胞的合适的方法在EP238023中进行了描述。Malardier等1989年描述了转化镰孢属种类的合适的方法。
因此,本发明提供了一种生产本发明的重组漆酶的方法,该方法包含在诱导酶产生的条件下培养上述宿主细胞并从细胞和/或培养基中回收该酶。用于培养该细胞的培养基可以是任何适于生长该宿主细胞并获得本发明的漆酶表达的常规培养基。合适的培养基可从供应商买到或根据出版的配方制备(例如,见美国标准菌种保藏所的目录。
可用常规方法从培养基中回收所得的酶,包括以离心或过滤从培养基中分离细胞,以盐法(例如硫酸铵)沉淀上清或滤液中的蛋白质成份,接着以各种色谱法纯化(例如离子交换色谱、凝胶过滤色谱、亲和色谱或类似方法)。优选的是分离的蛋白质经SDS-PAGE测定的纯度为大约90%,其纯度在食品,汁液或去污剂应用中是极为重要的。
在特别优选的实施例中,漆酶的表达是在真菌宿主细胞中实现的,如在曲霉属中。如下面实施例的详细描述,漆酶基因连接到含米曲霉高峰氏α-淀粉酶启动子和构巢曲霉amdS可选择标记的质粒上。作为选择,amdS可在单独的质粒上并用于共转化。根据Velton等(PNAS USA 81:1470-1474,1984)描述的方法,可将质粒(或多个质粒)用于转化曲霉属种类的宿主细胞(如米曲霉或黑色曲霉)。
本领域的技术人员将认识到本发明并不局限于使用本文特别公开的核酸片段(例如图1和2)。显而易见的是本发明还包含编码与图1,2和3所示相同的氨基酸序列的核苷酸序列,但由于遗传密码的简并性,它们与那些特别描述的核苷酸序列不同。另外,本发明还包含其它的核苷酸片段及由其编码的蛋白质,该核苷酸片段编码与茄丝核菌漆酶蛋白质具有基本相同的最适pH并与茄丝核菌氨基酸序列表现出明显的同源水平的漆酶蛋白质。例如,现有资料表明不只一种丝核菌属的种类产生具有所述pH特征的漆酶;因此期望其它的丝核菌属种类也产生相似的漆酶,从而使用本文描述的技术可将它们用作本发明范围内的基因的来源。正如提供的实施例所示,不仅不只一种编码具有所需特征的漆酶的核苷酸和氨基酸序列,而且还有大量在序列耐受范围内仍产生功能性酶的变异体。因此,本发明还包含任何变异的核苷酸序列及由其编码的蛋白质,该蛋白质与图1,2和3描述的一个或另一个氨基酸序列相比至少保留了大约80%的同源性,并且保留了本文所述序列的漆酶和最适pH活性。特别是在丝核菌属漆酶高保守区保留高水平(即≥80%)同源性的变异体是可以预料到的。这类区域鉴定为RSLAC1中的残基458-469,RSLAC2中的478-489;RSLACI中的131-144和RSLAC2中的132-145。
例如,上面限定的种类中有用的变异体包括发生了保守氨基酸置换的变异体,其中的置换并不显著影响到蛋白质的活性。保守置换是指相同类的氨基酸可被该类型的任何其它氨基酸取代。例如,非极性脂肪族残基Ala,Val,Leu和Ile可互相交换,碱性残基Lys和Arg或酸性残基Asp和Glu也一样。同样地,Ser和Thr互相是保守置换,Asn和Gln也一样。这种置换可在对分子功能较重要的区域之外进行且仍产生活性酶,这对本领域的技术人员而言是显而易见的。在0.1M磷酸钠(pH7.0)中使用标准ABTS氧化方法易于测定所需活性的保留。
该蛋白质可用于许多不同的工业生产中;仅管该酶在低pH下也发挥一定程度的功能,但茄丝核菌漆酶最有利的是用于通常在中性或碱性pH下进行的生产中,因为其它漆酶在这一pH范围没有活性。这些生产包括木质素(牛皮纸和木质素硫酸盐)在溶液中的聚合以产生具有高分子量的木质素。中性/碱性漆酶对于在较高pH下更易溶的牛皮纸木质素具有特别优点。例如,这类方法在Jinet al,Holzforschung45(6):467-468,1991;美国专利号4,432,921;EP0275544;PCT/DK93/00217,1992中普进行了描述。
本发明的漆酶也可用于牛皮纸浆中木质素的原位解聚,由此能产生具有低木质数含量的纸浆。通常使用氯气用于木质素的解聚,它导致产生氯化的芳香族化合物,该化合物是一种对环境有害的造纸厂副产品,漆酶的使用改进了这一现状。例如,这类用途在Current opinion in Biotechnology3:261-266,1992;J.Biotech-nol.25:333-339,1992;Hiroi et al,Svensk papperstidning 5:162-166,1976中进行了描述。由于造纸厂的环境一般是碱性,在这一用途中,该漆酶比其它在酸性条件下发挥最佳功能的已知漆酶相比更有用。
染料和其它有色化合物的氧化导致化合物脱色。漆酶可用于该目的,它在织物间不需染料转移的情况下(例如在纺织工业和去污工业中)特别具有优势。染料转移抑制和染料氧化的方法可见WO 92/01406,WO 92/18683,EP 0495836和Calvo.Mededelingenvan de Faculteit Landbouw-wetenschappen/RijiksuniversitetGent.56:1565-1567,1991。
该漆酶也可用于存在于液体中的酚化合物的聚合。这种用途的一个例子是汁液的处理(例如苹果汁),以使漆酶加速存在于汁液中的酚化合物的沉淀,从而产生更稳定的汁液。这类应用在Stutz,Fruit processing 7193,248-252,1993;Maier et al.,Dt,Lebens-mittel-rindschall 86(5):137-142,1990;Dietrich et al.,Fluss,Obst 57(2):67-73,1990中进行了描述。以下面非限制性的实施例进一步解释本发明。
实施例1.茄丝核菌漆酶的纯化和鉴定经过将含活生长物的一小块琼脂转移到500ml摇瓶中的100ml cFM(24.0g马铃薯葡萄糖培养基,3.0g酵母提取物,1.0ml微量元素溶液〔0.80g KH2PO4,0.64g CuSO4.5H2O,0.11gFeSO4.7H2O,0.80g MnCl2.4H2O,0.15g ZnSO4.7H2O,加蒸馏水至1000ml〕加蒸馏水至1000ml)中,检查在马铃薯葡萄糖琼脂(Difco)上培养的茄丝核菌单个分离物的漆酶形成。培养在室温下、有轨摇床上以200rpm进行。
在50、74、122和170小时时收获样品,离心并用ABTS(ABTS=2,2’-二连氮(3乙基苯并噻唑啉-6-硫酸)分析清亮的上清液中的漆酶。经过加入200μl 2mM ABTS的0.1M磷酸盐缓冲液(pH7)室温(大约23-25℃)培养30分钟后在418mm处观察吸光率变化来进行分析。该方法是对Putter和Becker(Peroxidases,in:Bergmeyer,H.U.Ced),Methods of Enzymatic Analysis,3rd ed.,VolⅢ,pp.286-293,1983)的过氧化物酶分析法的改进。
电泳分离每份在172小时收获的漆酶并以ABTS作为色素原染色。出现一些明显的带型;菌株RS22显示出产生具有碱性pI的漆酶,将它选来作进一步鉴定。
使用丁香醛连氮方法也可测定漆酶活性。在需氧条件下,漆酶催化丁香醛连氮氧化成四甲氧基偶氮双甲又醌,颜色曲黄变柴。在1cm比色杯中将3000μl 25mM乙酸缓冲液(含10mg/l硫酸铜,5H2O(pH5.5)在30℃下与225μl 0.28mM丁香醛连氮(5mg(溶于25ml乙醇中)用去矿质水调至50ml)混合。然后将混合物与100μl漆酶稀释液〔在乙酸缓冲液中稀释,以便吸光率的增加(ΔOD)在0.1-0.6范围内〕混合。反应混合物放于30℃恒温分光光度计中,从加入漆酶起反应在530nm下进行10到70秒。酶活性计算式为ΔOD/分X0.677X稀释系数,以LACU表达。
为了纯化丝核菌属漆酶,将2.1升LACU活性为0.19LACU/ml的培养基通过10μm滤膜过滤并使用临界值为10kDa的Filtronminisette OMEGA膜经超滤浓缩至230ml。样品的pH是5.3,浓缩样品的活性测定为3.34LACU/ml。
将pH调至4.5后,由于有轻微沉淀,所以进行了过滤。将样品加到用20mM乙酸缓冲液(pH4.5,缓冲液A)平衡的40ml SSepharose Fast Flow柱上。在缓冲液A中洗涤柱并用含1M NaCl的缓冲液A洗脱。收集活性馏分并合并。使用装配有Diaflo YM10膜的Amicon超滤装置浓缩活性合并物并将缓冲液变成缓冲液A。除了用超过30倍柱体积的从缓冲液A到含0.5M NaCl的缓冲液A的线型梯度溶液进行洗脱外,使用上述方法在5ml S SepharoseHigh Performance柱上对该样品进行再次色谱。合并这次纯化中表现出最高活性的馏分。以A280nm下一个吸光率单位等于1mg/ml估测蛋白质浓度时,获得大约45mg漆酶。以SDS-PAGE判定蛋白质纯度>90%。以SDS-PAGE估测的分子量是大约67KDa。纯化蛋白质的比活是1LACU/mg。使用丁香醛连氮作底物得到的纯化蛋白质的pH适应状况如下面表1所示。表1pH 5 6 7 8%活性0.53110059为了测序蛋白质,使用无色杆菌属赖氨酸特异性蛋白质(无色杆菌属蛋白酶Ⅰ)或地衣形芽孢杆菌谷氨酸特异性蛋白酶产生多肽。使用含0.08%TFA水溶液的80%2-丙醇(溶剂B)在0.1%TFA水溶液(溶剂A)中的线型梯度以反相HPLC纯化多肽。
根据厂商说明书在Applied Biosystems 473A蛋白质测序仪上对完整蛋白质和纯化的多肽进行N-末端氨基酸序列分析。分离的蛋白质的起始部分的测序得到下面N-末端序列AVRNYKFDIKNVNVAPDGFQRPIVSV(SEQ.ID.NO:5)然后用赖氨酸或谷氨酸特异性蛋白酶消化该蛋白质,并鉴定了下面的另一些多肽。多肽1-4可与毛革盖菌漆酶序列进行序列对比多肽1:SQYVDGLRGPLVIYDPDDDH(SEQ.ID.NO:6)多肽2:GLALVFAEAPSQIRQGVQSVQPDDA(SEQ.ID.NO:7)多肽3:SRYBVBBASTVVMLEBWYHTPAXVLE(SEQ.ID.NO:8)多肽4:SLGPTPNYVNPXIRDVVRVGGTTVV(SEQ.ID.NO:9)多肽5:IRYVGGPAVX(N)RSVI(SEQ.ID.NO:10)多肽6:ILANPA(SEQ.ID.NO:11)多肽7:YEAPSLPT(SEQ.ID.NO:12)在上面序列中,X指末鉴定的残基,B代表残基是天冬氨酸或天冬酰胺。2.茄丝核菌漆酶基因的分离对从非丝核菌属种类获得的真菌性漆酶的已知氨基酸序列(Choi et al..出处同上;German et al.,出处同上;Saloheimo et al.出处同上;和Kojima et al,出处同上)进行研究以确定在它们中存在的相同序列。发现在靠近该蛋白质氨基末端第三个残基处有2个高度一致的区域,即IHWHGFFQ帮TFWYHSH。根据这些相同序列和相应的DNA序列,使用Applide Bioststem 394 DNA/RNA合成仪合成了3个简并寡核苷酸,即O-lac2〔TGG/AAAGAC-CATA/GGTGTCG/AGTA/G〕、其互补的O-lac2r和O-lac3〔ATC-CAT/CTGGCAT/cGGG/cA/TTCTTCCAG/A〕。
合成的寡核苷酸用于聚合酶链式反应(PCR)以便以茄丝核菌基因组DNA中筛选漆酶基因或基片段。为了扩增基因组DNA,将0.5μg基因组DNA与每种引物1μM,200μM dNTP,1U Taq聚合酶(Boehringer Mannheim)在10mM Tris-Cl,1.5mM MgCl2,50mM KCl,1mg/ml明胶;pH8.3的溶液中温育。反应温育方式为在95℃1×5分钟,30×〔95℃1分钟,50-60℃1分钟,72℃1分钟〕和72℃下1×5分钟。PCR反应扩增出一条220核苷酸的DNA片段。根据厂商说明书将PCR产物克隆进TA克隆载体(InVitrogenCorp.)中。经过对各个克隆的DNA测序鉴定PCR产物,区分出2个单独的漆酶基因,命名为RSlac1和RSlac2。
为了制备茄丝核菌基因组文库,用限制性酶Sau 3A部分消化茄丝核菌DNA,在Tris/乙酸盐/EDTA缓冲液中通过0.8%SeaPlaque Agarose(FMC Bioproducts)电泳以分离那些大小在8.0至21kb之间的DNA片段。根据厂商说明书用Beta-Agarase(NewEng Land Biolabs)进一步纯化凝胶分离的片段并连接到具有BamHⅠ末端的λ噬菌体EMBL3臂上。使用GigapackⅡ包装提取物(stratagene)体外包装所得的噬菌体。将25ml TB培养基+0.2%麦芽糖和10mM MgSO4的溶液接种到50μl E.colik802(supE,hsdR,gal,metB)过夜培养物的等份试样中并在37℃下摇动培养至A600=0.5。将25μl 1:10和1:50稀释的包装噬菌体与250μl K802细胞合并在37℃下培养20分钟。在48℃下向每个稀释液中加入5μl融化的顶级琼脂。然后将混合物涂布到预温的LB平板上并在37℃培养至少12小时。从这些噬菌体里在E.coli k802中产生了170,000噬菌斑的文库,扩增100倍备用。
为了筛选漆酶基因,使用常规方法将扩增的基因组文库的25,000噬菌斑涂布到NZY/琼脂糖平板上以便转移噬菌斑。使用随机标记成5×108cpm/μg的220核苷酸PCR片段作探针筛选滤膜。滤膜在42℃下在50%甲酰胺,6xssc中杂交16小时,在65℃下用0.5xssc,0.1%SDS洗涤。排出阳性克隆并使用常规方法再次筛选。鉴定的9个阳性克隆经DNA序列分析分成2类,显示出编码2种不同的漆酶基因(RSlac1和RSlac2)。使用荧光核苷酸和AppliedBiosystems自动DNA测序仪(Model 363A,Version 1,2,0)确定每个基因的完整核苷酸序列。核苷酸和预测的氨基酸序列在图1和2中描述。
为了分离RSlac3,从在1mM茴香胺存在的条件下生长的茄丝核菌菌丝体中纯化的polyA RNA用作使用标准方法进行cDNA合成的模板。通过以0.8%琼脂糖凝胶电泳分离cDNA并收集大小在1.7和3.5kb之间的DNA片段然后将经过大小分离的cDNA克隆进酵母表达载体pYESZ来构建文库。起初将该文库的3000酵母转化子涂布到含2%葡萄糖的YNB(每升1.7g无氨基酸酵母氮源,5g(NH4)2SO4上。在30℃下生长4天后,所得的菌落重复涂布到含0.1%葡萄糖、2%半乳糖和2mM ABTS〔2,2’-二连氮(3-乙基苯并噻唑啉-6-磺酸);Sigma#A-1888〕的YNB上。在30℃下生长24小时后,有一个菌落具有亮绿色的晕圈,逐渐变成暗紫色。分离该菌落的质粒并测序插入片段。RSlac3基因翻译部分和蛋白质的序列如图4SEQ.ID.NOs.13和14所示。3.漆酶基因的表达质粒pMWR-1是含高峰氏淀粉酶转录调控信号和高峰氏淀粉酶信号序列的载体的pUC。在信号序列裂解位点的单个sfiⅠ位点和3’相邻的NsiⅠ位点加工该质粒以便这两个限制性酶可用于在阅读框中导入外源蛋白质。使用PCR反应(按上述进行,但以100ng合适的线型化质粒DNA作模板)和诱变引物,将sfiⅠ位点分别在RSlac1和RSlac2的氨基酸12和氨基酸14位处导入,以便蛋白质的编码序列在具有高峰氏淀粉酶信号序列的阅读框中。另外,PCR扩增也用于在RSlac1的3’端导入PstⅠ位点(cTGCAG)和在RSlac2的3’端导入NsiⅠ位点(ATGCAT)。
为了准备转化,将米曲霉细胞在YPG(1g/l酵母提取物,0.25gK2PO4、0.125g(MgSO4,3.75g葡萄糖)中在34℃下以100-120rpm培养16-20小时,然后以miracloth过滤收集。用Mg溶液洗涤细胞(0.6M MgSO4·7H2O),然后将2-6g细胞悬浮于10mlMgP(1.2M MgSO4·7H2O,10mM NaH2PO4·2H2O;pH5.8)中。向其中加入1ml NovozymeR234(120mg/ml MgP),将样品在冰上放置5分钟。加入1ml BSA(12mg/ml),在34-37℃下轻轻摇动样品。通过miracloth过滤收集原生质体,用5ml ST(0.6M山梨醇,100mM Tris,pH7)覆盖。样品以2500rpm离心15分钟,收集原生质体带。加入2体积的STCC1.2M山梨醇,10mM Tris,10mMCa-Cl2·2H2O;pH7.5),样品在2500rpm下离心5分钟。用5ml STC洗涤沉淀2次,将原生质体悬浮于0.5-1ml STC中。
为了进行转化,将原生质体浓度调到1-5×107/ml。向100μl原生质体溶液中加入最大量为10μl的DNA溶液(5-10μg超螺旋DNA)和0.2ml PEG(60%PEG 4000,10mM Tris,10mMCaCl2·H2O;pH7.5),将混合物充分混匀。样品在室温下静置25分钟,然后向其中先加入0.2ml PEG并混匀,然后加入0.85ml PEG并混匀。混合物在室温下静置20分钟,然后以4000rpm离心15分钟。以2ml STC经过在2500rpm离心10分钟洗涤沉淀。将原生质体重悬于0.2-0.5ml STC中,然后涂布到COVE平板上。COVE培养基(pH7)含有342.3g/l蔗糖,25g/l琼脂和盐溶液,盐溶液含有26g/l KCl,26g/l MgSO4·H2O,76g/lKH2PO4和5ml/l的微量金属,微量金属是40mg/l NaB4O7·10H2O,400mg/l CuSO4·5H2O,1200mg/l FeSO4·7H2O,700mg/l MnSO4·H2O.800mg/lNa2MO2·2H2O,10g/l ZnSO4·7H2O。高压灭菌后,向溶液中加入10ml/l1M过滤的乙酰胺和5-10ml 3M CsCl。经过在含乙酰胺作碳源的COVE培养基上生长细胞来选择转化子。
样品中漆酶生产可经过接上ABTS氧化方法在含2mMABTS.pH5-7.3的COVE培养基上予以证实。RSlac1和RSlac2两者在pH5和pH7时表达出漆酶活性,而对照漆酶相反,它在pH7.3时基本上无活性。
使用丁香醛连氮作底物在各种pH下测定RSac1和RSlac2每种表达的产物的氧化酶活性。测定基本上按照上对天然蛋白质的测定方法在pH4-9的范围内进行。如图5和6所示,两漆酶在pH超过5时具有活性,RSlac1在pH超过6时具有特别好的活性。将该活性方式与从RS22中分离的RSlac3漆酶所观察到的进行一般性比较(见上面表1),RSlac1表现出最大范围的活性。
生物学材料的保藏下列生物学材料按布达佩斯条约保藏在位于Bakeham Lane,Egham,Surrey Twzo 9Ty的遗传资源资料保藏中心的国际微生物学研究所,并给出下列保藏号。
保藏品 保藏号茄丝核菌RS22IMI CC 358730下列生物材料按布达佩斯条约保藏在1815Vnirersity Street,Peoria,IUinois,61604北方区域研究中心的农作物研究服务社专利培养的保藏中心,并给出下列保藏号。
保藏品 保藏号含与α-淀粉酶信号序列融合 NRRL B-21141的RSlac1的大肠杆菌(EMC00844)含具有sfiⅠ位点插入的RSlac2 NRRL B-21142的大肠杆菌(EMCC 00845)含RSlac3的大肠杆菌(EMCC 0088) NRRLB-21156
序列描述(1)一般资料(ⅰ)申请人:
(A)名称Novo Nordisk A/S(B)街道Novo Alle(C)城市Bagsvrerd(D)国家丹麦(E)邮编(编码)DK-2880(F)电话+4544448888(G)电传+4544493256(F)电极37304(ⅰ)申请人(A)名称Novo Nordisk Biotech.Inc(B)街道1445 Drew Avenue(D)国家美国(E)邮编(编码)95616-4880(F)电话(916)757-8100(G)电传(916)758-0317(ⅱ)发明题目纯化的pH中性漆酶和编码该酶的核酸(ⅲ)序列数14(ⅳ)联系地址(A)联系人Novo Nordisk of North America.Inc.
(B)街道405 Lexington avencce,Suite 6400(C)城市纽约
(D)州纽约(E)国家美国(F)编码10174-6401(ⅴ)计算机可读形式(A)媒体类型Floppy盘(B)计算机IBM PC兼容性(C)操作系统PC-DOS/MS-DOS(D)软件Patent In Release#1.0,Version#1.25(ⅵ)最近申请资料(A)申请号即将指定(B)申请日1994年9月13日(ⅶ)优先权申请资料(A)申请号US08/172,331(B)申请日1993年12月22日(ⅶ)优先权申请资料(A)申请号US08/122,230(B)申请日1993年9月17日(ⅶ)优先权申请资料(A)申请号US08/122,827(B)申请日1993年9月17日(ⅶ)优先权申请资料(A)申请号US08/162,827(B)申请日1993年12月3日
(ⅷ)代理人/代理资料(A)姓名Lowney Dr.,Karen A.
(B)登记号31,274(C)参考/目录号4052.204-WO(ⅸ)电传资料(A)电话212-867-0123(B)电话212-878-9655(2)SEQ ID NO:1资料(ⅰ)序列特征(A)长度2838碱基对(B)类型核酸(C)链型单链(D)拓扑线型(ⅱ)分子类型DNA(基因组)(ⅵ)最初来源(A)生物体丝核菌属漆酶(ⅸ)特征(A)名称/键内含子(B)位置302..351(ⅸ)特征(A)名称/键内含子(B)位置463..512(ⅸ)特征(A)名称/键内含子(B)位置576..633(ⅸ)特征(A)名称/键内含子(B)位置760..818(ⅸ)特征(A)名称/键内含子(B)位置822..877(ⅸ)特征(A)名称/键内含子(B)位置1001..1054(ⅸ)特征(A)名称/键内含子(B)位置1316..1372(ⅸ)特征(A)名称/键内含子(B)位置1697..1754(ⅸ)特征(A)名称/键内含子(B)位置1827..1880(ⅸ)特征(A)名称/键内含子(B)位置1992..2051(ⅸ)特征(A)名称/键内含子(B)位置2157..2206(ⅸ)特征(A)名称/键内含子(B)位置2348..2404(ⅸ)特征(A)名称/键内含子(B)位置2438...2498(ⅸ)特征(A)名称/键CDS(B)位置连接(170..301,352..462,513..575,634..759,819..821,878..1000,1055..1315,1373..1696,1755..1826,1881..1991,2052..2156,2207..2347,2405..2437,2499..2621)(ⅹⅰ)序列描述SEQ ID NO:1AGCGTCACAC CAGACATCGG ATGAAAACGG AAAGTGTATG CGCCATTTGA CGTCTGCGGC 60AACCACTGTT CATCTCGCGA GCTAACATGG GCGACGTATA AGAAGAACGC GAGAATGGGC 120AGATTTCGAT ATCCCCTCTC GTCTCGGTTT TGGTCTCGGC TTGCCTCTA ATG GCG 175Met Ala1CGC ACC ACT TTC CTT GTC TCG GTT TCG CTC TTT GTT TCC GCT GTT CTT 223Arg Thr Thr Phe Leu Val Ser Val Ser Leu Phe Val Ser Ala Val Leu5 10 15GCG CGC ACC GTC GAG TAC GGC TTG AAG ATT AGT GAT GGG GAG ATA GCT 271Ala Arg Thr Val Glu Tyr Gly Leu Lys Ile Ser Asp Gly Glu Ile Ala20 25 30CCT GAC GGT GTT AAG CGT AAT GCG ACT TTG GTACGCACTC CTTGTAATCC 321Pro Asp Gly Val Lys Arg Asn Ala Thr Leu35 40AACAATTCAA GGTTTCTGAT GCTTGGTCAG GTA AAT GGA GGG TAT CCC GGT CCA 375Val Asn Gly Gly Tyr Pro Gly Pro45 50CTC ATT TTT GCC AAC AAG GGG GAT ACT CTC AAA GTC AAG GTC CAA AAC 423Leu Ile Phe Ala Asn Lys Gly Asp Thr Leu Lys Val Lys Val Gln Asn55 60 65AAG CTC ACG AAT CCT GAG ATG TAT CGC ACC ACT TCC ATC GTATGTTCGT472Lys Leu Thr Asn Pro Glu Met Tyr Arg Thr Thr Ser Ile70 75 80TCGATATCTA CTAATACATC CGTCGCTAAA TATCTTGTAG CAT TGG CAC GGT CTC 527His Trp His Gly Leu85TTA CAA CAT AGA AAC GCC GAC GAC GAC GGT CCT TCG TTC GTC ACT CAG575Leu Gln His Arg Asn Ala Asp Asp Asp Gly Pro Ser Phe Val Thr Gln90 95 100GTAGGATTCT GGAAGGTTGG CCTGAACTCT CTGTTAACCG ACAACCCGAT GTCACCAG633TGC CCG ATT GTT CCA CGC GAG TCG TAT ACT TAC ACC ATA CCT CTG GAC681Cys Pro Ile Val Pro Arg Glu Ser Tyr Thr Tyr Thr Ile Pro Leu Asp105 110 115GAT CAA ACC GGA ACC TAT TGG TAC CAT AGC CAC TTG AGT TCG CAA TAC729Asp Gln Thr Gly Thr Tyr Trp Tyr His Ser His Leu Ser Ser Gln Tyr120 125 130GTT GAT GGT CTT CGA GGC CCG CTG GTA ATC GTGAGTATCT TGACTTGTCT 779Val Asp Gly Leu Arg Gly Pro Leu Val Ile135 140ACTGAAGGCA ACGAGACTAA AACAAGCGTC GATTCACAG TAT GTTCGTCTCC 831Tyr145CCTTTATTTA GCTCTGGATC TTCATTTCTC ACGTAATACA TGATAG GAT CCC AAG 886Asp Pro LysGAT CCT CAC AGG CGT TTG TAT GAT GTT GAC GAT GAG AAG ACC GTC CTG934Asp Pro His Arg Arg Leu Tyr Asp Val Asp Asp Glu Lys Thr Val Leu150 155 160ATC ATC GGT GAC TGG TAT CAT GAA TCG TCC AAG GCA ATC CTT GCT TCT982Ile Ile Gly Asp Trp Tyr His Glu Ser Ser Lys Ala Ile Leu Ala Ser165 170 175 180GGT AAC ATT ACC CGA CAG GTAAGTGATA CATGCCGGTC CCAGAAAAAT 1030Gly Asn Ile Thr Arg Gln185TCTCTAAATT CATTTTAATT ACAG CGA CCG GTC TCT GCC ACC ATC AAC GGC1081Arg Pro Val Ser Ala Thr Ile Asn Gly190 195AAA GGT CGA TTT GAC CCT GAC AAC ACT CCT GCC AAC CCA GAT ACT CTG 1129Lys Gly Arg Phe Asp Pro Asp Asn Thr Pro Ala Asn Pro Asp Thr Leu200 205 210TAC ACC CTC AAG GTC AAG CGA GGG AAG CGC TAT CGT CTG CGT GTC ATC 1177Tyr Thr Leu Lys Val Lys Arg Gly Lys Arg Tyr Arg Leu Arg Val Ile215 220 225AAT AGC TCG GAG ATC GCT TCG TTC CGA TTC AGT GTG GAA GGT CAC AAG 1225Asn Ser Ser Glu Ile Ala Ser Phe Arg Phe Ser Val Glu Gly His Lys230 235 240GTG ACT GTG ATT GCT GCC GAT GGC GTC TCT ACC AAA CCG TAT CAG GTC 1273Val Thr Val Ile Ala Ala Asp Gly Val Ser Thr Lys Pro Tyr Gln Val245 250 255GAT GCG TTT GAT ATT CTA GCA GGA CAG CGC ATA GAT TGC GTC 1315Asp Ala Phe Asp Ile Leu Ala Gly Gln Arg Ile Asp Cys Val260 265 270GTAAGTGTCG TCCGAACCCA CATCTGAGCT CAAGTGTTGA TACATGCGCG CTTATAG1372GTG GAG GCG AAC CAA GAA CCC GAC ACA TAC TGG ATC AAC GCA CCG CTG 1420Val Glu Ala Asn Gln Glu Pro Asp Thr Tyr Trp Ile Asn Ala Pro Leu275 280 285ACC AAC GTG CCC AAC AAG ACC GCT CAG GCT CTC CTC GTT TAT GAG GAG 1468Thr Asn Val Pro Asn Lys Thr Ala Gln Ala Leu Leu Val Tyr Glu Glu290 295 300 305GAT CGT CGG CCG TAC CAC CCT CCA AAG GGC CCG TAT CGC AAG TGG AGC 1516Asp Arg Arg Pro Tyr His Pro Pro Lys Gly Pro Tyr Arg Lys Trp Ser310 315 320GTC TCT GAG GCG ATC ATC AAG TAC TGG AAT CAC AAG CAC AAG CAC GGA 1564Val Ser Glu Ala Ile Ile Lys Tyr Trp Asn His Lys His Lys His Gly325 330 335CGT GGT TTG CTG TCT GGA CAT GGA GGT CTC AAG GCT CGG ATG ATC GAG 1612Arg Gly Leu Leu Ser Gly His Gly Gly Leu Lys Ala Arg Met Ile Glu340 345 350GGT AGC CAT CAT CTG CAT TCG CGC AGC GTC GTT AAG CGC CAG AAT GAG 1660Gly Ser His His Leu His Ser Arg Ser Val Val Lys Arg Gln Asn Glu355 360 365ACC ACC ACT GTT GTA ATG GAC GAG AGC AAG CTC GTT GTAAGTACCA 1706Thr Thr Thr Val Val Met Asp Glu Ser Lys Leu Val370 375 380TATTTAAAAG TTGGTTGGGT TTCGAATACT TATTTCAACT TTTCTTAG CCA CTG GAA 1763Pro Leu GluTAC CCC GGC GCT GCA TGC GGG TCT AAA CCT GCT GAC CTC GTC TTG GAT 1811Tyr Pro Gly Ala Ala Cys Gly Ser Lys Pro Ala Asp Leu Val Leu Asp385 390 395 400CTC ACT TTT GGT TTG GTATGTAGCC AAATCGCCCA TATACAGGAT ACTGAATATT 1866Leu Thr Phe Gly Leu405GTTTGTGCGT GTAG AAC TTT GCT ACC GGG CAC TGG ATG ATC AAC GGT ATC 1916Asn Phe Ala Thr Gly His Trp Met Ile Asn Gly Ile410 415CCA TAC GAG TCT CCC AAA ATC CCC ACA TTG CTC AAG ATC CTC ACT GAT 1964Pro Tyr Glu Ser Pro Lys Ile Pro Thr Leu Leu Lys Ile Leu Thr Asp420 425 430GAG GAC GGG GTT ACC GAG TCT GAC TTC GTATGTTCCC TTTTCGGTAT2011Glu Asp Gly Val Thr Glu Ser Asp Phe435 440CTTCGTATGC GTGCACTGAC TCGTGCTGGT GGGAATTTAG ACC AAG GAG GAG CAC 2066Thr Lys Glu Glu His445ACA GTC ATA CTC CCG AAG AAC AAA TGC ATC GAA TTC AAC ATC AAG GGG 2114Thr Val Ile Leu Pro Lys Asn Lys Cys Ile Glu Phe Asn Ile Lys Gly450 455 460AACTCG GGT ATT CCC ATT ACG CAC CCC GTA CAT CTT CAC GGT 2156Asn Ser Gly Ile Pro Ile Thr His Pro Val His Leu His Gly465 470 475GTAAGTGCAT ATCGGATGGT TTACGATACT AAGGCTCATC AACTTTTTAG CAC ACT 2212His ThrTGG GAT GTC GTA CAA TTT GGC AAC AAC CCA CCC AAT TAT GTC AAT CCT 2260Trp Asp Val Val Gln Phe Gly Asn Asn Pro Pro Asn Tyr Val Asn Pro480 485 490 495CCC CGT AGG GAC GTG GTT GGC TCT ACA GAT GCG GGT GTG AGG ATT CAG 2308Pro Arg Arg Asp Val Val Gly Ser Thr Asp Ala Gly Val Arg Ile Gln500 505 510TTC AAG ACC GAC AAT CCA GGA CCG TGG TTC CTG CAC TGC GTGCGTCGGT 2357Phe Lys Thr Asp Asn Pro Gly Pro Trp Phe Leu His Cys515 520CCCCATCGTC CGTTATGGTT TTTCTAATAC GTCCCATTCT ATTTTAG CAT ATT GAC 2413His Ile Asp525TGG CAT CTT GAG GAG GGT TTC GCA GTGAGTACTG AGACCTAAGT GCTACTCGGC2467Trp His Leu Glu Glu Gly Phe Ala530 535TCATTACTGA TTACCGCATG TATGCGTCTA G ATG GTG TTT GCT GAA GCG CCC 2519Met Val Phe Ala Glu Ala Pro540GAA GCC GTC AAG GGA GGT CCA AAG AGC GTG GCC GTG GAC TCT CAG TGG 2567Glu Ala Val Lys Gly Gly Pro Lys Ser Val Ala Val Asp Ser Gln Trp545 550 555GAA GGG CTG TGT GGC AAG TAC GAC AAC TGG CTA AAA TCA AAT CCG GGC 2615Glu Gly Leu Cys Gly Lys Tyr Asp Asn Trp Leu Lys Ser Asn Pro Gly560 565 570CAG CTG TAGGCGTATC GCAGCCACAT TGGTGATGAT TGAAAGTTGC ATCTTGTTCC 2671Gln Leu575TATAACCGGC TCTTATATAC GGGTGTCTCC CAGTAAAGTC GTAGCCCAAT TTCAGCCGAG 2731ACAGATATTT AGTGGACTCT TACTCTTGTG TCCCATTGAC GCACATCGTT GCATCAAACC 2791TGCTTTTTAT CGTCCCTCTT TGTAATTTGT GTTGCTGTAA TGTATCG 2838(2)SEQ ID NO资料(ⅰ)序列特征(A)长度576氨基酸(D)拓扑线型(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:2Met Ala Arg Thr Thr Phe Leu Val Ser Val Ser Leu Phe Val Ser Ala1 5 10 15Val Leu Ala Arg Thr Val Glu Tyr Gly Leu Lys Ile Ser Asp Gly Glu20 25 30Ile Ala Pro Asp Gly Val Lys Arg Asn Ala Thr Leu Val Asn Gly Gly35 40 45Tyr Pro Gly Pro Leu Ile Phe Ala Asn Lys Gly Asp Thr Leu Lys Val50 55 60Lys Val Gln Asn Lys Leu Thr Asn Pro Glu Met Tyr Arg Thr Thr Ser65 70 75 80Ile His Trp His Gly Leu Leu Gln His Arg Asn Ala Asp Asp Asp Gly85 90 95Pro Ser Phe Val Thr Gln Cys Pro Ile Val Pro Arg Glu Ser Tyr Thr100 105 110Tyr Thr Ile Pro Leu Asp Asp Gln Thr Gly Thr Tyr Trp Tyr His Ser115 120 125His Leu Ser Ser Gln Tyr Val Asp Gly Leu Arg Gly Pro Leu Val Ile130 135 140Tyr Asp Pro Lys Asp Pro His Arg Arg Leu Tyr Asp Val Asp Asp Glu145 150 155 160Lys Thr Val Leu Ile Ile Gly Asp Trp Tyr His Glu Ser Ser Lys Ala165 170 175Ile Leu Ala Ser Gly Asn Ile Thr Arg Gln Arg Pro Val Ser Ala Thr180 185 190Ile Asn Gly Lys Gly Arg Phe Asp Pro Asp Asn Thr Pro Ala Asn Pro195 200 205Asp Thr Leu Tyr Thr Leu Lys Val Lys Arg Gly Lys Arg Tyr Arg Leu210 215 220Arg Val Ile Asn Ser Ser Glu Ile Ala Ser Phe Arg Phe Ser Val Glu225 230 235 240Gly His Lys Val Thr Val Ile Ala Ala Asp Gly Val Ser Thr Lys Pro245 250 255Tyr Gln Val Asp Ala Phe Asp Ile Leu Ala Gly Gln Arg Ile Asp Cys260 265 270Val Val Glu Ala Asn Gln Glu Pro Asp Thr Tyr Trp Ile Asn Ala Pro275 280 285Leu Thr Asn Val Pro Asn Lys Thr Ala Gln Ala Leu Leu Val Tyr Glu290 295 300Glu Asp Arg Arg Pro Tyr His Pro Pro Lys Gly Pro Tyr Arg Lys Trp305 310 315 320Ser Val Ser Glu Ala Ile Ile Lys Tyr Trp Asn His Lys His Lys His325 330 335Gly Arg Gly Leu Leu Ser Gly His Gly Gly Leu Lys Ala Arg Met Ile340 345 350Glu Gly Ser His His Leu His Ser Arg Ser Val Val Lys Arg Gln Asn355 360 365Glu Thr Thr Thr Val Val Met Asp Glu Ser Lys Leu Val Pro Leu Glu370 375 380Tyr Pro Gly Ala Ala Cys Gly Ser Lys Pro Ala Asp Leu Val Leu Asp385 390 395 400Leu Thr Phe Gly Leu Asn Phe Ala Thr Gly His Trp Met Ile Asn Gly405 410 415Ile Pro Tyr Glu Ser Pro Lys Ile Pro Thr Leu Leu Lys Ile Leu Thr420 425 430Asp Glu Asp Gly Val Thr Glu Ser Asp Phe Thr Lys Glu Glu His Thr435 440 445Val Ile Leu Pro Lys Asn Lys Cys Ile Glu Phe Asn Ile Lys Gly Asn450 455 460Ser Gly Ile Pro Ile Thr His Pro Val His Leu His Gly His Thr Trp465 470 475 480Asp Val Val Gln Phe Gly Asn Asn Pro Pro Asn Tyr Val Asn Pro Pro485 490 495Arg Arg Asp Val Val Gly Ser Thr Asp Ala Gly Val Arg Ile Gln Phe500 505 510Lys Thr Asp Asn Pro Gly Pro Trp Phe Leu His Cys His Ile Asp Trp515 520 525His Leu Glu Glu Gly Phe Ala Met Val Phe Ala Glu Ala Pro Glu Ala530 535 540Val Lys Gly Gly Pro Lys Ser Val Ala Val Asp Ser Gln Trp Glu Gly545 550 555 560Leu Cys Gly Lys Tyr Asp Asn Trp Leu Lys Ser Asn Pro Gly Gln Leu565 570 575(ⅰ)序列特征(A)长度3117碱基对(B)类型核酸(C)键型单链(D)拓扑线型(ⅱ)分子类型DNA(基因组)(ⅵ)最初来源(A)生物体丝核菌属漆酶(ⅸ)特征(A)名称/键CDS(B)位置连接393..524,577..687,737..799,860..985,1043..1045,1097..1219,1269..1538,1601..1996,2047..2118,2174..2284,2338..2439,2495..2635,2693..2725,2786..2899)(ⅸ)特征(A)名称/键内含子(B)位置525..576(ⅸ)特征(A)名称/键内含子(B)位置688..736(ⅸ)特征(A)名称/键内含子(B)位置800..859(ⅸ)特征(A)名称/键内含子(B)位置986..1042(ⅸ)特征(A)名称/键内含子(B)位置1220..1268(ⅸ)特征(A)名称/键内含子(B)位置1539..1600(ⅸ)特征(A)名称/键内含子(B)位置1823..1936(ⅸ)特征(A)名称/键内含子(B)位置1973..2046(ⅸ)特征(A)名称/键内含子(B)位置2119..2173(ⅸ)特征(A)名称/键内含子(B)位置2285..2337(ⅸ)特征(A)名称/键内含子(B)位置2440..2494(ⅸ)特征(A)名称/键内含子(B)位置2636..2692(ⅸ)特征
(A)名称/键内含子(B)位置1046..1096(ⅹⅰ)序列描述SEQ ID NO:3:GAGTGATCCG CCAGAGTTCA GGCGGATAAG TTCCTAAATA GTCATTCGCC TATTCGTGTA60CCTCAGCATA CTGACGACAT ACCGCCAGAT CGCCCTCGGT TCGGGCGTGG CATACGTTCG 120CAAGGGCACC TCACGGAGCA AACTCTAAAA AGCTTCGGCA TGGATTGCAT TTTGTATTGT 180AAACAAGTTA CGAGAAAAAC AATAGATCAG TTTTTGCCGA ATCGGATGGC TTGAAACGGA 240AGTACCGATG GCCGATCCGA GTCGAATGAA TTAACGCATC TGAAACGGGA CCCTGAGTCG 300AGGCACCCGC CGGCCTTGGC CGTATAAGTC ACTTGTCGCC AACTAGCACT TTTTCATTCC 360CCCTTTTCTT CTTCCTCGTC TTCTTCTTCT CT ATG GCT CGG TCG ACT ACT TCA 413Met Ala Arg Ser Thr Thr Ser1 5CTC TTT GCA CTG TCT CTC GTT GCT TCA GCG TTT GCT CGA GTC GTT GAC 461Leu Phe Ala Leu Ser Leu Val Ala Ser Ala Phe Ala Arg Val Val Asp10 15 20TAT GGG TTT GAT GTG GCT AAT GGG GCA GTT GCT CCG GAT GGT GTA ACA 509Tyr Gly Phe Asp Val Ala Asn Gly Ala Val Ala Pro Asp Gly Val Thr25 30 35AGG AAC GCG GTT CTC GTGAGTTAGC TGTAAGATGG TGTATATGCT GGTTGCCTAA 564Arg Asn Ala Val Leu40CGGGAATGTC AG GTC AAT GGT CGC TTC CCT GGT CCA TTG ATC ACC GCC 612Val Asn Gly Arg Phe Pro Gly Pro Leu Ile Thr Ala45 50 55AAC AAG GGG GAT ACA CTT AAA ATC ACC GTG CGG AAT AAA CTC TCC GAT 660Asn Lys Gly Asp Thr Leu Lys Ile Thr Val Arg Asn Lys Leu Ser Asp60 65 70CCA ACT ATG CGA AGG AGC ACG ACC ATC GTTAGTACTT CCCCTCATCT 707Pro Thr Met Arg Arg Ser Thr Thr Ile75 80GTCTTGAAAC TTTCTCATCT TTTTTGAAG CAC TGG CAC GGT CTG CTC CAA CAC 760His Trp His Gly Leu Leu Gln His85AGG ACG GCA GAA GAA GAT GGC CCG GCC TTT GTA ACC CAG GTATGCCTTA 809Arg Thr Ala Glu Glu Asp Gly Pro Ala Phe Val Thr Gln90 95 100TCCTATCGCT GCTCTGTCCC CGCGTCCTTC CCTGACTCGG GCGATTCTAG TGC CCG 865Cys ProATT CCT CCG CAA GAA TCG TAC ACC TAT ACG ATG CCG CTC GGC GAA CAG913Ile Pro Pro Gln Glu Ser Tyr Thr Tyr Thr Met Pro Leu Gly Glu Gln105 110 115 120ACC GGC ACG TAT TGG TAC CAC AGC CAC TTG AGC TCC CAG TAT GTG GAC961Thr Gly Thr Tyr Trp Tyr His Ser His Leu Ser Ser Gln Tyr Val Asp125 130 135GGG TTG CGT GGG CCC ATC GTT ATT GTAAGTCTTC ATTTAACCTT ATTCTTGGTT 1015Gly Leu Arg Gly Pro Ile Val Ile140ATGGCTGATT GTGACGTCGT GGTTAGT ATG TTCGTGGCTT CCACAAGAAG 1065Met145TCAGCAGCCC TTGAAGCTAA CTTTATTCCA G GAC CCC CAC GAC CCG TAC AGA1117Asp Pro His Asp Pro Tyr Arg150AAC TAC TAT GAT GTC GAC GAC GAG CGT ACG GTC TTT ACT TTA GCA GAC 1165Asn Tyr Tyr Asp Val Asp Asp Glu Arg Thr Val Phe Thr Leu Ala Asp155 160 165TGG TAC CAC ACG CCG TCG GAG GCT ATC ATT GCC ACC CAC GAT GTC TTG 1213Trp Tyr His Thr Pro Ser Glu Ala Ile Ile Ala Thr His Asp Val Leu170 175 180AAA ACG GTACGCGTTA ATCCTTCTAG CTTTCTTTCC TTGGGTCACT TTCTATCAG 1268Lys Thr185ATC CCC GAC TCG GGT ACG ATC AAC GGC AAA GGC AAA TAC GAT CCT GCT 1316Ile Pro Asp Ser Gly Thr Ile Asn Gly Lys Gly Lys Tyr Asp Pro Ala190 195 200TCG GCT AAC ACC AAC AAC ACG ACA CTC GAG AAC CTC TAC ACT CTC AAA 1364Ser Ala Asn Thr Asn Asn Thr Thr Leu Glu Asn Leu Tyr Thr Leu Lys205 210 215GTC AAA CGC GGC AAG CGG TAT CGC CTG AGG ATT ATC AAC GCC TCG GCC 1412Val Lys Arg Gly Lys Arg Tyr Arg Leu Arg Ile Ile Asn Ala Ser Ala220 225 230ATC GCT TCG TTC CGG TTC GGC GTG CAG GGC CAC AAG TGC ACG ATC ATC 1460Ile Ala Ser Phe Arg Phe Gly Val Gln Gly His Lys Cys Thr Ile Ile235 240 245 250GAG GCT GAT GGC GTC CTC ACC AAA CCG ATC GAG GTC GAT GCG TTT GAT 1508Glu Ala Asp Gly Val Leu Thr Lys Pro Ile Glu Val Asp Ala Phe Asp255 260 265ATT CTA GCA GGC CAG AGG TAT AGC TGC ATC GTAAGTCTAC CTATGCCTTG 1558Ile Leu Ala Gly Gln Arg Tyr Ser Cys Ile270 275TTGTGGAGAT AAGAACCTGA CTGAATGTAT GCGCTCCAAT AG TTG AAG GCC GAC1612Leu Lys Ala Asp280CAA GAT CCT GAT TCC TAC TGG ATA AAT GCG CCA ATC ACA AAC GTT CTC 1660Gln Asp Pro Asp Ser Tyr Trp Ile Asn Ala Pro Ile Thr Asn Val Leu285 290 295AAC ACC AAC GTC CAG GCA TTG CTA GTG TAT GAA GAT GAC AAG CGT CCT 1708Asn Thr Asn Val Gln Ala Leu Leu Val Tyr Glu Asp Asp Lys Arg Pro300 305 310ACT CAC TAC CCC TGG AAG CCG TTT TTG ACA TGG AAG ATA TCA AAT GAA 1756Thr His Tyr Pro Trp Lys Pro Phe Leu Thr Trp Lys Ile Ser Asn Glu315 320 325ATC ATT CAG TAC TGG CAG CAC AAG CAC GGG TCG CAC GGT CAC AAG GGA 1804Ile Ile Gln Tyr Trp Gln His Lys His Gly Ser His Gly His Lys Gly330 335 340AAG GGG CAT CAT CAT AAA GTC CGG GCC ATT GGA GGT GTA TCC GGG TTG 1852Lys Gly His His His Lys Val ArG Ala Ile Gly Gly Val Ser Gly Leu345 350 355 360AGC TCC AGG GTT AAG AGC CGG GCG AGT GAC CTA TCG AAG AAG GCT GTC 1900Ser Ser Arg Val Lys Ser Arg Ala Ser Asp Leu Ser Lys Lys Ala Val365 370 375GAG TTG GCT GCT GCA CTC GTT GCG GGT GAG GCC GAG TTG GAC AAG AGG 1948Glu Leu Ala Ala Ala Leu Val Ala Gly Glu Ala Glu Leu Asp Lys ArG380 385 390CAG AAT GAG GAT AAT TCG ACT ATT GTA TTG GAT GAG ACC AAG CTT ATT 1996Gln Asn Glu Asp Asn Ser Thr Ile Val Leu Asp Glu Thr Lys Leu Ile395 400 405GTAAGTCCCT TAATTTTTTT CGGTGTCACG GAAGCTAACC CGCGTAATAG CCG TTG 2052Pro Leu410GTT CAA CCT GGT GCA CCG GGC GGC TCC AGA CCA GCT GAC GTC GTG GTC 2100Val Gln Pro Gly Ala Pro Gly Gly Ser Arg Pro Ala Asp Val Val Val415420 425CCT CTG GAC TTT GGC CTC GTATGTGGCT TCTTGTTATTCGTCCGGAAT 2148Pro Leu Asp Phe Gly Leu430GCAAACTGAT TTGGGTGGGC TATAG AAC TTT GCC AAC GGA CTG TGG ACG ATA 2200Asn Phe Ala Asn Gly Leu Trp Thr Ile435 440AAC AAT GTC TCC TAC TCC CCT CCG GAT GTC CCT ACT CTC CTC AAG ATC 2248Asn Asn Val Ser Tyr Ser Pro Pro Asp Val Pro Thr Leu Leu Lys Ile445 450 455TTG ACC GAC AAA GAC AAA GTC GAC GCT TCT GAC TTC GTAGGTTCCT 2294Leu Thr Asp Lys Asp Lys Val Asp Ala Ser Asp Phe460 465CTTCTTCTTT TCAAACTAGC TACTGACATT AAGTGAACGT CAG ACG GCC GAT GAA 2349Thr Ala Asp Glu470CAC ACG TAT ATT CTT CCA AAG AAC CAA GTT GTC GAG TTG CAC ATC AAG 2397His Thr Tyr Ile Leu Pro Lys Asn Gln Val Val Glu Leu His Ile Lys475 480 485GGA CAG GCT TTG GGA ATC GTA CAC CCC CTT CAT CTG CAT GGC 2439Gly Gln Ala Leu Gly Ile Val His Pro Leu His Leu His Gly490 495 500GTACGTCTTT CTCACACTGT TCCAGCTCCT ATTCTCTAAC ACACTCCTGC GATAG CAT 2497HisVal Ala Pro Asp Gly Val Thr Arg Asn Ala Val Leu Val Asn Gly Arg35 40 45Phe Pro Gly Pro Leu Ile Thr Ala Asn Lys Gly Asp Thr Leu Lys Ile50 55 60Thr Val Arg Asn Lys Leu Ser Asp Pro Thr Met Arg Arg Ser Thr Thr65 70 75 80Ile His Trp His Gly Leu Leu Gln His Arg Thr Ala Glu Glu Asp Gly85 90 95Pro Ala Phe Val Thr Gln Cys Pro Ile Pro Pro Gln Glu Ser Tyr Thr100 105 110Tyr Thr Met Pro Leu Gly Glu Gln Thr Gly Thr Tyr Trp Tyr His Ser115 120 125His Leu Ser Ser Gln Tyr Val Asp Gly Leu Arg Gly Pro Ile Val Ile130 135 140Met Asp Pro His Asp Pro Tyr Arg Asn Tyr Tyr Asp Val Asp Asp Glu145 150 155 160Arg Thr Val Phe Thr Leu Ala Asp Trp Tyr His Thr Pro Ser Glu Ala165 170 175Ile Ile Ala Thr His Asp Val Leu Lys Thr Ile Pro Asp Ser Gly Thr180 185 190Ile Asn Gly Lys Gly Lys Tyr Asp Pro Ala Ser Ala Asn Thr Asn Asn195 200 205Thr Thr Leu Glu Asn Leu Tyr Thr Leu Lys Val Lys Arg Gly Lys Arg210 215 220Tyr Arg Leu Arg Ile Ile Asn Ala Ser Ala Ile Ala Ser Phe Arg Phe225 230 235 240Gly Val Gln Gly His Lys Cys Thr Ile Ile Glu Ala Asp Gly Val Leu245 250 255Thr Lys Pro Ile Glu Val Asp Ala Phe Asp Ile Leu Ala Gly Gln Arg260 265 270Tyr Ser Cys Ile Leu Lys Ala Asp Gln Asp Pro Asp Ser Tyr Trp Ile275 280 285Asn Ala Pro Ile Thr Asn Val Leu Asn Thr Asn Val Gln Ala Leu Leu290 295 300Val Tyr Glu Asp Asp Lys Arg Pro Thr His Tyr Pro Trp Lys Pro Phe305 310 315 320Leu Thr Trp Lys Ile Ser Asn Glu Ile Ile Gln Tyr Trp Gln His Lys325 330 335His Gly Ser His Gly His Lys Gly Lys Gly His His His Lys Val Arg340 345 350Ala Ile Gly Gly Val Ser Gly Leu Ser Ser Arg Val Lys Ser Arg Ala355 360 365GCG TTC GAC GTC GTC CAA TTC GGC GAC AAC GCT CCA AAC TAC GTG AAC 2545Ala Phe Asp Val Val Gln Phe Gly Asp Asn Ala Pro Asn Tyr Val Asn505 510 515 520CCT CCG CGT AGG GAT GTA GTA GGC GTA ACT GAT GCT GGA GTC CGT ATC 2593Pro Pro Arg Arg Asp Val Val Gly Val Thr Asp Ala Gly Val Arg Ile525 530 535CAG TTC AGA ACC GAT AAC CCG GGC CCT TGG TTC CTC CAT TGC 2635Gln Phe Arg Thr Asp Asn Pro Gly Pro Trp Phe Leu His Cys540 545 550GTATGCTCTT CATCTCCCAC CGCTTGTTCT TTACTTATGG TTTACCTTGC GATTTAG 2692CAC ATT GAT TGG CAC TTG GAA GAA GGA TTT GCT GTAAGTTATT ATTCCTATTC 2745His Ile Asp Trp His Leu Glu Glu Gly Phe Ala555 560CGAAGCATCG GGGAGATGCT AACCAAGGGT GTGTTTTAAG ATG GTA TTC GCC GAA 2800Met Val Phe Ala Glu565GCG CCT GAA GAT ATC AAG AAA GGC TCT CAG AGT GTC AAG CCT GAC GGA 2848Ala Pro Glu Asp Ile Lys Lys Gly Ser Gln Ser Val Lys Pro Asp Gly570 575 580CAA TGG AAG AAA CTA TGC GAG AAG TAT GAG AAG TTG CCT GAA GCA CTG 2896Gln Trp Lys Lys Leu Cys Glu Lys Tyr Glu Lys Leu Pro Glu Ala Leu585 590 595CAG TGAAGTTGCA GTTGTTTCCC ATTCGGGAAC TGGCTCACTA TTCCTTTTGC 2949GlnATAATTCGGA CTTTTATTTT GGGACATTAT TGGACTATGG ACTTGTTTGT CACACCCTCG 3009CTCACTGTGT CCCTCGTTGA GTACCTATAC TCTATTCGTA TAGTGGGAAT ATGGAATATC 3069GGATGTAATA AATGCTCGTG CGTTTGGTGC TCGAAATGGG GTAGGACT3117(2)SEQ ID NO:4资料(ⅰ)序列特征(A)长度599氨基酸(B)类型氨基酸(D)拓扑线型(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:4Met Ala Arg Ser Thr Thr Ser Leu Phe Ala Leu Ser Leu Val Ala Ser1 5 10 15Ala Phe Ala Arg Val Val Asp Tyr Gly Phe Asp Val Ala Asn Gly Ala20 25 30Ser Asp Leu Ser Lys Lys Ala Val Glu Leu Ala Ala Ala Leu Val Ala370 375 380Gly Glu Ala Glu Leu Asp Lys Arg Gln Asn Glu Asp Asn Ser Thr Ile385 390 395 400Val Leu Asp Glu Thr Lys Leu Ile Pro Leu Val Gln Pro Gly Ala Pro405 410 415Gly Gly Ser Arg Pro Ala Asp Val Val Val Pro Leu Asp Phe Gly Leu420 425 430Asn Phe Ala Asn Gly Leu Trp Thr Ile Asn Asn Val Ser Tyr Ser Pro435 440 445Pro Asp Val Pro Thr Leu Leu Lys Ile Leu Thr Asp Lys Asp Lys Val450 455 460Asp Ala Ser Asp Phe Thr Ala Asp Glu His Thr Tyr Ile Leu Pro Lys465 470 475 480Asn Gln Val Val Glu Leu His Ile Lys Gly Gln Ala Leu Gly Ile Val485 490 495His Pro Leu His Leu His Gly His Ala Phe Asp Val Val Gln Phe Gly500 505 510Asp Asn Ala Pro Asn Tyr Val Asn Pro Pro Arg Arg Asp Val Val Gly515 520 525Val Thr Asp Ala Gly Val Arg Ile Gln Phe Arg Thr Asp Asn Pro Gly530 535 540Pro Trp Phe Leu His Cys His Ile Asp Trp His Leu Glu Glu Gly Phe545 550 555 560Ala Met Val Phe Ala Glu Ala Pro Glu Asp Ile Lys Lys Gly Ser Gln565 570 575Ser Val Lys Pro Asp Gly Gln Trp Lys Lys Leu Cys Glu Lys Tyr Glu580 585 590Lys Leu Pro Glu Ala Leu Gln595(ⅹⅰ)序列描述SEQ ID NO:5Ala Val Arg Asn Tyr Lys Phe Asp Ile Lys Asn Val Asn Val Ala Pro1 5 10 15Asp Gly Phe Gln Arg Pro Ile Val Ser Val20 25(2)SEQ ID NO:6资料(ⅰ)序列特征
(A)长度20个氨基酸(B)类型氨基酸(C)键型单链(D)拓扑线型(ⅱ)分子类型多肽(ⅹⅰ)序列描述SEQ ID NO:6Ser Gln Tyr Val Asp Gly Leu Arg Gly Pro Leu Val Ile Tyr Asp Pro1 5 10 15Asp Asp Asp His20(2)SEQ ID NO:7资料(ⅰ)序列特征(A)长度26个氨基酸(B)类型氨基酸(C)键型单链(D)拓扑线型(ⅱ)分子类型多肽(ⅹⅰ)序列描述SEQ ID NO:7Ser Arg Tyr Asx Val Asx Asx Ala Ser Thr Val Val Met Leu Glu Asx1 5 10 15Trp Tyr Arg Thr Pro Ala Xaa Val Leu Glu20 25(2)SEQ ID NO:8资料(ⅰ)序列特征(A)长度25个氨基酸(B)类型氨基酸
(C)键型单链(D)拓扑线型(ⅱ)分子类型多肽(ⅹⅰ)序列描述SEQ ID NO:8Ser Leu Gly Pro Thr Pro Asn Tyr Val Asn Pro Xaa Ile Arg Asp Val1 5 10 15Val Arg Val Gly Gly Thr Thr Val Val20 25(2)SEQ ID NO:9资料(ⅰ)序列特征(A)长度25个氨基酸(B)类型氨基酸(C)键型单链(D)拓扑线型(ⅱ)分子类型多肽(ⅹⅰ)序列描述SEQ ID NO:9Gly Leu Ala Leu Val Phe Ala Glu Ala Pro Ser Gln Ile Arg Gln Gly1 5 10 15Val Gln Ser Val Gln Pro Asp Asp Ala20 25(2)SEQ ID NO:10资料(ⅰ)序列特征(A)长度14个氨基酸(B)类型氨基酸(C)键型单链(D)拓扑线型
(ⅱ)分子类型多肽(ⅹⅰ)序列描述SEQ ID NO:10Ile Arg Tyr Val Gly GlyPro Ala Val Xaa Arg Ser Val Ile1 5 10(2)SEQ ID NO:11资料(ⅰ)序列特征(A)长度6个氨基酸(B)类型氨基酸(C)键型单链(D)拓扑线型(ⅱ)分子类型多肽(ⅹⅰ)序列描述SEQ ID NO:1lIle Leu Ala Asn Pro Ala1 5(2)SEQ ID NO:12资料(ⅰ)序列特征(A)长度8个氨基酸(B)类型氨基酸(C)键型单链(D)拓扑线型(ⅱ)分子类型多肽(ⅹⅰ)序列描述SEQ ID NO:12Tyr Glu Ala Pro Ser Leu Pro Thr1 5(2)SEQ ID NO:13资料(ⅰ)序列特征
(A)长度19 12碱基对(B)类型核酸(C)键型单链(D)拓扑线型(ⅱ)分子类型CDNA(ⅵ)最初来源(A)生物体丝核菌属漆酶(ⅸ)特征(A)名称/键CDS(B)位置85:1671(ⅹⅰ)序列描述SEQ ID NO:13CTAACGCTTG GTGCCGAGCT CGGATCCACT AGTAACGCGC GCCAGTGTGC TGGAATTCGC 60GGCCGCGTCG ACACCTCCTT CAAG ATG CTT TCT AGC ATT ACC CTC CTA CCT 111Met Leu Ser Ser Ile Thr Leu Leu Pro1 5TTG CTC GCT GCG GTC TCA ACC CCC GCC TTT GCT GCC GTC CGC AAC TAT 159Leu Leu Ala Ala Val Ser Thr Pro Ala Phe Ala Ala Val Arg Asn Tyr10 15 20 25AAG TTC GAC ATC AAG AAC GTC AAT GTC GCT CCC GAT GGC TTT CAG CGC 207Lys Phe Asp Ile Lys Asn Val Asn Val Ala Pro Asp Gly Phe Gln Arg30 35 40TCT ATC GTC TCC GTC AAC GGT TTA GTT CCT GGC ACG TTG ATC ACG GCC 255Ser Ile Val Ser Val Asn Gly Leu Val Pro Gly Thr Leu Ile Thr Ala45 50 55AAC AAG GGT GAC ACC TTG CGC ATT AAT GTC ACG AAT CAA CTC ACG GAC 303Asn Lys Gly Asp Thr Leu Arg Ile Asn Val Thr Asn Gln Leu Thr Asp60 65 70CCT AGT ATG CGT CGT GCC ACA ACG ATT CAT TGG CAT GGA TTG TTC CAA 351Pro Ser Met Arg Arg Ala Thr Thr Ile His Trp His Gly Leu Phe Gln75 80 85GCT ACT ACC GCC GAC GAG GAT GGC CCC GCA TTC GTC ACG CAA TGC CCT 399Ala Thr Thr Ala Asp Glu Asp Gly Pro Ala Phe Val Thr Gln Cys Pro90 95 100 105ATT GCG CAA AAT TTG TCC TAT ACA TAC GAG ATC CCA TTG CGC GGC CAA 447Ile Ala Gln Asn Leu Ser Tyr Thr Tyr Glu Ile Pro Leu Arg Gly Gln110 115 120ACA GGA ACC ATG TGG TAT CAC GCC CAT CTT GCG AGT CAA TAT GTC GAT 495Thr Gly Thr Met Trp Tyr His Ala His Leu Ala Ser Gln Tyr Val Asp125 130 135GGA TTG CGA GGC CCT TTG GTC ATC TAT GAT CCA AAC GAC CCA CAC AAG 543Gly Leu Arg Gly Pro Leu Val Ile Tyr Asp Pro Asn Asp Pro His Lys140 145 150TCG CGC TAC GAC GTG GAT GAT GCG AGC ACA GTA GTC ATG CTT GAG GAC 591Ser Arg Tyr Asp Val Asp Asp Ala Ser Thr Val Val Met Leu Glu Asp155 160 165TGG TAC CAT ACT CCG GCA CCC GTT CTA GAA AAG CAA ATG TTC TCG ACT 639Trp Tyr His Thr Pro Ala Pro Val Leu Glu Lys Gln Met Phe Ser Thr170 175 180 185AAT AAC ACC GCT CTG CTC TCT CCT GTT CCG GAC TCG GGT CTT ATC AAT 687Asn Asn Thr Ala Leu Leu Ser Pro Val Pro Asp Ser Gly Leu Ile Asn190 195 200GGC AAA GGG CGC TAT GTG GGC GGT CCC GCA GTT CCC CGG TCA GTA ATC 735Gly Lys Gly Arg Tyr Val Gly Gly Pro Ala Val Pro Arg Ser Val Ile205 210 215AAC GTA AAA CGT GGG AAA CGA TAT CGC TTG CGC GTA ATC AAC GCT TCT 783Asn Val Lys Arg Gly Lys Arg Tyr Arg Leu Arg Val Ile Asn Ala Ser220 225 230GCT ATC GGG TCG TTT ACC TTT TCG ATC GAA GGA CAT AGT CTG ACT GTC 831Ala Ile Gly Ser Phe Thr Phe Ser Ile Glu Gly His Ser Leu Thr Val235 240 245ATT GAG GCC GAT GGG ATC CTG CAC CAG CCC TTG GCT GTT GAC AGC TTC 879Ile Glu Ala Asp Gly Ile Leu His Gln Pro Leu Ala Val Asp Ser Phe250 255 260 265CAG ATT TAC GCT GGA CAA CGC TAC TCT GTC ATC GTT GAA GCC AAC CAA 927Gln Ile Tyr Ala Gly Gln Arg Tyr Ser Val Ile Val Glu Ala Asn Gln270 275 280ACC GCC GCC AAC TAC TGG ATT CGT GCA CCA ATG ACC GTT GCA GGA GCC 975Thr Ala Ala Asn Tyr Trp Ile Arg Ala Pro Met Thr Val Ala Gly Ala285 290 295GGA ACC AAT GCA AAC TTG GAC CCC ACC AAT GTC TTT GCC GTA TTG CAC 1023Gly Thr Asn Ala Asn Leu Asp Pro Thr Asn Val Phe Ala Val Leu His300 305 310TAC GAG GGA GCG CCC AAC GCC GAA CCC ACG ACG GAA CAA GGC AGT GCT 1071Tyr Glu Gly Ala Pro Asn Ala Glu Pro Thr Thr Glu Gln Gly Ser Ala315 320 325ATC GGT ACT GCA CTC GTT GAA GAG AAC CTC CAT GCG CTC ATC AAC CCT 1119Ile Gly Thr Ala Leu Val Glu Glu Asn Leu His Ala Leu Ile Asn Pro330 335 340 345GGC GCT CCG GGC GGC TCC GCT CCC GCA GAC GTT T CC CTC AAT CTT GCA 1167Gly Ala Pro Gly Gly Ser Ala Pro Ala Asp Val Ser Leu Asn Leu Ala350 355 360ATT GGG CGC AGC ACA GTT GAT GGG ATT CTT AGG TTC ACA TTT AAT AAC 1215Ile Gly Arg Ser Thr Val Asp Gly Ile Leu Arg Phe Thr Phe Asn Asn365 370 375ATC AAG TAC GAG GCT CCT TCG TTG CCC ACG CTC TTG AAG ATT TTG GCA 1263Ile Lys Tyr Glu Ala Pro Ser Leu Pro Thr Leu Leu Lys Ile Leu Ala380 385 390AAC AAT GCG AGC AAT GAC GCC GAT TTC ACG CCA AAT GAG CAC ACT ATC 1311Asn Asn Ala Ser Asn Asp Ala Asp Phe Thr Pro Asn Glu His Thr Ile395 400 405GTA TTG CCA CAC AAT AAA GTT ATC GAG CTC AAT ATC ACC GGA GGT GCA 1359Val Leu Pro His Asn Lys Val Ile Glu Leu Asn Ile Thr Gly Gly Ala410 415 420 425GAC CAC CCT ATC CAT CTC CAC GGC CAT GTG TTT GAT ATC GTC AAA TCA 1407Asp His Pro Ile His Leu His Gly His Val Phe Asp Ile Val Lys Ser430 435 440CTC GGT GGT ACC CCG AAC TAT GTC AAC CCG CCA CGC AGG GAC GTA GTT 1455Leu Gly Gly Thr Pro Asn Tyr Val Asn Pro Pro Arg Arg Asp Val Val445 450 455CGT GTC GGA GGC ACC GGT GTG GTA CTC CGA TTC AAG ACC GAT AAC CCA 1503Arg Val Gly Gly Thr Gly Val Val Leu Arg Phe Lys Thr Asp Asn Pro460 465 470GGC CCA TGG TTT GTT CAC TGC CAC ATT GAC TGG CAC TTG GAG GCT GGG 1551Gly Pro Trp Phe Val His Cys His Ile Asp Trp His Leu Glu Ala Gly475 480 485CTC GCA CTT GTC TTT GCC GAG GCC CCC AGC CAG ATT CGC CAG GGT GTC 1599Leu Ala Leu Val Phe Ala Glu Ala Pro Ser Gln Ile Arg Gln Gly Val490 495 500 505CAG TCG GTC CAG CCC AAC AAT GCC TGG AAC CAG CTC TGC CCC AAG TAC 1647Gln Ser Val Gln Pro Asn Asn Ala Trp Asn Gln Leu Cys Pro Lys Tyr510 515 520GCG GCT CTT CCT CCC GAT TTG CAG T 1672Ala Ala Leu Pro Pro Asp Leu Gln525(2)SEQ ID NO:14资料(ⅰ)序列特征(A)长度529个氨基酸(B)类型氨基酸(D)拓扑线型(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:14Met Leu Ser Ser Ile Thr Leu Leu Pro Leu Leu Ala Ala Val Ser Thr1 5 10 15Pro Ala Phe Ala Ala Val Arg Asn Tyr Lys Phe Asp Ile Lys Asn Val20 25 30Asn Val Ala Pro Asp Gly Phe Gln Arg Ser Ile Val Ser Val Asn Gly35 40 45Leu Val Pro Gly Thr Leu Ile Thr Ala Asn Lys Gly Asp Thr Leu Arg50 55 60Ile Asn Val Thr Asn Gln Leu Thr Asp Pro Ser Met Arg Arg Ala Thr65 70 75 80Thr Ile His Trp His Gly Leu Phe Gln Ala Thr Thr Ala Asp Glu Asp85 90 95Gly Pro Ala Phe Val Thr Gln Cys Pro Ile Ala Gln Asn Leu Ser Tyr100 105 110Thr Tyr Glu Ile Pro Leu Arg Gly Gln Thr Gly Thr Met Trp Tyr His115 120 125Ala His Leu Ala Ser Gln Tyr Val Asp Gly Leu Arg Gly Pro Leu Val130 135 140Ile Tyr Asp Pro Asn Asp Pro His Lys Ser Arg Tyr Asp Val Asp Asp145 150 155 160Ala Ser Thr Val Val Met Leu Glu Asp Trp Tyr His Thr Pro Ala Pro165 170 175Val Leu Glu Lys Gln Met Phe Ser Thr Asn Asn Thr Ala Leu Leu Ser180 185 190Pro Val Pro Asp Ser Gly Leu Ile Asn Gly Lys Gly Arg Tyr Val Gly195 200 205Gly Pro Ala Val Pro Arg Ser Val Ile Asn Val Lys Arg Gly Lys Arg210 215 220Tyr Arg Leu Arg Val Ile Asn Ala Ser Ala Ile Gly Ser Phe Thr Phe225 230 235 240Ser Ile Glu Gly His Ser Leu Thr Val Ile Glu Ala Asp Gly Ile Leu245 250 255His Gln Pro Leu Ala Val Asp Ser Phe Gln Ile Tyr Ala Gly Gln Arg260 265 270Tyr Ser Val Ile Val Glu Ala Asn Gln Thr Ala Ala Asn Tyr Trp Ile275 280 285Arg Ala Pro Met Thr Val Ala Gly Ala Gly Thr Asn Ala Asn Leu Asp290 295 300Pro Thr Asn Val Phe Ala Val Leu His Tyr Glu Gly Ala Pro Asn Ala305 310 315 320Glu Pro Thr Thr Glu Gln Gly Ser Ala Ile Gly Thr Ala Leu Val Glu325 330 335Glu Asn Leu His Ala Leu Ile Asn Pro Gly Ala Pro Gly Gly Ser Ala340 345 350Pro Ala Asp Val Ser Leu Asn Leu Ala Ile Gly Arg Ser Thr Val Asp355 360 365Gly Ile Leu Arg Phe Thr Phe Asn Asn Ile Lys Tyr Glu Ala Pro Ser370 375 380Leu Pro Thr Leu Leu Lys Ile Leu Ala Asn Asn Ala Ser Asn Asp Ala385 390 395 400Asp Phe Thr Pro Asn Glu His Thr Ile Val Leu Pro His Asn Lys Val405 410 415Ile Glu Leu Asn Ile Thr Gly Gly Ala Asp His Pro Ile His Leu His420 425 430Gly His Val Phe Asp Ile Val Lys Ser Leu Gly Gly Thr Pro Asn Tyr435 440 445Val Asn Pro Pro Arg Arg Asp Val Val Arg Val Gly Gly Thr Gly Val450 455 460Val Leu Arg Phe Lys Thr Asp Asn Pro Gly Pro Trp Phe Val His Cys465 470 475 480His Ile Asp Trp His Leu Glu Ala Gly Leu Ala Leu Val Phe Ala Glu485 490 495Ala Pro Ser Gln Ile Arg Gln Gly Val Gln Ser Val Gln Pro Asn Asn500 505 510Ala Trp Asn Gln Leu Cys Pro Lys Tyr Ala Ala Leu Pro Pro Asp Leu515 520 525Gln
权利要求
1.一种在溶液中聚合木质素或硫酸木质素底物的方法,包含将该底物与在pH为大约6.0-8.5之间发挥最佳功能的丝核菌属漆酶接触。
2.一种在牛皮纸浆中进行原位解聚的方法,包含将该纸浆与在pH为大约6.0-8.5之间发挥最佳功能的丝核菌属漆酶接触。
3.一种氧化染料的方法,包含将该染料与在pH为大约6.0-8.5之间发挥最佳功能的丝核菌属漆酶接触。
4.一种聚合酚类化合物的方法,包含将该酚类化合物与在pH为大约6.0-8.5之间发挥最佳功能的丝核菌属漆酶接触。
全文摘要
本发明涉及分离的、含有编码在中性或碱性pH下具有最适活性的茄丝核菌漆酶之序列的核酸片段及由其编码的漆酶蛋白质。
文档编号C07H21/04GK1324882SQ0111711
公开日2001年12月5日 申请日期2001年4月26日 优先权日1993年9月17日
发明者J·A·瓦雷斯尼尔, B·E·克里斯蒂森, P·施奈德 申请人:诺沃挪第克公司, 诺沃挪第克生物技术公司