新颖的脂肪酶及其用途的制作方法

文档序号:550284阅读:996来源:国知局
专利名称:新颖的脂肪酶及其用途的制作方法
技术领域
本发明涉及新鉴定出来的多核苷酸序列,所述序列包含编码来自Aspergillus niger的新颖的脂肪分解酶(lipolytic enzyme)的基因。本发明公开了所述新颖基因的全长核苷酸序列,包含所述的新颖的脂肪分解酶的全长编码序列的cDNA序列以及所述的全长脂肪分解酶及其功能等同物的氨基酸序列。本发明还涉及在工业过程中使用上述酶的方法和诊断真菌感染的方法。本发明中还包括了用本发明的多核苷酸转化过的细胞以及这样的细胞其中,本发明的脂肪分解酶被遗传修饰,以增加该酶的活性和/或表达水平。
背景技术
烘焙产品例如面包是从面团来制备的,面团通常由基本材料制成(小麦)面粉、水以及可选地,盐。其它添加成分取决于所烘焙的产品,其可以是糖、香料等等。对经过发酵的产品而言,主要使用面包酵母,其次是使用化学发酵系统,例如(产)酸(化合物)和碳酸氢盐的组合。
为改善所述面团的操作属性和/或所述烘焙产品的最终属性,人们持续努力以发展改善属性的加工助剂。此处将加工助剂定义为改善所述面团的操作属性和/或所述烘焙产品的最终属性的化合物。可能被改善的面团属性包含可加工性、气体保持能力、降低的粘性、弹性、延展性、成型性等等。可能被改善的所述烘焙产品的属性包含产品块的体积、外壳松脆性、碎屑质地以及柔软度、有关香味的腐败和保存期限。改善面团和/或烘焙产品的加工助剂可以分为两类化学添加剂和酶(也称为烘焙用酶)。
酵母、酶和化学添加剂通常是分别加入到面团中的。酵母可以作为液体悬浮剂、以压榨的形式、作为活性干酵母(active dry yeast,ADY)或速发干酵母(instant dry yeast,IDY)加入。上述酵母制剂的区别在于水和酵母干物质的含量。液体酵母具有的酵母干物质含量低于25%(w/v)。膏质酵母是液体酵母的特殊形式,其具有的干物质含量在17%和23%之间(w/v)。压榨酵母具有的酵母干物质含量在25%-35%之间(w/v),干酵母制剂具有的酵母干物质的含量在92%-98%之间(w/v)。
酶可以以干燥的例如颗粒状的形式或以液体形式被加入。大多数情况下,化学添加剂以粉末形式被加入。此外,适合于特殊烘焙应用的加工助剂组合物,可以由化学添加剂和酶的专门混合物来构成。
由上述材料和加工助剂来制备面团的方法在本领域是公知的,所述制备方法包括将所述材料和加工助剂混合,并包括一个或多个成型及发酵步骤。
用此类面团来制备烘焙产品的方法在本领域也是公知的,所述制备方法包括对面团进行成型、造型及进一步的发酵,以及随后在需要的温度和时间下进行烘焙。
改善属性的化学添加剂包括氧化剂、还原剂、用作面团调整剂的乳化剂或用作碎屑软化剂的乳化剂、脂肪类物质;所述氧化剂例如是抗坏血酸、溴酸盐和偶氮碳酸氢盐,所述还原剂例如是L-半胱氨酸和谷胱甘肽,所述用作面团调整剂的乳化剂例如是二乙酰酒石酸甘油单/二酯(diacetyltartatic esters of mono/diglycerides,DATEM)、硬脂酰乳酸钠(sodiumstearoyl lactylate,SSL)、硬脂酰乳酸钙(calcium stearoyl lactylate,CSL),所述用作碎屑软化剂的乳化剂例如是单硬脂酸甘油酯(glycerolmonostearate,GMS),所述脂肪类物质例如是甘油三酯(脂)或卵磷脂等等。
用更多的天然产品来代替化学添加剂是消费者的需求,为此人们已经发展出了多种能改善面团和/或烘焙产品属性的烘焙用酶,可以用所有可能的组合形式来使用所述的酶,这取决于特定的烘焙应用的条件。合适的酶包括降解淀粉的酶,降解阿拉伯糖基木聚糖和其它半纤维素的酶,降解纤维素的酶,氧化酶,分解脂肪类物质的酶,降解、修饰或交联蛋白质的酶。
降解淀粉的酶例如是内作用酶和外作用酶,所述内作用酶例如是alpha-淀粉酶、麦芽糖淀粉酶、支链淀粉酶或其它脱支酶,所述外作用酶用于去除葡萄糖(淀粉葡糖苷酶)、麦芽糖(beta-淀粉酶)、麦芽三糖、麦芽四糖和更高级的寡糖。
降解阿拉伯糖基木聚糖或其它半纤维素的酶例如是木聚糖酶、戊聚糖酶、半纤维素酶、阿拉伯呋喃糖苷酶、葡聚糖酶等等。
降解纤维素的酶例如是纤维素酶、纤维二糖水解酶和beta-葡糖苷酶。
氧化酶例如是葡糖氧化酶、己糖氧化酶、吡喃糖氧化酶、巯基氧化酶、脂肪氧化酶、漆酶、多酚氧化酶等等。
分解脂肪类物质的酶例如是脂肪分解酶,例如三酰甘油脂肪酶、磷脂酶(例如A1、A2、B、C和D)和半乳糖脂酶。
降解、修饰或交联蛋白质的酶例如是内作用蛋白酶(丝氨酸蛋白酶、金属蛋白酶、天冬氨酰蛋白酶、巯基蛋白酶)、从多肽链的N-末端(氨肽酶)或C-末端(羧肽酶)切掉一个氨基酸或二肽或三肽等的外作用蛋白酶、对天冬酰胺或谷氨酰胺脱酰胺的酶,例如脱酰胺酶和肽谷氨酰胺酶(peptidoglutaminase),或交联酶,例如谷氨酰胺转移酶。
烘焙用酶可以方便地从微生物中制得。微生物性的烘焙用酶可以从多种来源中获得;杆菌菌种是细菌性的酶的通常来源,而真菌性的酶则通常产生自曲霉菌种。
烘焙用酶可以被用于多种形式的烘焙制品。术语“烘焙制品”在此被定义为包含面包产品、卷、蛋糕、馅饼、松饼、酵母发酵的蛋糕及炸圈饼等,所述面包产品例如是烤模面包(tin bread)、面包块(loaves ofbread)、法式面包。
在上述过程中,使用通过重组DNA技术获得的烘焙用酶是有好处的。此类重组的酶较之其相应的传统纯化所得到的酶具有很多优点。重组酶生产起来成本低,产量高,其不含细菌或病毒等污染物,也不含细菌毒素,还不会对其它的酶活性产生负面影响。

发明内容
本发明的一个目的是提供新颖的多核苷酸,所述多核苷酸编码具有经过改善的属性的新颖的脂肪分解酶。本发明的进一步的目的是提供天然及重组生产的脂肪分解酶以及制造所述的酶的重组菌株。融合蛋白也是本发明的一部分,制造和使用本发明的多核苷酸及多肽的方法也属于本发明。
本发明还有一个目的是提供新颖的脂肪分解酶,所述的酶能解决上述问题中的至少一个,或者所述的酶具有广泛的底物特异性,或所述的酶在被用于面团和/或烘焙产品时具有一种或多种改善的属性,所述属性选自由以下成员构成的组增加的面团强度、增加的面团弹性、增加的面团稳定性、降低的面团粘性、经过改善的面团延展性、经过改善的面团可加工性、增加的烘焙产品体积、经过改善的烘焙产品碎屑结构、经过改善的烘焙产品柔软度、经过改善的烘焙产品香味、经过改善的烘焙产品保鲜性、经过改善的烘焙产品颜色、经过改善的烘焙产品外壳。
本发明提供了编码新颖的脂肪分解酶的新颖的多核苷酸。更具体地,本发明提供了具有核苷酸序列的多核苷酸,所述核苷酸序列优选在高严谨条件下,与选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的序列杂交。本发明相应地提供了与选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的序列同源性高于40%,例如约60%,优选65%,更优选为70%,进一步优选为75%、80%、85%、90%、95%、96%、97%、98%或99%的核酸。
在一种更优选的实施方式中,本发明提供了可从丝状真菌中获得的此种经过分离的多核苷酸,具体而言,Aspergillus niger是优选的。
在一种实施方式中,本发明提供了一种经过分离的多核苷酸,所述多核苷酸包含编码一种多肽或其功能等同物的核酸序列,所述多肽的氨基酸序列选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组。
在另外一种优选的实施方式中,本发明提供了一种经过分离的多核苷酸,所述多核苷酸编码一种多肽及其功能等同物的至少一个功能结构域,所述多肽选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组。
在一种优选的实施方式中,本发明提供了一种脂肪分解酶基因,所述基因选自由SEQ ID NO1、4、7、10、13、16、19、22、25、28、31、34和37所构成的组。在另一个方面,本发明提供了一种多核苷酸,优选是编码Aspergillus niger的脂肪分解酶或其变异体或片段的cDNA,所述脂肪分解酶的氨基酸序列选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组。在一种优选的实施方式中,所述cDNA具有选自由SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35和38或其功能等同物所构成的组的序列。
在一种更进一步优选的实施方式中,本发明提供了包含本发明多肽的编码序列的多核苷酸,优选的多核苷酸是选自SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35和38所构成的组的多核苷酸序列。
本发明还涉及包含本发明多核苷酸序列的载体,以及可被用于扩增或探测本发明的DNA的引物、探针和片段。
在进一步的优选实施方式中,提供了一种载体,其中,本发明的多核苷酸序列与调控序列被功能性地连接起来,所述调控序列适于所述被编码的氨基酸序列在合适的宿主细胞中表达,例如Aspergillus niger或Aspergillus oryzae。本发明还提供了用于制备本发明多核苷酸及载体的方法。
本发明还涉及重组产生的宿主细胞,所述细胞含有异源的或同源的本发明的多核苷酸。
在另一个实施方式中,本发明提供了重组宿主细胞,其中,本发明脂肪分解酶的表达显著提高,或其中所述脂肪分解酶的活性增加。
在另一个实施方式中,本发明提供了重组产生的宿主细胞,所述细胞含有异源的或同源的本发明的多核苷酸,并且,其中,所述的细胞能产生本发明的功能性脂肪分解酶;优选是能过量表达本发明的脂肪分解酶的细胞,例如包含拷贝数增加的本发明基因或cDNA的Aspergillus菌株。
在本发明的又一个方面,提供了一种经过纯化的多肽。本发明的该种多肽包括由本发明多核苷酸编码的多肽。特别优选的是选自由SEQ IDNO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的多肽或其功能等同物。
因此,本发明在一个方面提供了一种脂肪分解酶的组合物,所述组合物含有作为活性成分的选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的酶或其功能等同物。
在另一个方面,本发明提供了制造烘焙制品的方法,其中,将一种或多种酶或其功能等同物加入到用于制造烘焙制品的面团中,所述的酶选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组。
包含本发明多肽的融合蛋白也在本发明的范围内。本发明还提供了制造本发明多肽的方法。
本发明还涉及本发明的脂肪分解酶在此文描述的任何工业过程中的应用。
具体实施例方式
脂肪分解酶在此被定义为展示了下述脂肪分解活性中的至少一种优选为两种或三种或四种或更多种活性的酶,所述活性为三酰甘油脂肪酶、磷脂酶A1、磷脂酶A2、磷脂酶B、磷脂酶C、磷脂酶D、溶血磷脂酶和半乳糖脂酶。
多核苷酸本发明提供了编码脂肪分解酶的多核苷酸或其功能等同物,所述脂肪分解酶具有选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的氨基酸序列。通过对从Aspergillus niger中获得的基因组克隆进行测序,确定出了分别编码脂肪分解酶NBE028、NBE029、NBE030、NBE031、NBE032、NBE033、NBE034、NBE036、NBE038、NBE039、NBE043、NBE045和NBE042的七个基因的序列。本发明提供了多核苷酸序列,所述序列包含编码脂肪分解酶NBE028、NBE029、NBE030、NBE031、NBE032、NBE033、NBE034、NBE036、NBE038、NBE039、NBE043、NBE045和NBE042的基因,以及其cDNA全序列及编码序列(表1)。因此,本发明涉及经过分离的多核苷酸,所述多核苷酸包含选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的核苷酸序列或其功能等同物。
表1

更具体地,本发明涉及一种经过分离的多核苷酸,所述多核苷酸在严谨条件下,优选在高度严谨条件下,能够与选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的多核苷酸杂交。有利地,此类多核苷酸可以从丝状真菌中获得,特别是从Aspergillus niger获得。更明确地,本发明涉及一种经过分离的多核苷酸,所述多核苷酸具有选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的核苷酸序列。
本发明还涉及一种经过分离的多核苷酸或其功能等同物,所述多核苷酸编码一种多肽的至少一个功能结构域,所述多肽具有选自由SEQ IDNO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的氨基酸序列。
在本文中使用的术语“基因”和“重组基因”代指可以从染色体DNA中分离出来的核酸分子,所述核酸分子包括编码蛋白质的开放阅读框,所述蛋白质例如是Aspergillus niger的脂肪分解酶。基因可以包括编码序列、非编码序列、内含子和调控序列。此外,基因指本文中所定义的经过分离的核酸分子。
可以使用标准的分子生物学技术及本文中提供的序列信息,分离出本发明的核酸分子,例如具有选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的核苷酸序列的核酸分子或其功能等同物。例如,用选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的核酸分子的全部或部分作为探针,就可以使用标准的杂交和克隆技术(例如,描述于Sambrook,J.,Fritsh,E.F.,and Maniatis,T.MolecularCloningA Laboratory Manual.2nd,ed.,Cold Spring Harbor Laboratory,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,NY,1989中的)分离出本发明的核酸分子来。
此外,使用合成的寡核苷酸引物,通过聚合酶链式反应(PCR)可以分离出包含了选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的核酸序列的全部或部分的核酸分子,所述引物是基于选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的核酸序列中含有的序列信息来设计的。
可以用cDNA、mRNA或基因组DNA作为模板,用合适的寡核苷酸引物,根据标准的PCR扩增技术,来扩增出本发明的核酸。由此扩增出的核酸可以被克隆进合适的载体,并通过DNA序列分析来确认。
此外,与本发明的核苷酸序列相应的寡核苷酸或能与本发明的核苷酸序列杂交的寡核苷酸可以通过标准的合成技术来制备,例如,使用自动DNA合成仪。
在一种优选的实施方式中,经过分离的本发明的核酸分子包含SEQID NO2中展示的核苷酸序列。SEQ ID NO2的序列相当于SEQ IDNO1中提供的Aspergillus niger的基因的编码区域。该cDNA包含了编码如SEQ ID NO3中所示的Aspergillus niger的NBE028多肽的序列。
在第二种优选的实施方式中,经过分离的本发明的核酸分子包含SEQID NO5中展示的核苷酸序列。SEQ ID NO5的序列相当于SEQ IDNO4中提供的Aspergillus niger的基因的编码区域。该cDNA包含了编码如SEQ ID NO6中所示的Aspergillus niger的NBE029多肽的序列。
在第三种优选的实施方式中,经过分离的本发明的核酸分子包含SEQID NO8中展示的核苷酸序列。SEQ ID NO8的序列相当于SEQ IDNO7中提供的Aspergillus niger的基因的编码区域。该cDNA包含了编码如SEQ ID NO9中所示的Aspergillus niger的NBE030多肽的序列。
在第四种优选的实施方式中,经过分离的本发明的核酸分子包含SEQID NO11中展示的核苷酸序列。SEQ ID NO11的序列相当于SEQ IDNO10中提供的Aspergillus niger的基因的编码区域。该cDNA包含了编码如SEQ ID NO12中所示的Aspergillus niger的NBE031多肽的序列。
在第五种优选的实施方式中,经过分离的本发明的核酸分子包含SEQID NO14中展示的核苷酸序列。SEQ ID NO14的序列相当于SEQ IDNO13中提供的Aspergillus niger的基因的编码区域。该cDNA包含了编码如SEQ ID NO15中所示的Aspergillus niger的NBE032多肽的序列。
在第六种优选的实施方式中,经过分离的本发明的核酸分子包含SEQID NO17中展示的核苷酸序列。SEQ ID NO17的序列相当于SEQ IDNO16中提供的Aspergillus niger的基因的编码区域。该cDNA包含了编码如SEQ ID NO18中所示的Aspergillus niger的NBE033多肽的序列。
在第七种优选的实施方式中,经过分离的本发明的核酸分子包含SEQID NO20中展示的核苷酸序列。SEQ ID NO20的序列相当于SEQ IDNO19中提供的Aspergillus niger的基因的编码区域。该cDNA包含了编码如SEQ ID NO21中所示的Aspergillus niger的NBE034多肽的序列。
在第八种优选的实施方式中,经过分离的本发明的核酸分子包含SEQID NO23中展示的核苷酸序列。SEQ ID NO23的序列相当于SEQ IDNO22中提供的Aspergillus niger的基因的编码区域。该cDNA包含了编码如SEQ ID NO24中所示的Aspergillus niger的NBE036多肽的序列。
在第九种优选的实施方式中,经过分离的本发明的核酸分子包含SEQID NO26中展示的核苷酸序列。SEQ ID NO26的序列相当于SEQ IDNO25中提供的Aspergillus niger的基因的编码区域。该cDNA包含了编码如SEQ ID NO27中所示的Aspergillus niger的NBE038多肽的序列。
在第十种优选的实施方式中,经过分离的本发明的核酸分子包含SEQID NO29中展示的核苷酸序列。SEQ ID NO29的序列相当于SEQ IDNO28中提供的Aspergillus niger的基因的编码区域。该cDNA包含了编码如SEQ ID NO30中所示的Aspergillus niger的NBE039多肽的序列。
在第十一种优选的实施方式中,经过分离的本发明的核酸分子包含SEQ ID NO32中展示的核苷酸序列。SEQ ID NO32的序列相当于SEQID NO31中提供的Aspergillus niger的基因的编码区域。该cDNA包含了编码如SEQ ID NO33中所示的Aspergillus niger的NBE043多肽的序列。
在第十二种优选的实施方式中,经过分离的本发明的核酸分子包含SEQ ID NO35中展示的核苷酸序列。SEQ ID NO35的序列相当于SEQID NO34中提供的Aspergillus niger的基因的编码区域。该cDNA包含了编码如SEQ ID NO36中所示的Aspergillus niger的NBE045多肽的序列。
在第十三种优选的实施方式中,经过分离的本发明的核酸分子包含SEQ ID NO38中展示的核苷酸序列。SEQ ID NO38的序列相当于SEQID NO37中提供的Aspergillus niger的基因的编码区域。该cDNA包含了编码如SEQ ID NO39中所示的Aspergillus niger的NBE042多肽的序列。
在另一种优选的实施方式中,经过分离的本发明的核酸分子包含的核酸分子是选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的核苷酸序列的互补序列,或上述核苷酸序列的功能等同物。与另一条核苷酸序列互补的核酸分子,与所述的另外的核苷酸序列充分互补,从而能与所述的另外的核苷酸序列杂交,因此形成稳定的双链体(duplex)。
本发明的一个方面涉及编码本发明的多肽或其功能等同物的经过分离的核酸分子,所述功能等同物例如是具有生物活性的片段或结构域;此方面还涉及足以用作杂交探针去鉴别编码本发明多肽的核酸分子的核酸分子;以及适合于用作PCR引物来对核酸分子进行扩增或突变的核酸分子的片段。“经过分离的多核苷酸”或“经过分离的核酸”是DNA或RNA,在从中得到所述DNA或RNA的生物体的天然存在的基因组中,所述DNA或RNA与两条(5’端的一条和3’端的一条)编码序列直接相邻,而对“经过分离的多核苷酸”或“经过分离的核酸”而言,所述DNA或RNA与这两条编码序列并不直接相邻。因此,在一种实施方式中,经过分离的核酸包括直接相邻于所述编码序列的5’非编码(例如,启动子)序列的一部分或全部。因此该术语包括,例如,插入到载体中的重组DNA,插入到自主复制质粒或病毒中的重组DNA,或插入到原核生物或真核生物的基因组DNA中的重组DNA,或作为不依赖其它序列的独立分子(例如,通过PCR或限制性内切酶处理产生的cDNA或基因组DNA片段)而存在的重组DNA。该术语还包括作为杂种基因(hybrid gene)一部分的重组DNA,所述杂种基因编码另外的多肽,所述的多肽充分去除了细胞物质、病毒物质或培养基(当通过重组DNA技术进行生产时),或化学前体或其它化学制品(当化学合成时)。此外,“经过分离的核酸片段”并非是天然就作为片段存在的,而且其也不能在自然状态被发现。
本文中使用的术语“多核苷酸”或“核酸分子”被用来包括DNA分子(例如cDNA和基因组DNA)和RNA分子(例如mRNA)以及用核苷酸类似物生产出的DNA或RNA类似物。所述的核酸分子可以是单链的或双链的,但优选是双链的DNA。可以使用寡核苷酸类似物或衍生物(次黄苷或硫代磷酸核苷酸)来合成所述的核酸。例如,此类寡核苷酸可被用于制备碱基配对能力有所改变或对核酸酶抗性增加的核酸。
本发明的另一种实施方式提供了经过分离的核酸分子,所述核酸分子反义于本发明的核酸分子。本发明的范围内还包括了本文中描述的核酸分子的互补链。
测序错误本文中提供的序列信息不应被狭义地解释为需要将非正确鉴别的碱基包括在内。可以很容易地用本文公开的特定序列从丝状真菌中分离出完整的基因,特别是从Aspergillus niger中;然后可以很容易地对所述基因进行进一步的序列分析,从而鉴别出测序的错误来。
除非另外指明,本文中所有通过对DNA分子进行测序测定出的核苷酸序列都是用自动DNA测序仪来测定的,所有由此处所确定的DNA分子编码的多肽的氨基酸序列都是通过对按照上文所述测定的DNA序列进行翻译来预测的。因此,如本领域内所已知的那样,对任何通过该自动手段来测定的DNA序列而言,本文中测定的任何的核苷酸序列都可能含有一些错误。典型地,通过自动操作测定的核苷酸序列与被用来测序的DNA分子的实际核苷酸序列至少约90%相同,更典型地,至少约95%到至少约99.9%相同。可通过其它手段更精确地测定所述的实际序列,所述手段包括本领域中公知的手工DNA测序方法。如本领域中还已知的那样,如果测定出的核苷酸序列较之实际序列有一个插入或缺失,在该核苷酸进行翻译时就会导致移码,从而对测定出的核苷酸序列而言,从插入或缺失点开始,预测得到的其所编码的氨基酸序列就将完全不同于被用于测序的DNA分子实际编码的氨基酸序列。
本领域内的技术人员能够鉴别出此类非正确鉴别的碱基,而且知道如何改正此类错误。
核酸片段、探针和引物本发明的核酸分子可以仅仅包含选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的核酸序列的片段或一部分,例如,可以被用作探针或引物的片段,或编码本发明蛋白质的一部分的片段。对所述脂肪分解酶基因的克隆测定出的核苷酸序列以及cDNA可用来得到探针和引物,所述探针和引物是为鉴定和/或克隆脂肪分解酶家族的其它成员以及来自其它物种的脂肪分解酶同源体而设计的。典型地,所述探针/引物包含经过充分纯化的寡核苷酸,典型地,所述寡核苷酸包含核苷酸序列区域,所述核苷酸序列区域优选在高度严谨条件下,与一种核苷酸序列或其功能等同物的至少约12或15个,优选约18或20个,优选约22或25个,更优选约30、35、40、45、50、55、60、65或75或更多的连续核苷酸杂交,与所述核苷酸序列区域杂交的核苷酸序列选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组。
基于本文提供的核苷酸序列的探针可被用于探测转录物或基因组序列,所述转录物或基因组序列例如在其它生物中编码同样的蛋白质或同源蛋白质。在优选的实施方式中,所述探针进一步地包含连接到其上的标记基团,例如,所述标记基团可以是放射性同位素、荧光化合物、酶或酶的辅助因子。此类探针还可被用作诊断试验试剂盒的一部分,用于鉴别表达脂肪分解酶蛋白质的细胞。
同一性(identity)和同源性(homology)术语“同源性”或“百分比同一性(percent identity)”在本文中可互换使用。就本发明的目的而言,在此定义为确定两条氨基酸序列或两条核酸序列的百分比同一性,本着最优比较的目的(例如,可以在第一条氨基酸序列或核苷酸序列上引入缺口(gap),以与第二条氨基酸序列或核苷酸序列达到最佳的比对),将所述序列进行比对(align)。然后对相应氨基酸位置或核苷酸位置上的氨基酸残基或核苷酸进行比较。如果第一条序列上某位置的氨基酸残基或核苷酸与第二条序列上相应位置的相同,那么这些分子在此位置就是相同的。两条序列间的百分比同一性是所述序列共有的相同位置的数量的函数(即,%同一性=相同位置的数量/位置(即重叠位置)总数×100)。优选地,该两条序列长度相同。
技术人员会知道有若干计算机程序可被用于确定两条序列间的同源性。例如,可以使用数学算法来完成对序列的比对和对两条序列间百分比同一性的确定。在一个优选的实施方式中,使用Needleman and Wunsch(J.Mol.Biol.(48)444-453(1970))算法来确定两条氨基酸序列间的百分比同一性,所述算法已被合并到GCG软件包(可从http//www.gcg.com获得)的GAP程序中,其中使用Blossom 62矩阵或PAM250矩阵,缺口权重为16、14、12、10、8、6或4,长度权重为1、2、3、4、5或6。技术人员会意识到上述的所有不同参数将导致有细微区别的结果,但是使用不同算法时两条序列的总体百分比同一性不会有显著改变。
在又一个实施方式中,使用GCG软件包(可从http//www.gcg.com获得)的GAP程序来确定两条核苷酸序列间的百分比同一性,其中使用NWSgapdna.CMP矩阵,缺口权重为40、50、60、70或80,长度权重为1、2、3、4、5或6。在另一个实施方式中,使用E.Meyers和W.Miller(CABIOS,411-17(1989))的算法来确定两条氨基酸序列或核苷酸序列的百分比同一性,所述算法已被合并到ALIGN程序(2.0版)(可从http//vega.igh.cnrs.fr/bin/align-guess.cgi获得)中,其中使用PAM120加权残基表,缺口长度惩罚(penalty)为12,缺口惩罚为4。
本发明的核酸和蛋白质序列可以进一步地被用作“查询序列”来开展对公众数据库的搜索,例如,去鉴定相关序列或家族中其它成员。可以使用Altschul,et al.(1990)J.Mol.Biol.215403-10的BLASTN和BLASTX程序(2.0版)来开展此类搜索。可以用BLASTN程序,在score=100,字长(word length)=12下来开展BLAST核苷酸搜索,以获得与本发明的PLP03核酸分子同源的核苷酸序列。可以用BLASTX程序,在score=50,字长=3下来开展BLAST蛋白质搜索,以获得与本发明的PLP03蛋白质同源的氨基酸序列。本着比较的目的,为获得有缺口的比对,可以利用Altschul et al.,(1997)Nucleic Acids Res.25(17)3389-3402中描述的Gapped BLAST。当利用BLAST和Gapped BLAST程序时,可以使用各个程序(例如BLASTX和BLASTN)的缺省参数。见http//www.ncbi.nlm.nih.gov。
杂交本文中用到的术语“杂交”被用来描述杂交和洗涤的条件,在所述条件下,典型地,互相之间同源性为至少约50%、至少约60%、至少约70%、更优选为至少约80%、进一步优选为至少约85%到90%、更优选为至少95%的核苷酸序列保持相互杂交的状态。
对此类杂交条件而言,其中一个优选的非限制的例子是在6×氯化钠/柠檬酸钠(sodium chloride/sodium citrate,SSC)中,大约45℃下杂交,随后在1×SSC、0.1%SDS中,50℃下进行一次或多次洗涤,优选在55℃下,优选在60℃下,进一步优选在65℃下。
高度严谨条件包括例如,在68℃下于5×SSC/5×Denhardt’s溶液/1.0%SDS中进行杂交,室温下于0.2×SSC/0.1%SDS中洗涤。或者,洗涤可以在42℃展开。
本领域技术人员知道何种条件下适于使用严谨杂交条件及高度严谨杂交条件。本领域中不难获得其它关于此类条件的指导,例如,在Sambrooket al.,1989,Molecular Cloning,A Laboratory Manual,Cold Spring HarborPress,N.Y.;和Ausubel et al.(eds.),1995,Current Protocols in MolecularBiology,(John Wiley & Sons,N.Y.)中。
当然,仅与poly A序列(例如mRNA的3’末端poly(A)区)或仅与T(或U)残基的互补性延伸区段(stretch)杂交的多核苷酸将不会被包括在用于与本发明核酸的一部分特异性杂交的本发明多核苷酸中,因为此类多核苷酸将与任何含有poly(A)延伸区段的核酸分子或其互补序列(例如,实际上是任何双链的cDNA克隆)杂交。
获得来自其它生物的全长DNA采用典型手段,可以对从其它生物,例如从丝状真菌,特别是从Aspergillus的种所构建的cDNA文库进行筛选。
例如,可以通过Northern印迹分析来对Aspergillus的菌株进行筛选,以获得同源多核苷酸。在探测到与本发明多核苷酸同源的转录物之后,可以利用本领域技术人员公知的标准技术,由分离自合适菌株的RNA来构建cDNA文库。或者,可以使用能与本发明多核苷酸杂交的探针来对全基因组DNA文库进行筛选。
例如,可以通过使用两套简并的寡核苷酸引物组(primer pool)开展PCR,来分离出同源的基因序列,所述引物组是基于本文所教导的核苷酸而设计的。
用于所述反应的模板可以是通过对mRNA进行反转录所获得的cDNA,所述mRNA是从已知能表达或被怀疑能表达本发明多核苷酸的菌株中制备得到的。PCR产物可被用于亚克隆或测序,以确保扩增出的序列代表新的PLP03核酸序列或其功能等同物的序列。
然后可以通过一系列已知方法,用所述的PCR片段来分离全长cDNA克隆。例如,可对扩增出的片段进行标记,并将其用于对噬菌体cDNA文库或粘粒cDNA文库的筛选。或者,经过标记的片段可被用于筛选基因组文库。
PCR还可被用于从其它生物中分离全长cDNA序列。例如,可以遵循标准工序,从适当的细胞或组织来源分离出RNA。用寡核苷酸引物对所述RNA进行反转录反应,所述引物与扩增片段的5’末端序列具有特异性,用于引导第一链合成。
然后可以用标准的末端转移酶反应,给得到的RNA/DNA杂交体(hybrid)“加上尾巴”(例如,用鸟嘌呤),所述的杂交体可被RNaseH消化,然后第二链合成得以被引导(例如,用poly-C引物)。因此,可以很容易地分离出处于扩增片段上游的cDNA序列。关于有用的克隆策略的综述,参见例如前述的Sambrook et al.和前述的Ausubel et al.。
载体本发明的另一个方面是关于载体的,优选为表达载体,所述载体含有编码本发明蛋白质的核酸或其功能等同物。在本文中用到的术语“载体”指能运送连接到其上的另一个核酸分子的核酸分子。一种载体类型是“质粒”,“质粒”指环状的双链DNA环,另外的DNA片断可以连接到所述的环上。另一种载体的类型是病毒载体,其中,另外的DNA片断可以连接到病毒基因组中。某些载体能在其被引入的宿主细胞中进行自主复制(例如,具有细菌的复制起点的细菌载体以及游离的哺乳动物载体)。其它载体(例如,非游离的哺乳动物载体)在被引入宿主细胞之后就被整合到了宿主细胞的基因组中,因此它们与宿主基因组一同复制。此外,某些载体能指导可操作地连接到其上的基因的表达。此类载体在本文中被称为“表达载体”。一般而言,在重组DNA技术中用到的表达载体通常是质粒的形式。在本文中术语“质粒”和“载体”可以互换使用,因为质粒是最常用到的载体形式。然而,本发明也将包括其它形式的表达载体,例如病毒载体(例如,复制缺陷型逆转录病毒、腺病毒和腺伴随病毒),所述载体能提供等同的功能。
本发明的重组表达载体包含本发明的核酸,所述核酸存在的形式适合于该核酸在宿主细胞中的表达,这意味着该重组表达载体包括一段或多段调控序列,所述序列是基于被用于表达的宿主细胞来选择的,其被可操作地连接到将要表达的核酸序列上。在重组表达载体中,“可操作地连接”被用来表示人们感兴趣的核苷酸序列被连接到调控序列上,所述的连接以允许该核苷酸序列表达的方式(例如,在体外转录/翻译系统中或在载体被引入的宿主细胞中)进行。术语“调控序列”将包括启动子、增强子和其它表达控制元件(例如,多腺苷酸化信号)。例如,在Goeddel;GeneExpression TechnologyMethods in Enzymology 185,Academic Press,SanDiego,CA(1990)中对此类调控序列进行了描述。调控序列包括在很多种宿主细胞中指导核苷酸序列的组成型或诱导型表达的调控序列,也包括仅在某些宿主细胞中指导核苷酸序列表达的调控序列(例如,组织特异性调控序列)。本领域的技术人员将意识到,对表达载体的设计可能依赖于以下因素对将被转化的宿主细胞的选择,期望获得的蛋白质的表达水平等。本发明的表达载体可以被引入宿主细胞,以生产本文所述的核酸编码的蛋白质或肽(例如,脂肪分解酶、突变的脂肪分解酶、上述酶的片段、上述酶的变异体或功能等同物、融合蛋白等等)。
可以为了在原核细胞或真核细胞中表达脂肪分解酶而对本发明的重组表达载体加以设计。例如,本发明的蛋白质可在细菌细胞、昆虫细胞(使用杆状病毒表达载体)、酵母细胞或哺乳动物细胞中表达,所述细菌细胞例如是E.coli和Bacillus的种。在Goeddel;Gene Expression TechnologyMethods in Enzymology 185,Academic Press,San Diego,CA(1990)中对合适的宿主细胞进行了进一步的讨论。或者,所述的重组表达载体可在体外进行转录及翻译,例如,使用T7启动子调控序列和T7聚合酶。
在本发明中有用的表达载体包括源自染色体、游离体和病毒的载体,例如源自细菌质粒、噬菌体、酵母游离体、酵母染色体元件的载体,源自病毒,例如杆状病毒、乳头多瘤空泡病毒(papova virus)、痘苗病毒、腺病毒、禽痘病毒、假狂犬病病毒和逆转录病毒的载体和源自上述物质的组合的载体,例如源自质粒和噬菌体遗传元件的载体,例如粘粒和噬菌粒(phagemid)。
插入的DNA应当被可操作地连接到合适的启动子上,例如噬菌体的lambda PL启动子,E.coli的lac启动子、trp启动子和tac启动子,SV40的早期启动子和晚期启动子以及逆转录病毒LTR的启动子。技术人员知道其它合适的启动子。在一种具体的实施方式中,优选的启动子是能指导脂肪分解酶在丝状真菌中高水平表达的启动子。此类启动子为本领域所已知。所述的表达构建体可以含有用于转录起始和终止的位点,还在转录区域含有用于翻译的核糖体结合位点。由该构建体表达的成熟转录物的编码部分包括处于起点的用于起始翻译的AUG以及恰当地定位于待翻译的多肽末尾的终止密码。
可通过传统的转化或转染技术将载体DNA引入原核细胞或真核细胞。在此使用的“转化”和“转染”指一系列本领域内已知的用于将外源核酸(例如DNA)引入到宿主细胞中的技术,包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、转导、感染、脂质转染、阳离子脂介导的转染或电穿孔。用于对宿主细胞进行转化和转染的合适方法可在Sambrook,et al.(Molecular CloningA Laboratory Manual,2nd,ed.Cold Spring HarborLaboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989),Davis et al.,Basic Methods in Molecular Biology(1986)及其它实验手册中找到。
对哺乳动物细胞的稳定转染而言,人们已知,仅有一小部分的细胞可以将外源DNA整合到其基因组中,这取决于所用的表达载体和转染技术。为鉴别和选择出上述整合体,通常将编码选择性标志(例如对抗生素的抗性)基因与人们感兴趣的基因一起引入到宿主细胞中。优选的选择性标志包括赋予药物抗性的标志,所述药物例如是G418、潮霉素和甲氨喋呤。优选地,编码选择性标志的核酸在与编码本发明蛋白质的载体相同的载体上被转移到宿主细胞中,或者,所述核酸可以在另外的载体上被转移进去。经过被引入的核酸稳定转染的细胞可通过药物选择来鉴别(例如,已经插入了选择性标志基因的细胞将存活,而其它细胞则会死亡)。
蛋白质在原核生物中的表达通常是在E.coli中开展的,其中使用了含有组成型或诱导型启动子的载体,用于指导融合蛋白或非融合蛋白的表达。融合载体将多个氨基酸加入到该载体所编码的蛋白质上,例如,加入到该重组蛋白的氨基末端。典型地,此类融合载体用作三种目的1)以增强重组蛋白的表达;2)以增加该重组蛋白的溶解度;和3)通过在亲和纯化中作为配体以协助该重组蛋白的纯化。通常,在融合表达载体中,向融合部分和重组蛋白的连接处引入蛋白酶剪切位点,以便在融合蛋白被纯化之后能使重组蛋白与融合部分相分离。此类酶及其同源(cognate)识别序列包括Xa因子、凝血酶和肠激酶。
如本文所指出的,所述表达载体将优选含有选择性标志。此类标志包括用于真核细胞培养的二氢叶酸还原酶或新霉素抗性以及用于培养E.coli和其它细菌的四环素抗性或氨苄青霉素抗性。合适的宿主的代表性例子包括细菌细胞,例如E.coli、Streptomyces和Salmonella typhimurium;真菌细胞,例如酵母;昆虫细胞,例如Drosophila S2和Spodoptera Sf9;动物细胞,例如CHO、COS和Bowes黑色素瘤;以及植物细胞。用于上述宿主细胞的合适的培养基和培养条件都是本领域内已知的。
载体中优选用于细菌的是可从Qiagen获得的pQE70、pQE60和pQE-9,可从Stratagene获得的pBS载体、Phagescript载体、Bluescript载体、pNH8A、pNH16A、pNH18A、pNH46A,可从Pharmacia获得的ptrc99a、pKK223-3、pKK233-3、pDR540、pRIT5。优选的真核载体是可从Stratagene获得的PWLNEO、pSV2CAT、pOG44、pZT1和pSG,以及可从Pharmacia获得的pSVK3、pBPV、pMSG和pSVL。其它适合的载体对本领域技术人员而言是显而易见的。
用于本发明的已知的细菌启动子包括E.coli的lacI和lacZ启动子,T3和T7启动子,gpt启动子,lambda PR、PL启动子和trp启动子,HSV胸苷激酶启动子,SV40的早期启动子和晚期启动子,逆转录病毒LTR的启动子例如劳斯肉瘤病毒(Rous sarcoma virus,RSV)的启动子以及金属硫蛋白启动子,例如小鼠的金属硫蛋白-I启动子。
将增强子序列插入到载体中可以增强编码本发明多肽的DNA在更高等真核生物中的转录。增强子是DNA的顺式作用元件,通常从10bp至300bp,其在特定的宿主细胞类型中发挥作用,以增加启动子的转录活性。增强子的例子包括处于复制起点晚期一侧(late side)第100bp至270bp处的SV40增强子、巨细胞病毒早期启动子的增强子、腺病毒增强子以及处于复制起点晚期一侧的多瘤病毒增强子。
为使翻译的蛋白质能分泌到内质网的腔、胞质间隙或胞外环境中,可以将适当的分泌信号插入到表达的多肽中。所述的信号对该多肽而言可以是内源的,也可以是异源信号。
所述的多肽可以以经修饰的形式表达,例如以融合蛋白的形式,并且该多肽不仅可以包括分泌信号,还可以包括其它的异源功能区域。因此,例如,可以将其它氨基酸,特别是带电荷的氨基酸,区域加入到所述多肽的N-末端,以增加其在宿主细胞中、在纯化期间或在随后的操作及贮藏期间的稳定性和持久性。此外,还可以将肽的部分加入到所述多肽上,以协助进行纯化。
本发明的多肽本发明提供了氨基酸序列和经过分离的多肽,所述氨基酸序列可通过在合适的宿主中表达选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的多核苷酸来获得,所述多肽具有选自由SEQ IDNO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的氨基酸序列。此外,包含上述多肽的功能等同物的肽或多肽也被包含于本发明中。上述多肽被共同包含于术语“本发明的多肽”中。
(如通常所承认的一样,)术语“肽”和“寡肽”被认为是同义的,当上下文中需要指出通过肽键结合起来的至少两个氨基酸的链时,两个术语可以互换使用。“多肽”这个词在本文中被用于指含有超过七个氨基酸残基的链。本文中所有寡肽和多肽的分子式或序列都是从左至右书写的,而且是从氨基端到羧基端的方向。本文中使用的单字母氨基酸代码在本领域中是公知的,其可以在Sambrook,et al.(Molecular CloningA LaboratoryManual,2nd,ed.Cold Spring Harbor Laboratory,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY,1989)中找到。
“经过分离的”多肽或蛋白质被用于从其自然环境中移出来的多肽或蛋白质。例如,出于本发明的目的,在宿主细胞中表达的经重组生产的多肽和蛋白质被认为是经过分离的;已用任何合适的技术进行了充分纯化的天然或重组多肽也被认为是经过分离的,所述技术例如是在Smith andJohnson,Gene 6731-40(1988)中公开的一步纯化法。
可通过公知的方法从重组细胞培养物中回收及纯化本发明的脂肪分解酶,所述方法包括硫酸铵或乙醇沉淀、酸提取、阴离子交换层析或阳离子交换层析、磷酸纤维素层析、疏水作用层析、亲和层析、羟基磷灰石层析和凝集素层析。最优选地,使用高效液相色谱(HPLC)来进行纯化。
本发明的多肽包括天然纯化的产物、化学合成工序的产物以及从原核或真核宿主中通过重组技术生产的产物,所述宿主包括例如细菌、酵母、高等植物、昆虫和哺乳动物。本发明的多肽可以是经过了糖基化的,或者可以是未经过糖基化的,这取决于在重组生产工序中所使用的宿主。此外,本发明的多肽还可以包括初始修饰的甲硫氨酸残基,在某些情况下作为宿主介导的过程的结果。
本发明的脂肪分解酶可被有利地用于烘焙过程。加入到面团中的酶的量主要靠经验决定。其可能取决于所用面粉的质量、需要改善的程度、面包或烘焙制品的种类、制备面团的方法、其它成分的百分比等等。
蛋白质片段本发明还公开了本发明多肽的具有生物活性的片段。
本发明多肽的具有生物活性的片段包括包含下述氨基酸序列的多肽,所述氨基酸序列与所述脂肪分解酶的氨基酸序列充分相同或来自所述脂肪分解酶的氨基酸序列(例如所述脂肪分解酶的氨基酸序列选自由SEQ IDNO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组),所述片段包括的氨基酸较之所述的全长蛋白质要少,其显示了相应全长蛋白质的至少一种生物活性。典型地,具有生物活性的片段包含具有相应全长蛋白质的至少一种生物活性的结构域或基元(motif)。
本发明蛋白质的具有生物活性的片段可以是多肽,所述多肽的长度例如为10、25、50、100或更多个氨基酸。此外,可以通过重组技术来制备其它具有生物活性的部分,所述部分中被去除了所述蛋白质的其它区域;对本发明多肽的天然形式的一种或多种生物活性而言,可以对所述部分进行评估。
本发明还公开了编码上述脂肪分解酶蛋白质的具有生物活性的片段的核酸片段。
融合蛋白本发明的蛋白质或其功能等同物,例如其具有生物活性的部分,可被可操作地连接到非脂肪分解酶多肽(例如,异源氨基酸序列)上,以形成融合蛋白。本文中用到的脂肪分解酶的“嵌合(chimeric)蛋白”和“融合蛋白”包含可操作地连接到非脂肪分解酶多肽上去的脂肪分解酶多肽。“脂肪分解酶多肽”指具有选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的氨基酸序列的多肽,而“非脂肪分解酶多肽”则指具有与所述脂肪分解酶不充分同源的蛋白质的相应氨基酸序列的多肽,例如不同于所述脂肪分解酶的蛋白质,并且所述蛋白质与所述脂肪分解酶来自相同的或不同的生物。在脂肪分解酶的融合蛋白中,脂肪分解酶多肽可能对应于所述脂肪分解酶蛋白质的全部或部分。在一种优选的实施方式中,脂肪分解酶融合蛋白包含脂肪分解酶蛋白质的至少一段具有生物活性的片段。在另一种优选的实施方式中,脂肪分解酶融合蛋白包含脂肪分解酶蛋白质的至少两个具有生物活性的部分。在所述的融合蛋白中,术语“可操作地连接”用来表示所述的脂肪分解酶多肽和所述的非脂肪分解酶多肽以符合读框的方式(in-frame)相互融合。所述的非脂肪分解酶多肽可以被融合到所述脂肪分解酶多肽的N-末端或C-末端上。
例如,在一种实施方式中,所述的融合蛋白是GST-脂肪分解酶融合蛋白,其中,脂肪分解酶序列被融合到GST序列的C-末端上。此类融合蛋白可以促进对重组的脂肪分解酶的纯化。在另一种实施方式中,所述的融合蛋白是在其N-末端含有异源信号序列的脂肪分解酶蛋白质。可以通过使用异源信号序列,来增加所述脂肪分解酶在某些宿主细胞(例如,哺乳动物宿主细胞和酵母宿主细胞)中的表达和/或分泌。
在另一个实施例中,杆状病毒包膜蛋白的gp67分泌序列可被用作异源信号序列(Current Protocols in Molecular Biology,Ausubel et al.,eds.,John Wiley & Sons,1992)。真核异源信号序列的其它例子包括蜂毒肽的分泌序列和人类胎盘碱性磷酸酶的分泌序列(Stratagene;La Jolla,California)。在又一个实施例中,有用的原核异源信号序列包括phoA分泌信号(前述的Sambrook et al.)和蛋白质A分泌信号(Pharmacia Biotech;Piscataway,New Jersey)。
信号序列可被用于协助对本发明蛋白质或多肽的分泌及分离。典型地,信号序列的特征为具有疏水氨基酸核心,分泌期间,在一次或多次切割事件中,通常可将所述信号序列从成熟蛋白质上切割掉。此类信号肽含有加工位点(processing site),所述位点允许信号序列在通过分泌途径之时被从成熟蛋白质上切割掉。所述信号序列指导了所述蛋白质的分泌,例如从转化进表达载体的真核宿主中分泌,所述信号序列随后或同时被切割掉。然后通过本领域公知的方法,可以很容易地从胞外培养基中纯化出所述的蛋白质。或者,可以用能协助纯化的序列,例如用GST结构域将所述的信号序列连接到人们感兴趣的蛋白质上。因此,例如,编码所述多肽的序列可与标志序列融合,所述标志序列例如是编码能促进该融合多肽纯化的肽的序列。在本发明这一方面的某些优选的实施方式中,所述的标志序列是六组氨酸的肽,例如pQE载体(Qiagen,Inc.)中提供的标签;很多标志序列都是可以购买到的。例如,如Gentz et al,Proc.Natl.Acad.Sci.USA86821-824(1989)所述,六组氨酸为所述的融合蛋白提供了方便的纯化。所述的HA标签是另一种有利于纯化的肽,其与来自流感血凝素蛋白质的表位相对应,这已被例如Wilson et al.,Cell 37767(1984)进行了描述。
优选地,本发明的嵌合蛋白或融合蛋白是通过标准的重组DNA技术来产生的。例如,遵循传统技术,将编码不同多肽序列的DNA片段以符合读框的方式连接到一起,例如,通过采用平末端或交错切口末端用于连接;采用限制性酶消化以提供合适的末端,或根据需要填平粘末端;采用碱性磷酸酶处理,以避免人们不想要的结合或酶连接。在另一种实施方式中,可以通过传统技术来合成所述的融合基因,所述技术包括自动DNA合成仪。或者,可以使用锚定引物(anchor primer)来开展对基因片段的PCR扩增,所述引物能在两段连续的基因片段之间产生互补突出端(overhang),随后可以进行退火和再次扩增,以产生出嵌合基因序列(例如,见Current Protocols in Molecular Biology,eds.Ausubel et al.JohnWiley & Sons1992)。此外,还可以购买到很多已经编码有融合部分(例如,GST多肽)的表达载体。编码脂肪分解酶的核酸可被克隆到此类载体中,以使所述融合部分以符合读框的方式与所述脂肪分解酶蛋白质连接起来。
功能等同物术语“功能等同物”和“功能变异体”在本文中可以互换使用。编码脂肪分解酶的DNA的功能等同物是经过分离的DNA片段,所述片段编码展示特定功能的多肽,所述功能是本文中定义的Aspergillus niger的脂肪分解酶所具有的。本发明的脂肪分解酶多肽的功能等同物是展示了本文中定义的Aspergillus niger的脂肪分解酶的至少一种功能的多肽。因此,功能等同物也包括具有生物活性的片段。
蛋白质或多肽功能等同物可以含有仅经过对一个或多个氨基酸进行了保守替代的氨基酸序列或仅对非关键氨基酸进行了替代、插入或缺失的氨基酸序列,所述氨基酸序列选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组。因此,非关键氨基酸是氨基酸序列中可被改变的残基,但所述改变基本不会改变生物功能,所述氨基酸序列选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组。例如,对本发明的脂肪分解酶蛋白质而言是保守的氨基酸残基,就被预测为是尤其不能进行改变的残基。此外,对本发明的脂肪分解酶蛋白质和其它脂肪分解酶而言是保守的氨基酸,也不太可能易于被改变。
术语“保守替代”用来指一种替代,其中,所述的氨基酸残基被具有相似侧链的氨基酸残基所替换。上述族系已为本领域所已知,其包括具有碱性侧链的氨基酸(例如,赖氨酸、精氨酸和组氨酸),具有酸性侧链的氨基酸(例如,天冬氨酸、谷氨酸),具有不带电荷的极性侧链的氨基酸(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸),具有非极性侧链的氨基酸(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸),具有beta支链形式的侧链的氨基酸(例如,苏氨酸、缬氨酸、异亮氨酸)和具有芳香族侧链的氨基酸(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)。
典型地,核酸功能等同物可以含有沉默突变或不改变所编码多肽的生物功能的突变。因此,本发明提供了编码脂肪分解酶蛋白质的核酸分子,所述蛋白质含有氨基酸残基的改变,所述氨基酸残基对特定的生物活性来说是非必要的。此类脂肪分解酶蛋白质与选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的氨基酸序列不同,但所述的蛋白质仍然保留有至少一种生物活性。在一种实施方式中,所述经过分离的核酸分子含有编码蛋白质的核苷酸分子,其中,所述蛋白质包含与选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的氨基酸序列具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性的基本同源的氨基酸序列。
例如,在Bowie,J.U.et al.,Science 2471306-1310(1990)中提供了关于如何制造表型沉默的氨基酸替代的指导,其中,作者指出,有两种主要的手段可以用于研究氨基酸序列对改变的容忍度。第一种方法依赖进化过程,其中,突变或者被自然选择所接受,或者被其拒绝。第二种方法则是利用遗传工程向克隆基因的特定位点引入氨基酸改变,然后进行选择或筛选,以鉴别出保留了功能性的序列。如作者所言,上述研究揭示,蛋白质对氨基酸替代有着惊人的容忍度。作者还进一步指出了哪些改变可能被允许进行于蛋白质的特定位置上。例如,大多数隐蔽的氨基酸残基需要非极性侧链,而表面上的侧链通常很少有保守特征。在前述的Bowie et al和本文引用的参考文献中,描述了其它的表型沉默替代。
编码与选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的蛋白质同源的蛋白质的经过分离的核酸分子,可以通过下述方法来制造向相应的核苷酸编码序列(表1)中引入一个或多个核苷酸替代、增加或缺失,从而向被编码的蛋白质中引入一个或多个的氨基酸替代、缺失或插入。可以通过标准技术来引入此类突变,所述技术例如是定点诱变和PCR介导的诱变。
术语“功能等同物”还包括本文提供的Aspergillus niger的脂肪分解酶的直向同源体(orthologue)。Aspergillus niger的脂肪分解酶的直向同源体是可以从其它菌株或物种中分离得到的蛋白质,所述蛋白质具有相似或相同的生物活性。此类直向同源体包含与选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的氨基酸序列基本同源的氨基酸序列,因此所述同源体不难被鉴别出来。
如本文所定义,术语“基本同源”指第一条氨基酸或核苷酸序列与第二条氨基酸或核苷酸序列含有足够数目的或最低要求数目的相同或等同(例如,具有相似侧链)的氨基酸或核苷酸,从而,所述的第一条和第二条氨基酸或核苷酸序列具有共同(common)结构域。例如,含有共同结构域,且具有约60%,优选为65%,更优选为70%,进一步优选为75%、80%、85%、90%、95%、96%、97%、98%或99%或更高的同一性的氨基酸序列或核苷酸序列,在本文中就被定义为充分相同。
此外,编码脂肪分解酶家族其它成员的核酸也在本发明的范围内,所述核酸因此具有与选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的核苷酸序列不同的核苷酸序列。此外,编码来自其它物种的脂肪分解酶蛋白质的核酸也在本发明的范围内,所述核酸具有与选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的核苷酸序列不同的核苷酸序列。
使用本文中公开的cDNA或其合适的片段作为杂交探针,优选在高度严谨杂交条件下,可以按照标准的杂交技术,分离出与本发明多核苷酸的变异体(例如,天然的等位基因变异体)及同源体相应的核酸分子,所述分离基于与所述变异体及同源体相应的核酸分子与本文中公开的核酸分子的同源性。
对本文中提供的Aspergillus niger的序列而言,除其天然存在的等位基因变异体之外,技术人员还知道通过突变向选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的核苷酸序列引入改变,由此可以导致所述脂肪分解酶蛋白质的氨基酸序列改变,但所述蛋白质的功能却没有实质性变化。
在本发明的另一个方面,提供了经过改善的脂肪分解酶。改善的脂肪分解酶是其中至少一种生物活性经过了改善的蛋白质。此类蛋白质可以通过向所述脂肪分解酶编码序列的全部或一部分上随机引入突变来获得,例如通过饱和诱变来获得,得到的突变体可被重组表达,并被用于进行对生物活性的筛选。例如,本领域提供了用于测量脂肪分解酶酶活的标准检测方法,因此可以很容易地选出经过改善的蛋白质。
在一种优选的实施方式中,所述脂肪分解酶具有选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的氨基酸序列。另一种实施方式中,所述脂肪分解酶与选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的氨基酸序列基本同源,并且所述脂肪分解酶保留有选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的多肽的至少一种生物活性,但因为上述的天然变异或诱变,所述的脂肪分解酶与所述多肽的氨基酸序列仍有不同。
在另外一个优选实施方式中,所述脂肪分解酶具有由经过分离的核酸片段编码的氨基酸序列,所述核酸片段能与选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的核酸杂交,所述杂交优选进行于高度严谨的杂交条件下。
因此,所述的脂肪分解酶是包含一种氨基酸序列的蛋白质,所述氨基酸序列与选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的氨基酸序列具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;并且所述蛋白质还保留有选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的多肽的至少一种功能活性。
具体而言,所述的脂肪分解酶是包含一种氨基酸序列的蛋白质,所述氨基酸序列与SEQ ID NO3中所示的氨基酸序列具有至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一种氨基酸序列的蛋白质,所述氨基酸序列与SEQ ID NO6中所示的氨基酸序列具有至少约55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一种氨基酸序列的蛋白质,所述氨基酸序列与SEQ ID NO9中所示的氨基酸序列具有至少约75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一种氨基酸序列的蛋白质,所述氨基酸序列与SEQ ID NO12中所示的氨基酸序列具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一种氨基酸序列的蛋白质,所述氨基酸序列与SEQ ID NO15中所示的氨基酸序列具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一种氨基酸序列的蛋白质,所述氨基酸序列与SEQID NO18中所示的氨基酸序列具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一种氨基酸序列的蛋白质,所述氨基酸序列与SEQ ID NO21中所示的氨基酸序列具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一种氨基酸序列的蛋白质,所述氨基酸序列与SEQ ID NO24中所示的氨基酸序列具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一种氨基酸序列的蛋白质,所述氨基酸序列与SEQ ID NO27中所示的氨基酸序列具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一种氨基酸序列的蛋白质,所述氨基酸序列与SEQ ID NO30中所示的氨基酸序列具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一种氨基酸序列的蛋白质,所述氨基酸序列与SEQ ID NO33中所示的氨基酸序列具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一种氨基酸序列的蛋白质,所述氨基酸序列与SEQ ID NO36中所示的氨基酸序列具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一种氨基酸序列的蛋白质,所述氨基酸序列与SEQ ID NO39中所示的氨基酸序列具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性。
本发明的蛋白质的功能等同物还可以通过多种方式被鉴定出来,例如通过对本发明蛋白质的突变体例如截短突变体的组合(combinatorial)文库针对脂肪分解酶活性进行筛选。在一种实施方式中,通过核酸水平上的组合诱变产生了变异体的杂色文库(variegated library)。变异体的杂色文库可以通过多种方式来产生,例如,通过用酶将合成的寡核苷酸混合物连接到基因序列上,使得一套可能是蛋白质的简并序列可作为单个的多肽表达,或者,作为一套较大的融合蛋白表达(例如,用于噬菌体展示时)。有很多种方法可用于从简并的寡核苷酸序列来生产可能是本发明多肽变异体的文库。用于合成简并寡核苷酸的方法在本领域中是已知的(见例如,Narang(1983)Tetrahedron 393;Itakura et al.(1984)Annu.Rev.Biochem.53323;Itakura et al.(1984)Science 1981056;Ike et al.(1983)Nucleic AcidRes.11477)。
另外,本发明多肽编码序列的片段的文库也可用于制造多肽的杂色群(population),以在随后对变异体的选择中进行筛选。例如,编码序列片段的文库可以通过如下方法来制造用核酸酶处理双链PCR片段,所述片段是人们感兴趣的编码序列的,在所使用的处理条件下,对每个分子而言,切口(nick)仅出现大约一次;对所述双链DNA进行变性;对所述DNA进行复性,以形成双链DNA,所述双链DNA可能包括来自不同切口产物的同义/反义对;通过S1核酸酶处理,从重新形成的双链体中除去单链的部分;将得到的片段文库与表达载体连接起来。通过此种方法,可以得到一种表达文库,所述文库编码多种不同大小的N-末端片段及内部片段,所述片段是人们感兴趣的蛋白质的。
本领域中已知的多种技术都可用于筛选组合文库的基因产物及筛选cDNA文库以得到具有选定属性的基因产物,所述组合文库是通过截短点突变来制造的。典型地,使用最广泛的用于筛选大基因文库并适用于高通量分析的技术包括将所述基因文库克隆到可复制表达载体中;用得到的载体文库去转化合适的细胞;在一定条件下表达所述的组合基因,在所述表达条件下,针对人们想要的活性进行的探测,有助于分离出编码其产物被探测到的基因的载体。递归总体诱变(recursive ensemble mutagenesis,REM)技术能增强功能突变体在文库中出现的频率,所述技术可与筛选试验一起使用,以鉴定出本发明蛋白质的变异体(Arkin and Yourvan(1992)Proc.Natl.Acad.Sci.USA 897811-7815;Delgrave et al.(1993)ProteinEngineering 6(3)327-331)。
在给定的群中可能存在DNA序列多态性,这可能导致所述脂肪分解酶氨基酸序列的改变,这点对于本领域技术人员来说是显而易见的。此类遗传多态性可能由于天然的等位基因变异而存在于来自不同群的细胞中,或者存在于一个群中。等位基因变异体还可以包括功能等同物。
本发明多核苷酸的片段还可以包含不编码功能多肽的多核苷酸。此类多核苷酸可以用作探针或用作PCR反应的引物。
对本发明的核酸而言,不管其编码功能多肽或编码非功能多肽,都可被用作杂交探针或聚合酶链式反应(PCR)的引物。不编码具有脂肪分解酶活性的多肽的本发明的核酸分子的用途包括(1)从cDNA文库中分离编码脂肪分解酶蛋白质的基因,或其等位基因变异体,例如,来自其它生物而不是Aspergillus niger的cDNA文库;(2)如Verma et al.,HumanChromosomesa Manual of Basic Techniques,Pergamon Press,New York(1988)所述,对中期染色体扩展(spreads)进行的原位杂交(例如FISH),以提供对脂肪分解酶基因的精确染色体定位;(3)Northern印迹分析,用于探测脂肪分解酶mRNA在特定组织和/或细胞中的表达;(4)可作为诊断工具使用的引物和探针,以分析能在给定的生物(例如组织)样品中与所述脂肪分解酶探针杂交的核酸是否存在。
本发明中还包括一种方法,所述方法是用于获得脂肪分解酶编码基因或cDNA的功能等同物的。该方法需要获得经过标记的探针,所述探针包括经过分离的核酸或其变异体,所述核酸编码选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的序列的全部或一部分;用所述经过标记的探针对核酸片段文库进行筛选,其中,筛选是在允许探针与文库中核酸片段杂交的条件下进行的,从而形成了核酸双链体,并且由任何经过标记的双链体中的核酸片段制备出全长基因序列,以获得与所述的脂肪分解酶相关的基因。
在一种实施方式中,本发明的核酸与选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的核酸序列或其互补序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同源性。
在另一种优选的实施方式中,本发明的多肽与选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同源性。
宿主细胞在另一种实施方式中,本发明描述了含有本发明中包括的核酸的细胞,例如经过转化的宿主细胞或重组的宿主细胞。“经过转化的细胞”或“重组细胞”是通过重组DNA技术,向其中(或其祖代中)引入了本发明的核酸的细胞。原核细胞和真核细胞都被包括在内,例如,细菌、真菌、酵母等,特别优选的是来自丝状真菌的细胞,特别是Aspergillusniger。
可以对宿主细胞加以选择,选出能调节插入序列表达的宿主细胞或能以特异性的、令人期待的方式对基因产物进行修饰或加工的宿主细胞。此类对蛋白质产物的修饰(例如糖基化)和加工(例如切割)可以促进蛋白质的机能最优化。
多种宿主细胞都具有特征性的及特异性的机制,所述机制用于对蛋白质及基因产物的翻译后加工和修饰。可以选出分子生物学和/或微生物学领域的技术人员熟悉的合适的细胞系或宿主系统,以确保对所表达的外源蛋白质的修饰和加工是令人期望的及正确的。为达成此目标,可以使用具有胞内加工系统的真核宿主细胞,所述加工系统用于对初级转录物的正确加工、对基因产物的糖基化和磷酸化。此类宿主细胞是本领域中公知的。
宿主细胞还包括但不限于哺乳动物细胞系,例如CHO、VERO、BHK、HeLa、COS、MDCK、293、3T3、WI38和脉络丛细胞系。
如果需要的话,可通过稳定转染的细胞系来生产本发明的多肽。大量适于对哺乳动物细胞进行稳定转染的载体公众都可获得,构建此类细胞系的方法也为公众所已知,例如在(前述的)Ausubel et al.中。
抗体本发明进一步地描述了抗体,例如单克隆抗体或多克隆抗体,所述抗体与本发明的脂肪分解酶蛋白特异性地结合。
在本文中使用的术语“抗体(Ab)”或“单克隆抗体(Mab)”的意义中包括完整的分子及抗体片段(例如,Fab和F(ab’)2片段),所述片段能与脂肪分解酶蛋白质特异性地结合。Fab和F(ab’)2片段缺少完整抗体的Fc片段,较之完整抗体,其能更迅速地从循环中被清除,并且可能具有更少的非特异性组织结合(Wahl et al.,J.Nucl.Med.24316-325(1983))。因此,上述片段是优选的。
可通过若干方法中的任何一种来制备本发明的抗体。例如,可将表达脂肪分解酶蛋白质或其抗原片段的细胞施用给动物,以诱导含有多克隆抗体的血清的产生。在一种优选方法中,制备出脂肪分解酶蛋白质制剂,并对其进行纯化,以使其基本没有天然的污染物。再将该制剂引入到动物中,以产生具有更强的特异活性的多克隆抗血清。
在最优选的方法中,本发明的抗体是单克隆抗体(或其脂肪分解酶蛋白结合片段)。可以用杂交瘤技术(Kohler et al.,Nature 256495(1975);Kohler et al.,Eur.J.Immunol.6511(1976);Hammerling et al.,InMonoclonalAntibodies and T-Cell Hybridomas,Elsevier,N.Y.,pp.563-681(1981))来制备此类单克隆抗体。一般而言,此类工序涉及对动物(优选为小鼠)进行免疫,其中使用脂肪分解酶蛋白质抗原或使用表达脂肪分解酶蛋白质的细胞。提取出所述小鼠的脾细胞,将其与合适的骨髓瘤细胞系融合。根据本发明,可以采用任何合适的骨髓瘤细胞。然而,优选采用亲本骨髓瘤细胞系(SP2O),所述细胞系可从American Type Culture Collection,Rockville,Maryland获得。融合之后,将得到的杂交瘤细胞于HAT培养基上进行进行选择性培养,再通过由Wands et al.(Gastro-enterology 80225-232(1981))所述的极限稀释法(limiting dilution)进行克隆。通过此种选择方法获得的杂交瘤细胞再被用于试验,以鉴定出分泌能与所述脂肪分解酶蛋白质抗原相结合的抗体的克隆。一般而言,如前述的Ausubel et al.所述,所述多肽可被连结到载体蛋白例如KLH上,与佐剂混合,并向宿主哺乳动物中注射。
具体而言,可以通过注射感兴趣的多肽来对多种宿主动物进行免疫。合适的宿主动物的例子包括兔子、小鼠、豚鼠和大鼠。根据宿主动物的不同,多种佐剂可被用于增强免疫反应,其包括但不限于Freund’s(完全及不完全)佐剂,矿物胶例如氢氧化铝,表面活性物质例如溶血卵磷脂,多聚醇(pluronic polyols),聚阴离子,肽,油乳化剂,匙孔血蓝蛋白(keyhole limpet hemocyanin),二硝基苯酚,卡介苗(bacille Calmette-Guerin,BCG)和Corynebacterium parvum。多克隆抗体是从免疫动物血清中获得的抗体分子的异源群。
此类抗体可以属于任何的免疫球蛋白类型,所述类型包括lgG、lgM、lgE、lgA、lgD及其亚类。生产本发明mAb的杂交瘤可在体外或体内培养。
多克隆抗体或单克隆抗体被生产出来之后,就被用来进行免疫测定试验,所述试验针对所述抗体对本发明蛋白质或其功能等同物的特异性识别,所述免疫测定例如是Western印迹分析或使用标准技术进行的免疫沉淀分析,所述技术例如是前述的Ausubel et al.中所述的。与本发明蛋白质或其功能等同物特异性结合的抗体在本发明中是有用的。例如,此类抗体可被用于免疫测定,以在Aspergillus的致病株或非致病株中(例如Aspergillus提取物中)探测本发明的蛋白质。
优选地,用本发明蛋白质的片段来生产本发明的抗体,所述片段是看上去可能具有抗原性,辨别标准是例如带电荷残基出现的高频率。例如,可以通过标准的PCR技术来产生此类片段,再将此类片段克隆到pGEX表达载体中(前述的Ausubel et al.)。然后可以在E.coli中表达融合蛋白,并用谷胱甘肽琼脂糖亲和矩阵对其进行纯化,参见前述的Ausubel et al.所述。如果需要的话,对每种蛋白质可以制造多种(两种或三种)融合蛋白,每种融合蛋白可以被注射到至少两只兔子中去。可以通过一系列的注射来提高抗血清,典型地,所述一系列注射中包括至少三次强化注射(booster injection)。典型地,对所述抗血清进行检查,所述检查针对所述抗血清对本发明的蛋白质或其功能等同物的免疫沉淀能力,而无关蛋白质可被用作免疫反应特异性的对照。
或者,为生产单链抗体而描述的技术(U.S.Patent 4,946,778及U.S.Patent 4,704,692)可被进行改动以适应于生产针对本发明蛋白质或其功能等同物的单链抗体。用于生产和筛选噬菌体展示文库的试剂盒可以通过商业方法获得,例如从Pharmacia获得。
另外,例如从U.S.Patent No.5,223,409;PCT Publication No.WO92/18619;PCT Publication No.WO 91/17271;PCT Publication No.WO 20791;PCT Publication No.WO 92/20791;PCT Publication No.WO 92/15679;PCTPublication No.WO 93/01288;PCT Publication No.WO 92/01047;PCTPublication No.WO 92/09690;PCT Publication No.WO 90/02809;Fuchs et al.(1991)Bio/Technology 91370-1372;Hay et al.(1992)Hum.Antibod.Hybridomas 381-85;Huse et al.(1989)Science 246;1275-1281;Griffiths et al.(1993)EMBO J.12725-734中可以找到特别适用于生产及筛选抗体展示文库的方法及试剂的例子。
可对与本发明蛋白质或其功能等同物特异性结合的多克隆抗体及单克隆抗体加以使用,例如,用来探测编码本发明蛋白质或其功能等同物的基因的表达,例如,在Aspergillus另一种菌株中的表达。例如,对Aspergillus的细胞或提取物进行传统的免疫测定,可以很容易地对本发明的蛋白质进行探测。合适的测定的例子包括但不限于Western印迹、ELISA、放射性免疫测定等。
“与……特异性结合”是指抗体能对特定的抗原,例如本发明的蛋白质,加以识别并与之结合,但所述的抗体却基本不识别样品中其它无关分子,也不与所述无关分子结合。
可以对抗体加以纯化,例如,通过亲和层析的方法,其中,所述多肽抗原被固定到树脂上。
针对本发明多肽的抗体(例如,单克隆抗体)可被用于分离所述的多肽,所述分离通过标准技术来进行,例如亲和层析或免疫沉淀。此外,此抗体可被用于(例如,在细胞溶菌物或细胞上清液中)探测所述的蛋白质,以对该多肽的表达丰度和表达模式做出评价。所述的抗体还可被用于诊断方面,以作为临床检测程序的一部分,监测细胞或组织中的蛋白质水平,例如,用于确定特定治疗方法的疗效或用于对曲霉病(Aspergillosis)的诊断。
通过将所述抗体连结到可被探测的物质上可以有助于探测的进行。可被探测的物质的例子包括若干种酶、辅基、荧光材料、发光材料、生物发光材料和放射性材料。合适的酶的例子包括辣根过氧化酶、碱性磷酸酶、β-半乳糖苷酶或乙酰胆碱酯酶;合适的荧光材料的例子包括伞形酮(umbelliferone)、荧光素(fluorescein)、异硫氰酸荧光素、罗丹明(rhodamine)、二氯三嗪基胺(dichlorotriazinylamine)荧光素、丹磺酰氯或藻红素;发光材料的例子包括鲁米诺(luminol);生物发光材料的例子包括虫萤光素酶、虫萤光素(luciferin)和水母发光蛋白;合适的放射性材料的例子包括125I、131I、35S或3H。
抗原肽中包括的优选的表位是处于该蛋白质表面上的区域,例如亲水区域。本发明蛋白质的疏水小区域(plot)可被用于鉴定亲水区域。
本发明蛋白质的抗原肽包含至少7个(优选为10个、15个、20个或30个)连续的氨基酸残基,所述残基是选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的氨基酸序列的;所述抗原肽还包括该蛋白质的表位,从而针对所述肽而产生的抗体能与该蛋白质形成特异性的免疫复合物。
所述的抗原肽所包括的优选的表位是处于本发明蛋白质表面上的区域,例如,亲水区域、疏水区域、alpha区域、beta区域、卷曲区域、转角区域和柔韧区域。
免疫检测可以使用本领域内任何已知的方法来对生物样品中的本发明多肽进行定性和定量测定。基于抗体的技术为检测生物样品中特定多肽的水平提供了特别的好处。
其中,所述的初级(单克隆或多克隆)抗体提供了特异性识别,但二级探测系统可以利用荧光、酶或其它经过结合的二级抗体。由此获得了免疫复合物。
因此,本发明提供了一种诊断方法,用于诊断特定生物是否被Aspergillus感染,所述方法包括如下步骤●从所述疑似被Aspergillus感染的生物中分离出生物样品;●将所述的生物样品与本发明的抗体进行反应;●检测免疫复合物是否形成。
组织也可以被提取出来,用于释放蛋白质以进行Western-印迹试验或斑点印迹(dot/slot)试验,所述提取例如是使用尿素和中性去垢剂来进行的。上述技术也可用于体液。
其它适用于探测本发明蛋白质的基于抗体的方法包括免疫测定,例如酶联免疫吸附测定(ELISA)和放射性免疫测定(radioimmunoassay,RIA)。例如,针对本发明蛋白质的单克隆抗体既可被用作免疫吸附剂又可被用作酶标记探针,以对本发明的蛋白质进行探测及定量。使用线性衰退计算机算法,参照标准制剂中的蛋白质的量,可计算出样品中存在的蛋白质的量。在另一种ELISA试验中,可以使用两种完全不同的特异性单克隆抗体来在生物液中探测本发明的蛋白质。在该试验中,一种抗体被用作免疫吸附剂,另一种被用作酶标记探针。
上述技术基本可以“一步”试验或“两步”试验来进行。“一步”试验涉及将本发明的蛋白质与固定的抗体相接触,不经洗涤,将所述混合物与经过标记的抗体相接触。“两步”试验涉及在将所述混合物与经过标记的抗体接触前进行洗涤。使用其它传统方法也可以是合适的。人们通常想要将所述实验系统中的一种成分固定到支持物上,由此允许该系统中的其它成分与所述成分相接触,而又不难将其它成分从所述样品上移除。
合适的酶标记包括例如,来自于氧化酶那一类的,所述的酶可以通过与底物反应来催化过氧化氢的产生。可以通过测量过氧化氢的浓度来测定氧化酶标记的活性,所述过氧化氢是酶标记抗体/底物的反应产生的。
除了酶之外,其它合适的标记包括放射性同位素和荧光标记,所述放射性同位素例如是碘(125I、121I)、碳(14C)、硫(35S)、氚(3H)、铟(112In)和锝(99mTc),荧光标记例如是荧光素和罗丹明,以及生物素。
试验化合物与本发明蛋白质的特异性结合可被探测出来,例如,通过将本发明蛋白质可逆或不可逆地固定到衬底上来进行体外探测,所述衬底例如是96孔聚苯乙烯微量滴定板的孔表面。用于固定多肽和其它小分子的方法是本领域公知的。例如,可以通过将本发明蛋白质的溶液(典型地,体积为1-100μl,浓度为0.05mg/ml至1mg/ml)加入到每个孔中,来将所述的微量滴定板包被上本发明的蛋白质,再将所述的板在室温至37℃间保温培养0.1至36小时。可通过摇晃过量的溶液将未结合到板上的蛋白质从所述的板上除去,再用水或缓冲液对所述的板进行(一次或重复的)洗涤。典型地,所述的蛋白质被包含于水或缓冲液中。然后用缓冲液再对所述的板进行洗涤,所述缓冲液中没有已结合的蛋白质。为封闭所述板上的游离蛋白质结合位点,用与被结合的蛋白质无关的蛋白质对所述的板进行封闭。例如,在Tris-HCl中浓度为2mg/ml的体积为300μl的牛血清清蛋白(bovine serum albumin,BSA)是合适的。合适的衬底包括含有确定的交联化学组成的衬底(例如,塑料衬底,例如聚苯乙烯衬底、苯乙烯衬底或聚丙烯衬底,所述衬底例如是来自Corning Costar Corp.(Cambridge,MA)的)。如果需要的话,珠状微粒,例如珠状琼脂糖或珠状琼脂糖凝胶,可被用作衬底。
可通过若干种本领域已知的方法来对试验化合物与本发明多肽的结合进行探测。例如,可在免疫测定中使用特异性抗体。如果需要的话,该抗体可被(例如,荧光或用放射性同位素)标记并被直接探测(例如,见West and McMahon,J.Cell Biol.74264,1977)。或者,二级抗体可被用于探测(例如,经过标记的抗体,所述经过标记的抗体能与抗AN97抗体的Fc部分结合)。在另外一种探测方法中,对本发明的蛋白质进行标记,并对该标记进行探测(例如,通过用放射性同位素、荧光团、发色团等来标记本发明的蛋白质)。在又一种方法中,本发明的蛋白质被作为融合蛋白来生产,其中,本发明的蛋白质与能通过光学手段检测到的蛋白质,例如(可在UV光下被探测到的)绿色荧光蛋白,融合。在再一种方法中,本发明的蛋白质可以与酶融合或共价结合,所述的酶具有可被探测到的酶活,所述的酶例如是辣根过氧化酶、碱性磷酸酶、alpha-半乳糖苷酶或葡糖氧化酶。编码上述所有酶的基因都已被克隆出来了,对本领域的技术人员而言,所述基因是不难获得的。如果需要的话,所述的融合蛋白可以包括抗原,采用传统方法,可使用多克隆抗体或单克隆抗体对此抗原进行探测及测量。合适的抗原包括非酶性多肽(例如,血清蛋白和乳蛋白,所述血清蛋白例如是BSA和球蛋白,所述乳蛋白例如是酪蛋白)和酶(例如,辣根过氧化酶、碱性磷酸酶和alpha-半乳糖苷酶)。
表位、抗原和免疫原在另一个方面,本发明提供了一种肽或多肽,所述肽或多肽包含本发明多肽的具有表位的部分。该多肽部分的表位是本发明多肽的免疫原表位或抗原表位。“免疫原表位”被定义为蛋白质的一部分,当整个蛋白质是免疫原时,所述的部分会诱发抗体应答。人们相信,上述免疫原表位仅限于所述分子上的一些位点。另一方面,对蛋白质分子而言,其能与抗体结合的区域被定义为“抗原表位”。对蛋白质而言,其免疫原表位的数量通常要少于抗原表位的数量。例如,见Geysen,H.M.et al.,Proc.Natl.Acad.Sci.USA 813998-4002(1984)。
对具有抗原表位的肽或多肽(也就是说,含有能与抗体结合的蛋白质分子区域)的选择而言,本领域中公知对蛋白质序列的一部分进行模拟(mimic)的相对较短的合成肽通常能诱导抗血清的产生,所述抗血清是抗部分被模拟的蛋白质的。例如,见Sutcliffe,J.G.et al.,Science 219660-666(1984)。能诱导抗蛋白质血清产生的肽,往往在蛋白质的一级序列中就有所体现,通过一组简单的化学规则就可以将其鉴别出来,所述的肽既不限于完整蛋白质的免疫优势(immunodominant)区域(即免疫原表位),也不限于氨基末端或羧基末端。极度疏水的肽和具有六个或少于六个残基的肽,通常对诱导与被模拟蛋白质结合的抗体来说是无效的;更长的可溶的肽,尤其是那些含有脯氨酸残基的,通常是有效的。参见前述的Sutcliffe et al.,在第661页。例如,根据上述方针设计了20个肽,所述的肽含有8-39个残基,覆盖了流感病毒血凝素HA1多肽链序列的75%,这20个肽中,有18个诱导了抗HA1蛋白质或抗完整病毒的抗体;来自MuLV聚合酶的12个肽以及来自狂犬病糖蛋白的18个肽全都诱导了抗体的产生,所述抗体会沉淀相应的蛋白质。
本发明中,具有抗原表位的肽和多肽因此可用于产生抗体,包括与本发明多肽特异性结合的单克隆抗体。因此,通过与来自供体的脾细胞相融合并用具有抗原表位的肽进行免疫而获得的杂交瘤中,有很大一部分通常都会分泌抗原始蛋白的抗体。见前述的Sutcliffe et al.,第663页。由具有抗原表位的肽或多肽产生的抗体对于探测被模拟的蛋白质是有用的,并且,针对不同肽的抗体可被用于追踪蛋白质前体上的若干将经历翻译后加工的区域的命运。所述的肽和抗肽抗体可被用于一系列针对被模拟蛋白质的定性或定量试验,例如,可用于竞争性试验,因为已经显示在免疫沉淀试验中,更短的肽(例如,大约9个氨基酸)能结合及取代较大的肽。例如,见Wilson I.A.et al.,Cell 37767-778 at 777(1984)。本发明的抗肽抗体还可用于纯化被模拟的蛋白质,例如,用本领域公知的方法通过吸附层析来纯化。
根据上述方针设计出的本发明的具有抗原表位的肽及多肽优选含有本发明多肽的氨基酸序列中的至少七个氨基酸,更优选为至少九个氨基酸,最优选为大约15个至大约30个之间的氨基酸。然而,包含本发明多肽氨基酸序列中更长部分的肽或多肽也被认为是本发明的具有表位的肽或多肽,并且也可被用于诱导抗被模拟蛋白质的抗体,所述包含更长部分的肽或多肽含有30个至50个氨基酸,或者包含任何长度的氨基酸,所述长度可达本发明多肽的整个氨基酸序列的长度或包括了本发明多肽的整个氨基酸序列。优选地,对具有表位的肽的氨基酸序列加以选择,选出在水性溶剂中能充分溶解的那些(即所述的序列包括相对亲水的残基,而优选不用高度疏水的序列);含有脯氨酸残基的序列是特别优选的。
可用任何传统的制造肽或多肽的手段来生产本发明的具有表位的肽和多肽,所述手段包括用本发明的核酸分子来进行重组的手段。例如,在重组生产及纯化期间,以及在免疫以产生抗肽抗体期间,可以将较短的具有表位的氨基酸序列与作为载体的较大多肽融合。
还可以用已知的化学合成方法来合成具有表位的肽。例如,Houghten描述了一种用于合成较大数量的肽的简单方法,例如10-20mg的248个具有13个残基的不同的肽,其代表了HA1多肽片断的单氨基酸变异体,它们在少于四周之内被制备和鉴定(通过ELISA类型的结合研究)出来。Houghten,R.A.,Proc.Natl.Acad.Sci.USA 825131-5135(1985)。在Houghten et al.的U.S.Patent No.4,631,211(1986)中,对这种“同时进行的多种肽的合成(Simultaneous Multiple Peptide Synthesis,SMPS)”方法还有进一步的描述。在此工序中,用于对若干种肽进行固相合成的多个单独的树脂被分别包含于可透过溶剂的多个小包装中,从而能够以最理想的方式使用固相方法中涉及到的很多相同的重复步骤。
完全手工的工序允许500-1000或更多的合成同时开展。见前述的Houghten et al.,第5134页。
根据本领域公知的方法,可用本发明的具有表位的肽和多肽来诱导抗体。例如,见前述的Sutcliffe et al.;前述的Wilson et al.;Chow,M.et al.,Proc.Natl.Acad.Sci.USA 82910-914;和Bittle,F.J.et al.,J.Gen.Virol.662347-2354(1985)。
通常,可用游离肽对动物进行免疫;然而,通过将所述的肽与高分子载体连结,可以提高抗肽抗体的效价,所述高分子载体例如是匙孔血蓝蛋白(keyhole limpet hemocyanin,KLH)或破伤风类毒素。例如,可用马来酰亚胺苯酰基-N-羟基琥珀酰亚胺酯(maleimidobenzoyl-N-hydroxysuccinmide ester,MBS)等接头,将含有半胱氨酸的肽与载体连结,而对其它肽与载体的连结而言,可以使用更一般的连接剂,例如戊二醛。
可用游离肽或与载体连结的肽来对动物进行免疫,例如,通过用乳化剂进行腹膜内注射和/或皮内注射来免疫,所述乳化剂含有约100μg的肽或载体蛋白质以及Freund’s佐剂,所述动物例如是兔子、大鼠和小鼠。可能需要多次强化注射,以提供抗肽抗体的有用效价,所述强化注射例如是时间间隔为大约两周的,所述抗肽抗体的有用效价可通过例如ELISA试验来检测,其中,使用了被吸附到固体表面上的游离肽。可通过对抗肽抗体加以选择来提高被免疫动物血清中的抗肽抗体的效价,例如,通过吸附到固体支持物上的蛋白质上并按照本领域公知的方法对被选出的抗体进行洗脱来进行。
按照本领域中已知的方法,可鉴别出本发明中的具有免疫原表位的肽,即当整个蛋白质是免疫原时,蛋白质上能诱导抗体应答产生的那些部分。例如,前述的Geysen et al.,1984公开了一种工序,用于在固体支持物上快速地同时合成数百个肽,所述的肽足够纯净,能够在酶联免疫吸附测定中进行反应。然后可以很容易地探测到合成肽与抗体之间的相互作用,而不用将其从支持物上移走。用此种途径,本领域普通技术人员通过常规手段就可以鉴定出具有目标蛋白质免疫原表位的肽。例如,Geysen etal.对口蹄疫病毒外壳蛋白的免疫重要性表位进行了定位,将其确定为七个氨基酸,所述定位是通过合成包括全部208个可能的六肽在内的重叠系列来进行的,覆盖了该蛋白质的整个氨基酸序列,所述序列有213个氨基酸。然后,合成出了一套完整的替换多肽,其中,针对所述表位内部的每个位置,进行了全部20个氨基酸的依次替换,赋予与抗体反应特异性的特定氨基酸就被确定出来了。因此,可以用该方法来制造本发明的具有表位的肽的类似物。Geysen的U.S.Patent No.4,708,781(1987)中还进一步地描述了这种用来鉴定具有目标蛋白质免疫原表位的肽的方法。
更进一步地,Geysen的U.S.Patent No.5,194,392(1990)中,描述了一种用于探测或确定单体(氨基酸或其它化合物)序列的一般方法,所述序列是所述表位的拓扑等同物(即模拟型(mimitope)),所述等同物与感兴趣的抗体上的特定的抗体互补位(paratope)(抗原结合部位)互补。更一般地,Geysen的U.S.Patent No.4,433,092(1989)中,描述了一种探测或确定单体序列的方法,所述序列是一种配体的拓扑图像(topographical)等同物,所述等同物与感兴趣的特定受体上的配体结合位点互补。类似地,Houghten,R.A.et al.的关于“过烷基化的寡肽混合物(Peralkylated Oligopeptide Mixtures)”的U.S.Patent No.5,480,971(1996)中,公开了线性的C1-C7-烷基的过烷基化(peralkylated)寡肽以及此类肽的组和文库,还公开了一种方法,用于使用此类寡肽的组和文库来确定优先与感兴趣的接纳体(acceptor)分子结合的过烷基化寡肽的序列。因此,也可以通过常规手段用上述方法来制备本发明的具有表位的肽的非肽类似物。
脂肪分解酶在工业过程中的用途本发明还涉及本发明的脂肪分解酶在若干经过选择的工业过程中的用途。尽管人们长期以来从上述过程中获得了一些经验,但较之目前使用的酶,本发明的脂肪分解酶则展示了许多显著的优点。取决于特定的应用,上述优点可以包括以下方面例如,更低的生产成本、更高的针对底物的特异性、更少的抗原性、更少的不想要的副作用、当用合适的微生物生产时的更高的产量、更合适的pH及温度范围、更好的最终产品的口味以及食物级别和洁净卫生的方面。
本发明还涉及用于制备面团或烘焙产品的方法,所述方法包括将有效数量的本发明的脂肪分解酶合并到面团中去,从上述面团获得的面团或烘焙产品,较之未将所述多肽合并进去的面团或烘焙产品,一种或多种属性都有了改善。
在本文中把“将……合并到面团中去”这个短语定义为将本发明的脂肪分解酶加入到面团中,加入到用来制成面团的任何成分中和/或加入到用来制成面团的面团成分的任何混合物中去。换句话说,本发明的脂肪分解酶可在面团制备过程中的任何一个步骤被加入,本发明的脂肪分解酶也可以在一个、两个或多个步骤中被加入。可以将本发明的脂肪分解酶加入到面团成分中去,用本领域内公知的方法,对所述面团进行揉捏及烘焙,以制出烘焙产品。例如,见U.S.Patent No.4,567,046,EP-A-426,211,JP-A-60-78529,JP-A-62-111629和JP-A-63-258528。
术语“有效数量”在本文中被定义为一定量的本发明的脂肪分解酶,所述数量足以提供关于人们感兴趣的至少一种属性的可测量出来的效果,所述属性是所述面团和/或烘焙产品的。
术语“经过改善的属性”在本文中定义为面团和/或从该面团获得的产品,特别是烘焙产品的任何属性,较之本发明的脂肪分解酶未被合并进去的面团或产品而言,所述属性被本发明的脂肪分解酶的作用改善了。所述经过改善的属性包括但不限于增加的面团强度、增加的面团弹性、增加的面团稳定性、降低的面团粘性、经过改善的面团延展性、经过改善的烘焙产品的香味、经过改善的烘焙产品的保鲜性。
可以通过对制备中加入了本发明多肽的和制备中未加入本发明多肽的面团和/或烘焙产品进行比较,来确定出经过改善的属性,可以按照后面的实施例中所描述的本发明的方法来进行。对与感官相关品质的评估,可以通过使用已在烘焙工业中完善建立的工序来进行,其中可以包括,例如,利用一组受过专门训练的品尝试验师。
术语“增加的面团强度”在本文中被定义为一种面团的属性,所述面团通常具有更具弹性的属性,和/或需要更多关于成型和造型的工作。
术语“增加的面团弹性”在本文中被定义为一种面团的属性,所述面团在经受一定的物理张力之后,更容易恢复其原有的形状。
术语“增加的面团稳定性”在本文中被定义为一种面团的属性,所述面团更不容易受机械破坏影响,因此能更好地保持其形状和体积。
术语“降低的面团粘性”在本文中被定义为一种面团的属性,所述面团更不容易粘附到例如面团生产机器的表面上;可以由熟练的试验烘焙师对所述属性进行经验性地评估,或者可以通过使用本领域内已知的品质分析仪(texture analyser,例如TAXT2)来对其进行测量。
术语“经过改善的面团延展性”在本文中被定义为一种面团的属性,所述面团能经受更多的张力或拉伸,而不会断裂开。
术语“经过改善的面团可加工性”在本文中被定义为一种面团的属性,所述面团通常更少粘性和/或更为坚硬和/或更具弹性。
术语“增加的烘焙产品体积”是通过测定给定的面包块的比体积(体积/质量)来测出的,典型地,通过传统的油菜籽排水量(rapeseeddisplacement)法来对所述比体积进行测定。
术语“经过改善的烘焙产品碎屑结构”在本文中被定义为一种烘焙产品的属性,所述烘焙产品碎屑中小室的壁更纤小和/或更薄,和/或所述小室在碎屑中的分布更为一致/均匀;通常由熟练的试验烘焙师来进行经验性的评估。
术语“经过改善的烘焙产品柔软度”是“坚硬度”的反义词,其在本文中被定义为一种烘焙产品的属性,所述烘焙产品更容易被压缩;可以由熟练的试验烘焙师对所述属性进行经验性地评估,或者可以通过使用本领域内已知的品质分析仪(例如TAXT2)来对其进行测量。
术语“经过改善的烘焙产品香味”由受过专门训练的试验小组来评估。
术语“经过改善的烘焙产品保鲜性(anti-staling)”在本文中被定义为一种烘焙产品的属性,所述烘焙产品在贮藏期间的质量参数劣化速率变慢,所述参数例如是柔软度和/或弹性。
术语“面团”在本文中被定义为面粉和其它成分的混合物,所述混合物足够坚硬,能被揉捏或被卷起来。所述面团可以是新鲜的、冷冻过的、预先暴露的或预先烘焙过的。在Frozen and Refrigerated Doughs and Batters中,Kulp和Lorenz对冷冻过的面团的制备进行了描述。
术语“烘焙产品”在本文中被定义为从面团制得的任何产品,所述产品具有柔软特征或具有酥脆特征。可通过本发明有好处地生产出的烘焙产品,无论是白色、浅色或深色类型的,其例子是面包(特别是白面包、全麦面包或黑麦面包),典型地,是如下形式的块或卷、法棍类型的面包、意大利面、皮塔(pita)面包、玉米粉圆饼(tortillas)、墨西哥玉米卷(taco)、蛋糕、班戟(pancake)、饼干、曲奇饼、馅饼皮(piecrust)、馒头和脆面包等。
本发明的方法中用到的本发明的脂肪分解酶和/或另外的酶可以是任何适合于本文中讨论的用途的形式,例如干粉、团块状粉末、颗粒特别是没有撒上粉末的(non-dusting)颗粒、液体特别是稳定液体、或如WO01/11974及WO02/26044中所述的受到保护的酶。颗粒和成团块的粉末可以通过传统方法来制备,例如,通过在流床制粒机(fluid-bedgranulator)中将本发明的脂肪分解酶喷到载体上来制备。所述的载体可以由微粒状核心构成,所述核心具有合适的颗粒大小。所述载体可以是可溶的或者是不可溶的,例如,盐(例如NaCl或硫酸钠)、糖(例如蔗糖或乳糖)、糖醇(例如山梨糖醇)、淀粉、米、玉米渣或大豆。本发明的脂肪分解酶和/或另外的酶可以被包含于缓释制剂中。用于制备缓释制剂的方法在本领域中是公知的。根据现有方法添加营养学上可接受的稳定剂能对液体酶制剂加以稳定,所述稳定剂例如是糖、糖醇或其他多羟基化合物和/或乳酸或其它有机酸。
本发明的脂肪分解酶还可以被合并到含有酵母的组合物中,所述组合物例如是EP-A-0619947、EP-A-0659344和WO02/49441中所公布的。
对于向面粉预混合物中添加而言,本发明多肽以干燥产品的形式存在是有好处的,所述干燥产品例如是未撒上粉末的颗粒;而对于与液体一起添加而言,本发明多肽以液体形式存在是有好处的。
面团中可以被合并进一种或多种另外的酶。所述的另外的酶可以是任何来源的,包括哺乳动物和植物,优选是微生物(细菌、酵母或真菌)来源的,所述的酶可通过本领域中的常规技术来获得。
在一种优选的实施方式中,所述另外的酶可以是淀粉酶,例如alpha-淀粉酶(有利于提供可被酵母发酵的糖以及有利于延缓腐败)或beta-淀粉酶,环糊精(cyclodextrin)葡聚糖转移酶,肽酶,特别是外肽酶(有利于增加香味),谷氨酰胺转移酶,脂肪酶(有利于对面团或面团成分中的脂肪加以修饰,以软化所述的面团),磷脂酶,纤维素酶,半纤维素酶,特别是戊聚糖酶例如木聚糖酶(有利于对戊聚糖进行部分水解,以增加所述面团的延展性),蛋白酶(有利于弱化麸质,尤其是使用硬质小麦面粉的时候),蛋白质二硫化物异构酶,例如WO95/00636中公开的蛋白质二硫化物异构酶,糖基转移酶,过氧化物酶(有利于改善所述面团的稠度(consistency)),漆酶或氧化酶,例如葡糖氧化酶、己糖氧化酶、醛糖氧化酶、吡喃糖氧化酶、脂肪氧化酶或L-氨基酸氧化酶(有利于改善面团稠度)。
当按照本发明的方法添加一种或多种另外的酶活性时,上述活性可以单独添加或者与本发明的多肽一起添加,可选地,作为改善面包属性的组合物的成分或改善面团属性的组合物的成分添加。其它的酶活性可以是任何上述的酶,其剂量可以遵循现有的烘焙惯例。
本发明还涉及用于制备烘焙产品的方法,所述方法包括对通过本发明的方法获得的面团进行烘焙,以生产出烘焙产品来。可以用本领域内公知的方法来进行对所述面团的烘焙,以生产出烘焙产品。
本发明还涉及分别通过本发明的方法生产出来的面团和烘焙产品。
本发明进一步地涉及预混合物,例如,以面粉组合物的形式存在的预混合物,所述预混合物用于面团和/或用面团制成的烘焙产品,其中,所述的预混合物包含本发明的多肽。术语“预混合物”在本文中被定义为其传统意义,即作为烘焙试剂的混合物,通常包括面粉,所述预混合物不仅可用于工业化的面包烘焙机器/设备,其还可用于零售面包店。可以通过将本发明的多肽或改善面包属性的组合物和/或改善面团属性的组合物与合适的载体混合来制备得到所述的预混合物,所述组合物中包含所述的多肽,所述载体例如是面粉、淀粉、糖或盐。所述预混合物可以包含其它改善面团属性和/或改善面包属性的添加剂,例如,任何的上述添加剂,包括酶。
本发明进一步地涉及以颗粒或团块状粉末的形式存在的烘焙添加剂,所述添加剂中包含本发明的多肽。优选地,所述添加剂颗粒大小分布很狭窄,超过95%的(以重量计)颗粒在25μm至500μm的范围内。
在面团和面包的制造过程中,本发明可以和加工助剂联合使用,所述加工助剂在前文中有所定义,其例如是化学加工助剂,例如氧化剂(例如抗坏血酸)、还原剂(例如L-半胱氨酸)、氧化还原酶(例如葡糖氧化酶)和/或其它的酶,例如多糖修饰酶(例如,α-淀粉酶、纤维素酶、分支酶等)和/或蛋白质修饰酶(内蛋白酶、外蛋白酶、分支酶等)。
实施例1Aspergillus niger的发酵通过如下方式获得由本文中提供的核苷酸序列编码的脂肪分解酶构建含有所述DNA序列的表达质粒,用该质粒去转化A.niger菌株,以下述方法培养所述的Aspergillus niger菌株。
将A.niger的新鲜孢子(106-107)接种到20ml的CSL培养基中(带挡板的100ml瓶中),在34℃和170rpm下培养20-24小时。将5-10ml的CSL预培养物接种到100ml的CSM培养基中(带挡板的500ml瓶中),之后将所述菌株在34℃和170rpm下发酵3-5天。
通过在50ml的Greiner管中离心(30分钟,5000rpm)来获得不含细胞的上清液。在GF/A Whatman Glass微纤维过滤器(150mm AE)上对所述上清液进行预过滤,以移走较大的颗粒,用4N的KOH将pH调至5(如果必要的话),用0.2μm的(瓶在上)过滤器,在抽气作用下进行无菌过滤,以去除真菌物质。将所述上清液贮存于4℃(或-20℃)。
所述的CSL培养基由如下物质构成(以每升中的量计)100g的Corn Steep Solids(Roquette)、1g的NaH2PO4·H2O、0.5g的MgSO4·7H2O、10g的葡萄糖·H2O和0.25g的Basildon(防沫剂)。将所述成分溶解于去矿质水中,用NaOH或H2SO4将pH调至5.8;向带有挡板和泡沫球(foam ball)的100ml瓶中注入20ml发酵培养液,在120℃下灭菌20分钟,冷却至室温后,向每只瓶中加入200μl含有5000IU/ml青霉素和5mg/ml链霉素的溶液。
所述的CSM培养基由如下物质构成(以每升中的量计)150g的麦芽糖·H2O、60g的Soytone(蛋白胨)、1g的NaH2PO4·H2O、15g的MgSO4·7H2O、0.08g的Tween 80、0.02g的Basildon(防沫剂)、20g的MES、1g的L-精氨酸。将所述成分溶解于去矿质水中,用NaOH或H2SO4将pH调至6.2;向带有挡板和泡沫球的500ml瓶中注入100ml发酵培养液,在120℃下灭菌20分钟,冷却至室温后,向每只瓶中加入1ml含有5000IU/ml青霉素和5mg/ml链霉素的溶液。
实施例2纯化本发明的脂肪分解酶步骤1-制备超滤物对按照实施例1所获得的培养物上清液进行超滤,以去除小分子的污染物,所述污染物会妨碍酶活测定和烘焙试验。在Millipore Labscale TFF系统中对30ml上清液进行超滤,所述系统装备有临界值(cut-off)为10kDa的过滤器。
用100mM的冷磷酸缓冲液对所述样品进行3-5次洗涤,这取决于样品的颜色,所述缓冲液体积为40ml,pH 6.0,其中包括0.5mM的CaCl2。所述酶溶液的最终体积为30ml,在以后的实验中将其称为“超滤物”。
步骤2-通过A280和HPSEC来测定所述脂肪分解酶的浓度通过归因于所述脂肪分解酶的280nm处的消光(A280)以及计算得到的所述脂肪分解酶的分子消光系数,来计算出所述超滤物中脂肪分解酶的浓度。对A280的测量是用Uvikon XL Secomam分光光度计(Beun deRonde,Abcoude,The Netherlands)来进行的。
酶的分子消光系数可以通过每个酶分子所含的酪氨酸、色氨酸和半胱氨酸残基的数目来计算(S.C.Gill and P.H.von Hippel,Anal.Biochem.182,319-326(1989))。所述氨基酸的分子消光系统分别为1280、5690和120M-1·cm-1。从选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的蛋白质序列可以推断出本发明脂肪分解酶的酪氨酸、色氨酸和半胱氨酸残基数目。表2中总结了计算出的本发明脂肪分解酶的消光系数。
表2

可归于所述脂肪分解酶的所述超滤物在280nm的消光取决于酶样品的纯度。该纯度可以用高效尺寸排阻色谱(High Performance SizeExclusion Chromatography,HPSEC)和TSK SW-XL柱(300*7,8mm;MW范围为10-300kDa)来测定。洗脱缓冲液由25mM的磷酸钠缓冲液构成,pH为6.0,在1ml/min流速下使用。注射入5-100μl的样品。测量280nm处的吸收。
可归于本发明脂肪分解酶的超滤物A280是从色谱中各个脂肪分解酶在280nm处吸收峰的峰表面(surface)与280nm处吸收峰的总表面之比来获得的。然后通过将超滤物的A280与上述比率相乘,再除以针对每个脂肪分解酶计算得到的消光系数(1mg/ml溶液-表2中最右边一列),来计算出所述脂肪分解酶在超滤物中的浓度。
实施例3活性测量用实施例1中获得的无细胞上清液进行表3中所总结的脂肪酶检测、磷脂酶检测和半乳糖脂酶检测。
表3按照实施例1制备的无细胞上清液中的脂肪分解酶活性

0=与空白没有不同;+/++/+++=比空白要高;用2,3-巯基-1-丙醇三丁酸(2,3-mercapto-1-propanol-tributyrate,TBDMP)作为底物,对脂肪酶活性进行分光光度测定。脂肪酶会水解TBDMP的硫键从而释放出硫丁酸,所述硫丁酸随后再与4,4-二硫双吡啶(4,4-dithiodipyridine,DTDP)反应形成4-硫吡啶。后者是4-巯基吡啶的互变异构平衡体,其吸收334nm的光。所述反应在0.1M的乙酸缓冲液中于37℃下进行,所述缓冲液pH为5.0,其中含有0.2%的Triton-X100、0.65mM的TBDMP和0.2mM的DTDP。一个脂肪酶单位被定义为在上述反应条件下每分钟释放出1微摩尔4-硫丁酸的酶的量。
用1,2-二硫二辛酰磷脂酰胆碱(1,2-dithiodioctanoyl-phosphatidylcholine)作为底物,对磷脂酶A进行分光光度测定。磷脂酶A会水解1号位(PLA1)或2号位(PLA2)的硫键,从而释放出4-硫辛酸,所述4-硫辛酸随后与4,4’-二硫吡啶反应,形成4-硫吡啶。后者是4-巯基吡啶的互变异构平衡体,其吸收334nm处的光。所述反应在0.1M的乙酸缓冲液中于37℃下进行,所述缓冲液pH为4.0,其中含有0.2%的Triton-X100、0.65mM的底物和0.2mM的DTDP。一个磷脂酶A单位(phospholipase Aunit,PLA)被定义为在上述反应条件下每分钟释放出1微摩尔4-硫辛酸的酶的量。
用溶血磷脂酰胆碱作为底物,用31P-NMR分光法来测定溶血磷脂酶活性。溶血磷脂酶会水解酯键从而将脂肪酸从甘油部分中释放。用NMR来定量就此形成的甘油磷酸胆碱。所述反应在50mM的乙酸缓冲液中于55℃下进行30分钟,所述缓冲液pH为4.5,其中还含有1mg/ml的溶血磷脂酰胆碱和5mM的CaCl2。一个溶血磷脂酶单位(lysophospholipaseunit,LPC)被定义为在上述反应条件下每分钟形成1微摩尔4-甘油磷酸胆碱的酶的量。
用双半乳糖甘油二酯作为底物,用H-NMR分光法来测定半乳糖脂酶活性,所述测定按照Hirayama and Matsuda(1972)Agric.Biol.Chem.36,1831中所述的方法来进行。半乳糖脂酶会水解脂肪酸和甘油主链之间的酯键,因此释放出一个脂肪酸或全部两个脂肪酸。所述反应在50mM的乙酸缓冲液中于30℃下进行30分钟,所述缓冲液pH为4.5,其中还含有4mM的CaCl2、0.2%的Triton X-100和1mg/ml的双半乳糖甘油二酯(LipidProducts)。一个半乳糖脂酶单位被定义为在上述反应条件下每分钟形成1微摩尔脂肪酸的酶的量。
实施例2中获得的超滤物被用来进行FAU酶活测量。用PhadebasAmylase试验药片(Pharmacia)来测量真菌的alpha-淀粉酶活性。Phadebas药片中含有不溶于水的淀粉底物和蓝色颜料,所述颜料通过交联结合到底物上。所述底物被真菌淀粉酶水解,将被染色的可溶性麦芽糖糊精释放到溶液中。用含有对照真菌alpha淀粉酶活性的溶液来制备校正曲线。由对照和未知样品,用pH为5.5的50mM苹果酸缓冲液制备出适当的稀释物。在30℃下将5ml样品培养5分钟,加入Phadebas药片,15分钟后,加入1.0ml 0.5N的氢氧化钠使反应终止。使所述混合物自然冷却至室温,5分钟后加入4.0ml的水,用手对其进行摇晃,15分钟后,所述样品在4700rpm下离心10分钟。在620nm处测量上层的消光。所述的OD 620nm是对真菌alpha-淀粉酶活性的测量。一个真菌淀粉酶单位(fungal amylase unit,FAU)在本文中被定义为在上述反应条件下,每小时将1克淀粉(100%干物质)转化为一种产物的酶的量,所述产物在与已知浓度的碘溶液反应后具有620nm处的透射。
表4按照实施例2制备的超滤物中的蛋白质和FAU

除表4中提到的活性外,还存在较低的葡糖淀粉酶活性,然而其数量非常之低,因此这些酶不妨碍实施例4中描述的烘焙实验。
实施例4烘焙实验1-幼犬面包块(pup loave)幼面包块是用150克的面团块来烘焙的,所述面团块是通过混合200g面粉(KolibriTM/lbisTM,比例80/20)、1.4g干燥的面包酵母(Fermipan)、4g盐、3g糖、10mg抗坏血酸、116g水和2g脂肪来获得的。在擀面混合器中混合6分15秒之后,所述面团被分为若干150克的块,在30℃下发酵45分钟,对其进行冲压,再发酵25分钟,使其成型并在平锅中烹制(pan)。发酵进行于90%-100%的相对湿度下。30℃下最后发酵70分钟后,在225℃下对所述面团进行20分钟的烘焙。
将烘焙实验中不同脂肪分解酶的不同效果(表5和表6)与对照进行比较,所述对照中含有相同数量的真菌淀粉酶,所述淀粉酶是根据所述超滤物中的剂量(针对超滤物中的真菌淀粉酶活性,见表4)另行加入的。这是必须的,因为随脂肪分解酶加入的真菌淀粉酶的量特别影响块的体积,而非其它参数。加入了对照数量的真菌淀粉酶的面包体积被当作100%。
表5

通过面包体积测量仪(Bread Volume Measurer)BVM-3(RI CardsInstruments AB,Viken,Sweden)来测定块的体积。其测量原理基于传感器测量的超声反射,所述传感器处于旋转的面包周围。测量时间需要45秒。
面团粘度和延展性是由合格的烘焙师使用表5中所述的评分标准来评估的。对每个对象而言,测量了两块的平均值。
上述测试之后,面团块被弄成圆形,在30℃下进行45分钟的第一次发酵,然后对面团进行冲压,成型,在平锅中烹制,再在30℃下发酵75分钟。发酵期间的相对湿度设置在85%。
随后,通过气泡的出现、撕裂的侧面外皮和不规则弯曲的外皮表面来判断经过发酵的面团的稳定性。所述面团块在225℃下烘焙20分钟。通过BVM-3方法来测定块的体积表中的平均值来自从同一对象烘焙得到的2个面包。
碎屑结构是由合格的烘焙师用表5中描述的评分标准来判断的。将所述的面包块在室温于聚乙烯袋中贮藏三天,然后用Stevens TextureAnalyser来测量碎屑的牢固性。用所述的品质分析仪来分析来自每个面包块中央的两片2cm厚的面包片,使用的探测器直径为1.5英寸,压紧深度为5mm(25%),压紧速度为0.5mm/sec。表中展示的是两次测量的平均值。
外壳颜色是由合格的烘焙师按照表5中描述的评分标准来判断的。荷兰式烤模面包的标准食谱被用作对照。
碎屑颜色是由合格的烘焙师按照表5中描述的评分标准来判断的。对照面包的碎屑颜色被评定为正常(3)。两个对象的面包被用作正对照,所述对象是用与对照相同的成分加上0.5%的大豆粉制成的。发酵和烘焙工序都与没有大豆粉的对照相同。后者被评判为“非常好”。
所述面包的外伸顶部(overhanging top)是通过所述顶部相对烘焙模具的外伸(hanging)来判断的,所述顶部的边缘越低则评价越低。外伸越少,则评价越好。
面包的陈化是通过感受面包片的碎屑坚硬度来判断的。切片之前,面包在室温下于塑料袋中贮藏四天。所述面包片的碎屑越软,则评价越好。
表6本发明脂肪分解酶的烘焙表现


实施例5烘焙实验2-batard在被称为“batard”的法式面包中检测了本发明脂肪分解酶的烘焙表现。用标准烘焙方法对batard的制备是通过将大约20℃的3000g小麦粉、70g压榨酵母、60g盐、68ppm的抗坏血酸、30ppm的BakezymeHS2000(真菌的半纤维素酶)、7ppm的BakezymeP500(真菌的α-淀粉酶)和1680ml水(8-10℃)在螺旋式混合器(Diosna速度1下2分钟;速度2下100Wh输入)中混合来进行的。面团温度为27℃。所述面团的可加工性由烘焙师进行手工分析。将面团在发酵箱中进行15分钟的体积发酵(bulk proof),32℃,RH为90%。在此阶段结束时,对面团块进行成型和造型,并再在32℃和90%的RH下进行90分钟的最终发酵。沿面团块的长度对经过充分发酵的面团进行切割,并在烤箱中于240℃烘焙30分钟,并加入初始的蒸汽。冷却至室温后,通过BVM-方法(见实施例4)测定所述面包块的体积。
冷却至室温后,直接由合格的烘焙师用表7中的分数来分析所述面包的断性(break)、碎性(shred)和形状。经过室温下于密封箱中的16小时(过夜)贮藏后,由合格的烘焙师来评定碎屑的质量。针对所述面包的值(表8)获得自一个对象。
表7

表8本发明脂肪分解酶的烘焙表现

*以ppm表示,基于面粉重量和通过A280方法测定的酶的重量。
序列表<110>帝斯曼知识产权资产管理有限公司<120>新颖的脂肪酶及其用途<130>21078WO<160>39<170>PatentIn version 3.1<210>1<211>3728<212>DNA<213>黑曲霉(Aspergillus niger)<400>1cgggcaatta cgatccgagc gcgctatcta cgtgcaccgg aagcttgctc cttgatttgt60tgtttcataa tacttatttg tgctctttag cccgactgca gtggtggctg catgttgggc120aggtatttaa ctttgggcga taccaactac gcgtgcactt tgaagcatag cacggcgcgc180cggggatgcg tgtcgtctta tgactataat tgatgtggcc gactgactgc ttggtgttag240ggatcttgtg tttatcttgg ttttctgtac ttagaagaga gtgccggtgg catggtggtc300gatataacta gagcaatgcg tgtctccatc ctcatcctca tcggccatcc cttataccct360gatggcgccg aagggtgaga atggcgatgg gcgagaataa tatactgtgt atagtctgtc420ctatcctcct tgtgcactgc aaagtcagtt gatcatcatc cccactcaat cgtccactca480tgctctatat ccgagacaaa ccacaactta ttcaatttaa gcccgagtcc ataatcatcc540acaaccaccc cacagccagg gtacatccag ggtctctttc ccgccggaga aactaagccc600ttagctcctc actaggacct cccgccgcgt cttggctcct catcaccaac tttccaccta660taaactgcat caaacatgct gcaaagccac gactgctgct gcatgcaccc caacatcatc720cccgcataat acatccatcc ctgaagcaat caagcttgac tctgttgttt cttcggagat780gttaaccatt cgtactttcc aaatgacatc aatccaactg atagacatcg ccatcctcct840caataccatg gacgccccac gtccatgtca aaagtaagac tagctcagct cggcgttaat900caattatgat tgcgagtctc aatccctgag tcatgtgttc tctgtgtcgg agaattagac960tgaattcagc tgctcgttgc cactcctagc tccctgataa aggtcctcac ttcgtctcgt1020agctggctgg ctgcatattc tccggtgact aagttaacag aaccagcaac ttagtagcca1080tggcgagcgc actcctctgg ctctccctgc tgggtggcag caccctagcc tcaactctag1140acaccagtaa tacccctacc atcaagagag cagacgcagg aaacaacacc tcctcaatcc1200caacagccac cctcaacaac accgtcttca tcggccgttc cctgcccgag ttcgagcagg1260agttgttcct gggtatcaag tttgctgatg agcccgtgcg attcaccccg tcgacgttga1320aaaccgtcta tcgcgccaat gacagcgaca acggggtgta tcatgcttcc acagcatccg1380gactgcagac ttcctcgggg accgtgctct acaacgccac agagtatggg tatgattgcc1440ccgggtatgg atccgatgag acggagctgg cggaggaagg atatgcgcgg ttcgatgaga1500
actgtatgaa cctgaatata attcggccca agagagagaa agaggatgag ttgttgcctg1560tgatgatttg gatctttggt ggtggttggg tgcagggtgc gactgctgat ccgaggtagg1620atactatagt tttgtgctgt gctgtgtggg gttgatgctg acgatgtgca aggtacaata1680tgagctatat tgttcgccag ggtgcgttga atgataagcc tgtcttgggt gtctcgatca1740attaccgtgt ggctgcgttt ggattccttg actctgtcga ggttatggtg cgtttcttcc1800ttcaccgtca agtatatggg tttcagctga catgacatct gtaggaatcc ggcaacacga1860acctaggact tcgtgatcag cgcgtcgcca tgcattgggt caaacaaaac atcaaggcgt1920ttggtggtga cccggacaag atcaccatct ggggagaatc agcgtgagat tataccctaa1980tagcattcga tatacagcgc ctgacatggc acagtggtgc ctacagcgtc ggagcccacc2040tggtcaccaa cgacggtgac aacgagggtc tattcagagc cggtatgcac accactcccc2100aattctcgtc tcctcatctg ctaaccagca tagccatcat ggaatccggc aacgcagtcg2160gaccccccta caacggcacg gactggtacc agccgatgta cgaccagatc gtgaacgcaa2220ccaagtatgt cctcaccttc cccaaaagac aatactcaaa tgactagtat atatactaac2280tacatgaaag ctgcaccacc tcaagcaaca cccttcaatg cctccgcgaa gtccccttct2340caacgatcta caccgccgca gacatcggcc tggaatggtt cgccaccatc gacggcacct2400tcatcaaaga atatccccaa atcagcatta cggagggccg cttcgccaag gtccccatcc2460tccatggcac caacaccgac gagggcgtga gtttcggtac gacgggcgtg aacactgatg2520ccgaagcgat ccagcagttg atgggtgagc cccccccccc cccccttccc accaatcccc2580aagatatata tatagtacga gatactaagg tgaaatgaaa atgatagcat ccaaacgctg2640ggtcctaaac gaaacccaag ccacgaccct cctatcgcac tatcccaaca tctccgccct2700aggctgtccc tacggatggg gcaacacgac ctggccgaag ctggggtatg aatataagcg2760ctacgagtcg atggcgggcg atctgtgcat ggttgctccg aggaggttgc tcagtcagaa2820gatgaaggag tatgaggagc aagtgtttgc gtatcggtgg gatgtcgctg cgttgaatga2880ttcgagtacg attggggtgg cgcattttgc tgaggtaatg ccatccatcc atcccctatt2940attggttttc cctgcggtat gatatttggt atgctaatga tgtgttactg cgtgcatgca3000tagatcccgt ttgttttcgc caaccctgtg cagaacatca ctccgttggg aagtgatccc3060gcaagactgg agttgggtaa tctggccgcg aggatgtgga cggcttttgt gacggatttg3120gatccgaatg ggcatggtgg tacgttcctc ttctccatct tattagaatt gtgaaatgaa3180gcgtgtggtt ctaatgaggg tgacagtctc tggtatcccc cactggccga aatacaacct3240cactgatccg agggactttg tgttccggct accgagggat ggaagttatg tggagaagga3300tacttttagg acggggggga ttgattatat taatacaatt gtgcggtaag ttgctgctaa3360gtagtactac tatatgtata taggagggtg tgggtgaaaa gtagatagta gtactatatc3420aaggatggtt agatactata tactatttac tactactgta atgttactat aatcaagact3480agaagaaagt ctactgattg attacttcga ctgatcgatt gtattgatct agttagtata3540tcaaatcgac aaagagccgc cgtttttatt cattcatatt tcccgccact aagccagtat3600actataccat agtagtatag ctggtttagt tgatgccgag cagctcaacc tcgctaattg3660atatcagcat tccaatccat tttttcactg gcaaagaata ttagaagagg aaggaggagg3720aggataac 3728<210>2<211>1749<212>DNA<213>黑曲霉(Aspergillus niger)
<220>
<221>CDS<222>(1)..(1749)<400>2atg gcg agc gca ctc ctc tgg ctc tcc ctg ctg ggt ggc agc acc cta48Met Ala Ser Ala Leu Leu Trp Leu Ser Leu Leu Gly Gly Ser Thr Leu1 5 10 15gcc tca act cta gac acc agt aat acc cct acc atc aag aga gca gac96Ala Ser Thr Leu Asp Thr Ser Asn Thr Pro Thr Ile Lys Arg Ala Asp20 25 30gca gga aac aac acc tcc tca atc cca aca gcc acc ctc aac aac acc144Ala Gly Asn Asn Thr Ser Ser Ile Pro Thr Ala Thr Leu Asn Asn Thr35 40 45gtc ttc atc ggc cgt tcc ctg ccc gag ttc gag cag gag ttg ttc ctg192Val Phe Ile Gly Arg Ser Leu Pro Glu Phe Glu Gln Glu Leu Phe Leu50 55 60ggt atc aag ttt gct gat gag ccc gtg cga ttc acc ccg tcg acg ttg240Gly Ile Lys Phe Ala Asp Glu Pro Val Arg Phe Thr Pro Ser Thr Leu65 70 75 80aaa acc gtc tat cgc gcc aat gac agc gac aac ggg gtg tat cat gct288Lys Thr Val Tyr Arg Ala Asn Asp Ser Asp Asn Gly Val Tyr His Ala85 90 95tcc aca gca tcc gga ctg cag act tcc tcg ggg acc gtg ctc tac aac336Ser Thr Ala Ser Gly Leu Gln Thr Ser Ser Gly Thr Val Leu Tyr Asn100 105 110gcc aca gag tat ggg tat gat tgc ccc ggg tat gga tcc gat gag acg384Ala Thr Glu Tyr Gly Tyr Asp Cys Pro Gly Tyr Gly Ser Asp Glu Thr115 120 125gag ctg gcg gag gaa gga tat gcg cgg ttc gat gag aac tgt atg aac432Glu Leu Ala Glu Glu Gly Tyr Ala Arg Phe Asp Glu Asn Cys Met Asn130 135 140ctg aat ata att cgg ccc aag aga gag aaa gag gat gag ttg ttg cct480Leu Asn Ile Ile Arg Pro Lys Arg Glu Lys Glu Asp Glu Leu Leu Pro145 150 155 160gtg atg att tgg atc ttt ggt ggt ggt tgg gtg cag ggt gcg act gct528Val Met Ile Trp Ile Phe Gly Gly Gly Trp Val Gln Gly Ala Thr Ala165 170 175gat ccg agg tac aat atg agc tat att gtt cgc cag ggt gcg ttg aat576Asp Pro Arg Tyr Asn Met Ser Tyr Ile Val Arg Gln Gly Ala Leu Asn180 185 190gat aag cct gtc ttg ggt gtc tcg atc aat tac cgt gtg gct gcg ttt624Asp Lys Pro Val Leu Gly Val Ser Ile Asn Tyr Arg Val Ala Ala Phe
195 200 205gga ttc ctt gac tct gtc gag gtt atg gaa tcc ggc aac acg aac cta672Gly Phe Leu Asp Ser Val Glu Val Met Glu Ser Gly Asn Thr Asn Leu210 215 220gga ctt cgt gat cag cgc gtc gcc atg cat tgg gtc aaa caa aac atc720Gly Leu Arg Asp Gln Arg Val Ala Met His Trp Val Lys Gln Asn Ile225 230 235 240aag gcg ttt ggt ggt gac ccg gac aag atc acc atc tgg gga gaa tca768Lys Ala Phe Gly Gly Asp Pro Asp Lys Ile Thr Ile Trp Gly Glu Ser245 250 255gct ggt gcc tac agc gtc gga gcc cac ctg gtc acc aac gac ggt gac816Ala Gly Ala Tyr Ser Val Gly Ala His Leu Val Thr Asn Asp Gly Asp260 265 270aac gag ggt cta ttc aga gcc gcc atc atg gaa tcc ggc aac gca gtc864Asn Glu Gly Leu Phe Arg Ala Ala Ile Met Glu Ser Gly Asn Ala Val275 280 285gga ccc ccc tac aac ggc acg gac tgg tac cag ccg atg tac gac cag912Gly Pro Pro Tyr Asn Gly Thr Asp Trp Tyr Gln Pro Met Tyr Asp Gln290 295 300atc gtg aac gca acc aac tgc acc acc tca agc aac acc ctt caa tgc960Ile Val Asn Ala Thr Asn Cys Thr Thr Ser Ser Asn Thr Leu Gln Cys305 310 315 320ctc cgc gaa gtc ccc ttc tca acg atc tac acc gcc gca gac atc ggc1008Leu Arg Glu Val Pro Phe Ser Thr Ile Tyr Thr Ala Ala Asp Ile Gly325 330 335ctg gaa tgg ttc gcc acc atc gac ggc acc ttc atc aaa gaa tat ccc1056Leu Glu Trp Phe Ala Thr Ile Asp Gly Thr Phe Ile Lys Glu Tyr Pro340 345 350caa atc agc att acg gag ggc cgc ttc gcc aag gtc ccc atc ctc cat1104Gln Ile Ser Ile Thr Glu Gly Arg Phe Ala Lys Val Pro Ile Leu His355 360 365ggc acc aac acc gac gag ggc gtg agt ttc ggt acg acg ggc gtg aac1152Gly Thr Asn Thr Asp Glu Gly Val Ser Phe Gly Thr Thr Gly Val Asn370 375 380act gat gcc gaa gcg atc cag cag ttg atg gca tcc aaa cgc tgg gtc1200Thr Asp Ala Glu Ala Ile Gln Gln Leu Met Ala Ser Lys Arg Trp Val385 390 395 400cta aac gaa acc caa gcc acg acc ctc cta tcg cac tat ccc aac atc1248Leu Asn Glu Thr Gln Ala Thr Thr Leu Leu Ser His Tyr Pro Asn Ile405 410 415tcc gcc cta ggc tgt ccc tac gga tgg ggc aac acg acc tgg ccg aag1296Ser Ala Leu Gly Cys Pro Tyr Gly Trp Gly Asn Thr Thr Trp Pro Lys420 425 430ctg ggg tat gaa tat aag cgc tac gag tcg atg gcg ggc gat ctg tgc1344
Leu Gly Tyr Glu Tyr Lys Arg Tyr Glu Ser Met Ala Gly Asp Leu Cys435 440 445atg gtt gct ccg agg agg ttg ctc agt cag aag atg aag gag tat gag1392Met Val Ala Pro Arg Arg Leu Leu Ser Gln Lys Met Lys Glu Tyr Glu450 455 460gag caa gtg ttt gcg tat cgg tgg gat gtc gct gcg ttg aat gat tcg1440Glu Gln Val Phe Ala Tyr Arg Trp Asp Val Ala Ala Leu Asn Asp Ser465 470 475 480agt acg att ggg gtg gcg cat ttt gct gag atc ccg ttt gtt ttc gcc1488Ser Thr Ile Gly Val Ala His Phe Ala Glu Ile Pro Phe Val Phe Ala485 490 495aac cct gtg cag aac atc act ccg ttg gga agt gat ccc gca aga ctg1536Asn Pro Val Gln Asn Ile Thr Pro Leu Gly Ser Asp Pro Ala Arg Leu500 505 510gag ttg ggt aat ctg gcc gcg agg atg tgg acg gct ttt gtg acg gat1584Glu Leu Gly Asn Leu Ala Ala Arg Met Trp Thr Ala Phe Val Thr Asp515 520 525ttg gat ccg aat ggg cat ggt gtc tct ggt atc ccc cac tgg ccg aaa1632Leu Asp Pro Asn Gly His Gly Val Ser Gly Ile Pro His Trp Pro Lys530 535 540tac aac ctc act gat ccg agg gac ttt gtg ttc cgg cta ccg agg gat1680Tyr Asn Leu Thr Asp Pro Arg Asp Phe Val Phe Arg Leu Pro Arg Asp545 550 555 560gga agt tat gtg gag aag gat act ttt agg acg ggg ggg att gat tat1728Gly Ser Tyr Val Glu Lys Asp Thr Phe Arg Thr Gly Gly Ile Asp Tyr565 570 575att aat aca att gtg cgg taa1749Ile Asn Thr Ile Val Arg580<210>3<211>582<212>PRT<213>黑曲霉(Aspergillus niger)<400>3Met Ala Ser Ala Leu Leu Trp Leu Ser Leu Leu Gly Gly Ser Thr Leu1 5 10 15Ala Ser Thr Leu Asp Thr Ser Asn Thr Pro Thr Ile Lys Arg Ala Asp20 25 30Ala Gly Asn Asn Thr Ser Ser Ile Pro Thr Ala Thr Leu Asn Asn Thr35 40 45Val Phe Ile Gly Arg Ser Leu Pro Glu Phe Glu Gln Glu Leu Phe Leu
50 55 60Gly Ile Lys Phe Ala Asp Glu Pro Val Arg Phe Thr Pro Ser Thr Leu65 70 75 80Lys Thr Val Tyr Arg Ala Asn Asp Ser Asp Asn Gly Val Tyr His Ala85 90 95Ser Thr Ala Ser Gly Leu Gln Thr Ser Ser Gly Thr Val Leu Tyr Asn100 105 110Ala Thr Glu Tyr Gly Tyr Asp Cys Pro Gly Tyr Gly Ser Asp Glu Thr115 120 125Glu Leu Ala Glu Glu Gly Tyr Ala Arg Phe Asp Glu Asn Cys Met Asn130 135 140Leu Asn Ile Ile Arg Pro Lys Arg Glu Lys Glu Asp Glu Leu Leu Pro145 150 155 160Val Met Ile Trp Ile Phe Gly Gly Gly Trp Val Gln Gly Ala Thr Ala165 170 175Asp Pro Arg Tyr Asn Met Ser Tyr Ile Val Arg Gln Gly Ala Leu Asn180 185 190Asp Lys Pro Val Leu Gly Val Ser Ile Asn Tyr Arg Val Ala Ala Phe195 200 205Gly Phe Leu Asp Ser Val Glu Val Met Glu Ser Gly Asn Th rAsn Leu210 215 220Gly Leu Arg Asp Gln Arg Val Ala Met His Trp Val Lys Gln Asn Ile225 230 235 240Lys Ala Phe Gly Gly Asp Pro Asp Lys Ile Thr Ile Trp Gly Glu Ser245 250 255Ala Gly Ala Tyr Ser Val Gly Ala His Leu Val Thr Asn Asp Gly Asp260 265 270Asn Glu Gly Leu Phe Arg Ala Ala Ile Met Glu Ser Gly Asn Ala Val275 280 285Gly Pro Pro Tyr Asn Gly Thr Asp Trp Tyr Gln Pro Met Tyr Asp Gln290 295 300Ile Val Asn Ala Thr Asn Cys Thr Thr Ser Ser Asn Thr Leu Gln Cys305 310 315 320Leu Arg Glu Val Pro Phe Ser Thr Ile Tyr Thr Ala Ala Asp Ile Gly325 330 335Leu Glu Trp Phe Ala Thr Ile Asp Gly Thr Phe Ile Lys Glu Tyr Pro340 345 350Gln Ile Ser Ile Thr Glu Gly Arg Phe Ala Lys Val Pro Ile Leu His355 360 365Gly Thr Asn Thr Asp Glu Gly Val Ser Phe Gly Thr Thr Gly Val Asn370 375 380Thr Asp Ala Glu Ala Ile Gln Gln Leu Met Ala Ser Lys Arg Trp Val385 390 395 400Leu Asn Glu Thr Gln Ala Thr Thr Leu Leu Ser His Tyr Pro Asn Ile
405 410 415Ser Ala Leu Gly Cys Pro Tyr Gly Trp Gly Asn Thr Thr Trp Pro Lys420 425 430Leu Gly Tyr Glu Tyr Lys Arg Tyr Glu Ser Met Ala Gly Asp Leu Cys435 440 445Met Val Ala Pro Arg Arg Leu Leu Ser Gln Lys Met Lys Glu Tyr Glu450 455 460Glu Gln Val Phe Ala Tyr Arg Trp Asp Val Ala Ala Leu Asn Asp Ser465 470 475 480Ser Thr Ile Gly Val Ala His Phe Ala Glu Ile Pro Phe Val Phe Ala485 490 495Asn Pro Val Gln Asn Ile Thr Pro Leu Gly Ser Asp Pro Ala Arg Leu500 505 510Glu Leu Gly Ash Leu Ala Ala Arg Met Trp Thr Ala Phe Val Thr Asp515 520 525Leu Asp Pro Asn Gly His Gly Val Ser Gly Ile Pro His Trp Pro Lys530 535 540Tyr Asn Leu Thr Asp Pro Arg Asp Phe Val Phe Arg Leu Pro Arg Asp545 550 555 560Gly Ser Tyr Val Glu Lys Asp Thr Phe Arg Thr Gly Gly Ile Asp Tyr565 570 575Ile Asn Thr Ile Val Arg580<210>4<211>3853<212>DNA<213>黑曲霉(Aspergillus niger)<400>4ctttcctgtt gcccggtctt tgttgttgtc ataggataca attacccaga caacgttcgg60tttgtcgatc agttttaagt gtgcgtggac tgacagccaa ggccactggg gcccctgcct120ctatcattta attccacacg ctcgcctctg cagctctggc accagcgttg caaattccag180gggtcagcct acgtggcatt aggctctaag agaatctgag ggaaaggatt tcacttagaa240aaatttatcg gtccggcttg tccgatcggt aggaaggcat tgcttcccct catatgcggc300cccggttccc aagcagctga ttcgggacgt tttccggctt gatcgctata ctctcataat360ctctcctgca agagctggat aaacttggtt tcttatcttc cgtggggatg ccatagtcca420gtagacgctg tctcgaaatt gagtagcacc actatttacg ggcaagttaa tggcacatgt480attagctttg tactgacggt tgaaatgtgg agcaatttcc ggctatgtac cggatctgtt540ccggatatct tcatcgcaat tagttagtac ataaaactcc ctagtcacgc aagaacggtt600cgaacataac gaattaaaaa ttctcattct ctggcaaggc ttcgaaatgt ttgtttcctc660gcttgctcta ttagcactta ttgctccttt gatcgcaatt gcggtaaaaa tagaacagcc720aggaataaat ccaaatccca cagctactgt acgaaatggc acctactatg gtctccataa780
ccagcactat aatcaagacc tctttctcgg tattccatat gcacagcaac ctattggtga840ccttcgcttg cggaccccac gatcaatgaa cacctcctgg ccagtaccaa gaaatgcaac900agaatattca cccgcatgtg ttggatttaa tcagacagag ggtgcttccg aagcctgcct960tactctcaat gtcgtccgcc cggcaagcat cgctctttct gaaagtcttc ccgttgctgg1020tcagtatata ccccaaatct gatcagaagg gccagaactg actttgcgct cggccccagt1080ctggattcat ggcgggggat tcacctccgg ctcttcatca gagaaacaat acaatctgtc1140cttcatcgtt gatcagtcag tccaaatgga aaagcccgtt atcgcagtca gtctaaatta1200tcgtcttcaa tgctggggtt ttatgtggag caaggagatg aaggaagccg gagtagggaa1260cctgggactt agagaccaac gattagctct gcattggata caagaaagta ggtatctcga1320tagtgaagct cttccaagta cggatctgac catgacttag acattgctgc gtttggtgga1380gaccctgctc aggttacaat ttggggtgaa agtgccggcg ctaatagtgt tggcacacat1440ctggttgctt acggagggcg cgatgatggt atattccgtg cagctatcag tgaaagtggt1500gccccaagtg tttaccaacg ttatccaaca cctgctgaat ggcagcccta ttatgatggt1560attgtgaatg catcaggctg cagttcagca acggatactt tggcttgtct ccgaacaatt1620ccaactaaca tattgcatgg catctttgac aacacgtcta ttgtacccat gcacgctatt1680tcaggcctca gcggagcaaa attcattcct gtcatagatg acgacttcat taaagagagt1740gccacggttc agctccagaa gggcaacttc gtcaaagttc cctacttgat tggagctaac1800gccgacgaag ggactgcatt tgctgtggag ggagtcaaca cagatgctga gtttcgcgag1860ctagtcaaag gttggggcct caacaacgct accacggata tcttggaggc cctataccca1920gacattcctc agataggaat ccccgccata atggttggaa ggccaccgtc cggatatgga1980aatcaataca agcgtgtggc cgcatttcag ggtgatgtta acatccatgc cgcacgtagg2040ttgaccagtc agatctggtc atcccgcaat atctcagtat atagctacat gtttgacgtt2100atcagccctg gatatggccc ctctgctggt tcctatgctg gggctactca tggtactgat2160attccgtacg ttttctataa tctggatggc ctggggtatg actcgaacaa caagtccata2220gaaagcatac ctaacagtta ttcccgcatg agcaaaatta tgtcaagaat gtgggtcagt2280tttgtgacaa cattggaccc aaatcattct ggaggtatgg tcccacatcc cattcctatg2340attgcgcaat gtcagacccg agctgaatca actatcttct taggaactaa tgttcagtgg2400ccgccataca atatcgataa tccggagata atctttttcg ataccgatgt cacgaacctc2460acatatgtga gttctgacgt ttaccgtgcg gagggcataa aatacatcag tgatcacctt2520gcaagtgatt tcgggcactg agatcacata tcttctcggt ctaattttag aatgactgtg2580gtctcatcta accagacttg gcccgcaggt ctttacgccc actggtggta attgatgcaa2640cccccaagct atatagtgtc tggggctttg aactactgtc aatgagcgaa aattgactat2700ttccctttat gactcatgta gtagcatttg tgctggcact gtgatcaaga tatgtttttc2760gagattaccg gtagcagagt agtcgatgtc gccaatatta ttcatctata atgaatagta2820ataacttagg agtcattcag tatagtcgat actgacataa gtatcttttc ttgtgatatt2880tataatatgt cccgtttggc cttgtttgta gtaactctca tagcctgctg cttgagaact2940catctgttca atcatagaga taccaattat ggaaggatag gttggcatcg gtgtttgttt3000catcaagact actacctaat aagtcactga agaaggctgt agactgaaag cgcgacattg3060atgattagaa ttccaacttt ggtcaacata tgcattagac tataaaaggg acatgttaga3120agaactaagt acatacgacc atagggtgtg gaaaacaggg cttcccgtcc gctcagccgt3180acttaagcca cacgccggga ggttagtagt tgggtgggtg accaccagcg aatcccttct3240gttgtatgtt tttgtttctc tataaaactt ttggtcgggc atctcgagat gtcttccagg3300atgctaaaac cttcgggttc ctcacagcgg agatggtgtc aactggcttt tttaatgcat3360tcttggctaa agtgctcgtg aacacggcaa tatagtacga tgatatctga agtttgtggt3420
gtcaagacat atgcttattg tgaccaccag accataaatc ggagtattca cagcttatat3480catcctcaaa cattgattgc atagtagagt gtctaactct tgactcaagg gattgaaaat3540gattatttga aaatataggt agttttgaat aacattctgg cacacgagct ttagctggat3600tagtaagatg tgacgccgat tttgggtttg attatgtcat catttggcag ttcccccaga3660ggacagcccg gttaagaacg aaccttttct gagcccgtat acaaatgcgg ggaacagaga3720tgaggagatg ccgaagcatg ctttggcaaa cagaagccac tgtgaaaaac cattcacaga3780tatcttgtga tagttggatt gcactgactg tccgcgaaag cgagcatatc tatcccgtat3840actgagaact agt 3853<210>5<211>1743<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1743)<400>5atg ttt gtt tcc tcg ctt gct cta tta gca ctt att gct cct ttg atc48Met Phe Val Ser Ser Leu Ala Leu Leu Ala Leu Ile Ala Pro Leu Ile1 5 10 15gca att gcg gta aaa ata gaa cag cca gga ata aat cca aat ccc aca96Ala Ile Ala Val Lys Ile Glu Gln Pro Gly Ile Asn Pro Asn Pro Thr20 25 30gct act gta cga aat ggc acc tac tat ggt ctc cat aac cag cac tat144Ala Thr Val Arg Ash Gly Thr Tyr Tyr Gly Leu His Asn Gln His Tyr35 40 45aat caa gac ctc ttt ctc ggt att cca tat gca cag caa cct att ggt192Asn Gln Asp Leu Phe Leu Gly Ile Pro Tyr Ala Gln Gln Pro Ile Gly50 55 60gac ctt cgc ttg cgg acc cca cga tca atg aac acc tcc tgg cca gta240Asp Leu Arg Leu Arg Thr Pro Arg Ser Met Asn Thr Ser Trp Pro Val65 70 75 80cca aga aat gca aca gaa tat tca ccc gca tgt gtt gga ttt aat cag288Pro Arg Asn Ala Thr Glu Tyr Ser Pro Ala Cys Val Gly Phe Asn Gln85 90 95aca gag ggt gct tcc gaa gcc tgc ctt act ctc aat gtc gtc cgc ccg336Thr Glu Gly Ala Ser Glu Ala Cys Leu Thr Leu Asn Val Val Arg Pro100 105 110gca agc atc gct ctt tct gaa agt ctt ccc gtt gct gtc tgg att cat384Ala Ser Ile Ala Leu Ser Glu Ser Leu Pro Val Ala Val Trp Ile His115 120 125
ggc ggg gga ttc acc tcc ggc tct tca tca gag aaa caa tac aat ctg432Gly Gly Gly Phe Thr Ser Gly Ser Ser Ser Glu Lys Gln Tyr Ash Leu130 135 140tcc ttc atc gtt gat cag tca gtc caa atg gaa aag ccc gtt atc gca480Ser Phe Ile Val Asp Gln Ser Val Gln Met Glu Lys Pro Val Ile Ala145 150 155 160gtc agt cta aat tat cgt ctt caa tgc tgg ggt ttt atg tgg agc aag528Val Ser Leu Asn Tyr Arg Leu Gln Cys Trp Gly Phe Met Trp Ser Lys165 170 175gag atg aag gaa gcc gga gta ggg aac ctg gga ctt aga gac caa cga576Glu Met Lys Glu Ala Gly Val Gly Asn Leu Gly Leu Arg Asp Gln Arg180 185 190tta gct ctg cat tgg ata caa gaa aac att gct gcg ttt ggt gga gac624Leu Ala Leu His Trp Ile Gln Glu Asn Ile Ala Ala Phe Gly Gly Asp195 200 205cct gct cag gtt aca att tgg ggt gaa agt gcc ggc gct aat agt gtt672Pro Ala Gln Val Thr Ile Trp Gly Glu Ser Ala Gly Ala Asn Ser Val210 215 220ggc aca cat ctg gtt gct tac gga ggg cgc gat gat ggt ata ttc cgt720Gly Thr His Leu Val Ala Tyr Gly Gly Arg Asp Asp Gly Ile Phe Arg225 230 235 240gca gct atc agt gaa agt ggt gcc cca agt gtt tac caa cgt tat cca768Ala Ala Ile Ser Glu Ser Gly Ala Pro Ser Val Tyr Gln Arg Tyr Pro245 250 255aca cct gct gaa tgg cag ccc tat tat gat ggt att gtg aat gca tca816Thr Pro Ala Glu Trp Gln Pro Tyr Tyr Asp Gly Ile Val Asn Ala Ser260 265 270ggc tgc agt tca gca acg gat act ttg gct tgt ctc cga aca att cca864Gly Cys Ser Ser Ala Thr Asp Thr Leu Ala Cys Leu Arg Thr Ile Pro275 280 285act aac ata ttg cat ggc atc ttt gac aac acg tct att gta ccc atg912Thr Asn Ile Leu His Gly Ile Phe Asp Asn Thr Ser Ile Val Pro Met290 295 300cac gct att tca ggc ctc agc gga gca aaa ttc att cct gtc ata gat960His Ala Ile Ser Gly Leu Ser Gly Ala Lys Phe Ile Pro Val Ile Asp305 310 315 320gac gac ttc att aaa gag agt gcc acg gtt cag ctc cag aag ggc aac1008Asp Asp Phe Ile Lys Glu Ser Ala Thr Val Gln Leu Gln Lys Gly Asn325 330 335ttc gtc aaa gtt ccc tac ttg att gga gct aac gcc gac gaa ggg act1056Phe Val Lys Val Pro Tyr Leu Ile Gly Ala Asn Ala Asp Glu Gly Thr340 345 350gca ttt gct gtg gag gga gtc aac aca gat gct gag ttt cgc gag cta1104Ala Phe Ala Val Glu Gly Val Asn Thr Asp Ala Glu Phe Arg Glu Leu
355 360 365gtc aaa ggt tgg ggc ctc aac aac gct acc acg gat atc ttg gag gcc1152Val Lys Gly Trp Gly Leu Asn Asn Ala Thr Thr Asp Ile Leu Glu Ala370 375 380cta tac cca gac att cct cag ata gga atc ccc gcc ata atg gtt gga1200Leu Tyr Pro Asp Ile Pro Gln Ile Gly Ile Pro Ala Ile Met Val Gly385 390 395 400agg cca ccg tcc gga tat gga aat caa tac aag cgt gtg gcc gca ttt1248Arg Pro Pro Ser Gly Tyr Gly Asn Gln Tyr Lys Arg Val Ala Ala Phe405 410 415cag ggt gat gtt aac atc cat gcc gca cgt agg ttg acc agt cag atc1296Gln Gly Asp Val Asn Ile His Ala Ala Arg Arg Leu Thr Ser Gln Ile420 425 430tgg tca tcc cgc aat atc tca gta tat age tac atg ttt gac gtt atc1344Trp Ser Ser Arg Asn Ile Ser Val Tyr Ser Tyr Met Phe Asp Val Ile435 440 445agc cct gga tat ggc ccc tct gct ggt tcc tat gct ggg gct act cat1392Ser Pro Gly Tyr Gly Pro Ser Ala Gly Ser Tyr Ala Gly Ala Thr His450 455 460ggt act gat att ccg tac gtt ttc tat aat ctg gat ggc ctg ggg tat1440Gly Thr Asp Ile Pro Tyr Val Phe Tyr Asn Leu Asp Gly Leu Gly Tyr465 470 475 480gac tcg aac aac aag tcc ata gaa agc ata cct aac agt tat tcc cgc1488Asp Ser Asn Asn Lys Ser Ile Glu Ser Ile Pro Asn Ser Tyr Ser Arg485 490 495atg agc aaa att atg tca aga atg tgg gtc agt ttt gtg aca aca ttg1536Met Ser Lys Ile Met Ser Arg Met Trp Val Ser Phe Val Thr Thr Leu500 505 510gac cca aat cat tct gga ggt atg gtc cca cat ccc att cct atg att1584Asp Pro Asn His Ser Gly Gly Met Val Pro His Pro Ile Pro Met Ile515 520 525gcg caa tgt cag acc cga gct gaa tca act atc ttc tta gga act aat1632Ala Gln Cys Gln Thr Arg Ala Glu Ser Thr Ile Phe Leu Gly Thr Asn530 535 540gtt cag tgg ccg cca tac aat atc gat aat ccg gag ata atc ttt ttc1680Val Gln Trp Pro Pro Tyr Asn Ile Asp Asn Pro Glu Ile Ile Phe Phe545 550 555 560gat acc gat gtc acg aac ctc aca tat act tgg ccc gca ggt ctt tac1728Asp Thr Asp Val Thr Asn Leu Thr Tyr Thr Trp Pro Ala Gly Leu Tyr565 570 575gcc cac tgg tgg taa1743Ala His Trp Trp580
<400>23atg ctg aat gca cgc tcc att gct ctg gcc tcg ttg cca gtt ctt ctc48Met Leu Asn Ala Arg Ser Ile Ala Leu Ala Ser Leu Pro Val Leu Leu1 5 10 15cta cta ttc gcc cag caa ctt gcc tct cac cca acc gag cag att caa96Leu Leu Phe Ala Gln Gln Leu Ala Ser His Pro Thr Glu Gln Ile Gln20 25 30gcc att ctg gct ccg tgg gtc ccg gcc gca cta caa gat gtc gtg ctc144Ala Ile Leu Ala Pro Trp Val Pro Ala Ala Leu Gln Asp Val Val Leu35 40 45tat aat cga cct cgc gtc ata atc ccc cag ggc act gtc gtc ggc acg192Tyr Asn Arg Pro Arg Val Ile Ile Pro Gln Gly Thr Val Val Gly Thr50 55 60acc ttg aca gac acg ctc aag tcc ccg gta gat gct ttc cga gga att240Thr Leu Thr Asp Thr Leu Lys Ser Pro Val Asp Ala Phe Arg Gly Ile65 70 75 80cca tac gca ttg cct cca att ggg gat aga cgg ttt cgc cgt gcg gag288Pro Tyr Ala Leu Pro Pro Ile Gly Asp Arg Arg Phe Arg Arg Ala Glu85 90 95gct gtc cat gcg acg gac gag att atc gat gct agt gaa ttc ggc cca336Ala Val His Ala Thr Asp Glu Ile Ile Asp Ala Ser Glu Phe Gly Pro100 105 110agg tgc cct gga aag cag ctc ttg aat cca aat gac ata ggt ggt gat384Arg Cys Pro Gly Lys Gln Leu Leu Asn Pro Asn Asp Ile Gly Gly Asp115 120 125gaa gac tgt ctc aca gtc aat gtc ttc cgg cct cat ggc gct cag gga432Glu Asp Cys Leu Thr Val Asn Val Phe Arg Pro His Gly Ala Gln Gly130 135 140aaa ctc cct gtc gct gta tac gtg cac ggc gga gcc tac aat cgc ggc480Lys Leu Pro Val Ala Val Tyr Val His Gly Gly Ala Tyr Asn Arg Gly145 150 155 160act gct aaa tat cca gcc tcc gga cac aac acg gcc tcg atg gtc ggc528Thr Ala Lys Tyr Pro Ala Ser Gly His Asn Thr Ala Ser Met Val Gly165 170 175tgg tcg gac gag ccc ttc gtt gca gtc agc ttc aac tac cgc atc ggc576Trp Ser Asp Glu Pro Phe Val Ala Val Ser Phe Asn Tyr Arg Ile Gly180 185 190gcc ctc ggc ttc ctc cca tcc acc cta acc gcc aaa gaa gga atc ctc624Ala Leu Gly Phe Leu Pro Ser Thr Leu Thr Ala Lys Glu Gly Ile Leu195 200 205aac cta ggc ctc cat gac cag atc ctc ctg ctg caa tgg gtc caa gaa672Ash Leu Gly Leu His Asp Gln Ile Leu Leu Leu Gln Trp Val Gln Glu210 215 220aac atc gca cat ttc aac ggc gac cca acc caa gtc act cta atc ggc720
290 295 300His Ala Ile Ser Gly Leu Ser Gly Ala Lys Phe Ile Pro Val Ile Asp305 310 315 320Asp Asp Phe Ile Lys Glu Ser Ala Thr Val Gln Leu Gln Lys Gly Asn325 330 335Phe Val Lys Val Pro Tyr Leu Ile Gly Ala Asn Ala Asp Glu Gly Thr340 345 350Ala Phe Ala Val Glu Gly Val Asn Thr Asp Ala Glu Phe Arg Glu Leu355 360 365Val Lys Gly Trp Gly Leu Asn Asn Ala Thr Thr Asp Ile Leu Glu Ala370 375 380Leu Tyr Pro Asp Ile Pro Gln Ile Gly Ile Pro Ala Ile Met Val Gly385 390 395 400Arg Pro Pro Ser Gly Tyr Gly Asn Gln Tyr Lys Arg Val Ala Ala Phe405 410 415Gln Gly Asp Val Asn Ile His Ala Ala Arg Arg Leu Thr Ser Gln Ile420 425 430Trp Ser Ser Arg Asn Ile Ser Val Tyr Ser Tyr Met Phe Asp Val Ile435 440 445Ser Pro Gly Tyr Gly Pro Ser Ala Gly Ser Tyr Ala Gly Ala Thr His450 455 460Gly Thr Asp Ile Pro Tyr Val Phe Tyr Asn Leu Asp Gly Leu Gly Tyr465 470 475 480Asp Ser Asn Asn Lys Ser Ile Glu Ser Ile Pro Asn Ser Tyr Ser Arg485 490 495Met Ser Lys Ile Met Ser Arg Met Trp Val Ser Phe Val Thr Thr Leu500 505 510Asp Pro Asn His Ser Gly Gly Met Val Pro His Pro Ile Pro Met Ile515 520 525Ala Gln Cys Gln Thr Arg Ala Glu Ser Thr Ile Phe Leu Gly Thr Asn530 535 540Val Gln Trp Pro Pro Tyr Asn Ile Asp Asn Pro Glu Ile Ile Phe Phe545 550 555 560Asp Thr Asp Val Thr Asn Leu Thr Tyr Thr Trp Pro Ala Gly Leu Tyr565 570 575Ala His Trp Trp580<210>7<211>2769<212>DNA<213>黑曲霉(Aspergillus niger)
<400>7gtgaacaatg attagacttg gagaacgtgg tctccgattg gaagtggact atctatttaa60tagtattgcc aaggctttct gatcggcaaa catattgtcc tcccgtggtg actggtttct120cgcctgatgt gaatagtgat tatcaattta tacccttcgt cagcactgat tgaataagaa180cttacctcac attgccctca tttctatgct ggaaccatgc acctattttt aagccatccg240gccgatctta ctcacggtat gggctgactt tgtatcacaa cccatacctg tcgaccgtct300aaagtggggt cagtgacaag catgatgccg gtcagcatca tcagctcaac aaattctagc360caacaacgga gatcagtggt ccgacatttg atgtagaatt aaacccgcac acgtcggaat420ggcttcattc tcggtcttag tttcccaatc gaagctggtt cagcgcccag acgcggagcg480tgggggtggg accccggatt ttcccccaca accttggctg tggttggcac tttttcatta540gcctccatcc tgtgcgcaga tactagagaa ctctacatca tgccatcgag gtttgttagt600tagatttgtt aactagctga gcggtgtagg tgcatgccgt acggtgagtt tgtctatctt660ttgtatagcc ggaagccgaa ggtaccccgc gtcatggcta tataaggctt gtatatccca720tgctctggta gatgggacaa caagaacggc gatccgatag aatcatggtg cagggtgtgg780cttttggact gctcgggctg gctgcctctg ctttgggcac ttatgcgccc tactacgcga840atttgacatg ggagcaacca cggactctgt ccaactggtc caaccttacc gtcgagacac900ggacagggac gttcattggt atgctcaatg acacttaccc agacgttcga cagtttctgc960gagttcctta tgccaaggta attctctcgc tgtacacatg tcatactgtg tctgacatga1020ccagcctcct attggggatt taagatggct tcctcctcat cggcttgaca actcaagcag1080aacatatgac tccaccttct atggcccagg taagtagtct tccatacaac tatgagcagt1140tccaattaac ccgagttcag cctgtccgca gtatgttcca gcagagagcg atttttggaa1200tgaatatgaa ccggagaatt tgctgctcaa tgtcggcgaa aggctcaacc agggctctac1260ggcatggtcc tcgtcagagg attgcctgtc cctagcggta tggactccat cgtatgctaa1320tgagacatcc aagctgccag ttgcgctgtt tgtcacggga ggtggtggca tcacaggggg1380tatcaacatt ccgtcccagc tgccctctgc ttgggtatct cgctctcagg agcatatcgt1440tgttaccatc aattaccgcg tcaatatttt tggcagtaag tatttgctct atatttgcaa1500atattagcct gacatgtata gatcccaaat cgcgtgcgtt gaatgatacg tcgcttacgc1560tgatggacgt gcgcgctgct gtggagtggg tatatgagaa cattgaagcg ttcggtggta1620atcccgaaaa tattatggtc agactacaag tttcctctca catgactaga gctaacagta1680agcagctatg gggacagtca caaggtgctt tgctgacgca tctgtacacc ctcgcatggc1740cagaagagcc tcttgccgcc aagttcggcg tcatctccca aggagcatct gccacactca1800acctctctac cacgcccgat gtgtaccaag actttgacat cgtggccaag ggactaggct1860gcaattatgg tgatgatgcc gaggccgagc tggagtgcat gcgtgggatt tcctgggtgc1920agatcgagga gtatatcaac cgctacaata gctctccttc tattgctttc acgaactata1980ttcgtatgta cccatcttgc tcttttaact gcccctacta acaatatcag ccgatgagaa2040atacatcttc tccgacgaaa gacagcgtta ccttgagcgg aaggttgccc gaggcccgtc2100aattcgatct gacacggcgc gagaattccc tagcacaaac acgacctcag taaatattga2160agaaggcgaa tcagactgtc tggcagtgac tgaccttgcg ctacgtgcgt ccattgggct2220cgagacctat cgctactact gggctggtat gtccaatgac tttccatact gaagatagtg2280ctaacataaa caggcaactt ctccaatatc agtcccgtac cgtggctagg agcattccac2340tggaccgacc tgctgatgat cttcggtacg tataatctgg acgtcggcga gatctcgcag2400ttggaagtcg acacctctgc cacgatgcaa gattatctac tcgcctttct gaaggactca2460tcaaccgtca gcgagacggt cggatggccg ttatatctgg gcaacgagac caacggagga2520ctcatcctgg agttcggtaa cggcacagca gtgcggacca tcacaggtga ctggctcgac2580
gcgggatgtt tcaattcatc tatcccattc agaatctggg ggtagcctat acacaccatc2640atcagagtag tatatacatc atatccacaa atccatctcc acctatatac ataaacccca2700actgaatcta caacagcgcc tggtccttct tcccctcccc ctctttaatt tccctcgcct2760tctccccat2769<210>8<211>1623<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1623)<400>8atg gtg cag ggt gtg gct ttt gga ctg ctc ggg ctg gct gcc tct gct48Met Val Gln Gly Val Ala Phe Gly Leu Leu Gly Leu Ala Ala Ser Ala1 5 10 15ttg ggc act tat gcg ccc tac tac gcg aat ttg aca tgg gag caa cca96Leu Gly Thr Tyr Ala Pro Tyr Tyr Ala Asn Leu Thr Trp Glu Gln Pro20 25 30cgg act ctg tcc aac tgg tcc aac ctt acc gtc gag aca cgg aca ggg144Arg Thr Leu Ser Asn Trp Ser Asn Leu Thr Val Glu Thr Arg Thr Gly35 40 45acg ttc att ggt atg ctc aat gac act tac cca gac gtt cga cag ttt192Thr Phe Ile Gly Met Leu Asn Asp Thr Tyr Pro Asp Val Arg Gln Phe50 55 60ctg cga gtt cct tat gcc aag cct cct att ggg gat tta aga tgg ctt240Leu Arg Val Pro Tyr Ala Lys Pro Pro Ile Gly Asp Leu Arg Trp Leu65 70 75 80cct cct cat cgg ctt gac aac tca agc aga aca tat gac tcc acc ttc288Pro Pro His Arg Leu Asp Asn Ser Ser Arg Thr Tyr Asp Ser Thr Phe85 90 95tat ggc cca gcc tgt ccg cag tat gtt cca gca gag agc gat ttt tgg336Tyr Gly Pro Ala Cys Pro Gln Tyr Val Pro Ala Glu Ser Asp Phe Trp100 105 110aat gaa tat gaa ccg gag aat ttg ctg ctc aat gtc ggc gaa agg ctc384Asn Glu Tyr Glu Pro Glu Asn Leu Leu Leu Asn Val Gly Glu Arg Leu115 120 125aac cag ggc tct acg gca tgg tcc tcg tca gag gat tgc ctg tcc cta432Asn Gln Gly Ser Thr Ala Trp Ser Ser Ser Glu Asp Cys Leu Ser Leu130 135 140gcg gta tgg act cca tcg tat gct aat gag aca tcc aag ctg cca gtt480
Ala Val Trp Thr Pro Ser Tyr Ala Asn Glu Thr Ser Lys Leu Pro Val145 150 155 160gcg ctg ttt gtc acg gga ggt ggt ggc atc aca ggg ggt atc aac att528Ala Leu Phe Val Thr Gly Gly Gly Gly Ile Thr Gly Gly Ile Asn Ile165 170 175ccg tcc cag ctg ccc tct gct tgg gta tct cgc tct cag gag cat atc576Pro Ser Gln Leu Pro Ser Ala Trp Val Ser Arg Ser Gln Glu His Ile180 185 190gtt gtt acc atc aat tac cgc gtc aat att ttt ggc aat ccc aaa tcg624Val Val Thr Ile Asn Tyr Arg Val Asn Ile Phe Gly Asn Pro Lys Ser195 200 205cgt gcg ttg aat gat acg tcg ctt acg ctg atg gac gtg cgc gct gct672Arg Ala Leu Asn Asp Thr Ser Leu Thr Leu Met Asp Val Arg Ala Ala210 215 220gtg gag tgg gta tat gag aac att gaa gcg ttc ggt ggt aat ccc gaa720Val Glu Trp Val Tyr Glu Asn Ile Glu Ala Phe Gly Gly Asn Pro Glu225 230 235 240aat att atg gtc aga cta caa gtt tcc tct cac atg act aga gct aac768Asn Ile Met Val Arg Leu Gln Val Ser Ser His Met Thr Arg Ala Asn245 250 255agt aag cag cta tgg gga cag tca caa ggt gct ttg ctg acg cat ctg816Ser Lys Gln Leu Trp Gly Gln Ser Gln Gly Ala Leu Leu Thr His Leu260 265 270tac acc ctc gca tgg cca gaa gag cct ctt gcc gcc aag ttc ggc gtc864Tyr Thr Leu Ala Trp Pro Glu Glu Pro Leu Ala Ala Lys Phe Gly Val275 280 285atc tcc caa gga gca tct gcc aca ctc aac ctc tct acc acg ccc gat912Ile Ser Gln Gly Ala Ser Ala Thr Leu Asn Leu Ser Thr Thr Pro Asp290 295 300gtg tac caa gac ttt gac atc gtg gcc aag gga cta ggc tgc aat tat960Val Tyr Gln Asp Phe Asp Ile Val Ala Lys Gly Leu Gly Cys Asn Tyr305 310 315 320ggt gat gat gcc gag gcc gag ctg gag tgc atg cgt ggg att tcc tgg1008Gly Asp Asp Ala Glu Ala Glu Leu Glu Cys Met Arg Gly Ile Ser Trp325 330 335gtg cag atc gag gag tat atc aac cgc tac aat agc tct cct tct att1056Val Gln Ile Glu Glu Tyr Ile Asn Arg Tyr Asn Ser Ser Pro Ser Ile340 345 350gct ttc acg aac tat att ccc gat gag aaa tac atc ttc tcc gac gaa1104Ala Phe Thr Asn Tyr Ile Pro Asp Glu Lys Tyr Ile Phe Ser Asp Glu355 360 365aga cag cgt tac ctt gag cgg aag gtt gcc cga ggc ccg tca att cga1152Arg Gln Arg Tyr Leu Glu Arg Lys Val Ala Arg Gly Pro Ser Ile Arg370 375 380
tct gac acg gcg cga gaa ttc cct agc aca aac acg acc tca gta aat1200Ser Asp Thr Ala Arg Glu Phe Pro Ser Thr Asn Thr Thr Ser Val Asn385 390 395 400att gaa gaa ggc gaa tca gac tgt ctg gca gtg act gac ctt gcg cta1248Ile Glu Glu Gly Glu Ser Asp Cys Leu Ala Val Thr Asp Leu Ala Leu405 410 415cgt gcg tcc att ggg ctc gag acc tat cgc tac tac tgg gct ggc aac1296Arg Ala Ser Ile Gly Leu Glu Thr Tyr Arg Tyr Tyr Trp Ala Gly Asn420 425 430ttc tcc aat atc agt ccc gta ccg tgg cta gga gca ttc cac tgg acc1344Phe Ser Asn Ile Ser Pro Val Pro Trp Leu Gly Ala Phe His Trp Thr435 440 445gac ctg ctg atg atc ttc ggt acg tat aat ctg gac gtc ggc gag atc1392Asp Leu Leu Met Ile Phe Gly Thr Tyr Asn Leu Asp Val Gly Glu Ile450 455 460tcg cag ttg gaa gtc gac acc tct gcc acg atg caa gat tat cta ctc1440Ser Gln Leu Glu Val Asp Thr Ser Ala Thr Met Gln Asp Tyr Leu Leu465 470 475 480gcc ttt ctg aag gac tca tca acc gtc agc gag acg gtc gga tgg ccg1488Ala Phe Leu Lys Asp Ser Ser Thr Val Ser Glu Thr Val Gly Trp Pro485 490 495tta tat ctg ggc aac gag acc aac gga gga ctc atc ctg gag ttc ggt1536Leu Tyr Leu Gly Asn Glu Thr Asn Gly Gly Leu Ile Leu Glu Phe Gly500 505 510aac ggc aca gca gtg cgg acc atc aca ggt gac tgg ctc gac gcg gga1584Asn Gly Thr Ala Val Arg Thr Ile Thr Gly Asp Trp Leu Asp Ala Gly515 520 525tgt ttc aat tca tct atc cca ttc aga atc tgg ggg tag1623Cys Phe Asn Ser Ser Ile Pro Phe Arg Ile Trp Gly530 535 540<210>9<211>540<212>PRT<213>黑曲霉(Aspergillus niger)<400>9Met Val Gln Gly Val Ala Phe Gly Leu Leu Gly Leu Ala Ala Ser Ala1 5 10 15Leu Gly Thr Tyr Ala Pro Tyr Tyr Ala Asn Leu Thr Trp Glu Gln Pro20 25 30Arg Thr Leu Ser Asn Trp Ser Asn Leu Thr Val Glu Thr Arg Thr Gly35 40 45
Thr Phe Ile Gly Met Leu Asn Asp Thr Tyr Pro Asp Val Arg Gln Phe50 55 60Leu Arg Val Pro Tyr Ala Lys Pro Pro Ile Gly Asp Leu Arg Trp Leu65 70 75 80Pro Pro His Arg Leu Asp Asn Ser Ser Arg Thr Tyr Asp Ser Thr Phe85 90 95Tyr Gly Pro Ala Cys Pro Gln Tyr Val Pro Ala Glu Ser Asp Phe Trp100 105 110Asn Glu Tyr Glu Pro Glu Asn Leu Leu Leu Asn Val Gly Glu Arg Leu115 120 125Asn Gln Gly Ser Thr Ala Trp Ser Ser Ser Glu Asp Cys Leu Ser Leu130 135 140Ala Val Trp Thr Pro Ser Tyr Ala Asn Glu Thr Ser Lys Leu Pro Val145 150 155 160Ala Leu Phe Val Thr Gly Gly Gly Gly Ile Thr Gly Gly Ile Asn Ile165 170 175Pro Ser Gln Leu Pro Ser Ala Trp Val Ser Arg Ser Gln Glu His Ile180 185 190Val Val Thr Ile Asn Tyr Arg Val Asn Ile Phe Gly Asn Pro Lys Ser195 200 205Arg Ala Leu Asn Asp Thr Ser Leu Thr Leu Met Asp Val Arg Ala Ala210 215 220Val Glu Trp Val Tyr Glu Asn Ile Glu Ala Phe Gly Gly Asn Pro Glu225 230 235 240Asn Ile Met Val Arg Leu Gln Val Ser Ser His Met Thr Arg Ala Asn245 250 255Ser Lys Gln Leu Trp Gly Gln Ser Gln Gly Ala Leu Leu Thr His Leu260 265 270Tyr Thr Leu Ala Trp Pro Glu Glu Pro Leu Ala Ala Lys Phe Gly Val275 280 285Ile Ser Gln Gly Ala Ser Ala Thr Leu Asn Leu Ser Thr Thr Pro Asp290 295 300Val Tyr Gln Asp Phe Asp Ile Val Ala Lys Gly Leu Gly Cys Asn Tyr305 310 315 320Gly Asp Asp Ala Glu Ala Glu Leu Glu Cys Met Arg Gly Ile Ser Trp325 330 335Val Gln Ile Glu Glu Tyr Ile Asn Arg Tyr Asn Ser Ser Pro Ser Ile340 345 350Ala Phe Thr Asn Tyr Ile Pro Asp Glu Lys Tyr Ile Phe Ser Asp Glu355 360 365Arg Gln Arg Tyr Leu Glu Arg Lys Val Ala Arg Gly Pro Ser Ile Arg370 375 380Ser Asp Thr Ala Arg Glu Phe Pro Ser Thr Asn Thr Thr Ser Val Asn385 390 395 400
Ile Glu Glu Gly Glu Ser Asp Cys Leu Ala Val Thr Asp Leu Ala Leu405 410 415Arg Ala Ser Ile Gly Leu Glu Thr Tyr Arg Tyr Tyr Trp Ala Gly Asn420 425 430Phe Ser Ash Ile Ser Pro Val Pro Trp Leu Gly Ala Phe His Trp Thr435 440 445Asp Leu Leu Met Ile Phe Gly Thr Tyr Ash Leu Asp Val Gly Glu Ile450 455 460Ser Gln Leu Glu Val Asp Thr Ser Ala Thr Met Gln Asp Tyr Leu Leu465 470 475 480Ala Phe Leu Lys Asp Ser Ser Thr Val Ser Glu Thr Val Gly Trp Pro485 490 495Leu Tyr Leu Gly Asn Glu Thr Asn Gly Gly Leu Ile Leu Glu Phe Gly500 505 510Asn Gly Thr Ala Val Arg Thr Ile Thr Gly Asp Trp Leu Asp Ala Gly515 520 525Cys Phe Asn Ser Ser Ile Pro Phe Arg Ile Trp Gly530 535 540<210>10<211>3235<212>DNA<213>黑曲霉(Aspergillus niger)<400>10gttttcaatt tggactgaat tttggcggca tttcttgtat aaaattaaaa ggggcgttga60ctggattttg gtacttggga tttattctta gctttgactg tacatagttt gggcgtggtt120tgatagccga cgatcggccg acccacgaac cagatttgca tatgattaca ttccttcaat180tttggtccga gtcccaaccc gcctttcaac cccaacaact acaagcacgt tgtgtttgct240acattgactc actcgatatt gctgaaccat gcaggccgcc caactgagtt attacaccaa300gcatgcgaat cggaaagttc gacaaagcgg gtgaaatgtc cgagttggcg aaccaaagcg360caacggtcga ggctcctttc cccgcagagg cagccattct gcagcctttg aactgcgggg420gaaacggcat ttgatcaact cggcactgat gcagtgacca acaggatgtt agcaatgttg480gcctaatata ttcttactga tctgctgata cgtccctccc ttgcatcagc ctcggtttgc540gcatgagaac gggttcgaac gttcctgggc cacccggttg gcgtgatatt ctccgcccac600gctgtctgtc cccctgatgg gaaaccttcg gatcagcgat catcaggcca gttggctatg660agaatagggg ctttgctgtc ttgatgccta aaatgcaggt ctcatagcaa gatccacagc720cgaggaggca catggcgatg tcgaaaccca tgggagctga tttttcggtt ctcggatcgt780gctccaagac atagaaggat attgagcact tgaaacgaag gggtgaaaaa tggaactgta840tatagagtta ctcccagccc gatccgagag cctatgaccc atagcggtac agatcatggc900catcatgaag gccctccttt ggctctccct ttccctcgcc gtctgggcga ctccagttca960acgggatgca gctcctactg tcactattgc gcatccatcg gccaccgtca ttggaaaatc1020tggcaatgtc gagagcttca acaatattcc ctttgcgcag gcccccacag gctcgctgcg1080
tctgaagccc ccacaaccct tggaaactgc cctcggcact gttcaggcca caggagcctc1140gcaatcgtgt ccgcagatgt acttcaccac ggatgagagc gaattcccga catcggtcat1200tggcctcctc gctgatctcc ctttggtaca gtcggctacc aatgctctcg aggattgcct1260gaacattgac attcggcgtc cggccgggac caccgcggac tcgaagctgc ctgtgctggt1320ctggatcttt ggcggaggct ttgaacttgg ttcaaaggcg atgtatgatg gtacaacgat1380ggtatcatcg tcgatagaca agaacatgcc tatcgtgttt gtagcaatga attatcgcgt1440gggaggtttc gggttcttgc ccggaaagga gatcctggag gacgggtccg cgaacctagg1500gctcctggac caacgccttg ccctgcagtg ggttgccgac aacatcgagg cctttggtgg1560agacccggac aaggtgacga tttggggaga atcagcagga gccatttccg tttttgatca1620gatgatcttg tacgacggaa acatcactta caaggataag cccttgttcc ggggggccat1680catggactcc ggtagtgttg ttcccgcaga ccccgtcgat ggggtcaagg gacagcaagt1740atatgatgcg gtagtggaat ctgcaggctg ttcctcttct aacgacaccc tagcttgtct1800gcgtgaacta gactacaccg acttcctcaa tgcggcaaac tccgtgccag gcattttaag1860ctaccattct gtggcgttat catatgtgcc tcgaccggac gggacggcgt tgtcggcatc1920accggacgtt ttgggcaaag cagggaaata tgctcgggtc ccgttcatcg tgggcgacca1980agaggatgag gggaccttat tcgccttgtt tcagtccaac attacgacga tcgacgaggt2040ggtcgactac ctggcctcat acttcttcta tgacgctagc cgagagcagc ttgaagaact2100agtggccctg tacccagaca ccaccacgta cgggtctccg ttcaggacag gcgcggccaa2160caactggtat ccgcaattta agcgattggc cgccattctc ggcgacttgg tcttcaccat2220tacccggcgg gcattcctct cgtatgcaga ggaaatctcc cctgatcttc cgaactggtc2280gtacctggcg acctatgact atggcacccc agttctgggg accttccacg gaagtgacct2340gctgcaggtg ttctatggga tcaagccaaa ctatgcagct agttctagcc acacgtacta2400tctgagcttt gtgtatacgc tggatccgaa ctccaaccgg ggggagtaca ttgagtggcc2460gcagtggaag gaatcgcggc agttgatgaa tttcggagcg aacgacgcca gtctccttac2520ggatgatttc cgcaacggga catatgagtt catcctgcag aataccgcgg cgttccacat2580ctgatgccat tggcggaggg gtccggacgg tcaggaactt agccttatga gatgaatgat2640ggacgtgtct ggcctcggaa aaggatatat ggggatcatg atagtactag ccatattaat2700gaagggcata taccacgcgt tggacctgcg ttatagcttc ccgttagtta tagtaccatc2760gttataccag ccaatcaagt caccacgcac gaccggggac ggcgaatccc cgggaattga2820aagaaattgc atcccaggcc agtgaggcca gcgattggcc acctctccaa ggcacagggc2880cattctgcag cgctggtgga ttcatcgcaa tttcccccgg cccggcccga caccgctata2940ggctggttct cccacaccat cggagattcg tcgcctaatg tctcgtccgt tcacaagctg3000aagagcttga agtggcgaga tgtctctgca ggaattcaag ctagatgcta agcgatattg3060catggcaata tgtgttgatg catgtgcttc ttccttcagc ttcccctcgt gcagatgagg3120tttggctata aattgaagtg gttggtcggg gttccgtgag gggctgaagt gcttcctccc3180ttttagacgc aactgagagc ctgagcttca tccccagcat cattacacct cagca 3235<210>11<211>1689<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1689)<400>11atg gcc atc atg aag gcc ctc ctt tgg ctc tcc ctt tcc ctc gcc gtc48Met Ala Ile Met Lys Ala Leu Leu Trp Leu Ser Leu Ser Leu Ala Val1 5 10 15tgg gcg act cca gtt caa cgg gat gca gct cct act gtc act att gcg96Trp Ala Thr Pro Val Gln Arg Asp Ala Ala Pro Thr Val Thr Ile Ala20 25 30cat cca tcg gcc acc gtc att gga aaa tct ggc aat gtc gag agc ttc144His Pro Ser Ala Thr Val Ile Gly Lys Ser Gly Asn Val Glu Ser Phe35 40 45aac aat att ccc ttt gcg cag gcc ccc aca ggc tcg ctg cgt ctg aag192Asn Asn Ile Pro Phe Ala Gln Ala Pro Thr Gly Ser Leu Arg Leu Lys50 55 60ccc cca caa ccc ttg gaa act gcc ctc ggc act gtt cag gcc aca gga240Pro Pro Gln Pro Leu Glu Thr Ala Leu Gly Thr Val Gln Ala Thr Gly65 70 75 80gcc tcg caa tcg tgt ccg cag atg tac ttc acc acg gat gag agc gaa288Ala Ser Gln Ser Cys Pro Gln Met Tyr Phe Thr Thr Asp Glu Ser Glu85 90 95ttc ccg aca tcg gtc att ggc ctc ctc gct gat ctc cct ttg gta cag336Phe Pro Thr Ser Val Ile Gly Leu Leu Ala Asp Leu Pro Leu Val Gln100 105 110tcg gct acc aat gct ctc gag gat tgc ctg aac att gac att cgg cgt384Ser Ala Thr Asn Ala Leu Glu Asp Cys Leu Asn Ile Asp Ile Arg Arg115 120 125ccg gcc ggg acc acc gcg gac tcg aag ctg cct gtg ctg gtc tgg atc432Pro Ala Gly Thr Thr Ala Asp Ser Lys Leu Pro Val Leu Val Trp Ile130 135 140ttt ggc gga ggc ttt gaa ctt ggt tca aag gcg atg tat gat ggt aca480Phe Gly Gly Gly Phe Glu Leu Gly Ser Lys Ala Met Tyr Asp Gly Thr145 150 155 160acg atg gta tca tcg tcg ata gac aag aac atg cct atc gtg ttt gta528Thr Met Val Ser Ser Ser Ile Asp Lys Asn Met Pro Ile Val Phe Val165 170 175gca atg aat tat cgc gtg gga ggt ttc ggg ttc ttg ccc gga aag gag576Ala Met Asn Tyr Arg Val Gly Gly Phe Gly Phe Leu Pro Gly Lys Glu180 185 190atc ctg gag gac ggg tcc gcg aac cta ggg ctc ctg gac caa cgc ctt624Ile Leu Glu Asp Gly Ser Ala Asn Leu Gly Leu Leu Asp Gln Arg Leu195 200 205gcc ctg cag tgg gtt gcc gac aac atc gag gcc ttt ggt gga gac ccg672
Ala Leu Gln Trp Val Ala Asp Asn Ile Glu Ala Phe Gly Gly Asp Pro210 215 220gac aag gtg acg att tgg gga gaa tca gca gga gcc att tcc gtt ttt720Asp Lys Val Thr Ile Trp Gly Glu Ser Ala Gly Ala Ile Ser Val Phe225 230 235 240gat cag atg atc ttg tac gac gga aac atc act tac aag gat aag ccc768Asp Gln Met Ile Leu Tyr Asp Gly Asn Ile Thr Tyr Lys Asp Lys Pro245 250 255ttg ttc cgg ggg gcc atc atg gac tcc ggt agt gtt gtt ccc gca gac816Leu Phe Arg Gly Ala Ile Met Asp Ser Gly Ser Val Val Pro Ala Asp260 265 270ccc gtc gat ggg gtc aag gga cag caa gta tat gat gcg gta gtg gaa864Pro Val Asp Gly Val Lys Gly Gln Gln Val Tyr Asp Ala Val Val Glu275 280 285tct gca ggc tgt tcc tct tct aac gac acc cta gct tgt ctg cgt gaa912Ser Ala Gly Cys Ser Ser Ser Asn Asp Thr Leu Ala Cys Leu Arg Glu290 295 300cta gac tac acc gac ttc ctc aat gcg gca aac tcc gtg cca ggc att960Leu Asp Tyr Thr Asp Phe Leu Asn Ala Ala Asn Ser Val Pro Gly Ile305 310 315 320tta agc tac cat tct gtg gcg tta tca tat gtg cct cga ccg gac ggg1008Leu Ser Tyr His Ser Val Ala Leu Ser Tyr Val Pro Arg Pro Asp Gly325 330 335acg gcg ttg tcg gca tca ccg gac gtt ttg ggc aaa gca ggg aaa tat1056Thr Ala Leu Ser Ala Ser Pro Asp Val Leu Gly Lys Ala Gly Lys Tyr340 345 350gct cgg gtc ccg ttc atc gtg ggc gac caa gag gat gag ggg acc tta1104Ala Arg Val Pro Phe Ile Val Gly Asp Gln Glu Asp Glu Gly Thr Leu355 360 365ttc gcc ttg ttt cag tcc aac att acg acg atc gac gag gtg gtc gac1152Phe Ala Leu Phe Gln Ser Asn Ile Thr Thr Ile Asp Glu Val Val Asp370 375 380tac ctg gcc tca tac ttc ttc tat gac gct agc cga gag cag ctt gaa1200Tyr Leu Ala Ser Tyr Phe Phe Tyr Asp Ala Ser Arg Glu Gln Leu Glu385 390 395 400gaa cta gtg gcc ctg tac cca gac acc acc acg tac ggg tct ccg ttc1248Glu Leu Val Ala Leu Tyr Pro Asp Thr Thr Thr Tyr Gly Ser Pro Phe405 410 415agg aca ggc gcg gcc aac aac tgg tat ccg caa ttt aag cga ttg gcc1296Arg Thr Gly Ala Ala Asn Asn Trp Tyr Pro Gln Phe Lys Arg Leu Ala420 425 430gcc att ctc ggc gac ttg gtc ttc acc att acc cgg cgg gca ttc ctc1344Ala Ile Leu Gly Asp Leu Val Phe Thr Ile Thr Arg Arg Ala Phe Leu435 440 445
tcg tat gca gag gaa atc tcc cct gat ctt ccg aac tgg tcg tac ctg1392Ser Tyr Ala Glu Glu Ile Ser Pro Asp Leu Pro Asn Trp Ser Tyr Leu450 455 460gcg acc tat gac tat ggc acc cca gtt ctg ggg acc ttc cac gga agt1440Ala Thr Tyr Asp Tyr Gly Thr Pro Val Leu Gly Thr Phe His Gly Ser465 470 475 480gac ctg ctg cag gtg ttc tat ggg atc aag cca aac tat gca gct agt1488Asp Leu Leu Gln Val Phe Tyr Gly Ile Lys Pro Asn Tyr Ala Ala Ser485 490 495tct agc cac acg tac tat ctg agc ttt gtg tat acg ctg gat ccg aac1536Ser Ser His Thr Tyr Tyr Leu Ser Phe Val Tyr Th rLeu Asp Pro Asn500 505 510tcc aac cgg ggg gag tac att gag tgg ccg cag tgg aag gaa tcg cgg1584Ser Asn Arg Gly Glu Tyr Ile Glu Trp Pro Gln Trp Lys Glu Ser Arg515 520 525cag ttg atg aat ttc gga gcg aac gac gcc agt ctc ctt acg gat gat1632Gln Leu Met Asn Phe Gly Ala Asn Asp Ala Ser Leu Leu Thr Asp Asp530 535 540ttc cgc aac ggg aca tat gag ttc atc ctg cag aat acc gcg gcg ttc1680Phe Arg Asn Gly Thr Tyr Glu Phe Ile Leu Gln Asn Thr Ala Ala Phe545 550 555 560cac atc tga1689His Ile<210>12<211>562<212>PRT<213>黑曲霉(Aspergillus niger)<400>12Met Ala Ile Met Lys Ala Leu Leu Trp Leu Ser Leu Ser Leu Ala Val1 5 10 15Trp Ala Thr Pro Val Gln Arg Asp Ala Ala Pro Thr Val Thr Ile Ala20 25 30His Pro Ser Ala Thr Val Ile Gly Lys Ser Gly Asn Val Glu Ser Phe35 40 45Asn Asn Ile Pro Phe Ala Gln Ala Pro Thr Gly Ser Leu Arg Leu Lys50 55 60Pro Pro Gln Pro Leu Glu Thr Ala Leu Gly Thr Val Gln Ala Thr Gly65 70 75 80Ala Ser Gln Ser Cys Pro Gln Met Tyr Phe Thr Thr Asp Glu Ser Glu85 90 95Phe Pro Thr Ser Val Ile Gly Leu Leu Ala Asp Leu Pro Leu Val Gln
100 105 110Ser Ala Thr Asn Ala Leu Glu Asp Cys Leu Asn Ile Asp Ile Arg Arg115 120 125Pro Ala Gly Thr Thr Ala Asp Ser Lys Leu Pro Val Leu Val Trp Ile130 135 140Phe Gly Gly Gly Phe Glu Leu Gly Ser Lys Ala Met Tyr Asp Gly Thr145 150 155 160Thr Met Val Ser Ser Ser Ile Asp Lys Asn Met Pro Ile Val Phe Val165 170 175Ala Met Asn Tyr Arg Val Gly Gly Phe Gly Phe Leu Pro Gly Lys Glu180 185 190Ile Leu Glu Asp Gly Ser Ala Asn Leu Gly Leu Leu Asp Gln Arg Leu195 200 205Ala Leu Gln Trp Val Ala Asp Asn Ile Glu Ala Phe Gly Gly Asp Pro210 215 220Asp Lys Val Thr Ile Trp Gly Glu Ser Ala Gly Ala Ile Ser Val Phe225 230 235 240Asp Gln Met Ile Leu Tyr Asp Gly Asn Ile Th rTyr Lys Asp Lys Pro245 250 255Leu Phe Arg Gly Ala Ile Met Asp Ser Gly Ser Val Val Pro Ala Asp260 265 270Pro Val Asp Gly Val Lys Gly Gln Gln Val Tyr Asp Ala Val Val Glu275 280 285Ser Ala Gly Cys Ser Ser Ser Asn Asp Thr Leu Ala Cys Leu Arg Glu290 295 300Leu Asp Tyr Thr Asp Phe Leu Asn Ala Ala Asn Ser Val Pro Gly Ile305 310 315 320Leu Ser Tyr His Ser Val Ala Leu Ser Tyr Val Pro Arg Pro Asp Gly325 330 335Thr Ala Leu Ser Ala Ser Pro Asp Val Leu Gly Lys Ala Gly Lys Tyr340 345 350Ala Arg Val Pro Phe Ile Val Gly Asp Gln Glu Asp Glu Gly Thr Leu355 360 365Phe Ala Leu Phe Gln Ser Asn Ile Thr Thr Ile Asp Glu Val Val Asp370 375 380Tyr Leu Ala Ser Tyr Phe Phe Tyr Asp Ala Ser Arg Glu Gln Leu Glu385 390 395 400Glu Leu Val Ala Leu Tyr Pro Asp Thr Thr Thr Tyr Gly Ser Pro Phe405 410 415Arg Thr Gly Ala Ala Asn Asn Trp Tyr Pro Gln Phe Lys Arg Leu Ala420 425 430Ala Ile Leu Gly Asp Leu Val Phe Thr Ile Thr Arg Arg Ala Phe Leu435 440 445Ser Tyr Ala Glu Glu Ile Ser Pro Asp Leu Pro Asn Trp Ser Tyr Leu
450 455 460Ala Thr Tyr Asp Tyr Gly Thr Pro Val Leu Gly Thr Phe His Gly Ser465 470 475 480Asp Leu Leu Gln Val Phe Tyr Gly Ile Lys Pro Asn Tyr Ala Ala Ser485 490 495Ser Ser His Thr Tyr Tyr Leu Ser Phe Val Tyr Thr Leu Asp Pro Asn500 505 510Ser Asn Arg Gly Glu Tyr Ile Glu Trp Pro Gln Trp Lys Glu Ser Arg515 520 525Gln Leu Met Asn Phe Gly Ala Asn Asp Ala Ser Leu Leu Thr Asp Asp530 535 540Phe Arg Asn Gly Thr Tyr Glu Phe Ile Leu Gln Asn Thr Ala Ala Phe545 550 555 560His Ile<210>13<211>2097<212>DNA<213>黑曲霉(Aspergillus niger)<400>13cctggctgac gctataccga agacgatgtc gatgtcgtct ttgctcagag gccccgagtc60gtttggggca cgtcaagaaa gtagtcttcg ctgctgcttg aagacatgat caggacacgc120ggttcgacct tcgagtgtac atgatatccg tagaatttgc ttgtgactac caaggcatat180gttagttcgt gcagtggtaa aagcggcttc tcttcttcaa tctgcgaggt ggagatgcct240actatgatcg tcatccaact tggtgtctac aagacgaaca caagcttagt tccgacgaac300cagtgaaaac tctgtaagat atataagagc atcaagagtc ggacttgctt aggagagtgg360atagttgttg atgctcgcgg aagctctcat atagtataga tatgaagtat cggtgagtcg420tagtagtctt tgtattatat agggagaggc tgaatggtgt gggtcatgat aatttccaca480taatagcgat taaagcccta gatcgagggt atcttgaggc ataaatgata gtatcagtgg540acatatcctg agatgaggat gatatgagat gatagagatg aggaagaaag aggaaagaga600gaggcaagaa cagagatttt tatacctttg cagagcagcc catccgtcac tgaattcagg660catcttcact ccatactatc acgagtcaac gtgaagttgt ataagcgtag tgacaggccg720cagtgacgat gatccgtcac tgcggtggct atccgcgact gatcttgcta tccgtgactg780cgttgactct ggtgaaccaa gtgttcggga aggggtgaaa atgaagctga agcgggtcag840ggaacattcc aagcaacact agacgagtca gcgacgagtc agcgatccac tcggtctcac900acgctcccaa tagtctcaat ttggtgccaa tggcaactaa gtattccatc cacttttaat960taaagtgatc agcggtgcac gaattcacat gctggatctg gtacagatca gattaatatc1020tcctggaata cgatgaaggc ccacctcagg attcacgata aatttctggt gactgccagc1080tcgaatggca ttctccgtca ctctacacct gccgttggtt aattctccga acctctaatt1140gtcaatttct gccaaaatgc gtctatcatc gctggccctg gcatccagcg ccatcctacc1200cgccttaggc tacagcatca acgacttctc ctgcaatagc accgaacacc cgaatccagt1260tgtgctccta catgggctag gcgccaccta ctacgaagac ttgaattacc tgcaaggttg1320
gctacagacc caaggctatt gcacttacgc caaaacctac ggtgcatatg aaggcttccc1380ctttgtcggc ggcctcaagg ccatcgccga atcggccacg gaaatcgccg cgtacatccg1440cgaggtgaaa gaaaagacgg gcgccgacaa gattgacctt gtcggtcact ccgaaggcgc1500cttccagacc ctctacgtcc ctaagttcga ggatggtatc tcggagatgc tggataagct1560ggtggccatt gcacctccca ccagaggcac caacttggcg gggatctatg acatcgcata1620tgttctggga aatctatcgc gcgatctgat aggcgacgtc ctggataccg tgggctgcgc1680cgcctgtgat gatctgggtc cggatggagc agcgattgac cgcttgaacg atggcgagcc1740tatcgtgcag ccgggaaata atctaacggt gattgcatcg cggtccgacg aattggtcac1800cccaaccacc acctccttcg tgcatgaaga tggggtgacc aatgaatggg tgcaagacac1860ttgtcctcta gaccctgtcg gtcatatcgg tgaggcatac gatctgaacg tctggaattt1920ggtcaaaaac gccttggact ctacgccgaa gcgtgagttc gtctgctcgc tgggatctcc1980cggcaggtga gactatcatc ttctgaaaat ttgtatataa gcatttatat ttggataccc2040ggttaccagt cattagtgtc ataatgtata ataatatcac cacaacttcc tccaagc 2097<210>14<211>834<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(834)<400>14atg cgt cta tca tcg ctg gcc ctg gca tcc agc gcc atc cta ccc gcc48Met Arg Leu Ser Ser Leu Ala Leu Ala Ser Ser Ala Ile Leu Pro Ala1 5 10 15tta ggc tac agc atc aac gac ttc tcc tgc aat agc acc gaa cac ccg96Leu Gly Tyr Ser Ile Asn Asp Phe Ser Cys Asn Ser Thr Glu His Pro20 25 30aat cca gtt gtg ctc cta cat ggg cta ggc gcc acc tac tac gaa gac144Asn Pro Val Val Leu Leu His Gly Leu Gly Ala Thr Tyr Tyr Glu Asp35 40 45ttg aat tac ctg caa ggt tgg cta cag acc caa ggc tat tgc act tac192Leu Asn Tyr Leu Gln Gly Trp Leu Gln Thr Gln Gly Tyr Cys Thr Tyr50 55 60gcc aaa acc tac ggt gca tat gaa ggc ttc ccc ttt gtc ggc ggc ctc240Ala Lys Thr Tyr Gly Ala Tyr Glu Gly Phe Pro Phe Val Gly Gly Leu65 70 75 80aag gcc atc gcc gaa tcg gcc acg gaa atc gcc gcg tac atc cgc gag288Lys Ala Ile Ala Glu Ser Ala Thr Glu Ile Ala Ala Tyr Ile Arg Glu85 90 95gtg aaa gaa aag acg ggc gcc gac aag att gac ctt gtc ggt cac tcc336
Val Lys Glu Lys Thr Gly Ala Asp Lys Ile Asp Leu Val Gly His Ser100 105 110gaa ggc gcc ttc cag acc ctc tac gtc cct aag ttc gag gat ggt atc384Glu Gly Ala Phe Gln Thr Leu Tyr Val Pro Lys Phe Glu Asp Gly Ile115 120 125tcg gag atg ctg gat aag ctg gtg gcc att gca cct ccc acc aga ggc432Ser Glu Met Leu Asp Lys Leu Val Ala Ile Ala Pro Pro Thr Arg Gly130 135 140acc aac ttg gcg ggg atc tat gac atc gca tat gtt ctg gga aat cta480Thr Asn Leu Ala Gly Ile Tyr Asp Ile Ala Tyr Val Leu Gly Asn Leu145 150 155 160tcg cgc gat ctg ata ggc gac gtc ctg gat acc gtg ggc tgc gcc gcc528Ser Arg Asp Leu Ile Gly Asp Val Leu Asp Thr Val Gly Cys Ala Ala165 170 175tgt gat gat ctg ggt ccg gat gga gca gcg att gac cgc ttg aac gat576Cys Asp Asp Leu Gly Pro Asp Gly Ala Ala Ile Asp Arg Leu Ash Asp180 185 190ggc gag cct atc gtg cag ccg gga aat aat cta acg gtg att gca tcg624Gly Glu Pro Ile Val Gln Pro Gly Asn Asn Leu Thr Val Ile Ala Ser195 200 205cgg tcc gac gaa ttg gtc acc cca acc acc acc tcc ttc gtg cat gaa672Arg Ser Asp Glu Leu Val Th rPro Thr Thr Thr Ser Phe Val His Glu210 215 220gat ggg gtg acc aat gaa tgg gtg caa gac act tgt cct cta gac cct720Asp Gly Val Thr Asn Glu Trp Val Gln Asp Thr Cys Pro Leu Asp Pro225 230 235 240gtc ggt cat atc ggt gag gca tac gat ctg aac gtc tgg aat ttg gtc768Val Gly His Ile Gly Glu Ala Tyr Asp Leu Asn Val Trp Asn Leu Val245 250 255aaa aac gcc ttg gac tct acg ccg aag cgt gag ttc gtc tgc tcg ctg816Lys Asn Ala Leu Asp Ser Thr Pro Lys Arg Glu Phe Val Cys Ser Leu260 265 270gga tct ccc ggc agg tga834Gly Ser Pro Gly Arg275<210>15<211>277<212>PRT<213>黑曲霉(Aspergillus niger)<400>15Met Arg Leu Ser Ser Leu Ala Leu Ala Ser Ser Ala Ile Leu Pro Ala
1 5 10 l5Leu Gly Tyr Ser Ile Asn Asp Phe Ser Cys Asn Ser Thr Glu His Pro20 25 30Asn Pro Val Val Leu Leu His Gly Leu Gly Ala Thr Tyr Tyr Glu Asp35 40 45Leu Asn Tyr Leu Gln Gly Trp Leu Gln Thr Gln Gly Tyr Cys Thr Tyr50 55 60Ala Lys Thr Tyr Gly Ala Tyr Glu Gly Phe Pro Phe Val Gly Gly Leu65 70 75 80Lys Ala Ile Ala Glu Ser Ala Thr Glu Ile Ala Ala Tyr Ile Arg Glu85 90 95Val Lys Glu Lys Thr Gly Ala Asp Lys Ile Asp Leu Val Gly His Ser100 105 110Glu Gly Ala Phe Gln Thr Leu Tyr Val Pro Lys Phe Glu Asp Gly Ile115 120 125Ser Glu Met Leu Asp Lys Leu Val Ala Ile Ala Pro Pro Thr Arg Gly130 135 140Thr Asn Leu Ala Gly Ile Tyr Asp Ile Ala Tyr Val Leu Gly Asn Leu145 150 155 160Ser Arg Asp Leu Ile Gly Asp Val Leu Asp Thr Val Gly Cys Ala Ala165 170 175Cys Asp Asp Leu Gly Pro Asp Gly Ala Ala Ile Asp Arg Leu Asn Asp180 185 190Gly Glu Pro Ile Val Gln Pro Gly Asn Asn Leu Thr Val Ile Ala Ser195 200 205Arg Ser Asp Glu Leu Val Thr Pro Thr Thr Thr Ser Phe Val His Glu210 215 220Asp Gly Val Thr Asn Glu Trp Val Gln Asp Thr Cys Pro Leu Asp Pro225 230 235 240Val Gly His Ile Gly Glu Ala Tyr Asp Leu Asn Val Trp Asn Leu Val245 250 255Lys Asn Ala Leu Asp Ser Thr Pro Lys Arg Glu Phe Val Cys Ser Leu260 265 270Gly Ser Pro Gly Arg275<210>16<211>1881<212>DNA<213>黑曲霉(Aspergillus niger)<400>16ccgagtgatc cgcgacttct gggtcagctt tgttctgcgg gctccaccag tgccgtcatc60
gcacgcgaga cccgccccgg atgcttagct gaagccggca tagtccatcc ccgctcgggc120gtgatgccca acggtcactg gaggagaggt gcagggagga tgccgttgca tgaatcaagc180ccggggtttg actttcatcc gctcgtttcc tactggcggg ttcgccctct ccatcgaagc240cacggatcct tccatccgga tcctggcaga acagtgagga agcagagctt ggttatagta300gaaattatta ataccgagct ggtctgccca tttttcccaa accttccctc tttccatccc360tctcgcctcg cacccccttt atcctccctc ccgccatgta tatcccctcg gtgctgcttc420tggccgcgag cctgttccat ggcgcaacgg cgctgcccac gcccggctcc acgcccatcc480cgcccagcca ggatccctgg tacagtgcgc ccgagggctt cgaggaggct gatcccggtg540ccatcctgcg cgtgcggccc gcgcccggca acttgaccgt ggtagtgggc aatgcgtcgg600cggcctacaa catcctctac cgcactacag acagtcagta caagccctcc tgggctgtga660ccaccctgct ggtgcccccc gtggccgcct ccgccgccgt caaccagagt gtcctgctct720cccaccagat cgcctacgat tcgttcgacg tcaatgccag tcccagctac gccatgtaca780ccagcccgcc ctccgatatt atcctcgccc tgcagcgcgg ctggttcgtt aacgtccccg840attacgaggg ccccaatgcc tctttcaccg ccggtgtgca gtccggccat gccaccctcg900actcggtccg cagcgtgctc gcctccggat tcggcctgaa cgaggacgcc cagtacgctc960tgtggggtta ctctggcggt gccttggcca gcgaatgggc tgctgaactg cagatgcaat1020acgctcccga gttgaacatt gccggtctgg ccgtgggtgg tctcactccc aatgttacca1080gcgtcatgga cacggtgacc tcgaccatca gtgcgggact catccccgcc gccgccctgg1140gtctgtcgag ccagcacccc gagacctacg agttcatcct cagccagctc aagacgacgg1200gaccctacaa ccgcacagga ttcctagccg ccaaggacct gaccctgtcc gaggcggagg1260tcttctacgc cttccagaac atcttcgatt actttgtcaa cggatcggcc acgttccagg1320cggaggtggt gcagaaggcg ctgaaccagg acggatacat gggctaccat gggttcccgc1380agatgccggt gctcgcgtac aaggctattc acgatgagat cagtcccatc caggatacgg1440atcgcgtgat caagcgctac tgtggtctgg gattgaacat cttgtatgag cggaacacca1500tcggtggcca ctcggcagag caggtgaatg gcaacgccag ggcgtggaac tggttgacga1560gcattttcga cggaacgtat gcgcagcagt acaagaccga ggggtgcacg atccgcaatg1620tcactctgaa cacgacttcc tccgtttatt agagaggggg ctgttgttat gtgaataatg1680ctgaagatgg ctgtgtatgg acggtccgct ctcctgtata gtaatgggct aatgcatgcg1740gcttcatgaa catggtacga aagattagat tatgtatata gtgtggaagt ggtaatgatg1800atataatatc tgtctatgat ctatgttcct gctattctat acaaacgcga ccattcacag1860aatgactact ggcacatctg c 1881<210>17<211>1257<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1257)<400>17atg tat atc ccc tcg gtg ctg ctt ctg gcc gcg agc ctg ttc cat ggc 48
Met Tyr Ile Pro Ser Val Leu Leu Leu Ala Ala Ser Leu Phe His Gly1 5 10 15gca acg gcg ctg ccc acg ccc ggc tcc acg ccc atc ccg ccc agc cag96Ala Thr Ala Leu Pro Thr Pro Gly Ser Thr Pro Ile Pro Pro Ser Gln20 25 30gat ccc tgg tac agt gcg ccc gag ggc ttc gag gag gct gat ccc ggt144Asp Pro Trp Tyr Ser Ala Pro Glu Gly Phe Glu Glu Ala Asp Pro Gly35 40 45gcc atc ctg cgc gtg cgg ccc gcg ccc ggc aac ttg acc gtg gta gtg192Ala Ile Leu Arg Val Arg Pro Ala Pro Gly Asn Leu Thr Val Val Val50 55 60ggc aat gcg tcg gcg gcc tac aac atc ctc tac cgc act aca gac agt240Gly Asn Ala Ser Ala Ala Tyr Asn Ile Leu Tyr Arg Thr Thr Asp Ser65 70 75 80cag tac aag ccc tcc tgg gct gtg acc acc ctg ctg gtg ccc ccc gtg288Gln Tyr Lys Pro Ser Trp Ala Val Thr Thr Leu Leu Val Pro Pro Val85 90 95gcc gcc tcc gcc gcc gtc aac cag agt gtc ctg ctc tcc cac cag atc336Ala Ala Ser Ala Ala Val Asn Gln Ser Val Leu Leu Ser His Gln Ile100 105 110gcc tac gat tcg ttc gac gtc aat gcc agt ccc agc tac gcc atg tac384Ala Tyr Asp Ser Phe Asp Val Asn Ala Ser Pro Ser Tyr Ala Met Tyr115 120 125acc agc ccg ccc tcc gat att atc ctc gcc ctg cag cgc ggc tgg ttc432Thr Ser Pro Pro Ser Asp Ile Ile Leu Ala Leu Gln Arg Gly Trp Phe130 135 140gtt aac gtc ccc gat tac gag ggc ccc aat gcc tct ttc acc gcc ggt480Val Asn Val Pro Asp Tyr Glu Gly Pro Asn Ala Ser Phe Thr Ala Gly145 150 155 160gtg cag tcc ggc cat gcc acc ctc gac tcg gtc cgc agc gtg ctc gcc528Val Gln Ser Gly His Ala Thr Leu Asp Ser Val Arg Ser Val Leu Ala165 170 175tcc gga ttc ggc ctg aac gag gac gcc cag tac gct ctg tgg ggt tac576Ser Gly Phe Gly Leu Asn Glu Asp Ala Gln Tyr Ala Leu Trp Gly Tyr180 185 190tct ggc ggt gcc ttg gcc agc gaa tgg gct gct gaa ctg cag atg caa624Ser Gly Gly Ala Leu Ala Ser Glu Trp Ala Ala Glu Leu Gln Met Gln195 200 205tac gct ccc gag ttg aac att gcc ggt ctg gcc gtg ggt ggt ctc act672Tyr Ala Pro Glu Leu Asn Ile Ala Gly Leu Ala Val Gly Gly Leu Thr210 215 220ccc aat gtt acc agc gtc atg gac acg gtg acc tcg acc atc agt gcg720Pro Asn Val Thr Ser Val Met Asp Thr Val Thr Ser Thr Ile Ser Ala225 230 235 240
gga ctc atc ccc gcc gcc gcc ctg ggt ctg tcg agc cag cac ccc gag768Gly Leu Ile Pro Ala Ala Ala Leu Gly Leu Ser Ser Gln His Pro Glu245 250 255acc tac gag ttc atc ctc agc cag ctc aag acg acg gga ccc tac aac816Thr Tyr Glu Phe Ile Leu Ser Gln Leu Lys Thr Thr Gly Pro Tyr Asn260 265 270cgc aca gga ttc cta gcc gcc aag gac ctg acc ctg tcc gag gcg gag864Arg Thr Gly Phe Leu Ala Ala Lys Asp Leu Thr Leu Ser Glu Ala Glu275 280 285gtc ttc tac gcc ttc cag aac atc ttc gat tac ttt gtc aac gga tcg912Val Phe Tyr Ala Phe Gln Asn Ile Phe Asp Tyr Phe Val Asn Gly Ser290 295 300gcc acg ttc cag gcg gag gtg gtg cag aag gcg ctg aac cag gac gga960Ala Thr Phe Gln Ala Glu Val Val Gln Lys Ala Leu Asn Gln Asp Gly305 310 315 320tac atg ggc tac cat ggg ttc ccg cag atg ccg gtg ctc gcg tac aag1008Tyr Met Gly Tyr His Gly Phe Pro Gln Met Pro Val Leu Ala Tyr Lys325 330 335gct att cac gat gag atc agt ccc atc cag gat acg gat cgc gtg atc1056Ala Ile His Asp Glu Ile Ser Pro Ile Gln Asp Thr Asp Arg Val Ile340 345 350aag cgc tac tgt ggt ctg gga ttg aac atc ttg tat gag cgg aac acc1104Lys Arg Tyr Cys Gly Leu Gly Leu Asn Ile Leu Tyr Glu Arg Asn Thr355 360 365atc ggt ggc cac tcg gca gag cag gtg aat ggc aac gcc agg gcg tgg1152Ile Gly Gly His Ser Ala Glu Gln Val Asn Gly Asn Ala Arg Ala Trp370 375 380aac tgg ttg acg agc att ttc gac gga acg tat gcg cag cag tac aag1200Asn Trp Leu Thr Ser Ile Phe Asp Gly Thr Tyr Ala Gln Gln Tyr Lys385 390 395 400acc gag ggg tgc acg atc cgc aat gtc act ctg aac acg act tcc tcc1248Thr Glu Gly Cys Thr Ile Arg Asn Val Thr Leu Asn Thr Thr Ser Ser405 410 415gtt tat tag1257Val Tyr<210>18<211>418<212>PRT<213>黑曲霉(Aspergillus niger)<400>18Met Tyr Ile Pro Ser Val Leu Leu Leu Ala Ala Ser Leu Phe His Gly
1 5 10 15Ala Thr Ala Leu Pro Thr Pro Gly Ser Thr Pro Ile Pro Pro Ser Gln20 25 30Asp Pro Trp Tyr Ser Ala Pro Glu Gly Phe Glu Glu Ala Asp Pro Gly35 40 45Ala Ile Leu Arg Val Arg Pro Ala Pro Gly Asn Leu Thr Val Val Val50 55 60Gly Asn Ala Ser Ala Ala Tyr Asn Ile Leu Tyr Arg Thr Thr Asp Ser65 70 75 80Gln Tyr Lys Pro Ser Trp Ala Val Thr Thr Leu Leu Val Pro Pro Val85 90 95Ala Ala Ser Ala Ala Val Asn Gln Ser Val Leu Leu Ser His Gln Ile100 105 110Ala Tyr Asp Ser Phe Asp Val Asn Ala Ser Pro Ser Tyr Ala Met Tyr115 120 125Thr Ser Pro Pro Ser Asp Ile Ile Leu Ala Leu Gln Arg Gly Trp Phe130 135 140Val Asn Val Pro Asp Tyr Glu Gly Pro Asn Ala Ser Phe Thr Ala Gly145 150 155 160Val Gln Ser Gly His Ala Thr Leu Asp Ser Val Arg Ser Val Leu Ala165 170 175Ser Gly Phe Gly Leu Asn Glu Asp Ala Gln Tyr Ala Leu Trp Gly Tyr180 185 190Ser Gly Gly Ala Leu Ala Ser Glu Trp Ala Ala Glu Leu Gln Met Gln195 200 205Tyr Ala Pro Glu Leu Asn Ile Ala Gly Leu Ala Val Gly Gly Leu Thr210 215 220Pro Asn Val Thr Ser Val Met Asp Thr Val Thr Ser Thr Ile Ser Ala225 230 235 240Gly Leu Ile Pro Ala Ala Ala Leu Gly Leu Ser Ser Gln His Pro Glu245 250 255Thr Tyr Glu Phe Ile Leu Ser Gln Leu Lys Thr Thr Gly Pro Tyr Asn260 265 270Arg Thr Gly Phe Leu Ala Ala Lys Asp Leu Thr Leu Ser Glu Ala Glu275 280 285Val Phe Tyr Ala Phe Gln Asn Ile Phe Asp Tyr Phe Val Asn Gly Ser290 295 300Ala Thr Phe Gln Ala Glu Val Val Gln Lys Ala Leu Asn Gln Asp Gly305 310 315 320Tyr Met Gly Tyr His Gly Phe Pro Gln Met Pro Val Leu Ala Tyr Lys325 330 335Ala Ile His Asp Glu Ile Ser Pro Ile Gln Asp Thr Asp Arg Val Ile340 345 350Lys Arg Tyr Cys Gly Leu Gly Leu Asn Ile Leu Tyr Glu Arg Asn Thr
355 360 365Ile Gly Gly His Ser Ala Glu Gln Val Asn Gly Asn Ala Arg Ala Trp370 375 380Asn Trp Leu Thr Ser Ile Phe Asp Gly Thr Tyr Ala Gln Gln Tyr Lys385 390 395 400Thr Glu Gly Cys Thr Ile Arg Asn Val Thr Leu Asn Thr Thr Ser Ser405 410 415Val Tyr<210>19<211>2809<212>DNA<213>黑曲霉(Aspergillus niger)<400>19agtaatgtat catttgaaag atcagtaaat gaaatctgct gcacaatgca cgctttgaga60acgacgatgc gaatcgtaga atgcccaagt cagtctgcgt ggtcagacga gacccataca120ttgcatatgt acaatctagt agtataatat ggtgtaaatc cccataacct gatactcata180cacactatca gggcttgggt acatgagcga agtagtccca acaatcaaac aatcatccaa240actccaagcc aaatgccagc gaaaacaaca aaagcacaac atgatgttac agtgcactag300ggaaaccaat ctgtgtcacc atcactcagg acaccagata taacgaaccc ccctcacaga360ccacgagtct tctccggatc catctgcacc tcatcaccgc taatttcctt gaccgtctca420aacgccggct tgcccgcata tagctgctgg gacgagctgg agccgccgcc ttccgtcgtc480gataccgaga tgggctggtt tccgcggaac cgcttgcgca tatcgatcag gccgcgtcta540tagaaggaca aacagttagt aaccctgatg acttggcggt gattgcgttt tacaagaagg600tagcggctct ttactcactt gcactcgctg aatcccttcc gcaattgctg gcatcgcatg660ggaagctcgt cgacgtacgg ctcactcaga cattcgcggg gcgagcgccg ttgcaccatg720atgcagtctg attcttggag acattgggcc agagcatttc ctgttcatcc aggtgagatt780gattagagag tgtggagctg aagctgaagt tggggacaat gaggtggtga tctccgttcg840gggatacgtc gagtatccaa gccgcaattt aagagtatgg taaaggatat aagggtcaaa900cgtactgatc tcttggcagg aactcggcat tttggcgaac aacaatggcc gaattgctca960gccaactgac aagcaggaac aataccggtc tgcggcggcg gacatctgga gataatttgt1020ctgatcggaa aacaaactca accaacgggc cttgccccgg attaggtaag ccatcacatg1080aagaaggccc ccatgacgtc tggggggaat cctgacttgc tgcttgttcc gcttgattta1140tcctcttccc ctagtcatgc ggtcttgggt ctttgaagca ttgcttcggc gcattatggt1200tcactactac tactgcaggt gataagtatt ttagttggtt gatttgcaaa ttgtccatcc1260cttttcgata ataggaggtt tggtcttaat cgtcatggcg cgcgttccgg tcattggacg1320gctgttttgg ttcgagtatt tggccctttt tgggtcgctg attttggtat tgctggaatg1380ggttatacat attatcacat tctgtctgcg taagtagtgt gttcattctc tggaattgtg1440gtctatgtcg aggggcaaga gctaactgac gcagctgaac ctgttattaa gttctgttac1500gatcgatcca agactatctt caacgccttc attcctcccg atgacccggc taagcgcggt1560aaagaagaga aaattgctgc gtcggttgct ctggcgtcgg acttcacgga tatatgcgcg1620ctgttcggat atgaggcgga ggaacatatc gtccagacag gggatggcta tctgcttggt1680
ctgcaccgac tgccctatcg gaaaggagag gaggggagga agatcaacca gggcgaaggg1740agcatcaaga agaaggtcgt ctatctccac catggtctca tgatgtgcag tgaagtctgg1800atctgtctgt cagaggagca gcgatgcctt ccgtttcaat tagtcgaaag gggctatgac1860gtgtggttgg ggaacaatag aggaaacaag tactcgaaga agtccgtcaa gcattcgccc1920ctgtcgaacg agttctggga cttttcgatc gatcagttct cgttccatga tatcccagac1980agcatcaagt atatcctgga agtgacaggg cagccctccc tgtcatacgt ggggttctcg2040cagggaacag cgcaggcatt tgcgacgctg tccattcatc ctttgttgaa tcagaagatc2100gatgtctttg tggctctcgc gccggcaatg gctccgacag gtcttccaaa tcatctcgtg2160gactcgctca tgaaggcttc gccgaacttc ctgtttctgc tgtttggcag acgcagcatc2220cttagctcaa cgacgatgtg gcagacaatt ctctacccgc ctatctttgt ttggatcatc2280gacacgtcac ttcgcggcct gttcaattgg aggtgcaaga acatcagccg ctggcagaag2340ctggcagggt acctgcatct gttttccttc actagcacca agtcggtcgt ccattggttc2400cagattattc ggcaccggaa tttccagttc tacgatgacg aaatccatgc cccgctcagt2460attgtggcca gtgagcgatt ttacaagccg gtcaagtacc cgactaagaa cattaagacg2520cccattgtcc tgttgtatgg cggtagcgat agtctcgttg atatcaacgt gatgttgtcc2580gagctccctc gcgggaccgt ggcgaaggaa atcccgcagt atgagcattt agatttcttg2640tgggcgcgtg atgtggacca attggtattc aaccatgtct tcgaagcgct ggagcggtac2700agctcggaga atcagaaagg gacattgatg gagaaggtta atggtgccgc gggcacatat2760gtaccgacat aaagtacgag gtcctgcacc aatgaagaca cgcataatc2809<210>20<211>1413<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1413)<400>20atg gcg cgc gtt ccg gtc att gga cgg ctg ttt tgg ttc gag tat ttg48Met Ala Arg Val Pro Val Ile Gly Arg Leu Phe Trp Phe Glu Tyr Leu1 5 10 15gcc ctt ttt ggg tcg ctg att ttg gta ttg ctg gaa tgg gtt ata cat96Ala Leu Phe Gly Ser Leu Ile Leu Val Leu Leu Glu Trp Val Ile His20 25 30att atc aca ttc tgt ctg cct gaa cct gtt att aag ttc tgt tac gat144Ile Ile Thr Phe Cys Leu Pro Glu Pro Val Ile Lys Phe Cys Tyr Asp35 40 45cga tcc aag act atc ttc aac gcc ttc att cct ccc gat gac ccg gct192Arg Ser Lys Thr Ile Phe Asn Ala Phe Ile Pro Pro Asp Asp Pro Ala50 55 60aag cgc ggt aaa gaa gag aaa att gct gcg tcg gtt gct ctg gcg tcg240
Lys Arg Gly Lys Glu Glu Lys Ile Ala Ala Ser Val Ala Leu Ala Ser65 70 75 80gac ttc acg gat ata tgc gcg ctg ttc gga tat gag gcg gag gaa cat288Asp Phe Thr Asp Ile Cys Ala Leu Phe Gly Tyr Glu Ala Glu Glu His85 90 95atc gtc cag aca ggg gat ggc tat ctg ctt ggt ctg cac cga ctg ccc336Ile Val Gln Thr Gly Asp Gly Tyr Leu Leu Gly Leu His Arg Leu Pro100 105 110tat cgg aaa gga gag gag ggg agg aag atc aac cag ggc gaa ggg agc384Tyr Arg Lys Gly Glu Glu Gly Arg Lys Ile Asn Gln Gly Glu Gly Ser115 120 125atc aag aag aag gtc gtc tat ctc cac cat ggt ctc atg atg tgc agt432Ile Lys Lys Lys Val Val Tyr Leu His His Gly Leu Met Met Cys Ser130 135 140gaa gtc tgg atc tgt ctg tca gag gag cag cga tgc ctt ccg ttt caa480Glu Val Trp Ile Cys Leu Ser Glu Glu Gln Arg Cys Leu Pro Phe Gln145 150 155 160tta gtc gaa agg ggc tat gac gtg tgg ttg ggg aac aat aga gga aac528Leu Val Glu Arg Gly Tyr Asp Val Trp Leu Gly Asn Asn Arg Gly Asn165 170 175aag tac tcg aag aag tcc gtc aag cat tcg ccc ctg tcg aac gag ttc576Lys Tyr Ser Lys Lys Ser Val Lys His Ser Pro Leu Ser Asn Glu Phe180 185 190tgg gac ttt tcg atc gat cag ttc tcg ttc cat gat atc cca gac agc624Trp Asp Phe Ser Ile Asp Gln Phe Ser Phe His Asp Ile Pro Asp Ser195 200 205atc aag tat atc ctg gaa gtg aca ggg cag ccc tcc ctg tca tac gtg672Ile Lys Tyr Ile Leu Glu Val Thr Gly Gln Pro Ser Leu Ser Tyr Val210 215 220ggg ttc tcg cag gga aca gcg cag gca ttt gcg acg ctg tcc att cat720Gly Phe Ser Gln Gly Thr Ala Gln Ala Phe Ala Thr Leu Ser Ile His225 230 235 240cct ttg ttg aat cag aag atc gat gtc ttt gtg gct ctc gcg ccg gca768Pro Leu Leu Asn Gln Lys Ile Asp Val Phe Val Ala Leu Ala Pro Ala245 250 255atg gct ccg aca ggt ctt cca aat cat ctc gtg gac tcg ctc atg aag816Met Ala Pro Thr Gly Leu Pro Asn His Leu Val Asp Ser Leu Met Lys260 265 270gct tcg ccg aac ttc ctg ttt ctg ctg ttt ggc aga cgc agc atc ctt864Ala Ser Pro Asn Phe Leu Phe Leu Leu Phe Gly Arg Arg Ser Ile Leu275 280 285agc tca acg acg atg tgg cag aca att ctc tac ccg cct atc ttt gtt912Ser Ser Thr Thr Met Trp Gln Thr Ile Leu Tyr Pro Pro Ile Phe Val290 295 300
tgg atc atc gac acg tca ctt cgc ggc ctg ttc aat tgg agg tgc aag960Trp Ile Ile Asp Thr Ser Leu Arg Gly Leu Phe Asn Trp Arg Cys Lys305 310 315 320aac atc agc cgc tgg cag aag ctg gca ggg tac ctg cat ctg ttt tcc1008Asn Ile Ser Arg Trp Gln Lys Leu Ala Gly Tyr Leu His Leu Phe Ser325 330 335ttc act agc acc aag tcg gtc gtc cat tgg ttc cag att att cgg cac1056Phe Thr Ser Thr Lys Ser Val Val His Trp Phe Gln Ile Ile Arg His340 345 350cgg aat ttc cag ttc tac gat gac gaa ate cat gcc ccg ctc agt att1104Arg Asn Phe Gln Phe Tyr Asp Asp Glu Ile His Ala Pro Leu Ser Ile355 360 365gtg gcc agt gag cga ttt tac aag ccg gtc aag tac ccg act aag aac1152Val Ala Ser Glu Arg Phe Tyr Lys Pro Val Lys Tyr Pro Thr Lys Asn370 375 380att aag acg ccc att gtc ctg ttg tat ggc ggt agc gat agt ctc gtt1200Ile Lys Thr Pro Ile Val Leu Leu Tyr Gly Gly Ser Asp Ser Leu Val385 390 395 400gat atc aac gtg atg ttg tcc gag ctc cct cgc ggg acc gtg gcg aag1248Asp Ile Asn Val Met Leu Ser Glu Leu Pro Arg Gly Thr Val Ala Lys405 410 415gaa atc ccg cag tat gag cat tta gat ttc ttg tgg gcg cgt gat gtg1296Glu Ile Pro Gln Tyr Glu His Leu Asp Phe Leu Trp Ala Arg Asp Val420 425 430gac caa ttg gta ttc aac cat gtc ttc gaa gcg ctg gag cgg tac agc1344Asp Gln Leu Val Phe Asn His Val Phe Glu Ala Leu Glu Arg Tyr Ser435 440 445tcg gag aat cag aaa ggg aca ttg atg gag aag gtt aat ggt gcc gcg1392Ser Glu Asn Gln Lys Gly Thr Leu Met Glu Lys Val Asn Gly Ala Ala450 455 460ggc aca tat gta ccg aca taa1413Gly Thr Tyr Val Pro Thr465 470<210>21<211>470<212>PRT<213>黑曲霉(Aspergillus niger)<400>21Met Ala Arg Val Pro Val Ile Gly Arg Leu Phe Trp Phe Glu Tyr Leu1 5 10 15Ala Leu Phe Gly Ser Leu Ile Leu Val Leu Leu Glu Trp Val Ile His
20 25 30Ile Ile Thr Phe Cys Leu Pro Glu Pro Val Ile Lys Phe Cys Tyr Asp35 40 45Arg Ser Lys Thr Ile Phe Asn Ala Phe Ile Pro Pro Asp Asp Pro Ala50 55 60Lys Arg Gly Lys Glu Glu Lys Ile Ala Ala Ser Val Ala Leu Ala Ser65 70 75 80Asp Phe Thr Asp Ile Cys Ala Leu Phe Gly Tyr Glu Ala Glu Glu His85 90 95Ile Val Gln Thr Gly Asp Gly Tyr Leu Leu Gly Leu His Arg Leu Pro100 105 110Tyr Arg Lys Gly Glu Glu Gly Arg Lys Ile Asn Gln Gly Glu Gly Ser115 120 125Ile Lys Lys Lys Val Val Tyr Leu His His Gly Leu Met Met Cys Ser130 135 140Glu Val Trp Ile Cys Leu Ser Glu Glu Gln Arg Cys Leu Pro Phe Gln145 150 155 160Leu Val Glu Arg Gly Tyr Asp Val Trp Leu Gly Asn Asn Arg Gly Asn165 170 175Lys Tyr Ser Lys Lys Ser Val Lys His Ser Pro Leu Ser Asn Glu Phe180 185 190Trp Asp Phe Ser Ile Asp Gln Phe Ser Phe His Asp Ile Pro Asp Ser195 200 205Ile Lys Tyr Ile Leu Glu Val Thr Gly Gln Pro Ser Leu Ser Tyr Val210 215 220Gly Phe Ser Gln Gly Thr Ala Gln Ala Phe Ala Thr Leu Ser Ile His225 230 235 240Pro Leu Leu Asn Gln Lys Ile Asp Val Phe Val Ala Leu Ala Pro Ala245 250 255Met Ala Pro Thr Gly Leu Pro Asn His Leu Val Asp Ser Leu Met Lys260 265 270Ala Ser Pro Asn Phe Leu Phe Leu Leu Phe Gly Arg Arg Ser Ile Leu275 280 285Ser Ser Thr Thr Met Trp Gln Thr Ile Leu Tyr Pro Pro Ile Phe Val290 295 300Trp Ile Ile Asp Thr Ser Leu Arg Gly Leu Phe Asn Trp Arg Cys Lys305 310 315 320Asn Ile Ser Arg Trp Gln Lys Leu Ala Gly Tyr Leu His Leu Phe Ser325 330 335Phe Thr Ser Thr Lys Ser Val Val His Trp Phe Gln Ile Ile Arg His340 345 350Arg Asn Phe Gln Phe Tyr Asp Asp Glu Ile His Ala Pro Leu Ser Ile355 360 365Val Ala Ser Glu Arg Phe Tyr Lys Pro Val Lys Tyr Pro Thr Lys Asn
370 375 380Ile Lys Thr Pro Ile Val Leu Leu Tyr Gly Gly Ser Asp Ser Leu Val385 390 395 400Asp Ile Asn Val Met Leu Ser Glu Leu Pro Arg Gly Thr Val Ala Lys405 410 415Glu Ile Pro Gln Tyr Glu His Leu Asp Phe Leu Trp Ala Arg Asp Val420 425 430Asp Gln Leu Val Phe Asn His Val Phe Glu Ala Leu Glu Arg Tyr Ser435 440 445Ser Glu Asn Gln Lys Gly Thr Leu Met Glu Lys Val Asn Gly Ala Ala450 455 460Gly Thr Tyr Val Pro Thr465 470<210>22<211>3328<212>DNA<213>黑曲霉(Aspergillus niger)<400>22gatttatgaa gacaggggag ctctcagtag atgatcttcg cacaattgca cttcctgggg60agcctgttta gtctctagtg aattattgat agacaggtca tctgcctcga gggggttcta120ctaacaacgt gatatctatg ttgctccttt actttagaag aaaggttctg cttggtagct180ggaacccagt atatagttga tgtgagtata tgaagattcc aatgctttgg aatattccgc240cgtggctgaa tgatgggact ctcactgcca agccaaggga ttcctcccga aatttttgca300catatgttgt tgatgcctta tccctctggc attcactcgt tgctgcctcg ggtgggaccc360gacagtcctc aaacgatgaa atcttattgg ctctgctagt tgagctcggt ttcaccattt420ctattggcgc tttctcactc tactccatat tacagcttcc gctttgcaat gcggggctgt480gctgcgactt tgaattgctc gcatagcaag agacactgac cagcaatcca gctcttctgc540ccacatatgt tgcctttgcc ttagtatctc ataatttatg tgtccagtga gacagtttgt600ttgtactgta gcttgagttg ggaatcgtgt cctgtgacca tggaaatata tattctggat660ctcagaacat ctctaccgtt tgtaattttt gatatacttc ccaggatggg acaatgggga720cgatgagtat tgggatgcca tatcacttga aagcctctta gacagactgc acctattttt780attatgctaa attctttacg agacactttc ttcaagtttc tggccctttg tgaggcagag840tgaaacacga gcgttcaaac ttgtgttgta gatgtttatg atatttatct cagacagtct900ttccacatcc tgtaatcccc aacagaaaaa gatacacagt atatcactag aagctcctaa960tagttatcat gctgcaccct aacagcaatg cagtcaccct gctgcgtcag cgaccccgat1020tccggagaag tatccgagat agcgataagg atgcggagat aagattggca agtggagatg1080agaaagatat cctcggcctc agaagtaggc ccgatgataa ataactagtg aacaagtccc1140ccgcccttct ccgagcaaac tacacttcaa catgctgaat gcacgctcca ttgctctggc1200ctcgttgcca gttcttctcc tactattcgc ccagcaactt gcctctcacc caaccgagca1260gattcaagcc attctggctc cgtgggtccc ggccgcacta caagatgtcg tgctctataa1320tcgacctcgc gtcataatcc cccagggcac tgtcgtcggc acgaccttga cagacacgct1380
caagtccccg gtagatgctt tccgaggaat tccatacgca ttgcctccaa ttggggatag1440acggtttcgc cgtgcggagg ctgtccatgc gacggacgag attatcgatg ctagtgaatt1500cggcccaagg tatgcttctt atacgacatt cagatcatat ctgacctttc aggtgccctg1560gaaagcagct cttgaatcca aatgacatag gtggtgatga agactgtctc acagtcaatg1620tcttccggcc tcatggcgct cagggaaaac tccctgtcgc tgtatacgtg cacggcggag1680cctacaatcg cggcactggt aggtgtatca ccctcagtcc tctatatacc cacagctaaa1740tatccagcct ccggacacaa cacggcctcg atggtcggct ggtcggacga gcccttcgtt1800gcagtcagct tcaactaccg gtacgtcctc aaacctgtcc tccgaatcaa ctcaactaac1860aacccatcag catcggcgcc ctcggcttcc tcccatccac cctaaccgcc aaagaaggaa1920tcctcaacct aggcctccat gaccagatcc tcctgctgca atgggtccaa gaaaacatcg1980cacatttcaa cggcgaccca acccaagtca ctctaatcgg cctctccgcc ggcgcgcact2040ccgtatgccc ccttctaaga tacaaataga actcagtccc ctacccccaa actaacgcca2100cacagatagc ccaccacatc atgaactaca acccaccaaa cacccccctc tttcaccgcg2160ccatcatcga atccggcgcc gccacctccc gcgccgtcca cccctacaac gcctccctcc2220acgaatccca attcacagac ttcctcactg aaacgggctg cactaacctc cccgacactg2280ccattttgcc ctgtctccgc gccctcccat cctcagccat taccaccgcc tccatctccg2340tcttcgacaa atacaacccc tccatccgct gggccttcca acccgtcatc gaccacgaga2400tcatccaccg ccggcccatc gacgcctggc gctcaggaaa gtggaatagg atgcccatcc2460taacgggctt caactcgaac gaggggacat actacgtccc tcgcaacctc tctctctccg2520aggatttcac ttcgttcttc cgaaccctcc tccccgcgta ccccgagagc gacatccaga2580ccatcgatga gatctacccc gatccgaatg tatatgctac ggcgtcgcca tacctcgaga2640caaggccgat cccgagtcta ggaaggcagt ttaagcggct ggaggcggcg tatgggcatt2700atgcgtatgc gtgtccagta cggcagacgg cggggtttgt tgctaatgat gatggttgtg2760gtgagccggt gtttttgtat cgctgggcgt tgaataagac tgttattgga ggcgcgaacc2820atggtgatca gatggagtat gagacgttta atcctgcggt tagggatatt tcggaggctc2880agagggaggt tgcggggttg tttcatgcgt atgtgacttc gtttgtggtg catggggatc2940cgaatgttct ggggggtagg tatgagggga gggaggtttg ggagaggtat agtggggagg3000gaggggaggt gatggtgttt ggggagggga atgatgaacg tgctgggggg gatggagttg3060gggttgcggc gaggttgaag agggatgagt ggggggtgaa ggagtgtgga ttttggtctg3120ggaggagtgg gatttccgag tgatggtttg tttatatata gtctagtgga aggggatgta3180tatactgtag tcactatctg tagaacttta cttggtgtgt agatagtaaa tactacaact3240gctgaagacc ttgggataga acgacatgct gtttaatcct caaccctgac tagatatatt3300gtgcattact tgcatccacg cctaacat 3328<210>23<211>1779<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1779)
<400>23atg ctg aat gca cgc tcc att gct ctg gcc tcg ttg cca gtt ctt ctc48Met Leu Asn Ala Arg Ser Ile Ala Leu Ala Ser Leu Pro Val Leu Leu1 5 10 15cta cta ttc gcc cag caa ctt gcc tct cac cca acc gag cag att caa96Leu Leu Phe Ala Gln Gln Leu Ala Ser His Pro Thr Glu Gln Ile Gln20 25 30gcc att ctg gct ccg tgg gtc ccg gcc gca cta caa gat gtc gtg ctc144Ala Ile Leu Ala Pro Trp Val Pro Ala Ala Leu Gln Asp Val Val Leu35 40 45tat aat cga cct cgc gtc ata atc ccc cag ggc act gtc gtc ggc acg192Tyr Asn Arg Pro Arg Val Ile Ile Pro Gln Gly Thr Val Val Gly Thr50 55 60acc ttg aca gac acg ctc aag tcc ccg gta gat gct ttc cga gga att240Thr Leu Thr Asp Thr Leu Lys Ser Pro Val Asp Ala Phe Arg Gly Ile65 70 75 80cca tac gca ttg cct cca att ggg gat aga cgg ttt cgc cgt gcg gag288Pro Tyr Ala Leu Pro Pro Ile Gly Asp Arg Arg Phe Arg Arg Ala Glu85 90 95gct gtc cat gcg acg gac gag att atc gat gct agt gaa ttc ggc cca336Ala Val His Ala Thr Asp Glu Ile Ile Asp Ala Ser Glu Phe Gly Pro100 105 110agg tgc cct gga aag cag ctc ttg aat cea aat gac ata ggt ggt gat384Arg Cys Pro Gly Lys Gln Leu Leu Asn Pro Asn Asp Ile Gly Gly Asp115 120 125gaa gac tgt ctc aca gtc aat gtc ttc cgg cct cat ggc gct cag gga432Glu Asp Cys Leu Thr Val Asn Val Phe Arg Pro His Gly Ala Gln Gly130 135 140aaa ctc cct gtc gct gta tac gtg cac ggc gga gcc tac aat cgc ggc480Lys Leu Pro Val Ala Val Tyr Val His Gly Gly Ala Tyr Asn Arg Gly145 150 155 160act gct aaa tat cca gcc tcc gga cac aac acg gcc tcg atg gtc ggc528Thr Ala Lys Tyr Pro Ala Ser Gly His Asn Thr Ala Ser Met Val Gly165 170 175tgg tcg gac gag ccc ttc gtt gca gtc agc ttc aac tac cgc atc ggc576Trp Ser Asp Glu Pro Phe Val Ala Val Ser Phe Asn Tyr Arg Ile Gly180 185 190gcc ctc ggc ttc ctc cca tcc acc cta acc gcc aaa gaa gga atc ctc624Ala Leu Gly Phe Leu Pro Ser Thr Leu Thr Ala Lys Glu Gly Ile Leu195 200 205aac cta ggc ctc cat gac cag atc ctc ctg ctg caa tgg gtc caa gaa672Asn Leu Gly Leu His Asp Gln Ile Leu Leu Leu Gln Trp Val Gln Glu210 215 220aac atc gca cat ttc aac ggc gac cca acc caa gtc act cta atc ggc720
Asn Ile Ala His Phe Asn Gly Asp Pro Thr Gln Val Thr Leu Ile Gly225 230 235 240ctc tcc gcc ggc gcg cac tcc ata gcc cac cac atc atg aac tac aac768Leu Ser Ala Gly Ala His Ser Ile Ala His His Ile Met Asn Tyr Asn245 250 255cca cca aac acc ccc ctc ttt cac cgc gcc atc atc gaa tcc ggc gcc816Pro Pro Asn Thr Pro Leu Phe His Arg Ala Ile Ile Glu Ser Gly Ala260 265 270gcc acc tcc cgc gcc gtc cac ccc tac aac gcc tcc ctc cac gaa tcc864Ala Thr Ser Arg Ala Val His Pro Tyr Asn Ala Ser Leu His Glu Ser275 280 285caa ttc aca gac ttc ctc act gaa acg ggc tgc act aac ctc ccc gac912Gln Phe Thr Asp Phe Leu Thr Glu Thr Gly Cys Thr Asn Leu Pro Asp290 295 300act gcc att ttg ccc tgt ctc cgc gcc ctc cca tcc tca gcc att acc960Thr Ala Ile Leu Pro Cys Leu Arg Ala Leu Pro Ser Ser Ala Ile Thr305 310 315 320acc gcc tcc atc tcc gtc ttc gac aaa tac aac ccc tcc atc cgc tgg1008Thr Ala Ser Ile Ser Val Phe Asp Lys Tyr Asn Pro Ser Ile Arg Trp325 330 335gcc ttc caa ccc gtc atc gac cac gag atc atc cac cgc cgg ccc atc1056Ala Phe Gln Pro Val Ile Asp His Glu Ile Ile His Arg Arg Pro Ile340 345 350gac gcc tgg cgc tca gga aag tgg aat agg atg ccc atc cta acg ggc1104Asp Ala Trp Arg Ser Gly Lys Trp Asn Arg Met Pro Ile Leu Thr Gly355 360 365ttc aac tcg aac gag ggg aca tac tac gtc cct cgc aac ctc tct ctc1152Phe Asn Ser Asn Glu Gly Thr Tyr Tyr Val Pro Arg Asn Leu Ser Leu370 375 380tcc gag gat ttc act tcg ttc ttc cga acc ctc ctc ccc gcg tac ccc1200Ser Glu Asp Phe Thr Ser Phe Phe Arg Thr Leu Leu Pro Ala Tyr Pro385 390 395 400gag agc gac atc cag acc atc gat gag atc tac ccc gat ccg aat gta1248Glu Ser Asp Ile Gln Thr Ile Asp Glu Ile Tyr Pro Asp Pro Asn Val405 410 415tat gct acg gcg tcg cca tac ctc gag aca agg ccg atc ccg agt cta1296Tyr Ala Thr Ala Ser Pro Tyr Leu Glu Thr Arg Pro Ile Pro Ser Leu420 425 430gga agg cag ttt aag cgg ctg gag gcg gcg tat ggg cat tat gcg tat1344Gly Arg Gln Phe Lys Arg Leu Glu Ala Ala Tyr Gly His Tyr Ala Tyr435 440 445gcg tgt cca gta cgg cag acg gcg ggg ttt gtt gct aat gat gat ggt1392Ala Cys Pro Val Arg Gln Thr Ala Gly Phe Val Ala Asn Asp Asp Gly450 455 460
tgt ggt gag ccg gtg ttt ttg tat cgc tgg gcg ttg aat aag act gtt1440Cys Gly Glu Pro Val Phe Leu Tyr Arg Trp Ala Leu Asn Lys Thr Val465 470 475 480att gga ggc gcg aac cat ggt gat cag atg gag tat gag acg ttt aat1488Ile Gly Gly Ala Asn His Gly Asp Gln Met Glu Tyr Glu Thr Phe Asn485 490 495cct gcg gtt agg gat att tcg gag gct cag agg gag gtt gcg ggg ttg1536Pro Ala Val Arg Asp Ile Ser Glu Ala Gln Arg Glu Val Ala Gly Leu500 505 510ttt cat gcg tat gtg act tcg ttt gtg gtg cat ggg gat ccg aat gtt1584Phe His Ala Tyr Val Thr Ser Phe Val Val His Gly Asp Pro Asn Val515 520 525ctg ggg ggt agg tat gag ggg agg gag gtt tgg gag agg tat agt ggg1632Leu Gly Gly Arg Tyr Glu Gly Arg Glu Val Trp Glu Arg Tyr Ser Gly530 535 540gag gga ggg gag gtg atg gtg ttt ggg gag ggg aat gat gaa cgt gct1680Glu Gly Gly Glu Val Met Val Phe Gly Glu Gly Asn Asp Glu Arg Ala545 550 555 560ggg ggg gat gga gtt ggg gtt gcg gcg agg ttg aag agg gat gag tgg1728Gly Gly Asp Gly Val Gly Val Ala Ala Arg Leu Lys Arg Asp Glu Trp565 570 575ggg gtg aag gag tgt gga ttt tgg tct ggg agg agt ggg att tcc gag1776Gly Val Lys Glu Cys Gly Phe Trp Ser Gly Arg Ser Gly Ile Ser Glu580 585 590tga1779<210>24<211>592<212>PRT<213>黑曲霉(Aspergillus niger)<400>24Met Leu Asn Ala Arg Ser Ile Ala Leu Ala Ser Leu Pro Val Leu Leu1 5 10 15Leu Leu Phe Ala Gln Gln Leu Ala Ser His Pro Thr Glu Gln Ile Gln20 25 30Ala Ile Leu Ala Pro Trp Val Pro Ala Ala Leu Gln Asp Val Val Leu35 40 45Tyr Asn Arg Pro Arg Val Ile Ile Pro Gln Gly Thr Val Val Gly Thr50 55 60Thr Leu Thr Asp Thr Leu Lys Ser Pro Val Asp Ala Phe Arg Gly Ile65 70 75 80Pro Tyr Ala Leu Pro Pro Ile Gly Asp Arg Arg Phe Arg Arg Ala Glu
85 90 95Ala Val His Ala Thr Asp Glu Ile Ile Asp Ala Ser Glu Phe Gly Pro100 105 110Arg Cys Pro Gly Lys Gln Leu Leu Asn Pro Asn Asp Ile Gly Gly Asp115 120 125Glu Asp Cys Leu Thr Val Asn Val Phe Arg Pro His Gly Ala Gln Gly130 135 140Lys Leu Pro Val Ala Val Tyr Val His Gly Gly Ala Tyr Asn Arg Gly145 150 155 160Thr Ala Lys Tyr Pro Ala Ser Gly His Asn Thr Ala Ser Met Val Gly165 170 175Trp Ser Asp Glu Pro Phe Val Ala Val Ser Phe Asn Tyr Arg Ile Gly180 185 190Ala Leu Gly Phe Leu Pro Ser Thr Leu Thr Ala Lys Glu Gly Ile Leu195 200 205Asn Leu Gly Leu His Asp Gln Ile Leu Leu Leu Gln Trp Val Gln Glu210 215 220Asn Ile Ala His Phe Asn Gly Asp Pro Thr Gln Val Thr Leu Ile Gly225 230 235 240Leu Ser Ala Gly Ala His Ser Ile Ala His His Ile Met Asn Tyr Asn245 250 255Pro Pro Asn Thr Pro Leu Phe His Arg Ala Ile Ile Glu Ser Gly Ala260 265 270Ala Thr Ser Arg Ala Val His Pro Tyr Asn Ala Ser Leu His Glu Ser275 280 285Gln Phe Thr Asp Phe Leu Thr Glu Thr Gly Cys Thr Asn Leu Pro Asp290 295 300Thr Ala Ile Leu Pro Cys Leu Arg Ala Leu Pro Ser Ser Ala Ile Thr305 310 315 320Thr Ala Ser Ile Ser Val Phe Asp Lys Tyr Asn Pro Ser Ile Arg Trp325 330 335Ala Phe Gln Pro Val Ile Asp His Glu Ile Ile His Arg Arg Pro Ile340 345 350Asp Ala Trp Arg Ser Gly Lys Trp Asn Arg Met Pro Ile Leu Thr Gly355 360 365Phe Asn Ser Asn Glu Gly Thr Tyr Tyr Val Pro Arg Asn Leu Ser Leu370 375 380Ser Glu Asp Phe Thr Ser Phe Phe Arg Thr Leu Leu Pro Ala Tyr Pro385 390 395 400Glu Ser Asp Ile Gln Thr Ile Asp Glu Ile Tyr Pro Asp Pro Asn Val405 410 415Tyr Ala Thr Ala Ser Pro Tyr Leu Glu Thr Arg Pro Ile Pro Ser Leu420 425 430Gly Arg Gln Phe Lys Arg Leu Glu Ala Ala Tyr Gly His Tyr Ala Tyr
435 440 445Ala Cys Pro Val Arg Gln Thr Ala Gly Phe Val Ala Asn Asp Asp Gly450 455 460Cys Gly Glu Pro Val Phe Leu Tyr Arg Trp Ala Leu Asn Lys Thr Val465 470 475 480Ile Gly Gly Ala Asn His Gly Asp Gln Met Glu Tyr Glu Thr Phe Asn485 490 495Pro Ala Val Arg Asp Ile Ser Glu Ala Gln Arg Glu Val Ala Gly Leu500 505 510Phe His Ala Tyr Val Thr Ser Phe Val Val His Gly Asp Pro Asn Val515 520 525Leu Gly Gly Arg Tyr Glu Gly Arg Glu Val Trp Glu Arg Tyr Ser Gly530 535 540Glu Gly Gly Glu Val Met Val Phe Gly Glu Gly Asn Asp Glu Arg Ala545 550 555 560Gly Gly Asp Gly Val Gly Val Ala Ala Arg Leu Lys Arg Asp Glu Trp565 570 575Gly Val Lys Glu Cys Gly Phe Trp Ser Gly Arg Ser Gly Ile Ser Glu580 585 590<210>25<211>3932<212>DNA<213>黑曲霉(Aspergillus niger)<400>25cagataacgt tttgagtttg gggatcttga ttatctcggc tccaaacaga ctcgcctatc60cgagagatca agtacataat gcaactagct attagtcaaa tataacgccg gcagaagtct120attttgtcct tttctctttc tttcctcgaa gaaaacccgt ggattaactt gagccggtcg180gcctcaaagt cggctcaacc ggcgcgttgc caactttaaa tgcagacaac catcgtttcc240ggccgttgtg ggggcgatgt agatcagatc caaattccca aaacatccat ggggtaaatc300aagaattgag gttacatcga ccgatagggc tcttaatcca accctcttca cggggaaaac360cttctatatg atacatggtt tactcctctg tttctcttcc tccccggagg tgccaaatcc420gggcgcatcg tgtctattct tagcaaccag cgaatttgac aaattgatcc aatcccatag480aatcagagta actctacaac ccaatcagtc gcctaatacg cacagcaaaa gaagatgcat540tcggacagcc aacgcaagaa aagagattaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa600aaaaggcctc ccctcatcac ctcaccaaag tcgcaatcaa tcagcgacca ctagctacat660cgcgactgaa cgatagcatt ccgcatggtg ttaaagttca agacagttgc tatgcttgcc720cgaaccttta cacattcttg ccctttccgt agaattccaa gctcatcgga cagagagtag780tgtttctgtg aatgtggtgg tttaccaccg ttacctctgc tgtctatcac ttgctcctac840ccctgagcac aggcaccata gttacaacac ccccacgggg ccattgtctg ttttcagctt900cagcttcgtc gacaatggac tgtcatatcc cctcatctca aaagaatgtc ggaaacactg960tatggcatgg cgtgtgggaa ccgatcaatt tgtataatat cttaggccca cctcttcccc1020tccgagaggt ttgacatcag ggggtttcag agatagtccg tcgatattta tggcttcctc1080
tgtcttcttg ccgctacttg cggcctcatt actgcccaca ctcgcttcta cacagaatgc1140cgatacaccg acatccgctc ctactgtgca agtccgcaat ggcacatacg agggtctcta1200taatcccacg tacaatcagg acttgttcct cggcataccg tatgcgcagc ctccggttgg1260tgagctacga ttccgtccac cacaaccgct caacacgacg tggactggca ctcgaaatgc1320aacagcctat tacaatgaat gtatcggtta tggtagcgac gactggtatt ggaccgacgt1380agtctccgaa gattgtctcg ctctcagtgt gattcgacct cacggcatcg actcaagcgc1440gaagctgccc gtcgtcttct ggatgcatgg tggagaattc gcagaaggag gcactcgcga1500ctcccgttac aacctctcct acatcgtcca acaatcccag gagatgcaat ctcccatcat1560tggcgtgact gtcaactacc gcctttcggg atggggattc ctctatagcc aggaagtcgc1620cgacgaaggc tccgccaact taggactccg cgaccaacgg cacgctctgt actggctcca1680agagaatatc gcttccttcg gcggcgaccc gtcgcggctc accatctggg gccaaagtgc1740cggtgccaac agcgtcggtc tccatttagt ggcatacgac ggccagaatg atggcatctt1800ccgtgccggg atcgccgaga gcggctccgt accctccctc gcagcataca tgagcgccga1860agatgcacaa ccatactatg atgccgtcgt caacgcaacc aactgcaccg gctcttccaa1920cacccttact tgtctccgtg aagttcccac cgacgtcctc agctccatct tcaacagctc1980cctcgtcgct ggggcaggat atcatcccgt cattgacggc gatttcctca gagcctcggg2040gatagttaat ctccagactg gccaattcgc caaaaccccg cttcttatcg gcaccaactt2100cgacgaaggg accaagtatg cccctcatgg ctataatacc accgaccaat ttgtctccct2160cgtccaagcc aacggaacca attataccag cgctctcacc attgcatccc tgtacccaga2220tgacccagcc gttggtattc cgggaaccct tcaaggtcgt cccccaccgt catacggtta2280ccagtggaag cgcgtggctg ccttcctcgg cgatctgctc atgcacgcgc ctcgccgcgt2340gacaacccag tggctggcac actggaatgt acctgcctac gtgtatcact ggaacgtgat2400gacactaggg ccattagatg gagccgcgca tggctatgaa gtccccttca gtttccataa2460ttatgatggt ttgggcgatg aacggggaaa cgacagcgtg acctggccac aactatcgac2520tatgatgtca cggatgtggg tgagctttat taatcatttg gatccgaatt atagtaatag2580tgagtgattt gccccaccta cctctggaca ctgctttagg agcttgaggg taaggaagga2640tgctgacacg ctgctctgct agtgacggat atccactggc ctgtctacac aacagaaacc2700ccgcaaaata tggtctttga tgtcaatgtg actggactgg cttatgttga accagatacc2760tatagagcgg agggaattgc gtatatcact agcattctgc agagtgcctt taatcggtag2820ggtagactag aggcttcaat atcaatagat atcacacata caggagagca gcccatgttt2880ccctccagat caagagctat tccgttaaaa ggtagtgcat ccccgcaccg gggggaaggc2940cggggagtgc ttacctctgt gtgaaactag aattccagca acgatggttt tagaaaggcc3000agatctgttg actcattgtt tgatcctccg atgttgcatc cgagaaagct tctgcttggt3060cgtgccaagg atgttaacag ctgctgttga ggcaactcta gaaaccccat agacctttac3120tatctcgctg actagagggt acagtaggtc ctactttgaa ttccttggcg gttgggattt3180cgcggaaggt tgtctcaacc ctcaatgctt gtcacgacag acggcttggc aatgagacga3240gaccacgggc gattgacatg tgtcaagcag tagctatcgg gaatctgaaa aagcatggct3300gtcatggact ttgcaggcaa aggctgtctg ttctagacca tcggctagag cgcggtgagc3360atactaggcg agctgaaaag cctagaagcg gttgccggtt atccgctttg tttgtgccct3420ttccgtttcc gggcgtaggc aatcacattt aggcaatgcc gtgtgggcct tggagatctc3480acctaacctt attgcatttt acctcacggt gatacaacct gagtgactat cagggaaact3540gagcctattg atcatcacat attagcacca cacaaagctg ccaaggaaca atagtaatgt3600gagcgccaag gagatatctt tgaactttgt ctccagatct tgtactacat acccagccag3660acaggggttc gtatcgatgg ctccacagcg ggatatcatg aatcttcatg tcgtcacgac3720
tcatacctcg agcgataggg ccgggtatta ctccatctgg aaattgtcat gactgtagag3780ctcagctgtc cgggatacga gcattatccg tcagtttata aattccaggg ccatcctgct3840caatctcaac atgtgggctc ttacgctgtc atcatattag ttagggtcca agagaatcac3900agaatcattg gcattgttct tcatcgttcc aa 3932<210>26<211>1518<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1518)<400>26atg gct tcc tct gtc ttc ttg ccg cta ctt gcg gcc tca tta ctg ccc48Met Ala Ser Ser Val Phe Leu Pro Leu Leu Ala Ala Ser Leu Leu Pro1 5 10 15aca ctc gct tct aca cag aat gcc gat aca ccg aca tcc gct cct act96Thr Leu Ala Ser Thr Gln Asn Ala Asp Thr Pro Thr Ser Ala Pro Thr20 25 30gtg caa gtc cgc aat ggc aca tac gag ggt ctc tat aat ccc acg tac144Val Gln Val Arg Asn Gly Thr Tyr Glu Gly Leu Tyr Asn Pro Thr Tyr35 40 45aat cag gac ttg ttc ctc ggc ata ccg tat gcg cag cct ccg gtt ggt192Asn Gln Asp Leu Phe Leu Gly Ile Pro Tyr Ala Gln Pro Pro Val Gly50 55 60gag cta cga ttc cgt cca cca caa ccg ctc aac acg acg tgg act ggc240Glu Leu Arg Phe Arg Pro Pro Gln Pro Leu Asn Thr Thr Trp Thr Gly65 70 75 80act cga aat gca aca gcc tat tac aat gaa tgt atc ggt tat ggt agc288Thr Arg Asn Ala Thr Ala Tyr Tyr Asn Glu Cys Ile Gly Tyr Gly Ser85 90 95gac gac tgg tat tgg acc gac gta gtc tcc gaa gat tgt ctc gct ctc336Asp Asp Trp Tyr Trp Thr Asp Val Val Ser Glu Asp Cys Leu Ala Leu100 105 110agt gtg att cga cct cac ggc atc gac tca agc gcg aag ctg ccc gtc384Ser Val Ile Arg Pro His Gly Ile Asp Ser Ser Ala Lys Leu Pro Val115 120 125gtc ttc tgg atg cat ggt gga gaa ttc gca gaa gga ggc act cgc gac432Val Phe Trp Met His Gly Gly Glu Phe Ala Glu Gly Gly Thr Arg Asp130 135 140tcc cgt tac aac ctc tcc tac atc gtc caa caa tcc cag gag atg caa480
Ser Arg Tyr Asn Leu Ser Tyr Ile Val Gln Gln Ser Gln Glu Met Gln145 150 155 160tct ccc atc att ggc gtg act gtc aac tac cgc ctt tcg gga tgg gga528Ser Pro Ile Ile Gly Val Thr Val Asn Tyr Arg Leu Ser Gly Trp Gly165 170 175ttc ctc tat agc cag gaa gtc gcc gac gaa ggc tcc gcc aac tta gga576Phe Leu Tyr Ser Gln Glu Val Ala Asp Glu Gly Ser Ala Asn Leu Gly180 185 190ctc cgc gac caa cgg cac gct ctg tac tgg ctc caa gag aat atc gct624Leu Arg Asp Gln Arg His Ala Leu Tyr Trp Leu Gln Glu Asn Ile Ala195 200 205tcc ttc ggc ggc gac ccg tcg cgg ctc acc atc tgg ggc caa agt gcc672Ser Phe Gly Gly Asp Pro Ser Arg Leu Thr Ile Trp Gly Gln Ser Ala210 215 220ggt gcc aac agc gtc ggt ctc cat tta gtg gca tac gac ggc cag aat720Gly Ala Asn Ser Val Gly Leu His Leu Val Ala Tyr Asp Gly Gln Asn225 230 235 240gat ggc atc ttc cgt gcc ggg atc gcc gag agc ggc tcc gta ccc tcc768Asp Gly Ile Phe Arg Ala Gly Ile Ala Glu Ser Gly Ser Val Pro Ser245 250 255ctc gca gca tac atg agc gcc gaa gat gca caa cca tac tat gat gcc816Leu Ala Ala Tyr Met Ser Ala Glu Asp Ala Gln Pro Tyr Tyr Asp Ala260 265 270gtc gtc aac gca acc aac tgc acc ggc tct tcc aac acc ctt act tgt864Val Val Asn Ala Thr Asn Cys Thr Gly Ser Ser Asn Thr Leu Thr Cys275 280 285ctc cgt gaa gtt ccc acc gac gtc ctc agc tcc atc ttc aac agc tcc912Leu Arg Glu Val Pro Thr Asp Val Leu Ser Ser Ile Phe Asn Ser Ser290 295 300ctc gtc gct ggg gca gga tat cat ccc gtc att gac ggc gat ttc ctc960Leu Val Ala Gly Ala Gly Tyr His Pro Val Ile Asp Gly Asp Phe Leu305 310 315 320aga gcc tcg ggg ata gtt aat ctc cag act ggc caa ttc gcc aaa acc1008Arg Ala Ser Gly Ile Val Asn Leu Gln Thr Gly Gln Phe Ala Lys Thr325 330 335ccg ctt ctt atc ggc acc aac ttc gac gaa ggg acc aag tat gcc cct1056Pro Leu Leu Ile Gly Thr Asn Phe Asp Glu Gly Thr Lys Tyr Ala Pro340 345 350cat ggc tat aat acc acc gac caa ttt gtc tcc ctc gtc caa gcc aac1104His Gly Tyr Asn Thr Thr Asp Gln Phe Val Ser Leu Val Gln Ala Asn355 360 365gga acc aat tat acc agc gct ctc acc att gca tcc ctg tac cea gat1152Gly Thr Asn Tyr Thr Ser Ala Leu Thr Ile Ala Ser Leu Tyr Pro Asp370 375 380
gac cca gcc gtt ggt att ccg gga acc ctt caa ggt cgt ccc cca ccg1200Asp Pro Ala Val Gly Ile Pro Gly Thr Leu Gln Gly Arg Pro Pro Pro385 390 395 400tca tac ggt tac cag tgg aag cgc gtg gct gcc ttc ctc ggc gat ctg1248Ser Tyr Gly Tyr Gln Trp Lys Arg Val Ala Ala Phe Leu Gly Asp Leu405 410 415ctc atg cac gcg cct cgc cgc gtg aca acc cag tgg ctg gca cac tgg1296Leu Met His Ala Pro Arg Arg Val Thr Thr Gln Trp Leu Ala His Trp420 425 430aat gta cct gcc tac gtg tat cac tgg aac gtg atg aca cta ggg cca1344Asn Val Pro Ala Tyr Val Tyr His Trp Asn Val Met Thr Leu Gly Pro435 440 445tta gat gga gcc gcg cat ggc tat gaa gtc ccc ttc agt ttc cat aat1392Leu Asp Gly Ala Ala His Gly Tyr Glu Val Pro Phe Ser Phe His Asn450 455 460tat gat ggt ttg ggc gat gaa cgg gga aac gac agc gtg acc tgg cca1440Tyr Asp Gly Leu Gly Asp Glu Arg Gly Asn Asp Ser Val Thr Trp Pro465 470 475 480caa cta tcg act atg atg tca cgg atg tgg gtg agc ttt att aat cat1488Gln Leu Ser Thr Met Met Ser Arg Met Trp Val Ser Phe Ile Asn His485 490 495ttg gat ccg aat tat agt aat agt gag tga15Leu Asp Pro Asn Tyr Ser Asn Ser Glu500 505<210>27<211>505<212>PRT<213>黑曲霉(Aspergillus niger)<400>27Met Ala Ser Ser Val Phe Leu Pro Leu Leu Ala Ala Ser Leu Leu Pro1 5 10 15Thr Leu Ala Ser Thr Gln Asn Ala Asp Thr Pro Thr Ser Ala Pro Thr20 25 30Val Gln Val Arg Asn Gly Thr Tyr Glu Gly Leu Tyr Asn Pro Thr Tyr35 40 45Asn Gln Asp Leu Phe Leu Gly Ile Pro Tyr Ala Gln Pro Pro Val Gly50 55 60Glu Leu Arg Phe Arg Pro Pro Gln Pro Leu Asn Thr Thr Trp Thr Gly65 70 75 80Thr Arg Asn Ala Thr Ala Tyr Tyr Asn Glu Cys Ile Gly Tyr Gly Ser85 90 95
Asp Asp Trp Tyr Trp Thr Asp Val Val Ser Glu Asp Cys Leu Ala Leu100 105 110Ser Val Ile Arg Pro His Gly Ile Asp Ser Ser Ala Lys Leu Pro Val115 120 125Val Phe Trp Met His Gly Gly Glu Phe Ala Glu Gly Gly Thr Arg Asp130 135 140Ser Arg Tyr Asn Leu Ser Tyr Ile Val Gln Gln Ser Gln Glu Met Gln145 150 155 160Ser Pro Ile Ile Gly Val Thr Val Asn Tyr Arg Leu Ser Gly Trp Gly165 170 175Phe Leu Tyr Ser Gln Glu Val Ala Asp Glu Gly Ser Ala Asn Leu Gly180 185 190Leu Arg Asp Gln Arg His Ala Leu Tyr Trp Leu Gln Glu Asn Ile Ala195 200 205Ser Phe Gly Gly Asp Pro Ser Arg Leu Thr Ile Trp Gly Gln Ser Ala210 215 220Gly Ala Asn Ser Val Gly Leu His Leu Val Ala Tyr Asp Gly Gln Asn225 230 235 240Asp Gly Ile Phe Arg Ala Gly Ile Ala Glu Ser Gly Ser Val Pro Ser245 250 255Leu Ala Ala Tyr Met Ser Ala Glu Asp Ala Gln Pro Tyr Tyr Asp Ala260 265 270Val Val Asn Ala Thr Asn Cys Thr Gly Ser Ser Asn Thr Leu Thr Cys275 280 285Leu Arg Glu Val Pro Thr Asp Val Leu Ser Ser Ile Phe Asn Ser Ser290 295 300Leu Val Ala Gly Ala Gly Tyr His Pro Val Ile Asp Gly Asp Phe Leu305 310 315 320Arg Ala Ser Gly Ile Val Asn Leu Gln Thr Gly Gln Phe Ala Lys Thr325 330 335Pro Leu Leu Ile Gly Thr Asn Phe Asp Glu Gly Thr Lys Tyr Ala Pro340 345 350His Gly Tyr Asn Thr Thr Asp Gln Phe Val Ser Leu Val Gln Ala Asn355 360 365Gly Thr Asn Tyr Thr Ser Ala Leu Thr Ile Ala Ser Leu Tyr Pro Asp370 375 380Asp Pro Ala Val Gly Ile Pro Gly Thr Leu Gln Gly Arg Pro Pro Pro385 390 395 400Ser Tyr Gly Tyr Gln Trp Lys Arg Val Ala Ala Phe Leu Gly Asp Leu405 410 415Leu Met His Ala Pro Arg Arg Val Thr Thr Gln Trp Leu Ala His Trp420 425 430Asn Val Pro Ala Tyr Val Tyr His Trp Asn Val Met Thr Leu Gly Pro435 440 445
Leu Asp Gly Ala Ala His Gly Tyr Glu Val Pro Phe Ser Phe His Asn450 455 460Tyr Asp Gly Leu Gly Asp Glu Arg Gly Asn Asp Ser Val Thr Trp Pro465 470 475 480Gln Leu Ser Thr Met Met Ser Arg Met Trp Val Ser Phe Ile Asn His485 490 495Leu Asp Pro Asn Tyr Ser Asn Ser Glu500 505<210>28<211>3091<212>DNA<213>黑曲霉(Aspergillus niger)<400>28ggcgaacggg cctgagcgtg cgtcggaggc agaagtagag ccgggactat ggatattggc60gaggaatata ttatagtaga ttatagggag tcgaatgcag ctcggattgg gttgttactt120tgagtcagat ggacattgtt ggaaaagatg aacgcgacgg gaaaaaaaca tgaggatttg180cggggatttc gtcacatgcg gaggcgcgga ttttcccctc cggatttact tcctcaactc240tcctttctct ttcatttcca tccgatttga gtccaactca tctcactcga agaatctcat300taatttcagg gtcctgctca gcccagtcaa ggttccttag tttcgatcct tcagttggcc360cgtcatgtcc attgaccagg aatggagcaa gccccgatga ggatcggcca gcggagacaa420ctgccaatcc ttggtatcca tacccttaac agcgcaatgg caccagctct ctgccgattc480acgtcatctg cacagcctag ctgccgatta ggcttgaccc cttctcactt gcggcatcag540tgccgctgat actagccccc acagagtgtt tctcccttcg actgtggctc ggaacgtggg600ggcgggttcc aagttcttat gcccagagtt ggttggctag ccttgctcat ctgggtggcc660agcacacctc ccatacaata ggatccgtgg tgttggcagg attcttgtca tttcgccatg720tcgaatcacc gcatgcggaa ggaggacgcc ttgccttgca atgttttctc cacatctgcg780accctattgt tcagaccctg gagccgattc cgcgagatgt attcctgccg ggccactgaa840agtgctttat aacgtctggg gtgtcctttt attgatgaga gcatgatctt tcgcgttaca900gttctcacaa tcggttaaag cattcgtggc cccgaggctc gttgcacaac acaatatgat960tttctttcat ctggcaccgt tcttctttct ctttggtcta gtagtatctt ctcagaaccc1020tacggtggac cttggctaca caagatataa aggcaaatct ctgcccaatg gtatcagtca1080gtggctgggg atacgctacg cggctgcacc taccgggtct ctgcggttct ctgcgccaca1140ggatcctgac acggtagatg gcgttcaaga agcattcaag gtatggtttt ttctacaata1200aataaaaaga tatattgcga gtctgtgctt tgctaatacc cagggcacag catggtcccc1260ggtgtgttcc caccagccaa tatcccactc ccgcaggcac gtccgaggat tgtctcttcc1320tcgatgtata cgctcccagc tcggtggaag ctactacgag gctgcccgtt ttcgtttgga1380ttcaaggagg cggcttcaat gccaactcca gccccaacta caatggaaca ggattgatcg1440aagcggccaa tatgtccatg gtggtggtca ccttcaacta cagggtcggt ccgtacgggt1500tcctctctgg atccgaggtg ctggagggag gaagcgtgaa caatggcctg aaggaccaaa1560tcaaggtcct gaagtgggtg caagagcata tcagcaaggt atgcggacac tcaccaaccc1620acagcaaatc accgctaatt gcagccgcag tttggaggcg atcccagtca cgttgttatc1680
ggcggcgaca gcgcaggcgc agcgtctatc actctccatc tttcagccca cggtggcaga1740gacgacgaac tattccacgc tgccgccgca gagtcccaaa gctttgctcc tatgttgacc1800gtcaatcaaa gccaattcgc ctataacaac ctggtcatcc gcgccggctg cgcaagcgat1860tcagacaccc tcgcctgctt acgccgacta aacaccacag aactgcagcg catcaacatc1920aacacaccct tacccaccgc ccaacaagca cctctctacc tgtacggtcc cgtcgtcgac1980ggctccctca tcccagacta cacataccgg cttttccagc aaggcaaatt catcaaagtc2040cccgtaatct tcggcgacga caccaacgaa ggaacaatct tcgtccccaa aacgacctcc2100accgtcggcg aagccgacac cttcatccaa gaccaattcc ccaacatcaa cttcacccac2160ctaaccaagc tgaacgactg gtatctcaaa gaaaaccaaa ctcgcgagtt ccccaattcc2220tccccctact ggcgtcccgc tagcaccgcg tacggtgaaa tcagatatat ctgtccgggg2280atctacatgt cctctgtgtt tgctagtgcc ggtgtcaaca gctggaacta tcattatgct2340gtgcaggacc ccgccgcgga agcctcaggc agaggtgtca gtcatactgt ggaagaaaat2400gccatttggg gcccgcagta tgtgagtggc acaccgccgg cgtcgtatct cactgagaat2460gcgccaattg tgccggtgat gcagggctac tggacgagtt tcattagagt gtttgatccg2520aatccgctga ggtatccggg gagtccggag tggaagacgt ggagtgatgg acatggggag2580gattatcggc ggatatttgt ccgcacgaat gagacgagga tggagacggt gtcggaggcg2640cagagggaaa ggtgcgaata ttggagtagt gttgggccgg acttgtcgca gtgattgcac2700ttattatctt tgttcggtgg taaggtatat atatagatag tataatattg taagctatag2760agtgatggta cgtgaattga atatatggag aaagatggtc ttgtataaat caaaacattc2820ttttttggct gccattccac gatcatcatt cccaatgatc aaaccaagta actataaccg2880aatatataca tctatatcaa cctgcttctc atcagaatta ccaaaagacg ggtccggcac2940acacagctag accgagcaga tacgtcgaca tgaacccagg tgatgaaaca taatgcaaca3000aaagaaagag aaaagaaggc aaaacaagtg agaagcacta ctgctccaca tagagcagta3060aacgaacgat gaatgaggga tatcatcatc a 3091<210>29<211>1617<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1617)<400>29atg att ttc ttt cat ctg gca ccg ttc ttc ttt ctc ttt ggt cta gta48Met Ile Phe Phe His Leu Ala Pro Phe Phe Phe Leu Phe Gly Leu Val1 5 10 15gta tct tct cag aac cct acg gtg gac ctt ggc tac aca aga tat aaa96Val Ser Ser Gln Asn Pro Thr Val Asp Leu Gly Tyr Thr Arg Tyr Lys20 25 30ggc aaa tct ctg ccc aat ggt atc agt cag tgg ctg ggg ata cgc tac144Gly Lys Ser Leu Pro Asn Gly Ile Ser Gln Trp Leu Gly Ile Arg Tyr
35 40 45gcg gct gca cct acc ggg tct ctg cgg ttc tct gcg cca cag gat cct192Ala Ala Ala Pro Thr Gly Ser Leu Arg Phe Ser Ala Pro Gln Asp Pro50 55 60gac acg gta gat ggc gtt caa gaa gca ttc aag cat ggt ccc cgg tgt240Asp Thr Val Asp Gly Val Gln Glu Ala Phe Lys His Gly Pro Arg Cys65 70 75 80gtt ccc acc agc caa tat ccc act ccc gca ggc acg tcc gag gat tgt288Val Pro Thr Ser Gln Tyr Pro Thr Pro Ala Gly Thr Ser Glu Asp Cys85 90 95ctc ttc ctc gat gta tac gct ccc agc tcg gtg gaa gct act acg agg336Leu Phe Leu Asp Val Tyr Ala Pro Ser Ser Val Glu Ala Thr Thr Arg100 105 110ctg ccc gtt ttc gtt tgg att caa gga ggc ggc ttc aat gcc aac tcc384Leu Pro Val Phe Val Trp Ile Gln Gly Gly Gly Phe Asn Ala Asn Ser115 120 125agc ccc aac tac aat gga aca gga ttg atc gaa gcg gcc aat atg tcc432Ser Pro Asn Tyr Asn Gly Thr Gly Leu Ile Glu Ala Ala Asn Met Ser130 135 140atg gtg gtg gtc acc ttc aac tac agg gtc ggt ccg tac ggg ttc ctc480Met Val Val Val Thr Phe Asn Tyr Arg Val Gly Pro Tyr Gly Phe Leu145 150 155 160tct gga tcc gag gtg ctg gag gga gga agc gtg aac aat ggc ctg aag528Ser Gly Ser Glu Val Leu Glu Gly Gly Ser Val Asn Asn Gly Leu Lys165 170 175gac caa atc aag gtc ctg aag tgg gtg caa gag cat atc agc aag ttt576Asp Gln Ile Lys Val Leu Lys Trp Val Gln Glu His Ile Ser Lys Phe180 185 190gga ggc gat ccc agt cac gtt gtt atc ggc ggc gac agc gca ggc gca624Gly Gly Asp Pro Ser His Val Val Ile Gly Gly Asp Ser Ala Gly Ala195 200 205gcg tct atc act ctc cat ctt tca gcc cac ggt ggc aga gac gac gaa672Ala Ser Ile Thr Leu His Leu Ser Ala His Gly Gly Arg Asp Asp Glu210 215 220cta ttc cac gct gcc gcc gca gag tcc caa agc ttt gct cct atg ttg720Leu Phe His Ala Ala Ala Ala Glu Ser Gln Ser Phe Ala Pro Met Leu225 230 235 240acc gtc aat caa agc caa ttc gcc tat aac aac ctg gtc atc cgc gcc768Thr Val Asn Gln Ser Gln Phe Ala Tyr Asn Asn Leu Val Ile Arg Ala245 250 255ggc tgc gca agc gat tca gac acc ctc gcc tgc tta cgc cga cta aac816Gly Cys Ala Ser Asp Ser Asp Thr Leu Ala Cys Leu Arg Arg Leu Asn260 265 270acc aca gaa ctg cag cgc atc aac atc aac aca ccc tta ccc acc gcc864
Thr Thr Glu Leu Gln Arg Ile Asn Ile Asn Thr Pro Leu Pro Thr Ala275 280 285caa caa gca cct ctc tac ctg tac ggt ccc gtc gtc gac ggc tcc ctc912Gln Gln Ala Pro Leu Tyr Leu Tyr Gly Pro Val Val Asp Gly Ser Leu290 295 300atc cca gac tac aca tac cgg ctt ttc cag caa ggc aaa ttc atc aaa960Ile Pro Asp Tyr Thr Tyr Arg Leu Phe Gln Gln Gly Lys Phe Ile Lys305 310 315 320gtc ccc gta atc ttc ggc gac gac acc aac gaa gga aca atc ttc gtc1008Val Pro Val Ile Phe Gly Asp Asp Thr Asn Glu Gly Thr Ile Phe Val325 330 335ccc aaa acg acc tcc acc gtc ggc gaa gcc gac acc ttc atc caa gac1056Pro Lys Thr Thr Ser Thr Val Gly Glu Ala Asp Thr Phe Ile Gln Asp340 345 350caa ttc ccc aac atc aac ttc acc cac cta acc aag ctg aac gac tgg1104Gln Phe Pro Asn Ile Asn Phe Thr His Leu Thr Lys Leu Asn Asp Trp355 360 365tat ctc aaa gaa aac caa act cgc gag ttc ccc aat tcc tcc ccc tac1152Tyr Leu Lys Glu Asn Gln Thr Arg Glu Phe Pro Asn Ser Ser Pro Tyr370 375 380tgg cgt ccc gct agc acc gcg tac ggt gaa atc aga tat atc tgt ccg1200Trp Arg Pro Ala Ser Thr Ala Tyr Gly Glu Ile Arg Tyr Ile Cys Pro385 390 395 400ggg atc tac atg tcc tct gtg ttt gct agt gcc ggt gtc aac agc tgg1248Gly Ile Tyr Met Ser Ser Val Phe Ala Ser Ala Gly Val Asn Ser Trp405 410 415aac tat cat tat gct gtg cag gac ccc gcc gcg gaa gcc tca ggc aga1296Asn Tyr His Tyr Ala Val Gln Asp Pro Ala Ala Glu Ala Ser Gly Arg420 425 430ggt gtc agt cat act gtg gaa gaa aat gcc att tgg ggc ccg cag tat1344Gly Val Ser His Thr Val Glu Glu Asn Ala Ile Trp Gly Pro Gln Tyr435 440 445gtg agt ggc aca ccg ccg gcg tcg tat ctc act gag aat gcg cca att1392Val Ser Gly Thr Pro Pro Ala Ser Tyr Leu Thr Glu Asn Ala Pro Ile450 455 460gtg ccg gtg atg cag ggc tac tgg acg agt ttc att aga gtg ttt gat1440Val Pro Val Met Gln Gly Tyr Trp Thr Ser Phe Ile Arg Val Phe Asp465 470 475 480ccg aat ccg ctg agg tat ccg ggg agt ccg gag tgg aag acg tgg agt1488Pro Asn Pro Leu Arg Tyr Pro Gly Ser Pro Glu Trp Lys Thr Trp Ser485 490 495gat gga cat ggg gag gat tat cgg cgg ata ttt gtc cgc acg aat gag1536Asp Gly His Gly Glu Asp Tyr Arg Arg Ile Phe Val Arg Thr Asn Glu500 505 510
acg agg atg gag acg gtg tcg gag gcg cag agg gaa agg tgc gaa tat1584Thr Arg Met Glu Thr Val Ser Glu Ala Gln Arg Glu Arg Cys Glu Tyr515 520 525tgg agt agt gtt ggg ccg gac ttg tcg cag tga1617Trp Ser Ser Val Gly Pro Asp Leu Ser Gln530 535<210>30<211>538<212>PRT<213>黑曲霉(Aspergillus niger)<400>30Met Ile Phe Phe His Leu Ala Pro Phe Phe Phe Leu Phe Gly Leu Val1 5 10 15Val Ser Ser Gln Asn Pro Thr Val Asp Leu Gly Tyr Thr Arg Tyr Lys20 25 30Gly Lys Ser Leu Pro Asn Gly Ile Ser Gln Trp Leu Gly Ile Arg Tyr35 40 45Ala Ala Ala Pro Thr Gly Ser Leu Arg Phe Ser Ala Pro Gln Asp Pro50 55 60Asp Thr Val Asp Gly Val Gln Glu Ala Phe Lys His Gly Pro Arg Cys65 70 75 80Val Pro Thr Ser Gln Tyr Pro Thr Pro Ala Gly Thr Ser Glu Asp Cys85 90 95Leu Phe Leu Asp Val Tyr Ala Pro Ser Ser Val Glu Ala Thr Thr Arg100 105 110Leu Pro Val Phe Val Trp Ile Gln Gly Gly Gly Phe Asn Ala Asn Ser115 120 125Ser Pro Asn Tyr Asn Gly Thr Gly Leu Ile Glu Ala Ala Asn Met Ser130 135 140Met Val Val Val Thr Phe Asn Tyr Arg Val Gly Pro Tyr Gly Phe Leu145 150 155 160Ser Gly Ser Glu Val Leu Glu Gly Gly Ser Val Asn Asn Gly Leu Lys165 170 175Asp Gln Ile Lys Val Leu Lys Trp Val Gln Glu His Ile Ser Lys Phe180 185 190Gly Gly Asp Pro Ser His Val Val Ile Gly Gly Asp Ser Ala Gly Ala195 200 205Ala Ser Ile Thr Leu His Leu Ser Ala His Gly Gly Arg Asp Asp Glu210 215 220Leu Phe His Ala Ala Ala Ala Glu Ser Gln Ser Phe Ala Pro Met Leu225 230 235 240
Thr Val Asn Gln Ser Gln Phe Ala Tyr Asn Asn Leu Val Ile Arg Ala245 250 255Gly Cys Ala Ser Asp Ser Asp Thr Leu Ala Cys Leu Arg Arg Leu Asn260 265 270Thr Thr Glu Leu Gln Arg Ile Asn Ile Asn Thr Pro Leu Pro Thr Ala275 280 285Gln Gln Ala Pro Leu Tyr Leu Tyr Gly Pro Val Val Asp Gly Ser Leu290 295 300Ile Pro Asp Tyr Thr Tyr Arg Leu Phe Gln Gln Gly Lys Phe Ile Lys305 310 315 320Val Pro Val Ile Phe Gly Asp Asp Thr Asn Glu Gly Thr Ile Phe Val325 330 335Pro Lys Thr Thr Ser Thr Val Gly Glu Ala Asp Thr Phe Ile Gln Asp340 345 350Gln Phe Pro Asn Ile Asn Phe Thr His Leu Thr Lys Leu Asn Asp Trp355 360 365Tyr Leu Lys Glu Asn Gln Thr Arg Glu Phe Pro Asn Ser Ser Pro Tyr370 375 380Trp Arg Pro Ala Ser Thr Ala Tyr Gly Glu Ile Arg Tyr Ile Cys Pro385 390 395 400Gly Ile Tyr Met Ser Ser Val Phe Ala Ser Ala Gly Val Asn Ser Trp405 410 415Asn Tyr His Tyr Ala Val Gln Asp Pro Ala Ala Glu Ala Ser Gly Arg420 425 430Gly Val Ser His Thr Val Glu Glu Asn Ala Ile Trp Gly Pro Gln Tyr435 440 445Val Ser Gly Thr Pro Pro Ala Ser Tyr Leu Thr Glu Asn Ala Pro Ile450 455 460Val Pro Val Met Gln Gly Tyr Trp Thr Ser Phe Ile Arg Val Phe Asp465 470 475 480Pro Asn Pro Leu Arg Tyr Pro Gly Ser Pro Glu Trp Lys Thr Trp Ser485 490 495Asp Gly His Gly Glu Asp Tyr Arg Arg Ile Phe Val Arg Thr Asn Glu500 505 510Thr Arg Met Glu Thr Val Ser Glu Ala Gln Arg Glu Arg Cys Glu Tyr515 520 525Trp Ser Ser Val Gly Pro Asp Leu Ser Gln530 535<210>31<211>4575<212>DNA<213>黑曲霉(Aspergillus niger)
<400>31gatgcaactt cagtgaaatt gagacgattg taactcatca tcgcatctca catggaaagg60ttgtacaccc aacaattaga cctcaacata tttcacggat attcctgcaa gatatataat120aaagccatca ctccactttg gtagatatgt tagccaaccg ggtttgagcg agtttcttga180atggactcat taagggtagg atcaattctg atgtccacaa ttggtcccta tttgccagat240gtaggcccag agaattcggt atcttgcaga tttgcgatgc tatcccggtt tccagtaaac300tattaggttc ggctcggtca caccagacag acacgactga cccatgcgct gccaggaatc360ctgataggcc tagcagtccc gcgtgcacat atcggcttgg tagaaaagga tagccgtgaa420tgtataatct ttcagatgac ggttaaatgc gtttctgtat ggtgagaagc tgtgtagatg480ggagatgagc tgtaaatggc ttcgcagtgg caacctctag gctgctgcag gccggaatac540tgcatggcgt gattttcgtc gtgaatcttg ttcatataca ggtgtaaaac acacgtaagg600aaaatcttgt tatagcaggg ttgaaaacag ttgctagaat tggcagtgac tgttgcggtt660gcaagggttt attttgcacc cttgaagtac actgcgcttg gtcaaaggca aatcacccca720tcaagtaata aatatatatc tctgttatca agtcggctcc tctagtagtg cagcctcagt780acagacaaca gggactaaca gcactcttgc tgttgagctt gagcgcacct cacctttctc840tccggcctct ttcgtatttg gcatttcaat ggcctgttat gggacttctg agcctgcttg900attgagtgat atggtagtgc gagcgcaaaa aaggtgattt tcaaacacca tgatgcaaag960tcagaggtaa gtgcgagagg gagatcagga ggaggagagc tttatataag gccgcgtagg1020cggcagagac ggcaagacat ctggtgaagt accagcattc agtgaatttt ataacagtat1080tatttgtcat cacgactctg cattgccttt aataagctcg gcgtaatttg gtagggaccc1140taggtttgga tagccccagg ggggcttggt gtcggttgtg gagcttgctg cccgagattc1200attttacacc tagtcaggga tccgggcggg ttttatacct ccctggaggc ggaatgtacc1260tttgttatca ctgaaaattc cggccatttt gttctatttt actggctatg gggtttgcca1320ctatcgctca catcctcgca aggcacctcc cgatactgca gtcaaacgtg ggagttgccg1380atagaaacta caagatcaaa tctcgttccc tgggttggac ggtcacattc ggtgaaagag1440gtttatcttc gctccaacca gcctttcatg tcgggcgctc agtgcataag atccaagcaa1500ttttaagcac tgtactccac tagtcacact gttttagcag tgcatgcttc tgaatcagga1560ctaaactccg atttttctca gtgaatactg ctaaagacaa ttatgatcct acagactatc1620tctgtgaaaa agcgcagtta acttctcgtc aatcatgaag ccattttgag cctttctccg1680tcaatcattc acccctactg ttgactatat cagccctaag ggaataaaac atttgccgta1740gaggtgaact ataactcaat caatgactga aagcttaacg tatctcacaa ttcatctcac1800cgtgaagagt catttacatt tacgatccag ccaggccgcg ctgacatcag caggcgtgag1860agcgcatcca tgcttgctcg gacataagcc gaatccattg catgatgcga ccttcccgaa1920agagtatggg tgtccgaact gaccatgtca gtggccccat atggctctca actacacgaa1980cacagacctt tatcagtccc ggtccccaca acttaaatcc ggagatgcgg gggtgcagga2040atggaacacg gatacatgtg tggaatgtag gaccaaacaa attggctgtc gtggacattc2100gactcgactt gacccctcaa tgcgctggcc ggaggactga gccatagggt ataagaacac2160cgtgatcact catgcctcgt tatcgctttt ctatcattat gtctcgatat caggaagaca2220tagcatgacc gtgaacacga tgaagggaat gctcccgacg cttagttggt tggcactggg2280catggccagc ctggcaacct gcaccaaccc agtagcccag acaaagaacg gaagttatta2340tggtgtctac atgcctcagt ataatgagga ttattttctt ggaattccat ttgctaagcc2400cccgttggca cacttgcgtt gggccaaccc cgagagtctt aatgagtctt ggtcgggatt2460gcgccctgct accggctatg cgatggtaag tagcctgaac agactgctaa acgaccatgt2520
acttactaac agcgcgtgtg ataggaatgt ataggttacg gcagtgatca aaaaggttat2580ctgcaggtga ggatttgacg ccactttctt tacgctgttc tctactaacc agcaaaatag2640agcgaggact gtctctacct aaacgtggtc cgtcccgctg aatacgacaa tgccagtctt2700ccagtccttg tatggattca tggtatgtag tgaaatctac ctcaacgaca agttactccc2760gacgctgaat gaacaaaaca ggcggtggct tcgcacaagg cggcactccc gaccttcgat2820acaatcttac atttattgtt gaacactcgg tcaatatcgg ccagccaatt atcgcagtga2880gcgttgccta tcgtctcggt ccttggggtt tcttcaatgg ggtcgagctc gccaatgagg2940gatcgttaaa tctcgggctg aaggaccagc gcttggccct gcattgggtg aaagagaaca3000ttgcaggttt cggtggtggg tttccataaa gctattaaac gtacacagtc caaaattact3060aatgacagtc actcctatac aggcgaccct agtaaagtcg tgatttacgg acaaagtgcc3120ggctccgaaa gcgtgggata ccaaatccgc gcgtacaacg gccgagatga cgggctcttc3180cgcggaggca tgatggagtc cggcgcggtg ttacctggca gtgccttgaa cctcacctgg3240acatatgagc cttggttcca gcaaatagca gacgaggcag gatgttccca gaccacccgc3300aaactggact gtctacgccg cacgcccttc acagtcctaa acaacattct gaacaccacc3360gccaacgaca cgacgcctta caactggagg cccacagtgg acggtgactt cgtagcgcga3420tatcccagcg agcaactcga cacaggagac ttcgtcaaag taccaatcat aatcggctac3480accacggacg aaggaacaac agagtgccca gaaccagtga acaccaccgc cgaattaaaa3540gaatacctca gctgtacgta cctccttccc ttcctccctt atccccccat ccccatccca3600ataacaccaa cccagcaaca acaacctacg gctgggccct cgactcacag gtagtatcct3660cgctcctgga cctctacccc aacaccacct ccttcggcat cccatcatcc gaagaactcg3720gcggcaacgt caccttccca cagccctacg gcgccgcatt ccgccagacg gcagcatact3780acggcgacgc ccagttcata gccgcgacgc gctacacctg tgagctatgg gcggcacata3840acctgacagc atattgctac cgattcaaca ccaagacaga cgattacaac agggaagaag3900gcgtggcgca tttctcggac gtgatcttca tcttcaacaa ccttaatggt tatgggttca3960gtccgaaccc gttcaccaat gctccagaga gctatactga gcttagctac ctcatgtccg4020gctcgtggat cagcttcact aatagtctgg atcctaataa gtggactggt cgcggaagga4080acgctacgaa gacggagaat tggcccgtgt atgatctgga gaatcccttg agtatgatct4140gggatgcgaa tgtcacttcg tatgcggcgc cggatacttg gcgtaaggag ggtattgcgt4200tgattaatgc taatcggagg gcgtatcaga ggtgaatgtg gtgtagcttg cagccgttgc4260ctacttgttc gactttcaaa ctcaaaactt tctattgaga gagaaaattg tgcgaggaaa4320gtactaccgc gggcagaaca ctctgcgcac aggtccatat ctacaaactc actgaacaga4380gtctatagca gattaggtag attgtcaagc ttacatacag acataacccc accacaatat4440cgtggtaaga tagcacattt ctttaaagaa gaaaaaaaaa gatgaataca tataatcggc4500tacgtcaata attcaaaaca gaatatgtca gctgtgcaca catccgacca ttacactagt4560aaagtgagcg gcggc 4575<210>32<211>1695<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS
<222>(1)..(1695)<400>32atg aag gga atg ctc ccg acg ctt agt tgg ttg gca ctg ggc atg gcc48Met Lys Gly Met Leu Pro Thr Leu Ser Trp Leu Ala Leu Gly Met Ala1 5 10 15agc ctg gca acc tgc acc aac cca gta gcc cag aca aag aac gga agt96Ser Leu Ala Thr Cys Thr Asn Pro Val Ala Gln Thr Lys Asn Gly Ser20 25 30tat tat ggt gtc tac atg cct cag tat aat gag gat tat ttt ctt gga144Tyr Tyr Gly Val Tyr Met Pro Gln Tyr Asn Glu Asp Tyr Phe Leu Gly35 40 45att cca ttt gct aag ccc ccg ttg gca cac ttg cgt tgg gcc aac ccc192Ile Pro Phe Ala Lys Pro Pro Leu Ala His Leu Arg Trp Ala Asn Pro50 55 60gag agt ctt aat gag tct tgg tcg gga ttg cgc cct gct acc ggc tat240Glu Ser Leu Asn Glu Ser Trp Ser Gly Leu Arg Pro Ala Thr Gly Tyr65 70 75 80gcg atg gaa tgt ata ggt tac ggc agt gat caa aaa ggt tat ctg cag288Ala Met Glu Cys Ile Gly Tyr Gly Ser Asp Gln Lys Gly Tyr Leu Gln85 90 95agc gag gac tgt ctc tac cta aac gtg gtc cgt ccc gct gaa tac gac336Ser Glu Asp Cys Leu Tyr Leu Asn Val Val Arg Pro Ala Glu Tyr Asp100 105 110aat gcc agt ctt cca gtc ctt gta tgg att cat ggc ggt ggc ttc gca384Asn Ala Ser Leu Pro Val Leu Val Trp Ile His Gly Gly Gly Phe Ala115 120 125caa ggc ggc act ccc gac ctt cga tac aat ctt aca ttt att gtt gaa432Gln Gly Gly Thr Pro Asp Leu Arg Tyr Asn Leu Thr Phe Ile Val Glu130 135 140cac tcg gtc aat atc ggc cag cca att atc gca gtg agc gtt gcc tat480His Ser Val Asn Ile Gly Gln Pro Ile Ile Ala Val Ser Val Ala Tyr145 150 155 160cgt ctc ggt cct tgg ggt ttc ttc aat ggg gtc gag ctc gcc aat gag528Arg Leu Gly Pro Trp Gly Phe Phe Asn Gly Val Glu Leu Ala Asn Glu165 170 175gga tcg tta aat ctc ggg ctg aag gac cag cgc ttg gcc ctg cat tgg576Gly Ser Leu Asn Leu Gly Leu Lys Asp Gln Arg Leu Ala Leu His Trp180 185 190gtg aaa gag aac att gca ggt ttc ggt ggc gac cct agt aaa gtc gtg624Val Lys Glu Asn Ile Ala Gly Phe Gly Gly Asp Pro Ser Lys Val Val195 200 205att tac gga caa agt gcc ggc tcc gaa agc gtg gga tac caa atc cgc672Ile Tyr Gly Gln Ser Ala Gly Ser Glu Ser Val Gly Tyr Gln Ile Arg
210 215 220gcg tac aac ggc cga gat gac ggg ctc ttc cgc gga ggc atg atg gag720Ala Tyr Asn Gly Arg Asp Asp Gly Leu Phe Arg Gly Gly Met Met Glu225 230 235 240tcc ggc gcg gtg tta cct ggc agt gcc ttg aac ctc acc tgg aca tat768Ser Gly Ala Val Leu Pro Gly Ser Ala Leu Asn Leu Thr Trp Thr Tyr245 250 255gag cct tgg ttc cag caa ata gca gac gag gca gga tgt tcc cag acc816Glu Pro Trp Phe Gln Gln Ile Ala Asp Glu Ala Gly Cys Ser Gln Thr260 265 270acc cgc aaa ctg gac tgt cta cgc cgc acg ccc ttc aca gtc cta aac864Thr Arg Lys Leu Asp Cys Leu Arg Arg Thr Pro Phe Thr Val Leu Asn275 280 285aac att ctg aac acc acc gcc aac gac acg acg cct tac aac tgg agg912Asn Ile Leu Asn Thr Thr Ala Asn Asp Thr Thr Pro Tyr Asn Trp Arg290 295 300ccc aca gtg gac ggt gac ttc gta gcg cga tat ccc agc gag caa ctc960Pro Thr Val Asp Gly Asp Phe Val Ala Arg Tyr Pro Ser Glu Gln Leu305 310 315 320gac aca gga gac ttc gtc aaa gta cca atc ata atc ggc tac acc acg1008Asp Thr Gly Asp Phe Val Lys Val Pro Ile Ile Ile Gly Tyr Thr Thr325 330 335gac gaa gga aca aca gag tgc cca gaa cca gtg aac acc acc gcc gaa1056Asp Glu Gly Thr Thr Glu Cys Pro Glu Pro Val Asn Thr Thr Ala Glu340 345 350tta aaa gaa tac ctc agc tca aca aca acc tac ggc tgg gcc ctc gac1104Leu Lys Glu Tyr Leu Ser Ser Thr Thr Thr Tyr Gly Trp Ala Leu Asp355 360 365tca cag gta gta tcc tcg ctc ctg gac ctc tac ccc aac acc acc tcc1152Ser Gln Val Val Ser Ser Leu Leu Asp Leu Tyr Pro Asn Thr Thr Ser370 375 380ttc ggc atc cca tca tcc gaa gaa ctc ggc ggc aac gtc acc ttc cca1200Phe Gly Ile Pro Ser Ser Glu Glu Leu Gly Gly Asn Val Thr Phe Pro385 390 395 400cag ccc tac ggc gcc gca ttc cgc cag acg gca gca tac tac ggc gac1248Gln Pro Tyr Gly Ala Ala Phe Arg Gln Thr Ala Ala Tyr Tyr Gly Asp405 410 415gcc cag ttc ata gcc gcg acg cgc tac acc tgt gag cta tgg gcg gca1296Ala Gln Phe Ile Ala Ala Thr Arg Tyr Thr Cys Glu Leu Trp Ala Ala420 425 430cat aac ctg aca gca tat tgc tac cga ttc aac acc aag aca gac gat1344His Asn Leu Thr Ala Tyr Cys Tyr Arg Phe Asn Thr Lys Thr Asp Asp435 440 445tac aac agg gaa gaa ggc gtg gcg cat ttc tcg gac gtg atc ttc atc1392
Tyr Asn Arg Glu Glu Gly Val Ala His Phe Ser Asp Val Ile Phe Ile450 455 460ttc aac aac ctt aat ggt tat ggg ttc agt ccg aac ccg ttc acc aat1440Phe Asn Asn Leu Asn Gly Tyr Gly Phe Ser Pro Asn Pro Phe Thr Asn465 470 475 480gct cca gag agc tat act gag ctt agc tac ctc atg tcc ggc tcg tgg1488Ala Pro Glu Ser Tyr Thr Glu Leu Ser Tyr Leu Met Ser Gly Ser Trp485 490 495atc agc ttc act aat agt ctg gat cct aat aag tgg act ggt cgc gga1536Ile Ser Phe Thr Asn Ser Leu Asp Pro Asn Lys Trp Thr Gly Arg Gly500 505 510agg aac gct acg aag acg gag aat tgg ccc gtg tat gat ctg gag aat1584Arg Asn Ala Thr Lys Thr Glu Asn Trp Pro Val Tyr Asp Leu Glu Asn515 520 525ccc ttg agt atg atc tgg gat gcg aat gtc act tcg tat gcg gcg ccg1632Pro Leu Ser Met Ile Trp Asp Ala Asn Val Thr Ser Tyr Ala Ala Pro530 535 540gat act tgg cgt aag gag ggt att gcg ttg att aat gct aat cgg agg1680Asp Thr Trp Arg Lys Glu Gly Ile Ala Leu Ile Asn Ala Asn Arg Arg545 550 555 560gcg tat cag agg tga1695Ala Tyr Gln Arg<210>33<211>564<212>PRT<213>黑曲霉(Aspergillus niger)<400>33Met Lys Gly Met Leu Pro Thr Leu Ser Trp Leu Ala Leu Gly Met Ala1 5 10 15Ser Leu Ala Thr Cys Thr Asn Pro Val Ala Gln Thr Lys Asn Gly Ser20 25 30Tyr Tyr Gly Val Tyr Met Pro Gln Tyr Asn Glu Asp Tyr Phe Leu Gly35 40 45Ile Pro Phe Ala Lys Pro Pro Leu Ala His Leu Arg Trp Ala Asn Pro50 55 60Glu Ser Leu Asn Glu Ser Trp Ser Gly Leu Arg Pro Ala Thr Gly Tyr65 70 75 80Ala Met Glu Cys Ile Gly Tyr Gly Ser Asp Gln Lys Gly Tyr Leu Gln85 90 95Ser Glu Asp Cys Leu Tyr Leu Asn Val Val Arg Pro Ala Glu Tyr Asp100 105 110
Asn Ala Ser Leu Pro Val Leu Val Trp Ile His Gly Gly Gly Phe Ala115 120 125Gln Gly Gly Thr Pro Asp Leu Arg Tyr Asn Leu Thr Phe Ile Val Glu130 135 140His Ser Val Asn Ile Gly Gln Pro Ile Ile Ala Val Ser Val Ala Tyr145 150 155 160Arg Leu Gly Pro Trp Gly Phe Phe Asn Gly Val Glu Leu Ala Asn Glu165 170 175Gly Ser Leu Asn Leu Gly Leu Lys Asp Gln Arg Leu Ala Leu His Trp180 185 190Val Lys Glu Asn Ile Ala Gly Phe Gly Gly Asp Pro Ser Lys Val Val195 200 205Ile Tyr Gly Gln Ser Ala Gly Ser Glu Ser Val Gly Tyr Gln Ile Arg210 215 220Ala Tyr Asn Gly Arg Asp Asp Gly Leu Phe Arg Gly Gly Met Met Glu225 230 235 240Ser Gly Ala Val Leu Pro Gly Ser Ala Leu Asn Leu Thr Trp Thr Tyr245 250 255Glu Pro Trp Phe Gln Gln Ile Ala Asp Glu Ala Gly Cys Ser Gln Thr260 265 270Thr Arg Lys Leu Asp Cys Leu Arg Arg Thr Pro Phe Thr Val Leu Asn275 280 285Asn Ile Leu Asn Thr Thr Ala Asn Asp Thr Thr Pro Tyr Asn Trp Arg290 295 300Pro Thr Val Asp Gly Asp Phe Val Ala Arg Tyr Pro Ser Glu Gln Leu305 310 315 320Asp Thr Gly Asp Phe Val Lys Val Pro Ile Ile Ile Gly Tyr Thr Thr325 330 335Asp Glu Gly Thr Thr Glu Cys Pro Glu Pro Val Asn Thr Thr Ala Glu340 345 350Leu Lys Glu Tyr Leu Ser Ser Thr Thr Thr Tyr Gly Trp Ala Leu Asp355 360 365Ser Gln Val Val Ser Ser Leu Leu Asp Leu Tyr Pro Asn Thr Thr Ser370 375 380Phe Gly Ile Pro Ser Ser Glu Glu Leu Gly Gly Asn Val Thr Phe Pro385 390 395 400Gln Pro Tyr Gly Ala Ala Phe Arg Gln Thr Ala Ala Tyr Tyr Gly Asp405 410 415Ala Gln Phe Ile Ala Ala Thr Arg Tyr Thr Cys Glu Leu Trp Ala Ala420 425 430His Asn Leu Thr Ala Tyr Cys Tyr Arg Phe Asn Thr Lys Thr Asp Asp435 440 445Tyr Asn Arg Glu Glu Gly Val Ala His Phe Ser Asp Val Ile Phe Ile450 455 460
Phe Asn Asn Leu Asn Gly Tyr Gly Phe Ser Pro Asn Pro Phe Thr Asn465 470 475 480Ala Pro Glu Ser Tyr Thr Glu Leu Ser Tyr Leu Met Ser Gly Ser Trp485 490 495Ile Ser Phe Thr Asn Ser Leu Asp Pro Asn Lys Trp Thr Gly Arg Gly500 505 510Arg Asn Ala Thr Lys Thr Glu Asn Trp Pro Val Tyr Asp Leu Glu Asn515 520 525Pro Leu Ser Met Ile Trp Asp Ala Asn Val Thr Ser Tyr Ala Ala Pro530 535 540Asp Thr Trp Arg Lys Glu Gly Ile Ala Leu Ile Asn Ala Asn Arg Arg545 550 555 560Ala Tyr Gln Arg<210>34<211>2371<212>DNA<213>黑曲霉(Aspergillus niger)<400>34gccctgacat ggacggtgtc agatagagac cgttggaagg ctgaaccaca gggcacacgg60cacgttgagg accctgcatg ccggtgtatc cggataatgg cagataatcc cggctaattg120ggggcgacgg cagctacggc tcacaaattg tgatggaata gacacggcat gatgtttcaa180tgaagctcca aactttacag tgctaggctg taaacgtgat tataatcacg atgtaattga240ttatcatcta caactcaacc cccgcaccaa gaaatgaatc ctctcgtcgg aagaaaaaga300cggcattcca gaagaacttt ttcctagata acaaacagta atcagtccat ccgtccctga360cgatcccccc atcgaacctc ggtaagacgc tcgacccaaa aaccagaccg acaagctttt420caacctccct aaacgaaaca acggctgtgt tgatcgtgaa cgtggttgcc tataccaata480cgagaaccat ataggataga aattgagttt accgtggaaa agccacccgc tacagtttaa540ttaaccaacc cacccacatg cccaaggcac ctgtaacagg gactactgtc cagagagtgg600atagtggcta gtgggcagac gtcggatgaa ctccggaaga ccctaactga tacgtagaac660catcgtgaac cctggtttgt ccctagttcg gggcgctatt cccagcgtag aaaagcggcc720gatcctctga aacagttttc ccccggggta tacttgctag ttagtcacta tcatacaaaa780gtagtgtagt ggacaagacc agggtctact actattagtt agttctgttt catcccgact840caattttgcg tcccaagacc ctgggttgtc cgggcctgtc ttgcccaaca cgagatgtat900ggagtaagta tggagggaga ctaacctcgg aatattcttg tctcttttta gtactatcta960gcccttagtg agactatagc agtagtgaac cagagagaga gagagatgtc tatataagta1020cagtcgtaga tccctaaaca tgaccagctt cagactcaga ctcgagcagc cagtgcagtc1080cagtccactc tttcattctc accccttctt tactatctta caataatttc tattcaataa1140gtctgcagtg cagcacccac acacattcat tctctgagag ataaaaaata acaaaatggc1200ccccctcaaa tccctcctcc tcggcgcctc cctggccacc ctcgcccttt ccaccccact1260ggcaaccgac gccgaaaacc tctacgcacg tcaattcggc acgggctcta cagccaacga1320actcgagcag ggaagctgca aggatgtgac tctcatcttt gcgagggggt caactgagct1380
tgggaatatg gtatgcttgt tgcctgcctt tacccgtact atactatccc agaacatacc1440aagcacaaca tcacaaaaca tgtggagcca ggagctaatc agtggtggtg atgatatgat1500gtagggcacc gtaatcggcc cccctctctg cgacaacctg aaatccaaac tcggatccga1560caaagtcgcc tgccagggtg tcggcggcca atacagcgcc ggactcgtgc agaatgccct1620gccccagaac accgatccgg ggagtatctc cgccgcgaag cagatgttcg aggaggcgaa1680ttcgaagtgt cccaatacta agattgttgc gggtggttat aggtatatat ccctttcccc1740tttaccttcc cccatatcaa tgctagaggc aaaggaatat catgctaatg tagatgttgg1800ggaaacagtc aaggaagcgc tgtgattgac aacgccgtgc aagaactcag caccaccgtg1860aaagaccaag tgaagggtgt cgtgctcttc gggttcacga gaaacgtgca ggatcacggg1920cagatcccta attaccctaa ggatgacgtg aaggtttatt gtgccgtggg cgatctggtc1980tgtgatgata cgttggttgt tacggcgatg catctgacgt atggcatgga tgcgggtgat2040gcggcgagct ttttggccga gaaggtgcag tcttccagta gttcgactac tagctccagc2100tcggatgccg cgagtagttc atctgctgcg gggacgtcgt cgtcggggtt gtcgggactg2160tcttcttttt ttggaggtct ctaaatagaa ttagatgaga tgagtggtcc gggtgggggt2220ttaggggatt gttgttcgtt tctcttggat gatttagttt ccgttattta cttagctggg2280ataagatata tggtacatag tatagatgtg ttgtgatgtt attctggcta ttttgtacac2340tttgacatga tctgcgatat gggagcgtct a 2371<210>35<211>789<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(789)<400>35atg gcc ccc ctc aaa tcc ctc ctc ctc ggc gcc tcc ctg gcc acc ctc48Met Ala Pro Leu Lys Ser Leu Leu Leu Gly Ala Ser Leu Ala Thr Leu1 5 10 15gcc ctt tcc acc cca ctg gca acc gac gcc gaa aac ctc tac gca cgt96Ala Leu Ser Thr Pro Leu Ala Thr Asp Ala Glu Asn Leu Tyr Ala Arg20 25 30caa ttc ggc acg ggc tct aca gcc aac gaa ctc gag cag gga agc tgc144Gln Phe Gly Thr Gly Ser Thr Ala Asn Glu Leu Glu Gln Gly Ser Cys35 40 45aag gat gtg act ctc atc ttt gcg agg ggg tca act gag ctt ggg aat192Lys Asp Val Thr Leu Ile Phe Ala Arg Gly Ser Thr Glu Leu Gly Asn50 55 60atg ggc acc gta atc ggc ccc cct ctc tgc gac aac ctg aaa tcc aaa240Met Gly Thr Val Ile Gly Pro Pro Leu Cys Asp Asn Leu Lys Ser Lys65 70 75 80
ctc gga tcc gac aaa gtc gcc tgc cag ggt gtc ggc ggc caa tac agc288Leu Gly Ser Asp Lys Val Ala Cys Gln Gly Val Gly Gly Gln Tyr Ser85 90 95gcc gga ctc gtg cag aat gcc ctg ccc cag aac acc gat ccg ggg agt336Ala Gly Leu Val Gln Asn Ala Leu Pro Gln Asn Thr Asp Pro Gly Ser100 105 110atc tcc gcc gcg aag cag atg ttc gag gag gcg aat tcg aag tgt ccc384Ile Ser Ala Ala Lys Gln Met Phe Glu Glu Ala Asn Ser Lys Cys Pro115 120 125aat act aag att gtt gcg ggt ggt tat agt caa gga agc gct gtg att432Asn Thr Lys Ile Val Ala Gly Gly Tyr Ser Gln Gly Ser Ala Val Ile130 135 140gac aac gcc gtg caa gaa ctc agc acc acc gtg aaa gac caa gtg aag480Asp Asn Ala Val Gln Glu Leu Ser Thr Thr Val Lys Asp Gln Val Lys145 150 155 160ggt gtc gtg ctc ttc ggg ttc acg aga aac gtg cag gat cac ggg cag528Gly Val Val Leu Phe Gly Phe Thr Arg Asn Val Gln Asp His Gly Gln165 170 175atc cct aat tac cct aag gat gac gtg aag gtt tat tgt gcc gtg ggc576Ile Pro Asn Tyr Pro Lys Asp Asp Val Lys Val Tyr Cys Ala Val Gly180 185 190gat ctg gtc tgt gat gat acg ttg gtt gtt acg gcg atg cat ctg acg624Asp Leu Val Cys Asp Asp Thr Leu Val Val Thr Ala Met His Leu Thr195 200 205tat ggc atg gat gcg ggt gat gcg gcg agc ttt ttg gcc gag aag gtg672Tyr Gly Met Asp Ala Gly Asp Ala Ala Ser Phe Leu Ala Glu Lys Val210 215 220cag tct tcc agt agt tcg act act agc tcc agc tcg gat gcc gcg agt720Gln Ser Ser Ser Ser Ser Thr Thr Ser Ser Ser Ser Asp Ala Ala Ser225 230 235 240agt tca tct gct gcg ggg acg tcg tcg tcg ggg ttg tcg gga ctg tct768Ser Ser Ser Ala Ala Gly Thr Ser Ser Ser Gly Leu Ser Gly Leu Ser245 250 255tct ttt ttt gga ggt ctc taa789Ser Phe Phe Gly Gly Leu260<210>36<211>262<212>PRT<213>黑曲霉(Aspergillus niger)<400>36
Met Ala Pro Leu Lys Ser Leu Leu Leu Gly Ala Ser Leu Ala Thr Leu1 5 10 15Ala Leu Ser Thr Pro Leu Ala Thr Asp Ala Glu Asn Leu Tyr Ala Arg20 25 30Gln Phe Gly Thr Gly Ser Thr Ala Asn Glu Leu Glu Gln Gly Ser cys35 40 45Lys Asp Val Thr Leu Ile Phe Ala Arg Gly Ser Thr Glu Leu Gly Asn50 55 60Met Gly Thr Val Ile Gly Pro Pro Leu Cys Asp Asn Leu Lys Ser Lys65 70 75 80Leu Gly Ser Asp Lys Val Ala Cys Gln Gly Val Gly Gly Gln Tyr Ser85 90 95Ala Gly Leu Val Gln Asn Ala Leu Pro Gln Asn Thr Asp Pro Gly Ser100 105 110Ile Ser Ala Ala Lys Gln Met Phe Glu Glu Ala Asn Ser Lys Cys Pro115 120 125Asn Thr Lys Ile Val Ala Gly Gly Tyr Ser Gln Gly Ser Ala Val Ile130 135 140Asp Asn Ala Val Gln Glu Leu Ser Thr Thr Val Lys Asp Gln Val Lys145 150 155 160Gly Val Val Leu Phe Gly Phe Thr Arg Asn Val Gln Asp His Gly Gln165 170 175Ile Pro Asn Tyr Pro Lys Asp Asp Val Lys Val Tyr Cys Ala Val Gly180 185 190Asp Leu Val Cys Asp Asp Thr Leu Val Val Thr Ala Met His Leu Thr195 200 205Tyr Gly Met Asp Ala Gly Asp Ala Ala Ser Phe Leu Ala Glu Lys Val210 215 220Gln Ser Ser Ser Ser Ser Thr Thr Ser Ser Ser Ser Asp Ala Ala Ser225 230 235 240Ser Ser Ser Ala Ala Gly Thr Ser Ser Ser Gly Leu Ser Gly Leu Ser245 250 255Ser Phe Phe Gly Gly Leu260<210>37<211>2981<212>DNA<213>黑曲霉(Aspergillus niger)<400>37tcctcatccc atgctctccc ggcagaaccc cggagacaac ccacactaat gcacccaaag60caaaatgaca tggattgaat tatccggggt gcatccatct tgttccccca cacattggac120
cctttcctta taatggctgc cccggcaaac ccccaattgc tgtttaggcc agcgcagata180gcaaatctct cgtctgatta acgatgctaa agctcgctgt tgctcttttt tcgttacttg240ccgtgggcaa tgcagcgcca accaaagtgg cccgttccac ggccagtcct acggccaagg300ttcgcaacgg tacatatgtc ggagtgacaa atgcgcatta ccagcaagat ttctttttgg360gaatgccgta tgcccagcag cctttaggtg acttgcgctt cacggtgcct cagtccctga420acgaaagctg gagtggcgag cgcgacgcga aggaatattc caatatctgt gtaggatacg480gtgtgagtgc gcaaatcttc ttcgagagcc aggccctact agctgcatcc tggcactatg540aatataatct aatgggtaga tctgttagac cgactcgatt tggtacccac agtccgaagc600ttgtctaacc ttgaatgtca tccgcgattc ttctgcaaat gagaactcga agctccccgt660gggcgtctgg atacatggag gtggcttctt tgagggatct agtgctgacc agcgctacaa720catgtccgcg attgttgcca actcctataa gatcggtatg tcgacgtatg cggttgtaga780attagactga ctcggcttgc tcgcattgta ggaaagccgt tcattgctgt cagcttaaac840tatcgccttt cggcatgggg cttcttgagt tccagtcaag tctggggcac tggcaatacc900aatctaggta tcagggatca aaggttagca ctccattgga tcaaggagaa tatcgcggca960ttcggaggag acccagataa gatcactatc tggggcgaat ctgccggagc gatgtccgtg1020ggttatcacc ttgcagcata cggcggtagg gacgatggac tcttccgtgg aggaattatg1080gagtcaggag ggactattgc agctagtcca gccaactata ccgggtacca agcgcactat1140gatgagctcg cgggtcaagt cggttgctcc gacgtagtag attcgttgca gtgcctgcgc1200gaagttccgt tcgagaaatt gaacgctgct ctcaacacca ccagtggtaa ctcggatttc1260aatttcgggc ccgtcattga tggagatata atcagggact ggggcagcct ccagctagac1320aagcatgaat tcgtcaaagt ccctattctt gcaggtacca ataccgacga agggacagcc1380tttgggccca caggtatcaa cacgacagag gagttctatg catatctcac aggtatgtgt1440gataatgagt taacatcctg aaagaacccc agagcagcaa aacgggctaa tctcactggc1500agatggcgaa tctggattcc agctaccccc cacgatcgcc caggaaatcc tgcagctcta1560ccctgatgat ccagcactgg gcatccccga atttctcggt gacactagag tcccgtccaa1620aggctaccaa tggcggcgca cctgtgcata cgcaggggac tatgtaatgc atgccaaccg1680tcgccgacaa tgtgaggcgt ggacagagac ctcgacgacg gcgtactgtt atcgattcaa1740tatgcgtgcg gccgatgtcc ccatcctgtc tggcgccacc cattttgaag aagttgcttt1800tgtattcaac aacattgcag gactcgggta ccattacgga aagccgttcg cagggatgcc1860cgagtcctac gtacagctaa gcaacttgat gaccagcatg tgggcatcct tcatccacga1920tttagaccct aattcgggca tcaaggactc agctgtacag tggcaaccgt acgggaagga1980tcagccggtt gatctagtgt ttgatgcgaa tgtcacgagc tacagctaca tggagccaga2040cacgtggcgg aaggagggga tcgactatat caattccgtg gccaacgcgt actggcgata2100agcttcatgc tatcgaaaac acatgtgatg agcgtgagag tttttgcctt ccgcttgatg2160ttgcctgcga gaggaaaagg ttaaggcaaa caaggatggt agggggtgcg agcgcatcta2220agtcggccac ggtagttgat tgatggttcc ctcgttagaa gcaaatacag atgccatact2280tcctgcaaca aacccagaac ttgttgtaat caagtttttt caaacggatg gtagatcggt2340tccgatttgt aaaaagcaag atcctagcgt tacgagggaa ccaagacacc cacacagagg2400agcattacga attccaaatt accaaagcct gtataacaaa aaccagcaga gaccgcctaa2460ttagtcaact acagcattgg ttcaatgtac ctgcaaggac ctttacacgc gtggtcaccc2520atgtaccaag ccaagccaac ggccaagaca cggaaataac caagaggaaa ccactccctc2580caagaatcaa gaacccaggg ggtcaagaga atctggaagc gataaagggg tcttcttttt2640tttctttgct tacctagaga gggaggagtc ggcgttcatc gtcaatcagt agagtgttct2700ccgccctgag tggtgtagtc tatatccgga ccatcgggga catgattatc atacgatcca2760
taaccaagtc cccgattgta ctacggctac caaaactaga atgatgaaaa tattggagta2820cgaaaggaac taaaccaata ctaagaaaaa aaaaaaagag taaagaaaaa agagtaaaaa2880accaagctcg gaaagtaaaa atttcccctg gtcttgttgt cattccccta cctattgaga2940accgggttca ccaatgacag cggatccccg atttgacatc g2981<210>38<211>1686<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1686)<400>38atg cta aag ctc gct gtt gct ctt ttt tcg tta ctt gcc gtg ggc aat48Met Leu Lys Leu Ala Val Ala Leu Phe Ser Leu Leu Ala Val Gly Asn1 5 10 15gca gcg cca acc aaa gtg gcc cgt tcc acg gcc agt cct acg gcc aag96Ala Ala Pro Thr Lys Val Ala Arg Ser Thr Ala Ser Pro Thr Ala Lys20 25 30gtt cgc aac ggt aca tat gtc gga gtg aca aat gcg cat tac cag caa144Val Arg Asn Gly Thr Tyr Val Gly Val Thr Asn Ala His Tyr Gln Gln35 40 45gat ttc ttt ttg gga atg ccg tat gcc cag cag cct tta ggt gac ttg192Asp Phe Phe Leu Gly Met Pro Tyr Ala Gln Gln Pro Leu Gly Asp Leu50 55 60cgc ttc acg gtg cct cag tcc ctg aac gaa agc tgg agt ggc gag cgc240Arg Phe Thr Val Pro Gln Ser Leu Asn Glu Ser Trp Ser Gly Glu Arg65 70 75 80gac gcg aag gaa tat tcc aat atc tgt gta gga tac ggt acc gac tcg288Asp Ala Lys Glu Tyr Ser Asn Ile Cys Val Gly Tyr Gly Thr Asp Ser85 90 95att tgg tac cca cag tcc gaa gct tgt cta acc ttg aat gtc atc cgc336Ile Trp Tyr Pro Gln Ser Glu Ala Cys Leu Thr Leu Asn Val Ile Arg100 105 110gat tct tct gca aat gag aac tcg aag ctc ccc gtg ggc gtc tgg ata384Asp Ser Ser Ala Asn Glu Asn Ser Lys Leu Pro Val Gly Val Trp Ile115 120 125cat gga ggt ggc ttc ttt gag gga tct agt gct gac cag cgc tac aac432His Gly Gly Gly Phe Phe Glu Gly Ser Ser Ala Asp Gln Arg Tyr Asn130 135 140atg tcc gcg att gtt gcc aac tcc tat aag atc gga aag ccg ttc att480
Met Ser Ala Ile Val Ala Asn Ser Tyr Lys Ile Gly Lys Pro Phe Ile145 150 155 160gct gtc agc tta aac tat cgc ctt tcg gca tgg ggc ttc ttg agt tcc528Ala Val Ser Leu Asn Tyr Arg Leu Ser Ala Trp Gly Phe Leu Ser Ser165 170 175agt caa gtc tgg ggc act ggc aat acc aat cta ggt atc agg gat caa576Ser Gln Val Trp Gly Thr Gly Asn Thr Asn Leu Gly Ile Arg Asp Gln180 185 190agg tta gca ctc cat tgg atc aag gag aat atc gcg gca ttc gga gga624Arg Leu Ala Leu His Trp Ile Lys Glu Asn Ile Ala Ala Phe Gly Gly195 200 205gac cca gat aag atc act atc tgg ggc gaa tct gcc gga gcg atg tcc672Asp Pro Asp Lys Ile Thr Ile Trp Gly Glu Ser Ala Gly Ala Met Ser210 215 220gtg ggt tat cac ctt gca gca tac ggc ggt agg gac gat gga ctc ttc720Val Gly Tyr His Leu Ala Ala Tyr Gly Gly Arg Asp Asp Gly Leu Phe225 230 235 240cgt gga gga att atg gag tca gga ggg act att gca gct agt cca gcc768Arg Gly Gly Ile Met Glu Ser Gly Gly Thr Ile Ala Ala Ser Pro Ala245 250 255aac tat acc ggg tac caa gcg cac tat gat gag ctc gcg ggt caa gtc816Asn Tyr Thr Gly Tyr Gln Ala His Tyr Asp Glu Leu Ala Gly Gln Val260 265 270ggt tgc tcc gac gta gta gat tcg ttg cag tgc ctg cgc gaa gtt ccg864Gly Cys Ser Asp Val Val Asp Ser Leu Gln Cys Leu Arg Glu Val Pro275 280 285ttc gag aaa ttg aac gct gct ctc aac acc acc agt ggt aac tcg gat912Phe Glu Lys Leu Asn Ala Ala Leu Asn Thr Thr Ser Gly Asn Ser Asp290 295 300ttc aat ttc ggg ccc gtc att gat gga gat ata atc agg gac tgg ggc960Phe Asn Phe Gly Pro Val Ile Asp Gly Asp Ile Ile Arg Asp Trp Gly305 310 315 320agc ctc cag cta gac aag cat gaa ttc gtc aaa gtc cct att ctt gca1008Ser Leu Gln Leu Asp Lys His Glu Phe Val Lys Val Pro Ile Leu Ala325 330 335ggt acc aat acc gac gaa ggg aca gcc ttt ggg ccc aca ggt atc aac1056Gly Thr Asn Thr Asp Glu Gly Thr Ala Phe Gly Pro Thr Gly Ile Asn340 345 350acg aca gag gag ttc tat gca tat ctc aca gat ggc gaa tct gga ttc1104Thr Thr Glu Glu Phe Tyr Ala Tyr Leu Thr Asp Gly Glu Ser Gly Phe355 360 365cag cta ccc ccc acg atc gcc cag gaa atc ctg cag ctc tac cct gat1152Gln Leu Pro Pro Thr Ile Ala Gln Glu Ile Leu Gln Leu Tyr Pro Asp370 375 380
gat cca gca ctg ggc atc ccc gaa ttt ctc ggt gac act aga gtc ccg1200Asp Pro Ala Leu Gly lle Pro Glu Phe Leu Gly Asp Thr Arg Val Pro385 390 395 400tcc aaa ggc tac caa tgg cgg cgc acc tgt gca tac gca ggg gac tat1248Ser Lys Gly Tyr Gln Trp Arg Arg Thr Cys Ala Tyr Ala Gly Asp Tyr405 410 415gta atg cat gcc aac cgt cgc cga caa tgt gag gcg tgg aca gag acc1296Val Met His Ala Asn Arg Arg Arg Gln Cys Glu Ala Trp Thr Glu Thr420 425 430tcg acg acg gcg tac tgt tat cga ttc aat atg cgt gcg gcc gat gtc1344Ser Thr Thr Ala Tyr Cys Tyr Arg Phe Asn Met Arg Ala Ala Asp Val435 440 445ccc atc ctg tct ggc gcc acc cat ttt gaa gaa gtt gct ttt gta ttc1392Pro Ile Leu Ser Gly Ala Thr His Phe Glu Glu Val Ala Phe Val Phe450 455 460aac aac att gca gga ctc ggg tac cat tac gga aag ccg ttc gca ggg1440Asn Asn Ile Ala Gly Leu Gly Tyr His Tyr Gly Lys Pro Phe Ala Gly465 470 475 480atg ccc gag tcc tac gta cag cta agc aac ttg atg acc agc atg tgg1488Met Pro Glu Ser Tyr Val Gln Leu Ser Asn Leu Met Thr Ser Met Trp485 490 495gca tcc ttc atc cac gat tta gac cct aat tcg ggc atc aag gac tca1536Ala Ser Phe Ile His Asp Leu Asp Pro Asn Ser Gly Ile Lys Asp Ser500 505 510gct gta cag tgg caa ccg tac ggg aag gat cag ccg gtt gat cta gtg1584Ala Val Gln Trp Gln Pro Tyr Gly Lys Asp Gln Pro Val Asp Leu Val515 520 525ttt gat gcg aat gtc acg agc tac agc tac atg gag cca gac acg tgg1632Phe Asp Ala Asn Val Thr Ser Tyr Ser Tyr Met Glu Pro Asp Thr Trp530 535 540cgg aag gag ggg atc gac tat atc aat tcc gtg gcc aac gcg tac tgg1680Arg Lys Glu Gly Ile Asp Tyr Ile Asn Ser Val Ala Asn Ala Tyr Trp545 550 555 560cga taa1686Arg<210>39<211>561<212>PRT<213>黑曲霉(Aspergillus niger)<400>39Met Leu Lys Leu Ala Val Ala Leu Phe Ser Leu Leu Ala Val Gly Asn
1 5 10 15Ala Ala Pro Thr Lys Val Ala Arg Ser Thr Ala Ser Pro Thr Ala Lys20 25 30Val Arg Asn Gly Thr Tyr Val Gly Val Thr Asn Ala His Tyr Gln Gln35 40 45Asp Phe Phe Leu Gly Met Pro Tyr Ala Gln Gln Pro Leu Gly Asp Leu50 55 60Arg Phe Thr Val Pro Gln Ser Leu Asn Glu Ser Trp Ser Gly Glu Arg65 70 75 80Asp Ala Lys Glu Tyr Ser Asn Ile Cys Val Gly Tyr Gly Thr Asp Ser85 90 95Ile Trp Tyr Pro Gln Ser Glu Ala Cys Leu Thr Leu Asn Val Ile Arg100 105 110Asp Ser Ser Ala Asn Glu Asn Ser Lys Leu Pro Val Gly Val Trp Ile115 120 125His Gly Gly Gly Phe Phe Glu Gly Ser Ser Ala Asp Gln Arg Tyr Asn130 135 140Met Ser Ala Ile Val Ala Asn Ser Tyr Lys Ile Gly Lys Pro Phe Ile145 150 155 160Ala Val Ser Leu Asn Tyr Arg Leu Ser Ala Trp Gly Phe Leu Ser Ser165 170 175Ser Gln Val Trp Gly Thr Gly Asn Thr Asn Leu Gly Ile Arg Asp Gln180 185 190Arg Leu Ala Leu His Trp Ile Lys Glu Asn Ile Ala Ala Phe Gly Gly195 200 205Asp Pro Asp Lys Ile Thr Ile Trp Gly Glu Ser Ala Gly Ala Met Ser210 215 220Val Gly Tyr His Leu Ala Ala Tyr Gly Gly Arg Asp Asp Gly Leu Phe225 230 235 240Arg Gly Gly Ile Met Glu Ser Gly Gly Thr Ile Ala Ala Ser Pro Ala245 250 255Asn Tyr Thr Gly Tyr Gln Ala His Tyr Asp Glu Leu Ala Gly Gln Val260 265 270Gly Cys Ser Asp Val Val Asp Ser Leu Gln Cys Leu Arg Glu Val Pro275 280 285Phe Glu Lys Leu Asn Ala Ala Leu Asn Thr Thr Ser Gly Asn Ser Asp290 295 300Phe Asn Phe Gly Pro Val Ile Asp Gly Asp Ile Ile Arg Asp Trp Gly305 310 315 320Ser Leu Gln Leu Asp Lys His Glu Phe Val Lys Val Pro Ile Leu Ala325 330 335Gly Thr Asn Thr Asp Glu Gly Thr Ala Phe Gly Pro Thr Gly Ile Asn340 345 350Thr Thr Glu Glu Phe Tyr Ala Tyr Leu Thr Asp Gly Glu Ser Gly Phe
355 360 365Gln Leu Pro Pro Thr Ile Ala Gln Glu Ile Leu Gln Leu Tyr Pro Asp370 375 380Asp Pro Ala Leu Gly Ile Pro Glu Phe Leu Gly Asp Thr Arg Val Pro385 390 395 400Ser Lys Gly Tyr Gln Trp Arg Arg Thr Cys Ala Tyr Ala Gly Asp Tyr405 410 415Val Met His Ala Asn Arg Arg Arg Gln Cys Glu Ala Trp Thr Glu Thr420 425 430Ser Thr Thr Ala Tyr Cys Tyr Arg Phe Asn Met Arg Ala Ala Asp Val435 440 445Pro Ile Leu Ser Gly Ala Thr His Phe Glu Glu Val Ala Phe Val Phe450 455 460Asn Asn Ile Ala Gly Leu Gly Tyr His Tyr Gly Lys Pro Phe Ala Gly465 470 475 480Met Pro Glu Ser Tyr Val Gln Leu Ser Asn Leu Met Thr Ser Met Trp485 490 495Ala Ser Phe Ile His Asp Leu Asp Pro Asn Ser Gly Ile Lys Asp Ser500 505 510Ala Val Gln Trp Gln Pro Tyr Gly Lys Asp Gln Pro Val Asp Leu Val515 520 525Phe Asp Ala Asn Val Thr Ser Tyr Ser Tyr Met Glu Pro Asp Thr Trp530 535 540Arg Lys Glu Gly Ile Asp Tyr Ile Asn Ser Val Ala Asn Ala Tyr Trp545 550 555 560Arg
权利要求
1.一种经过分离的多核苷酸,所述多核苷酸能与选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的多核苷酸杂交。
2.如权利要求1所述的经过分离的多核苷酸,所述多核苷酸能在高度严谨条件下与选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组的多核苷酸杂交。
3.如权利要求1或2所述的经过分离的多核苷酸,所述多核苷酸可以从丝状真菌中获得。
4.如权利要求3所述的经过分离的多核苷酸,所述多核苷酸可以从Aspergillus niger中获得。
5.一种经过分离的多核苷酸,所述多核苷酸编码多肽或其功能等同物,所述多肽包含选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组的氨基酸序列。
6.一种经过分离的多核苷酸,编码多肽或其功能等同物的至少一个功能结构域,所述多肽选自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组。
7.一种经过分离的多核苷酸,所述多核苷酸包含一种核苷酸序列或其功能等同物,所述核苷酸序列选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组。
8.一种经过分离的多核苷酸,选自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所构成的组。
9.一种载体,所述载体包含如权利要求1至8所述的多核苷酸序列。
10.如权利要求9所述的载体,其中所述的如权利要求1至8所述的多核苷酸与调控序列可操作地连接,所述调控序列适于所述多核苷酸序列在合适的宿主细胞中的表达。
11.如权利要求10所述的载体,其中所述的合适的宿主细胞是丝状真菌。
12.一种用于生产如权利要求1-8所述的多核苷酸或如权利要求9至11所述的载体的方法,所述方法包括如下步骤培养经过所述多核苷酸或所述的载体转化的宿主细胞,从所述的宿主细胞中分离出所述的多核苷酸或所述的载体。
13.一种经过分离的脂肪分解酶或其功能等同物,所述酶选自由SEQID NO3、6、9、12、15、18、21、24、27、30、33、36和39所构成的组。
14.如权利要求13所述的酶,可从Aspergillus niger中获得。
15.一种经过分离的脂肪分解酶,所述的酶可通过在合适的宿主细胞例如Aspergillus niger中表达如权利要求1至8所述的多核苷酸或如权利要求9至11所述的载体来获得。
16.重组的脂肪分解酶,所述的酶包含如权利要求13-15中所述的任何脂肪分解酶的功能结构域。
17.一种用于生产如权利要求13至16所述的脂肪分解酶的方法,所述方法包括如下步骤用如权利要求1至8所述的经过分离的多核苷酸或如权利要求9至11所述的载体对合适的宿主细胞进行转化,在允许所述的多核苷酸表达的条件下培养所述的细胞,以及可选地,从所述细胞或培养基中纯化被编码的多肽。
18.一种重组宿主细胞,所述细胞包含如权利要求1至8所述的多核苷酸或如权利要求9至11所述的载体。
19.一种重组宿主细胞,所述细胞表达如权利要求13至16所述的脂肪分解酶。
20.经过纯化的抗体,所述抗体能与如权利要求13至16所述的脂肪分解酶发生反应。
21.融合蛋白,所述蛋白包含如权利要求13至16所述的脂肪分解酶序列。
22.一种用于生产面团的方法,所述方法包括添加如权利要求13-16中任意一项所述的脂肪分解酶。
23.一种用于从面团生产烘焙产品的方法,所述面团是通过如权利要求22所述的方法来制备的。
24.如权利要求13-16中任意一项所述的脂肪分解酶在制备面团和/或其烘焙产品中的用途。
全文摘要
本发明涉及新鉴定出来的多核苷酸序列,所述序列包含编码来自Aspergillus niger的新颖的脂肪分解酶的基因。本发明公开了所述新颖基因的全长核苷酸序列,包含所述的新颖的脂肪分解酶的全长编码序列的cDNA序列以及所述的全长功能蛋白质及其功能等同物的氨基酸序列。本发明还涉及在工业过程中使用上述酶的方法和诊断真菌感染的方法。本发明中还包括了用本发明的多核苷酸转化过的细胞以及这样的细胞其中,本发明的脂肪分解酶被遗传修饰,以增加该酶的活性和/或表达水平。
文档编号C12N9/20GK1675355SQ03819742
公开日2005年9月28日 申请日期2003年8月15日 优先权日2002年8月19日
发明者理查德·奥尔本, 乌尔里克·福克斯, 安德烈亚斯·弗里茨, 贝娅特丽克丝·格哈德, 奥利弗·海因里希, 希尔马·伊尔根弗里茨, 迪特尔·梅尔, 法维奥·斯普雷亚菲科, 克里斯琴·瓦格纳, 德·莱克斯·博尔, 罗埃尔弗·伯恩哈德·梅玛 申请人:帝斯曼知识产权资产管理有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1