专利名称:来自棉桃阿舒氏囊霉的与跨膜转运相关的新基因产物的制作方法
技术领域:
本发明涉及来自棉桃阿舒氏囊霉(Ashbya gossypii)的新颖多核苷酸;与之杂交的寡核苷酸;包含这些多核苷酸的表达盒和载体;由该多核苷酸转化的微生物;由这些多核苷酸编码的多肽;及将该新颖多肽和多核苷酸用作调节阿舒氏囊霉属微生物中跨膜运输,且尤其是提高维生素B2的产量的靶点。
背景技术:
维生素B2(核黄素,乳黄素)是一种碱敏感和光敏感的维生素,其在溶液中显示黄绿色荧光。维生素B2的缺乏可以导致外胚层的损害,尤其是白内障、角膜炎、角膜血管化,或导致自主泌尿生殖系统紊乱。维生素B2是FAD和FMN分子的前体,这两种分子与NAD+和NADP+在生物学上对氢传递具有重要意义。维生素B2通过磷酸化(FMN)和随后的腺苷酸化(FAD)形成这两种分子。
维生素B2在植物,酵母菌以及多种微生物中由GTP和核酮酸-5-磷酸合成。该反应途径首先打开GTP的嘧唑环并消除一个磷酸残基。保留的磷酸盐经脱氨,还原,和消除形成5-氨基-6-核醇基(ribityl)氨基-2,4-嘧啶酮。该化合物与3,4-二羟基-2-丁酮-4-磷酸反应产生双环分子6,7-二甲基-8-核醇基二氧四氢蝶啶。通过歧化反应该化合物转化成三环化合物核黄素,该反应转移了一个4-碳单位。
维生素B2存在于许多蔬菜和肉类中,在谷类产品中的含量较低。成人每日的维生素B2需要量为约1.4到2毫克。核黄素又是辅酶FMN和FAD在人体中的主要分解产物并就此被排出。
维生素B2是人类和动物的重要营养物质。因此研究人员努力使维生素B2可工业规模产生,并建议由微生物的途径合成维生素B2。可用于该目的的微生物是,例如,枯草杆菌(Bacillus subtilis),子囊菌阿舒假囊酵母菌(Eremothecium ashbyii),棉桃阿舒氏囊霉及酵母Candida flareri和酿酒酵母(Saccharomyces cerevisiae)。为此使用的营养培养基包含作为碳源的糖蜜或植物油、无机盐、氨基酸、动物或植物胨和蛋白质及维生素添加剂。在无菌有氧浸没培养方法中,产率为每升培养液在几天内生成10克以上维生素B2。所需条件为培养液良好的通风,小心搅动及设定低于约30℃的温度。去掉生物质、蒸发并干燥浓缩液得到富含维生素B2的产物。
例如,WO-A-92/01060,EP-A-0 405 370和EP-A-0 531 708中描述了维生素B2的微生物生产。
在Ullmann氏工业化学百科全书A27卷,521页及以下等中,可以找到关于维生素B2的重要性,出现,生产,生物合成和使用的调查。
细胞膜在细胞中起多种作用。首先,膜将细胞内容物从周围环境中划分出来,使得细胞保持完整。膜还起屏障的作用,使得危险或不良化合物不能进入而所需的化合物不能流出。由于细胞膜的结构双层脂分子,其中极性头部基团朝向外(于细胞外或细胞内部)而非极性尾部朝向双层中央并形成疏水核心,其对例如蛋白质,水分子和离子等亲水化合物的非易化扩散天然地不能通透(膜的结构和功能的概述见Gennis,R.B.(1989)生物膜,分子结构和功能(Biomembranes,Molecular Structure and Function,SpringerHeidelberg)。由于有效阻止了化合物透过膜的扩散,该屏障使细胞较周围介质可以含有较高的所需化合物浓度和相对低的不需要的化合物的浓度。
然而,该膜也成为输入所需分子和输出废物分子的有效的屏障。为克服这一困难,细胞膜含有多种能够促进不同类型化合物跨膜运输的转运蛋白孔或通道和运载蛋白。前者形成一种通过膜的可调节孔道,是整合膜蛋白,偶尔为蛋白复合物。通常这种调节或“门控”对通过该孔或该通道的待转运底物具特异性,因而这些跨膜结构对特定类别的底物特异;例如钾通道的构造使得只有具有与钾相似的电荷和大小的离子才能通过。通道和孔蛋白具有一定的疏水和亲水结构域,使得该蛋白的疏水部分能够结合于膜内,而亲水部分则构成通道的内侧,从而提供一种使所选亲水分子能够通过的受保护的亲水环境。本领域已知许多这样的孔/通道,包括钾通道、钙通道、钠通道和氯离子通道等。
由孔和通道介导的这一系统限于非常小的分子,例如离子,因为使完整的蛋白可能经易化扩散通过的足够大的孔或通道将不能阻止更小的分子通过。由于转运的发生需要浓度梯度的驱动力,通过这种方法运输分子也偶尔被称为“易化扩散”。当较大分子(例如葡萄糖或其他糖)在膜一侧的浓度大于另一侧时,通透酶可以类似地促成此较大分子易化扩散进入细胞(也称为“单向转运”)。与孔或通道不同,这些整合蛋白质(常含有6至14个跨膜螺旋)不形成通过膜的开放通道,但其确实与膜表面的目标分子结合,并经过构象改变使目标分子在膜另一侧释放。
然而,细胞常常需要逆存在的浓度梯度输入或输出(“主动转运”)分子,在这种情况下易化扩散不能发生。细胞的这种膜运输通常有两种机制同向转运或逆向转运,和能量偶联的转运,例如由ABC转运蛋白介导的转运。同向转运和逆向转运系统将两种不同分子的跨膜移动偶联在一起(通过对两种不同分子具有不同的结合位点的通透酶实现);两种分子在同向转运中运输方向相同,而在逆向转运中,一种分子被输入而另一种被输出。因为两种分子之一顺浓度梯度移动,该转运在能量上是可能的,而且只有所需化合物逆优势浓度梯度同时移动才能实现这一能量上有利的过程。有些分子在能量驱动的过程中可逆浓度梯度跨膜转运,例如,通过ABC转运蛋白的转运。在这一系统中,位于膜上的转运蛋白具有ATP结合盒子,在与目标分子结合后ATP被转化成ADP+Pi,产生的能量释放后促成目标分子在转运蛋白的协助下向膜对侧移动。所有转运系统的更具体的描述见Bamberg,E.等(1993)“离子泵在脂双层膜上的电荷运输”,Q.Rev.Biophys.261-25;Findlay,J.B.C.(1991)“膜转运系统的结构和功能”,Curr.Opin.Struct.Biol.1804-810;Higgins,C.F.(1992)“从微生物到人类的ABC转运蛋白”,Ann.Rev.Cell.Biol.867-113;Gennis,R.B.(1989)“孔,通道和转运蛋白”,《Biomembranes,Molecular Structure andFunction》,SpringerHeidelberg,270-322页;和Nikaido,H.和Saier,H.(1992)“细菌中的转运蛋白其设计中的共同主题”,Science 258936-942,及这些文献中引用的参考文献。目前仍无利用跨膜转运基因产生具有改变的跨膜转运特性的微生物,优选地为阿舒氏囊霉属,尤其是棉桃阿舒氏囊霉株的描述。
发明概述本发明的目的是提供一种可用于影响阿舒氏囊霉属微生物,尤其是棉桃阿舒氏囊霉的跨膜转运的新颖靶点。具体目的为改善这种微生物的跨膜转运。进一步的目的是通过这种微生物提高维生素B2的产量。
我们发现尤其可以通过提供在棉桃阿舒氏囊霉的维生素B2生产过程中被向上或下调节的编码核酸序列实现该目的(基于试验部分详细描述的MPSS分析法发现的结果)。
我们发现具体地可以通过提供可分离自棉桃阿舒氏囊霉并编码跨膜转运相关蛋白和/或跨膜蛋白,且尤其是具有表1中所示的结构(例如序列同源性)和/或功能特性(如酶活性)的多核苷酸实现该目的a)优选被上调的核酸序列,其编码具有线粒体能量传递蛋白的功能的蛋白。
本发明此方面的一个优选实施方案中,分离了编码本发明核酸序列的特征性部分序列的DNA克隆,其内部名称为“Oligo19”。
在再一优选的实施方案中,根据本发明分离了编码本发明的核酸的完全序列的DNA克隆,其内部名称为“Oligo19v”。
本发明一方面涉及包含SEQ ID NO1所示的核酸序列的多核苷酸。本发明另一方面涉及包含SEQ ID NO3所示的核酸序列或其片段的多核苷酸。这些多核苷酸优选地自阿舒氏囊霉属微生物,尤其是棉桃阿舒氏囊霉中分离。本发明还涉及与这些多核苷酸互补的多核苷酸,以及这些多核苷酸经遗传密码简并性衍生而成的序列。
“Oligo19”和“Oligo19v”的插入序列与来自酿酒酵母的MIPS标签“Ygr257c”有显著的同源性。这些插入序列具有SEQ ID NO1或SEQID NO3所示的核酸序列。来自SEQ ID NO1的相应互补序列或来自SEQID NO3所示的编码链的氨基酸序列或氨基酸部分序列与酿酒酵母线粒体能量传递蛋白具有显著的序列同源性。
b)优选被上调的核酸序列,其编码具有与酿酒酵母ABC转运蛋白相应的功能的蛋白。ABC(ATP结合盒子)蛋白起运输系统的作用,并参与从细胞摄取或释放底物。ATP水解在此驱动该运输过程。
本发明此方面的一个优选实施方案中,分离了编码本发明核酸序列的特征性部分序列的DNA克隆,其内部名称为“Oligo24”。
在另一优选的实施方案中根据本发明分离了编码本发明的核酸的完全序列的DNA克隆,其内部名称为“Oligo24v”。
本发明一方面涉及包含SEQ ID NO5所示的核酸序列的多核苷酸。本发明另一方面涉及包含SEQ ID NO8所示的核酸序列或其片段的多核苷酸。这些多核苷酸优选地自阿舒氏囊霉属微生物,尤其是棉桃阿舒氏囊霉中分离。本发明还涉及与这些多核苷酸互补的多核苷酸,以及这些多核苷酸经遗传密码简并性衍生而成的序列。
“Oligo24”和“Oligo24v”的插入序列与来自酿酒酵母的MIPS标签“Mdl2”有显著的同源性,这些插入序列具有SEQ ID NO5或SEQ IDNO8所示的核酸序列。来自SEQ ID NO5的相应互补序列或来自SEQ IDNO8所示的编码链的氨基酸序列或氨基酸部分序列与酿酒酵母ABC转运蛋白具有显著的序列同源性。
c)优选被下调的核酸序列,其编码具有线粒体膜整合蛋白的功能的蛋白。
本发明此方面的一个优选实施方案中,分离了编码本发明核酸序列的特征性部分序列的DNA克隆,其内部名称为“Oligo109”。
本发明另一优选的实施方案中根据本发明分离了编码本发明的核酸的完全序列的DNA克隆,其内部名称为“Oligo109v”。
本发明一方面涉及包含SEQ ID NO10所示的核酸序列的多核苷酸。本发明另一方面涉及包含SEQ ID NO12所示的核酸序列或其片段的多核苷酸。该多核苷酸优选地自阿舒氏囊霉属微生物,尤其是棉桃阿舒氏囊霉中分离。本发明还涉及与这些多核苷酸互补的多核苷酸,以及这些多核苷酸经遗传密码简并性衍生而成的序列。
“Oligo109”和“Oligo109v”的插入序列与来自酿酒酵母的MIPS标签“Prp12”有显著的同源性,这些插入序列具有SEQ ID NO10或SEQID NO12所示的核酸序列。来自该编码链的氨基酸序列或氨基酸部分序列与酿酒酵母线粒体膜整合蛋白具有显著的序列同源性。
d)优选被下调的核酸序列,其编码具有线粒体内膜转运蛋白的功能的蛋白。
本发明此方面的一个优选实施方案中,分离了编码本发明核酸序列的特征性部分序列的DNA克隆,其内部名称为“Oligo163”。
本发明另一优选的实施方案中根据本发明分离了编码本发明的核酸的完全序列的DNA克隆,其内部名称为“Oligo163v”。
本发明一方面涉及包含SEQ ID NO14所示的核酸序列的多核苷酸。本发明另一方面涉及包含SEQ ID NO17所示的核酸序列或其片段的多核苷酸。这些多核苷酸优选地自阿舒氏囊霉属微生物,尤其是棉桃阿舒氏囊霉中分离。本发明还涉及与这些多核苷酸互补的多核苷酸,以及这些多核苷酸经遗传密码简并性衍生而成的序列。
“Oligo163”和“Oligo163v”的插入序列与来自酿酒酵母的MIPS标签“Flx1”有显著的同源性,这些插入序列具有SEQ ID NO14或SEQID NO17所示的核酸序列。来自该编码链的氨基酸序列或氨基酸部分序列与酿酒酵母线粒体内膜转运蛋白具有显著的序列同源性。
e)优选被下调的核酸序列,其编码具有非液泡H+-ATP酶V0结构域的102kD亚基的功能的蛋白。
本发明此方面的一个优选实施方案中,分离了编码本发明核酸序列的特征性部分序列的DNA克隆,其内部名称为“Oligo31”。
本发明另一优选的实施方案中根据本发明分离了编码本发明的核酸的完全序列的DNA克隆,其内部名称为“Oligo31v”。
本发明一方面涉及包含SEQ ID NO19所示的核酸序列的多核苷酸。本发明另一方面涉及包含SEQ ID NO21所示的核酸序列或其片段的多核苷酸。这些多核苷酸优选地自阿舒氏囊霉属微生物,尤其是棉桃阿舒氏囊霉中分离。本发明还涉及与这些多核苷酸互补的多核苷酸,以及这些多核苷酸经遗传密码简并性衍生而成的序列。
“Oligo31和“Oligo31v”的插入序列与来自酿酒酵母的MIPS标签“STV1”有显著的同源性,这些插入序列具有SEQ ID NO19或SEQ IDNO21所示的核酸序列。来自该编码链的氨基酸序列或氨基酸部分序列与酿酒酵母非液泡H+-ATP酶V0结构域的102kD亚基具有显著的序列同源性。
f)优选被上调的核酸序列,其编码具有与粟酒裂殖酵母(S.pombe.)的isp4蛋白相类似的功能的蛋白。
本发明此方面的一个优选实施方案中,分离了编码本发明核酸序列的特征性部分序列的cDNA克隆,其内部名称为“Oligo4”。
本发明另一优选的实施方案中根据本发明分离了编码本发明的核酸的完全序列的DNA克隆,其内部名称为“Oligo4v”。
本发明一方面涉及包含SEQ ID NO23所示的核酸序列的多核苷酸。本发明另一方面涉及包含SEQ ID NO26所示的核酸序列或SEQ ID NO25所示的SEQ ID NO26的互补序列的多核苷酸。这些多核苷酸优选地自阿舒氏囊霉属微生物,尤其是棉桃阿舒氏囊霉中分离。本发明还涉及与这些多核苷酸互补的多核苷酸,以及这些多核苷酸经遗传密码简并性衍生而成的序列。
“Oligo4和“Oligo4v”的插入序列与来自酿酒酵母的MIPS标签“OPT2”有显著的同源性,这些插入序列包含SEQ ID NO23或SEQ IDNO25所示的核酸序列。来自该编码链(包含SEQ ID NO26)的氨基酸序列或氨基酸部分序列与类似于粟酒裂殖酵母isp4蛋白的酿酒酵母蛋白具有显著的序列同源性。本发明的蛋白也因此被确定为具有寡肽转运蛋白的活性。
g)优选被上调的核酸序列,其编码具有酿酒酵母VAC1蛋白的功能的蛋白,VAC1蛋白是一种具有三个锌指的胞质膜外周蛋白。
本发明此方面的一个优选实施方案中,分离了编码本发明核酸序列的特征性部分序列的DNA克隆,其内部名称为“Oligo6”。
本发明另一优选的实施方案中根据本发明分离了编码本发明的核酸的完全序列的DNA克隆,其内部名称为“Oligo6v”。
本发明一方面涉及包含SEQ ID NO28所示的核酸序列的多核苷酸。本发明另一方面涉及包含SEQ ID NO31所示的核酸序列或其片段的多核苷酸。这些多核苷酸优选地自阿舒氏囊霉属微生物,尤其是棉桃阿舒氏囊霉中分离。本发明还涉及与这些多核苷酸互补的多核苷酸,以及这些多核苷酸经遗传密码简并性衍生而成的序列。
“Oligo6”和“Oligo6v”的插入序列与来自酿酒酵母的MIPS标签“VAC1”有显著的同源性,这些插入序列具有SEQ ID NO28或SEQ IDNO31所示的核酸序列。来自SEQ ID NO28的相应互补序列或来自SEQID NO3所示序列的氨基酸序列或氨基酸部分序列与酿酒酵母的VAC1蛋白(一种具有三个锌指的胞质膜外周蛋白)具有显著的序列同源性。
h)优选被上调的核酸序列,其编码具有ATP酶样功能的蛋白。
本发明此方面的一个优选实施方案中,分离了编码本发明核酸序列的特征性部分序列的DNA克隆,其内部名称为“Oligo146”。
本发明另一优选的实施方案中根据本发明分离了编码本发明的核酸的完全序列的DNA克隆,其内部名称为“Oligo146v”。
本发明一方面涉及包含SEQ ID NO33所示的核酸序列的多核苷酸。本发明另一方面涉及包含SEQ ID NO35所示的核酸序列或其片段的多核苷酸。这些多核苷酸优选地自阿舒氏囊霉属微生物,尤其是棉桃阿舒氏囊霉中分离。本发明还涉及与这些多核苷酸互补的多核苷酸,以及这些多核苷酸经遗传密码简并性衍生而成的序列。
“Oligo146”和“Oligo146v”的插入序列与来自酿酒酵母的MIPS标签“Ymr162c”有显著的同源性,这些插入序列具有SEQ ID NO33或SEQ ID NO35所示的核酸序列。来自SEQ ID NO33的相应互补序列或来自SEQ ID NO35所示编码链的氨基酸序列或氨基酸部分序列与酿酒酵母的具有ATP酶功能或具有ATP酶样功能的蛋白具有显著的序列同源性。
i)优选被上调的核酸序列,其编码具有类似于酿酒酵母PHO85蛋白的功能的蛋白。PHO85是一种激酶,参与多种细胞过程,包括调节PHO基因、糖原代谢、调节细胞周期和细胞形态。
本发明此方面的一个优选实施方案中,分离了编码本发明核酸序列的特征性部分序列的DNA克隆,其内部名称为“Oligo56”。
本发明另一优选的实施方案中根据本发明分离了编码本发明的核酸的完全序列的DNA克隆,其内部名称为“Oligo56v”。
本发明一方面涉及包含SEQ ID NO37所示的核酸序列的多核苷酸。本发明另一方面涉及包含SEQ ID NO40所示的核酸序列或其片段的多核苷酸。这些多核苷酸优选地自阿舒氏囊霉属微生物,尤其是棉桃阿舒氏囊霉中分离。本发明还涉及与这些多核苷酸互补的多核苷酸,以及这些多核苷酸经遗传密码简并性衍生而成的序列。
“Oligo56”和“Oligo56v”的插入序列与来自酿酒酵母的MIPS标签“Ypl110c”有显著的同源性,这些插入序列具有SEQ ID NO37或SEQID NO40所示的核酸序列。来自SEQ ID NO37的相应互补序列或SEQ IDNO40所示编码链的氨基酸序列或氨基酸部分序列与酿酒酵母的PHO85蛋白具有显著的序列同源性。
k)优选被上调的核酸序列,其编码具有类似于参与膜运输的酿酒酵母p24蛋白质的功能的蛋白。P24蛋白家族成员是具有短的胞质COOH端的小的I型跨膜蛋白。其在早期分泌路径中起运输作用,并参与例如各种分泌蛋白由内质网向高尔基体的转运。
本发明此方面的一个优选实施方案中,分离了编码本发明核酸序列的特征性部分序列的DNA克隆,其内部名称为“Oligo167”。
本发明另一优选的实施方案中根据本发明分离了编码本发明的核酸的完全序列的DNA克隆,其内部名称为“Oligo167v”。
本发明一方面涉及包含SEQ ID NO42所示的核酸序列的多核苷酸。本发明另一方面涉及包含SEQ ID NO44所示的核酸序列或其片段的多核苷酸。这些多核苷酸优选地自阿舒氏囊霉属微生物,尤其是棉桃阿舒氏囊霉中分离。本发明还涉及与这些多核苷酸互补的多核苷酸,以及这些多核苷酸经遗传密码简并性衍生而成的序列。
“Oligo167”和“Oligo167v”的插入序列与来自酿酒酵母的MIPS标签“ERP5”有显著的同源性,这些插入序列具有SEQ ID NO42或SEQID NO44所示的核酸序列。来自SEQ ID NO42的相应互补序列和来自SEQ ID NO44的编码链的氨基酸序列与参与膜运输的酿酒酵母p24蛋白具有显著的序列同源性。
本发明再一方面涉及尤其是在严格的条件下与以上多核苷酸之一杂交的寡核苷酸。
本发明还涉及可以与本发明的寡核苷酸之一杂交并编码来自阿舒氏囊霉属微生物的基因产物或该基因产物的功能等价物的多核苷酸。
本发明进一步涉及由上述多核苷酸编码的多肽或蛋白质;及其具有如下氨基酸序列的肽片段,该氨基酸序列包含SEQ ID NO2,4,6,7,9,11,13,15,16,18,20,22,24,27,29,30,32,34,36,38,39,41,43或SEQ ID NO45中显示的至少10个连续的氨基酸残基;以及本发明的多肽或蛋白质的功能等价物。
在这方面,功能等价物与本发明中具体公开的产物相比在氨基酸序列上于至少一个,例如1到30或1到20或1到10个序列位置由于添加,插入,替代,缺失或倒位而不同(这可以经与其他蛋白质进行序列比对推断),但功能等价物不丧失最初观察到的蛋白功能。因此,与天然蛋白相比较功能等价物可能具有基本相同的、较高或较低的活性。
本发明其它方面涉及用于重组产生本发明蛋白的表达盒,其包含可操作地与至少一个调节核酸序列连接的上述核酸序列之一;并涉及包含至少一个这样的本发明表达盒的重组载体。
本发明还提供了由至少一个上述类型的载体转化的原核或真核宿主。一个优选的实施方案提供了原核或真核宿主,在宿主中至少一种编码上述本发明多肽的基因的功能性表达受到调节(例如被抑制或被过量表达);或上述定义的多肽的生物活性被降低或增加。优选的宿主选自子囊菌,尤其是阿舒氏囊霉属,优选地为棉桃阿舒氏囊霉株。
上述意义的基因表达调节包括对表达的抑制(如通过阻断表达的某一阶段(尤其是转录或翻译)抑制表达)以及基因的特异过量表达(例如通过修饰调节序列或增加编码序列的拷贝数)。
本发明另一方面涉及本发明的表达盒、本发明的载体或本发明的宿主在维生素B2和/或其前体和/或其衍生物的微生物生产中的应用。
本发明另一方面涉及本发明表达盒、本发明的载体或本发明的宿主在上述本发明多肽的重组生产中的应用。
本发明还提供了一种检测或验证可以用于调节维生素B2和/或其前体和/或其衍生物的微生物生产的效应物靶点的方法。该方法涉及使用能够与选自上述本发明多肽或其编码核酸序列的靶点相互作用(例如非共价结合)的效应物处理能够以微生物学方式生产维生素B2和/或其前体和/或其衍生物的微生物,验证该效应物对微生物生产的维生素B2和/或其前体和/或其衍生物的量的影响,以及在适当时分离靶点。在此优选地通过与在缺乏该效应物而其他条件相同时微生物的维生素B2产生直接比较来进行验证。
本发明另一方面涉及调节维生素B2和/或其前体和/或其衍生物的微生物生产(涉及产生的量和/或速率)的方法,其中用效应物处理能够以微生物学方式产生维生素B2和/或其前体和/或其衍生物的微生物,该效应物可以与选自上面定义的本发明多肽或编码该多肽的核酸序列的靶点相互作用。
应提及的上述效应物的优选例子为a)抗体或其抗原结合片段;b)与a)不同并可以与本发明的多肽相互作用的多肽配体;c)可以调节本发明多肽的生物活性的低分子量效应物;d)可以与本发明的核酸序列相互作用的反义核酸序列。
本发明还涉及对至少一个以上定义的本发明靶点具有特异性的上述效应物。
本发明另一方面涉及微生物生产维生素B2和/或其前体和/或其衍生物的方法,其中在有利产生维生素B2和/或其前体和/或其衍生物的条件下培养以上定义的宿主,所需的产物自培养混合物中分离。在这方面,优选地用以上定义的效应物在培养前和/或培养过程中处理该宿主。在此优选的宿主选自阿舒氏囊霉属微生物,尤其是上述转化的宿主。
本发明最后的方面涉及利用本发明的多核苷酸或多肽作为调节阿舒氏囊霉属微生物生产维生素B2和/或其前体和/或其衍生物的靶点。
图1显示本发明的氨基酸部分序列(相应于SEQ ID NO1第609位至第1位的互补链)(上面的序列)和来自酿酒酵母的MIPS标签Ygr257c的部分序列(下面的序列)的比对。相同的序列位置在两个序列之间标出。相似的序列位置以“+”标出。
图2显示本发明的氨基酸部分序列(SEQ ID NO6)(相应于SEQ IDNO5第1494位至第1387位的互补链)(上面的序列)和来自酿酒酵母的MIPS标签Mdl2的部分序列(下面的序列)的比对。相同的序列位置在两个序列之间标出。相似的序列位置以“+”标出。
图3显示本发明的氨基酸部分序列(相应于SEQ ID NO10第15位至第455位的编码链)(上面的序列)和来自酿酒酵母的MIPS标签Prp12的部分序列(下面的序列)的比对。相同的序列位置在两个序列之间标出。相似的序列位置以“+”标出。
图4显示本发明的氨基酸部分序列(相应于SEQ ID NO14第246位至第1118位的编码链)(上面的序列)和来自酿酒酵母的MIPS标签Flx1的部分序列(下面的序列)的比对。相同的序列位置在两个序列之间标出。相似的序列位置以“+”标出。
图5显示本发明的氨基酸部分序列(相应于SEQ ID NO19第2位至第790位的编码链)(上面的序列)和来自酿酒酵母的MIPS标签STV1的部分序列(下面的序列)的比对。相同的序列位置在两个序列之间标出。相似的序列位置以“+”标出。
图6显示本发明的氨基酸部分序列(相应于SEQ ID NO23第869位至第522位的互补链)(上面的序列)和来自酿酒酵母的MIPS标签OPT2的部分序列(下面的序列)的比对。相同的序列位置在两个序列之间标出。相似的序列位置以“+”标出。
图7A显示本发明的氨基酸部分序列(相应于SEQ ID NO28第356位至第243位的互补序列)(上面的序列)和来自酿酒酵母的MIPS标签VAC1的部分序列(下面的序列)的比对。相同的序列位置在两个序列之间标出。相似的序列位置以“+”标出。图7B显示本发明的氨基酸部分序列(相应于SEQ ID NO28第166位至第2位的互补序列)(上面的序列)和来自酿酒酵母的MIPS标签VAC1的部分序列(下面的序列)的比对。相同的序列位置在两个序列之间标出。相似的序列位置以“+”标出。
图8显示本发明的氨基酸部分序列(相应于SEQ ID NO33第904位至第707位的互补序列)(上面的序列)和来自酿酒酵母的MIPS标签Ymr162c的部分序列(下面的序列)的比对。相同的序列位置在两个序列之间标出。相似的序列位置以“+”标出。
图9显示本发明的氨基酸部分序列(相应于SEQ ID NO37第898位至第5位的互补序列)(上面的序列)和来自酿酒酵母的MIPS标签Ypl110c的部分序列(下面的序列)的比对。相同的序列位置在两个序列之间标出。相似的序列位置以“+”标出。
图10显示本发明的氨基酸部分序列(相应于SEQ ID NO42第931位至第806位的互补序列)(上面的序列)和来自酿酒酵母的MIPS标签ERP5的部分序列(下面的序列)的比对。相同的序列位置在两个序列之间标出。相似的序列位置以“+”标出。
发明详述本发明的核酸分子编码的多肽或蛋白在此被称为跨膜转运蛋白(例如具有与跨膜转运系统相关的活性)或简称为“TMT蛋白”。这些TMT蛋白具有例如控制膜相关转运系统的功能,该转运系统消耗能量将所需蛋白质逆浓度梯度转运入细胞内。TMT蛋白能够影响细胞对外界条件的反应,并由此例如调节细胞的代谢。由于已掌握了可用于棉桃阿舒氏囊霉的克隆载体(例如Wright和Philipsen(1991)基因(Gene),109,99-105中公开)以及棉桃阿舒氏囊霉和相关的酵母物种的遗传操作技术,本发明的核酸分子可以用于这些生物体,尤其是棉桃阿舒氏囊霉的遗传操作,从而使其更好并更有效的生产维生素B2和/或其前体和/或其衍生物。产量或生产效率的提高可以由操作本发明的基因的直接效应或该操作的间接效应导致。
本发明基于在此被称为TMT核酸和TMT蛋白的新颖分子的提供,这些分子参与尤其是棉桃阿舒氏囊霉中的跨膜转运(例如参与转运蛋白的合成或调节)。本发明的TMT分子在棉桃阿舒氏囊霉中的活性影响该微生物的维生素B2生产。优选对本发明的TMT分子的活性进行调节,以便本发明的TMT蛋白参与的棉桃阿舒氏囊霉的代谢和/或能量途径在维生素B2的产率、产量和/或生产效率方面受到调节,即直接或间接地调节棉桃阿舒氏囊霉中维生素B2的产率、产量和/或生产效率。
本发明提供的核酸序列可以自例如棉桃阿舒氏囊霉株基因组分离,所述菌株可以从美国典型培养物保藏中心(保藏号为ATCC 10895)自由获得。
维生素B2生产的改进通过改变本发明的TMT蛋白的量和/或活性有多种可能的机制可以直接地影响棉桃阿舒氏囊霉株的维生素B2的产率、产量和/或生产效率。
因此,更有效的跨膜转运可提高细胞的应答,从而增加有价值的所需产物的生成。对本发明的一种或多种TMT蛋白的诱变也可以导致TMT蛋白的活性改变(增加或降低),间接地影响棉桃阿舒氏囊霉株中所需产物的生产。例如可通过TMT蛋白使细胞适应新的或改变的外部环境。通过改善这些修饰细胞的生长和繁殖,可以增加这些细胞在大规模培养中的生存力并提高分裂速率。最后,可由此增加这些细胞生产所需目标产物的产率。
多肽本发明涉及包含上述的氨基酸序列或其特征性部分序列和/或由在此描述的核酸序列编码的多肽。
本发明还包括具体公开的新颖多肽的“功能等价物”。
具体公开的多肽的“功能等价物”或类似物为本发明的目的是指与具体公开的多肽不同但仍具有所需生物活性(例如底物特异性)的多肽。
“功能等价物”在本发明中尤其指在至少一个上述序列位置中具有与具体公开所不同的氨基酸但仍具有一种上述的生物活性的突变体。“功能等价物”因此包括可由一个或多个氨基酸添加,替换,缺失和/或倒位获得的突变体,只要生成的突变体能具有本发明的性质谱,所述的修饰可发生于任何序列位置。功能等价物尤其还可以是这样的形式,即突变体和未修饰的多肽就反应模式而言在性质上是一致的,即例如对同样的底物的转化速率不同。
上述意义的“功能等价物”也可以是所述多肽的前体以及该多肽的功能衍生物和盐类。“盐类”一词指本发明蛋白分子的羧基的盐和氨基的酸加成盐。可由本领域已知方式制备羧基的盐,包括例如钠,钙,铵,铁和锌盐等无机盐以及与有机碱的盐,例如与胺类如三乙醇胺、精氨酸、赖氨酸、哌啶等的盐。本发明另一方面涉及酸加成盐,例如与无机酸(例如盐酸或硫酸)的盐和与有机酸(例如乙酸和草酸)的盐。
本发明多肽的“功能衍生物”也可由已知技术在氨基酸侧链官能团上或在多肽的N末端或C末端制备。这样的衍生物包括例如羧基的脂族酯和可通过与氨或与伯胺或仲胺反应得到的羧基的酰胺;通过与酰基反应制备的游离氨基的N-酰基衍生物;或通过与酰基反应制备的游离羟基的O-酰基衍生物。
“功能等价物”自然地也包括可自其他生物体获得的多肽和自然出现的变体。例如,可以通过序列比对发现同源序列区并根据本发明的具体要求确立等价酶。
“功能等价物”还包括具有例如所需的生物学功能的片段,优选为本发明多肽的单结构域或序列基序。
“功能等价物”还可以是具有上述多肽序列之一或其功能等价物和至少一个另外的具有不同功能的异源序列的融合蛋白,该异源序列在所述多肽序列或其功能等价物的N或C末端进行功能性连接(即该融合蛋白的各部分在功能方面产生的相互损害是微不足道的)。这种异源序列的非限制性例子为例如信号肽,酶,免疫球蛋白,表面抗原,受体或受体配体。
根据本发明,“功能等价物”包括本文具体公开的蛋白的同系物。通过Pearson和Lipman,Proc.Natl.Acad.Sci.(USA)85(8),1988,2444-2448.的算法计算,这些同系物与具体公开的序列之一具有至少60%,优选地至少75%,尤其至少85%,例如90%,95%,或99%的同源性。
在可能存在蛋白糖基化的情况下,本发明的等价物包括以上定义的蛋白类型的去糖基化或糖基化形式,及可通过改变糖基化模式获得的修饰形式。
诱变可产生本发明的蛋白或多肽的同系物,例如通过蛋白点突变或截短实现。这里使用的“同系物”一词涉及可以对蛋白活性产生激动剂或拮抗剂作用的蛋白的变体形式。
可以通过筛选突变体(例如截短突变体)组合文库鉴定本发明蛋白的同系物。通过核酸水平的组合诱变,例如通过合成的寡核苷酸混合物的酶促连接,可以产生一个多样化的蛋白质变体文库。大量方法可用于从简并寡核苷酸序列产生潜在同系物的文库。简并基因序列的化学合成可在自动DNA合成仪中进行,然后可将合成的基因与适合的表达载体连接。利用一组简并基因可在一个混合物中提供编码一组所需的潜在蛋白质序列的所有序列。本领域技术人员已知合成简并寡核苷酸的方法(例如Narang,S.A.(1983)Tetrahedron 393;Itakura等(1984)Annu.Rev.Biochem.53323;Itakura等(1984)Science 1981056;Ike等(1983)Nucleic Acids Res.11477)。
此外,也可以利用蛋白密码子的片段文库来生成多样的蛋白片段群用于筛选和随后选择本发明蛋白的同系物。在一个实施方案中,通过如下方法产生编码序列片段文库在每个分子只发生大约一次切割的条件下,以核酸酶处理编码序列的双链PCR片段,变性双链DNA,之后使该DNA复性,从而形成可能包含来自不同切割产物的有义/反义对的双链DNA,经S1核酸酶处理自新形成的双链体中去除单链部分,并将产生的片段文库连接到表达载体中。可由这种方法得到编码本发明蛋白的不同大小的N末端、C末端和内部片段的表达文库。
现有技术中已知一些技术可以从点突变或截短产生的组合文库中筛选基因产物和从cDNA文库中筛选具有选定性质的基因产物。这些技术经改造后可用于快速筛选由本发明同系物的组合诱变产生的基因文库。最常用的高通量大型基因文库筛选分析技术包括将该基因文库克隆入可复制的表达载体中,使用产生的载体文库转化合适的细胞,并在检测所需的活性有助于分离如下载体的条件下表达该组合基因,所述载体编码的基因的产物是活性检测中被检出的产物。递归总体诱变(Recursive ensemblemutagenesis,REM)技术增加文库中功能性突变体的频率,因而可以与筛选实验结合用于鉴定同系物。(Arkin和Yourvan(1992)PNAS897811-7815;Delgrave等(1993)蛋白质工程(Protein Engineering)6(3)327-331)。
可重组制备本发明的多肽(见以下部分)或可通过传统的生化技术自微生物,特别是阿舒氏囊霉属微生物中分离自然形式的多肽。(见Cooper,T.G.,Biochemische Arbeitsmethoden,Verlag Walter de Gruyter,柏林,纽约或Scopes,R.,蛋白质纯化(Protein Purification),施普林格,纽约,海德堡,柏林)。
核酸序列本发明还涉及编码上述多肽之一及其功能等价物的核酸序列(单链和双链DNA和RNA序列,例如cDNA和mRNA),该核酸序列可以例如利用人工核苷酸类似物获得。
本发明既涉及编码本发明的多肽或蛋白质或其生物活性部分的分离的核酸分子,又涉及可用作例如鉴定或扩增本发明的编码核酸的杂交探针或引物的核酸片段。
本发明的核酸分子还可包含来自基因编码区的3’和/或5’末端的非翻译序列。
“分离的”核酸分子自存在于该核酸的天然来源中的其他核酸分子中分离出来,如果该核酸分子由重组技术产生,还可以基本不含其他细胞物质或培养基;如果由化学方法合成,则基本不含化学前体或其他化学物质。
通过分子生物学标准技术以及本发明提供的序列信息可以分离本发明的核酸分子。例如,以一种具体公开的完全序列或其一部分为杂交探针,通过标准杂交技术(如Sambrook,J.,Fritsch,E.F.和Maniatis,T.分子克隆实验室手册,第二版,Molecular CloningA Laboratory Manual.2ndedition,美国冷泉港实验室(Cold Spring Harbor Laboratory),美国冷泉港实验室出版社,冷泉港,纽约,1989的描述),可以从适宜的cDNA文库中分离cDNA。使用基于一种公开序列而构建的寡核苷酸引物、通过聚合酶链反应也可以分离获得包含该序列或其一部分的核酸分子。由这种方法扩增的核酸分子可以被克隆入合适的载体中并由DNA序列分析法表征。由标准合成法,例如使用自动DNA合成仪也可以产生相应于TMT核苷酸序列的本发明寡核苷酸。
本发明还包括与具体描述的核苷酸序列互补的核酸分子或其一部分。
本发明的核苷酸序列使得可产生能用于鉴定和/或克隆其他细胞类型和生物中的同源序列的探针和引物。这样的探针和引物通常包括如下核苷酸序列区域,该区域可以在严格条件下与本发明核酸序列的有义链或相应的反义链中的至少约12,优选地约25,例如约40,50或75个连续的核苷酸杂交。
本发明的其它核酸序列衍生自SEQ ID NO1,3,5,8,10,12,14,17,19,21,23,25,26,28,31,33,35,37,40,42或SEQ ID NO44并由于添加,替代、插入或缺失一个或多个核苷酸而与所衍生自的序列不同,但仍编码具有所需性质谱的多肽。
本发明还包括含有所谓的沉默突变或经过修饰(这是根据特定来源或宿主生物的密码子使用与具体公开的序列相比而言的)的核酸序列以及它们的自然存在的变体(例如拼接变体或等位基因变体)。本发明还涉及可通过保守核苷酸替代(即相关的氨基酸被具有同样电荷、大小、极性和/或溶解性的氨基酸替代)获得的序列。
本发明还涉及由序列多态性自具体公开的核酸衍生得到的分子。这些遗传多态性可由于自然变异存在于群体的个体中。这些自然变异通常导致基因的核苷酸序列出现1%至5%的变化。
本发明还包括与上述编码序列杂交或互补的核酸序列。对基因组或cDNA文库进行筛选可发现这些多核苷酸,适当时可以利用合适的引物通过PCR扩增这些多核苷酸,并例如使用合适的探针进行分离。另一种可能的方案是利用本发明的多核苷酸或载体转化合适的微生物,增殖该微生物并由此扩增这些多核苷酸然后分离之。再一可能方案是通过化学途径合成本发明的多核苷酸。
能与多核苷酸“杂交”的性质意味着多核苷酸或寡核苷酸在严格的条件下能与几乎互补的序列结合,而在此条件下,非互补序列之间不发生非特异的结合。为此这些序列应具有70%至100%,优选为90%至100%的互补性。互补序列能够特异性地互相结合的性质可用于例如Northern或Southern印迹杂交或在PCR或RT-PCR中用于引物的结合。为此目的通常使用长30个碱基对或以上的寡核苷酸。严格的条件指例如在Northern印迹杂交法中,在50-70℃,优选地为60-65℃下进行洗涤,如用含有0.1xSSC缓冲液和0.1%SDS(20x SSC3M氯化钠,0.3M柠檬酸钠,pH7.0)的洗涤溶液洗脱非特异杂交的cDNA探针或寡核苷酸。在此情况下,如上述只有高度互补的核酸互相保持结合。本领域技术人员已知这种严格条件的建立,并可参见例如Ausubel等的《Current Protocols in MolecularBiology》,John Wiley & Sons,纽约N.Y.(1989),6.3.1-6.3.6.中的描述。
本发明另一方面涉及反义核酸。其包含与有义编码核酸互补的核苷酸序列。该反义核酸可与整个编码链互补或仅与其中一部分互补。在另一个实施方案中,该反义核酸分子与核苷酸序列编码链的非编码区反义。“非编码区”指序列中被称为5’-和3’-非翻译区的部分。
反义寡核苷酸可以是例如大约5,10,15,20,25,30,35,40,45或50个核苷酸长。可由本领域已知的方法通过化学合成和酶促连接反应构建本发明的反义核酸。反义核酸可由天然存在的核苷酸或各种修饰的、设计以增强分子的生物稳定性或增强反义和有义核酸间形成的双链体的物理稳定性的核苷酸通过化学方式合成。可以使用的例子包括硫代磷酸酯衍生物和吖啶取代的核苷酸。可用于产生反义核酸的经修饰的核苷有例如5-氟尿嘧啶,5-溴尿嘧啶,5-氯尿嘧啶,5-碘尿嘧啶,次黄嘌呤,黄嘌呤,4-乙酰胞嘧啶,.5-(羧基羟基甲基)尿嘧啶,5-羧基甲基氨基甲基-2-硫尿苷,5-羧基甲基氨基甲基尿嘧啶,二氢尿嘧啶,β-D-半乳糖基queuosine,肌苷,N6-异戊烯腺嘌呤,1-甲基鸟嘌呤,1-甲基肌苷,2,2-二甲基鸟嘌呤,2-甲基腺嘌呤,2-甲基鸟嘌呤,3-甲基胞嘧啶,5-甲基胞嘧啶,N6-甲基腺嘌呤,7-甲基鸟嘌呤,5-甲基氨基甲基尿嘧啶,5-甲氧基氨基甲基-2-硫尿嘧啶,β-D-甘露糖基queuosine,5-甲氧基羧基甲基尿嘧啶,5-甲氧基尿嘧啶,2-甲硫基-N6-异戊烯腺嘌呤,尿嘧啶-5-氧基乙酸(v),Wybutoxosine,假尿嘧啶,queuosine,2-硫代胞嘧啶,5-甲基-2-硫尿嘧啶,2-硫尿嘧啶,4-硫尿嘧啶,5-甲基尿嘧啶,尿嘧啶-5-氧乙酸甲基酯,3-(3-氨基-3-羧基丙基)尿嘧啶,(acp3)w和2,6-二氨基嘌呤等。也可利用其中以反义方向亚克隆了核酸的表达载体来生物产生反义核酸。
本发明的反义核酸分子通常被施用给细胞或在原位产生,这样它们可以与该细胞mRNA和/或编码DNA杂交或结合,通过例如抑制转录和/或翻译抑制蛋白的表达。
可以例如通过使反义核酸分子与能结合细胞表面受体或抗原的肽或抗体相连接,以修饰反义分子从而使之能与在所选的细胞表面上表达的受体或抗原特异性地结合。该反义核酸分子还可通过在此描述的载体被给予细胞。为使细胞内的反义分子达到足够的浓度,优选使用的载体构建体为其中反义核酸分子处于强的细菌、病毒或真核细胞启动子的控制之下的载体。
在另一个实施方案中,本发明的反义核酸分子是一种α-异头核酸分子。α-异头核酸分子(α-anomeric nucleic acid molecule)与互补的RNA形成特有的双链杂交体,与通常的α单元不同,这两条链的走向互相平行(Gaultier等,(1987)Nucleic Acids Res.156625-6641)。该反义核酸分子还可以包含2'-O-甲基核糖核苷酸(Inoue等.,(1987)Nucleic Acids Res.156131-6148)或嵌合RNA-DNA类似物(Inoue等.(1987)FEBS Lett.215327-330)。
本发明还涉及核酶。其为具有核糖核酸酶活性的催化性RNA分子,能够切割具有与其互补的区域的单链核酸例如mRNA。因此核酶(例如锤头核酶(见Haselhoff和Gerlach(1988)Nature 334585-591))可用于本发明转录物的催化性切割从而抑制相应核酸的翻译。对本发明的编码核酸具有特异性的核酶可以在例如本发明具体公开的cDNA的基础上形成。例如,可构建四膜虫-L-19 IVS RNA的衍生物,其中活性位点的核苷酸序列与本发明的编码mRNA中待切割的核苷酸序列互补。(参考例如US-A-4 987071和US-A-5 116 742)。可替换地,可用mRNA自RNA分子池中选择具有特异的核糖核酸酶活性的催化性RNA(见例如Bartel,D.,和Szostak,J.W.(1993)Science 2611411-1418)。
可替换地,本发明序列的基因表达可通过与本发明核苷酸序列的调节区互补(例如与编码序列的启动子和/或增强子互补)的核苷酸序列的打靶来抑制,这种打靶可造成三股螺旋结构形成从而阻止目标细胞中相应基因的转录(Helene,C.(1991)Anticancer Drug Res.6(6)569-584;Helene,C.等,(1992)Ann.N.Y.Acad.Sci.66027-36;和Maher.,L.J.(1992)Bioassays 14(12)807-815)。
表达构建体和载体本发明还涉及包含在调节性核酸序列的遗传控制下的编码本发明多肽的核酸序列的表达构建体;以及包含至少一个这样的表达构建体的载体。本发明的这种表达构建体优选包含位于特定编码序列5’端上游的启动子以及位于特定编码序列3’端下游的终止序列和,适当时,其他通常的调节元件,这些元件每一个都与该编码序列可操作地连接。“可操作地连接”指启动子,编码序列,终止子和适当时其他调节元件的相继排列方式,这种方式使得每个调节元件都能按预期行使其功能用于编码序列的表达。可操作连接的序列的例子为前导序列和增强子、多腺苷酸化信号等。其他调节元件包括选择标记、扩增信号、复制起点等。适宜的调节序列在例如Goeddel,基因表达技术酶学方法(Gene Expression TechnologyMethodsin Enzymology)185,Academic Press,圣地亚哥San Diego,加利福尼亚州CA(1990)中有所描述。
除了人工调节序列,天然的调节序列仍可以存在于实际的结构基因之前。这种天然调节可在适当时通过基因修饰而关闭,从而使基因的表达可被增加或降低。然而,基因构建体也可具有较为简单的结构,即在结构基因之前没有插入附加的调节信号,且具有调节功能的天然启动子未被删除。可替换地,可以使天然调节序列发生突变不再具有调节作用,从而增强或降低基因的表达。核酸序列在基因构建体中可有一个或多个拷贝。
可使用的启动子的例子包括cos,tac,trp,tet,trp-tet,lpp,lac,lpp-lac,lacIq,T7,T5,T3,gal,trc,ara,SP6,λ-PR或λ-PL启动子(它们优选用于革兰氏阴性细菌);革兰氏阳性细菌启动子amy和SPO2,酵母启动子ADC1,MFα,AC,P-60,CYC1,GAPDH或植物启动子CaMV/35S,SSU,OCS,lib4,usp,STLS1,B33,或泛素或菜豆蛋白启动子。尤其优选使用可诱导的启动子,例如光诱导的启动子,更优选为温度诱导的启动子如PrP1启动子。原则上所有天然启动子以及它们的调节序列均可使用。此外,使用合成启动子也可能是有利的。
所述的调节序列旨在用于实现核酸序列的特异表达。这意味着例如视宿主生物不同使基因只在诱导后才表达或过量表达或立即被表达和/或过量表达。
此外优选调节序列或因子可以正面地产生影响,从而增加或减低表达。因此,调节元件的增强作用可以有利地使用强转录信号如启动子和/或增强子在转录水平上发生。然而通过例如增加mRNA的稳定性,也可加强其翻译。
融合适宜的启动子和适宜的核苷酸编码序列以及终止信号或多腺苷酸化信号可以产生表达盒。为此目的可以使用常规的重组和克隆技术,参见T.Maniatis,E.F.Fritsch和J.Sambrook,分子克隆实验室手册(Molecular CloningA Laboratory Manual),Cold Spring HarborLaboratory,冷泉港Cold Spring Harbor,纽约(1989);T.J.Silhavy,M.L.Berman和L.W.Enquist,基因融合试验(Experiments with GeneFusions),Cold Spring Harbor Laboratory,Cold Spring Harbor,纽约(1984);Ausubel,F.M.等,Current Protocols in Molecular Biology,GreenePublishing Assoc.and Wiley Interscience(1987)。
为在适宜的宿主生物中表达,重组核酸构建体或基因构建体可以有利地插入宿主特异的载体中实现这些基因在宿主中的最佳表达。载体是本领域技术人员熟知的,并可在例如“克隆载体”(Cloning Vectors)(PouwelsP.H.等,eds,Elsevier,Amsterdam-New York-Oxford,1985)中找到有关内容。载体不仅指质粒,还包括本领域技术人员已知的所有其他载体,例如噬菌体,病毒如SV40、CMV、杆状病毒和腺病毒,转座子,IS元件,质粒,粘粒和线性或环状DNA。这些载体可以在宿主生物中自主复制或随染色体复制。
可以提及的适宜表达载体的例子有常规的融合表达载体如pGEX(Pharmacia Biotech Inc;Smith,D.B.和Johnson,K.S.(1988)Gene 6731-40),pMAL(New England Biolabs,Beverly,MA)和pRIT 5(Pharmacia,Piscataway,NJ),使用这些载体可以分别使谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白和A蛋白融合至重组目标蛋白。
非融合蛋白表达载体如pTrc(Amann等(1988)Gene 69301-315)和pET 11d(Studier等,基因表达技术酶学方法(Gene ExpressionTechnologyMethods in Enzymology)185,Academic Press,圣地亚哥,加利福尼亚(1990)60-89)。
用于酿酒酵母中表达的酵母表达载体如pYepSec1(Baldari等(1987)Embo J.6229-234),pMFα(Kurjan和Herskowitz(1982)细胞(Cell)30933-943),pJRY88(Schultz等(1987)基因(Gene)54113-123)和pYES2(Invitrogen Corporation,圣地亚哥,加利福尼亚)。有关适用于其他真菌(如丝状真菌)的载体和载体构建方法的例子的详细描述见例如van denHondel,C.A.M.J.J.& Punt,P.J.(1991)“丝状真菌基因转移系统和载体的发展”,《真菌的应用分子遗传学》(Applied Molecular Genetics ofFungi),J.F.Peberdy等eds,pp.1-28,Cambridge University PressCambridge。
现有用于培养的昆虫细胞(例如Sf9细胞)中蛋白的表达的杆状病毒载体包括pAc系列(Smith等,(1983)Mol.Cell Biol.32156-2165)和pVL系列(Lucklow和Summers(1989)病毒学(Virology)17031-39)。
植物表达载体的例子的详细描述见例如Becker,D.,Kemper,E.,Schell,J.和Masterson,R.(1992)“紧靠左边界带有选择标记的新植物二元载体”,Plant Mol.Biol.201195-1197;和Bevan,M.W.(1984)“用于植物转化的农杆菌二元载体”,Nucl.Acids Res.128711-8721。
哺乳动物表达载体例如pCDM8(Seed,B.(1987)Nature 329840)和pMT2PC(Kaufman等(1987)EMBO J.6187-195)。
适用于原核和真核细胞的其它表达系统在Sambrook,J.,Fritsch,E.F.和Maniatis,T.,分子克隆实验室手册(Molecular cloningA LaboratoryManual),第二版,Cold Spring Harbor Laboratory,Cold Spring HarborLaboratory Press,Cold Spring Harbor,纽约,1989.的第16和17章中描述。
重组微生物本发明的载体可用于产生重组微生物,所述微生物由例如至少一个本发明的载体转化并可用于产生本发明的多肽。有利地,可以将上述的本发明重组构建体引入适合的宿主系统中并在其中表达。本领域技术人员熟悉克隆和转染的方法,例如共沉淀,原生质体融合,电穿孔法,逆转录病毒转染法等,并优选使用这些方法引起所述的核酸在特定的表达系统中表达。适宜的表达系统在例如《Current Protocols in Molecular Biology》(F.Ausubel等,eds,Wiley Interscience,纽约1997)或Sambrook等《分子克隆实验室手册》(Molecular CloningA Laboratory Manual)第二版(Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,纽约,1989)中有描述。
根据本发明还可以制备同源重组微生物。这需要产生包含至少一段本发明的基因或编码序列的载体,在适当时,向其中引入至少一个氨基酸缺失、添加或替代以修饰,例如从功能上破坏本发明的序列(剔除载体)。引入的序列也可为例如来自相关微生物的同系物或来自哺乳动物、酵母或昆虫。可替代地,还可设计用于同源重组的载体以便同源重组过程中内源性基因发生突变或经过其他修饰但仍编码功能蛋白(如可以修饰位于上游的调节序列以改变内源性蛋白的表达)。TMT基因的修饰部分存在于同源重组载体内。适宜的同源重组载体的构建的描述见例如Thomas,K.R.和Capecchi,M.R.(1987)Cell 51503。
原则上适宜的宿主生物体可为所有能够表达本发明的核酸的生物体,其等位基因变体,其功能等价物或衍生物。宿主生物指例如细菌,真菌,酵母,植物或动物细胞。优选的生物为细菌,例如埃希氏杆菌属(Escherichia)如大肠杆菌,链霉菌属(streptomyces)、芽孢杆菌属(Bacillus)或假单胞菌属(Pseudomonas),真核微生物如酿酒酵母,曲霉菌(Aspergillus),来自动物或植物的高等真核细胞,如Sf9或CHO细胞。优选的生物选自阿舒氏囊霉属,尤其是棉桃阿舒氏囊霉株。
成功转化的生物可通过同样存在于载体或表达盒中的标记基因选择。这样的标记基因为例如抗生素抗性基因和催化引起转化细胞染色的颜色形成反应的酶的基因。随后可以通过自动细胞分拣法进行选择。由载体成功转化并包含适当的抗生素抗性基因(例如G418或潮霉素)的微生物可由适当的含抗生素的培养质或营养介质选择。利用细胞表面上存在的标记蛋白可以通过亲和层析法进行选择。
宿主生物与适合该生物的载体例如质粒、病毒或噬菌体,如具有RNA聚合酶/启动子系统的质粒、λ或μ噬菌体或其他温和噬菌体或转座子和/或其他有利调节序列的结合形成表达系统。“表达系统”一词指,例如,哺乳动物细胞如CHO细胞与适合哺乳动物细胞的载体如pcDNA3neo载体的结合。
如需要,基因产物还可在转基因生物体例如转基因动物(尤其为小鼠,绵羊)或转基因植物中表达。
多肽的重组生产本发明还涉及重组产生本发明的多肽或其生物学活性功能片断的方法,该方法中培养可以产生多肽的微生物,在适当时诱导多肽的表达,并自培养物中分离多肽。如需要,该多肽可由此方法进行工业规模的生产。
可以利用已知的方法培养和发酵重组微生物。可以在例如20到40℃下,pH为6到9的TB或LB培养基中培养细菌。适合的培养条件的描述见例如T.Maniatis,E.F.Fritsch和J.Sambrook,Molecular CloningALaboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1989)。
如果多肽不被分泌入培养基,则破坏细胞后,利用已知的蛋白分离法自裂解物中获得产物。备选地,可以通过高频率超声波,高压例如在弗氏细胞压碎器中,渗胀裂解(osmolysis),变性剂的作用,裂解酶或有机溶剂,匀浆或上述多种方法的组合来破碎细胞。
多肽的纯化可以利用已知的色谱法例如分子筛色谱(凝胶过滤法),如Q-Sepharose色谱,离子交换色谱和疏水色谱以及其他常用方法如超滤,结晶,盐析,透析和非变性凝胶电泳。对适合的方法的描述见例如Cooper,T.G.,Biochemische Arbeitsmethoden,Verlag Walter de Gruyter,Berlin,New York或Scopes,R.,Protein Purification,Springer Verlag,New York,Heidelberg,Berlin。
使用如下载体系统或寡核苷酸尤其利于分离重组蛋白,所述载体系统或寡核苷酸通过特定的核苷酸序列延长cDNA,并由此编码可用于例如简化纯化过程的经修饰的多肽或融合蛋白。该类型的适当修饰包括例如所谓的标签——其起锚的作用(例如六组氨酸锚修饰法)或能被抗体识别为抗原的表位(描述见例如Harlow,E.和Lane,D.,1988,AntibodiesALaboratory Manual.Cold Spring Harbor(N.Y.)Press)。这些锚可用于使蛋白结合在例如聚合物基质等固相载体上,该固相载体可装入例如层析柱中,或用于微量滴定板或其他载体上。
同时这些锚也可用于蛋白的识别。还可以单独或与锚结合使用传统的标记物例如荧光染料,与底物反应后可形成可探测的反应产物的酶标记物或放射性标记物来衍生并由此识别蛋白质。
本发明还涉及维生素B2和/或其前体和/或其衍生物的微生物生产方法。
如果转化是用重组微生物进行的,则优选该微生物首先在有氧的复合培养基中培养,例如在约20℃或更高的温度下,pH值约为6到9时培养直到细胞密度足够为止。为了能够更好的控制反应,优选使用可诱导的启动子。对维生素B2产生实施诱导后,接着在有氧条件下继续培养12小时到3天。
以下非限制性实施例描述了本发明具体的实施方案。
一般性实验描述a)一般克隆方法本发明利用的克隆步骤,例如限制性切割,琼脂糖凝胶电泳,DNA片段的纯化,转移核酸至硝化纤维素膜和尼龙膜上,DNA片段的连接,大肠杆菌细胞的转化,细菌的培养,噬菌体的复制,以及重组DNA的序列分析,均按照Sambrook等(1989)上述引文的描述进行。
b)聚合酶链反应(PCR)按照标准方案在下面的标准混合物中进行PCR8μl dNTP混合液(200μM),10μl不含MgCl2的Taq聚合酶缓冲液(10x),8μl MgCl2(25mM),每种引物各1μl(0.1μM),1μl DNA(待扩增),2.5U Taq聚合酶(MBI Fermentas,Vilnius,Lithuania),去离子水加至100μl。
c)大肠杆菌的培养在LB-amp培养基(胰胨10.0g,氯化钠5.0g,酵母提取物5.0g,氨苄青霉素100g/ml,H2O加至1000ml)中、37℃下培养重组大肠杆菌DH5α菌株。为此每种情况下用接种环将一个菌落从琼脂平板转移至5mlLB-amp中。在220rpm下振荡培养约18小时后,将4ml培养物接种至2升摇瓶中的400ml培养基中。当OD578值到达0.8和1.0之间后在42℃下热休克3至4个小时,诱导大肠杆菌中P450的表达。
d)自培养物中纯化所需产物可以利用多种本领域已知的方法将所需的产物自微生物或培养物上清中分离出来。如果所需的产物不被细胞分泌,则可通过慢速离心将细胞从培养物中分离出来,并可以由如机械作用力或超声作用等标准技术裂解细胞。
利用离心除去细胞碎片,得到包含可溶性蛋白的上清部分用于进一步纯化所需的化合物。如果该产物被细胞分泌,则由慢速离心除去培养物中的细胞,保留的上清部分用于进一步纯化。
在适合的树脂中层析从这两种纯化方法得到的上清部分,所需的分子以大于杂质的选择性保留于层析树脂上或通过之。如有必要可用相同或不同的层析树脂重复层析步骤。本领域技术人员能够选择适宜的层析树脂,并最为有效的利用其纯化特定的分子。纯化产物可以经过滤或超滤浓缩,并在该产物最为稳定的温度下储存。
本领域已知多种纯化方法。这些纯化技术的描述见例如,Bailey,J.E.&Ollis,D.F.Biochemical Engineering Fundamentals,McGraw-HillNewYork(1986)。
可以利用现有技术确定分离的化合物的成分和纯度。这些技术包括高效液相色谱法(HPLC)、光谱学方法、染色方法、薄层色谱法、NIRS、酶分析或微生物学分析法。这些分析方法的概述见Patek等(1994)Appl.Environ.Microbiol.60133-140;Malakhova等(1996)Biotekhnologiya 1127-32;和Schmidt等(1998)Bioprocess Engineer.1967-70;Ullmann’sEncyclopedia of Industrial Chemistry(1996)Vol.A27,VCHWeinheim,pp.89-90,pp.521-540,pp.540-547,pp.559-566,pp.575-581和pp.581-587;Michal,G(1999)Biochemical PathwaysAn Atlas of Biochemistry andMolecular Biology,John Wiley and Sons;Fallon,A.等(1987)HPLC在生物化学中的应用,《Laboratory Techniques in Biochemistry and MolecularBiology》,Vol.17。
e)MPSS法、克隆鉴定和同源性检索的一般描述MPSS技术(Massive Parallel Signature Sequencing,大规模平行信号测序,参考Brenner等,Nat.Biotechnol.(2000)18,630-634)被应用于产生维生素B2的丝状真菌棉桃阿舒氏囊霉。利用该技术可以获得有关大量基因在真核生物体中的表达水平的高度准确的定量信息。该技术涉及在一个特定的时间X时分离生物体的mRNA,在逆转录酶的帮助下转录成cDNA并克隆入具有特定标签序列的特定载体中。选择数目足够多(大约高1000倍)的具有不同标签序列的载体,以便在统计学上每个DNA分子均被克隆入因其标签序列而独特的载体中。
该载体的插入序列随后与标签一起被切下。通过这种方法得到的DNA分子然后与具有所述标签的分子对应物的微珠共同孵育。孵育后可认为通过特定标签或对应物每个微珠仅加载了一种类型的DNA分子。将这些微珠转移至特殊的流式处理槽(flow cell)中并固定在那里,从而可能利用以荧光染料为基础的改造的测序法和数码彩色相机对所有的微珠进行群体测序。尽管这种方法可进行高数目的分析,却受到约16到20个碱基对的阅读宽度的限制。然而对大多数生物体而言,该序列长度却足以使序列和可能的基因之间建立明确的关系(20bp序列的频率为~1×1012;与之相比,人类基因组的大小“仅”~3×109bp)。
计数相同序列的数目并相互比较频率以分析由此得到的数据。频繁出现的序列反映了高水平的表达,而只出现一次的序列反映了低水平的表达。如果在两个不同的时间点(X和Y)分离mRNA,可构建单个基因按时间顺序的表达模式。
实施例1自棉桃阿舒氏囊霉中分离mRNA根据已知的技术培养棉桃阿舒氏囊霉(营养培养基27.5g/l酵母提取物;0.5g/l硫酸镁;50ml/l大豆油;pH7)。在发酵过程的不同时间(24h,48h和72h)取出棉桃阿舒氏囊霉的菌丝样品,根据Sambrook等(1989)的方案分离相应的RNA或mRNA。
实施例2MPSS的应用利用上述的MPSS分析法分析自棉桃阿舒氏囊霉分离的mRNA。
利用统计分析法分析得到的数据并根据表达差异的显著性进行分类。这必需要进行关于表达水平的增加和降低的检测。对表达的改变进行分类a)单调的改变(monotonic change),b)24h后改变,和c)48h后改变。
将由MPSS分析发现的反映了表达的改变的20bp序列作为探针与来自棉桃阿舒氏囊霉的基因文库杂交,文库的插入序列的平均大小约为1kb。在此处杂交温度为约30至57℃。
实施例3自棉桃阿舒氏囊霉构建基因组文库为构建基因组DNA文库,首先通过Wright和Philippsen(Gene(1991)10999-105)及Mohr(1995,phD论文,Bio Zentrum universitt Basel,瑞士)的方法分离染色体DNA。
该DNA由Sau3A部分消化。为此,利用不同量(0.1至1U)Sau3A酶消化6μg基因组DNA。在蔗糖密度梯度中分级分离DNA片断。分离1kb区并进行QiaEx提取。最大的片段与BamHI切割的载体pRS416(Sikorski和Hieter,Genetics(1988)122;19-27)连接(90ng BamHI切割的脱磷酸化载体;198ng插入DNA;5ml水;2μl的10×连接缓冲液;1U连接酶)。该连接混合物用于转化大肠杆菌实验室菌株XL-1 blue,产生的克隆用于鉴定该插入序列。
实施例4有序基因文库的制备(芯片技术)将棉桃阿舒氏囊霉基因文库的约25,000个菌落(相当于对该基因组的约3倍覆盖)有序地转移至尼龙膜然后由Sambrook等(1989)描述的菌落杂交法处理。从Mpss分析法发现的20bp序列合成寡核苷酸并用放射性32P标记。在每种情况下组合10个标记的熔点相似的寡核苷酸并一起与该尼龙膜杂交。杂交并洗涤后,由放射自显影鉴定出阳性克隆,并直接由PCR测序法分析。
由此方法鉴定出包含内部名称为″Oligo19″的插入序列并与来自酿酒酵母的MIPS标签“Ygr257c”具有显著同源性的克隆。该插入序列具有SEQ ID NO1显示的核酸序列。
由此方法鉴定出包含内部名称为″Oligo24″的插入序列并与来自酿酒酵母的MIPS标签“Mdl2”具有显著同源性的克隆。该插入序列具有SEQID NO5显示的核酸序列。
由此方法还鉴定出包含内部名称为″Oligo109″的插入序列并与来自酿酒酵母的MIPS标签“Prpl2”具有显著同源性的克隆。该插入序列具有SEQ ID NO10显示的核酸序列。
由此方法还鉴定出包含内部名称为″Oligo163″的插入序列并与来自酿酒酵母的MIPS标签“Flx1”具有显著同源性的克隆。该插入序列具有SEQ ID NO14显示的核酸序列。
由此方法还鉴定出包含内部名称为″Oligo31″的插入序列并与来自酿酒酵母的MIPS标签“STV1”具有显著同源性的克隆。该插入序列具有SEQ ID NO19显示的核酸序列。
由此方法还鉴定出包含内部名称为″Oligo4″的插入序列并与来自酿酒酵母的MIPS标签“OPT2”具有显著同源性的克隆。该插入序列具有SEQ ID NO23显示的核酸序列。
由此方法还鉴定出包含内部名称为″Oligo6″的插入序列并与来自酿酒酵母的MIPS标签“VAC1”具有显著同源性的克隆。该插入序列具有SEQ ID NO28显示的核酸序列。
由此方法还鉴定出包含内部名称为″Oligo146″的插入序列并与来自酿酒酵母的MIPS标签“Ymr162c”具有显著同源性的克隆。该插入序列具有SEQ ID NO33显示的核酸序列。
由此方法还鉴定出包含内部名称为″Oligo56″的插入序列并与来自酿酒酵母的MIPS标签“Ypl110c”具有显著同源性的克隆。该插入序列具有SEQ ID NO37显示的核酸序列。
由此方法还鉴定出包含内部名称为″Oligo167”的插入序列并与来自酿酒酵母的MIPS标签“ERP5”具有显著同源性的克隆。该插入序列具有SEQ ID NO42显示的核酸序列。
实施例5由BLASTX查询法分析序列数据对所得核酸序列的分析,即通过功能性氨基酸序列推断出其功能,由BLASTX查询法在序列数据库中进行。几乎所有发现的氨基酸序列同系物均与酿酒酵母(面包酵母)有关。由于该生物的全部序列已被测定,有关这些基因的更详细的信息可查阅http//www.mips.gsf.de/proj/yeast/search/code search.htm。
由此发现了与酿酒酵母氨基酸片段的如下同源性。相应的比对情况见附图1至10。
a)来自SEQ ID NO1的相应互补链的氨基酸序列与酿酒酵母线粒体能量传递蛋白具有显著的序列同源性。图1描绘了来自该互补链(相应于SEQ ID NO1第609位至第1位核苷酸)的氨基酸部分序列与该酿酒酵母蛋白的部分序列。SEQ ID NO2显示N端延长的氨基酸部分序列。
因此可以推断出发现的该棉桃阿舒氏囊霉核酸序列具有线粒体能量传递蛋白的功能。
b)来自SEQ ID NO5的相应互补链的氨基酸序列与酿酒酵母ABC转运蛋白具有显著的序列同源性。图2描绘了来自该互补链(相当于SEQ IDNO5第1494位至1387位核苷酸)的氨基酸部分序列(SEQ ID NO6)与该酿酒酵母蛋白的部分序列。SEQ ID NO7显示另一个本发明的氨基酸部分序列。
因此可以推断出发现的该棉桃阿舒氏囊霉核酸序列具有ABC转运蛋白的功能。
c)来自SEQ ID NO10的编码链的氨基酸序列与酿酒酵母线粒体膜整合蛋白具有显著的序列同源性。图3描绘了来自该编码链(相当于SEQ IDNO10中的第15位至第455位核苷酸)的氨基酸部分序列与该酿酒酵母蛋白的部分序列。SEQ ID NO11显示一种N端延长的氨基酸部分序列。
因此可以推断出发现的该棉桃阿舒氏囊霉核酸序列具有线粒体膜整合蛋白的功能。
d)来自SEQ ID NO14的编码链的氨基酸序列与酿酒酵母线粒体内膜转运蛋白具有显著的序列同源性。图4描绘了来自该编码链(相当于SEQID NO14中的第455位至第1215位核苷酸)的氨基酸部分序列与该酿酒酵母酶的部分序列。SEQ ID NO15显示一种N端延长的氨基酸部分序列因此可以推断出发现的该棉桃阿舒氏囊霉核酸序列具有线粒体内膜转运蛋白的功能。
e)来自SEQ ID NO19的编码链的氨基酸序列与酿酒酵母非液泡H+-ATP酶V0结构域的102Kd亚基具有显著的序列同源性。图5描绘了来自该编码链(相当于SEQ ID NO19中的第2位至第790位核苷酸)的氨基酸部分序列与此酿酒酵母酶的部分序列。SEQ ID NO20显示一种N端延长的氨基酸部分序列。
因此可以推断发现的该棉桃阿舒氏囊霉核酸序列具有非液泡H+-ATP酶V0结构域的102Kd亚基的功能。
f)来自SEQ ID NO23的相应互补链的氨基酸序列与酿酒酵母中和粟酒裂殖酵母的isp4蛋白相似的蛋白具有显著的序列同源性。图6描绘了来自该互补链(相当于SEQ ID NO23中的第869位至第522位核苷酸)的氨基酸部分序列与此酿酒酵母酶的部分序列。SEQ ID NO24显示一种N端延长的氨基酸部分序列。
因此可以推断出发现的该棉桃阿舒氏囊霉核酸序列具有与粟酒裂殖酵母isp4蛋白相似的蛋白的功能,因而具有寡肽转运蛋白的活性。
g)来自SEQ ID NO28的相应互补链的氨基酸序列与酿酒酵母VAC1蛋白(一种具有三个锌指结构的胞质膜外周蛋白)具有显著的序列同源性。图7A描绘了来自该互补链(相当于SEQ ID NO28中的第356位至第243位核苷酸)的氨基酸部分序列与该酿酒酵母蛋白的部分序列。图7B描绘了来自该互补链(相当于SEQ ID NO28中的第166位至第2位核苷酸)的氨基酸部分序列与该酿酒酵母蛋白的部分序列。SEQ ID NO29和SEQID NO30各显示一种N端延长的氨基酸部分序列。
因此可以推断出发现的该棉桃阿舒氏囊霉核酸序列具有VAC1蛋白(一种具有三个锌指结构的胞质膜外周蛋白)的功能。
h)来自SEQ ID NO33的相应互补链的氨基酸序列与酿酒酵母的具有ATP酶样功能的蛋白具有显著的序列同源性。图8描绘了来自该互补链(相当于SEQ ID NO33中的第904位至第707位核苷酸)的氨基酸部分序列与该酿酒酵母酶的部分序列。SEQ ID NO34显示一种N端延长的氨基酸部分序列。
因此可以推断出发现的该棉桃阿舒氏囊霉核酸序列具有ATP酶样蛋白的功能。
i)来自SEQ ID NO37的相应互补链的氨基酸序列与酿酒酵母PHO85蛋白具有显著的序列同源性。图9描绘了来自该互补链(相当于SEQ ID NO37中的第898位至第5位核苷酸)的氨基酸部分序列与该酿酒酵母酶的部分序列。SEQ ID NO38和SEQ ID NO39显示的氨基酸序列相应于分别来自SEQ ID NO37第950位至第900位和第898位至第5位的互补链的氨基酸部分序列。
因此可以推断出发现的该棉桃阿舒氏囊霉核酸序列具有PHO85蛋白的功能。
k)来自SEQ ID NO42的相应互补链的氨基酸序列与酿酒酵母中参与膜运输的p24蛋白具有显著的序列同源性。图10描绘了来自该互补链(相当于SEQ ID NO42中的第931位至第806位核苷酸)的氨基酸部分序列与该酿酒酵母蛋白的部分序列。SEQ ID NO24显示一种N端延长的氨基酸部分序列。
因此可以推断出发现的该棉桃阿舒氏囊霉核酸序列具有参与膜运输的p24蛋白的功能。
实施例6全长DNA的分离a)构建棉桃阿舒氏囊霉基因文库从100ml在液体MA2培养基(10克葡萄糖,10克蛋白胨,1克酵母提取物,0.3g肌醇,加至1000ml)中生长两天的棉桃阿舒氏囊霉培养物制备高分子量细胞总DNA。滤出菌丝体,并用蒸馏水洗两遍,悬浮于10ml包含1M山梨糖醇、20mM EDTA和20mg酶解酶20T的溶液中,并于27℃下孵育、轻振30至60分钟。将原生质体悬液调整至包含50mMTris-HCl,pH7.5,150mM NaCl,100mM EDTA和0.5%浓度的十二烷基硫酸钠(SDS),并于65℃下孵育20分钟。经过两次酚/氯仿(体积比1∶1)萃取,用异丙醇沉淀DNA,悬浮于TE缓冲液中,经RNA酶的处理后再次用异丙醇沉淀并悬浮于TE缓冲液中。
根据大小选出并由Sau3A部分消化的基因组DNA与粘粒载体Super-Cos1(Stratagene)的去磷酸化臂连接产生棉桃阿舒氏囊霉粘粒基因文库。Super-Cos1载体在两个cos位点间经Xbal消化打开并用牛小肠碱性磷酸酶(Boehringer)去磷酸化,接着用BamHI打开克隆位点。该连接在20μl包含2.5μg部分消化的染色体DNA,1μg Super-Cos1载体臂,40mMTris-HCl,pH7.5,10mM MgCl2,1mM二硫苏糖醇,0.5mM ATP和2Weiss单位T4-DNA连接酶(Boehringer)的混合液中、15℃下过夜进行。利用提取物和Stratagene的方案(Gigapack II Packaging Extract)在体外包装连接产物。将包装产物用于感染大肠杆菌NM554(recA13,araD139,Δ(ara,leu)7696,Δ(lac)17A,galU,galK,hsrR,rps(strr),mcrA,mcrB)并涂布在含有氨苄青霉素(50μg/ml)的LB板上。获得含有长度平均为30-45kb的棉桃阿舒氏囊霉插入片段的转化体。
b)粘粒基因文库的储存和筛选将共4×104个新鲜单菌落各自单独地接种于96孔微量滴定板(Falcon,No.3072)孔中的100μlLB培养基中,所述LB培养基补充有冻存液(36mM K2HPO4/13.2mM KH2PO4,、1.7mM柠檬酸钠、0.4mMMgSO4、6.8mM(NH4)2SO4,、4.4%(w/v)甘油)和氨苄青霉素(50μg/ml),37℃下振摇过夜生长之后在-70℃下冷冻。快速融解滴定板并在新鲜培养基中用经酒精浴消毒随后在热板上蒸发去除酒精的96孔复制板进行复制。在冷冻前和解冻后(采取其它所有措施前),在微量滴定板振荡器(Infors)中短暂振荡这些板子以保证该细胞悬液的均匀。利用能够将少量液体自96孔微量滴定板转移至尼龙膜的自动机械系统(Bio-Robotics)将单克隆置于尼龙膜上(GeneScreen Plus,New England Nuclear)。当培养物自96孔微量滴定板转移后(1920个克隆),该膜被置于22×22厘米培养皿(Nunc)中含有氨苄青霉素(50μg/ml)的LB琼脂表面上并在37℃下孵育过夜。细胞汇合前,用Herrmann,B.G.,Barlow,D.P和Lehrach,H.(1987),Cell 48,pp.813-825描述的方法处理这些膜,包括第一个变性步骤后的附加处理,即将滤膜置于沸水浴上饱含变性溶液的垫子上方暴露于蒸气5分钟。
利用随机六聚体引物标记法(Feinberg,A.P.和Vogelstein,B.(1983),Anal.Biochem.132,pp.6-13)、通过[α-32P]dCTP的摄取,得到高比活的标记双链探针。这些膜经过预杂交后在42℃下、于含有50%(vol/vol)甲酰胺、600mM磷酸钠、pH7.2、1mM EDTA、10%硫酸葡聚糖、1%SDS和10x Denhardt氏液、鲑鱼精子DNA(50μg/ml)以及32P标记的探针(0.5-1×106cpm/ml)的溶液中杂交6至12小时。典型地,在55至65℃下、13至30mM NaCl、1.5至3mM柠檬酸钠、pH6.3、0.1%SDS中洗涤约1小时,滤膜在-70℃用柯达增感屏放射自显影12至24小时。至今,每张膜均已被成功重复使用20次以上。在95℃下、2mM Tris-HCl,pH8.0,0.2mM EDTA,0.1%SDS中孵育2×20分钟剥离滤膜上的探针。
c)从存储的基因文库中回收阳性菌落用无菌一次性柳叶刀将微量滴定板孔中的冰冻细菌培养物刮出,并在含有氨苄青霉素(50μg/ml)的LB琼脂培养皿上划线。然后,将单菌落接种于液体培养基中,通过碱裂解法产生DNA(Birnboim,H.C.和Doly,J.(1979),Nucleic Acids Res.7,pp.1513-1523)。
d)全长DNA如上述可鉴定出包含具有正确的完全序列的插入片段的克隆。这些克隆的内部名称为“Oligo19v”,包含完全序列的插入片断具有SEQ ID NO3中所示的核酸序列。
“Oligo24v”,包含完全序列的插入片断具有SEQ ID NO8中所示的核酸序列。
“Oligo109v”,包含完全序列的插入片断具有SEQ ID NO12中所示的核酸序列。
“Oligo163v”,包含完全序列的插入片断具有SEQ ID NO17中所示的核酸序列。
“Oligo31v”,包含完全序列的插入片断具有SEQ ID NO21中所示的核酸序列。
“Oligo4v”,包含完全序列的插入片断具有SEQ ID NO26中所示的核酸序列。
“Oligo6v”,包含完全序列的插入片断具有SEQ ID NO31中所示的核酸序列。
“Oligo146v”,包含完全序列的插入片断具有SEQ ID NO35中所示的核酸序列。
“Oligo56v”,包含完全序列的插入片断具有SEQ ID NO40中所示的核酸序列。
“Oligo167v”,包含完全序列的插入片断具有SEQ ID NO44中所示的核酸序列。
本发明所有部分序列和完全序列的综览如下表1
表1序列综览
序列表<110>巴斯福股份公司(BASF Aktiengesellschaft)<120>来自棉桃阿舒氏囊霉的与跨膜运输相关的新基因产物<130>M/42291_PCT<160>45<170>PatentIn version 3.1<210>1<211>1253<212>DNA<213>棉桃阿舒氏囊霉(Ashbya gossypii)<220>
<221>misc_feature<223>Oligo19<220>
<221>misc_feature<222>(579)..(579)<223>未知核苷酸<400>1gatctccaag cctttaaata gcgcacggta acccataacc gaaacctcat gccgcatctc 60tcgcagcagg tcgcctatca gatatattgt acgctctgtg tctcttgcgc ggggcacact120ctggagccgt gtgcgcaata gctccagcgg cgcaatagta gttgcagcca atatccgcgc180aaatgctcca cacactagtg ggtttgccac aggtagccgg gatgccaagg gcgagttatc240acgcagtgct tcatagccgg aaaagtacac cacgttagcc ggcaccgcca ttacgagcgt300aatccccagc cctcgccaca gagtcggcag accctctagt tgggctatct tcctgagccc360ctccagagtt ccctgcagcc tcgcagcagg ctctcggcag ccgacgtttg caaagcactc420atcctgccaa aacactttcc ctgccggttt cgacagctgt cctgtacatg tacaacttgg480aagcatttct tgctgttgaa gccgcacgcg gaccacgtcc agtggcgtga gaaacagtga540cgtgaccagc gagccagcag aggcgcttac catgcgttnc ttcagcgtaa ccttctttcc600gggttcctta ctcatggccc caaatttgca cctttcagcg ctaaccccgt ccaatagtac660tgcctcttcc tgttagccta tcttgccgct cgagagtaac ttatgttttg atcgaagctt720tcttgggggc gattattcgc tgtgtatggg acttagtttt actatgcgct aaaatgttgt780cggggcccga aagccgttgt acggcgtcag cgttgatgtg caccccgtgg ctatttaata840atatactata taaatactaa aactattaag tattaatcat gatgatgtgg aatcagtatt900tcagtaagat gtagcatcag agttgtccaa tgggacctcc gggctttcct cgtatagtct960taaaaccatg gaggttatcc gtttcagctg gaattgtaat agttcgtcga cggttgccat 1020
attaatctgg gtcttctccc cgcgctggaa caaagacatg tcaaattcat cctcctccca1080gttcatgtac tcgtcaatgc tatagcagtc gtgagtcagg gtactcttcg gtgaacaata1140tgtattggaa cattttctat ccattggtta accttctcgc ggtggggcat gttcagcgct1200gcgcgcggat taaaataggc aggaaagctc gactgtggaa catcgtaggg atc 1253<210>2<211>203<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo19<220>
<221>misc_feature<222>(11)..(11)<223>未知氨基酸<400>2Lys Glu Pro Gly Lys Lys Val Thr Leu Lys Xaa Arg Met Val Ser Ala1 5 10 15Ser Ala Gly Ser Leu Val Thr Ser Leu Phe Leu Thr Pro Leu Asp Val20 25 30Val Arg Val Arg Leu Gln Gln Gln Glu Met Leu Pro Ser Cys Thr Cys35 40 45Thr Gly Gln Leu Ser Lys Pro Ala Gly Lys Val Phe Trp Gln Asp Glu50 55 60Cys Phe Ala Asn Val Gly Cys Arg Glu Pro Ala Ala Arg Leu Gln Gly65 70 75 80Thr Leu Glu Gly Leu Arg Lys Ile Ala Gln Leu Glu Gly Leu Pro Thr85 90 95Leu Trp Arg Gly Leu Gly Ile Thr Leu Val Met Ala Val Pro Ala Asn100 105 110Val Val Tyr Phe Ser Gly Tyr Glu Ala Leu Arg Asp Asn Ser Pro Leu115 120 125Ala Ser Arg Leu Pro Val Ala Asn Pro Leu Val Cys Gly Ala Phe Ala130 135 140Arg Ile Leu Ala Ala Thr Thr Ile Ala Pro Leu Glu Leu Leu Arg Thr145 150 155 160Arg Leu Gln Ser Val Pro Arg Ala Arg Asp Thr Glu Arg Thr Ile Tyr165 170 175Leu Ile Gly Asp Leu Leu Arg Glu Met Arg His Glu Val Ser Val Met180 185 190
Gly Tyr Arg Ala Leu Phe Lys Gly Leu Glu Ile195 200<210>3<211>2020<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(112)..(294)<223>
<220>
<221>misc_feature<223>Oligo19<400>3aatcccccta tattcaacaa cagtccgcag tatttcccag atctgaacta tttatctcca 60tggcacagtt attcaaacgg tgtcggcacc ccaataccaa ttaacagttc c atg att 117Met Ile1ggg aac cca aac ctt tcc aac gtc ccc atg acc aag acg tac gat ccc165Gly Asn Pro Asn Leu Ser Asn Val Pro Met Thr Lys Thr Tyr Asp Pro5 10 15tac gat gtt cca cag tcg agc ttt cct gcc tat ttt aat ccg cgc gca213Tyr Asp Val Pro Gln Ser Ser Phe Pro Ala Tyr Phe Asn Pro Arg Ala20 25 30gcg ctg aac atg ccc cac cgc gag aag gtt aac caa tgg ata gaa aat261Ala Leu Asn Met Pro His Arg Glu Lys Val Asn Gln Trp Ile Glu Asn35 40 45 50gtt cca ata cat att gtt cac cga aga gta ccc tgactcacga ctgctatagc 314Val Pro Ile His Ile Val His Arg Arg Val Pro55 60attgacgagt acatgaactg ggaggaggat gaatttgaca tgtctttgtt ccagcgcggg 374gagaagaccc agattaatat ggcaaccgtc gacgaactat tacaattcca gctgaaacgg 434ataacctcca tggttttaag actatacgag gaaagcccgg aggtcccatt ggacaactct 494gatgctacat cttactgaaa tactgattcc acatcatcat gattaatact taatagtttt 554agtatttata tagtatatta ttaaatagcc acggggtgca catcaacgct gacgccgtac 614aacggctttc gggccccgac aacattttag cgcatagtaa aactaagtcc catacacagc 674gaataatcgc ccccaagaaa gcttcgatca aaacataagt tactctcgag cggcaagata 734ggctaacagg aagaggcagt actattggac ggggttagcg ctgaaaggtg caaatttggg 794gccatgagta aggaacccgg aaagaaggtt acgctgaagg aacgcatggt aagcgcctct 854gctggctcgc tggtcacgtc actgtttctc acgccactgg acgtggtccg cgtgcggctt 914
caacagcaag aaatgcttcc aagttgtaca tgtacaggac agctgtcgaa accggcaggg 974aaagtgtttt ggcaggatga gtgctttgca aacgtcggct gccgagagcc tgctgcgagg1034ctgcagggaa ctctggaggg gctcaggaag atagcccaac tagagggtct gccgactctg1094tggcgagggc tggggattac gctcgtaatg gcggtgccgg ctaacgtggt gtacttttcc1154ggctatgaag cactgcgtga taactcgccc ttggcatccc ggctacctgt ggcaaaccca1214ctagtgtgtg gagcatttgc gcggatattg gctgcaacta ctattgcgcc gctggagcta1274ttgcgcacac ggctccagag tgtgccccgc gcaagagaca cagagcgtac aatatatctg1334ataggcgacc tgctgcgaga gatgcggcat gaggtttcgg ttatgggtta ccgtgcgcta1394tttaaaggct tggagatcac tttatggagg gacgtgccct tcagcgcaat ctattgggga1454acatacgagt tctgtaaaac ccagttctgg gcccgccatg ccgcaaccca taatgcatca1514aactgggacc atttcatcgg cagttttgcc tgcggtagca tgggcggtgc tgttgcagca1574cttttgacac atccttttga tgtgggcaag acccgcatgc agattgcgat tgccagtcca1634cagcagctaa ctgtgggggg aaaagctacg aaaactgatg actcaagagg catgttctca1694tttttgaatg ccattaggaa atcagaaggt attagagcgc tatataccgg cctattacct1754agggtgatga agattgcacc aagttgcgcc ataatgatct cgacttatga actgtcgaag1814aagttcttca ctagttgaac tttgtttctt cctgtatata ccaagtaatt cacactgttg1874atacacgata cagcattttt cttaaaaccc tgtgatatac gcttgctgta gtacacgccc1934aaacggtgag gtctataatt ttacatgtcc gcgagatggt attggatcgg cagaatttta1994gagctgccgc tgtagcccat ccgtcg 2020<210>4<211>61<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo19<400>4Met Ile Gly Asn Pro Asn Leu Ser Asn Val Pro Met Thr Lys Thr Tyr1 5 10 15Asp Pro Tyr Asp Val Pro Gln Ser Ser Phe Pro Ala Tyr Phe Asn Pro20 25 30Arg Ala Ala Leu Asn Met Pro His Arg Glu Lys Val Asn Gln Trp Ile35 40 45Glu Asn Val Pro Ile His Ile Val His Arg Arg Val Pro50 55 60
<210>5<211>1495<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo24<220>
<221>misc_feature<222>(1386)..(1386)<223>未知核苷酸<400>5gatcgccacc tggtccctgt tcagcgcgcc ggacgtctgc tgcgcctcca gcgggtccag 60gaacttcagc atcgcgggct cgatctgcga aaagcacttg tacagcgggt agaagaggcc120acgcccgtcc tggatccagt cgaagtactg tggcatgtgc gacaccacca cgtccctaga180aaacgtcccc ttcagcgaca ccttcagatc ctgcagcagg ttgaccaatc gcaacaggtc240ctgcttgatc tcctccgtgc tcaggttctt gtttccgatt cgcagcatca catcctccag300tgagtcagct ccgggcccta gtgtggtcgc taaggggggc gagataaacg cgttaggtac360ctgtatcatg ctgcggacac cacctcactt tgaaatatta caactgtgct atcagctgcc420ctttataagc agcgctgtct ccatacaatt gcgctgattt tatgtagttg atgcgtgtaa480tctgcttttt ccctattgag acgtcagcat ctcgtagcaa ggctccgtgt gcttacttaa540gaaaagatgg aatcgatgga atcgatgaaa ctaaaacatt ttatcaaata tcagttctat600atatatgtag ttattgggag ataatacggg tgaatctggg gcatgtctta aggcattggg660gcacgggccg tgtcctccag cacatgcttt atgacctctt catttaggcg aagatttccg720ccctcgatat cgcggggaat gtctgcggcc tgtggagcgg aagcctcttc ctgggcagga780gctggagacg cctcgggctt cgcaggctcc gacgcgtgtt cgttcaatag cttgaacaac840tcgctgtcct cgtcacggta taggtcggca aacttgccgg cctcgatgac ggagccgtca900ttgccgagaa ccacgatgtt ctcggagcgg cgtatggtgc tgaggcggtg ggcgatgctc960acgatggtga tctccttgct gcgcattagc ctgccgaggg tgtagttgat ggcgccctcg 1020ctttcaacgt ccaacgccga ggtggcctcg tcgaggatta ggattttcgg tttcttgatg 1080agcgcgcggg cgatggcaat gcgctggcgc tggcccccgc tgagtagggc gcctctaggc 1140ccaatcacgg tgtcatagcc gtccgggaac ttggtgatga agttatggca gaagcacttc 1200ttggcaactg cgcgtatctc atccatggag ggcgtgtagg aaaggccgta ggtgatgttg 1260tctctgatgg tcccggacat caagaccggc tcctgctgga caacgccaag atgttttctg 1320
agcgacttgg cgcttacctt ggatatgtcc tgaccgtcta tgaggatggt gccgctgttg1380gcatcngtaa aaccgtagga ggagggacgc aatggtggac ttgccccgcc cggagggccc1440gacgatgcag acgttggagc ccggggttat cgtgaggcgg agtttcttca agatc 1495<210>6<211>36<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo24<400>6Ile Leu Lys Lys Leu Arg Leu Thr Ile Thr Pro Gly Ser Asn Val Cys1 5 10 15Ile Val Gly Pro Ser Gly Arg Gly Lys Ser Thr Ile Ala Ser Leu Leu20 25 30Leu Arg Phe Tyr35<210>7<211>225<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo24<400>7Gly Pro Pro Gly Gly Ala Ser Pro Pro Leu Arg Pro Ser Ser Tyr Gly1 5 10 15Phe Thr Asp Ala Asn Ser Gly Thr Ile Leu Ile Asp Gly Gln Asp Ile20 25 30Ser Lys Val Ser Ala Lys Ser Leu Arg Lys His Leu Gly Val Val Gln35 40 45Gln Glu Pro Val Leu Met Ser Gly Thr Ile Arg Asp Asn Ile Thr Tyr50 55 60Gly Leu Ser Tyr Thr Pro Ser Met Asp Glu Ile Arg Ala Val Ala Lys65 70 75 80Lys Cys Phe Cys His Asn Phe Ile Thr Lys Phe Pro Asp Gly Tyr Asp85 90 95Thr Val Ile Gly Pro Arg Gly Ala Leu Leu Ser Gly Gly Gln Arg Gln100 105 110
Arg Ile Ala Ile Ala Arg Ala Leu Ile Lys Lys Pro Lys Ile Leu Ile115 120 125Leu Asp Glu Ala Thr Ser Ala Leu Asp Val Glu Ser Glu Gly Ala Ile130 135 140Asn Tyr Thr Leu Gly Arg Leu Met Arg Ser Lys Glu Ile Thr Ile Val145 150 155 160Ser Ile Ala His Arg Leu Ser Thr Ile Arg Arg Ser Glu Asn Ile Val165 170 175Val Leu Gly Asn Asp Gly Ser Val Ile Glu Ala Gly Lys Phe Ala Asp180 185 190Leu Tyr Arg Asp Glu Asp Ser Glu Leu Phe Lys Leu Leu Asn Glu His195 200 205Ala Ser Glu Pro Ala Lys Pro Glu Ala Ser Pro Ala Pro Ala Gln Glu210 215 220Glu225<210>8<211>4118<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(820)..(3081)<223>
<220>
<221>misc_feature<223>Oligo24<400>8ctgtcacagc aagacctggc ttcccgtcac gctatggctc gcctgatcat ctcatctcgc 60ctgcgcatcg agcgcagctc aaaattttta ccattacccc ggccagtaca catattacat120aatcaccagt gtccagggat tacccggaca tcaaacatca cagagaacga acccaatgaa180atgcaggaaa agctgctcag cgccggtgcc cggcggccat taagcgtgca cctacagcca240cttcactcca ggccacacac tccacgcctc cccgcaagta aacacgatgt ctgcctggag300aaaagccggt ttgacctaca atagctacct ggccgttgcg gccaggaccg tgcgcgcggc360tctgaagaag gagctccaga gccctgccgt cctcaaccga tctgtgacgg aggcaaaggt420catcgactac gcctccaagg gctccgccgc ggaggccgtg ccgctacgga agtgagcagc480acgcgtgctc ttctcgttga actgctggca cgcagcctgg gccctgttgg cggcaagcgg540gcggatggag acgcccagca caggcccttt gacgggctgt gctggtggca tgtgtgtagt600tcgactatat aaactctcgt tctctaatga taatgacaga aggtcgattg ggcgatttcg660
gtgctgcgaa cggggacgtt gtgcaggggc aaaggcggtt ttcgcgggca agcgaagagg720tgcgttttcc gcaagcttgc ttgtgtcccc gcccaaggca agacacagtc tactcgcatc780agttttggca gagcgtgttg ctacaggatt ccaggcgct atg tgg aga gcg ata 834Met Trp Arg Ala Ile1 5agg ccc ttt ggg ggg ctt ggc cct gta gcg gtg tta cag agg cta ccg 882Arg Pro Phe Gly Gly Leu Gly Pro Val Ala Val Leu Gln Arg Leu Pro10 15 20ggc ccg cgg cac aat gtc gcc gtg agg ctt cag gtg atg tcc agg gcc 930Gly Pro Arg His Asn Val Ala Val Arg Leu Gln Val Met Ser Arg Ala25 30 35aga tgc ggc tgg cag tgt gtg cgt gcg aca tct cga ctg aca gtg ccg 978Arg Cys Gly Trp Gln Cys Val Arg Ala Thr Ser Arg Leu Thr Val Pro40 45 50gtg tgc agg caa agc cgg gcg tac agc gct gcc cgt gtg ggc ggc gag 1026Val Cys Arg Gln Ser Arg Ala Tyr Ser Ala Ala Arg Val Gly Gly Glu55 60 65gga acg cct tcg ccg cgg gac aag gag cat gag cag gag cgc aaa gtt 1074Gly Thr Pro Ser Pro Arg Asp Lys Glu His Glu Gln Glu Arg Lys Val70 75 80 85gaa aag cga ccg gcg gag ccg tcg cgc gcg caa ccc gca aag cca gcc 1122Glu Lys Arg Pro Ala Glu Pro Ser Arg Ala Gln Pro Ala Lys Pro Ala90 95 100ggc tgg cac gag gtg ttc cgg ctc ttg cga ttg gtg aag ccc gac tgg 1170Gly Trp His Glu Val Phe Arg Leu Leu Arg Leu Val Lys Pro Asp Trp105 110 115aag ttg ttg ctt gcg gcg ttg ggg ctc ctc acg ata tct tgc tcg att 1218Lys Leu Leu Leu Ala Ala Leu Gly Leu Leu Thr Ile Ser Cys Ser Ile120 125 130ggg atg gcg gtt ccg aag gtt att ggg ctt gtg cta gat gcc acg aaa 1266Gly Met Ala Val Pro Lys Val Ile Gly Leu Val Leu Asp Ala Thr Lys135 140 145gac gca gtc gca cag gca gaa aag aac gaa acg ggc gcg ccg atg tct 1314Asp Ala Val Ala Gln Ala Glu Lys Asn Glu Thr Gly Ala Pro Met Ser150 155 160 165ttg cta gac atg ccg cct atc atc ggg aac ttc acg cta gtc gac gtg 1362Leu Leu Asp Met Pro Pro Ile Ile Gly Asn Phe Thr Leu Val Asp Val170 175 180ctt gct gcg ttt gcg ggc gcg ttg ctc gtg ggc tcc gcc gcg aac ttc 1410Lau Ala Ala Phe Ala Gly Ala Leu Leu Val Gly Ser Ala Ala Asn Phe185 190 195ggg cgg atg ttc ctc ttg aaa atg ctt ggt gag cgt ttg gtt gcg cgg 1458Gly Arg Met Phe Leu Leu Lys Met Leu Gly Glu Arg Leu Val Ala Arg200 205 210cta cgt gcg cag gtc atc aag aag acg ttg cat cac gac gcg gag ttt 1506
Leu Arg Ala Gln Val Ile Lys Lys Thr Leu His His Asp Ala Glu Phe215 220 225ttc gac agg aac aag gtc ggc gac ttg ata tcg cgg ctt ggt tcc gac1554Phe Asp Arg Asn Lys Val Gly Asp Leu Ile Ser Arg Leu Gly Ser Asp230 235 240 245gcc tac att gta tcg cgc tcg atg acg cag aac att tcg gac ggg gtt1602Ala Tyr Ile Val Ser Arg Ser Met Thr Gln Asn Ile Ser Asp Gly Val250 255 260aaa gcc gcg ctc tgc gga ggc gtc ggt gtg ggc atg atg ttc cac att1650Lys Ala Ala Leu Cys Gly Gly Val Gly Val Gly Met Met Phe His Ile265 270 275tcg agc aca ttg act tct gca atg ata atg ttt gcc cct ccc ctc ctc1698Ser Ser Thr Leu Thr Ser Ala Met Ile Met Phe Ala Pro Pro Leu Leu280 285 290atc gcc gcc acc atc tac ggc aag cgc att cgc gcc atc tcg cgc gag1746Ile Ala Ala Thr Ile Tyr Gly Lys Arg Ile Arg Ala Ile Ser Arg Glu295 300 305ctc cag caa tct aca ggt aac ttg acg cgg gtg tca gag gag cag ttc1794Leu Gln Gln Ser Thr Gly Asn Leu Thr Arg Val Ser Glu Glu Gln Phe310 315 320 325aat ggc atc aag acc atc aag tca ttc gtc gcg gag gga aag gag atg1842Asn Gly Ile Lys Thr Ile Lys Ser Phe Val Ala Glu Gly Lys Glu Met330 335 340cgg aga tac aac acg gcc gtg cgg agg ctc ttc aac gtt gca aag agg1890Arg Arg Tyr Asn Thr Ala Val Arg Arg Leu Phe Asn Val Ala Lys Arg345 350 355gaa ggt ata acg agc gcg acg ttt ttc agc ggt acg aat gtg ttg ggc1938Glu Gly Ile Thr Ser Ala Thr Phe Phe Ser Gly Thr Asn Val Leu Gly360 365 370gac gtg agt ttt ttg ctt gtt ttg gcg tat ggg tcg cac ctc gtt ttg1986Asp Val Ser Phe Leu Leu Val Leu Ala Tyr Gly Ser His Leu Val Leu375 380 385cag ggc gaa cta tcc ctt ggg agc ttg acg gcg ttc atg ctc tac act2034Gln Gly Glu Leu Ser Leu Gly Ser Leu Thr Ala Phe Met Leu Tyr Thr390 395 400 405gag tac act gga agc tcg gtt ttc ggt tta tcg aac ttt tac tca gag2082Glu Tyr Thr Gly Ser Ser Val Phe Gly Leu Ser Asn Phe Tyr Ser Glu410 415 420ttg atg aag ggc gct ggt gct gct tcg cgc ttg ttc gaa ttg aca gac2130Leu Met Lys Gly Ala Gly Ala Ala Ser Arg Leu Phe Glu Leu Thr Asp425 430 435tac aag aac tcc gtg ccg tct acc gtt ggc cag acg ttt gtg ccg cgc2178Tyr Lys Asn Ser Val Pro Ser Thr Val Gly Gln Thr Phe Val Pro Arg440 445 450gat ggt cgc atc gag ttc aag gac gtg tcc ttc agc tac ccc acg cgg2226Asp Gly Arg Ile Glu Phe Lys Asp Val Ser Phe Ser Tyr Pro Thr Arg455 460 465
ccg acg agc cag atc ttc aag aaa ctc cgc ctc acg ata acc ccg ggc2274Pro Thr Ser Gln Ile Phe Lys Lys Leu Arg Leu Thr Ile Thr Pro Gly470 475 480 485tcc aac gtc tgc atc gtc ggg ccc tcc ggg cgg ggc aag tcc acc att2322Ser Asn Val Cys Ile Val Gly Pro Ser Gly Arg Gly Lys Ser Thr Ile490 495 500gcg tcc ctc ctc cta cgg ttt tac gat gcc aac agc ggc acc atc ctc2370Ala Ser Leu Leu Leu Arg Phe Tyr Asp Ala Asn Ser Gly Thr Ile Leu505 510 515ata gac ggt cag gac ata tcc aag gta agc gcc aag tcg ctc aga aaa2418Ile Asp Gly Gln Asp Ile Ser Lys Val Ser Ala Lys Ser Leu Arg Lys520 525 530cat ctt ggc gtt gtc cag cag gag ccg gtc ttg atg tcc ggg acc atc2466His Leu Gly Val Val Gln Gln Glu Pro Val Leu Met Ser Gly Thr Ile535 540 545aga gac aac atc acc tac ggc ctt tcc tac acg ccc tcc atg gat gag2514Arg Asp Asn Ile Thr Tyr Gly Leu Ser Tyr Thr Pro Ser Met Asp Glu550 555 560 565ata cgc gca gtt gcc aag aag tgc ttc tgc cat aac ttc atc acc aag2562Ile Arg Ala Val Ala Lys Lys Cys Phe Cys His Asn Phe Ile Thr Lys570 575 580ttc ccg gac ggc tat gac acc gtg att ggg cct aga ggc gcc cta ctc2610Phe Pro Asp Gly Tyr Asp Thr Val Ile Gly Pro Arg Gly Ala Leu Leu585 590 595agc ggg ggc cag cgc cag cgc att gcc atc gcc cgc gcg ctc atc aag2658Ser Gly Gly Gln Arg Gln Arg Ile Ala Ile Ala Arg Ala Leu Ile Lys600 605 610aaa ccg aaa atc cta atc ctc gac gag gcc acc tcg gcg ttg gac gtt2706Lys Pro Lys Ile Leu Ile Leu Asp Glu Ala Thr Ser Ala Leu Asp Val615 620 625gaa agc gag ggc gcc atc aac tac acc ctc ggc agg cta atg cgc agc2754Glu Ser Glu Gly Ala Ile Asn Tyr Thr Leu Gly Arg Leu Met Arg Ser630 635 640 645aag gag atc acc atc gtg agc atc gcc cac cgc ctc agc acc ata cgc2802Lys Glu Ile Thr Ile Val Ser Ile Ala His Arg Leu Ser Thr Ile Arg650 655 660cgc tcc gag aac atc gtg gtt ctc ggc aat gac ggc tcc gtc atc gag2850Arg Ser Glu Asn Ile Val Val Leu Gly Asn Asp Gly Ser Val Ile Glu665 670 675gcc ggc aag ttt gcc gac cta tac cgt gac gag gac agc gag ttg ttc2898Ala Gly Lys Phe Ala Asp Leu Tyr Arg Asp Glu Asp Ser Glu Leu Phe680 685 690aag cta ttg aac gaa cac gcg tcg gag cct gcg aag ccc gag gcg tct2946Lys Leu Leu Asn Glu His Ala Ser Glu Pro Ala Lys Pro Glu Ala Ser695 700 705cca gct cct gcc cag gaa gag gct tcc gct cca cag gcc gca gac att2994
Pro Ala Pro Ala Gln Glu Glu Ala Ser Ala Pro Gln Ala Ala Asp Ile710 715 720 725ccc cgc gat atc gag ggc gga aat ctt cgc cta aat gaa gag gtc ata 3042Pro Arg Asp Ile Glu Gly Gly Asn Leu Arg Leu Asn Glu Glu Val Ile730 735 740aag cat gtg ctg gag gac acg gcc cgt gcc cca atg cct taagacatgc 3091Lys His Val Leu Glu Asp Thr Ala Arg Ala Pro Met Pro745 750cccagattca cccgtattat ctcccaataa ctacatatat atagaactga tatttgataa3151aatgttttag tttcatcgat tccatcgatt ccatcttttc ttaagtaagc acacggagcc3211ttgctacgag atgctgacgt ctcaataggg aaaaagcaga ttacacgcat caactacata3271aaatcagcgc aattgtatgg agacagcgct gcttataaag ggcagctgat agcacagttg3331taatatttca aagtgaggtg gtgtccgcag catgatacag gtacctaacg cgtttatctc3391gcccccctta gcgaccacac tagggcccgg agctgactca ctggaggatg tgatgctgcg3451aatcggaaac aagaacctga gcacggagga gatcaagcag gacctgttgc gattggtcaa3511cctgctgcag gatctgaagg tgtcgctgaa ggggacgttt tctagggacg tggtggtgtc3571gcacatgcca cagtacttcg actggatcca ggacgggcgt ggcctcttct acccgctgta3631caagtgcttt tcgcagatcg agcccgcgat gctgaagttc ctggacccgc tggaggcgca3691gcagacgtcc ggcgcgctga acagggacca ggtggcgatc ttcaacctga tcgaccaggt3751gtccgagctc gtgctgagcc tgaagccgct gttccagtcg gtgaagaacc tattcgacac3811ggcgctggag ttcaatgaga tcttcaagga ccacatgaac tcgctactgg aggagatcga3871aggaaacatg aagaagtgcc tcgcgctgca ccaggactgc ttcgcgtcgc ccgtgagaca3931ccctccgtcc ttcacgttgg accagctcgt ggagcttata tcctcatcgt caaacaacca3991gcggctgcag atgccgacct tcaatcccct ggaaaagcgc atctaccagg gattactgcg4051agctaagaga atgctattgt gccgatccag acatcgctga agagacgtcc tgaaaacccg4111catccca 4118<210>9<211>754<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo24<400>9Met Trp Arg Ala Ile Arg Pro Phe Gly Gly Leu Gly Pro Val Ala Val1 5 10 15
Leu Gln Arg Leu Pro Gly Pro Arg His Asn Val Ala Val Arg Leu Gln20 25 30Val Met Ser Arg Ala Arg Cys Gly Trp Gln Cys Val Arg Ala Thr Ser35 40 45Arg Leu Thr Val Pro Val Cys Arg Gln Ser Arg Ala Tyr Ser Ala Ala50 55 60Arg Val Gly Gly Glu Gly Thr Pro Ser Pro Arg Asp Lys Glu His Glu65 70 75 80Gln Glu Arg Lys Val Glu Lys Arg Pro Ala Glu Pro Ser Arg Ala Gln85 90 95Pro Ala Lys Pro Ala Gly Trp His Glu Val Phe Arg Leu Leu Arg Leu100 105 110Val Lys Pro Asp Trp Lys Leu Leu Leu Ala Ala Leu Gly Leu Leu Thr115 120 125Ile Ser Cys Ser Ile Gly Met Ala Val Pro Lys Val Ile Gly Leu Val130 135 140Leu Asp Ala Thr Lys Asp Ala Val Ala Gln Ala Glu Lys Asn Glu Thr145 150 155 160Gly Ala Pro Met Ser Leu Leu Asp Met Pro Pro Ile Ile Gly Asn Phe165 170 175Thr Leu Val Asp Val Leu Ala Ala Phe Ala Gly Ala Leu Leu Val Gly180 185 190Ser Ala Ala Asn Phe Gly Arg Met Phe Leu Leu Lys Met Leu Gly Glu195 200 205Arg Leu Val Ala Arg Leu Arg Ala Gln Val Ile Lys Lys Thr Leu His210 215 220His Asp Ala Glu Phe Phe Asp Arg Asn Lys Val Gly Asp Leu Ile Ser225 230 235 240Arg Leu Gly Ser Asp Ala Tyr Ile Val Ser Arg Ser Met Thr Gln Asn245 250 255Ile Ser Asp Gly Val Lys Ala Ala Leu Cys Gly Gly Val Gly Val Gly260 265 270Met Met Phe His Ile Ser Ser Thr Leu Thr Set Ala Met Ile Met Phe275 280 285Ala Pro Pro Leu Leu Ile Ala Ala Thr Ile Tyr Gly Lys Arg Ile Arg290 295 300Ala Ile Ser Arg Glu Leu Gln Gln Ser Thr Gly Asn Leu Thr Arg Val305 310 315 320Ser Glu Glu Gln Phe Asn Gly Ile Lys Thr Ile Lys Ser Phe Val Ala325 330 335Glu Gly Lys Glu Met Arg Arg Tyr Asn Thr Ala Val Arg Arg Leu Phe340 345 350
Asn Val Ala Lys Arg Glu Gly Ile Thr Ser Ala Thr Phe Phe Ser Gly355 360 365Thr Asn Val Leu Gly Asp Val Ser Phe Leu Leu Val Leu Ala Tyr Gly370 375 380Ser His Leu Val Leu Gln Gly Glu Leu Ser Leu Gly Ser Leu Thr Ala385 390 395 400Phe Met Leu Tyr Thr Glu Tyr Thr Gly Ser Ser Val Phe Gly Leu Ser405 410 415Asn Phe Tyr Ser Glu Leu Met Lys Gly Ala Gly Ala Ala Ser Arg Leu420 425 430Phe Glu Leu Thr Asp Tyr Lys Asn Ser Val Pro Ser Thr Val Gly Gln435 440 445Thr Phe Val Pro Arg Asp Gly Arg Ile Glu Phe Lys Asp Val Ser Phe450 455 460Ser Tyr Pro Thr Arg Pro Thr Ser Gln Ile Phe Lys Lys Leu Arg Leu465 470 475 480Thr Ile Thr Pro Gly Ser Asn Val Cys Ile Val Gly Pro Ser Gly Arg485 490 495Gly Lys Ser Thr Ile Ala Ser Leu Leu Leu Arg Phe Tyr Asp Ala Asn500 505 510Ser Gly Thr Ile Leu Ile Asp Gly Gln Asp Ile Ser Lys Val Ser Ala515 520 525Lys Ser Leu Arg Lys His Leu Gly Val Val Gln Gln Glu Pro Val Leu530 535 540Met Ser Gly Thr Ile Arg Asp Asn Ile Thr Tyr Gly Leu Ser Tyr Thr545 550 555 560Pro Ser Met Asp Glu Ile Arg Ala Val Ala Lys Lys Cys Phe Cys His565 570 575Asn Phe Ile Thr Lys Phe Pro Asp Gly Tyr Asp Thr Val Ile Gly Pro580 585 590Arg Gly Ala Leu Leu Ser Gly Gly Gln Arg Gln Arg Ile Ala Ile Ala595 600 605Arg Ala Leu Ile Lys Lys Pro Lys Ile Leu Ile Leu Asp Glu Ala Thr610 615 620Ser Ala Leu Asp Val Glu Ser Glu Gly Ala Ile Asn Tyr Thr Leu Gly625 630 635 640Arg Leu Met Arg Ser Lys Glu Ile Thr Ile Val Ser Ile Ala His Arg645 650 655Leu Ser Thr Ile Arg Arg Ser Glu Asn Ile Val Val Leu Gly Asn Asp660 665 670Gly Ser Val Ile Glu Ala Gly Lys Phe Ala Asp Leu Tyr Arg Asp Glu
675 680 685Asp Ser Glu Leu Phe Lys Leu Leu Asn Glu His Ala Ser Glu Pro Ala690 695 700Lys Pro Glu Ala Ser Pro Ala Pro Ala Gln Glu Glu Ala Ser Ala Pro705 710 715 720Gln Ala Ala Asp Ile Pro Arg Asp Ile Glu Gly Gly Asn Leu Arg Leu725 730 735Asn Glu Glu Val Ile Lys His Val Leu Glu Asp Thr Ala Arg Ala Pro740 745 750Met Pro<210>10<211>1002<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo109<400>10gatcggagcc gattaaaacg gcacaagctt gggagctgat cgaactactt tcacaaaatg 60atgtcgtgaa gtatggagat atcgttttca ggccgttgtt taagtcttct ccagaggccg120ggttgttgga gttagagaaa aatgggctga tcacaatcag ccgcaataga ggagtgttgc180aagatatccg gcccgctaaa ccattgttta aagccgcatt cagctacctg ttacaggaca240aggacctgtc catcgtcctc cgaacaggtt actacttgcg actaatcgcg tttgaaactg300ggcggatcaa aaagtgggag gaggaattgc gtctattggc aaaggttagt gaccaaagaa360tatgcaagag tcggttgaat tacttagcaa gcaaaataga cgccagtagt ggggtaatta420acagttgtga ggacaaggta aaagaaatgt caaagcgtat ttagaaacgc tcgcatcaat480aagaccccat tttgccacga tctggcaaga tgaactaaat agcgataatc acactaggtc540tcattagttt agcattccag ctgcacgggc tttagtttag tacctcaatt ccaaaaacgg600cactatcttg tccgagcgct ggtgaatatc cttgccgtat gtgaaattat ccagggttga660tgtagttggc cggagctacc agtaattgtt ggcctatgca cgggccgcta ttttccgtaa720cataatccag agatccgtta acaggcaaca tgaactgatt gattaatttt aatgaacttt780tttttttggc tttgaaaggc ctaaaattgg atcatctaca ttccctgacg atataggatg840gtaaaagccc taccaaccaa gaaattctga tccctttgac aaatccctta taacatagat900attagaatat aatcaacccc attgtgtgac aactcttctc caaaaataat tggtctttca960cacaattaaa gattggcttc aaggtagctc cacggtgaga tc 1002
<210>11<211>147<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo109<400>11Lys Thr Ala Gln Ala Trp Glu Leu Ile Glu Leu Leu Ser Gln Asn Asp1 5 10 15Val Val Lys Tyr Gly Asp Ile Val Phe Arg Pro Leu Phe Lys Ser Ser20 25 30Pro Glu Ala Gly Leu Leu Glu Leu Glu Lys Asn Gly Leu Ile Thr Ile35 40 45Ser Arg Asn Arg Gly Val Leu Gln Asp Ile Arg Pro Ala Lys Pro Leu50 55 60Phe Lys Ala Ala Phe Ser Tyr Leu Leu Gln Asp Lys Asp Leu Ser Ile65 70 75 80Val Leu Arg Thr Gly Tyr Tyr Leu Arg Leu Ile Ala Phe Glu Thr Gly85 90 95Arg Ile Lys Lys Trp Glu Glu Glu Leu Arg Leu Leu Ala Lys Val Ser100 105 110Asp Gln Arg Ile Cys Lys Ser Arg Leu Asn Tyr Leu Ala Ser Lys Ile115 120 125Asp Ala Ser Ser Gly Val Ile Asn Ser Cys Glu Asp Lys Val Lys Glu130 135 140Met Ser Lys145<210>12<211>4077<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(502)..(2919)<223>
<220>
<221>misc_feature<223>Oligo109<400>12cctgtaccgg gtgcggtgcc agatacatcg caatcccctt cgtgctgttg ccatgcggga 60cacaagcagg tcccattccc atctgcccac ctgcacccgc ggcgagtaat gcttctcccc120
cccgtagttc gctccaccgc tcgatccgcc acgtgaaccg gccctcgtac tcggtctctt180ctccttctag cggcggcaaa acctcctcga acgtcttgcc gagctccacc gcctccatgt240ttgtttcccg ggtttctggc acatccatta ctatcttgat atagttcgat gttgatactg300cctgggtcca gcctactatc caagtcctgg tttgttcatc gtgtgtagcc ctgtagagag360tgaatttcaa ggggcaggta acattgccgg acgcctacac ccgtggcttc tgaagaccat420cgcaaaaggt attcagaact ttgcaactag taccagcgat acaaggccgg tgacagcaga480agtaacgtcc cgagaaggcc a atg atg ttt ctg gag atg cag cga gcg ttc 531Met Met Phe Leu Glu Met Gln Arg Ala Phe1 5 10atg cta cac ggg cgg cga gca gtg acg aga agt gcg gtc ggc gtg cgg 579Met Leu His Gly Arg Arg Ala Val Thr Arg Ser Ala Val Gly Val Arg15 20 25tac atc tcg gag gac atc cag cag aag gac gca cag gcg ggc gag aag 627Tyr Ile Ser Glu Asp Ile Gln Gln Lys Asp Ala Gln Ala Gly Glu Lys30 35 40gcg acg gcg acg gcg acg ggg gtt atc tac aag tcg gac gag gaa acg 675Ala Thr Ala Thr Ala Thr Gly Val Ile Tyr Lys Ser Asp Glu Glu Thr45 50 55ctg atg tat ttc gac aac gta tac ccg cgg gcg acg tcg ttg tgg cgg 723Leu Met Tyr Phe Asp Asn Val Tyr Pro Arg Ala Thr Ser Leu Trp Arg60 65 70ccg acg cag tgg tac aac att ctg ctg tcg aac cag tcg cgg gaa gcg 771Pro Thr Gln Trp Tyr Asn Ile Leu Leu Ser Asn Gln Ser Arg Glu Ala75 80 85 90gtg agg gag aag atc atg cgg ttc gca agc ccg gca agc aac ccg gtg 819Val Arg Glu Lys Ile Met Arg Phe Ala Ser Pro Ala Ser Asn Pro Val95 100 105cac gga ctg gag ctg cgg tcg acg atc ccg atc aag cgg gac ggc ggg 867His Gly Leu Glu Leu Arg Ser Thr Ile Pro Ile Lys Arg Asp Gly Gly110 115 120gtg ttt gcg acg ttc cgg gtg ccg cgt gag tac acg agg gcg cag gtg 915Val Phe Ala Thr Phe Arg Val Pro Arg Glu Tyr Thr Arg Ala Gln Val125 130 135aac gcg ttg atc cag gcg acc acg cag cag gag tcg tcg aag tcg ctg 963Asn Ala Leu Ile Gln Ala Thr Thr Gln Gln Glu Ser Ser Lys Ser Leu140 145 150ctg gcg gcg ttt acg cgg gct gca gcg ttc ccg gtg aag ggc gtg ccg 1011Leu Ala Ala Phe Thr Arg Ala Ala Ala Phe Pro Val Lys Gly Val Pro155 160 165 170tgg atc gag gac ctg aag cgg ctg ccg aac aac gtg gtg cgc gtg gag 1059Trp Ile Glu Asp Leu Lys Arg Leu Pro Asn Asn Val Val Arg Val Glu175 180 185gtg gag ggc ccg gcg ctg tcg gag gag gag ttg tac tcg ctg ttc cgg 1107
Val Glu Gly Pro Ala Leu Ser Glu Glu Glu Leu Tyr Ser Leu Phe Arg190 195 200cgg tac ggc acg att ctg gac atc tac ccc gcg ggc aag aac ggc tat1155Arg Tyr Gly Thr Ile Leu Asp Ile Tyr Pro Ala Gly Lys Asn Gly Tyr205 210 215gcg acg atc cgc tac cgc tcg ttc cgg ggc gcg atc tgc gcg aag aac1203Ala Thr Ile Arg Tyr Arg Ser Phe Arg Gly Ala Ile Cys Ala Lys Asn220 225 230tgt gtg tcg ggg atc gag atc aac ggc tcg acg ctg cat gtc aag ttt1251Cys Val Ser Gly Ile Glu Ile Asn Gly Ser Thr Leu His Val Lys Phe235 240 245 250gag cct gta gtc cgc gcg cac gcg atc cgc gac ttc ttc gtg aac cac1299Glu Pro Val Val Arg Ala His Ala Ile Arg Asp Phe Phe Val Asn His255 260 265ccg cgc att gcc att ccc ctg ctg att gcc ctg tta tcc atc tgt gct1347Pro Arg Ile Ala Ile Pro Leu Leu Ile Ala Leu Leu Ser Ile Cys Ala270 275 280gtg ctg atc ttc gac cct atc cgg gag ttt tcc att gag cag aag atc1395Val Leu Ile Phe Asp Pro Ile Arg Glu Phe Ser Ile Glu Gln Lys Ile285 290 295acg cgc atg tac aca ctg tcg cgg gac aac ttc gtg gtg aaa agc atc1443Thr Arg Met Tyr Thr Leu Ser Arg Asp Asn Phe Val Val Lys Ser Ile300 305 310ctg cgc ctc acc tcc tat acg gtc tca tct gtg aag cat ctc tgg ggc1491Leu Arg Leu Thr Ser Tyr Thr Val Ser Ser Val Lys His Leu Trp Gly315 320 325 330tac gac gat gac cag cca gag aaa cga cag ttg tgg cag gag cgc gtg1539Tyr Asp Asp Asp Gln Pro Glu Lys Arg Gln Leu Trp Gln Glu Arg Val335 340 345gag aag gtg aac gac ctg aag atg tgg tta gag gaa aac aac aac act1587Glu Lys Val Asn Asp Leu Lys Met Trp Leu Glu Glu Asn Asn Asn Thr350 355 360ttc gtc gtg gtg acc ggt cct cgc ggc tct ggc aag cat gag ctc gtg1635Phe Val Val Val Thr Gly Pro Arg Gly Ser Gly Lys His Glu Leu Val365 370 375atg cag cac act ctg cat gac cgt cct aat gtg cta tat ctg gat tgt1683Met Gln His Thr Leu His Asp Arg Pro Asn Val Leu Tyr Leu Asp Cys380 385 390gat act ttg atc aag tcg cgt act gat tcc aag ttt ttg agg aat gcc1731Asp Thr Leu Ile Lys Ser Arg Thr Asp Ser Lys Phe Leu Arg Asn Ala395 400 405 410gcc cac cag att ggc tat ttc cca ata ttc ccg tgg ttg aat tcc gtc1779Ala His Gln Ile Gly Tyr Phe Pro Ile Phe Pro Trp Leu Asn Ser Val415 420 425acg act ctg gtt gac ctg gct gtt cag ggc ctg acc ggc cag aag tcc1827Thr Thr Leu Val Asp Leu Ala Val Gln Gly Leu Thr Gly Gln Lys Ser430 435 440
ggg cta tct gag tca aag gaa acg caa ttc cgg aat atg ctg aac act1875Gly Leu Ser Glu Ser Lys Glu Thr Gln Phe Arg Asn Met Leu Asn Thr445 450 455gct atg atg tct att agg cac att gct ttg tcc ggt tat aag gcg act1923Ala Met Met Ser Ile Arg His Ile Ala Leu Ser Gly Tyr Lys Ala Thr460 465 470ctg cac tct ggc gat gat gtt acg act gtg aag gag gag gac tac ttg1971Leu His Ser Gly Asp Asp Val Thr Thr Val Lys Glu Glu Asp Tyr Leu475 480 485 490caa cag cat cct gag cgc aag ccg gtt att gta ata gac agg ttc agt2019Gln Gln His Pro Glu Arg Lys Pro Val Ile Val Ile Asp Arg Phe Ser495 500 505aac aag gct gag ata aac ggt ttt gtg tac aaa gaa ctc gca gat tgg2067Asn Lys Ala Glu Ile Asn Gly Phe Val Tyr Lys Glu Leu Ala Asp Trp510 515 520gcg tcc atg ctt gtt cag atg aac atc gcg cat gtt ata ttc ctc acc2115Ala Ser Met Leu Val Gln Met Asn Ile Ala His Val Ile Phe Leu Thr525 530 535gag tct gta tct cca aac cag ttg ttg gca gag gct ctt cca aat caa2163Glu Ser Val Ser Pro Asn Gln Leu Leu Ala Glu Ala Leu Pro Asn Gln540 545 550gtt ttc aag ttc ctg ttt ctc tca gat gcg tcg aag gac tca gcg agg2211Val Phe Lys Phe Leu Phe Leu Ser Asp Ala Ser Lys Asp Ser Ala Arg555 560 565 570agc tac gtg ctt tca cag tta tac cct tct agc cca gcg tat tct gaa2259Ser Tyr Val Leu Ser Gln Leu Tyr Pro Ser Ser Pro Ala Tyr Ser Glu575 580 585aaa atg cca gca gca gat gca gat gcc aat gag gag tat agg aag gag2307Lys Met Pro Ala Ala Asp Ala Asp Ala Asn Glu Glu Tyr Arg Lys Glu590 595 600ata gac cgt gca ttg gag cct atc ggc ggt aga atg ttg gac cta caa2355Ile Asp Arg Ala Leu Glu Pro Ile Gly Gly Arg Met Leu Asp Leu Gln605 610 615gcg ttt gtc cgc aga gtg aaa tca ggg gag gag ccg tct gaa gca ttg2403Ala Phe Val Arg Arg Val Lys Ser Gly Glu Glu Pro Ser Glu Ala Leu620 625 630gaa aag atg gtg gag caa gca tca gag cag atc act caa ata ttc tta2451Glu Lys Met Val Glu Gln Ala Ser Glu Gln Ile Thr Gln Ile Phe Leu635 640 645 650agt gag aga tcg gag ccg att aaa acg gca caa gct tgg gag ctg atc2499Ser Glu Arg Ser Glu Pro Ile Lys Thr Ala Gln Ala Trp Glu Leu Ile655 660 665gaa cta ctt tca caa aat gat gtc gtg aag tat gga gat atc gtt ttc2547Glu Leu Leu Ser Gln Asn Asp Val Val Lys Tyr Gly Asp Ile Val Phe670 675 680agg ccg ttg ttt aag tct tct cca gag gcc ggg ttg ttg gag tta gag2595
Arg Pro Leu Phe Lys Ser Ser Pro Glu Ala Gly Leu Leu Glu Leu Glu685 690 695aaa aat ggg ctg atc aca atc agc cgc aat aga gga gtg ttg caa gat 2643Lys Asn Gly Leu Ile Thr Ile Ser Arg Asn Arg Gly Val Leu Gln Asp700 705 710atc cgg ccc gct aaa cca ttg ttt aaa gcc gca ttc agc tac ctg tta 2691Ile Arg Pro Ala Lys Pro Leu Phe Lys Ala Ala Phe Ser Tyr Leu Leu715 720 725 730cag gac aag gac ctg tcc atc gtc ctc cga aca ggt tac tac ttg cga 2739Gln Asp Lys Asp Leu Ser Ile Val Leu Arg Thr Gly Tyr Tyr Leu Arg735 740 745cta atc gcg ttt gaa act ggg cgg atc aaa aag tgg gag gag gaa ttg 2787Leu Ile Ala Phe Glu Thr Gly Arg Ile Lys Lys Trp Glu Glu Glu Leu750 755 760cgt cta ttg gca aag gtt agt gac caa aga ata tgc aag agt cgg ttg 2835Arg Leu Leu Ala Lys Val Ser Asp Gln Arg Ile Cys Lys Ser Arg Leu765 770 775aat tac tta gca agc aaa ata gac gcc agt agt ggg gta att aac agt 2883Asn Tyr Leu Ala Ser Lys Ile Asp Ala Ser Ser Gly Val Ile Asn Ser780 785 790tgt gag gac aag gta aaa gaa atg tca aag cgt att tagaaacgct 2929Cys Glu Asp Lys Val Lys Glu Met Ser Lys Arg Ile795 800 805cgcatcaata agaccccatt ttgccacgat ctggcaagat gaactaaata gcgataatca2989cactaggtct cattagttta gcattccagc tgcacgggct ttagtttagt acctcaattc3049caaaaacggc actatcttgt ccgagcgctg gtgaatatcc ttgccgtatg tgaaattatc3109cagggttgat gtagttggcc ggagctacca gtaattgttg gcctatgcac gggccgctat3169tttccgtaac ataatccaga gatccgttaa caggcaacat gaactgattg attaatttta3229atgaactttt ttttttggct ttgaaaggcc taaaattgga tcatctacat tccctgacga3289tataggatgg taaaagccct accaaccaag aaattctgat ccctttgaca aatcccttat3349aacatagata ttagaatata atcaacccca ttgtgtgaca actcttctcc aaaaataatt3409ggtctttcac acaattaaag attggcttca aggtagctcc acggtgagat ctgctaaaac3469agtatggaag ctgctaccat taatgaagag caagtcatct ctgaaaggga tttggaaaag3529ctgccagtgt cgagaaatgt cagtagagga tgggcagttc gtaagttggc aatattatac3589tttctattag cgtctttcgc tatagggacg gtgcacttat tccagtctgg ttacatgggt3649gctaatagta aatctcctca gatcggtcgc tggcaactat ttgcggagaa ttctcagggc3709cttacaaaac ggagtagatg ggcgatgatc gctgaaaaac accacgcgcc cctcttagca3769gcggcaagtc tatcaacggc agtggagcct aatgtttgcc cgcctgatgg cagaagatgc3829atgggcgaac taatcaccag attattactt caatcactcg cgatagctca ggacctctat3889
ggtggtgagt ggaagattac tcagccacat ccaccataca acaacaacaa acgcagtctg3949tcgaactatg catttgaaac tgcatcggaa ctttcaactc aaataaagag tagagcagac4009actttggcgg cgttaaatat caatctggtg ggacgcttcc gcagcaatga cccaaatggc4069cttgcgaa 4077<210>13<211>806<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo109<400>13Met Met Phe Leu Glu Met Gln Arg Ala Phe Met Leu His Gly Arg Arg1 5 10 15Ala Val Thr Arg Ser Ala Val Gly Val Arg Tyr Ile Ser Glu Asp Ile20 25 30Gln Gln Lys Asp Ala Gln Ala Gly Glu Lys Ala Thr Ala Thr Ala Thr35 40 45Gly Val Ile Tyr Lys Ser Asp Glu Glu Thr Leu Met Tyr Phe Asp Asn50 55 60Val Tyr Pro Arg Ala Thr Ser Leu Trp Arg Pro Thr Gln Trp Tyr Asn65 70 75 80Ile Leu Leu Ser Asn Gln Ser Arg Glu Ala Val Arg Glu Lys Ile Met85 90 95Arg Phe Ala Ser Pro Ala Ser Asn Pro Val His Gly Leu Glu Leu Arg100 105 110Ser Thr Ile Pro Ile Lys Arg Asp Gly Gly Val Phe Ala Thr Phe Arg115 120 125Val Pro Arg Glu Tyr Thr Arg Ala Gln Val Asn Ala Leu Ile Gln Ala130 135 140Thr Thr Gln Gln Glu Ser Ser Lys Ser Leu Leu Ala Ala Phe Thr Arg145 150 155 160Ala Ala Ala Phe Pro Val Lys Gly Val Pro Trp Ile Glu Asp Leu Lys165 170 175Arg Leu Pro Asn Asn Val Val Arg Val Glu Val Glu Gly Pro Ala Leu180 185 190Ser Glu Glu Glu Leu Tyr Ser Leu Phe Arg Arg Tyr Gly Thr Ile Leu195 200 205Asp Ile Tyr Pro Ala Gly Lys Asn Gly Tyr Ala Thr Ile Arg Tyr Arg
210 215 220Ser Phe Arg Gly Ala Ile Cys Ala Lys Asn Cys Val Ser Gly Ile Glu225 230 235 240Ile Asn Gly Ser Thr Leu His Val Lys Phe Glu Pro Val Val Arg Ala245 250 255His Ala Ile Arg Asp Phe Phe Val Asn His Pro Arg Ile Ala Ile Pro260 265 270Leu Leu Ile Ala Leu Leu Ser Ile Cys Ala Val Leu Ile Phe Asp Pro275 280 285Ile Arg Glu Phe Ser Ile Glu Gln Lys Ile Thr Arg Met Tyr Thr Leu290 295 300Ser Arg Asp Asn Phe Val Val Lys Ser Ile Leu Arg Leu Thr Ser Tyr305 310 315 320Thr Val Ser Ser Val Lys His Leu Trp Gly Tyr Asp Asp Asp Gln Pro325 330 335Glu Lys Arg Gln Leu Trp Gln Glu Arg Val Glu Lys Val Asn Asp Leu340 345 350Lys Met Trp Leu Glu Glu Asn Asn Asn Thr Phe Val Val Val Thr Gly355 360 365Pro Arg Gly Ser Gly Lys His Glu Leu Val Met Gln His Thr Leu His370 375 380Asp Arg Pro Asn Val Leu Tyr Leu Asp Cys Asp Thr Leu Ile Lys Ser385 390 395 400Arg Thr Asp Ser Lys Phe Leu Arg Asn Ala Ala His Gln Ile Gly Tyr405 410 415Phe Pro Ile Phe Pro Trp Leu Asn Ser Val Thr Thr Leu Val Asp Leu420 425 430Ala Val Gln Gly Leu Thr Gly Gln Lys Ser Gly Leu Ser Glu Ser Lys435 440 445Glu Thr Gln Phe Arg Asn Met Leu Asn Thr Ala Met Met Ser Ile Arg450 455 460His Ile Ala Leu Ser Gly Tyr Lys Ala Thr Leu His Ser Gly Asp Asp465 470 475 480Val Thr Thr Val Lys Glu Glu Asp Tyr Leu Gln Gln His Pro Glu Arg485 490 495Lys Pro Val Ile Val Ile Asp Arg Phe Ser Asn Lys Ala Glu Ile Asn500 505 510Gly Phe Val Tyr Lys Glu Leu Ala Asp Trp Ala Ser Met Leu Val Gln515 520 525Met Asn Ile Ala His Val Ile Phe Leu Thr Glu Ser Val Ser Pro Asn530 535 540
Gln Leu Leu Ala Glu Ala Leu Pro Asn Gln Val Phe Lys Phe Leu Phe545 550 555 560Leu Ser Asp Ala Ser Lys Asp Ser Ala Arg Ser Tyr Val Leu Ser Gln565 570 575Leu Tyr Pro Ser Ser Pro Ala Tyr Ser Glu Lys Met Pro Ala Ala Asp580 585 590Ala Asp Ala Asn Glu Glu Tyr Arg Lys Glu Ile Asp Arg Ala Leu Glu595 600 605Pro Ile Gly Gly Arg Met Leu Asp Leu Gln Ala Phe Val Arg Arg Val610 615 620Lys Ser Gly Glu Glu Pro Ser Glu Ala Leu Glu Lys Met Val Glu Gln625 630 635 640Ala Ser Glu Gln Ile Thr Gln Ile Phe Leu Ser Glu Arg Ser Glu Pro645 650 655Ile Lys Thr Ala Gln Ala Trp Glu Leu Ile Glu Leu Leu Ser Gln Asn660 665 670Asp Val Val Lys Tyr Gly Asp Ile Val Phe Arg Pro Leu Phe Lys Ser675 680 685Ser Pro Glu Ala Gly Leu Leu Glu Leu Glu Lys Asn Gly Leu Ile Thr690 695 700Ile Ser Arg Asn Arg Gly Val Leu Gln Asp Ile Arg Pro Ala Lys Pro705 710 715 720Leu Phe Lys Ala Ala Phe Ser Tyr Leu Leu Gln Asp Lys Asp Leu Ser725 730 735Ile Val Leu Arg Thr Gly Tyr Tyr Leu Arg Leu Ile Ala Phe Glu Thr740 745 750Gly Arg Ile Lys Lys Trp Glu Glu Glu Leu Arg Leu Leu Ala Lys Val755 760 765Ser Asp Gln Arg Ile Cys Lys Ser Arg Leu Asn Tyr Leu Ala Ser Lys770 775 780Ile Asp Ala Ser Ser Gly Val Ile Asn Ser Cys Glu Asp Lys Val Lys785 790 795 800Glu Met Ser Lys Arg Ile805<210>14<211>1337<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo163
<400>14gatcttggac ttgacacaga cagtggcacg ttacggctgg ttaccattca tcctttacat 60gggctggtcg cacactgcca actcccccaa cctgctaaac cttctctccc cactcccaag120tgtctaatgt atttgcaacg gttccctcag tatgtgcttt tgttcacatg atcctcctag180ggcaaggccg ggacggaggg aacgatagcg cgaggctacc agcctcggtc ctaccacgtc240gagtgtgccg caattctagt gagcttgtat atacgtaatt tgaataaata agcgttcatt300gttaccttat ccgcctatga gttcgggaac tacctgttcg ctgcctttgt gaaaagtagc360tgacaatagc agcggtgatg catcttccga aacagccata ggagagcaat gggccacgag420ctgacaagcc tgcagcgtga agtgatttcc ggactcacag caggaacaat cacaacaatc480gcragccacc cgctcgacct gcttaaactg cgactacaat tatcagcggg caacagggct540aacactacat atacaggact aatcagagac atatttgaac gccagcaatg gggacgagag600ctatatcgtg gtttaggcgt taacctgctt ggaaattcag tggcatgggc gctttacttt660ggctgttacc gatgcgcaaa ggacattgcg cttcgacact tgggcaatga gtctgctacg720ggtatcatgg accgccgcct gccagcgcac gcatacatgc ttgcagctgg tagcagcggg780attgcgacgg cagtccttac aaaccccata tgggtcatta agactcgcat aatggccact840tctcgtgctg gaccttacaa gtcgacgttt gacggggttt ataagttata tcaaactgaa900ggtgttctgg cattctggcg gggtgttgtt ccatcgctac tcggcgtctc gcaaggagct960atctactttg cgctgtatga tacattgaaa ttccattacc tgcactctag tactgacaag 1020gccgagcgaa ggttgtcggt ttccgagatc atcggcataa catgtatctc taaaatgatt 1080tccgtcacat cggtctatcc atttcagctg ctgaaatcta agctgcagga ttttggtgca 1140ccatccggca tcacccaact tgttcagact gtttacagta gagagggtat cagaggcttc 1200tacaggggcc tatcctgcta atctcctgcg ggcagttcct gctacatgca taaccttttt 1260cgtgtacgaa aatatcaaat atcgtctcta aatttgtgat ttggtgcagc gcgtagcaag 1320tatacactga ctggatc 1337<210>15<211>267<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo163<400>15His Glu Leu Thr Ser Leu Gln Arg Glu Val Ile Ser Gly Leu Thr Ala1 5 10 15
Gly Thr Ile Thr Thr Ile Ala Ser His Pro Leu Asp Leu Leu Lys Leu20 25 30Arg Leu Gln Leu Ser Ala Gly Asn Arg Ala Asn Thr Thr Tyr Thr Gly35 40 45Leu Ile Arg Asp Ile Phe Glu Arg Gln Gln Trp Gly Arg Glu Leu Tyr50 55 60Arg Gly Leu Gly Val Asn Leu Leu Gly Asn Ser Val Ala Trp Ala Leu65 70 75 80Tyr Phe Gly Cys Tyr Arg Cys Ala Lys Asp Ile Ala Leu Arg His Leu85 90 95Gly Asn Glu Ser Ala Thr Gly Ile Met Asp Arg Arg Leu Pro Ala His100 105 110Ala Tyr Met Leu Ala Ala Gly Ser Ser Gly Ile Ala Thr Ala Val Leu115 120 125Thr Asn Pro Ile Trp Val Ile Lys Thr Arg Ile Met Ala Thr Ser Arg130 135 140Ala Gly Pro Tyr Lys Ser Thr Phe Asp Gly Val Tyr Lys Leu Tyr Gln145 150 155 160Thr Glu Gly Val Leu Ala Phe Trp Arg Gly Val Val Pro Ser Leu Leu165 170 175Gly Val Ser Gln Gly Ala Ile Tyr Phe Ala Leu Tyr Asp Thr Leu Lys180 185 190Phe His Tyr Leu His Ser Ser Thr Asp Lys Ala Glu Arg Arg Leu Ser195 200 205Val Ser Glu Ile Ile Gly Ile Thr Cys Ile Ser Lys Met Ile Ser Val210 215 220Thr Ser Val Tyr Pro Phe Gln Leu Leu Lys Ser Lys Leu Gln Asp Phe225 230 235 240Gly Ala Pro Ser Gly Ile Thr Gln Leu Val Gln Thr Val Tyr Ser Arg245 250 255Glu Gly Ile Arg Gly Phe Tyr Arg Gly Leu Ser260 265<210>16<211>47<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo163<400>16Ala Ser Pro Asn Leu Phe Arg Leu Phe Thr Val Glu Arg Val Ser Glu1 5 10 15
Ala Ser Thr Gly Ala Tyr Pro Ala Asn Leu Leu Arg Ala Val Pro Ala20 25 30Thr Cys Ile Thr Phe Phe Val Tyr Glu Asn Ile Lys Tyr Arg Leu35 40 45<210>17<211>1733<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(329)..(1207)<223>
<220>
<221>misc_feature<223>Oligo163<400>17actcccccaa cctgataaac cttctctccc cactcccaag tgtctaatgt atttgcaacg 60gttccctcag tatgtgcttt tgttcacatg atcctcctag ggcaaggccg ggacggaggg120aacgatagcg cgaggctacc agcctcggtc ctaccacgtc gagtgtgccg caattctagt180gagcttgtat atacagtaat ttgaataaat aagcgttcat tgttacctta tccgcctatg240agttcgggaa ctactgttcg ctgcctttgt gaaaagtagc tgacaatagc agcggtgatg300catcttccga aacagccata ggagagca atg ggc cac gag ctg aca agc ctg 352Met Gly His Glu Leu Thr Ser Leu1 5cag cgt gaa gtg att tcc gga ctc aca gca gga aca atc aca aca atc 400Gln Arg Glu Val Ile Ser Gly Leu Thr Ala Gly Thr Ile Thr Thr Ile10 15 20gct agc cac ccg ctc gac ctg ctt aaa ctg cga cta caa tta tca gcg 448Ala Ser His Pro Leu Asp Leu Leu Lys Leu Arg Leu Gln Leu Ser Ala25 30 35 40ggc aac agg gct aac act aca tat aca gga cta atc aga gac ata ttt 496Gly Asn Arg Ala Asn Thr Thr Tyr Thr Gly Leu Ile Arg Asp Ile Phe45 50 55gaa cgc cag caa tgg gga cga gag cta tat cgt ggt tta ggc gtt aac 544Glu Arg Gln Gln Trp Gly Arg Glu Leu Tyr Arg Gly Leu Gly Val Asn60 65 70ctg ctt gga aat tca gtg gca tgg gcg ctt tac ttt ggc tgt tac cga 592Leu Leu Gly Asn Ser Val Ala Trp Ala Leu Tyr Phe Gly Cys Tyr Arg75 80 85tgc gca aag gac att gcg ctt cga cac ttg ggc aat gag tct gct acg 640Cys Ala Lys Asp Ile Ala Leu Arg His Leu Gly Asn Glu Ser Ala Thr90 95 100ggt atc atg gac cgc cgc ctg cca gcg cac gca tac atg ctt gca gct 688
Gly Ile Met Asp Arg Arg Leu Pro Ala His Ala Tyr Met Leu Ala Ala105 110 115 120ggt agc agc ggg att gcg acg gca gtc ctt aca aac ccc ata tgg gtc 736Gly Ser Ser Gly Ile Ala Thr Ala Val Leu Thr Asn Pro Ile Trp Val125 130 135att aag act cgc ata atg gcc act tct cgt gct gga cct tac aag tcg 784Ile Lys Thr Arg Ile Met Ala Thr Ser Arg Ala Gly Pro Tyr Lys Ser140 145 150acg ttt gac ggg gtt tat aag tta tat caa act gaa ggt gtt ctg gca 832Thr Phe Asp Gly Val Tyr Lys Leu Tyr Gln Thr Glu Gly Val Leu Ala155 160 165ttc tgg cgg ggt gtt gtt cca tcg cta ctc ggc gtc tcg caa gga gct 880Phe Trp Arg Gly Val Val Pro Ser Leu Leu Gly Val Ser Gln Gly Ala170 175 180atc tac ttt gcg ctg tat gat aca ttg aaa ttc cat tac ctg cac tct 928Ile Tyr Phe Ala Leu Tyr Asp Thr Leu Lys Phe His Tyr Leu His Ser185 190 195 200agt act gac aag gcc gag cga agg ttg tcg gtt tcc gag atc atc ggc 976Ser Thr Asp Lys Ala Glu Arg Arg Leu Ser Val Ser Glu Ile Ile Gly205 210 215ata aca tgt atc tct aaa atg att tcc gtc aca tcg gtc tat cca ttt 1024Ile Thr Cys Ile Ser Lys Met Ile Ser Val Thr Ser Val Tyr Pro Phe220 225 230cag ctg ctg aaa tct aag ctg cag gat ttt ggt gca cca tcc ggc atc 1072Gln Leu Leu Lys Ser Lys Leu Gln Asp Phe Gly Ala Pro Ser Gly Ile235 240 245acc caa ctt gtt cag act gtt tac agt aga gag ggt atc aga ggc ttc 1120Thr Gln Leu Val Gln Thr Val Tyr Ser Arg Glu Gly Ile Arg Gly Phe250 255 260tac agg ggc cta tcc gct aat ctc ctg cgg gca gtt cct gct aca tgc 1168Tyr Arg Gly Leu Ser Ala Asn Leu Leu Arg Ala Val Pro Ala Thr Cys265 270 275 280ata acc ttt ttc gtg tac gaa aat atc aaa tat cgt ctc taaatttgtg 1217Ile Thr Phe Phe Val Tyr Glu Asn Ile Lys Tyr Arg Leu285 290atttggtgca gcgcgtagca agtatacact gactggatct aaaagatgat taatttgtct1277taagctttac aaaaaaacac tttatatatt gattgatatt gggcaaaaga ttcatgacct1337tatgatgaaa tttagtaacc gagcttggcc aaatcctcag cgatctcgga cttagcatca1397tatttagcct tgacagcagc agccgttttg ttgaaggccc tcttcttgga gtagtactca1457gcagatctga cctttctctt ctcttccaac ttggcaacaa cgttctcgta cttccagcca1517acggtggaag acaacttacc caaggtggtg aactttctac ctggcttcaa tctcaaaact1577ctaaagcctg tggaacaaca actctcttca acttgtcgta tggaggtggg acaccctcta1637agacctttaa tctctccata gcagccttac cacggggcag tcttgtgagc aaccatacct1697
ctgacagcct tgtagaagaa tctggatggg gctctg 1733<210>18<211>293<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo163<400>18Met Gly His Glu Leu Thr Ser Leu Gln Arg Glu Val Ile Ser Gly Leu1 5 10 15Thr Ala Gly Thr Ile Thr Thr Ile Ala Ser His Pro Leu Asp Leu Leu20 25 30Lys Leu Arg Leu Gln Leu Ser Ala Gly Asn Arg Ala Asn Thr Thr Tyr35 40 45Thr Gly Leu Ile Arg Asp Ile Phe Glu Arg Gln Gln Trp Gly Arg Glu50 55 60Leu Tyr Arg Gly Leu Gly Val Asn Leu Leu Gly Asn Ser Val Ala Trp65 70 75 80Ala Leu Tyr Phe Gly Cys Tyr Arg Cys Ala Lys Asp Ile Ala Leu Arg85 90 95His Leu Gly Asn Glu Ser Ala Thr Gly Ile Met Asp Arg Arg Leu Pro100 105 110Ala His Ala Tyr Met Leu Ala Ala Gly Ser Ser Gly Ile Ala Thr Ala115 120 125Val Leu Thr Asn Pro Ile Trp Val Ile Lys Thr Arg Ile Met Ala Thr130 135 140Ser Arg Ala Gly Pro Tyr Lys Ser Thr Phe Asp Gly Val Tyr Lys Leu145 150 155 160Tyr Gln Thr Glu Gly Val Leu Ala Phe Trp Arg Gly Val Val Pro Ser165 170 175Leu Leu Gly Val Ser Gln Gly Ala Ile Tyr Phe Ala Leu Tyr Asp Thr180 185 190Leu Lys Phe His Tyr Leu His Ser Ser Thr Asp Lys Ala Glu Arg Arg195 200 205Leu Ser Val Ser Glu Ile Ile Gly Ile Thr Cys Ile Ser Lys Met Ile210 215 220Ser Val Thr Ser Val Tyr Pro Phe Gln Leu Leu Lys Ser Lys Leu Gln225 230 235 240Asp Phe Gly Ala Pro Ser Gly Ile Thr Gln Leu Val Gln Thr Val Tyr245 250 255
Ser Arg Glu Gly Ile Arg Gly Phe Tyr Arg Gly Leu Ser Ala Asn Leu260 265 270Leu Arg Ala Val Pro Ala Thr Cys Ile Thr Phe Phe Val Tyr Glu Asn275 280 285Ile Lys Tyr Arg Leu290<210>19<211>972<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo31<400>19gatcgatatt gtcggcaact tcattcctgg attaatattt atgcaatcaa tatttgggta 60cctatcgtgg gcaattattt acaagtggtc aaaagattgg attaaagatg agctgcctgc120gcctggttta ttaaacatgt tgattaacat gtttttatct cccggagttg tcgatgaaaa180actatataca ggccagagct ttcttcaagt tatccttttg ctagctgctc tagtttgtgt240tccgtggcta ctactttaca aaccgttgat gttgaagcgc cagaacgata tagctctcag300caaaggattc agaagcctca gagaccaacg ggtgcatgag attcttctgg aagcacagga360aaacgcaggc gaagatatgc tggttgcaga ttatgaaaat gaagatgaat cgtcggagga420gttcaacttt ggtgacgtta tgatacatca ggttatccac accattgaat tttgtttgaa480ttgtatatct catactgcat cgtatctcag attgtgggcc ttatctcttg cgcatgctca540actctcgact gtgttgtggt ctatgaccat tcagaattcg ttctccgact ccaaccctgg600ttcatttttc tctgtcacca aggtggtggt tttgtttgcc atgtggtttg tgttgactgt660ttgcatttta gtcttaatgg aaggaacgtc ggctatgttg cactcgttaa gattgcattg720ggtggaagcg atgtccaaat tcttcgaggg cgaaggctat gcttacgaac cattttcctt780caaggctatc aacagcgatg atgaatagta tcgtatatat taaaactaga cagatggagg840tagtgtcaca tgtgtcaggt atagattgcc cgatgaataa gcatccttga aatttagaaa900aatcataggc ctttagaatc gacatacaac gtctaaatat atttactatt cacttcatag960ttcatcgtga tc972<210>20<211>263<212>PRT<213>棉桃阿舒氏囊霉
<220>
<221>misc_feature<223>Oligo31<400>20Ile Asp Ile Val Gly Asn Phe Ile Pro Gly Leu Ile Phe Met Gln Ser1 5 10 15Ile Phe Gly Tyr Leu Ser Trp Ala Ile Ile Tyr Lys Trp Ser Lys Asp20 25 30Trp Ile Lys Asp Glu Leu pro Ala Pro Gly Leu Leu Asn Met Leu Ile35 40 45Asn Met phe Leu Ser pro Gly Val Val Asp Glu Lys Leu Tyr Thr Gly50 55 60Gln Ser Phe Leu Gln Val Ile Leu Leu Leu Ala Ala Leu Val Cys Val65 70 75 80Pro Trp Leu Leu Leu Tyr Lys Pro Leu Met Leu Lys Arg Gln Asn Asp85 90 95Ile Ala Leu Ser Lys Gly Phe Arg Ser Leu Arg Asp Gln Arg Val His100 105 110Glu Ile Leu Leu Glu Ala Gln Glu Asn Ala Gly Glu Asp Met Leu Val115 120 125Ala Asp Tyr Glu Asn Glu Asp Glu Ser Ser Glu Glu Phe Asn Phe Gly130 135 140Asp Val Met Ile His Gln Val Ile His Thr Ile Glu Phe Cys Leu Asn145 150 155 160Cys Ile Ser His Thr Ala Ser Tyr Leu Arg Leu Trp Ala Leu Ser Leu165 170 175Ala His Ala Gln Leu Ser Thr Val Leu Trp Ser Met Thr Ile Gln Asn180 185 190Ser Phe Ser Asp Ser Asn Pro Gly Ser Phe Phe Ser Val Thr Lys Val195 200 205Val Val Leu Phe Ala Met Trp Phe Val Leu Thr Val Cys Ile Leu Val210 215 220Leu Met Glu Gly Thr Ser Ala Met Leu His Ser Leu Arg Leu His Trp225 230 235 240Val Glu Ala Met Ser Lys Phe Phe Glu Gly Glu Gly Tyr Ala Tyr Glu245 250 255Pro Phe Ser Phe Lys Ala Ile260<210>21<211>4054<212>DNA<213>棉桃阿舒氏囊霉
<220>
<221>CDS<222>(623)..(3253)<223>
<220>
<221>misc_feature<223>Oligo31<400>21ccgtgcagta catcttgcgc attgccagta taggtcaccc accactgtcg tcgcctgctt 60ctcgtatacc cactgttcca caacatacag ctcgtaccca ccaagtgcca cttcttggta120cgaacaatcc tccaaagcgc tctgcgacct gaaaaccgcc cggaagtccg gcacaacgta180ctttatccat ccgccatgtg tttcggcctc accatcgttc accactttgc gtgaacctcg240agagttatgc tgggcaatat ccatatctaa gctccatcta ctactgttcg ctacctcacg300ggctgcctag gaagtggttc atagacgata tggagctata gggctcatcg cagtccgtca360taaggcatgt tcaccatcac agaaaacgat ttaaaaggga cacccacaac ttcaaccact420acaaatacca gtaaggtatg cgctaggaag cagttggagt tactagctgt taggagacat480tgaaacgagt atctaaagat tttgacagtg gggattctgt gtgcattggt gttcatgcac540gtagtgacta agtagtggct gcatacatag ggtacacaga ctgacagggt ggctgacaaa600agaacagtaa cttgagatcg tg atg ttc cta tca atg cgg gcc gag gag gcc 652Met Phe Leu Ser Met Arg Ala Glu Glu Ala1 5 10atg ttt cga tct gcg gat atg acc tat atc gag ttg tac att ccg cta 700Met Phe Arg Ser Ala Asp Met Thr Tyr Ile Glu Leu Tyr Ile Pro Leu15 20 25gag ata gcg cgc gag gtt gtt tgt gta tta ggt aac ctg ggg agc gta 748Glu Ile Ala Arg Glu Val Val Cys Val Leu Gly Asn Leu Gly Ser Val30 35 40atg tta aag gac atg aac aaa gac cta agc acg ttc cag cgc ggg tac 796Met Leu Lys Asp Met Asn Lys Asp Leu Ser Thr Phe Gln Arg Gly Tyr45 50 55gtt aac cag gtg cgg agg ttc gat gag gtc gag cgg cag gtg ggg tac 844Val Asn Gln Val Arg Arg Phe Asp Glu Val Glu Arg Gln Val Gly Tyr60 65 70atg gag ggt gtg gta cgg agg cac aag aac gag aca tgg cgg tac ctg 892Met Glu Gly Val Val Arg Arg His Lys Asn Glu Thr Trp Arg Tyr Leu75 80 85 90tat cga cat cta cag cgg gaa gag cag cag gag tat ccc ggc cgg gag 940Tyr Arg His Leu Gln Arg Glu Glu Gln Gln Glu Tyr Pro Gly Arg Glu95 100 105cac ccc acg ctt gcg cag ctg atc ggt tca atg cac aca cac tcg att 988His Pro Thr Leu Ala Gln Leu Ile Gly Ser Met His Thr His Ser Ile110 115 120
gat tcg gtg gac gag gtt gcg gag gaa atc atg cag ttc gag ggg cgc1036Asp Ser Val Asp Glu Val Ala Glu Glu Ile Met Gln Phe Glu Gly Arg125 130 135gtg agg cag ctc gac cag agt ctt gta gcg atg cgc gag cga ctg tcg1084Val Arg Gln Leu Asp Gln Ser Leu Val Ala Met Arg Glu Arg Leu Ser140 145 150aag ctt gtg cat gag cga cgt gtg atg ttc act tgc gaa cac ttt ctc1132Lys Leu Val His Glu Arg Arg Val Met Phe Thr Cys Glu His Phe Leu155 160 165 170gaa gtg aac ccc ggg atc ggg gag cga ttg ccc aca cgc ccc gcg ggg1180Glu Val Asn Pro Gly Ile Gly Glu Arg Leu Pro Thr Arg Pro Ala Gly175 180 185ttc gaa gct gat gag ttt gaa ctc acg cgt gtc ggg gag gag gac gag1228Phe Glu Ala Asp Glu Phe Glu Leu Thr Arg Val Gly Glu Glu Asp Glu190 195 200gag acg gca agc cag ctg tct ttt gat att tcg gat gac gca gag aca1276Glu Thr Ala Ser Gln Leu Ser Phe Asp Ile Ser Asp Asp Ala Glu Thr205 210 215cag ctg ccc ggg gac atg cgc acg tta ctc gaa ccg gtg tac cgg cat1324Gln Leu Pro Gly Asp Met Arg Thr Leu Leu Glu Pro Val Tyr Arg His220 225 230cag tac cta ctt aca ggc tca att gag cgt gct aag gta gag gcg ctc1372Gln Tyr Leu Leu Thr Gly Ser Ile Glu Arg Ala Lys Val Glu Ala Leu235 240 245 250aac aag atc ttg tgg cgc ctt ctc cgt ggg aat gtt ttc ttc cag aat1420Asn Lys Ile Leu Trp Arg Leu Leu Arg Gly Asn Val Phe Phe Gln Asn255 260 265ttc cct gtc tca gtg tca ccg gtg gaa gaa gat gat acc gat ctc gag1468Phe Pro Val Ser Val Ser Pro Val Glu Glu Asp Asp Thr Asp Leu Glu270 275 280act gac tgc ttt atc gtc ttt acg cat ggc gaa gtc ttg cta agc aag1516Thr Asp Cys Phe Ile Val Phe Thr His Gly Glu Val Leu Leu Ser Lys285 290 295gcg aag aaa gtg ata gaa tcc cta aat ggc aca ata tat ccg ttt atg1564Ala Lys Lys Val Ile Glu Ser Leu Asn Gly Thr Ile Tyr Pro Phe Met300 305 310caa gac ggg gcg aca gtg cag gag ttg aac gac aag ata gcg gac ctt1612Gln Asp Gly Ala Thr Val Gln Glu Leu Asn Asp Lys Ile Ala Asp Leu315 320 325 330aag cag ata tgt tct acg aca gaa cag aca cta cat acg gaa ctt ttt1660Lys Gln Ile Cys Ser Thr Thr Glu Gln Thr Leu His Thr Glu Leu Phe335 340 345ctt gtt gcc aac caa ttg ccc atg tgg aat gcc att att aag cgt gaa1708Leu Val Ala Asn Gln Leu Pro Met Trp Asn Ala Ile Ile Lys Arg Glu350 355 360aag tac atc tac tct gcc ttg aat tta ttt agg cag gag tca cag ggc1756
Lys Tyr Ile Tyr Ser Ala Leu Asn Leu Phe Arg Gln Glu Ser Gln Gly365 370 375ctc gtt gca gag gga tgg ctt ccc acg tac gat cta cca gga gtt cag1804Leu Val Ala Glu Gly Trp Leu Pro Thr Tyr Asp Leu Pro Gly Val Gln380 385 390gcg gca cta aag gac tat ggg gag agc gta gga tcc gca aat tcg gcc1852Ala Ala Leu Lys Asp Tyr Gly Glu Ser Val Gly Ser Ala Asn Ser Ala395 400 405 410gtt ttg aat gta att tcg aca acg agg aca ccg cca act ttc cac agg1900Val Leu Asn Val Ile Ser Thr Thr Arg Thr Pro Pro Thr Phe His Arg415 420 425act aac aag ttt acg cag gca ttc cag tcc att gtt gat gcc tat ggt1948Thr Asn Lys Phe Thr Gln Ala Phe Gln Ser Ile Val Asp Ala Tyr Gly430 435 440att gca aca tat aaa gaa gtg aac ccc ggg ttg gca act atc gtc aca1996Ile Ala Thr Tyr Lys Glu Val Asn Pro Gly Leu Ala Thr Ile Val Thr445 450 455ttt ccc ttt atg ttt gcc gtt atg ttt ggc gat gcc gga cac ggt gca2044Phe Pro Phe Met Phe Ala Val Met Phe Gly Asp Ala Gly His Gly Ala460 465 470ttg atg ctc ata gcc gcg ctc tat ttg gtg tta aat gaa aag aag ttg2092Leu Met Leu Ile Ala Ala Leu Tyr Leu Val Leu Asn Glu Lys Lys Leu475 480 485 490gga gca atg aaa cga ggt gag att ttc gac atg gca tac act gga aga2140Gly Ala Met Lys Arg Gly Glu Ile Phe Asp Met Ala Tyr Thr Gly Arg495 500 505tat gtt att cta ctg atg gga atc ttt tct atc tat acc ggt ata atg2188Tyr Val Ile Leu Leu Met Gly Ile Phe Ser Ile Tyr Thr Gly Ile Met510 515 520tac aat gat att ttt tcc aag tcc atg cat ttg ttt tcc act ggc tgg2236Tyr Asn Asp Ile Phe Ser Lys Ser Met His Leu Phe Ser Thr Gly Trp525 530 535aaa tgg cct tca aac ttt caa gag ggc gag atg att gag gct caa aaa2284Lys Trp Pro Ser Asn Phe Gln Glu Gly Glu Met Ile Glu Ala Gln Lys540 545 550gtt ggt gtt tac cca ttt gga ttg gac tat gcc tgg cac ggt tcg gac2332Val Gly Val Tyr Pro Phe Gly Leu Asp Tyr Ala Trp His Gly Ser Asp555 560 565 570aat agt ttg tta ttc acc aat tca tat aaa atg aag tta tca atc ctt2380Asn Ser Leu Leu Phe Thr Asn Ser Tyr Lys Met Lys Leu Ser Ile Leu575 580 585cta ggc ttt atc cac atg tcg tat tca tat att ttc tca tat ctc aac2428Leu Gly Phe Ile His Met Ser Tyr Ser Tyr Ile Phe Ser Tyr Leu Asn590 595 600tac cac tat aaa ggt tcg agg atc gat att gtc ggc aac ttc att cct2476Tyr His Tyr Lys Gly Ser Arg Ile Asp Ile Val Gly Asn Phe Ile Pro605 610 615
gga tta ata ttt atg caa tca ata ttt ggg tac cta tcg tgg gca att2524Gly Leu Ile Phe Met Gln Ser Ile Phe Gly Tyr Leu Ser Trp Ala Ile620 625 630att tac aag tgg tca aaa gat tgg att aaa gat gag ctg cct gcg cct2572Ile Tyr Lys Trp Ser Lys Asp Trp Ile Lys Asp Glu Leu Pro Ala Pro635 640 645 650ggt tta tta aac atg ttg att aac atg ttt tta tct ccc gga gtt gtc2620Gly Leu Leu Asn Met Leu Ile Asn Met Phe Leu Ser Pro Gly Val Val655 660 665gat gaa aaa cta tat aca ggc cag agc ttt ctt caa gtt atc ctt ttg2668Asp Glu Lys Leu Tyr Thr Gly Gln Ser Phe Leu Gln Val Ile Leu Leu670 675 680cta gct gct cta gtt tgt gtt ccg tgg cta cta ctt tac aaa ccg ttg2716Leu Ala Ala Leu Val Cys Val Pro Trp Leu Leu Leu Tyr Lys Pro Leu685 690 695atg ttg aag cgc cag aac gat ata gct ctc agc aaa gga ttc aga agc2764Met Leu Lys Arg Gln Asn Asp Ile Ala Leu Ser Lys Gly Phe Arg Ser700 705 710ctc aga gac caa cgg gtg cat gag att ctt ctg gaa gca cag gaa aac2812Leu Arg Asp Gln Arg Val His Glu Ile Leu Leu Glu Ala Gln Glu Asn715 720 725 730gca ggc gaa gat atg ctg gtt gca gat tat gaa aat gaa gat gaa tcg2860Ala Gly Glu Asp Met Leu Val Ala Asp Tyr Glu Asn Glu Asp Glu Ser735 740 745tcg gag gag ttc aac ttt ggt gac gtt atg ata cat cag gtt atc cac2908Ser Glu Glu Phe Asn Phe Gly Asp Val Met Ile His Gln Val Ile His750 755 760acc att gaa ttt tgt ttg aat tgt ata tct cat act gca tcg tat ctc2956Thr Ile Glu Phe Cys Leu Asn Cys Ile Ser His Thr Ala Ser Tyr Leu765 770 775aga ttg tgg gcc tta tct ctt gcg cat gct caa ctc tcg act gtg ttg3004Arg Leu Trp Ala Leu Ser Leu Ala His Ala Gln Leu Ser Thr Val Leu780 785 790tgg tct atg acc att cag aat tcg ttc tcc gac tcc aac cct ggt tca3052Trp Ser Met Thr Ile Gln Asn Ser Phe Ser Asp Ser Asn Pro Gly Ser795 800 805 810ttt ttc tct gtc acc aag gtg gtg gtt ttg ttt gcc atg tgg ttt gtg3100Phe Phe Ser Val Thr Lys Val Val Val Leu Phe Ala Met Trp Phe Val815 820 825ttg act gtt tgc att tta gtc tta atg gaa gga acg tcg gct atg ttg3148Leu Thr Val Cys Ile Leu Val Leu Met Glu Gly Thr Ser Ala Met Leu830 835 840cac tcg tta aga ttg cat tgg gtg gaa gcg atg tcc aaa ttc ttc gag3196His Ser Leu Arg Leu His Trp Val Glu Ala Met Ser Lys Phe Phe Glu845 850 855ggc gaa ggc tat gct tac gaa cca ttt tcc ttc aag gct atc aac agc3244
Gly Glu Gly Tyr Ala Tyr Glu Pro Phe Ser Phe Lys Ala Ile Asn Ser860 865 870gat gat gaa tagtatcgta tatattaaaa ctagacagat ggaggtagtg 3293Asp Asp Glu875tcacatgtgt caggtataga ttgcccgatg aataagcatc cttgaaattt agaaaaatca3353taggccttta gaatcgacat acaacgtcta aatatattta ctattcactt catagttcat3413cgtgatcgat gtccgaagtg gaactatctg cgctagaggt ggatgcatct gctggttgtt3473gcgtagaggt cgcttttgct tcatctgcga agtcagtagt agatgaagag gctgcttctt3533tgcttttctc ttctttcctc tttgccgctc ttagttttct tgtgtataat gagtttagct3593cacgcaagcg gtatgcatgt gctctttcgc ggaatttttg catttcctcg atggaattta3653gatgaccttc ggatttcatg aacaatttta ctaactgttc gcggtcaatt gtatcaaatg3713catctggagt taatatgggc tcgagttcgc tcagtatctt accgagtgcg gccaattctg3773actcagcaaa ggttgaattg tactgtaaat tctttggaac cttcagttta gtatattctc3833tagtgacatt taggccaaga gagttaaaat tatcctcaag ttcattagct tgtgccactg3893cagtatcatc aaatgcgtta aaggtagaaa tggcttcaga aacatttttg cgtagaagct3953caaatactgg gagatccaaa accttagcgt ctatggaaag gtaatggcta agcaacttat4013acagactcat ggtttcctgg aatctgtggt ggatatcgcc a4054<210>22<211>877<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo31<400>22Met Phe Leu Ser Met Arg Ala Glu Glu Ala Met Phe Arg Ser Ala Asp1 5 10 15Met Thr Tyr Ile Glu Leu Tyr Ile Pro Leu Glu Ile Ala Arg Glu Val20 25 30Val Cys Val Leu Gly Asn Leu Gly Ser Val Met Leu Lys Asp Met Asn35 40 45Lys Asp Leu Ser Thr Phe Gln Arg Gly Tyr Val Asn Gln Val Arg Arg50 55 60Phe Asp Glu Val Glu Arg Gln Val Gly Tyr Met Glu Gly Val Val Arg65 70 75 80Arg His Lys Asn Glu Thr Trp Arg Tyr Leu Tyr Arg His Leu Gln Arg
Glu Glu Gln Gln Glu Tyr Pro Gly Arg Glu His Pro Thr Leu Ala Gln100 105 110Leu Ile Gly Ser Met His Thr His Ser Ile Asp Ser Val Asp Glu Val115 120 125Ala Glu Glu Ile Met Gln Phe Glu Gly Arg Val Arg Gln Leu Asp Gln130 135 140Ser Leu Val Ala Met Arg Glu Arg Leu Ser Lys Leu Val His Glu Arg145 150 155 160Arg Val Met Phe Thr Cys Glu His Phe Leu Glu Val Asn Pro Gly Ile165 170 175Gly Glu Arg Leu Pro Thr Arg Pro Ala Gly Phe Glu Ala Asp Glu Phe180 185 190Glu Leu Thr Arg Val Gly Glu Glu Asp Glu Glu Thr Ala Ser Gln Leu195 200 205Ser Phe Asp Ile Ser Asp Asp Ala Glu Thr Gln Leu Pro Gly Asp Met210 215 220Arg Thr Leu Leu Glu Pro Val Tyr Arg His Gln Tyr Leu Leu Thr Gly225 230 235 240Ser Ile Glu Arg Ala Lys Val Glu Ala Leu Asn Lys Ile Leu Trp Arg245 250 255Leu Leu Arg Gly Asn Val Phe Phe Gln Asn Phe Pro Val Ser Val Ser260 265 270Pro Val Glu Glu Asp Asp Thr Asp Leu Glu Thr Asp Cys Phe Ile Val275 280 285Phe Thr His Gly Glu Val Leu Leu Ser Lys Ala Lys Lys Val Ile Glu290 295 300Ser Leu Asn Gly Thr Ile Tyr Pro Phe Met Gln Asp Gly Ala Thr Val305 310 315 320Gln Glu Leu Asn Asp Lys Ile Ala Asp Leu Lys Gln Ile Cys Ser Thr325 330 335Thr Glu Gln Thr Leu His Thr Glu Leu Phe Leu Val Ala Asn Gln Leu340 345 350Pro Met Trp Asn Ala Ile Ile Lys Arg Glu Lys Tyr Ile Tyr Ser Ala355 360 365Leu Asn Leu Phe Arg Gln Glu Ser Gln Gly Leu Val Ala Glu Gly Trp370 375 380Leu Pro Thr Tyr Asp Leu Pro Gly Val Gln Ala Ala Leu Lys Asp Tyr385 390 395 400Gly Glu Ser Val Gly Ser Ala Asn Ser Ala Val Leu Asn Val Ile Ser405 410 415Thr Thr Arg Thr Pro Pro Thr Phe His Arg Thr Asn Lys Phe Thr Gln
420 425 430Ala Phe Gln Ser Ile Val Asp Ala Tyr Gly Ile Ala Thr Tyr Lys Glu435 440 445Val Asn Pro Gly Leu Ala Thr Ile Val Thr Phe Pro Phe Met Phe Ala450 455 460Val Met Phe Gly Asp Ala Gly His Gly Ala Leu Met Leu Ile Ala Ala465 470 475 480Leu Tyr Leu Val Leu Asn Glu Lys Lys Leu Gly Ala Met Lys Arg Gly485 490 495Glu Ile Phe Asp Met Ala Tyr Thr Gly Arg Tyr Val Ile Leu Leu Met500 505 510Gly Ile Phe Ser Ile Tyr Thr Gly Ile Met Tyr Asn Asp Ile Phe Ser515 520 525Lys Ser Met His Leu Phe Ser Thr Gly Trp Lys Trp Pro Ser Asn Phe530 535 540Gln Glu Gly Glu Met Ile Glu Ala Gln Lys Val Gly Val Tyr Pro Phe545 550 555 560Gly Leu Asp Tyr Ala Trp His Gly Ser Asp Asn Ser Leu Leu Phe Thr565 570 575Asn Ser Tyr Lys Met Lys Leu Ser Ile Leu Leu Gly Phe Ile His Met580 585 590Ser Tyr Ser Tyr Ile Phe Ser Tyr Leu Asn Tyr His Tyr Lys Gly Ser595 600 605Arg Ile Asp Ile Val Gly Asn Phe Ile Pro Gly Leu Ile Phe Met Gln610 615 620Ser Ile Phe Gly Tyr Leu Ser Trp Ala Ile Ile Tyr Lys Trp Ser Lys625 630 635 640Asp Trp Ile Lys Asp Glu Leu Pro Ala Pro Gly Leu Leu Asn Met Leu645 650 655Ile Asn Met Phe Leu Ser Pro Gly Val Val Asp Glu Lys Leu Tyr Thr660 665 670Gly Gln Ser Phe Leu Gln Val Ile Leu Leu Leu Ala Ala Leu Val Cys675 680 685Val Pro Trp Leu Leu Leu Tyr Lys Pro Leu Met Leu Lys Arg Gln Asn690 695 700Asp Ile Ala Leu Ser Lys Gly Phe Arg Ser Leu Arg Asp Gln Arg Val705 710 715 720His Glu Ile Leu Leu Glu Ala Gln Glu Asn Ala Gly Glu Asp Met Leu725 730 735Val Ala Asp Tyr Glu Asn Glu Asp Glu Ser Ser Glu Glu Phe Asn Phe
740 745 750Gly Asp Val Met Ile His Gln Val Ile His Thr Ile Glu Phe Cys Leu755 760 765Asn Cys Ile Ser His Thr Ala Ser Tyr Leu Arg Leu Trp Ala Leu Ser770 775 780Leu Ala His Ala Gln Leu Ser Thr Val Leu Trp Ser Met Thr Ile Gln785 790 795 800Asn Ser Phe Ser Asp Ser Asn Pro Gly Ser Phe Phe Ser Val Thr Lys805 810 815Val Val Val Leu Phe Ala Met Trp Phe Val Leu Thr Val Cys Ile Leu820 825 830Val Leu Met Glu Gly Thr Ser Ala Met Leu His Ser Leu Arg Leu His835 840 845Trp Val Glu Ala Met Ser Lys Phe Phe Glu Gly Glu Gly Tyr Ala Tyr850 855 860Glu Pro Phe Ser Phe Lys Ala Ile Asn Ser Asp Asp Glu865 870 875<210>23<211>872<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo4<400>23gatctcatgg aggattgatt atataactat ttcttgctga gaggaagtta tggctataat 60cgccgtgtac acatgtattt ccaagacgct cactttttct tcatagaggg tgctccatat120aacctgatag agcttaagcg ggtctttgaa accaaagata aacttcttaa agtttattcc180atattactcg taaaatggaa ctctaaagtt ttacagcctc aagggtgagg cagtgacgac240ttttttcatc cattccggca ccttgagaat atttgatgtt aagtgctctg ttgttagtag300atagctttca tggctatctc gaatgtttga ctctgtattg gctccgcctg agtcaagctt360ttgaagctaa gaaaggacca acttgtaaaa cttcagacaa attttatcta ggaacatggc420ctgattcagc tegaggtatc ctctttcaac tcaaatcaca ttaatgcact aaaactgagt480gtaagcaaga cctgcaaata ataaaatttg ggcacatttt cattaaattt ctcccatata540agatagtatc ttctcatgta aagcatatta atgaaaccca cacaaagacc agaagtatta600tactgaaaag tataggaaga aacagcaata atcatcccat tattaaataa ttctactaaa660ccggtcagga taaggtatat ttcagacatg agactgagct ttttccatag tccgaagaac720aatccttcac acgccacaat taaccagcac catttcatta taggatagaa atgttcagaa780
attctctttg gatcaataga atctcacatg aaagaagtat tgacgtattt tctgattcct840gggcatgtaa acttaaaccg ctgttaagga tc 872<210>24<211>114<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo4<400>24Pro Gln Arg Phe Lys Phe Thr Cys Pro Gly Ile Arg Lys Tyr Val Asn1 5 10 15Thr Ser Phe Met Asp Ser Ile Asp Pro Lys Arg Ile Ser Glu His Phe20 25 30Tyr Pro Ile Met Lys Trp Cys Trp Leu Ile Val Ala Cys Glu Gly Leu35 40 45Phe Phe Gly Leu Trp Lys Lys Leu Ser Leu Met Ser Glu Ile Tyr Leu50 55 60Ile Leu Thr Gly Leu Val Glu Leu Phe Asn Asn Gly Met Ile Ile Ala65 70 75 80Val Ser Ser Tyr Thr Phe Gln Tyr Asn Thr Ser Gly Leu Cys Val Gly85 90 95Phe Ile Asn Met Leu Tyr Met Arg Arg Tyr Tyr Leu Ile Trp Glu Lys100 105 110Phe Asn<210>25<211>2093<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo4<400>25ccatgaatga gcgataatat atataacaag agtggtgtag catggcatga gcctgcttgc 60ggatggataa aggaggagtc ttcaggatag gaataatttc ccaagaatct attcatgaat120ggtatccaca ataggtcttt aatgtgagtt acgtagagtc tcttatgaga tttttacaga180aatttgattt taaaaatggt catttagcat gtttagtcta tgtcgccagg ggaatggtgt240ttaaaaattt tctcatttgt tgtgaattca agatatgcta tgatacacaa ataaacgata300
tacggactct accacatgca aattatagac taaaaagata cggttgataa aagcattttt360aaggagcaag attaaccgtc cagttgcgta atattatact taatttggtt tatagaggtg420tttttactcg tcttcatgat gtttatcggt attggataaa catgatggca ccactctcta480tcatatcgct cgcagaatag ccgatataat cttttcagta gcgaaaaaat attttgcgtt540atcttaaata aatttaagct tagttaccat tttttttatt tagagaactg tctactgtga600tctcatggag gattgattat ataactattt cttgctgaga ggaagttatg gctataatcg660ccgtgtacac atgtatttcc aagacgctca ctttttcttc atagagggtg ctccatataa720cctgatagag cttaagcggg tctttgaaac caaagataaa cttcttaaag tttattccat780attactcgta aaatggaact ctaaagtttt acagcctcaa gggtgaggca gtgacgactt840ttttcatcca ttccggcacc ttgagaatat ttgatgttaa gtgctctgtt gttagtagat900agctttcatg gctatctcga atgtttgact ctgtattggc tccgcctgag tcaagctttt960gaagctaaga aaggaccaac ttgtaaaact tcagacaaat tttatctagg aacatggcct1020gattcagctc gaggtatcct ctttcaactc aaatcacatt aatgcactaa aactgagtgt1080aagcaagacc tgcaaataat aaaatttggg cacattttca ttaaatttct cccatataag1140atagtatctt ctcatgtaaa gcatattaat gaaacccaca caaagaccag aagtattata1200ctgaaaagta taggaagaaa cagcaataat catcccatta ttaaataatt ctactaaacc1260ggtcaggata aggtatattt cagacatgag actgagcttt ttccatagtc cgaagaacaa1320tccttcacac gccacaatta accagcacca tttcattata ggatagaaat gttcagaaat1380tctctttgga tcaatagaat ctcacatgaa agaagtattg acgtattttc tgattcctgg1440gcatgtaaac ttaaaccgct gttaaggatc gcaatagttc tcaatattat gaagttgcca1500attaataacg ccaagattca caaagatctg tataagaatc attaaaagct gaccccgaaa1560tattggaacg ggtggtatct ttgcgtaatg tgccaactta atatcgccaa gatagttatc1620agtttggata tcaatattat acgcgaatga cttgataaaa gttagcgcat aatgatttct1680cggcactttt caaaccactt attacctgca acagcagcat tgttgctata gtaatactat1740ctgtgacttg tagcaacgcg acggaaagtg atagatcgga gttctaatct atggaaaacc1800atattgctca gatcaattcg acttccaagg ctatactacc agagatattg caaaggttgt1860gaagaacggt ccctacagtc actcctgctg ccattggttc ttaagagata ccatatctta1920aatacccctt gtcgggcaat gatgaggatt agcaacattc attgatagtt ggtatccttt1980tcttagtacc aatgcggtgt gcaggtgtaa tggtttacag gcggaacaat ggaggatatg2040cagtttctgg acaaggataa tcaaggaatg aaaccattag gagtgggcca ata 2093
<210>26<211>2093<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(738)..(1037)<223>
<220>
<221>misc_feature<223>Oligo4<400>26tattggccca ctcctaatgg tttcattcct tgattatcct tgtccagaaa ctgcatatcc 60tccattgttc cgcctgtaaa ccattacacc tgcacaccgc attggtacta agaaaaggat120accaactatc aatgaatgtt gctaatcctc atcattgccc gacaaggggt atttaagata180tggtatctct taagaaccaa tggcagcagg agtgactgta gggaccgttc ttcacaacct240ttgcaatatc tctggtagta tagccttgga agtcgaattg atctgagcaa tatggttttc300catagattag aactccgatc tatcactttc cgtcgcgttg ctacaagtca cagatagtat360tactatagca acaatgctgc tgttgcaggt aataagtggt ttgaaaagtg ccgagaaatc420attatgcgct aacttttatc aagtcattcg cgtataatat tgatatccaa actgataact480atcttggcga tattaagttg gcacattacg caaagatacc acccgttcca atatttcggg540gtcagctttt aatgattctt atacagatct ttgtgaatct tggcgttatt aattggcaac600ttcataatat tgagaactat tgcgatcctt aacagcggtt taagtttaca tgcccaggaa660tcagaaaata cgtcaatact tctttcatgt gagattctat tgatccaaag agaatttctg720aacatttcta tcctata atg aaa tgg tgc tgg tta att gtg gc9 tgt gaa 770Met Lys Trp Cys Trp Leu Ile Val Ala Cys Glu1 5 10gga ttg ttc ttc gga cta tgg aaa aag ctc agt ctc atg tct gaa ata 818Gly Leu Phe Phe Gly Leu Trp Lys Lys Leu Ser Leu Met Ser Glu Ile15 20 25tac ctt atc ctg acc ggt tta gta gaa tta ttt aat aat ggg atg att 866Tyr Leu Ile Leu Thr Gly Leu Val Glu Leu Phe Asn Asn Gly Met Ile30 35 40att gct gtt tct tcc tat act ttt cag tat aat act tct ggt ctt tgt 914Ile Ala Val Ser Ser Tyr Thr Phe Gln Tyr Asn Thr Ser Gly Leu Cys45 50 55gtg ggt ttc att aat atg ctt tac atg aga aga tac tat ctt ata tgg 962Val Gly Phe Ile Asn Met Leu Tyr Met Arg Arg Tyr Tyr Leu Ile Trp60 65 70 75gag aaa ttt aat gaa aat gtg ccc aaa ttt tat tat ttg cag gtc ttg 1010Glu Lys Phe Asn Glu Asn Val Pro Lys Phe Tyr Tyr Lau Gln Val Leu
80 85 90ctt aca ctc agt ttt agt gca tta atg tgatttgagt tgaaagagga1057Leu Thr Leu Ser Phe Ser Ala Leu Met95 100tacctcgagc tgaatcaggc catgttccta gataaaattt gtctgaagtt ttacaagttg1117gtcctttctt agcttcaaaa gcttgactca ggcggagcca atacagagtc aaacattcga1177gatagccatg aaagctatct actaacaaca gagcacttaa catcaaatat tctcaaggtg1237ccggaatgga tgaaaaaagt cgtcactgcc tcacccttga ggctgtaaaa ctttagagtt1297ccattttacg agtaatatgg aataaacttt aagaagttta tctttggttt caaagacccg1357cttaagctct atcaggttat atggagcacc ctctatgaag aaaaagtgag cgtcttggaa1417atacatgtgt acacggcgat tatagccata acttcctctc agcaagaaat agttatataa1477tcaatcctcc atgagatcac agtagacagt tctctaaata aaaaaaatgg taactaagct1537taaatttatt taagataacg caaaatattt tttcgctact gaaaagatta tatcggctat1597tctgcgagcg atatgataga gagtggtgcc atcatgttta tccaataccg ataaacatca1657tgaagacgag taaaaacacc tctataaacc aaattaagta taatattacg caactggacg1717gttaatcttg ctccttaaaa atgcttttat caaccgtatc tttttagtct ataatttgca1777tgtggtagag tccgtatatc gtttatttgt gtatcatagc atatcttgaa ttcacaacaa1837atgagaaaat ttttaaacac cattcccctg gcgacataga ctaaacatgc taaatgacca1897tttttaaaat caaatttctg taaaaatctc ataagagact ctacgtaact cacattaaag1957acctattgtg gataccattc atgaatagat tcttgggaaa ttattcctat cctgaagact2017cctcctttat ccatccgcaa gcaggctcat gccatgctac accactcttg ttatatatat2077tatcgctcat tcatgg2093<210>27<211>100<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo4<400>27Met Lys Trp Cys Trp Leu Ile Val Ala Cys Glu Gly Leu Phe Phe Gly1 5 10 15Leu Trp Lys Lys Leu Ser Leu Met Ser Glu Ile Tyr Leu Ile Leu Thr20 25 30Gly Leu Val Glu Leu Phe Asn Asn Gly Met Ile Ile Ala Val Ser Ser35 40 45
Tyr Thr Phe Gln Tyr Asn Thr Ser Gly Leu Cys Val Gly Phe Ile Asn50 55 60Met Leu Tyr Met Arg Arg Tyr Tyr Leu Ile Trp Glu Lys Phe Asn Glu65 70 75 80Asn Val Pro Lys Phe Tyr Tyr Leu Gln Val Leu Leu Thr Leu Ser Phe85 90 95Ser Ala Leu Met100<210>28<211>853<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo6<400>28gatcatattc cccttgtagg tctagccgca cgggtaaacg gcaatgtatg tcgcagaaca 60agtccccaca cctccggcag ttctggattc ctgtcctcgg tgtgagcttt cgcccgcatc120tcgagcattg tgacttccct ggcacaagag gtttgtaatg tgacctgttt ctgccggatg180tctcccgact ggacgccaga cccaccgaag ttggtgtagt acttgcaatg ttcacsggaa240ccgctgtctg tggatagcga tcgttcatct ttaaaattgt gttcaacatc cagatgcata300ttcaactgtt ccaagttttc aatatttcga ttgcatacgg ggcactcgac cgattccgag360gcgtcagagg cagcagcatt actgtactct gtaggtattt gttcatctgc ctccggggtt420ggcattactg ggccacctag ttggaactga catttatgat ataacgcaca gcactaatgt480gtgaaacgca aaagttcacc acactgtcaa aaaccaccac acagtcaact cgagatagac540acaataatga tggaagagct gtttatgcta ccagttattg gtatcacggc gttgttggtg600tataaatacg cttacgatat cctttggtac aagttacaga atctatttga actgattcct660tcatcaagct catctcaccc ctactcttcg gctatcgcta gcattaataa gtctcagaat720gggtttctgt acaagctata cacggaatat tcagtttctt ctaacaatgt gctgcgagtg780attcggactg ctagtctccg ggactgttgg ctgctgtgcg tctgtggctg tggagatagt840gctatggcag atc 853<210>29<211>38<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo6<400>29Glu Ser Val Glu Cys Pro Val Cys Asn Arg Asn Ile Glu Asn Leu Glu1 5 10 15Gln Leu Asn Met His Leu Asp Val Glu His Asn Phe Lys Asp Glu Arg20 25 30Ser Leu Ser Thr Asp Ser35<210>30<211>55<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo6<400>30Arg Ser His Tyr Lys Pro Leu Val Pro Gly Lys Ser Gln Cys Ser Arg1 5 10 15Cys Gly Arg Lys Leu Thr Pro Arg Thr Gly Ile Gln Asn Cys Arg Arg20 25 30Cys Gly Asp Leu Phe Cys Asp Ile His Cys Arg Leu Pro Val Arg Leu35 40 45Asp Leu Gln Gly Glu Tyr Asp50 55<210>31<211>2389<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(428)..(1993)<223>
<220>
<221>misc_feature<223>Oligo6<400>31gatctgccat agcactatct ccacagccac agacgcacag cagccaacag tcccggagac 60tagcgtccga atcactcgca gcacattgtt agaagaaact gaatattccg tgtatagctt120gtacagaaac ccattctgag acttattaat gctagcgata gccgaagagt aggggtgaga180
tgagcttgat gaaggaatca gttcaaatag attctgtaac ttgtaccaaa ggatatcgta240agcgtattta tacaccaaca acgccgtgat accaataact ggtagcataa acagctcttc300catcattatt gtgtctatct cgagttgact gtgtggtggt ttttgacagt gtggtgaact360tttgcgtttc acacattagt gctgtgcgtt atatcataaa tgtcagttcc aactaggtgg420cccagta atg cca acc ccg gag gca gat gaa caa ata cct aca gag tac 469Met Pro Thr Pro Glu Ala Asp Glu Gln Ile Pro Thr Glu Tyr1 5 10agt aat gct gct gcc tct gac gcc tcg gaa tcg gtc gag tgc ccc gta 517Ser Asn Ala Ala Ala Ser Asp Ala Ser Glu Ser Val Glu Cys Pro Val15 20 25 30tgc aat cga aat att gaa aac ttg gaa cag ttg aat atg cat ctg gat 565Cys Asn Arg Asn Ile Glu Asn Leu Glu Gln Leu Asn Met His Leu Asp35 40 45gtt gaa cac aat ttt aaa gat gaa cga tcg cta tcc aca gac agc ggt 613Val Glu His Asn Phe Lys Asp Glu Arg Ser Leu Ser Thr Asp Ser Gly50 55 60tcc gtg aac att gca agt act aca cca act tcg gtg ggt ctg gcg tcc 661Ser Val Asn Ile Ala Ser Thr Thr Pro Thr Ser Val Gly Leu Ala Ser65 70 75agt cgg gag aca tcc ggc aga aac agg tca cat tac aaa cct ctt gtg 709Ser Arg Glu Thr Ser Gly Arg Asn Arg Ser His Tyr Lys Pro Leu Val80 85 90cca ggg aag tca caa tgc tcg aga tgc ggg cga aag ctc aca ccg agg 757Pro Gly Lys Ser Gln Cys Ser Arg Cys Gly Arg Lys Leu Thr Pro Arg95 100 105 110aca gga atc cag aac tgc cgg agg tgt ggg gac ttg ttc tgc gac ata 805Thr Gly Ile Gln Asn Cys Arg Arg Cys Gly Asp Leu Phe Cys Asp Ile115 120 125cat tgc cgt tta ccc gtg cgg cta gac cta caa ggg gaa tat gat ccg 853His Cys Arg Leu Pro Val Arg Leu Asp Leu Gln Gly Glu Tyr Asp Pro130 135 140aga aac ggc gac tgg tgc aag tgc tgc cat gcc tgc atg gcg ggg cgc 901Arg Asn Gly Asp Trp Cys Lys Cys Cys His Ala Cys Met Ala Gly Arg145 150 155cct gga tac aac aaa ctg ggc tta tcg gtg gac cgg acc gac gag ttt 949Pro Gly Tyr Asn Lys Leu Gly Leu Ser Val Asp Arg Thr Asp Glu Phe160 165 170ata cgc cat cgt acc tct aaa aac gag gat aaa cag ctt cgc att ctg 997Ile Arg His Arg Thr Ser Lys Asn Glu Asp Lys Gln Leu Arg Ile Leu175 180 185 190cag ctt gag aat cgg ctt gtg cgt ctt gtt gac ggc atc gct act att 1045Gln Leu Glu Asn Arg Leu Val Arg Leu Val Asp Gly Ile Ala Thr Ile195 200 205gtt cgc gcg cac aac cag tct ttg ttt tat gga agt gga atg tat agg 1093Val Arg Ala His Asn Gln Ser Leu Phe Tyr Gly Ser Gly Met Tyr Arg
210 215 220gaa atc act gct cta cag aag tcc gtt acg cca tgg aaa gaa aat tca1141Glu Ile Thr Ala Leu Gln Lys Ser Val Thr Pro Trp Lys Glu Asn Ser225 230 235cag gca tca agc tgc tat ctc tgt tct cgg ccg ttc aat ctt ctt ctt1189Gln Ala Ser Ser Cys Tyr Leu Cys Ser Arg Pro Phe Asn Leu Leu Leu240 245 250cgc aag cac cat tgc aag ttg tgt ggt ctg ata gtc tgc gaa aac aac1237Arg Lys His His Cys Lys Leu Cys Gly Leu Ile Val Cys Glu Asn Asn255 260 265 270ttt acc aac tgt tcc aag gag ttc ccg atc gcg cag ctg gtg agt gct1285Phe Thr Asn Cys Ser Lys Glu Phe Pro Ile Ala Gln Leu Val Ser Ala275 280 285gcc aca gac cta cca ttc agg agc aat ccc cag gaa tta gcc gca ttg1333Ala Thr Asp Leu Pro Phe Arg Ser Asn Pro Gln Glu Leu Ala Ala Leu290 295 300ccg gtt cga cta cgc gtc tgc gtg gtt tgc ata aga tcc gtg ttt ctg1381Pro Val Arg Leu Arg Val Cys Val Val Cys Ile Arg Ser Val Phe Leu305 310 315cgc gca agg ttg cag gac aat ctc gca aac gat gct tct cag cta ttt1429Arg Ala Arg Leu Gln Asp Asn Leu Ala Asn Asp Ala Ser Gln Leu Phe320 325 330tcc aag tac act gag ttg cag cgt gta tca aga gcc atc ttg cgt ata1477Ser Lys Tyr Thr Glu Leu Gln Arg Val Ser Arg Ala Ile Leu Arg Ile335 340 345 350atg cct cgt ttc gag caa ctg ctc ggg gac ctc aac gca ccc gac gcg1525Met Pro Arg Phe Glu Gln Leu Leu Gly Asp Leu Asn Ala Pro Asp Ala355 360 365agc ccg aat cga agc gag cta gac gag ctg gcg cac ctg cga agg aaa1573Ser Pro Asn Arg Ser Glu Leu Asp Glu Leu Ala His Leu Arg Arg Lys370 375 380ctc ttg gag act ttc aag ctg tac gac acc ata gcc aag cag ata ttt1621Leu Leu Glu Thr Phe Lys Leu Tyr Asp Thr Ile Ala Lys Gln Ile Phe385 390 395gcc atc gac ccg gcc aat acc gca gaa ttg aag atc cag cag gct ata1669Ala Ile Asp Pro Ala Asn Thr Ala Glu Leu Lys Ile Gln Gln Ala Ile400 405 410aag gcc aaa tcg atg tcc ttc ata cag gat aaa atg cta ccg cta aag1717Lys Ala Lys Ser Met Ser Phe Ile Gln Asp Lys Met Leu Pro Leu Lys415 420 425 430aat atc ccc ggc ctg ctg aag ccg aag gat gcc gaa cct gag atc aat1765Asn Ile Pro Gly Leu Leu Lys Pro Lys Asp Ala Glu Pro Glu Ile Asn435 440 445tac act act agc aat cta ctt ttc aac aat ctg act gtc cgc gag gtt1813Tyr Thr Thr Ser Asn Leu Leu Phe Asn Asn Leu Thr Val Arg Glu Val450 455 460
aaa ctc tac cgt gaa cag ctg atg gta ctc aaa gag cag agg ttt ata 1861Lys Leu Tyr Arg Glu Gln Leu Met Val Leu Lys Glu Gln Arg Phe Ile465 470 475gtg gag ggc atg ctc gag aac gcc aag aaa cag cgg cgt ttt gaa gag 1909Val Glu Gly Met Leu Glu Asn Ala Lys Lys Gln Arg Arg Phe Glu Glu480 485 490gtt aat acg tta aag gaa aat acc aaa gag cta gac aat cag ata gcc 1957Val Asn Thr Leu Lys Glu Asn Thr Lys Glu Leu Asp Asn Gln Ile Ala495 500 505 510cag ctc gaa gaa acc cta ggc gac cag ggt ttt gtt tagtatctag 2003Gln Leu Glu Glu Thr Leu Gly Asp Gln Gly Phe Val515 520catggagttt tttgcttaac tataattact gtgtagatgc cgcagatagc atgtcgtagc2063ataattgcga attttcacca acatgaaaaa gtgtatgtgt ataaggcatc cagtgaactc2123ctaacatgct gatgaggttt taagtaaaga tatcactagc aatgaacgta agtgcagttt2183ttgagcttta tgtcctctgt agaacataat attaacgaca gggggatagg atgaaagaag2243acagcagtta tttgagctga acagtgaagc ctggtctgga attgatgcgt tcccgaataa2303aaccagcaag cttgactcaa gcatcaagag aaacacaggg tttatcaaaa agctgaaaca2363gggtatcacg aaagactcga aagatc 2389<210>32<211>522<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo6<400>32Met Pro Thr Pro Glu Ala Asp Glu Gln Ile Pro Thr Glu Tyr Ser Asn1 5 10 15Ala Ala Ala Ser Asp Ala Ser Glu Ser Val Glu Cys Pro Val Cys Asn20 25 30Arg Asn Ile Glu Asn Leu Glu Gln Leu Asn Met His Leu Asp Val Glu35 40 45His Asn Phe Lys Asp Glu Arg Ser Leu Ser Thr Asp Ser Gly Ser Val50 55 60Asn Ile Ala Ser Thr Thr Pro Thr Ser Val Gly Leu Ala Ser Ser Arg65 70 75 80Glu Thr Ser Gly Arg Asn Arg Ser His Tyr Lys Pro Leu Val Pro Gly85 90 95Lys Ser Gln Cys Ser Arg Cys Gly Arg Lys Leu Thr Pro Arg Thr Gly100 105 110
Ile Gln Asn Cys Arg Arg Cys Gly Asp Leu Phe Cys Asp Ile His Cys115 120 125Arg Leu Pro Val Arg Leu Asp Leu Gln Gly Glu Tyr Asp Pro Arg Asn130 135 140Gly Asp Trp Cys Lys Cys Cys His Ala Cys Met Ala Gly Arg Pro Gly145 150 155 160Tyr Asn Lys Leu Gly Leu Ser Val Asp Arg Thr Asp Glu Phe Ile Arg165 170 175His Arg Thr Ser Lys Asn Glu Asp Lys Gln Leu Arg Ile Leu Gln Leu180 185 190Glu Asn Arg Leu Val Arg Leu Val Asp Gly Ile Ala Thr Ile Val Arg195 200 205Ala His Asn Gln Ser Leu Phe Tyr Gly Ser Gly Met Tyr Arg Glu Ile210 215 220Thr Ala Leu Gln Lys Ser Val Thr Pro Trp Lys Glu Asn Ser Gln Ala225 230 235 240Ser Ser Cys Tyr Leu Cys Ser Arg Pro Phe Asn Leu Leu Leu Arg Lys245 250 255His His Cys Lys Leu Cys Gly Leu Ile Val Cys Glu Asn Asn Phe Thr260 265 270Asn Cys Ser Lys Glu Phe Pro Ile Ala Gln Leu Val Ser Ala Ala Thr275 280 285Asp Leu Pro Phe Arg Ser Asn Pro Gln Glu Leu Ala Ala Leu Pro Val290 295 300Arg Leu Arg Val Cys Val Val Cys Ile Arg Ser Val Phe Leu Arg Ala305 310 315 320Arg Leu Gln Asp Asn Leu Ala Asn Asp Ala Ser Gln Leu Phe Ser Lys325 330 335Tyr Thr Glu Leu Gln Arg Val Ser Arg Ala Ile Leu Arg Ile Met Pro340 345 350Arg Phe Glu Gln Leu Leu Gly Asp Leu Asn Ala Pro Asp Ala Ser Pro355 360 365Asn Arg Ser Glu Leu Asp Glu Leu Ala His Leu Arg Arg Lys Leu Leu370 375 380Glu Thr Phe Lys Leu Tyr Asp Thr Ile Ala Lys Gln Ile Phe Ala Ile385 390 395 400Asp Pro Ala Asn Thr Ala Glu Leu Lys Ile Gln Gln Ala Ile Lys Ala405 410 415Lys Ser Met Ser Phe Ile Gln Asp Lys Met Leu Pro Leu Lys Asn Ile420 425 430Pro Gly Leu Leu Lys Pro Lys Asp Ala Glu Pro Glu Ile Asn Tyr Thr
435 440 445Thr Ser Asn Leu Leu Phe Asn Asn Leu Thr Val Arg Glu Val Lys Leu450 455 460Tyr Arg Glu Gln Leu Met Val Leu Lys Glu Gln Arg Phe Ile Val Glu465 470 475 480Gly Met Leu Glu Asn Ala Lys Lys Gln Arg Arg Phe Glu Glu Val Asn485 490 495Thr Leu Lys Glu Asn Thr Lys Glu Leu Asp Asn Gln Ile Ala Gln Leu500 505 510Glu Glu Thr Leu Gly Asp Gln Gly Phe Val515 520<210>33<211>975<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo146<400>33gatccggacg acagggctgc ggcacaggag tcgtaccgta ggggcggggc agtccgaggc 60cagcacgaat gggttccggc cgttcacgga cgagggcatg ttcttccgag gggccggggg120ggctccggag gacctgtttg actttttctt tcggggcggg ggccccggcg gcccgttcgg180gatggctgat ccctatgatt cgtttgggcc ctttgggggc gctacgacgt ttacgtttgg240cgggcccgcg ggcttcaagg tgtacagcgg agggtctggg gggcagttcc gccgcggacc300gtttggcatg gcacaggctg ccaccgaagc gcaacgccaa cgtgcgaacg gccagccgga360ggcgcaagat ccgctacaac acgtagtgtt cgttctcctg atagtgcttc tcttcctgct420actgccaagt ctgggcttct gacttggagc agtatccgtt gtaccataca gggccggcgc480cgacctgacc aaggcttccc atggctggcc ttccatgatg gcatttcgta aatacctatt540tttatagtca acaagtataa ataaataata atatacaaat aatttacaaa tctgcagcac600gtcgcgtgac gctgactgcg acataaaaat gttcaagata gtttgattag aatgcacaaa660caaacattgc aacacttaca taaaccagat gaagctacag ccgctattcc aggttttgca720ttctgcgttc tattatttcg tcaatatcct cggctgctgg cttaagcttt agcttcctgc780ctaatttggc ggcaaatcca tcgtttcccg agccgccaga attgtcaggt actagatttt840ttctcttgat aagtttgcca ctcggtaact gctcatattc ctctgtgtta tatgtggcac900tgctgtgtat agtcactttg ctaggcgttc caggaggtaa ctcggtcgca ccgggtagtg960tattcttcct ggatc 975
<210>34<211>66<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo146<400>34Ser Ser Ala Thr Tyr Asn Thr Glu Glu Tyr Glu Gln Leu Pro Ser Gly1 5 10 15Lys Leu Ile Lys Arg Lys Asn Leu Val Pro Asp Asn Ser Gly Gly Ser20 25 30Gly Asn Asp Gly Phe Ala Ala Lys Leu Gly Arg Lys Leu Lys Leu Lys35 40 45Pro Ala Ala Glu Asp Ile Asp Glu Ile Ile Glu Arg Arg Met Gln Asn50 55 60Leu Glu65<210>35<211>2509<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(882)..(1208)<223>
<220>
<221>misc_feature<223>Oligo146<400>35ctgcagtttc tgaaggtgct ggtggcagat ccctacggtt tgaacaagat ccgcaccgcg 60ttcgagaagg gctacatcac gccgaatgac acatggttcc agggtggcac gacgacatac120gacaacattg cctatacgct gcgcctgatg atcgactgcg gcattgttgg catgtcgtgg180atcacactac caaagggcaa gtatgccatg atcccaaaga acaaaaaaat atctacgtgc240cagctggaag tgtcaataaa ctataaggac ctgatttcgc ggccggcaga cagtgactgg300tcgcacagtg ctccattgcg aatcctctct ttcgacatag aatgtgctgg ccgcgtgggc360gtgtttccag aaccggaggt tgatcctgtc attcagatag cgaatgttgt cagtattgcg420ggagagtcaa aaccatttat tcgcaatgtc ttcacagttg acacctgtgc gcccattact480ggctcgcaaa tttttgagca tgagacagaa gaagcgatgc ttaaacactg gcgtgacttc540
cttgttgagg ttgaccccga cgttatcatt ggttacaata cgacaaattt tgatcttcct600tacctgatca acagagctgc agccttgaac gtgtcttcat ttccctactt tggccgtttg660gttaactcca agcaggtcat caaagaaact gtattttcat ccaaggctca tggaacgcgg720gagtcgaagt cgatcaatat cgagggccgc cttcagttgg atatttttca gtttgtaaga780cgagaatatc agttgagatc gtacactttg aattcggtgc gtttaatgag ttgaagcaag840gatggacatg gcaacgtgat cctccaacaa ttaagcgctt g atg aac aag gcg att896Met Asn Lys Ala Ile1 5gga aat aaa agc gat act ttt gat ggc gtt atc aac cat acg cga tcc 944Gly Asn Lys Ser Asp Thr Phe Asp Gly Val Ile Asn His Thr Arg Ser10 15 20agg aag aat aca cta ccc ggt gcg acc gag tta cct cct gga acg cct 992Arg Lys Asn Thr Leu Pro Gly Ala Thr Glu Leu Pro Pro Gly Thr Pro25 30 35agc aaa gtg act ata cac agc agt gcc aca tat aac aca gag gaa tat 1040Ser Lys Val Thr Ile His Ser Ser Ala Thr Tyr Asn Thr Glu Glu Tyr40 45 50gag cag tta ccg agt ggc aaa ctt atc aag aga aaa aat cta gta cct 1088Glu Gln Leu Pro Ser Gly Lys Leu Ile Lys Arg Lys Asn Leu Val Pro55 60 65gac aat tct ggc ggc tcg gga aac gat gga ttt gcc gcc aaa tta ggc 1136Asp Asn Ser Gly Gly Ser Gly Asn Asp Gly Phe Ala Ala Lys Leu Gly70 75 80 85agg aag cta aag ctt aag cca gca gcc gag gat att gac gaa ata ata 1184Arg Lys Leu Lys Leu Lys Pro Ala Ala Glu Asp Ile Asp Glu Ile Ile90 95 100gaa cgc aga atg caa aac ctg gaa tagcggctgt agcttcatct ggtttatgta 1238Glu Arg Arg Met Gln Asn Leu Glu105agtgttgcaa tgtttgtttg tgcattctaa tcaaactatc ttgaacattt ttatgtcgca1298gtcagcgtca cgcgacgtgc tgcagatttg taaattattt gtatattatt atttatttat1358acttgttgac tataaaaata ggtatttacg aaatgccatc atggaaggcc agccatggga1418agccttggtc aggtcggcgc cggccctgta tggtacaacg gatactgctc caagtcagaa1478gcccagactt ggcagtagca ggaagagaag cactatcagg agaacgaaca ctacgtgttg1538tagcggatct tgcgcctccg gctggccgtt cgcacgttgg cgttgcgctt cggtggcagc1598ctgtgccatg ccaaacggtc cgcggcggaa ctgcccccca gacccaccgc tgtacacctt1658gaagcccgcg ggcccgccaa acgtaaacgt cgtagcgccc ccaaagggcc caaacgaatc1718atagggatca gccatcccga acgggccgcc ggggcccccg ccccgaaaga aaaagtcaaa1778caggtcctcc ggagcccccc cggcccctcg gaagaacatg ccctcgtccg tgaacggccg1838
gaacccattc gtgctggcct cggactgccc cgcccctacg gtacgactcc tgtgccgcag1898ccctgtcgtc cggatcgtag cccagctggt cgtacacgcg gcgcttcttc tcgtcagaca1958aaacctcgaa cgcacgattt accttcttga acgcttccgc cgccctcggg tgccgatttt2018tgtccggatg tagtttgatt gccatcttgc ggtacgcctt ctttatgtcc ccatcgctcg2078ccttctcgtc cacctgtagc agctcataga acgaatgctt gtccttatcc acaatcagca2138gcgtcagctt ttcttgctct tctgtgtact ctttctccgc catcttgata gctatcttag2198ctctccgcca atctgccaga ccttgttctt cttgccaccg agctacaatt cctcgagcct2258ctcaaccaaa ctaccttata acagctcctt cagatcacac gctgctggaa tcgatgactg2318gtccccggtc tgtcactatt catgcacaaa gcaactatag aacactcctc ttttcttaaa2378tgtaaaagtt gaagccaccg tgcagcgccg tttacgggaa gttccccaag gtagcacaac2438agaaggtaaa gatgaaacga ctacgcaccc gcataccggc ctagggccaa cggcgacatt2498cggcgtacag c 2509<210>36<211>109<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo146<400>36Met Asn Lys Ala Ile Gly Asn Lys Ser Asp Thr Phe Asp Gly Val Ile1 5 10 15Asn His Thr Arg Ser Arg Lys Asn Thr Leu Pro Gly Ala Thr Glu Leu20 25 30Pro Pro Gly Thr Pro Ser Lys Val Thr Ile His Ser Ser Ala Thr Tyr35 40 45Asn Thr Glu Glu Tyr Glu Gln Leu Pro Ser Gly Lys Leu Ile Lys Arg50 55 60Lys Asn Leu Val Pro Asp Asn Ser Gly Gly Ser Gly Asn Asp Gly Phe65 70 75 80Ala Ala Lys Leu Gly Arg Lys Leu Lys Leu Lys Pro Ala Ala Glu Asp85 90 95Ile Asp Glu Ile Ile Glu Arg Arg Met Gln Asn Leu Glu100 105<210>37<211>1031<212>DNA
<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo56<400>37gatccactaa taattggacg atacgcgcgt acccttcagt cgctgccgca aagattgggg 60tccagccaaa aagcttctca ccaagttcca tatttgcacc ctgtttaact agatattcgg120ccgcctcata gatgtctaac ttgcaagcaa cataaagagc agtctcgaga ttttccggct180cctgatagtc aatatcaaag cccttagcag acaataaaga atttaacaaa gacggcgagt240ttagtcttgt cgcgaggtgt agcaaacgag ggctgttaag agatttctct gggttcataa300acgacaatag cgtgctgaca gtaagagggt gtgtcccgat aacagccaaa tgcaatggtg360tgaggttctc cgaatctccc cacacgtcaa tatcatcgat tgcaacgtct gcattccaag420catcccactc actcagagcy tgcagaatta tcctggtamc ctcacataga ccatattggg480cagagtaatg tagcggcgtt cgcttgtagt tatctctttg taacagcgac ggtcttaaat540gggctggcaa ctgttgtaat atgtgtgaca ggggagctgg agagtcgtca gagttaacgc600catccggacc aaaagcacca acaagtctag tattgggttc cgggggtatc gctgcctcta660gatcgagaga gtcgctcagt agcgagttta tgttatcacg ctcttcgaga ctcttggtcc720gctttttgcc cagtgcaatt acatgatgat ggaagaagtt tctgccattt atatcggatg780gatctccgag cgtaggtata ataccaagga tttcatccac acagctgaag gaccgcgata840aagcggactt attcaatagc gtcaccagcg tccgcgtcgg tatcaggaca acagaactgg900tacatagaaa tgagctcgtt tatcaagccc gccccgtcat ccttggtaac tagctgggac960gccacatcaa ttggcgacga cgagccttgg agcagacgac ggtcttcgcc gcgtagttta1020tcctgtagat c 1031<210>38<211>17<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo56<400>38Val Thr Lys Asp Asp Gly Ala Gly Leu Ile Asn Glu Leu Ile Ser Met1 5 10 15Tyr
<210>39<211>298<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo56<220>
<221>misc_feature<222>(147)..(147)<223>未知氨基酸<400>39Ser Ser Val Val Leu Ile Pro Thr Arg Thr Leu Val Thr Leu Leu Asn1 5 10 15Lys Ser Ala Leu Ser Arg Ser Phe Ser Cys Val Asp Glu Ile Leu Gly20 25 30Ile Ile Pro Thr Leu Gly Asp Pro Ser Asp Ile Asn Gly Arg Asn Phe35 40 45Phe His His His Val Ile Ala Leu Gly Lys Lys Arg Thr Lys Ser Leu50 55 60Glu Glu Arg Asp Asn Ile Asn Ser Leu Leu Ser Asp Ser Leu Asp Leu65 70 75 80Glu Ala Ala Ile Pro Pro Glu Pro Asn Thr Arg Leu Val Gly Ala Phe85 90 95Gly Pro Asp Gly Val Asn Ser Asp Asp Ser Pro Ala Pro Leu Ser His100 105 110Ile Leu Gln Gln Leu Pro Ala His Leu Arg Pro Ser Leu Leu Gln Arg115 120 125Asp Asn Tyr Lys Arg Thr Pro Leu His Tyr Ser Ala Gln Tyr Gly Leu130 135 140Cys Glu Xaa Thr Arg Ile Ile Leu Gln Ala Leu Ser Glu Trp Asp Ala145 150 155 160Trp Asn Ala Asp Val Ala Ile Asp Asp Ile Asp Val Trp Gly Asp Ser165 170 175Glu Asn Leu Thr Pro Leu His Leu Ala Val Ile Gly Thr His Pro Leu180 185 190Thr Val Ser Thr Leu Leu Ser Phe Met Asn Pro Glu Lys Ser Leu Asn195 200 205Ser Pro Arg Leu Leu His Leu Ala Thr Arg Leu Asn Ser Pro Ser Leu210 215 220Leu Asn Ser Leu Leu Ser Ala Lys Gly Phe Asp Ile Asp Tyr Gln Glu225 230 235 240
Pro Glu Asn Leu Glu Thr Ala Leu Tyr Val Ala Cys Lys Leu Asp Ile245 250 255Tyr Glu Ala Ala Glu Tyr Leu Val Lys Gln Gly Ala Asn Met Glu Leu260 265 270Gly Glu Lys Leu Phe Gly Trp Thr Pro Ile Phe Ala Ala Ala Thr Glu275 280 285Gly Tyr Ala Arg Ile Val Gln Leu Leu Val290 295<210>40<211>4925<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(426)..(4388)<223>
<220>
<221>misc_feature<223>Oligo56<400>40ctcaaggttt ggctgggtct ggaactacgc cagctcatga cgctatccgt gcgtatcatc 60aatgacctcg ttaaaacgga tcagctatgt cctagttact gaaggccaaa aagaaatata120taaaagtaac gctggtgcct ttccacctta tccacgtgcg gaagctcggg cgttaaggtt180acgagctacg cttgcagatt gtgtttgagg aaggccaggg tgctcgtgcc tagcattcat240tccgcgcaca tgtgtacata tatactagct ttataggcca cacaacaaac agatatgcgc300acggctggag atatctcggc atacaccgcg tggcacagtg tttttccttg acttctgcat360attagaggtt tgtatagggg atactagctt cagctgggga gcacacagac taggctagga420caagt atg aag ttc ggc aag aca ttt ccc aac cat cag gtg ccg gaa tgg470Met Lys Phe Gly Lys Thr Phe Pro Asn His Gln Val Pro Glu Trp1 5 10 15gca cac aag tac gtg aat tac aag ggt ctg aag aag cag atc aag gaa 518Ala His Lys Tyr Val Asn Tyr Lys Gly Leu Lys Lys Gln Ile Lys Glu20 25 30atc acg ttg gtg cag gat gcg ctg ttc cgc cag gag caa ggc gca gct 566Ile Thr Leu Val Gln Asp Ala Leu Phe Arg Gln Glu Gln Gly Ala Ala35 40 45tcg cag gac gga ccc gct cgg cgg cgg gga aga gag agc aag gag cag 614Ser Gln Asp Gly Pro Ala Arg Arg Arg Gly Arg Glu Ser Lys Glu Gln50 55 60tat ctt ggc cat cca gag gtg aag aag ctg ctt gca gca ttt ttc ttt 662Tyr Leu Gly His Pro Glu Val Lys Lys Leu Leu Ala Ala Phe Phe Phe65 70 75
gcc ctg gac cgg gat atc gag aag gtg gac ggt ttc tac aac atg cag710Ala Leu Asp Arg Asp Ile Glu Lys Val Asp Gly Phe Tyr Asn Met Gln80 85 90 95ttt atg gag tat gac cgg cgg ctg agg aag ctt cta tca agc gcg cag758Phe Met Glu Tyr Asp Arg Arg Leu Arg Lys Leu Leu Ser Ser Ala Gln100 105 110ctg gca gac atc acg tcg gta cag cgc ggc gct acc ggc tac ctg cac806Leu Ala Asp Ile Thr Ser Val Gln Arg Gly Ala Thr Gly Tyr Leu His115 120 125gcg cca ctt ccg cag tac ata gca tac ggg gag cgc gaa cgg gat gga854Ala Pro Leu Pro Gln Tyr Ile Ala Tyr Gly Glu Arg Glu Arg Asp Gly130 135 140ttg cca gag cgc tat gta ccg ccg cac gcc act gac atg tcg gag gac902Leu Pro Glu Arg Tyr Val Pro Pro His Ala Thr Asp Met Ser Glu Asp145 150 155cta gcg gag gtg ctg acg att ctg ctg gag ctg cgg tcg cac ttc cgc950Leu Ala Glu Val Leu Thr Ile Leu Leu Glu Leu Arg Ser His Phe Arg160 165 170 175aac ctg aag tgg tac ggt gag ctc aac aag cgg gca ttc acg aaa atc998Asn Leu Lys Trp Tyr Gly Glu Leu Asn Lys Arg Ala Phe Thr Lys Ile180 185 190atg aag aaa ctg gat aag aag gtt ggc aca aac cag cag cac tcc tac 1046Met Lys Lys Leu Asp Lys Lys Val Gly Thr Asn Gln Gln His Ser Tyr195 200 205ttc cag gcc cgc att aag ccc tta gaa ttt gct gac gat aca ccg atc 1094Phe Gln Ala Arg Ile Lys Pro Leu Glu Phe Ala Asp Asp Thr Pro Ile210 215 220gtc aag gcg cta gct acc att aat gag atc cta gat cgc atc tcg ccc 1142Val Lys Ala Leu Ala Thr Ile Asn Glu Ile Leu Asp Arg Ile Ser Pro225 230 235tgc gtg aag gat cta cag gat aaa cta cgc ggc gaa gac cgt cgt ctg 1190Cys Val Lys Asp Leu Gln Asp Lys Leu Arg Gly Glu Asp Arg Arg Leu240 245 250 255ctc caa ggc tcg tcg tcg cca att gat gtg gcg tcc cag cta gtt acc 1238Leu Gln Gly Ser Ser Ser Pro Ile Asp Val Ala Ser Gln Leu Val Thr260 265 270aag gat gac ggg gcg ggc ttg ata aac gag ctc att tct atg tac cgt 1286Lys Asp Asp Gly Ala Gly Leu Ile Asn Glu Leu Ile Ser Met Tyr Arg275 280 285tct gtt gtc ctg ata ccg acg cgg acg ctg gtg acg cta ttg aat aag 1334Ser Val Val Leu Ile Pro Thr Arg Thr Leu Val Thr Leu Leu Asn Lys290 295 300tcc gct tta tcg cgg tcc ttc agc tgt gtg gat gaa atc ctt ggt att 1382Ser Ala Leu Ser Arg Ser Phe Ser Cys Val Asp Glu Ile Leu Gly Ile305 310 315ata cct acg ctc gga gat cca tcc gat ata aat ggc aga aac ttc ttc 1430
Ile Pro Thr Leu Gly Asp Pro Ser Asp Ile Asn Gly Arg Asn Phe Phe320 325 330 335cat cat cat gta att gca ctg ggc aaa aag cgg acc aag agt ctc gaa1478His His His Val Ile Ala Leu Gly Lys Lys Arg Thr Lys Ser Leu Glu340 345 350gag cgt gat aac ata aac tcg cta ctg agc gac tct ctc gat cta gag1526Glu Arg Asp Asn Ile Asn Ser Leu Leu Ser Asp Ser Leu Asp Leu Glu355 360 365gca gcg ata ccc ccg gaa ccc aat act aga ctt gtt ggt gct ttt ggt1574Ala Ala Ile Pro Pro Glu Pro Asn Thr Arg Leu Val Gly Ala Phe Gly370 375 380ccg gat ggc gtt aac tct gac gac tct cca gct ccc ctg tca cac ata1622Pro Asp Gly Val Asn Ser Asp Asp Ser Pro Ala Pro Leu Ser His Ile385 390 395tta caa cag ttg cca gcc cat tta aga ccg tcg ctg tta caa aga gat1670Leu Gln Gln Leu Pro Ala His Leu Arg Pro Ser Leu Leu Gln Arg Asp400 405 410 415aac tac aag cga acg ccg cta cat tac tct gcc caa tat ggt cta tgt1718Asn Tyr Lys Arg Thr Pro Leu His Tyr Ser Ala Gln Tyr Gly Leu Cys420 425 430gag gtt acc agg ata att ctg cag gct ctg agt gag tgg gat gct tgg1766Glu Val Thr Arg Ile Ile Leu Gln Ala Leu Ser Glu Trp Asp Ala Trp435 440 445aat gca gac gtt gca atc gat gat att gac gtg tgg gga gat tcg gag1814Asn Ala Asp Val Ala Ile Asp Asp Ile Asp Val Trp Gly Asp Ser Glu450 455 460aac ctc aca cca ttg cat ttg gct gtt atc ggg aca cac cct ctt act1862Asn Leu Thr Pro Leu His Leu Ala Val Ile Gly Thr His Pro Leu Thr465 470 475gtc agc acg cta ttg tcg ttt atg aac cca gag aaa tct ctt aac agc1910Val Ser Thr Leu Leu Ser Phe Met Asn Pro Glu Lys Ser Leu Asn Ser480 485 490 495cct cgt ttg cta cac ctc gcg aca aga cta aac tcg ccg tct ttg tta1958Pro Arg Leu Leu His Leu Ala Thr Arg Leu Asn Ser Pro Ser Leu Leu500 505 510aat tct tta ttg tct gct aag ggc ttt gat att gac tat cag gag ccg2006Asn Ser Leu Leu Ser Ala Lys Gly Phe Asp Ile Asp Tyr Gln Glu Pro515 520 525gaa aat ctc gag act gct ctt tat gtt gct tgc aag tta gac atc tat2054Glu Asn Leu Glu Thr Ala Leu Tyr Val Ala Cys Lys Leu Asp Ile Tyr530 535 540gag gcg gcc gaa tat cta gtt aaa cag ggt gca aat atg gaa ctt ggt2102Glu Ala Ala Glu Tyr Leu Val Lys Gln Gly Ala Asn Met Glu Leu Gly545 550 555gag aag ctt ttt ggc tgg acc cca atc ttt gcg gca gcg act gaa ggg2150Glu Lys Leu Phe Gly Trp Thr Pro Ile Phe Ala Ala Ala Thr Glu Gly560 565 570 575
tac gcg cgt atc gtc caa tta tta gtg gat cat ggg gcc aaa tat gat2198Tyr Ala Arg Ile Val Gln Leu Leu Val Asp His Gly Ala Lys Tyr Asp580 585 590ctt ttt gat gag agc ggt tgg aca cca atg gag cac gcg gct ctg cgg2246Leu Phe Asp Glu Ser Gly Trp Thr Pro Met Glu His Ala Ala Leu Arg595 600 605gga cat ttg gat atc tct caa ctc att cgc ata aca gat aat aaa gcg2294Gly His Leu Asp Ile Ser Gln Leu Ile Arg Ile Thr Asp Asn Lys Ala610 615 620atc act cgg ccg aag ttc gcc acc gac tgg aac aag tct acc aga cca2342Ile Thr Arg Pro Lys Phe Ala Thr Asp Trp Asn Lys Ser Thr Arg Pro625 630 635aca gaa acc acg aat ggt ttg tta tcc gca tta aca cca tca gaa tct2390Thr Glu Thr Thr Asn Gly Leu Leu Ser Ala Leu Thr Pro Ser Glu Ser640 645 650 655ggg tct aca acc acg ggc tcc gaa aac aag agc tct tct ttg aca cct2438Gly Ser Thr Thr Thr Gly Ser Glu Asn Lys Ser Ser Ser Leu Thr Pro660 665 670agc acc agc aat gaa atg tat gct ctg cca gca cgc tct tca acg tca2486Ser Thr Ser Asn Glu Met Tyr Ala Leu Pro Ala Arg Ser Ser Thr Ser675 680 685ata gac aag ata tct gaa cca aac aaa gga aac cac agg aag gtt ttg2534Ile Asp Lys Ile Ser Glu Pro Asn Lys Gly Asn His Arg Lys Val Leu690 695 700aag tcc cag cta agc cac ggt aag gta caa act att aag gac aca caa2582Lys Ser Gln Leu Ser His Gly Lys Val Gln Thr Ile Lys Asp Thr Gln705 710 715ttg ccg cag cag ccg att aag tct ttc ggt cat agc ttc ctg cag aaa2630Leu Pro Gln Gln Pro Ile Lys Ser Phe Gly His Ser Phe Leu Gln Lys720 725 730 735gac gag tct gtt atc ctt ttg act ttg ggc act aat gat aat cgc agt2678Asp Glu Ser Val Ile Leu Leu Thr Leu Gly Thr Asn Asp Asn Arg Ser740 745 750acc ata cct gct gtt tct ctg aat aag gtt cct gtt gct aag gct tcc2726Thr Ile Pro Ala Val Ser Leu Asn Lys Val Pro Val Ala Lys Ala Ser755 760 765tca acg gag cta gat aca gcg tta tct ttg ttg gtt aca tgc atg gat2774Ser Thr Glu Leu Asp Thr Ala Leu Ser Leu Leu Val Thr Cys Met Asp770 775 780aat ttg gat gca gaa cct gtt atg ctg gac ctt cca ttg cat gag aac2822Asn Leu Asp Ala Glu Pro Val Met Leu Asp Leu Pro Leu His Glu Asn785 790 795ttg gat tcg gtc act ttt aaa gtc cca tac aag aaa gat tcc tct tat2870Leu Asp Ser Val Thr Phe Lys Val Pro Tyr Lys Lys Asp Ser Ser Tyr800 805 810 815act ata ttt ttt gat atc gtt ccc acc tat ggc tat tca atg gca aac2918
Thr Ile Phe Phe Asp Ile Val Pro Thr Tyr Gly Tyr Ser Met Ala Asn820 825 830atg aac cgc gaa aat tcc tct ggt atg cat tcg aat gtt ggt aat agt 2966Met Asn Arg Glu Asn Ser Ser Gly Met His Ser Asn Val Gly Asn Ser835 840 845act ggc ccc gcg tac cta gac gca caa gtg ggc cag tgc ggc tct cgt 3014Thr Gly Pro Ala Tyr Leu Asp Ala Gln Val Gly Gln Cys Gly Ser Arg850 855 860tta cac tat gac cag ctt ggg aga gat aca cca aac act tac gat cag 3062Leu His Tyr Asp Gln Leu Gly Arg Asp Thr Pro Asn Thr Tyr Asp Gln865 870 875cgt tcg cgg cac caa gca tcc caa caa aag gaa caa att gcc acg aag 3110Arg Ser Arg His Gln Ala Ser Gln Gln Lys Glu Gln Ile Ala Thr Lys880 885 890 895aag caa agt aag ata tta ggg agg gca gtt gct tta ttg gac tcc gcg 3158Lys Gln Ser Lys Ile Leu Gly Arg Ala Val Ala Leu Leu Asp Ser Ala900 905 910cca act tcg gtg ggc ccc aac agg cgc tct att gcg gag gct atc act 3206Pro Thr Ser Val Gly Pro Asn Arg Arg Ser Ile Ala Glu Ala Ile Thr915 920 925ata cct atc att ggg agc gac aca ctt gaa gtc ctc ggg att att cga 3254Ile Pro Ile Ile Gly Ser Asp Thr Leu Glu Val Leu Gly Ile Ile Arg930 935 940ttt gac ttc ctc gta gtt act ccg ttt gtc cac aag aat tta tca gtt 3302Phe Asp Phe Leu Val Val Thr Pro Phe Val His Lys Asn Leu Ser Val945 950 955gga cct gct gaa acg tat tgg aaa tcg ctg gtt tcg acc cgg gtg atc 3350Gly Pro Ala Glu Thr Tyr Trp Lys Ser Leu Val Ser Thr Arg Val Ile960 965 970 975gga cac aga ggc ttg ggc aaa aac atg aac acg aac aag tcg ttg cag 3398Gly His Arg Gly Leu Gly Lys Asn Met Asn Thr Asn Lys Ser Leu Gln980 985 990ctt ggc gag aat acg gtg gag tcc ttt atc gca gct gcc tca ttg ggt 3446Leu Gly Glu Asn Thr Val Glu Ser Phe Ile Ala Ala Ala Ser Leu Gly995 10001005gcc tcg tat gtc gaa ttc gat gtc cag ttg aca aag gat aac att 3491Ala Ser Tyr Val Glu Phe Asp Val Gln Leu Thr Lys Asp Asn Ile101010151020ccc gtt gtg tac cac gat ttt ctt gtt gca gaa tcg ggt gtc gat 3536Pro Val Val Tyr His Asp Phe Leu Val Ala Glu Ser Gly Val Asp102510301035att ccc atg cat gag ctc act ttg gaa cag ttt ctc gat ctg aac 3581Ile Pro Met His Glu Leu Thr Leu Glu Gln Phe Leu Asp Leu Asn104010451050ggg gag cgt caa agg cat cag gac gcg aga gag gcc cac aga aac 3626Gly Glu Arg Gln Arg His Gln Asp Ala Arg Glu Ala His Arg Asn105510601065
cac agg agc ccg aac ggc aga cgc ttg tcc atg gat gac agc tct3671His Arg Ser Pro Asn Gly Arg Arg Leu Ser Met Asp Asp Ser Ser107010751080gct gag cta att aag cgg tcc ctg atg atg cgg ggc gat gaa gac3716Ala Glu Leu Ile Lys Arg Ser Leu Met Met Arg Gly Asp Glu Asp108510901095cgc aca gct aga gac ctt aac aca ata tac ggc gac cgt atg cgg3761Arg Thr Ala Arg Asp Leu Asn Thr Ile Tyr Gly Asp Arg Met Arg110011051110ctg acc aga acg ttc aag aag aat gcc ttc aaa gcc aac tcc agg3806Leu Thr Arg Thr Phe Lys Lys Asn Ala Phe Lys Ala Asn Ser Arg111511201125ggt cat gcc att gca tct agt ttt gtt acg cta aaa gag ctg ttc3851Gly His Ala Ile Ala Ser Ser Phe Val Thr Leu Lys Glu Leu Phe113011351140aag aag atc ccc cag aat gtt ggc ttc aac atc gag tgc aag tat3896Lys Lys Ile Pro Gln Asn Val Gly Phe Asn Ile Glu Cys Lys Tyr114511501155cca atg gta gac gag gcc gag gag gaa gac atc ggc ccg atc gcc3941Pro Met Val Asp Glu Ala Glu Glu Glu Asp Ile Gly Pro Ile Ala11601165 1170gtg gaa atg aac cat tgg atc gat acc gtg ctg gag gtt gtc tac3986Val Glu Met Asn His Trp Ile Asp Thr Val Leu Glu Val Val Tyr117511801185gac aac gtc gag ggc cgt gac gtc atc ttt tcg tcg ttt cag cca4031Asp Asn Val Glu Gly Arg Asp Val Ile Phe Ser Ser Phe Gln Pro119011951200gac gtg tgc ctc atg ctc tcc cta aag cag ccc tcc ttc ccg atc4076Asp Val Cys Leu Met Leu Ser Leu Lys Gln Pro Ser Phe Pro Ile120512101215ctg ttc cta acg gaa ggt ggg acc gcg aag cgc tgc gac atc cgc4121Leu Phe Leu Thr Glu Gly Gly Thr Ala Lys Arg Cys Asp Ile Arg122012251230gcg gcg tcg ctg cag aat gcc atc cgc ttc gcg cac cgc tgg aac4166Ala Ala Ser Leu Gln Asn Ala Ile Arg Phe Ala His Arg Trp Asn123512401245ctg ctg ggc atc gtc tcg gcc gcg gcg cca atc gtc atc gcg ccc4211Leu Leu Gly Ile Val Ser Ala Ala Ala Pro Ile Val Ile Ala Pro125012551260cgc ctg gcc cag atc gtc aag tcc agt ggc ctt gtg tgc gtg scg4256Arg Leu Ala Gln Ile Val Lys Ser Ser Gly Leu Val Cys Val Thr126512701275tac ggc gtc gag aac aac gac ccc gag atc gcc cgc gtc gag atg4301Tyr Gly Val Glu Asn Asn Asp Pro Glu Ile Ala Arg Val Glu Met128012851290gac gcc ggc gtc gac gcg gtc atc gtc gac agc gtg ctc gcg gtc4346
Asp Ala Gly Val Asp Ala Val Ile Val Asp Ser Val Leu Ala Val129513001305cgc aag ggc ctc acc cgc gag gca cag gac gcc gac acg ctc 4388Arg Lys Gly Leu Thr Arg Glu Ala Gln Asp Ala Asp Thr Leu131013151320taagaacaaa tcgtgattca ctaagcagaa gatatatcgt tatgtagagc ctgccgggtc4448ccaggctaat ccacccattg ccgtcacaaa atcgtaaccg agatgcgccg cccgtgcccc4508cgcgcgccgc cctgcagact cgcgcccgcg ctctgcatcg tcagcttctc caagctgact4568aacttgtcgg tcacgtgatc atccttgaac atttccccga tctggtgctt gcccgcgtca4628tccgtgaaca cctgcaacgt cttcgtctgc gccgcctcgt tgatgtggtg gtactcgtcc4688gggaagggct ggatgtgctc gaccgtcagt tcgttcaatt ggatgaactt catcactgtg4748aggttcgaca cctcgactgg aatattcgaa actatcacac tgtgcgccat ggggactctg4808tttgtactgc cgcccttgtt gcgccactga tgctgccacc gccacgtcca gcttatatac4868ccgcgtggaa agttgtcgaa ttgtgaaata gccgacgcta tcggtaccat ttacacc 4925<210>41<211>1321<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo56<400>41Met Lys Phe Gly Lys Thr Phe Pro Asn His Gln Val Pro Glu Trp Ala1 5 10 15His Lys Tyr Val Asn Tyr Lys Gly Leu Lys Lys Gln Ile Lys Glu Ile20 25 30Thr Leu Val Gln Asp Ala Leu Phe Arg Gln Glu Gln Gly Ala Ala Ser35 40 45Gln Asp Gly Pro Ala Arg Arg Arg Gly Arg Glu Ser Lys Glu Gln Tyr50 55 60Leu Gly His Pro Glu Val Lys Lys Leu Leu Ala Ala Phe Phe Phe Ala65 70 75 80Leu Asp Arg Asp Ile Glu Lys Val Asp Gly Phe Tyr Asn Met Gln Phe85 90 95Met Glu Tyr Asp Arg Arg Leu Arg Lys Leu Leu Ser Ser Ala Gln Leu100 105 110Ala Asp Ile Thr Ser Val Gln Arg Gly Ala Thr Gly Tyr Leu His Ala115 120 125Pro Leu Pro Gln Tyr Ile Ala Tyr Gly Glu Arg Glu Arg Asp Gly Leu
130 135 140Pro Glu Arg Tyr Val Pro Pro His Ala Thr Asp Met Ser Glu Asp Leu145 150 155 160Ala Glu Val Leu Thr Ile Leu Leu Glu Leu Arg Ser His Phe Arg Asn165 170 175Leu Lys Trp Tyr Gly Glu Leu Asn Lys Arg Ala Phe Thr Lys Ile Met180 185 190Lys Lys Leu Asp Lys Lys Val Gly Thr Asn Gln Gln His Ser Tyr Phe195 200 205Gln Ala Arg Ile Lys Pro Leu Glu Phe Ala Asp Asp Thr Pro Ile Val210 215 220Lys Ala Leu Ala Thr Ile Asn Glu Ile Leu Asp Arg Ile Ser Pro Cys225 230 235 240Val Lys Asp Leu Gln Asp Lys Leu Arg Gly Glu Asp Arg Arg Leu Leu245 250 255Gln Gly Ser Ser Ser Pro Ile Asp Val Ala Ser Gln Leu Val Thr Lys260 265 270Asp Asp Gly Ala Gly Leu Ile Asn Glu Leu Ile Ser Met Tyr Arg Ser275 280 285Val Val Leu Ile Pro Thr Arg Thr Leu Val Thr Leu Leu Asn Lys Ser290 295 300Ala Leu Ser Arg Ser Phe Ser Cys Val Asp Glu Ile Leu Gly Ile Ile305 310 315 320Pro Thr Leu Gly Asp Pro Ser Asp Ile Asn Gly Arg Asn Phe Phe His325 330 335His His Val Ile Ala Leu Gly Lys Lys Arg Thr Lys Ser Leu Glu Glu340 345 350Arg Asp Asn Ile Asn Ser Leu Leu Ser Asp Ser Leu Asp Leu Glu Ala355 360 365Ala Ile Pro Pro Glu Pro Asn Thr Arg Leu Val Gly Ala Phe Gly Pro370 375 380Asp Gly Val Asn Ser Asp Asp Ser Pro Ala Pro Leu Ser His Ile Leu385 390 395 400Gln Gln Leu Pro Ala His Leu Arg Pro Ser Leu Leu Gln Arg Asp Asn405 410 415Tyr Lys Arg Thr Pro Leu His Tyr Ser Ala Gln Tyr Gly Leu Cys Glu420 425 430Val Thr Arg Ile Ile Leu Gln Ala Leu Ser Glu Trp Asp Ala Trp Asn435 440 445Ala Asp Val Ala Ile Asp Asp Ile Asp Val Trp Gly Asp Ser Glu Asn450 455 460
Leu Thr Pro Leu His Leu Ala Val Ile Gly Thr His Pro Leu Thr Val465 470 475 480Ser Thr Leu Leu Ser Phe Met Asn Pro Glu Lys Ser Leu Asn Ser Pro485 490 495Arg Leu Leu His Leu Ala Thr Arg Leu Asn Ser Pro Ser Leu Leu Asn500 505 510Ser Leu Leu Ser Ala Lys Gly Phe Asp Ile Asp Tyr Gln Glu Pro Glu515 520 525Asn Leu Glu Thr Ala Leu Tyr Val Ala Cys Lys Leu Asp Ile Tyr Glu530 535 540Ala Ala Glu Tyr Leu Val Lys Gln Gly Ala Asn Met Glu Leu Gly Glu545 550 555 560Lys Leu Phe Gly Trp Thr Pro Ile Phe Ala Ala Ala Thr Glu Gly Tyr565 570 575Ala Arg Ile Val Gln Leu Leu Val Asp His Gly Ala Lys Tyr Asp Leu580 585 590Phe Asp Glu Ser Gly Trp Thr Pro Met Glu His Ala Ala Leu Arg Gly595 600 605His Leu Asp Ile Ser Gln Leu Ile Arg Ile Thr Asp Asn Lys Ala Ile610 615 620Thr Arg Pro Lys Phe Ala Thr Asp Trp Asn Lys Ser Thr Arg Pro Thr625 630 635 640Glu Thr Thr Asn Gly Leu Leu Ser Ala Leu Thr Pro Ser Glu Ser Gly645 650 655Ser Thr Thr Thr Gly Ser Glu Asn Lys Ser Ser Ser Leu Thr Pro Ser660 665 670Thr Ser Asn Glu Met Tyr Ala Leu Pro Ala Arg Ser Ser Thr Ser Ile675 680 685Asp Lys Ile Ser Glu Pro Asn Lys Gly Asn His Arg Lys Val Leu Lys690 695 700Ser Gln Leu Ser His Gly Lys Val Gln Thr Ile Lys Asp Thr Gln Leu705 710 715 720Pro Gln Gln Pro Ile Lys Ser Phe Gly His Ser Phe Leu Gln Lys Asp725 730 735Glu Ser Val Ile Leu Leu Thr Leu Gly Thr Asn Asp Asn Arg Ser Thr740 745 750Ile Pro Ala Val Ser Leu Asn Lys Val Pro Val Ala Lys Ala Ser Ser755 760 765Thr Glu Leu Asp Thr Ala Leu Ser Leu Leu Val Thr Cys Met Asp Asn770 775 780
Leu Asp Ala Glu Pro Val Met Leu Asp Leu Pro Leu His Glu Asn Leu785 790 795 800Asp Ser Val Thr Phe Lys Val Pro Tyr Lys Lys Asp Ser Ser Tyr Thr805 810 815Ile Phe Phe Asp Ile Val Pro Thr Tyr Gly Tyr Ser Met Ala Asn Met820 825 830Asn Arg Glu Asn Ser Ser Gly Met His Ser Asn Val Gly Asn Ser Thr835 840 845Gly Pro Ala Tyr Leu Asp Ala Gln Val Gly Gln Cys Gly Ser Arg Leu850 855 860His Tyr Asp Gln Leu Gly Arg Asp Thr Pro Asn Thr Tyr Asp Gln Arg865 870 875 880Ser Arg His Gln Ala Ser Gln Gln Lys Glu Gln Ile Ala Thr Lys Lys885 890 895Gln Ser Lys Ile Leu Gly Arg Ala Val Ala Leu Leu Asp Ser Ala Pro900 905 910Thr Ser Val Gly Pro Asn Arg Arg Ser Ile Ala Glu Ala Ile Thr Ile915 920 925Pro Ile Ile Gly Ser Asp Thr Leu Glu Val Leu Gly Ile Ile Arg Phe930 935 940Asp Phe Leu Val Val Thr Pro Phe Val His Lys Asn Leu Ser Val Gly945 950 955 960Pro Ala Glu Thr Tyr Trp Lys Ser Leu Val Ser Thr Arg Val Ile Gly965 970 975His Arg Gly Leu Gly Lys Asn Met Asn Thr Asn Lys Ser Leu Gln Leu980 985 990Gly Glu Asn Thr Val Glu Ser Phe Ile Ala Ala Ala Ser Leu Gly Ala995 10001005Ser Tyr Val Glu Phe Asp Val Gln Leu Thr Lys Asp Asn Ile Pro101010151020Val Val Tyr His Asp Phe Leu Val Ala Glu Ser Gly Val Asp Ile102510301035Pro Met His Glu Leu Thr Leu Glu Gln Phe Leu Asp Leu Asn Gly104010451050Glu Arg Gln Arg His Gln Asp Ala Arg Glu Ala His Arg Asn His105510601065Arg Ser Pro Asn Gly Arg Arg Leu Ser Met Asp Asp Ser Ser Ala107010751080Glu Leu Ile Lys Arg Ser Leu Met Met Arg Gly Asp Glu Asp Arg108510901095Thr Ala Arg Asp Leu Asn Thr Ile Tyr Gly Asp Arg Met Arg Leu110011051110
Thr Arg Thr Phe Lys Lys Asn Ala Phe Lys Ala Asn Ser Arg Gly111511201125His Ala Ile Ala Ser Ser Phe Val Thr Leu Lys Glu Leu Phe Lys113011351140Lys Ile Pro Gln Asn Val Gly Phe Asn Ile Glu Cys Lys Tyr Pro114511501155Met Val Asp Glu Ala Glu Glu Glu Asp Ile Gly Pro Ile Ala Val116011651170Glu Met Asn His Trp Ile Asp Thr Val Leu Glu Val Val Tyr Asp117511801185Asn Val Glu Gly Arg Asp Val Ile Phe Ser Ser Phe Gln Pro Asp119011951200Val Cys Leu Met Leu Ser Leu Lys Gln Pro Ser Phe Pro Ile Leu120512101215Phe Leu Thr Glu Gly Gly Thr Ala Lys Arg Cys Asp Ile Arg Ala122012251230Ala Ser Leu Gln Asn Ala Ile Arg Phe Ala His Arg Trp Asn Leu123512401245Leu Gly Ile Val Ser Ala Ala Ala Pro Ile Val Ile Ala Pro Arg125012551260Leu Ala Gln Ile Val Lys Ser Ser Gly Leu Val Cys Val Thr Tyr126512701275Gly Val Glu Asn Asn Asp Pro Glu Ile Ala Arg Val Glu Met Asp128012851290Ala Gly Val Asp Ala Val Ile Val Asp Ser Val Leu Ala Val Arg129513001305Lys Gly Leu Thr Arg Glu Ala Gln Asp Ala Asp Thr Leu131013151320<210>42<211>1078<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo167<220>
<221>misc_feature<222>(436)..(436)<223>未知核苷酸<220>
<221>misc_feature<222>(584)..(584)
<223>未知核苷酸<400>42gatccttcga gcgtagacga agaaaaggtc aaacgcctga aatcgacctt taccttttag 60ctctcaacta atccggtcgt tatcaatcgt gtaattctat accttaaata gactacctaa120ccagcacgca gtgtcccata cagggcttgc agtatggtgc ctaggtctca ttcgttgtat180tcttttgctc tgcagctttc ctttgggccc atgcagcgta agccctgccg ttcgcaatca240acggattatc atgcttgaaa tagtatgggc cagagagcgc tgaatattgt ctcttgtcta300agttatacac tctttccatt tcttccttat agacgtcctc gataatttta acatctccct360catctatctt cgtgttgttg gaggcggtgt ataaatctgc atcgaatggc cgaatgcaat420tgccgacata gaaganggtg gatgtgtgcc cctcacccaa ttcaaactcg gatttggggt480tacgcamccg ccctagatgt tccataagcc gccgtgctag ctgcggatgg tctggctgct540gcttttgctg atgtggcctg tcactctctg tttcctctcc accntgagac gccatagatg600gcccaacaga gtttcgtggc acgtcaatcc ctccgtctca tggctggtta tgcgtcgcag660tccggaatgg ggacagttat atacgcagca aactgcagat cgacccacgc ggcctgtgcc720cacgacacac attaccgtag tcgcaggcgc ttatgctcac aaaagaaagc cctgtatata780aggtcctaat tatatagagc tcttacaaca ctttctgttt catgaagaag gtgcgcaggt840ggttgacctg ccagaagcat gtgccgccaa gcacaaacaa cgtcatgacc gcacaccata900caacccacga attggcgctc tcggacgcat ctgcggaatt gggcctccct ctcactgcac960caacctgctg ctctgttgct ggatcgcctt caccttctcg ccgagctgta gcacgcgcga 1020atgcaggtac tgcagcttgt ccttcttctt gggatccagc agtaggtccg atccgatc 1078<210>43<211>42<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo167<400>43Asp Ala Ser Glu Ser Ala Asn Ser Trp Val Val Trp Cys Ala Val Met1 5 10 15Thr Leu Phe Val Leu Gly Gly Thr Cys Phe Trp Gln Val Asn His Leu20 25 30Arg Thr Phe Phe Met Lys Gln Lys Val Leu35 40
<210>44<211>2549<212>DNA<213>棉桃阿舒氏囊霉<220>
<221>CDS<222>(563)..(1216)<223>
<220>
<221>misc_feature<223>Oligo167<400>44tatgccccgc ggctgcgggc ccgccagcac ccggcacatc caaaccggcc catcaaacat 60gtactcctgg ttctgccgcc ccaccgccgc gaggtcccac atcttcactc tccaatcccg120cgagctgctc cataggtacc gtccacattg cgaccacgcc accgactgca ccgctcgtac180atggccgccc ccatggtttc ccagcaccga aataggcttc ttcgtatcca tgtcgtagat240caccagagac ccgttggagc atccaactgc caggtagtca ccgcctgggc tgaactccag300acaatcgcat tgcagcggga tttcaaacgt atatgttagc gtctcagggt attccttcag360tacactgaat ggatcctgca acaaccgatt tgccatcgcc ccttccccgc ctccaagcct420ccaacctgat gctttcctcc aggctgtacc tggaaagtaa aaaaaaattc gaacagcgaa480ccagatatgg acaccgaatt gaagatcttg ttccccctgg aatctcagta tatcgatcga540tcaggcgctg aaggcttcca gg atg aac ttg aag aca ttt tta cag gta ctg 592Met Asn Lau Lys Thr Phe Leu Gln Val Lau1 5 10gtg ctc ggc atg ttg ccg ttg cag gtc agt ggg ttc tac ttc tat gtc 640Val Leu Gly Met Leu Pro Leu Gln Val Ser Gly Phe Tyr Phe Tyr Val15 20 25aat ggt gga gac cgt aag tgc ttc cac agt gaa tta atg aaa gat gcg 688Asn Gly Gly Asp Arg Lys Cys Phe His Ser Glu Leu Met Lys Asp Ala30 35 40gtt ttg aac ctg aag tac aac gtg caa tcg tac gac tcc cag tct gga 736Val Leu Asn Leu Lys Tyr Asn Val Gln Ser Tyr Asp Ser Gln Ser Gly45 50 55acg tac cgg gac atg cgg gac ggt gaa cta atg atg atg atc gac ata 784Thr Tyr Arg Asp Met Arg Asp Gly Glu Leu Met Met Met Ile Asp Ile60 65 70gag gag gtg ttt gac gac aac cac cgt gtt atg cac cag aaa ttg ccg 832Glu Glu Val Phe Asp Asp Asn His Arg Val Met His Gln Lys Leu Pro75 80 85 90gcg tac ggt aca act acg ttc aac gcg gtt gac tct ggc gag cac aag 880Ala Tyr Gly Thr Thr Thr Phe Asn Ala Val Asp Ser Gly Glu His Lys95 100 105gtt tgc gtt cag ccg cag ttc cag ggg tgg atg gcg cgc acc aag aca 928
Val Cys Val Gln Pro Gln Phe Gln Gly Trp Met Ala Arg Thr Lys Thr110 115 120aag atc acg ctt gac ttt gag atc gga tcg gac cta ctg ctg gat ccc 976Lys Ile Thr Leu Asp Phe Glu Ile Gly Ser Asp Leu Leu Leu Asp Pro125 130 135aag aag aag gac aag ctg cag tac ctg cat tcg cgc gtg cta cag ctc 1024Lys Lys Lys Asp Lys Leu Gln Tyr Leu His Ser Arg Val Leu Gln Leu140 145 150ggc gag aag gtg aag gcg atc cgc aac gag cag cgg ttg gtg cgt gag 1072Gly Glu Lys Val Lys Ala Ile Arg Asn Glu Gln Arg Leu Val Arg Glu155 160 165 170agg gag gcc caa ttc cgc gat gcg tcc gag agc gcc aat tcg tgg gtt 1120Arg Glu Ala Gln Phe Arg Asp Ala Ser Glu Ser Ala Asn Ser Trp Val175 180 185gta tgg tgt gcg gtc atg acg ttg ttt gtg ctt ggc ggc aca tgc ttc 1168Val Trp Cys Ala Val Met Thr Leu Phe Val Leu Gly Gly Thr Cys Phe190 195 200tgg cag gtc aac cac ctg cgc acc ttc ttc atg aaa cag aaa gtg ttg 1216Trp Gln Val Asn His Leu Arg Thr Phe Phe Met Lys Gln Lys Val Leu205 210 215taagagctct atataattag gaccttatat acagggcttt cttttgtgag cataagcgcc1276tgcgactacg gtaatgtgtg tcgtgggcac aggccgcgtg ggtcgatctg cagtttgctg1336cgtatataac tgtccccatt ccggactgcg acgcataacc agccatgaga cggagggatt1396gacgtgccac gaaactctgt tgggccatct atggcgtctc agggtggaga ggaaacagag1456agtgacaggc cacatcagca aaagcagcag ccagaccatc cgcagctagc acggcggctt1516atggaacatc tagggcggtt gcgtaacccc aaatccgagt ttgaattggg tgaggggcac1576acatccaccc tcttctatgt cggcaattgc attcggccat tcgatgcaga tttatacacc1636gcctccaaca acacgaagat agatgaggga gatgttaaaa ttatcgagga cgtctataag1696gaagaaatgg aaagagtgta taacttagac aagagacaat attcagcgct ctctggccca1756tactatttca agcatgataa tccgttgatt gcgaacggca gggcttacgc tgcatgggcc1816caaaggaaag ctgcagagca aaagaataca acgaatgaga cctagcacca tacgcaagcc1876ctgtatggga cactgcgtgc tggttaggta gtctatttaa ggtatagaat tacacgattg1936ataacgaccg gattagttga gagctaaaag gtaaaggtcg atttcaggcg tttgaccttt1996tcttcgtcta cgctcgaagg atcaatccca gatacaggta aggttccgaa gtcaaagtgg2056aacggaaccg cttcggcaga tgctgcagtg ttctctgcaa atgaggagtc atccttgggt2116aagtcaggtt tcgagaagga aaatgcaaag ggggtgcggg atgtcgtatt gtgcttatct2176tcacttttat gaacttggga gactttctga atgccattag aaaaattgaa cgacccattc2236gactgcaatg agctccccga tatgttattc tccatgggcc cgttaagagt agctccgtgg2296
gtattagatt cctctacttt ggccagaggt tgaaacgaaa atgtgctggt tgcatcaggt2356atagtgtgtg gcttctcaga caaagtatcc acattgtggt ctttgggctt ttggaaagaa2416aagttaaatt tagagctctg tggaacaggc tgccgaggcg acttttcagg cgacttttca2476acagtcacct caacgcgcca gcgatgaagg cctggaaggt ttaaacccgg acactggttg2536tgtagcatga gga 2549<210>45<211>218<212>PRT<213>棉桃阿舒氏囊霉<220>
<221>misc_feature<223>Oligo167<400>45Met Asn Leu Lys Thr Phe Leu Gln Val Leu Val Leu Gly Met Leu Pro1 5 10 15Leu Gln Val Ser Gly Phe Tyr Phe Tyr Val Asn Gly Gly Asp Arg Lys20 25 30Cys Phe His Ser Glu Leu Met Lys Asp Ala Val Leu Asn Leu Lys Tyr35 40 45Asn Val Gln Ser Tyr Asp Ser Gln Ser Gly Thr Tyr Arg Asp Met Arg50 55 60Asp Gly Glu Leu Met Met Met Ile Asp Ile Glu Glu Val Phe Asp Asp65 70 75 80Asn His Arg Val Met His Gln Lys Leu Pro Ala Tyr Gly Thr Thr Thr85 90 95Phe Asn Ala Val Asp Ser Gly Glu His Lys Val Cys Val Gln Pro Gln100 105 110Phe Gln Gly Trp Met Ala Arg Thr Lys Thr Lys Ile Thr Leu Asp Phe115 120 125Glu Ile Gly Ser Asp Leu Leu Leu Asp Pro Lys Lys Lys Asp Lys Leu130 135 140Gln Tyr Leu His Ser Arg Val Leu Gln Leu Gly Glu Lys Val Lys Ala145 150 155 160Ile Arg Asn Glu Gln Arg Leu Val Arg Glu Arg Glu Ala Gln Phe Arg165 170 175Asp Ala Ser Glu Ser Ala Asn Ser Trp Val Val Trp Cys Ala Val Met180 185 190Thr Leu Phe Val Leu Gly Gly Thr Cys Phe Trp Gln Val Asn His Leu195 200 205
Arg Thr Phe Phe Met Lys Gln Lys Val Leu210 21权利要求
1.可自棉桃阿舒氏囊霉分离的多核苷酸,其编码与跨膜转运相关的蛋白和/或跨膜蛋白。
2.权利要求1的多核苷酸,其与跨膜转运相关和/或为跨膜蛋白并具有表1所示的结构和/或功能特性。
3.包含SEQ ID NO1,5,10,14,19,23,28,33,37或42所示的核酸序列并优选自棉桃阿舒氏囊霉中分离的权利要求1或2的多核苷酸;其互补多核苷酸;以及通过遗传密码简并性衍生自这些多核苷酸的序列。
4.权利要求4的多核苷酸,其包含SEQ ID NO3,8,12,17,21,26,31,35,40或44显示的核酸序列或其片段。
5.寡核苷酸,其可以与任一前述权利要求的多核苷酸杂交,且尤其是在严格的条件下杂交。
6.多核苷酸,其可以与权利要求5的寡核苷酸杂交,且尤其是在严格的条件下杂交,并编码阿舒氏囊霉属微生物的基因产物或该基因产物的功能等价物。
7.多肽及其功能等价物,特别是具有权利要求2所述的结构和/或功能特性之一的功能等价物,其中,所述多肽由包含权利要求1至4中任意一项的核酸序列或其片段的多核苷酸编码,或由权利要求6的多核苷酸编码;或具有包含SEQ ID NO2,4,6,7,9,11,13,15,16,18,20,22,24,27,29,30,32,34,36,38,39,41,43或SEQ ID NO45中所示的至少10个连续氨基酸残基的氨基酸序列。
8.包含权利要求1至6中任意一项的核酸序列的表达盒,其中,所述核酸序列与至少一个调节核酸序列可操作地连接。
9.包含至少一个权利要求8的表达盒的重组载体。
10.由至少一个权利要求9的载体转化的原核或真核宿主。
11.原核或真核宿主,在该宿主中,至少一个编码权利要求7的多肽的基因的功能性表达受到调节;或权利要求7的多肽的生物活性被降低或增加。
12.权利要求10或11的宿主,其来自阿舒氏囊霉属。
13.权利要求8的表达盒、权利要求9的载体或权利要求10至12之任一项的宿主在维生素B2和/或其前体和/或其衍生物的微生物生产中的用途。
14.权利要求8的表达盒、权利要求9的载体或权利要求10至12之任一项的宿主在权利要求7的多肽的重组生产中的用途。
15.检测可以用于调节维生素B2和/或其前体和/或其衍生物的微生物生产的效应物靶点的方法,其中,用效应物处理能够通过微生物法生产维生素B2和/或其前体和/或其衍生物的微生物,所述效应物可以与选自权利要求7的多肽或其核酸编码序列的靶点相互作用,尤其是结合;验证效应物对微生物法生产的维生素B2和/或其前体和/或其衍生物的产量的影响;并且适当时分离该靶点。
16.调节维生素B2和/或其前体和/或其衍生物的微生物生产的方法,其中,用效应物处理能够以微生物法生产维生素B2和/或其前体和/或其衍生物的微生物,所述效应物可以与选自权利要求7的多肽或其核酸编码序列的靶点相互作用。
17.针对选自权利要求7的多肽或其核酸编码序列的靶点的效应物,其中所述效应物选自a)抗体或其抗原结合片段;b)可以与权利要求7的多肽相互作用的不同于a)的多肽配体;c)可以调节权利要求7的多肽的生物活性的低分子量效应物;d)反义核酸序列。
18.微生物生产维生素B2和/或其前体和/或其衍生物的方法,其中在利于产生维生素B2和/或其前体和/或其衍生物的条件下培养权利要求10至12之任一项的宿主,自培养混合物中分离所需的产物。
19.权利要求18的方法,其中用权利要求17的效应物在培养前和/或培养过程中处理宿主。
20.权利要求18或19的方法,其中宿主选自阿舒氏囊霉属微生物。
21.权利要求18至20之任一项的方法,其中微生物为权利要求10至12之任一项的宿主。
22.权利要求1至4和6之任一项的多核苷酸或权利要求7的多肽作为靶点在调节阿舒氏囊霉属微生物的维生素B2和/或其前体和/或其衍生物的生产中的用途。
23.权利要求1至4和6之任一项的多核苷酸或权利要求7的多肽作为靶点在培养阿舒氏囊霉属微生物生产维生素B2和/或其前体和/或其衍生物的过程中的用途,用于调节阿舒氏囊霉属微生物的跨膜转运、跨膜蛋白活性或与之相关的后续状态。
24.权利要求12的宿主,其具有增强的对外界条件的细胞应答。
全文摘要
本发明涉及来自棉桃阿舒氏囊霉的新颖多核苷酸;与之杂交的寡核苷酸;包含这些多核苷酸的表达盒和载体;用其转化的微生物;由这些多核苷酸编码的多肽;及该新颖多肽和多核苷酸作为靶点在改善阿舒氏囊霉属微生物的跨膜转运,且尤其是改善阿舒氏囊霉属微生物的维生素B2生产中的用途。
文档编号C12N15/31GK1553956SQ02817625
公开日2004年12月8日 申请日期2002年8月9日 优先权日2001年8月10日
发明者M·考罗什, H·阿尔特赫费, B·克勒格尔, J·L·雷韦尔塔多瓦尔, M 考罗什, 崭穸 , 睾辗, 雷韦尔塔多瓦尔 申请人:巴斯福股份公司