本发明属于微生物生物化学的领域,更具体而言,属于通过微生物酶合成间苯三酚的领域。本发明涉及来自细菌(特别是来自放线菌属细菌)的iii型聚酮合酶作为间苯三酚合酶的用途。
背景技术:
间苯三酚是一种芳香族有机化合物,特别用于医药产品和爆炸物的生产中。
间苯三酚合成被称为间苯三酚合酶的iii型聚酮合酶催化。根据以下反应流程,间苯三酚合酶进行三个丙二酰基-coa分子的缩合反应,从而形成间苯三酚分子(反应i):
随后可以从间苯三酚合成许多低聚物,例如褐藻多酚。褐藻多酚具体包括多羟基联苯(fucols)、根皮素(phloretol)和岩藻糖根皮素(fucophloretol),它们是由间苯三酚衍生的产物,其构成褐藻的壁。另外,褐藻的各种保护活性也归因于褐藻多酚。
目前,仅在革兰氏阴性荧光假单胞菌细菌(achkar等人,2005;zha等人,2006)和褐藻外子藻(ectocarpussiliculosus)(meslet-cladière等人,2013)中描述了间苯三酚的合成。在这两个物种中已鉴定出参与间苯三酚合成的间苯三酚合酶。它们是迄今为止鉴定和表征的仅有的两种间苯三酚合酶。
在荧光假单胞菌中,间苯三酚合酶由phld基因编码(achkar等人,2005;zha等人,2006)。
在外子藻中,间苯三酚合酶由pks1基因编码(meslet-cladière等人,2013)。
有可能在表达异源phld基因的大肠杆菌(escherichiacoli)中证明phld间苯三酚合酶的活性(achkar等人,2005)。通过用从大肠杆菌培养物中表达和纯化的重组phld进行的小规模酶学测试,已在体外证实了这种活性(zha等人,2006)。
已经在体外通过大肠杆菌中表达和纯化的重组pks1以及外子藻(e.siliculosus)的细胞提取物证明了pks1间苯三酚合酶的活性(meslet-cladière等人,2013,wo2013/045510)。
但是,phld和pks1酶表现出较低的酶活性。另外,尚未证明使用这些酶在体外大规模合成间苯三酚的可能性。最后,在这些研究中使用的间苯三酚合酶是由大肠杆菌或荧光假单胞菌细菌产生的。因此,当这些酶由真核生物(例如酵母或昆虫或哺乳动物细胞)产生时,其活性是未知的。然而,真核系统可能是有利的,特别是对于大规模生产。实际上,它们使获得在翻译后水平上修饰的酶成为可能。
因此,仍然需要鉴定在体外或体内具有高间苯三酚合酶活性的新的间苯三酚合酶,其适于工业规模生产并且可以通过真核系统来生产。
然而,聚酮合酶的确切功能表征由于以下事实而变得复杂:该类酶将具有大的序列相似性的蛋白质汇集在一起,而他们可以催化基本不同的反应并识别完全不同的底物。
尽管存在这些困难,本发明人仍能够鉴定出细菌中存在的并具有间苯三酚合酶活性的多肽。因此,已经鉴定出新的间苯三酚合酶,特别是在革兰氏阳性细菌中。它们构成了这种类型细菌中间苯三酚合酶的第一个示例。发明人在此证明这些新的间苯三酚合酶表现出高的间苯三酚合成活性。因此,它们适合于工业规模的生产。此外,当在真核系统中产生时,它们是有功能的。
技术实现要素:
在本发明的上下文中,发明人完全出乎意料地证明,除了荧光假单胞菌外,细菌在其基因组中包含编码具有功能性间苯三酚合酶活性的iii型聚酮合酶的基因。
因此,本发明涉及选自细菌的iii型聚酮合酶,特别是来自革兰氏阳性细菌的iii型聚酮合酶,特别是来自放线菌属细菌的iii型聚酮合酶的多肽,其可以用作间苯三酚合酶。
本发明还涉及分离的核酸分子,其编码来自细菌的间苯三酚合酶,特别是编码来自革兰氏阳性细菌的间苯三酚合酶,特别是编码来自放线菌属细菌的iii型聚酮合酶,并且还涉及由此编码的间苯三酚合酶。
本发明还涉及包含至少一个编码这种间苯三酚合酶的分离的核酸分子的载体。
本发明还涉及包含至少一个根据本发明的分离的核酸分子或至少一个载体的宿主细胞。
本发明还涉及生产功能性间苯三酚合酶的方法。
本发明还涉及生产间苯三酚的方法。
附图说明
图1显示了鉴定的候选酶的蛋白质序列比对。使用clustalw软件将十种选定的酶与酶pks1.es(phld.es)进行比对。
图2显示了在丙基五氟苯基(pfp)柱上间苯三酚/间苯二酚分离的实例。
图3显示了为给定候选物(phld.ii)构建的基因单元结构的实例,这使得可以在酵母酿酒酵母中表达phld基因。
图4显示了在存在20g.l-1的乙醇作为碳源、在30℃下在24孔板中培养48小时后,在adh2启动子控制下表达各种候选基因phld.ii和对照phld.pf和pks1.es基因(几个拷贝)的酵母菌株中间苯三酚的生产水平。(a)各种测得数据的总结。(b)在600nm(do600)下测得的各种培养物的光密度(do),表明每种菌株的生长水平。(c)在培养基中测得的间苯三酚生产水平(以mg.l-1计)。(d)相对于整合到基因组中的基因拷贝数归一化的间苯三酚的生产水平(以mg.1-1计)。
图5显示了在jlp1基因座上整合到酵母基因组中的基因构建体的结构。编码每个phld/pks1的基因在padh2启动子或pccw12启动子的控制下。
图6显示了在存在20g.l-1的乙醇作为碳源、在30℃下在24孔板中培养48小时后,在adh2启动子控制下表达各种phld.ii基因(仅1个拷贝)的酵母菌株中间苯三酚的生产水平。(a)各种测得数据的总结。(b)在600nm(do600)下测得的各种培养物的光密度(do),表明每种菌株的生长水平。(c)在培养基中测得的间苯三酚生产水平(以mg.l-1计)。
图7显示了在存在20g.l-1的葡萄糖作为碳源、在30℃下在24孔板中培养48小时后,在ccw12启动子控制下表达各种phld基因(仅1个拷贝)的酵母菌株中间苯三酚的生产水平。(a)各种测得数据的总结。(b)在600nm(do600)下测得的各种培养物的光密度(do),表明每种菌株的生长水平。(c)在培养基中测得的间苯三酚生产水平(以mg.l-1计)。
具体实施方式
定义
术语“iii型聚酮合酶”旨在表示产生聚酮的多功能酶或酶复合物,并且不使用酰基载体蛋白(或acp)结构域。
术语“聚酮”旨在表示细菌、霉菌、植物和某些动物品系中一个大的次级代谢产物家族,其源自聚酮合酶对乙酰基或丙二酰亚基的反复缩合。聚酮还用作生产各种天然和半合成产品的起始原料。
术语“间苯三酚”旨在表示具有以下化学式(式i)的芳香族有机化合物苯-1,3,5-三醇:
术语“间苯三酚合酶”旨在表示属于iii型聚酮合酶家族并且催化间苯三酚合成的多功能酶或酶复合物。间苯三酚合酶催化三个丙二酰基-coa分子的缩合,从而形成间苯三酚分子。
术语酶的“酶活性”或“催化活性”或“活性”旨在表示在给定环境中将底物转化为产物的酶的效率。酶的效率在本文中考虑了酶将底物转化为产物的速率和酶将底物转化为产物的程度。表述“酶将底物转化为产物的程度”在此旨在表示对于限定量的酶,获得的最终产物的量相对于底物的初始量之间的比率。例如,出于本发明的目的,酶活性可以表示为在给定体积中生产的间苯三酚的量(以g/l计)。
术语“细菌”旨在表示存在于所有介质中的微观和原核生物。
术语“革兰氏+细菌”或“革兰氏阳性细菌”旨在表示在革兰氏染色时呈阳性的细菌(也就是说,保留龙胆紫,也称为结晶紫,并保持淡紫色或蓝黑紫色)。
术语“放线菌属细菌”或“革兰氏+放线菌属细菌”或“gram阳性放线菌属细菌”意指属于放线菌纲中放线菌目的细菌,其对于革兰氏染色是阳性的。放线菌是细菌,其生长会产生由菌丝组成的菌落,也就是说,菌丝在产生它们的微生物周围离心生长辐射。
术语“冢卡氏菌属”旨在表示冢卡氏菌属的杆状、必须需氧的、无孢子放线菌属细菌。冢卡氏菌属特别地包括以下菌种:微变冢卡氏菌(tsukamurellapaurometabola)(以下也称为tp)、溶酪氨酸冢卡氏菌(tsukamurellatyrosinosolvens)(以下也称为tt)、假单胞冢卡氏菌(tsukamurellapseudospumae)(以下也称为tps)、肺冢卡氏菌(tsukamurellapulmonis)(以下也称为tpu)和冢卡氏菌属1534(以下也称为tsp)。
术语“诺卡氏菌属”旨在表示诺卡氏菌属的丝状放线菌属细菌。诺卡氏菌属特别地包括物种皮诺卡氏菌(nocardiafarcinica)(以下也称为nf)。
术语“分枝杆菌属(mycobacteriumsp.)”旨在表示分枝杆菌属的呈杆状、无孢子、需氧的放线菌属细菌。分枝杆菌属特别地包括菌种海分枝杆菌、堪萨斯分枝杆菌和结核分枝杆菌(以下也分别称为mma、mk和mt)。
术语“戈登菌属”旨在表示戈登菌属的放线菌属细菌。戈登菌属特别地包括菌种疏水性戈登菌(以下也称为gh)。
术语“假单胞菌属”旨在表示革兰氏阴性(gram-)细菌,其不形成孢子(或无孢子),其为杆状形式、必须需氧的假单胞菌属。假单胞菌属特别地包括荧光假单胞菌种(以下也称为pf)。
术语“外子藻菌属(ectocarpussp.)”旨在表示属于外子藻科(ectocarpaceae)、褐藻纲(classe)的外子藻菌属。外子藻菌属特别地包括菌种外子藻(ectocarpussiliculosus)。
术语“phld.pf”旨在无区别地表示编码荧光假单胞菌的phld间苯三酚合酶的基因,或由该基因编码的多肽。
术语“pks1.es”或“phld.es”旨在无区别地表示编码外子藻的pks1间苯三酚合酶的基因或由该基因编码的多肽。
术语“phld”或“phld”在本文中表示编码候选间苯三酚合酶的候选基因,或由该基因编码的多肽。根据发明人选择的命名法,术语“phld.ii”或“phld.ii”在这里表示来自给定生物体的候选基因或候选多肽。字母“ii”代表所述生物体所属的属和菌种。
术语“核酸分子”旨在表示任何长度的脱氧核糖核酸(adn)或多脱氧核糖核苷酸的聚合物,特别是包括互补adn或adnc、基因组adn、质粒、载体、病毒基因组、分离的adn、探针、引物及其任何混合物;或任何长度的核糖核酸(arn)或多核糖核苷酸的聚合物,尤其包括信使arn或arnm、反义arn;或混合的多核糖-多脱氧核糖核苷酸。它们涵盖单链或双链、线性或环状以及天然或合成的多核苷酸。另外,多核苷酸可以包含非天然核苷酸,并且可以被非核苷酸组分中断。在本发明的上下文中,术语“核酸”、“核酸分子”、“多核苷酸”和“核苷酸序列”可互换使用。
术语“分离的分子”旨在表示从其天然环境中提取的分子,特别是蛋白质、多肽、肽、核酸分子、质粒载体、病毒载体或宿主细胞(也就是说,从与其天然相关的至少一个其他组分中分离)。
术语“多肽”、“蛋白质”和“肽”旨在表示氨基酸残基的聚合物,其包含通过肽键结合的至少九个氨基酸。该聚合物可以是直链、支链或环状的。该聚合物可以包含天然氨基酸和/或氨基酸类似物,并且其可以被非氨基酸残基中断。作为一般说明并且不将其束缚于本申请中,如果氨基酸聚合物包含多于50个氨基酸残基,则其优选地称为多肽或蛋白质,而如果该聚合物由50个或更少氨基酸组成,则优选地其被称为“肽”。
术语“载体”旨在表示载体,优选核酸分子或病毒颗粒,其包含使一个或多个核酸分子能够被施用于宿主细胞或生物体、在宿主细胞或生物体中传播和/或在宿主细胞或生物体中表达所需的元件。
从功能的角度来看,该术语涵盖维持载体(克隆载体)、在各种宿主细胞或生物体中表达的载体(表达载体)、染色体外载体(例如多拷贝质粒)或整合载体(例如设计用于整合入宿主细胞的基因组,并且当宿主细胞复制时产生其包含的核酸分子的其他副本)。该术语还涵盖穿梭载体(例如,其在原核宿主和/或真核宿主中均起作用)和转移载体(例如,用于将核酸分子转移至宿主细胞的基因组中)。
从结构的角度来看,根据本发明的载体可以是天然的、合成的或人工的遗传来源,或天然和人工的遗传元件的组合。
因此,在本发明的上下文中,术语“载体”应被广义地理解,同时包括质粒载体(或质粒)和病毒载体。
如本文所用,“质粒”表示可复制的adn构建体。通常,质粒载体包含选择性标记基因,其允许在存在对应于选择性标记物的化合物时鉴定和/或选择携带质粒的宿主细胞为阳性或阴性。多种阳性和阴性选择性标记基因是本领域已知的。通过举例说明,可以将抗生素抗性基因用作阳性选择性标记基因,用于在存在相应抗生素时选择宿主细胞。
如本文所用,术语“病毒载体”是指包含病毒基因组的至少一种元件并且可以包装在病毒颗粒或病毒颗粒中的核酸载体。病毒载体可以是具有复制能力的或选择性的(例如,设计成在特定宿主细胞中更好地或选择性地复制),或者可以是基因失活的,从而是复制缺陷或不足的。
术语“宿主细胞”旨在表示包含根据本发明的核酸分子的细胞。有利地,宿主细胞能够表达具有间苯三酚合酶活性的多肽和/或产生本发明载体。再次有利地,宿主细胞能够合成间苯三酚。
宿主细胞可以由单一类型的细胞或一组不同类型的细胞组成。宿主细胞也可以是杂合细胞,也就是说,由至少两种不同类型的细胞融合产生的细胞。
宿主细胞可以属于培养的细胞系、原代细胞、干细胞或增殖细胞。在本发明的上下文中,术语“宿主细胞”包括原核细胞、低等真核细胞如酵母细胞、以及其他真核细胞如昆虫细胞、植物细胞和哺乳动物细胞(例如人或非人细胞,优选非人细胞)。
术语“宿主细胞”更广泛地包括含有或已经含有根据本发明的核酸分子的细胞,以及此类细胞的后代。宿主细胞可以例如在组织或器官或者可以在完整的生物体中得以分离或被组织。在宿主细胞在完整生物体中的情况下,所述生物体不是人。
因此清楚的是,根据本发明的“宿主细胞”是重组宿主细胞,即,容纳外源遗传物质的细胞。因此,宿主细胞不是天然存在的细胞,而是通过遗传操作技术获得的分子生物学工具。
术语“同一性”旨在表示两个多肽或两个氨基酸分子之间的确切序列对应性。两个序列之间的“同一性百分比”取决于两个序列共有的相同残基的数量,并考虑到为了最佳比对而必须引入的间隔数和每个间隔的长度。现有技术中有各种计算机程序和数学算法可用于确定氨基酸序列之间的同一性百分比,例如在ncbi或align基础上可用的blast程序(atlasofproteinsequenceandstructure,dayhoff(编辑),1981,增刊3482-489)。用于确定核苷酸序列之间同源性的程序也可在专门的数据库中获得(例如genbank,威斯康星州序列分析软件包,bestfit,fasta和gap程序)。作为说明,如本文所用,表述“至少80%序列同一性”代表80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
在下面的详细描述中,本领域技术人员可以将实施方案单独考虑或适当地组合。
分离的多肽及其作为间苯三酚合酶的用途
本文的重点是分离的多肽,其选自细菌的iii型聚酮合酶,特别是革兰氏阳性细菌的iii型聚酮合酶,特别是选自放线菌属细菌的iii型聚酮合酶。
实际上,发明人完全出乎意料地鉴定了在细菌基因组中编码新型iii型聚酮合酶的基因,之前不知道这些细菌编码此类酶。特别地,本发明人最令人惊奇地证明,这些新型iii型聚酮合酶具有间苯三酚合酶活性。
本发明特别涉及分离的多肽作为间苯三酚合酶的用途,该分离的多肽选自细菌的iii型聚酮合酶,优选地排除荧光假单胞菌的iii型聚酮合酶phld.pf。本发明特别地涉及分离的多肽作为间苯三酚合酶的用途,该分离的多肽选自细菌的iii型聚酮合酶,排除荧光假单胞菌的iii型聚酮合酶phld.pf。
本发明还特别涉及分离的多肽作为间苯三酚合酶的用途,该分离的多肽选自革兰氏阳性细菌的iii型聚酮合酶,特别是选自放线菌属细菌的iii型聚酮合酶。
有利地,所述多肽包含与选自seqidno.1、seqidno.2、seqidno.3、seqidno.4、seqidno.5、seqidno.6、seqidno.7、seqidno.8、seqidno.9和seqidno.10的序列具有至少50%同一性的至少一个氨基酸序列。
有利地,所述分离的多肽选自革兰氏阳性细菌的iii型聚酮合酶。有利地,所述分离的多肽选自放线菌属细菌的iii型聚酮合酶,所述放线菌属细菌选自冢卡氏菌属、诺卡氏菌属、分枝杆菌属和戈登菌属,特别是选自微变冢卡氏菌、溶酪氨酸冢卡氏菌、假单胞冢卡氏菌、肺冢卡氏菌、冢卡氏菌属1534、皮诺卡氏菌、海分枝杆菌、堪萨斯分枝杆菌、堪萨斯分枝杆菌和疏水性戈登菌。
根据一个实施方案,所述多肽包含与选自seqidno:1、seqidno:2、seqidno:3、seqidno:4、seqidno:5、seqidno:6、seqidno:7、seqidno:8、seqidno:9和seqidno:10的序列优选具有至少60%的同一性,更优选至少65%的同一性,更优选至少70%的同一性,甚至更优选至少75%的同一性,再更优选至少80%的同一性,甚至更优选至少85%的同一性,甚至更优选至少90%的同一性,更优选至少95%的同一性,更优选至少96%的同一性,甚至更优选至少97%的同一性,更优选至少98%的同一性,甚至更优选至少99%的同一性的至少一个氨基酸序列。
根据一个特别有利的实施方案,所述多肽包含选自seqidno:1、seqidno:2、seqidno:3、seqidno:4、seqidno:5、seqidno:6、seqidno:7、seqidno:8、seqidno:9和seqidno:10中的至少一个氨基酸序列。
在一个优选的实施方案中,具有间苯三酚合酶活性的分离的多肽具有选自seqidno:1、seqidno:2、seqidno:3、seqidno:4、seqidno:5、seqidno:6、seqidno:7、seqidno:8、seqidno:9和seqidno:10的氨基酸序列。
有利地,具有间苯三酚合酶活性的分离的多肽选自具有微变冢卡氏菌phld.tp的间苯三酚合酶活性的分离的多肽、具有溶酪氨酸冢卡氏菌phld.tt的间苯三酚合酶活性的分离的多肽、具有假单胞冢卡氏菌phld.tps的间苯三酚合酶活性的分离的多肽、具有肺冢卡氏菌phld.tpu的间苯三酚合酶活性的分离的多肽、具有冢卡氏菌属1534phld.tp的间苯三酚合酶活性的分离的多肽、具有皮诺卡氏菌phld.nf的间苯三酚合酶活性的分离的多肽、具有海分枝杆菌phld.mma的间苯三酚合酶活性的分离的多肽、具有堪萨斯分枝杆菌phld.mk的间苯三酚合酶活性的分离的多肽、具有结核分枝杆菌phld.mt的间苯三酚合酶活性的分离的多肽和具有疏水性戈登菌phld.gh的间苯三酚合酶活性的分离的多肽。
分离的核酸分子
本发明涉及编码至少一种选自细菌的iii型聚酮合酶,特别是选自放线菌属细菌的iii型聚酮合酶的多肽的分离的核酸分子。
有利地,所述多肽如上所述。
根据一个实施方案,分离的核酸分子包含控制至少一种编码如上所定义的多肽的核酸序列表达的启动子。因此,根据一个实施方案,本发明涉及一种分离的核酸分子,其包含至少一种编码选自如上所定义的iii型聚酮合酶的多肽的核酸序列,并且还包含控制所述至少一种核酸序列表达的启动子。
有利地,该启动子是外源性启动子,特别是酵母启动子,优选选自adh2(padh2)和ccw12(pccw12)的启动子,更优选选自酿酒酵母的adh2(padh2)和酿酒酵母的ccw12的启动子,更优选选自seqidno:13的adh2和seqidno:14的ccw12启动子。
根据一个实施方案,分离的核酸分子包含至少一个编码如上定义的多肽的核酸序列的转录终止子。因此,根据一个实施方案,本发明涉及一种分离的核酸分子,其包含至少一种编码选自如上所定义的iii型聚酮合酶的多肽的核酸序列,并且还包含控制所述至少一个核酸序列表达的终止子。
有利的是,所述终止子是外源性终止子,特别是酵母终止子,优选为rpl3终止子(trpl3),更优选为酿酒酵母的rpl3终止子,更优选为seqidno:15的rpl3终止子。
根据一个优选的实施方案,分离的核酸分子包含如上定义的启动子和终止子。因此,根据一个实施方案,本发明涉及一种分离的核酸分子,其包含至少一种编码选自如上所定义的iii型聚酮合酶的多肽的核酸序列,并且还包含控制所述至少一种核酸序列表达的启动子和终止子。
根据一个实施方案,所述核酸分子还包含输出序列。有利地,该输出序列允许在细胞培养基中分泌或排出由所述核酸分子编码的多肽。
根据一个实施方案,核酸分子从培养物的同源菌株中分离,所述菌株优选选自冢卡氏菌属、诺卡氏菌属和分枝杆菌属,特别是微变冢卡氏菌、溶酪氨酸冢卡氏菌、假单胞冢卡氏菌、肺冢卡氏菌、冢卡氏菌属1534、皮诺卡氏菌、海分枝杆菌、堪萨斯分枝杆菌、结核分枝杆菌和疏水性戈登菌。
根据一个实施方案,核酸分子从包含所述分子的异源载体或宿主细胞中分离,所述载体或所述宿主细胞如上文所定义并且如以下“宿主细胞”或“载体”部分中所述。
根据一个实施方案,通过本领域技术人员完全熟知如何定义的核酸合成技术在体外合成分离的核酸分子。
根据一个实施方案,分离的核酸分子是重组的。
载体
本发明涉及包含至少一个如上所述的核酸分子的载体。
有利地,载体是质粒。
适用于本发明上下文的载体包括但不限于,例如用于在原核宿主细胞如细菌(例如大肠杆菌或假单胞菌属细菌)中表达的噬菌体、质粒或粘粒载体;用于在酵母中表达的载体(例如酿酒酵母、粟酒裂殖酵母、巴斯德毕赤酵母(pichiapastoris));用于在昆虫细胞系统中表达的杆状病毒载体(例如,sf9细胞);用于在植物细胞系统中表达的病毒和质粒载体(例如,ti质粒、花椰菜花叶病毒camv、烟草花叶病毒tmv);以及用于在高等真核细胞或生物体中表达的病毒和质粒载体。
这些载体通常是可商购的(例如,购自诸如invitrogen、stratagene、amershambiosciences、promega等的供应商),从诸如美国典型培养物保藏中心(atcc,rockville,md)的保藏机构获得,或已经有许多出版物主题描述了它们的序列、它们的结构和生产它们的方法,因此本领域技术人员可以毫无困难地应用它们。
合适的质粒载体的代表性实例包括但不限于,prep4、pcep4(invitrogen)、pci(promega)、pvax(invitrogen)和pgwiz(genetherapysysteminc)。
宿主细胞
在另一方面,本发明涉及包含至少一个如上所述的核酸分子或至少一个载体的宿主细胞。
根据各种实施方案,所述宿主细胞,特别是上述的所述异源宿主细胞可以是原核细胞、低等真核细胞如酵母细胞、以及其他真核细胞如昆虫细胞、植物细胞和哺乳动物细胞(例如,人或非人细胞,优选非人细胞)。
有利地,宿主细胞是选自细菌、酵母、真菌、藻和蓝藻的微生物。
宿主细胞优选是酵母,所述酵母特别地选自酵母菌属、念珠菌属、阿舒菌属、德克拉菌属、毕赤酵母属(汉逊酵母属)、德巴利氏酵母属、克拉维孢菌属、娄德酵母属、耶氏酵母属、合子酵母菌属、裂殖酵母菌属、孢圆酵母菌属、克鲁维酵母菌属、酒香酵母菌属、隐球菌属和马拉色菌属。
甚至更特别地,酵母选自酿酒酵母、布拉氏酿酒酵母、道格拉斯酵母、巴氏酵母、拜耳接合酵母、粟酒裂殖酵母、布氏德克拉菌、中间德克拉菌、卡斯特酒香酵母菌、中间酒香酵母菌、嗜热克鲁维酵母、球有孢圆酵母和光滑球拟酵母。
甚至更特别地,酵母是酿酒酵母属的酵母,优选地是酿酒酵母菌种的酵母。
根据一个实施方案,宿主细胞包含整合到其基因组中的至少一个拷贝的如上所定义的核酸分子。
根据一个实施方案,宿主细胞包含整合到其基因组中的如上定义的核酸分子的单个拷贝。
当宿主细胞是酵母细胞时,核酸分子的一个或多个拷贝可以整合在多个基因座,优选地整合在所述酵母细胞基因组的ura3基因座、jlp1基因座、leu2基因座或trp1基因座。当宿主细胞是酵母细胞并且整合有核酸分子的几个拷贝时,多个拷贝可以整合在相同的基因座上,或者整合在不同的基因座上,优选地整合在ura3、jlp1、leu2和/或trp1基因座的任何组合中。
有利地,核酸分子中使用的密码子已经被调整为在所选宿主细胞中最佳表达。
当所选择的密码子是宿主细胞起源生物体优先使用的那些密码子时,尤其可以获得最佳表达。对于本领域中通常使用的大多数生物体来说,优先使用的密码子是已知的。本领域技术人员将能够容易地确定将被用作所选择宿主细胞功能的最有利的密码子。
为此,本领域技术人员知道使用哪种技术来修饰核酸分子的密码子。例如,可以通过使用聚合酶链反应(pcr)扩增的方法,使用密码子有待调整的核酸分子的样品,通过体外定点诱变来修饰密码子。或者,可以用优化的密码子直接在体外合成核酸分子。
宿主细胞可以在小规模和大规模的需氧或厌氧生物反应器中、烧瓶或培养皿中培养。培养可以在适合给定宿主细胞的温度、ph、培养基和氧含量下进行。
方法
生产具有间苯三酚合酶活性的多肽的方法
本发明还涉及生产如上定义的具有间苯三酚合酶活性的多肽的方法。
根据一个实施方案,生产如上定义的具有间苯三酚合酶活性的多肽的方法至少包括以下步骤:
(i)将如上所述的核酸分子或载体引入根据之前描述的合适的宿主细胞中;和
(ii)在允许所述宿主细胞生长和/或表达所述核酸分子的条件下体外培养步骤(i)中获得的所述宿主细胞,以生产所述多肽。
根据另一个实施方案,生产如上定义的具有间苯三酚合酶活性的多肽的方法至少包括以下步骤:
(i)在允许所述宿主细胞生长和/或表达所述宿主细胞中包含的核酸分子的条件下,体外培养表达所述多肽的宿主细胞,例如如上所述的宿主细胞,从而生产所述多肽。
根据一个可能的实施方案,生产具有间苯三酚合酶活性的多肽的方法包括选自以下步骤的至少一个额外步骤:
(α)回收在培养步骤后获得的表达所述多肽的细胞;和
(β)从步骤(α)中回收的细胞中纯化多肽。
生产间苯三酚的方法
本发明还涉及生产间苯三酚的方法。
根据一个实施方案m1,生产间苯三酚的方法至少包括以下步骤:
(i)通过实施上述方法之一获得细胞;
(ii)使步骤(i)中获得的细胞与合适的底物接触;
(iii)在适于生产间苯三酚的条件下孵育步骤(ii)得到的混合物;
(iv)任选地,回收在步骤(iii)之后获得的包含间苯三酚的反应介质;和
(v)任选地,从步骤(iv)的反应介质中纯化间苯三酚。
根据另一个实施方案m2,生产间苯三酚的方法包括以下步骤:
(i)使如上所述表达具有间苯三酚合酶活性的多肽的宿主细胞(例如如上定义的宿主细胞)与合适的底物接触;
(ii)在允许所述宿主细胞生长和/或表达所述宿主细胞中包含的核酸分子的条件下体外培养步骤(i)的宿主细胞,以产生间苯三酚;
(iii)任选地,回收在步骤(ii)之后获得的包含间苯三酚的培养基;和
(iv)任选地,从步骤(iii)的培养基中纯化间苯三酚。
为了方法m1和m2的目的,所述底物是碳源。有利地,碳源是纯碳源或工业副产品(例如糖蜜或绿色糖浆,例如来自制糖业)。优选地,纯碳源或工业副产品中的底物是单糖,例如葡萄糖(或右旋糖)、果糖、半乳糖、甘露糖、蔗糖、乳糖或麦芽糖;复合糖,例如单糖、二糖或三糖,或者多糖,例如淀粉;醇,例如乙醇;酸;脂肪酸及其酯衍生物;或糖、醇、酸和/或脂肪酸或其酯衍生物的混合物。
优选地,底物是葡萄糖。或者,底物是乙醇。
根据另一个实施方案m3,生产间苯三酚的方法至少包括以下步骤:
(i)使在上述方法的步骤(β)中获得的至少一种多肽与合适的底物接触;
(ii)在适合于生产间苯三酚的条件下孵育步骤(i)得到的混合物;
(iii)任选地,回收在步骤(ii)之后获得的包含间苯三酚的反应介质;和
(iv)任选地,从步骤(iii)的反应介质中纯化间苯三酚。
根据另一个实施方案m4,生产间苯三酚的方法至少包括以下步骤:
(i)使至少一种如上定义的多肽与合适的底物接触;
(ii)在适合生产间苯三酚的条件下孵育步骤(i)得到的混合物;
(iii)任选地,回收在步骤(ii)之后获得的包含间苯三酚的反应介质;和
(iv)任选地,从步骤(iii)的反应介质中纯化间苯三酚。
为了这些方法m3和m4的目的,底物是硫酯。有利地,底物是酰基辅酶a(或酰基-coa),例如丙二酰基-coa、乙酰基-coa、己酰基-coa、癸酰基-coa、月桂酰基-coa和棕榈酰基-coa、或其混合物。优选地,底物是丙二酰基-coa。
根据一个优选的实施方案,间苯三酚的纯化通过液-液提取进行。
以下实施例旨在说明本发明而没有任何限制。
本文中使用分别由荧光假单胞菌的phld基因(zha等人,2006)和外子藻的pks1基因(meslet-cladière等人,2013)编码的酶作为对照。
实施例
实施例1:新型候选间苯三酚合酶的鉴定
直到本发明,仅鉴定和表征了两种间苯三酚合酶:
-荧光假单胞菌的phld基因编码的酶(zha等人,2006),和
-外子藻的pks1基因编码的酶(meslet-cladière等人,2013)。
发明人现在已经使用遗传和功能分析发现并表征了新型间苯三酚合酶。
如以上介绍中所述,聚酮合酶的确切功能表征是复杂的,因为这类酶组合了具有高序列相似性的蛋白质,尽管这些蛋白质可以催化基本上不同的反应并识别完全不同的底物。
1.1.选择新的候选酶
为了鉴定新的间苯三酚合酶,发明人鉴定了编码推定的iii型聚酮合酶的序列。使用具体是由meslet-cladière等人,2013发表的iii型聚酮合酶比对作为基础,对本发明人如此鉴定的这些推定的iii型聚酮合酶的序列进行分析和相互比对。
对该序列比对的分析得到一组候选酶的选择,其蛋白质序列与藻类外子藻的pks1.es基因产物的蛋白质序列接近(表1和表2)。
表1:鉴定的推定iii型聚酮合酶。阴影行表示具有已知间苯三酚合酶活性的酶。
表2:鉴定的推定iii型聚酮合酶的蛋白质序列
图1显示了表1中列出的候选酶的蛋白质序列的比对。使用clustalw软件进行所选择的十种候选酶与pks1.es酶的比对。
表3显示了这些各种候选酶与phld.pf和pks1.es之间存在的序列同一性矩阵。
表3:各种候选酶之间存在的序列同一性的矩阵。
结果表明候选酶与细菌酶phld.pf之间存在的系统发生的距离相当可观,因为在这两组之间观察到的同一性低于25%。因此,由于这种强的序列差异,不可能事先指定所研究的推定聚酮合酶具有间苯三酚合酶的功能。
1.2.在酵母中测量间苯三酚合酶的活性
为了在上述鉴定的候选物中鉴定间苯三酚合酶,开发了一种提取和分析间苯三酚的方法,如下所述。
1.2.1.间苯三酚提取方法
该方法使用间苯二酚作为内部标准开发。各种测试导致开发了在ph4.0、在乙酸乙酯作为溶剂存在下、通过用nacl使水相饱和,来进行液-液提取的方法。提取在循环摇动下进行30分钟。除去有机相,并在30℃的氮n2流下蒸发掉乙酸乙酯溶剂。然后将完全蒸发后获得的干提取物吸收到预定体积的50%-50%乙醇/h2o混合物中。
在高压色谱法后通过质谱测量提取收率,用0.03%的甲醇酸(hcooh)/乙腈(acn)梯度在c18柱(尺寸:100mm×2.1mm;粒径:1.7μm)上进行。
使用在用于酵母生长的培养基中制备的间苯三酚和间苯二酚的溶液测定提取收率。间苯三酚浓度对应于测定范围的最低点(20μg.ml-1)和最高点(200μg.ml-1)。间苯二酚浓度对应于在测定过程中作为内部标准添加的浓度(200μg.ml-1)。结果列于表4。
表4:根据所述方法,用乙酸乙酯提取的间苯三酚(20和200μg.ml-1)和间苯二酚(200μg.ml-1)的提取收率
1.2.2.开发uplc/uv和uplc/ms分析方法
开发了一种通过uplc色谱法和uv(紫外辐射)吸光度测量进行的分析方法。提取物在尺寸为100mm×2.1mm的五氟苯基丙基(pfp)柱上进行色谱分离;粒径:1.8μm,根据0.1%hcooh/acn-0.1%hcooh的梯度进行。间苯三酚在230nm处通过uv检测。还开发了uplc质谱(uplc/mass)方法。
使用酵母培养基(酵母抽提物1%,bactopeptone2%)中稀释的范围20-200μg.ml-1的间苯三酚,在存在固定量的间苯二酚作为内部标准的情况下进行定量。通过计算间苯三酚/间苯二酚色谱峰的表面比率来测定间苯三酚的量。
图2表示在pfp柱上获得的间苯三酚/间苯二酚色谱峰的示例。
因此,该测定方法使得可以可靠地定性和定量地测量样品中存在的间苯三酚。
uplc质谱法(uplc/mass)使测定含有间苯三酚浓度为2至50μg.ml-1的样品成为可能。
实施例2:鉴定新功能的间苯三酚合酶
2.1.在酿酒酵母中以多拷贝的形式表达候选基因
通过调节用于酿酒酵母中最佳表达的密码子,合成了如上所述选择和描述的10个候选基因(phld.tp、phld.tt、phld.tps、phld.tpu、phld.tsp、phld.nf、phld.mma、phld.mk、phld.mt和phld.gh),以及编码迄今已鉴定的两种间苯三酚合酶的phld.pf和pks1.es基因(用作对照)(见表1和2)。
进行密码子调整是为了优化这些不同基因在酵母细胞中的表达(这12个合成基因编码的蛋白质与原始生物体表达的蛋白质严格相同)。将这些基因中的每一个置于相同的酵母启动子adh2(padh2)的控制下,特别是在培养基中含有乙醇作为碳源的情况下,允许其表达。rpl3酵母基因(trpl3)的转录终止子位于adh2启动子控制下的12个基因中每一个的下游。
图3显示了针对候选或给定对照(phld.ii)而如此构建的基因单元的示例。
如此构建的各种基因单元被独立地整合到酿酒酵母野生型菌株的基因组的ura3基因座上。使用的野生型菌株是商业菌株w303(基因型:mat-a、his3、leu2、trp1、ura3、ade-)。所使用的整合技术允许整合每个基因单元多个拷贝数目。对于每个构建体,根据常规taqman方法通过定量pcr确定整合的基因单元的拷贝数。将酵母菌株在存在20g.l-1乙醇作为碳源的情况下在30℃下培养48小时,所述酵母菌株表达上述10个phld.ii候选基因或phld.pf和pks1.es对照基因中每一个的多个拷贝数。因此,分析了上述基因单元在ura3基因座上转化和整合后独立获得的12个酵母菌株产生间苯三酚的能力。在相同条件下培养w303野生型亲本菌株并用作对照。
在600nm(do600)下测量了各种培养物的光密度(do),由此表明每种菌株的生长水平(图4a和图4b)。
使用如上1.2节中所述开发的提取和测定方法,测试了在adh2启动子控制下表达各种phld.ii基因的各种酵母菌株合成间苯三酚的能力。在培养基中测量间苯三酚的生产水平(以mg.l-1计)(图4a和图4c)。
图4显示所有表达不同拷贝数的phld.tp、phld.tt、phld.tps、phld.tpu、phld.tsp、phld.nf、phld.mma、phld.mk、phld.mt和phld.gh基因的菌株均产生显著量的间苯三酚,所述间苯三酚排入培养基中(图4a、图4c和图4d)。因此,这些结果表明这10个基因中的每一个都表达在酵母中有活性的间苯三酚合酶。
此外,如所预期的,在w303对照亲本菌株中未检测到间苯三酚的产生(数据未显示)。
因此,这项功能研究使得可能鉴定出十种新的间苯三酚合酶,分别由phld.tp、phld.tt、phld.tps、phld.tpu、phld.tsp、phld.nf、phld.mma、phld.mk、phld.mt和phld.gh基因编码。这项研究首次揭示了革兰氏阳性细菌,尤其是放线菌属细菌编码功能性间苯三酚合酶(phld.tp、phld.tt、phld.tps、phld.tpu、phld.tsp、phld.nf、phld.mma、phld.mk、phld.mt和phld.gh)。
这项研究还首次揭示了pks1.es酶在异源真核系统(即酵母)中表达时的功能。这项研究还出乎意料地揭示了phld.pf不编码在酵母中发挥功能的间苯三酚合酶。该结果令人惊讶,因为在大肠杆菌中表达时证实了由phld.pf编码的酶表现出间苯三酚合酶活性(achkar等人,2005)。
2.2.在酿酒酵母中以单拷贝形式表达候选基因
还评估了仅整合了单拷贝phld候选基因的菌株产生的间苯三酚(参见前一节的结果和图4),其中所述候选基因经选择和鉴定为在酵母中是有功能的。根据上文第2.1节中所述的结果,编码在酵母中有功能的间苯三酚合酶的pks1.es基因用作阳性对照。根据上文第2.1节所述的结果,编码在酵母中没有功能的间苯三酚合酶的phld.pf基因用作阴性对照。
将这些基因中的每一个置于允许其表达的酵母启动子adh2(padh2)的控制下(尤其是在培养基含有乙醇作为碳源时),或者置于允许其表达的酵母启动子ccw12(pccw12)的控制下(尤其是在培养基中含有葡萄糖作为碳源的糖酵解过程中)。rpl3酵母基因(trpl3)的转录终止子置于每个构建体的下游。
所产生的各种基因构建体的细节在图5中报道。
在存在20g.l-1乙醇作为碳源(由padh2控制的构建体)或存在20g.l-1葡萄糖(由pccw12控制的构建体)时,在30℃下培养表达单拷贝phld或pks1的酵母菌株48小时(图6和图7)。培养菌株并分析其产生间苯三酚的能力。
在600nm下测量各种培养物的光密度(指示每种菌株的生长水平,图6a和图6b以及图7a和图7b),对于每个构建体的2个独立转化体,在培养基中测量间苯三酚的产量(以mg.l-1计)(图6a和图6c以及图7a和图9c)。
图6(a和c)显示了在存在乙醇作为碳源的情况下,在adh2启动子控制下表达单拷贝phld.tp、phld.tt、phld.tps、phld.tpu、phld.tsp、phld.nf、phld.mma、phld.mk、phld.mt或phld.gh基因的菌株合成了可测量的显著量的间苯三酚,所述间苯三酚被分泌到培养基中。
对于在存在葡萄糖作为碳源的情况下进行的培养,在ccw12启动子控制下表达单拷贝phld.tp、phld.tt、phld.tps、phld.tpu、phld.tsp、phld.nf、phld.mma、phld.mk、phld.mt和phld.gh基因的菌株全部合成间苯三酚,其量与存在乙醇作为碳源下进行的培养相当(图7a和图7c)。
以上获得的结果证实了在上文第2.1节中描述的含有几个拷贝的间苯三酚合酶的菌株中获得的结果。因此,phld.tp、phld.tt、phld.tps、phld.tpu、phld.tsp、phld.nf、phld.mma、phld.mk、phld.mt和phld.gh候选酶的表达使得酵母细胞显著产生间苯三酚。这些结果表明,这些基因编码间苯三酚合酶,并且这些间苯三酚合酶在酵母细胞中具有活性。
这些结果还表明,即使表达单拷贝的编码间苯三酚合酶的基因,间苯三酚的产生水平也很高。
这些结果首次证实了在革兰氏阳性型细菌中存在间苯三酚合酶活性。
更普遍地,结果表明,所测试的phld.ii候选酶表现出的活性总体上高于本研究前已知的仅有两种间苯三酚合酶的活性,即外子藻(e.siliculosus)和荧光假单胞菌(p.fluorescens)的酶。当在酵母中表达时,冢卡氏菌属的phld候选酶(phld.tt、phld.tps、phld.tpu、phld.tsp、phld.tp)在酵母中特别有活性。实际上,通过相对于拷贝数进行归一化的间苯三酚产量表明,在本文所测试的酵母表达系统中,所测试的冢卡氏菌属的酶(phld.tp、phld.tt、phld.tpu、phld.tps和phld.tsp)具有的间苯三酚合酶活性比外子藻pks1酶高至少10倍。根据这些结果,在各种测试条件下,phld.tpu酶似乎尤其是最有活性的酶。
三种酶:phld.mma(海分枝杆菌)、phld.nf(皮诺卡氏菌)和phld.gh(疏水性戈登菌),也显著的非常有活性。
因此,本发明为在酵母中生物合成间苯三酚提供了几种新的原始且有利的途径。
2.3.其他观察
发明人进行的并在此报道的研究,使得能够鉴定出具有间苯三酚合酶活性的10种新型酶。这10种新型间苯三酚合酶来自放线菌目的革兰氏阳性细菌,包括冢卡氏菌属(phld.tt、phld.tps、phld.tpu、phld.tsp、phld.tp)、诺卡氏菌属(phld.nf);分枝杆菌属(phld.mma、phld.mt和phld.mk)和戈登菌属(phld.gh),迄今为止从未描述这些菌属产生间苯三酚。
因此,这些结果首次并明确地证明在酵母细胞中合成间苯三酚是可能的。
重要的是要注意,合成的间苯三酚超过95%被酵母细胞分泌到培养基中。这种特别有效的分泌对于间苯三酚生物生产过程的实施是非常有利的。
根据迄今为止获得的结果,冢卡氏菌属的放线菌细菌的间苯三酚合酶似乎是最具活性的。实际上,获得的结果表明,在测试条件下,在酵母细胞中表达的冢卡氏菌属的phld酶的活性比现有技术中褐藻外子藻的间苯三酚合酶的活性高至少10倍。
因此,冢卡氏菌属的phld酶可以代表用于在酿酒酵母中实施间苯三酚生物生产过程所选择的酶。
最后,发明人鉴定的酶在来源物种和蛋白质序列方面都是首创的。事实上,首次表明革兰氏阳性细菌编码功能性间苯三酚合酶。此外,在发明人测试的实验条件下,最具活性的酶,肺冢卡氏菌phld.tpu的蛋白质序列与已知的外子藻的pks1.es酶序列显著不同(差异大于63%,表3)。
参考文献
achkarj等人(2005)“biosynthesisofphloroglucinol”jamchemsoc.127:5332-5333.
meslet-cladièrel,delagel,lerouxcj,goulitquers,leblancc,creise,gallea,stiger-pouvreauv,czjzekm和potinp.(2013)“structure/functionanalysisofatypeiiipolyketidesynthaseinthebrownalgaectocarpussiliculosusrevealsabiochemicalpathwayinphlorotanninmonomerbiosynthesis.”plantcell.25:3089-3103.
zhaw,rubin-pitelsb和zhaoh.(2006)“characterizationofthesubstratespecificityofphld,atypeiiipolyketidesynthasefrompseudomonasfluorescens.”jbiolchem.281:32036-32047。
序列表
<110>米其林集团总公司
<120>来自细菌的iii型聚酮合酶作为间苯三酚合酶的用途
<130>b374763pctd37152
<150>fr1756106
<151>2017-06-30
<160>15
<170>patentinversion3.5
<210>1
<211>393
<212>prt
<213>微变冢卡氏菌
<400>1
metilealaproglnileargleuglygluproaspthrthrproleu
151015
proaspproleutrphisglyalaproproalaproprothrthrval
202530
alavalilegluserleualathrglyserproalaglnalahisgly
354045
glnservalseralagluargvalalaalaargphealaaspproile
505560
glnalagluargileargargvaltyralaasnthralavalalathr
65707580
arghisleualaileaspproleuseraspaspphealaasppheser
859095
alaargproaspthrileargglnargmetaspleutyrphegluhis
100105110
alaalaproleualailegluthralaargargalaleuglyalaval
115120125
aspalathrgluvalglyglnleuilephevalthrserthrglyphe
130135140
leualaproglyvalaspvalalavalthrargserleuglyleupro
145150155160
alaserthrserargvalvalileasnphemetglycysalaalaala
165170175
metasnalaleuargvalalaseraspphevalargalahisproasp
180185190
arglysserleuleuvalcysleugluleuserservalasnalaval
195200205
phealaglyaspproasnaspvalvalileserserleuphealaasp
210215220
glycysglyalaalaleuileglyalasergluvalglyhisproleu
225230235240
proalaglyhisilevalvalargaspthrphealahisleuleuasp
245250255
aspalagluaspglyilevalleuglyvalasnalaasnglyilethr
260265270
cysgluleualahisserleuproargtyrileleuaspglyvalser
275280285
provalileaspglyvalleualaargasnglyleuglyarggluasp
290295300
valalahistrpalailehisproglyglyprolysileilegluser
305310315320
alaseralaalaleuglyleuproargseralaserglnthrsertrp
325330335
alavalleualagluhisglyasnmetleuservalserleuleuphe
340345350
valleugluargleuleuglyalaargalaalaglyglythrglnglu
355360365
thrglyleualapheserphealaproglyvalthrvalgluglyphe
370375380
leupheaspvalvalglyglyproser
385390
<210>2
<211>412
<212>prt
<213>溶酪氨酸冢卡氏菌
<400>2
metthrmetasnalaglyserglnglyalaproalaleuaspvalpro
151015
alaprovalleuproalaproglythrtrpleuglyalaproproala
202530
proprothrservalalavalilegluserleualathrglyserpro
354045
alaglnthrtyrglyglnalagluseralaaspargvalalaalaarg
505560
pheaspaspproargglnalagluargileargargvaltyralalys
65707580
thrargvalaspgluarghisleualaileaspproleuthrproglu
859095
phealaglupheserthrargproaspthrvalarggluargmetasp
100105110
leuphetyrgluhisalaalaproleualavalaspthralaargarg
115120125
alaleuglyvalglythrgluhisglupheaspproalaaspvalgly
130135140
glnleuvalphevalthrserthrglypheleualaproglyvalasp
145150155160
valalavalileargalaleuglyleualaproglnthrserargval
165170175
valileasnphemetglycysalaalaalametasnalaleuargval
180185190
serthrasptyrvalargalahisproasparglysserleumetile
195200205
cysleugluleuserservalasnalavalpheserglyaspproasn
210215220
aspvalvalileserserleuphealaaspglycysglyalaalaval
225230235240
ileglyalasergluvalglyhisproleuproglyglyargileval
245250255
valargaspthrphethrhisleuleuaspglyalagluaspglyile
260265270
valleuglyvalasnalaasnglyilethrcysgluleualagluser
275280285
leuproglntyrilevalaspglyvalalaprovalileaspgluval
290295300
leuglyargasnaspleuglyargglualavalalahistrpalaile
305310315320
hisproglyglyprolysileilegluseralaalathralaleugly
325330335
leuproaspglualaserargthrsertrpaspvalleualagluhis
340345350
glyasnmetleuservalserleuleuphevalleugluargleuleu
355360365
alaglnvalalaaspglyalaalathrglnproaspglyalaprothr
370375380
thrglymetalapheserphealaproglyvalthrvalgluglyphe
385390395400
leupheaspvalvalthrglyaspglnproglyglu
405410
<210>3
<211>387
<212>prt
<213>假单胞冢卡氏菌
<400>3
metalaalaprogluleuproglythrservaltrpargglyalapro
151015
proalaproprothrservalalavalilegluserleualathrgly
202530
serproserglnalatyraspglnalagluseralaaspargvalala
354045
serargpheaspaspproargglnalagluargileargargvaltyr
505560
alalysthrargvalalagluarghisleualaileaspproleuthr
65707580
progluphealaalapheserthrargproaspthrilearggluarg
859095
metaspleuphephegluhisalaalaproleualaileaspthrala
100105110
argargalaleuglythrvalaspproalaaspvalglyglnleuval
115120125
phevalthrserthrglypheleualaproglyvalaspvalalaval
130135140
ileargalaleuglyleuserproglythrserargvalvalileasn
145150155160
phemetglycysalaalaalametasnalaleuargvalserthrasp
165170175
tyrvalargalahisproasparglysserleumetilecysleuglu
180185190
leuserservalasnalavalpheserglyaspproasnaspvalval
195200205
ileserserleuphealaaspglycysglyalaalaleuileglyala
210215220
sergluvalglyhisproleuproalaglyasnilevalvalargasp
225230235240
thrpheserhisleuleuaspglyalagluaspglyilevalleugly
245250255
valasnalaaspglyilethrcysgluleualagluserleuprogln
260265270
tyrilevalaspglyvalalaprovalvalaspglyvalleuargarg
275280285
asnglyleuaspargaspalavalalahistrpalailehisprogly
290295300
glyprolysileilegluseralaserthralaleuglyleuproasp
305310315320
glualaserargleusertrpaspvalleualaglyhisglyasnmet
325330335
leuservalserleuleuphevalleugluargleuleualaglnval
340345350
alaseraspglyalaaspglyalaproserthrglymetalapheser
355360365
phealaproglyvalthrvalgluglypheleupheaspvalvalthr
370375380
thrglyglu
385
<210>4
<211>390
<212>prt
<213>肺冢卡氏菌
<400>4
metasnthrthrgluglnglnservalleuproglnglnalatrpleu
151015
glyalaproproalaproprothrservalalavalilegluserleu
202530
alathrserserprothrglnthrtyrglyglnalagluseralaasp
354045
argvalalaalaargpheaspaspproargglnalagluargilearg
505560
argvaltyralalysthrargvalthrgluarghisleualaileasp
65707580
proleuthrprogluphealaglupheseralaargproaspthrval
859095
arggluargmetaspleuphephegluhisalaalaproleualaile
100105110
gluthralaargargalaleuglyaspasnalaalathraspilegly
115120125
glnleuvalphevalthrserthrglypheleualaproglyvalasp
130135140
valalavalileargalaleuglyleualaproglnthrserargval
145150155160
valileasnphemetglycysalaalaalametasnalaleuargval
165170175
serthrasptyrvalargalaglnproasparglysserleumetile
180185190
cysleugluleuserservalasnalavalpheserglyaspproasn
195200205
aspvalvalileserserleuphealaaspglycysglyalaalaval
210215220
ileglyalasergluvalglyhisproleuproserglyglnileval
225230235240
valargaspthrphethrhisleuleuaspglyalagluaspglyile
245250255
valleuglyvalasnalaasnglyilethrcysgluleualagluser
260265270
leuproglntyrilevalasnglyvalalaprovalvalaspalaval
275280285
leuaspargasnglyleuglyargglualavalalahistrpalaile
290295300
hisproglyglyprolysileilegluseralaalaalaalaleugly
305310315320
leuproaspaspalaserargleusertrpaspvalleualagluhis
325330335
glyasnmetleuservalserleuleuphevalleugluargleuarg
340345350
alaglnvalalaseraspglyalaaspglyalaproserthrglymet
355360365
alapheserphealaproglyvalthrvalgluglypheleupheasp
370375380
valvalthrthrglyglu
385390
<210>5
<211>397
<212>prt
<213>冢卡菌属1534
<400>5
metasnileglnaspargserthrvalalaproaspserproalaleu
151015
glypheproproalaproprothrservalalavalilegluserleu
202530
alathrglyserproserglyvalhisalaglnalagluseralaasp
354045
argvalalaserargpheaspaspproalaglnalagluargilearg
505560
argvaltyrthrlysthrargvalalaargarghisleualaileasp
65707580
proleuaspgluaspphealaalapheseralaargproaspthrile
859095
arggluargmetaspleuphealagluhisalaserproleualaval
100105110
aspthralaargargalaleuglyalavalaspproalaaspvalgly
115120125
glnleuvalphevalthrserthrglypheleualaproglyvalasp
130135140
valalailevalargalaleuglyleuproalathrthrserargval
145150155160
ilevalasnphemetglycysalaalaalametasnalaleuargval
165170175
alaseraspphevalargalahisproasparglysserleumetval
180185190
cysleugluleuserservalasnalavalpheserglyaspproasn
195200205
aspvalvalileserserleuphealaaspglycysglyalaalaval
210215220
ileglyalasergluvalglyhisproleuproglyglyserileval
225230235240
valargaspthrphealahisleuleuaspglyalagluaspglyile
245250255
valleuglyvalasnalaasnglyilethrcysgluleualagluser
260265270
leuproargtyrilevalaspglyvalargprovalileaspglyval
275280285
leualaargasnglyleuglyhisalaaspvalalahistrpalaile
290295300
hisproglyglyprolysileilegluseralaseralaalaleugly
305310315320
leuproalaalaalaseralathrsertrpglnvalleualagluhis
325330335
glyasnmetleuservalserleuleuphevalleugluargmetleu
340345350
serglyleuproaspglyalaproserthrglymetalapheserphe
355360365
alaproglyvalthrvalgluglypheleupheaspilevalargasp
370375380
glyalaproargproglyalaleuglyglyargproala
385390395
<210>6
<211>400
<212>prt
<213>皮诺卡氏菌
<400>6
metserilethrvalaspgluglyglyalaargproalathrglupro
151015
argglnargilehisproaspleuglyhisalahisthrprometpro
202530
proalaproprovalthrileglyvalvalgluglyilealathrgly
354045
serproalaglnilevalaspglnalaglualaalagluargvalala
505560
alaleuphethraspproalaglnargalaargilealaargvaltyr
65707580
glulysthrargilegluthrargargmetalavalaspprothrala
859095
proglupheargserpheserargglnproglythrleuarggluarg
100105110
metasnleuphetyrarghisalaalaproleualavalaspvalala
115120125
glyargalaleualaaspserglyalaalaalaalaaspileglyleu
130135140
leuvalphevalthrserthrglypheilealaproglyvalaspval
145150155160
alavalleuarggluleuglyleuvalprothrvalglyargvalval
165170175
valasnphemetglycysalaalaalametasnglyileargthrgly
180185190
valasptyrvalargalahisproasplyslysalaleuvalvalcys
195200205
leugluleuserservalasnalavalphealaaspaspvalasnasp
210215220
valileilehisserleupheglyaspglycysglyalavalvalleu
225230235240
glyalaserglnalaargglnproleualaproglyargvalvalval
245250255
argaspserpheserhisleupheaspalaalagluaspglyileval
260265270
leuglyvalasphisasnglyilethrcysgluleusergluasnleu
275280285
proargtyriletyrargglyvalaspprovalvalarggluvalleu
290295300
alaargasnglyleuarglysseraspileaspleutrpalailehis
305310315320
proglyglyprolysileileglugluservalargserleuglyleu
325330335
serprogluglnalaalaprosertrpaspvalleualaarghisgly
340345350
asnmetleuservalserleuilephevalleugluglnmetileala
355360365
glnseralathralagluproileserthrglyvalalapheserphe
370375380
alaproglyvalthrleugluglyleuilepheaspileileargarg
385390395400
<210>7
<211>393
<212>prt
<213>海分枝杆菌
<400>7
metserthralaalagluglyglyalaileargargalaglyhisglu
151015
proargtyraspleualaglnleuproproalaproprothrthrval
202530
alavalilegluglymetalathrglyalaproglnargvalvalala
354045
glnalaaspalaalaalaargvalsergluleuphevalaspprogln
505560
glnarggluargileserargiletyrasplysthrargileaspthr
65707580
argargmetalavalaspproleuaspaspglupheaspgluphearg
859095
arggluproalathrileargaspargmetasnleuphetyrglnhis
100105110
alavalproleualavalaspvalalaalaargalaleuaspglyleu
115120125
protyralaproaspgluileglyglnleuvalphevalthrserthr
130135140
glypheilealaproglyvalaspvalgluilevallysglnleugly
145150155160
leuproargserileserargvalvalvalasnphemetglycysala
165170175
alaalametasnalaileargthralathrasntyrvalargalahis
180185190
prosermetlysalaleuvalvalcysilegluleuserservalasn
195200205
alavalphealaaspaspileasnaspvalvalilehisserleuphe
210215220
glyaspglycysglyalaleuvalileglyalaserglnvalglngln
225230235240
proleuproalaglyasnvalvalileargserserpheserglnleu
245250255
leuaspaspsergluaspglyilevalleuglyvalasnhisaspgly
260265270
ilethrcysgluleusergluasnleuprosertyriletyrargser
275280285
valaspprovalvalalaglumetleuargaspasnglyleuserlys
290295300
alaaspileaspleutrpalailehisproglyglyprolysileile
305310315320
gluglnseralaargserleuglyileprovalglyargalavalgln
325330335
sertrpaspvalleualaglnpheglyasnmetleuservalserleu
340345350
ilephevalleuglumetmetvalalaglnalagluserasplyspro
355360365
ileserthrglyvalalaphealaphealaproglyvalthrvalglu
370375380
glymetleupheaspileileargarg
385390
<210>8
<211>395
<212>prt
<213>堪萨斯分枝杆菌
<400>8
metserseralaalaaspglyglyalaprovalalaaspvalprogly
151015
tyrgluprohistyraspleualaglnleuproproalaproprothr
202530
thrvalalavalilegluglymetalathrglyvalproglnargval
354045
valargglnseraspalaalaalaargvalalaglnmetphevalasp
505560
proglnglnarggluargvalserargvaltyralalysthrargile
65707580
aspthrargargmetalavalasnproleuaspalaglupheaspala
859095
pheargarggluproalathrileargaspargmetserleuphetyr
100105110
arghisalavalproleualavalgluvalthrargargalaleuala
115120125
glyleusertyrglyalaaspgluileglyleuleuvalphevalthr
130135140
serthrglyphevalalaproglyvalaspvalalailevallysglu
145150155160
leuglyleuserargalaileserargvalvalvalasnphemetgly
165170175
cysalaalaalametasnalaileargthralathrasntyrvalarg
180185190
alahisproalametlysalaleuvalvalcysilegluleucysser
195200205
valasnalavalphealaaspasnvallysaspvalvalilehisser
210215220
leupheglyaspglycysalaalaleuvalileglyalaserglnval
225230235240
glnglnglnleuproalaglyservalvalileargserasnpheser
245250255
glnleuleuaspaspalagluaspglyilevalleuglyvalasnhis
260265270
aspglyilethrcysgluleusergluasnleuproasptyriletyr
275280285
argglyvalalaprovalvalalaasnvalleutyraspasnglyleu
290295300
glnglnseraspileaspleutrpalailehisproglyglyprolys
305310315320
ileilegluglnservalargserleuglyileglyvalglucysala
325330335
alaprosertrpaspvalleualaargtyrglyasnmetleuserval
340345350
serleuilephevalleuglumetmetvalglnglnalagluserglu
355360365
lysproleuserthrglyvalalaphealaphealaproglyvalthr
370375380
valgluglymetleupheaspilevalargarg
385390395
<210>9
<211>334
<212>prt
<213>结核分枝杆菌
<400>9
metasnvalseralagluserglyalaproargargalaglyglnarg
151015
hisgluvalglyleualaglnleuproproalaproprothrthrval
202530
alavalilegluglyleualathrglythrproargargvalvalasn
354045
glnseraspalaalaaspargvalalagluleupheleuaspprogly
505560
glnarggluargileproargvaltyrglnlysserargilethrthr
65707580
argargmetalavalaspproleuaspalalyspheaspvalphearg
859095
arggluproalathrileargaspargmethisleuphetyrgluhis
100105110
alavalproleualavalaspvalserlysargalaleualaglyleu
115120125
protyrargalaalagluileglyleuleuvalleualathrserthr
130135140
glypheilealaproglyvalaspvalalailevallysgluleugly
145150155160
leuserproserpheglyaspglycysalaalaleuvalileglyala
165170175
serglnvalglnglulysleugluproglylysvalvalvalargser
180185190
serpheserglnleuleuaspasnthrgluaspglyilevalleugly
195200205
valasnhisasnglyilethrcysgluleusergluasnleuprogly
210215220
tyrilepheserglyvalalaprovalvalthrglumetleutrpasp
225230235240
asnglyleuglnileseraspileaspleutrpalailehisprogly
245250255
glyprolysileilegluglnservalargserleuglyileserala
260265270
gluleualaalaglnsertrpaspvalleualaargpheglyasnmet
275280285
leuservalserleuilephevalleugluthrmetvalglnglnala
290295300
gluseralalysalaileserthrglyvalalaphealapheglypro
305310315320
glyvalthrvalgluglymetleupheaspileileargarg
325330
<210>10
<211>370
<212>prt
<213>疏水性戈登菌
<400>10
metproalaprovalthrthrvalalavalileglualavalalathr
151015
glyalaproalathrvalhisproglnthrargalaalagluglnval
202530
alagluleutyraspaspproalaleuglngluargileargargleu
354045
tyrargasnthrargvalglnthrarghisleualavalasppromet
505560
thrproglupheglnglupheserserargproalathrvalargthr
65707580
argmetasnasptyrphehishisalavalproleualavalaspval
859095
alaargargalaleualaglyvalthraspproalathrgluilegly
100105110
glnileilephevalthrserthrglypheilealaproglyvalasp
115120125
valalavalilethrgluleuglyleualaprothrvalhisargval
130135140
ileileasnphemetglycysalaalaalaileasnglyileserthr
145150155160
alathrasphisvalargalaasnproaspserargalaleuleuile
165170175
cysleugluleuserservalasnalavalpheglyalaaspproval
180185190
gluleuvalthrhisserleupheglyaspglycysglyalametleu
195200205
ileglyalaserprovalglyargargleualaproglyglnleuval
210215220
valargaspthrpheserhisleuphehisaspthrglyaspglyile
225230235240
valleuglyvalasnaspaspglyilethrcysgluleualaglnglu
245250255
leuprosertyrileargargglyvalglyproalaileaspalaala
260265270
leuasnargserargleuargargaspaspilealahistrpalaile
275280285
hisproglyglyproalaileilegluglnservalalaalaleuasp
290295300
leuproproaspargalaalathrsertrpgluvalleualaglutyr
305310315320
glyasnmetleuservalserleuvalphevalleuglulysleuile
325330335
alaalaglyalahisglyargglyglnalaprogluthrglyvalala
340345350
pheserphealaproglyvalalaleugluglymetleupheaspleu
355360365
valcys
370
<210>11
<211>349
<212>prt
<213>荧光假单胞菌pf5
<400>11
metserthrleucysleuprohisvalmetpheproglnhislysile
151015
thrglnglnglnmetvalasphisleugluasnleuhisalaasphis
202530
proargmetalaleualalysargmetilealaasnthrgluvalasn
354045
gluarghisleuvalleuproileaspgluleualavalhisthrgly
505560
phethrhisargserilevaltyrgluargglualaargglnmetser
65707580
seralaalaalaargglnalailegluasnalaglyleuglnileser
859095
aspileargmetvalilevalthrsercysthrglyphemetmetpro
100105110
serleuthralahisleuileasnaspleualaleuprothrserthr
115120125
valglnleuproilealaglnleuglycysvalalaglyalaalaala
130135140
ileasnargalaasnaspphealaargleuaspalaargasnhisval
145150155160
leuilevalserleuglupheserserleucystyrglnproaspasp
165170175
thrlysleuhisalapheileseralaalaleupheglyaspalaval
180185190
seralacysvalleuargalaaspaspglnalaglyglyphelysile
195200205
lyslysthrglusertyrpheleuprolyssergluhistyrilelys
210215220
tyraspvallysaspthrglyphehisphethrleuasplysalaval
225230235240
metasnserilelysaspvalalaprovalmetgluargleuasntyr
245250255
gluserphegluglnasncysalahisasnaspphepheilephehis
260265270
thrglyglyarglysileleuaspgluleuvalmethisleuaspleu
275280285
alaserasnargvalserglnserargserserleuserglualagly
290295300
asnilealaservalvalvalpheaspvalleulysargglnpheasp
305310315320
serasnleuasnargglyaspileglyleuleualaalapheglypro
325330335
glyphethralaglumetalavalglyglutrpthrala
340345
<210>12
<211>381
<212>prt
<213>外子藻
<400>12
metserlysaspgluglnthrvaltyrprovalilealaglymetala
151015
ileglyasnproglntyrargcysthrglnasnglualaleualaval
202530
alaserlyscysproglyleugluserilelysprovalleugluarg
354045
iletyrglyasnserargileglyserargtyrphealavalproasp
505560
phethrproglyargalaalalysglyaspproleuphetyrproala
65707580
aspglysertyrglnvalprovalaspvalargleuasplysphelys
859095
glulysalavalproleuvalseraspvalalaargargalailelys
100105110
glualaglyleuasnvalgluaspileserlysleuvalvalvalser
115120125
serthrglypheleuglyproglyleuaspcysgluleuilelysasn
130135140
leuglyleuthrargservalaspargthrleuileglyphemetgly
145150155160
cysalaalaalametasnglypheargasnalaasnasptyrvalthr
165170175
alaasnproglylystyralaleumetilecysvalgluleuserser
180185190
valhisthrthrpheaspaspasnileasnaspalaileleuhisala
195200205
ilephealaaspglycysalaalaalavalleulysglyalaarglys
210215220
serglucysprolysglythrleualailevalaspasnhisalatrp
225230235240
leumetgluglythrgluaspglyilethrleualailelysproasn
245250255
glyilethrcysthrleuserlyspheleuproglntyrilealalys
260265270
asnilealaphephealaaspglypheleulyslyshislysleugly
275280285
argaspaspvalaspphetrpcysvalhisproglyglyargargile
290295300
ilegluglualaglnasnglyleuglyleuserglugluglnthrala
305310315320
aspsertrpalavalleuglyglutyrglyasnmetleuserproser
325330335
valmetphevalleuserargvalphelysarghisasnalaalaleu
340345350
alaglnglylysproglytyrglnthrglymetalapheserpheser
355360365
proglyvalglyalagluglyileleuleuargglnile
370375380
<210>13
<211>598
<212>dna
<213>酿酒酵母
<400>13
tatcttaactgatagtttgatcaaaggggcaaaacgtaggggcaaacaaacggaaaaatc60
gtttctcaaattttctgatgccaagaactctaaccagtcttatctaaaaattgccttatg120
atccgtctctccggttacagcctgtgtaactgattaatcctgcctttctaatcaccattc180
taatgttttaattaagggattttgtcttcattaacggctttcgctcataaaaatgttatg240
acgttttgcccgcaggcgggaaaccatccacttcacgagactgatctcctctgccggaac300
accgggcatctccaacttataagttggagaaataagagaatttcagattgagagaatgaa360
aaaaaaaaaaaaaaaaggcagaggagagcatagaaatggggttcactttttggtaaagct420
atagcatgcctatcacatataaatagagtgccagtagcgacttttttcacactcgaaata480
ctcttactactgctctcttgttgtttttatcacttcttgtttcttcttggtaaatagaat540
atcaagctacaaaaagcatacaatcaactatcaactattaactatatcgtaatacaca598
<210>14
<211>998
<212>dna
<213>酿酒酵母
<400>14
aaccagggcaaagcaaaataaaagaaacttaatacgttatgccgtaatgaagggctacca60
aaaacgataatctcaactgtaaacaggtacaatgcggacccttttgccacaaaacataca120
tcattcattgccggaaaaagaaagaagtgaagacagcagtgcagccagccatgttgcgcc180
aatctaattatagatgctggtgccctgaggatgtatctggagccagccatggcatcatgc240
gctaccgccggatgtaaaatccgacacgcaaaagaaaaccttcgaggttgcgcacttcgc300
ccacccatgaaccacacggttagtccaaaaggggcagttcagattccagatgcgggaatt360
agcttgctgccaccctcacctcactaacgctgcggtgtgcggatacttcatgctatttat420
agacgcgcgtgtcggaatcagcacgcgcaagaaccaaatgggaaaatcggaatgggtcca480
gaactgctttgagtgctggctattggcgtctgatttccgttttgggaatcctttgccgcg540
cgcccctctcaaaactccgcacaagtcccagaaagcgggaaagaaataaaacgccaccaa600
aaaaaaaaataaaagccaatcctcgaagcgtgggtggtaggccctggattatcccgtaca660
agtatttctcaggagtaaaaaaaccgtttgttttggaattccccatttcgcggccaccta720
cgccgctatctttgcaacaactatctgcgataactcagcaaattttgcatattcgtgttg780
cagtattgcgataatgggagtcttacttccaacataacggcagaaagaaatgtgagaaaa840
ttttgcatcctttgcctccgttcaagtatataaagtcggcatgcttgataatctttcttt900
ccatcctacattgttctaattattcttattctcctttattctttcctaacataccaagaa960
attaatcttctgtcattcgcttaaacactatatcaata998
<210>15
<211>300
<212>dna
<213>酿酒酵母
<400>15
gaagttttgttagaaaataaatcattttttaattgagcattcttattcctattttattta60
aatagttttatgtattgttagctacatacaacagtttaaatcaaattttctttttcccaa120
gtccaaaatggaggtttattttgatgacccgcatgcgattatgttttgaaagtataagac180
tacatacatgtacatatatttaaacatgtaaacccgtccattatattgcttactttcttc240
ttttttgccgttttgacttggacctctggtttgctatttccttacaatctttgctacaat300