本申请是申请号为201280066129.1、申请日为2012年11月5日、发明名称为“一种用于糖蛋白合成的基于原核生物的无细胞系统”的中国发明专利申请的分案申请,原申请为国际申请号为pct/us2012/063590的国家阶段申请,该国际申请要求2011年11月4日提交的美国临时专利申请号61/555,854的优先权,其通过引用整体并入本申请。
发明领域
本发明涉及用于生产糖基化蛋白或肽的无细胞系统、试剂盒和方法。
发明背景
无细胞蛋白合成系统正在逐渐成为有吸引力的替代依靠活细胞的常规表达系统的方案(katzen等,“thepast,presentandfutureofcell-freeproteinsynthesis,”trendsbiotechnol.23:150-156(2005))。这是因为,在过去的十年中,无细胞蛋白合成反应:(i)能够在不到一天的时间内完成;(ii)使用的试剂成本降低;(iii)通过常规形成二硫键折叠复杂的蛋白;以及(iv)能够扩展至100l。两种主要方法已被用于体外转录/翻译:一种是基于无细胞提取物(cef),其通常来源于大肠杆菌、家兔网状细胞或小麦胚芽,另一种是基于纯化组分的重构的蛋白合成(shimizu等,“cell-freetranslationreconstitutedwithpurifiedcomponents,”nat.biotechnol.19:751-755(2001))。由于其有能力在单一的集成平台上共同活化多种生化网络(jewett等,“anintegratedcell-freemetabolicplatformforproteinproductionandsyntheticbiology,”mol.syst.biol.4:220(2008)),因而无细胞系统越来越多地用于多种重要的生物技术和合成生物学应用中(ryabova等,“functionalantibodyproductionusingcell-freetranslation:effectsofproteindisulfideisomeraseandchaperones,”nat.biotechnol.15:79-84(1997);noireaux等,“principlesofcell-freegeneticcircuitassembly,”proc.nat’l.acad.sci.u.s.a.100:12672-12677(2003);yang等,“rapidexpressionofvaccineproteinsforb-celllymphomainacell-freesystem,”biotechnol.bioeng.89:503-511(2005))。
在无细胞系统中准确和有效地将蛋白糖基化的能力将在基础和应用研究的多个领域中具有优势,特别是考虑到n-连接糖基化在蛋白折叠、定量控制、分类、降解、分泌和活化中的重要性。(helenius&aebi,“rolesofn-linkedglycansintheendoplasmicreticulum,”annu.rev.biochem.73:1019-1049(2004))。不幸的是,最佳表征和最广泛使用的基于大肠杆菌的无细胞翻译系统不能制备糖蛋白,因为大肠杆菌缺乏糖基化机制。同样地,家兔网状细胞和小麦胚芽cfe系统也不能进行这种翻译后修饰,因为其缺乏微粒体(tarui等,“anovelcell-freetranslation/glycosylationsystempreparedfrominsectcells,”j.biosci.bioeng.90:508-514(2000))。这可以通过补充具有微粒体囊泡的真核生物cfe克服(例如犬胰腺微粒体)(lingappa等,“coupledcell-freesynthesis,segregation,andcoreglycosylationofasecretoryprotein,”proc.nat’l.acad.sci.u.s.a.75:2338-2342(1978);rothblatt&meyer,“secretioninyeast:reconstitutionofthetranslocationandglycosylationofalpha-factorandinvertaseinahomologouscell-freesystem,”cell44:619-628(1986)),但是由于一些cfe与微粒体囊泡之间的相容性较差所得到的系统并不总是忠实地加工靶蛋白(rothblatt&meyer,“secretioninyeast:reconstitutionofthetranslocationandglycosylationofalpha-factorandinvertaseinahomologouscell-freesystem,”cell44:619-628(1986);moreno等,“anmrna-dependentinvitrotranslationsystemfromtrypanosomabrucei,”mol.biochem.parasitol.46:265-274(1991))。形成能够进行n-连接糖基化的无细胞翻译系统的替代策略是由特定细胞制备cfe,如杂交瘤(mikami等,“ahybridoma-basedinvitrotranslationsystemthatefficientlysynthesizesglycoproteins,”j.biotechnol.127:65-78(2006))、锥虫(moreno等,“anmrna-dependentinvitrotranslationsystemfromtrypanosomabrucei,”mol.biochem.parasitol.46:265-274(1991))、昆虫细胞(tarui等,“anovelcell-freetranslation/glycosylationsystempreparedfrominsectcells,”j.biosci.bioeng.90:508-514(2000))或哺乳动物细胞(shibutani等,“preparationofacell-freetranslationsystemfrompc12cell,”neurochem.res.21:801-807(1996))。然而,这些系统在技术上难以制备并且通常会产生低效的糖基化和较低的产物收率。而且,在上述所有系统中,糖基化过程实际上是“黑箱”,因此难以控制。
本发明的目的是克服本领域中的这些和其他缺陷。
发明概述
本发明的第一个方面涉及一种用于生产糖基化蛋白的无细胞系统。该系统包括能够将聚糖由脂质载体分子转移至糖蛋白靶点的分离的寡糖转移酶(ost);一种或多种分离的聚糖,其中各聚糖均与脂质载体分子连接;以及糖蛋白靶点,其包括一个或多个聚糖接受体氨基酸残基,或者编码所述糖蛋白靶点的核酸分子。
本发明的另一个方面涉及一种试剂盒,所述试剂盒包括能够将聚糖由脂质载体分子转移至糖蛋白靶点的分离的寡糖转移酶,以及一种或多种分离的聚糖,其中各聚糖均与脂质载体分子连接。
本发明的另一个方面涉及一种在无细胞系统中生产糖基化蛋白的方法。该方法包括提供能够将聚糖由脂质载体分子转移至糖蛋白靶点的分离的寡糖转移酶,提供一种或多种分离的聚糖,其中各聚糖均与脂质载体分子连接,以及提供包括一种或多种聚糖接受体氨基酸残基的糖蛋白靶点。该方法进一步包括将所述寡糖转移酶、一种或多种分离的聚糖和糖蛋白靶点组合以形成无细胞糖基化反应混合物,以及将所述无细胞糖基化反应混合物置于使寡糖转移酶有效地促使聚糖由脂质载体分子转移至糖蛋白靶点的一个或多个聚糖接受体残基的条件下以产生糖基化蛋白。
为解决其他无细胞细胞不能准确而有效地将蛋白糖基化的问题,本申请建立了两种新型的无细胞翻译/糖基化系统——称为“glycocfe”和“glycopure”。这些系统将现有的体外翻译系统与重组n-连接糖基化途径相组合。纯化的糖基化组分来源于在革兰氏阴性菌空肠弯曲杆菌(campylobacterjejuni)基因组中存在的蛋白糖基化基因座(pgl)(图1a)。该基因簇编码与真核生物和古生菌在功能上相似的n-连接糖基化系统,其包括寡糖转移酶,该寡糖转移酶催化预组装的寡糖由脂质载体整体转移至多肽保守基序[在真核生物中为n-x1-s/t和在细菌中为d/e-x1-n-x2-s/t(seqidno:1)(kowarik等,“definitionofthebacterialn-glycosylationsiteconsensussequence,”emboj.25:1957-1966(2006),其通过引用整体并入本申请),其中x1和x2为除脯氨酸以外的任意残基]中的天冬酰胺残基(图1b)。空肠弯曲杆菌糖基化机制是非常适合用于无细胞翻译/糖基化系统中的,其原因如下。首先,使用整个pgl基因簇转化的大肠杆菌能够进行n连接蛋白糖基化(wacker等,“n-linkedglycosylationincampylobacterjejunianditsfunctionaltransferintoe.coli,”science298:1790-1793(2002),其通过引用整体并入本申请),从而提供了用于生产纯的活性形式的必要组分的适宜宿主。由于大肠杆菌缺乏天然的糖基化机制,因此避免了来自背景n或o连接系统的潜在污染。其次,称为pglb的空肠弯曲杆菌ost(cjpglb)是一种当溶解在去垢剂中时活化的单亚基酶(lizak等,“x-raystructureofabacterialoligosaccharyltransferase,”nature474:350-355(2011),其通过引用整体并入本申请),并且其活性不需要任何辅助组分。再次,cjpglb能够在翻译后将糖转移至折叠蛋白局部的柔性结构(kowarik等,“n-linkedglycosylationoffoldedproteinsbythebacterialoligosaccharyltransferase,”science314:1148-1150(2006),其通过引用整体并入本申请),这表明无需添加功能性膜系统(例如微粒体)就能够实现蛋白糖基化。
附图简述
图1a-1b显示了细菌和真核生物n-连接糖基化的方面。图1a显示了编码n连接糖基化机制的空肠弯曲杆菌17-kbpgl基因座,其已在大肠杆菌中完全重建。图1b显示了对在原核生物(左侧)和真核生物(右侧)中n-连接糖基化的比较。在这两个系统中,若干糖基转移酶通过将核苷酸活化的糖依次加入内膜胞质面上的脂质载体上合成聚糖。一旦组装后,翻转酶将脂质连接的聚糖(也称为脂质连接的寡糖或llo)跨膜转运,在膜上寡糖转移酶催化该转移至周质或内质网底物蛋白上的asn残基。pglb是单亚基、整合膜蛋白,其与真核生物oststt3的催化亚基同源(注意pg1b和stt3的复合物未按照比例表示)。尽管真核生物和古生菌使用n-x-s/t接受体序列(其中x是除pro以外的任意氨基酸),但是pglb需要在-2位包括asp或glu残基的延长的基序(d/e-x1-n-x2-s/t(seqidno:1),其中x1和x2可以是除pro以外的任意氨基酸)。pglb能够在翻译后将糖转移至折叠蛋白局部的柔性结构。
图2a-2b显示了细菌ost的纯化。cjpglb在大肠杆菌c43(de3)细胞中表达并纯化至接近均一。使用sds-page对从凝胶过滤柱上得到的洗脱组分(如所示的)进行检测,并且将考马斯亮蓝染色凝胶图(图2b)与洗脱图(图2a)一起给出。mw,分子量标准品。
图3a-3c显示了使用确定的组分重建的糖基化。图3a,使用在大肠杆菌中生产的纯化的ost、提取的llo和纯化的接受体蛋白进行的体外糖基化检测。图3a的免疫印迹显示了对接受体蛋白acra和scfv13-r4-gt(均抗-his)或聚糖(抗-聚糖)的检测结果。反应包括3μg野生型cjpglb、5(+)或10(++)μlllo和5μg接受体蛋白。对照包括不同组分(-)的省略物、灭活的pglb(mut)和来自具有空pacyc的scm6细胞的llo(+/-)。糖基化产生了由未经修饰的(g0)向糖基化形式(g1和g2)迁移率的改变。图3b是与图3a中所述的相同的检测,但具有纯化的来自于红嘴鸥弯曲杆菌(campylobacterlari)(clpglb)的pg1b。图3c显示了使用贮存3个月的冻融组分进行体外糖基化后检测的acra的免疫印迹。
图4a-4b显示了acra的无细胞翻译/糖基化。图4a是检测由通过使用大肠杆菌cfe或纯化的翻译组分(pure)体外翻译产生的不同acra构建体(抗-acra)的免疫印迹。通过将条带强度与第1道上样的纯化acra进行比较估算acra的浓度。图4b是检测δssacra表达(抗-acra)和糖基化(抗-聚糖)的免疫印迹。δssacra由经pet24(acra-cyt)启动的cfe或pure系统通过无细胞翻译/糖基化产生。对照包括不同组分(-)的省略物或来自具有空pacyc的scm6细胞的llo(+/-)。
图5a-5b显示了scfv13-r4-gt的无细胞翻译/糖基化。图5a是检测由通过使用大肠杆菌无细胞提取物(cfe)或纯化的翻译组分(pure)体外翻译产生的不同scfv13-r4-gt(抗-flag)的免疫印迹。通过将条带强度与第1道上样的纯化scfv13-r4-gt样品进行比较估算scfv13-r4-gt的浓度。图5b是检测scfv13-r4-gt表达(抗-flag)和糖基化(抗-聚糖)的免疫印迹。scfv13-r4-gt蛋白由经pet24-ssdsbascfv13-r4-gt启动的cfe或pure系统通过无细胞翻译/糖基化产生。对照包括不同组分(-)的省略物。
图6a-6c显示了适用于本发明的系统、试剂盒和方法的不同弯曲杆菌属pg1b蛋白的氨基酸序列比对结果。pglb氨基酸序列来自于空肠弯曲杆菌(c.jejuni)(seqidno:2)、红嘴鸥弯曲杆菌(c.lari)(seqidno:4)、大肠弯曲杆菌(c.coli)(seqidno:6)和乌普萨拉弯曲杆菌(c.upsaliensis)(seqidno:8)。(*)表示具有单一的、完全保守的残基的位置;(:)表示保守基团之间具有较强的相似性质;以及(.)表示保守基团之间具有较弱的相似性质。基于弯曲杆菌属pg1b序列比对的pglb共有序列如seqidno:10所示。在四个弯曲杆菌属序列之间不完全保守的残基以x表示,其中x可以是任意氨基酸残基。或者,x选自在四个所示的弯曲杆菌属序列之一的相应位置的氨基酸残基。
图7a-7e显示了适用于本发明的系统、试剂盒和方法的不同火球菌属(pyrococcus)oststt3亚基蛋白的氨基酸序列比对结果。ost氨基酸序列来自于激烈火球菌(p.furiosus)(seqidno:11)、火球菌属(pyrococcussp).st04(seqidno:13)、火球菌属(pyrococcussp).(菌株na2)(seqidno:14)、超嗜热火球菌(p.horikoshii)(seqidno:15)、深海火球菌(p.abyssi)(seqidno:16)和专性嗜压超嗜热火球菌(p.yayanosii)(seqidno:17)。(*)表示具有单一的、完全保守的残基的位置;(:)表示保守基团之间具有较强的相似性质;以及(.)表示保守基团之间具有较弱的相似性质。基于热球菌属stt3序列比对的stt3共有序列如seqidno:18所示。在六个热球菌属序列之间不完全保守的残基以x表示,其中x可以是任意氨基酸残基。或者,x选自在六个所示的热球菌属序列之一的相应位置的氨基酸残基。
图8a-8d显示了适用于本发明的系统、试剂盒和方法的不同利什曼原虫属(leishmania)oststt3亚基蛋白的氨基酸序列比对结果。ost氨基酸序列来自于硕大利什曼原虫(l.major)(seqidno:19)、杜氏利什曼原虫(l.donovani)(seqidno:21)、婴儿利什曼原虫(l.infantum)(seqidno:22)、墨西哥利什曼原虫(l.mexicana)(seqidno:23)和巴西利什曼原虫(l.braziliensis)(seqidno:24)。(*)表示具有单一的、完全保守的残基的位置;(:)表示保守基团之间具有较强的相似性质;以及(.)表示保守基团之间具有较弱的相似性质。基于利什曼原虫属stt3序列比对的stt3共有序列如seqidno:25所示。在五个利什曼原虫属序列之间不完全保守的残基以x表示,其中x可以是任意氨基酸残基。或者,x选自在五个所示的利什曼原虫属序列之一的相应位置的氨基酸残基。
图9a-9j包含了适用于本发明的系统、试剂盒和方法的真核生物stt3寡糖转移酶的列表。寡糖转移酶以提供了蛋白的氨基酸序列的uniprotkb输入编号(第1列)、uniprotkb输入名称(第2列)、蛋白名称(第3列)、基因名称(第4列)、生物体(第5列)和提供了蛋白编码的核苷酸序列的欧洲分子生物学实验室(embl)数据库登录号(第6列)表示。
发明详述
本发明的第一个方面涉及一种用于生产糖基化蛋白的无细胞系统。该系统包括能够将聚糖由脂质载体分子转移至糖蛋白靶点的分离的寡糖转移酶;一种或多种分离的聚糖,其中各聚糖均与脂质载体分子连接;以及糖蛋白靶点,其包括一个或多个聚糖接受体氨基酸残基,或者编码所述糖蛋白靶点的核酸分子。
根据本发明的这一方面和所有方面,“寡糖转移酶”(“ost”)通常指能够将聚糖即寡糖或多糖由供体底物转移至特定接受体底物的糖基化酶或糖基化酶复合物的亚基。供体底物通常是与聚糖连接的脂质载体分子,接受体底物通常是靶糖蛋白的特定氨基酸残基。适宜的ost包括将聚糖转移至天冬酰胺残基的那些酶即参与n-连接糖基化的ost,以及将聚糖或活化的糖部分转移至氨基酸残基羟基氧分子的那些酶即参与o-连接糖基化的ost。本发明的分离的ost可以是单一亚基的酶、多亚基的酶复合物或者来自于多亚基的酶复合物的单一亚基。尽管下文中描述了多种示例性的ost,但是本领域技术人员将理解本领域公知的任意寡糖转移酶均适用于本发明。
根据本发明的这一方面和所有方面,所述ost可以是原核生物ost。仅作为举例,来自于弯曲空肠杆菌的单一的、整合膜ost蛋白pglb适用于本发明。pglb将七糖与糖蛋白靶点的天冬酰胺残基连接(kowarik等,“definitionofthebacterialn-glycosylationsiteconsensussequence,”emboj.25:1957-66(2006),其整体通过引用并入本申请)。编码弯曲空肠杆菌(c.jejuni)pglb(uniprotkb登录号q9s4v7)的氨基酸序列如下述seqidno:2所示:
编码seqidno:2的氨基酸序列的核酸序列如下述seqidno:3所示(embl核苷酸序列数据库编号aad51383):
seqidno:2和3所示的氨基酸和核苷酸序列分别为代表性的空肠弯曲杆菌的pglb蛋白及其核酸序列。本领域技术人员将理解有至少70个亚种的空肠弯曲杆菌具有pg1b蛋白,其与seqidno:2氨基酸序列的序列一致性可能不同,但是仍具有相同的功能。因此,其特征为与seqidno:2所示的空肠弯曲杆菌的氨基酸序列具有至少约70%、更优选地至少约75%或80%、最优选地至少约85%或90%或95%的氨基酸序列一致性的来自空肠弯曲杆菌其他亚种和菌株的同源性pg1b蛋白序列也适用于本发明。相关空肠弯曲杆菌pg1b蛋白的氨基酸序列及编码其的核苷酸序列是已知的和本领域技术人员易于获得的。
与空肠弯曲杆菌的pglb具有序列一致性和/或能够将寡糖部分转移至靶糖蛋白的来自弯曲杆菌属其他种的ost也适用于本发明的这一方面和所有方面。例如,如本申请所示,来自红嘴鸥弯曲杆菌(campylobacterlari)的pglb(clpglb),其仅与空肠弯曲杆菌的氨基酸序列具有56%的序列一致性(schwarz等,“relaxedacceptorsitespecificityofbacterialoligosaccharyltransferaseinvivo,”glycobiology21:45-54(2011),其全部内容通过引用并入本申请),能够在本发明的无细胞糖基化系统中将聚糖转移至靶糖蛋白的接受体氨基酸残基(即天冬酰胺)。编码c.laripglb(uniprotkb登录号b9kdd4)的氨基酸序列如下述seqidno:4所示:
与seqidno:4所示的红嘴鸥弯曲杆菌(c.lari)的氨基酸序列具有至少约70%、更优选地至少约75%或80%、最优选地至少约85%或90%或95%一致性的氨基酸序列也适用于本发明。编码seqidno:4所示的氨基酸序列的核酸序列如下述seqidno:5所示(embl核苷酸序列数据库编号acm64573.1):
适用于本发明这一方面和所有方面的来自弯曲杆菌属的另一个n连接ost是来自大肠弯曲杆菌(c.coli)的pg1b。编码来自大肠弯曲杆菌(c.coli)的pg1b的氨基酸序列(uniprotkb登录号h7wi6),其与弯曲空肠杆菌(c.jejuni)具有81%的一致性,如下述seqidno:6所示:
与seqidno:6所示的大肠弯曲杆菌(c.coli)的氨基酸序列具有至少约70%、更优选地至少约75%或80%、最优选地至少约85%或90%或95%一致性的氨基酸序列也适用于本发明。编码seqidno:6所示的氨基酸序列的核酸序列如下述seqidno:7所示(embl核苷酸序列数据库编号eib14175):
适用于本发明这一方面和所有方面的另一个弯曲杆菌属的ost是来自乌普萨拉弯曲杆菌(c.upsaliensis)的pg1b。编码来自乌普萨拉弯曲杆菌(c.upsaliensis)的pg1b的氨基酸序列(uniprotkb登录号e6laj2),其与弯曲空肠杆菌(c.jejuni)具有57%的一致性,如下述seqidno:8所示:
与seqidno:8所示的乌普萨拉弯曲杆菌(c.upsaliensis)的氨基酸序列具有至少约70%、更优选地至少约75%或80%、最优选地至少约85%或90%或95%一致性的氨基酸序列也适用于本发明。编码seqidno:8所示的氨基酸序列的核酸序列如下述seqidno:9所示(embl核苷酸序列数据库编号efu71695):
对弯曲杆菌属pg1b序列的比对见图6a-6c,基于该比对的pg1b共有序列如图6中的seqidno:10所示。在四个弯曲杆菌属序列之间不完全保守的残基以x表示,其中x可以是任意氨基酸残基。或者,x选自在所示弯曲杆菌属序列的相应位置所示的四个氨基酸残基之一。
在本发明的另一个实施方式中,ost是古生菌寡糖转移酶。例如,能够将聚糖转移至靶糖蛋白的天冬酰胺残基的来自激烈火球菌(pyrococcusfuriosus)的oststt3亚基适用于本发明的这一方面和所有方面。激烈火球菌(p.furiosus)(uniprotkb登录号q8u4d2)的氨基酸序列如下述seqidno:11所示:
与seqidno:11所示的激烈火球菌(p.furiosus)的氨基酸序列具有至少约70%、更优选地至少约75%或80%、最优选地至少约85%或90%或95%一致性的氨基酸序列也适用于本发明。编码seqidno:11所示的氨基酸序列的核酸序列如下述seqidno:12所示(embl核苷酸序列数据库编号aal80280):
与激烈火球菌(p.furiosus)oststt3亚基相关蛋白具有序列一致性和/或能够将寡糖部分转移至靶糖蛋白的来自火球菌属其他种或菌株的ost也适用于本发明的这一方面和所有方面。例如,来源于火球菌种属(pyrococcussp.)st04(seqidno:13;uniprotkbno.i3rcf1)、火球菌种属(菌株na2)(seqidno:14;uniprotkbno.f4hm23)、超嗜热火球菌(p.horikoshii)(seqidno:15;uniprotkbno.o74088)、深海火球菌(p.abyssi)(seqidno:16;uniprotkbno.q9v250)和专性嗜压超嗜热火球菌(p.yayanosii)(seqidno:17;uniprotkbno.f8aig3)的同源ost均与激烈火球菌(p.furiosus)ost(参见图7的比对结构)的氨基酸序列具有70%以上序列一致性,其适用于本发明的这一方面和所有方面。编码前述火球菌属ost的核苷酸序列是已知的和本领域易于获得的。基于火球菌属stt3序列比对的stt3共有序列如图7中的seqidno:18所示。在六个火球菌属序列之间不完全保守的残基以x表示,其中x可以是任意氨基酸残基。或者,x选自在六个所示的火球菌属序列之一的相应位置的氨基酸残基。
在本发明的另一个实施方式中,所述ost是真核生物寡糖转移酶。例如,硕大利什曼原虫(leishmaniamajor)ost的stt3亚基,其能够将聚糖转移至靶糖蛋白的天冬酰胺残基,其适用于本发明的这一方面和所有方面。硕大利什曼原虫(l.major)的氨基酸残基(uniprotkb登录号q9u5n8)如下述seqidno:19所示。
与seqidno:19所示的硕大利什曼原虫(l.major)的氨基酸序列具有至少约70%、更优选地至少约75%或80%、最优选地至少约85%或90%或95%一致性的氨基酸序列也适用于本发明。编码seqidno:19所示的氨基酸序列(l.majorstt3)的核酸序列如下述seqidno:20所示(embl核苷酸序列数据库编号cab61569):
与硕大利什曼原虫(l.major)oststt3亚基相关蛋白具有序列一致性和/或能够将寡糖部分转移至靶糖蛋白的来自利什曼原虫属其他种或菌株的ost也适用于本发明。例如,来源于杜氏利什曼原虫(l.donovani)(seqidno:21;uniprotkbno.e9brz2)、婴儿利什曼原虫(l.infantum)(seqidno:22;uniprotkbno.a4ib10)、墨西哥利什曼原虫(l.mexicana)(seqidno:23;uniprotkbkbno.e9b5z4)和巴西利什曼原虫(l.braziliensis)(seqidno:24;uniprotkbno.a4hmd6)的同源性ost,其均与硕大利什曼原虫(l.major)ost的氨基酸序列(参见图8的比对结果)具有70%以上的序列一致性,也适用于本发明的这一方面和所有方面。基于利什曼原虫属stt3序列比对的stt3共有序列如图8中的seqidno:25所示。在五个利什曼原虫属序列之间不完全保守的残基以x表示,其中x可以是任意氨基酸残基。或者,x选自在五个所示的利什曼原虫属序列之一的相应位置的氨基酸残基。
在本发明的另一个实施方式中,所述真核生物寡糖转移酶是酿酒酵母(saccharomycescerevisiae)的stt3。酿酒酵母(s.cerevisiae)的氨基酸序列(uniprotkb登录号p39007)如下述seqidno:26所示。
与seqidno:26所示的酿酒酵母(s.cerevisiae)的氨基酸序列具有至少约70%、更优选地至少约75%或80%、最优选地至少约85%或90%或95%一致性的氨基酸序列也适用于本发明。编码seqidno:26所示的氨基酸序列(酿酒酵母(s.cerevisiae)stt3)的核酸序列如下述seqidno:27所示(embl核苷酸序列数据库编号baa06079)。
在本发明的另一个实施方式中,所述真核生物寡糖转移酶是栗酒裂殖酵母(schizosaccharomycespombe)的stt3。栗酒裂殖酵母(s.pombe)的氨基酸序列(uniprotkb登录号o94335)如下述seqidno:28所示。
与seqidno:28所示的栗酒裂殖酵母(s.pombe)的氨基酸序列具有至少约70%、更优选地至少约75%或80%、最优选地至少约85%或90%或95%一致性的氨基酸序列也适用于本发明。编码seqidno:28所示的氨基酸序列(栗酒裂殖酵母(s.pombe)stt3)的核酸序列如下述seqidno:29所示(embl核苷酸序列数据库编号baa76479)。
在本发明的另一个实施方式中,所述真核生物寡糖转移酶是盘基网柄菌(dictyosteliumdiscoideum)的stt3。盘基网柄菌(d.discoideum)的氨基酸序列(uniprotkb登录号q54nm9)如下述seqidno:30所示。
与seqidno:30所示的盘基网柄菌(d.discoideum)的氨基酸序列具有至少约70%、更优选地至少约75%或80%、最优选地至少约85%或90%或95%一致性的氨基酸序列也适用于本发明。编码seqidno:30所示的氨基酸序列(盘基网柄菌(d.discoideum)stt3)的核酸序列如下述seqidno:31所示(embl核苷酸序列数据库编号eal64892)。
能够在本发明的这一方面和所有方面使用的其他真核生物寡糖转移酶列于图9a-9g的表中。该表中以提供了所述蛋白的氨基酸序列的uniprotkb项目流水号以及提供了编码的核苷酸序列的embl数据库登录号表示各寡糖转移酶。各寡糖转移酶列于图9中的uniprotkb和embl登录号以及相应的氨基酸和核苷酸序列信息整体通过引用并入本申请。
在本发明的另一个实施方式中,所述寡糖转移酶是o连接的寡糖转移酶。一个示例性的o连接ost是铜绿假单胞菌(pseudomonasaeruginosa)的pilo。pilo负责将寡糖由与脂质连接的供体整块转移至丝氨酸和苏氨酸残基的氧原子(faridmoayer等,“functionalcharacterizationofbacterialoligosaccharyltransferasesinvolvedino-linkedproteinglycosylation,”j.bacteriol.189(22):8088-8098(2007),其通过引用整体并入本申请)。铜绿假单胞菌(p.aeruginosa)的氨基酸序列(uniprotkb登录号q51353)如下述seqidno:32所示:
与seqidno:32所示的铜绿假单胞菌(p.aeruginosa)的氨基酸序列具有至少约70%、更优选地至少约75%或80%、最优选地至少约85%或90%或95%一致性的氨基酸序列也适用于本发明。编码seqidno:33所示的氨基酸序列(铜绿假单胞菌(p.aeruginosa)pilo)的核酸序列如下述seqidno:33所示(embl核苷酸序列数据库编号aaa87404)。
适用于本发明所有方面的另一个示例性o连接的ost是脑膜炎双球菌(neisseriameningitidis)的pgll(faridmoayer等,“functionalcharacterizationofbacterialoligosaccharyltransferasesinvolvedino-linkedproteinglycosylation,”j.bacteriol.189(22):8088-8098(2007),其通过引用整体并入本申请)。脑膜炎双球菌(n.meningitidis)的氨基酸序列(uniprotkb登录号g1fg65)如下述seqidno:34所示:
与seqidno:34所示的脑膜炎双球菌(n.menigitidis)的氨基酸序列具有至少约70%、更优选地至少约75%或80%、最优选地至少约85%或90%或95%一致性的氨基酸序列也适用于本发明。编码seqidno:34所示的氨基酸序列(脑膜炎双球菌(n.menigitidis)pgll)的核酸序列如下述seqidno:35所示(embl核苷酸序列数据库编号aek98518)。
如本申请所使用的,“分离的”寡糖转移酶指基本上是纯的或基本上分离自在其天然的宿主细胞中天然伴随着天然蛋白的其他细胞组分的寡糖转移酶。通常地,本发明的分离的寡糖转移的纯度约80%,通常至少约90%以及更优选地至少约95%。可以采用本领域公知的任意方法对纯度进行评估,例如聚丙烯酰胺凝胶电泳、hplc等。所述分离的寡糖转移酶可以从作为其直接来源的生物体中获得,或者从本申请实施例所述的宿主细胞中或使用下文所述的本领域公知的技术重组生产和纯化。
在通常情况下,使用重组表达系统生产和分离所目的蛋白涉及将编码所需蛋白的氨基酸序列的核酸分子插入表达系统中,所述分子在其中是异源性的(即通常是不存在的)。可以将编码一种或多种蛋白的一种或多种所需的核酸分子插入所述载体中。当插入多种核酸分子时,所述多种核酸分子可以编码相同或不同的酶。将异源性核酸分子以相对于启动子和任意其他的5’调控分子以及正确的阅读框架的正确的有意义(5’→3’)方向插入表达系统或载体中。
可以采用本领域公知的标准克隆程序制备核酸构建体,如josephsambrook等,molecularcloning:alaboratorymanual(coldspringsharbor1989)以及cohen和boyer的美国专利号4,237,224所述的,其通过引用整体并入本申请。然后通过转化的方法将这些重组质粒引入适宜的宿主细胞并使其在宿主细胞中复制。
可以将控制多个层面上基因表达(例如dna转录和信使rna(“mrna”)翻译)的多种遗传信号和加工事件引入核酸构建体以便最大限度的提高酶的生产。为了表达编码一种或多种所需酶的克隆的核酸序列,使用强启动子以获得高水平的转录是有益的。根据所使用的宿主系统,可以使用多种适宜的启动子中的任意一种。例如,当在大肠杆菌(e.coli)中克隆时,可以使用其噬菌体或质粒启动子如t7噬菌体启动子、lac启动子、trp启动子、reca启动子、核糖体rna启动子、大肠杆菌噬菌体λ的pr和pl启动子等其他的包括但不限于lacuv5、ompf、bla、lpp等以使得邻近的dna区段高水平的转录。此外,可以使用由重组dna或其他合成dna技术生产的杂交trp-lacuv5(tac)启动子或其他大肠杆菌(e.coli)启动子以便将插入的基因转录。适于在哺乳动物细胞中引导表达的常见启动子包括但不限于sv40、mmtv、金属硫蛋白-1、腺病毒ela、cmv、立即早期、免疫球蛋白重链启动子和增强子以及rsv-ltr。
可以在核酸构建体中引入在原核细胞中有效基因转录和翻译所需的其他特异性起始信号以便最大限度的产生肽,例如shine-dalgarno核糖体结合位点。根据所使用的载体系统和宿主,可以使用任意数量适宜的转录和/或翻译元件包括组成型、诱导型和阻遏型启动子,以及最小的5’启动子元件、增强子或先导序列。最大限度地提高基因表达的综述见roberts和lauer,“maximizinggeneexpressiononaplasmidusingrecombinationinvitro,”methodsinenzymology68:473–82(1979),其通过引用整体并入本申请。
使用本领域的标准克隆程序将编码寡糖转移酶或本发明的其他蛋白组分(例如糖蛋白靶点、参与聚糖生产的酶)的核酸分子、所选择的启动子分子包括但不限于增强子和先导序列、使得在宿主中转录的适宜的3’调控区以及任意其他所需的组分如报告子或标记物基因克隆至所选择的载体中,如根据josephsambrook等,molecularcloning:alaboratorymanual(coldspringsharbor1989);frederickm.ausubel,shortprotocolsinmolecularbiology(wiley1999)以及cohen和boyer的美国专利号4,237,224所述的,其通过引用整体并入本申请。
一旦编码蛋白的核酸分子克隆至表达载体中,其已准备好掺入宿主中。可以使用本领域公知的标准克隆程序将重组分子引入细胞中,不限于通过转染(如果宿主是真核生物)、转导、偶联、带动转移、电穿孔、脂质转染、原生质体融合、氯化钙转化、带动转移、使用噬菌体转染或粒子轰击,如josephsambrook等,molecularcloning:alaboratorymanual(coldspringsharbor1989)所述的,其通过引用整体并入本申请。
用于重组蛋白生产的适宜宿主细胞包括原核和真核细胞。适宜的原核宿主细胞包括但不限于大肠杆菌和其他肠杆菌科细菌埃希氏菌属(escherichiasp.)、弯曲杆菌属(campylobactersp.)、沃廉菌属(wolinellasp.)、脱硫弧菌属(desulfovibriosp.)、弧菌属(vibriosp.)、假单胞菌属(pseudomonassp.)、芽孢杆菌属(bacillussp.)、李斯特氏菌属(listeriasp.)、葡萄球菌属(staphylococcussp.)、链球菌属(streptococcussp.)、消化链球菌属(peptostreptococcussp.)、巨球型菌属(megasphaerasp.)、梳状菌属(pectinatussp.)、月形单胞菌属(selenomonassp.)、嗜发酵菌属(zymophilussp.)、放线菌属(actinomycessp.)、节杆菌属(arthrobactersp.)、弗兰克菌(frankiasp.)、单孢丝菌(micromonosporasp.)、诺卡氏菌(nocardiasp.)、丙酸杆菌属(propionibacteriumsp.)、链霉菌属(streptomycessp.)、乳杆菌属(lactobacillussp.)、乳球菌属(lactococcussp.)、明串珠菌(leuconostocsp.)、片球菌(pediococcussp.)、醋酸杆菌属(acetobacteriumsp.)、真杆菌属(eubacteriumsp.)、太阳杆菌属(heliobacteriumsp.)、螺旋阳光菌属(heliospirillumsp.)、鼠孢菌属(sporomusasp.)、螺原体(spiroplasmasp.)、尿支原体属(ureaplasmasp.)、丹毒丝菌属(erysipelothrix,sp.)、棒杆菌属(corynebacteriumsp.)、肠球菌属(enterococcussp.)、梭菌属(clostridiumsp.)、支原体属(mycoplasmasp.)、分枝杆菌属(mycobacteriumsp.)、放线菌属(actinobacteriasp.)、沙门氏菌属(salmonellasp.)、志贺氏菌属(shigellasp.)、莫拉氏菌属(moraxellasp.)、缠绕杆菌属(helicobactersp.)、寡养单胞菌属(stenotrophomonassp.)、微球菌属(micrococcussp.)、奈瑟氏菌属(neisseriasp.)、蛭弧菌属(bdellovibriosp.)、嗜血杆菌属(hemophilussp.)、克雷伯氏菌属(klebsiellasp.)、奇异变形杆菌(proteusmirabilis)、阴沟肠杆菌(enterobactercloacae)、沙雷氏菌属(serratiasp.)、枸橼酸杆菌属(citrobactersp.)、变形杆菌属(proteussp.)、沙雷氏菌属(serratiasp.)、耶尔森氏菌属(yersiniasp.)、不动杆菌属(acinetobactersp.)、放线杆菌属(actinobacillussp.)、博德特氏菌属(bordetellasp.)、布鲁氏菌(brucellasp.)、二氧化碳嗜纤维菌属(capnocytophagasp.)、心杆菌属(cardiobacteriumsp.)、艾肯菌属(eikenellasp.)、弗朗西斯氏菌(francisellasp.)、嗜血杆菌属(haemophilussp.)、金氏菌属(kingellasp.)、巴斯德菌属(pasteurellasp.)、黄杆菌属(flavobacteriumsp.)、黄单胞菌属(xanthomonassp.)、鼻疽菌属(burkholderiasp.)、气单胞菌属(aeromonassp.)、邻单胞菌属(plesiomonassp.)、军团菌属(legionellasp.)和α-变形菌如沃尔巴克氏体属(wolbachiasp.)、蓝藻、螺旋体、绿色硫黄菌和绿色非硫磺菌、革兰氏阴性球菌、苛求的革兰氏阴性杆菌、肠杆菌-葡萄糖-发酵的革兰氏阴性杆菌、革兰氏阴性杆菌-非葡萄糖发酵菌、革兰氏阴性杆菌-葡萄糖发酵的氧化酶阳性菌。除了细菌细胞以外,真核细胞如哺乳动物、昆虫和酵母系统也是用于重组蛋白生产的表达载体转染/转化的适宜宿主细胞。在本领域中能够获得的用于表达异源性蛋白或多肽的哺乳动物细胞系包括中国仓鼠卵巢细胞、hela细胞、仓鼠崽肾细胞、cos细胞和其他多种。
可以采用本领域公知的若干方法从宿主细胞中获得纯化的蛋白,包括离子交换层析、疏水性相互作用层析、亲和层析、凝胶过滤和反相层析。所述肽优选地通过常规技术以纯化形式生产(优选地纯度至少约70至约75%、或者纯度约80%至85%、更优选地纯度至少约90%或95%)。根据是否将重组的宿主细胞制成将蛋白分泌至生长培养基中(参见bauer等的美国专利号6,596,509,其通过引用整体并入本申请),可以通过离心(将细胞组分与含有分泌蛋白的上清液分离)随后将上清液进行逐级硫酸铵沉淀分离和纯化蛋白。可以将含有蛋白的组分在适宜尺寸的葡聚糖或聚丙烯酰胺柱进行凝胶过滤以便将所述蛋白与其他细胞组分和蛋白分离。如有必要,可以使用hplc对蛋白组分进行进一步纯化。
寡糖转移酶催化聚糖由脂质供体转移至接受体蛋白、肽或多肽。在本发明的一个实施方式中,所述脂质供体或载体分子是原核脂质供体,即其在原核生物中制备或对原核生物是天然的。原核脂质供体的例子包括十一异戊烯-磷酸酯和十一异戊烯-磷酸酯连接的杆菌胺(bacillosamine)(weerapana等,“investigatingbacterialn-linkedglycosylation:synthesisandglycosylacceptoractivityoftheundecaprenylpyrophosphate-linkedbacillosamine,”j.am.chem.soc.127:13766-67(2005),其通过引用整体并入本申请)。在本发明的另一个实施方式中,所述脂质供体是真核脂质供体,即其在真核细胞中制备或对真核细胞是天然的。示例性的真核脂质供体是多萜基焦磷酸酯。
根据本发明的这一方面和所有方面,所述聚糖包含与脂质供体分子连接的寡糖或多糖。构成寡糖或多糖链的聚糖组分的组合物在单糖单元的数量和类型上是不同的。聚糖的单糖组分包括但不限于一个或多个葡萄糖(glc)、半乳糖(gal)、甘露糖(man)、岩藻糖(fuc)、n-乙酰半乳糖胺(galnac)、n-乙酰葡糖胺(glcnac)、葡糖醛酸(glucorionicacid)、木糖、唾液酸(例如n-乙酰-神经氨酸(neuac))、6-脱氧-塔罗糖和鼠李糖单糖。
根据本发明的这一方面和所有方面,所述聚糖可以是原核生物、古生菌或真核生物聚糖。或者,所述聚糖可以包含完全非天然的聚糖组合物。
在本发明的一个实施方式中,所述聚糖是由一种或多种原核生物糖基转移酶生产的原核生物聚糖。在本发明的另一个实施方式中,所述原核生物聚糖使用原核生物和真核生物糖基转移酶的组合生产,但是其具有模拟原核生物聚糖结构的单糖组合物。在本发明的另一个实施方式中,所述原核生物聚糖是合成生产的(seeberger等,chemicalandenzymaticsynthesisofglycansandglycoconjugates,inessentialsofglycobiology(a.varki等eds.,2009),其通过引用整体并入本申请)。
示例性的原核生物聚糖是由空肠弯曲杆菌(c.jejuni)、大肠弯曲杆菌(c.coli)、红嘴鸥弯曲杆菌(c.lari)或乌普萨拉弯曲杆菌(c.upsaliensis)pgl基因簇或经修饰的空肠弯曲杆菌(c.jejuni)、大肠弯曲杆菌(c.coli)、红嘴鸥弯曲杆菌(c.lari或乌普萨拉弯曲杆菌(c.upsaliensis)pgl基因簇的糖基转移酶生产的聚糖。pgl簇的基因包括wlaa、gale、wlab、pglh、pgli、pglj、pglb、pgla、pglc、pgld、wlaj、pgle、pglf和pglg(szymanski和wren,“proteinglycosylationinbacterialmucosalpathogens,”naturemicrobiol.3:225-237(2005),其通过引用整体并入本申请)。原核生物聚糖通常包含二乙酰胺基-三脱氧糖,杆菌胺(bacillosamine)(bac;2,4-二乙酰胺基-2,4,6-三脱氧葡萄糖)。本发明这一方面和所有方面的适宜的原核生物聚糖是庚糖包括葡萄糖、n-乙酰半乳糖胺和杆菌胺,即glcgalnac5bac。
如本申请中的实施例所述,本发明这一方面和所有方面的聚糖可以重组生产。例如,可以将编码进行glcgalnac5bac庚糖和其他聚糖结构生物合成的酶的修饰或未经修饰的空肠弯曲杆菌(c.jejuni)pgl基因簇分离并转移至用于生产脂质连接的聚糖的适宜宿主细胞中(亦参见wacker等,“n-linkedglycosylationincampylobacterjejunianditsfunctionaltransferintoe.coli,”science298(5599):1790-93(2002),其通过引用整体并入本申请)。来源于其他弯曲杆菌种属例如大肠弯曲杆菌(c.coli)、红嘴鸥弯曲杆菌(c.lari)和乌普萨拉弯曲杆菌(c.upsaliensis)的pgl基因簇也适于重组生产用于本发明所有方面的聚糖(szymanski和wren,“proteinglycosylationinbacterialmucosalpathogens,”naturemicrobiol.3:225-237(2005),其通过引用整体并入本申请)。此外,已在产琥珀酸沃林氏菌(wolinellasuccinogens)、硫酸盐还原菌(desulfovibriodesulfuricans)和普通脱硫弧菌(d.vulgaris)中鉴定得到的类似pg1样糖基化基因基因座也适于重组生产本发明的聚糖(baar等,“completegenomesequenceandanalysisofwolinellasuccinogenes,”proc.natl.acad.sci.usa100:11690-11695(2003)以及szymanski和wren,“proteinglycosylationinbacterialmucosalpathogens,”naturemicrobiol.3:225-237(2005),其通过引用整体并入本申请)。
可以对pg1基因簇进行修饰以增强脂质连接的聚糖在宿主细胞中的产生、累积和分离。例如,将基因簇的寡糖转移酶组分(例如在pgl基因簇中的pglb基因)灭活是所需的以阻止脂质连接的聚糖向宿主细胞的糖蛋白靶点转移。此外,在本发明的一些实施方式中,可能需要减弱、破坏或缺失宿主细胞中的竞争性聚糖生物合成反应。特别地,可能也需要将参与将聚糖转移或连接至宿主细胞接受体部分的宿主细胞糖基转移酶(n-连接或o-连接反应酶)或其他酶灭活。例如,当使用大肠杆菌(e.coli)作为宿主细胞时,将聚糖由十一异戊烯脂质载体转移至脂质a的waal酶的缺失,反而使寡糖穿梭至外膜的外叶,这将确保重组产生的脂质连接的聚糖在内膜中累积。可以缺失、破坏或修饰的其他大肠杆菌宿主细胞糖基化相关酶包括但不限于weca、wbbl、glct、glf、gaft、wzx、wzy以及o16抗原生物合成通路的酶。
在本发明的另一个实施方式中,所述聚糖是真核生物聚糖,即由一种或多种真核糖基转移酶生产的聚糖。在本发明的一个实施方式中,真核生物聚糖仅由真核糖基转移酶生产。在本发明的另一个实施方式中,所述真核聚糖使用原核生物和真核生物糖基转移酶的组合生产,但是其模拟真核生物聚糖的结构。在本发明的另一个实施方式中,所述真核生物聚糖是合成生产的(seeberger等,chemicalandenzymaticsynthesisofglycansandglycoconjugates,inessentialsofglycobiology(a.varki等,eds.,2009),其通过引用整体并入本申请)。
在一个实施方式中,所述真核生物聚糖包含glcnac2核。所述glcnac2核可以进一步包含至少一个甘露糖残基。适宜的真核生物聚糖结构可以包括但不限于man1glcnac2、man2glcnac2和man3glcnac2。
如上文所述,可以通过在适宜的宿主细胞中引入一种或多种真核糖基转移酶重组生产真核生物脂质连接的聚糖。如本申请所使用的真核糖基转移酶指催化糖基从供体底物例如从活化的核苷酸的糖转移至接受体底物例如增长的脂质连接的寡糖链的酶。能够在宿主细胞中被利用以促进系统的真核生物脂质连接的聚糖重组生产的适宜的糖基转移酶包括但不限于半乳糖转移酶(例如β1,4-半乳糖转移酶、β1,3-半乳糖转移酶)、岩藻糖转移酶、葡萄糖转移酶、n-乙酰半乳糖胺转移酶(例如galnact、galnac-t1、galnac-t2、galnac-t3)、n-乙酰葡糖胺转移酶(例如β-1,2-n-乙酰葡糖氨基转移酶i(gnti-)、gnt-ii、gnt-iii、gnt-iv、gnt-v、gnt-vi和gvt-ivh)、葡糖醛酸转移酶、唾液酸转移酶(例如α(2,3)唾液酸转移酶、α-n-乙酰半乳糖胺α-2,6-唾液酸转移酶i、galβ1,3galnacα2,3-唾液酸转移酶、β半乳糖苷-α-2,6-唾液酸转移酶和α2,8-唾液酸转移酶)、甘露糖转移酶(例如α-1,6-甘露糖转移酶、α-1,3-甘露糖转移酶、β-1,4-甘露糖转移酶)、葡糖醛酸转移酶、半乳糖醛酸转移酶等。已经在多种真核生物系统中对上述糖基转移酶进行了广泛的研究。因此,这些酶的核酸和氨基酸序列是本领域技术人员公知的和易于获得的。此外,这些酶中的多种是市售的(例如sigma-aldrich,st.louis,mo)。
用于生产原核生物或真核生物脂质连接聚糖的适宜的宿主细胞包括原核生物宿主细胞和真核生物宿主细胞。示例性的适宜宿主细胞列表如上文所示。当在原核宿主细胞中使用真核糖基转移酶时,可以对真核糖基转移酶的核苷酸序列进行密码子优化以克服与大肠杆菌(e.coli)(及其他细菌)和更高级的生物体之间密码子使用偏好相关的局限性,如酵母和哺乳动物细胞。密码子使用偏好指生物体在蛋白编码dna序列(基因)的密码子出现频率上存在差异。密码子是编码多肽链中特定氨基酸残基的一系列三联核苷酸(三联体)。可以通过制备特异性的颠换核苷酸改变,即嘌呤变成嘧啶或嘧啶变成嘌呤的核苷酸改变,或者转换核苷酸改变,即嘌呤变为嘌呤或嘧啶变为嘧啶的核苷酸改变。
根据本发明的这一方面和所有方面,“糖蛋白靶点”包括包含一个或多个聚糖接受体氨基酸残基的任意肽、多肽或蛋白。典型地聚糖接受体残基包含天冬酰胺(n或asn)以形成n-连接糖蛋白,或者在羟基赖氨酸、羟基脯氨酸、丝氨酸、苏氨酸或酪氨酸侧链上的羟基氧以形成o-连接糖蛋白。多种多样的糖蛋白靶点存在于包括但不限于结构分子(例如胶原蛋白)、润滑和保护剂(例如粘蛋白)、转运蛋白(例如转铁蛋白)、免疫蛋白(免疫球蛋白、组织相容性抗原)、激素、酶、细胞连接识别位点、受体、蛋白折叠伴侣、发育调控蛋白和参与止血和血栓形成的蛋白。治疗性蛋白如抗体是本发明系统重要的糖蛋白靶点。
根据本发明的这一方面和所有方面,糖蛋白靶点的一个或多个寡糖接受体残基可以是天冬酰胺(n或asn)残基。天冬酰胺残基位于包含n-x1-s/t(真核生物共有序列)或d/e-x1-n-x2-s/t(seqidno:1)(原核生物共有序列)的糖基化共有序列中,其中d是天冬氨酸,x1和x2是除了脯氨酸以外的任意氨基酸,n是天冬酰胺和t是苏氨酸。
根据本发明这一方面和所有方面的糖蛋白靶点可以是包含所需聚糖接受体残基的纯化的蛋白、肽或多肽。或者,所述糖蛋白靶点可以是编码所述糖蛋白靶点的分离的核酸分子形式。根据本发明的这个实施方式,所述系统进一步包括适于由所述核酸分子合成糖蛋白靶点的试剂,即翻译试剂。
用于在体外(即无细胞环境)由核酸分子合成蛋白的试剂是本领域公知的。这些试剂或系统通常由家兔网状细胞、小麦胚芽和大肠杆菌(e.coli)的提取物组成。所述提取物含有翻译外源性rna分子所必需的所有大分子组分,包括例如核糖体,trna,氨酰基-trna合成酶,起始、延伸和终止因子。该系统所需的其他组分包括氨基酸、能量来源(例如atp、gtp)、能量再生系统(用于真核生物系统的磷酸肌酸和肌酸磷酸激酶和用于原核生物系统的磷酸烯醇丙酮酸和丙酮酸激酶)以及其他辅因子(例如mg2+、k+等)。如果编码糖蛋白靶点的核酸分子是dna分子,则无细胞翻译反应与利用rna聚合酶的起始转录反应偶联或连接。
本发明的另一个方面涉及一种试剂盒,所述试剂盒包括能够将聚糖由脂质载体分子转移至糖蛋白靶点的分离的寡糖转移酶和一种或多种分离的聚糖,其中各聚糖均与脂质载体分子连接。
根据本发明的这一方面,所述试剂盒的分离的寡糖转移酶可以是纯化的蛋白或者可以是编码寡糖转移酶的核酸的形式。核酸分子可以是dna或rna分子,并且其可以是线性的(裸露的)或环状的(位于表达载体中)。示例性的原核生物、古生菌和真核生物寡糖转移酶如上文所述。
如上文所述,所述一种或多种聚糖与脂质载体分子连接(例如十一异戊烯醇-焦磷酸酯、十一异戊烯焦磷酸酯连接的杆菌胺或多萜基焦磷酸酯)。亦如上文所述,所述聚糖可以包含原核生物、古生菌、真核生物或完全非天然合成的聚糖。适宜的原核生物核心聚糖结构包括包含葡萄糖、n-乙酰半乳糖胺和任选地杆菌胺(例如glcgalnac5bac)的庚糖。适宜的真核生物聚糖核心结构包括n-乙酰葡糖胺和甘露糖(例如man1glcnac2、man2glcnac2和man3glcnac2)。
在本发明这一方面的一个实施方式中,所述试剂盒的一种或多种与脂质载体分子连接的分离的聚糖是组合和纯化的形式。或者,本发明的试剂盒包括编码一种或多种真核生物和/或原核生物糖基转移酶的一种或多种核酸分子以及含有聚异戊二烯基焦磷酸酯聚糖载体并且能够表达一种或多种核酸分子的宿主细胞(真核或原核)。根据本发明的这一实施方式,所述试剂盒可以进一步含有用于在使用其他的试剂盒组分之前在宿主细胞中重组生产和分离脂质连接的聚糖的说明书。
本发明的试剂盒可以进一步包括用于合成所选择的寡糖转移酶和/或糖蛋白、肽或多肽的体外或无细胞转录和/或翻译试剂。
本发明的另一个方面涉及一种在无细胞系统中生产糖基化蛋白的方法。该方法涉及提供一种能够将聚糖由脂质载体分子转移至糖蛋白靶点的分离的寡糖转移酶,提供一种或多种分离的聚糖,其中各聚糖均与脂质载体分子连接,以及提供包括一种或多种聚糖接受体氨基酸残基的糖蛋白靶点。该方法进一步涉及将所述寡糖转移酶、一种或多种分离的聚糖以及糖蛋白靶点组合以形成无细胞糖基化反应混合物,以及将所述无细胞糖基化反应混合物置于使寡糖转移酶有效地将聚糖由脂质载体分子转移至糖蛋白靶点的一种或多种聚糖接受体残基的条件下以生产糖基化的蛋白。
本发明方法的组分即寡糖转移酶、与脂质载体分子连接的分离的聚糖和糖蛋白靶点已在上文中详细地描述。
本发明的方法可以包括一个或多个附加步骤。例如,通过提供适于由核酸分子合成糖蛋白靶点的试剂可以将糖蛋白靶点的翻译与糖基化偶联。在本发明的这个实施方式中,将编码糖蛋白靶点的核酸分子、翻译试剂、寡糖转移酶、分离的聚糖全部组合以形成翻译-糖基化反应混合物。然后,在糖基化反应之前或同时由靶核酸分子合成糖蛋白靶点。
本申请还包括以下实施方式:
实施方式1.一种用于生产糖基化蛋白的无细胞系统,所述系统包括:
能够将聚糖由脂质载体分子转移至糖蛋白靶点的分离的寡糖转移酶;
一种或多种分离的聚糖,其中各聚糖均与脂质载体分子连接;以及
糖蛋白靶点,其包括一个或多个聚糖接受体氨基酸残基,或者编码所述糖蛋白靶点的核酸分子。
实施方式2.根据实施方式1所述的系统,其中所述寡糖转移酶是原核生物寡糖转移酶。
实施方式3.根据实施方式2所述的系统,其中所述原核生物寡糖转移酶来源于弯曲杆菌属(campylobacter)。
实施方式4.根据实施方式1所述的系统,其中所述寡糖转移酶是古生菌寡糖转移酶。
实施方式5.根据实施方式1所述的系统,其中所述寡糖转移酶是真核生物寡糖转移酶。
实施方式6.根据实施方式1所述的系统,其中所述脂质载体分子包括十一碳二烯磷酸酯。
实施方式7.根据实施方式1所述的系统,其中所述一种或多种分离的聚糖包括原核生物聚糖。
实施方式8.根据实施方式1所述的系统,其中所述原核生物聚糖包括glcgalnac5bac。
实施方式9.根据实施方式1所述的系统,其中所述一种或多种分离的聚糖包括真核生物聚糖。
实施方式10.根据实施方式9所述的系统,其中所述真核生物聚糖包括glcnac2。
实施方式11.根据实施方式10所述的系统,其中所述真核生物聚糖进一步包括至少一个甘露糖残基。
实施方式12.根据实施方式9所述的系统,其中所述真核生物聚糖包括选自man1glcnac2、man2glcnac2和man3glcnac2的组分。
实施方式13.根据实施方式1所述的系统,其中所述糖蛋白靶点的一个或多个聚糖接受体氨基酸残基是天冬酰胺残基。
实施方式14.根据实施方式13所述的系统,其中糖蛋白靶点进一步包括n-x1-s/t或d/e-x1-n-x2-s/t(seqidno:1)聚糖接受体氨基酸序列基序,其中d是天冬氨酸、x1和x2是脯氨酸以外的任意氨基酸、n是天冬酰胺和t是苏氨酸。
实施方式15.根据实施方式1所述的系统,其进一步包括:适于由所述核酸分子合成糖蛋白靶点的试剂。
实施方式16.根据实施方式1所述的系统,其中所述糖蛋白靶点包括抗体。
实施方式17.一种试剂盒,包括:
能够将聚糖由脂质载体分子转移至糖蛋白靶点的分离的寡糖转移酶,以及
一种或多种分离的聚糖,其中各聚糖均与脂质载体分子连接。
实施方式18.根据实施方式17所述的试剂盒,其进一步包括:
适于由编码所述糖蛋白靶点的核酸分子合成糖蛋白靶点的试剂。
实施方式19.一种在无细胞系统中生产糖基化蛋白的方法,所述方法包括:
提供能够将聚糖由脂质载体分子转移至糖蛋白靶点的分离的寡糖转移酶;
提供一种或多种分离的聚糖,其中各聚糖均与脂质载体分子连接;
提供包括一种或多种聚糖接受体氨基酸残基的糖蛋白靶点;
将所述寡糖转移酶、一种或多种分离的聚糖和糖蛋白靶点组合以形成无细胞糖基化反应混合;以及
将所述无细胞糖基化反应混合物置于使寡糖转移酶有效地促使聚糖由脂质载体分子转移至糖蛋白靶点的一个或多个聚糖接受体残基的条件下以产生糖基化蛋白。
实施方式20.根据实施方式19所述的方法,其中所述寡糖转移酶是原核生物寡糖转移酶。
实施方式21.根据实施方式20所述的方法,其中所述原核生物寡糖转移酶来源于弯曲杆菌属(campylobacter)。
实施方式22.根据实施方式19所述的方法,其中所述寡糖转移酶是古生菌寡糖转移酶。
实施方式23.根据实施方式19所述的方法,其中所述寡糖转移酶是真核生物寡糖转移酶。
实施方式24.根据实施方式19所述的方法,其中所述脂质载体分子包括十一碳二烯磷酸酯。
实施方式25.根据实施方式19所述的方法,其中所述一种或多种分离的聚糖包括原核生物聚糖。
实施方式26.根据实施方式25所述的方法,其中所述原核生物聚糖包括glcgalnac5bac。
实施方式27.根据实施方式19所述的方法,其中一种或多种分离的聚糖包括真核生物聚糖。
实施方式28.根据实施方式27所述的方法,其中所述一种或多种真核生物聚糖包括glcnac2。
实施方式29.根据实施方式28所述的方法,其中所述一种或多种真核生物聚糖进一步包括至少一个甘露糖残基。
实施方式30.根据实施方式28所述的方法,其中所述一种或多种真核生物聚糖包含选自man1glcnac2、man2glcnac2和man3glcnac2的组分。
实施方式31.根据实施方式19所述的方法,其中所述提供糖蛋白靶点包括提供编码所述糖蛋白的核酸序列,所述方法进一步包括:
提供适于由所述核酸分子合成糖蛋白靶点的试剂,以及
先于所述操作或与所述操作同时地将所述试剂在有效地从所述核酸分子合成所述糖蛋白靶点的条件下与糖基化反应混合。
实施方式32.根据实施方式19所述的方法,其中所述糖蛋白靶点的一种或多种聚糖接受体氨基酸残基是天冬酰胺残基。
实施方式33.根据实施方式32所述的方法,其中所述糖蛋白靶点进一步包括n-x1-s/t或d/e-x1-n-x2-s/t(seqidno:1)聚糖接受体氨基酸序列基序,其中d是天冬氨酸、x1和x2是脯氨酸以外的任意氨基酸、n是天冬酰胺和t是苏氨酸。
实施方式34.根据实施方式19所述的方法,其中所述蛋白包括抗体。
实施例
实施例1-4的材料和方法
蛋白纯化。对于cjpglb的纯化而言,使用质粒psn18对大肠杆菌菌株c43(de3)(lucigen,middleton,wi)进行新鲜转化(kowarik等,“n-linkedglycosylationoffoldedproteinsbythebacterialoligosaccharyltransferase,”science314:1148-1150(2006),其通过引用整体并入本申请),所述质粒是编码具有c-末端十个组氨酸亲和标签的空肠弯曲杆菌(c.jejuni)pglb的经修饰的pbad表达质粒。将细胞在37℃下在补充了100μg/ml氨苄西林的1.5l优质肉汤培养基中培养。当培养物的光密度(a600)达到~1.0时,加入0.02%的阿拉伯糖(w/v)在30℃下诱导细胞4.5h。除非有不同的说明,否则所有的下述步骤均在4℃下进行。离心收集细胞,将其重悬于25mmtris,ph8.0和250mmnacl中并通过三通道的弗氏细胞压碎器裂解细胞(slm-aminco;10,000psi,slminstruments,inc.,urbana,il)。离心除去细胞碎片后,经100,000×g超离心1h将膜组分分离。将含有pg1b的膜重悬于25mmtris–hcl,ph8.0、250mmnacl、10%甘油(v/v)和1%ddm(w/v)(ddm,anatrace,affymetrix,inc.,santaclara,ca)中并孵育2h。经100,000×g超离心1h除去不溶性组分。所有随后的缓冲液中均含有ddm作为去垢剂。在溶解的膜中加入10mm咪唑,将其上样于ni-nta超流亲和柱(qiagen,valencia,ca)上并在使用200mm咪唑洗脱pg1b前使用60mm咪唑洗涤。然后将经纯化的蛋白进样至使用akta-fplc的superdex200凝胶过滤柱(gehealthcare,waukesha,wi)上。对洗脱物组分进行十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(sds–page)并使用考马斯亮蓝染色以鉴定含有pg1b的组分(图2)。使用pd10脱盐柱(gehealthcare)将蛋白脱盐至20mmtris,ph7.5、100mmnacl、5%甘油(w/v)和0.05%ddm(w/v)中并在截止分子量为100kda的amiconcentricon超滤管中将其浓缩至5–10mg/ml。对无活性的cjpglb突变体进行同样操作的表达和纯化,其使用携带质粒psn18.1的c43(de3)细胞,其编码来自pacycpglmut的pglb亚克隆无活性的拷贝(如下所示)。从携带质粒psf2的bl2-gold(de3)细胞(stratagene,lajolla,ca)中纯化clpglb,如其他地方所述(lizak等,“x-raystructureofabacterialoligosaccharyltransferase,”nature474:350-355(2011),其通过引用整体并入本申请)。在-20℃下长期保存时,将pglb样品中的甘油含量增加至10%(w/v)。从分离自携带质粒pet24(acra-per)(nita-lazar等,“then-x-s/tconsensussequenceisrequiredbutnotsufficientforbacterialn-linkedproteinglycosylation,”
glycobiology15:361-367(2005),其通过引用整体并入本申请)或
pet24-ssdsbascfv13-r4-gt(见下文)的bl21(de3)细胞的周质组分中纯化acra和scfv13-r4-gt。如此前所述(schwarz等,“relaxedacceptorsitespecificityofbacterialoligosaccharyltransferaseinvivo,”glycobiology21:45-54(2011),其通过引用整体并入本申请)制备周质提取物,补充咪唑使其终浓度达到10mm,无菌过滤(0.22μm)并通过使用ni-nta超流亲和柱(qiagen,valencia,ca)的镍亲和层析进行纯化。
脂质连接聚糖的分离。将使用pacycpglmut(wacker等,“n-linkedglycosylationincampylobacterjejunianditsfunctionaltransferintoe.coli,”science298:1790-1793(2002),其通过引用整体并入本申请)转化的大肠杆菌(escherichiacoli)scm6细胞于37℃下在补充了25μg/ml氯霉素的1lluria-burtani中培养,pacycpglmut编码空肠弯曲杆菌(c.jejuni)llo和无活性的空肠弯曲杆菌(c.jejuni)pglb基因(w458a和d459a)的生物合成。当a600达到~1.0时,经离心收集细胞并将细胞团在-80℃和0.04mbar下冷冻干燥20h。所有的后续步骤均使用玻璃试管和玻璃移液管进行。在25ml10:20:3的chcl3:meoh:h2o中提取经均质化的细胞团,随后3000×g离心30min。使用旋转蒸发仪(büchi,flawil,sanktgallen,switzerland)蒸发上清液,随后将所得到的沉淀重悬于1ml10:20:3chcl3:meoh:h2o中并超声直至均质。在37℃下在氮气流中干燥样品,将其溶解在10mmhepes(4-(2-羟乙基)-1-哌嗪乙磺酸),ph7.5、1mmmncl2和0.1%ddm(w/v)中并在-20℃下保存。采用相同的程序从携带空pacyc的scm6细胞中提取脂质。
无细胞翻译和糖基化。为了对纯化的接受体蛋白进行体外糖基化,将在10mmhepes,ph7.5、1mmmncl2和0.1%ddm(w/v)中含3μg纯化的pglb、5–10μl提取的llo和5μg纯化的acra或scfv13-r4-gt的50μl溶液在30℃下孵育12h。为了对没有糖基化的acra和scfv13-r4-gt进行体外翻译,根据生产厂商的说明使用s30t7高产出表达系统(promega,fitchburg,wi)或purexpress(newenglandbiolabs,ipswich,ma)制备50μl反应物。在每个反应物中加入总计1μg的下述质粒:pet24b(novagen,madison,wi);编码具有c-末端六个组氨酸标签的全长空肠弯曲杆菌(c.jejuni)acra的pet24-acra(nita-lazar等,“then-x-s/tconsensussequenceisrequiredbutnotsufficientforbacterialn-linkedproteinglycosylation,”glycobiology15:361-367(2005),其通过引用整体并入本申请);编码在其天然输出信号的位置具有n-末端pelb信号肽的acra版本的pet24(acra-per)(nita-lazar等,“then-x-s/tconsensussequenceisrequiredbutnotsufficientforbacterialn-linkedproteinglycosylation,”glycobiology15:361-367(2005),其通过引用整体并入本申请);编码不具有n-末端输出信号的acra版本(δssacra)的pet24(acra-cyt)(nita-lazar等,“then-x-s/tconsensussequenceisrequiredbutnotsufficientforbacterialn-linkedproteinglycosylation,”glycobiology15:361-367(2005),其通过引用整体并入本申请)以及编码具有来自大肠杆菌(e.coli)dsba的用于分泌的n-末端信号肽和c-末端gt(fisher等,“productionofsecretoryandextracellularn-linkedglycoproteinsinescherichiacoli,”appl.environ.microbiol.77:871-881(2011),其通过引用整体并入本申请)后接flag和六个组氨酸表位标签的表达优化的scfv13-r4胞内抗体基因(martineau等,“expressionofanantibodyfragmentathighlevelsinthebacterialcytoplasm,”j.mol.biol.280:117-127(1998),其通过引用整体并入本申请)的pet24-ssdsba-scfv13-r4-gt。为了进行体外翻译/糖基化反应,在50μl反应反应物中加入3μg纯化的pglb、5μl提取的llo、1μg纯化的质粒dna、1mmmncl2和0.1%ddm(w/v)并在30℃下孵育12h。选择ddm用于体外翻译/糖基化,因为此前已经观察到其在大肠杆菌(e.coli)来源的cfe系统中具有良好的耐受性(klammt等,“evaluationofdetergentsforthesolubleexpressionofalpha-helicalandbeta-barrel-typeintegralmembraneproteinsbyapreparativescaleindividualcell-freeexpressionsystem,”febsj.272:6024-6038(2005),其通过引用整体并入本申请)。
western印迹分析。在sds-page之后进行免疫印迹对acra和scfv13-r4-gt的表达和糖基化情况进行分析。使用单克隆的抗-his抗体(qiagen,valencia,ca)、单克隆的抗-flag抗体(abcam,cambridge,ma)、多克隆的抗-acra血清(wacker等,“n-linkedglycosylationincampylobacterjejunianditsfunctionaltransferintoe.coli,”science298:1790-1793(2002),其通过引用整体并入本申请)和多克隆的抗-聚糖血清hr6进行免疫检测。在sds-page之前使用rnasea(rochediagnosticsgmbh,mannheim,germany)处理所有的体外翻译样品以减轻由过量的rna导致的凝胶电泳不规则。所有实验均至少重复三次,并显示代表性的样品。
实施例1-n-连接糖基化组分的制备
首先,尝试在体外对细菌n-连接糖基化进行功能性重建。最低限度,这需要三个组分:ost、脂质连接的寡糖(llo)(即脂质连接的聚糖)和携带d/e-x1-n-x2-s/t基序的接受体蛋白。对于ost而言,在大肠杆菌(e.coli)细胞的膜组分中表达cjpglb,使用1%的n-十二烷基-β-d-麦芽糖苷(ddm)溶解并通过镍亲和层析后接凝胶过滤纯化至接近均质(图2b)。另外,使用携带空肠弯曲杆菌(c.jejuni)pgl基因座的大肠杆菌(e.coli)细胞生产寡糖供体。该基因簇编码实施glcgalnac5bac庚糖(其中bac是杆菌胺)生物合成并且将其由膜锚定的十一异戊烯焦磷酸酯(undpp)转移至天冬酰胺残基的酶。这里,将该基因簇携带无活性的pg1b基因(wacker等,“n-linkedglycosylationincampylobacterjejunianditsfunctionaltransferintoe.coli,”science298:1790-1793(2002),其通过引用整体并入本申请)的经修饰的版本转移至大肠杆菌scm6细胞并用于制备llo。选择scm6细胞的几个原因是:首先,这些细胞缺乏waal酶,该酶天然地将寡糖(例如o-抗原,聚糖)由脂质载体十一异戊烯基转移至脂质a,其反而使寡糖穿梭至外膜的外叶(feldman等,“engineeringn-linkedproteinglycosylationwithdiverseoantigenlipopolysaccharidestructuresinescherichiacoli,”proc.nat’l.acad.sci.u.s.a.102:3016-3021(2005),其通过引用整体并入本申请)。这样,在缺乏waal时,所需的脂质连接的聚糖在内膜中累积。其次,将启动glcnac转移酶的脂多糖及肠道细菌常见抗原weca除去。因此,该菌株应该仅生产在缩小的末端具有glcgalnac5bac的llo。在这一观点的支持下,此前对从大肠杆菌菌株中提取的llo进行质谱分析的结果与本申请中使用的一个(即δwaalδweca)类似,这表明仅检测到了含有glcgalnac5bac庚糖的llo(reid等,“affinity-capturetandemmassspectrometriccharacterizationofpolyprenyl-linkedoligosaccharides:tooltostudyproteinn-glycosylationpathways,”anal.chem.80:5468-5475(2008),其通过引用整体并入本申请)。对于寡糖接受体而言,从周质中纯化来自空肠弯曲杆菌(c.jejuni)(nita-lazar等,“then-x-s/tconsensussequenceisrequiredbutnotsufficientforbacterialn-linkedproteinglycosylation,”glycobiology15:361-367(2005),其通过引用整体并入本申请)的模型糖蛋白acra。acra存在两个共有的d/e-x1-n-x2-s/t位点,其被cjpglb糖基化(kowarik等,“definitionofthebacterialn-glycosylationsiteconsensussequence,”emboj.25:1957-1966(2006),其通过引用整体并入本申请)。或者,对称为scfv13-r4-gt的糖基工程化的单链可变片段(scfv)进行简单纯化,所述片段携带由四个被连续的甘氨酸残基彼此间隔的连续dqnat基序组成的c-末端糖基化标签(gt)(fisher等,“productionofsecretoryandextracellularn-linkedglycoproteinsinescherichiacoli,”appl.environ.microbiol.77:871-881(2011),其通过引用整体并入本申请)。
实施例2-在体外对空肠弯曲杆菌(c.jejuni)蛋白糖基化途径进行功能性重建
为评估重建的糖基化途径,将cjpglbost与从大肠杆菌细胞中提取的llo和纯化的acra组合。该反应使两个acra位点均有效地糖基化,其由接近全部的acra由未经修饰的(g0)形式迁移至完全糖基化的(g2)形式的迁移率所证实(图3a)。该活性取决于pglb和llo。将llo的浓度加倍导致了除了g2以外,还出现了acra的g0和g1形式,这表明糖基化的效率略有降低。重要的是,当使用缺乏pg1簇或无活性cjpglb突变的细胞的脂质提取物时,糖基化活性丧失(图3a)。通过检测对空肠弯曲杆菌(c.jejuni)n-聚糖具有血清特异性的糖基化acra对这些结果进行了确证(图3a)。当使用糖基工程化的scfv13-r4-gt蛋白作为寡糖接受体时观察到了几乎相同的结果(图3a)。应注意的是,g2、g3和g4是本申请中检测到的主要糖形式,几乎无法检测g1。为证实其他ost能够在这个系统中使用,还使用红嘴鸥弯曲杆菌(campylobacterlari)pglb(clpglb)进行了acra的体外糖基化,其与空肠弯曲杆菌(c.jejuni)具有56%的一致性(schwarz等,“relaxedacceptorsitespecificityofbacterialoligosaccharyltransferaseinvivo,”glycobiology21:45-54(2011),其通过引用整体并入本申请)。在检测条件下结果得到几乎相同量的g0、g1和g2形式(图3b)。为了在翻译/糖基化反应中使用,纯化的糖基化组分必须能够耐受长期贮存和冻融循环。为了对这方面进行检测,将所述组分分别在-20℃下贮存3个月。除了将pg1b样品中甘油的终浓度增加至10%以外不改变贮存缓冲液。在此期间将各组分均冻融5-10次,随后使用clpglb进行体外反应。该反应产生的acra糖基化的效率仅略低于新鲜纯化组分的糖基化(比较图3b和3c)。
实施例3-蛋白靶点的无细胞翻译
为确定是否存在能够合成目的蛋白靶点的无细胞翻译系统,对基于大肠杆菌(e.coli)cfe的蛋白合成系统和使用纯化的翻译组分和t7rna聚合酶的pure(使用重组元件的蛋白合成)系统(shimizu等,“cell-freetranslationreconstitutedwithpurifiedcomponents,”nat.biotechnol.19:751-755(2001),其通过引用整体并入本申请)进行了评估。其涉及启动具有在t7启动子驱动的pet载体中克隆的三个不同的acradna序列的cfe和pure系统。使用cfe系统,在1h内生产~150–250μg/ml各acra变体作为全长多肽(图4a)。携带其天然信号肽的acra累积至最高水平但也出现了最大量的降解。而相反的是,在天然信号位置携带pelb信号肽的acra和缺乏信号肽的acra均累积至略低的浓度但是未出现可见的降解。同样地,pure系统生产全部三种acra变体作为全长多肽,尽管其水平(均为~100μg/ml/h)略低于基于cfe的系统(图4a)。这两个系统均能够产生显著量的scfv13-r4-gt(图5a)。应注意的是,此前已在无氧化性条件下(即缺乏二硫键)对该scfv的表达进行了优化(martineau等,“expressionofanantibodyfragmentathighlevelsinthebacterialcytoplasm,”j.mol.biol.280:117-127(1998),其通过引用整体并入本申请),因此其不需要特别的转录/翻译条件。
实施例4-靶糖蛋白的无细胞翻译和糖基化
受这些结果的鼓舞,通过将纯化的糖基化组分(扣除接受体蛋白)与无细胞翻译系统之一组合构建glycocfe和glycopure翻译/糖基化系统。选择编码不含n-末端信号肽的acra的质粒pet24(acra-cyt)评估这些系统,因为其在这两个系统中均产生显著量的靶蛋白且无可检测的降解。当使用这种质粒以及cjpglb和llo启动cfe或pure系统时,acra主要以双重糖基化的g2糖形式生产,其具有较少量的g1和实质上不含可检测的未经修饰的acra(图4b)。据估计在12h后在1ml反应体积中产生~100–150μg糖基化的acra。同样地,利用glycocfe和glycopure系统均有效地产生scfv13-r4-gt,其蛋白的~50%具有完全糖基化的g4形式,50%为g3形式(图5b)。这两个系统均在12h内产生~50–100μg/ml糖基化的scfv13-r4-gt。因此,glycocfe和glycopure系统含有有效地翻译n-连接糖蛋白所必需的全部组分。
实施例1-4的讨论
本申请开发开放的基于原核生物的翻译/糖基化系统的主要优势是能够以精确比率提供纯化的糖基化组分及其底物和辅助因子(lizak等,“x-raystructureofabacterialoligosaccharyltransferase,”nature474:350-355(2011),其通过引用整体并入本申请)。同样地,能够完全降低或消除抑制性底物如蛋白酶和催化糖苷键水解的糖苷酶的浓度。此外,该体外系统允许引入可能与体内系统不相容的组分如某些在体内不能生产或翻转的llo。在此前任意的翻译/糖基化系统中都难以获得该可控性水平并且其具有下述几个方面的意义。首先,其有助于避免糖蛋白的异质性,这在评估具体聚糖结构贡献的基础研究中或在药用糖蛋白的生产中特别麻烦。按照这些原则,glycocfe和glycopure系统应允许检验与糖基化机制相互作用或对其产生刺激或者促进接受体位点占有率增加的因素。尽管在本申请中通过cjpglb观察到的的糖基化效率超出了通常在体内观察到的水平(kowarik等,“n-linkedglycosylationoffoldedproteinsbythebacterialoligosaccharyltransferase,”science314:1148-1150(2006);kowarik等,“definitionofthebacterialn-glycosylationsiteconsensussequence,”emboj.25:1957-1966(2006);fisher等,“productionofsecretoryandextracellularn-linkedglycoproteinsinescherichiacoli,”appl.environ.microbiol.77:871-881(2011),其通过引用整体并入本申请),但是应指出的是对反应条件的进一步研究能提高生产率和糖基化效率。其次,其促进了多种复合的代谢系统和途径在体外的整合/共活化,包括转录、翻译、蛋白折叠和糖基化。因此,glycocfe和glycopure系统为在降低系统复杂性和除去结构性障碍的条件下对这些重要机制相互作用的研究提供了独特的机会。例如,由于细菌ost能够将折叠蛋白(kowarik等,“n-linkedglycosylationoffoldedproteinsbythebacterialoligosaccharyltransferase,”science314:1148-1150(2006),其通过引用整体并入本申请)和一些蛋白构造性结构域的局部柔性结构糖基化,因而这些系统有助于解释蛋白结构对糖基化效率的影响。而且,因为细菌和真核生物糖基化机制显示出显著的相似性,所以这些细菌系统能够为理解更复杂的真核生物过程提供简化的模型框架。再次,其允许通过在糖基化途径中重建附加的或替代性步骤(天然和非天然的)对所述系统进行进一步定制。例如,已在体外重建了在pg1途径中糖基转移酶的依次活化(glover等,“invitroassemblyoftheundecaprenylpyrophosphate-linkedheptasaccharideforprokaryoticn-linkedglycosylation,”proc.nat’l.acad.sci.u.s.a.102:14255-14259(2005),其通过引用整体并入本申请)以及能够容易地将翻译/糖基化反映整合至单一的整合平台。在糖基工程化的大肠杆菌具有提供大量的undpp-连接聚糖的潜能的同时(feldman等,“engineeringn-linkedproteinglycosylationwithdiverseoantigenlipopolysaccharidestructuresinescherichiacoli,”proc.nat’l.acad.sci.u.s.a.102:3016-3021(2005);yavuz等,“glycomimicry:displayoffucosylationonthelipo-oligosaccharideofrecombinantescherichiacolik12,”glycoconj.j.28:39-47(2011),其通过引用整体并入本申请),可以通过添加特异性的糖基转移酶和必需的活化的糖实现将其能力延伸至细菌聚糖以外。这种方法能够用于制备原核生物聚糖模拟物(schwarz等,“acombinedmethodforproducinghomogeneousglycoproteinswitheukaryoticn-glycosylation,”nat.chem.biol.6:264-266(2010),其通过引用整体并入本申请)并且能够更精细地控制能够用于在体外修饰靶蛋白的糖形式的多样性。由于cjpglb对聚糖结构的特异性较低(feldman等,“engineeringn-linkedproteinglycosylationwithdiverseoantigenlipopolysaccharidestructuresinescherichiacoli,”proc.nat’l.acad.sci.u.s.a.102:3016-3021(2005),其通过引用整体并入本申请),所以所有这些undpp-连接聚糖均可能是适宜的底物。就算cjpglb不足以确证,本申请中对两种不同的ost能够互换使用的证实表明实质上包括那些来自其他细菌、古生菌和甚至是一些真核生物(nasab等,“allinone:leishmaniamajorstt3proteinssubstituteforthewholeoligosaccharyltransferasecomplexinsaccharomycescerevisiae,”mol.biol.cell19:3758-3768(2008),其通过引用整体并入本申请)的任意单个亚基ost均能够用于这些系统中。在这一概念的支持下,可以在大肠杆菌膜上功能性表达硕大利什曼原虫(leishmaniamajor)和激烈火球菌(pyrococcusfuriosus)的单个亚基ost(igura&kohda,“selectivecontrolofoligosaccharidetransferefficiencyforthen-glycosylationsequonbyapointmutationinoligosaccharyltransferase,”j.biol.chem.286:13255-13260(2011),其通过引用整体并入本申请)。最后,因为其不仅限于天然聚糖,glycocfe和glycopure系统允许杂交的天然/非天然的或者甚至是完全人工的聚糖的合成。例如,加入合成的糖-核苷酸供体底物和/或突变的糖基转移酶以及具有新的特异性的ost将能够构建建立在不规范的聚糖编码上的糖基化系统。基于所有这些原因,glycocfe和glycopure系统为无细胞翻译和糖生物学工具包提供了有益的补充。
尽管在本申请中已对优选的实施方式进行了详细的图示和描述,但是在不脱离本发明主旨的前提下可以进行多种修饰、增加、取代等,这对相关领域的技术人员是显而易见的,因此认为这些在权利要求所定义的本发明的范围内。
序列表
<110>康奈尔大学
<120>一种用于糖蛋白合成的基于原核生物的无细胞系统
<130>29543.7021
<150>us61/555,854
<151>2011-11-04
<160>35
<170>patentin3.5版
<210>1
<211>5
<212>prt
<213>人工的
<220>
<223>细菌糖基化基序
<220>
<221>misc_feature
<222>(1)..(1)
<223>在位置1的x是d或e
<220>
<221>misc_feature
<222>(2)..(2)
<223>在位置2的x是除了脯氨酸以外的任意氨基酸
<220>
<221>misc_feature
<222>(4)..(4)
<223>在位置4的x是除了脯氨酸以外的任意氨基酸
<220>
<221>misc_feature
<222>(5)..(5)
<223>在位置5的x是s或t
<400>1
xaaxaaasnxaaxaa
15
<210>2
<211>664
<212>prt
<213>空肠弯曲杆菌
<400>2
ileileserasnaspglytyralaphealagluglyalaargaspmet
151015
ilealaglyphehisglnproasnaspleusertyrtyrglyserser
202530
leuserthrleuthrtyrtrpleutyrlysilethrpropheserphe
354045
gluserileileleutyrmetserthrpheleuserserleuvalval
505560
ileproileileleuleualaasnglutyrlysargproleumetgly
65707580
phevalalaalaleuleualaserilealaasnsertyrtyrasnarg
859095
thrmetserglytyrtyraspthraspmetleuvalilevalleupro
100105110
metpheileleuphephemetvalargmetileleulyslysaspphe
115120125
pheserleuilealaleuproleupheileglyiletyrleutrptrp
130135140
tyrprosersertyrthrleuasnvalalaleuileglyleupheleu
145150155160
iletyrthrleuilephehisarglysglulysilephetyrileala
165170175
valileleuserserleuthrleuserasnilealatrpphetyrgln
180185190
serthrileilevalileleuphealaleuphealaleugluglnlys
195200205
argleuasnphevalileileglyileleualaservalthrleuile
210215220
pheleuileleuserglyglyvalaspproileleutyrglnleulys
225230235240
phetyrilepheargseraspgluseralaasnleuthrglnglyphe
245250255
mettyrpheasnvalasnglnthrileglngluvalgluasnvalasp
260265270
leusergluphemetargargileserglysergluilevalpheleu
275280285
pheserleupheglyphevaltrpleuleuarglyshislyssermet
290295300
ilemetalaleuproileleuvalleuglypheleualaleulysgly
305310315320
glyleuargphethriletyrservalprovalmetalaleuglyphe
325330335
glypheleuleusergluphelysalaileleuvallyslystyrser
340345350
glnleuthrserasnvalcysilevalphealathrileleuthrleu
355360365
alaprovalpheilehisiletyrasntyrlysalaprothrvalphe
370375380
serglnasnglualaserleuleuasnglnleulysasnilealaasn
385390395400
arggluasptyrvalvalthrtrptrpasptyrglytyrprovalarg
405410415
tyrtyrseraspvallysthrleuvalaspglyglylyshisleugly
420425430
lysaspasnphepheproserphealaleuserlysaspgluglnala
435440445
alaalaasnmetalaargleuservalglutyrthrglulysserphe
450455460
tyralaproglnasnaspileleulysthraspileleuglnalamet
465470475480
metlysasptyrasnglnserasnvalaspleupheleualaserleu
485490495
serlysproaspphelysileaspthrprolysthrargaspiletyr
500505510
leutyrmetproalaargmetserleuilepheserthrvalalaser
515520525
pheserpheileasnleuaspthrglyvalleuasplysprophethr
530535540
pheserthralatyrproleuaspvallysasnglygluiletyrleu
545550555560
serasnglyvalvalleuseraspasppheargserphelysilegly
565570575
aspasnvalvalservalasnserilevalgluileasnserilelys
580585590
glnglyglutyrlysilethrproileaspasplysalaglnphetyr
595600605
ilephetyrleulysaspseralaileprotyralaglnpheileleu
610615620
metasplysthrmetpheasnseralatyrvalglnmetphepheleu
625630635640
glyasntyrasplysasnleupheaspleuvalileasnserargasp
645650655
alalysvalphelysleulysile
660
<210>3
<211>1995
<212>dna
<213>空肠弯曲杆菌
<400>3
atcatttcaaacgatggttatgcttttgctgagggtgcaagagatatgatagcaggtttt60
catcagcctaatgatttgagttattatggatcttctttatctacgcttacttattggctt120
tataaaatcacacctttttctttcgaaagtattattttatatatgagtacttttttatct180
tctttggtggtgattcctattattttactagctaatgaatacaaacgtcctttaatgggc240
tttgtagctgctcttttagcaagtatagcaaacagttattataatcgcactatgagtggg300
tattatgatacggatatgctggtaattgttttacctatgtttattttattttttatggta360
agaatgattttaaaaaaagactttttttcattgattgccttaccgttatttataggaatt420
tatctttggtggtatccttcaagctatactttaaatgtagctttaattggacttttttta480
atttatacacttatttttcatagaaaagaaaagattttttatatagctgtgattttgtct540
tctcttactctttcaaatatagcatggttttatcaaagtactattatagtaatacttttt600
gctttatttgctttagagcaaaaacgcttaaattttgtaattataggaattttagctagt660
gtaactttgatatttttgattttaagtggaggggttgatcctatactttatcagcttaaa720
ttttatatttttagaagtgatgaaagtgcgaatttaacgcagggttttatgtattttaat780
gtcaatcaaaccatacaagaagttgaaaatgtagatcttagcgaatttatgcgaagaatt840
agtggtagtgaaattgtttttttgttttctttgtttggttttgtatggcttttgagaaaa900
cataaaagtatgattatggctttacctatattggtgcttgggtttttagccttaaaaggg960
gggcttagatttaccatttattctgtacctgtaatggccttaggatttggttttttattg1020
agcgagtttaaggctatattggttaaaaaatatagccaattaacttcaaatgtttgtatt1080
gtttttgcaactattttgactttagctccagtatttatccatatttacaactataaagca1140
ccaacagttttttctcaaaatgaagcatcattattaaatcaattaaaaaatatagccaat1200
agagaagattatgtggtaacttggtgggattatggttatcctgtgcgttattatagtgat1260
gtgaaaactttagtagatggtggaaagcatttaggtaaggataattttttcccttctttt1320
gctttaagcaaagatgaacaagctgcagctaatatggcaagacttagtgtagaatataca1380
gaaaaaagcttttatgctccgcaaaatgatattttaaaaacagacattttacaagccatg1440
atgaaagattataatcaaagcaatgtggatttgtttctagcttcattatcaaaacctgat1500
tttaaaatcgatacaccaaaaactcgtgatatttatctttatatgcccgctagaatgtct1560
ttgattttttctacggtggctagtttttcttttattaatttagatacaggagttttggat1620
aaaccttttacctttagcacagcttatccacttgatgttaaaaatggagaaatttatctt1680
agcaacggagtggttttaagcgatgattttagaagttttaaaataggtgataatgtggtt1740
tctgtaaatagtatcgtagagattaattctattaaacaaggtgaatacaaaatcactcca1800
attgatgataaggctcagttttatattttttatttaaaggatagtgctattccttacgca1860
caatttattttaatggataaaaccatgtttaatagtgcttatgtgcaaatgtttttttta1920
ggaaattatgataagaatttatttgacttggtgattaattctagagatgctaaggttttt1980
aaacttaaaatttaa1995
<210>4
<211>711
<212>prt
<213>红嘴鸥弯曲杆菌
<400>4
metlysleuglnglnasnphethraspasnasnserilelystyrthr
151015
cysileleuileleuilealaphealapheservalleucysargleu
202530
tyrtrpvalalatrpalasergluphetyrgluphephepheasnasp
354045
glnleumetilethrthrasnaspglytyralaphealagluglyala
505560
argaspmetilealaglyphehisglnproasnaspleusertyrphe
65707580
glyserserleuserthrleuthrtyrtrpleutyrserileleupro
859095
pheserphegluserileileleutyrmetseralaphephealaser
100105110
leuilevalvalproileileleuilealaargglutyrlysleuthr
115120125
thrtyrglypheilealaalaleuleuglyserilealaasnsertyr
130135140
tyrasnargthrmetserglytyrtyraspthraspmetleuvalleu
145150155160
valleuprometleuileleuleuthrpheileargleuthrileasn
165170175
lysaspilephethrleuleuleuserprovalpheilemetiletyr
180185190
leutrptrptyrprosersertyrserleuasnphealametilegly
195200205
leupheglyleutyrthrleuvalphehisarglysglulysilephe
210215220
tyrleuthrilealaleumetileilealaleusermetleualatrp
225230235240
glntyrlysleualaleuilevalleuleuphealailephealaphe
245250255
lysgluglulysileasnphetyrmetiletrpalaleuilepheile
260265270
serileleuileleuhisleuserglyglyleuaspprovalleutyr
275280285
glnleulysphetyrvalphelysalaseraspvalglnasnleulys
290295300
aspalaalaphemettyrpheasnvalasngluthrilemetgluval
305310315320
asnthrileaspprogluvalphemetglnargileserserserval
325330335
leuvalpheileleuserpheileglypheileleuleucyslysasp
340345350
hislyssermetleuleualaleuprometleualaleuglyphemet
355360365
alaleuargalaglyleuargphethriletyralavalprovalmet
370375380
alaleuglypheglytyrpheleutyralaphepheasnpheleuglu
385390395400
lyslysglnilelysleuserleuargasnlysasnileleuleuile
405410415
leuilealaphepheserileserproalaleumethisiletyrtyr
420425430
tyrlysserserthrvalphethrsertyrglualaserileleuasn
435440445
aspleulysasnlysalaglnarggluasptyrvalvalalatrptrp
450455460
asptyrglytyrproileargtyrtyrseraspvallysthrleuile
465470475480
aspglyglylyshisleuglylysaspasnphepheserserpheval
485490495
leuserlysgluglnileproalaalaasnmetalaargleuserval
500505510
glutyrthrglulysserphelysgluasntyrproaspvalleulys
515520525
alametvallysasptyrasnlysthrseralalysasppheleuglu
530535540
serleuasnasplysaspphelyspheaspthrasnlysthrargasp
545550555560
valtyriletyrmetprotyrargmetleuargilemetprovalval
565570575
alaglnphealaasnthrasnproaspasnglygluglnglulysser
580585590
leuphepheserglnalaasnalailealaglnasplysthrthrgly
595600605
servalmetleuaspasnglyvalgluileileasnasppheargala
610615620
leulysvalgluglyalaserileproleulysalaphevalaspile
625630635640
gluserilethrasnglylysphetyrtyrasngluileaspserlys
645650655
alaglniletyrleuleupheleuargglutyrlysserphevalile
660665670
leuaspgluserleutyrasnsersertyrileglnmetpheleuleu
675680685
asnglntyraspglnaspleuphegluglnilethrasnaspthrarg
690695700
alalysiletyrargleulys
705710
<210>5
<211>2139
<212>dna
<213>红嘴鸥弯曲杆菌
<400>5
atgaaactacaacaaaatttcacggataataattctataaaatatacctgtattttaatc60
cttatagcctttgcttttagtgttttgtgtagattatactgggtagcttgggcaagtgag120
ttttatgagtttttctttaatgatcaactcatgattactactaatgatggctatgctttt180
gcagaaggtgcaagagatatgatagcaggttttcatcaacctaatgacttatcttatttt240
ggaagctcactttctactttgacttattggctttatagtattttgccttttagctttgaa300
agtattattttatatatgagtgctttttttgcttctttgattgttgtgcctattatatta360
atcgcaagagagtataaactcactacctatggctttatagcagctttacttggaagcatt420
gcaaatagttattataaccgcactatgagtgggtattacgatacagatatgctagtgtta480
gttttaccaatgcttattttgcttacctttatacgcttaactattaataaagacattttc540
accctacttttaagtccggtttttatcatgatttatttgtggtggtatccatcaagttat600
tctttaaattttgctatgataggactttttggactttatactttagtatttcatagaaaa660
gaaaagattttttatctaactattgctttgatgatcatagctttaagtatgctagcatgg720
caatataagcttgctttgattgtattattatttgctatttttgcttttaaagaagaaaaa780
atcaatttttatatgatttgggctttgatttttattagcattttgatattgcatttaagt840
ggcggcttagatcctgttttataccaacttaaattttatgtatttaaagcttctgatgtg900
caaaatttaaaagatgctgcctttatgtattttaatgtcaatgaaaccattatggaagta960
aatactatcgatcctgaagtatttatgcaaagaattagctctagtgttttagtatttatc1020
ctttcttttataggttttatcttactttgcaaagatcacaaaagcatgcttttggctcta1080
cctatgcttgcactaggttttatggctttaagagctggacttagatttaccatttatgca1140
gttcctgtgatggctttgggttttgggtattttttatatgcattttttaattttttagaa1200
aaaaaacaaatcaaacttagcctaagaaataaaaatatcttacttatactcattgcattt1260
tttagtataagccctgctttgatgcatatttattattataaatcctctactgtttttact1320
tcttatgaagctagtattttaaatgatttaaaaaataaagctcaaagagaagattatgtt1380
gttgcttggtgggattatggttatccaatacgctattatagcgatgtaaaaaccttaatc1440
gatggtggaaaacacctaggaaaagataattttttctcatcttttgtcttaagcaaagaa1500
caaattccagcagccaatatggcaagacttagcgtagaatacactgaaaaatctttcaaa1560
gaaaactatcctgatgttttaaaagctatggttaaagattataataaaacaagtgctaaa1620
gattttttagaaagtttaaatgataaagattttaaatttgataccaataaaactagagat1680
gtatacatttatatgccttatagaatgttgcgtatcatgcctgtggtggcacaatttgca1740
aatacaaatcctgataatggagagcaagaaaaaagtttatttttctcccaagctaatgcc1800
atagctcaagataaaaccacaggttctgttatgcttgataatggagtagaaattattaat1860
gattttagagccttaaaagtagaaggtgcaagcatacctttaaaagcttttgtggatata1920
gaatccattactaatggcaaattttattacaatgaaattgattcaaaagctcaaatttat1980
ttgctctttttaagagaatataaaagctttgtgattttagatgaaagtctttataatagt2040
tcttatatacaaatgtttttgttaaatcaatacgatcaagatttatttgaacaaattact2100
aatgatacaagagcaaaaatttataggctaaaaagatga2139
<210>6
<211>714
<212>prt
<213>结肠弯曲杆菌
<400>6
metleulyslysglutyrphelysasnprothrpheileleuleuala
151015
pheileileleualatyrvalpheservalleucysargphetyrtrp
202530
ilephetrpalaserglupheasnglutyrphepheasnasngluleu
354045
metileileserasnaspglytyralaphealagluglyalaargasp
505560
metilealaglyphehisglnproasnaspleusertyrtyrglyser
65707580
serleuserthrleuthrtyrtrpphetyrlysilethrpropheser
859095
leugluserilepheiletyrileserthrpheleuserserleuval
100105110
valileproleuileleuilealaasnglutyrlysargproleumet
115120125
glyphevalalaalaleuleualaserilealaasnsertyrtyrasn
130135140
argthrmetserglytyrtyraspthraspmetleuvalilevalleu
145150155160
alametmetilevalphephemetileargleuileleulyslysasp
165170175
leuleuserleuilethrleuproleuphevalglyiletyrleutrp
180185190
trptyrprosersertyrthrleuasnvalalaleuleuglyleuphe
195200205
pheiletyrthrleuvalphehisilelysglulysthrleutyrmet
210215220
alaileileleualaserilethrleuserasnilealatrpphetyr
225230235240
glnseralaileilevalileleupheserleuphevalleuglnasn
245250255
lysargpheserphealaleuleuglyileleuglyleualathrleu
260265270
valpheleuileleuserglyglyileaspproileleutyrglnleu
275280285
lysphetyrilepheargseraspgluseralaasnleualaglngly
290295300
phemettyrpheasnvalasnglnthrileglngluvalgluserile
305310315320
aspleuserilephemetglnargileserglysergluleuvalphe
325330335
phevalserleuileglypheilepheleuvalarglyshislysser
340345350
metileleualaleuprometleualaleuglypheleualaleulys
355360365
serglyleuargphethriletyralavalprovalleualaleugly
370375380
pheglypheleumetserleuleuglngluarglysglnlysasnasn
385390395400
asnthrtyrtrptrpalaasnileglyvalpheilephethrpheleu
405410415
serleuileprometphetyrhisileasnasntyrlysalaprothr
420425430
valpheserglnasnglualathrlysleuaspgluleulyslysile
435440445
alaglnarggluasptyrvalvalthrtrptrpasptyrglytyrpro
450455460
ileargtyrtyrseraspvallysthrleualaaspglyglylyshis
465470475480
leuglylysaspasnphepheproserphevalleuserlysaspgln
485490495
valalaalaalaasnmetalaargleuservalglutyrthrglulys
500505510
serphetyralaproleuasnaspileleulysasnaspleuleugln
515520525
alametmetlysasptyrasnglnasnasnvalaspleupheleuala
530535540
serleuserlysproaspphelysileasnthrprolysthrargasp
545550555560
valtyriletyrmetproalaargmetserleuilepheserthrval
565570575
alaserpheserphevalaspleugluthrglygluileasnlyspro
580585590
phethrpheseralaalatyrproleuaspvallysasnglygluile
595600605
tyrleuserasnglyilealaleuseraspasppheargserphelys
610615620
ileasnasnserthrileservalasnserileilegluileasnser
625630635640
ilelysglnglyglutyrlysilethrproileaspaspmetalagln
645650655
phetyrilephetyrleulysaspserthrileprotyralaglnphe
660665670
ileleumetasplysthrmetpheasnseralatyrvalglnmetphe
675680685
pheleuglyasntyrasplysasnleutyraspleuvalileasnala
690695700
argaspalalysvalphelysleulysile
705710
<210>7
<211>2145
<212>dna
<213>结肠弯曲杆菌
<400>7
atgttaaaaaaagaatactttaaaaacccaacttttattttattggcttttataatttta60
gcgtatgtctttagtgttttatgtaggttttattggattttttgggcaagtgagtttaat120
gaatattttttcaataacgagcttatgattatctcaaatgatggatatgcttttgcagag180
ggtgcaagagatatgatagcgggttttcatcaacctaatgatttgagttattatggttct240
tcgctttcaacgctcacatattggttttataaaataactcctttttctttagaaagcatt300
tttatatatatcagtacttttttatcttctttggtggttatacctttgattttgattgct360
aatgaatacaaacgccctttaatggggtttgttgcagcattgctagccagtatagctaat420
agctattataatcgcacgatgagcggatattatgatactgatatgcttgttatagttctt480
gcaatgatgatagttttctttatgataaggctgattttgaaaaaagatttattatcttta540
ataacactgcctttgtttgtaggaatttatctttggtggtatccatcaagctatacttta600
aatgttgctttactaggacttttctttatttataccttggtttttcatataaaagaaaaa660
acgctttatatggctattatcctagcttctatcacactttcaaatatagcttggttttat720
caaagcgccatcattgtcatactttttagtctttttgttttgcaaaataagcgttttagc780
tttgctttgcttggaattttaggtttggcaactttggtatttttgatactaagcggtgga840
attgatcctatactctatcaacttaaattttatatttttagaagtgatgagagtgcaaat900
ttggctcaaggttttatgtattttaatgtaaatcaaaccatacaagaggtagaaagtata960
gatttaagtatttttatgcaaaggattagcggaagcgagcttgtattttttgtatcttta1020
atcggctttattttccttgttagaaaacataaaagtatgattttggctttgccgatgtta1080
gctttaggatttttagcacttaagagtggacttcgttttactatttatgcagtacctgtt1140
ttagcacttggatttggttttttaatgagtcttttgcaagaaagaaaacaaaaaaacaat1200
aatacctattggtgggccaatataggcgtttttatttttacttttttaagtttaattcct1260
atgttctatcatatcaacaattataaagcaccaactgttttttctcaaaatgaggctacg1320
aaattagatgagcttaaaaaaattgcacaaagagaagattatgtagtaacttggtgggat1380
tatggatatcctattaggtattacagcgatgttaaaactttggctgatgggggtaagcat1440
ttaggcaaggataattttttcccatcttttgttctaagtaaagatcaagtggctgctgca1500
aatatggcaagacttagtgtagaatacacagaaaaaagtttttacgcccctttaaatgat1560
attttaaaaaatgatcttttacaagccatgatgaaagattataatcaaaataatgtggat1620
ttgtttttagcttcgctttccaagcctgattttaaaatcaatacgccaaaaacacgcgat1680
gtgtatatctatatgccagctagaatgtctttgattttttcaactgtggctagtttttct1740
tttgtggatttggagacaggtgagataaataaaccttttacttttagtgcagcttatcca1800
cttgatgttaaaaatggagaaatttatcttagcaatggtattgcattaagtgatgatttt1860
agaagttttaaaataaataatagtactatatccgtaaatagtatcatagagattaattct1920
atcaaacaaggtgaatataaaatcactcctattgatgatatggctcaattttatattttt1980
tatcttaaagatagcaccataccttatgctcagtttattttaatggataaaactatgttt2040
aatagtgcttatgtgcaaatgtttttccttggaaattatgataaaaatttgtatgattta2100
gtgattaatgctagagatgcaaaagtttttaaactcaaaatttaa2145
<210>8
<211>785
<212>prt
<213>乌普萨拉弯曲杆菌
<400>8
metlysasnglualavallysasnalaasnleuargleuvalphephe
151015
ileleuleualapheglypheservalleucysargphetyrtrpile
202530
tyrtrpalaserasppheasnglutyrphepheasnasnglnleumet
354045
ileserserasnaspglytyrthrphealagluglyalaargasplys
505560
ilealaglyphehisglngluasnaspleuserpheileasnserser
65707580
leuserileleuthrtyrvalleutyrlysilethrpropheserphe
859095
gluserileileleutyrmetservalphepheserserleuileval
100105110
valproleuileleuilealaasngluleulysargproleumetgly
115120125
leuphealaalapheleualaserilealalyssertyrtyrasnarg
130135140
thrmetalaglytyrtyraspthraspmetleualailevalleupro
145150155160
metpheileleutyrphepheileargleuileleuarglysaspasp
165170175
pheserleuleualaleuprophephemetglyleutyrleutrptrp
180185190
tyrprosersertyrthrleuasnvalalapheilealaleuphethr
195200205
leutyrvalleuiletyrhisarglysgluargserphetyrmetala
210215220
alaleuleucysalailethrleuserasnilealatrpphetyrgln
225230235240
seralaileilevalleuleuphealaleuphemetleulysasnser
245250255
phepheasnphelyspheilealaleuleualaleuglyvalleuval
260265270
pheleualaleuserglyglyileaspproileleutyrglnleulys
275280285
phetyrleuleuargseraspgluseralaserleualaargglyphe
290295300
alatyrpheasnvalasnleuthrileglngluvalgluserileasp
305310315320
leuserthrphemetglnargileserglysergluleuvalpheleu
325330335
leuserleupheglypheleutrpleuleulyslyshislysvalmet
340345350
leuleuthrleuprometleuleuleuglypheleualaleuarggly
355360365
glyleuargphethriletyralavalproilemetalaleuglyphe
370375380
glypheleuservalglnileleuserleuileglnlysmetargpro
385390395400
leulysgluthrarglysleuargilephephetyrglyilephepro
405410415
leuphevalleuvalleuglyalatyrphetyrpheserglnserala
420425430
iletyrglusermetglyvalglupheglnlysasnphevalserphe
435440445
phevalgluaspthrleuleupheserleuleuileleualailephe
450455460
thrproleuilephegluleuleutrparglyslysaspileargphe
465470475480
valcysserphetyrilevalglyvalleuleupheserleutrpala
485490495
asnleuserhisiletyrasntyrargalahisthrvalphesertyr
500505510
asnglualaserileleuaspasnleulysalaasnvalserargglu
515520525
asptyrilevalalatrptrpasptyrglytyrproileargtyrtyr
530535540
seraspvallysthrleualaaspglyglylyshisleuglylysasp
545550555560
asnphepheproserphevalleuserglnasnproargalaalaala
565570575
asnmetalaargleuservalglutyrthrglulysglyphelysthr
580585590
protyrasnaspleuleuglualametmetlysasptyrasntyrser
595600605
asnvalasnleupheleualaalaleuserlysgluaspphethrleu
610615620
glnthrprolysthrargaspiletyriletyrmetproserargmet
625630635640
alaalailepheglythrvalalaserphesertyrmetserleuglu
645650655
thrglygluleugluasnprophevaltyrservalalatyrtyrleu
660665670
glyasngluaspglylysleuvalleuserasnasnmetleuleuhis
675680685
serasppheargserpheaspleuasnglylysasntyralaileasn
690695700
serleuvalgluphethrservalglnglnlystyrtyrservalval
705710715720
gluileasplysasnalalystyrtyrleuphehisilelysaspala
725730735
asnileproasnvalglnpheileleumetasplysalamettyrglu
740745750
seralaphevalglnmetphephepheglylystyraspgluserleu
755760765
tyrgluleuilevalaspserlysglualalysvaltyrlysleulys
770775780
leu
785
<210>9
<211>2358
<212>dna
<213>乌普萨拉弯曲杆菌
<400>9
atgaaaaacgaggctgtgaaaaatgcgaatttgaggctagtattttttatcttactagct60
tttggttttagtgttttatgtcgcttttattggatttattgggcgagtgattttaacgaa120
tatttttttaataatcagcttatgataagctcaaatgacggctacacttttgcagagggt180
gctagagataagatagcgggctttcatcaggaaaatgatttaagctttattaattcctct240
ctttctattttgacttatgtgctttataaaatcacgccttttagttttgaaagcattatt300
ttatatatgagtgtatttttttcttcacttatagttgtgccgcttattttaattgcaaat360
gagcttaaacgccctttaatgggactttttgcggcatttttagcaagtattgcaaaaagc420
tattataaccgcactatggcaggatattatgatacagatatgttagccattgtgcttcct480
atgtttattttatattttttcatcaggcttattttaagaaaagatgatttttctttactt540
gccttgccgttttttatgggactttatctttggtggtatccatcaagctatactctaaat600
gtcgcttttatcgcactttttaccctttatgttttgatttatcatagaaaagaaaggtct660
ttttatatggcagcacttttgtgtgccattaccctttcaaatattgcttggttttatcaa720
agtgctattattgttttactttttgctctttttatgcttaaaaattcgttttttaatttt780
aaatttatcgcacttttagccttaggagttttagtttttttggctttaagtggggggata840
gaccccatactttatcagcttaaattttatcttttaagaagtgatgaaagtgcaagttta900
gcgcgtggttttgcgtattttaatgtaaatttaaccatacaagaggttgaaagtatcgat960
ttaagcacttttatgcaaagaattagcggaagtgagcttgtgtttttactttctcttttt1020
ggctttttatggcttttaaaaaagcataaggtgatgcttttaaccctacctatgcttttg1080
ctcggttttttagcacttagaggtgggcttagatttactatttatgctgtgcctattatg1140
gcgcttggctttggctttttaagcgttcaaattttaagcttaatccaaaaaatgcgtccc1200
ttaaaagaaactcgaaaattaagaatatttttttatggaatctttccgctttttgtgctt1260
gttttgggggcttatttttattttagtcaaagtgctatttatgagagtatgggagtggaa1320
tttcaaaagaactttgtgagcttttttgtagaagatactttgcttttttctttgctgatt1380
ttggctatttttacgcctttaatttttgagcttttgtggagaaaaaaggacattcgtttt1440
gtgtgtagcttttatattgtgggggttttgcttttttctttatgggcaaatttaagtcat1500
atttataattatagagcacacaccgtttttagctacaatgaagcgagtattttggataat1560
cttaaagctaatgtttctagggaagattatattgtggcttggtgggattatggctatcct1620
attcgttattatagcgatgtgaaaaccttagctgatgggggtaagcatttgggtaaggat1680
aattttttcccttcttttgttttaagtcaaaatccacgcgcagcggcaaatatggcaaga1740
cttagcgtagaatacacagaaaaaggctttaaaacgccttataatgatcttttagaagcg1800
atgatgaaggattataattatagcaatgtaaatttatttttagcggcactttctaaggag1860
gattttactcttcaaacgcccaaaactagagatatttacatctatatgccttctcgtatg1920
gcggcgatttttggcacggtggcaagtttttcttatatgagcttagaaacgggtgagctt1980
gaaaatccttttgtttatagtgtggcgtattatttgggaaatgaggacggcaaactcgtc2040
ttaagtaataatatgctccttcatagcgactttagaagctttgaccttaatggcaagaat2100
tatgctattaattctttggttgaatttacttcggtgcagcaaaaatattatagtgttgtg2160
gagattgataaaaatgctaaatattatctctttcacatcaaagacgctaatatccctaat2220
gtgcaatttatcctaatggataaggcgatgtatgagagtgctttcgtgcaaatgtttttc2280
tttggtaagtatgatgagagtttgtatgaattaattgtagatagtaaagaagcaaaggtg2340
tataaattaaaattatga2358
<210>10
<211>661
<212>prt
<213>人工的
<220>
<223>弯曲杆菌属pg1b共有序列
<220>
<221>misc_feature
<222>(1)..(2)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(7)..(7)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(15)..(15)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(22)..(22)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(27)..(29)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(34)..(34)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(38)..(39)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(41)..(41)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(47)..(47)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(51)..(52)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(54)..(54)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(56)..(56)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(58)..(60)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(62)..(62)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(64)..(64)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(66)..(66)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(69)..(69)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(71)..(71)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(73)..(73)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(75)..(78)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(80)..(81)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(84)..(84)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(86)..(86)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(90)..(90)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(98)..(98)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(107)..(108)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(111)..(111)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(113)..(113)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(115)..(124)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(127)..(129)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(131)..(133)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(135)..(135)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(137)..(139)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(149)..(149)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(152)..(152)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(154)..(156)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(159)..(160)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(162)..(162)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(164)..(165)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(167)..(167)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(170)..(172)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(174)..(177)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(179)..(182)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(185)..(186)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(189)..(189)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(191)..(194)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(197)..(197)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(200)..(201)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(203)..(210)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(212)..(216)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(218)..(224)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(226)..(226)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(231)..(231)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(234)..(234)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(240)..(240)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(242)..(250)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(252)..(255)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(257)..(257)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(263)..(263)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(266)..(266)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(269)..(271)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(273)..(275)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(278)..(278)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(282)..(282)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(284)..(285)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(288)..(289)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(291)..(292)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(295)..(296)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(298)..(301)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(303)..(303)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(305)..(307)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(310)..(310)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(312)..(312)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(316)..(316)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(319)..(320)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(328)..(328)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(331)..(332)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(338)..(348)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(350)..(373)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(376)..(377)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(379)..(381)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(385)..(387)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(390)..(391)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(393)..(394)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(397)..(400)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(405)..(405)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(407)..(407)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(415)..(415)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(421)..(421)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(425)..(425)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(438)..(438)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(441)..(441)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(444)..(448)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(463)..(463)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(465)..(469)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(471)..(471)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(473)..(473)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(475)..(476)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(481)..(486)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(489)..(490)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(492)..(494)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(497)..(499)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(501)..(501)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(506)..(506)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(508)..(508)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(512)..(512)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(515)..(516)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(518)..(520)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(523)..(523)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(525)..(531)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(533)..(540)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(542)..(542)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(544)..(552)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(554)..(556)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(558)..(558)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(560)..(565)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(569)..(586)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(588)..(601)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(603)..(604)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(606)..(618)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(620)..(622)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(624)..(628)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(630)..(632)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(636)..(639)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(642)..(643)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(645)..(653)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(656)..(661)
<223>xaa可以是任意天然存在的氨基酸
<400>10
xaaxaaasnaspglytyrxaaphealagluglyalaargaspxaaile
151015
alaglyphehisglnxaaasnaspleuserxaaxaaxaaserserleu
202530
serxaaleuthrtyrxaaxaatyrxaaileleupropheserxaaglu
354045
serilexaaxaatyrxaaserxaaphexaaxaaxaaleuxaavalxaa
505560
proxaaileleuxaaalaxaagluxaalysxaaxaaxaaxaaglyxaa
65707580
xaaalaalaxaaleuxaaserilealaxaasertyrtyrasnargthr
859095
metxaaglytyrtyraspthraspmetleuxaaxaavalleuxaamet
100105110
xaailexaaxaaxaaxaaxaaxaaxaaxaaxaaxaalysaspxaaxaa
115120125
xaaleuxaaxaaxaaproxaaphexaaxaaxaatyrleutrptrptyr
130135140
prosersertyrxaaleuasnxaaalaxaaxaaxaaleuphexaaxaa
145150155160
tyrxaaleuxaaxaahisxaalysgluxaaxaaxaatyrxaaxaaxaa
165170175
xaaleuxaaxaaxaaxaaleuserxaaxaaalatrpxaatyrxaaxaa
180185190
xaaxaailevalxaaleuphexaaxaaphexaaxaaxaaxaaxaaxaa
195200205
xaaxaaphexaaxaaxaaxaaxaaleuxaaxaaxaaxaaxaaxaaxaa
210215220
leuxaaleuserglyglyxaaaspproxaaleutyrglnleulysxaa
225230235240
tyrxaaxaaxaaxaaxaaxaaxaaxaaxaaleuxaaxaaxaaxaaphe
245250255
xaatyrpheasnvalasnxaathrilexaagluvalxaaxaaxaaasp
260265270
xaaxaaxaaphemetxaaargileserxaaserxaaxaavalphexaa
275280285
xaaserxaaxaaglyphexaaxaaleuxaaxaaxaaxaalysxaamet
290295300
xaaxaaxaaleuproxaaleuxaaleuglyphexaaalaleuxaaxaa
305310315320
glyleuargphethriletyrxaavalproxaaxaaalaleuglyphe
325330335
glyxaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaalysxaaxaaxaa
340345350
xaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaa
355360365
xaaxaaxaaxaaxaahisilexaaxaatyrxaaxaaxaathrvalphe
370375380
xaaxaaxaaglualaxaaxaaleuxaaxaaleulysxaaxaaxaaxaa
385390395400
arggluasptyrxaavalxaatrptrpasptyrglytyrproxaaarg
405410415
tyrtyrseraspxaalysthrleuxaaaspglyglylyshisleugly
420425430
lysaspasnphephexaaserphexaaleuserxaaxaaxaaxaaxaa
435440445
alaalaasnmetalaargleuservalglutyrthrglulysxaaphe
450455460
xaaxaaxaaxaaxaaaspxaaleuxaaalaxaaxaalysasptyrasn
465470475480
xaaxaaxaaxaaxaaxaapheleuxaaxaaleuxaaxaaxaaaspphe
485490495
xaaxaaxaathrxaalysthrargaspxaatyrxaatyrmetproxaa
500505510
argmetxaaxaailexaaxaaxaavalalaxaaphexaaxaaxaaxaa
515520525
xaaxaaxaaglyxaaxaaxaaxaaxaaxaaxaaxaaserxaaalaxaa
530535540
xaaxaaxaaxaaxaaxaaxaaxaaglyxaaxaaxaaleuxaaasnxaa
545550555560
xaaxaaxaaxaaxaaasppheargxaaxaaxaaxaaxaaxaaxaaxaa
565570575
xaaxaaxaaxaaxaaxaaxaaxaaxaaxaaserxaaxaaxaaxaaxaa
580585590
xaaxaaxaaxaaxaaxaaxaaxaaxaaalaxaaxaatyrxaaxaaxaa
595600605
xaaxaaxaaxaaxaaxaaxaaxaaxaaxaaphexaaxaaxaaaspxaa
610615620
xaaxaaxaaxaaserxaaxaaxaaglnmetphexaaxaaxaaxaatyr
625630635640
aspxaaxaaleuxaaxaaxaaxaaxaaxaaxaaxaaxaaalalysxaa
645650655
xaaxaaxaaxaaxaa
660
<210>11
<211>967
<212>prt
<213>激烈火球菌
<400>11
metvallysthrglnilelysglulyslyslysaspglulysvalthr
151015
ileproleuproglylysilelysthrvalleualapheleuvalval
202530
leualaphealaalatyrglyphetyrilearghisleuthralagly
354045
lystyrpheseraspproaspthrphetyrhisphegluiletyrlys
505560
leuvalleulysgluglyleuproargtyrtyrprometalaaspala
65707580
propheglyserleuileglygluproleuglyleutyrileleupro
859095
alailephetyrlysileileserilepheglytyrasngluleuglu
100105110
alapheleuleutrpproprophevalglypheleuservalilegly
115120125
valtyrleuleuglyarglysvalleuasnglutrpalaglymettrp
130135140
glyalaileileleuservalleuthralaasnpheserargthrphe
145150155160
serglyasnalaargglyaspglyprophemetmetleuphethrphe
165170175
seralavalleumetleutyrtyrleuthrglugluasnlysasnlys
180185190
lysileiletrpglythrleuphevalleuleualaglyileserthr
195200205
alaalatrpasnglyserpropheglyleumetvalleuleuglyphe
210215220
alaserpheglnthrileileleupheilepheglylysileasnglu
225230235240
leuargglupheilelysglutyrtyrproalatyrleuglyileleu
245250255
alailesertyrleuleuthrileproglyileglylysileglygly
260265270
phevalargphealaphegluvalpheleuglyleuvalpheleuala
275280285
ilevalmetleutyrglyglylystyrleuasntyrserasplyslys
290295300
hisargphealavalvalalavalilevalilealaglyphealagly
305310315320
alatyriletyrvalglyprolysleuphethrleumetglyglyala
325330335
tyrglnserthrglnvaltyrgluthrvalglngluleualalysthr
340345350
asptrpglyaspvallysvaltyrtyrglyvalglulysproasngly
355360365
ilevalphepheleuglyleuvalglyalametilevalthralaarg
370375380
tyrleutyrlysleuphelysaspglyargargprohisglugluleu
385390395400
phealailethrphetyrvalmetseriletyrleuleutrpthrala
405410415
alaargpheleupheleualasertyralailealaleumetsergly
420425430
valphealaglytyrvalleugluthrvalglulysmetlysgluser
435440445
ileproilelysalaalaleuglyglyvalilealailemetleuleu
450455460
leuileproleuthrhisglyproleuleualaglnseralalysser
465470475480
metargthrthrgluilegluthrserglytrpgluaspalaleulys
485490495
trpleuarggluasnthrproglutyrserthralathrsertrptrp
500505510
asptyrglytyrtrpilegluserserleuleuglyglnargargala
515520525
seralaaspglyglyhisalaargaspargasphisileleualaleu
530535540
pheleualaargaspglyasnilesergluvalasppheglusertrp
545550555560
gluleuasntyrpheleuvaltyrleuasnasptrpalalyspheasn
565570575
alailesertyrleuglyglyalailethrargargglutyrasngly
580585590
aspgluserglyargglyalavalthrthrleuleuproleuproarg
595600605
tyrglyglulystyrvalasnleutyralalysvalilevalaspval
610615620
serasnserservallysvalthrvalglyaspargglucysasppro
625630635640
leumetvalthrphethrproserglylysthrilelysglythrgly
645650655
thrcysseraspglyasnalapheprotyrvalleuhisleuthrpro
660665670
thrileglyvalleualatyrtyrlysvalalathralaasnpheile
675680685
lysleualapheglyvalproalaserthrileproglypheserasp
690695700
lysleupheserasnphegluprovaltyrgluserglyasnvalile
705710715720
valtyrargphethrpropheglyiletyrlysileglugluasnile
725730735
asnglythrtrplysglnvaltyrasnleuthrproglylyshisglu
740745750
leulysleutyrileseralapheglyargaspilegluasnalathr
755760765
leutyriletyralaileasnasnglulysileileglulysilelys
770775780
ilealagluileserhismetasptyrleuasnglutyrproileala
785790795800
valasnvalthrleuproasnalathrsertyrargphevalleuval
805810815
glnlysglyproileglyvalleuleuaspalaprolysvalasngly
820825830
gluileargserprothrasnileleuarggluglygluserglyglu
835840845
ilegluleulysvalglyvalasplysasptyrthralaaspleutyr
850855860
leuargalathrpheiletyrleuvalarglysserglylysaspasn
865870875880
gluasptyraspalaalaphegluproglnmetaspvalphepheile
885890895
thrlysileglygluasnileglnleulysgluglygluasnthrval
900905910
lysvalargalagluleuprogluglyvalilesersertyrlysasp
915920925
gluleuglnarglystyrglyasplysleuileileargglyilearg
930935940
valgluprovalpheilealaglulysglutyrleumetleugluval
945950955960
seralaseralaprohishis
965
<210>12
<211>2904
<212>dna
<213>激烈火球菌
<400>12
atggtgaaaacccaaataaaggagaaaaagaaagatgaaaaagttactattccacttcct60
gggaagataaaaactgttttggccttcctagtcgttttggcatttgccgcatatggattt120
tacattagacatttaacagccggaaagtatttctcagatccagataccttctaccatttc180
gaaatttataagctagtcctcaaagagggccttcctaggtattacccaatggcagatgct240
ccatttggaagtctcataggagaacctcttggactatacatccttccagcaatattctac300
aaaataatctcaatatttgggtacaatgagctagaggcatttcttctttggcccccattc360
gtaggatttctcagtgttataggtgtttacttactcggaagaaaagttctgaacgaatgg420
gcagggatgtggggtgctataattctctcagtcctcacggcaaacttttcaagaacattc480
tcaggcaacgcaagaggcgacggcccattcatgatgttgtttacgttttcagcagtccta540
atgctctattatctaaccgaggaaaataaaaacaagaaaataatctggggaacactgttt600
gtactcttggcaggaatatcaactgcagcatggaacggttcaccatttggactaatggtt660
ctccttggattcgcatcgttccagacaataatcctctttatttttggaaagatcaatgag720
cttagagaattcataaaggaatactacccagcatacctgggaattttagctataagctac780
cttctaacgatcccaggaattggaaaaataggaggatttgtaagatttgcatttgaggtt840
ttcttagggttagttttcttagccatcgtcatgctctatggaggaaaatacttgaactat900
tctgacaagaagcacaggttcgcagtggttgcagttatagttattgcggggttcgcagga960
gcttatatttacgttggtccaaaactcttcactctaatgggtggagcttatcagtcaacg1020
caagtttatgaaacagtacaggagctcgcaaaaactgattggggagatgtaaaagtctat1080
tatggagtagaaaagccaaacggaatagtcttcttccttggattagttggagcaatgatt1140
gttacagctaggtacctctacaaattatttaaagatggaaggcgcccacacgaagagtta1200
tttgcaataactttctatgtaatgtcaatttacctcctctggacagctgctagattccta1260
ttcctagcgagttatgcgatagcattgatgtcaggtgtctttgcaggatacgtcctagag1320
actgtagaaaagatgaaagagagtataccaataaaagcagcactaggaggagtaattgct1380
attatgcttcttctaatacccttaactcatggcccactcttagctcaaagcgctaaaagt1440
atgagaacaaccgagatcgagactagtggatgggaagatgcgctcaaatggctcagagaa1500
aacactccagaatattcgaccgcaacctcttggtgggactatggatattggatagagtca1560
agcctcctaggacagagaagggccagtgctgatggtggacatgcaagagatagagatcat1620
atcttagccctatttctagccagagacggtaacattagtgaagtagactttgagagttgg1680
gagcttaactacttcctagtttaccttaatgattgggcaaagttcaatgcaatcagctat1740
ctaggcggggctataacgaggagagaatacaatggagatgaaagtggaagaggagccgta1800
actacgctacttcctctcccaaggtatggagagaaatacgtcaacctctatgccaaagtt1860
atagttgatgtttcaaactcgagcgtaaaggttactgtaggagacagagagtgtgatcca1920
ctaatggttacgtttactccaagtggaaagacgataaaaggaactggaacctgtagtgat1980
ggcaacgccttcccatatgttttacacttaactccaacaattggagtacttgcatactac2040
aaagtagcaactgcaaacttcattaagttagccttcggtgttccagcttcaacaattcca2100
ggattctctgataagctattctcaaactttgagccagtgtatgagtcaggaaacgtaata2160
gtatatcgcttcacaccatttggaatatacaaaattgaggaaaacattaacggaacttgg2220
aagcaagtttataacctaactcctggaaaacacgagctcaaactgtacatttcagcattc2280
ggaagagacatcgaaaatgcaacgctgtacatttacgccataaacaacgagaagatcata2340
gagaaaattaagattgccgagatatcccacatggactatctaaatgaatacccgatagca2400
gtgaacgtaaccctaccaaatgctacaagctacaggtttgtactagttcaaaaaggccca2460
ataggtgttcttctagatgcaccaaaagtcaatggtgagataagaagtccaaccaacata2520
ctaagggaaggagaaagtggagaaatagagcttaaagttggggttgataaagactacact2580
gccgatctatacttaagggctacgttcatatatttagtcagaaaaagtggaaaggataac2640
gaagattatgacgcagcgtttgagccccaaatggatgttttctttatcacaaagatcgga2700
gaaaacattcaacttaaagaaggagagaatacagtaaaggttagggcggagcttccagaa2760
ggagttatatctagctacaaagatgaactacagagaaaatacggagacaagttgataatc2820
agaggaataagagtagagccagtgttcatagcagaaaaagagtacctaatgctcgaggtc2880
agtgcatcggctcctcatcactaa2904
<210>13
<211>980
<212>prt
<213>人工的
<220>
<223>火球菌属st04ost
<400>13
metlysserleuvallysvalgluvallysargglulyslysasparg
151015
lysglulysarggluileglyasnileserarghistyrglylysile
202530
lysleualaleuthrpheilevalthrleuilephealatrptyrala
354045
phehisilearghisleuthralaglylystyrpheproaspproasp
505560
thrphetyrhistyrgluiletyrlysleuvalleulysgluglyleu
65707580
prolystyrtyrprometseraspalapropheglyserleuilegly
859095
gluproleuglyleutyrileleuproalailephetyrlysileleu
100105110
seralapheglytyrasnglupheglnalapheleuleutrppropro
115120125
phevalglypheleuservalileglyvaltyrleuleuglyarglys
130135140
ileleuasnglutrpalaglyleutrpalaalaalaileleualaval
145150155160
serthralaasnpheserargthrpheserglyasnalaargglyasp
165170175
glyprophemetmetleuphevalphesermetvalalaleuleutyr
180185190
tyrleugluglualaargilelysarglysalavaltrpglyalaleu
195200205
phevalileleualaglyleuserthrmetalatrpasnglyserpro
210215220
pheglyleumetvalleuleuglyphealaserleuglnthrileala
225230235240
leupheilepheglylysileaspgluleulyslyspheilelysglu
245250255
phetyrproalatyrvalservalleuileleusertyrleuleuthr
260265270
ileproglyleualalysileglnserpheileargphealapheglu
275280285
valpheleuglyleuvalpheleualailevalmetleutyrglyglu
290295300
lyspheleuasntyrserasplyslyshisargpheleuvalvalala
305310315320
ileilevalleuileglyphealaglyalatyralatyrvalglypro
325330335
lysleupheargleumetglyglyalatyrglnserthrglnvaltyr
340345350
glnthrvalglngluleualalysthrsermetglnaspilelysleu
355360365
tyrtyrglyvalglulysalaasnglyleuilephepheleuserile
370375380
proglypheleuilemetleuserleutyrleuileglyleutrpser
385390395400
lyssergluserproasnlysgluleuleuglyilethrphetyrval
405410415
metseriletyrleumetserleualavalargpheleupheleuala
420425430
sertyralailealaleuphealaglyileleuvalglytyrglyleu
435440445
gluvalileglulysmetlysgluasnvalglyilelysalaalaleu
450455460
alailevalileserilemetileleuleuileproilethrhisgly
465470475480
provalleualaargseralalysalametserlysthrgluvalglu
485490495
thrserglytrpgluglnalaleulystrpleuargasnasnthrpro
500505510
lystyralathralathrsertrptrpasptyrglytyrtrpileglu
515520525
serserleuleuglyasnargargalaseralaaspglyglyhisala
530535540
argaspargasphisileleualaleupheleualaargaspglyasn
545550555560
valsergluvalasppheglusertrpgluleuasntyrpheileval
565570575
tyrleuasnasptrpalalyspheasnalailesertyrleuglygly
580585590
alailethrlysargglutyrserglyaspglulysglyargglyser
595600605
ileprothrileileleualaproargpheglygluglntyrileasn
610615620
protyrasnglyvalserilelysvalleuasnasnserglnvalthr
625630635640
valthrileglyserthrthrcysserproleumetthrvalpheile
645650655
proglyasnlyslysvallysglyglnglysercysthrasnglygly
660665670
serpheprophevalvaltyrleuthrprothrleuglyvalileser
675680685
tyrtyrlysvalalathrserasnpheleulysleualatyrglyile
690695700
proalaserlysgluproglyphethrasplysleupheserasnphe
705710715720
lysmetvaltyrglngluglyasnvalvaliletyrglupheargpro
725730735
phealailetyrlysleuglngluphethrasnglythrtrplysthr
740745750
ilethrthrleuserproglylyshisthrleulysleutyrileser
755760765
alapheglyargaspilelysasnalathrleutyrileaspalaile
770775780
lysaspasnargthrileglnargilelysileglygluilelystyr
785790795800
metserhisleuasngluthrproilethrvalasnvalthrleupro
805810815
aspalaasplystyrlysphevalleuvalglnlysglyprovalgly
820825830
valleuthralaproprolysvalasnglylysilealaasnproval
835840845
argvalleuasnaspglygluserglyargleugluleulysvalgly
850855860
valasplysasptyrlysalaaspleutyrleuargalathrpheile
865870875880
tyrleuvalarglysserglythrserasnaspasptyrasnalaala
885890895
phegluprohismetaspvalphepheilethrlysleulyssergly
900905910
ileserleuhislysglygluasngluvalthrvalglualalysmet
915920925
progluasnvalileserasptyrlyslyslysleuglualaglutyr
930935940
glyasplysleuileileargglyileargvalgluprovalpheile
945950955960
alaglulysglutyrvalmetleugluvalargalaseralaprohis
965970975
hisserserglu
980
<210>14
<211>973
<212>prt
<213>人工的
<220>
<223>火球菌属菌株na2ost
<400>14
metvallysarglyslysgluglulysgluilelysglyglulysarg
151015
gluphetyrserlysilelysargmetileileproileilevalleu
202530
glyphealathrtyrglyphetyrleuarghisleuthralaglyarg
354045
tyrpheproaspproaspthrphetyrhisphegluiletyrlysleu
505560
valilelysgluglyleuprolystyrtyrproleuseraspalapro
65707580
pheglyserleuileglygluproleuglyleutyrileleuproala
859095
ilephetyrlysvalileseralapheglytyrasnglupheglnala
100105110
pheleuleutrpproprophevalglypheleuservalvalglyile
115120125
tyrleuleuglyarglysvalleuasnglutrpalaglyleutrpala
130135140
alavalileleuservalserthralaasnpheserargthrpheser
145150155160
glyasnalaargglyaspglyprophemetmetleuphevalpheser
165170175
alaileleumetphehistyrleuarggluthrserlysthrlyslys
180185190
valleutyrglythrleuphevalileleualaserileserleugly
195200205
alatrpasnglyserpropheglyleumetvalleuleuglypheala
210215220
serpheglnthrilealaleupheilepheglylysilesergluleu
225230235240
lyslysphealathrgluphetyrproalatyrleuglyileleuala
245250255
leuglytyrleuleuthrileproglyilevallysileglyserphe
260265270
ilelysphealaphegluvalpheleuglyleuvalvalleuleuthr
275280285
ilemetleutyrglyglyargtyrleuasntyrserasplyslyshis
290295300
argpheleuvalvalalavalvalvalleuileglyphealaglyala
305310315320
tyralatyrvalglyprolysleupheargleumetglyglyalatyr
325330335
glnserthrglnvaltyrgluthrvalglngluleualalysthrthr
340345350
metargaspilelysvaltyrtyrglyvalgluasnproasnglyleu
355360365
ilephepheleuserileproglyileileileileleuvallystyr
370375380
leuvalaspleuphearglyssergluserserasngluthrleuphe
385390395400
alaalavalphetyrilemetseriletyrleuleuserleualaval
405410415
argpheleupheleualasertyralailealaleuphealaglyile
420425430
phealaglyphevalilegluilevalglulysmetlysgluserile
435440445
glyilelysalaalaleuglyilevalileserilemetileleumet
450455460
ileproilethrhisalaprovalleualaargseralaargserleu
465470475480
serargthrgluvalgluthrthrglytrpgluglnvalleulystrp
485490495
leuargserasnthrserglntyralathralathrsertrptrpasp
500505510
tyrglytyrtrpilegluserserleuleuglyasnargargalaser
515520525
alaaspglyglyhisalaargaspargasphisileleualaleuphe
530535540
leualaargaspglyasnvalsergluvalasppheglusertrpglu
545550555560
leuasntyrpheilevaltyrleuasnasptrpalalyspheasnala
565570575
ilesertyrleuglyglyalaleuthrargargglutyrlysglyasp
580585590
gluthrglyargglyservalthrserileleuilethrglnglyala
595600605
glyasnvaltyrvalasnprotyralaglyilethrilelysvalval
610615620
glugluasnlysthrarglysvalvalvalasnileglyargleuglu
625630635640
cysserprometthrthrvalvalpheproglyasnilehisilelys
645650655
glythrglysercysasnasnglyserserpheprotyrvalvaltyr
660665670
leuthrproserleuglyileilealatyrtyrlysvalalathrser
675680685
asnpheilelysleualapheglyileprovalserasntyrlysgly
690695700
phethrglulysleupheserasnphevalprovaltyrglnalagly
705710715720
asnvalilevaltyrglupheargprophealailetyrglymetglu
725730735
gluleuvalasnglysertrpargtyrileglytyrleuthrprogly
740745750
lyshisthrleuargleutyrileseralapheglyargaspilelys
755760765
asnalathrleutyrvaltyralaileasnglythrgluilethrala
770775780
lysileargleuthrlysileasptyrmetasnhisleuasnglutyr
785790795800
proilethrvalasnvalthrleuproproalaglnlystyrargphe
805810815
valleuvalglnlysglyprovalglyvalleuthrglyproprolys
820825830
leuasnglylysilevalasnproileservalleulysgluglyglu
835840845
gluglygluleugluleulysvalglyvalasplysasntyrthrala
850855860
aspleutyrleuargalathrpheiletyrleuvalarglysglygly
865870875880
thrserasngluasptyrasnalaalaphegluprohismetaspval
885890895
phepheileserargvallysgluglyilelysleuhisproglyasp
900905910
asntyrvallysalahisvalglumetprolysglyvalileserser
915920925
tyrlysglugluleuglulyslystyrglyaspargleuileilearg
930935940
glyileargvalgluprovalpheilealaglulysglutyrthrmet
945950955960
leugluvalseralaseralaprohishisserserglu
965970
<210>15
<211>976
<212>prt
<213>超嗜热火球菌
<400>15
metvallysserlysvallyslysvalglulysglylysgluglyglu
151015
glulysargserthrtyrvalleuleulyslysvalleuileproile
202530
leuvalpheglyphealailetyralaphetyrleuarghisleuthr
354045
alaglylystyrpheproaspproaspthrphetyrhisphegluile
505560
tyrlysleuvalleulysgluglyleuproargtyrtyrprometser
65707580
aspalapropheglyserleuileglygluproleuglyleutyrleu
859095
leuproalaalaphetyrlysvalvalserleupheglytyrasnglu
100105110
leuglnalapheleuleutrpproprophevalglypheleuglyval
115120125
ilealavaltyrleuleuglyarglysvalleuasnglutrpthrgly
130135140
leutrpglyalavalvalleuthrvalserthralaasnpheserarg
145150155160
thrpheserglyasnalaargglyaspglyprophemetalaleuphe
165170175
ilephealaservalalametleutyrtyrleulysgluserasnlys
180185190
thrarglysileiletyrglythrleuphevalleuleuthrvalile
195200205
serleuglyalatrpasnglyserpropheglyleumetvalleuleu
210215220
glyphealaserleuglnthrileileleupheilepheglylysleu
225230235240
glugluleulyslysphevallysgluphetyrproalatyrleuala
245250255
ileleualapheglytyralaleuthrpheproglyilevallysile
260265270
glyglypheileargphealaphegluvalpheleuglyleuilephe
275280285
leuleuvalilemetleutyrglyglyargtyrleuasntyrserasp
290295300
lyslyshisargpheleuvalvalthrileilevalleuleuglyphe
305310315320
glyglyalatyralatyrvalglyprolysleupheargleumetgly
325330335
glyalatyrglnserthrglnvaltyrgluthrvalglngluleuala
340345350
lysthrthrileglyaspvallysalatyrtyrglyvalglusergly
355360365
asnglyleuilephepheleuserileproglyleuleuileleuleu
370375380
thrlystyrleutyraspleuphelyslysalalysseraspasnglu
385390395400
thrleuphealaleuvalphetyrthrmetserleutyrleuleutyr
405410415
leualavalargpheleupheleualasertyralavalalaleuphe
420425430
pheglyilepheileglyphesermetaspvalileglulysmetlys
435440445
gluasnileglyilelysalaalaleuglyilevalleuserleumet
450455460
ileleuvalileprophevalhisalaprovalleualaargserala
465470475480
argalaleulysasnthrgluilegluvalthrglytrpgluglnala
485490495
leulystrpleuargserasnthrserlystyralathralathrser
500505510
trptrpasptyrglytyrtrpilegluserserleuleuglyasnarg
515520525
argalaseralaaspglyglyhisalaargaspargasphisileleu
530535540
alaleupheleualaargaspglyasnilesergluvalasppheglu
545550555560
sertrpgluleuasntyrpheileiletyrleuasnasptrpalalys
565570575
pheasnalailesertyrleuglyglyalailethrarglysglutyr
580585590
asnglyaspgluasnglyargglyargvalthrthrileleuleuthr
595600605
glnalaalaglyasnvaltyrvalasnprotyralaargilevalile
610615620
lysvalileglnglnasnlysthrargargilealavalasnilegly
625630635640
glnleuglucysserproileleuservalalapheproglyasnile
645650655
lysilelysglyserglyargcysseraspglyserpropheprotyr
660665670
valvaltyrleuthrproserleuglyvalleualatyrtyrlysval
675680685
alathrserasnphevallysleualapheglyileprothrserser
690695700
tyrsergluphealaglulysleupheserasnpheileprovaltyr
705710715720
glntyrglyservalilevaltyrglupheargprophealailetyr
725730735
lysilegluasppheileasnglythrtrparggluvalglylysleu
740745750
serproglylyshisthrleuargleutyrileseralapheglyarg
755760765
aspilelysasnalathrleutyrvaltyralaleuasnglythrlys
770775780
ileilelysargilelysvalglygluilelystyrmetasnhisleu
785790795800
gluglutyrproileilevalasnvalthrleuprothralaglnlys
805810815
tyrargpheileleualaglnlysglyprovalglyvalleuthrgly
820825830
provalargvalasnglylysilethrasnproalatyrilemetarg
835840845
gluglygluserglyargleugluleulysvalglyvalasplysglu
850855860
tyrthralaaspleutyrleuargalathrpheiletyrleuvalarg
865870875880
lysglyglylysserasngluasptyraspalaserphegluprohis
885890895
metaspthrphepheilethrlysleulysgluglyilelysleuarg
900905910
proglygluasngluilevalvalasnalaglumetprolysasnala
915920925
ilesersertyrlysglulysleuglulysgluhisglyasplysleu
930935940
ileileargglyileargvalgluprovalpheilevalglulysglu
945950955960
tyrthrmetilegluvalseralaseralaprohishisserserglu
965970975
<210>16
<211>976
<212>prt
<213>深海火球菌
<400>16
metvallysthrlysvallysgluglulysgluglulysserglulys
151015
sergluglylysserleutyrproleuleulysargileleuilepro
202530
leualavalileglypheglyiletyralatyrtyrleuarghisleu
354045
thralaglylystyrpheproaspproaspthrphetyrhispheglu
505560
iletyrlysleuvalleulysgluglyleuprolystyrtyrpromet
65707580
alaglualapropheglyserleuileglygluproleuglyleutyr
859095
ileleuproalailephetyrlysvalvalservalpheglytyrasn
100105110
glupheglnalapheleumettrpproprophevalglypheleugly
115120125
valilealavaltyrleuleuglyarglysvalleuasnglutrpala
130135140
glyleutrpalaalavalileleuservalserthralaasnpheser
145150155160
argthrpheserglyasnalaargglyaspglyprophemetthrleu
165170175
pheleupheserleuvalalametleutyrtyrleulysgluasnasp
180185190
ilelyslyslysserleutrpglyalavalphevalleuleualaser
195200205
ileserleuglyalatrpasnglyserpropheglyleumetvalleu
210215220
ileglyphealaserpheglnthrilealaleupheilepheglylys
225230235240
ilelysgluleulyslysphevallysgluphetyrproalatyrleu
245250255
alaileleualaileglytyrglyleuthrileproglyilealalys
260265270
ileglyglypheilelysphealaphegluvalpheleuglyleuval
275280285
leuleuvalthrilemetleutyrglyglylyspheleuasntyrser
290295300
asplyslyshisargphealavalvalalavalilevalleuleugly
305310315320
phealaglyalatyralatyrvalglyprolysleupheargleumet
325330335
glyglyalatyrglnserthrglnvaltyrglnthrvalglngluleu
340345350
alalysthrthrleuseraspilelysleutyrtyrglyvalglugly
355360365
asnasnglyleuvalphepheleuserileproglypheleuileile
370375380
leuglyleutyrleuasnalaleuleulyslyssergluserserasn
385390395400
glutyrmetleuserleuvalphetyrilemetserleutyrleuleu
405410415
serleualavalargpheleupheleualasertyralailealaleu
420425430
pheserglyilephealaglyphethrmetgluvalileglulysmet
435440445
lysgluasnvalglyilelysalaalaleuglyilealailealaval
450455460
metileleumetvalproilethrhisglyprovalilealaargasn
465470475480
alalysalaleulysvalsergluilegluthrthrglytrpglugln
485490495
valleulystrpleuasngluasnthrserlystyralathralathr
500505510
sertrptrpasptyrglytyrtrpilegluserserleuleuglyhis
515520525
argargalaseralaaspglyglyhisalaargaspargasphisile
530535540
leualaleupheleualaargaspglyasnvalsergluvalaspphe
545550555560
glusertrpgluleuasntyrpheileiletyrleuasnasptrpala
565570575
lyspheasnalailesertyrleuglyglyalailethrargargglu
580585590
tyrasnglyaspgluthrglyargglyglnvalthrthrileleupro
595600605
leuglnglyserglyglyiletyrvalasnprotyralaglyileser
610615620
valargvalvalglnserasnthrthrserlysvalthrvalasnval
625630635640
argglyargalaglucysserproiletyrthrleuleuileprogly
645650655
asnlyslysileproglyasnglyargcysseraspglyserprophe
660665670
protyrvalleutyrleualaproasnpheglyleuilethrtyrtyr
675680685
lysvalalathrserasnpheilelysleualapheasnileproile
690695700
serlystyrserglyphethrglulysleutyrserasnphevalpro
705710715720
valtyrglytyrglyasnvalilevaltyrglupheargpropheala
725730735
iletyrargileglugluleuileasnglythrtrplysalavalasn
740745750
serleuthrproglylyshisgluleulysleutyrileseralaphe
755760765
glyargaspileargasnalathrleutyrvaltyralaileglyasn
770775780
lysthrglulysilelysileglygluileglutyrmetasnhisleu
785790795800
asnglulysproileilevalasnvalthrleuprolysalaglulys
805810815
tyrargleuvalleuvalglnlysglyprovalglyvalleuthrgly
820825830
proprolysleuasnglygluilealaasnproileargilealaarg
835840845
gluglyglulysglythrleuserleulysvalglyvalasplysasp
850855860
tyrthralaaspleutyrleuargalathrpheiletyrleuvalarg
865870875880
lysgluglylysserasnaspasptyrasnalaalaphegluprohis
885890895
metaspthrphepheilethrlysleulysglyglyilelysleuhis
900905910
lysglyaspasnvalvalthralagluleuasnmetproasnglyval
915920925
ilesersertyrlysglulysleuglulysglutyrglyasplysleu
930935940
ileileargglyileargvalgluprovalpheilealaglulysglu
945950955960
tyrvalmetalagluvalargalaseralaprohishisglyserglu
965970975
<210>17
<211>972
<212>prt
<213>专性嗜压超嗜热火球菌
<400>17
metvallysthrlysvallysargglulysarggluglulysalapro
151015
gluhisargprolysthrleuvalvalphephelysargpheglyile
202530
proleuilevalleualaphealathrleuglyphetyrileargtyr
354045
leuproglythrglylystyrpheileaspproaspthrtyrtyrhis
505560
tyrgluiletyrlysleuvalleulysgluglyleuproargtyrtyr
65707580
sermetalaglualapropheglyserleuileglygluproleugly
859095
leutyrleuleuproalailephetyrlysleuileseralaphegly
100105110
tyrthrthrleuglnalaphelysleutrpproprothrvalglyphe
115120125
leuserileilealathrtyrleuleualaarglysilehisglyglu
130135140
trpalaglyleutrpseralaalailemetserpheleuleualahis
145150155160
phethrargthrpheserglyasnalaargglyaspglypropheleu
165170175
metleupheleuphealaservalalametleutyrtyrleugluala
180185190
lysaspvallysarglysmetvaltyrglythrleuphevalalaleu
195200205
servalilealaleuseralatrpasnglyserpropheserleumet
210215220
valpheleuglypheglyalaleuglnalailevalleuphevalphe
225230235240
glyargileglugluleuargglupheilelysleutyrtyrprothr
245250255
tyrleuthrvalleuleuleuglytyrleuleuthrpheproargile
260265270
valalavallysglyhisileleuphealaleulysvalpheleugly
275280285
leualaglyleuthrvalleumetleutyrglyglylystrpleuasn
290295300
tyrseraspargarghisargphealavalvalalavalvalthrleu
305310315320
leuglyphevalglyalatyriletyrvalglyprolysleupheser
325330335
leumetalaglyalatyrglnserthrglnvaltyrgluthrvalgln
340345350
gluleualalysthrthrleuglyaspilelysalatyrtyrglyile
355360365
lysglythraspglyilevalphephemetserleualaglyvalleu
370375380
valleuleutyrargtyrleuthrthrleuleuarggluglyargser
385390395400
serhisglutyrleuphealaleuthrleutyrglymetserleutyr
405410415
leuvaltrpseralavalargpheleupheleualaserglyalaval
420425430
ileleumetalaglyvalphealaglygluleupheargileileglu
435440445
aspmetlysglulysalathrthrlysilethrleuglyleualaleu
450455460
thrvalmetleuleuleumetprovalthrglyvalproleumetile
465470475480
asnthralalysalametlysthrsergluvalgluargserglytrp
485490495
gluaspalaleumettrpleuarggluasnthrserglutyralathr
500505510
alathrsertrptrpasptyrglytyrtrpilegluserserleuleu
515520525
glyasnargargalaseralaaspglyglyhisalaargaspargasp
530535540
hisileleualaleupheleualaargaspglyasnvalsergluval
545550555560
asppheglusertrpgluleuasntyrpheilealatyrmetglnasp
565570575
trparglyspheasnalailesertyrleuglyglyalailethrarg
580585590
argglutyrlysglyaspgluserglyargglyglyvalthrthrile
595600605
valleuleuproglyalaasnglyvaltyrserasnprotyrmetgly
610615620
leuthrleuargvalgluasnargthrvallysvalasnglytyrcys
625630635640
gluprometgluservalileleuproserasnthrhisilelysgly
645650655
serglyglncysgluthrglysertyrpheprotyrvalalatyrval
660665670
thrprothrphealavalleualatyrtyrlysvalalathrserasn
675680685
pheleulysleualapheglyileproalaserlysglualaasnphe
690695700
thrglulysleutyralaasnphegluleuvalpheglnserglyasp
705710715720
valilevaltyrgluphelysprophealavaltyrlysalagluglu
725730735
leuvalasnglythrtrpargalavalgluthrleuthrproglyglu
740745750
histhrleulysleutyrileseralapheglyargaspvallysasn
755760765
alathrleutyrvalglualaleulysaspglylysvalvalgluarg
770775780
ilelysvalalagluglyleutyrileasphisleuasnglulyspro
785790795800
ilegluvallysvalasnleuproglualaaspglutyrargpheval
805810815
leuvalglnlysglyprovalglyvalleuthrseralaproargval
820825830
asnglyserilealaasnproilelysvalleuglygluglyglnser
835840845
glythrleugluleulysalaalapheaspargasptyrthralaasp
850855860
leutyrleuargvalthrpheiletyrleuvalarglysserglyarg
865870875880
serasnaspaspileaspalaalaphegluprohismetaspthrphe
885890895
phealaalalysleualagluglyleulysleulyslysglygluasp
900905910
thrilethrvalasnalaglyleuproalaglyvalilesersertyr
915920925
gluglulysleulysalaleutyrglyaspargleuileilearggly
930935940
ileargvalgluprovalpheilealaasplysalatyrthriletrp
945950955960
gluvalargalaseralaprohishisglyserglu
965970
<210>18
<211>982
<212>prt
<213>人工的
<220>
<223>火球菌属stt3共有序列
<220>
<221>misc_feature
<222>(1)..(1)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(4)..(29)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(31)..(40)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(42)..(48)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(50)..(50)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(52)..(54)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(56)..(56)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(59)..(59)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(64)..(64)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(67)..(67)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(74)..(74)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(80)..(80)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(83)..(86)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(101)..(101)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(105)..(105)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(109)..(110)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(112)..(112)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(116)..(119)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(122)..(123)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(127)..(127)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(132)..(136)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(140)..(140)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(143)..(145)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(148)..(148)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(150)..(150)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(152)..(152)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(154)..(160)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(162)..(162)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(164)..(164)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(178)..(179)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(182)..(182)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(184)..(190)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(193)..(199)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(201)..(203)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(205)..(206)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(209)..(209)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(211)..(216)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(224)..(224)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(228)..(229)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(232)..(234)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(236)..(236)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(238)..(238)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(241)..(241)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(244)..(246)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(249)..(250)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(252)..(255)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(258)..(258)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(260)..(262)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(264)..(266)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(268)..(268)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(271)..(271)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(273)..(282)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(285)..(286)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(292)..(293)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(295)..(297)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(302)..(304)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(310)..(311)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(315)..(315)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(318)..(323)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(326)..(326)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(330)..(330)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(338)..(338)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(341)..(341)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(351)..(351)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(360)..(362)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(364)..(364)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(366)..(366)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(370)..(374)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(376)..(377)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(380)..(383)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(385)..(391)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(394)..(395)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(397)..(412)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(414)..(414)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(417)..(417)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(420)..(422)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(424)..(424)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(432)..(432)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(434)..(435)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(437)..(438)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(440)..(442)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(444)..(449)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(451)..(451)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(455)..(458)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(460)..(461)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(463)..(468)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(470)..(470)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(472)..(473)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(475)..(478)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(480)..(484)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(486)..(491)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(493)..(493)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(495)..(496)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(500)..(501)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(503)..(503)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(506)..(507)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(510)..(511)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(513)..(513)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(532)..(532)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(559)..(559)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(573)..(574)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(576)..(577)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(580)..(580)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(592)..(592)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(594)..(595)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(598)..(598)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(602)..(602)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(606)..(619)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(621)..(621)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(623)..(623)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(625)..(630)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(632)..(649)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(651)..(651)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(653)..(658)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(660)..(665)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(667)..(667)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(669)..(669)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(671)..(672)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(674)..(675)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(678)..(678)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(680)..(683)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(685)..(690)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(697)..(697)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(700)..(700)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(704)..(706)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(708)..(708)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(710)..(713)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(715)..(716)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(719)..(720)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(723)..(724)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(726)..(728)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(730)..(730)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(732)..(733)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(735)..(735)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(737)..(737)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(740)..(741)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(743)..(748)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(751)..(751)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(753)..(757)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(759)..(759)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(762)..(762)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(764)..(764)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(766)..(766)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(776)..(777)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(783)..(784)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(786)..(794)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(796)..(805)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(807)..(807)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(809)..(809)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(812)..(812)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(814)..(814)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(816)..(816)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(819)..(819)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(821)..(822)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(824)..(826)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(828)..(828)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(833)..(833)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(837)..(842)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(845)..(845)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(847)..(848)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(850)..(855)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(857)..(858)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(860)..(862)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(865)..(867)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(869)..(870)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(872)..(872)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(879)..(879)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(888)..(888)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(890)..(891)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(893)..(893)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(895)..(896)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(898)..(898)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(902)..(902)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(905)..(905)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(908)..(916)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(918)..(919)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(921)..(930)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(932)..(934)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(937)..(937)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(939)..(941)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(943)..(946)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(949)..(949)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(963)..(964)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(966)..(966)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(968)..(970)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(973)..(973)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(980)..(982)
<223>xaa可以是任意天然存在的氨基酸
<400>18
xaavallysxaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaa
151015
xaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaalysxaaxaa
202530
xaaxaaxaaxaaxaaxaaxaaxaaphexaaxaaxaaxaaxaaxaaxaa
354045
argxaaleuxaaxaaxaaglyxaatyrphexaaaspproaspthrxaa
505560
tyrhisxaagluiletyrlysleuvalxaalysgluglyleuproxaa
65707580
tyrtyrxaaxaaxaaxaaalapropheglyserleuileglyglupro
859095
leuglyleutyrxaaleuproalaxaaphetyrlysxaaxaaserxaa
100105110
pheglytyrxaaxaaxaaxaaalaphexaaxaatrpproproxaaval
115120125
glypheleuxaaxaaxaaxaaxaatyrleuleuxaaarglysxaaxaa
130135140
xaaglutrpxaaglyxaatrpxaaalaxaaxaaxaaxaaxaaxaaxaa
145150155160
alaxaaphexaaargthrpheserglyasnalaargglyaspglypro
165170175
phexaaxaaleuphexaaphexaaxaaxaaxaaxaaxaaxaatyrleu
180185190
xaaxaaxaaxaaxaaxaaxaalysxaaxaaxaaglyxaaxaapheval
195200205
xaaleuxaaxaaxaaxaaxaaxaaalatrpasnglyserprophexaa
210215220
leumetvalxaaxaaglyphexaaxaaxaaglnxaailexaaleuphe
225230235240
xaapheglyxaaxaaxaagluleuxaaxaaphexaaxaaxaaxaatyr
245250255
proxaatyrxaaxaaxaaleuxaaxaaxaatyrxaaleuthrxaapro
260265270
xaaxaaxaaxaaxaaxaaxaaxaaxaaxaaphealaxaaxaavalphe
275280285
leuglyleuxaaxaaleuxaaxaaxaametleutyrglyxaaxaaxaa
290295300
leuasntyrseraspxaaxaahisargphexaavalvalxaaxaaxaa
305310315320
xaaxaaxaaglyphexaaglyalatyrxaatyrvalglyprolysleu
325330335
phexaaleumetxaaglyalatyrglnserthrglnvaltyrxaathr
340345350
valglngluleualalyslysxaaxaaxaaaspxaalysxaatyrtyr
355360365
glyxaaxaaxaaxaaxaaglyxaaxaaphephexaaxaaxaaxaagly
370375380
xaaxaaxaaxaaxaaxaaxaatyrleuxaaxaaleuxaaxaaxaaxaa
385390395400
xaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaatyrxaametser
405410415
xaatyrleuxaaxaaxaaalaxaaargpheleupheleualaserxaa
420425430
alaxaaxaaleuxaaxaaglyxaaxaaxaaglyxaaxaaxaaxaaxaa
435440445
xaagluxaametlysgluxaaxaaxaaxaalysxaaxaaleuxaaxaa
450455460
xaaxaaxaaxaametxaaleuxaaxaaproxaaxaaxaaxaaproxaa
465470475480
xaaxaaxaaxaaalaxaaxaaxaaxaaxaaxaagluxaagluxaaxaa
485490495
glytrpgluxaaxaaleuxaatrpleuxaaxaaasnthrxaaxaatyr
500505510
xaathralathrsertrptrpasptyrglytyrtrpilegluserser
515520525
leuleuglyxaaargargalaseralaaspglyglyhisalaargasp
530535540
argasphisileleualaleupheleualaargaspglyasnxaaser
545550555560
gluvalasppheglusertrpgluleuasntyrphexaaxaatyrxaa
565570575
xaaasptrpxaalyspheasnalailesertyrleuglyglyalaxaa
580585590
thrxaaxaaglutyrxaaglyaspgluxaaglyargglyxaaxaaxaa
595600605
xaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaatyrxaaasnxaatyr
610615620
xaaxaaxaaxaaxaaxaavalxaaxaaxaaxaaxaaxaaxaaxaaxaa
625630635640
xaaxaaxaaxaaxaaxaaxaaxaaxaacysxaaproxaaxaaxaaxaa
645650655
xaaxaaproxaaxaaxaaxaaxaaxaaglyxaaglyxaacysxaaxaa
660665670
glyxaaxaapheproxaavalxaaxaaxaaxaaproxaaxaaxaaxaa
675680685
xaaxaatyrtyrlysvalalathrxaaasnphexaalysleualaxaa
690695700
xaaxaaproxaaserxaaxaaxaaxaaphexaaxaalysleuxaaxaa
705710715720
asnphexaaxaavalxaaxaaxaaglyxaavalxaaxaatyrxaaphe
725730735
xaaprophexaaxaatyrxaaxaaxaaxaaxaaxaaasnglyxaatrp
740745750
xaaxaaxaaxaaxaaleuxaaproglyxaahisxaaleuxaaleutyr
755760765
ileseralapheglyargaspxaaxaaasnalathrleutyrxaaxaa
770775780
alaxaaxaaxaaxaaxaaxaaxaaxaaxaailexaaxaaxaaxaaxaa
785790795800
xaaxaaxaaxaaxaaleuxaagluxaaproilexaavalxaavalxaa
805810815
leuproxaaalaxaaxaatyrxaaxaaxaaleuxaaglnlysglypro
820825830
xaaglyvalleuxaaxaaxaaxaaxaaxaaasnglyxaailexaaxaa
835840845
proxaaxaaxaaxaaxaaxaaglyxaaxaaglyxaaxaaxaaleulys
850855860
xaaxaaxaaaspxaaxaatyrxaaalaaspleutyrleuargxaathr
865870875880
pheiletyrleuvalarglysxaaglyxaaxaaasnxaaaspxaaxaa
885890895
alaxaaphegluproxaametaspxaaphephexaaxaaxaaxaaxaa
900905910
xaaxaaxaaxaaleuxaaxaaglyxaaxaaxaaxaaxaaxaaxaaxaa
915920925
xaaxaaproxaaxaaxaaileserxaatyrxaaxaaxaaleuxaaxaa
930935940
xaaxaaglyaspxaaleuileileargglyileargvalgluproval
945950955960
pheilexaaxaalysxaatyrxaaxaaxaagluvalxaaalaserala
965970975
prohishisxaaxaaxaa
980
<210>19
<211>833
<212>prt
<213>硕大利什曼原虫
<400>19
metalaalaalaserasnvalasnalaprogluserasnvalmetthr
151015
thrargseralavalalaproproserthralaalaprolysgluala
202530
sersergluthrleuleuileglyleutyrlysmetproserglnthr
354045
argserleuiletyrsersercysphealavalalametalaileala
505560
leuproilealatyraspmetargvalargserileglyvaltyrgly
65707580
tyrleuphehisserseraspprotrppheasntyrargalaalaglu
859095
tyrmetserthrhisglytrpseralaphephesertrppheasptyr
100105110
metsertrptyrproleuglyargprovalglyserthrthrtyrpro
115120125
glyleuglnleuthralavalalailehisargalaleualaalaala
130135140
glymetprometserleuasnasnvalcysvalleumetproalatrp
145150155160
pheserleuvalserseralametalaalaleuleualahisglumet
165170175
serglyasnmetalavalalaserileserserileleupheserval
180185190
valproalahisleumetargsermetalaglyglupheaspasnglu
195200205
cysilealavalalaalametleuleuthrphetyrcystrpvalarg
210215220
serleuargthrargsersertrpproileglyvalleuthrglyval
225230235240
alatyrglytyrmetalaalaalatrpglyglytyrilephevalleu
245250255
asnmetvalalamethisalaglyilesersermetvalasptrpala
260265270
argasnthrtyrasnproserleuleuargalatyrthrleuphetyr
275280285
valvalglythralailealavalcysvalproprovalglymetser
290295300
prophelysserleugluglnleuglyalaleuleuvalleuvalphe
305310315320
ilepheglyglnservalcysglualaglnargargargleuglyile
325330335
alaargleuserlysgluglyvalalaleuleuileargileaspala
340345350
alaphephevalglyilevalalavalalathrilealaproalagly
355360365
phephelysproleuserleuglnalaasnalaileilethrglyval
370375380
serargthrglyasnthrleuvalaspileleuleualaglnaspala
385390395400
serasnleuleumetvaltrpglnleupheleuphepropheleugly
405410415
trpvalalaglymetseralapheleuarggluleuileargasntyr
420425430
thrtyralalysserpheileleumettyrglyvalvalglymettyr
435440445
phealaserglnservalargmetmetvalmetmetalaprovalala
450455460
cysilephethralaleuleupheargtrpalaleuasptyrleuleu
465470475480
glyserleuphetrpalaglumetproproserpheaspthraspala
485490495
glnargglyargglnglnglnthralaglugluserglualagluthr
500505510
lysarglysglugluglutyrasnthrmetglnvallyslysmetser
515520525
valargmetleuprophemetleuleuleuleuleupheargleuser
530535540
glypheilegluaspvalalaalaileserarglysmetglualapro
545550555560
glyilevalpheprosergluglnvalglnglyvalserglulyslys
565570575
valaspasptyrtyralaglytyrleutyrleuargaspserthrpro
580585590
gluaspalaargvalleualatrptrpasptyrglytyrglnilethr
595600605
glyileglyasnargthrserleualaaspglyasnthrtrpasnhis
610615620
gluhisilealathrileglylysmetleuthrserprovalalaglu
625630635640
alahisserleuvalarghismetalaasptyrvalleuileserala
645650655
glyaspthrtyrpheseraspleuasnargserprometmetalaarg
660665670
ileglyasnservaltyrhisaspilecysproaspaspproleucys
675680685
serglnphevalleuglnlysargprolysalaalaalaalalysarg
690695700
serarghisvalservalaspalaleuglugluaspaspthralaglu
705710715720
hismetvaltyrgluproserserleuilealalysserleuiletyr
725730735
hisleuhisserthrglyvalvalthrglyvalthrleuasngluthr
740745750
leupheglnhisvalphethrserproglnglyleumetargilephe
755760765
lysvalmetasnvalserthrgluserlyslystrpvalalaaspser
770775780
alaasnargvalcyshisproproglysertrpilecysproglygln
785790795800
tyrproproalalysgluileglnglumetleualahisglnhisthr
805810815
asnphelysaspleuleuaspproargthrthrtrpserglyserarg
820825830
arg
<210>20
<211>2502
<212>dna
<213>硕大利什曼原虫
<400>20
atggcggcagcgtcaaacgtgaatgcccccgaaagcaacgtgatgacaacgagaagtgcc60
gttgcaccaccgtcgacggctgcacccaaagaggcttcaagtgaaacgctgctcattggc120
ctatacaagatgccctcgcaaactcgtagcctcatctactcctcctgctttgcggtggcc180
atggccattgccctccctatcgcgtacgacatgcgtgtccgctccatcggcgtgtacggg240
tacctcttccacagcagtgacccgtggttcaactaccgcgctgccgagtacatgtccacg300
cacggctggtccgccttcttcagctggttcgactacatgagctggtacccgctgggccgc360
cccgtcggctccaccacgtacccgggcctgcagctcactgccgtcgccattcaccgcgca420
ctggcggctgccggcatgccgatgtctctcaacaacgtgtgcgtgctgatgccagcgtgg480
ttttcacttgtctcttcagcgatggcggcactgctggcgcatgagatgagcggcaatatg540
gcggtagccagcatctcgtctatcttattcagtgtggttccagcccacctgatgcggtcc600
atggcgggtgagttcgacaacgagtgtatcgccgtcgcagccatgctcctcaccttctac660
tgctgggtgcgctcgctgcgcacgcggtcctcgtggcccatcggtgtcctcaccggtgtc720
gcctacggctacatggcggcggcgtggggcggctacattttcgtgctcaacatggttgcc780
atgcatgccggcatatcatcgatggtggactgggcccgcaacacgtacaacccgtcgctg840
ctgcgtgcatacacgctgttctacgtcgtgggcaccgccatcgccgtgtgcgtgccgcca900
gtggggatgtcgcccttcaagtcgctggagcagctgggtgcgctgctggtgcttgtcttc960
attttcggtcagtctgtgtgtgaggcccagcgcagacgattgggaatcgcgcgcctttca1020
aaggagggcgtggcgctgctcatccgcatcgacgcagccttcttcgtcggtatcgttgcc1080
gtggccaccattgccccggctggattcttcaagccgctctccctgcaagcgaacgcgata1140
atcactggcgtatctcgtaccggaaacacactcgtagacattctgcttgcgcaagacgcg1200
tccaacctactcatggtgtggcagctttttctctttcccttcttaggttgggtggcgggc1260
atgagcgccttccttagagagttgatccggaactacacctacgcgaagagtttcatcctg1320
atgtacggcgtggtcggtatgtacttcgccagccagtctgtccgaatgatggtgatgatg1380
gcccccgtggcgtgcatctttactgccctcttgttccgctgggcactggactacctcctc1440
gggtctttgttttgggctgagatgccaccttcctttgacaccgacgcacagcgtgggcgg1500
cagcaacagaccgccgaggagtcggaggcagagaccaagcgtaaggaggaagagtacaac1560
accatgcaggtcaagaagatgtcggtgcgcatgttgcccttcatgctgttgctcttactg1620
tttcgtctttcggggttcatcgaagatgtggcggcgatatcgcgcaagatggaggcgccg1680
ggtatagtttttcccagtgaacaggtgcaaggcgtgtcggagaaaaaggtcgacgactac1740
tatgcggggtacctgtatctgcgcgacagcacgccagaggacgcgcgcgttttggcctgg1800
tgggactacggctaccagatcacaggcatcggcaaccgcacctcgctggccgatggcaac1860
acctggaaccacgagcacatcgccacgatcggcaagatgctgacgtcgcccgtggcggag1920
gcgcactcgctggtgcgccacatggccgactatgttctgatttctgctggagacacatat1980
ttttccgacctgaatcgctcaccgatgatggcgcgcatcggcaacagcgtgtaccacgac2040
atctgccccgacgacccactttgtagtcagttcgtgttgcagaaaagaccgaaagctgct2100
gcagcgaagcgcagtcggcacgtcagcgttgacgcactagaggaggatgacactgcagag2160
catatggtatacgagccgtcatcactcatagccaagtcgctcatatatcacctgcactcc2220
acaggggtggtgacgggggtcacgctgaatgagacgctcttccagcacgtcttcacctca2280
ccgcagggtctcatgcgcatcttcaaggtcatgaacgtgagcacggagagcaaaaagtgg2340
gttgctgactcggcaaaccgcgtgtgccacccgcctgggtcgtggatctgccccgggcag2400
tacccgccggcgaaggagatccaggagatgctggcacaccaacacaccaacttcaaggac2460
cttcttgatcccagaacgacttggagcgggagcaggcgctga2502
<210>21
<211>794
<212>prt
<213>杜氏利什曼原虫
<400>21
metserserglnthrargserileiletyrsersercysphealaval
151015
alametalailealaleuproilealatyraspmetargvalargser
202530
ileglyvaltyrglytyrleuphehisargseraspprotrppheasn
354045
tyrargalaalaglutyrmetserthrhisglytrpseralaphephe
505560
sertrppheasptyrmetsertrptyrproleuglyargprovalgly
65707580
serthrthrtyrproglyleuglnleuthralavalalailehisarg
859095
alaleualaalaalaglymetprometserleuasnasnvalcysval
100105110
leumetproalatrppheserleuvalserseralametvalalaleu
115120125
leualahisgluleuserglyasnmetalavalalaserileserser
130135140
ileleupheservalvalproalahisleumetargsermetalagly
145150155160
glupheaspasnglucysilealavalalaalametleuleuthrphe
165170175
tyrcystrpvalargserleuargthrargsersertrpproilegly
180185190
valleuthrglyvalalatyrglytyrmetvalalaalatrpglygly
195200205
tyrilephevalleuasnmetvalalamethisalaglyileserser
210215220
metvalasptrpalaargasnthrtyrasnproserleuleuargala
225230235240
tyrthrleuphetyrvalvalglythralailealavalcysvalpro
245250255
provalglymetserprophelysserleugluglnleuglyalaleu
260265270
leuvalleuleupheilepheglyglnservalcysglualaglnarg
275280285
argargleugluilealaargpheserlysgluglyvalalaleuleu
290295300
ileargiletyralaalaphephevalglyilevalalavalalathr
305310315320
ilealaproalaglyphephelysproleuserleuglnalaserala
325330335
ileilethrglyvalserargthrglyasnthrleuvalaspthrleu
340345350
ilealaglnaspalaserasnleuleuilevaltrpglnleupheleu
355360365
pheprovalpheglytrpvalalaglymetseralapheleuthrglu
370375380
leuvalargasntyrthrtyrthrlysserphemetleumettyrgly
385390395400
valvalglyleutyrphealaserglnservalargmetmetvalmet
405410415
metalaprovalalacysilephethralaleuleupheargtrpala
420425430
leuasptyrleuleuglyserleuphetrpalaglumetproprocys
435440445
pheaspthraspalaglnargglyargglnglnglnthralagluglu
450455460
alaglualagluthrlysarglysglugluglutyrasnthrmetgln
465470475480
vallyslysmetthrthrargmetleuprophemetpheleuleuleu
485490495
leupheargleuserglypheilegluaspvalalaalaileserarg
500505510
glumetglualaproglyilevalpheproserglyglnvalglngly
515520525
valserglulyslysvalaspasptyrtyralaglytyrleutyrleu
530535540
argaspasnthrprogluaspalaargileleualatrptrpasptyr
545550555560
glytyrglnilethrglyileglyasnargthrserleualaaspgly
565570575
asnthrtrpasnhisgluhisilealathrileglylysmetleuthr
580585590
serprovalalaglualahisserleuvalarghismetalaasptyr
595600605
valleuilephealaglyaspthrtyrpheseraspleuasnargser
610615620
prohismetalaargileglyasnservaltyrargaspilecyspro
625630635640
hisaspproleucysserargphevalleuglnlysargprolysala
645650655
alaalaalalysargserarghisvalservalaspgluleugluglu
660665670
gluaspasnalagluhisvalvaltyrgluproserserleumetala
675680685
lysserleuiletyrhisleuhisseralaglyvalvalthrglyval
690695700
thrleuasngluthrleupheglnhisvalphethrseralaglngly
705710715720
leuileargilephelysvalmetasnvalserglugluserlyslys
725730735
trpvalalaaspproalaasnargvalcyshisproproglysertrp
740745750
ilecysproglyglntyrproproalalysgluileglnglumetleu
755760765
alahisglnhisthrasnphelysaspleuleuaspalametasnasp
770775780
leugluarggluglnalaleuasnlysglu
785790
<210>22
<211>794
<212>prt
<213>婴儿利什曼原虫
<400>22
metserserglnthrargserileiletyrsersercysphealaval
151015
alametalailealaleuproilealatyraspmetargvalargser
202530
ileglyvaltyrglytyrleuphehisargseraspprotrppheasn
354045
tyrargalaalaglutyrmetserthrhisglytrpseralaphephe
505560
sertrppheasptyrmetsertrptyrproleuglyargprovalgly
65707580
serthrthrtyrproglyleuglnleuthralavalalailehisarg
859095
alaleualaalaalaglymetprometserleuasnasnvalcysval
100105110
leumetproalatrppheserleuvalserseralametvalalaleu
115120125
leualahisgluleuserglyasnmetalavalalaserileserser
130135140
ileleupheservalileproalahisleumetargsermetalagly
145150155160
glupheaspasnglucysilealavalalaalametleuleuthrphe
165170175
tyrcystrpvalargserleuargthrargsersertrpproilegly
180185190
valleuthrglyvalalatyrglytyrmetvalalaalatrpglygly
195200205
tyrilephevalleuasnmetvalalamethisalaglyileserser
210215220
metvalasptrpalaargasnthrtyrasnproserleuleuargala
225230235240
tyrthrleuphetyrvalvalglythralailealavalcysvalpro
245250255
provalglymetserprophelysserleugluglnleuglyalaleu
260265270
leuvalleuleupheilepheglyglnservalcysglualaglnarg
275280285
argargleugluilealaargpheserlysgluglyvalalaleuleu
290295300
ileargiletyralaalaphephevalglyilevalalavalalathr
305310315320
ilealaproalaglyphephelysproleuserleuglnalaserala
325330335
ileilethrglyvalserargthrglyasnthrleuvalaspthrleu
340345350
ilealaglnaspalaserasnleuleuilevaltrpglnleupheleu
355360365
pheprovalpheglytrpvalalaglymetseralapheleuthrglu
370375380
leuvalargasntyrthrtyrthrlysserphemetleumettyrgly
385390395400
valvalglyleutyrphealaserglnservalargmetmetvalmet
405410415
metalaprovalalacysilephethralaleuleupheargtrpala
420425430
leuasptyrleuleuglyserleuphetrpalaglumetproprocys
435440445
pheaspthraspalaglnargglyargglnglnglnthralagluglu
450455460
alaglualagluthrlysarglysglugluglutyrasnthrmetgln
465470475480
vallyslysmetthrthrargmetleuprophemetpheleuleuleu
485490495
leupheargleuserglypheilegluaspvalalaalaileserarg
500505510
glumetglualaproglyilevalpheproserglyglnvalglngly
515520525
valserglulyslysvalaspasptyrtyrserglytyrleutyrleu
530535540
argaspasnthrprogluaspalaargileleualatrptrpasptyr
545550555560
glytyrglnilethrglyileglyasnargthrserleualaaspgly
565570575
asnthrtrpasnhisgluhisilealathrileglylysmetleuthr
580585590
serprovalalaglualahisserleuvalarghismetalaasptyr
595600605
valleuilephealaglyaspthrtyrpheseraspleuasnargser
610615620
prohismetalaargileglyasnservaltyrargaspilecyspro
625630635640
hisaspproleucysserargphevalleuglnlysargprolysala
645650655
alaalaalalysargserarghisvalservalaspgluleugluglu
660665670
gluaspasnalagluhisvalvaltyrgluproserserleumetala
675680685
lysserleuiletyrhisleuhisseralaglyvalvallysglyval
690695700
thrleuasngluthrleupheglnhisvalphethrseralaglngly
705710715720
leuileargilephelysvalmetasnvalserglugluserlyslys
725730735
trpvalalaaspproalaasnargvalcyshisproproglysertrp
740745750
ilecysproglyglntyrproproalalysgluileglnglumetleu
755760765
alahisglnhisthrasnphelysaspleuleuaspalametasnasp
770775780
leugluarggluglnalaleuasnlysglu
785790
<210>23
<211>794
<212>prt
<213>墨西哥利什曼原虫
<400>23
metserserglnthrargserleuiletyrsersercysphealaval
151015
valmetalaileglyleuserilealatyraspmetargvalargser
202530
ileglyvaltyrglytyrleuphehisserseraspprotrppheasn
354045
tyrargalaalaglutyrmetserthrhisglytrpseralaphephe
505560
sertrppheasptyrmetsertrptyrproleuglyargprovalgly
65707580
serthrthrtyrproglyleuglnphethralavalalailehisarg
859095
alaleualaalaalaglymetprometserleuasnaspvalcysval
100105110
leuileproalatrppheserleuleuserseralametvalalaleu
115120125
leualahisgluileserglyasnmetalavalalaservalserser
130135140
ileleupheservalvalproalahisleumetargsermetalagly
145150155160
glupheaspasnglucysilealavalthralametleuleuthrphe
165170175
tyrcystrpvalargserleuargthrargsersertrpproilegly
180185190
valleuthrglyvalalatyrglytyrmetvalalaalatrpglygly
195200205
tyrilephevalleuasnmetvalalamethisalaglyileserser
210215220
metvalasptrpalaargasnthrtyrasnproserleuleuargala
225230235240
tyrthrleuphetyrvalvalglythralailealavalcysvalpro
245250255
provalglymetserprophelysserleugluglnleuglyalaleu
260265270
leuvalleuleupheilepheglyglnalaleucysglualaglnarg
275280285
serargleuglyilegluargpheserlysgluglyvalalaleuleu
290295300
ileargiletyralaalaphephevalglyilevalalavalalaala
305310315320
valalaproalaglyphephelysproleuserleuglnalathrala
325330335
ileilealaglyvalserargthrglyasnthrleuvalaspileleu
340345350
ilealaglnaspalaserasnleuleuilevaltrpglnleupheleu
355360365
pheproleuleuglytrpvalvalglymetserleupheleuthrglu
370375380
leuvalargasnphethrtyralalysserpheileleumettyrgly
385390395400
valvalglyiletyrphealaserglnservalargmetmetvalmet
405410415
metalaprovalalacysilephethralaleuleupheargtrpthr
420425430
leuasptyrleuleuglyserphephetrpalaglumetproleuser
435440445
leuaspthraspalaglnargglyargglnglnglnthralagluglu
450455460
alaglualagluthrlysarglysglugluglutyrasnthrmetgln
465470475480
vallyslysmetthrvalargmetvalprophemetileleuleuleu
485490495
leupheargleuserglypheilegluaspvalalaalaileserarg
500505510
glumetgluserproglyileilepheproargglyglnvalglngly
515520525
metprogluasplysvalaspasptyrtyralaglytyrleutyrleu
530535540
arggluasnthrprogluaspalaargileleualatrptrpasptyr
545550555560
glytyrglnilethrglyileglyasnargthrserleualaaspgly
565570575
asnthrtrpasnhisgluhisilealathrileglylysmetleuthr
580585590
serprovalalaglualahisserleuvalarghismetalaasptyr
595600605
valleuilepheserglyasplystyrpheseraspleuasnargser
610615620
prometmetalaargileglyasnservaltyrargaspilecyspro
625630635640
asnaspproleucysserglnphevalleuglnlysargarglysval
645650655
alaalaalalysargserarghisvalthrvalasngluglngluglu
660665670
aspaspasnprogluservalvaltyrgluproserserleumetala
675680685
lysserleuiletyrhisleuhisserthrglyvalvalgluglyval
690695700
metleuaspgluthrleupheglnasnvalphethrserthrglngly
705710715720
phemetargilephelysvalmetasnvalseralagluserlyslys
725730735
trpvalalaaspproalaasnargvalcysargproproglysertrp
740745750
ilecysproglyglntyrproproalalysgluileglnglumetleu
755760765
alahisglnasnthrasnphelysaspleuleuaspalametasnasp
770775780
leugluglnalaglnalaleuasnlysval
785790
<210>24
<211>823
<212>prt
<213>巴西利什曼原虫
<400>24
metvalthrgluargglyalaalathrproserthralaalasergly
151015
glualaprosergluthrleuleuleuglyglutyrlysvalserleu
202530
hisalaargserthriletyrthralacysphealavalprometala
354045
ileleupheproilealatyrlysmetargvalargserileaspval
505560
tyrglytyrleuphehisargasnaspprotrppheasntyrargala
65707580
alaglutyrmetseralahisglytrpseralaphephesertrpphe
859095
asptyrmetsertrptyrproleuglyargprovalglythrthrthr
100105110
tyrproglyleuglnleuthralavalalailehisargalaleuala
115120125
alaalaglyvalprometserleuasnasnvalcysvalleuilepro
130135140
alatrppheserleuvalserseralametvalalaleuleualahis
145150155160
glumetthrglyasnmetalathrserserileserserileleuphe
165170175
servalvalproalahisleumetargsermetalaglyglupheasp
180185190
asnglucysilealavalalaalametleuleuthrphetyrleutrp
195200205
valargserleuargthrargcyssertrpproileglyileleuthr
210215220
glyilealatyrglytyrmetvalalaalatrpglyglytyrilephe
225230235240
valleuasnmetvalalamethisalaglyilesersermetvalasp
245250255
trpalaargasnthrtyrasnproserleuleuargalatyralaleu
260265270
phetyrvalvalglythralailealathrargvalproprovalgly
275280285
metserpropheargserleugluglnleuglyalaleuvalvalleu
290295300
leupheleucysglyleuglnalacysgluthrglnargserargleu
305310315320
glyvalgluargpheserthrgluglyvalserleuleuvalargile
325330335
tyralaalaphephevalglyilevalalavalvalalametalapro
340345350
alaglyphephelysproleuserleuglnalahisalametileala
355360365
glyalaglnprothrglyasnthrleuvalaspmetleuilealalys
370375380
aspalaserserleuleuvalalatrpgluleuleuleupheprophe
385390395400
pheglytrpmetvalglymetglyalapheleuthrgluleuvalgln
405410415
serphethrtyrthrlysserphemetleumettyrglyalavalgly
420425430
mettyrphealaserglnservalargmetmetvalmetmetalapro
435440445
valalacysilephethralaleuleuphecysleualaleuasptyr
450455460
alaleuglyalaleuphetrpalagluileproproserileaspser
465470475480
aspalaglnglngluleuhisglnglnthralaglualaalalysthr
485490495
lyslysarglysglngluglutyrthrthrmetglnvallysmetile
500505510
servalargmetmetproleumetleuleuvalleuleupheargphe
515520525
serglypheilegluaspvalalaalaileserarggluilegluval
530535540
proglyilevalpheproglysermetvalglnglyleuseraspasp
545550555560
metileaspasptyrtyralaglytyrleutyrleuargaspasnthr
565570575
proalaaspalaargvalleusertrptrpasptyrglytyrglnile
580585590
thrglyileglyasnargthrserleualaaspglyasnthrtrpasn
595600605
hisgluhisilealathrileglylysmetleuthrserprovalala
610615620
glualahisserleuvalarghismetalaasptyrvalleuilephe
625630635640
alaglyaspmethispheseraspleuileasnserprometmetala
645650655
argileglyasnservaltyrhisaspilecysproasnaspproleu
660665670
cysserargphevalpheglnglulysarglysilealaproalaarg
675680685
serglyarghisileasnleualalysleuglyaspaspglugluglu
690695700
thrglnasnvalglutyrgluproserproleumetalalysserleu
705710715720
iletyrhisleuhisseralaglyvallysgluglyvalthrleuasn
725730735
asplysleupheglnhisvaltyrthrseralahisglyleumetarg
740745750
ilephelysvalmetasnvalseralagluserlyslystrpvalala
755760765
aspproalaasnargvalcyshisproproglysertrpilecyspro
770775780
glyglntyrproproalalysgluileglnglumetleualahisarg
785790795800
tyrthrserleulysaspleuvalaspsermetseraspsergluarg
805810815
gluglythrleuasnglyglu
820
<210>25
<211>795
<212>prt
<213>人工的
<220>
<223>利什曼原虫属stt3共有序列
<220>
<221>misc_feature
<222>(1)..(6)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(9)..(9)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(12)..(13)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(21)..(23)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(27)..(27)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(34)..(34)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(42)..(43)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(57)..(57)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(81)..(81)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(89)..(89)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(103)..(103)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(109)..(109)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(114)..(114)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(121)..(121)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(126)..(126)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(133)..(134)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(139)..(140)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(142)..(142)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(150)..(150)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(170)..(170)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(178)..(178)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(187)..(187)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(193)..(193)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(197)..(197)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(203)..(203)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(242)..(242)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(253)..(254)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(264)..(264)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(273)..(273)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(276)..(276)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(278)..(279)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(281)..(283)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(286)..(286)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(289)..(289)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(292)..(294)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(296)..(296)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(298)..(298)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(302)..(302)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(305)..(305)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(308)..(308)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(319)..(321)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(335)..(335)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(337)..(337)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(339)..(339)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(341)..(343)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(351)..(351)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(353)..(353)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(355)..(355)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(359)..(359)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(362)..(363)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(365)..(365)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(367)..(367)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(371)..(372)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(375)..(376)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(379)..(380)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(383)..(383)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(386)..(389)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(392)..(392)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(396)..(396)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(401)..(401)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(404)..(404)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(430)..(432)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(436)..(436)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(439)..(440)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(445)..(445)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(447)..(449)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(451)..(451)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(455)..(458)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(464)..(469)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(473)..(473)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(477)..(477)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(483)..(486)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(489)..(489)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(491)..(491)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(493)..(493)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(495)..(495)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(500)..(500)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(513)..(514)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(516)..(516)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(520)..(520)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(523)..(525)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(529)..(534)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(539)..(539)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(546)..(547)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(550)..(550)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(554)..(554)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(556)..(556)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(612)..(613)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(616)..(617)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(622)..(623)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(626)..(626)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(636)..(636)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(641)..(641)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(647)..(647)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(650)..(650)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(652)..(654)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(656)..(656)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(658)..(658)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(660)..(662)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(665)..(681)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(686)..(686)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(688)..(688)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(699)..(699)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(702)..(703)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(706)..(706)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(708)..(710)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(714)..(714)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(716)..(716)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(719)..(720)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(722)..(723)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(733)..(733)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(742)..(742)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(748)..(748)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(772)..(773)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(775)..(776)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(780)..(780)
<223>xaa可以是任意天然存在的氨基酸
<220>
<221>misc_feature
<222>(782)..(795)
<223>xaa可以是任意天然存在的氨基酸
<400>25
xaaxaaxaaxaaxaaxaaserthrxaatyrthrxaaxaaphealaval
151015
prometalailexaaxaaxaailealatyrxaametargvalargser
202530
ilexaavaltyrglytyrleuphehisxaaxaaaspprotrppheasn
354045
tyrargalaalaglutyrmetserxaahisglytrpseralaphephe
505560
sertrppheasptyrmetsertrptyrproleuglyargprovalgly
65707580
xaathrthrtyrproglyleuglnxaathralavalalailehisarg
859095
alaleualaalaalaglyxaaprometserleuasnxaavalcysval
100105110
leuxaaproalatrppheserleuxaaserseralametxaaalaleu
115120125
leualahisgluxaaxaaglyasnmetalaxaaxaaserxaaserser
130135140
ileleupheservalxaaproalahisleumetargsermetalagly
145150155160
glupheaspasnglucysilealavalxaaalametleuleuthrphe
165170175
tyrxaatrpvalargserleuargthrargxaasertrpproilegly
180185190
xaaleuthrglyxaaalatyrglytyrmetxaaalaalatrpglygly
195200205
tyrilephevalleuasnmetvalalamethisalaglyileserser
210215220
metvalasptrpalaargasnthrtyrasnproserleuleuargala
225230235240
tyrxaaleuphetyrvalvalglythralailealaxaaxaavalpro
245250255
provalglymetserprophexaaargserleugluglnleuglyala
260265270
xaavalvalxaaleuxaaxaacysxaaxaaxaaalacysxaathrgln
275280285
xaaserargxaaxaaxaagluxaaphexaathrgluglyxaaserleu
290295300
xaaargilexaaalaalaphephevalglyilevalalavalxaaxaa
305310315320
xaaalaproalaglyphephelysproleuserleuglnalaxaaala
325330335
xaailexaaglyxaaxaaxaathrglyasnthrleuvalaspxaaleu
340345350
xaaalaxaaaspalaserxaaleuleuxaaxaatrpxaaleuxaaleu
355360365
pheproxaaxaaglytrpxaaxaaglymetxaaxaapheleuxaaglu
370375380
leuxaaxaaxaaxaathrtyrxaalysserphexaaleumettyrgly
385390395400
xaavalglyxaatyrphealaserglnservalargmetmetvalmet
405410415
metalaprovalalacysilephethralaleuleuphexaaxaaxaa
420425430
leuasptyrxaaleuglyxaaxaaphetrpalagluxaaproxaaxaa
435440445
xaaaspxaaaspalaglnxaaxaaxaaxaaglnglnthralagluxaa
450455460
xaaxaaxaaxaaxaalysarglysxaagluglutyrxaathrmetgln
465470475480
vallysxaaxaaxaaxaaargmetxaaproxaametxaaleuxaaleu
485490495
leupheargxaaserglypheilegluaspvalalaalaileserarg
500505510
xaaxaagluxaaproglyilexaapheproxaaxaaxaavalglngly
515520525
xaaxaaxaaxaaxaaxaaaspasptyrtyrxaaglytyrleutyrleu
530535540
argxaaxaathrproxaaaspalaargxaaleuxaatrptrpasptyr
545550555560
glytyrglnilethrglyileglyasnargthrserleualaaspgly
565570575
asnthrtrpasnhisgluhisilealathrileglylysmetleuthr
580585590
serprovalalaglualahisserleuvalarghismetalaasptyr
595600605
valleuilexaaxaaglyaspxaaxaapheseraspleuxaaxaaser
610615620
proxaametalaargileglyasnservaltyrxaaaspilecyspro
625630635640
xaaaspproleucysserxaaphevalxaaglnxaaxaaxaalysxaa
645650655
alaxaaalaxaaxaaxaaarghisxaaxaaxaaxaaxaaxaaxaaxaa
660665670
xaaxaaxaaxaaxaaxaaxaaxaaxaatyrgluproserxaaleuxaa
675680685
alalysserleuiletyrhisleuhisserxaaglyvalxaaxaagly
690695700
valxaaleuxaaxaaxaaleupheglnxaavalxaathrserxaaxaa
705710715720
glyxaaxaaargilephelysvalmetasnvalserxaagluserlys
725730735
lystrpvalalaaspxaaalaasnargvalcysxaaproproglyser
740745750
trpilecysproglyglntyrproproalalysgluileglnglumet
755760765
leualahisxaaxaathrxaaxaalysaspleuxaaaspxaaxaaxaa
770775780
xaaxaaxaaxaaxaaxaaxaaxaaxaaxaaxaa
785790795
<210>26
<211>718
<212>prt
<213>酿酒酵母
<400>26
metglyseraspargsercysvalleuservalpheglnthrileleu
151015
lysleuvalilephevalalailepheglyalaalaileserserarg
202530
leuphealavalilelysphegluserileilehisglupheasppro
354045
trppheasntyrargalathrlystyrleuvalasnasnserphetyr
505560
lyspheleuasntrppheaspaspargthrtrptyrproleuglyarg
65707580
valthrglyglythrleutyrproglyleumetthrthrseralaphe
859095
iletrphisalaleuargasntrpleuglyleuproileaspilearg
100105110
asnvalcysvalleuphealaproleupheserglyvalthralatrp
115120125
alathrtyrgluphethrlysgluilelysaspalaseralaglyleu
130135140
leualaalaglypheilealailevalproglytyrileserargser
145150155160
valalaglysertyraspasnglualailealailethrleuleumet
165170175
valthrphemetphetrpilelysalaglnlysthrglyserilemet
180185190
hisalathrcysalaalaleuphetyrphetyrmetvalseralatrp
195200205
glyglytyrvalpheilethrasnleuileproleuhisvalpheleu
210215220
leuileleumetglyargtyrserserlysleutyrseralatyrthr
225230235240
thrtrptyralaileglythrvalalasermetglnilepropheval
245250255
glypheleuproileargserasnasphismetalaalaleuglyval
260265270
pheglyleuileglnilevalalapheglyaspphevallysglygln
275280285
ileserthralalysphelysvalilemetmetvalserleupheleu
290295300
ileleuvalleuglyvalvalglyleuseralaleuthrtyrmetgly
305310315320
leuilealaprotrpthrglyargphetyrserleutrpaspthrasn
325330335
tyralalysilehisileproileilealaservalsergluhisgln
340345350
provalsertrpproalaphephepheaspthrhispheleuiletrp
355360365
leupheproalaglyvalpheleuleupheleuaspleulysaspglu
370375380
hisvalphevalilealatyrservalleucyssertyrphealagly
385390395400
valmetvalargleumetleuthrleuthrprovalilecysvalser
405410415
alaalavalalaleuserlysilepheaspiletyrleuaspphelys
420425430
thrserasparglystyralailelysproalaalaleuleualalys
435440445
leuilevalserglyserpheilephetyrleutyrleuphevalphe
450455460
hisserthrtrpvalthrargthralatyrserserproservalval
465470475480
leuproserglnthrproaspglylysleualaleuileaspaspphe
485490495
argglualatyrtyrtrpleuargmetasnseraspgluaspserlys
500505510
valalaalatrptrpasptyrglytyrglnileglyglymetalaasp
515520525
argthrthrleuvalaspasnasnthrtrpasnasnthrhisileala
530535540
ilevalglylysalametalaserprogluglulyssertyrgluile
545550555560
leulysgluhisaspvalasptyrvalleuvalilepheglyglyleu
565570575
ileglypheglyglyaspaspileasnlyspheleutrpmetilearg
580585590
ilesergluglyiletrpproglugluilelysgluargtyrphetyr
595600605
thralagluglyglutyrargvalaspalaargalasergluthrmet
610615620
argasnserleuleutyrlysmetsertyrlysasppheproglnleu
625630635640
pheasnglyglyglnalathraspargvalargglnglnmetilethr
645650655
proleuaspvalproproleuasptyrpheaspgluvalphethrser
660665670
gluasntrpmetvalargiletyrglnleulyslysaspaspalagln
675680685
glyargthrleuargaspvalglygluleuthrargserserthrlys
690695700
thrargargserilelysargprogluleuglyleuargval
705710715
<210>27
<211>2157
<212>dna
<213>酿酒酵母
<400>27
atgggatccgaccggtcgtgtgttttgtctgtgtttcagaccatcctcaagctcgtcatc60
ttcgtggcgatttttggggctgccatatcatcacgtttgtttgcagtcatcaaatttgag120
tctattatccatgaattcgacccctggttcaattatagggctaccaaatatctcgtcaac180
aattcgttttacaagtttttgaactggtttgacgaccgtacctggtaccccctcggaagg240
gttactggagggactttatatcctggtttgatgacgactagtgcgttcatctggcacgcc300
ctgcgcaactggttgggcttgcccattgacatcagaaacgtttgtgtgctatttgcgcca360
ctattttctggggtcaccgcctgggcgacttacgaatttacgaaagagattaaagatgcc420
agcgctgggcttttggctgctggttttatagccattgtccccggttatatatctagatca480
gtggcggggtcctacgataatgaggccattgccattacactattaatggtcactttcatg540
ttttggattaaggcccaaaagactggctctatcatgcacgcaacgtgtgcagctttattc600
tacttctacatggtgtcggcttggggtggatacgtgttcatcaccaacttgatcccactc660
catgtctttttgctgattttgatgggcagatattcgtccaaactgtattctgcctacacc720
acttggtacgctattggaactgttgcatccatgcagatcccatttgtcggtttcctacct780
atcaggtctaacgaccacatggccgcattgggtgttttcggtttgattcagattgtcgcc840
ttcggtgacttcgtgaagggccaaatcagcacagctaagtttaaagtcatcatgatggtt900
tctctgtttttgatcttggtccttggtgtggtcggactttctgccttgacctatatgggg960
ttgattgccccttggactggtagattttattcgttatgggataccaactacgcaaagatc1020
cacattcctatcattgcctccgtttccgaacatcaacccgtttcgtggcccgctttcttc1080
tttgatacccactttttgatctggctattccccgccggtgtattcctactattcctcgac1140
ttgaaagacgagcacgtttttgtcatcgcttactccgttctgtgttcgtactttgccggt1200
gttatggttagattgatgttgactttgacaccagtcatctgtgtgtccgccgccgtcgca1260
ttgtccaagatatttgacatctacctggatttcaagacaagtgaccgcaaatacgccatc1320
aaacctgcggcactactggccaaattgattgtttccggatcattcatcttttatttgtat1380
cttttcgtcttccattctacttgggtaacaagaactgcatactcttctccttctgttgtt1440
ttgccatcacaaaccccagatggtaaattggcgttgatcgacgacttcagggaagcgtac1500
tattggttaagaatgaactctgatgaggacagtaaggttgcagcgtggtgggattacggt1560
taccaaattggtggcatggcagacagaaccactttagtcgataacaacacgtggaacaat1620
actcacatcgccatcgttggtaaagccatggcttcccctgaagagaaatcttacgaaatt1680
ctaaaagagcatgatgtcgattatgtcttggtcatctttggtggtctaattgggtttggt1740
ggtgatgacatcaacaaattcttgtggatgatcagaattagcgagggaatctggccagaa1800
gagataaaagagcgttatttctataccgcagagggagaatacagagtagatgcaagggct1860
tctgagaccatgaggaactcgctactttacaagatgtcctacaaagatttcccacaatta1920
ttcaatggtggccaagccactgacagagtgcgtcaacaaatgatcacaccattagacgtc1980
ccaccattagactacttcgacgaagtttttacttccgaaaactggatggttagaatatat2040
caattgaagaaggatgatgcccaaggtagaactttgagggacgttggtgagttaaccagg2100
tcttctacgaaaaccagaaggtccataaagagacctgaattaggcttgagagtctaa2157
<210>28
<211>749
<212>prt
<213>粟酒裂殖酵母
<400>28
metalaasnseralathrilethrserlyslysglyvallysserhis
151015
glnlysasptrplysileproleulysvalleuileleuilecysile
202530
alavalalaservalserserargleupheservalileargtyrglu
354045
serileilehisglupheaspprotrppheasnpheargalaserlys
505560
ileleuvalgluglnglyphetyrasnpheleuasntrppheaspglu
65707580
argsertrptyrproleuglyargvalalaglyglythrleutyrpro
859095
glyleumetvalthrserglyileilephelysvalleuhisleuleu
100105110
argileasnvalasnileargaspvalcysvalleuleualaproala
115120125
pheserglyilethralailealathrtyrtyrleualaarggluleu
130135140
lysseraspalacysglyleuleualaalaalaphemetglyileala
145150155160
proglytyrthrserargservalalaglysertyraspasngluala
165170175
ilealailethrleuleumetserthrphealaleutrpilelysala
180185190
vallysserglyserserphetrpglyalacysthrglyleuleutyr
195200205
phetyrmetvalthralatrpglyglytyrvalpheilethrasnmet
210215220
ileproleuhisvalphevalleuleuleumetglyargtyrthrser
225230235240
lysleutyrilealatyrthrthrtyrtyrvalileglythrleuala
245250255
sermetglnvalprophevalglypheglnprovalserthrserglu
260265270
hismetseralaleuglyvalpheglyleuleuglnleuphealaphe
275280285
tyrasntyrvallysglyleuvalserserlysglnpheglnileleu
290295300
ileargphealaleuvalcysleuvalglyleualathrvalvalleu
305310315320
phealaleuserserthrglyvalilealaprotrpthrglyargphe
325330335
tyrserleutrpaspthrasntyralalysilehisileproileile
340345350
alaservalsergluhisglnproprothrtrpserserleuphephe
355360365
aspleuglnpheleuiletrpleuleuprovalglyvaltyrleucys
370375380
phelysgluleuargasngluhisvalpheileileiletyrproval
385390395400
leuglythrtyrphecysglyvalmetvalargleuvalleuthrleu
405410415
thrprocysvalcysilealaalaalavalalaileserthrleuleu
420425430
aspthrtyrmetglyprogluvalglugluasplysvalsergluglu
435440445
alaalaseralalysserlysasnlyslysglyileserserileleu
450455460
serphephethrserglyserlysasnileglyiletyrserleuleu
465470475480
serargvalleuvalileserserthralatyrpheleuilemetphe
485490495
valtyrhissersertrpvalthrserasnalatyrserserprothr
500505510
valvalleuserthrvalleuasnaspglyserleumettyrileasp
515520525
asppheargglualatyrasptrpleuargargasnthrprotyrasp
530535540
thrlysvalmetsertrptrpasptyrglytyrglnilealaglymet
545550555560
alaaspargilethrleuvalaspasnasnthrtrpasnasnthrhis
565570575
ilealathrvalglylysalametserserprogluglulysalatyr
580585590
proileleuarglyshisaspvalasptyrileleuileiletyrgly
595600605
glythrleuglytyrserseraspaspmetasnlyspheleutrpmet
610615620
ileargileserglnglyleutrpproaspgluilevalgluargasn
625630635640
phephethrproasnglyglutyrargthraspaspalaalathrpro
645650655
thrmetarggluserleuleutyrlysmetsertyrhisglyalatrp
660665670
lysleupheproproasnglnglytyraspargalaargasnglnlys
675680685
leuproserlysaspproglnleuphethrilegluglualaphethr
690695700
thrvalhishisleuvalargleutyrlysvallyslysproaspthr
705710715720
leuglyargaspleulysglnvalthrleupheglugluglylysarg
725730735
lyslysseralavalleuglnlysleuthrlyspheleu
740745
<210>29
<211>2250
<212>dna
<213>粟酒裂殖酵母
<400>29
atggctaattctgctacaattacgagtaaaaaaggcgtgaagtctcatcagaaggactgg60
aaaattccacttaaagtgctcattcttatatgtattgctgtggcttctgtctcttcgagg120
cttttttctgtcattcgttacgagtccattattcatgaatttgatccttggttcaatttc180
cgagcttccaaaatattggtggaacaaggtttttataactttttaaattggtttgatgaa240
agaagttggtacccgttgggtcgtgtagcgggtggtactttgtacccaggacttatggtc300
acgtctggtattattttcaaagttttacatcttttaagaattaacgtgaacatccgtgat360
gtatgtgttttacttgcccctgctttctctggaatcactgcgattgctacctattatctg420
gctagagaattgaaaagtgatgcatgtggccttttagctgccgcatttatgggtattgct480
cctggatacacctcccgttccgtcgctggttcttacgataatgaagcaattgctattacc540
cttttgatgtcaacgtttgctttgtggatcaaggcagtgaagtctggctcctctttctgg600
ggtgcctgcacaggattgctctacttctatatggtaactgcgtggggtggttatgtattc660
atcacaaacatgatacctttacacgtatttgttcttctacttatgggtcgctatactagc720
aaattatacattgcttacacaacatactatgttattggaacgctggcttctatgcaagtt780
ccgtttgttggtttccaacccgtgtcgactagtgagcatatgtccgctttaggagtgttt840
ggcctgttacagctttttgcattctacaattatgttaaaggtctagtttcatccaagcaa900
ttccaaatacttattcgttttgccttggtttgcttagtgggtctagcaacagtcgtcctt960
tttgctttatcttcaacaggtgttatcgctccttggacaggacgtttctattctctttgg1020
gatacaaactacgccaagattcatattcctatcattgcttcggtatcagaacatcagcct1080
cctacttggagttcgttgttctttgatcttcaatttttgatttggttattgccagttggt1140
gtttacttgtgtttcaaggaacttcgtaatgaacatgtctttattattatatatcctgtc1200
ttaggaacatatttttgtggtgtgatggttcgtttggttttaaccttaactccttgtgtt1260
tgcatagctgctgctgtagcaatttccactcttttagacacatatatgggtcctgaagtt1320
gaagaggacaaagtgagcgaagaagccgcttcagccaaatctaagaacaagaaaggtatt1380
tcctctattcttagtttcttcacttctggctcaaaaaatattggaatttacagtttgctt1440
tccagagtattagtcatttcctctaccgcatatttcctaataatgtttgtttatcattcc1500
agttgggtgacttctaatgcttactcttcccctaccgtggttttgtctaccgtgttaaac1560
gatggtagtttaatgtatattgatgacttccgtgaagcttatgactggcttcgtagaaac1620
actccttatgacacaaaggttatgagttggtgggattatggttaccaaattgctggtatg1680
gctgatcgtattactttagtcgacaacaatacgtggaacaacacacatattgccacagtt1740
ggaaaagccatgtcttcacctgaagaaaaagcttaccctatcctccgtaaacacgatgtt1800
gattatattcttattatatatggtggtactcttggatacagcagcgacgacatgaacaag1860
ttcctttggatgatccgaatttctcagggattatggcccgatgaaatagtagagcgtaac1920
ttttttactcctaatggagaatatcgaactgacgatgcggctactcccactatgcgtgag1980
tctttattatataagatgtcatatcacggtgcttggaaacttttccctcccaatcaagga2040
tatgaccgtgctcgcaatcaaaaactaccatcgaaagatcctcaactatttactatcgaa2100
gaagcattcactaccgttcatcatttagttcgtttgtataaggttaagaaaccggataca2160
cttggacgcgatttgaaacaagtgacattatttgaagaaggcaaaagaaagaagtccgcc2220
gtcctgcaaaaactaacgaaattcctttga2250
<210>30
<211>714
<212>prt
<213>盘基网柄菌
<400>30
metlysargserglulysserserthrservalvalserasnasnlys
151015
glnglnaspvalasnileileserserasngluvalglyvallysglu
202530
gluasnlysglyhisglnglupheleuleulysvalleuileleuser
354045
valiletyrvalleualapheserthrargleupheservalleuarg
505560
tyrgluservalilehisglupheaspprotyrpheasntyrargser
65707580
thriletyrleuvalglngluglyphetyrasnpheleuasntrpphe
859095
aspgluargalatrptyrproleuglyargilevalglyglythrile
100105110
tyrproglyleumetalathralaserleuvalhistrpserleuasn
115120125
serleuasnilethrvalasnileargasnvalcysvalleuleuser
130135140
protrpphealaserasnthralametvalthrtyrlysphealalys
145150155160
gluvallysaspthrglnthrglyleuvalalaalaalametileala
165170175
ilevalproglytyrileserargservalalaglyserpheaspasn
180185190
gluglyilealailephealaleuilephethrtyrtyrcystrpile
195200205
lysservalasnthrglyserleumettrpalaalailecysserleu
210215220
alatyrphetyrmetalaseralatrpglyglytyrvalpheileile
225230235240
asnleuileproleuhisalaphepheleuleuleuthrglyargtyr
245250255
serhisargleutyrilealatyrserthrmetphevalileglythr
260265270
ileleusermetglnilethrpheileserpheglnprovalglnser
275280285
sergluhisleualaalaileglyilepheglyleuleuglnleutyr
290295300
alaglyleusertrpvallysserhisleuthrasnglualaphelys
305310315320
lysleuglnargleuthrvalleuphevalleusercysalaalaala
325330335
valleuvalvalglythrleuthrglytyrileserpropheasngly
340345350
argphetyrserleuleuaspprothrtyralaargasphisilepro
355360365
ileilealaservalsergluhisglnprothrthrtrpalasertyr
370375380
phepheaspleuhisileleuvalpheleupheproalaglyleutyr
385390395400
phecyspheglnlysleuthraspalaasnilepheleuileleutyr
405410415
glyvalthrseriletyrpheserglyvalmetvalargleumetleu
420425430
valleualaprovalalacysileleualaalavalalavalserala
435440445
thrleuthrthrtyrmetlyslysleulysalaproserserproser
450455460
aspalaasnasnserlysgluserglyglyvalmetvalalavalleu
465470475480
thrvalleuleuileleutyralaphehiscysthrtrpvalthrser
485490495
glualatyrserserproserilevalleuseralalysglnasnasp
500505510
glyserargvalilepheaspasppheargglualatyrargtrpile
515520525
glyglnasnthralaaspaspalaargilemetsertrptrpasptyr
530535540
glytyrglnleuseralametalaasnargthrvalleuvalaspasn
545550555560
asnthrtrpasnasnserhisilealaglnvalglylysalapheala
565570575
serthrglugluaspalatyrileglnmetlysalaleuaspvalasp
580585590
tyrvalleuvalilepheglyglyleuthrglytyrserseraspasp
595600605
ileasnlyspheleutrpmetvalargileglyglysercysasppro
610615620
asnilelysgluglnasptyrleuthrasnglyglntyrargileasp
625630635640
lysglyalaserprothrmetleuasnserleumettyrlysleuser
645650655
tyrtyrargphesergluvalhisthrasptyrglnargprothrgly
660665670
pheaspargvalargasnvalgluileglyasnlysasnpheaspleu
675680685
thrtyrleugluglualaphethrservalhistrpleuvalargval
690695700
tyrlysvallysasppheaspasnargala
705710
<210>31
<211>2145
<212>dna
<213>盘基网柄菌
<400>31
atgaaaagatcagaaaaatcaagtacatctgttgttagtaataacaaacaacaagatgta60
aatatcatcagttcaaatgaagttggtgttaaagaagaaaataaaggacatcaagaattc120
ttattaaaagttttaattctatcagtcatttatgttttagcattttcaactcgtttattc180
tcagtattacgttatgaaagtgttattcatgaatttgatccatattttaattatagatca240
acaatatatcttgttcaagaaggtttttataattttttaaattggtttgatgaaagagca300
tggtatccattaggacgtattgtaggtggtacaatttacccaggtttaatggcaacagca360
agtttagttcattggtcattgaattcattgaatattacagttaatattagaaatgtatgt420
gtattgttatcaccatggtttgcatcaaatacagcaatggtaacctataaatttgccaaa480
gaagttaaggatacacaaactggtttggttgcagcagccatgattgcaattgttccaggt540
tatatttcacgttcagtagcaggttcattcgataatgaaggtattgcaatctttgcattg600
attttcacatattattgttggattaagtcagtaaacacaggctcattgatgtgggctgcc660
atctgttcattggcctacttttatatggcaagtgcctggggtggttatgtattcatcatt720
aatttaatcccattgcatgcctttttcttgcttttgacaggccgttattcacatcgtctc780
tacatagcctacagcacaatgtttgtcattggtacaatcctctctatgcaaattacattc840
attagtttccaaccagttcaatcatctgaacatttggctgccattggtatctttggtctc900
ctccaattgtacgctggtttgtcatgggtaaagagtcacctcaccaatgaagccttcaag960
aaacttcaacgtttgacagtgttattcgttttatcttgtgctgctgccgtacttgtcgtt1020
ggtacattaactggttacatctcaccattcaatggtcgtttctattcattgttggatcca1080
acctatgctcgtgaccacattccaatcattgcatcagtatcagagcatcaaccaaccact1140
tgggcatcatactttttcgatctccatatcttggtattccttttcccagccggtttatac1200
ttttgtttccaaaaattaaccgatgctaatattttcctcattctctacggtgtcacctcc1260
atttatttctctggtgtaatggtacgtcttatgttggttttagcaccagttgcatgtatt1320
ttagccgccgttgccgtcagtgcaaccctcaccacctatatgaagaagttaaaggctcca1380
tcatcaccaagtgatgctaataattccaaagagagtggtggtgttatggttgcagtctta1440
actgttcttttaattctctacgctttccattgtacttgggtcactagtgaagcctactca1500
tctccatccattgtactctctgccaaacaaaacgatggtagtcgtgtgattttcgatgat1560
ttccgtgaagcctaccgttggattggtcaaaatactgccgacgacgctcgtattatgtct1620
tggtgggattatggttatcaattatctgcaatggccaatcgtaccgtattggttgataat1680
aacacttggaacaatagtcatatcgctcaagttggtaaagcatttgcatccactgaagaa1740
gatgcttacatacaaatgaaagcattggatgtcgattatgttttagttatttttggtggt1800
ttaactggttacagttctgatgatatcaataaattcctttggatggttagaattggtggt1860
agttgtgatccaaatattaaagaacaagattatctcaccaatggtcaatatagaatagat1920
aaaggtgcctcaccaacaatgttaaattctctcatgtacaaacttagttactatcgtttc1980
tctgaagttcacactgactatcaaagaccaacaggtttcgatcgtgtaagaaatgttgaa2040
attggtaataaaaatttcgatttaacttatttagaagaagctttcacatctgttcattgg2100
ttagttagagtttataaagttaaagattttgataatagagcttaa2145
<210>32
<211>206
<212>prt
<213>铜绿假单胞菌
<400>32
metserleualaserserleugluserleuarglysileaspileasn
151015
aspleuaspleuasnasnileglysertrpproalaalavallysval
202530
ilevalcysvalleuleuthralaalavalleualaleuglytyrasn
354045
phehisleuseraspmetglnalaglnleugluglnglnalaalaglu
505560
glugluthrleulysglnglnpheserthrlysalapheglnalaala
65707580
asnleuglualatyrlysalaglnmetlysglumetglugluserphe
859095
glyalaleuleuargglnleuproseraspthrgluvalproglyleu
100105110
leugluaspilethrargthrglyleuglyserglyleuglupheglu
115120125
gluilelysleuleuprogluvalalaglnglnphetyrilegluleu
130135140
proileglnileservalvalglyglytyrhisaspleualathrval
145150155160
serglyvalserserleuproargilevalthrleuhisasppheglu
165170175
ilelysprovalalaproglyserthrserlysleuargmetserile
180185190
leualalysthrtyrargtyrasnasplysglyleulyslys
195200205
<210>33
<211>624
<212>dna
<213>铜绿假单胞菌
<400>33
atgagtctggccagttccctggaaagtctgcgcaagatcgatatcaacgatctcgacctg60
aacaacatcggttcctggccggcggcggtcaaggtcatcgtctgcgtgctgctgaccgcg120
gcggtcctggcgctgggctacaacttccatctgagtgacatgcaggctcagctcgaacag180
caggccgcggaagaggagacgctcaagcagcagttctccaccaaggccttccaggccgcg240
aacctggaagcctacaaggcacagatgaaggagatggaagagtcctttggcgccttgctg300
cggcagttgcccagcgacaccgaggtacccgggctgctcgaggacatcactcgtaccggc360
ctgggcagcggcctggagttcgaggaaatcaagctgcttcccgaggttgcccagcagttc420
tacatcgagctgccgatccagatcagcgtggtcggcggctaccacgacttggcgaccttc480
gtcagcggcgtgtccagcctgccgcggatcgtcaccctgcatgacttcgagatcaagccg540
gtcgcgcccggcagcacgtccaagctgcgcatgagcatcctggccaagacctatcgctac600
aacgacaaggggctgaagaaatga624
<210>34
<211>604
<212>prt
<213>脑膜炎双球菌
<400>34
metproalagluthrthrvalserglyalahisproalaalalysleu
151015
proiletyrileleuprocyspheleutrpileglyilevalprophe
202530
thrphealaleulysleulysproserproaspphetyrhisaspala
354045
alaalaalaalaglyleuilevalleuleupheleuthralaglylys
505560
lysleupheaspvallysileproalaileserpheleuleupheala
65707580
metalaalaphetrptyrleuglnalaargleumetasnleuiletyr
859095
proglymetasnaspilevalsertrpilepheileleuleualaval
100105110
seralatrpalacysargserleuvalalahispheglyglngluarg
115120125
ilevalthrleuphealatrpserleuleuileglyserleuleugln
130135140
sercysilevalvalileglnphealaglytrpgluaspthrproleu
145150155160
pheglnasnileilevaltyrserglyglnglyvalileglyhisile
165170175
glyglnargasnasnleuglyhistyrleumettrpglyileleuala
180185190
alaalatyrleuasnglyglnarglysileproalaalaleuglyval
195200205
ilecysleuilemetglnthralavalleuglyleuvalasnserarg
210215220
thrileleuthrtyrilealaalailealaleuileleuprophetrp
225230235240
tyrpheargserasplysserasnargargthrmetleuglyileala
245250255
alaalavalpheleuthralaleupheglnphesermetasnthrile
260265270
leugluthrphethrglyileargtyrgluthralavalgluargval
275280285
alaasnglyglyphethraspleuproargglnileglutrpasnlys
290295300
alaleualaalapheglnseralaproilepheglyhisglytrpasn
305310315320
serphealaglnglnthrpheleuileasnalagluglnhisasnile
325330335
tyraspasnleuleuserasnleuphethrhisserhisasnileval
340345350
leuglnleuleualaglumetglyileserglythrleuleuvalala
355360365
alathrleuleuthrglyilealaglyleuleulysargproleuthr
370375380
proalaserleupheleuilecysthrleualavalsermetcyshis
385390395400
sermetleuglutyrproleutrptyrvaltyrpheleuileprophe
405410415
glyleumetleupheleuserproalaglualaseraspglyileala
420425430
phelyslysalaalaasnleuglyileleuthralaseralaalaile
435440445
phealaglyleuleuhisleuasptrpthrtyrthrargleuvalasn
450455460
alapheserproalathraspaspseralalysthrleuasnarglys
465470475480
ileasngluleuargtyrileseralaasnserprometleuserphe
485490495
tyralaasppheserleuvalasnphealaleuproglutyrproglu
500505510
thrglnthrtrpalagluglualathrleulysserleulystyrarg
515520525
prohisseralathrtyrargilealaleutyrleumetargglngly
530535540
lysvalalaglualalysglntrpmetargalathrglnsertyrtyr
545550555560
protyrleumetproargtyralaaspgluilearglysleuproval
565570575
trpalaproleuleuprogluleuleulysaspcyslysalapheala
580585590
alaalaproglyhisproglualalysprocyslys
595600
<210>35
<211>1815
<212>dna
<213>脑膜炎双球菌
<400>35
atgcccgctgaaacgaccgtatccggcgcgcaccccgccgccaaactgccgatttacatc60
ctgccctgcttcctttggataggcatcgtcccctttaccttcgcgctcaaactgaaaccg120
tcgcccgacttttaccacgatgccgccgccgcagccggcctgattgtcctgttgttcctc180
acggcaggaaaaaaactgtttgatgtcaaaatccccgccatcagcttccttctgtttgca240
atggcggcgttttggtatcttcaggcacgcctgatgaacctgatttaccccggtatgaac300
gacatcgtctcttggattttcatcttgctcgccgtcagcgcgtgggcctgccggagcttg360
gtcgcacacttcggacaagaacgcatcgtgaccctgtttgcctggtcgctgcttatcggc420
tccctgcttcaatcctgcatcgtcgtcatccagtttgccggctgggaagacacccctctg480
tttcaaaacatcatcgtttacagcgggcaaggcgtaatcggacacatcgggcagcgcaac540
aacctcggacactacctcatgtggggcatactcgccgccgcctacctcaacggacaacga600
aaaatccccgccgccctcggcgtaatctgcctgattatgcagaccgccgttttaggtttg660
gtcaactcgcgcaccatcttgacctacatagccgccatcgccctcatccttcccttctgg720
tatttccgttcggacaaatccaacaggcggacgatgctcggcatagccgcagccgtattc780
cttaccgcgctgttccaattttccatgaacaccattctggaaacctttactggcatccgc840
tacgaaactgccgtcgaacgcgtcgccaacggcggtttcacagacttgccgcgccaaatc900
gaatggaataaagcccttgccgccttccagtccgccccgatattcgggcacggctggaac960
agttttgcccaacaaaccttcctcatcaatgccgaacagcacaacatatacgacaacctc1020
ctcagcaacttgttcacccattcccacaacatcgtcctccaactccttgcagagatggga1080
atcagcggcacgcttctggttgccgcaaccctgctgacgggcattgccgggctgcttaaa1140
cgccccctgacccccgcatcgcttttcctaatctgcacgcttgccgtcagtatgtgccac1200
agtatgctcgaatatcctttgtggtatgtctatttcctcatccctttcggactgatgctc1260
ttcctgtcccccgcagaggcttcagacggcatcgccttcaaaaaagccgccaatctcggc1320
atactgaccgcctccgccgccatattcgcaggattgctgcacttggactggacatacacc1380
cggctggttaacgccttttcccccgccactgacgacagtgccaaaaccctcaaccggaaa1440
atcaacgagttgcgctatatttccgcaaacagtccgatgctgtccttttatgccgacttc1500
tccctcgtaaacttcgccctgccggaataccccgaaacccagacttgggcggaagaagca1560
accctcaaatcactaaaataccgcccccactccgccacctaccgcatcgccctctacctg1620
atgcggcaaggcaaagttgcagaagcaaaacaatggatgcgggcgacacagtcctattac1680
ccctacctgatgccccgatacgccgacgaaatccgcaaactgcccgtatgggcgccgctg1740
ctacccgaactgctcaaagactgcaaagccttcgccgccgcgcccggtcatccggaagca1800
aaaccctgcaaatga1815