新月弯孢霉来源的甾类物质转运蛋白及其编码基因与应用的制作方法

文档序号:22476281发布日期:2020-10-09 22:16阅读:139来源:国知局
新月弯孢霉来源的甾类物质转运蛋白及其编码基因与应用的制作方法
本发明涉及生物
技术领域
,特别涉及一种新月弯孢霉来源的甾类物质转运蛋白及其编码基因与应用。
背景技术
:在自然界中存在着以胆固醇及其类似物相关衍生物为代表的一大类化合物,该类化合物均以环戊烷多氢菲为母核因携带不同侧链修饰基团而具有不同生理活性。自然界中发现的甾体化合物有接近300种,被广泛熟知的如:胆固醇,植物甾醇,雄烯二酮,氢化可的松等甾体类药物。甾体类药物主要分为:肾上腺皮质激素,蛋白同化激素和性激素三大类。随着甾体药物在疾病治疗和代谢调控等领域取得的成功,甾体药物的市场需求日益壮大,发展势态良好,常年保持稳定增长,雄踞第二大药物市场地位(fernandez-cabezonetal.,2018)。随着市场需求的不断扩大,甾体药物的生物合成得到广泛关注,目前甾体药物的生物合成主要采取半合成技术,以天然甾体作为骨架进行结构改造。但是由于甾体化合物的结构特点,大多数的甾体底物具有溶解性极低的特点,所以目前甾体药物生产的两大瓶颈性问题为:1、底物投药量低;2、催化副产物比例较高(xiong,s.,wang,y.,yao,m.,liu,h.,zhou,x.,xiao,w.,yuan,y.,2017.cellfoundrywithhighproductspecificityandcatalyticactivityfor21-deoxycortisolbiotransformation.microbcellfact.16,105.)。而目前针对底物投药量低做出的研究和探索大多集中在不同有机溶剂的使用,表面活性剂的使用,利用环糊精增强底物溶解性以及超临界体系下的生物转化等(lu,w.-y.,du,l.-x.,wang,m.,wen,j.-p.,sun,b.,guo,y.-w.,2006.effectoftwo-stepssubstrateadditiononsteroids11β-hydroxylationbycurvularialunatacl-114.biochemicalengineeringjournal.32,233-238.lu,w.,du,l.,wang,m.,guo,y.,lu,f.,sun,b.,wen,j.,jia,x.,2007.anovelsubstrateadditionmethodinthe11β-hydroxylationofsteroidsbycurvularialunata.foodandbioproductsprocessing.85,63-72.)。但是不论是有机溶剂的使用还是表面活性剂等方式都会对生物细胞造成不同程度的损伤而影响催化效率。以氢化可的松的生产为例,经过几十年的研究其前体化合物17α-羟基孕甾-4-烯-3,20-二酮-21-醋酸酯(cortexolone-21-acetate,rsa)的投药量最高只能达到7g/l,大大限制了氢化可的松的生物合成。所以高效的底物和产物转运机制是甾体药物生物合成的关键,而从生物细胞自身挖掘,找到高效的转运蛋白也是解决这一问题非常有效的方式。技术实现要素:本发明的目的是提供一种新月弯孢霉来源的甾类物质转运蛋白及其编码基因与应用。第一方面,本发明要求保护蛋白质或成套蛋白质。本发明所要求保护的蛋白质为新月弯孢霉来源的甾类物质转运蛋白,命名为clcdr4蛋白,具体可为如下(a1)-(a4)中任一所示的蛋白质:(a1)氨基酸序列如seqidno.1所示的蛋白质;(a2)将(a1)所限定的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;(a3)与(a1)或(a2)所限定的氨基酸序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质;(a4)在(a1)-(a3)中任一所限定的蛋白质的n端和/或c端连接标签后得到的融合蛋白。本发明所要求保护的成套蛋白质由蛋白质a、蛋白质b、蛋白质c和蛋白质d组成。所述蛋白质a为如上(a1)-(a4)中任一所示的蛋白质(即clcdr4蛋白)。所述蛋白质b为蓝色犁头霉来源的ac-cpr蛋白,具体可为如下(b1)-(b4)中任一所示的蛋白质:(b1)氨基酸序列如seqidno.19所示的蛋白质;(b2)将(b1)所限定的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;(b3)与(b1)或(b2)所限定的氨基酸序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质;(b4)在(b1)-(b3)中任一所限定的蛋白质的n端和/或c端连接标签后得到的融合蛋白。所述蛋白质c为蓝色犁头霉来源的ac-cytb5蛋白,具体可为如下(c1)-(c4)中任一所示的蛋白质:(c1)氨基酸序列如seqidno.20所示的蛋白质;(c2)将(c1)所限定的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;(c3)与(c1)或(c2)所限定的氨基酸序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质;(c4)在(c1)-(c3)中任一所限定的蛋白质的n端和/或c端连接标签后得到的融合蛋白;所述蛋白质d为蓝色犁头霉来源的ac-cyp003蛋白,具体可为如下(d1)-(d4)中任一所示的蛋白质:(d1)氨基酸序列如seqidno.21所示的蛋白质;(d2)将(d1)所限定的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;(d3)与(d1)或(d2)所限定的氨基酸序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质;(d4)在(d1)-(d3)中任一所限定的蛋白质的n端和/或c端连接标签后得到的融合蛋白。第二方面,本发明要求保护核酸分子或成套核酸分子。本发明所要求保护的核酸分子为编码前文第一方面所述蛋白质(即clcdr4蛋白)的核酸分子。本发明所要求保护的成套核酸分子由核酸分子a、核酸分子b、核酸分子c和核酸分子d组成。所述核酸分子a为编码前文第一方面中所述蛋白质a(即clcdr4蛋白)的核酸分子;所述核酸分子b为编码前文第一方面中所述蛋白质b(即ac-cpr蛋白)的核酸分子;所述核酸分子c为编码前文第一方面中所述蛋白质c(即ac-cytb5蛋白)的核酸分子;所述核酸分子d为编码前文第一方面中所述蛋白质d(即ac-cyp003蛋白)的核酸分子。进一步地,所述核酸分子为编码clcdr4蛋白的基因,命名为clcdr4基因,具体可为如下(a1)-(a3)中任一所示的dna分子:(a1)核苷酸序列如seqidno.2的第887-5653位所示的dna分子;(a2)在严格条件下与(a1)限定的dna分子杂交且编码clcdr4蛋白的dna分子;(a3)与(a1)或(a2)所限定的dna序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且编码clcdr4蛋白的dna分子。进一步地,所述核酸分子a为如上(a1)-(a3)中任一所示的dna分子(即clcdr4基因)。进一步地,所述核酸分子b为编码ac-cpr蛋白的基因,命名为ac-cpr基因,具体可为如下(b1)-(b3)中任一所示的dna分子:(b1)核苷酸序列如seqidno.16的第813-2864位所示的dna分子;(b2)在严格条件下与(b1)限定的dna分子杂交且编码ac-cpr蛋白的dna分子;(b3)与(b1)或(b2)所限定的dna序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且编码ac-cpr蛋白的dna分子。进一步地,所述核酸分子c为编码ac-cytb5蛋白的基因,命名为ac-cytb5基因,具体可为如下(c1)-(c3)中任一所示的dna分子:(c1)核苷酸序列如seqidno.17的887-1276位所示的dna分子;(c2)在严格条件下与(c1)限定的dna分子杂交且编码ac-cytb5蛋白的dna分子;(c3)与(c1)或(c2)所限定的dna序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且编码ac-cytb5蛋白的dna分子。进一步地,所述核酸分子d为编码ac-cyp003蛋白的基因,命名为ac-cyp003基因,具体可为如下(d1)-(d3)中任一所示的dna分子:(d1)核苷酸序列如seqidno.18的第501-2084位所示的dna分子;(d2)在严格条件下与(d1)限定的dna分子杂交且编码ac-cyp003蛋白的dna分子;(d3)与(d1)或(d2)所限定的dna序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且编码ac-cyp003蛋白的dna分子。其中,所述严格条件可为如下:50℃,在7%十二烷基硫酸钠(sds)、0.5mna3po4和1mmedta的混合溶液中杂交,在50℃,2×ssc,0.1%sds中漂洗;还可为:50℃,在7%sds、0.5mna3po4和1mmedta的混合溶液中杂交,在50℃,1×ssc,0.1%sds中漂洗;还可为:50℃,在7%sds、0.5mna3po4和1mmedta的混合溶液中杂交,在50℃,0.5×ssc,0.1%sds中漂洗;还可为:50℃,在7%sds、0.5mna3po4和1mmedta的混合溶液中杂交,在50℃,0.1×ssc,0.1%sds中漂洗;还可为:50℃,在7%sds、0.5mna3po4和1mmedta的混合溶液中杂交,在65℃,0.1×ssc,0.1%sds中漂洗;也可为:在6×ssc,0.5%sds的溶液中,在65℃下杂交,然后用2×ssc,0.1%sds和1×ssc,0.1%sds各洗膜一次。第三方面,本发明要求保护如下生物材料中的任一种:(c1)重组载体,为含有前文第二方面中所述核酸分子的重组载体。(c2)表达盒,为含有前文第二方面中所述核酸分子的表达盒。(c3)转基因细胞系,为含有前文第二方面中所述核酸分子的转基因细胞系。(c4)重组菌,为含有前文第二方面中所述核酸分子的重组菌。(c5)成套重组载体,由重组载体a、重组载体b、重组载体c和重组载体d组成;所述重组载体a为含有前文第二方面中所述核酸分子a的重组载体;所述重组载体b为含有前文第二方面中所述核酸分子b的重组载体;所述重组载体c为含有前文第二方面中所述核酸分子c的重组载体;所述重组载体d为含有前文第二方面中所述核酸分子d的重组载体。(c6)成套表达盒,由表达盒a、表达盒b、表达盒c和表达盒d组成;所述表达盒a为含有前文第二方面中所述核酸分子a的表达盒;所述表达盒b为含有前文第二方面中所述核酸分子b的表达盒;所述表达盒c为含有前文第二方面中所述核酸分子c的表达盒;所述表达盒d为含有前文第二方面中所述核酸分子d的表达盒。(c7)成套转基因细胞系,由转基因细胞系a、转基因细胞系b、转基因细胞系c和转基因细胞系d组成;所述转基因细胞系a为含有前文第二方面中所述核酸分子a的转基因细胞系;所述转基因细胞系b为含有前文第二方面中所述核酸分子b的转基因细胞系;所述转基因细胞系c为含有前文第二方面中所述核酸分子c的转基因细胞系;所述转基因细胞系d为含有前文第二方面中所述核酸分子d的转基因细胞系。(c8)成套重组菌,由重组菌a、重组菌b、重组菌c和重组菌d组成;所述重组菌a为含有前文第二方面中所述核酸分子a的重组菌;所述重组菌b为含有前文第二方面中所述核酸分子b的重组菌;所述重组菌c为含有前文第二方面中所述核酸分子c的重组菌;所述重组菌d为含有前文第二方面中所述核酸分子d的重组菌。第四方面,本发明要求保护一种构建工程菌的方法。本发明所要求保护的构建工程菌的方法,可为如下方法a或方法b:方法a:一种构建工程菌a的方法,具体可包括如下步骤:对酵母菌进行改造,使其表达前文第一方面所述的蛋白质,改造后的酵母菌即为工程菌a。方法b:一种构建工程菌b的方法,具体可包括如下步骤:对酵母菌进行改造,使其表达前文第一方面所述的成套蛋白质,改造后的酵母菌即为工程菌b。进一步地,所述方法a可包括如下步骤:将前文第二方面中所述核酸分子导入所述酵母菌,得到表达前文第一方面所述蛋白质的重组酵母菌,即为所述工程菌a。进一步地,所述方法b可包括如下步骤:将前文第二方面中所述成套核酸分子导入所述酵母菌,得到表达前文第一方面所述成套蛋白质的重组酵母菌,即为所述工程菌b。更进一步地,在所述方法a中,所述核酸分子可是通过前文第三方面中所述重组载体或所述表达盒的形式导入所述酵母菌中。在所述方法b中,所述成套核酸分子可通过前文第三方面中所述成套重组载体或所述成套表达盒的形式导入所述酵母菌中。更进一步地,所述核酸分子或所述成套核酸分子被整合到所述酵母菌的基因组的如下位点中的至少一处:gal7位点、ndt80位点、gal80位点、adh1位点。更加具体地,所述核酸分子(或所述核酸分子a)被整合到所述酵母菌的基因组的gal7位点或者adh1位点;所述核酸分子b、所述核酸分子c和所述核酸分子d被整合到所述酵母菌的基因组的gal7位点、ndt80位点、gal80位点和/或adh1位点。更进一步地,所述酵母菌可为酿酒酵母(如by4742△trp菌株)等。在本发明的一个具体实施方式中,所述核酸分子是通过表达盒的形式导入所述酵母菌中的;所述表达盒为表达盒ptdh3-clcdr4-tpi1t;所述表达盒ptdh3-clcdr4-tpi1t的序列为seqidno.2。当向所述酵母菌中导入所述表达盒ptdh3-clcdr4-tpi1t的同时,还导入了同源臂marker片段gal7s-ura3-up和同源臂marker片段gal7s-ura3-down(实现了整合于酿酒酵母的gal7位点);所述同源臂marker片段gal7s-ura3-up的序列如seqidno.6所示;所述同源臂marker片段gal7s-ura3-down的序列如seqidno.7所示。在本发明的另一个具体实施方式中,所述成套核酸分子是通过成套表达盒的形式导入所述酵母菌中的;所述成套表达盒由表达盒ppgk-ac-cpr-adh1t、表达盒ptdh3-ac-cytb5-tpi1t、表达盒ptef-ac-cyp003-cyc1t和表达盒pfba1-clcdr4-tdh2t组成;所述表达盒ppgk-ac-cpr-adh1t的序列为seqidno.16;所述表达盒ptdh3-ac-cytb5-tpi1t的序列为seqidno.17;所述表达盒ptef-ac-cyp003-cyc1t的序列为seqidno.18;所述表达盒pfba1-clcdr4-tdh2t的序列为seqidno.3。当向所述酵母菌中导入各表达盒的同时,还导入了同源臂marker片段。导入同源臂marker片段gal7-ura3-up和同源臂marker片段gal7-ura3-down实现了整合于酿酒酵母的gal7位点;所述同源臂marker片段gal7-ura3-up的序列如seqidno.8所示;所述同源臂marker片段gal7-ura3-down的序列如seqidno.9所示。导入同源臂marker片段ndt80-his3-up和同源臂ndt80-his3-down实现了整合于酿酒酵母的ndt80位点;所述同源臂marker片段ndt80-his3-up的序列如seqidno.10所示;所述同源臂marker片段ndt80-his3-down的序列如seqidno.11所示。导入同源臂marker片段gal80-leu2-up和同源臂gal80-leu2-down实现了整合于酿酒酵母的gal80位点;所述同源臂marker片段gal80-leu2-up的序列如seqidno.12所示;所述同源臂marker片段gal80-leu2-down的序列如seqidno.13所示。导入同源臂marker片段adh1-trp1-up和同源臂adh1-trp1-down实现了整合于酿酒酵母的adh1位点;所述同源臂marker片段adh1-trp1-up的序列如seqidno.14所示;所述同源臂marker片段adh1-trp1-down的序列如seqidno.15所示。第五方面,本发明要求保护利用前文第四方面中所述方法制备得到的工程菌(即所述工程菌a或所述工程菌b)。在本发明的具体实施方式中,所述工程菌a为工程菌hc202;所述工程菌hc202是按照包括如下步骤的得到制备获得的:(d1)将cas9质粒导入酿酒酵母(saccharomycescerevisiae)by4742△trp,得到重组酵母by4742cas9。进一步地,所述cas9质粒具体可为p414-tef1p-cas9-cyc1t(addgene,#43802)。(d2)向所述by4742cas9中导入pgcy1grna质粒和△gcy1片段,得到重组酵母by4742△trp△gcy1。所述pgcy1grna质粒上携带有用于表达特异于gcy1基因的sgrna上的间隔序列(spacer)的dna序列(即用于表达特异于gcy1基因的sgrna中的crrna中用于识别gcy1基因中的靶标序列的dna序列)。进一步地,所述pgcy1grna质粒是以质粒p426-snr52p-grna.can1.y-sup4t(addgene,#43803)为模板,使用引物43803-up(5’-gatcatttatctttcactgcg-3’)和43803-gcy1grna-down1(5’-cgcagtgaaagataaatgatcctcaaataggtttaggtacggttttagagctagaaatagcaag-3’)经pcr扩增后所得。所述△gcy1片段的序列如seqidno.4所示。(d3)向所述by4742△trp△gcy1中导入pypr1grna质粒和△ypr1片段,得到重组酵母by4742△trp△gcy1△ypr1,命名为hc201;所述pypr1grna质粒上携带有用于表达特异于ypr1基因的sgrna上的间隔序列(spacer)的dna序列(即用于表达特异于ypr1基因的sgrna中的crrna中用于识别ypr1基因中的靶标序列的dna序列)。进一步地,所述pypr1grna质粒是以质粒p426-snr52p-grna.can1.y-sup4t(addgene,#43803)为模板,使用引物43803-up(5’-gatcatttatctttcactgcg-3’)和43803-ypr1grna-down1(5’-cgcagtgaaagataaatgatccagtgttgggtttcggcactgttttagagctagaaatagcaag-3’)经pcr扩增后所得。所述△ypr1片段的序列如seqidno.5所示。(d4)向所述hc201中导入所述表达盒ptdh3-clcdr4-tpi1t(seqidno.2)、所述同源臂marker片段gal7s-ura3-up(seqidno.6)以及所述同源臂marker片段gal7s-ura3-down(seqidno.7)后得到的重组菌即为所述工程菌hc202。在本发明的具体实施方式中,所述工程菌b为工程菌hc207;所述工程菌hc207是按照包括如下步骤的得到制备获得的:(e1)向所述hc201中导入所述表达盒ppgk-ac-cpr-adh1t(seqidno.16)、所述表达盒ptdh3-ac-cytb5-tpi1t(seqidno.17)、所述表达盒ptef-ac-cyp003-cyc1t(seqidno.18),以及所述同源臂marker片段gal7-ura3-up(seqidno.8)和所述同源臂marker片段gal7-ura3-down(seqidno.9),得到的重组菌命名为hc203。(e2)向所述hc203中导入所述表达盒ppgk-ac-cpr-adh1t(seqidno.16)、所述表达盒ptdh3-ac-cytb5-tpi1t(seqidno.17)、所述表达盒ptef-ac-cyp003-cyc1t(seqidno.18),以及所述同源臂marker片段ndt80-his3-up(seqidno.10)和所述同源臂marker片段ndt80-his3-down(seqidno.11),得到的重组菌命名为hc204。(e3)向所述hc204中导入所述表达盒ppgk-ac-cpr-adh1t(seqidno.16)、所述表达盒ptdh3-ac-cytb5-tpi1t(seqidno.17)、所述表达盒ptef-ac-cyp003-cyc1t(seqidno.18),以及所述同源臂marker片段gal80-leu2-up(seqidno.12)和所述同源臂marker片段gal80-leu2-down(seqidno.13),得到的重组菌命名为hc205。(e4)向所述hc205中导入所述表达盒ppgk-ac-cpr-adh1t(seqidno.16)、所述表达盒ptdh3-ac-cytb5-tpi1t(seqidno.17)、所述表达盒ptef-ac-cyp003-cyc1t(seqidno.18)、所述表达盒pfba1-clcdr4-tdh2t(seqidno.3),以及所述同源臂marker片段adh1-trp1-up(seqidno.14)和所述同源臂marker片段adh1-trp1-down(seqidno.15),得到的重组菌即为工程菌hc207。第六方面,本发明要求保护如下任一应用:(a)前文第一方面所述的蛋白质(即clcdr4蛋白)在作为甾类物质转运蛋白中的应用;(b)前文第一方面中所述的蛋白质或成套蛋白质或前文第二方面中所述的核酸分子或成套核酸分子或前文第三方面中所述的生物材料或前文第五方面中所述的工程菌在如下中的应用:转运甾类物质或者制备能够转运甾类物质的产品;(c)前文第一方面中所述的蛋白质或成套蛋白质或前文第二方面中所述的核酸分子或成套核酸分子或前文第三方面中所述的生物材料或前文第五方面中所述的工程菌在如下中的应用:在甾类物质合成中提高对甾类底物的转运能力和/或对甾类产物的外排能力,或者制备能够在甾类物质合成中提高对甾类底物的转运能力和/或对甾类产物的外排能力的产品;(d)前文第一方面所述的成套蛋白质或前文第二方面所述的成套核酸分子或前文第三方面中所述的成套重组载体、成套表达盒、成套转基因细胞系或成套重组菌在如下中的应用:通过提高菌株对作为底物的甾类物质的转运能力和/或对甾体产物的外排能力来提高菌株合成氢化可的松的能力。第七方面,本发明要求保护一种制备氢化可的松的方法。本发明所提供的制备氢化可的松的方法为全细胞催化法,具体可包括如下步骤:前文所述的工程菌b进行发酵培养,收集菌体后加入底物,进行催化反应,反应产物中即含有氢化可的松;所述底物为能够被甾类11β-羟化酶催化生成氢化可的松的甾类物质。其中,所述工程菌b由于其不仅可以表达甾类11β-羟化酶,还可以表达作为甾类物质转运蛋白的clcdr4蛋白,所以该方法可以通过提高菌株对作为底物的甾类物质的转运能力对甾体产物的外排能力来提高菌株合成氢化可的松的能力。在上述各方面中,所述甾类物质均可为甾类化合物(steroid)。所述甾类化合物(steroid)是指具有甾核,即环戊烷多氢菲碳骨架的化合物群的总称。进一步地,在本发明中,所述甾类物质具体可为7α-羟基孕甾-4-烯-3,20-二酮-21-醋酸酯(或称为去氧氢化可的松21-醋酸酯,cortexolone-21-acetate,rsa),脱氧皮质醇(11-deoxyhydrocortisone,rs)或者氢化可的松(hydrocortisone,hc)。实验证明,本发明所提供的新月弯孢霉来源的clcdr4蛋白可以作为甾类物质转运蛋白,与不表达该蛋白的工程菌hc206相比较,表达该蛋白的工程菌hc207其在氢化可的松的产率显著提高。因此,本发明中该甾类物质转运蛋白(即clcdr4蛋白)的挖掘与发现,为氢化可的松合成工业中底物投料量低这一瓶颈性问题提供了可行的解决方案。附图说明图1为菌株hc201和hc202催化底物rsa水解能力比较。a为底物rsa胞内胞外比例;b为水解产物rs胞内胞外比例。图2为菌株hc206和hc207氢化可的松合成能力对比。具体实施方式下述实施例中所使用的实验方法如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。新月弯孢霉(curvularialunata):atcc12017,北纳生物(bnbio)产品。质粒m4:在peasy-blunt-simple载体(全式金生物有限公司)的多克隆位点按顺序插入了sexa1酶切位点,ptdh3启动子,绿色荧光蛋白(gfp)基因,以及终止子tpi1t和asc1酶切位点。质粒m8:在peasy-blunt-simple载体(全式金生物有限公司)的多克隆位点按顺序插入了sexa1酶切位点,pfba1启动子,绿色荧光蛋白(gfp)基因,以及终止子tdh2t和asc1酶切位点。酿酒酵母(saccharomycescerevisiae)by4742:thermofisher公司产品。酿酒酵母(saccharomycescerevisiae)by4742△trp:为记载在“zhubodai,etal.producingaglyconsofginsenosidesinbakers′yeast.scirep.2014jan15”一文表1中的“by4742-trp”。公众可从申请人处获得,仅可用于重复本发明实验使用。实施例1、新月弯孢霉甾类物质转运蛋白clcdr4的克隆表达基因的克隆表达分为以下3步:1、新月弯孢霉总rna的提取首先,将新月弯孢霉在平板上培养数天,并收取一定数目的孢子接入到50ml马铃薯-葡萄糖(pda)培养基中,过夜培养至合成大量菌体;随后,离心收集新月弯孢霉菌丝体,使用磷酸钾盐缓冲液(pbs)进行洗涤,最后用50ml缓冲液重悬并加入终浓度为170mg/l的底物去氧氢化可的松21-醋酸酯(rsa)诱导1h,取样进行rna提取。rna提取方法:(1)2.0ml螺帽管(rnasefree)中加入0.5mm的研磨珠(填满锥形管底)以及1mltrizol,之后加入液氮速冻过的菌丝块(约100mg)。(2)使用珠磨机(beadbeater)最大转速30s,重复两次。(3)室温温和的摇动5min,去除附着的核小体。(4)加入0.2ml的氯仿,最大转速珠磨15s。(5)室温温和的摇动2min。(6)4℃下12000g离心15min,取上清液(约0.5ml)至新的ep管(rnasefree)(7)加入等体积(0.5ml)的异丙醇,充分混匀。(8)室温温和的摇动10min,此时可见白色沉淀。(9)4℃下12000g离心10min,去上清。(10)1mldepc水配置的75%酒精洗涤沉淀,4℃下7500g离心5min,充分去除上清。(11)室温放置约15-20min除去乙醇,晾置过久rna会变得难溶。(12)加入50μldepc水,60℃水浴10min助溶。(13)nanodrop测定rna浓度和纯度。通常纯度较好的rna样品a260/a280比值在1.9~2.0之间,a260/a230通常大于2。2、反转录pcr与基因扩增第一链反转录-pcr:取无rna酶pcr管,按thermo反转录试剂盒扩增得到cdna。具体操作步骤如下:模板总rna3μl,oligo(dt)18引物1μl,10mmdntpmix1μl,rnase-free水10μl。瞬间离心,pcr65℃5min,冰上急冷;再加入以下体系中反应液:5×rtbuffer4μl,maximahminusenzymemix1μl,瞬间离心,pcr仪中进行反应50℃50min,85℃5min,4℃保温。pcr扩增:反转录所得cdna为模板,用引物clcdr4-up-pac1/clcdr4-down-asc1(见表1)扩增到目的基因,扩增体系为takarahsdna聚合酶5×buffer10μl,dntpmix4μl,引物(见表1)各1μl,cdna,模板0.5μl,primerstarhs聚合酶(2.5u/μl)0.5μl,补加蒸馏水至总体积50μl。扩增条件为98℃预变性2分钟(1个循环);98℃变性10秒、56℃退火15秒、72℃延伸5分钟(30个循环);72℃延伸8分钟(1个循环)。所得扩增产物命名为clcdr4。将得到的pcr扩增产物用上海生工生物工程有限公司的pcr产物纯化试剂盒纯化,纯化后用thermo公司的pac1与asc1酶切dna片段,胶回收产物备用。表1clcdr4基因扩增引物引物名称序列(5’-3’)clcdr4-up-pac1ccttaattaaatgagcctagtcggcaatttcaclcdr4-down-asc1ggcgcgccttataccttctccgatatttctclcdr4基因(野生型)序列如seqidno.2的第887-5653位所示,编码seqidno.1所示的蛋白质(命名为clcdr4蛋白)。3、构建酵母基因整合片段用thermo公司pac1和asc1酶切质粒m4,m8,酶切产物胶回收备用。与上述步骤2所得clcdr4基因片段各50ng加入连接体系:5μl2×quickligationbuffer(neb公司)、0.5μlquickligase(neb公司,400,000cohesiveendunits/ml),补充蒸馏水至10μl,室温反应10min得到连接产物,转入trans1-t1感受态细胞中冰浴30分钟,42℃热激30秒,立即至于冰上2分钟。加入800μllb培养基,250rpm,37℃孵育1小时,菌液涂在含有氨苄青霉素的lb平板上,过夜培养后,pcr筛选5个阳性单菌落,将阳性克隆进行液体培养,提取阳性克隆质粒进行测序验证,测序结果表明在载体m4,m8上插入目的片段,得到质粒m4-clcdr4和m8-clcdr4。以构建好的质粒m4-clcdr4为模板使用引物xp-m-peasy-m13f-r和xp-m-peasy-m13r-f(见表2)进行pcr扩增(方法同实施例1步骤2),获得ptdh3-clcdr4-tpi1t片段(seqidno.2),该片段包含tdh3启动子(seqidno.2的第87-886位),新月弯孢霉来源的clcdr4基因(seqidno.2的第887-5653位)以及tpi1终止子(seqidno.2的第5654-6055位)。以构建好的质粒m8-clcdr4为模板使用引物s-4g-4-m-adh1t-fba1-f和s-4g-4-m-tdh2t-tdh3-r(见表2)进行pcr扩增(方法同实施例1步骤2),获得pfba1-clcdr4-tdh2t片段(seqidno.3),该片段包含fba1启动子(seqidno.3的第55-876位),新月弯孢霉来源的clcdr4基因(seqidno.3的第877-5643位)以及tdh2终止子(seqidno.3的第5644-6044位)。对扩增获得的目的片段进行胶回收处理备用。表2clcdr4基因整合片段扩增引物实施例2、酿酒酵母底盘菌株hc201的构建通过crispr-cas9的方法构建酿酒酵母底盘菌株hc201的过程分为以下6步:1、酿酒酵母内源gcy1,ypr1基因grna质粒的构建首先以质粒p426-snr52p-grna.can1.y-sup4t(addgene,#43803)为模板,使用引物43803-up和43803-gcy1grna-down1(见表3)进行pcr扩增(方法同实施例1步骤2),扩增获得的pcr产物进行dpn1消化处理,dpn1处理体系为:10μl10×dpn1buffer(thermo公司)、5μldpn1(therom公司,400,000cohesiveendunits/ml),80μlpcr扩增产物,补充蒸馏水至100μl,消化处理4小时,随后对处理后的产物,进行胶回收处理备用。将胶回收后得到的消化产物,转入trans1-t1感受态细胞中冰浴30分钟,42℃热激30秒,立即至于冰上2分钟。加入800μllb培养基,250rpm,37℃孵育1小时,菌液涂在含有氨苄青霉素的lb平板上,过夜培养后,pcr筛选5个阳性单菌落,将阳性克隆进行液体培养,提取阳性克隆质粒进行测序验证,测序结果表明正确的质粒命名为pgcy1grna该质粒包含gcy1基因对应的n20序列(即特异于gcy1基因的sgrna上的间隔序列(spacer)的dna序列,也即用于表达特异于gcy1基因的sgrna中的crrna中用于识别gcy1基因中的靶标序列的dna序列)。ypr1基因相应grna质粒pypr1grna的构建方法与此相同,使用的引物为43803-up和43803-ypr1grna-down1,见表3。2、酿酒酵母内源gcy11,ypr1基因敲除重组片段的构建首先以野生型酿酒酵母by4742的基因组为模板,使用引物gcy1-qc-yz-up和gcy1-qc-m(见表3)进行pcr扩增(方法同实施例1步骤2),获得gcy1基因敲除重组片段△gcy1(seqidno.4),该片段包含gcy1基因上游约500bp和下游50bp同源区。对扩增获得的目的片段进行胶回收处理备用。ypr1基因敲除重组片段△ypr1(seqidno.5)构建方法与△gcy1相同,使用的引物为ypr1-qc-yz-up和ypr1-qc-m,见表3。3、cas9质粒的转化出发菌酿酒酵母(saccharomycescerevisiae)by4742△trp于筛选培养基中过夜培养。筛选培养基组成如下:sd-ura-his-leu-trp(北京泛基诺(功能基因组)科技有限公司),2%葡萄糖,0.005%his.,0.01%leu.,0.01%ura.,0.01%trp.(各百分号均表示g/100ml)。取1ml(lod约0.6-1.0)分装到1.5mlep管中,4℃、10000g离心1min,弃上清,沉淀用无菌水(4℃)洗涤,同样条件下离心,弃上清。菌体加入1ml处理液(10mmliac;10mmdtt;0.6m山梨醇;10mmtris-hcl(ph7.5),处理液使用时才加dtt),25℃下放置20min。离心,弃上清,菌体中加入1ml1m山梨醇(0.22μm水系膜过膜除菌)重悬,离心,弃上清(用1m山梨醇重悬二次),到最终体积约为90μl。加入cas9质粒p414-tef1p-cas9-cyc1t(addgene,#43802)1μl,混匀后转移至电转杯中,2.7kv电击5.6ms,加入1ml1m山梨醇,30℃复苏1h,涂布于筛选培养基平板(配方:0.8%酵母选择培养基sd-ura-his-leu-trp,2%葡萄糖,0.005%his.,0.01%leu.,0.01%ura.,1.5%琼脂;各百分号均表示g/100ml)。筛选培养的条件为:30℃,培养36h以上。pcr鉴定出正确的阳性克隆,命名为菌株by4742cas9。4、grna质粒和基因敲除重组片段的共转化出发菌株by4742cas9于筛选培养基中过夜培养。筛选培养基组成如下:sd-ura-his-leu-trp(北京泛基诺(功能基因组)科技有限公司),2%葡萄糖,0.005%his.,0.01%leu.,0.01%ura.(各百分号均表示g/100ml)。然后制备酿酒酵母感受态,向制备好的酿酒酵母by4742cas9的感受态细胞中加入pgcy1grna质粒和△gcy1片段各1μl,混匀后转移至电转杯中,2.7kv电击5.6ms,加入1ml1m山梨醇,30℃复苏1h,涂布于筛选培养基平板(配方:0.8%酵母选择培养基sd-ura-his-leu-trp,2%葡萄糖,0.005%his.,0.01%leu.,1.5%琼脂;各百分号均表示g/100ml)。筛选培养的条件为:30℃,培养36h以上。获得的菌株进行pcr验证,使用引物gcy1-qc-yz-up/gcy1-qc-yz-down,验证正确的阳性克隆,命名为菌株by4742△trp△gcy1。5、pgcy1grna质粒的消除将出发菌株by4742△trp△gcy1在含有5-氟乳清酸(5-foa)筛选培养基平板(配方:0.8%酵母选择培养基sd-ura-his-leu-trp,2%葡萄糖,0.005%his.,0.01%leu.,0.01%ura.,0.05%5-foa.,1.5%琼脂;各百分号均表示g/100ml)30℃划线培养24h,随后挑选单克隆分别在sd-ura-trp和sd-trp筛选培养基平板划线,选取在sd-trp平板上生长而在sd-ura-trp平板上不生长的克隆,确认为已经正确消除掉pgcy1grna质粒的by4742△trp△gcy1菌株。6、ypr1基因的敲除将步骤5中获得的酿酒酵母by4742△trp△gcy1菌株进行pypr1grna质粒和△ypr1片段的共转化(方法同步骤4),获得的菌株进行pcr验证,使用引物ypr1-qc-yz-up/ypr1-qc-yz-down,验证正确的菌株继续进行pypr1grna质粒消除(方法同步骤5),获得的菌株为by4742△trp△gcy1△ypr1命名为hc201表3gcy1和ypr1基因敲除引物实施例3、酿酒酵母工程菌hc202的构建出发菌酿酒酵母(saccharomycescerevisiae)hc201(by4742,△trp△ypr1△gcy1)于筛选培养基中过夜培养。筛选培养基组成如下:sd-ura-his-leu-trp(北京泛基诺(功能基因组)科技有限公司),2%葡萄糖,0.005%his.,0.01%leu.,0.01%ura.,0.01%trp.(各百分号均表示g/100ml)。取1ml(1od约0.6-1.0)分装到1.5mlep管中,4℃、10000g离心1min,弃上清,沉淀用无菌水(4℃)洗涤,同样条件下离心,弃上清。菌体加入1ml处理液(10mmliac;10mmdtt;0.6m山梨醇;10mmtris-hcl(ph7.5),处理液使用时才加dtt),25℃下放置20min。离心,弃上清,菌体中加入1ml1m山梨醇(0.22μm水系膜过膜除菌)重悬,离心,弃上清(用1m山梨醇重悬二次),到最终体积约为90μl。分别加入实施例1获得的片段ptdh3-clcdr4-tpi1t以及同源臂marker片段gal7s-ura3-up(seqidno.6;该同源臂片段包含gal7位点上游400bp同源区域,ura3marker基因,以及ptdh3-clcdr4-tpi1t上游86bp同源区域),gal7s-ura3-down(seqidno.7;该同源臂片段包含ptdh3-clcdr4-tpi1t下游同源区域,以及gal7位点下游300bp同源区域)(实现将clcdr4基因片段整合于酿酒酵母by4742的gal7位点)各1μl,混匀后转移至电转杯中,2.7kv电击5.6ms,加入1ml1m山梨醇,30℃复苏1h,涂布于筛选培养基平板(配方:0.8%酵母选择培养基sd-ura-his-leu-trp,2%葡萄糖,0.005%his.,0.01%leu.,0.01%trp.,1.5%琼脂;各百分号均表示g/100ml)。筛选培养的条件为:30℃,培养36h以上。pcr鉴定出正确的阳性克隆,命名为菌株hc202。实施例4、酿酒酵母菌株hc202催化底物rsa水解摇瓶发酵催化:在固体选择培养基(配方:固体酵母筛选培养基sd-ura-his-leu-trp,2%葡萄糖,0.005%his,0.01%leu,0.01%trp.,1.5%琼脂;各百分号均表示g/100ml)中活化hc202酵母菌株,于相应液体选择培养基(配方:液体酵母筛选培养基sd-ura-his-leu-trp,2%葡萄糖,0.005%his,0.01%leu,0.01%trp.;各百分号均表示g/100ml)中制备种子液(30℃,250rpm,16h),以1ml的接种量分别接种于3瓶含100mlypd液体培养基(2%葡萄糖,2%peptone,1%yeastextract;各百分号均表示g/100ml)的500ml三角瓶中,30℃,250rpm振荡培养2天,5000rpm收集酵母细胞,并用pbs缓冲液洗涤最终重悬于含有30mlpbs的250ml三角瓶中,加入终浓度为1000mg/l的底物rsa,进行催化反应,30℃,250rpm振荡培养1天。产物萃取:1、全催化液萃取,取5ml的催化反应液于分液漏斗中,加入等体积的萃取剂(甲醇:氯仿=1:9,体积比),取下层有机相4ml,装入10ml离心管中干燥,用1ml甲醇溶液进行复溶,离心取上清过0.22μm有机滤膜至液相瓶中进行hplc检测。检测方法:色谱柱shimadzuinertsustain250mm*4.6mm*5um(广州绿百草生物有限公司),流动相甲醇:水=6:4(v/v),流速0.8ml/min,柱温25℃,检测波长254nm。通过安捷伦1260高效液相色谱仪(hplc)分析产物。2、胞外产物萃取,取5ml的催化反应液5000rpm收集上清溶液,加入等体积的萃取剂(甲醇:氯仿=1:9,体积比),取下层有机相2ml,装入10ml离心管中干燥,用500μl甲醇溶液进行复溶,离心取上清过0.22μm有机滤膜至液相瓶中进行hplc检测(检测方法同步骤1)。通过安捷伦1260高效液相色谱仪(hplc)分析产物。3、胞内产物萃取,取5ml的催化反应液5000rpm收集菌体沉淀,加入等体积的萃取剂(甲醇:氯仿=1:9,体积比),取下层有机相2ml,装入10ml离心管中干燥,用500μl甲醇溶液进行复溶,离心取上清过0.22μm有机滤膜至液相瓶中进行hplc检测(检测方法同步骤1)。通过安捷伦1260高效液相色谱仪(hplc)分析产物。通过对比酿酒酵母菌株hc201和hc202的胞内、胞外以及全菌的数据结果(图1),可见:当投加底物rsa浓度为1000mg/l的条件下,菌株hc201在催化24h后有29%的rsa底物残余,其余71%转化为水解产物11-脱氧皮质醇(11-deoxyhydrocortisone,rs),其中52%存在于胞内,19%存在于胞外;而表达了新月弯孢霉来源的clcdr4基因的酿酒酵母菌株hc202无底物rsa剩余,表明1000mg/l的底物rsa均转化为水解产物rs,其中74%存在于胞内,26%存在于胞外。根据这一数据结果推断,新月弯孢霉来源的clcdr4蛋白的加入促进了甾体底物的转运与外排。clcdr4蛋白含有1588个氨基酸,根据序列比对,clcdr4氨基酸序列与白色念珠菌(candidaalbicans)来源的cdr4以及酿酒酵母(saccharomycescerevisiae)来源的pdr5这两个已有报道的abc转运蛋白的氨基酸序列的同源性分别为51%和48%,进一步结合我们的实验结果,我们推断该蛋白为丝状真菌来源的甾类物质abc转运蛋白。实施例5、酿酒酵母hc206和hc207的构建1、以酿酒酵母菌株hc201出发,sd-ura-his-leu-trp(北京泛基诺(功能基因组)科技有限公司),2%葡萄糖,0.005%his.,0.01%leu.,0.01%ura.(各百分号均表示g/100ml)。取1ml(od约0.6-1.0)分装到1.5mlep管中,4℃、10000g离心1min,弃上清,沉淀用无菌水(4℃)洗涤,同样条件下离心,弃上清。菌体加入1ml处理液(10mmliac;10mmdtt;0.6m山梨醇;10mmtris-hcl(ph7.5),处理液使用时才加dtt),25℃下放置20min。离心,弃上清,菌体中加入1ml1m山梨醇(0.22μm水系膜过膜除菌)重悬,离心,弃上清(用1m山梨醇重悬二次),到最终体积约为90μl。分别加入实验室已有的重组片段ppgk-ac-cpr-adh1t(seqidno.16,该片段包含pgk启动子—seqidno.16的第63-812位,蓝色犁头霉来源的ac-cpr基因—seqidno.16的第813-2864位(ac-cpr蛋白的氨基酸序列如seqidno.19所示),以及adh1终止子—seqidno.16的第2865-3022位),ptdh3-ac-cytb5-tpi1t(seqidno.17,该片段包含ptdh3启动子—seqidno.17的第87-886位,蓝色犁头霉来源的ac-cytb5基因—seqidno.17的第887-1276位(ac-cytb5蛋白的氨基酸序列如seqidno.20所示),以及tpi1t终止子—seqidno.17的第1277-1678位),ptef-ac-cyp003-cyc1t(seqidno.18,该片段包含tef启动子—seqidno.18的第51-500位,蓝色犁头霉来源的ac-cyp003基因—seqidno.18的第501-2084位(ac-cyp003蛋白的氨基酸序列如seqidno.21所示),以及cyc1终止子—seqidno.18的第2085-2391位)以及同源臂marker片段gal7-ura3-up(seqidno.8;该同源臂片段包含gal7位点上游400bp同源区域,ura3marker基因,以及pgk启动子400bp同源区域),gal7-ura3-down(seqidno.9;该同源臂片段包含cyc1终止子200bp同源区域,以及gal7位点下游300bp同源区域)(实现将accpr,accytb5,accyp003基因片段整合于酿酒酵母hc201的gal7位点)各1μl,混匀后转移至电转杯中,2.7kv电击5.7ms,加入1ml1m山梨醇,30℃复苏1h,涂布于固体筛选培养基(配方:酵母选择培养基sd-ura-his-leu-trp,2%葡萄糖,0.005%his.,0.01%leu,1.5%琼脂;各百分号均表示g/100ml)。筛选培养的条件为:30℃,培养36h以上。pcr鉴定出正确的阳性克隆,命名为菌株hc203。2、以酿酒酵母菌株hc203出发,继续将accpr,accytb5,accyp003基因片段整合于酿酒酵母hc203的ndt80位点(方法同步骤1),将所用同源臂marker片段替换为ndt80-his3-up(seqidno.10;该同源臂片段包含ndt80位点上游400bp同源区域,his3marker基因,以及pgk启动子400bp同源区域),ndt80-his3-down(seqidno.11;该同源臂片段包含cyc1终止子200bp同源区域,以及gal7位点下游300bp同源区域),获得正确的阳性克隆,命名为菌株hc204。3、以酿酒酵母菌株hc204为出发菌株,继续将accpr,accytb5,accyp003基因片段整合于酿酒酵母hc204的gal80位点(方法同步骤1),将所用同源臂marker片段替换为gal80-leu2-up(seqidno.12;该同源臂片段包含ndt80位点上游400bp同源区域,leu2marker基因,以及pgk启动子400bp同源区域),ndt80-leu2-down(seqidno.13;该同源臂片段包含cyc1终止子200bp同源区域,以及gal80位点下游300bp同源区域),获得正确的阳性克隆,命名为菌株hc205。4、以酿酒酵母菌株hc205出发,将与步骤2、3中一致的accpr,accytb5,accyp003基因片段一起整合于酿酒酵母adh1位点(方法同步骤1),将所用同源臂marker片段替换为adh1-trp1-up(seqidno.14;该同源臂片段包含adh1位点上游400bp同源区域,trp1marker基因,以及pgk启动子400bp同源区域),adh1-trp1-down(seqidno.15;该同源臂片段包含cyc1终止子200bp同源区域,以及adh1位点下游300bp同源区域),获得正确的阳性克隆,命名为菌株hc206。5、同样以酿酒酵母菌株hc205出发,将与步骤2、3、4中一致的accpr,accytb5,accyp003基因片段以及重组片段pfba1-clcdr4-tdh2t(seqidno.3)一起整合于酿酒酵母adh1位点(方法同步骤1),将所用同源臂marker片段替换为adh1-trp1-up(seqidno.14;该同源臂片段包含adh1位点上游400bp同源区域,trp1marker基因,以及pgk启动子400bp同源区域),adh1-trp1-down(seqidno.15;该同源臂片段包含cyc1终止子200bp同源区域,以及adh1位点下游300bp同源区域),获得正确的阳性克隆,命名为菌株hc207。实施例6、酿酒酵母hc206和hc207的催化发酵合成氢化可的松摇瓶发酵催化:在固体选择培养基(配方:固体酵母筛选培养基sd-ura-his-leu-trp,2%葡萄糖,1.5%琼脂;各百分号均表示g/100ml)中活化hc205,hc206酿酒酵母菌株,于相应液体选择培养基(配方:液体酵母筛选培养基sd-ura-his-leu-trp,2%葡萄糖;各百分号均表示g/100ml)中制备种子液(30℃,250rpm,16h),以1ml的接种量分别各自接种于3瓶含100mlypd液体培养基(2%葡萄糖,2%peptone,1%yeastextract;各百分号均表示g/100ml)的500ml三角瓶中,30℃,250rpm振荡培养2天,5000rpm收集酵母细胞,并用pbs缓冲液洗涤最终重悬于含有30mlpbs的250ml三角瓶中,加入终浓度为850mg/l的底物rsa,进行催化反应,30℃,250rpm振荡培养1天。产物萃取:全催化液萃取,取5ml的催化反应液于分液漏斗中,加入等体积的萃取剂(甲醇:氯仿=1:9,体积比),取下层有机相4ml,装入10ml离心管中干燥,用1ml甲醇溶液进行复溶,离心取上清过0.22μm有机滤膜至液相瓶中进行hplc检测(检测方法同实施例4步骤1)。通过安捷伦1260高效液相色谱仪(hplc)分析产物。通过对菌株hc206和hc207的摇瓶催化发酵合成氢化可的松能力的对比验证,结果如图2所示,菌株hc206的氢化可的松生产速率为136mg/l·d,而在hc206的基础上表达了新月弯孢霉来源的转运蛋白clcdr4的菌株hc207的氢化可的松生产速率为167mg/l·d,相比于菌株hc206提高了23%。结果表明新月弯孢霉来源的甾类物质转运蛋白clcdr4通过提高底物rsa的转运能力,有效的提高了菌株的氢化可的松合成能力。该甾类物质转运蛋白的挖掘与发现,为氢化可的松合成工业中底物投料量低这一瓶颈性问题提供了可行的解决方案。<110>中国科学院天津工业生物技术研究所<120>新月弯孢霉来源的甾类物质转运蛋白及其编码基因与应用<130>gncln190431<160>21<170>patentinversion3.5<210>1<211>1588<212>prt<213>curvularialunata<400>1metserleuvalglyasnphethrserasnpheaspargglualaval151015serglyglyalaproserproglumetilealagluglnglnarggln202530histyrglnaspaspgluargasphisglnalaalagluseraspala354045serthrilealaalaglygluglyserproproserglnhisasnarg505560alaasphislysasnalaserhisasnthrargaspaspaspgluile65707580alagluthrmetargarggluglualavalhisglnleualaargarg859095leuthralaglnserhisglnserserserglnalaasnpropheasn100105110alaproproasnseralaleuaspproasnglygluhispheasnala115120125argalatrpthrlysalametleuasnleuglnleuglnaspgluasn130135140alaproprovalargthralaglyvalalapheargasnleuasnval145150155160hisglypheglythraspalaasptyrglnlysservalglyasnval165170175trpleugluglyproserleuvallyslysleumetglyasplysgly180185190arglysileasnileleuargaspcysaspglyleuvalglualagly195200205glumetleuvalvalleuglyproproglyserglycysserthrphe210215220leulysthrilethrglygluthrhisglyphephevalaspglnasn225230235240serhisileasntyrglnglyileserprogluilemetasnlysasn245250255tyrargglyglualailetyrthralagluvalaspvalhisphepro260265270metmetthrvalglygluthrleutyrphealaalaglnalaargarg275280285proarghisileproglyglyvalservalglnglntyralagluhis290295300glnargaspvalilemetalaleutyrglyileserhisthrleuasn305310315320thrargvalglyasnasppheleuargglyvalserglyglygluarg325330335lysargvalthrilealaglualaserleuserargalaproleugln340345350alatrpaspasnserthrargglyleuaspseralaasnalaileglu355360365phecyslysthrleuargmetgluthrgluileasnglyserthrala370375380cysvalalailetyrglnalaproglnalaalatyraspleupheasp385390395400lysalaleuvalleutyrgluglyargglnilephepheglylysthr405410415thraspalalysalatyrphevalasnmetglyphehiscysproasp420425430argglnthraspalaasppheleuthrsermetthrserproleuglu435440445argilevalarggluglyphegluglyargvalproargthrproasp450455460gluphealaglnargtrpleuaspserprogluargalaalaleuleu465470475480argaspileglualatyrgluglnlystyrproileglyglygluser485490495serglnlysphelysgluserargglnleuglnlysalalysglygln500505510arggluthrserprotyrthrleusertyrmetaspglnvallysleu515520525cysleutrpargglyphevalargleulysalaaspproserilethr530535540leuthrglnleuilealaasnserilemetalaleuileileserser545550555560valphetyrasnleuglnprothrthrserserphetyrserargser565570575alaleuleuphephealaileleumetasnalapheglyseralaleu580585590gluileleuthrleutyralaglnargproilevalglulyshisser595600605argtyralaleutyrhisproseralaglualaphealasermetleu610615620thraspleuprotyrlysilevalasnalailethrpheasnleuval625630635640leutyrphemetthrasnleuargarggluproglyasnphephephe645650655phevalleuileserphethrleuthrleuvalmetsermetphephe660665670argserilealaalaleuserargserleuvalglnalaleualapro675680685alaalaileleuileleuglyleuvalmettyrthrglyphealaile690695700proproasntyrmetleuglytrpserlystrpileargtyrileasn705710715720provalsertyrglypheglualaleumetvalasngluphehisasn725730735argargpheglucysasnasptyrileproserserglyglyleupro740745750alaleuseralatyraspasnileserglyproglnargalacysarg755760765alaileglyservalproglyglnprotyrvalgluglyaspalatyr770775780ileasnserserpheasntyrtyralaserhislystrpargasnphe785790795800glyilemettrpalaphemetpheglyleumetphevaltyrleuala805810815glythrglutyrilethralalyslysserlysglygluvalleuval820825830pheargargglyhislysleuproalaprolysserlysserglnglu835840845aspleuglualaalaaspproglyargasnvalalavalglnasnasp850855860asnseraspserilealaileilegluargglnthralailephegln865870875880trpgluaspvalcystyraspilethrilelyslysgluproargarg885890895ileleuasphisvalaspglytrpvallysproglythrleuthrala900905910leumetglyvalserglyalaglylysthrthrleuleuaspcysleu915920925alathrargthrthrmetglyvalilethrglyglnmetleuvalasp930935940glylysproargaspgluserpheglnarglysthrglytyralagln945950955960glnglnaspleuhisleuserthrserthrvalargglualaleuile965970975pheseralavalleuargglnproalahisvalserargglnglulys980985990leuglutyrvalglugluvalilelysleuleuglumetthrglutyr99510001005alaaspalavalvalglyvalproglygluglyleuasnvalglu101010151020glnarglysargleuthrileglyvalgluleualaalalyspro102510301035alaleuleuleupheleuaspgluprothrserglyleuaspser104010451050glnthrsertrpalaileleuaspleuleuasplysleulyslys105510601065asnglyglnalaileleucysthrilehisglnproseralamet107010751080leupheglnargpheaspargleuleupheleualaargglygly108510901095argthrvaltyrtyrglyaspileglygluasnserglnthrleu110011051110valasntyrphevalargasnglyglyproprocysproproasp111511201125alaasnproalaglutrpmetleugluvalileglyalaalapro113011351140glyserhisthraspileasptrphisglnthrtrpargglnser114511501155proglutyrthrgluvallysarghisleualagluleulysser116011651170gluargglyglnalaglualaleuglnargthrleuseralagln117511801185lysarggluasplysalaalatyrarggluphealaalaprophe119011951200alavalglnleuarggluthrleuvalargvalpheglnglntyr120512101215trpargthrprosertyriletyrserlysthrpheleucysval122012251230leuseralaleupheileglypheserleupheglnmetproasn123512401245thrglnthrglyleuglnasnglnmetpheglyilephemetleu125012551260leuthrilepheglyglnleuvalglnglnilemetprohisphe126512701275valthrglnargalaleutyrgluvalarggluargproserlys128012851290alatyrsertrplysalaphemetilealaasnilevalvalglu129513001305leuprotrpasnserleumetalavalleuilephephecystrp131013151320tyrtyrproileglyleutyrlysasnalaglutyrthraspala132513301335valthrleuargglypheglnleupheleuphevaltrpmetphe134013451350leuleuphethrserthrphethrhismetvalilealaglymet135513601365asphisalagluthrglyglyasnvalalaasnleumetpheser137013751380leucysleuilephecysglyvalleualaglnproserglnphe138513901395proargphetrpilephemettyrargvalserprophethrtyr140014051410metvalserglymetleuseralaglyleualaasnserglnval141514201425asncysalaproasngluleuilehispheaspproserglngly143014351440glnthrcysglyglutyrilelysprotrpileservalsergly144514501455glylysmetleuasnproaspalathrseraspcysasnphecys146014651470alaileglnaspthrasnvalpheleuserserileserserser147514801485tyrseraspleutrpargasnpheglyileleutrpvaltyrval149014951500ilepheasnilealaalaalaleualaleutyrtyrleuilearg150515101515metprolysprolyslysglugluthrlysglualaserproala152015251530thralaalaseralathrthralaglygluproserargvalgly153515401545serserhisasnseraspserglyargglnglyglulysaspgly155015551560gluthralaargtyralaserilethrglyalaserthrpropro156515701575glnglnprothrgluileserglulysval15801585<210>2<211>6143<212>dna<213>artificialsequence<400>2gtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagt60cggtcacacaggaaacagctatgaccatactagcgttgaatgttagcgtcaacaacaaga120agtttaatgacgcggaggccaaggcaaaaagattccttgattacgtaagggagttagaat180cattttgaataaaaaacacgctttttcagttcgagtttatcattatcaatactgccattt240caaagaatacgtaaataattaatagtagtgattttcctaactttatttagtcaaaaaatt300agccttttaattctgctgtaacccgtacatgcccaaaatagggggcgggttacacagaat360atataacatcgtaggtgtctgggtgaacagtttattcctggcatccactaaatataatgg420agcccgctttttaagctggcatccagaaaaaaaaagaatcccagcaccaaaatattgttt480tcttcaccaaccatcagttcataggtccattctcttagcgcaactacagagaacaggggc540acaaacaggcaaaaaacgggcacaacctcaatggagtgatgcaacctgcctggagtaaat600gatgacacaaggcaattgacccacgcatgtatctatctcattttcttacaccttctatta660ccttctgctctctctgatttggaaaaagctgaaaaaaaaggttgaaaccagttccctgaa720attattcccctacttgactaataagtatataaagacggtaggtattgattgtaattctgt780aaatctatttcttaaacttcttaaattctacttttatagttagtcttttttttagtttta840aaacaccaagaacttagtttcgaataaacacacataaacaaacaaaatgagcctagtcgg900caatttcacctccaactttgatcgggaggctgtatccggcggcgccccatcaccagaaat960gatagccgaacagcaacgccaacactaccaggacgacgagcgggaccaccaggctgccga1020gtcagatgcgtccacaatagcagcgggcgagggctcgccgcccagtcagcacaaccgcgc1080tgaccacaagaatgcctctcacaacacacgtgacgacgacgaaatcgccgagaccatgcg1140gagagaagaggcagtccaccaacttgccagacgcctgactgcccagagccatcaatcttc1200atcacaagcaaaccctttcaacgcaccccctaattcggctctggatcccaatggcgagca1260cttcaacgcccgtgcctggacaaaggctatgctcaatctgcaacttcaagacgagaatgc1320accaccggtccgaaccgctggtgttgctttccgcaacctgaatgtccatggtttcggtac1380cgacgctgattaccagaagagcgtcggcaacgtttggctcgaaggccccagtctcgtcaa1440gaagctcatgggcgacaagggccgcaagatcaacattctgcgagactgtgatggtcttgt1500cgaggctggtgaaatgttggttgttctaggacctcctggatctggttgctcaaccttctt1560gaagaccattactggcgaaacacacggtttctttgtcgatcagaactcacacattaacta1620ccagggtatcagcccagagattatgaacaagaactaccgtggagaggccatctacacggc1680cgaggtcgacgtccacttccccatgatgactgtcggagaaaccctctactttgctgctca1740agctcgccgccccaggcacatcccaggcggcgtcagcgtacaacaatacgctgaacacca1800gcgcgatgtcatcatggccttgtacggcatctcccacactctcaacactcgggtcggaaa1860cgacttcctccgcggtgtctctggtggagagcgaaagcgtgtcaccatcgccgaagcatc1920ccttagcagagcacccctgcaagcctgggacaactcgaccagaggtctcgactctgcaaa1980cgccatcgagttctgcaaaaccctccgtatggagactgagatcaacggcagcactgcatg2040tgttgccatttaccaagcaccacaggcagcttatgatctttttgacaaggcgcttgtttt2100gtacgagggccgccaaatcttctttggtaagacgacagacgcaaaggcctactttgtcaa2160catgggcttccattgccctgaccgccaaacggatgccgatttcttaacctccatgaccag2220tccgctggagcgcatcgtgcgtgaaggcttcgagggccgcgttccccgcacacctgacga2280gttcgcacagcgctggctagattctcctgagcgagcagcgctgcttcgagacattgaagc2340ttatgagcaaaaataccccattggtggcgagtctagccagaaattcaaggagtctcgcca2400gcttcaaaaggcaaagggtcagcgtgagacatcgccttacacgctctcttacatggacca2460ggtcaagctttgcctctggcgaggcttcgtccgcttaaaggccgatcctagtatcactct2520cacccaactcatcgctaactccatcatggctcttatcatctcgtccgtcttctacaacct2580ccagcctacgacatcaagtttctactctcgatccgctctgctcttcttcgctatcctgat2640gaacgccttcggttccgcgcttgagatcttgacgctctacgcccaacgtcccattgttga2700gaagcactcgcgctacgccttgtatcacccatctgctgaggcttttgctagtatgttgac2760ggatttgccttacaagattgtaaacgccattacgttcaatttggttttgtacttcatgac2820caacctgcggagagaaccgggcaatttcttcttctttgtcctcatctcctttacgcttac2880gctcgtcatgtccatgttcttccgatccattgccgctttgtcgcgctccctggtacaggc2940gttggcgcctgctgccattctcattctcggcctcgtcatgtacaccggtttcgccattcc3000tccgaactacatgttgggatggtccaagtggatccgctacatcaaccctgtcagctatgg3060atttgaggccctcatggtcaatgaattccacaacaggcgatttgagtgcaatgactacat3120tccttccagcggtggtcttccagctctcagtgcctatgacaacatctctggtccccaacg3180agcttgccgggctatcggatctgttcctggacagccatatgtcgagggcgacgcttacat3240caactcgtccttcaattactacgcttcgcacaagtggcgcaactttggaatcatgtgggc3300attcatgttcggtctcatgtttgtctacctcgctggtaccgaatacatcactgccaagaa3360gtccaagggtgaggtccttgttttccgccgcggccacaagctccccgctcccaagagcaa3420gtcacaagaggaccttgaagctgctgaccccggacgcaacgttgctgtgcaaaacgacaa3480ctcggacagcattgccatcatcgaacgccaaaccgccatcttccagtgggaggacgtgtg3540ctacgacatcacgatcaagaaggagcctcgccgaattctcgaccacgttgatggatgggt3600caagcctggtactttgaccgcgctcatgggcgtttctggtgccggtaaaacaacgctttt3660ggactgcttggctacacgtacaaccatgggtgtgattacaggtcagatgctggttgatgg3720caaacctcgcgatgaatctttccagcgtaagacaggttacgctcaacaacaggatctcca3780tctgtcaacctcgaccgttcgcgaagccctcattttctctgctgtcctacgtcaacctgc3840acacgtctctcgccaagagaagctcgaatatgtcgaagaagttatcaagcttctggaaat3900gaccgagtacgctgatgccgtcgttggtgtacctggcgaaggtcttaatgtcgagcaacg3960aaagcgtcttactatcggtgtggagttggctgctaagcctgcgctccttctcttcttgga4020tgaacctacctctggacttgactctcaaacctcttgggctatcctggatcttctcgacaa4080gctgaagaagaacggccaggctattctctgcactatccaccagcccagtgccatgttgtt4140ccagcgcttcgaccgtcttctgttcttggcccgtggtggacgtactgtctactatggaga4200tatcggtgaaaactcgcaaactcttgtcaactactttgttcgcaacggcggccctccatg4260cccacctgatgccaatcccgctgaatggatgttggaagtcatcggtgctgctcctggctc4320gcatactgatattgactggcatcagacttggcgacagtcccctgagtataccgaggtcaa4380gcgccatcttgctgaactcaagtccgaacgtggccaggctgaggctcttcagcgtaccct4440gtctgctcagaagcgggaggacaaggctgcataccgcgagtttgccgcgccatttgccgt4500ccagctccgcgagaccttggttcgtgtcttccaacaatactggcgcactccttcgtacat4560ctactccaagactttcctctgtgttctttcggccctcttcatcggtttctcgctcttcca4620gatgcccaacacccagactgggctccagaaccagatgtttggtatcttcatgttgttgac4680catcttcggtcagttggtccaacagatcatgccgcactttgtcacccagcgtgccttgta4740cgaggttcgtgagcgacccagcaaggcctattcctggaaggcattcatgattgccaacat4800cgtcgtcgaacttccctggaactccctgatggctgtgctcattttcttctgctggtacta4860cccgattggtctctacaagaatgccgagtacaccgatgccgtcaccctccgcggtttcca4920gttgttcctctttgtctggatgttcctgctctttacctcgaccttcacgcacatggttat4980tgctggtatggaccacgccgagactggtggcaatgtggccaacttgatgttctcgctctg5040cctgattttctgcggtgtcctcgcccagccttcccagttcccccgcttctggatcttcat5100gtaccgtgtctcaccgtttacgtacatggtgtccggtatgttgtccgctggtcttgccaa5160cagtcaggtgaactgcgctccaaacgagctcattcatttcgacccatcccagggccagac5220ttgcggcgaatacatcaagccttggatttcggtctctggtggcaagatgctgaacccgga5280tgctacaagtgattgcaacttctgtgctatccaggataccaatgtcttcctctcaagcat5340ctcatcctcctactccgacctttggcgtaactttggaatcctctgggtctatgtcatctt5400caacatcgctgccgcgctcgccttgtactatcttatccgtatgcccaagcccaagaagga5460ggagacaaaggaagctagcccggctactgcagccagtgcgacaacggccggtgagccttc5520ccgtgttggcagcagccacaactcggattccggccgccaaggtgagaaggatggcgagac5580tgctcgctacgcttccatcactggtgccagcacaccaccacaacaacctacagaaatatc5640ggagaaggtataagattaatataattatataaaaatattatcttcttttctttatatcta5700gtgttatgtaaaataaattgatgactacggaaagcttttttatattgtttctttttcatt5760ctgagccacttaaatttcgtgaatgttcttgtaagggacggtagatttacaagtgataca5820acaaaaagcaaggcgctttttctaataaaaagaagaaaagcatttaacaattgaacacct5880ctatatcaacgaagaatattactttgtctctaaatccttgtaaaatgtgtacgatctcta5940tatgggttactcataagtgtaccgaagactgcattgaaagtttatgttttttcactggag6000gcgtcattttcgcgttgagaagatgttcttatccaaatttcaactgttatatagaactgg6060ccgtcgttttacaacgtcgtccattcaggctgcgcaactgttgggaagggcgatcggtgc6120gggcctcttcgctattacgccag6143<210>3<211>6098<212>dna<213>artificialsequence<400>3ctcaggtatagcatgaggtcgctcttattgaccacacctctaccggcatgccgagatcca60actggcaccgctggcttgaacaacaataccagccttccaacttctgtaaataacggcggt120acgccagtgccaccagtaccgttacctttcggtatacctcctttccccatgtttccaatg180cccttcatgcctccaacggctactatcacaaatcctcatcaagctgacgcaagccctaag240aaatgaataacaatactgacagtactaaataattgcctacttggcttcacatacgttgca300tacgtcgatatagataataatgataatgacagcaggattatcgtaatacgtaatagttga360aaatctcaaaaatgtgtgggtcattacgtaaataatgataggaatgggattcttctattt420ttcctttttccattctagcagccgtcgggaaaacgtggcatcctctctttcgggctcaat480tggagtcacgctgccgtgagcatcctctctttccatatctaacaactgagcacgtaacca540atggaaaagcatgagcttagcgttgctccaaaaaagtattggatggttaataccatttgt600ctgttctcttctgactttgactcctcaaaaaaaaaaaatctacaatcaacagatcgcttc660aattacgccctcacaaaaacttttttccttcttcttcgcccacgttaaattttatccctc720atgttgtctaacggatttctgcacttgatttattataaaaagacaaagacataatacttc780tctatcaatttcagttattgttcttccttgcgttattcttctgttcttctttttcttttg840tcatatataaccataaccaagtaatacatattcaaaatgagcctagtcggcaatttcacc900tccaactttgatcgggaggctgtatccggcggcgccccatcaccagaaatgatagccgaa960cagcaacgccaacactaccaggacgacgagcgggaccaccaggctgccgagtcagatgcg1020tccacaatagcagcgggcgagggctcgccgcccagtcagcacaaccgcgctgaccacaag1080aatgcctctcacaacacacgtgacgacgacgaaatcgccgagaccatgcggagagaagag1140gcagtccaccaacttgccagacgcctgactgcccagagccatcaatcttcatcacaagca1200aaccctttcaacgcaccccctaattcggctctggatcccaatggcgagcacttcaacgcc1260cgtgcctggacaaaggctatgctcaatctgcaacttcaagacgagaatgcaccaccggtc1320cgaaccgctggtgttgctttccgcaacctgaatgtccatggtttcggtaccgacgctgat1380taccagaagagcgtcggcaacgtttggctcgaaggccccagtctcgtcaagaagctcatg1440ggcgacaagggccgcaagatcaacattctgcgagactgtgatggtcttgtcgaggctggt1500gaaatgttggttgttctaggacctcctggatctggttgctcaaccttcttgaagaccatt1560actggcgaaacacacggtttctttgtcgatcagaactcacacattaactaccagggtatc1620agcccagagattatgaacaagaactaccgtggagaggccatctacacggccgaggtcgac1680gtccacttccccatgatgactgtcggagaaaccctctactttgctgctcaagctcgccgc1740cccaggcacatcccaggcggcgtcagcgtacaacaatacgctgaacaccagcgcgatgtc1800atcatggccttgtacggcatctcccacactctcaacactcgggtcggaaacgacttcctc1860cgcggtgtctctggtggagagcgaaagcgtgtcaccatcgccgaagcatcccttagcaga1920gcacccctgcaagcctgggacaactcgaccagaggtctcgactctgcaaacgccatcgag1980ttctgcaaaaccctccgtatggagactgagatcaacggcagcactgcatgtgttgccatt2040taccaagcaccacaggcagcttatgatctttttgacaaggcgcttgttttgtacgagggc2100cgccaaatcttctttggtaagacgacagacgcaaaggcctactttgtcaacatgggcttc2160cattgccctgaccgccaaacggatgccgatttcttaacctccatgaccagtccgctggag2220cgcatcgtgcgtgaaggcttcgagggccgcgttccccgcacacctgacgagttcgcacag2280cgctggctagattctcctgagcgagcagcgctgcttcgagacattgaagcttatgagcaa2340aaataccccattggtggcgagtctagccagaaattcaaggagtctcgccagcttcaaaag2400gcaaagggtcagcgtgagacatcgccttacacgctctcttacatggaccaggtcaagctt2460tgcctctggcgaggcttcgtccgcttaaaggccgatcctagtatcactctcacccaactc2520atcgctaactccatcatggctcttatcatctcgtccgtcttctacaacctccagcctacg2580acatcaagtttctactctcgatccgctctgctcttcttcgctatcctgatgaacgccttc2640ggttccgcgcttgagatcttgacgctctacgcccaacgtcccattgttgagaagcactcg2700cgctacgccttgtatcacccatctgctgaggcttttgctagtatgttgacggatttgcct2760tacaagattgtaaacgccattacgttcaatttggttttgtacttcatgaccaacctgcgg2820agagaaccgggcaatttcttcttctttgtcctcatctcctttacgcttacgctcgtcatg2880tccatgttcttccgatccattgccgctttgtcgcgctccctggtacaggcgttggcgcct2940gctgccattctcattctcggcctcgtcatgtacaccggtttcgccattcctccgaactac3000atgttgggatggtccaagtggatccgctacatcaaccctgtcagctatggatttgaggcc3060ctcatggtcaatgaattccacaacaggcgatttgagtgcaatgactacattccttccagc3120ggtggtcttccagctctcagtgcctatgacaacatctctggtccccaacgagcttgccgg3180gctatcggatctgttcctggacagccatatgtcgagggcgacgcttacatcaactcgtcc3240ttcaattactacgcttcgcacaagtggcgcaactttggaatcatgtgggcattcatgttc3300ggtctcatgtttgtctacctcgctggtaccgaatacatcactgccaagaagtccaagggt3360gaggtccttgttttccgccgcggccacaagctccccgctcccaagagcaagtcacaagag3420gaccttgaagctgctgaccccggacgcaacgttgctgtgcaaaacgacaactcggacagc3480attgccatcatcgaacgccaaaccgccatcttccagtgggaggacgtgtgctacgacatc3540acgatcaagaaggagcctcgccgaattctcgaccacgttgatggatgggtcaagcctggt3600actttgaccgcgctcatgggcgtttctggtgccggtaaaacaacgcttttggactgcttg3660gctacacgtacaaccatgggtgtgattacaggtcagatgctggttgatggcaaacctcgc3720gatgaatctttccagcgtaagacaggttacgctcaacaacaggatctccatctgtcaacc3780tcgaccgttcgcgaagccctcattttctctgctgtcctacgtcaacctgcacacgtctct3840cgccaagagaagctcgaatatgtcgaagaagttatcaagcttctggaaatgaccgagtac3900gctgatgccgtcgttggtgtacctggcgaaggtcttaatgtcgagcaacgaaagcgtctt3960actatcggtgtggagttggctgctaagcctgcgctccttctcttcttggatgaacctacc4020tctggacttgactctcaaacctcttgggctatcctggatcttctcgacaagctgaagaag4080aacggccaggctattctctgcactatccaccagcccagtgccatgttgttccagcgcttc4140gaccgtcttctgttcttggcccgtggtggacgtactgtctactatggagatatcggtgaa4200aactcgcaaactcttgtcaactactttgttcgcaacggcggccctccatgcccacctgat4260gccaatcccgctgaatggatgttggaagtcatcggtgctgctcctggctcgcatactgat4320attgactggcatcagacttggcgacagtcccctgagtataccgaggtcaagcgccatctt4380gctgaactcaagtccgaacgtggccaggctgaggctcttcagcgtaccctgtctgctcag4440aagcgggaggacaaggctgcataccgcgagtttgccgcgccatttgccgtccagctccgc4500gagaccttggttcgtgtcttccaacaatactggcgcactccttcgtacatctactccaag4560actttcctctgtgttctttcggccctcttcatcggtttctcgctcttccagatgcccaac4620acccagactgggctccagaaccagatgtttggtatcttcatgttgttgaccatcttcggt4680cagttggtccaacagatcatgccgcactttgtcacccagcgtgccttgtacgaggttcgt4740gagcgacccagcaaggcctattcctggaaggcattcatgattgccaacatcgtcgtcgaa4800cttccctggaactccctgatggctgtgctcattttcttctgctggtactacccgattggt4860ctctacaagaatgccgagtacaccgatgccgtcaccctccgcggtttccagttgttcctc4920tttgtctggatgttcctgctctttacctcgaccttcacgcacatggttattgctggtatg4980gaccacgccgagactggtggcaatgtggccaacttgatgttctcgctctgcctgattttc5040tgcggtgtcctcgcccagccttcccagttcccccgcttctggatcttcatgtaccgtgtc5100tcaccgtttacgtacatggtgtccggtatgttgtccgctggtcttgccaacagtcaggtg5160aactgcgctccaaacgagctcattcatttcgacccatcccagggccagacttgcggcgaa5220tacatcaagccttggatttcggtctctggtggcaagatgctgaacccggatgctacaagt5280gattgcaacttctgtgctatccaggataccaatgtcttcctctcaagcatctcatcctcc5340tactccgacctttggcgtaactttggaatcctctgggtctatgtcatcttcaacatcgct5400gccgcgctcgccttgtactatcttatccgtatgcccaagcccaagaaggaggagacaaag5460gaagctagcccggctactgcagccagtgcgacaacggccggtgagccttcccgtgttggc5520agcagccacaactcggattccggccgccaaggtgagaaggatggcgagactgctcgctac5580gcttccatcactggtgccagcacaccaccacaacaacctacagaaatatcggagaaggta5640taaatttaactccttaagttactttaatgatttagtttttattattaataattcatgctc5700atgacatctcatatacacgtttataaaacttaaatagattgaaaatgtattaaagattcc5760tcagggattcgatttttttggaagtttttgtttttttttccttgagatgctgtagtattt5820gggaacaattatacaatcgaaagatatatgcttacattcgaccgttttagccgtgatcat5880tatcctatagtaacataacctgaagcataactgacactactatcatcaatacttgtcaca5940tgagaactctgtgaataattaggccactgaaatttgatgcctgaaggaccggcatcacgg6000attttcgataaagcacttagtatcacactaattggcttttcgccatactagcgttgaatg6060ttagcgtcaacaacaagaagtttaatgacgcggaggcc6098<210>4<211>621<212>dna<213>artificialsequence<400>4gaagtatgacctctgttaaatttttttttttttaaatttcactttctaaagtcccagaaa60tccgcttgaatgtcttacatattgcaatggatatgcttgggtgatcatacttcctggctt120tagatatttgaaacttaactcttgtcaacaaacttcctatggagtgtataagaattgtaa180gttataacaccggcgaacaatcggggcagactattccggggaagaacaaggaagggcggt240cttttctccctcattgtcatagcaaggtcatttcgccttctcagaaaggggtagaatcaa300tctagcacgcagattgcaaacacggcttaataatatgcctatcaggcattcacccgtgtg360acgaatcgcacaccgctgctctccttaattccctagagtagaaaccgagctttcaggaaa420agactacggcagtaaagaattgctttactgggcgtataaaaccgggagaatcaagacatt480ctaatgacttgattcaggatgagagcttaataggtgcatcttagcaagctaaaatttgga540cagctctcattactaaattaagatagaaaattgtttttgcgtgtttctcgtatgattgta600atatgtagataaattaaacat621<210>5<211>581<212>dna<213>artificialsequence<400>5aagtgcaactgaaagctacgaatataccatgactattttaattacgttggtgtcattgat60attcaggttctactttaacttcattttggcatcttttgttcaagaattgttacaccaccc120caaatatttagttgatagggatgacgtagaacaaaacttgaaaaacaagcctatttggaa180aagactgtgggctaagagccaaaaaggttgttataagctatgtaagaatttgttagagta240aatagtaaaataaagccctagcgttatagcgttttacactgatgaagaaatgtttctatt300ctgacatcataaaatcattctcactgatgctattgtcacttttcatcacgtgtgtattta360agtagctcttacgtaattttgaaaaaaaaggaaaaaggaaactatatagcacgcaattcc420ctatttggttgcaattcaattccgtgaaacccttttcttttctaaagtgataataaagta480actttgcaatataatcaggtcgcaaatatacccacagataataatctaccgcgcgctaca540ttacagttaatgcctccagcaacctgtagtgcttctttaaa581<210>6<211>1290<212>dna<213>artificialsequence<400>6ggaaaagttgtaaatattattggtagtattcgtttggtaaagtagagggggtaatttttc60ccctttattttgttcatacattcttaaattgctttgcctctccttttggaaagctatact120tcggagcactgttgagcgaaggctcattagatatattttctgtcattttccttaacccaa180aaataagggaaagggtccaaaaagcgctcggacaactgttgaccgtgatccgaaggactg240gctatacagtgttcacaaaatagccaagctgaaaataatgtgtagctatgttcagttagt300ttggctagcaaagatataaaagcaggtcggaaatatttatgggcattattatgcagagca360tcaacatgataaaaaaaaacagttgaatattccctcaaaaatgtcgaaagctacatataa420ggaacgtgctgctactcatcctagtcctgttgctgccaagctatttaatatcatgcacga480aaagcaaacaaacttgtgtgcttcattggatgttcgtaccaccaaggaattactggagtt540agttgaagcattaggtcccaaaatttgtttactaaaaacacatgtggatatcttgactga600tttttccatggagggcacagttaagccgctaaaggcattatccgccaagtacaatttttt660actcttcgaagacagaaaatttgctgacattggtaatacagtcaaattgcagtactctgc720gggtgtatacagaatagcagaatgggcagacattacgaatgcacacggtgtggtgggccc780aggtattgttagcggtttgaagcaggcggcagaagaagtaacaaaggaacctagaggcct840tttgatgttagcagaattgtcatgcaagggctccctatctactggagaatatactaaggg900tactgttgacattgcgaagagcgacaaagattttgttatcggctttattgctcaaagaga960catgggtggaagagatgaaggttacgattggttgattatgacacccggtgtgggtttaga1020tgacaagggagacgcattgggtcaacagtatagaaccgtggatgatgtggtctctacagg1080atctgacattattattgttggaagaggactatttgcaaagggaagggatgctaaggtaga1140gggtgaacgttacagaaaagcaggctgggaagcatatttgagaagatgcggccagcaaaa1200ctaagtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttc1260cagtcggtcacacaggaaacagctatgacc1290<210>7<211>376<212>dna<213>artificialsequence<400>7aaagaaagtggaatattcattcatatcatattttttctattaactgcctggtttctttta60aattttttattggttgtcgacttgaacggagtgacaatatatatatatatatatttaata120atgacatcattatctgtaaatctgattcttaatgctattctagttatgtaagagtggtcc180tttccataaaaaaaaaaaaaaagaaaaaagaattttaggaatacaatgcagcttgtaagt240aaaatctggaatattcatatcgccacaacttcttatgcttataaaagcactaatgcctgg300cgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggacgacgttg360taaaacgacggccagt376<210>8<211>1604<212>dna<213>artificialsequence<400>8ggaaaagttgtaaatattattggtagtattcgtttggtaaagtagagggggtaatttttc60ccctttattttgttcatacattcttaaattgctttgcctctccttttggaaagctatact120tcggagcactgttgagcgaaggctcattagatatattttctgtcattttccttaacccaa180aaataagggaaagggtccaaaaagcgctcggacaactgttgaccgtgatccgaaggactg240gctatacagtgttcacaaaatagccaagctgaaaataatgtgtagctatgttcagttagt300ttggctagcaaagatataaaagcaggtcggaaatatttatgggcattattatgcagagca360tcaacatgataaaaaaaaacagttgaatattccctcaaaaatgtcgaaagctacatataa420ggaacgtgctgctactcatcctagtcctgttgctgccaagctatttaatatcatgcacga480aaagcaaacaaacttgtgtgcttcattggatgttcgtaccaccaaggaattactggagtt540agttgaagcattaggtcccaaaatttgtttactaaaaacacatgtggatatcttgactga600tttttccatggagggcacagttaagccgctaaaggcattatccgccaagtacaatttttt660actcttcgaagacagaaaatttgctgacattggtaatacagtcaaattgcagtactctgc720gggtgtatacagaatagcagaatgggcagacattacgaatgcacacggtgtggtgggccc780aggtattgttagcggtttgaagcaggcggcagaagaagtaacaaaggaacctagaggcct840tttgatgttagcagaattgtcatgcaagggctccctatctactggagaatatactaaggg900tactgttgacattgcgaagagcgacaaagattttgttatcggctttattgctcaaagaga960catgggtggaagagatgaaggttacgattggttgattatgacacccggtgtgggtttaga1020tgacaagggagacgcattgggtcaacagtatagaaccgtggatgatgtggtctctacagg1080atctgacattattattgttggaagaggactatttgcaaagggaagggatgctaaggtaga1140gggtgaacgttacagaaaagcaggctgggaagcatatttgagaagatgcggccagcaaaa1200ctaaacgcacagatattataacatctgcacaataggcatttgcaagaattactcgtgagt1260aaggaaagagtgaggaactatcgcatacctgcatttaaagatgccgatttgggcgcgaat1320cctttattttggcttcaccctcatactattatcagggccagaaaaaggaagtgtttccct1380ccttcttgaattgatgttaccctcataaagcacgtggcctcttatcgagaaagaaattac1440cgtcgctcgtgatttgtttgcaaaaagaacaaaactgaaaaaacccagacacgctcgact1500tcctgtcttcctattgattgcagcttccaatttcgtcacacaacaaggtcctagcgacgg1560ctcacaggttttgtaacaagcaatcgaaggttctggaatggcgg1604<210>9<211>499<212>dna<213>artificialsequence<400>9agtctaggtccctatttatttttttatagttatgttagtattaagaacgttatttatatt60tcaaatttttcttttttttctgtacagacgcgtgtacgcatgtaacattatactgaaaac120cttgcttgagaaggttttgggacgctcgaaggctttaatttgcaagctgcggccctgcat180taatgaatcggccaacgcgcaaagaaagtggaatattcattcatatcatattttttctat240taactgcctggtttcttttaaattttttattggttgtcgacttgaacggagtgacaatat300atatatatatatatttaataatgacatcattatctgtaaatctgattcttaatgctattc360tagttatgtaagagtggtcctttccataaaaaaaaaaaaaaagaaaaaagaattttagga420atacaatgcagcttgtaagtaaaatctggaatattcatatcgccacaacttcttatgctt480ataaaagcactaatgcctg499<210>10<211>1463<212>dna<213>artificialsequence<400>10caagtttgtgtaatagatagcgttatattatagaactataaaggtccttgaatatacata60gtgtttcattcctattactgtatatgtgactttacattgttacttccgcggctatttgac120gttttctgcttcaggtgcggcttggagggcaaagtgtcagaaaatcggccaggccgtatg180acacaaaagagtagaaaacgagatctcaaatatctcgaggcctgtcctctatacaaccgc240ccagctctctgacaaagctccagaacggttgtcttttgtttcgaaaagccaaggtccctt300ataattgccctccattttgtgtcacctatttaagcaaaaaattgaaagtttactaacctt360tcattaaagagaaataacaatattataaaaagcgcttaaaatgacagagcagaaagccct420agtaaagcgtattacaaatgaaaccaagattcagattgcgatctctttaaagggtggtcc480cctagcgatagagcactcgatcttcccagaaaaagaggcagaagcagtagcagaacaggc540cacacaatcgcaagtgattaacgtccacacaggtatagggtttctggaccatatgataca600tgctctggccaagcattccggctggtcgctaatcgttgagtgcattggtgacttacacat660agacgaccatcacaccactgaagactgcgggattgctctcggtcaagcttttaaagaggc720cctaggggccgtgcgtggagtaaaaaggtttggatcaggatttgcgcctttggatgaggc780actttccagagcggtggtagatctttcgaacaggccgtacgcagttgtcgaacttggttt840gcaaagggagaaagtaggagatctctcttgcgagatgatcccgcattttcttgaaagctt900tgcagaggctagcagaattaccctccacgttgattgtctgcgaggcaagaatgatcatca960ccgtagtgagagtgcgttcaaggctcttgcggttgccataagagaagccacctcgcccaa1020tggtaccaacgatgttccctccaccaaaggtgttcttatgtagacgcacagatattataa1080catctgcacaataggcatttgcaagaattactcgtgagtaaggaaagagtgaggaactat1140cgcatacctgcatttaaagatgccgatttgggcgcgaatcctttattttggcttcaccct1200catactattatcagggccagaaaaaggaagtgtttccctccttcttgaattgatgttacc1260ctcataaagcacgtggcctcttatcgagaaagaaattaccgtcgctcgtgatttgtttgc1320aaaaagaacaaaactgaaaaaacccagacacgctcgacttcctgtcttcctattgattgc1380agcttccaatttcgtcacacaacaaggtcctagcgacggctcacaggttttgtaacaagc1440aatcgaaggttctggaatggcgg1463<210>11<211>616<212>dna<213>artificialsequence<400>11agtctaggtccctatttatttttttatagttatgttagtattaagaacgttatttatatt60tcaaatttttcttttttttctgtacagacgcgtgtacgcatgtaacattatactgaaaac120cttgcttgagaaggttttgggacgctcgaaggctttaatttgcaagctgcggccctgcat180taatgaatcggccaacgcgcataaactaatgattttaaatcgttaaaaaaatatgcgaat240tctgtggatcgaacacaggacctccagataacttgaccgaagttttttcttcagtctggc300gctctcccaactgagctaaatccgcttactatttgttatcagttcccttcatatctacat360agaataggttaagtattttattagttgccagaagaactactgatagttgggaatatttgg420tgaataatgaagattgggtgaataatttgataattttgagattcaattgttaatcaatgt480tacaatattatgtatacagagtatactagaagttctcttcggagatcttgaagttcacaa540aagggaatcgatatttctacataatattatcattacttcttccccatcttatatttgtca600ttcattattgattatg616<210>12<211>1775<212>dna<213>artificialsequence<400>12gcgcaagttttccgctttgtaatatatatttatacccctttcttctctcccctgcaatat60aatagtttaattctaatattaataatatcctatattttcttcatttaccggcgcactctc120gcccgaacgacctcaaaatgtctgctacattcataataaccaaaagctcataactttttt180ttttgaacctgaatatatatacatcacatatcactgctggtccttgccgaccagcgtata240caatctcgatagttggtttcccgttctttccactcccgtcatgtctgcccctaagaagat300cgtcgttttgccaggtgaccacgttggtcaagaaatcacagccgaagccattaaggttct360taaagctatttctgatgttcgttccaatgtcaagttcgatttcgaaaatcatttaattgg420tggtgctgctatcgatgctacaggtgttccacttccagatgaggcgctggaagcctccaa480gaaggctgatgccgttttgttaggtgctgtgggtggtcctaaatggggtaccggtagtgt540tagacctgaacaaggtttactaaaaatccgtaaagaacttcaattgtacgccaacttaag600accatgtaactttgcatccgactctcttttagacttatctccaatcaagccacaatttgc660taaaggtactgacttcgttgttgtcagagaattagtgggaggtatttactttggtaagag720aaaggaagacgatggtgatggtgtcgcttgggatagtgaacaatacaccgttccagaagt780gcaaagaatcacaagaatggccgctttcatggccctacaacatgagccaccattgcctat840ttggtccttggataaagctaatgttttggcctcttcaagattatggagaaaaactgtgga900ggaaaccatcaagaacgaattccctacattgaaggttcaacatcaattgattgattctgc960cgccatgatcctagttaagaacccaacccacctaaatggtattataatcaccagcaacat1020gtttggtgatatcatctccgatgaagcctccgttatcccaggttccttgggtttgttgcc1080atctgcgtccttggcctctttgccagacaagaacaccgcatttggtttgtacgaaccatg1140ccacggttctgctccagatttgccaaagaataaggtcaaccctatcgccactatcttgtc1200tgctgcaatgatgttgaaattgtcattgaacttgcctgaagaaggtaaggccattgaaga1260tgcagttaaaaaggttttggatgcaggtatcagaactggtgatttaggtggttccaacag1320taccaccgaagtcggtgatgctgtcgccgaagaagttaagaaaatccttgcttaaacgca1380cagatattataacatctgcacaataggcatttgcaagaattactcgtgagtaaggaaaga1440gtgaggaactatcgcatacctgcatttaaagatgccgatttgggcgcgaatcctttattt1500tggcttcaccctcatactattatcagggccagaaaaaggaagtgtttccctccttcttga1560attgatgttaccctcataaagcacgtggcctcttatcgagaaagaaattaccgtcgctcg1620tgatttgtttgcaaaaagaacaaaactgaaaaaacccagacacgctcgacttcctgtctt1680cctattgattgcagcttccaatttcgtcacacaacaaggtcctagcgacggctcacaggt1740tttgtaacaagcaatcgaaggttctggaatggcgg1775<210>13<211>532<212>dna<213>artificialsequence<400>13agtctaggtccctatttatttttttatagttatgttagtattaagaacgttatttatatt60tcaaatttttcttttttttctgtacagacgcgtgtacgcatgtaacattatactgaaaac120cttgcttgagaaggttttgggacgctcgaaggctttaatttgcaagctgcggccctgcat180taatgaatcggccaacgcgcaagcatcttgccctgtgcttggcccccagtgcagcgaacg240ttataaaaacgaatactgagtatatatctatgtaaaacaaccatatcatttcttgttctg300aactttgtttacctaactagttttaaatttccctttttcgtgcatgcgggtgttcttatt360tattagcatactacatttgaaatatcaaatttccttagtagaaaagtgagagaaggtgca420ctgacacaaaaaataaaatgctacgtataactgtcaaaactttgcagcagcgggcatcct480tccatcatagcttcaaacatattagcgttcctgatcttcatacccgtgctca532<210>14<211>1535<212>dna<213>artificialsequence<400>14ttcactaccctttttccatttgccatctattgaagtaataataggcgcatgcaacttctt60ttctttttttttcttttctctctcccccgttgttgtctcaccatatccgcaatgacaaaa120aaatgatggaagacactaaaggaaaaaattaacgacaaagacagcaccaacagatgtcgt180tgttccagagctgatgaggggtatctcgaagcacacgaaactttttccttccttcattca240cgcacactactctctaatgagcaacggtatacggccttccttccagttacttgaatttga300aataaaaaaaagtttgctgtcttgctatcaagtataaatagacctgcaattattaatctt360ttgtttcctcgtcattgttctcgttccctttcttccttgtttctttttctgcacaatatt420tcaagctataccaagcatacaatcaactatctcatatacaatgtctgttattaatttcac480aggtagttctggtccattggtgaaagtttgcggcttgcagagcacagaggccgcagaatg540tgctctagattccgatgctgacttgctgggtattatatgtgtgcccaatagaaagagaac600aattgacccggttattgcaaggaaaatttcaagtcttgtaaaagcatataaaaatagttc660aggcactccgaaatacttggttggcgtgtttcgtaatcaacctaaggaggatgttttggc720tctggtcaatgattacggcattgatatcgtccaactgcatggagatgagtcgtggcaaga780ataccaagagttcctcggtttgccagttattaaaagactcgtatttccaaaagactgcaa840catactactcagtgcagcttcacagaaacctcattcgtttattcccttgtttgattcaga900agcaggtgggacaggtgaacttttggattggaactcgatttctgactgggttggaaggca960agagagccccgaaagcttacattttatgttagctggtggactgacgccagaaaatgttgg1020tgatgcgcttagattaaatggcgttattggtgttgatgtaagcggaggtgtggagacaaa1080tggtgtaaaagactctaacaaaatagcaaatttcgtcaaaaatgctaagaaatagacgca1140cagatattataacatctgcacaataggcatttgcaagaattactcgtgagtaaggaaaga1200gtgaggaactatcgcatacctgcatttaaagatgccgatttgggcgcgaatcctttattt1260tggcttcaccctcatactattatcagggccagaaaaaggaagtgtttccctccttcttga1320attgatgttaccctcataaagcacgtggcctcttatcgagaaagaaattaccgtcgctcg1380tgatttgtttgcaaaaagaacaaaactgaaaaaacccagacacgctcgacttcctgtctt1440cctattgattgcagcttccaatttcgtcacacaacaaggtcctagcgacggctcacaggt1500tttgtaacaagcaatcgaaggttctggaatggcgg1535<210>15<211>613<212>dna<213>artificialsequence<400>15agtctaggtccctatttatttttttatagttatgttagtattaagaacgttatttatatt60tcaaatttttcttttttttctgtacagacgcgtgtacgcatgtaacattatactgaaaac120cttgcttgagaaggttttgggacgctcgaaggctttaatttgcaagctgcggccctgcat180taatgaatcggccaacgcgcgcgaatttcttatgatttatgatttttattattaaataag240ttataaaaaaaataagtgtatacaaattttaaagtgactcttaggttttaaaacgaaaat300tcttattcttgagtaactctttcctgtaggtcaggttgctttctcaggtatagcatgagg360tcgctcttattgaccacacctctaccggcatgccgagcaaatgcctgcaaatcgctcccc420atttcacccaattgtagatatgctaactccagcaatgagttgatgaatctcggtgtgtat480tttatgtcctcagaggacaacacctgttgtaatcgttcttccacacggatccacagccta540gccttcagttgggctctatcttcatcgtcattcattgcatctactagccccttacctgag600cttcaagacgtta613<210>16<211>3072<212>dna<213>artificialsequence<400>16ctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccttaatt60aaacgcacagatattataacatctgcacaataggcatttgcaagaattactcgtgagtaa120ggaaagagtgaggaactatcgcatacctgcatttaaagatgccgatttgggcgcgaatcc180tttattttggcttcaccctcatactattatcagggccagaaaaaggaagtgtttccctcc240ttcttgaattgatgttaccctcataaagcacgtggcctcttatcgagaaagaaattaccg300tcgctcgtgatttgtttgcaaaaagaacaaaactgaaaaaacccagacacgctcgacttc360ctgtcttcctattgattgcagcttccaatttcgtcacacaacaaggtcctagcgacggct420cacaggttttgtaacaagcaatcgaaggttctggaatggcgggaaagggtttagtaccac480atgctatgatgcccactgtgatctccagagcaaagttcgttcgatcgtactgttactctc540tctctttcaaacagaattgtccgaatcgtgtgacaacaacagcctgttctcacacactct600tttcttctaaccaagggggtggtttagtttagtagaacctcgtgaaacttacatttacat660atatataaacttgcataaattggtcaatgcaagaaatacatatttggtcttttctaattc720gtagtttttcaagttcttagatgctttctttttctcttttttacagatcatcaaggaagt780aattatctactttttacaacaaatataaaacaatggatctccctacagcaactgatatca840atgaaaaacccaaattgtccaaggaagaacaagatccacgcaatttcgtaaagttaatga900acgatcagaatcgaaatgaattgatcatcttttatggttctcaaactggtactggtgaag960actatgcgcaacgcttgggaaaggaatgcaagaagcgattcaacatacaaccaatggtgg1020ccgatctagaaaactatgatcttggctatttggatacactccccaaggaaacgattgccg1080tgtttgttatctctacttatggtgaaggcgaccctacggatagtgcagtcaacttttggg1140aactcttgaacaaggatgtacctaccttctctaaaggttgcgcggtggaacgacctctta1200aagatttacgctactttgtctttgggcttggcaatcgaacgtatgaatactttaatggag1260cagctattggagtggataaacaacttactcagcttggtgcaacacgattgggcgaagtag1320gaatgggggatgatgataactctttggaagacgattttattcaatggcaagatcaagtat1380ggcctttattagcggatgctttagcgacaagcacggatacagtggatgaacaagcacaag1440cacaacatgcgtacaaggtgatgatgggccaagaaaaggaagatgaatcattttactata1500tgggtgagcttggcgatactcagcttacaacatggagtgcgaagcgaccttaccctgcac1560ctgtcaagattcatgacctcacacctgcttctcgtgatcaacgtcattgcttacacctgg1620atgtggacttgtccaacagcaacatctcttatactactggcgatcatctcggtatttggc1680ctacgaacaacgaagacgaagtgtttttggtatctagtctttttggttggaatgacgctt1740atctggatcaagtaatcaatgttgttcccacagattccaccaacaaacctccattccccc1800agcctaccaccttacggtctgctcttcgtcattacttggatattgctcaacttccttctc1860gatctactcttgatttactgcttccttcttgctcaaacgacagcctaaagtctttcttac1920agaacttggtcaacgataaagatgaacacaagcgggtggtattggatcaagttcgtaacc1980tgggccagcttctctcttttgctttggaaactattggatccacgactactgatggtgctt2040tgaaggatatacccgtggaagttgtattggaatgctactctcggcttcaacctcgttatt2100actctatatcatcatcatccagcgaatcagcaactacagttagtgcgaccgctgtcactt2160tgaaatacaacccaactcctgatcgaactgtatatggcgtgaacaccaattacctttggg2220cgatccatcaatcaatgtcatcgactccatcatcggatgtgccaaagtatgtagtggatg2280ggccgcgtcaacaatatctgatcaccaaggaagccaacagcgactcgattaaaatcaaga2340ttcctgtacatattcgcaaatccaccttccgtctacctccttcatcaagcactcctgtca2400ttatggttggtcctggtactggtgttgctcctttccgtggatttgtacgtgaacgtgtct2460accaaaagcaagtcttgggcgaagatgttggtgctactgtcctcttctttggctgccgac2520gatccaccgaagactatctttatgctgacgaatggccaagattattcaagtccctgggaa2580atggtccttctagaatcatcaccgccttctctagagaatctgaagaaaagaaggtctacg2640tacagcaacgactagccgaacatggacaggaaatgtgggacttgttggcaaatcaagggg2700cttacttttatgtctgtggtgatgcaaagtatatggcgaaggatgtgcaacaaaccgtga2760tcgacatggcaaagtcttttggtggtcttggcgataacgaagctactacctttattcaag2820aattacggaaatccaatcgatatgtggaagacgtgtgggcatagagttataaaaaaaata2880agtgtatacaaattttaaagtgactcttaggttttaaaacgaaaattcttattcttgagt2940aactctttcctgtaggtcaggttgctttctcaggtatagcatgaggtcgctcttattgac3000cacacctctaccggcatgccgattaattaaagtgatcccccacacaccatagcttcaaaa3060tgtttctactcc3072<210>17<211>1766<212>dna<213>artificialsequence<400>17gtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagt60cggtcacacaggaaacagctatgaccatactagcgttgaatgttagcgtcaacaacaaga120agtttaatgacgcggaggccaaggcaaaaagattccttgattacgtaagggagttagaat180cattttgaataaaaaacacgctttttcagttcgagtttatcattatcaatactgccattt240caaagaatacgtaaataattaatagtagtgattttcctaactttatttagtcaaaaaatt300agccttttaattctgctgtaacccgtacatgcccaaaatagggggcgggttacacagaat360atataacatcgtaggtgtctgggtgaacagtttattcctggcatccactaaatataatgg420agcccgctttttaagctggcatccagaaaaaaaaagaatcccagcaccaaaatattgttt480tcttcaccaaccatcagttcataggtccattctcttagcgcaactacagagaacaggggc540acaaacaggcaaaaaacgggcacaacctcaatggagtgatgcaacctgcctggagtaaat600gatgacacaaggcaattgacccacgcatgtatctatctcattttcttacaccttctatta660ccttctgctctctctgatttggaaaaagctgaaaaaaaaggttgaaaccagttccctgaa720attattcccctacttgactaataagtatataaagacggtaggtattgattgtaattctgt780aaatctatttcttaaacttcttaaattctacttttatagttagtcttttttttagtttta840aaacaccaagaacttagtttcgaataaacacacataaacaaacaaaatgtccaaagtcta900ttctactgctgatgtcaatgcccaccaaacccgtggtgacctttgggttgtgattcacaa960caaggtttacgatattaccgaattcgttcttgaacatcctggtggtgaagaagtcttgct1020cgacgaagctggtaaggatgctactgaatccttcgaagacattggccactctgacgaagc1080tcgctacattttggaaaagtacctcattggtgaattggatgctgcttctcgtgttgacaa1140ccacaagtttgatcccatccgtgctggagaactccctgaacaaaagcaatctggatctgc1200cctccgtgtgatcatccctgctcttgctgttgccggtgtccttgtctacaagtttatcct1260ctccaacaagaactaggattaatataattatataaaaatattatcttcttttctttatat1320ctagtgttatgtaaaataaattgatgactacggaaagcttttttatattgtttctttttc1380attctgagccacttaaatttcgtgaatgttcttgtaagggacggtagatttacaagtgat1440acaacaaaaagcaaggcgctttttctaataaaaagaagaaaagcatttaacaattgaaca1500cctctatatcaacgaagaatattactttgtctctaaatccttgtaaaatgtgtacgatct1560ctatatgggttactcataagtgtaccgaagactgcattgaaagtttatgttttttcactg1620gaggcgtcattttcgcgttgagaagatgttcttatccaaatttcaactgttatatagaac1680tggccgtcgttttacaacgtcgtccattcaggctgcgcaactgttgggaagggcgatcgg1740tgcgggcctcttcgctattacgccag1766<210>18<211>2445<212>dna<213>artificialsequence<400>18ggtatagcatgaggtcgctcttattgaccacacctctaccggcatgccgattaattaaag60tgatcccccaagtgatcccccacacaccatagcttcaaaatgtttctactccttttttac120tcttccagattttctcggactccgcgcatcgccgtaccacttcaaaacacccaagcacag180catactaaatttcccctctttcttcctctagggtgtcgttaattacccgtactaaaggtt240tggaaaagaaaaaagagaccgcctcgtttctttttcttcgtcgaaaaaggcaataaaaat300ttttatcacgtttctttttcttgaaaatttttttttttgatttttttctctttcgatgac360ctcccattgatatttaagttaataaacggtcttcaatttctcaagtttcagtttcatttt420tcttgttctattacaactttttttacttcttgctcattagaaagaaagcatagcaatcta480atctaagttttaattacaaaatgcttacagagtacattcatcattttatcaacaactttg540atcaaaagaagactatggatcaattacaaaccatggtgtcatccaaagaaggtatgatcg600gtttggccacagctgcagtccttatgtctggtgcagccgtttacaaatcaaccaggatcg660aacggggatgccctcaagtacctaaccagtcctactttatgggatctacaaaagaatatc720gcaacaaccctgctgcattcatcgagaaatgggaaaaggaactgggccctgtttatggtg780cttatttgtttggtcagtatactactgttgtctctggtcctcaagtgcgcgaagtattct840tgaacgatgactttgactttattgctggcatccgacgagactttgataccaacttgttat900caaatggcggcgatcttcgagacttgcctgtacacaagtttgcgggtagtatcaagaaga960acctcagccccaaactcccattctacaccagccgcgtgattgaacatctcaagattggat1020taaaggaattctgtggagtagtgccagatgaaggaaaggaattcgatcatgtgtatccct1080tggtgcaacatatggtagccaaagctagtgcatccgtctttgtgggtcctgaattagcca1140agaatgaacaattgatcgactcgtttaagaatatggtcctcgaagtgggatctgaattag1200cccccaagccttatttagaattcttccctaatctgatgcgtctacgaatgtggtttattg1260gcaaaacgtcacaaaaggtcaagagacatcgggatcagcttcgtgcggccttggcacctc1320aagtggaatatcgactcaaggctatgaaggaaaacgatagcaactgggatcgacctaacg1380actttttacaagatattctggaaagcggcgatatcccagctcatgtggatgtcacggatc1440attgttgcgattggatgacacaaattatctttgcagctctacacacaaccagtgaaaacg1500gcacattatccttctatcgcttattggataacccaaaggtgttggaagatttactggaag1560aacaaaatcaagtgttggaagatgcaggctatgatagctccgttggccctgaagtcttta1620cccgggaaatcctcaacaaattcgtcaagatggatagtgtgattcgtgaaacgagtcgac1680tacgaaacgactatatcggtctccctcacaagaatattagctcaaagacaattacattat1740cagggggtgctatgatccgtccaggtgaacgtgcttatgtgaatgcttattccaaccatc1800gtgatggaactatccaaaaagtgacggacaacttaaaatcatttgaaccctaccgatttg1860taaaccaagacaggaactctacaaagattggtgaagactttatattctttggaatgggta1920aacatgcctgtcctggtcgatggttcgccattcaagaaattaaaacgattattgccatga1980tgatccgaagctaccaattatctgcccttggtcctgttaccttccccaccgatgactatt2040ccagaatacccatgggtcgattcaagattgtgccaagaaagtaaccgctgatcctagagg2100gccgcatcatgtaattagttatgtcacgcttacattcacgccctccccccacatccgctc2160taaccgaaaaggaaggagttagacaacctgaagtctaggtccctatttatttttttatag2220ttatgttagtattaagaacgttatttatatttcaaatttttcttttttttctgtacagac2280gcgtgtacgcatgtaacattatactgaaaaccttgcttgagaaggttttgggacgctcga2340aggctttaatttgcaagctgcggccctgcattaatgaatcggccaacgcgccagggtttt2400cccagtcacgacgttgtaaaacgacggccagtgaattgtaatacg2445<210>19<211>683<212>prt<213>artificialsequence<400>19metaspleuprothralathraspileasnglulysprolysleuser151015lysglugluglnaspproargasnphevallysleumetasnaspgln202530asnargasngluleuileilephetyrglyserglnthrglythrgly354045gluasptyralaglnargleuglylysglucyslyslysargpheasn505560ileglnprometvalalaaspleugluasntyraspleuglytyrleu65707580aspthrleuprolysgluthrilealavalphevalileserthrtyr859095glygluglyaspprothraspseralavalasnphetrpgluleuleu100105110asnlysaspvalprothrpheserlysglycysalavalgluargpro115120125leulysaspleuargtyrphevalpheglyleuglyasnargthrtyr130135140glutyrpheasnglyalaalaileglyvalasplysglnleuthrgln145150155160leuglyalathrargleuglygluvalglymetglyaspaspaspasn165170175serleugluaspasppheileglntrpglnaspglnvaltrpproleu180185190leualaaspalaleualathrserthraspthrvalaspgluglnala195200205glnalaglnhisalatyrlysvalmetmetglyglnglulysgluasp210215220gluserphetyrtyrmetglygluleuglyaspthrglnleuthrthr225230235240trpseralalysargprotyrproalaprovallysilehisaspleu245250255thrproalaserargaspglnarghiscysleuhisleuaspvalasp260265270leuserasnserasnilesertyrthrthrglyasphisleuglyile275280285trpprothrasnasngluaspgluvalpheleuvalserserleuphe290295300glytrpasnaspalatyrleuaspglnvalileasnvalvalprothr305310315320aspserthrasnlyspropropheproglnprothrthrleuargser325330335alaleuarghistyrleuaspilealaglnleuproserargserthr340345350leuaspleuleuleuprosercysserasnaspserleulysserphe355360365leuglnasnleuvalasnasplysaspgluhislysargvalvalleu370375380aspglnvalargasnleuglyglnleuleuserphealaleugluthr385390395400ileglyserthrthrthraspglyalaleulysaspileprovalglu405410415valvalleuglucystyrserargleuglnproargtyrtyrserile420425430sersersersersergluseralathrthrvalseralathralaval435440445thrleulystyrasnprothrproaspargthrvaltyrglyvalasn450455460thrasntyrleutrpalailehisglnsermetserserthrproser465470475480seraspvalprolystyrvalvalaspglyproargglnglntyrleu485490495ilethrlysglualaasnseraspserilelysilelysileproval500505510hisilearglysserthrpheargleuproproserserserthrpro515520525valilemetvalglyproglythrglyvalalapropheargglyphe530535540valarggluargvaltyrglnlysglnvalleuglygluaspvalgly545550555560alathrvalleuphepheglycysargargserthrgluasptyrleu565570575tyralaaspglutrpproargleuphelysserleuglyasnglypro580585590serargileilethralapheserargglusergluglulyslysval595600605tyrvalglnglnargleualagluhisglyglnglumettrpaspleu610615620leualaasnglnglyalatyrphetyrvalcysglyaspalalystyr625630635640metalalysaspvalglnglnthrvalileaspmetalalysserphe645650655glyglyleuglyaspasnglualathrthrpheileglngluleuarg660665670lysserasnargtyrvalgluaspvaltrpala675680<210>20<211>129<212>prt<213>artificialsequence<400>20metserlysvaltyrserthralaaspvalasnalahisglnthrarg151015glyaspleutrpvalvalilehisasnlysvaltyraspilethrglu202530phevalleugluhisproglyglyglugluvalleuleuaspgluala354045glylysaspalathrgluserphegluaspileglyhisseraspglu505560alaargtyrileleuglulystyrleuileglygluleuaspalaala65707580serargvalaspasnhislyspheaspproileargalaglygluleu859095progluglnlysglnserglyseralaleuargvalileileproala100105110leualavalalaglyvalleuvaltyrlyspheileleuserasnlys115120125asn<210>21<211>527<212>prt<213>artificialsequence<400>21metleuthrglutyrilehishispheileasnasnpheaspglnlys151015lysthrmetaspglnleuglnthrmetvalserserlysgluglymet202530ileglyleualathralaalavalleumetserglyalaalavaltyr354045lysserthrargilegluargglycysproglnvalproasnglnser505560tyrphemetglyserthrlysglutyrargasnasnproalaalaphe65707580ileglulystrpglulysgluleuglyprovaltyrglyalatyrleu859095pheglyglntyrthrthrvalvalserglyproglnvalarggluval100105110pheleuasnaspasppheasppheilealaglyileargargaspphe115120125aspthrasnleuleuserasnglyglyaspleuargaspleuproval130135140hislysphealaglyserilelyslysasnleuserprolysleupro145150155160phetyrthrserargvalilegluhisleulysileglyleulysglu165170175phecysglyvalvalproaspgluglylysglupheasphisvaltyr180185190proleuvalglnhismetvalalalysalaseralaservalpheval195200205glyprogluleualalysasngluglnleuileaspserphelysasn210215220metvalleugluvalglysergluleualaprolysprotyrleuglu225230235240phepheproasnleumetargleuargmettrppheileglylysthr245250255serglnlysvallysarghisargaspglnleuargalaalaleuala260265270proglnvalglutyrargleulysalametlysgluasnaspserasn275280285trpaspargproasnasppheleuglnaspileleugluserglyasp290295300ileproalahisvalaspvalthrasphiscyscysasptrpmetthr305310315320glnileilephealaalaleuhisthrthrsergluasnglythrleu325330335serphetyrargleuleuaspasnprolysvalleugluaspleuleu340345350glugluglnasnglnvalleugluaspalaglytyraspserserval355360365glyprogluvalphethrarggluileleuasnlysphevallysmet370375380aspservalilearggluthrserargleuargasnasptyrilegly385390395400leuprohislysasnileserserlysthrilethrleuserglygly405410415alametileargproglygluargalatyrvalasnalatyrserasn420425430hisargaspglythrileglnlysvalthraspasnleulysserphe435440445gluprotyrargphevalasnglnaspargasnserthrlysilegly450455460gluasppheilephepheglymetglylyshisalacysproglyarg465470475480trpphealaileglngluilelysthrileilealametmetilearg485490495sertyrglnleuseralaleuglyprovalthrpheprothraspasp500505510tyrserargileprometglyargphelysilevalproarglys515520525当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1