以突变的筛选剂抗性基因为报告体系的C·T碱基替换的细胞富集技术及其应用的制作方法

文档序号:19658491发布日期:2020-01-10 20:46阅读:292来源:国知局
以突变的筛选剂抗性基因为报告体系的C·T碱基替换的细胞富集技术及其应用的制作方法
本发明涉及生物
技术领域
,具体涉及以突变的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用。
背景技术
:crispr-cas9技术已经成为强有力的基因组编辑手段,被广泛应用到很多组织和细胞中。crispr/cas9protein-rna复合物通过向导rna(guiderna)定位于靶点上,切割产生dna双链断裂(dsdnabreak,dsb),而后生物体会本能的启动dna修复机制修复dsb。修复机制一般有两种,一种是非同源末端连接(non-homologousendjoining,nhej),另一种是同源重组(homology-directedrepair,hdr)。通常情况下nhej占大多数,因此修复产生的随机的indels(insertionsordeletions)比精确修复高很多。对于碱基精确替换,因为hdr效率低以及需要dna模板,所以使用hdr实现碱基精确替换的应用受到很大的限制。2016年,davidliu和akihikokondo两个实验室分别独立报道了两种不同类型的胞嘧啶碱基编辑器(cytosinebaseeditor,cbe),分别使用了两种不同的胞苷脱氨酶rapobec1(ratapobec1)和pmcda1(activation-inducedcytidinedeaminase(aid)orthologfromsealamprey),原理都是通过使用胞苷脱氨酶直接实现对单个胞嘧啶(cytosine,c)碱基进行编辑,而不再通过产生dsb和启动hdr修复,大大提高了c替换为胸腺嘧啶(thymine,t)的碱基编辑效率。具体为deadcas9(dcas9)或thecas9nickase(cas9n)连带着rapobec1或pmcda1通过sgrna定位到靶点,rapobec1或pmcda1催化非配对的单链dna上的c发生胞嘧啶脱氨反应变成尿嘧啶(uracil,u),通过dna的修复使得u与腺嘌呤(adenine,a)配对,又通过dna复制,最终使得t与a配对,从而实现了c到t的转换。在所测试的编辑器中,spcas9n(d10a)&rapobec1/pmcda1&ugi碱基编辑系统(其含有尿嘧啶dna糖化酶抑制剂(uracildnaglycosylaseinhibitor,ugi))的平均突变率较高,原因有二:一是ugi可以抑制尿嘧啶dna糖化酶(uracildnaglycosylase,udg)催化清除dna中u,二是spcas9n(d10a)在非编辑链上产生切口,诱导真核错配修复机制或long-patchber(base-excisionrepair)修复机制,促使u:g错配更多的偏好性修复成u:a。目前,在植物中通过报告基因介导的细胞富集技术富集c·t碱基替换细胞的研究非常有限,目前尚无利用转化过程中使用筛选标记在细胞水平上实现c·t碱基替换细胞的富集,进而提高c·t碱基替换效率的报道。技术实现要素:本发明的目的是提供一种以突变的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术,该细胞富集技术能够在细胞水平上实现c·t碱基替换细胞的富集,进而提高目标靶点的c·t碱基替换效率。为了实现上述目的,本发明首先提供了一种成套试剂,所述成套试剂包括sgrna或与所述sgrna相关的生物材料、c·t碱基替换系统和功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料;所述sgrna由靶向目标基因靶点序列的sgrna和靶向所述功能丧失的筛选剂抗性基因靶点序列的sgrna组成;所述sgrna结构如下:所述靶点序列转录的rna-sgrna骨架;所述c·t碱基替换系统包括cas9核酸酶或与所述cas9核酸酶相关的生物材料和胞嘧啶脱氨酶或与所述胞嘧啶脱氨酶相关的生物材料;所述功能丧失的筛选剂抗性基因为将筛选剂抗性基因进行无功能突变后得到的序列;所述功能丧失的筛选剂抗性基因靶点序列为含有所述突变位点的靶点序列;所述c·t碱基替换系统在靶向所述含有所述突变位点的靶点序列的sgrna的向导下,可通过对所述突变位点进行c·t碱基替换使所述功能丧失的筛选剂抗性基因功能恢复;所述sgrna骨架为s1)或s2)或s3):s1)将序列1第571-646位中的t替换为u得到的rna分子;s2)将s1)所示的rna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的rna分子;s3)与s1)或s2)限定的核苷酸序列具有75%或75%以上同一性且具有相同功能的rna分子。上述成套试剂中,所述sgrna具体可为trna-sgrna;所述trna-sgrna由靶向所述目标基因靶点序列(内源靶点)的trna-sgrna和靶向所述功能丧失的筛选剂抗性基因靶点序列(代理靶点)的trna-sgrna组成;所述trna-sgrna结构如下:trna-所述靶点序列转录的rna-sgrna骨架;所述trna为r1)或r2)或r3):r1)将序列1第474-550位中的t替换为u得到的rna分子;r2)将r1)所示的rna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的rna分子;r3)与r1)或r2)限定的核苷酸序列具有75%或75%以上同一性且具有相同功能的rna分子。上述成套试剂中,靶向所述目标基因靶点序列的个数可为一个或两个或多个;靶向所述功能丧失的筛选剂抗性基因靶点序列的个数可为一个或两个或多个。所述靶点序列大小可为15-25bp,进一步可为18-22bp,更进一步可为20bp。所述无功能突变是指将正常的筛选剂抗性基因序列中的某一个或两个或多个碱基t突变为碱基c而使突变后的筛选剂抗性基因功能丧失,且通过对含有所述突变位点的靶点序列进行c·t碱基替换后可使功能丧失的筛选剂抗性基因功能恢复。进一步的,所述筛选剂抗性基因可为现有技术中常见的筛选剂抗性基因,如bar/pat草铵膦-n-乙酰转移酶基因、pmi6-磷酸甘露糖异构酶基因、epsps5-烯醇丙酮莽草酸-3-磷酸合成酶基因等。在本发明的一个具体实施例中,所述筛选剂抗性基因为潮霉素抗性基因。更进一步的,所述功能丧失的筛选标记基因为将正常的潮霉素抗性基因(序列5)的第272位由t突变为c,且将第274位由t突变为c后得到的序列。所述功能丧失的筛选剂抗性基因靶点的靶序列为序列1第11574-11596位。所述功能丧失的筛选剂抗性基因靶点序列(含有突变位点的靶点序列)为序列1第11574-11593位。所述c·t碱基替换系统在靶向所述含有突变位点的靶点序列的trna-sgrna的向导下,可通过对所述含有突变位点的靶点序列进行c·t碱基替换,使含有突变位点的靶点序列中的第3位和第5位的碱基c均突变为碱基t,进而使筛选标记基因功能恢复。上述成套试剂中,所述c·t碱基替换系统还包括ugi或与所述ugi相关的生物材料。上述成套试剂中,所述cas9核酸酶包括不同来源的cas9核酸酶或其变体、dead失活酶(deadcas9,dcas9)或其变体、nickase切刻酶(cas9nickase,cas9n)或其变体。所述不同来源的cas9核酸酶或其变体包括来源于细菌的cas9(如sacas9、sacas9-kkh等),cas9-pam变体(如xcas9、ngcas9、cas9-vqr、cas9-vrer等),cas9高保真酶变体(如hypacas9、espcas9(1.1)、cas9-hf1等)等。在本发明的一个具体实施例中,所述cas9核酸酶为cas9n,具体为spcas9n蛋白质。在本发明的另一个具体实施例中,所述cas9核酸酶为cas9n,具体为hypacas9n蛋白质。所述胞嘧啶脱氨酶可为hapobe3a蛋白质、humanaid蛋白质、pmcda1蛋白质或rapobec1蛋白质。在本发明的一个具体实施例中,所述胞嘧啶脱氨酶为pmcda1蛋白质。进一步的,所述spcas9n蛋白质为a1)或a2)或a3):a1)氨基酸序列是序列2所示的蛋白质;a2)将序列表中序列2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;a3)在a1)或a2)的n端或/和c端连接标签得到的融合蛋白质;与所述spcas9n相关的生物材料为b1)至b5)中的任一种:b1)编码所述spcas9n的核酸分子;b2)含有b1)所述核酸分子的表达盒;b3)含有b1)所述核酸分子的重组载体、或含有b2)所述表达盒的重组载体;b4)含有b1)所述核酸分子的重组微生物、或含有b2)所述表达盒的重组微生物、或含有b3)所述重组载体的重组微生物;b5)含有b1)所述核酸分子的转基因细胞系、或含有b2)所述表达盒的转基因细胞系;所述pmcda1蛋白质为e1)或e2)或e3):e1)氨基酸序列是序列3所示的蛋白质;e2)将序列表中序列3所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;e3)在e1)或e2)的n端或/和c端连接标签得到的融合蛋白质;与所述pmcda1蛋白质相关的生物材料为f1)至f5)中的任一种:f1)编码所述pmcda1蛋白质的核酸分子;f2)含有f1)所述核酸分子的表达盒;f3)含有f1)所述核酸分子的重组载体、或含有f2)所述表达盒的重组载体;f4)含有f1)所述核酸分子的重组微生物、或含有f2)所述表达盒的重组微生物、或含有f3)所述重组载体的重组微生物;f5)含有f1)所述核酸分子的转基因细胞系、或含有f2)所述表达盒的转基因细胞系;所述ugi蛋白质为i1)或i2)或i3):i1)氨基酸序列是序列4所示的蛋白质;i2)将序列表中序列4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;i3)在i1)或i2)的n端或/和c端连接标签得到的融合蛋白质;与所述ugi蛋白质相关的生物材料为j1)至j5)中的任一种:j1)编码所述ugi蛋白质的核酸分子;j2)含有j1)所述核酸分子的表达盒;j3)含有j1)所述核酸分子的重组载体、或含有j2)所述表达盒的重组载体;j4)含有j1)所述核酸分子的重组微生物、或含有j2)所述表达盒的重组微生物、或含有j3)所述重组载体的重组微生物;j5)含有j1)所述核酸分子的转基因细胞系、或含有j2)所述表达盒的转基因细胞系;与所述功能丧失的筛选剂抗性基因相关的生物材料为k1)至k4)中的任一种:k1)含有所述功能丧失的筛选剂抗性基因的表达盒;k2)含有所述功能丧失的筛选剂抗性基因的重组载体、或含有k1)所述表达盒的重组载体;k3)含有所述功能丧失的筛选剂抗性基因的重组微生物、或含有k1)所述表达盒的重组微生物、或含有k2)所述重组载体的重组微生物;k4)含有所述功能丧失的筛选剂抗性基因的转基因细胞系、或含有k1)所述表达盒的转基因细胞系。为了使a1)、e1)、i1)中的蛋白质便于纯化,可在由序列表中序列2或序列3或序列4所示的氨基酸序列组成的蛋白质的氨基末端或羧基末端连接上如下表所示的标签。表、标签的序列标签残基序列poly-arg5-6(通常为5个)rrrrrpoly-his2-10(通常为6个)hhhhhhflag8dykddddkstrep-tagii8wshpqfekc-myc10eqkliseedl上述a2)、e2)、i2)中的蛋白质,为与序列2或序列3或序列4所示蛋白质的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。所述具有75%或75%以上同一性为具有75%、具有80%、具有85%、具有90%、具有95%、具有96%、具有97%、具有98%或具有99%的同一性。上述a2)、e2)、i2)中的蛋白质可人工合成,也可先合成其编码基因,再进行生物表达得到。上述a2)、e2)、i2)中的蛋白质的编码基因可通过将序列1的第3529-7797位(编码序列2所示的蛋白质)、序列1的第8089-8712位(编码序列3所示的蛋白质)、序列1的第8734-9030位(编码序列4所示的蛋白质)所示的dna序列中缺失一个或几个氨基酸残基的密码子,和/或进行一个或几个碱基对的错义突变,和/或在其5′端和/或3′端连接上表所示的标签的编码序列得到。更进一步的,b1)所述核酸分子为b1)或b2)或b3):b1)序列表中序列1第3529-7797位所示的cdna分子或dna分子;b2)与b1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述spcas9n的cdna分子或dna分子;b3)在严格条件下与b1)或b2)限定的核苷酸序列杂交,且编码所述spcas9n的cdna分子或dna分子;f1)所述核酸分子为f1)或f2)或f3):f1)序列表中序列1第8089-8712位所示的cdna分子或dna分子;f2)与f1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述pmcda1的cdna分子或dna分子;f3)在严格条件下与f1)或f2)限定的核苷酸序列杂交,且编码所述pmcda1的cdna分子或dna分子;j1)所述核酸分子为j1)或j2)或j3):j1)序列表中序列1的第8734-9030位所示的cdna分子或dna分子;j2)与j1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述ugi的cdna分子或dna分子;j3)在严格条件下与j1)或j2)限定的核苷酸序列杂交,且编码所述ugi的cdna分子或dna分子;k1)所述功能丧失的筛选剂抗性基因为序列1第11305-12330位所示的dna分子。其中,所述核酸分子可以是dna,如cdna、基因组dna或重组dna;所述核酸分子也可以是rna,如mrna或hnrna等。本领域普通技术人员可以很容易地采用已知的方法,例如定向进化和点突变的方法,对本发明的编码所述spcas9n或所述pmcda1或所述ugi的核苷酸序列进行突变。那些经过人工修饰的,具有与本发明的所述spcas9n或所述pmcda1或所述ugi的核苷酸序列75%或者更高同一性的核苷酸,只要编码所述spcas9n或所述pmcda1或所述ugi且具有相同功能,均是衍生于本发明的核苷酸序列并且等同于本发明的序列。这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的编码序列2、3或4所示的氨基酸序列组成的蛋白质的核苷酸序列具有75%或更高,或85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。所述严格条件是在2×ssc,0.1%sds的溶液中,在68℃下杂交并洗膜2次,每次5min,又于0.5×ssc,0.1%sds的溶液中,在68℃下杂交并洗膜2次,每次15min;或,0.1×sspe(或0.1×ssc)、0.1%sds的溶液中,65℃条件下杂交并洗膜。上述75%或75%以上同一性,可为80%、85%、90%或95%以上的同一性。b2)所述的含有编码spcas9n蛋白质的核酸分子的表达盒(spcas9n基因表达盒),是指能够在宿主细胞中表达spcas9n蛋白质的dna,该dna不但可包括启动spcas9n基因转录的启动子,还可包括终止spcas9n基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述spcas9n基因表达盒的重组载体。f2)所述的含有编码pmcda1蛋白质的核酸分子的表达盒(pmcda1基因表达盒),是指能够在宿主细胞中表达pmcda1蛋白质的dna,该dna不但可包括启动pmcda1基因转录的启动子,还可包括终止pmcda1基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述pmcda1基因表达盒的重组载体。j2)所述的含有编码ugi蛋白质的核酸分子的表达盒(ugi基因表达盒),是指能够在宿主细胞中表达ugi蛋白质的dna,该dna不但可包括启动ugi基因转录的启动子,还可包括终止ugi基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述ugi基因表达盒的重组载体。所述载体可为质粒、黏粒、噬菌体或病毒载体。在本发明的具体实施例中,所述重组载体具体为sgrna-tp-hyg-tp/sgrna-gt-1重组表达载体或sgrna-tp-hyg-tp/sgrna-gt-2重组表达载体。所述sgrna-tp-hyg-tp/sgrna-gt-1重组表达载体的序列为序列1。所述sgrna-atg-hyg-atg/sgrna-gt-1重组表达载体含有六个靶点序列,序列见表1。所述sgrna-tp-hyg-tp/sgrna-gt-2重组表达载体的序列为将序列1中的前五个靶点序列依次分别替换为如下五个靶点序列als-t3、cdc48-t2、nrt1.1b-t3、nrt1.1b-t2、dep1,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。所述微生物可为酵母、细菌、藻或真菌。其中,所述细菌可为农杆菌,如农杆菌eha105。在本发明的具体实施例中,所述重组微生物具体为含有所述sgrna-tp-hyg-tp/sgrna-gt-1重组表达载体或所述sgrna-tp-hyg-tp/sgrna-gt-2重组表达载体。所述转基因细胞系不包括繁殖材料。上述成套试剂具有如下用途:m1)富集生物体或生物细胞基因组靶点序列发生c·t碱基替换的细胞;m2)制备富集生物体或生物细胞基因组靶点序列发生c·t碱基替换的细胞的产品;m3)提高生物体或生物细胞基因组靶点序列的c·t碱基替换效率;m4)制备提高生物体或生物细胞基因组靶点序列的c·t碱基替换效率的产品;m5)生物体或生物细胞基因组靶点序列中的c·t碱基替换;m6)制备生物体或生物细胞靶点序列中的c·t碱基替换的产品。上述功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料也属于本发明的保护范围。为了实现上述目的,本发明还提供了上述成套试剂或上述功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料的新用途。本发明提供了上述成套试剂或上述功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料在m1)-m6)任一种中的应用:m1)富集生物体或生物细胞基因组靶点序列发生c·t碱基替换的细胞;m2)制备富集生物体或生物细胞基因组靶点序列发生c·t碱基替换的细胞的产品;m3)提高生物体或生物细胞基因组靶点序列的c·t碱基替换效率;m4)制备提高生物体或生物细胞基因组靶点序列的c·t碱基替换效率的产品;m5)生物体或生物细胞基因组靶点序列中的c·t碱基替换;m6)制备生物体或生物细胞靶点序列中的c·t碱基替换的产品。为了实现上述目的,本发明还提供了n1)或n2)或n3)或n4)或n5)所述的方法:n1)富集生物体或生物细胞基因组靶点序列发生c·t碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列c·t碱基替换效率的方法,包括如下步骤:将上述cas9核酸酶的编码基因、转录靶向目标基因靶点序列的sgrna的dna分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgrna的dna分子、胞嘧啶脱氨酶的编码基因、ugi的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内,使所述cas9核酸酶、所述sgrna、所述胞嘧啶脱氨酶和ugi均得到表达;所述cas9核酸酶、所述胞嘧啶脱氨酶和所述ugi在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgrna的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行c·t碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而实现富集筛选剂抗性基因发生c·t碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生c·t碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的c·t碱基替换效率;n2)富集生物体或生物细胞基因组靶点序列发生c·t碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列c·t碱基替换效率的方法,包括如下步骤:将上述cas9核酸酶的编码基因、转录靶向目标基因靶点序列的sgrna的dna分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgrna的dna分子、胞嘧啶脱氨酶的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内,使所述cas9核酸酶、所述sgrna、所述胞嘧啶脱氨酶均得到表达;所述cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgrna的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行c·t碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而富集筛选剂抗性基因发生c·t碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生c·t碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的c·t碱基替换效率;n3)富集生物体或生物细胞基因组靶点序列发生c·t碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列c·t碱基替换效率的方法,包括如下步骤:将上述cas9核酸酶、靶向目标基因靶点序列的sgrna、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgrna、胞嘧啶脱氨酶、ugi和功能丧失的筛选剂抗性基因导入生物体或生物细胞内;所述cas9核酸酶、所述胞嘧啶脱氨酶和所述ugi在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgrna的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行c·t碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而实现富集筛选剂抗性基因发生c·t碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生c·t碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的c·t碱基替换效率;n4)富集生物体或生物细胞基因组靶点序列发生c·t碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列c·t碱基替换效率的方法,包括如下步骤:将上述cas9核酸酶、靶向目标基因靶点序列的sgrna、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgrna、胞嘧啶脱氨酶和功能丧失的筛选剂抗性基因导入生物体或生物细胞内;所述cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgrna的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行c·t碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而富集筛选剂抗性基因发生c·t碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生c·t碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的c·t碱基替换效率;n5)生物突变体的制备方法,包括如下步骤:按照n1)或n2)或n3)或n4)所述的方法对生物体的基因组进行编辑,获得生物突变体;所述生物突变体为发生c·t碱基替换的生物体。上述方法中,所述靶向目标基因靶点序列的sgrna为靶向目标基因靶点序列的trna-sgrna,所述靶向功能丧失的筛选剂抗性基因靶点序列的sgrna为靶向功能丧失的筛选剂抗性基因靶点序列的trna-sgrna。进一步的,所述转录靶向目标基因靶点序列的trna-sgrna的dna分子或所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的trna-sgrna的dna分子转录后得到的trna-sgrna为不成熟的rna前体,该rna前体中的trna会被两种酶(rnasep和rnasez)切割掉后得到成熟的rna。一个重组表达载体中有多少个靶点,就会得到多少个独立的成熟的rna,每个成熟的rna依次由所述靶点序列转录的rna和所述sgrna骨架组成,或依次由所述trna残留的个别碱基、所述靶点序列转录的rna和所述sgrna骨架组成。上述方法中,所述n1)或n3)中,所述ugi的个数可为一个或两个或多个。在本发明的具体实施例中,所述ugi的个数具体为一个。上述方法中,所述n1)中,所述cas9核酸酶的编码基因、所述转录靶向目标基因靶点序列的sgrna的dna分子、所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgrna的dna分子、所述胞嘧啶脱氨酶的编码基因和所述ugi的编码基因通过含有所述cas9核酸酶的编码基因的表达盒、所述转录靶向目标基因靶点序列的sgrna的dna分子的表达盒、所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgrna的dna分子的表达盒、所述胞嘧啶脱氨酶的编码基因的表达盒和所述ugi的编码基因的表达盒的重组载体导入生物体或生物细胞内。上述各个表达盒可通过同一个重组表达载体导入生物体或生物细胞内,也可通过两个或者多个重组表达载体共同导入生物体或生物细胞内。在本发明的具体实施例中,上述各个表达盒通过同一个重组表达载体导入生物体或生物细胞内,所述重组表达载体具体为上述sgrna-tp-hyg-tp/sgrna-gt-1重组表达载体或上述sgrna-tp-hyg-tp/sgrna-gt-2重组表达载体。上述成套试剂或应用或方法中,所述c·t碱基替换为碱基c突变为碱基t。所述碱基c可为位于所述靶点序列中任意位置的碱基c。上述成套试剂或应用或方法中,所述生物体为p1)或p2)或p3)或p4):p1)植物或动物;p2)单子叶植物或双子叶植物;p3)禾本科植物;p4)水稻(如日本晴水稻);所述生物细胞为q1)或q2)或q3)或q4):q1)植物细胞或动物细胞;q2)单子叶植物细胞或双子叶植物细胞;q3)禾本科植物细胞;q4)水稻细胞(如日本晴水稻细胞)。本发明的细胞富集技术原理如下:以失活的筛选剂抗性基因为报告基因,建立一种c·t碱基替换的细胞富集技术,使得报告基因上发生了c·t碱基替换的细胞能够在含有筛选剂的培养基中生长出来,没有发生c·t碱基替换的细胞不能够在含有筛选剂的培养基中生长。在此报告基因的基础上,如果同时对内源目标基因靶点进行c·t碱基替换编辑,在含有筛选剂的培养基中生长出来的细胞有更大的概率发生内源目标基因靶点的c·t碱基替换,从而实现对内源目标基因靶点发生c·t碱基替换的细胞的富集,进而提高内源目标基因靶点的c·t碱基替换效率。本发明具有以下优点:1、有多种不同类型的基因可以作为报告基因,在植物中进行c·t碱基替换的细胞富集。由于各种作物的遗传转化方法(如农杆菌转化法、基因枪转化法)都有相对成熟、稳定的筛选体系,使用转化用筛选剂对应的抗性基因作为报告基因进行基因组内源突变细胞的富集,比其余的如荧光报告基因、内源除草剂抗性基因等,更具有广谱性、通用性。2、技术设计简便,其中的代理靶点以及设计形式可以更广泛的应用到更多的筛选剂对应的抗性基因中,以满足不同作物的不同转化筛选体系的需求。3、本发明的细胞富集技术对不同的脱氨酶介导的碱基编辑器或者是不同的cas9酶介导的碱基编辑器均实现了细胞水平上c·t碱基替换细胞富集,大大提高c·t碱基替换效率。附图说明图1为细胞富集技术载体sgrna-tp-hyg-tp/sgrna-gt和非细胞富集技术载体sgrna-gt的结构示意图。图2为细胞富集技术的工作原理示意图。图3为重组载体的结构示意图。图4为细胞富集技术载体sgrna-tp-hyg-tp/sgrna-gt和非细胞富集技术载体sgrna-gt在抗性愈伤中对靶点的c·t碱基替换效率比较。具体实施方式下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。下述实施例中,如无特殊说明,序列表中各核苷酸序列的第1位均为相应dna/rna的5′末端核苷酸,末位均为相应dna/rna的3′末端核苷酸。引物对t1由引物t1-f:5’-gtaagaaccaccagcgacac-3’和引物t1-r:5’-gtaattgtgcttggtgatgga-3’组成,用于扩增靶点als-t1。引物对t2由引物t2-f:5’-aatatgccattcaggtgctgg-3’和引物t2-r:5’-atcataggcagcacatgctcc-3’组成,用于扩增靶点als-t2。引物对t3由引物t3-f:5’-atggctacgaccgccgcgg-3’和引物t3-r:5’-gcctcaattttccctgtcacacgatc-3’组成,用于扩增靶点als-t3。引物对t4由引物t4-f:5’-attgtggctcgtgctctacc-3’和引物t4-r:5’-agacacacccacaggaacatt-3’组成,用于扩增靶点dep1。引物对t5由引物t5-f:5’-cttcaaattctaatccccaatcc-3’和引物t5-r:5’-ggttgttgttgaggtttaggatc-3’组成,用于扩增靶点waxy。引物对t6由引物t6-f:5’-ttacgaactttataactttgtcgg-3’和引物t6-r:5’-atggaggcgatgaggaagac-3’组成,用于扩增靶点nrt1.1b-t1。引物对t7由引物t7-f:5’-ctaatcctaccaattaacgagtcg-3’和引物t7-r:5’-accagttgaagaagcgcatc-3’组成,用于扩增靶点nrt1.1b-t2。引物对t8由引物t8-f:5’-cctccatcctcctcaccg-3’和引物t8-r:5’-tgaccttgtggacgatggtg-3’组成,用于扩增靶点nrt1.1b-t3。引物对t9由引物t9-f:5’-acatcgagatggagaagcgg-3’和引物t9-r:5’-ccatgctccaatcgatgaatac-3’组成,用于扩增靶点cdc48-t1。引物对t10由引物t10-f:5’-agacaccatctgcattgttct-3’和引物t10-r:5’-ggatgtaagaaggcgacactag-3’组成,用于扩增靶点cdc48-t2。以下实施例中,c·t碱基替换是指靶点序列中任何位置的c突变为t。c·t碱基替换效率=发生c·t碱基替换的阳性抗性愈伤数/分析的总阳性抗性愈伤数×100%。日本晴水稻:参考文献:梁卫红,王高华,杜京尧,等.硝普钠及其光解产物对日本晴水稻幼苗生长和5种激素标记基因表达的影响[j].河南师范大学学报(自然版),2017(2):48-52.;公众可以从北京市农林科学院获得。恢复培养基:含有200mg/l特美汀的n6固体培养基。筛选培养基:含有50mg/l潮霉素的n6固体培养基。实施例1、c·t碱基替换的细胞富集技术的建立一、c·t碱基替换的细胞富集技术载体的建立将cas9核酸酶、胞嘧啶脱氨酶和ugi介导的c·t碱基替换的普通技术(非细胞富集技术)载体命名为sgrna-gt。将cas9核酸酶、胞嘧啶脱氨酶和ugi介导的c·t碱基替换的细胞富集技术载体命名为sgrna-tp-hyg-tp/sgrna-gt。以cas9核酸酶为spcas9n,胞嘧啶脱氨酶为pmcda1为例:sgrna-tp-hyg-tp/sgrna-gt和sgrna-gt载体的结构示意图均如图1所示。细胞富集技术载体为在非细胞富集技术载体基础上对筛选剂抗性基因进行基因突变使其功能丧失,同时在sgrna部分加入相应的含有所述突变位点的靶点序列(代理靶点序列)后得到的载体。以筛选剂抗性基因为潮霉素抗性基因hygromycin为例:非细胞富集技术载体中的筛选剂抗性基因为正常的潮霉素抗性基因hygromycin。细胞富集技术载体中的筛选剂抗性基因为突变的潮霉素抗性基因hygromycin,突变的潮霉素抗性基因hygromycin(称为hygromycin-tp,简称hyg-tp)为将正常的潮霉素抗性基因的第272位由t突变为c,且将第274位由t突变为c后得到的序列,hyg-tp基因编码的潮霉素抗性蛋白的氨基酸序列为将正常的潮霉素抗性蛋白的第91位由异亮氨酸(密码子为atc)突变为苏氨酸(密码子为acc),且将第92位由丝氨酸(密码子为tcc)突变为脯氨酸(密码子为ccc)后得到的序列。hyg-tp序列为序列1第11305-12330位,其中,第11574-11596位为含有上述突变位点的代理靶点靶序列:caccccccgccgttcacaggggg(斜体所示的碱基为pam序列)(序列6)。二、c·t碱基替换的细胞富集技术的工作原理c·t碱基替换的细胞富集技术的工作原理如图2所示。以筛选剂抗性基因为潮霉素抗性基因hygromycin为例:在细胞富集技术中,由于潮霉素抗性基因hygromycin含有突变位点,抗性功能丧失,在潮霉素筛选培养基中,植物无法长出抗性愈伤,当细胞富集技术中的c·t碱基替换系统(由cas9核酸酶、胞嘧啶脱氨酶和ugi组成的c·t碱基替换系统)在sgrna向导下将含有上述突变位点的靶点序列中的第3位和第5位的c均突变为t,使hyg-tp恢复为正常的潮霉素抗性基因hygromycin,能够正常表达,恢复抗性功能,进而使植物在潮霉素筛选培养基中长出抗性愈伤。由于长出抗性愈伤的细胞已经发生了c·t碱基替换,那么此细胞对应的内源基因发生c·t碱基替换的效率相对会更高,从而达到富集c·t碱基替换细胞的目的,实现提高植物内源靶点的c·t碱基替换效率。实施例2、cas9n&pmcda1&ugi介导的细胞富集技术载体的构建及其在水稻基因组编辑中的应用一、重组表达载体的构建本实施例中的重组表达载体为cas9n&pmcda1&ugi(pcbe)介导的c·t碱基替换的普通技术载体sgrna-gt及cas9n&pmcda1&ugi(pcbe)介导的c·t碱基替换的细胞富集技术载体sgrna-tp-hyg-tp/sgrna-gt。各载体均为环状质粒。两种重组表达载体各元件结构示意图均如图3所示。根据含有的靶序列不同,每种重组表达载体又各自分成两种,共有如下四种重组表达载体:sgrna-tp-hyg-tp/sgrna-gt-1重组表达载体、sgrna-tp-hyg-tp/sgrna-gt-2重组表达载体、sgrna-gt-1重组表达载体、sgrna-gt-2重组表达载体。人工合成上述四种重组表达载体,四种重组表达载体的具体结构描述分别如下:sgrna-tp-hyg-tp/sgrna-gt-1重组表达载体的序列为序列表中的序列1。序列1的第131-467位为osu3启动子的核苷酸序列,第474-550位、第647-723位、第820-896位、第993-1069位、第1166-1242位、第1339-1415位均为trna的核苷酸序列,第551-570位、第724-743位、第897-916位、第1070-1089位、第1243-1262位分别为靶向osals、oscdc48、osnrt1.1b、oswax、osals基因的五个靶点序列,第1416-1435位为hyg-tp报告基因代理靶点序列。第571-646位、第744-819位、第917-992位、第1090-1165位、第1263-1338位、第1436-1511位为sgrna的核苷酸序列,第1512-1802位为osu3终止子的核苷酸序列;序列1的第1809-3522位为osubq3启动子的核苷酸序列,第3529-7797位为spcas9n蛋白质的编码序列(不含有终止密码子),编码序列2所示的spcas9n蛋白质;序列1的第8089-8712位为pmcda1蛋白质的编码序列(不含有终止密码子),编码序列3所示的pmcda1蛋白质;序列1的第8734-9030位为ugi蛋白质的编码序列,编码序列4所示的ugi蛋白质;序列1的第9037-9231位为35s终止子的核苷酸序列,第9306-11298位为zmubi1启动子的核苷酸序列,第11305-12330位为hyg-tp序列,第12357-12572位为camv35spolya终止子的核苷酸序列。sgrna-tp-hyg-tp/sgrna-gt-1重组表达载体中六个靶点序列见表1,靶点分别为als-t1、cdc48-t1、nrt1.1b-t1、waxy、als-t2、hyg-tp。sgrna-tp-hyg-tp/sgrna-gt-2重组表达载体的序列为将序列1中的前五个靶点序列依次分别替换为如下五个靶点序列als-t3、cdc48-t2、nrt1.1b-t3、nrt1.1b-t2、dep1,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。sgrna-gt-1重组表达载体的序列为将序列1第11305-12330位替换为序列5所示的正常的潮霉素抗性基因序列,且保持其他序列不变后得到的序列。sgrna-gt-2重组表达载体将sgrna-gt-1重组表达载体中的前五个靶点序列依次分别替换为如下五个靶点序列als-t3、cdc48-t2、nrt1.1b-t3、nrt1.1b-t2、dep1,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。各载体的sgrna的靶点核苷酸序列及相应的pam序列如表1所示。表1二、水稻阳性抗性愈伤的获得将步骤一获得的sgrna-tp-hyg-tp/sgrna-gt-1载体,sgrna-tp-hyg-tp/sgrna-gt-2载体,sgrna-gt-1载体和sgrna-gt-2载体分别按照如下步骤1-8进行操作:1、将载体导入农杆菌eha105(上海唯地生物技术有限公司的产品,cat#:ac1010),得到重组农杆菌。2、采用培养基(含50μg/ml卡那霉素和25μg/ml利福平的yep培养基)培养重组农杆菌,28℃,150rpm震荡培养至od600为1.0-2.0,室温条件下,10000rpm离心1min,用侵染液(将n6液体培养基中的糖替换为葡萄糖和蔗糖,葡萄糖和蔗糖在侵染液中的浓度分别为10g/l和20g/l)重悬菌体并稀释至od600为0.2,得到农杆菌侵染液。3、水稻品种日本晴成熟种子去壳脱粒,置于100ml三角瓶中,加入70%(v/v)乙醇水溶液浸泡30sec,再置于25%(v/v)次氯酸钠水溶液中,120rpm震荡灭菌30min,无菌水冲洗3次,用滤纸吸干水分,然后将种子胚朝下置于n6固体培养基上,28℃暗培养4-6周,得到水稻愈伤。4、完成步骤3后,将水稻愈伤浸泡置于农杆菌侵染液甲(农杆菌侵染液甲为向农杆菌侵染液中加入乙酰丁香酮得到的液体,乙酰丁香酮的添加量满足乙酰丁香酮与农杆菌侵染液的体积比为25μl:50ml)中浸泡10min,然后,放在铺有两层灭菌滤纸的培养皿(内含约200ml不含农杆菌的侵染液)上,21℃暗培养1天。5、取步骤4得到的水稻愈伤放入恢复培养基上,25-28℃暗培养3天。6、取步骤5得到的水稻愈伤,置于筛选培养基上,28℃暗培养2周。7、取步骤6得到的水稻愈伤,再次置于筛选培养基上,28℃暗培养2周,得到水稻抗性愈伤。8、分别提取20-24块水稻抗性愈伤的基因组dna并以其作为模板,采用引物f(5’-attatgtagcttgtgcgtttcg-3’)和引物r(5’-gatgaagagcttatcgacgt-3’)组成的引物对进行pcr扩增,得到pcr扩增产物;将该pcr扩增产物进行琼脂糖凝胶电泳,然后进行如下判断:如果pcr扩增产物中含有约1150bp的dna片段,则相应的水稻抗性愈伤为水稻阳性抗性愈伤;如果pcr扩增产物中不含有约1150bp的dna片段,则相应的水稻抗性愈伤不为水稻阳性抗性愈伤。三、结果分析1、每载体分别取步骤二所获得的20-24块水稻阳性抗性愈伤的基因组dna作为模板(独立侵染两次,获得平均值和方差),对于als-t1靶点,采用引物对t1进行pcr扩增,得到pcr扩增产物;对于als-t2靶点,采用引物对t2进行pcr扩增,得到pcr扩增产物;对于als-t3靶点,采用引物对t3进行pcr扩增,得到pcr扩增产物;对于dep1靶点,采用引物对t4进行pcr扩增,得到pcr扩增产物;对于waxy靶点,采用引物对t5进行pcr扩增,得到pcr扩增产物;对于nrt1.1b-t1靶点,采用引物对t6进行pcr扩增,得到pcr扩增产物;对于nrt1.1b-t2靶点,采用引物对t7进行pcr扩增,得到pcr扩增产物;对于nrt1.1b-t3靶点,采用引物对t8进行pcr扩增,得到pcr扩增产物;对于cdc48-t1靶点,采用引物对t9进行pcr扩增,得到pcr扩增产物;对于cdc48-t2靶点,采用引物对t10进行pcr扩增,得到pcr扩增产物。2、将步骤1得到的pcr扩增产物进行sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生c·t碱基替换的水稻阳性抗性愈伤数,计算得出c·t碱基替换效率,结果见图4。结果表明,通过使用细胞富集技术,als-t1靶点中第3位c的c·t碱基替换效率从44%增加到64%;als-t2靶点中第4位c的c·t碱基替换效率从29%增加到55%;als-t3靶点中第5位c的平均c·t碱基替换效率从40%增加到54%;nrt1.1b-t3靶点中第5位c的平均c·t碱基替换效率从40%增加到46%;nrt1.1b-t2靶点中第3位c的平均c·t碱基替换效率从20%增加到35%;waxy靶点中第11位c的c·t碱基替换效率从4%增加到12%;cdc48-t1靶点中第3位c的平均c·t碱基替换效率从55%增加到62%;cdc48-t2靶点中第3位c的c·t碱基替换效率从0增加到15%。综上所述,通过使用细胞富集技术大部分靶点的c·t碱基替换效率提升至普通技术体系的1.2-3倍。以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。序列表<110>北京市农林科学院<120>以突变的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用<160>6<170>patentinversion3.5<210>1<211>18978<212>dna<213>人工序列(artificialsequence)<400>1ggtggcaggatatattgtggtgtaaacatggcactagcctcaccgtcttcgcagacgagg60ccgctaagtcgcagctacgctctcaacggcactgactaggtagtttaaacgtgcacttaa120ttaaggtaccgaagcaacttaaagttatcaggcatgcatggatcttggaggaatcagatg180tgcagtcagggaccatagcacaagacaggcgtcttctactggtgctaccagcaaatgctg240gaagccgggaacactgggtacgttggaaaccacgtgatgtgaagaagtaagataaactgt300aggagaaaagcatttcgtagtgggccatgaagcctttcaggacatgtattgcagtatggg360ccggcccattacgcaattggacgacaacaaagactagtattagtaccacctcggctatcc420acatagatcaaagctgatttaaaagagttgtgcagatgatccgtggcggatccaacaaag480caccagtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgattccc540ggctggtgcacgcgtccatggagatccaccgttttagagctagaaatagcaagttaaaat600aaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcaacaaagcaccagt660ggtctagtggtagaatagtaccctgccacggtacagacccgggttcgattcccggctggt720gcagaccagccagcgtctggcgcgttttagagctagaaatagcaagttaaaataaggcta780gtccgttatcaacttgaaaaagtggcaccgagtcggtgcaacaaagcaccagtggtctag840tggtagaatagtaccctgccacggtacagacccgggttcgattcccggctggtgcacggc900gacggcgagcaagtgggttttagagctagaaatagcaagttaaaataaggctagtccgtt960atcaacttgaaaaagtggcaccgagtcggtgcaacaaagcaccagtggtctagtggtaga1020atagtaccctgccacggtacagacccgggttcgattcccggctggtgcattgtaatcaac1080tccagtgtcgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaact1140tgaaaaagtggcaccgagtcggtgcaacaaagcaccagtggtctagtggtagaatagtac1200cctgccacggtacagacccgggttcgattcccggctggtgcagaacaaccaacatttggg1260tagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaa1320gtggcaccgagtcggtgcaacaaagcaccagtggtctagtggtagaatagtaccctgcca1380cggtacagacccgggttcgattcccggctggtgcacaccccccgccgttcacagggtttt1440agagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcac1500cgagtcggtgcttttttttttcgttttgcattgagttttctccgtcgcatgtttgcagtt1560ttattttccgttttgcattgaaatttctccgtctcatgtttgcagcgtgttcaaaaagta1620cgcagctgtatttcacttatttacggcgccacattttcatgccgtttgtgccaactatcc1680cgagctagtgaatacagcttggcttcacacaacactggtgacccgctgacctgctcgtac1740ctcgtaccgtcgtacggcacagcatttggaattaaagggtgtgatcgatactgcttgctg1800ctaagcttacaaattcgggtcaaggcggaagccagcgcgccaccccacgtcagcaaatac1860ggaggcgcggggttgacggcgtcacccggtcctaacggcgaccaacaaaccagccagaag1920aaattacagtaaaaaaaaagtaaattgcactttgatccaccttttattacctaagtctca1980atttggatcacccttaaacctatcttttcaatttgggccgggttgtggtttggactacca2040tgaacaacttttcgtcatgtctaacttccctttcagcaaacatatgaaccatatatagag2100gagatcggccgtatactagagctgatgtgtttaaggtcgttgattgcacgagaaaaaaaa2160atccaaatcgcaacaatagcaaatttatctggttcaaagtgaaaagatatgtttaaaggt2220agtccaaagtaaaacttatagataataaaatgtggtccaaagcgtaattcactcaaaaaa2280aatcaacgagacgtgtaccaaacggagacaaacggcatcttctcgaaatttcccaaccgc2340tcgctcgcccgcctcgtcttcccggaaaccgcggtggtttcagcgtggcggattctccaa2400gcagacggagacgtcacggcacgggactcctcccaccacccaaccgccataaataccagc2460cccctcatctcctctcctcgcatcagctccacccccgaaaaatttctccccaatctcgcg2520aggctctcgtcgtcgaatcgaatcctctcgcgtcctcaaggtacgctgcttctcctctcc2580tcgcttcgtttcgattcgatttcggacgggtgaggttgttttgttgctagatccgattgg2640tggttagggttgtcgatgtgattatcgtgagatgtttaggggttgtagatctgatggttg2700tgatttgggcacggttggttcgataggtggaatcgtggttaggttttgggattggatgtt2760ggttctgatgattggggggaatttttacggttagatgaattgttggatgattcgattggg2820gaaatcggtgtagatctgttggggaattgtggaactagtcatgcctgagtgattggtgcg2880atttgtagcgtgttccatcttgtaggccttgttgcgagcatgttcagatctactgttccg2940ctcttgattgagttattggtgccatgggttggtgcaaacacaggctttaatatgttatat3000ctgttttgtgtttgatgtagatctgtagggtagttcttcttagacatggttcaattatgt3060agcttgtgcgtttcgatttgatttcatatgttcacagattagataatgatgaactctttt3120aattaattgtcaatggtaaataggaagtcttgtcgctatatctgtcataatgatctcatg3180ttactatctgccagtaatttatgctaagaactatattagaatatcatgttacaatctgta3240gtaatatcatgttacaatctgtagttcatctatataatctattgtggtaatttcttttta3300ctatctgtgtgaagattattgccactagttcattctacttatttctgaagttcaggatac3360gtgtgctgttactacctatctgaatacatgtgtgatgtgcctgttactatctttttgaat3420acatgtatgttctgttggaatatgtttgctgtttgatccgttgttgtgtccttaatcttg3480tgctagttcttaccctatctgtttggtgattatttcttgcagtacgtaatggactacaag3540gaccacgacggggattacaaagaccacgacatagactacaaggatgacgatgacaaaatg3600gcaccgaagaaaaaaaggaaggtcggaatccatggcgttccagctgccgataagaaatat3660tccatcggactcgccattggcacgaatagcgtcggatgggctgttattactgatgagtac3720aaagttccgtctaagaagttcaaggtgctgggcaacacagaccgccacagcataaagaaa3780aatctcatcggtgcactccttttcgatagtggggagactgcagaagcgacaagattgaaa3840aggactgcgagaaggcgctatacacggcgtaagaatagaatctgctaccttcaggagatt3900ttctctaacgaaatggctaaggtcgatgacagtttctttcatagacttgaggaatcgttc3960ttggttgaggaggataagaaacatgagaggcacccgatatttggaaacatcgtggatgag4020gtcgcatatcatgaaaagtaccccacaatctaccacctgagaaagaaactcgttgattcc4080accgacaaagcggatttgagactcatctacctcgctcttgcccatatgataaagttccgc4140ggacactttctgatcgagggcgacctcaaccctgataatagcgacgtcgataagctcttc4200atccagttggttcaaacctacaatcagctctttgaggaaaacccaattaatgctagtgga4260gtggatgcaaaagcgatactgtcggccagactctccaagagcagaaggttggagaacctg4320atcgctcaacttcctggagaaaagaaaaacggtctttttgggaatttgattgccttgtct4380ctgggcctcacaccaaacttcaagtcaaattttgacctcgctgaggatgccaaacttcag4440ttgtctaaggatacctatgatgacgatcttgacaatttgctggcacaaattggcgaccag4500tacgcggatctgttcctcgcagcgaagaatctgagtgatgctattctcctttcggacata4560ctcagggttaacactgagatcacaaaagcacctttgagtgcgtcgatgattaagcgctat4620gatgaacatcaccaagacctcactttgctgaaggcccttgtgcggcagcaattgccagag4680aagtacaaagaaatcttctttgaccaatctaagaacggatacgctggctatattgatgga4740ggagcttctcaggaggaattctataagtttatcaaacctatacttgagaagatggatggt4800acagaggaactccttgttaaattgaacagagaagatttgctgcgcaagcaacggaccttt4860gacaacggatcaattccgcatcagatacacctcggcgagcttcatgccatccttcgccgg4920caggaagatttctacccctttttgaaggacaaccgcgagaagatagaaaaaatccttacg4980ttccggattccttactatgtgggtccattggcaagggggaattcccgctttgcgtggatg5040actcggaaaagcgaggaaactatcacaccgtggaacttcgaggaagttgtggacaaggga5100gcttctgcccaatcattcattgagaggatgactaacttcgataagaacctgccgaacgag5160aaagttctccccaagcactccctcctttacgagtatttcaccgtgtataacgaacttacg5220aaggttaaatacgtgactgagggtatgaggaagccagcattcttgagcggggaacaaaag5280aaagcgattgttgatttgctgtttaaaactaatcgcaaggtgacagtcaagcagctcaaa5340gaggattatttcaagaaaattgaatgtttcgactctgtggagatatcaggagtcgaagat5400aggtttaacgcttcccttggcacataccatgacctccttaagatcattaaggacaaagat5460ttcctggataacgaggaaaatgaggacatcctcgaagatattgttcttaccttgacgctg5520tttgaggatcgcgaaatgatcgaggaacggcttaagacgtatgctcacttgttcgacgat5580aaggttatgaagcagctcaagcgtagaaggtacactggatggggccgtctgtctagaaag5640ctcatcaacggaatacgtgataaacaaagtggcaagacaattttggattttctgaagtcg5700gacggattcgccaacagaaattttatgcagctgattcatgacgatagtctcaccttcaaa5760gaggacatacagaaggctcaagtgagtggtcaaggggattcgctgcatgaacacatcgca5820aacctcgcgggttcaccggccataaagaaaggaatccttcaaactgttaaggtcgttgat5880gagttggttaaagtgatgggtaggcacaagcccgaaaacatagtgatcgagatggctcgc5940gaaaatcagactacacaaaaagggcagaagaactctcgcgagcggatgaaaaggattgag6000gaaggaatcaaggaactgggctcacagattctcaaagagcatccagtcgaaaacacacag6060ctgcaaaatgagaagctctatctttactatctccaaaatggccgggacatgtatgttgat6120caggagcttgacatcaaccgtttgtccgactatgatgtggaccacattgtcccgcaatct6180ttccttaaggacgattcaatcgataataaggtgttgacccggagcgataaaaaccgtgga6240aagtctgacaatgtcccttcagaggaagtggttaagaagatgaagaactactggagacaa6300ttgctgaatgcaaaactgatcacacagagaaagttcgacaacctcaccaaagcagagaga6360ggtgggctcagtgaacttgataaagcgggcttcattaagcgtcagctcgttgagactaga6420cagatcacgaagcatgtcgcgcagattttggattcgcggatgaacacgaagtacgacgag6480aatgataaactgatacgtgaagtcaaggttatcactcttaagtccaaattggtgagcgat6540ttcagaaaggacttccaattctataaggtcagggagatcaacaattatcatcacgctcac6600gatgcctaccttaatgctgttgtggggaccgcccttattaagaaataccctaaattggag6660tctgaattcgtttacggggattataaggtctacgacgttaggaaaatgatagctaagagt6720gagcaggagatcggtaaagcaactgcgaagtatttcttttactcgaacatcatgaatttc6780tttaagaccgagataacgctggcaaatggcgaaattagaaagaggcctctcatagagact6840aacggtgagacaggggaaatcgtctgggataagggtagggactttgcgacagtgcgcaag6900gtcctctctatgccgcaagttaatattgtgaagaaaaccgaggtgcagacgggaggcttc6960tccaaggaaagcatacttcccaaacggaactctgataagttgatcgctcgtaagaaagat7020tgggaccctaagaaatatggtgggttcgattccccaactgttgcttacagcgtgctggtc7080gttgccaaggtcgagaagggtaaatccaagaaactcaaaagcgttaaggaactccttggg7140attactatcatggagagatcttcattcgaaaagaatcctatcgactttcttgaggccaaa7200ggatataaggaagttaagaaagatctgataatcaaactcccaaagtactcattgtttgag7260ctggaaaacggcaggaagcgcatgcttgcttccgccggagagttgcagaaagggaacgag7320ttggctctgccttctaagtatgttaacttcctctatcttgcctctcattacgagaagctc7380aaaggctcaccagaggacaacgaacagaaacaactttttgtcgagcaacataagcactat7440ttggatgagattatagaacagatcagtgaattctcgaaaagggttatccttgcagatgcg7500aatcttgacaaggtgttgtctgcatacaacaaacatagagataagccgatcagggagcaa7560gcggaaaatatcattcacctcttcactcttacaaacttgggtgctcccgctgccttcaag7620tattttgataccacgattgaccggaaacgttacacctcaacgaaggaggtgctggatgcc7680accctcatccaccaatctattaccggactctacgagactagaatcgatctctcacagctc7740ggcggggataaaagaccagcagcgacgaaaaaggcaggacaggctaagaagaagaaagag7800ctcggaggaggaggcacgggaggaggaggctccgccgagtatgtgcgcgcgctcttcgac7860ttcaacggcaatgacgaggaggatctccctttcaagaagggcgacatcctccgcatccgc7920gataagccggaggagcagtggtggaacgcagaggactccgagggcaagcggggcatgatc7980ctggtgccatacgtcgagaagtacagcggcgattacaaggaccacgatggcgactacaag8040gatcatgacatcgattacaaggacgatgacgataagtccggcgtcgacatgacggacgcg8100gagtatgtgcgcatccacgagaagctcgatatctacaccttcaagaagcagttcttcaac8160aataagaagtcggtgtcccatcggtgctacgtcctcttcgagctgaagcgcaggggagag8220cgccgcgcctgcttctggggctacgcggtgaataagccgcagtcaggcacagagcgcggc8280atccacgccgagatcttctcgatccggaaggtcgaggagtacctccgcgacaacccaggc8340cagttcacgatcaattggtactccagctggtccccttgcgcagattgcgcagagaagatc8400ctcgagtggtacaaccaggagctgaggggcaatggccataccctcaagatctgggcctgc8460aagctgtactacgagaagaacgcgaggaatcagatcggcctctggaacctgcgggataat8520ggcgtgggcctcaacgtgatggtgtccgagcactaccagtgctgccgcaagatcttcatc8580cagtcctcccacaatcagctgaacgagaataggtggctcgaaaagaccctgaagcgcgcc8640gagaagtggaggagcgagctgtctatcatgatccaggtcaagatcctgcacaccacaaag8700tcaccggcggtgggcggcggcggcagcgaattctccggcggcagcacgaacctcagcgac8760atcatcgagaaggagacaggcaagcagctcgtgatccaggagtctatcctcatgctgcct8820gaggaggtggaggaggtcatcggcaacaagccggagtccgatatcctcgtgcacaccgcc8880tacgacgagtcgacagatgagaatgtcatgctcctgacctccgacgcaccagagtacaag8940ccatgggcgctcgtgatccaggattccaacggcgagaataagatcaagatgctgtctggc9000ggctccccgaagaagaagcgcaaggtctagactagtctgaaatcaccagtctctctctac9060aaatctatctctctctataataatgtgtgagtagttcccagataagggaattagggttct9120tatagggtttcgctcatgtgttgagcatataagaaacccttagtatgtatttgtatttgt9180aaaatacttctatcaataaaatttctaattcctaaaaccaaaatccagtggggcgcccga9240cctgtactcgcgaaggttaacttacagagagtgtccgggcgcgcctggtggatcgtccgc9300ctaggctgcagtgcagcgtgacccggtcgtgcccctctctagagataatgagcattgcat9360gtctaagttataaaaaattaccacatattttttttgtcacacttgtttgaagtgcagttt9420atctatctttatacatatatttaaactttactctacgaataatataatctatagtactac9480aataatatcagtgttttagagaatcatataaatgaacagttagacatggtctaaaggaca9540attgagtattttgacaacaggactctacagttttatctttttagtgtgcatgtgttctcc9600tttttttttgcaaatagcttcacctatataatacttcatccattttattagtacatccat9660ttagggtttagggttaatggtttttatagactaatttttttagtacatctattttattct9720attttagcctctaaattaagaaaactaaaactctattttagtttttttatttaataattt9780agatataaaatagaataaaataaagtgactaaaaattaaacaaataccctttaagaaatt9840aaaaaaactaaggaaacatttttcttgtttcgagtagataatgccagcctgttaaacgcc9900gtcgacgagtctaacggacaccaaccagcgaaccagcagcgtcgcgtcgggccaagcgaa9960gcagacggcacggcatctctgtcgctgcctctggacccctctcgagagttccgctccacc10020gttggacttgctccgctgtcggcatccagaaattgcgtggcggagcggcagacgtgagcc10080ggcacggcaggcggcctcctcctcctctcacggcaccggcagctacgggggattcctttc10140ccaccgctccttcgctttcccttcctcgcccgccgtaataaatagacaccccctccacac10200cctctttccccaacctcgtgttgttcggagcgcacacacacacaaccagatctcccccaa10260atccacccgtcggcacctccgcttcaaggtacgccgctcgtcctccccccccccccctct10320ctaccttctctagatcggcgttccggtccatggttagggcccggtagttctacttctgtt10380catgtttgtgttagatccgtgtttgtgttagatccgtgctgctagcgttcgtacacggat10440gcgacctgtacgtcagacacgttctgattgctaacttgccagtgtttctctttggggaat10500cctgggatggctctagccgttccgcagacgggatcgatttcatgattttttttgtttcgt10560tgcatagggtttggtttgcccttttcctttatttcaatatatgccgtgcacttgtttgtc10620gggtcatcttttcatgcttttttttgtcttggttgtgatgatgtggtctggttgggcggt10680cgttctagatcggagtagaattctgtttcaaactacctggtggatttattaattttggat10740ctgtatgtgtgtgccatacatattcatagttacgaattgaagatgatggatggaaatatc10800gatctaggataggtatacatgttgatgcgggttttactgatgcatatacagagatgcttt10860ttgttcgcttggttgtgatgatgtggtgtggttgggcggtcgttcattcgttctagatcg10920gagtagaatactgtttcaaactacctggtgtatttattaattttggaactgtatgtgtgt10980gtcatacatcttcatagttacgagtttaagatggatggaaatatcgatctaggataggta11040tacatgttgatgtgggttttactgatgcatatacatgatggcatatgcagcatctattca11100tatgctctaaccttgagtacctatctattataataaacaagtatgttttataattatttt11160gatcttgatatacttggatgatggcatatgcagcagctatatgtggatttttttagccct11220gccttcatacgctatttatttgcttggtactgtttcttttgtcgatgctcaccctgttgt11280ttggtgttacttctgcaggagctcatgaaaaagcctgaactcaccgcgacgtctgtcgag11340aagtttctgatcgaaaagttcgacagcgtctccgacctgatgcagctctcggagggcgaa11400gaatctcgtgctttcagcttcgatgtaggagggcgtggatatgtcctgcgggtaaatagc11460tgcgccgatggtttctacaaagatcgttatgtttatcggcactttgcatcggccgcgctc11520ccgattccggaagtgcttgacattggggagtttagcgagagcctgacctattgcaccccc11580cgccgttcacagggggtcacgttgcaagacctgcctgaaaccgaactgcccgctgttcta11640caaccggtcgcggaggctatggatgcgatcgctgcggccgatcttagccagacgagcggg11700ttcggcccattcggaccgcaaggaatcggtcaatacactacatggcgtgatttcatatgc11760gcgattgctgatccccatgtgtatcactggcaaactgtgatggacgacaccgtcagtgcg11820tccgtcgcgcaggctctcgatgagctgatgctttgggccgaggactgccccgaagtccgg11880cacctcgtgcacgcggatttcggctccaacaatgtcctgacggacaatggccgcataaca11940gcggtcattgactggagcgaggcgatgttcggggattcccaatacgaggtcgccaacatc12000ttcttctggaggccgtggttggcttgtatggagcagcagacgcgctacttcgagcggagg12060catccggagcttgcaggatcgccacgactccgggcgtatatgctccgcattggtcttgac12120caactctatcagagcttggttgacggcaatttcgatgatgcagcttgggcgcagggtcga12180tgcgacgcaatcgtccgatccggagccgggactgtcgggcgtacacaaatcgcccgcaga12240agcgcggccgtctggaccgatggctgtgtagaagtactcgccgatagtggaaaccgacgc12300cccagcactcgtccgagggcaaagaaatagagtagatgccgaccgggatctgtcgatcga12360caagctcgagtttctccataataatgtgtgagtagttcccagataagggaattagggttc12420ctatagggtttcgctcatgtgttgagcatataagaaacccttagtatgtatttgtatttg12480taaaatacttctatcaataaaatttctaattcctaaaaccaaaatccagtactaaaatcc12540agatcccccgaattaattcggcgttaattcagcctgcaggacgcgtttaattaagtgcac12600gcggccgcctacttagtcaagagcctcgcacgcgactgtcacgcggccaggatcgcctcg12660tgagcctcgcaatctgtacctagtgtttaaactatcagtgtttgacaggatatattggcg12720ggtaaacctaagagaaaagagcgtttattagaataacggatatttaaaagggcgtgaaaa12780ggtttatccgttcgtccatttgtatgtgcatgccaaccacagggttcccctcgggatcaa12840agtactttgatccaacccctccgctgctatagtgcagtcggcttctgacgttcagtgcag12900ccgtcttctgaaaacgacatgtcgcacaagtcctaagttacgcgacaggctgccgccctg12960cccttttcctggcgttttcttgtcgcgtgttttagtcgcataaagtagaatacttgcgac13020tagaaccggagacattacgccatgaacaagagcgccgccgctggcctgctgggctatgcc13080cgcgtcagcaccgacgaccaggacttgaccaaccaacgggccgaactgcacgcggccggc13140tgcaccaagctgttttccgagaagatcaccggcaccaggcgcgaccgcccggagctggcc13200aggatgcttgaccacctacgccctggcgacgttgtgacagtgaccaggctagaccgcctg13260gcccgcagcacccgcgacctactggacattgccgagcgcatccaggaggccggcgcgggc13320ctgcgtagcctggcagagccgtgggccgacaccaccacgccggccggccgcatggtgttg13380accgtgttcgccggcattgccgagttcgagcgttccctaatcatcgaccgcacccggagc13440gggcgcgaggccgccaaggcccgaggcgtgaagtttggcccccgccctaccctcaccccg13500gcacagatcgcgcacgcccgcgagctgatcgaccaggaaggccgcaccgtgaaagaggcg13560gctgcactgcttggcgtgcatcgctcgaccctgtaccgcgcacttgagcgcagcgaggaa13620gtgacgcccaccgaggccaggcggcgcggtgccttccgtgaggacgcattgaccgaggcc13680gacgccctggcggccgccgagaatgaacgccaagaggaacaagcatgaaaccgcaccagg13740acggccaggacgaaccgtttttcattaccgaagagatcgaggcggagatgatcgcggccg13800ggtacgtgttcgagccgcccgcgcacgtctcaaccgtgcggctgcatgaaatcctggccg13860gtttgtctgatgccaagctggcggcctggccggccagcttggccgctgaagaaaccgagc13920gccgccgtctaaaaaggtgatgtgtatttgagtaaaacagcttgcgtcatgcggtcgctg13980cgtatatgatgcgatgagtaaataaacaaatacgcaaggggaacgcatgaaggttatcgc14040tgtacttaaccagaaaggcgggtcaggcaagacgaccatcgcaacccatctagcccgcgc14100cctgcaactcgccggggccgatgttctgttagtcgattccgatccccagggcagtgcccg14160cgattgggcggccgtgcgggaagatcaaccgctaaccgttgtcggcatcgaccgcccgac14220gattgaccgcgacgtgaaggccatcggccggcgcgacttcgtagtgatcgacggagcgcc14280ccaggcggcggacttggctgtgtccgcgatcaaggcagccgacttcgtgctgattccggt14340gcagccaagcccttacgacatatgggccaccgccgacctggtggagctggttaagcagcg14400cattgaggtcacggatggaaggctacaagcggcctttgtcgtgtcgcgggcgatcaaagg14460cacgcgcatcggcggtgaggttgccgaggcgctggccgggtacgagctgcccattcttga14520gtcccgtatcacgcagcgcgtgagctacccaggcactgccgccgccggcacaaccgttct14580tgaatcagaacccgagggcgacgctgcccgcgaggtccaggcgctggccgctgaaattaa14640atcaaaactcatttgagttaatgaggtaaagagaaaatgagcaaaagcacaaacacgcta14700agtgccggccgtccgagcgcacgcagcagcaaggctgcaacgttggccagcctggcagac14760acgccagccatgaagcgggtcaactttcagttgccggcggaggatcacaccaagctgaag14820atgtacgcggtacgccaaggcaagaccattaccgagctgctatctgaatacatcgcgcag14880ctaccagagtaaatgagcaaatgaataaatgagtagatgaattttagcggctaaaggagg14940cggcatggaaaatcaagaacaaccaggcaccgacgccgtggaatgccccatgtgtggagg15000aacgggcggttggccaggcgtaagcggctgggttgtctgccggccctgcaatggcactgg15060aacccccaagcccgaggaatcggcgtgacggtcgcaaaccatccggcccggtacaaatcg15120gcgcggcgctgggtgatgacctggtggagaagttgaaggccgcgcaggccgcccagcggc15180aacgcatcgaggcagaagcacgccccggtgaatcgtggcaagcggccgctgatcgaatcc15240gcaaagaatcccggcaaccgccggcagccggtgcgccgtcgattaggaagccgcccaagg15300gcgacgagcaaccagattttttcgttccgatgctctatgacgtgggcacccgcgatagtc15360gcagcatcatggacgtggccgttttccgtctgtcgaagcgtgaccgacgagctggcgagg15420tgatccgctacgagcttccagacgggcacgtagaggtttccgcagggccggccggcatgg15480ccagtgtgtgggattacgacctggtactgatggcggtttcccatctaaccgaatccatga15540accgataccgggaagggaagggagacaagcccggccgcgtgttccgtccacacgttgcgg15600acgtactcaagttctgccggcgagccgatggcggaaagcagaaagacgacctggtagaaa15660cctgcattcggttaaacaccacgcacgttgccatgcagcgtacgaagaaggccaagaacg15720gccgcctggtgacggtatccgagggtgaagccttgattagccgctacaagatcgtaaaga15780gcgaaaccgggcggccggagtacatcgagatcgagctagctgattggatgtaccgcgaga15840tcacagaaggcaagaacccggacgtgctgacggttcaccccgattactttttgatcgatc15900ccggcatcggccgttttctctaccgcctggcacgccgcgccgcaggcaaggcagaagcca15960gatggttgttcaagacgatctacgaacgcagtggcagcgccggagagttcaagaagttct16020gtttcaccgtgcgcaagctgatcgggtcaaatgacctgccggagtacgatttgaaggagg16080aggcggggcaggctggcccgatcctagtcatgcgctaccgcaacctgatcgagggcgaag16140catccgccggttcctaatgtacggagcagatgctagggcaaattgccctagcaggggaaa16200aaggtcgaaaaggtctctttcctgtggatagcacgtacattgggaacccaaagccgtaca16260ttgggaaccggaacccgtacattgggaacccaaagccgtacattgggaaccggtcacaca16320tgtaagtgactgatataaaagagaaaaaaggcgatttttccgcctaaaactctttaaaac16380ttattaaaactcttaaaacccgcctggcctgtgcataactgtctggccagcgcacagccg16440aagagctgcaaaaagcgcctacccttcggtcgctgcgctccctacgccccgccgcttcgc16500gtcggcctatcgcggccgctggccgctcaaaaatggctggcctacggccaggcaatctac16560cagggcgcggacaagccgcgccgtcgccactcgaccgccggcgcccacatcaaggcaccc16620tgcctcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagacg16680gtcacagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagcg16740ggtgttggcgggtgtcggggcgcagccatgacccagtcacgtagcgatagcggagtgtat16800actggcttaactatgcggcatcagagcagattgtactgagagtgcaccatatgcggtgtg16860aaataccgcacagatgcgtaaggagaaaataccgcatcaggcgctcttccgcttcctcgc16920tcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaagg16980cggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaag17040gccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctcc17100gcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacag17160gactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccga17220ccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctc17280atagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtg17340tgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagt17400ccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagca17460gagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctaca17520ctagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagag17580ttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgca17640agcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacgg17700ggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgcattctaggt17760actaaaacaattcatccagtaaaatataatattttattttctcccaatcaggcttgatcc17820ccagtaagtcaaaaaatagctcgacatactgttcttccccgatatcctccctgatcgacc17880ggacgcagaaggcaatgtcataccacttgtccgccctgccgcttctcccaagatcaataa17940agccacttactttgccatctttcacaaagatgttgctgtctcccaggtcgccgtgggaaa18000agacaagttcctcttcgggcttttccgtctttaaaaaatcatacagctcgcgcggatctt18060taaatggagtgtcttcttcccagttttcgcaatccacatcggccagatcgttattcagta18120agtaatccaattcggctaagcggctgtctaagctattcgtatagggacaatccgatatgt18180cgatggagtgaaagagcctgatgcactccgcatacagctcgataatcttttcagggcttt18240gttcatcttcatactcttccgagcaaaggacgccatcggcctcactcatgagcagattgc18300tccagccatcatgccgttcaaagtgcaggacctttggaacaggcagctttccttccagcc18360atagcatcatgtccttttcccgttccacatcataggtggtccctttataccggctgtccg18420tcatttttaaatataggttttcattttctcccaccagcttatataccttagcaggagaca18480ttccttccgtatcttttacgcagcggtatttttcgatcagttttttcaattccggtgata18540ttctcattttagccatttattatttccttcctcttttctacagtatttaaagatacccca18600agaagctaattataacaagacgaactccaattcactgttccttgcattctaaaaccttaa18660ataccagaaaacagctttttcaaagttgttttcaaagttggcgtataacatagtatcgac18720ggagccgattttgaaaccgcggtgatcacaggcagcaacgctctgtcatcgttacaatca18780acatgctaccctccgcgagatcatccgtgtttcaaacccggcagcttagttgccgttctt18840ccgaatagcatcggtaacatgagcaaagtctgccgccttacaacggctctcccgctgacg18900ccgtcccggactgatgggctgcctgtatcgagtggtgattttgtgccgagctgccggtcg18960gggagctgttggctggct18978<210>2<211>1423<212>prt<213>人工序列(artificialsequence)<400>2metasptyrlysasphisaspglyasptyrlysasphisaspileasp151015tyrlysaspaspaspasplysmetalaprolyslyslysarglysval202530glyilehisglyvalproalaalaasplyslystyrserileglyleu354045alaileglythrasnservalglytrpalavalilethraspglutyr505560lysvalproserlyslysphelysvalleuglyasnthrasparghis65707580serilelyslysasnleuileglyalaleuleupheaspserglyglu859095thralaglualathrargleulysargthralaargargargtyrthr100105110argarglysasnargilecystyrleuglngluilepheserasnglu115120125metalalysvalaspaspserphephehisargleuglugluserphe130135140leuvalglugluasplyslyshisgluarghisproilepheglyasn145150155160ilevalaspgluvalalatyrhisglulystyrprothriletyrhis165170175leuarglyslysleuvalaspserthrasplysalaaspleuargleu180185190iletyrleualaleualahismetilelyspheargglyhispheleu195200205ilegluglyaspleuasnproaspasnseraspvalasplysleuphe210215220ileglnleuvalglnthrtyrasnglnleupheglugluasnproile225230235240asnalaserglyvalaspalalysalaileleuseralaargleuser245250255lysserargargleugluasnleuilealaglnleuproglyglulys260265270lysasnglyleupheglyasnleuilealaleuserleuglyleuthr275280285proasnphelysserasnpheaspleualagluaspalalysleugln290295300leuserlysaspthrtyraspaspaspleuaspasnleuleualagln305310315320ileglyaspglntyralaaspleupheleualaalalysasnleuser325330335aspalaileleuleuseraspileleuargvalasnthrgluilethr340345350lysalaproleuseralasermetilelysargtyraspgluhishis355360365glnaspleuthrleuleulysalaleuvalargglnglnleuproglu370375380lystyrlysgluilephepheaspglnserlysasnglytyralagly385390395400tyrileaspglyglyalaserglnglugluphetyrlyspheilelys405410415proileleuglulysmetaspglythrglugluleuleuvallysleu420425430asnarggluaspleuleuarglysglnargthrpheaspasnglyser435440445ileprohisglnilehisleuglygluleuhisalaileleuargarg450455460glngluaspphetyrpropheleulysaspasnargglulysileglu465470475480lysileleuthrpheargileprotyrtyrvalglyproleualaarg485490495glyasnserargphealatrpmetthrarglysserglugluthrile500505510thrprotrpasnpheglugluvalvalasplysglyalaseralagln515520525serpheilegluargmetthrasnpheasplysasnleuproasnglu530535540lysvalleuprolyshisserleuleutyrglutyrphethrvaltyr545550555560asngluleuthrlysvallystyrvalthrgluglymetarglyspro565570575alapheleuserglygluglnlyslysalailevalaspleuleuphe580585590lysthrasnarglysvalthrvallysglnleulysgluasptyrphe595600605lyslysileglucyspheaspservalgluileserglyvalgluasp610615620argpheasnalaserleuglythrtyrhisaspleuleulysileile625630635640lysasplysasppheleuaspasnglugluasngluaspileleuglu645650655aspilevalleuthrleuthrleuphegluaspargglumetileglu660665670gluargleulysthrtyralahisleupheaspasplysvalmetlys675680685glnleulysargargargtyrthrglytrpglyargleuserarglys690695700leuileasnglyileargasplysglnserglylysthrileleuasp705710715720pheleulysseraspglyphealaasnargasnphemetglnleuile725730735hisaspaspserleuthrphelysgluaspileglnlysalaglnval740745750serglyglnglyaspserleuhisgluhisilealaasnleualagly755760765serproalailelyslysglyileleuglnthrvallysvalvalasp770775780gluleuvallysvalmetglyarghislysprogluasnilevalile785790795800glumetalaarggluasnglnthrthrglnlysglyglnlysasnser805810815arggluargmetlysargileglugluglyilelysgluleuglyser820825830glnileleulysgluhisprovalgluasnthrglnleuglnasnglu835840845lysleutyrleutyrtyrleuglnasnglyargaspmettyrvalasp850855860glngluleuaspileasnargleuserasptyraspvalasphisile865870875880valproglnserpheleulysaspaspserileaspasnlysvalleu885890895thrargserasplysasnargglylysseraspasnvalproserglu900905910gluvalvallyslysmetlysasntyrtrpargglnleuleuasnala915920925lysleuilethrglnarglyspheaspasnleuthrlysalagluarg930935940glyglyleusergluleuasplysalaglypheilelysargglnleu945950955960valgluthrargglnilethrlyshisvalalaglnileleuaspser965970975argmetasnthrlystyraspgluasnasplysleuilearggluval980985990lysvalilethrleulysserlysleuvalseraspphearglysasp99510001005pheglnphetyrlysvalarggluileasnasntyrhishisala101010151020hisaspalatyrleuasnalavalvalglythralaleuilelys102510301035lystyrprolysleuglusergluphevaltyrglyasptyrlys104010451050valtyraspvalarglysmetilealalyssergluglngluile105510601065glylysalathralalystyrphephetyrserasnilemetasn107010751080phephelysthrgluilethrleualaasnglygluilearglys108510901095argproleuilegluthrasnglygluthrglygluilevaltrp110011051110asplysglyargaspphealathrvalarglysvalleusermet111511201125proglnvalasnilevallyslysthrgluvalglnthrglygly113011351140pheserlysgluserileleuprolysargasnserasplysleu114511501155ilealaarglyslysasptrpaspprolyslystyrglyglyphe116011651170aspserprothrvalalatyrservalleuvalvalalalysval117511801185glulysglylysserlyslysleulysservallysgluleuleu119011951200glyilethrilemetgluargserserpheglulysasnproile120512101215asppheleuglualalysglytyrlysgluvallyslysaspleu122012251230ileilelysleuprolystyrserleuphegluleugluasngly123512401245arglysargmetleualaseralaglygluleuglnlysglyasn125012551260gluleualaleuproserlystyrvalasnpheleutyrleuala126512701275serhistyrglulysleulysglyserprogluaspasnglugln128012851290lysglnleuphevalgluglnhislyshistyrleuaspgluile129513001305ilegluglnileserglupheserlysargvalileleualaasp131013151320alaasnleuasplysvalleuseralatyrasnlyshisargasp132513301335lysproilearggluglnalagluasnileilehisleuphethr134013451350leuthrasnleuglyalaproalaalaphelystyrpheaspthr135513601365thrileasparglysargtyrthrserthrlysgluvalleuasp137013751380alathrleuilehisglnserilethrglyleutyrgluthrarg138513901395ileaspleuserglnleuglyglyasplysargproalaalathr140014051410lyslysalaglyglnalalyslyslyslys14151420<210>3<211>208<212>prt<213>人工序列(artificialsequence)<400>3metthraspalaglutyrvalargilehisglulysleuaspiletyr151015thrphelyslysglnphepheasnasnlyslysservalserhisarg202530cystyrvalleuphegluleulysargargglygluargargalacys354045phetrpglytyralavalasnlysproglnserglythrgluarggly505560ilehisalagluilepheserilearglysvalgluglutyrleuarg65707580aspasnproglyglnphethrileasntrptyrsersertrpserpro859095cysalaaspcysalaglulysileleuglutrptyrasnglngluleu100105110argglyasnglyhisthrleulysiletrpalacyslysleutyrtyr115120125glulysasnalaargasnglnileglyleutrpasnleuargaspasn130135140glyvalglyleuasnvalmetvalsergluhistyrglncyscysarg145150155160lysilepheileglnserserhisasnglnleuasngluasnargtrp165170175leuglulysthrleulysargalaglulystrpargsergluleuser180185190ilemetileglnvallysileleuhisthrthrlysserproalaval195200205<210>4<211>98<212>prt<213>人工序列(artificialsequence)<400>4serglyglyserthrasnleuseraspileileglulysgluthrgly151015lysglnleuvalileglngluserileleumetleuproglugluval202530glugluvalileglyasnlysprogluseraspileleuvalhisthr354045alatyraspgluserthraspgluasnvalmetleuleuthrserasp505560alaproglutyrlysprotrpalaleuvalileglnaspserasngly65707580gluasnlysilelysmetleuserglyglyserprolyslyslysarg859095lysval<210>5<211>1026<212>dna<213>人工序列(artificialsequence)<400>5atgaaaaagcctgaactcaccgcgacgtctgtcgagaagtttctgatcgaaaagttcgac60agcgtctccgacctgatgcagctctcggagggcgaagaatctcgtgctttcagcttcgat120gtaggagggcgtggatatgtcctgcgggtaaatagctgcgccgatggtttctacaaagat180cgttatgtttatcggcactttgcatcggccgcgctcccgattccggaagtgcttgacatt240ggggagtttagcgagagcctgacctattgcatctcccgccgttcacagggtgtcacgttg300caagacctgcctgaaaccgaactgcccgctgttctacaaccggtcgcggaggctatggat360gcgatcgctgcggccgatcttagccagacgagcgggttcggcccattcggaccgcaagga420atcggtcaatacactacatggcgtgatttcatatgcgcgattgctgatccccatgtgtat480cactggcaaactgtgatggacgacaccgtcagtgcgtccgtcgcgcaggctctcgatgag540ctgatgctttgggccgaggactgccccgaagtccggcacctcgtgcacgcggatttcggc600tccaacaatgtcctgacggacaatggccgcataacagcggtcattgactggagcgaggcg660atgttcggggattcccaatacgaggtcgccaacatcttcttctggaggccgtggttggct720tgtatggagcagcagacgcgctacttcgagcggaggcatccggagcttgcaggatcgcca780cgactccgggcgtatatgctccgcattggtcttgaccaactctatcagagcttggttgac840ggcaatttcgatgatgcagcttgggcgcagggtcgatgcgacgcaatcgtccgatccgga900gccgggactgtcgggcgtacacaaatcgcccgcagaagcgcggccgtctggaccgatggc960tgtgtagaagtactcgccgatagtggaaaccgacgccccagcactcgtccgagggcaaag1020aaatag1026<210>6<211>23<212>dna<213>人工序列(artificialsequence)<400>6caccccccgccgttcacaggggg23当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1