本发明属于基因工程领域,涉及一种基于crispr-cas的大肠杆菌基因组编辑工具及其在大肠杆菌中的应用。
背景技术:
大肠杆菌作为模式微生物菌株,是分子生物学的常用宿主。在大肠杆菌中建立一种高效的基因组编辑方法极其重要。已经报道了几种在大肠杆菌中建立基于ii型crispr-cas系统的基因组编辑工具,pcas连用ptargetf或ptargett是目前应用最为广泛的一套质粒。我们原先所建立的pcas/ptargetf或ptargett双质粒系统(eccrispr1.0)能在大肠杆菌mg1655中实现迭代的基因组编辑,已经分享到addgene上。但一些研究者在使用pcas后告诉我们,pcas/ptargetf或ptargett双质粒系统在大肠杆菌bl21(de3)中不能工作。于是我们将ptargett-δcada或ptargett-δmaea质粒(jiangy,chenb,etal.applenvironmicrobiol,2015)转化至含pcas的bl21(de3)中后,确实未获得转化子(参见表2),说明现有的基因组编辑工具在一些大肠杆菌如b系大肠杆菌bl21(de3)中编辑效果不佳。我们推测pcas质粒上锚定辅助质粒ptargetf或ptargett复制子的sgrna在bl21(de3)中存在渗漏转录,使得辅助质粒被切割,以至我们在含卡那霉素(50μg/ml)和壮观霉素(50μg/ml)双抗筛选平板上无法获得转化子。
技术实现要素:
为了克服现有技术的双质粒crispr-cas9基因编辑系统的上述缺陷,我们设计了一种新的思路,包括如下策略:1.将pcas质粒上laci/trc启动子替换为鼠李糖诱导型启动子(rhas/rhar)来控制切割辅助质粒dna序列的grna,避免在某些大肠杆菌比如bl21(de3)中渗漏转录切割辅助质粒,从而能在更多类型的大肠杆菌中实现基因组编辑;2.将pcas质粒上的温敏型复制子psc101ts更换为psc101,使得大肠杆菌能在37℃下快速生长,避免需低温(eccrispr1.0为30℃)培养的限制,缩短了实验周期;3.将sacb基因添加至pcas质粒上,可用于质粒丢除时在蔗糖平板上进行反筛,代替原先的低温反筛。最终获得升级版质粒peccas(eccrispr2.0)。
因此,本发明的第一个目的在于提供一种通用型的大肠杆菌基因组编辑工具。其包括如下技术方案:
一种基于crispr-cas的大肠杆菌基因组编辑工具,其包括用于表达核酸内切酶cas9的质粒peccas,该质粒peccas包括cas9核酸酶基因、用于提高编辑效率的λ-red重组系统(或称重组酶)基因、arac蛋白基因、sacb基因、复制子psc101、鼠李糖调节蛋白rhas/rhar基因、用于将cas9导向辅助质粒dna序列的sgrna序列。
上述λ-red重组系统包含exo蛋白、beta蛋白、gam蛋白。λ-red重组系统的表达可以用阿拉伯糖诱导,受到阿拉伯糖启动子的调控。
上述rhas/rhar基因的添加使得鼠李糖诱导型启动子替换laci/trc启动子,以避免切割辅助质粒的sgran渗漏转录。
优选地,上述质粒peccas还包含卡那霉素抗性基因kanr。
在一种实施方式中,上述cas9核酸酶基因是化脓链球菌来源的cas9核酸酶基因,也可以是其他微生物来源的cas核酸酶基因。
为了实现基因编辑功能,上述大肠杆菌基因组编辑工具还包括与质粒peccas配合使用的另一个辅助质粒(选自ptargetf或ptargett),从而使得上述大肠杆菌基因组编辑工具呈现为peccas/ptargetf或peccas/ptargett双质粒系统。
上述质粒peccas还包括用于将cas9导向辅助质粒dna序列的sgrna序列,该sgrna序列的转录由l-鼠李糖诱导。
当基因组编辑完成后,上述sgrna序列用于靶向辅助质粒dna序列,引导cas9切割辅助质粒,达到消除辅助质粒效果。
优选上述sgrna序列是位于鼠李糖启动子prha下游的20nt的与靶序列互补的n20序列,其为:5’-ctatcgtcttgagtccaacc-3’(seqidno:2)。
该n20序列与复制子pmb1和p15a基因的部分序列相同,pmb1和p15a基因上该n20序列之后是pam序列5’-cgg-3’。
上述质粒peccas的核苷酸序列可以为seqidno:1,其包括14605个碱基。
上述辅助质粒ptargetf或ptargett与质粒peccas配套使用,其包含用于靶向大肠杆菌基因组预定位点的sgrna、pmb1和/或p15a复制子。
上述辅助质粒上的sgrna的长度可以是18-25nt,优选19-22nt,更优选为20nt。
优选地,辅助质粒ptargetf或ptargett还包含壮观霉素抗性基因aada。
在一种实施方式中,上述辅助质粒上sgrna的转录由pj23119组成型启动子控制。
上述大肠杆菌基因组编辑工具呈试剂盒形式,其包含质粒peccas、辅助质粒ptargetf或ptargett、用于实施基因组编辑的各种pcr引物等。
本发明的第二个目的在于提供一种构建上述peccas的方法,其包括如下步骤:
通过pcr扩增获得psc101复制子片段;以pcas质粒为模板,pcr扩增出卡那霉素抗性基因kanr片段;以pcas质粒为模板,pcr扩增出cas9和λ-red重组酶基因片段;从枯草芽孢杆菌基因组dna中扩增出sacb基因片段;从文献jiangy,chenb,etal.,applenvironmicrobiol,2015报道的ptargetf-cada质粒中扩增sgrna片段;从大肠杆菌mg1655基因组dna中扩增rhars片段,将上述六个片段组装后,获得peccas质粒。
优选地,上述组装可以是clonexpressmultisonestepcloningkit(vazyme)组装或者gibson组装。
本发明的第三个目的在于提供上述新型大肠杆菌基因组编辑工具在b系和k-12系大肠杆菌中的应用,用于实现基因组编辑。本发明的大肠杆菌基因组编辑工具适应性广,可以应用于b系、k-12系及w系大肠杆菌的基因组编辑,例如可以用于大肠杆菌bl21及其衍生株比如bl21(de3)、或者大肠杆菌mg1655的基因组编辑。
在一种优选的实施方式中,上述应用包括下述步骤:
1)将质粒peccas转化至大肠杆菌感受态细胞中,37℃条件下在含卡那霉素的lb固体平板上进行筛选;
2)挑取阳性克隆子,制备电转感受态细胞,在离心收集前1小时加入阿拉伯糖诱导red重组酶表达;
3)通过电转化将辅助质粒ptargetf或ptargett转入步骤2)所得感受态细胞,菌液涂布于含卡那霉素和壮观霉素双抗lb固体平板,37℃过夜培养后对克隆子进行验证,筛选;
4)挑取阳性克隆子于含卡那霉素的lb培养液中,加入鼠李糖,诱导导向辅助质粒dna序列的sgrna序列转录,并在含壮观霉素的lb固体平板上验证辅助质粒的消除;
5)挑取辅助质粒消除阳性克隆子,直接在含葡萄糖的lb液体培养基中37℃过夜培养,吸取菌液于含葡萄糖和蔗糖的lb固体平板上划线分单菌,单菌落在含卡那霉素抗性lb平板上进行鉴定,验证peccas质粒消除,得到编辑菌株。
本发明的大肠杆菌基因组编辑工具peccas/ptargetf或ptargett是一种通用型的双质粒系统,能够在k-12系、b系及w系大肠杆菌中有效地实现基因组编辑,缩短了编辑周期,且宿主的适应性更广。
附图说明
图1是质粒peccas质粒的结构示意图。
图2是质粒peccas中sgrna序列的结构示意图。该基因片段用于锚定辅助质粒dna序列的pmb1和/或p15a复制子,其中n20序列与复制子pmb1和p15a基因的部分序列相同,pmb1和p15a基因上该n20序列之后是pam序列5’-cgg-3’。
具体实施方式
在本文中,为了描述简便,有时会将某种蛋白比如cas9与其编码基因(dna)名称混用,本领域技术人员应能理解它们在不同描述场合表示不同的物质。本领域技术人员根据语境和上下文容易理解它们的含义。例如,对于cas9,用于描述核酸酶功能或类别时,指的是蛋白质;在作为一种基因描述时,指的是编码该cas9的基因。类似地,有时会将rna比如sgrna与其编码基因(dna)名称混用,本领域技术人员应能理解它们在不同描述场合表示不同的物质。
本发明的大肠杆菌基因组编辑工具可以是质粒peccas与辅助质粒的双质粒组合,其中辅助质粒可以是ptargetf或ptargett,ptargetf和ptargett的区别在于ptargetf质粒上不含有同源重组所需的同源臂序列,同源臂是以片段形式单独提供;而ptargett是将同源臂序列克隆在质粒上。
在该双质粒系统中,peccas质粒表达的切口酶cas9要在两个地方起作用:第一是辅助质粒上的sgrna引导cas9对大肠杆菌基因组靶点进行切割,实现基因组改造;第二是在基因组改造完成后,为了得到不含质粒的宿主菌便于迭代编辑,需要利用peccas质粒上的sgrna引导cas9对辅助质粒的pmb1和/或p15a复制子进行切割,以消除辅助质粒。
考虑到实验操作方便目的,本发明的大肠杆菌基因组编辑工具可以为试剂盒,将所需的材料整合在一个试剂盒中。在优选的实施方式中,上述试剂盒除了包含质粒peccas、ptargetf或ptargett质粒、用于实施基因组编辑的各种pcr引物等外,还可分别包括下述物品中的至少之一:携带工具,其空间划分为可以收容一种或多种容器、96孔板或板条的限定空间,该容器例如是试剂盒、药瓶、试管、和类似物,每样容器都含有一个单独的用于本发明方法的组分;说明书,其可以写在瓶子、试管和类似物上,或者写在一张单独的纸上,或者在容器的外部或内部,例如是带有操作演示视频app下载窗口比如二维码的纸件,说明书也可以是多媒体的形式,比如cd、u盘、网盘等。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于举例说明目的,而不是对本发明的限制。此外应理解,在阅读了本发明的构思之后,本领域技术人员对其作出的各种改变或调整,均应落入本发明的保护范围内,这些等价形式同样属于本申请所附权利要求书限定的范围。
本文中涉及到多种物质的添加量、含量及浓度,其中所述的百分含量,除特别说明外,皆指质量百分含量。
在实施例中,为了将双质粒系统中的peccas与辅助质粒(ptargetf或ptargett)简化表述,将peccas称作质粒a,并将辅助质粒比如ptargett-δcada和ptargett-δmaea称作质粒b。
实施例
材料和方法
本文中的引物合成由上海百力格生物技术有限公司完成,测序由上海生工生物工程股份有限公司完成。
本文中的分子生物学实验包括质粒构建、酶切、连接、感受态细胞制备、转化、培养基配制等等,主要参照《分子克隆实验指南》(第三版),j.萨姆布鲁克,d.w.拉塞尔(美)编著,黄培堂等译,科学出版社,北京,2002)进行。必要时可以通过简单试验确定具体实验条件。
pcr扩增实验根据质粒或dna模板供应商提供的反应条件或说明书进行。必要时可以通过简单试验予以调整。
实施例1质粒peccas的构建
构建peccas质粒所需的引物见表1。
表1、pcr引物序列
注:表中引物名称后缀的数字1代表正向引物即-f,数字2代表反向引物即-r。
1.1构建psc101复制子片段
以repa1/repa2为引物,pmw119载体(nippongene)为模板,pcr扩增获得psc101复制子片段。
pcr反应体系(50μl):
pcr反应条件:
kodplus试剂盒购自东洋纺(上海)生物科技有限公司。
1.2构建卡那霉素抗性基因kanr片段
以kan1/kan2为引物,pcas质粒(addgene:62225)为模板,pcr扩增出卡那霉素抗性基因kanr片段。
pcr反应条件及所需试剂同步骤1.1。
1.3扩增cas9和λ-red重组酶基因片段
以casred1/casred2为引物,pcas质粒(addgene:62225)为模板,pcr分别扩增出cas9和λ-red重组酶基因片段。
pcr反应条件及所需试剂同步骤1.1。
1.4扩增sacb基因片段
以sac1/sac2为引物,从枯草芽孢杆菌(atcc23857)基因组dna中扩增出sacb基因片段。
pcr反应条件及所需试剂同步骤1.1。
1.5构建sgrna片段
用引物sgrna1/sgrna2从ptargetf-cada质粒(jiangy,chenb,etal.applenvironmicrobiol,2015)中扩增sgrna片段。
pcr反应条件及所需试剂同步骤1.1。
1.6扩增rhar、rhas片段
用引物rha1/rha2从大肠杆菌mg1655(atcc700926)基因组dna中扩增rhars片段。
pcr反应条件及所需试剂同步骤1.1。
1.7片段组装
上述步骤得到的六个片段使用clonexpressmultisonestepcloningkit(vazyme)组装,获得peccas质粒。测序验证正确。
pcr反应条件及所需试剂同步骤1.1。
实施例2大肠杆菌基因组编辑
2.1将peccas质粒分别转化至大肠杆菌mg1655和bl21(de3)化学感受态细胞中,37℃条件下在含卡那霉素(50μg/ml)的lb固体平板上进行筛选;化学转化感受态细胞制备方法参考《分子克隆实验指南》(第三版);
2.2挑取阳性克隆子,制备电转感受态细胞,在离心收集前1小时加入10mm的阿拉伯糖诱导red重组酶表达;
2.3电转化转入辅助质粒ptargett-δcada或ptargett-δmaea质粒(电转电压为2.5kv),37℃、200rpm条件下复苏1小时后,菌液涂布于含卡那霉素(50μg/ml)和壮观霉素(50μg/ml)双抗lb固体平板,37℃过夜培养后对克隆子进行验证、筛选;电转化感受态细胞制备方法参考《分子克隆实验指南》(第三版);
2.4辅助质粒消除:挑取阳性克隆子于lb液体(含卡那霉素50μg/ml),加入10mm的鼠李糖,诱导导向辅助质粒dna序列的sgrna序列转录,培养过夜,划线分单菌,并在含壮观霉素(50μg/ml)lb固体平板上验证辅助质粒的消除;
2.5peccas质粒消除:挑取辅助质粒消除阳性克隆子,直接在含5g/l葡萄糖lb液体培养基中37℃过夜摇床培养,吸取少量菌液于含5g/l葡萄糖和10g/l蔗糖lb固体平板上划线分单菌。单菌落在含卡那霉素(50μg/ml)抗性lb平板上进行鉴定,验证peccas质粒消除。
我们将辅助质粒ptargett-δcada或ptargett-δmaea质粒分别转化至含peccas的大肠杆菌bl21(de3)和mg61655中后,成功获得编辑菌株,编辑效率和质粒消除率见表2。
表2、peccas在大肠杆菌mg1655和bl21(de3)中进行基因编辑的比较
a.正确编辑的克隆株数/筛选的克隆株总数
表2中对比结果显示,大肠杆菌mg1655中,使用peccas的编辑效率与pcas相当;但在大肠杆菌bl21(de3)中,peccas具有很高的编辑效率,但pcas没有编辑效果。表明新型的大肠杆菌基因组编辑工具peccas的宿主适应性更广。
以上实验以peccas/ptargetf或ptargett双质粒系统为实施例对本发明的大肠杆菌基因组编辑工具的功能和特点进行了验证,本领域的技术人员应理解,在不违背本发明的思想下,本领域技术人员可以在此基础上做出各种改动或者修改,所做的各种变形或者修改的等价形式,同样应属于本发明的范围。
序列表
<110>中国科学院上海生命科学研究院
<120>一种基于crispr-cas的大肠杆菌基因组编辑工具
<130>shpi1910731
<160>2
<170>siposequencelisting1.0
<210>1
<211>14605
<212>dna
<213>人工序列()
<400>1
catgggtatggacagttttccctttgatatgtaacggtgaacagttgttctacttttgtt60
tgttagtcttgatgcttcactgatagatacaagagccataagaacctcagatccttccgt120
atttagccagtatgttctctagtgtggttcgttgtttttgcgtgagccatgagaacgaac180
cattgagatcatacttactttgcatgtcactcaaaaattttgcctcaaaactggtgagct240
gaatttttgcagttaaagcatcgtgtagtgtttttcttagtccgttacgtaggtaggaat300
ctgatgtaatggttgttggtattttgtcaccattcatttttatctggttgttctcaagtt360
cggttacgagatccatttgtctatctagttcaacttggaaaatcaacgtatcagtcgggc420
ggcctcgcttatcaaccaccaatttcatattgctgtaagtgtttaaatctttacttattg480
gtttcaaaacccattggttaagccttttaaactcatggtagttattttcaagcattaaca540
tgaacttaaattcatcaaggctaatctctatatttgccttgtgagttttcttttgtgtta600
gttcttttaataaccactcataaatcctcatagagtatttgttttcaaaagacttaacat660
gttccagattatattttatgaatttttttaactggaaaagataaggcaatatctcttcac720
taaaaactaattctaatttttcgcttgagaacttggcatagtttgtccactggaaaatct780
caaagcctttaaccaaaggattcctgatttccacagttctcgtcatcagctctctggttg840
ctttagctaatacaccataagcattttccctactgatgttcatcatctgagcgtattggt900
tataagtgaacgataccgtccgttctttccttgtagggttttcaatcgtggggttgagta960
gtgccacacagcataaaattagcttggtttcatgctccgttaagtcatagcgactaatcg1020
ctagttcatttgctttgaaaacaactaattcagacatacatctcaattggtctaggtgat1080
tttaatcactataccaattgagatgggctagtcaatgataattactagtccttttccttt1140
gagttgtgggtatctgtaaattctgctagacctttgctggaaaacttgtaaattctgcta1200
gaccctctgtaaattccgctagacctttgtgtgttttttttgtttatattcaagtggtta1260
taatttatagaataaagaaagaataaaaaaagataaaaagaatagatcccagccctgtgt1320
ataactcactactttagtcagttccgcagtattacaaaaggatgtcgcaaacgctgtttg1380
ctcctctacaaaacagaccttaaaaccctaaaggcttaagtagcaccctcgcaagctcgg1440
ttgcggccgcaatcgggcaaatcgctgaatattccttttgtctccgaccatcaggcacct1500
gagtcgctgtctttttcgtgacattcagttcgctgcgctcacggctctggcagtgaatgg1560
gggtaaatggcactacaggcgccttttatggattcatgcaaggaaactacccataataca1620
agaaaagcccgtcacgggcttctcagggcgttttatggcgggtctgctatgtggtgctat1680
ctgactttttgctgttcagcagttcctgccctctgattttccagtctgaccacttcggat1740
tatcccgtgacaggtcattcagactggctaatgcacccagtaaggcagcggtatcatcaa1800
cccactgcagcaaccaattaaccaattctgattagaaaaactcatcgagcatcaaatgaa1860
actgcaatttattcatatcaggattatcaataccatatttttgaaaaagccgtttctgta1920
atgaaggagaaaactcaccgaggcagttccataggatggcaagatcctggtatcggtctg1980
cgattccgactcgtccaacatcaatacaacctattaatttcccctcgtcaaaaataaggt2040
tatcaagtgagaaatcaccatgagtgacgactgaatccggtgagaatggcaaaagcttat2100
gcatttctttccagacttgttcaacaggccagccattacgctcgtcatcaaaatcactcg2160
catcaaccaaaccgttattcattcgtgattgcgcctgagcgagacgaaatacgcgatcgc2220
tgttaaaaggacaattacaaacaggaatcgaatgcaaccggcgcaggaacactgccagcg2280
catcaacaatattttcacctgaatcaggatattcttctaatacctggaatgctgttttcc2340
cggggatcgcagtggtgagtaaccatgcatcatcaggagtacggataaaatgcttgatgg2400
tcggaagaggcataaattccgtcagccagtttagtctgaccatctcatctgtaacatcat2460
tggcaacgctacctttgccatgtttcagaaacaactctggcgcatcgggcttcccataca2520
atcgatagattgtcgcacctgattgcccgacattatcgcgagcccatttatacccatata2580
aatcagcatccatgttggaatttaatcgcggcctcgagcaagacgtttcccgttgaatat2640
ggctcataacaccccttgtattactgtttatgtaagcagacagttttattgttcatgatg2700
atatatttttatcttgtgcaatgtaacatcagagattttgagacacaacgtggctttccc2760
tgcagctgaacaatacttaatactatagaatgataacaaaataaactactttttaaaaga2820
attttgtgttataatctatttattattaagtattgggtaatattttttgaagagatattt2880
tgaaaaagaaaaattaaagcatattaaactaatttcggaggtcattaaaactattattga2940
aatcatcaaactcattatggatttaatttaaactttttattttaggaggcaaaaatggat3000
aagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcact3060
gatgattataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagt3120
atcaaaaaaaatcttataggggctcttttatttgacagtggagagacagcggaagcgact3180
cgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatcta3240
caggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaa3300
gagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatata3360
gtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattg3420
gtagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgatt3480
aagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggac3540
aaactatttatccagttggtacaaacctacaatcaattatttgaagaaaaccctattaac3600
gcaagtggagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgatta3660
gaaaatctcattgctcagctccccggtgagaagaaaaatggcttatttgggaatctcatt3720
gctttgtcattgggtttgacccctaattttaaatcaaattttgatttggcagaagatgct3780
aaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaatt3840
ggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactt3900
tcagatatcctaagagtaaatactgaaataactaaggctcccctatcagcttcaatgatt3960
aaacgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaa4020
cttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttat4080
attgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaa4140
atggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaa4200
cggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctatt4260
ttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaa4320
atcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgtttt4380
gcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtc4440
gataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatctt4500
ccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataac4560
gaattgacaaaggtcaaatatgttactgaaggaatgcgaaaaccagcatttctttcaggt4620
gaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaag4680
caattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcagga4740
gttgaagatagatttaatgcttcattaggtacctaccatgatttgctaaaaattattaaa4800
gataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaaca4860
ttgaccttatttgaagatagggagatgattgaggaaagacttaaaacatatgctcacctc4920
tttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttg4980
tctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagatttt5040
ttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttg5100
acatttaaagaagacattcaaaaagcacaagtgtctggacaaggcgatagtttacatgaa5160
catattgcaaatttagctggtagccctgctattaaaaaaggtattttacagactgtaaaa5220
gttgttgatgaattggtcaaagtaatggggcggcataagccagaaaatatcgttattgaa5280
atggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaa5340
cgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaa5400
aatactcaattgcaaaatgaaaagctctatctctattatctccaaaatggaagagacatg5460
tatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgtt5520
ccacaaagtttccttaaagacgattcaatagacaataaggtcttaacgcgttctgataaa5580
aatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactat5640
tggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaa5700
gctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggtt5760
gaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaa5820
tacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaatta5880
gtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccat5940
catgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatcca6000
aaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgatt6060
gctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatc6120
atgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctcta6180
atcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccaca6240
gtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagaca6300
ggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgt6360
aaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattca6420
gtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagag6480
ttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgacttttta6540
gaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagt6600
ctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaa6660
ggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattat6720
gaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcat6780
aagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttatttta6840
gcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaata6900
cgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgct6960
gcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagtt7020
ttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttg7080
agtcagctaggaggtgactgaagtatattttagatgaagattatttcttaatctagacat7140
gagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatt7200
tccccgaaaagtgccacctgcatcgatttattatgacaacttgacggctacatcattcac7260
tttttcttcacaaccggcacggaactcgctcgggctggccccggtgcattttttaaatac7320
ccgcgagaaatagagttgatcgtcaaaaccaacattgcgaccgacggtggcgataggcat7380
ccgggtggtgctcaaaagcagcttcgcctggctgatacgttggtcctcgcgccagcttaa7440
gacgctaatccctaactgctggcggaaaagatgtgacagacgcgacggcgacaagcaaac7500
atgctgtgcgacgctggcgatatcaaaattgctgtctgccaggtgatcgctgatgtactg7560
acaagcctcgcgtacccgattatccatcggtggatggagcgactcgttaatcgcttccat7620
gcgccgcagtaacaattgctcaagcagatttatcgccagcagctccgaatagcgcccttc7680
cccttgcccggcgttaatgatttgcccaaacaggtcgctgaaatgcggctggtgcgcttc7740
atccgggcgaaagaaccccgtattggcaaatattgacggccagttaagccattcatgcca7800
gtaggcgcgcggacgaaagtaaacccactggtgataccattcgcgagcctccggatgacg7860
accgtagtgatgaatctctcctggcgggaacagcaaaatatcacccggtcggcaaacaaa7920
ttctcgtccctgatttttcaccaccccctgaccgcgaatggtgagattgagaatataacc7980
tttcattcccagcggtcggtcgataaaaaaatcgagataaccgttggcctcaatcggcgt8040
taaacccgccaccagatgggcattaaacgagtatcccggcagcaggggatcattttgcgc8100
ttcagccatacttttcatactcccgccattcagagaagaaaccaattgtccatattgcat8160
cagacattgccgtcactgcgtcttttactggctcttctcgctaaccaaaccggtaacccc8220
gcttattaaaagcattctgtaacaaagcgggaccaaagccatgacaaaaacgcgtaacaa8280
aagtgtctataatcacggcagaaaagtccacattgattatttgcacggcgtcacactttg8340
ctatgccatagcatttttatccataagattagcggatcctacctgacgctttttatcgca8400
actctctactgtttctccatacccgtttttttgggaattcgagctctaaggaggttataa8460
aaaatggatattaatactgaaactgagatcaagcaaaagcattcactaaccccctttcct8520
gttttcctaatcagcccggcatttcgcgggcgatattttcacagctatttcaggagttca8580
gccatgaacgcttattacattcaggatcgtcttgaggctcagagctgggcgcgtcactac8640
cagcagctcgcccgtgaagagaaagaggcagaactggcagacgacatggaaaaaggcctg8700
ccccagcacctgtttgaatcgctatgcatcgatcatttgcaacgccacggggccagcaaa8760
aaatccattacccgtgcgtttgatgacgatgttgagtttcaggagcgcatggcagaacac8820
atccggtacatggttgaaaccattgctcaccaccaggttgatattgattcagaggtataa8880
aacgaatgagtactgcactcgcaacgctggctgggaagctggctgaacgtgtcggcatgg8940
attctgtcgacccacaggaactgatcaccactcttcgccagacggcatttaaaggtgatg9000
ccagcgatgcgcagttcatcgcattactgatcgttgccaaccagtacggccttaatccgt9060
ggacgaaagaaatttacgcctttcctgataagcagaatggcatcgttccggtggtgggcg9120
ttgatggctggtcccgcatcatcaatgaaaaccagcagtttgatggcatggactttgagc9180
aggacaatgaatcctgtacatgccggatttaccgcaaggaccgtaatcatccgatctgcg9240
ttaccgaatggatggatgaatgccgccgcgaaccattcaaaactcgcgaaggcagagaaa9300
tcacggggccgtggcagtcgcatcccaaacggatgttacgtcataaagccatgattcagt9360
gtgcccgtctggccttcggatttgctggtatctatgacaaggatgaagccgagcgcattg9420
tcgaaaatactgcatacactgcagaacgtcagccggaacgcgacatcactccggttaacg9480
atgaaaccatgcaggagattaacactctgctgatcgccctggataaaacatgggatgacg9540
acttattgccgctctgttcccagatatttcgccgcgacattcgtgcatcgtcagaactga9600
cacaggccgaagcagtaaaagctcttggattcctgaaacagaaagccgcagagcagaagg9660
tggcagcatgacaccggacattatcctgcagcgtaccgggatcgatgtgagagctgtcga9720
acagggggatgatgcgtggcacaaattacggctcggcgtcatcaccgcttcagaagttca9780
caacgtgatagcaaaaccccgctccggaaagaagtggcctgacatgaaaatgtcctactt9840
ccacaccctgcttgctgaggtttgcaccggtgtggctccggaagttaacgctaaagcact9900
ggcctggggaaaacagtacgagaacgacgccagaaccctgtttgaattcacttccggcgt9960
gaatgttactgaatccccgatcatctatcgcgacgaaagtatgcgtaccgcctgctctcc10020
cgatggtttatgcagtgacggcaacggccttgaactgaaatgcccgtttacctcccggga10080
tttcatgaagttccggctcggtggtttcgaggccataaagtcagcttacatggcccaggt10140
gcagtacagcatgtgggtgacgcgaaaaaatgcctggtactttgccaactatgacccgcg10200
tatgaagcgtgaaggcctgcattatgtcgtgattgagcgggatgaaaagtacatggcgag10260
ttttgacgagatcgtgccggagttcatcgaaaaaatggacgaggcactggctgaaattgg10320
ttttgtatttggggagcaatggcgatgacgcatcctcacgataatatccgggtaggcgca10380
atcactttcgtctactccgttacaaagcgaggctgggtatttcccggcctttctgttatc10440
cgaaatccactgaaagcacagcggctggctgaggagataaataataaacgaggggctgta10500
tgcacaaagcatcttctgttgagttaagaacgagtatcgagatggcacatagccttgctc10560
aaattggaatcaggtttgtgccaataccagtagaaacagacgaagaatccatgggtatgg10620
acagatcctctttaggcccgtagtctgcaaatccttttatgattttctatcaaacaaaag10680
aggaaaatagaccagttgcaatccaaacgagagtctaatagaatgaggtcgaaaagtaaa10740
tcgcgcgggtttgttactgataaagcaggcaagacctaaaatgtgtaaagggcaaagtgt10800
atactttggcgtcaccccttacatattttaggtctttttttattgtgcgtaactaacttg10860
ccatcttcaaacaggagggctggaagaagcagaccgctaacacagtacataaaaaaggag10920
acatgaacgatgaacatcaaaaagtttgcaaaacaagcaacagtattaacctttactacc10980
gcactgctggcaggaggcgcaactcaagcgtttgcgaaagaaacgaaccaaaagccatat11040
aaggaaacatacggcatttcccatattacacgccatgatatgctgcaaatccctgaacag11100
caaaaaaatgaaaaatatcaagttcctgaattcgattcgtccacaattaaaaatatctct11160
tctgcaaaaggcctggacgtttgggacagctggccattacaaaacgctgacggcactgtc11220
gcaaactatcacggctaccacatcgtctttgcattagccggagatcctaaaaatgcggat11280
gacacatcgatttacatgttctatcaaaaagtcggcgaaacttctattgacagctggaaa11340
aacgctggccgcgtctttaaagacagcgacaaattcgatgcaaatgattctatcctaaaa11400
gaccaaacacaagaatggtcaggttcagccacatttacatctgacggaaaaatccgttta11460
ttctacactgatttctccggtaaacattacggcaaacaaacactgacaactgcacaagtt11520
aacgtatcagcatcagacagctctttgaacatcaacggtgtagaggattataaatcaatc11580
tttgacggtgacggaaaaacgtatcaaaatgtacagcagttcatcgatgaaggcaactac11640
agctcaggcgacaaccatacgctgagagatcctcactacgtagaagataaaggccacaaa11700
tacttagtatttgaagcaaacactggaactgaagatggctaccaaggcgaagaatcttta11760
tttaacaaagcatactatggcaaaagcacatcattcttccgtcaagaaagtcaaaaactt11820
ctgcaaagcgataaaaaacgcacggctgagttagcaaacggcgctctcggtatgattgag11880
ctaaacgatgattacacactgaaaaaagtgatgaaaccgctgattgcatctaacacagta11940
acagatgaaattgaacgcgcgaacgtctttaaaatgaacggcaaatggtacctgttcact12000
gactcccgcggatcaaaaatgacgattgacggcattacgtctaacgatatttacatgctt12060
ggttatgtttctaattctttaactggcccatacaagccgctgaacaaaactggccttgtg12120
ttaaaaatggatcttgatcctaacgatgtaacctttacttactcacacttcgctgtacct12180
caagcgaaaggaaacaatgtcgtgattacaagctatatgacaaacagaggattctacgca12240
gacaaacaatcaacgtttgcgccaagcttcctgctgaacatcaaaggcaagaaaacatct12300
gttgtcaaagacagcatccttgaacaaggacaattaacagttaacaaataaaaacgcaaa12360
agaaaatgccgatatcctattggcattttcttttatttcttatcaacataaaggtgaatc12420
ccatatgaactatataaaagcaggcaaatggctaaccgtattcctcaaaaaaagcaccga12480
ctcggtgccactttttcaagttgataacggactagccttattttaacttgctatttctag12540
ctctaaaacggttggactcaagacgatagttacgaccagtctaaaaagcgcctgaattcg12600
cgaccttctcgttactgacaggaaaatgggccattggcaaccagggaaagatgaacgtga12660
tgatgttcacaatttgctgaattgtggtgatgtgatgctcaccgcatttcctgaaaattc12720
acgctgtatcttgaaaaatcgacgttttttacgtggttttccgtcgaaaatttaaggtaa12780
gaacctgacctcgtgattactatttcgccgtgttgacgacatcaggaggccagtatgacc12840
gtattacatagtgtggatttttttccgtctggtaacgcgtccgtggcgatagaaccccgg12900
ctcccgcaggcggattttcctgaacatcatcatgattttcatgaaattgtgattgtcgaa12960
catggcacgggtattcatgtgtttaatgggcagccctataccatcaccggtggcacggtc13020
tgtttcgtacgcgatcatgatcggcatctgtatgaacataccgataatctgtgtctgacc13080
aatgtgctgtatcgctcgccggatcgatttcagtttctcgccgggctgaatcagttgctg13140
ccacaagagctggatgggcagtatccgtctcactggcgcgttaaccacagcgtattgcag13200
caggtgcgacagctggttgcacagatggaacagcaggaaggggaaaatgatttaccctcg13260
accgccagtcgcgagatcttgtttatgcaattactgctcttgctgcgtaaaagcagtttg13320
caggagaacctggaaaacagcgcatcacgtctcaacttgcttctggcctggctggaggac13380
cattttgccgatgaggtgaattgggatgccgtggcggatcaattttctctttcactgcgt13440
acgctacatcggcagcttaagcagcaaacgggactgacgcctcagcgatacctgaaccgc13500
ctgcgactgatgaaagcccgacatctgctacgccacagcgaggccagcgttactgacatc13560
gcctatcgctgtggattcagcgacagtaaccacttttcgacgctttttcgccgagagttt13620
aactggtcaccgcgtgatattcgccagggacgggatggctttctgcaataacgcgaatct13680
tctcaacgtatttgtacgccatattgcgaataatcaacttcgttctctggccgaggtagc13740
cacggtggcgcatcagttaaaacttctcaaagatgatttttttgccagcgaccagcaggc13800
agtcgctgtggctgaccgttatccgcaagatgtctttgctgaacatacacatgatttttg13860
tgagctggtgattgtctggcgcggtaatggcctgcatgtactcaacgatcgcccttatcg13920
cattacccgtggcgatctcttttacattcatgctgacgataaacactcctacgcttccgt13980
taacgatctggttttgcagaatattatttattgcccggagcgtctgaagctgaatcttga14040
ctggcagggggcgattccgggatttaacgccagcgcagggcaaccacactggcgcttagg14100
tagcatggggatggcgcaggcgcggcaggttatcggtcagcttgagcatgaaagtagtca14160
gcatgtgccgtttgctaacgaaatggctgagttgctgttcgggcagttggtgatgttgct14220
gaatcgccatcgttacaccagtgattcgttgccgccaacatccagcgaaacgttgctgga14280
taagctgattacccggctggcggctagcctgaaaagtccctttgcgctggataaattttg14340
tgatgaggcatcgtgcagtgagcgcgttttgcgtcagcaatttcgccagcagactggaat14400
gaccatcaatcaatatctgcgacaggtcagagtgtgtcatgcgcaatatcttctccagca14460
tagccgcctgttaatcagtgatatttcgaccgaatgtggctttgaagatagtaactattt14520
ttcggtggtgtttacccgggaaaccgggatgacgcccagccagtggcgtcatctcaattc14580
gcagaaagattaattcgccatgccc14605
<210>2
<211>20
<212>dna
<213>人工序列()
<400>2
ctatcgtcttgagtccaacc20