本发明涉及一种肝素前体合酶及其应用,属于生物工程技术领域。
背景技术:
肝素(heparin)属于一类高度硫酸化的糖胺聚糖(gags),具有独特的生理功能。肝素作为一种抗凝血和抗血栓药物,在深部静脉血栓形成、肾透析和留置导管分流术、及术后血栓控制等医疗措施中使用。其结构复杂,具有生物活性多样等特点,因此研发肝素成为近年来多糖药物研究的热点。当前,肝素获得主要依赖动物组织提取,但是随着对肝素需求的不断增加,仅依赖动物组织制备无法满足需求,同时,疯牛病的发生以及2008年以来发生的肝素污染事件,使人们对从动物体内获得肝素的安全性提出了质疑。为此,采用安全有效的化学酶法合成肝素成为人们寻求新肝素来源的途径。
肝素前体(heparosan),结构式[-glcua-β(1,4)-glcnac-α(1,4)-]n(glcua是葡萄糖醛酸,glcnac是葡萄糖乙酰胺,是合成肝素的前体,也是合成过程中最重要的模板),其未被硫酸化且未将葡萄糖醛酸异构化为艾杜糖醛酸,heparosan具有与肝素类似的多糖骨架,因此,可作为肝素的生物合成骨架。根据文献报道,已知的可以产heparosan的微生物有大肠杆菌e.colik5和多杀巴斯德杆菌pasteurellamultocidad型,其中e.colik5产生的heparosan的分子量为10-20kda,更接近肝素的分子量大小。k5基因簇中具有编码乙酰葡萄糖胺转移酶kfia和编码葡萄糖醛酸转移酶kfic的基因(即kfia和kfic),它们分别将尿苷二磷酸(udp)前体形式存在的单糖,即udp-葡糖醛酸(udp-glcua)、udp-乙酰葡萄糖胺(udp-glcnac)交替连接形成肝素前体多糖链,因此这两种酶需要共同作用,名称上将其统称为肝素前体合酶。不同的是,p.multocida来源的肝素前体合酶pmhs虽然为双功能糖基转移酶,即同时具有转运udp-glcua和udp-glcnac的作用,且蛋白较小(652个氨基酸),但pmhs合成的肝素前体分子量在200-300kda,分子量过大,与动物来源的天然肝素相差甚远,尤其是如今市场上,低分子量肝素或超低分子量肝素因具有更长的半衰期和更良好的生物皮下利用率而更加受到关注,因此不利于下游硫酸化修饰获得商品化肝素药品。尽管e.colik5避免了这一问题,但其来源的两个独立的糖基转移酶kfic和kfia,它们附着在细胞膜上的位置、距离不一定为最佳,这一因素可能会影响聚合速率与效率,
技术实现要素:
针对现有技术存在的上述缺陷,本发明采用linker连接两酶或进行融合使其作为整体,调节酶之间的作用距离。
本发明的第一个目的是提供一种新型肝素前体合酶,所述合酶的氨基酸序列如seqidno.1、seqidno.2、seqidno.3所示。
本发明的第二个目的是提供编码所述合酶的基因,包括(a)、(b)、(c):
(a)在seqidno.6所示序列基础上,将s102-l315区域的碱基序列替换为seqidno.5所示序列中的s237-l450区域,i394-f599区域的碱基序列替换为seqidno.4所示序列中的i2-f207区域;
(b)将seqidno.5所示序列与seqidno.6所示序列通过柔性linker(ggggs)2连接;
(c)将seqidno.5所示序列的终止密码子端与seqidno.6所示序列的起始密码子端连接,且seqidno.6所示序列的起始密码子atg去掉。
本发明的第三个目的是提供含有所述基因的载体或细胞。
本发明的第四个目的是提供获得所述新型肝素前体合酶的方法,所述方法是将大肠杆菌k5来源的肝素前体合酶kfic和kfia进行融合,或将多杀巴斯德杆菌来源的肝素前体合酶中两段关键区域分别替换为kfic和kfia中的关键区域。
在本发明的一种实施方式中,所述多杀巴斯德杆菌来源的肝素前体合酶中两段关键区域分别是s102-l315区域和i394-f599区域。
在本发明的一种实施方式中,所述kfic和kfia中的关键区域分别是s237-l450区域和i2-f207区域。
在本发明的一种实施方式中,所述大肠杆菌k5来源的kfia基因序列如seqidno.4所示;所述大肠杆菌k5来源的kfic基因序列如seqidno.5所示;所述多杀巴斯德杆菌来源的肝素前体合酶基因序列如seqidno.6所示。
本发明的第五个目的是提供一种重组表达所述新型肝素前体合酶的基因工程菌。
在本发明的一种实施方式中,所述基因工程菌以枯草芽孢杆菌bacillussubtilis168为宿主,以组成型启动子p43启动编码新型肝素前体合酶基因的表达。
在本发明的一种实施方式中,所述基因工程菌是以pp43nmk为表达载体。
本发明还提供了一种应用所述重组菌发酵生产肝素前体的方法,是将重组菌接种至发酵培养基中,在37℃下培养48h。
在本发明的一种实施方式中,所述发酵培养基以蔗糖为碳源。
在本发明的一种实施方式中,所述发酵培养基的组成成为分:20g/l酵母粉,50g/l蔗糖,3.9g/l硫酸钾,1.5g/l硫酸镁,50mm磷酸盐缓冲液,ph7.0。
本发明还提供了所述新型合酶及含有该合酶的细胞株系在生产肝素前体中的应用。
在本发明的一种实施方式中,所述重组枯草芽孢杆菌通过重组型质粒游离表达(a)或(b)或(c)所示新型合酶基因。
有益效果:本发明利用三种不同的基因工程操作手段将单独表达肝素前体的两个合酶改造为一个完整的合酶,具有较大的应用优势。首先,本发明过程中使用的宿主为食品级,可满足医疗卫生和食品安全的要求,无内毒素和病原感染的风险;其次,由于较单独表达的kfic和kfia在作用空间距离上有一定变化,经改造后形成的新型肝素前体合酶合成肝素前体的效率更高,在摇瓶上产量最高为1.87g/l,较原始合酶提高18.35%,且分子量均有所减小,范围在46.04~53.87kda,这对于产生小分子肝素前体具有有利影响。
附图说明
图1所示为摇瓶中原大肠杆菌k5来源的肝素前体合酶kfic和kfia共表达情况下以及三种新型合酶分别表达在第48h时所产肝素前体的产量比较;eh,b.subtiliseh;c(gs)2a,b.subtilisc(gs)2a;pmca,b.subtilispmca;hca,b.subtilishca。
具体实施方式
肝素前体发酵产物分子量检测分析方法:采用高效体积排阻色谱-多角度激光散射进行分析,选择示差折光检测器ri,使用凝胶色谱柱ultrahydrogellinear进行分析。流动相选择0.1m硝酸钠进行洗脱,流速为0.5ml/min,柱子温度设定为50℃,进样量为20μl,每个样品洗脱时间为20min,利用软件进行平均分子质量的计算。
实施例涉及的核苷酸序列信息:
(1)seqidno.1序列信息为kfic、kfia关键区域置换pmhs合酶关键区域所形成的新酶氨基酸序列;
(2)seqidno.2序列信息为kfic与kfia通过linker(ggggs)2融合后所形成的新酶氨基酸序列;
(3)seqidno.3序列信息为kfic与kfia通过开放阅读框相连,且kfic、kfia分别去除终止密码子和起始密码子所形成的新酶氨基酸序列;
(4)seqidno.4序列信息为来源于大肠杆菌k5(e.colio10:k5:h4,e.colik5)的α-糖基转移酶编码基因kfia编码序列;
(5)seqidno.5序列信息为来源于大肠杆菌k5(e.colio10:k5:h4,e.colik5)的β-糖基转移酶编码基因kfic编码序列;
(6)seqidno.6序列信息为来源于多杀巴斯德杆菌(pasteurellamultocidadtype)的肝素前体合酶heparosansynthaseb编码基因hssb编码序列;
实施例1大肠杆菌k5肝素前体合酶kfic和kfia共表达重组质粒的构建
α-糖基转移酶编码基因kfia和β-糖基转移酶编码基因kfic来源于大肠杆菌k5(e.colio10:k5:h4,e.colik5),e.colik5菌株接种于5mllb液体培养基,在37℃200rpm培养16h。收集菌体,采用细菌基因组提取试剂盒提取e.colik5菌株的基因组dna。
分别设计引物kfia-f1/kfia-r1、kfic-f1/kfic-r1,以提取的基因组dna为模板,采用标准的pcr扩增体系和程序,扩增获取目标基因。
引物序列信息:5’-3’方向
kfia-f1:ggtaagagaggaatgtacacatgattgttgcaaatatgtc
kfia-r1:ccgctcgagttacccttccacattataca
kfic-f1:cggggtaccatgaacgcagaatatataaatttag
kfic-r1:gtgtacattcctctcttaccctattgttcaattattcctg
在kfic上下游引物两端分别引入kpni限制性酶切位点和rbs序列,在kfia上下游引物两端分别引入rbs序列和xhoi限制性酶切位点。pcr扩增获取的kfic和kfia片段后通过rbs重叠区域将两片段进行融合pcr,获得片段kpni-kfic-rbs-kfia-xhoi,并与质粒pp43-d(公开于efficientbiosynthesisofpolysaccharideschondroitinandheparosanbymetabolicallyengineeredbacillussubtilis,carbohydratepolymers,2016,jinpengandzhanglinpei)同时进行kpni/xhoi双酶切,采用琼脂糖凝胶核酸电泳进行切胶回收,回收产物进行连接,体系10μl:1μl双切的载体,4μl双切的目的片段,5μlsolutioni连接酶,16℃连接过夜,转化jm109感受态细胞,挑取单菌落pcr验证,阳性重组子进行测序,比对正确,重组质粒pp43nmk-kfic-rbs-kfia构建成功。重组质粒转化bacillussubtilis168,以5μg/ml的卡那霉素平板进行筛选整合重组子,并对重组菌株进行pcr验证和测序验证,对成功转化pp43nmk-kfic-rbs-kfia的枯草芽孢杆菌菌株命名为b.subtiliseh。
实施例2大肠杆菌k5肝素前体合酶kfic和kfia通过柔性linker(ggggs)2连接的构建
以上述重组质粒pp43nmk-kfic-rbs-kfia为模板,分别设计引物kfia-f2/kfia-r1、kfic-f1/kfic-r2,采用标准的pcr扩增体系和程序,扩增获取目标基因。
引物序列信息:5’-3’方向
kfia-f2:ggtggcggtggctcgggcggtggtgggtcgatgattgttgcaaatatgtc
kfic-r2:cgacccaccaccgcccgagccaccgccaccttgttcaattattcctgata
在kfic上下游引物两端分别引入kpni限制性酶切位点和(ggggs)2linker序列,并去掉kfic的终止密码子。在kfia上下游引物两端分别引入(ggggs)2linker序列和xhoi限制性酶切位点。pcr扩增获取的kfic和kfia片段后通过(ggggs)2linker重叠区域将两片段进行融合pcr,获得片段kpni-kfic-(ggggs)2-kfia-xhoi,并与质粒pp43nmk-kfic-kfia同时进行kpni/xhoi双酶切,采用琼脂糖凝胶核酸电泳进行切胶回收,回收产物进行连接,体系10μl:1μl双切的载体,4μl双切的目的片段,5μlsolutioni连接酶,16℃连接过夜,转化jm109感受态细胞,挑取单菌落pcr验证,阳性重组子进行测序,比对正确,重组质粒pp43nmk-kfic-(ggggs)2-kfia构建成功。重组质粒转化b.subtilis168,以5μg/ml的卡那霉素平板进行筛选整合重组子,并对重组菌株进行pcr验证和测序验证,对成功转化pp43nmk-kfic-(ggggs)2-kfia的枯草芽孢杆菌菌株命名为b.subtilisc(gs)2a。
实施例3大肠杆菌k5肝素前体合酶kfic和kfia融合的构建
以重组质粒pp43nmk-kfic-rbs-kfia为模板,分别设计引物kfia-f3/kfia-r1、kfic-f1/kfic-r3,采用标准的pcr扩增体系和程序,扩增获取目标基因。
引物序列信息:5’-3’方向
kfia-f3:agatgtatcaggaataattgaacaaattgttgcaaatatgtcatc
kfic-r3:ttgttcaattattcctgata
在kfic上下游引物两端分别引入kpni限制性酶切位点和kfia自起始密码子atg后(不含atg)的20bp序列,并去掉kfic的终止密码子。在kfia下游引物5’端引入xhoi限制性酶切位点。pcr扩增获取的kfic和kfia片段后通过20bp重叠区域将两片段进行融合pcr,获得片段kpni-kfic-kfia-xhoi,并与质粒pp43nmk-kfic-kfia同时进行kpni/xhoi双酶切,采用琼脂糖凝胶核酸电泳进行切胶回收,回收产物进行连接,体系10μl:1μl双切的载体,4μl双切的目的片段,5μlsolutioni连接酶,16℃连接过夜,转化jm109感受态细胞,挑取单菌落pcr验证,阳性重组子进行测序,比对正确,重组质粒pp43nmk-kfic-kfia构建成功。重组质粒转化b.subtilis168,以5μg/ml的卡那霉素平板进行筛选整合重组子,并对重组菌株进行pcr验证和测序验证,对成功转化pp43nmk-kfic-kfia的枯草芽孢杆菌菌株命名为b.subtilishca。
实施例4多杀巴斯德杆菌来源的肝素前体合酶关键区域置换的构建
通过blast比对找出kfic、kfia分别与hssb基因同源的部分,kfic中为s237-l450,kfia中为i2-f207。用s237-l450、i2-f207分别置换hssb中的s102-l315和i394-f599部分,则hssb剩余区域m1-t101,y316-p393和r600-l643分别命名为区域1,区域2,区域3。
以重组质粒pp43nmk-kfic-rbs-kfia为模板,采用标准的pcr扩增体系和程序,通过kfic-f4/kfic-r4扩增kfic中的s237-l450,通过kfia-f4/kfia-r4扩增kfia中的i2-f207。以提取的p.multocida基因组dna为模板,采用标准的pcr扩增体系和程序,通过pmhs-f1/pmhs-r1,pmhs-f2/pmhs-r2,pmhs-f3/pmhs-r3分别扩增获得区域1,区域2,区域3。
引物序列信息:5’-3’方向
kfia-f4:tgtccaatcctaagattcctattgttgcaaatatgtcatc
kfia-r4:aaatgtgttccaaagtcctt
kfic-f4:tagaaaaagataagcaaacatcagaaataactgatatata
kfic-r4:caatggctgcagtaatctta
pmhs-f1:cggggtaccatgaagggaaaaaaagagat
pmhs-r1:tgtttgcttatctttttcta
pmhs-f2:taagattactgcagccattgtactacaacacaatgagaga
pmhs-r2:aggaatcttaggattggaca
pmhs-f3:aaggactttggaacacatttcgagacaatgatgagcaaca
pmhs-r3:ccgctcgagttataaaaaataaaaaggta
在kfic的s237-l450区域和kfia的i2-f207区域上下游引物两端分别引入和hssb重叠的20bp碱基。在hssb区域1上游引物5’端和区域3下游引物5’端分别引入kpni、xhoi限制性酶切位点。pcr扩增获取的5个片段通过重叠区域进行融合,并与质粒pp43nmk-kfic-kfia同时进行kpni/xhoi双酶切,采用琼脂糖凝胶核酸电泳进行切胶回收,回收产物进行连接,体系10μl:1μl双切的载体,4μl双切的目的片段,5μlsolutioni连接酶,16℃连接过夜,转化jm109感受态细胞,挑取单菌落pcr验证,阳性重组子进行测序,比对正确,重组质粒pp43nmk-hssbca构建成功。重组质粒转化b.subtilis168,以5μg/ml的卡那霉素平板进行筛选整合重组子,并对重组菌株进行pcr验证和测序验证,对成功转化pp43nmk-hssbca的枯草芽孢杆菌菌株命名为b.subtilispmca。
实施例5重组枯草芽孢杆菌的摇瓶发酵
分别挑取上述构建的4株重组枯草芽孢杆菌,单菌落接种于lb培养基,置于200rpm37℃过夜培养。按体积比为10%的接种量转接于25ml发酵培养基中(250ml摇瓶),发酵培养基为:20g/l酵母粉,50g/l蔗糖,硫酸钾3.9g/l,硫酸镁1.5g/l,50mm磷酸盐缓冲液,ph7.0,50μg/ml卡那霉素,置于200rpm37℃培养48h。
摇瓶发酵过程中第48h肝素前体的含量采用bitter-muir硫酸咔唑法测定,在比色管中加入1ml硼砂硫酸试剂和200μl经一定倍数稀释后的肝素前体样品,混匀后在沸水中煮15min后,冷却至室温,再加入50μl咔唑试剂,混匀后再在沸水中煮15min,冷却至室温,并在530nm处测定吸光值。利用纯化肝素前体样品绘制标准曲线,根据标准曲线计算产量。
根据附图1,较对照菌株b.subtiliseh(两个合酶分开表达)的产量1.58g/l,经过改造的三种肝素前体新型合酶,在摇瓶上均有产量且有所提高,证明获得的新型合酶均保持原有功能。其中b.subtilispmca产量为1.65g/l(产量基本相近),b.subtilishca产量为1.76g/l(增长11.39%),而b.subtilisc(gs)2a产量最高,为1.87g/l,提高幅度最大,为18.35%。根据三种不同改造方式,比较三种新型合酶在结构上的特点,推测以kfic、kfia中关键区域置换多杀巴斯德杆菌来源的肝素前体合酶的关键区域,也可产生该多糖,证明这两段区域是合成产物的主要功能区域,但仅有此关键区域的作用还不够,或与多杀巴斯德杆菌来源的合酶其它区域不匹配导致合成效果不佳。而对于c(gs)2a和hca,在kfic、kfia中间加上具有10个氨基酸的柔性linker产量较将kfic、kfia首尾相连的方式高,证明两个合酶在作用过程中,距离、角度等因素会对产量有一定影响。
表1摇瓶中原大肠杆菌k5来源的肝素前体合酶kfic和kfia共表达情况下以及三种新型合酶分别表达在第48h时所产肝素前体的分子量比较
a数量平均分子量(mn);b质量平均分子量(mw);c聚合度(ip=mw/mn).
同时采用hpsec-malls测定第48h肝素前体的质量平均分子量(mw),数量平均分子量(mn)和分散系数ip。表1显示对照菌b.subtiliseh摇瓶上所产肝素前体的mw为56.48kda。而重组菌b.subtilispmca、b.subtilisc(gs)2a和b.subtilishca在摇瓶上所产肝素前体的mw分别为53.87kda、46.04kda和49.39kda,均比对照菌的产物分子量低,而b.subtilisc(gs)2a效果最好,产物分子量及分散度均最低,说明糖链长度更集中,产物更均一。
虽然本发明已以较佳实施例公开如上,但其并非用以限定本发明,任何熟悉此技术的人,在不脱离本发明的精神和范围内,都可做各种的改动与修饰,因此本发明的保护范围应该以权利要求书所界定的为准。
sequencelisting
<110>江南大学
<120>一种肝素前体合酶及其应用
<160>24
<170>patentinversion3.3
<210>1
<211>643
<212>prt
<213>人工序列
<400>1
metlysglylyslysglumetthrglnileglnilealalysasnpro
151015
proglnhisglulysgluasngluleuasnthrpheglnasnlysile
202530
aspserleulysthrthrleuasnlysaspileileserglnglnthr
354045
leuleualalysglnaspserlyshisproleuseralaserleuglu
505560
asngluasnlysleuleuleulysglnleuglnleuvalleuglnglu
65707580
pheglulysiletyrthrtyrasnglnalaleuglualalysleuglu
859095
lysasplysglnthrsergluilethraspiletyrproasnlysile
100105110
ileleuglnglyilelyspheasplyslyslysasnvaltyrglylys
115120125
aspleuvalserileilemetservalpheasnsergluaspthrile
130135140
alatyrserleuhisserleuleuasnglnthrtyrgluasnileglu
145150155160
ileleuvalcysaspaspcysserserasplysserleugluileile
165170175
lysserilealatyrserserserargvallysvaltyrserserarg
180185190
lysasnglnglyprotyrasnileargasngluleuilelyslysala
195200205
hisglyasnpheilethrpheglnaspalaaspaspleuserhispro
210215220
gluargileglnargglnvalgluvalleuargasnasnlysalaval
225230235240
ilecysmetalaasntrpileargvalalaserasnglylysilegln
245250255
phephetyraspasplysalathrargmetservalvalsersermet
260265270
ilelyslysaspilephealathrvalglyglytyrargglnserleu
275280285
ileglyalaaspthrgluphetyrgluthrvalilemetargtyrgly
290295300
arggluserilevalargleuleuglnproleutyrtyrasnthrmet
305310315320
arggluasnserleuphethraspmetvalglutrpileaspasnhis
325330335
asnileileglnlysmetseraspthrargglnhistyralathrleu
340345350
pheglnalamethisasngluthralaserhisaspphelysasnleu
355360365
pheglnpheproargiletyraspalaleuprovalproglnglumet
370375380
serlysleuserasnprolysileproilevalalaasnmetserser
385390395400
tyrproproarglyslysgluleuvalhisserileglnserleuhis
405410415
alaglnvalasplysileasnleucysleuasnglupheglugluile
420425430
proglugluleuaspglypheserlysleuasnprovalileproasp
435440445
lysasptyrlysaspvalglylyspheilepheprocysalalysasn
450455460
aspmetilevalleuthraspaspaspileiletyrproproasptyr
465470475480
valglulysmetleuasnphetyrasnserphealailepheasncys
485490495
ilevalglyilehisglycysiletyrileaspalapheaspglyasp
500505510
glnserlysarglysvalpheserphethrglnglyleuleuargpro
515520525
argvalvalasnglnleuglythrglythrvalpheleulysalaasp
530535540
glnleuproserleulystyrmetaspglyserglnargphevalasp
545550555560
valargpheserargtyrmetleugluasngluileglymetilecys
565570575
valproargglulysasntrpleuarggluvalserserglysermet
580585590
gluglyleutrpasnthrpheargaspasnaspgluglnglnthrgln
595600605
leuilemetgluasnglyprotrpglytyrserseriletyrproleu
610615620
vallysasnhisprolysphethraspleuileprocysleuprophe
625630635640
tyrpheleu
<210>2
<211>768
<212>prt
<213>人工序列
<400>2
metasnalaglutyrileasnleuvalgluarglyslyslysleugly
151015
thrasnileglyalaleuasppheleuleuserilehislysglulys
202530
valaspleuglnhislysasnserproleulysglyasnaspasnleu
354045
ilehislysargileasnglutyraspasnvalleugluleuserlys
505560
asnvalseralaglnasnserglyasngluphesertyrleuleugly
65707580
tyralaaspserleuarglysvalglymetleuaspthrtyrilelys
859095
ilevalcystyrleuthrileglnserargtyrphelysasnglyglu
100105110
argvallysleuphegluhisileserasnalaleuargtyrserarg
115120125
serasppheleuileasnleuilephegluargtyrileglutyrile
130135140
asnhisleulysleuserprolysglnlysaspphetyrphecysthr
145150155160
lyspheserlysphehisasptyrthrlysasnglytyrlystyrleu
165170175
alapheaspasnglnalaaspalaglytyrglyleuthrleuleuleu
180185190
asnalaasnaspaspmetglnaspsertyrasnleuleuproglugln
195200205
gluleupheilecysasnalavalileaspasnmetasniletyrarg
210215220
serglnpheasnlyscysleuarglystyraspleusergluilethr
225230235240
aspiletyrproasnlysileileleuglnglyilelyspheasplys
245250255
lyslysasnvaltyrglylysaspleuvalserileilemetserval
260265270
pheasnsergluaspthrilealatyrserleuhisserleuleuasn
275280285
glnthrtyrgluasnilegluileleuvalcysaspaspcysserser
290295300
asplysserleugluileilelysserilealatyrserserserarg
305310315320
vallysvaltyrserserarglysasnglnglyprotyrasnilearg
325330335
asngluleuilelyslysalahisglyasnpheilethrpheglnasp
340345350
alaaspaspleuserhisprogluargileglnargglnvalgluval
355360365
leuargasnasnlysalavalilecysmetalaasntrpileargval
370375380
alaserasnglylysileglnphephetyraspasplysalathrarg
385390395400
metservalvalsersermetilelyslysaspilephealathrval
405410415
glyglytyrargglnserleuileglyalaaspthrgluphetyrglu
420425430
thrvalilemetargtyrglyarggluserilevalargleuleugln
435440445
proleuileleuglyleutrpglyaspserglyleuthrargasnlys
450455460
glythrglualaleuproaspglytyrileserglnserargargglu
465470475480
tyrseraspilealaalaargglnargvalleuglylysserileval
485490495
serasplysaspvalargglyleuleuserargtyrglyleuphelys
500505510
aspvalserglyileilegluglnglyglyglyglyserglyglygly
515520525
glysermetilevalalaasnmetsersertyrproproarglyslys
530535540
gluleuvalhisserileglnserleuhisalaglnvalasplysile
545550555560
asnleucysleuasnglupheglugluileproglugluleuaspgly
565570575
pheserlysleuasnprovalileproasplysasptyrlysaspval
580585590
glylyspheilepheprocysalalysasnaspmetilevalleuthr
595600605
aspaspaspileiletyrproproasptyrvalglulysmetleuasn
610615620
phetyrasnserphealailepheasncysilevalglyilehisgly
625630635640
cysiletyrileaspalapheaspglyaspglnserlysarglysval
645650655
pheserphethrglnglyleuleuargproargvalvalasnglnleu
660665670
glythrglythrvalpheleulysalaaspglnleuproserleulys
675680685
tyrmetaspglyserglnargphevalaspvalargpheserargtyr
690695700
metleugluasngluileglymetilecysvalproargglulysasn
705710715720
trpleuarggluvalserserglysermetgluglyleutrpasnthr
725730735
phethrlyslystrpproleuaspileilelysgluthrglnalaile
740745750
alaglytyrserlysleuasnleugluleuvaltyrasnvalglugly
755760765
<210>3
<211>757
<212>prt
<213>人工序列
<400>3
metasnalaglutyrileasnleuvalgluarglyslyslysleugly
151015
thrasnileglyalaleuasppheleuleuserilehislysglulys
202530
valaspleuglnhislysasnserproleulysglyasnaspasnleu
354045
ilehislysargileasnglutyraspasnvalleugluleuserlys
505560
asnvalseralaglnasnserglyasngluphesertyrleuleugly
65707580
tyralaaspserleuarglysvalglymetleuaspthrtyrilelys
859095
ilevalcystyrleuthrileglnserargtyrphelysasnglyglu
100105110
argvallysleuphegluhisileserasnalaleuargtyrserarg
115120125
serasppheleuileasnleuilephegluargtyrileglutyrile
130135140
asnhisleulysleuserprolysglnlysaspphetyrphecysthr
145150155160
lyspheserlysphehisasptyrthrlysasnglytyrlystyrleu
165170175
alapheaspasnglnalaaspalaglytyrglyleuthrleuleuleu
180185190
asnalaasnaspaspmetglnaspsertyrasnleuleuproglugln
195200205
gluleupheilecysasnalavalileaspasnmetasniletyrarg
210215220
serglnpheasnlyscysleuarglystyraspleusergluilethr
225230235240
aspiletyrproasnlysileileleuglnglyilelyspheasplys
245250255
lyslysasnvaltyrglylysaspleuvalserileilemetserval
260265270
pheasnsergluaspthrilealatyrserleuhisserleuleuasn
275280285
glnthrtyrgluasnilegluileleuvalcysaspaspcysserser
290295300
asplysserleugluileilelysserilealatyrserserserarg
305310315320
vallysvaltyrserserarglysasnglnglyprotyrasnilearg
325330335
asngluleuilelyslysalahisglyasnpheilethrpheglnasp
340345350
alaaspaspleuserhisprogluargileglnargglnvalgluval
355360365
leuargasnasnlysalavalilecysmetalaasntrpileargval
370375380
alaserasnglylysileglnphephetyraspasplysalathrarg
385390395400
metservalvalsersermetilelyslysaspilephealathrval
405410415
glyglytyrargglnserleuileglyalaaspthrgluphetyrglu
420425430
thrvalilemetargtyrglyarggluserilevalargleuleugln
435440445
proleuileleuglyleutrpglyaspserglyleuthrargasnlys
450455460
glythrglualaleuproaspglytyrileserglnserargargglu
465470475480
tyrseraspilealaalaargglnargvalleuglylysserileval
485490495
serasplysaspvalargglyleuleuserargtyrglyleuphelys
500505510
aspvalserglyileilegluglnilevalalaasnmetsersertyr
515520525
proproarglyslysgluleuvalhisserileglnserleuhisala
530535540
glnvalasplysileasnleucysleuasnglupheglugluilepro
545550555560
glugluleuaspglypheserlysleuasnprovalileproasplys
565570575
asptyrlysaspvalglylyspheilepheprocysalalysasnasp
580585590
metilevalleuthraspaspaspileiletyrproproasptyrval
595600605
glulysmetleuasnphetyrasnserphealailepheasncysile
610615620
valglyilehisglycysiletyrileaspalapheaspglyaspgln
625630635640
serlysarglysvalpheserphethrglnglyleuleuargproarg
645650655
valvalasnglnleuglythrglythrvalpheleulysalaaspgln
660665670
leuproserleulystyrmetaspglyserglnargphevalaspval
675680685
argpheserargtyrmetleugluasngluileglymetilecysval
690695700
proargglulysasntrpleuarggluvalserserglysermetglu
705710715720
glyleutrpasnthrphethrlyslystrpproleuaspileilelys
725730735
gluthrglnalailealaglytyrserlysleuasnleugluleuval
740745750
tyrasnvalglugly
755
<210>4
<211>717
<212>dna
<213>人工序列
<400>4
atgattgttgcaaatatgtcatcatacccacctcgaaaaaaagagttggtgcattctata60
caaagtttacatgctcaagtagataaaattaatctttgcctgaatgagtttgaagaaatt120
cctgaggaattagatggtttttcaaaattaaatccagttattccagataaagattataag180
gatgtgggcaaatttatatttccttgcgctaaaaatgatatgatcgtacttacagatgat240
gatattatttaccctcccgattatgtagaaaaaatgctcaatttttataattcctttgca300
atattcaattgcattgttgggattcatggctgtatatacatagatgcatttgatggagat360
cagtctaaaagaaaagtattttcatttactcaagggctattgcgaccgagagttgtaaat420
caattaggtacagggactgtttttcttaaggcagatcaattaccatctttaaaatatatg480
gatggttctcaacgattcgtcgatgttagattttctcgctatatgttagagaatgaaatt540
ggtatgatatgtgttcccagagaaaaaaactggctaagagaggtctcatcaggttcaatg600
gaaggactttggaacacatttacaaaaaaatggcctttagacatcataaaagaaacacaa660
gcaatcgcaggatattcaaaacttaacctcgaattagtgtataatgtggaagggtaa717
<210>5
<211>1563
<212>dna
<213>人工序列
<400>5
atgaacgcagaatatataaatttagttgaacgtaaaaagaaattagggacaaatattggt60
gctcttgattttttattatcaattcataaggagaaagttgatcttcaacataaaaactcg120
cctttaaaaggtaacgataaccttattcacaaaagaataaacgaatacgacaatgtactt180
gaactatctaagaatgtatcagctcagaattctggcaatgagttttcttatttattggga240
tatgcagattctcttagaaaagttggtatgttggatacttatattaaaattgtttgttat300
ctaacaattcaatctcgttattttaaaaatggcgaacgagttaagctttttgaacatata360
agtaacgctctacggtattcaaggagtgattttctcattaatcttatttttgaacgatat420
atcgaatatataaaccatctaaaattgtcgcccaaacaaaaagatttttatttttgtacg480
aagttttcaaaatttcatgattatactaaaaatggatataaatatttagcatttgataat540
caagccgatgcagggtatggcctgactttattattaaatgcaaacgatgatatgcaagat600
agttataatctactccctgagcaagaactttttatttgtaatgctgtaatagataatatg660
aatatttataggagtcaatttaacaaatgtctacgaaaatacgatttatcagaaataact720
gatatatacccaaataaaattatattgcaaggaattaagttcgataagaaaaaaaatgtt780
tatggaaaagatcttgttagtataataatgtcagtattcaattcagaagatactattgca840
tactcattacattcattgttgaatcaaacatatgaaaatattgaaattctcgtgtgcgat900
gattgttcatcggacaaaagccttgaaataattaagagcatagcttattctagttcaaga960
gtgaaagtatatagctcacgaaaaaaccaaggcccttataatataagaaatgagctaata1020
aaaaaagcacacggtaatttcatcacctttcaagatgcagatgatctttctcatccggag1080
agaatacaaagacaagttgaggttcttcgcaataataaggctgtaatctgtatggctaac1140
tggatccgtgttgcgtcaaatggaaaaattcaattcttctatgatgataaagccacaaga1200
atgtctgttgtatcgtcaatgataaaaaaagatatttttgcgacagttggtggctataga1260
caatctttaattggtgcagatacggagttttatgaaacagtaataatgcgttatgggcga1320
gaaagtattgtaagattactgcagccattgatattggggttatggggagactccggactt1380
accaggaataaaggaacagaagctctacctgatggatatatatcacaatctcgaagagaa1440
tatagtgatatcgcggcaagacaacgagtgttagggaaaagtatcgtaagtgataaagat1500
gtacgtggtttattatctcgctatggtttgtttaaagatgtatcaggaataattgaacaa1560
tag1563
<210>6
<211>1955
<212>dna
<213>人工序列
<400>6
atgaagggaaaaaaagagatgactcaaattcaaatagctaaaaatccaccccaacatgaa60
aaagaaaatgaactcaacacctttcaaaataaaattgatagtctaaaaacaactttaaac120
aaagacatcatttctcaacaaactttattggcaaaacaggacagtaaacatccgctatcc180
gcatcccttgaaaacgaaaataaacttttattaaaacaactccaattggttctgcaagaa240
tttgaaaaaatatatacctataatcaagcattagaagcaaagctagaaaaagataagcaa300
acaacatcaataacagatttatataatgaagtcgctaaaagtgatttagggttagtcaaa360
gaaactaacagcgcaaatccattagtcagtattatcatgacatctcacaatacagcgcaa420
tttatcgaagcttctattaattcattattgttacaaacatataaaaacatagaaattatt480
attgtagatgatgatagctcggataatacatttgaaattgcctcgagaatagcgaatacg540
acaagcaaagtcagagtatttagattaaattcaaacctaggaacttactttgcgaaaaat600
acaggcatattaaaatctaaaggtgacattattttctttcaagatagtgatgatgtatgt660
catcatgaaagaatagaaagatgtgtaaatatattattagctaataaagaaactattgct720
gttcgttgtgcatactcaagactagcaccagaaacacaacatatcattaaagtcaataat780
atggattatagattaggttttataaccttgggtatgcacagaaaagtatttcaagaaatt840
ggtttcttcaattgtacgactaaaggctcagatgatgagttttttcatagaattgcgaaa900
tattatggaaaagaaaaaataaaaaatttactcttgccgttatactacaacacaatgaga960
gaaaactctttatttactgatatggttgaatggatagacaatcataacataatacagaaa1020
atgtctgataccagacaacattatgcaaccctgtttcaagcgatgcataacgaaactgcc1080
tcacatgatttcaaaaatctttttcaattccctcgtatttacgatgccttaccagtacca1140
caagaaatgagtaagttgtccaatcctaagattcctgtttatatcaatatttgttctatt1200
ccctcaagaatagcgcaattacgacgtattatcggcatactaaaaaatcaatgtgatcat1260
tttcatatttatcttgatggctatgtagaaatccctgacttcataaaaaatttaggtaat1320
aaagcaaccgttgttcattgcaaagataaagataactccattagagataatggcaaattc1380
attttactggaagagttgattgaaaaaaatcaagatggatattatataacctgtgatgat1440
gacattatctatccaagcgattacatcaatacgatgatcaagaagctgaatgaatacgat1500
gataaagcggttattggtttacacggcattctctttccaagtagaatgaccaaatatttt1560
tcggcggatagactggtatatagcttctataaacctctggaaaaagacaaagcggtcaat1620
gtattaggtacaggaactgttagctttagagtcagtctctttaatcaattttctctttct1680
gactttacccattcaggcatggctgatatctatttctctctcttgtgtaagaaaaataat1740
attcttcagatttgtatttcaagaccagcaaactggctaacagaagataatagagacagc1800
gaaacactctatcatcaatatcgagacaatgatgagcaacaaactcagctgatcatggaa1860
aacggtccatggggatattcaagtatttatccattagtcaaaaatcatcctaaatttact1920
gaccttatcccctgtttacctttttatttttataa1955
<210>7
<211>40
<212>dna
<213>人工序列
<400>7
ggtaagagaggaatgtacacatgattgttgcaaatatgtc40
<210>8
<211>29
<212>dna
<213>人工序列
<400>8
ccgctcgagttacccttccacattataca29
<210>9
<211>34
<212>dna
<213>人工序列
<400>9
cggggtaccatgaacgcagaatatataaatttag34
<210>10
<211>40
<212>dna
<213>人工序列
<400>10
gtgtacattcctctcttaccctattgttcaattattcctg40
<210>11
<211>50
<212>dna
<213>人工序列
<400>11
ggtggcggtggctcgggcggtggtgggtcgatgattgttgcaaatatgtc50
<210>12
<211>50
<212>dna
<213>人工序列
<400>12
cgacccaccaccgcccgagccaccgccaccttgttcaattattcctgata50
<210>13
<211>45
<212>dna
<213>人工序列
<400>13
agatgtatcaggaataattgaacaaattgttgcaaatatgtcatc45
<210>14
<211>20
<212>dna
<213>人工序列
<400>14
ttgttcaattattcctgata20
<210>15
<211>40
<212>dna
<213>人工序列
<400>15
tgtccaatcctaagattcctattgttgcaaatatgtcatc40
<210>16
<211>20
<212>dna
<213>人工序列
<400>16
aaatgtgttccaaagtcctt20
<210>17
<211>40
<212>dna
<213>人工序列
<400>17
tagaaaaagataagcaaacatcagaaataactgatatata40
<210>18
<211>20
<212>dna
<213>人工序列
<400>18
caatggctgcagtaatctta20
<210>19
<211>29
<212>dna
<213>人工序列
<400>19
cggggtaccatgaagggaaaaaaagagat29
<210>20
<211>20
<212>dna
<213>人工序列
<400>20
tgtttgcttatctttttcta20
<210>21
<211>40
<212>dna
<213>人工序列
<400>21
taagattactgcagccattgtactacaacacaatgagaga40
<210>22
<211>20
<212>dna
<213>人工序列
<400>22
aggaatcttaggattggaca20
<210>23
<211>40
<212>dna
<213>人工序列
<400>23
aaggactttggaacacatttcgagacaatgatgagcaaca40
<210>24
<211>29
<212>dna
<213>人工序列
<400>24
ccgctcgagttataaaaaataaaaaggta29