本发明涉及了crm197蛋白的制备,具体涉及了一种重组crm197蛋白在原核体系中可溶性表达及其高效纯化的方法。
背景技术:
1、crm197蛋白是白喉毒素的一种天然突变体,由535个氨基酸组成,其中含有4个半胱氨酸,可形成两对二硫键,且疏水氨基酸比例较高,理论分子量约为58.4kda,理论等电点为9.93。crm197蛋白由白喉毒素的第52位甘氨酸突变为谷氨酸,从而几乎完全丧失原有的细胞毒性。crm197蛋白能够诱导机体产生强烈的t细胞依赖型免疫反应,能够提高如多糖等半抗原的免疫原性,现国内外已有多种以crm197蛋白为载体的多糖结合疫苗获批上市使用。此外,crm197蛋白还具有抗肿瘤活性,具有广泛的应用前景。
2、crm197蛋白最早通过白喉棒状杆菌进行生产,利用感染tox突变基因β噬菌体的白喉棒状杆菌的溶原菌株,如c7(beta 197)m1菌株(atcc 39255)获得,但存在培养条件复杂,产量低,生产成本高等问题。现市售的crm197蛋白即通过利用白喉棒状杆菌发酵,分泌表达至培养基中,经硫铵沉淀,凝胶过滤层析制得,产量约为100mg/l。
3、crm197蛋白对于哺乳动物细胞以及酿酒酵母细胞具有毒性,因此无法利用此类宿主细胞进行生产,nadav orr等尝试通过减毒伤寒沙门氏菌cvd 908-htra,引入大肠杆菌溶血素a成功分泌表达crm197蛋白,但表达水平较低,产量约7.1mg/l。rochelleaw等利用真核系统-甲醇诱导型毕赤酵母成功分泌表达具有活性的crm197蛋白,产量大于100mg/l,相当于天然白喉棒状杆菌产量,纯度大于95%。penex公司生产的crm197以荧光假单胞菌作为表达系统,满足cgmp要求,产量至少可达0.5g/l。
4、利用大肠杆菌系统尝试重组crm197蛋白的表达,由于大肠杆菌体系中缺乏二硫键氧化、辅助蛋白折叠等相关功能以及crm197蛋白自身较强的疏水性,重组crm197蛋白在原核表达体系中通常以包涵体形式存在,alessandra stefan等将crm197基因克隆至pet9a中,并在n端融合6×his标签和肠激酶切割位点序列(共84bp),转化至clear coli bl21(de3)细胞中,筛选阳性克隆细胞,进行发酵获得不溶性包涵体crm197-his蛋白,后使用尿素变性蛋白,利用ni亲和层析进行纯化,之后经透析复性和凝胶过滤层析制得crm197his蛋白。所得重组crm197his蛋白纯度约为98%,收率约为20~25%,产量为250±50mg/l,并且具有脱氧核糖核酸酶活性。经肠激酶切割后,蛋白产量约为50%,产量较低。ah-reum park等设计了类似的含有n端6×his标签和肠激酶切割位点的序列得到不溶性包涵体crm197蛋白,优化增溶剂,使用非变性增溶剂重悬蛋白,利用ni亲和层析进行初步纯化,后经复性和凝胶过滤层析制得crm197蛋白。其核酸酶活性,hb-egf结合特点以及与白喉抗毒素的亲和力,与市售crm197蛋白标准品(sigma-aldrich)活性表现几乎一致。此法所得具有活性的crm197蛋白收率约为85%,纯度大于98%,大幅提高了蛋白收率。实验结果表明,n端的标签并未对crm197蛋白体外活性产生影响。但考虑到crm197通常作为疫苗载体使用,两实验并未考察n端标签对于体内活性以及免疫原性的影响,可能存在安全隐患。philippe goffin等利用信号肽实现了crm197蛋白在大肠杆菌周质空间中的表达,利用渗透休克释放周脂蛋白,产量可达3g/l以上,crm197蛋白占周质蛋白总量的36.4%,仍需大量下游加工获得纯度合格的crm197蛋白。
5、在大肠杆菌中,常利用基因工程的策略,如在大肠杆菌系统中共表达具有二硫键氧化功能异源蛋白或融合促溶标签的策略,促进含有多对二硫键的难溶蛋白实现可溶表达,r roth等将具有二硫键氧化功能的质粒pmjs205与含有crm197基因的pet28a质粒共同转化至bl21(de3)宿主中,进行共表达,成功实现了crm197的可溶表达,但表达量明显低于包涵体形式表达量,pornpimol mahamad等以pet32a质粒中含有的trxa作为n端融合标签,并探索多种宿主细胞以及有无分子伴侣对crm197蛋白可溶表达的影响,但并未实现蛋白完全可溶表达,仍有部分蛋白以包涵体形成存在。对于融合促溶标签实现蛋白可溶表达的策略仍有待改进。
技术实现思路
1、本发明的目的在于:针对现有技术的不足和上述所提及的困难问题,提供一种从原核体系中可溶表达重组crm197蛋白的方法,并提供一种从细菌破碎上清液的复杂体系中高效纯化重组crm197蛋白的方法。串联sumo标签重组crm197蛋白能够在原核体系大肠杆菌胞内以可溶的形式高产量表达,后续下游通过两步ni亲和层析和一步酶切去除标签可从复杂的细菌破碎上清液中纯化获取高纯度重组crm197蛋白,其培养过程简单且成本极低,表达周期短,下游纯化步骤简单,所制备的重组crm197蛋白结构正确,与市售crm197蛋白抗原性相当。
2、为了实现上述目的,本发明采用的技术方案为:
3、一种可溶性表达及高效纯化重组crm197蛋白的方法,包括以下步骤:
4、步骤1、将crm197蛋白基因序列的5’末端与两个及以上的sumo蛋白串联序列的c端拼接,获得his-(sumo)n-crm197(n为≥2,自然数)的基因序列;
5、步骤2、将步骤1得到的his-(sumo)n-crm197的基因序列插入原核体系表达质粒载体中,之后将质粒载体转入原核感受态细胞中;
6、步骤3、通过抗性涂板挑选优势生长菌落,进行扩大培养,通过加入iptg并降低温度进行诱导目的基因的表达得到融合蛋白his-(sumo)n-crm197;
7、步骤4、裂解菌体,离心获得上清液,通过第一次金属螯合层析从上清液中纯化获取较高纯度重组his-(sumo)n-crm197融合蛋白,经ulp1酶酶切除去his-(sumo)n融合序列后,再通过第二次金属螯合层析,得到重组crm197蛋白。
8、基于crm197序列,通过密码子大肠杆菌偏好性优化,获得优化后的基因序列(seqid no:1)。通过pcr技术,在crm197基因序列的5’末端插入his-sumo融合标签序列(sumo氨基酸序列:seq id no:4,sumo基因序列:seq id no:5),然后将his-sumo-crm197基因序列插入ndei和xhoi位点之间,得到his-sumo-crm197-pet-32a质粒,在此基础上,再插入一个sumo标签,即得到his-2sumo-crm197-pet-32a质粒(seq id no:3),并且在pcr过程中,删除第一个sumo标签c末端的甘氨酸(gly),以保证后续酶切中,his-(sumo)n作为一个整体融合标签被切除。将得到的含有目的基因的克隆载体导入到大肠杆菌中,通过在固体培养基上划板培养筛选得到克隆载体阳性的大肠杆菌。将所筛选得到的优势克隆菌,进行培养,然后降温诱导目的基因在胞内表达。最终诱导结束收获菌体,经细菌破碎后离心得到破碎上清液,然后进行两次亲和层析纯化(吸附洗脱模式及流穿模式),得到最终crm197蛋白。
9、所述crm197的可溶标签优选sumo标签,sumo标签蛋白是一种小分子泛素样修饰蛋白,可以作为重组蛋白表达的融合标签和分子伴侣,不但可以进一步提高融合蛋白的表达量,且具有抗蛋白酶水解以及促进靶蛋白正确折叠,提高重组蛋白可溶性等功能。相较于其他促溶标签,sumo促溶能力强,分子量较小,对于目的蛋白结构影响较小,酶切特异性高且无氨基酸残留。将两个及以上的sumo标签串联(his-(sumo)n),可进一步增强促溶效果,并且在最后与crm197蛋白相邻连接的sumo以外的其他sumo单元c末端去除一个赖氨酸gly,即删除了c末端的甘氨酸的sumo改造体(代表性sumo改造体氨基酸序列:seq id no:6,sumo基因序列:seq id no:7),可以实现(his-(sumo)n)单点特异性整体酶切水解。在(sumo)n的n末端插入his-tag,可通过亲和层析较简单的得到纯度较高的目的蛋白。
10、所述具代表性的一种融合形式即为his-2sumo-crm197,其表达载体优选pet系列高表达载体,特别优选pet32a质粒,pet载体是原核蛋白表达引用最多的载体,严格受t7强转录及翻译信号控制,在宿主菌中无t7 rna聚合酶时基因处于关闭不表达的状态;并且可根据诱导物(如iptg)浓度调控目的蛋白表达量;pet32a载体具有氨苄抗性,有利于阳性克隆菌株的筛选。
11、所述his-2sumo-crm197在大肠杆菌中的诱导方式为iptg诱导,并降低温度至20-30℃,低温诱导表达,降低表达速率以实现二硫键正确折叠进而可溶表达。
12、所述his-2sumo-crm197表达宿主为大肠杆菌,优选origami b(de3)感受态细胞,origami b(de3)菌株是集合origami、tuner和bl21(de3)三种细胞株的优点于一身。具有origami系列菌株含有的trxb/gor基因突变,有助于二硫键折叠促进蛋白可溶表达,上述所选的pet32a载体具有氨苄抗性,有利于阳性菌落筛选;该菌株还来源于bl21的laczy基因突变株,能够通过iptg高效控制目的基因的表达;该菌株染色体整合了λ噬菌体de3区(de3区含有t7噬菌体rna聚合酶),可同时表达t7 rna聚合酶和大肠杆菌rna聚合酶,可用于pet系列等质粒的蛋白表达。
13、利用原核大肠杆菌可溶性的高表达his-(sumo)n-crm197,避免了疏水性较强的crm197在原核胞内表达过程中形成无活性、无结构的包涵体,后续下游无需经历包涵体复性的过程。
14、利用原核大肠杆菌体系直接可溶表达his-2sumo-crm197,远离crm197蛋白序列的第一个sumo标签c末端去除一个赖氨酸gly,可以实现单点特异性酶切水解。在2sumo的n末端插入his-tag,可通过亲和层析较简单的得到纯度较高的目的蛋白。
15、利用亲和层析(吸附洗脱模式)和亲和层析(流穿)两步骤层析从大肠杆菌细菌破碎上清液的复杂体系中高效纯化得蛋白。所制备获得的crm197蛋白具有正确的空间结构。
16、进一步的,sumo的个数n值越多,促溶解表达效果越强。
17、进一步的,所述步骤1中,将crm197蛋白的氨基酸序列依次进行基因序列转换、大肠杆菌宿主偏好密码子优化,获得crm197蛋白的基因序列。
18、进一步的,crm197蛋白的基因序列如seq id no:1所示。
19、进一步的,sumo蛋白的序列是小泛素相关修饰物,来源物种为酿酒酵母的泛素样蛋白smt3的序列,或对酿酒酵母的泛素样蛋白smt3的一级序列中的一个或数个氨基酸残基进行替换、突变的sumo改造体。分子量较小,亲水氨基酸比例极高,且不含有半胱氨酸,能够防止宿主蛋白酶对目标外源蛋白的降解,提高重组蛋白表达量,辅助重组蛋白折叠,能够被sumo蛋白酶ulp1特异性识别蛋白三级结构,并在sumo标签c末端gly-gly基序之后进行高度保真切割,几乎不会产生非特异性酶切。
20、两个及以上的sumo蛋白序列的串联模式可以是多个sumo重复序列的串联,或是多个sumo改造体的串联,或是sumo与sumo改造体的串联,其中一种代表性的串联模式(从n端至c端)为his-sumo改造体-sumo-crm197。
21、对其蛋白序列的一个或数个氨基酸残基进行替换、突变,尤其是c末端的五个氨基酸eqigg中的一个或数个氨基酸残基进行突变、替换或截短等,一种典型的sumo改造体c末端的序列为eqig。
22、当与其它蛋白序列融合于其c末端时,sumo蛋白水解酶,如ulp1酶不能识别sumo改造体的c末端序列,难以将其酶切断裂。
23、crm197蛋白在大肠杆菌中的诱导方式为加入乳糖及乳糖结构类似物如iptg,降低温度至20-30℃,保持至诱导表达结束。
24、在对携带目的基因(his-(sumo)n-crm197)的质粒进行启动转录的操作状态,包括加入一定浓度的干预启动子的诱导剂、升高或降低培养的温度,或者培养基自诱导的方式等,但不局限于此。一种常用且代表性的干预启动子启动质粒中目的基因转录的方式是通过加入iptg或采用乳糖及其他乳糖结构类似物化合物等,如pet系列质粒t7启动子类型的转录启动。另一种常见且具代表性的促进目的基因可溶表达的方式是降低诱导表达时的培养温度,如20~30℃。
25、原核表达体系优选大肠杆菌,其具备鲜明的原核表达体系特征,如培养周期短、培养基成分要求简单、表达产量高、无翻译后修饰等,其中大肠杆菌宿主菌优选origami b(de3)感受态细胞,其特征是含有二硫键氧化相关的trxb和gor基因突变,能够促进含有二硫键蛋白的折叠,宿主菌选择包括bl21(de3),bl21(de3)plyss,jm109,rosetta(de3)等,但不仅限于此。
26、进一步的,原核感受态细胞为大肠杆菌或枯草芽孢杆菌。
27、进一步的,所述步骤2中,质粒载体为pet系列质粒或pbv系列质粒。基础表达水平低,含有高严紧性t7 lac启动子,可通过加入半乳糖苷类似物iptg,启动外源基因的表达,具有氨苄抗性,可用于阳性转化子的筛选,还可选用pet30a,pet28a等,但不仅于此。
28、进一步的,所述步骤3中,当n为2时,融合蛋白his-(sumo)2-crm197的基因序列如seq id no:2所示。其对应的表达载体(his-2sumo-crm197-pet32a)基因序列(seq id no:3)。
29、进一步的,融合形式(his-(sumo)n-crm197)中,his-(sumo)n为两个及以上的sumo蛋白序列的串联,n≥2,且为自然数。
30、进一步的,所述步骤4中,第一次金属螯合层析为吸附-洗脱模式;第二次螯合层析为流穿模式。
31、进一步的,所述步骤4中,所述第一次金属螯合层析和所述第二次金属螯合层析中,固相层析填料是能够与三个及以上的组氨酸残基串联融合标签亲和结合吸附的层析填料类型;固相层析微球填料上通过衍生出螯合基团螯合二价金属离子,包括镍离子、铜离子、锌离子和钴离子。
32、进一步的,所述步骤4具体的操作步骤:
33、步骤41、将表达后的菌体,使用重悬缓冲液重悬后进行细菌破碎,将细菌内蛋白释放至胞外重悬缓冲液,离心细菌破碎上清液,使用nacl调节电导值至与上样缓冲液电导相当,静置、离心后得柱层析前样品;
34、步骤42、将步骤41得到的上清液进行镍金属螯合层析纯化,样品流经层析填料后,his-(sumo)n-crm197目标蛋白吸附在层析填料上,经过适当淋洗后,最终使用咪唑洗脱液将蛋白洗脱下来;
35、步骤43、步骤42所得蛋白样品脱盐至50mm tris-hcl,100mm nacl ph8.0缓冲液,至最终咪唑浓度≤1mm;然后使用ulp1酶进行酶切切除his-(sumo)n融合蛋白,释放出游离的crm197蛋白;所用的ulp1酶与蛋白的比例为1:10~10000;
36、步骤44、将步骤43所得酶切后样品,进行再次镍金属螯合层析纯化,ulp1酶、his-(sumo)n蛋白以及未被有效酶切的his-(sumo)n-crm197融合蛋白被吸附在层析填料上,目标蛋白crm197流穿通过层析柱,最终收集流穿液,浓缩、换液,获得重组crm197。
37、具体地,(1)将前述诱导表达结束后收获的菌体,使用破碎缓冲液重悬后进行细菌破碎,将细菌内蛋白释放至胞外重悬缓冲液,离心的细菌破碎上清液。
38、上述步骤(1)所述重悬缓冲液为含有0~0.5m盐的ph5.0-9.0缓冲液,优选ph8.0;常用盐为nacl,na2so4,(nh4)2so4等,但不局限于此。
39、上述步骤(1)所述细菌破碎的方式为超声破碎或者高压均质破碎,优选高压均质破碎,所用压力尤为400~1000bar,优选600bar。
40、(2)上步骤(1)所得样品首先进行亲和层析纯化(吸附洗脱模式),样品流经层析填料后,目标蛋白吸附在填料上,其它蛋白、核酸等杂质流穿去除,经过适当淋洗后,最终使用洗脱液将蛋白洗脱下来。
41、上述步骤(2)所述亲和层析样品为大肠杆菌细菌破碎后的上清液,其组分为大肠杆菌所有的宿主蛋白以及核酸类物质、可溶性脂质、脂多糖、小分子色素、氨基酸、盐类等物质。
42、上述步骤(2)所述亲和层析填料为带有ni2+配基的介质,如ni sepharose 6ff。
43、上述步骤(2)所述亲和层析平衡缓冲液为50mm tris-hcl,500mm nacl,ph8.0缓冲液,洗脱液为50mm tris-hcl,500mm nacl,500mm咪唑,ph8.0缓冲液。
44、(4)将步骤(3)所得洗脱样品使用50mm tris-hcl,100mm nacl,ph8.0缓冲液进行脱盐至样品中咪唑终浓度小于等于1mm。
45、(5)将步骤(4)所得样品按样品:酶(w/w)为1000:1的比例于37℃,用ulp1酶进行酶切水解约30min。
46、(6)将步骤(5)所得样品进行亲和层析纯化(流穿模式),样品流经层析填料后,目标蛋白经流穿获得,其他蛋白吸附在填料上,最终通过洗脱液进行洗脱。
47、上述步骤(6)所述亲和层析填料为带有ni2+配基的填料,如ni sepharose 6ff等,但不仅限于此。
48、上述步骤(5)所述亲和层析平衡缓冲液为50mm tris-hcl,500mm nacl,ph8.0缓冲液,洗脱液为50mm tris-hcl,500mm nacl,500mm咪唑,ph8.0缓冲液。
49、说明书中涉及的序列如下所示:
50、seq id no:1
51、经大肠杆菌偏好性密码子优化的crm197基因序列
52、ggcgctgatgacgtggttgactcttctaaatccttcgttatggagaacttctcttcctaccacggtactaaaccaggttacgtggactccatccagaagggcatccagaaaccaaagtctggtactcagggtaattacgatgacgactggaagcagttctacagcaccgacaacaaatacgatgccgcgggctactctgttgataacgagaacccgctgagcggtaaagcaggtggtgtcgtcaaagtcacgtacccgggcctgacgaaagttctggcgctgaaagttgacaacgcagagaccatcaaaaaagagctgggtctgtctctgaccgagccgctgatggaacaggtaggtactgaagaattcattaaacgtttcggtgatggcgcgtctcgtgttgttctgtccctgccgttcgctgaaggttcctctagcgtggaatacatcaacaactgggaacaggctaaggctctgtctgttgaactggaaatcaacttcgaaacgcgtggtaagcgcggtcaggacgcgatgtacgaatacatggcgcaagcgtgtgcgggtaaccgtgttcgtcgctctgtgggtagcagcctgtcctgtatcaacctggactgggacgtaatccgcgacaaaactaaaaccaaaatcgaatctctgaaagagcacggcccgattaaaaacaagatgtccgaaagcccgaacaagacggtttctgaagaaaaggcgaaacagtatctggaagaattccatcagaccgctctggagcacccggaactgtccgaactgaaaaccgttaccggtaccaacccagttttcgctggtgcgaactacgctgcgtgggccgttaacgtggctcaggttatcgactccgaaaccgcagacaacctggaaaaaaccactgcggctctgtctatcctgccgggcatcggttccgtcatgggcatcgctgatggtgcagtgcatcataacacggaagaaatcgtagcgcagagcattgcgctgtctagcctgatggttgctcaggcgattccgctggtcggcgaactggtagacatcggttttgccgcttacaactttgttgagtccatcattaacctgttccaggtagtacacaactcttacaaccgcccggcttactctccaggccataaaacgcagccgttcctgcacgacggctatgcagttagctggaacaccgttgaagactctattatccgtactggctttcagggtgaaagcggccatgatattaaaatcactgctgaaaacacccctctgccgatcgcgggtgtactgctgccaactattccgggcaaactggatgtaaacaaatccaaaacccacatctctgttaacggtcgcaaaatccgtatgcgttgccgtgctatcgatggtgacgtcaccttttgtcgtccaaaatctccggtctacgtgggtaacggtgtgcacgccaacctgcacgttgcgttccaccgtagcagcagcgaaaaaatccacagcaacgagatttcttccgattccatcggcgtgctgggctatcagaaaactgtggaccacaccaaagtaaattccaagctgtctctgttcttcgagattaaatct。
53、seq id no:2
54、his-2sumo-crm197基因序列
55、catcatcaccatcatcatagcgatagcgaagttaatcaagaagccaaaccggaagttaagccggaagtgaaacctgaaacacatattaacctgaaagtgagtgatggtagcagcgagatctttttcaaaatcaaaaagaccacaccgctgcgtcgtctgatggaagcatttgcaaaacgtcagggtaaagaaatggatagcctgcgttttctgtatgatggtattcgtattcaggcagatcagacaccggaagatctggatatggaagataacgatattatcgaagcacatcgtgagcagattggtagcgatagcgaagttaatcaagaagccaaaccggaagttaagccggaagtgaaacctgaaacacatattaacctgaaagtgagtgatggtagcagcgagatctttttcaaaatcaaaaagaccacaccgctgcgtcgtctgatggaagcatttgcaaaacgtcagggtaaagaaatggatagcctgcgttttctgtatgatggtattcgtattcaggcagatcagacaccggaagatctggatatggaagataacgatattatcgaagcacatcgtgagcagattggtggtggcgctgatgacgtggttgactcttctaaatccttcgttatggagaacttctcttcctaccacggtactaaaccaggttacgtggactccatccagaagggcatccagaaaccaaagtctggtactcagggtaattacgatgacgactggaagcagttctacagcaccgacaacaaatacgatgccgcgggctactctgttgataacgagaacccgctgagcggtaaagcaggtggtgtcgtcaaagtcacgtacccgggcctgacgaaagttctggcgctgaaagttgacaacgcagagaccatcaaaaaagagctgggtctgtctctgaccgagccgctgatggaacaggtaggtactgaagaattcattaaacgtttcggtgatggcgcgtctcgtgttgttctgtccctgccgttcgctgaaggttcctctagcgtggaatacatcaacaactgggaacaggctaaggctctgtctgttgaactggaaatcaacttcgaaacgcgtggtaagcgcggtcaggacgcgatgtacgaatacatggcgcaagcgtgtgcgggtaaccgtgttcgtcgctctgtgggtagcagcctgtcctgtatcaacctggactgggacgtaatccgcgacaaaactaaaaccaaaatcgaatctctgaaagagcacggcccgattaaaaacaagatgtccgaaagcccgaacaagacggtttctgaagaaaaggcgaaacagtatctggaagaattccatcagaccgctctggagcacccggaactgtccgaactgaaaaccgttaccggtaccaacccagttttcgctggtgcgaactacgctgcgtgggccgttaacgtggctcaggttatcgactccgaaaccgcagacaacctggaaaaaaccactgcggctctgtctatcctgccgggcatcggttccgtcatgggcatcgctgatggtgcagtgcatcataacacggaagaaatcgtagcgcagagcattgcgctgtctagcctgatggttgctcaggcgattccgctggtcggcgaactggtagacatcggttttgccgcttacaactttgttgagtccatcattaacctgttccaggtagtacacaactcttacaaccgcccggcttactctccaggccataaaacgcagccgttcctgcacgacggctatgcagttagctggaacaccgttgaagactctattatccgtactggctttcagggtgaaagcggccatgatattaaaatcactgctgaaaacacccctctgccgatcgcgggtgtactgctgccaactattccgggcaaactggatgtaaacaaatccaaaacccacatctctgttaacggtcgcaaaatccgtatgcgttgccgtgctatcgatggtgacgtcaccttttgtcgtccaaaatctccggtctacgtgggtaacggtgtgcacgccaacctgcacgttgcgttccaccgtagcagcagcgaaaaaatccacagcaacgagatttcttccgattccatcggcgtgctgggctatcagaaaactgtggaccacaccaaagtaaattccaagctgtctctgttcttcgagattaaatct。
56、seq id no:3
57、his-2sumo-crm197-pet32a质粒基因序列
58、tggcgaatgggacgcgccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctacacttgccagcgccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttcgccggctttccccgtcaagctctaaatcgggggctccctttagggttccgatttagtgctttacggcacctcgaccccaaaaaacttgattagggtgatggttcacgtagtgggccatcgccctgatagacggtttttcgccctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaacaacactcaaccctatctcggtctattcttttgatttataagggattttgccgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgtttacaatttcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagtatacactccgctatcgctacgtgactgggtcatggctgcgccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgaggcagctgcggtaaagctcatcagcgtggtcgtgaagcgattcacagatgtctgcctgttcatccgcgtccagctcgttgagtttctccagaagcgttaatgtctggcttctgataaagcgggccatgttaagggcggttttttcctgtttggtcactgatgcctccgtgtaagggggatttctgttcatgggggtaatgataccgatgaaacgagagaggatgctcacgatacgggttactgatgatgaacatgcccggttactggaacgttgtgagggtaaacaactggcggtatggatgcggcgggaccagagaaaaatcactcagggtcaatgccagcgcttcgttaatacagatgtaggtgttccacagggtagccagcagcatcctgcgatgcagatccggaacataatggtgcagggcgctgacttccgcgtttccagactttacgaaacacggaaaccgaagaccattcatgttgttgctcaggtcgcagacgttttgcagcagcagtcgcttcacgttcgctcgcgtatcggtgattcattctgctaaccagtaaggcaaccccgccagcctagccgggtcctcaacgacaggagcacgatcatgcgcacccgtggggccgccatgccggcgataatggcctgcttctcgccgaaacgtttggtggcgggaccagtgacgaaggcttgagcgagggcgtgcaagattccgaataccgcaagcgacaggccgatcatcgtcgcgctccagcgaaagcggtcctcgccgaaaatgacccagagcgctgccggcacctgtcctacgagttgcatgataaagaagacagtcataagtgcggcgacgatagtcatgccccgcgcccaccggaaggagctgactgggttgaaggctctcaagggcatcggtcgagatcccggtgcctaatgagtgagctaacttacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgccagggtggtttttcttttcaccagtgagacgggcaacagctgattgcccttcaccgcctggccctgagagagttgcagcaagcggtccacgctggtttgccccagcaggcgaaaatcctgtttgatggtggttaacggcgggatataacatgagctgtcttcggtatcgtcgtatcccactaccgagatgtccgcaccaacgcgcagcccggactcggtaatggcgcgcattgcgcccagcgccatctgatcgttggcaaccagcatcgcagtgggaacgatgccctcattcagcatttgcatggtttgttgaaaaccggacatggcactccagtcgccttcccgttccgctatcggctgaatttgattgcgagtgagatatttatgccagccagccagacgcagacgcgccgagacagaacttaatgggcccgctaacagcgcgatttgctggtgacccaatgcgaccagatgctccacgcccagtcgcgtaccgtcttcatgggagaaaataatactgttgatgggtgtctggtcagagacatcaagaaataacgccggaacattagtgcaggcagcttccacagcaatggcatcctggtcatccagcggatagttaatgatcagcccactgacgcgttgcgcgagaagattgtgcaccgccgctttacaggcttcgacgccgcttcgttctaccatcgacaccaccacgctggcacccagttgatcggcgcgagatttaatcgccgcgacaatttgcgacggcgcgtgcagggccagactggaggtggcaacgccaatcagcaacgactgtttgcccgccagttgttgtgccacgcggttgggaatgtaattcagctccgccatcgccgcttccactttttcccgcgttttcgcagaaacgtggctggcctggttcaccacgcgggaaacggtctgataagagacaccggcatactctgcgacatcgtataacgttactggtttcacattcaccaccctgaattgactctcttccgggcgctatcatgccataccgcgaaaggttttgcgccattcgatggtgtccgggatctcgacgctctcccttatgcgactcctgcattaggaagcagcccagtagtaggttgaggccgttgagcaccgccgccgcaaggaatggtgcatgcaaggagatggcgcccaacagtcccccggccacggggcctgccaccatacccacgccgaaacaagcgctcatgagcccgaagtggcgagcccgatcttccccatcggtgatgtcggcgatataggcgccagcaaccgcacctgtggcgccggtgatgccggccacgatgcgtccggcgtagaggatcgagatcgatctcgatcccgcgaaattaatacgactcactataggggaattgtgagcggataacaattcccctctagaaataattttgtttaactttaagaaggagatatacatatgcatcatcaccatcatcatagcgatagcgaagttaatcaagaagccaaaccggaagttaagccggaagtgaaacctgaaacacatattaacctgaaagtgagtgatggtagcagcgagatctttttcaaaatcaaaaagaccacaccgctgcgtcgtctgatggaagcatttgcaaaacgtcagggtaaagaaatggatagcctgcgttttctgtatgatggtattcgtattcaggcagatcagacaccggaagatctggatatggaagataacgatattatcgaagcacatcgtgagcagattggtagcgatagcgaagttaatcaagaagccaaaccggaagttaagccggaagtgaaacctgaaacacatattaacctgaaagtgagtgatggtagcagcgagatctttttcaaaatcaaaaagaccacaccgctgcgtcgtctgatggaagcatttgcaaaacgtcagggtaaagaaatggatagcctgcgttttctgtatgatggtattcgtattcaggcagatcagacaccggaagatctggatatggaagataacgatattatcgaagcacatcgtgagcagattggtggtggcgctgatgacgtggttgactcttctaaatccttcgttatggagaacttctcttcctaccacggtactaaaccaggttacgtggactccatccagaagggcatccagaaaccaaagtctggtactcagggtaattacgatgacgactggaagcagttctacagcaccgacaacaaatacgatgccgcgggctactctgttgataacgagaacccgctgagcggtaaagcaggtggtgtcgtcaaagtcacgtacccgggcctgacgaaagttctggcgctgaaagttgacaacgcagagaccatcaaaaaagagctgggtctgtctctgaccgagccgctgatggaacaggtaggtactgaagaattcattaaacgtttcggtgatggcgcgtctcgtgttgttctgtccctgccgttcgctgaaggttcctctagcgtggaatacatcaacaactgggaacaggctaaggctctgtctgttgaactggaaatcaacttcgaaacgcgtggtaagcgcggtcaggacgcgatgtacgaatacatggcgcaagcgtgtgcgggtaaccgtgttcgtcgctctgtgggtagcagcctgtcctgtatcaacctggactgggacgtaatccgcgacaaaactaaaaccaaaatcgaatctctgaaagagcacggcccgattaaaaacaagatgtccgaaagcccgaacaagacggtttctgaagaaaaggcgaaacagtatctggaagaattccatcagaccgctctggagcacccggaactgtccgaactgaaaaccgttaccggtaccaacccagttttcgctggtgcgaactacgctgcgtgggccgttaacgtggctcaggttatcgactccgaaaccgcagacaacctggaaaaaaccactgcggctctgtctatcctgccgggcatcggttccgtcatgggcatcgctgatggtgcagtgcatcataacacggaagaaatcgtagcgcagagcattgcgctgtctagcctgatggttgctcaggcgattccgctggtcggcgaactggtagacatcggttttgccgcttacaactttgttgagtccatcattaacctgttccaggtagtacacaactcttacaaccgcccggcttactctccaggccataaaacgcagccgttcctgcacgacggctatgcagttagctggaacaccgttgaagactctattatccgtactggctttcagggtgaaagcggccatgatattaaaatcactgctgaaaacacccctctgccgatcgcgggtgtactgctgccaactattccgggcaaactggatgtaaacaaatccaaaacccacatctctgttaacggtcgcaaaatccgtatgcgttgccgtgctatcgatggtgacgtcaccttttgtcgtccaaaatctccggtctacgtgggtaacggtgtgcacgccaacctgcacgttgcgttccaccgtagcagcagcgaaaaaatccacagcaacgagatttcttccgattccatcggcgtgctgggctatcagaaaactgtggaccacaccaaagtaaattccaagctgtctctgttcttcgagattaaatcttaagatatcatcggatccgaattcgagctccgtcgacaagcttgcggccgcactcgagcaccaccaccaccaccactgagatccggctgctaacaaagcccgaaaggaagctgagttggctgctgccaccgctgagcaataactagcataaccccttggggcctctaaacgggtcttgaggggttttttgctgaaaggaggaactatatccggat。
59、seq id no:4
60、sumo氨基酸序列
61、sdsevnqeakpevkpevkpethinlkvsdgsseiffkikkttplrrlmeafakrqgkemdslrflydgiriqadqtpedldmedndiieahreqigg。
62、seq id no:5
63、sumo基因序列
64、agcgatagcgaagttaatcaagaagccaaaccggaagttaagccggaagtgaaacctgaaacacatattaacctgaaagtgagtgatggtagcagcgagatctttttcaaaatcaaaaagaccacaccgctgcgtcgtctgatggaagcatttgcaaaacgtcagggtaaagaaatggatagcctgcgttttctgtatgatggtattcgtattcaggcagatcagacaccggaagatctggatatggaagataacgatattatcgaagcacatcgtgagcagattggtggt。
65、seq id no:6
66、sumo改造体氨基酸(删除c端gly)序列
67、sdsevnqeakpevkpevkpethinlkvsdgsseiffkikkttplrrlmeafakrqgkemdslrflydgiriqadqtpedldmedndiieahreqig。
68、seq id no:7
69、sumo改造体基因(删除c端gly)序列
70、agcgatagcgaagttaatcaagaagccaaaccggaagttaagccggaagtgaaacctgaaacacatattaacctgaaagtgagtgatggtagcagcgagatctttttcaaaatcaaaaagaccacaccgctgcgtcgtctgatggaagcatttgcaaaacgtcagggtaaagaaatggatagcctgcgttttctgtatgatggtattcgtattcaggcagatcagacaccggaagatctggatatggaagataacgatattatcgaagcacatcgtgagcagattggt。
71、seq id no:8
72、his-2sumo氨基酸序列
73、hhhhhhsdsevnqeakpevkpevkpethinlkvsdgsseiffkikkttplrrlmeafakrqgkemdslrflydgiriqadqtpedldmedndiieahreqigsdsevnqeakpevkpevkpethinlkvsdgsseiffkikkttplrrlmeafakrqgkemdslrflydgiriqadqtpedldmedndiieahreqigg。
74、seq id no:9
75、his-2sumo基因序列
76、catcatcaccatcatcatagcgatagcgaagttaatcaagaagccaaaccggaagttaagccggaagtgaaacctgaaacacatattaacctgaaagtgagtgatggtagcagcgagatctttttcaaaatcaaaaagaccacaccgctgcgtcgtctgatggaagcatttgcaaaacgtcagggtaaagaaatggatagcctgcgttttctgtatgatggtattcgtattcaggcagatcagacaccggaagatctggatatggaagataacgatattatcgaagcacatcgtgagcagattggtagcgatagcgaagttaatcaagaagccaaaccggaagttaagccggaagtgaaacctgaaacacatattaacctgaaagtgagtgatggtagcagcgagatctttttcaaaatcaaaaagaccacaccgctgcgtcgtctgatggaagcatttgcaaaacgtcagggtaaagaaatggatagcctgcgttttctgtatgatggtattcgtattcaggcagatcagacaccggaagatctggatatggaagataacgatattatcgaagcacatcgtgagcagattggtggt。
77、seq id no:10
78、his-2sumo-crm197氨基酸序列
79、hhhhhhsdsevnqeakpevkpevkpethinlkvsdgsseiffkikkttplrrlmeafakrqgkemdslrflydgiriqadqtpedldmedndiieahreqigsdsevnqeakpevkpevkpethinlkvsdgsseiffkikkttplrrlmeafakrqgkemdslrflydgiriqadqtpedldmedndiieahreqigggaddvvdssksfvmenfssyhgtkpgyvdsiqkgiqkpksgtqgnydddwkqfystdnkydaagysvdnenplsgkaggvvkvtypgltkvlalkvdnaetikkelglslteplmeqvgteefikrfgdgasrvvlslpfaegsssveyinnweqakalsveleinfetrgkrgqdamyeymaqacagnrvrrsvgsslscinldwdvirdktktkieslkehgpiknkmsespnktvseekakqyleefhqtalehpelselktvtgtnpvfaganyaawavnvaqvidsetadnlekttaalsilpgigsvmgiadgavhhnteeivaqsialsslmvaqaiplvgelvdigfaaynfvesiinlfqvvhnsynrpayspghktqpflhdgyavswntvedsiirtgfqgesghdikitaentplpiagvllptipgkldvnkskthisvngrkirmrcraidgdvtfcrpkspvyvgngvhanlhvafhrsssekihsneissdsigvlgyqktvdhtkvnsklslffeiks。
80、综上所述,由于采用了上述技术方案,本发明的有益效果是:
81、本发明提供的一种crm197蛋白在原核体系中可溶性表达及高效纯化的方法,首先,将crm197蛋白基因序列的5’末端与两个及以上的sumo蛋白串联序列的c端拼接,插入在原核表达体系表达载体中,并转入到原核感受态细胞中;然后,所述的his-(sumo)n(n≥2)与crm197的融合蛋白在原核表达体系中在特定状态下以可溶的形式在胞内高表达;最后表达后的his-(sumo)n(n≥2)与crm197的融合蛋白无需进行包涵体复性,通过一步金属螯合层析(吸附-洗脱模式)获得his-(sumo)n-crm197融合蛋白,再经过ulp1酶酶切去除his-(sumo)n融合序列后,再经过一步金属螯合层析(流穿模式)得到重组crm197蛋白。该方法利用两个及以上的sumo序列串联融合的方法,实现crm197蛋白在大肠杆菌表达体系中的可溶性表达,避免了传统大肠杆菌体系表达crm197蛋白形成包涵体,避免crm197蛋白以无结构、无活性的包涵体形式表达,避免下游进行crm197蛋白复性的工序;并通过简单的层析步骤从组分复杂的细菌破碎上清液体系中高效纯化得到crm197蛋白;具有操作简便,适合规模化放大、周期短、纯度高、工艺稳定等特点。