用于获得高产量重组蛋白表达的基于mgmt的方法
【专利摘要】本发明涉及宿主细胞中蛋白生产的新型增强子。其公开了一种用于在这些细胞中表达重组蛋白的载体,包括编码a)分泌肽信号、b)6-甲基鸟嘌呤-DNA-甲基转移酶(MGMT,EC2.1.1.63)及其突变体或催化结构域、和c)重组蛋白的核苷酸序列。所述MGMT酶优选是所谓的SNAP蛋白。
【专利说明】用于获得高产量重组蛋白表达的基于MGMT的方法
【技术领域】
[0001]本发明涉及遗传工程和分子生物学领域。特别是,本发明涉及一种宿主细胞中蛋白生产的新型增强子。此外,本发明涉及含有编码所述增强子蛋白的DNA序列的载体,及其用于表达重组蛋白的用途,如工业用酶或药用蛋白,包括真核(例如,哺乳动物,如人)和病毒蛋白。
【背景技术】
[0002]蛋白生产系统,其中在重组生物体或细胞中生产兴趣多肽或蛋白,是商业生物技术的主干。
[0003]最早的系统,基于在宿主如大肠杆菌中的细菌表达,已加入了基于真核宿主的系统,特别是培养的哺乳动物细胞、培养的以及整个昆虫形式的昆虫细胞,和转基因哺乳动物如绵羊和山羊。
[0004]原核细胞培养系统易于维护且操作便宜。然而,原核细胞不能进行真核蛋白的翻译后修饰。此外,许多蛋白不能正确折叠,需要特殊的程序使其重新折叠,这增加了生产成本。
[0005]真核细胞培养系统已经描述了多种应用。例如,哺乳动物细胞能够进行翻译后修饰,且通常产生正确折叠的和可溶性蛋白。哺乳动物细胞系统的主要缺点包括需要专门的和昂贵的培养设施、感染的风险,这可能会导致整个培养物的损失、以及潜在的有害哺乳动物蛋白污染最终产品的风险。交替使用昆虫细胞用来表达多肽。昆虫细胞中所用的最普遍的表达系统基于杆状病毒载体。在强天然多角体蛋白启动子的控制下,通过用异源基因替换编码杆状病毒主要结构蛋白的杆状病毒多角体蛋白基因来构建杆状病毒表达载体。用重组病毒感染培养的昆虫宿主细胞,可以从细胞本身中回收由此产生的蛋白,或者如果采用合适的分泌信号时,从培养基中回收由此产生的蛋白。
[0006]然而,这两种系统,都存在重组蛋白表达水平和质量的再现性、培养物感染的相关问题,并且需要专门的培养设施。此外,用于某些蛋白生产而不得不在GMP条件下制备的杆状病毒原料,随着时间的推移并不总是稳定的。
[0007]果蚬细胞,特别是黑腹果蚬(Drosophila melanogaster) S2细胞,已被US5, 550,043、US5,681,713和US5, 705,359所公开用于蛋白的表达。不同于现有技术的杆状病毒系统,在其中只有裂解感染的昆虫细胞时才能提供兴趣蛋白,基于S2细胞的方法提供连续的异源蛋白的细胞表达系统,并因此产生更高的表达水平。
[0008]已经提出了几个其它用于增强异源蛋白在宿主细胞中表达的装置:例如,US5,919,682描述了在原核生物中使用pCW载体在tac启动子的控制下、共表达蛋白和分子伴侣过量生产功能性硝酸合酶的方法。此外,US4, 758,512涉及在其DNA序列内具有特定突变的宿主细胞的生产,其导致生物体表现出降解外源产物的能力降低。这些突变的宿主生物体可用于增加遗传工程的外源蛋白的产量。
[0009]脊椎动物细胞,特别是哺乳动物细胞,也被广泛用于重组蛋白的表达。来自培养中生长的细胞的蛋白生产的量,随着时间,依赖于若干因素,如,例如细胞密度、细胞周期相、蛋白的细胞生物合成速度、用以支持细胞活力和生长的介质条件、以及细胞在培养中的寿命(即多久之后它们死于程序性细胞死亡或凋亡)。例如通过控制营养物、细胞密度、氧和二氧化碳的含量、乳酸脱氢酶、pH、渗透性、代谢物等,已经开发了改善细胞在培养中的活力和寿命的各种方法,以及提高所需蛋白的产量的方法。
[0010]其它的宿主细胞可用于生产异源重组蛋白,特别是植物细胞和酵母细胞。
[0011]在植物中已经合成了哺乳动物来源的许多药物蛋白。这些从血液制品,如有着每年超过500吨需求量的人血清白蛋白,到需要更少量的细胞因子和其它信号分子。大多数植物来源的蛋白已在转基因烟草中生产,并直接从叶中提取。一般情况下,这些蛋白以较低的水平生产,通常小于总可溶性蛋白的0.1%。这样低水平的生产尤其反映出各种因素的组合,其中最重要的是蛋白折叠和稳定性差。最近,烟草叶绿体系统已被用于以更高的水平表达人类蛋白(MA JKC等人,2004)。
[0012]酵母系统多年来是用于生产大量工业和生物制药用蛋白的主要物质。酵母在明确定义的介质中可生长到非常高的细胞质量密度。可在酵母中过度表达重组蛋白,从而产物从细胞中分泌,并可在发酵液中回收。酵母分泌的蛋白,在一致的糖基化位点,被大量糖基化。因此,重组蛋白在酵母系统中的表达历来被限制用于翻译后糖基化模式不影响蛋白功能的那些蛋白。若干酵母表达系统用于重组蛋白表达,包括酵母菌属(Sacharomyces)、分裂酵母(Schizosaccharomyces pombe)、毕赤酵母(Pichia pastoris)和多形汉逊酵母(Hansanuela polymorpha)。最近,出现了一种具有在酵母中生产重组糖蛋白的能力的新型系统,其糖基化序列与哺乳动物细胞中产生的分泌型人糖蛋白相似。通过消除内源性酶(其向N-糖基化中间体添加高甘露糖链)来修饰毕赤酵母的糖基化途径。此外,参与人源化寡糖链合成的至少五种活性酶被特异性地转染至毕赤酵母。在酵母中生产大量人源化糖蛋白的能力赋予了这样的优势,在其中糖基化结构是高度统一的且易于纯化。此外,可以通过在酵母中使用流加(fed-batch)生产,采用比哺乳动物细胞更短的发酵时间,来消除被哺乳动物病毒和其它哺乳动物宿主糖蛋白的交叉污染。
[0013]然而,通过使用这些系统,在培养细胞的上清中以大约l_2mg/L生产异源蛋白,相较于工业生产目的,这是相当低的。
[0014]因此,迫切需要提供一个能够达到显著更高水平的异源蛋白表达的系统。
[0015]本发明迎合了这种需要,并提供了蛋白表达方法,该方法达到了比现有蛋白生产手段高100倍的生产水平(即,上清中直至200mg/L的蛋白)。
[0016]本发明人的确表明,使用编码来自于人6-甲基鸟嘌呤-DNA-甲基转移酶(hMGMT)蛋白的蛋白的核苷酸载体,所述hMGMT来源的蛋白直接或不直接地连接兴趣蛋白,将所述兴趣蛋白的生产平均增强至40mg/L至200mg/L的产量。
【专利附图】
【附图说明】
[0017]图1公开了(A)编码本发明MGMT融合蛋白序列的mRNA的示意图,从5’到3’, 含有信号肽、MGMT mRNA序列、间隔序列、蛋白酶切割位点、重组蛋白基因(外源基因)、间隔序列、和一个标记(His6)标签,和(B)载体相同部分的DNA和氨基酸序列,其包括i)昆虫ssBiP信号肽(斜体)、ii) SNAP编码增强子序列(灰色)、iii) DNA间隔序列、iv)肠激酶位点编码序列(粗体)、V)克隆位点EcoRV/Xmal (下划线)和vi)编码His标签标记的DNA (粗斜体)(也见 SEQ ID NO:5)。
[0018]图2公开了(A)融合蛋白SNAP (灰色)和连接至His标签标记的裂谷热病毒(RiftValley fever virus) N核蛋白(RVF.N,粗体)的氨基酸序列,两种蛋白被间隔序列GGGS隔开,(B)在转染有SEQ ID NO:19 (SNAP-RVF)的DNA载体的S2细胞的细胞上清上,用或不用镉刺激10天,用抗Hi s 的抗体的免疫印迹分析,和(C)用抗Hi s抗体,在大肠杆菌B21裂解物的不溶(INS)或可溶(SOL)蛋白部分(fraction)上进行的免疫印迹分析,所述细菌携带pET302/RVF.N+proTEV+GST质粒。(D)免疫印迹分析显示,来自10天刺激的S2细胞的分泌嵌合蛋白SNAP-RVF.N在经过两步纯化之后所获得的连续部分(fraction)样本中的SNAP-RVF.N 的量,使用 Talon 和 Superdex75 柱。
[0019]图3公开了(A)融合蛋白SNAP (斜体)和来自西尼罗病毒的包膜蛋白E的可溶形式(灰色),连接至His标签标记(粗体)的DNA和氨基酸序列,蛋白被间隔序列GGGS隔开(SEQ ID NO:20),和(B)使用抗His标签抗体进行的免疫印迹分析,显示在转染有本发明编码SNAP-WNsE的DNA载体(SEQ ID NO:20)的S2细胞的上清中,用或不用镉刺激10天,西尼罗病毒包膜蛋白E蛋白的可溶形式的分泌。
[0020]图4公开了(A)含有BiP肽信号、MGMT样编码序列(SNAP样)、在IFNa序列两侧的两个pro-TEV切割位点(huIFNAI)、和His标签标记的DNA盒的示意图,(B)融合蛋白SNAP(灰色,前面是斜体表示的昆虫肽信号)和IFNa (粗体)接着是His标签标记(粗斜体)的DNA和氨基酸序列,SNAP和IFNa蛋白用肠激酶切割位点(下划线)和间隔序列GGGS隔开。(C)使用抗His标签抗体进行的免疫印迹分析,来检测转染有本发明编码IFNa (S2/SNAP-1FN)的载体或对照载体的S2细胞上清中IFNa的表达,用或不用Cd2+刺激。(D)使用抗SNAP抗体,在用或不用镉诱导10天的IOyL S2/DeSNAPuniv-1FNa细胞上清上进行的免疫印迹分析。(E)在感染有表达海肾荧光素酶的基孔肯雅病毒(Chikungunya virus)的HeLa细胞中萤光素酶的活性,用不同剂量的来自商业来源(Intergen)的或通过本发明的方法产生的IFNa处理所述细胞。(F)在感染有表达海肾荧光素酶的基孔肯雅病毒的HeLa细胞中萤光素酶的活性,用不同剂量的通过本发明生产方法获得的SNAP-1FNa蛋白处理所述细胞。
[0021]图5表示本发明重组蛋白生产过程中的不同步骤。
[0022]图6公开了(A)融合蛋白SNAP (灰色,前面是昆虫肽信号)和颗粒酶M随后是His标签的DNA和氨基酸序列,SNAP和颗粒酶M蛋白用肠激酶切割位点和间隔序列GGGS隔开。(B)嵌合融合蛋白SNAP-GrM的示意图,突出SNAP中的三个潜在GrM酶切割位点(C)使用抗SNAP或抗His标签抗体进行的免疫印迹分析,来检测转染有本发明编码GrM(S2/SNAP-GrM,SEQ ID NO:55)的载体的S2细胞上清中SNAP-GrM的表达。
[0023]图7公开了(A)含有BiP样肽信号、MGMT编码序列、在IFNa序列两侧的两个pro-TEV切割位点(huIFNAI)、和His标签标记的通用DNA盒的示意图,(B)融合蛋白SNAP(灰色,前面是昆虫Bip样肽信号)和人IFNa I (氨基酸以粗体显示)接着是His标签标记的DNA和氨基酸序列,SNAP和IFNa蛋白用proTEV切割位点和间隔序列GGGS隔开。(C)用抗SNAP抗体进行的免疫印迹分析,来检测转染有单独编码SNAP而没有肽信号的载体(pSNAPf载体)、或单独编码SNAP,其前面是登革病毒肽信号的载体(pDVlssprM-SNAP)、或编码IFNa包括如(A)中所定义的DNA序列的本发明载体(pDeSNAP-4/SNAP-1FNAl,SEQ IDNO:57)的HeLa细胞上清中SNAP-1FNa的表达。
[0024]图8A公开了包含BiP样肽信号、SNAP编码序列、两个pro_TEV切割位点、His标签标记、用于克隆兴趣基因的四个独特的克隆位点BamH1、Eco RV、Xma I和Apa 1、和间隔序列GGGS的通用DNA盒(DeSNAP univ,SEQ ID NO:59和60)。需要5’端的独特位点NheI和3’端的Not I/Hind III用于哺乳动物表达载体中的亚克隆步骤(如质粒pcDNA3或pC1-neo),以及需要5’端的独特位点Bgl II和3’端的Age I用于非脊椎动物DES系统的亚克隆步骤。(B)中的示意图公开了包含BiP样肽信号、MGMT编码序列、两个pro-TEV切割位点、His标签标记、用于克隆兴趣基因的四个独特的克隆位点BamH1、Eco RV,Xma I和Apa1、和间隔序列 GGGS 的通用 DNA 盒(DeMGMT univ, SEQ ID NO:69 和 70)。
[0025]图9公开了一种将外源基因插入DeMGMT Univ的方式。
[0026]图10 公开了在-80° C、4° C、25° C 或 37 ° C 下孵育 4 天(A)或在-80 ° C、4° C、25° C 或 37。C 下孵育两个月(B)的 SNAP 融合蛋白 CHIK.sE2-SNAP、SNAP-WN.EDIII和SNAP-1FNa I的热稳定性。
[0027]图11公开了通过将本发明的载体引入S2细胞,在用(+ )或不用(_)镉诱导10天后,在全部上清(A)或在不同部分(B)中融合蛋白SNAP-SSX2和SNAP-sFasL的生产。
[0028]图12公开了 (A)包含BiP样肽信号、MGMT编码序列(SNAP样)、SSX2癌抗原两侧的两个pro-TEV切割位点、和His标签标记的通用DNA盒的示意图,(B)包含BiP样肽信号、MGMT编码序列、NERMCSL蛋白两侧的两个pro-TEV切割位点、和His标签标记的通用DNA盒的示意图,(C)使用小鼠抗SNAP抗体,在瞬时转染的HeLa细胞上进行两天的免疫印迹分析,显示IFNa、SSX2和NERMCSL的细胞外或细胞内生产。
[0029]图13公开了(A)包含BiP样肽信号、MGMT编码序列(SNAP样)、hSULF_2A?多肽两侧的两个pro-TEV切割位点、和His标签标记的通用DNA盒的示意图,(B)融合蛋白SNAP (深灰色,前面是昆虫BiP样肽信号)和hSULF-2A?接着是His标签标记的DNA和氨基酸序列,SNAP和hSULF-2"?蛋白用proTEV切割位点和间隔序列GGGS隔开,以及(C)瞬时转染有pcDNA3/DeSNAPuniv-hSULF_2A?两天的HEK293细胞所分泌的分泌型嵌合DeSNAP-hSULF_2^m 的酶活性。
[0030]图14公开了(A)包含BiP肽信号、MGMT编码序列(SNAP样)、NERMCSL蛋白两侧的两个pro-TEV切割位点、和His标签标记的DNA盒的示意图,(B)使用抗SNAP抗体进行的免疫印迹分析,来检测转染有本发明编码NERMCSL蛋白的载体(S2/SNAP-NERMCSL)或编码基孔肯雅病毒可溶性蛋白E2的载体(CHIK.SE2-SNAP)的S2细胞上清中,用或不用Cd2+刺激,NERMCSL蛋白的表达。
【具体实施方式】
[0031]本发明人观察到6-甲基鸟嘌呤-DNA甲基转移酶(MGMT)和兴趣重组蛋白一起的共表达极大地提高了所述重组蛋白在昆虫细胞如S2细胞以及在哺乳动物细胞如HeLa细胞中的生产。
[0032]6-甲基鸟嘌呤-DNA-甲基转移酶(MGMT,也被称为Atase或AGT,以下称为“MGMT”)在IUBMB酶命名法中编号为EC2.1.1.63。它是207个氨基酸残基的6-烷基鸟嘌呤-DNA-烷基转移酶的DNA修复酶,其在细胞内的功能是修复烷基化DNA。更精确地,MGMT通过将Sn2反应中的甲基转化为反应性半胱氨酸残基(半胱氨酸145)对DNA中的O6-甲基化鸟嘌呤发挥作用。由于蛋白不可逆地失活,该修复机制是不常见的(Pegg A.E.等人,Mutat.Res.2000; 462,82-100)。目前在分子生物学中,通过与O6-苄基鸟嘌呤衍生物的不可逆标记反应,这种酶用来给蛋白在体内标记上报告分子(Juillerat A.等人,Chemistry&Biology, vol.10,313-317,2003 和 W02005/085470)。[0033]到目前为止,已经描述了源自MGMT的不同酶(Lim A.等人,EMBOJ.15:4050-4060,1996 ;Daniels D.S.等人,EMBO J.19:1719-1730, 2000 Juillerat A.等人,Chemistry&Biology, vol.10,313-317,2003、W02005/085470、W02004/031405)。尤其是,获得了含有突变 Cys62Ala、Lysl25Ala、Alal27Thr、Argl28Ala、Glyl31Lys、Glyl32Thr、Metl34Leu、Argl35Ser、Cysl50Ser、Asnl57Gly、Serl59Glu、在 182 位氨基酸被截短的 20kDa的蛋白(W02005/085470中所谓的“AGT26”突变体,在W02006/114409中也称为“SNAP26”)。特定突变体“SNAP26”已被证明具有增强的标记活性。然而,从未显示或没有暗示过,它可增强和它偶联的重组蛋白的表达。
[0034]此处本发明人首次提出使用MGMT酶(EC2.1.1.63)、其突变体、其催化结构域或其子片段,用于增强蛋白在宿主细胞中的生产,特别是在非脊椎动物和脊椎动物宿主细胞中。当宿主细胞表达包括至少i)在所述宿主细胞中具有功能的肽分泌信号、ii) MGMT酶、其突变体、催化结构域或子片段、和iii)兴趣蛋白的融合多肽时,观察到增强作用。为了使增强作用发生,MGMT酶直接或间接地(可引入间隔序列及其它氨基酸)物理连接至兴趣蛋白。不受理论约束,可设想,MGMT酶可以作为伴侣蛋白,例如通过利于从宿主细胞的分泌以及在宿主细胞上清中稳定合成的融合多肽,或防止从宿主细胞合成和分泌的过程中和之后被代谢掉。
[0035]此外,已经观察到,MGMT有三维球状结构,其包括α螺旋(Wibley JEA等人,2000),这和MGMT的支架作用相兼容。
[0036]在本发明的上下文中,“宿主”细胞是可用于生产重组蛋白的任何细胞,如“非脊椎动物”(或无脊椎动物)细胞、脊椎动物细胞、植物细胞、酵母细胞或原核细胞。优选地,它们是非脊椎动物和脊椎动物细胞。
[0037]非脊椎动物(也称为无脊椎动物)包括不同的门,最熟知的是昆虫、蛛形纲(Arachnida)> 甲壳纲(Crustacea)、软体动物门(Mollusca)、环节动物门(Annelida)、蔓足纲(Cirripedia)、放射虫纲(Radiata)、腔肠动物门(Coelenterata)和纤毛虫纲(Infusoria)。它们现在分为30多个门,从简单的生物体,如海绵和扁形虫到复杂的动物,如节肢动物和软体动物。在本发明的上下文中,非脊椎动物细胞优选是昆虫细胞,如果蝇或蚊子细胞,更优选为果蝇S2细胞。
[0038]可用作宿主细胞系的源自脊椎动物生物体的细胞实例包括非人类胚胎干细胞或其衍生物,例如禽EBX细胞;转化有SV40序列的猴肾CVI系(C0S-7,ATCCCRL1651);人胚胎肾系(293);幼仓鼠肾细胞(BHK,ATCC CCL10 );中国仓鼠卵巢细胞(CHO);小鼠支持细胞[TM4];猴肾细胞(CVI,ATCC CCL70);非洲绿猴肾细胞(VER0-76,ATCC CRL-1587);人宫颈癌细胞(HeLa,ATCC CCL2);犬肾细胞(MDCK,ATCC CCL34);布法罗大鼠肝细胞(BRL3A,ATCCCRL1442);人肺细胞(W138,ATCC CCL75);人肝细胞(Hep G2,HB8065);小鼠乳腺肿瘤细胞(MMT060562,ATCC CCL51);大鼠肝癌细胞[HTC, Ml.5] ;YB2/0 (ATCC n。CRL1662);NIH3T3 ;HEK和TRI细胞。在本发明的上下文中,脊椎动物细胞优选是EBX、CH0、YB2/0、C0S、HEK、NIH3T3细胞或其衍生物。
[0039]在本发明的上下文中,可用的植物细胞是烟草栽培品种Bright Yellow2 (BY2)和普通烟草 I (Nicotiana Tabaccum) (NT-1)。
[0040]在本发明的上下文中,可用的酵母细胞是:酿酒酵母(Saccharomycescerevisiae)、分裂酵母(Schizosaccharomyces pombe)和多形汉逊酵母(Hansanuelapolymorpha),以及(methylotropic yeast)甲醇营养型酵母如毕赤酵母和甲醇毕赤酵母(Pichia methanolica)0
[0041]在本发明的上下文中,可用的原核生物细胞通常是大肠杆菌细菌或枯草芽孢杆菌(Bacillus Subtilis)细菌。
[0042]因此,本发明公开了编码至少a)在非脊椎动物细胞或脊椎动物细胞中优选具有功能的肽分泌信号、和b)6-甲基鸟嘌呤-DNA-甲基转移酶、其突变体、子片段或催化结构域的核苷酸表达载体。
[0043]术语“载体”此处是指,外源基因的DNA或RNA序列借此可以引入宿主细胞中从而转化和促进所引入的序列的表达的媒介。载体可包括例如,质粒、噬菌体、和病毒,并在下面更详细讨论。事实上,任何类型的质粒、粘粒、YAC或病毒载体可用于制备可引入宿主细胞中的重组核酸构建体,并在宿主细胞中获得兴趣蛋白的表达。或者,其中希望在特定类型的宿主细胞中表达兴趣蛋白时,可以使用选择性感染所需细胞类型或组织类型的病毒载体。在本发明的上下文中,也很重要的是用于基因治疗的载体(即,能够向宿主有机体递送核酸分子)。
[0044]例如,病毒载体如慢病毒、逆转录病毒、疱疹病毒、腺病毒、腺相关病毒、痘病毒、杆状病毒和其它具有所需细胞嗜性.的重组病毒。用于构建和使用病毒载体的方法在本领域中是已知的(参见,Miller 和 Rosman, BioTechniques, 7:980-990,1992)。
[0045]在本发明中实际优选的病毒载体是非常适用于脊椎动物和非脊椎动物细胞中的那些。
[0046]对于非脊椎动物细胞,优选的载体是虫媒病毒,特别优选西尼罗病毒,其是节肢动物载体。已知在非脊椎动物细胞中被有效表达的其它载体是杆状病毒。
[0047]对于脊椎动物细胞,优选慢病毒、AAV、杆状病毒和腺病毒载体。适于在哺乳动物宿主细胞中表达的载体也可以是非病毒(如质粒DNA)来源。合适的质粒载体包括但不限于pREP4、pCEP4 (Invitrogene)、pCI (Promega)>pCDM8 和 pMT2PC、pVAX 和 pgWiz。
[0048]对于原核生物细胞,优选质粒、曬菌体和粘粒载体。用于原核细胞系统的合适载体包括但不限于 pBR322 (Gibco BRL)> pUC (Gibco BRL)> pBluescript (Stratagene)、pPoly、pTrc ;pETlld ;pIN ;和 pGEX 载体。
[0049]对于植物细胞,优选质粒表达载体如Ti质粒,和病毒表达载体如花椰菜花叶病毒(CaMV)和烟草花叶病毒TMV。
[0050]重组蛋白在酵母细胞中的表达可以通过三种类型的载体来实施:整合载体(Yip)、附加体质粒(YEp)和中心粒质粒(YCp):用于在酵母(例如酿酒酵母)中表达的合适载体包括但不局限于 pYepSecl、pMFa、pJRY88、pYES2 (Invitrogen Corporation, SanDiego, Calif.)和 pTEF-MF (Dualsystems Biotech 产品编号:P03303)。[0051]可被用于基因治疗的载体是本领域已知的。它们是例如慢病毒、逆转录病毒、腺病毒、痘病毒、疱疹病毒、麻疹病毒、泡沫病毒或腺相关病毒(AAV)。病毒载体可以具有复制能力,或可以遗传上不具有复制能力,从而成为复制缺陷的或复制受损的。优选的基因治疗载体是 W01999/055892、US6, 682,507 和 W02001/27300 中所描述的 DNA Flap 载体。
[0052]“编码”表达产物(如RNA、多肽、蛋白或酶)的序列是,当表达时,导致RNA、多肽、蛋白或酶产生的核苷酸序列;即核苷酸序列“编码”RNA或其编码多肽、蛋白或酶的氨基酸序列。
[0053]在本发明的上下文中,酶的“催化结构域”是指酶的活性位点,或者换句话说,发生底物催化的酶分子部分(此处,在Sn2反应中,将甲基基团转化为反应性半胱氨酸残基)。因此,术语“其催化结构域”指定为MGMT多肽的任何片段或同源序列,优选具有至少80%的天然MGMT酶的催化活性。这些片段(也称为“子片段”)可包括20至180个之间,优选30至100个之间的氨基酸。所述催化结构域的同源序列可以具有一个或多个导致所述催化活性的部分或全部失去的突变。
[0054]在本发明的上下文中,MGMT酶可以是序列SEQ ID NO:4的人MGMT (参考NP_002403.2)、鉴定为 NP_032624.1 的小鼠 MGMT (SEQ ID NO:45)、鉴定为 NP_036993.1 的大鼠MGMT (SEQ ID NO:46)或其同源序列。
[0055]术语“同源的”是指具有序列相似性的序列。术语“序列相似性”,以其所有语法形式,是指核酸或氨基酸序列之间的同一性或对应程度。在本发明的上下文中,当至少约80%、或者至少约81%、或者至少约82%、或者至少约83%、或者至少约84%、或者至少约85%、或者至少约86%、或者至少约87%、或者至少约88%、或者至少约89%、或者至少约90%、或者至少约91%、或者至少约92%、或者至少约93%、或者至少约94%、或者至少约95%、或者至少约96%、或者至少约97%、或者至少约98%、或者至少约99%的氨基酸相似时,两条氨基酸序列是“同源的”。优选,通过使用Needleman和Wunsch算法鉴定相似或同源的多肽序列。
[0056]优选地,和6-甲基鸟嘌呤-DNA甲基转移酶同源的序列与SEQ ID NO:4分享至少64%的氨基酸序列同一性,优选至少约65%的氨基酸序列同一性、或者至少约66%的氨基酸序列同一性、或者至少约67%的氨基酸序列同一性、或者至少约68%的氨基酸序列同一性、或者至少约69%的氨基酸序列同一性、或者至少约70%的氨基酸序列同一性、或者至少约71%的氨基酸序列同一性、或者至少约72%的氨基酸序列同一性、或者至少约73%的氨基酸序列同一性、或者至少约74%的氨基酸序列同一性、或者至少约75%的氨基酸序列同一性、或者至少约76%的氨基酸序列同一性、或者至少约77%的氨基酸序列同一性、或者至少约78%的氨基酸序列同一性、或者至少约79%的氨基酸序列同一性、或者至少是80%的氨基酸序列同一性、或者至少约81%的氨基酸序列同一性、或者至少约82%的氨基酸序列同一性、或者至少约83%的氨基酸序列同一性、或者至少约84%的氨基酸序列同一性、或者至少约85%的氨基酸序列同一性、或者至少约86%的氨基酸序列同一性、或者至少约87%的氨基酸序列同一性、或者至少约88%的氨基酸序列同一性、或者至少约89%的氨基酸序列同一性、或者至少约90%的氨基酸序列同一性、或者至少约91%的氨基酸序列同一性、或者至少约92%的氨基酸序列同一性、或者至少约93%的氨基酸序列同一性、或者至少约94%的氨基酸序列同一性、或者至少约95%的氨基酸序列同一性、或者至少约96%的氨基酸序列同一性、或者至少约97%的氨基酸序列同一性、或者至少约98%的氨基酸序列同一性以及或者至少约99%的氨基酸序列同一性。在一个优选的实施方式中,SEQ ID NO:4的同源序列与SEQID NO:4至少64%、优选70%、以及更优选80%相同。
[0057]更优选的同源MGMT序列包含W02005/085470中描述的突变,其位置可以很容易地调换以基于SEQ ID N0:4,SNAP26的起始蛋氨酸残基对应着SEQ IDNO:4第32位的蛋氨酸残基(因此,31个氨基酸应加入到W02005/085470所公开的位置中,从而获得SEQ ID NO:4中对应的那些)。
[0058]优选地,可用于本发明的MGMT同源序列对应着SEQ ID NO:4的野生型MGMT序列,其中I和30个之间,优选6和25个之间,以及尤其是14、15、16、17、18、19、20、21、22或23个氨基酸被其它氨基酸取代,和/或在C-端I至40个,优选I至20个,尤其是10至20个氨基酸,更优选15个氨基酸被删除。
[0059]在一个优选的实施方式中,与SEQ ID NO:4相比,MGMT同源序列包含以下突变:
[0060](A) Lys31取代为Arg、或Met32取代为Ser、或Cys93取代为Ala、或Lysl56取代为Ala、或Alal58取代为Thr、或Argl59取代为Ala、Glyl62取代为Lys、或Glyl63取代为Thr、或Metl65取代为Leu、或Argl66取代为Ser、或Cysl81取代为Ser、或Asnl88取代为Gly、或Serl90取代为Glu、或Gly214取代为Pro、或Ser215取代为Ala、或Ser216取代为Gly、或Gly217取代为He、或Leu218取代为Gly、或Gly220取代为Pro、或Ala221取代为Gly、或Trp222取代为Ser,或
[0061](B) Lys31-Met32 取代为 Arg-Ser、或 Alal58_Argl59 取代为 Thr-Ala,或Glyl62-Glyl63 取代为 Lys-Thr、或 Metl65_Argl66 取代为 Leu-Ser,或 Glyl62_Glyl63/Metl65-Argl66 取代为 Lys-Thr/Leu-Ser、或 Asnl88/Serl90 取代为 Gly/Glu、或 Gly214_Ser215-Ser216-Gly217-Leu218 取代为 Pro-Ala-Gly-1le-Gly、或 Gly220-Ala221_Trp222 取代为Pro-Gly-Ser,优选与(A)中描述的任何其它氨基酸取代相组合,或
[0062](C)在Leu223后截断(氨基酸224-238被删除),优选与(A)或(B)中描述的任何其它氨基酸取代相组合。
[0063]优选的MGMT同源序列是在Leu223后被截断的那些。
[0064]优选的MGMT同源序列是在其中出现修饰(B)中的2个修饰的那些,任选在Leu223后截断。
[0065]优选的MGMT同源序列是在其中出现修饰(B)中的3个修饰的那些,任选在Leu223后截断。
[0066]优选的MGMT同源序列是在其中出现修饰(B)中的4个修饰的那些,任选在Leu223后截断。
[0067]优选的MGMT同源序列是在其中出现修饰(B)中的5个修饰的那些,任选在Leu223后截断。
[0068]优选的MGMT同源序列是在其中出现修饰(B)中的6个修饰的那些,任选在Leu223后截断。
[0069]其它优选的MGMT 同源序列是含有 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、
18、19或20个选自(A)中所公开的修饰的突变的组合的那些,以及任选在Leu223后截断。
[0070]尤其优选的是,含有突变Lys31Arg、Met32Ser、Cys93Ala、Lysl56Ala、Alal58Thr、Argl59Ala、Glyl62Lys、Glyl63Thr、Metl65Leu、Argl66Ser、Cysl81Ser、Asnl88Gly、Serl90Glu、Gly214Pro、Ser215Ala、Ser216Gly、Gly217Ile、Leu218Gly、Gly220Pro、Ala221Gly、Trp222Ser以及在Leu223后截断的同源序列(即,SEQ ID NO:2的SNAP序列)。
[0071]在一个更优选的实施方式中,MGMT酶是SEQ ID NO:2的SNAP突变蛋白或其同源物。SEQ ID NO:2的SNAP突变体与人6-甲基鸟嘌呤-DNA-甲基转移酶(NP_002403.2,SEQ ID NO:4)的氨基酸序列分享77%的同源性,与小鼠6-甲基鸟嘌呤-DNA-甲基转移酶(NP_032624.1,SEQ ID NO:45)的氨基酸序列分享70%的同源性。
[0072]优选地,所述SNAP蛋白的同源序列与序列SEQ ID NO:2的SNAP蛋白至少80%以上、优选81%、更优选82%、更优选83%、更优选84%、更优选85%、优选86%、更优选87%、更优选88%、更优选89%、更优选90%、更优选91%、更优选92%、更优选93%、更优选94%、更优选95%、更优选96%到甚至更优选97%相同。
[0073]优选地,本发明的核苷酸表达载体还包括使得编码兴趣蛋白的异源DNA序列能够进行框内插入的克隆位点。
[0074]如本发明中所表示的,术语“肽分泌信号”表示指导蛋白运输的短(3-60个氨基酸长)肽链。
[0075]适用于本发明的分泌信号的实例包括但不限于交配因子(MF) α的信号肽序列(US5, 879,926);转化酶(W084/01153) ;PH05 (DK3614/83) ;ΥΑΡ3 (酵母天冬氨酸蛋白酶 3 ;W095/02059);和 BARl (TO87/02670)。
[0076]在本发明的上下文中,这种肽分泌信号优选在非脊椎动物细胞或脊椎动物细胞或者在两种当中是具有功能的。
[0077]在昆虫细胞中具有功能的肽分泌信号的实例是:昆虫ssBiP (SEQ ID N0:48,例如具有SEQ ID NO: 11的DNA序列)、SEQ ID NO:51的BiP样肽信号(例如具有SEQ ID NO:50的DNA序列)以及虫媒病毒中存在的任何肽信号,例如西尼罗病毒的包膜E蛋白(SEQ IDNO:15)。
[0078]有趣的是,上述BiP样肽信号在非脊椎动物和脊椎动物细胞中均是有功能的。这种BiP样信号对应着SEQ ID NO:48的BiP肽信号,其中最后的甘氨酸氨基酸被对应着登革病毒E蛋白切割位点的氨基酸序列Pro Thr Ala Leu Ala (SEQ ID N0:61)取代。因此,一旦蛋白被翻译和分泌到宿主细胞上清中,BiP样信号将有利地被切割掉。
[0079]各种分泌信号也可用于在酵母宿主细胞中的表达,如在酿酒酵母中。这包括前体α 因子(pr印ro alpha factor)、HSpl50、PHOl、SUC2、KILMl (I 型杀伤毒毒素)和 GGPl。
[0080]克隆位点是方便将编码兴趣蛋白的基因克隆至表达系统中的序列。其含有限制性位点、或限制性识别位点,即,含有特异性核苷 酸序列的DNA分子上的位置,其被限制性酶所识别(见如图中)。这些通常是回文序列(因为限制性酶通常作为同型二聚体结合),且特定的限制性酶可切割其识别位点之内或附近的两条核苷酸之间的序列。克隆位点是本领域技术人员已知的。
[0081]更优选的是,核苷酸表达载体还包括插入到所述克隆位点中的编码兴趣异源蛋白或异源多肽的异源DNA序列。
[0082]术语“异源”是指非天然存在的元素的组合。例如,本发明包括编码“兴趣蛋白/多肽”的“异源DNA序列”,这些DNA序列并非天然地处于或位于用于蛋白表达的宿主细胞的染色体位点中。[0083]当编码兴趣异源蛋白或多肽的异源DNA序列插入至本发明的核苷酸载体中时,优选要求其编码包括所述信号肽、所述MGMT酶、其突变体或同源物、以及所述兴趣异源蛋白/多肽的融合多肽。
[0084]在本发明的一个优选实施方式中,编码所述MGMT酶的DNA序列位于编码所述兴趣异源蛋白的DNA序列的5’或3’,优选在5’。因此,MGMT酶直接或间接连接至兴趣异源蛋白/多肽,优选位于兴趣异源蛋白/多肽的N端。
[0085]特别优选,当兴趣异源蛋白/多肽的活性结构域位于其C-端部分时,比如IFNa,编码其所述MGMT酶的DNA序列位于编码所述兴趣异源蛋白/多肽的DNA序列的5’。按照相同的方式,其可以特别优选,当兴趣异源蛋白/多肽的活性结构域位于其N-端部分时,编码所述MGMT酶的DNA序列位于编码所述兴趣异源蛋白/多肽的DNA序列的3’。
[0086]更准确地,在第一方面中,本发明涉及一种用于在宿主细胞中,优选在非脊椎动物和/或脊椎动物宿主细胞中,更优选在昆虫细胞中表达重组蛋白的载体,所述载体包括按照5’至3’的方向在单一开放阅读框中编码如下的核苷酸序列:
[0087]a)在所述宿主细胞中具有功能的肽分泌信号,
[0088]b)6-甲基鸟嘌呤-DNA-甲基转移酶(MGMT,EC2.1.1.63)、其突变体或催化结构域,以及
[0089]c )重组蛋白。
[0090]本发明的上下文中,术语“重组蛋白”或“兴趣蛋白”表示异源于蛋白产生细胞的基因产物或多肽,其优选选自诊断和治疗蛋白或多肽。
[0091]更优选的是,所述诊断和治疗蛋白或多肽选自如下:
[0092]-细菌或病毒的免疫原性蛋白,更优选(感染性、致病性)病毒的蛋白,例如来自登革、日本脑炎、蝶传播脑炎、黄热、乌苏图、罗西奥、穆雷脑炎、威塞尔斯布朗(Wesselbron)、兹卡或西尼罗病毒的EDIII蛋白,或来自裂谷热或托斯卡纳病毒的核蛋白N,或来自基孔肯雅病毒的E2包膜蛋白的可溶形式,或西尼罗病毒E包膜蛋白的可溶形式,和
[0093]-血液因子、抗凝血剂、生长因子、激素、疫苗、治疗性酶、单克隆抗体和细胞因子(如IFN- α、颗粒酶M和FasL),
[0094]-抗原,如癌抗原,如睾丸癌抗原SSX2、或ERC/Mesotheline(无对应译文)的N-端区域(NERCMSL ),
[0095]-抗肿瘤蛋白,如FasL,或肝素硫酸6_0_内硫酸酯酶(heparan-sulfate6-0_endosulfatases) (hSULF),
[0096]-微生物、病毒和/或寄生虫多肽,
[0097]-任何其它有用蛋白(例如接触蛋白)。
[0098]蛋白FasL是一种促凋亡蛋白,其可以用作抗肿瘤剂。其可以例如由SEQ ID NO:88编码。
[0099]hSulf蛋白(或hSULF)是体内调节肝素硫酸结构并对恶性细胞的生长和进展具有显著影响的肝素-硫酸6-0-内硫酸酯酶(Dai等人,2005)。在本发明的上下文中,优选hSulf2蛋白,和更优选hSulf_2"?,其中跨膜结构域(TMD)已被删除以提高其溶解度,这种突变体具有氨基酸序列SEQ ID NO:95,并由例如SEQ IDNO:94编码。
[0100]本发明的载体也可用于表达和纯化兴趣肽和/或多肽。在本发明的上下文中,术语“肽”和“多肽”是同义的,表示以肽键相连的氨基酸单体的短聚合物(也称为“残基”)。这些聚合物优选含有100个以内的残基,更优选50个以内的残基。
[0101]特别是,本发明的载体可用于表达和纯化诊断性微生物多肽,如细菌、病毒或寄生虫多肽。这种多肽的实例是由细菌、病毒或寄生虫所分泌或表达的抗原肽、粘蛋白和/或毒素。优选,所述抗原肽由流感病毒、甲型肝炎病毒、乙型肝炎病毒、丙型肝炎病毒、庚型肝炎病毒、HIV病毒、黄热病毒、登革病毒、日本脑炎病毒、蜱传播脑炎病毒、乌苏图或西尼罗病毒、裂谷热或托斯卡纳病毒、基孔肯雅病毒、呼吸道合胞病毒、罗西奥病毒、穆雷脑炎病毒、威塞尔斯布朗病毒、兹卡病毒(Zika Virus)、淋巴细胞性脉络丛脑膜炎(lymphocyticchoriomeningitis)病毒、人细小病毒、人乳头状瘤病毒、人巨细胞病毒、或任何已鉴定的病毒表达。优选地,所述抗原肽由寄生原虫(如痢疾变形虫(Entamoeba histolytica)、篮氏贾第鞭毛虫(Giardia lamblia))、蠕虫(如线虫、绦虫或吸虫)、或节肢动物(如甲壳纲、昆虫纲、蜘蛛纲)表达。优选,所述抗原肽由传染性细菌,如链球菌属(Streptococcus )、葡萄球菌属(Staphylococcus)和大肠杆菌表达。传染性毒素在本领域是众所周知的。人们可以举出,作为实例,肉毒杆菌神经毒素、产气荚膜梭菌ε毒素、蓖麻毒素、蛤蛘毒素、志贺毒素、河豚毒素、葡萄球菌肠毒素等。粘蛋白也是本领域已知的。MUC5AC、MUC5B和MUC2是其实例。这些实施例不是限制性的,任何肽/多肽可以通过本发明的方法表达。
[0102]接触蛋白是属于免疫球蛋白超家族的分子亚群,其只在神经系统表达(见Shimoda和Watanabe, 2009的综述)。它们参与精神障碍,尤其是自闭症。通过本发明的系统所生产的优选接触蛋白是接触蛋白2和接触蛋白4。例如接触蛋白4(CNTN4)由SEQ ID NO:91编码(对应着完整蛋白NP_783200.1的氨基酸19-990)。
[0103]已知大量癌抗原是用于治疗癌症的有效疫苗靶。这种多肽的大量生产(见Cheever等人,2009中的列表)对于获得有效的癌症疫苗似乎是非常重要的。有趣的是,本发明的载体能够获得高水平的可用于免疫治疗、或产生抗体、或癌症诊断方法中的重组癌抗原。
[0104]SSX2和NERCMSL是癌.抗原的两个例子。SSX2癌抗原由具有SEQ ID NO:76的DNA编码(基因库:NM_175698)0 ERC/Mesotheline 的 N-端区(NERCMSL)由 SEQ ID N0:83 编码。这种抗原常用作患恶性间皮的患者中的检测抗原。
[0105]根据本发明的方法可以产生任何蛋白。
[0106]然而,优选蛋白是治疗性蛋白,如胰岛素、IFN、FasL、Mesotheline、hSULF或接触蛋白。
[0107]更一般地,优选蛋白是到目前为止难以大量生产的那些。这种蛋白是例如FasL、颗粒酶M、hSULF、Mesotheline和接触蛋白。
[0108]编码包括所述肽信号、所述MGMT酶、其突变体或催化结构域和所述兴趣重组蛋白的融合多肽的DNA序列可以可操作地连接至诱导型启动子,其中诱导型启动子在相同宿主细胞中与肽信号同样是有功能的。
[0109]更优选地,在本发明的载体中,所述开放阅读框可操作地连接至诱导型启动子,其中诱导型启动子在相同宿主细胞中与肽信号同样是有功能的。
[0110]在细胞中,编码序列“可操作地连接至”表达调控序列(即转录和翻译调控序列),当RNA聚合酶将编码序列转录成RNA时,RNA然后进行反式RNA剪接(如果它包含内含子)以及,如果该序列编码蛋白,则翻译成该蛋白。[0111]“启动子”是一种由此起始转录可操作地连接至其下游的DNA的核苷酸序列(即在双链DNA的正义链3’方向)。启动子序列内可见转录起始位点(例如,通过用核酸酶SI作图可以方便地找到),以及负责RNA聚合酶结合的蛋白结合结构域(共有序列)。
[0112]本发明的上下文中可用于控制基因表达的启动子例如在非脊椎动物细胞或脊椎动物细胞中是有功能的。例如,对于非脊椎动物细胞,可以使用金属硫蛋白基因的调节序列(Brinster 等人,Nature, 296:39-42,1982)。
[0113]优选地,存在于本发明载体中的诱导型启动子在昆虫细胞中,更优选在果蝇细胞中,具有启动子活性。例如果蝇金属硫蛋白启动子(Lastowsk1-Perry等人,J.Biol.Chem.260:1527(1985))),其在金属如硫酸铜存在下指导高水平的基因转录。或者,可以使用果蝇肌动蛋白5C基因启动子,这是一种组成型启动子并且不需要添加金属(B.J.Bond等人,Mol.Cell.Biol.6:2080(1986))。其它已知果蝇启动子的实例包括例如诱导型热休克(Hsp70)和COPIA LTR启动子。SV40早期启动子给出比果蝇金属硫蛋白更低的表达水平。
[0114]优选地,存在于本发明载体中的诱导型启动子在黑腹果蝇细胞中,优选在果蝇S2细胞中具有启动子活性。例如在Lastowsk1-Perry等人,J.Biol.Chem.260:1527(1985)中充分描述的金属硫蛋白启动子。
[0115]适于在哺乳动物细胞中组成型表达的启动子包括巨细胞病毒(CMV)立即早期启动子、腺病毒主要晚期启动子、磷酸甘油酸激酶(PGK)启动子、单纯疱疹病毒(HSV)-1的胸苷激酶(TK)启动子。受外源性提供的化合物调节的诱导型真核启动子包括但不限于锌诱导的金属硫蛋白(MT)启动子、地塞米松(Dex)诱导型小鼠乳腺肿瘤病毒(MMTV)启动子、T7聚合酶启动子系统(W098/10 088)、昆虫蜕皮激素启动子、四环素阻遏型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。
[0116]优选地,存在于本发明载体的启动子在哺乳动物细胞中,优选在HeLa细胞中具有启动子活性。例如SV40启动子。
[0117]一系列酵母启动子可用于在酵母宿主细胞中表达蛋白。有些例如ADH2、SUC2是诱导型的,而其它的例如GAPDH在表达中是组成型的。适于在酵母中表达的其它启动子包括TEF,PGK,MFa、CYC-1、GAL_1、GAL4、GAL10、PH05、甘油醛 _3_ 磷酸脱氢酶(GAP 或 GAPDH)和乙醇脱氢酶(ADH)启动子。
[0118]为了用于植物细胞中,最常用的启动子是花椰菜花叶病毒(CaMV) 35S启动子或其增强版,但可以使用一些替代启动子,如来自玉米和拟南芥(A.Thaliana)的杂交(ocs)3mas启动子或泛素启动子。不同于这些组成型启动子,水稻α-淀粉酶RAmy3D启动子由糖的剥夺诱导(Hellwig S等人,2004)。
[0119]适于在大肠杆菌宿主细胞中表达的启动子包括但不仅限于噬菌体lamba pL启动子、lac、TRP和IPTG诱导型pTAC启动子。
[0120]优选,肽分泌信号和诱导型启动子在相同宿主细胞中是有功能的。
[0121]更优选,肽分泌信号和诱导型启动子在果蝇S2细胞和脊椎动物细胞中是有功能的。
[0122]术语“诱导型”,当用于启动子时,是本领域技术人员众所周知的。本质上,在诱导型启动子控制下的表达,在响应所施加的刺激时,被“开启”或增加。刺激的性质随启动子而不同。在没有适当刺激的情况下,有些诱导型启动子导致很少或检测不到的表达水平(或不表达)。在没有刺激的情况下,其它诱导型启动子导致可检测到的组成型表达。在没有刺激的情况下,无论表达水平如何,当存在正确刺激时,来自任何诱导型启动子的表达是增加的。
[0123]一旦构建适当的载体并转染到所选择的宿主细胞中,优选果蝇细胞系,通过加入适于诱导型启动子的诱导剂来诱导异源蛋白的表达。例如镉或铜是Hsp70启动子的诱导剂。对于组成型启动子,如肌动蛋白5C启动子,表达不需要诱导剂。
[0124]本发明的人MGMT酶优选由人MGMT基因序列NM_002412.3、基因ID4255 (SEQ IDNO:3)编码、或由优化序列SEQ ID N0:68 (包括仅50% G/C)编码。然而,在本发明的上下文中可以使用任何其同源序列,只要它编码功能MGMT酶、其突变体或催化结构域,优选SEQID NO:4 或 SEQ ID NO:2。
[0125]编码所述MGMT突变体的优选DNA序列是SNAP DNA序列SEQ ID NO:1,或者是编码 SEQ ID NO:2 但具有 51% G/C 含量的 DNA 序列 SEQ ID NO:47 或 SEQ ID NO:67。
[0126]在本发明的另一个实施方式中,本发明的核苷酸载体编码至少MGMT酶的一个片段(例如SEQ ID NO:4的片段),或其同源物的片段(例如序列SEQ ID NO:2的MGMT突变体的片段),其保留了以比用该片段所来源的全长酶获得的水平增加至少0.5倍的因子增加兴趣蛋白的表达的生物活性。作为一个实例,如果利用SEQ ID NO:4的全长酶的生产水平为100mg/L,那么具有至少50mg/L生产水平的SEQ ID NO:4的任何片段(与SEQ ID N0:4全长酶相同的实验条件)都包括在本发明之内。
[0127]在本发明的另一个实施方式中,核苷酸表达载体编码至少一个肽切割位点,其优选位于MGMT酶或其催化结构域和兴趣重组蛋白之间。
[0128]肽的切割位点(也称为“肽切割位点”)是由至少一种蛋白酶(例如,丝氨酸蛋白酶、半胱氨酸蛋白酶等)所识别的氨基酸序列。肽切割位点的实例是SEQ IDNO:62的肠激酶切割位点(AspAspAspAspLys/Asp),例如由DNA序列SEQ IDNO:12所编码的。肠激酶是一种丝氨酸蛋白酶(EC3.4.21.9),已知其通过切割序列的C-端将非活性胰蛋白酶原转换为活性胰蛋白酶:Val—(Asp)4—Lys—Ile—Val ~(胰蛋白酶原)一Val—(Asp)4—Lys (六肽)+Ile—Val~(胰蛋白酶)。如果Lys前面是四个Asp并且后面没有脯氨酸残基,则肠激酶在赖氨酸后切割。
[0129]另一种有用的肽切割位点是所谓的“TEV蛋白酶”切割位点,其具有氨基酸序列SEQID N0:53 或 SEQ ID NO:65(Glu Asn Leu Tyr Phe Gln Gly 或 Ser),其是例如由 DNA 序列SEQ ID N0:52 或 SEQ ID N0:66 编码。TEV 蛋白酶是烟草蚀纹病毒(tobacco etch virus)编码的核包涵体蛋白的27kDa催化结构域的通用名。其可市售获得(Invitrogen)。
[0130]来自登革病毒血清型I的膜前体prM的切割位点(SEQ ID NO:61)也可用于本发明的载体中。
[0131 ] 在另一个实施方式中,本发明核苷酸表达载体还编码一个标记,其优选位于本发明融合多肽中重组蛋白的C端(包括肽信号、MGMT蛋白或其同源物和重组蛋白)。
[0132] 在本发明的上下文中,“标记”专门用于便于从宿主细胞的粗裂解物中回收多肽,并优选选自:突光蛋白、多聚组氨酸(poly-his)或聚组氨酸-甘氨酸(poly-his-gly)标签;Flu HA标签;c-myc标签单纯疱疹病毒糖蛋白D (gD)标签、Flag-肽、α -微管蛋白表位或Τ7基因10蛋白肽标签。然而,可以使用任何其它标记。在本发明的一个优选实施方式中,载体包括编码具有SEQ ID NO:14的六个组氨酸标签的DNA。
[0133]在另一个实施方式中,本发明的核苷酸表达载体还编码间隔序列,优选位于MGMT酶(或其催化结构域)和兴趣重组蛋白之间和/或兴趣重组蛋白和标记之间。
[0134]在本发明的上下文中,间隔序列是包括至少三个氨基酸的氨基酸序列,专门用于空间分隔两条连接的多肽(然后这些多肽间接地连接起来)。这样的间隔序列可以是例如氨基酸序列甘氨酸-甘氨酸-甘氨酸-丝氨酸(GGGS,SEQ ID NO:63),以及编码它的DNA间隔序列是SEQ ID NO:130在本发明的上下文中,此后这种DNA序列称为“DNA间隔序列”并位于编码MGMT或其催化结构域的DNA和重组DNA序列之间,优选编码肽切割位点的DNA序列的上游。
[0135]本发明所公开的核苷酸表达载体可以有序列SEQ ID NO:9、序列SEQ ID N0:10或SEQ ID NO:64 (对应着在克隆位点中没有插入兴趣重组基因的空载体)。在【具体实施方式】中,本发明的载体可以编码:
[0136]-如上所述的肽BiP昆虫信号(优选在S2果蝇细胞中是有功能的)或BiP样信号,
[0137]-SEQ ID NO:4 的 MGMT 蛋白或 SEQ ID NO:2 的 SNAP 蛋白,
[0138]-兴趣重组蛋白,
[0139]-如上所述的肠激酶肽切割位点或proTEV切割位点,
[0140]-多聚组氨酸标记,和
[0141]-具有氨基酸序列甘氨酸-甘氨酸-甘氨酸-丝氨酸(GGGS,SEQID NO:63)的两条间隔序列。
[0142]在一个更优选的实施方式中,本发明的表达载体编码:
[0143]-SEQ ID NO:48 的肽 BiP 昆虫信号,
[0144]-SEQ ID NO:4 的 MGMT 蛋白或 SEQ ID NO:2 的 SNAP 蛋白,
[0145]-兴趣重组蛋白,
[0146]-SEQ ID NO:62的肠激酶肽切割位点,
[0147]-多聚组氨酸标记,和
[0148]-具有氨基酸序列甘氨酸-甘氨酸-甘氨酸-丝氨酸(GGGS)的两条间隔序列。
[0149]在另一个优选的实施方式中,本发明的表达载体编码:
[0150]-SEQ ID NO:51 的 BiP 样肽信号,
[0151]-SEQ ID NO:4 的 MGMT 蛋白或 SEQ ID NO:2 的 SNAP 蛋白,
[0152]-兴趣重组蛋白,
[0153]-SEQ ID NO:53 的 proTEV 肽切割位点,
[0154]-多聚组氨酸标记,和
[0155]-具有氨基酸序列甘氨酸-甘氨酸-甘氨酸-丝氨酸(GGGS)的两条间隔序列。
[0156]例如,这样的载体可以包括序列SEQ ID NO:19 (当兴趣蛋白是RVF病毒核蛋白N时)、SEQ ID NO:20 (当兴趣蛋白是西尼罗病毒核蛋白N时)、SEQ IDNO:21或57或72或74(当兴趣蛋白是IFNa时)、 SEQ ID N0:77、79或81 (当兴趣蛋白是癌抗原SSX2时)、SEQ IDNO:55 (当兴趣蛋白是颗粒酶M时)、SEQ ID NO:89 (当兴趣蛋白是FasL时)、SEQ ID NO:84或86 (当兴趣蛋白是癌抗原NERCMSL时)、或SEQ ID NO:92 (当兴趣蛋白是接触蛋白CNTN4时)。[0157]在第二方面中,本发明还公开了用于在宿主细胞中表达重组蛋白的载体,其包括在单一开放阅读框中从5’到3’的方向编码如下的核苷酸序列:
[0158]a)肽分泌信号,
[0159]b) SEQ ID NO:4 的 MGMT 蛋白或 SEQ ID NO:2 的 SNAP 蛋白,
[0160]c)至少一个肽切割位点,
[0161]d)多聚组氨酸标记,和
[0162]e)至少一条间隔序列。
[0163]在一个优选的实施方式中,所述肽分泌信号是SEQ ID NO:50的BiP样肽信号。
[0164]在一个更优选的实施方式中,所述载体包含两个SEQ ID NO:52的proTEV肽切割位点和/或两条具有氣基酸序列SEQ ID NO:63的间隔序列。
[0165]在一个具体的优选实施方式中,所述载体包含序列SEQ ID N0:59或SEQ IDNO:69,所述序列在本申请中被分别称为通用DeSNAP盒“DeSNAP Univ”和DeMGMT盒“DeMGMTUniv,,。
[0166]这些“DeSNAP Univ” (SEQ ID NO:59)和 “DeMGMT Univ” (SEQ ID NO:69)被称为“通用”序列,因为它们可以插入到任何类型的专门用于转染宿主的载体中以产生异源蛋白,即脊椎动物载体(如 PCDNA3或PC1-neo载体)以及非脊椎动物载体(如用于DES系统的pMT/BiP/V5-HisA,见如下实施例)。
[0167]包括所述通用序列的质粒实例是SEQ ID NO:64 (包括DeSNAP Univ的pUC57)和SEQ ID NO:71 (带有 DeMGMT Univ 的 pUC57)。
[0168]一旦兴趣蛋白的异源序列在此处被克隆,这样的载体可有利地转染到脊椎动物或非脊椎动物宿主细胞中,以便产生大量兴趣蛋白。
[0169]在第三方面中,本发明针对稳定转染有所述DeSNAP Univ或DeMGMT Univ载体的重组细胞,即转染有包括在单一开放阅读框中编码如下的核苷酸序列的表达载体,从5’到3’的方向:
[0170]a)肽分泌信号,
[0171]b) SEQ ID NO:4 的 MGMT 蛋白或 SEQ ID NO:2 的 SNAP 蛋白,
[0172]c)至少一个肽切割位点,
[0173]d)多聚组氨酸标记,和
[0174]e)至少一条间隔序列,
[0175]各成分如上述定义。
[0176]其优选包括SEQ ID NO:64 的质粒(包括 DeSNAP Univ 的 pUC57)或 SEQ ID NO:71(带有 DeMGMT Univ 的 pUC57)、或至少核苷酸序列 SEQ ID NO:59 (DeSNAP Univ)或 SEQ IDNO:69 (DeMGMT Univ)。
[0177]优选地,在本发明的这一方面,所述重组细胞是大肠杆菌细胞。
[0178]使用这种重组细胞以便扩增和纯化本发明的表达载体,优选包括SEQ ID N0:59的DeSNAP Univ (如 SEQ ID NO:64)或 SEQ ID NO:69 的 DeMGMT Univ (如 SEQ ID NO:71)的那些。
[0179]因此,本发明还针对这种重组细胞用于生产本发明的任何表达载体(所述载体如上所述)的用途。[0180]本发明的核苷酸表达载体也可包括编码选择标志物和/或终止子序列的基因。
[0181]可纳入构建体的选择标志物基因通常是赋予选择性表型的那些,如抗生素抗性(如杀稻痕圃素、氣节青霉素、卡那霉素、潮霉素、嘿吟霉素、氣霉素)。
[0182]在第四方面中,本发明涉及融合多肽,其包括在宿主细胞中,优选在非脊椎动物或脊椎动物细胞中,更优选在昆虫细胞中有功能的肽分泌信号,以及如上所述的6-甲基鸟嘌呤-DNA-甲基转移酶(MGMT) (EC2.1.1.63)、其突变体或催化结构域。
[0183]在这种融合多肽中,优选所述MGMT酶是SEQ ID NO:4的蛋白、SEQ ID NO:2的SNAP蛋白突变体或其同源物。
[0184]这种融合多肽优选还包括如上所述的兴趣重组蛋白,优选位于如上所述的MGMT酶或其催化结构域、和/或标记的C端。这种标记优选是多聚组氨酸标记,且优选位于兴趣重组蛋白的C端。
[0185]本发明的融合多肽可以是SEQ ID吣:33至43、5£0 ID NO:56或SEQ ID NO:58的氨基酸序列(当兴趣重组蛋白是GrM时)、SEQ ID NO:73或75 (当兴趣重组蛋白是IFN a时)、SEQ ID N0:78或80或82 (当兴趣重组蛋白是癌抗原SSX2时)、SEQ ID NO:85或87(当兴趣重组蛋白是NERCMSL时)、SEQ ID NO:90 (当兴趣重组蛋白是FasL时)、或SEQ IDNO:93 (当兴趣重组蛋白是CNTN4时)。
[0186]有趣的是,本发明的融合蛋白可以被存储在4°C下持续几个月没有降解。储存期间的这种体外稳定效果可以归因于MGMT蛋白的支架作用、和/或由于MGMT蛋白的存在而获得的高浓度(通常至少40mg/mL)。
[0187]更重要的是,与MGMT.的结合在分泌蛋白的纯化过程中稳定了重组蛋白。因此一旦施用至有此需求的受试者中,它可以用于体内稳定重组蛋白。与MGMT偶联将是用于增强这种重组蛋白在体内寿命的手段。这种体内稳定效果目前正在研究中。
[0188]在第五方面中,本发明涉及包括本发明表达载体的非脊椎动物重组宿主细胞。
[0189]非脊椎动物细胞可以是来自昆虫、蛛形纲、甲壳纲、软体动物门、环节动物门、蔓足纲、放射虫纲、腔肠动物门和纤毛虫纲的任何细胞。在本发明的上下文中,非脊椎动物细胞优选是昆虫细胞,如果蝇或蚊子细胞。它们更优选为果蝇S2细胞。
[0190]果蝇S2细胞已被广泛描述。它们尤其适合蛋白的高产量生产,因为在室温(24±1°C)下它们可以保持在悬浮培养中。培养基是补充有5%和10% (v/v)之间的热灭活胎牛血清(FBS)的M3。在本发明的优选实施方式中,培养基含有5%FBS。诱导后,细胞培养在无血清介质中。在这样的介质中,S2细胞可以在悬浮培养中生长,例如在250mL至2000mL旋转瓶中,以50-60rpm搅拌。细胞密度通常保持在IO6和IO7之间个细胞每mL。
[0191]本发明还涉及包括本发明表达载体的重组S2果蝇细胞,所述表达载体包括优选选自如下的核苷酸序列:
[0192]-质粒SEQID NO:64 (带有DeSNAP Univ的pUC57)或克隆至细胞中的核苷酸序列,根据布达佩斯条约该细胞已于2011年12月9日以编号CNCM 1-4581保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所,25rue du Docteur Roux, 75724Paris cedexl5,法国,
[0193]-包括SEQID NO:19的载体或克隆至细胞中的核苷酸序列,根据布达佩斯条约该细胞已于2010年8月19日以编号CNCM 1-4357保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所,25rue du Docteur Roux, 75724Paris cedexl5,法国,
[0194]-包括SEQID NO:22的本发明载体或克隆至细胞中的核苷酸序列,该细胞已于2010年10月27日以编号CNCM 1-4381保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所,
[0195]-包括SEQID NO:21的本发明载体或克隆至细胞中的核苷酸序列,该细胞已于2010年10月27日以编号CNCM 1-4382保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所,
[0196]-SEQ ID NO:9的载体或克隆至细胞中的核苷酸序列,该细胞已于2010年9月29日以编号CNCM 1-4368保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所,
[0197]-包括SEQID NO:20的本发明载体或克隆至细胞中的核苷酸序列,该细胞已于2010年9月29日以编号CNCM 1-4369保藏在法国国家微生物保藏中心(CNCM), 巴斯德研究所,
[0198]-SEQ ID NO:71 的载体,
[0199]-包括SEQ ID N0:57 或 72 或 74 (当兴趣蛋白是 IFNa 时)、SEQ ID NO:77、79 或81 (当兴趣蛋白是癌抗原SSX2时)、SEQ ID NO:55 (当兴趣蛋白是颗粒酶M时)、SEQ ID NO:89(当兴趣蛋白是FasL时)、SEQ ID NO:84或86(当兴趣蛋白是癌抗原NERCMSL时)、或SEQID NO:92 (当兴趣蛋白是接触蛋白CNTN4时)或SEQ ID NO:96 (当兴趣蛋白是hSULF_2A?时)的本发明的载体。
[0200]本发明稳定转染的S2细胞也可选自如下:
[0201]-于2010年8月19日以编号CNCM1-4357保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所,25rue du Docteur Roux, 75724Paris cedexl5,法国的细胞,
[0202]-于2010年10月27日以编号CNCM1-4381保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0203]-于2010年10月27日以编号CNCM1-4382保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0204]-于2010年9月29日以编号CNCM1-4368保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0205]-于2010年9月29日以编号CNCM1-4369保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0206]-于2011年12月5日以编号CNCM1-4565保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0207]-于2011年12月5日以编号CNCM1-4566保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0208]-于2011年12月5日以编号CNCM1-4567保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0209]-于2011年12月5日以编号CNCM1-4568保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0210]-于2011年12月5日以编号CNCM1-4569保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,[0211]-于2011年12月5日以编号CNCM1-4570保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0212]-于2011年12月5日以编号CNCM1-4571保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0213]-于2011年12月5日以编号CNCM1-4572保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0214]-于2011年12月8日以编号CNCM1-4576保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0215]-于2011年12月8日以编号CNCM1-4577保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0216]-于2011年12月8日以编号CNCM1-4578保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0217]-于2011年12月8日以编号CNCM1-4579保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0218]-于2011年12月8日以编号CNCM1-4580保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0219]-于2011年12月9日以编号CNCM1-4582保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25r ue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0220]-于2011年12月9日以编号CNCM1-4583保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0221]-于2011年12月9日以编号CNCM1-4584保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,
[0222]-于2011年12月9日以编号CNCM1-4585保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,以及
[0223]-于2011年12月9日以编号CNCM1-4586保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞。
[0224]以编号CNCM 1-4357保藏的重组细胞是包括SEQ ID NO: 19的质粒载体(pMT/BiP/SNAP-RVF.N/His标签)的稳定巨噬细胞果蝇细胞系S2,其中RVF.N为裂谷热病毒(RVF)的N 抗原(see Brehin 等人,Virology371:185, 2008)。
[0225]以编号CNCM 1-4381保藏的重组细胞是包括质粒载体pMT/BiP/V5_His标签的稳定巨噬细胞果蝇细胞系S2,其中SEQ ID NO:22 (3應?/11£0111)插入到扮?序列之后,其中WN.EDIII是西尼罗病毒糖蛋白E的III结构域。
[0226]以编号CNCM 1-4382保藏的重组细胞是包括质粒载体pMT/V5_His标签的稳定巨噬细胞果蝇细胞系S2,其中插入有SEQ ID NO:21 (BiP/SNAP/IFNa I)。IFNa I是SEQ IDNO:32 的人 a I 干扰素(Mokkim 等人,Protein expression purif.63:140,2009)。
[0227]以CNCM 1-4369保藏的重组细胞是包括含有SEQ ID NO:20 (WN.sE/SNAP/his标签)的质粒载体pMT/BiP/V5-His标签的稳定巨噬细胞果蝇细胞系S2,其中WN.sE是西尼罗病毒E包膜蛋白的可溶形式。
[0228]以CNCM 1-4369保藏的重组细胞是包括含有SEQ ID NO:20 (WN.sE/SNAP/his标签)的质粒载体pMT/BiP/V5-His标签的稳定巨噬细胞果蝇细胞系S2,其中WN.sE是西尼罗病毒E包膜蛋白的可溶形式。
[0229]以CNCM 1-4565保藏的重组细胞是包括质粒载体pMT/BiP/SNAP+DVl.EDII I/His标签的稳定巨噬细胞果蝇细胞系S2,其中DVl.EDIII编码登革病毒I的EDIII蛋白,并具有序列 SEQ ID NO:27。
[0230]以CNCM 1-4566保藏的重组细胞是包括质粒载体pMT/BiP/SNAP+DV2.EDII I/His标签的稳定巨噬细胞果蝇细胞系S2,其中DV2.EDIII编码登革病毒2的EDIII蛋白,并具有序列 SEQ ID NO:28。
[0231]以CNCM 1-4567保藏的重组细胞是包括质粒载体pMT/BiP/SNAP+DV3.EDII I/His标签的稳定巨噬细胞果蝇细胞系S2,其中DV3.EDIII编码登革病毒3的EDIII蛋白,并具有序列 SEQ ID NO:29。
[0232]以CNCM 1-4568保藏的重组细胞是包括质粒载体pMT/BiP/SNAP+DV4.EDII I/His标签的稳定巨噬细胞果蝇细胞系S2,其中DV4.EDIII编码登革病毒4的EDIII蛋白,并具有序列 SEQ ID NO:30。
[0233]以CNCM 1-4569保藏的重组细胞是包括质粒载体pMT/BiP/SNAP+YF.EDIII/His标签的稳定巨噬细胞果蝇细胞系S2,其中YF.EDIII编码黄热病毒的EDIII蛋白,并具有序列SEQ ID NO:31。
[0234]以CNCM 1-4570保藏的重组细胞是包括质粒载体pMT/BiP/SNAP+JE.EDIII/His标签的稳定巨噬细胞果蝇细胞系S2,其中JE.EDIII编码日本脑炎病毒的EDIII蛋白,并具有序列 SEQ ID NO:25。
[0235]以CNCM 1-4571保藏的重组细胞是包括质粒载体pMT/BiP/SNAP+USU.EDII I/His标签的稳定巨噬细胞果蝇细胞系S2,其中USU.EDIII编码乌苏图病毒的EDIII蛋白,并具有序列 SEQ ID NO:24。
[0236]以CNCM 1-4572保藏的重组细胞是包括质粒载体pMT/BiP/SNAP+TBE.EDII I/His标签的稳定巨噬细胞果蝇细胞系S2,其中TBE.EDIII编码蜱传播脑炎病毒的EDIII蛋白,并具有序列SEQ ID NO:26。
[0237]以CNCM 1-4576保藏的重组细胞是包括质粒载体pMT/BiP/SNAP+MVE.EDII I/His标签的稳定巨噬细胞果蝇细胞系S2,其中MVE.EDIII编码穆雷脑炎病毒的EDIII蛋白。
[0238]以CNCM 1-4577保藏的重组细胞是包括质粒载体pMT/BiP/SNAP+Roci0.EDIII/His标签的稳定巨噬细胞果蝇细胞系S2,其中Roci0.EDIII编码罗西奥病毒的EDIII蛋白。
[0239]以CNCM 1-4578保藏的重组细胞是包括质粒载体pMT/BiP/SNAP+SLE.EDII I/His标签的稳定巨噬细胞果蝇细胞系S2,其中SLE.EDIII编码圣路易脑炎病毒(Saint-Louisencephalitis virus)的 EDIII 蛋白。
[0240]以CNCM 1-4579保藏的重组细胞是 包括质粒载体pMT/BiP/SNAP+WSL.EDII I/His标签的稳定巨噬细胞果蝇细胞系S2,其中WSL.EDIII编码威塞尔斯布朗病毒的EDIII蛋白。
[0241]以CNCM 1-4580保藏的重组细胞是包括质粒载体pMT/BiP/SNAP+Zika.EDIII/His标签的稳定巨噬细胞果蝇细胞系S2,其中Zika.EDIII编码兹卡病毒的EDIII蛋白。
[0242]以CNCM 1-4583保藏的重组细胞是包括质粒载体pMT/BiP/SNAP+SSX2/His标签的稳定巨噬细胞果蝇细胞系S2,其中SSX2是SEQ ID NO:76。[0243]以CNCM 1-4584保藏的重组细胞是包括质粒载体pMT/BiP/SNAP+NERCMSL/His标签的稳定巨噬细胞果蝇细胞系S2,其中NERCMSL是SEQ IDNO:83。
[0244]以CNCM 1-4585保藏的重组细胞是包括质粒载体pMT/BiP/SNAP+GrM/His标签的稳定巨噬细胞果蝇细胞系S2,其中GrM是SEQ ID NO:54。
[0245]以CNCM 1-4586保藏的重组细胞是包括质粒载体pMT/BiP/ProTEV/His标签的稳定巨噬细胞果蝇细胞系S2,其中ProTEV是SEQ ID NO:52。
[0246]在第六方面中,本发明还针对稳定转染有本发明表达载体的脊椎动物重组细胞。
[0247]优选地,所述脊椎动物重组细胞是哺乳动物细胞,优选CHO、YB2/0、COS、HEK、NIH3T3、HeLa细胞或其衍生物。更优选,在这种情况下,本发明的表达载体包括SEQ ID NO:57或72或74(当兴趣蛋白是IFN a时)、SEQ ID NO:77、79或81(当兴趣蛋白是癌抗原SSX2时)、SEQ ID NO:55 (当兴趣蛋白是颗粒酶M时)、SEQ ID NO:89 (当兴趣蛋白是FasL时)、SEQ ID N0:84或86 (当兴趣蛋白是癌抗原NERCMSL时)、SEQ ID NO:92 (当兴趣蛋白是接触蛋白CNTN4时)或SEQ ID NO:96 (当兴趣蛋白是hSULF_2A?时)。在第七方面中,本发明涉及增强重组蛋白表达的方法,包括将所述蛋白和肽分泌信号与酶6-甲基鸟嘌呤-DNA-甲基转移酶(MGMT)(EC2.1.1.63)、其突变体或催化结构域共表达。所述共表达优选在非脊椎动物细胞中进行,且更优选昆虫细胞。
[0248]更优选,在本方法中,MGMT酶是SEQ ID NO:4的蛋白或其同源物,例如SEQ ID NO:2的SNAP蛋白或其同源物。
[0249]在本发明的上下文中,术语异源蛋白的“增强表达”是指所述蛋白在重组细胞上清中或细胞自身内的表达,相较于现有技术的重组载体(即,不共表达蛋白与MGMT或SNAP蛋白的载体)所获的所述蛋白的表达和/或分泌,改善至少2倍,优选5倍,更优选10倍,以及甚至更优选20倍。在一个优选的实施方式中,术语“增强表达”是指有可能从转染有本发明载体的宿主细胞上清中回收至少40mg/L、优选至少50mg/L、更优选至少60mg/L兴趣蛋白。
[0250]术语“共表达”是指编码i)重组蛋白、ii)MGMT酶、其突变体或催化结构域和iii)肽分泌信号的DNA序列,可操作地连接至表达调控序列(即转录和翻译调控序列),并受其控制。编码肽分泌信号、兴趣异源蛋白和MGMT酶的DNA序列的翻译因此导致融合多肽的形成,其中蛋白可以通过如上所定义的间隔序列、和/或酶切割位点分开。
[0251]本发明融合多肽的“肽分泌信号”优选是在非脊椎动物细胞或脊椎动物细胞中、或两者中、以及更优选在昆虫细胞中、甚至更优选在果蝇S2细胞中具有功能的分泌信号。
[0252]在昆虫细胞中具有功能的肽分泌信号的实例是:SEQ ID NO:48的昆虫ssBiP、SEQID N0:51的BiP样信号以及虫媒病毒中存在的任何肽信号,例如西尼罗病毒的包膜E蛋白(SEQ ID NO:15)。
[0253]在脊椎动物和非脊椎动物细胞中具有功能的肽分泌信号的实例是SEQ ID NO:51的BiP样信号。
[0254]在第八方面中,本发明涉及改善兴趣重组蛋白的生产或在细胞培养中生产重组蛋白的方法,包括使用如上所述的本发明的载体、或如上所述的重组宿主细胞。
[0255]更精确地,改善兴趣重组蛋白的生产、或在细胞培养中生产重组蛋白的所述方法包括步骤:
[0256]a)提供编码所述兴趣蛋白的本发明的核苷酸表达载体,[0257]b)将所述表达载体引入宿主细胞,优选非脊椎动物或脊椎动物宿主细胞,
[0258]c)使引入所述宿主细胞的核苷酸进行表达来产生所述兴趣重组蛋白。
[0259]优选地,所述非脊椎动物宿主细胞是昆虫细胞,例如果蝇S2细胞。
[0260]优选地,所述脊椎动物宿主细胞是哺乳动物细胞,例如CHO、YB2/0、COS、HEK、NIH3T3、HeLa细胞或其衍生物。
[0261]通过使用这 种方法,兴趣重组蛋白以至少40mg/L或以上的回收的细胞培养上清
得以表达。
[0262]使用将基因产物直接分泌到介质中的果蝇细胞系S2是本发明的一个优选实施方式(直接分泌到介质中允许利用高效的一步纯化系统)。
[0263]在第九实施方式中,本发明涉及酶6-甲基鸟嘌呤-DNA-甲基转移酶(MGMT)(EC2.1.1.63)、其突变体或催化结构域用于增强重组蛋白优选在感染有复制型或缺陷型载体的非脊椎动物和/或脊椎动物宿主细胞,更优选在昆虫细胞或哺乳动物细胞中的生产水平的用途。
[0264]MGMT酶可以是序列SEQ ID NO:4的人MGMT (参考NP_002403.2)、鉴定为NP_032624.1 的小鼠 MGMT (SEQ ID NO:45)、鉴定为 NP_036993.1 的大鼠 MGMT (SEQ ID NO:46)、其同源序列、或其子片段。
[0265]优选地,MGMT突变酶是SEQ ID NO: 2的SNAP蛋白或是其同源物,即与序列SEQ IDNO:2的SNAP蛋白至少80%以上,优选85%,更优选90%同一性。
[0266]所述非脊椎动物细胞优选是昆虫细胞,例如果蝇S2细胞。
[0267]在一个优选的实施方式中,本发明涉及酶6-甲基鸟嘌呤-DNA-甲基转移酶(MGMT)(EC2.1.1.63)、其突变体或催化结构域用于增强重组蛋白在感染有复制型或缺陷型载体的脊椎动物细胞,例如哺乳动物细胞中的生产水平的用途。
[0268]所述脊椎动物细胞优选是EBX、CHO、YB2/0、COS、HEK、NIH3T3细胞或其衍生物。
[0269]此外,本发明涉及编码MGMT酶、其突变体或催化结构域的DNA序列用于改善兴趣蛋白在重组细胞中生产水平的用途。
[0270]本发明还涉及编码MGMT酶、其突变体或催化结构域的DNA序列用于i)体外和体内稳定兴趣重组蛋白,和因此ii)增强其体外和体内寿命的用途。
[0271]例如这种DNA序列是人MGMT基因序列NM_002412.3、基因ID4255 (SEQID NO:3)或编码功能MGMT酶、其突变体或催化结构域的其任何同源序列(优选SEQ ID NO=USEQ NO:47、SEQ ID N0:67 或 SEQ ID NO:68)。
[0272]特别是,本发明涉及6-甲基鸟嘌呤-DNA-甲基转移酶(MGMT,EC2.1.1.63)、其突变体或催化结构域,作为融合至或连接至重组蛋白的保护多肽,来改善重组蛋白在储存介质、在血浆或缓冲液中半衰期的用途,来改善作为药物或疫苗的重组蛋白半衰期的用途,或改善用于诊断试剂盒中的重组蛋白半衰期的用途。
[0273]在本发明的上下文中,术语异源蛋白的“改善生产水平”或“增强生产水平”是指所述蛋白在所述细胞上清中或细胞内的表达,相较于用现有技术的重组载体(即,不包括本发明的载体)所获的所述蛋白的表达,改善了至少2倍,优选5倍,更优选10倍,甚至更优选20倍。在一个优选的实施方式中,术语“改善生产”是指有可能从转染有本发明载体的宿主细胞上清中回收至少40mg/L、优选至少50mg/L、更优选至少60mg/L兴趣蛋白。[0274]在一个优选的实施方式中,所述重组蛋白选自:胰岛素、IFN、SSX2、颗粒酶M、FasL、Mesotheline (NERMCSL)、内硫酸酯酶(hSULF)或接触蛋白。
[0275]在一个具体的实施方式中,本发明还涉及用于生产兴趣重组蛋白的方法,方法包括步骤:
[0276]Ca)获得编码兴趣重组蛋白的异源DNA序列;[0277](b)将所述异源DNA序列插入本发明的核苷酸表达载体,所述载体具有例如DNA序列 SEQ ID N0:9、SEQ ID NO: 10, SEQ ID NO:64 或 SEQ ID NO:71,
[0278](C)用步骤(b)得到的多核苷酸转染宿主细胞(优选昆虫细胞或哺乳动物细胞);
[0279](d)使步骤(C)获得的所述多核苷酸进行表达来生产兴趣蛋白;
[0280](e )任选,切割MGMT多肽,
[0281](f)回收兴趣蛋白,
[0282](g)任选,纯化兴趣蛋白。
[0283]为了进行本发明方法的不同步骤,可以采用本领域技术范围内的常规分子生物学、微生物学和重组DNA技术。这种技术在文献中都有完整的解释。见,例如,Sambrook, Fitsch&Maniatis, Molecular Cloning:A Laboratory Manual,第二版(1989)Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(此处参考"Sambrook 等人,?,1989〃);DNA Cloning:A Practical Approach, Volumes I and II(D.N.Glover ed.1985) ;01igonucleotide Synthesis (M.J.Gait ed.1984) ;NucleicAcid Hybridization (B.D.Hames&S.J.Higgins,eds.1984) ;Animal Cell Culture(R.1.Freshney,ed.1986) ;Immobilized Cells and Enzymes (IRL Press, 1986);B.E.Perbal, A Practical Guide to Molecular Cloning (1984) ;F.M.Ausubel 等人,(eds.), Current Protocols in Molecular Biology, John ffiley&Sons, Inc.(1994)。
[0284]术语“转染”是指将外源核酸引入到真核宿主细胞,从而宿主细胞将表达所引入的基因或序列以产生所需物质,在本发明中是所引入的基因或序列编码的蛋白。接受且表达所引入的DNA或RNA的宿主细胞是“被转染的”并成为“转染子”或“克隆”。引入到宿主细胞中的DNA或RNA可以来自任何来源,包括与宿主细胞属于相同属或种的细胞,或属于不相同属或种的细胞
[0285]在本发明的上下文中,用多核苷酸转染宿主细胞可以通过本领域中的经典方法进行,例如通过转染、感染或电穿孔。在另一个实施方式中,可以通过脂质体转染(以裸露DNA的形式),或与其它转染促进剂(肽、聚合物等)体内引入本发明的载体。合成的阳离子脂类可用于制备编码标志物的基因的体内转染的脂质体(Feigner等人,Proc.Natl.Acad.Sc1.U.S.A.,84:7413-7417, 1987)。可用于转移核酸的脂质化合物或组合物描述于W095/18863和TO96/17823,和U.S.5,459,127中。出于靶向的目的,脂质可化学偶联至其它分子(见Mackey 等人,Proc.Natl.Acad.Sc1.U.S.A.,85:8027-8031,1988)。靶向肽如激素或神经递质、和蛋白如抗体、或非肽分子可以化学偶联至脂质体。其它分子也可用于促进核酸在体内的转染,如阳离子寡肽(参见W095/21931 )、源自DNA结合蛋白的肽(见W096/25508)、或阳离子聚合物(见W095/21931)。也可能将载体作为裸露DNA质粒在体内引入。可通过本领域已知方法,如电穿孔、显微注射、细胞融合、DEAE葡聚糖、磷酸钙沉淀、使用基因枪、或使用DNA载体转运体,将用于基因疗法的裸露DNA载体引入所需宿主细胞中(见Wu等人,J.Biol.Chem.,267:963-967,1992 ;ffu 和 ffu, J.Biol.Chem.,263:14621-14624,1988 !Williams 等人,Proc.Natl.Acad.Sc1.U.S.A.,88:2726-2730,1991)。
[0286]术语“允许表达”多核苷酸此处是指存在于载体中的调控序列和所有所需成分的刺激(例如激活诱导型启动子),其以足以发生多核苷酸翻译的量进行。
[0287]如果需要的话,所产生的融合蛋白的MGMT/SNAP多肽的切割通过向上清中或重组细胞内加入具有明确切割位点的蛋白酶而实现。例如,通过向重组细胞上清中加入肠激酶而获得肠激酶切割位点DDDK/D的切割。或者,可以维持MGMT/SNAP多肽从而增强重组蛋白的寿命。
[0288]此外,技术人员将理解可以在用于维持或培养本宿主细胞的培养基中检测表达或分泌的蛋白或多肽。通过已知方法,如离心或过滤可以将培养基和宿主细胞分离。然后,通过利用蛋白或多肽的已知性质特征,可以在无细胞培养基中检测蛋白或多肽。这种性质可以包括蛋白或多肽的区别免疫、酶或物理性质。例如,如果蛋白或多肽具有独特的酶活性,可以在宿主细胞所用培养基上进行针对这种活性的分析。此外,当可以获得针对给定蛋白或多肽的反应性抗体时,这种抗体可用于在任何已知免疫学方法中检测蛋白或多肽(例如,在 Harlowe,等人,1988,Antibodies:A Laboratory Manual, Cold Spring HarborLaboratory Press 中X
[0289]兴趣蛋白的回收由本领域中公知的方法介导,包括但不限于制备性圆盘凝胶电泳、等电聚焦、HPLC、反相HPLC、凝胶过滤、离子交换和分配色谱、沉淀和盐析色谱、萃取和逆流分配(countercurrent distribution)等。因为优选在连接有标记的本发明重组系统中产生兴趣蛋白,所述标记有助于通过色谱在适当的固相基质上从宿主细胞粗裂解物中回收多肽。或者,产生的对抗蛋白或对抗源自蛋白的多肽的抗体可用作回收剂。
[0290]可实施进一步的纯化步骤(g),但有趣的是并不需要。
[0291]被纯化的物质可含有小于约50%,优选小于约75%,最优选小于约90%的与该被纯化的物质原始相关的细胞成分。“基本上纯的”表示使用本领域已知的常规纯化技术可以实现的最闻纯度。
[0292]在本发明的一个实施方式中,本发明的方法使得可以在回收的细胞培养上清中获得至少40mg/L,优选至少50mg/L,更优选至少60mg/L基本上纯的兴趣蛋白。
[0293]本发明的兴趣重组蛋白和融合蛋白(即偶联有MGMT/SNAP多肽的重组蛋白,其比单独的重组蛋白更稳定)可用于各种产品中。例如,这些重组和/或融合蛋白可用于药物组合物,例如用于病毒感染的治疗。
[0294]在一个优选的实施方式中,所述重组蛋白选自:胰岛素、IFN、FasL、颗粒酶M、SSX2、Mesotheline (NERMCSL)、内硫酸酯酶(hSULF)或接触蛋白。
[0295]在另一个实施方式中,本发明提供含有上述核酸载体的感染性病毒颗粒。通常情况下,通过包括如下步骤的方法产生这样的病毒颗粒:
[0296](a)将本发明的病毒载体引入到合适的细胞系中,
[0297](b)在适当的条件下培养所述细胞系以便允许生产所述感染性病毒颗粒,
[0298](C)从所述细胞系的培养物中回收所产生的感染性病毒颗粒,和
[0299](d)任选纯化所述回收的感染性病毒颗粒。
[0300]当病毒载体是缺陷型时,通常在反式提供非功能性病毒基因的互补细胞系或通过使用辅助病毒来产生感染性颗粒。例如,用于互补El缺失的腺病毒载体的合适细胞系包括293细胞以及PER-C6细胞。可以从培养上清中或从裂解后的细胞中回收感染性病毒颗粒。根据标准技术(例如在 W096/27677、W098/00524、W098/22588、W098/26048、W000/40702、EP1016700和W000/50573中描述的色谱法、在氯化铯梯度中的超速离心法)它们可以被进
一步纯化。
[0301]因此,本发明涉及包括本发明的表达载体、重组蛋白、融合蛋白、宿主细胞或病毒颗粒、或其任意组合的药物组合物。这样的药物组合物包括混合有可药用载体的、通过本发明方法获得的治疗量的载体、颗粒、细胞或蛋白。
[0302]可以通过肠胃外、静脉或皮下地系统性施用组合物。当系统性施用时,用于本发明的治疗组合物为无致热源的、肠胃外可接受的蛋白溶液形式。这种肠胃外可接受的蛋白溶液的制备,考虑到pH、等渗性、稳定性等,在本领域的技术范围内。
[0303]考虑到改变药物作用的多种因素,例如状态、体重、患者的排泄物(sew)和饮食、感染的严重程度、施用时间和其它临床因素,剂量方案将由主治医师确定。药物组合物的药物载体和其它成分将由本领域技术人员选择。
[0304]此外,例如,本发明的融合和重组蛋白可用作疫苗组成,来接种哺乳动物受试者以对抗病毒感染。这些蛋白可单独使用或与其它重组蛋白或治疗性接种剂联合使用。这种疫苗的组成将由本领域技术人员确定。
[0305]本发明还包括本发明的融合蛋白、表达载体、感染性病毒颗粒、宿主细胞或药物组合物用于制备药物特别是疫苗中的用途。
[0306]本发明还提供用于治疗或预防人或动物生物体的方法,包括向所述生物体施用治疗有效量的本发明的融合蛋白、表达载体、感染性病毒颗粒、宿主细胞或组合物。
[0307]最后本发明的蛋白,尤其是兴趣融合蛋白的SNAP蛋白,可用作用于检测癌症、病毒感染或生物体液(如血液、血清、唾液等)中抗病毒蛋白抗体存在的诊断剂。这些蛋白也可用在鉴定和/或分离生物体液和组织中病毒蛋白的方法。因此,蛋白可以是进行这种方法的试剂盒中的组成。
[0308]因此,在另一个方面中,本发明还涉及通过本发明任何方法获得的来自致病性或非致病性微生物的重组蛋白或MGMT或SNAP标签的重组蛋白用于鉴定生物样本中是否存在所述致病性或非致病性微生物的用途。在一个优选的实施方式中,所述致病微生物是病毒,MGMT或SNAP标签的蛋白是病毒蛋白,如来自基孔肯雅、登革、日本脑炎(JE)、蜱传脑炎(TBE)、黄热(YF)、乌苏图(USU)或西尼罗病毒的EDII1、或来自裂谷热或托斯卡纳病毒的核蛋白N。
[0309]在本发明的上下文中,所述生物样本是指血样、尿样、或疑似被病毒感染的任何生物样本。
[0310]实施例
[0311]1.质粒构律
[0312]1.1.使用质粒pMT/BiP/V5_His A。它包含3642个核苷酸,并包含以下特征:
[0313]-金属硫蛋白启动子:碱基412-778
[0314]-转录起始:碱基778
[0315]-MT正向引物位点:碱基814-831[0316]-BiP 信号序列:碱基 851-904 (SEQ ID NO:11)
[0317]-多克隆位点:碱基906-999
[0318]-V5 抗原标签:碱基 1003-1044
[0319]-多聚组氨酸区:碱基1054-1074
[0320]-BGH反向引物位点:碱基1094-1111
[0321]-SV40晚期多聚腺苷酸化信号:碱基1267-1272
[0322]-pUC 原点:碱基 1765-2438 (互补链)
[0323]-bla启动子:碱基3444-3542 (互补链)
[0324]-氨苄青霉素(bla)抗性基因ORF:碱基2583-3443 (互补链)
[0325]pUC57Amp载体也可以用于本发明的目的。该载体包含:
[0326]-独特克隆位点EcoRI
[0327]-金属硫蛋白启动子、
[0328]_来自西尼罗病毒株IS_98_ST1的基因组RNA5’端非编码区、
[0329]-翻译起始密码子(ATG)、
[0330]-来自西尼罗病毒 株IS-98-ST1的包膜E蛋白的信号肽(SEQID NO:15),
[0331]_来自西尼罗病毒株IS_98_ST1的基因组RNA3’端非编码区,其中两个重复序列和3’端茎环已被删除、
[0332]_S40polyA f目号基序、
[0333]-独特克隆位点ApaI。
[0334]1.2.SNAP 克隆
[0335]在模板pMT/BiP/CHIK.sE2+SNAP标签上,通过PCR使用如下文所述的一对5’ -SNAP和3’ -MCS引物进行编码SNAP蛋白序列SEQ ID NO:2的DNA的扩增。
[0336]引物5,-SNAP:5,-aaaaaagatctgacaaagactgcgaaatg-3,(SEQ ID NO:7)
[0337]引物3,-MCS:5,-gaggagagggttagggataggcttacc-3’ (SEQ ID NO:8)
[0338]然后用Bgl II和Not I消化PCR产物,并插入到DES系统中线性化质粒p/MT/BiP/V5-A的独特Bgl II (在MCS的5’端)和Not I (在MCS的3’端)位点之间。
[0339]得到的质粒是SEQ ID NO:9的pMT/BiP/SNAP-His标签载体,包括:
[0340]-SEQ ID NO:11 的昆虫 ssBiP 序列、
[0341]-SEQ ID NO:1 的 SNAP DNA 序列、
[0342]-SEQ ID NO:12的肠激酶切割位点、
[0343]-EcoRV-Sma I 限制性位点、
[0344]-位于限制性位点下游的编码His6标签的DNA(SEQ ID N0:14)、以及
[0345]-位于i)增强子序列和EcoRV-SmaI限制性位点之间,和ii)EcoRV-SmaI限制性位点和编码His6标签的DNA之间的SEQ ID NO:13的两个DNA间隔序列。
[0346]pMT/BiP/SNAP-His标签载体可以获自pUC57骨架,并获得具有序列SEQ ID NO:10的载体,载体包括:
[0347]-独特克隆位点EcoRI
[0348]_金属硫蛋白启动子
[0349]_来自西尼罗病毒株IS-98-ST1基因组RNA的5’端非编码区、[0350]-翻译起始密码子、
[0351]-SEQ ID NO:15的来自西尼罗病毒株IS-98-ST1的包膜E蛋白的信号肽、
[0352]-SEQ ID NO -Al 的 SNAP DNA 序列、
[0353]-用于将外源序列插入框架中的独特克隆位点EcoRV和Sma I/Xma 1、
[0354]-SEQ ID NO:12的肠激酶切割位点,其位于SNAP增强子DNA和克隆位点之间、
[0355]-编码六个组氨酸标签序列的DNA(SEQ ID NO:14)、
[0356]-位于i)增强子序列和EcoRV-SmaI限制性位点之间,和ii)EcoRV-SmaI限制性位点和编码His6标签的DNA之间的SEQ ID NO:13的两个DNA间隔序列
[0357]-两个翻译终止密码子、
[0358]-来自西尼罗病毒株IS-98-ST1基因组RNA的3’端非编码区,其中两个重复序列和3’端茎环已被删除、
[0359]-S40polyA信号基序和
[0360]-独特克隆位点ApaI。
[0361]pMT/BiP样/SNAP-His标签载体可以获自pUC57骨架,其中SEQ ID NO:59 (也见图8)插入到独特位点EcoR V和 Hind III之间。载体具有序列SEQ ID NO:64。其包括:
[0362]-独特克隆位点EcoRI
[0363]_金属硫蛋白启动子
[0364]_来自西尼罗病毒株IS-98-ST1基因组RNA的5’端非编码区、
[0365]-翻译起始密码子、
[0366]-SEQ ID NO:15的来自西尼罗病毒株IS-98-ST1的包膜E蛋白的信号肽、
[0367]-SEQ ID NO -Al 的 SNAP DNA 序列、
[0368]-用于将外源序列插入框架中的独特克隆位点BamHUEcoR V、Apa I和Xma1、
[0369]-SEQ ID NO:52的两个proTEV切割位点,位于SNAP增强子DNA和His标签之间、
[0370]-编码六个组氨酸标签序列的DNA(SEQ ID NO:14)、
[0371]-位于i)增强子序列和EcoRV-SmaI限制性位点之间,和ii)ApaI限制性位点和编码His6标签的DNA之间的SEQ ID NO:13的两个DNA间隔序列
[0372]-两个翻译终止密码子、
[0373]-来自西尼罗病毒株IS-98-ST1基因组RNA的3’端非编码区,其中两个重复序列和3’端茎环已被删除、
[0374]-S40polyA信号基序和
[0375]-独特克隆位点ApaI。
[0376]1.3.兴趣基因的克隆
[0377]1.3.1.裂谷热病毒(RVF-N)的核蛋白N
[0378]通过PCR使用如下所列的5’ -N和3’ -N’弓丨物对进行编码RFV-N蛋白序列的cDNA的定向诱变。
[0379]引物5’-N:
[0380]5' -aaaaaggcgcgccagggggtggcggatctgacaactatcaagagcttcgagtccagtttgctgctc-3’ (SEQ ID NO:17)
[0381]引物3,-N:[0382]5' -aaaaaaccggtcaatgatgatgatgatgatgacttccaccgccggctgctgtcttgtaagcctgagcgg-3’ (SEQ ID NO:18)
[0383]1.3.2.非病毒蛋白,例如干扰素IFNa I或颗粒酶M
[0384]也可使用SEQ ID NO:32的人IFNa I蛋白序列。
[0385]也可使用SEQ ID NO:54的人颗粒酶M蛋白序列。颗粒酶M是糜蛋白酶样丝氨酸蛋白酶,其优先在Met或Leu之后切割其底物。其在激活的固有效应自然杀伤细胞中组成型表达。这种蛋白酶还具有抗病毒和抗肿瘤特性(van Domselaar R.等人,The Journal ofImmunology2010 ;Hu D.等人,The Journal of Biological Chemistry2010)o
[0386]1.4.将编码蛋白的基因插入到pMT/BiP/SNAP-His标签或pMT/BiP样/SNAP-His标签载体,从而获得pMT/BiP/SNAP-蛋白-His标签或pMT/BiP样/SNAP-蛋白-His标签载体
[0387]1.4.1.RVF.N
[0388]在1.3.1中获得的PCR产物通过BssHII和AgeI消化,并插入到1.2中获得的线性化质粒p/MT/BiP/SNAP-His标签的独特BssHII (在SNAP基因的3’端)和AgeI (在穿梭质粒MCS的3’端)位点之间。
[0389]得到的质粒是例如p/MT/BiP/SNAP-RVF.N/His 标签(SEQ ID NO:19)。
[0390]1.4.2.不同黄病毒的ED III蛋白
[0391]为了增强基于重组黄病毒抗原的ELISA或免疫印迹试验的特异性,E蛋白(EDIII)的抗原结构域III似乎是种有前途的方法(Ludolfs等人,2007)。用本发明的方法测试来自西尼罗(WN)、乌苏图(USU)、日本脑炎(JE)、蜱传播脑炎(TBE)、登革血清型I至4(DEN-1、-2、-3、-4)和黄热(YF)病毒的重组EDIII的生产。
[0392]动物传染病的WN、USU和JE病毒属于JE血清复合物(serocomplex)。果蝇S2诱导型表达系统(DES, Invitrogen)已被选择用于在非脊椎动物细胞中大规模生产来自黄病毒的个体EDIII。编码来自黄病毒WN、USU、JE、TBE、DEN-1到DEN-4和YF的E蛋白全长结构域III的合成基因列于SEQ ID NO:23至SEQ IDNO:31。在1.2获得的质粒pMT/BiP/SNAP-His标签中,ED III序列在框架中融合至SNAP蛋白的C端产生融合蛋白SNAP-EDIII。
[0393]1.4.3.1FNa
[0394]获得质粒pMT/BiP/SNAP-1FN-His 标签(见图 4)和 pMT/BiP 样 /SNAP-1FN-His 标签(详见图8)。
[0395]1.4.4.颗粒酶 M
[0396]获得质粒pMT/BiP/SNAP-GrM-His 标签(详见图 6)。
[0397]2.转染到宿主细胞中
[0398]2.1.转染到S2细朐中
[0399]允许将SNAP-标签蛋白作为 以Hises结尾的分泌融合蛋白进行生产的所得质粒pMT/BiP/SNAP-蛋白-Hi和选择标志物pC0_Blast共转染到S2细胞中生成显示氨苄青霉素抗性的稳定S2/sSNAP-蛋白胞系。
[0400]搅拌瓶(spinner) (IOOOml)中生长的稳定S2细胞系用重金属镉(Cd2+)刺激10天,浓缩并纯化来自细胞外介质的蛋白。
[0401]用重金属镉孵育10天后,在稳定S2/sSNAP_蛋白-His标签的细胞上清中观察到分泌的SNAP-标签蛋白的积累。
[0402]用抗His标签的羊血清,免疫印迹分析使得能够检测细胞外的SNAP-标签蛋白(见图 2B、3B、4B、6C)。
[0403]2.2.转染到HeLa细朐中
[0404]质粒pMT/BiP样/SNAP-1FN-His标签转染到HeLa细胞中。
[0405]使用抗-SNAP抗体,免疫印迹分析使得能够检测细胞外SNAP标签干扰素(见图7B)。
[0406]3.重组蛋白的纯化
[0407]用金属螯合树脂和HLPC法纯化细胞外His标签和SNAP标签蛋白。
[0408]3.1.RVF-N 和 TOS-N
[0409]RVF-N
[0410]联合 Plate-Forme5Production de Proteines recombinants et d’Anticorps(巴斯德研究所),从用Cd2+刺激10天后的2升S2/sSNAP-RVFV.N-Hises细胞上清中获得高达97mg的高纯SNAP-标签RVF.N蛋白。
[0411]TOS-N
[0412]联合 Plate-Forme5Production de Proteines recombinants et d’Anticorps(巴斯德研究所),从用Cd2+刺激10天后的2升S2/sSNAP-T0S.N-HiSes细胞上清中获得高达4 Img的高纯SNAP-标签RVF.N蛋白。
[0413]生产水平的概要:
[0414]
病毒抗似质粒稳定的细胞系纯化的蛋白浓度(/2L)
来 ft RVF
11 pMT/BiP/SNAP + RVF.N S2/SNAP+RVF.N SNAP-RVF.N 97 mg
的N基因F6
夹白TOS
pMT/BiP/SNAP+ TOS.N S2/SNAP+TOS.N SNAP-TOS.N 41
[0415]3.2?可溶 INF a I
[0416]通过用肠激酶切割(Novagen试剂盒),从SNAP标签释放可溶INF a I蛋白。
[0417]3.3.来自不同黄病毒的抗原
[0418]使用果蝇表达系统分泌的SNAP-标签蛋白储液(stock)
[0419]
【权利要求】
1.一种用于在宿主细胞中表达重组蛋白的载体,其包括在单一开放阅读框中编码如下的核苷酸序列,按照5’至3’的方向: a)在所述宿主细胞中具有功能的肽分泌信号, b)6-甲基鸟嘌呤-DNA-甲基转移酶(MGMT,EC2.1.1.63)、其催化结构域或突变体,以及 c)重组蛋白。
2.根据权利要求1所述的表达载体,其中所述MGMT酶是SEQID NO:4的蛋白或其同源物。
3.根据权利要求1所述的表达载体,其中所述MGMT突变体是SEQID NO:2的SNAP蛋白或其同源物。
4.根据权利要求1至3任一项所述的表达载体,其中所述开放阅读框可操作地与诱导型启动子结合,所述诱导型启动子在相同宿主细胞中与肽信号同样是有功能的。
5.根据权利要求1至4任一项所述的表达载体,其中所述分泌肽信号和所述诱导型启动子在非脊椎动物细胞中,优选在昆虫细胞中,更优选在果蝇S2细胞中是有功能的。
6.根据权利要求1至5任一项所述的表达载体,其中所述分泌肽信号和所述诱导型启动子在脊椎动物细胞中,优选在哺乳动物细胞中,更优选在CHO细胞、YB2/0细胞、COS细胞、HEK细胞、NIH3T3细胞、HeLa细胞或其衍生物中是有功能的。
7.根据权利要求1至6 任一项所述的表达载体,其中所述重组蛋白选自诊断和/或治疗蛋白和/或多肽。
8.根据权利要求7所述的表达载体,其中所述诊断和治疗蛋白和/或多肽选自: -细菌或病毒免疫原性蛋白,更优选来自登革、日本脑炎(JE)、蜱传播脑炎(TBE)、黄热(YF)、乌苏图(USU)、罗西奥、穆雷脑炎(MVE)、威塞尔斯布朗(WSL)、兹卡或西尼罗(WN)病毒的EDIII蛋白,或来自裂谷热(RVF)或托斯卡纳(TOS)病毒的核蛋白N,或来自基孔肯雅病毒的E2包膜蛋白的可溶形式,或西尼罗病毒E包膜蛋白的可溶形式,和 -血液因子、抗凝血剂、生长因子、激素、治疗性酶和单克隆抗体和细胞因子, -抗肿瘤蛋白, -微生物、病毒和/或寄生虫多肽, -抗原,比如癌抗原。
9.根据权利要求7所述的表达载体,其中所述诊断和治疗蛋白选自IFN-α、颗粒酶M、FasL、SSX2、NERCMSL、hSULF2^m 和 CNTN4。
10.根据权利要求1至9任一项所述的表达载体,其中所述MGMT酶由SEQIDNO:3或SEQ ID NO:68的DNA序列编码。
11.根据权利要求1至9任一项所述的表达载体,其中所述MGMT酶突变体由SEQIDNO:1或SEQ ID NO:47的DNA序列编码。
12.根据权利要求1至11任一项所述的表达载体,其还编码至少一个肽切割位点,其优选位于MGMT酶、其突变体或催化结构域和重组蛋白之间。
13.根据权利要求1至12任一项所述的表达载体,其还编码一个标记,其优选位于重组蛋白的C端。
14.根据权利要求1至13任一项所述的表达载体,其还编码间隔序列,优选位于所述MGMT酶、其突变体或催化结构域和所述重组蛋白之间,和/或所述重组蛋白和所述标记之间。
15.根据权利要求1所述的表达载体,其编码: -肽BiP昆虫信号,
-SEQ ID NO:2 的 SNAP 蛋白, -权利要求9所定义的重组蛋白, -肠激酶肽切割位点, -多聚组氨酸标记,和 -两条具有氨基酸序列甘氨酸-甘氨酸-甘氨酸-丝氨酸(GGGS)的间隔序列。
16.根据权利要求1所述的表达载体,其编码: -BiP样肽信号,
-SEQ ID NO:2 的 SNAP 蛋白, -权利要求9所定义的重组蛋白, -PiOTEV肽切割位点, -多聚组氨酸标记,和 -两条具有氨基酸序列甘氨酸-甘氨酸-甘氨酸-丝氨酸(GGGS)的间隔序列。
17.一种用于在宿主细胞中表达重组蛋白的载体,其包括在单一开放阅读框中编码如下的核苷酸序列,按照5’至3’的方向: a)BiP样肽信号,
b)SEQ ID NO:4 的 MGMT 蛋白或 SEQ ID NO:2 的 SNAP 蛋白, c)两个proTEV肽切割位点, d)多聚组氨酸标记,和 e)两条具有氨基酸序列甘氨酸-甘氨酸-甘氨酸-丝氨酸(GGGS)的间隔序列。
18.—种重组细胞,其稳定转染有包括权利要求1至17任一项的表达载体的质粒,优选包括 SEQ ID NO:59 或 SEQ ID NO:69。
19.根据权利要求18所述的稳定转染的重组细胞,其中其是细菌,优选大肠杆菌细胞。
20.根据权利要求18所述的转染的重组细胞,其中其是细菌、昆虫细胞,更优选果蝇S2细胞或其衍生物;哺乳动物细胞,更优选CHO细胞、YB2/0细胞、COS细胞、HEK细胞、NIH3T3细胞、HeLa细胞、PER.C6细胞或其衍生物;和禽细胞比如EBx细胞,优选EB66细胞或其衍生物。
21.根据权利要求18至20任一项所述的重组细胞用于生产权利要求1至17任一项所定义的表达载体的用途。
22.根据权利要求18至20任一项所述的重组细胞用于生产重组蛋白的用途。
23.一种融合多肽,其包括肽分泌信号、和6-甲基鸟嘌呤-DNA-甲基转移酶(MGMT, EC2.1.1.63)、其突变体或催化结构域。
24.根据权利要求23所述的融合多肽,其中所述MGMT突变体是SEQID NO:2的SNAP蛋白或其同源物。
25.根据权利要求23所述的融合多肽,其中所述MGMT酶是SEQID NO:4的蛋白或其同源物。
26.根据权利要求23至25任一项所述的融合多肽,其还包括在MGMT酶、其突变体或催化结构域的C端的重组蛋白。
27.根据权利要求26所述的融合多肽,还包括一个标记,优选多聚组氨酸标记,其位于重组蛋白C端。
28.一种非脊椎动物重组细胞,其稳定转染有权利要求1至5、和7至14之一的表达载体。
29.根据权利要求28所述的稳定转染的细胞,其中其是昆虫细胞。
30.根据权利要求29所述的稳定转染的细胞,其中其是黑腹果蝇Drosophilamelanogaster细胞,更优选果蚬S2细胞。
31.根据权利要求30所述的稳定转染的S2细胞,其特征在于: i )所述表达载体选自:-包括SEQ ID NO:19的载体或克隆至细胞中的核苷酸序列,细胞已于2010年8月19日以编号CNCM 1-4357保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所,巴黎,法国,-包括SEQ ID NO:22的权利要求7的载体或克隆至细胞中的核苷酸序列,细胞已于2010年10月27日以编号CNCM 1-4381保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所, -包括SEQ ID NO:21的权利要求7的载体或克隆至细胞中的核苷酸序列,细胞已于2010年10月27日以编号CNCM 1-4382保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所, -包括SEQ ID NO:9的载体或 克隆至细胞中的核苷酸序列,细胞已于2010年9月29日以编号CNCM 1-4368保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所,和 -包括SEQ ID NO:20的权利要求7的载体或克隆至细胞中的核苷酸序列,细胞已于2010年9月29日以编号CNCM 1-4369保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所, -包括SEQ ID NO: 10或59或69的权利要求17的载体, -SEQ ID NO:64的载体或克隆至细胞中的核苷酸序列,细胞已于2011年12月9日以编号CNCM 1-4581保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所, -SEQ ID NO:71 的载体,
-包括 SEQ ID NO:55, SEQ ID NO:57 或 72 或 74、SEQ ID NO:77、79 或 81、SEQ ID NO:.89、SEQ ID NO:84 或 86、SEQ ID NO:92 或 SEQ ID NO:96 的权利要求 9 的载体, 或 ii)其选自: -于2010年8月19日以编号CNCM 1-4357保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所的细胞, -于2010年10月27日以编号CNCM 1-4381保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所的细胞, -于2010年10月27日以编号CNCM 1-4382保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所的细胞, -于2010年9月29日以编号CNCM 1-4368保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所的细胞,-于2010年9月29日以编号CNCM 1-4369保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所的细胞, -于2011年12月5日以编号CNCM 1-4565保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞, -于2011年12月5日以编号CNCM 1-4566保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞, -于2011年12月5日以编号CNCM 1-4567保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞, -于2011年12月5日以编号CNCM 1-4568保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞, -于2011年12月5日以编号CNCM 1-4569保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞, -于2011年12月5日以编号CNCM 1-4570保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞, -于2011年12月5日以编号CNCM 1-4571保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞, -于2011年12月5日以编号CNCM 1-4572保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du D octeur Roux, 75724Paris cedexl5,法国)的细胞, -于2011年12月8日以编号CNCM 1-4576保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞, -于2011年12月8日以编号CNCM 1-4577保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞, -于2011年12月8日以编号CNCM 1-4578保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞, -于2011年12月8日以编号CNCM 1-4579保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞, -于2011年12月8日以编号CNCM 1-4580保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞, -于2011年12月9日以编号CNCM 1-4583保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞, -于2011年12月9日以编号CNCM 1-4584保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞, -于2011年12月9日以编号CNCM 1-4585保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞,以及 -于2011年12月9日以编号CNCM 1-4586保藏在法国国家微生物保藏中心(CNCM),巴斯德研究所(25rue du Docteur Roux, 75724Paris cedexl5,法国)的细胞。
32.一种脊椎动物重组细胞,其稳定转染有权利要求1至4、6至14、和16至17之一的表达载体。
33.根据权利要求32所述的稳定转染的细胞,其中其是哺乳动物细胞,优选CHO细胞、YB2/0细胞、COS细胞、HEK细胞、NIH3T3细胞、HeLa细胞或其衍生物。
34.根据权利要求32或33所述的稳定转染的哺乳动物细胞,其特征在于所述表达载体是包括SEQ ID N0:57或72或74 (当兴趣蛋白是IFNa时)、SEQ IDNO:77、79或81 (当兴趣蛋白是癌抗原SSX2时)、SEQ ID NO:55 (当兴趣蛋白是颗粒酶M时)、SEQ ID NO:89 (当兴趣蛋白是FasL时)、SEQ ID NO:84或86 (当兴趣蛋白是癌抗原NERCMSL时)、或SEQ IDNO:92 (当兴趣蛋白是接触蛋白CNTN4时)、或SEQ ID NO:96 (当兴趣蛋白是hSULF2A?时)的权利要求9的载体。
35.一种增强重组蛋白表达的方法,其包括将所述蛋白和肽分泌信号、连同酶6-甲基鸟嘌呤-DNA-甲基转移酶(MGMT,EC2.1.1.63)、其突变体或催化结构域共表达,所述共表达优选在非脊椎动物细胞中进行。
36.根据权利要求35所述的方法,其中所述MGMT酶是SEQID NO:4的蛋白。
37.根据权利要求35所述的方法,其中所述MGMT突变体酶是SEQID NO:2的SNAP蛋白或其同源物。
38.一种在细胞培养中生产重组蛋白的方法,其包括步骤: a)提供权利要求1至16所述的表达载体, b)将所述表达载体引入宿 主细胞, c)使引入所述宿主细胞的核苷酸进行表达来产生重组蛋白。
39.根据权利要求35至38任一项所述的方法,其中重组蛋白以至少40mg/L或以上的回收的细胞培养上清得以表达。并不
40.6-甲基鸟嘌呤-DNA-甲基转移酶(MGMT,EC2.1.1.63)、其突变体或催化结构域用于增强异源蛋白在感染有复制型或缺陷型载体的宿主细胞中生产的用途。
41.根据权利要求40所述的用途,其中所述MGMT酶是SEQID NO:4的蛋白。
42.根据权利要求40所述的用途,其中所述MGMT突变体是SEQID NO:2的SNAP蛋白。
43.6-甲基鸟嘌呤-DNA-甲基转移酶(MGMT,EC2.1.1.63)、其突变体或催化结构域,作为融合至或连接至重组蛋白的保护多肽,用于改善重组蛋白在储存介质、在血浆或缓冲液中的半衰期,用于改善作为药物或疫苗的重组蛋白的半衰期,或用于改善用在诊断试剂盒中的重组蛋白的半衰期的用途。
44.根据权利要求43所述的用途,其中所述重组蛋白选自:胰岛素、IFNa、颗粒酶M、SSX2、FasL,内硫酸酯酶(hSULF)、接触蛋白和 MesotheIin (NERMCSL)。
【文档编号】C12N9/10GK103476928SQ201180065989
【公开日】2013年12月25日 申请日期:2011年12月9日 优先权日:2010年12月9日
【发明者】P·德普雷斯, S·波卢斯, E·克吕布莱特 申请人:巴斯德研究所