专利名称:用于重组蛋白质过量表达的起始密码子下游被修饰的构建体的制作方法
技术领域:
本发明涉及用于在原核细胞中表达编码目的重组蛋白质的基因的构建体,该基因置于色氨酸操纵子Ptrp的控制之下,该构建体包含在起始密码子直接下游的序列SEQ ID No.1的核酸序列和位于该序列下游的、接受编码所述的目的重组蛋白质的基因的多克隆盒,该序列SEQ IDNo.1的至少一个核苷酸突变或缺失,从而使所述的重组蛋白质过量表达。本发明还涉及包含该构建体的载体、用该载体转化的原核宿主细胞、以及利用本发明的构建体产生目的重组蛋白质的方法。
由于生物技术学家能够在短期内克隆一个基因、将其以生物活性蛋白质形式表达、然后创造其变体以建立序列/功能关系,因此这使得提供用于医疗或研究目的的许多重组蛋白质成为可能。由于可以应用来自生物技术的纯净形式的和可接受的价格的分子,目前许多人类疾病可以得到治疗或避免(K.Koths,Current Opinion in Biotechnology,6,681-687,1995)。
细菌细胞是优选的表达重组蛋白质的宿主是因为它们营养需求有限而同时可以达到很高的生长密度,但也由于在过去它们是许多研究的对象因此产生了许多目的突变体和不同的质粒表达系统。通过从大量的有关在其中表达原核或真核来源的蛋白质的文献可以判断出,在细菌中大肠杆菌(Escherichia coli(E.coli))是最常用和鉴定最完善的生物体。但是由于在多个水平(目的基因的转录、翻译、影响该分子在细菌的细胞质或周质环境中的结局的翻译后事件)上存在的困难使得不是所有的蛋白质都能以相同的效率在其中得到表达(S.C.Makrides,Microbiological Reviews,60,512-538,1996)。
为了有效翻译,信使RNA必须含有特异结合细菌的核糖体和能使翻译起始的序列。称为核糖体结合位点(RBS)的该序列位于包括起始密码子的区域。统计学分析细菌的mRNA起始结构域表明存在一34核苷酸的窗口(window),其序列与随机分布的不同(L.Gold,AnnualReview of Biochemistry,57,199-233,1988)。如果+1位为起始密码子的第一个核苷酸的话,该序列为mRNA的-20位至+13位,其通过帮助核糖体从所有的“RBS样”序列中区别真正的起始结构域而发挥RBS的作用。许多研究使有关RBS的知识完善以定义其一些特征性成分成为可能i)Shine-Dalgarno(SD)序列经16S核糖体RNA的3′末端序列测定(J.Shine and L.Dalgarno,Proc.Natl.Acad.Sci.U.S.A.,71,1342-1346,1974),将“ Shine-Dalgarno”序列定义为与16S rRNA的3′末端序列5′-CCUCCUUA-3′互补的定位起始密码子5′末端的mRNA区。通过E.coli mRNA的天然RBS区(-12;-7)的嘌呤碱基A和G的强表现度证实了Shine-Dalgarno序列介导的16S rRNA和RBS间的相互作用。也在158种基于其促进报告基因表达的能力选择的、随机化的RBS中发现这种倾向性(D.Barrick等,NucleicAcid.Res.,22,1287-1295,1994)。
ii)起始密码子尽管GUG以及再次UUG可以偶尔被发现为启动密码子,但是优选AUG密码子作为起始密码子(S.Ringquist等,MolecularMicrobiology,6,1219-1229,1992)。
iii)SD序列和起始密码子之间的距离H.Chen等人的详尽地研究(Nucleic Acid Reserch,22,4953-4957,1994a)已经表明在SD序列的3′末端和起始密码子之间存在最适间隔距离。将共有序列5′-UAAGGAGGU-3′作为参考SD序列,可以使最大水平表达的间隔是5个核苷酸。1-9个核苷酸的间隔都是有效的,可以保证至少50%最大水平的表达水平。
iv)其它主要序列已知在起始翻译中涉及两种配对首先是mRNA起始密码子和tRNA-fMet之间的配对,另外是SD序列和16S rRNA 3′末端之间的配对。突变研究和非典型mRNA(特别是缺少引导序列的mRNA)的分析使在AUG密码子的周围鉴定新序列成分(其可能导致了起始结构域的全部功效)成为可能。紧接着起始密码子下游的富含腺嘌呤的基序有助于翻译起始(G.F.E.Scherer等,Nucleic Acids Research,8,3895-3907,1980;H.Chen等,Journal of Molecular Biology,240,20-27,1994b)。类似的,在第二密码子位置(L.Gold,1988)最常见的AAA和GCU密码子对翻译也有正面的影响,特别是当该起始密码子不是最适宜的时(GUG或UUG)(S.Ringquist等,1992)。在T7噬菌体0.3基因的mRNA上鉴定的、称为“Downstream Box(下游盒)”(DB)的序列,因其位于起始密码子的下游,是另一种翻译促进成分(M.L.Sprengart等,Nucleic Acids Research,18,1719-1723,1990)。该12个核苷酸的序列与16S rRNA的1469-1483位核苷酸互补,并且在几种高度表达的E.coli和细菌噬菌体基因的翻译起始结构域中具有类似的形式(M.L.Sprengart等,1990)。该“Downstream Box”即使在缺少SD序列的情况下也能使翻译起始(M.L.Sprengart等,The EMBO Journal,15,665-674,1996)。最近的研究结果表明,与最初提出的假设相反,该DB序列可能通过与16S rRNA的1469-1483区域配对不同的机制起作用(M.O′Connor等,Proc.Natl.Acad.Sci.U.S.A.,96,8973-8978,1999)。
v)二级结构在SD区附近的mRNA序列可能通过形成二级结构影响翻译的效率。M.H.de Smit和J.van Duin(Journal of Molecular Biology,235,173-184,1994)表明mRNA分子内配对可通过与mRNA/rRNA配对竞争对正确的翻译不利,SD区与16S rRNA的互补性越弱时更加如此。同样地也已表明凝乳酶原在E.coli中的表达依赖于连接SD序列与起始密码子区域的组成限制二级结构的序列促进RBS接近核糖体,并导致高的表达效率(G.Wang等,Protein Expression ang Purification,6,284-290,1995)。
由于翻译起始步骤对重组蛋白质表达产量的重要性,为优化细菌表达载体的RBS区进行了许多研究。一种直观的方法是首先将完整的共有SD区(UAAGGAGGU)置于目的基因的上游(G.Jay等,Proc.Natl.Acad.Sci.U.S.A.,78,5543-5548,1981)。D.M.Marquis等(Gene,42,175-183,1986)比较系统地将该序列置于多种启动子的下游,并与起始密码子不同的距离(5-9个核苷酸)。以IL-2基因为模型,结果显示对几乎所有的被测试启动子来说,6个核苷酸的SD/AUG间隔是最适的。但是,W.Mandecki等(Gene,43,131-13,1986)在共有SD序列和lacZ基因的SD序列之间的比较研究中指出共有SD序列的体外表达水平较高,但在体内时较lacZ的SD序列弱2-2.5倍。也已经证实对于不同来源(植物、哺乳动物细胞、细菌)的蛋白质的表达来说,来自噬菌体基因的、带有其本身SD序列的完整的RBS区优于共有SD序列(P.O.Olins等,Gene,73,227-235,1998)。K.Curry和C.S.C.Tomich(DNA,7,173-179,1988)利用色氨酸启动子比较了共有序列SD序列与Ptrp天然存在的SD序列的效率。他们的结果表明对所研究的目的基因有很强的依赖性,并得出结论构建对所有异源基因都起作用的最适载体是不可能的。M.K.Olsen等人(Journal of Biotechnology,9,179-190,1989)也研究了色氨酸启动子和共有SD序列,通过富集SD区侧翼序列的A和T核苷酸对多种异源蛋白质(生长激素、TNF)获得了非常高的表达水平(总蛋白的20-30%)。早前H.A.De Boer等人(DNA,2,231-235,1983)描述了类似的结果,其指出了在杂和启动子Ptrp/PlacUV5表达α-干扰素时置于SD区下游的A和T碱基的正效应。
所有的结果都是从仅考虑有限参数的试验中获得的。由于意识到许多因素(已知的和未知的)对翻译的起始有影响,尤其意识到未被反复的试验所考虑的因素间的相互作用可能具有重要的作用,随后一些作者尝试从大的随机文库中筛选体内最佳的合成的RBS。因此R.S.Wilson等人(BioTechniques,17,944-952,1994)筛选了起始密码子上游16处简并的所有组成序列(在含有lac启动子/操纵子控制下的β-内酰胺酶基因的表达盒之内)。该试验有可能鉴定具有3倍高的表达效率的表达β-内酰胺酶的原始序列。利用另一种编码scFv的基因时,过量表达水平为原始RBS的大约2倍。
鉴于这些结果,可以确定最佳RBS区通常在特定情况下涉及目的基因序列和mRNA前导区序列(其本身依赖于所用启动子的类型)的区域。色氨酸启动子(B.P.Nichols和C.Yanofsky,Methods inEnzymology,101,155-164,1983)是用于重组蛋白质表达的主要系统之一(D.G.Yansura和D.J.Henner,Methods in Enzymology(AnonymousAcademic Press,Inc.,San Diego,CA)54-60,1990;D.G.Yansura和S.H.Bass,Methods in Molecular Biology,62,55-62,1997),但是其RBS从来未是利用基于随机序列筛选的方法进行系统优化的对象。
对于希望开发工业规模的方法的生物技术学家来说,具有使无论何种目的蛋白质都能最大表达的工具是非常重要的。因此,对能够可能最优化重组蛋白质表达的任何增强(通过宿主菌株、表达载体、培养和表达方法或这些因素的任意组合导致的增强)都有极大的兴趣。
更具体而言,本发明从翻译的效率上证明了新型核苷酸序列(表达载体携带的、在核糖体结合位点(RBS)区、色氨酸启动子(Ptrp)的下游)的优点。
本申请人利用在起始密码子上游引入的简并寡核苷酸,然后选择过量表达氯霉素乙酰转移酶(CAT)报告基因的克隆寻找新型最优化的RBS序列。在起始密码子的上游寻找最优化的序列时意外的发现可以突变或缺失位于起始密码子直接下游的核酸序列以过量表达重组蛋白质。因此获得的序列具有增强不同来源的多种目的基因表达的特性。
另外,有关当前限制质量的主要问题是获得尽可能纯的重组蛋白质,即在该重组蛋白质的上游或下游嫁接最少量的由所使用的构建体产生的氨基酸。当位于起始密码子和第一个克隆位点之间的核酸序列存在缺失以至于过量表达重组蛋白质时,本发明也解决了该问题。
因此本发明的主题是用于在原核宿主细胞中表达置于色氨酸操纵子启动子Ptrp控制下的编码重组蛋白质的基因的构建体,其包含起始密码子直接下游的序列SEQ ID No.1的核酸序列、位于该序列下游的用来接受编码所述目的重组蛋白质的基因的多克隆盒,其特征在于该序列SEQ ID No.1中至少一个核苷酸被突变或缺失使得所述的重组蛋白质过量表达。
因为现有技术教导了没有修饰的该序列SEQ ID No.1的使用,因此根据本发明获得过量表达更加出人意料。为此需特别提到专利US5,714,589、US5,468,845、US5,418,135、US4,891,310、US4,789,702、WO88/09344、US4,738,921和EP0 212 532,其教导在起始密码子下游的序列SEQ ID No.1表达目的蛋白质的应用。
表述“目的重组蛋白质”是指通过基因重组获得的并能用于人类或动物健康领域、美容业领域、动物营养领域、工农业领域或化学工业领域的所有的蛋白质、多肽或肽。在这些目的蛋白质中需特别提到、但不限于此的是-细胞因子并特别是白细胞介素、干扰素、组织坏死因子和生长因子并特别是造血生长因子(G-CSF、GM-CSF)、人类生长激素或胰岛素、神经肽;-在凝固中涉及的因子或辅因子并特别是因子VIII、yonWillebrand因子、抗凝血酶III、蛋白C、凝血酶和水蛭素;-酶并特别是胰蛋白酶、核酶和β-半乳糖苷酶;-酶抑制因子如α1-抗胰蛋白酶和病毒蛋白酶抑制因子;-能够抑制癌症起始或发展的蛋白质,如肿瘤抑制基因(例如P53基因)的表达产物;-能够刺激免疫应答的蛋白质或抗原,如革兰氏阴性(Gram-negative)细菌的膜蛋白或其活性片段,特别是克雷白氏杆菌属(Klebsiella)OmpA蛋白质或人呼吸道合胞病毒蛋白G;-可能或不可能人源化的单克隆抗体或抗体片段如scFv-能够抑制病毒感染或其发展的蛋白质,例如所讨论的病毒的抗原性表位或病毒蛋白修饰的变体,其能够与天然病毒蛋白质竞争;-常用于化妆品组合物中的蛋白质,如物质P或超氧化物歧化酶;-食物蛋白质并特别是alicament;-能够指导合成化学或生物学化合物的蛋白质,或能够降解某些毒性化合物的蛋白质;或
-对产生其的微生物具有毒性的任何蛋白质,特别是例如如果该微生物是E.coli时的HIV-1病毒蛋白酶、ECP蛋白(“嗜酸性粒细胞阳离子蛋白”)、或脊髓灰质炎病毒蛋白2B和3A。
表述“序列SEQ ID No.1的核酸序列,该序列中至少一个核苷酸突变或缺失使所述的重组蛋白质过量表达”是指包含序列SEQ ID No.1的至少一个核苷酸缺失或突变的任何序列,与使用未修饰的序列SEQID No.1获得的所述的重组蛋白质相比,其使重组蛋白质过量表达。
术语“缺失”是指在序列SEQ ID No.1的一个或多个核苷酸位点去除一个或多个核苷酸。获得的序列较原始序列短。
术语“突变”是指用另一种核酸替换一种核酸(A用C、G或T;C用A、G或T;G用A、C或T;T用A、C或G)。获得的序列与原始序列具有相同的长度。
可以利用下列方法之一具体地确定过量表达(即获得比起始密码子下游没有修饰时获得的表达更大的表达的情况)i)通过SDS-PAGE迁移细菌总蛋白,用考马斯兰染色或用Western印迹显示重组蛋白质;ii)通过利用特异性抗体的方法(Elisa)分析该重组蛋白质;iii)如果该重组蛋白质具有催化活性,进行酶促分析。
优选使用方法ii),详见实施例III。
表述“多克隆盒”是指含有一种或多种限制性位点的核苷酸序列,该位点可用于在起始密码子的下游克隆目的基因。
优选的,所述的序列SEQ ID No.1中至少一个核苷酸被缺失使得所述的重组蛋白质过量表达。
本发明还涉及本发明的构建体,其中所述的至少突变或缺失的(优选缺失的)核苷酸位于序列SEQ ID No.1的SEQ ID No.2的片段上。
本发明的另一主题涉及构建体,其中所述的至少突变或缺失的(优选突变的)核苷酸位于序列SEQ ID No.1的密码子GTA和/或密码子GCA和/或密码子CTG上。
在本发明优选的实施方案中,所述的序列SEQ ID No.1(至少一个核苷酸突变或缺失)至少在位点1、2和3具有核苷酸A。
在本发明的优选实施方案中,位于序列SEQ ID No.1的核酸序列与接受编码所述目的重组蛋白质的基因的多克隆盒之间的至少一个核苷酸、优选的所有的核苷酸被缺失。
在本发明另一更优选的实施方案中,所述的序列SEQ ID No.1其至少一个核苷酸突变或缺失,并且所有的核苷酸位于序列SEQ ID No.1的核酸序列与多克隆盒之间被完全缺失,结果使起始密码子直接在多克隆盒的上游。
在本发明的优选实施方案中,所述的构建体含有起始密码子直接上游的核酸序列,该序列选自序列SEQ ID No.3、SEQ ID No.4、SEQ IDNo.5、SEQ ID No.6、SEQ ID No.7、SEQ ID No.8、SEQ ID No.9和SEQ ID No.10。
本发明包含本发明的构建体,其特征在于原核宿主细胞是革兰氏阴性细菌,优选属于E.coli种属。
本发明的另一主题关于含有上述构建体的载体,以及用该载体转染的原核宿主细胞(优选属于E.coli种)。
本发明的主题还是利用上述构建体在宿主细胞中制备目的重组蛋白质的方法。
本发明的主题还是制备本发明的目的重组蛋白质的方法,其中优选通过上述载体将所述的构建体引入到原核宿主细胞中。
制备本发明的目的重组蛋白质的优选方法的特征在于其包含下列步骤a)将目的基因克隆进本发明的载体中;b)用包含编码所述目的重组蛋白质的基因的载体转染原核细胞;c)在能使重组蛋白质表达的培养基中培养该转化细胞;d)从培养基或所述的转化细胞中回收重组蛋白质。
本发明还包含本发明的构建体、载体或原核宿主细胞制备重组蛋白质的用途。
最后,本发明涉及重组蛋白质制备医药产品(给予需要此类治疗的患者)的用途,其特征在于所述的重组蛋白质是利用制备本发明的目的重组蛋白质的方法制备的。
下列实施例和图是用来说明本发明,决不是限制其范围。
图和表的说明
图1质粒载体pTEXmp18图谱,以及包含Ptrp启动子/操纵基因、PtrpL前导区、mp18多克隆位点和转录终止子的1-450区的序列SEQID No.39。
图2载体pTEXmp18上的RBS(核糖体结合位点)区的限制性图谱(SEQ ID No.40)。
图3用载体pTEXCAT和pTEXCAT4转化的细菌中CAT表达的SDS-PAGE凝胶分析。
图4用载体pTEX-βGAL和pTEX4-βGAL的β-半乳糖苷酶表达的比较研究(发酵罐中的动力学)。
实施例I本实施例阐述本发明的一个方面,具体而言阐明携带Ptrp色氨酸启动子并且起始密码子上游随机突变了的质粒载体文库的构建方式。原始载体如图1所示。其为衍生自pBR322(F.Bolivar等,Gene,2,95-113,1977)的质粒,其中克隆有Ptrp启动子/操纵基因(1-298),接着是编码E.coli TrpL前导序列的头7个氨基酸的序列(C.Yanofsky等,Nucleic Acids Research,9,6647-6668,1981)、多克隆位点和E.coli trpt转录终止子(C.Yanofsky等,1981)。pTEXmp18中的Ptrp的3′部分与天然序列不同,其在ATG起始密码子上游有XbaI克隆位点(见图2),并且在SD和起始密码子之间具有较长的间隔。
为了选择RBS部分修饰的载体,将氯霉素乙酰转移酶(CAT)报告基因克隆到pTEXmp18的EcoRI和PstI位点。为此,利用寡核苷酸CATfor和CATrev经PCR扩增cat基因的编码序列,该序列为CATfor5′-CCGGAATTCATGGAGAAAAAAATCACTGG-3′(SEQ ID No.11)EcoRICATrev5′-AAACTGCAGTTACGCCCCGCCCTG-3′(SEQ ID No.12)PstI利用噬菌粒pBC-SK(Stratagene,La Jolla,CA,USA)为模板进行该PCR反应。根据GeneClean方法(Bio101,La Jolla,CA)将扩增产物上样到琼脂糖凝胶并纯化。转化进E.coli后,通过在含有30μg/ml的氯霉素的LB培养基(J.Sambrook等,Molecular cloning.Alaboratory manual,2ndedition.Plainview,NYCold Spring HarborLaboratory Press,1989)的平皿上出现的克隆来验证pTEXmp18的插入克隆。利用“Dye Terminator”试剂盒和DNA测序仪373A(PerkinElmer Applied Biosystems,Foster City,CA)通过自动测序来确定插入片段的序列。获得的载体称为pTEXCAT。
通过把合成的寡核苷酸连接到载体pTEXCAT的SpeI和EcoRI位点插入起始密码子的上游具有简并序列的RBS。通过酶消化将SpeI和EcoRI位点(分别位于位点-49和+28)(见图2)之间的区域缺失,并用两条互相杂交的部分简并的合成寡核苷酸形成的异源双螺旋取而代之。使用两对寡核苷酸,分别为寡核苷酸RanSD1/RanSD2和RanSD3/RanSD4,其序列为5’CTAGTTAACTAGTACGCAAGTTCACGTAAANNNNNNNNNNNNNNNNATGAAAGCAATTTTCGTACTGAATGCGG-3’(SEQ ID No.13)RanRD25’AATTCCGCATTCAGTACGAAAATTGCTTTCATNNNNNNNNNNNNNNNNTTTACGTGAACTTGCGTACTAGTTAA-3’(SEQ ID No.14)RanSD35’CTAGTTAACTAGTACGCAAGTTCACGTAAATRRRRRRRNNNNNNATGAAAGCAATTTTCGTACTGAATGCGG-3’(SEQ ID No.15)RanSD45’AATTCCGCATTCAGTACGAAAATTGCTTTCATNNNNNNYYYYYYYATTTACGTGAACTTGCGTACTAGTTAA-3’(SEQ ID No.16).
通过MWG Biotech(Ebersberg,Germany)合成四条寡核苷酸,合成条件是保证对于每种简并性碱基的分配摩尔数相等。RanSD1/RanSD2对在ATG密码子前的16个核苷酸引入完全的简并性(N=4种核苷酸A、C、T、G的混合)。组和数(416,即大约4.3×109)使能够从Shine-Dalgarno(SD)序列和位于SD区与起始密码子之间的序列以及SD-ATG间隔上筛选最适的RBS。在下文中该文库被称为(N16)。RanSD3/RanSD4对在ATG前的6个核苷酸上引入完全的简并性以及在上游7个核苷酸上引入部分简并性。在正链上专用嘌呤(R=A或G)以及在互补链上专用嘧啶(Y=C或T)促进了至ATG密码子的最适距离(6个核苷酸)的Shine-Dalgarno类型序列的丰度。该文库称为(R7N6)。
根据J.Sambrook等人描述的条件(1989)进行载体pTEXCAT的线性化并凝胶纯化、配对的寡核苷酸杂交、异源双螺旋连接到线性化的载体pTEXCAT并转化进组成文库的E.coli中。通常向终体积15μl的含有T4连接酶的连接反应中加入100fmol的载体和1000fmol的插入片段。在16℃下反应过夜。然后在制造商(Invitrogen,Carlsbad,CA)建议的条件下用3μl的连接混合物电穿孔转化电子感受态TOP10细菌(50μl)。将转化混合物铺在含有200μg/ml的氨苄青霉素的LB琼脂平皿上,37℃温育16小时后使之产生转化的克隆。
实施例II基于克隆过表达CAT酶将提高氯霉素抗性的假设筛选该文库。这通过结果如下列表1所示的实验得到验证。
表1存在或不存在IAA的TOP10×pTEXCAT细菌的氯霉素抗性
数字(上面一行)表明在37℃温育18小时后计数的克隆数,每一种培养基接种大约100个细胞。
下面一行的指数是克隆生长的定量标准(-=没有生长至+++=最大生长)。
这些结果表明用载体pTEXCAT转化的并铺在含有不同浓度的氯霉素的平皿中的TOP10E.coli细菌(Invitrogen,Carlsbad,CA)在300-600μg/ml的氯霉素、存在3-β吲哚乙酸(IAA)(色氨酸类似物,其通过Ptrp抑制作用作为诱导物)(R.Q.Marmorstein和P.B.Sifler,The Journal of Biological Chemistry,264,9149-9154,1989)下生长更好。这暗示由于最适的RBS区过量产生CAT的克隆可能在低于MIC(最低抑制浓度)的氯霉素浓度时比野生型群体生长得更快,或者能在对于野生型群体为致死的氯霉素浓度下生长。
实施例III该实施例阐述了从根据实施例的描述构建的文库中选择克隆。将获得的在LB+氨苄青霉素的琼脂平皿上的克隆层形式的文库溶解在无菌水中,重新形成具有1以内的580nm光密度(OD)的混悬液。根据实施例2的结果,将该混悬液以100μl/培养皿的比例铺在含有致死计量的氯霉素(600、700、800和900μg/ml)的LB琼脂平皿上。将平皿在37℃下温育,研究出现的抗性克隆,同时确证用野生型pTEXCAT载体转化的TOP10细菌的混悬液接种的平皿上没有任何生长。分离抗性克隆并在选择性培养基上传代培养几次以确定它们的抗性表型。然后对该步骤选择到的克隆进行一系列分析(i)提取质粒(Qiagen kit,Hilden,Germany)并对包括RBS的区测序,(ii)在IAA的诱导下在Erlenmeyer培养瓶中培养并用ELISA试验测定CAT的表达水平,(iii)将从上述培养物中提取的总蛋白进行SDS-PAGE电泳,并用考马斯兰染色,以显示总的细胞内蛋白质。在ABI 373A测序仪(Perkin Elmer AppliedBiosystems,Foster City,CA)上利用Dye terminator试剂盒测序该克隆。Erlenmeyer培养瓶中的培养物通过接种25ml的TSBY(30g/l的胰胨豆胨培养液(DIFCO)+5g/l的酵母提取物(Difco))培养基+8mg/l的四环素和平皿上的克隆或保存在-80℃的细菌混悬液制备。每一预培养物在37℃、200rpm振荡的平台温育过夜。转移一部分至50ml的相同培养基中以使起始光密度等于1。向培养基中加入25mg/l的IAA,其然后在相同条件下振荡5小时来诱导CAT蛋白。将一部分悬液(3×1ml,稀释到OD=0.8)离心,并将细胞保存在-20℃用来ELISA分析CAT(CATELISA kit,Roche Diagnostics,Basel,Switzerland)。以10000g、4℃离心15分钟回收剩余的生物物质。以5ml/g湿生物物质的比例将该生物物质溶解在TEL缓冲液(25Mm Tris,1mM EDTA,500μg/ml的溶菌酶,pH8)中。通过超声处理(配有显微探针的VibraCell超声波仪,Sonics&Materials,Danbury,CT)将细胞裂解。将1ml获得的混悬液以12000rpm离心5分钟。将沉淀用200μl的TEL溶解,获得不溶性的部分(I)。上清记为“S”。用变性电泳(SDS-PAGE)和考马斯兰染色分析部分I和S中的总蛋白。
下列表2表明在筛选两个文库(N16)和(R7N6)后获得的各种RBS序列。与GenBank和EMBL核苷酸数据库比对后,我们可以得出结论在各种分离的克隆中的紧接着AUG密码子上游的16-核苷酸((N16)策略)或13-核苷酸((R7N6)策略)序列至今没有一种被描述过。表2利用(N16)策略或(R7N6)策略之一分离的新型RBS序列
(*)每条核苷酸序列(信使RNA)在起始密码子下游包含突变区。表中的第一行为载体pTEXCAT的参考序列。该表中表示了该载体起始密码子上游和下游的核酸序列转录后的RNA形式。在这些序列的3′末端,只表示了多克隆位点的头两个密码子,称为GAAUUC。
因此,非常另人惊奇的发现,表2中所述的克隆在紧接着AUG密码子下游的RBS区有突变。克隆pTEXCAT4、pTEXCAT1′、pTEXCAT3′携带的点突变影响编码的蛋白质的N末端部分的氨基酸(分别为Leu7Pro、Ala3Pro和Val6Ala)。其它克隆携带更大的重排pTEXCAT2′、pTEXCAT5′和pTEXCAT9′带有的缺失分别引起Ala2Leu7、Ile4Leu7和Ile4Asn8区的缺失。如果随机分析(N16)文库在氨苄青霉素上选择(即没有氯霉素的选择压力)的10个克隆,表明在TrpL肽编码区没有改变(数据未列出),因此可以推断根据表达CAT的能力选择的克隆中观察到的TrpL中的突变在表达中发挥重要作用。因此,我们证明了下列创新的特性重组蛋白质的表达确实受起始密码子下游的突变的影响。
图3显示了用pTEXCAT或pTEXCAT4转化的细菌总蛋白的SDS-PAGE分析。其表明了载体pTEXCAT4的过量表达的特性,因为位于CAT位置的主要蛋白质(28kDa)在IAA的诱导提取物中非常明显,而在相同诱导条件下获得的载体pTEXCAT的提取物中仅有低密度的条带。
为了排除过量表达是由SpeI-EcoRI部分之外的载体的修饰引起的可能性,通过SpeI-EcoRI消化和双螺旋(由下列两条磷酸化的寡核苷酸形成的)连接由pTEXCAT体外重新构建了载体pTEXCAT4SDopt4-f5’CTAGTTAACTAGTACGCAAGTTCACGTAAAACGGAGAAACCCCCCAATGAAAGCAATTTTCGTACCGAATGCGG-3’(SEQ ID No.17)SDopt4-r5’AATTCCGCATTCGGTACGAAAATTGCTTTCATTGGGGGGTTTCTCCGTTTTACGTGAACTTGCGTACTAGTTAA-3’(SEQ ID No.18).
然后将获得的载体(称为pTEXCAT-SD4)转化E.coli TOP10,并与pTEXCAT4就CAT酶表达能力进行比较。获得的结果表明pTEXCAT4和pTEXCAT-SD4的表达水平相当并明显高于pTEXCAT。这证实了该假设本专利申请中要求的克隆中观察到的表达的增强确实是特异地由位于SpeI和EcoRI位点间的序列引起的。
为了证明位于起始密码子的直接下游的突变或缺失序列的特异性,用脯氨酸CGG取代野生型载体pTEXCAT的第七位的亮氨酸CTG,得到载体pTEXCAT-L7P。用亮氨酸CTG取代载体pTEXCAT4的第七位的脯氨酸CGG,得到载体pTEXCAT-P7L。该试验结果列于下列表3表3载体pTEXCAT、pTEXCAT4、pTEXCAT-L7P和pTEXCAT-P7L的表达水平的比较
结果(平均值±标准误差)是由两次独立的试验获得。将载体pTEXCAT水平任意地定为1。
这些结果证明起始密码子下游突变独立地引起过量表达,因为将该突变重新引入野生型载体使其获得相同的过量表达。
实施例IV该实施例表明所述的新型序列的过量表达作用不限于用来选择它们的报告基因,一旦其它基因有效地与他们连接到相同地载体上,其可以转而影响这些基因。为此,用编码E.coliβ-半乳糖苷酶的lacZ基因序列取代载体pTEXCAT和pTEXCAT4的CAT基因。通过使用载体pβGAL-basic(Clontech,Palo Alto,CA)PCR扩增lacZ序列、然后将该序列在单一BsmI和HindIII位点插入trpL的下游进行克隆,分别获得载体pTEX-βGAL和pTEX4-βGAL。
将两种载体转化进E.coli菌株ICONE 200(法国专利申请FR 2777292,公布于1999年10月15日)以在发酵罐中培养(具有β-半乳糖苷酶表达动力学)。通常,在200ml完全培养基(30g/l的胰胨豆胨培养液(DIFCO),5g/l的酵母提取物(DIFCO))中37℃过夜培养重组的细菌ICONE 200×pTEX-βGAL和ICONE 200×pTEX4-βGAL。将细胞混悬液无菌地转到含有1.8升下列培养基的发酵罐(Chemap modelCF3000,体积3.5l)中(2升最终培养物中的浓度)90g/l甘油,5g/l(NH4)2SO4,6g/l KH2PO4,4g/l K2HPO4,9g/l柠檬酸三钠.2H2O,2g/lMgSO4.7H2O,1g/l酵母提取物,微量元素,0.06%消泡剂,8mg/l四环素,200mg/l色氨酸。通过加入氨水将pH定为7.0。通过振荡速率和通过测量溶氧的通气速率的伺服控制将溶氧水平维持在30%的饱和度。当培养物的光密度达到30-40时,加入25mg/l的IAA(Sigma,St Louis,MO)进行诱导。进行培养物的光密度(580nm的OD)和细胞内β-半乳糖苷酶活性的动力学分析。混合30μl样品(部分“S”,参见实施例3)、204μl缓冲液(50mMTris-HCl,pH7.5-1mM MgCl2)和66μl ONPG(4mg/ml的50mMTris-HCl, pH7.5),通过比色分析测定β-半乳糖苷酶的活性水平。反应混合物37℃温育。加入500μl 1M Na2CO3终止反应。420nm的OD(与温育时间相关)与样品中的β-半乳糖苷酶的活性成正比。由于E.coli ICONE 200的lac操纵子完全缺失,测量的β-半乳糖苷酶的活性只由质粒lacZ基因的表达所致。
该对比研究的结果表明,两次独立的试验中,载体pTEX4-βGAL的β-半乳糖苷酶的活性水平比pTEX-βGAL高大约50倍(图4)。由此我们可以推断出在载体pTEXCAT4的RBS区分离的新型序列不但能使CAT蛋白表达,也能使例如β-半乳糖等其它蛋白质表达。基于该实施例,我们可以得出结论利用本发明的载体之一,通过将其编码序列引入到本发明的突变的或缺失的序列的下游,可以方便地表达其它目的生物工程蛋白质。
实施例V比较载体pTEXwt(不在本发明之内)和载体pTEX9′、pTEX10′、pTEX11′和pTEX12′的表达水平。
载体pTEX10′、pTEX11′和pTEX12′衍生自载体pTEX9,但包含另外的突变,如下列表4所示
表4比较载体pTEXwt、pTEX9′、pTEX10′、pTEX11′和pTEX12′的表达水平
(*)每条核苷酸序列(信使RNA)在起始密码子下游包含突变区。表中的第一行为载体pTEXCAT的参考序列。该表中表示了该载体起始密码子上游和下游的核酸序列转录后的RNA形式。在这些序列的3′末端,只表示了多克隆位点的头两个密码子,称为GAAUUC。
确定表达的方法为上述实施例中使用的方法。
这些结果证明起始密码子下游的缺失有可能获得比用野生型载体观察到的表达高达250倍以上的过量表达。
序列表序列表<110>PIERRE FABRE MEDICAMENT<120>用于重组蛋白质过量表达的起始密码子下游被修饰的构建体<130><150>PCT/FR 01/01 952<151>2001-06-21<150>FR 00/08 002<151>2000-06-22<160>40<170>PatentIn Ver.2.1<210>1<211>18<212>DNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>1aaagcaattt tcgtactg 18<210>2<211>9<212>DNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>2tttcgtact 9<210>3<211>16<212>DNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>3aagggtatct agaatt16<210>4<211>16<212>DNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>4gggccggttt cttatt16<210>5<211>16<212>DNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>5acggagaaac ccccca16<210>6<211>14<212>DNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>6tgggagggtc aatt 14<210>7<211>14<212>DNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>7taaaggaacc atat 14<210>8<211>14<212>DNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RB5)的序列<400>8taggaaagat aacg 14<210>9<211>14<212>DNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>9tgaggagaag acag 14<210>10<211>14<212>DNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>10tgaggagagt aatc 14<210>11<211>29<212>DNA<213>人工序列<220><223>源自CAT报告基因(氯霉素乙酰转移酶)的引物<400>11CCggaattca tggagaaaaa aatcactgg 29<210>12<211>24<212>DNA<213>人工序列<220><223>源自CAT报告基因(氯霉素乙酰转移酶)的引物<400>12aaactgcagt tacgccccgc cctg 24<210>13<211>74<212>DNA<213>人工序列<220><223>简并的寡核苷酸RanSD1<400>13ctagttaact agtacgcaag ttcacgtaaa nnnnnnnnnn nnnnnnatga aagcaatttt 60cgtactgaat gcgg74<210>14<211>74<212>DNA<213>人工序列<220><223>简并的寡核苷酸RanSD2<400>14aattccgcat tcagtacgaa aattgctttc atnnnnnnnn nnnnnnnntt tacgtgaact 60tgcgtactag ttaa74<210>15<211>72<212>DNA<213>人工序列<220><223>简并的寡核苷酸RanSD3<400>15ctagttaact agtacgcaag ttcacgtaaa trrrrrrrnn nnnnatgaaa gcaattttcg 60tactgaatgc gg 72<210>16<211>72<212>DNA<213>人工序列<220><223>简并的寡核苷酸RanSD4<400>16aattccgcat tcagtacgaa aattgctttc atnnnnnnyy yyyyyattta cgtgaacttg 60cgtactagtt aa 72<210>17<211>74<212>DNA<213>人工序列<220><223>磷酸化寡核苷酸SDopt4-f<400>17ctagttaact agtacgcaag ttcacgtaaa acggagaaac cccccaatga aagcaatttt 60cgtaccgaat gcgg74<210>18<211>74<212>DNA<213>人工序列<223>磷酸化寡核苷酸SDopt4-r<400>18aattccgcat tcggtacgaa aattgctttc attggggggt ttctccgttt tacgtgaact 60tgcgtactag ttaa74<210>19<211>49<212>RNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>19aaggguaucu agaauuauga aagcaauuuu cguacugaau gcggaauuc 49<210>20<211>11<212>PRT<213>人工序列<220><223>源自大肠杆菌TrpL前导序列N-末端序列的肽<400>20Met Lys Ala Ile Phe Val Leu Asn Ala Glu Phe1 5 10<210>21<211>49<212>RNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>21gggccgguuu cuuauuauga aagcaauuuu cguaccgaau gcggaauuc 49<210>22<211>11<212>PRT<213>人工序列<220><223>源自大肠杆菌TrpL前导序列N-末端序列的肽<400>22Met Lys Ala Ile Phe Val Pro Asn Ala Glu Phe1 5 10<210>23<211>47<212>RNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>23ugggaggguc aauuaugaaa ccaauuuucg uacugaaugc ggaauuc47<210>24<211>11<212>PRT<213>人工序列<220><223>源自大肠杆菌TrpL前导序列N-末端序列的肽<400>24Met Lys Pro Ile Phe Val Leu Asn Ala Glu Phe1 5 10<210>25<211>32<212>RNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>25uaaaggaacc auauaugaaa aaugcggaau uc32<210>26<211>6<212>PRT<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>26Met Lys Asn Ala Glu Phe1 5<210>27<211>47<212>RNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>27uaggaaagau aacgaugaaa gcaauuuucg cacugaaugc ggaauuc 47<210>28<211>11<212>PRT<213>人工序列<220><223>源自大肠杆菌TrpL前导序列N-末端序列的肽<400>28Met Lys Ala Ile Phe Ala Leu Asn Ala Glu Phe15 10<210>29<211>38<212>RNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>29ugaggagaag acagaugaaa gcaaugaaug cggaauuc 38<210>30<211>8<212>PRT<213>人工序列<220><223>源自大肠杆菌TrpL前导序列N-未端序列的肽<400>30Met Lys Ala Met Asn Ala Glu Phe1 5<210>31<211>32<212>RNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>31ugaggagagu aaucaugaaa gcagcggaau uc 32<210>32<211>6<212>PRT<213>人工序列<220><223>源自大肠杆菌TrpL前导序列N-末端序列的肽<400>32Met Lys Ala Ala Glu Phe1 5<210>33<211>29<212>RNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>33ugaggagagu aaucaugaaa gcagaauuc 29<210>34<211>5<212>PRT<213>人工序列<220><223>源自大肠杆菌TrpL前导序列N-末端序列的肽<400>34Met Lys Ala Glu Phe1 5<210>35<211>26<212>RNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>35ugaggagagu aaucaugaaa gaauuc26<210>36<211>4<212>PRT<213>人工序列<220><223>源自大肠杆菌TrpL前导序列N-末端序列的肽<400>36Met Lys Glu Phe1<210>37<211>23<212>RNA<213>人工序列<220><223>源自细菌序列核糖体结合位点(RBS)的序列<400>37ugaggagagu aaucauggaa uuc 23<210>38<211>3<212>PRT<213>人工序列<220><223>源自大肠杆菌TrpL前导序列N-末端序列的肽<400>38Met Glu Phe1<210>39<211>445<212>DNA<213>人工序列<220><223>源自质粒载体pTEXmp18的序列<400>39gaattaattc atgctgtggt gtcatggtcg gtgatcgcca gggtgccgac gcgcatctcg 60actgcacggt gcaccaatgc ttctggcgtc aggcagccat cggaagctgt ggtatggctg 120tgcaggtcgt aaatcactgc ataattcgtg tcgctcaagg cgcactcccg ttctggataa 180tgttttttgc gccgacatca taacggttct ggcaaatatt ctgaaatgag ctgttgacaa 240ttaatcatcg aactagttaa ctagtacgca agttcacgta aaaagggtat ctagaattat 300gaaagcaatt ttcgtactga atgcggaatt cgagctcggt acccggggat cctctagagt 360cgacctgcag gcatgcaagc ttaagtaagt aagccgccag ttccgctggc ggcatttttt 420ttgatcctaa cgctcggttg ccgcc445<210>40<211>178<212>DNA<213>人工序列<220><223>源自质粒载体pTEXmp18的序列<400>40ttaatcatcg aactagttaa ctagtacgca agttcacgta aaaagggtat ctagaattat 60gaaagcaatt ttcgtactga atgcggaatt cgagctcggt acccggggat cctctagagt 120cgacctgcag gcatgcaagc ttaagtaagt aagccgccag ttccgctggc ggcatttt178
权利要求
1.在原核细胞中表达编码目的重组蛋白质的基因的构建体,该基因置于色氨酸操纵子Ptrp的控制之下,该构建体包含在起始密码子的直接下游的序列SEQ ID No.1的核酸序列和位于该序列下游的、用于接受编码所述的目的重组蛋白质的基因的多克隆盒,其特征在于至少一个序列SEQ ID No.1的核苷酸被突变或缺失,从而能使所述的重组蛋白质过量表达。
2.权利要求1的构建体,其特征在于至少一个序列SEQ ID No.1的核苷酸被缺失。
3.权利要求1的构建体,其特征在于所述的至少被突变或缺失的核苷酸位于序列SEQ ID No.1的序列SEQ ID No.2的片段上。
4.权利要求1的构建体,其特征在于所述的至少被突变或缺失的、优选被突变的核苷酸位于序列SEQ ID No.1的密码子GTA上。
5.权利要求1的构建体,其特征在于所述的至少被突变或缺失的、优选被突变的核苷酸位于序列SEQ ID No.1的密码子GCA上。
6.权利要求1的构建体,其特征在于所述的至少被突变或缺失的、优选被突变的核苷酸位于序列SEQ ID No.1的密码子CTG上
7.权利要求1的构建体,其特征在于所述的至少一个核酸被突变或缺失的序列SEQ ID No.1至少在位点1、2和3具有核苷酸A。
8.权利要求1的构建体,其特征在于所述的序列SEQ ID No.1被完全缺失。
9.权利要求1到8之一的构建体,其特征在于位于序列SEQ IDNo.1的核酸序列和接受编码所述的目的重组蛋白质的基因的多克隆盒之间的至少一个核苷酸、优选所有的核苷酸被缺失。
10.权利要求1到9任一项中的构建体,其特征在于在起始密码子直接上游的核酸序列选自序列SEQ ID No.3至SEQ ID No.10。
11.权利要求1到10任一项中的构建体,其特征在于原核宿主细胞为革兰氏阴性菌。
12.权利要求1到11任一项中的构建体,其特征在于原核宿主细胞为E.coli。
13.包含权利要求1到12任一项中的构建体的载体。
14.用权利要求13的载体转化的原核宿主细胞。
15.权利要求14的原核宿主细胞,其特征在于其为E.coli。
16.用权利要求1-12的任一项中的构建体在宿主细胞中制备目的重组蛋白质的方法。
17.权利要求16中的制备目的重组蛋白质的方法,其中所述的构建体被引入原核宿主细胞。
18.权利要求16或17中的制备目的重组蛋白质的方法,其中所述的构建体通过权利要求13的载体被引入原核宿主细胞。
19.权利要求16-18之一中的制备目的重组蛋白质的方法,其特征在于其包含下列步骤a)将目的基因克隆到权利要求13的载体;b)用含有所述目的蛋白质编码基因的载体转化原核宿主细胞;c)在能够使重组蛋白质表达的培养基中培养所述的转化细胞;及d)从培养基或所述的转化细胞中回收重组蛋白质。
20.权利要求1-12之一的构建体、权利要求13的载体或权利要求14或15的细胞在制备重组蛋白质上的用途。
21.重组蛋白质在制备用来给予需要此类治疗的患者的医药产品上的用途,其特征在于所述的重组蛋白质是用权利要求16-19之一的方法制备的。
全文摘要
本发明涉及在原核细胞中表达编码目的重组蛋白质的基因的构建体,该基因置于色氨酸操纵子(Ptrp)的控制之下,该构建体包含在起始密码子的直接下游的核酸序列SEQ ID No.1和位于该序列下游的、设计为接受编码所述的目的重组蛋白质的基因的多克隆盒,至少该核酸序列SEQ ID No.1的核酸被突变或缺失,从而能使所述的重组蛋白质过量表达。本发明还涉及包含该构建体的载体、用该载体转化的原核宿主细胞、以及利用本发明的构建体产生目的重组蛋白质的方法。
文档编号C12N15/09GK1443242SQ01812988
公开日2003年9月17日 申请日期2001年6月21日 优先权日2000年6月22日
发明者L·切瓦莱特 申请人:皮埃尔法博赫药品公司