转录终止子序列的制作方法
【专利摘要】本发明提供新的转录终止信号序列,尤其是包含至少两个连续的转录终止信号的多核苷酸,其特征在于所述连续的转录终止信号包含至少第一和相距至多1000个核苷酸的第二转录终止信号,并且终止信号中至少一个具有或编码RNA发夹结构。
【专利说明】转录终止子序列
【技术领域】
[0001]本发明涉及表达系统和多核苷酸构建体的领域。
【背景技术】
[0002]为了通过表达系统生产足够产量的重组蛋白,在设计多核苷酸构建体和重组表达系统时,必须考虑多个方面。重要的方面是宿主细胞培养的类型以及选择适当的转染系统,以保证在整个生产过程中的细胞活性和保证高表达效率。这些关注点常常是相悖的,因为高的表达速率(expression rate) (二级蛋白的高表达速率对存活不是必要的)对细胞的健康和存活是有害的。需要可控的表达系统以允许对表达速率和对细胞代谢的修饰进行特异性调整。重组表达系统的一个重要方面是转录效率,包括终止的效率。低终止效率导致转录通读和产生冗长的mRNA,该mRNA本身对细胞造成负担,但更严重的是该mRNA会导致不需要的蛋白的表达或扰乱转基因构建体的复制控制,尤其是在质粒载体领域。不需要的复制反过来产生转基因的许多拷贝数,因此给细胞系统增加了代谢负担,使低效表达系统的问题加倍。
[0003]转录位于细胞基因表达的核心,因此可呈现出最强大的选择来操控单基因或基因群的表达速率。当三元复合体组成,其必足够稳定以允许,在非终止转录暂停或延迟期间,每秒并入多达上百个碱基,而无需RNA聚合酶的解离。因此,延伸RNA聚合酶与模板DNA以及生成的RNA转录物的紧密结合,对于生产具有数百或上千核苷酸长度的mRNA的能力而言是必不可少的。
[0004]在转录起始后以及异常稳定的三元复合物组成后,酶沿着模板移动,一个接一个地并入核苷酸并产生所需的RNA链。RNA的合成与单基因或转录操纵子的mRNA的释放必须在模板上的不同位点上停止。这个过程就称为转录终止,这个过程与转录起始期间的事件相类似但是顺序相反,结果导致了 RNA聚合酶的解离以及转录的RNA的释放。对模板DNA中的明确信号(所谓的转录终止子)作`出响应时发生终止。就像每一个生物过程一样,甚至终止也不是决定胜负的,因此终止并不以100%的程度发生。事实上,终止子在其终止效率上变化很广泛,在终止效率(TE)上有巨大的差异。事实上,终止信号对给定的RNA聚合酶是高度特异的。非终止事件也被描述为聚合酶的通读。
[0005]终止子可以分成几组。在终止信号的第一组,核心酶可在体外在缺少任何其它因子的情况下在某些位点上终止(如体外实验所测试的)。这些终止位点称为固有(intrinsic)终止子或I类终止子。固有终止子常常具有一个共同的结构特征,称为发夹或莖环结构。一方面,发夹包含莖结构,其由富含dG-dC序列的双重对称(dyad asymmetric)结构所编码。另一方面,该终止子在紧随茎结构后的3’端又展示了富含dA-dT的区。当RNA聚合酶在发夹结构上暂停时,3’端富含鸟苷的区被认为有助于转录物释放。
[0006]很长一段时间以来,在茎结构内的由G-C对所介导的发夹的稳定性,被认为是影响TE的发夹结构的最基本部分(compartment)。在莖结构上插入假定的碱基,在理论上应导致更高的整体Λ G值,并且因此整体TE应升高。令人吃惊的是,通过插入G-C对来增加热力学稳定性,并未导致更高的TE,这说明发夹结构的稳定性并不是终止的唯一基本决定因素。据推测,除了稳定性之外,发夹的三维结构在终止中也起重要作用。对最典型的固有终止子而言,从莖结构的第一个封闭碱基对(closing base pair)到第一终止位置的距离是保守的。该不变性可看作是三维结构重要性的假定证据。作为结论,发夹似乎具有(assume)一个截然不同的三维形状以便与延伸聚合酶相互作用。
[0007]Wilson和 von Hippel (PNAS92, 1995; 8793-8797)描述了 tR2 发夹终止子的变体以及使用大肠杆菌(E.coli)RNA聚合酶的终止效率。最大终止效率的最佳发夹结构具有至多有8或9个G/C碱基对的茎以及有4-8个残基跟随其后是6-8个rU残基的环。进一步延长该茎则降低转录效率。
[0008]Orosz 等人(Eur.J.Biochem201, 1991:653-659)调查了使用大肠杆菌 RNA 聚合酶的rrnB基因的大肠杆菌终止子的结构需求。天然终止子区由两个发夹终止子和两段间断的小重复组成,每段间断的小重复被认为各自都能形成小的茎。有意思的是,删除第一终止子外的所有结构不导致终止效率的降低。第一终止子的茎具有43%的G/C含量。
[0009]Jeng 等人(J Biol Chem267 (27),1992:19306-19312)描述了使用噬菌体 T7RNA聚合酶的thr弱化子(attenuator)的体外终止。thr弱化子的终止可能受thr弱化子上游和远端(distal)的远端(remote)序列影响,具有7对G/C碱基对和可变A/T附加序列(additions)的富含G/C的莖环发夹,在发夹前的脱氧胸苷延伸(stretch)以及环结构(偏好thr弱化子的反向序列)。随后的调查显示,对终止而言,茎环上游的腺苷残基延伸是不需要的(Yang 等人,J Biol Chem270 (49),1995:23330-23336)。
[0010]终止子包含在细菌的序列中,例如在质粒pAPEC-01-ColBM(NCBI数据库acc.n0.NC_009837.1)或大肠杆菌 APEC 01 株的基因组中(NCBI 数据库 acc.n0.NC_008563.1)。
[0011]Carafa 等人(J Mol Biol216(4) (1999):835-858)描述了 Rho 依赖性的大肠杆菌
转录终止子。
[0012]Mitra 等人(Nucleic Acids Research, 39 (2011):D129_D135)提供了 WebGeSTer数据库的展示,转录终止子数据库。
[0013]Unniraman 等人(Nucleic Acids Research30 (3) (2002): 675-684)提供了某些终止子结构和分类的综述。
[0014]Quiagen 的 QIAexpress pQE 载体(“The QIAexpress System”,TheQIAexpressionist06/2003,第5版,,第15页)包含两个终止子。
[0015]Unniraman 等人(Journal of Biological Chemistry, 276 (45)(2001):41850-41855)涉及真细菌的固有转录终止子。
[0016]Friedman 等人(Annual Review of Genetics, 21(1) (1987): 453-488)提供了 I 类和II类终止子的综述。
[0017]Lesnik 等人(Nucleic Acid Research, 29 (17) (2001): 3583-3594)描述了用于研究固有rho依赖性终止子的RNA基序项目(RNAMotif )。
【发明内容】
[0018]本发明的目的是通过有效的转录终止提供改进的表达系统,表达系统具有提高的所需产物的表达效率,尤其是高度加工的RNA聚合酶,如T7RNA聚合酶的表达效率。[0019]这个目的通过权利要求的主题和本文描述的定义得以解决。
[0020]在第一方面,本发明提供包含至少两个连续的转录终止信号的多核苷酸,其中所述连续的转录终止信号包含至少第一转录终止信号和至多相距1000个核苷酸的第二转录终止信号,并且终止信号中至少有一个具有或编码RNA发夹结构。根据本发明,人们已经发现,连续的终止信号能够互相影响并导致终止效率的显著增加,尤其是如果至少一个终止子包含发夹结构。所述发夹具有包含至少12对内部碱基对的茎的结构,其中具有至少60%的G或C("G/C")核酸。在优选的实施方案中,发夹有在第二方面所限定的特定结构。本发明提供包含2、3、4或更多终止信号的组合的多核苷酸,终止信号是可操纵地连接的以允许在之前编码的序列转录之后以协同的行动(concerted action)终止,用于增加终止效率。
[0021]在第二方面,本发明还提供包含至少一个转录终止信号的多核苷酸,所述转录终止信号包含具有序列Y-U/T-NNG-Z的发夹结构,
[0022]其中Y是至少8个核苷酸长并具有至少60%,优选至少70%的G/C含量的核苷酸序列;
[0023]Z是与Y具有至少70%互补性的核苷酸序列,
[0024]Z的互补核苷酸与Y的核苷酸碱基配对,序列U/T-NNG是没有与Y或Z配对的碱基的环,其中N是选自T (U)、A、C、G的任一核苷酸;序列U/T-NNG优选是U/T-U/T-CG。该第二方面与发明的第一方面可组合:考虑到满足第一方面的限制(Y和Z至少12个核苷酸长),这种类型的终止子也可以用作多核苷酸上的二级发夹,或者可进一步限定一级发夹。尤其是如果用作特定基因或表达构建体的唯一终止子时,优选较长的茎结构,例如至少13、
14、15、16或更多碱基对(Y和Z)。根据本发明,通过进一步增加G/C含量、茎的互补性以及对环进行优化(这些将在下文中详述)可以提高终止效率。如根据本发明已经发现的,所有这些选择增加发夹的稳 定性,其导致终止效率增加。一般而言,发夹的形成吉布斯能(Gibbs-energy, dG)通过这些结构优化得以降低。然而,如Wilson和von Hippel (见前)已发现的,单一的dG优化并不必然导致终止效率的增加:增加茎长度至超过9个碱基对-虽然其降低dG (并且增加发夹的稳定性)-并不导致终止效率的增加。
[0025]如本文所用,在核苷酸序列中的“/”或用括号括起的核苷酸指的是替代的核苷酸,例如在RNA序列中替代的U取代在DNA序列中的T。因此,U/T或U(T)表示一个可以是U或是T的核苷酸位点。同样地,A/T指的是核苷酸A或T ;G/C指的是核苷酸G或C。因为U和T之间的功能的同一性,本文中任何对U或T的引用,也可被视作对T或U中另一个的公开。例如,对(在RNA上的)序列UUCG的引用也可被理解为(在对应的DNA上的)序列TTCG的公开。为简单起见,这些选择中只有一个可用于本文描述。
[0026]互补的核苷酸或碱基是那些能够碱基配对的,例如A和T (或U) ;G和C ;G和U。
[0027]发夹或莖环(stem-loop)是RNA单链部分的RNA结构,RNA单链部分自身折叠形成茎内的(内部)碱基对以及在茎部分之间的中间环序列上没有碱基配对。环优选是短的,如长度是3、4、5、6、7或8个核苷酸。本发明的多核苷酸可有1、2、3、4个或更多的发夹,如本文所限定的至少1、2、3或4,其中至少一个具有至少12个碱基对的较大茎长度,优选在14到26碱基对范围内。
[0028]本发明的多核苷酸可以是DNA (通常编码终止子)或者RNA (其通常能够折叠成发夹结构并可包含发明的终止子)。多核苷酸可以是单链(尤其是对RNA)或者是双链(尤其是对DNA)。
[0029]如本文所用,“同一性”意为当比对序列以使序列匹配最大化时在两个或多个序列中对应位置上相同核苷酸所占的比例,即,考虑到空位(gaps)和插入。设计确定同一性的方法用于在测试的序列之间给出最大的匹配。此外,确定同一性的方法编码于公开可用的计算机程序。在两序列间确定同一性的计算机程序方法包括但不仅限于GCG程序包、BLASTP, BLASTNjP FASTA。BLAST程序从NCBI和其它资源可以公开获得(BLAST手册,Altschul, S 等人.,NCBI NLM NIH Bethesda, Md.20894; Altschul, S 等人.,J.Mol.Biol.215:403-410 (1990)。公知的Smith Waterman算法也可用于确定同一性。能够例如使用具有11.0的开放空位(open gap)罚分和1.0的延伸空位(extended gap)罚分的默认参数来运行以及使用blosum-62矩阵来运行BLASTN。 [0030]如本文所用,“包含”(comprising)可理解为对开放式限定的引用,允许相似的其它成员或其它特征。“由……组成”(Consisting of)可理解为涉及有限范围的特征的封闭式限定。
[0031]本文使用的“终止”(Termination),如果没有另外注明,指的是转录终止。“终止信号”或(Termination signal)仅“终止子”(terminator),如果没有另外注明,指的是“转录终止信号”(transcription termination signal)。终止子是妨碍或是阻止聚合酶转录的序列。本发明的终止子是为T7RNA聚合酶特别优化的,但是也能在一定程度上影响其它RNA聚合酶的终止。
[0032]“0RF”或“开放阅读框”是能被翻译成多肽的核苷酸序列。这样的延伸序列的编码序列(“CDS”)不能被终止密码子打断。终止密码子可以存在于基因表达期间被删除的内含子中。代表全长蛋白质的编码序列的ORF起始于“起始”密码子,通常是ATG,终止于“终止”密码子之一。出于本申请的目的,ORF可以是编码序列的任何部分,具有或没有起始和/或终止密码子。对编码基因产物的序列而言,“0RF”和“⑶S”可以互换使用。
[0033]如本文所用,术语“可操作地连接”或“可操作地定位”(operably positioned)涉及0RF,例如在表达盒中(expression cassette),其意思是具有本发明的终止子活性的序列与该核酸分子的另一核苷酸组件在功能上相关。例如,如果终止子影响到编码序列的转录,那么该终止子与编码序列可操作地连接。这样的可操作的连接可以例如通过在和基因编码序列相同的DNA分子上提供本发明的终止子。如果两个或更多的终止子彼此被定位用于为之前的编码序列提供协同的终止,那么它们可以是可操作地连接的。尤其优选地,终止子序列位于编码序列的下游,例如在编码序列的3’位置。终止子可以在编码序列的下游,例如至少I个、至少10个、至少30个、至少50个、至少100个、至少150个、至少200个、至少250个、至少300个、至少400个、至少500个核苷酸处,或者终止子可与编码序列直接相邻。终止子序列,以其组合或其独立的形式,可以位于编码序列的下游10000个以内、8000个以内、6000个以内、5000个以内、4500个以内、4000个以内、3500个以内、3000个以内、2500个以内、2000个以内、1500个以内、1000个以内、750个以内、500个以内、250个以内、100个以内核苷酸处。
[0034]在本发明的优选的实施方案中,多核苷酸可包含第三转录终止信号,其任选地包含或编码RNA发夹结构(例如上文所限定的,然而独立地选自任何其它发夹终止子,或其它),所述第三转录终止信号与第一或第二转录终止信号相距至多1000个核苷酸。第一、第二和任选的第三终止子可以被放置在(相同的)基因或编码序列的末端,用以停止所述基因或编码序列的转录。多核苷酸可包含其它终止子。
[0035]在第一和第二终止子之间的核苷酸距离,在第一和第三终止子之间的和/或在第二和第三终止子之间的核苷酸距离可各自单独地选自下述任何范围,至多1000个核苷酸、至多900个核苷酸、至多800个核苷酸、至多700个核苷酸、至多600个核苷酸、至多500个核苷酸、至多400个核苷酸、至多300个核苷酸、至多250个核苷酸、至多200个核苷酸、至多180个核苷酸、至多160个核苷酸、至多150个核苷酸、至多140个核苷酸、至多130个核苷酸、至多120个核苷酸、至多110个核苷酸、至多100个核苷酸、至多90个核苷酸、至多80个核苷酸、至多70个核苷酸、至多60个核苷酸、至多50个核苷酸。此外,在第一和第二终止子之间的核苷酸距离,在第一和第三终止子之间的和/或在第二和第三终止子之间的核苷酸距离可各自单独地选自下述任何范围,至少10个核苷酸、至少15个核苷酸、至少20个核苷酸、至少30个核苷酸、至少40个核苷酸、至少50个核苷酸、至少60个核苷酸、至少70个核苷酸、至少80个核苷酸。终止子在多核苷酸上的放置可允许可操作的定位以影响其它终止子的终止。
[0036]发夹是包含分子内碱基配对的茎环序列,发夹也是一种能在单链DNA或,更通常地,在RNA中发生的模式(pattern)。所述结构也称为发夹环。当同一链上的两个区,以相反方向阅读时核苷酸序列上大部分互补时,碱基对形成末端是未配对环的双螺旋,而产生发夹。茎环结构的形成依赖于生成的螺旋和环区的稳定性。显然,第一前提是存在能够自身回折以形成配对的双螺旋的序列。该螺旋的稳定性取决于其长度、错配数或其包含的凸出(bulges)数(小数目是可容许的,尤其是在长螺旋中)以及配对区的碱基组成。鸟嘌呤和胞嘧啶之间的配对具有三个氢键,比腺嘌呤-尿嘧啶的配对(只有两个氢键)更稳定。在RNA中,以两个氢键为特征的鸟嘌呤-尿嘧啶配对也是常见和有利的。碱基堆积相互作用,使碱基的芳香环的Pi轨道以有 利的方向排列,也促进螺旋的形成。
[0037]在尤其优选的实施方案中,发夹结构被序列Y-X-Z所限定,其中Y是至少8个核苷酸长的核苷酸序列,并具有至少40%的G/C含量,优选至少50%,尤其优选至少60%,
[0038]X是3至9核苷酸长的核苷酸序列,Z是与Y具有至少70%互补性的核苷酸序列,Z的互补核苷酸与Y的核苷酸碱基配对,X是没有与Y或Z (也没有在X内部)配对的碱基的环。优选X在是3个、4个、5个、6个、7个或8个核苷酸长。这种一般结构能够通过增加茎的G/C含量、优化环以及增加Y和Z之间的互补性来进一步改善TE。X的四元环(tetraloop)(长度为4)结构是尤其优选的。X可包含或可由序列U/T-NNG组成,或反之亦然,其中N是选自U (T)、A、C、G的任一核苷酸;序列U/T-NNG优选是U/T-NCG,尤其是U/T-U/T-CG。在Y和Z上具有相邻G/C的四元环形成非常稳定的环结构,其显示出非常高的终止效率并且属于本发明最优选的实施方案中。
[0039]这样的式X-Y-Z的发夹结构可位于第一、第二和/或第三转录终止信号上。其它终止信号可包含其它的发夹终止子或替代的非发夹(例如II类)终止子,或者当然也可包含式X-Y-Z的发夹的终止子,其中Y、x和Z是独立选择的。在优选的实施方案中,本发明的多核苷酸包含两个发夹终止子,尤其优选其中一个或两个是本发明的X-Y-Z结构。
[0040]本发明也提供包含至少一个转录终止信号的多核苷酸,该转录终止信号包含具有所述序列Y-U/T-NNG-Z的发夹结构,[0041]其中Y是至少10个核苷酸长的核苷酸序列,并具有至少60%的G/C含量,
[0042]Z是与Y具有至少70%互补性的核苷酸序列,
[0043]Z的互补核苷酸与Y的核苷酸碱基配对,序列U/T-NNG是没有与Y或Z相配对的碱基的环,其中N是选自T (U)、A、C、G的任一核苷酸;序列U/T-NNG优选是U/T-U/T-CG。这样的具有上述Y-X-Z结构的多核苷酸,其中X是U/T-NNG (当然任选地也包括反之亦然),可包含仅一个终止子,尤其是其位置独立于其它终止子,例如可操作地连接至ORF或可插入ORF的克隆位点。涉及χ-y-ζ发夹的上文和下文适用于本发明的所有方面。
[0044]在发夹的茎(Y或Z或两者一起)中高G/C含量在能量上是有利的,导致高度稳定的发夹,继而增加终止效率。在优选的实施方案中,在Y或Z或两者的核苷酸中的G/C含量是至少50%、至少52%、至少54%、至少56%、至少58%、至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%。
[0045]在优选的实施方案中,至少一个转录终止信号(第一、第二和/或第三)包含富含A/T (U)的区,该区是至少4个、优选至少5、至少6、至少7、至少8、至少9、或至少10个核苷酸长,该区包含至少75%的A或T (U),其中所述富含A/T (U)的区优选位于发夹下游,尤其优选地距所述发夹不多于20个核苷酸。富含A/T(U)的区可包含选自A/T (U)的至少3个、至少5个、至少6个、至少7个、至少8个、至少9个、或至少10个核苷酸,优选至多I个、至多2个、至多3个G/C核苷酸。尤其优选富含A/T(U)的区是与发夹直接相邻,或者与发夹相距(通常下游)至多20个核苷酸、优选至多15个核苷酸、至多12个核苷酸、至多10个核苷酸、至多8个核苷酸、至多7个核苷酸、至多6个核苷酸、至多5个核苷酸、至多4个核苷酸、至多3个核苷酸、至多2个核苷酸、至多I个核苷酸。富含A/T(U)的区可以是富含T(U)的,而且优选包含至少3个T (U)、至少4个T (U)、至少5个T (U)、至少6个T (U)、至少7个T (U)或至少8个T(U)。富含A/T(U)的区在长度上可以多至20、多至15、多至12、多至10、多至8个核苷酸。发夹下游的富含A/T(U)的区通常增加终止效率。其可与茎(Z)重叠。在这种情况下,优选地,Z的最后I个、2个、3个、4个或5个核苷酸可是A或T(U),优选T(U)。
[0046]在本发明的式Y-X-Z的发夹中,优选Y在长度上是9、10、11、12、13、14、15、16、17、
18、19、20、21、22、23、24、25、26、27、28、29、或30个核苷酸。Y的长度,通过互补性决定Z的长度,其可选自相同的核苷酸长度。基本上互补的Y和Z,即发夹的茎,的长度在碱基对上决定茎的长度。该茎并不一定是100%互补的,如下文所述,而是对于Y和Z具有有限的非互补的不同喊基(opposing bases)。
[0047]尤其地,Y和Z可以是m个核苷酸长,其中Y由核苷酸I1到ym组成,Z由核苷酸Z1到 zm 组成,发夹由序列 ymym-lym_2...Υ8Υ7Υ6Υ5Υ4Υ3Υ2Υ1_Χ_Ζ1Ζ2Ζ3Ζ4Ζ5Ζ6Ζ7Ζ8...ZnrlZm 组成。优选Z1与I1互补,以及Zm与ym互补,意思是发夹的茎的端点是互补的。此外,任何一个ya都可以与Za互补,a是从I到m的整数,尤其是在73和Za之间的互补性,a可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或 30 以及其任意组合。尤其优选地,茎的开始的和\或最后的I个、2个、3个、4个或5个核苷酸是互补的。
[0048]Y和Z需具有高互补性以形成高效和稳定的发夹,例如,Y和Z至少80%互补,优选至少82%、至少84%、至少85%、至少86%、至少88%、至少90%、至少92%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或者甚至100%互补。最优选地,互补性是至少70%、优选地至少75%、至少80%、至少85%、至少90%、至少95%或者至少100%G_C或A-T (U)互补性。[0049]在由X和Z形成的莖结构中,应该限制非互补性(non-complementarites)。某些有限的非互补性是可能的,但是不应将其相邻放置以避免形成“泡”(bubble)或额外的环。在优选的实施方案中,在发夹内,Y和Z的核苷酸之间,至多3、2或I个G-U互补与另一个G-U互补相邻,优选无相邻G-U互补的发夹。[0050]本发明的一个尤其优选的终止子是SEQ ID N0:4编码。本发明扩充至与SEQ IDNO:4编码的终止子有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少92%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的其它同源终止子。优选地,非同一'I"生(non-1dentities)仍然如上文所限定的,例如,形成没有或有限的非互补的茎结构或者形成如前所述的富含A/T的区。SEQ ID NO:4描述一个人工优化的终止子,具有茎(ntsl至16,21至36)、环(ntsl7至20)和茎之后的富含A/U的区(nts37至40)。其在茎结构上(25/32nts)具有78%的G/C含量。[0051]在优选的实施方案中,本发明的多核苷酸的终止子中的至少一个是II类终止子。[0052]与通常的发夹样终止子相反,终止事件(II类终止子的作用需要非编码链的存在),因此是双链驱动过程(He等人.,J Biol Chem267, 1998:19306-19312)。进一步的证据是,在这些新序列上的转录终止,所谓的II类终止信号,是通过独立于I类终止途经的机制介导的,源于使用突变的T7RNA聚合酶的体外转录分析。在20kDa N-端部分和80kDaC-端片段之间的突变导致该聚合酶的“切口 ”(nicked)形,其不能在II类终止信号上终止,但是当转录包含I类终止信号的发夹时,其依然能够阻止延伸(Lyakhov等人.,J MolBiol269, 1997:28-40)。因此,在大肠杆菌中有两种不同的机制能够完成转录的终止,并且两种途径是彼此独立地操作。[0053]对推测的(putative)生物体的序列分析揭示存在其它II类终止信号。这些不寻常的序列存在于大肠杆菌rrnB Tl终止位点内、在水疱性口炎病毒(vesicular stomatitisvirus, VSV)的cDNA拷贝上、在腺病毒DNA中、以及在噬菌体的lambda DNA上(Zhang和Studier, 1995) (Sousa等人.,1992)。与固有终止信号上的U串(U_run)相比,所有这些新发现的序列共享7bp长的共有序列(根据非模板链ATCTGTT)和3’端的不均衡的(unequally)长串尿苷。[0054]II类终止子的实例是:[0055]
【权利要求】
1.一种包含至少两个连续的转录终止信号的多核苷酸,其特征在于所述连续的转录终止信号包含至少第一转录终止信号和相距至多1000个核苷酸的第二转录终止信号,并且终止信号中至少一个具有或编码RNA发夹结构,所述发夹结构包含具有至少60%G或C核酸的至少12对内部碱基对的茎。
2.根据权利要求1所述的多核苷酸,其包含第三转录终止信号,任选地包含或编码RNA发夹结构,所述第三转录终止信号距所述第一转录终止信号或第二转录终止信号至多1000个核苷酸。
3.根据权利要求1或2所述的多核苷酸,其特征在于所述发夹结构由序列Y-X-Z所限定,其中Y是至少12个核苷酸长并具有至少60%的G/C含量的核苷酸序列, X是3至9个核苷酸长的核苷酸序列,以及 Z是与Y具有至少70%互补性的核苷酸序列, Z的互补核苷酸与Y的核苷酸碱基配对,以及X是没有与Y或Z配对的碱基的环。
4.根据权利要求3所述的多核苷酸,其特征在于X具有3、4、5、6、7、8或9个核苷酸长。
5.根据权利要求3或4所述的多核苷酸,其特征在于X包含或由序列U/T-NNG组成,其中N是选自U (T)、A、C、G的任一核苷酸;序列U/T-NNG优选是U/T-NCG,尤其是U/T-U/T-CG。
6.根据 权利要求1至5中任一项所述的多核苷酸,其特征在于所述第一转录终止信号、第二转录终止信号和/或第三转录终止信号包含如权利要求3至5中任一项所限定的所述发夹结构,优选地转录终止信号中至少一个包含如权利要求5所限定的发夹结构,并且至少另一转录终止信号包含权利要求3所限定的发夹结构,其中Y、X和Z被独立地选择。
7.根据权利要求1至6中任一项所述的多核苷酸,其中所述终止子信号中至少一个是II类终止子。
8.一种包含至少一个转录终止信号的多核苷酸,所述转录终止信号包含具有序列Y-U/T-NNG-Z的发夹结构, 其中Y是至少12个核苷酸长并具有至少60%的G/C含量的核苷酸序列, Z是与Y具有至少70%互补性的核苷酸序列, Z的互补核苷酸与Y的核苷酸碱基配对,以及序列U/T-NNG是没有与Y或Z配对的碱基的环,其中N是选自T (U)、A、C、G的任一核苷酸;序列U/T-NNG优选是U/T-U/T-CG。
9.根据权利要求1至8中任一项所述的多核苷酸,其特征在于至少一个转录终止信号包含含有至少75°从或1'出)的至少4个核苷酸长的富含A/T (U)的区,其中所述富含A/T (U)的区优选位于发夹的下游,尤其优选距所述发夹不多于20个核苷酸。
10.根据权利要求3至9中任一项所述的多核苷酸,其特征在于Y是12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或 30 个核苷酸长。
11.根据权利要求3至10中任一项所述的多核苷酸,其特征在于Y和Z是m个核苷酸长,Y由核苷酸Ii至ym组成,以及Z由核苷酸Z1至Zm组成,所述发夹由序列ymym-lym_2...y8y7y6y5y4y3y2y「X_ZlZ2Z3Z4Z5Z6Z7Z8...ZnriZm 组成,其中 Z1 与 Y1 互补,以及 Zm 与 ym 互补。
12.根据权利要求3至11中任一项所述的多核苷酸,其特征在于Y和z至少80%互补,优选至少90%互补,尤其优选100%互补,最优选具有至少70%G-C或A-T⑶互补性。
13.根据权利要求3至12中任一项所述的多核苷酸,其特征在于在所述发夹中,在Y和Z的核苷酸之间,至多3、2或I个G-U互补与另一个G-U互补相邻,优选没有相邻的G-U互补的发夹。
14.根据权利要求1至13中任一项所述的多核苷酸,所述多核苷酸是DNA,其编码如权利要求I至12中任一项所限定的终止信号;或者所述多核苷酸是包含权利要求1至12所限定的终止信号的RNA。
15.一种根据权利要求1至14中任一项所述的多核苷酸,所述多核苷酸尺寸是至多10000个核苷酸长。
16.—种根据权利要求1至15中任一项所述的多核苷酸,其特征在于所述多核苷酸包含一个或多个限制性位点,所述限制性位点位于所述转录终止信号的侧面和/或位于转录终止信号上游的克隆位点的侧面,或位于转录终止信号上游的编码序列的侧面,优选编码序列还与启动子可操作地连接。
17.一种根据权利要求1至16中任一项所述的多核苷酸,其包含第一终止子信号和第二终止子信号, 所述第一终止子信号包含由序列Y-X-Z所限定的发夹结构,其中Y是至少12个核苷酸长并具有至少60%,优选至少65%的G/C含量的核苷酸序列, X是3至9个核苷酸长的核苷酸序列,以及 Z是与Y具有至少80%互补性的核苷酸序列, Z的互补核苷酸与Y的核苷酸碱基配对,以及X是没有与Y或Z配对的碱基的环; 所述第二终止子信号包含II类终止信号,优选地包含共有序列TCTGTT,尤其优选地包含具有至少40%的T含量的至少20个核苷酸长的序列。
18.一种根据权利要求1至17中任一项所述的多核苷酸,其包含第一终止子信号和第二终止子信号, 所述第一终止子信号包含由序列Y-X-Z所限定的发夹结构,其中Y是至少14个核苷酸长并具有至少60%,优选至少65%的G/C含量的核苷酸序列, X是3至9个核苷酸长的核苷酸序列,以及 Z是与Y具有至少90%互补性的核苷酸序列,Z的互补核苷酸与Y的核苷酸碱基配对,以及X是没有与Y或Z配对的碱基的环; 所述第二终止子信号包含由序列Y-X-Z所限定的发夹结构,其中Y是至少8个核苷酸长并具有至少40%,优选至少50%,尤其至少60%的G/C含量的核苷酸序列, X是3至9个核苷酸长的核苷酸序列,以及 Z是与Y具有至少70%互补性的核苷酸序列,Z的互补核苷酸与Y的核苷酸碱基配对,以及X是没有与Y或Z配对的碱基的环;其中第一终止子和第二终止子相距至多1000个核苷酸以通过第一终止信号和第二终止信号提供协同的终止,其中第一终止子和第二终止子的Y、X和Z可独立地选择,尤其如权利要求4、5、10至13所限定。
19.一种根据权利要求1至17中任一项所述的多核苷酸,其包含第一终止子信号和第二终止子信号, 所述第一终止子信号包含由序列Y-X-Z所限定的发夹结构,其中Y是至少12个核苷酸长并具有至少60%,优选至少65%的G/C含量的核苷酸序列,X是3至9个核苷酸长的核苷酸序列,以及Z是与Y具有至少80%互补性的核苷酸序列,Z的互补核苷酸与Y的核苷酸碱基配对,以及X是没有与Y或Z配对的碱基的环;所述第二终止子信号包含II类终止信号,优选地包含共有序列TCTGTT,尤其优选地包含具有至少40%的T含量的至少20个核苷酸长的序列。
20.一种根据权利要求1至17中任一项所述的多核苷酸,其包含第一终止子信号、第二终止子信号和第三终止子信号, 所述第一终止子信号包含由序列Y-X-Z所限定的发夹结构,其中Y是至少12个核苷酸长并具有至少60%,优选至少65%的G/C含量的核苷酸序列,X是3至9个核苷酸长的核苷酸序列,以及Z是与Y具有至少80%互补性的核苷酸序列,Z的互补核苷酸与Y的核苷酸碱基配对,以及X是没有与Y或Z配对的碱基的环; 所述第二终止子信号包含由序列Y-X-Z所限定的发夹结构,其中Y是至少8个核苷酸长并具有至少40%,优选至少50%,尤其至少60%的G/C含量的核苷酸序列, X是3至9个核苷酸长的核苷酸序列,以及 Z是与Y具有至少70%互补性的核苷酸序列,Z的互补核苷酸与Y的核苷酸碱基配对,以及X是没有与Y或Z配对的碱基的环; 所述第三终止子信号包含由序列Y-X-Z所限定的发夹结构,其中Y是至少8个核苷酸长并具有至少40%,优选至少50%,尤其至少60%的G/C含量的核苷酸序列, X是3至9个核苷酸长的核苷酸序列,以及 Z是与Y具有至少70%互补性的核苷酸序列,Z的互补核苷酸与Y的核苷酸碱基配对,以及X是没有与Y或Z配对的碱基的环;` 其中所述第一终止子、第二终止子和第三终止子相距至多1000个核苷酸以通过第一终止信号、第二终止信号和第三终止信号提供协同的终止,其中第一终止子、第二终止子或第三终止子的Y、X和Z可独立地选择,尤其如权利要求4、5、10至13所限定。
21.一种根据权利要求1至17中任一项所述的多核苷酸,其包含第一终止子信号、第二终止子信号和第三终止子信号, 所述第一终止子信号包含由序列Y-X-Z所限定的发夹结构,其中Y是至少12个核苷酸长并具有至少60%,优选至少65%的G/C含量的核苷酸序列,X是3至9个核苷酸长的核苷酸序列,以及Z是与Y具有至少80%互补性的核苷酸序列,Z的互补核苷酸与Y的核苷酸碱基配对,以及X是没有与Y或Z配对的碱基的环; 所述第二终止子信号包含II类终止信号,优选地包含共有序列TCTGTT,尤其优选地包含具有至少40%的T含量的至少20个核苷酸长的序列; 所述第三终止子信号包含由序列Y-X-Z所限定的发夹结构,其中Y是至少8个核苷酸长并具有至少40%,优选至少50%,尤其至少60%的G/C含量的核苷酸序列, X是3至9个核苷酸长的核苷酸序列,以及 Z是与Y具有至少70%互补性的核苷酸序列,Z的互补核苷酸与Y的核苷酸碱基配对,以及X是没有与Y或Z配对的碱基的环;其中第一终止子、第二终止子和第三终止子相距至多1000个核苷酸以通过第一终止信号、第二终止信号和第三终止信号提供协同的终止,其中第一终止子或第三终止子的Y、X和Z以及II类终止信号的共有且富含T的序列可独立地选择,尤其如权利要求4、5、10至13所限定。
22.一种根据权利要求1至17中任一项所述的多核苷酸,其包含第一终止子信号、第二终止子信号和第三终止子信号,所述第一终止子信号包含由序列Y-X-Z所限定的发夹结构的,其中Y是至少12个核苷酸长并具有至少60%,优选至少65%的G/C含量的核苷酸序列,X是3至9个核苷酸长的核苷酸序列,以及Z是与Y具有至少80%互补性的核苷酸序列,Z的互补核苷酸与Y的核苷酸碱基配对,以及X是没有与Y或Z配对的碱基的环; 所述第二终止子信号包含由序列Y-X-Z所限定的发夹结构,其中Y是至少8个核苷酸长并具有至少40%,优选至少50%,尤其至少60%的G/C含量的核苷酸序列, X是3至9个核苷酸长的核苷酸序列,以及 Z是与Y具有至少70%互补性的核苷酸序列,Z的互补核苷酸与Y的核苷酸碱基配对,以及X是没有与Y或Z配对的碱基的环,以及与所述发夹结构相邻的II类终止信号,优选包含共有序列TCTGTT,尤其优选地包含具有至少40%的T含量的至少20个核苷酸长的序列; 所述第三终止子信号包含由序列Y-X-Z所限定的发夹结构,其中Y是至少8个核苷酸长并具有至少40%,优选至少50%,尤其至少60%的G/C含量的核苷酸序列, X是3至9个核苷酸长的核苷酸序列,以及 Z是与Y具有至少70%互补性的核苷酸序列,Z的互补核苷酸与Y的核苷酸碱基配对,以及X是没有与Y或Z配对的碱基的环;其中第一终止子、第二终止子和第三终止子相距至多1000个核苷酸以通过第一终止信号、第二终止信号和第三终止信号提供协同的终止,其中第一终止子、第二终止子或第三终止子的Y、X和Z以及II类终止信号的共有且富含T的序列可独立地选择,尤其如权利要求4、5、10至13所限定。
23.一种表达盒,其包含根据权利要求1至22中任一项所述的多核苷酸序列和编码序列,其中为了终止所述编码序列,对所述序列进行可操作地定位。
24.一种载体,其包含根据权利要求1至22中任一项所述的多核苷酸或根据权利要求18所述的表达盒,所述载体优选是质粒。
25.一种包含多核苷酸分子的细胞,其中基因,优选在载体中,与根据权利要求1至22中任一项所述的多核苷酸的转录终止信号可操作地连接。
26.根据权利要求25所述的细胞,所述细胞包含T7RNA聚合酶或编码所述T7RNA聚合酶的多核苷酸。
27.一种生产基因产物的方法,其包括提供根据权利要求25或26所述的细胞,以及在允许所述基因表达的条件下培养所述细胞。
28.一种生产mRNA的体外方法,其包括提供根据权利要求1至22中任一项所述的多核苷酸和所述转录终止信号上游的编码序列,以及使所述多核苷酸接触所述T7RNA聚合酶。
【文档编号】C12N15/70GK103620038SQ201280026385
【公开日】2014年3月5日 申请日期:2012年6月4日 优先权日:2011年6月3日
【发明者】G·施特里德纳, A·维特维尔 申请人:桑多斯股份公司, 勃林格殷格翰Rcv有限两合公司