包含珠蛋白基因簇的调控元件的真核表达载体的制作方法

文档序号:14392467阅读:273来源:国知局
包含珠蛋白基因簇的调控元件的真核表达载体的制作方法

本发明涉及可用于增强目标蛋白的生产收率的新型表达盒。该表达盒包含人珠蛋白基因簇的表达调控元件,具体而言包含人aγ珠蛋白的启动子和人β-珠蛋白或α-珠蛋白基因簇的基因座控制区。本发明尤其提供包含这类珠蛋白表达调控元件的表达盒。



背景技术:

重组蛋白生产是当今生物产业的一个主要方面。因为需要大量高品质蛋白质的应用的数目在市场上增加,所以重组蛋白生产越来越重要。食品生产以及尤其是药理学是对重组蛋白的需求稳步增加的两个主要领域。为了获得商业上可行的工艺,需要更高的生产效率以及因此导致的更低的最终产品费用。

然而,同时高的产品品质以及与人类应用的相容性是必须的。越来越多的应用需要在真核细胞,尤其是在高等真核细胞中重组生产蛋白质。特别是,携带翻译后修饰诸如糖基化的蛋白质(糖蛋白)在原核细胞系统诸如大肠杆菌或真核细胞系统诸如(尤其是人细胞系)中表达时显著不同。这些差异在许多情形中明显影响所产生的蛋白质的生物活性以及免疫原性。然而,使用高等真核细胞系的许多表达系统的缺点是所需蛋白质的表达率相当低,从而导致重组蛋白的收率低且费用高。

因此,本领域需要提供新型的手段和方法,用于增加重组蛋白生产的收率,尤其是在使用真核表达细胞系时。



技术实现要素:

如本发明所展示的,可组合人珠蛋白基因簇的某些元件来提供表达盒,该表达盒使得目标多肽能在真核细胞中稳定高效表达。具体地讲,β-珠蛋白基因簇或α-珠蛋白基因簇的基因座控制区的特定部分与aγ珠蛋白启动子以及任选的还有aγ珠蛋白3'增强子的组合可形成具有惊人的高且稳定的表达率的表达盒。

因此,本发明在第一个方面提供用于重组生产目标多肽的方法,包括以下步骤:

(a)提供宿主细胞,该宿主细胞包含表达盒,所述表达盒包含功能上彼此连接的以下元件:

(i)包含人β-珠蛋白基因簇或人α-珠蛋白基因簇的基因座控制区的至少功能部分的基因座控制区;

(ii)包含人aγ珠蛋白基因的启动子的至少功能部分的启动子区;以及

(iii)包含编码目标多肽的核酸序列的编码区;

(b)在宿主细胞表达目标多肽的条件下培养宿主细胞;以及

(c)分离所述目标多肽。

在第二个方面,本发明提供包含在功能上彼此连接的以下元件的表达盒:

(i)包含人β-珠蛋白基因簇或人α-珠蛋白基因簇的基因座控制区的至少功能部分的基因座控制区;

(ii)包含人aγ珠蛋白基因的启动子的至少功能部分的启动子区;

(iii)任选地编码区;

(iv)转录终止子区;以及

(v)包含人aγ珠蛋白基因的3'增强子的至少功能部分的增强子区;

其中该表达盒不包含编码整个人aγ珠蛋白的核酸序列。

在第三个方面,本发明提供包含根据第二个方面的表达盒的载体以及包含所述表达盒或所述载体的宿主细胞。

根据下面的描述以及随附的权利要求书,本发明的其他目标、特征、优点和方面对本领域技术人员将显而易见。然而,应当理解,下面的描述、随附的权利要求书以及表明本申请优选实施方案的具体实施例仅以示例方式给出。通过阅读下文,在本公开发明的精神和范围内的各种变化和修改对于本领域技术人员将变得显而易见。

定义

如本文所用,下面的表述总体上优选具有下面列出的含义,除非使用它们的上下文另外明确指明。

如本文所用,表述“包含”除了其字面含义以外还包括并且尤其是指表述“基本上由...组成”和“由...组成”。因此,表述“包含”是指其中“包含”具体列出的元件的主题不包含另外的元件的实施方案以及其中“包含”具体列出的元件的主题可以和/或确实涵盖另外的元件的实施方案。同样,表述“具有”应该理解为表述“包含”,还包括并且尤其包括表述“基本上由...组成”和“由...组成”。

本文所用的术语“核酸”是指核糖核苷酸或脱氧核糖核苷酸聚合物。核酸可以是rna或dna。其可以由单条聚合物链构成或者其可以是双链。核酸可以是天然来源的、重组来源的或合成来源的。在优选的实施方案中,核酸是双链dna。

“表达盒”是一种生成的或者合成的核酸构建体,其中具有能够实现结构基因在与这类序列相容的宿主中表达的核酸元件。表达盒至少包含启动子和任选地转录终止信号。典型的,表达盒包含待转录的核酸和启动子。有助于实现表达的另外的因子也可如本文所述使用。例如,表达盒还可包含编码引导表达的蛋白质从宿主细胞分泌的信号序列的核苷酸序列。表达盒优选是表达载体的一部分。将要用于表达待转录的核酸的宿主细胞用该表达载体转化或转染。为了允许对包含该构建体的转化细胞进行选择,可将选择标记基因便利地包括在表达载体中。本领域技术人员将认识到可对该载体组分进行修改而不会实质影响其功能。

表述“功能上相连”意指表达盒的两个或更多个元件以它们的功能能够相协调并允许编码序列(如编码区)表达的方式彼此相连。举个例子,当启动子能够确保编码序列表达时,则该启动子与所述编码序列功能上相连。根据本发明的表达盒的构建以及其各种元件的组装可使用本领域技术人员所熟知的技术,尤其是在sambrook等人(1989,molecularcloning:alaboratorymanual,nolanc.编辑,newyork:coldspringharborlaboratorypress)中描述的那些技术来进行。

本文所用的术语“上游”和“下游”是指核酸分子上的核酸元件或序列相对于所述核酸分子上的另一核酸元件或序列的位置。“上游”是指更接近核酸分子的5'端的位置,而“下游”是指更接近核酸分子的3'端的位置。在双链核酸,尤其是dna的情形中,核酸中用作基质来转录rna诸如mrna的那条链,即有义链,用来确定该核酸的5'端和3'端。因此,“上游”是在有义链的5'端的方向,而“下游”是在有义链的3'端的方向。

靶标核酸序列或氨基酸序列的“同源物”与所述靶标核酸序列或氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少93%、至少95%、至少96%、至少97%、至少98%或至少99%的同源性或同一性。氨基酸序列或核苷酸序列的“同源性”或“同一性”优选根据本发明在靶标序列的整个长度上或在靶标序列的所标明部分的整个长度上确定。当提及具体的核酸序列或氨基酸序列时,本发明通常还分别涵盖所述核酸序列或氨基酸序列的同源物。靶标核酸序列或氨基酸序列的同源物尤其是具有衍生其的靶标核酸序列或氨基酸序列的相同或基本相同的功能和活性的功能同源物。

“启动子”是允许和控制与其功能上相连的核酸序列,尤其是编码序列的转录的核酸序列。启动子含有用于结合rna聚合酶的识别序列,并且包含转录起始位点或与转录起始位点功能上相连。启动子可以是诱导型启动子,其仅在存在(或缺少)特定信号的情况下有活性,或者可以是组成活性启动子。启动子的活性可进一步通过调控元件诸如基因座控制区和增强子元件调控。

“编码序列”是编码基因产物诸如多肽或rna的核酸序列。

核酸元件的“部分”尤其包含所述核酸元件的至少5个核酸,优选至少10个、至少15个、至少20个、至少30个或至少50个核酸。核酸元件的“部分”尤其包含所述核酸元件的至少5个连续核苷酸,优选至少10个、至少15个、至少20个、至少30个或至少50个连续核苷酸。具体地讲,其包含所述核酸元件的至少1%,优选至少2%、至少3%、至少5%、至少7.5%、至少10%、至少15%、至少20%或至少25%。核酸元件的“功能部分”是所述元件能够执行该元件的预期功能的部分。例如,基因座控制区、启动子或3'增强子的功能部分能够调节,尤其是增强与其功能上相连的编码区的表达。核酸元件的部分尤其是指所述核酸元件的功能部分。

本文所用的“肽”或“多肽”是指包含至少5个氨基酸的多肽链。肽或多肽优选包含至少10个、至少15个、至少20个、至少25个、至少30个或至少35个氨基酸。本文所用的术语“肽”或“多肽”还指蛋白质,包括经翻译后修饰的肽、多肽和蛋白质。具体地讲,术语肽或多肽包括糖基化的肽和糖蛋白。术语“肽”和“多肽”在本文中可互换使用。

肽、多肽或蛋白质的部分优选包含所述肽、多肽或蛋白质的至少3个连续氨基酸,优选所述蛋白质的至少5个、至少10个、至少15个或至少20个连续氨基酸。

术语“药物组合物”及类似术语尤其是指适于施用给人的组合物,即含有药学上可接受的组分的组合物。优选地,药物组合物包含活性化合物或其盐或前药以及载体、稀释剂或药物赋形剂诸如缓冲剂、防腐剂和张力调节剂。

具体实施方式

本发明涉及包含人珠蛋白基因簇的基因座控制区的至少一部分和人aγ珠蛋白启动子的表达盒。

血红蛋白是人和动物血液中的一种金属蛋白,其使得能够运输氧和二氧化碳。血红蛋白是由四个亚基(珠蛋白)组成的多亚基球形蛋白质,每个亚基由与携带铁离子的血红素紧密结合的多肽链组成。有七种不同类型的珠蛋白亚基,并且血红蛋白的亚基组成在整个生命期间发生变化。例如,人胎儿具有血红蛋白f,其由两个珠蛋白α和两个珠蛋白γ(α2γ2)构成,而在成人中具有两个珠蛋白α和两个珠蛋白β(α2β2)的血红蛋白a占优。人珠蛋白基因簇表达不同的珠蛋白多肽,这些基因簇负责在人类不同发育状态表达不同亚基。人β珠蛋白基因簇包含基因座控制区和五种不同的珠蛋白基因,即ε-、gγ-、aγ-、δ-和β-珠蛋白基因。同样,α-珠蛋白基因簇也包含基因座控制区和ζ-、α2-、α1-和θ-珠蛋白基因。图1示出了人α-和β-珠蛋白基因簇的结构。基因簇内的每个单独的珠蛋白基因具有其特定的启动子和增强子序列,它们控制相应珠蛋白亚基的编码序列的表达。然而,这些启动子本身受基因座控制区调控。具体地讲,基因座控制区能够使启动子激活或失活,并且这种激活模式在整个生命期间变化。两种基因座控制区(α-珠蛋白基因簇的一种,β-珠蛋白基因簇中的另一种)因此编排不同珠蛋白基因在发育过程中表达,从而导致不同血红蛋白的特定亚基组成。

基因座控制区包含数个dna酶i超敏感位点(hs),这些位点负责启动子的激活和失活。已经发现,例如,β-珠蛋白基因簇的hs2控制aγ珠蛋白启动子的活性。β-珠蛋白基因簇的hs2可进一步细分为核心区和调控亚域(subdomain)。核心区是hs2中主要负责珠蛋白启动子激活的部分。调控亚域m1至m5调控核心域的效果,可以是正向调控或者负向调控。核心区处于调控亚域m1和m2之间,之后是m3至m5。具体地讲,m1和m2进一步增强核心区对aγ珠蛋白启动子的激活效果。

现在发现,使用人珠蛋白基因簇的表达元件可提供靶标产物诸如目标多肽在真核细胞,尤其是在人血细胞或衍生自人血细胞的细胞中的稳定高效表达。本发明提供一种表达盒,该表达盒包含人aγ珠蛋白启动子的至少功能部分和人α-珠蛋白或β-珠蛋白基因簇的基因座控制区的至少功能部分。该表达盒还包含编码区和/或克隆位点,所述编码区含有编码目标多肽的核酸序列,所述克隆位点用于引入这种编码区。该表达盒可进一步包含增强子区,该增强子区包含人aγ珠蛋白基因的3'增强子的至少功能部分。基因座控制区、启动子和3'增强子在表达盒中的位置均能够使得它们可调控编码区的表达,尤其是使得编码区能够表达且增强其表达。表达盒还可包含转录终止子区,编码区的转录在此终止。表达盒的元件尤其是彼此功能上相连接的。

表达盒的具体实例包含seqidno:1至5中任一者的核酸序列或由所述序列组成。相应的表达元件也在图2中示出,其中标明了表达盒的不同元件。具体地讲,hs4、hs3、hs2和hs40是人α-珠蛋白或β-珠蛋白基因簇的基因座控制区的部分。在该基因座控制区的后面,标明了人aγ珠蛋白启动子的功能部分(aγ-prom)。其后,编码序列或引入编码序列的克隆位点(cs)和包括多聚腺苷酸化信号在内的转录终止子区(γpa)在后面。在该表达盒的末尾,设置有人aγ珠蛋白基因的3'增强子的功能部分(aγ-enh)。

在某些实施方案中,该表达盒不包含β-珠蛋白内含子2,尤其是β-珠蛋白基因或任何其他珠蛋白基因的任何内含子。

aγ珠蛋白启动子

该表达盒利用人aγ珠蛋白启动子的功能部分来使得编码区(尤其是目标多肽)能表达和控制其表达。人aγ珠蛋白启动子的功能部分尤其是设置在编码区的上游。其在功能上与编码区相连,并允许编码区转录以及控制其转录。在某些实施方案中,人aγ珠蛋白启动子的功能部分涵盖早熟mrna转录开始的转录起始位点。此外,人aγ珠蛋白启动子的功能部分还可以包含5'非翻译区(5'utr)的至少一部分,尤其是人aγ珠蛋白基因的5'utr的至少一部分。在特定的实施方案中,人aγ珠蛋白启动子的功能部分至少涵盖人aγ珠蛋白基因中允许人aγ珠蛋白mrna转录的那个部分。在某些实施方案中,人aγ珠蛋白启动子的功能部分包含ccaat盒。具体地讲,人aγ珠蛋白启动子的功能部分包含人aγ珠蛋白基因相对于转录起始位点而言的核苷酸-299至-26,特别是核苷酸-299至+36、核苷酸-384至-26、或核苷酸-384至+36,或由这些核苷酸组成。具体地讲,人aγ珠蛋白启动子的功能部分包含seqidno:1中位置1123至1542的核酸序列,特别是由该核酸序列组成。还可能利用人aγ珠蛋白启动子的仍具有功能的更短片段。本领域技术人员能够确定人aγ珠蛋白启动子的合适的功能部分。具体地讲,用于确定启动子序列的活性的方法是本领域已知的并且在下面的实施例中描述。

备选地,可根据本发明使用人aγ珠蛋白启动子的所述功能部分的同源物。所述同源物优选与上面定义的核酸序列之一在其整个长度上具有至少85%、优选至少90%、至少95%、至少97%、至少98%或至少99%同一性。在某些实施方案中,该同源物与衍生其的aγ珠蛋白启动子的功能部分具有相同或实质上相同的功能和/或活性,尤其是提供的编码区表达率达到相同条件下使用衍生其的aγ珠蛋白启动子的功能部分所达到的表达率的至少75%、优选至少80%、至少85%或至少90%。

基因座控制区

基因座控制区在功能上连接至启动子区并且能够调控、尤其是增强人aγ珠蛋白启动子的功能部分的活性。基因座控制区尤其是设置在启动子区的上游。

在某些优选的实施方案中,使用人β-珠蛋白基因簇的基因座控制区或其功能部分。根据本领域知识,人β-珠蛋白基因座控制区涵盖四个红细胞特异性dna酶i超敏感位点,称为hs1至hs4,其位于该基因簇的第一个珠蛋白基因即ε-珠蛋白基因上游6至20kbp。具体地讲,hs2负责控制珠蛋白基因的表达并且被认为是构成基因座控制区的主要功能组分。人β-珠蛋白基因座控制区的hs2细分成核心元件以及进一步的调控亚域,其中核心元件位于调控亚域m1和m2之间。核心元件是β-珠蛋白基因座控制区中能够增强人aγ珠蛋白启动子的启动子活性的最小区域。

在一个优选的实施方案中,基因座控制区包含人β-珠蛋白基因簇的dna酶i超敏感位点2(hs2)的核心元件。具体地讲,人β-珠蛋白基因簇的hs2的核心元件具有seqidno:1位置906至939的核酸序列。在某些实施方案中,所述基因座控制区包含hs2的核心元件及两个相邻的调控亚域m1和m2(即人β-珠蛋白基因簇的hs2的m1-核心-m2元件)或者由它们组成。所述m1-核心-m2元件可具有seqidno:1位置742至995的核酸序列。因而其包括具有seqidno:1位置906至939的核酸序列的hs2核心区。

在另一实施方案中,基因座控制区包含人β-珠蛋白基因簇的超敏感位点2(hs2)的至少功能部分,该部分包含seqidno:1位置741至1109的核酸序列。hs2的该功能部分包含m1-核心-m2元件以及直接在其下游的额外的核酸序列。

在某些实施方案中,包含人β-珠蛋白基因簇的hs2的至少功能部分的基因座控制区还包含人β-珠蛋白基因簇的超敏感位点3(hs3)的至少一部分。具体地讲,在表达盒的基因座控制区中,hs3或其部分位于hs2或其部分的上游。hs3或其部分尤其是包含seqidno:1位置310至735的核酸序列或由该序列组成。此外,基因座控制区还可包含人β-珠蛋白基因簇的超敏感位点4(hs4)或其部分,其尤其是位于hs2和hs3(如果存在的话)的上游。在某些实施方案中,hs4或其部分包含seqidno:1位置13至294的核酸序列或由该序列组成。因而,根据本发明的表达盒的基因座控制区可在下游方向上任选地包含人β-珠蛋白基因簇的hs4的至少一部分、任选地包含h3的至少一部分并且包含hs2的至少功能部分。在备选的实施方案中,基因座控制区不包含人β-珠蛋白基因簇的超敏感位点3(hs3)。

在特定的实施方案中,基因座控制区具有选自seqidno:1的位置13至1109、seqidno:2的位置20至819、seqidno:3的位置18至386以及seqidno:4的位置13至266的核酸序列。

在另一实施方案中,基因座控制区包含人α-珠蛋白基因簇的超敏感位点40(hs40)的至少功能部分。hs40的所述部分尤其是包含hs40的核心元件或由该核心元件组成,所述核心元件可具有seqidno:5位置24至278的核酸序列。具体地讲,hs40或其部分包含seqidno:5位置7至372的核酸序列或由该序列组成。

此外,在某些实施方案中,可使用包含作为上述基因座控制区之一的同源物的核酸序列或由该核酸序列组成的基因座控制区。具体地讲,所述同源物与上述基因座控制区之一在整个长度上具有至少90%、优选至少95%、至少97%、至少98%或至少99%的序列同一性,以及/或者与衍生其的基因座控制区具有相同或实质上相同的功能。在优选的实施方案中,基因座控制区的同源物提供的编码区表达率达到在相同条件下使用衍生该同源物的基因座控制区所达到的表达率的至少75%、优选至少80%、至少85%或至少90%。

编码区

表达盒的编码区包含编码待由该表达盒表达的目标产物,尤其是目标多肽的核酸序列。编码区的核酸序列的表达由启动子区调控,因而与该启动子区在功能上相连。当将该表达盒(任选存在于载体中)引入合适的宿主细胞中时,所述宿主细胞产生由编码区的核酸序列编码的产物,尤其是多肽。

表达盒的编码区尤其含有编码目标多肽的核酸序列或由该核酸序列组成。

目标多肽可以是任何多肽,包括蛋白质。该多肽可以具有任何来源,包括哺乳动物来源的和人来源的多肽以及人造多肽。在某些实施方案中,多肽包含一个或多个糖基化位点,并且尤其是糖基化多肽诸如糖蛋白或其部分;抗体或者其衍生物或部分;肽激素,促性腺激素诸如fsh(促卵泡激素)、cg(绒毛膜促性腺激素)、lh(促黄体生成激素)和tsh(促甲状腺激素),包括它们的所有同种型和变体;红细胞生成素;血液凝固因子诸如因子vii、viii、ix或冯维勒布兰德因子;溶酶体酶和细胞因子。此外,目标多肽可选自下组中:细胞因子及其受体组中的任何蛋白质分子,例如肿瘤坏死因子tnf-α和tnf-β;肾素;人生长激素和牛生长激素;生长激素释放因子;甲状旁腺激素;促甲状腺激素;脂蛋白;α-1-抗胰蛋白酶;胰岛素a链和b链;促性腺激素,如促卵泡激素(fsh)、促黄体生成激素(lh)、促甲状腺激素和人绒毛膜促性腺激素(hcg);降钙素;胰高血糖素;凝血因子诸如因子viiic、因子ix、因子vii、组织因子和冯维勒布兰德因子;抗凝因子诸如蛋白c;心房钠尿肽;肺表面活性剂;纤溶酶原激活剂,诸如尿激酶、人尿和组织型纤溶酶原激活剂;蛙皮素;凝血酶;造血生长因子;脑啡肽酶;人巨噬细胞炎性蛋白;血清白蛋白诸如人血清白蛋白;缪勒氏管抑制物质(mullerian-inhibitingsubstance);松弛素a链和b链;松弛素原;鼠促性腺激素相关肽;血管内皮生长因子;激素或生长因子的受体;整合素;蛋白a和蛋白d;类风湿因子;神经营养因子诸如骨源神经营养因子、神经营养因子-3、神经营养因子-4、神经营养因子-5、神经营养因子-6和神经生长因子-β;血小板衍生生长因子;成纤维细胞生长因子;表皮生长因子;转化生长因子诸如tgf-α和tgf-β;胰岛素样生长因子-i和胰岛素样生长因子-ii;胰岛素样生长因子结合蛋白;cd蛋白诸如cd-3、cd-4、cd-8和cd-19;红细胞生成素(epo);骨诱导因子;免疫毒素;骨形态发生蛋白;干扰素诸如干扰素-α、干扰素-β和干扰素-γ;集落刺激因子(csf),如m-csf、gm-csf和g-csf;白介素(il),如il-1至il-12;超氧化物歧化酶;t细胞受体;表面膜蛋白;衰变加速因子;抗体和免疫粘附素;血型糖蛋白a;以及粘蛋白诸如muc1。

在某些实施方案中,目标多肽是抗体或者其部分或衍生物。具体地讲,目标多肽可以是抗体的重链或轻链或者其部分。此外,目标多肽可以是选自以下的抗体的部分或衍生物:(i)fab片段,由重链和轻链每一者的可变区和第一恒定域组成的单价片段;(ii)f(ab)2片段,包含在铰链区通过二硫键连接的两个fab片段的二价片段;(iii)fd片段,由重链的可变区和第一恒定域ch1组成;(iv)fv片段,由单个抗体臂的重链和轻链可变区组成;(v)scfv片段,由单条多肽链组成的fv片段;(vi)(fv)2片段,由两个共价连接在一起的fv片段组成;(vii)重链可变域;以及(viii)多抗体,由共价连接在一起的重链可变区和轻链可变区组成,连接的方式使得重链和轻链可变区的联合仅可在分子间进行而不会在分子内进行。在其中表达盒包含编码抗体或其部分或衍生物的编码区的实施方案中,基因座控制区尤其是包含人β-珠蛋白基因簇的hs2的至少一部分、优选人β-珠蛋白基因簇的hs2的至少一部分和hs3的至少一部分或者人β-珠蛋白基因簇的hs2的至少一部分和hs4的至少一部分,特别是人β-珠蛋白基因簇的hs2的至少一部分和hs3的至少一部分以及hs4的至少一部分。

在某些实施方案中,编码区编码不止一种多肽,尤其是两种多肽。在这些实施方案中,编码区可含有两个或更多个分开的核酸序列,这些核酸序列可转录成分开的mrna,每个核酸序列具有其自身的转录起始位点、转录终止位点和多腺苷酸化信号。备选地,编码区可含有转录成mrna的核酸序列,这些mrna包含两个或更多个分开的编码核酸序列,其各编码单独的多肽。在这些实施方案中,编码区可包含一个或多个内部核糖体进入位点,除了第一个外,每个编码核酸序列有一个位点。这些内部核糖体进入位点允许从单个转录物翻译不止一种多肽。在某些实施方案中,编码区编码两种多肽,尤其是抗体的重链和轻链。

在某些实施方案中,编码区包含编码信号肽的核酸序列,该信号肽尤其包含细胞外定位信号。编码信号肽的核酸序列可以是该编码区的唯一编码序列或者除了另外的编码序列(诸如上述编码多肽的那些核酸序列之外)还存在。信号肽尤其可诱导编码区所编码的目标多肽分泌表达。在表达期间信号肽可从剩下的多肽切除。信号肽尤其是位于包括在编码区中包含的其它编码核酸序列的上游或位于克隆位点的上游,尤其是处于编码区的起点。此外,编码信号肽的核酸序列与包含在编码区中的其他编码核酸序列一起处于阅读框中。

在特定的实施方案中,编码区包含编码目标多肽的核酸序列。

在某些实施方案中,编码区不包含报告基因或选择标记基因。在另外的实施方案中,编码区不包含编码珠蛋白或其包含珠蛋白至少20个连续氨基酸的部分的核酸序列。

克隆位点

在某些实施方案中,表达盒包含用于整合核酸序列的克隆位点。克隆位点可存在于表达盒中而不是编码区中,并且可用于将所述核酸序列引入表达盒中。此外,除了编码区以外,克隆位点还可存在于表达盒中,尤其是在其中编码区仅包含编码信号肽的核酸序列的实施方案中。

存在于表达盒中的克隆位点适于将编码区、尤其是编码目标多肽的核酸引入表达盒中。合适的克隆位点及将核酸片段引入其它核酸分子诸如表达盒或载体中的方法是本领域周知的。在某些实施方案中,克隆位点包含至少一个、尤其是至少两个、至少三个、至少四个或至少五个限制性酶识别序列。合适的限制性酶及其识别序列是本领域已知的。示例性的限制性酶为ecori、ecorv、hindiii、bamhi、xbai、pvui、kpni、bstxi、xmai、smai、noti、xhoi和clai。多克隆位点的示例性核酸序列由seqidno:1位置1559至1664的核酸序列表示。

转录终止子区

在某些实施方案中,表达盒包含转录终止子区。转录终止子区与启动子区在功能上相连并且终止编码区的转录。其设置在编码区和/或克隆位点的下游。

在特定的实施方案中,转录终止子区包含转录终止位点和/或多聚腺苷酸化信号。多聚腺苷酸化信号可以是能够在真核细胞、尤其是在人细胞中诱导成熟前mrna的多聚腺苷酸化的任何多聚腺苷酸化信号。其可包含seqidno:1中位置1725至1730的核酸序列或其同源物,或者由seqidno:1中位置1725至1730的核酸序列或其同源物组成。

增强子区

在某些实施方案中,表达盒包含增强子区,尤其是3'增强子区。3'增强子区设置在编码区和/或克隆位点的下游以及转录终止子区(如果存在的话)的下游。其与启动子区在功能上相连并且增强编码区的表达。增强子区尤其是包含人aγ珠蛋白基因的3'增强子的至少功能部分或者由其组成。在某些实施方案中,增强子区包含seqidno:1中位置2136至2881的核酸序列或其同源物,或者由seqidno:1中位置2136至2881的核酸序列或其同源物组成。在某些实施方案中,同源增强子区提供的编码区表达率达到在相同条件下使用衍生该同源增强子区的增强子区所达到的表达率的至少75%、优选至少80%、至少85%或至少90%。

包含所述表达盒的载体

在一个方面,本发明涉及包含根据本发明的表达盒的载体。该载体可以是适合于将表达盒转移进宿主细胞中的任何载体。各载体是本领域已知的。具体地讲,该载体适于转移进真核细胞诸如哺乳动物细胞、尤其是人细胞中。

除了表达盒以外,该载体可包含另外的元件。例如,该载体可包含一种或多种选择标记。在某些实施方案中,选择标记中的至少一个适于相对于不包含所述载体的宿主细胞选择包含所述载体的宿主细胞,尤其是真核宿主细胞,诸如哺乳动物宿主细胞,尤其是人宿主细胞。选择标记的合适实例是提供抗生素化合物抗性的基因。此外,该载体可包含适于在原核宿主细胞诸如大肠杆菌细胞中扩增该载体的元件。这类元件例如包括复制起点诸如cole1ori和原核选择标记诸如提供杀菌剂如氨苄青霉素抗性的基因。

在某些实施方案中,该载体为环状或线性的双链dna,尤其是环状双链dna。

在某些实施方案中,该载体包含具有编码区的表达盒,该编码区包含编码目标多肽的核酸序列。

选择标记基因

在某些实施方案中,载体还包含选择标记基因。选择标记基因不需要与表达盒的元件在功能上相连。选择标记基因使得能对包含该载体的宿主细胞进行选择。优选将含有载体的细胞在存在合适的选择剂的情况下培养,所述选择剂可减少或抑制不包含该选择标记基因的细胞的增殖。

在特定的实施方案中,选择标记基因是可扩增的选择标记基因,该可扩增选择标记基因允许标记基因扩增以及存在于同一载体上的表达盒的共同扩增。当使用可扩增的标记基因时,表达盒在转染细胞中的扩增尤其通过在存在渐增浓度的选择剂的情况下分步培养细胞来实现。在某些实施方案中,选择标记基因编码二氢叶酸还原酶(dhfr),诸如抗叶酸剂抗性dhfr变体,并且对应的选择剂为抗叶酸剂,诸如甲氨喋呤。

合适的可扩增选择标记基因及其对应的选择剂的另外的实例为:新霉素抗性基因(如氨基糖苷磷酸转移酶)和遗传霉素(g418);嘌呤霉素n-乙酰基转移酶和嘌呤霉素;金属硫蛋白和镉;cad(氨甲酰磷酸合成酶:天冬氨酸转氨甲酰酶:二氢乳清酸酶)和n-膦乙酰基-l-天冬氨酸;腺苷脱氨酶和xyl-a-或腺苷酸、2'脱氧助间型霉素;amp(腺苷酸)脱氨酶和腺嘌呤、偶氮丝胺酸、助间型霉素;ump-合酶和6-氮尿苷、吡唑呋喃(pyrazofuran);imp5'-脱氢酶和霉酚酸;黄嘌呤-鸟嘌呤-磷酸核糖转移酶和有限黄嘌呤的霉酚酸;突变hgprt酶或突变胸苷激酶和次黄嘌呤、氨基喋呤和胸苷(hat);胸苷酸合成酶和5-氟脱氧尿苷;p-糖蛋白170(mdr1)和阿霉素、长春新碱、秋水仙碱;核糖核苷酸还原酶和阿非迪霉素;谷氨酰胺合成酶和甲硫氨酸砜亚胺(msx);天冬酰胺合成酶和β-天冬氨酰异羟肟酸、脲基丙氨酸、5'氮杂胞啶;精氨琥珀酸合成酶和刀豆氨酸;鸟氨酸脱羧酶和α-二氟甲基-鸟氨酸;hmg-coa-还原酶和康帕丁;n-乙酰葡糖氨基转移酶和衣霉素;苏氨酰-trna合成酶和疏螺体素(borrelidin);以及na+k+-atp酶和乌本苷。

包含所述表达盒或所述载体的宿主细胞

在一个另外的方面,本发明提供包含根据本发明的表达盒或根据本发明的载体的宿主细胞。宿主细胞可以是适于用表达盒或载体转染并且尤其是适于生产目标多肽的任何细胞。在某些实施方案中,宿主细胞源于已建立的表达细胞系。宿主细胞尤其是真核细胞,诸如哺乳动物细胞,尤其是人细胞,或者源于这些细胞的细胞。具体地讲,宿主细胞是血细胞(诸如白细胞)、血球前体细胞或白血病细胞、或者源于它们的细胞。在某些实施方案中,宿主细胞是白细胞起源的细胞。

在特定的实施方案中,宿主细胞源于人髓性白血病细胞。宿主细胞的具体实例为k562、nm-f9、nm-d4、nm-h9d8、nm-h9d8-e6、nm-h9d8-e6q12、gt-2x、gt-5s以及源于所述宿主细胞中任一者的细胞。k562是存在于美国典型培养物保藏中心(americantypeculturecollection)的人髓性白血病细胞系(atccccl-243)。其余的细胞系源于k562细胞并且已经针对特定的糖基化特征进行了选择。可在熟知的适于k562的条件下培养和维持源于k562的细胞系。除了k562细胞以外的所有这些细胞系均根据布达佩斯条约进行了保藏。保藏信息可见于本说明书末尾。

示例性的宿主细胞还例如在wo2008/028686中进行了描述。在某些实施方案中,针对具有特定糖基化模式的糖蛋白的表达对宿主细胞进行了优化。具体地讲,编码区中的密码子用法和/或启动子以及表达盒或载体的另外的元件与所使用的宿主细胞的类型相容,尤其是针对所使用的宿主细胞的类型进行了优化。

在某些实施方案中,宿主细胞是分离的宿主细胞。在特定的实施方案中,宿主细胞不存在于人体或动物体内。

可用根据本发明的表达盒或载体瞬时或稳定地转染宿主细胞。稳定转染是优选的,尤其是通过将表达盒整合进宿主细胞的基因组中。稳定或瞬时转染的转染方法是本领域周知的。在某些实施方案中,用包含具有编码区的表达盒的载体转染宿主细胞,所述编码区包含编码目标多肽的核酸序列。

生产方法

根据另一方面,本发明提供重组生产目标多肽的方法,包括以下步骤:

(a)提供宿主细胞,该宿主细胞包含表达盒,所述表达盒包含功能上彼此相连的以下元件:

(i)包含人β-珠蛋白基因簇或人α-珠蛋白基因簇的基因座控制区的至少功能部分的基因座控制区;

(ii)包含人aγ珠蛋白基因的启动子的至少功能部分的启动子区;以及

(iii)包含编码目标多肽的核酸序列的编码区;

(b)在宿主细胞表达目标多肽的条件下培养宿主细胞;以及

(c)分离所述目标多肽。

宿主细胞尤其是包含本文所定义的表达盒,该表达盒具有本文所定义的元件中的一种或多种。

适合于培养宿主细胞以及表达目标多肽的条件取决于本方法中使用的具体的宿主细胞、载体和表达盒。技术人员可容易地确定合适的条件,而且,对于多种宿主细胞而言,这些条件也已经是本领域已知的。在某些实施方案中,用包含所述表达盒并且另外包含选择标记基因的载体转染宿主细胞。在这些实施方案中,步骤(b)中的培养条件可包括在细胞培养基中存在对应的选择剂。

分离目标多肽尤其是指将目标多肽与细胞培养物中的其余组分分离。在某些实施方案中,表达盒的编码区还包含编码用于分泌表达的信号肽的核酸序列,并且在步骤(b)中宿主细胞分泌目标多肽。在这些实施方案中,步骤(c)尤其包括将包含目标多肽的细胞培养基与宿主细胞分离,例如通过离心分离,并将目标多肽与细胞培养基的一些或大多数组分分离,例如通过色谱法分离。适于分离目标多肽的方法和手段是本领域已知的,并且可由技术人员容易地应用。

在某些实施方案中,生产目标多肽的方法在步骤(c)后还包括以下步骤:

(d)将目标多肽配制为药物组合物。

将目标多肽配制为药物组合物特别地包括交换包含目标多肽的组合物的缓冲溶液或缓冲溶液组分。此外,配制步骤可包括冻干目标多肽。具体地讲,将目标多肽转移进仅包含药学上可接受的成分的组合物中。

本文描述的数值范围包括限定该范围的数字。本文提供的各标题不限制本发明的各个方面或实施方案,这些方面或实施方案可参考说明书作为一个整体来阅读。根据一个实施方案,本文在方法的情形下描述为包括某些步骤或者在组合物的情形下描述为包含某些成分的主题是指由各步骤或者成分组成的主题。优选的是选择和组合本文所述的具体方面和实施方案,并且具体实施方案的各组合所产生的具体主题也属于本公开内容。

附图

图1示出了包括基因座控制区(lcr)和不同的珠蛋白基因的人珠蛋白基因簇的结构,该基因座控制区具有不同的dna酶超敏感位点(hs)。a:染色体11上的人β-珠蛋白基因簇;b:染色体16上的人α-珠蛋白基因簇。

图2示出了载体phbg1a-e中所用的示例性表达盒的元件。hs:dna酶超敏感位点;aγ-prom:aγ珠蛋白基因的启动子;cs:编码序列/克隆位点;γpa:aγ珠蛋白基因的多聚腺苷酸化信号;aγ-enh:aγ珠蛋白基因的3'增强子。

图3示出了在瞬时转染包含因子vii的编码序列的不同载体后获得的因子vii蛋白收率。将包含图2中所示的表达盒的载体瞬时转染进nm-h9d8细胞中,该载体具有引入进克隆位点的因子vii的编码序列以及作为可扩增选择标记的编码dhfr的基因。在培养后测定因子vii的总收率。pefdhfrmut(-):具有因子vii编码序列的对照载体。示出了三次独立实验的结果。

图4示出了编码抗体的根据本发明的载体和对照载体稳定转染的比较。用对照载体pef或根据本发明的载体phb稳定转染nm-h9d8-e6q12细胞。这两种载体均包含抗体的编码序列和作为可扩增选择标记的编码dhfr的基因。对于载体在细胞中的扩增,逐步增加培养基中的选择压力,即选择剂甲氨喋呤的浓度。该图示出了在给定培养时间后对于各载体可能的最大选择压力。更高的可能选择压力(甲氨喋呤浓度)指示载体在转染细胞中的扩增更强,这应该导致目标蛋白产量更高。

图5示出了图4的稳定转染的细胞的群体生产力。对于根据本发明的载体和对照载体示出了不同选择压力下每天每细胞的抗体产量(以皮克计)。

图6示出了图4的稳定转染细胞由于选择压力扩增载体而引起的生产力增加。对于起始细胞群、扩增后的细胞群以及扩增后的单细胞克隆示出了不同选择压力下每天每细胞的抗体产量(以皮克计)。a:对照载体pef;b:根据本发明的载体phb。

实施例

实施例1:包含人aγ珠蛋白启动子和人珠蛋白基因簇的基因座控制区的元件的载体的构建

为了构建珠蛋白载体,移除亲本载体(如具有嘌呤霉素或新霉素抗性基因或dhfr基因作为选择标记的pef)的增强子和启动子区。合成人aγ珠蛋白启动子、多聚腺苷酸化信号和3'增强子区以及人珠蛋白基因簇的基因座控制区的不同构建体并在适当位点克隆进该载体中。图2示出了所构建的载体的表达盒的示例性构建体。然后将编码目标多肽的核酸序列引入进克隆位点中。

实施例2:珠蛋白载体的瞬时转染

ltx和plustm试剂,根据制造商的说明进行瞬时转染。简而言之,在细胞的对数生长期期间将2x105个细胞接种于6孔板中。将质粒dna稀释于opti-memi低血清培养基和plustm试剂中。在温育期(15分钟)后,将ltx添加至该溶液。进一步温育(30分钟)后,将该混合物滴进该细胞悬浮液中。72小时后通过elisa分析表达。相比于载体pefdhfrmut(-),载体phbg1cdhfr、phbg1ddhfr和phbg1edhfr实现较高的蛋白质滴度(图3)。

实施例3:珠蛋白载体的稳定转染

根据制造商的说明,使用分别编码抗体重链和轻链的两种表达质粒的质粒dna(二者均线性化)通过nucleofection(amaxa公司的nucleofectortm技术)进行细胞系nm-h9d8的转染。对于抗体产生群体的选择和扩增,添加渐增浓度的甲氨喋呤和嘌呤霉素,并针对活性抗体分子的分泌对群体进行筛选。

用phb质粒转染的群体可在较短的时间周期内扩增(图4),并导致较高的蛋白质水平(图5),这可分别针对所得的单个细胞克隆进行确认(图6)。

保藏生物材料的鉴定

细胞系dsmacc2606和dsmacc2605由nemodbiotherapeutics有限两合公司(nemodbiotherapeuticsgmbh&co.kg,10,13125berlin(de))于2003年8月14日保藏于德国布伦瑞克的德国微生物菌种保藏中心(dsmz-deutschesammlungvonmikroorganismenundzellkulturengmbh,mascheroderweg1b,38124braunschweig(de))。glycotope公司有权引用这些生物材料,因为它们同时由nemodbiotherapeutics有限两合公司转让给glycotope有限公司。

细胞系dsmacc2806、dsmacc2807、dsmacc2856、dsmacc2858和dsmacc3078由glycotope有限公司(glycotopegmbh,10,13125berlin(de))于下面表格中标明的日期保藏于德国布伦瑞克的德国微生物菌种保藏中心(dsmz-deutschesammlungvonmikroorganismenundzellkulturengmbh,inhoffenstraβe7b,38124braunschweig(de))。

序列表

<110>glycotopegmbh

<120>包含珠蛋白基因簇的调节元件的真核表达载体

<130>56981k

<150>lu92686

<151>2015-03-31

<150>ep15161922.8

<151>2015-03-31

<160>5

<170>bissap1.0

<210>1

<211>2899

<212>dna

<213>人工序列

<220>

<221>来源

<222>1..2899

<223>/分子类型="dna"

/注释="表达盒hbg1a"

/生物体="人工序列"

<400>1

tcgcgatgatcaacttttagagagctcttggggaccccagtacacaagaggggacgcagg60

gtatatgtagacatctcattctttttcttagtgtgagaataagaatagccatgacctgag120

tttatagacaatgagcccttttctctctcccactcagcagctatgagatggcttgccctg180

cctctctactaggctgactcactccaaggcccagcaatgggcagggctctgtcagggctt240

tgatagcactatctgcagagccagggccgagaaggggtggactccagagactctcctgat300

cattaattaagctactgctcatgggccctgtgctgcactgatgaggaggatcagatggat360

ggggcaatgaagcaaaggaatcattctgtggataaaggagacagccatgaagaagtctat420

gactgtaaatttgggagcaggagtctctaaggacttggatttcaaggaattttgactcag480

caaacacaagaccctcacggtgactttgcgagctggtgtgccagatgtgtctatcagagg540

ttccagggagggtggggtggggtcagggctggccaccagctatcagggcccagatgggtt600

ataggctggcaggctcagataggtggttaggtcaggttggtggtgctgggtggagtccat660

gactcccaggagccaggagagatagaccatgagtagagggcagacatgggaaaggtgggg720

gaggcacagcatagcttaattaagccagtttttccttagttcctgttacatttctgtgtg780

tctccattagtgacctcccatagtccaagcatgagcagttctggccaggcccctgtcggg840

gtcagtgccccacccccgccttctggttctgtgtaaccttctaagcaaaccttctggctc900

aagcacagcaatgctgagtcatgatgagtcatgctgaggcttagggtgtgtgcccagatg960

ttctcagcctagagtgatgactcctatctgggtccccagcaggatgcttacagggcagat1020

ggcaaaaaaaaggagaagctgaccacctgactaaaactccacctcaaacggcatcataaa1080

gaaaatggatgcctgagacagaatgtgacgcatttaaatgatcctcactggagctacaga1140

caagaaggtaaaaaacggctgacaaaagaagtcctggtatcctctatgatgggagaagga1200

aactagctaaagggaagaataaattagagaaaaactggaatgactgaatcggaacaaggc1260

aaaggctataaaaaaaattaagcagcagtatcctcttgggggccccttccccacactatc1320

tcaatgcaaatatctgtctgaaacggtccctggctaaactccacccatgggttggccagc1380

cttgccttgaccaatagccttgacaaggcaaacttgaccaatagtcttagagtatccagt1440

gaggccaggggccggcggctggctagggatgaagaataaaaggaagcacccttcagcagt1500

tccacacactcgcttctggaacgtctgagattatcaataagctcctagtccagacgccaa1560

gcttggtaccgagctcggatccactagtaacggccggccagtgtgctggaattctgcaga1620

tatccatcacactgcccgggcggccgctcgagcatcgatctagagcctcttgcccatgat1680

tcagagctttcaaggataggctttattctgcaagcaatacaaataataaatctattctgc1740

tgagagatcacacatgattttcttcagctcttttttttacatctttttaaatatatgagc1800

cacaaagggtttatattgagggaagtgtgtatgtgtatttctgcatgcctgtttgtgttt1860

gtggtgtgtgcatgctcctcatttatttttatatgagatgtgcattttgatgagcaaata1920

aaagcagtaaagacacttgtacacgggagttctgcaagtgggagtaaatggtgttggaga1980

aatccggtgggaagaaagacctctataggacaggacttctcagaaacagatgttttggaa2040

gagatgggaaaaggttcagtgaagacctgggggctggattgattgcagctgagtagcaag2100

gatggttcttaatgaagggaaagtgttccaagctggaattcaaggtttagtcaggtgtag2160

caattctattttattaggaggaatactatttctaatggcacttagcttttcacagccctt2220

gtggatgcctaagaaagtgaaattaatcccatgccctcaagtgtgcagattggtcacagc2280

atttcaagggagagacctcattgtaagactctgggggaggtggggacttaggtgtaagaa2340

atgaatcagcagaggctcacaagtcagcatgagcatgttatgtctgagaaacagaccagc2400

actgtgagatcaaaatgtagtgggaagaatttgtacaacattaattggaaggtttactta2460

atggaatttttgtatagttggatgttagtgcatctctataagtaagagtttaatatgatg2520

gtgttacggacctggtgtttgtgtctcctcaaaattcacatgctgaatccccaactccca2580

actgaccttatctgtgggggaggcttttgaaaagtaattaggtttagctgagctcataag2640

agcagatccccatcataaaattattttccttatcagaagcagagagacaagccatttctc2700

tttcctcccggtgaggacacagtgagaagtccgccatctgcaatccaggaagagaaccct2760

gaccacgagtcagccttcagaaatgtgagaaaaaactctgttgttgaagccacccagtct2820

tttgtattttgttatagcaccttacactgagtaaggcagatgaagaaggagaaaaaaata2880

acagctggttaactacgta2899

<210>2

<211>2609

<212>dna

<213>人工序列

<220>

<221>来源

<222>1..2609

<223>/分子类型="dna"

/注释="表达盒hbg1b"

/生物体="人工序列"

<400>2

tcgcgatgatcattaattaagctactgctcatgggccctgtgctgcactgatgaggagga60

tcagatggatggggcaatgaagcaaaggaatcattctgtggataaaggagacagccatga120

agaagtctatgactgtaaatttgggagcaggagtctctaaggacttggatttcaaggaat180

tttgactcagcaaacacaagaccctcacggtgactttgcgagctggtgtgccagatgtgt240

ctatcagaggttccagggagggtggggtggggtcagggctggccaccagctatcagggcc300

cagatgggttataggctggcaggctcagataggtggttaggtcaggttggtggtgctggg360

tggagtccatgactcccaggagccaggagagatagaccatgagtagagggcagacatggg420

aaaggtgggggaggcacagcatagcttaattaagccagtttttccttagttcctgttaca480

tttctgtgtgtctccattagtgacctcccatagtccaagcatgagcagttctggccaggc540

ccctgtcggggtcagtgccccacccccgccttctggttctgtgtaaccttctaagcaaac600

cttctggctcaagcacagcaatgctgagtcatgatgagtcatgctgaggcttagggtgtg660

tgcccagatgttctcagcctagagtgatgactcctatctgggtccccagcaggatgctta720

cagggcagatggcaaaaaaaaggagaagctgaccacctgactaaaactccacctcaaacg780

gcatcataaagaaaatggatgcctgagacagaatgtgacgcatttaaatgatcctcactg840

gagctacagacaagaaggtaaaaaacggctgacaaaagaagtcctggtatcctctatgat900

gggagaaggaaactagctaaagggaagaataaattagagaaaaactggaatgactgaatc960

ggaacaaggcaaaggctataaaaaaaattaagcagcagtatcctcttgggggccccttcc1020

ccacactatctcaatgcaaatatctgtctgaaacggtccctggctaaactccacccatgg1080

gttggccagccttgccttgaccaatagccttgacaaggcaaacttgaccaatagtcttag1140

agtatccagtgaggccaggggccggcggctggctagggatgaagaataaaaggaagcacc1200

cttcagcagttccacacactcgcttctggaacgtctgagattatcaataagctcctagtc1260

cagacgccaagcttggtaccgagctcggatccactagtaacggccggccagtgtgctgga1320

attctgcagatatccatcacactgcccgggcggccgctcgagcatcgatctagagcctct1380

tgcccatgattcagagctttcaaggataggctttattctgcaagcaatacaaataataaa1440

tctattctgctgagagatcacacatgattttcttcagctcttttttttacatctttttaa1500

atatatgagccacaaagggtttatattgagggaagtgtgtatgtgtatttctgcatgcct1560

gtttgtgtttgtggtgtgtgcatgctcctcatttatttttatatgagatgtgcattttga1620

tgagcaaataaaagcagtaaagacacttgtacacgggagttctgcaagtgggagtaaatg1680

gtgttggagaaatccggtgggaagaaagacctctataggacaggacttctcagaaacaga1740

tgttttggaagagatgggaaaaggttcagtgaagacctgggggctggattgattgcagct1800

gagtagcaaggatggttcttaatgaagggaaagtgttccaagctggaattcaaggtttag1860

tcaggtgtagcaattctattttattaggaggaatactatttctaatggcacttagctttt1920

cacagcccttgtggatgcctaagaaagtgaaattaatcccatgccctcaagtgtgcagat1980

tggtcacagcatttcaagggagagacctcattgtaagactctgggggaggtggggactta2040

ggtgtaagaaatgaatcagcagaggctcacaagtcagcatgagcatgttatgtctgagaa2100

acagaccagcactgtgagatcaaaatgtagtgggaagaatttgtacaacattaattggaa2160

ggtttacttaatggaatttttgtatagttggatgttagtgcatctctataagtaagagtt2220

taatatgatggtgttacggacctggtgtttgtgtctcctcaaaattcacatgctgaatcc2280

ccaactcccaactgaccttatctgtgggggaggcttttgaaaagtaattaggtttagctg2340

agctcataagagcagatccccatcataaaattattttccttatcagaagcagagagacaa2400

gccatttctctttcctcccggtgaggacacagtgagaagtccgccatctgcaatccagga2460

agagaaccctgaccacgagtcagccttcagaaatgtgagaaaaaactctgttgttgaagc2520

cacccagtcttttgtattttgttatagcaccttacactgagtaaggcagatgaagaagga2580

gaaaaaaataacagctggttaactacgta2609

<210>3

<211>2176

<212>dna

<213>人工序列

<220>

<221>来源

<222>1..2176

<223>/分子类型="dna"

/注释="表达盒hbg1c"

/生物体="人工序列"

<400>3

tcgcgatgatcattaattaagccagtttttccttagttcctgttacatttctgtgtgtct60

ccattagtgacctcccatagtccaagcatgagcagttctggccaggcccctgtcggggtc120

agtgccccacccccgccttctggttctgtgtaaccttctaagcaaaccttctggctcaag180

cacagcaatgctgagtcatgatgagtcatgctgaggcttagggtgtgtgcccagatgttc240

tcagcctagagtgatgactcctatctgggtccccagcaggatgcttacagggcagatggc300

aaaaaaaaggagaagctgaccacctgactaaaactccacctcaaacggcatcataaagaa360

aatggatgcctgagacagaatgtgacgcatttaaatgatcctcactggagctacagacaa420

gaaggtaaaaaacggctgacaaaagaagtcctggtatcctctatgatgggagaaggaaac480

tagctaaagggaagaataaattagagaaaaactggaatgactgaatcggaacaaggcaaa540

ggctataaaaaaaattaagcagcagtatcctcttgggggccccttccccacactatctca600

atgcaaatatctgtctgaaacggtccctggctaaactccacccatgggttggccagcctt660

gccttgaccaatagccttgacaaggcaaacttgaccaatagtcttagagtatccagtgag720

gccaggggccggcggctggctagggatgaagaataaaaggaagcacccttcagcagttcc780

acacactcgcttctggaacgtctgagattatcaataagctcctagtccagacgccaagct840

tggtaccgagctcggatccactagtaacggccggccagtgtgctggaattctgcagatat900

ccatcacactgcccgggcggccgctcgagcatcgatctagagcctcttgcccatgattca960

gagctttcaaggataggctttattctgcaagcaatacaaataataaatctattctgctga1020

gagatcacacatgattttcttcagctcttttttttacatctttttaaatatatgagccac1080

aaagggtttatattgagggaagtgtgtatgtgtatttctgcatgcctgtttgtgtttgtg1140

gtgtgtgcatgctcctcatttatttttatatgagatgtgcattttgatgagcaaataaaa1200

gcagtaaagacacttgtacacgggagttctgcaagtgggagtaaatggtgttggagaaat1260

ccggtgggaagaaagacctctataggacaggacttctcagaaacagatgttttggaagag1320

atgggaaaaggttcagtgaagacctgggggctggattgattgcagctgagtagcaaggat1380

ggttcttaatgaagggaaagtgttccaagctggaattcaaggtttagtcaggtgtagcaa1440

ttctattttattaggaggaatactatttctaatggcacttagcttttcacagcccttgtg1500

gatgcctaagaaagtgaaattaatcccatgccctcaagtgtgcagattggtcacagcatt1560

tcaagggagagacctcattgtaagactctgggggaggtggggacttaggtgtaagaaatg1620

aatcagcagaggctcacaagtcagcatgagcatgttatgtctgagaaacagaccagcact1680

gtgagatcaaaatgtagtgggaagaatttgtacaacattaattggaaggtttacttaatg1740

gaatttttgtatagttggatgttagtgcatctctataagtaagagtttaatatgatggtg1800

ttacggacctggtgtttgtgtctcctcaaaattcacatgctgaatccccaactcccaact1860

gaccttatctgtgggggaggcttttgaaaagtaattaggtttagctgagctcataagagc1920

agatccccatcataaaattattttccttatcagaagcagagagacaagccatttctcttt1980

cctcccggtgaggacacagtgagaagtccgccatctgcaatccaggaagagaaccctgac2040

cacgagtcagccttcagaaatgtgagaaaaaactctgttgttgaagccacccagtctttt2100

gtattttgttatagcaccttacactgagtaaggcagatgaagaaggagaaaaaaataaca2160

gctggttaactacgta2176

<210>4

<211>2054

<212>dna

<213>人工序列

<220>

<221>来源

<222>1..2054

<223>/分子类型="dna"

/注释="表达盒hbg1d"

/生物体="人工序列"

<400>4

tcgcgatgatcaaagccagtttttccttagttcctgttacatttctgtgtgtctccatta60

gtgacctcccatagtccaagcatgagcagttctggccaggcccctgtcggggtcagtgcc120

ccacccccgccttctggttctgtgtaaccttctaagcaaaccttctggctcaagcacagc180

aatgctgagtcatgatgagtcatgctgaggcttagggtgtgtgcccagatgttctcagcc240

tagagtgatgactcctatctgggtccatttaaatgatcctcactggagctacagacaaga300

aggtaaaaaacggctgacaaaagaagtcctggtatcctctatgatgggagaaggaaacta360

gctaaagggaagaataaattagagaaaaactggaatgactgaatcggaacaaggcaaagg420

ctataaaaaaaattaagcagcagtatcctcttgggggccccttccccacactatctcaat480

gcaaatatctgtctgaaacggtccctggctaaactccacccatgggttggccagccttgc540

cttgaccaatagccttgacaaggcaaacttgaccaatagtcttagagtatccagtgaggc600

caggggccggcggctggctagggatgaagaataaaaggaagcacccttcagcagttccac660

acactcgcttctggaacgtctgagattatcaataagctcctagtccagacgccaagcttg720

gtaccgagctcggatccactagtaacggccggccagtgtgctggaattctgcagatatcc780

atcacactgcccgggcggccgctcgagcatcgatctagagcctcttgcccatgattcaga840

gctttcaaggataggctttattctgcaagcaatacaaataataaatctattctgctgaga900

gatcacacatgattttcttcagctcttttttttacatctttttaaatatatgagccacaa960

agggtttatattgagggaagtgtgtatgtgtatttctgcatgcctgtttgtgtttgtggt1020

gtgtgcatgctcctcatttatttttatatgagatgtgcattttgatgagcaaataaaagc1080

agtaaagacacttgtacacgggagttctgcaagtgggagtaaatggtgttggagaaatcc1140

ggtgggaagaaagacctctataggacaggacttctcagaaacagatgttttggaagagat1200

gggaaaaggttcagtgaagacctgggggctggattgattgcagctgagtagcaaggatgg1260

ttcttaatgaagggaaagtgttccaagctggaattcaaggtttagtcaggtgtagcaatt1320

ctattttattaggaggaatactatttctaatggcacttagcttttcacagcccttgtgga1380

tgcctaagaaagtgaaattaatcccatgccctcaagtgtgcagattggtcacagcatttc1440

aagggagagacctcattgtaagactctgggggaggtggggacttaggtgtaagaaatgaa1500

tcagcagaggctcacaagtcagcatgagcatgttatgtctgagaaacagaccagcactgt1560

gagatcaaaatgtagtgggaagaatttgtacaacattaattggaaggtttacttaatgga1620

atttttgtatagttggatgttagtgcatctctataagtaagagtttaatatgatggtgtt1680

acggacctggtgtttgtgtctcctcaaaattcacatgctgaatccccaactcccaactga1740

ccttatctgtgggggaggcttttgaaaagtaattaggtttagctgagctcataagagcag1800

atccccatcataaaattattttccttatcagaagcagagagacaagccatttctctttcc1860

tcccggtgaggacacagtgagaagtccgccatctgcaatccaggaagagaaccctgacca1920

cgagtcagccttcagaaatgtgagaaaaaactctgttgttgaagccacccagtcttttgt1980

attttgttatagcaccttacactgagtaaggcagatgaagaaggagaaaaaaataacagc2040

tggttaactacgta2054

<210>5

<211>2160

<212>dna

<213>人工序列

<220>

<221>来源

<222>1..2160

<223>/分子类型="dna"

/注释="表达盒hbg1e"

/生物体="人工序列"

<400>5

tcgcgatgctctcaggaagaccctctggaacctatcagggaccacagtcagccaggcaag60

cacatctgcccaagccaagggtggaggcatgcagctgtgggggtctgtgaaaacacttga120

gggagcagataactgggccaaccatgactcagtgcttctggaggccaacaggactgctga180

gtcatcctgtgggggtggaggtgggacaagggaaaggggtgaatggtactgctgattaca240

acctctggtgctgcctccccctcctgtttatctgagagggaaggccatgcccaaagtgtt300

cacagccaggcttcaggggcaaagcctgacccagacagtaaatacgttcttcatctggag360

ctgaagaaattcatttaaatgatcctcactggagctacagacaagaaggtaaaaaacggc420

tgacaaaagaagtcctggtatcctctatgatgggagaaggaaactagctaaagggaagaa480

taaattagagaaaaactggaatgactgaatcggaacaaggcaaaggctataaaaaaaatt540

aagcagcagtatcctcttgggggccccttccccacactatctcaatgcaaatatctgtct600

gaaacggtccctggctaaactccacccatgggttggccagccttgccttgaccaatagcc660

ttgacaaggcaaacttgaccaatagtcttagagtatccagtgaggccaggggccggcggc720

tggctagggatgaagaataaaaggaagcacccttcagcagttccacacactcgcttctgg780

aacgtctgagattatcaataagctcctagtccagacgccaagcttggtaccgagctcgga840

tccactagtaacggccggccagtgtgctggaattctgcagatatccatcacactgcccgg900

gcggccgctcgagcatcgatctagagcctcttgcccatgattcagagctttcaaggatag960

gctttattctgcaagcaatacaaataataaatctattctgctgagagatcacacatgatt1020

ttcttcagctcttttttttacatctttttaaatatatgagccacaaagggtttatattga1080

gggaagtgtgtatgtgtatttctgcatgcctgtttgtgtttgtggtgtgtgcatgctcct1140

catttatttttatatgagatgtgcattttgatgagcaaataaaagcagtaaagacacttg1200

tacacgggagttctgcaagtgggagtaaatggtgttggagaaatccggtgggaagaaaga1260

cctctataggacaggacttctcagaaacagatgttttggaagagatgggaaaaggttcag1320

tgaagacctgggggctggattgattgcagctgagtagcaaggatggttcttaatgaaggg1380

aaagtgttccaagctggaattcaaggtttagtcaggtgtagcaattctattttattagga1440

ggaatactatttctaatggcacttagcttttcacagcccttgtggatgcctaagaaagtg1500

aaattaatcccatgccctcaagtgtgcagattggtcacagcatttcaagggagagacctc1560

attgtaagactctgggggaggtggggacttaggtgtaagaaatgaatcagcagaggctca1620

caagtcagcatgagcatgttatgtctgagaaacagaccagcactgtgagatcaaaatgta1680

gtgggaagaatttgtacaacattaattggaaggtttacttaatggaatttttgtatagtt1740

ggatgttagtgcatctctataagtaagagtttaatatgatggtgttacggacctggtgtt1800

tgtgtctcctcaaaattcacatgctgaatccccaactcccaactgaccttatctgtgggg1860

gaggcttttgaaaagtaattaggtttagctgagctcataagagcagatccccatcataaa1920

attattttccttatcagaagcagagagacaagccatttctctttcctcccggtgaggaca1980

cagtgagaagtccgccatctgcaatccaggaagagaaccctgaccacgagtcagccttca2040

gaaatgtgagaaaaaactctgttgttgaagccacccagtcttttgtattttgttatagca2100

ccttacactgagtaaggcagatgaagaaggagaaaaaaataacagctggttaactacgta2160

pct/ro/134表

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1