编码具有人独特型的啮齿动物抗体的多核苷酸以及包含所述多核苷酸的动物的制作方法
【专利说明】编码具有人独特型的啮齿动物抗体的多核苷酸以及包含所 述多核苷酸的动物
[0001] 相关申请的交叉引用
[0002] 本申请要求2012年12月14日提交的美国临时专利申请U.S.S.N. 61/737,371的 优先权。本申请明确地以全文引用的方式并入本文中。 发明领域
[0003] 本发明涉及可用于在啮齿动物中产生具有人独特型的免疫球蛋白的多核苷酸,尤 其是嵌合多核苷酸。本发明还涉及包含此类多核苷酸的啮齿动物细胞。
[0004] 参考序列表
[0005] 在此专利文件中,以在2012年12月12日创建(大小3MB)并且命名为 "189314-US_ST25. txt"的txt文件提供序列表。此文件的内容以全文引用的方式并入本文 中。
[0006] 发明背景
[0007] 已证明人单克隆抗体在治疗应用中作为常规大小的IgG、单链或者结构域模块是 无价的 1A尽管成功,但在它们的产生中仍然存在着主要缺点,其依赖于可获得的人材料的 特异性选择以及个体产物的后续修饰,或者转基因动物(主要是小鼠)的有限可用性的免 疫 3。靶抗原限制对转基因小鼠以及大的转基因动物(例如牛)的使用而言普遍是适当的, 而新的特异性的开发是受公司控制的 4_7。
[0008] 在20多年前,通过在种系构型中稳定地插入重链基因,开创了在转基因小鼠中人 免疫球蛋白(Ig)基因的DNA重排和表达 8。虽然在这些早期动物中获得了人抗体库,但是 导致人Ig的较高表达水平和专一产生的主要改进结合了两种新策略:在胚胎干(ES)细胞 中基因敲除 9以及在人工染色体上基因座延伸1Q。
[0009] 通过在ES细胞中基因靶向,内源性Ig基因的沉默产生若干失活小鼠系,其没有重 排它们的IgH和Ig κ基因座的能力或者不产生完全功能性的IgH、Ig κ或Ig λ产物(总 结于3)。近来设计锌指核酸酶(ZFN)用以在Ig基因中产生位点特异性双链断裂,其通过缺 失和非同源的DNA修复使得基因破坏。将ZFN质粒注入受精卵产生Ig沉默的大鼠和具有 IgH和IgL破坏的兔1η3。
[0010] 抗体的有效表达需要免疫球蛋白基因座中在各种位置处的功能性调节元件。通 过核酸酶消化和对降解的超敏性,已经在多个活性基因附近鉴定增强子序列。超敏位点 可以在启动子序列之前,并且它们的活性强度与该DNA序列相关。如果增强子功能存在, 则与报告基因的连锁显现出升高的转录(Mundt等人,J. Immunol.,,166, 3315[2001]。 在IgH基因座中,已经鉴定出两个重要的转录或表达调节子,即在基因座末端的E μ 和3'E (Pettersson等人,Nature,344,165 [1990])。在小鼠中,整个3'调节区(包含 hs3a、hsl,2、hs3b和hs4)的去除容许正常的早期B细胞发育但是消除了类别转换重 组(Vincent-Fabert等人,Blood, 116, 1895[2010])并且可能防止体细胞超突变的优化 (Pruzina 等人,Protein Engineering, Design and Selection, I, [2011]) 〇
[0011] 当使用转基因的人IgH基因时,实现最佳的同种型表达的调节性功能是特别适合 的。然而,在许多实验室中,通常仅仅提供hsl,2元件的具有不完全3'E区的转基因构建体, 即使在内源性IgH基因座被敲除时,也导致在转基因小鼠中令人失望的表达水平。这可能是 为什么迄今为止从基因工程小鼠产生抗原特异性完全人IgG效率低的一个原因 。(Lonberg 等人,Nature 368, 856 [1994] ;Nicholson 等人,J. Immunol. ,163, 6898 [1999] ;Davis 等人, Cancer Metastasis Rev. 18, 421 [1999] ;Pruzina等人,Protein Engineering, Design and Selection,1, [2011]。
[0012] 在大鼠中,仅对3' E区进行了欠佳地分析。小鼠和大鼠序列的比较不容许鉴定 hs4, hs4为更下游的具有附加重要调节序列的关键第4E元件(Chatterjee等人,J. Biol. Chem.,286, 29303[2011])。这可能意味着大鼠中并不存在该区,并且也许不如在小鼠中重 要,或者在所分析的大鼠基因组序列中可能并不存在该区。
[0013] 仍然需要使用转基因动物优化产生具有人独特型的免疫球蛋白或抗体的方法和 材料,其可用于在范围广泛的疾病领域对人进行治疗。
【发明内容】
[0014] 本文公开新型多核苷酸,其包含编码嵌合免疫球蛋白链特别是用于产生转基因动 物的嵌合重链的核酸序列。因为缺乏3'增强子的转基因座导致受损的同种型转换和低IgG 表达,所以本发明的多核苷酸至少部分地由于包含了此3'增强子而有利地提供优化的表 达。因此,在优选的实施方案中,本发明提供包含大鼠3'增强子序列、Ig恒定区基因和至 少一个人免疫球蛋白(Ig)连接(J)区基因的嵌合多核苷酸。在一个优选的实施方案中,大 鼠3'增强子序列包括如SEQ ID NO: 1所示的序列,或其部分。
[0015] 本文所述的嵌合多核苷酸还可以包含至少一个人可变(V)基因、至少一个多样性 (D)基因,或其组合。在一个实施方案中,嵌合多核苷酸的恒定区基因选自由人恒定区基因 和大鼠恒定区基因组成的组。在一个优选的实施方案中,恒定区基因是大鼠恒定区基因。在 另一个优选的实施方案中,恒定区基因选自由Cy和Cy组成的组。
[0016] 在一个实施方案中,嵌合多核苷酸包含与本文公开的细菌人工染色体(BAC) Annabel (例如SEQ ID NO: 10)或其部分基本同源的核酸序列,并且还可以任选地包含至少 一个可从BAC6-VH3-11和BAC3分离的人可变Ig基因。在一个优选的实施方案中,本文涵 盖的嵌合多核苷酸以5'至3'的顺序包含核酸序列(a)和(b) : (a)人Ig可变区,其包含可 从BAC6-VH3-11和/或BAC3分离的呈天然构型的人V基因,和(b)人Ig连接区,其包含可 从BAC Annabel分离的呈天然构型的人J基因。在另一个实施方案中,如本文公开的嵌合 多核苷酸的人Ig可变区、人Ig多样性区、人Ig连接区、Ig恒定区和大鼠3'增强子区中的 每一个处于如图Ia中所示的相对位置。在另一个实施方案中,所公开的嵌合多核苷酸具有 包括如SEQ ID N0:2所示的序列或其部分或与其基本同源的序列。在另一个实施方案中, 所公开的嵌合多核苷酸具有包括如SEQ ID NO: 11所示的序列或其部分或与其基本同源的 序列。在另一个实施方案中,如本文公开的嵌合多核苷酸包含重排的V-D-J区,其中所述重 排的V-D-J区编码重链可变结构域外显子。
[0017] 本文还公开编码人κ轻链基因的多核苷酸。在一个实施方案中,如本文公开的 多核苷酸具有这样的核酸序列,其包括选自由RP11_1156D9(如SEQ ID N0:3所示)和 RP11-1134E24(如SEQ ID N0:4所示)组成的组的核酸序列或者与其基本同源。在另一个 实施方案中,分离的多核苷酸以5'至3'的顺序包含核酸序列(a)和(b) : (a)人Ig可变 区,其包含可从细菌人工染色体(BAC)RP11-156D9和/或RP11-1134E24分离的呈天然构 型的人V基因;(b)人Ig连接区,其包含可从细菌人工染色体(BAC) RPl 1-1134E24和/或 RP11-344F17(如SEQ ID N0:5所示)分离的呈天然构型的人J基因。在一个优选的实施 方案中,人Ig可变区、人Ig连接区和人Ig恒定区中的每一个处于如图Ib中所示的相对位 置。在另一个实施方案中,所公开的嵌合多核苷酸具有包括如SEQ ID N0:6所示的序列或 其部分或与其基本同源的序列。
[0018] 本文还提供啮齿动物细胞,其包含本发明的一种或多种多核苷酸。例如,本文提供 啮齿动物细胞,其包含如本文公开的多核苷酸,优选包含编码嵌合重链的核酸序列,例如, 编码大鼠3'增强子序列、Ig恒定区基因和至少一个人J区基因的核酸序列,并任选地包 含与选自由RP11-1156D9、RP11-1134E24及其部分组成的组的核酸序列基本同源的核酸序 列。本文涵盖的啮齿动物细胞还可以包含编码功能性轻链的多核苷酸,例如,具有如下核酸 序列的多核苷酸,该核酸序列包括选自由图Ib所示的序列(如SEQ ID N0:6所示)、图Ic 所示的序列(如SEQ ID NO:7所示)及其部分组成的组的核酸序列或者与其基本同源。在 一个实施方案中,将所述多核苷酸中的一个或多个整合在啮齿动物细胞基因组中。
[0019] 附图简述
[0020] 图1 :整合的人Ig基因座。(a)嵌合人-大鼠 IgH区含有与22个不同且潜在功能 性的人Vh区段的3个重叠 BAC。BAC6-3已经用VH3-11延伸以提供与BAC3的10. 6kb重叠, 其通过VH6-1与C区BAC Hu-大鼠 Annabel重叠11. 3kb。后者是嵌合的,并且含有所有的 人D和Jh区段,随后的具有完全增强子序列的大鼠 C区。(b)具有12个Vk和所有Jk的人 Igk BAC提供在该Vk区中的约14kb重叠和在Ck中的约40kb以包括KDE。(c)具有17个 Vl和所有J-Cl的包括3'增强子的人Igl区,是来自YAC33。
[0021] 图2 :来自3月龄大鼠的淋巴细胞门控的骨髓和脾细胞的流式细胞术分析。对 IgM和CD45R(B220)表面染色揭示在HC14和wt大鼠的骨髓和脾中相似数量的未成熟的和 成熟的B细胞,而JKO/JKO动物表现出没有B细胞发育。以前向(FSC)对位点(SSC)散布 (scatter)作图显示就尺寸和形状而论可比数量的淋巴细胞(门控性)群。将用抗IgG(Gl、 G2a、G2b、G2c同种型)对脾细胞的表面染色对细胞计数(xl02)作图,揭示与wt相比在 HC14大鼠中接近正常数量的IgG+表达子(expresser)。在骨髓中,A是指前(pro/pre) B细胞(CD45R+IgM_),B是指未成熟的B细胞(CD45R+IgM+)。在脾中,A是指过渡型B细胞 (⑶45R+IgM_),B是指滤泡性B细胞(⑶45R+IgM +),并且C是指边缘区B细胞(⑶45RlQWIgM+)。
[0022] 图3 :来自PBL的IgH和IgL转录体的突变变化。单一的(VHDJH)和VL是来自用 乂组特异性引物:16!^1、2、3、4和6与通用丫012反向引物、161^2、3和4及反向(^引物 的组合;以及IGKV1、3、4和5与反向Ck引物(补充表1)的扩增。鉴定突变的顺式转换 (trans-switch)产物的人 VH-大鼠 Cy 2a(4)和人 VH-大鼠 Cy 2c (2)。
[0023] 图4:具有人独特型的大鼠 Ig的纯化以及与人和正常大鼠 Ig水平的比较。将 OmniRat血清和人或大鼠 wt对照血清,各100 μ 1,用于IgM/G纯化。(a)用抗IgM基质捕 获IgM,在wt大鼠中鉴定出14yg,在0mniRat[HC14(a)和HC14(c)]中鉴定出30yg和 10 μ g。(b)将IgG在蛋白A和蛋白G柱上纯化,其中对于OmniRat产率高达约3mg/ml (蛋白 A :HC14 (a) 1000 μ g/ml ;HC14 (b) 350 μ g/ml ;wt 大鼠 350 μ g/ml ;蛋白 G :HC14 (a) 2970 μ g/ ml ;HC14(b) 280 μ g/ml ;wt 大鼠 1010 μ g/ml)。(c)人 Ig K 和(d)人 Ig λ 分别在抗 Ig K 和抗Ig λ基质上纯化。使用wt大鼠血清,没有获得纯化产物(未示出)。将纯化的Ig,约 3 μ g(通过nano drop测定的浓度),在4-15% SDS-PAGE上在还原条件下进行分离。将个 体OmniRat (8531、8322、8199、8486、8055)、人和被大鼠血清中的(6)人181〇和出人18入 水平通过ELISA滴定进行比较。将血清稀释度(1:10、1:100、1:1,000、1:10, 000)对通过在 492nm下的吸收测得的结合进行作图。匹配的名称/数量是指来自相同大鼠的样本。
[0024] 详述
[0025] 本文提供编码重组或人工免疫球蛋白链或基因座的嵌合多核苷酸。如上所述,本 文公开的嵌合多核苷酸用于转化啮齿动物以包括人Ig基因,并用于利用此类啮齿动物产 生具有人独特型的免疫球蛋白或抗体。
[0026] 多核苷酸
[0027] 免疫球蛋白是指由一个或多个基本上由免疫球蛋白基因编码的多肽组成的蛋白 质。已公认的人免疫球蛋白基因包括κ、λ、α (IgAl和IgA2)、y (IgGl、IgG2、IgG3、IgG4)、 δ、ε和μ恒定区基因,以及大量的免疫球蛋白可变区基因。全长免疫球蛋白"轻链"(约 25Kd,或者214个氨基酸)通常包含:由包含一个或多个可变区基因和在NH 2-末端的一个 或多个连接区基因的外显子编码的可变结构域(约110个氨基酸),以及由在COOH-末端的 κ或λ恒定区基因编码的恒定结构域。全长免疫球蛋白"重链"(约50Kd,或者446个氨 基酸),相似地包含(1)由包含一个或多个可变区基因、一个或多个多样性区基因和一个或 多个连接区基因的外显子编码的可变结构域(约116个氨基酸),以及(2)上述恒定结构 域之一,其包含一个或多个恒定区基因,例如,α、γ、δ、ε或μ (编码约330个氨基酸)。 免疫球蛋白重链恒定区基因编码抗体类别即同种型(例如,IgM或IgGl)。
[0028] 如本文使用的,术语"抗体"是指包含至少一个且优选为两个重(H)链可变结构域 (在此缩写为VH)和至少一个且优选为两个轻(L)链可变结构域(在此缩写为VL)的蛋白 质。普通技术人员将认识到免疫链的可变结构域在基因区段中被编码,该基因区段必须首 先进行体细胞重组以形成编码该可变结构域的完整外显子。进行重排以形成可变结构域的 区或基因区段有三种类型:包含可变基因的可变区、包含多样性基因的多样性区(在免疫 球蛋白重链的情况中),以及包含连接基因的连接区。可以将VH和VL结构域进一步细分为 被称为"互补决定区"("CDR")的高变区,其中穿插有被称为"骨架区"("FR")的更保守 区。已经精确确定FR和CDR的范围(参见,Kabat等人(1991) Sequences of Proteins of Immunological Interest,第 5 版,U. S. Department of Health and Human Services, NIH Publication No. 91-3242 ;和 Chothia 等人(1987) J. Mol. Biol. 196:901-17,所述文献在此 以引用的方式并入)。每个VH和VL结构域通常由按以下顺序从氨基末端至羧基末端排列 的三个CDR和四个FR构成:FR1、CDR1、FR2、CDR2、FR3、CDR3、FR4。如本文使用的,抗体的 抗原结合片段(或者简单地说,"抗体部分"或"片段")是指全长抗体的保留特异性结合抗 原的能力的一个或多个片段(例如,CD3)。
[0029] 涵盖在术语抗体的"抗原结合片段"内的结合片段的实例包括(i)Fab片段,其为 由VL、VH、CL和CHl结构域组成的单价片段;(ii)F(ab') 2片段,其为包含在铰链区通过 二硫桥连接的两个Fab片段的二价片段;(iii) Fd片段,其由VH和CHl结构域组成;(iv) Fv片段,其由抗体的单臂的VL和VH结构域组成;(v)dAb片段(Ward等人(1989)Nature 341:544-46),其由VH结构域组成;和(vi)分离的互补决定区(⑶R)。此外,虽然Fv片段 的两个结构域VL和VH是由分开的基因编码,但是可以利用重组方法通过使它们得以制成 单个蛋白链的合成连接子将它们连接,其中VL和VH区配对以形成单价分子(称为单链 Fv(scFv);参见,例如,Bird 等人(1988) Science 242:423-26 ;和 Huston 等人(1988) Proc. Natl. Acad. Sci. USA 85:5879-83)。此类单链抗体也旨在涵盖在术语抗体的"抗原结合片 段"内。利用本领域技术人员已知的常规技术获得这些抗体片段,并且以与完整抗体相同的 方式对片段进行实用性筛选。
[0030] 抗体还可以包括重和/或轻链恒定结构域,从而分别形成重和轻免疫球蛋白链。 在一个实施方案中,抗体是两条重免疫球蛋白链和两条轻免疫球蛋白链的四聚体,其中该 重和轻免疫球蛋白链通过例如二硫键互相连接。重链恒定结构域由三个基因区段CH1、CH2 和CH3组成。轻链恒定结构域由一个基因 CL组成。重链和/或轻链的可变结构域含有与 抗原相互作用的结合结构域。该抗体的恒定结构域通常介导抗体与包括免疫系统的各种细 胞(例如,效应细胞)和经典补体系统的第一组分(Clq)在内的宿主组织或因子的结合。
[0031] 所谓编码人工免疫球蛋白基因座或人工免疫球蛋白链的多核苷酸是指重组多核 苷酸,其包含多个免疫球蛋白区,例如,包含V基因的可变(V)区或基因区段、包含J基因的 连接(J)基因区或基因区段、在重链基因座的情况中包含D基因的多样性(D)区或基因区 段,和/或包含至少一个C基因的至少一个恒定(C)区。优选地,可变结构域的每个区,例 如,V、D或J区,包含或跨越至少两个相同类型的基因。例如,如本文使用的可变区包含至少 两个可变基因,连接区包含至少两个连接基因,并且多样性区包含两个多样性基因。恒定区 可以包含仅仅一个恒定基因,例如κ基因或λ基因,或者多个基因,例如,CHl、CH2和CH3。
[0032] 如本文使用的,"增强子序列"或"增强子"是指通过核酸酶消化和对降解的超敏 性,已经在多个活性基因附近鉴定的序列。超敏位点可以在启动子序列之前,并且它们的活 性强度与该DNA序列相关。如果增强子功能存在,则与报告基因的连锁显现出升高的转录 (Mundt等人,J. Immunol.,166, 3315[2001])。在IgH基因座中,已经鉴定出两个重要的转录 或表达调