专利名称:用于失活α-1,6岩藻糖基转移酶(FUT8)基因表达的方法和组合物的制作方法
技术领域:
本公开内容是在基因组工程、细胞培养和蛋白产生领域。背景医学上单克隆抗体治疗是一种广泛的正在成长的治疗方式(Glermie等(2000) Immunol Today 21:403-10)。存在超过20种FDA-批准的单克隆抗体治疗,其中许多近来 处于临床试验期。简单地,针对可溶因子(例如诸如血管内皮生长因子或肿瘤坏死因子) 的抗体治疗的目的是通过免疫复合体的形成降低游离配体的浓度。相反,当抗体治疗针对 细胞表面抗原时(如同通常在抗赘生性免疫治疗中一样),目标通常是去除细胞本身。治 疗性抗体可直接诱导凋亡(Shan 等(1998)Blood 91 1644-52 ;Shan(2000)CancerImmunol Immunother 48 :673_83),但是更通常地抗体必须募集患者的免疫系统来破坏靶细胞。参 见,Reff 等(1994)Blood 83 :435_45 ;Idusogie 等(2000)J Immunol 164 :4178_84 ;Golay 等(2000)Blood 95 :3900_8 ;Harjunpaa 等(2000)Scand J Immunol 51 :634_41 ;Anderson 等(1997)Biochem Soc Trans 25,705-8 ;Clynes 等(1998)Proc Natl Acad Sci USA 95: 652-6 ;Clynes 等(2000)Nat Med 6 :443_6 ;Sampson 等(2000)Proc Natl Acad Sci USA 97 :7503-8。存在两种机制,通过它们抗体激活的免疫系统可破坏攻击细胞补体依赖性细胞 毒性(CDC)和抗体依赖性细胞的细胞毒性(ADCC)。ADCC是主要由针对抗体包被的靶的天然 杀伤(NK)细胞产生的免疫应答。参见,Lewis 等(1993) Cancer Immunol Immunother 37 255-63。在ADCC中,NK细胞主要经由与NK细胞Fc y RIII受体的相互作用识别抗体的恒 定(Fe)区。然后NK细胞沉积穿孔蛋白和粒酶于靶细胞表面,分别诱导细胞裂解和凋亡。 Fc-Fc γ RIII相互作用对Fc糖基化极度敏感。非糖基化免疫球蛋白不能结合Fc受体。参 见,Leatherbarrow 等(I985)Mol Immunol 22 407-15(1985) ;Walker 等(I989)Biochem J 259:347-53(1989) ;Leader 等(1991) Immunology 72:481-5。另外,附着于 Fc 区 Asn297 的碳水化合物链的岩藻糖基化抑制与Fc γ RIII的结合,并且在体外降低ADCC的活性。参 见,Shields 等(2002) J Biol Chem 277 :26733_40 ;Shinkawa 等(2003) J Biol Chem278 3466-73 ;Niwa(2004)Cancer Res 64:2127-33。大多数哺乳动物免疫球蛋白被岩藻糖基化,包括中国仓鼠卵巢细胞(CH0细胞, 黑线仓鼠(Cricetulus griseus))产生的免疫球蛋白。Jefferis 等(1990)Biochem J 268 529-37 ;Hamako 等(1993)Comp Biochem Physiol B106 949-54 ;Raju 等(2000) Glycobiology 10:477-86。岩藻糖附着于Fc核心区是经由al,6岩藻糖基转移酶(FutS) 蛋白(明显是哺乳动物细胞中唯一的α-1,6岩藻糖基转移酶)产生的α _1,6键合。Oriol 等(1999)Glycobiology9 :323-34 ;Costache 等(1997)J Biol Chem 272:29721-8。CHO细胞中的FUT8基因的破坏消除了抗体的核心岩藻糖基化,并且增强了 ADCC约100倍。参见, Yamane-Ohnuki 等(2004)Biotechnol Bioeng 87:614-22)。然而,此类传统的通过同源重 组的基因破坏一般是费力的过程。这在黑线仓鼠FUT8的实例中尤其如此,其中筛选了大 约120,000个克隆细胞系,发现了 3个健康的FUT8-/-克隆(Yamane-Ohnuki等(2004),上 文)。因此,存在对其中FutS的表达被部分或全部失活的细胞系的需要。基因组位点的 位点特异性切割为传统的同源重组提供了有效的补充和/或可选方案。双链断裂(DSB)的 产生增加了靶位点同源重组的频率超过1000倍。更简单地,非同源末端连接(NHEJ)产生 的位点特异性DSB的不精确修复还可导致基因破坏。两个此类DSB的产生可导致任意大区 域的缺失。锌指蛋白的模块DNA识别偏好允许合理的设计位点特异性多指DNA结合蛋白。 II型限制酶Fok I的核酸酶结构域与位点特异性锌指蛋白的融合允许产生位点特异性核 酸酶。参见,例如,美国专利公布 20030232410 ;20050208489 ;20050026157 ;20050064474 ; 20060188987 ;20060063231 ;和国际公布WO 07/014275,为所有目的其公开内容通过引用 整体并入。概述本文公开了用于部分或完全失活FUT8基因的组合物。本文还公开了制备和使用 这些组合物(试剂)的方法,例如在细胞中失活FUT8以产生其中失活了 FUT8基因的细胞 系。FUT8破坏的细胞系用于例如产生诸如α 1-抗胰蛋白酶的重组蛋白和单克隆抗体,因为 其中FutS表达被降低的细胞中产生的抗体表现出增强的ADCC功能。在一方面,提供了改造为结合FUT8基因的锌指蛋白。本文描述的任何锌指蛋白可 包括1、2、3、4、5、6或更多锌指,每种锌指具有结合FUT8基因中靶亚位点的识别螺旋。在 某些实施方案中,锌指蛋白包含4、5或6种指(其中单种锌指命名为Fl、F2、F3、F4、F5和 F6),并且包含显示于表1的识别螺旋的氨基酸序列。在某些实施方案中,本文提供了改造的锌指蛋白DNA结合结构域,其中该DNA结合 结构域包含顺序为从N-末端至C末端为Fl至F4的4种锌指识别区,并且其中Fl、F2、F3 和 F4 包含以下氨基酸序列F1 :QSSDLSR (SEQ ID NO 9) ;F2 :TSGNLTR (SEQ ID NO: 10) ;F3 RSDDLSK (SEQ IDN0:11);禾口 F4 DRSALAR (SEQ ID NO: 12)。在其他实施方案中,本公开内容提供了改造的锌指蛋白DNA结合结构域,其中该 DNA结合结构域包含顺序为从N-末端至C末端为Fl至F4的4种锌指识别区,并且其中Fl、 F2、F3 和 F4 包含以下氨基酸序列F1 :RSDVLSA (SEQ ID NO 14) ;F2 :QNATRIN (SEQ ID NO 15) ;F3 :DRSNLSR(SEQ ID NO 16);和 F4 :RLDNRTA (SEQ ID NO 17)。在其他实施方案中,本公开内容提供了改造的锌指蛋白DNA结合结构域,其中该 DNA结合结构域包含顺序为从N-末端至C末端为Fl至F6的6种锌指识别区,并且其中Fl、 F2、F4、F5 和 F6 包含以下氨基酸序列F1 :RSDNLSV (SEQ ID NO 19) ;F2 :QNATRIN (SEQ ID NO 15) ;F4 QSATRTK(SEQ ID NO 21) ;F5 RSDNLSR(SEQ ID NO 22);禾口F6 :RNDNRKT(SEQ ID NO 23) ο在任何这些实施方案中,F3可包含RSDNLST (SEQ ID NO 20)或RSDHLSQ(SEQ ID NO 24)。在其他实施方案中,本公开内容提供了改造的锌指蛋白DNA结合结构域,其中该 DNA结合结构域包含顺序为从N-末端至C末端为Fl至F5的5种锌指识别区,并且其中Fl、F2、F3、F4 和 F5 包含以下氨基酸序列:F1 :RSDNLRE (SEQ ID NO 26) ;F2 :NNTQLIE (SEQ ID NO 27) ;F3 :TSSILSR(SEQ ID NO 28) ;F4RSDNLSA(SEQ ID NO 29);和 F5 :RKDTRIT(SEQ ID NO 30)。在另一个方面,还提供了包含本文描述的任何锌指蛋白和至少一个切割结构域或 至少一个切割半结构域的融合蛋白。在某些实施方案中,切割半结构域是野生型FokI切割 半结构域。在其他实施方案中,切割半结构域是改造的FokI切割半结构域。还在另一个方面,提供了编码本文描述的任何蛋白的多核苷酸。还在另一个方面,还提供了包含如本文描述的任何蛋白和/或多核苷酸的分离细 胞。在某些实施方案中,细胞中的FutS被失活(部分或完全)。本文描述的任何细胞可包 括已被失活的其他基因,例如使用设计为与选择基因中的靶位点结合的锌指核酸酶。在某 些实施方案中,本文提供了其中FUT8、二氢叶酸还原酶(DHFR)和谷氨酰胺合成酶(GS)已被 失活的细胞或细胞系。另外,提供了在失活细胞或细胞系中FUT8的方法中使用锌指蛋白及其融合体的 方法。在某些实施方案中,失活FUT8基因导致能以更高水平产生重组蛋白的细胞系,或者 在其中与FUT8基因未被失活的细胞中产生的蛋白相比蛋白的一种或多种活性(功能)被 增强的细胞系。例如,如本文所述的具有失活的FUT8基因的细胞系可用来产生表现出增 强的用于免疫治疗的ADCC功能的单克隆抗体。如本文所述的细胞系还可用来产生重组 α 1-抗胰蛋白酶。因此,在另一个方面,本文提供了一种用于在细胞中失活细胞FUT8基因(例如,内 源FUT8基因)的方法,该方法包括(a)将编码第一多肽的第一核酸引入细胞,其中该第一 多肽包含(i)改造为与内源FUT8基因的第一靶位点结合的锌指DNA结合结构域;和(ii) 切割结构域;以便该多肽在细胞中表达,由此该多肽与靶位点结合,并切割FUT8基因。在某 些实施方案中,该方法进一步包含引入编码第二多肽的核酸,其中第二多肽包含(i)改造 为与FUT8基因的第二靶位点结合的锌指DNA结合结构域;和(ii)切割结构域;以便第二多 肽在细胞中表达,由此第一和第二多肽与其各自的靶位点结合并切割FUT8基因。第一和第 二多肽可由第一核酸或不同的核酸编码。在某些实施方案中,一种或多种其他多核苷酸或 多肽被引入细胞,例如编码其他锌指蛋白的多核苷酸。在另一个方面,本公开内容提供了一种在宿主细胞中产生感兴趣的重组蛋白的方 法,该方法包括以下步骤(a)提供包含内源FUT8基因的宿主细胞;(b)通过本文所述的任 何方法失活宿主细胞的内源FUT8基因;和(c)将包含转基因的表达载体引入宿主细胞,该 转基因包含编码感兴趣的蛋白的序列,因此产生重组蛋白。在某些实施方案中,感兴趣的蛋 白包含抗体,例如单克隆抗体。在本文所述的任何细胞和方法中,细胞或细胞系可以是COS、CHO(例如,CHO-S, CHO-Kl、CH0-DG44、CHO-DUXB11, CHO-DUKX, CHOKl SV)、VERO、MDCK、WI38、V79、B14AF28-G3、 BHK、HaK, NSO、SP2/0_Agl4、HeLa, HEK293 (例如,HEK293-F、HEK293-H、HEK293-T)、 perC6、诸如草地贪夜蛾(Spodoptera fugiperda) (Sf)的昆虫细胞、或诸如酿酒酵母 (Saccharomyces)、毕赤酵母(Pichia)和裂殖酵母(Schizosaccharomyces)的真菌细胞。附图简述
图1描述了黑线仓鼠FUTScDNA序列的核苷酸序列(SEQ ID NO :1)。
图2描述了黑线仓鼠FutS的氨基酸序列(SEQ ID NO :2)。图3描述了黑线仓鼠FUT8基因组DNA的外显子9、内含子9、外显子10和内含子 10的部分核苷酸序列(SEQ ID NO :3)。图4(图A和B)是描述FUT8外显子10内锌指核酸酶(ZFN)结合位点和切割位 点的图。图4A是外显子9至内含子10区域的概述。外显子用黑色箭头表示,灰线显示非 编码DNA。图4B显示了岩藻糖基转移酶基序II和ZFN结合位点的详细视图。如Oriol等 (1999)Glycobiology 9 =323-34(1999)所述确定岩藻糖基转移酶基序II的位置(浅灰色 框)。Fut基序II的翻译显示于DNA序列上面。关于基因有义链的ZFN的识别序列的位置 显示为深灰色框。ZFN 12176(表1)是五锌指蛋白识别的15bp的靶位点,而ZFN 12170(表 1)是六锌指蛋白识别的18bp的靶位点。显示的最后两个核苷酸(GT)是内含子10的5’剪 接供体位点。图5(图A和B)显示内源FUT8基因座ZFN活性的Cel-I错配测定的结果。每 个ZFN对的效果反映在母PCR产物下切割产物的总量上。图5A显示指示质粒转染后两天 收集的 DNA 和使用寡核苷酸 GJC 7IF :GCTTGGCTTCAAACATCCAG (SEQ ID NO 4)和 GJC 89R GGACTTGTTCCGTGTGTTCT (SEQ ID NO :5)PCR 扩增的 FUT8 基因座的一部分的 Cel-I 测定结 果。预测切割产物的大小是264bp和216bp。图5B显示转染后两天收集的DNA和使用寡核苷 酸GJC 90F :CTGTTGATTCCAGGTTCCCA(SEQ ID NO :6)和 GJC 9IR :TGTTACTTAAGCCCCAGGC(SEQ IDNO :7)PCR扩增的FUT8基因座的一部分的结果。预测切割产物的大小是431bp和342bp。 ZFN组合显示于适当的泳道之上;ZFN特异性切割产物用白色箭头表示。通过非同源末端 连接修饰的染色体的百分比列于每条泳道之下。分子量标志物条带的大小显示于凝胶的左 侧。图6 (图A和B)描述内源FUT8基因座的ZFN活性。图6A显示使用两指示的ZFN 对的核酸酶介导的FUT8的1.3kb缺失的结果,其与两天之后收集的基因组DNA平行转染。 ZFN位点之间约1300bp的缺失产生约559bp的产物。图6B是CHO细胞中具有和没有扁豆 凝集素(LCA)富集的内源FUT8基因座ZFN活性的Cel-I错配测定的结果。ZFN对显示于顶 行(泳道2至4 (从左至右)的ZFN对12170和12176和泳道5至7 (从左至右)的ZFN对 12172和12176)。命名为“pVAX”的泳道指用空质粒(没有ZFN)转染的对照细胞。泳道名 称“2”和“30”指转染后的天数,而“LCA”指经受LCA选择的细胞。图7显示其中二氢叶酸还原酶(DHFR)和谷氨酰胺合成酶(GS)基因已通过先前的 ZFN处理被破坏的CHO细胞中具有和没有扁豆凝集素(LCA)富集的内源FUT8基因座ZFN活 性的Cel-I错配测定的结果。使用的ZFN库(1、3、5、7)显示于每条泳道的顶部,通过非同 源末端连接修饰的染色体百分此列于每条泳道之下。标记为“Cont. ”的两条泳道显示其中 细胞用GFP表达质粒转染(左侧“Cont. ”泳道)或未转染(右侧“Cont. ”泳道)的阴性对 照。图8显示分离自LCA富集的ZFN处理的编号1库的三重基因(DHFR/GS/FUT8)敲 除克隆的指示特性。图9是描述荧光LCA与指示细胞类型结合的图。“未染色”指含有野生型FutS但 未暴露于荧光LCA的CHO细胞;“三重K0”指其中DHFR、GS和FUT8基因的所有三种已使用 ZFN被破坏的细胞;而“futSwt”指含有野生型FUT8并且已暴露于荧光LCA的CHO细胞。
图10显示FUT8亚等位基因中内源FUT8基因座ZFN活性的Cel-I错配测定的结 果。克隆数显示于每条泳道之上,等位基因的破坏示于每条泳道之下。图11是描述荧光LCA与指示细胞类型结合的图。“野生型未染色”指含有野生型 FutS但未暴露于荧光LCA的CHO细胞;“亚等位基因克隆”指其中FUT8被部分失活(FUT8 亚等位基因)的细胞群体;而“CH0-K1”指含有野生型FUT8并暴露于荧光LCA的CHO细胞。详述本文描述了用于部分或完全失活FUT8基因的组合物和方法。还公开了制备和使 用这些组合物(试剂)的方法,例如失活靶细胞中的FutS基因。失活靶细胞中的FutS可 用来产生用于表达重组蛋白(特别是引发增强的ADCC的单克隆抗体)的细胞系。在哺乳动物细胞中,FutS将核心岩藻糖附着于存在于抗体Fc区上的寡糖上,其 一般被认为对抗体依赖性细胞的细胞毒性的效应功能非常重要。人类FutS结构的三维 分析显示3个α 2/α 6岩藻糖基转移酶基序形成酶的催化核心。参见,Ihara等(2007) Glycobiology 17:455-66。该区域中,许多单个残基点突变为丙氨酸导致酶的完全失 活。参见,Ihara 等(2007)Glycobiology 17 :455_66 ;Takahashi 等(2000)Glycobiology 10 :503-10。如上文提到,其中FUT8的表达降低或消除的细胞(例如敲除细胞系或使用 siRNA)产生具有更强效应功能的非岩藻糖基化的抗体。参见,例如,Kanada等(2007) Biotechnol.130(3) :300_310 ;Kanada等(2007)Glycobiologyl8 :104_118 ;Mori 等(2004) Biotechnol. Bioeng. 88 :901_908。因此,本文描述的方法和组合物提供了用于靶向基因敲除(部分或完全)的FUT8 的高度有效的方法,其允许产生用于产生非岩藻糖基化蛋白(诸如抗体)的细胞系。彳既要方法的实践以及本文公开的组合物的制备和使用采用(除非另外指明)分子生物 学、生物化学、染色质结构和分析、计算化学、细胞培养、重组DNA和在本领域技术范围内的 相关领域的常规技术。这些技术在文献中被充分解释。参见,例如,Sambrook等,MOLECULAR CLONING :ALAB0RAT0RY MANUAL (分子克隆实验手册),第二版,Cold SpringHarbor Laboratory Press,1989 和第三版,2001 ;Ausubel 等,CURRENTPR0T0C0LS IN MOLECULAR BIOLOGY(现代分子生物学技术),JohnWiley&Sons,New York,1987和定期更新METH0DS IN ENZYM0L0GY (酶学方法)系列,Academic Press, San Diego ;Wolffe, CHROMATINSTRUCTURE AND FUNCTION(染色质结构和功能),第三版,AcademicPress,San Diego, 1998 ;METHODS IN ENZYM0L0GY(酶学方法),第 304 卷,“染色质” (P. M. Wassarman 和 A. P. Wolffe,编辑), Academic Press, San Diego,1999 ;和 METHODS IN MOLECULAR BIOLOGY(分子生物学方 法),第 119 卷,“Chromatin Protocols”(染色质规程)(P. B. Becker,编辑)Humana Press, Totowa,1999。定义术语“核酸”、“多核苷酸”和“寡核苷酸”可交换使用,并且指以线性或环状构象和 以单链或双链形式的脱氧核糖核苷酸或核糖核苷酸多聚体。为了本公开内容的目的,这些 术语不被解释为限制多聚体的长度。该术语可包含天然核苷酸的已知类似物以及在碱基、 糖和/或磷酸部分(例如,硫代磷酸骨架)被修饰的核苷酸。一般而言,特定核苷酸的类似 物具有同样的碱基配对特异性;即A的类似物与T碱基配对。
术语“多肽”、“肽”和“蛋白,,可交换使用来指氨基酸残基的多聚体。该术语还应 用于其中一种或多种氨基酸是对应的天然存在氨基酸的化学类似物或修饰的衍生物的氨 基酸多聚体。“结合”指大分子之间(例如,蛋白和核酸之间)的序列特异性、非共价相互作用。 不是所有的结合相互作用的组分需要是序列特异性的(例如,在DNA骨架中与磷酸残基接 触),只要相互作用作为整体是序列特异性的。此类相互作用的一般特征是KT6M4或更低 的解离常数(Kd)。“亲和性”指结合的强度增强的结合亲和性与更低的Kd相关。“结合蛋白”是能非共价地结合另一个分子的蛋白。结合蛋白能结合例如,DNA分 子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白分子(蛋白结合蛋白)。在蛋白 结合蛋白的情况中,其能结合自身(形成同源二聚体、同源三聚体等)和/或其能结合一种 或多种不同蛋白的一个或多个分子。结合蛋白可具有不只一种类型的结合活性。例如,锌 指蛋白具有DNA结合、RNA结合和蛋白结合活性。“锌指DNA结合蛋白”(或结合结构域)是更大蛋白内的蛋白或结构域,其通过一 种或多种锌指以序列特异性的方式结合DNA,该锌指是结构通过锌离子的配位被稳定的结 合结构域内的氨基酸序列区。术语锌指DNA结合蛋白通常缩写为锌指蛋白或ZFP。锌指结合结构域可被“改造”以便结合预定的核苷酸序列。用于改造锌指蛋白的 方法的非限制性实施例是设计和选择。设计的锌指蛋白是其设计/组合物主要来自于合理 的标准的自然中不存在的蛋白。用于设计的合理的标准包括应用取代规则和计算机化的 算法来加工现有ZFP设计和结合数据的数据库储存信息中的信息。参见,例如,美国专利 6,140,081 ;6,453,242 ;和 6,534,261 ;还参见 WO 98/53058 ;WO 98/53059 ;WO 98/53060 ; W002/016536 和 WO 03/016496。“选择的”锌指蛋白是其产生主要来自于在诸如噬菌体展示、相互作用陷阱或杂 交选择的经验过程的自然中未发现的蛋白。参见例如,US5,789,538 ;US 5,925, 523 ;US 6,007,988 ;US 6,013,453 ;US 6,200,759 ;WO 95/19431 ;WO 96/06166 ;WO 98/53057;WO 98/54311;WO 00/27878 ;WO 01/60970 ;WO 01/88197 和 WO 02/099084。术语“序列”指任意长度的核苷酸序列,其可以是DNA或RNA ;可以是线性、环状或 分支状,并且可以是单链或双链。术语“供体序列”指被插入基因组的的核苷酸序列。供体 序列可以是任意长度,例如长度介于2个和10,000个核苷酸之间(或其间或其上任意整数 值),优选地长度介于约100个和1,000个核苷酸之间(或其间任意整数),更优选地长度 介于约200个和500个核苷酸之间。“同源不相同序列”指与第二条序列共享一定程度的序列一致性、但其序列不等同 于第二条序列的第一条序列。例如,包含突变基因的野生型序列的多核苷酸与突变基因的 序列是同源且不相同的。在某些实施方案中,两条序列之间同源性的程度足以允许利用正 常细胞机制的其间的同源重组。两条同源不相同的序列可以是任何长度,其非同源性程度 可小至单个核苷酸(例如,对通过靶向同源重组的基因组点突变的校正)或大至1万个或 更多碱基(例如,对基因在染色体预定异位位点的插入)。包含同源不相同序列的两条多核 苷酸不需要是相同的长度。例如,可使用介于20个和10,000个核苷酸或核苷酸对之间的 外源多核苷酸(即供体多核苷酸)。用于确定核酸和氨基酸序列一致性的技术在本领域是已知的。此类技术一般包括确定基因mRNA的核苷酸序列和/或确定其编码的氨基酸序列,并将这些序列与第二条核苷 酸或氨基酸序列此较。也可以以这种方式来确定和比较基因组序列。一般而言,一致性分 别指两条多核苷酸或多肽序列的精确核苷酸-对-核苷酸或氨基酸-对-氨基酸对应性。 可通过确定序列的百分比一致性来比较两条或多条序列(多核苷酸或氨基酸)。无论是核 酸或氨基酸序列,两条序列的百分比一致性是由更短序列的长度分开的两条比对序列之间 精确匹配的数目乘以100。核酸序列的近似比对是通过Smith和Waterman,Advances in Applied Mathematics 2:482-489(1981)的局部同源性算法提供的。通过使用由Dayhoff Atlas of Protein Sequences and结构(蛋白序列和结构图册),M. 0. Dayhoff编辑,5增 干丨J 3 :353_358, NationalBiomedical Research Foundation, Washington, D. C. , USA)开发 和由Gribskov, Nucl. Acids Res. 14(6) :6745_6763 (1986)标准化的得分矩阵,该算法可应 用于氨基酸序列。确定序列百分比一致性的该算法的示例性实施是由Genetics Computer Group (Madison, WI)的“BestFit”使用应用提供的。其他适合用于计算序列之间百分比 一致性或相似性的程序一般在本领域是已知的,例如,另一个此对程序是使用默认参数的 BLAST。例如,可使用采用以下默认参数的BLASTN和BLASTP 遗传密码=标准;过滤器=无; 链=两条;截断值=60 ;预期值=10 ;矩阵=BL0SUM62 ;描述=50个序列;分类=高分;数 据库=非冗余,GenBank+EMBL+DDBJ+PDB+GenBank CDS翻译+Swiss 蛋白 +Spupdate+PIR。这 些程序的详述可发现于GenBank网站。关于本文描述的序列,希望的序列一致性程度的范 围是大约80%至100%及其间任意整数值。序列之间的百分比一致性一般为至少70-75%、 优选地80-82%、更优选地85-90%、甚至更优选地92%、还更优选地95%和最优选地98% 序列一致性。可选地,可通过在允许同源区域之间形成稳定双链体的条件下多核苷酸的杂交 来确定多核苷酸之间序列相似性的程度,然后用单链特异核酸酶消化并确定消化片段的 大小。如使用上述方法确定,当序列表现出在分子的特定长度范围至少约70% -75%、优 选地80% -82%、更优选地85% -90%、甚至更优选地92%、还更优选地95%和最优选地 98%序列一致性时,两种核酸、或两种多肽序列大体上彼此同源。如本文所用,大体上同源 还指与特定DNA或多肽序列显示完全一致性的序列。大体上同源的DNA序列可在例如针 对该特定系统所限定的严紧条件下的Southern杂交实验中鉴定。限定适当的杂交条件 在本领域的技术范围内。参见,例如,Sambrook等,上文;Nucleic Acid Hybridization A Practical Approach(核酸杂交实用方法),编辑 B. D. Hames 和 S. J. Higgins,(1985) Oxford ;Washington, DC ;IRL 出版社)。可如下文确定两种核酸片段的选择性杂交。两个核酸分子之间序列一致性的程 度影响此类分子之间杂交事件的效率和强度。部分相同的核酸序列将至少部分抑制完 全相同的序列与靶分子的杂交。可使用本领域公知的杂交测定来评估完全相同序列的 杂交的抑制(例如,Southern(DNA)印迹、Northern(RNA)印迹、溶液杂交或类似杂交测
0M Sambrook Molecular Cloning :A Laboratory Manual,第二片反,(1989)Cold SpringHarbor, N. Y.)。此类测定可使用改变选择性程度来进行,例如,使用从低至高严紧性 改变的条件。如果采用低严紧性的条件,可使用缺少甚至部分程度序列一致性的第二探针 (例如,具有与靶分子低于约30%序列一致性的探针)来评估缺少非特异性结合,以便,在 缺少非特异性结合事件时,第二探针将不与靶杂交。
当使用基于杂交的检测系统时,选择与参考核酸序列互补的核酸探针,然后通过 选择适当的条件,探针和参考序列选择性彼此杂交或结合来形成双链体分子。在适度严紧 杂交条件下能选择性与参考序列杂交的核酸分子一般在允许检测长度至少约10-14个核 苷酸、具有与选择的核酸探针序列至少约70%序列一致性的靶核酸序列的条件下杂交。严 紧杂交条件一般允许检测长度至少约10-14个核苷酸、具有与选择的核酸探针序列大于约 90% -95%序列一致性的靶核酸序列。可如本领域已知的方法来确定用于探针/参考序列 杂交(其中探针和参考序列具有特定程度的序列一致性)的杂交条件(参见,例如,Nucleic Acid Hybridization :A Practical Approach,编辑 B. D. Hames 禾口 S. J. Higgins, (1985) Oxford ;Washington, DC ;IRL 出版社)。用于杂交的条件是本领域技术人员公知的。杂交严紧性指杂交条件不适合形成含 有错配核苷酸的杂交体的程度,更高的严紧性与更低的对错配杂交体的耐受性相关。影响 杂交严紧性的因素是本领域技术人员公知的,并且包括但不限于温度、PH、离子强度和有机 溶剂的浓度,诸如,例如,甲酰胺和二甲基亚砜。如本领域的技术人员所知,杂交严紧性通过 更高的温度、更低的离子强度和更低的溶液浓度被增强。关于杂交的严紧性条件,本领域公知的是可采用多种同等条件来建立特定的严紧 性,例如,通过改变以下因素序列的长度和特性、各种序列的碱基组合、盐和其他杂交溶液 组分的浓度、杂交溶液中是否存在阻断剂(例如,硫酸葡聚糖和聚乙二醇)、杂交反应温度 和时间参数以及变化的洗涤条件。特定组杂交条件的选择是根据本领域标准的方法来选择 的(参见,仿 如,Sambrook 等,Molecular Cloning :A Laboratory Manual,第二版,(1989) Cold Spring Harbor, N. Y.)。“重组”指两种多核苷酸之间遗传信息交换的过程。为了本公开的目的,“同源重 组(HR) ”指例如在细胞中双链断裂修复期间发生的此类交换的特定形式。该过程要求核苷 酸序列同源性,使用“供体”分子来模板修复“靶”分子(即经历双链断裂的分子),并且不 同地被称为“非交换基因转换”或“短道基因转换”,因为其导致遗传信息从供体向靶的转 移。不希望受任何特定理论所限,此类转移可涉及在断裂的靶和供体之间形成的异源双链 体DNA的错配校正,和/或其中供体用来重新合成将变为靶的一部分的遗传信息的“合成依 赖性链退火”,和/或相关过程。此类特定的HR通常导致靶分子序列的改变,以致供体多核 苷酸的部分或所有序列被并入靶多核苷酸。“切割”指DNA分子共价骨架的断裂。切割可由各种方法来起始,这些方法包括但 不限于磷酸二酯键的酶促或化学水解。单链切割和双链切割是可能的,并且双链切割作为 两个不同的单链切割事件的结果而发生。DNA切割可导致平末端或交错末端的产生。在某 些实施方案中,融合多肽用于靶向双链DNA切割。“切割半结构域”是与第二多肽(相同或不同)轭合形成具有切割活性(优选地双 链切割活性)的复合体的多肽序列。术语“第一和第二切割半结构域”、“+和-切割半结构 域”和“右和左切割半结构域”可交换使用,指二聚化的切割半结构域对。“改造的切割半结构域”是已被修饰以便与另一个切割半结构域(例如,另一个 改造的切割半结构域)形成专性异源二聚体的切割半结构域。还参见,美国专利公布第 2005/0064474 ;2007/0218528和2008/0131962号,其通过引用整体并入本文。“染色质”是包含细胞基因组的核蛋白结构。细胞染色质包含核酸(主要是DNA)和蛋白(包括组蛋白和非组蛋白染色体蛋白)。大多数真核细胞染色质以核小体的形式存 在,其中核小体核心包含与包含组蛋白H2A、H2B、H3和H4中每种两个的八聚体缔合的大约 150个碱基对的DNA,并且连接体DNA(根据有机体长度可变)在核小体核心之间延伸。组 蛋白Hl分子一般与连接体DNA缔合。为了本公开的目的,术语“染色质”意图包含所有类 型的细胞核蛋白(原核和真核)。细胞染色质包括染色体和附加型染色质。“染色体”是包含全部或部分细胞基因组的染色质复合体。通常细胞基因组的特征 是其核型,核型是包含细胞基因组所有染色体的集合。细胞基因组可包含一条或多条染色 体。“附加体”是包含不是细胞染色体核型一部分的核酸的复制的核酸、核蛋白复合体 或其他结构。附加体的实例包括质粒和某些病毒基因组。“可及区”是其中存在于核酸中的靶位点能被识别靶位点的外源分子结合的细胞 染色质位点。不希望受任何特定理论的限制,相信可及区是不包装为核小体结构的区域。可 及区的独特结构通常可通过其对化学或酶探针(例如,核酸酶)的敏感性来检测。“靶位点”或“靶序列”是定义结合分子将结合的核酸的一部分的核酸序列,只要存 在结合的充分条件。例如,序列5’ -GAATTC-3’是Eco RI限制性内切核酸酶的靶位点。“外源”分子是正常不存在于细胞中但可通过一种或多种遗传、生化或其他方法引 入细胞的分子。“正常存在于细胞中”是根据细胞的特定发育阶段和环境条件确定的。因 此,例如,仅在肌肉胚胎发育期间存在的分子是成体肌肉细胞的外源分子。相似地,热激诱 导的分子是非热激细胞的外源分子。外源分子可包含例如,功能异常的内源分子的有功能 形式或正常有功能的内源分子的功能异常形式。其中外源分子还可以是诸如通过组合化学过程产生的小分子,或诸如蛋白、核酸、 碳水化合物、脂类、糖蛋白、脂蛋白、多糖的大分子,上述分子的任何修饰的衍生物,或包含 上述分子的一种或多种的任何复合体。核酸包括DNA和RNA,可以是单链或双链;可以是线 性、分支的或环状的;并且可以是任意长度。核酸包括能形成双链体的核酸以及形成三链 体的核酸。参见,例如,美国专利第5,176,996和5,422,251号。蛋白包括但不限于DNA结 合蛋白、转录因子、染色质重建因子、甲基化的DNA结合蛋白、聚合酶、甲基化酶、去甲基化 酶、乙酰转移酶、脱乙酰酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、促旋酶和解 旋酶。外源分子也可以是与内源分子相同类型的分子,但衍生自与衍生该细胞的不同物种。 例如,人类核酸序列可被引入最初衍生自小鼠或仓鼠的细胞系。外源分子可以是与内源分子相同类型的分子,例如外源蛋白或核酸。例如,外源核 酸可包含引入细胞的感染的病毒基因组、质粒或附加体,或正常不存在于细胞中的染色体。 将外源分子引入细胞的方法对本领域技术人员是已知的,方法包括但不限于脂类介导的转 移(即脂质体,包括中性和阳离子型脂类)、电穿孔、直接注射、细胞融合、粒子轰击、磷酸钙 共沉淀、DEAE-葡聚糖介导的转移和病毒载体介导的转移。相反,“内源”分子是在特定环境条件和特定的发育阶段正常存在于特定细胞中的 分子。例如,内源核酸可包含染色体,线粒体、叶绿体或其他细胞器的基因组,或天然存在的 附加型核酸。其他内源分子可包括蛋白,例如,转录因子和酶。“融合”分子是其中两个或多个亚基分子优选地共价相连的分子。亚基分子可以是 相同化学类型的分子、或者可以是不同化学类型的分子。第一类融合分子的实例包括但不限于融合蛋白(例如,ZFP DNA结合结构域和切割结构域之间的融合体)和融合核酸(例 如,编码上文所述融合蛋白的核酸)。第二类融合分子的实例包括但不限于形成三链体的核 酸和多肽之间的融合体和小沟结合体和核酸之间的融合体。细胞中融合蛋白的表达可产生于将融合蛋白递送至细胞,或通过将编码融合蛋白 的多核苷酸递送至细胞,其中该多核苷酸被转录,转录物被翻译产生融合蛋白。反式剪接、 多肽切割和多肽连接还可涉及细胞中蛋白的表达。将多核苷酸和多肽递送至细胞的方法在 本公开内容的其他地方介绍。为了本公开的目的,“基因”包括编码基因产物的DNA区域(参见下文),以及调控 基因产物产生的所有DNA区域,无论此类调控序列是否与编码和/或转录序列相邻。相应 地,基因包括但不必要地限于启动子序列、终止子、翻译调控序列(诸如核糖体结合位点和 内部核糖体进入位点)、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点和基因 座控制区。“基因表达”指将包含于基因中的信息转变为基因产物。基因产物可以是基因的 直接转录产物(例如mRNA、tRNA、rRNA、反义RNA、shRNA、微小RNA(miRNA)核酶、结构性RNA 或任何其他类型的RNA)或由mRNA的翻译产生的蛋白。基因产物还包括通过诸如加帽、多 聚腺苷化、甲基化和编辑的方法修饰的RNA,和通过例如甲基化、乙酰化、磷酸化、泛素化、 ADP-核糖基化、豆蔻基化和糖基化修饰的蛋白。基因表达的“调节”指基因活性的改变。表达的调节可包括但不限于基因激活和 基因抑制。基因失活指与不包括本文描述的ZFP的细胞相比基因表达的任何降低。因此, 基因失活可以是完全(敲除)或部分的(例如,其中基因表现出低于正常表达水平的亚等 位基因或显示其影响的活性的部分降低的突变基因的产物)。“真核”细胞包括但不限于真菌细胞(诸如酵母)、植物细胞、动物细胞、哺乳动物 细胞和人类细胞(例如,T细胞)。“感兴趣的区域”是细胞染色质的任何区域,诸如例如其中期望结合外源分子的基 因内部或邻近的基因或非编码序列。结合可以是为了靶向DNA切割和/或靶向重组的目的。 感兴趣的区域可存在于例如染色体、附加体、细胞器基因组(例如,线粒体、叶绿体)或感染 的病毒基因组中。感兴趣的区域可位于基因编码区内、转录的非编码区(诸如例如前导序 列、尾随序列或内含子)内,或编码区上游或下游的非转录区域内。感兴趣的区域的长度可 小至单个核苷酸对,或可达2,000个核苷酸对,或核苷酸对的任意整数值。对两个或多个组分(诸如序列元件)的并列,术语“可操作键合”和“可操作连接 (operatively linked) ”(或“可操作连接(operably linked)”)可交换使用,其中排列组 分以便两个组分正常地发挥作用,并允许组分的至少一个可介导对其他组分的至少一个执 行的功能。作为例证,如果响应于是否存在一种或多种转录调控因子,转录调控序列控制编 码序列转录的水平,那么诸如启动子的转录调控序列可操作地与编码序列连接。转录调控 序列一般以顺式可操作地与编码序列连接,但不需要直接与其邻近。例如,增强子是可操作 地与编码序列连接的转录调控序列,甚至尽管其不邻近。关于融合多肽,术语“可操作地连接”可指每个组分在与其他组分的键合中将执行 相同功能(如果其不如此连接)的事实。例如,关于其中ZFPDNA结合结构域与切割结构域 融合的融合多肽,如果融合多肽中ZFPDNA结合结构域部分能结合其靶位点和/或其结合位点,而切割结构域能在靶位点附近切割DNA,那么ZFP DNA结合结构域和切割结构域处于可 操作键合。蛋白、多肽或核酸的“功能性片段”是其序列与全长蛋白、多肽或核酸不相同但保 留与全长蛋白、多肽或核酸相同功能的蛋白、多肽或核酸。功能性片段可含有与对应天然分 子更多、更少或相同数目的残基,和/或可含有一个或多个氨基酸或核苷酸取代。用于确定 核酸功能(例如,编码功能、与另一个核酸杂交的能力)的方法是本领域公知的。相似地, 用于确定蛋白功能的方法是公知的。例如,可通过例如滤膜结合测定、电泳迁移率变动测 定或免疫沉淀测定来确定多肽的DNA结合功能。可通过凝胶电泳来测定DNA切割。参见 Ausubel等,上文。可通过例如共免疫沉淀、双杂交测定或遗传和生化都互补来确定蛋白与 另一个蛋白相互作用的能力。参见,例如,Fields等(1989)Nature 340 :245_246 ;美国专 利第 5,585,245 号和 PCT WO 98/44350。如本文所用术语“抗体”包括获自多克隆和单克隆制品的抗体以及以下杂交 (嵌合)抗体分子(参见,例如,Winter等,Nature(1991)349 :293-299 ;和美国专利第 4,816,567号);F(ab,)2和F(ab)片段;Fv分子(非共价异源二聚体,参见,例如,Inbar 等,Proc Natl Acad Sci USA(1972) 69 :2659_2662 ;和 Ehrlich 等,Biochem(1980) 19 4091-4096);单链 Fv 分子(sFv)(参见,例如,Huston 等,Proc Natl Acad Sci USA(1988)85 =5879-5883) ;二聚体和三聚体抗体片段构建体;微抗体(参见,例如,Pack 等,Biochem (1992) 31 1579-1584 ;Cumber 等,J Immunology (1992) 149B 120-126);人 源化抗体分子(参见,例如,Riechmann 等,Nature (1988) 332 :323_327 ;Verhoeyan 等, Science (1988) 239 :1534_1536 ;和英国专利公布第 GB 2,276,169 号,公布于 1994 年 9 月 21日);和获自此类分子的任何功能性片段,其中此类片段保留了母抗体分子的免疫结合 特性。如本文所用,术语“单克隆抗体”指具有均质抗体群体的抗体组合物。该术语不限 于物种或抗体的来源,其不意图受抗体制备方式的限制。该术语包含完整的免疫球蛋白以 及诸如Fab、F(ab' )2、Fv和其他片段的片段,以及表现出母单克隆抗体分子的免疫结合特 性的嵌合和人源化均质抗体群体。锌指核酸酶本文描述了能用于失活FUT8基因的锌指核酸酶(ZFN)。ZFN包含锌指蛋白(ZFP) 和核酸酶(切割)结构域。A.锌指蛋白锌指结合结构域可被改造为结合选择的序列。参见,例如,Beerli等(2002) Nature Biotechnol. 20 :135_141 ;Pabo 等(2001) Ann. Rev. Biochem. 70 :313_340 ;Isalan 等(2001) Nature Biotechnol. 19 :656_660 ;Segal 等(2001)Curr. Opin. Biotechnol. 12 :632_637 ; Choo等(2000)Curr. Opin. Struct. Biol. 10 :411_416。与天然存在的锌指蛋白相比,改造 的锌指结合结构域可具有新的结合特异性。改造方法包括但不限于合理的设计和各种类 型的选择。合理的设计包括,例如,使用包含三联体(或四联体)核苷酸序列和单种锌指 氨基酸序列的数据库,其中每个三联体或四联体核苷酸序列与结合特定三联体或四联体序 列的锌指的一个或多个氨基酸序列缔合。参见,例如,共同拥有的美国专利6,453,242和 6,534,261,其通过引用整体并入本文。
包括噬菌体展示和双杂交系统的示例性选择方法公开于美国专利5,789,538 ; 5,925,523 ;6,007,988 ;6,013,453 ;6,410,248 ;6,140,466 ;6,200,759 ;和 6,242,568 ;以 及 W 98/37186 ;WO 98/53057 ;WO 00/27878 ;W001/88197 和 GB 2,338,237。另外,例如在 共同拥有的WO 02/077227中描述了锌指结合结构域的结合特异性的增强。靶位点、ZFP和用于设计和构建融合蛋白(及编码融合蛋白的多核苷酸)的方法 的选择是本领域的技术人员已知的,并且详细描述于美国专利申请公开第20050064474和 20060188987号,其通过引用整体并入本文。另外,如这些和其他参考文献中所公开,可使用任何适合的连接体序列将锌指结 构域和/或多指锌指蛋白连接到一起,连接体序列包括例如,长度为5个或多个氨基酸的连 接体(例如,TGEKP(SEQ ID NO 36)、TGGQRP(SEQ ID NO 37)、TGQKP(SEQ ID NO 38)、禾口 / 或TGSQKP(SEQ IDNO :39))。长度为6个或多个氨基酸的示例性连接体序列还参见美国专 利第6,479,626 ;6, 903,185 ;和7,153,949号。本文描述的蛋白可包括蛋白的单种锌指之 间合适连接体的任意组合。其他连接体结构的实例发现于2008年5月28日提交的标题为 “用于连接DNA结合结构域和切割结构域的组合物”的美国临时申请第61/130,099号。表1描述了已改造为结合FUT8基因的核苷酸序列的许多锌指结合结构域。还参见 图1和图3。每行描述了不同的锌指DNA结合结构域。每个结构域的DNA靶序列显示于第 1列,第2至第5列显示了蛋白中每种锌指(Fl至F4、F5或F6)识别区的氨基酸序列(相 对螺旋起始,氨基酸-1至+6)。第1列还提供了蛋白的鉴定号。表1 靶向Fut8的锌指核酸酶 如下文所述,在某些实施方案中,如表1所示的4指、5指或6指结合结构域与诸 如例如II型限制性内切核酸酶(诸如FokI)的切割结构域的切割半结构域融合。此类 锌指/核酸酶半结构域融合体的一对或多对用于例如在美国专利公布第20050064474和 20070218528号中公开的靶向切割。对靶向切割,结合位点的近边界处可由5个或多个核苷酸对分开,并且每个融合 蛋白能结合DNA靶的相反链。显示于表1的蛋白的所有成对的组合(例如,ZFN 12029与 ZFN 12030,和ZFN 12170与ZFN 12172或ZFN 12176)可用于FUT8基因的靴向切割。根据 本公开内容,ZFN可靶向FUT8基因中的任何序列。B.切割结构域ZFN还包含核酸酶(切割结构域、切割半结构域)。本文公开的融合蛋白的切割 结构域部分可获自任何内切核酸酶或外切核酸酶。可衍生切割结构域的示例性内切核酸 酶包括但不限于限制性内切核酸酶和归巢内切核酸酶。参见,例如,2002-2003目录,New England Biolabs,Beverly,MA ;禾口 Belfort 等(1997)Nucleic Acids Res. 25 :3379_3388。 切割DNA的其他酶是已知的(例如,Sl核酸酶;绿豆核酸酶;胰腺DNA酶I ;微球菌核酸酶; 酵母HO内切核酸酶;还参见Linn等(编辑)Nucleases (核酸酶),Cold SpringHarbor Laboratory Press,1993)。这些酶(或其功能性片段)的一种或多种可用作切割结构域和 切割半结构域的来源。相似地,切割半结构域可衍生自如上文提到其切割活性需要二聚化的任何核酸酶 或其片段。一般而言,如果融合蛋白包含切割半结构域,则切割需要两个融合蛋白。可选 地,可使用包含两个切割半结构域的单个蛋白。两个切割半结构域可衍生自相同的内切核 酸酶(或其功能性片段),或者每个切割半结构域可衍生自不同的内切核酸酶(或其功能 性片段)。另外,两个融合蛋白的靶位点彼此优选地放置,以便两个融合蛋白与其各自靶位 点的结合将切割半结构域置于允许切割半结构域例如通过二聚化形成功能性切割结构域 的彼此的空间定向。因此,在某些实施方案中,靶位点的近边界由5-8个核苷酸或由15-18 个核苷酸分开。然而,任何整数数目的核苷酸或核苷酸对可插入两个靶位点之间(例如从 2至50个核苷酸对或更多)。一般而言,切割位点位于靶位点之间。限制性内切核酸酶(限制酶)存在于许多物种,并且能序列特异地结合DNA (在识 别位点),并在结合位点或接近结合位点处切割DNA。某些限制酶(例如,IIS型)在远离 识别位点的位点处切割DNA,并具有可分的结合结构域和切割结构域。例如,IIS型酶Fok I在一条链上离其识别位点第9个核苷酸处和另一条链上离其识别位点第13个核苷酸处 催化DNA的双链切割。参见,例如,美国专利5,356,802 ;5, 436,150和5,487,994 ;以及Li 等(1992) Proc. Natl. Acad. Sci. USA 89 4275-4279 ;Li 等(1993) Proc. Natl. Acad. Sci.USA 90 2764-2768 ;Kim 等(1994a) Proc. Natl. Acad. Sci. USA91 :883_887 ;Kim 等(1994b) J. Biol. Chem. 269 :31,978-31,982。因此,在一个实施方案中,融合蛋白包含来自至少一个 IIS型限制酶的切割结构域(或切割半结构域)和一个或多个可能改造或可能未改造的锌 指结合结构域。切割结构域与结合结构域可分的示例性IIS型限制酶是Fok I。该特定的酶作 为二聚体有活性。Bitinaite 等(1998) Proc. Natl. Acad. Sci. USA 95 :10,570-10,575。相 应地,为了本公开的目的,公开的融合蛋白中使用的FokI酶的一部分被认为是切割半结构 域。因此,对使用锌指-Fok I融合体的细胞序列的靶向双链切割和/或靶向替代,每个包 含FokI切割半结构域的两个融合蛋白可用来重构催化上有活性的切割结构域。可选地,还 可使用含有锌指结合结构域和两个Fok I切割半结构域的单个多肽分子。使用锌指-Fok I 融合体的靶向切割和靶向序列改变的参数在本公开内容的其他地方提供。切割结构域或切割半结构域可以是保留切割活性或保留多聚化(例如二聚化)以 形成功能性切割结构域的能力的蛋白的任何部分。示例性IIS型限制性内切酶描述于国际公布WO 07/014275,其整体并入本文。其 他限制酶还包含可分的结合结构域和切割结构域,这些酶涵盖于本公开内容。参见,例如, Roberts 等(2003)NucleicAcids Res. 31 :418_420。在某些实施方案中,切割结构域包含例如在美国专利公布第20050064474 ; 20060188987和20080131962号(其所有公开内容通过引用整体并入本文)中所述最小化 或阻止同源二聚化的一个或多个改造的切割半结构域(也称为二聚化结构域突变体)。位 于 Fok I 的 446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537 和 538位置的氨基酸残基都是影响Fok I切割半结构域二聚化的靶。形成专性异源二聚体的Fok I的示例性改造的切割半结构域包括其中第一切割半 结构域包括在Fok I的490和538位置的氨基酸残基的突变,而第二切割半结构域包括在 氨基酸残基486和499处的突变的对。因此,在一个实施方案中,在490处的突变用Lys (K)替代Glu (E);在538处的突变 用Lys (K)替代Iso (I);在486处的突变用Glu (E)替代Gln (Q);而在499处的突变用Lys (K) 替代Iso(I)。具体地,通过突变一个切割半结构域中的位置490 (E — K)和538(1 — K)来 产生命名为“E490K :I538K”的改造的切割半结构域和通过突变另一个切割半结构域中的 位置486 (Q — Ε)和499(1 — L)来产生命名为“Q486E :I499L”的改造的切割半结构域制备 本文所述的改造的切割半结构域。本文所述的改造的切割半结构域是其中当使用含有这些 切割半结构域的一对或多对核酸酶用于切割时异常切割被最小化或消除的专性异源二聚 体突变体。参见,例如,美国专利公布第20080131962号,为所有目的其公开内容通过引用 整体并入。本文描述的改造的切割半结构域可使用任何适合的方法来制备,例如,通过如美 国专利公布第20050064474 (实施例5)和20070134796 (实施例38)号中所述的野生型切 割半结构域(Fok I)的位点定向诱变。C.用于FUT8中靶向切割的其他方法在FUT8基因中具有靶位点的任何核酸酶可用在本文公开的方法中。例如,归巢内 切核酸酶和大范围核酸酶具有非常长的识别序列,其中一些酶基于统计基础可能在人类大小的基因组中出现一次。在FUT8基因中具有独特靶位点的任何此类核酸酶可用来代替锌 指核酸酶或除锌指核酸酶外用于FUT8基因中的靶向切割。示例性归巢内切核酸酶包括I-Scel、I-Ceul、PI-PspI、ΡΙ-Sce、Ι-SceIV、I-CsmI, I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII 和 I-TevIII。其识别序列已 知。还参见美国专利第5,420,032号;美国专利第6,833,252号;Belfort等(1997) Nucleic Acids Res. 25 :3379-3388 ;Dujon 等(1989)Gene82 :115_118 ;Perler 等(1994)Nucleic Acids Res. 22,1125-1127 Jasin(1996)Trends Genet. 12 224~228 ;Gimble等 (1996) J. Mol.Biol. 263 163-180 ;Argast 等(1998)J. Mol. Biol. 280 345-353 和 New England Biolabs 目录。尽管大多数归巢内切核酸酶的切割特异性关于其识别位点不是绝对的,这些位点 具有足够的长度使得能通过在含有单拷贝其识别位点的细胞中表达归巢内切核酸酶来获 得每个哺乳动物大小的基因组的单个切割事件。还据报道,归巢内切核酸酶和大范围核酸 酶的特异性可被改造以便结合非天然的靶位点。参见,例如,Chevalier等(2002)MoleC. Cell 10 895-905 ;Epinat 等(2003)Nucleic Acids Res. 31 2952-2962 ;Ashworth 等 (2006)Nature441 :656_659 ;Paques 等(2007)Current Gene Therapy 7 :49_66。递送本文描述的ZFN可通过任何适合的方法递送至靶细胞。适合的细胞包括但不限 于真核和原核细胞和/或细胞系。此类细胞或细胞系的非限制性实例包括COS、CHO(例 如,CHO-S、CH0-K1、CH0-DG44、CHO-DUXB 11、CHO-DUKX、CH0K1SV)、VERO、MDCK、WI38、 V79、B14AF28-G3、BHK、HaK, NSO、SP2/0_Agl4、HeLa, HEK293(例如,HEK293-F、HEK293-H、 HEK293-T)和perC6细胞以及诸如草地贪夜蛾(Sf)的昆虫细胞或诸如酿酒酵母、毕赤酵母 和裂殖酵母的真菌细胞。递送包含锌指的蛋白的方法描述于例如美国专利第6,453,242 ;6, 503,717 ; 6,534,261 ;6,599,692 ;6,607,882 ;6,689,558 ;6,824,978 ;6,933,113 ;6,979,539 ; 7,013,219 ;和7,163,824号中,所有其公开内容通过引用整体并入本文。如本文所述的FUT8ZFN还可使用含有编码一种或多种ZFN的序列的载体来递 送。可使用任何载体系统,包括但不限于质粒载体、反转录病毒载体、慢病毒载体、腺病毒 载体、痘病毒载体;疱疹病毒载体和腺伴随病毒载体等。还参见美国专利第6,534,261 ; 6,607,882 ;6,824,978 ;6,933,113 ;6,979,539 ;7,013,219 ;和 7,163,824 号,其通过引用 整体并入本文。进一步,明显的是,任何这些载体可包含编码一种或多种ZFN的序列。因此, 当一种或多种ZFN对被引入细胞时,ZFN可携带于相同载体上或不同载体上。当使用多种 载体时,每个载体可包含编码一种或多种ZFN的序列。传统的基于病毒和非病毒的基因转移方法可用来将编码改造的ZFP的核酸 引入细胞(例如,哺乳动物细胞)和靶组织。这些方法还可用来将编码ZFP的核酸 体外施用至细胞。在某些实施方案中,施用编码ZFP的核酸用于体内或离体基因治 疗使用。非病毒载体递送系统包括DNA质粒、裸核酸和与诸如脂质体或泊洛沙姆的 递送载体复合的核酸。病毒载体递送系统包括在递送至细胞后具有附加型基因组或 整合的基因组的DNA和RNA病毒。对基因治疗程序的综述,参见Anderson,Science 256 808-813(1992) ;Nabel&Felgner, TIBTECH 11 211-217 (1993) ;Mitani&Ciiskey,TIBTECH11 162-166(1993) ;Dillon, TIBTECH 11 167-175 (1993) ;Miller, Nature357 455-460(1992) ;Van Brunt,Biotechnology 6(10) 1149-1154(1988) ;Vigne,Restorative Neurology and Neuroscience 8:35-36(1995) ;Kremer&Perricaudet, British Medical Bulletin 51(1) 31-44(1995) ;Haddada 于 Current Topics in Microbiology and Immunology Doerflei^PBiihm (编辑)(1995);和 Yu 等,Gene Therapy 1 :13-26 (1994)。编码改造的ZFP的核酸的非病毒递送方法包括电穿孔、脂质转染、显微注射、基 因枪、病毒体、脂质体、免疫脂质体、聚阳离子或脂类核酸轭合物、裸DNA、人工病毒体和 增强DNA摄取的剂。还可使用采用例如Sonitron 2000系统(Rich-Mar)的声孔效应 (Sonoporation)来递送核酸。其他示例性核酸递送系统包括由Amaxa Biosystems (Cologne, Germany)、 Maxcyte,Inc. (Rockville,Maryland)和 BTX 分子递送系统(Holliston,ΜΑ)和 Copernicus Therapeutics Inc.(参见例如美国专利第6,008, 336号)提供的系统。脂质转染描述于例如,US5,049,386、US 4,946,787 ;和 US 4,897,355),脂质转 染试剂是商业化销售的(例如,Transfectam 和Lipofectin )。适合于多核苷酸的有效 的受体识别的脂质转染的阳离子和中性脂类包括Feigner、WO 91/17424、WO 91/16024中 的脂类。可递送至细胞(离体施用)或靶组织(体内施用)。包括诸如免疫脂类复合体的靶向脂质体的脂类核酸复合体的制备对本领域的技 术人员是公知的(参见,例如,Crystal, Science 270 :404_410 (1995) ;Blaese 等,Cancer Gene Ther. 2 291-297 (1995) ;Behr 等,BioconjugateChem. 5 :382_389 (1994) ;Remy 等, Bioconjugate Chem. 5 647-654 (1994) ;Gao 等,Gene Therapy 2:710-722(1995) ;Ahmad 等,Cancer Res. 52 4817-4820 (1992);美国专利第 4,186,183,4, 217,344,4, 235,871、 4,261,975,4, 485,054,4, 501,728,4, 774,085,4, 837,028 和 4,946,787 号)。使用基于RNA或DNA病毒的系统来递送编码改造的ZFP的核酸利用将病毒靶向机 体特定细胞和将病毒的有效载荷运输至核的高度进化的过程。病毒载体可直接施用于患者 (体内),或者其可用来在体外处理细胞并将修饰的细胞施用于患者(离体)。用于递送ZFP 的传统的基于病毒的系统包括但不限于用于基因转移的反转录病毒、慢病毒、腺病毒、腺伴 随病毒、痘苗病毒和单纯疱疹病毒载体。使用反转录病毒、慢病毒和腺伴随病毒基因转移方 法可能整合到宿主基因组中,通常导致插入转基因的长程表达。另外,在许多不同的细胞类 型和靶组织中观察到高转导率。反转录病毒的向性可通过并入外源包膜蛋白、扩展靶细胞的潜在靶群体而被改 变。慢病毒载体是能转导或感染非分裂细胞并且一般产生高病毒滴度的反转录病毒载体。 反转录病毒基因转移系统的选择取决于靶组织。反转录病毒载体包含具有可达6-10kb外 源序列包装能力的顺式作用长末端重复。最小的顺式作用LTR足够用于载体的复制和包 装,然后其被用来将治疗性基因整合到靶细胞中来提供永久的转基因的表达。广泛使用 的反转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿猴免疫 缺陷病毒(SIV)、人类免疫缺陷病毒(HIV)及其组合的载体(参见,例如,Buchscher等, J. Virol. 66 2731-2739 (1992) Johann 等,J. Virol. 66 1635-1640 (1992) ;Sommerfelt 等,Virol. 176 :58-59 (1990) ;Wilson 等,J. Virol. 63 :2374_2378 (1989) ;Miller 等, J. Virol. 65 :2220_2224 (1991) ;PCT/US94/05700)。
在其中ZFP融合蛋白的瞬时表达为优选的应用中,可使用基于腺病毒的系统。基 于腺病毒的载体在许多细胞类型中能具有非常高的转导效率,并且不需要细胞分裂。使用 此类载体,已获得高滴度和高水平的表达。在相对简单的系统中,可大量产生该载体。还 使用腺伴随病毒(“AAV”)载体以用靶核酸转导细胞,例如,在核酸和肽的体外产生中和用 于体内和离体基因治疗程序(参见,例如,West等,Virology 160:38-47(1987);美国专利 第4,797,368号;WO 93/24641 ;Kotin,Human Gene Therapy 5:793-801(1994) ;Muzyczka, J. Clin. Invest. 94 =1351(1994)。重组AAV载体的构建描述于许多出版物中,包括美国专利 第 5,173,414 号;Tratschin 等,Mol. Cell. Biol. 5 :3251_3260 (1985) ;Tratschin 等,Mol. Cell. Biol. 4 2072-2081(1984) ;Hermonat & Muzyczka,PNAS 81:6466-6470(1984);和 Samulski 等,J. Virol. 63 :03822_3828 (1989)。目前至少有6种病毒载体的方法可用于临床试验的基因转移,其利用涉及插入辅 助细胞系的基因与缺陷型载体的互补来产生转导剂的方法。pLASN和MFG-S是已用于临床试验的反转录病毒载体的实例(Dunbar等, Blood 85 3048-305(1995) ;Kohn 等,Nat. Med. 1 1017-102 (1995) ;Malech 等,PNAS 94 2212133-12138(1997))。PA317/pLASN是第一个用于基因治疗试验的治疗性载体(Blaese 等,Science 270:475-480(1995))。已观察到MFG-S包装载体具有50 %或更高的转导 率(Ellem 等,Immunol Immunother. 44(1) 10-20 (1997) ;Dranoff 等,Hum. Gene Ther. 1 111-2(1997)。重组腺伴随病毒载体(rAAV)是基于缺陷型和非病原细小病毒腺伴随2型病毒的 有希望的可选基因递送系统。所有载体衍生自仅保留转基因表达盒侧翼AAV 145bp反向 末端重复的质粒。由整合进转导细胞基因组引起的有效的基因转移和稳定的转基因递送 是该载体系统的关键特征(Wagner 等,Lancet 351 9117 1702-3(1998),Kearns 等,Gene Ther. 9 :748_55(1996))。复制缺陷的重组腺病毒载体(Ad)可以以高滴度产生,并且容易地感染许多不同 的细胞类型。大多数腺病毒载体被改造以便转基因替代AdEla、Elb和/或E3基因;随后复 制缺陷载体在以反式提供缺失基因功能的人类293细胞中增殖。Ad载体能在体内转导多种 类型的组织,包括诸如发现于肝、肾和肌肉中的非分裂、分化细胞。传统的Ad载体具有大的 运载能力。Ad载体在临床试验中应用的实例涉及用于通过肌内注射的抗肿瘤免疫接种的 多核苷酸治疗(Sterman等,Hum. Gene Ther. 7 1083-9 (1998))。腺病毒载体用于临床试验 的基因转移的应用的其他实例包括Rosenecker等,Infection 24:15-10(1996) ;Sterman 等,Hum. Gene Ther. 9 71083-1089 (1998) ;Welsh 等,Hum. Gene Ther. 2 205-18 (1995); Alvarez 等,Hum. GeneTher. 5 597-613 (1997) ;Topf 等,Gene Ther. 5 507-513 (1998); Sterman 等,Hum. Gene Ther. 7 1083-1089 (1998)。包装细胞用来形成能感染宿主细胞的病毒颗粒。此类细胞包括包装腺病毒的293 细胞和包装反转录病毒的Ψ2细胞或PA317细胞。用于基因治疗的病毒载体通常由将核酸 载体包装到病毒颗粒中的产生者细胞系产生。该载体一般含有包装和随后整合到宿主(如 果适用)所需的最小病毒序列、被编码待表达的蛋白的表达盒替代的其他病毒序列。缺失 的病毒功能由包装细胞系以反式提供。例如,用于基因治疗的AAV载体一般仅含有来自AAV 基因组的包装和整合进宿主基因组所需的反向末端重复(ITR)序列。病毒DNA被包装到含有编码其他AAV基因(即rep和cap)但缺少ITR序列的辅助质粒的细胞系中。该细胞系 还用腺病毒感染作为辅助细胞。辅助病毒促进AAV载体的复制和来自辅助质粒的AAV基因 的表达。由于缺少ITR序列,辅助质粒不以可观的量包装。腺病毒的污染可通过例如热处 理(腺病毒对热处理比AAV更敏感)而被降低。在许多基因治疗应用中,需要基因治疗载体以高度特异性递送至特定的组织类 型。相应地,通过表达配体作为与病毒外表面上的病毒外壳蛋白的融合蛋白,病毒载体可被 修饰以便具有对给定细胞类型的特异性。选择具有对已知存在于感兴趣的细胞类型上的受 体具有亲和性的配体。例如,Han 等,Proc. Natl. Acad. Sci. USA 92 :9747_9751 (1995)报道 莫洛尼氏鼠白血病病毒可被修饰以便表达与gp70融合的人类调蛋白,重组病毒感染表达 人类表皮生长因子受体的某些人类乳腺癌细胞。该原理可扩展至其他病毒_靶细胞对,其 中靶细胞表达受体而病毒表达包含针对细胞表面受体的配体的融合蛋白。例如,丝状噬菌 体可被改造为展示对实际上任何选择的细胞受体具有特定结合亲和性的抗体片段(例如, FAB或Fv)。尽管上述描述主要应用于病毒载体,同样的原理可应用于非病毒载体。此类载 体可被改造为含有促进特定靶细胞摄取的特定摄取序列。通过施用于单个患者,一般通过系统施用(例如,静脉内、腹膜内、肌内、皮下或颅 内输注)或如下文所述的局部应用,基因治疗载体可被体内递送。可选地,载体可离体地被 递送至细胞,诸如从单个患者移出的细胞(例如,淋巴细胞、骨髓涂片、组织活检)或万能供 体造血干细胞,然后通常在选择已并入载体的细胞后,将细胞重新植入患者。用于诊断、研究或用于基因治疗的离体细胞转染(例如,通过将转染细胞重新输 注到宿主有机体内)对本领域的技术人员是公知的。在优选实施方案中,从受治疗者有机 体中分离细胞,用ZFP核酸(基因或cDNA)转染,并重新输注回受治疗者有机体中(例如, 患者)。适合用于离体转染的各种细胞类型对本领域的技术人员是公知的(参见,例如, Freshney ·,Culture of Animal Cells, A Manual of Basic Technique (云力白勺 基本技术手册)(第3版,1994))和用于讨论如何分离和培养来自患者的细胞的本文列举的 参考文献)。在一个实施方案中,在离体操作中使用干细胞用于细胞转染和基因治疗。使用干 细胞的优势是其能在体外分化为其他细胞类型,或者可被导入其中其将移入骨髓的哺乳动 物(诸如细胞的供体)。使用诸如GM-CSF、IFN- γ和TNF- α的细胞因子在体外将⑶34+ 细胞分化为临床上重要的免疫细胞类型的方法是已知的(参见Inaba等,J. Exp. Med. 176 1693-1702(1992))。使用已知的方法分离干细胞用于转导和分化。例如,通过用结合不需要的细胞的 抗体淘选骨髓细胞而从骨髓细胞中分离干细胞,这些不需要的细胞诸如CD4+和CD8+(T细 胞)、CD45+(panB细胞)、GR-I (粒细胞)和Iad (分化的抗原呈递细胞)(参见Inaba等, J. Exp. Med. 176 1693-1702 (1992))。含有治疗性ZFP核酸的载体(例如,反转录病毒、腺病毒、脂质体等)还可直接施 用于有机体用于在体内转导细胞。可选地,可施用裸DNA。施用是通过正常用于将分子引 入最终与血细胞或组织细胞接触的任何途径,其包括但不限于注射、输注、局部应用和电穿 孔。施用此类核酸的适合的方法是可得的,并且是本领域的技术人员公知的,尽管可使用不 只一种途径来施用特定的组合物,特定的途径通常提供此另一种途径更直接和更有效的反应。用于将DNA引入造血干细胞的方法公开于例如美国专利第5,928,638号。用于将 转基因引入造血干细胞(例如,⑶34+细胞)的载体包括腺病毒35型。适合用于将转基因引入免疫细胞(例如,T细胞)的载体包括非整合的慢病毒载 体。参见,例如,Ory 等(1996)Proc. Natl. Acad. Sci. USA93 :11382_11388 ;Dull 等(1998) J. Virol. 72 :8463_8471 ;Zuffery 等(1998)J. Virol. 72 :9873_9880 ;Follenzi 等(2000) Nature Genetics 25 :217-222。药学上可接受的载体是部分通过施用的特定组合物以及通过用来施用组合物的 特定方法确定的。相应地,存在广泛的多种可得的药物组合物的适合制剂,如下文所述(参 见,例如,Remington,s Pharmaceutical Sciences (雷明顿药物科学),第 17 版,1989)。如上文指出,公开的方法和组合物可用在任何类型的细胞中,包括但不限于原核 细胞、真菌细胞、古细菌细胞、植物细胞、昆虫细胞、动物细胞、脊椎动物细胞、哺乳动物细 胞和人类细胞。适合用于蛋白表达的细胞系是本领域的技术人员公知的,其包括但不限于 COS、CHO (例如,CHO-S、CHO-K1、CH0-DG44、CHO-DUXB11)、VERO、MDCK、WI38、V79、B14AF28-G3、 BHK、HaK, NSO、SP2/0_Agl4、HeLa, HEK293 (例如,HEK293-F、HEK293-H、HEK293-T)、perC6、 诸如草地贪夜蛾(Sf)的昆虫细胞和诸如酿酒酵母、毕赤酵母和裂殖酵母的真菌细胞。也可 使用这些细胞系的子代、变体和衍生物。应用公开的方法和组合物可用于失活FUT8基因组序列。如上文提到,失活包括部分或 完全抑制细胞中FUT8基因的表达。可例如通过单一切割事件、通过切割然后非同源末端连 接、通过在两个位点切割然后连接以便删除两个切割位点之间的序列、通过错义或无义密 码子靶向重组到编码区、通过不相关序列(即“填充”序列)靶向重组到基因或其调控区以 便破坏基因或调控区,或通过剪接受体序列靶向重组到内含子而引起转录物的错误剪接来 实现FUT8基因的失活。FUT8的ZFN-介导的失活(敲除或抑制)有多种应用。例如,本文描述的方法和组 合物允许产生FutS-缺陷细胞系用于重组蛋白的产生(例如α -抗胰蛋白酶)和/或单 克隆抗体的产生。其中FutS被失活的细胞产生表现出更强效应功能的抗体,特别在ADCC 的诱导中。相似地,其中FutS被部分或完全失活的细胞也可用来产生岩藻糖基化丝氨酸蛋 白酶抑制剂α -抗胰蛋白酶或α -抗胰蛋白酶(Α1ΑΤ)。AlAT在抑制癌转移中发挥作 用(Goodarzi 和 Turner (1995)Chim Acto 236(2) :161_171),并且患有多种癌症的患者 表现出与正常群体中发现的岩藻糖基化相比更严重岩藻糖基化的AlAT(Saitoh等(1993) Archives Biochem. &Biophysics 303 :281_287),表明内源AlAT的岩藻糖基化可导致降低 的功能性。另外,已显示卵巢癌患者中存在岩藻糖基化的AlAT预测了对化疗的无反应性 (Thompson等(1988) Br. J. Cancer 58(5) :89_93)。分离自血浆的α -抗胰蛋白酶已用于 治疗由缺少AlAT引起的肺退化(例如,肺气肿)。在fut8敲除或抑制细胞系中产生AlAT 能产生具有更高一致性和活性的蛋白。因此,本文描述的细胞和细胞系还允许AlAT的有效 产生。也可失活本文描述的FutS缺陷细胞和细胞系中的其他基因。涉及蛋白过量表达的其他基因以及用于失活这些基因的组合物和方法公开于美国专利公布第2006/0063231 和20080015164号,其公开内容通过引用整体并入本文。例如,如实施例5中所公开,使用 本文描述的方法可产生其中Fut8、二氢叶酸还原酶(DHFR)和谷氨酰胺合成酶(GS)已被失 活的细胞。参见实施例5。这些细胞用于过量表达感兴趣的蛋白。
实施例实施例1 :FUT8ZFN的设计和构建α -2和α _6岩藻糖基转移酶中保守的3种基序负责FutS的酶促活性和随后重 组产生的抗体治疗剂的岩藻糖基化。参见,Ihara等(2007)Glycobiology 17:455-66。这 些基序在仓鼠(黑线仓鼠)序列中可容易地鉴定。参见,Oriol等(1999)Glycobiology 9 323-34 Javaud 等(2000)Mol BiolEvol 17:1661-72。特别地,仓鼠 FUT8Fut 基序 II (图 4)与牛和人类基序相同,只有1个氨基酸不同于猪和小鼠的基序。Javaud等(2000)Mol BiolEvol 17 :1661_72。另外,小家鼠(M. musculus)和褐家鼠(R. norvegicus)FUT8 基因组 DNA序列的比对说明黑线仓鼠FUT8基因的内含子9将是足够小的以便可容易地克隆。如下所述克隆黑线仓鼠FUT8 cDNA。衍生自CH0-S细胞的IOngcDNA文 库使用引物 GJC 119F :AACAGAAACTTATTTTCCTGTGT (SEQID NO 31)和 GJC 106R GGTCTTCTGCTTGGCTGAGA(SEQ ID NO 32)进行 PCR 扩增,使用 Τ0Ρ0 (Invitrogen)克 隆并测序。相似地,使用EasyA 聚合酶(Stratagene)和寡核苷酸引物GJC 71F GCTTGGCTTCAAACATCCAG(SEQ ID NO 4)和 GJC 72R :CACTTTGTCAGTGCGTCTGA(SEQ IDNO 33) 从黑线仓鼠基因组DNA中PCR扩增FUT8内含子9。PCR产物被克隆并测序。使用EasyA 聚合酶(Stratagene)和寡核苷酸 GJC 75F :AGTCCATGTCAGACGCACTG (SEQ ID NO 34)和 GJC 77R CAGAACTGTGAGACATAAACTG (SEQ ID NO 35),通过黑线仓鼠基因组 DNA 的 PCR 扩增获得 内含子10的部分序列。然后如上文所述克隆的FUTScDNA、内含子9和内含子10的序列用于设计FUT8内 ZFN的结合。特别地,筛选FUTScDNA(图1)序列的有利于锌指核酸酶识别的位点,并鉴定到 与FutS酶基序重叠的一个此类位置(图4)。另外,还筛选内含子DNA(图3)的潜在的ZFN 结合位点。设计了几对识别FUT8内序列的锌指核酸酶(ZFN)。FUT8基因内两种ZFN位点的大 致位置显示于图4。锌指识别螺旋的序列和设计为锌指螺旋识别的DNA序列列于表1。包 含编码FUT8ZFN的序列的质粒基本上如Urnov等(2005) Nature 435(7042) :646_651所述构建。实施例2 =Cel-I错配测定为了确定FUT8-靶向的ZFN是否如预期修饰内源FUT8基因座,基本上按照制造商 的说明书(Trangenomic SURVEY0RTM)进行Cel-I错配测定。简单地说,将适当的ZFN质粒 对转染进CHO K-I细胞。CHO K-I细胞获自美国典型培养物保藏中心,并如推荐生长于补 充有10%合格的胎牛血清(FCS, Hyclone)的F-12培养基中(Invitrogen) 0使用TrypLE SelectTM蛋白酶(Invitrogen)使细胞与塑料器皿分离。为了转染,一百万个CHO K-I细胞 与1 μ g每种锌指核酸酶混合并且使用程序U-23在Amaxa Nucleofectorll 中转染100 μ L Amaxa Solution Τ.细胞,并恢复于1. 4mL温F-12培养基+10% FCS中。
转染后2天收集细胞,并使用Masterpure DNA纯化试剂盒(Epicentre)制备染 色体DNA。使用Accuprime 高保真DNA聚合酶(Invitrogen)PCR扩增FUT8基因座的适 当区域。将PCR反应加热至94 □,并逐渐冷却至室温。大约200ng退火的DNA与0.33 μ L CEL-I 酶(Transgenomic)混合,并在42 □下孵育20分钟。通过聚丙烯酰胺凝胶电泳于 IX Tris-硼酸-EDTA缓冲液中分析反应产物。如图5A和5B所示,FUT8ZFN修饰内源FUT8基因座。特别地,ZFNl2029和ZFN 12030的ZFN对导致3. 3%的染色体的修饰(图5A)。ZFN对12170/12176和12172/12176 分别修饰3. 0%和4. 4%的染色体(图5B)。实施例3:基因型分析还在遗传水平分析FUT8缺失克隆。为了迅速鉴定双突变体克隆,使用基于岩藻糖 基化缺陷的CHO细胞对凝集素扁豆凝集素(LCA,VectorLaboratories)的抗性进行表型筛 选。CHO细胞系Lecl3含有岩藻糖生物合成基因GMD的突变,这允许其生长于比野生型CHO 细胞高 50 倍的 LCA 浓度中。参见,例如,Ripka 等(1986)Somat Cell Mol Genet 12:51-62; Ohyama 等(1998) J Biol Chem 273:14582-7。FUT8-/-细胞不能结合荧光标记的 LCA。参 见,Yamane-Ohnuki 等(2004) Biotechnol Bioeng 87 :614_22。相应地,我们推测 FUT8-/-细 胞可能也抵抗在LCA中的生长。使用ZFN对12170/12176如实施例2中所述转染细胞,除了在转染后第6和第30 天之间,将ZFN-处理的细胞以限制稀释铺板为96孔形式,大约0. 4个细胞/孔。生长2周 后,记录每孔的克隆数,细胞于IX PBS中洗涤并加入20μ L TrypLE Select (InVitrogen)。 将10微升解离的细胞转移到含有F-12培养基+10% FCS+50 μ g/mL LCA的平行的96-孔板 中。将100微升F-12培养基+10% FCS加入到初始96孔板中剩余10 μ L细胞中。18小时 后记录含有LCA的平板中细胞的形态。注意在LCA存在时保持野生型非圆形CHO-KI形态 的克隆,并且扩展来自未经LCA处理的平板的对应集落。如果发现最初的孔含有不止一种 克隆(并且因此当生长于LCA时也产生圆形和野生型形态细胞的混合物),那么如上文所述 将孔的内含物重新稀释克隆。从未经LCA处理的LCA抗性细胞中收集基因组DNA,并使用寡核苷酸GJC 75F AGTCCATGTCAGACGCACTG(SEQ ID NO 34)和 GJC 9IR :TGTTACTTAAGCCCCAGGC(SEQ ID NO 7) PCR扩增FUT8基因座的一部分。如上文所述使用CEL-I测定分析一半的PCR产物(约200ng),而另一半PCR产物进 行凝胶纯化。为CEL-I阴性(纯合子)的纯化条带直接测序。CEL-I阳性条带进行Topo -克隆(Invitrogen),测序克隆直至恢复两个等位基因。在以这种方式分析的600个克隆中,28个是抗LCA的(4. 7% )。28个LCA-抗性 细胞系中的15个是单细胞克隆。从未暴露于LCA的一半培养物中扩展细胞系。这些克隆 的FUT8基因型显示于表2。此处显示的序列区域与显示于图4的区域相同。5个碱基对的 缺口被插入野生型序列的该描述中以便容纳含有发现于一些克隆中的小插入的等位序列。 等位基因命名为A和B ;没有等位基因名称的克隆是纯合的。克隆12-Β含有黑线仓鼠核糖 体DNA(rDNA)序列的148bp的插入以及指示的缺失。表2 用ZFN对12170/12176处理的LCA抗性克隆
24 对所有测序的克隆,FUT8的两个等位基因都被修饰。5个克隆是纯合的。基因分 型还揭示了具有2至38个碱基对缺失和1至5个碱基对小插入的克隆。克隆12的等位基 因B含有12个碱基对的缺失以及黑线仓鼠rDNA序列的148个碱基对的插入。实施例4 通过双重ZFN修饰破坏FUT8还通过同时转染内含子ZFN对ZFN 12029/12030和外显子对ZFN12172/12176产 生了 FUT8中更大的缺失(FUT8的1300bp,包括外显子10的大部分)。特别地,如上文所述将 1微克每种ZFN 12029、12030、12172和12176转染到CHO K-I细胞中。转染后2天收集细 胞,并纯化基因组DNA。用EcoR I和Xmn I消化DNA来破坏野生型染色体,并使用寡核苷酸 GJC 71F :GCTTGGCTTCAAACATCCAG(SEQ ID NO 4)和GJC 91R :TGTTACTTAAGCCCCAGGC(SEQID NO 7)进行PCR扩增。结果显示于图6A,并且证明产生了预期大小的片段。随后还用具有或不具有LCA富集的靶向FUT8基因的不同ZFN对处理CHO细胞系。如上文实施例2所述用ZFN质粒转染后2天和30天进行CEL-I测定。如图6B所示,LCA处理导致FUT8-/-细胞百分比的显著增加。实施例5 其他基因的失活还产生其中FUT8和其他基因被失活的细胞系。特别地,如美国专利公布第 2006/0063231和U. S. 2008/015164号所述设计和构建针对DHFR和GS的锌指核酸酶。如 实施例2所述将编码DHFR-靶向ZFN和GS-靶向ZFN的质粒引入CHO细胞以产生GS+/ DHFR+CH0细胞系。然后,用靶向FUT8基因的4对不同的ZFN(库1、3、5和7)处理GS+/DHFR+CH0细 胞系。每个库经受LCA来选择其中FUT8的表达被破坏的群体(图7,具有LCA富集)。如 上文所述对LCA选择的和未选择(图7,没有LCA富集)的库进行CEL-I测定。如图7所示,LCA选择的库中FUT8基因破坏的拷贝的频率高达34% (具有LCA富 集的库1)。基本上如上文实施例3中所述,还对分离自库编号1或库编号5的各种三重敲除 克隆进行基因分型分析。如图8所示,在从库编号1筛选的75个克隆中,33个(或约44% ) 克隆在FUT8基因的两个拷贝都被修饰。最后还测试其中通过用ZFN处理破坏了 DHFR、GS和FUT8的CHO细胞结合荧 光LCA的能力。大约100,000个细胞用胰蛋白酶消化、于IXPBS中洗涤,并与2 μ g/mL荧 光素-LCA(F-LCA)混合。通过流式细胞术测定F-LCA的结合(Yamane-Ohnuki等(2004) Biotech. Bioeng. 87 614)。如图9所示,荧光LCA不结合其中GS、DHFR和FUT8基因被破坏 的细胞。因此,其中FUT8和1种、2种(或多种)基因的任一种被失活的细胞用于表达(过 量表达)感兴趣的重组蛋白。这些结果显示使用靶向切割FUT8基因的ZFN可迅速产生Fut8_缺陷细胞系。通 过切割位点处NHEJ的易错过程的DNA修复导致功能上有害的突变。尽管相对于通过传统 基因破坏产生的突变,NHEJ-衍生的突变有时小,本文描述的ZFN靶向对编码FUT8关键催 化区的DNA的这些突变的能力确保甚至小的且符合读码框的等位基因将导致酶活性的严 重缺陷。例如,仅亮氨酸413的纯合缺失(克隆5、8、9和15)造成抗LCA的细胞。此外,尽管存在许多不同亚型的通常具有订制的遗传或表型改变的CHO细胞系, 本文描述的ZFN可用来迅速破坏任何细胞系或亚型中的FUT8。另外,由于可选择在哺乳动 物物种之间保守的锌指蛋白结合位点,ZFN可设计为在来自任何物种的细胞系中无活性的 FUT8。实施例6 :Fut8亚等位基因一些具有FUT8的ZFN修饰的CHO细胞可保留其野生型Fut8活性的一部分。此类 细胞可抵抗用来进行最初筛选的相对低浓度的LCA (50 μ g/mL),但保持对更高浓度LCA的 敏感性。如实施例2所述转染细胞并筛选其对50 μ g/mL LCA的抗性,如实施例3进行基因 分型。单种克隆的CEL-I测定和这些克隆的一些基因型显示于图10。用50 μ g/mLLCA的初 级筛选之后,用更高浓度的LCA对这些最初ZFN修饰的LCA抗性细胞系进行次级筛选以鉴 定亚等位基因。测定抵抗50 μ g/mL LCA的细胞系在100、200、400和800 μ g/mL LCA中的 生长。以这种方式测试的16种细胞系中的11种表现出在800 μ g/mLLCA的野生型的生长和细胞形态。测试的16种细胞系中的5种表现出仅在低于800 μ g/mL的LCA浓度下的野 生型的生长和细胞形态。因此具有中等LCA抗性的这5种克隆是FutS活性的亚等位基因。 FutS亚等位基因性与ZFN结合位点之间3个核苷酸(ATT)的插入的存在具有很好的相关 性。该插入在黑线仓鼠FutS蛋白的位置415处增加了一个亮氨酸残基。预测每个这些克 隆中的另一个等位基因消除了酶活性。这5种克隆中的2种是克隆14和克隆19,并显示于 图10中。在LCA抗性滴定中发现的亚等位基因通过测定荧光-LCA (F-LCA)与暴露于细胞表 面的α 1-6-连接的岩藻糖的结合得到证实。对每个分析的细胞系,大约100,000个细胞用 胰蛋白酶消化,于IXPBS中洗涤,并与2 μ g/mL荧光素-LCA(F-LCA)混合。通过流式细胞术 测定F-LCA的结合(GuavaTechnologies)。通过F-LCA结合检查的所有亚等位基因克隆具 有比野生型低约5倍的F-LCA结合;抵抗800 μ g/mL LCA的所有克隆没有显示结合F-LCA 的能力。野生型CHO-KI细胞和一个此类亚等位基因克隆的染色显示于图11中。本文提到的所有专利、专利申请和公布通过弓I用整体并入本文。尽管为了清楚和理解的目的,通过例证和实施例较详细地提供了本公开内容,对 本领域的技术人员明显的是,可进行各种改变和修饰,而不偏离本公开内容的精神和范围。 相应地,上述说明书和实施例不应解释为限制性的。
权利要求
一种锌指DNA结合结构域,其中所述DNA结合结构域包含从N末端至C末端顺序为F1至F4的4种锌指识别区,并且其中F1、F2、F3和F4包含以下氨基酸序列F1QSSDLSR(SEQ ID NO9);F2TSGNLTR(SEQ ID NO10);F3RSDDLSK(SEQ ID NO11);和F4DRSALAR(SEQ ID NO12)。
2.一种锌指DNA结合结构域,其中所述DNA结合结构域包含从N末端至C末端顺序为 Fl至F4的4种锌指识别区,并且其中Fl、F2、F3和F4包含以下氨基酸序列Fl :RSDVLSA(SEQ ID NO 14) F2 :QNATRIN(SEQ ID NO 15) F3 :DRSNLSR(SEQ ID NO: 16);禾口 F4 :RLDNRTA(SEQ ID NO 17)。
3.一种锌指DNA结合结构域,其中所述DNA结合结构域包含从N末端至C末端顺序为 Fl至F6的6种锌指识别区,并且其中Fl、F2、F4、F5和F6包含以下氨基酸序列Fl :RSDNLSV(SEQ ID NO 19) F2 :QNATRIN(SEQ ID NO 15) F4 :QSATRTK(SEQ ID NO 21) F5RSDNLSR(SEQ ID NO 22);禾口 F6 :RNDNRKT(SEQ ID NO 23)。
4.如权利要求3所述的锌指DNA结合结构域其中F3包含RSDNLST(SEQ ID NO 20)。
5.如权利要求3所述的锌指DNA结合结构域,其中F3包含RSDHLSQ(SEQID NO 24)。
6.一种锌指DNA结合结构域,其中所述DNA结合结构域包含从N末端至C末端顺序为 Fl至F5的5种锌指识别区,并且其中Fl、F2、F3、F4和F5包含以下氨基酸序列Fl :RSDNLRE(SEQ ID NO 26) F2 :NNTQLIE(SEQ ID NO 27) F3 :TSSILSR(SEQ ID NO 28) F4RSDNLSA (SEQ ID NO 29);禾口 F5 :RKDTRIT(SEQ ID NO 30)。
7.一种融合蛋白,其包含如权利要求1至6的任一项所述的锌指DNA结合结构域,并且 还提供了至少一个切割结构域或至少一个切割半结构域。
8.如权利要求7所述的融合蛋白,其中所述切割半结构域是野生型FokI切割半结构域。
9.如权利要求8所述的融合蛋白,其中所述切割半结构域是改造的FokI切割半结构域。
10.一种多核苷酸,其编码如权利要求1至9的任一项所述的任何蛋白。
11.一种分离细胞,其包含如权利要求1至9的任一项所述的任何蛋白或如权利要求 10所述的多核苷酸。
12.如权利要求11所述的细胞,其中FutS被部分失活。
13.如权利要求11所述的细胞,其中FutS被完全失活。
14.如权利要求11-13的任一项所述的细胞,其中一种或多种另外的基因被部分或完全失活。
15.如权利要求14所述的细胞,其中二氢叶酸还原酶(DHFR)和谷氨酰胺合成酶(GS) 已被失活。
16.一种细胞系,其中FutS被部分或完全失活。
17.一种失活细胞中内源细胞FUT8基因的方法,所述方法包括 (a)将编码第一多肽的第一核酸引入细胞,其中所述第一多肽包含⑴改造为结合内源FUT8基因内第一靶位点的锌指DNA结合结构域;和 ( )切割结构域;以便所述多肽在细胞中表达,其中所述多肽结合所述靶位点并切割 所述FUT8基因。
18.如权利要求17所述的方法,其进一步包括引入编码第二多肽的核酸,其中所述第 二多肽包含⑴改造为结合内源FUT8基因内第二靶位点的锌指DNA结合结构域;和 ( )切割结构域;以便所述第二多肽在细胞中表达,其中所述第一和第二多肽结合其 各自的靶位点并切割所述FUT8基因。
19.如权利要求18所述的方法,其中所述第一和第二多肽由相同的核酸编码。
20.如权利要求18所述的方法,其中所述第一和第二多肽由不同的核酸编码。
21.一种在宿主细胞产生感兴趣的重组蛋白的方法,所述方法包括以下步骤(a)提供包含内源FUT8基因的宿主细胞;(b)通过如权利要求17至21的任一项所述的方法失活宿主细胞的内源FUT8基因;和(c)将包含转基因的表达载体引入所述宿主细胞,由此产生重组蛋白,所述转基因包含 编码感兴趣蛋白的序列。
22.如权利要求21所述的方法,其中所述感兴趣的蛋白包含抗体。
23.一种细胞系,其中Fut 8被部分或完全失活,其中所述细胞系通过以下步骤产生(a)如权利要求17至20的任一项所述的方法失活细胞中的FutS;和(b)在适合产生其中FutS被部分或完全失活的细胞系的条件下培养所述细胞。
24.如权利要求23所述的细胞系,其中所述细胞是选自由以下细胞组成的组的哺乳动 物细胞C0S细胞、CHO细胞、VERO细胞、MDCK细胞、WI38细胞、V79细胞、B14AF28-G3细胞、 BHK细胞、HaK细胞、NSO细胞、SP2/0_Agl4细胞、HeLa细胞、HEK293细胞和perC6细胞。
全文摘要
本文公开了使用包含锌指蛋白和切割结构域或切割半结构域的融合蛋白来失活FUT8基因的方法和组合物。还提供了编码所述融合蛋白的多核苷酸,以及包含所述多核苷酸和融合蛋白的细胞。
文档编号C12N15/00GK101883850SQ200880103421
公开日2010年11月10日 申请日期2008年7月10日 优先权日2007年7月12日
发明者G·J·柯斯特, T·科林伍德 申请人:桑格摩生物科学股份有限公司