专利名称::切割来自人血红蛋白β基因的DNA靶序列的大范围核酸酶变体及其用途的制作方法切割来自人血红蛋白β基因的DNA靶序列的大范围核酸酶变体及其用途本发明涉及切割来自人血红蛋白β基因的DNA靶序列的大范围核酸酶(meganuclease)变体,编码所述变体的载体,经所述载体修饰的细胞,动物或植物以及所述大范围核酸酶变体及衍生产物用于离体基因组疗法(基因细胞疗法)和基因组工程(genomeengineering)的用途。血红蛋白(haemoglobin或Hb)负责通过红细胞将氧从肺携带至身体的多个部分,供细胞呼吸使用。成熟的血红蛋白(正常成人血红蛋白或HbA)是四聚体蛋白,其由两类蛋白质组成两条α链和两条β链。血红蛋白β链通常被称作β珠蛋白(β-珠蛋白)。血红蛋白的每个蛋白亚基均带有称作血红素(heme)的含铁分子,其负责氧结合。完整的血红蛋白能够一次携带四个氧分子。编码血红蛋白β链的基因(HBB基因或β珠蛋白基因)位于11号染色体短(P)臂上的位置15.5(11ρ15.5)。其由3个外显子组成,所述3个外显子分布在基因组DNA的1606个碱基对上(登录号GenBankNC_000011.8或ΝΤ_009237·17)。mRNA(626_bp;登录号GenBankNM_00518.4)被翻译为HBB多肽链的147个氨基酸的序列[登录GenBankNP_00509.1;OnlineMendelianInheritanceinMan,OMIM(TM).JohnsHopkinsUniversity,Baltimore,MD.MIMNo.141900(2001年11月6日)]。已在HBB基因中鉴定了数百种改变。这些改变中的一些导致产生异常的血红蛋白形式,通常用字母表中的字母命名,有时也用名称命名。这些异常的血红蛋白形式引起镰状细胞病(sicklecelldisease)(镰状细胞综合征或镰状细胞贫血综合征),包括镰状细胞贫血(HbSS),血红蛋白SC(HbSC)和血红蛋白SE(HbSE),(Park,K.W.,Int.Anesthesiol.Clin.,2004,42,77-93;Stuart,Μ.J.和NagelR.L.,Lancet,2004,364,1343-1360)。称作β地中海贫血的另一些病症由消除或减少血红蛋白β珠蛋白亚基产生的许多遗传突变引起。当产生血红蛋白S和β地中海贫血的突变同时发生时,引起镰状血红蛋白-β地中海贫血(HbSBetaThal)。镰状细胞病是一类遗传性血红蛋白病症,其特征是慢性溶血性贫血,对感染的易感性提高,器官损伤以及引起急性和慢性疼痛的血管阻塞(Ashley-Koch等,AmericanJournalofEpidemiology,2000,151,839-845;Themetabolic&molecularbasesofinheriteddisease,第八版,Scriver,C.R.,c2001:p4571-4636,McGraw-Hill,NewYork)。据估计,70,000名不同人种背景的美国人患有镰状细胞病,并且每400个美国黑人中有一个患有镰状细胞综合征。来自地中海盆地、中东和印度人群也以高发生率患该疾病。引起镰状细胞病的最常见的β血红蛋白变体是血红蛋白S或HbS,其涉及用缬氨酸替换β珠蛋白链上6位的谷氨酸(E6V)。在常见的镰状细胞病形式——镰状细胞贫血(HbSS)中,血红蛋白S或HbS代替了血红蛋白中的两个β血红蛋白亚基(Ashley-Koch等,Am.J.Epidemiol.2000,151,839-845;Sicklecelldisease,SergeantG,OxfordUniversityPress:0xford,1985)。该突变导致异常的HbS亚基粘合在一起,并形成长而僵硬的分子。僵硬的HbS分子将红细胞弯曲成镰刀形,在未成熟时即死亡。因此,该突变导致红细胞的短缺(贫血)。镰状细胞还能够阻断小血管,引起疼痛或器官损伤。在另一些类型的镰状细胞病中,只有一个β血红蛋白亚基被血红蛋白S代替。另一β血红蛋白亚基被不同的异常变体例如血红蛋白C或血红蛋白E代替。例如,在血红蛋白SC(HbSC)疾病中,β血红蛋白亚基被血红蛋白S和血红蛋白C代替。该病症的严重程度高度可变,但是其可以与镰状细胞贫血一样严重。血红蛋白C(HbC)在西非后裔人群中比在其他种群中更加常见,由赖氨酸对6位谷氨酸的替换所致(Ε6Κ)。血红蛋白E(HbE)是主要存在于东南亚人中的血红蛋白变体。突变的蛋白质由赖氨酸对26位谷氨酸的替换所致(Ε26Κ)。HBB中的缺陷是β-地中海贫血症的病因(TheinSL.,Br.J.Haematol.,2004,124,264-274)。其主要发生于地中海和东南亚人群中。已鉴定了多于200种引起β地中海贫血症的HBB突变。大部分突变涉及HBB基因内单核苷酸的改变,但是也报道了插入或缺失。地中海贫血症的标志是成体HbA分子中珠蛋白链产生方面的失衡。β链的缺失引起β(0)-地中海贫血症,而可检测β珠蛋白量的降低引起β(+)_地中海贫血症。在严重的地中海贫血症形式中,过量的α珠蛋白链在骨髓中正在发育的红细胞前体中累积。它们的沉积导致红细胞凋亡大幅提高,这进而引起无效的红细胞生成和严重的小红细胞低色素性贫血(microcytichypochromicanemia)。镰状细胞患者中最常见的问题是主要是骨端、背、胸和腹部的疼痛发作(Dwarakanath,GK.禾口WarfieldC.,Hosp.Pract.,1986,64b;FieldsH.L.禾口LevineJ.D.,West.J.Med.1984,347,141-143;Vichinski等,Am.J.Ped.Hemato1.Oncol.,1982,4,328)。剧烈疼痛的确切原因还不了解。可能是由镰状红细胞产生的血流阻塞和沉积所导致的炎性应答引起的。疼痛发作通常通过使用镇痛剂来控制。然而,尽管存在疼痛,但是最严重的危及生命的并发症是细菌感染和脾隔离危象(splenicsequestrationcrisis)。细菌感染是镰状细胞病患者死亡的主要原因之一(Barrett-Connor,Ε.,Medicine,1971,50,97-112),特别是当儿童小于三岁时。因为在镰状细胞贫血中脾功能降低或丧失,所以患者有被包膜生物感染的高度风险,所述生物例如肺炎链球菌(Str印tococcuspneumoniae)、流感嗜血杆菌(Haemophilusinfluenzae)、沙门氏菌(Salmonella)、脑膜炎双球菌(Meningococcus)等[Powars等,JAMA,1981,245,1839-1842]。因此,在幼儿中总是规定使用预防性青霉素(Gaston等,N.Engl.J.Med.,1986,314,1593-99)。脾隔离危象是最严重的并发症之一,并且是镰状细胞病婴儿死亡的第二原因。该事件通常发生在四个月至三岁之间。在隔离发作时,镰状细胞被困在脾中,引起血红蛋白水平迅速下降以及脾肿大以及其他并发症。目前唯一的治疗由侵入性输血构成。有时需要紧急进行脾切除(Vichinsky等,NEngl.J.Med.,1995,222,206-213;Haberkern等,Blood,1995,86,142a)。每日施用口服抗镰状剂(anti-sicklingagent)如羟基脲(Hydrea)是第一种证明在镰状细胞病中提供显著益处的有效疗法(SteinbergΜΗ.,ScientificWorldJournal,2002,2,1706-1728;MehannaA.S.,Curr.Med.Chem.,2001,8,79-88;Charache等,N.Engl.J.Med.,1995,332,1317-1322)。然而,羟基脲的长期益处和毒性是未知的。因此对危及生命的并发症而言,目前输血仍然是最好的急性疗法。第二种策略将是骨髓移植。它已用于将美国的27位患者从血红蛋白SS成功转化为正常的AA或AS(取决于相关骨髓供体的表型)。然而,骨髓移植仍然是一种实验性疗法,其仅限于这样的患者所述患者中镰状细胞病并发症和骨髓移植长期并发症已多至足以导致死亡危险(10%死亡率),并且还有具有相同HLA匹配的兄弟姐妹(Walters等,NewEngl.J.Med.,1996,355,369-376;Walters等,Biol.BloodMarrowTransplant.,1996,2,100-104)。同种异体(allogenic)造血干细胞(HSC)移植是根治性的,但是该治疗选择对大部分患者而言是不可用的。因此,转移自体HSC中受调节的珠蛋白基因代表了一种具有高度吸引力的替代性治疗(TisdaleJ.和Sadelain,Μ.,Semin.Hematol.,2001,38,382-392)。HBB似乎是基因疗法的极佳候选者该基因很小并且已被充分表征;病症是隐性遗传的并且影响血细胞。然而,1980年的初次尝试失败了,主要是因为无效的基因转移和所引入珠蛋白基因的较差表达。尽管关于HBB基因获得了多得多的知识,但是之后没有进行基因疗法的尝试。这是由于需要在期望的细胞中对基因表达进行非常严密的控制。事实上,产生的β-珠蛋白的量必须等于α-珠蛋白的量,因为β-珠蛋白和α-珠蛋白链之间的失衡会导致α-地中海贫血表型(SadelainM.等,Best.Pract.Res.Clin.Haematol.,2004,17,517-534)。尽管如此,离体基因疗法似乎是非常吸引人的,并且至少在小动物如小鼠中达到了巨大的成就。通过敲除内源α-和β-珠蛋白基因和敲入人α-、βS-和γ-珠蛋白基因,获得了不同的人源化镰状细胞贫血(SCA)小鼠模型(Paszty等,Science1997,278,876-878;Ryan等,Science,1997,278,873-876;Chang等,Proc.Nat.Acad.Sci.USA,1998,95,14886-14890),所述镰状细胞小鼠再现了人镰状细胞病中存在的主要特性。可以通过将慢病毒载有的人珠蛋白基因整合进骨髓细胞中来逆转镰状细胞表型(May等,Blood,2002,99,1902-1908;Pawliuk等,Science,2001,294,2368-2371),这提供了朝向真实的人基因疗法的第一步。靶向同源重组是可能避免目前方法所引起的问题的另一种选择。目前的基因治疗策略基于回补方法,其中随机插入但是有功能的额外基因拷贝提供了突变的内源拷贝的功能。相反,同源重组会允许精确地原位矫正突变(图1A)。同源重组(HR)是一种非常保守的DNA修复途径,其涉及DNA双链断裂(DSB)和其他DNA损伤的修复(Rothstein,MethodsEnzymol.,1983,101,202-211;Paques等,MicrobiolMolBiolRev,1999,63,349-404;Sung等,Nat.Rev.Mol.Cell.Biol.,2006,7,739-750),但是也是许多生物学现象的基础,例如减数分裂中等位基因的减数分裂再分布(Roeder,GenesDev.,1997,11,2600-2621)、酵母中的接合型互换(Haber,Annu.Rev.Genet.,1998,32,561-599)以及I类内含子和蛋白内含子(intein)到新等位基因的“归巢”。HR通常促进内源序列之间遗传信息的交换,但是在基因靶向实验中,其被用于促进内源染色体序列与外源DNA构建体之间的交换。基本上,向细胞核中引入与所靶向的序列具有同源性的DNA,内源的同源重组机器提供了接下来的步骤(图1A)。同源基因靶向策略已用于在染色体中敲除内源基因(Capecchi,Μ.R.,Science,1989,244,1288-1292;Smithies,0.,NatureMedicine,2001,7,1083-1086)或敲入(knock-in)外源序列。其同样也可用于基因矫正,并原则上用于矫正与单基因疾病相关的突变。然而,由于该过程的低效率(转染细胞的10_6到10_9),该应用事实上是困难的。最近,基因靶向方法被用于矫正来自模型SCA小鼠的ES细胞中的人β-S-珠蛋白基因(Chang等,Proc.Nat.Acad.Sci.USA,2006,103,1036-1040;Wu等,Blood,2006,108,1183-1188)。然而,由于该方法固有的低效性,不得不使用经典的选择方案。在最近十年中,已开发了若干种方法来增强这一产率。例如,嵌合修复术(chimeraplasty)(deSemir,Nadal等2003)和小片段同源替换(Goncz,Colosimo等2001;Bruscia,Sangiuolo^2002;Sangiuolo,Bruscia^2002;DeSemirandAran2003)BU用于尝试矫正CFTR突变,并取得了不同程度的成功。增强重组效率的另一策略是使用大范围核酸酶向靶基因座中递送DNA双链断裂。大范围核酸酶定义为识别大序列的序列特异性内切核酸酶(Thierry,A.andB.Dujon,NucleicAcidsRes.,1992,20,5625-5631)。它们能够在活细胞中切割独特的位点,从而将切割位点附近的基因靶向增强1000倍或更多(Puchta等,NucleicAcidsRes.,1993,21,5034-5040;Rouet等,Mol.Cell.Biol.,1994,14,8096-8106;Choulika等,Mol.Cell.Biol.,1995,15,1968—1973;Puchta等,Proc.Natl.Acad.Sci.U.S.Α.,1996,93,5055-5060;Sargent等,Mol.Cell.Biol.,1997,17,267-277;Cohen-Tannoudji等,Mol.Cell.Biol.,1998,18,1444-1448;Donoho,等,Mol.Cell.Biol.,1998,18,4070-4078;Elliott等,Mol.Cell.Biol.,1998,18,93-101)。这样的大范围核酸酶可用于矫正造成单基因遗传疾病的突变。矫正遗传缺陷的最精准方法是使用带有未突变基因拷贝的修复基质(repairmatrix),得到突变的回复。然而,基因矫正的效率随着突变与DSB之间距离的增长而降低,200bp的距离降低五倍。因此,可使用给定的大范围核酸酶矫正仅在其DNA靶标附近的突变。图IB中展示了称为“外显子敲入”的替代方案。在该情况下,可以使用在基因5'部分进行切割的大范围核酸酶将功能性外显子序列敲入有害突变的上游。尽管该方法将转基因置于其常规位置,但是它也引起外显子重复(exonsduplication),其长期影响尚待评价。另外,如将天然顺式作用元件置于切割下游的内含子中,则其直接环境将被改变,其固有功能也有待于探索。然而,该方法具有一个巨大的优点一种大范围核酸酶可用于许多不同的患者。然而,尽管鉴定了数百种天然的大范围核酸酶(也称作“归巢内切核酸酶”)(Chevalier,B.S.和B.L.Stoddard,NucleicAcidsRes.,2001,29,3757-3774),但可切割序列的种类过于有限而不能应对基因组的复杂度,在选定的基因中常常没有可切割的位点。例如,人HBB基因中没有已知天然大范围核酸酶的切割位点。理论上,产生具有选定特异性的人造序列特异性内切核酸酶能够缓解这一局限性。因此,具有定制特异性的大范围核酸酶的产生处于紧张的研究中。最近,使用了锌指蛋白(ZFPs)与FokI(—种IIS类限制性内切核酸酶)催化结构域的融合物来产生功能性序列特异性内切核酸酶(Smith等,NucleicAcidsRes.,1999,27,674-681;Bibikova等,Mol.Cell.Biol.,2001,21,289-297;Bibikova等,Genetics,2002,161,1169-1175;Bibikova等,Science,2003,300,764;Porteus,Μ.H.andD.Baltimore,Science,2003,300,763-;Alwin等,Mol.Ther.,2005,12,610-617;Urnov等,Nature,2005,435,646-651;Porteus,Μ.H.,Mol.Ther.,2006,13,438-446)。这些核酸酶最近可用于改造来自淋巴谱系的人细胞中的IL2RG基因(Urnov等,Nature,2005,435,646-651)。Cys2-His2型锌指蛋白的结合特异性是容易操纵的,可能因为它们代表了简单(特异性基本上由每个锌指上的四个残基决定)和模块化的系统(Pabo等,Annu.Rev.Biochem.,2001,70,313-340Jamieson等,Nat.Rev.DrugDiscov.,2003,2,361-368)。来自Pabo(Rebar,E.J.和C.0.Pabo,Science,1994,263,671-673;Kim,J.S.和C.0.Pabo,Proc.Natl.Acad.Sci.USA,1998,95,2812—2817)、Klug(Choo,Y.禾口A.Klug,Proc.Natl.Acad.Sci.USA,1994,91,11163-11167;IsalanΜ.禾口A.Klug,Nat.Biotechnol.,2001,19,656-660)和Barbas(Choo,Y.和A.Klug,Proc.Natl.Acad.Sci.USA,1994,91,11163-11167;IsalanΜ.和A.Klug,Nat.Biotechnol.,2001,19,656-660)实验室的研究产生了能够结合大部分G/ANNG/ANNG/ANN序列的多种新人工ZFP。然而,ZFP可能具有其局限性,特别是对于需要极高水平特异性的应用(如治疗应用)而言。最近显示融合物中的FokI核酸酶活性通过DNA环作用于一个识别位点或被不同距离隔开的两个位点,包括存在一些DNA结合缺陷的FokI突变体时(Catto等,NucleicAcidsRes.,2006,34,1711-1720)。因此,特异性可以是非常退化的,如在哺乳动物细胞和果蠅(Bibikova等,Genetics,2002,161,1169-1175;Bibikova等,Science,2003,300,764-)中的毒性所显示的。在自然界中,大范围核酸酶基本上由归巢内切核酸酶(HomingEndonuclease)代表。归巢内切核酸酶(HE)是一种广泛的天然大范围核酸酶家族,包括数百个蛋白质家族(Chevalier,B.S.和B.L.Stoddard,NucleicAcidsRes.,2001,29,3757-3774)。这些蛋白质由可动遗传因子编码,所述可动遗传因子通过称作“归巢”的过程繁殖内切核酸酶切割其中不存在该可动遗传因子的同源等位基因,从而刺激同源重组事件,所述事件将该可动DNA复制进受者基因座。考虑到它们在效率和特异性方面的特有切割特性,它们可代表产生新的高度特异性内切核酸酶的理想骨架(scaffold)。HE属于四个主要的家族。LAGLIDADG家族(根据涉及催化中心的保守肽基序命名)是分布最广和最充分表征的一组。目前能够获得七种结构。尽管来自该家族的大部分蛋白质是单体的并展示两种LAGLIDADG基序,但是少数仅具有一个基序,发生二聚化以切割回文或假回文的靶序列。尽管LAGLIDADG肽是该家族成员中唯一的保守区,但是这些蛋白质共有非常类似的结构(图2A)。催化核心侧翼是两个DNA结合结构域,对同二聚体(如I-CreI(Chevalier,等,Nat.Struct.Biol.,2001,8,312-316)和I-MsoI(Chevalier等,J.Mol.Biol.,2003,329,253-269))而言具有完全的二重对称性,对单体(如I-SceI(Moure等,J.Mol.Biol.,2003,334,685-69),I-DmoI(Silva等,J.Mol.Biol.,1999,286,1123-1136)或I-AniI(Bolduc等,GenesDev.,2003,17,2875-2888))而言具有假对称性。两个单体或两个结构域(对于单体蛋白质而言)组成组织在二价阳离子周围的催化核心。就在催化核心上方的两个LAGLIDADG肽也在二聚化界面中起关键作用。DNA结合依赖于位于DNA大沟上的两个典型的鞍形ββαββ折叠。其他结构域可见于蛋白内含子(如PI-PfuI(Ichiyanagi等,J.Mol.Biol.,2000,300,889-901)和PI-SceI(Moure等,Nat.Struct.Biol.,2002,9,764-770)中,其蛋白质剪接结构域也参与DNA结合。通过将N端I-DmoI结构域与I-CreI单体融合来产生功能性嵌合大范围核酸酶(Chevalier等,Mol.Cell.,2002,10,895-905;Epinat等,NucleicAcidsRes,2003,31,2952-62;国际PCT申请WO03/078619和TO2004/031346)已证明了LAGLIDADG蛋白的可塑性。此外,不同的小组还使用半推理性方法来局部改变I-CreI(Seligman等,Genetics,1997,147,1653-1664;Sussman等,J.Mol.Biol.,2004,342,31-41;国际PCT申请WO2006/097784和WO2006/097853;Arnould等,J.Mol.Biol.,2006,355,443-458;Rosen等,NucleicAcidsRes.,2006,34,4791-4800;Smith等,NucleicAcidsRes.,2006,34,el49),I-SceI(Doyon等,J.Am.Chem.Soc.,2006,128,2477-2484),PI-SceI(Gimble等,J.Mol.Biol.,2003,334,993-1008)和I-MsoI(Ashworth等,Nature,2006,441,656-659)的特异性。另外,通过将半推理方法和高通量筛选组合在一起,改造了具有局部改变之特异性的数百种I-CreI衍生物-诱变I-CreI的残基Q44,R68和R70或Q44,R68,D75和177,并通过筛选(国际PCT申请WO2006/097784和WO2006/097853;Arnould等,J.Mol.Biol.,2006,355,443-458;Smith等,NucleicAcidsRes.,2006,34,el49)鉴定在DNA靶标(5NNNDNA靶标)的士3到5位中具有改变特异性的变体集合。-诱变I-CreI的残基K28,N30和Q38,N30,Y33和Q38或K28,Y33,Q38和S40,并通过筛选(Smith等,NucleicAcidsRes.,2006,34,el49;国际PCT申请WO2007/060495和TO2007/049156)鉴定在DNA靶标(10NNNDNA靶标)的士8到10位中具有改变特异性的变体集合。将两个不同的变体组合并装配在能切割嵌合靶标的一个功能性异二聚体内切核酸酶中,所述嵌合靶标得自每个变体DNA靶序列中不同一半的融合物(Arnould等,precited;国际PCT申请WO2006/097854和W02007/034262),如图2B中所示。有趣的是,新蛋白保持了正确的折叠和稳定性,高活性和窄特异性。另外,I-CreI的28到40位以及44到77位残基显示形成两个可分离的功能性亚结构域,其能够结合归巢内切核酸酶半位点的不同部分(Smith等NucleicAcidsRes.,2006,34,el49;国际PCT申请WO2007/049095和WO2007/057781)在相同单体内组合I-CreI中两个亚结构域的突变使得能够设计出新的嵌合分子(同二聚体),其能切割含有通过各亚结构域结合的士3至5位以及士8至10位的核苷酸的回文组合DNA靴序列(Smith等,NucleicAcidsRes.,2006,34,el49;国际PCT申请WO2007/060495和W02007/049156),如图2C所示。所述两个前述步骤的组合允许进行包括4种不同亚结构域的更大的组合方法。可分别修饰不同的亚结构域,并将其组合以获得完全重新设计的具有选定特异性的大范围核酸酶变体(异二聚体或单链分子),如图2D所示。在第一步中,将几对新的大范围核酸酶组合在切割来自希望切割之靶标的回文靶标的新分子(“半大范围核酸酶”)中。然后,这种“半大范围核酸酶”的组合可得到切割目的靶标的异二聚体种类。在Smith等(NucleicAcidsRes.,2006,34,el49)和Arnould等,(J.Mol.Biol.,Epub10May,2007)中分别描述了将4组突变组装成切割模型靶序列或来自人RAGl和XPC基因的序列的异二聚体内切核酸酶。这些变体可用于切割天然染色体序列,并在包括基因治疗的几个领域中开辟了具有新前景的道路。然而,尽管士1和士2位碱基对不显示与蛋白质有任何接触,但是已显示这些位置并非没有信息含量(Chevalier等,J.Mol.Biol.,2003,329,253-269)(特别是对于士1位碱基对而言),并且可以是额外的底物特异性的来源(Argast等,J.Mol.Biol.,1998,280,345-353Jurica等,Mol.Cell.,1998,2,469-476;Chevalier,B.S.andB.L.Stoddard,NucleicAcidsRes.,2001,29,3757-3774)。对随机诱变的可切割的I-Crel靴标(Argast等,前文所述)进行的体外选择揭示了这四个碱基对对于蛋白质结合和切割活性的重要性。已提出,存在于活性位点中的有序水分子网络对于DNA靶标的定位是重要的(Chevalier等,Biochemistry,2004,43,14015-14026)。另外,I-CreI结合后该区域中出现的广泛的构象改变表明,四个中心核苷酸可对底物特异性做出贡献,可能是通过序列依赖性的构象偏好来实现(Chevalier等,2003,前文所述)。因此,尚不清楚在10NNN和5NNNDNA靶标上被鉴定为切割回文序列(四个中心核苷酸为gtac)之同二聚体的突变体是否允许设计新的内切核酸酶,所述内切核酸酶会切割在四个中心核苷酸中含有改变的靶标。本发明人在人β珠蛋白基因中鉴定了一系列能够被I-CreI变体切割的DNA靶标(表I和图16)。使用图2D中描述的组合方法完全重新设计I-CreI蛋白质的DNA结合结构域,并进而改造出具有完全改造的特异性的新大范围核酸酶,以切割来自人HBB基因的两种DNA靶标(ΗΒΒ5和ΗΒΒ8),所述靶标与I-CreIC122122bp回文位点的区别分别为16个核苷酸(包括四个中心核苷酸中的3个(-2,+1,+2位))(HBB5;图4)和15个核苷酸(包括四个中心核苷酸中2个(+1,+2位))(HBB8;图5)。尽管最初分别针对核苷酸10NNN和5NNN鉴定了组合变体,并且观察到靶标的四个中心核苷酸对经改造大范围核酸酶之活性的强烈影响,但是仍然选择出具有重大的特异性改变的功能性大范围核酸酶。另外,与I-CreI蛋白质的活性相比,可以通过随机诱变和筛选显著改进所改造蛋白质的活性。能够切割来自人HBB基因的基因组DNA靶标的I-CreI变体可用于镰状细胞病和β地中海贫血症的基因组疗法,以及β珠蛋白基因座上的基因组改造(动物模型和重组细胞生产)。例如,位于HBB编码外显子1中的称作ΗΒΒ6的DNA靶标(SEQIDNO4的1138至Ij1159位;图3)与突变后导致镰状细胞贫血和HbSC的谷氨酸密码子重叠,并与突变后导致HbSE的谷氨酸密码子接近。在下述HbS等位基因中,ΗΒΒ6序列被ΗΒΒ8序列代替,所述HbS等位基因与野生型基因的区别是1148位从A到T的颠换,所述颠换将谷氨酸密码子(GAG;SEQIDNO4的1147位到1149位)改变为缬氨酸密码子(GIG)。称作HBB5的DNA靶标位于HBB基因内含子1的起点处(SEQIDNO4的1237到1258位;图3),与导致镰状细胞贫血(1147到1149位的GTC密码子;E6V突变)、HbSC(1147到1149位的MG密码子;E6K突变)和HbSE(1207到1209位的_密码子;E6K突变)的突变谷氨酸密码子接近。切割HBB8或HBB5的大范围核酸酶可用于矫正E6V突变。切割HBB5的大范围核酸酶也还用于矫正β珠蛋白链6位上的其他突变(HbC:E6K)。另外,切割HBB5或HBB6的大范围核酸酶可用于矫正切割位点附近的任何其他氨基酸突变(E26K)。因为基因矫正效率随着距DSB距离的增加而降低(Elliott等,Mol.Cell.Biol.,1998,18,93-101),所以当突变位于切割位点500bp以内时该策略最有效。或者,相同的大范围核酸酶可用于敲入外显子序列,所述外显子序列会在HBB基因座上重建功能性HBB基因(图1B)。该策略可以被用于切割位点下游的任何突变。本发明涉及I-CreI变体,其中两个I-CreI单体的至少一个中含有至少两个替换,其中LAGLIDADG核心结构域的两个功能性亚结构域中各含一个,所述功能性亚结构域分别位于I-CreI的位置26到40和44到77,所述变体能够切割来自人β珠蛋白基因的DNA靶序列。可以通过任何公知的体外或体内切割测定法测量本发明变体的切割活性,例如国际PCT申请WO2004/067736;Epinat等,NucleicAcidsRes.,2003,31,2952-2962;Chames等,NucleicAcidsRes.,2005,33,el78和Arnould等,J.Mol.Biol.,2006,355,443-458中所述的测定法。例如,可通过直接重复重组测定法,使用报告载体在酵母或哺乳动物细胞中测量本发明变体的切割活性。报告载体在间插序列内包含报告基因的两个截短的非功能性拷贝(直接重复)和基因组DNA靶序列,所述间插序列克隆到酵母或哺乳动物表达载体中。变体的表达产生功能性内切核酸酶,其能够切割基因组DNA靶序列。该切割诱导直接重复之间的同源重组,产生功能性报告基因,其表达可以通过合适的测定法监测。定义-HBB和大范围核酸酶变体二者被认可的位置编号省略了对第一个甲硫氨酸的计数;这解释了常用的数值标注与在本文所附序列表中观察到的有效位置之间的偏差;更精确地对HBB编号而言,其与0ΜΙΜ数据库中给出的编号一致;因此,突变E6K和E26K在参照序列(GenBankNP_00509.1或本文附带的序列表中的SEQIDNO150)中分别对应于7位和27位的突变;且对大范围核酸酶编号而言,其与I-CreIpdb登录码Ig9y—致。-多肽序列中的氨基酸残基在本文中根据单字母代码命名,其中例如Q表示Gln或谷氨酰胺残基,R表示Arg或精氨酸残基,D表示Asp或天冬氨酸残基。-核苷酸如下命名使用单字母代码命名核苷的碱基a为腺嘌呤,t为胸腺嘧啶,c为胞嘧啶,g为鸟嘌呤。对于简并核苷酸而言,r表示g或a(嘌呤核苷酸),k表示g或t,S表示g或c,w表示a或t,m表示a或c,y表示t或c(啼唆核苷酸),d表示g,a或t,ν表不g,a或c,b表不g,t或c,h表不a,t或c,η表不g,a,t或C。-“大范围核酸酶”是指具有12到45pb双链DNA靶序列的内切核酸酶。所述大范围核酸酶是其中各结构域位于单体上的二聚体酶,或是在单个多肽上包含两个结构域的单体酶。-“大范围核酸酶结构域”是指这样的区域,其与大范围核酸酶DNA靶标的一半相互作用,并能够与相同大范围核酸酶的另一结构域结合,形成能够切割DNA靶标的功能性大范围核酸酶,所述另一结构域与所述DNA靶标的另一半相互作用。-“大范围核酸酶变体”或“变体”是指通过将野生型大范围核酸酶(天然大范围核酸酶)氨基酸序列中的至少一个残基替换为不同的氨基酸而获得的大范围核酸酶。-“功能件变体”是指能够切割DNA靶序列的变体,优选地所述靶标是不被母体大范围核酸酶切割的新靶标。例如,这些变体在接触DNA靶序列的位置或与所述DNA靶标直接或间接相互作用的位置上具有氨基酸改变。-“I-CreI”是指具有序列SWISSPROTΡ05725或pdb登录号lg9y(分别对应于序列表中的序歹IjSEQIDNO1和SEQIDNO178)的野生型I-CreI。-“具有新特异件的I-CreI变体”是指具有与母体大范围核酸酶不同的靶标切割模式的变体。等价且无差异地使用的术语“新特异性”,“经修饰的特异性”,“新切割特异性”,“新底物特异性”是指变体针对DNA靶序列中核苷酸的特异性。-“I-CreI位点”是指被I-CreI切割的22到24bp双链DNA序列。I-CreI位点包括野生型(天然)非回文I-CreI归巢位点和衍生的回文序列,如序列5’-t_12C_lia_1(ia_9a_8a_10g+11a+12(SEQIDNO2),也称为C1221(图4)。-“结构域”或“核心结构域”是指“LAGLIDADG归巢内切核酸酶核心结构域”,它是LAGLIDADG家族归巢内切核酸酶的特征性ajii^c^i^i^c^折叠,对应于约一百个氨基酸残基的序列。所述结构域包含在折叠成反向平行片层的四条β链(0力203旦4),所述β-片层与DNA靶标的一半相互作用。该结构域能够与另一LAGLIDADG归巢内切核酸酶结构域结合,形成能够切割DNA靶标的功能性内切核酸酶,所述另一结构域与所述DNA靶标的另一半相互作用。例如,在二聚体归巢内切核酸酶I-CreI(163个氨基酸)的情况下,LAGLIDADG归巢内切核酸酶核心结构域对应于残基6到94。-“亚结构域”是指LAGLIDADG归巢内切核酸酶核心结构域中的区域,其与归巢内切核酸酶DNA靶标半位点的不同部分相互作用。-“β-发夹”是指LAGLIDADG归巢内切核酸酶核心结构域反向平行β-片层的两条连续β-链(^^或β3β4),其通过环或转角相连。-“单链大范围核酸酶”,“单链嵌合大范围核酸酶”,“单链大范围核酸酶衍生物”,“单链嵌合大范围核酸酶衍生物”或“单链衍生物”是指包含通过肽间隔区连接的两个LAGLIDADG归巢内切核酸酶结构域或核心结构域的大范围核酸酶。单链大范围核酸酶能够切割嵌合DNA靶序列,所述靶序列包含各母体大范围核酸酶靶序列中不同的一半。-"DNA靶标”,“DNA靶序列,,,“靶序列,,,“靶位点,,,“靶标,,,“位点”;“目的位点,,;“识别位点”,“识别序列”,“归巢识别位点”,“归巢位点”,“切割位点”是指被LAGLIDADG归巢内切核酸酶(例如I-CreI或其变体,或来自于I-CreI的单链嵌合大范围核酸酶)识别并切割的20到24bp双链回文,局部回文(假回文)或非回文的多核苷酸序列。这些术语是指大范围核酸酶要在其中诱导双链断裂(切割)的独特DNA定位,优选地为基因组定位。DNA靶标通过双链多核苷酸一条链的5'到3'序列来定义,如上文针对C1221所指出的。DNA靶标的切割分别发生在有义和反义链位置+2和-2的核苷酸处。除非另有说明,否则I-CreI大范围核酸酶变体对DNA靶标进行切割的位置对应于DNA靶标有义链上的切割位点。-“DNA靶标半位点,,,“半切割位点”或“半位点”是指DNA靶标中与各个LAGLIDADG归巢内切核酸酶核心结构域结合的部分。-“嵌合DNA靶标”或“杂合DNA靶标”是指两条母体大范围核酸酶靶序列不同的一半的融合物。另外,所述靶标的至少一半可包含与至少两个独立的亚结构域结合的核苷酸组合(组合DNA靶标)。-“3珠蛋白基因”或“HBB”基因表示位于11号染色体短(p)臂上位置15.5(llpl5.5)的人0珠蛋白基因。本发明包括正常(野生型HBB)和突变的HBB基因(突变的HBB;HBB等位基因),尤其是导致镰状细胞病(HbS等位基因、0S-珠蛋白基因或镰状珠蛋白基因)和地中海贫血症的突变体。HBB基因(1606bp)对应于登录号GenBankNT_009237.17的序列的反向互补链上第4033937到4035542位。其包含三个外显子(外显子1:1到142位;外显子2273到495位;外显子31346到1606位)。位于51位(外显子1)到1474位(外显子3)的0RF的侧翼是两个非翻译区。野生型HBB序列(SEQIDNO3)包含在4080bp的片段(SEQIDNO4)中,所述片段对应于登录号NT_009237.17之序列的反向互补链上第4032541到4036620位。HBB基因序列对应于SEQIDNO:4的1079到2684位,外显子1对应于1079到1220位,外显子2对应于1351到1573位,外显子3对应于2424到2684位,0RF对应于1129到2552位(图3)。HBBmRNA对应于登录号GenBankNM_00518.4的序列(SEQIDN0:149)。3珠蛋白的蛋白质对应于登录号GenBankNP_00509.1的序列(SEQIDNO150)。“来自13珠蛋白基因的DNA靶序列”,“基因组DNA靶序列”,“基因组DNA切割位点”,“基因组DNA靶标”或“基因组靶标”是指哺乳动物的3珠蛋白基因中被大范围核酸酶变体或单链嵌合大范围核酸酶衍生物识别并切割的20到24bp序列。-“_”是指能够转运与之连接的另一核酸的核酸分子。-“M遯”是指一条序列与另一序列具有足够导致序列间同源重组的同一性,更具体地具有至少95%的同一性,优选97%的同一性,更优选99%的同一性。-“同一件,,是指两条核酸分子或多妝之间的序列同一件。可通过比较各序列中可为比较目的而排列的位置来测定同一性。当所比较序列中的一个位置被相同的碱基占据时,则这些分子在该位置上是相同的。核酸或氨基酸序列之间的相似性或同一性程度是核酸序列间共有的位置上相同或匹配的核苷酸数量的函数。可使用多种比对算法和/或程序计算两条序列之间的同一性,包括FASTA或BLAST,它们可作为GCG序列分析包(UniversityofWisconsin,Madison,Wis.)的一部分获得,并可以例如默认设定使用。-“土体”包括哺乳动物,以及其他脊椎动物(例如鸟类,鱼和爬行动物)。本文使用的术语“哺乳动物”是指任何这样的脊椎动物,包括单孔类,有袋类和胎盘动物,它们对其幼仔哺乳,并且分娩活的幼仔(真哺乳亚纲(eutharian)或胎盘哺乳动物)或者产卵(后兽亚纲(metatharian)或非胎盘(nonplacental)哺乳动物)。哺乳动物物种的实例包括人和其他灵长类(例如猴,猩猩),啮齿动物(例如大鼠,小鼠,豚鼠)和其他,例如牛,猪和马。-突变是指在多核苷酸(cDNA,基因)或多肽序列中替换,缺失,添加一个或多个核苷酸/氨基酸。所述突变可影响基因的编码序列或其调节序列。其还可影响基因组序列的结构或所编码mRNA的结构/稳定性。本发明的变体可以是同二聚体或异二聚体。优选地,异二聚体的两个单体在26到40位和/或44到77位中被突变。更优选地,两个单体均在I-Crel的26到40位以及44到77位中具有不同的替换。在所述变体的一个优选的实施方案中,位于I-Crel中44到77位的亚结构域中的所述替换位于44,68,70,75和/或77位。在所述变体的另一个优选的实施方案中,位于I-Crel中26到40位的亚结构域中的所述替换位于26,28,30,32,33,38和/或40位。在所述变体的另一个优选实施方案中,其在直接或通过水分子与DNA骨架或核苷酸碱基相互作用或与DNA靶序列接触的其他氨基酸残基位置上包含一个或多个突变;这些残基是本领域公知的(Jurica等,MolecularCell.,1998,2,469-476;Chevalier等,J.Mol.Biol.,2003,329,253-269)。具体地,可在与磷酸骨架接触的位置例如最终的C端环(137到143位;Prieto等,NucleicAcidsRes.,Epub22April2007)上引入另外的替换。优选地,所述残基涉及所述DNA切割位点的结合和切割。更优选地,所述残基处于I-Crel的138,139,142或143位上。可以在一个变体中突变两个残基,条件是各个突变在选自以下的不同残基对中138和139位残基对以及142和143位残基对。所引入的突变改变最终C端环中所述氨基酸与I-Crel位点中磷酸主链的相互作用。优选地,用疏水氨基酸替换138或139位上的残基,以避免与DNA切割位点的磷酸主链形成氢键。例如,用丙氨酸替换138位的残基,或用甲硫氨酸替换139位的残基。有利地用小氨基酸(例如甘氨酸)替换142或143位的残基,以减小这些氨基酸残基侧链的大小。更优选地,最终C端环中的所述替换改变了变体针对I-Crel位点中士1到2,士6到7禾P/或士11到12位的特异性。在所述变体的另一个优选实施方案中,其包含一个或多个额外的突变,所述突变改善变体对来自人0珠蛋白基因之DNA靶序列的结合和/或切割特性。被突变的额外残基可位于整个I-Crel序列上,尤其是I_CreI的C端一半(80到163位)。I-Crel的两个单体均有利地被突变;每个单体上的突变可以相同或不同。例如,变体在4、7、12、16、19、24、34、43、49、54、58、60、64、66、79、80、81、82、85、86、87、92、93、94、96、99、100、103、105、109、111、117、120、121、125、129、131、132、139、140、147、151、152、155、159、160、161、162和163位上包含一个或多个额外的替换。所述替换有利地选自以下K4E、K7R、Y12H、F16L、G19S、G19A、I24V、K34R、F43L、T49A、F54L、L58Q、D60N、D60G、V64I、Y66H、S79G、E80G、E80K、I81T、K82R、K82E、H85R、N86S、F87L、Q92R、P93A、F94L、K96R、Q99R、K100R、N103S、V105A、V105I、I109V、Q111H、E117G、D120G、K121R、K121E、V125A、V129A、Q131R、I132V、K139R、T140A、T147A、V151M、L152Q、L155P、K159R、K159E、K160E、S161P、S162P和P163S。优选地,变体包含至少一个选自G19S、F54L、E80K、F87L、V105A和I132V的替换。更优选地,变体至少包含G19S和E80K替换或者F87L和E80K替换。根据所述变体的一个更优选的实施方案,所述额外的突变还削弱了功能性同二聚体的形成。更优选地,所述突变是G19S突变。G19S突变被有利地引入异二聚体I-Crel变体的两个单体之一中,从而获得具有增强的切割活性和增强的切割特异性的大范围核酸酶。另外,为了进一步增强切割特异性,另一单体可带有削弱功能性同二聚体的形成或者有助于异二聚体的形成的不同突变。在所述变体的另一个优选的实施方案中,所述替换是用选自A、D、E、G、H、K、N、P、Q、R、S、T、Y、C、V、L和W的氨基酸代替原始氨基酸。本发明的变体可以衍生自野生型I_CreI(SEQIDN0:1或SEQIDN0:178)或者与SEQIDNO:178具有至少85%同一性、优选至少90%同一性、更优选至少95%同一性的I-Crel骨架蛋白,例如在I-Crel序列中具有2位丙氨酸插入、D75N替换和在C端(164到166位)AAD插入的骨架SEQIDNO:5(167个氨基酸)。另外,本发明的变体可包含一个或多个在序列NH2端和/或COOH端插入的残基。例如,在NH2端和/或COOH端引入标签(表位或多聚组氨酸序列);所述标签可用于所述变体的检测和/或纯化。例如,变体C端中可插入AAD或ATD序列。变体也可以包含核定位信号(NLS);所述NLS可用于将所述变体输入细胞核中。NLS可以被恰好插入变体的第一甲硫氨酸后,或恰好插入N-端标签后。本发明的变体可以是能够切割回文或假回文DNA靶序列的同二聚体。或者,所述变体是异二聚体,其得自I-CreI中26到40位和44到77位中具有不同替换的第一和第二单体的结合,所述异二聚体能够切割来自人β珠蛋白基因的非回文DNA靶序列。本发明的异二聚体变体中的每个单体(第一单体和第二单体)可以根据上文所示28、30、32、33、38、40、44、68以及70、75和77位上的11个残基以及被突变的额外残基,用字母代码来命名。例如,KTSHRS/KYSDT+120G或28K30T32S33H38R40S/44K68Y70S7OT77T+120G代表I-CreIΚ28、Τ30、S32、Η33、R38、S40/K44、Υ68、S70、D75、Τ77和G120。被所述变体切割的DNA靶序列可位于人β珠蛋白基因的外显子或内含子中。在所述变体的另一个优选的实施方案中,所述DNA靶序列选自序列SEQIDNO6到19(图16和表I)。人HBB基因靶序列<table>tableseeoriginaldocumentpage18</column></row><table><table>tableseeoriginaldocumentpage19</column></row><table>*靶标中第一个核苷酸的位置参照SEQIDNO4序列标出。更优选地,I-Crel变体的单体至少具有以下替换,分别针对第一和第二I_CreI单体*N30S、Y33G、Q44D、R68N、R70S和D75N(第一单体),和Y33T、Q38A、R70S、D75Y和I77R(第二单体);该变体切割位于人HBB基因5,侧翼序列中的HBB靶标SEQIDNO:6(图16和表I),*N30D、Y33R、R70S和D75N(第一单体),和S32G、Y33T、Q44A、R70G和D75N(第二单体);该变体切割位于人HBB基因5,侧翼序列中的HBB靶标SEQIDNO:7(图16和表I),*S32D、Q38C、R70S和I77K(第一单体),和S32D、Q38C、R70S和D75N(第二单体);该变体切割位于人HBB基因5,侧翼序列中的HBB靶标SEQIDNO:8(图16和表I),*Y33T,Q44D、R68A,R70S.D75K和IMR(第一单体),和YMR、Q38T,R68H,R70H和D75N(第二单体);该变体切割HBB6靶标(SEQIDNO9)和HBB8革巴标(SEQIDNO10)二者(图3和16和表I)。HBB6和HBB8靶标均位于外显子1中,并且分别与人0珠蛋白链6位上的正常(GAG;谷氨酸,E6)和突变(GTG;A到T的颠换,导致谷氨酸替换成缬氨酸(E6V),引起镰状细胞贫血)密码子重叠。*以下的变体(图16和表XVI、XVIII、XX禾口XXI)切割HBB8(SEQIDNO10)靶标(图3和16和表I),并且不切割或者低效切割HBB6靶标。HBB8靶标位于外显子1中,并且与人0珠蛋白链6位上导致镰状细胞贫血的突变密码子重叠。-第一单体在28位具有K,在30位具有N,在32位具有S、E或T,在33位具有T、C、S或V,在38位具有S、Q、R、H,在40位具有S或Q,在44位具有K、R、D、N或H,在68位具有Y、A或E,在70位具有S,在75位具有D、K或N,和在77位具有R或Q。优选地,28、30、32、33、38和40位的残基选自KNSTSS、KNSSSS、KNETQS、KNTCQS、KNSCQS、KNSTRQ、KNSVRQ、KNSVHQ、KNSCHS、KNSSRS、KNSTQS和KNSVHS,并且44、68、70、75和77位的残基选自KASDR、RYSNQ、HYSNR、NESNR和DASKR。更优选地,第一单体选自KNSTSS/RYSNQ、KNTCQS/RYSNQ、KNTCQS/HYSNR、KNSCHS/RYSNQ、KNSVHS/RYSNQ、KNSTRQ/NESNR、KNETQS/DASKR、KNTCQS/DASKR、KNSCHS/DASKR、KNSCQS/DASKR、KNSSSS/KASDR、KNSSRS/DASKR、KNSTRQ/DASKR、KNSVRQ/DASKR、KNSTQS/DASKR和KNSVHQ/DASKR。第一单体有利地包含至少一个选自G19S、F54L、E80K、F87L、V105A和I132V的第一额外突变,并最终包含选自K7R、K121R禾口Q131R的第二额外突变。这类变体的例子展示于表XVI(SEQIDNO104、105、111、113、114、118、121)、表XX(SEQIDNO:257到276)、表XXI(SEQIDNO286)和图16(SEQIDNO126)中。-第二单体在28位具有K,在30位具有N、T或Q,在32位具有T或S,在33位具有G、H、T、C、Y或R,在38位具有K、R、T或Q,在40位具有S,在44位具有Q或K,在68位具有A、S、H或Y,在70位具有S或H,在75位具有N,在77位具有R、Q、Y或I。优选地,28、30、32、33、38和40位的残基选自KNSGKS、KTSHRS、KNSTRS、KNSRTS、KNSGRS、KNSCRS、KQTYRS禾口KTSRQS,并且44、68、70、75和77位的残基选自QASNR、KYSNY、KYSNQ、QYSNR、KYSNR、KYSNI、QHHNI和KSSNY。更优选地,第二单体选自KNSGKS/QASNR、KTSHRS/KYSNY、KNSTRS/KYSNY、KNSGRS/KYSNY、KNSCRS/KYSNQ、KNSGKS/KYSNY、KNSGKS/QYSNR、KNSGKS/KYSNR、KNSGKS/KYSNQ,KQTYRS/KYSNI、KQTYRS/KYSNY、KQTYRS/QASNR、KQTYRS/KYSNQ、KNSRTS/QHHNI禾口KTSRQS/KSSNY。第二单体有利地包含至少一个选自G19S、F54L、E80K、F87L、V105A和I132V的第一额外突变,并最终包含选自K4E、Y12H、L58Q、D60N、V64I、H85R、P93A、E117G、V129A和L152Q的第二额外突变。这类变体的例子展示于表XVI(SEQIDNO:82、84、85、88、94、103)、表XVIII(SEQIDNO231到255)、表XXI(SEQIDN0:287到291)和图16(SEQIDNO139)中。切割HBB8靶标并且不切割或低效切割HBB6靶标的这类变体的例子展示于表XVI、XVIII、XX和XXI中。例如,表XVI中展示的变体具有以下的替换-Y33T、Q38S、Q44R、R68Y、R70S、D75N和I77Q(KNSTSS/RYSNQ)或S32E、Y33T、Q44D、R68A、R70S、D75K和I77R(KNETQS/DASKR;第一单体),和Y33C、Q38R、Q44K、R68Y、R70S、D75N和177Q(KNSCRS/KYSNQ;第二单体),-Y33C、Q38H、Q44R、R68Y、R70S、D75N和I77Q(KNSCHS/RYSNQ)或S32T、Y33C、Q44D、R68A、R70S、D75K和I77R(KNTCQS/DASKR;第一单体),且第二单体选自Y33G、Q38K、R68A、R70S、D75N和177R(KNSGKS/QASNR);N30T、Y33H、Q38R、Q44K、R68Y、R70S、D75N禾口I77Y(KTSHRS/KYSNY);Y33T、Q38R、Q44K、R68Y、R70S、D75N和I77Y(KNSTRS/KYSNY);Y33G、Q38R、Q44K、R68Y、R70S、D75N和I77Y(KNSGRS/KYSNY);Y33G、Q38K、Q44K、R68Y、R70S、D75N和I77Y(KNSGKS/KYSNY),-Y33T、Q38R、S40Q、Q44N、R68E、R70S、D75N和I77R(KNSTRQ/NESNR)或Y33S、Q38S、Q44K、R68A、R70S,和177R(KNSSSS/KASDR;第一单体),和N30T、Y33H、Q38R、Q44K、R68Y、R70S、D75N和177Y(KTSHRS/KYSNY;第二单体),-S32T、Y33C、Q44R、R68Y、R70S、D75N和I77Q(KNTCQS/RYSNQ;第一单体),和Y33G、Q38K、R68A、R70S、D75N和177R(KNSGKS/QASNR;第二单体);优选的变体是展示于表XXI中的变体-KNSVHQ/DASKR+87L+131R(第一单体)和KNSGKS/KYSNY+19S+117G、KQTYRS/KYSNY+19S+64I、KNSGKS/KYSNY+19S+132V、KQTYRS/KYSNY+54L或KQTYRS/KYSNQ+19S(第二单体),-KNSTRQ/DASKR+19S(第一单体)和KQTYRS/KYSNY+IOSA+IMQ、KQTYRS/KYSNY+54L,KQTYRS/QASNR+87L或KQTYRS/KYSNI+19S(第二单体),-KNSVRQ/DASKR+19S(第一单体)禾口KQTYRS/QASNR+87L+58Q、KQTYRS/KYSNY+105A+152Q、KNSGKS/KYSNY+132V、KQTYRS/KYSNY+54L或KQTYRS/QASNR+87L(第二单体),-KNSVHQ/DASKR+87L(第一单体)禾口KNSGKS/KYSNY+132V、KNSGKS/KYSNY+19S+117G,KNSGKS/KYSNY+19S+132V,KQTYRS/KYSNY+54L或KQTYRS/KYSNI+19S(第二单体)。*以下变体(图16和表V、VII、IX、XI和XII)切割HBB5靶标(SEQIDNO:11),其位于内含子1中,并与导致三种主要镰状细胞病的突变密码子接近镰状细胞贫血(E6V)、HbSC(E6V禾口E6K)禾口HbSE(E6V禾口E26K;图16和表I)-第一单体在28位具有K,在30位具有N,在32位具有T、S、P或D,在33位具有Y或P,在38位具有Q,在40位具有S,在44位具有A,在68位具有R,在70位具有S,在75位具有E,和在77位具有R。这些变体对应于KNTYQS/ARSER、KNDYQS/ARSER、KNPYQS/ARSER、KNSPQS/ARSER和KNSYQS/ARSER。第一单体有利地包含至少一个选自G19S、E80K、F87L、V105A和1132V的第一额外突变。更优选地,第一单体至少包含G19S和E80K替换或者F87L和E80K替换,并最终包含选自I24V、F43L、K82R、H85R、K96R、K100R、V105I、I109V、K121E、V129A、K139R、L155P、K159R、K160E和S161P的额外突变。这类变体的例子展示于表V(SEQIDNO:79)、表IX(SEQIDNO179到186)、表XI(SEQIDNO:209到220)、表XII(SEQIDNO:281)、图16(SEQIDNO:127)、图19B和20B(SEQIDNO:292到297)中。-第二单体在28位具有K,在30位具有T、N、K或S,在32位具有S或P,在33位具有H、S或R,在38位具有H、Q、K或R,在40位具有S,在44位具有K或R,在68位具有Y、S或E,在70位具有S,在75位具有S、D或N,在77位具有T、R、I或Q。优选地,28、30、32、33、38和40位的残基选自KTSRHS、KTSHRS、KNSRRS、KNSSKS、KNSRRS、KSSHRS、KKSSQS和KSPHRS,且44、68、70、75和77位的残基选自KSSNI、KYSDT、KYSDR、KYSNQ、RYSNQ和KESNR。更优选地,第二单体选自KTSRHS/KSSNI、KTSHRS/KYSDT、KNSRRS/KYSDT;KNSRRS/KYSDR、KNSRRS/KYSNQ、KNSRRS/RYSNQ、KSSHRS/KYSDT、KNSSKS/KYSNQ、KNSSKS/KYSDR、KNSRRS/KYSNQ、KSSHRS/KYSDQ、KSPHRS/KYSDT、KSSHRS/KYSNQ和KKSSQS/KESNR。第二单体有利地至少包含一个选自G19S、E80K、F87L、V105A和I132V的第一额外突变,并最终包含选自K4E、K7R、F16L、K34R、T49A、D60G、Y66H、E80G、I81T、K82R、K82E、N86S、Q92R、F94L、Q99R、K100R、N103S、Q111H、D120G、V125A、K139R、T140A、T147A、V151M、K159E、K159R、K160E、S162P和P163S的第二额外突变。这类变体的例子展示于表V(SEQIDNO:45和56)、表VII(SEQIDNO:164到177)、表XI(SEQIDNO197到208)、表XII(SEQIDNO:277到280)和图16(SEQIDNO:140)、17A(SEQIDNO298到301)、19A(SEQIDNO302到304)和20A(SEQIDNO305,306)中。切割HBB5靶标的这类变体的例子展示于图16、17、19、20和表V、VII、IX、XI和XII中,并通过以下的序列展示Y33P、Q44A、R70S、D75E和I77R(KNSPQS/ARSER;第一单体)和N30K、Y33S、Q44K、R68E、R70S和I77R(KKSSQS/KESNR;第二单体);S32T、Q44A、R70S、D75E、I77R、E80K和K96R(KNTYQS/ARSER+80K+96R;第一单体),和N30T、Y33H、Q338R、Q44K、R68Y、R70S和I77T(KTSHRS/KYSDT)或Y33R、Q38R、Q44K、R68Y、R70S和I77T(KNSRRS/KYSDT;第二单体)。优选的变体是展示于表XII中的变体KNTYQS/ARSER+19S+80K+85R+87L+96R+139R(第一单体)和KSPHRS/KYSDT+81T或KTSHRS/KYSDT+66H+82R+86S+"R+132V+139R+140A(第二单体)。*Y33T、Q38A、Q44A和R70H(第一单体),和Y33H、Q38S、Q44Y、R68D、R70S、D75R禾口I77T(第二单体);该变体切割位于内含子2中的HBB靶标SEQIDNO12(图16和表I),*S32G,Y33T,Q44K、R68E,R70S,D75Y和I77V(第一单体),和Ν30Η、Y33H,Q44P、R70H和D75N(第二单体);该变体切割位于内含子2中的HBB靶标SEQIDNO13(图16和表I),*N30D,S32T,R68Y,R70S和D75Y(第一单体),和SMD、Q38C,R68Y,R70S.D75R和I77Q(第二单体);该变体切割位于内含子2中的HBB靶标SEQIDNO14(图16和表I),*N30T、Y33G、R68H、R70H和D75N(第一单体),和Y33R、Q38T、Q44A和R70H(第二单体);该变体切割位于内含子2中的HBB靶标SEQIDNO15(图16和表I),*N30H、Y33S、R68Y、R70S和D75Y(第一单体),和N30D、Y33R、R68H、R70H和D75N(第二单体);该变体切割位于内含子2中的HBB靶标SEQIDNO16(图16和表I),*S32W、Y33T、Q44A和R70H(第一单体),和S32T、Y33C、Q44A、R70G和D75N(第二单体);该变体切割位于内含子2中的HBB靶标SEQIDNO17(图16和表I),*S32T、Q38W、Q44N、R68Y、R70S、D75R和I77V(第一单体),和S32T、Y33T、Q44A、R70S、D75E和I77R(第二单体);该变体切割位于内含子2中的HBB靶标SEQIDN0:18(图16和表I),和*N30Q、Y33H、Q44A、R70S、D75E和I77R(第一单体),和S32N、Y33G、Q38Y、R70S、D75R和I77Q(第二单体);该变体切割位于外显子3中的HBB靶标SEQIDNO19(图16和表I)。上文定义的异二聚体变体可仅具有上文标出的氨基酸替换。在这种情况下,未标出的位置未突变,并因此分别对应于野生型I-CreI(SEQIDNO1或178)或I-CreIN75骨架(SEQIDNO5)序列。切割表I的HBBDNA靶标(核苷酸序列SEQIDNO6到19)的这类异二聚体Ι-Crel变体的例子包括由第一和第二单体组成的变体,所述第一和第二单体分别对应于以下序列对SEQIDNO123到135(第一单体)和SEQIDNO136到148(第二单体;图16)。由下述第一和第二单体组成的变体切割HBB5靶标,所述第一和第二单体对应于以下的序列对(表V、VII、IX、XI禾口XII)=SEQIDNO:79(第一单体)和SEQIDNO:45、56、164到177、298到301任一个(第二单体);SEQIDNO179到186(第一单体)和SEQIDN0:57(第二单体);SEQIDNO:179(第一单体)和SEQIDNO197到208,302到306任一个(第二单体);SEQIDNO:209到220、292到297(第一单体)和SEQIDN0:164(第二单体);SEQIDNO:213、214、281(第一单体)和SEQIDNO:277、278、279或280(第二单体)。另外,由下述第一和第二单体组成的变体切割HBB8靶标,所述第一和第二单体对应于以下的序列对(表XVI、XVIII、XX和XXI)=SEQIDNO104或114(第一单体)和SEQIDN0:82(第二单体);SEQIDNO:105或118(第一单体)和SEQIDNO:84、85、88、94和103任一个(第二单体);SEQIDNO:113或111(第一单体)和SEQIDNO:103(第二单体);SEQIDNO121(第一单体)和SEQIDN0:85(第二单体);SEQIDNO:118(第一单体)和SEQIDNO:231到255(第二单体);SEQIDN0:257到274(第一单体)和SEQIDNO:103(第二单体);SEQIDN0:286(第一单体)和SEQIDNO:250、236、287、288和289任一个(第二单体);SEQIDN0:269(第一单体)和SEQIDNO:290、236、237和248任一个(第二单体);SEQIDN0:273(第一单体)和SEQIDNO:291、290、242、236和237任一个(第二单体);SEQIDN0:261(第一单体)和SEQIDNO242、289、287、236和248任一个(第二单体)。或者,异二聚体变体可以由包含上文所定义氨基酸替换的I-Crel序列组成。在后一情况下,未标出的位置可包含额外的突变,例如一个或多个上文定义的额外突变。本发明包括与上文定义的序列具有至少85%同一性、优选地至少90%同一性、更优选地至少95%(96%,97%,98%,99%)同一性的I_CreI变体,所述变体能够切割来自人3珠蛋白基因的DNA靶标。异二聚体变体有利地是专性异二聚体变体,其具有至少一对突变,其对应于第一和第二单体中使两个I-Crel单体之间发生分子间相互作用的对应残基,其中所述突变对的第一突变处于第一单体中,所述对的第二突变处于第二单体中,所述突变对防止每个单体形成功能性同二聚体,并且允许形成能够切割来自人0珠蛋白基因的基因组DNA靶标的功能性异二聚体。为了形成专性异二聚体,单体有利地具有至少一个以下突变对,分别针对第一和第二单体a)用碱性氨基酸(优选精氨酸)替换8位的谷氨酸(第一单体),和用酸性氨基酸(优选谷氨酸)替换7位的赖氨酸(第二单体);第一单体还可包含用精氨酸替换7和96位的至少一个赖氨酸残基。b)用碱性氨基酸(优选精氨酸)替换61位的谷氨酸(第一单体),和用酸性氨基酸(优选谷氨酸)替换96位的赖氨酸(第二单体);第一单体还可包含用精氨酸替换7和96位的至少一个赖氨酸残基。c)用芳香氨基酸(优选苯丙氨酸)替换97位的亮氨酸(第一单体),和用小氨基酸(优选甘氨酸)替换54位的苯丙氨酸(第二单体);第一单体还可包含用色氨酸替换54位的苯丙氨酸,第二单体还可包含用甲硫氨酸替换58位的亮氨酸或57位的赖氨酸,和d)用碱性氨基酸(优选精氨酸)替换137位的天冬氨酸(第一单体),和用酸性氨基酸(优选谷氨酸)替换51位的精氨酸(第二单体)。例如,第一单体可具有突变D137R,第二单体可具有突变R51D。专性异二聚体大范围核酸酶有利地包含至少两对在上文a)、b)、c)或d)中定义的突变;突变对之一有利地如c)或d)所定义。优选地,一个单体包含用酸性氨基酸(天冬氨酸(D)或谷氨酸(E))替换7位和96位的赖氨酸残基(K7E和K96E),另一单体包含用碱性氨基酸(赖氨酸(R)或赖氨酸(K))替换8位和61位的谷氨酸残基(例如E8K和E61R)。更优选地,专性异二聚体大范围核酸酶包含在上文a)、b)和c)中定义的三对突变。专性异二聚体大范围核酸酶有利地由(i)E8R、E8K或E8H、E61R、E61K或E61H和L97F、L97W或L97Y;(ii)K7R、E8R、E61R、K96R和L97F,或(iii)K7R、E8R、F54W、E61R、K96R和L97F和第二单体(B)组成,所述第二单体(B)至少具有突变(iv)K7E或K7D、F54G或F54A和K96D或K96E;(v)K7E、F54G、L58M和K96E,或(vi)K7E、F54G、K57M和K96E。例如,第一单体可具有突变K7R、E8R或E8K、E61R、K96R和L97F或K7R、E8R或E8K、F54W、E61R、K96R和L97F,第二单体可具有突变K7E、F54G、L58M和K96E或K7E、F54G、K57M和K96E。专性异二聚体可包含上文定义的至少一个NLS和/或一个标签;所述NLS和/或标签可以在第一和/或第二单体中。本发明的主题还包括衍生自如上所述的I-CreI变体的单链嵌合大范围核酸酶(融合蛋白)。所述单链大范围核酸酶可包含两个I-CreI单体、两个I-CreI核心结构域(I-CreI的6到94位)或二者的组合。优选地,两个单体/核心结构域或二者的组合通过肽连接子连接。本发明的主题还包括编码如上所述的变体或单链嵌合大范围核酸酶的多核苷酸片段;所述多核苷酸可编码同二聚体或异二聚体变体的一个单体,或编码单链嵌合大范围核酸酶的两个结构域/单体。本发明的主题还包括用于表达本发明变体或单链大范围核酸酶的重组载体。所述重组载体包含至少一个编码变体或单链大范围核酸酶的多核苷酸片段,如上所述。在一个优选的实施方案中,所述载体包含两个不同的多核苷酸片段,每个片段各编码异二聚体变体的单体之一。可在本发明中使用的载体包括但不限于病毒载体、质粒、RNA载体,或者线性或环形DNA或RNA分子,可由染色体、非染色体、半合成或合成的核酸所组成。优选的载体是能够自主复制与之连接之核酸的载体(附加型载体)和/或表达与之连接之核酸的载体(表达载体)。大量的合适载体是本领域技术人员已知的,并可以商品获得。病毒载体包括逆转录病毒、腺病毒、细小病毒(parvovirus)(例如腺相关病毒)、冠状病毒、负链RNA病毒如正粘病毒(orthomyxovirus)(例如流感病毒)、杆状病毒(例如狂犬病毒和疱疫性口炎病毒(vesicularstomatitisvirus))、畐Ij粘病毒(paramyxovirus)(例如麻疹病毒和仙台病毒(Sendai))、正链RNA病毒如小RNA病毒(picornavirus)和α病毒,以及双链DNA病毒,其包括腺病毒、疱疹病毒(例如1和2型单纯疱疹病毒、EB病毒、巨细胞病毒)和痘病毒(例如牛痘病毒、禽痘病毒和金丝雀痘病毒)。其他病毒包括例如诺瓦克病毒、披膜病毒(togavirus)、黄病毒(flavivirus)、呼肠病毒(reoviruses)、乳多空病毒(papovavirus)、嗜肝DNA病毒(h印adnavirus)和肝炎病毒。逆转录病毒的实例包括禽白血病_肉瘤、哺乳动物C型、B型病毒、D型病毒、HTLV-BLV组、慢病毒、泡沫病毒(spumavirus)(Coffin,J.Μ.,Retroviridae:Thevirusesandtheirreplication,InFundamentalVirology,第三版,B.N.Fields,等编辑,Lippincott-RavenPublishers,Philadelphia,1996)。优选的载体包括慢病毒载体,尤其是自失活(selfinactivacting)的慢病毒载体。载体可包含选择标记,例如用于真核细胞培养的新霉素磷酸转移酶、组氨醇脱氢酶、二氢叶酸还原酶、潮霉素磷酸转移酶、单纯疱疹病毒胸苷激酶、腺苷脱氨酶、谷氨酰胺合成酶和次黄嘌呤-鸟嘌呤磷酸核糖基转移酶;用于酿酒酵母(S.Cerevisiae)的TRPl;大肠杆菌(E.coli)中的四环素、利福平或氨苄青霉素抗性。优选地,所述载体是表达载体,其中编码本发明变体/单链大范围核酸酶专性异二聚体大范围核酸酶/单链衍生物的序列置于适当的转录和翻译控制元件的控制下,以允许产生或合成所述变体。因此,所述多核苷酸包含在表达盒中。更具体地,载体包含复制起点、与所述编码多核苷酸有效连接的启动子、核糖体结合位点、RNA剪接位点(使用基因组DNA时)、多腺苷酸化位点和转录终止位点。其还可包含增强子。启动子的选择将取决于其中表达多肽的细胞。优选地,当所述变体是异二聚体时,编码各个单体的两种多核苷酸包含在一个载体中,所述载体能够驱动两种多核苷酸同时表达。合适的启动子包括组织特异性和/或诱导型启动子。诱导型启动子的实例是由提高重金属水平诱导的真核金属硫蛋白(metallothionine)启动子,应答于异丙基-β-D-硫代半乳吡喃糖苷(IPTG)诱导的原核IacZ启动子,和由提高温度诱导的真核热休克启动子。组织特异性启动子的实例是骨骼肌肌酸激酶、前列腺特异性抗原(PSA)、α-抗胰蛋白酶、人表面活性剂(SP)A和B蛋白、β-酪蛋白和酸性乳清蛋白基因。根据所述载体的另一个有利的实施方案,其包括靶向DNA构建体,所述靶向DNA构建体含有与上文定义的基因组DNA切割位点周围区域有同源性的序列。例如,所述与变体基因组DNA切割位点周围区域具有同源性的序列是人β珠蛋白基因的片段,其包含SEQIDNO4的以下位置508到707,651到850,701到900,1048到1247、1147到1346、1524到1723、1599到1798、1808到2007,2084到2283,2094到2293、2245到2444、2323到2522和2523到2722。或者,编码I-CreI变体/单链大范围核酸酶的载体和包含靶向构建体的载体是不同的载体。更优选地,靶向DNA构建体包含a)与如上述基因组DNA切割位点周围的区域共有同源性的序列,和b)侧翼是a)中序列或包含在a)中序列内的待引入序列。优选使用至少50bp、优选多于lOObp、更优选多于200bp的同源序列。因此,靶向DNA构建体优选地从200bp到6000bp,更优选地从IOOObp到2000bp。事实上,共有的DNA同源性位于断裂位点上游和下游的侧翼区域中,且待引入的DNA序列应位于两臂之间。对基因组治疗的目的而言,待引入的序列优选是修复目的基因中突变的序列(基因矫正或功能基因的恢复)。或者,其可以是用于以某种特定方式改变染色体DNA的任何其他序列,包括用于修饰特异序列、用于减弱或激活目的基因、用于失活或缺失目的基因或其部分、用于向目的位点中引入突变或用于引入外源基因或其部分的序列。这些染色体DNA改变被用于基因组改造(动物模型/人重组细胞系)。靶向构建体有利地在两条同源性臂之间包含阳性选择标记,并最终在第一同源性臂上游或第二同源性臂下游包含阴性选择标记。所述标记允许选择通过同源重组在靶位点上插入了目的序列的细胞。例如,图16标出了来自HBB基因的靶标、能够切割所述靶标的变体以及修复每个靶位点上切割的最小基质。就矫正HBB基因而言,基因的切割发生在突变附近,优选在突变的500bp范围内(图1A)。靶向构建体包含HBB基因片段,其含有靶位点两侧至少200bp的同源序列(最小修复基质)用于修复切割,并含有编码对应于突变区域的野生型β珠蛋白部分用于修复突变(图1Α)。因此,用于基因矫正的靶向构建体包含最小修复基质或由其组成;其优选为200pb到6000pb,更优选为IOOOpb到2000pb。优选地,当变体的切割位点与突变(例如HBB8靶标)重叠时,修复基质包含未被变体(其用于在HBB基因中诱导所述切割)切割的经修饰切割位点,和编码野生型人β珠蛋白的序列,所述序列不改变人β珠蛋白蛋白质的开放读码框。例如,为了矫正镰状细胞病中存在的HBB基因E6V、E6K或E26K突变(分别为HbSS、HbSC和HbSE),如图3所示,可以与至少包含SEQIDNO4中1147到1346位的靶向构建体一起,使用切割上文定义的HBB5DNA靶标的异二聚体变体,用于有效修复DNA双链断裂和突变。优选的变体是表XII所示变体KNTYQS/ARSER+19S+80K+85R+87L+96R+139R(第一单体;例如SEQIDNO214)和KSPHRS/KYSDT+81T(例如SEQIDNO277)或KTSHRS/KYSDT+66H+82R+86S+99R+132V+139R+140A(例如SEQIDNO279;第二单体)。另外,为了矫正镰状细胞贫血症中发现的HBB基因E6V突变(HbSS),如图3中所示,可以与至少包含SEQIDNO4中1048到1247位的靶向构建体一起,使用切割上文定义的HBB8DNA靶标的异二聚体变体,用于有效修复DNA双链断裂和突变。优选的变体是表XXI中所示变体-KNSVHQ/DASKR+87L+131R(例如SEQIDNO286;第一单体)和KNSGKS/KYSNY+19S+117G(例如SEQIDNO286)、KQTYRS/KYSNY+19S+64I(例如SEQIDNO288)、KNSGKS/KYSNY+19S+132V(例如SEQIDNO:287)、KQTYRS/KYSNY+54L(例如SEQIDNO226)或KQTYRS/KYSNQ+19S(例如SEQIDNO250,第二单体),-KNSTRQ/DASKR+19S(例如SEQIDNO269)第一单体)和KQTYRS/KYSNY+105A+152Q(例如SEQIDNO290)、KQTYRS/KYSNY+54L(例如SEQIDNO236)、KQTYRS/QASNR+87L(例如SEQIDNO237)或KQTYRS/KYSNI+19S(例如SEQIDNO248;第二单体),-KNSVRQ/DASKR+19S(例如SEQIDNO273)第一单体)禾ΠKQTYRS/QASNR+87L+58Q(例如SEQIDNO291)、KQTYRS/KYSNY+105A+152Q(例如SEQIDNO290)、KNSGKS/KYSNY+132V(例如SEQIDNO242)、KQTYRS/KYSNY+54L(例如SEQIDNO236)或KQTYRS/QASNR+87L(例如SEQIDNO248;第二单体),-KNSVHQ/DASKR+87L(例如SEQIDNO261)第一单体)和KNSGKS/KYSNY+132V(例如SEQIDNO:242)、KNSGKS/KYSNY+19S+117G(例如SEQIDNO:289)、KNSGKS/KYSNY+19S+132V(例如SEQIDNO287)、KQTYRS/KYSNY+54L(例如SEQIDNO236)或KQTYRS/KYSNI+19S((例如SEQIDNO248;第二单体)。另外,为了矫正HbSE中发现的HBB基因E26K突变,可以与至少包含SEQIDNO4中1048到1247位的靶向构建体一起,使用切割HBB6DNA靶标的以下变体,用于有效修复DNA双链断裂和突变-第一单体Y33T、Q44D、R68A、R70S、D75K和I77R(例如SEQIDNO:126)和第二单体Y33R、Q38T、R68H、R70H和D75N(例如SEQIDNO139)。或者,为了重建功能性基因(图1B),基因的切割发生在突变上游。优选地,所述突变是基因序列中第一个已知的突变,使得可以同时矫正该基因的所有下游突变。因此,切割优选地发生在HBB基因上游,例如SEQIDNO4的597位(HBB靶标SEQIDNO6)、740位(HBB靶标SEQIDNO7)或790位(HBB靶标SEQIDNO8)。可以使用图16中所示的异二聚体变体*597位第一单体N30S、Y33G、Q44D、R68N、R70S和D75N(例如SEQIDNO123)和第二单体Y33T、Q38A、R70S、D75Y和I77R(例如SEQIDNO:136),*597位第一单体N30D、Y33R、R70S和D75N(例如SEQIDNO124)和第二单体S32G、Y33T、Q44A、R70G和D75N(例如SEQIDNO137),*790位第一单体S32D、Q38C、R70S和I77K(例如SEQIDNO125)和第二单体S32D、Q38C、R70S和D75N(例如SEQIDNO:138)。靶向构建体包含切割位点下游的外显子,它们框内融合(像在cDNA中一样),并在3'具有多聚腺苷酸化位点以终止转录。待引入的序列(外显子敲入构建体)的侧翼是切割位点周围的内含子或外显子序列,从而允许改造基因(外显子敲入基因)转录成为能编码功能性蛋白质的mRNA(图1B)。例如,外显子敲入构建体的侧翼是切割位点上游和下游的序列,其来自如上所述的最小修复基质。为了产生敲入动物/细胞,靶向DNA构建体包含HBB基因片段(其具有靶位点两侧至少200bp的同源序列用于修复切割)、目的外源基因序列和最终的选择标记(例如HPRT基因)。为了插入序列,DNA同源性通常位于紧邻断裂位点上游和下游的区域中(与断裂紧邻的序列;最小修复基质)。然而,当插入伴随着切割位点两侧ORF序列的缺失时,所具有的DNA同源性位于缺失区域上游和下游的区域中。为了人基因组疗法或产生人重组细胞系的目的,将人HBB基因中的修饰引入人细胞中。然而,为了产生遗传性血红蛋白病症的动物模型或研究通过大范围核酸酶诱导的同源重组对突变进行矫正,也可以将它们引入人源化细胞中,其中缺失(敲除)了内源HBB基因,并且在基因组中任何位置引入(转基因)或特异性地在内源HBB基因座上引入(敲入)正常或突变的人HBB基因。遗传性血红细胞病症的小鼠模型是本领域公知的,并例如包括SCA小鼠(Paszty等,Science1997,278,876-878;Ryan等,Science,1997,278,873-876;Chang等,Proc.Nat.Acad.Sci.USA,1998,95,14886-14890)。本发明的主题还包括上文定义的靶向DNA构建体。本发明的主题还包括组合物,其特征在于包含至少一种上文定义的大范围核酸酶(变体或单链衍生的嵌合大范围核酸酶)和/或至少一种编码所述大范围核酸酶的表达载体,如上文所述。在所述组合物的一个优选实施方案中,其包含如上文所述的靶向DNA构建体。优选地,所述靶向DNA构建体被包含在重组载体中或被包含在表达载体中,所述载体包含编码本发明大范围核酸酶的多核苷酸。本发明的主题还包括上文定义的至少一种大范围核酸酶和/或一种表达载体用于制备药物的用途,所述药物用于在有需要的个体中预防、改善或治疗由上文定义的β珠蛋白基因突变导致的病理学状况。优选地,所述病理学状况选自镰状细胞病(镰状细胞贫血症、血红蛋白SC、血红蛋白SE)和β-地中海贫血症。大范围核酸酶的使用可至少包括以下步骤(a)在供体/个体的体细胞组织中,在包含所述大范围核酸酶的至少一个识别和切割位点的β珠蛋白基因的目的位点处引入双链切割,所述引入通过将所述切割位点与所述大范围核酸酶接触来实现,和b)向所述体细胞组织中引入靶向DNA,其中所述靶向DNA包含(1)与切割位点周围区域具有同源性的DNAJP(2)在靶向DNA与染色体DNA重组后修复β珠蛋白基因的DNA,如上文所述。在适合将靶向DNA引入目的位点中的条件下将靶向DNA引入体细胞组织中。靶向构建体可包含用于缺失人β珠蛋白基因的序列,并最终包含目的外源基因的序列(基因替换)。根据本发明,可以如下离体诱导所述双链切割将所述大范围核酸酶引入来自患病个体的体细胞(造血干细胞)中,然后将所述经修饰的细胞移植回该患病个体中。本发明的主题还包括在有此需求的个体中预防、改善或治疗由珠蛋白基因中突变引起的病理状况的方法,所述方法至少包括以下步骤通过任意方式将上文所定义的组合物施用给所述个体。本发明的主题还包括上文所定义的大范围核酸酶、一种或两种多核苷酸(优选包含在表达载体中)为非治疗目的用于对人β珠蛋白基因进行基因组改造的用途。所述人β珠蛋白基因可以是人内源HBB基因(人HBB基因基因座;人重组细胞生产)或者是被插入动物例如小鼠中的转基因(遗传性血红蛋白病症的动物模型)。根据所述用途的一个有利的实施方案,其用于在包含基因组DNA靶序列的β珠蛋白基因目的位点中诱导双链断裂,从而诱导DNA重组事件、DNA丢失或细胞死亡。根据本发明,所述双链断裂是用于修复人β珠蛋白基因中的特定序列、修饰人β珠蛋白基因中的特定序列、恢复功能性人β珠蛋白基因而替换突变基因,弱化或活化人β珠蛋白基因、将突变引入到人β珠蛋白基因的目的位点中、引入外源基因或其部分、失活或消灭人β珠蛋白基因或其部分、使染色体臂易位或者使DNA不被修复并被降解。根据所述用途的另一个有利的实施方案,所述变体、多核苷酸、载体与上文定义的靶向DNA构建体相联合。在本发明大范围核酸酶用途的第一个实施方案中,其包括至少以下的步骤1)在包含所述大范围核酸酶的至少一个识别和切割位点的人β珠蛋白基因的目的位点处引入双链断裂,所述引入通过将所述切割位点与所述大范围核酸酶接触来实现;2)提供包含待引入序列的靶向DNA构建体,所述序列侧翼是与靶基因座共有同源性的序列。所述大范围核酸酶可直接提供给细胞或通过表达载体提供,所述表达载体包含编码所述大范围核酸酶的多核苷酸序列,并适用于在所使用细胞中对其进行表达。该策略用于在靶位点引入DNA序列,从而产生例如可用于蛋白质生产、基因功能研究、药物开发(药物筛选)或用作遗传性血红蛋白病症模型(疾病研究和通过大范围核酸酶诱导的同源重组来矫正突变的研究)的敲入或转基因动物或重组人细胞系。在本发明的大范围核酸酶的用途的第二实施方案中,其包括至少以下步骤1)在包含所述大范围核酸酶的至少一个识别和切割位点的人β珠蛋白基因的目的位点处引入双链断裂,所述引入通过将所述切割位点与所述大范围核酸酶接触来实现;2)将所述断裂的基因座保持在适于与下述染色体DNA同源重组的条件下,所述染色体DNA与切割位点周围的区域具有同源性。在本发明的大范围核酸酶的用途的第三实施方案中,其包括至少以下步骤1)在包含所述大范围核酸酶的至少一个识别和切割位点的人β珠蛋白基因的目的位点处引入双链断裂,所述引入通过将所述切割位点与所述大范围核酸酶接触来实现;2)将所述断裂的基因座保持在适于通过非同源末端接合而修复所述双键断裂的条件下。本发明的主题还包括产生来自人源化小鼠的包含正常/突变HBB基因的修饰小鼠(敲入小鼠)的方法,所述方法包括至少以下步骤(a)向所述人源化小鼠的多能前体细胞或胚胎中引入上文定义的大范围核酸酶,从而在包含所述大范围核酸酶的DNA识别和切割位点的人HBB基因目的位点处引入双链切割;并同时或依次地,(b)向步骤(a)的小鼠前体细胞或胚胎中引入靶向DNA,从而产生通过同源重组而修复了该目的位点的经基因组修饰的小鼠前体细胞或胚胎,其中所述靶向DNA包含⑴与切割位点周围区域具有同源性的DNAJP(2)在靶向DNA与染色体DNA重组后修复该目的位点的DNA,(c)将步骤(b)的经基因组修饰的小鼠前体细胞或胚胎发育成为嵌合小鼠,和(d)从步骤(C)的嵌合小鼠产生转基因小鼠。优选地,步骤(C)包括将步骤(b)中产生的经基因组修饰的前体细胞引入胚泡中,从而产生嵌合小鼠。本发明的主题还包括产生重组人细胞的方法,其包括至少以下步骤(a)向人细胞中引入上文定义的大范围核酸酶,从而在包含所述大范围核酸酶的DNA识别和切割位点的人珠蛋白基因目的位点处诱导双链切割;并同时或先后地,(b)向步骤(a)的细胞中引入靶向DNA,从而产生通过同源重组而修复了目的位点的重组人细胞,其中所述靶向DNA包含(1)与切割位点周围的区域具有同源性的DNA,和(2)在靶向DNA与染色体DNA重组后修复该目的位点的DNA,(c)通过任何手段的途径分离步骤(b)的重组人细胞。在适于将靶向DNA引入目的位点的条件下,将靶向DNA引入细胞中。在一个优选的实施方案中,将所述靶向DNA构建体插入载体中。被修饰的细胞可以是任何目的细胞。为了产生敲入/转基因小鼠,所述细胞是多能前体细胞如胚胎来源干细胞(ES细胞),其为本领域所公知。为了产生重组人细胞系,细胞可有利地是PerC6(FalIaux等,Hum.GeneTher.9,1909-1917,1998)或HEK293(ATCC#CRL-1573)细胞。所述大范围核酸酶可以直接提供至细胞,或通过表达载体提供,所述表达载体包含编码所述大范围核酸酶并适于在所用细胞中表达的多核苷酸序列。为了产生表达异源目的蛋白质的人重组细胞系/转基因动物,靶向DNA包含编码目的产物(蛋白质或RNA)的序列,并最终包含标记基因,其侧翼是上文定义的切割位点的上游和下游序列,从而产生经基因组修饰的细胞(人细胞),所述细胞通过同源重组而在人β珠蛋白基因中整合了外源目的序列。目的序列可以是编码某目的蛋白质/多肽的任何基因,包括但不限于报告基因、报告子、信号转导分子、转录因子、有药物活性的蛋白质和肽、致病的基因产物和毒素。所述序列也可以编码目的RNA分子,包括如siRNA。外源基因的表达可以由内源人β珠蛋白启动子驱动,或者由上文定义的组成型或诱导型异源启动子(优选遍在型或组织特异型启动子)驱动。另外,目的序列的表达可以是有条件的;表达可以由位点特异性重组酶(Cre、FLP等)诱导。因此,将目的序列插入合适的盒中,所述盒可包含与所述目的基因有效连接的异源启动子以及一个或多个功能序列,所述功能序列包括但不限于(选择)标记基因、重组酶识别位点、多腺苷酸化信号、剪接受体序列、内含子、用于蛋白质检测的标签和增强子。为了产生遗传型血红蛋白病症的动物模型,靶向DNA包含正确/突变的人HBB基因序列,其侧翼是切割位点上游和下游的序列,从而产生HBB基因中突变被矫正的动物,或插入了突变HBB基因(例如镰状珠蛋白基因)的动物。大范围核酸酶可作为多肽使用或作为编码所述多肽的多核苷酸构建体使用。其通过本领域技术人员公知的任何适用于特定细胞种类的便利手段而(单独地或与至少一种合适的媒介或运载体和/或与靶向DNA组合)引入小鼠细胞内。根据本发明的用途的一个有利的实施方案,所述大范围核酸酶(多肽)与以下组合_脂质体、聚乙烯亚胺(PEI);在这些情况下施用所述组合并因此将其引入躯体靶细胞内。-膜易位肽(Bonetta,TheScientist,2002,16,38;Ford等,GeneTher.,2001,8,1-4;Wadia*Dowdy,Curr.Opin.Biotechnol.,2002,13,52-56);在这样的情况下,将变体/单链大范围核酸酶的序列与膜易位肽的序列融合(融合蛋白)。根据本发明的用途的另一有利的实施方案,将大范围核酸酶(编码所述大范围核酸酶的多核苷酸)和/或靶向DNA插入载体中。可通过大量方法(例如注射、直接摄入、发射物轰击、脂质体、电穿孔)将包含靶向DNA和/或编码大范围核酸酶的载体引入细胞中。可使用表达载体在细胞中稳定或瞬时地表达大范围核酸酶。在真核细胞中表达的技术是本令页域技术人员公知的(见CurrentProtocolsinHumanGenetics第12章“VectorsForGeneTherapy,,&第13章"DeliverySystemsforGeneTherapy,,)。任选地,可优选在重组蛋白中掺入核定位信号以确保其在核内表达。一旦进入细胞内,大范围核酸酶和包含靶向DNA和/或编码大范围核酸酶的核酸的载体(如果存在的话)被细胞从胞质输入或易位至核内的作用位点。对治疗的目的而言,以治疗有效量施用大范围核酸酶和可药用赋形剂。如果施用量是有生理意义的,则这样的组合被称作以“治疗有效量”施用。如果一种药剂的存在导致可检测的接受者生理学改变,则它是有生理意义的。在本文中,如果药剂的存在导致目标疾病的一个或多个症状的严重程度减轻以及损伤或异常的基因组矫正,则它是有生理意义的。在根据本发明的用途的一个实施方案中,大范围核酸酶基本上是非免疫原性的,即不引发或几乎不引发不利的免疫应答。根据本发明可使用大量改善或消除这类有害免疫反应的方法。在一个优选的实施方案中,大范围核酸酶基本不含N-甲酰基甲硫氨酸。避免不想要的免疫反应的另一种方式是将大范围核酸酶与聚乙二醇("PEG")或聚丙二醇(“PPG")(优选500到20,000道尔顿的平均分子量(MW))缀合。与PEG或PPG缀合(例如Davis等(US4,179,337)所述)能够提供具有抗病毒活性的非免疫原性的生理活性水溶性内切核酸酶缀合物。Saifer等(US5,006,333)中还描述了使用聚乙-聚丙二醇共聚物的类似方法。本发明还涉及通过上文所述的多核苷酸或载体(优选表达载体)修饰的原核或真核宿主细胞。本发明还涉及非人转基因动物或转基因植物,其特征是其所有或部分细胞通过上文所述的多核苷酸或载体进行了修饰。本文使用的“细胞”是指原核细胞如细菌细胞,或真核细胞如动物、植物或酵母细胞。本发明的主题还包括如上所述的至少一种大范围核酸酶变体作为制造其他大范围核酸酶的骨架的用途。例如,为了制造新的、第三代大范围核酸酶的目的,可例如对所述变体进行第三轮诱变和选择/筛选。大范围核酸酶的不同用途以及本发明大范围核酸酶的使用方法还包括使用I-CreI变体、衍生自所述变体的单链嵌合大范围核酸酶、编码所述变体或单链嵌合大范围核酸酶的多核苷酸、载体、细胞、转基因植物或非人转基因哺乳动物的用途,如上所述。可通过改造能够切割来自人β珠蛋白基因的基因组DNA靶序列的I-CreI变体的方法来获得本发明的I-CreI变体,所述方法包括以下步骤(a)构建第一系列I-CreI变体,其在LAGLIDADG核心结构域的第一功能性亚结构域中具有至少一个替换,所述第一功能性亚结构域位于I-CreI的26到40位,(b)构建第二系列I-CreI变体,其在LAGLIDADG核心结构域的第二功能性亚结构域中具有至少一个替换,所述第二功能性亚结构域位于I-CreI的44到77位,(c)从来自步骤(a)的第一系列中选择和/或筛选能够切割突变体I-CreI位点的变体,所述突变体位点中(i)I-CreI位点-10到-8位的核苷酸三联体已被替换为存在于所述基因组靶标中-10到-8位的核苷酸三联体,且(ii)+8到+10位的核苷酸三联体已被替换为存在于所述基因组靶标中-10到-8位的核苷酸三联体的反向互补序列,(d)从来自步骤(b)的第二系列中选择和/或筛选能够切割突变体I-CreI位点的变体,所述突变体位点中(i)I-CreI位点-5到-3位的核苷酸三联体已被替换为存在于所述基因组靶标中_5到-3位的核苷酸三联体,且(ii)+3到+5位的核苷酸三联体已被替换为存在于所述基因组靶标中_5到-3位的核苷酸三联体的反向互补序列,(e)从来自步骤(a)的第一系列中选择和/或筛选能够切割突变体I_CreI位点的变体,所述突变体位点中(i)I-CreI位点+8到+10位的核苷酸三联体已被替换为存在于所述基因组靶标中+8到+10位的核苷酸三联体,且(ii)-10到-8位的核苷酸三联体已被替换为存在于所述基因组靶标中+8到+10位的核苷酸三联体的反向互补序列,(f)从来自步骤(b)的第二系列中选择和/或筛选能够切割突变体I-CreI位点的变体,所述突变体位点中(i)I-CreI位点+3到+5位的核苷酸三联体已被替换为存在于所述基因组靶标中+3到+5位的核苷酸三联体,且(ii)_5到-3位的核苷酸三联体已被替换为存在于所述基因组靶标中+3到+5位的核苷酸三联体的反向互补序列,(g)将来自步骤(c)和步骤(d)的两个变体中26到40位和44到77位的突变组合在单个变体中,获得切割以下序列的新的同二聚体I-CreI变体,所述序列中(i)-10到-8位的核苷酸三联体与存在于所述基因组靶标中-10到-8位的核苷酸三联体相同,(ii)+8到+10位的核苷酸三联体与存在于所述基因组靶标中-10到-8位的核苷酸三联体的反向互补序列相同,(iii)"5到_3位的核苷酸三联体与存在于所述基因组靶标中_5到-3位的核苷酸三联体相同,和(iv)+3到+5位的核苷酸三联体与存在于所述基因组靶标中_5到-3位的核苷酸三联体的反向互补序列相同,和/或(h)将来自步骤(e)和步骤(f)的两个变体中26到40位和44到77位的突变组合在单个变体中,获得切割以下序列的新的同二聚体I-CreI变体,所述序列中(i)+3到+5位的核苷酸三联体与存在于所述基因组靶标中+3到+5位的核苷酸三联体相同,(ii)-5到-3位的核苷酸三联体与存在于所述基因组靶标中+3到+5位的核苷酸三联体的反向互补序列相同,(iii)I-CreI位点+8到+10位的核苷酸三联体被替换为存在于所述基因组靶标中+8到+10位的核苷酸三联体,和(iv)-lO到-8位的核苷酸三联体与存在于所述基因组靶标中+8到+10位的核苷酸三联体的反向互补序列相同,(i)将步骤(g)和(h)中获得的变体相组合,以形成异二聚体,和(j)选择和/或筛选来自步骤⑴的能够切割来自人β珠蛋白基因的所述DNA靶序列的异二聚体。可省略步骤(c)、(d)、(e)或(f)之一。例如,如果省略步骤(C),则步骤(d)用这样的突变体I-CreI位点进行,所述突变中-10到-8位和-5到-3位的两个核苷酸三联体已被分别替换为存在于所述基因组靶标-10到-8位和-5到-3位的核苷酸三联体,且+3到+5位和+8到+10位的核苷酸三联体已分别被替换为存在于所述基因组靶标_5到-3位和-10到-8位的核苷酸三联体的反向互补序列。步骤(a)、(b)、(g)、(h)和⑴可进一步包括在下述位置引入另外的突变接触DNA靶序列或直接或间接地与所述DNA靶标相互作用的位置,改善突变体的结合和/或切割特性的位置,或防止或削弱功能性同二聚体形成或帮助异二聚体形成的位置,如上所述。可以根据本领域公知的标准诱变方法,例如通过使用PCR,通过对变体或变体库进行定点诱变和/或随机诱变来引入额外的突变。定点诱变可以有利地根据公知的重叠PCR技术,如上文所述,通过扩增包含突变位置的重叠片段来进行。另外,可以对变体或变体池有利地进行如图18中所述的多位点定点诱变。具体地,可以将随机突变引入整个变体或变体的部分中,尤其是引入变体的C端一半(80到163位),以改善突变体对来自目的基因的DNA靶标的结合和/或切割特性。在改善突变体结合和/或切割特性之位置(例如19、54、80、87、105和/或132位)上的定点诱变也可与随机诱变相组合。可根据本领域公知的并可以商品获得的标准诱变方法,通过对变体池(pool)产生随机/定点诱变文库来进行诱变。优选地,诱变在步骤(i)中形成或步骤(j)中获得的异二聚体的单体之一上进行,有利地在单体池上进行,优选地在步骤(i)或(j)的异二聚体的两个单体上均进行诱变。优选根据Arnould等,J.Mol.Biol.,Epub2007年5月10日的图4所阐述的过程进行至少两轮选择/筛选。在第一轮中,对异二聚体的单体之一进行诱变(图4中的单体Y),与另一单体(图4中的单体X)共表达以形成异二聚体,并针对来自目的基因的靶标选择改进的单体Y+。在第二轮中,对另一单体(单体X)进行诱变,与改进的单体Y+共表达形成异二聚体,并针对来自目的基因的靶标进行选择,以获得具有改进活性的大范围核酸酶(X+Y+)。诱变可以是对单体或单体库进行的随机诱变或定点诱变,如上文所述。有利地将这两种类型的诱变相结合。可以对一个或两个单体进行额外的选择/筛选轮次,以改进变体的切割活性。可通过直接重复重组测定法,通过与原始大范围核酸酶的切割活性比较,使用报告载体在酵母或哺乳动物细胞中测量本发明变体的切割活性。报告载体在间插序列内包含报告基因的两个截短的非功能性拷贝(直接重复)和被原始大范围核酸酶切割的基因组DNA靶序列,所述间插序列克隆到酵母或哺乳动物表达载体中。大范围核酸酶的表达导致基因组DNA靶序列的切割。该切割诱导直接重复之间的同源重组,产生功能性报告基因(例如LacZ),其表达可以通过合适的测定法监测。用与原始大范围核酸酶相比经改进的大范围核酸酶观察到更强的信号。或者可以在哺乳动物细胞中使用染色体测定法,将经改进的大范围核酸酶对其基因组DNA靶标的活性与相同基因组基因座上I-CreI对I-CreI位点的活性进行比较(Arnould等,J.Mol.Biol.,2007,371,49—65)。可根据公知的重叠PCR技术,通过扩增包含两个亚结构域中之每一个的重叠片段来进行步骤(g)和(h)中的(分子内)突变组合。步骤(i)中的(分子内)变体组合是通过将步骤(g)的一种变体与步骤(h)的一种变体共表达从而允许形成异二聚体来进行的。例如,可通过编码所述变体的一种或两种重组表达载体修饰宿主细胞。然后在允许表达所述变体的条件下培养所述细胞,从而在所述宿主细胞中形成异二聚体,如先前在PCT国际申请WO2006/097854,Arnould等,J.Mol.Biol.,2006,355,443-458中所述的。可如国际PCT申请WO2004/067736,Epinat等,NucleicAcidsRes.,2003,31,2952-2962和Chames等,NucleicAcidsRes.,2005,33,el78或Arnould等,J.Mol.Biol.,2006,355,443-458中所述,通过使用体外或体内切割测定来进行步骤(c)、(d)、(e)、(f)和/或(j)中的选择和/或筛选。根据所述方法的另一个优选的实施方案,通过重组介导的DNA双链断裂的修复在下述条件下在体内进行步骤(c)、(d)、(e)、(f)和/或(j),在所述条件下,由所述变体产生的突变DNA靶序列中的双链断裂导致阳性选择标记或报告基因的激活或者阴性选择标记或报告基因的失活。本发明的主题还包括在I-CreI的26到40位和/或44到77位具有突变的I-CreI变体,其适用于改造能够切割来自人β珠蛋白基因的DNA靶标的本发明变体。具体地,本发明包括如上所述改造I-CreI变体(包括表II、III、VI、VIII、X、XIII、XIV、XVII和XIX的变体)的方法的步骤(c)到(f)中定义的I-CreI变体。本发明还包括如上所述改造I-CreI变体的方法的步骤(g)和(h)中定义的I-CreI变体,所述变体包括SEQIDNO38到76、80到122、163、223到230之序列的变体(表II、III、VI、XIII、XIV和XVII的组合变体)。能够切割来自目的基因的DNA靶标的单链嵌合大范围核酸酶根据本领域公知的方法衍生自本发明的变体(Epinat等,NucleicAcidsRes.,2003,31,2952-62;Chevalier等,Mol.Cell.,2002,10,895-905;Steuer等,Chembiochem.,2004,5,206-13;国际PCT申请WO03/078619和W02004/031346)。任何这些方法都可用于构建衍生自本发明所述变体的单链嵌合大范围核酸酶。编码本发明所述变体的多核苷酸序列可通过本领域技术人员已知的任何方法制备。例如,通过使用特定引物的聚合酶链式反应从cDNA模板扩增它们。优选将所述cDNA的密码子选择成有助于所述蛋白质在期望的表达系统中表达。可通过公知的重组DNA和和遗传工程技术获得包含所述多核苷酸的重组载体并将其引入宿主细胞中。通过表达如上所述的多肽来产生本发明所述的I-CreI变体或单链衍生物;优选在适合多肽表达或共表达的条件下在以一个或两个表达载体(仅在变体的情况下)修饰的宿主细胞或转基因动物/植物中表达或共表达(仅在变体的情况下)所述多肽,并从宿主细胞培养物或从转基因动物/植物中回收变体或单链衍生物。除非另有说明,否则本发明的实施将使用本领域内的细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的常规技术。这些技术在文献中有详尽解释。参阅,例如CurrentProtocolsinMolecularBiology(FrederickΜ.AUSUBEL,2000,Wiley禾口sonInc,LibraryofCongress,USA);MolecularCloning:ALaboratoryManual,第三片反,(Sambrook等,2001,ColdSpringHarbor,NewYork:ColdSpringHarborLaboratoryPress);OligonucleotideSynthesis(M.J.Gait^辑,1984);Mullis等美国专利号4,683,195;NucleicAcidHybridization(B.D.Harries&S.J.Higgins编辑1984);TranscriptionAndTranslation(B.D.Hames&S.J.Higgins编辑1984);CultureOfAnimalCells(R.I.Freshney,AlanR.Liss,Inc.,1987);ImmobilizedCellsAndEnzymes(IRLPress,1986);B.Perbal,APracticalGuideToMolecularCloning(1984);theseries,MethodsInENZYM0L0GY(主编J.Abelson禾口M.Simon,AcademicPress,Inc.,NewYork),尤其是第154和155卷(Wu等编辑)以及第185卷,“GeneExpressionTechnology〃(D.Goeddel编辑);GeneTransferVectorsForMammalianCells(J.H.Miller禾口Μ·P.Calos编辑,1987,ColdSpringHarborLaboratory);ImmunochemicalMethodsInCellAndMolecularBiology(Mayer禾口Walker编辑,AcademicPress,London,1987);HandbookOfExperimentalImmunology,第I-IV卷(D.Μ·Weir和C.C.Blackwell编辑,1986);以及ManipulatingtheMouseEmbryo,(ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.,1986)。除了上述特征以外,本发明还包括在以下描述中显现的其他特征,所述描述涉及说明本发明的I-CreI变体及其用途的实施例、概括本发明中所述不同序列的表XXII、以及附图,在附图中-图1显示了通过大范围核酸酶诱导的重组来恢复功能性基因的两种不同策略。A.基因矫正。突变发生在HBB基因内。用大范围核酸酶切割并与修复基质重组后,有害突变被矫正。B.外显子序列敲入。突变发生在HBB基因内。突变的mRNA转录本示于基因下方。在修复基质中,位于切割位点上游的外显子与多聚腺苷酸化位点框内(像cDNA中那样)融合,在3'终止转录。内含子和外显子序列可用作同源区。外显子序列敲入产生被改造的基因,其转录为能够编码功能性HBB蛋白质的mRNA。-图2显示了归巢内切核酸酶的模块结构和用于制造重新设计的归巢内切核酸酶的组合方法。A.与其DNA靶标结合的I-CreI归巢内切核酸酶的三维结构。催化核心被两个αββαββα折叠包围,所述折叠在DNA大沟上形成鞍形相互作用界面。B.来自于I-CreI靶序列的不同的结合序列(右上和坐下),以获得切割非回文嵌合靶标的异二聚体或单链融合分子(右下)。C.鉴定更小的独立亚基(即在单个单体或αββαββα折叠内的亚基(右上和左下))允许通过将突变在同一单体内组合来设计新的嵌合分子(右下)。这样的分子切割回文嵌合靶标(右下)。D.两个先前步骤的组合允许进行涉及四个不同亚结构域的更大的组合方法。产生了具有局部改变的特异性的I-CreI衍生物的大集合。在第一步骤中,可将几个新的大范围核酸酶组合成新的同二聚体蛋白质(通过将突变组合在同一单体内;“半-大范围核酸酶”),该分子切割来自期望切割之靶标的回文靶标。然后,这样的“半_大范围核酸酶”的组合可产生切割目的靶标的异二聚体种类(定制大范围核酸酶)。因此,针对各亚结构域鉴定少量新的切割酶(cleaver)允许设计非常大量的新内切核酸酶,其具有完全重新设计的特异性。-图3显示了人HBB基因的基因组座位。人HBB基因(登录号NT_009237.17;1606bp;SEQIDNO:3)包含在4080bp的片段(SEQIDNO:4)中。外显子序列用灰色框标明,并标明了其接合处。标明了HBB5、HBB6和HBB8靶标的序列和位置。HBB8靶标是天然HBB6序列的突变形式,其导致镰状细胞贫血症。标明了将谷氨酸残基改变为缬氨酸的突变(A到T的颠换)。-图4显示了HBB5靶序列及其衍生物。将所有靶标与C1221靶标进行比对,所述C1221靶标是被I-CreI切割的回文序列。10GGT_P、10AAG_P、5CCT_P和5AGG_P是发现被I-CreI突变体切割的密切衍生物。它们与C1221的区别为带框的基序。C1221、10GGT_P、10AAG_P、5CCT_P和5AGG_P首先被描述为24bp的序列,但是结构数据表明只有22bp与蛋白质/DNA相互作用相关。然而,在括号中标出了士12位。HBB5是位于人HBB基因中1237-1258位的DNA序列(图3)。HBB5.3是衍生自HBB5右侧部分的回文序列,HBB5.4是衍生自HBB5左侧部分的回文序列。如图中所示,来自10GGT_P、10AAG_P、5CCT_P*5AGG_P的带框基序存在于HBB5系列靶标中。-图5显示了HBB6/HBB8靶序列及其衍生物。将所有靶标与C1221靶标进行比对,所述C1221靶标是被I-CreI切割的回文序列。10AGA_P、10TGA_P、5TCT_P和5CCT_P是发现被I-CreI突变体切割的密切衍生物。它们与C1221的区别为带框的基序。C1221、10AGA_P、10TGA_P、5TCT_P和5CCT_P首先被描述成24bp的序列,但是结构数据表明只有22bp与蛋白质/DNA相互作用相关。然而,在括号中标出了士12位。HBB6是位于人HBB基因中1138-1159位的天然靶标(图3)。同样位于人HBB基因中1138-1159位的HBB8在1148位上包含A到T的颠换,所述颠换造成镰状细胞贫血症(图3)。在HBB8.2靶标中,靶标中央的序列被存在于C1221中的碱基代替。HBB8.3是衍生自HBB8右侧部分的回文序列,HBB8.4是衍生自HBB8左侧部分的回文序列。HBB8.5和HBB8.6是分别衍生自HBB8左侧部分和右侧部分的回文序列,CCAC序列存在于中部。HBB6.5和HBB6.6是分别衍生自HBB6左侧部分和右侧部分的回文序列,CCTC序列存在于中部。如图中所示,来自于10AGA_P、10TGA_P、5TCT_P和5CCT_P的带框基序存在于HBB6/HBB8系列靶标中。-图6显示了组合突变体对HBB5.3的切割。该图展示了用HBB5.3靶标初步筛选I-CreI组合突变体的实例。在上方的滤膜中,08、?10、!15和!16(带框)位置上的阳性突变体的序列分别为KDSRQS/DASKR、KNSHQS/KYSDT、KKSAQS/KYSDT和KKSAQS/RYSNQ(命名法与表II相同)。在下方的滤膜中,C6、C8和El(带框)位置上的阳性突变体的序列分别为KNSSKS/KYSDT、KNSRRS/KSSNV和KKSTQS/RYSNQ。H10、Hll、H12是不同长度的阳性对照。-图7显示了组合突变体对HBB5.4的切割。该图展示了用HBB5.4靶标初步筛选I-CreI组合突变体的实例。在上方的滤膜中,A9、D4和H3(带框)位置上的阳性突变体的序列分别为KGSYQS/RYSET、KNSYQS/ARSER和KNQYQS/ARSER(命名法与表III相同)。在下方的滤膜中,B6和B12(带框)位置上的阳性突变体的序列分别为KQSRQS/ARSER和KGSYQS/ARSE。H10、H11、H12是不同长度的阳性对照。-图8显示了异二聚体组合突变体对HBB5.2和HBB5靶标的切割。A.用HBB5.2再次筛选I-CreI突变体的80个组合。B.用HBB5靶标再次筛选同一I-CreI突变体组合。用竖框标出针对HBB5.2靶标(图A)或HBB5靶标(图B)筛选的克隆。-图9显示了HBB5靶标的切割。优化了切割HBB5.4的一系列I_CreIN75突变体,并与切割HBB5.3的两个突变体共表达。用HBB5靶标测试切割。圈出显示改进的HBB5切割的突变体。在所示的两个滤膜中,B2对应于以下任一异二聚体-28K30N32T33Y38Q40S44A68R70S75E77R80K96R(KNTYQS/ARSER/80K96R)+KTSHRS/KYSDT(图A)或-28K30N32T33Y38Q40S44A68R70S75E77R80K96R(KNTYQS/ARSER/80K96R)+KNSRRS/KYSDT(图B)。H10、H11、H12是不同长度的阳性对照。-图10显示了组合突变体对HBB8.3的切割。该图展示了用HBB8.3靶标对I-CreI组合突变体进行初步筛选的实例。在上方的滤膜中,D3、D4、E5、E7、E10、G3和Gll(带框)位置上的阳性突变体的序列分别为KTSHRS/KYSNI、KNSSKS/KYSNY、KNSRRS/KYSNY、KNSTRS/KYSNV,KNSGKS/QASNR、KTSHRS/KYSNY、KDSRQS/KYSNY(命名法与表VI相同)。在下方的滤膜中,C9、F6、G3和H4(带框)位置上的阳性突变体的序列分别为KNSGKS/KYSNI、KDSRQS/QSSNR、KSSGQS/KYSNY、KNSGRS/KYSNV(命名法与表VI相同)。H10、Hll、H12是不同长度的阳性对照。-图11显示了组合突变体对HBB8.4的切割。该图展示了用HBB8.4靶标对I-CreI组合突变体进行初步筛选的实例。在上方的滤膜中,A10、A12、B5、B8、C11、E1和G8(带框)位置上的阳性突变体的序列分别为KNSSRH/RRSND、KTSGQS/DASKR、KNTCQS/KYSDT、KNETQS/RYSNQ、KNSCTS/KTSDR、KNETQS/DASKR和KNETQS/DASKR(命名法与表VII相同)。在第二滤膜中,A4、B2和G12(带框)位置上的阳性突变体的序列分别为KNTCQS/KTSDR、KNTTQS/KTSDR和KNSTQT/RYSNQ(命名法与表VII相同)。H10、Hll、H12是不同长度的阳性对照。-图12显示了异二聚体组合突变体对HBB8的切割。A.用HBB8.2靶标再次筛选I-CreI突变体的组合。B.用HBB8靶标再次筛选同一I-CreI突变体组合。圈出通过针对HBB8.2靶标(图A)或HBB8靶标(图B)筛选获得的阳性克隆。-图13显示了pCLS0542载体图。-图14显示了pCLS1055载体图。-图15显示了pCLS1107载体图。-图16展示了可见于人β珠蛋白基因中的大范围核酸酶靶序列,以及能够切割所述DNA靶标的相应I-CreI变体。标出了与靶序列最接近的外显子和外显子接合处(第1列和第2列),显示了DNA靶标的序列(第3列)及其第一个核苷酸相对于SEQIDNO4的位置(第4列)。修复靶位点切割的最小修复基质通过其第一个核苷酸(起点,第7列)和最后一个核苷酸(终点,第8列)标出。各I-CreI变体的序列由所指位置上的突变的残基来定义。例如,图16的第一个异二聚体变体由在30、33、44、68、70和75位分别具有S、G、D、N、S和N的第一单体和在33、38、70、75和77位分别具有Τ、A、S、Y、R的第二单体组成。上述位置参考I-CreI序列SWISSPROTP05725(SEQIDNO1)进行标示;I-CreI在30、33、38、44、68、70、75和77位分别具有N、Y、Q、Q、R、R、D禾口I。-图17显示了切割HBB5.3或HBB5.4靶标的优化I-CreI突变体对HBB5的切割。A.用HBB5靶标对I_CreI精细化突变体进行异二聚体初步筛选的实例,所述突变体切割HBB5.3序列并具有通过定点诱变获得的替换G19S。在滤膜中,B11、C3、E3、G6、G11、G12、H6和H9位置上的阳性突变体的序列分别为KTSHRS/KYSDT+19S、KNSRRS/KYSDT+19S、KNSRRS/KYSNQ+19S+82E、KNSRRS/RYSNQ+19S、KNSSKS/KYSNQ+19S、KTSHRS/KYSDT+19S、KNSSKS/KYSNQ+19S+92R、KNSSKS/KYSDR+G19S(命名法与表V相同)。H10、H11、H12是不同长度的阳性对照。B.用HBB5靶标对I_CreI精细化突变体进行异二聚体初步筛选的实例,所述突变体切割HBB5.4序列并具有通过定点诱变获得的替换G19S。在滤膜中,B8位置上的阳性突变体的序列为KNDYQS/ARSER+19S+80K+96R,E1位置上为KNPYQS/ARSER+19S,E11、F6、F11位置上为KNTYQS/ARSER+19S+80K,B10、C2、D5、D7、F7位置上为KNTYQS/ARSER+19S+80K+96R(命名法与表V相同)。H10、H11、H12是不同长度的阳性对照。-图18显示了对I-CreI突变体进行多位点定点诱变的原理。首先进行六组独立的重叠PCR反应,其扩增I-CreIN75编码序列的内部片段,其中包含在插入突变G19S、F54L、E80K、V105A、I132V所影响的位置之间的序列。然后将六个片段库纯化并通过PCR进行装配,获得具有不同突变的I-CreI编码序列。-图19显示了通过随机诱变获得的切割HBB5.3或HBB5.4靶标的优化I-CreI突变体对HBB5的切割。A.用HBB5靶标对切割HBB5.3序列的I_CreI精细化突变体进行异二聚体筛选的实例。在滤膜中,用圆圈和方块标出具有提高的HBB5靶标切割效率的阳性突变体。B5、E6和ElO(方块)位置上的阳性突变体的序列分别为KNSRRS/KYSDR+19S+87L+103S+147A、KNSRRS/KYSDR+16L+19S+87L+159R、KNSRRS/KYSNQ+19S+82E+105A+162P(命名法与表V相同)。H10、HlUH12是不同长度的阳性对照。B.用HBB5靶标对切割HBB5.4序列的I_CreI精细化突变体进行异二聚体筛选的实例。在滤膜中,用圆圈和方块标出具有提高的HBB5靶标切割效率的阳性突变体。E1、F3、G7和Hl(方块)位置上的阳性突变体的序列分别为KNTYQS/ARSER+19S+80K、KNTYQS/ARSER+19S+34R+80K+87L+96R、KNTYQS/ARSER+24V+43L+80K+82R+87L+155P、KNTYQS/ARSER+19S+34R+80K+87L+96R(命名法与表V相同)。HlO、H11、H12是不同长度的阳性对照。-图20显示了通过多位点定点诱变获得的切割HBB5.3或HBB5.4靶标的优化I-CreI突变体对HBB5的切割。A.用HBB5靶标对切割HBB5.3序列的I_CreI精细化突变体进行异二聚体筛选的实例。在滤膜中,用圆圈和方块标出具有提高的HBB5靶标切割效率的阳性突变体。Al、A8、D3和H7(方块)位置上的阳性突变体的序列分别为KNSRRS/KYSNQ+19S+80K+132V、KNSRRS/KYSDR+19S+105A+132V+159E+160E、KSSHRS/KYSDQ+105A+132V,KSSHRS/KYSNQ+19S+80K(命名法与表V相同)。H10、H11、H12是不同长度的阳性对照。B.用HBB5靶标对切割HBB5.4序列的I_CreI精细化突变体进行异二聚体筛选的实例。在滤膜中,用圆圈和方块标出具有提高的HBB5靶标切割效率的阳性突变体。C2、C1UD3和E2(方块)位置上的阳性突变体的序列分别为KNSYQS/ARSER+24V+43L+80K+96R、KNTYQS/ARSER+19S+80K+96R+132V、KNTYQS/ARSER+80K+96R+132V、KNDYQS/ARSER+19S+80K+96R+132V(命名法与表V相同)。H10、H11、H12是不同长度的阳性对照。-图21显示了CHO哺乳动物中HBB5DNA靶标的染色体外切割。测试12个异二聚体组合的切割效率。所测试的优化突变体的序列描述于表XII中。阴性对照PCLS1069是空表达载体。-图22显示了HBB8靶标的切割。将一系列I-CreIN75优化的定点突变体与切割HBB8.4的一个突变体共表达,所述定点突变体具有F54L、F87L、V105A、I132V突变(图A)或者G19S和E80K突变(图B),并且切割HBB8.3。用HBB8靶标测试切割。H10、HlUH12是不同长度的阳性对照。-图23显示了HBB8.5和HBB6.5靶标的切割特异性。在同二聚体筛选中,针对切割HBB8.5靶标(图A)或HBB6.5靶标(图B)的效率对一系列I-CreIN75优化的定点突变体进行测试,所述定点突变体具有F54L、F87L、V105A、I132V突变并且切割HBB8.3。H10、H11、H12是不同长度的阳性对照。-图24显示了HBB8靶标的切割。将一系列I-CreIN75优化的定点突变体与切割HBB8.3的一个突变体共表达,所述定点突变体具有F54L、E80K、F87L、V105A、I132V突变(图A)或G19S突变(图B)。用HBB8靶标测试切割。H10、HlUH12是不同长度的阳性对照。-图25显示了来自HBB8.6和HBB6.6的靶标的切割特异性。在同二聚体筛选中,针对切割HBB8.6靶标(图A)或HBB6.6靶标(图B)的效率,对一系列I-CreIN75优化的定点突变体进行测试,所述定点突变体具有F54L、E80K、F87L、V105A、I132V突变并且切割HBB8.4。HlO、Hl1、Hl2是不同长度的阳性对照。-图26显示了CHO哺乳动物细胞中靶向HBB衍生序列的大范围核酸酶的染色体外切割效率。针对切割靶标HBB8和HBB6的效率,比较十九个异二聚体组合。测试的优化突变体的序列描述于表XXI中。阴性对照PCLS1069是空表达载体。-图27显示了哺乳动物细胞中的报告系统。嘌呤霉素抗性基因处于EFIα启动子的控制下,所述基因被起始密码子下游132bp的I-SceI切割位点中断(1)。该转基因已在CHO-Kl细胞中以单拷贝稳定表达。为了在同一染色体环境中引入大范围核酸酶靶位点,修复基质由以下组成i)无启动子的潮霉素抗性基因,)完整的IacZ表达盒,和iii)同源序列的两条臂(1.Ikb和2.3kb)。已构建了若干修复基质,其区别仅在于中断IacZ基因的识别位点(2)。因此,产生了称为Al细胞系、I-SceI细胞系和I-CreI细胞系的非常相似的细胞系。在将IacZ修复基质(长度2kb)与表达切割该识别位点之大范围核酸酶的载体共转染时,功能性IacZ基因被重建(3)。大范围核酸酶诱导的重组水平可以从转染后的蓝色菌落或灶点数来推测。-图28显示了切割HBB8DNA靶序列的大范围核酸酶的染色体切割效率。用修复基质和不同量大范围核酸酶表达载体转染含有HBB8或HBB6染色体报告系统的CHO细胞后,检测LacZ基因的修复频率,所述表达载体编码优化的HBB8异二聚体H3/A4(突变体序列见表XXI)。-图29显示了用于人HBB基因座基因靶向的敲入载体。描述了人基因组HBB基因座的结构。描述了适用于基因靶向的载体。LH和RH对应于同源性的左臂和右臂。显示了用潮霉素和更昔洛韦(Ganciclovir)选择克隆的标记。标出了对基质HBB6位点序列的修饰。-图30显示了pCLS1058载体图谱。-图31显示了pCLS1069载体图谱。然而,应当清楚地明白,这些例子仅通过示例本发明主题的方式给出,而不以任何方式构成限制。实施例1产生切割HBB5.3的大范围核酸酶本实施例显示,I-CreI突变体能够切割来自HBB5靶标右侧部分之回文形式的HBB5.3DNA靶序列(图4)。本实施例中描述的靶序列是22bp回文序列。因此,仅以前11个核苷酸描述它们,随后是后缀_P。例如,靶标HBB5.3还被记为tggtCtCCtgt_P(SEQIDN0:25)。HBB5.3在士1、士2、士3、士4、士5位与5CCT_P相似,并在士1、士2、士8、士9禾口士10位与10GGT_P相似。推测位置士6、士7和士11对结合和切割活性几乎没有影响。先前通过在44、68、70、75和77位诱变I-CreIN75获得了能够切割5CCT_P(caaaaccctgt_P;SEQIDNO22)的突变体,如Arnould等,J.Mol.Biol.,2006,355,443-458和国际PCT申itWO2006/097784、WO2006/097853中所述。通过在28、30、32、33、38、40和70位上诱变I-CreIN75和D75获得了能够切割10GGT_P靶标(cggtacgtcgt_P;SEQIDNO:20)的突变体(Smith等,NucleicAcidsRes.,2006,34,el49和国际PCT申请W02007/049095和WO2007/057781)。因此,组合这样的突变体对会允许切割HBB5.3靶标。两组蛋白质均在70位上被突变。然而存在两个可分离的功能性亚结构域(Smith等,NucleicAcidsRes.,2006,34,el49和国际PCT申请WO2007/060495和WO2007/049156)。这意味着该位置对靶标的碱基10到8中的特异性几乎没有影响。因此,为了检验组合的突变体是否能够切割HBB5.3靶标,将来自切割5CCT_P的蛋白质中44、68、70、75和77位的突变和来自切割10GGT_P的蛋白质中28、30、32、33、38和40位的突变组合。1)材料和方法国际PCT申请WO2004/067736;Epinat等,NucleicAcidsRes.,2003,31,2952-2962;Chames等,NucleicAcidsRes.,2005,33,el78,和Arnould等,J.Mol.Biol.,2006,355,443-458中描述了在哺乳动物或酵母细胞中产生大范围核酸酶的方法和基于切割所诱导的重组的测定,其用于筛选具有改变的特异性的变体。这些测定产生可通过标准方法监测的功能性LacZ报告基因。a)构建靶标载体如下克隆靶标侧翼是gateway克隆序列的对应于靶序列的寡核苷酸从Proligo定购5,tggcatacaagttttggtctcctgtacaggagaccaacaatcgtctgtca3,(SEQIDNO33)。使用Gateway方案(INVITR0GEN),将通过PCR扩增单链寡核苷酸而产生的双链靶DNA克隆进酵母报告载体(PCLS1055,图14)中。将酵母报告载体转化进酿酒酵母菌株FYBL2-7B(MATα,ura3A851,trplΔ63,leu2A1,lys2Δ202)中。b)构建组合突变体如先前在Smith等,NucleicAcidsRes.,2006,34,el49;国际PCT申请WO2007/049095、WO2007/057781和Arnould等,J.Mol.Biol.,2006,355,443-458;国际PCT申请WO2006/097784和WO2006/097853中所述,分别针对10GGT_P或5CCT_P靶标鉴定了切割10GGT_P或5CCT_P的I-CreI突变体。为了产生含有来自两个系列的突变的来自I-CreI的编码序列,分别进行扩增I-CreI编码序列5’端(1_43位aa)或3’端(39-167位)的重叠PCR反应。对5’和3’两端而言,使用对载体(pCLS0542,图13)特异的引物Ga110F(5'-gcaactttagtgctgacacatacagg-3';SEQIDNO34)或GallOR(5,-acaaccttgattggagacttgacc-3,;SEQIDNO35)以及对I-Crel编码序列氨基酸39-43特异的引物(assF5'-ctannnttgaccttt-3'(SEQIDNO36)或assR5'-aaaggtcaannntag-3‘(SEQIDNO:37)(其中nrrn编码40位残基))进行PCR扩增。合并用相同引物从扩增反应获得并且对40位残基而言具有相同编码序列的PCR片段。然后,将从使用引物GallOF和assR或者assF和GallOR的反应获得的每个PCR片段库以等摩尔比混合。最后,使用高效LiAc转化方案(Gietz和Woods,MethodsEnzymo1.,2002,350,87-96),使用通过NcoI和EagI消化而线性化的75ng载体DNA(pCLS0542)和25ng两种重叠PCR片段的每种最终库,转化酵母酿酒酵母菌株FYC2-6A(MATa,trplA63,IeuA1,his3A200)。通过酵母中的体内同源重组产生同时含有两组突变的完整编码序列。c)龄表汰±細細隱械筛选如先前所述进行(Arnould等,J.Mol.Biol.2006,355,443-458)。使用菌落网格(gridder)(QpixILGenetix)进行接合。使用低网格密度(约4个点/cm2)将突变体在覆盖YPD平板的尼龙滤膜上划网格。在相同的滤膜上进行第二次划网格的过程从而印上第二层,所述第二层对每个靶标而言由具有不同报告子的酵母菌株组成。将膜置于富含固体琼脂YPD的培养基上,并在30°C孵育一夜,以允许接合。接着,将滤膜转移至合成培养基上并在37°C孵育五天,以选择带有表达载体和靶标载体的二倍体,所述合成培养基缺乏亮氨酸和色氨酸,并含有半乳糖(1%)作为碳源。5天后,将滤膜置于固体培养基上并在37°C孵育,以监测β-半乳糖苷酶活性,所述固体培养基在0.5M磷酸钠缓冲液pH7.O中含有0.02%X-Gal、0.SDS、6%二甲基甲酰胺(DMF)、7mMβ-巯基乙醇、1%琼脂糖。通过扫描分析结果,并使用合适的软件进行量化。d)突变体测序为了回收突变体表达质粒,使用标准方案提取酵母DNA并用于转化大肠杆菌。然后通过MILLEGENSA对质粒进行突变体ORF的测序。或者,通过PCR从酵母DNA中扩增ORF(Akada等,Biotechniques,2000,28,668-670)并通过MILLEGENSA直接对PCR产物进行测序。2)结果通过在I-CreIN75或D75骨架上将44、68、70、75和77位的突变与28、30、32、33、38和40位的突变相结合来构建I-CreI组合突变体,得到复杂度1935的文库。组合的例子展示于表II中。将该文库转化进酵母中,并针对对HBB5.3DNA靶标(tggtctcctgt_P;SEQIDNO25)的切割筛选了3456个克隆(多样性的1.8倍)。发现了366个阳性克隆,其在测序和通过再次筛选验证后显示对应于176种不同的新内切核酸酶(见表II)。表II所示的20种新的内切核酸酶对应于序列表中的序列SEQIDN0:38到57。切割HBB5.3靶标的阳性突变体的例子显示于图6中。在实施例通篇上下文和图中,组合突变体均根据28、30、32、33、38、40、44、68和70、75和77位残基的11字母编码来命名。例如,KCSRQS/KASDI代表I-CreIK28、C30、S32、R33、Q38、S40、K44、A68、S70、D75和177(I-CreI28K30C32S33R38Q40S44K68A70S75D77I)。亲本突变体根据28、30、32、33、38和40位残基的六字母代码或44、68、70、75和77位残基的五字母代码来命名。例如,KCSRQS代表I-CreIK28、C30、S32、R33、Q38和S40K,KASDI代表I-CreIK44、A68、S70、D75和177。ΜΛΙ组合变体对HBB5.3靶标的切割<table>tableseeoriginaldocumentpage41</column></row><table>仅展示了1935个组合中的110个。+表示组合变体切割HBB5.3靶标*SEQID49与SEQID163相同;在第二轮测序后检测到165位的突变实施例2产生切割HBB5.4的大范围核酸酶该实施例显示,I-CreI突变体能够切割来自HBB5靶标左侧部分的回文形式HBB5.4DNA靶序列(图4)。本实施例中描述的所有靶序列是22bp回文序列。因此,仅以前11个核苷酸描述它们,随后是后缀—P。例如,HBB5.4会被称作caagacagggt—P(SEQIDNO26)οHBB5.4在士1、士2、士3、士4、士5、士6、士7、士9、士10和±11位与5AGG—P相似,并在士1、士2、士6、士7、士8、士9、士10禾P士11位与10AAG—P相似。推测士6和士11位对结合和切割活性几乎没有影响。如Arnould等,J.Mol.Biol.,2006,355,443-458和国际PCT申ifWO2006/097784、W02006/097853中所述,先前通过在44、68、70、75和77位诱变I-CreIN75获得了能够切割5AGG—P的突变体。如Smith等,NucleicAcidsRes.,2006,34,el49和国际PCT申请WO2007/049095和WO2007/057781中所述,通过在28、30、32、33、38、40和70位上诱变I-CreIN75和D75获得了能够切割10AAG—P靶标的突变体。因此,组合这样的突变体对会允许切割HBB5.4靶标。两组蛋白质均在70位上被突变。然而,推测存在两个可分离的功能性亚结构域(Smith等,NucleicAcidsRes.,2006,34,el49和国际PCT申请WO2007/060495和WO2007/049156)。这意味着该位置对针对靶标碱基8到10的特异性几乎没有影响。因此,为了检验组合突变体是否能够切割HBB5.4靶标,将来自切割5AGG—P(caaaacagggt—P;SEQIDNO23)的蛋白质44、68、70、75和77位的突变与来自切割10AAG_P(caagacgtcgt_P;SEQIDNO21)的蛋白质的28、30、32、33、38、40突变相组合。1)材料和方法见实施例1,不同之处是使用高效LiAc转化方案(Gietz和WoodS2002),使用25ngPCR产物和经DraIII和NgoMIV消化而线性化的75ng载体DNA(pCLS1107,图15)转化酵母酿酒酵母(Saccharomycescerevisiae)菌株FYC2-6A(ΜΑΤα,trplΔ63,leu2A1,his3Δ200)。在酵母中通过体内同源重组产生含有完整的I-CreI突变体编码序列的表达质粒。2)结果通过在I-CreIΝ75或D75骨架上将44、68、70、75和77位的突变与28、30、32、33、38和40位的突变相结合来构建I-CreI组合突变体,得到复杂度920的文库。组合突变体的例子展示于表III中。将该文库转化进酵母中,并针对对HBB5.4DNA靶标(caagacagggt_P;SEQIDNO26)的切割筛选了1728个克隆(多样性的1.9倍)。发现了25个阳性克隆,其在测序和通过再次筛选验证后显示对应于19种不同的新内切核酸酶(见表III)。表III所示的19种新的内切核酸酶对应于序列表中的序列SEQIDNO58到76。切割HBB5.4靶标的阳性突变体的例子显示于图7中。表III组合变体对HBB5.4靶标的切割<table>tableseeoriginaldocumentpage42</column></row><table>*仅展示了920个组合中的110个+表示组合变体切割HBB5.4靶标实施例3产生切割HBB5的大范围核酸酶在实施例1和2中鉴定了能够切割每个来自HBB5的回文靶标(HBB5.3和HBB5.4)的I-CreI突变体。在酵母中共表达这样的突变体对(一个切割HBB5.3,一个切割HBB5.4)。共表达后,应当有三种活性分子种类——两种同二聚体和一种异二聚体。测试应当形成的异二聚体是否能够切割HBB5.2和HBB5靶标。1)材料和方法a)KanH示表汰·Φ械··为了在酵母中共表达两种I-CreI突变体,将切割ΗΒΒ5.4序列的突变体亚克隆到用卡那霉素抗性基因标记的酵母表达载体(PCLS1107,图15)中。使用pCLS0542和PCLS1107通用的引物GallOF5,-gcaactttagtgctgacacatacagg_3,(SEQIDNO34)和Gall0R5‘-acaaccttgattggagacttgacc-3‘(SEQIDNO:35),通过PCR反应扩增突变体。使用高效LiAc转化方案,使用约25ngPCR片段和通过DraIII和NgoMIV消化被线性化的75ng载体DNA(pCLS1107)转化酵母酿酒酵母菌株FYC2-6A(ΜΑΤα,trplΔ63,leu2A1,his3A200)。在酵母中通过体内同源重组产生I-CreI突变体的完整编码序列。然后将含有亚克隆到PCLS1107载体中的切割HBB5.4靶标之突变体的每种酵母菌株与带有HBB5.4靶标的酵母进行接合来验证。为了回收表达突变体的质粒,使用标准方案提取酵母DNA,用于转化大肠杆菌(E.coli)并制备大肠杆菌DNA。b)突变体共表汰用pCLS1107表达载体中编码切割HBB5.4靶标之突变体的DNA转化酵母菌株,所述酵母菌株表达PCLS0542表达载体中切割HBB5.3靶标的突变体。在L_Glu+G418培养基上选择转化体。c)龄±細細献表汰描使用菌落网格(gridder)(QpixII,Genetix)进行接合。使用低网格密度(约4个点/cm2)将突变体在覆盖YPD平板的尼龙滤膜上划网格。在相同的滤膜上进行第二次划网格的过程从而印上第二层,所述第二层对每个靶标而言由具有不同报告子的酵母菌株组成。将膜置于富含固体琼脂YPD的培养基上,并在30°C孵育一夜,以允许接合。接着,将滤膜转移至合成培养基上并在37°C孵育五天,以选择带有表达载体和靶标载体的二倍体,所述合成培养基缺乏亮氨酸和色氨酸,添加G418,并含有半乳糖(1%)作为碳源。5天后,将滤膜置于固体琼脂糖培养基上并在37°C孵育,以监测半乳糖苷酶活性,所述固体琼脂糖培养基在0.5Μ磷酸钠缓冲液ρΗ7.0中含有0.02%X-GaUO.1%SDS、6%二甲基甲酰胺(DMF)、7mMβ_巯基乙醇、1%琼脂糖。通过扫描分析结果,并使用合适的软件进行量化。2)结果切割ΗΒΒ5.3(8个突变体)和ΗΒΒ5.4(10个突变体)序列的突变体的共表达几乎在所有情况下均导致ΗΒΒ5.2靶标的有效切割(图8,图Α)。然而,这些组合均不能够切割ΗΒΒ5天然靶标(图8,图B),所述ΗΒΒ5天然靶标与ΗΒΒ5.2序列的区别仅在于_2、+1和+2位的3bp(图4)。切割HBB5.2靶标的功能性组合总结于表IV中。^TV导致HBB5.2靶标切割的组合<table>tableseeoriginaldocumentpage44</column></row><table>+表示异二聚体突变体切割ΗΒΒ5.2靶标。Α该突变体被称作SEQIDΝ0:49,其与SEQID163相同在第二轮测序后检测到165位的突变实施例4通过对切割ΗΒΒ5.4的蛋白质进行随机诱变并与切割ΗΒΒ5.3的蛋白质进行装配来产生切割ΗΒΒ5的大范围核酸酶已通过将切割回文ΗΒΒ5.3和ΗΒΒ5.4靶标的突变体进行装配而鉴定了能够切割非回文ΗΒΒ5.2靶标的I-CreI突变体。然而,这些组合均不能够切割ΗΒΒ5,所述ΗΒΒ5与ΗΒΒ5.2的差异仅在于_2、+1和+2位的3bp(图4)。因此,对切割HBB5.2的蛋白组合进行了诱变,并筛选了有效切割HBB5的突变体。根据与其靶标结合的I-CreI蛋白质的结构,4个中央碱基对(-2到2位)不与I-CreI蛋白接触(Chevalier等,Nat.Struct.Biol.,2001,8,312-316;ChevalierB.S.和StoddardB.L.,NucleicAcidsRes.,2001,29,3757-3754;Chevalier等,J.Mol.Biol.,2003,329,253-269)。因此,难以合理地选择一组位置来诱变,因此在整个蛋白质上进行了诱变。随机诱变产生高复杂度文库,并且通过仅对切割HBB5.2的异二聚体的两个组件之一进行诱变,来限制待测试变体文库的复杂度。因此,诱变切割HBB5.4的蛋白质,并且测试与切割HBB5.3的蛋白质共表达时它们是否能够有效切割HBB5。1)材料和方法a)通过随机诱变构建文库如JBSdNTP-诱变试剂盒中JENABIOSCIENCEGmbH的方案所述,通过使用Mn2+的PCR,或通过使用dNTP衍生物8-氧-dGTP和dPTP的两步式PCR,以选择的突变体池为基础创建随机诱变文库。使用的引物是preATGCreFor(5,-gcataaattactatacttctatagacacgcaaacacaaatacacagcggccttgccacc-3';SEQIDNO77)禾口ICreIpostRev(5,-ggctcgaggagctcgtctagaggatcgctcgagttatcagtcggccgc-3';SEQIDNO:78)。使用高效LiAc转化方案(Gietz和Woods,MethodsEnzymo1.,2002,350,87-96),使用通过DraIII和NgoMIV消化而线性化的75ng载体DNA(pCLS1107,图15)和约25ngPCR产物转化酵母酿酒酵母菌株FYC2-6A(MATa,trplA63,leu2A1,his3A200)。通过酵母中的体内同源重组产生含有I-CreI突变体的完整编码序列的表达质粒。b)突变体_靶标酵母菌株,筛诜和测序使用高效LiAc转化方案,用PCLS0542载体(用LEU2基因标记)中切割HBB5.3靶标的突变体转化酵母菌株FYBL2-7B(MATa,ura3Δ851,trplΔ63,leu2Δl,lys2Δ202),所述酵母菌株在酵母报告载体(PCLS1055,图14)中含有ΗΒΒ5靶标。使用突变体-靶标酵母作为实施例1中所述接合实验的靶标菌株。如实施例1中所述通过测序(MILLEGEN)验证具有阳性结果的克隆。2)结果将切割ΗΒΒ5.4的四个突变体(根据表IV的命名法为KGSYQS/RYSET、KGSYQS/ARSER,KGSYQS/TRSER,KNTYQS/ARSER)合并,随机诱变并转化进酵母中。然后将2280个转化克隆与酵母菌株接合,所述酵母菌株含有(i)在报告质粒中的HBB5靶标,(ii)表达质粒,其含有切割HBB5.3靶标的突变体(根据表IV的命名法为KTSHRS/KYSDT或KNSRRS/KYSDT)。将这两种酵母菌株接合后,发现一个阳性克隆切割HBB5靶标。在对照实验中,发现该阳性克隆在不与KTSHRS/KYSDT或KNSRRS/KYSDTI-CreI突变体共表达时不引起HBB5的切割。总之,该阳性克隆含有能够与KTSHRS/KYSDT或KNSRRS/KYSDT形成异二聚体而产生HBB5靶标切割活性的蛋白质。实现阳性克隆鉴定的酵母筛选实验展示于图9中。根据表IV的命名法的阳性克隆的序列列于表V中。^V对HBB5展示切割活性的功能性突变体组合<table>tableseeoriginaldocumentpage46</column></row><table>*由随机诱变引起的突变为粗体。实施例5通过对切割HBB5.3的蛋白质进行随机诱变和定点诱变并与切割HBB5.4的蛋白质进行装配来对切割HBB5的大范围核酸酶进行精细化已通过与切割回文HBB5.4靶标的突变体共表达而鉴定和测试了切割回文HBB5.3靶标的I-CreI突变体切割非回文靶标HBB5的能力(实施例3)。然而,所测试的异二聚体组合均不能够切割HBB5序列。为了获得对该靶标的切割,将切割HBB5.3序列的I-CreI突变体随机诱变或定点诱变,并且在与切割HBB5.4靶标的突变体共表达时,筛选高效切割HBB5的新变体。将增强I-CreI衍生物活性的六个氨基酸替分别引入切割HBB5.3的蛋白质的编码序列中。这些突变对应于用丝氨酸代替19位甘氨酸(G19S)、用亮氨酸代替54位苯丙氨酸(F54L)、用赖氨酸代替80位谷氨酸(E80K)、用亮氨酸代替87位苯丙氨酸(F87L)、用丙氨酸代替105位缬氨酸(V105A)和用缬氨酸代替132位异亮氨酸(I132V)。然后在与切割HBB5.4的突变体共表达后,测试所得到诱变蛋白诱导HBB5靶标有效切割的能力。1)材料和方法a)通过随机诱变构建文库方案与实施例4中相同,不同之处在于使用高效LiAc转化方案(Gietz等,MethodsEnzymo1.,2002,350,87-96),使用通过NcoI和EagI消化而线性化的75ng载体DNA(pCLS0542,图13)和25ngPCR产物转化酵母酿酒酵母菌株FYC2-6A(ΜΑΤα,trplA63,leu2Al,his3A200)。通过酵母中的体内同源重组产生含有I-CreI突变体的完整编码序列的表达质粒。b)通过定点诱变构津文库通过PCR在切割HBB5.3的原始突变体库上创建文库。例如,为了将G29S替换引入突变体的编码序列中,进行两个独立的重叠PCR反应,所述以应扩增I-CreIN75编码序列的5'端(1-24位残基)或3'端(14-167位残基)。对5'和3'端而言,PCR扩增均使用与载体具有同源性的引物(GallOF5,-gcaactttagtgctgacacatacagg-3,(SEQIDNO34)或GallOR5,-acaaccttgattggagacttgacc_3,(SEQIDNO35))和对含有替换突变G19S的14-24位氨基酸的I-CreI编码序列具有特异性的引物(G19SF5,-gccggctttgtggactctgacggtagcatcatc-3'(SEQIDNO151)]^G19SR5'~gatgatgctaccgtcagagtccacaaagccggc~3'(SEQIDNO152))来进行。得到的PCR产物彼此具有33bp的同源性。纯化PCR片段。最后使用高效LiAc转化方案(Gietz等,MethodsEnzymo1.,2002,350,87-96),使用通过NcoI和EagI消化而线性化的约75ng载体DNA(pCLS0542,图13)和约25ng两种重叠PCR片段的每一种,转化酵母酿酒酵母菌株FYC2-6A(MATa,trplΔ63,leu2Δ1,his3Δ200)。通过酵母中的体内同源重组产生含有G19S替换的完整编码序列。用以下的寡核苷酸对,使用相同的策略创建分别含有F54L、Ε80Κ、F87L、V105A和I132V替换的其他文库*F54LF:5,-acccagcgccgttggctgctggacaaactagtg-3,(SEQIDNO153)禾口F54LR5'-cactagtttgtccagcagccaacggcgctgggt-3'(SEQIDNO154);*E80KF:5,-ttaagcaaaatcaagccgctgcacaacttcctg-3,(SEQIDNO155)禾口E80KR:5,-caggaagttgtgcagcggcttgattttgcttaa-3,(SEQIDNO156);*F87LF:5,-aagccgctgcacaacctgctgactcaactgcag-3,(SEQIDNO157)禾口F87LR5'-ctgcagttgagtcagcaggttgtgcagcggctt-3'(SEQIDNO158);*V105AF:5,-aaacaggcaaacctggctctgaaaattatcgaa-3,(SEQIDNO:159)禾口V105AR:5,-ttcgataattttcagagccaggtttgcctgttt-3,(SEQIDNO160);*I132VF:5,-acctgggtggatcaggttgcagctctgaacgat-3,(SEQIDNO161)禾口I132VR5'-atcgttcagagctgcaacctgatccacccaggt-3'(SEQIDN0:162)oc)突变体_靶标酵母菌株,筛选和测序使用高效LiAc转化方案,用亮氨酸载体(pCLS0542,图13)中切割HBB5.3靶标的突变体转化酵母菌株FYBL2-7B(ΜΑΤα,ura3Δ851,trplΔ63,leu2Δ1,lys2Δ202),所述酵母菌株在酵母报告载体(PCLS1055,图14)中含有ΗΒΒ5靶标。使用突变体-靶标酵母作为实施例1中所述接合实验的靶标菌株。如实施例1中所述通过测序(Millegen)验证具有阳性结果的克隆。2)结果在切割ΗΒΒ5.3靶标的十四种原始I-CreI突变体(表VI)的库中构建通过随机诱变和定点诱变获得的文库。然后将每个文库的2232和372个转化克隆与酵母菌株接合,所述酵母菌株(i)在报告质粒中含有HBB5靶标,(ii)表达突变体28K30N32T33Y38Q40S44A68R70S75E77R+80K+96R(也称为KNTYQS/ARSER+80K+96R),其为实施例4中已描述的切割HBB5.4靶标的优化变体。图17的图A中展示了在定点诱变后带有G19S突变并有效切割HBB5靶标的一些阳性突变体的鉴定。与该酵母菌株接合后,鉴定了80个新的I-CreI克隆,所述克隆在与切割HBB5.4靶标的突变体形成异二聚体后比初原始突变体更有效地切割HBB5靶标。对这80个阳性克隆(51个克隆通过随机诱变获得,15个克隆具有G19S突变,2个克隆具有F87L突变,3个克隆具有V105A突变,9个克隆具有I132V突变)的测序使得鉴定出给出更高HBB5靶标切割水平的49个不同的新突变体。例如,表VII中总结了在与切割HBB5.4的突变体KNTYQS/ARSER+80K+96R形成异二聚体时切割HBB5.3靶标的14个I-CreI优化突变体的序列。这些优化变体对应于序列SEQIDNO164到177。^VI用于通过随机诱变和定点诱变构建文库的切割HBB5.3靶标的一组十四个突变体。ND对应于未测定的序列。<table>tableseeoriginaldocumentpage48</column></row><table><table>tableseeoriginaldocumentpage49</column></row><table>表VII对ΗΒΒ5显示强切割活性的功能性突变体组合。<table>tableseeoriginaldocumentpage50</column></row><table>实施例6通过对切割HBB5.4的蛋白质讲行定点诱变并与切割HBB5.3的蛋白质讲行装配,来改讲靶向HBB5的大范围核刀害时舌个牛如实施例4中所述,通过对随机诱变所得文库进行异二聚体酵母筛选并通过与切割回文ΗΒΒ5.3靶标的突变体共表达来进行测试,仅鉴定出一个切割回文ΗΒΒ5.4靶标的I-CreI优化突变体(称作KNTYQS/ARSER+80K+96R)。为了增加ΗΒΒ5序列的I-CreI切割酶数量,通过插入六氨基酸替换G19S、F54L、Ε80Κ、F87L、V105A和I132V来构建另一组文库,所述文库对应于切割ΗΒΒ5.4靶标的突变体库的定点诱变。测试所得蛋白质诱导ΗΒΒ5靶标有效切割的能力。1)材料和方法a)通过定点诱变构建文库方案与实施例5中相同,不同之处是使用高效LiAc转化方案(Gietz等,MethodsEnzymol,2002,350,87-96),使用通过DraIII和NgoMIV消化而线性化的75ng载体DNA(pCLS1107,图15)和25ng两种重叠PCR片段的每一种,转化酵母酿酒酵母菌株FYC2-6A(MATa,trplA63,leu2Δ1,his3Δ200)。在酵母中通过体内同源重组产生含有不同突变的完整编码序列。b)突变体_靶标酵母菌株,筛选和测序使用高效LiAc转化方案,用克隆在卡那霉素载体(pCLS1107,图15)中的切割HBB5.4靶标的突变体,转化酵母菌株FYBL2-7B(MATa,ura3Δ851,trplΔ63,leu2A1,lys2A202),所述酵母菌株在酵母报告载体(pCLS1055,图14)中含有HBB5靶标。使用突变体-靶标酵母作为实施例1中所述接合实验的靶标菌株。如实施例1中所述通过测序(Millegen)验证具有阳性结果的克隆。2)结果通过定点诱变构建的文库来自于对应于11种原始突变体的12个I-CreI的库以及称作KNTYQS/ARSER+80K+96R的一个切割HBB5.4靶标的优化突变体(表VIII)。然后将每个文库的372个转化克隆与酵母菌株接合,所述酵母菌株(i)在报告质粒中含有HBB5靶标,(ii)表达突变体28K30T32S33R38H40S/44K68S70S75N77I,也称作KTSRHS/KSSNI,其为实施例3中已描述的切割HBB5.3靶标的原始变体。图17的图B中展示了在定点诱变后带有G19S突变并有效切割HBB5靶标的一些阳性优化突变体。与接合该酵母菌株后,鉴定了20个新的I-CreI克隆,所述克隆在与切割HBB5.3靶标的突变体形成异二聚体后比原始突变体更有效地切割HBB5靶标。对这20个阳性克隆(10个克隆具有G19S突变,6个克隆具有F87L突变,4个克隆具有I132V突变)的测序使得鉴定了8个不同的新突变体。表IX中概括了切割HBB5靶标(SEQIDNO179到186)的这类I-CreI优化突变体的序列。表VIII用于通过定点诱变构建文库的一组12个切割HBB5.4靶标的突变体。<table>tableseeoriginaldocumentpage51</column></row><table><table>tableseeoriginaldocumentpage52</column></row><table>MJI对HBB5显示强切割活性的功能性突变体组合。<table>tableseeoriginaldocumentpage52</column></row><table>实施例7通过对切割HBB5.3和HBB5.4的蛋白质进行随机诱变和多位点定点诱变并与切割HBB5.4和HBB5.3的蛋白质进行装配对靶向HBB5的大范围核酸酶的切割效率进行精细化靶向回文靶标HBB5.3和HBB5.4的突变体的诱变实验结果使得鉴定了优化突变体,所述优化突变体在异二聚体共表达酵母筛选实验(见实施例5和6)中测试时更有效地切割序列HBB5。另外,如实施例6(表IX)中所示,一些优化突变体(KNTYQS/ARSER+80K+87L,KNTYQS/ARSER+19S+80K)的序列表明,在同一突变体中将替换E80K与F87L结合以及将G19S与E80K结合能够提高其对HBB5靶标的切割效率。为了获得大量具有最高HBB5靶标切割效率的I-CreI突变体,从靶向序列HBB5.3和HBB5.4的优化突变体库(表X)构建了涉及替换G19S、F54L、E80K、V105A和I132V的随机诱变和多位点定点诱变的新文库(图18)。1)材料和方法a)通过随机诱变构津文库方案与实施例4中相同。对来自于靶向HBB5.3或HBB5.4序列的突变体库的文库而言,使用高效LiAc转化方案(Gietz等,MethodsEnzymo1.,2002,350,87-96),使用25ngPCR产物和75ng载体DNA转化酵母酿酒酵母菌株FYC2-6A(MATa,trplA63,leu2A1,his3Δ200),所述载体DNA分别是通过NcoI和EagI消化而线性化的pCLS0542(图13)或通过用DraIII和NgoMIV消化而线性化的pCLS1107(图15)。通过酵母中的体内同源重组产生含有I-CreI突变体的完整编码序列的表达质粒。b)诵i寸雜蹄,■棚雅方案与实施例5中相同,不同之处在于为了在切割HBB5.3和HBB5.4靶标的突变体的编码序列中获得G19S、F54L、E80K、V105A和I132V替换的多重插入,进行六组独立的重叠PCR反应,所述反应扩增含有不同突变之间序列的I-CreIN75编码序列的内部片段。例如,对用于插入突变G19S和F54L的多位点定点诱变而言,使用对含有或不含替换G19S的14-24位氨基酸的I-CreI编码序列具有特异性的引物(G19SF5’-gCCggCtttgtggactctgacggtagcatcatc-3'(SEQIDNO151)和G19wtF5'-gccggctttgtggacggtgacggtagcatcatc-3,(SEQIDNO187))以及对含有或不含有替换F54L的49-59位氨基酸的I-CreI编码序歹丨J具有特异性的弓丨物(F54LR5,-cactagtttgtccagcagccaacggcgctgggt-3,(SEQIDNO:154)禾口F54wtR5,-cactagtttgtccagaaaccaacggcgctgggt-3,(SEQIDNO188))进行PCR扩增,导致产生具有不同末端的四种PCR片段。用以下的寡核苷酸组,使用相同的策略产生其他内部片段*GallOF:5,-gcaactttagtgctgacacatacagg-3,(SEQIDNO34)与G19SR:5,-gatgatgctaccgtcagagtccacaaagccggc-3‘(SEQIDNO152)和G19wtR:5'-gatgatgctaccgtcaccgtccacaaagccggc-3'(SEQIDNO189)*F54LF:5,-acccagcgccgttggctgctggacaaactagtg-3,(SEQIDNO153)禾口F54wtF5'-acccagcgccgttggtttctggacaaactagtg-3'(SEQIDNO:190)与E80KR5'-caggaagttgtgcagcggcttgattttgcttaa-3'(SEQIDNO156)^PESOwtR5'-caggaagttgtgcagcggcttgatttcgcttaa-3,(SEQIDNO191)*E80KF:5,-ttaagcaaaatcaagccgctgcacaacttcctg-3,(SEQIDNO155)禾口E80wtF5'-ttaagcgaaatcaagccgctgcacaacttcctg-3'(SEQIDNO:192)与V105AR5'-ttcgataattttcagagccaggtttgcctgttt-3,(SEQIDNO:160)禾口V105wtR5,-ttcgataattttcagaaccaggtttgcctgttt-3,(SEQIDNO:193)*V105AF:5,-aaacaggcaaacctggctctgaaaattatcgaa-3,(SEQIDNO:159)禾口V105wtF5'-aaacaggcaaacctggttctgaaaattatcgaa-3'(SEQIDNO:194)与I132VR5'-atcgttcagagctgcaacctgatccacccaggt-3'(SEQIDNO162)和I132wtR5'-atcgttcagagctgcaatctgatccacccaggt-3'(SEQIDNO:195)*I132VF:5,-acctgggtggatcaggttgcagctctgaacgat-3,(SEQIDNO161)禾口I132wtF-acctgggtggatcagattgcagctctgaacgat-S'(SEQIDNO196)与GallOR-acaaccttgattggagacttgacc-3'(SEQIDNO:35)得到的重叠PCR产物彼此含有15bp的同源性。然后将对应于每个内部区域的PCR片段纯化合并,并且通过PCR装配产生含有或不含有突变G19S、F54L、E80K、V105A和I132V的I-CreI编码序列。最后,使用高效LiAc转化方案(Gietz等,MethodsEnzymo1.,2002,350,87-96),使用约25ng用切割HBB5.3和HBB5.4靶标的突变体获得的装配PCR片段的每一种,和75ng载体DNA转化酵母酿酒酵母菌株FYC2-6A(ΜΑΤα,trplΔ63,leu2Δ1,his3Δ200),所述载体DNA是通过NcoI和EagI消化而线性化的pCLS0542(图13)或通过DraIII和NgoMIV消化而线性化的pCLS1107(图15)。通过酵母中的体内同源重组产生含有替换的完整编码序列。c)突变体-靶标酵母菌株,筛诜和测序使用高效LiAc转化方案,用克隆到亮氨酸载体(PCLS0542,图13)中切割HBB5.3靶标的突变体或者克隆到卡那霉素载体(PCS1107,图15)中切割HBB5.4靶标的突变体转化酵母菌株FYBL2-7B(ΜΑΤα,ura3Δ851,trplΔ63,leu2Δ1,lys2Δ202),所述酵母菌株在酵母报告载体(PCLS1055,图14)中含有ΗΒΒ5靶标。使用突变体-靶标酵母作为实施例1中所述接合实验的靶标菌株。如实施例1中所述通过测序(Millegen)验证具有阳性结果的克隆。2)结果通过随机诱变或多位点定点诱变构建的文库来自于对应于切割靶标ΗΒΒ5.3和ΗΒΒ5.4的优化突变体的8个和6个I-CreI突变体的库(表X)。然后获得每个文库的2232或2790个转化克隆。将对应于来自ΗΒΒ5.3突变体的文库的克隆与酵母菌株接合,所述酵母菌株(i)在报告质粒中含有HBB5靶标,(ii)表达突变体28K30N32S33Y38Q40S/44A68R70S75E77R+24V+43L+80K+87L+96R,也称作KNSYQS/ARSER+24V+43L+80K+87L+96R,其为实施例6中已描述的切割HBB5.4靶标的优化变体。将对应于来自HBB5.4突变体的文库的克隆与酵母菌株接合,所述酵母菌株(i)在报告质粒中含有HBB5靶标,(ii)表达突变体28K30S32S33H38R40S/44K68Y70S7OT77T,也称作KSSHRS/KYSDT,其为实施例5中已描述的切割HBB5.3靶标的优化变体通过两种诱变鉴定的有效切割HBB5靶标的阳性突变体的例子展示于图19和20中。对随机诱变文库的筛选使得鉴定了66和45个新的I-CreI克隆,所述新克隆与分别靶向HBB5.4(图19,图A)或HBB5.3(图19,图B)的突变体形成异二聚体时,比原始突变体更有效地切割HBB5靶标。对多位点定点诱变文库而言,从切割序列HBB5.3(图20,图A)或序列HBB5.4(图20,图B)的突变体库中也获得了以最高效力切割HBB5靶标的62和36个精细化的I-CreI变体。对这类阳性克隆的测序使得鉴定了98和45个新的优化突变体,所述突变体在酵母异二聚体筛选实验中导致HBB5靶标的有效切割。切割HBB5.3和HBB5.4靶标的一些I-CreI优化突变体的序列总结于表XI中。表X用于通过随机诱变和多位点定点诱变构建文库的切割HBB5.3和HBB5.4靶标的8和6个优化的突变体的组。<table>tableseeoriginaldocumentpage55</column></row><table>^XI对ΗΒΒ5显示强切割活性的功能性突变体组合<table>tableseeoriginaldocumentpage56</column></row><table>实施例8在CHO细胞中在染色体外模型中验证ΗΒΒ5靶标切割在实施例7中鉴定了在形成异二聚体时能够在酵母中有效切割HBB5靶标的若干I-CreI精细化突变体。为了验证和表征展示在CHO细胞中显示HBB5序列最高切割效力的异二聚体,在哺乳动物细胞中使用染色体外测定测试了能够切割HBB5靶标的突变体组合的效率。1)材料和方法a)在用于CHO筛选的载体中克隆HBB5靶标如下克隆目的靶标从PR0LIG0定购寡核苷酸,其相应于两侧为Gateway克隆序列的靶序列。利用Gateway方案(INVITR0GEN)将由单链寡核苷酸的PCR扩增得到的双链靶标DNA克隆到CHO报告子载体(pCLS1058,图30)中。通过测序(MILLEGEN)验证克隆的靶标。b)大范围核酸酶的再克降将实施例7中鉴定的切割HBB5.3和HBB5.4靶标的I-CreI优化突变体的ORF再克隆到PCLS1069中(图31)。使用引物attBl-ICrelFor(5‘-ggggacaagtttgtacaaaaaagcaggcttcgaaggagatagaaccatggccaataccaaatataacaaagagttcc-3'(SEQIDNO221)禾口attB2-ICreIRev(5'-ggggaccactttgtacaagaaagctgggtttagtcggccgccggggaggatttcttcttctcgc-3,(SEQIDNO222),通过PCR在酵母DNA上扩增0RF。使用Gateway方案(INVITR0GEN),在来自INVITR0GEN的CHO表达载体pCDNA6.2(pCLS1069,图31)中克隆PCR产物。通过测序(MILLEGEN)验证所得克隆。c)哺乳动物细胞中的染饩体外测定根据供应商(QIAGEN)的方案,用Polyfect转染试剂转染CHO细胞。转染后72小时去除培养基,并添加150μ1裂解/暴露缓冲液用于β“半乳糖苷酶液体测定(通常1升缓冲液含100ml裂解缓冲液(Tris-HClIOmMpH7.5、NaCl150mM、TritonX1000.1%,BSA0.lmg/ml、蛋白酶抑制剂),10mlMg100X缓冲液(MgCl2100mM、β-巯基乙醇35%),IlOmlONPG8mg/ml和780ml磷酸钠0.IMpH7.5)。在37°C下孵育后,在420nm处测量光吸收。整个过程在自动化的VelocityllBioCel平台上进行。在每次测定中,用每种HBB5突变体表达载体各12.5ng(12.5ng编码切割回文HBB5.3靶标之突变体的载体,和12.5ng编码切割回文HBB5.4靶标之突变体的载体)转染150ng靶载体。2)结果首先在哺乳动物表达载体pCLS1069(图31)中再克隆表XI中所述的突变体。图21展示了针对12个异二聚体组合获得的结果,不同组合的数值总结于表XII中。对HBB5序列切割效率的分析证明,主要有两种I-CreI突变体组合(MtA2_MtA6、MtA3_MtA6)能够在CHO细胞中有效切割HBB5靶标。这类观察结果与功能性异二聚体酵母筛选测定的结果一致。表XII在CHO细胞中有效切割HBB5靶标的功能性异二聚体组合。<table>tableseeoriginaldocumentpage58</column></row><table>实施例9产生切割HBB8.3的大范围核酸酶该实施例显示,I-CreI突变体能够切割来自HBB8靶标右侧部分的HBB8.3DNA靶序列(图5)。本实施例中描述的靶序列是22bp回文序列。因此,仅以前11个核苷酸描述它们,随后是后缀_。例如,靶标HBB8.3还被记为cagacttctgt_P(SEQIDNO:31)。HBB8.3在士1、士2、士3、士4、士5、士8、士10和士11位与5TCT_P相似,并在士1、士2、士8、士9禾口±10位与10AGA_P相似。如Arnould等,JMol.Biol.,2006;355,443-458以及国际PCT申请WO2006/097784和WO2006/097853中所述,先前通过在44、68、70、75和77位诱变I-CreIN75获得了能够切割5TCT_P的突变体。如Smith等,NucleicAcidsRes.,2006,34,el49和国际PCT申请WO2007/060495和WO2007/049156中所述,通过在28、30、32、33、38、40和70位上诱变I-CreIN75获得了能够切割10AGA_P靶标的突变体。因此,组合这些突变体对会允许切割HBB8.3靶标。两组蛋白质均在70位上被突变。然而,存在两个可分离的功能性亚结构域(Smith等,NucleicAcidsRes.,2006,34,el49and国际PCT申请WO2007/057781和WO2007/049095)。这意味着该位置对靶标碱基10到8的特异性几乎没有影响。因此,为了检验组合突变体是否能够切割HBB8.3靶标,将来自切割5TCT_P(caaaactctgt_P)的蛋白质44、68、70、75和77位的突变与来自切割10AGA_P(cagaacgtcgt_P)的蛋白质的28、30、32、33、38和40突变相组合。1)材料和方法实验步骤如实施例1中所述进行。2)结果通过在I-CreI骨架上结合44、68、70、75和77位的突变和28、30、33、38和40位的突变来构建I-CreI组合突变体,得到复杂度1600的文库。将该文库转化进酵母中,并针对对HBB8.3DNA靶标(cagacttctgt_P;SEQIDNO31)的切割筛选了2880个克隆(复杂度的1.8倍)。发现了总计264个阳性克隆,其在测序和通过再次筛选验证后显示对应于126个不同的新内切核酸酶(见表XIII)。展示于表XIII中的24个新内切核酸酶对应于SEQIDNO80到103。切割HBB8.3靶标的阳性突变体的例子展示于图10中。表XIII组合变体对HBB8.3靶标的切割<table>tableseeoriginaldocumentpage60</column></row><table>*仅展示了1600个组合中的120个+表示组合突变体切割HBB8.3靶标。实施例10产生切割HBB8.4的大范围核酸酶。本实施例显示,I-CreI变体能够切割来自HBB8靶标左侧部分之回文形式的HBB8.4DNA靶序列(图5)。本实施例中描述的所有靶序列是22bp回文序列。因此,仅以前11个核苷酸描述它们,随后是后缀—P。例如,HBB8.4会被记为ctgactcctgt—P;SEQIDN0:32)。HBB8.4在士1、士2、士3、士4、士5、士8禾P士11位与5CCT—P相似,并在士1、士2、士8、士9、士10和士11位与10TGA—P相似。推测位置士6和士11对结合和切割活性几乎没有影响。先前通过在44、68、70、75和77位诱变I-CreIN75获得了能够切割5CCT—P(caaaaccctgt_P;SEQIDNO22)的突变体,如Arnould等,J.Mol.Biol.,2006,355,443-458和国际PCT申请WO2006/097784、W02006/097853中所述。通过在28、33、38、40和70位上诱变I-CreIN75获得了能够切割10TGA_P靶标(ctgaacgtcgt_P;SEQIDNO28)的突变体,如Smith等,NucleicAcidsRes.,2006,34,el49和国际PCT申请W02007/049095和TO2007/057781中所述。因此,组合这样的突变体对会允许切割HBB8.4靶标。两组蛋白质均在70位上被突变。然而,存在两个可分离的功能性亚结构域(Smith等,NucleicAcidsRes.,2006,34,el49和国际PCT申请W02007/057781和WO2007/049095)。这意味着该位置对靶标碱基10到8的特异性几乎没有影响。因此,为了检验组合突变体是否能够切割HBB8.4靶标,将来自切割5CCT_P(caaaacCCtgt_P)的蛋白质44、68、70、75和77位的突变与来自切割10TGA_P(ctgaacgtcgt_P)的蛋白质的28、33、38和40突变相组合。1)材料和方法实验步骤如实施例2中所述进行。2)结果通过在I-CreI骨架上结合44、68、70、75和77位的突变和28、30、32、33、38和40位的突变来构建I-CreI组合突变体(表XIV),得到复杂度1720的文库。将该文库转化进酵母中,并针对对HBB8.4的切割筛选了3168个克隆(多样性的1.8倍)。发现了总计141个阳性克隆,其在测序和通过再次筛选验证后显示对应于93个不同的新内切核酸酶(见表XIV)。展示于表XIV中的19个新内切核酸酶对应于SEQIDNO104到122。切割HBB8.4靶标的阳性突变体的例子展示于图11中。表XIV组合变体对HBB8.4靶标的切割<table>tableseeoriginaldocumentpage62</column></row><table>*仅展示了1720个组合中的120个。+表示组合突变体切割HBB8.4靶标实施例11产生切割HBB8的大范围核酸酶我们先前鉴定了能够切割每种回文HBB8衍生靶标(HBB8.3和HBB8.4,见实施例9和10)的I-CreI突变体。在酵母中共表达酵母中的这类突变体对(一种切割HBB8.3,一种切割HBB8.4)。共表达后,应当存在三种活性分子种类——两种同二聚体,一种异二聚体。测试异二聚体是否切割HBB8.2和HBB8靶标。1)材料和方法实验步骤如实施例3中所述进行。2)结果切割HBB8.3序列(11个突变体)和切割HBB8.4序列(15个突变体)的突变体的共表达在几乎所有情况下均导致HBB8.2靶标的有效切割(图12,图A)。另外,这些组合中的一些能够切割HBB8天然靶标(图12,图B),所述HBB8天然靶标与HBB8.2序列的区别仅在于-1、-2和2位的3bp(图5)。功能性组合概括于表XV和表XVI中。^XV导致HBB8.2靶标切割的组合<table>tableseeoriginaldocumentpage63</column></row><table>+表示异二聚体突变体切割ΗΒΒ8.2靶标。ND对应于未经鉴定的序列。表XVI导致ΗΒΒ8靶标切割的组合<table>tableseeoriginaldocumentpage64</column></row><table>+表示异二聚体突变体切割HBB8靶标。ND对应于未经鉴定的序列。从上文中看出,本发明不完全局限于上文明确描述过的这些实施方案、实施和应用;相反,其包括本领域专业人士可能想到而不偏离本发明框架范围的所有变化。实施例12通过对切割HBB8.3的蛋白质进行定点诱变并与切割HBB8.4的蛋白质进行装配来产生切割HBB8的大范围核酸酶已通过共表达切割回文HBB8.3靶标的突变体和切割回文HBB8.4靶标的突变体而鉴定了能够切割非回文HBB8靶标的I-CreI突变体(实施例11)。为了提高能够切割非回文HBB8靶标的I-CreI突变体的数量和效力,定点诱变切割回文HBB8.3靶标的突变体,并筛选与切割HBB8.4靶标的突变体共表达时高效切割HBB8的新突变体。将增强I-CreI衍生物活性的六个氨基酸取代分别引入切割HBB8.3的蛋白质的编码序列中。这些突变对应于用丝氨酸代替19位甘氨酸(G19S)、用亮氨酸代替54位苯丙氨酸(F54L)、用赖氨酸代替80位谷氨酸(E80K)、用亮氨酸代替87位苯丙氨酸(F87L)、用丙氨酸代替105位缬氨酸(V105A)和用缬氨酸代替132位异亮氨酸(I132V)。然后测试与切割HBB8.4的突变体共表达后,所得诱变蛋白质诱导HBB8靶标有效切割的能力。1)材料和方法实验步骤如实施例5中所述。2)结果在切割HBB8.3靶标的17个原始I-CreI突变体(表XVII)的库上构建含有六氨基酸替换(用丝氨酸代替19位甘氨酸、用亮氨酸代替54位苯丙氨酸、用赖氨酸代替80位谷氨酸、用亮氨酸代替87位苯丙氨酸、用丙氨酸代替105位缬氨酸和用缬氨酸代替132位异亮氨酸)的文库。然后将每个文库的372个转化克隆与酵母菌株接合,所述酵母菌株(i)在报告质粒中含有HBB8靶标,(ii)表达突变体28K30N32T33C38Q40S44D68A70S75K77R,也称作KNTCQS/DASKR,其为实施例11所述切割HBB8.4靶标的变体。与该酵母菌株接合后,发现了186个新的I-CreI克隆,所述克隆与切割HBB8.4靶标的突变体形成异二聚体后比原始突变体更有效地切割HBB8靶标。然后重新排列(重排板的孔Al到H9)这186个突变体(72个克隆具有G19S突变,60个克隆具有F54L突变,21个克隆具有E80K突变,5个克隆具有F87L突变,9个克隆具有V105A突变,19个克隆具有1132V突变),并进行验证筛选,所述筛选在与第一次完全相同的条件下进行(图22)。对这186个阳性克隆的测序使得鉴定给出更高的HBB8靶标切割水平的114个不同的新突变体。在与切割HBB8.4的突变体KNTCQS/DASKR形成异二聚体时切割HBB8.3靶标的25个I-CreI优化突变体的序列列于表XVIII(SEQIDNO:231到255)中。这些I-CreI突变体中的一些是定点诱变的预计突变体,但是也含有预料之外的突变,这可能是由于PCR反应和用于文库构建的池中突变体之间的微重组。为了测试HBB8靶标切割的特异性,将切割HBB8.3靶标的带有单个突变F54L、F87L、V105A和I132V的93个优化突变体与酵母菌株接合(图5),所述酵母菌株在报告质粒中含有HBB8.5或HBB8.6靶标。对几乎所有测试的I-CreI优化突变体而言,与来自于野生型序列的HBB6.5回文靶标(图23,图B)相比,具有导致镰状细胞贫血症的突变回文靶标HBB8.5(图23,图A)均被更有效地切割。表XVII用于定点诱变的切割HBB8.3靶标的一组17个突变体。切割HBB8.3靶标的序列SEQ28,30,32,33,38,40/44,68,70,75和77位的氨基酸ID和不同位置上的额外突变NO例如:KNSGKS/QNSNR/87L代表K28,N30,S32,G33,K38,S40/Q44,N68,S70,N75,R77和L87~28K30N32S33C38R40S44K68Y70S75N77Q82~KNSCRS/KYSNQ<table>tableseeoriginaldocumentpage66</column></row><table><table>tableseeoriginaldocumentpage67</column></row><table>表XVIII对HBB8显示强切割活性的功能性突变体。<table>tableseeoriginaldocumentpage68</column></row><table>实施例13通过对切割HBB8.4的蛋白质进行定点诱变并与切割HBB8.3的蛋白质进行装配来产生切割HBB8的大范围核酸酶已通过共表达切割回文HBB8.3的突变体和切割回文HBB8.4靶标的突变体而鉴定了能够切割非回文HBB8靶标的I-CreI突变体(实施例11)。为了提高能够切割非回文HBB8靶标的I-CreI突变体的数量和效力,还定点诱变了切割回文HBB8.4靶标的突变体,并筛选在与切割HBB8.3靶标的突变体共表达时高效切割HBB8的新突变体。将实施例12中所述六个氨基酸取代(G19S、F54L、E80K、F87L、V105A和I132V)分别引入切割HBB8.4的蛋白质的编码序列中,并测试所得蛋白在与切割HBB8.3的突变体共表达后诱导HBB8靶标有效切割的能力。1)材料和方法如实施例5中所述,在切割HBB8.4的原始突变体库上通过PCR创建定点诱变文库。纯化PCR片段。使用高效LiAc转化方案,使用通过DraIII和NgoMIV消化而线性化的75ng载体DNA(pCLS1107,图15)和两种重叠PCR片段各约25ng转化酵母酿酒酵母菌株FYC2-6A(MATa,trplA63,leu2Δ1,his3Δ200)。通过酵母中的体内同源重组产生含有单个突变的完整编码序列的表达质粒。2)结果在切割ΗΒΒ8.4靶标的14个原始I-CreI突变体(表XIX)的库上构建含有六氨基酸替换的文库。然后将每个文库的372个转化克隆与酵母菌株接合,所述酵母菌株(i)在报告质粒中含有HBB8靶标,(ii)表达突变体28K30T32S33H38R40S44K68Y70S75N77Y,也称作KTSHRS/KYSNY,其为实施例11中所述切割HBB8.3靶标的变体。与该酵母菌株接合后,发现了166个新的I-CreI克隆,所述克隆在与切割HBB8.3靶标的突变体形成异二聚体后比原始突变体更有效地切割HBB8靶标。然后重新排列这166个突变体(93个克隆具有G19S突变,6个克隆具有F54L突变,12个克隆具有E80K突变,17个克隆具有F87L突变,23个克隆具有V105A突变,15个克隆具有1132V突变),并进行验证筛选,所述筛选在与第一次完全相同的条件下进行(图24)。对这166个阳性克隆的测序使得鉴定给出更高的HBB8靶标切割水平的78个不同的新突变体。在与切割HBB8.3靶标的突变体KTSHRS/KYSNY形成异二聚体时切割HBB8.4靶标的20个I-CreI优化突变体的序列列于表XX中。这些I-CreI突变体中的一些是归因于定点诱变的预计突变体,但是也含有预料之外的突变,这可能是由于PCR反应和用于文库构建的库中突变体之间的微重组。为了测试HBB8靶标切割的特异性,将切割HBB8.4靶标的带有单个突变F54L、E80K、F87L、V105A和I132V的93个优化突变体与酵母菌株接合,所述酵母菌株在报告质粒中含有HBB8.6或HBB6.6靶标(图5)。对几乎所有测试的I-CreI优化突变体而言,与来自于野生型序列的HBB6.6回文靶标相比,具有导致镰状细胞贫血症的突变回文靶标HBB8.6均被更有效地切割(图25,图A和B)。表XIX用于定点诱变的切割HBB8.4靶标的一组14个突变体ND对应于未鉴定的序列<table>tableseeoriginaldocumentpage70</column></row><table><table>tableseeoriginaldocumentpage71</column></row><table><table>tableseeoriginaldocumentpage72</column></row><table>实施例14哺乳动物细胞中切割ΗΒΒ8的大范围核酸酶的功能效率在实施例12和13中,我们鉴定了能够在酵母中有效切割ΗΒΒ8靶标的I-CreI精细化突变体。在本实施例中,我们在CHO哺乳动物细胞中,使用染色体外和染色体报告子测定,测试了切割ΗΒΒ8.3和ΗΒΒ8.4序列的突变体组合切割ΗΒΒ8靶标的能力。1)材料和方法在用于CHO筛选的载体中克隆来自ΗΒΒ8的靶标、再克隆大范围核酸酶和哺乳动物中染色体外测定的方案如实施例8中所述。a)CHO细胞中的染色体测定将带有报告系统的CHO细胞系(图27)以每IOcm平板2XIO5个细胞的密度接种于完全培养基(Kaighn’s改良F-12培养基(F12-K),补充有2mML-谷氨酰胺、青霉素(100UI/ml)、链霉素(100μg/ml)、两性霉素B(Fongizone)(0.25μg/ml)(INVITROGEN-LIFESCIENCE)和10%FBS(SIGMA-ALDRICHCHIMIE))中。第二天,用Polyfect转染试剂(QIAGEN)转染细胞。简言之,将2ygIacz修复基质载体与不同量的大范围核酸酶表达载体共转染。在37°C下孵育72小时后,将细胞在0.5%戊二醛中于4°C固定10分钟,用含0.02%NP40的IOOmM磷酸缓冲液洗涤两次,并用以下染色缓冲液(IOmM磷酸缓冲液、ImMMgCl2、33mMK六氰基铁酸盐(III)、33mMK六氰基亚铁酸盐(II),0.1%(v/v)X-Gal)染色。在37°C下过夜孵育后,在光学显微镜下检查平板,并计数LacZ阳性细胞克隆数。LacZ修复的频率被表述为LacZ+灶点数除以转染细胞数(5XIO5),并用转染效率校准。2)结果首先,在哺乳动物CHO细胞中使用染色体外测定监测I-CreI改进突变体异二聚体针对两种靶标HBB8和HBB6的切割活性的比较。从表XXI中和图26中可以看出,鉴定了引发HBB衍生靶标有效切割的19个异二聚体组合。对HBB8和HBB6切割效率的分析证明,对鉴定的大部分活性异二聚体组合而言,与对应于未突变序列的HBB6靶标相比,带有导致镰状细胞贫血症的突变靶标HBB8被更有效地切割。这样的观察结果与功能性异二聚体酵母筛选测定的结果一致。表XXI在CHO细胞中导致HBB有效切割的靶标的异二聚体组合。数值(吸光度单位)对应于三个实验结果的均值。<table>tableseeoriginaldocumentpage74</column></row><table>还在含有HBB8或HBB6靶标的CHO细胞系中,使用染色体测定法测试了含有两种I-CreI优化突变体HBB8.3—H3和HBB8.4—A4的最有效HBB8异二聚体之一的活性。该染色体测定法详尽描述于近期的出版物中(Arnould等,JMolBiol,2007,371,49-65)。简言之,首先产生带有单拷贝转基因的CHO细胞系。该转基因在I-SceI切割位点上游含有人EFla启动子(图27,步骤1)。其次,使用I-SceI大范围核酸酶在该基因座处引发DSB诱导的同源重组,并掺入带有新的大范围核酸酶切割位点的5.5kb盒(图27,步骤2)。该盒含有由CMV启动子驱动的非功能性LacZ开放读码框,以及无启动子的潮霉素标记基因。通过50bp插入使LacZ基因本身失活,所述插入含有要测试的大范围核酸酶切割位点(此处为HBB8或HBB6切割位点)。这些细胞系可继而同切割HBB8靶标的经改造I-CreI衍生物一起用于评价DSB诱导的基因靶向效率(LacZ修复)(图27,步骤3)。将两种细胞系与修复基质和不同量的表达大范围核酸酶的载体共转染。LacZ基因的修复频率从带有HBB6靶标的细胞系的最大3.9X10_3提高至带有HBB8靶标的细胞系的最大8·8Χ1(Γ2(图28)。这些发现证实在染色体环境中,与来自于野生型基因座的ΗΒΒ6靶标相比,带有导致镰状细胞贫血症的突变的ΗΒΒ8靶标也被更有效地切割。这样的结果与使用染色体外测定法获得的结果一致,这意味着可以使用I-CreI优化突变体对导致遗传疾病的突变进行基因组矫正。实施例15设计用于在人细胞系中在HBB基因座进行基因组改造的策略在实施例7、8、12、13和14中鉴定了能够在酵母和哺乳动物细胞(CHOKl细胞)中有效切割ΗΒΒ5和ΗΒΒ8/6靶标的I-CreI精细化突变体。因此构建用于测试HBB大范围核酸酶矫正导致镰状细胞贫血症之突变的效率的分子工具是有用的。为此,设计了敲入基质(KI)来分析I-CreI精细化突变体的异二聚体组合对类淋巴母细胞人SC-I(ATCC_CRL_8756)细胞系中HBB基因座处同源重组的诱导。1)材料和方法a)敲入(KI)基质敲入基质由克隆在两个人HBB同源性臂[1730bp的LHHBB来自于基因组重叠群NT009237.17中的4032375到4034105位,2136bp的RHHBB来自于4034106到4036242位]之间的潮霉素抗性编码序列(⑶S)组成。4034105位在HBB5靶标内(HBB5靶标的11位),并且对应于SEQIDN0:4(图3)上的1247位。得到的质粒描述于图29中。同源性臂从基因组DNA中扩增,所述基因组DNA纯化自镰状细胞等位基因纯合的类淋巴母细胞人SC-I细胞系。敲入基质包含HBB6野生型修饰位点(图29),所述位点不被HBB大范围核酸酶切割,并且不改变HBB蛋白质的开放读码框。潮霉素抗性基因的编码序列(hygroCDS)与SV40启动子区有效连接,并与SV40polyA信号有效连接。将HSV病毒胸腺嘧啶激酶的表达盒包括在内,以建立针对更昔洛韦的负选择,用于选择对应于HBB基因座上同源重组事件的克隆。b)人SC-I细胞系中的敲入实验在补充有20%胎牛血清、青霉素、链霉素、两性霉素B、10mMHEPES、lmM丙酮酸钠、4.5g/L葡萄糖、1.5g/L碳酸氢钠的完全RPMI1640培养基中,培养人的类淋巴母细胞SC-I细胞系(ATCC_CRL_8756)。转染后,使用潮霉素在完全培养基中进行选择。用潮霉素选择十天后,施加针对更昔洛韦的负选择,以选择对潮霉素和更昔洛韦有抗性的克隆。扩增这样的克隆并提取基因组DNA。c)敲入事件的PCR分析可以通过对基因组DNA的PCR分析来检测敲入事件,所述PCR使用分别位于LHHBB左侧同源性臂上游人HBB序列中和潮霉素⑶S中的一对引物,获得KI特异性PCR扩增。对PCR扩增片段的测序将允许测定镰状细胞贫血症突变的矫正效率。表XXII序列表中所示序列的序列概要<table>tableseeoriginaldocumentpage76</column></row><table><table>tableseeoriginaldocumentpage77</column></row><table><table>tableseeoriginaldocumentpage78</column></row><table><table>tableseeoriginaldocumentpage79</column></row><table>权利要求I-CreI变体,其特征为两个I-CreI单体中的至少一个具有至少两个替换,其中LAGLIDADG核心结构域的两个功能性亚结构域中各含一个,所述亚结构域分别位于I-CreI的26到40位和44到77位,所述变体能够切割来自人β珠蛋白基因的DNA靶序列,并可通过至少包含下述步骤的方法获得(a)构建第一系列I-CreI变体,其在LAGLIDADG核心结构域的第一功能性亚结构域中具有至少一个替换,所述第一功能性亚结构域位于I-CreI的26到40位,(b)构建第二系列I-CreI变体,其在LAGLIDADG核心结构域的第二功能性亚结构域中具有至少一个替换,所述第二功能性亚结构域位于I-CreI的44到77位,(c)从来自步骤(a)的第一系列中选择和/或筛选能够切割突变体I-CreI位点的变体,所述突变体位点中至少(i)I-CreI位点-10到-8位的核苷酸三联体已被替换为存在于来自人β珠蛋白基因的所述DNA靶序列中-10到-8位的核苷酸三联体,且(ii)+8到+10位的核苷酸三联体已被替换为存在于来自人β珠蛋白基因的所述DNA靶序列中-10到-8位的核苷酸三联体的反向互补序列,(d)从来自步骤(b)的第二系列中选择和/或筛选能够切割突变体I-CreI位点的变体,所述突变体位点中至少(i)I-CreI位点-5到-3位的核苷酸三联体已被替换为存在于来自人β珠蛋白基因的所述DNA靶序列中-5到-3位的核苷酸三联体,且(ii)+3到+5位的核苷酸三联体已被替换为存在于来自人β珠蛋白基因的所述DNA靶序列中-5到-3位的核苷酸三联体的反向互补序列,(e)从来自步骤(a)的第一系列中选择和/或筛选能够切割突变体I-CreI位点的变体,所述突变体位点中至少(i)I-CreI位点+8到+10位的核苷酸三联体已被替换为存在于来自人β珠蛋白基因的所述DNA靶序列中+8到+10位的核苷酸三联体,且(ii)-10到-8位的核苷酸三联体已被替换为存在于来自人β珠蛋白基因的所述DNA靶序列中+8到+10位的核苷酸三联体的反向互补序列,(f)从来自步骤(b)的第二系列中选择和/或筛选能够切割突变体I-CreI位点的变体,所述突变体位点中至少(i)I-CreI位点+3到+5位的核苷酸三联体已被替换为存在于来自人β珠蛋白基因的所述DNA靶序列中+3到+5位的核苷酸三联体,且(ii)-5到-3位的核苷酸三联体已被替换为存在于来自人β珠蛋白基因的所述DNA靶序列中+3到+5位的核苷酸三联体的反向互补序列,(g)将来自步骤(c)和步骤(d)的两个变体中26到40位和44到77位的突变组合在单个变体中,获得切割以下序列的新的同二聚体I-CreI变体,所述序列中(i)-10到-8位的核苷酸三联体与存在于来自人β珠蛋白基因的所述DNA靶序列中-10到-8位的核苷酸三联体相同,(ii)+8到+10位的核苷酸三联体与存在于来自人β珠蛋白基因的所述DNA靶序列中-10到-8位的核苷酸三联体的反向互补序列相同,(iii)-5到-3位的核苷酸三联体与存在于来自人β珠蛋白基因的所述DNA靶序列中-5到-3位的核苷酸三联体相同,和(iv)+3到+5位的核苷酸三联体与存在于来自人β珠蛋白基因的所述DNA靶序列中-5到-3位的核苷酸三联体的反向互补序列相同,和/或(h)将来自步骤(e)和步骤(f)的两个变体中26到40位和44到77位的突变组合在单个变体中,获得切割以下序列的新的同二聚体I-CreI变体,所述序列中(i)+3到+5位的核苷酸三联体与存在于来自人β珠蛋白基因的所述DNA靶序列中+3到+5位的核苷酸三联体相同,(ii)-5到-3位的核苷酸三联体与存在于来自人β珠蛋白基因的所述DNA靶序列中+3到+5位的核苷酸三联体的反向互补序列相同,(iii)I-CreI位点+8到+10位的核苷酸三联体被替换为存在于来自人β珠蛋白基因的所述DNA靶序列中+8到+10位的核苷酸三联体,和(iv)-10到-8位的核苷酸三联体与存在于来自人β珠蛋白基因的所述DNA靶序列中+8到+10位的核苷酸三联体的反向互补序列相同,(i)将步骤(g)和/或(h)中获得的变体相组合,以形成异二聚体,和(j)选择和/或筛选来自步骤(i)的能够切割来自人β珠蛋白基因的所述DNA靶序列的异二聚体。2.权利要求1的变体,其中位于I-CreI44到77位的亚结构域中的所述替换位于44、68、70、75和/或77位。3.权利要求1的变体,其中位于I-CreI26到40位的亚结构域中的所述替换位于26、28、30、32、33、38和/或40位。4.权利要求1到3中任一项的变体,其中所述替换是用选自A、D、E、G、H、K、N、P、Q、R、S、Τ、Y、C、W、L和V的氨基酸替换原始氨基酸。5.权利要求1到4中任一项的变体,所述变体为第一和第二单体结合所得到的异二聚体,所述第一和第二单体在I-CreI的26到40位和/或44到77位具有不同的突变,所述异二聚体能够切割来自人β珠蛋白基因的非回文DNA靶序列。6.权利要求5的变体,其中所述DNA靶标选自序列SEQIDNO6到19。7.权利要求6的变体,其中所述第一和第二单体分别在28、30、32、33、38、40、44、68、70,75和77位上具有选自以下的氨基酸KSSGQS/DNSNI和KNSTAS/QRSYR、KDSRQS/QRSNI禾口KNGTQS/ARGNI、KNDYCS/QRSDK和KNDYCS/QRSNI、KNSTAS/ARHDI和KNSHSS/YDSRY、KNGTQS/KESYV和KHSHQS/PRHNI、KDTYQS/QYSH和KNDYCS/QYSRQ、KTSGQS/QHHNI和KNSRTS/ARHDI、KHSSQS/QYSYI和KDSRQS/QHHDI、KNWTQS/ARHDI和KNTCQS/ARGNI、KNTYWS/NYSRV和KNTTQS/ARSER、KQSHQS/ARSER和KNNGYS/QRSRQ。8.权利要求6的变体,其中所述第一单体在28、30、32、33、38、40、44、68、70、75和77位上具有选自KNSTSS/RYSNQ、KNTCQS/RYSNQ、KNTCQS/HYSNR、KNSCHS/RYSNQ、KNSVHS/RYSNQ、KNSTRQ/NESNR、KNETQS/DASKR、KNTCQS/DASKR、KNSCHS/DASKR、KNSCQS/DASKR、KNSSSS/KASDR、KNSSRS/DASKR、KNSTRQ/DASKR、KNSVRQ/DASKR、KNSTQS/DASKR和KNSVHQ/DASKR的氨基酸,并且所述第二单体在28、30、32、33、38、40、44、68、70、75和77位上具有选自KNSGKS/QASNR,KTSHRS/KYSNY、KNSTRS/KYSNY、KNSGRS/KYSNY、KNSCRS/KYSNQ、KNSGKS/KYSNY、KNSGKS/QYSNR、KNSGKS/KYSNR、KNSGKS/KYSNQ、KQTYRS/KYSNI、KQTYRS/KYSNY、KQTYRS/QASNR、KQTYRS/KYSNQ、KNSRTS/QHHNI和KTSRQS/KSSNY的氨基酸。9.权利要求6的变体,其中所述第一单体在28、30、32、33、38、40、44、68、70、75和77位上具有选自KNTYQS/ARSER、KNDYQS/ARSER、KNPYQS/ARSER、KNSPQS/ARSER和KNSYQS/ARSER的氨基酸,并且所述第二单体在28、30、32、33、38、40、44、68、70、75和77位上具有选自KTSHRS/KYSDT、KNSRRS/KYSDT;KNSRRS/KYSDR、KNSRRS/KYSNQ,KNSRRS/RYSNQ,KSSHRS/KYSDT、KNSSKS/KYSNQ、KNSSKS/KYSDR、KNSRRS/KYSNQ、KSSHRS/KYSDQ、KSPHRS/KYSDT、KSSHRS/KYSNQ和KKSSQS/KESNR的氨基酸。10.权利要求1到9中任一项的变体,其在I-CreI的137到143位上包含一个或多个替换,所述替换修饰所述变体对I-CreI位点中士1到2、士6到7和/或士11到12位核苷酸的特异性。11.权利要求1到10中任一项的变体,其在I-CreI全序列中包含一个或多个替换,所述替换改进所述变体对所述来自人β珠蛋白基因之DNA靶标的结合和/或切割特性。12.权利要求11的变体,其包含一个或多个选自以下的替换K4E、K7R、Υ12Η、F16L、G19S、G19A、I24V、K34R、F43L、Τ49Α、F54L、L58Q、D60N、D60G、V64I、Υ66Η、S79G、E80G、Ε80Κ、Ι81Τ、K82R、Κ82Ε、H85R、N86S、F87L、Q92R、Ρ93Α、F94L、K96R、Q99R、K100R、N103S、V105A、V105I、I109V、Q111H、E117G、D120G、K121R、Κ121Ε、V125A、V129A、Q131R、I132V、K139R、Τ140Α、Τ147Α、V151M、L152Q、L155P、K159R、Κ159Ε、Κ160Ε、S161P、S162P和P163S。13.权利要求12的变体,其包含一个或多个选自G19S、F54L、Ε80Κ、F87L、V105A和I132V的替换。14.权利要求8和11到13中任一项的变体,其中所述第一和第二单体分别在28、30、32、33、38、40、44、68、70、75和77位和额外的位置上具有选自以下的氨基酸-KNSVHQ/DASKR、87L禾Π131R(第一单体)以及KNSGKS/KYSNY、19S禾Π117G,KQTYRS/KYSNYU9S和641,KNSGKS/KYSNY、19S和132V,KQTYRS/KYSNY和54L,KQTYRS/KYSNQ禾口19S(第二单体),-KNSTRQ/DASKR和I9S(第一单体)以及KQTYRS/KYSNY、105A和lMQ,KQTYRS/KYSNY禾口54L,KQTYRS/QASNR和87L,KQTYRS/KYSNI和19S(第二单体),-KNSVRQ/DASKR和19S(第一单体)以及KQTYRS/QASNR、87L和58Q,KQTYRS/KYSNY、105A禾口152Q,KNSGKS/KYSNY和132V,KQTYRS/KYSNY和54L,KQTYRS/QASNR和87L(第二单体),-KNSVHQ/DASKR和87L(第一单体)以及KNSGKS/KYSNY和132V;KNSGKS/KYSNY、19S禾口117G,KNSGKS/KYSNY、19S和132V,KQTYRS/KYSNY和54L,KQTYRS/KYSNI和19S(第二单体)。15.权利要求9和11到13中任一项的变体,其中所述第一和第二单体分别在28、30、32、33、38、40、44、68、70、75和77位和额外的位置上具有选自以下的氨基酸=KNTYQS/ARSER、19S、80K、85R、87L、96R和139R(第一单体)以及KSPHRS/KYSDT和81T或者KTSHRS/KYSDT、66H、82R、86S、99R、132V、139R和140A(第二单体)。16.权利要求7到15中任一项的变体,其中所述第一单体和所述第二单体选自以下序列对分别为SEQIDNO123到135(第一单体)和SEQIDNO136到148(第二单体);SEQIDNO:79(第一单体)和SEQIDNO:45、56、164到177、298到301任一(第二单体);SEQIDNO179到186(第一单体)和SEQIDN0:57(第二单体);SEQIDNO179(第一单体)和SEQIDNO197到208、302到306任一(第二单体);SEQIDNO209到220、292至Ij297(第一单体)和SEQIDNO:164(第二单体);SEQIDNO:213、214、281(第一单体)和SEQIDNO:277、278、279或280(第二单体);SEQIDNO:104或114(第一单体)和SEQIDN0:82(第二单体);SEQIDNO:105或118(第一单体)和SEQIDNO:84、85、88、94和103任一(第二单体);SEQIDNO:113或111(第一单体)和SEQIDNO:103(第二单体);SEQIDNO121(第一单体)和SEQIDN0:85(第二单体);SEQIDNO118(第一单体)和SEQIDNO231到255(第二单体);SEQIDNO257到274(第一单体)和SEQIDNO103(第二单体);SEQIDN0:286(第一单体)和SEQIDNO:250、236、287、288和289任一(第二单体);SEQIDN0:269(第一单体)和SEQIDNO:290、236、237和248任一(第二单体);SEQIDNO:273(第一单体)和SEQIDNO:291、290、242、236和237任一(第二单体);SEQIDNO261(第一单体)和SEQIDNO:242、289、287、236和248任一(第二单体)。17.权利要求1到16中任一项的变体,其与权利要求16所定义的序列之一具有至少95%的序列同一性。18.权利要求1到17中任一项的变体,其包含核定位信号和/或标签。19.权利要求5到18中任一项的变体,其为专性异二聚体,其中所述第一单体还包含D137R突变,第二单体还包含R51D突变。20.权利要求5到18中任一项的变体,其为专性异二聚体,其中所述第一单体还包含E8R或E8K以及E61R突变,第二单体还包含K7E和K96E突变。21.单链大范围核酸酶,其包含权利要求1至20中任一项所述一种变体的两个单体或核心结构域,或二者的组合。22.权利要求21的单链大范围核酸酶,其包含权利要求7、8、9、14、15和16中任一项定义的第一和第二单体,二者通过肽连接子连接。23.多核苷酸片段,其编码权利要求1至20中任一项所述变体或者权利要求21或权利要求22的单链大范围核酸酶。24.表达载体,其包含至少一个权利要求23所述多核苷酸片段。25.权利要求24的表达载体,其包含两个不同的多核苷酸片段,每个多核苷酸片段编码权利要求5到20中任一项所定义之异二聚体变体的单体之一。26.权利要求24或权利要求25的载体,其包含靶向构建体,所述靶向构建体包含待引入人β珠蛋白基因的序列,以及与权利要求1、5和6中任一项所定义I-CreI变体之基因组DNA切割位点侧翼的人β珠蛋白基因序列同源的序列。27.权利要求26的载体,其中所述与I-CreI变体之基因组DNA切割位点侧翼的人β珠蛋白基因序列同源的序列是人β珠蛋白基因的片段,所述片段包含SEQIDNO:4的508到707位、651到850位、701到900位、1048到1247位、1147到1346位、1524到1723位、1599到1798位、1808到2007位、2084到2283位、2094到2293位、2245到2444位、2323到2522位和2523到2722位。28.权利要求26或27的载体,其中所述待引入的序列是修复人β珠蛋白基因中突变的序列。29.权利要求28的载体,其中修复所述突变的序列编码野生型人β珠蛋白的一部分。30.权利要求26或27的载体,其中所述与I-CreI变体之基因组DNA切割位点侧翼的人β珠蛋白序列同源的序列包含权利要求29所定义的编码野生型人β珠蛋白之一部分的序列。31.权利要求28的载体,其中修复所述突变的序列包含人β珠蛋白ORF和终止3’转录的多腺苷酸化位点。32.权利要求31的载体,其中所述修复突变之序列的侧翼是权利要求26或27中定义的与I-CreI变体之基因组DNA切割位点侧翼的人β珠蛋白基因序列同源的序列。33.组合物,其至少包含权利要求1到20中任一项的变体、权利要求21或22的单链大范围核酸酶,和/或权利要求24到32中任一项的表达载体。34.权利要求33的组合物,其包含权利要求26到32中任一项定义的靶向DNA构建体。35.权利要求34的组合物,其中所述靶向DNA构建体包含在重组载体中。36.宿主细胞,其至少用权利要求23或25中定义的多核苷酸片段或权利要求24到32中任一项所述载体进行了修饰。37.非人转基因动物,其包含权利要求23或权利要求25中定义的一种或两种多核苷酸片段。38.转基因植物,其包含如权利要求23或权利要求25中所定义的一种或两种多核苷酸片段。39.权利要求1到20中任一项的变体、权利要求21或22的单链大范围核酸酶、和/或权利要求24到32中任一项的表达载体中的至少之一用于制备药物的用途,所述药物用于预防、改善或治疗β-珠蛋白基因中突变引起的病理状况。40.权利要求39的用途,其中所述病理状况选自镰状细胞病和β-地中海贫血症。41.权利要求1到20中任一项的变体、权利要求21或权利要求22的单链大范围核酸酶、和/或根据权利要求24到32中任一项的表达载体中的至少之一用于非治疗目的的基因组改造的用途。42.权利要求41的用途,其中所述变体、单链大范围核酸酶或载体与权利要求26到32中任一项所定义的靶向DNA构建体相联合。43.权利要求41或权利要求42的用途,其用于产生β球蛋白基因突变所致遗传性血红蛋白病症的动物模型。全文摘要本发明涉及一种I-CreI变体,其中两个I-CreI单体之一具有至少两个替换,其中LAGLIDADG核心结构域的两个功能性亚结构域中各含一个,所述亚结构域分别位于I-CreI的26到40位以及44到77位,所述变体能够切割来自人β珠蛋白基因的DNA靶序列。本发明还涉及所述变体和衍生产物用于预防和治疗人β珠蛋白基因中突变所引起的病理状况(镰状细胞病,β-地中海贫血症)的用途。文档编号C12N15/90GK101802184SQ200880108153公开日2010年8月11日申请日期2008年7月23日优先权日2007年7月23日发明者克里斯托夫·佩雷斯-米绍申请人:赛莱克蒂斯公司