专利名称:嵌合内切核酸酶及其用途的制作方法
技术领域:
本发明涉及包含内切核酸酶和异源DNA结合结构域的嵌合内切核酸酶,所述异源DNA结合结构域包含一个或多个Zn2C6锌指,本发明还涉及使用此类嵌合内切核酸酶对多核苷酸进行靶向整合、靶向缺失或靶向突变的方法。
背景技术:
基因组工程化(genome engineering)是概括用于在基因组内插入、缺失、取代或操纵特定遗传序列的不同技术的通用术语,其具有大量的治疗应用和生物技术应用。所有基因组工程化技术或多或少都使用重组酶、整合酶或内切核酸酶,用于在预定位点制造DNA双链断裂,以促进同源重组。
尽管已利用了大量的方法来制造DNA双链断裂,开发在基因组中于高度特异性位点制造DNA双链断裂的有效方法仍是基因疗法、农业技术和合成生物学中的主要目标。实现该目标的一种手段是使用对下述序列具有特异性的核酸酶,所述序列足够大到仅存在于基因组内的单个位点。识别此类大约15至30个核苷酸的大DNA序列的核酸酶因此被称为“大范围核酸酶”或“归巢(homing)内切核酸酶”,并常与寄生性(parasitic)DNA元件相关联,所述元件例如常发现于植物和真菌基因组中的组I自剪接内含子和内含肽。大范围核酸酶通常被分组为四个家族LAGLIDADG家族、GIY-YIG家族、His-Cys盒家族和HNH家族。这些家族的特征在于影响催化活性和它们的DNA识别序列的序列的结构基序。来自LAGLIDADG家族的天然大范围核酸酶已被用于在昆虫和哺乳动物细胞培养物以及很多生物(例如植物、酵母或小鼠)中有效促进位点特异性基因组修饰,但是该手段已局限于对DNA识别序列保守的同源基因的修饰或已向其中引入了识别序列的预工程化(preengineered)基因组的修饰。为避免此类局限以及为促进DNA双链断裂激发的基因修饰的系统性(systematic)执行,已经制造了新的核酸酶类型。一种新核酸酶类型由人工组合的非特异性核酸酶和高度特异性DNA结合结构域构成。已使用FokI限制性酶的非特异性核酸酶结构域和经工程化的锌指DNA结合结构域之间的嵌合融合体,在多种生物中展现了该策略的有效性(例如W003/089452 )。该手段的一种变化是使用作为DNA结合结构域的大范围核酸酶的失活变体与非特异性核酸酶(例如FokI)融合的,例如 Lippow 等人,“Creation of a type IIS restriction endonucleasewith a long recognition sequence”, Nucleic Acid Research(2009), Vol. 37, No. 9, 3061至3073页所公开的。一种备选手段是对天然大范围核酸酶进行遗传工程化,以定制其与基因组中存在的位点结合的DNA结合区域,由此制造具有新特异性的经工程化的大范围核酸酶(例如TO07093918、W02008/093249、W009114321)。但是,已针对DNA切割特异性工程化过的很多大范围核酸酶相对于其所来源的天然存在的大范围核酸酶而言具有减少的切割活性(US2010/0071083)。大多数的大范围核酸酶还作用于与其最优结合位点相似的序列上,这可能导致非意图性的或者甚至有害的脱靶作用。尽管已采取了若干手段,以避免增强大范围核酸酶诱导的同源重组的效率,例如通过将核酸酶与大鼠糖皮质激素受体的配体结合结构域融合,以通过添加地塞米松或相似化合物促进或者甚至诱导该经修饰的核酸酶运送至细胞核以及由此运送至其靶向位点(W02007/135022),但本领域仍需要开发具有对同源重组有高诱导效率和/或针对其结合位点有高特异性的大范围核酸酶,由此限制脱靶作用的风险。发明简述
本发明提供了嵌合内切核酸酶,其包含至少一个LAGLIDADG内切核酸酶和至少一个包含一个或多个Zn2C6锌指的异源DNA结合结构域。优选地,嵌合内切核酸酶包含至少一个包含下述氨基酸序列的LAGLIDADG内切核酸酶,所述氨基酸序列与SEQ ID NO: I、
2、3、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、161 或 165 中任一所描述的多肽具有至少80%的氨基酸序列同一性。优选地,与SEQ ID NO: 1、2或3所描述的多肽具有至少80%的氨基酸序列同一'丨生。在一种优选的实施方式中,嵌合内切核酸酶包含至少一个下述LAGLIDADG内切核酸酶,其是经工程化的或经优化的内切核酸酶,或是经工程化的内切核酸酶的经优化版本,优选地,经优化的内切核酸酶或经工程化的内切核酸酶的经优化版本。在另一实施方式中,嵌合内切核酸酶包含下述异源DNA结合结构域,所述结构域包含源于转录因子的一个或多个Zn2C6锌指。在一种优选的实施方式中,嵌合内切核酸酶包含下述异源DNA结合结构域,所述结构域包含至少一个与SEQ ID N0s:57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、
111、112、113、114、115、116、117、118、119、120 或 121 中任一所描述的多肽具有至少 80% 氨基酸序列同一性的多肽。本文所述的嵌合内切核酸酶可包含或可不包含将至少一个内切核酸酶与至少一个异源DNA结合结构域相连的接头。优选地,所述接头(同义词“接头多肽”)由至少3个氨基酸构成,并且其中,该接头多肽的氨基酸序列中至少三分之一的氨基酸是甘氨酸或丝氨酸或丙氨酸或甘氨酸、丝氨酸和丙氨酸的组合。优选地,嵌合内切核酸酶包含至少一个NLS-序列和或SecIII或SecIV分泌信号。本发明的一种实施方式提供了嵌合内切核酸酶,其中异源DNA结合结构域的DNA结合活性是可诱导的,优选地是可通过二聚LAGLIDADG内切核酸酶或异源二聚LAGLIDADG内切核酸酶的第二单体的表达来诱导的。本发明还提供了经分离的多核苷酸,其包含编码本发明的嵌合内切核酸酶的核苷酸序列。优选地,经分离的多核苷酸是经密码子优化的,或具有低含量的DNA不稳定性动机(motives),或具有低含量的密码子重复,或具有低含量的隐蔽剪接位点,或具有低含量的备选起始密码子,具有低含量的限制性位点,或具有低含量的RNA 二级结构,或具有这些特征的任何组合。本发明的另一实施方式是表达盒,所述表达盒包含与启动子和终止子序列功能性组合的、如上文所述的经分离的多核苷酸。本发明的另一实施方式是经分离的多核苷酸,其包含长度为大约15至大约300个核苷酸的嵌合识别序列,并包含LAGLIDADG内切核酸酶的识别序列以及下述异源DNA结合结构域的识别序列,所述结构域包含一个或多个Zn2C6锌指。优选地,异源DNA结合结构域的识别序列可被包含 SEQ ID N0s:57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121中任一所描述的氨基酸序列的至少一种DNA结合结构域结合。本发明还提供了包含嵌合识别序列的经分离的多核苷酸,优选地,所述嵌合识别序列包含在表达盒中,或者接近5’或3’末端,或者接近两个末端,其中,所述表达盒包含启动子、终止子和能被所述启动子表达的序列。优选地,能被表达的序列编码标记基因。本发明还提供了下述嵌合识别序列,其包含直接相连或通过I至10个核苷酸的序列相连的,I-SceI 的 DNA 识别序列和可被包含 SEQ ID NO: 57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、
112、113、114、115、116、117、118、119、120、121中任一所描述的氨基酸序列的至少一个DNA结合结构域结合的识别序列。在一种实施方式中,嵌合识别序列包含直接相连或通过I至 10个核苷酸的序列相连的,I-SceI的DNA识别序列和AlcR的识别序列、或AlcR(l-60)的识别序列。在本发明的一个实施方式中,经分离的多核苷酸包含嵌合识别序列,所述识别序列包含SEQ ID NO: 13、14、15、16、43、44、45或46中任一所描述的多核苷酸序列。本发明的其它一些实施方式是下述载体、宿主细胞或非人生物,它们包含编码嵌合内切核酸酶的多核苷酸,或编码嵌合内切核酸酶的经分离的多核苷酸,或含有嵌合识别序列的经分离的多核苷酸,或含有编码嵌合内切核酸酶或嵌合识别序列的多核苷酸的表达盒,所述实施方式还是包含上述嵌合内切核酸酶、经分离的多核苷酸和表达盒的组合的载体、宿主细胞或非人生物。优选地,非人生物是植物。本发明提供了使用本文所述的嵌合内切核酸酶和嵌合识别序列诱导或协助同源重组或末端联接事件的方法。优选地,在用于靶向整合或序列切除的方法中。优选地,被切除的序列是标记基因。本发明的一种实施方式中提供嵌合内切核酸酶的方法,所述方法包括下述步骤a)提供至少一个内切核酸酶编码区域,b)提供至少一个异源DNA结合结构域编码区域,c)提供具有步骤a)的一个或多个内切核酸酶的一个或多个可能的DNA识别序列并且具有步骤b)的一个或多个异源DNA结合结构域的一个或多个可能的识别序列的多核苷酸,d)制造步骤b)的所有内切核酸酶的编码区域和步骤c)的所有异源DNA结合结构域的翻译融合体,e)从来自步骤d)制造的翻译融合体表达嵌合内切核酸酶,f)针对对步骤c)的多核苷酸的切割,测试步骤e)中表达的嵌合内切核酸酶。本发明还提供了用于多核苷酸同源重组的方法,所述方法包括下述步骤a)提供同源重组的感受态细胞,b)提供包含侧翼有序列A和序列B的嵌合识别位点的多核苷酸,c)提供包含序列A’和B’的多核苷酸,序列A’和B’足够长并且与序列A和序列B足够同源,从而允许在所述细胞中同源重组,以及d)提供如本文所述的嵌合内切核酸酶或如本文所述的表达盒,e)在所述细胞中组合b)、c)和d),以及f)检测b)和c)的重组多核苷酸,或选择出包含b)和c)的重组多核苷酸的细胞或使包含b)和c)的重组多核苷酸的细胞生长。优选地,用于多核苷酸同源重组的方法导致同源重组,其中,步骤a)的感受态细胞中包含的多核苷酸序列从步骤f)的生长细胞的基因组中缺失。本发明的另一方法是用于靶向突变的方法,所述方法包括下述步骤a)提供包含下述多核苷酸的细胞,所述多核苷酸包含嵌合内切核酸酶的嵌合识别位点,b)提供能切割步骤a)的嵌合识别位点的嵌合内切核酸酶,C)在所述细胞中组合a)和b),以及d)检测经突变的多核苷酸,或针对包含经突变的多核苷酸的生长细胞加以选择。在本发明的另ー优选的实施方式中,上文所述的方法包括下述步骤,其中嵌合内切核酸酶和嵌合识别位点组合于至少ー种细胞中,这通过生物的杂交、通过转化或通过经由融合至经优化内切核酸酶的SecIII或SecIV肽介导的运送来实现。附图简述图I描述了包含I-SceI作为N-端和AlcR的氨基酸I至60作为C-端结构域的嵌合核酸酶的模型。·图2是对本文所述的实施例10和20d的实验结果的图示。由此提供了对野生型I-SceI和三种不同的嵌合内切核酸酶变体用于在植物中诱导同源重组的能力的比较。诱导的同源重组的频率通过同源重组后显示出⑶S活性的植物的百分比(%蓝色植物)表示。图2还包含了野生型I-SceI的DNA识别序列(被称为wt靶点)的多核苷酸序列以及嵌合内切核酸酶(I-SceI-AlcR (1-60)、I-SceI#2-AlcR (1-60)和 I-SceI#l-AlcR(l_60))的嵌合识别位点的多核苷酸序列。图2还提供了显示SceI的C-末端的氨基酸序列,其包含不同的突变,赖氨酸(L)被用作为接头,并且AlcR(l-60)原N-末端的前六个氨基酸被用于制造嵌合内切核酸酶。Wt I-SceI原C-末端的不同突变将野生型氨基酸序列“TISSETFLK”改变为“TIKSEETFLK”(嵌合内切核酸酶I-SceI#l-AlcR(l_60)中)和“AIANQAFLK”(嵌合内切核酸酶 I-SceI#2-AlcR(l-60)中)。图3描述了对不同I-SceI同源物的序列比对,其中I是SEQ ID NO: 1,2是SEQ IDNO:122,3 是 SEQ ID NO:123,4 是 SEQ ID NO:124,5 是 SEQ ID NO:125。图4描述了对不同I-CreI同源物的序列比对,其中I是SEQ ID NO: 126,2是SEQID NO:127,3 是 SEQ ID NO:128,4 是 SEQ ID NO:129,5 是 SEQ ID NO:130。图5a至5c描述了对不同PトSceI同源物的序列比对,其中I是SEQ ID NO: 145,2 是 SEQ ID NO:146,3 是 SEQ ID NO:147,4 是 SEQ ID NO:148,5 是 SEQ ID NO:149。图6描述了对不同I-CeuI同源物的序列比对,其中I是SEQ ID NO: 131,2是SEQID NO:132,3 是 SEQ ID NO:133,4 是 SEQ ID NO:134,5 是 SEQ ID NO:135。图7描述了对不同I-ChuI同源物的序列比对,其中I是SEQ ID NO: 136,2是SEQID NO:137,3 是 SEQ ID NO:138,4 是 SEQ ID NO:139,5 是 SEQ ID NO:140。图8描述了对不同I-DmoI同源物的序列比对,其中I是SEQ ID NO: 141,2是SEQID NO:142,3 是 SEQ ID NO:143,4 是 SEQ ID NO:144。图9描述了对不同I-MsoI同源物的序列比对,其中I是SEQ ID NO: 150,并且2是SEQ ID NO:151。
图10显示了对与AlcR的DNA结合结构域(AlcR I至60)同源的不同Zn2C6结构域的序列比对。共有序列显示了这些同源物中保守的氨基酸(AlcR I至60共有序列)。序列 No. 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24 和 25 分别指 SEQ ID N0:70、71、7274、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93 和 94。图11显示了对与AflR的DNA结合结构域同源的不同Zn2C6结构域的序列比对。共有序列显示了这些同源物中保守的氨基酸(AflR共有序列)。序列No. 1、2、3、4、5、6、7、8、
9、10、11 和 12 分别指 SEQ ID NO:57、58、59、60、61、62、63、64、65、66、67、68 和 69。
图12显示了对与Hapl的DNA结合结构域同源的不同Zn2C6结构域的序列比对。共有序列显示了这些同源物中保守的氨基酸(Hapl共有序列)。序列No. 1、2、3、4、5、6、7、8、
9、10、11、12和 13 分别指 SEQ ID N0:95、96、97、98、99、100、101、102、103、104、105、106 和107。图13显示了对与Leu3的DNA结合结构域同源的不同Zn2C6结构域的序列比对。共有序列显示了这些同源物中保守的氨基酸(Leu3共有序列)。序列No. 1、2、3、4、5、6、7、8、9、
10、11、12、13和 14 分别指 SEQ ID NO: 108、109、110、111、112、113、114、115、116、117、118、119,120 和 121。发明详述
本发明提供了嵌合LAGLIDADG内切核酸酶,其包含至少ー个LAGLIDADG内切核酸酶和至少ー个包含ー个或多个Zn2C6锌指的异源DNA结合结构域。LAGLIDADG内切核酸酶可用于本发明的LAGLIDADG内切核酸酶可在藻类、真菌、酵母、原生动物、叶绿体、线粒体、细菌和古细菌的基因组中发现。LAGLIDADG内切核酸酶包含至少ー个保守的LAGLIDADG基序。LAGLIDADG基序的名称基于出现于所有LAGLIDADG内切核酸酶中的特征性氨基酸序列。术语LAGLIDADG是该氨基酸序列根据STANDARD ST. 25 (S卩,PCIPI执行协调委员会(PCIPI Executive Coordination Committee)针对专利申请中呈现的核苷酸和氨基酸序列表所采用的标准)中所述的单字母编码的首字母縮写。但是,LAGLIDADG基序并非在所有LAGLIDADG内切核酸酶中完全保守(见例如Chevalier 等人(2001), Nucleic Acids Res. 29(18):3757 至 3774,或 Dalgaard 等人(1997), Nucleic Acids Res. 25(22) :4626 至 4638),从而ー些 LAGLIDADG 内切核酸酶在它们的LAGLIDADG基序中包含一个或数个氨基酸改变。包含仅ー个LAGLIDADG基序的LAGLIDADG内切核酸酶通常作为同源或异源ニ聚体发挥作用。包含两个LAGLIDADG基序的LAGLIDADG内切核酸酶作为単体发挥作用,并且通常包含伪ニ聚体结构。LAGLIDADG内切核酸酶可分离自表I至6中以示例性目的提到的生物的多核苷酸,或通过本领域已知的技术从头合成,例如使用本领域技术人员已知的公众数据库中可获得的序列信息来进行,所述数据库例如Genbank(Benson(2010)),Nucleic Acids Res38:D46_51 或 Swissprot(Boeckmann(2003),Nucleic Acids Res 31:365-70)。可在针对蛋白质家族的PFAM-数据库中发现LAGLIDADG内切核酸酶的集合。PFAM-数据库检录号PR)0961描述了 LAGLIDADG I蛋白质家族,其包含约800条蛋白序列。PFAM-数据库检录号PF03161描述了 LAGLIDADG 2蛋白质家族的成员,其包含约150条蛋白序列。可在InterPro数据库中找到LAGLIDADG内切核酸酶的ー个备选集合,例如,InterPro检录号 IPR004860。术语LAGLIDADG内切核酸酶还将包括人工同源ニ聚和异源ニ聚LAGLIDADG内切核酸酶,其可通过修饰単体的蛋白质-蛋白质相互作用区域以促进同源或异源ニ聚体形成来制造。包含LAGLIDADG内切蛋白酶I-Dmo I作为ー个结构域的人工异源ニ聚LAGLIDADG内切核酸酶的例子可被发现于例如W02009/074842和W02009/074873中。除此之外,术语LAGLIDADG内切核酸酶还将包括人工单链内切核酸酶,其可通过产生同源ニ聚或异源ニ聚LAGLIDADG内切核酸酶的单体的翻译融合体来制造。
在另ー些实施方式中,嵌合内切核酸酶中包含的LAGLIDADG内切核酸酶可以是单体、同源ニ聚、人工同源ニ聚或异源ニ聚或人工单链LAGLIDADG内切核酸酶。在一种实施方式中,LAGLIDADG内切核酸酶是单体、同源ニ聚、异源ニ聚或人工单链LAGLIDADG内切核酸酶。优选地,内切核酸酶是单体或人工单链LAGLIDADG内切核酸酶。优选的LAGLIDADG 内切核酸酶是I_Anil,I-Sce I, I-Chu I, I-Dmo I, I-Cre I,I-Csm I, PI-Sce I, PI-TliI, PI-Mtu I, I-Ceu I, I-Sce II,I-Sce III,HO,PI-Civ I, PICtr I, PI-Aae I, PI-Bsu I, PI-Dha I, PI-Dra I, PI-Mav I, PI-Mch I, PI-Mfu I, PI-Mfl I, PI-Mga I, PI-Mgo I, PI-Min I, PI-Mka I, PI-Mle I, PI-Mma I, PI-Msh I, PI-Msm I,I-Mso I,PI-Mth I,PI-Mtu I,PI-Mxe I,PI-Npu I,PI-Pfu I,PI-Rma I,PI-Spb I,PI-SspI, PI-Fac I, PI-Mja I, PI-Pho I, PI-Tag I, PI-Thy I, PI-Tko I,和 PI-Tsp I 及它们中任一的在氨基酸水平上具有至少 49%、51%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物;更优选的是I-Sce I ,I-Chu I ,I-Dmo IU-CreI、I-Csm I、PI-Pfu I、PI-Sce I、PI-Tli I、I-Mso I、PI-Mtu I、I-Ceu I、I-Sce II、I-SceIII和HO及它们中任一的在氨基酸水平上具有至少49%、51%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物;进ー步更优选的是,I-SceI、I-Chu I、I-Dmo I、I-Cre I、I-Csm I、PI-Sce I、PI-Pfu I、PI-Tli I、I-Mso I、PI-MtuI和I-Ceu I及它们中任一的在氨基酸水平上具有至少49%、51%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98% 或 99% 的序列同一性的同源物;还更优选的是I-Dmo I>I-Cre I>I-Sce I>I-Mso I和I-Chu I及它们中任一的在氨基酸水平上具有至少 49%、51%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物;最优选的是I-Sce I及I-Sce I的在氨基酸水平上具有至少 49%、51%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98% 或 99% 的序列同一性的同源物。优选的单体LAGLIDADG 内切核酸酶是I-AniI,I-Sce I, I-Chu I, I-Dmo I, I-CsmI, PI-Sce I, PI-Tli I, PI-Mtu I, I-Sce II,I-Sce III,HO,PI-Civ I, PI Ctr I, PI-AaeI, PI-Bsu I, PI-Dha I, PI-Dra I, PI-Mav I, PI-Mch I, PI-Mfu I, PI-Mfl I, PI-Mga I,PI-Mgo I,PI-Min I,PI-Mka I,PI-Mle I,PI-Mma I,PI-Msh I,PI-Msm I,PI-Mth I,PI-MtuI, PI-Mxe I, PI-Npu I, PI-Pfu I, PI-Rma I, PI-Spb I, PI-Ssp I, PI-Fac I, PI-Mja I,PI-Pho I,PI-Tag I,PI-Thy I,PI-Tko I JPPI-Tsp I ;及它们中任一的在氨基酸水平上具有至少 49%、51%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98% 或 99% 的序列同一性的同源物。优选I-Sce I, I-Chu I,Ι-Dmo I,I-Csm I,PI-Pfu I,PI-Sce I,PI-Tli I,PI-MtuI,I-Sce II,I-Sce III和HO ;及它们中任一的在氨基酸水平上具有至少49%、51%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98% 或 99% 的序列同一性的同源物。更优选的单体LAGLIDADG 内切核酸酶是I_Sce I、I-Chu I、I-Dmo I、I-Csm I、PI-Sce I,PI-Tli I和PI-Mtu I ;及它们中任一的在氨基酸水平上具有至少49%、51%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98% 或 99% 的序列同一性的同源物。进ー步更优选的单体LAGLIDADG内切核酸酶是I_Dmo I、I-Sce I和I-Chu I ;及它们中任一的在氨基酸水平上具有至少49%、51%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物。优选的LAGLIDADG内切核酸酶是表I至6中提到的LAGLIDADG内切核酸酶及其在氨基酸水平上具有至少80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物。一种类型的LAGLIDADG内切核酸酶同源物是人工单链LAGLIDADG内切核酸酶,其可包含相同LAGLIDADG内切核酸酶的两个亚单位,例如,W003078619中公开的单链I_Cre、单链I-Ceu I或单链I-Ceu II,或其可包含不同LAGLIDADG内切核酸酶的两个亚单位。包含不同LAGLIDADG内切核酸酶的两个亚单位的人工单链LAGLIDADG内切核酸酶被称为杂交体大范围核酸酶。 优选的人工单链LAGLIDADG内切核酸酶是单链I-CreI、单链I-CeuI或单链I-CeuII 和杂交体大范围核酸酶,例如W003078619、W009/074842、W02009/059195 和W009/074873 中公开的 I-Sce/I-Chu I,I-Sce/PI-Pfu I,I-的 Chu/1-Sce I,I-Chu/PI-Pfu I,I-Sce/I-Dmo I,I Dmo I/I-See I,I-Dmo I/PI-Pfu I, I-Dmo I/I-Cre I,I-Crel/I-DmoI, I-Cre I/PI-Pfu I, I-Sce I/I-Csm I, I-Sce I/I-Cre I, I-Sce I/PI-Sce I, I-Sce I/PI-Tli I,I-SceI/PI-Mtu I,I-Sce I/I-Ceu I,I-Cre I/I-Ceu I,I-Chu I/I-Cre I,I-ChuI/I-Dmo I, I-Chu I/I-Csm I,トChuI/PI-Sce I, I-Chu I/PI-Tlil, I-Chu I/PI-Mtu I,I-Cre I/I-Chu I,I-Cre I/I-Csm I,I-Cre I/PI-Sce I,I Crel/PI-Tli I,I-Cre I/PI-MtuI, I-Cre I/I-Sce I, I-Dmo I/I-Chu I, I-Dmo I/I-Csm I, I Dmo I/PI-Sce I, I-Dmo I/PI-TliLI-Dmo I/PI-Mtu I, I-Csm I/I-Chu I, I-Csm I/PI-Pfu I, I-Csm I/I-Cre I, I-CsmI/I-Dmo I, I-Csm I/PI-Sce I, I-Csm I/PI-Tlil, I-Csm I/PI-Mtu I, I-Csm I/I-Sce I,PI-Sce I/I-Chu I, PI-Sce I/I-Pful, PI-Sce I/I-Cre I, PI-Sce I/I Dmo I, PI-Sce I/I-Csm I,PI-Sce I/PI-Tlil,PI-Sce I/PI-Mtu I,PI-Sce I/I-Sce I,PI-Tli I/I Chu I,PI-Tli I/PI-Pfu I,PI-Tli I/I-Cre I,PI-Tli I/I-Dmo Ι,ΡΙ-Tli I/I-Csm I,PI-Tli I/PISce I,PI-Tli I/PI-Mtu I,PI-Tli 1/I-Sce I,PI-Mtu I/I-Chu I,PI-Mtu I/PI-Pfu I,PI-Mtu I/I-Cre I, PI-MtuI/I-Dmo I、PI-Mtu I/I-Csm I、PI-Mtu I/I-Sce I、PI-Mtu I/PI-Tli I 和PI-Mtu I/I-Scel,以及W009/006297 中公开的 L1G3-4SC,或Sylvestre Grizot等人“Efficient targeting of a SしID gene by an engineered singie—chain nommgendonuclease,,, Nucleic Acids Research, 2009, Vol. 37, No. 16, 5405 - 5419 页中公开的单链 I-Cre I V2V3。ー种特别优选的单链LAGLIDADG内切核酸酶单链I-CreI。优选的ニ聚LAGLIDADG 内切核酸酶是 J-Cre I、I-Ceu I、I-Sce II、I-Mso I 和I-Csm I及它们中任一的在氨基酸水平上具有至少49%、51%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98% 或 99% 的序列同一性的同源物。优选的异源ニ聚LAGLIDADG内切核酸酶被公开于WO 07/034262,WO 07/047859和W008093249 中。LAGLIDADG内切核酸酶的同源物可克隆自其它生物,或可通过对LAGLIDADG内切核酸酶加以突变来制造,例如通过替代、添加或缺失给定的LAGLIDADG内切核酸酶的氨基酸序列中的氨基酸来进行,这优选对其DNA结合亲和性、其ニ聚体形成亲和性没有影响,或者这将改变其DNA识别序列。
在本文中使用时,术语“DNA结合亲和性”表示大范围核酸酶或LAGLIDADG内切核酸酶与參照DNA分子(例如DNA识别序列或任意序列)非共价联结的趋势。结合亲和性是通过解离常数Kd (例如,I-CreI针对WT DNA识别序列的Kd为大约O. InM)测量的。在本文中使用时,如果相对于參照大范围核酸酶或LAGLIDADG内切核酸酶而言,重组大范围核酸酶针对參照DNA识别序列的Kd増加或减少统计上显著(p〈0. 05)的量,那么大范围核酸酶则具有“变动的”结合亲和性。关于大范围核酸酶单体或LAGLIDADG内切核酸酶单体,在本文中使用的术语“针对ニ聚体形成的亲和性”表示单体与參照大范围核酸酶单体或LAGLIDADG内切核酸酶单体非共价联结的趋势。针对ニ聚体形成的亲和性可使用相同単体(即,同源ニ聚体形成)或使用不同単体(B卩,异源ニ聚体形成)例如參照野生型大范围核酸酶或參照LAGLIDADG内切核酸酶来测量。结合亲和性通过解离常数Kd来測量。在本文中使用时,如果相对于參照大范围核酸酶单体或LAGLIDADG内切核酸酶单体而言,重组大范围核酸酶单体或重组LAGLIDADG内切核酸酶单体针对參照大范围核酸酶单体或针对參照LAGLIDADG内切核酸酶的Kd增加或减少统计上显著(P〈0. 05)的量,那么大范围核酸酶则具有“变动的”针对ニ聚体形成的亲和性。·在本文中使用时,术语“酶活性”指大范围核酸酶(例如LAGLIDADG内切核酸酶)切割特定DNA识别序列的速率。此类活性是可测量的酶促反应,所述反应涉及对双链DNA的磷酸ニ酯键的水解。作用于特定DNA底物上的大范围磷酸酶的活性受大范围核酸酶对该特定DNA底物的亲和性(affinity)或亲合力(avidity)的影响,这又进而受与DNA的序列特异性相互作用和非序列特异性相互作用的影响。例如,可向LAGLIDADG内切核酸酶的氨基酸序列添加核定位信号和/或改变其序列的一个或多个氨基酸和/或缺失其序列的部分,例如,其C-末端的部分或N-末端的部分。例如,可制造I-SceI的同源物LAGLIDADG内切核酸酶,这通过突变其氨基酸序列的氨基酸来实现。对I-SceI的DNA结合亲和性影响极少,或将改变其DNA识别序列的突变,例如但不限于A36G、L40M、L40V、I41S、I41N、L43A、H91A 和 I123L。在本发明的一种实施方式中,LAGLIDADG内切核酸酶的同源物选自人工单链LAGLIDADG内切核酸酶(包括或不包括杂交体大范围核酸酶)、可克隆自其它生物的同源物、经工程化的内切核酸酶或经优化的核酸酶的组。在一种实施方式中,LAGLIDADG内切核酸酶选自下组,所述组包含I-Sce I ,I-CreI>I-Mso I, I-Ceu I, I-Dmo I, I-Ani UPI-Sce I, I-Pfu I 或它们中任一的在氨基酸水平上具有至少 49%、51%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98% 或 99% 的序列同一性的同源物。在另ー实施方式中,LAGLIDADG内切核酸酶选自下组,所述组包含I-Sce I ,I-ChuI、I-Cre I、I-Dmo I、I-Csm I、PI-Sce I、PI-Pfu I、PI-Tlil、PI-Mtu I 和 I-Ceu I 及它们中任一的在氨基酸水平上具有至少49%、51%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物。表I =I-SceI的示例性同源物,它们可克隆自其它生物。
权利要求
1.嵌合内切核酸酶,其包含至少ー个LAGLIDADG内切核酸酶和至少ー个包含一个或多个Zn2C6锌指的异源DNA结合结构域。
2.权利要求I所述的嵌合内切核酸酶,其中至少ー个LAGLIDADG内切核酸酶包含下述氨基酸序列,所述氨基酸序列与SEQ ID NO: 1、2或3所描述的多肽具有至少80%的氨基酸序列同一性。
3.权利要求I所述的嵌合内切核酸酶,其中至少ー个LAGLIDADG内切核酸酶是经工程化的或经优化的内切核酸酶,或是经工程化的内切核酸酶的经优化版本。
4.权利要求I至3中任意一项所述的嵌合内切核酸酶,包含下述异源DNA结合结构域,所述结构域包含源于转录因子的ー个或多个Zn2C6锌指。
5.权利要求I至4中任意一项所述的嵌合内切核酸酶,其中所述异源DNA结合结构域包含至少ー个与 SEQ ID N0s:57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、I10、III、I12、I13、I14、115、I16、I17、118,119,120或121中任一所描述的多肽具有至少80%氨基酸序列同一性的多肽。
6.权利要求I至5中任意一项所述的嵌合内切核酸酶,其中所述嵌合内切核酸酶包含经优化的内切核酸酶。
7.权利要求I至6中任意一项所述的嵌合内切核酸酶,其中具有DNA双链断裂诱导活性的所述内切核酸酶和所述异源DNA结合结构域通过接头多肽连接。
8.权利要求I至7中任意一项所述的嵌合内切核酸酶,其中所述接头多肽由至少3个氨基酸构成,并且其中,该接头多肽的氨基酸序列中至少三分之一的氨基酸是甘氨酸或丝氨酸或丙氨酸或甘氨酸、丝氨酸和丙氨酸的组合。
9.权利要求I至8中任意一项所述的嵌合内切核酸酶,包含至少ー个NLS序列。
10.权利要求I至9中任意一项所述的嵌合内切核酸酶,其中所述异源DNA结合结构域的DNA结合活性是可诱导的。
11.权利要求I至10中任意一项所述的嵌合内切核酸酶,其中所述内切核酸酶的DNA双链断裂诱导活性是可通过ニ聚LAGLIDADG内切核酸酶或异源ニ聚LAGLIDADG内切核酸酶的第二単体的表达来诱导的。
12.权利要求I至11中任意一项所述的嵌合内切核酸酶,还包含至少ー个SecIII或S ecIV分泌信号。
13.包含核苷酸序列的经分离的多核苷酸,所述核苷酸序列编码权利要求I至12中任意一项所述的嵌合内切核酸酶。
14.权利要求13所述的包含核苷酸序列的经分离的多核苷酸,其中所述经分离的多核苷酸序列 a.是经密码子优化的, b.具有低含量的RNA不稳定性动机, c.具有低含量的密码子重复, d.具有低含量的隐蔽剪接位点, e.具有低含量的备选起始密码子, f.具有低含量的限制性位点,g.具有低含量的RNAニ级结构, h.具有a)、b)、C)、d)、e)、f)或g)的任何组合。
15.表达盒,所述表达盒包含与启动子和終止子序列功能性组合的、权利要求13或15所述的经分离的多核苷酸。
16.包含嵌合识别序列的经分离的多核苷酸,所述嵌合识别序列长度为大约15至大约300个核苷酸,并且包含 a.LAGLIDADG内切核酸酶的识别序列,以及 b.下述异源DNA结合结构域的识别序列,所述结构域包含ー个或多个Zn2C6锌指。
17.权利要求16所述的包含嵌合识别序列的经分离的多核苷酸,其中异源DNA结合结构域的识别序列可被包含 SEQ ID N0s:57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、I10、I11、I12、I13、I14、I15、116、117、118、119、120、121中任一所描述的氨基酸序列的至少ー个DNA结合结构域结合。
18.权利要求16或17所述的包含嵌合识别序列的经分离的多核苷酸,包含 a.I-SceI的DNA识别序列, b.直接相连或通过I至10个核苷酸的序列相连的AlcR或AlcR(1-60)的识别序列。
19.权利要求16至19中任意一项所述的包含嵌合识别序列的经分离的多核苷酸,包含SEQ ID NO:13、14、15、16、43、44、45或46中任一所描述的多核苷酸序列。
20.载体、宿主细胞或非人生物,它们包含 a.编码权利要求I至12中任一所述的嵌合内切核酸酶的多核苷酸,或 b.权利要求13或14所述的经分离的多核苷酸,或 c.权利要求15所述的表达盒,或 d.权利要求16至19中任意一项所述的包含嵌合识别序列的经分离的多核苷酸,或 e.a)、b)、c)和d)的任何组合。
21.权利要求20所述的非人生物,其中所述非人生物是植物。
22.提供嵌合内切核酸酶的方法,所述方法包括下述步骤 a.提供至少ー个内切核酸酶编码区域, b.提供至少ー个异源DNA结合结构域编码区域, c.提供具有步骤a)的一个或多个内切核酸酶的ー个或多个可能的DNA识别序列并且具有步骤b)的一个或多个异源DNA结合结构域的ー个或多个可能的识别序列的多核苷酸, d.制造步骤b)的所有内切核酸酶的编码区域和步骤c)的所有异源DNA结合结构域的翻译融合体, e.从来自步骤d)制造的翻译融合体表达嵌合内切核酸酶, f.针对对步骤c)的多核苷酸的切割,测试步骤e)中表达的嵌合内切核酸酶。
23.用于多核苷酸同源重组的方法,所述方法包括下述步骤 a.提供同源重组的感受态细胞, b.提供下述多核苷酸,所述多核苷酸包含侧翼有序列A和序列B的、如权利要求16至19中任意一项所述的经分离的多核苷酸, c.提供包含序列A’和B’的多核苷酸,所述序列A’和B’足够长并且与序列A和序列B足够同源,从而允许在所述细胞中同源重组,以及 d.提供如权利要求I至12中任意一项所述的嵌合内切核酸酶或如权利要求15所述的表达盒, e.在所述细胞中组合b)、c)的多核苷酸和d)的嵌合内切核酸酶,以及 f.检测b)和c)的重组多核苷酸,或选择出包含b)和c)的重组多核苷酸的细胞,和/或使包含b)和c)的重组多核苷酸的细胞生长。
24.如权利要求23所述的用于多核苷酸同源重组的方法,其中,同源重组之后,步骤a)的所述感受态细胞中包含的多核苷酸序列从步骤f )的生长细胞的基因组中缺失。
25.用于祀向突变多核苷酸的方法,所述方法包括 a.提供包含含有嵌合识别位点的多核苷酸的细胞, b.提供能切割步骤a)的所述嵌合识别位点的、如权利要求I至12中任意一项所述的嵌合内切核酸酶, c.在所述细胞中组合a)的所述多核苷酸和b)的所述嵌合内切核酸酶,以及 d.检测经突变的多核苷酸,或针对包含经突变的多核苷酸的生长细胞加以选择。
26.如权利要求23至25中任意一项所述的用于同源重组或靶向突变的方法,其中所述嵌合内切核酸酶和所述嵌合识别位点通过生物的杂交、通过转化或通过经由融合至嵌合内切核酸酶的SecIII或SecIV肽介导的运送,组合于至少ー个细胞中。
全文摘要
本发明涉及包含内切核酸酶和异源DNA结合结构域的嵌合内切核酸酶,所述异源DNA结合结构域包含一个或多个Zn2C6锌指,本发明还涉及使用此类嵌合内切核酸酶对多核苷酸进行靶向整合、靶向缺失或靶向突变的方法。
文档编号C12N9/22GK102686726SQ201080053667
公开日2012年9月19日 申请日期2010年11月26日 优先权日2009年11月27日
发明者A·赫鲁贝克, C·比斯根, H·W·霍夫肯 申请人:巴斯夫植物科学有限公司