一种用于talen高效构建的双rvd单元模块库及talen构建方法

文档序号:10589114阅读:848来源:国知局
一种用于talen高效构建的双rvd单元模块库及talen构建方法
【专利摘要】本发明属于基因工程技术领域,涉及一种用于TALEN高效构建的双RVD单元模块库。本发明针对现有GG?Vector TALEN组装方法的诸多不足,从头设计了“双RVD单元”(two?RVD unite)的TALEN组装策略。本发明的技术方案是一种用于TALEN高效构建的双RVD单元模块库,包括独立包装的144个双RVD单元模块、8个单RVD单元模块和24个末位RVD单元。本发明公布了一种基于Golden Gate克隆法的双RVD单元模块库,通过一次反应,可以构建靶向15~19bp任意DNA序列的TALEN表达载体。
【专利说明】
一种用于TALEN高效构建的双RVD单元模块库及TALEN构建 方法
技术领域
[0001] 本发明属于基因工程技术领域,涉及一种用于TALEN(转录激活样效应因子核酸 酶)高效构建的双RVD (重复变异双残基)单元模块库及TALEN构建方法。
【背景技术】
[0002] 基因组编辑技术(genome editing)是指针对基因组的特定序列进行定点突变、定 点整合、定点置换等遗传修饰的一项技术。利用基因组编辑技术在基因组原位引入基因序 列的改变,对研究基因功能提供了方便。在应用上,利用基因组编辑技术创制动植物新品 种,可以避免现存转基因技术中基因随机插入造成的表达不确定性和对原基因组的损伤。 随着靶向核酸酶技术的问世,实现了目的基因精准定向敲除(knock-out),从而获得目标基 因敲除的突变体。目前研究较多的三项技术为ZFN(zinc finger nuclease,锌指核酸酶)、 TALEN(transcription activator-like effectors nuclease,转录激活样效应因子核酸 酉每)和CRISPR/cas9(The clustered,regularly interspaced,short palindromic repeats-associated protein systems,成簇的规律间隔的短回文重复序列及关联蛋白系 统)。
[0003] TALENs蛋白包括两个组成部分。第一个组成部分来自于天然TALE(Transcription Activator-Like Effectors,转录激活样效应因子)蛋白,其N端含有一个易位结构域;中间 是一段由1.5~33.5个不等的TALE单元组成的重复氨基酸序列,每个单元又由34个氨基酸 组成,其中32个氨基酸是高度保守的,只有第12位和13位氨基酸是可以变化的,能够特异地 结合一个碱基序列,因此这两个氨基酸又被称为重复变异双残基(Repeat variant diresidue,RVD),最后的0.5个单元只含有前面的20个氨基酸;天然TALE蛋白的C端含有一 个核定位信号以及转录激活因子,能帮助TALE蛋白从细胞质进入细胞核同时发挥转录激活 作用。以水稻白叶枯病菌分泌的TALE-AvrXslO蛋白为例,它结合宿主细胞内19bp的DNA序列 需要17.5个单元,在天然的TALE蛋白中发现其5'端第一个碱基为T不需要TALE蛋白单元的 结合,最后一个碱基由最后的〇. 5个单元约20个氨基酸结合。
[0004] 2009年12月,Science第326期同时发表了两篇破解植物病毒分泌的TALES蛋白能 够特异识别碱基序列的机制,其中Moscou等完全采用生物信息学的方法得到了TALEs蛋白 识别碱基的规律,而Boch等则用实验手段破译了这一"密码"。他们发现TALEs蛋白中第12位 和13位氨基酸组合(天冬酰胺-异亮氨酸-NI )、(天冬酰胺-丙氨酸-NA)、(组氨酸-天冬氨酸-HD)、(天冬酰胺-甘氨酸-NG)可分别高效特异地识别碱基A、G、C、T,并提出将来可以像ZFNs 一样把它改造成为基因定点修饰的工具。2010年,明尼苏达大学Daniel Voytas教授领导的 实验室率先将TALE的DNA结合相关结构域与FokI的核酸酶结构域融合,优化二者间的连接 序列(1 inker ),获得了针对特定DNA序列具有特异切割活性的靶向核酸酶TALEN。此后,研究 人员以天然的TALEs蛋白为骨架,构建了针对人、大鼠、小鼠、斑马鱼等不同生物基因的 dTALES(design TALE),并跟FokI核酸内切酶、转录因子以及表观遗传修饰酶结合在一起实 现对不同物种基因组的定点修饰或调控。
[0005] TALENs的第二个组成部分为来自细菌的IIS型核酸内切酶FokI,当两个FokI发生 二聚化后就会发挥活性对DNA双链进行切割,细胞DNA损伤后会启动两种修复机制过程,一 种为末端非同源依赖的修复机制(NHEJ),另一种是依赖同源重组的修复机制(HDR)。当没有 外源的同源序列加入时,细胞就会启动NHEJ修复机制,将断开的DNA末端重新结合在一起, 但是这种修复机制是一种存在缺陷的修复过程,往往会引入新的突变,因此也就达到了进 行基因敲除的目的。如果此时加入外源的同源碱基序列就可以启动第二种修复机制HDR修 复,利用同源修复机制,可以帮助我们实现基因敲进和基因修复,但是如果外源的同源序列 是存在缺陷的,那么同样可以达到基因敲除的效果。
[0006] 利用TALEN技术进行基因组定向修饰一般包含1)根据目标基因寻找TALEN候选靶 位点;2)针对靶位点序列设计并构建TALE载体;3)与合适的FokI序列组装获得TALEN载体; 4)将完整的TALEN载体导入目的细胞;5)筛选定向修饰的克隆。为了保证TALEN的剪切特异 性,避免脱靶效应,TALEN作用的靶序列长度通常选择在15~20bp左右。这样,就要求TALE需 要含有至少15个重复的RVD单元,编码这个TALE的核苷酸长度就会大于1.5kb,并且序列的 重复性很强。因此在实际应用中,构建由重复RVD单元组装而成的,识别特定DNA序列的TALE 载体就成为该技术的关键步骤和难点。
[0007] 目前,已发展的TALEN组装方法主要有:基于PCR的Golden Gate克隆法(GG-PCR), 基于传统质粒载体的Golden Gate克隆法(GG-Vector),基于长粘性末端的LIC法,基于酶切 连接的连续克隆法,基于固相合成的高通量法等。其中,Cermak等报道的基于单个RVD质粒 载体文库的Golden Gate克隆法(GG-Vector)是TALEN设计和构建组装中使用最为广泛的技 术体系(Cermak T,Starker CG,Voytas DF.2015.Efficient design and assembly of custom TALENs using the Golden Gate platform.Methods Molecular Biology,1239: 133-159.Cermak T,Dolye EL,Christian M,et al.,2011.Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting.Nucleic Acids Res ,39: e82)。该方法根据RVD识别核苷酸的规律(NI-A,HD- C,NN-G,NG-T,NK-G)以及其在TALE蛋白中的所有可能位置,分别构建了包含50个RVD单 元模块的质粒载体、5个最末位RVD模块质粒载体、13个TALEN组装中间载体以及4个TALEN表 达骨架质粒载体的文库。该GG-Vector文库组装TALEN载体的原理是根据设计的靶序列核苷 酸组成,从文库中挑出所需的不同RVD单元载体,通过特定的II型内切酶酶切这些载体产生 多种--对应的、特异匹配的粘性末端对,一次同时连接8-10个RVD单元。
[0008] 在实际应用中,由于受到Golden Gate反应效率的限制,单次TALEN组装反应中RVD 单元的最大重复数目不能超过10个,因此为了组装出识另Ul5-20bp靶序列的TALEN载体,就 不得不分别组装两条长度小于10个RVD重复单元的TALE序列,再将他们通过Golden Gate法 连接起来。完整的TALEN组装流程不得不被拆分为2个独立的阶段,耗时在5个工作日左右。 这无疑增加了实验消耗、延长了构建周期,也极大的限制了 TALEN技术的高通量应用。

【发明内容】

[0009] 本发明针对现有GG-Vector TALEN组装方法的诸多不足,从头设计了"双RVD单元" (two-RVD unite)的TALEN组装策略。
[0010]本发明的技术方案是一种用于TALEN高效构建的双RVD单元模块库,包括分别独立 包装的144个双RVD单元模块、8个单RVD单元模块和24个末位RVD单元;
[0011 ]所述的144个双RVD单元模块用于识别任意组合的相邻的2个碱基;所述的8个单 RVD单元模块分为M08和M09两组,每组4个单RVD单元模块,M08用于靶序列为16bp时识别第 15位的碱基,M09组用于靶序列为18bp时识别第17位的碱基;
[0012] 所述的24个末位RVD单元分为左侧组和右侧组,每组12个,左侧组的末位RVD单元 3'端融合FokI异源二聚体的单体I,右侧组末位RVD单元模块3 '端融合FokI异源二聚体的单 体Π ;左侧组和右侧组分别包括识别15bp长度的靶序列第15位碱基的4个末位RVD单元,识 别16bp和17bp长度的靶序列第16位和第17位碱基的4个末位RVD单元,识别18bp和19bp长度 的靶序列第18位和19位碱基的4个末位RVD单元。
[0013] 进一步的,所述的双RVD单元模块、单RVD单元模块的两端根据识别碱基在靶序列 中的位点顺序设置首尾相连的粘性末端。
[0014] 进一步的,所述的双RVD单元模块和单RVD单元模块置于A/T克隆载体上。
[0015] 进一步的,所述的末位RVD单元构建到真核表达载体中,表达元件从5'到3'方向依 次包括CaMV35S启动子,核定位信号NLS及5'端TALE,ccdB毒素基因,末位RVD单元,和3 '端 TALE及FokI异源二聚体的单体I或单体Π 。
[0016] 具体的,所述的144个双RVD单元模块具有如SEQ ID No. 1~144所述的核苷酸序 列。
[0017] 具体的,所述的8个单RVD单元模块具有如SEQ ID No. 143~152所述的核苷酸序 列。
[0018] 具体的,所述的识别15bp长度的靶序列第15位碱基的4个末位RVD单元具有如SEQ ID No. 153~156所示的核苷酸序列;识别16bp和17bp长度的靶序列第16位和第17位碱基的 4个末位RVD单元具有如SEQ ID如.157~160所示的核苷酸序列;识别18&?和1%?长度的靶 序列第18位和19位碱基的4个末位RVD单元具有如SEQ ID No. 161~164所示的核苷酸序列。
[0019] 本发明还提供了采用所述模块库构建TALEN的方法,包括如下步骤:对一段目标序 列构建针对2个靶序列的表达载体,1个表达载体的末位RVD单元采用左侧组,另1个表达载 体的末位RVD单元采用右侧组;识别15、17、19bp长度靶序列的表达载体根据序列中碱基顺 序选取7、8、9个双RVD单元模块,和识别第15位、第17位、第19位碱基的末位RVD单元模块;识 另lJ16、18bp长度靶序列的表达载体根据序列中碱基顺序选取7、8个双RVD单元模块,识别第 15位、第17位碱基的单RVD单元模块,和识别第16位、第18位碱基的末位RVD单元模块;然后 通过Golden Gate克隆法一步合成。
[0020] 通过将相邻的两个单一 RVD单元模块串联,形成一个可识别两个核苷酸的双RVD单 元模块,同时在双RVD单元模块的两端设计可根据位点顺序首尾相连的粘性末端,最后将其 构建到合适的质粒载体上形成一个包含144个双RVD单元模块文库(图1)。双RVD单元模块根 据RVD识别核苷酸的规律以及所有可能的位置进行设计,如NI-NI双RVD单元模块可识别AA 核苷酸,当AA碱基位于靶序列第一二位时,其对应的双RVD单元模块载体即为D01-AA: NI-NI (D01-01-AA);当AA碱基位于靶序列第三四位时,其对应的RVD模块载体即为D02-AA:NI-NI (D02-01-AA);以此类推,所有可能的靶序列均可以简便的在144个双RVD单元文库中找到对 应的模块载体。
[0021 ]除了 144个双RVD单元模块外,该体系还包含了 8个单RVD单元模块(图2)。这些单 RVD单元模块只有一个RVD重复单元,用于靶序列为偶数长度时倒数第二位RVD构建。如构建 一个识别16bp靶序列的TALEN载体,前1~14bp根据核苷酸两两组合在144个双RVD单元文库 中挑选合适的7个载体,第15位的RVD就使用单RVD单元模块M08中的一个,再通过Golden Gate反应将这7个双RVD单元模块、1个单RVD单元模块与相应的末位RVD表达载体连接起来, 组装完成需要的16个RVD的TALEN表达载体。
[0022]为了便于双RVD单元模块组装到TALEN表达载体上,该体系还使用了 24个左侧和右 侧末位RVD表达载体(图3)。这些末位RVD表达载体使用植物组成型启动子CaMV 35S启动子, 以及Nos终止子调控基因的表达,其转录区域包含了 TALE蛋白N端和C端序列、识别靶序列最 后一位核苷酸的末位RVD重复序列、核定位信号NLS的序列、便于载体筛选的ccdB毒素基因 序列、以及用于剪切DNA的核酸酶FokI序列。不同的骨架表达载体适应于识别不同长度靶序 列的左侧和右侧TALEN的组装,完成组装的TALEN蛋白表达载体可以方便的通过农杆菌介导 或其他方法导入宿主细胞中。野生型FokI活性剪切结构域为同源二聚体结构,实际应用中, 为了降低非特异性剪切,常使用左右两个序列存在差异的FokI剪切结构域,便于在细胞内 翻译完成后形成异源二聚体。因此,在本申请中将二聚体的2个单体分别构建载体,含有每 一单体的表达载体针对目标序列中的同一靶序列或不同的靶序列。
[0023] 为了实现这种双RVD单元模块TALEN组装体系,通过人工合成的方式,全合成了 144 个双RVD单元的模块序列(SEQ ID No.l:D01-01-AA至SEQ ID N〇.144:D09-16-TT),并分别 构建到PUC57载体(购自金斯瑞公司)上,形成双RVD单元模块质粒载体文库。同样的,人工合 成了8个单体RVD单元的模块序列(SEQIDNo·143 :M08-01-A至SEQIDNo·152:M09-04-T), 也分别构建到PUC57载体上,形成单RVD单元模块质粒载体文库。此外,对zhang等报道的左 侧和右侧TALEN真核表达骨架载体pZHY500(EL)、pZHY501(ER)进行改造 (Zhang Y,Zhang F, Li X,et al.,2013. Transcription activator-like effector nucleases enable efficient plant genome engineering.Plant Physiology, 161:20-27·)。将植物组成型 启动子CaMV 35S启动子(SEQ ID No.165 35S P)和Nos终止子(SEQ ID No.l70Nos-T)通过 Fusion PCR的方法分别连入上述两个骨架载体中,用于调控核定位信号NLS及5'端TALE (SEQ ID No.l66NLS+5'TALE)、ccdB(SEQ ID No.l67ccdB)和3'端TALE及左侧Fok I(Seq No.168 3'TALE+Fok I-L)、3'端TALE及右侧Fok I(SEQ ID No.169 3'TALE+Fok I-R)的表 达。进一步将合成的24个末位RVD重复单元序列(Seq NO EL/R07-01_Last A至Seq NO EL/ R09-04-Last T)通过融合PCR分别连入上述左侧和右侧改造载体中,得到如图3所示的12个 左侧末位RVD-TALEN骨架表达载体和12个右侧末位RVD-TALEN骨架表达载体。
[0024] 对于靶序列长度大于19bp的TALEN组装来说,同样可以使用双RVD单元模块的载体 文库,只是由于GG反应中片段少于10个的限制,需要进行两步GG反应来完成组装构建。但是 在实际应用中,若单侧TALEN的长度为19bp,左右两侧TALEN的长度就达到了38bp,这样的靶 序列长度片段足以应付现有物种的基因组复杂程度,实现对特定靶位点的特异性识别和切 害J,避免脱靶现象产生。
[0025] 本发明的有益效果:本发明公布了一种基于Golden Gate克隆法,通过一次反应构 建TALEN表达载体的RVD单元模块库,该模块库可以靶向15~19bp任意DNA序列。基于这一双 RVD单元模块文库构建TALEN表达载体的方法,有效的简化了构建步骤、降低了实验消耗、提 高了组装效率,将构建耗时缩短至1个工作日。利用本发明的模块库可以大大优化TALEN组 装个过程并降低成本,方便快捷,花费较少,为TALEN技术的进一步推广应用提供了保证,并 为TALEN技术的高通量应用提供了基础骨架载体。
【附图说明】
[0026]图1双体RVD模块的基本载体(16X9= 144)的排列矩阵。144个双体RVD模块以9列 16行的方式分布,每列为双RVD所在的位置,每行为一个双RVD所对应的两个相邻核苷酸的 序列。图中列代表双RVD单元结合的2个碱基在靶序列中的位置,例如D01表示该双RVD单元 结合的2个碱基位于靶序列的第1、2位,D02表示该双RVD单元结合的2个碱基位于靶序列的 第3、4位,以此类推,D09表示该双RVD单元结合的2个碱基位于靶序列的第17、18位。图中行 代表双RVD单元结合的2个碱基序列以及识别2个碱基的氨基酸,例如AA :NI-NI中AA表示双 RVD单元结合的2个碱基序列为AA,NI-NI表示结合AA的氨基酸。如第一列第一行的载体为 D01-AA,表示位于该TALEN的第一二位碱基为AA时,其双RVD为NI-NI,对应序列为SEQ ID No. 1 :D01-AA;第四列第三行的载体为D04-AG,表示位于该TALEN的第七八位碱基为AG时,其 双RVD为NI-NN,对应序列为SEQ ID No · 51: D04-AG。CATG、GGAC、CCAG、TGTT、TGCA、CGGT、 6八八六、1^64、6(:1'(::双1^0单元模块两端首尾相连的粘性末端41-祖、冊-肋、1?-顺川1-如、 HD-NI、HD-HD、HD-NN、HD-NG、NN-NI、NN-HD、NN-NN、NN-NG、NG-NI、NG-HD、NG-NN、NG-NG :识别 连续两个不同核苷酸的双RVD对应DNA序列;Kan:卡那霉素抗性基因。
[0027] 图2单体RVD模块的基本载体(4\2 = 8)。8个单1^)模块以勵8列和]\?)9列两列4〇6丁 各一行共计四行的方式分布。M08列用于当靶序列长度为16时,倒数第二位(第15位)碱基的 相应RVD选择;M09列用于当靶序列长度为18时,倒数第二位(第17位)碱基的相应RVD选择。 如构建靶序列长16bp,且第15位为G的TALEN载体时,挑选的单体RVD模块即为M08-G,对应序 列为SEQ ID No. HTJOS-GAAAAJCGAjCTC:单RVD单元模块两端首尾相连的粘性末端; 、册、顺、呢:识别不同单核苷酸的1^0对应0嫩序列 ;1(&11:卡那霉素抗性基因。
[0028] 图3末位RVD的TALEN骨架表达载体(4X 3 X 2 = 24)。24个骨架表达载体分为左侧 (EL)和右侧(ER) TALEN两列,分别用于构建左侧TALEN载体和右侧TALEN载体时使用。每列 (侧)载体又根据不同长度靶序列末位RVD识别DNA碱基的不同分为12列,EL/ER07用于靶序 列长度为15bp时,EL/ER08用于靶序列长度为16bp和17bp时,EL/ER09用于靶序列长度为 18bp和19bp时。如构建靶序列长16bp,末位为G的TALEN左侧载体时,挑选的骨架表达载体即 为EL08-G,对应序列为SEQ ID N〇.159:EL/R08-Last GJ5S-P:植物组成型启动子CaMV 35S 启动子;NLS+5 ' TALE:核定位信号+TALE蛋白N端序列;CTAT、GAAA:粘性末端序列;ccdB:便于 载体筛选的ccdB毒素基因序列;Last-NI:末位RVD模块序列;3 ' TALE+Fokl-L/R: TALE蛋白C 端序列+用于剪切DNA的核酸酶FokI左侧/右侧序列;Nos-T: Nos终止子;Amp:氨苄青霉素抗 性基因。
[0029] 图4双RVD单元(two-RVD unite)基本载体库构建检测。A:以D04为例的双RVD单元 模块质粒载体PCR检测结果,1~16表示16个D04双RVD单元模块,Μ为分子量标记;B: 8个单体 RVD单元模块质粒载体PCR检测结果,1~4表示4个Μ08单RVD模块,5~6表示4个Μ09单RVD模 块,Μ为分子量标记;C:以4个EL09为例的末位RVD的TALEN骨架表达载体Aatll/Agel双酶切 检测结果,1~4表不4个EL09表达骨架载体,Μ为分子量标记。
[0030] 图5水稻OsDEPl基因的左侧TALEN表达载体示意图。35S-P:植物组成型启动子CaMV 35S启动子;NLS+5 ' TALE:核定位信号+TALE蛋白N端序列;OsDEPl-Left RVD Cluster:水稻 DEP1基因定向编辑序列对应的左侧RVD序列;3'TALE+FokI-L:TALE蛋白C端序列+用于剪切 DNA的核酸酶FokI左侧序列;N〇S-T:N〇S终止子;Amp:氨苄青霉素抗性基因;Ori:复制起始 子。
[0031] 图6水稻OsDEPl基因的右侧TALEN表达载体示意图。35S-P:植物组成型启动子CaMV 35S启动子;NLS+5 ' TALE:核定位信号+TALE蛋白N端序列;OsDEPl-Left RVD Cluster:水稻 DEP1基因定向编辑序列对应的左侧RVD序列;3'TALE+FokI-R:TALE蛋白C端序列+用于剪切 DNA的核酸酶FokI右侧序列;Nos-T: Nos终止子;Amp:氨苄青霉素抗性基因;Ori:复制起始 子。
[0032] 图7基于双RVD单元(two-RVD unite)文库策略的目标基因 TALEN表达载体构建及 检测。TAL-L01、TAL-R01为表2中OsDEP 1基因的两个TALEN表达载体PCR结果,TAL-L01的2#、 4#、5#、6#单菌落均扩增出了2000bp左右的目标条带(19RVD),TAL-R01的2#、3#、4#、5#、6#单 菌落均扩增出了 1700bp左右的目标条带(15RVD) ;TAL-L02、TAL-R02为表2中0sBADH2基因的 两个TALEN表达载体PCR结果,TAL-L02的2#、3#、4#、5#、6#单菌落均扩增出了 1900bp左右的 目标条带(17RVD) ;TAL-R02的6个单菌落均扩增出了 1800bp左右的目标条带(16RVD);说明4 个TALEN载体均构建成功。
[0033] 图8基于双RVD单元(two-RVD unite)文库策略的目标基因 TALEN表达载体活性评 价。通过原生质体瞬时表达,检测到不同TALEN载体的剪切活性从25%至55%,可以用于植 物的内源基因定向修饰。
【具体实施方式】
[0034]以下将通过具体的实施实例说明本发明,但这些具体的实施实例并不应被理解为 对本发明的限制,对某些细节进行修改仍然落入本发明的保护范围之内。
[0035]实施例1双RVD单元文库的基本载体构建及检测
[0036]通过人工合成的方式(委托金斯瑞生物科技有限公司合成),全合成了 144个双RVD 单元的模块序列(SEQ ID No.lDOl-AA至SEQ ID NO.144D09-TT),并分别构建到pUC57载体 (购自金斯瑞公司)上,形成双RVD单元模块质粒载体(图1)。将一系列质粒载体通过热激法 分别导入大肠杆菌DH5a菌株中,得到双RVD单元模块文库,并通过菌落PCR的方法扩增每个 质粒的双RVD单元区域,验证该文库的准确性。现以D04列的D04-AA至D04-TT 16个载体为 例,介绍其验证方法。以D04-AA菌液为模板,相应的寡聚核苷酸M13F和M13R为上下游引物, 建立如下PCR体系 :10XTaqbuffer5μL、dNTPMixture(10mM)5μL、M13F(SEQIDNo·171)(10 yM)lyL、M13R(SEQ ID No.172)(10yM)lyL、D04-AAlyL、TaqlyL、ddH2036yL。
[0037] PCR反应条件为:预变性95°C,3min;变性94°C,20s;退火56°C,20s;延伸72°C,15s, 33个循环,延伸72°C,3min。验证其他15个载体的PCR体系和反应条件与此相同,仅有质粒模 板和上下游引物不同。所得PCR结果电泳如图4A所示:泳道1~16分别为16个D04双RVD单元 模块,均扩增获得200bp左右的目标条带,与预期相符,说明D04的16个双RVD单元模块质粒 载体构建成功。
[0038] 同样的,人工合成(委托金斯瑞生物科技有限公司合成)了8个单体RVD单元的模块 序列(SEQ ID N〇.145M08-A至Seq N〇.152M09-T),也分别构建到pUC57载体上,形成单RVD单 元模块质粒载体文库(图2)。将这8个单RVD模块质粒载体通过热激法分别导入大肠杆菌 DH5a菌株中,得到单RVD模块文库,并通过菌落PCR的方法扩增每个质粒的单RVD区域,验证 该文库的准确性。PCR体系和反应条件与双RVD单元模块的相同,仅有菌液模板不同(引物同 上M13F和M13R)。所得PCR结果电泳如图4B所示:泳道1~4表示4个M08单RVD模块,5~6表示4 个M09单RVD模块,均扩增获得lOObp左右的目标条带,与预期相符,说明M08和M09的8个单 RVD模块质粒载体构建成功。
[0039] 为了构建24个末位RVD的TALEN骨架表达载体,对Zhang等报道的左侧和右侧TALEN 真核表达骨架载体pZHY500(EL)、pZHY501(ER)进行改造。将植物组成型启动子CaMV 35S启 动子(SEQ ID No.l6535S P)和Nos终止子(SEQ ID No.l70Nos-T)通过融合PCR的方法分别 连入上述两个骨架载体中,用于调控核定位信号NLS及5'端TALE(SEQ ID N0.166NLS+5' TALE)、ccdB(SEQ ID No.l67ccdB)和3'端TALE及左侧Fok I(SEQ ID Νο·168 3'TALE+Fok I-L)、3'端TALE及右侧Fok I(SEQ ID No.169 3'TALE+Fok I-R)的表达。进一步将合成的 12 个末位RVD重复单元序列(合成的末位RVD为12个,在对应的左侧骨架和右侧骨架载体中这 部分序列是完全一致的,只是连接的FokI不同)(SEQ ID N〇.153EL/R07-Last A至SEQ ID No. 164EL/R09-Last T)通过融合PCR分别连入上述左侧和右侧改造载体中,得到如图3所示 的12个左侧末位RVD-TALEN骨架表达载体和12个右侧末位RVD-TALEN骨架表达载体。融合 PCR的反应体系如下:10XK0Dbuffer5μL,dNTPMixture(10mM)5μL,PrimerF(SEQID No.l73、SEQIDNo.l74SSEQIDNo.l75)(10yM)lyL,PrimerR(SEQIDNo.l76)(10yM)ly 1^,口2册500化1^)/^2!^501化1〇1以1^,1(001以1^,(1(1!12〇36以匕?0?反应条件为:预变性95°(:,311^11 ; 变性 94°C,20s;退火 56°C,20s;延伸 68°C,15s,33 个循环,延伸 68°C,3min。
[0040] 为验证构建的骨架表达载体是否正确,通过Aatll/Agel (均为Thermo Scientif ic.Fermentas快酶)双酶切进行验证。以EL09的4个载体为例,建立酶切体系如下: lOXFast Digest 1311打61541^,厶&1:11]^1^,厶861]^1^,质粒(卩1&81111(1)0嫩2〇41^,(1(1!12〇234匕 经37°C酶切30min后,电泳结果如图4C所示,4个EL09骨架表达载体均切出一条约4000bp左 右的TALEN表达框目的带,与预期相符,说明EL和ER的24个末位RVD骨架表达载体构建成功。 [0041 ] 上述PCR反应所用试剂均为东洋纺(上海)生物科技有限公司KOD-Plus-Neo试剂 盒。
[0042]实施例2基于双RVD单元模块组装TALEN的方法及规则
[0043] 应用双RVD单元模块组织TALEN时,先选定靶序列(长度一般在15~20bp),然后设 计相应的RVD,再从双RVD单元模块库、单RVD模块库、以及末位RVD骨架表达载体中选出适当 的文库载体,根据Golden Gate反应进行构建即可。
[0044]双RVD单元模块根据RVD识别核苷酸的规律以及所有可能的位置进行设计,如NI-NI双RVD单元可识别AA核苷酸,当AA碱基位于靶序列第一二位时,其对应的RVD模块载体即 为D01-AA:NI-NI(D01-01-AA);当AA碱基位于靶序列第三四位时,其对应的RVD模块载体即 为D02-AA:NI-NI(D02-01-AA);以此类推,所有可能的靶序列均可以简便的在144个双RVD单 元文库中找到对应的模块载体。而单RVD单元模块只有一个RVD重复单元,用于靶序列为偶 数长度时倒数第二位RVD构建。如构建一个识别16bp靶序列的TALEN载体,前1~14bp根据核 苷酸两两组合在144个双RVD单元文库中挑选合适的7个载体,第15位的RVD就使用单体RVD 单元模块M08中的一个,再通过GG反应将这7个双体载体、1个单体载体与相应的末位RVD表 达载体连接起来,组装完成需要的16个RVD的TALEN表达载体。
[0045] 表1列出了不同长度靶序列相应的RVD模块选择规则,如组装一对均识别15bp靶序 列的TALEN,需要根据DNA序列碱基组成不同,在双RVD单元模块文库中挑选D01至D07列的相 应质粒载体,由于骨架表达载体已含有末位RVD,故不需要在单RVD单元模块中挑选载体,选 用相应的左侧和右侧末位骨架表达载体,就可以组装出完整的左侧和右侧15个RVD的TALEN 载体。
[0046] 表1基于双RVD单元模块的TALEN组装规则
[0047]
[0048] 同样的若组装一对识别16bp靶序列的TALEN,根据DNA序列碱基组成不同,除了选 择双RVD单元模块文库中D01至D07列的相应质粒载体外,还需要根据第15位核苷酸在单RVD 单元模块中挑选一个相应的M08载体,加上相应的左侧和右侧末位RVD骨架表达载体,就可 以组装出完整的左侧和右侧16个RVD的TALEN载体。
[0049] 对于靶序列长度17~19bp的TALEN组装规则和前面15bp、16bp是类似的,仅仅是双 RVD单元模块的质粒数量逐一增加。
[0050] 对于靶序列长度大于19bp的TALEN组装来说,同样可以使用双RVD单元模块的载体 文库,只是由于GG反应中片段少于10个的限制,需要进行两步GG反应来完成组装构建。但是 在实际应用中,若单侧TALEN的长度为19bp,左右两侧TALEN的长度就达到了38bp,这样的靶 序列长度片段足以应付现有物种的基因组复杂程度,实现对特定靶位点的特异性识别和切 害J,避免脱靶现象产生。
[0051] 实施例3基于双RVD单元模块的植物内源基因定向修饰TALEN载体的组装及活性检 测
[0052] 1、植物内源基因定向修饰TALEN载体的设计与组装
[0053]为检验利用双RVD单元模块对植物内源基因进行定向剪切和突变的效率,选择了 水稻品种日本晴的0sDEPl(GenBank NO. :FJ039904)、0sBADH2(GenBank NO. :KT993490)、 0sCKX2(GenBank NO. :AB205193)基因以及小麦的TaML0(GenBank NO. :KF009556)基因作为 目标基因,分别设计了4对TALEN对其相应的DNA靶序列进行特异剪切。目标基因名称,革巴位 点DNA序列(SEQ ID吣.177~184)、对应的了41^~名称、1^0数目、1^0序列,以及在双1^0单元 文库中应该选用的相应双体、单体和末位RVD质粒载体编号均在表2中列出。
[0054] 表2基于双RVD单元模块组装策略的目标基因 TALEN表达载体构建情况 [0055]
[0056] 2、内源目标基因的TALEN载体构建及活性检测
[0057]以 OsDEP 1 基因的TAL-L01 (图 5)、TAL-R01 (图 6),及0sBADH2基因的TAL-L02、TAL-R02四个TALEN载体的构建为例。基于上述TALEN设计和组装策略,参考Cermak等的方法 (Cermak T,Dolye EL,Christian M,et al.,2011.Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting.Nucleic Acids Res,39:e82),通过Golden Gate反应将不同的RVD与末位RVD及 骨架表达载体连接起来。连接产物经热激法导入大肠杆菌DH5a中,铺平板过夜培养。分别挑 选6个单克隆进行菌落PCR检测,结果如图5所示:TAL-L01表达载体的2#、4#、5#、6#单菌落均 扩增出了2000bp左右的目标条带(19RVD);TAL-R01表达载体的2#、3#、4#、5#、6#单菌落均扩 增出了 1700bp左右的目标条带(15RVD);TAL-L02表达载体的2#、3#、4#、5#、6#单菌落均扩增 出了 1900bp左右的目标条带(17RVD);TAL-R02表达载体的6个单菌落均扩增出了 1800bp左 右的目标条带(16RVD)。以上结果表明4个TALEN表达载体均构建成功。
[0058] 其余两个基因 0sCKX2、TaML0的TALEN构建方法与此相同,并同样经过菌落PCR检 测,证明相应的TAL-L03、TAL-R03和TAL-L04、TAL-R04均构建成功。
[0059] 为了验证构建的TALEN载体剪切活性,将每2个载体(一个是末位RVD是左侧组,一 个末位RVD是右侧组)作为一组导入原生质体细胞中,经2天黑暗培养后,在荧光显微镜下波 长450~490nm的蓝光激发后观察细胞的GFP荧光,统计荧光细胞比例,得到上述8个TALEN载 体的特异剪切活性结果如图6所示。8个TALEN载体均表现出来TALEN剪切活性,其活性水平 从25%至55%不等,表明上述TALEN载体均可以用于下一步的植物定向修饰研究中。
【主权项】
1. 一种用于TALEN高效构建的双RVD单元模块库,其特征在于:包括分别独立包装的144 个双RVD单元模块、8个单RVD单元模块和24个末位RVD单元; 所述的144个双RVD单元模块用于识别任意组合的相邻的2个碱基;所述的8个单RVD单 元模块分为M08和M09两组,每组4个单RVD单元模块,M08用于靶序列为16bp时识别第15位的 碱基,M09组用于靶序列为I Sbp时识别第17位的碱基; 所述的24个末位RVD单元分为左侧组和右侧组,每组12个,左侧组的末位RVD单元3 '端 融合FokI异源二聚体的单体I,右侧组末位RVD单元模块3'端融合FokI异源二聚体的单体 Π ;左侧组和右侧组分别包括识别15bp长度的靶序列第15位碱基的4个末位RVD单元,识别 16bp和17bp长度的靶序列第16位和第17位碱基的4个末位RVD单元,识别18bp和19bp长度的 靶序列第18位和19位碱基的4个末位RVD单元。2. 如权利要求1所述的用于TALEN高效构建的双RVD单元模块库,其特征在于:所述的双 RVD单元模块、单RVD单元模块的两端根据识别碱基在靶序列中的位点顺序设置首尾相连的 粘性末端。3. 如权利要求1或2所述的用于TALEN高效构建的双RVD单元模块库,其特征在于:所述 的双RVD单元模块和单RVD单元模块分别置于A/T克隆载体上。4. 如权利要求1~3任一项所述的用于TALEN高效构建的双RVD单元模块库,其特征在 于:所述的末位RVD单元构建到真核表达载体中,表达元件从5'到3'方向依次包括CaMV35S 启动子,核定位信号NLS及5 '端TALE,ccdB毒素基因,末位RVD单元,和3 '端TALE及FokI异源 二聚体的单体I或单体Π 。5. 如权利要求1~4任一项所述的用于TALEN高效构建的双RVD单元模块库,其特征在 于:所述的144个双RVD单元模块具有如SEQ ID No. 1~144所述的核苷酸序列。6. 如权利要求1~5任一项所述的用于TALEN高效构建的双RVD单元模块库,其特征在 于:所述的8个单RVD单元模块具有如SEQ ID No. 143~152所述的核苷酸序列。7. 如权利要求1~6任一项所述的用于TALEN高效构建的双RVD单元模块库,其特征在 于:所述的识别15bp长度的靶序列第15位碱基的4个末位RVD单元具有如SEQ ID No. 153~ 156所示的核苷酸序列;识别16bp和17bp长度的靶序列第16位和第17位碱基的4个末位RVD 单元具有如SEQ ID No. 157~160所示的核苷酸序列;识别ISbp和19bp长度的靶序列第18位 和19位碱基的4个末位RVD单元具有如SEQ ID No. 161~164所示的核苷酸序列。8. 采用权利要求1~7所述模块库构建TALEN的方法,其特征在于:包括如下步骤:对一 段目标序列构建针对2个靶序列的表达载体,1个表达载体的末位RVD单元采用左侧组,另1 个表达载体的末位RVD单元采用右侧组;识别15、17、19bp长度靶序列的表达载体根据序列 中碱基顺序选取7、8、9个双RVD单元模块,和识别第15位、第17位、第19位碱基的末位RVD单 元模块;识别16、18bp长度靶序列的表达载体根据序列中碱基顺序选取7、8个双RVD单元模 块,识别第15位、第17位碱基的单RVD单元模块,和识别第16位、第18位碱基的末位RVD单元 模块;然后通过Golden Gate克隆法一步合成。
【文档编号】C12N15/113GK105950623SQ201610341638
【公开日】2016年9月21日
【申请日】2016年5月19日
【发明人】郑雪莲, 张勇, 邓科君, 仲昭辉
【申请人】电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1