一种dna文库及构建转录激活子样效应因子核酸酶质粒的方法

文档序号:3285484阅读:491来源:国知局
一种dna文库及构建转录激活子样效应因子核酸酶质粒的方法
【专利摘要】本发明公开了一种DNA文库及构建转录激活子样效应因子核酸酶质粒的方法,一种Tale连接单元库包括16组×n个双碱基识别模块和4组×m个单碱基识别模块,每个双碱基识别模块或单碱基识别模块两末端均有经二类限制性内切酶酶切形成第一粘性末端和第二粘性末端;DNA库包括与Tale连接单元库的连接单元数量相同的质粒,每个质粒包含一个碱基序列互异的连接单元,连接单元两末端与原始载体连接处有Bsa?I酶切位点。采用本发明的DNA库用于构建转录激活子样效应因子核酸酶质粒,识别模块的酶切和连接能在一个反应中进行,可实现一步将12-19个识别模块连接起来,速度快,效率高,操作简单,材料易于保存,成本低。
【专利说明】一种DNA文库及构建转录激活子样效应因子核酸酶质粒的方法
【技术领域】
[0001]本发明涉及基因工程领域,尤其涉及一种Tale连接单元库、包含该Tale连接单元库中所有Tale连接单元的DNA文库以及构建转录激活子样效应因子核酸酶质粒的方法。
【背景技术】
[0002]按照人类的意愿对基因组进行定向靶向修饰一直是许多科学家的梦想。在内源的基因组上特异地删除或加入我们需要的序列,一方面可以构建出各种动物模型用于生物学基础研究和疾病机理研究,另一方面可以生产动物反应器用以廉价生产我们需要的又很难从其他途径得到的生物组分。人们一直没有找到简单高效的方法对基因组进行基因组靶向修饰。传统的基因打靶技术依赖于细胞内自然发生的同源染色体随机交换,其打靶效率非常低,通常只有10_6-10_8,这种打靶方法只在小鼠中得到了广泛了应用,而在其他模式动物及大型哺乳动物中都因效率太低而得不到广泛应用。
[0003]2009年两个研究组发现植物病原体Xanthomonas中的一种可以调节植物基因表达的转录激活子样效应因子(transcription activator-like effector, TALE)表现出DNA结合特异性,而其识别密码具有模块化和简单化的特点,为科学家们开发出更简易的新型基因组祀向修饰技术带来了新希望。
[0004]TALE与Fokl融合后即形成转录激活子样效应因子核酸酶(transcriptionactivator-like effector nucleases, TALEN)。TALEs 由数十个特异性识别 DNA 的串联“蛋白模块”和两侧的N-末端及C-末端序列组成。每个“蛋白模块”包含34个氨基酸,第12和13位残基是祀向识别的关键位点,被称作重复可变的d1-residues (RVDs)位点。
[0005]实践中,TALEN技术大大提高了基因打靶效率,应用范围和可操作性,但如何把十几个高度重复的DNA的识别模块组装起来成为了 TALEN广泛应用的一个限制因素。研究者们在怎样制作TALEN做出了各种各样的努力。有的采用化学合成的方法,有的采用两步分子克隆的方法,也有的采用一步分子克隆的方法。但都有各自的缺陷,因为需合成的DNA高度重复的序列化学合成非常困难,成本也非常高;两步法因为需两步连接所以材料成本、时间成本、测序成本都较高;现在公开的唯一一个可一步连接的方法最多只能连接14个识别模块,而自然界中常见的识别模块的长度为12-23,在实际应用中很多情况需要大于14个识别模块的TALEN,14个片段长度的限制不止影响此种方法应用,而且不利于TALEN特异性的提高,并且因其需要酶切,纯化,再连接造成操作繁琐,工艺流程复杂,酶切纯化后的DNA保存困难,特别是单链的尾巴容易降解。
[0006]以前有研究者用单模块连接TALEN,如连接18个识别模块,一个反应连接18个片段难度非常大,世界范围内还没有人能实现;以前也有建立在双模炔基础上的研究,但其只能连接14个识别模块。

【发明内容】
[0007]本发明提供了一种转录激活子样效应因子(Tale)连接单元库,利用该连接单元库可以连接14个以上的识别模块。
[0008]一种转录激活子样效应因子连接单元库,包括16组Xn个双碱基识别模块和4组Xm个单碱基识别模块,每个双碱基识别模块或单碱基识别模块两末端均有经二类限制性内切酶酶切形成第一粘性末端和第二粘性末端,η表示每组双碱基识别模块的数量,m表示每组单碱基识别模块的数量;m ≤ η ;
[0009]在同一组双碱基识别模块中,第i个双碱基识别模块的第二粘性末端与第i+Ι个双喊基识别I吴块的第一粘性末端互补;两组双喊基识别|吴块的粘性末端喊基序列对应相同,I ( i ( η-l ;
[0010]在同一组单碱基识别模块中,第j个单碱基识别模块的第二粘性末端与第j+i个单碱基识别模块的第一粘性末端互补;一组单碱基识别模块的全部单碱基识别模块的粘性末端碱基序列与一组双碱基识别模块的部分或全部双碱基识别模块的粘性末端碱基序列
对应相同,两组单碱基识别模块的粘性末端碱基序列对应相同,I ≤ j ≤m-lo
[0011 ] 本发明相当于对连接单元进行编号,双碱基识别模块为1.....1.....η,单碱基识
别模块为 1、...、j、...、m。
[0012]其中二类限制性内切酶(typeIIs enzyme),可以是Bsa 1、BsmBl、BsmAl、Bbsl 等,优选为Bsa I。
[0013]单个连接单元的结构如图5所示,粘性末端有4个碱基,沿5’ -3’方向,正义链的第2~4个碱基编码亮氨酸,正义链的第I个碱基为甘氨酸密码子的最后一个碱基,正义链的最后两个碱基为甘氨酸密码子的前两个碱基,反义链的第I~3个碱基的互补序列编码
亮氨酸。
[0014]当η大于等于7时,可以连接14个以上的识别模块,而当η等于9,m等于7时,最多可以连接19个识别模块。
[0015]本发明所述的单碱基识别模块是指该Tale连接单元编码的氨基酸能够识别碱基A、T、C、G0所述的双碱基识别模块是指Tale连接单元编码的氨基酸能够识别AA、AT、AC、AG、TT、TA、TC、TG、CC、CA、CT、CG、GG、GA、GT、GC。同一组的双碱基识别模块或单碱基识别模块识别同一对碱基或同一个碱基。
[0016]由于连接单元本身无法进行很好的保存和扩增,因此将连接单元插入相应的原始载体当中,构成环状结构,以便于保存和扩增。
[0017]本发明还提供了一种DNA文库,包括数量与权利要求1~6任一所述的转录激活子样效应因子连接单元库的连接单元数量相同的DNA片段,每个DNA片段包含一个碱基序列互异的连接单元,连接单元两末端与DNA片段的其余部分连接处有二类限制性内切酶酶切位点。也就是说,利用二类限制性内切酶(type IIs enzyme)对DNA片段进行酶切,就可以得到所述的Tale连接单元。
[0018]所述的DNA片段可以是重组质粒,也可以是PCR扩增产物,当选择为重组质粒时,原始载体可以是PMD18-T载体、topo、pucl9、或pucl8。
[0019]本发明又提供了一种构建转录激活子样效应因子核酸酶质粒的方法,包括:
[0020](I)根据目的基因的靶序列确定识别模块,从所述的DNA文库中选取各识别模块对应的DNA片段;[0021](2)在同一体系内,采用二类限制性内切酶和DNA连接酶将各DNA片段中连接单元连接入带有DNA切割蛋白以及转录激活子样效应因子氨基酸序列框架N端和C端的载体中;
[0022](3)用消化线性DNA的酶进行消化处理,得到转录激活子样效应因子核酸酶质粒。
[0023]该方法中,各识别模块之间能够顺序连接;同时,识别模块之间、识别模块与载体之间一旦连接上,就无法被二类限制性内切酶(type IIs enzyme)再切开,所以把几个片断和载体放在同一体系里,用二类限制性内切酶(type IIs enzyme)和DNA连接酶边切边连,即可一步把TALEN连接成功。
[0024]步骤(2)中,所述二类限制性内切酶(type IIs enzyme)可以为Bsa I。
[0025]所述的DNA连接酶可以为T4连接酶。
[0026]以20 μ L连接体系计为:载体:40-200ng ;识别模块:20_200ng/识别模块;二类限制性内切酶:0.5-2 μ L ;DNA连接酶:0.5_2ul μ L ;DNA连接酶缓冲液:2 μ L ;双蒸水:补足M 20 μ Lo
[0027]连接程序优选为:37°C5min ;16°C IOmin, 15 个循环;80°C,lOmin。
[0028]所述的带有DNA切割蛋白以及转录激活子样效应因子氨基酸序列框架N端和C端的载体(TALEN载体)的碱基序列可以如SEQ ID N0.41或42所示。
[0029]TALEN载体预先经二类限制性内切酶酶切,酶切产生的两个粘性末端分别与第I个双碱基识别模块或单碱基识别模块的第一粘性末端以及第i个双碱基识别模块或第j个单碱基识别模块的第二粘性末端互补。
[0030]步骤(3)中,所述的消化线性质粒的质粒酶可以为Plasmid-Safe核酸酶。因为连接时会有连接不完全现象,只连接上部分片段,这种连接不完全的线性DNA会通过重组的方式降低连接的效率,因此,在转化之前用可以消化线性DNA的酶Plasmid-Safe?ATP-Dependent DNase (Epicentre,货号:E3105K)进行消化处理,可以消化线性DNA,提高连接效率。
[0031]本发明以20个识别模块为基础,通过设计合适的引物,可以构建得到含有172个连接单元(含有能识别一个或两个碱基的识别模块、二类限制性内切酶位点)的DNA文库;通过该DNA文库,可以把识别模块的酶切和连接放在一个反应中进行,避免了识别模块酶切后的纯化、再连接步骤,提高了生产效率,改进了生产工艺,可以实现一步将12-19个识别模块快速连接起来,得到连接转录激活子样效应因子核酸酶(TALEN)质粒。
[0032]本发明方法使用的识别单元是质粒或质粒的PCR产物,避免了保存酶切产物中遇到的末端单链尾巴破坏和降解的问题,且操作步骤更简单,更节约成本。
【专利附图】

【附图说明】
[0033]图1为包含172个识别单元的DNA文库示意图;
[0034]图2 为最终载体 pEFla-NLS-TALE backbone-Fokl (R) -pA 示意图;
[0035]图 3 为最终载体 pEF la-NLS-TALE backbone-Fokl (L) -1RES-PURO-ρΑ 示意图;
[0036]图4为19个识别模块连接时的连接步骤示意图;
[0037]图5为本发明连接单元的结构示意图。
[0038]图6为不同数量的识别碱基的相应单双模的选择块示意图;[0039]图7为实施例2中的电泳图;其中,中间为Ikb的DNA Marker,marker左面为连接二的酶切图,右面为连接一的酶切图;
【具体实施方式】
[0040]以下实施例中所使用的技术,包括PCR扩增与检测、细胞转染等分子生物学技术,以及细胞培养、检测技术等,除非特别说明,均为本领域内的技术人员已知的常规技术;所使用的仪器设备、试剂和细胞系等,除非是本说明书特别注明,均为一般本领域的研究和技术人员可以通过公共途径获得的。
[0041]实施例1TALENs识别模块之间的连接及重组载体的构建
[0042]1、20个识别模块(modular)的获得
[0043](I)合成分别识别4个单碱基A、T、C、G以及16个双碱基AA、AT、AC、AG、TA、TT、TC、TG、CA、CT、CC、CG、GA、GT、GC、GG 的 20 个识别模块 N1、NG、HD、NN、N1-N1、N1-NG、NI_HD、N1-NN、NG-N1、NG-NG、NG-HD、NG-NN、HD-N1、HD-NG、HD-HD、HD-NN、NN-N1、NN-NG、NN-HD、NN-NN,序列见表1,分别如SEQ ID NO:1_20所示。
[0044]表1
[0045]
【权利要求】
1.一种转录激活子样效应因子连接单元库,其特征在于,包括16组Xn个双碱基识别模块和4组Xm个单碱基识别模块,每个双碱基识别模块或单碱基识别模块两末端均有经二类限制性内切酶酶切形成第一粘性末端和第二粘性末端,η表示每组双碱基识别模块的数量,m表示每组单碱基识别模块的数量;m、η为自然数,且m≤η ; 在同一组双碱基识别模块中,第i个双碱基识别模块的第二粘性末端与第i+Ι个双碱基识别1吴块的第一粘性末端互补;两组双喊基识别1吴块的粘性末端喊基序列对应相同,I < i < η-1 ; 在同一组单碱基识别模块中,第j个单碱基识别模块的第二粘性末端与第j+Ι个单碱基识别模块的第一粘性末端互补;一组单碱基识别模块的全部单碱基识别模块的粘性末端碱基序列与一组双碱基识别模块的部分或全部双碱基识别模块的粘性末端碱基序列一一对应相同,两组单碱基识别模块的粘性末端碱基序列一一对应相同,I < j ≤m-10
2.如权利要求1所述的转录激活子样效应因子连接单元库,其特征在于,所述二类限制性内切酶为Bsa I。
3.如权利要求1所述的转录激活子样效应因子连接单元库,其特征在于,6< η < 7。
4.如权利要求1所述的转录激活子样效应因子连接单元库,其特征在于,η大于7。
5.如权利要求4所述的转录激活子样效应因子连接单元库,其特征在于,η= 9, m =7。
6.一种DNA文库,其特征在于,包括数量与权利要求1~5任一所述的转录激活子样效应因子连接单元库的连接单元数量相同的DNA片段,每个DNA片段包含一个碱基序列互异的连接单元,连接单元两末端与DNA片段的其余部分连接处有二类限制性内切酶酶切位点。
7.如权利要求6所述的DNA文库,其特征在于,所述DNA片段为重组质粒或PCR扩增产物。
8.如权利要求7所述的DNA文库,其特征在于,所述重组质粒的原始载体为PMD18-T载体。
9.一种构建转录激活子样效应因子核酸酶质粒的方法,包括: (1)根据目的基因的靶序列确定识别模块,从如权利要求6所述的DNA文库中选取各识别模块对应的DNA片段; (2)在同一体系内,采用二类限制性内切酶和DNA连接酶将各DNA片段中连接单元连接入带有DNA切割蛋白基因以及转录激活子样效应因子氨基酸序列框架N端和C端的载体中; (3)用消化线性DNA的酶进行消化处理,得到转录激活子样效应因子核酸酶质粒。
10.如权利要求9所述的方法,其特征在于,步骤(2)中,所述的带有DNA切割蛋白以及转录激活子样效应因子氨基酸序列框架N端和C端的载体的碱基序列如SEQ ID N0.41或42所示。
11.如权利要求9所述的方法,其特征在于,步骤(2)中,以20μ L连接体系计为:载体:40-200ng ;识别模块:20-200ng/识别模块;二类限制性内切酶:0.5-2 μ L ;DNA连接酶:.0.5-2ul μ L ;DNA连接酶缓冲液:2 μ L ;双蒸水:补足至20 μ L。
【文档编号】C40B40/06GK103668470SQ201210336604
【公开日】2014年3月26日 申请日期:2012年9月12日 优先权日:2012年9月12日
【发明者】赵金龙, 吴昭 申请人:上海斯丹赛生物技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1