专利名称:二类内含子靶向整合真核细胞染色体基因组上的特定序列的制作方法
技术领域:
本发明属生物技术领域。具体涉及一种二类内含子靶向整合真核细胞染色体基因组上的特定序列的方法。
虽然DNA操作的手段日新月异,但如何使外源DNA序列高效靶向整合到哺乳动物细胞基因组却一直未能得到很好的解决。而如何使外源DNA高效靶向整合不仅是很多理想的基因治疗方案的关键因素,同时也是构建转基因动物等研究的一个瓶颈。虽然说,有一些病毒和一些整合酶可以介导外源DNA的整合,但是这些元件都有着各自的较难克服的缺点。比如说,逆转录病毒虽然能够整合,但只能随机整合,这样就可能引起一些原瘤基因的激活或其它不适当的基因改变,并产生意想不到的表型;再比如说腺相关病毒虽然是目前研究的一大热门,但是很难克服其包装容量小(Dong J.Y.,Human GeneTherapy 199672101-2112)、反向末端重复序列(Inverted TerminalRepeat Sequences)为启动子(Haberman R.P.,Jounal of Virology 2000;74(18)8732-8739)等问题,更不用说,它只能定点整合到人类19号染色体中,而不能靶向到其它目的序列中。至于其它一些较常用的整合酶却存在这样的问题不但在哺乳动物基因组中很难找到靶向整合所需的序列,而且,即使找到了,位点也很固定、整合的效率不高(Thyagarajan,B.,Gene 2000;24447-54)。因此如何找到一个高效靶向整合的元件是一个亟待解决的问题。无疑,具有自身剪接和靶向复位(retrohoming)性质的二类内含子(group II intron)(US Patent6,027,895;Guo,H.,Science 2000;289452-457)的研究结果令人们看到了新的希望。
最近,美国得克萨斯大学奥斯丁分校(University of Texas atAustin)的Lambowitz.Alan等人的研究表明一些二类内含子(如Ll.ltrB)可以介导外源DNA高效整合到细菌双链DNA,单链DNA或单链RNA中及真菌和一些人体细胞的外源的质粒DNA中(USPatent 6,027,895;Guo,H.,Science 2000;289452-457),但是并未证明二类内含子可以介导外源DNA高效整合到真核细胞染色体基因组,这可能与真核细胞染色体位于细胞核内,以及染色体的结构有关。如果想使二类内含子介导外源DNA序列靶向整合到真核细胞染色体基因组中,一方面,必须使蛋白质高效表达(如果想使该二类内含子所编码的蛋白质在胞内直接表达的话),另一方面必须使该蛋白质从胞浆到达核内;当然,如何检测其整合效率也是个问题。
本发明的目的在于解决上述问题,提供一种介导外源DNA靶向整合到真核细胞染色体上特定的DNA序列的方法。
本发明提供了一种二类内含子靶向整合真核细胞染色体基因组上的特定序列的方法。
本发明采用一种核苷酸整合酶,促使DNA靶向整合到真核细胞染色体特定序列的方法。这种核苷酸整合酶是由一种二类内含子RNA和这种二类内含子自身编码的蛋白质组成,这种二类内含子是乳酸乳球菌的二类内含子Ll.ltrB;这种蛋白质是LtrA。
该Ll.ltrB RNA具有能与DNA底物的一链的第一内含子RNA结合序列结合的第一杂交序列,还具有能与DNA底物的一链的第二内含子RNA结合序列结合的第二杂交序列。
蛋白质LtrA能够与底物识别位点上的第一序列元件的至少一个核苷酸结合,该LtrA能与Ll.ltrB RNA结合。这种核苷酸整合酶与底物反应,使核苷酸整合酶切割DNA底物第一链及二类内含子RNA插入切割位点。
本发明构建了一种报道型细胞株,这种细胞株含有与Ll.ltrB同源的序列E1E2,该E1E2序列由上面所说的第一内含子RNA结合序列及第二内含子RNA结合序列组成。为了便于检测整合及整合效率,在E1E2序列的下游插入绿色荧光蛋白EGFP(Enhanced GreenFluorescent Protein)报道基因。这个报道基因缺乏启动子。为了防止上游序列对EGFP表达的影响,在E1E2序列上游插入了绝缘子。
上述所说的绝缘子和E1E2及EGFP通过逆转录病毒介导整合到细胞株NIH3T3染色体基因组,由此构建了一种报道型细胞株。
为了证明所说的整合酶能够使二类内含子整合到底物序列E1E2中,构建了一个表达载体,该载体的二类内含子及LtrA是以PCMV作为启动子的,其中二类内含子的第四结构域的3’端插入一个启动子PSV40,其第四结构域的LtrA编码区的第40至第572氨基酸编码序列替换成苯丙氨酸密码子。二类内含子的上游序列是E1序列,下游序列是E2序列。
LtrA全序列是插入到E2序列下游的,为了使LtrA高表达,本发明根据宿主细胞嗜用密码子进行改码;为了促使LtrA进入细胞核内,在LtrA氨基端添加了核定位信号。
本发明的设计思想是,尽可能使NLtrA在NIH3T3细胞中高表达,并且尽可能促进其编码的蛋白合成后到达细胞核内。本发明涉及对NLtrA基因进行具体地设计,设计时采用了分子生物学三大核心数据库1.国际核酸序列数据库(Genbank/EMBL/DDBJ);2.瑞士蛋白质序列及注解数据库(Swiss-PROT);3.美国Brookhaven国家实验室提供的蛋白质及生物分子三维结构数据库(Protein Data Bank,PDB)。再采用多种计算机软件包(包括美国威斯康星大学GeneticComputer Group编制的GENESIS和PROSIS软件包、美国加州理工学院编制的Caltec软件包、瑞典Pharmacia公司提供的DNASIS和PROSIS软件包以及其它程序)进行多方面的辅助分析,在计算机图形工作站(SGIR4400)上进行NLtrA基因的全新设计,并考虑如下原则1.引入的核定位信号不影响NLtrA基因的功能域构型;2.NLtrA合成基因尽可能选用小鼠偏爱密码子,降低该基因罕用的密码子的比例。3.消除NLtrA合成基因内部出现的复杂的二级结构(包括重复结构、互补结构、发夹结构及大片段的反向回文结构)等;4.消除了NLtrA合成基因内部不适宜基因操作(部分限制性内切酶位点;同时在NLtrA基因内部从5’至3’方向依次插入了Bst98I、XhoI、SacI和BamHI四个酶切位点,使NLtrA相对均衡地分割成五大片段(见图),便于合成基因的拼接、克隆和组装;5.在NLtrA合成基因的内部尽量减少连续的G-C配对;6.在起始密码子处加上KOZAK序列;7.为了防止密码子通读,在终止密码子TGA后面添加了TAA。根据上述设计进行化学合成,所得到的NLtrA全长基因见
图1。
3.合成两端分别含有HindIII和NotI酶切位点的ΔltrB3(如图4所示);4.碱裂解法小量抽提pCAT-promoter vector(Promega)和pcDNA3.1/Hygro(+)(Invitrogen)回收纯化;5.分别用NheI-Csp45I、Csp45I-BglII、BglII-HindIII、HindIII-NotI、NheI-NotI酶切ΔltrB1、ΔltrB2、pCAT-promoter vector(可得到启动子PSV40(如图5所示))、ΔltrB3、pcDNA3.1/Hygro(+),酶切产物分别用3%琼脂糖凝胶电泳,用刀片切下含相应大小的DNA片段,再用Qiagen kit回收DNA片段。每个片段DNA分别用10-50ulTE溶解,使其浓度为10ng/ul。取上述DNA片段各2ul(ΔltrB1、ΔltrB2、pSV40、ΔltrB3、pcDNA3.1/Hygro(+)),0.2NNaCl 10ul,加热至75℃变性2min,然后在3小时逐渐退火到室温。加40ul溶液(含10×ligase buffer 6ul,ATP1umol,T4DNA ligase 10U,用灭菌双蒸水补足60ul体系),混匀后在12℃连接过夜。取上述连接液1ul来转化大肠杆菌HB101感受态宿主菌,随机挑取48个克隆,用碱裂解法快速抽提双链质粒DNA,用NheI和NotI酶切鉴定,结果获得8个含有相应大小插入序列的质粒,用所切割获得的序列作模板,在DNA全自动测序仪上进行序列分析。结果获得2个与设计的序列完全一致的序列。把该质粒命名为pcDNA3.1/ΔltrB;6.用NotI-XbaI酶切pcDNA3.1/ΔltrB和NLtrA,酶切产物分别用3%琼脂糖凝胶电泳,用刀片切下含相应大小的DNA片段,再用Qiagen kit回收DNA片段。每个片段DNA分别用10-50ulTE溶解,使其浓度为10ng/ul。取上述DNA片段各2ul,0.2N NaCl 10ul,加热至75℃变性2min,然后在3小时逐渐退火到室温。加40ul溶液(含10×ligase buffer 6ul,ATP1umol,T4DNA ligase 10U,用灭菌双蒸水补足60ul体系),混匀后在12℃连接过夜。取上述连接液1ul来转化大肠杆菌HB101感受态宿主菌,随机挑取24个克隆,用碱裂解法快速抽提双链质粒DNA,用NotI和XbaI酶切鉴定,结果获得6个含有相应大小插入序列的质粒,用所切割获得的序列作模板,在DNA全自动测序仪上进行序列分析。结果获得3个与设计的序列完全一致的序列。把该质粒命名为pcDNA3.1/ΔltrB/LtrA(如图7所示)。
和LtrB同源序列InE1E2(如图6所示),用BglII-AgeI酶切InE1E2和pEGFP-1(Clontech),用3%琼脂糖凝胶电泳,回收目的片段,用TE溶解使其浓度为10ng/ul。连接,转化,鉴定,获得pInE-EGFP-1。(2)以pInE-EGFP-1为模板,用上游引物5’CAGATCTGGGATTAATAGGGACAG3’和下游引物5′CATCgATgATTTggACAAACCACAACTAGAAT3’扩增,得到InE-EGFP-pA,回收纯化,,鉴定。用VspI-ClaI酶切质粒InE-EGFP-pA及pLNCX,回收纯化目的片段,连接,转化,测序鉴定,得到受体质粒pLNCXInE-EGFP(如图7所示)。
1.转染逆病毒载体(1)转染24小时前铺板5×105PT67包装细胞于100mm平皿中,所用培基为含有10%FBS的DMEM。于转染前2小时换上新鲜培基。
(2)每个平皿用标准的磷酸钙沉淀转染法转染质粒pLNCXInE-EGFPA,溶解转染试剂并使之升温至室温,充分混匀各成分;B,分别在两个tube中依次添加如下试剂(15ug DNA(23ul),415ulH2O,62ul 2CaCl2,0.5ml2×HBS)第一管,先混合DNA和水,然后加2MCaCl2,再次混匀;第二管,2×HBS。C,边震荡第二管,边逐滴添加第一管混合液,然后置于室温30min;D,在加入细胞前再次震荡转染液,添加转染混合液于培养皿中,旋转铺匀。
(3)转染12小时后,吸干培基,用2×PBS清洗,加上5ml含10%FBS的DMEM。
(4)转染后72小时,用G418筛选稳定生产病毒的细胞系所用的G418浓度为500ug/ml,筛选时间为7天。
2.确定病毒滴度(1)收集含有病毒的培基(2)添加聚季铵盐(终浓度4ug/ml),用0.45-um孔径过滤器过滤培基。(3)用含有病毒的培基感染NIH3T3(一天前接种NIH3T3细胞于6孔板,每孔细胞数为1×105,培基4ml)。用G418筛选,根据有限稀释法确定病毒滴度。选择30个高病毒滴度的生产细胞系PT67-LNCXInE-EGFP冻存。
3.加入终浓度为4ug/ml的聚季铵盐4.每隔12小时用收集的培基感染NIH3T3,连续两次。
5.用G418筛选(500ug/ml)10天获得稳定整合逆转录病毒LNCXInE-EGFP的NIH3T3即NIH3T3-InE-EGFP细胞系,冻存。
6.共转染供体质粒pcDNA3.1/ΔltrB/LtrA(以pcDNA3.1/ΔltrB作为对照质粒)在转染前24小时,接种约5×105NIH3T3-InE-EGFP于100-mm平皿中,用磷酸钙沉淀转染法转染15ug pcDNA3.1/ΔltrB/LtrA或pcDNA3.1/ΔltrB质粒。转染后12小时换液,转染后72小时用G418和潮酶素(200ug/ml)进行筛选。筛选7-10天,检测绿色荧光蛋白表达情况。结果,pcDNA3.1/ΔltrB对照组细胞没有荧光,而pcDNA3.1/ΔltrB/LtrA实验组大概有10%~52%的细胞有荧光显示。实施例六,分离及分析细胞DNA1.DNA分离(1)单细胞克隆显示荧光的细胞每个10-mm平皿接种一千个候选的共转染细胞,第一天,在平皿底下标记分散的单一细胞。第四天,分别挑取有荧光的和无荧光的细胞各10个集落,转入24孔板,加入0.5ml培基。重复上述步骤3次,直至每个孔,要么100%细胞发出荧光,要么100%细胞不发荧光。
(2)用标准方法抽提基因组DNA,溶解于TE。
2.PCR分析用标准的及巢式PCR方法分析基因组DNA。反应体系(终末反应体积用GibcoBRL PCR bufferTMPH8.4)如下50ng模板DNA;0.5uM上游和0.5uM下游引物;4种dNTPs各0.1mM(Phamacia);2.5单位Taq DNA多聚酶(GibcoBRL);MgCl2,如下所述;和30ul石蜡油。对于巢式反应,纯化用外引物(上游引物5’GAACACATCCATAACGTGCG3’;下游引物5’GAACTTCAGGGTCAGC TTGC3’)扩增得到的DNA产物,并重悬于20ul TE;取1ul外引物PCR产物作为内引物(上游引物5’AATCTTGCAAGGGTACGGAGTA3’;下游引物5’TATGAA TCACGTGACGAT GACA3’)PCR反应的DNA模板;纯化第二反应的PCR产物,凝胶电泳(如图八所示),测序证实。
3.Southern杂交把经HindIII限制性消化的基因组DNA产物凝胶电泳(1.0%凝胶,4小时)。凝胶变性,转移到尼龙膜(GeneScreenTM),置于标准的预杂交和杂交缓冲液。用上述内引物扩增得到的片段作为探针,于3.0%凝胶电泳,低熔点琼脂糖法回收,用随机引物标记法和[α-32P]dCTP标记探针。置杂交膜于2~3×106cpm32P-标记探针/ml杂交液24小时,随后用2×SSC于21℃清洗两次,每次10分钟,于1×SSC和0.1%×SDS,42℃清洗两次,每次30分钟。用0.2×SSC和0.5%SDS于55℃清洗15分钟,放射自显影(如图9杂交图所示),Lanel、2、3为实验组中发荧光的细胞,Lane4、5为实验组中不发荧光的细胞。Lane6为对照组细胞)。
本发明提供了一种介导外源DNA靶向整合到真核细胞染色体上特定的DNA序列的方法。该方法可应用于基因治疗,转基因动物等需要的DNA序列定向整合的研究与应用领域。并能解决目前这些领域中目的序列不能定向整合或整合效率低的问题。
权利要求
1.一种二类内含子靶向整合真核细胞染色体基因组上特定序列的方法,其特征在于该方法是采用核苷酸整合酶介导DNA序列靶向整合到真核细胞染色体基因组上特定DNA序列的方法。
2.根据权利要求1所述的一种二类内含子靶向整合真核细胞染色体基因组上特定序列的方法,其特征在于其中所述的核苷酸整合酶是由一种二类内含子RNA与该二类内含子编码的蛋白质组成。
3.根据权利要求1所述的一种二类内含子靶向整合真核细胞染色体基因组上特定序列的方法,其特征在于其中所述的二类内含子是乳酸乳球菌的二类内含子Ll.ltrB,所说的二类内含子编码的蛋白质是该Ll.ltrB编码的蛋白质LtrA。
4.根据权利要求3所述的二类内含子Ll.ltrB RNA和蛋白质LtrA,其特征在于二类内含子Ll.ltrB RNA和蛋白质LtrA能通过体外合成的方式,也能通过体内表达方式产生。
5.根据权利要求3所述的LtrA蛋白质,其特征在于LtrA蛋白质能添加核定位信号修饰。
6.根据权利要求1所述的一种二类内含子靶向整合真核细胞染色体基因组上特定序列的方法,其特征在于其中所述的二类内含子能添加插入启动子或表达盒子修饰。
7.根据权利要求1所述的一种二类内含子靶向整合真核细胞染色体基因组上特定序列的方法,其特征在于其中所述的Ll.ltrB RNA能根据所说的染色体基因组上选择的序列进行一些修饰,使之互补结合。
8.根据权利要求1所述的一种二类内含子靶向整合真核细胞染色体基因组上特定序列的方法,其特征在于其中所述的真核细胞染色体基因组上特定序列的二类内含子插入位点上游的第21个核苷酸为G、二类内含子插入位点下游的第5个核苷酸为T。
全文摘要
本发明涉及到一种整合酶介导DNA序列整合到真核细胞染色体基因组上所选择的位点的方法。该方法所用的整合酶是由乳酸乳球菌(Lactococcus lactis)的二类内含子L1.1trB的RNA与该二类内含子编码的蛋白质LtrA组成;经过一些修饰如添加核定位信号于LtrA的氨基端可以使该整合酶介导经过适当修饰了的二类内含子整合到真核细胞染色体基因组的所选定的位点。
文档编号C12N15/11GK1390934SQ0111340
公开日2003年1月15日 申请日期2001年6月8日 优先权日2001年6月8日
发明者李宗海 申请人:桂林华诺威基因药业有限公司, 李宗海