专利名称:一对转录激活子样效应因子核酸酶及其编码基因与应用的制作方法
技术领域:
本发明涉及基因工程领域,尤其涉及一对转录激活子样效应因子核酸酶及其编码基因与应用。
背景技术:
按照人类的意愿对基因组进行定向靶向修饰一直是许多科学家的梦想。在内源的基因组上特异地删除或加入我们需要的序列,一方面可以构建出各种动物模型用于生物学基础研究和疾病机理研究,另一方面可以生产动物反应器用以廉价生产我们需要的又很难从其他途径得到的生物组分。其中,利用大动物乳腺生产药用或保健用蛋白不仅有巨大的经济价值,同时还具有很大程度降低整体医疗成本等社会价值。大动物乳腺器原理是通过基因组靶向修饰技术把目的蛋白定点敲入到乳腺高效并特异表达的蛋白启动子后,通过该启动子在大动物的乳腺中大量并特异的表达高价值的目的蛋白。β乳球蛋白基因是制造乳腺反应器的主要目的基因,其表达量高,并具有很强的时空特异性,只会在成年的雌性动物的乳腺中表达。表达的产物只会分泌到乳腺中,便以收集和提纯。但人们一直没有找到简单高效的方法对基因组进行基因组靶向修饰。传统的基因打靶技术依赖于细胞内自然发生的同源染色体随机交换,其打靶效率非常低,通常只有 10-6-10-8,这种打靶方法只在小鼠中得到了广泛了应用,而在其他模式动物及大型哺乳动物中都因效率太低而得不到广泛应用。近年发展很快的序列特异的核酸酶可以用于精确的基因组靶向修饰。一般由序列特异的核酸酶由一个DNA识别结构域和一个非特异性核酸内切酶结构域构成。原理是首先由DNA识别域把核酸酶定位到需要编辑的基因组区域,然后非特异性核酸内切酶切断双链 DNA从而造成DNA双链断裂(double-strand break,DSB),引入的DSB激活的DNA自我修复可以引起基因的突变和促进该位点DNA同源重组。锌指核酸酶(Zinc-finger nucleases, ZFN)是现在研究最清楚也是应用最广的序列特异的核酸酶。其原理是两个锌指蛋白特异识别两段相隔5-7bp的DNA序列,并把与之融合表达的非特异性DNA切割蛋白R)kl的两个单聚体定位到了一起,DNA切割蛋白形成双聚体时可以切断该位置的双链DNA,从而造成 DSB。ZFN的出现使基因组靶向修饰技术向前迈进了一大步,然而,ZFN技术还存在靶向不确定性、效率低、拖把率高等问题,研究者很难自行设计出特异和高效的靶向基因组目的序列的锌指核酸酶仍然是制约ZFN广泛应用的瓶颈。而商业购买高效特异的锌指核酸酶又价格昂贵(20万人民币/基因),一般研究者或商业公司根本无法承受这笔费用。2009年两个研究组发现植物病原体Xanthomonas中的一种可以调节植物基因表达的转录激活子样效应因子(transcription activator-like effector,TALE)表现出DNA 结合特异性,而其识别密码具有模块化和简单化的特点,为科学家们开发出更简易的新型基因组靶向修饰技术带来了新希望。TALE与R)kl融合后即形成转录激活子样效应因子核酸酶(transcriptionactivator-like effector nucleases,TALEN)。TALEN 的打靶原理与 ZFN 相同,只是识别特异DNA的蛋白不同。TALEs由数十个特异性识别DNA的串联“蛋白模块”和两侧的N-末端及C-末端序列组成。每个“蛋白模块”包含34个氨基酸,第12和13位残基是靶向识别的关键位点,被称作重复可变的di-residUes(RVDs)位点。然而不同于每个锌指蛋白识别特异性的三联体碱基,TALEs上的每个RVDs仅能识别一个碱基。Sangamo BioSciences公司和哈佛大学的两个研究小组分别利用TALEs技术进行了基因组靶向修饰相关研究,两篇研究论文发表在同一期的《自然生物技术》(Nature Biotechnology)杂志上。Edward Rebar领导的研究小组将带有不同C-末端TALE的截短片段连接到核酸酶 FokI的催化结构域上。当研究人员将构建的TALENs靶向内源性的人类NTF3和CCR5基因时,证实TALENs能够特异性地对这些基因片段进行剪切。哈佛大学研究小组开发了一种基于分层连接的策略来构建包含12个重复模块的TALEs。他们在保留RVDs的基础上减少了每个模块的DNA序列,同时将剩余序列的重复性降到最低。进而通过12重PCR获得了带有特异性连接序列的单体,并将其克隆至包含TALE N-末端和C-末端序列的骨架载体中。为了构建TALE转录因子,研究人员又将TALE融合到一个转录因子的激活域。在接下来的靶向性检测中,研究人员证实其能特异地使四个检测内源基因中的两个基因表达上调。今年7月MIT的Rudolf Jaenisch小组也验证了 TALEN在人胚胎干细胞和人iPSC 中的打靶效果。其通过在五个位点的TALENs与之前其在相同位置的ZFNs的打靶效果作对比,得出五组TALENs在打靶效率和精确度上都与从Sangamo Biosciences公司购买的ZFNs 相似,进一步验证了 TALENs是非常好的基因组编辑工具。
发明内容
本发明提供了一对短肽,利用这对短肽构建获得的一对转录激活子样效应因子 (TALE)能够特异性地识别山羊或绵羊β乳球蛋白基因(BLG) eX0n2上的二段相邻核苷酸; 利用这对转录激活子样效应因子构建获得的一对转录激活子样效应因子核酸酶(TALEN), 能够对山羊或绵羊β乳球蛋白基因进行准确、高效地打靶。一对短肽,所述一对短肽分别具有如SEQ ID NO. 1和SEQ ID N0. 2所示的氨基酸序列。本发明提供了一对多核苷酸,所述一对多核苷酸分别编码上述的一对短肽。优选地,所述一对多核苷酸分别具有如SEQ ID N0. 3和SEQ ID N0. 4所示的碱基序列。其中,所述的多核苷酸由分别识别山羊或绵羊β乳球蛋白基因eXOn2上核苷酸序列SEQ ID NO 16和SEQ ID NO 20中相应碱基的TALENs识别模块依序连接而成,其中,识别碱基A的TALENs识别模块为NI-A (如SEQ ID NO 22所示),识别碱基T的TALENs识别模块为NG-T (如SEQID NO 23所示),识别碱基C的TALENs识别模块为HD-C (如SEQ IDNO 24所示),识别碱基G的TALENs识别模块为NK-G (如SEQ ID NO 25所示)。本发明还提供了一对蛋白质,所述一对蛋白质由上述的一对短肽两端分别加上转录激活子样效应因子氨基酸序列框架的N端和C端组成;其中,所述的转录激活子样效应因子氨基酸序列框架的N端和C端为天然的或经过人工改造的序列。
这对蛋白质可以分别特异性地识别山羊或绵羊β乳球蛋白基因(BLG)eXOn2上的二段核苷酸序列,所述二段核苷酸序列分别选自以下二个核苷酸序列(I)SEQ ID N0:16序列或SEQ ID NO 16序列的一个或二个核苷酸经过取代所衍生的核苷酸序列;(2) SEQ ID NO 20序列或SEQ ID NO :20序列的一个或二个核苷酸经过取代所衍
生的核苷酸序列。优选地,所述的这对蛋白质分别具有如SEQ ID NO. 5和SEQ ID NO. 6所示的氨基酸序列。该蛋白质为转录激活子样效应因子,命名为BLG-TALE-L1和BLG-TALE-R2。本发明还提供了一对多核苷酸,所述一对多核苷酸分别编码上述的一对蛋白质。优选地,所述一对多核苷酸分别具有如SEQ ID NO. 7和SEQ ID NO. 8所示的碱基序列。本发明还提供了一对融合蛋白,所述一对融合蛋白由上述的一对蛋白质分别与 DNA切割蛋白融合而成。优选地,所述的DNA切割蛋白为DNA内切酶。优选地,所述的一对蛋白质分别与DNA切割蛋白的二个亚基融合。更优选地,所述的DNA切割蛋白为天然的或经过人工改造的FoklDNA内切酶。最优选地,所述一对融合蛋白分别具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列。该融合蛋白为转录激活子样效应因子核酸酶,命名为BLG-TALEN-L1和 BLG-TALEN-R2。本发明还提供了一对多核苷酸,所述一对多核苷酸分别编码上述的一对融合蛋白质。优选地,所述一对多核苷酸分别具有如SEQ ID NO. 11和SEQ IDN0. 12所示的碱基序列。本发明还提供了一种包含上述一对多核苷酸中的任意一条多核苷酸的载体。优选地,可以先将能特异性识别SEQ ID N0. 16或SEQ ID N0. 20所示碱基序列的多核苷酸连接到中间载体pCMV-NLS-TALEbaclibone-Fokl (R)-intermediate上,再将该中间载体连接到最终载体 pEFla-NLS-TALE backbone-Fokl (R)-pA (如 SEQ ID NO :48 所示)或最终载体 pEFla-NLS-TALE backbone-R)kl (L)-IRES-PURO-pA (如 SEQ IDNO :49 所示)上, 构建获得包含编码转录激活子样效应因子核酸酶基因的质粒载体,能表达转录激活子样效应因子核酸酶。本发明还提供了一种用上述载体转化的宿主细胞。优选地,所述宿主细胞为山羊或绵羊细胞;更优选地,所述宿主细胞为山羊或绵羊 IPS细胞。本发明还提供了一种上述一对融合蛋白或上述一对多核苷酸在对山羊或绵羊β 乳球蛋白基因靶向修饰中的应用。优选地,所述一对融合蛋白分别具有如SEQ ID Ν0. 9和SEQ ID NO. 10所示的氨基酸序列;所述一对多核苷酸分别具有如SEQ ID NO. 11和SEQID N0. 12所示的碱基序列。本发明还提供了一种山羊或绵羊β乳球蛋白基因打靶的方法,包括将上述一对融合蛋白或者上述一对多核苷酸或者含有这对多核苷酸的载体转入山羊或绵羊IPS细胞,于30-37°C扩增培养3-7天,得到β乳球蛋白基因被靶向修饰的细胞。优选地,所述一对融合蛋白分别具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列;所述一对多核苷酸分别具有如SEQ ID NO. 11和SEQID NO. 12所示的碱基序列。优选地,所述的山羊或绵羊IPS细胞中还转入有抗puro蛋白或能表达抗puro蛋白的质粒,便于筛选。优选地,所述的扩增培养中至少有1天在30°C下进行,能获得更好的打靶效果。本发明针对山羊或绵羊BLG基因的一个位点设计了一对转录激活子样效应因子核酸酶(BLG-TALEN-L1和BLG-TALEN-R2),这对TALENs分别由可以识别BLG基因exon2上一段核苷酸的DNA识别结构域与一个R)kl DNA内切酶的两个异源亚基融合得到。将这对转录激活子样效应因子核酸酶同时转入宿主细胞时,其能对宿主细胞BLG基因的eXon2位点打靶,并使打靶位点发生基因突变,包括碱基缺失、碱基插入等,从而实现对山羊或绵羊BLG 基因的靶向修饰,具有特异性强、打靶效率高、准确度高等优点。
图1为人工设计的转录激活子样效应因子核酸酶识别的DNA序列及位点;图2为18个识别模块连接策略示意图;其中,A =PCR为每个识别模块添加酶切识别序列和连接接头过程示意图;B =PCR为每个识别模块添加酶切识别序列和连接接头后示意图;C =PCR扩增6模块片段与中间载体示意图;D 最终构建的TALEN质粒示意图;图 3 为中间载体 pCMV-NLS-TALE backbone-Fokl (R) -intermediate 示意图;图 4 为最终载体 pEFla-NLS-TALE backbone-Fokl (R) -pA 示意图;图 5 为最终载体 pEF la-NLS-TALE backbone-Fokl (L) -IRES-PURO-pA 示意图;图 6 为最终的 TALEN 质粒 pEFla-NLS-TALE backbone N terninal-BLG-TALEN-Ll-TALE backbone C terminal-Fokl (L) -IRES-PURO-pA 的示意图;图7为BLG基因在打靶位点的基因型变化;其中,-表示碱基缺失,+表示碱基插入。
具体实施例方式以下实施例中所使用的技术,包括PCR扩增与检测、细胞转染等分子生物学技术, 以及细胞培养、检测技术等,除非特别说明,均为本领域内的技术人员已知的常规技术;所使用的仪器设备、试剂和细胞系等,除非是本说明书特别注明,均为一般本领域的研究和技术人员可以通过公共途径获得的。实施例1 TALENs靶序列的设计1、从NCBI上下载山羊和绵羊BLG基因组序列(GenBank编号山羊为Z33881. 1, 绵羊为X12817. 1),选择eXOn2为打靶目标;2、设计引物并PCR扩增基因组上打靶位点片段,并测序,其中,PCR引物及测序引物见表1 ;表 1
片段名称引物名称引物序列BLG exon2Fprimer ( SEQ ID NO: 13 )CCCCACCTTGCTCCCGTTCCRprimer( SEQ ID NO: 14 )CAGACTAACAGGGAATTCAGAATACCT GC测序引物(SEQ ID NO: 15 )GACCCAGAGTCCAGACACCC3、设计TALENs识别序列根据测序得到的序列,并依照以下原则确定TALENs识别序列(1)第0位碱基为T (识别序列第一位之前的碱基为第0位)(2)最后一位碱基为T(3)识别序列长度在14-19之间(4) 二个识别序列之间的间隔序列(Spacer)长度控制在14_21之间(12或13也可,但效率可能较低)设计得到的靶序列位置如图1所示,具体序列见表2。表 2
TALE名称靶序列BLG-TALE-L1(SEQ ID NO 16)gtctcagccctccactBLG-TALE-L2(SEQ ID NO 17)cagccctccactccctBLG-TALE-L3(SEQ ID NO 18)gtctcagccctBLG-TALE-R1(SEQ ID NO 19)gcagctggggtcgtgcttBLG-TALE-R2(SEQ ID NO :20)gcagctggggtcgtgctBLG-TALE-R3(SEQ ID NO :21)ggctgcagctggggt实施例2 TALENs识别模块之间的连接及重组载体的构建1、TALENs 识别模块(modular)的获得(1)合成分别识别碱基A、T、C、G的四个识别模块Ni、NG、HD、NK,序列见表3。表权利要求
1.一对短肽,其特征在于,所述一对短肽分别具有如SEQ ID NO. 1和SEQ ID NO. 2所示的氨基酸序列。
2.一对多核苷酸,其特征在于,所述一对多核苷酸分别编码如权利要求1所述的一对短肽。
3.如权利要求2所述一对多核苷酸,其特征在于,所述一对多核苷酸分别具有如SEQID NO. 3和SEQ ID NO. 4所示的碱基序列。
4.一对蛋白质,其特征在于,所述一对蛋白质由权利要求1所述的一对短肽两端分别加上转录激活子样效应因子氨基酸序列框架的N端和C端组成;其中,所述的转录激活子样效应因子氨基酸序列框架的N端和C端为天然的或经过人工改造的序列。
5.如权利要求4所述一对蛋白质,其特征在于,所述一对蛋白质分别具有如SEQIDNO. 5和SEQ ID NO. 6所示的氨基酸序列。
6.一对多核苷酸,其特征在于,所述一对多核苷酸分别编码如权利要求4或5所述的一对蛋白质。
7.如权利要求6所述一对多核苷酸,其特征在于,所述一对多核苷酸分别具有如SEQID NO. 7和SEQ ID NO. 8所示的碱基序列。
8.一对融合蛋白,其特征在于,所述一对融合蛋白由权利要求4所述的一对蛋白质分别与DNA切割蛋白融合而成。
9.如权利要求8所述一对融合蛋白,其特征在于,所述的一对蛋白质分别与DNA切割蛋白的二个亚基融合。
10.如权利要求9所述一对融合蛋白,其特征在于,所述的DNA切割蛋白为天然的或经过人工改造的i^okl DNA内切酶。
11.如权利要求8-10任一权利要求所述一对融合蛋白,其特征在于,所述一对融合蛋白分别具有如SEQ ID N0. 9和SEQ ID NO. 10所示的氨基酸序列。
12.—对多核苷酸,其特征在于,所述一对多核苷酸分别编码如权利要求8-10任一权利要求所述的一对融合蛋白。
13.—对多核苷酸,其特征在于,所述一对多核苷酸分别编码如权利要求11所述的一对融合蛋白。
14.如权利要求13所述的一对多核苷酸,其特征在于,所述一对多核苷酸分别具有如SEQ ID NO. 11和SEQ ID N0. 12所示的碱基序列。
15.一种包含权利要求2-3、6-7、13或14任一权利要求所述一对多核苷酸中的任意一条多核苷酸的载体。
16.一种用权利要求15所述载体转化的宿主细胞。
17.一种包含权利要求12所述一对多核苷酸中的任意一条多核苷酸的载体。
18.一种用权利要求17所述载体转化的宿主细胞。
19.如权利要求16或18所述宿主细胞,其特征在于,所述宿主细胞为山羊或绵羊IPS细胞。
20.一种如权利要求11所述一对融合蛋白或如权利要求14所述一对多核苷酸在对山羊或绵羊β乳球蛋白基因靶向修饰中的应用。
21.—种山羊或绵羊β乳球蛋白基因打靶的方法,其特征在于,包括将权利要求11所述一对融合蛋白或者权利要求13或14所述一对多核苷酸或者含有权利要求13或14所述一对多核苷酸的载体转入山羊或绵羊IPS细胞,于30-37°C扩增培养3-7天,得到β乳球蛋白基因被靶向修饰的细胞。
22.如权利要求21所述的方法,其特征在于,所述的山羊或绵羊IPS细胞中还转入有抗puro蛋白或能表达抗puro蛋白的质粒。
23.如权利要求21或22所述的方法,其特征在于,所述的扩增培养中至少有1天在30°C下进行。
全文摘要
本发明公开了一对转录激活子样效应因子核酸酶及其编码基因与应用。这对转录激活子样效应因子核酸酶(TALEN)由一对DNA识别蛋白分别与Fok1 DNA内切酶的两个异源亚基融合得到,可以特异性地识别山羊或绵羊β乳球蛋白基因(BLG)exon2上的两个相邻位点。将这对转录激活子样效应因子核酸酶同时转入宿主细胞时,其能对宿主细胞BLG基因的exon2位点打靶,并使打靶位点发生基因突变,从而实现对山羊或绵羊BLG基因的靶向修饰,具有特异性强、打靶效率高、准确度高等优点。
文档编号C12N5/10GK102558309SQ20121002976
公开日2012年7月11日 申请日期2012年2月10日 优先权日2012年2月10日
发明者肖磊, 赵金龙 申请人:浙江大学