本发明属于基因工程领域。具体而言,本发明涉及一种在基因组中定点插入外源序列的方法。具体而言,本发明基于引导编辑系统(pe),使用逆转录模板上带有部分重叠序列的两个相邻的pegrna,在基因组特别是植物基因组中实现了高效且精准的外源序列定点插入。进一步将该系统与重组酶系统如cre/lox或flp/frt等相偶联,在基因组特别是植物基因组中实现了大片段外源序列定点插入。
背景技术:
0、发明背景
1、dna测序技术的快速发展使得生命科学领域快速进入基因组时代,以gwas为代表的技术的出现大大促进了遗传学的发展,尤其是植物中众多关键的基因功能被解析,这对分子作物育种的发展是个巨大契机。以杂交、回交为代表的传统作物育种方法由于耗费时间,耗费劳动力等原因,已经不足以支撑作物育种快速增长的要求,因此新型分子育种技术的开发愈发重要。
2、转基因技术依靠快速、高效获得优良性状的能力被快速应用于植物分子育种中,但由于其引入外源基因的特点而受到严格的监管,而相比来说,基因组编辑技术能够在不引入外源基因的情况下对功能基因进行定点精准修饰,从而更加快速高效的获得优良性状。目前植物基因组编辑工具主要包括三大类,一是锌指核酸酶(zfn);二是类转录激活效应因子核酸酶(talen);三是成簇规律间隔的短回文重复序列及其相关蛋白(crispr/cas)。其中以crispr/cas系统最为简便和高效,近几年对遗传学研究和植物分子育种等方向贡献巨大。
3、目前广泛应用的crispr/cas系统包括一个人工设计的单链向导rna(sgrna)以及一个位点特异性核酸酶cas9。sgrna通过碱基互补配对原则靶向特定位置的基因组dna,cas9与sgrna在细胞内形成核糖核酸蛋白复合体(rnp)。与此同时cas9构象发生改变,复合体中cas9上的一个结构域(pam-interaction domain,pi domain)不断与基因组上各个位置的基序ngg(pam)互作,直至找到能与sgrna碱基互补配对的位置,此时rnp复合体与dna互作形成新的复合体。cas9将dna双链解旋形成r-loop,同时构象再次发生改变,其上的ruvc和hnh核酸酶活结构域被激活,分别完成对非靶标链和靶标链的切割从而产生dna双链断裂(dsb)。此时dna双链断裂会引发细胞内源dna修复机制,一般会通过发生频率最高的非同源末端连接(nhej)进行修复。nhej是易错的修复途径,因此在修复过程中可能会在dsb附近随机引入一些碱基的插入或缺失(indel)从而导致该基因无法正常表达。在产生dsb的过程中如果提供带有dsb两侧基因组序列同源臂的一段外源dna(donor),则细胞内源修复机制有可能以此donor为模板进行同源重组修复(hr)。hr是精准的修复途径,可以在基因组上引入任意的点突变、片段插入及删除。但此修复途径在高等生物细胞尤其是植物细胞内发生频率极低,因此并未得到广泛应用。此后,基于crispr系统的碱基编辑器(base editor,be)被开发,be系统利用ruvc结构域失活的cas9(ncas9-d10a)偶联一个脱氨酶(胞嘧啶脱氨酶或腺嘌呤脱氨酶,分别对应cbe和abe),在rnp复合体结合dna形成r-loop时,脱氨酶对非靶标链上的胞嘧啶(c)或腺嘌呤(a)进行脱氨形成尿嘧啶(u)或次黄嘌呤(i),细胞内修复机制会将尿嘧啶识别为胸腺嘧啶(t),将次黄嘌呤识别为鸟嘌呤(g),此时ncas9对靶标链进行切割,从而促进细胞发生碱基切除修复途径(ber)完成c-u-t或a-i-g的修复。be系统不需要依赖dsb的产生和hr途径即可完成高效精准的点突变,因此迅速得到了广泛应用。而以be为代表的crispr系统偶联其他效应因子的基因组编辑工具箱也得到了快速发展,包括偶联转录激活、抑制因子或表观修饰因子进行靶向激活、抑制以及表观修饰等。
4、尽管crispr分子工具箱迅速发展,从简单的基因敲除到精准的碱基编辑,再到转录激活、抑制及表观修饰等,但dna片段的靶向精准插入在高等植物细胞中一直难以实现。实现靶向插入的传统策略依赖于dsb的产生,当额外提供一段不含基因组同源序列的donordna时,此donor则有可能在dsb产生后通过nhej的修复途径被插入到dsb附近,但此过程是非常不精准的,而且由于donor提供方式等问题导致其效率也较低;当额外提供一段含有基因组同源序列的donor dna时,此donor中的目的片段则有可能在dsb产生后通过hr的修复途径被插入到靶点位置,但此过程的效率是极低的,在高等植物细胞中更是几乎难以实现。
5、由于hr效率过低,定点大片段dna整合可以借助位点特异性重组酶(ssr)来完成。ssr可以特异性识别结合某段dna序列(重组位点,rs)并形成联会复合体,两个联会复合体之间可以发生链交换过程并完成dna的重组,这一过程由ssr催化活性中心的酪氨酸或丝氨酸残基攻击rs磷酸骨架发生dna的切割介导,切割之后形成共价中间体并发生两个rs之间的链交换反应,此过程不需要高能辅助因子的参与,不借助细胞内源dna修复途径,因为较为高效。由ssr酶活中心残基的差异可以将其分为酪氨酸重组酶家族以及丝氨酸重组酶家族,其主要来源于噬菌体、细菌以及真菌中,发挥着切离、倒位、整合、转座等生物学功能。常见的酪氨酸重组酶有大肠杆菌噬菌体λ整合酶、p1噬菌体cre重组酶、酵母flp重组酶等,其都利用一个保守的酪氨酸残基攻击rs骨架的一条链,暴露出5’磷酸基团与3’羟基基团,此时两个rs的5’磷酸基团与3’羟基基团分别结合实现链交换,同时结合在rs上的重组酶变构,攻击另一条链并通过同样的途径实现链交换,从而完成重组的过程。常见的丝氨酸重组酶有tn3转座酶、沙门氏菌重组酶hin、链霉菌噬菌体фc31整合酶、以及分枝杆菌噬菌体bxb1整合酶等,其重组过程与酪氨酸重组酶类似,不同的是其利用丝氨酸残基同时攻击rs骨架的两条链,实现两个rs两条链的同时交换,从而完成重组过程。ssr的应用很广泛:在体外主要作为分子克隆工具使用,其dna分子间重组高效性使得大片段、多片段的体外分子克隆变的十分简单;在原核细胞中可以作为基因或染色工程改造工具,进行大片段dna的删除、倒位、易位或整合;在高等生物真核细胞中则主要作为转基因标记基因删除的工具,而由于目前rs难以定点敲入导致定点大片段dna整合十分困难。
6、近期,能够实现任意碱基突变、短片段dna插入及删除的引导编辑系统(pe)被开发,迅速因其强大且不依赖于dsb的功能被广泛应用于动植物基因组编辑。引导编辑系统利用hnh结构域失活的cas9(ncas9-h840a)偶联一个逆转录酶(mlv),同时在sgrna的3’端先后引入逆转录模板序列(rt)以及逆转录酶的引物结合位点(pbs),其中rt上带有目的突变序列以及突变序列两侧与基因组同源的序列,将此sgrna称为pegrna。ncas9对非靶标链切割后,pbs会结合在在其5’端从而作为逆转录酶的起始引物,此时逆转录酶向rt的3’端延申,将rt序列逆转录为dna,形成一个带有突变序列的3’悬端,经过细胞内源dna修复后就有可能将此突变序列引入基因组,从而完成一定长度内任意类型的基因组编辑。
7、引导编辑系统在高等植物细胞中的效率仍太低,不足以实现高效插入,且插入片段长度非常受限。推测主要原因有三个,一是引导编辑系统在高等植物中利用的修复途径发生频率较为低下,导致最终编辑效率较低;二是rt与基因组同源的序列竞争性结合基因组dna,阻碍了逆转录过程的发生;三是逆转录酶或pegrna容易被降解或逆转录能力不足。本领域仍然需要在植物基因组中实现外源核苷酸序列特别是大片段外源核苷酸序列的高效插入的系统和方法。
技术实现思路
0、发明简述
1、为了避免上述pe在高等植物中效率低下的前两个原因,本发明人首先设计了双pegrna策略,两个pegrna分别靶向结合基因组dna的两条链且pam间有一定的距离(大约20bp-大约60bp),两个pegrna的rt上均只含有所需插入序列且3’端带有部分重叠序列,逆转录完成之后两条新合成的dna链由于有重叠序列进行相互结合并退火,通过与原pe系统不同的dna修复途径之后完成插入(根据本技术的部分结果,此修复途径可能为ssa,一种在植物中发生频率较为高效的修复途径)。
2、最近,通过融合逆转录病毒核衣壳蛋白(nc)以及删除逆转录酶mlv的rnaseh活性结构域建立的增强版的植物引导编辑系统(eppe)能够增强逆转录能力或增强逆转录酶稳定性,从而大大提高植物引导编辑系统的效率。此外,通过在pegrna的3’端添加一个二级结构tevopre(epegrna)同样能够通过增强逆转录能力或增强pegrna稳定性并提高pe的效率。
3、为了进一步提高插入效率,本发明人同时使用了上述的eppe系统以及epegrna,从而在植物体细胞中实现了高效的短片段定点插入。同时评估了酪氨酸重组酶家族中的cre/lox系统、flp/frt系统等与丝氨酸家族中的фc31、bxb1重组酶系统在水稻体细胞中的dna整合能力,发现cre/lox系统和flp/frt系统效果更好,于是将其与上述高效插入系统相结合,通过额外提供一个带有rs的所需插入基因的donor,进而通过一步法实现了大片段外源核苷酸序列的定点插入。