本发明涉及grna合成领域,具体而言,涉及一种grna及其生物合成方法。
背景技术:
1、向导rna(guide rna, grna)是一段非编码的rna,在20世纪80年代,它在动鞭毛虫纲动质虫目锥体虫中动质体(kinetoplastid trypanosome)的线粒体(mitochondrion)中被发现,在rna编辑过程中起向导作用。grna收到广泛关注源自crispr-cas9基因编辑技术的发现和应用,该技术利用sgrna (single guide rna)准确找到dna上要编辑的位置——pam(protospacer adjunct motif)位点,进而cas9(dna核酸内切酶)找到对应位置,进行剪切,达到编辑(删除,插入,变更)基因的目的。grna是一条同时包含crrna和tracrrna的长度约67-142nt的单链rna,crrna是长约15-25nt的可变序列,通过互补配对的方式特异性识别编辑的目的基因,tracrrna是一段固定的序列,负责招募cas9,根据cas9的种类不同,tracrrna的序列不同。
2、目前最常用的cas9蛋白是酿脓链球菌(streptococcus pyogenes)来源的spcas9,其它可用的cas9蛋白有金黄色葡萄球菌(staphylococcus aureus)来源的sacas9,弗朗西斯氏菌属的francisella novicida来源的fncas9,空肠弯曲菌(campylobacter jejuni)来源的cjcas9,白喉杆菌(corynebacterium diphtheriae)来源的cdcas9,嗜热链球菌(streptococcus thermophilus)来源的st1cas9和脑膜炎奈瑟菌(neisseriameningitidis)来源的nmecas9。其中spcas9、sacas9、fncas9和cjcas9的常用的grna长度约100nt,st1cas9和cdcas9常用的grna长度约115nt,nmecas9可用的grna长度最长约140nt。尽管各cas9蛋白需要的grna的长度不同,但所有的grna都具有类似的结构。
3、对于链长达到100nt左右的grna,在现有技术中可以通过体外转录和固相合成的方法合成。但现有的固相合成方法主要通过引物合成实现,合成规模局限在nmol-μmol级别,难以放大至生产规模。且受限于固相合成的特性,链长的增加会导致纯度和产率的下降,会出现偶联效率降低、载体物理稳定性下降、支链杂质增多等诸多问题。而利用体外转录方式制备的grna,grna产品的末端序列不准确,影响产品质量。
技术实现思路
1、本发明的主要目的在于提供一种grna及其生物合成方法,以解决现有技术中合成grna纯度低的问题。
2、为了实现上述目的,根据本发明的第一个方面,提供了一种grna的生物合成方法,该生物合成方法包括:利用rna连接酶将不同底物的3'端和5'端连接形成磷酸二酯键,形成grna,上述grna包括天然grna或非天然grna,底物的数量≥2;底物的连接位点位于grna的茎环结构互补区域、茎环结构环状区域、或茎环结构间的连接区域(linker)中的任意一个或多个位置,底物的内部或底物之间能够进行碱基互补配对,形成grna的二级结构;rna连接酶包括rna连接酶家族1、2或3中任意的一种或多种酶。
3、进一步地,rna连接酶包括:seq id no:1、seq id no:2、seq id no:3、seq id no:4、seq id no:5、seq id no:6、seq id no:7、seq id no:8、seq id no:9、seq id no:10、seq id no:11、seq id no:12、seq id no:13、seq id no:14、seq id no:15、seq id no:16、seq id no:17、seq id no:18、seq id no:19、seq id no:20、seq id no:21、seq idno:22、seq id no:23或seq id no:24所示的rna连接酶中的一种或多种;或与seq id no:1~ seq id no:24中任一所示rna连接酶具有70%以上同一性的酶,优选为70%以上同一性、75%以上同一性、80%以上同一性、90%以上同一性、95%以上同一性、99%以上同一性、99.5%以上同一性、99.9%以上同一性。
4、进一步地,底物包括2个或更多个。
5、进一步地,grna的长度为67-146 nt。
6、进一步地,grna的长度为91-104或130-146nt。
7、进一步地,grna的序列包括seq id no:25、seq id no:26、seq id no:27、seq idno:28、seq id no:41、seq id no:42或seq id no:43中任一项所示的核苷酸序列。
8、进一步地,底物包括seq id no:29或由15-25个n碱基组成的核苷酸序列;以及seqid no:30和seq id no:31所示的核苷酸序列;或由15-25个n碱基组成的核苷酸序列和seqid no:36所示的核苷酸序列连接而成的序列或seq id no:32所示的核苷酸序列,以及seqid no:33所示的核苷酸序列;由15-25个n碱基组成的核苷酸序列位于seq id no:36的5’方向;或由15-25个n碱基组成的核苷酸序列和seq id no:47所示的核苷酸序列连接而成的序列或seq id no:44所示的核苷酸序列,以及seq id no:45和seq id no:46所示的核苷酸序列;由15-25个n碱基组成的核苷酸序列位于seq id no:36的5’方向;或由15-25个n碱基组成的核苷酸序列和seq id no:50所示的核苷酸序列连接而成的序列或seq id no:48所示的核苷酸序列,以及seq id no:49所示的核苷酸序列;由15-25个n碱基组成的核苷酸序列位于seq id no:50的5’方向。
9、进一步地,当底物为2个时,生物合成方法包括:将底物和rna连接酶混合,底物包括第一底物和第二底物,rna连接酶将第一底物的5'端的磷酸基团和第二底物3'端的羟基连接形成磷酸二酯键,获得grna。
10、进一步地,第二底物的5'端为5'保护基,第一底物的3'端为3'保护基。
11、进一步地,当底物为3个时,底物包括第一底物、第二底物和第三底物,生物合成方法包括:将第一底物、第二底物和rna连接酶混合,第一底物的5'端为磷酸基团,第一底物的3'端为3'保护基,第二底物的5'端和3'端为羟基,rna连接酶将第一底物的5'端的磷酸基团和第二底物3'端的羟基连接形成磷酸二酯键,获得5'端为羟基的中间产物;对中间产物进行5'磷酸化,获得5'磷酸化中间产物;将5'磷酸化中间产物、第三底物和rna连接酶混合,将5'磷酸化中间产物的5'端的磷酸基团和第三底物3'端的羟基连接形成磷酸二酯键,获得grna;其中,第三底物的5'端为5'保护基。
12、进一步地,重复利用生物合成方法,将4个或更多个底物进行多次连接和5'磷酸化,每次连接的底物的数量为2个,依次连接获得grna。
13、进一步地,利用模板核酸链指导底物的连接;模板核酸链与不同底物均具有至少3个碱基特异性结合,特异性结合在模板核酸链上的底物的碱基相邻并形成缺刻,获得含有缺刻的双链核苷酸结构,缺刻两端相邻的碱基分别为不同底物的5'端和3'端,5'端为5'磷酸根,3'端为羟基;利用rna连接酶连接缺刻上下游的5'磷酸根和羟基,形成磷酸二酯键,获得双链核苷酸结构;利用dna酶消化双链核苷酸结构上的模板核酸链,获得grna。
14、进一步地,模板核酸链的序列包括seq id no:37、seq id no:39、seq id no:40或seq id no:51所示的核苷酸序列中任一条。
15、进一步地,模板核酸链与不同底物混合后,高温孵育后缓慢冷却退火或恒温孵育,获得含有缺刻的双链核苷酸结构;恒温孵育的温度包括4~37℃,恒温孵育的时间≥10min;高温孵育后缓慢冷却退火包括:95℃孵育2min,0.5~1.2℃/min降温至12℃,12℃孵育10min后降温至4℃。
16、进一步地,位于grna的3'端的底物的3'端为3'保护基,位于grna的5'端的底物的5'端为5'保护基。
17、进一步地,grna的二级结构通过底物自身或底物之间的自发发生的碱基互补配对形成。
18、进一步地,3'保护基包括但不限于n-乙酰半乳糖胺基团、磷酸基团、-o-nh2、叠氮基、氰乙基、烯丙基或2-硝基苄基等能够阻止磷酸酯键形成的修饰基团;5'保护基包括但不限于羟基、氢或甲基等能够阻止磷酸酯键形成的修饰基团。
19、进一步地,底物中包括一个或多个非天然核苷酸,非天然核苷酸包括:具有核糖2'位修饰、核糖骨架修饰、碱基修饰或磷酸骨架修饰中的一种或多种的核糖核苷酸;核糖2'位修饰包括2'-甲氧基修饰、2'-氟修饰、2'-氢修饰、2'-甲氧乙基修饰、2'-fana修饰、锁核酸修饰或己糖醇核酸修饰;核糖骨架修饰包括将核苷酸中的核糖替换为ribulona、tna、tphona、或dxna;碱基修饰包括脱氮腺嘌呤c7修饰、脱氮鸟苷c7修饰、胞嘧啶c5修饰或尿苷c5修饰;磷酸骨架修饰包括ps修饰。
20、为了实现上述目的,根据本发明的第二个方面,提供了一种grna,该grna包括利用上述生物合成方法制备获得的grna。
21、应用本发明的技术方案,利用上述生物合成方法,通过rnl1、rnl2或rnl3家族的rna连接酶,将2个或2个以上的底物连接,连接的缺刻位置可位于grna的茎环结构上,也可位于茎环结构间的连接区域,从而将多条底物连接为一条完整的rna链,且底物之间能够自行进行碱基互补配对,从而制备获得具有二级结构的grna。利用上述生物合成方法,能够以较高的底物浓度进行反应,产量较高,能够满足工业大规模生产的要求。