基于Cas12a技术的外源基因定点敲入方法与流程

文档序号:20371218发布日期:2020-04-14 13:12阅读:1482来源:国知局
本发明涉及基因体学及基因工程领域,具体地说,涉及一种基于cas12a技术的外源基因定点敲入方法。
背景技术
::位点特异的转基因整合可以通过同源臂依赖的修复(homology-directedrepair,hdr)途径实现也可以通过介导的末端连接(non-homologyendjoining,nhej)的途径实现。通过同源臂依赖的修复途径实现外源基因的精确整合往往是费时费力的,因为对于每一个基因它都需要进行同源臂克隆载体的构建。并且因为只有在细胞的s/g2期时,hdr途径才可以有效的发挥作用,因此在非分裂细胞中,通过hdr介导的外源基因的整合的效率是非常低的。精确的位点特异性外源基因的整合也可以通过一种称为obligare(obligateligation-gatedrecombination)的方法实现,它是利用zincfingernucleases(zfns)或者talenucleases(talens)通过nhej途径实现的,但是复杂的设计和高成本限制了它的广泛应用。利用nhej途径,crispr/cas9已经在斑马鱼、哺乳动物等细胞中实现了外源基因的方便快捷及高效的定点整合,然而在外源基因和内源靶点的两端的接头处往往会出现各式各样的突变。多项研究致力于优化这个系统,利用通过将fkbp12-l106p降解domain和cas9相连接,从而控制cas9蛋白的表达,以及利用相同的grna同时切割供体载体和基因靶点的hiti(homology-independenttargetintegration)策略。利用cas9可以通过非同源末端连接的途径将外源dna高效整合到基因组中,然而这些整合通常是不精确的,在外源dna和内源基因的两端接头处经常会出现突变。cas12a是cas12家族最新发现的一个rna介导的核酸酶,与cas9相比它拥有多种不同的优势,例如更低的容错率以及更高的特异性,cas12a可以成熟自己的crisprrnas(crrnas)成为成熟的crrnas,从而实现多基因的同时打靶。基于这些体外的比较研究,推测cas12a可用于哺乳动物细胞中基因的精准定点插入。技术实现要素:本发明的目的是提供一种基于cas12a技术的外源基因定点敲入方法。本发明构思如下:利用cas12a切割基因组产生粘性末端(而cas9产生平末端,cas9产生的平末端使得它主要利用gibson组装的方法进行体外分子克隆),当cas12a的crrna的长度在20nt或者更长的情况下,cas12a主要切割crrna识别序列中pam序列下游非模板链的第18nt的位置,模板链的第23nt的位置,产生一个5nt的粘性末端;当cas12a的crrna的长度小于20nt的情况下,cas12a主要切割crrna识别序列中pam序列下游非模板链的第14nt的位置,模板链的第22nt的位置,产生一个8nt的粘性末端。这一特性使得cas12a能够像限制性内切酶一样实现dna的体外组装。本发明利用cas12a设计了一种依赖微同源臂的外源基因精确定点整合的方法,该方法通过简单的pcr或者t4连接反应即可将识别序列插入到供体载体中,其中重要的是cas12a在供体载体中的识别序列的方向与基因组中的靶点的整体方向是相反的,但是远离pam端的cas12a识别切割的5个碱基与基因组靶位点的最后5个碱基是相同的,因此可以利用内外源的dna产生的互补粘性末端实现无缝连接。由于它依赖于5bp的同源序列,故将其命名为miti(microhomology-dependenttargetedintegration)。在将外源基因整合到基因组中的特定位点以及在对内源基因进行标记时,相较已有的cas9hiti策略,该方法可以产生更高的精准插入效率。此外,利用4个不同的crrnas连成的array分别打靶供体载体和基因靶点使之两头产生互补配对的序列,同时结合负向筛选,miti策略可同时提高两端的插入精确度。为了实现本发明目的,第一方面,本发明提供一种基于cas12a技术的外源基因定点敲入方法(单靶点),包括以下步骤:1)根据真核宿主细胞基因组dna,选择合适靶点,设计并合成crrna序列:根据crrna作用位点的dna序列5′-tttv-n1-n2-……-nx-5-nx-4-nx-3-nx-2-nx-1-nx-3′,其中tttv为pam,v表示碱基a、c或g,x为20~23之间的整数(优选x=23),设计并合成针对上述作用位点的crrna序列,并将crrna序列构建到含有polii类型启动子、cas12adirectrepeat序列以及表达cas12a的te4396骨架载体中,得到crrna与cas12a的共表达载体;2)构建携带crrna识别序列和外源基因表达盒的供体载体,其中crrna识别序列位于外源基因表达盒的5′端;所述crrna识别序列与步骤1)的crrna作用位点的dna中tttv-n1-n2-……-nx-5序列相同,但方向相反,所述crrna识别序列中远离pam端的cas12a识别切割的碱基序列与步骤1)的crrna作用位点的dna中nx-4-nx-3-nx-2-nx-1-nx的碱基序列相同,且方向相同;其中,n表示碱基a、t、g或c;3)将crrna、crrna与cas12a的共表达载体和供体载体共同导入真核宿主细胞中,筛选阳性转化子。本发明中,te4396骨架载体购自addgene公司,货号74041。本发明中,所述polii类型启动子优选人u6启动子。前述的方法,步骤1)中所述cas12adirectrepeat(dr)序列为5′-aatttctactcttgtagat-3′(seqidno:1)。第二方面,本发明提供基于双cas12amiti技术的外源基因定点敲入方法(双靶点),包括以下步骤:1)根据真核宿主细胞基因组dna,选择两个相邻位点作为靶点,分别设计并合成crrna1和crrna2:根据crrna1作用位点的dna序列5′-tttv-n1-n2-……-nx-5-nx-4-nx-3-nx-2-nx-1-nx-3′,其中tttv为pam1,v表示碱基a、c或g,x为20~23之间的整数(优选x=23),设计并合成针对上述作用位点的crrna1序列;根据crrna2作用位点的dna序列5′-tttv′-n1′-n2′-……-n′x-5-n′x-4-n′x-3-n′x-2-n′x-1-n′x-3′,其中tttv′为pam2,v′表示碱基a、c或g,x为20~23之间的整数(优选x=23),设计并合成针对上述作用位点的crrna2序列,其中pam1和pam2相互靠近,呈头对头方式排列;2)构建包含crrna1识别序列-外源基因表达盒-crrna2识别序列构建体的供体载体;所述crrna1识别序列与步骤1)的crrna1作用位点的dna中tttv-n1-n2-……-nx-5序列相同,但方向相反,所述crrna1识别序列中远离pam端的cas12a识别切割的碱基序列与步骤1)的crrna1作用位点的dna中nx-4-nx-3-nx-2-nx-1-nx的碱基序列相同,且方向相同;所述crrna2识别序列与步骤1)的crrna2作用位点的dna中tttv′-n1′-n2′-……-n′x-5序列相同,但方向相反,所述crrna2识别序列中远离pam端的cas12a识别切割的碱基序列与步骤1)的crrna2作用位点的dna中n′x-4-n′x-3-n′x-2-n′x-1-n′x的碱基序列相同,且方向相同;其中,n和n′表示碱基a、t、g或c;基因组中crrna1识别序列中的pam与crrna2识别序列中的pam相互远离,呈尾对尾方式排列;3)将crrna1、crrna1识别序列、crrna2和crrna2识别序列构建到含有polii类型启动子、cas12adirectrepeat序列以及表达cas12a的te4396骨架载体中,得到包含如下构建体的重组载体,即为crrnas与cas12a的共表达载体;所述构建体为polii类型启动子-cas12adirectrepeat序列-crrna1-cas12adirectrepeat序列-crrna1识别序列-cas12adirectrepeat序列-crrna2-cas12adirectrepeat序列-crrna2识别序列;共表达载体的构建过程如下:分别合成四条长引物,用t4pnk酶于37℃处理30分钟,然后95℃处理5分钟,接着退火至4℃,然后连入该载体骨架中,即得。4)将步骤2)的供体载体及步骤3)的crrnas与cas12a的共表达载体共同导入真核宿主细胞中,筛选阳性转化子。进一步地,所述供体载体还包含负性筛选标记基因,所述负性筛选标记基因位于crrna1′识别序列-外源基因表达盒-crrna2′识别序列构建体的外侧。所述负性筛选标记基因可以是hsv-tk。借由上述技术方案,本发明至少具有下列优点及有益效果:本发明基于cas12a的miti技术进一步丰富了精确基因组工程方法,为各种基因编辑应用提供了有力工具。与cas9相比,miti可以提高定点插入的精确度,且比cas9hiti更加灵活。附图说明图1为本发明实施例1中cas12amiti、cas12ahiti、cas9hiti基因敲入策略示意图。其中,a:cas12amiti系统示意图。cas12amiti需要在供体载体中引入修饰的cas12a识别序列,这个序列和基因组中的靶序列相似,整体方向相反,不同之处在于pam远端的5个碱基和基因组靶点的pam远端的5个碱基序列是相同的。b:cas12ahiti系统示意图。该策略与cas9hiti相似,需要在供体载体上引入和基因组靶点相同的序列,但是方向是和基因组的相反。c:cas9hiti系统示意图。cas9hiti策略需要一个在供体载体上引入一个确定的sgrna识别位点,这个位点的序列和基因组中的靶点序列相同,但方向是相反的。“tttn”表示cas12a的pam序列。灰色剪刀表示cas12a核酸酶,黑色剪刀表示cas9核酸酶。图2为本发明实施例1中利用cas12ahiti,cas12amiti和cas9hiti三种策略在介导报告元件整合到aavs1位点时的差别。其中,a:在aavs1位点的cas12ahiti,cas12amiti和cas9hiti三种策略示意图。虚线表示cas9或者cas12a的切割位点。引物p1序列为tgccatctctcgtttcttaggatg,引物p2序列为cagatcgataaaacacatgcgtcaattt,引物p3序列为gcgtttcggtgatgacggtg,p4序列为ctgccaagctctcctcccag。1、2分别表示aavs1的第1、第2外显子。b:在aavs1位点,利用这三种整合策略的精确插入效率。结果重复三次,*p<0.05,**p<0.01,***p<0.001,两个独立样本t检验。图3为本发明实施例2中利用cas12amiti或者cas9hiti策略在hek293t细胞中标记clta基因。其中,a:利用这两种方法标记clta基因的示意图。“tga”碱基表示clta基因的终止密码子。引物p5序列为gggacaaataggcagttgct,引物p6序列为tcctcgcccttgctcaccat,引物p7序列为ctctgaatgccagggagaac。b:通过流式分析tdtomato阳性细胞的比率来检测比较这两种策略在clta位点的插入效率。c.通过t载体克隆及测序分析在clta位点这两种整合策略的精确整合效率。所有结果均重复三次。*p<0.05,**p<0.01,***p<0.001,两个独立样本t检验。图4为本发明实施例3中在hepg2细胞中利用含双切位点的载体标记clta基因。其中,a:利用cas12a在hepg2细胞中标记clta基因的供体载体和打靶策略示意图。含双切位点的供体载体(d4.1)包括两个cas12a的识别位点,一个位点是miti修饰的cas12a的识别序列,另一个位点和基因组中的序列相同但是方向相反。利用此种策略进行试验可能主要会得到两种结果,一种是只有报告元件插入到了靶位点,另一种情况是包括原核骨架在内的整个载体插入到靶位点。引物p8序列为tctgttccacatacacttcattc。b:对tdtomato阳性的hepg2细胞克隆进行pcr鉴定的结果,各泳道表示不同克隆在5′接头处和3′接头处的连接情况;情况1、情况2是指在利用d4.1载体实现定点插入时,会出现两种结果,一种是只有报告元件插入到了靶位点(情况1),另一种情况是包括原核骨架在内的整个载体插入到靶位点(情况2)。c:通过对5′接头处的pcr及测序确定tdtomato阳性的hepg2克隆含有预期的3×flag-f2a-tdtomato报告元件的整合。d:整合了全部d4.1载体的代表性的hepg2克隆的3′接头的测序结果。图5为本发明实施例4中利用cas12a在供体载体和基因组中产生的两对互补序列,同时结合负向筛选可提高两侧接头的精准度。其中,a:cas12a介导的sa-ires-gfp报告元件插入到aavs1位点的打靶策略示意图。供体载体上在sa-ires-gfp的两侧携带了两个修饰的cas12a打靶识别位点,这两个位点分别对应基因组中的两个不同的靶序列,同时一个负向筛选基因hsv-tk(herpessimplexvirusthymidinekinase)被插入到供体载体的原核骨架中。引物p9序列为cccggtgcctgagataaacg,引物p12序列为caggacggggctggctactg。b:通过pcr的方法检测抗puromycin和fiau的克隆中的sa-ires-gfp原件的定点整合情况,各泳道表示不同克隆在5′接头处和3′接头处的连接情况。11个克隆中有7个克隆在左右两侧均有插入。c:利用miti的策略产生的gfp阳性的克隆的两侧接头处的测序结果。图6为本发明实施例1中在aavs1位点验证并比较cas9和cas12a的打靶效率。t7e1分析表明在对相同的aavs1位点进行打靶时,cas9的效率比cas12a高。该结果重复两次,*p<0.05,**p<0.01,两个独立样本t检验。图7为本发明实施例1中各个策略的两个接头处的精确度分析。其中,a:pcr分析利用这三种策略在hela细胞中的aavs1位点的外源基因的整合情况。对转染了三组不同质粒的hela细胞的基因组分别进行pcr扩增的结果。第一组包括cas12ahiti供体载体(d2)和aavs1crrna1、cas12a共表达的载体(cr);第二组包括cas12amiti供体载体(d3)和aavs1crrna1,aavs1crrna1.1和cas12a共表达的载体(a1);第三组包括cas9hiti供体载体(d1)和aavs1grna1、cas9共表达载体(c1)。m表示1kbplusladdermaker。b:cas12ahiti介导的外源基因定点整合到aavs1位点的5′接头处代表性的ta克隆测序结果。c:cas9hiti介导的外源基因定点整合到aavs1位点的5′接头处代表性的ta克隆测序结果。d:cas12amiti介导的外源基因定点整合到aavs1位点的5′接头处代表性的ta克隆测序结果。图8为本发明实施例2中检测定点整合到clta位点时5′接头的情况。对转染了clta供体载体和相应的cas12a或者cas9打靶载体的hek293t细胞的5′接头处进行pcr扩增及ta克隆测序。a2表示cas12a和cltacrrnaarray共表达质粒。c2表示cas9和cltagrna共表达质粒。p5和p6引物用于扩增5′接头处。图上方右半部分表示的是利用cas12amiti或者cas9hiti策略介导外源基因片段整合到clta位点处的5′接头处的代表性的ta克隆测序结果。图9为本发明实施例2中利用miti策略在猪的胎儿成纤维细胞中标记greb1l基因。其中,a:在pff细胞中标记greb1l基因的策略示意图。引物p10序列为cggctgtcacatcttggttt,引物p11序列为tccaaagcatctcctcaggc。b:pcr鉴定正确整合了3×flag-f2a-tdtomato报告元件的pff克隆。c:阳性pff克隆的5′接头序列。图10为本发明实施例3中tdtomato阳性的hepg2细胞的免疫荧光染色的结果。在clta基因位点整合了flag-2a-tdtomato原件的tdtomato阳性的hepg2细胞被固定,然后被anti-flag抗体染色,并用荧光显微镜进行检测。比例尺,200μm。具体实施方式以下实施例用于说明本发明,但不用来限制本发明的范围。若未特别指明,实施例均按照常规实验条件,如sambrook等分子克隆实验手册(sambrookj&russelldw,molecularcloning:alaboratorymanual,2001),或按照制造厂商说明书建议的条件。实施例1基于cas12a的miti技术可以提高定点整合的精确度为证明cas12a产生的粘性末端对于定点整合的效果,本实施例设计了两种策略:cas12ahiti和cas12amiti,这两个策略的不同之处是pam远端的5个碱基的方向是相反的(图1,a和b)。在miti策略中,cas12a在基因组靶点和供体载体的靶点产生的粘性末端是互补的。作为对照实验,还检测了cas9hiti策略的精准度(图1,c)。利用ncoi酶切pzgs载体(pzgs载体由中国农业大学生物学院吴森课题组提供,参见wus,yingg,wuq,capecchimr(2008)aprotocolforconstructinggenetargetingvectors:generatingknockoutmiceforthecadherinfamilyandbeyond.natprotoc3:1056–1076.https://doi.org/10.1038/nprot.2008.70)后,进行t4自连接即得到含有报告元件的供体载体sa-ires-gfp-sv40-puro。通过将报告元件sa-ires-gfp-sv40-puro定点插入到一个可编辑的aavs1位点中的特定位点来测试比较这些系统(图2中a,图6),其中aavs1位点位于ppp1r12c(ncbigeneid:54776)基因的第一个内含子中,是一个转基因的安全位点。首先在aavs1位点选择了一个cas9和cas12a均可编辑的重合打靶位点tttctgtcaccaatcctgtccctagtgg,其中起始序列tttc为cas12a的pam识别序列,末尾的tgg序列为cas9的pam识别序列,tgtcaccaatcctgtccctagtg序列为cas12a的crrna序列,而gtcaccaatcctgtccctag序列是cas9的grna序列。首先通过酶切连接的方法分别将含有这个cas12a和cas9的识别序列引物(f:ctagtttctgtcaccaatcctgtccctagtggc,r:tcgagccactagggacaggattggtgacagaaa)经过退火后,连接到经xhoi/spei酶酶切的sa-ires-gfp-sv40-puro骨架中,其中cas12a或者cas9的识别序列与基因组中的方向是相反的,从而分别得到了cas12ahiti供体载体(d2)和cas9hiti供体载体(d1)。构建cas12amiti供体载体(d3)时,将含有miti识别序列的引物(f:ctagtttctgtcaccaatcctgtccccactac,r:tcgagtagtggggacaggattggtgaccagaaa)经过退火后,将其也经过t4酶连接到经酶切的sa-ires-gfp-sv40-puro骨架中,其中cas12ahiti和miti的区别在于其末端5个碱基对的方向是相反的(图2,a)。cas9表达载体来源于addgene的px330载体,而cas12a的表达载体是来源于addgene公司的te4396载体。在aavs1位点的cas12amiti的crrna序列是tgtcaccaatcctgtccccacta。将含有aavs1位点的cas9的grna序列的引物(aavs1-sgrna1-f:caccgtcaccaatcctgtccctag,aavs1-sgrna1-r:aaacctagggacaggattggtgac)通过t4连接酶连接到经bbsi酶酶切的px330质粒骨架中得到aavs1位点的cas9hiti打靶载体px330-aavs1-grna1;将cas12a的crrna序列的引物(针对aavs1靶点设计的crrna的引物:aavs1-crrna1-f:agattgtcaccaatcctgtccctagtg,aavs1-crrna1-r:aaaacactagggacaggattggtgaca;针对miti供体载体上靶点设计的crrna的引物:mitiaavs1crrna1.1-f:agattgtcaccaatcctgtccccacta,mitiaavs1crrna1.1-r:aaaatagtggggacaggattggtgaca)通过t4连接酶分别连接到经bsmbi酶切的te4396质粒骨架中分别得到cas12ahiti的打靶载体te4396-aavs1-crrna1和cas12amiti的打靶载体te4396-aavs1-crrna1.1。利用lonza2b电转仪,将cas9hiti供体载体d1和打靶载体px330-aavs1-grna1、cas12ahiti供体载体d2和打靶载体te4396-aavs1-crrna1以及cas12amiti供体载体d3和打靶载体te4396-aavs1-crrna1.1、te4396-aavs1-crrna三组质粒通过电转染的方法分别转入到hela细胞中,经过5天的puro(嘌呤霉素)药筛后进行了gfp的流式分析。然后通过对通过这些策略得到的细胞的靶点的两侧接头进行pcr扩增以及ta克隆分析,我们发现cas12amiti在5′接头处有70%的精确连接,而cas9hiti只有约16.67%的精确度,cas12ahiti几乎没有精确的插入整合(图2中b,图7中a-d)。实施例2miti可实现更加高效且精确的报告基因标记为进一步比较cas12miti和cas9hiti的精确度,本实施例利用2a-tdtomato报告系统在hek293t细胞中标记持续表达的clta基因(ncbigeneid:1211)(图3,a)。clta位点的基因组中的cas12a的识别序列是tttccacagggtggctcttcagtgcac,cas9的识别序列是gtggctcttcagtgcaccagcgg。首先分别从ppb-hnrasg12v质粒(ppb-hnrasg12v质粒由中国农业大学生物学院吴森课题组提供,参见xuc,qix,dux,etal(2017)piggybacmediatesefficientinvivocrisprlibraryscreeningfortumorigenesisinmice.procnatlacadsciusa114:722–727.https://doi.org/10.1073/pnas.1615735114)上pcr得到pb载体的pb接头和原核骨架部分、从px330载体上pcr得到3×flag部分、从pmaster12(addgene公司,货号58527)载体上通过pcr扩增得到f2a部分、从prset-btdtomato质粒上通过pcr扩增得到tdtomato部分,loxp-pgk-puro-loxp部分直接合成并进行酶切后得到,将上述各pcr片段通过gibson连接法将其连接起来,构建得到2a-tdtomato-loxp-pgk-puro-loxp供体载体。然后通过酶切和t4连接的方法,将含有clta的cas12amiti识别序列和cas9hiti的识别序列(cas12amiti的识别序列是tttccacagggtggctcttcaggtgca,cas9hiti的识别序列是gtggctcttcagtgcaccagcgg)的引物经过退火后分别连接到该酶切好的供体载体中,分别得到cas12amiti供体载体(d4)和cas9hiti供体载体(d5)。为了减少转染的crrna载体数量,我们构建了可同时表达多个cltacrrna的一元载体---clta-crrnaarray载体。为构建clta位点的cas12amiticrrnaarray载体,将针对基因组的crrna序列和针对miti载体上的crrna序列串联起来,,中间以cas12a的直接重复序列(aatttctactcttgtagat)相间隔,从而构成一个可以同时表达多个crrna的array载体。我们合成了包含有这两个crrna序列及中间的直接重复序列的一对引物(clta-crrna-array-f:agatcacagggtggctcttcagtgcacaatttctactcttgtagatcacagggtggctcttcaggtgca,clta-crrna-array-r:aaaatgcacctgaagagccaccctgtgatctacaagagtagaaattgtgcactgaagagccaccctgtg),经过退火后直接连入了经bsmbi酶切后的te4396载体骨架中,使其连接到hu6启动子和cas12adirectrepeat的后面,即得到了clta位点的cas12amiti的打靶载体质粒te4396-clta-crrna-array。同时将含有clta的cas9grna序列的引物(clta-sgrna-f:caccgtggctcttcagtgcaccag,clta-sgrna-r:aaacctggtgcactgaagagccac)进行退火后通过t4连接酶直接连入经bbsi酶酶切后的px330载体骨架中,得到cltacas9hiti的打靶载体px330-clta-grna。通过电转染的方法,将cas12amiti供体载体(d4)和cas9hiti供体载体(d5)分别与其相应的cas12a的打靶载体te4396-clta-crrna-array和cas9的打靶载体px330-clta-grna转入到hek293t细胞中。经过5天左右的嘌呤霉素筛选及流式分析,发现与cas9hiti相比,利用cas12amiti策略可以得到更高的tdtomato阳性细胞的比率(图3,b)。采用这两种方法产生的阳性细胞的比率均较低,可能是因为在12号染色体上存在一个与clta靶点序列完全相同的序列,这个序列所在的位点为clta的假基因。通过对这两种混合细胞的5′末端的接头处进行pcr扩增及测序后分析,发现cas12amiti介导的定点插入拥有更高的精确度(图3中c,图8)。进一步检测利用miti策略在猪的成纤维细胞中标记不表达的greb1l基因(ncbigeneid:100524319)(图9,a)。同样地,将含有greb1l基因的识别位点的序列的引物(d6-linker-f:tatgttaattaatttggtctcttcaaaagctcatcacgtaaggccgg,d6-linker-r:ccttacgtgatgagcttttgaagagaccaaattaattaaca)经过退火后用t4连接酶连接到已构建好的2a-tdtomato-loxp-pgk-puro-loxp的供体载体骨架中,即得到greb1lmiti供体载体(d6)。将针对基因组中的crrna的序列和针对miti载体(d6)的crrna序列串联起来合并到同一个crrnaarray中,这两个crrna之间用cas12a的直接重复序列进行间隔。通过合成引物(greb1l-crrna-array-f:agatgtctcttcaaaagctcatacgtgaatttctactcttgtagatgtctcttcaaaagctcatcacgt,greb1l-crrna-array-r:aaaaacgtgatgagcttttgaagagacatctacaagagtagaaattcacgtatgagcttttgaagagac),并进行退火后,利用t4连接酶将其连入到经bsmbi酶切后的含有hu6启动子、cas12adirectrepeat和cas12a的te4396质粒骨架中,即得到greb1lmitiarray的表达质粒te4396-greb1l-crrna-array。在电转染了greb1lmitiarray和cas12a的共表达质粒及d6供体载体及puro筛选后,挑取24个克隆进行靶点的pcr检测及测序分析(图9,b),结果发现有91.67%的克隆在5′端有预期的插入,且其中的81.82%拥有预期的连接序列(图9,c)。以上的结果进一步表明cas12amiti策略能够用于精准的报告基因的标记。实施例3在供体载体上引入两个cas12a的识别位点可以排除质粒骨架的随机整合为了避免质粒骨架随机插入基因组中,从而可能会造成严重的基因沉默,我们在clta的cas12amiti供体载体(d4)中的puromycin基因的后面通过酶切连接的方法,添加了一个和基因组中靶点序列相同而方向相反的cas12a的识别序列(tttccacagggtggctcttcagtgcac)即得到了d4.1载体(图4,a)。其crrna仍然可以用cltacas12amiti的crrnaarray质粒。将d4.1供体载体、cltacas12amiti的crrnaarray质粒和py010载体共同电转入hepg2细胞后,经过5天的puro筛选后,挑取16个tdtomato阳性的细胞克隆。pcr和测序结果表明16个克隆中有10个克隆在5′接头处出现预期的序列(图4,b和c),并且有8个定点整合的克隆未整合质粒骨架(图4,b和d)。并且,针对flag的免疫荧光染色的结果也进一步确定这个基因成功标记(图10)。这些结果表明cas12amiti能够容易地避免质粒骨架的整合。实施例4在供体载体上引入两个miti切点能够提高两个接头处的精确度为了提高内源和外源基因两个接头处的精确度,本实施例将两个不同相应的miti识别位点设置在供体载体中外源报告基因的两侧,同时选择两个临近的相应的不同的基因位点作为靶点。同时,我们也将一个负向筛选标记的自杀基因-胸苷激酶(herpessimplexvirusthymidinekinase,hsv-tk)设置在报告基因的外侧原核骨架的内侧以避免打靶载体的随机整合(图5,a),从而富集预期的打靶细胞。这样在供体载体上引入两个miti识别序列后会丢失hsv-tk自杀基因,从而使得该细胞抵抗非阿尿苷(fialuridine,fiau)药物的筛选。为了验证上述策略,在aavs1基因中选择了临近的两个cas12a识别位点用于精确插入sa-ires-gfp-sv40-puro报告元件,其中这两个基因组中的cas12a识别位点的序列呈头对头的方式(两个pam序列相互靠近的方向)排列,这样cas12a在切割基因组的两个靶点后会留下比较稳定的粘性末端。相应地在供体载体报告基因两侧的cas12a识别序列的方向呈尾对尾的方向排列(两个pam序列相互远离的方向)(图5,a)。为了构建aavs1位点的双miti的供体载体(d7),我们设计并合成了一对包含另一个miti识别位点序列的引物,经退火后,利用t4连接酶将其连入到d3供体载体的报告元件的3′端。为将各个crrna整合到同一个array载体中,我们合成了四条长的引物(aavs1-crrna-array-f1:agattgtcaccaatcctgtccctagtgaatttctactcttgtagattgtcaccaatcctgtcc,aavs1-crrna-array-f2:ccactaaatttctactcttgtagatcttacgatggagccagagaggatatttctactcttgtagatcttacgatggagccagagatcct,aavs1-crrna-array-r1:aaaaaggatctctggctccatcgtaagatctacaagagtagaaattatcctctctggctccat,aavs1-crrna-array-r2:cgtaagatctacaagagtagaaatttagtggggacaggattggtgacaatctacaagagtagaaattcactagggacaggattggtgaca),经过t4pnk酶处理,并进行退火后,连接到经bsmbi酶酶切的含有hu6启动子、cas12a的直接重复序列和cas12a共表达的te4396载体骨架中。将d7和te4396-aavs1-crrna-array载体电转染到hela细胞并进行puro和fiau的双药筛后,挑取克隆并通过pcr及测序分析5′和3′两侧接头处的序列。发现在这些克隆中,3′接头处的精确度有所提高(图5,b和c)。总之,在不考虑在双切割基因组时可能产生的染色体外环形dna、染色体异位及倒位等的情况下,上述实验结果表明在供体载体上引入两个miti切割位点同时结合负筛选能够促进外源基因整合的两侧接头处的精确度。本发明首次证明cas12a产生的粘性末端能够促进外源dna精确整合到目标基因组靶点。miti方法是建立在cas12a切割供体和基因组产生的互补粘性末端的基础上,它可以促进基因标记的效率和精准率。在相同情况下进行的比较实验表明,在检测的几个位点中,miti介导的末端连接的精确性比cas9hiti的要高。miti可能是未来基因治疗的一个重要工具。本发明成功证明了利用cas12a实现外源dna片段精确置换内源靶基因片段的可行性,这可以通过cas12a同时切割基因组的两个相邻位点和供体载体上相应的两个位点,使其产生两两互补的粘性末端,同时配合负向筛选而实现。cas9hiti目前为止只能够将外源dna插入到单独的一个位点中。该策略在一些情况下非常有用,例如在一个外显子两侧加上loxp位点以实现条件性敲除动物,或者将目标基因替换成想要的dna序列。当给内源基因标记上一个特定的标签时,利用cas9hiti策略时总会丢失该基因的最后几个密码子序列,这可能会破坏该基因的完整性甚至会对其功能有所影响。例如,本发明中,当利用cas9hiti策略标记人源细胞中的clta基因时,6个碱基对被不可避免的删除了(图8)。而利用miti策略时可以在供体载体的切割位点后面额外地添加这几个必要的碱基对,从而有效避免了上述情况的发生,这使得它比cas9hiti更加灵活。虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之做一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。参考文献:[1]yamamotoy,gerbisa(2018)makingendsmeet:targetedintegrationofdnafragmentsbygenomeediting.chromosoma127:405–420.https://doi.org/10.1007/s00412-018-0677-6.[2]heyerw-d,ehmsenkt,liuj(2010)regulationofhomologousrecombinationineukaryotes.annurevgenet44:113–139.https://doi.org/10.1146/annurev-genet-051710-150955.[3]marescam,linvg,guon,yangy(2013)obligateligation-gatedrecombination(obligare):custom-designednuclease-mediatedtargetedintegrationthroughnonhomologousendjoining.genomeres23:539–546.https://doi.org/10.1101/gr.145441.112.[4]auerto,durourek,deciana,etal(2014)highlyefficientcrispr/cas9-mediatedknock-ininzebrafishbyhomology-independentdnarepair.genomeres24:142–153.https://doi.org/10.1101/gr.161638.113.[5]kimuray,hisanoy,kawaharaa,higashijimasi(2014)efficientgenerationofknock-intransgeniczebrafishcarryingreporter/drivergenesbycrispr/cas9-mediatedgenomeengineering.scirep4:6545.https://doi.org/10.1038/srep06545.[6]bachur,bergarechei,chasinla(2015)crispr-castargetedplasmidintegrationintomammaliancellsvianon-homologousendjoining.biotechnolbioeng112:2154–2162.https://doi.org/10.1002/bit.25629.[7]hex,tanc,wangf,etal(2016)knock-inoflargereportergenesinhumancellsviacrispr/cas9-inducedhomology-dependentandindependentdnarepair.nucleicacidsres44:e85.https://doi.org/10.1093/nar/gkw064.[8]lacknerdh,carréa,guzzardopm,etal(2015)agenericstrategyforcrispr-cas9-mediatedgenetagging.natcommun6:10237.https://doi.org/10.1038/ncomms10237.[9]geisingerjm,turans,hernandezs,etal(2016)invivoblunt-endcloningthroughcrispr/cas9-facilitatednon-homologousend-joining.nucleicacidsres44:e76.https://doi.org/10.1093/nar/gkv1542.[10]suzukik,tsunekaway,hernandez-benitezr,etal(2016)invivogenomeeditingviacrispr/cas9mediatedhomology-independenttargetedintegration.nature540:144–149.https://doi.org/10.1038/nature20565.[11]kimd,kimj,hurjk,etal(2016)genome-wideanalysisrevealsspecificitiesofcpf1endonucleasesinhumancells.natbiotechnol34:863–868.https://doi.org/10.1038/nbt.3609.[12]kleinstiverbp,tsaisq,prewms,etal(2016)genome-widespecificitiesofcrispr-cascpf1nucleasesinhumancells.natbiotechnol34:869–74.https://doi.org/10.1038/nbt.3620.[13]fonfarai,richterh,m,etal(2016)thecrispr-associateddna-cleavingenzymecpf1alsoprocessesprecursorcrisprrna.nature532:517–521.https://doi.org/10.1038/nature17945.[14]zetscheb,heidenreichm,mohanrajup,etal(2017)multiplexgeneeditingbycrispr-cpf1usingasinglecrrnaarray.natbiotechnol35:31–34.https://doi.org/10.1038/nbt.3737.[15]zetscheb,gootenbergjs,abudayyehoo,etal(2015)cpf1isasinglerna-guidedendonucleaseofaclass2crispr-cassystem.cell163:759–771.https://doi.org/10.1016/j.cell.2015.09.038[16]jinekm,chylinskik,fonfarai,etal(2012)aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.science337:816–821.https://doi.org/10.1126/science.1225829[17]jiangw,zhaox,gabrielit,etal(2015)cas9-assistedtargetingofchromosomesegmentscatchenablesone-steptargetedcloningoflargegeneclusters.natcommun6:8101.https://doi.org/10.1038/ncomms9101[18]leic,lisy,liujk,etal(2017)thecctl(cpf1-assistedcuttingandtaqdnaligase-assistedligation)methodforefficienteditingoflargednaconstructsinvitro.nucleicacidsres45:e74.https://doi.org/10.1093/nar/gkx018[19]wus,yingg,wuq,capecchimr(2008)aprotocolforconstructinggenetargetingvectors:generatingknockoutmiceforthecadherinfamilyandbeyond.natprotoc3:1056–1076.https://doi.org/10.1038/nprot.2008.70[20]xuc,qix,dux,etal(2017)piggybacmediatesefficientinvivocrisprlibraryscreeningfortumorigenesisinmice.procnatlacadsciusa114:722–727.https://doi.org/10.1073/pnas.1615735114[21]mansoursl,thomaskr,capecchimr(1988)disruptionoftheproto-oncogeneint-2inmouseembryo-derivedstemcells:ageneralstrategyfortargetingmutationstonon-selectablegenes.nature336:348–352.https://doi.org/10.1038/336348a0.序列表<110>中国农业大学<120>基于cas12a技术的外源基因定点敲入方法<130>khp191116109.9<160>1<170>siposequencelisting1.0<210>1<211>19<212>dna<213>人工序列(artificialsequence)<400>1aatttctactcttgtagat19当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1