一种用于微生物的CRISPR/Cas9基因编辑载体的构建及其应用
【技术领域】
[0001] 本发明涉及基因编辑领域中一种用于微生物的CRISPR/Cas9基因编辑载体的构 建及其应用。
【背景技术】
[0002] 对基因进行定点编辑,是生物研究领域重要的方法之一。随着科学的发展,出 现了越来越多的基因编辑技术,从经典的EMS随机诱变、T-DNA插入诱变或转座子插入失 活到锌指核酸酶(Zinc-fingernucleases,ZFN)技术和转录激活因子样效应因子核酸 酉每(transcriptionactivator-likeeffectornucleases,TALEN)技术,这些技术都大 大地促进了基因功能研究的进程。但由于ZFN技术与TALEN技术需要针对每一个目的 基因设计特定的内切酶,且构建过程繁琐,大大限制了其应用范围。与其它沉默体系相 比,规律成族间隔短回文重复(Clusteredregularlyinterspacedshortpalindromic r印eats),CRISPR)技术有其无法比拟的优点,逐渐被广泛地应用于基因定点修饰研究中。
[0003] CRISPR/Cas系统最早是在细菌的天然免疫系统内发现的,其主要功能是对抗入侵 的病毒及外源DNA,该系统主要依赖于CRISPRRNA(crRNA)与Cas蛋白形成的核糖核蛋白复 合物识别祀序列上的原间隔物模块(protospacer-adjacentmotif,PAM)对入侵菌体或 质粒进行特异性切割。CRISPR系统主要有三种类型,其中II型体系仅需要一个Cas9蛋白、 crRNA与反式激活的crRNA(tracrRNA)就能行使其功能。有研究表明将crRNA与tracrRNA 整合成向导RNA(guideRNA,gRNA)并不影响CRISPR/Cas9体系的作用。2013年8月,自然 生物技术期刊上首次同时发表了三篇有关CRISPR/Cas9体系成功应用于植物基因修饰的 研究。之后,CRISPR/Cas9体系被广泛地应用于动植物的研究上,而在微生物中的研究较少。 近期有研究报道将CRISPR/Cas系统应用于大肠杆菌的多基因编辑,但是其采用的是多质 粒系统,操作复杂,所需时间较长。因此构建出操作方便、适用于微生物的CRISPR/Cas9系 统具有重要的意义。
【发明内容】
[0004] 本发明所要解决的技术问题是如何构建出利用CRISPR/Cas9基因编辑技术对大 肠杆菌进行编辑的单一载体或谷氨酸棒状杆菌基因组进行编辑的单一载体。
[0005] 为解决上述技术问题,本发明首先提供了两种载体,一种是大肠杆菌CRISPR/Cas9 基因编辑载体,一种是谷氨酸棒状杆菌CRISPR/Cas9基因编辑载体。
[0006] 本发明所提供的大肠杆菌CRISPR/Cas9基因编辑载体和谷氨酸棒状杆菌CRISPR/ Cas9基因编辑载体,均包括复制起始位点(origin)、筛选标记基因、Cas9蛋白基因和gRNA 的编码DNA,所述gRNA识别受体菌的目的DNA,所述受体菌的目的DNA具有5 ' - (N)x-NGG-3 ' 结构,(N)x表示X个N,N为A、G、C或T,X可为大于5的一个自然数;其特征在于:所述载 体包括同源重组元件和操纵子;
[0007] 所述同源重组元件含有用于进行同源重组的DNA片段,所述同源重组元件通过与 所述受体菌的基因组DNA靶位点附近发生同源重组从而实现所述靶位点的基因组编辑(包 括删除、插入、替换等);
[0008] 所述操纵子调控所述Cas9蛋白基因的转录,或调控所述Cas9蛋白基因和所述 gRNA的编码DNA的转录。
[0009] 上述大肠杆菌CRISPR/Cas9基因编辑载体和上述谷氨酸棒状杆菌CRISPR/Cas9基 因编辑载体中,所述X具体可为20。
[0010] 上述大肠杆菌CRISPR/Cas9基因编辑载体中,含有终止所述Cas9蛋白基因转录的 终止子和启动所述gRNA的编码DNA转录的启动子。
[0011] 上述大肠杆菌CRISPR/Cas9基因编辑载体中,所述操纵子为阿拉伯糖操纵子,所 述阿拉伯糖操纵子由操纵区域和调控蛋白基因组成,所述调控蛋白基因具体可为AraC蛋 白基因,所述阿拉伯糖操纵子调控所述Cas9蛋白基因的转录和Red同源重组系统的转录。 [0012] 上述大肠杆菌CRISPR/Cas9基因编辑载体为1)-3)中任一种载体:
[0013] 1)所述载体由所述阿拉伯糖操纵子的操纵区域、与所述操纵区域连接的所述 Cas9蛋白基因、与所述Cas9蛋白基因连接的所述终止所述Cas9蛋白基因转录的终止子、 与所述终止所述Cas9蛋白基因转录的终止子连接的所述启动所述gRNA的编码DNA转录的 启动子、与所述启动所述gRNA的编码DNA转录的启动子连接的所述gRNA的编码DNA、与所 述gRNA的编码DNA连接的所述复制起始位点、与所述复制起始位点连接的所述阿拉伯糖操 纵子、与所述阿拉伯糖操纵子连接的同源重组系统、与所述同源重组系统连接的〇rf60a基 因,与所述〇rf60a基因连接的所述同源重组元件、与所述同源重组元件连接的所述筛选标 记基因组成;
[0014] 2)所述载体包括Red同源重组系统;
[0015] 3)所述载体的核苷酸序列为SEQIDNo. 1。
[0016] 上述大肠杆菌CRISPR/Cas9基因编辑载体中,1)所述载体的所述复制起始位点可 包括oriRlOl基因和r印A101基因;所述同源重组元件含有与所述受体菌的基因组DNA靶 位点附近发生同源重组的上游同源臂和下游同源臂,或含有与所述受体菌的基因组DNA靶 位点附近发生同源重组的上游同源臂、敲入基因和与所述受体菌的基因组DNA靶位点附近 发生同源重组的下游同源臂;所述阿拉伯糖操纵子的操纵区域具体可为SEQIDNo. 1的第 7333-7684位的核苷酸序列或SEQIDNo. 1的第11516-11867位的核苷酸序列;所述orf60a 基因具体可为SEQIDNo. 1的第9566-9748位所示的核苷酸序列。
[0017] 上述大肠杆菌CRISPR/Cas9基因编辑载体中,2)所述载体的所述Red同源重组系 统由λ卩策菌体exo、bet、gam三个基因组成,它们分别编码Exo、Beta、Gam三种蛋白质。
[0018] 上述大肠杆菌CRISPR/Cas9基因编辑载体中,3)所述载体的SEQIDNo. 1的第 10577-11371位的核苷酸序列为卡那霉素抗性基因;SEQIDNo. 1的第11868-4059位的核 苷酸序列为所述Cas9蛋白基因;SEQIDNo. 1的第4060-4114位的核苷酸序列为所述终 止Cas9蛋白基因转录的终止子;SEQIDNo. 1的第4115-4158位的核苷酸序列为所述启动 gRNA的编码DNA转录的启动子;SEQIDNo. 1的第4183-4260位的核苷酸序列为所述gRNA 的编码DNA;SEQIDNo. 1的第4494-6188位的核苷酸序列为所述复制起始位点(origin), 所述复制起始位点(origin)包括所述oriRlOl基因和所述repAlOl基因,SEQIDNo. 1的 第4494-5444位的核苷酸序列为所述r印A101基因,SEQIDNo. 1的第5448-6188位的核 苷酸序列为所述oriRlOl基因;SEQIDNo. 1的第6452-7684位的核苷酸序列为所述阿拉 伯糖操纵子,SEQIDNo. 1的第6452-7330位所示的核苷酸序列为所述AraC蛋白基因,SEQ IDNo. 1的第7333-7684位的核苷酸序列和SEQIDNo. 1的第11516-11867位的核苷酸 序列均为所述操纵区域;SEQIDNo. 1的第7658-9569位的核苷酸序列为所述Red同源重 组系统;SEQIDNo. 1的第9566-9748位的核苷酸序列为orf60a基因;SEQIDNo. 1的第 9842-10436位的核苷酸序列为所述同源重组元件的上游同源臂和下游同源臂。
[0019] 上述谷氨酸棒状杆菌CRISPR/Cas9基因编辑载体中,含有终止所述Cas9蛋白基因 转录的终止子、启动所述gRNA的编码DNA转录的启动子和终止所述gRNA的编码DNA转录 的终止子。
[0020] 上述谷氨酸棒状杆菌CRISPR/Cas9基因编辑载体中,所述操纵子为乳糖操纵子, 所述乳糖操纵子由laclq基因和Ptrc启动子组成,调控所述Cas9蛋白基因的转录。
[0021] 上述谷氨酸棒状杆菌CRISPR/Cas9基因编辑载体为1)或2)的载体:
[0022] 1)所述载体由所述乳糖操纵子、与所述乳糖操纵子连接的所述Cas9蛋白基因、 与所述Cas9蛋白基因连接的所述终止所述Cas9蛋白基因转录的终止子、与所述终止所述 Cas9蛋白基因转录的终止子连接的所述启动所述gRNA的编码DNA转录的启动子、与所述 启动所述gRNA的编码DNA转录的启动子连接的所述gRNA的编码DNA、与所述gRNA的编码 DNA连接的所述终止所述gRNA的编码DNA转录的终止子、与所述终止所述gRNA的编码DNA 转录的终止子连接的per基因,与所述per基因连接的所述复制起始位点、与所述复制起始 位点连接的所述筛选标记基因、与所述筛选标记基因连接的所述同源重组元件组成;
[0023] 2)所述载体的核苷酸序列为SEQIDNo. 2。
[0024] 上述谷氨酸棒状杆菌CRISPR/Cas9基因编辑载体中,1)所述的载体的所述复制 起始位点可为r印A101基因;所述同源重组元件含有与所述受体菌的基因组DNA靶位点 附近发生同源重组的上游同源臂和下游同源臂;所述per基因具体可为SEQIDNo.2的第 5422-5367位所示的核苷酸序列。
[0025] 上述谷氨酸棒状杆菌CRISPR/Cas9基因编辑载体中,2)所述的载体的SEQID No. 2的第11351-12735位的核苷酸序列为所述乳糖操纵子,SEQIDNo. 2的第11351-12433 位的核苷酸序列为乳糖操纵子中的laclq基因,SEQIDNo. 2的第12490-12735位的核苷 酸序列为乳糖操纵子中的Ptrc启动子;SEQIDNo. 2的第12755-4069位的核苷酸序列为 所述Cas9蛋白基因;SEQIDNo. 2的第4070-4124位的核苷酸序列为所述终止Cas9蛋白 基因转录的终止子;SEQIDNo. 2的第4125-4168位的核苷酸序列为所述启动gRNA的编码 DNA转录的启动子;SEQIDNo. 2的第4193-4270位的核苷酸序列为所述gRNA的编码DNA; SEQIDNo. 2的第4271-4701位的核苷酸序列为所述终止gRNA的编码DNA转录的终止子; SEQIDNo. 2的第5422-5367位的核苷酸序列为per基因;SEQIDNo. 2的第6280-7743位 的核苷酸序列为所述复制起始位点(origin),所述复制起始位点(origin)为repAlOl基 因;SEQIDNo. 2的第8273-9067位的核苷酸序列为卡那霉素抗性基因