CRISPR酶以及系统的制作方法

文档序号:33320184发布日期:2023-03-03 19:58阅读:30来源:国知局
CRISPR酶以及系统的制作方法
crispr酶以及系统
技术领域
1.本发明涉及基因编辑领域,特别是规律成簇的间隔短回文重复(crispr)技术领域。具体而言,本发明涉及crispr酶以及系统,具体涉及一种扩大pam识别范围的cas蛋白、相应的crispr系统及应用。


背景技术:

2.crispr/cas技术是一种被广泛使用的基因编辑技术,它通过rna引导对基因组上的靶序列进行特异性结合并切割dna产生双链断裂,利用生物非同源末端连接或同源重组进行定点基因编辑。
3.crispr/cas9系统是最常用的ii型crispr系统,它识别3
’‑
ngg的pam基序,对靶标序列进行平末端切割。crispr/cas type v系统是一类新发现的crispr系统,它具有5
’‑
ttn的基序,对靶标序列进行粘性末端切割,例如cpf1,c2c1,casx,casy。然而目前存在的不同的crispr/cas各有不同的优点和缺陷。例如cas9,c2c1和casx均需要两条rna进行指导rna,而cpf1只需要一条指导rna而且可以用来进行多重基因编辑。casx具有980个氨基酸的大小,而常见的cas9,c2c1,casy和cpf1通常大小在1300个氨基酸左右。此外,cas9,cpf1,casx,casy的pam序列都比较复杂多样,而c2c1识别严谨的5
’‑
ttn,因此它的靶标位点比其他系统容易被预测从而降低了潜在的脱靶效应。
4.中国发明专利cn114672473a中公开了一种氨基酸产生突变的cas蛋白,还公开了该蛋白可以在真核细胞中进行基因编辑,但是,其识别的pam位点为ttn,本技术经过实验验证,拓宽了该蛋白对于pam的识别范围,提高了在真核细胞中的编辑范围,扩展了其应用范围。


技术实现要素:

5.本技术的发明人经过大量实验和反复摸索,提供了一种pam识别范围更大的crispr/cas系统,扩展了靶点的选择范围,增加了其应用范围,有良好的应用前景。
6.一方面,本发明提供了一种工程化的、非天然存在的crispr系统,包含
7.a)cas蛋白,所述cas蛋白的氨基酸序列如seq id no.1所示,以及
8.b)至少一种被设计与所述cas蛋白形成复合物的grna,其中所述grna包含与靶序列杂交的区域,其中所述靶序列位于原型间隔区相邻基序(pam)的3’端,且所述pam序列为atn,其中n选自a、t、c或g中的任意一种。
9.一方面,本发明提供了一种工程化、非天然存在的crispr系统,包含
10.a)一种或多种编码上述cas蛋白的核苷酸序列,以及
11.b)一种或多种编码至少一种grna的核苷酸序列,所述至少一种grna与所述cas蛋白形成复合物,其中所述grna与靶核酸杂交,其中所述靶序列位于原型间隔区相邻基序(pam)的3’端,且所述pam序列为atn,其中n选自a、t、c或g中的任意一种。
12.上述系统中,所述cas蛋白的生物学功能包括但不限于,与指导rna结合的活性、核
酸内切酶活性、在指导rna引导下与靶序列特定位点结合并切割的活性,包括但不限于cis切割活性和trans切割活性。
13.本发明中,“cas突变蛋白”也可以称之为突变的cas蛋白,或者cas蛋白变体。
14.本发明中,所述grna包括第一区段和第二区段;所述第一区段称为“骨架区”、“蛋白质结合区段”、“蛋白质结合序列”、或者“同向重复(direct repeat)序列”;所述第二区段又称为“靶向核酸的靶向序列”或者“靶向核酸的靶向区段”,或者“靶向靶序列的引导序列”。
15.所述grna的第一区段能够与本发明的cas蛋白相互作用,从而使cas蛋白和grna形成复合物。
16.在优选的实施方式中,所述第一区段为如上所述的同向重复序列。
17.本发明靶向核酸的靶向序列或靶向核酸的靶向区段包含与靶核酸中的靶序列互补的核苷酸序列。换言之,本发明靶向核酸的靶向序列或靶向核酸的靶向区段经过杂交(即,碱基配对)以序列特异性方式与靶核酸相互作用。其中,所述靶序列位于原型间隔区相邻基序(pam)的3’端;前述pam序列为5
’‑
atn-3’,其中,n=c/g/a/t。
18.因此,靶向核酸的靶向序列或靶向核酸的靶向区段可改变,或可被修饰以杂交靶核酸内的任何希望的序列。所述核酸选自dna或rna。
19.在一种实施方式中,所述编码所述cas蛋白的核酸序列和编码一种或多种指导rna的核酸是人工合成的。
20.在一种实施方式中,所述编码所述cas蛋白的核酸序列和编码一种或多种指导rna的核酸并不共同天然存在。
21.在一个实施方式中,所述的核苷酸序列经过密码子优化用于在原核细胞中进行表达。
22.在一个实施方式中,所述的核苷酸序列经过密码子优化用于在真核细胞中进行表达。
23.一方面,本发明还提供了一种包含一种或多种载体的工程化的、非天然存在的载体系统,其中包含
24.a)可操作地连接一种或多种编码上述cas蛋白的核苷酸序列的第一调控元件;
25.b)可操作地连接一种或多种编码至少一种grna的核苷酸序列的第二调控元件,所述至少一种grna与所述cas蛋白形成复合物,其中所述grna与靶序列杂交,其中所述靶序列位于原型间隔区相邻基序(pam)的3’端且所述pam序列为atn,其中n选自a、t、c或g中的任意一种;
26.组分(a)和(b)位于所述系统的相同或者不同的载体上。
27.所述第一和第二调控元件包括启动子(例如,组成型启动子或诱导型启动子)、增强子(例如35s promoter或35s enhanced promoter)、内部核糖体进入位点(ires)、和其他表达控制元件(例如转录终止信号,如多聚腺苷酸化信号和多聚u序列)。
28.在一些实施方案中,所述系统中的载体是病毒载体(例如逆转录病毒载体,慢病毒载体,腺病毒载体,腺相关载体和单纯疱疹载体),还可以是质粒、病毒、粘粒、噬菌体等类型,它们是本领域技术人员所熟知的。
29.在一些实施例中,本文提供的系统处于递送系统中。在一些实施方案中,递送系统
是纳米颗粒,脂质体,外体,微泡和基因枪。
30.在一个实施方式中,所述靶序列是来自原核细胞或真核细胞的dna或rna序列。在一个实施方式中,所述靶序列是非天然存在的dna或rna序列。
31.在一个实施方式中,所述靶序列存在于细胞内。在一个实施方式中,所述靶序列存在于细胞核内或细胞质(例如,细胞器)内。在一个实施方式中,所述细胞是真核细胞。在其他实施方式中,所述细胞是原核细胞。
32.另一方面,本发明涉及一种工程化、非天然存在的crispr系统,所述系统包含
33.(a)上述cas蛋白,所述cas蛋白的氨基酸序列如seq id no.1所示;或一种或多种编码所述cas蛋白核苷酸序列,以及
34.(b)至少一种与所述cas蛋白形成复合物的grna,其中所述grna与靶序列杂交,或一种或多种编码所述至少一种grna的核苷酸序列,其中所述靶序列位于原型间隔区相邻基序(pam)的3’端,且所述pam序列为atn,其中n选自a、t、c或g中的任意一种。
35.在一个实施方式中,本发明中的cas蛋白还包括其他的修饰部分;在一个实施方式中,所述cas蛋白和其他的修饰部分可以为融合蛋白。
36.在一个实施方式中,所述修饰部分选自另外的蛋白或多肽、可检测的标记或其任意组合。
37.在一个实施方式中,所述修饰部分选自表位标签、报告基因序列、核定位信号(nls)序列、靶向部分、转录激活结构域(例如,vp64)、转录抑制结构域(例如,krab结构域或sid结构域)、核酸酶结构域(例如,fok1),以及具有选自下列的活性的结构域:核苷酸脱氨酶,甲基化酶活性,去甲基化酶,转录激活活性,转录抑制活性,转录释放因子活性,组蛋白修饰活性,核酸酶活性,单链rna切割活性,双链rna切割活性,单链dna切割活性,双链dna切割活性和核酸结合活性;以及其任意组合。所述nls序列是本领域技术人员熟知的,其实例包括但不限于所述,sv40大t抗原,egl-13,c-myc以及tus蛋白。
38.在一个实施方式中,所述nls序列位于、靠近或接近本发明的cas蛋白的末端(例如,n端、c端或两端)。
39.所述表位标签(epitope tag)是本领域技术人员熟知的,包括但不限于his、v5、flag、ha、myc、vsv-g、trx等,并且本领域技术人员可以选择其他合适的表位标签(例如,纯化、检测或示踪)。
40.所述报告基因序列是本领域技术人员熟知的,其实例包括但不限于gst、hrp、cat、gfp、hcred、dsred、cfp、yfp、bfp等。
41.在一个实施方式中,本发明的融合蛋白包含能够与dna分子或细胞内分子结合的结构域,例如麦芽糖结合蛋白(mbp)、lex a的dna结合结构域(dbd)、gal4的dbd等。
42.在一个实施方式中,本发明的融合蛋白包含可检测的标记,例如荧光染料,例如fitc或dapi。
43.在一个实施方式中,本发明的cas蛋白任选地通过接头与所述修饰部分偶联、缀合或融合。
44.在一个实施方式中,所述修饰部分直接连接至本发明的cas蛋白的n端或c端。
45.在一个实施方式中,所述修饰部分通过接头连接至本发明的cas蛋白的n端或c端。这类接头是本领域熟知的,其实例包括但不限于包含一个或多个(例如,1个,2个,3个,4个
或5个)氨基酸(如,glu或ser)或氨基酸衍生物(如,ahx、β-ala、gaba或ava)的接头,或peg等。
46.本发明的cas蛋白、蛋白衍生物或融合蛋白不受其产生方式的限定,例如,其可以通过基因工程方法(重组技术)产生,也可以通过化学合成方法产生。
47.在一个实施方式中,所述靶序列为真核细胞中的靶序列。
48.在一个实施方式中,所述真核细胞是动物细胞,例如,哺乳动物细胞。
49.在一个实施方式中,所述真核细胞是人类细胞。
50.在一个实施方式中,所述真核细胞是植物细胞,例如栽培植物(如水稻、玉米、高粱、小麦或木薯)、藻类、树或蔬菜具有的细胞。
51.在一个实施方式中,所述的多核苷酸优选是单链的或双链的。
52.另一方面,本发明提供了一种修饰真核细胞靶序列特定位点的方法,包括递送上述所述crispr/cas系统、上述载体系统到所述细胞中,其中所述grna与所述靶序列杂交产生特定位点的修饰,所述靶序列位于原型间隔区相邻基序(pam)的3’端,所述pam序列为atn,其中n选自a、t、c或g中的任意一种。
53.在一个实施方式中,该方法包括将包含cas蛋白和一种和多种核酸组分形成复合物递送至所述细胞后,cas蛋白诱导对特定位点的靶序列的修饰。
54.在一个实施方式中,修饰是链断裂的引入。
55.在一个实施方式中,链断裂是交错切割的。
56.在一个实施方式中,所述递送包括将一种或多种编码所述cas蛋白的核苷酸序列和一种或多种编码所述至少一种grna的核苷酸序列递送至所述细胞中。
57.在一个实施方式中,所述一个或多个核酸序列被包含在一个或多个载体中。
58.本发明还提供了一种编辑靶核酸、靶向靶核酸或切割靶核酸的方法,所述方法包括将靶核酸与前述crispr系统、载体系统进行接触的步骤,所述系统中的grna包含与所述靶核酸上的靶序列杂交的区域,其中,所述靶序列位于原型间隔区相邻基序(pam)的3’端,所述pam序列为atn,其中n选自a、t、c或g中的任意一种。
59.在一个实施方式中,所述编辑靶核酸、靶向靶核酸或切割靶核酸的方法为在细胞内或细胞外编辑靶核酸、靶向靶核酸或切割靶核酸。
60.所述基因编辑或编辑靶核酸包括修饰基因、敲除基因、改变基因产物的表达、修复突变、和/或插入多核苷酸、基因突变。
61.所述编辑可以在原核细胞和/或真核细胞中进行编辑。
62.本发明还提供了上述crispr系统、载体系统在制备试剂或试剂盒中的用途,所述试剂或试剂盒用于编辑靶核酸、靶向靶核酸、切割靶核酸,上述所述系统中的grna包含与所述靶核酸上的靶序列杂交的区域,其中,所述靶序列位于原型间隔区相邻基序(pam)的3’端,且所述pam序列为atn,其中n选自a、t、c或g中的任意一种。
63.在一个实施方式中,所述靶核酸为真核细胞中的靶核酸;优选的,所述真核细胞为植物细胞、动物细胞和人类细胞。
64.术语定义
65.在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的分子遗传学、核酸化学、化学、分子生物学、生
物化学、细胞培养、微生物学、细胞生物学、基因组学和重组dna等操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
66.本文中的核酸切割或切割核酸包括:由本文所述cas酶产生的靶核酸中的dna或rna断裂(cis切割)、dna或rna在侧枝核酸底物(单链核酸底物)中的断裂(即非特异性或非靶向性,trans切割)。在一些实施方式中,所述切割是双链dna断裂。在一些实施方案中,切割是单链dna断裂或单链rna断裂。
67.crispr系统
68.如本文中所使用的,术语“规律成簇的间隔短回文重复(crispr)-crispr-相关(cas)(crispr-cas)系统”或“crispr系统”可互换地使用并且具有本领域技术人员通常理解的含义,其通常包含与crispr相关(“cas”)基因的表达有关的转录产物或其他元件,或者能够指导所述cas基因活性的转录产物或其他元件。
69.crispr/cas复合物
70.如本文中所使用的,术语“crispr/cas复合物”是指,指导rna(guide rna)或成熟crrna与cas蛋白结合所形成的复合体,其包含杂交到靶序列的引导序列上并且与cas蛋白结合的同向重复序列,该复合体能够识别并切割能与该指导rna或成熟crrna杂交的多核苷酸。
71.指导rna(guide rna,grna)
72.如本文中所使用的,术语“指导rna(guide rna,grna)”、“成熟crrna”、“指导序列”可互换地使用并且具有本领域技术人员通常理解的含义。一般而言,指导rna可以包含同向重复序列(direct repeat)和引导序列,或者基本上由或由同向重复序列和引导序列组成。
73.在某些情况下,指导序列是与靶序列具有足够互补性从而与所述靶序列杂交并引导crispr/cas复合物与所述靶序列的特异性结合的任何多核苷酸序列。在一个实施方式中,当最佳比对时,指导序列与其相应靶序列之间的互补程度为至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少99%。确定最佳比对在本领域的普通技术人员的能力范围内。例如,存在公开和可商购的比对算法和程序,诸如但不限于clustalw、matlab中的史密斯-沃特曼算法(smith-waterman)、bowtie、geneious、biopython以及seqman。
74.靶序列
[0075]“靶序列”是指被grna中的引导序列所靶向的多核苷酸,例如与该引导序列具有互补性的序列,其中靶序列与引导序列之间的杂交将促进crispr/cas复合物(包括cas蛋白和grna)的形成。完全互补性不是必需的,只要存在足够互补性以引起杂交并且促进一种crispr/cas复合物的形成即可。
[0076]
靶序列可以包含任何多核苷酸,如dna或rna。在某些情况下,所述靶序列位于细胞内或细胞外。在某些情况下,所述靶序列位于细胞的细胞核或细胞质中。在某些情况下,该靶序列可位于真核细胞的一个细胞器例如线粒体或叶绿体内。可被用于重组到包含该靶序列的靶基因座中的序列或模板被称为“编辑模板”或“编辑多核苷酸”或“编辑序列”。在一个实施方式中,所述编辑模板为外源核酸。在一个实施方式中,该重组是同源重组。
[0077]
在本发明中,“靶序列”或“靶多核苷酸”或“靶核酸”可以是对细胞(例如,真核细胞)而言任何内源或外源的多核苷酸。例如,该靶多核苷酸可以是一种存在于真核细胞的细
胞核中的多核苷酸。该靶多核苷酸可以是一个编码基因产物(例如,蛋白质)的序列或一个非编码序列(例如,调节多核苷酸或无用dna)。在某些情况下,该靶序列应该与原间隔序列临近基序(pam)相关。
[0078]
野生型
[0079]
如本文中所使用的,术语“野生型”具有本领域技术人员通常理解的含义,其表示生物、菌株、基因的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征,其可从自然中的来源分离并且没有被人为有意地修饰。
[0080]
衍生化
[0081]
如本文中所使用的,术语“衍生化”是指,对氨基酸、多肽或蛋白的化学修饰,其中一个或多个取代基已与所述氨基酸、多肽或蛋白共价连接。取代基也可称为侧链。
[0082]
衍生化的蛋白是该蛋白的衍生物,通常,蛋白的衍生化不会不利影响该蛋白的期望活性(例如,与指导rna结合的活性、核酸内切酶活性、在指导rna引导下与靶序列特定位点结合并切割的活性),也就是说蛋白的衍生物与蛋白有相同的活性。
[0083]
衍生化蛋白
[0084]
又称“蛋白衍生物”,是指蛋白的经修饰形式,例如其中所述蛋白的一个或多个氨基酸可以被缺失、插入、修饰和/或取代。
[0085]
非天然存在的
[0086]
如本文中所使用的,术语“非天然存在的”或“工程化的”可互换地使用并且表示人工的参与。当这些术语用于描述核酸分子或多肽时,其表示该核酸分子或多肽至少基本上从它们在自然界中或如发现于自然界中的与其结合的至少另一种组分游离出来。
[0087]
载体
[0088]
术语“载体”是指一种核酸分子,它能够运送与其连接的另一种核酸分子。载体包括但不限于,单链、双链、或部分双链的核酸分子;包括一个或多个自由端、无自由端(例如环状的)的核酸分子;包括dna、rna、或两者的核酸分子;以及本领域已知的其他多种多样的多核苷酸。载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。一种载体可以被引入到宿主细胞中而由此产生转录物、蛋白质、或肽,包括由如本文所述的蛋白、融合蛋白、分离的核酸分子等(例如,crispr转录物,如核酸转录物、蛋白质、或酶)。一种载体可以含有多种控制表达的元件,包括但不限于,启动子序列、转录起始序列、增强子序列、选择元件及报告基因。另外,载体还可含有复制起始位点。
[0089]
一种类型的载体是“质粒”,其是指其中可以例如通过标准分子克隆技术插入另外的dna片段的环状双链dna环。
[0090]
另一种类型的载体是病毒载体,其中病毒衍生的dna或rna序列存在于用于包装病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒)的载体中。病毒载体还包含由用于转染到一种宿主细胞中的病毒携带的多核苷酸。某些载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。
[0091]
其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中,并且由此与该宿主基因组一起复制。而且,某些载体能够指导它们可操作连接的基因的表达。这样的载体在此被称为“表达载体”。
[0092]
宿主细胞
[0093]
如本文中所使用的,术语“宿主细胞”是指,可用于导入载体的细胞,其包括但不限于,如大肠杆菌或枯草菌等的原核细胞,如微生物细胞、真菌细胞、动物细胞和植物细胞的真核细胞。
[0094]
本领域技术人员将理解,表达载体的设计可取决于诸如待转化的宿主细胞的选择、所希望的表达水平等因素。
[0095]
调控元件
[0096]
如本文中所使用的,术语“调控元件”旨在包括启动子、增强子、内部核糖体进入位点(ires)、和其他表达控制元件(例如转录终止信号,如多聚腺苷酸化信号和多聚u序列),其详细描述可参考戈德尔(goeddel),《基因表达技术:酶学方法》(gene expression technology:methods in enzymology)185,学术出版社(academic press),圣地亚哥(san diego),加利福尼亚州(1990)。在某些情况下,调控元件包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如,组织特异型调节序列)。组织特异型启动子可主要指导在感兴趣的期望组织中的表达,所述组织例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如肝脏、胰腺)、或特殊的细胞类型(例如淋巴细胞)。在某些情况下,调控元件还可以时序依赖性方式(如以细胞周期依赖性或发育阶段依赖性方式)指导表达,该方式可以是或者可以不是组织或细胞类型特异性的。在某些情况下,术语“调控元件”涵盖的是增强子元件,如wpre;cmv增强子;在htlv-i的ltr中的r-u5’片段((mol.cell.biol.,第8(1)卷,第466-472页,1988);sv40增强子;以及在兔β-珠蛋白的外显子2与3之间的内含子序列(proc.natl.acad.sci.usa.,第78(3)卷,第1527-31页,1981)。
[0097]
启动子
[0098]
如本文中所使用的,术语“启动子”具有本领域技术人员公知的含义,其是指一段位于基因的上游能启动下游基因表达的非编码核苷酸序列。组成型(constitutive)启动子是这样的核苷酸序列:当其与编码或者限定基因产物的多核苷酸可操作地相连时,在细胞的大多数或者所有生理条件下,其导致细胞中基因产物的产生。诱导型启动子是这样的核苷酸序列,当可操作地与编码或者限定基因产物的多核苷酸相连时,基本上只有当对应于所述启动子的诱导物在细胞中存在时,其导致所述基因产物在细胞内产生。组织特异性启动子是这样的核苷酸序列:当可操作地与编码或者限定基因产物的多核苷酸相连时,基本上只有当细胞是该启动子对应的组织类型的细胞时,其才导致在细胞中产生基因产物。
[0099]
nls
[0100]“核定位信号”或“核定位序列”(nls)是对蛋白质“加标签”以通过核转运导入细胞核的氨基酸序列,即,具有nls的蛋白质被转运至细胞核。典型地,nls包含暴露在蛋白质表面的带正电荷的lys或arg残基。示例性核定位序列包括但不限于来自以下的nls:sv40大t抗原,egl-13,c-myc以及tus蛋白。在一些实施例中,该nls包含pkkkrkv序列。在一些实施例中,该nls包含avkrpaatkkagqakkkkld序列。在一些实施例中,该nls包含paakrvkld序列。在一些实施例中,该nls包含msrrrkanptklsenakklakeven序列。在一些实施例中,该nls包含klkikrpvk序列。其他核定位序列包括但不限于hnrnp a1的酸性m9结构域、酵母转录抑制子matα2中的序列kipik和py-nls。
[0101]
可操作地连接
[0102]
如本文中所使用的,术语“可操作地连接”旨在表示感兴趣的核苷酸序列以一种允许该核苷酸序列的表达的方式被连接至该一种或多种调控元件(例如,处于一种体外转录/翻译系统中或当该载体被引入到宿主细胞中时,处于该宿主细胞中)。
[0103]
互补性
[0104]
如本文中所使用的,术语“互补性”是指核酸与另一个核酸序列借助于传统的沃森-克里克或其他非传统类型形成一个或多个氢键的能力。互补百分比表示一个核酸分子中可与一个第二核酸序列形成氢键(例如,沃森-克里克碱基配对)的残基的百分比(例如,10个之中有5、6、7、8、9、10个即为50%、60%、70%、80%、90%、和100%互补)。“完全互补”表示一个核酸序列的所有连续残基与一个第二核酸序列中的相同数目的连续残基形成氢键。如本文使用的“基本上互补”是指在一个具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上至少为60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互补程度,或者是指在严格条件下杂交的两个核酸。
[0105]
严格条件
[0106]
如本文中所使用的,对于杂交的“严格条件”是指与靶序列具有互补性的一个核酸主要地与该靶序列杂交并且基本上不杂交到非靶序列上的条件。严格条件通常是序列依赖性的,并且取决于许多因素而变化。一般而言,该序列越长,则该序列特异性地杂交到其靶序列上的温度就越高。
[0107]
杂交
[0108]
术语“杂交”或“互补的”或“基本上互补的”是指核酸(例如rna、dna)包含使其能够非共价结合的核苷酸序列,即以序列特异性,反平行的方式(即核酸特异性结合互补核酸)与另一核酸形成碱基对和/或g/u碱基对,“退火”或“杂交”。
[0109]
杂交需要两个核酸含有互补序列,尽管碱基之间可能存在错配。两个核酸之间杂交的合适条件取决于核酸的长度和互补程度,这是本领域公知的变量。典型地,可杂交核酸的长度为8个核苷酸或更多(例如,10个核苷酸或更多,12个核苷酸或更多,15个核苷酸或更多,20个核苷酸或更多,22个核苷酸或更多,25个核苷酸或更多,或30个核苷酸或更多)。
[0110]
应当理解,多核苷酸的序列不需要与其靶核酸的序列100%互补以特异性杂交。多核苷酸可包含60%或更高,65%或更高,70%或更高,75%或更高,80%或更高,85%或更高,90%或更高,95%或更高,98%或更高,99%或更高,99.5%或更高,或与其杂交的靶核酸序列中的靶区域的序列互补性为100%。
[0111]
靶序列与grna的杂交代表靶序列和grna的核酸序列至少60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的可以杂交,形成复合物;或者代表靶序列和grna的核酸序列至少有12个、15个、16个、17个、18个、19个、20个、21个、22个或更多个碱基可以互补配对,杂交形成复合物。
[0112]
表达
[0113]
如本文中所使用的,术语“表达”是指,藉此从dna模板转录成多核苷酸(如转录成mrna或其他rna转录物)的过程和/或转录的mrna随后藉此翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以总称为“基因产物”。如果多核苷酸来源于基因组dna,表达可以包
括真核细胞中mrna的剪接。
[0114]
接头
[0115]
如本文中所使用的,术语“接头”是指,由多个氨基酸残基通过肽键连接形成的线性多肽。本发明的接头可以为人工合成的氨基酸序列,或天然存在的多肽序列,例如具有铰链区功能的多肽。此类接头多肽是本领域众所周知的(参见例如,holliger,p.等人(1993)proc.natl.acad.sci.usa 90:6444-6448;poljak,r.j.等人(1994)structure 2:1121-1123)。
[0116]
治疗
[0117]
如本文中所使用的,术语“治疗”是指,治疗或治愈病症,延缓病症的症状的发作,和/或延缓病症的发展。
[0118]
受试者
[0119]
如本文中所使用的,术语“受试者”包括但不限于各种动物、植物和微生物。
[0120]
动物
[0121]
例如哺乳动物,例如牛科动物、马科动物、羊科动物、猪科动物、犬科动物、猫科动物、兔科动物、啮齿类动物(例如,小鼠或大鼠)、非人灵长类动物(例如,猕猴或食蟹猴)或人。在某些实施方式中,所述受试者(例如人)患有病症(例如,疾病相关基因缺陷所导致的病症)。
[0122]
植物
[0123]
术语“植物”应理解为能够进行光合作用的任何分化的多细胞生物,在包括处于任何成熟或发育阶段的作物植物,特别是单子叶或双子叶植物,蔬菜作物,包括洋蓟、球茎甘蓝、芝麻菜、韭葱、芦笋、莴苣(例如,结球莴苣、叶莴苣、长叶莴苣)、小白菜(bok choy)、黄肉芋、瓜类(例如,甜瓜、西瓜、克伦肖瓜(crenshaw)、白兰瓜、罗马甜瓜)、油菜作物(例如,球芽甘蓝、卷心菜、花椰菜、西兰花、羽衣甘蓝、无头甘蓝、大白菜、小白菜)、刺菜蓟、胡萝卜、洋白菜(napa)、秋葵、洋葱、芹菜、欧芹、鹰嘴豆、欧洲防风草、菊苣、胡椒、马铃薯、葫芦(例如,西葫芦、黄瓜、小西葫芦、倭瓜、南瓜)、萝卜、干球洋葱、芜菁甘蓝、紫茄子(也称为茄子)、婆罗门参、苣菜、青葱、苦苣、大蒜、菠菜、绿洋葱、倭瓜、绿叶菜类(greens)、甜菜(糖甜菜和饲料甜菜)、甘薯、唐莴苣、山葵、西红柿、芜菁、以及香辛料;水果和/或蔓生作物,如苹果、杏、樱桃、油桃、桃、梨、李子、西梅、樱桃、榅桲、杏仁、栗子、榛子、山核桃、开心果、胡桃、柑橘、蓝莓、博伊增莓(boysenberry)、小红莓、穗醋栗、罗甘莓、树莓、草莓、黑莓、葡萄、鳄梨、香蕉、猕猴桃、柿子、石榴、菠萝、热带水果、梨果、瓜、芒果、木瓜、以及荔枝;大田作物,如三叶草、苜蓿、月见草、白芒花、玉米/玉蜀黍(饲料玉米、甜玉米、爆米花)、啤酒花、荷荷芭、花生、稻、红花、小粒谷类作物(大麦、燕麦、黑麦、小麦等)、高粱、烟草、木棉、豆科植物(豆类、小扁豆、豌豆、大豆)、含油植物(油菜、芥菜、橄榄、向日葵、椰子、蓖麻油植物、可可豆、落花生)、拟南芥属、纤维植物(棉花、亚麻、黄麻)、樟科(肉桂、莰酮)、或一种植物如咖啡、甘蔗、茶、以及天然橡胶植物;和/或花坛植物,如开花植物、仙人掌、肉质植物和/或观赏植物,以及树如森林(阔叶树和常绿树,如针叶树)、果树、观赏树、以及结坚果的树(nut-bearing tree)、以及灌木和其他苗木。
[0124]
发明的有益效果
[0125]
本发明拓宽了cas蛋白pam识别范围,扩大了crispr系统靶点可选择的范围,具有
广泛的应用前景。
[0126]
下面将结合附图和实施例对本发明的实施方案进行详细描述,但是本领域技术人员将理解,下列附图和实施例仅用于说明本发明,而不是对本发明的范围的限定。根据附图和优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说将变得显然。
附图说明
[0127]
图1.pam为ata时,不同蛋白对于靶点1的识别编辑的效率。其中横坐标代表靶点,1代表靶点1:396-g1;纵坐标代表编辑效率;不同柱子代表不同蛋白,空白柱子代表野生型cas12i(wt),黑色柱子代表第369和第433双突的cas12i蛋白(369/433),条纹柱子代表第7位突变的cas12i蛋白(s7r)。
[0128]
图2.pam为att时,不同蛋白对于不同靶点的识别编辑的效率。其中横坐标代表不同靶点,1代表靶点1:396-g2,2代表靶点2:pyl-6-g2,3代表靶点3:nal-g2;纵坐标代表编辑效率;不同柱子代表不同蛋白,空白柱子代表野生型cas12i(wt),黑色柱子代表第369和第433双突的cas12i蛋白(369/433),条纹柱子代表第7位突变的cas12i蛋白(s7r)。
[0129]
图3.pam为atc时,不同蛋白对于不同靶点的识别编辑的效率。其中横坐标代表不同靶点,1代表靶点1:396-g3,2代表靶点2:pyl-6-g3,3代表靶点3:nal-g3,4代表靶点4:nramp5-g3;纵坐标代表编辑效率;不同柱子代表不同蛋白,空白柱子代表野生型cas12i(wt),黑色柱子代表第369和第433双突的cas12i蛋白(369/433),条纹柱子代表第7位突变的cas12i蛋白(s7r)。
[0130]
图4.pam为atg时,不同蛋白对于不同靶点的识别编辑的效率。其中横坐标代表不同靶点,1代表靶点1:396-g4,2代表靶点2:pyl-6-g4,3代表靶点3:nal-g4,4代表靶点4:nramp5-g4;纵坐标代表编辑效率;不同柱子代表不同蛋白,空白柱子代表野生型cas12i(wt),黑色柱子代表第369和第433双突的cas12i蛋白(369/433),条纹柱子代表第7位突变的cas12i蛋白(s7r)。
具体实施方式
[0131]
以下实施例仅用于描述本发明,而非限定本发明。除非特别指明,否则基本上按照本领域内熟知的以及在各种参考文献中描述的常规方法进行实施例中描述的实验和方法。例如,本发明中所使用的免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组dna等常规技术,可参见萨姆布鲁克(sambrook)、弗里奇(fritsch)和马尼亚蒂斯(maniatis),《分子克隆:实验室手册》(molecular cloning:a laboratory manual),第2次编辑(1989);《当代分子生物学实验手册》(current protocols in molecular biology)(f.m.奥苏贝尔(f.m.ausubel)等人编辑,(1987));《酶学方法》(methods in enzymology)系列(学术出版公司):《pcr 2:实用方法》(pcr 2:a practical approach)(m.j.麦克弗森(m.j.macpherson)、b.d.黑姆斯(b.d.hames)和g.r.泰勒(g.r.taylor)编辑(1995))、哈洛(harlow)和拉内(lane)编辑(1988)《抗体:实验室手册》(antibodies,a laboratory manual),以及《动物细胞培养》(animal cell culture)(r.i.弗雷谢尼(r.i.freshney)编辑(1987))。
[0132]
另外,实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。本领域技术人员知晓,实施例以举例方式描述本发明,且不意欲限制本发明所要求保护的范围。本文中提及的全部公开案和其他参考资料以其全文通过引用合并入本文。
[0133]
实施例1.基因编辑载体构建
[0134]
针对水稻中的mi396、pyl-6、nal和nramp5基因分别设计pam为ata、att、atc和atg的靶点,具体靶点信息见表1-表4。每个载体使用单独的u3/u6启动子分别与表1-表4所示的mi396、pyl-6、nal和nramp5的靶点杂交的grna(grna的设计为本领域常规的方法,具体也可参见cn111757889b或cn114672473a)连接,再分别与野生型cas12i3(专利cn111757889b中的cas12f.4,本实施例中,将其称之为cas12i3)、s7r(专利cn114672473a中公开,本技术中的seq id no.1所示序列)、双突蛋白369/433(专利2022107953737中记载,为cas12i3第369和第433位氨基酸分别突变为r的双突蛋白,本发明中也可以称之为双突蛋白n369/s433)连接构成相应的载体。
[0135]
表1.pam为ata时靶点信息
[0136][0137]
表2.pam为att时靶点信息
[0138][0139]
表3.pam为atc时靶点信息
[0140][0141]
表4.pam为atg时靶点信息
[0142][0143]
实施例2、水稻遗传转化及编辑效率的验证
[0144]
将实施例1中构建的载体分别通过农杆菌转化,侵染水稻愈伤组织,每个载体稳定获得36株水稻。通过pcr以及测序对以上植株进行鉴定,发现不同蛋白对不同pam位点的识别以及编辑效率存在不同。
[0145]
结果如图1-图4所示。图1所示pam为ata时,s7r蛋白在靶点1(396-g1)处有明显的编辑,编辑效率为12%,但野生型cas12i3(wt)与双突蛋白n369/s433在靶点1均未发生编辑;图2所示pam为att时,s7r在靶点1(396-g2)有15%左右、靶点2(pyl-6-g2)有92%以及靶点3(nal-g2)有90%的编辑效率,明显优于其他两种蛋白的编辑活性,n369/s433在靶点2(pyl-6-g2)以及靶点3(nal-g2)表现出一定的活性,分别为68%和10%左右的编辑效率,wt仅在靶点2(pyl-6-g2)处表现出一定的活性,编辑效率为65%左右;图3所示pam为atc时,s7r在靶点1(396-g3)、靶点2(pyl-6-g3)、靶点3(nal-g3)以及靶点4(nramp5-g3)均表现出活性,编辑效率分别为80%、14%、10%、84%左右,在靶点1(396-g3)和靶点4(nramp5-g3)中具有极显著的编辑活性,n369/s433在靶点1(396-g3)以及靶点4(nramp5-g3)表现出较弱的编辑活性,编辑效率分别为6%、7%左右,wt仅在靶点1(396-g3)表现出较弱的编辑活性,编辑效率仅为8%;图4所示pam为atg时,s7r在靶点1(396-g4),靶点2(pyl-6-g4),靶点3(nal-g4)和靶点4(nramp5-g4)都具有编辑活性,编辑效率分别为:2%、54%、39%以及82%,n369/s433在靶点3(nal-g4)和靶点4(nramp5-g4)具有一定的编辑活性,编辑效率为14%和2%,wt在四个位点处均没有检测到编辑活性。
[0146]
综上所述,野生型的cas12i3除了att的pam有一个靶点有编辑以外,其他类型的atn pam序列基本不能识别;369/433的双突对atn的pam提升有限,而s7r对所测试的atn的pam序列都能实现编辑,最高的编辑效率在92%。因此s7r的突变体能对atn的pam实现编辑,扩增了cas12i3的pam识别范围。
[0147]
尽管本发明的具体实施方式已经得到详细的描述,但本领域技术人员将理解:根据已经公布的所有教导,可以对细节进行各种修改和变动,并且这些改变均在本发明。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1