包含cas12i2变体多肽的组合物及其用途
1.序列表
2.本技术含有已以ascii格式以电子方式提交且特此通过援引以其全文并入的序列表。所述ascii副本创建于2021年3月31日,命名为51451-008wo5_sequence_listing_03_30_2021_st25,并且大小为1,589,401字节。
背景技术:3.成簇规律间隔短回文重复序列(crispr)和crispr相关(cas)基因(统称为crispr-cas或crispr/cas系统)是古细菌和细菌中针对外来遗传元件而防御特定物种的适应性免疫系统。
技术实现要素:4.正是在上述背景下,本发明提供了优于现有技术的某些优点和进步。
5.尽管本文披露的本发明不限于特定的优点或功能,但本发明提供了一种变体cas12i2多肽,该多肽包含与seq id no:3至146中的任一个或seq id no:495至512中的任一个中所示的序列具有至少95%同一性的序列。
6.在变体cas12i2多肽的一个方面,变体cas12i2多肽包含seq id no:4中所示的序列。
7.在变体cas12i2多肽的另一个方面,变体cas12i2多肽包含seq id no:5中所示的序列。
8.在变体cas12i2多肽的另一个方面,变体cas12i2多肽包含seq id no:495中所示的序列。
9.在变体cas12i2多肽的另一个方面,变体cas12i2多肽包含seq id no:496中所示的序列。
10.在变体cas12i2多肽的另一个方面,变体cas12i2多肽进一步包含表2的一个或多个取代。
11.在变体cas12i2多肽的另一个方面,变体cas12i2多肽是包含seq id no:2中所示的序列的cas12i2多肽的变体。
12.本发明进一步提供了一种包含如本文所述的变体cas12i2多肽的组合物,其中组合物进一步包含rna指导物或编码rna指导物的核酸,其中rna指导物包含同向重复序列和间隔子序列。
13.在组合物的一个方面,同向重复序列包含与seq id no:492-494中的任一个具有至少95%序列同一性的核苷酸序列。
14.在组合物的另一个方面,同向重复序列包含seq id no:492-494中的任一个中所示的核苷酸序列。
15.在组合物的另一个方面,间隔子序列包含介于约11个与约50个之间的核苷酸。
16.在组合物的另一个方面,间隔子序列包含介于约15个与约35个之间的核苷酸。
17.在组合物的另一个方面,间隔子序列与靶核酸序列结合,其中靶核酸序列与5'-nttn-3'序列相邻。
18.在变体cas12i2多肽或组合物的另一个方面,变体cas12i2多肽进一步包含至少一个核定位信号(nls)、至少一个核输出信号(nes)或至少一个nls和至少一个nes。
19.在变体cas12i2多肽或组合物的另一个方面,变体cas12i2多肽进一步包含肽标签、荧光蛋白、碱基编辑结构域、dna甲基化结构域、组蛋白残基修饰结构域、定位因子、转录修饰因子、光门控因子、化学诱导型因子或染色质可视化因子。
20.在组合物的另一个方面,组合物存在于包括纳米颗粒、脂质体、外来体、微泡或基因枪的递送系统中。
21.本发明进一步提供了一种编码如本文所述的变体cas12i2多肽的核酸分子。
22.本发明进一步提供了一种包含如本文所述的组合物或变体cas12i2多肽的细胞。
23.在细胞的一个方面,细胞是真核细胞或原核细胞。
24.在细胞的另一个方面,细胞是哺乳动物细胞或植物细胞。
25.在细胞的另一个方面,细胞是人细胞。
26.本发明进一步提供了一种包含如本文所述的变体cas12i2多肽和任选的rna指导物和/或细胞的组合物或配制品。
27.本发明进一步提供了一种包含变体cas12i2多肽和rna指导物的组合物,其中cas12i2变体多肽和rna指导物形成复合物,并且其中与亲本多肽相比,变体cas12i2多肽表现出增加的与rna指导物的复合物形成。
28.本发明进一步提供了一种包含变体cas12i2多肽和rna指导物的组合物,其中cas12i2变体多肽和rna指导物形成复合物,并且其中与亲本多肽相比,cas12i2变体多肽表现出增加的对rna指导物的结合亲和力。
29.本发明进一步提供了一种包含变体cas12i2多肽和rna指导物的组合物,其中cas12i2变体多肽和rna指导物形成复合物,并且与亲本多肽和rna指导物相比,cas12i2变体多肽和rna指导物表现出增加的蛋白质-rna相互作用。
30.在组合物的一个方面,变体cas12i2多肽在例如20℃至65℃的温度范围内表现出增加的复合物形成、增加的对rna指导物的结合亲和力和/或增加的稳定性。
31.在组合物的另一个方面,变体cas12i2多肽在一定孵育时间范围内表现出增加的复合物形成、增加的对rna指导物的结合亲和力和/或增加的稳定性。
32.在组合物的另一个方面,变体cas12i2多肽在具有约7.3至约8.6范围内的ph的缓冲液中表现出增加的复合物形成、增加的对rna指导物的结合亲和力和/或增加的稳定性。
33.在组合物的另一个方面,当变体二元复合物的tm值比亲本复合物的tm值大至少8℃时,变体cas12i2多肽表现出增加的复合物形成、增加的对rna指导物的结合亲和力和/或增加的稳定性。
34.在组合物的另一个方面,亲本多肽包含seq id no:2的氨基酸序列。
35.在组合物的另一个方面,变体cas12i2多肽表现出与亲本多肽相当或比亲本多肽更大的酶活性。
36.在组合物的另一个方面,相当或更大的酶活性发生在约20℃至约90℃的温度范围内。
37.在组合物的另一个方面,变体cas12i2多肽表现出增加的稳定性和/或蛋白质-rna相互作用。
38.在组合物的另一个方面,变体cas12i2多肽进一步缺乏酶活性。
39.在组合物的另一个方面,变体cas12i2多肽进一步表现出增加的酶活性。
40.在组合物的另一个方面,变体cas12i2多肽表现出增加的rna指导物复合物形成、rna指导物结合活性和/或rna指导物结合特异性。
41.在组合物的另一个方面,变体cas12i2多肽表现出改变的在靶结合。
42.在组合物的另一个方面,变体cas12i2多肽表现出改变的脱靶结合。
43.本发明进一步提供了一种包含变体cas12i2多肽和rna指导物的组合物,其中cas12i2变体多肽和rna指导物形成变体二元复合物,并且其中变体二元复合物表现出比由亲本多肽和rna指导物形成的复合物降低的复合物解离。
44.本发明进一步提供了一种包含变体cas12i2多肽和rna指导物的组合物,其中cas12i2变体多肽和rna指导物形成变体二元复合物,并且其中rna指导物表现出比亲本复合物的rna指导物降低的与变体cas12i2多肽的解离。
45.本发明进一步提供了一种包含变体cas12i2多肽和rna指导物的组合物,其中cas12i2变体多肽和rna指导物形成变体二元复合物,并且其中变体二元复合物表现出比由亲本多肽和rna指导物形成的复合物增加的稳定性。
46.在组合物的一个方面,变体二元复合物在例如20℃至65℃的温度范围内表现出增加的三元复合物形成、增加的对靶核酸的结合亲和力和/或增加的稳定性。
47.在组合物的另一个方面,变体二元复合物在一定孵育时间范围内表现出增加的稳定性。
48.在组合物的另一个方面,变体二元复合物在具有约7.3至约8.6范围内的ph的缓冲液中表现出增加的稳定性。
49.在组合物的另一个方面,当变体二元复合物的tm值比亲本复合物的tm值大至少8℃时,变体二元复合物表现出增加的三元复合物形成、增加的对靶核酸的结合亲和力和/或增加的稳定性。
50.在组合物的另一个方面,亲本多肽包含seq id no:2的氨基酸序列。
51.在组合物的另一个方面,变体cas12i2多肽表现出与亲本多肽相当或比亲本多肽更大的酶活性。
52.在组合物的另一个方面,相当或更大的酶活性发生在约20℃至约90℃的温度范围内。
53.在组合物的另一个方面,变体cas12i2多肽表现出增加的稳定性和/或蛋白质-rna相互作用。
54.在组合物的另一个方面,变体cas12i2多肽进一步缺乏酶活性。
55.在组合物的另一个方面,变体cas12i2多肽进一步表现出增加的酶活性。
56.在组合物的另一个方面,变体cas12i2多肽表现出增加的rna指导物复合物形成、rna指导物结合活性和/或rna指导物结合特异性。
57.在组合物的另一个方面,变体cas12i2多肽表现出改变的在靶结合。
58.在组合物的另一个方面,变体cas12i2多肽表现出改变的脱靶结合。
59.本发明进一步提供了一种使如本文所述的变体cas12i2多肽与rna指导物(例如,如本文所述的rna指导物)复合的方法。
60.本发明进一步提供了一种包含变体cas12i2多肽、rna指导物和靶核酸的组合物,其中变体cas12i2多肽和rna指导物形成变体二元复合物,并且其中与亲本二元复合物相比,变体二元复合物表现出增加的与靶核酸的三元复合物形成。
61.本发明进一步提供了一种包含变体cas12i2多肽、rna指导物和靶核酸的组合物,其中cas12i2变体多肽和rna指导物形成变体二元复合物,并且其中与亲本二元复合物相比,变体二元复合物表现出增加的对靶核酸的结合亲和力。
62.本发明进一步提供了一种包含变体cas12i2多肽、rna指导物和靶核酸的组合物,其中cas12i2变体多肽和rna指导物形成变体二元复合物,并且其中与亲本二元复合物相比,变体二元复合物表现出增加的蛋白质-rna相互作用。
63.本发明进一步提供了一种包含变体cas12i2多肽、rna指导物和靶核酸的组合物,其中cas12i2变体多肽和rna指导物形成变体二元复合物,并且其中与亲本二元复合物相比,变体二元复合物表现出增加的蛋白质-dna相互作用。
64.在组合物的一个方面,变体二元复合物在例如20℃至65℃的温度范围内表现出增加的三元复合物形成、增加的对靶核酸的结合亲和力和/或增加的稳定性。
65.在组合物的另一个方面,变体二元复合物在一定孵育时间范围内表现出增加的三元复合物形成、增加的对靶核酸的结合亲和力和/或增加的稳定性。
66.在组合物的另一个方面,变体二元复合物在具有约7.3至约8.6范围内的ph的缓冲液中表现出增加的三元复合物形成、增加的对靶核酸的结合亲和力和/或增加的稳定性。
67.在组合物的另一个方面,当二元复合物的tm值比亲本二元复合物的tm值大至少8℃时,变体二元复合物表现出增加的三元复合物形成、增加的对靶核酸的结合亲和力和/或增加的稳定性。
68.在组合物的另一个方面,亲本多肽包含seq id no:2的氨基酸序列。
69.在组合物的另一个方面,变体二元复合物表现出与亲本二元复合物相当或比亲本二元复合物更大的酶活性。
70.在组合物的另一个方面,相当或更大的酶活性发生在约20℃至约90℃的温度范围内。
71.在组合物的另一个方面,变体二元复合物表现出增加的稳定性和/或蛋白质-rna相互作用。
72.在组合物的另一个方面,变体二元复合物表现出增加的稳定性和/或蛋白质-dna相互作用。
73.在组合物的另一个方面,变体二元复合物进一步缺乏酶活性。
74.在组合物的另一个方面,变体二元复合物进一步表现出增加的酶活性。
75.在组合物的另一个方面,变体cas12i2多肽表现出增加的rna指导物复合物形成、rna指导物结合活性和/或rna指导物结合特异性。
76.在组合物的另一个方面,变体二元复合物表现出增加的靶核酸复合物形成、靶核酸活性和/或靶核酸特异性。
77.在组合物的另一个方面,变体二元复合物表现出改变的在靶结合。
78.在组合物的另一个方面,变体二元复合物表现出改变的脱靶结合。
79.本发明进一步提供了一种包含变体cas12i2多肽、rna指导物和靶核酸的组合物,其中cas12i2变体多肽和rna指导物形成变体二元复合物,其中变体二元复合物和靶核酸形成变体三元复合物,并且其中变体三元复合物表现出比亲本三元复合物降低的复合物解离。
80.本发明进一步提供了一种包含变体cas12i2多肽、rna指导物和靶核酸的组合物,其中cas12i2变体多肽和rna指导物形成变体二元复合物,其中变体二元复合物和靶核酸形成变体三元复合物,并且其中靶核酸表现出比亲本三元复合物降低的与变体三元复合物的解离。
81.本发明进一步提供了一种包含变体cas12i2多肽、rna指导物和靶核酸的组合物,其中cas12i2变体多肽和rna指导物形成变体二元复合物,其中变体二元复合物和靶核酸形成变体三元复合物,并且其中变体三元复合物表现出比亲本三元复合物增加的稳定性。
82.在组合物的一个方面,变体三元复合物在例如20℃至65℃的温度范围内表现出增加的稳定性。
83.在组合物的另一个方面,变体三元复合物在一定孵育时间范围内表现出增加的稳定性。
84.在组合物的另一个方面,变体三元复合物在具有约7.3至约8.6范围内的ph的缓冲液中表现出增加的稳定性。
85.在组合物的另一个方面,当变体三元复合物的tm值比亲本三元复合物的tm值大至少8℃时,变体三元复合物表现出增加的稳定性。
86.在组合物的另一个方面,亲本多肽包含seq id no:2的氨基酸序列。
87.在组合物的另一个方面,变体cas12i2多肽表现出与亲本多肽相当或比亲本多肽更大的酶活性。
88.在组合物的另一个方面,相当或更大的酶活性发生在约20℃至约90℃的温度范围内。
89.在组合物的另一个方面,变体cas12i2多肽表现出增加的稳定性和/或蛋白质-rna相互作用。
90.在组合物的另一个方面,变体二元复合物表现出增加的稳定性和/或蛋白质-dna相互作用。
91.在组合物的另一个方面,变体三元复合物表现出增加的稳定性。
92.在组合物的另一个方面,变体二元复合物进一步缺乏酶活性。
93.在组合物的另一个方面,变体二元复合物进一步表现出增加的酶活性。
94.在组合物的另一个方面,变体cas12i2多肽表现出增加的rna指导物复合物形成、rna指导物结合活性和/或rna指导物结合特异性。
95.在组合物的另一个方面,变体二元复合物表现出增加的靶核酸复合物形成、靶核酸结合活性和/或靶核酸结合特异性。
96.在组合物的另一个方面,变体二元复合物表现出改变的在靶结合。
97.在组合物的另一个方面,变体二元复合物表现出改变的脱靶结合。
98.本发明进一步提供了一种使如本文所述的变体二元复合物与如本文所述的靶核
酸(例如,dna)复合的方法。
99.本发明进一步提供了一种包含变体cas12i2多肽和rna指导物的组合物,其中变体cas12i2多肽和rna指导物形成变体二元复合物,并且其中与亲本二元复合物相比,变体二元复合物表现出增加的对靶核酸的结合亲和力。
100.本发明进一步提供了一种包含变体cas12i2多肽和rna指导物的组合物,其中cas12i2变体多肽和rna指导物形成变体二元复合物,并且其中与亲本二元复合物相比,变体二元复合物表现出增加的对靶核酸的靶基因座的靶结合亲和力。
101.在组合物的一个方面,变体二元复合物在例如20℃至65℃的温度范围内表现出增加的三元复合物形成和/或增加的稳定性。
102.在组合物的另一个方面,变体二元复合物在一定孵育时间范围内表现出增加的三元复合物形成和/或增加的稳定性。
103.在组合物的另一个方面,变体二元复合物在具有约7.3至约8.6范围内的ph的缓冲液中表现出增加的三元复合物形成和/或增加的稳定性。
104.在组合物的另一个方面,当二元复合物的tm值比亲本二元复合物的tm值大至少8℃时,变体二元复合物表现出增加的三元复合物形成和/或增加的稳定性。
105.在组合物的另一个方面,亲本多肽包含seq id no:2的氨基酸序列。
106.在组合物的另一个方面,变体二元复合物表现出与亲本二元复合物相当或比亲本二元复合物更大的酶活性。
107.在组合物的另一个方面,相当或更大的酶活性发生在约20℃至约90℃的温度范围内。
108.在组合物的另一个方面,变体二元复合物表现出增加的稳定性和/或蛋白质-rna相互作用。
109.在组合物的另一个方面,变体二元复合物表现出增加的稳定性和/或蛋白质-dna相互作用。
110.在组合物的另一个方面,变体二元复合物进一步缺乏酶活性。
111.在组合物的另一个方面,变体二元复合物进一步表现出增加的酶活性。
112.在组合物的另一个方面,变体cas12i2多肽表现出增加的rna指导物复合物形成、rna指导物结合活性和/或rna指导物结合特异性。
113.在组合物的另一个方面,变体二元复合物表现出增加的靶核酸复合物形成、靶核酸活性和/或靶核酸特异性。
114.在组合物的另一个方面,变体二元复合物表现出改变的在靶结合。
115.在组合物的另一个方面,变体二元复合物表现出改变的脱靶结合。
116.本发明进一步提供了一种包含多个变体cas12i2多肽和两个或更多个不同的rna指导物的组合物,其中不同的rna指导物与单独的变体cas12i2多肽单独地形成变体二元复合物,并且其中变体二元复合物与靶核酸的两个或更多个靶基因座特异性结合。
117.本发明进一步提供了一种包含多个变体cas12i2多肽和两个或更多个不同的rna指导物的组合物,其中不同的rna指导物与单独的变体cas12i2多肽单独地形成变体二元复合物,并且其中与亲本二元复合物相比,变体二元复合物表现出增加的靶核酸的两个或更多个靶基因座的在靶结合。
118.本发明进一步提供了一种包含多个变体cas12i2多肽和两个或更多个不同的rna指导物的组合物,其中不同的rna指导物与单独的变体cas12i2多肽单独地形成变体二元复合物,并且其中与亲本二元复合物相比,变体二元复合物表现出增加的与靶核酸的两个或更多个靶基因座的在靶结合。
119.本发明进一步提供了一种包含多个变体cas12i2多肽和两个或更多个不同的rna指导物的组合物,其中不同的rna指导物与单独的变体cas12i2多肽单独地形成变体二元复合物,并且其中变体二元复合物表现出与靶核酸的两个或更多个靶基因座的在靶三元复合物形成。
120.本发明进一步提供了一种包含多个变体cas12i2多肽和两个或更多个不同的rna指导物的组合物,其中不同的rna指导物与单独的变体cas12i2多肽单独地形成变体二元复合物,并且其中与亲本二元复合物相比,变体二元复合物表现出增加的与靶核酸的两个或更多个靶基因座的三元复合物形成。
121.在组合物的一个方面,变体二元复合物在例如20℃至65℃的温度范围内表现出增加的与靶核酸的三元复合物形成和/或增加的稳定性。
122.在组合物的另一个方面,变体二元复合物在一定孵育时间范围内表现出增加的与靶核酸的三元复合物形成和/或增加的稳定性。
123.在组合物的另一个方面,变体二元复合物在具有约7.3至约8.6范围内的ph的缓冲液中表现出增加的与靶核酸的三元复合物形成和/或增加的稳定性。
124.在组合物的另一个方面,当二元复合物的tm值比亲本二元复合物的tm值大至少8℃时,变体二元复合物表现出增加的与靶核酸的三元复合物形成和/或增加的稳定性。
125.在组合物的另一个方面,亲本多肽包含seq id no:2的氨基酸序列。
126.在组合物的另一个方面,变体cas12i2多肽表现出与亲本多肽相当或比亲本多肽更大的酶活性。
127.在组合物的另一个方面,相当或更大的酶活性发生在约20℃至约90℃的温度范围内。
128.在组合物的另一个方面,变体cas12i2多肽表现出增加的稳定性和/或蛋白质-rna相互作用。
129.在组合物的另一个方面,变体二元复合物表现出增加的稳定性和/或蛋白质-dna相互作用。
130.在组合物的另一个方面,变体二元复合物进一步缺乏酶活性。
131.在组合物的另一个方面,变体二元复合物进一步表现出增加的酶活性。
132.在组合物的另一个方面,变体cas12i2多肽表现出增加的rna指导物复合物形成、rna指导物结合活性和/或rna指导物结合特异性。
133.在组合物的另一个方面,变体二元复合物表现出增加的靶核酸三元复合物形成、靶核酸结合亲和力和/或靶核酸结合特异性。
134.在组合物的另一个方面,变体二元复合物表现出改变的在靶结合。
135.在组合物的另一个方面,变体二元复合物表现出改变的脱靶结合。
136.本发明进一步提供了一种使本文所述的变体二元复合物与如本文所述的靶核酸(例如,dna)复合的方法。
137.本发明进一步提供了一种包含变体cas12i2多肽和rna指导物的组合物,其中cas12i2变体多肽和rna指导物形成变体二元复合物,并且其中与亲本二元复合物相比,变体二元复合物表现出增加的对靶核酸的靶基因座的在靶结合亲和力。
138.本发明进一步提供了一种包含变体cas12i2多肽和rna指导物的组合物,其中变体cas12i2多肽和rna指导物形成变体二元复合物,并且其中与亲本二元复合物相比,变体二元复合物表现出降低的对靶核酸的非靶基因座的结合亲和力。
139.本发明进一步提供了一种包含变体cas12i2多肽和rna指导物的组合物,其中变体cas12i2多肽和rna指导物形成变体二元复合物,并且其中与亲本二元复合物相比,变体二元复合物表现出增加的靶核酸的在靶基因座处的活性。
140.本发明进一步提供了一种包含变体cas12i2多肽和rna指导物的组合物,其中变体cas12i2多肽和rna指导物形成变体二元复合物,并且其中与亲本二元复合物相比,变体二元复合物表现出降低的靶核酸的脱靶基因座处的活性。
141.在组合物的一个方面,变体二元复合物在例如20℃至65℃的温度范围内表现出增加的靶基座处的三元复合物形成和/或增加的稳定性。
142.在组合物的另一个方面,变体二元复合物在一定孵育时间范围内表现出增加的靶基因座处的三元复合物形成和/或增加的稳定性。
143.在组合物的另一个方面,变体二元复合物在具有约7.3至约8.6范围内的ph的缓冲液中表现出增加的靶基因座处的三元复合物形成和/或增加的稳定性。
144.在组合物的另一个方面,当二元复合物的tm值比亲本二元复合物的tm值大至少8℃时,变体二元复合物表现出增加的靶基因座处的三元复合物形成和/或增加的稳定性。
145.在组合物的另一个方面,亲本二元复合物包含亲本多肽,该亲本多肽包含seq id no:2的氨基酸序列。
146.在组合物的另一个方面,变体cas12i2多肽表现出与亲本多肽相当或比亲本多肽更大的酶活性。
147.在组合物的另一个方面,相当或更大的酶活性发生在约20℃至约90℃的温度范围内。
148.在组合物的另一个方面,变体二元复合物表现出增加的稳定性和/或蛋白质-rna相互作用。
149.在组合物的另一个方面,变体二元复合物表现出增加的稳定性和/或蛋白质-dna相互作用。
150.在组合物的另一个方面,变体cas12i2多肽表现出增加的二元复合物形成、rna指导物结合活性和/或rna指导物结合特异性。
151.本发明进一步提供了一种包含多个变体cas12i2多肽和两个或更多个不同的rna指导物的组合物,其中不同的rna指导物与单独的变体cas12i2多肽单独地形成多个变体二元复合物,并且其中与多个亲本二元复合物相比,多个变体二元复合物表现出增加的与靶核酸的两个或更多个靶基因座的在靶结合。
152.本发明进一步提供了一种包含多个变体cas12i2多肽和两个或更多个不同的rna指导物的组合物,其中不同的rna指导物与单独的变体cas12i2多肽单独地形成多个变体二元复合物,并且其中与多个亲本二元复合物相比,多个变体二元复合物表现出降低的与靶
核酸的两个或更多个非靶基因座的脱靶结合。
153.本发明进一步提供了一种包含多个变体cas12i2多肽和两个或更多个不同的rna指导物的组合物,其中不同的rna指导物与单独的变体cas12i2多肽单独地形成多个变体二元复合物,并且其中与多个亲本二元复合物相比,多个变体二元复合物表现出增加的靶核酸的两个或更多个靶基因座处的在靶活性。
154.本发明进一步提供了一种包含多个变体cas12i2多肽和两个或更多个不同的rna指导物的组合物,其中不同的rna指导物与单独的变体cas12i2多肽单独地形成多个变体二元复合物,并且其中与多个亲本二元复合物相比,多个变体二元复合物表现出降低的靶核酸的两个或更多个非靶基因座处的脱靶活性。
155.在组合物的一个方面,多个变体二元复合物在例如20℃至65℃的温度范围内表现出增加的靶核酸的靶基因座处的三元复合物形成和/或增加的稳定性。
156.在组合物的另一个方面,多个变体二元复合物在一定孵育时间范围内表现出增加的靶核酸的靶基因座处的三元复合物形成和/或增加的稳定性。
157.在组合物的另一个方面,多个变体二元复合物在具有约7.3至约8.6范围内的ph的缓冲液中表现出增加的靶核酸的靶基因座处的三元复合物形成和/或增加的稳定性。
158.在组合物的另一个方面,当二元复合物的tm值比亲本二元复合物的tm值大至少8℃时,多个变体二元复合物表现出增加的靶核酸的靶基因座处的三元复合物形成和/或增加的稳定性。
159.在组合物的另一个方面,多个亲本二元复合物包含亲本多肽,该亲本多肽包含seq id no:2的氨基酸序列。
160.在组合物的另一个方面,变体cas12i2多肽表现出与亲本多肽相当或比亲本多肽更大的酶活性。
161.在组合物的另一个方面,相当或更大的酶活性发生在约20℃至约90℃的温度范围内。
162.在组合物的另一个方面,变体cas12i2多肽表现出增加的稳定性和/或蛋白质-rna相互作用。
163.在组合物的另一个方面,多个变体二元复合物表现出增加的稳定性和/或蛋白质-dna相互作用。
164.在组合物的另一个方面,变体cas12i2多肽表现出增加的二元复合物形成、rna指导物结合活性和/或rna指导物结合特异性。
165.本发明进一步提供了一种使如本文所述的变体二元复合物与如本文所述的靶核酸(例如,dna)复合的方法。
166.本发明进一步提供了一种使本文所述的多个变体二元复合物与如本文所述的靶核酸(例如,dna)复合的方法。
167.在本文所述的组合物或cas12i2多肽的一个方面,变体cas12i2多肽包含seq id no:2的氨基酸序列的d581、g624、f626、d835、l836、p868、s879、d911、i926、v1020、v1030、e1035和s1046取代中的至少一种。
168.在组合物或cas12i2多肽的另一个方面,变体cas12i2多肽包含seq id no:2的氨基酸序列的d581g、d581r、g624r、f626g、f626r、d835g、d835r、l836g、l836r、p868g、p868r、
p868t、s879g、s879r、d911g、d911r、i926g、i926r、v1020g、v1020r、v1030g、v1030r、e1035g、e1035r、s1046g和s1046r取代中的至少一种。
169.在组合物或cas12i2多肽的另一个方面,变体cas12i2多肽包含seq id no:2的氨基酸序列的d581r、g624r、f626r、p868t、d911r、i926r、v1030g、e1035r和s1046g取代中的至少一种。
170.在组合物或cas12i2多肽的另一个方面,变体cas12i2多肽包含表1中列出的至少一个取代。
171.在组合物或cas12i2多肽的另一个方面,变体cas12i2多肽包含seq id no:3至146中的任一个氨基酸序列或seq id no:495至512中的任一个氨基酸序列。
172.在组合物或cas12i2多肽的另一个方面,变体cas12i2多肽包含表位肽、核定位信号和核输出信号中的至少一种。
173.在组合物的另一个方面,rna指导物包含dna靶向序列。
174.在组合物的另一个方面,dna靶向序列是rna指导物。
175.在组合物的另一个方面,dna靶向序列介于13至30个核苷酸之间。
176.在组合物的另一个方面,rna指导物包含与dna靶向序列连接的同向重复序列。
177.在组合物的另一个方面,组合物进一步包含靶核酸。
178.在组合物的另一个方面,靶核酸存在于细胞中。
179.在组合物的另一个方面,变体cas12i2多肽和rna指导物在载体(例如,表达载体)中编码。
180.本发明进一步提供了一种包含如本文所述的组合物的细胞。
181.本发明进一步提供了一种表达如本文所述的载体的方法。
182.本发明进一步提供了一种产生如本文所述的组合物的方法。
183.本发明进一步提供了一种递送如本文所述的组合物的方法。
184.本发明进一步提供了一种包含如本文所述的组合物或其一种或多种组分的试剂盒或系统。
185.在本文所述的组合物的一个方面,rna指导物包含43个或约43个核苷酸或者由43个或约43个核苷酸组成。
186.在组合物的另一个方面,rna指导物是无tracr的rna指导物。
187.在组合物或cas12i2多肽的另一个方面,变体cas12i2多肽进一步表现出比亲本多肽高约40倍的酶活性。
188.在组合物或cas12i2多肽的另一个方面,与亲本多肽相比,变体cas12i2多肽表现出增加的在靶特异性。
189.在组合物或cas12i2多肽的另一个方面,与亲本多肽相比,变体cas12i2多肽表现出降低的脱靶特异性。
190.在组合物的另一个方面,变体cas12i2多肽选择性地诱导与5'-nttn-3'序列相邻的缺失,其中n是任何核苷酸。
191.在组合物的另一个方面,缺失在5'-nttn-3'序列的下游。
192.在组合物的另一个方面,亲本多肽不诱导缺失。
193.在组合物的另一个方面,缺失的长度大于cas9多肽诱导的缺失的长度。
194.在组合物的另一个方面,缺失在细胞的基因中。
195.在组合物的另一个方面,缺失的长度多达约40个核苷酸。
196.在组合物的另一个方面,缺失的长度为约4个核苷酸至40个核苷酸。
197.在组合物的另一个方面,缺失的长度为约4个核苷酸至25个核苷酸。
198.在组合物的另一个方面,缺失的长度为约10个核苷酸至25个核苷酸。
199.在组合物的另一个方面,缺失的长度为约10个核苷酸至15个核苷酸。
200.在组合物的另一个方面,缺失在5'-nttn-3'序列的约5个核苷酸至约15个核苷酸内开始。
201.在组合物的另一个方面,缺失在5'-nttn-3'序列的约5个核苷酸至约10个核苷酸内开始。
202.在组合物的另一个方面,缺失在5'-nttn-3'序列的约10个核苷酸至约15个核苷酸内开始。
203.在组合物的另一个方面,缺失在5'-nttn-3'序列的下游约5个核苷酸至约15个核苷酸内开始。
204.在组合物的另一个方面,缺失在5'-nttn-3'序列的下游约5个核苷酸至约10个核苷酸内开始。
205.在组合物的另一个方面,缺失在5'-nttn-3'序列的下游约10个核苷酸至约15个核苷酸内开始。
206.在组合物的另一个方面,缺失在5'-nttn-3'序列的约20个核苷酸至约30个核苷酸内结束。
207.在组合物的另一个方面,缺失在5'-nttn-3'序列的约20个核苷酸至约25个核苷酸内结束。
208.在组合物的另一个方面,缺失在5'-nttn-3'序列的约25个核苷酸至约30个核苷酸内结束。
209.在组合物的另一个方面,缺失在5'-nttn-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
210.在组合物的另一个方面,缺失在5'-nttn-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
211.在组合物的另一个方面,缺失在5'-nttn-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
212.在组合物的另一个方面,缺失在5'-nttn-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在5'-nttn-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
213.在组合物的另一个方面,缺失在5'-nttn-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在5'-nttn-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
214.在组合物的另一个方面,缺失在5'-nttn-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在5'-nttn-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
215.在组合物的另一个方面,缺失在5'-nttn-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在5'-nttn-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
216.在组合物的另一个方面,缺失在5'-nttn-3'序列的下游约5个核苷酸至约10个核
苷酸内开始,并且在5'-nttn-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
217.在组合物的另一个方面,缺失在5'-nttn-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在5'-nttn-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
218.在组合物的另一个方面,缺失在5'-nttn-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在5'-nttn-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
219.在组合物的另一个方面,缺失在5'-nttn-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在5'-nttn-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
220.在组合物的另一个方面,缺失在5'-nttn-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在5'-nttn-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
221.在组合物的另一个方面,5'-nttn-3'序列是5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3',其中y是c或t,b是除a以外的任何核苷酸,d是除c以外的任何核苷酸,并且r是a或g。
222.在组合物的另一个方面,5'-nttn-3'序列是5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'。
223.在组合物的另一个方面,缺失在基因(例如,b2m、trac、pdcd1)的外显子中。
224.在组合物的另一个方面,缺失与基因中的突变重叠。
225.在组合物的另一个方面,缺失与基因中的插入重叠。
226.在组合物的另一个方面,缺失消除基因的重复扩增。
227.在组合物的另一个方面,缺失破坏基因的一个或两个等位基因。
228.在组合物的另一个方面,缺失在真核细胞或原核细胞中被诱导。
229.在组合物的另一个方面,缺失在动物细胞、植物细胞或真菌细胞中被诱导,或者细胞来源于动物细胞、植物细胞或真菌细胞。
230.在组合物的另一个方面,缺失在哺乳动物细胞中被诱导或来源于哺乳动物细胞。
231.在组合物的另一个方面,缺失在人细胞中被诱导或来源于人细胞。
232.在组合物的另一个方面,缺失是原代细胞中被诱导。
233.在组合物的另一个方面,缺失是细胞系中被诱导。
234.在组合物的另一个方面,缺失在t细胞中被诱导。
235.在组合物的另一个方面,缺失在干细胞(例如,全能/万能干细胞、多能干细胞、多潜能干细胞、寡能干细胞或单能干细胞)、分化细胞或终末分化细胞中被诱导。
236.在组合物的另一个方面,2个或更多个缺失(例如,多重靶向缺失)被诱导。
237.本发明进一步提供了一种在细胞中获得缺失的方法,其中该方法包括使如本文所述的变体cas12i2多肽或复合物与细胞中的dna接触。
238.本发明进一步提供了一种包含如本文所述的变体cas12i2多肽、rna指导物和细胞的组合物或配制品。
239.本发明进一步提供了一种产生如本文所述的组合物的方法。
240.本发明进一步提供了一种使如本文所述的变体cas12i2多肽与rna指导物(诸如本文所述的rna指导物)复合的方法。
241.本发明进一步提供了一种使如本文所述的变体二元复合物与靶核酸复合的方法。
242.本发明进一步提供了一种递送如本文所述的组合物的方法。
243.本发明进一步提供了一种包含变体cas12i2多肽的组合物,其中与亲本多肽相比,变体cas12i2多肽包含增加变体cas12i2多肽与核酸之间的相互作用的取代。
244.在组合物的一个方面,变体cas12i2多肽包含seq id no:4中所示的序列。
245.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3、seq id no:5、seq id no:495和seq id no:496中的任一个中所示的序列。
246.在组合物的另一个方面,相互作用是静电相互作用。
247.在组合物的另一个方面,相互作用是非特异性相互作用。
248.在组合物的另一个方面,相互作用是芳族、疏水、范德华和/或阳离子-π相互作用。
249.在组合物的另一个方面,取代在核酸界面中或与核酸界面相邻。
250.在组合物的另一个方面,核酸是包含同向重复序列和间隔子序列的rna指导物。
251.在组合物的另一个方面,同向重复序列包含与seq id no:492-494中的任一个具有至少95%序列同一性的核苷酸序列。
252.在组合物的另一个方面,同向重复序列包含seq id no:492-494中的任一个中所示的核苷酸序列。
253.在组合物的另一个方面,取代增加变体cas12i2多肽与同向重复序列之间的相互作用。
254.在组合物的另一个方面,与亲本多肽相比,取代增加二元复合物形成。
255.在组合物的另一个方面,与亲本二元复合物相比,包含变体cas12i2多肽的二元复合物表现出增加的稳定性。
256.在组合物的另一个方面,取代是精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸、酪氨酸或丝氨酸取代。
257.在组合物的另一个方面,取代在rna结合界面中。
258.在组合物的另一个方面,取代是wedge结构域或rec2结构域中的取代。
259.在组合物的另一个方面,取代是表4中列出的取代。
260.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3至146中的任一个或seq id no:495-512中的任一个中所示的序列具有至少95%同一性的序列。
261.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3至146中的任一个或seq id no:495至512中的任一个中所示的序列具有至少95%同一性并且进一步具有表4中列出的取代的序列。
262.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3至146中的任一个或seq id no:495至512中的任一个中所示的序列。
263.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3至146中的任一个或seq id no:495至512中的任一个中所示的序列并且进一步具有表4中列出的取代。
264.在组合物的另一个方面,同向重复序列在seq id no:492中示出,并且变体cas12i2多肽包含seq id no:4中所示的序列。
265.在组合物的另一个方面,同向重复序列在seq id no:492中示出,并且变体cas12i2多肽包含seq id no:3、seq id no:5、seq id no:495和seq id no:496中的任一个中所示的序列。
266.在组合物的另一个方面,核酸是靶核酸。
267.在组合物的另一个方面,核酸是双链dna。
268.在组合物的另一个方面,取代增加变体cas12i2多肽与双链dna之间的相互作用。
269.在组合物的另一个方面,双链dna包含pam序列。
270.在组合物的另一个方面,与亲本多肽相比,取代增加三元复合物形成。
271.在组合物的另一个方面,与亲本三元复合物相比,包含变体cas12i2多肽的三元复合物表现出增加的稳定性。
272.在组合物的另一个方面,取代是精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸或丝氨酸取代。
273.在组合物的另一个方面,取代在双链dna结合界面中。
274.在组合物的另一个方面,取代是rec1结构域、pi结构域或wedge结构域中的取代。
275.在组合物的另一个方面,取代是表5中列出的取代。
276.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列具有至少95%同一性的序列。
277.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列具有至少95%同一性并且进一步具有表5中列出的取代的序列。
278.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列。
279.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列并且进一步具有表5中列出的取代。
280.在组合物的另一个方面,核酸是单链dna。
281.在组合物的另一个方面,单链dna包含非靶链。
282.在组合物的另一个方面,单链dna包含靶链。
283.在组合物的另一个方面,与亲本多肽相比,取代增加三元复合物形成。
284.在组合物的另一个方面,与亲本三元复合物相比,包含变体cas12i2多肽的三元复合物表现出增加的稳定性。
285.在组合物的另一个方面,取代是精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸或丙氨酸取代。
286.在组合物的另一个方面,取代在单链dna结合界面中。
287.在组合物的另一个方面,取代是pi结构域、rec1结构域、wedge结构域、ruvc结构域、rec2结构域或nuc结构域中的取代。
288.在组合物的另一个方面,取代是表6中列出的取代。
289.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3至146中的任一个或seq id no:495至512中的任一个中所示的序列具有至少95%同一性的序列。
290.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3至146中的任一个或seq id no:495至512中的任一个中所示的序列具有至少95%同一性并且进一步具有表6中列出的取代的序列。
291.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3至146中的任一个或
seq id no:495至512中的任一个中所示的序列。
292.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3至146中的任一个或seq id no:495至512中的任一个中所示的序列并且进一步具有表6中列出的取代。
293.在组合物的另一个方面,取代增加变体cas12i2多肽与dna/rna杂交分子之间的相互作用。
294.在组合物的另一个方面,dna/rna杂交分子是包含rna指导物的间隔子序列和靶链的异源双链体。
295.在组合物的另一个方面,取代稳定异源双链体。
296.在组合物的另一个方面,与亲本多肽相比,取代增加三元复合物形成。
297.在组合物的另一个方面,与亲本三元复合物相比,包含变体cas12i2多肽的三元复合物表现出增加的稳定性。
298.在组合物的另一个方面,取代是精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸或丝氨酸取代。
299.在组合物的另一个方面,取代是rec1结构域、pi结构域、rec2结构域或ruvc2基序中的取代。
300.在组合物的另一个方面,取代是表7中列出的取代。
301.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列具有至少95%同一性的序列。
302.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列具有至少95%同一性并且进一步具有表7中列出的取代的序列。
303.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列。
304.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列并且进一步具有表7中列出的取代。
305.在组合物的另一个方面,取代增加变体cas12i2多肽与以下项的碱基之间的相互作用:(a)双链dna双链体和/或(b)包含rna指导物的间隔子序列和靶链的异源双链体。
306.在组合物的另一个方面,双链dna双链体包含pam序列。
307.在组合物的另一个方面,相互作用是芳族、疏水、范德华和/或阳离子-π相互作用。
308.在组合物的另一个方面,取代稳定r-环。
309.在组合物的另一个方面,与亲本多肽相比,取代增加三元复合物形成。
310.在组合物的另一个方面,与亲本三元复合物相比,包含变体cas12i2多肽的三元复合物表现出增加的稳定性。
311.在组合物的另一个方面,取代是精氨酸、赖氨酸、色氨酸、苯丙氨酸、酪氨酸、甲硫氨酸、组氨酸、谷氨酰胺、苏氨酸或缬氨酸取代。
312.在组合物的另一个方面,取代是wedge结构域、rec1结构域或ruvc结构域中的取代。
313.在组合物的另一个方面,取代是表8中列出的取代。
314.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3-146中的任一个或
seq id no:495-512中的任一个中所示的序列具有至少95%同一性的序列。
315.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列具有至少95%同一性并且进一步具有表8中列出的取代的序列。
316.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列。
317.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列并且进一步具有表8中列出的取代。
318.在组合物的另一个方面,亲本多肽包含seq id no:2的氨基酸序列。
319.在组合物的另一个方面,与亲本多肽相比,变体cas12i2多肽表现出增加的酶活性。
320.在组合物的另一个方面,组合物进一步包含rna指导物,该rna指导物包含同向重复序列和间隔子序列。
321.在组合物的另一个方面,同向重复序列包含与seq id no:492-494中的任一个具有至少95%序列同一性的核苷酸序列。
322.在组合物的另一个方面,同向重复序列包含seq id no:492-494中的任一个中所示的核苷酸序列。
323.在组合物的另一个方面,同向重复序列在seq id no:492中示出,并且变体cas12i2多肽包含seq id no:4中所示的序列。
324.239.
325.在组合物的另一个方面,同向重复序列在seq id no:492中示出,并且变体cas12i2多肽包含seq id no:3、seq id no:5、seq id no:495和seq id no:496中的任一个中所示的序列。
326.本发明进一步提供了一种包含本文所述的组合物的细胞。
327.在细胞的一个方面,组合物基本上不影响细胞的活力。
328.本发明进一步提供了一种包含变体cas12i2多肽的组合物,其中与亲本多肽相比,变体cas12i2多肽包含在dna结合期间增加变体cas12i2多肽的柔性的取代。
329.在组合物的一个方面,变体cas12i2多肽包含seq id no:4中所示的序列。
330.在组合物的另一个方面,cas12i2多肽包含seq id no:3、seq id no:5、seq id no:495和seq id no:496中的任一个中所示的序列。
331.在组合物的另一个方面,取代增加变体cas12i2多肽与dna的结合。
332.在组合物的另一个方面,取代增加变体cas12i2多肽与双链dna的结合。
333.在组合物的另一个方面,取代增加变体cas12i2多肽与单链dna的结合。
334.在组合物的另一个方面,与亲本多肽相比,取代增加三元复合物形成。
335.在组合物的另一个方面,与亲本三元复合物相比,包含变体cas12i2多肽的三元复合物表现出增加的稳定性。
336.在组合物的另一个方面,取代是大体积氨基酸到具有较小侧链的氨基酸的取代。
337.在组合物的另一个方面,取代是丙氨酸、缬氨酸、甘氨酸或丝氨酸取代。
338.在组合物的另一个方面,取代在变体cas12i2多肽的螺旋ii结构域中。
339.在组合物的另一个方面,取代是表9中列出的取代。
340.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列具有至少95%同一性的序列。
341.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列具有至少95%同一性并且进一步具有表9中列出的取代的序列。
342.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列。
343.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列并且进一步具有表9中列出的取代。
344.本发明进一步提供了一种包含变体cas12i2多肽的组合物,其中与亲本多肽相比,变体cas12i2多肽包含稳定在三元复合物形成期间形成的结构域-结构域界面的取代。
345.在组合物的一个方面,变体cas12i2多肽包含seq id no:4中所示的序列。
346.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3、seq id no:5、seq id no:495和seq id no:496中的任一个中所示的序列。
347.在组合物的另一个方面,当单链dna接触变体cas12i2多肽的活性位点时,形成结构域-结构域界面。
348.在组合物的另一个方面,结构域-结构域界面是螺旋ii结构域-nuc结构域界面。
349.在组合物的另一个方面,与亲本多肽相比,取代增加三元复合物形成。
350.在组合物的另一个方面,与亲本三元复合物相比,包含变体cas12i2多肽的三元复合物表现出增加的稳定性。
351.在组合物的另一个方面,取代是天冬氨酸、谷氨酸、精氨酸或赖氨酸取代。
352.在组合物的另一个方面,取代是表10中列出的取代。
353.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列具有至少95%同一性的序列。
354.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列具有至少95%同一性并且进一步具有表10中列出的取代的序列。
355.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列。
356.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列并且进一步具有表10中列出的取代。
357.在组合物的另一个方面,亲本多肽包含seq id no:2的氨基酸序列。
358.在组合物的另一个方面,与亲本多肽相比,变体cas12i2多肽表现出增加的酶活性。
359.在组合物的另一个方面,组合物进一步包含rna指导物,该rna指导物包含同向重复序列和间隔子序列。
360.在组合物的另一个方面,同向重复序列包含与seq id no:492-494中的任一个具有至少95%序列同一性的核苷酸序列。
361.在组合物的另一个方面,同向重复序列包含seq id no:492-494中的任一个中所示的核苷酸序列。
362.在组合物的另一个方面,同向重复序列在seq id no:492中示出,并且变体cas12i2多肽包含seq id no:4中所示的序列。
363.在组合物的另一个方面,同向重复序列在seq id no:492中示出,并且变体cas12i2多肽包含seq id no:3、seq id no:5、seq id no:495和seq id no:496中的任一个中所示的序列。
364.本发明进一步提供了一种包含如本文所述的组合物的细胞。
365.在细胞的一个方面,组合物基本上不影响细胞的活力。
366.本发明进一步提供了一种包含变体cas12i2多肽的组合物,其中与亲本多肽相比,变体cas12i2多肽包含增加变体cas12i2多肽的在靶特异性的取代。
367.在组合物的一个方面,变体cas12i2多肽包含seq id no:4中所示的序列。
368.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3、seq id no:5、seq id no:495和seq id no:496中的任一个中所示的序列。
369.在组合物的另一个方面,取代增加在靶dna结合。
370.在组合物的另一个方面,取代降低脱靶dna结合。
371.在组合物的另一个方面,与亲本多肽相比,取代增加在靶三元复合物形成。
372.在组合物的另一个方面,与亲本三元复合物相比,包含变体cas12i2多肽的在靶三元复合物表现出增加的稳定性。
373.在组合物的另一个方面,取代是接触rna指导物的间隔子序列的氨基酸的取代。
374.在组合物的另一个方面,取代是大体积氨基酸到具有较小侧链的氨基酸的取代。
375.在组合物的另一个方面,取代是丙氨酸、丝氨酸、缬氨酸、谷氨酰胺或天冬酰胺取代。
376.在组合物的另一个方面,取代是wedge结构域、rec1结构域、rec2结构域或ruvc结构域中的取代。
377.在组合物的另一个方面,取代是螺旋ii结构域中的取代。
378.在组合物的另一个方面,取代是表11中列出的取代。
379.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列具有至少95%同一性的序列。
380.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列具有至少95%同一性并且进一步具有表11中列出的取代的序列。
381.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列。
382.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列并且进一步具有表11中列出的取代。
383.在组合物的另一个方面,取代降低变体cas12i2多肽的催化速率(kcat)。
384.在组合物的另一个方面,取代是丙氨酸、丝氨酸、苏氨酸、缬氨酸、亮氨酸、甲硫氨酸、天冬酰胺或异亮氨酸取代。
385.在组合物的另一个方面,取代是wedge结构域、rec1结构域、rec2结构域或ruvc结构域中的取代。
386.在组合物的另一个方面,取代是ruvc结构域中的取代。
387.在组合物的另一个方面,取代是表12中列出的取代。
388.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列具有至少95%同一性的序列。
389.在组合物的另一个方面,变体cas12i2多肽包含与seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列具有至少95%同一性并且进一步具有表12中列出的取代的序列。
390.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列。
391.在组合物的另一个方面,变体cas12i2多肽包含seq id no:3-146中的任一个或seq id no:495-512中的任一个中所示的序列并且进一步具有表12中列出的取代。
392.在组合物的另一个方面,与亲本多肽相比,变体cas12i2多肽表现出增加的在靶酶活性。
393.在组合物的另一个方面,与亲本多肽相比,变体cas12i2多肽表现出降低的脱靶酶活性。
394.在组合物的另一个方面,变体cas12i2多肽表现出不超过在靶编辑的10%的脱靶编辑。
395.在组合物的另一个方面,变体cas12i2多肽表现出不超过在靶编辑的5%的脱靶编辑。
396.在组合物的另一个方面,组合物进一步包含rna指导物,该rna指导物包含同向重复序列和间隔子序列。
397.在组合物的另一个方面,同向重复序列包含与seq id no:492-494中的任一个具有至少95%序列同一性的核苷酸序列。
398.在组合物的另一个方面,同向重复序列包含seq id no:492-494中的任一个中所示的核苷酸序列。
399.在组合物的另一个方面,同向重复序列在seq id no:492中示出,并且变体cas12i2多肽包含seq id no:4中所示的序列。
400.在组合物的另一个方面,同向重复序列在seq id no:492中示出,并且变体cas12i2多肽包含seq id no:3、seq id no:5、seq id no:495和seq id no:496中的任一个中所示的序列。
401.本发明进一步提供了一种包含如本文所述的组合物的细胞。
402.在细胞的一个方面,组合物基本上不影响细胞的活力。
403.在组合物的另一个方面,与cas9多肽相比,变体cas12i2多肽表现出更高的在靶结合与脱靶结合比率。
404.在组合物的另一个方面,与cas9多肽相比,变体cas12i2多肽表现出更高的在靶活性与脱靶活性比率。
405.在组合物的另一个方面,与cas9多肽相比,变体cas12i2多肽表现出更高的在靶编
辑与脱靶编辑比率。
406.在组合物的另一个方面,与cas9多肽相比,变体cas12i2多肽表现出更少的脱靶结合。
407.在组合物的另一个方面,与cas9多肽相比,变体cas12i2多肽表现出更少的脱靶活性。
408.在组合物的另一个方面,与cas9多肽相比,变体cas12i2多肽表现出更少的脱靶编辑。
409.在组合物的另一个方面,变体cas12i2多肽的脱靶结合、脱靶活性和/或脱靶编辑比cas9多肽的脱靶结合、脱靶活性和/或脱靶编辑少至少10%。
410.在组合物的另一个方面,变体cas12i2多肽的脱靶结合、脱靶活性和/或脱靶编辑比cas9多肽的脱靶结合、脱靶活性和/或脱靶编辑少至少20%。
411.在组合物的另一个方面,变体cas12i2多肽的脱靶结合、脱靶活性和/或脱靶编辑比cas9多肽的脱靶结合、脱靶活性和/或脱靶编辑少至少30%。
412.在组合物的另一个方面,变体cas12i2多肽的脱靶结合、脱靶活性和/或脱靶编辑比cas9多肽的脱靶结合、脱靶活性和/或脱靶编辑少至少40%。
413.在组合物的另一个方面,变体cas12i2多肽的脱靶结合、脱靶活性和/或脱靶编辑比cas9多肽的脱靶结合、脱靶活性和/或脱靶编辑少至少50%。
414.在另一个方面,本发明提供了一种包含本文所述的组合物的细胞。
415.在细胞的一个方面,组合物基本上不影响细胞的活力。
416.定义
417.本发明将相对于特定实施例并参考某些附图进行描述,但本发明不限于此,而仅由权利要求来限定。除非另有说明,否则下文阐述的术语通常应以其常见意义来理解。
418.如本文所用,术语“活性”是指生物活性。在一些实施例中,活性是指效应子活性。在一些实施例中,活性包括酶活性,例如效应子的催化能力。例如,活性可以包括核酸酶活性。在一些实施例中,活性包括结合活性,例如效应子与rna指导物和/或靶核酸的结合活性。
419.如本文所用,术语“相邻”是指一个核苷酸或氨基酸序列紧邻另一个核苷酸或氨基酸序列。在一些实施例中,如果没有核苷酸将一个核苷酸序列与另一个核苷酸序列分隔,则这两个序列相邻。在一些实施例中,如果少量核苷酸(例如,约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸)将一个核苷酸序列与另一个核苷酸序列分隔,则这两个序列相邻。在一些实施例中,如果第一序列与第二序列被约5、6、7、8、9、10、11、12、13、14或15个核苷酸分隔,则这两个序列相邻。在一些实施例中,术语“与
……
相邻”用于指与另一个蛋白质残基相互作用的蛋白质残基。在一些实施例中,术语“与
……
相邻”用于指与核苷酸或核酸相互作用的蛋白质残基。在一些实施例中,术语“与
……
相邻”用于指与另一个蛋白质结构域或基序相互作用的蛋白质结构域或基序。在一些实施例中,术语“与
……
相邻”用于指与核苷酸或核酸序列相互作用的蛋白质结构域或基序。如本文所用,术语“与
……
相邻”用于指在本披露的修饰细胞中定位插入缺失(插入/缺失)。
420.如本文所用,术语“复合物”是指两个或更多个分子的群化。在一些实施例中,复合物包含彼此相互作用(例如,结合、接触、粘附)的多肽和核酸分子。
421.如本文所用,术语“二元复合物”是指两个分子(例如,多肽和核酸分子)的群化。在一些实施例中,二元复合物是指多肽和靶向部分(例如,rna指导物)的群化。在一些实施例中,二元复合物是指核糖核蛋白(rnp)。如本文所用,术语“变体二元复合物”是指变体cas12i2多肽和rna指导物的群化。如本文所用,术语“亲本二元复合物”是指亲本多肽和rna指导物或参考多肽和rna指导物的群化。
422.如本文所用,术语“三元复合物”是指三个分子(例如,一个多肽和两个核酸分子)的群化。在一些实施例中,“三元复合物”是指多肽、rna分子和dna分子的群化。在一些实施例中,三元复合物是指多肽、靶向部分(例如,rna指导物)和靶核酸(例如,靶dna分子)的群化。在一些实施例中,“三元复合物”是指二元复合物(例如,核糖核蛋白)和第三分子(例如,靶核酸)的群化。如本文所用,术语“变体三元复合物”、“变体cas12i2三元复合物”和“cas12i2变体三元复合物”是指变体cas12i2多肽、rna指导物和靶核酸(例如,变体cas12i2核糖核蛋白和靶核酸)的群化。如本文所用,术语“亲本三元复合物”、“亲本cas12i2三元复合物”和“cas12i2亲本三元复合物”是指亲本多肽、rna指导物和靶核酸(例如,亲本核糖核蛋白和靶核酸)或参考多肽、rna指导物和靶核酸(例如,参考核糖核蛋白和靶核酸)的群化。
423.如本文所用,术语“缺失”是指核酸序列中核苷酸的丢失或去除。缺失可以在生物体的基因组中。缺失可以在细胞中。缺失可以是dna序列。缺失可以是rna序列。缺失可以是移码突变或非移码突变。本文所述的cas12i2诱导的缺失可以指核酸分子中多达约100个核苷酸(诸如约4个核苷酸至100个核苷酸、约4个核苷酸至50个核苷酸、约4个核苷酸至40个核苷酸、约4个核苷酸至25个核苷酸、约10个核苷酸至25个核苷酸、约10个核苷酸至15个核苷酸)的缺失。在一些实施例中,本文所述的cas12i2诱导的缺失发生在5'-nttn-3'序列的下游。在一些实施例中,术语“cas12i2诱导的”是指由于由cas12i2多肽诱导的dna断裂而产生的缺失。在一些实施例中,术语“cas12i2诱导的”是指由于由cas12i2多肽诱导并由细胞的dna修复机制修复的dna断裂而产生的缺失。
424.如本文所用,术语“结构域”是指多肽的不同功能和/或结构单元。在一些实施例中,结构域可包含保守氨基酸序列。
425.如本文所用,术语“编辑效率”和“插入缺失活性”是指酶(例如,变体cas12i2多肽)将插入缺失(插入/缺失)引入序列中的能力。例如,在一些实施例中,将插入缺失引入十个靶基因座中的每一个中的酶表现出100%的编辑效率。将插入缺失引入十个靶基因座中的五个中的酶表现出50%的编辑效率。在另一个实例中,在多个细胞的50%中的靶基因座处引入插入缺失的酶表现出50%的编辑效率。如本文所用,术语“编辑效率”、“插入缺失活性”和“在靶编辑”是指酶(例如,变体cas12i2多肽)在靶基因座处选择性引入插入缺失的能力。在一些实施例中,将靶基因座处的编辑效率与非靶基因座处的编辑效率进行比较。在一些实施例中,将靶基因座处的编辑与非靶基因座处的编辑进行比较。
426.如本文所用,术语“效应子活性”是指生物活性。在一些实施例中,效应子活性包括酶活性,例如效应子的催化能力。例如,效应子活性可以包括核酸酶活性。
427.如本文所用,术语“界面”是指变体cas12i2多肽的与核酸分子或变体cas12i2多肽的不同结构域/基序或不同结构域/基序的一部分接触(例如,与它们相互作用或与它们相邻)的一个或多个残基(例如,结构域/基序或结构域/基序的一部分)。在一些方面,界面是相邻结构域或基序之间的掩埋表面区域。在一些方面,界面是多肽与配体(例如,dna或rna)
之间的其中多肽和配体接触的表面区域。如本文所用,术语“核酸界面”是指变体cas12i2多肽的紧邻核酸序列(例如,dna序列或rna序列)(例如,与其相邻)或与其相互作用的残基。如本文所用,术语“rna结合界面”是指变体cas12i2多肽的紧邻rna指导物(例如,rna指导物的同向重复序列)(例如,与其相邻)或与其相互作用的残基。如本文所用,术语“双链dna结合界面”是指变体cas12i2多肽的紧邻双链dna(例如,与其相邻)和/或与其相互作用的残基。如本文所用,术语“单链dna结合界面”是指变体cas12i2多肽的紧邻单链dna(例如,与其相邻)和/或与其相互作用的残基。如本文所用,术语“结构域-结构域界面”是指紧邻单独结构域(例如,与其相邻)的结构域。在一些实施例中,结构域-结构域界面(例如,螺旋ii结构域-nuc结构域界面)在复合物形成(例如,三元复合物形成)时形成。
428.如本文所用,术语“亲本”、“亲本多肽”和“亲本序列”是指对其进行改变以产生本发明的变体cas12i2多肽的原始多肽(例如,起始多肽)。在一些实施例中,亲本是具有在一个或多个特定位置处具有一个或多个变异的变体的相同氨基酸序列的多肽。在示例性实施例中,变异是指多肽序列内的氨基酸变化。亲本可以是天然存在的(野生型)多肽。在一个具体实施例中,亲本是与seq id no:2的多肽具有至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少70%、至少72%、至少73%、至少74%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的多肽。在一些实施例中,变异可包括结构改变,诸如不改变亲本的原始氨基酸序列的连接、融合或其他改变。在一些实施例中,亲本多肽序列包括氨基酸变异和结构改变。
429.如本文所用,“多个变体二元复合物”是指包含多个变体cas12i2多肽的多个二元复合物。包含多个亲本多肽(例如,seq id no:2的野生型cas12i2多肽亲本)的多个二元复合物在本文中称为“多个亲本二元复合物”。多个cas12i2多肽(例如,多个变体cas12i2多肽)和两个或更多个不同的靶向部分(例如,两个或更多个不同的rna指导物)单独地形成两个或更多个二元复合物(例如,多个二元复合物)。在此类实施例中,复合物形成可在单一组合物中同时完成或在单独的组合物中独立完成。
430.如本文所用,术语“原型间隔子相邻基序”或“pam”是指与包含多肽(例如酶,诸如cas12i2或其变体)和靶向部分(例如,rna指导物)的二元复合物所结合的靶序列相邻的dna序列。在一些实施例中,pam是酶活性所需的。在双链靶的情况下,靶向部分(例如,rna指导物)与靶的第一链结合,并且如本文所述的pam序列存在于第二互补链中。例如,在一些实施例中,rna指导物与靶链(例如,间隔子互补链)结合,并且如本文所述的pam序列存在于非靶链(即,非间隔子互补链)中。在一些实施例中,靶链(即,间隔子互补链)包含5'-naan-3'序列。
431.如本文所用,术语“参考组合物”、“参考分子”、“参考序列”、“参考”和“参考复合物”是指对照,诸如阴性对照或亲本(例如,亲本序列、亲本蛋白质、野生型蛋白质或包含亲本序列的复合物)。例如,参考分子是指与变体cas12i2多肽进行比较的cas12i2多肽。同样,参考rna指导物是指与修饰的rna指导物进行比较的靶向部分。变体或经修饰的分子可基于序列(例如,变体或修饰的分子可与参考分子具有x%序列同一性或同源性)、热稳定性或活性(例如,变体或修饰的分子可具有x%的参考分子的活性)与参考分子进行比较。例如,在参考分子是cas12i2多肽的情况下,变体或修饰的分子可表征为具有不超过10%的参考
cas12i2多肽的活性,或可表征为具有比参考cas12i2多肽高至少10%的活性。参考cas12i2多肽的实例包括天然存在的未修饰的cas12i2多肽,例如来自古细菌或其他细菌物种的天然存在的cas12i2多肽。在某些实施例中,参考cas12i2多肽是天然存在的cas12i2多肽,该多肽与所比较的变体cas12i2多肽具有最接近的序列同一性或同源性。在某些实施例中,参考cas12i2多肽是具有天然存在或已知序列的亲本分子,已经在该序列上进行突变以获得变体cas12i2多肽。
432.如本文所用,术语“rna指导物”或“rna指导物序列”是指促进本文所述的多肽靶向靶核酸的任何rna分子。例如,rna指导物可以是识别靶核酸(例如,与其结合)的分子。rna指导物可被设计成与特定核酸序列互补。rna指导物包含dna靶向序列和同向重复(dr)序列。术语crispr rna(crrna)、前crrna和成熟crrna在本文中也用于指rna指导物。
433.如本文所用,术语“基本上相同”是指与参考序列具有一定程度同一性的序列、多核苷酸或多肽。
434.如本文所用,术语“靶向部分”是指促进另一分子或组分靶向靶核酸的分子或组分(例如,核酸和/或rna指导物)。在一些实施例中,靶向部分与靶核酸特异性相互作用或缔合。
435.如本文所用,术语“靶核酸”、“靶序列”、“靶底物”和“在靶基因座”是指靶向部分(例如,rna指导物)特异性结合的核酸序列。在一些实施例中,rna指导物的dna靶向序列与靶核酸结合。二元复合物与靶基因座的结合在本文中称为“在靶结合”。
436.如本文所用,术语“非靶”和“脱靶”是指除靶向部分特异性结合或旨在特异性结合的序列以外的核酸序列。非靶基因座是靶向部分(例如,rna指导物)的非预期靶。二元复合物与非靶基因座的结合在本文中称为“脱靶结合”。在一些实施例中,非靶基因座是靶核酸上的基因座。在一些实施例中,非靶基因座是除靶核酸以外的核酸(例如,非靶核酸)上的基因座。
437.如本文所用,术语“上游”和“下游”是指核酸分子中单个核酸(例如,dna)序列内的相对位置。如本文所用,术语“上游”和“下游”是指两个序列相对于彼此的定位。“上游”和“下游”分别涉及发生rna转录的5'至3'方向。当第一序列的3'端出现在第二序列的5'端之前时,第一序列在第二序列的上游。当第一序列的5'端出现在第二序列的3'端之后时,第一序列在第二序列的下游。如本文所用,术语“上游”和“下游”用于指关于5'-nttn'-3'序列缺失的相对定位。如本文所用,5'-nttn-3'序列在cas12i2诱导的缺失的上游,并且cas12i2诱导的缺失在5'-nttn-3'序列的下游。
438.如本文所用,术语“变体cas12i2多肽”和“变体效应子多肽”是指与亲本多肽相比在一个或多个残基位置处包含改变(例如,取代、插入、缺失和/或融合)的多肽。如本文所用,术语“变体cas12i2多肽”和“变体效应子多肽”是指与seq id no:2的多肽相比包含改变的多肽。
附图说明
439.图1是示出野生型cas12i2(seq id no:2)和seq id no:3-5、495或496中所示的cas12i2变体的示意图。描绘了ruvc基序和突变残基。
440.图2示出了引入单突变并产生表达变体cas12i2序列的线性dna模板的重叠pcr方
法。
441.图3a是示出用a)野生型cas12i2(seq id no:2)、seq id no:3的变体cas12i2或seq id no:4的变体cas12i2以及b)crrna 1(seq id no:147)制备的rnp结合aavs1 dsdna靶(seq id no:150)的能力的dna emsa凝胶。指示了结合的dsdna和未结合的dsdna条带。
442.图3b是示出用a)野生型cas12i2(seq id no:2)、seq id no:3的变体cas12i2或seq id no:4的变体cas12i2以及b)crrna 2(seq id no:148)制备的rnp结合vegfa dsdna靶(seq id no:151)的能力的dna emsa凝胶。指示了结合的dsdna和未结合的dsdna条带。
443.图3c是示出用a)野生型cas12i2(seq id no:2)、seq id no:3的变体cas12i2或seq id no:4的变体cas12i2以及b)crrna 3(seq id no:149)制备的rnp结合emx1 dsdna靶(seq id no:152)的能力的dna emsa凝胶。指示了结合的dsdna和未结合的dsdna条带。
444.图3d是示出用a)野生型cas12i2(seq id no:2)、seq id no:3的变体cas12i2或seq id no:4的变体cas12i2以及b)crrna 1(seq id no:147)制备的rnp结合emx1 dsdna靶(seq id no:152)的能力的dna emsa凝胶。指示了未结合的dsdna条带。
445.图3e是示出包含以下项的样品的迁移的凝胶:a)crrna 1(seq id no:147)和dna靶1(seq id no:150)、b)crrna 2(seq id no:148)和dna靶2(seq id no:151)、c)crrna 3(seq id no:149)和dna靶3(seq id no:152)以及d)crrna 1(seq id no:147)和dna靶3(seq id no:152)。
446.图4是实例10中描述的用于测量变体cas12i2活性的荧光耗减测定的示意图。
447.图5a-5t是野生型cas12i2(实线)、seq id no:3的变体cas12i2(点划线)和seq id no:4的变体cas12i2(短划线)的gfp耗减比(非靶/靶)的图。耗减比值是根据在12小时的时段内获取的测量结果计算的。示出了二十个gfp靶:top1(图5a)、top2(图5b)、top3(图5c)、top4(图5d)、top5(图5e)、top6(图5f)、top7(图5g)、top8(图5h)、top9(图5i)、top10(图5j)、bot1(图5k)、bot2(图5l)、bot3(图5m)、bot4(图5n)、bot5(图5o)、bot6(图5p)、bot7(图5q)、bot8(图5r)、bot9(图5s)、bot10(图5t)。
448.图6a示出了用野生型cas12i2、seq id no:3的变体cas12i2或seq id no:4的变体cas12i2靶向的十五个遗传区域的插入缺失测量结果,如通过下一代测序所评估的。图6b示出了使用图6a的数据发现能够用野生型cas12i2、seq id no:3的变体cas12i2或seq id no:4的变体cas12i2靶向的十五个遗传区域的部分。
449.图7a比较了使用野生型cas12i2(seq id no:2)或者seq id no:3-5、495或496、46、47、50-63、65-68、79、84、87-90、95-97、99、101、103、104、112、114-118、123、130和131的cas12i2变体对aavs1靶的插入缺失率。图7b比较了使用野生型cas12i2或者seq id no:3-5、495或496、46、47、50-63、65-68、76、79、84、86-90、95-97、99、101、103、104、112和114-124的cas12i2变体对emx1靶的插入缺失率。图7c比较了使用野生型cas12i2或者seq id no:3-5、495或496、46、47、50-63、65-68、76、79、84、86-90、95-97、99、101、103、104、112和114-124的cas12i2变体对vegfa1靶的插入缺失率。
450.图8示出了包含seq id no:4的变体cas12i2和靶向b2m的几种单独crrna的变体二元复合物在不同浓度下在原代t细胞中的插入缺失活性。误差条代表来自一个代表性供体的四个技术重复的平均值的标准偏差。
451.图9示出了包含seq id no:4的变体cas12i2和靶向b2m的几种单独crrna的变体二
元复合物在不同浓度下在原代t细胞中的b2m表达降低。误差条代表来自一个代表性供体的四个技术重复的平均值的标准偏差。
452.图10示出了在原代t细胞中引入不同浓度的靶向b2m的变体cas12i2 rnp后七天的细胞活力(经由dapi染色)。误差条代表来自一个代表性供体的四个技术重复的平均值的标准偏差。
453.图11a示出了包含seq id no:4的变体cas12i2和靶向trac的几种单独crrna的变体二元复合物在不同浓度下在原代t细胞中的插入缺失活性。误差条代表来自一个代表性供体的四个技术重复的平均值的标准偏差。
454.图11b示出了在原代t细胞中引入不同浓度的靶向trac的变体cas12i2 rnp后七天的细胞活力(经由dapi染色)。误差条代表来自一个代表性供体的四个技术重复的平均值的标准偏差。
455.图12a示出了包含seq id no:4的变体cas12i2和靶向pdcd1的几种单独crrna的变体二元复合物在不同浓度下在原代t细胞中的插入缺失活性。误差条代表来自一个代表性供体的四个技术重复的平均值的标准偏差。
456.图12b示出了在原代t细胞中引入不同浓度的靶向pdcd1的变体cas12i2 rnp后七天的细胞活力(经由dapi染色)。误差条代表来自一个代表性供体的四个技术重复的平均值的标准偏差。
457.图13是示出如何使用示例性在靶和非靶序列计算莱文斯坦(levenshtein)距离(编辑距离)的示意图。示出了在靶序列和四个非靶序列,每个序列的编辑距离为1、2、3或4。每个取代、插入或缺失的残基以粗体标示。靶序列和每个非靶序列的pam序列在点划线的左侧标示。
458.图14a示出了使用seq id no:3的cas12i2变体的八个aavs1基因座、八个emx1基因座和八个vegfa基因座上的在靶插入缺失百分比,并且进一步示出了与靶基因座相比编辑距离为1、2、3或4的基因座上的脱靶插入缺失百分比。图14b示出了使用seq id no:4的cas12i2变体的八个aavs1基因座、八个emx1基因座和八个vegfa基因座上的在靶插入缺失百分比,并且进一步示出了与靶基因座相比编辑距离为1、2、3或4的基因座上的脱靶插入缺失百分比。图14c示出了使用seq id no:5的cas12i2变体的八个aavs1基因座、八个emx1基因座和八个vegfa基因座上的在靶插入缺失率,并且进一步示出了与靶基因座相比编辑距离为1、2、3或4的基因座上的脱靶插入缺失率。
459.图15是示出实例16中用于分析cas12i2变体特异性和活性的基于标记(tagmentation)的标签整合位点测序(ttiss)方法的步骤的示意图。
460.图16a示出了seq id no:4的变体cas12i2和spcas9在靶aavs1_t5处的在靶和脱靶读段。图16b示出了seq id no:4的变体cas12i2和spcas9在靶emx1_t2处的在靶和脱靶读段。图16c示出了seq id no:4的变体cas12i2和spcas9在靶emx1_t4处的在靶和脱靶读段。图16d示出了seq id no:4的变体cas12i2和spcas9在靶vegfa_t6处的在靶和脱靶读段。
461.图17a是示出由几种工程化cas12i2变体在emx1_t6和vegfa_t7中诱导的插入缺失的图。
462.图17b是示出由seq id no:3-5和495的cas12i2变体在emx1_t6和vegfa_t7中诱导的插入缺失的图。
463.图18是示出由seq id no:4、495和496的cas12i2变体在aavs1_t6、aavs1_t7、emx1_t2、emx1_t6和vegfa_t5中诱导的插入缺失的图。
464.图19是示出cas12i2多肽的结构域结构的示意图。
465.图20a描绘了d581r取代在cas12i2结构中的位置。d581r取代可以在pam序列处与dna形成静电接触。d581r可以与非靶链相互作用。
466.图20b描绘了cas12i2结构中靠近活性位点的i926r和v1030g取代的位置。i926r可以在活性位点附近与单链dna相互作用并且稳定与rec1的界面。v1030g在该结构的c末端部分。
467.图20c描绘了未配对和非堆叠碱基的同向重复稳定。同向重复序列与cas12i2在较大区域上相互作用。另外,一些rna指导物碱基彼此配对。然而,留下一些碱基暴露(星号),例如暴露的碱基不与其他碱基配对并且不具有与cas12i2的许多相互作用。增加cas12i2与rna指导物之间、尤其是暴露区域处的相互作用的取代可以稳定二元复合物并且增加酶活性。
468.图21a是示出三元复合物形成的示意图。pam下游的双链dna解链,并且rna指导物的间隔子与靶链结合,从而形成异源双链体。pam序列保持为完整的双链dna,导致末端pam双链dna碱基对被部分暴露于环境和蛋白质。异源双链体的末端碱基对也被暴露。暴露的碱基被表示为“异源双链体末端”和“dsdna双链体末端”。
469.图21b示出了cas12i2结构中dna解链和异源双链体退火位点的暴露碱基。本文描述了用于稳定双链dna双链体和异源双链体的末端的取代。这些取代可以降低初始靶解旋的能垒。
470.图22a示出了二元复合物向三元复合物转变所需的构象变化。二元结构与三元结构之间c
ɑ
位置中的大多数变化发生在螺旋ii结构域中。矢量示出了螺旋ii绕轴旋转约25
°
的c
ɑ
运动。本文描述了取代以增强三元复合物形成。
471.图22b示出了螺旋ii结构域中取代可以增加螺旋ii结构域柔性的区域。图22b进一步示出了cas12i2结构中的区域,在这些区域中,取代可以稳定螺旋ii结构域与nuc结构域之间的界面。
具体实施方式
472.本披露涉及seq id no:2的效应子的新型变体及其产生和使用方法。本披露进一步涉及包含seq id no:2的效应子的变体的复合物及其产生和使用方法。在一些方面,本文描述了一种包含具有一个或多个特性的复合物的组合物。在一些方面,描述了一种递送包含复合物的组合物的方法。
473.组合物
474.在一些方面,本文所述的本发明包括包含复合物(例如,二元复合物)的组合物。在一些方面,本文所述的本发明包括包含复合物的组合物,该复合物包含cas12i2多肽和靶向部分。在一些实施例中,本发明的组合物包括变体cas12i2多肽和rna指导物,并且与亲本多肽相比,变体cas12i2多肽具有增加的与rna指导物的复合物形成。
475.在一些方面,本发明的组合物包括包含变体cas12i2多肽和rna指导物的复合物,其中与亲本多肽和rna指导物相比,cas12i2变体多肽和rna指导物具有更大的结合亲和力。
476.在一些方面,本发明的组合物包括包含变体cas12i2多肽和rna指导物的复合物,其中与亲本多肽和rna指导物相比,cas12i2变体多肽和rna指导物具有更强的蛋白质-rna相互作用。在一些实施例中,蛋白质-rna相互作用是离子相互作用。
477.在一些方面,本发明的组合物包括包含变体cas12i2多肽和rna指导物的复合物,其中复合物比由亲本多肽和rna指导物形成的复合物更稳定。
478.在一些方面,本文所述的本发明包括包含复合物(例如,三元复合物)的组合物。在一些实施例中,本发明的组合物包括变体cas12i2多肽、rna指导物和靶核酸,并且与亲本多肽相比,变体cas12i2多肽具有增加的与rna指导物和靶核酸的复合物形成(例如,三元复合物形成)。
479.在一些方面,本发明的组合物包括包含变体cas12i2多肽和rna指导物的二元复合物,并且组合物进一步包含靶核酸。在一些实施例中,与亲本二元复合物相比,二元复合物具有增加的与靶核酸的三元复合物形成。
480.在一些方面,本发明的组合物包括变体cas12i2多肽、rna指导物和靶核酸,其中与亲本多肽和rna指导物相比,cas12i2变体多肽和rna指导物具有更大的对靶核酸的结合亲和力。
481.在一些方面,本发明的组合物包括包含变体cas12i2多肽和rna指导物的二元复合物,并且组合物进一步包含靶核酸。在一些实施例中,与亲本二元复合物相比,二元复合物具有更大的对靶核酸的结合亲和力。
482.在一些方面,本发明的组合物包括包含变体cas12i2多肽、rna指导物和靶核酸的三元复合物,其中三元复合物比由亲本多肽、rna指导物和靶核酸形成的复合物更稳定。
483.在一些方面,本发明的组合物包括包含变体cas12i2多肽和rna指导物的二元复合物,并且组合物进一步包含靶核酸。在一些实施例中,二元复合物与靶核酸形成比由亲本二元复合物和靶核酸形成的三元复合物更稳定的三元复合物。
484.在一些方面,本文所述的本发明包括包含复合物(例如,三元复合物)的组合物。在一些实施例中,本发明的组合物包括变体cas12i2多肽、rna指导物和靶核酸,并且与亲本二元复合物相比,变体cas12i2多肽和rna指导物形成具有更大的对靶核酸的结合亲和力的变体二元复合物。
485.在一些方面,本发明的组合物包括包含变体cas12i2多肽和rna指导物的二元复合物,并且组合物进一步包含靶核酸。在一些实施例中,与亲本二元复合物相比,二元复合物具有更大的对靶核酸的靶基因座的靶结合亲和力。
486.在一些方面,本发明的组合物包括多个变体cas12i2多肽和两个或更多个不同的rna指导物。在一些实施例中,不同的rna指导物与单独的变体cas12i2多肽单独地形成变体二元复合物,并且与亲本二元复合物相比,变体二元复合物具有更大的靶核酸的两个或更多个靶基因座的在靶结合。
487.在一些方面,本发明的组合物包括多个变体cas12i2多肽和两个或更多个不同的rna指导物。在一些实施例中,不同的rna指导物与单独的变体cas12i2多肽单独地形成变体二元复合物,并且与亲本二元复合物相比,变体二元复合物具有更大的与靶核酸的两个或更多个靶基因座的在靶三元复合物形成。
488.在一些方面,本发明的组合物包括多个变体cas12i2多肽和两个或更多个不同的
rna指导物。在一些实施例中,不同的rna指导物与单独的变体cas12i2多肽单独地形成变体二元复合物,并且与亲本二元复合物相比,变体二元复合物与靶核酸的两个或更多个靶基因座形成更稳定的三元复合物。
489.在一些方面,本文所述的本发明包括包含复合物的组合物。在一些实施例中,本发明包括包含变体cas12i2多肽和rna指导物的二元复合物。
490.在一些实施例中,本发明包括包含变体cas12i2多肽、rna指导物和靶核酸的靶基因座的三元复合物。在一些实施例中,本发明的组合物包含多个变体cas12i2多肽和两个或更多个不同的rna指导物,并且不同的rna指导物与单独的变体cas12i2多肽单独地形成变体二元复合物。
491.在一些方面,本发明的组合物包括变体cas12i2多肽和rna指导物,并且变体cas12i2多肽和rna指导物形成变体二元复合物,与亲本二元复合物相比,该变体二元复合物具有更高的对靶核酸的靶基因座的在靶结合亲和力。在一些实施例中,本发明的组合物包括多个变体二元复合物,与多个亲本二元复合物相比,这些变体二元复合物具有更高的与靶核酸的两个或更多个靶基因座的在靶结合。
492.在一些方面,本发明的组合物包括包含变体cas12i2多肽和rna指导物的二元复合物,并且与亲本二元复合物相比,该二元复合物具有较低的对靶核酸的非靶基因座的结合亲和力。在一些实施例中,本发明的组合物包括多个变体二元复合物,与多个亲本二元复合物相比,这些变体二元复合物具有更低的与靶核酸的两个或更多个非靶基因座的脱靶结合。
493.在一些方面,本发明的组合物包括包含变体cas12i2多肽和rna指导物的二元复合物,并且与亲本二元复合物相比,该二元复合物具有更高的靶核酸的在靶基因座处的活性。在一些实施例中,本发明的组合物包括多个变体二元复合物,与多个亲本二元复合物相比,这些变体二元复合物具有更高的靶核酸的两个或更多个靶基因座处的在靶活性。
494.在一些方面,本发明的组合物包括包含变体cas12i2多肽和rna指导物的二元复合物,并且与亲本二元复合物相比,该二元复合物具有更低的靶核酸的非靶基因座处的活性。在一些实施例中,本发明的组合物包括多个变体二元复合物,与多个亲本二元复合物相比,这些变体二元复合物具有更低的靶核酸的两个或更多个非靶基因座处的脱靶活性。
495.变体cas12i2多肽
496.在一些实施例中,本发明的组合物包括本文所述的变体cas12i2多肽。
497.在一些实施例中,本发明的多肽是亲本多肽的变体,其中亲本由包含核苷酸序列诸如seq id no:1或包含氨基酸序列诸如seq id no:2的多核苷酸编码。
498.表1.亲本序列。
499.500.[0501][0502]
在本发明的一个方面,变体多肽序列包括一个或多个变异。
[0503]
编码本文所述的亲本多肽的核酸序列可与参考核酸序列(例如,seq id no:1)基本上相同。在一些实施例中,变体cas12i2多肽由包含以下序列的核酸编码:该序列与参考核酸序列(例如,编码亲本多肽的核酸序列,例如seq id no:1)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%序列同一性。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,blast、align、clustal)使用标准参数人工确定两个此类核酸之间的同一性百分比。两个核酸序列基本上相同的一个指示是核酸分子在严格条件下(例如,在中等至高度严格的范围内)与另一个核酸分子的互补序列杂交。
[0504]
在一些实施例中,变体cas12i2多肽由以下核酸序列编码:该核酸序列与参考核酸序列(例如,编码亲本多肽的核酸序列,例如seq id no:1)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高序列同一性,但非100%序列同一性。
[0505]
在一些实施例中,本发明的变体cas12i2多肽包含与seq id no:2具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%但非100%同一性的多肽序列。在一些实施例中,本发明的变体cas12i2多肽包含与seq id no:2具有大于50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、
96%、97%、98%或99%但非100%同一性的多肽序列。
[0506]
在一些实施例中,本发明描述了一种变体cas12i2多肽,该多肽与一个或多个参考多肽(例如,亲本多肽)具有特定程度的氨基酸序列同一性,例如与seq id no:2的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%但非100%序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如blast、align或clustal)通过氨基酸序列比对来确定。
[0507]
在一些实施例中,变体cas12i2多肽包含在亲本多肽的一个或多个(例如,若干个)氨基酸处的改变,其中至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、162、164、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、193、194、195、196、197、198、199、200个或更多个氨基酸被改变。
[0508]
在一些实施例中,变体cas12i2多肽包含表2中列出的氨基酸取代中的一种或多种。在一些实施例中,变体cas12i2多肽包含d581、g624、f626、d835、l836、p868、s879、d911、i926、v1020、v1030、e1035和s1046取代中的至少一种。在一些实施例中,变体cas12i2多肽包含d581r、g624r、f626r、d835r、l836r、p868r、s879r、d911r、i926r、v1020r、v1030r、e1035r和s1046r取代中的至少一种。在一些实施例中,变体cas12i2多肽包含d581g、f626g、d835g、l836g、p868g、s879g、d911g、i926g、v1020g、v1030g、e1035g和s1046g取代中的至少一种。在一些实施例中,变体cas12i2多肽包含d581r、g624r、f626r、d835r、l836r、p868t、s879r、d911r、i926r、v1020g、v1030g、e1035r和s1046g取代中的至少一种以及表2中列出的至少一种另外的取代。在一些实施例中,变体cas12i2多肽包含seq id no:3-146和495-512中的任一个。在一些实施例中,变体cas12i2多肽包含seq id no:3-146和495-512中的任一个以及表2中列出的至少一个另外的取代。在一些实施例中,变体cas12i2多肽包含seq id no:3的氨基酸序列。在一些实施例中,变体cas12i2多肽包含seq id no:4的氨基酸序列。在一些实施例中,变体cas12i2多肽包含seq id no:5的氨基酸序列。在一些实施例中,变体cas12i2多肽包含seq id no:495的氨基酸序列。在一些实施例中,变体cas12i2多肽包含seq id no:496的氨基酸序列。
[0509]
表2.变体cas12i2多肽中的单个氨基酸取代。
[0510]
[0511]
[0512]
[0513]
[0514]
[0515]
[0516]
[0517]
[0518]
[0519]
[0520]
[0521]
[0522]
[0523]
[0524]
[0525]
[0526]
[0527]
[0528]
[0529]
[0530]
[0531][0532]
在一些实施例中,变体cas12i2多肽包含表2中列出的氨基酸取代中的一种或多种。在一些实施例中,变体cas12i2多肽包含图1中描绘的seq id no:3-5、495或496中的任一个中所示的序列。在一些实施例中,变体cas12i2多肽包含seq id no:6-146中的任一个中所示的序列。
[0533]
在一些实施例中,本文所述的组合物包含一个或多个单独的(例如,2、3、4、5、6、7、8、9个或更多个)变体cas12i2多肽。在此类实施例中,单独的变体多肽可独立地包含表2中列出的氨基酸取代中的一种或多种。在一些实施例中,单独的变体cas12i2多肽包含图1中描绘的seq id no:3-5、495或496中的任一个中所示的序列。在一些实施例中,单独的变体cas12i2多肽包含seq id no:6-146中的任一个中所示的序列。
[0534]
在一些实施例中,变体cas12i2多肽包含如表3中所示的突变或突变组,其中这些突变是相对于seq id no:2的序列而言的。
[0535]
表3.cas12i2变体取代和序列。
[0536]
[0537]
[0538]
[0539]
[0540]
[0541][0542]
在一些实施例中,变体cas12i2多肽是表3中所示的多肽。表3中的取代是相对于seq id no:2的序列而言的。在一些实施例中,变体cas12i2多肽包含表3中列出的氨基酸取代中的一种或多种。
[0543]
在一些实施例中,本发明的变体cas12i2多肽包含与seq id no:3-146和495-512中的任一个具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些实施例中,本发明的变体cas12i2多肽包含与seq id no:3-146和495-512中的任一个具有大于50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
[0544]
在一些实施例中,seq id no:2的氨基酸597至607之间的一个或多个氨基酸被改变或突变。在一些实施例中,seq id no:2的氨基酸597至604之间的一个或多个氨基酸被改变或突变。在一些实施例中,seq id no:2的氨基酸830至833之间的一个或多个氨基酸被改变或突变。在一些实施例中,seq id no:2的氨基酸829至835之间的一个或多个氨基酸被改变或突变。在一些实施例中,seq id no:2的氨基酸882至888之间的一个或多个氨基酸被改变或突变。在一些实施例中,seq id no:2的氨基酸883至889之间的一个或多个氨基酸被改变或突变。参见表2。
[0545]
在一些实施例中,seq id no:2的氨基酸600至607之间的一个或多个氨基酸被改变或突变。在一些实施例中,seq id no:2的氨基酸833至871之间的一个或多个氨基酸被改
变或突变。在一些实施例中,seq id no:2的氨基酸877至885之间的一个或多个氨基酸被改变或突变。参见表2。
[0546]
在一些实施例中,变体cas12i2多肽包含至少一个ruvc结构域。在一些实施例中,变体cas12i2多肽包含至少一个ruvc基序(例如,一个、两个或三个ruvc基序)。本文披露的cas12i2多肽的结构域在图19中描绘。wedge结构域包含cas12i2多肽的残基1-14和442-586。rec1结构域包含cas12i2多肽的残基15-176和270-441。在rec1结构域内,螺旋i结构域包含残基15-176和270-327,并且螺旋ii结构域包含残基328-441。pi结构域包含cas12i2多肽的残基177-269。rec2结构域包含cas12i2多肽的残基638-828。nuc结构域包含cas12i2多肽的残基880-1017。ruvc基序包含cas12i2多肽的残基587-637(ruvc1)、残基829-879(ruvc2)和残基1018-1054(ruvc3)。
[0547]
在一些实施例中,具有本文所述的特征的变体cas12i2多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0548]
尽管本文所述的改变可以是一个或多个氨基酸改变,但变体cas12i2多肽的改变也可具有结构或实质性质,诸如作为氨基和/或羧基末端延伸的多肽的融合。例如,变体cas12i2多肽可含有另外的肽,例如一种或多种肽。另外的肽的实例可包括用于标记的表位肽,诸如多组氨酸标签(his标签)、myc和flag。在一些实施例中,本文所述的变体cas12i2多肽可以融合到可检测部分,诸如荧光蛋白(例如,绿色荧光蛋白(gfp)或黄色荧光蛋白(yfp))。
[0549]
在一些实施例中,变体cas12i2多肽包含至少一个(例如,两个、三个、四个、五个、六个或更多个)核定位信号(nls)。在一些实施例中,变体cas12i2多肽包含至少一个(例如,两个、三个、四个、五个、六个或更多个)核输出信号(nes)。在一些实施例中,变体cas12i2多肽包含至少一个(例如,两个、三个、四个、五个、六个或更多个)nls和至少一个(例如,两个、三个、四个、五个、六个或更多个)nes。
[0550]
在一些实施例中,本文所述的变体cas12i2多肽可以是自灭活的。参见epstein等人,“engineering a self-inactivating crispr system for aav vectors[改造用于aav载体的自我灭活的crispr系统],”mol.ther.[分子疗法],24(2016):s50,将该文献通过援引以其全文并入。
[0551]
在一些实施例中,编码本文所述的变体cas12i2多肽的核苷酸序列可以经密码子优化以用于特定的宿主细胞或生物体。例如,核酸可以经密码子优化以用于任何非人真核生物,包括小鼠、大鼠、兔、狗、家畜或非人灵长类动物。密码子使用表是易于获得的,例如在www.kazusa.orjp/codon/上可获得的“密码子使用数据库(codon usage database)”中,并且这些表可以按多种方式进行改编。参见nakamura等人nucl.acids res.[核酸研究]28:292(2000),将该文献通过援引以其全文并入本文。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可获得的,诸如基因制造(gene forge)(aptagen公司;宾夕法尼亚州雅各布斯(jacobus,pa))。
[0552]
变体多肽的功能性
[0553]
如本文所用,“生物活性部分”是保留亲本多肽(例如,“最小”或“核心”结构域)的至少一种功能(例如,完全地、部分地、最低限度地)的部分。在一些实施例中,变体cas12i2
多肽保留至少与亲本多肽一样活性的酶活性。因此,在一些实施例中,变体cas12i2多肽具有比亲本多肽更大的酶活性。
[0554]
还提供了本发明的变体cas12i2多肽,该多肽具有酶活性(例如,核酸酶或内切核酸酶活性),并且包含当使用前述比对方法中的任一种进行比对时与亲本多肽和seq id no:2中的任一个的氨基酸序列相差50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个氨基酸残基的氨基酸序列。在一些实施例中,具有酶活性的变体cas12i2多肽包含当使用前述比对方法中的任一种进行比对时与亲本多肽和seq id no:2中的任一个的氨基酸序列具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0555]
在一些方面,变体cas12i2多肽包含至少一个改变或突变,该改变或突变增强变体cas12i2多肽的酶活性、rna指导物复合物(二元复合物)形成、rna指导物结合活性、rna指导物亲和力、rna指导物结合特异性、蛋白质-rna相互作用、蛋白质-dna相互作用、蛋白质稳定性、三元复合物形成、在靶结合活性、在靶结合特异性和/或三元复合物中的稳定性。在一些实施例中,本发明的变体cas12i2多肽具有等于或大于亲本多肽的酶活性、rna指导物复合物(二元复合物)形成、rna指导物结合活性、rna指导物亲和力、rna指导物结合特异性、蛋白质-rna相互作用、蛋白质-dna相互作用、蛋白质稳定性、三元复合物形成、在靶结合活性、在靶结合特异性和/或三元复合物中的稳定性中的至少一种。在一些实施例中,变体cas12i2多肽包含至少一个改变或突变,该改变或突变增强酶活性、rna指导物复合物(二元复合物)形成、rna指导物结合活性、rna指导物亲和力、rna指导物结合特异性、蛋白质-rna相互作用、蛋白质-dna相互作用、蛋白质稳定性、三元复合物形成、在靶结合活性、在靶结合特异性和/或三元复合物中的稳定性,并且变体cas12i2多肽包含与seq id no:4具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0556]
在一些实施例中,变体cas12i2多肽包含增强的酶活性、rna指导物复合物(二元复合物)形成、rna指导物结合活性、rna指导物亲和力、rna指导物结合特异性、蛋白质-rna相互作用、蛋白质-dna相互作用、蛋白质稳定性、三元复合物形成、在靶结合活性、在靶结合特异性和/或三元复合物中的稳定性,并且变体cas12i2多肽包含seq id no:3-5、495或496中的任一个的氨基酸序列。
[0557]
在一些实施例中,变体cas12i2多肽包含增强的酶活性、rna指导物复合物(二元复合物)形成、rna指导物结合活性、rna指导物亲和力、rna指导物结合特异性、蛋白质-rna相互作用、蛋白质-dna相互作用、蛋白质稳定性、三元复合物形成、在靶结合活性、在靶结合特异性和/或三元复合物中的稳定性,并且变体cas12i2多肽包含seq id no:3-146和495-512中的任一个的氨基酸序列。
[0558]
在本发明的一些方面,变体cas12i2多肽包含改变多肽与核酸(例如,rna指导物或dna)相互作用(例如,结合或形成复合物)的能力的取代。在本发明的一些方面,变体cas12i2多肽包含改变多肽对核酸(例如,rna指导物或dna)的亲和力的取代。
[0559]
在一些实施例中,包含d581r取代的变体cas12i2多肽表现出增强的酶活性。在一些实施例中,包含d581r取代的变体cas12i2多肽与nts相互作用。在一些实施例中,包含d581r取代的变体cas12i2多肽与pam序列主链相互作用。在一些实施例中,包含d581r取代
的变体cas12i2多肽表现出在pam序列处与dna的静电相互作用增强。在一些实施例中,包含d581r取代的变体cas12i2多肽降低与核酸的排斥相互作用。在一些实施例中,包含d581r取代的变体cas12i2多肽增强r-环稳定性。见图20a。
[0560]
在一些实施例中,包含v1030g取代的变体cas12i2多肽表现出增强的酶活性。在一些实施例中,包含v1030g取代的变体cas12i2多肽与nts相互作用。在一些实施例中,包含v1030g取代的变体cas12i2多肽在cas12i2活性位点附近。参见图20b。
[0561]
在一些实施例中,包含i926r取代的变体cas12i2多肽表现出增强的酶活性。在一些实施例中,包含i926r取代的变体cas12i2多肽在cas12i2活性位点附近与单链dna相互作用。在一些实施例中,包含i926r取代的变体cas12i2多肽稳定单链dna。参见图20b。
[0562]
在一些实施例中,包含g624r取代的变体cas12i2多肽表现出增强的酶活性。在一些实施例中,包含g624r取代的变体cas12i2多肽与nts相互作用。在一些实施例中,包含g624r取代的变体cas12i2多肽增强r-环稳定性。
[0563]
在一些实施例中,包含f626r取代的变体cas12i2多肽表现出增强的酶活性。在一些实施例中,包含f626r取代的变体cas12i2多肽与nts相互作用。在一些实施例中,包含f626r取代的变体cas12i2多肽增强r-环稳定性。
[0564]
在一些实施例中,本发明的变体cas12i2多肽在约20℃至约90℃的温度范围内(例如,约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、65℃或更高温度中的任一个)具有酶活性、rna指导物复合物(二元复合物)形成、rna指导物结合活性、rna指导物亲和力、rna指导物结合特异性、蛋白质-rna相互作用、蛋白质-dna相互作用、蛋白质稳定性、三元复合物形成、在靶结合活性、在靶结合特异性和/或三元复合物中的稳定性中的至少一种。在一些实施例中,本发明的变体cas12i2多肽在约20℃至约25℃的温度下或在约37℃的温度下具有酶活性、rna指导物复合物(二元复合物)形成、rna指导物结合活性、rna指导物亲和力、rna指导物结合特异性、蛋白质-rna相互作用、蛋白质-dna相互作用、蛋白质稳定性、三元复合物形成、在靶结合活性、在靶结合特异性和/或三元复合物中的稳定性中的至少一种。
[0565]
在一些实施例中,与亲本多肽相比,变体cas12i2多肽在具有约7.3至约8.6范围内(例如,7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5、8.6或这些值的任何组合之间的范围内的任何值)的ph的缓冲液中表现出增强的酶活性、rna指导物复合物(二元复合物)形成、rna指导物结合活性、rna指导物亲和力、rna指导物结合特异性、蛋白质-rna相互作用、蛋白质-dna相互作用、蛋白质稳定性、三元复合物形成、在靶结合活性、在靶结合特异性和/或三元复合物中的稳定性。
[0566]
在一些实施例中,当变体cas12i2多肽的tm值比亲本多肽的tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃时,变体cas12i2表现出酶活性、rna指导物复合物(二元复合物)形成、rna指导物结合活性、rna指导物亲和力、rna指导物结合特异性、蛋白质-rna相互作用、蛋白质-dna相互作用、蛋白质稳定性、三元复合物形成、在靶结合活性、在靶结合特异性和/或三元复合物中的稳定性中的至少一种。在一个实施例中,当变体cas12i2多肽的tm值比亲本多肽的tm值大至少8℃时,变体cas12i2表现出增强的酶活性、rna指导物复合物(二元复合物)形成、rna指
导物结合活性、rna指导物亲和力、rna指导物结合特异性、蛋白质-rna相互作用、蛋白质-dna相互作用、蛋白质稳定性、三元复合物形成、在靶结合活性、在靶结合特异性和/或三元复合物中的稳定性。
[0567]
在一些实施例中,与亲本多肽相比,本发明的变体cas12i2多肽在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内表现出增加的酶活性、rna指导物复合物(二元复合物)形成、rna指导物结合活性、rna指导物亲和力、rna指导物结合特异性、蛋白质-rna相互作用、蛋白质-dna相互作用、蛋白质稳定性、三元复合物形成、在靶结合活性、在靶结合特异性和/或三元复合物中的稳定性中的至少一种。在一些实施例中,与亲本多肽相比,本发明的变体cas12i2多肽在一定孵育时间范围内表现出增加的酶活性、rna指导物复合物(二元复合物)形成、rna指导物结合活性、rna指导物亲和力、rna指导物结合特异性、蛋白质-rna相互作用、蛋白质-dna相互作用、蛋白质稳定性、三元复合物形成、在靶结合活性、在靶结合特异性和/或三元复合物中的稳定性中的至少一种。
[0568]
还提供了本发明的变体cas12i2多肽,该多肽具有降低的与rna指导物的解离(二元复合物的解离)、与靶核酸的解离(三元复合物的解离)、与非靶核酸的脱靶结合和/或靶核酸的非靶基因座处的活性,并且包含当使用前述比对方法中的任一种进行比对时与亲本多肽和seq id no:2中的任一个的氨基酸序列相差50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个氨基酸残基的氨基酸序列。在一些实施例中,具有降低的与rna指导物的解离(二元复合物的解离)、与靶核酸的解离(三元复合物的解离)、与非靶核酸的脱靶结合和/或靶核酸的非靶基因座处的活性的变体cas12i2多肽包含当使用前述比对方法中的任一种进行比对时与亲本多肽和seq id no:2中的任一个的氨基酸序列具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0569]
在一些方面,变体cas12i2多肽包含至少一个改变或突变,该改变或突变降低变体cas12i2多肽的与rna指导物的解离(二元复合物的解离)、与靶核酸的解离(三元复合物的解离)、与非靶核酸的脱靶结合和/或靶核酸的非靶基因座处的活性。在一些实施例中,变体cas12i2多肽包含至少一个改变或突变,该改变或突变降低与rna指导物的解离(二元复合物的解离)、与靶核酸的解离(三元复合物的解离)、与非靶核酸的脱靶结合和/或靶核酸的非靶基因座处的活性,并且变体cas12i2多肽包含与seq id no:4具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0570]
在一些方面,与亲本多肽相比,变体cas12i2多肽包含至少一个改变或突变,该改变或突变降低与rna指导物的解离(二元复合物的解离)、与靶核酸的解离(三元复合物的解离)、与非靶核酸的脱靶结合和/或靶核酸的非靶基因座处的活性。在一些方面,与亲本多肽相比,变体cas12i2多肽包含降低的与rna指导物的解离(二元复合物的解离)、与靶核酸的解离(三元复合物的解离)、与非靶核酸的脱靶结合和/或靶核酸的非靶基因座处的活性,并且变体cas12i2多肽包含seq id no:3-5、495或496中的任一个的氨基酸序列。
[0571]
在一些方面,与亲本多肽相比,变体cas12i2多肽包含降低的与rna指导物的解离(二元复合物的解离)、与靶核酸的解离(三元复合物的解离)、与非靶核酸的脱靶结合和/或
靶核酸的非靶基因座处的活性,并且变体cas12i2多肽包含seq id no:3-146和495-512中的任一个的氨基酸序列。
[0572]
在一些实施例中,本发明的变体cas12i2多肽以等于或低于亲本多肽的水平表现出与rna指导物的解离(二元复合物的解离)、与靶核酸的解离(三元复合物的解离)、与非靶核酸的脱靶结合和/或靶核酸的非靶基因座处的活性中的至少一种。在一些实施例中,本发明的变体cas12i2多肽在约20℃至约90℃的温度范围内(例如,约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、65℃或更高温度中的任一个)具有等于或降低的与rna指导物的解离(二元复合物的解离)、与靶核酸的解离(三元复合物的解离)、与非靶核酸的脱靶结合和/或靶核酸的非靶基因座处的活性。在一些实施例中,本发明的变体cas12i2多肽在约20℃至约25℃的温度下或在约37℃的温度下执行与rna指导物的解离(二元复合物的解离)、与靶核酸的解离(三元复合物的解离)、与非靶核酸的脱靶结合和/或靶核酸的非靶基因座处的活性中的至少一种。
[0573]
在一些实施例中,与亲本多肽相比,变体cas12i2多肽在具有约7.3至约8.6范围内(例如,7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5、8.6或这些值的任何组合之间的范围内的任何值)的ph的缓冲液中表现出降低的与rna指导物的解离(二元复合物的解离)、与靶核酸的解离(三元复合物的解离)、与非靶核酸的脱靶结合和/或靶核酸的非靶基因座处的活性。
[0574]
在一些实施例中,当变体cas12i2多肽的tm值比亲本多肽的tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃时,与亲本多肽相比,变体cas12i2多肽表现出与rna指导物的解离(二元复合物的解离)、与靶核酸的解离(三元复合物的解离)、与非靶核酸的脱靶结合和/或靶核酸的非靶基因座处的活性中的至少一种。在一个实施例中,当变体cas12i2多肽的tm值比亲本多肽的tm值大至少8℃时,变体cas12i2多肽表现出降低的与rna指导物的解离(二元复合物的解离)、与靶核酸的解离(三元复合物的解离)、与非靶核酸的脱靶结合和/或靶核酸的非靶基因座处的活性。
[0575]
增加的rna指导物相互作用
[0576]
在一些实施例中,与亲本多肽相比,变体cas12i2多肽包含增加变体cas12i2多肽与rna指导物之间的相互作用和/或亲和力的改变。参见图20c。在一些实施例中,增加变体cas12i2多肽与rna指导物之间的相互作用和/或亲和力的改变是将一个或多个氨基酸取代为精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸、丝氨酸或酪氨酸残基。在一些实施例中,变体cas12i2多肽包含将rna结合界面中的一个或多个氨基酸取代为精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸、丝氨酸或酪氨酸残基。在一些实施例中,变体cas12i2多肽包含将一个或多个氨基酸441-586或637-828取代为精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸、丝氨酸或酪氨酸残基中的任一个。在一些实施例中,变体cas12i2多肽包含将至少一个结构域(例如,wedge结构域或rec2结构域)中的一个或多个氨基酸改变为精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸、丝氨酸或酪氨酸残基。在一些实施例中,与亲本多肽相比,rna结合界面取代使rna指导物结合或rna指导物结合亲和力增加约4%、5%、6%、7%、8%、9%、10%、
11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。
[0577]
在一些实施例中,相对于亲本多肽,取代增加rna指导物复合物(二元复合物)形成。可以改变变体cas12i2多肽与rna指导物的同向重复序列相互作用的能力的取代的非限制性实例在表4中示出。在一些实施例中,相对于亲本多肽,包含表4中列出的一个或多个取代的变体cas12i2多肽表现出增强的rna指导物复合物(二元复合物)形成。在一些实施例中,与包含亲本多肽的二元复合物相比,包含表4中列出的一个或多个取代的变体cas12i2多肽与rna指导物形成更稳定的二元复合物。
[0578]
表4.增加同向重复序列接触的取代。
[0579]
残基取代n459r、k、ht513np514qh519r、kv536nt541r、ye542q、kf646y、r、h、qy651h、r、k、ql654n、ql703nc741n、sl749nl801r、kt804k、r、qe812qa815rn816hq820k、r
[0580]
在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含表4中列出的一个或多个取代。在一些实施例中,变体cas12i2多肽包含表2和表4中列出的一个或多个取代。
[0581]
在一些实施例中,表现出增强的rna指导物复合物(二元复合物)形成的变体
cas12i2多肽包含两个或更多个取代,例如l654k q658a、l520k q496n或l520k q496s。在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含l654k q658a、l520k q496n或l520k q496s取代。在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含l654k q658a、l520k q496n或l520k q496s取代和表4中列出的一个或多个取代。
[0582]
在一些实施例中,包含表4中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,包含表4中列出的一个或多个取代的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,进一步包含l654k q658a、l520k q496n或l520k q496s和表4中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,与亲本多肽相比,变体cas12i2多肽表现出增加的酶活性(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。
[0583]
增加的双链dna相互作用
[0584]
在一些方面,相对于亲本多肽,变体cas12i2多肽包含增加与双链dna的相互作用的改变。在一些实施例中,增加的与双链dna的相互作用是增加的静电相互作用。在一些实施例中,相对于亲本多肽,变体cas12i2多肽包含增加变体cas12i2多肽与双链dna之间的亲和力的改变。在一些实施例中,增加变体cas12i2多肽与双链dna之间的相互作用和/或亲和力的改变增加变体cas12i2多肽与pam序列的结合。
[0585]
在一些实施例中,增加变体cas12i2多肽与双链dna之间的相互作用和/或亲和力的改变是将一个或多个氨基酸取代为精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸或丝氨酸残基。在一些实施例中,变体cas12i2多肽包含将双链dna结合界面中的一个或多个氨基酸取代为精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸或丝氨酸残基。在一些实施例中,变体cas12i2多肽包含将一个或多个氨基酸140-190、220-300、440-480或560-570取代为精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸或丝氨酸残基中的任一个。在一些实施例中,变体cas12i2多肽包含将至少一个结构域(例如,rec1结构域、pi结构域或wedge结构域)中的一个或多个氨基酸改变为精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸或丝氨酸残基。在一些实施例中,与亲本多肽相比,双链dna结合界面取代使双链dna相互作用和/或亲和力增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、
80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。在一些实施例中,与亲本多肽相比,双链dna结合界面取代使变体cas12i2多肽与pam序列的结合增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。
[0586]
在一些实施例中,相对于亲本多肽,增加双链dna相互作用的取代增加三元复合物形成。可以改变变体cas12i2多肽与双链dna相互作用的能力的取代的非限制性实例在表5中示出。在一些实施例中,相对于亲本多肽,包含表5中列出的一个或多个取代的变体cas12i2多肽表现出增加的双链dna相互作用(三元复合物形成)。在一些实施例中,与亲本多肽相比,包含表5中列出的一个或多个取代的变体cas12i2多肽形成更稳定的三元复合物。
[0587]
表5.改变双链相互作用的取代。
[0588][0589][0590]
在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进
一步包含表5中列出的一个或多个取代。在一些实施例中,变体cas12i2多肽包含表2和表5中列出的一个或多个取代。
[0591]
在一些实施例中,表现出增加的双链dna相互作用的变体cas12i2多肽包含两个或更多个取代,例如t562r e563k、t562r e563k n448k、i451r l452k、i451r l452k t562r e563r、i451r l452k y472r、n229r q224n或n229k q224n。在一些实施例中,表现出增加的三元复合物形成/稳定性的变体cas12i2多肽包含两个或更多个取代,例如t562r e563k、t562r e563k n448k、i451r l452k、i451r l452k t562r e563r、i451r l452k y472r、n229r q224n或n229k q224n。在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含t562r e563k、t562r e563k n448k、i451r l452k、i451r l452k t562r e563r、i451r l452k y472r、n229r q224n或n229k q224n取代。在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含t562r e563k、t562r e563k n448k、i451r l452k、i451r l452k t562r e563r、i451r l452k y472r、n229r q224n或n229k q224n取代和表4和/或表5中列出的一个或多个取代。在一些实施例中,变体cas12i2多肽包含表4和/或表5中的任何一个或多个取代。在一些实施例中,与亲本多肽相比,具有表4和/或表5中的一个或多个取代的变体cas12i2多肽表现出增加的双链dna相互作用和/或亲和力(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。在一些实施例中,与亲本多肽相比,具有表4和/或表5中的一个或多个取代的变体cas12i2多肽表现出增加的三元复合物形成和/或三元复合物稳定性(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。
[0592]
在一些实施例中,包含表4和/或表5中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,包含表4和/或表5中列出的一个或多个取代的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,进一步包含t562r e563k、t562r e563k n448k、i451r l452k、i451r l452k t562r e563r、i451r l452k y472r、n229r q224n或n229k q224n取代和表4和/或表5中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的酶
活性。在一些实施例中,与亲本多肽相比,变体cas12i2多肽表现出增加的酶活性(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。
[0593]
增加的单链dna相互作用
[0594]
在一些实施例中,相对于亲本多肽,变体cas12i2多肽包含增加与单链dna的相互作用的改变。在一些实施例中,相对于亲本多肽,变体cas12i2多肽包含增加变体cas12i2多肽与双链dna之间的亲和力的改变。在一些实施例中,单链dna包含非靶链(nts)。在一些实施例中,增加的与单链dna(例如,nts)的相互作用是pam序列与变体cas12i2多肽的活性位点之间的相互作用。在一些实施例中,单链dna包含在变体cas12i2多肽的活性位点处或附近与变体cas12i2多肽相互作用的单链dna。在一些实施例中,增加变体cas12i2多肽与单链dna之间的相互作用和/或亲和力的改变稳定r-环。如本文所用,“r-环”是指包含与靶链(ts)和单链非靶链(nts)配对的rna指导物的核酸。
[0595]
在一些实施例中,增加变体cas12i2多肽与单链dna之间的相互作用和/或亲和力的改变是将一个或多个氨基酸取代为精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸或丙氨酸残基。在一些实施例中,变体cas12i2多肽包含将单链dna结合界面中的一个或多个氨基酸取代为精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸或丙氨酸残基。在一些实施例中,变体cas12i2多肽包含将一个或多个氨基酸230-260、350-400、580-630、700-760、830-900或920-1035取代为精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸或丙氨酸残基中的任一个。在一些实施例中,变体cas12i2多肽包含将至少一个结构域/基序(例如,pi结构域、rec1结构域、wedge结构域、ruvc1基序、rec2结构域、ruvc2基序、nuc结构域或ruvc3基序)中的一个或多个氨基酸改变为精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸或丙氨酸残基。在一些实施例中,与亲本多肽相比,单链dna结合界面取代使单链dna相互作用和/或亲和力增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。
[0596]
在一些实施例中,相对于亲本多肽,增加单链dna相互作用的取代增加三元复合物形成。可以改变变体cas12i2多肽与单链dna相互作用的能力的取代的非限制性实例在表6中示出。在一些实施例中,相对于亲本多肽,包含表6中列出的一个或多个取代的变体
cas12i2多肽表现出增加的单链dna相互作用(三元复合物形成)。在一些实施例中,与亲本多肽相比,包含表6中列出的一个或多个取代的变体cas12i2多肽形成更稳定的三元复合物。
[0597]
表6.改变单链相互作用的取代。
[0598]
残基取代接触t235knts ssdnad256k、n、rnts ssdnag360r、kssdna(活性位点附近)d362k、rssdna(活性位点附近)v383r、kssdna(活性位点附近)l384r、kssdna(活性位点附近)n390qssdna(活性位点附近)n391r、qssdna(活性位点附近)g587k、rnts ssdnat588r、knts ssdnat603k、r、qssdna(活性位点附近)y619r、knts ssdnae622r、k、ants ssdnae709r、kssdna(活性位点附近)y712r、kssdna(活性位点附近)d716r、kssdna(活性位点附近)s752r、kssdna(活性位点附近)d835kssdna(活性位点附近)n840kssdna(活性位点附近)f876r、knts ssdnay881k、rssdna(活性位点附近)h884kssdna(活性位点附近)d894k、rnts ssdnan925k、rssdna(活性位点附近)e930r、kssdna(活性位点附近)s957r、kssdna(活性位点附近)d958k、n、rssdna(活性位点附近)v1030r、knts ssdna
[0599]
在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含表6中列出的一个或多个取代。在一些实施例中,变体cas12i2多肽包含表2和表6中列出的一个或多个取代。
[0600]
在一些实施例中,表现出增加的单链dna相互作用的变体cas12i2多肽包含两个或更多个取代,例如g587r t588r、g587r t588k、g587r t588k q590r或g587r t588r q590k。在一些实施例中,表现出增加的三元复合物形成/稳定性的变体cas12i2多肽包含两个或更
多个取代,例如g587r t588r、g587r t588k、g587r t588k q590r或g587r t588r q590k。在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含g587r t588r、g587r t588k、g587r t588k q590r或g587r t588r q590k取代。在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含g587r t588r、g587r t588k、g587r t588k q590r或g587r t588r q590k取代和表4和/或表5和/或表6中列出的一个或多个取代。在一些实施例中,变体cas12i2多肽包含表4和/或表5和/或表6中的任何一个或多个取代。在一些实施例中,与亲本多肽相比,具有表4和/或表5和/或表6中的一个或多个取代的变体cas12i2多肽表现出增加的单链dna相互作用和/或亲和力(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。在一些实施例中,与亲本多肽相比,具有表4和/或表5和/或表6中的一个或多个取代的变体cas12i2多肽表现出增加的三元复合物形成和/或三元复合物稳定性(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。
[0601]
在一些实施例中,变体cas12i2多肽包含增加单链dna稳定性的取代(例如,该取代增加单链dna与变体cas12i2多肽的活性位点之间的静电相互作用)。在一些实施例中,与亲本多肽相比,变体cas12i2多肽使单链dna稳定性增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。可以改变变体cas12i2多肽稳定单链dna的能力的取代的非限制性实例在表6中示出。在一些实施例中,相对于亲本多肽,包含表6中列出的一个或多个取代的变体cas12i2多肽表现出增加的单链dna稳定性。
[0602]
在一些实施例中,包含表4和/或表5和/或表6中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,包含表4和/或表5和/或表6中列出的一个或多个取代的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,进一步包含g587r t588r、g587r t588k、g587r t588k q590r或g587r t588r q590k取代和表4和/或表5和/或表6中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,与亲本多肽相比,变体cas12i2多肽表现出增加的酶活性(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。
[0603]
增加的异源双链体相互作用
[0604]
在一些实施例中,对于亲本多肽,变体cas12i2多肽包含相增加与dna/rna杂交分子的相互作用的取代。在一些实施例中,相对于亲本多肽,变体cas12i2多肽包含增加变体cas12i2多肽与dna/rna杂交体之间的亲和力的改变。在一些实施例中,dna/rna杂交分子是异源双链体。如本文所用,“异源双链体”是指由rna指导物的间隔子和靶链(ts)形成的双螺旋。如本文所用,术语“种子区”是指异源双链体的紧邻pam序列下游的ts部分。种子区包含异源双链体中与rna指导物配对的第一碱基,并且是rna-dna结合和ts取代所需的。在一些实施例中,增加变体cas12i2多肽与异源双链体之间的相互作用和/或亲和力的改变增加非特异性核酸接触。在一些实施例中,相对于亲本多肽,增加变体cas12i2多肽与异源双链体之间的相互作用和/或亲和力的改变增加三元复合物形成/稳定性。
[0605]
在一些实施例中,增加变体cas12i2多肽与异源双链体之间的相互作用和/或亲和力的改变是将一个或多个氨基酸取代为精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸或丝氨酸残基。在一些实施例中,变体cas12i2多肽包含将接触异源双链体的一个或多个氨基酸取代为精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸或丝氨酸残基。在一些实施例中,变体cas12i2多肽包含将一个或多个氨基酸110-130、150-170、250-320、340-400、420-450、670-720、770-810或830-870取代为精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸或丝氨酸残基中的任一个。在一些实施例中,变体cas12i2多肽包含将至少一个结构域/基序(例如,rec1结构域、pi结构域、rec2结构域或ruvc2基序)中的一个或多个氨基酸改变为精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸或丝氨酸残基。在一些实施例中,与亲本多肽相比,核酸界面取代使异源双链体相互作用和/或亲和力增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、
72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。
[0606]
在一些实施例中,相对于亲本多肽,增加异源双链相互作用的取代增加三元复合物形成/稳定性。可以改变变体cas12i2多肽与异源双链体相互作用的能力的取代的非限制性实例在表7中示出。在一些实施例中,相对于亲本多肽,包含表7中列出的一个或多个取代的变体cas12i2多肽表现出增加的异源双链体相互作用(三元复合物形成)。在一些实施例中,与亲本多肽相比,包含表7中列出的一个或多个取代的变体cas12i2多肽形成更稳定的三元复合物。
[0607]
表7.改变异源双链相互作用的取代。
[0608]
[0609][0610]
在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含表7中列出的一个或多个取代。在一些实施例中,变体cas12i2多肽包含表2和表7
中列出的一个或多个取代。
[0611]
在一些实施例中,表现出增加的异源双链体相互作用的变体cas12i2多肽包含两个或更多个取代,例如e691r a695r、s78k v438g、s78k v438a、s346r e343s、d782r d793n、s78r v438g、s78r v438a、s346k e343s或d782k d793n。在一些实施例中,表现出增加的三元复合物形成/稳定性的变体cas12i2多肽包含两个或更多个取代,例如e691r a695r、s78k v438g、s78k v438a、s346r e343s、d782r d793n、s78r v438g、s78r v438a、s346k e343s或d782k d793n。在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含e691r a695r、s78k v438g、s78k v438a、s346r e343s、d782r d793n、s78r v438g、s78r v438a、s346k e343s或d782k d793n取代。在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含e691r a695r、s78k v438g、s78k v438a、s346r e343s、d782r d793n、s78r v438g、s78r v438a、s346k e343s或d782k d793n取代和表4和/或表5和/或表6和/或表7中列出的一个或多个取代。在一些实施例中,变体cas12i2多肽包含表4和/或表5和/或表6和/或表7中的任何一个或多个取代。在一些实施例中,与亲本多肽相比,具有表4和/或表5和/或表6和/或表7中的一个或多个取代的变体cas12i2多肽表现出增加的异源双链体相互作用和/或亲和力(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。在一些实施例中,与亲本多肽相比,具有表4和/或表5和/或表6和/或表7中的一个或多个取代的变体cas12i2多肽表现出增加的三元复合物形成和/或三元复合物稳定性(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。
[0612]
在一些实施例中,包含表4和/或表5和/或表6和/或表7中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,包含表4和/或表5和/或表6和/或表7中列出的一个或多个取代的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,进一步包含e691r a695r、s78k v438g、s78k v438a、s346r e343s、d782r d793n、s78r v438g、s78r v438a、s346k e343s或d782k d793n取代和表4和/或表5和/或表6和/或表7中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,与亲本多
肽相比,变体cas12i2多肽表现出增加的酶活性(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。
[0613]
增加的双链dna双链体和异源双链体稳定性
[0614]
在三元复合物形成期间,pam序列下游的双链dna解链(例如,解旋)成靶链(ts)和非靶链(nts)。rna指导物的间隔子与ts结合,从而形成称为异源双链体的双螺旋。pam序列不解链并且保持为完整的双链dna。这导致这些末端pam dsdna碱基对部分暴露于环境和蛋白质,这在能量上可能是不利的。类似地,异源双链体的末端碱基对被暴露并且在能量上可能是不利的。参见图21。在一些实施例中,增加变体cas12i2多肽与双链dna双链体的暴露末端pam碱基或异源双链体的末端碱基之间的芳族、疏水、范德华和/或阳离子-π相互作用的改变增加三元复合物形成期间dna解链的稳定性。在一些实施例中,增加变体cas12i2多肽与双链dna双链体或异源双链体的暴露碱基之间的芳族、疏水、范德华和/或阳离子-π相互作用的改变增加三元复合物形成期间的r-环稳定性。在一些实施例中,增加变体cas12i2多肽与双链dna双链体或异源双链体的暴露碱基之间的芳族、疏水、范德华和/或阳离子-π相互作用的改变增加三元复合物形成。在一些实施例中,增加变体cas12i2多肽与双链dna双链体或异源双链体的暴露碱基之间的芳族、疏水、范德华和/或阳离子-π相互作用的改变增加三元复合物稳定性。参见图20d。
[0615]
在一些实施例中,增加芳族、疏水、范德华和/或阳离子-π相互作用的改变是用精氨酸、赖氨酸、色氨酸、苯丙氨酸、酪氨酸、甲硫氨酸、组氨酸、谷氨酰胺、苏氨酸或缬氨酸残基取代一个或多个残基。在一些实施例中,增加芳族、疏水、范德华和/或阳离子-π相互作用的改变是用精氨酸、赖氨酸、色氨酸、苯丙氨酸、酪氨酸、甲硫氨酸、组氨酸、谷氨酰胺、苏氨酸或缬氨酸残基取代接触双链dna双链体和/或异源双链体的一个或多个残基。在一些实施例中,增加芳族、疏水、范德华和/或阳离子-π相互作用的改变是表8中列出的取代。在一些实施例中,与亲本多肽相比,包含表8中列出的取代的变体cas12i2多肽表现出增加的变体cas12i2多肽与双链dna双链体或异源双链体的暴露碱基之间的芳族、疏水、范德华和/或阳离子-π相互作用。在一些实施例中,该改变包括用带正电荷的芳族、疏水或支链氨基酸(例如,精氨酸、赖氨酸、色氨酸、苯丙氨酸、酪氨酸、甲硫氨酸、组氨酸、谷氨酰胺、苏氨酸、异亮氨酸或缬氨酸)取代与末端双链体碱基对相邻的氨基酸,以产生对双链dna和异源双链体而言在能量上更有利的条件。
[0616]
表8.稳定r-环的取代。
[0617][0618]
在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含表8中列出的一个或多个取代。在一些实施例中,变体cas12i2多肽包含表2和表8中列出的一个或多个取代。
[0619]
在一些实施例中,表现出增加的三元复合物形成和/或三元复合物稳定性(例如,通过稳定dna和/或r-环的解链)的变体cas12i2多肽包含两个或更多个取代,例如q163n n164w、q163m n164w、q163m n164q、q163n n164q、i5g p577y、i5g p577f、i5g p577h或i5m p577l。在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含q163n n164w、q163m n164w、q163m n164q、q163n n164q、i5g p577y、i5g p577f、i5g p577h或i5m p577l取代。在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含q163n n164w、q163m n164w、q163m n164q、q163n n164q、i5g p577y、i5g p577f、i5g p577h或i5m p577l取代和来自表4、表5、表6、表7和/或表8的一个或多个取代。在一些实施例中,变体cas12i2多肽包含表4、表5、表6、表7和/或表8中的任何一个或多个取代。在一些实施例中,与亲本多肽相比,具有表4、表5、表6、表7和/或表8中的一个或多个取代的变体cas12i2多肽表现出增加的三元复合物形成和/或三元复合物稳定性(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。
[0620]
在一些实施例中,包含表4、表5、表6、表7和/或表8中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,包含表4、表5、表6、表7和/或表8中列出的一个或多个取代的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,进一步包含q163n n164w、q163m n164w、q163m n164q、q163n n164q、i5g p577y、i5g p577f、i5g p577h或i5m p577l取代和表4、表5、表6、表7和/或表8中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,与亲本多肽相比,变体cas12i2多肽表现出增加的酶活性(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、
16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。
[0621]
增加的构象变化
[0622]
构象变化(例如,在结合rna指导物或靶dna时)影响变体cas12i2多肽的功能,例如构象变化可改变变体cas12i2多肽的动力学。cas12i2的rec1(螺旋ii)结构域在三元复合物形成期间移动并旋转以适应dna结合。参见图22a和图22b。在一些实施例中,增加螺旋ii结构域的移动(例如,柔性或构象变化)的改变增加dna结合/dna结合亲和力。在一些实施例中,增加螺旋ii结构域中的柔性的取代(例如,将大体积氨基酸取代为具有小或较小侧链的氨基酸(丙氨酸、缬氨酸、甘氨酸或丝氨酸残基))增加三元复合物形成。在一些实施例中,增加螺旋ii结构域的移动(例如,柔性或构象变化)的改变增加三元复合物稳定性。在一些实施例中,增加螺旋ii结构域的构象变化的改变是用丙氨酸、缬氨酸、甘氨酸或丝氨酸残基取代一个或多个残基。在一些实施例中,增加螺旋ii结构域的柔性的改变是用丙氨酸、缬氨酸、甘氨酸或丝氨酸残基取代一个或多个残基。在一些实施例中,变体cas12i2多肽包含螺旋ii结构域附近的一个或多个氨基酸的改变。在一些实施例中,变体cas12i2多肽包含将螺旋ii结构域附近的一个或多个氨基酸改变为丙氨酸、缬氨酸、甘氨酸或丝氨酸。在一些实施例中,变体cas12i2多肽包含将一个或多个氨基酸327-330取代为丙氨酸、缬氨酸、甘氨酸或丝氨酸中的任一个。在一些实施例中,变体cas12i2多肽包含表9中所示的取代。
[0623]
表9.改变螺旋ii结构域的柔性的取代。
[0624]
残基取代h300al327v、an328g、sn329g、sl330aa434gp436a、g
[0625]
在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含表9中列出的一个或多个取代。在一些实施例中,变体cas12i2多肽包含表2和表9中列出的一个或多个取代。
[0626]
在一些实施例中,增加螺旋ii结构域柔性的改变是表9中列出的取代。在一些实施例中,与亲本多肽相比,具有表9中列出的取代中的一种或多种的变体cas12i2多肽表现出螺旋ii结构域柔性增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、
46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。在一些实施例中,增加dna结合/dna亲和力的改变是表9中列出的取代。在一些实施例中,与亲本多肽相比,具有表9中列出的取代中的一种或多种的变体cas12i2多肽表现出dna结合/dna亲和力增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。在一些实施例中,与亲本多肽相比,包含表9中列出的取代的变体cas12i2多肽表现出增加的三元复合物形成和/或三元复合物稳定性(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。
[0627]
在一些实施例中,表现出增加的螺旋ii结构域柔性的变体cas12i2多肽包含两个或更多个取代,例如l327v n328s n329g l330a、l327a n328s n329g l330a、l327v n328g n329s l330a或l327v n328g n329g l330a。在一些实施例中,表现出增加的dna结合/亲和力的变体cas12i2多肽包含两个或更多个取代,例如l327v n328s n329g l330a、l327a n328s n329g l330a、l327v n328g n329s l330a或l327v n328g n329g l330a。在一些实施例中,表现出增加的三元复合物形成/稳定性的变体cas12i2多肽包含两个或更多个取代,例如l327v n328s n329g l330a、l327a n328s n329g l330a、l327v n328g n329s l330a或l327v n328g n329g l330a。在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含l327v n328s n329g l330a、l327a n328s n329g l330a、l327v n328g n329s l330a或l327v n328g n329g l330a取代。在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含l327v n328s n329g l330a、l327a n328s n329g l330a、l327v n328g n329s l330a或l327v n328g n329g l330a取代以及表4和/或表5和/或表6和/或表7和/或表8和/或表9中列出的一个或多个取代。在一些实施例中,变体cas12i2多肽包含表4和/或表5和/或表6和/或表7和/或表8和/或表9中的任何一个或多个取代。在一些实施例中,与亲本多肽相比,具有表4和/或表5和/或表6和/或表7和/或
表8和/或表9中的一个或多个取代的变体cas12i2多肽表现出增加的dna结合/亲和力(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。在一些实施例中,与亲本多肽相比,具有表4和/或表5和/或表6和/或表7和/或表8和/或表9中的一个或多个取代的变体cas12i2多肽表现出增加的三元复合物形成和/或三元复合物稳定性(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。
[0628]
在一些实施例中,包含具有表4和/或表5和/或表6和/或表7和/或表8和/或表9中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9中列出的一个或多个取代的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,进一步包含l327v n328s n329g l330a、l327a n328s n329g l330a、l327v n328g n329s l330a或l327v n328g n329g l330a取代和表4和/或表5和/或表6和/或表7和/或表8和/或表9中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,与亲本多肽相比,变体cas12i2多肽表现出增加的酶活性(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。
[0629]
在一些实施例中,当靶单链dna在cas12i2多肽的活性位点中时形成的增加nuc与螺旋ii界面之间的连接的改变增加从二元复合物到三元复合物的转变。在一些实施例中,增加nuc与螺旋ii界面之间的连接的改变增加三元复合物形成。参见图22b。在一些实施例中,增加nuc与螺旋ii界面之间的连接的改变增加三元复合物稳定性。在一些实施例中,增
d387e、v383d d386e、v383e d387e、v383e d386e、q919k d387e、q919k d383d、q919k v383e、d386e d387e、n925d d362r k365r、n925e d362r k365r、n925d d362k k365r、n925e d362k k365r、n925d d362r、n925e d362r、n925d d362k、n925e d362k、n925d k365r、n925e k365r或d362e n925k。在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含v383d d387e、v383d d386e、v383e d387e、v383e d386e、q919k d387e、q919k d383d、q919k v383e、d386e d387e、n925d d362r k365r、n925e d362r k365r、n925d d362k k365r、n925e d362k k365r、n925d d362r、n925e d362r、n925d d362k、n925e d362k、n925d k365r、n925e k365r或d362e n925k取代。在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含v383d d387e、v383d d386e、v383e d387e、v383e d386e、q919k d387e、q919k d383d、q919k v383e、d386e d387e、n925d d362r k365r、n925e d362r k365r、n925d d362k k365r、n925e d362k k365r、n925d d362r、n925e d362r、n925d d362k、n925e d362k、n925d k365r、n925e k365r或d362e n925k取代和表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10中列出的一个或多个取代。在一些实施例中,变体cas12i2多肽包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10中的任何一个或多个取代。在一些实施例中,与亲本多肽相比,具有表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10中的一个或多个取代的变体cas12i2多肽表现出增加的nuc与螺旋ii界面之间的连接(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。在一些实施例中,与亲本多肽相比,具有表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10中的一个或多个取代的变体cas12i2多肽表现出增加的三元复合物形成和/或三元复合物稳定性(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。
[0635]
在一些实施例中,包含具有表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10中列出的一个或多个取代的变体cas12i2多肽表现出增加的酶活性。在
一些实施例中,进一步包含v383d d387e、v383d d386e、v383e d387e、v383e d386e、q919k d387e、q919k d383d、q919k v383e、d386e d387e、n925d d362r k365r、n925e d362r k365r、n925d d362k k365r、n925e d362k k365r、n925d d362r、n925e d362r、n925d d362k、n925e d362k、n925d k365r、n925e k365r或d362e n925k取代和表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的酶活性。在一些实施例中,与亲本多肽相比,变体cas12i2多肽表现出增加的酶活性(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。
[0636]
在一些实施例中,改变减少nuc与螺旋ii界面之间的连接。在一些实施例中,减少nuc与螺旋ii界面之间的连接的改变增加三元复合物形成。在一些实施例中,减少nuc与螺旋ii界面之间的连接的改变是用天冬酰胺或丝氨酸残基取代一个或多个残基。在一些实施例中,变体cas12i2多肽包含将一个或多个氨基酸386、387、915和956取代为天冬酰胺或丝氨酸。在一些实施例中,变体cas12i2多肽包含d386n r915s、d387n r956s、d386n d387n r915s r956s或d386n d387n r915s r922s r956s取代。在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含d386n r915s、d387n r956s、d386n d387n r915s r956s或d386n d387n r915s r922s r956s取代。
[0637]
增加的保真度
[0638]
在一些方面,相对于亲本多肽,变体cas12i2多肽包含增加在靶特异性的改变。在一些方面,相对于亲本多肽,变体cas12i2多肽包含增加在靶结合的改变。在一些实施例中,相对于亲本多肽,变体cas12i2多肽包含增加变体cas12i2多肽与在靶dna之间的相互作用(例如,亲和力)的改变。
[0639]
在一些实施例中,增加在靶特异性的改变是将一个或多个氨基酸取代为丙氨酸、丝氨酸、缬氨酸、谷氨酰胺或天冬酰胺残基。在一些方面,增加在靶特异性的改变是截短接触rna指导物的间隔子序列的残基(例如,用具有较小侧链的残基取代接触间隔子序列的残基)。在一些方面,增加在靶特异性的改变是截短接触rna指导物的间隔子序列的残基,例如将其取代为丙氨酸、丝氨酸或缬氨酸。在一些实施例中,变体cas12i2多肽包含将接触rna指导物的间隔子序列的一个或多个氨基酸取代为丙氨酸、丝氨酸、缬氨酸、谷氨酰胺或天冬酰胺残基。在一些实施例中,变体cas12i2多肽包含将一个或多个氨基酸290-320、340-360、390-450、550-580、710-720、760-810或830-870取代为丙氨酸、丝氨酸、缬氨酸、谷氨酰胺或天冬酰胺残基中的任一个。在一些实施例中,变体cas12i2多肽包含将至少一个结构域/基序(例如,wedge结构域、rec1结构域、rec2结构域或ruvc2基序)中的一个或多个氨基酸改变为丙氨酸、丝氨酸、缬氨酸、谷氨酰胺或天冬酰胺残基。在一些实施例中,螺旋ii结构域中的
截短取代产生表现出增加的在靶结合特异性的变体cas12i2多肽。在一些方面,以下螺旋ii残基中的一个或多个被截短:e348、e349、e395、i397、r398、n399、y351、h356、h357、k394和r428。在一些实施例中,与亲本多肽相比,取代使与变体cas12i2多肽的在靶特异性增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。在一些实施例中,与亲本多肽相比,取代使变体cas12i2多肽的在靶结合增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。在一些实施例中,与亲本多肽相比,取代使变体cas12i2多肽的在靶结合亲和力增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。
[0640]
可以改变变体cas12i2多肽与在靶dna选择性结合的能力的改变的非限制性实例是表11中列出的取代。在一些实施例中,相对于亲本多肽,包含表11中列出的一个或多个取代的变体cas12i2多肽表现出增加的在靶特异性。在一些实施例中,相对于亲本多肽,包含表11中列出的一个或多个取代的变体cas12i2多肽表现出增加的在靶结合。在一些实施例中,相对于亲本多肽,包含表11中列出的一个或多个取代的变体cas12i2多肽表现出增加的在靶结合亲和力。如本文所用,术语“ts种子”是指与rna指导物形成双链体的种子序列,并且术语“指导物种子”是指与ts种子序列配对的rna指导物。
[0641]
表11.增加在靶特异性的取代。
[0642]
[0643][0644]
在一些实施例中,增加在靶特异性的改变(例如,表11中列出的取代)进一步增加在靶三元复合物形成和/或在靶三元复合物稳定性(例如,在靶三元复合物形成/稳定性)。
在一些实施例中,与亲本多肽相比,增加在靶特异性的改变使在靶三元复合物形成和/或在靶三元复合物稳定性增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。
[0645]
在一些方面,相对于亲本多肽,变体cas12i2多肽包含降低脱靶特异性的改变。在一些方面,相对于亲本多肽,变体cas12i2多肽包含降低脱靶结合的改变。在一些实施例中,相对于亲本多肽,变体cas12i2多肽包含降低变体cas12i2多肽与脱靶dna之间的相互作用(例如,亲和力)的改变。
[0646]
在一些实施例中,降低脱靶特异性的改变是将一个或多个氨基酸取代为丙氨酸、丝氨酸、缬氨酸、谷氨酰胺或天冬酰胺残基。在一些方面,降低脱靶特异性的改变是截短接触rna指导物的间隔子序列的残基(例如,用具有较小侧链的残基取代接触间隔子序列的残基)。在一些方面,降低脱靶特异性的改变是截短接触rna指导物的间隔子序列的残基,例如将其取代为丙氨酸、丝氨酸或缬氨酸。在一些实施例中,变体cas12i2多肽包含将接触rna指导物的间隔子序列的一个或多个氨基酸取代为丙氨酸、丝氨酸、缬氨酸、谷氨酰胺或天冬酰胺残基。在一些实施例中,变体cas12i2多肽包含将一个或多个氨基酸290-320、340-360、390-450、550-580、710-720、760-810或830-870取代为丙氨酸、丝氨酸、缬氨酸、谷氨酰胺或天冬酰胺残基中的任一个。在一些实施例中,变体cas12i2多肽包含将至少一个结构域/基序(例如,wedge结构域、rec1结构域、rec2结构域或ruvc2基序)中的一个或多个氨基酸改变为丙氨酸、丝氨酸、缬氨酸、谷氨酰胺或天冬酰胺残基。在一些实施例中,螺旋ii结构域中的截短取代产生表现出降低的脱靶结合特异性的变体cas12i2多肽。在一些方面,以下螺旋ii残基中的一个或多个被截短:e348、e349、e395、i397、r398、n399、y351、h356、h357、k394和r428。在一些实施例中,与亲本多肽相比,取代使变体cas12i2多肽的脱靶特异性降低约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些实施例中,与亲本多肽相比,取代使变体cas12i2多肽的脱靶结合降低约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、
75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些实施例中,与亲本多肽相比,取代使变体cas12i2多肽的脱靶结合亲和力降低约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
[0647]
可以改变变体cas12i2多肽与脱靶dna结合的能力的改变的非限制性实例是表11中列出的取代。在一些实施例中,相对于亲本多肽,包含表11中列出的一个或多个取代的变体cas12i2多肽表现出降低的脱靶特异性。在一些实施例中,相对于亲本多肽,包含表11中列出的一个或多个取代的变体cas12i2多肽表现出降低的脱靶结合。在一些实施例中,相对于亲本多肽,包含表11中列出的一个或多个取代的变体cas12i2多肽表现出降低的脱靶结合亲和力。
[0648]
在一些实施例中,与亲本多肽相比,使变体cas12i2多肽的在靶特异性增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比的取代进一步使变体cas12i2多肽的脱靶特异性降低约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些实施例中,与亲本多肽相比,使变体cas12i2多肽的在靶结合增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、
130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比的取代进一步使变体cas12i2多肽的脱靶结合降低约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些实施例中,与亲本多肽相比,使变体cas12i2多肽的在靶结合亲和力增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比的取代进一步使变体cas12i2多肽的脱靶结合亲和力降低约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
[0649]
在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含表11中列出的一个或多个取代。在一些实施例中,变体cas12i2多肽包含表2和表11中列出的一个或多个取代。
[0650]
在一些实施例中,包含具有表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的在靶酶活性。在一些实施例中,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11中列出的一个或多个取代的变体cas12i2多肽表现出增加的在靶酶活性。在一些实施例中,与亲本多肽相比,变体cas12i2多肽表现出增加的在靶酶活性(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、
140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。
[0651]
在一些实施例中,包含具有表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的在靶酶活性与脱靶酶活性的比率。在一些实施例中,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11中列出的一个或多个取代的变体cas12i2多肽表现出增加的在靶酶活性与脱靶酶活性的比率。在一些实施例中,与亲本多肽相比,变体cas12i2多肽(例如,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽)的在靶酶活性比变体cas12i2多肽的脱靶酶活性高至少4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。在一些实施例中,与亲本多肽相比,变体cas12i2多肽(例如,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11中列出的一个或多个取代的变体cas12i2多肽)的在靶酶活性比变体cas12i2多肽的脱靶酶活性高至少4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。
[0652]
在一些实施例中,变体cas12i2多肽(例如,seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的酶活性不超过在靶基因座处的酶活性的10%(例如,10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%)。在一些实施例中,变体cas12i2多肽(例如,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的酶活性不超过在靶基因座处的酶活性的10%(例如,10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%)。在一些实施例中,变体cas12i2多肽(例如,seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的酶活性不超过在靶基因座处的酶活性的5%(例如,5%、4%、3%、2%、1%或0%)。在一些实施例中,变体cas12i2多肽(例如,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的酶活性不超过在靶基因座处的酶活性的5%(例如,5%、4%、3%、2%、1%
或0%)。通过比较,spcas9在脱靶基因座处的酶活性高达在靶基因座处的酶活性的95%(例如,95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、44%、43%、42%、41%、40%、39%、38%、37%、36%、35%、34%、33%、32%、31%、30%、29%、28%、27%、26%、25%、24%、23%、22%、21%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%)。参见实例16。
[0653]
在一些实施例中,变体cas12i2多肽(例如,seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的编辑效率不超过在靶基因座处的编辑效率的10%(例如,10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%)。在一些实施例中,变体cas12i2多肽(例如,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的编辑效率不超过在靶基因座处的编辑效率的10%(例如,10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%)。在一些实施例中,变体cas12i2多肽(例如,seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的编辑效率不超过在靶基因座处的编辑效率的5%(例如,5%、4%、3%、2%、1%或0%)。在一些实施例中,变体cas12i2多肽(例如,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的编辑效率不超过在靶基因座处的编辑效率的5%(例如,5%、4%、3%、2%、1%或0%)。通过比较,spcas9在脱靶基因座处的编辑效率高达在靶基因座处的编辑效率的95%(例如,95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、44%、43%、42%、41%、40%、39%、38%、37%、36%、35%、34%、33%、32%、31%、30%、29%、28%、27%、26%、25%、24%、23%、22%、21%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%)。参见实例16。
[0654]
在一些实施例中,变体cas12i2多肽(例如,seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的编辑不超过在靶基因座处的编辑的10%(例如,10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%)。在一些实施例中,变体cas12i2多肽(例如,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的编辑不超过在靶基因座处的编辑的10%(例如,10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%)。在一些实施例中,变体cas12i2多肽(例如,seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的编辑不超过在靶基因座处的编辑的5%(例如,5%、4%、3%、2%、1%或0%)。在一些实施例中,变体cas12i2多肽(例如,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处
的编辑不超过在靶基因座处的编辑的5%(例如,5%、4%、3%、2%、1%或0%)。通过比较,spcas9在脱靶基因座处的编辑高达在靶基因座处的编辑的95%(例如,95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、44%、43%、42%、41%、40%、39%、38%、37%、36%、35%、34%、33%、32%、31%、30%、29%、28%、27%、26%、25%、24%、23%、22%、21%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%)。参见实例16。
[0655]
在一些方面,包含相对于亲本多肽增加在靶特异性的改变的变体cas12i2多肽是与亲本多肽相比降低催化速率(kcat)的改变。降低的(例如,较慢的)kcat允许变体cas12i2多肽区分在靶序列和脱靶序列。在一些实施例中,降低催化速率的改变是将一个或多个氨基酸取代为丙氨酸、丝氨酸、苏氨酸、缬氨酸、亮氨酸、甲硫氨酸、天冬酰胺或异亮氨酸。在一些实施例中,变体cas12i2多肽包含将一个或多个氨基酸600-605、835-840或1020-1030取代为丙氨酸、丝氨酸、苏氨酸、缬氨酸、亮氨酸、甲硫氨酸、天冬酰胺或异亮氨酸中的任一个。在一些实施例中,变体cas12i2多肽包含将至少一个ruvc结构域/基序(例如,ruvc1、ruvc2或ruvc)中的一个或多个氨基酸改变为丙氨酸、丝氨酸、苏氨酸、缬氨酸、亮氨酸、甲硫氨酸、天冬酰胺或异亮氨酸。在一些实施例中,与亲本多肽相比,取代使变体cas12i2多肽的kcat降低约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。
[0656]
在一些实施例中,与亲本多肽相比,降低变体cas12i2多肽的kcat的取代进一步使在靶特异性增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。在一些实施例中,与亲本多肽相比,降低变体cas12i2多肽的kcat的取代进一步使变体cas12i2多肽的在靶结合增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、
64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。在一些实施例中,与亲本多肽相比,降低变体cas12i2多肽的kcat的取代进一步使变体cas12i2多肽的在靶结合亲和力增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。
[0657]
在一些实施例中,与亲本多肽相比,降低变体cas12i2多肽的kcat的取代进一步使脱靶特异性降低约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些实施例中,与亲本多肽相比,降低变体cas12i2多肽的kcat的取代进一步使变体cas12i2多肽的脱靶结合降低约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些实施例中,与亲本多肽相比,降低变体cas12i2多肽的kcat的取代进一步使变体cas12i2多肽的脱靶结合亲和力降低约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
[0658]
可以改变变体cas12i2多肽的kcat的改变的非限制性实例是表12中列出的取代。在一些实施例中,相对于亲本多肽,包含表12中列出的一个或多个取代的变体cas12i2多肽
表现出增加的在靶特异性。在一些实施例中,相对于亲本多肽,包含表11中列出的一个或多个取代的变体cas12i2多肽表现出增加的在靶结合。在一些实施例中,相对于亲本多肽,包含表12中列出的一个或多个取代的变体cas12i2多肽表现出增加的在靶结合亲和力。在一些实施例中,相对于亲本多肽,包含表12中列出的一个或多个取代的变体cas12i2多肽表现出降低的脱靶特异性。在一些实施例中,相对于亲本多肽,包含表11中列出的一个或多个取代的变体cas12i2多肽表现出降低的脱靶结合。在一些实施例中,相对于亲本多肽,包含表12中列出的一个或多个取代的变体cas12i2多肽表现出降低的脱靶结合亲和力。
[0659]
表12.增加在靶特异性的取代。
[0660]
q600a、s、t、vq602l、a、s、mt603s、v、n、al836s、t、v、n、as837a、t、v、l、ia1022si1026v、a、n
[0661]
在一些实施例中,与亲本多肽相比,使变体cas12i2多肽的kcat降低约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比的取代进一步使在靶特异性增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比并且使脱靶特异性降低约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
[0662]
在一些实施例中,与亲本多肽相比,使变体cas12i2多肽的kcat降低约4%、5%、
6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比的取代进一步使在靶结合增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比并且使脱靶结合降低约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
[0663]
在一些实施例中,与亲本多肽相比,使变体cas12i2多肽的kcat降低约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比的取代进一步使在靶结合亲和力增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比并且使脱靶结合亲和力降低约4%、5%、6%、7%、
8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
[0664]
在一些实施例中,降低变体cas12i2多肽的kcat的改变(例如,表12中列出的取代)进一步增加在靶三元复合物形成与脱靶三元复合物形成的比率。在一些实施例中,与亲本多肽相比,降低kcat的改变使在靶三元复合物形成与脱靶三元复合物形成的比率增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。
[0665]
在一些实施例中,seq id no:3-146和495-512中的任一个的变体cas12i2多肽进一步包含表12中列出的一个或多个取代。在一些实施例中,变体cas12i2多肽包含表2和表12中列出的一个或多个取代。
[0666]
在一些实施例中,包含具有表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11和/或表12中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的在靶酶活性。在一些实施例中,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11和/或表12中列出的一个或多个取代的变体cas12i2多肽表现出增加的在靶酶活性。在一些实施例中,与亲本多肽相比,变体cas12i2多肽表现出增加的在靶酶活性(例如,增加约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比)。
[0667]
在一些实施例中,包含具有表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11和/或表12中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽表现出增加的在靶酶活性与脱靶酶活性的比率。在一些实施例中,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11和/或表12
中列出的一个或多个取代的变体cas12i2多肽表现出增加的在靶酶活性与脱靶酶活性的比率。在一些实施例中,与亲本多肽相比,变体cas12i2多肽(例如,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11和/或表12中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽)的在靶酶活性比变体cas12i2多肽的脱靶酶活性高至少4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。在一些实施例中,与亲本多肽相比,变体cas12i2多肽(例如,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11和/或表12中列出的一个或多个取代的变体cas12i2多肽)的在靶酶活性比变体cas12i2多肽的脱靶酶活性高至少4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多或它们之间的任何百分比。
[0668]
在一些实施例中,变体cas12i2多肽(例如,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11和/或表12中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的酶活性不超过在靶基因座处的酶活性的10%(例如,10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%)。在一些实施例中,变体cas12i2多肽(例如,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的酶活性不超过在靶基因座处的酶活性的5%(例如,5%、4%、3%、2%、1%或0%)。通过比较,spcas9在脱靶基因座处的酶活性高达在靶基因座处的酶活性的95%(例如,95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、44%、43%、42%、41%、40%、39%、38%、37%、36%、35%、34%、33%、32%、31%、30%、29%、28%、27%、26%、25%、24%、23%、22%、21%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%)。参见实例16。
[0669]
在一些实施例中,变体cas12i2多肽(例如,包含表4和/或表5和/或表6和/或表7
和/或表8和/或表9和/或表10和/或表11和/或表12中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的编辑效率不超过在靶基因座处的编辑效率的10%(例如,10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%)。在一些实施例中,变体cas12i2多肽(例如,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的编辑效率不超过在靶基因座处的编辑效率的5%(例如,5%、4%、3%、2%、1%或0%)。通过比较,spcas9在脱靶基因座处的编辑效率高达在靶基因座处的编辑效率的95%(例如,95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、44%、43%、42%、41%、40%、39%、38%、37%、36%、35%、34%、33%、32%、31%、30%、29%、28%、27%、26%、25%、24%、23%、22%、21%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%)。参见实例16。
[0670]
在一些实施例中,变体cas12i2多肽(例如,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11和/或表12中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的编辑不超过在靶基因座处的编辑的10%(例如,10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%)。在一些实施例中,变体cas12i2多肽(例如,包含表4和/或表5和/或表6和/或表7和/或表8和/或表9和/或表10和/或表11中列出的一个或多个取代的seq id no:3-146和495-512中的任一个的变体cas12i2多肽)在脱靶基因座处的编辑不超过在靶基因座处的编辑的5%(例如,5%、4%、3%、2%、1%或0%)。通过比较,spcas9在脱靶基因座处的编辑高达在靶基因座处的编辑的95%(例如,95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、44%、43%、42%、41%、40%、39%、38%、37%、36%、35%、34%、33%、32%、31%、30%、29%、28%、27%、26%、25%、24%、23%、22%、21%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%)。参见实例16。
[0671]
靶向部分
[0672]
在一些实施例中,如本文所述的组合物或复合物包含结合靶核酸并且与变体cas12i2多肽相互作用的靶向部分(例如,rna指导物、反义、寡核苷酸、肽寡核苷酸缀合物)。靶向部分可结合靶核酸(例如,利用对靶核酸的特异性结合亲和力)。在一些实施例中,本文所述的组合物包含两个或更多个靶向部分,例如两个或更多个rna指导物(例如,2、3、4、5、6、7、8、9个或更多个)。
[0673]
在一些实施例中,靶向部分包含或是rna指导物。在一些实施例中,rna指导物将本文所述的变体cas12i2多肽导向特定核酸序列。阅读特定种类的rna指导物的以下实例的本领域技术人员将理解,在一些实施例中,rna指导物具有位点特异性。即,在一些实施例中,rna指导物与一个或多个靶核酸序列(例如,特异性dna或基因组dna序列)特异性缔合,而不
与非靶核酸序列(例如,非特异性dna或随机序列)特异性缔合。就组合物内的两个或更多个指导物而言,两个或更多个指导物可将如本文所述的两个或更多个单独的变体cas12i2多肽(例如,具有相同或不同序列的变体cas12i2多肽)靶向靶核酸的两个或更多个(例如,2、3、4、5、6、7、8、9个或更多个)靶核酸或者两个或更多个(例如,2、3、4、5、6、7、8、9个或更多个)靶基因座。
[0674]
在一些实施例中,如本文所述的组合物包含与本文所述的变体cas12i2多肽缔合并且将变体cas12i2多肽导向靶核酸序列(例如,dna)的rna指导物。
[0675]
rna指导物可靶向(例如,缔合、导向、接触或结合)靶序列(例如,位点特异性序列或位点特异性靶)的一个或多个核苷酸。在一些实施例中,变体效应子核蛋白(例如,变体cas12i2多肽加rna指导物)在结合到与rna指导物中的dna靶向序列互补的靶核酸(例如,序列特异性底物或靶核酸)时被活化。
[0676]
在一些实施例中,rna指导物包含具有约7个核苷酸至约100个核苷酸的长度的间隔子。例如,dna靶向区段可以具有约7个核苷酸至约80个核苷酸、约7个核苷酸至约50个核苷酸、约7个核苷酸至约40个核苷酸、约7个核苷酸至约30个核苷酸、约7个核苷酸至约25个核苷酸、约7个核苷酸至约20个核苷酸或约7个核苷酸至约19个核苷酸的长度。例如,间隔子可以具有约7个核苷酸至约20个核苷酸、约7个核苷酸至约25个核苷酸、约7个核苷酸至约30个核苷酸、约7个核苷酸至约35个核苷酸、约7个核苷酸至约40个核苷酸、约7个核苷酸至约45个核苷酸、约7个核苷酸至约50个核苷酸、约7个核苷酸至约60个核苷酸、约7个核苷酸至约70个核苷酸、约7个核苷酸至约80个核苷酸、约7个核苷酸至约90个核苷酸、约7个核苷酸至约100个核苷酸、约10个核苷酸至约25个核苷酸、约10个核苷酸至约30个核苷酸、约10个核苷酸至约35个核苷酸、约10个核苷酸至约40个核苷酸、约10个核苷酸至约45个核苷酸、约10个核苷酸至约50个核苷酸、约10个核苷酸至约60个核苷酸、约10个核苷酸至约70个核苷酸、约10个核苷酸至约80个核苷酸、约10个核苷酸至约90个核苷酸或约10个核苷酸至约100个核苷酸的长度。
[0677]
在一些实施例中,rna指导物的间隔子通常可被设计成具有介于7个与50个核苷酸之间或介于7个与30个核苷酸之间(例如,7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸)的长度并且与特定靶核酸序列互补。在一些具体实施例中,rna指导物可被设计成与例如基因组基因座的特定dna链互补。在一些实施例中,dna靶向序列被设计成与例如基因组基因座的特定dna链互补。
[0678]
rna指导物可与参考核酸序列的互补链基本上相同。在一些实施例中,rna指导物包含与参考核酸序列(例如,靶核酸)的互补链具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%序列同一性的序列。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,blast、align、clustal)使用标准参数人工确定两个此类核酸之间的同一性百分比。
[0679]
在一些实施例中,rna指导物与靶核酸的互补链具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至
dttt-3'、5'-attn-3'或5'-gttn-3,其中b是除a之外的任何核苷酸,d是除c之外的任何核苷酸,并且r是a或g。在一些实施例中,pam包含5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'。
[0687]
在一些实施例中,本文所述的组合物或复合物包括一个或多个(例如,两个、三个、四个、五个、六个、七个、八个或更多个)rna指导物,例如多个rna指导物。
[0688]
在一些实施例中,rna指导物具有类似于例如国际公布号wo 2014/093622和wo 2015/070083的结构,将每篇文献的全部内容通过援引并入本文。
[0689]
修饰
[0690]
rna指导物或编码变体cas12i2多肽的任何核酸序列可包括关于参考序列、特别是亲本多核糖核苷酸的一个或多个共价修饰,这些共价修饰包括在本发明的范围内。
[0691]
示例性修饰可以包括对糖、核碱基、核苷间键(例如,对连接磷酸盐/磷酸二酯键/磷酸二酯主链)以及任何组合的任何修饰。下面详细描述了本文提供的一些示例性修饰。
[0692]
rna指导物或编码变体cas12i2多肽的组分的任何核酸序列可包括任何有用的修饰,诸如对糖、核碱基或核苷间键(例如,对连接磷酸盐/磷酸二酯键/磷酸二酯主链)的修饰。嘧啶核碱基的一个或多个原子可被任选取代的氨基、任选取代的硫醇、任选取代的烷基(例如,甲基或乙基)或卤基(例如,氯或氟)替代或取代。在某些实施例中,修饰(例如,一个或多个修饰)存在于糖和核苷间键的每一者中。修饰可以是对核糖核酸(rna)到脱氧核糖核酸(dna)、苏糖核酸(tna)、乙二醇核酸(gna)、肽核酸(pna)、锁核酸(lna)或它们的杂交体的修饰。本文描述了另外的修饰。
[0693]
在一些实施例中,修饰可包括化学或细胞诱导的修饰。例如,细胞内rna修饰的一些非限制性实例由lewis和pan在“rna modifications and structures cooperate to guide rna-protein interactions[rna修饰和结构协作指导rna-蛋白质相互作用]”,nat reviews mol cell biol[自然评论:分子细胞生物学],2017,18:202-210中所描述。
[0694]
不同的糖修饰、核苷酸修饰和/或核苷间键(例如,主链结构)可存在于序列中的不同位置处。本领域普通技术人员将理解,核苷酸类似物或其他修饰可位于序列的任何位置处,使得序列的功能基本上不降低。序列可包括约1%至约100%的经修饰的核苷酸(相对于总核苷酸含量,或相对于一种或多种类型的核苷酸,即a、g、u或c中的任一种或多种)或任何插入百分比(例如,1%至20%、1%至25%、1%至50%、1%至60%、1%至70%、1%至80%、1%至90%、1%至95%、10%至20%、10%至25%、10%至50%、10%至60%、10%至70%、10%至80%、10%至90%、10%至95%、10%至100%、20%至25%、20%至50%、20%至60%、20%至70%、20%至80%、20%至90%、20%至95%、20%至100%、50%至60%、50%至70%、50%至80%、50%至90%、50%至95%、50%至100%、70%至80%、70%至90%、70%至95%、70%至100%、80%至90%、80%至95%、80%至100%、90%至95%、90%至100%和95%至100%)。
[0695]
在一些实施例中,糖修饰(例如,2'位置或4'位置处)或序列的一个或多个核糖核苷酸处的糖替代以及主链修饰可包括磷酸二酯键的修饰或替代。序列的特定实例包括但不限于包括经修饰的主链或非天然核苷间连接(例如核苷间修饰,包括磷酸二酯连接的修饰或替代)的序列。具有经修饰的主链的序列尤其包括在主链中不具有磷原子的那些。出于本技术的目的,并且如本领域中有时提及的,在其核苷间主链中不具有磷原子的经修饰的rna
mccloskey,j.(1999).the rna modification database:1999update[rna修饰数据库:1999年更新].nucl acids res[核酸研究]27:196-197)。在一些实施例中,第一分离的核酸包含信使rna(mrna)。在一些实施例中,mrna包含至少一种选自下组的核苷,该组由以下组成:吡啶-4-酮核糖核苷、5-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基尿苷、3-甲基尿苷、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸基甲基尿苷、1-牛磺酸基甲基-假尿苷、5-牛磺酸基甲基-2-硫代-尿苷、1-牛磺酸基甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫代-1-甲基-1-去氮-假尿苷、二氢尿苷、二氢假尿苷、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷和4-甲氧基-2-硫代-假尿苷。在一些实施例中,mrna包含至少一种选自下组的核苷,该组由以下组成:5-氮杂-胞苷、假异胞苷、3-甲基-胞苷、n4-乙酰基胞苷、5-甲酰基胞苷、n4-甲基胞苷、5-羟基甲基胞苷、1-甲基-假异胞苷、吡咯并-胞苷、吡咯并-假异胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-去氮-假异胞苷、1-甲基-1-去氮-假异胞苷、折布拉林(zebularine)、5-氮杂-折布拉林、5-甲基-折布拉林、5-氮杂-2-硫代-折布拉林、2-硫代-折布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷和4-甲氧基-1-甲基-假异胞苷。在一些实施例中,mrna包含至少一种选自下组的核苷,该组由以下组成:2-氨基嘌呤、2,6-二氨基嘌呤、7-去氮-腺嘌呤、7-去氮-8-氮杂-腺嘌呤、7-去氮-2-氨基嘌呤、7-去氮-8-氮杂-2-氨基嘌呤、7-去氮-2,6-二氨基嘌呤、7-去氮-8-氮杂-2,6-二氨基嘌呤、1-甲基腺苷、n6-甲基腺苷、n6-异戊烯基腺苷、n6-(顺式-羟基异戊烯基)腺苷、2-甲基硫代-n6-(顺式-羟基异戊烯基)腺苷、n6-甘氨酰氨甲酰基腺苷、n6-苏氨酰氨甲酰基腺苷、2-甲基硫代-n6-苏氨酰氨甲酰基腺苷、n6,n6-二甲基腺苷、7-甲基腺嘌呤、2-甲基硫代-腺嘌呤和2-甲氧基-腺嘌呤。在一些实施例中,mrna包含至少一种选自下组的核苷,该组由以下组成:肌苷、1-甲基-肌苷、怀俄苷、怀丁苷、7-去氮-鸟苷、7-去氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-去氮-鸟苷、6-硫代-7-去氮-8-氮杂-鸟苷、7-甲基-鸟苷、6-硫代-7-甲基-鸟苷、7-甲基肌苷、6-甲氧基-鸟苷、1-甲基鸟苷、n2-甲基鸟苷、n2,n2-二甲基鸟苷、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、n2-甲基-6-硫代-鸟苷、和n2,n2-二甲基-6-硫代-鸟苷。
[0703]
序列沿着分子的整个长度可以被或者可以不被均一地修饰。例如,一种或多种或所有类型的核苷酸(例如,天然存在的核苷酸嘌呤或嘧啶,或者a、g、u、c、i、pu中的任一种或多种或所有)可或可不在序列中或其给定的预定序列区域中被均匀修饰。在一些实施例中,序列包括假尿苷。在一些实施例中,序列包括肌苷,该肌苷可以帮助免疫系统将序列相对于病毒rna表征为内源性。肌苷的掺入还可以介导改善的rna稳定性/减少降解。参见例如,yu,z.等人(2015)rna editing by adar1 marks dsrna as“self”[adar1进行的rna编辑将dsrna标记为“自我”].cell res[细胞研究].25,1283-1284,将该文献通过援引以其全文并入。
[0704]
靶核酸
[0705]
本文披露的方法适用于多种靶核酸。在一些实施例中,靶核酸是dna,诸如dna基因座。在一些实施例中,靶核酸在细胞核中。在一些实施例中,靶核酸是基因组dna基因座。在
一些实施例中,靶核酸是单链的(例如,单链dna)。在一些实施例中,靶核酸是双链的(例如,双链dna)。在一些实施例中,靶核酸包含单链区和双链区两者。在一些实施例中,靶核酸是线性的。在一些实施例中,靶核酸是环状的。在一些实施例中,靶核酸包含一个或多个经修饰的核苷酸,诸如甲基化的核苷酸、受损核苷酸或核苷酸类似物。在一些实施例中,靶核酸是未经修饰的。
[0706]
在一些实施例中,本文所述的组合物包括一个或多个(例如,两个、三个、四个、五个、六个、七个、八个或更多个)靶核酸,例如多个靶核酸。在一些实施例中,本文所述的组合物包括靶核酸的一个或多个(例如,两个、三个、四个、五个、六个、七个、八个或更多个)靶基因座,例如多个靶基因座。
[0707]
靶核酸可具有任何长度,诸如10bp、20bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、200bp、500bp、1000bp、2000bp、5000bp、10kb、20kb、50kb、100kb、200kb、500kb、1mb或更长或它们之间的任何长度中的至少任一种。靶核酸也可包含任何序列。在一些实施例中,靶核酸是富含gc的,诸如具有至少约40%、45%、50%、55%、60%、65%或更高gc含量中的任一种。在一些实施例中,靶核酸具有至少约70%、80%或更高的gc含量。在一些实施例中,靶核酸是非富含gc的靶核酸中的富含gc的片段。在一些实施例中,靶核酸不是富含gc的。在一些实施例中,靶核酸具有一个或多个二级结构或更高级结构。在一些实施例中,靶核酸不处于凝聚状态,诸如在染色质中,以使变体cas12i2多肽/rna指导物复合物不能接近靶核酸。
[0708]
在一些实施例中,靶核酸存在于细胞中。在一些实施例中,靶核酸存在于细胞核中。在一些实施例中,靶核酸对细胞是内源的。在一些实施例中,靶核酸是基因组dna。在一些实施例中,靶核酸是染色体dna。在一些实施例中,靶核酸是蛋白质编码基因或其功能区(诸如编码区)或调节元件(诸如启动子、增强子、5'或3'非翻译区等)。在一些实施例中,靶核酸是非编码基因,诸如转座子、mirna、trna、核糖体rna、核酶或lincrna。在一些实施例中,靶核酸是质粒。
[0709]
在一些实施例中,靶核酸对细胞是外源的。在一些实施例中,靶核酸是病毒核酸,诸如病毒dna或病毒rna。在一些实施例中,靶核酸是水平转移的质粒。在一些实施例中,靶核酸整合在细胞的基因组中。在一些实施例中,靶核酸不整合在细胞的基因组中。在一些实施例中,靶核酸是细胞中的质粒。在一些实施例中,靶核酸存在于染色体外阵列中。
[0710]
在一些实施例中,靶核酸是分离的核酸,诸如分离的dna或分离的rna。在一些实施例中,靶核酸存在于无细胞环境中。在一些实施例中,靶核酸是分离的载体,诸如质粒。在一些实施例中,靶核酸是超纯质粒。
[0711]
在一些实施例中,靶样品可包括靶核酸的与靶向部分(例如,rna指导物)的至少一部分杂交的片段。在一些实施例中,靶样品仅具有靶核酸的一个拷贝。在一些实施例中,靶样品具有多于一个拷贝,诸如至少约2、3、4、5、10、100个或更多个拷贝的靶核酸中的任一种。例如,在病毒或细菌的基因组中包含重复序列(例如,靶核酸序列)的靶样品和该重复序列可被靶向部分的至少一部分靶向。
[0712]
在一些实施例中,靶核酸存在于核酸的易接近区域中。在一些实施例中,靶核酸在基因的外显子中。在一些实施例中,靶核酸跨越基因的外显子-内含子连接部。在一些实施例中,靶核酸存在于非编码区(诸如基因的调节区)中。在一些实施例中,其中靶核酸对细胞
是外源的,靶核酸包含在细胞的基因组中未发现的序列。
[0713]
合适的dna/rna结合条件包括通常存在于细胞中的生理条件。其他合适的dna/rna结合条件(例如,无细胞系统中的条件)是本领域已知的;参见例如sambrook,同上。靶核酸的与靶向部分(例如,rna指导物)互补并与之杂交的链被称为“互补链”,并且靶核酸的与“互补链”互补(因此不与rna指导物互补)的链被称为“非互补链”。
[0714]
二元复合物
[0715]
在一些方面,cas12i2多肽和靶向部分形成复合物。在一些实施例中,cas12i2多肽(例如,变体cas12i2多肽)和靶向部分(例如,如本文所述的rna指导物)形成复合物(例如二元复合物,例如核糖核蛋白或rnp)。在一些实施例中,cas12i2多肽和rna指导物形成二元复合物。
[0716]
在一些实施例中,本文所述的二元复合物包含与至少一个rna指导物缔合的变体cas12i2多肽,其中每个rna指导物靶向靶核酸,诸如dna。在一些实施例中,变体cas12i2多肽/rna指导物复合物(例如,变体二元复合物)包含酶活性,诸如可切割或裂解靶核酸的核酸酶活性。变体cas12i2多肽和rna指导物(单独或一起)不会天然存在。与亲本多肽和rna指导物相比,变体cas12i2多肽与rna指导物之间的复合物形成可以增强两者之间的稳定性和/或蛋白质-rna相互作用。
[0717]
通常,变体cas12i2多肽和靶向部分(例如,rna指导物)以约1:1的摩尔比彼此结合以形成变体二元复合物。变体cas12i2多肽和靶向部分(例如,rna指导物)结合以形成变体二元复合物被称为将rna指导物加载到多肽上。
[0718]
在一些实施例中,二元复合物遵循单指导物规则,即变体cas12i2多肽不与复合物中结合的rna指导物解离或用游离的未结合rna交换rna指导物。在一些实施例中,三元复合物遵循单二元复合物规则,即变体二元复合物不从结合的靶核酸(例如,靶dna底物)解离或用游离的未结合核酸交换靶核酸。
[0719]
二元复合物的官能度
[0720]
在一些方面,变体二元复合物包含具有至少一个改变或突变的变体cas12i2多肽,该改变或突变增强酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种。
[0721]
在一些方面,变体二元复合物包含具有至少一个改变或突变的变体cas12i2多肽,并且变体二元复合物具有降低的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离、与靶核酸的解离中的至少一种。
[0722]
在一些方面,变体cas12i2多肽和靶向部分(例如,rna指导物)形成变体二元复合物,并且与亲本二元复合物相比,变体二元复合物表现出增加的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种。
[0723]
在一些实施例中,变体二元复合物包含具有至少一个改变或突变的变体cas12i2多肽,该改变或突变使变体二元复合物的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种比亲本二元复合物的酶活性、靶核酸复合物形
成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性增加至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。
[0724]
在一些实施例中,与亲本二元复合物相比,变体二元复合物在约20℃至约65℃范围内的温度下(例如,约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中的任一个)表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种。
[0725]
在一些实施例中,与亲本二元复合物相比,变体二元复合物在具有约7.3至约8.6范围内(例如,7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5、8.6或这些值的任何组合之间的范围内的任何值)的ph的缓冲液中表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种。
[0726]
在一些实施例中,当变体二元复合物的tm值比亲本二元复合物的tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃时,与亲本二元复合物相比,变体二元复合物表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种。在一个实施例中,当变体二元复合物的tm值比亲本二元复合物的tm值大至少8℃时,变体二元复合物表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种。
[0727]
在一些实施例中,与亲本二元复合物相比,变体二元复合物在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内表现出增加的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种。在一些实施例中,与亲本二元复合物相比,变体二元复合物在一定孵育时间范围内表现出增加的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种。
[0728]
在一些实施例中,变体二元复合物包含具有至少一个改变或突变的变体cas12i2多肽,该改变或突变增加变体二元复合物的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种,并且变体二元复合物包含变体cas12i2多肽,该多肽包含与seq id no:4具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0729]
在一些实施例中,变体二元复合物包含增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种,并且变体二元复合物包含变体cas12i2多肽,该多肽包含与seq id no:3-5、495或496中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0730]
在一些实施例中,变体二元复合物包含增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种,并且变体二元复合物包含变体cas12i2多肽,该多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0731]
在一些方面,变体cas12i2多肽和靶向部分(例如,rna指导物)形成变体二元复合物,并且与亲本二元复合物相比,变体二元复合物表现出降低的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种。在一些实施例中,与亲本二元复合物的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离相比,变体二元复合物表现出的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种低至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。
[0732]
在一些实施例中,与亲本二元复合物的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离相比,变体二元复合物表现出的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种低至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。
[0733]
在一些实施例中,与亲本二元复合物相比,变体二元复合物在约20℃至约65℃范围内的温度下(例如,约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中的任一个)表现出降低的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种。
[0734]
在一些实施例中,与亲本二元复合物相比,变体二元复合物在具有约7.3至约8.6范围内(例如,7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5、8.6或这些值的任何组合之间的范围内的任何值)的ph的缓冲液中表现出降低的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种。
[0735]
在一些实施例中,当变体二元复合物的tm值比亲本二元复合物的tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、
19℃或20℃时,与亲本二元复合物相比,变体二元复合物表现出降低的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种。在一个实施例中,当变体二元复合物的tm值比亲本二元复合物的tm值大至少8℃时,变体二元复合物表现出降低的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种。
[0736]
在一些实施例中,变体二元复合物包含降低的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种,并且变体二元复合物包含变体cas12i2多肽,该多肽包含与seq id no:4具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0737]
在一些实施例中,变体二元复合物包含降低的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种,并且变体二元复合物包含变体cas12i2多肽,该多肽包含与seq id no:3-5、495或496具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0738]
在一些实施例中,变体二元复合物包含降低的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种,并且变体二元复合物包含变体cas12i2多肽,该多肽包含与seq id no:3-146和495-512具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0739]
在一些实施例中,与由亲本多肽和rna指导物形成的复合物相比,变体二元复合物在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内表现出降低的复合物(变体二元复合物或变体三元复合物)解离和/或与靶基因座的解离中的至少一种。在一些实施例中,与由亲本多肽和rna指导物形成的复合物相比,变体二元复合物在一定孵育时间范围内表现出降低的复合物(变体二元复合物或变体三元复合物)解离和/或与靶基因座的解离中的至少一种。
[0740]
在一些实施例中,与亲本二元复合物相比,变体二元复合物在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内表现出降低的复合物(变体二元复合物或变体三元复合物)解离和/或与靶基因座的解离中的至少一种。在一些实施例中,与亲本二元复合物相比,变体二元复合物在一定孵育时间范围内表现出降低的复合物(变体二元复合物或变体三元复合物)解离和/或与靶基因座的解离中的至少一种。
[0741]
三元复合物
[0742]
在一些方面,cas12i2多肽、靶向部分和靶核酸形成复合物。在一些实施例中,cas12i2多肽(例如,变体cas12i2多肽)、靶向部分(例如,如本文所述的rna指导物)和靶核酸(例如,dna)形成复合物(例如三元复合物,例如与dna结合的核糖核蛋白)。在一些实施例中,cas12i2多肽、rna指导物和靶dna形成三元复合物。
[0743]
在一些实施例中,本文所述的三元复合物包含与至少一个rna指导物缔合(即,形
成变体二元复合物)的变体cas12i2多肽,其中每个rna指导物靶向靶核酸(诸如dna)并与其缔合(即,形成变体三元复合物)。在一些实施例中,变体cas12i2多肽/rna指导物复合物(例如,变体二元复合物)包含酶活性,诸如可切割或裂解变体三元复合物的靶核酸的核酸酶活性。在一些实施例中,变体三元复合物包含酶活性,诸如核酸酶活性。变体cas12i2多肽、rna指导物和靶核酸(单独或一起)不会天然存在。
[0744]
通常,变体二元复合物(例如,变体cas12i2多肽和靶向部分)以约1:1的摩尔比与靶核酸结合以形成变体三元复合物。变体二元复合物与靶核酸(例如,靶dna底物)结合以形成变体三元复合物被称为将变体二元复合物加载到靶核酸上。
[0745]
通常,变体cas12i2多肽、靶向部分(例如,rna指导物)和靶核酸以约1:1:1的摩尔比彼此缔合以形成变体三元复合物。
[0746]
在一些实施例中,靶核酸包括变体二元复合物或多个变体二元复合物的一个或多个靶基因座。在一些实施例中,靶核酸包括变体二元复合物或多个变体二元复合物的一个或多个非靶基因座。
[0747]
三元复合物的官能度
[0748]
在一些方面,变体三元复合物包含具有至少一个改变或突变的变体cas12i2多肽,并且变体三元复合物具有增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种。
[0749]
在一些方面,变体三元复合物包含具有至少一个改变或突变的变体cas12i2多肽,并且变体三元复合物具有降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。
[0750]
在一些方面,变体二元复合物和靶核酸(例如,dna)形成变体三元复合物,并且与亲本二元复合物相比,变体三元复合物表现出增加的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种。
[0751]
在一些实施例中,变体三元复合物表现出比亲本二元复合物的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性大至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的变体三元复合物的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种。
[0752]
在一些实施例中,与亲本三元复合物相比,变体三元复合物在约20℃至约65℃范围内的温度下(例如,约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中的任一个)表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少
一种。
[0753]
在一些实施例中,与亲本三元复合物相比,变体三元复合物在具有约7.3至约8.6范围内(例如,7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5、8.6或这些值的任何组合之间的范围内的任何值)的ph的缓冲液中表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种。
[0754]
在一些实施例中,当变体三元复合物的tm值比亲本三元复合物的tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃时,与亲本三元复合物相比,变体三元复合物表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种。在一个实施例中,当变体三元复合物的tm值比亲本三元复合物的tm值大至少8℃时,变体三元复合物表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种。
[0755]
在一些实施例中,与亲本三元复合物相比,变体三元复合物在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内表现出增加的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种。在一些实施例中,与亲本三元复合物相比,变体三元复合物在一定孵育时间范围内表现出增加的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种。
[0756]
在一些实施例中,变体三元复合物表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种,并且变体三元复合物包含变体cas12i2多肽,该多肽包含与seq id no:4具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0757]
在一些实施例中,变体三元复合物表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种,并且变体三元复合物包含变体cas12i2多肽,该多肽包含与seq id no:3-5、495或496中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0758]
在一些实施例中,变体三元复合物表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、在靶结合活性、在靶结合特异性和/或稳定性中的至少一种,并且变体三元复合物包含变体cas12i2多肽,该多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或
100%同一性的氨基酸序列。
[0759]
在一些方面,变体二元复合物和靶核酸(例如,dna)形成变体三元复合物,并且与亲本二元复合物相比,变体三元复合物表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。
[0760]
在一些实施例中,与亲本二元复合物的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离相比,变体三元复合物表现出的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种低至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。
[0761]
在一些实施例中,与亲本三元复合物相比,变体三元复合物在约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中的任一个的温度下表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。
[0762]
在一些实施例中,与亲本三元复合物相比,变体三元复合物在约20℃至约65℃的温度范围内表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。在一些实施例中,与亲本三元复合物相比,变体三元复合物在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。在一些实施例中,与亲本三元复合物相比,变体三元复合物在一定孵育时间范围内表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。
[0763]
在一些实施例中,与亲本三元复合物相比,变体三元复合物在具有约7.3至约8.6范围内的ph的缓冲液中表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。在一个实施例中,与亲本三元复合物相比,变体三元复合物在约7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5或8.6的ph下表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。
[0764]
在一些实施例中,当变体三元复合物的tm值比参考分子的tm值或参考值的tm(例如,亲本三元复合物的tm)大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃时,变体三元复合物表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。在一个实施例中,当变体三元复合物的tm值比参考分子的tm值或参考值的tm(例如,亲本三元复合物的tm)大至少8℃时,变体三元复合物表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。
[0765]
在一些实施例中,变体三元复合物表现出降低的与靶基因座的解离、与非靶核酸
的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种,并且变体三元复合物包含变体cas12i2多肽,该多肽包含与seq id no:4具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0766]
在一些实施例中,变体三元复合物表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种,并且变体三元复合物包含变体cas12i2多肽,该多肽包含与seq id no:3-5、495或496中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0767]
在一些实施例中,变体三元复合物表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种,并且变体三元复合物包含变体cas12i2多肽,该多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0768]
在一些实施例中,与亲本三元复合物相比,变体三元复合物在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内表现出增加的稳定性。在一些实施例中,与亲本三元复合物相比,变体三元复合物在一定孵育时间范围内表现出增加的稳定性。
[0769]
在一些方面,与亲本二元复合物相比,变体二元复合物表现出降低的靶核酸的非靶基因座处的活性。在一些实施例中,在距在靶基因座序列特定莱文斯坦距离(例如,1、2、3或4的编辑距离)的pam相邻序列处评估非靶活性。在一些实施例中,变体二元复合物在非靶基因座处的活性可比亲本二元复合物在非靶基因座处的活性低至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。
[0770]
多个复合体
[0771]
在一些实施例中,两个或更多个(例如,2、3、4、5、6、7、8、9个或更多个)不同的变体cas12i2多肽和两个或更多个(例如,2、3、4、5、6、7、8、9个或更多个)不同的靶向部分形成单独的变体二元复合物,并且其中不同的变体二元复合物在一定孵育时间范围内表现出增加的对靶核酸的结合亲和力、增加的对靶核酸的靶基因座的靶结合亲和力、增加的三元复合物形成和/或增加的稳定性中的至少一种或多种特性。在此类实施例中,复合物形成可在单一组合物中同时完成或在单独的组合物中独立完成。
[0772]
在一些方面,多个cas12i2多肽(例如,多个变体cas12i2多肽)和两个或更多个不同的靶向部分(例如,两个或更多个不同的rna指导物)单独地形成二元复合物。例如,seq id no:aa的第一cas12i2多肽与seq id no:bb的rna指导物(例如,以约1:1的摩尔比)形成第一二元复合物,并且seq id no:aa的第二cas12i2多肽与seq id no:dd的rna指导物(例如,以约1:1的摩尔比)形成第二二元复合物。在一些实施例中,两种二元复合物与靶核酸的不同靶基因座特异性结合。例如,第一二元复合物(例如,seq id no:aa的cas12i2多肽/seq id no:bb的rna指导物)可与靶核酸的靶基因座cc(例如,以1:1的摩尔比)特异性结合以形
成第一三元复合物,并且第二二元复合物(例如,seq id no:aa的cas12i2多肽/seq id no:yy的rna指导物)可与靶核酸的靶基因座zz(例如,以1:1的摩尔比)特异性结合以形成第二三元复合物。如本文所用,术语“二元复合物”是指一个或多个不同的二元复合物,例如各自具有靶向不同靶基因座(例如,靶核酸的两个或更多个靶基因座)的不同靶向部分(例如,不同rna指导物)的二元复合物。如本文所用,术语“三元复合物”是指一个或多个不同的三元复合物,例如包含与不同靶基因座结合的不同靶向部分(例如,不同rna指导物)的三元复合物。
[0773]
在一些方面,多个变体cas12i2多肽和两个或更多个靶向部分(例如,两个或更多个rna指导物)形成多个变体二元复合物,并且与多个亲本二元复合物相比,多个变体二元复合物表现出增加的与靶核酸的两个或更多个靶基因座的在靶结合。在一些实施例中,多个变体二元复合物的在靶结合可比多个亲本二元复合物与两个或更多个靶基因座的在靶结合大至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。
[0774]
在一些方面,多个变体cas12i2多肽和两个或更多个靶向部分(例如,两个或更多个rna指导物)形成多个变体二元复合物,并且与多个亲本二元复合物相比,多个变体二元复合物表现出增加的靶核酸的两个或更多个靶基因座处的在靶活性。在一些实施例中,多个变体二元复合物的在靶活性可比多个亲本二元复合物的在靶活性大至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。
[0775]
在一些实施例中,多个变体二元复合物在约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中的任一个的温度下与靶核酸的两个或更多个靶基因座形成多个变体三元复合物。在一些实施例中,多个变体二元复合物在约20℃至约65℃的温度范围内形成多个变体三元复合物。
[0776]
在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物在约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中的任一个的温度下表现出增加的靶核酸的两个或更多个靶基因座的在靶结合、增加的与靶核酸的两个或更多个靶基因座的在靶三元复合物形成和/或增加的稳定性。在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物在约20℃至约65℃的温度范围内表现出增加的靶核酸的两个或更多个靶基因座的在靶结合、增加的与靶核酸的两个或更多个靶基因座的在靶三元复合物形成和/或增加的稳定性。
[0777]
在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物在约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55
℃、56℃、57℃、58℃、59℃、60℃或65℃中的任一个的温度下表现出降低的与靶核酸的两个或更多个靶基因座的解离。在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物在约20℃至约65℃的温度范围内表现出降低的与靶核酸的两个或更多个靶基因座的解离。
[0778]
在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内表现出降低的与靶核酸的两个或更多个靶基因座的解离。在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物在一定孵育时间范围内表现出降低的与靶核酸的两个或更多个靶基因座的解离。
[0779]
在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物在具有约7.3至约8.6范围内的ph的缓冲液中表现出降低的与靶核酸的两个或更多个靶基因座的解离。在一个实施例中,与多个亲本二元复合物相比,多个变体二元复合物在约7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5或8.6的ph下表现出降低的与靶核酸的两个或更多个靶基因座的解离。
[0780]
在一些实施例中,当多个变体二元复合物的tm值比参考复合物的相应tm值或参考tm值(例如,多个亲本二元复合物的tm值)大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃时,多个变体二元复合物表现出降低的与靶核酸的两个或更多个靶基因座的解离。在一个实施例中,当多个变体二元复合物的tm值比参考复合物的相应tm值或参考tm值(例如,多个亲本二元复合物的tm值)大至少8℃时,多个变体二元复合物表现出降低的与靶核酸的两个或更多个靶基因座的解离。
[0781]
在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物在具有约7.3至约8.6范围内的ph的缓冲液中表现出增加的靶核酸的两个或更多个靶基因座的在靶结合、增加的与靶核酸的两个或更多个靶基因座的在靶三元复合物形成和/或增加的稳定性。在一个实施例中,与多个亲本二元复合物相比,多个二元复合物在约7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5或8.6的ph下表现出增加的靶核酸的两个或更多个靶基因座的在靶结合、增加的与靶核酸的两个或更多个靶基因座的在靶三元复合物形成和/或增加的稳定性。
[0782]
在一些实施例中,多个变体二元复合物在具有约7.3至8.6范围内的ph的缓冲液中是稳定的。在一个实施例中,多个变体二元复合物在约7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5或8.6的ph下是稳定的。
[0783]
在一些实施例中,如果多个变体二元复合物的tm值比参考复合物的相应tm值或参考tm值(例如,多个亲本二元复合物的tm值)大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃,则多个变体二元复合物可以是稳定的。在一些实施例中,如果多个变体二元复合物的tm值比参考复合物的相应tm值或参考tm值(例如,多个亲本二元复合物的tm值)大至少8℃,则多个变体二元复合物是稳定的。
[0784]
在一些实施例中,如果多个变体二元复合物的tm值比参考复合物的相应tm值或参考tm值(例如,多个亲本二元复合物的tm值)大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9
℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃,则多个变体二元复合物表现出增加的稳定性。在一个实施例中,当多个变体二元复合物的tm值比参考复合物的相应tm值或参考tm值(例如,多个亲本二元复合物的tm值)大至少8℃时,多个变体二元复合物表现出增加的稳定性。
[0785]
在一些实施例中,多个变体二元复合物(例如,由多个变体cas12i2多肽和多个不同的靶向部分形成的二元复合物)与靶核酸的多个靶基因座特异性结合。在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物表现出增加的与两个或更多个(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、162、164、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、193、194、195、196、197、198、199、200个或更多个)靶基因座的在靶结合。
[0786]
在一些实施例中,多个变体二元复合物(例如,由多个变体cas12i2多肽和多个rna指导物形成的二元复合物)与靶核酸的多个靶基因座特异性结合。在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物表现出增加的与两个或更多个(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、162、164、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、193、194、195、196、197、198、199、200个或更多个)靶基因座的在靶结合。
[0787]
在一些实施例中,多个变体二元复合物(例如,由多个变体cas12i2多肽和多个不同靶向部分形成的二元复合物)表现出与靶核酸的多个靶基因座的三元复合物形成。在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物表现出增加的与两个或更多个(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、
140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、162、164、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、193、194、195、196、197、198、199、200个或更多个)靶基因座的三元复合物形成。
[0788]
在一些实施例中,多个变体二元复合物(例如,由多个变体cas12i2多肽和多个rna指导物形成的二元复合物)表现出与靶核酸的多个靶基因座的三元复合物形成。在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物表现出增加的与两个或更多个(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、162、164、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、193、194、195、196、197、198、199、200个或更多个)靶基因座的三元复合物形成。
[0789]
在一些实施例中,与多个亲本三元复合物相比,多个变体三元复合物在约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中的任一个的温度下表现出增加的稳定性。在一些实施例中,与多个亲本三元复合物相比,多个变体三元复合物表现出在靶基因座处增加的三元复合物形成和/或在约20℃至约65℃的温度范围内增加的稳定性。
[0790]
在一些实施例中,与多个亲本三元复合物相比,多个变体三元复合物在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内表现出增加的稳定性。在一些实施例中,与多个亲本三元复合物相比,多个变体三元复合物在一定孵育时间范围内表现出增加的稳定性。
[0791]
在一些实施例中,多个变体三元复合物在具有约7.3至8.6范围内的ph的缓冲液中表现出增加的稳定性。在一个实施例中,多个变体三元复合物在约7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5或8.6的ph下表现出增加的稳定性。在一些实施例中,与多个亲本三元复合物相比,多个变体三元复合物在具有约7.3至8.6范围内的ph的缓冲液中表现出增加的稳定性。在一个实施例中,与多个亲本三元复合物相比,多个变体三元复合物在约7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5或8.6的ph下表现出增加的稳定性。
[0792]
在一些实施例中,如果多个变体三元复合物的tm值比参考复合物的tm值或tm参考值(例如,多个亲本三元复合物的tm值)大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃,则多个变体三元复合物表现出增加的稳定性。例如,在某些实施例中,如果多个变体三元复合物的tm值比参考复合物
的tm值或tm参考值(例如,多个亲本三元复合物的tm值)大至少8℃,则多个变体三元复合物表现出增加的稳定性。
[0793]
在一些实施例中,多个变体三元复合物在一定温度、孵育时间、ph值和tm值范围内表现出降低的两个或更多个靶基因座的解离。
[0794]
在一些实施例中,与多个亲本三元复合物相比,多个变体三元复合物在约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中的任一个的温度下表现出降低的它们的两个或更多个靶基因座的解离。在一些实施例中,与多个亲本三元复合物相比,多个变体三元复合物在约20℃至约65℃的温度范围内表现出降低的它们的两个或更多个靶基因座的解离。
[0795]
在一些实施例中,与多个亲本三元复合物相比,多个变体三元复合物在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内表现出降低的它们的两个或更多个靶基因座的解离。在一些实施例中,与多个亲本三元复合物相比,多个变体三元复合物在一定孵育时间范围内表现出降低的它们的两个或更多个靶基因座的解离。
[0796]
在一些实施例中,与多个亲本三元复合物相比,多个变体三元复合物在具有约7.3至约8.6范围内的ph的缓冲液中表现出降低的它们的两个或更多个靶基因座的解离。在一个实施例中,与多个亲本三元复合物相比,多个变体三元复合物在约7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5或8.6的ph下表现出降低的它们的两个或更多个靶基因座的解离。
[0797]
在一些实施例中,当多个变体三元复合物的tm值比参考复合物的tm值或tm参考值(例如,多个亲本三元复合物的tm值)大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃时,多个变体三元复合物表现出降低的它们的两个或更多个靶基因座的解离。在一些实施例中,当多个变体三元复合物的tm值比参考复合物的tm值或tm参考值(例如,多个亲本三元复合物的tm值)大至少8℃时,多个变体三元复合物表现出降低的它们的两个或更多个靶基因座的解离。
[0798]
在一些方面,多个变体cas12i2多肽和两个或更多个靶向部分(例如,两个或更多个rna指导物)形成多个变体二元复合物,并且与多个亲本二元复合物相比,多个变体二元复合物表现出降低的与靶核酸的两个或更多个非靶基因座的脱靶结合。在一些实施例中,多个变体二元复合物的脱靶结合可比亲本二元复合物与两个或更多个非靶基因座的脱靶结合低至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。
[0799]
在一些方面,多个变体cas12i2多肽和两个或更多个靶向部分(例如,两个或更多个rna指导物)形成多个变体二元复合物,并且与亲本二元复合物相比,多个变体二元复合物表现出降低的靶核酸的两个或更多个非靶基因座处的脱靶活性。在一些实施例中,多个变体二元复合物的脱靶活性可比多个亲本二元复合物的脱靶活性低至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、
95%或100%。
[0800]
除非另有说明,否则本文提供的所有组合物和复合物和多肽都是参考该组合物或复合物或多肽的活性水平而制成的,并且不包括杂质,例如可能存在于市售来源中的残留溶剂或副产物。酶组分重量基于总活性蛋白质。除非另外指明,否则所有百分比和比率均按重量进行计算。除非另外指明,否则所有百分比和比率均基于总组合物计算。在示例性组合物中,酶水平以总组合物的重量计按纯酶表示,除非另有说明,否则成分以总组合物的重量表示。
[0801]
活性
[0802]
本文的发明描述了具有较高的在靶特异性和降低的脱靶效应(诸如切割或裂解脱靶基因座或多个脱靶基因座)的变体cas12i2多肽和变体二元复合物。脱靶效应(即使出现频率低)可能导致遗传不稳定性和基因功能破坏。
[0803]
在一些实施例中,本文所述的组合物包含复合物,例如包含在非靶基因座或多个非靶基因座处具有降低的脱靶相互作用和/或降低的活性(例如,降低的与非靶核酸的相互作用和/或活性)的变体cas12i2多肽(例如,变体二元复合物)的二元复合物。实际上,在实例中,显示本发明涉及形成具有增加的在靶活性和降低的脱靶活性的变体二元复合物的变体cas12i2多肽。
[0804]
在一些实施例中,在靶基因座和非靶基因座在同一核酸(例如,同一染色体)上。在一些实施例中,在靶基因座和非靶基因座在不同的核酸(例如,不同的染色体)上。
[0805]
在一些实施例中,通过首先鉴定距在靶基因座序列的特定莱文斯坦距离(也称为编辑距离)的非靶基因座序列并且测量在靶基因座和非靶基因座处的插入缺失来测量在靶活性和脱靶活性,如实例6中所示。编辑距离是指将第一序列(例如,脱靶序列)改变为第二序列(例如,在靶序列)所需的编辑(例如,插入、缺失或取代)的最小次数。例如,需要两次编辑(例如,两次插入、两次缺失、两次取代、一次插入和一次缺失、一次插入和一次取代或一次缺失和一次取代)来将编辑距离为2的脱靶序列的序列改变为在靶序列。五个示例性序列在图13中示出:在靶序列、编辑距离为1的脱靶序列、编辑距离为2的脱靶序列、编辑距离为3的脱靶序列和编辑距离为4的脱靶序列。
[0806]
在一些实施例中,变体二元复合物由变体cas12i2多肽和靶向靶基因座的靶向部分(例如,rna指导物)形成,并且在靶基因座和非靶基因座处测量变体二元复合物的活性(例如,核酸酶活性)以确定在靶活性和脱靶活性。在一些实施例中,选择编辑距离为1、2、3、4、5、6、7、8、9、10或更大的序列来测量脱靶活性,如实例14中所述。在一些实施例中,变体二元复合物表现出降低的在非靶基因座处的活性或缺乏编辑。
[0807]
因此,在本发明的上下文中,变体二元复合物与亲本二元复合物之间降低的脱靶活性(例如,脱靶核酸酶活性)和/或增加的在靶活性(例如,在靶核酸酶活性)的程度可相差约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、99%、100%或更多。
[0808]
在一些实施例中,变体二元复合物的脱靶活性降低至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
[0809]
在一些实施例中,与亲本二元复合物的在靶活性相比,变体二元复合物的在靶活性增加至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多。
[0810]
在一些实施例中,与参考相比,变体二元复合物在靶基因座处的活性(在靶活性)增加与以下情况相关:与参考相比,变体二元复合物在非靶基因座处的活性(例如,脱靶活性)降低。在一些实施例中,变体二元复合物在靶基因座处的活性(在靶活性)与变体二元复合物在非靶基因座处的活性(例如,脱靶活性)负相关。在一些实施例中,与参考(例如,亲本二元复合物的在靶活性)相比,变体二元复合物在靶基因座处的活性增加至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多与以下情况相关:与参考(例如,亲本二元复合物的脱靶活性)相比,变体二元复合物在非靶基因座处的活性降低至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多。在一些实施例中,与
参考相比,变体二元复合物在靶基因座处的活性(在靶活性)增加导致与参考相比,变体二元复合物在非靶基因座处的活性(例如,脱靶活性)降低。
[0811]
在一些实施例中,与参考相比,多个变体二元复合物在两个或更多个靶基因座处的活性(在靶活性)增加与以下情况相关:与参考相比,多个变体二元复合物在两个或更多个非靶基因座处的活性(例如,脱靶活性)降低。在一些实施例中,多个变体二元复合物在两个或更多个靶基因座处的活性(例如,在靶活性)与多个变体二元复合物在两个或更多个非靶基因座处的活性(例如,脱靶活性)负相关。在一些实施例中,与参考(例如,亲本二元复合物的在靶活性)相比,多个变体二元复合物在两个或更多个靶基因座处的活性(在靶活性)增加至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多与以下情况相关:与参考(例如,亲本二元复合物的脱靶活性)相比,多个变体二元复合物在两个或更多个非靶基因座处的活性(例如,脱靶活性)降低至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多。在一些实施例中,与参考相比,多个变体二元复合物在两个或更多个靶基因座处的活性(在靶活性)增加导致与参考相比,多个变体二元复合物在两个或更多个非靶基因座处的活性(例如,脱靶活性)降低。
[0812]
结合活性
[0813]
如本文所用,术语“结合亲和力”通常是指第一试剂(例如,变体cas12i2多肽和/或二元复合物)与第二试剂(例如,靶核酸的靶向部分和/或在靶基因座)相互作用的总体结合特性。在一些实施例中,可在特定条件下评估或测量结合亲和力,并且总结合性质可取决于第一试剂和/或第二试剂的一种或多种固有特性,包括但不限于第一试剂和/或第二试剂的表面组成(例如但不限于在存在第二试剂的情况下第一试剂的浓度)、分子间键亲和力(例如,离子键形成)、亲合力以及用于结合相互作用的周围/环境条件(例如但不限于在第一试剂与第二试剂之间的结合相互作用期间,第一试剂和/或第二试剂的浓度和/或第三试剂(例如,靶核酸、非靶核酸和/或干扰剂)的存在)。
[0814]
测定试剂的结合亲和力的不同方法是本领域已知的。在一些实施例中,变体cas12i2多肽与靶向部分的结合亲和力可以通过变体cas12i2多肽与靶向部分结合的解离常数(kd)来指示。在一些实施例中,二元复合物与靶核酸的结合亲和力可以通过二元复合
物与靶核酸结合的解离常数(kd)来指示。解离常数(kd)是通常测量二元或三元复合物可逆地分离(解离)成单独试剂的倾向的平衡常数。在这些实施例中,较高的解离常数指示较低的结合亲和力。替代性地,第一试剂(例如,变体cas12i2多肽或二元复合物)与第二试剂(例如,靶向部分或靶核酸)的结合亲和力可以通过第一试剂与第二试剂结合的缔合常数(ka)来指示。
[0815]
在一些实施例中,结合亲和力通过变体cas12i2多肽或二元复合物与非靶向部分或非靶向核酸的(非特异性)结合的解离常数(kd)来指示。在一些实施例中,变体cas12i2多肽与非靶核酸的结合亲和力可以通过变体cas12i2多肽与非靶向部分结合的解离常数(kd)来指示。在一些实施例中,二元复合物与非靶核酸的结合亲和力可以通过二元复合物与非靶核酸结合的解离常数(kd)来指示。解离常数(kd)是通常测量二元或三元复合物可逆地分离(解离)成单独试剂的倾向的平衡常数。在这些实施例中,较高的解离常数指示较低的结合亲和力。替代性地,第一试剂(例如,变体cas12i2多肽或二元复合物)与第二试剂(例如,非靶向部分非或靶核酸)的结合亲和力可以通过第一试剂与第二试剂结合的缔合常数(ka)来指示。
[0816]
在一些实施例中,可以进行本领域已知的检测方法以测量结合亲和力,例如使用“夹心”方法诸如elisa或任何其他检测方法。
[0817]
在一些实施例中,本发明的kd值可低于被认为是第一试剂与第二试剂的非特异性结合的特征的kd值。如本领域技术人员将认识到的,与包含亲本多肽的二元或三元复合物相比,包含变体cas12i2多肽的二元或三元复合物的kd值可在一定范围内。包含亲本多肽的二元或三元复合物的上述kd可以是包含变体cas12i2多肽的二元或三元复合物的kd值的上限。在本发明内,各个变体cas12i2多肽在各自的二元或三元复合物中的kd值可表现出不同的kd值。
[0818]
在本发明的上下文中,变体二元复合物与亲本二元复合物之间降低的对非靶基因座的结合亲和力和/或增加的在靶结合亲和力的程度可相差约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或更多。
[0819]
在一些实施例中,与亲本二元复合物对非靶基因座的结合亲和力(例如,脱靶结合亲和力)相比,变体二元复合物对非靶基因座的结合亲和力降低至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、99%或100%。
[0820]
在一些实施例中,与多个亲本二元复合物对两个或更多个非靶基因座的结合亲和力(例如,脱靶结合亲和力)相比,多个变体二元复合物对两个或更多个非靶基因座的结合亲和力降低至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
[0821]
在一些实施例中,与亲本二元复合物对靶基因座的结合亲和力(例如,在靶结合亲和力)相比,变体二元复合物对靶基因座的结合亲和力增加至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多。
[0822]
在一些实施例中,与多个亲本二元复合物对两个或更多个靶基因座的结合亲和力(例如,在靶结合亲和力)相比,多个变体二元复合物对两个或更多个靶基因座的结合亲和力增加至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多。
[0823]
在本发明的上下文中,变体二元复合物与亲本二元复合物之间降低的脱靶结合和/或增加的在靶结合的程度可相差约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或更多。
[0824]
在一些实施例中,与亲本二元复合物与非靶基因座的脱靶结合相比,变体二元复合物与非靶基因座的脱靶结合降低至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、
13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
[0825]
在一些实施例中,与多个亲本二元复合物与两个或更多个非靶基因座的脱靶结合相比,多个变体二元复合物与两个或更多个非靶基因座的脱靶结合降低至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
[0826]
在一些实施例中,与亲本二元复合物与靶基因座的在靶结合相比,变体二元复合物与靶基因座的在靶结合增加至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多。
[0827]
在一些实施例中,与多个亲本二元复合物与两个或更多个靶基因座的在靶结合相比,多个变体二元复合物与两个或更多个靶基因座的在靶结合增加至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多。
[0828]
在一些实施例中,与参考相比,变体二元复合物对靶基因座的结合亲和力(例如,在靶结合亲和力)增加与以下情况相关:与参考相比,变体二元复合物对非靶基因座的结合亲和力(例如,脱靶结合亲和力)降低。在一些实施例中,变体二元复合物在靶基因座处的结合亲和力(例如,在靶结合亲和力)与变体二元复合物在非靶基因座处的结合亲和力(例如,脱靶结合亲和力)负相关。在一些实施例中,与参考(例如,亲本二元复合物的在靶结合亲和
力)相比,变体二元复合物在靶基因座处的结合亲和力增加至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多与以下情况相关:与参考(例如,亲本二元复合物的脱靶结合亲和力)相比,变体二元复合物在非靶基因座处的结合亲和力降低至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多。在一些实施例中,与参考相比,变体二元复合物对靶基因座的结合亲和力(例如,在靶结合亲和力)增加导致与参考相比,变体二元复合物在靶基因座处的结合亲和力(例如,在靶结合亲和力)增加。
[0829]
在一些实施例中,与参考相比,多个变体二元复合物对两个或更多个靶基因座的结合亲和力(例如,在靶结合亲和力)增加与以下情况相关:与参考相比,多个变体二元复合物对两个或更多个非靶基因座的结合亲和力(例如,脱靶结合亲和力)降低。在一些实施例中,多个变体二元复合物在两个或更多个靶基因座处的结合亲和力(例如,在靶结合亲和力)与多个变体二元复合物在两个或更多个非靶基因座处的结合亲和力(例如,脱靶结合亲和力)负相关。在一些实施例中,与参考(例如,亲本二元复合物的在靶结合亲和力)相比,多个变体二元复合物在两个或更多个靶基因座处的结合亲和力(例如,在靶结合亲和力)增加至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多与以下情况相关:与参考(例如,亲本二元复合物的脱靶结合亲和力)相比,多个变体二元复合物在两个或更多个非靶基因座处的结合亲和力(例如,脱靶结合亲和力)降低至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、
60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多。在一些实施例中,与参考相比,多个变体二元复合物对两个或更多个靶基因座的结合亲和力(例如,在靶结合亲和力)增加导致与参考相比,多个变体二元复合物对两个或更多个非靶基因座的结合亲和力(例如,脱靶结合亲和力)降低。
[0830]
在一些实施例中,与参考相比,变体二元复合物与靶基因座的结合(例如,在靶结合)增加与以下情况相关:与参考相比,变体二元复合物与非靶基因座的结合(例如,脱靶结合)降低。在一些实施例中,变体二元复合物在靶基因座处的结合(例如,在靶结合)与变体二元复合物在非靶基因座处的结合(例如,脱靶结合)负相关。在一些实施例中,与参考(例如,亲本二元复合物的在靶结合)相比,变体二元复合物在靶基因座处的结合增加至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多与以下情况相关:与参考(例如,亲本二元复合物的脱靶结合)相比,变体二元复合物在非靶基因座处的结合降低至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多。在一些实施例中,与参考相比,变体二元复合物与靶基因座的结合(例如,在靶结合)增加导致与参考相比,变体二元复合物与非靶基因座的结合(例如,脱靶结合)降低。
[0831]
在一些实施例中,与参考相比,多个变体二元复合物与两个或更多个靶基因座的结合(例如,在靶结合)增加与以下情况相关:与参考相比,多个变体二元复合物与两个或更多个非靶基因座的结合(例如,脱靶结合)降低。在一些实施例中,多个变体二元复合物在两个或更多个靶基因座处的结合(例如,在靶结合)与多个变体二元复合物在两个或更多个非靶基因座处的结合(例如,脱靶结合)负相关。在一些实施例中,与参考(例如,亲本二元复合物的在靶结合)相比,多个变体二元复合物在两个或更多个靶基因座处的结合(在靶结合)增加至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、
48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多与以下情况相关:与参考(例如,亲本二元复合物的脱靶结合)相比,多个变体二元复合物在两个或更多个非靶基因座处的结合(例如,脱靶结合)降低至少约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%或更多。在一些实施例中,与参考相比,多个变体二元复合物与两个或更多个靶基因座的结合(例如,在靶结合)增加导致与参考相比,多个变体二元复合物与两个或更多个非靶基因座的结合(例如,脱靶结合)降低。
[0832]
在一些实施例中,变体二元复合物对靶基因座的结合亲和力增加与变体二元复合物在靶基因座处的活性(例如,在靶活性)增加相关。在一些实施例中,变体二元复合物对靶基因座的结合亲和力增加导致变体二元复合物在靶基因座处的活性(例如,在靶活性)增加。
[0833]
在一些实施例中,多个变体二元复合物对两个或更多个靶基因座的结合亲和力增加与多个变体二元复合物在两个或更多个靶基因座处的活性(例如,在靶活性)增加相关。在一些实施例中,多个变体二元复合物对两个或更多个靶基因座的结合亲和力增加导致与多个变体二元复合物在两个或更多个靶基因座处的活性(例如,在靶活性)增加。
[0834]
在一些实施例中,变体二元复合物与靶基因座的结合增加与变体二元复合物在靶基因座处的活性(例如,在靶活性)增加相关。在一些实施例中,变体二元复合物与靶基因座的结合增加导致变体二元复合物在靶基因座处的活性(例如,在靶活性)增加。
[0835]
在一些实施例中,多个变体二元复合物与两个或更多个靶基因座的结合增加与多个变体二元复合物在两个或更多个靶基因座处的活性(例如,在靶活性)增加相关。在一些实施例中,多个变体二元复合物与两个或更多个靶基因座的结合增加导致与多个变体二元复合物在两个或更多个靶基因座处的活性(例如,在靶活性)增加。
[0836]
在一些实施例中,变体二元复合物对非靶基因座的结合亲和力降低与变体二元复合物在非靶基因座处的活性(例如,脱靶活性)降低相关。在一些实施例中,变体二元复合物对非靶基因座的结合亲和力降低导致变体二元复合物在非靶基因座处的活性(例如,脱靶活性)降低。
[0837]
在一些实施例中,多个变体二元复合物对两个或更多个非靶基因座的结合亲和力降低与多个变体二元复合物在两个或更多个非靶基因座处的活性(例如,脱靶活性)降低相关。在一些实施例中,多个变体二元复合物对两个或更多个非靶基因座的结合亲和力降低导致多个变体二元复合物在两个或更多个非靶基因座处的活性(例如,脱靶活性)降低。
[0838]
在一些实施例中,变体二元复合物与非靶基因座的结合降低与变体二元复合物在非靶基因座处的活性(例如,脱靶活性)降低相关。在一些实施例中,变体二元复合物与非靶基因座的结合降低导致变体二元复合物在非靶基因座处的活性(例如,脱靶活性)降低。
[0839]
在一些实施例中,多个变体二元复合物与两个或更多个非靶基因座的结合降低与多个变体二元复合物在两个或更多个非靶基因座处的活性(例如,脱靶活性)降低相关。在一些实施例中,多个变体二元复合物与两个或更多个非靶基因座的结合降低导致多个变体二元复合物在两个或更多个非靶基因座处的活性(例如,脱靶活性)降低。
[0840]
在一些实施例中,变体二元复合物对非靶基因座的结合亲和力降低与变体二元复合物在靶基因座处的活性(例如,在靶活性)增加相关。在一些实施例中,变体二元复合物对非靶基因座的结合亲和力降低导致变体二元复合物在靶基因座处的活性(例如,在靶活性)增加。
[0841]
在一些实施例中,多个变体二元复合物对两个或更多个非靶基因座的结合亲和力降低与多个变体二元复合物在两个或更多个在靶基因座处的活性(例如,在靶活性)增加相关。在一些实施例中,多个变体二元复合物对两个或更多个非靶基因座的结合亲和力降低导致多个变体二元复合物在两个或更多个在靶基因座处的活性(例如,在靶活性)增加。
[0842]
在一些实施例中,变体二元复合物与非靶基因座的结合降低与变体二元复合物在在靶基因座处的活性(例如,在靶活性)增加相关。在一些实施例中,变体二元复合物与非靶基因座的结合降低导致变体二元复合物在在靶基因座处的活性(例如,在靶活性)增加。
[0843]
在一些实施例中,多个变体二元复合物与两个或更多个非靶基因座的结合降低与多个变体二元复合物在两个或更多个在靶基因座处的活性(例如,在靶活性)增加相关。在一些实施例中,多个变体二元复合物与两个或更多个非靶基因座的结合降低导致多个变体二元复合物在两个或更多个在靶基因座处的活性(例如,在靶活性)增加。
[0844]
在一些实施例中,与亲本二元复合物相比,变体二元复合物对靶基因座的结合亲和力与变体二元复合物的在靶活性(例如,在靶基因座处)与脱靶活性(例如,在非靶基因座处)的比率相关。在一些实施例中,与亲本二元复合物相比,变体二元复合物对靶基因座的结合亲和力增加与变体二元复合物的在靶活性(例如,在靶基因座处)与脱靶活性(例如,在非靶基因座处)的比率增加相关,并且/或者导致变体二元复合物的在靶活性(例如,在靶基因座处)与脱靶活性(例如,在非靶基因座处)的比率增加。
[0845]
在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物对两个或更多个靶基因座的结合亲和力与多个变体二元复合物的在靶活性(例如,在两个或更多个靶基因座处)与脱靶活性(例如,在两个或更多个非靶基因座处)的比率相关。在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物对两个或更多个靶基因座的结合亲和力增加与多个变体二元复合物的在靶活性(例如,在两个或更多个靶基因座处)与脱靶活性(例如,在两个或更多个非靶基因座处)的比率增加相关,并且/或者多个变体二元复合物的在靶活性(例如,在两个或更多个靶基因座处)与脱靶活性(例如,在两个或更多个非靶基因座处)的比率增加。
[0846]
在一些实施例中,与亲本二元复合物相比,变体二元复合物与靶基因座的结合与变体二元复合物的在靶活性(例如,在靶基因座处)与脱靶活性(例如,在非靶基因座处)的比率相关。在一些实施例中,与亲本二元复合物相比,变体二元复合物与靶基因座的结合增
加与变体二元复合物的在靶活性(例如,在靶基因座处)与脱靶活性(例如,在非靶基因座处)的比率增加相关,并且/或者导致变体二元复合物的在靶活性(例如,在靶基因座处)与脱靶活性(例如,在非靶基因座处)的比率增加。
[0847]
在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物与两个或更多个靶基因座的结合与多个变体二元复合物的在靶活性(例如,在两个或更多个靶基因座处)与脱靶活性(例如,在两个或更多个非靶基因座处)的比率相关。在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物与两个或更多个靶基因座的结合增加与多个变体二元复合物的在靶活性(例如,在两个或更多个靶基因座处)与脱靶活性(例如,在两个或更多个非靶基因座处)的比率增加相关,并且/或者导致多个变体二元复合物的在靶活性(例如,在两个或更多个靶基因座处)与脱靶活性(例如,在两个或更多个非靶基因座处)的比率增加。
[0848]
在一些实施例中,与亲本二元复合物相比,变体二元复合物的在靶结合亲和力与脱靶结合亲和力的比率与在靶活性(例如,在靶基因座处)相关。在一些实施例中,与亲本二元复合物相比,变体二元复合物的在靶结合亲和力与脱靶结合亲和力的比率增加与在靶活性(例如,在靶基因座处)增加相关,并且/或者导致在靶活性(例如,在靶基因座处)增加。
[0849]
在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物的在靶结合亲和力与脱靶结合亲和力的比率与在靶活性(例如,在两个或更多个靶基因座处)相关。在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物的在靶结合亲和力与脱靶结合亲和力的比率增加与在靶活性(例如,在两个或更多个靶基因座处)增加相关,并且/或者导致在靶活性(例如,在两个或更多个靶基因座处)增加。
[0850]
在一些实施例中,与亲本二元复合物相比,变体二元复合物的在靶结合与脱靶结合的比率与在靶活性(例如,在靶基因座处)相关。在一些实施例中,与亲本二元复合物相比,变体二元复合物的在靶结合与脱靶结合的比率增加与在靶活性(例如,在靶基因座处)增加相关,并且/或者导致在靶活性(例如,在靶基因座处)增加。
[0851]
在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物的在靶结合与脱靶结合的比率与在靶活性(例如,在两个或更多个靶基因座处)相关。在一些实施例中,与多个亲本二元复合物相比,多个变体二元复合物的在靶结合与脱靶结合的比率增加与在靶活性(例如,在两个或更多个靶基因座处)增加相关,并且/或者导致在靶活性(例如,在两个或更多个靶基因座处)增加。
[0852]
插入缺失活性
[0853]
在一些实施例中,变体二元复合物、变体三元复合物形成或变体复合物的在靶结合诱导导致与5'-nttn-3'序列相邻的缺失(例如,核苷酸缺失或dna缺失)的dna断裂,其中n是任何核苷酸。在一些实施例中,变体复合物的在靶结合导致与5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列相邻的缺失,其中y是c或t,b是除a之外的任何核苷酸,d是除c之外的任何核苷酸,并且r是a或g。在一些实施例中,变体复合物的在靶结合导致与5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列相邻的缺失。在一些实施例中,变体二元复合物、变体三元复合物形成或变体复合物的在靶结合导致与富含t/c的序列相邻的缺失。
[0854]
在一些实施例中,变体二元复合物、变体三元复合物形成或变体复合物的在靶结合导致5'-nttn-3'序列的下游的缺失。在一些实施例中,变体二元复合物、变体三元复合物形成或变体复合物的在靶结合导致5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游的缺失。在一些实施例中,变体二元复合物、变体三元复合物形成或变体复合物的在靶结合导致5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游的缺失。在一些实施例中,变体二元复合物、变体三元复合物形成或变体复合物的在靶结合导致富含t/c的序列的下游的缺失。
[0855]
在一些实施例中,缺失在5'-nttn-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失在富含t/c的序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始。
[0856]
在一些实施例中,缺失在5'-nttn-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失在富含t/c的序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始。
[0857]
在一些实施例中,缺失在5'-nttn-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。在一些实施例中,缺失在富含t/c的序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。
[0858]
在一些实施例中,缺失在5'-nttn-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、
5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。在一些实施例中,缺失在富含t/c的序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。
[0859]
在一些实施例中,缺失在5'-nttn-3'序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失在富含t/c的序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。
[0860]
在一些实施例中,缺失在5'-nttn-3'序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失在富含t/c的序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。
[0861]
在一些实施例中,缺失在5'-nttn-3'序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
[0862]
在一些实施例中,缺失在5'-nttn-3'序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约20至约30个核苷酸(例如,约
17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
[0863]
在一些实施例中,缺失在5'-nttn-3'序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
[0864]
在一些实施例中,缺失在5'-nttn-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
[0865]
在一些实施例中,缺失在5'-nttn-3'序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
[0866]
在一些实施例中,缺失在5'-nttn-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
[0867]
在一些实施例中,缺失在5'-nttn-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在这些序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在这些序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
[0868]
在一些实施例中,缺失在5'-nttn-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-nttn-3'序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
[0869]
在一些实施例中,缺失在5'-nttn-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并
且在这些序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在这些序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
[0870]
在一些实施例中,缺失在5'-nttn-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-nttn-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始,并且在该序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
[0871]
在一些实施例中,缺失在5'-nttn-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在这些序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在这些序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
[0872]
在一些实施例中,缺失在5'-nttn-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-nttn-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始,并且在该序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
[0873]
在一些实施例中,缺失在5'-nttn-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在这些序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在这些序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
[0874]
在一些实施例中,缺失在5'-nttn-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5'-nttn-3'序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游
约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
[0875]
在一些实施例中,缺失在5'-nttn-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在这些序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在这些序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的约5至约10个核苷酸内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内结束。
[0876]
在一些实施例中,缺失在5'-nttn-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5'-nttn-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
[0877]
在一些实施例中,缺失在5'-nttn-3'序列的约5至约10个核苷酸(例如,约3、4、5、
6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在这些序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在这些序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
[0878]
在一些实施例中,缺失在5'-nttn-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5'-nttn-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
[0879]
在一些实施例中,缺失在5'-nttn-3'序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-ntty-3'、5'-nttc-3'、5'-nttt-3'、5'-ntta-3'、5'-nttb-3'、5'-nttg-3'、5'-ctty-3'、5'-dttr'3'、5'-cttr-3'、5'-dttt-3'、5'-attn-3'或5'-gttn-3'序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在这些序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在5'-cttt-3'、5'-cttc-3'、5'-gttt-3'、5'-gttc-3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在这些序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷
3'、5'-tttc-3'、5'-gtta-3'或5'-gttg-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在富含t/c的序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
[0885]
在一些实施例中,缺失的长度多达约40个核苷酸(例如,约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个核苷酸)。在一些实施例中,缺失的长度介于约4个核苷酸与约40个核苷酸之间(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个核苷酸)。在一些实施例中,缺失的长度介于约4个核苷酸与约25个核苷酸之间(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)。在一些实施例中,缺失的长度介于约10个核苷酸与约25个核苷酸之间(例如,约7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)。在一些实施例中,缺失的长度介于约10个核苷酸与约15个核苷酸之间(例如,约7、8、9、10、11、12、13、14、15、16或17个核苷酸)。
[0886]
在一些实施例中,具有缺失的基因存在于细胞核中。在一些实施例中,具有缺失的基因对于细胞是内源的。在一些实施例中,具有缺失的基因是基因组dna。在一些实施例中,具有缺失的基因是染色体dna。在一些实施例中,具有缺失的基因是蛋白质编码基因(例如,编码b2m、trac或pdcd1的基因)或其功能区(诸如编码区)或调节元件(诸如启动子、增强子、5'或3'非翻译区等)。在一些实施例中,缺失在外显子(例如,b2m、trac或pdcd1的外显子)或内含子中。在一些实施例中,具有缺失的基因是非编码基因,诸如转座子、mirna、trna、核糖体rna、核酶或lncrna。
[0887]
在一些实施例中,缺失改变基因的表达。在一些实施例中,缺失改变基因的功能。在一些实施例中,缺失使基因失活。在一些实施例中,缺失是移码缺失。在一些实施例中,缺失是非移码缺失。在一些实施例中,缺失导致细胞毒性或细胞死亡(例如,凋亡)。
[0888]
在一些实施例中,变体二元复合物(例如,与亲本多肽相比表现出增加的与靶向部分的复合物形成的变体二元复合物)诱导导致b2m中出现本文所述的缺失的dna断裂。在一些实施例中,变体二元复合物包含表22的crrna。b2m中的插入缺失活性在图8中示出,并且b2m表达的减少在图9中示出。参见实例13。
[0889]
在一些实施例中,变体二元复合物(例如,与亲本多肽相比表现出增加的与靶向部分的复合物形成的变体二元复合物)诱导导致trac中出现本文所述的缺失的dna断裂。在一些实施例中,变体二元复合物包含表23的crrna。trac中的插入缺失活性在图11a中示出。参见实例13。
[0890]
在一些实施例中,变体二元复合物(例如,与亲本多肽相比表现出增加的与靶向部分的复合物形成的变体二元复合物)诱导导致pdcd1中出现本文所述的缺失的dna断裂。在一些实施例中,变体二元复合物包含表23的crrna。pdcd1中的插入缺失活性在图12a中示出。参见实例13。
[0891]
在一些实施例中,缺失与基因中的突变重叠。在一些实施例中,缺失与基因内的插
入重叠。例如,在一些实施例中,缺失消除基因的重复扩增。在一些实施例中,缺失破坏基因的一个等位基因。在一些实施例中,缺失破坏基因的两个等位基因。
[0892]
在一些实施例中,缺失在真核细胞或原核细胞中被诱导。在一些实施例中,缺失在动物细胞、植物细胞或真菌细胞中被诱导,或者细胞来源于动物细胞、植物细胞或真菌细胞。在一些实施例中,缺失在哺乳动物细胞中被诱导或来源于哺乳动物细胞。在一些实施例中,缺失在人细胞中被诱导或来源于人细胞。在一些实施例中,缺失在原代细胞中被诱导。在一些实施例中,缺失在细胞系中被诱导。在一些实施例中,缺失在t细胞中被诱导。在一些实施例中,缺失在干细胞(例如,全能/万能干细胞、多能干细胞、多潜能干细胞、寡能干细胞或单能干细胞)、分化细胞或终末分化细胞中被诱导。在一些实施例中,变体二元复合物选择性地诱导导致细胞中出现本文所述的缺失的dna断裂(例如,变体二元复合物不形成非靶变体三元复合物,或变体二元复合物诱导导致与亲本二元复合物相比在靶缺失与脱靶缺失的比率更高的dna断裂)。在一些实施例中,本文所述的缺失在与未修饰的细胞相比缺少由变体二元复合物诱导的另外的缺失的细胞中被诱导。例如,在一些实施例中,本文所述的缺失在与未修饰的细胞相比缺少长度大于或小于约10个核苷酸的另外的变体cas12i2多肽诱导的缺失(例如,长度为约40、30、25、20、15、10、9、8、7、6、5、4或3个核苷酸的另外的缺失)的细胞中被诱导。在一些实施例中,缺失在与未修饰的细胞相比缺少长度大于或小于约10个核苷酸的cas12i2多肽诱导的插入(例如,长度为约10、9、8、7、6、5、4、3、2或1个核苷酸的插入)的细胞中被诱导。在一些实施例中,2个或更多个缺失(例如,多重靶向缺失)被诱导。
[0893]
在一些方面,本文所述的发明包括一种在细胞中获得缺失的方法,其中该方法包括使本文所述的变体cas12i2多肽与细胞中的dna接触。
[0894]
在一些方面,本文所述的发明包括一种包含如本文所述的变体cas12i2多肽、靶向部分和细胞的组合物或配制品。
[0895]
制备
[0896]
在一些实施例中,本发明的变体cas12i2多肽可以通过以下过程制备:(a)培养产生本发明的变体cas12i2多肽的细菌,分离变体cas12i2多肽,任选地,纯化变体cas12i2多肽,以及使变体cas12i2多肽与rna指导物复合。变体cas12i2多肽还可以通过(b)已知的基因工程技术来制备,具体地,通过以下过程制备:从细菌中分离编码本发明的变体cas12i2多肽的基因,构建重组表达载体,然后将该载体转移到表达rna指导物的合适宿主细胞中以在宿主细胞中表达与rna指导物复合的重组蛋白。替代性地,变体cas12i2多肽可以通过(c)体外偶联的转录-翻译系统然后与rna指导物复合来制备。可以用于制备本发明的变体cas12i2多肽的细菌没有特别限制,只要它们可以产生本发明的变体cas12i2多肽。细菌的一些非限制性实例包括本文所述的大肠杆菌(e.coli)细胞。
[0897]
载体
[0898]
本发明提供了一种用于表达本文所述的变体cas12i2多肽的载体或可将编码本文所述的变体的核酸掺入载体中。在一些实施例中,本发明的载体包括编码变体cas12i2多肽的核苷酸序列。在一些实施例中,本发明的载体包括编码变体cas12i2多肽的核苷酸序列。
[0899]
本发明还提供了一种可用于制备如本文所述的变体cas12i2多肽或包含变体cas12i2多肽的组合物的载体。在一些实施例中,本发明包括细胞中的本文所述的组合物或载体。在一些实施例中,本发明包括一种在细胞中表达包含变体cas12i2多肽的组合物或者
编码变体cas12i2多肽的载体或核酸的方法。该方法可包括提供组合物(例如,载体或核酸)以及将组合物递送到细胞的步骤。
[0900]
天然或合成多核苷酸的表达通常通过将编码感兴趣的基因的多核苷酸(例如,编码变体cas12i2多肽的核苷酸序列)可操作地连接到启动子并将构建体掺入表达载体中来实现。表达载体没有特别限制,只要它包括编码本发明的变体cas12i2多肽的多核苷酸并且可以适合于在真核细胞中复制和整合。
[0901]
典型的表达载体包括可用于表达所希望多核苷酸的转录和翻译终止子、起始序列和启动子。例如,可使用携带rna聚合酶识别序列的质粒载体(psp64、pbluescript等)。包括来源于逆转录病毒如慢病毒的那些载体是实现长期基因转移的合适工具,因为它们允许转基因的长期稳定整合及其在子细胞中的繁殖。载体的实例包括表达载体、复制载体、探针产生载体、和测序载体。可以按病毒载体的形式,将表达载体提供给细胞。
[0902]
病毒载体技术是本领域众所周知的,并且描述于多种病理学和分子生物学手册。可用作载体的病毒包括但不限于噬菌体病毒、逆转录病毒、腺病毒、腺相关病毒、疱疹病毒和慢病毒。通常,合适的载体含有在至少一种生物体中有复制功能的起点、启动子序列、方便的限制性内切酶位点、和一种或多种选择性标志物。
[0903]
载体的种类没有特别限制,可以适当地选择可以在宿主细胞中表达的载体。更具体而言,取决于宿主细胞的种类,适当地选择启动子序列以确保从多核苷酸表达变体cas12i2多肽,并且将该启动子序列和多核苷酸插入各种质粒等中的任一种中以制备表达载体。
[0904]
另外的启动子元件(例如,增强序列)调节转录起始的频率。典型地,这些元件位于起始位点上游30-110bp的区域中,尽管最近已经显示许多启动子也含有起始位点下游的功能元件。取决于启动子,似乎单个元件可以共同地或独立地发挥功能,以激活转录。
[0905]
此外,本披露不应限于使用组成型启动子。诱导型启动子也被考虑作为本披露的一部分。诱导型启动子的使用提供了分子开关,该分子开关能够当需要该启动子可操作地连接的多核苷酸序列的表达时启动这种表达,或者当不需要表达时关闭表达。诱导型启动子的实例包括但不限于金属硫蛋白启动子、糖皮质激素启动子、孕酮启动子、和四环素启动子。
[0906]
待引入的表达载体还可以含有选择性标志物基因或报告基因或二者,从而便于从寻求通过病毒载体转染或感染的细胞的群体中,鉴定和选择表达性细胞。在其他方面,选择性标志物可以在一段单独的dna上进行,并且用于共转染程序。选择性标志物和报告基因二者侧翼可以是适当的转录控制序列,以使得能够在宿主细胞中表达。这种标志物的实例包括用于真核细胞培养的二氢叶酸还原酶基因和新霉素抗性基因;以及用于大肠杆菌和其他细菌培养的四环素抗性基因和氨苄青霉素抗性基因。通过使用这样的选择标志物,可以确认编码本发明的变体cas12i2多肽的多核苷酸是否已被转移到宿主细胞中,然后被成功表达。
[0907]
重组表达载体的制备方法没有特别限制,其实例包括使用质粒、噬菌体或粘粒的方法。
[0908]
表达方法
[0909]
本发明包括一种用于蛋白质表达的方法,该方法包括翻译本文所述的变体
cas12i2多肽。
[0910]
在一些实施例中,本文所述的宿主细胞用于表达变体cas12i2多肽。宿主细胞没有特别限制,并且可以优选地使用各种已知的细胞。宿主细胞的具体实例包括细菌,诸如大肠杆菌、酵母(芽殖酵母酿酒酵母(saccharomyces cerevisiae)和裂殖酵母粟酒裂殖酵母(schizosaccharomyces pombe))、线虫(秀丽隐杆线虫(caenorhabditis elegans))、爪蟾(xenopus laevis)卵母细胞和动物细胞(例如,cho细胞、cos细胞和hek293细胞)。用于将上述表达载体转移到宿主细胞中的方法(即转化法)没有特别限制,并且可以使用已知的方法,诸如电穿孔、磷酸钙法、脂质体法和deae葡聚糖法。
[0911]
在用表达载体转化宿主后,可培养、培育或繁殖宿主细胞以产生变体cas12i2多肽。在表达变体cas12i2多肽后,可以根据常规方法(例如,过滤、离心、细胞破坏、凝胶过滤色谱、离子交换色谱等)收集宿主细胞并且从培养物中纯化变体cas12i2多肽等。
[0912]
在一些实施例中,用于变体cas12i2多肽表达的方法包括翻译变体cas12i2多肽的至少5个氨基酸、至少10个氨基酸、至少15个氨基酸、至少20个氨基酸、至少50个氨基酸、至少100个氨基酸、至少150个氨基酸、至少200个氨基酸、至少250个氨基酸、至少300个氨基酸、至少400个氨基酸、至少500个氨基酸、至少600个氨基酸、至少700个氨基酸、至少800个氨基酸、至少900个氨基酸或至少1000个氨基酸。在一些实施例中,用于蛋白质表达的方法包括翻译变体cas12i2多肽的约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约50个氨基酸、约100个氨基酸、约150个氨基酸、约200个氨基酸、约250个氨基酸、约300个氨基酸、约400个氨基酸、约500个氨基酸、约600个氨基酸、约700个氨基酸、约800个氨基酸、约900个氨基酸、约1000个氨基酸或更多氨基酸。
[0913]
多种方法可以用于确定宿主细胞中成熟变体cas12i2多肽的产生水平。此类方法包括但不限于例如利用对变体cas12i2多肽具有特异性的多克隆或单克隆抗体或如本文别处所述的标记标签的方法。示例性方法包括但不限于酶联免疫吸附测定(elisa)、放射免疫测定(ma)、荧光免疫测定(fia)和荧光激活细胞分选(facs)。这些和其他测定是本领域熟知的(参见例如maddox等人,j.exp.med.[实验医学杂志]158:1211[1983])。
[0914]
本披露提供了在细胞中体内表达变体cas12i2多肽的方法,这些方法包括向宿主细胞提供编码变体cas12i2多肽的多核糖核苷酸,其中多核糖核苷酸编码变体cas12i2多肽;在细胞中表达变体cas12i2多肽;以及从细胞获得变体cas12i2多肽。
[0915]
改变或突变的引入
[0916]
可通过本领域已知的合成方法来产生编码变体多肽或多个变体多肽的核酸序列。使用编码亲本多肽本身的核酸序列作为框架,可以一次插入一个或多个改变或突变以改变编码亲本多肽的核酸序列。沿着同样的思路,可通过在以合成方式合成时将变化引入多肽序列中来改变或突变亲本多肽。这可通过本领域熟知的方法来完成。
[0917]
产生改变或突变并将它们引入亲本多肽序列中可以使用本领域技术人员已知的任何方法来完成。特别地,在一些实施例中,用于pcr的寡核苷酸引物可用于dna模板(包括编码变体多肽的核酸序列中的一个或多个改变或突变)的快速合成。位点特异性诱变也可用作通过对基础dna进行特异性诱变来制备单个肽或者生物学功能等价蛋白或肽的有用技术。该技术进一步提供了结合一个或多个前述考虑通过将一个或多个核苷酸序列变化引入dna中来制备和测试变体的能力。位点特异性诱变允许通过使用编码所需突变的dna序列的
特异性寡核苷酸序列以及足够数量的相邻核苷酸来产生变体,以提供足够大小和序列复杂性的引物序列,从而在所穿过的缺失连接部的两侧形成稳定的双链体。通常,长度为约17至25个核苷酸的引物是优选的,序列的连接部的两侧上约5至10个残基被改变。
[0918]
引入结构变异(诸如作为氨基和/或羧基末端延伸的多肽融合)可以以与将改变或突变引入亲本多肽中类似的方式来完成。可通过将编码附加肽的适当核酸序列包括到编码亲本多肽或变体多肽的核酸序列中来将附加肽添加到亲本多肽或变体多肽上。任选地,可通过合成多肽产生来将附加肽直接附加到变体多肽上。
[0919]
在一个方面,本发明还提供了用于将改变或突变引入亲本多肽序列中以产生变体cas12i2多肽的方法,与亲本多肽相比,该变体cas12i2多肽具有增加的与靶核酸的两个或更多个基因座(例如,2、3、4、5、6、7、8、9个或更多个)的在靶结合。
[0920]
在一个方面,本发明还提供了用于将改变或突变引入亲本多肽序列中以产生多个变体cas12i2多肽(例如,具有相同氨基酸序列的单独的变体cas12i2多肽)的方法,与多个亲本多肽和rna指导物相比,多个变体cas12i2多肽在与多个不同的rna指导物单独复合时具有增加的与靶核酸的两个或更多个基因座的在靶结合。
[0921]
在一个方面,本发明还提供了用于将改变或突变引入亲本多肽序列中以产生变体cas12i2多肽的方法,与亲本多肽相比,该变体cas12i2多肽具有增加的与靶核酸的两个或更多个靶基因座的在靶三元复合物形成。
[0922]
在一个方面,本发明还提供了用于将改变或突变引入亲本多肽序列中以产生多个变体cas12i2多肽(例如,具有相同氨基酸序列的单独的变体cas12i2多肽)的方法,与多个亲本多肽和rna指导物相比,多个变体cas12i2多肽在与多个不同的rna指导物单独复合时具有增加的与靶核酸的两个或更多个靶基因座的三元复合物形成。
[0923]
在一个方面,本发明还提供了用于将改变或突变引入亲本多肽序列中以产生cas12i2多肽的方法,与亲本多肽相比,该变体cas12i2多肽表现出靶向数量增加的靶核酸或靶基因座。
[0924]
在一个方面,本发明还提供了用于将改变或突变引入亲本多肽序列中以产生多个变体cas12i2多肽(例如,具有相同氨基酸序列的单独的变体cas12i2多肽)的方法,与多个亲本多肽和rna指导物相比,多个变体cas12i2多肽在与多个不同的rna指导物单独复合时表现出靶向数量增加的靶核酸或靶基因座。
[0925]
在一个方面,本发明还提供了用于将改变或突变引入亲本多肽序列中以增强cas12i2多肽的稳定性的方法。cas12i2多肽的稳定性可以通过以下技术测定或可包括但不限于以下技术:热变性测定、热转变测定、差示扫描量热法(dsc)、差示扫描荧光测定法(dsf)、等温滴定量热法(itc)、脉冲追踪法、漂白追踪法、放线菌酮追踪法、圆二色性(cd)光谱法、结晶和基于荧光的活性测定。
[0926]
功能性的变体选择
[0927]
在一个方面,本发明提供了用于将改变或突变导入亲本多肽序列中以增强二元复合物形成、rna指导物结合活性和/或rna指导物结合特异性的方法。
[0928]
在一个方面,本发明还提供了用于将改变或突变导入亲本多肽序列中以增强三元复合物形成、在靶结合亲和力、在靶结合活性、在靶结合和/或在靶结合特异性的方法。在一个方面,本发明还提供了用于将改变或突变引入亲本多肽序列中以增强二元复合物(例如,
核糖核蛋白)的在靶结合亲和力(例如,与靶相互作用的亲和力或时间)、在靶结合活性(例如,与靶相互作用时的效应子活性)、在靶结合(例如,与靶相互作用的强度)和/或在靶结合特异性(例如,对特定靶的偏好)的方法。
[0929]
在一些实施例中,将改变或突变引入亲本多肽序列中以产生具有增加的在靶结合和/或活性的变体cas12i2多肽。而且,在此类实施例中,与亲本多肽相比,变体cas12i2多肽中的脱靶结合和/或活性可以降低。此外,有关在靶结合与脱靶结合的特异性可以增加或降低。
[0930]
在一些实施例中,将改变或突变引入亲本多肽序列以产生变体cas12i2多肽,该变体cas12i2多肽在与rna指导物复合时具有增加的在靶结合。而且,在此类实施例中,包含变体cas12i2多肽和rna指导物的复合物中的脱靶结合可以降低。此外,有关在靶结合/活性与脱靶结合/活性的特异性可以增加或降低。
[0931]
在某些实施例中,将改变或突变引入亲本多肽序列以产生增强稳定性和/或蛋白质-rna相互作用的变体cas12i2多肽。在某些实施例中,与亲本多肽相比,变体cas12i2多肽包括促进变体cas12i2多肽的稳定性和/或rna相互作用以及酶活性的至少一种改变。
[0932]
在某些实施例中,将改变或突变引入亲本多肽序列以产生(a)缺乏酶活性但(b)保持增强的稳定性和/或蛋白质-rna相互作用的变体cas12i2多肽。在某些实施例中,与亲本多肽相比,变体cas12i2多肽包括促进变体cas12i2多肽的稳定性和/或rna相互作用但不促进酶活性的至少一种改变。
[0933]
在某些实施例中,将改变或突变引入亲本多肽序列以产生(a)增强酶活性并(b)增强二元复合物形成、rna指导物结合活性和/或rna指导物结合特异性的变体cas12i2多肽。在某些实施例中,与亲本多肽相比,变体cas12i2多肽包括促进变体cas12i2多肽的rna指导物复合物形成、rna指导物结合活性和/或rna指导物结合特异性以及酶活性的至少一种改变。
[0934]
在某些实施例中,将改变或突变引入亲本多肽序列以产生(a)缺乏酶活性但(b)保留增强的二元复合物形成、rna指导物结合活性和/或rna指导物结合特异性的变体cas12i2多肽。在某些实施例中,与亲本多肽相比,变体cas12i2多肽包括促进变体cas12i2多肽的二元复合物形成、rna指导物结合活性和/或rna指导物结合特异性但不促进酶活性的至少一种改变。
[0935]
在某些实施例中,将改变或突变引入亲本多肽序列以产生(a)增强酶活性并(b)增强在靶三元复合物形成、在靶结合亲和力、在靶结合活性和/或在靶结合特异性的变体cas12i2多肽。在某些实施例中,与亲本多肽相比,变体cas12i2多肽包括促进变体cas12i2多肽的在靶三元复合物形成、在靶结合亲和力、在靶结合活性和/或在靶结合特异性以及酶活性的至少一种改变。
[0936]
在某些实施例中,将改变或突变引入亲本多肽序列以产生(a)缺乏酶活性但(b)保留增强的在靶三元复合物形成、在靶结合亲和力、在靶结合活性和/或在靶结合特异性的变体cas12i2多肽。在某些实施例中,与亲本多肽相比,变体cas12i2多肽包括促进变体cas12i2多肽的在靶三元复合物形成、在靶结合亲和力、在靶结合活性和/或在靶结合特异性但不促进酶活性的至少一种改变。
[0937]
在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于
seq id no:2的亲本多肽表现出(a)降低的酶活性和(b)增强的rna亲和力的变体cas12i2多肽。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)增加的酶活性和(b)增强的rna亲和力的变体cas12i2多肽。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)保留的酶活性和(b)增强的rna亲和力的变体cas12i2多肽。在一些实施例中,具有本文所述的特征的变体cas12i2多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0938]
在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)降低的酶活性和(b)增强的二元复合物形成的变体cas12i2多肽。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)增加的酶活性和(b)增强的二元复合物形成的变体cas12i2多肽。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)保留的酶活性和(b)增强的二元复合物形成的变体cas12i2多肽。在一些实施例中,具有本文所述的特征的变体cas12i2多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0939]
在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)降低的酶活性和(b)增强的rna指导物结合活性的变体cas12i2多肽。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)增加的酶活性和(b)增强的rna指导物结合活性的变体cas12i2多肽。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)保留的酶活性和(b)增强的rna指导物结合活性的变体cas12i2多肽。在一些实施例中,具有本文所述的特征的变体cas12i2多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0940]
在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)降低的酶活性和(b)增强的rna指导物结合特异性的变体cas12i2多肽。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)增加的酶活性和(b)增强的rna指导物结合特异性的变体cas12i2多肽。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)保留的酶活性和(b)增强的rna指导物结合特异性的变体cas12i2多肽。在一些实施例中,具有本文所述的特征的变体cas12i2多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0941]
在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)降低的酶活性和(b)增强的蛋白质-rna相互作用的变体cas12i2多肽。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相
对于seq id no:2的亲本多肽表现出(a)增加的酶活性和(b)增强的蛋白质-rna相互作用的变体cas12i2多肽。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)保留的酶活性和(b)增强的蛋白质-rna相互作用的变体cas12i2多肽。在一些实施例中,具有本文所述的特征的变体cas12i2多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0942]
在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)降低的酶活性和(b)增强的蛋白质稳定性的变体cas12i2多肽。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)增加的酶活性和(b)增强的蛋白质稳定性的变体cas12i2多肽。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)保留的酶活性和(b)增强的蛋白质稳定性的变体cas12i2多肽。在一些实施例中,具有本文所述的特征的变体cas12i2多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0943]
在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)降低的酶活性和(b)降低的与rna指导物的解离的变体cas12i2多肽。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)增加的酶活性和(b)降低的与rna指导物的解离的变体cas12i2多肽。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)保留的酶活性和(b)降低的与rna指导物的解离的变体cas12i2多肽。在一些实施例中,具有本文所述的特征的变体cas12i2多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0944]
在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)降低的酶活性和(b)增强的三元复合物形成的变体cas12i2多肽。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)增加的酶活性和(b)增强的三元复合物形成的变体cas12i2多肽。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生相对于seq id no:2的亲本多肽表现出(a)保留的酶活性和(b)增强的三元复合物形成的变体cas12i2多肽。在一些实施例中,具有本文所述的特征的变体cas12i2多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0945]
在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生形成变体二元复合物的变体cas12i2多肽,该变体二元复合物相对于包含seq id no:2的多肽的亲本二元复合物表现出(a)降低的酶活性和(b)增强的对靶核酸的结合亲和力。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生形成变体二元复合物的变体cas12i2多肽,该变体二元复合物相对于包含seq id no:2的多肽的亲本二元复合物表现出(a)增加的酶活性和(b)增强的对靶核酸的结合亲和力。在一些实施例中,将至少一种改变
引入seq id no:2的亲本多肽中以产生形成变体二元复合物的变体cas12i2多肽,该变体二元复合物相对于包含seq id no:2的多肽的亲本二元复合物表现出(a)保留的酶活性和(b)增强的对靶核酸的结合亲和力。在一些实施例中,具有本文所述的特征的变体cas12i2多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0946]
在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生形成变体二元复合物的变体cas12i2多肽,该变体二元复合物相对于包含seq id no:2的多肽的亲本二元复合物表现出(a)降低的酶活性和(b)增强的在靶结合活性。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生形成变体二元复合物的变体cas12i2多肽,该变体二元复合物相对于包含seq id no:2的多肽的亲本二元复合物表现出(a)增加的酶活性和(b)增强的在靶结合活性。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生形成变体二元复合物的变体cas12i2多肽,该变体二元复合物相对于包含seq id no:2的多肽的亲本二元复合物表现出(a)保留的酶活性和(b)增强的在靶结合活性。在一些实施例中,具有本文所述的特征的变体cas12i2多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0947]
在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生形成变体二元复合物的变体cas12i2多肽,该变体二元复合物相对于包含seq id no:2的多肽的亲本二元复合物表现出(a)降低的酶活性和(b)增强的在靶结合特异性。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生形成变体二元复合物的变体cas12i2多肽,该变体二元复合物相对于包含seq id no:2的多肽的亲本二元复合物表现出(a)增加的酶活性和(b)增强的在靶结合特异性。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生形成变体二元复合物的变体cas12i2多肽,该变体二元复合物相对于包含seq id no:2的多肽的亲本二元复合物表现出(a)保留的酶活性和(b)增强的在靶结合特异性。在一些实施例中,具有本文所述的特征的变体cas12i2多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0948]
在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生形成变体二元复合物的变体cas12i2多肽,该变体二元复合物相对于包含seq id no:2的多肽的亲本二元复合物表现出(a)降低的酶活性和(b)降低的与非靶核酸的脱靶结合。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生形成变体二元复合物的变体cas12i2多肽,该变体二元复合物相对于包含seq id no:2的多肽的亲本二元复合物表现出(a)增加的酶活性和(b)降低的与非靶核酸的脱靶结合。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生形成变体二元复合物的变体cas12i2多肽,该变体二元复合物相对于包含seq id no:2的多肽的亲本二元复合物表现出(a)保留的酶活性和(b)降低的与非靶核酸的脱靶结合。在一些实施例中,具有本文所述的特征的变体cas12i2多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序
列。
[0949]
在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生形成变体二元复合物的变体cas12i2多肽,该变体二元复合物相对于包含seq id no:2的多肽的亲本二元复合物表现出(a)降低的酶活性和(b)增强的与靶核酸的解离。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生形成变体二元复合物的变体cas12i2多肽,该变体二元复合物相对于包含seq id no:2的多肽的亲本二元复合物表现出(a)增加的酶活性和(b)增强的与靶核酸的解离。在一些实施例中,将至少一种改变引入seq id no:2的亲本多肽中以产生形成变体二元复合物的变体cas12i2多肽,该变体二元复合物相对于包含seq id no:2的多肽的亲本二元复合物表现出(a)保留的酶活性和(b)增强的与靶核酸的解离。在一些实施例中,具有本文所述的特征的变体cas12i2多肽包含与seq id no:3-146和495-512中的任一个具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
[0950]
变体二元复合
[0951]
通常,变体cas12i2多肽和rna指导物以约1:1的摩尔比彼此结合以形成变体二元复合物。变体cas12i2多肽和rna指导物(单独或一起)不会天然存在。
[0952]
在一些实施例中,变体cas12i2多肽可以在宿主细胞中过表达并如本文所述对其进行纯化,然后使其与rna指导物复合(例如,在试管中)以形成变体效应子rnp(例如,变体二元复合物)。
[0953]
在一些实施例中,变体二元复合物在一定孵育时间范围内表现出增加的对靶核酸的结合亲和力、增加的在靶结合活性、增加的在靶结合特异性、增加的与靶核酸的三元复合物形成和/或增加的稳定性。在一些实施例中,变体二元复合物在一定孵育时间范围内表现出降低的与非靶核酸的脱靶结合和/或降低的与靶核酸的解离。在一些实施例中,变体二元复合物在一定孵育时间范围内表现出增加的靶核酸复合物形成、靶核酸活性和/或靶核酸特异性。
[0954]
在一些实施例中,二元复合物的复合可在约20℃至约55℃范围内的温度下(例如,约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃或55℃中的任一个)发生。在一些实施例中,变体cas12i2多肽在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内不从rna指导物解离或与游离rna结合。在一些实施例中,在二元复合物形成后,变体效应子核糖核蛋白复合物不与不同的rna交换rna指导物。
[0955]
在一些实施例中,使变体cas12i2多肽和rna指导物在二元复合缓冲液中复合。在一些实施例中,将变体cas12i2多肽储存在被二元复合缓冲液替代的缓冲液中以与rna指导物形成复合物。在一些实施例中,将变体cas12i2多肽储存在二元复合缓冲液中。
[0956]
在一些实施例中,二元复合缓冲液具有约7.3至8.6范围内的ph。在一个实施例中,二元复合缓冲液的ph为约7.3。在一个实施例中,二元复合缓冲液的ph为约7.4。在一个实施例中,二元复合缓冲液的ph为约7.5。在一个实施例中,二元复合缓冲液的ph为约7.6。在一个实施例中,二元复合缓冲液的ph为约7.7。在一个实施例中,二元复合缓冲液的ph为约7.8。在一个实施例中,二元复合缓冲液的ph为约7.9。在一个实施例中,二元复合缓冲液的
ph为约8.0。在一个实施例中,二元复合缓冲液的ph为约8.1。在一个实施例中,二元复合缓冲液的ph为约8.2。在一个实施例中,二元复合缓冲液的ph为约8.3。在一个实施例中,二元复合缓冲液的ph为约8.4。在一个实施例中,二元复合缓冲液的ph为约8.5。在一个实施例中,二元复合缓冲液的ph为约8.6。
[0957]
变体cas12i2多肽的热稳定性可以在有利条件下(诸如添加rna指导物,例如结合rna指导物)增加。
[0958]
在一些实施例中,在如本文所述的纯化之前,变体cas12i2多肽可以在宿主细胞中过表达并与rna指导物复合。在一些实施例中,将编码变体cas12i2多肽的mrna或dna引入细胞中,使得变体cas12i2多肽在细胞中表达。还将rna指导物(其将变体cas12i2多肽引导到所需靶核酸)与单个mrna或dna构建体同时、分开或依次引入细胞中,使得在细胞中形成必需的核糖核蛋白复合物。
[0959]
评估变体二元复合物稳定性和功能性
[0960]
本文在某些实施例中提供了用于鉴定最佳变体cas12i2多肽/rna指导物复合物(本文称为变体二元复合物)的方法,这些方法包括(a)组合样品中的变体cas12i2多肽和rna指导物以形成变体二元复合物;(b)测量变体二元复合物的值;以及(c)如果变体二元复合物的值大于参考分子的值,则确定变体二元复合物相对于参考分子是最佳的。在一些实施例中,该值可包括但不限于稳定性测量结果(例如,tm值、热稳定性)、二元复合物形成速率、rna指导物结合特异性和/或复合物活性。
[0961]
在一些实施例中,通过以下步骤鉴定最佳变体cas12i2多肽/rna指导物复合物(即变体二元复合物):(a)组合样品中的变体cas12i2多肽和rna指导物以形成变体二元复合物;(b)检测变体二元复合物的tm值;以及(c)如果变体二元复合物的tm值比参考分子的tm值或tm参考值大至少8℃,则确定变体二元复合物是稳定的。
[0962]
涉及测量变体cas12i2多肽/rna指导物复合物(即变体二元复合物)的热稳定性的步骤的方法可包括但不限于确定变体二元复合物的稳定性的方法、确定促进稳定的变体二元复合物的条件的方法、筛选稳定的变体二元复合物的方法以及用于鉴定最佳grna以形成稳定的变体二元复合物的方法。在某些实施例中,可测量变体二元复合物的热稳定性值。
[0963]
另外,在某些实施例中,还可测量参考分子的热稳定性值。在某些实施例中,如果测量的变体二元复合物的热稳定性值大于测量的参考分子的热稳定性值或在相同实验条件下测量的热稳定性参考值,如本文所述,则可将变体二元复合物确定为稳定的。在某些实施例中,参考分子可以是缺少rna指导物的变体cas12i2多肽。
[0964]
在某些实施例中,测量的热稳定性值可以是变性温度值。在这些实施例中,热稳定性参考值是变性温度参考值。在某些实施例中,测量的热稳定性值可以是tm值。在这些实施例中,热稳定性参考值可以是tm参考值。在某些实施例中,可使用热转变测定来测量热稳定性值。在某些实施例中,用于测量热稳定性的测定可涉及本文所述的技术,包括但不限于热变性测定、热转变测定、差示扫描量热法(dsc)、差示扫描荧光测定法(dsf)、等温滴定量热法(itc)、脉冲追踪法、漂白追踪法、放线菌酮追踪法、圆二色性(cd)光谱法、结晶和基于荧光的活性测定。
[0965]
在某些实施例中,如果变体二元复合物的变体cas12i2多肽/rna指导物复合物形成速率、rna指导物结合特异性和/或复合物活性大于参考分子的值或参考值(例如,亲本多
肽/rna指导物复合物(本文称为亲本二元复合物)的值),则可鉴定变体二元复合物。例如,在某些实施例中,如果变体二元复合物的变体cas12i2多肽/rna指导物复合物形成速率、rna指导物结合特异性和/或复合物活性的值比参考分子的值或参考值(例如,亲本二元复合物的值)大至少x%,则可鉴定变体二元复合物。在某些实施例中,本文所述的方法可进一步包括包括测量如本文所述的变体二元复合物的活性的步骤。
[0966]
变体三元复合
[0967]
在一些实施例中,如本文所述的变体cas12i2多肽、rna指导物和靶核酸形成变体三元复合物(例如,在试管或细胞中)。通常,变体cas12i2多肽、rna指导物和靶核酸以约1:1:1的摩尔比彼此缔合以形成变体三元复合物。变体cas12i2多肽、rna指导物和靶核酸(单独或一起)不会天然存在。
[0968]
在一些实施例中,如本文所述的变体二元复合物(例如,变体cas12i2多肽和rna指导物的复合物)进一步与靶核酸复合(例如,在试管或细胞中)以形成变体三元复合物。
[0969]
在一些实施例中,三元复合物的复合在约20℃至约55℃范围内的温度下(例如,约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃或55℃中的任一个)发生。在一些实施例中,变体二元复合物在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内不从靶核酸解离或与游离核酸(例如,游离dna)结合。在一些实施例中,在三元复合物形成后,变体二元复合物不与不同的核酸交换靶核酸。
[0970]
在一些实施例中,变体cas12i2多肽、rna指导物和靶核酸在三元复合缓冲液中复合。在一些实施例中,将变体cas12i2多肽储存在用三元复合缓冲液替代的缓冲液中以与rna指导物和靶核酸形成复合物。在一些实施例中,将变体cas12i2多肽储存在三元复合缓冲液中。
[0971]
在一些实施例中,变体二元复合物和靶核酸在三元复合缓冲液中复合。在一些实施例中,将变体二元复合物储存在用三元复合缓冲液替代的缓冲液中以与靶核酸形成复合物。在一些实施例中,将变体二元复合物储存在三元复合缓冲液中。
[0972]
在一些实施例中,三元复合缓冲液具有约7.3至8.6范围内的ph。在一个实施例中,三元复合缓冲液的ph为约7.3。在一个实施例中,三元复合缓冲液的ph为约7.4。在一个实施例中,三元复合缓冲液的ph为约7.5。在一个实施例中,三元复合缓冲液的ph为约7.6。在一个实施例中,三元复合缓冲液的ph为约7.7。在一个实施例中,三元复合缓冲液的ph为约7.8。在一个实施例中,三元复合缓冲液的ph为约7.9。在一个实施例中,三元复合缓冲液的ph为约8.0。在一个实施例中,三元复合缓冲液的ph为约8.1。在一个实施例中,三元复合缓冲液的ph为约8.2。在一个实施例中,三元复合缓冲液的ph为约8.3。在一个实施例中,三元复合缓冲液的ph为约8.4。在一个实施例中,三元复合缓冲液的ph为约8.5。在一个实施例中,三元复合缓冲液的ph为约8.6。
[0973]
变体cas12i2多肽的热稳定性可以在有利条件下(诸如添加rna指导物和靶核酸)增加。
[0974]
评估变体三元复合物稳定性和功能性
[0975]
本文在某些实施例中提供了用于鉴定最佳变体三元复合物的方法,这些方法包括
(a)组合样品中的变体cas12i2多肽、rna指导物和靶核酸以形成变体三元复合物;(b)测量变体三元复合物的值;以及(c)如果变体三元复合物的值大于参考分子的值,则确定变体三元复合物相对于参考分子是最佳的。在一些实施例中,该值可包括但不限于稳定性测量结果(例如,tm值、热稳定性)、三元复合物形成速率、dna结合亲和力测量结果、dna结合特异性测量结果和/或复合物活性测量结果(例如,核酸酶活性测量结果)。
[0976]
在一些实施例中,通过以下步骤鉴定最佳变体三元复合物:(a)组合样品中的变体cas12i2多肽、rna指导物和靶核酸以形成变体三元复合物;(b)检测变体三元复合物的tm值;以及(c)如果变体三元复合物的tm值比参考分子的tm值或tm参考值大至少8℃,则确定变体三元复合物是稳定的。
[0977]
涉及测量变体三元复合物的热稳定性的步骤的方法可包括但不限于确定变体三元复合物的稳定性的方法、确定促进稳定的变体三元复合物的条件的方法、筛选稳定的变体三元复合物的方法以及用于鉴定最佳二元复合物以形成稳定的变体三元复合物的方法。在某些实施例中,可测量变体三元复合物的热稳定性值。
[0978]
另外,在某些实施例中,还可测量参考分子的热稳定性值。在某些实施例中,如果测量的变体三元复合物的热稳定性值大于测量的参考分子的热稳定性值或在相同实验条件下测量的热稳定性参考值,如本文所述,则可将变体三元复合物确定为稳定的。在某些实施例中,参考分子可以是缺少rna指导物和/或靶核酸的变体cas12i2多肽。
[0979]
在某些实施例中,测量的热稳定性值可以是变性温度值。在这些实施例中,热稳定性参考值是变性温度参考值。在某些实施例中,测量的热稳定性值可以是tm值。在这些实施例中,热稳定性参考值可以是tm参考值。在某些实施例中,可使用热转变测定来测量热稳定性值。在某些实施例中,用于测量热稳定性的测定可涉及本文所述的技术,包括但不限于差示扫描荧光测定法(dsf)、差示扫描量热法(dsc)或等温滴定量热法(itc)。
[0980]
在某些实施例中,如果变体三元复合物的三元复合物形成速率、dna结合亲和力、dna结合特异性和/或复合物活性(例如,核酸酶活性)大于参考分子的值或参考值(例如,亲本三元复合物的值),则可鉴定变体三元复合物。例如,在某些实施例中,如果变体三元复合物的三元复合物形成速率、dna结合亲和力、dna结合特异性和/或复合物活性的值比参考分子的值或参考值(例如,亲本三元复合物的值)大至少x%,则可鉴定变体三元复合物。在某些实施例中,本文所述的方法可进一步包括包括测量如本文所述的变体三元复合物的活性的步骤。
[0981]
递送
[0982]
可将本文所述的组合物或复合物配制成例如包括载剂(诸如载剂和/或聚合物载剂,例如脂质体),并且通过已知方法递送到细胞(例如,原核细胞、真核细胞、植物细胞、哺乳动物细胞等)。此类方法包括但不限于转染(例如,脂质介导、阳离子聚合物、磷酸钙、树枝状大分子);电穿孔或其他破坏膜的方法(例如,核转染)、病毒递送(例如,慢病毒、逆转录病毒、腺病毒、aav)、显微注射、微粒轰击(“基因枪”)、fugene、直接声波加载、细胞挤压、光转染、原生质体融合、刺穿感染、磁转染、外来体介导的转移、脂质纳米颗粒介导的转移以及它们的任何组合。
[0983]
在一些实施例中,该方法包括将一种或多种核酸(例如,编码变体cas12i2多肽的核酸、rna指导物、供体dna等)、它们的一种或多种转录物和/或预形成的变体cas12i2多肽/
rna指导物复合物(即,变体二元复合物)递送到细胞。示例性细胞内递送方法包括但不限于:病毒或病毒样药剂;基于化学的转染方法,诸如使用磷酸钙、树枝状大分子、脂质体或阳离子聚合物(例如,deae-葡聚糖或聚乙烯亚胺)的转染方法;非化学方法,诸如显微注射、电穿孔、细胞挤压、声孔效应、光转染、刺穿感染、原生质体融合、细菌缀合、质粒或转座子的递送;基于粒子的方法,诸如使用基因枪、磁转染或磁辅助转染、粒子轰击;以及混合方法,诸如核转染。在一些实施例中,本技术进一步提供了通过此类方法产生的细胞,以及包含此类细胞的或由此类细胞产生的生物体(例如,动物、植物或真菌)。
[0984]
细胞
[0985]
可将本文所述的组合物或复合物递送到多种细胞。在一些实施例中,细胞是分离的细胞。在一些实施例中,细胞在细胞培养物中。在一些实施例中,细胞是离体的。在一些实施例中,细胞从活生物体获得并且维持在细胞培养物中。在一些实施例中,细胞是单细胞生物体。
[0986]
在一些实施例中,细胞是原核细胞。在一些实施例中,细胞是细菌细胞或来源于细菌细胞。在一些实施例中,细菌细胞与亲本多肽所来源的细菌物种无关。在一些实施例中,细胞是古细菌细胞或来源于古细菌细胞。在一些实施例中,细胞是真核细胞。在一些实施例中,细胞是植物细胞或来源于植物细胞。在一些实施例中,细胞是真菌细胞或来源于真菌细胞。在一些实施例中,细胞是动物细胞或来源于动物细胞。在一些实施例中,细胞是无脊椎动物细胞或来源于无脊椎动物细胞。在一些实施例中,细胞是脊椎动物细胞或来源于脊椎动物细胞。在一些实施例中,细胞是哺乳动物细胞或来源于哺乳动物细胞。在一些实施例中,细胞是人细胞。在一些实施例中,细胞是斑马鱼细胞。在一些实施例中,细胞是啮齿动物细胞。在一些实施例中,细胞是合成制成的,有时称为人工细胞。
[0987]
在一些实施例中,细胞来源于细胞系。用于组织培养的多种多样的细胞系是本领域已知的。细胞系的实例包括但不限于293t、mf7、k562、hela以及它们的转基因品种。细胞系可从本领域技术人员已知的多种来源获得(例如,参见美国典型培养物保藏中心(atcc)(弗吉尼亚州马纳萨斯(manassas,va.)))。在一些实施例中,将用本文所述的一种或多种核酸(诸如ago编码载体和gdna)或ago-gdna复合物转染的细胞用于建立包含一种或多种载体来源的序列的新细胞系,以建立包含对靶核酸的修饰的新细胞系。在一些实施例中,将用本文所述的一种或多种核酸(诸如变体cas12i2多肽编码载体和rna指导物)或变体cas12i2多肽/rna指导物复合物(即变体二元复合物)瞬时或非瞬时转染的细胞或者来源于此类细胞的细胞系用于评估一种或多种测试化合物。
[0988]
在一些实施例中,细胞是原代细胞。例如,可以将原代细胞的培养物传代0次、1次、2次、4次、5次、10次、15次或更多次。在一些实施例中,通过任何已知方法从个体收获原代细胞。例如,可通过单采、白细胞单采、密度梯度分离等收获白细胞。可以通过活检收集组织(诸如皮肤、肌肉、骨髓、脾、肝、胰腺、肺、肠、胃等)的细胞。可使用合适的溶液来分散或悬浮收获的细胞。这种溶液通常可以是平衡盐溶液(例如,生理盐水、磷酸盐缓冲盐水(pbs)、汉克平衡盐溶液等),方便地补充有胎牛血清或其他天然存在的因子,连同低浓度的可接受的缓冲液。缓冲液可以包括hepes、磷酸盐缓冲液、乳酸盐缓冲液等。可立即使用细胞,或者可将它们储存起来(例如,通过冷冻)。冷冻细胞可以解冻并且能够重复使用。可以将细胞冷冻在dmso、血清、培养基缓冲液(例如,10%dmso、50%血清、40%缓冲培养基)和/或用于在冷
冻温度下保存细胞的一些其他这样的常用溶液中。
[0989]
在一些实施例中,变体cas12i2多肽具有诱导靶核酸(例如,基因组dna)中的双链断裂或单链断裂的核酸酶活性。双链断裂可以刺激细胞内源dna修复途径,包括同源定向重组(hdr)、非同源末端连接(nhej)或替代性非同源末端连接(a-nhej)。nhej可以修复裂解的靶核酸,而无需同源模板。这可以导致一个或多个核苷酸缺失或插入靶核酸中。hdr可以与同源模板(诸如供体dna)一起发生。同源模板可以包含与靶核酸裂解位点两侧的序列同源的序列。在一些情况下,hdr可以将外源多核苷酸序列插入裂解的靶基因座中。由于nhej和/或hdr引起的对靶dna的修饰可以导致例如突变、缺失、改变、整合、基因矫正、基因替换、基因标记、转基因敲入、基因破坏和/或基因敲除。
[0990]
在一些实施例中,使细胞培养同步以提高这些方法的效率。在一些实施例中,将处于s和g2期的细胞用于hdr介导的基因编辑。在一些实施例中,可以使细胞在任何细胞周期经受该方法。在一些实施例中,细胞过度铺板显著降低了该方法的功效。在一些实施例中,该方法以不超过约40%、45%、50%、55%、60%、65%或70%汇合度中的任一个应用于细胞培养物。
[0991]
在一些实施例中,变体cas12i2多肽/rna指导物复合物(即变体二元复合物)在细胞中与靶核酸的结合募集除dna修复途径之外的一种或多种内源性细胞分子或途径以修饰靶核酸。在一些实施例中,变体二元复合物的结合阻断一种或多种内源性细胞分子或途径接近靶核酸,从而修饰靶核酸。例如,变体二元复合物的结合可阻断内源性转录或翻译机器以降低靶核酸的表达。
[0992]
在一些实施例中,递送变体cas12i2多肽基本上不影响细胞的活力。在一些实施例中,在递送变体cas12i2多肽后,细胞保持存活。在一些实施例中,在递送变体cas12i2多肽后,细胞保持存活至少1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、23小时、24小时、36小时、48小时、60小时、72小时或更长时间。在一些实施例中,在递送变体cas12i2多肽后,至少70%(例如,71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的多个细胞保持存活。在一些实施例中,在递送变体cas12i2多肽后,至少70%(例如,71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的多个细胞保持存活至少1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、23小时、24小时、36小时、48小时、60小时、72小时或更长时间。在一些实施例中,在递送变体cas12i2多肽后,至少80%(例如,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的多个细胞保持存活。在一些实施例中,在递送变体cas12i2多肽后,至少80%(例如,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的多个细胞保持存活至少1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小
时、22小时、23小时、24小时、36小时、48小时、60小时、72小时或更长时间。在一些实施例中,在递送变体cas12i2多肽后,至少90%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的多个细胞保持存活。在一些实施例中,在递送变体cas12i2多肽后,至少90%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的多个细胞保持存活至少1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、23小时、24小时、36小时、48小时、60小时、72小时或更长时间。
[0993]
在一些实施例中,递送变体cas12i2二元复合物(例如,rnp)基本上不影响细胞的活力。在一些实施例中,在递送变体cas12i2二元复合物(例如,rnp)后,细胞保持存活。在一些实施例中,在递送变体cas12i2二元复合物(例如,rnp)后,细胞保持存活至少1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、23小时、24小时、36小时、48小时、60小时、72小时或更长时间。在一些实施例中,在递送变体cas12i2二元复合物(例如,rnp)后,至少70%(例如,71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的多个细胞保持存活。在一些实施例中,在递送变体cas12i2二元复合物(例如,rnp)后,至少70%(例如,71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的多个细胞保持存活至少1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、23小时、24小时、36小时、48小时、60小时、72小时或更长时间。在一些实施例中,在递送变体cas12i2二元复合物(例如,rnp)后,至少80%(例如,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的多个细胞保持存活。在一些实施例中,在递送变体cas12i2二元复合物(例如,rnp)后,至少80%(例如,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的多个细胞保持存活至少1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、23小时、24小时、36小时、48小时、60小时、72小时或更长时间。在一些实施例中,在递送变体cas12i2二元复合物(例如,rnp)后,至少90%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的多个细胞保持存活。在一些实施例中,在递送变体cas12i2二元复合物(例如,rnp)后,至少90%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的多个细胞保持存活至少1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、23小时、24小时、36小时、48小时、60小时、72小时或更长时间。
[0994]
试剂盒
[0995]
本发明还提供了可以用于例如实施本文所述的方法的试剂盒。在一些实施例中,试剂盒包括本发明的变体cas12i2多肽,例如包含表2的取代的变体或表3的变体多肽。在一
些实施例中,试剂盒包括编码这种变体cas12i2多肽的多核苷酸,并且任选地多核苷酸包含在例如如本文所述的载体内。试剂盒还可以任选地包括例如如本文所述的rna指导物。本发明的试剂盒的rna指导物可以被设计成靶向感兴趣的序列,如本领域已知的。可以将效应子变体和rna指导物包装在试剂盒内的同一小瓶或其他容器内,或者可以包装在单独的小瓶或其他容器中,可以在使用前混合它们的内容物。试剂盒可以另外任选地包括缓冲液以及/或者使用效应子变体和/或rna指导物的说明书。
[0996]
本文引用的所有参考文献和出版物特此通过援引并入。
[0997]
实例
[0998]
提供以下实例以进一步说明本发明的一些实施例但并非旨在限制本发明的范围;通过它们的示例性性质将理解,可替代性地使用本领域技术人员已知的其他程序、方法或技术。
[0999]
实例1—cas12i2变体构建体的工程化
[1000]
在本实例中,产生了cas12i2变体构建体。
[1001]
使用从idt订购的诱变正向引物和诱变反向引物,经由两个pcr步骤(图2)构建包含单突变的dna模板。在第一步骤中,在384孔板中进行两组pcr反应以产生两个片段。两个pcr片段的重叠区域含有所需的单突变并允许经由第二pcr装配整个dna模板。在第二步骤中,将来自第一步骤的纯化片段用作重叠pcr(ol pcr)的模板,并将与退火至载体主链的fw和rv寡核苷酸用作ol pcr引物。所得的线性dna模板含有t7启动子、t7终止子和cas12i2效应子的开放阅读框。
[1002]
将这些线性dna模板直接用于无细胞转录和翻译系统以表达含有单突变的cas12i2效应子变体。将变体构建体进一步单独转移到瞬时转染载体中。另外,通过pcr制备包含组合突变的dna模板,随后将其转移到瞬时转染载体中。
[1003]
实例2—用于变体cas12i2二元复合物检测的荧光偏振测定
[1004]
在本实例中,通过荧光偏振测定来评估cas12i2多肽(野生型或变体cas12i2)和rna指导物形成二元复合物的能力。
[1005]
通过idt合成线性ssdna片段,这些片段包含成熟cas12i2同向重复序列上游的t7 rna聚合酶启动子序列的反向补体和期望的20bp rna指导物靶。然后通过将通用t7正向寡核苷酸(95-4℃,以5℃/分钟)退火至反向补体ssdna并在25℃下用klenow片段(新英格兰生物实验室公司(new england biolabs))填充15分钟来产生线性dsdna体外转录(ivt)模板。然后使用hiscribe t7 high yield rna合成试剂盒(新英格兰生物实验室公司)在37℃下将所得ivt模板转录成rna指导物,持续4小时。转录后,使用rna清洁和浓缩试剂盒(rna clean and concentrator kit)(兹莫公司(zymo))纯化每个rna指导物并将其储存在-20℃下直至使用。
[1006]
然后用6-羧基荧光素(6-fam)(idt)标记rna指导物。用增加浓度的标记rna指导物(7.5-250nm)滴定1x测定缓冲液(20mm tris-hcl(ph 7.5)、150mm kcl、5mm mgcl2、1mm dtt)中的25nm cas12i2多肽(野生型或变体cas12i2)。将复合物在37℃下孵育30分钟,然后使用酶标仪(infinite 200pro,帝肯公司(tecan))进行荧光偏振测量。
[1007]
还研究了不同温度下的二元复合物形成。如上所述的进一步结合实验在25℃、50℃、60℃和70℃下等温进行。
tcep)中。经由细胞破裂器(恒定系统有限公司(constant system limited))裂解细胞,然后在4℃下以20,000x g离心20分钟以澄清裂解物。将0.2%聚乙烯亚胺(pei)添加到澄清的裂解物中,并在4℃下以恒定的端对端旋转孵育20分钟。然后将裂解物以20,000x g再次离心10分钟。经由离子交换色谱纯化裂解物。纯化后,使级分在sds-page凝胶上运行,合并含有适当大小蛋白质的级分并使用30kd amicon ultra15离心装置浓缩。将蛋白质缓冲液交换到12.5mm hepes ph 7.0、120mm nacl、0.5mm tcep和50%甘油中。然后使用nanodrop(赛默飞世尔公司)测量浓度,并将蛋白质储存在-20℃下。
[1020]
使用2:1比率的合成crrna(埃德特生物科技公司(integrated dna technologies))与蛋白质来制备rnp。使rnp在37℃下在1x neb2缓冲液(50mm nacl、10mm tris-hcl、10mm mgcl2、1mm dtt,ph 7.9)中复合30分钟。复合后,使用1x neb2作为稀释缓冲液稀释rnp。以相同的方式制备apo反应(无rna指导物的蛋白质),用h2o补足crrna的体积。
[1021]
将靶dsdna底物(埃德特生物科技公司)以20nm添加到rnp和apo样品中。将反应充分混合,然后在37℃下孵育1小时,然后用1μl 20mg/ml蛋白酶k(赛默飞世尔公司)淬灭。将反应在50℃下再孵育15分钟,然后使整个反应在2%琼脂糖e-凝胶(赛默飞世尔公司)上运行。在gel doc ez凝胶成像仪(伯乐公司(biorad))上通过溴化乙锭使凝胶可视化。
[1022]
测量两种类型的条带的强度:1)全长(未裂解)dna条带和2)一个或多个下移的裂解dna条带。无活性rnp以全长dna条带为特征。活性rnp产生一个或多个下移的裂解dna条带。随着活性rnp的浓度降低,全长条带的强度增加,并且所述一个或多个裂解条带的强度降低。在比较多个rnp的活性时,具有比另一个更高活性的rnp的特征在于在较低rnp浓度下更强的裂解条带。
[1023]
本实例的方法允许比较野生型或变体cas12i2 rnp(二元复合物)对靶dna的体外裂解活性。
[1024]
实例5—变体cas12i2多肽和变体cas12i2二元复合物的体外稳定性测定
[1025]
在本实例中,评估了cas12i2(野生型或变体cas12i2)rnp的稳定性。
[1026]
对于加速稳定性研究,以与实例4中所述相同的方式产生rnp(5μm),随后将样品在25℃下储存48小时。
[1027]
对rnp样品进行体外裂解测定(如实例4中所述)。将这些结果与实例4的结果进行比较以确定在25℃下储存48小时的cas12i2rnp(野生型或变体cas12i2 rnp)保持生物化学活性的程度。
[1028]
也将apo多肽(无rna指导物)在25℃下孵育48小时。使用实例3中所述的方法对apo样品进行rna emsa测定。将这些结果与实例3的结果进行比较以确定cas12i2(野生型或变体cas12i2)能够与rna指导物形成二元复合物的程度。
[1029]
使用实例4中所述的方法,使在25℃下孵育48小时的apo样品也与rna指导物复合以形成rnp。然后根据实例4的方法进行体外裂解测定。将测定结果与实例4的测定结果进行比较以评估在25℃下孵育的与蛋白质形成的cas12i2 rnp的活性水平。
[1030]
本实例的方法允许比较野生型和变体cas12i2多肽以及野生型和变体cas12i2 rnp(二元复合物)的稳定性。证明与rna指导物的特异性结合比另一种cas12i2多肽与rna指导物的特异性结合更大的cas12i2多肽指示更稳定的多肽。证明靶dna的体外裂解比另一种
cas12i2多肽的裂解更稳健的cas12i2 rnp指示更稳定的二元复合物。
[1031]
实例6—用于变体cas12i2三元复合物检测的荧光偏振测定
[1032]
在本实例中,通过荧光偏振测定来评估rna指导物、cas12i2多肽(野生型或变体cas12i2)和靶dna分子形成三元复合物的能力。
[1033]
通过idt合成线性ssdna片段,这些片段包含成熟cas12i2同向重复序列上游的t7 rna聚合酶启动子序列的反向补体和期望的20bp rna指导物靶。然后通过将通用t7正向寡核苷酸(95-4℃,以5℃/分钟)退火至反向补体ssdna并在25℃下用klenow片段(新英格兰生物实验室公司(new england biolabs))填充15分钟来产生线性dsdna体外转录(ivt)模板。然后使用hiscribe t7 high yield rna合成试剂盒(新英格兰生物实验室公司)在37℃下将所得ivt模板转录成rna指导物,持续4小时。转录后,使用rna清洁和浓缩试剂盒(兹莫公司)纯化每个rna指导物并将其储存在-20℃下直至使用。
[1034]
为了产生rnp,将cas12i2多肽(野生型或变体cas12i2)和rna指导物以1:1.2的摩尔比组合,在1x测定缓冲液(20mm tris-hcl(ph 7.5)、150mm kcl、5mm mgcl2、1mm dtt)中的最终摩尔浓度为10μm rnp。将这些组分在37℃下孵育30分钟以允许rnp形成。
[1035]
将cas12i2 rnp(野生型或变体cas12i2 rnp)在测定缓冲液中稀释至1μm的工作浓度。从1μm至15.6nm产生7点2倍稀释。将cas12i2 rnp与6-fam标记的dna靶(idt)在37℃下孵育30分钟。孵育后,使用酶标仪(infinite 200pro,帝肯公司)测量荧光偏振值。
[1036]
为了评估不同温度下的三元复合物形成,在25℃、50℃、60℃和70℃的恒定温度下重复上述方案。
[1037]
cas12i2 rnp与靶dna的结合的特征在于荧光偏振值的变化。观察到三元复合物的形成随着时间和/或随着cas12i2浓度的增加而改变(例如,增加或减小)mp单位。
[1038]
本实例指示可以如何测定和比较野生型cas12i2 rnp与靶dna的结合亲和力以及cas12i2变体rnp与靶dna的结合亲和力。
[1039]
实例7—用于变体cas12i2三元复合物检测的dna电泳迁移率变动测定
[1040]
本实例描述了使用dna emsa来测定rna指导物、cas12i2多肽(野生型或变体cas12i2)和靶dna底物形成三元复合物的能力。
[1041]
将cas12i2载体转化到大肠杆菌bl21(de3)(新英格兰生物实验室公司)中,并使其在t7启动子下表达。使转化的细胞最初在5ml luria broth(泰克诺瓦公司)+50μg/ml卡那霉素中生长过夜,然后将其接种到1l terrific broth培养基(泰克诺瓦公司)+50μg/ml卡那霉素中。使细胞在37℃下生长直至od
600
为0.6-0.8,然后用0.5mm iptg诱导蛋白质表达。然后培养物在18℃下再生长14-18小时。收获培养物并经由离心沉淀,然后将每5g细胞沉淀重悬于1ml提取缓冲液(50mm hepes,ph 7.5,500mm nacl,5%甘油,0.5mm tcep)中。经由细胞破裂器(恒定系统有限公司(constant system limited))裂解细胞,然后在4℃下以20,000x g离心20分钟以澄清裂解物。将0.2%聚乙烯亚胺(pei)添加到澄清的裂解物中,并在4℃下以恒定的端对端旋转孵育20分钟。然后将裂解物以20,000x g再次离心10分钟。经由离子交换色谱纯化裂解物。纯化后,使级分在sds-page凝胶上运行,合并含有适当大小蛋白质的级分并使用30kd amicon ultra15离心装置浓缩。将蛋白质缓冲液交换到12.5mm hepes ph 7.0、120mm nacl、0.5mm tcep和50%甘油中。然后使用nanodrop(赛默飞世尔公司)测量浓度,并将蛋白质储存在-20℃下。
[1042]
使用2:1比率的合成rna指导物(埃德特生物科技公司)与多肽来制备rnp。rna指导物序列在表14中示出。crrna 1(seq id no:147)对应于靶1(seq id no:150),crrna 2(seq id no:148)对应于靶2(seq id no:151),并且crrna 3(seq id no:149)对应于靶3(seq id no:152)。使rnp在37℃下在1x neb2缓冲液(50mm nacl、10mm tris-hcl、10mm mgcl2、1mm dtt,ph 7.9)中复合30分钟。复合后,使用1x neb2作为稀释缓冲液进行从5μm到37.5μm的5点1:2连续稀释。以相同的方式制备apo反应(无rna指导物的多肽),用h2o补足rna指导物的体积。
[1043]
表14.dna emsa rna指导物序列。
[1044][1045]
使用表16中的引物,通过pcr从寡核苷酸(埃德特生物科技公司)产生表15中的序列的dsdna靶底物。在pcr之前,将正向引物的5'末端标记ir800染料,如yan等人,2018中所述。使用amplitaq gold(赛默飞世尔公司),然后用ir800标记的正向引物和未标记的反向引物扩增dsdna底物。将所得dsdna用dna清洁和浓缩试剂盒(兹莫公司)纯化,并通过nanodrop(赛默飞世尔公司)定量。
[1046]
表15.dna emsa靶底物。
[1047][1048][1049]
表16.用于dna emsa靶底物产生的引物。
neb2中从5μm连续稀释至37.5nm。然后将rnp和apo样品进一步以1:10稀释到1x neb2中,并以20nm添加靶dsdna底物。将反应充分混合,然后在37℃下孵育1小时,然后用1μl 20mg/ml蛋白酶k(赛默飞世尔公司)淬灭。将反应在50℃下再孵育15分钟,然后使整个反应在2%琼脂糖e-凝胶(赛默飞世尔公司)上运行。在gel doc ez凝胶成像仪(伯乐公司)上通过溴化乙锭使凝胶可视化。
[1066]
测量两种类型的条带的强度:1)全长(未裂解)dna条带和2)一个或多个下移的裂解dna条带。无活性rnp以全长dna条带为特征(例如,rnp不能与dna底物形成三元复合物)。活性rnp产生一个或多个下移的裂解dna条带(例如,rnp能够与dna底物形成三元复合物)。随着活性rnp的浓度降低,全长条带的强度增加,并且所述一个或多个裂解条带的强度降低。在比较多个rnp的活性时,具有比另一个更高活性的rnp的特征在于在较低rnp浓度下更强的裂解条带。
[1067]
本实例的方法允许比较野生型或变体cas12i2 rnp(二元复合物)对靶dna的体外裂解活性。裂解活性指示rnp(二元复合物)与靶dna形成三元复合物。
[1068]
实例9—变体cas12i2二元和三元复合物的体外稳定性测定
[1069]
在本实例中,评估了cas12i2(野生型或变体cas12i2)rnp的稳定性,其中cas12i2 rnp(二元复合物)能够与靶dna底物形成三元复合物。
[1070]
对于加速稳定性研究,以与实例7中所述相同的方式产生rnp(5μm),随后将样品在25℃下储存48小时。
[1071]
对rnp样品进行dna emsa测定(如实例7中所述)和体外裂解测定(如实例8中所述)。将这些结果与实例7和实例8的结果进行比较以确定在25℃下储存48小时的cas12i2 rnp(野生型或变体cas12i2 rnp)保留dna结合和裂解活性的程度。dna结合指示三元复合物的形成,并且裂解活性指示活性三元复合物。
[1072]
也将apo多肽(无rna指导物)在25℃下孵育48小时。然后使用实例7中所述的方法,使apo样品与rna指导物复合以形成rnp。然后分别根据实例7和实例8的方法进行dna emsa和体外裂解测定。将dna emsa结果与实例7的结果进行比较以确定cas12i2 rnp(在25℃下孵育预复合的cas12i2多肽后形成)能够与靶dna形成三元复合物的程度。此外,将体外裂解测定结果与实例8的结果进行比较以确定cas12i2 rnp(在25℃下孵育预复合的cas12i2多肽后形成)具有活性(例如,与靶dna形成功能性三元复合物)的程度。
[1073]
本实例的方法允许比较野生型和变体cas12i2多肽以及野生型和变体cas12i2 rnp(二元复合物)的稳定性。在本实例中,与证明对靶dna的体外裂解活性降低的cas12i2 rnp相比,保留对靶dna的体外裂解活性的cas12i2 rnp指示能够形成三元复合物的更稳定的二元复合物。
[1074]
实例10—cas12i2变体对gfp的体外靶向
[1075]
本实例描述了使用荧光耗减测定(fda)来测量野生型cas12i2和cas12i2变体的活性。
[1076]
在本测定中,被设计成靶向gfp的活性crispr系统结合并裂解编码gfp的双链dna区域,从而导致gfp荧光耗减。fda测定涉及体外转录和翻译,从而允许利用同向重复(dr)-间隔子-同向重复(dr)在t7启动子下从编码cas12i2多肽的dna模板和含有前crrna序列的dna模板产生rnp;间隔子靶向gfp。在相同一锅反应中,还作为靶和荧光报告分子两者产生
gfp和rfp(图4)。靶gfp质粒序列在seq id no:159中示出,并且荧光报告分子rfp质粒序列在seq id no:160中示出。使用tecan infinite f plex读板器在37℃下每20分钟测量gfp和rfp荧光值,持续12小时。由于未靶向rfp,因此其荧光不受影响,因此用作内部信号对照。
[1077]
设计总共20个gfp靶(加1个非靶)用于筛选野生型cas12i2和cas12i2变体的活性。用于fda测定的前crrna序列、靶序列和非靶对照序列在表17中列出。
[1078]
表17.fda测定的前crna和靶序列。
[1079]
[1080]
no:3的变体cas12i2用点划线描绘,并且seq id no:4的变体cas12i2用短划线描绘。
[1085]
在每个靶处,用seq id no:3的变体cas12i2或seq id no:4的变体cas12i2形成的rnp的耗减比大于用野生型cas12i2形成的rnp的耗减比。这表明在每个靶位点处cas12i2变体的比活性高于野生型cas12i2的比活性。
[1086]
此外,在若干靶(例如,top01、top05、top09、top10、bot02、bot03、bot04、bot09、bot10)处,野生型cas12i2的耗减比为1或约1,这表明野生型cas12i2在这些靶位点处不具有活性(即,任何测量的由非gfp靶向前crrna诱导的gfp耗减基本上等于由gfp靶向前crrna诱导的gfp耗减)。参见图5a、图5d、图5i、图5j、图5l、图5m、图5n、图5s和图5t。然而,在这些靶的每一个处,用seq id no:3的变体cas12i2或seq id no:4的变体cas12i2形成的rnp的耗减比大于1,这表明cas12i2变体在每个位点处耗减gfp信号都具有活性。因此,cas12i2变体能够靶向gfp上不能被野生型cas12i2靶向的位点。
[1087]
本实例表明与野生型cas12i2二元复合物相比,cas12i2变体二元复合物显示出增加的与gfp靶位点的三元复合物形成。本实例进一步表明cas12i2变体通过在不能被野生型cas12i2裂解的gfp靶位点处裂解双链dna来扩大靶向空间。此外,与野生型cas12i2相比,cas12i2变体在多个gfp靶位点处更有效地裂解双链dna。
[1088]
实例11—通过cas12i2变体靶向哺乳动物基因
[1089]
本实例描述了使用通过瞬时转染引入哺乳动物细胞中的野生型cas12i2和cas12i2变体对多个靶的插入缺失评估。
[1090]
将野生型cas12i2、seq id no:3的变体cas12i2和seq id no:4的变体cas12i2克隆到pcda3.1主链(英杰公司(invitrogen))中。然后将质粒大量制备并且稀释至1μg/μl。对于rna指导物制备,通过含有靶序列支架的超聚体(ultramer)和u6启动子衍生编码crrna的dsdna片段。将超聚体重悬于ph 7.5的10mm tris
·
hcl中至最终原液浓度为100μm。随后再次使用10mm tris
·
hcl将工作原液稀释至10μm以充当用于pcr反应的模板。将crrna的扩增在具有以下组分的50μl反应物中进行:0.02μl前面提及的模板、2.5μl正向引物、2.5μl反向引物、25μl neb hifi聚合酶和20μl水。循环条件是:1x(98℃下30s)、30x(98℃下10s,67℃下15s)、1x(72℃下2min)。将pcr产物用1.8x spri处理净化并且归一化至25ng/μl。制备的crrna序列及其相应的靶序列在表18中示出。
[1091]
表18.用于瞬时转染的crrna和靶序列。
[1092]
d10培养基添加至每个孔并且混合以重悬细胞。然后将细胞以500g旋转沉降10分钟,并且弃去上清液。将quickextract缓冲液添加至原始细胞悬浮液体积的量的1/5。将细胞在65℃下孵育15分钟,在68℃下孵育15分钟,并且在98℃下孵育10分钟。
[1095]
通过两轮pcr制备用于下一代测序的样品。使用第一轮(pcr1)来扩增根据靶的特定基因组区域。通过柱纯化对pcr1产物进行纯化。进行第2轮pcr(pcr2)以添加illumina衔接子和索引。然后将反应物池化并且通过柱纯化进行纯化。用150次循环nextseq v2.5中等或高输出试剂盒进行测序运行。
[1096]
图6a示出了野生型cas12i2、seq id no:3的变体cas12i2和seq id no:4的变体cas12i2靶向表18中的十五个遗传区域。编辑的靶被定义为显示出背景以上的插入缺失水平(在本测定中》0.5%,由点划线标记)的靶。在同一靶集合中,野生型cas12i2编辑背景以上15个靶中的10个,但不能编辑背景以上15个靶中的5个(图6a和图6b)。然而,seq id no:3的变体cas12i2和seq id no:4的变体cas12i2编辑背景以上15个靶中的每一个(图6a和图6b)。
[1097]
本实例表明与野生型cas12i2二元复合物相比,cas12i2变体二元复合物显示出增加的与靶哺乳动物基因的三元复合物形成。本实例进一步表明cas12i2变体通过在不能被野生型cas12i2编辑的靶中引入插入缺失来扩大靶向空间。
[1098]
实例12—通过cas12i2变体增加的插入缺失率
[1099]
本实例描述了与野生型cas12i2相比,cas12i2变体对多个靶的酶活性(例如,核酸酶)增加。
[1100]
如实例11所述制备cas12i2质粒和rna指导物。制备的crrna序列及其相应的靶序列在表19中示出。此外,转染并收获细胞,并且如实例11所述制备样品用于下一代测序。
[1101]
表19.用于瞬时转染的crrna和靶序列。
[1102][1103]
通过比较aavs1、emx1和vegfa处的插入缺失评估野生型cas12i2和变体cas12i2的性能。如图7a、图7b和图7c所示,与野生型cas12i2相比,cas12i2变体分别在aavs1靶、emx1靶和vegfa靶处增加了插入缺失率。点划线划分aavs1、emx1和vegfa处的cas12i2插入缺失率。对应于图7a的条形图中每个条的cas12i2变体的序列标识符在表20中指示,并且对应于图7b和图7c的条形图中每个条的cas12i2变体的序列标识符在表21中指示。
[1104]
表20.用于aavs1的插入缺失测定中的cas12i2变体序列(图7a)。
[1105][1106][1107]
表21.用于emx1(图7b)和vegfa(图7c)的插入缺失测定中的cas12i2变体序列。
[1108]
[1109][1110]
本实例表明与野生型cas12i2二元复合物相比,cas12i2变体二元复合物显示出增加的与靶哺乳动物基因的三元复合物形成。此外,与野生型cas12i2相比,cas12i2变体不仅在不能被野生型cas12i2靶向的靶基因座处引入插入缺失(实例11),而且cas12i2变体在多个靶基因座处具有增加的酶活性。
[1111]
实例13—用cas12i2变体进行有效免疫细胞编辑
[1112]
本实例描述了rnp转染,然后进行facs染色并使用工程化变体cas12i2核酸酶(seq id no:4)和spcas9对照在原代t细胞中对多个靶进行插入缺失评估。
[1113]
crispr rna指导的核酸酶因其在革新工程化细胞疗法的现有离体方法中的作用而获得相当大的兴趣。在这里,我们提出了一种新颖的工程化v型crispr-cas变体cas12i,作为广泛使用的cas9和cpf1 crispr核酸酶系统的替代物。尽管已经详细研究了亚型v-a(cas12a,也称为cpf1)和v-b(cas12b)的效应子,但未表征的cas12蛋白的不同结构域结构和分化的ruvc序列表明尚未探索的功能多样性(yan等人,science[科学]363(6422):88-91,2019)。为了揭示这种功能多样性,对cas12i的严格表征揭示了在治疗上区别于经典基因修饰核酸酶的属性,包括紧凑大小(1054个氨基酸的蛋白质、43个核苷酸的无tracr的指导物rna)、最佳富含t的pam在哺乳动物细胞中的验证、独特的编辑结果和复用的潜力。我们对cas12i的工程化变体进行了高通量评价,得到比原始cas12i产生明显增加(约40倍)的活性并且与spcas9相比具有增强的特异性的cas12i变体。rnp介导的将cas12i变体递送到靶向治疗相关基因座的t细胞揭示了稳健的编辑(在多个靶和供体中插入缺失》90%)。另外,使用计算机预测与靶向ngs测序相结合的特异性研究证明了cas12i变体的稳健活性和特异
性。总之,这些数据表明cas12i的这种变体具有独特的差异化,可实现稳健且精确的工程细胞疗法。这些研究的细节如下。
[1114]
将来自三个单个供体的cd3+t细胞复苏,并使用自动细胞计数器进行计数。收集来自每个供体的样品,并分别进行cd3ε和dapi染色以用于表面表达和活力的流式细胞术分析。将细胞密度调节至1e6个细胞/ml,并将细胞用抗cd3:cd28的混合物刺激3天。
[1115]
通过以1:1(效应子:crrna)的体积比(2.5:1crrna:效应子摩尔比)混合纯化的变体cas12i2(400μm;seq id no:4)与crrna(在250mm nacl中为1mm;参见表13和14中的序列)进行变体cas12i2 rnp复合反应。通过以6.45:1(效应子:sgrna)的体积比(2.5:1sgrna:效应子摩尔比)混合纯化的spcas9(aldevron;62μm)与sgrna(在水中为1mm;参见表22中的序列)进行spcas9rnp复合反应。对于“只有效应子”的对照,分别以与crrna或sgrna相同的体积比将变体cas12i2或spcas9与蛋白质储存缓冲液(25mm tris(ph 7.5)、250mm nacl、1mm tcep、50%甘油)混合。包括另外的对照:spcas9(aldevron)与lethal#1(转染对照指导物)、合并的cd3或rosa26 sgrna以及spcas9(horizon)与lethal#1、合并的cd3或rosa26 sgrna。将复合物在37℃下孵育30-60分钟。孵育后,将rnp稀释至20μm、50μm、100μm或160μm效应子浓度(对于变体cas12i2)和20μm或50μm(对于spcas9)。
[1116]
表22.用于rnp转染的crrna和sgrna序列(seq id no:237-241)。
[1117][1118]
表23.用于rnp转染的crrna和sgrna序列(seq id no:242-251)。
3032)中的细胞、只有蛋白质储存缓冲液中的细胞。使用电穿孔装置(程序eo-115-aa,lonza ht)对板进行电穿孔,不包括未电穿孔条件。使用机器人技术(starlab hamilton)将每个孔分成四个96孔编辑板(含有200μl总体积)。将编辑板在37℃下孵育7天,在第4天更换100μl培养基。
[1122]
7天后,将板离心并除去上清液。将沉淀重悬于200μl pbs中。收集100μl样品,并用抗体组(抗b2m、抗trac、抗pd1)或抗cd3ε抗体(lethal#1,用于cas9对照的合并cd3ε、rosa26、蛋白质储存缓冲液和未电穿孔)染色。将所有细胞用dapi染色以评估活力。将剩余的细胞悬浮液转移到96孔pcr板中并以500x g离心5分钟。除去上清液并将沉淀冷冻在-80℃下。
[1123]
对于gdna提取,将沉淀解冻至室温并重悬于适当体积的dna提取缓冲液(quickextract)中,得到1000个细胞/μl的最终浓度。然后将样品在pcr机器中在65℃下循环15分钟,在68℃下循环15分钟,在98℃下循环10分钟。然后将样品冷冻在-20℃下。
[1124]
通过多轮pcr制备用于下一代测序(ngs)的样品。第一轮(pcr i)用于扩增靶位点侧翼的基因组区域并添加ngs衔接子。第二轮(pcr ii)用于添加ngs index。然后将反应液汇集,通过柱纯化进行纯化,并在荧光计(量子比特公司(qubit))上定量。使用150循环ngs仪器(nextseq v2.5)中或高输出试剂盒完成测序运行,并在ngs仪器(nextseq 550)上运行。
[1125]
对于ngs分析,插入缺失映射功能使用样品的fastq文件、扩增子参考序列、和正向引物序列。对于每个读段,使用kmer扫描算法来计算读段与参考序列之间的编辑操作(匹配、错配、插入、缺失)。为了去除一些样品中存在的少量引物二聚体,每个读段的前30nt需要与参考匹配,并且超过一半的映射核苷酸为错配的读段也被滤除。通过这些过滤器的多达50,000个读段用于分析,并且如果读段含有插入或缺失,则将其计为插入缺失读数。将插入缺失%计算为含有插入缺失的读段数目除以分析的读段数目(通过过滤器的读段多达50,000个)。通过过滤器的最小读段数目的qc标准是10,000。
[1126]
这些结果证明了原代t细胞中变体cas12i2 rnp靶向多个b2m靶的稳健插入缺失活性(图8),活性峰值在16μm。流式细胞术染色显示变体cas12i2 rnp后t细胞中的b2m蛋白表达显著降低(图9)。这些结果另外显示了原代t细胞中由变体cas12i2 rnp靶向诱导的trac和pdcd1中的插入缺失(分别为图11a和图12a)。在靶向b2m的cas12i2 rnp(图10)、靶向trac的cas12i2 rnp(图11b)和靶向pdcd1的cas12i2 rnp(图12b)的电穿孔后七天,所有条件下的细胞活力均保持高水平。
[1127]
本实例显示cas12i2变体二元复合物(例如,变体cas12i2 rnp)与多个靶形成稳定的三元复合物并且在原代t细胞中具有活性。本实例进一步显示变体cas12i2形成具有增加的对靶核酸的(在靶)结合亲和力并且在原代t细胞中具有活性的稳定二元复合物(例如,rnp)。
[1128]
实例14—测定cas12i2变体的脱靶酶活性
[1129]
本实例描述了用于评估cas12i2二元复合物在在靶基因座和非靶基因座处的核酸酶活性的方法。
[1130]
选择表24中的靶序列用于本测定。对于每个靶序列,通过搜索与pam序列相邻的其他基因组序列并计算靶序列与pam相邻序列之间的莱文斯坦距离来鉴定潜在非靶位点。莱
文斯坦距离(例如,编辑距离)对应于将一个序列改变为另一个序列(例如,将潜在非靶基因座的序列改变为在靶基因座的序列)所需的编辑(例如,插入、缺失或取代)的最小次数,如图13所示。选择编辑距离为1、2、3或4的潜在非靶序列,并且这些序列在表25中示出。
[1131]
表24.在靶序列和相应的crrna序列。
[1132]
[1133][1134]
表25.非靶基因座序列和编辑距离。
[1135]
[1136]
[1137]
[1138]
[1139]
[1140]
[1141]
[1142]
[1143]
[1144]
[1145]
[1146][1147][1148]
如实例11中所述制备如表24所示的对应于每个靶位点的rna指导物序列。将hek293t细胞铺板到96孔板的孔中,并且用cas12i2质粒和rna指导序列转染每个孔,如实例
11中所述。
[1149]
如实例11中所述收集并制备样品以用于ngs。使用primer3软件来鉴定每个非靶位点的引物对,从而将非靶序列置于120-140个碱基对扩增子的中心,用于在编辑和阴性对照(只有效应子)样品中进行靶向扩增子测序。然后完成在靶扩增子、非靶扩增子和未编辑对照样品的ngs分析。为了尽量减少技术差异,每个在靶和对应于该在靶的所有非靶的输入材料均取自同一收获孔。使用最大似然估计(mle)产生背景校正的非靶活性率,该最大似然估计在给定配对阴性对照样品的插入缺失水平的情况下估计样品的非靶插入缺失水平。
[1150]
在靶编辑由靶序列处背景以上的插入缺失水平(在本测定中》0.5%)定义。脱靶编辑由一个或多个相应非靶序列处背景以上的插入缺失水平(在本测定中在mle校正后》0.2%)定义。计算变体cas12i2二元复合物的每个在靶序列和非靶序列的插入缺失水平。
[1151]
图14a、图14b和图14c分别示出了使用seq id no:3的cas12i2变体、seq id no:4的cas12i2变体和seq id no:5的cas12i2变体时表24的aavs1、emx1和vegfa基因座上的在靶插入缺失百分比。图14a、图14b和图14c进一步示出了表25的非靶基因座上的插入缺失百分比。在不同的非靶基因座处(诸如在对应于aavs1_t5(编辑距离为2和/或3)和vegfa_t6(编辑距离为2)的非靶基因座处)观察到每种cas12i2变体的一些脱靶酶活性。然而,在每个非靶基因座上观察到总体上最小的脱靶活性,并且对应于特定在靶基因座(例如,aavs1_t4、aavs1_t7、aavs1_t8、emx1_t1、emx1_t2、emx1_t3、emx1_t5、emx1_t6、emx1_t7、vegfa_t4、vegfa_t5、vegfa_t7和vegfa_t8)的脱靶基因座处的酶活性被确定为不存在或可忽略。因此,每种cas12i2变体在多个基因座处表现出比脱靶活性更高的在靶活性。
[1152]
用野生型cas12i2二元复合物(例如,亲本二元复合物)重复这些方法。与亲本二元复合物相比,在非靶基因座处具有降低的酶活性的变体cas12i2二元复合物在非靶基因座处表现出更低的插入缺失百分比。与亲本二元复合物相比,在在靶基因座处具有增加的酶活性的变体cas12i2二元复合物在靶基因座处表现出更高的插入缺失百分比。因此,本实例示出了如何测量和比较野生型cas12i2和变体cas12i2在在靶和非靶基因座处的酶活性。
[1153]
实例15—测定cas12i2变体的脱靶结合活性
[1154]
本实例描述了用于评估和比较cas12i2(野生型和变体cas12i2)二元复合物与在靶和非靶序列的结合的方法。
[1155]
如实例7中所述产生并标记对应于来自实例14的在靶序列和非靶序列的dsdna底物。然后根据实例7的方法制备靶向实例14的每个在靶序列的cas12i2 rnp。以相同的方式制备apo反应(无rna指导物的cas12i2),用h2o补足rna指导物的体积。
[1156]
将每个rnp或apo样品单独与在靶dsdna底物和非靶dsdna底物在37℃下孵育1小时,如实例7所述。将溴酚蓝加入到反应中,然后将其加载到6%dna阻滞凝胶(赛默飞世尔公司)上,并在licor odyssey clx上对凝胶进行成像。
[1157]
在该测定中,dna迁移通过凝胶的速率由其大小决定。只有dna的样品能够迁移特定距离。然而,如果rnp与dna结合,则会出现代表更大、移动性更低的dna复合物的条带,该条带在凝胶上“上移”。因此,针对每个rnp鉴定凝胶中的“未结合的dsdna”和“结合的dsdna”条带,其中“结合的dsdna”比“未结合的dsdna”迁移得少。
[1158]
具有增加的在靶结合的变体cas12i2 rnp表现出增加的与dsdna靶序列的结合,如通过与亲本rnp相比上移条带更强所证明的。具有降低的非靶结合的变体cas12i2 rnp表现
出降低的与dsdna非靶序列的结合,如通过与亲本rnp相比上移条带强度更低或缺失所证明的。
[1159]
因此,本实例示出了如何测量和比较野生型cas12i2和变体cas12i2二元复合物对在靶和非靶底物的结合活性。
[1160]
实例16—用于确定变体cas12i2脱靶裂解位点的方法
[1161]
在本实例中,使用在schmid-burgk等人,technology[科技]78(4):794-800(2000)中描述的基于标记的标签整合位点测序(ttiss)方法的改进版本来分析cas12i2变体特异性和活性。本文所述的方法的示意图在图15中示出。
[1162]
表xx中的ttiss供体寡核苷酸和引物由埃德特生物科技公司(爱荷华州科拉尔维尔(coralville,ia))合成。“/5phos/”表示5'磷酸化位点,“3ddc/”表示3'双脱氧胞苷,并且“*”表示硫代磷酸酯键。
[1163]
表26.ttiss方法序列。
[1164]
[1165]
[1166][1167]
通过添加等体积的pcr2_staggeredprimer1至pcr2_staggeredprimer12并在10mm tris-hcl中稀释10倍来制备pcr_fwd_2_stagger_mix(10μm)。
[1168]
通过以下过程制备双链ttiss供体寡核苷酸:在96孔pcr板中混合等摩尔量的donor_sense和donor_antisense寡核苷酸,并将45μl等摩尔混合物与5μl idt双链体缓冲液(埃德特生物科技公司)混合。然后通过以下过程使寡核苷酸双链化:将板置于热循环仪中并运行程序以将样品加热至95℃,随后通过运行700个6秒循环将温度升高至25℃,其中
每个循环的温度降低0.1℃。
[1169]
通过以下过程制备转座子dna:将332μl 100μm transposon_me和100μm transposon_read_2寡核苷酸中的每一种与80μl 10x退火缓冲液(300mm nacl、1.5mm edta、15mm hcl)和40μl超纯水(英杰公司)组合。将混合物分布在96孔pcr板的8个孔中。通过以下过程使转座子dna退火:将pcr板置于热循环仪中并运行程序以将样品加热至95℃保持3分钟,随后通过运行700个6秒循环将温度升高至25℃,其中每个循环的温度降低0.1℃。
[1170]
退火步骤完成后,然后将转座子dna稀释至100ng/μl。接下来,将375μl 100ng/μl转座子dna与375μl甘油和750μl ez-tn5转座酶(lucigen)混合。然后通过涡旋混合溶液,并在室温下孵育30分钟以形成加载的tn5转座体。将转座体储存在-20℃下直至准备使用。
[1171]
在转染之前,将hek 293t细胞以每孔125,000个细胞的密度铺板在24孔板(康宁公司(corning))中的500μl d10培养基(含有glutamax和丙酮酸盐的dmem(吉布科公司(gibco)),补充有10%premium热灭活fbs(康宁公司)和青霉素/链霉素抗生素(海克隆公司(hyclone)))中。将细胞在设定为37℃和5%co2的培养箱中培养过夜。
[1172]
铺板大约15小时后转染细胞。对于待转染的每个孔,将500ng约1.25ng/μl的供体寡核苷酸、375ng 1000ng/μl的cas12i2效应子质粒(seq id no:4的cas12i2变体)和125ng 100ng/μl的rna引导物质粒添加到opti-mem培养基(吉布科公司)中,使最终体积为125μl,以形成opti-1溶液。rna指导物和靶序列在表27中示出;spcas9用作对照。在单独的容器中,将122.5μl opti-mem培养基与2.5μl genejuice转染试剂(密理博西格玛公司(millipore-sigma))混合,以形成opti-2溶液。将opti-2溶液在室温下孵育5分钟。在opti-2孵育后,将opti-1和opti-2混合在一起并在室温下孵育5-15分钟。孵育后,将opti-1+opti-2溶液滴加到24孔板的单个孔中。将细胞放回培养箱中大约72小时。
[1173]
表27.用于ttiss的靶和crrna序列。
[1174]
[1175]
[1176]
[1177][1178]
然后通过去除培养基、用200μl pbs(吉布科公司)洗涤一次、添加50μl tryple解离试剂(吉布科公司)并在37℃下孵育5分钟来将细胞从板上解离。然后通过添加200μl d10培养基并充分混合来重悬细胞。然后将重悬的细胞转移到96孔pcr板中并以400xg离心10分钟。去除上清液,并将细胞沉淀储存在-20℃下直至dna提取。
[1179]
通过将沉淀重悬于50μl裂解缓冲液(1mm cacl2、3mm mgcl2、1mm edta、1%triton x-100(西格玛公司(sigma))、8u/ml蛋白酶k(neb)、10mm tris-hcl)中并在65℃下孵育重悬
液10分钟来从细胞中提取dna。接下来使用zymo gdna清洁和浓缩-5试剂盒(兹莫研究公司(zymo research))按照制造商的说明书纯化gdna,并在35μl 10mm tris-hcl中洗脱。在凝胶上显现gdna,并通过qubit高灵敏度dsdna试剂盒(量子比特公司)按照制造商的说明书定量。然后将gdna提取物在10mm tris-hcl中归一化为50ng/μl。
[1180]
通过首先制备溶液24μl转座体、6μl ez-tn5 10x反应缓冲液(lucigen)、24μl纯化和稀释的基因组dna以及6μl水来标记基因组dna。将该溶液充分混合并在37℃下孵育两小时。孵育后,将6μl的ez-tn5 10x终止溶液混合到反应中。然后将反应+终止溶液混合物在70℃下加热10分钟。然后使用zymo gdna清洁和浓缩-5试剂盒按照制造商的说明书纯化终止的反应,并在50μl 10mm tris-hcl中洗脱。
[1181]
使用kod hotstart pcr试剂盒(密理博西格玛公司)进行第1轮pcr,每个反应的条件如下:5μl 10x kod热启动dna聚合酶缓冲液、3μl 25mm mgso4、5μl dntp(各2mm)、1.5μl pcr_fwd_1(10μm)、1.5μl transposon_read_2(10μm)、1μl kod热启动dna聚合酶(1.0u/μl)、15μl标记和纯化的gdna以及18μl超纯水。将所有试剂充分混合,并按照制造商的说明书使用60℃的退火温度和60秒的延长时间进行反应。
[1182]
进行第2轮pcr,每个反应的条件如下:5μl 10x kod热启动dna聚合酶缓冲液、3μl 25mm mgso4、5μl dntp(各2mm)、pcr_fwd_2_stagger_mix(10μm)、1.5μl一种反向条形码引物(pcr_rev_bc1至pcr_rev_bc24)(10μm)、1μl kod热启动dna聚合酶(1.0u/μl)、3μl pcr 1产物和30μl超纯水。将所有试剂充分混合,并按照制造商的说明书使用65℃的退火温度和60秒的延长时间进行反应。
[1183]
然后使用clean-ngs珠粒(bulldog bio)通过0.8x spri净化来纯化50μl pcr2反应。在25μl 10mm tris-hcl中洗脱spri反应物。合并净化的反应物,并将合并物加载到2%e-凝胶ex(英杰公司)上,然后在e-凝胶基座上运行10分钟。然后用剃刀从250-1000bp切下所得涂片,并用凝胶提取试剂盒(快而精公司(qiagen))按照制造商的说明书纯化切下的文库,并在50μl中洗脱。使用清洁和浓缩-5试剂盒(兹莫研究公司)按照制造商的说明书进行第二次文库纯化,并在20μl中洗脱。
[1184]
然后通过qubit高灵敏度dsdna试剂盒定量文库,并使用估计的平均文库大小400bp将其归一化为3nm。将归一化的文库与3nm phix(illumina)混合,使得文库:phix比率为4:1。然后将最终文库:phix混合物以2.0pm的最终浓度加载到illumina nextseq 550高输出试剂盒上。将读段长度设置为75/8/0/25r1/i1/i2/r2。
[1185]
测序后,分析ttiss数据以鉴定在靶和脱靶位点。首先使用illumina的bcl2fastq2软件对原始测序数据进行解复用并将其转换为双端测序(paired-end)fastq文件。将没有从dsodn引物序列开始或具有低测序质量的读段滤除,并且将剩余的读段在正向方向上截短至基因组dna的25bp并在反向方向上截短至基因组dna的15bp。然后使用bowtie2将截短的读段与grch38人参考基因组进行比对,允许最大片段长度为1000bp(langmead&salzberg,nature methods[自然方法]9:357-9(2012))。过滤比对结果以仅包括正确映射的读段对,并使用samtools(li等人,bioinformatics[生物信息学]35(16):2078-9(2009))标记pcr重复读段。将具有至少两个独特比对读段的所有100bp基因组窗口鉴定为可能的整合位点,并且对于每个窗口,基于其比对读段的频率和位置分布预测切割位点。然后在每个窗口中搜索距用于样品的靶序列的编辑距离为6内的任何序列,并确定该序列的推定切割
位点。spcas9从靶的3'端切割-4bp,cas12i2从靶的3'端切割3bp。没有任何推定在靶/脱靶序列的窗口被去除,推定在靶/脱靶序列的切割位点距窗口的预测切割位点超过8bp的窗口也被去除。出现在阴性对照样品中的窗口也被去除,以避免常见的断裂位点。然后输出剩余的窗口、它们的在靶/脱靶序列以及相关度量,诸如与窗口比对的读段的计数以及所鉴定的在靶/脱靶与靶序列之间的编辑距离。
[1186]
表28示出了针对每个cas12i2和spcas9靶测量的在靶读段和脱靶读段的数量。“在靶读段”是指映射到在靶位点周围100bp窗口的独特读段的数量。“脱靶的数量”是指基因组中在位点周围100bp窗口内具有至少两个独特读段图谱并且含有推定脱靶序列的位点的数量(例如,在距指导物序列的编辑距离为6内并且在从读段映射到位点的分布预测的切割位点的8bp内具有预测切割位点的序列)。“最高脱靶读段”是指具有最高读段数量的脱靶位点的读段的数量。图16a、图16b、图16c和图16d是seq id no:4的变体cas12i2和spcas9在靶emx1_t2处的在靶和脱靶读段的示意图。与在靶序列相对应(例如,与其相同)的读段中的每个碱基用点表示,并且不与在靶序列相对应(例如,与其不同)的读段中的每个碱基用测序的碱基表示。
[1187]
表28.在靶和脱靶读段。
[1188][1189][1190]
表28以及图16a、图16b、图16c和图16d中的数据表明,seq id no:4的变体cas12i2显示出比在靶读段显著更少的脱靶读段。相反,spcas9产生若干具有高读段计数的脱靶,这
表明spcas9与变体cas12i2相比具有更高的脱靶编辑效率。如图16b所示,emx1_t2的每个cas12i2读段是在靶读段。然而,spcas9读段显示出具有高读段计数的多个emx1_t2脱靶序列。如图16c所示,spcas9脱靶读段超过emx1_t4的在靶读段。还可参见表28中的“最高脱靶读段”列。这些结论还通过对所选脱靶位点进行深度测序(其中变体cas12i2的最大脱靶插入缺失率为2.6%,spcas9的最大脱靶插入缺失率为77.7%)得到支持。
[1191]
ttiss方法进一步证明了变体cas12i2偏好5'-nttn-3'pam序列。用非规范pam序列鉴定的脱靶发生在低读段计数以及指导物与脱靶之间的高编辑距离的情况下,这表明那些准备好的可能是假阳性,而不是真正的脱靶位点。
[1192]
本实例显示seq id no:4的变体cas12i2表现出高在靶选择性和活性。spcas9的脱靶结合/活性超过seq id no:4的变体cas12i2的脱靶结合/活性。
[1193]
实例17—通过cas12i2变体靶向哺乳动物基因
[1194]
本实例描述了使用通过瞬时转染引入哺乳动物细胞中的野生型cas12i2和cas12i2变体对多个靶的插入缺失评估。
[1195]
将本实例中的cas12i2工程化变体克隆到先前工程化的seq id no:5的cas12i2变体顶部的pcda3.1主链(英杰公司)中,改变体具有以下突变:d581r、i926r、v1030g和s1046g。从genewiz作为在10t缓冲液中归一化为1μg/μl的midi-preps订购质粒。作为环化质粒midi-preps订购如表14所示的crrna序列,并在10t缓冲液中归一化为100ng/μl。
[1196]
表29.用于瞬时转染的crrna和靶序列。
[1197][1198]
在转染前大约16-18小时,将100μl在dmem/10%fbs+pen/strep中的25,000个hek293t细胞铺板到96孔板中的每个孔中。在转染的当天,细胞的汇合度为70%-90%。对于待转染的每个孔,制备0.5μl lipofectamine 2000和9.5μl opti-mem的混合物,然后在室
温下孵育5-20分钟(溶液1)。在孵育之后,将lipofectamine:optimem混合物添加至最多至10μl的含有182ng效应子质粒和14ng crrna以及水的单独混合物(溶液2)。将溶液1和溶液2混合物通过向上和向下吸移进行混合,且然后在室温下孵育25分钟。在孵育后,将20μl溶液1和溶液2混合物逐滴添加至含有细胞的96孔板的每个孔。在转染后72小时,通过将10μl tryple添加到每个孔的中心并且孵育大约5分钟来使细胞胰蛋白酶化。然后将100μl d10培养基添加至每个孔并且混合以重悬细胞。然后将细胞以500g旋转沉降10分钟,并且弃去上清液。将quickextract缓冲液添加至原始细胞悬浮液体积的量的1/5。将细胞在65℃下孵育15分钟,在68℃下孵育15分钟,并且在98℃下孵育10分钟。
[1199]
通过两轮pcr制备用于下一代测序的样品。使用第一轮(pcr1)来扩增根据靶的特定基因组区域。通过柱纯化对pcr1产物进行纯化。进行第2轮pcr(pcr2)以添加illumina衔接子和索引。然后合并反应,将其加载到2%e-gel ex上10分钟并进行凝胶提取。用150次循环nextseq v2.5中等或高输出试剂盒进行测序运行。
[1200]
编辑的靶被定义为显示出背景以上的插入缺失水平(在本测定中》1.0%)和通过下一代测序获得读段计数大于10,000的靶。图17a示出了由几种工程化cas12i2变体在emx1_t6和vegfa_t7中诱导的插入缺失。图17b示出了由seq id no:3-5和495的cas12i2变体在emx1_t6和vegfa_t7中诱导的插入缺失。图18示出了由seq id no:4、495和496的cas12i2变体在aavs1_t6、aavs1_t7、emx1_t2、emx1_t6和vegfa_t5中诱导的插入缺失。
[1201]
本实例显示seq id no:495和seq id no:496的cas12i2变体在多个靶位点处诱导增加的插入缺失水平。