具有RUVC结构域的酶的制作方法

文档序号:35018058发布日期:2023-08-04 08:53阅读:78来源:国知局
具有RUVC结构域的酶的制作方法


背景技术:

1、cas酶及其相关的成簇规则间隔短回文重复(crispr)指导核糖核酸(rna)似乎是原核免疫系统的普遍(约45%的细菌,约84%的古细菌)组分,用于保护此类微生物通过crispr-rna指导的核酸切割来对抗非自身核酸,例如传染性病毒和质粒。虽然编码crisprrna元件的脱氧核糖核酸(dna)元件在结构和长度上可以相对保守,但它们的crispr相关(cas)蛋白高度多样化,包含广泛多种核酸相互作用结构域。虽然早在1987年就已观察到crispr dna元件,但crispr/cas复合物的可编程核酸内切酶切割能力直到最近才被认识到,导致在各种dna操作和基因编辑应用中使用重组crispr/cas系统。

2、序列表

3、本技术包含序列表,所述序列表已以ascii格式电子提交,并通过引用整体并入本文。创建于2020年2月13日的所述ascii副本被命名为55921-703_601_sl.txt,并且大小是23,363,113字节。


技术实现思路

1、在一些方面,本公开提供了一种工程改造的核酸酶系统,其包含:(a)包含ruvc_iii结构域和hnh结构域的核酸内切酶,其中所述核酸内切酶源自未培养的微生物,其中所述核酸内切酶是2类ii型cas核酸内切酶;和(b)工程改造的指导核糖核酸结构,其被构造成与所述核酸内切酶形成复合物,所述复合物包含:(i)指导核糖核酸序列,其被构造成与靶脱氧核糖核酸序列杂交;和(ii)tracr核糖核酸序列,其被构造成与所述核酸内切酶结合。在一些实施方案中,ruvc_iii结构域包含与seq id no:1827-3637中任一个具有至少70%、至少75%、至少80%或至少90%序列同一性的序列。

2、在一些方面,本公开提供了一种工程改造的核酸酶系统,其包含:(a)包含与seqid no:1827-3637中任一个具有至少75%序列同一性的ruvc_iii结构域的核酸内切酶;和(b)工程改造的指导核糖核酸结构,其被构造成与所述核酸内切酶形成复合物,所述复合物包含:(i)指导核糖核酸序列,其被构造成与靶脱氧核糖核酸序列杂交;和(ii)tracr核糖核酸序列,其被构造成与所述核酸内切酶结合。

3、在一些方面,本公开提供了一种工程改造的核酸酶系统,其包含:(a)被构造成与包含seq id no:5512-5537的前间区序列邻近基序(pam)序列结合的核酸内切酶,其中所述核酸内切酶是2类ii型cas核酸内切酶;和(b)工程改造的指导核糖核酸结构,其被构造成与所述核酸内切酶形成复合物,所述复合物包含:(i)指导核糖核酸序列,其被构造成与靶脱氧核糖核酸序列杂交;和(ii)tracr核糖核酸序列,其被构造成与所述核酸内切酶结合。

4、在一些实施方案中,所述核酸内切酶源自未培养的微生物。在一些实施方案中,所述核酸内切酶未被工程改造以结合不同的pam序列。在一些实施方案中,所述核酸内切酶不是cas9核酸内切酶、cas14核酸内切酶、cas12a核酸内切酶、cas12b核酸内切酶、cas12c核酸内切酶、cas12d核酸内切酶、cas12e核酸内切酶、cas13a核酸内切酶、cas13b核酸内切酶、cas13c核酸内切酶或cas13d核酸内切酶。在一些实施方案中,所述核酸内切酶与cas9核酸内切酶具有小于80%的同一性。在一些实施方案中,所述核酸内切酶进一步包含hnh结构域。在一些实施方案中,所述tracr核糖核酸序列包含与选自seq id no:5476-5511和seqid no:5538中任一个的约60至90个连续核苷酸具有至少80%序列同一性的序列。

5、在一些方面,本公开提供了一种工程改造的核酸酶系统,其包含:(a)工程改造的指导核糖核酸结构,其包含:(i)指导核糖核酸序列,其被构造成与靶脱氧核糖核酸序列杂交;和(ii)tracr核糖核酸序列,其被构造成与核酸内切酶结合,其中所述tracr核糖核酸序列包含与选自seq id no:5476-5511和seq id no:5538中任一个的约60至90个连续核苷酸具有至少80%序列同一性的序列;和(b)2类ii型cas核酸内切酶,其被构造成与所述工程改造的指导核糖核酸结合。在一些实施方案中,所述核酸内切酶被构造成与选自包含seq idno:5512-5537的组的前间区序列邻近基序(pam)序列结合。

6、在一些实施方案中,所述工程改造的指导核糖核酸结构包含至少两个核糖核酸多核苷酸。在一些实施方案中,所述工程改造的指导核糖核酸结构包含一个包含所述指导核糖核酸序列和所述tracr核糖核酸序列的核糖核酸多核苷酸。

7、在一些实施方案中,指导核糖核酸序列与原核、细菌、真核、古细菌、真菌、植物、哺乳动物或人基因组序列互补。在一些实施方案中,指导核糖核酸序列的长度为15-24个核苷酸。在一些实施方案中,所述核酸内切酶包含一个或多个在所述核酸内切酶的n末端或c末端的近端的核定位序列(nls)。在一些实施方案中,所述nls包含选自seq id no:5597-5612的序列。

8、在一些实施方案中,工程改造的核酸酶系统进一步包含单链或双链dna修复模板,其从5’至3’包含:包含所述靶脱氧核糖核酸序列5’的至少20个核苷酸的序列的第一同源臂,至少10个核苷酸的合成dna序列,以及包含所述靶序列3’的至少20个核苷酸的序列的第二同源臂。在一些实施方案中,第一同源臂或所述第二同源臂包含至少40、80、120、150、200、300、500或1,000个核苷酸的序列。

9、在一些实施方案中,系统进一步包含mg2+源。

10、在一些实施方案中,核酸内切酶和tracr核糖核酸序列源自同一门内的不同细菌物种。在一些实施方案中,核酸内切酶源自属于皮杆菌属的细菌。在一些实施方案中,所述核酸内切酶源自属于疣微菌门(phylum verrucomicrobia)、暂定异域菌门(phylumcandidatus peregrinibacteria)或暂定黑水仙菌门(phylum candidatusmelainabacteria)的细菌。在一些实施方案中,核酸内切酶源自包含与seq id no:5592-5595中任一个具有至少90%同一性的16s rrna基因的细菌。

11、在一些实施方案中,hnh结构域包含与seq id no:5638-5460中任一个具有至少70%或至少80%同一性的序列。在一些实施方案中,核酸内切酶包含seq id no:1-1826或与其具有至少55%同一性的变体。在一些实施方案中,核酸内切酶包含与选自seq id no:1827-1830或seq id no:1827-2140的序列至少70%、80%或90%相同的序列。

12、在一些实施方案中,核酸内切酶包含与选自seq id no:3638-3641或seq id no:3638-3954的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含至少1个、至少2个、至少3个、至少4个或至少5个选自seq id no:5615-5632的肽基序。在一些实施方案中,核酸内切酶包含与选自seq id no:1-4或seq id no:1-319的序列至少70%、80%或90%相同的序列。

13、在一些实施方案中,指导rna结构包含与选自seq id no:5461-5464、seq id no:5476-5479或seq id no:5476-5489的序列至少70%、80%或90%相同的序列。在一些实施方案中,指导rna结构包含被预测为包含由杆和环组成的发夹的rna序列,所述杆包含至少10个、至少12个或至少14个碱基配对的核糖核苷酸,以及所述环的4个碱基对内的不对称凸起。

14、在一些实施方案中,核酸内切酶被构造成与包含选自seq id no:5512-5515或seqid no:5527-5530的序列的pam结合。

15、在一些实施方案中:(a)所述核酸内切酶包含与seq id no:1827至少70%、至少80%或至少90%相同的序列;(b)所述指导rna结构包含与seq id no:5461或seq id no:5476中的至少一个至少70%、至少80%或至少90%相同的序列;和(c)所述核酸内切酶被构造成与包含seq id no:5512或seq id no:5527的pam结合。在一些实施方案中:(a)所述核酸内切酶包含与seq id no:1828至少70%、至少80%或至少90%相同的序列;(b)所述指导rna结构包含与seq id no:5462或seq id no:5477中的至少一个至少70%、至少80%或至少90%相同的序列;和(c)所述核酸内切酶被构造成与包含seq id no:5513或seq id no:5528的pam结合。在一些实施方案中:(a)所述核酸内切酶包含与seq id no:1829至少70%、至少80%或至少90%相同的序列;(b)所述指导rna结构包含与seq id no:5463或seq idno:5478中的至少一个至少70%、至少80%或至少90%相同的序列;和(c)所述核酸内切酶被构造成与包含seq id no:5514或seq id no:5529的pam结合。在一些实施方案中:

16、(a)所述核酸内切酶包含与seq id no:1830至少70%、至少80%或至少90%相同的序列;(b)所述指导rna结构包含与seq id no:5464或seq id no:5479中的至少一个至少70%、至少80%或至少90%相同的序列;和(c)所述核酸内切酶被构造成与包含seq id no:5515或seq id no:5530的pam结合。

17、在一些实施方案中,核酸内切酶包含与选自seq id no:2141-2142或seq id no:2141-2241序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含与选自seq id no:3955-3956或seq id no:3955-4055的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含选自seq id no:5632-5638的至少1个、至少2个、至少3个、至少4个或至少5个肽基序。在一些实施方案中,核酸内切酶包含与选自seq id no:320-321或seq id no:320-420中的序列至少70%、80%或90%相同的序列。在一些实施方案中,指导rna结构包含与选自以下的序列至少70%、80%或90%相同的序列:seq id no:5465、seq id no:5490-5491或seq id no:5490-5494。在一些实施方案中,指导rna结构包含含有发夹的tracr核糖核酸序列,所述发夹包含至少8个、至少10个或至少12个碱基配对的核糖核苷酸。在一些实施方案中,核酸内切酶被构造成与包含选自seq id no:5516和seqid no:5531的序列的pam结合。在一些实施方案中:(a)所述核酸内切酶包含与seq id no:2141至少70%、80%或90%相同的序列;(b)所述指导rna结构包含与

18、seq id no:5490至少70%、80%或90%相同的序列;和(c)所述核酸内切酶被构造成与包含seq id no:5531的pam结合。在一些实施方案中:(a)所述核酸内切酶包含与seqid no:2142至少70%、80%或90%相同的序列;(b)所述指导rna结构包含与seq id no:5465或seq id no:5491至少70%、80%或90%相同的序列;和(c)所述核酸内切酶被构造成与包含seq id no:5516的pam结合。

19、在一些实施方案中,核酸内切酶包含与选自seq id no:2245-2246中的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含与选自seq id no:4059-4060的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含选自

20、seq id no:5639-5648的至少1个、至少2个、至少3个、至少4个或至少5个肽基序。在一些实施方案中,核酸内切酶包含与选自seq id no:424-425的序列至少70%、80%或90%相同的序列。在一些实施方案中,指导rna结构包含与选自seq id no:5498-5499和seqidno:5539的序列至少70%、80%或90%相同的序列。在一些实施方案中,指导rna结构包含被预测为包含具有不间断碱基配对区的发夹的指导核糖核酸序列,所述指导核糖核酸结构包含至少8个核苷酸的指导核糖核酸序列和至少8个核苷酸的tracr核糖核酸序列,并且其中所述tracr核糖核酸序列从5’至3’包含第一发夹和第二发夹,其中所述第一发夹具有比所述第二发夹更长的杆。

21、在一些实施方案中,核酸内切酶包含与选自seq id no:2242-2244或seq id no:2247-2249的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含与选自seq id no:4056-4058和seq id no:4061-4063的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含选自seq id no:5639-5648的至少1个、至少2个、至少3个、至少4个或至少5个肽基序。在一些实施方案中,核酸内切酶包含与选自seq idno:421-423或seq id no:426-428的序列至少70%、80%或90%相同的序列。在一些实施方案中,指导rna结构包含与选自以下的序列至少70%、80%或90%相同的序列:seq id no:5466-5467、seq id no:5495-5497、seq id no:5500-5502和seq id no:5539。在一些实施方案中,指导rna结构包含被预测为包含具有不间断碱基配对区的发夹的指导核糖核酸序列,所述指导核糖核酸结构包含至少8个核苷酸的指导核糖核酸序列和至少8个核苷酸的tracr核糖核酸序列,并且其中所述tracr核糖核酸序列从5'至3'包含第一发夹和第二发夹,其中所述第一发夹具有比所述第二发夹更长的杆。在一些实施方案中,核酸内切酶被构造成与包含选自seq id no:5517-5518或seq id no:5532-5534的序列的pam结合。在一些实施方案中:(a)所述核酸内切酶包含与seq id no:2247至少70%、80%或90%相同的序列;(b)所述指导rna结构包含与seq id no:5500至少70%、80%或90%相同的序列;和(c)所述核酸内切酶被构造成与包含seq id no:5517或seq id no:5532的pam结合。在一些实施方案中:(a)所述核酸内切酶包含与seq id no:2248至少70%、80%或90%相同的序列;(b)所述指导rna结构包含与seq id no:5501至少70%、80%或90%相同的序列;和

22、(c)所述核酸内切酶被构造成与包含seq id no:5518或seq id no:5533的pam结合。在一些实施方案中:(a)所述核酸内切酶包含与seq id no:2249至少70%、80%或90%相同的序列;(b)所述指导rna结构包含与seq id no:5502至少70%、80%或90%相同的序列;和(c)所述核酸内切酶被构造成与包含seq id no:5534的pam结合。

23、在一些实施方案中,核酸内切酶包含与选自seq id no:2253或seq id no:2253-2481的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含与选自seq id no:4067或seq id no:4067-4295的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含根据seq id no:5649的肽基序。在一些实施方案中,核酸内切酶包含与选自seq id no:432或seq id no:432-660中的序列至少70%、80%或90%相同的序列。在一些实施方案中,指导rna结构包含与选自seq id no:id no:5468或seq id no:5503的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶被构造成与包含选自seq id no:5519的序列的pam结合。在一些实施方案中:(a)所述核酸内切酶包含与seq id no:2253至少70%、80%或90%相同的序列;(b)所述指导rna结构包含与seq idno:5468或seq id no:5503至少70%、80%或90%相同的序列;和(c)所述核酸内切酶被构造成与包含seq id no:5519的pam结合。

24、在一些实施方案中,核酸内切酶包含与选自seq id no:2482-

25、2489中的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含与选自seq id no:4296-4303的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含与选自seq id no:661-668的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含与选自seq id no:2490-2498的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含与选自seq id no:4304-4312的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含与选自seqid no:669-677的序列至少70%、80%或90%相同的序列。在一些实施方案中,指导rna结构包含与选自seq id no:5504的序列至少70%、80%或90%相同的序列。

26、在一些实施方案中,核酸内切酶包含与选自seq id no:2499或seq id no:2499-2750的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含与选自seq id no:4313或seq id no:4313-4564的序列至少70%、80%或90%相同的序列。在一些实施方案中,所述核酸内切酶包含选自seq id no:5650-5667的至少1个、至少2个、至少3个、至少4个或至少5个肽基序。在一些实施方案中,核酸内切酶包含与选自seq id no:678或seq id no:678-

27、929中的序列至少70%、80%或90%相同的序列。在一些实施方案中,指导rna结构包含与seq id no:5469或seq id no:5505至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶被构造成与包含seq id no:5520或seq id no:5535的pam结合。在一些实施方案中:(a)所述核酸内切酶包含与seq id no:2499至少70%、80%或90%相同的序列;(b)所述指导rna结构包含与seq id no:5469或seq id no:5505至少70%、80%或90%相同的序列;和(c)所述核酸内切酶被构造成与包含seq id no:5520或seq id no:5535的pam结合。

28、在一些实施方案中,核酸内切酶包含与选自seq id no:2751或seq id no:2751-2913的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含与选自seq id no:4565或seq id no:4565-4727的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含选自seq id no:5668-5678的至少1个、至少2个、至少3个、至少4个或至少5个肽基序。在一些实施方案中,核酸内切酶包含与选自seq id no:930或seqid no:930-1092中的序列至少70%、80%或90%相同的序列。在一些实施方案中,指导rna结构包含与seq id no:5470或seq id no:5506至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶被构造成与包含选自seq id no:5521或seq id no:5536的序列的pam结合。在一些实施方案中:(a)所述核酸内切酶包含与seq id no:2751至少70%、80%或90%相同的序列;(b)所述指导rna结构包含与seq id no:5470或seq id no:5506至少70%、80%或90%相同的序列;和c)所述核酸内切酶被构造成与包含seq id no:5521或seqid no:5536的pam结合。

29、在一些实施方案中,核酸内切酶包含与选自seq id no:2914或seq id no:2914-3174的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含与选自seq id no:4728或seq id no:4728-4988的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含选自seq id no:5676-5678的至少1个、至少2个或至少3个肽基序。在一些实施方案中,核酸内切酶包含与选自seq id no:1093或seq id no:1093-1353中的序列至少70%、80%或90%相同的序列。在一些实施方案中,指导rna结构包含与选自以下的序列至少70%、80%或90%相同的序列:seq id no:5471、seq id no:5507和seq idno:5540-5542。在一些实施方案中,指导rna结构包含被预测为包含至少两个发夹的tracr核糖核酸序列,所述发夹包含少于5个碱基配对的核糖核苷酸。在一些实施方案中,核酸内切酶被构造成与包含seq id no:5522的pam结合。在一些实施方案中:(a)所述核酸内切酶包含与seq id no:2914至少70%、80%或90%相同的序列;(b)所述指导rna结构包含与seqid no:5471或seq id no:5507至少70%、80%或90%相同的序列;和(c)所述核酸内切酶被构造成与包含seq id no:5522的pam结合。

30、在一些实施方案中,核酸内切酶包含与选自seq id no:3175或seq id no:3175-3330的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含与选自seq id no:4989或seq id no:4989-5146的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含选自seq id no:5679-5686的至少1个、至少2个、至少3个、至少4个或至少5个肽基序。在一些实施方案中,核酸内切酶包含与选自seq id no:1354或seqid no:1354-1511中的序列至少70%、80%或90%相同的序列。在一些实施方案中,指导rna结构包含与选自seq id no:5472或seq id no:5508的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶被构造成与包含选自seq id no:5523或seq id no:5537的序列的pam结合。在一些实施方案中:(a)所述核酸内切酶包含与seq id no:3175至少70%、80%或90%相同的序列;(b)所述指导rna结构包含与seq id no:5472或seq idno:5508至少70%、80%或90%相同的序列;和(c)所述核酸内切酶被构造成与包含seq idno:5523或seq id no:5537的pam结合。

31、在一些实施方案中,核酸内切酶包含与选自seq id no:3331或seq id no:3331-3474的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含与选自seq id no:5147或seq id no:5147-5290的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含选自seq id no:5674-5675和seq id no:5687-5693的至少1个、至少2个、至少3个、至少4个或至少5个肽基序。在一些实施方案中,核酸内切酶包含与选自seq id no:1512或seq id no:1512-1655中的序列至少70%、80%或90%相同的序列。在一些实施方案中,指导rna结构包含与选自seq id no:5473或seq id no:5509的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶被构造成与包含seq id no:5524的pam结合。在一些实施方案中:(a)所述核酸内切酶包含与seq id no:3331至少70%、80%或90%相同的序列;(b)所述指导rna结构包含与seq id no:5473或seq id no:5509至少70%、80%或90%相同的序列;和(c)所述核酸内切酶被构造成与包含seq id no:5524的pam结合。

32、在一些实施方案中,核酸内切酶包含与选自seq id no:3475或seq id no:3475-3568的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含与选自seq id no:5291或seq id no:5291-5389的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含选自seq id no:5694-5699的至少1个、至少2个、至少3个、至少4个或至少5个肽基序。在一些实施方案中,核酸内切酶包含与选自seq id no:1656或seqid no:1656-1755的序列至少70%、80%或90%相同的序列。在一些实施方案中,指导rna结构包含与seq id no:5474或seq id no:5510至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶被构造成与包含seq id no:5525的pam结合。在一些实施方案中:(a)所述核酸内切酶包含与seq id no:3475至少70%、80%或90%相同的序列;

33、(b)所述指导rna结构包含与seq id no:5474或seq id no:5510至少70%、80%或90%相同的序列;和(c)所述核酸内切酶被构造成与包含seq id no:5525的pam结合。

34、在一些实施方案中,核酸内切酶包含与选自seq id no:3569或seq id no:3569-3637的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含与选自seq id no:5390或seq id no:5390-5460的序列至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶包含选自seq id no:5700-5717的至少1个、至少2个、至少3个、至少4个或至少5个肽基序。在一些实施方案中,核酸内切酶包含与选自seq id no:1756或seqid no:1756-1826中的序列至少70%、80%或90%相同的序列。在一些实施方案中,指导rna结构包含与seq id no:5475或seq id no:5511至少70%、80%或90%相同的序列。在一些实施方案中,核酸内切酶被构造成与包含seq id no:5526的pam结合。在一些实施方案中:(a)所述核酸内切酶包含与seq id no:3569至少70%、80%或90%相同的序列;(b)所述指导rna结构包含与seq id no:5475或seq id no:5511至少70%、80%或90%相同的序列;和(c)所述核酸内切酶被构造成与包含seq id no:5526的pam结合。在一些实施方案中,序列同一性由blastp、clustalw、muscle、mafft或smith-waterman同源性搜索算法确定。在一些实施方案中,序列同一性通过所述blastp同源性搜索算法来确定,所述blastp同源性搜索算法使用3的字长(w)、10的期望(e)的参数和设置缺口存在时罚分为11、延伸为1的blosum62评分矩阵并使用条件型组成得分矩阵调整。

35、在一些方面,本公开提供了一种工程改造的指导核糖核酸多核苷酸,其包含:(a)dna靶向区段,其包含与靶dna分子中的靶序列互补的核苷酸序列;和(b)蛋白质结合区段,其包含杂交形成双链rna(dsrna)双链体的两个互补核苷酸段,其中所述两个互补核苷酸段通过居间核苷酸共价连接到彼此,以及其中所述工程改造的指导核糖核酸多核苷酸被构造成与包含与seq id no:1827-3637中任一个具有至少75%序列同一性的ruvc_iii结构域的核酸内切酶形成复合物并将所述复合物靶向所述靶dna分子的所述靶序列。在一些实施方案中,dna靶向区段位于所述两个互补核苷酸段的5’。

36、在一些实施方案中:(a)所述蛋白质结合区段包含与选自

37、seq id no:5476-5479或seq id no:5476-5489的序列具有至少70%、至少80%或至少90%同一性的序列;(b)所述蛋白质结合区段包含与选自(seq id no:5490-5491或seqid no:5490-5494)和seq id no:5538的序列具有至少70%、至少80%或至少90%同一性的序列;(c)所述蛋白质结合区段包含与选自seq id no:5498-5499的序列具有至少70%、至少80%或至少90%同一性的序列;(d)所述蛋白质结合区段包含与选自seq id no:5495-5497和seq id no:5500-5502的序列具有至少70%、至少80%或至少90%同一性的序列;(e)所述蛋白质结合区段包含与seq id no:5503具有至少70%、至少80%或至少90%同一性的序列;(f)所述蛋白质结合区段包含与seq id no:5504具有至少70%、至少80%或至少90%同一性的序列;(g)所述蛋白质结合区段包含与seq id no:5505具有至少70%、至少80%或至少90%同一性的序列;(h)所述蛋白质结合区段包含与seq id no:5506具有至少70%、至少80%或至少90%同一性的序列;(i)所述蛋白质结合区段包含与seq id no:5507具有至少70%、至少80%或至少90%同一性的序列;(j)所述蛋白质结合区段包含与seq idno:5508具有至少70%、至少80%或至少90%同一性的序列;(k)所述蛋白质结合区段包含与seq id no:5509具有至少70%、至少80%或至少90%同一性的序列;(l)所述蛋白质结合区段包含与seq id no:5510具有至少70%、至少80%或至少90%同一性的序列;或(m)所述蛋白质结合区段包含与seq id no:5511具有至少70%、至少80%或至少90%同一性的序列。

38、在一些实施方案中:(a)所述指导核糖核酸多核苷酸包含含有发夹的rna序列,所述发夹包含杆和环,其中所述杆包含至少10个、至少12个或至少14个碱基配对的核糖核苷酸和所述环的4个碱基对内的不对称凸起;(b)所述指导核糖核酸多核苷酸包含被预测包含发夹的tracr核糖核酸序列,所述发夹包含至少8个、至少10个或至少12个碱基配对的核糖核苷酸;(c)所述指导rna结构包含被预测包含具有不间断碱基配对区的发夹的指导核糖核酸序列,所述指导核糖核酸结构包含至少8个核苷酸的指导核糖核酸序列和至少8个核苷酸的tracr核糖核酸序列,并且其中所述tracr核糖核酸序列从5’至3’包含第一发夹和第二发夹,所述第一发夹具有比所述第二发夹更长的杆;或(d)所述指导核糖核酸多核苷酸包含被预测包含至少两个发夹的tracr核糖核酸序列,所述发夹包含少于5个碱基配对的核糖核苷酸。

39、在一些方面,本公开提供了一种脱氧核糖核酸多核苷酸,其编码本文所述的任何的工程改造的指导核糖核酸多核苷酸。

40、在一些方面,本公开提供了一种包含优化用于在生物体中表达的工程改造的核酸序列的核酸,其中所述核酸编码包含ruvc_iii结构域和hnh结构域的2类ii型cas核酸内切酶,并且其中所述核酸内切酶源自未培养的微生物。

41、在一些方面,本公开提供了一种包含优化用于在生物体中表达的工程改造的核酸序列的核酸,其中所述核酸编码包含与seq id no:1827-3637中任一个具有至少70%序列同一性的ruvc_iii结构域的核酸内切酶。在一些实施方案中,核酸内切酶包含与seq idno:3638-5460中任一个具有至少70%或至少80%序列同一性的hnh结构域。在一些实施方案中,核酸内切酶包含seq id no:5572-5591或与其具有至少70%序列同一性的变体。在一些实施方案中,核酸内切酶包含对所述核酸内切酶的n末端或c末端的近端的一个或多个核定位序列(nls)进行编码的序列。在一些实施方案中,nls包含选自seq id no:5597-5612的序列。

42、在一些实施方案中,生物体是原核生物体、细菌生物体、真核生物体、真菌生物体、植物生物体、哺乳动物生物体、啮齿动物生物体或人。在一些实施方案中,生物体是大肠杆菌,并且:(a)所述核酸序列与选自seq id no:5572-5575的序列具有至少70%、80%或90%的同一性;(b)所述核酸序列与选自seq id no:5576-5577的序列具有至少70%、80%或90%的同一性;(c)所述核酸序列与选自seq id no:5578-5580的序列具有至少70%、80%或90%的同一性;(d)所述核酸序列与seq id no:5581具有至少70%、80%或90%的同一性;(e)所述核酸序列与seq id no:5582具有至少70%、80%或90%的同一性;(f)所述核酸序列与seq id no:5583具有至少70%、80%或90%的同一性;(g)所述核酸序列与seq idno:5584具有至少70%、80%或90%的同一性;(h)所述核酸序列与seq id no:5585具有至少70%、80%或90%的同一性;(i)所述核酸序列与seq id no:5586具有至少70%、80%或90%的同一性;或(j)所述核酸序列与seq id no:5587具有至少70%、80%或90%的同一性。在一些实施方案中,生物体是人,并且:(a)所述核酸序列与seq id no:5588或seq idno:5589具有至少70%、80%或90%的同一性;或(b)所述核酸序列与seq id no:5590或seqid no:5591具有至少70%、80%或90%的同一性。

43、在一些方面,本公开提供了一种载体,其包含编码包含ruvc_iii结构域和hnh结构域的2类ii型cas核酸内切酶的核酸序列,其中所述核酸内切酶源自未培养的微生物。

44、在一些方面,本公开提供了一种载体,其包含本文所述的任何核酸。在一些实施方案中,载体进一步包含编码工程改造的指导核糖核酸结构的核酸,所述工程改造的指导核糖核酸结构被构造成与所述核酸内切酶形成复合物,所述复合物包含:a)指导核糖核酸序列,其被构造成与靶脱氧核糖核酸序列杂交;和b)tracr核糖核酸序列,其被构造成与所述核酸内切酶结合。在一些实施方案中,载体是质粒、小环、celid、腺相关病毒(aav)衍生的病毒体或慢病毒。

45、在一些方面,本公开提供了一种细胞,其包含如本文所述的任何载体。

46、在一些方面,本公开提供了一种制造核酸内切酶的方法,其包括培养如本文所述的任何细胞。

47、在一些方面,本公开提供了一种用于对双链脱氧核糖核酸多核苷酸进行结合、切割、标记或修饰的方法,所述方法包括:(a)使所述双链脱氧核糖核酸多核苷酸与跟工程改造的指导核糖核酸结构复合的2类ii型cas核酸内切酶接触,所述工程改造的指导核糖核酸结构被构造成与所述核酸内切酶和所述双链脱氧核糖核酸多核苷酸结合;(b)其中所述双链脱氧核糖核酸多核苷酸包含前间区序列邻近基序(pam);以及(c)其中所述pam包含选自seq id no:5512-5526或seq id no:5527-5537的序列。在一些实施方案中,双链脱氧核糖核酸多核苷酸包含第一链和第二链,所述第一链包含与所述工程改造的指导核糖核酸结构的序列互补的序列,所述第二链包含所述pam。在一些实施方案中,pam与跟所述工程改造的指导核糖核酸结构的所述序列互补的所述序列的3’末端直接相邻。

48、在一些实施方案中,2类ii型cas核酸内切酶不是cas9核酸内切酶、cas14核酸内切酶、cas12a核酸内切酶、cas12b核酸内切酶、cas 12c核酸内切酶、cas12d核酸内切酶、cas12e核酸内切酶、cas13a核酸内切酶、cas13b核酸内切酶、cas13c核酸内切酶或cas 13d核酸内切酶。在一些实施方案中,2类ii型cas核酸内切酶源自未培养的微生物。在一些实施方案中,双链脱氧核糖核酸多核苷酸是真核、植物、真菌、哺乳动物、啮齿动物或人双链脱氧核糖核酸多核苷酸。

49、在一些实施方案中:(a)所述pam包含选自seq id no:5512-5515和seq id no:5527-5530的序列;(b)所述pam包含seq id no:5516或seq id no:5531;(c)所述pam包含seq id no:5539;(d)所述pam包含seq id no:5517或seq id no:5518;(e)所述pam包含seqid no:5519;(f)所述pam包含seq id no:5520或seq id no:5535;(g)所述pam包含seq idno:5521或seq id no:5536;(h)所述pam包含seq id no:5522;(i)所述pam包含seq id no:5523或seq id no:5537;(j)所述pam包括seq id no:5524;(k)所述pam包含seq id no:5525;或(l)所述pam包含seq id no:5526。

50、在一些方面,本公开提供了一种修饰靶核酸基因座的方法,所述方法包括将本文所述的任何工程改造的核酸酶系统递送至所述靶核酸基因座,其中所述核酸内切酶被构造成与所述工程改造的指导核糖核酸结构形成复合物,并且其中所述复合物被构造成使得在所述复合物与所述靶核酸基因座结合后,所述复合物修饰所述靶核酸基因座。在一些实施方案中,修饰所述靶核酸基因座包括对所述靶核酸基因座进行结合、切口、切割或标记。在一些实施方案中,靶核酸基因座包含脱氧核糖核酸(dna)或核糖核酸(rna)。在一些实施方案中,靶核酸包含基因组dna、病毒dna、病毒rna或细菌dna。在一些实施方案中,靶核酸基因座是在体外。在一些实施方案中,靶核酸基因座在细胞内。在一些实施方案中,细胞是原核细胞、细菌细胞、真核细胞、真菌细胞、植物细胞、动物细胞、哺乳动物细胞、啮齿动物细胞、灵长类细胞或人细胞。

51、在一些实施方案中,将所述工程改造的核酸酶系统递送至所述靶核酸基因座包括递送如权利要求135-140任一项所述的核酸或如权利要求142-146任一项所述的载体。在一些实施方案中,将所述工程改造的核酸酶系统递送至所述靶核酸基因座包括递送包含编码所述核酸内切酶的开放阅读框的核酸。在一些实施方案中,核酸包含启动子,编码所述核酸内切酶的所述开放阅读框可操作地连接至所述启动子。在一些实施方案中,将所述工程改造的核酸酶系统递送至所述靶核酸基因座包括递送包含编码所述核酸内切酶的所述开放阅读框的加帽mrna。在一些实施方案中,将所述工程改造的核酸酶系统递送至所述靶核酸基因座包括递送翻译的多肽。在一些实施方案中,将所述工程改造的核酸酶系统递送至所述靶核酸基因座包括递送对与核糖核酸(rna)pol iii启动子可操作地连接的所述工程改造的指导核糖核酸结构进行编码的脱氧核糖核酸(dna)。在一些实施方案中,核酸内切酶在所述靶基因座处或所述靶基因座的近端诱导单链断裂或双链断裂。

52、从以下详细说明中,本公开的其他方面和优点对于本领域技术人员将变得显而易见,其中仅示出和描述了本公开的说明性实施方案。如将认识到的,本公开能够具有其他和不同的实施方案,并且所有这些在不脱离本公开的情况下其若干细节能够在各个明显方面进行修改。因此,应该认为附图和说明本质上都是示例性的,而不是限制性的。

53、援引并入

54、本说明书中提到的所有出版物、专利和专利申请均通过引用并入本文,其程度如同每个单独的出版物、专利或专利申请被明确地并单独地指出通过引用的方式并入一样。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1