包含变体多肽的组合物及其用途的制作方法

文档序号:36507206发布日期:2023-12-28 19:24阅读:78来源:国知局
包含变体多肽的组合物及其用途的制作方法


背景技术:

1、成簇规律间隔短回文重复序列(crispr)和crispr相关(cas)基因(统称为crispr-cas或crispr/cas系统)是古细菌和细菌中针对外来遗传元件而防御特定物种的适应性免疫系统。


技术实现思路

1、正是在上述背景下,本发明提供了优于现有技术的某些优点和进步。

2、尽管本文披露的本发明不限于特定的优点或功能,但本发明提供了变体多肽,相对于seq id no:3的亲本多肽,该变体多肽包含改变,其中该改变是表2的取代。在一些实施例中,取代是p14r取代、e311r取代、d32r取代、i61r取代、g223r取代、n109r取代、和/或d719r取代。

3、在某些实施例中,变体多肽包含a)p14r取代、e311r取代、和d32r取代;b)p14r取代、e311r取代、和g223r取代;c)p14r取代、e311r取代、d32r取代、和i61r取代;以及d)d32r取代、n109r取代、e311r取代、和d719r取代。在一些实施例中,变体多肽包含c)p14r取代、e311r取代、d32r取代、和i61r取代。

4、在一些实施例中,变体多肽进一步包含k208g取代、d302g取代、d590g取代、e154g取代、d567g取代、l38g取代、d145g取代、c13g取代、t338g取代、p14g取代、d55g取代、k221g取代、k35g取代、和e736g取代。

5、在一方面,本披露提供了变体多肽,该变体多肽包含与seq id no:3具有至少95%同一性的氨基酸序列并且相对于seq id no:3,包含在以下位置中的一个或多个处的取代:p14、e311、d32、i61、g223、n109、和d719。

6、在一方面,本披露提供了变体多肽,该变体多肽包含与seq id no:3具有至少95%同一性的氨基酸序列并且包含以下取代中的一个或多个:p14r、e311r、d32r、i61r、g223r、n109r、和d719r。

7、在一方面,本披露提供了变体多肽,该变体多肽包含与seq id no:3具有至少95%同一性的氨基酸序列并且相对于seq id no:3,包含在以下位置中的一个或多个处的取代:k208、d302、d590、e154、d567、l38、d145、c13、t338、p14、d55、k221、k35、和e736。

8、在一方面,本披露提供了变体多肽,该变体多肽包含与seq id no:3具有至少95%同一性的氨基酸序列并且包含以下取代中的一个或多个:k208g、d302g、d590g、e154g、d567g、l38g、d145g、c13g、t338g、p14g、d55g、k221g、k35g、和e736g。

9、在一些实施例中,变体多肽包含在p14处的取代(例如,p14r取代)。在某些实施例中,变体多肽包含在e311处的取代(例如,e311r取代)。在一些实施例中,变体多肽包含在d32处的取代(例如,d32r取代)。在某些实施例中,变体多肽包含在i61处的取代(例如,i61r取代)。在一些实施例中,变体多肽包含在g223处的取代(例如,g223取代)。在某些实施例中,变体多肽包含在n109处的取代(例如,n109r取代)。在一些实施例中,变体多肽包含在d719处的取代(例如,d719r取代)。

10、在某些实施例中,变体多肽包含在以下位置处的取代:p14(例如,p14r取代)、e311(例如,e311r取代)、d32(例如,d32r取代)、i61(例如,i61r取代)、g223(例如,g223取代)、n109(例如,n109r取代)、d719(例如,d719r取代)、或其任何组合。

11、在一些实施例中,相对于seq id no:3,变体多肽包含在以下位置处的取代:p14(例如,p14r取代)、e311(例如,e311r)、和d32(例如,d32r取代)(例如,p14r、e311r、d32r变体多肽)。

12、在一些实施例中,相对于seq id no:3,变体多肽包含在以下位置处的取代:p14(例如,p14r取代)、e311(例如,e311r)、和g223(例如,g223r取代)(例如,p14r、e311r、g223r变体多肽)。

13、在某些实施例中,相对于seq id no:3,变体多肽包含在以下位置处的取代:p14(例如,p14r取代)、e311(例如,e311r)、d32(例如,d32r取代)、和i61(例如,i61r取代)(例如,p14r、e311r、d32r和i61r变体多肽)。

14、在一些实施例中,相对于seq id no:3,变体多肽包含在以下位置处的取代:d32r(例如,d32r取代)、n109(例如,n109r)、e311(例如,e311r取代)、和d719(例如,d719r取代)(例如,d32r、n109r、e311r和d719r变体多肽)。

15、在某些实施例中,变体多肽包含在以下位置处的取代:k208(例如,k208g取代)、d302(例如,d302g取代)、d590(例如,d590g取代)、e154(例如,e154g取代)、d567(例如,d567g取代)、l38(例如,l38g取代)、d145(例如,d145g取代)、c13(例如,c13g取代)、t338(例如,t338g取代)、p14(例如,p14g取代)、d55(例如,d55g取代)、k221(例如,k221g取代)、k35(例如,k35g取代)、和e736(例如,e736g取代)、或其任何组合。

16、在特定的实施例中,相对于亲本多肽,该变体多肽表现出增加的与rna指导物的二元复合物形成。在某些实施例中,相对于亲本二元复合物,包含该变体多肽的二元复合物表现出增加的稳定性。

17、在一些实施例中,相对于亲本多肽,该变体多肽表现出增加的核酸酶活性。

18、在一方面,本披露提供了包含本文所述的变体多肽的组合物,其中组合物进一步包含rna指导物或编码rna指导物的核酸,其中rna指导物包含同向重复序列和间隔子序列。在某些实施例中,同向重复序列与seq id no:4-13中的任一个具有至少90%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)同一性,或者包含与seq idno:14或seq id no:15具有至少90%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)同一性的序列。在一些实施例中,同向重复序列与seq id no:4-13中的任一个具有至少95%(例如,95%、96%、97%、98%、99%或100%)同一性,或者包含与seqid no:14或seq id no:15具有至少95%(例如,95%、96%、97%、98%、99%或100%)同一性的序列。在一些实施例中,同向重复序列是seq id no:4-13中的任一个或者包含seq idno:14或seq id no:15的序列。

19、在一些实施例中,间隔子序列的长度为约15个核苷酸至约35个核苷酸。

20、在某些实施例中,间隔子序列与靶核酸的靶链序列结合,并且其中靶核酸序列的非靶链序列与原型间隔子相邻基序(pam)序列相邻。在一些实施例中,pam序列是5’-ttr-3’、5’-nttr-3’、5’-nttn-3’、5’-rttr-3’、5’-attr-3’、或5’-rttg-3’,其中n是任何核苷酸,y是c或t,并且r是a或g。在某些实施例中,pam序列是5’-ttg-3’、5’-tta-3’、5’-attg-3’、5’-ttta-3’、或5’-tttg-3’。

21、在某些实施例中,变体多肽进一步包含核定位信号(nls)。

22、在一些实施例中,变体多肽进一步包含肽标签、荧光蛋白、碱基编辑结构域、dna甲基化结构域、组蛋白残基修饰结构域、定位因子、转录修饰因子、光门控因子、化学诱导型因子或染色质可视化因子。

23、在一方面,本披露提供了包含核酸的组合物,该核酸编码本文任一处所述的变体多肽和/或rna指导物。在一些实施例中,核酸经密码子优化以用于在细胞中表达。在某些实施例中,核酸可操作地连接至启动子。在一些实施例中,核酸位于载体中。在某些实施例中,该载体包括逆转录病毒载体、慢病毒载体、噬菌体载体、腺病毒载体、腺相关载体或单纯疱疹载体。

24、在一些实施例中,变体多肽存在于包含纳米颗粒(例如,脂质纳米颗粒)、脂质体、外泌体、微泡、或基因枪的递送系统中。

25、在一方面,本披露提供了细胞,该细胞包含如任一前述方面或实施例所述的变体多肽或组合物。

26、在一些实施例中,细胞是真核细胞。在某些实施例中,细胞是哺乳动物细胞或植物细胞。在某些实施例中,细胞是人细胞。

27、在一方面,本披露提供了组合物,该组合物包含变体多肽、或含有该变体多肽的复合物,其中相对于seq id no:3的亲本多肽,该变体多肽包含改变,并且其中相对于亲本多肽或包含该亲本多肽的复合物,该变体多肽或该复合物表现出增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性。

28、在一些实施例中,改变是表2的取代。

29、在某些实施例中,取代是p14r取代、e311r取代、d32r取代、i61r取代、g223r取代、n109r取代、和/或d719r取代。

30、在一些实施例中,变体多肽包含a)p14r取代、e311r取代、和d32r取代;b)p14r取代、e311r取代、和g223r取代;c)p14r取代、e311r取代、d32r取代、和i61r取代;以及d)d32r取代、n109r取代、e311r取代、和d719r取代。

31、在某些实施例中,变体多肽进一步包含k208g取代、d302g取代、d590g取代、e154g取代、d567g取代、l38g取代、d145g取代、c13g取代、t338g取代、p14g取代、d55g取代、k221g取代、k35g取代、和e736g取代。

32、在一些实施例中,该增强的酶活性是增强的核酸酶活性。

33、在某些实施例中,相对于该亲本多肽,该变体多肽表现出增强的与rna指导物的结合活性。

34、在一些实施例中,相对于该亲本多肽,该变体多肽表现出增强的与rna指导物的结合特异性。

35、在一些实施例中,该含有该变体多肽的复合物是进一步包含rna指导物的变体二元复合物,并且相对于亲本二元复合物,该变体二元复合物表现出增强的与靶核酸的结合活性(例如,中靶结合活性)。

36、在又一个实施例中,该含有该变体多肽的复合物是进一步包含rna指导物的变体二元复合物,并且相对于亲本二元复合物,该变体二元复合物表现出增强的与靶核酸的结合特异性(例如,中靶结合特异性)。

37、在一些实施例中,该含有该变体多肽的复合物是进一步包含rna指导物的变体二元复合物,并且相对于亲本二元复合物,该变体二元复合物表现出增强的稳定性。

38、在某些实施例中,该变体二元复合物和靶核酸形成变体三元复合物,并且相对于亲本三元复合物,该变体三元复合物表现出增加的稳定性。

39、在一些实施例中,相对于该亲本多肽,该变体多肽进一步表现出增强的二元复合物形成、增强的蛋白质-rna相互作用、和/或降低的与rna指导物的解离。

40、在某些实施例中,相对于该亲本二元复合物,该变体二元复合物进一步表现出降低的与靶核酸的解离、和/或降低的与非靶核酸的脱靶结合。

41、在一些实施例中,该增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在例如20℃至65℃(例如,20℃至30℃、30℃至40℃、40℃至50℃、50℃至60℃、或60℃至65℃)的温度范围内。

42、在某些实施例中,该增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在一定孵育时间范围内。

43、在一些实施例中,该增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在具有约7.3至约8.6(例如,约7.5至约8.0、约7.8至8.3、或约8.0至8.6)范围内的ph的缓冲液中。

44、在某些实施例中,当该变体多肽、变体二元复合物、或变体三元复合物的tm值比该亲本多肽、亲本二元复合物、或亲本三元复合物的tm值大至少8℃时,该增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生。

45、在一些实施例中,该变体多肽包含ruvc结构域或拆分型ruvc结构域。

46、在某些实施例中,该亲本多肽包含seq id no:3的序列。

47、在一些实施例中,该rna指导物包含同向重复序列和间隔子序列。

48、在一些实施例中,同向重复序列与seq id no:4-13中的任一个具有至少90%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)同一性,或者包含与seq id no:14或seq id no:15具有至少90%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)同一性的序列。

49、在一些实施例中,同向重复序列与seq id no:4-13中的任一个具有至少95%(例如,95%、96%、97%、98%、99%或100%)同一性,或者包含与seq id no:14或seq id no:15具有至少95%(例如,95%、96%、97%、98%、99%或100%)同一性的序列。在一些实施例中,同向重复序列是seq id no:4-13中的任一个或者包含seq id no:14或seq id no:15的序列。

50、在某些实施例中,该间隔子序列的长度为15至35个核苷酸。

51、在某些实施例中,该间隔子序列包含与靶核酸的靶链序列的互补性。

52、在一些实施例中,该靶核酸包含与原型间隔子相邻基序(pam)序列相邻的非靶链序列。在某些实施例中,pam序列是5’-ttr-3’、5’-nttr-3’、5’-nttn-3’、5’-rttr-3’、5’-attr-3’、或5’-rttg-3’,其中n是任何核苷酸,y是c或t,并且r是a或g。在一些实施例中,pam序列是5’-ttg-3’、5’-tta-3’、5’-attg-3’、5’-ttta-3’、或5’-tttg-3’。

53、在某些实施例中,变体多肽进一步包含肽标签、荧光蛋白、碱基编辑结构域、dna甲基化结构域、组蛋白残基修饰结构域、定位因子、转录修饰因子、光门控因子、化学诱导型因子或染色质可视化因子。

54、在一方面,本披露提供了包含核酸的组合物,该核酸编码如前述方面或其实施例所述的变体多肽,其中任选地,该核酸经密码子优化以用于在细胞中表达。

55、在一些实施例中,细胞是真核细胞。

56、在一些实施例中,细胞是哺乳动物细胞或植物细胞。在某些实施例中,细胞是人细胞。

57、在一些实施例中,该编码该变体多肽的核酸可操作地连接至启动子。

58、在某些实施例中,该编码该变体多肽的核酸位于载体中。

59、在一些实施例中,该载体包括逆转录病毒载体、慢病毒载体、噬菌体载体、腺病毒载体、腺相关载体或单纯疱疹载体。

60、在某些实施例中,该组合物存在于包含纳米颗粒(例如,脂质纳米颗粒)、脂质体、外泌体、微泡、或基因枪的递送组合物中。

61、在一方面,本披露提供了用于编辑细胞中的基因的方法,该方法包括使该细胞与如前述方面或实施例中任一项所述的变体多肽或组合物接触。

62、在一方面,本披露提供了核酸分子,该核酸分子编码如前述实施例的方面中任一项所述的变体多肽。

63、在某些实施例中,该核酸分子的序列与选自由seq id no:1、2、或21-27组成的组的序列具有95%同一性。在一些实施例中,该核酸分子的序列包含选自由seq id no:1、2、或21-27组成的组的序列。在某些实施例中,该核酸分子的序列与选自由seq id no:22、23、或25组成的组的序列具有95%同一性。

64、尽管本文披露的本发明不限于特定的优点或功能,但本发明提供了变体多肽和/或包含变体多肽的组合物,其中相对于seq id no:3的亲本多肽,变体多肽包含改变,并且其中相对于亲本多肽或包含亲本多肽的复合物,变体多肽或包含变体多肽的复合物表现出增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性。

65、在一些方面,该增强的酶活性是增强的核酸酶活性。

66、在一些方面,相对于该亲本多肽,该变体多肽表现出增强的与rna指导物的结合活性。

67、在一些方面,相对于该亲本多肽,该变体多肽表现出增强的与rna指导物的结合特异性。

68、在一些方面,变体多肽和rna指导物形成变体二元复合物,并且相对于亲本二元复合物,该变体二元复合物表现出增强的与靶核酸的结合活性(例如,中靶结合活性)。

69、在一些方面,变体多肽和rna指导物形成变体二元复合物,并且相对于亲本二元复合物,该变体二元复合物表现出增强的与靶核酸的结合特异性(例如,中靶结合特异性)。

70、在一些方面,变体多肽和rna指导物形成变体二元复合物,并且相对于亲本二元复合物,该变体二元复合物表现出增强的稳定性。

71、在一些方面,该变体二元复合物和靶核酸形成变体三元复合物,并且相对于亲本三元复合物,该变体三元复合物表现出增加的稳定性。

72、在一些方面,相对于该亲本多肽,该变体多肽进一步表现出增强的二元复合物形成、增强的蛋白质-rna相互作用、和/或降低的与rna指导物的解离。

73、在一些方面,相对于该亲本二元复合物,该变体二元复合物进一步表现出降低的与靶核酸的解离、和/或降低的与非靶核酸的脱靶结合。

74、在一些方面,该增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在例如20℃至65℃(例如,20℃至30℃、30℃至40℃、40℃至50℃、50℃至60℃、或60℃至65℃)的温度范围内。

75、在一些方面,该增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在一定孵育时间范围内。

76、在一些方面,该增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在具有约7.3至约8.6(例如,约7.5至约8.0、约7.8至8.3、或约8.0至8.6)范围内的ph的缓冲液中。

77、在一些方面,当该变体多肽、变体二元复合物、或变体三元复合物的tm值比该亲本多肽、亲本二元复合物、或亲本三元复合物的tm值大至少8℃时,该增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生。

78、在其他方面,改变包含相对于具有seq id no:3中所示的序列的亲本多肽的氨基酸序列改变,其中改变包含与具有seq id no:3中所示的序列的亲本多肽相比的一个或多个(例如,一个、两个、三个、四个、五个或更多个)取代、插入、缺失、和/或添加。

79、在一些方面,改变包含相对于seq id no:3中所示的亲本多肽序列的氨基酸序列改变,其中改变包含表2中列出的一个或多个氨基酸取代。

80、在一些方面,改变包含精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸、丙氨酸、或甘氨酸取代。

81、在一些方面,改变是选自p14r、e311r、d32r、i61r、g223r、n109r、和/或d719r的氨基酸取代。

82、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置p14处的取代(例如,p14r取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置p14处的取代(例如,p14r取代)。

83、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置e311处的取代(例如,e311r取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置e311处的取代(例如,e311r取代)。

84、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置d32处的取代(例如,d32r取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置d32处的取代(例如,d32r取代)。

85、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置i61处的取代(例如,i61r取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置i61处的取代(例如,i61r取代)。

86、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置g223处的取代(例如,g223r取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置g223处的取代(例如,g223r取代)。

87、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置n109处的取代(例如,n109r取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置n109处的取代(例如,n109r取代)。

88、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置d719处的取代(例如,d719r取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置d719处的取代(例如,d719r取代)。

89、在一些方面,改变是表3中列出的氨基酸取代的组合。

90、在一些方面,氨基酸取代的组合包含以下列出的取代:a)p14r、e311r、d32r;b)p14r、e311r、g223r;c)p14r、e311r、d32r、i61r;或d)d32r、n109r、e311r、d719r。

91、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸,并且相对于seq id no:3,包含在以下位置处的取代:p14(例如,p14r取代)、e311(例如,e311r)、和d32(例如,d32r取代)(例如,p14r、e311r、d32r变体多肽)。

92、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸,并且相对于seq id no:3,包含在以下位置处的取代:p14(例如,p14r取代)、e311(例如,e311r)、和g223(例如,g223r取代)(例如,p14r、e311r、g223r变体多肽)。

93、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸,并且相对于seq id no:3,包含在以下位置处的取代:p14(例如,p14r取代)、e311(例如,e311r)、d32(例如,d32r取代)、和i61(例如,i61r取代)(例如,p14r、e311r、d32r和i61r变体多肽)。

94、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸,并且相对于seq id no:3,包含在以下位置处的取代:d32r(例如,d32r取代)、n109(例如,n109r)、e311(例如,e311r取代)、和d719(例如,d719r取代)(例如,d32r、n109r、e311r和d719r变体多肽)。

95、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置k208处的取代(例如,k208g取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置k208处的取代(例如,k208g取代)。

96、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置d302处的取代(例如,d302g取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置d302处的取代(例如,d302g取代)。

97、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置d590处的取代(例如,d590g取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置d590处的取代(例如,d590g取代)。

98、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置e154处的取代(例如,e154g取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置e154处的取代(例如,e154g取代)。

99、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置d567处的取代(例如,d567g取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置d567处的取代(例如,d567g取代)。

100、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置l38处的取代(例如,l38g取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置l38处的取代(例如,l38g取代)。

101、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置d145处的取代(例如,d145g取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置d145处的取代(例如,d145g取代)。

102、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置c13处的取代(例如,c13g取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置c13处的取代(例如,c13g取代)。

103、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置t338处的取代(例如,t338g取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置t338处的取代(例如,t338g取代)。

104、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置p14处的取代(例如,p14g取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置p14处的取代(例如,p14g取代)。

105、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置d55处的取代(例如,d55g取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置d55处的取代(例如,d55g取代)。

106、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置k221处的取代(例如,k221g取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置k221处的取代(例如,k221g取代)。

107、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置k35处的取代(例如,k35g取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置k35处的取代(例如,k35g取代)。

108、在一些方面,本披露提供了多肽,该多肽包含与seq id no:3具有至少95%、96%、97%、98%、或99%同一性的氨基酸序列并且相对于seq id no:3,包含在位置e736处的取代(例如,e736g取代)。在一些方面,本披露提供了多肽,该多肽包含在seq id no:3的至多1、2、3、4、5、10、15、20、25、30、或35个氨基酸位置处具有一个或多个序列改变(例如,取代、插入、或缺失、或其任何组合)的氨基酸序列,其中相对于seq id no:3,这些序列改变中的一个包含在位置e736处的取代(例如,e736g取代)。

109、在一些方面,变体多肽包含ruvc结构域或拆分型ruvc结构域。

110、在一些方面,变体多肽包含一个或多个催化残基(例如,天冬氨酸或谷氨酸)。在一些方面,一个或多个催化残基包含d328和e530。在一些方面,一个或多个催化残基进一步包含d684、d646、或d621。

111、在一些方面,包含变体多肽的组合物或复合物进一步包含rna指导物,并且rna指导物包含同向重复序列和间隔子序列。

112、在一些方面,rna指导物包含同向重复序列和间隔子序列。

113、在一些方面,同向重复序列包含与seq id no:4-13中的任一个具有至少95%序列同一性的核苷酸序列。

114、在一些方面,同向重复序列包含seq id no:4-13中的任一个的核苷酸序列。

115、在一些方面,间隔子序列的长度为15至35个核苷酸。

116、在一些方面,靶核酸包含与间隔子序列中的核苷酸序列互补的序列。

117、在一些方面,靶核酸与原型间隔子相邻基序(pam)序列相邻,其中pam序列包含核苷酸序列,其如5’-nttr-3’、5’-nttn-3’、5’-rttr-3’、5’-attr-3’、或5’-rttg-3’所示,其中n是任何核苷酸并且r是a或g。在一些实施例中,pam序列包含核苷酸序列,其如5’-gtta-3’、5’-tttg-3’、5’-cttg-3’、5’-gttg-3’、5’-ttta-3’、5’-ctta-3’、5’-attg-3’、5’-atta-3’、5’-actg-3’、5’-cata-3’、5’-ttga-3’、或5’-tata-3’所示。

118、在一些方面,靶核酸是单链dna或双链dna。

119、在一些方面,变体多肽进一步包含肽标签、荧光蛋白、碱基编辑结构域、dna甲基化结构域、组蛋白残基修饰结构域、定位因子、转录修饰因子、光门控因子、化学诱导型因子或染色质可视化因子。

120、在一些方面,编码变体多肽的核酸经密码子优化以用于在细胞中表达。

121、在一些方面,编码变体多肽的核酸可操作地连接至启动子。

122、在一些方面,编码变体多肽的核酸位于载体中。

123、在一些方面,载体包括逆转录病毒载体、慢病毒载体、噬菌体载体、腺病毒载体、腺相关载体或单纯疱疹载体。

124、在一些方面,组合物存在于递送组合物中,该递送组合物包含纳米颗粒、脂质体、外泌体、微泡或基因枪。

125、本发明进一步提供了细胞,其包含本文披露的变体多肽和/或组合物。在一些方面,细胞是真核细胞或原核细胞。在一些方面,细胞是哺乳动物细胞或植物细胞。在一些方面,细胞是人细胞。

126、本发明进一步提供了制备本文披露的变体多肽和/或组合物的方法。

127、本发明进一步提供了使变体多肽与本文披露的rna指导物复合的方法。

128、本发明进一步提供了使变体二元复合物与本文披露的靶核酸复合的方法。

129、本发明进一步提供了递送本文披露的变体多肽和/或组合物的方法。

130、本发明还进一步提供了组合物,组合物包含变体多肽、或含有变体多肽和rna指导物的复合物,其中相对于seq id no:3的亲本多肽,变体多肽包含改变,并且其中相对于亲本多肽或包含亲本多肽和rna指导物的复合物,变体多肽或复合物表现出增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性。

131、在一些方面,该增强的酶活性是增强的核酸酶活性。

132、在一些方面,相对于该亲本多肽,该变体多肽表现出增强的与rna指导物的结合活性。

133、在一些方面,相对于该亲本多肽,该变体多肽表现出增强的与rna指导物的结合特异性。

134、在一些方面,变体多肽和rna指导物形成变体二元复合物,并且相对于亲本二元复合物,该变体二元复合物表现出增强的与靶核酸的结合活性(例如,中靶结合活性)。

135、在一些方面,变体多肽和rna指导物形成变体二元复合物,并且相对于亲本二元复合物,该变体二元复合物表现出增强的与靶核酸的结合特异性(例如,中靶结合特异性)。

136、在一些方面,变体多肽和rna指导物形成变体二元复合物,并且相对于亲本二元复合物,该变体二元复合物表现出增强的稳定性。

137、在一些方面,该变体二元复合物和靶核酸形成变体三元复合物,并且相对于亲本三元复合物,该变体三元复合物表现出增加的稳定性。

138、在一些方面,相对于该亲本多肽,该变体多肽进一步表现出增强的二元复合物形成、增强的蛋白质-rna相互作用、和/或降低的与rna指导物的解离。

139、在一些方面,相对于该亲本二元复合物,该变体二元复合物进一步表现出降低的与靶核酸的解离、和/或降低的与非靶核酸的脱靶结合。

140、在一些方面,该增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在例如20℃至65℃的温度范围内。

141、在一些方面,该增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在一定孵育时间范围内。

142、在一些方面,该增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在具有约7.3至约8.6(例如,约7.5至约8.0、约7.8至8.3、或约8.0至8.6)范围内的ph的缓冲液中。

143、在一些方面,当该变体多肽、变体二元复合物、或变体三元复合物的tm值比该亲本多肽、亲本二元复合物、或亲本三元复合物的tm值大至少8℃时,该增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生。

144、在其他方面,改变包含相对于具有seq id no:3中所示的序列的亲本多肽的氨基酸序列改变,其中改变包含与具有seq id no:3中所示的序列的亲本多肽相比的一个或多个(例如,一个、两个、三个、四个、五个或更多个)取代、插入、缺失、和/或添加。

145、在一些方面,改变包含相对于seq id no:3中所示的亲本多肽序列的氨基酸序列改变,其中改变包含表2中列出的一个或多个氨基酸取代。

146、在一些方面,改变包含精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸、丙氨酸、或甘氨酸取代。

147、在一些方面,变体多肽包含ruvc结构域或拆分型ruvc结构域。

148、在一些方面,变体多肽包含一个或多个催化残基(例如,天冬氨酸或谷氨酸)。在一些方面,一个或多个催化残基包含d328和e530。在一些方面,一个或多个催化残基进一步包含d684、d646、或d621。

149、在一些方面,rna指导物包含同向重复序列和间隔子序列。

150、在一些方面,同向重复序列包含与seq id no:4-13中的任一个具有至少95%序列同一性的核苷酸序列。

151、在一些方面,同向重复序列包含seq id no:4-13中的任一个的核苷酸序列。

152、在一些方面,间隔子序列的长度为15至35个核苷酸。

153、在一些方面,靶核酸包含与间隔子序列中的核苷酸序列互补的序列。

154、在一些方面,靶核酸与pam序列相邻,其中pam序列包含核苷酸序列,其如5’-nttr-3’、5’-nttn-3’、5’-rttr-3’、5’-attr-3’、或5’-rttg-3’所示,其中n是任何核苷酸并且r是a或g。在一些实施例中,pam序列包含核苷酸序列,其如5’-gtta-3’、5’-tttg-3’、5’-cttg-3’、5’-gttg-3’、5’-ttta-3’、5’-ctta-3’、5’-attg-3’、5’-atta-3’、5’-actg-3’、5’-cata-3’、5’-ttga-3’、或5’-tata-3’所示。

155、在一些方面,靶核酸是单链dna或双链dna。

156、在一些方面,变体多肽进一步包含肽标签、荧光蛋白、碱基编辑结构域、dna甲基化结构域、组蛋白残基修饰结构域、定位因子、转录修饰因子、光门控因子、化学诱导型因子或染色质可视化因子。

157、在一些方面,编码变体多肽的核酸经密码子优化以用于在细胞中表达。

158、在一些方面,编码变体多肽的核酸可操作地连接至启动子。

159、在一些方面,编码变体多肽的核酸位于载体中。

160、在一些方面,载体包括逆转录病毒载体、慢病毒载体、噬菌体载体、腺病毒载体、腺相关载体或单纯疱疹载体。

161、在一些方面,组合物或复合物存在于递送组合物中,该递送组合物包含纳米颗粒、脂质体、外泌体、微泡或基因枪。

162、本发明进一步提供了细胞,其包含本文披露的变体多肽和/或复合物。在一些方面,细胞是真核细胞或原核细胞。在一些方面,细胞是哺乳动物细胞或植物细胞。在一些方面,细胞是人细胞。

163、本发明进一步提供了制备本文披露的变体多肽和/或复合物的方法。

164、本发明进一步提供了使变体多肽与本文披露的rna指导物复合的方法。

165、本发明进一步提供了使变体二元复合物与本文披露的靶核酸复合的方法。

166、本发明进一步提供了递送本文披露的变体多肽和/或复合物的方法。

167、定义

168、本发明将相对于特定实施例并参考某些附图进行描述,但本发明不限于此,而仅由权利要求来限定。除非另有说明,否则下文阐述的术语通常应以其常见意义来理解。

169、除非另外定义,本文所用的科学术语和技术术语具有本领域普通技术人员普遍理解的含义。在任何潜在的歧义情况下,本文提供的定义优先于任何字典或外部定义。除非上下文另有要求,否则单数术语应包括复数形式,并且复数术语应包括单数形式。除非另有说明,否则“或”的使用意指“和/或”。术语“包括(including)”以及其他形式(如“包括(includes和included)”)的使用没有限制性。

170、通常,本文所述的结合细胞和组织培养、分子生物学、免疫学、微生物学、遗传学以及蛋白质和核酸化学和杂交使用的命名是本领域中熟知并且普遍使用的那些。除非另外指明,否则本文提供的方法及技术可根据本领域中熟知的常规方法且如贯穿本说明书所引用及论述的各种通用及更特定参考文献中所描述来进行。酶促反应和纯化方法是根据制造商说明书来进行,如本领域中普遍完成的或如本文所述。结合本文所述的分析化学、合成有机化学、以及医学和药物化学使用的命名,它们的实验室程序和技术是本领域中熟知并且普遍使用的那些。使用标准技术进行化学合成、化学分析、药物制备、配制、递送以及患者的治疗。

171、为了使本披露可以容易地理解,下面定义了选定的术语。

172、本文中使用的冠词“一个/种(a/an)”是指一个/种或多于一个/种(即,至少一个/种)该冠词的语法宾语。举例来说,“一个元素”意指一个元素或多于一个元素。

173、当指可测量的值如量、时距等时,如本文所用的“约”意指涵盖自指定值±20%或±10%,更优选±5%,甚至更优选±1%,以及还更优选±0.1%的变化,因为这样的变化适于进行所披露的方法。

174、如本文所用,术语“复合物”是指两个或更多个分子的群化。在一些实施例中,复合物包含彼此相互作用(例如,结合、接触、粘附)的多肽和核酸分子。

175、如本文所用,术语“二元复合物”是指两个分子(例如,多肽和核酸分子)的群化。在一些实施例中,二元复合物是指多肽和靶向部分(例如,rna指导物)的群化。在一些实施例中,二元复合物是指核糖核蛋白(rnp)。如本文所用,术语“变体二元复合物”是指变体多肽和rna指导物的群化。如本文所用,术语“亲本二元复合物”是指亲本多肽和rna指导物或参考多肽和rna指导物的群化。

176、如本文所用,术语“三元复合物”是指三个分子(例如,一个多肽和两个核酸分子)的群化。在一些实施例中,“三元复合物”是指多肽、rna分子和dna分子的群化。在一些实施例中,三元复合物是指多肽、靶向部分(例如,rna指导物)和靶核酸(例如,靶dna分子)的群化。在一些实施例中,“三元复合物”是指二元复合物(例如,核糖核蛋白)和第三分子(例如,靶核酸)的群化。

177、如本文所用,术语“结构域”是指多肽的不同功能和/或结构单元。在一些实施例中,结构域可包含保守氨基酸序列。

178、如本文所用,术语“亲本”、“亲本多肽”和“亲本序列”是指对其进行改变以产生本发明的变体多肽的原始多肽(例如,参考多肽或起始多肽)。

179、如本文所用,术语“原型间隔子相邻基序”或“pam”是指与包含效应子(例如,核酸酶)和rna指导物的复合物所结合的靶序列相邻的dna序列。在一些实施例中,pam是酶活性所需的。该“靶核酸”是双链分子:一条链包含与pam相邻的靶序列并且被称为“pam链”(例如,非靶链或非间隔子互补链),而另一条互补链被称为“非-pam链”(例如,靶链或间隔子互补链)。如本文所用,术语“相邻”包括复合物的rna指导物与紧邻pam的靶序列特异性结合、相互作用或缔合的情况。在此类情况下,在靶序列与pam之间没有核苷酸。术语“相邻”还包括在与靶向部分结合的靶序列与pam之间存在少数(例如,1、2、3、4或5个)核苷酸的情况。

180、如本文所用,术语“参考组合物”、“参考分子”、“参考序列”和“参考”是指对照,例如阴性对照或亲本(例如,亲本序列、亲本蛋白质或野生型蛋白质)。例如,参考分子是指与变体多肽进行比较的多肽。同样,参考rna指导物是指与经修饰的rna指导物进行比较的靶向部分。变体或经修饰的分子可基于序列(例如,变体或经修饰的分子可与参考分子具有x%序列同一性或同源性)、热稳定性或活性(例如,变体或经修饰的分子可具有参考分子的x%的活性)与参考分子进行比较。例如,变体或经修饰的分子可表征为具有参考多肽的不超过10%的活性,或可表征为具有比参考多肽高至少10%的活性。参考多肽的实例包括天然存在的未经修饰的多肽,例如来自古细菌或细菌物种的天然存在的多肽。在某些实施例中,参考多肽是天然存在的多肽,该多肽与所比较的变体多肽具有最接近的序列同一性或同源性。在某些实施例中,参考多肽是具有天然存在或已知序列的亲本分子,已经在该序列上进行突变以获得变体多肽。

181、如本文所用,术语“rna指导物”或“rna指导物序列”是指促进本文所述的多肽靶向靶核酸的任何rna分子。例如,rna指导物可以是识别靶核酸(例如,与其结合)的分子。rna指导物可以被设计为与靶核酸序列的靶链(例如,非pam链)互补。rna指导物包含dna靶向序列和同向重复(dr)序列。术语crispr rna(crrna)、前crrna、成熟crrna和grna在本文中也用于指rna指导物。如本文所用,术语“前crrna”是指包含dr-间隔子-dr序列的未加工rna分子。如本文所用,术语“成熟crrna”是指前crrna的加工形式;成熟crrna可以包含dr-间隔子序列,其中dr是前crrna的dr的截短形式和/或间隔子是前crrna的间隔子的截短形式。如本文所用,术语“基本上相同”是指与参考序列具有一定程度同一性的序列、多核苷酸或多肽。

182、如本文所用,术语“基本上相同”是指与参考序列具有一定程度同一性的序列、多核苷酸或多肽。

183、如本文所用,术语“靶核酸”、“靶序列”和“靶底物”是指与rna指导物特异性结合的核酸。在一些实施例中,rna指导物的dna靶向序列与靶核酸结合。

184、如本文所用,术语“变体多肽”、“变体效应子多肽”和“变体crispr核酸酶多肽”是指与亲本多肽相比在一个或多个残基位置处包含改变(例如但不限于,取代、插入、缺失、添加和/或融合)的多肽。如本文所用,术语“变体多肽”、“变体效应子多肽”和“变体crispr核酸酶多肽”是指与seq id no:3的多肽相比包含改变的多肽。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1