背景技术:
1、十多年来,基因组编辑一直被认为是一种有前途的治疗遗传疾病的治疗方法。然而,考虑到不期望的双链dna断裂、异质性修复(包括在预期位点的大的和小的插入和缺失)以及毒性的可能性,使用传统遗传编辑器在dna水平上进行操作仍然是有风险的。相反,靶向表观遗传修饰提供了改变基因表达而不导致双链断裂诱导的遗传毒性的潜力。
2、一个有希望的表观遗传沉默候选物是前蛋白转化酶枯草杆菌蛋白酶/kexin 9型(pcsk9)基因。pcsk9是治疗心脏病的关键靶标,心脏病是全世界死亡的主要原因((berberich et al.,nature rev cardiol.(2019)16(1):9-20)。位于1号染色体上的人pcsk9基因与其食蟹猴和小鼠对应物分别具有约94%和80%的同源性。该基因在启动子区具有cpg岛,并且远离其他基因和顺式调节特征。pcsk9蛋白主要由肝脏产生。
3、在人类中,pcsk9由于与ldl受体(ldlr)结合而在调节低密度脂蛋白(ldl)颗粒的循环水平中起关键作用。ldlr通过介导ldl颗粒在细胞中的内吞和降解来降低ldl颗粒的循环浓度。在不存在pcsk9的情况下,或者如果pcsk9与ldlr的相互作用被阻断,则ldlr再循环到细胞表面的速率增加,并且再循环的ldlr蛋白继续从细胞外液中去除ldl颗粒(tomblinget al.,atherosclerosis(2021)330:52-60)。相反,当内吞的ldlr与pcsk9结合时,ldlr与其乘客ldl颗粒一起降解。临床和遗传学研究已经确定循环ldl导致动脉粥样硬化性心血管疾病(ference et al.,eur heart j(2017)38:2459-72)。此外,pcsk9中的功能丧失突变与低ldl水平相关(zhao et al.,am j hum genet.(2006)79(3):514-23)。遗传或药理学降低pcsk9可减少心血管事件(ference et al.,n engl j med.(2016)375(22):2144-53;sabatine et al.,n engl j med.(2017)376(18):1713-22)。降低pcsk9表达有助于增加ldlr的再循环,这将导致较低的血液ldl颗粒浓度。
4、鉴于pcsk9在高胆固醇血症和心血管疾病发病机制中的关键作用,需要靶向pcsk9表达的新的和改进的疗法。
技术实现思路
0、发明概述
1、本公开提供了用于表观遗传修饰的系统和组合物(本文中的“表观遗传编辑器”或“表观遗传编辑系统”),以及使用其在pcsk9处产生表观遗传修饰的方法,包括在宿主细胞和生物体中。
2、在一些方面,本公开提供了用于抑制人细胞(任选地人肝细胞)中人pcsk9基因转录的系统,其包括:
3、a)一种或多种融合蛋白,其共同包含
4、dna甲基转移酶(dnmt)结构域和/或招募dnmt的结构域,任选地其中所述dnmt结构域和/或所述招募结构域包含dnmt3a结构域和/或dnmt3l结构域,并且任选地其中所述招募的dnmt是dnmt3a,和
5、转录阻遏结构域,
6、每个结构域与结合人pcsk9基因中靶区域的dna结合结构域连接;或
7、b)编码所述一种或多种融合蛋白的一种或多种核酸分子。
8、在一些实施方案中,dna结合结构域结合seq id no:1488或1489中的靶序列。在某些实施方案中,dna结合结构域将融合蛋白靶向pcsk9基因中选自seq id no:700-747和1036-1261的一个或多个序列。
9、在一些实施方案中,dna结合结构域包含死亡crispr cas(dcas)结构域、zfp结构域或tale结构域。例如,dna结合结构域可以包含dcas9结构域,并且系统可以进一步包含(i)一种或多种指导rna(例如,包含seq id no:1262-1487中的任一个),或(ii)编码一种或多种指导rna的核酸分子。在某些实施方案中,dcas结构域包含dcas9序列,例如与seq idno:12或13具有至少90%同一性的序列。
10、在一些实施方案中,融合蛋白包含死亡crispr cas(dcas)结构域,并且系统包含本文提供的一种或多种结合pcsk9的指导rna(grna)。在一些实施方案中,系统包含单个grna。在一些实施方案中,系统包含2个grna。在一些实施方案中,系统包含3个grna。在一些实施方案中,系统包含4个grna。在一些实施方案中,系统包含5个或更多个grna。在一些实施方案中,系统包含选自表2中提供的grna的grna。在一些实施方案中,系统包含选自表7中提供的grna的grna。在一些实施方案中,系统包含选自表8中提供的grna的grna。在一些实施方案中,系统包含选自表10中提供的grna的sgrna。在一些实施方案中,系统包含选自表12中提供的grna的grna。
11、在一些实施方案中,系统包含含有表10的grna009的grna靶向序列的grna,或结合与grna009相同的靶结构域序列的grna。在一些实施方案中,系统包含含有表10的grna003的grna靶向序列的grna,或结合与grna003相同的靶结构域序列的grna。在一些实施方案中,系统包含含有表10的grna093的grna靶向序列的grna,或结合与grna093相同的靶结构域序列的grna。在一些实施方案中,系统包含含有表10的grna011的grna靶向序列的grna,或结合与grna011相同的靶结构域序列的grna。在一些实施方案中,系统包含含有表10的grna007的grna靶向序列的grna,或结合与grna007相同的靶结构域序列的grna。在一些实施方案中,系统包含含有表10的grna077的grna靶向序列的grna,或结合与grna077相同的靶结构域序列的grna。在一些实施方案中,系统包含含有表10的grna113的grna靶向序列的grna,或结合与grna113相同的靶结构域序列的grna。在一些实施方案中,系统包含含有表10的grna004的grna靶向序列的grna,或结合与grna004相同的靶结构域序列的grna。在一些实施方案中,系统包含含有表10的grna008的grna靶向序列的grna,或结合与grna008相同的靶结构域序列的grna。在一些实施方案中,系统包含含有表10的grna012的grna靶向序列的grna,或结合与grna012相同的靶结构域序列的grna。在一些实施方案中,系统包含含有表10的grna111的grna靶向序列的grna,或结合与grna111相同的靶结构域序列的grna。在一些实施方案中,系统包含含有表10的grna005的grna靶向序列的grna,或结合与grna005相同的靶结构域序列的grna。在一些实施方案中,系统包含含有表10的grna013的grna靶向序列的grna,或结合与grna013相同的靶结构域序列的grna。
12、在一些实施方案中,系统包含融合蛋白9变体1(实施例12)和grna g041。在一些实施方案中,系统包含融合蛋白9变体2(实施例12)和grna g041。在一些实施方案中,系统包含融合蛋白10(实施例12)和grna g041。在一些实施方案中,系统包含融合蛋白11(实施例12)和grna g041。在一些实施方案中,系统包含融合蛋白12(实施例12)和grna g041。在一些实施方案中,系统包含融合蛋白13(实施例12)和grna g041。在一些实施方案中,系统包含融合蛋白14(实施例12)和grna g041。在一些实施方案中,系统包含融合蛋白15(实施例12)和grna g041。在一些实施方案中,系统包含融合蛋白9变体1(实施例12)和grna g049。在一些实施方案中,系统包含融合蛋白9变体2(实施例12)和grna g049。在一些实施方案中,系统包含融合蛋白10(实施例12)和grna g049。在一些实施方案中,系统包含融合蛋白11(实施例12)和grna g049。在一些实施方案中,系统包含融合蛋白12(实施例12)和grnag049。在一些实施方案中,系统包含融合蛋白13(实施例12)和grna g049。在一些实施方案中,系统包含融合蛋白14(实施例12)和grna g049。在一些实施方案中,系统包含融合蛋白15(实施例12)和grna g049。在一些实施方案中,系统包含融合蛋白9变体1(实施例12)以及grna g041和g049。在一些实施方案中,系统包含融合蛋白9变体2(实施例12)以及grnag041和g049。在一些实施方案中,系统包含融合蛋白10(实施例12)以及grna g041和g049。在一些实施方案中,系统包含融合蛋白11(实施例12)以及grna g041和g049。在一些实施方案中,系统包含融合蛋白12(实施例12)以及grna g041和g049。在一些实施方案中,系统包含融合蛋白13(实施例12)以及grna g041和g049。在一些实施方案中,系统包含融合蛋白14(实施例12)以及grna g041和g049。在一些实施方案中,系统包含融合蛋白15(实施例12)以及grna g041和g049。
13、在一些实施方案中,dna结合结构域包含靶向选自seq id no:700-747的核苷酸序列的zfp结构域。在某些实施方案中,zfp结构域依次包含如表1中所示的zf001至zf048中任一个的f1-f6氨基酸序列。
14、在一些实施方案中,dnmt3a结构域包含与seq id no:574或575具有至少90%同一性的序列。
15、dnmt3l结构域可以包含例如与选自seq id no:578-581的序列具有至少90%同一性的序列。在一些实施方案中,dnmt3l结构域包含与选自seq id no:582-603的序列具有至少90%同一性的序列。在一些实施方案中,dnmt3l结构域包含与选自seq id no:601-603的序列具有至少90%同一性的序列。
16、在一些实施方案中,转录阻遏结构域包含与选自seq id no:33-570的序列具有至少90%同一性的序列。在某些实施方案中,转录阻遏结构域是衍生自kox1、zim3、zfp28或zn627的krab结构域。krab结构域可以包含例如与选自seq id no:89、116、245和255的序列具有至少90%同一性的序列。在一些实施方案中,转录阻遏结构域包含zim3和kox1 krab的n-和c-末端区域的融合物,并且任选地包含seq id no:571或572的氨基酸序列。在某些实施方案中,转录阻遏结构域衍生自kap1、mecp2、hp1a/cbx5、hp1b、cbx8、cdyl2、tox、tox3、tox4、eed、ezh2、rbbp4、rcor1或scml2。
17、在一些实施方案中,所述系统包括
18、a)融合蛋白,其包含dnmt3a结构域、dnmt3l结构域、转录阻遏结构域和dna结合结构域,
19、任选地,其中所述dnmt3a结构域和所述dnmt3l结构域中的一个或两个是人的,并且
20、任选地,其中所述dna结合结构域是死亡crispr cas结构域或zfp结构域;或
21、b)编码融合蛋白的核酸分子。
22、在某些实施方案中,融合蛋白从n末端到c末端包含dnmt3a结构域、第一肽接头、dnmt3l结构域、第二肽接头、dna结合结构域、第三肽接头和转录阻遏结构域。例如,融合蛋白从n末端到c末端可以包含dnmt3a结构域、第一肽接头、dnmt3l结构域、第二肽接头、第一核定位信号(nls)、dna结合结构域、第二nls、第三肽接头和转录阻遏结构域。融合蛋白从n末端到c末端可以包含第一nls、dnmt3a结构域、第一肽接头、dnmt3l结构域、第二肽接头、dna结合结构域、第三肽接头、转录阻遏结构域和第二nls。融合蛋白从n末端到c末端可以包含第一和第二nls、dnmt3a结构域、第一肽接头、dnmt3l结构域、第二肽接头、dna结合结构域、第三肽接头、转录阻遏结构域以及第三和第四nls。在特定的实施方案中,转录阻遏结构域是krab结构域,例如人kox1、zfp28、zn627或zim3 krab结构域。在特定的实施方案中,第二和第三肽接头中的一个或两个是xten接头,其可以选自xten80(例如,seq id no:643)和xten16(例如,seq id no:638),例如,其中第二肽接头是xten80,并且第三肽接头是xten16。
23、在一些实施方案中,融合蛋白从n末端到c末端可以包含人dnmt3a结构域、第一肽接头、人dnmt3l结构域、xten80肽接头、第一nls、dspcas9结构域、第二nls、xten16肽接头和人kox1 krab结构域。在某些实施方案中,融合蛋白包含seq id no:658或与其至少90%相同的序列。在某些实施方案中,融合蛋白包含seq id no:1495或与其至少90%相同的序列。
24、在一些实施方案中,融合蛋白从n末端到c末端包含人dnmt3a结构域、第一肽接头、人dnmt3l结构域、xten80肽接头、第一nls、zfp结构域、第二nls、xten16接头和人kox1 krab结构域。在某些实施方案中,融合蛋白包含seq id no:659或与其至少90%相同的序列,任选地其中zfp依次包含如表1中所示的zf001至zf048中任一个的f1-f6氨基酸序列。在某些实施方案中,融合蛋白包含seq id no:1496或与其至少90%相同的序列,任选地其中zfp依次包含如表1中所示的zf001至zf048中任一个的f1-f6氨基酸序列。
25、在一些实施方案中,融合蛋白从n末端到c末端包含第一和第二nls、人dnmt3a结构域、第一肽接头、人dnmt3l结构域、xten80肽接头、dspcas9结构域、xten16肽接头、人kox1krab结构域以及第三和第四nls。在特定的实施方案中,融合蛋白可以包含seq id no:660的氨基酸序列或与其至少90%相同的序列。
26、在一些实施方案中,融合蛋白从n末端到c末端包含第一和第二nls、人dnmt3a结构域、第一肽接头、人dnmt3l结构域、xten80肽接头、zfp结构域、xten16肽接头、人kox1 krab结构域以及第三和第四nls。
27、在一些实施方案中,融合蛋白从n末端到c末端包含第一和第二nls、人dnmt3a结构域、第一肽接头、人dnmt3l结构域、xten80肽接头、dspcas9结构域、xten16肽接头、人zfp28krab结构域以及第三和第四nls。在特定的实施方案中,融合蛋白可以包含seq id no:661的氨基酸序列或与其至少90%相同的序列。
28、在一些实施方案中,融合蛋白从n末端到c末端包含第一和第二nls、人dnmt3a结构域、第一肽接头、人dnmt3l结构域、xten80肽接头、zfp结构域、xten16肽接头、人zfp28 krab结构域以及第三和第四nls。
29、在一些实施方案中,融合蛋白从n末端到c末端包含第一和第二nls、人dnmt3a结构域、第一肽接头、人dnmt3l结构域、xten80肽接头、dspcas9结构域、xten16肽接头、人zn627krab结构域以及第三和第四nls。在特定的实施方案中,融合蛋白可以包含seq id no:662的氨基酸序列或与其至少90%相同的序列。
30、在一些实施方案中,融合蛋白从n末端到c末端包含第一和第二nls、人dnmt3a结构域、第一肽接头、人dnmt3l结构域、xten80肽接头、zfp结构域、xten16肽接头、人zn627 krab结构域以及第三和第四nls。
31、在一些实施方案中,融合蛋白从n末端到c末端包含第一和第二nls、人dnmt3a结构域、第一肽接头、人dnmt3l结构域、xten80肽接头、dspcas9结构域、xten16肽接头、人zim3krab结构域以及第三和第四nls。在特定的实施方案中,融合蛋白可以包含seq id no:663的氨基酸序列或与其至少90%相同的序列。
32、在一些实施方案中,融合蛋白从n末端到c末端包含第一和第二nls、人dnmt3a结构域、第一肽接头、人dnmt3l结构域、xten80肽接头、zfp结构域、xten16肽接头、人zim3 krab结构域以及第三和第四nls。
33、在一些实施方案中,本文所述的融合蛋白中的nls的至少一个是sv40 nls(例如,seq id no:644)。
34、在一些实施方案中,系统包括:
35、a)包含第一dna结合结构域并且包含或招募dnmt3a结构域的第一融合蛋白,
36、包含第二dna结合结构域并且包含或招募dnmt3l结构域的第二融合蛋白,和
37、包含第三dna结合结构域并且包含或招募转录阻遏结构域的第三融合蛋白;或
38、b)一种或多种编码融合蛋白的核酸分子。
39、本公开还提供了包含本文所述系统的人细胞或该细胞的后代。在一些实施方案中,所述细胞是肝细胞。
40、本公开还提供了药物组合物,其包含本文所述的系统和药学上可接受的赋形剂。在一些实施方案中,组合物包含脂质纳米颗粒(lnp),其包含所述系统,和/或dna结合结构域是dcas结构域,并且lnp还包含一种或多种grna。
41、本公开还提供了治疗有此需要的患者的方法,其包括向患者施用本文所述的系统或药物组合物(例如,静脉内)。在一些实施方案中,患者患有心脏病;低密度脂蛋白胆固醇(ldl-c)升高或高胆固醇血症;处于发展心肌梗塞、中风或不稳定型心绞痛的风险中;和/或患有原发性高脂血症(例如,杂合子家族性高胆固醇血症(hefh)或纯合子家族性高胆固醇血症(hofh))。
42、本公开还提供了本文所述的系统或药物组合物,其用于例如在本文所述的方法中治疗有此需要的患者。
43、本公开还提供了本文所述的系统在制备用于治疗有此需要的患者的药物中的用途,例如在本文所述的方法中。
44、本公开还提供了包含本文所述系统的制品和试剂盒。
45、所公开的方法和组合物的其他特征、目的和优点在下面的详细描述中是显而易见的。然而,应当理解,详细描述虽然指示了所公开的方法和组合物的实施例和实施方案,但仅以说明的方式给出,而不是限制。根据详细描述,本公开范围内的各种变化和修改对于本领域技术人员将成为显而易见的。