一种融合蛋白在遗传编辑的用途

文档序号:34660276发布日期:2023-07-05 04:23阅读:87来源:国知局
一种融合蛋白在遗传编辑的用途


背景技术:

1、基因组编辑是一种基因工程,利用工程核酸酶(分子剪刀)将dna插入、删除或替换到活生物体的基因组中。利用基因组编辑工具对细胞和活生物体的基因组进行遗传操作在生命科学研究、生物技术/农业技术开发以及最重要的药物/临床创新中有着广泛的应用。例如,基因组编辑可用于纠正遗传疾病背后的驱动突变,从而彻底治愈活生物体中的这些疾病。基因组编辑还可用于工程改造农作物基因组,提高农作物产量,赋予农作物抗环境污染或病原体感染的能力。此外,通过精确的基因组编辑进行微生物基因组转化对可再生生物能源的开发具有重要意义。

2、crispr/cas(成簇的规则间隔的短回文重复序列/crispr相关蛋白)系统因其无与伦比的编辑效率、便捷性和在活生物体中的潜在应用,自诞生以来一直是最强大的基因组编辑工具。在引导rna(grna)的引导下,cas核酸酶可以在各种细胞(细胞系和来自活生物体的细胞)的靶基因组位点产生dna双链断裂(dsbs)。这些dsbs随后被内源性dna修复系统修复,可用于进行所需的基因组编辑。

3、一般而言,dsbs可激活两种主要的dna修复途径:非同源末端连接(nhej)和同源导向修复(hdr)。nhej可在dsbs周围的基因组dna区域引入随机插入/缺失(indels),导致开放阅读框(orf)移位,最终导致基因失活。相反,当hdr被触发时,靶位点的基因组dna序列可以通过同源重组机制被外源供体dna模板的序列替代,从而导致遗传突变的纠正。然而,hdr介导的基因纠正的实际效率较低(通常<5%),因为同源重组的发生具有细胞类型特异性和细胞周期依赖性,并且nhej比hdr更频繁地被触发。因此,hdr相对较低的效率限制了crispr/cas基因组编辑工具在精确基因治疗(疾病驱动的基因纠正)领域的翻译。

4、最近开发的碱基编辑器(be),它将crispr/cas系统与apobec(载脂蛋白b mrna编辑酶,催化性多肽样)aid(活化诱导的胞苷脱氨酶)家族相结合,极大地提高了crispr/cas介导的基因校正的效率。通过与cas9切割酶(ncas9)或催化失活的cpf1(dcpf1,也称为dcas12a)融合,apobec/aid家族成员的胞嘧啶(c)脱氨活性可以有目的地导向基因组中的靶碱基,并在这些碱基上催化c至胸腺嘧啶(t)替代。

5、然而,由于apobec/aid家族成员可在单链dna(ssdna)区域诱导c-to-t碱基替换突变,当前碱基编辑系统的特异性受到损害,从而限制了其应用,例如,使用bes恢复导致人类疾病的t-to-c突变用于治疗目的。因此,创建能够特异性编辑靶区域胞嘧啶,但不会在其他ssdna区域引起c-to-t突变的新型bes是可取的。这种新型的bes将使我们能够在各种活生物体中进行更特异的碱基编辑。重要的是,此类bes的高特异性将促进潜在的临床转化,尤其是在涉及恢复疾病相关的t-to-c突变的基因治疗中。


技术实现思路

1、在一些实施方案中,本发明提供了对基因组编辑有用的碱基编辑器,其可减少或避免现有碱基编辑器共有的脱靶突变。在某些实施方案中,核碱基脱氨酶抑制剂和参与基因组编辑的核碱基脱氨酶可裂解地融合。在存在核碱基脱氨酶抑制剂的情况下,核碱基脱氨酶不能(不太能)与核苷酸分子反应。在目标编辑位置,核碱基脱氨酶抑制剂被裂解并释放出完全活性的核碱基脱氨酶,然后可根据需要进行编辑。

2、因此,在一个实施方案中,提供了一种融合蛋白,其包括:包含核碱基脱氨酶或其催化结构域的第一片段,包含核碱基脱氨酶抑制剂的第二片段,以及在第一片段和第二片段之间的蛋白酶切割位点。

3、在一些实施方案中,所述核碱基脱氨酶为腺苷脱氨酶。在一些实施方案中,腺苷脱氨酶选自由trna特异性腺苷脱氨酶(tada)、trna特异性1腺苷脱氨酶(adat1)、trna特异性腺苷脱氨酶2(adat2)、trna特异性腺苷脱氨酶3(adat3)、rna特异性腺苷脱氨酶b1(adarb1)、rna特异性腺苷脱氨酶b2(adarb2)、腺苷一磷酸脱氨酶1(ampd1)、腺苷一磷酸脱氨酶2(ampd2)、腺苷一磷酸脱氨酶3(ampd3)、腺苷脱氨酶(ada)、腺苷脱氨酶2(ada2)、腺苷脱氨酶类似物(adal)、含腺苷脱氨酶结构域1(adad1),含腺苷脱氨酶结构域2(adad2),rna特异性腺苷脱氨酶(adar)和rna特异性腺苷脱氨酶b1(adarb1)组成的组。

4、在一些实施方案中,核碱基脱氨酶为胞苷脱氨酶。在一些实施方案中,胞苷脱氨酶选自由apobec3b(a3b)、apobec3c(a3c)、apobec3d(a3d)、apobec3f(a3f)、apobec3g(a3g)、apobec3h(a3h)、apobec1(a1)、apobec3(a3)、apobec2(a2)、apobec4(a4)和aicda(aid)组成的组。在一些实施方案中,胞苷脱氨酶为人或小鼠胞苷脱氨酶。在一些实施方案中,催化结构域为小鼠a3胞苷脱氨酶结构域1(cda1)或人a3b胞苷脱氨酶结构域2(cda2)。

5、在一些实施方案中,所述核碱基脱氨酶抑制剂为核碱基脱氨酶的抑制结构域。在一些实施方案中,核碱基脱氨酶抑制剂为胞苷脱氨酶的抑制结构域。在一些实施方案中,所述核碱基脱氨酶抑制剂为腺苷脱氨酶的抑制结构域。在一些实施方案中,所述核碱基脱氨酶抑制剂包含选自seq id no:1-2和表1和表2(seq id no:48-135)的氨基酸序列,或选自与seq id no:1-2和表1和表2中任一氨基酸序列至少具有85%同一性的氨基酸序列。在一些实施方案中,所述核碱基脱氨酶抑制剂包含如seq id no:1所示的氨基酸序列、seq idno:1的氨基酸残基aa76-aa149或seq id no:2的氨基酸序列。

6、在一些实施方案中,第一片段还包含成簇的规则间隔的短回文重复序列(crispr)相关(cas)蛋白。在一些实施方案中,cas蛋白选自spcas9、fncas 9、st1cas9、st3cas9、nmcas9、sacas9、ascpf1、lbcpf1、fncpf1、vor spcas9、eqr spcas 9、vrer spcas9、spcas9-ng、xspcas9、rha fncas9、kkh sacas9、nmecas9、stcas9、cjcas9、ascpf1、fncpf1、sscpf1、pccpf1、bpcpf1、cmtcpf1、licpf1、pmcpf1、pb3310cpf1、pb4417cpf1、bscpf1、eecpf1、bhcas12b、akcas12b、ebcas12b、lscas12b、rfcas13d、lwacas13a、pspcas13b、pgucas13b和rancas13b组成的组。

7、在一些实施方案中,蛋白酶切割位点为选自由tumv蛋白酶、ppv蛋白酶、pvy蛋白酶、zikv蛋白酶和wnv蛋白酶组成的组中的蛋白酶。

8、在一些实施方案中,蛋白酶切割位点为自切割位点。在一些实施方案中,蛋白酶切割位点为tev蛋白酶切割位点。在一些实施方案中,所述融合蛋白还包含第三片段,所述第三片段包含tev蛋白酶或其一片段。在一些实施方案中,第三片段包含单独不能切割tev蛋白酶切割位点的tev蛋白酶片段。

9、在另一个实施方案中,还提供了一种融合蛋白,其包括:包含胞苷脱氨酶或其催化结构域的第一片段,成簇的规则间隔的短回文重复序列(crispr)相关(cas)蛋白,和第一tev蛋白酶片段,包含胞苷脱氨酶抑制剂的第二片段,和在第一片段和第二片段之间的tev蛋白酶切割位点,其中第一tev蛋白酶片段单独不能切割tev蛋白酶切割位点。

10、在一些实施方案中,融合蛋白还包含尿嘧啶糖基化酶抑制剂(ugi)。在一些实施方案中,胞苷脱氨酶抑制剂、tev蛋白酶切割位点、胞苷脱氨酶或其催化结构域、cas蛋白和第一tev蛋白酶片段从n-末端排列到c-末端。在一些实施方案中,第一个tev蛋白酶片段为tev蛋白酶的n-末端结构域(seq id no:3)或c-末端结构域(seq id no:4)。在一些实施方案中,tev蛋白酶切割位点具有seq id no:5的氨基酸序列。

11、在一个实施方案中,还提供了一种在细胞中靶位点进行基因组编辑的方法,包括向细胞引入:(a)本公开的融合蛋白,(b)靶向靶位点的引导rna或靶向靶位点的crrna和tracrrna,并且还包含标签序列,和(c)与能够结合标签序列的rna识别肽偶联的第二tev蛋白酶片段。

12、在一些实施方案中,一个或多个分子通过编码该分子的多核苷酸导入细胞。在一些实施方案中,当相互作用时,第一tev蛋白酶片段和第二tev蛋白酶片段能够切割tev蛋白酶切割位点。在一些实施方案中,第二tev蛋白酶片段与rna识别肽融合。

13、在一些实施方案中,标签序列包含ms2序列(seq id no:16)。在一些实施方案中,rna识别肽包含ms2外壳蛋白(mcp,seq id no:22)。在一些实施方案中,标签序列包含pp7序列(seq id no:18)且rna识别肽包含pp7外壳蛋白(pcp,seq id no:23);或标签序列包含boxb序列(seq id no:20)且rna识别肽包含boxb外壳蛋白(n22p,seq id no:24)。

14、在一个实施方案中,还提供了用于进行基因编辑的试剂盒或包装,其包含:(a)本公开的融合蛋白,和(b)与能够结合rna序列的rna识别肽偶联的第二tev蛋白酶片段。

15、另一个实施方案提供了一种融合蛋白,其包括:包含第一胞苷脱氨酶或其催化结构域的第一片段,和包含第二胞苷脱氨酶的抑制结构域的第二片段,其中所述第一胞苷脱氨酶与所述第二胞苷脱氨酶相同或不同。

16、在另一个实施方案中,提供了包含第一片段的融合蛋白,所述第一片段包含:核碱基脱氨酶或其催化结构域、核碱基脱氨酶抑制剂、第一rna识别肽、以及核碱基脱氨酶或其催化结构域与核碱基脱氨酶抑制剂之间的tev蛋白酶切割位点。

17、在一些实施方案中,所述融合蛋白还包含第二片段,其包含:单独不能切割tev蛋白酶切割位点的tev蛋白酶片段,和第二rna识别肽。在一些实施方案中,融合蛋白还包含第一片段和第二片段之间的自切割位点。

18、在一些实施方案中,所述融合蛋白还包含第三片段,所述第三片段包含第二tev蛋白酶片段,其中所述第一tev蛋白酶片段能在存在所述第二tev蛋白酶片段的情况下切割所述tev蛋白酶位点。在一些实施方案中,融合蛋白还包含在第二片段和第三片段之间的第二自切割位点,并且当切割第二自切割位点时,融合蛋白释放未与任何rna识别肽融合的第二tev蛋白酶片段。

19、在一个实施方案中,还提供了一种双引导rna系统,其包括:靶向单引导rna,其包含与第一pam位点附近的靶核酸序列具有序列互补性的第一间隔子;辅助单引导rna,其包含与第二pam位点附近的第二核酸序列具有序列互补性的第二间隔子;成簇的规则间隔的短回文重复序列(crispr)相关(cas)蛋白;以及核碱基脱氨酶,其中所述第二pam位点距第一pam位点为34至91个碱基。在一些实施方案中,第二间隔子的长度为8-15个碱基。在一些实施方案中,第二间隔子的长度为9-12个碱基。

20、在一个实施方案中,提供了包含支架的引导rna,所述支架从5’至3’方向包括第一茎环部分、第二茎环部分、第三茎环部分和第四茎环部分,其中所述第三茎环包括五个碱基对。在另一个实施方案中,本公开提供了一种引导rna,其包含通过在45和55位碱基之间引入碱基对而衍生自seq id no:31的支架。在一些实施方案中,所述支架包含选自由seq idno:32-43组成的组中的序列。在一些实施方案中,引导rna的长度为至少100或120个核苷酸。

21、另一个实施方案提供了一种在细胞中靶位点进行遗传编辑的方法,该方法包括向细胞导入:第一病毒颗粒,其包封编码成簇的规则间隔的短回文重复序列(crispr)相关(cas)蛋白的第一构建体,和第二病毒颗粒,其包封编码与rna识别肽融合的逆转录酶的第二构建体。

22、在一些实施方案中,第二构建体进一步编码包含rna识别肽结合的rna识别位点的引导rna。在一些实施方案中,cas蛋白为spcas9-ng(seq id no:46)或xspcas9(seq id no:47)。

23、本公开还提供了编码融合蛋白的多核苷酸、包括所述多核苷酸的构建体、所述多核苷酸或其构建体的细胞、以及任何上述物质的组合物,且无限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1