工程化的Cas12i核酸酶及其效应蛋白以及用途

文档序号:26014184发布日期:2021-07-23 21:35阅读:755来源:国知局
工程化的Cas12i核酸酶及其效应蛋白以及用途

本申请属于生物技术领域。更具体地说,本申请涉及具有提高的催化活性(例如基因编辑活性)的cas12i核酸酶、效应蛋白及其用途。



背景技术:

基因组编辑是在基因组研究中的重要且有用的技术。有多个系统可用于基因组编辑,包括成簇规律间隔短回文重复序列(crispr)-cas系统、转录激活子样效应因子核酸酶(talen)系统以及锌指核酸酶(zfn)系统。

crispr-cas系统是一种高效且具有成本效益的基因组编辑技术,可广泛应用于从酵母、植物到斑马鱼和人类的一系列真核生物中(参见综述:vanderoost2013,science339:768-770,以及charpentieranddoudna,2013,nature495:50-51)。crispr-cas系统通过结合cas12i效应蛋白和crisprrna(crrna)在古细菌和细菌中提供适应性免疫。迄今为止,基于该系统的突出的功能上和进化上的模块性,已经对包括六型(i–vi型)两类(第1类和第2类)的crispr-cas系统进行了表征。在第2类crispr-cas系统中,ii型cas9系统和v型-a/b/e/jcas12a/cas12b/cas12e/cas12j系统已被利用来进行基因组编辑,并为生物医学研究提供了广阔的前景。

但是,当前的crispr-cas系统具有多种局限性,包括有限的基因编辑效率。因此,需要改进方法和系统以进行有效的跨多基因座的基因组编辑。



技术实现要素:

本申请提供了下述技术方案:

1.一种工程化的cas12i核酸酶;其包含一种,两种、三种或四种基于参比cas12i核酸酶的突变,所述突变选自:

(1)将参比cas12i核酸酶中与pam相互作用的一个或多个氨基酸替换为带正电的氨基酸;和/或

(2)将参比cas12i核酸酶中参与打开dna双链的一个或多个氨基酸替换为带芳香环的氨基酸;和/或

(3)将参比cas12i核酸酶中位于ruvc结构域并与单链dna底物相互作用的一个或多个氨基酸替换为带正电的氨基酸;和/或

(4)将参比cas12i核酸酶中与dna-rna双螺旋相互作用的一个或多个氨基酸替换为带正电的氨基酸。

在一些实施方案中,所述参比cas12i核酸酶为天然野生型cas12i酶。在一些实施方案中,所述参比cas12i核酸酶为cas12i1、cas12i2、或其同源核酸酶。在一些实施方案中,所述参比酶为为天然cas12i2核酸酶,其氨基酸序列如seqidno.1所定义。在一些实施方案中,所述参比酶为天然cas12i1酶,其氨基酸序列如seqidno.13所定义。在一些实施方案中,所述参比cas12i核酸酶为工程化的cas12i核酸酶。

2.如项1所述的工程化的cas12i核酸酶,其中,所述与pam相互作用的一个或多个氨基酸是与pam在三维结构上距离在9埃以内的氨基酸。在一些实施方式中,所述与pam相互作用的一个或多个氨基酸是下述位置的一个或多个氨基酸:176、178、226、227、229、237、238、264、447和/或563。在一些实施方式中,所述与pam相互作用的一个或多个氨基酸是下述一个或多个氨基酸:e176、e178、y226、a227、n229、e237、k238、k264、t447和/或e563。在一些实施方式中,所述与pam相互作用的一个或多个氨基酸是下述一个或多个氨基酸:e176、k238、t447和/或e563。其中,所述氨基酸位置编号如seqidno.1所定义。

3.如项2所述的工程化的cas12i核酸酶,其中,所述带正电的氨基酸是r或k。在一些实施方式中,该带正电的氨基酸为r。

4.如项3所述的工程化的cas12i核酸酶,其中,所述将参比cas12i核酸酶中与pam相互作用的一个或多个氨基酸替换为带正电的氨基酸是指如下替换中的一种或多种:e176r、k238r、t447r和/或e563r。在一些实施方式中,所述cas12i核酸酶包含下述任何一种突变或突变组合:1)e563r;(2)e176r、t447r、e176r和e563r;(3)k238r和e563r;(4)e176r、k238r和t447r;(5)e176r、k238r和e563r;(6)e176r、t447r和e563r;和/或(7)e176r、k238r、t447r和e563r。其中,所述氨基酸位置编号如seqidno.1所定义。

5.如项1~4中任一项所述的工程化的cas12i核酸酶,其中,所述参与打开dna双链的一个或多个氨基酸是与pam中相对于靶标链的3’端最后一个碱基对相互作用的氨基酸。在一些实施方式中,所述参与打开dna双链的一个或多个氨基酸是下述位置的一个或多个氨基酸:163和/或164。;在一些实施方式中,所述参与打开dna双链的一个或多个氨基酸是下述一个或多个氨基酸:q163和/或n164。在一些实施方式中,所述参与打开dna双链的一个或多个氨基酸为n164。其中,所述氨基酸位置编号如seqidno.1所定义。

6.如项5所述的工程化的cas12i核酸酶,其中,所述参与打开dna双链的一个或多个氨基酸替换为带芳香环的氨基酸,所述带芳香环的氨基酸是f、y或w。在一些实施方式中,该氨基酸为f或y。

7.如项6所述的工程化的cas12i核酸酶,其中,所述将参比cas12i酶中参与打开dna双链的一个或多个氨基酸的替换为带芳香环的氨基酸是指:q163f、q163y、q163w、n164f和/或n164y。在一些实施方式中,所述cas12i核酸酶包含n164y或n164f突变,例如n164y。

8.如项1~7中任一项所述的工程化的cas12i核酸酶,其中,所述位于ruvc结构域并与单链dna底物相互作用的一个或多个氨基酸是在三维结构上与单链dna底物距离在9埃以内的氨基酸。在一些实施方式中,所述位于ruvc结构域并与单链dna底物相互作用的一个或多个氨基酸是下述位置的一个或多个氨基酸:323、362、425、925、926、390、391、392、751、755、840、848、851、856、885、897、929、932、327、355、359、360、361、414、421、650、652、705、708、709、752、928、388、393、417、418、424、653、696和/或1022。在一些实施方式中,所述位于ruvc结构域并与单链dna底物相互作用的一个或多个氨基酸是下述一个或多个氨基酸:e323、d362、q425、n925、i926、n390、n391、f392、l751、e755、n840、n848、s851、a856、q885、m897、g929、y932、l327、v355、g359、g360、k361、q414、k421、s650、e652、k705、k708、e709、s752、t928、l388、k393、l417、a418、q424、g653、i696和/或a1022。在一些实施方式中,所述位于ruvc结构域并与单链dna底物相互作用的一个或多个氨基酸是是下述一个或多个氨基酸:e323、d362、q425、n925、i926、n391、q424和/或g929。其中,所述氨基酸位置编号如seqidno.1所定义。

9.如项8所述的工程化的cas12i核酸酶,其中,将参比cas12i核酸酶中参与双链dna的切割的一个或多个氨基酸替换为带正电的氨基酸,所述带正电的氨基酸是r或k。在一些实施方式中,该氨基酸为r。

10.如项9所述的工程化的cas12i核酸酶,其中,将参比cas12i核酸酶位于ruvc结构域并与单链dna底物相互作用的一个或多个氨基酸替换为带正电的氨基酸是指包括如下替换中的一种或多种:e323r、d362r、n391r、q424r、q425r、n925r、i926r和/或g929r。在一些实施方式中,所述cas12i核酸酶包含下述任何一种突变或突变组合:1)e323r;(2)d362r;(3)q425r;(4)n925r;(5)i926r;(6)e323r和d362r;(7)e323r和q425r;(8)e323r和i926r;(9)q425r和i926r;(10)d362r和i926r;(11)n925r和i926r;(12)e323r、d362r和q425r;(13)e323r、d362r和i926r;(14)e323r、q425r和i926r;(15)d362r、n925r和i926r;和/或(16)e323r、d362r、q425r和i926r。其中,所述氨基酸位置编号如seqidno.1所定义。

11.如项1~10中任一项所述的工程化的cas12i核酸酶,其中,所述与dna-rna双螺旋相互作用的一个或多个氨基酸是与dna-rna双螺旋在三维结构上距离在9埃以内的氨基酸。在一些实施方式中,所述与dna-rna双螺旋相互作用的一个或多个氨基酸是下述位置的一个或多个氨基酸:116、117、156、159、161、301、305、306、308、312、313、427、433、438、441、442、852、855、861、865、160、316、319、320、247、343、348、349、679、683、691、782、783、797、800、853、957、958、293、294和/或297。在一些实施方式中,所述与dna-rna双螺旋相互作用的一个或多个氨基酸是下述一个或多个氨基酸:g116、e117、a156、t159、s161、t301、i305、k306、t308、n312、f313、d427、k433、v438、n441、q442、m852、l855、n861、q865、e160、q316、e319、q320、e247、e343、e348、e349、n679、e683、e691、d782、e783、e797、e800、d853、s957、d958、g293、e294和/或n297。在一些实施方式中,所述与dna-rna双螺旋相互作用的一个或多个氨基酸是下述一个或多个氨基酸:g116、e117、t159、s161、e319、e343和/或d958。其中,所述氨基酸位置编号如seqidno.1所定义。

12.如项11所述的工程化的cas12i核酸酶,其中,所述带正电的氨基酸是r或k。在一些实施方式中,所述带正电的氨基酸为r。

13.如项12所述的工程化的cas12i核酸酶,其中,所述将参比cas12i核酸酶中与dna-rna双螺旋相互作用的一个或多个氨基酸替换为带正电的氨基酸是指如下替换中的一种或多种:g116r、e117r、t159r、s161r、e319r、e343r和/或d958r。在一些实施方式中,所述cas12i核酸酶包含d958r。其中,所述氨基酸位置编号如seqidno.1所定义。

14.如项1~13中任一项所述的工程化的cas12i核酸酶,其包含一个或多个柔性区突变,所述突变增加了参比cas12i核酸酶中的柔性区的柔性,所述柔性区选自对应于以下的区的组:氨基酸残基439-443或氨基酸残基925-929,其中所述氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述柔性区突变位于下述位置的一个或多个:439和/或926。在一些实施方式中,所述柔性区突变是下述一个或多个氨基酸:l439和/或i926。

15.如项14所述的工程化的cas12i核酸酶,其中,所述一个或多个柔性区突变为:将该氨基酸替换为g、和/或在其后插入一个或两个g。在一些实施方式中,所述一个或多个柔性区突变包含i926g。在一些实施方式中,所述一个或多个柔性区突变包含439g或439gg。其中所述氨基酸位置编号如seqidno.1所定义。

16.一种工程化的cas12i核酸酶(如cas12i2核酸酶),其氨基酸位置编号如seqidno.1所定义;所述工程化的cas12i核酸酶包含以下任一组或多组(如2、3、4、5、6或更多组)突变:(1)e563r;(2)e176r和t447r;(3)e176r和e563r;(4)k238r和e563r;(5)e176r、k238r和t447r;(6)e176r、t447r和e563r;(7)e176r、k238r和e563r;(8)e176r、k238r、t447r和e563r;(9)n164y;(10)n164f;(11)e323r;(12)d362r;(13)q425r;(14)n925r;(15)i926r;(16)d958r;(17)e323r和d362r;(18)e323r和q425r;(19)e323r和i926r;(20)q425r和i926r;(21)d362r和i926r;(22)n925r和i926r;(23)e323r、d362r和q425r;(24)e323r、d362r和i926r;(25)e323r、q425r和i926r;(26)d362r、n925r和i926r;(27)e323r、d362r、q425r和i926r;(28)d362r和i926g;(29)n925r和i926g;(30)d362r、n925r和i926g;(31)i926r和439g;(32)i926r和439gg;和/或(33)e323r、d362r和i926g。在一些实施方式中,所述工程化的cas12i核酸酶包含以下任一组或多组(如2、3、4、或5组)突变:(1)e176r、k238r、t447r和e563r;(2)n164y;(3)i926r;(4)e323r和d362r;(4)i926g;(5)i926r和439g;(6)i926r和439gg;和/或(7)d958r。在一些实施方式中,所述工程化的cas12i核酸酶包含以下任一组突变:((1)e176r、k238r、t447r、e563r和n164y;(2)e176r、k238r、t447r、e563r和i926r;(3)n164y、e323r和d362r;(4)e176r、k238r、t447r、e563r、e323r和d362r;(5)n164y和i926r;(6)e176r、k238r、t447r、e563r、n164y和i926r;(7)e176r、k238r、t447r、e563r、n164y、e323r和d362r;(8)e176r、k238r、t447r、e563r、n164y、i926r、e323r和d362r;(9)e176r、k238r、t447r、e563r、n164y、e323r、d362r和i926g;(10)e176r、k238r、t447r、e563r、n164y、e323r、d362r、i926g和439gg;(11)e176r、k238r、t447r、e563r、n164y、e323r、d362r、i926g和439g;(12)e176r、k238r、t447r、e563r、n164y和d958r;(13)e176r、k238r、t447r、e563r、i926r和d958r;(14)e176r、k238r、t447r、e563r、e323r、d362r和d958r;(15)n164y、i926r和d958r;(16)n164y、e323r、d362r和d958r;(17)e176r、k238r、t447r、e563r、n164y、i926r和d958r;(18)e176r、k238r、t447r、e563r、n164y、e323r、d362r和d958r;(19)e176r、k238r、t447r、e563r、n164y、i926r、e323r、d362r和d958r;(20)e176r、k238r、t447r、e563r、n164y、e323r、d362r、i926g和d958r;(21)e176r、k238r、t447r、e563r、n164y、e323r、d362r、i926g、439gg和d958r;或(22)e176r、k238r、t447r、e563r、n164y、e323r、d362r、i926g、439g和d958r。在一些实施方式中,所述突变基于天然野生型cas12i2核酸酶,其氨基酸序列为seqidno.1。

17.包含如seqidno.2~12中任一项所示氨基酸序列的工程化cas12i核酸酶。在一些实施方式中,所述工程化的cas12i核酸酶包含与seqidno.2~12中任一项所示的氨基酸序列具有至少85%(例如至少87%、89%、91%、93%、95%、97%、或99%)序列一致性的氨基酸序列。

18.一种工程化的cas12i效应蛋白,其包含项1~17中任一项所述的工程化的cas12i核酸酶或其功能衍生物。在一些实施方案中,所述工程化的cas12i核酸酶或其功能衍生物具有酶活性。在一些实施方案中,所述效应蛋白包含所述工程化的cas12i核酸酶的酶失活突变体。

19.如项18所述的工程化的cas12i效应蛋白,其中所述效应蛋白能够诱导dna分子中的双链断裂或单链断裂。

20.如项18所述的工程化的cas12i效应蛋白,其中所述工程化的cas12i核酸酶的功能衍生物为酶失活突变体,例如含有d599a、e833a、s883a、h884a、d886a、r900a和/或d1019a的酶失活突变体。

21.如项18~20所述的工程化的cas12i效应蛋白,其还包含与所述工程化的cas12i核酸酶融合的功能结构域。

22.如项21所述的工程化的cas12i效应蛋白,其中所述功能结构域选自下组:翻译起始结构域、转录阻遏结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域(例如,cbe或abe结构域)、逆转录酶结构域、报告分子结构域(例如,荧光结构域)和核酸酶结构域。

23.如项18~22所述的工程化的cas12i效应蛋白,所述工程化的cas效应蛋白包含:含有所述工程化的cas12i核酸酶或其功能衍生物的n末端部分的第一多肽和含有所述工程化的cas12i核酸酶或其功能衍生物的c末端部分的第二多肽,其中所述第一多肽和所述第二多肽能够在包含指导序列的指导rna的存在下彼此缔合,以形成与靶核酸特异性结合的成簇规律间隔短回文重复序列(crispr)复合物,所述靶核酸包含与所述指导序列互补的靶序列。在一些实施方案中,所述第一多肽包含项1-17中任一项所述的工程化的cas12i核酸酶的n末端部分氨基酸残基1至x,所述第二多肽包含项1-17中任一项所述的工程化的cas12i核酸酶的氨基酸残基x+1至所述cas12i核酸酶的c末端,其中所述第一多肽和所述第二多肽能够在包含指导序列的指导rna的存在下彼此缔合,以形成与靶核酸特异性结合的成簇规律间隔短回文重复序列(crispr)复合物,该靶核酸包含与所述指导序列互补的靶序列。在一些实施方案中,所述第一多肽和所述第二多肽各自包含二聚化结构域。在一些实施方案中,所述第一二聚结构域和所述第二二聚结构域在诱导剂存在下彼此缔合。在一些实施方案中,所述第一多肽和所述第二多肽不包含二聚化结构域。

24.一种工程化的crispr-cas12i系统,包括:

(a)项18-23中任一项所述的工程化的cas12i效应蛋白;以及

(b)包含与靶序列互补的指导序列的指导rna,或编码所述指导rna的一种或多种核酸,

其中所述工程化的cas12i效应蛋白和所述指导rna能够形成crispr复合物,所述crispr复合物特异性结合包含所述靶序列的靶核酸并诱导所述靶核酸的修饰。在一些实施方案中,所述指导rna是包含所述指导序列的crrna。在一些实施方案中,所述系统包括编码多个crrna的前体指导rna阵列(array)。在一些实施方案中,其中所述工程化的cas效应蛋白是主编辑器,所述指导rna是pegrna。

25.如项24中所述的工程化的crispr-cas12i系统,其包含一种或多种编码所述工程化的cas12i效应蛋白的载体。在一些实施方案中,所述一种或多种载体选自下组:逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关的载体和单纯疱疹载体。在一些实施方案中,所述一种或多种载体是腺相关病毒(aav)载体。在一些实施方案中,aav载体还编码所述指导rna(例如,crrna、或前体指导rna阵列)。

26.一种检测样品中靶核酸的方法,包括:

(a)使样品与项24中的工程化的crispr-cas12i系统以及加标签的检测核酸接触,该检测核酸为单链且不与所述指导rna的指导序列杂交;以及

(b)测量通过所述工程化的cas12i效应蛋白切割所述加标签的检测核酸而产生的可检测信号,从而检测所述靶核酸。

27.一种修饰包含靶序列的靶核酸的方法,包括使所述靶核酸与项24中所述的工程化的crispr-cas12i系统接触。在一些实施方案中,所述方法在体外进行。在一些实施方案中,所述靶核酸存在于细胞中。在一些实施方案中,所述细胞是细菌细胞、酵母细胞、哺乳动物细胞、植物细胞或动物细胞。在一些实施方案中,所述方法离体进行。在一些实施方案中,所述方法在体内进行。

在根据上述修饰靶核酸的方法中任一种的一些实施方案中,通过所述工程化的crispr-cas12i系统切割所述靶核酸或改变所述靶核酸中的靶序列。在一些实施方案中,通过所述工程化的crispr-cas12i系统改变靶核酸的表达。在一些实施方案中,所述靶核酸是基因组dna。在一些实施方案中,所述靶序列与疾病或病况相关。

在根据上述修饰靶核酸的方法中任一种的一些实施方案中,所述工程化的crispr-cas12i系统包括编码多个crrna的前体指导rna阵列,其中每个crrna包含不同的指导序列。

28.如项24所述的工程化的crispr-cas12i系统在制备治疗与个体的细胞中靶核酸相关的疾病或病症的药物中的用途。在一些实施例中,所述疾病或病症选自下组:癌症、心血管疾病、遗传性疾病、自身免疫疾病、代谢性疾病、神经退行性疾病、眼病、细菌感染和病毒感染。

29.一种治疗与个体的细胞中的靶核酸相关的疾病或病症的方法;所述方法包含采用使用项27所述工程化的crispr-cas12i系统的方法中任一种来修饰所述个体的细胞中的靶核酸,从而治疗所述疾病或病症。在一些实施方案中,所述疾病或病症选自下组:癌症、心血管疾病、遗传性疾病、自身免疫疾病、代谢性疾病、神经退行性疾病、眼病、细菌感染和病毒感染。

30.工程化的细胞,其包含经修饰的靶核酸,其中使用如项27中所述的方法修饰过所述靶核酸。

31.工程化非人类动物,其包含一种或多种如项27所述的工程化细胞。

应理解为清楚起见,在单独实施方案的上下文中描述的本公开的某些特征,也可以在单个实施方案中组合提供。相反,为简洁起见,在单个实施方案的上下文中描述的本公开的各种特征,也可以单独地或以任何合适的子组合来提供。涉及特定方法步骤、试剂或条件或组合物组分的实施方案的所有组合被本公开明确地涵盖,并且在本文中公开,如同各自和每个组合均被单独地和明确地公开。

本申请的技术方案取得的有益效果

本申请工程化的cas12i核酸酶及其效应蛋白具有更高的活性,如切割核酸底物的催化效率及细胞内的基因编辑效率。本申请中的工程化cas12i核酸酶具有较现有常规cas基因编辑工具更卓越的哺乳动物细胞(如人类细胞)内的基因编辑效率;例如本申请中的一些示例性cas12i2核酸酶突变体在人类细胞中多个位点(如62个位点)测试基因编辑效率,发现有57个位点的基因编辑效率超过约60%,平均基因编辑效率接近70%。在一些实施例中,本申请工程化的cas12i核酸酶及其效应蛋白还具有以下一个或多个优点:蛋白小(1,054aa),crrna组分简单,pam序列简单,并且蛋白自身能加工前体crrna。这些优点使得本申请高效的工程化的cas12i核酸酶及其效应蛋白非常适用于在体内进行基因编辑或者基因调控。

附图说明

图1a:将参比cas12i核酸酶中与pam相互作用的氨基酸替换为带正电的氨基酸,从而提高基因编辑效率。如图所示,e176r,k238r,t447r,e563r四种突变体能够显著地提高在人293t细胞中的基因编辑效率。

图1b:将图1a中能够显著提高基因编辑效率的氨基酸突变(e176r,k238r,t447r,e563r)进行组合,发现组合后的突变体能够展现在人293t细胞中更高的基因编辑效率。

图2:将参比cas12i核酸酶中参与打开dna双链的氨基酸替换为带芳香环的氨基酸从而提高基因编辑的效率。如图所示,q163f、q163y、q163w、n164f、n164y这些突变体能够显著提高在人293t细胞中的基因编辑效率。

图3a、3b、3c:将参比cas12i核酸酶中位于ruvc结构域并与单链dna底物相互作用的氨基酸替换为带正电的氨基酸,从而提高基因编辑的效率。如图所示,e323r、l327r、v355r、g359r、g360r、d362r、n391r、q424r、q425r、n925r、i926r和g929r等突变体能够显著地提高在人293t细胞中的基因编辑效率。

图3d:将图3a、3b中提高效率的点突变进行组合,发现组合后的突变体能够展现在人293t细胞中更高的基因编辑效率。

图3e:将图3a、3b中提高效率的点突变以及根据分子柔性原理改造突变(439gg,i926g)进行组合,发现组合后的突变体能够展现在人293t细胞中更高的基因编辑效率。

图4:将参比cas12i酶参比cas12i核酸酶中与与dna-rna双螺旋相互作用的氨基酸替换为带正电的氨基酸,从而提高基因编辑效率。如图所示,g116r、e117r、t159r、s161r、e319r、e343r、d958r这些突变体能够明显地提高在人293t细胞中的基因编辑效率。其中,d958r最优。

图5:将图1a~图3e中三种改造策略得到的高效率突变体以及根据分子柔性原理改造突变(439gg、i926g)进行组合,发现组合后的突变体能够展现在人293t细胞中更高的基因编辑效率。组合后能够极大地提高基因编辑效率。选出基因编辑效果最佳的突变体并命名为casxx供后续实验使用。

图6a:casxx在62个人基因组位点的基因编辑效率汇总。pam=nttn。在此casxx代表的是(基于氨基酸序列seqidno.1的参比cas12i2)具有e176r+k238r+t447r+e563r+n164y+e323r+d362r突变组合的工程酶。

图6b:casxx与ascas12a,bhcas12bv4基因编辑效率的比较。

图6c:casxx与spcas9,sacas9,sacas9-kkh基因编辑效率的比较。

图6d:casxx在小鼠hepa1-6细胞系的基因编辑效率统计,可以看到,casxx在65个位点展示出强大的基因编辑能力,平均基因编辑效率超过60%。

图7:cas12i2(seqidno.1)与cas12i1(seqidno.13)的氨基酸序列的同源性比对。阴影标注的氨基酸代表2种cas12i蛋白相同的氨基酸,用白色框标注的氨基酸代表2种cas12i蛋白性质相似的氨基酸。

具体实施方式

需要说明的是,在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解,技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为一开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本发明的较佳实施方式,然所述描述乃以说明书的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所界定者为准。除非另有定义,本文中使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同含义。

.术语

如本文所用,“效应蛋白”是指具有活性如位点特异性结合活性、单链dna切割活性、双链dna切割活性、单链rna切割活性或转录调节活性的蛋白。

如本文所用,“指导rna”和“grna”在本文中可互换使用,是指能够与cas12i效应蛋白和靶核酸(例如,双链dna)形成复合物的rna。本文还考虑了可以被加工成多个crrna的前体指导rna阵列。“crrna”或“crisprrna”包含与靶核酸(例如,双链dna)的靶序列具有足够互补性的指导序列,其指导crispr复合物与靶核酸的序列特异性结合。

术语“核酸”、“多核苷酸”和“核苷酸序列”可互换使用,是指任何长度的核苷酸的聚合形式,包括脱氧核糖核苷酸、核糖核苷酸、其组合及其类似物。“寡核苷酸”和“低聚核苷酸”可互换使用,是指具有不超过约50个核苷酸的短多核苷酸。

如本文所用,“互补性”是指核酸通过传统的沃森-克里克(watson-crick)碱基配对与另一核酸形成氢键的能力。互补性百分比表示可与第二种核酸形成氢键(即,沃森-克里克碱基配对)的核酸分子中的残基百分比(例如,10分之5、6、7、8、9、10,分别互补约50%、60%、70%、80%、90%和100%)。“完全互补”是指核酸序列的所有连续残基与第二核酸序列中相同数目的连续残基形成氢键。如本文所用,“基本上互补”是指在约40、50、60、70、80、100、150、200、250个或更多个核苷酸的区域上,互补程度为至少约70%、75%、80%、85%、90%、95%、97%、98%、99%或100中任一个,或指在严格条件下杂交的两种核酸。

如本文所用,用于杂交的“严格条件”是指与靶序列具有互补性的核酸主要与靶序列杂交,而基本上不与非靶序列杂交的条件。严格条件通常是序列依赖性的,并且取决于许多因素而变化。通常,序列越长,序列与其靶序列特异性杂交的温度越高。严格条件的非限制性例子详细描述于tijssen(1993),laboratorytechniquesinbiochemistryandmolecularbiology-hybridizationwithnucleicacidprobes,第一部分第二章"overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassay,”elsevier,n,y。

“杂交”是指一种或多种多核苷酸反应形成复合物的反应,所述复合物通过核苷酸残基的碱基之间的氢键而稳定化。氢键可通过沃森克里克碱基配对、霍格斯坦(hoogstein)结合或以任何其他序列特异性方式发生。能够与给定序列杂交的序列称为所述给定序列的“互补体”。

针对核酸序列的“序列同一性百分比(%)”定义为,在通过允许空缺(gaps)来比对序列(如有必要)以实现最大的序列同一性百分比后,候选序列中与特定核酸序列中的核苷酸相同的核苷酸百分比。针对肽、多肽或蛋白质序列的“序列同一性百分比(%)”,是在通过允许空缺来比对序列(如有必要)以实现最大的序列同源性百分比后,候选序列中与特定肽或氨基酸序列中的氨基酸残基相同替换的氨基酸残基的百分比。为了确定氨基酸序列同一性百分比的目的,比对可以以本领域技术范围内的各种方式来实现,例如,使用诸如blast、blast-2、align或megaligntm(dnastar)软件之类的公众可获得的计算机软件。本领域技术人员可以确定用于测量比对的合适参数,包括在所比较序列的全长上实现最大比对所需的任何算法。

术语“多肽”和“肽”在本文可互换使用,是指任何长度的氨基酸的聚合物。所述聚合物可以是直链或支链的,它可以包含经修饰的氨基酸,并且可以被非氨基酸中断。蛋白质可以具有一个或多个多肽。该术语还涵盖已经过修饰的氨基酸聚合物;例如,二硫键的形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作(诸如与标记组分的缀合)。

如本文所用,“变体”解释为分别不同于参比多核苷酸或多肽但保留必要特性的多核苷酸或多肽。多核苷酸的典型变体与另一参比多核苷酸的核酸序列不同。变体核酸序列的变化可以改变或可以不改变参比多核苷酸编码的多肽的氨基酸序列。核苷酸变化可导致参比序列编码的多肽中的氨基酸替换、添加、缺失、融合和截短,如下所述。多肽的典型变体与另一参比多肽在氨基酸序列上不同。通常,差异是有限的,使得参比多肽和变体的序列总体上非常相似,并且在许多区域是相同的。变体和参比多肽的氨基酸序列可以通过一个或多个替换、添加、缺失的任何组合而不同。替换或插入的氨基酸残基可以是或可以不是遗传密码编码的氨基酸残基。多核苷酸或多肽的变体可以是天然存在的(诸如等位基因变体),或者可以是未知天然存在的变体。多核苷酸和多肽的非天然存在的变体可以通过诱变技术,通过直接合成,以及通过本领域技术人员已知的其他重组方法来制备。

如本文所用,术语“野生型”具有本领域技术人员通常理解的含义,意指当它存在于大自然中时,将其与突变体或变体区分开的、典型形式的生物体、菌株、基因或特征。它可以与自然界中的资源隔离开来,并没有被刻意修饰。

如本文所用,术语“非天然存在”或“工程化的”可互换使用,是指人工参与。当这些术语用于描述核酸分子或多肽时,是指所述核酸分子或多肽至少基本上不含其天然缔合的或天然存在的至少一种其他组分。

如本文所用,术语“直系同源物(orthologue/ortholog)”具有本领域普通技术人员通常理解的含义。作为进一步的指导,本文所指的蛋白质的“直系同源物”是指属于不同物种的蛋白质,其执行与作为其直系同源物的蛋白质相同或相似的功能。

如本文所用,术语“同一性”用于表示两个多肽之间或两个核酸之间的序列匹配。当两个比较序列中的一个位置被相同的碱基或氨基酸单体亚基占据时(例如,两个dna分子的每个中的一个位置都被腺嘌呤占据,或者两个多肽的每个中的一个位置被赖氨酸占据),那么在那个位置每个分子均相同。这两个序列之间的“同一性百分比”是两个序列共有的匹配位置数除以要比较的位置数x100的函数。例如,如果两个序列的10个位置中有6个匹配,则这两个序列具有60%的同一性。例如,dna序列ctgact和caggtt具有50%的同一性(总共6个位置中有3个匹配)。通常,当两个序列进行比对以产生最大的同一性时,进行这种比较。这种比对可以通过例如needlemanetal.(1970)j.mol.biol.48:443-453中的方法来实现,所述方法可方便地通过计算机程序如比对(align)程序(dnastar,inc.)来进行。也可以采用pam120权重残基表,使用e.meyers和w.miller的算法(comput.applbiosci.,4:11-17(1988))集成到align程序(2.0版)中。空缺长度罚分12和空缺罚分4,用于确定两个氨基酸序列之间的同一性百分比。此外,可以使用集成到gcg软件包(可从www.gcg.com获得)的gap程序中的needleman和wunsch(jmoibiol.48:444-453(1970))算法,采用blossum62矩阵或pam250矩阵,空缺权重为16、14、12、10、8、6或4,长度权重为1、2、3、4、5或6,以确定两个氨基酸序列之间的同一性百分比。

本文所用的“细胞”应理解为不仅指特定的单个细胞,而且指该细胞的后代或潜在后代。因为由于突变或环境影响,可能在后代中发生某些修饰,所以此类后代可能事实上与亲本细胞不同,但仍包括在本文术语的范围内。

如本文所用,术语“转导”和“转染”包括本领域已知的使用感染剂(如病毒)或其他方式将dna引入细胞中以表达目的蛋白质或分子的方法。除了病毒或类似病毒的试剂外,还有基于化学的转染方法,如使用磷酸钙、树状聚合物,脂质体或阳离子聚合物(例如deae-葡聚糖或聚乙烯亚胺)的转染方法;非化学方法,如电穿孔、细胞挤压(cellsqueezing)、声致穿孔(sonoporation)、光学转染、穿刺转染(impalefection)、原生质体融合、质粒递送或转座子;基于颗粒的方法,如使用基因枪、磁转染或磁体辅助转染、颗粒轰击;以及杂交方法(诸如核转染)。

如本文所用,术语“转染的”、“转化的”或“转导的”是指将外源核酸转移或引入宿主细胞的过程。“转染的”、“转化的”或“转导的”细胞是已经用外源核酸转染、转化或转导的细胞。

术语“体内”是指从其中获得细胞的该生物体内。“离体”或“体外”是指从其中获得细胞的该生物体外。

如本文所用,“治疗(treatment/treating)”是用于获得有益的或期望的结果(包括临床结果)的方法。为了本发明的目的,有益的或期望的临床结果包括但不限于以下的一种或多种:减轻由疾病引起的一种或多种症状,减轻疾病的程度,稳定疾病(例如预防或延缓疾病的恶化),预防或延缓疾病的扩散(例如转移),预防或延缓疾病的复发,降低疾病的复发率,延缓或减慢疾病的进展,改善疾病状态,提供疾病的(部分或全部)缓解,减少治疗该疾病所需的一种或多种其他药物的剂量,延缓疾病的进展,提高生活质量,和/或延长生存期。“治疗”还包括减少病症、病况或疾病的病理后果。本发明的方法考虑了这些治疗的方面中的任何一个或多个。

如本文所用,术语“有效量”是指足以治疗特定病症、病况或疾病(如改善、缓解、减轻和/或延迟其一种或多种症状)的化合物或组合物的量。如本领域中所理解的,“有效量”可以以一次或多次给药,即,可能需要单次给药或多此给药来达到期望的治疗终点。

“受试者”、“个体”或“患者”在本文中可互换使用,以达到治疗目的,是指任何归类为哺乳动物的动物,包括人类、家畜和农场动物,以及动物园、农场或宠物动物如狗、马、猫、牛等。在一些实施方案中,所述个体是人类个体。

应理解,本文所述的本发明的实施方案包括“由...组成”和/或“基本上由...组成”的实施方案。在本文中对“约”值或参数的提及包括(并描述了)针对该值或参数本身的变化。例如,提及“大约x”的描述,包括对“x”的描述。

如本文所用,对“不”值或参数的提及通常意指并描述了“除…外”值或参数。例如,所述方法不用于治疗x型癌症,意味着所述方法用于治疗除x型以外的癌症。

如本文所用,术语“大约x-y”具有与“大约x至大约y”相同的含义。

如本文和所附权利要求书中所使用的,单数形式“一个/一种(a/an)”和“所述”包括复数对象,除非上下文另外明确指出。还应注意,权利要求可以被撰写为排除任何可选的要素。因此此陈述旨在作为与权利要求要素的叙述结合使用诸如“只”、“仅”等排他性术语的先行基础,或使用“否”的限制。

如本文所用,术语“和/或”在词语诸如“a和/或b”中,旨在既包括a和b;a或b;a(单独);以及b(单独)。同样地,如本文所用,术语“和/或”在词语诸如“a、b和/或c”中,旨在包括以下每个实施方案:a、b和c;a、b或c;a或c;a或b;b或c;a和c;a和b;b和c;a(单独);b(单独);以及c(单独)。

核酸酶及效应蛋白

工程化的cas12i核酸酶

在一些实施方式中,提供了一种工程化的cas12i核酸酶;所述工程化的cas12i核酸酶包含以下一种、两种、三种或四种基于参比cas12i核酸酶的突变:

(1)将参比cas12i核酸酶中与pam相互作用的氨基酸替换为带正电的氨基酸;和/或

(2)将参比cas12i核酸酶中参与打开dna双链的氨基酸替换为带芳香环的氨基酸;和/或

(3)将参比cas12i核酸酶中位于ruvc结构域并与单链dna底物相互作用的氨基酸替换为带正电的氨基酸;和/或

(4)将参比cas12i核酸酶中与dna-rna双螺旋相互作用的氨基酸替换为带正电的氨基酸;所述参比cas12i核酸酶为天然cas12i核酸酶或工程化的cas12i核酸酶,例如天然cas12i2核酸酶(比如其氨基酸序列如seqidno.1所定义)。

本申请提供了通过引入氨基酸突变来工程化改造酶的方法,所述氨基酸突变基于上述三种改造原理的任何一种或多种的组合,这导致体外和体内酶活性的增加。所述工程化cas12i核酸酶含有一个或多个如以下1)-4)节中所描述的具体突变。在一些实施方式中,本申请中所述的任何一个或多个突变可以与现有的cas12i突变组合(例如以下5)节中所描述的突变),以提供具有更高活性的工程化cas12i核酸酶。

在一些实施方式中,提供了一种工程化的cas12i核酸酶;所述工程化的cas12i核酸酶包含将参比cas12i核酸酶中与pam相互作用的一个或多个氨基酸替换为带正电的氨基酸的突变。在一些实施方式中,提供了一种工程化的cas12i核酸酶;所述工程化的cas12i核酸酶包含将参比cas12i核酸酶中参与打开dna双链的一个或多个氨基酸替换为带芳香环的氨基酸。在一些实施方式中,提供了一种工程化的cas12i核酸酶;所述工程化的cas12i核酸酶包含将参比cas12i核酸酶中位于ruvc结构域并与单链dna底物相互作用的一个或多个氨基酸替换为带正电的氨基酸。在一些实施方式中,提供了一种工程化的cas12i核酸酶;所述工程化的cas12i核酸酶包含将参比cas12i核酸酶中与dna-rna双螺旋相互作用的一个或多个氨基酸氨基酸替换为带正电的氨基酸。

在一些实施方式中,提供了一种工程化的cas12i核酸酶;所述工程化的cas12i核酸酶包含:1)将参比cas12i核酸酶中与pam相互作用的一个或多个氨基酸替换为带正电的氨基酸的突变;和2)将参比cas12i核酸酶中参与打开dna双链的一个或多个氨基酸替换为带芳香环的氨基酸。在一些实施方式中,提供了一种工程化的cas12i核酸酶;所述工程化的cas12i核酸酶包含:1)将参比cas12i核酸酶中与pam相互作用的一个或多个氨基酸替换为带正电的氨基酸的突变;和2)将参比cas12i核酸酶中位于ruvc结构域并与单链dna底物相互作用的一个或多个氨基酸替换为带正电的氨基酸。在一些实施方式中,提供了一种工程化的cas12i核酸酶;所述工程化的cas12i核酸酶包含:1)将参比cas12i核酸酶中参与打开dna双链的一个或多个氨基酸替换为带芳香环的氨基酸;和2)将参比cas12i核酸酶中位于ruvc结构域并与单链dna底物相互作用的一个或多个氨基酸替换为带正电的氨基酸。

在一些实施方式中,提供了一种工程化的cas12i核酸酶;所述工程化的cas12i核酸酶包含:1)将参比cas12i核酸酶中与pam相互作用的一个或多个氨基酸替换为带正电的氨基酸的突变;和2)将参比cas12i核酸酶中与dna-rna双螺旋相互作用的一个或多个氨基酸氨基酸替换为带正电的氨基酸。在一些实施方式中,提供了一种工程化的cas12i核酸酶;所述工程化的cas12i核酸酶包含:1)将参比cas12i核酸酶中参与打开dna双链的一个或多个氨基酸替换为带芳香环的氨基酸;和2)将参比cas12i核酸酶中与dna-rna双螺旋相互作用的一个或多个氨基酸氨基酸替换为带正电的氨基酸。在一些实施方式中,提供了一种工程化的cas12i核酸酶;所述工程化的cas12i核酸酶包含:1)将参比cas12i核酸酶中位于ruvc结构域并与单链dna底物相互作用的一个或多个氨基酸替换为带正电的氨基酸;和2)将参比cas12i核酸酶中与dna-rna双螺旋相互作用的一个或多个氨基酸氨基酸替换为带正电的氨基酸。

在一些实施方式中,提供了一种工程化的cas12i核酸酶;所述工程化的cas12i核酸酶包含:1)将参比cas12i核酸酶中与pam相互作用的一个或多个氨基酸替换为带正电的氨基酸的突变;2)将参比cas12i核酸酶中参与打开dna双链的一个或多个氨基酸替换为带芳香环的氨基酸;和3)将参比cas12i核酸酶中位于ruvc结构域并与单链dna底物相互作用的一个或多个氨基酸替换为带正电的氨基酸。在一些实施方式中,提供了一种工程化的cas12i核酸酶;所述工程化的cas12i核酸酶包含:1)将参比cas12i核酸酶中与pam相互作用的一个或多个氨基酸替换为带正电的氨基酸的突变;2)将参比cas12i核酸酶中参与打开dna双链的一个或多个氨基酸替换为带芳香环的氨基酸;和3)将参比cas12i核酸酶中与dna-rna双螺旋相互作用的一个或多个氨基酸氨基酸替换为带正电的氨基酸。在一些实施方式中,提供了一种工程化的cas12i核酸酶;所述工程化的cas12i核酸酶包含:1)将参比cas12i核酸酶中与pam相互作用的一个或多个氨基酸替换为带正电的氨基酸的突变;2)将参比cas12i核酸酶中位于ruvc结构域并与单链dna底物相互作用的一个或多个氨基酸替换为带正电的氨基酸;和3)将参比cas12i核酸酶中与dna-rna双螺旋相互作用的一个或多个氨基酸氨基酸替换为带正电的氨基酸。在一些实施方式中,提供了一种工程化的cas12i核酸酶;所述工程化的cas12i核酸酶包含:1)将参比cas12i核酸酶中位于ruvc结构域并与单链dna底物相互作用的一个或多个氨基酸替换为带正电的氨基酸;2)将参比cas12i核酸酶中位于ruvc结构域并与单链dna底物相互作用的一个或多个氨基酸替换为带正电的氨基酸;和3)将参比cas12i核酸酶中与dna-rna双螺旋相互作用的一个或多个氨基酸氨基酸替换为带正电的氨基酸。

在一些实施方式中,提供了一种工程化的cas12i核酸酶;所述工程化的cas12i核酸酶包含:1)将参比cas12i核酸酶中与pam相互作用的一个或多个氨基酸替换为带正电的氨基酸的突变;2)将参比cas12i核酸酶中参与打开dna双链的一个或多个氨基酸替换为带芳香环的氨基酸;3)将参比cas12i核酸酶中位于ruvc结构域并与单链dna底物相互作用的一个或多个氨基酸替换为带正电的氨基酸;和4)将参比cas12i核酸酶中与dna-rna双螺旋相互作用的一个或多个氨基酸氨基酸替换为带正电的氨基酸。

1)将参比cas12i核酸酶中与pam相互作用的氨基酸替换为带正电的氨基酸

在一些实施方式中,所述工程化的cas12i核酸酶包含一个或多个基于参比cas12i核酸酶(例如cas12i2)的突变,所述突变为将参比cas12i核酸酶中与pam相互作用的氨基酸替换为带正电的氨基酸。在一些实施方式中,所述工程化的cas12i核酸酶包含一个、两个、三个、四个、五个、或六个所述氨基酸残基的替换。

在一些实施方式中,所述与pam相互作用的氨基酸是与pam在三维结构上距离在9埃以内的氨基酸,例如可以为:与pam在三维结构上距离在9埃以内的氨基酸、与pam在三维结构上距离在8埃以内的氨基酸、与pam在三维结构上距离在7埃以内的氨基酸、与pam在三维结构上距离在6埃以内的氨基酸、与pam在三维结构上距离在5埃以内的氨基酸、与pam在三维结构上距离在4埃以内的氨基酸、或与pam在三维结构上距离在3埃以内的氨基酸。

在一些实施方式中,所述一个或多个基于参比cas12i核酸酶的突变是在下述位置的一个或多个氨基酸:176、178、226、227、229、237、238、264、447和563。在一些实施方式中,所述一个或多个基于参比cas12i核酸酶的突变是在下述一个或多个氨基酸:e176、e178、y226、a227、n229、e237、k238、k264、t447、e563。在一些实施方式中,所述一个或多个基于参比cas12i核酸酶的突变是在下述一个或多个氨基酸:e176、k238、t447、e563。在一些实施方式中,所述基于参比cas12i核酸酶的突变位于563号氨基酸残基,例如e563。在一些实施方式中,所述氨基酸位置编号如seqidno.1所定义。

在本说明书的上下文中,e176的含义是;在所援引的氨基酸序列中,第176号氨基酸e(谷氨酸);在此,常见的氨基酸及其三字母和单字母缩写列举性地说明如下:

丙氨酸alaa;精氨酸argr;天冬氨酸aspd;半胱氨酸cysc;谷氨酰胺glnq;谷氨酸glue;组氨酸hish;异亮氨酸ilei;甘氨酸glyg;天冬酰胺asnn;亮氨酸leul;赖氨酸lysk;甲硫氨酸metm;苯丙氨酸phef;

脯氨酸prop;丝氨酸sers;苏氨酸thrt;色氨酸trpw;酪氨酸tyry;缬氨酸valv。

如本文所用,“该氨基酸在x位置处,其中所述氨基酸位置编号如seqidno.1所定义”的含义是:该氨基酸残基位于参比酶cas12i的某位置处,其相当在seqidno:1的x位置处,而且参比酶cas12i的氨基酸序列与seqidno:1的氨基酸序列基于序列同源性相互对齐。例如,图7示出了cas12i2(seqidno.1)与cas12i1(seqidno.13)的氨基酸序列的同源性比对。本领域人员可以用本领域常用的软件,如clustalomega,将任一参比cas12i核酸酶的氨基酸序列与seqidno.1进行序列同一性比较和对齐(alignment),进而得到与本申请中所述基于seqidno.1所定义的氨基酸位点相对应的所述参比cas12i核酸酶中的氨基酸位点。

在一些实施方式中,所述基于参比cas12i核酸酶的突变为将参比cas12i核酸酶中相应的氨基酸残基替换为r或k。在一些实施方式中,所述基于参比cas12i核酸酶的突变为将参比cas12i核酸酶中相应的氨基酸残基替换为r。

在一些实施方式中,所述工程化的cas12i核酸酶包含以下一个或多个氨基酸残基:r176、r238、r447和r563,其中,所述氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述工程化的cas12i核酸酶包含以下一个或多个基于参比cas12i核酸酶的突变:e176r、k238r、t447r和e563r;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述工程化的cas12i核酸酶包含e563r突变;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,为改善基因编辑效率的目的,也可以使用与上述经工程化的cas12i核酸酶具有至少85%序列一致性的工程化酶;在一些实施方式中,可以使用与其具有至少87%、89%、91%、93%、95%、97%、99%序列一致性的工程化酶。

在本说明书的上下文中,e176r表示的含义是,在所援引的氨基酸序列中,将第176号氨基酸e(谷氨酸)替换为r(精氨酸)。

在一些实施方式中,所述工程化cas12i核酸酶包含任一个在下述氨基酸残基位置的突变或突变组合:176、238、264、447、563、176和238、176和447、176和563、238和447、238和563、447和563、176和238和447、176和238和563、176和447和563、238和447和563、176和238和447和563;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述突变为将参比cas12i核酸酶中相应的氨基酸残基替换为r或k,如r。在一些实施方式中,所述工程化cas12i核酸酶包含任一个在下述氨基酸残基或组合:r176、r238、r264、r447、r563、r176+r238、r176+r447、r176+r563、r238+r447、r238+r563、r447+r563、r176+r238+r447、r176+r238+r563、r176+r447+r563、r238+r447+r563、r176+r238+r447+r563;其中,氨基酸位置编号如seqidno.1所定义。

在一些实施方式中,所述工程化cas12i核酸酶包含下述突变/突变组合的任一个:e176r、k238r、e264r、t447r、e563r、e176r+k238r、e176r+t447r、e176r+e563r、k238r+t447r、k238r+e563r、t447r+e563r、e176r+k238r+t447r、e176r+k238r+e563r、e176r+t447r+e563r、k238r+t447r+e563r、e176r+k238r+t447r+e563r;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述工程化cas12i核酸酶包含下述突变/突变组合的任一个:e563r、e176r+t447r、e176r+e563r、k238r+e563r、e176r+k238r+t447r、e176r+k238r+e563r、e176r+t447r+e563r、e176r+k238r+t447r+e563r;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述工程化cas12i核酸酶包含e176r+k238r+t447r+e563r突变组合;其中,氨基酸位置编号如seqidno.1所定义。为改善基因编辑效率的目的,也可以使用与上述经工程化的cas12i具有至少85%序列一致性的工程化酶;在一些实施方式中,可以使用与其具有至少87%、89%、91%、93%、95%、97%、99%序列一致性的工程化酶。

2)将参比cas12i核酸酶中参与打开dna双链的氨基酸替换为带芳香环的氨基酸

在一些实施方式中,所述工程化的cas12i核酸酶包含一个或多个基于参比cas12i核酸酶(例如cas12i2)的突变,所述突变为将参比cas12i核酸酶中参与打开dna双链的氨基酸替换为带芳香环的氨基酸。在一些实施方式中,所述工程化的cas12i核酸酶包含一个、两个、三个、四个、五个、或六个所述氨基酸残基的替换。

其中,所述参与打开dna双链的一个或多个氨基酸是与pam中相对于靶标链的3’端最后一个碱基对相互作用的氨基酸。例如,cas12i2识别的pam序列是5’-nttn-3’碱基对,其中pam序列中3’末端的n碱基与靶标链所形成的碱基对就是文本所述的“与pam中相对于靶标链的3’端最后一个碱基对,”而该碱基对之后就是靶向位点的序列。

在一些实施方式中,所述一个或多个氨基酸位于下述位置:163和/或164。在一些实施方式中,所述一个或多个氨基酸是下述一个或多个氨基酸:q163、n164。在一些实施方式中,所述氨基酸为n164;其中氨基酸位置编号如seqidno.1所定义。

在一些实施方式中,所述参与打开dna双链的氨基酸替换为f、y或w。在一些实施方式中,所述参与打开dna双链的氨基酸替换为f。在一些实施方式中,所述参与打开dna双链的氨基酸替换为y。

在一些实施方式中,所述工程化cas12i核酸酶包含下述任一个或多个氨基酸残基:f163、y163、w163、f164或y164;其中氨基酸位置编号如seqidno.1所定义。

在一些实施方式中,所述工程化cas12i核酸酶包含下述任一个突变:q163f、q163y、q163w、n164f或n164y。在一些实施方式中,其中氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述工程化cas12i核酸酶包含n164y、或n164f突变。在一些实施方式中,所述工程化cas12i核酸酶包含n164y突变。在一些实施例中,为实现改善基因编辑效率的目的,也可以使用与上述工程化酶具有至少85%序列一致性的工程化酶;在一些实施方式中,可以使用与其具有至少87%、89%、91%、93%、95%、97%、99%序列一致性的酶。

3)将参比cas12i核酸酶中位于ruvc结构域并与单链dna底物相互作用的氨基酸替换为带正电的氨基酸

在一些实施方式中,所述工程化的cas12i核酸酶包含一个或多个基于参比cas12i核酸酶(例如cas12i2)的突变,所述突变为将参比cas12i酶中位于ruvc结构域并与单链dna底物相互作用的氨基酸替换为带正电的氨基酸。在一些实施方式中,所述工程化的cas12i酶包含一个、两个、三个、四个、五个、或六个所述氨基酸残基的替换。

其中,所述位于ruvc结构域并与单链dna底物相互作用的一个或多个氨基酸是在三维结构上与单链dna底物距离在9埃以内的氨基酸,例如可以为:在三维结构上与单链dna底物距离在8埃以内的氨基酸、在三维结构上与单链dna底物距离在7埃以内的氨基酸、在三维结构上与单链dna底物距离在6埃以内的氨基酸、在三维结构上与单链dna底物距离在5埃以内的氨基酸、在三维结构上与单链dna底物距离在4埃以内的氨基酸、在三维结构上与单链dna底物距离在3埃以内的氨基酸。ruvc结构域是cas12i蛋白中负责切割单链dna或者双链dna的酶活结构域。在蛋白质的一级序列中,cas12i的ruvc结构域被分为3个部分:ruvc-1,ruvc-2以及ruvc-3。这3个部分在三维结构中相邻近,一同组成具有酶切活性的催化口袋。cas12i2的三维晶体结构,其结构域组成,及与dna底物相互作用的描述见huangx.etal.,naturecommunications,11,articlenumber:5241(2020)。cas12i1的三维晶体结构,其结构域组成,及与dna底物相互作用的描述见zhangh.etal.naturestructural&molecularbiology27,1069-1076(2020)。可以通过同源结构比较和建模(homologymodeling)通过已知的cas12i三维晶体结构,得到参比cas12i和底物相互作用的三维结构模型。实施例3中描述了一种建模方式以得到cas12i2中位于ruvc结构域并与单链dna底物距离在9埃以内的氨基酸。

在一些实施方式中,所述一个或多个氨基酸是下述位置的一个或多个氨基酸:323、362、425、925、926、390、391、392、751、755、840、848、851、856、885、897、929、932、327、355、359、360、361、414、421、650、652、705、708、709、752、928、388、393、417、418、424、653、696、1022。在一些实施方式中,所述一个或多个氨基酸是下述一个或多个氨基酸:e323、d362、q425、n925、i926、n390、n391、f392、l751、e755、n840、n848、s851、a856、q885、m897、g929、y932、l327、v355、g359、g360、k361、q414、k421、s650、e652、k705、k708、e709、s752、t928、l388、k393、l417、a418、q424、g653、i696、a1022。在一些实施方式中,所述一个或多个氨基酸是下述一个或多个氨基酸:e323、d362、q425、n925、i926、n391、q424、g929、l388、l417。在一些实施方式中,所述氨基酸位置编号如seqidno.1所定义。

在一些实施方式中,所述工程化的cas12i核酸酶包含将参比cas12i核酸酶中参与双链dna的切割的一个或多个氨基酸替换为r或k的突变。在一些实施方式中,所述工程化的cas12i核酸酶包含将参比cas12i核酸酶中参与双链dna的切割的一个或多个氨基酸替换为为r的突变。

在一些实施方式中,所述工程化cas12i核酸酶包含任一个下述氨基酸残基位置的突变或突变组合:323、362、425、925、926和929;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述工程化cas12i核酸酶包含任一个下述氨基酸残基位置的突变或突变组合:323、362、425、925、926、323和362、323和425、323和926、362和425、362和926、425和926、925和926、323和362和425、323和362和926、323和425和926、362和925和926、362和425和926;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述突变为将所述位置氨基酸残基替换为r或k(如r)的突变。在一些实施方式中,所述工程化cas12i核酸酶包含下述任何一个氨基酸或氨基酸组合:r323、r362、r425、r925、r926、r323+r362、r323+r425、r323+r926、r362+r425、r362+r926、r425+r926、r925+r926、r323+r362+r425、r323+r362+r926、r323+r425+r926、r362+r925+r926、r362+r425+r926;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述工程化cas12i核酸酶包含任一个下述突变或突变组合:e323r、d362r、q424r、q425r、n925r、i926r和g929r;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述工程化cas12i核酸酶包含任一个下述突变或突变组合:e323r、d362r、q425r、n925r、i926r、e323r+d362r、e323r+q425r、e323r+i926r、q425r+i926r、d362r+i926r、n925r+i926r、e323r+d362r+q425r、e323r+d362r+i926r、e323r+q425r+i926r、d362r+n925r+i926r、e323r+d362r+q425r+i926r;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述工程化cas12i核酸酶包含i926r突变;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述工程化cas12i核酸酶包含e323r+d362r突变;其中,氨基酸位置编号如seqidno.1所定义。在一些实施例中,为实现改善基因编辑效率的目的,也可以使用与上述工程化酶具有至少85%序列一致性的工程化酶。在一些实施方式中,可以使用与其具有至少87%、89%、91%、93%、95%、97%、99%序列一致性的酶。

4)将参比cas12i核酸酶中与dna-rna双螺旋相互作用的一个或多个氨基酸替换为带正电的氨基酸

在一些实施方式中,所述工程化的cas12i核酸酶包含一个或多个基于参比cas12i核酸酶(例如cas12i2)的突变,所述突变为将参比cas12i核酸酶中与dna-rna双螺旋相互作用的一个或多个氨基酸替换为带正电的氨基酸。在一些实施方式中,所述工程化的cas12i酶包含一个、两个、三个、四个、五个、或六个所述氨基酸残基的替换。

其中,所述与dna-rna双螺旋相互作用的一个或多个氨基酸是在三维结构上与dna-rna双螺旋距离在9埃以内的氨基酸,例如可以为:在三维结构上与dna-rna双螺旋距离在8埃以内的氨基酸、在三维结构上与dna-rna双螺旋距离在7埃以内的氨基酸、在三维结构上与dna-rna双螺旋距离在6埃以内的氨基酸、在三维结构上与dna-rna双螺旋距离在5埃以内的氨基酸、在三维结构上与dna-rna双螺旋距离在4埃以内的氨基酸、或在三维结构上与dna-rna双螺旋距离在3埃以内的氨基酸。某些cas核酸酶的工作原理如下:cas与指导rna(如crrna)形成复合体,其中crrna和靶向dna相互配对形成的dna-rna双螺旋,并与cas核酸酶相互作用,打开双链靶向dna,并形成r-loop,得以使cas的酶切活性位点完成对dsdna的切割。cas12i2的三维晶体结构,其结构域组成,及与dna-rna双螺旋相互作用的描述见huangx.etal.,naturecommunications,11,articlenumber:5241(2020)。

在一些实施方式中,所述一个或多个氨基酸是下述位置的一个或多个氨基酸:116、117、156、159、161、301、305、306、308、312、313、427、433、438、441、442、852、855、861、865、160、316、319、320、247、343、348、349、679、683、691、782、783、797、800、853、957、958、293、294、或297。在一些实施方式中,所述一个或多个氨基酸是下述一个或多个氨基酸:g116、e117、a156、t159、s161、t301、i305、k306、t308、n312、f313、d427、k433、v438、n441、q442、m852、l855、n861、q865、e160、q316、e319、q320、e247、e343、e348、e349、n679、e683、e691、d782、e783、e797、e800、d853、s957、d958、g293、e294、或n297。在一些实施方式中,所述一个或多个氨基酸是下述一个或多个氨基酸:g116、e117、t159、s161、e319、e343、或d958。在一些实施方式中,所述一个或多个氨基酸是d958。在一些实施方式中,所述一个或多个氨基酸是在一些实施方式中,所述氨基酸位置编号如seqidno.1所定义。

在一些实施方式中,所述工程化的cas12i核酸酶包含将参比cas12i核酸酶中与dna-rna双螺旋相互作用的一个或多个氨基酸替换为r或k的突变。在一些实施方式中,所述工程化的cas12i核酸酶包含将参比cas12i核酸酶中参与dna-rna双螺旋相互作用的一个或多个氨基酸替换为为r的突变。

在一些实施方式中,所述工程化cas12i核酸酶包含任一个下述氨基酸残基位置的突变或突变组合:116、117、159、161、319、343、或958;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述突变为将所述位置氨基酸残基替换为r或k(如r)的突变。在一些实施方式中,所述工程化cas12i核酸酶包含下述任何一个氨基酸或氨基酸组合:r116、r117、r159、r161、r319、r343、或r958;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述工程化cas12i核酸酶包含任一个下述突变或突变组合:e323r、d362r、q424r、q425r、n925r、i926r和g929r;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述工程化cas12i核酸酶包含任一个下述突变或突变组合:g116r、e117r、t159r、s161r、e319r、e343r、或d958r;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述工程化cas12i核酸酶包含i926r突变;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述工程化cas12i核酸酶包含d958r突变;其中,氨基酸位置编号如seqidno.1所定义。在一些实施例中,为实现改善基因编辑效率的目的,也可以使用与上述工程化酶具有至少85%序列一致性的工程化酶。在一些实施方式中,可以使用与其具有至少87%、89%、91%、93%、95%、97%、99%序列一致性的酶。

5)其它突变

在1)至4)节中描述的任一个或者多个突变可以结合任一个或多个增加cas12i活性的已知突变,例如靶标结合、双链切割活性、切口酶活性和/或基因编辑活性。示例行的突变例如可见于下述文献pct/cn2020/0134249和cn112195164a,这些文献通过整体引用而并入本文。

在一些实施方式中,所述工程化的cas12i核酸酶还包含一个或多个柔性区突变,所述突变增加了参比cas12i核酸酶中的柔性区的柔性(flexibility)。所述参比cas12i核酸酶中的柔性区可以使用本领域中已知的任何方法来确定。在一些实施方案中,仅基于所述参比酶的氨基酸序列确定多个柔性区。在一些实施方案中,基于所述参比酶的结构信息确定多个柔性区,包括例如二级结构、晶体结构、nmr结构等。

此处所述的工程化改造cas12i核酸酶柔性区的方法包括:(a)获得多种工程化的cas12i核酸酶,每种工程化的cas12i核酸酶包含一个或多个突变,所述突变增加了参比cas12i核酸酶的多个柔性区中的柔性区柔性;以及(b)从所述多种工程化的cas12i核酸酶中选择一种或多种工程化的cas12i核酸酶,其中所述一种或多种工程化的cas12i核酸酶与所述参比cas12i核酸酶相比具有增加的活性。在一些实施方案中,所述方法还包括确定所述参比cas12i核酸酶中的多个柔性区。在一些实施方案中,在真核细胞诸如哺乳动物细胞(例如人细胞)中测量活性。

在一些实施方案中,使用选自下组的程序确定多个柔性区:predyflexy、foldunfold、profbval、flexserv、flexpred、dynamine和disomine。在一些实施方案中,所述多个柔性区位于无规卷曲处。在一些实施方案中,所述多个柔性区在参比cas12i核酸酶的与dna和/或rna相互作用的结构域中。在一些实施方案中,所述柔性区的长度为至少约5个(例如5个)氨基酸。

在一些实施方案中,所述一个或多个突变包括在柔性区中插入一个或多个(例如2个)甘氨酸(g)残基。在一些实施方案中,所述一个或多个g残基插入在柔性区中的柔性氨基酸残基的n末端,其中所述柔性氨基酸残基选自下组:g、丝氨酸(s)、天冬酰胺(n)、天冬氨酸(d)、组氨酸(h)、蛋氨酸(m)、苏氨酸(t)、谷氨酸(e)、谷氨酰胺(q)、赖氨酸(k)、精氨酸(r)、丙氨酸(a)和脯氨酸(p)。在一些实施方案中,根据以下优先级选择所述柔性氨基酸残基:g>s>n>d>h>m>t>e>q>k>r>a>p。在一些实施方案中,所述一个或多个突变包括用一个或多个g残基替换一个或多个非g残基。

在一些实施方案中,所述一个或多个突变包括用g残基替换柔性区中的疏水氨基酸残基,其中所述疏水氨基酸残基选自下组:亮氨酸(l)、异亮氨酸(i)、缬氨酸(v)、半胱氨酸(c)、酪氨酸(y)、苯丙氨酸(f)和色氨酸(w)。

在一些实施方案中,所述活性是位点特异性核酸酶活性。在一些实施方案中,所述活性是真核细胞(例如人细胞)中的基因编辑活性。在一些实施方案中,所述基因编辑效率是使用如下方法来测量的:t7核酸内切酶1(t7e1)测定、靶dna的测序、由分解追踪插入缺失(tide)测定或通过扩增子分析进行插入缺失检测(idaa)测定。

在一些实施方案中,所述工程化cas12i核酸酶包含一个或多个突变,所述突变增加了参比cas12i核酸酶(如cas12i2核酸酶)中柔性区的柔性,所述柔性区选自对应于以下的区的组:氨基酸残基228-232、氨基酸残基439-443、氨基酸残基478-482、氨基酸残基500-504、氨基酸残基775-779和氨基酸残基925-929,其中所述氨基酸残基编号基于seqidno:1。在一些实施方案中,所述柔性区对应于氨基酸残基439-443或氨基酸残基925-929,其中所述氨基酸残基编号基于seqidno:1。在一些实施方案中,所述参比cas12i酶是cas12i2。在一些实施方案中,所述一个或多个突变包括在所述柔性区中插入一个或多个(例如2个)g残基。在一些实施方案中,所述一个或多个g残基插入在所述柔性区中柔性氨基酸残基的n末端,其中所述柔性氨基酸残基选自下组:g、s、n、d、h、m、t、e、q、k、r、a和p。在一些实施方案中,根据以下优先级选择所述柔性氨基酸残基:g>s>n>d>h>m>t>e>q>k>r>a>p。在一些实施方案中,所述一个或多个突变包括用g残基替换柔性区中的疏水氨基酸残基,其中所述疏水氨基酸残基选自下组:l、i、v、c、y、f和w。

在一些实施方式中,所述柔性区突变位于下述位置的一个或多个:439、926。在一些实施方式中,它们是下述一个或多个氨基酸:l439、i926。

在一些实施方案中,所述工程化的cas12i核酸酶包含氨基酸残基g926和/或g439,所述氨基酸残基编号基于seqidno:1。在一些实施方案中,所述工程化的cas12i核酸酶包含一个或多个下列柔性区突变:i926g;和/或439g或439gg。在一些实施方案中,所述工程化的cas12i核酸酶包含i926g突变。在一些实施方案中,所述工程化的cas12i核酸酶包含439g突变。在一些实施方案中,所述工程化的cas12i核酸酶包含439gg突变。

在本说明书的上下文中,439g的含义是,在所援引的氨基酸序列中,在第439号氨基酸后插入一个甘氨酸(g)。而439gg的含义是,在所援引的氨基酸序列中,在第439号氨基酸后插入两个甘氨酸(gg)。

在一些实施方式中,所述工程化cas12i核酸酶包含任一个下述氨基酸残基位置的突变或突变组合:926、439、925和926、326和925和926、926和439、323和362和926;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述位于氨基酸位置323、362、925或926的突变为将所述位置氨基酸残基替换为r或k(如r)的突变。在一些实施方式中,所述位于氨基酸位置439或926的突变为将所述位置氨基酸残基替换为g或在所述氨基酸残基后插入g或gg的突变。

在一些实施方式中,所述工程化cas12i核酸酶包含任一个下述氨基酸残基或氨基酸残基组合:g926、439gg、r925+g926、r326+r925+g926、r926+439gg、或r323+r362+g926;其中,氨基酸位置编号如seqidno.1所定义。

在一些实施方式中,所述工程化cas12i核酸酶包含任一个下述突变或突变组合:i926g、439gg、i926r+439gg、n925r+i926g、d362r+n925r+i926g、e323r+d362r+i926g;其中氨基酸位置编号如seqidno.1所定义。

在一些实施方案中,为实现改善基因编辑效率的目的,也可以使用与上述工程化酶具有至少85%序列一致性的工程化酶。在一些实施方式中,可以使用与其具有至少87%、89%、91%、93%、95%、97%、99%序列一致性的酶。

6)组合突变

利用根据本说明书中1)-5)节所描述的突变以及表1至表5中的多个氨基酸替换/插入的组合而得到的工程化酶都在本申请的请求保护范围之下。

在一些实施方案中,所述工程化的cas12i核酸酶包含任一个下述氨基酸残基位置的突变或突变组合:176、238、447、563、164、926、323、362、439、958、176和238和447和563、323和362、176和238和447和563和164、176和238和447和563和926、176和238和447和563和323和362、164和926、164和323和362、176和238和447和563和164和926、176和238和447和563和164和323和362、176和238和447和563和164和926和323和362、176和238和447和563和164和323和362和926和439;其中,氨基酸位置编号如seqidno.1所定义。在一些实施方式中,所述位于氨基酸位置176、238、447、563、926、323、362或958的突变为将所述位置氨基酸残基替换为r或k(如r)的突变。在一些实施方式中,所述位于氨基酸位置164的突变为将所述位置氨基酸残基替换为y或f(如y)的突变。在一些实施方式中,所述位于氨基酸位置439或926的突变为将所述位置氨基酸残基替换为g或在所述氨基酸残基后插入g或gg的突变。

在一些实施方式中,所述工程化cas12i核酸酶包含任一个下述氨基酸残基或氨基酸残基组合:r176、r238、r447、r563、y164、r926、g926、r958、r323、r362、439g、439gg、r176+r238+r447+r563、r323+r362、r176+r238+r447+r563+y164、r176+r238+r447+r563+r926、r176+r238+r447+r563+r323+r362、y164+r926、y164+r323+r362、r176+r238+r447+r563+y164+r926、r176+r238+r447+r563+y164+r323+r362、r176+r238+r447+r563+y164+r926+r323+r362、r176+r238+r447+r563+y164+r323+r362+g926、r176+r238+r447+r563+y164+r323+r362+g926+439g、r176+r238+r447+r563+y164+r323+r362+g926+439gg;

r176+r238+r447+r563+y164+r958;

r176+r238+r447+r563+r926+r958;

r176+r238+r447+r563+r323+r362+r958;

y164y+r926+r958;

y164+r323+r362+r958;

r176+r238+r447+r563+y164+r958;

r176+r238+r447+r563+y164+r926+r958;

r176+r238+r447+r563+y164+r323+r362+r958;

r176+r238+r447+r563+y164+r926+r323+r362+r958;

r176+r238+r447+r563+y164+r323+r362+g926+r958;

r176+r238+r447+r563+y164+r323+r362+g926+439gg+r958;或

r176+r238+r447+r563+y164+r323+r362+g926+439g+r958;

其中,氨基酸位置编号如seqidno.1所定义。

在一些实施方式中,所述工程化cas12i核酸酶包含任一个下述突变或突变组合:e176r+k238r+t447r+e563r、n164y、i926r、e323r+d362r、e176r+k238r+t447r+e563r+n164y、e176r+k238r+t447r+e563r+i926r、n164y+e323r+d362r、e176r+k238r+t447r+e563r+e323r+d362r、n164y+i926r、e176r+k238r+t447r+e563r+n164y+i926r、e176r+k238r+t447r+e563r+n164y+e323r+d362、e176r+k238r+t447r+e563r+n164y+i926r+e323r+d362r、e176r+k238r+t447r+e563r+n164y+e323r+d362r+i926g、e176r+k238r+t447r+e563r+n164y+e323r+d362r+i926g+439gg、e176r+k238r+t447r+e563r+n164y+e323r+d362r+i926g+439g、e176r+k238r+t447r+e563r+n164y+d958r、

e176r+k238r+t447r+e563r+i926r+d958r、

e176r+k238r+t447r+e563r+e323r+d362r+d958r、n164y+i926r+d958r、n164y+e323r+d362r+d958r、e176r+k238r+t447r+e563r+n164y+d958r、e176r+k238r+t447r+e563r+n164y+i926r+d958r、

e176r+k238r+t447r+e563r+n164y+e323r+d362r+d958r、

e176r+k238r+t447r+e563r+n164y+i926r+e323r+d362r+d958r、

e176r+k238r+t447r+e563r+n164y+e323r+d362r+i926g+d958r、

e176r+k238r+t447r+e563r+n164y+e323r+d362r+i926g+439gg+d958r、或e176r+k238r+t447r+e563r+n164y+e323r+d362r+i926g+439g+d958r;其中,氨基酸位置编号如seqidno.1所定义。

在一些实施方式中,所述工程化cas12i核酸酶包含e176r、k238r、t447r、e563r、n164y、e323r、和d362r突变。在一些实施方式中,所述工程化cas12i核酸酶包含e176r、k238r、t447r、e563r、n164y、和i926r突变。在一些实施方式中,所述工程化cas12i核酸酶包含e176r、k238r、t447r、e563r、e323r、和d362r突变。在一些实施方式中,所述工程化cas12i核酸酶包含e176r、k238r、t447r、e563r、n164y、e323r、d362r、和i926g突变。在一些实施方式中,所述工程化cas12i核酸酶包含e176r、k238r、t447r、e563r、n164y、e323r、d362r、i926g、和439gg突变。在一些实施方式中,所述工程化cas12i核酸酶包含e176r、k238r、t447r、e563r、n164y、e323r、d362r、i926g、和439g突变。在一些实施方式中,所述工程化cas12i核酸酶包含e176r、k238r、t447r、e563r、n164y、和d958r突变。在一些实施方式中,所述工程化cas12i核酸酶包含e176r、k238r、t447r、e563r、n164y、i926r、和d958r突变。在一些实施方式中,所述工程化cas12i核酸酶包含e176r、k238r、t447r、e563r、n164y、e323r、d362r、和d958r突变。在一些实施方式中,所述工程化cas12i核酸酶包含e176r、k238r、t447r、e563r、n164y、i926r、e323r、d362r、和d958r突变。在一些实施方式中,所述工程化cas12i核酸酶包含e176r、k238r、t447r、e563r、n164y、e323r、d362r、i926g、和d958r突变。在一些实施方式中,所述工程化cas12i核酸酶包含e176r、k238r、t447r、e563r、n164y、e323r、d362r、i926g、439gg、和d958r突变。

在一些实施方案中,为实现改善基因编辑效率的目的,也可以使用与上述工程化酶具有至少85%序列一致性的工程化酶;在一些实施方式中可以使用与其具有至少87%、89%、91%、93%、95%、97%、99%序列一致性的酶。

在一些实施方案中,提供了一种工程化的cas12i核酸酶,其包含如seqidno.1~12中所示的任一氨基酸序列,或具有与seqidno.1~12中所示的任一氨基酸序列具有至少85%(例如至少87%、89%、91%、93%、95%、97%、或99%)序列一致性的氨基酸序列。

6)参比cas12i核酸酶

在一些实施方案中,所述参比cas12i核酸酶为cas12i1、cas12i2,或其直系同源物。在一些实施方案中,所述参比cas12i核酸酶为天然cas12i1。在一些实施方案中,所述参比cas12i核酸酶为天然cas12i2。在一些实施方案中,所述参比cas12i核酸酶为经过工程改造后的cas12i核酸酶。

v-i型crispr-cas12i已被鉴定为rna-指导的dna核酸内切酶系统。与诸如cas12b或cas9的crispr-cas系统不同,基于cas12i的crispr系统不需要tracrrna序列。在一些实施方案中,所述rna指导序列包括crrna。通常,本文所述的crrna包括直接重复序列和间隔区序列。在某些实施方案中,所述crrna包括与指导序列或间隔区序列连接的直接重复序列、基本由或由其组成。在一些实施方案中,所述crrna包括直接重复序列、间隔区序列和直接重复序列(dr-间隔区-dr),其是其他crispr系统中的前体crrna(pre-crrna)构型的典型特征。在一些实施方案中,所述crrna包括截短的直接重复序列和间隔区序列,其是经加工的或成熟的crrna的典型特征。在一些实施方案中,所述crispr-cas12i效应蛋白与rna指导序列形成复合物,并且所述间隔区序列将复合物引导至与靶核酸的序列特异性结合,所述靶核酸与间隔区序列互补。

在一些实施方案中,本申请的工程化的cas12i是核酸内切酶,其结合靶序列的特定位点并在指导rna的指导下切割,并且具有dna和rna内切核酸酶活性。在一些实施方案中,所述cas12i能够通过加工前体crrna阵列来进行自主的crrna生物发生。自主的前体crrna处理可促进cas12i的递送,从而实现双切口应用,因为可以由单个crrna转录物靶向两个单独的基因组位点。然后,cas12i蛋白将crispr阵列加工成两个同源的crrna,从而形成配对的切口复合物。v-i型(cas12i)效应蛋白的复用(multiplexing)是利用所述效应蛋白的前体crrna处理能力完成的,其中可以针对具有不同序列的多个靶标在单个rna指导序列上编程。这样,可以同时操纵多个基因或dna靶标以用于治疗应用。在一些实施方案中,所述指导rna包含由crispr阵列表达的前体crrna,所述crispr阵列由与未加工的dr序列交错的靶序列组成,通过所述效应蛋白的内在前体crrna加工而重复以使得能够同时靶向一个、两个或多个位点。

在一些实施方案中,vi型crispr-cas12i效应蛋白能够识别原间隔区相邻基序(pam),并且所述靶核酸包括pam或由其组成,pam包括核酸序列5'-ttn-3'、5'-tth-3'、5'-tty-3'或5'-ttc-3',或者由其组成。

来自多种生物体的cas12i核酸酶可以用作所述参比cas12i核酸酶,以提供本申请的工程化的cas12i核酸酶及效应蛋白。示例性cas12i核酸酶已经描述于例如wo2019/201331a1和us2020/0063126a1中,其通过整体引用而并入本文。在一些实施方案中,所述参比cas12i核酸酶具有酶活性。在一些实施方案中,所述参比cas12i是核酸酶,即切割靶双螺旋核酸(例如,双螺旋dna)的两条链。在一些实施方案中,所述参比cas12i是切口酶,即切割靶双螺旋核酸(例如,双螺旋dna)的单链。在一些实施方案中,所述参比cas12i核酸酶是酶失活的。在一些实施方案中,所述参比cas12i酶是cas12i1、cas12i2或cas12i-phi。与cas12i或其功能衍生物具有一定序列同一性(例如至少约60%、70%、80%、85%、90%、95%、98%或更多中任一个)的直系同源物可以用作设计本申请的工程化的cas12i核酸酶或效应蛋白的基础。

在一些实施方案中,所述工程化的cas12i核酸酶基于天然存在的cas12i核酸酶的功能变体。在一些实施方案中,所述功能变体具有一个或多个突变,如氨基酸替换、插入和缺失。举例来说,与野生型天然存在的cas12i核酸酶相比,所述功能变体可包含1、2、3、4、5、6、7、8、9、10个或更多个氨基酸替换中的任一个。在一些实施方案中,所述一个或多个替换是保守替换。在一些实施方案中,所述功能变体具有天然存在的cas12i核酸酶的所有结构域。在一些实施方案中,所述功能变体不具有天然存在的cas12i核酸酶的一个或多个结构域。

还提供了基于本文所述工程化的cas12i2核酸酶中任一种的工程化的cas12i效应蛋白。在一些实施方案中,所述工程化的cas12i效应蛋白具有酶活性。在一些实施方案中,所述工程化的cas12i效应蛋白是切割靶双螺旋核酸(例如,双螺旋dna)的两条链的核酸酶。在一些实施方案中,所述工程化的cas12i效应蛋白是切口酶,即切割靶双螺旋核酸(例如,双螺旋dna)的单链。在一些实施方案中,所述工程化的cas12i效应蛋白包含所述工程化的cas12i核酸酶的酶失活突变体。cas12i核酸酶活性位点中一个或多个氨基酸残基的突变会导致失去酶活的cas12i。在一些实施方案中,本文提供的工程化的cas12i酶可以被修饰以具有减少的核酸酶活性,例如,核酸酶与野生型cas12i酶相比失活至少50%、至少60%、至少70%、至少80%、至少90%、至少95%,至少97%或100%。所述核酸酶活性可以通过几种方法来降低,例如,将突变引入所述核酸酶或cas12i酶的pam相互作用结构域中。在一些实施方案中,鉴定了核酸酶活性的催化残基,并且这些氨基酸残基可以被不同的氨基酸残基(例如,甘氨酸或丙氨酸)替换以降低所述核酸酶活性。cas12i1的此类突变的实例包括d647a、e894a或d948a。cas12i2的此类突变的实例包括d599a、e833a、s883a、h884a、d886a、r900a和/或d1019a。

7)工程化的cas12i核酸酶的活性

所述工程化的cas12i核酸酶与所述参比cas12i核酸酶相比具有增加的活性。在一些实施方案中,所述活性是靶dna结合活性。在一些实施方案中,所述活性是位点特异性核酸酶活性。在一些实施方案中,所述活性是双链dna切割活性。在一些实施方案中,所述活性是单链dna切割活性,包括例如位点特异性dna切割活性或非特异性dna切割活性。在一些实施方案中,所述活性是单链rna切割活性,例如位点特异性rna切割活性或非特异性rna切割活性。在一些实施方案中,所述活性是在体外测量的。在一些实施方案中,所述活性是在细胞如细菌细胞、植物细胞或真核细胞中测量的。在一些实施方案中,所述活性是在哺乳动物细胞如啮齿动物细胞或人细胞中测量的。在一些实施方案中,所述活性是在人细胞诸如293t细胞中测量的。在一些实施方案中,所述活性是在小鼠细胞,例如hepa1-6细胞中测量的。在一些实施方案中,所述工程化的cas12i核酸酶具有与参比cas12i核酸酶相比增加至少约20%、30%、40%、60%、70%、80%、90%、1.5倍、2倍、3倍、4倍、5倍、10倍或更多中任一个的位点特异性核酸酶活性。所述工程化的cas12i核酸酶的位点特异性核酸酶活性可以使用本领域中已知的方法来测量,包括例如,凝胶迁移测定,如本文提供的实施例中所述的基于琼脂糖凝胶电泳的体外切割测定。

在一些实施方案中,所述活性是细胞中的基因编辑活性。在一些实施方案中,所述细胞是细菌细胞、植物细胞或真核细胞。在一些实施方案中,所述细胞是哺乳动物细胞如啮齿动物细胞或人细胞。在一些实施方案中,所述细胞是293t细胞。在一些实施方案中,所述活性是在小鼠细胞,例如hepa1-6细胞中测量的。在一些实施方案中,所述活性是在细胞中靶基因组位点的插入缺失形成活性,例如通过所述工程化的cas12i核酸酶对靶核酸进行位点特异性切割和通过非同源末端连接(nhej)机制进行dna修复。在一些实施方案中,所述活性是在细胞中靶基因组位点插入外源核酸序列,例如通过所述工程化的cas12i核酸酶对靶核酸进行位点特异性切割和通过同源重组(hr)机制进行dna修复。在一些实施方案中,所述工程化的cas12i核酸酶与参比cas12i核酸酶相比在细胞(例如人细胞如293t细胞或小鼠hepa1-6细胞)的基因组位点处增加至少约20%、30%、40%、60%、70%、80%、90%、1.5倍、2倍、3倍、4倍、5倍、10倍或更多中任一个的基因编辑(例如,插入缺失形成)活性。在一些实施方案中,所述工程化的cas12i核酸酶与参比cas12i2核酸酶相比在细胞(例如人细胞如293t细胞或小鼠hepa1-6细胞)的多个(例如2、3、4、5、6、7、8、9、10个或更多个)基因组位点处增加至少约20%、30%、40%、60%、70%、80%、90%、1.5倍、2倍、3倍、4倍、5倍、10倍或更多中任一个的基因编辑(例如,插入缺失形成)活性。在一些实施方案中,所述工程化的cas12i核酸酶与所述参比cas12i核酸酶相比,能够编辑更多数目的基因组位点。在一些实施方案中,所述工程化的cas12i核酸酶的共有pam序列与所述参比cas12i核酸酶相同。

可使用本领域已知的方法确定细胞中工程化的cas12i核酸酶的基因编辑效率,包括例如t7核酸内切酶1(t7e1)测定、靶dna的测序(包括例如,sanger序列,以及二代测序)、由分解追踪插入缺失(tide)测定或通过扩增子分析进行插入缺失检测(idaa)测定。参见例如sentmanatmfetal.,“asurveyofvalidationstrategiesforcrispr-cas9editing,”scientificreports,2018,8,文章编号888,其通过整体引用而并入本文。在一些实施方案中,例如,如本文实施例中所述,使用靶向的二代测序(ngs)来测量细胞中所述工程化的cas12i核酸酶的基因编辑效率。用于确定所述工程化的cas12i核酸酶的基因编辑效率的示例性基因组位点包括但不限于ccr5、aavs、cd34、rnf2和emx1。在一些实施方案中,所述工程化的cas12i核酸酶的基因编辑效率为所述工程化的cas12i核酸酶在至少5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个或更多位点(入人类细胞基因组位点)的平均基因编辑效率。在一些实施方案中,所述工程化的cas12i核酸酶的基因编辑效率(例如插入缺失率)达到至少20%、30%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%或更高。

工程化的cas12i效应蛋白

本申请提供了工程化的cas12i(如cas12i2)效应蛋白,其具有改善的活性,例如靶标结合、双链切割活性、切口酶活性和/或基因编辑活性。在一些实施方案中,提供了工程化的cas12i效应蛋白(例如,cas12i核酸酶、cas12i切口酶、cas12i融合效应蛋白或分割型(split)cas12i效应蛋白),其包含本文所述工程化的cas12i核酸酶或其功能衍生物中的任一种。

变体

本申请提供了工程化的cas12i效应蛋白,其包含本文所述工程化的cas12i核酸酶的功能变体。在一些实施方案中,当与相应的工程化的cas12i核酸酶的氨基酸序列相比时,功能变体的氨基酸序列具有至少一个氨基酸残基的不同(例如,具有缺失、插入、替换和/或融合)。在一些实施方案中,所述功能变体具有一个或多个突变,如氨基酸替换、插入和/或缺失。举例来说,与工程化的cas12i核酸酶相比,功能变体可包含1、2、3、4、5、6、7、8、9、10个或更多个氨基酸中任一个替换。在一些实施方案中,所述一个或多个替换是保守替换。在一些实施方案中,所述功能变体具有工程化的cas12i核酸酶的所有结构域。在一些实施方案中,所述功能变体不具有工程化的cas12i核酸酶的一个或多个结构域。

对于本文所述cas12i变体蛋白(例如,切口酶cas12i蛋白、失活或催化失活的cas12i(dcas12i)、融合cas12i)中任一种,所述cas12i变体可包括具有上述相同参数(例如,存在的结构域、同一性百分比等)的cas12i蛋白序列。

催化活性

在一些实施方案中,所述功能变体与其工程化的cas12i核酸酶的非突变形式相比,具有不同的催化活性。在一些实施方案中,所述突变(例如,氨基酸替换、插入和/或缺失)在cas12i效应蛋白的催化结构域(例如,ruvc结构域)中。在一些实施方案中,所述变体包含多个催化结构域中的突变。切割双链靶核酸的一条链而不切割另一条链的cas12i效应蛋白,在本文中被称为“切口酶”(例如“cas12i切口酶”)。在本文中,基本上不具有核酸酶活性的cas12i蛋白称为失活cas12i蛋白(“dcas12i”)(声明:在融合cas12i效应蛋白的情况下,异源多肽(融合伴侣)可以提供核酸酶活性,将在下面进行详细说明)。在一些实施方案中,相对于其非突变形式而言,当突变酶的dna切割活性小于约25%、10%、5%、1%、0.1%、0.01%或更低时,认为cas12i效应蛋白基本上缺乏所有的dna切割活性。

分割型cas12i效应蛋白

本申请还提供了基于本文所述工程化的cas12i效应蛋白中任一种的分割型cas12i效应蛋白。分割型cas12i效应蛋白对于递送可能是有利的。在一些实施方案中,所述工程化的cas12i效应蛋白被分割成酶的两个部分,可以将它们重构在一起以提供基本起作用的cas12i效应蛋白。可利用已知方法提供cas效应蛋白,例如,cas12和cas9蛋白的分割形式已描述于例如wo2016/112242、wo2016/205749和pct/cn2020/111057,其通过整体引用而并入本文。

在一些实施方案中,提供了分割型cas12i效应蛋白,其包含第一多肽和第二多肽,所述第一多肽包含本文所述工程化的cas12i核酸酶中任一种或其功能衍生物的n末端部分,所述第二多肽包含所述工程化的cas12i核酸酶或其功能衍生物的c末端部分,其中所述第一多肽和第二多肽能够在包含指导序列的指导rna存在下彼此缔合,以形成与靶核酸特异性结合的crispr复合物,所述靶核酸包含与所述指导序列互补的靶序列。在一些实施方案中,所述第一多肽和第二多肽各自包含二聚化结构域。在一些实施方案中,所述第一二聚化结构域和第二二聚化结构域在诱导剂(例如雷帕霉素)存在下彼此缔合。在一些实施方案中,所述第一多肽和第二多肽不包含二聚化结构域。在一些实施方案中,所述分割型cas12i效应蛋白是自诱导的。

可以以不影响催化结构域的方式进行分割。cas12i效应蛋白可以用作核酸酶(包括切口酶)或可以是灭活的酶,其本质上是具有很少或没有催化活性(例如由于其催化结构域中的突变)的rna指导的dna结合蛋白。

在一些实施方案中,cas12i蛋白的核酸酶叶和α-螺旋叶表达为分开的多肽。尽管所述叶不自行相互作用,但rna指导序列将它们募集到一个复合物中,所述复合物概括了全长cas12i酶的活性并催化位点特异性的dna切割。在一些实施方案中,经修饰的rna指导序列可以用于通过防止二聚化而消除分割型酶的活性,从而允许诱导型二聚化系统的发展。所述分割型酶描述于例如,wright,addisonv.,etal.“rationaldesignofasplit-cas9enzymecomplex,”proc.nat'l.acad.sci.,112.10(2015):2984-2989,其通过整体引用并入本文。

本文所述分割型cas12i效应蛋白部分可设计为通过将参比工程化的cas12i效应蛋白(例如全长工程化的cas12i)在一个分割位置处分开(即,分割)成两半,所述位置是所述参比cas12i效应蛋白的n端部分与c端部分分开的点。在一些实施方案中,所述n末端部分包含氨基酸残基1至x,而所述c末端部分包含氨基酸残基x+1至所述参比cas12i效应蛋白的c末端。在该实例中,编号是连续的,但这并非必需的,因为还考虑了氨基酸(或编码它们的核苷酸)可以从分割的末端和/或突变(例如,插入、删除和替换)中任一个在所述多肽链的内部区域修剪而来,条件是重构的cas12i效应蛋白保留了足够的dna结合活性(如果需要)、dna切口酶或切割活性,例如与所述参比cas12i效应蛋白相比,具有至少40%、50%、60%、70%、80%、90%或95%活性。

可以通过计算机(insilico)设计分割点并将其克隆到构建体中。在此过程中,可以将突变引入分割型cas12i效应蛋白,并且可以去除非功能结构域。在一些实施方案中,所述分割型cas12i效应蛋白的两个部分或片段(即,n末端和c末端片段)可以形成完整的cas12i效应蛋白,其包含例如完整cas12i效应蛋白序列的至少70%、至少80%、至少90%、至少95%或至少99%。

所述分割型cas12i效应蛋白可各自包含一个或多个二聚化结构域。在一些实施方案中,所述第一多肽包含与第一分割型cas12i效应蛋白部分融合的第一二聚结构域,并且所述第二多肽包含与第二分割型cas12i效应蛋白部分融合的第二二聚结构域。可通过肽接头(例如,柔性肽接头如gs接头)或化学键将所述二聚化结构域融合至所述分割型cas12i效应蛋白部分。在一些实施方案中,所述二聚化结构域与所述分割型cas12i效应蛋白部分的n末端融合。在一些实施方案中,所述二聚化结构域与所述分割型cas12i效应蛋白部分的c末端融合。

在一些实施方案中该分割型cas12i效应蛋白不包含任何二聚化结构域。

在一些实施方案中,所述二聚化结构域促进两个分割型cas12i效应蛋白部分的缔合。在一些实施方案中,所述分割型cas12i效应蛋白部分被诱导剂诱导而缔合或二聚化为功能性cas12i效应蛋白。在一些实施方案中,所述分割型cas12i效应蛋白包含可诱导的二聚化结构域。在一些实施方案中,所述二聚化结构域不是可诱导的二聚化结构域,即,所述二聚化结构域在诱导剂不存在下进行二聚化。

诱导剂可以是除指导rna(例如sgrna)以外的诱导能量源或诱导分子。所述诱导剂通过诱导的二聚化结构域的二聚化将两个分割型cas12i效应蛋白部分重构为功能性cas12i效应蛋白。在一些实施方案中,所述诱导剂通过可诱导的二聚化结构域的诱导缔合的作用将两个分割型cas12i效应蛋白部分聚集在一起。在一些实施方案中,在没有诱导剂的情况下,两个分割型cas12i效应蛋白部分不彼此缔合以重构为功能性cas12i效应蛋白。在一些实施方案中,在没有诱导剂的情况下,两个分开的cas12i效应蛋白部分可以在指导rna(例如crrna)存在下彼此缔合以重构为功能性cas12i效应蛋白。

本申请的诱导剂可以是热、超声、电磁能或化合物。在一些实施方案中,所述诱导剂是抗生素、小分子、激素、激素衍生物、类固醇或类固醇衍生物。在一些实施方案中,所述诱导剂是脱落酸(aba)、多西霉素(dox)、异丙基苯甲酸(cumate)、雷帕霉素、4-羟基他莫昔芬(4oht)、雌激素或蜕皮激素。在一些实施方案中,所述分割型cas12i效应系统是选自下组的诱导剂控制的系统:基于抗生素的诱导系统、基于电磁能的诱导系统、基于小分子的诱导系统、基于核受体的诱导系统和基于激素的诱导系统。在一些实施方案中,所述分割型cas12i效应系统是选自下组的诱导剂控制的系统:四环素(tet)/dox诱导系统、光诱导系统、aba诱导系统、异丙基苯甲酸(cumate)阻遏物/操纵子系统、4oht/雌激素诱导系统、基于蜕皮激素的诱导系统和fkbp12/frap(fkbp12-雷帕霉素复合物)诱导系统。这样的诱导剂也讨论于本文和pct/us2013/051418,其通过整体引用而并入本文。frb/fkbp/雷帕霉素系统已描述于paulmuruganandgambhir,cancerres,august15,200565;7413,以及crabtreeetal.,chemistry&biology13,99-107,jan2006,其通过整体引用而并入本文。

在一些实施方案中,成对的分割型cas12i效应蛋白是分开的并且是无活性的,直到诱导了所述二聚化结构域的二聚化(例如,frb和fkbp),该二聚化导致功能性cas12i效应蛋白核酸酶的再组装。在一些实施方案中,包含诱导型二聚体(例如frb)的第一半部分的第一分割型cas12i效应蛋白被分开递送,和/或处在与包含诱导型二聚体(例如fkbp)的第二半部分的第二分割型cas12i效应蛋白分开的位置。

可用于本文所述的诱导剂控制的分割型cas12i效应系统中的其他示例性的基于fkbp的诱导系统包括但不限于:在fk506存在下与钙调神经磷酸酶(cna)进行二聚化的fkbp;在fkcsa存在下与cyp-fas进行二聚化的fkbp;在雷帕霉素存在下与frb进行二聚化的fkbp;在香豆霉素存在下与gryb进行二聚化的gyrb;在赤霉素存在下与gid1进行二聚化的gai;或在haxs存在下与halotag进行二聚化的snap-tag。

也考虑了fkbp家族本身内的替代方案。例如,在fk1012存在下fkbp进行均二聚(即,一个fkbp与另一种fkbp进行二聚化)。

在一些实施方案中,所述二聚化结构域是fkbp,而诱导剂是fk1012。在一些实施方案中,所述二聚化结构域是gryb,而诱导剂是香豆霉素。在一些实施方案中,所述二聚化结构域是aba,而诱导剂是赤霉素。

在一些实施方案中,可以在不存在诱导剂的情况下自动诱导(即,自动激活或自诱导)所述分割型cas12i效应蛋白部分以缔合/二聚化为功能性cas12i效应蛋白。不受任何理论或假设的束缚,可以通过与指导rna如crrna结合来介导所述分割型cas12i效应蛋白部分的自动诱导。在一些实施方案中,所述第一多肽和第二多肽不包含二聚化结构域。在一些实施方案中,所述第一多肽和第二多肽包含二聚化结构域。

在一些实施方案中,本文所述分割型cas12i效应系统(包括诱导剂控制的和自动诱导的系统)的重构的cas12i效应蛋白,相对于参比cas12i效应蛋白编辑效率,具有至少70%(如至少约70%、75%、80%、85%、90%、95%、98%、99%或更多效率或100%效率中任一种)的编辑效率。

在一些实施方案中,本文所述诱导剂控制的分割型cas12i效应系统的重构的cas12i效应蛋白,在没有诱导剂存在下(即由于自动诱导),相对于参比cas12i效应蛋白编辑效率,其具有不超过50%(如不超过约50%、45%、40%、35%、30%、25%、20%、15%、10%、5%或更低效率,或0%效率中任一个)的编辑效率。

融合cas12i效应蛋白

本申请还提供了工程化的cas12i效应蛋白,其包含另外的蛋白结构域和/或组分,如接头、核定位/输出序列、功能结构域和/或报告蛋白。

在一些实施方案中,所述工程化的cas12i效应蛋白是包含一个或多个异源蛋白结构域(例如,约或大于约1、2、3、4、5、6、7、8、9、10个或更多个结构域)以及所述工程化的cas12i核酸酶的核酸靶向结构域或其功能衍生物的蛋白复合物。在一些实施方案中,所述工程化的cas12i效应蛋白是包含与所述工程化的cas12i核酸酶融合的一个或多个异源蛋白结构域(例如约或多于约1、2、3、4、5、6、7、8、9、10个或更多个结构域)的融合蛋白。

在一些实施方案中,本申请的工程化的cas12i效应蛋白可包含(例如,通过融合蛋白,如通过一个或多个肽接头,例如gs肽接头等)一个或多个功能结构域或缔合(例如,通过多种蛋白的共表达)于它。在一些实施方案中,所述一个或多个功能结构域是酶结构域。这些功能结构域可以具有多种活性,例如dna和/或rna甲基化酶活性、脱甲基酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、rna切割活性、dna切割活性、核酸结合活性和开关活性(例如,光诱导的)。在一些实施方案中,所述一个或多个功能结构域是转录激活结构域(即,反式激活结构域)或阻遏物结构域。在一些实施方案中,所述一个或多个功能结构域是组蛋白修饰结构域。在一些实施方案中,所述一个或多个功能结构域是转座酶结构域、hr(同源重组)机构结构域、重组酶结构域和/或整合酶结构域。在一些实施方案中,所述功能结构域是krüppel相关盒(krab)、vp64、vp16、fok1、p65、hsf1、myod1、生物素-apex、apobec1、aid、pmcda1、tad1和m-mlv逆转录酶。在一些实施方案中,所述功能结构域选自下组:翻译起始结构域、转录阻遏结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域(例如,cbe或abe结构域)、逆转录酶结构域、报告分子结构域(例如,荧光结构域)和核酸酶结构域。

在一些实施方案中,所述工程化的cas12i效应蛋白中一个或多个功能结构域的定位允许功能结构域的正确空间定向以影响具有所赋予功能作用的靶标。例如,如果所述功能结构域是转录激活子(例如,vp16、vp64或p65),则将所述转录激活子放置在使其能够影响靶标转录的空间取向上。同样地,定位转录阻遏物以影响靶标的转录,并且将核酸酶(例如,fok1)定位以切割或部分切割所述靶标。在一些实施方案中,所述功能结构域位于所述工程化的cas12i效应蛋白的n末端。在一些实施方案中,所述功能结构域位于工程化的cas12i效应蛋白的c末端。在一些实施方案中,所述工程化的cas12i效应蛋白在n末端包含第一功能结构域,并在c末端包含第二功能结构域。在一些实施方案中,所述工程化cas12i效应蛋白包含与一个或多个功能结构域融合的本文所述工程化的cas12i核酸酶中任一种的催化失活突变体。

在一些实施方案中,所述工程化的cas12i效应蛋白是转录激活子。在一些实施方案中,所述工程化的cas12i效应蛋白包含与反式激活结构域融合的本文所述工程化的cas12i核酸酶中任一种的酶失活变体。在一些实施方案中,所述反式激活域选自下组:vp64、p65、hsf1、vp16、myod1、hsf1、rta、set7/9及其组合。在一些实施方案中,所述反式激活结构域包含vp64、p65和hsf1。在一些实施方案中,所述工程化的cas12i效应蛋白包含两个分割型cas12i效应多肽,每个都与反式激活结构域融合。

在一些实施方案中,所述工程化的cas12i效应蛋白是转录阻遏物。在一些实施方案中,所述工程化的cas12i效应蛋白包含与转录阻遏结构域融合的本文所述工程化的cas12i核酸酶中任一种的酶失活变体。在一些实施方案中,所述转录阻遏物结构域选自下组:krüppel相关盒(krab)、enr、nue、ncor、sid、sid4x及其组合。在一些实施方案中,所述工程化的cas12i效应蛋白包含两个分割型cas12i效应多肽,每个都与转录阻遏结构域融合。

在一些实施方案中,所述工程化的cas12i效应蛋白是碱基编辑器,如胞嘧啶编辑器或腺苷编辑器。在一些实施方案中,所述工程化的cas12i效应蛋白包含与核碱基编辑结构域融合的本文所述任何工程化的cas12i核酸酶中任一种的酶失活变体,所述核碱基编辑结构域诸如为胞嘧啶碱基编辑(cbe)结构域或腺苷碱基编辑(abe)域。在一些实施方案中,所述核碱基编辑结构域是dna编辑结构域。在一些实施方案中,所述核碱基编辑结构域具有脱氨酶活性。在一些实施方案中,所述核碱基编辑结构域是胞嘧啶脱氨酶结构域。在一些实施方案中,所述核碱基编辑结构域是腺苷脱氨酶结构域。基于cas核酸酶的示例性碱基编辑器描述于例如,wo2018/165629a1和wo2019/226953a1,其通过整体引用而并入本文。示例性cbe结构域包括但不限于:活化诱导的胞苷脱氨酶或aid(例如haid)、载脂蛋白bmrna编辑复合物或apobec(例如大鼠apobec1、hapobec3a/b/c/d/e/f/g)和pmcda1。示例性abe结构域包括但不限于:tada、abe8及其变体(参见例如gaudellietal.,2017,nature551:464-471;andrichteretal.,2020,naturebiotechnology38:883-891)。在一些实施方案中,所述功能性结构域是apobec1结构域,例如大鼠apobec1结构域。在一些实施方案中,所述功能性结构域是tada结构域,例如大肠杆菌(e.coli)tada结构域。在一些实施方案中所述工程化的cas12i效应蛋白还包含一个或多个核定位序列。

在一些实施方案中,所述工程化的cas12i效应蛋白是主编辑器。基于cas9的主编辑器描述于例如,a.anzaloneetal.,nature,2019,576(7785):149-157,其通过整体引用而并入本文。在一些实施方案中,所述工程化的cas12i效应蛋白包含与逆转录酶结构域融合的本文所述工程化的cas12i核酸酶中任一种的切口酶变体。在一些实施方案中,所述功能结构域是逆转录酶结构域。在一些实施方案中,所述逆转录酶结构域是m-mlv逆转录酶或其变体,例如具有d200n、t306k、w313f、t330p和l603w的一个或多个突变的m-mlv逆转录酶。在一些实施方案中,提供了包含所述主编辑器的工程化crispr/cas12i系统。在一些实施方案中,所述工程化的crispr/cas12i系统还包含第二cas12i切口酶,例如基于与主编辑器的相同的工程化的cas12i核酸酶。在一些实施方案中,所述工程化的crispr/cas12i系统包含主编辑器指导rna(pegrna),其包含引物结合位点和逆转录酶(rt)模板序列。

在一些实施方案中,本申请提供了具有与分割型cas12i效应蛋白部分之一或两者缔合(即,结合或融合)的一个或多个(例如,1、2、3、4、5、6个或更多个)功能结构域的分割型cas12i效应系统。所述功能结构域可以作为所第一和/或第二分割型cas12i效应蛋白的一部分提供,作为该构建体内的融合物。所述功能结构域通常通过肽接头(诸如gs接头)与分割型cas12i效应蛋白中其他部分融合(例如,分割型cas12i效应蛋白部分)。这些功能结构域可用于基于催化失活cas12i效应蛋白重新改换该分割型cas12i效应系统的功能。

在一些实施方案中,所述工程化的cas12i效应蛋白包含一个或多个核定位序列(nls)和/或一个或多个核输出序列(nes)。示例性的nls序列包括例如pkkkrkvpg和aspkkkrkv。nls和/或nes可以可操作地连接至所述工程化的cas12i效应蛋白的n末端和/或c末端或所述工程化的cas12i效应蛋白中的多肽链。

在一些实施方案中,所述工程化的cas12i效应蛋白可以编码另外的组分,例如报告蛋白。在一些实施方案中,所述工程化的cas12i效应蛋白包含荧光蛋白,例如gfp。这样的系统可以允许对基因组位点进行成像(例如,参见“dynamicimagingofgenomiclociinlivinghumancellsbyanoptimizedcrispr/cassystem”chenbetal.cell2013)。在一些实施方案中所述工程化的cas12i效应蛋白是可用于对基因组位点成像的可诱导分割型cas12i效应系统。

在又一具体实施方案中,提供了一种工程化的cas12i效应蛋白,其中所述效应蛋白能够诱导dna分子中的双链断裂或单链断裂。

在再一具体实施方案中,提供了一种工程化的cas12i效应蛋白,其中所述工程化的cas12i核酸酶的功能衍生物为酶失活突变体,例如含有d599a、e833a、s883a、h884a、d886a、r900a和/或d1019a的cas12i2核酸酶失活突变体,和含有d647a、e894a和/或d948a的cas12i1核酸酶失活突变体。已知的cas12i2核酸酶的酶失活突变体,如在us10808245b2和huangx.etal.,naturecommunications,11,articlenumber:5241(2020)中描述的cas12i2核酸酶的任何酶失活突变体都可以和本申请中的突变体组合在一起以提供工程化的cas12i核酸酶的功能衍生物及其相应的效应蛋白。

在又一具体实施方案中,提供了一种工程化的cas12i效应蛋白,其还包含与所述工程化的cas12i核酸酶融合的功能结构域。

在再一具体实施方案中,提供了一种工程化的cas12i效应蛋白,其中所述功能结构域选自下组:翻译起始结构域、转录阻遏结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域、逆转录酶结构域、报告分子结构域和核酸酶结构域。

工程化的crispr-cas12i系统

在一些实施方式中,提供了一种工程化的crispr-cas12i系统,包括:(a)本申请所述的任一种工程化的cas12i效应蛋白(如工程化cas12i核酸酶);以及(b)包含与靶序列互补的指导序列的指导rna,或编码所述指导rna的一种或多种核酸,

其中所述工程化的cas12i效应蛋白和所述指导rna能够形成crispr复合物,所述crispr复合物特异性结合包含所述靶序列的靶核酸并诱导所述靶核酸的修饰。

在一些实施方式中,所述工程化的crispr-cas12i系统包括:(a)本文所述工程化的cas12i效应蛋白中任一种(例如,工程化的cas12i核酸酶、切口酶、分割型cas12i、转录阻遏物、转录激活子、碱基编辑器或主编辑器);以及(b)包含与靶序列互补的指导序列的指导rna,或编码所述指导rna的一种或多种核酸,其中所述工程化的cas12i效应蛋白和所述指导rna能够形成crispr复合物,所述crispr复合物特异性结合于包含所述靶序列的靶核酸并诱导所述靶核酸的修饰。在一些实施方案中,所述工程化的crispr-cas12i系统包含编码所述工程化的cas12i效应蛋白和/或所述指导rna的一种或多种核酸。在一些实施方案中,所述工程化的crispr-cas12i系统包含前体指导rna阵列,其可以例如通过所述工程化的cas12i效应蛋白加工成多个crrna。在一些实施方案中,所述工程化的crispr-cas12i系统包含一种或多种编码所述工程化的cas12i效应蛋白和/或所述指导rna的载体。在一些实施方案中,所述工程化的crispr-cas12i系统包含核糖核蛋白(rnp)复合物,其包含结合至所述指导rna的所述工程化的cas12i效应蛋白。

本申请的工程化的crispr-cas12i系统可包含任何合适的指导rna。指导rna(grna)可以包含能够与目标靶核酸(诸如细胞中的目标基因组位点)中的靶序列杂交的指导序列。在一些实施方案中,所述grna包含含有所述指导序列的crisprrna(crrna)序列。

通常,本文所述的crrna包括直接重复序列和间隔区序列。在某些实施方案中,所述crrna包括与指导序列或间隔区序列连接的直接重复序列、基本由或由它组成。在一些实施方案中,所述crrna包括直接重复序列、间隔区序列和直接重复序列(dr-间隔区序列-dr),其是前体crrna(pre-crrna)构型的典型特征。在一些实施方案中,所述crrna包括截短的直接重复序列和间隔区序列,其是经加工的或成熟的crrna的典型特征。在一些实施方案中,所述crispr-cas12i效应蛋白与rna指导序列形成复合物,并且所述间隔区序列将所述复合物引导至与靶核酸进行序列特异性结合,所述靶核酸与间隔区序列互补。

在一些实施方案中,所述指导rna是包含指导序列的crrna。在一些实施方案中,所述工程化的crispr-cas12i系统包含编码多个crrna的前体指导rna阵列。在一些实施方案中,所述cas12i效应蛋白切割所述前体指导rna阵列以产生多个crrna。在一些实施方案中,所述工程化的crispr-cas12i系统包含编码多个crrna的前体指导rna阵列,其中每个crrna包含不同的指导序列。

所述指导序列可以具有合适的长度。在一些实施方案中,所述指导序列在约18至约35个核苷酸之间,包括例如18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸。所述指导序列可以与靶核酸的靶序列具有至少约70%、75%、80%、85%、90%、95%、98%、99%或100%的互补性。

构建体和载体

本文还提供了编码本文所述工程化的cas12i效应蛋白(例如工程化cas12i核酸酶)中任一种的构建体、载体和表达系统。在一些实施方案中,所述构建体、载体或表达系统还包含一种或多种grna或crrna阵列。

“载体”是包含分离的核酸并且可以用于将所述分离的核酸递送至细胞内部的物质组合物。许多载体是本领域已知的,包括但不限于:线性多核苷酸、与离子或两亲性化合物缔合的多核苷酸、质粒和病毒。通常,合适的载体包含在至少一种生物中起作用的复制起点、启动子序列、方便的限制性核酸内切酶位点和一种或多种选择性标记物。术语“载体”也应被解释为包括非质粒和非病毒化合物,其促进核酸转移到细胞中,诸如例如,聚赖氨酸化合物、脂质体等。

在一些实施方案中,所述载体是病毒载体。病毒载体的实例包括但不限于:腺病毒载体、腺相关病毒载体、慢病毒载体、逆转录病毒载体、牛痘载体、单纯疱疹病毒载体及其衍生物。在一些实施方案中,所述载体是噬菌体载体。病毒载体技术是本领域众所周知的,并且例如描述于sambrook等人(2001,molecularcloning:alaboratorymanual,coldspringharborlaboratory,newyork),以及其他病毒学和分子生物学手册。

已经开发了许多基于病毒的系统,用于将基因转移到哺乳动物细胞中。例如,逆转录病毒为基因递送系统提供了便利的平台。可以使用本领域已知的技术将异源核酸插入载体,并包装在逆转录病毒颗粒中。然后可以分离重组病毒,并在体外或离体递送至所述工程化的哺乳动物细胞。许多逆转录病毒系统是本领域已知的。在一些实施方案中,使用腺病毒载体。许多腺病毒载体是本领域已知的。在一些实施方案中,使用慢病毒载体。在一些实施方案中,使用自灭活的慢病毒载体。

在某些实施方案中,所述载体是腺相关病毒(aav)载体,例如aav2、aav8或aav9,其可以按包含至少1×105个颗粒(也称为颗粒单位,pu)的单次给药施用腺病毒或腺相关病毒。在一些实施方案中,所述给药量是至少约1×106个颗粒,至少约1×107个颗粒,至少约1×108个颗粒,或至少约1×109个颗粒的腺相关病毒。递送方法和给药量描述于例如wo2016205764和美国专利no.8,454,972,其通过整体引用而并入本文。

在一些实施方案中,所述载体是重组腺相关病毒(raav)载体。例如,在一些实施方案中,可以使用经修饰的aav载体递送。经修饰的aav载体可以基于几种衣壳类型中的一种或多种,包括aav1、av2、aav5、aav6、aav8、aav8.2、aav9、aavrh10,经修饰的aav载体(例如经修饰的aav2,经修饰的aav3,经修饰的aav6)和假型aav(例如aav2/8,aav2/5和aav2/6)。可用于产生raav颗粒的示例性aav载体和技术是本领域已知的(参见例如aponte-ubillusetal.(2018)appl.microbiol.biotechnol.102(3):1045-54;zhongetal.(2012)j.genet.syndr.genether.s1:008;westetal.(1987)virology160:38-47(1987);tratschinetal.(1985)mol.cell.biol.5:3251-60;美国专利nos.4,797,368和5,173,414;国际公开第wo2015/054653号和第wo93/24641号,其各自通过引用并入本文)。

用于递送cas9和其他cas蛋白的任何已知的aav载体都可以用于递送本申请的工程化的cas12i系统。

将载体引入哺乳动物细胞的方法是本领域已知的。可以通过物理、化学或生物学方法将载体转移到宿主细胞中。

用于将载体引入宿主细胞的物理方法包括:磷酸钙沉淀、脂质转染、粒子轰击、显微注射、电穿孔等。产生包含载体和/或外源核酸的细胞的方法是本领域众所周知的。参见,例如sambrooketal.(2001)molecularcloning:alaboratorymanual,coldspringharborlaboratory,newyork。在一些实施方案中,通过电穿孔将所述载体引入所述细胞。

用于将异源核酸引入宿主细胞的生物学方法包括使用dna和rna载体。病毒载体已成为将基因插入哺乳动物例如人细胞的最广泛使用的方法。

用于将载体引入宿主细胞的化学方法包括胶体分散系统如大分子复合物、纳米胶囊、微球、珠子和基于脂质的系统,所述基于脂质的系统包括水包油乳液、胶束、混合胶束和脂质体。用作体外递送载体的示例性胶体系统是脂质体(例如,人工膜囊泡)。在一些实施方案中,所述工程化的crispr-cas12i系统以rnp的形式在纳米颗粒中递送。

在一些实施方案中,编码所述crispr-cas12i系统或其组分的载体或表达系统包含一种或多种可选择或可检测的标记物,该标记物提供了分离或有效选择含有和/或已被crispr-cas12i系统(例如在早期和大规模)修饰的细胞的手段。

报告基因可用于鉴定潜在转染的细胞和评估调节序列的功能。通常,报告基因是在受体生物体或组织中不存在或不表达的基因,其编码的多肽的表达是通过某些易于检测的性质(例如酶活性)来证明。在将dna引入受体细胞后的合适时间测定报告基因的表达。合适的报告基因可以包括编码荧光素酶、β-半乳糖苷酶、氯霉素乙酰转移酶、分泌的碱性磷酸酶的基因或绿色荧光蛋白基因(例如ui-teietal.febsletters479:79-82(2000))。

确认宿主细胞中异源核酸的存在的其他方法包括例如本领域技术人员众所周知的分子生物学测定,诸如southern和northern印迹、rt-pcr和pcr;生化测定,例如通过免疫学方法(如elisa和western印迹)检测特定肽的存在或不存在。

在一些实施方案中,编码所述工程化的cas12i效应蛋白和/或所述指导rna的核酸序列与启动子可操作地连接。在一些实施方案中,所述启动子是相对于使用所述工程化的crispr-cas12i系统进行工程化改造的细胞的内源启动子。例如,可以使用本领域已知的任何方法将编码所述工程化的cas12i效应蛋白的核酸敲入工程化的哺乳动物细胞的基因组中位于内源性启动子下游处。在一些实施方案中,所述内源启动子是丰富蛋白(如β-肌动蛋白)的启动子。在一些实施方案中,所述内源启动子是可诱导的启动子,例如,可通过工程化的哺乳动物细胞的内源激活信号来诱导。在一些实施方案中,其中所述工程化的哺乳动物细胞是t细胞,所述启动子是t细胞活化依赖性启动子(诸如il-2启动子、nfat启动子或nfb启动子)。

在一些实施方案中,所述启动子是相对于使用所述工程化的crispr-cas12i系统进行工程化改造的细胞的异源启动子。已经探索了多种启动子以在哺乳动物细胞中表达基因,并且本领域中已知的任何启动子都可以用于本申请中。启动子可大致分为组成型启动子或受调节的启动子,例如诱导型启动子。

在一些实施方案中,编码所述工程化的cas12i效应蛋白和/或所述指导rna的核酸序列与组成型启动子可操作地连接。组成型启动子允许异源基因(也称为转基因)在宿主细胞中组成型表达。本文考虑的示例性组成型启动子包括但不限于:巨细胞病毒(cmv)启动子、人延伸因子-1α(hef1α)、泛素c启动子(ubic)、磷酸甘油激酶启动子(pgk)、猿猴病毒40早期启动子(sv40)以及鸡β-肌动蛋白启动子与cmv早期增强子(cag)耦联。在一些实施方案中,所述启动子是cag启动子,其包含巨细胞病毒(cmv)早期增强子元件、启动子、鸡β-肌动蛋白基因的第一外显子和第一内含子,以及兔β-珠蛋白基因的剪接受体。

在一些实施方案中,编码所述工程化的crispr-cas12i效应蛋白和/或所述指导rna的核酸序列可操作地连接至诱导型启动子。诱导型启动子属于受调控的启动子类型。所述诱导型启动子可以通过一种或多种条件如物理条件、微环境或宿主细胞的生理状态、诱导物(即,诱导剂)或其组合来诱导。在一些实施方案中,所述诱导条件选自下组:诱导剂、辐照(如电离辐射、光)、温度(如热)、氧化还原状态、肿瘤环境和待通过工程化的crispr-cas12i系统进行工程化改造的细胞的活化状态。在一些实施方案中,所述启动子可被小分子诱导剂诸如化合物诱导。在一些实施方案中,所述小分子选自下组:强力霉素、四环素、醇、金属或类固醇。化学诱导的启动子已被最广泛地研究。这样的启动子包括其转录活性受小分子化学物质例如强力霉素、四环素、醇、类固醇、金属和其他化合物的存在或不存在调节的启动子。具有逆四环素受控反式激活因子(rtta)和四环素响应元件启动子(tre)的强力霉素诱导系统是目前最成熟的系统。wo9429442描述了通过四环素响应性启动子严格控制真核细胞中基因表达。wo9601313公开了四环素调节的转录调节剂。另外,诸如tet-on系统之类的tet技术已描述于例如tetsystems.com网站。在本申请中,任何已知的化学调节的启动子均可用于驱动编码所述工程化的crispr-cas12i蛋白和/或所述指导rna的表达。

在一些实施方案中,编码所述工程化的cas12i效应蛋白的核酸序列是经过密码子优化的。

在一些实施方案中,提供了表达构建体,其包含经密码子优化的序列,编码所述工程化的cas12i效应蛋白的该序列连接到bpk2104-ccdb载体上。在一些实施方案中,所述表达构建体编码与所述工程化的cas12i效应蛋白的c末端可操作连接的标签(例如10xhis标签)。

在一些实施方案中,每种工程化的分割型cas12i构建体编码荧光蛋白诸如gfp或rfp。所述报告蛋白可以用于评估所述工程化的cas12i蛋白的共定位和/或二聚化,例如使用显微镜。可以使用编码自切割肽诸如t2a、p2a、e2a或f2a肽的序列,将编码工程化的cas12i效应蛋白的核酸序列与编码另外的组分的核酸序列融合。

在一些实施方案中,提供了用于哺乳动物细胞(例如人细胞)的表达构建体,所述构建体包含编码所述工程化的cas12i效应蛋白的核酸序列。在一些实施方案中,所述表达构建体包含经密码子优化的序列,所述序列编码插入pcag-2a-egfp载体中的所述工程化的cas12i效应蛋白,从而使cas12i蛋白可操作地连接至egfp。在一些实施方案中,提供第二载体用于在哺乳动物细胞(例如人细胞)中表达指导rna(例如crrna或前体crrna阵列)。在一些实施方案中,编码所述指导rna的序列在puc19-u6-i2-crrna载体主链中表达。

iii.使用方法

本申请提供了使用本文所述工程化的cas12i效应蛋白或crispr-cas12i系统中任一种在体外、离体或体内检测靶核酸或修饰核酸的方法,以及使用所述工程化的cas12i效应蛋白或crispr-cas12i系统进行治疗或诊断的方法。还提供了本文所述工程化的cas12i效应蛋白或crispr-cas12i系统用于检测或修饰细胞中的核酸,以及用于治疗或诊断受试者的疾病或病况的用途;以及包含所述工程化的cas12i效应蛋白中任一种或所述工程化的crispr-cas12i系统的一种或多种组分的组合物在制备用于检测或修饰细胞中的核酸以及用于治疗或诊断受试者的疾病或病况的药物中的用途。

检测样品中靶核酸的方法

本申请还提供了使用具有改善的活性的所述工程化的cas12i效应蛋白或crispr-cas12i系统中任一种来检测靶核酸的方法。使用cas12i效应蛋白作为检测试剂可利用以下发现:一旦通过检测到靶dna而被激活,v型crispr/cas蛋白(例如,cas12i)可混杂地切割非靶向单链dna(ssdna或rna,即指导rna的指导序列不与之杂交的单链核酸)。因此,当样品中存在靶dna(双链或单链)时(例如,在某些情况下超过阈值量),结果是样品中单链核酸的切割,这可使用任何方便的检测方法进行检测(例如,使用加标签的单链检测核酸如dna或rna)。cas12i可以切割ssdna和ssrna。例如使用cas蛋白作为检测试剂的方法描述于us10253365和wo2020/056924,其通过整体引用而并入本文。

在一些实施方案中,提供了检测样品中的靶dna(例如,双链或单链)的方法,其包括:(a)使所述样品与以下项接触:(i)本文所述工程化的cas12i效应蛋白中任一种;(ii)指导rna,其包含与所述靶dna杂交的指导序列;和(iii)检测核酸,其为单链的(即“单链检测核酸”)并且不与所述指导rna的指导序列杂交;以及(b)测量通过所述工程化的cas12i效应蛋白切割所述单链检测核酸而产生的可检测信号。在某些情况下,所述单链检测核酸包括发射荧光的染料对(例如,发射荧光的染料对是荧光共振能量转移(fret)对、猝灭剂/荧光对)。在某些情况下,所述靶dna是病毒dna(例如,乳头状病毒、肝dna病毒、疱疹病毒、腺病毒、痘病毒、细小病毒等)。在一些实施方案中,所述单链检测核酸是dna。在一些实施方案中,所述单链检测核酸是rna。

本公开的用于检测样品中的靶dna(单链或双链)的方法,可以以高灵敏度检测靶dna。在一些情况下,本公开的方法可以用于检测存在于包含多个dna(包括所述靶dna和多个非靶dna)的样品中的靶dna,其中所述靶dna以每107个非靶dna中的一个或更多个拷贝存在(例如,每106个非靶dna中的一个或更多个拷贝,每105个非靶dna中的一个或更多个拷贝,每104个非靶dna中的一个或更多个拷贝,每103个非靶dna中的一个或更多个拷贝,每102个非靶dna中的一个或更多个拷贝,每50个非靶dna中的一个或更多个拷贝,每20个非靶dna中的一个或更多个拷贝,每10个非靶dna中的一个或更多个拷贝或每5个非靶dna中的一个或更多个拷贝)。在一些实施方案中,与所述参比cas12i核酸酶相比,本文所述工程化的cas12i效应蛋白可以以更高的灵敏度检测靶dna。在一些实施方案中,与所述参比cas12i核酸酶相比,所述工程化的cas12i效应蛋白可以以10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%或更高的灵敏度检测靶dna。

修饰的方法

在一些实施方案中,本申请提供了修饰包含靶序列的靶核酸的方法,所述方法包括使所述靶核酸与本文所述工程化的crispr-cas12i系统中任一种接触。在一些实施方案中,所述方法在体外进行。在一些实施方案中,所述靶核酸存在于细胞中。在一些实施方案中,所述细胞是细菌细胞、酵母细胞、哺乳动物细胞、植物细胞或动物细胞。在一些实施方案中,所述方法离体进行。在一些实施方案中,所述方法在体内进行。

在一些实施方案中,通过所述工程化的crispr-cas12i系统切割所述靶核酸或改变所述靶核酸中的靶序列。在一些实施方案中,通过所述工程化的crispr-cas12i系统改变所述靶核酸的表达。在一些实施方案中,所述靶核酸是基因组dna。在一些实施方案中,所述靶序列与疾病或病况相关。在一些实施方案中,所述工程化的crispr-cas12i系统包含编码多个crrna的前体指导rna阵列,其中每个crrna包含不同的指导序列。

在一些实施方案中,本申请提供了处理与个体细胞中的靶核酸相关的疾病或病况的方法,其包括使用本文所述方法中任一种来修饰所述个体细胞中的所述靶核酸,从而处理所述疾病或病况。在一些实施方案中,所述疾病或病况选自下组:癌症、心血管疾病、遗传性疾病、自身免疫疾病、代谢性疾病、神经退行性疾病、眼病、细菌感染和病毒感染。

本文所述工程化的crispr-cas12i系统可以用多种方式修饰细胞中的靶核酸,这取决于所述crispr-cas12i系统中工程化的cas12i效应蛋白的类型。在一些实施方案中,所述方法诱导靶核酸中的位点特异性切割。在一些实施方案中,所述方法在细胞如细菌细胞、植物细胞或动物细胞(例如哺乳动物细胞)中切割基因组dna。在一些实施方案中,所述方法通过切割细胞中的基因组dna来杀死细胞。在一些实施方案中所述方法在细胞中切割病毒核酸。

在一些实施方案中,所述方法改变(如增加或减少)细胞中所述靶核酸的表达水平。在一些实施方案中,所述方法例如基于融合至反式激活结构域的无酶活性的cas12i蛋白,使用工程化的cas12i效应蛋白来提高细胞中所述靶核酸的表达水平。在一些实施方案中,所述方法例如基于融合至转录阻遏结构域的无酶活性的cas12i蛋白,使用工程化的cas12i效应蛋白来降低细胞中所述靶核酸的表达水平。在一些实施方案中,所述方法例如基于融合至表观遗传修饰结构域的无酶活性的cas12i蛋白,使用工程化的cas12i效应蛋白将表观遗传修饰引入细胞中的所述靶核酸。本文所述工程化的cas12i系统可用于将其他修饰引入所述靶核酸,这取决于所述工程化的cas12i效应蛋白所包含的功能结构域。

在一些实施方案中,所述方法改变细胞中所述靶核酸中的靶序列。在一些实施方案中,所述方法将突变引入细胞中的所述靶核酸。在一些实施方案中,所述方法使用一种或多种内源性dna修复途径,如非同源末端连接(nhej)或同源定向重组(hdr),在细胞中修复靶dna中诱导的双链断裂,作为由crispr复合物进行序列特异性切割的结果。示例性的突变包括但不限于:插入、缺失、替换和移码。在一些实施方案中,所述方法在靶位点处插入供体dna。在一些实施方案中,供体dna的插入导致将选择性标记物或报告蛋白引入所述细胞。在一些实施方案中,供体dna的插入导致基因的敲入。在一些实施方案中,供体dna的插入导致敲除突变。在一些实施方案中,供体dna的插入导致替换突变诸如单核苷酸替换。在一些实施方案中,所述方法诱导细胞的表型变化。

在一些实施方案中,所述工程化的crispr-cas12i系统用于基因电路(geneticcircuit)的一部分,或用于将基因电路插入细胞的基因组dna中。本文所述的诱导剂控制的工程化的分割型cas12i效应蛋白尤其可用作基因电路的组分。基因电路可用于基因疗法。设计和使用基因电路的方法和技术是本领域已知的。可以进一步参考例如brophy,jenniferan,andchristophera.voigt."principlesofgeneticcircuitdesign."naturemethods11.5(2014):508。

本文所述工程化的crispr-cas12i系统可用于修饰多种靶核酸。在一些实施方案中,所述靶核酸在细胞中。在一些实施方案中,所述靶核酸是基因组dna。在一些实施方案中,所述靶核酸是染色体外dna。在一些实施方案中,所述靶核酸对于细胞是外源的。在一些实施方案中,所述靶核酸是病毒核酸诸如病毒dna。在一些实施方案中,所述靶核酸是细胞中的质粒。在一些实施方案中,所述靶核酸是经水平转移(horizontallytransferred)的质粒。在一些实施方案中,所述靶核酸是rna。

在一些实施方案中,所述靶核酸是经分离的核酸诸如经分离的dna。在一些实施方案中,所述靶核酸存在于无细胞的环境中。在一些实施方案中,所述靶核酸是经分离的载体诸如质粒。在一些实施方案中,所述靶核酸是经分离的线性dna片段。

本文描述的方法适用于任何合适的细胞类型。在一些实施方案中,所述细胞是细菌、酵母细胞、真菌细胞、藻类细胞、植物细胞或动物细胞(例如,哺乳动物细胞,如人细胞)。在一些实施方案中,所述细胞是自然来源的诸如由组织活检分离出的细胞。在一些实施方案中,所述细胞是从体外培养的细胞系分离的细胞。在一些实施方案中,所述细胞来自原代细胞系。在一些实施方案中,所述细胞来自永生化细胞系。在一些实施方案中,所述细胞是基因工程化的细胞。

在一些实施方案中,所述细胞是选自下组的生物的动物细胞:牛、绵羊、山羊、马、猪、鹿、鸡、鸭、鹅、兔和鱼。

在一些实施方案中,所述细胞是选自下组的生物的植物细胞:玉米、小麦、大麦、燕麦、水稻、大豆、油棕、红花、芝麻、烟草、亚麻、棉花、向日葵、珍珠小米、粟米、高粱、油菜、大麻、蔬菜作物、饲料作物、工业作物、木本作物和生物质作物。

在一些实施方案中,所述细胞是哺乳动物细胞。在一些实施方案中,所述细胞是人细胞。在一些实施方案中,所述人细胞是人胚胎肾293t(hek293t或293t)细胞或hela细胞。在一些实施方案中,所述细胞是人胚肾(hek293t)细胞。在一些实施方案中,所述细胞是小鼠hepa1-6细胞。在一些实施方案中,所述哺乳动物细胞选自下组:免疫细胞、肝细胞、肿瘤细胞、干细胞、合子、肌肉细胞和皮肤细胞。

在一些实施方案中,所述细胞是选自下组的免疫细胞:细胞毒性t细胞、辅助t细胞、天然杀伤(nk)t细胞、ink-t细胞、nk-t样细胞、t细胞、肿瘤浸润性t细胞和树突状细胞(dc)激活的t细胞。在一些实施方案中,所述方法产生经修饰的免疫细胞,诸如car-t细胞或tcr-t细胞。

在一些实施方案中,所述细胞是胚胎干(es)细胞、诱导性多能干(ips)细胞、配子的祖细胞、配子、合子或胚胎中的细胞。

本文所述的方法可以用于在体内、离体或体外修饰靶细胞,并且可以用改变所述细胞的方式进行,以使得一旦被修饰,所述经修饰的细胞的后代或细胞系就保留经改变的表型。所述经修饰的细胞和后代可以是多细胞生物的一部分,诸如具有离体或体内应用(如基因组编辑和基因疗法)的植物或动物。

在一些实施方案中,所述方法离体进行。在一些实施方案中,将所述工程化的crispr-cas12i系统引入细胞后,所述经修饰的细胞(例如,哺乳动物细胞)离体繁殖。在一些实施方案中,将所述经修饰的细胞培养以繁殖至少约1天、2天、3天、4天、5天、6天、7天、10天、12天或14天中任一个。在一些实施方案中,将所述经修饰的细胞培养不超过约1天、2天、3天、4天、5天、6天、7天、10天、12天或14天中任一个。在一些实施方案中,进一步评价或筛选所述经修饰的细胞以选择具有一种或多种所需表型或特性的细胞。

在一些实施方案中,所述靶序列是与疾病或病况相关的序列。示例性的疾病或病况包括但不限于:癌症、心血管疾病、遗传性疾病、自身免疫性疾病、代谢性疾病、神经退行性疾病、眼病、细菌感染和病毒感染。在一些实施方案中,所述疾病或病况是遗传疾病。在一些实施方案中,所述疾病或病况是单基因疾病或病况。在一些实施方案中,所述疾病或病况是多基因疾病或病况。

在一些实施方案中,与野生型序列相比,所述靶序列具有突变。在一些实施方案中,所述靶序列具有与疾病或病况相关的单核苷酸多态性(snp)。

在一些实施方案中,插入所述靶核酸中的供体dna编码选自下组的生物产物:报告蛋白、抗原特异性受体、治疗性蛋白、抗生素抗性蛋白、rnai分子、细胞因子、激酶、抗原、抗原特异性受体、细胞因子受体和自杀多肽。在一些实施方案中,所述供体dna编码治疗性蛋白。在一些实施方案中,所述供体dna编码可用于基因疗法的治疗性蛋白。在一些实施方案中,所述供体dna编码治疗性抗体。在一些实施方案中,所述供体dna编码工程化的受体,诸如嵌合抗原受体(car)或工程化的tcr。在一些实施方案中,所述供体dna编码治疗性rna,诸如小rna(例如,sirna、shrna或mirna)或长的非编码rna(lincrna)。

本文所述的方法可以用于在两个或更多个(例如2、3、4、5、6、8、10个或更多)不同的靶位点处进行多重基因编辑或调节。在一些实施方案中,所述方法检测或修饰多个靶核酸或靶核酸序列。在一些实施方案中,所述方法包括使靶核酸与包含多个(例如2、3、4、5、6、8、10个或更多)crrna序列的指导rna接触,其中每个crrna均包含不同的靶序列。

还提供了包含经修饰的靶核酸的工程化的细胞,所述细胞使用本文所述方法中任一种来产生。所述工程化的细胞可以用于细胞疗法。可以使用本文所述用于细胞疗法的方法将自体或同种异体细胞用于制备工程化的细胞。

本文所述的方法还可用于生成细胞(例如哺乳动物细胞)的等基因系以研究遗传变体。

还提供了包含本文所述工程化的细胞的工程化非人类动物。在一些实施方案中,所述工程化的非人类动物是经过基因组编辑的非人类动物。所述工程化的非人类动物可以用作疾病模型。

产生非人类基因组编辑或转基因动物的技术是本领域众所周知的,包括但不限于:原核显微注射、病毒感染、对胚胎干细胞和诱导性多能干(ips)细胞的转化。可以使用的详细方法包括但不限于sundberg和ichiki描述的方法(2006,geneticallyengineeredmicehandbook,crcpress)和gibson描述的方法(2004,aprimerofgenomescience2nded.sunderland,mass.:sinauer)。

所述工程化的动物可以是任何合适的物种,包括但不限于:牛、马、羊、犬、鹿、猫科动物,山羊、猪、灵长类,以及了解较少的哺乳动物诸如大象、鹿、斑马或骆驼。

治疗方法

在一些实施方式中,提供了前述工程化的crispr-cas12i系统在制备治疗与个体的细胞中靶核酸相关的疾病或病症的药物中的用途。

进一步提供了使用根据本文所述的修饰细胞中的靶核酸的方法中的任一种的治疗方法。在一些实施方案中,本申请提供了治疗与个体细胞中的靶核酸相关的疾病或病况的方法,其包括使所述靶核酸与本文所述工程化的crispr-cas12i系统中任一种接触,其中所述指导rna的指导序列与所述靶核酸的靶序列互补,其中所述工程化的cas12i效应蛋白和所述指导rna彼此缔合以结合至所述靶核酸以修饰所述靶核酸,从而使所述疾病或病况得到治疗。在一些实施方案中,将突变(例如,敲除或敲入突变)引入所述靶核酸。在一些实施方案中,所述靶核酸的表达被增强。在一些实施方案中,所述靶核酸的表达被抑制。在一些实施方案中,本申请提供了治疗个体的疾病或病况的方法,其包括向所述个体施用有效量的本文所述工程化的crispr-cas12i系统中任一种以及编码治疗剂的供体dna,其中所述指导rna的指导序列与所述个体的靶核酸的靶序列互补,其中所述工程化的cas12i效应蛋白和所述指导rna彼此结合以结合至所述靶核酸并将供体dna插入所述靶序列中,从而使所述疾病或病况得到治疗。

在一些实施方案中,本申请提供了治疗个体的疾病或病况的方法,其包括向所述个体施用有效量的包含经修饰的靶核酸的工程化的细胞,其中所述工程化的细胞是通过使所述细胞与本文所述工程化的crispr-cas12i系统中任一种接触而制备的,其中所述指导rna的指导序列与所述靶核酸的靶序列互补,其中所述工程化的cas12i效应蛋白和所述指导rna相互缔合以结合至靶核酸以修饰所述靶核酸。在一些实施方案中,所述工程化的细胞是免疫细胞。在一些实施方案中,所述个体是人。在一些实施方案中,所述个体是动物,例如模型动物诸如啮齿动物、宠物或农场动物。在一些实施方案中,所述个体是哺乳动物。

在一些实施方案中,所述疾病或病况选自下组:癌症、心血管疾病、遗传性疾病、自身免疫性疾病、代谢性疾病、神经退行性疾病、眼病、细菌感染和病毒感染。在一些实施方案中,所述靶核酸是pcsk9。在一些实施方案中,所述疾病或病况是心血管疾病。在一些实施方案中,所述疾病或病况是冠状动脉疾病。在一些实施方案中,所述方法降低个体的胆固醇水平。在一些实施方案中,所述方法治疗个体的糖尿病。

递送方法

在一些实施方案中,本文所述工程化的crispr-cas12i系统或其组分、其核酸分子、或编码或提供其组分的核酸分子可通过多种递送系统诸如质粒或病毒递送至宿主细胞(例如,上面“构建体和载体”小节中描述的载体中的任一种)。在一些实施方案或方法中,所述工程化的crispr-cas12i系统可以通过其他方法递送,如由所述工程化的cas12i效应蛋白及其一个或多个同源rna指导序列组成的核糖核蛋白复合物的核转染或电穿孔。

在一些实施方案中,通过纳米颗粒或外泌体来递送。

在一些实施方案中,成对的cas12i切口酶复合物可以使用纳米颗粒或其他直接蛋白递送方法直接递送,使得包含两个成对的crrna元件的复合物被共同递送。此外,蛋白可以通过病毒载体或直接地递送至细胞,然后直接递送包含针对双切口的两个成对间隔区的crispr阵列。在某些情况下,对于直接rna递送,可以将rna缀合于至少一个糖部分诸如n-乙酰基半乳糖胺(galnac)(特别是三触角galnac)。

试剂盒和制品

还提供了包含本文所述工程化的cas12i核酸酶、工程化的cas12i效应蛋白或工程化的crispr-cas12i系统中任一种的一种或多种组分的组合物、试剂盒、单位药剂和制品。

在一些实施方案中,提供了试剂盒,其包含:一个或多个aav载体,其编码本文所述工程化的cas12i核酸酶、工程化cas12i效应蛋白或工程化crispr-cas12i系统中任一种。在一些实施方案中,所述试剂盒还包含一种或多种指导rna。在一些实施方案中,所述试剂盒还包含供体dna。在一些实施方案中,所述试剂盒还包含细胞诸如人细胞。

所述试剂盒可包含一种或多种额外组分,诸如容器、试剂、培养基、细胞因子、缓冲液、抗体等,以允许工程化的细胞的繁殖。所述试剂盒还可包含用于施用组合物的装置。

所述试剂盒还可包含使用本文所述工程化的crispr-cas12i系统的说明书,诸如检测或修饰靶核酸的方法。在一些实施方案中,所述试剂盒包含用于处理或诊断疾病或病况的说明书。与所述试剂盒组分使用有关的说明书通常包括针对该刻意处理的给药量、给药时间表和给药途径的信息。所述容器可以是单位剂量、散装包装(例如多剂量包装)或亚单位剂量。例如,可以提供这样的试剂盒(其包含足够剂量的本文所公开的组合物)以在延长的时期内提供对个体的有效处理。试剂盒还可以包括多个单位剂量的组合物和使用说明书,其包装数量足以在药房(例如医院药房和复方药房)中存储和使用。

本发明的试剂盒处于合适的包装中。合适的包装包括但不限于:小瓶、瓶子、广口瓶、软包装(例如密封的聚酯薄膜或塑料袋)等。试剂盒可以任选地提供额外的组分,如缓冲液和解释性信息。因此,本申请还提供了一种制品,其包括小瓶(如密封的小瓶)、瓶子、广口瓶、柔性包装等。

所述制品可以包括容器以及在容器上或与容器粘合的标签或包装插页。合适的容器包括例如瓶子、小瓶、注射器等。所述容器可以由多种材料(诸如玻璃或塑料)形成。通常,所述容器容纳有效处理本文所述的疾病或病症的组合物,并且可以具有无菌进入口(例如,容器可以是静脉注射溶液袋或具有可通过皮下注射针刺穿的塞子的小瓶)。所述标签或包装插页表明该组合物用于处理个体中的特定病况。所述标签或包装插页将进一步包括用于将组合物向个体施用的说明书。

包装插页是指通常包含在治疗产品的商业包装中的说明,所述说明包含关于使用此类治疗产品的适应症、用法、给药量、施用、禁忌症和/或警告的信息。

此外,所述制品还可包括第二容器,其包含药学上可接受的缓冲液,如抑菌注射用水(bwfi)、磷酸盐缓冲盐水、林格氏溶液和葡萄糖溶液。从商业和用户的角度来看,它还可以包括其他材料,包括其他缓冲液、稀释剂、过滤器、针头和注射器。

实施例部分

下面将参照附图更详细地描述本发明的具体实施例。虽然附图中显示了本发明的具体实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。

实施例1:将参比cas12i2酶中与pam相互作用的氨基酸替换为带正电的氨基酸,并验证其基因编辑效率。

质粒构建

cas12i2的编码序列经过密码子优化(人类)并合成。通过基于pcr的定点诱变产生cas蛋白的变体。具体的方法是以突变的位点为中心将cas12i2蛋白的dna序列设计分成两部分,设计两对引物分别扩增这两部分dna序列,同时引物上引入需要突变的序列,最后通过gibson克隆的方式将两个片段装载到pcag-2a-egfp载体上。突变体的组合则通过将cas12i2蛋白的dna拆分成多段,使用pcr、gibsonclone实现构建。突变体的位置确定使用本领域常用的蛋白质结构可视化软件(例如pymol、chimera等软件都可以选用)分析cas12i2的结构信息而获得的。cas12i2的结构信息参照pdb:6ltu,6ltr,6lu0,6ltp)。cas12i2效应蛋白通过pcag-2a-egfp载体在人293t细胞中表达。将编码cas12i2蛋白的dna插入xmai和nhei之间。通过将含有靶序列的退火寡核苷酸连接到basi消化的puc19-u6-i2-crrna骨架中构建了在293t中表达cas12i2的crrna的载体。

细胞培养、转染以及荧光激活细胞分选法(facs)

将hek293t细胞在含1%青霉素-链霉素(gibco)和10%胎牛血清(gibco)的dmem(gibco)中培养。将细胞接种在24-细胞培养皿(corning)中16小时,直到融合度达到70%。通过使用lipofectamine3000(invitrogen),将600ng编码cas12i2蛋白的质粒和3000ng编码crrna的质粒转染到每个24-细胞培养皿中。转染68h后,用胰蛋白酶-edta(0.05%)(gibco)消化荧光激活细胞分选(facs)的hek293t细胞。使用具有gfp信号的mofloxdp(beckmancoulter)进行细胞分选。

靶向深度测序分析以进行基因组修饰

将facs分选的gfp-阳性293ft细胞用缓冲液l裂解,并在55℃下孵育3小时,然后在95℃下孵育10分钟。使用相应的引物对在不同基因组位点中包含靶位点的dsdna片段进行pcr扩增。对于靶向的深度测序,直接使用细胞裂解液作为模板,通过条形码(barcoded)pcr直接扩增靶位点。纯化pcr产物并归集到几个文库中以进行高通量测序。通过计算包含插入或缺失的读取(reads)的比率,采用crispresso2软件分析插入缺失的频率(%)。在本申请中,统一使用插入缺失的频率(%)这一指标来进行基因编辑效率的对比和分析。数量少于完整读取的0.05%的读取被废弃。

实施例1-a选出了四个具有单个氨基酸替换的工程化cas12i2

按照实施例1描述的方法分别表达氨基酸序列具有单个突变的工程化cas12i2酶,优选的氨基酸替换方式及其相应的基因编辑效率的见于图1和表1。在图1中,我们首先选取了cas12i2距离pamdna9å以内的10个氨基酸:e176、e178、y226、a227、n229、e237、k238、k264、t447、e563,进行精氨酸(r)的点突变测试。通过在293t细胞中比较这些突变体与野生型cas12i2在2个基因组位点:ccr5-3、rnf2-7的基因编辑效率,我们发现,带有下述氨基酸替换的突变体:e176r、k238r、t447r和e563r能够有效地提高基因编辑效率(图1中显示,有四种氨基酸替换都获得了高于约10%(此为针对ccr5-3的参比酶的基因编辑效率)以及高于约12%(此为针对rnf2-7的参比酶的基因编辑效率)插入缺失率,明显优于其他的单个氨基酸替换方案),其余6种突变体则对基因编辑效率的提高没有帮助,甚至有严重的负面影响。

实施例1-b比较同时具有多个优选的氨基酸替换的工程化cas12i2

按照实施例1描述的方法分别表达其氨基酸序列同时具有两个以上优选的氨基酸替换的工程化cas12i2酶,其组合方式及其基因编辑效率的对比见于表1和图2。图2显示,我们将由实施例1-a筛选得到的e176r、k238r、t447r和e563r这4个能够提高效率的突变体中的点突变进行组合。通过在293t细胞中比较这些突变体与野生型cas12i2在3个基因组位点:ccr5-3,ccr5-5,、rnf2-7的基因编辑效率,我们发现点突变组合之后能够获得效率更进一步提升的突变体。尤其是当把4种突变组合到一起(e176r+k238r+t447r+e563r)时能够获得效率最优的组合突变。

实施例1的实验结果总结

表1实施例1的结果(基因编辑效率)总结

实施例2:将参比cas12i2酶中参与打开dna双链的氨基酸替换为带芳香环的氨基酸,并分别验证它们的基因编辑的效率

质粒构建

通过基于pcr的定点诱变产生cas12i2蛋白的变体,具体的方法是以突变的位点为中心将cas12i2蛋白的dna序列设计分成两部分,设计两对引物分别扩增这两部分dna序列,同时引物上引入需要突变的序列,最后通过gibsonclone的方式将两个片段装载到pcag-2a-egfp载体上。氨基酸替换位置的确定可以使用常见的蛋白质结构可视化软件(例如,可以采用pymol、chimera等软件)分析cas12i2的结构信息得到。cas12i2的结构信息参照pdb:6ltu,6ltr,6lu0,6ltp)。cas12i2效应蛋白通过pcag-2a-egfp载体在人293t细胞中表达。将编码cas12i2蛋白的dna插入xmai和nhei之间。通过将含有靶序列的退火寡核苷酸连接到basi消化的puc19-u6-i2-crrna骨架中构建了在293t中表达cas12i2crrna的载体。

细胞培养、转染以及荧光激活细胞分选法(facs)

将hek293t细胞在含1%青霉素-链霉素(gibco)和10%胎牛血清(gibco)的dmem(gibco)中培养。将细胞接种在24-细胞培养皿(corning)中16小时,直到融合度达到70%。通过使用lipofectamine3000(invitrogen),将600ng编码cas12i2蛋白的质粒和3000ng编码crrna的质粒转染到每个24-细胞培养皿中。转染68h后,用胰蛋白酶-edta(0.05%)(gibco)消化荧光激活细胞分选(facs)的hek293t细胞。使用具有gfp信号的mofloxdp(beckmancoulter)进行细胞分选。

靶向深度测序分析以进行基因组修饰

将facs分选的gfp-阳性293ft细胞用缓冲液l裂解,并在55℃下孵育3小时,然后在95℃下孵育10分钟。使用相应的引物对在不同基因组位点中包含靶位点的dsdna片段进行pcr扩增。对于靶向的深度测序,直接使用细胞裂解液作为模板,通过条形码(barcoded)pcr直接扩增靶位点。纯化pcr产物并归集到几个文库中以进行高通量测序。通过计算包含插入或缺失的读取(reads)的比率,采用crispresso2软件分析插入缺失的频率(%)。数量少于完整读取的0.05%的读取被废弃。

从图2可以看出,首先我们选取了cas12i2酶中参与打开dna双链的氨基酸:q163和n164进行带有芳香环的氨基酸(y,f,w)的点突变测试。通过在293t细胞中比较这些突变体与野生型cas12i2在3个基因组位点:ccr5-3,ccr5-5,rnf2-7的基因编辑效率,我们发现,有5个突变体:q163w,q163y,q163f,n164y,n164f能够有效地提高基因编辑效率(至少在一个基因组位点)。可以得出结论:n164y以及n164f在3个基因组位点都展示了极佳的基因编辑效率;而n164w相比于参比酶无任何改善基因编辑效率的效果。

实施例2的实验结果总结

表2实施例2的结果(基因编辑效率)总结

实施例3:将参比cas12i2酶中位于ruvc结构域并与单链dna底物相互作用的氨基酸替换为带正电的氨基酸,并验证其基因编辑的效率

质粒构建

通过基于pcr的定点诱变产生cas12i2蛋白的变体,具体的方法是以突变的位点为中心将cas12i2蛋白的dna序列设计分成两部分,设计两对引物分别扩增这两部分dna序列,同时引物上引入需要突变的序列,最后通过gibsonclone的方式将两个片段装载到pcag-2a-egfp载体上。突变体的组合则通过将cas12i2蛋白的dna拆分成多段,使用pcr、gibsonclone实现构建。突变体的位置确定是用常用的蛋白质结构可视化软件(例如,pymol、chimera等软件均可采用)分析cas12i2的结构信息得到的。cas12i2的结构信息参照pdbid:6ltu,6ltr,6lu0,6ltp。这些cas12i2结构中显示的ssdna底物只有5nt。为了得到更长的ssdna与cas12i2相互作用的信息,我们将cas12i1的结构(pdbid:6w5c,6w62和6w64;zhangh.etal.naturestructural&molecularbiology27,1069-1076(2020))与cas12i2的结构做了同源比对,以便将该cas12i1结构中的ssdna底物(9nt)放入了cas12i2的ruvc催化口袋,通过该模型进一步寻找9a之内的氨基酸。cas12i2效应蛋白通过pcag-2a-egfp载体在人293t细胞中表达。将编码cas12i2蛋白的dna插入xmai和nhei之间。通过将含有靶序列的退火寡核苷酸连接到basi消化的puc19-u6-i2-crrna骨架中构建了在293t中表达cas12i2crrna的载体。

细胞培养、转染以及荧光激活细胞分选法(facs)

将hek293t细胞在含1%青霉素-链霉素(gibco)和10%胎牛血清(gibco)的dmem(gibco)中培养。将细胞接种在24-细胞培养皿(corning)中16小时,直到融合度达到70%。通过使用lipofectamine3000(invitrogen),将600ng编码cas12i2蛋白的质粒和3000ng编码crrna的质粒转染到每个24-细胞培养皿中。转染68h后,用胰蛋白酶-edta(0.05%)(gibco)消化荧光激活细胞分选(facs)的hek293t细胞。使用具有gfp信号的mofloxdp(beckmancoulter)进行细胞分选。

靶向深度测序分析以进行基因组修饰

将facs分选的gfp-阳性293ft细胞用缓冲液l裂解,并在55℃下孵育3小时,然后在95℃下孵育10分钟。使用相应的引物对在不同基因组位点中包含靶位点的dsdna片段进行pcr扩增。对于靶向的深度测序,直接使用细胞裂解液作为模板,通过条形码(barcoded)pcr直接扩增靶位点。纯化pcr产物并归集到几个文库中以进行高通量测序。通过计算包含插入或缺失的读取(reads)的比率,采用crispresso2软件分析插入缺失的频率(%)。数量少于完整读取的0.05%的读取被废弃。

在图3a中,我们将参比cas12i2酶中位于ruvc结构域并与单链dna底物相互作用的氨基酸替换为带正电的氨基酸。通过在293t细胞中比较这些突变体与野生型cas12i2在2个基因组位点:ccr5-3、rnf2-7的基因编辑效率,我们发现,有3个突变体:n391r、i926r、g929r能够有效地提高基因编辑效率(至少在一个基因组位点)。其中i926r在2个基因组位点都展示了极佳的基因编辑效率。

在图3b、3c中,我们通过进一步将参比cas12i2酶中位于ruvc结构域并与单链dna底物相互作用的氨基酸替换为带正电的氨基酸。通过在293t细胞中比较这些突变体与野生型cas12i2在2个基因组位点:ccr5-3、rnf2-7的基因编辑效率,我们发现,有许多突变体能够有效地提高基因编辑效率(至少在一个基因组位点)。其中基因编辑效率提高的单个氨基酸替换方案的排名为:d362r>e323r>q425r>n925r>其他效率提高的突变体。

在图3d中,我们将图3a、3b、3c筛选得到的e323r、d362r、q425r和i926r这4个能够提高效率的突变体中的点突变进行组合。通过在293t细胞中比较这些突变体与野生型cas12i2在2个基因组位点:ccr5-3,rnf2-7的基因编辑效率,我们发现点突变组合之后能够获得效率更进一步提升的突变体。

在图3e中,我们将图3a、3b、3c筛选得到的部分能够提高效率的突变体中的点突变与i926g,439gg进行组合。通过在293t细胞中比较这些突变体与野生型cas12i2在2个基因组位点:ccr5-3,rnf2-7的基因编辑效率,我们发现点突变组合之后能够获得效率更进一步提升的突变体。

实施例3的实验结果总结

表3实施例3的结果(基因编辑效率)总结。*439gg的含义是,在439号氨基酸后插入两个甘氨酸。

实施例4:将参比cas12i2酶中与dna-rna双螺旋相互作用的氨基酸替换为带正电的氨基酸,并验证其基因编辑的效率

质粒构建

通过基于pcr的定点诱变产生cas12i2蛋白的变体,具体的方法是以突变的位点为中心将cas12i2蛋白的dna序列设计分成两部分,设计两对引物分别扩增这两部分dna序列,同时引物上引入需要突变的序列,最后通过gibsonclone的方式将两个片段装载到pcag-2a-egfp载体上。突变体的组合则通过将cas12i2蛋白的dna拆分成多段,使用pcr、gibsonclone实现构建。突变体的位置确定是用常用的蛋白质结构可视化软件(例如,pymol、chimera等软件均可采用)分析cas12i2的结构信息得到的。cas12i2的结构信息参照pdb:6ltu,6ltr,6lu0,6ltp)。cas12i2效应蛋白通过pcag-2a-egfp载体在人293t细胞中表达。将编码cas12i2蛋白的dna插入xmai和nhei之间。通过将含有靶序列的退火寡核苷酸连接到basi消化的puc19-u6-i2-crrna骨架中构建了在293t中表达cas12i2crrna的载体。

细胞培养、转染以及荧光激活细胞分选法(facs)

将hek293t细胞在含1%青霉素-链霉素(gibco)和10%胎牛血清(gibco)的dmem(gibco)中培养。将细胞接种在24-细胞培养皿(corning)中16小时,直到融合度达到70%。通过使用lipofectamine3000(invitrogen),将600ng编码cas12i2蛋白的质粒和3000ng编码crrna的质粒转染到每个24-细胞培养皿中。转染68h后,用胰蛋白酶-edta(0.05%)(gibco)消化荧光激活细胞分选(facs)的hek293t细胞。使用具有gfp信号的mofloxdp(beckmancoulter)进行细胞分选。

靶向深度测序分析以进行基因组修饰

将facs分选的gfp-阳性293ft细胞用缓冲液l裂解,并在55℃下孵育3小时,然后在95℃下孵育10分钟。使用相应的引物对在不同基因组位点中包含靶位点的dsdna片段进行pcr扩增。对于靶向的深度测序,直接使用细胞裂解液作为模板,通过条形码(barcoded)pcr直接扩增靶位点。纯化pcr产物并归集到几个文库中以进行高通量测序。通过计算包含插入或缺失的读取(reads)的比率,采用crispresso2软件分析插入缺失的频率(%)。数量少于完整读取的0.05%的读取被废弃。

图4和表4总结了在293t细胞中比较本实施例中的cas12i2突变体与野生型cas12i2在2个基因组位点:ccr5-3、rnf2-7的基因编辑效率。我们发现,有7个突变体:g116r、e117r、t159r、s161r、e319r、e343r、和d958r能够有效地提高基因编辑效率(至少在一个基因组位点)。其中d958r在2个基因组位点都展示了极佳的基因编辑效率。

实施例4的实验结果总结

表4实施例4的结果(基因编辑效率)总结。

实施例5:将实施例1-4中筛选得到的部分提高基因编辑效率cas12i2工程化改造氨基酸突变进行组合,并验证它们的基因编辑的效率。

质粒构建

突变体的组合则通过将cas12i2蛋白的dna拆分成多段,使用pcr、gibsonclone实现构建。突变体的位置确定是使用常用蛋白质结构可视化软件(例如,pymol、chimera等软件都可以采用)分析cas12i2的结构信息得到的。cas12i2的结构信息参照pdb:6ltu,6ltr,6lu0,6ltp)。cas12i2效应蛋白通过pcag-2a-egfp载体在人293t细胞中表达。将编码cas12i2蛋白的dna插入xmai和nhei之间。通过将含有靶序列的退火寡核苷酸连接到basi消化的puc19-u6-i2-crrna骨架中构建了在293t中表达cas12i2crrna的载体。

细胞培养、转染以及荧光激活细胞分选法(facs)

将hek293t细胞在含1%青霉素-链霉素(gibco)和10%胎牛血清(gibco)的dmem(gibco)中培养。将细胞接种在24-细胞培养皿(corning)中16小时,直到融合度达到70%。通过使用lipofectamine3000(invitrogen),将600ng编码cas12i2蛋白的质粒和3000ng编码crrna的质粒转染到每个24-细胞培养皿中。转染68h后,用胰蛋白酶-edta(0.05%)(gibco)消化荧光激活细胞分选(facs)的hek293t细胞。使用具有gfp信号的mofloxdp(beckmancoulter)进行细胞分选。

靶向深度测序分析以进行基因组修饰

将facs分选的gfp-阳性293ft细胞用缓冲液l裂解,并在55℃下孵育3小时,然后在95℃下孵育10分钟。使用相应的引物对在不同基因组位点中包含靶位点的dsdna片段进行pcr扩增。对于靶向的深度测序,直接使用细胞裂解液作为模板,通过条形码(barcoded)pcr直接扩增靶位点。纯化pcr产物并归集到几个文库中以进行高通量测序。通过计算包含插入或缺失的读取(reads)的比率,采用crispresso2软件分析插入缺失的频率(%)。数量少于完整读取的0.05%的读取被废弃。

在图5中,我们将实施例1、2、3中筛选得到的氨基酸突变或者氨基酸突变组合:e176r+k238r+t447r+e563r,n164y,e323r+d362r,i926r,e323r+d362r+i926r,e323r+d362r+i926g,e323r+d362r+i926g+439g,e323r+d362r+i926g+439gg进行进一步的组合。通过在293t细胞中比较这些突变体与野生型cas12i作用于5个基因组位点:ccr5-3,ccr5-5,cd34-8,cd34-9,rnf2-14的基因编辑效率,我们发现点突变组合之后能够获得效率更进一步提升的突变体。同时,将我们认为效率最优的突变体(e176r+k238r+t447r+e563r+n164y+e323r+d362r)命名为casxx。

实施例5的结果总结(仅以rnf2-14处体现的基因编辑效率数据为例)

表5实施例5的结果(基因编辑效率)总结

*439g的含义是,在439号氨基酸后插入一个甘氨酸。

此外,我们通过t7核酸内切酶1(t7e1)测定和靶向深度测序检测以下突变组合的基因编辑效率:e176r+k238r+t447r+e563r+n164y+d958r;

e176r+k238r+t447r+e563r+i926r+d958r;

e176r+k238r+t447r+e563r+e323r+d362r+d958r;

n164y+i926r+d958r;n164y+e323r+d362r+d958r;

e176r+k238r+t447r+e563r+n164y+i926r+d958r;

e176r+k238r+t447r+e563r+n164y+e323r+d362r+d958r;

e176r+k238r+t447r+e563r+n164y+i926r+e323r+d362r+d958r;

e176r+k238r+t447r+e563r+n164y+e323r+d362r+i926g+d958r;

e176r+k238r+t447r+e563r+n164y+e323r+d362r+i926g+439gg+d958r;和e176r+k238r+t447r+e563r+n164y+e323r+d362r+i926g+439g+d958r

实施例6:casxx与常规基因编辑工具的比较验证其基因编辑效率。

质粒构建

ascas12a,bhcas12bv4,spcas9,sacas9,sacas9-kkh的编码序列经过密码子优化(人类)并合成。cas效应蛋白通过pcag-2a-egfp载体在人293t细胞中表达。将编码cas蛋白的dna插入xmai和nhei之间。通过将含有靶序列的退火寡核苷酸连接到basi消化的puc19-u6-i2-crrna骨架中,构建了在293t中表达ascas12a,bhcas12bv4,spcas9,sacas9,sacas9-kkh和cas12i2的sgrna或crrna的载体。

细胞培养、转染以及荧光激活细胞分选法(facs)

将hek293t细胞在含1%青霉素-链霉素(gibco)和10%胎牛血清(gibco)的dmem(gibco)中培养。将细胞接种在24-细胞培养皿(corning)中16小时,直到融合度达到70%。通过使用lipofectamine3000(invitrogen),将600ng编码cas蛋白的质粒和3000ng编码crrna的质粒转染到每个24-细胞培养皿中。转染68h后,用胰蛋白酶-edta(0.05%)(gibco)消化荧光激活细胞分选(facs)的hek293t细胞。使用具有gfp信号的mofloxdp(beckmancoulter)进行细胞分选。

靶向深度测序分析以进行基因组修饰

将facs分选的gfp-阳性293ft细胞用缓冲液l裂解,并在55℃下孵育3小时,然后在95℃下孵育10分钟。使用相应的引物对在不同基因组位点中包含靶位点的dsdna片段进行pcr扩增。对于靶向的深度测序,直接使用细胞裂解液作为模板,通过条形码(barcoded)pcr直接扩增靶位点。纯化pcr产物并归集到几个文库中以进行高通量测序。通过计算包含插入或缺失的读取(reads)的比率,采用crispresso2软件分析插入缺失的频率(%)。数量少于完整读取的0.05%的读取被废弃。

在图6a中,我们首先测试了casxx在62个人基因组位点的基因编辑效率。casxx展现了极其强大的基因编辑能力,平均基因编辑效率超过60%,并且几乎在测试的所有位点的基因编辑效率都超过了50%。并且,对于任意的nttnpam(n=a,t,g,c)都展现了很高的基因编辑效率。这是野生型cas12i无法做到的。

在图6b中,为了进一步展示我们工程化改造的casxx的基因编辑能力,我们将casxx与ascas12a在tttnpam位点进行比较。我们的casxx展现了更高的平均基因编辑效率。同时,与bhcas12bv4在ttnpam位点进行比较,我们的casxx展现了更高的平均基因编辑效率。

在图6c中,为了进一步展示我们工程化改造的casxx的基因编辑能力,我们将casxx与spcas9在相同位点进行比较。我们的casxx展现了更高的平均基因编辑效率。同时,与sacas9、sacas9-kkh在相同位点进行比较,我们的casxx展现了更高的平均基因编辑效率。

在图6d中,我们发现,casxx在小鼠hepa1-6细胞系的基因编辑效率统计,可以看到,casxx在65个位点展示出强大的基因编辑能力,平均基因编辑效率超过60%。

尽管以上结合附图对本发明的实施方案进行了描述,但本发明并不局限于上述的具体实施方案和应用领域,上述的具体实施方案仅仅是示意性的、指导性的,而不是限制性的。本领域的普通技术人员在本说明书的启示下和在不脱离本发明权利要求所保护的范围的情况下,还可以做出很多种的形式,这些均属于本发明保护之列。

序列表

序列表

<110>中国科学院动物研究所

北京干细胞与再生医学研究院

<120>工程化的cas12i核酸酶及其效应蛋白以及用途

<160>13

<170>siposequencelisting1.0

<210>1

<211>1054

<212>prt

<213>artificialsequence

<400>1

metserseralailelyssertyrlysservalleuargproasnglu

151015

arglysasnglnleuleulysserthrileglncysleugluaspgly

202530

seralaphephephelysmetleuglnglyleupheglyglyilethr

354045

progluilevalargpheserthrgluglnglulysglnglnglnasp

505560

ilealaleutrpcysalavalasntrppheargprovalserglnasp

65707580

serleuthrhisthrilealaseraspasnleuvalglulyspheglu

859095

glutyrtyrglyglythralaseraspalailelysglntyrpheser

100105110

alaserileglyglusertyrtyrtrpasnaspcysargglnglntyr

115120125

tyraspleucysarggluleuglyvalgluvalseraspleuthrhis

130135140

aspleugluileleucysargglulyscysleualavalalathrglu

145150155160

serasnglnasnasnserileileservalleupheglythrglyglu

165170175

lysgluaspargservallysleuargilethrlyslysileleuglu

180185190

alaileserasnleulysgluileprolysasnvalalaproilegln

195200205

gluileileleuasnvalalalysalathrlysgluthrphearggln

210215220

valtyralaglyasnleuglyalaproserthrleuglulyspheile

225230235240

alalysaspglyglnlysglupheaspleulyslysleuglnthrasp

245250255

leulyslysvalileargglylysserlysgluargasptrpcyscys

260265270

glnglugluleuargsertyrvalgluglnasnthrileglntyrasp

275280285

leutrpalatrpglyglumetpheasnlysalahisthralaleulys

290295300

ilelysserthrargasntyrasnphealalysglnargleuglugln

305310315320

phelysgluileglnserleuasnasnleuleuvalvallyslysleu

325330335

asnaspphepheaspsergluphepheserglyglugluthrtyrthr

340345350

ilecysvalhishisleuglyglylysaspleuserlysleutyrlys

355360365

alatrpgluaspaspproalaaspprogluasnalailevalvalleu

370375380

cysaspaspleulysasnasnphelyslysgluproileargasnile

385390395400

leuargtyrilephethrileargglnglucysseralaglnaspile

405410415

leualaalaalalystyrasnglnglnleuaspargtyrlyssergln

420425430

lysalaasnproservalleuglyasnglnglyphethrtrpthrasn

435440445

alavalileleuproglulysalaglnargasnaspargproasnser

450455460

leuaspleuargiletrpleutyrleulysleuarghisproaspgly

465470475480

argtrplyslyshishisileprophetyraspthrargphephegln

485490495

gluiletyralaalaglyasnserprovalaspthrcysglnphearg

500505510

thrproargpheglytyrhisleuprolysleuthraspglnthrala

515520525

ileargvalasnlyslyshisvallysalaalalysthrglualaarg

530535540

ileargleualaileglnglnglythrleuprovalserasnleulys

545550555560

ilethrgluileseralathrileasnserlysglyglnvalargile

565570575

provallyspheaspvalglyargglnlysglythrleuglnilegly

580585590

aspargphecysglytyraspglnasnglnthralaserhisalatyr

595600605

serleutrpgluvalvallysgluglyglntyrhislysgluleugly

610615620

cysphevalargpheileserserglyaspilevalserilethrglu

625630635640

asnargglyasnglnpheaspglnleusertyrgluglyleualatyr

645650655

proglntyralaasptrparglyslysalaserlysphevalserleu

660665670

trpglnilethrlyslysasnlyslyslysgluilevalthrvalglu

675680685

alalysglulyspheaspalailecyslystyrglnproargleutyr

690695700

lyspheasnlysglutyralatyrleuleuargaspilevalarggly

705710715720

lysserleuvalgluleuglnglnileargglngluilepheargphe

725730735

ilegluglnaspcysglyvalthrargleuglyserleuserleuser

740745750

thrleugluthrvallysalavallysglyileiletyrsertyrphe

755760765

serthralaleuasnalaserlysasnasnproileseraspglugln

770775780

arglysglupheaspprogluleuphealaleuleuglulysleuglu

785790795800

leuileargthrarglyslyslysglnlysvalgluargilealaasn

805810815

serleuileglnthrcysleugluasnasnilelyspheilearggly

820825830

gluglyaspleuserthrthrasnasnalathrlyslyslysalaasn

835840845

serargsermetasptrpleualaargglyvalpheasnlysilearg

850855860

glnleualapromethisasnilethrleupheglycysglyserleu

865870875880

tyrthrserhisglnaspproleuvalhisargasnproasplysala

885890895

metlyscysargtrpalaalaileprovallysaspileglyasptrp

900905910

valleuarglysleuserglnasnleuargalalysasnileglythr

915920925

glyglutyrtyrhisglnglyvallysglupheleuserhistyrglu

930935940

leuglnaspleugluglugluleuleulystrpargserasparglys

945950955960

serasnileprocystrpvalleuglnasnargleualaglulysleu

965970975

glyasnlysglualavalvaltyrileprovalargglyglyargile

980985990

tyrphealathrhislysvalalathrglyalavalserilevalphe

99510001005

aspglnlysglnvaltrpvalcysasnalaasphisvalalaalaala

101010151020

asnilealaleuthrvallysglyileglygluglnserseraspglu

1025103010351040

gluasnproaspglyserargilelysleuglnleuthrser

10451050

<210>2

<211>1054

<212>prt

<213>artificialsequence

<400>2

metserseralailelyssertyrlysservalleuargproasnglu

151015

arglysasnglnleuleulysserthrileglncysleugluaspgly

202530

seralaphephephelysmetleuglnglyleupheglyglyilethr

354045

progluilevalargpheserthrgluglnglulysglnglnglnasp

505560

ilealaleutrpcysalavalasntrppheargprovalserglnasp

65707580

serleuthrhisthrilealaseraspasnleuvalglulyspheglu

859095

glutyrtyrglyglythralaseraspalailelysglntyrpheser

100105110

alaserileglyglusertyrtyrtrpasnaspcysargglnglntyr

115120125

tyraspleucysarggluleuglyvalgluvalseraspleuthrhis

130135140

aspleugluileleucysargglulyscysleualavalalathrglu

145150155160

serasnglntyrasnserileileservalleupheglythrglyarg

165170175

lysgluaspargservallysleuargilethrlyslysileleuglu

180185190

alaileserasnleulysgluileprolysasnvalalaproilegln

195200205

gluileileleuasnvalalalysalathrlysgluthrphearggln

210215220

valtyralaglyasnleuglyalaproserthrleugluargpheile

225230235240

alalysaspglyglnlysglupheaspleulyslysleuglnthrasp

245250255

leulyslysvalileargglylysserlysgluargasptrpcyscys

260265270

glnglugluleuargsertyrvalgluglnasnthrileglntyrasp

275280285

leutrpalatrpglyglumetpheasnlysalahisthralaleulys

290295300

ilelysserthrargasntyrasnphealalysglnargleuglugln

305310315320

phelysgluileglnserleuasnasnleuleuvalvallyslysleu

325330335

asnaspphepheaspsergluphepheserglyglugluthrtyrthr

340345350

ilecysvalhishisleuglyglylysaspleuserlysleutyrlys

355360365

alatrpgluaspaspproalaaspprogluasnalailevalvalleu

370375380

cysaspaspleulysasnasnphelyslysgluproileargasnile

385390395400

leuargtyrilephethrileargglnglucysseralaglnaspile

405410415

leualaalaalalystyrasnglnglnleuaspargtyrlyssergln

420425430

lysalaasnproservalleuglyasnglnglyphethrtrpargasn

435440445

alavalileleuproglulysalaglnargasnaspargproasnser

450455460

leuaspleuargiletrpleutyrleulysleuarghisproaspgly

465470475480

argtrplyslyshishisileprophetyraspthrargphephegln

485490495

gluiletyralaalaglyasnserprovalaspthrcysglnphearg

500505510

thrproargpheglytyrhisleuprolysleuthraspglnthrala

515520525

ileargvalasnlyslyshisvallysalaalalysthrglualaarg

530535540

ileargleualaileglnglnglythrleuprovalserasnleulys

545550555560

ilethrargileseralathrileasnserlysglyglnvalargile

565570575

provallyspheaspvalglyargglnlysglythrleuglnilegly

580585590

aspargphecysglytyraspglnasnglnthralaserhisalatyr

595600605

serleutrpgluvalvallysgluglyglntyrhislysgluleugly

610615620

cysphevalargpheileserserglyaspilevalserilethrglu

625630635640

asnargglyasnglnpheaspglnleusertyrgluglyleualatyr

645650655

proglntyralaasptrparglyslysalaserlysphevalserleu

660665670

trpglnilethrlyslysasnlyslyslysgluilevalthrvalglu

675680685

alalysglulyspheaspalailecyslystyrglnproargleutyr

690695700

lyspheasnlysglutyralatyrleuleuargaspilevalarggly

705710715720

lysserleuvalgluleuglnglnileargglngluilepheargphe

725730735

ilegluglnaspcysglyvalthrargleuglyserleuserleuser

740745750

thrleugluthrvallysalavallysglyileiletyrsertyrphe

755760765

serthralaleuasnalaserlysasnasnproileseraspglugln

770775780

arglysglupheaspprogluleuphealaleuleuglulysleuglu

785790795800

leuileargthrarglyslyslysglnlysvalgluargilealaasn

805810815

serleuileglnthrcysleugluasnasnilelyspheilearggly

820825830

gluglyaspleuserthrthrasnasnalathrlyslyslysalaasn

835840845

serargsermetasptrpleualaargglyvalpheasnlysilearg

850855860

glnleualapromethisasnilethrleupheglycysglyserleu

865870875880

tyrthrserhisglnaspproleuvalhisargasnproasplysala

885890895

metlyscysargtrpalaalaileprovallysaspileglyasptrp

900905910

valleuarglysleuserglnasnleuargalalysasnileglythr

915920925

glyglutyrtyrhisglnglyvallysglupheleuserhistyrglu

930935940

leuglnaspleugluglugluleuleulystrpargserasparglys

945950955960

serasnileprocystrpvalleuglnasnargleualaglulysleu

965970975

glyasnlysglualavalvaltyrileprovalargglyglyargile

980985990

tyrphealathrhislysvalalathrglyalavalserilevalphe

99510001005

aspglnlysglnvaltrpvalcysasnalaasphisvalalaalaala

101010151020

asnilealaleuthrvallysglyileglygluglnserseraspglu

1025103010351040

gluasnproaspglyserargilelysleuglnleuthrser

10451050

<210>3

<211>1054

<212>prt

<213>artificialsequence

<400>3

metserseralailelyssertyrlysservalleuargproasnglu

151015

arglysasnglnleuleulysserthrileglncysleugluaspgly

202530

seralaphephephelysmetleuglnglyleupheglyglyilethr

354045

progluilevalargpheserthrgluglnglulysglnglnglnasp

505560

ilealaleutrpcysalavalasntrppheargprovalserglnasp

65707580

serleuthrhisthrilealaseraspasnleuvalglulyspheglu

859095

glutyrtyrglyglythralaseraspalailelysglntyrpheser

100105110

alaserileglyglusertyrtyrtrpasnaspcysargglnglntyr

115120125

tyraspleucysarggluleuglyvalgluvalseraspleuthrhis

130135140

aspleugluileleucysargglulyscysleualavalalathrglu

145150155160

serasnglnasnasnserileileservalleupheglythrglyarg

165170175

lysgluaspargservallysleuargilethrlyslysileleuglu

180185190

alaileserasnleulysgluileprolysasnvalalaproilegln

195200205

gluileileleuasnvalalalysalathrlysgluthrphearggln

210215220

valtyralaglyasnleuglyalaproserthrleugluargpheile

225230235240

alalysaspglyglnlysglupheaspleulyslysleuglnthrasp

245250255

leulyslysvalileargglylysserlysgluargasptrpcyscys

260265270

glnglugluleuargsertyrvalgluglnasnthrileglntyrasp

275280285

leutrpalatrpglyglumetpheasnlysalahisthralaleulys

290295300

ilelysserthrargasntyrasnphealalysglnargleuglugln

305310315320

phelysgluileglnserleuasnasnleuleuvalvallyslysleu

325330335

asnaspphepheaspsergluphepheserglyglugluthrtyrthr

340345350

ilecysvalhishisleuglyglylysaspleuserlysleutyrlys

355360365

alatrpgluaspaspproalaaspprogluasnalailevalvalleu

370375380

cysaspaspleulysasnasnphelyslysgluproileargasnile

385390395400

leuargtyrilephethrileargglnglucysseralaglnaspile

405410415

leualaalaalalystyrasnglnglnleuaspargtyrlyssergln

420425430

lysalaasnproservalleuglyasnglnglyphethrtrpargasn

435440445

alavalileleuproglulysalaglnargasnaspargproasnser

450455460

leuaspleuargiletrpleutyrleulysleuarghisproaspgly

465470475480

argtrplyslyshishisileprophetyraspthrargphephegln

485490495

gluiletyralaalaglyasnserprovalaspthrcysglnphearg

500505510

thrproargpheglytyrhisleuprolysleuthraspglnthrala

515520525

ileargvalasnlyslyshisvallysalaalalysthrglualaarg

530535540

ileargleualaileglnglnglythrleuprovalserasnleulys

545550555560

ilethrargileseralathrileasnserlysglyglnvalargile

565570575

provallyspheaspvalglyargglnlysglythrleuglnilegly

580585590

aspargphecysglytyraspglnasnglnthralaserhisalatyr

595600605

serleutrpgluvalvallysgluglyglntyrhislysgluleugly

610615620

cysphevalargpheileserserglyaspilevalserilethrglu

625630635640

asnargglyasnglnpheaspglnleusertyrgluglyleualatyr

645650655

proglntyralaasptrparglyslysalaserlysphevalserleu

660665670

trpglnilethrlyslysasnlyslyslysgluilevalthrvalglu

675680685

alalysglulyspheaspalailecyslystyrglnproargleutyr

690695700

lyspheasnlysglutyralatyrleuleuargaspilevalarggly

705710715720

lysserleuvalgluleuglnglnileargglngluilepheargphe

725730735

ilegluglnaspcysglyvalthrargleuglyserleuserleuser

740745750

thrleugluthrvallysalavallysglyileiletyrsertyrphe

755760765

serthralaleuasnalaserlysasnasnproileseraspglugln

770775780

arglysglupheaspprogluleuphealaleuleuglulysleuglu

785790795800

leuileargthrarglyslyslysglnlysvalgluargilealaasn

805810815

serleuileglnthrcysleugluasnasnilelyspheilearggly

820825830

gluglyaspleuserthrthrasnasnalathrlyslyslysalaasn

835840845

serargsermetasptrpleualaargglyvalpheasnlysilearg

850855860

glnleualapromethisasnilethrleupheglycysglyserleu

865870875880

tyrthrserhisglnaspproleuvalhisargasnproasplysala

885890895

metlyscysargtrpalaalaileprovallysaspileglyasptrp

900905910

valleuarglysleuserglnasnleuargalalysasnargglythr

915920925

glyglutyrtyrhisglnglyvallysglupheleuserhistyrglu

930935940

leuglnaspleugluglugluleuleulystrpargserasparglys

945950955960

serasnileprocystrpvalleuglnasnargleualaglulysleu

965970975

glyasnlysglualavalvaltyrileprovalargglyglyargile

980985990

tyrphealathrhislysvalalathrglyalavalserilevalphe

99510001005

aspglnlysglnvaltrpvalcysasnalaasphisvalalaalaala

101010151020

asnilealaleuthrvallysglyileglygluglnserseraspglu

1025103010351040

gluasnproaspglyserargilelysleuglnleuthrser

10451050

<210>4

<211>1054

<212>prt

<213>artificialsequence

<400>4

metserseralailelyssertyrlysservalleuargproasnglu

151015

arglysasnglnleuleulysserthrileglncysleugluaspgly

202530

seralaphephephelysmetleuglnglyleupheglyglyilethr

354045

progluilevalargpheserthrgluglnglulysglnglnglnasp

505560

ilealaleutrpcysalavalasntrppheargprovalserglnasp

65707580

serleuthrhisthrilealaseraspasnleuvalglulyspheglu

859095

glutyrtyrglyglythralaseraspalailelysglntyrpheser

100105110

alaserileglyglusertyrtyrtrpasnaspcysargglnglntyr

115120125

tyraspleucysarggluleuglyvalgluvalseraspleuthrhis

130135140

aspleugluileleucysargglulyscysleualavalalathrglu

145150155160

serasnglnasnasnserileileservalleupheglythrglyarg

165170175

lysgluaspargservallysleuargilethrlyslysileleuglu

180185190

alaileserasnleulysgluileprolysasnvalalaproilegln

195200205

gluileileleuasnvalalalysalathrlysgluthrphearggln

210215220

valtyralaglyasnleuglyalaproserthrleugluargpheile

225230235240

alalysaspglyglnlysglupheaspleulyslysleuglnthrasp

245250255

leulyslysvalileargglylysserlysgluargasptrpcyscys

260265270

glnglugluleuargsertyrvalgluglnasnthrileglntyrasp

275280285

leutrpalatrpglyglumetpheasnlysalahisthralaleulys

290295300

ilelysserthrargasntyrasnphealalysglnargleuglugln

305310315320

phelysargileglnserleuasnasnleuleuvalvallyslysleu

325330335

asnaspphepheaspsergluphepheserglyglugluthrtyrthr

340345350

ilecysvalhishisleuglyglylysargleuserlysleutyrlys

355360365

alatrpgluaspaspproalaaspprogluasnalailevalvalleu

370375380

cysaspaspleulysasnasnphelyslysgluproileargasnile

385390395400

leuargtyrilephethrileargglnglucysseralaglnaspile

405410415

leualaalaalalystyrasnglnglnleuaspargtyrlyssergln

420425430

lysalaasnproservalleuglyasnglnglyphethrtrpargasn

435440445

alavalileleuproglulysalaglnargasnaspargproasnser

450455460

leuaspleuargiletrpleutyrleulysleuarghisproaspgly

465470475480

argtrplyslyshishisileprophetyraspthrargphephegln

485490495

gluiletyralaalaglyasnserprovalaspthrcysglnphearg

500505510

thrproargpheglytyrhisleuprolysleuthraspglnthrala

515520525

ileargvalasnlyslyshisvallysalaalalysthrglualaarg

530535540

ileargleualaileglnglnglythrleuprovalserasnleulys

545550555560

ilethrargileseralathrileasnserlysglyglnvalargile

565570575

provallyspheaspvalglyargglnlysglythrleuglnilegly

580585590

aspargphecysglytyraspglnasnglnthralaserhisalatyr

595600605

serleutrpgluvalvallysgluglyglntyrhislysgluleugly

610615620

cysphevalargpheileserserglyaspilevalserilethrglu

625630635640

asnargglyasnglnpheaspglnleusertyrgluglyleualatyr

645650655

proglntyralaasptrparglyslysalaserlysphevalserleu

660665670

trpglnilethrlyslysasnlyslyslysgluilevalthrvalglu

675680685

alalysglulyspheaspalailecyslystyrglnproargleutyr

690695700

lyspheasnlysglutyralatyrleuleuargaspilevalarggly

705710715720

lysserleuvalgluleuglnglnileargglngluilepheargphe

725730735

ilegluglnaspcysglyvalthrargleuglyserleuserleuser

740745750

thrleugluthrvallysalavallysglyileiletyrsertyrphe

755760765

serthralaleuasnalaserlysasnasnproileseraspglugln

770775780

arglysglupheaspprogluleuphealaleuleuglulysleuglu

785790795800

leuileargthrarglyslyslysglnlysvalgluargilealaasn

805810815

serleuileglnthrcysleugluasnasnilelyspheilearggly

820825830

gluglyaspleuserthrthrasnasnalathrlyslyslysalaasn

835840845

serargsermetasptrpleualaargglyvalpheasnlysilearg

850855860

glnleualapromethisasnilethrleupheglycysglyserleu

865870875880

tyrthrserhisglnaspproleuvalhisargasnproasplysala

885890895

metlyscysargtrpalaalaileprovallysaspileglyasptrp

900905910

valleuarglysleuserglnasnleuargalalysasnileglythr

915920925

glyglutyrtyrhisglnglyvallysglupheleuserhistyrglu

930935940

leuglnaspleugluglugluleuleulystrpargserasparglys

945950955960

serasnileprocystrpvalleuglnasnargleualaglulysleu

965970975

glyasnlysglualavalvaltyrileprovalargglyglyargile

980985990

tyrphealathrhislysvalalathrglyalavalserilevalphe

99510001005

aspglnlysglnvaltrpvalcysasnalaasphisvalalaalaala

101010151020

asnilealaleuthrvallysglyileglygluglnserseraspglu

1025103010351040

gluasnproaspglyserargilelysleuglnleuthrser

10451050

<210>5

<211>1054

<212>prt

<213>artificialsequence

<400>5

metserseralailelyssertyrlysservalleuargproasnglu

151015

arglysasnglnleuleulysserthrileglncysleugluaspgly

202530

seralaphephephelysmetleuglnglyleupheglyglyilethr

354045

progluilevalargpheserthrgluglnglulysglnglnglnasp

505560

ilealaleutrpcysalavalasntrppheargprovalserglnasp

65707580

serleuthrhisthrilealaseraspasnleuvalglulyspheglu

859095

glutyrtyrglyglythralaseraspalailelysglntyrpheser

100105110

alaserileglyglusertyrtyrtrpasnaspcysargglnglntyr

115120125

tyraspleucysarggluleuglyvalgluvalseraspleuthrhis

130135140

aspleugluileleucysargglulyscysleualavalalathrglu

145150155160

serasnglntyrasnserileileservalleupheglythrglyglu

165170175

lysgluaspargservallysleuargilethrlyslysileleuglu

180185190

alaileserasnleulysgluileprolysasnvalalaproilegln

195200205

gluileileleuasnvalalalysalathrlysgluthrphearggln

210215220

valtyralaglyasnleuglyalaproserthrleuglulyspheile

225230235240

alalysaspglyglnlysglupheaspleulyslysleuglnthrasp

245250255

leulyslysvalileargglylysserlysgluargasptrpcyscys

260265270

glnglugluleuargsertyrvalgluglnasnthrileglntyrasp

275280285

leutrpalatrpglyglumetpheasnlysalahisthralaleulys

290295300

ilelysserthrargasntyrasnphealalysglnargleuglugln

305310315320

phelysgluileglnserleuasnasnleuleuvalvallyslysleu

325330335

asnaspphepheaspsergluphepheserglyglugluthrtyrthr

340345350

ilecysvalhishisleuglyglylysaspleuserlysleutyrlys

355360365

alatrpgluaspaspproalaaspprogluasnalailevalvalleu

370375380

cysaspaspleulysasnasnphelyslysgluproileargasnile

385390395400

leuargtyrilephethrileargglnglucysseralaglnaspile

405410415

leualaalaalalystyrasnglnglnleuaspargtyrlyssergln

420425430

lysalaasnproservalleuglyasnglnglyphethrtrpthrasn

435440445

alavalileleuproglulysalaglnargasnaspargproasnser

450455460

leuaspleuargiletrpleutyrleulysleuarghisproaspgly

465470475480

argtrplyslyshishisileprophetyraspthrargphephegln

485490495

gluiletyralaalaglyasnserprovalaspthrcysglnphearg

500505510

thrproargpheglytyrhisleuprolysleuthraspglnthrala

515520525

ileargvalasnlyslyshisvallysalaalalysthrglualaarg

530535540

ileargleualaileglnglnglythrleuprovalserasnleulys

545550555560

ilethrgluileseralathrileasnserlysglyglnvalargile

565570575

provallyspheaspvalglyargglnlysglythrleuglnilegly

580585590

aspargphecysglytyraspglnasnglnthralaserhisalatyr

595600605

serleutrpgluvalvallysgluglyglntyrhislysgluleugly

610615620

cysphevalargpheileserserglyaspilevalserilethrglu

625630635640

asnargglyasnglnpheaspglnleusertyrgluglyleualatyr

645650655

proglntyralaasptrparglyslysalaserlysphevalserleu

660665670

trpglnilethrlyslysasnlyslyslysgluilevalthrvalglu

675680685

alalysglulyspheaspalailecyslystyrglnproargleutyr

690695700

lyspheasnlysglutyralatyrleuleuargaspilevalarggly

705710715720

lysserleuvalgluleuglnglnileargglngluilepheargphe

725730735

ilegluglnaspcysglyvalthrargleuglyserleuserleuser

740745750

thrleugluthrvallysalavallysglyileiletyrsertyrphe

755760765

serthralaleuasnalaserlysasnasnproileseraspglugln

770775780

arglysglupheaspprogluleuphealaleuleuglulysleuglu

785790795800

leuileargthrarglyslyslysglnlysvalgluargilealaasn

805810815

serleuileglnthrcysleugluasnasnilelyspheilearggly

820825830

gluglyaspleuserthrthrasnasnalathrlyslyslysalaasn

835840845

serargsermetasptrpleualaargglyvalpheasnlysilearg

850855860

glnleualapromethisasnilethrleupheglycysglyserleu

865870875880

tyrthrserhisglnaspproleuvalhisargasnproasplysala

885890895

metlyscysargtrpalaalaileprovallysaspileglyasptrp

900905910

valleuarglysleuserglnasnleuargalalysasnargglythr

915920925

glyglutyrtyrhisglnglyvallysglupheleuserhistyrglu

930935940

leuglnaspleugluglugluleuleulystrpargserasparglys

945950955960

serasnileprocystrpvalleuglnasnargleualaglulysleu

965970975

glyasnlysglualavalvaltyrileprovalargglyglyargile

980985990

tyrphealathrhislysvalalathrglyalavalserilevalphe

99510001005

aspglnlysglnvaltrpvalcysasnalaasphisvalalaalaala

101010151020

asnilealaleuthrvallysglyileglygluglnserseraspglu

1025103010351040

gluasnproaspglyserargilelysleuglnleuthrser

10451050

<210>6

<211>1054

<212>prt

<213>artificialsequence

<400>6

metserseralailelyssertyrlysservalleuargproasnglu

151015

arglysasnglnleuleulysserthrileglncysleugluaspgly

202530

seralaphephephelysmetleuglnglyleupheglyglyilethr

354045

progluilevalargpheserthrgluglnglulysglnglnglnasp

505560

ilealaleutrpcysalavalasntrppheargprovalserglnasp

65707580

serleuthrhisthrilealaseraspasnleuvalglulyspheglu

859095

glutyrtyrglyglythralaseraspalailelysglntyrpheser

100105110

alaserileglyglusertyrtyrtrpasnaspcysargglnglntyr

115120125

tyraspleucysarggluleuglyvalgluvalseraspleuthrhis

130135140

aspleugluileleucysargglulyscysleualavalalathrglu

145150155160

serasnglntyrasnserileileservalleupheglythrglyglu

165170175

lysgluaspargservallysleuargilethrlyslysileleuglu

180185190

alaileserasnleulysgluileprolysasnvalalaproilegln

195200205

gluileileleuasnvalalalysalathrlysgluthrphearggln

210215220

valtyralaglyasnleuglyalaproserthrleuglulyspheile

225230235240

alalysaspglyglnlysglupheaspleulyslysleuglnthrasp

245250255

leulyslysvalileargglylysserlysgluargasptrpcyscys

260265270

glnglugluleuargsertyrvalgluglnasnthrileglntyrasp

275280285

leutrpalatrpglyglumetpheasnlysalahisthralaleulys

290295300

ilelysserthrargasntyrasnphealalysglnargleuglugln

305310315320

phelysargileglnserleuasnasnleuleuvalvallyslysleu

325330335

asnaspphepheaspsergluphepheserglyglugluthrtyrthr

340345350

ilecysvalhishisleuglyglylysargleuserlysleutyrlys

355360365

alatrpgluaspaspproalaaspprogluasnalailevalvalleu

370375380

cysaspaspleulysasnasnphelyslysgluproileargasnile

385390395400

leuargtyrilephethrileargglnglucysseralaglnaspile

405410415

leualaalaalalystyrasnglnglnleuaspargtyrlyssergln

420425430

lysalaasnproservalleuglyasnglnglyphethrtrpthrasn

435440445

alavalileleuproglulysalaglnargasnaspargproasnser

450455460

leuaspleuargiletrpleutyrleulysleuarghisproaspgly

465470475480

argtrplyslyshishisileprophetyraspthrargphephegln

485490495

gluiletyralaalaglyasnserprovalaspthrcysglnphearg

500505510

thrproargpheglytyrhisleuprolysleuthraspglnthrala

515520525

ileargvalasnlyslyshisvallysalaalalysthrglualaarg

530535540

ileargleualaileglnglnglythrleuprovalserasnleulys

545550555560

ilethrgluileseralathrileasnserlysglyglnvalargile

565570575

provallyspheaspvalglyargglnlysglythrleuglnilegly

580585590

aspargphecysglytyraspglnasnglnthralaserhisalatyr

595600605

serleutrpgluvalvallysgluglyglntyrhislysgluleugly

610615620

cysphevalargpheileserserglyaspilevalserilethrglu

625630635640

asnargglyasnglnpheaspglnleusertyrgluglyleualatyr

645650655

proglntyralaasptrparglyslysalaserlysphevalserleu

660665670

trpglnilethrlyslysasnlyslyslysgluilevalthrvalglu

675680685

alalysglulyspheaspalailecyslystyrglnproargleutyr

690695700

lyspheasnlysglutyralatyrleuleuargaspilevalarggly

705710715720

lysserleuvalgluleuglnglnileargglngluilepheargphe

725730735

ilegluglnaspcysglyvalthrargleuglyserleuserleuser

740745750

thrleugluthrvallysalavallysglyileiletyrsertyrphe

755760765

serthralaleuasnalaserlysasnasnproileseraspglugln

770775780

arglysglupheaspprogluleuphealaleuleuglulysleuglu

785790795800

leuileargthrarglyslyslysglnlysvalgluargilealaasn

805810815

serleuileglnthrcysleugluasnasnilelyspheilearggly

820825830

gluglyaspleuserthrthrasnasnalathrlyslyslysalaasn

835840845

serargsermetasptrpleualaargglyvalpheasnlysilearg

850855860

glnleualapromethisasnilethrleupheglycysglyserleu

865870875880

tyrthrserhisglnaspproleuvalhisargasnproasplysala

885890895

metlyscysargtrpalaalaileprovallysaspileglyasptrp

900905910

valleuarglysleuserglnasnleuargalalysasnileglythr

915920925

glyglutyrtyrhisglnglyvallysglupheleuserhistyrglu

930935940

leuglnaspleugluglugluleuleulystrpargserasparglys

945950955960

serasnileprocystrpvalleuglnasnargleualaglulysleu

965970975

glyasnlysglualavalvaltyrileprovalargglyglyargile

980985990

tyrphealathrhislysvalalathrglyalavalserilevalphe

99510001005

aspglnlysglnvaltrpvalcysasnalaasphisvalalaalaala

101010151020

asnilealaleuthrvallysglyileglygluglnserseraspglu

1025103010351040

gluasnproaspglyserargilelysleuglnleuthrser

10451050

<210>7

<211>1054

<212>prt

<213>artificialsequence

<400>7

metserseralailelyssertyrlysservalleuargproasnglu

151015

arglysasnglnleuleulysserthrileglncysleugluaspgly

202530

seralaphephephelysmetleuglnglyleupheglyglyilethr

354045

progluilevalargpheserthrgluglnglulysglnglnglnasp

505560

ilealaleutrpcysalavalasntrppheargprovalserglnasp

65707580

serleuthrhisthrilealaseraspasnleuvalglulyspheglu

859095

glutyrtyrglyglythralaseraspalailelysglntyrpheser

100105110

alaserileglyglusertyrtyrtrpasnaspcysargglnglntyr

115120125

tyraspleucysarggluleuglyvalgluvalseraspleuthrhis

130135140

aspleugluileleucysargglulyscysleualavalalathrglu

145150155160

serasnglntyrasnserileileservalleupheglythrglyarg

165170175

lysgluaspargservallysleuargilethrlyslysileleuglu

180185190

alaileserasnleulysgluileprolysasnvalalaproilegln

195200205

gluileileleuasnvalalalysalathrlysgluthrphearggln

210215220

valtyralaglyasnleuglyalaproserthrleugluargpheile

225230235240

alalysaspglyglnlysglupheaspleulyslysleuglnthrasp

245250255

leulyslysvalileargglylysserlysgluargasptrpcyscys

260265270

glnglugluleuargsertyrvalgluglnasnthrileglntyrasp

275280285

leutrpalatrpglyglumetpheasnlysalahisthralaleulys

290295300

ilelysserthrargasntyrasnphealalysglnargleuglugln

305310315320

phelysgluileglnserleuasnasnleuleuvalvallyslysleu

325330335

asnaspphepheaspsergluphepheserglyglugluthrtyrthr

340345350

ilecysvalhishisleuglyglylysaspleuserlysleutyrlys

355360365

alatrpgluaspaspproalaaspprogluasnalailevalvalleu

370375380

cysaspaspleulysasnasnphelyslysgluproileargasnile

385390395400

leuargtyrilephethrileargglnglucysseralaglnaspile

405410415

leualaalaalalystyrasnglnglnleuaspargtyrlyssergln

420425430

lysalaasnproservalleuglyasnglnglyphethrtrpargasn

435440445

alavalileleuproglulysalaglnargasnaspargproasnser

450455460

leuaspleuargiletrpleutyrleulysleuarghisproaspgly

465470475480

argtrplyslyshishisileprophetyraspthrargphephegln

485490495

gluiletyralaalaglyasnserprovalaspthrcysglnphearg

500505510

thrproargpheglytyrhisleuprolysleuthraspglnthrala

515520525

ileargvalasnlyslyshisvallysalaalalysthrglualaarg

530535540

ileargleualaileglnglnglythrleuprovalserasnleulys

545550555560

ilethrargileseralathrileasnserlysglyglnvalargile

565570575

provallyspheaspvalglyargglnlysglythrleuglnilegly

580585590

aspargphecysglytyraspglnasnglnthralaserhisalatyr

595600605

serleutrpgluvalvallysgluglyglntyrhislysgluleugly

610615620

cysphevalargpheileserserglyaspilevalserilethrglu

625630635640

asnargglyasnglnpheaspglnleusertyrgluglyleualatyr

645650655

proglntyralaasptrparglyslysalaserlysphevalserleu

660665670

trpglnilethrlyslysasnlyslyslysgluilevalthrvalglu

675680685

alalysglulyspheaspalailecyslystyrglnproargleutyr

690695700

lyspheasnlysglutyralatyrleuleuargaspilevalarggly

705710715720

lysserleuvalgluleuglnglnileargglngluilepheargphe

725730735

ilegluglnaspcysglyvalthrargleuglyserleuserleuser

740745750

thrleugluthrvallysalavallysglyileiletyrsertyrphe

755760765

serthralaleuasnalaserlysasnasnproileseraspglugln

770775780

arglysglupheaspprogluleuphealaleuleuglulysleuglu

785790795800

leuileargthrarglyslyslysglnlysvalgluargilealaasn

805810815

serleuileglnthrcysleugluasnasnilelyspheilearggly

820825830

gluglyaspleuserthrthrasnasnalathrlyslyslysalaasn

835840845

serargsermetasptrpleualaargglyvalpheasnlysilearg

850855860

glnleualapromethisasnilethrleupheglycysglyserleu

865870875880

tyrthrserhisglnaspproleuvalhisargasnproasplysala

885890895

metlyscysargtrpalaalaileprovallysaspileglyasptrp

900905910

valleuarglysleuserglnasnleuargalalysasnargglythr

915920925

glyglutyrtyrhisglnglyvallysglupheleuserhistyrglu

930935940

leuglnaspleugluglugluleuleulystrpargserasparglys

945950955960

serasnileprocystrpvalleuglnasnargleualaglulysleu

965970975

glyasnlysglualavalvaltyrileprovalargglyglyargile

980985990

tyrphealathrhislysvalalathrglyalavalserilevalphe

99510001005

aspglnlysglnvaltrpvalcysasnalaasphisvalalaalaala

101010151020

asnilealaleuthrvallysglyileglygluglnserseraspglu

1025103010351040

gluasnproaspglyserargilelysleuglnleuthrser

10451050

<210>8

<211>1054

<212>prt

<213>artificialsequence

<400>8

metserseralailelyssertyrlysservalleuargproasnglu

151015

arglysasnglnleuleulysserthrileglncysleugluaspgly

202530

seralaphephephelysmetleuglnglyleupheglyglyilethr

354045

progluilevalargpheserthrgluglnglulysglnglnglnasp

505560

ilealaleutrpcysalavalasntrppheargprovalserglnasp

65707580

serleuthrhisthrilealaseraspasnleuvalglulyspheglu

859095

glutyrtyrglyglythralaseraspalailelysglntyrpheser

100105110

alaserileglyglusertyrtyrtrpasnaspcysargglnglntyr

115120125

tyraspleucysarggluleuglyvalgluvalseraspleuthrhis

130135140

aspleugluileleucysargglulyscysleualavalalathrglu

145150155160

serasnglntyrasnserileileservalleupheglythrglyarg

165170175

lysgluaspargservallysleuargilethrlyslysileleuglu

180185190

alaileserasnleulysgluileprolysasnvalalaproilegln

195200205

gluileileleuasnvalalalysalathrlysgluthrphearggln

210215220

valtyralaglyasnleuglyalaproserthrleugluargpheile

225230235240

alalysaspglyglnlysglupheaspleulyslysleuglnthrasp

245250255

leulyslysvalileargglylysserlysgluargasptrpcyscys

260265270

glnglugluleuargsertyrvalgluglnasnthrileglntyrasp

275280285

leutrpalatrpglyglumetpheasnlysalahisthralaleulys

290295300

ilelysserthrargasntyrasnphealalysglnargleuglugln

305310315320

phelysargileglnserleuasnasnleuleuvalvallyslysleu

325330335

asnaspphepheaspsergluphepheserglyglugluthrtyrthr

340345350

ilecysvalhishisleuglyglylysargleuserlysleutyrlys

355360365

alatrpgluaspaspproalaaspprogluasnalailevalvalleu

370375380

cysaspaspleulysasnasnphelyslysgluproileargasnile

385390395400

leuargtyrilephethrileargglnglucysseralaglnaspile

405410415

leualaalaalalystyrasnglnglnleuaspargtyrlyssergln

420425430

lysalaasnproservalleuglyasnglnglyphethrtrpargasn

435440445

alavalileleuproglulysalaglnargasnaspargproasnser

450455460

leuaspleuargiletrpleutyrleulysleuarghisproaspgly

465470475480

argtrplyslyshishisileprophetyraspthrargphephegln

485490495

gluiletyralaalaglyasnserprovalaspthrcysglnphearg

500505510

thrproargpheglytyrhisleuprolysleuthraspglnthrala

515520525

ileargvalasnlyslyshisvallysalaalalysthrglualaarg

530535540

ileargleualaileglnglnglythrleuprovalserasnleulys

545550555560

ilethrargileseralathrileasnserlysglyglnvalargile

565570575

provallyspheaspvalglyargglnlysglythrleuglnilegly

580585590

aspargphecysglytyraspglnasnglnthralaserhisalatyr

595600605

serleutrpgluvalvallysgluglyglntyrhislysgluleugly

610615620

cysphevalargpheileserserglyaspilevalserilethrglu

625630635640

asnargglyasnglnpheaspglnleusertyrgluglyleualatyr

645650655

proglntyralaasptrparglyslysalaserlysphevalserleu

660665670

trpglnilethrlyslysasnlyslyslysgluilevalthrvalglu

675680685

alalysglulyspheaspalailecyslystyrglnproargleutyr

690695700

lyspheasnlysglutyralatyrleuleuargaspilevalarggly

705710715720

lysserleuvalgluleuglnglnileargglngluilepheargphe

725730735

ilegluglnaspcysglyvalthrargleuglyserleuserleuser

740745750

thrleugluthrvallysalavallysglyileiletyrsertyrphe

755760765

serthralaleuasnalaserlysasnasnproileseraspglugln

770775780

arglysglupheaspprogluleuphealaleuleuglulysleuglu

785790795800

leuileargthrarglyslyslysglnlysvalgluargilealaasn

805810815

serleuileglnthrcysleugluasnasnilelyspheilearggly

820825830

gluglyaspleuserthrthrasnasnalathrlyslyslysalaasn

835840845

serargsermetasptrpleualaargglyvalpheasnlysilearg

850855860

glnleualapromethisasnilethrleupheglycysglyserleu

865870875880

tyrthrserhisglnaspproleuvalhisargasnproasplysala

885890895

metlyscysargtrpalaalaileprovallysaspileglyasptrp

900905910

valleuarglysleuserglnasnleuargalalysasnileglythr

915920925

glyglutyrtyrhisglnglyvallysglupheleuserhistyrglu

930935940

leuglnaspleugluglugluleuleulystrpargserasparglys

945950955960

serasnileprocystrpvalleuglnasnargleualaglulysleu

965970975

glyasnlysglualavalvaltyrileprovalargglyglyargile

980985990

tyrphealathrhislysvalalathrglyalavalserilevalphe

99510001005

aspglnlysglnvaltrpvalcysasnalaasphisvalalaalaala

101010151020

asnilealaleuthrvallysglyileglygluglnserseraspglu

1025103010351040

gluasnproaspglyserargilelysleuglnleuthrser

10451050

<210>9

<211>1054

<212>prt

<213>artificialsequence

<400>9

metserseralailelyssertyrlysservalleuargproasnglu

151015

arglysasnglnleuleulysserthrileglncysleugluaspgly

202530

seralaphephephelysmetleuglnglyleupheglyglyilethr

354045

progluilevalargpheserthrgluglnglulysglnglnglnasp

505560

ilealaleutrpcysalavalasntrppheargprovalserglnasp

65707580

serleuthrhisthrilealaseraspasnleuvalglulyspheglu

859095

glutyrtyrglyglythralaseraspalailelysglntyrpheser

100105110

alaserileglyglusertyrtyrtrpasnaspcysargglnglntyr

115120125

tyraspleucysarggluleuglyvalgluvalseraspleuthrhis

130135140

aspleugluileleucysargglulyscysleualavalalathrglu

145150155160

serasnglntyrasnserileileservalleupheglythrglyarg

165170175

lysgluaspargservallysleuargilethrlyslysileleuglu

180185190

alaileserasnleulysgluileprolysasnvalalaproilegln

195200205

gluileileleuasnvalalalysalathrlysgluthrphearggln

210215220

valtyralaglyasnleuglyalaproserthrleugluargpheile

225230235240

alalysaspglyglnlysglupheaspleulyslysleuglnthrasp

245250255

leulyslysvalileargglylysserlysgluargasptrpcyscys

260265270

glnglugluleuargsertyrvalgluglnasnthrileglntyrasp

275280285

leutrpalatrpglyglumetpheasnlysalahisthralaleulys

290295300

ilelysserthrargasntyrasnphealalysglnargleuglugln

305310315320

phelysargileglnserleuasnasnleuleuvalvallyslysleu

325330335

asnaspphepheaspsergluphepheserglyglugluthrtyrthr

340345350

ilecysvalhishisleuglyglylysargleuserlysleutyrlys

355360365

alatrpgluaspaspproalaaspprogluasnalailevalvalleu

370375380

cysaspaspleulysasnasnphelyslysgluproileargasnile

385390395400

leuargtyrilephethrileargglnglucysseralaglnaspile

405410415

leualaalaalalystyrasnglnglnleuaspargtyrlyssergln

420425430

lysalaasnproservalleuglyasnglnglyphethrtrpargasn

435440445

alavalileleuproglulysalaglnargasnaspargproasnser

450455460

leuaspleuargiletrpleutyrleulysleuarghisproaspgly

465470475480

argtrplyslyshishisileprophetyraspthrargphephegln

485490495

gluiletyralaalaglyasnserprovalaspthrcysglnphearg

500505510

thrproargpheglytyrhisleuprolysleuthraspglnthrala

515520525

ileargvalasnlyslyshisvallysalaalalysthrglualaarg

530535540

ileargleualaileglnglnglythrleuprovalserasnleulys

545550555560

ilethrargileseralathrileasnserlysglyglnvalargile

565570575

provallyspheaspvalglyargglnlysglythrleuglnilegly

580585590

aspargphecysglytyraspglnasnglnthralaserhisalatyr

595600605

serleutrpgluvalvallysgluglyglntyrhislysgluleugly

610615620

cysphevalargpheileserserglyaspilevalserilethrglu

625630635640

asnargglyasnglnpheaspglnleusertyrgluglyleualatyr

645650655

proglntyralaasptrparglyslysalaserlysphevalserleu

660665670

trpglnilethrlyslysasnlyslyslysgluilevalthrvalglu

675680685

alalysglulyspheaspalailecyslystyrglnproargleutyr

690695700

lyspheasnlysglutyralatyrleuleuargaspilevalarggly

705710715720

lysserleuvalgluleuglnglnileargglngluilepheargphe

725730735

ilegluglnaspcysglyvalthrargleuglyserleuserleuser

740745750

thrleugluthrvallysalavallysglyileiletyrsertyrphe

755760765

serthralaleuasnalaserlysasnasnproileseraspglugln

770775780

arglysglupheaspprogluleuphealaleuleuglulysleuglu

785790795800

leuileargthrarglyslyslysglnlysvalgluargilealaasn

805810815

serleuileglnthrcysleugluasnasnilelyspheilearggly

820825830

gluglyaspleuserthrthrasnasnalathrlyslyslysalaasn

835840845

serargsermetasptrpleualaargglyvalpheasnlysilearg

850855860

glnleualapromethisasnilethrleupheglycysglyserleu

865870875880

tyrthrserhisglnaspproleuvalhisargasnproasplysala

885890895

metlyscysargtrpalaalaileprovallysaspileglyasptrp

900905910

valleuarglysleuserglnasnleuargalalysasnargglythr

915920925

glyglutyrtyrhisglnglyvallysglupheleuserhistyrglu

930935940

leuglnaspleugluglugluleuleulystrpargserasparglys

945950955960

serasnileprocystrpvalleuglnasnargleualaglulysleu

965970975

glyasnlysglualavalvaltyrileprovalargglyglyargile

980985990

tyrphealathrhislysvalalathrglyalavalserilevalphe

99510001005

aspglnlysglnvaltrpvalcysasnalaasphisvalalaalaala

101010151020

asnilealaleuthrvallysglyileglygluglnserseraspglu

1025103010351040

gluasnproaspglyserargilelysleuglnleuthrser

10451050

<210>10

<211>1054

<212>prt

<213>artificialsequence

<400>10

metserseralailelyssertyrlysservalleuargproasnglu

151015

arglysasnglnleuleulysserthrileglncysleugluaspgly

202530

seralaphephephelysmetleuglnglyleupheglyglyilethr

354045

progluilevalargpheserthrgluglnglulysglnglnglnasp

505560

ilealaleutrpcysalavalasntrppheargprovalserglnasp

65707580

serleuthrhisthrilealaseraspasnleuvalglulyspheglu

859095

glutyrtyrglyglythralaseraspalailelysglntyrpheser

100105110

alaserileglyglusertyrtyrtrpasnaspcysargglnglntyr

115120125

tyraspleucysarggluleuglyvalgluvalseraspleuthrhis

130135140

aspleugluileleucysargglulyscysleualavalalathrglu

145150155160

serasnglntyrasnserileileservalleupheglythrglyarg

165170175

lysgluaspargservallysleuargilethrlyslysileleuglu

180185190

alaileserasnleulysgluileprolysasnvalalaproilegln

195200205

gluileileleuasnvalalalysalathrlysgluthrphearggln

210215220

valtyralaglyasnleuglyalaproserthrleugluargpheile

225230235240

alalysaspglyglnlysglupheaspleulyslysleuglnthrasp

245250255

leulyslysvalileargglylysserlysgluargasptrpcyscys

260265270

glnglugluleuargsertyrvalgluglnasnthrileglntyrasp

275280285

leutrpalatrpglyglumetpheasnlysalahisthralaleulys

290295300

ilelysserthrargasntyrasnphealalysglnargleuglugln

305310315320

phelysargileglnserleuasnasnleuleuvalvallyslysleu

325330335

asnaspphepheaspsergluphepheserglyglugluthrtyrthr

340345350

ilecysvalhishisleuglyglylysargleuserlysleutyrlys

355360365

alatrpgluaspaspproalaaspprogluasnalailevalvalleu

370375380

cysaspaspleulysasnasnphelyslysgluproileargasnile

385390395400

leuargtyrilephethrileargglnglucysseralaglnaspile

405410415

leualaalaalalystyrasnglnglnleuaspargtyrlyssergln

420425430

lysalaasnproservalleuglyasnglnglyphethrtrpargasn

435440445

alavalileleuproglulysalaglnargasnaspargproasnser

450455460

leuaspleuargiletrpleutyrleulysleuarghisproaspgly

465470475480

argtrplyslyshishisileprophetyraspthrargphephegln

485490495

gluiletyralaalaglyasnserprovalaspthrcysglnphearg

500505510

thrproargpheglytyrhisleuprolysleuthraspglnthrala

515520525

ileargvalasnlyslyshisvallysalaalalysthrglualaarg

530535540

ileargleualaileglnglnglythrleuprovalserasnleulys

545550555560

ilethrargileseralathrileasnserlysglyglnvalargile

565570575

provallyspheaspvalglyargglnlysglythrleuglnilegly

580585590

aspargphecysglytyraspglnasnglnthralaserhisalatyr

595600605

serleutrpgluvalvallysgluglyglntyrhislysgluleugly

610615620

cysphevalargpheileserserglyaspilevalserilethrglu

625630635640

asnargglyasnglnpheaspglnleusertyrgluglyleualatyr

645650655

proglntyralaasptrparglyslysalaserlysphevalserleu

660665670

trpglnilethrlyslysasnlyslyslysgluilevalthrvalglu

675680685

alalysglulyspheaspalailecyslystyrglnproargleutyr

690695700

lyspheasnlysglutyralatyrleuleuargaspilevalarggly

705710715720

lysserleuvalgluleuglnglnileargglngluilepheargphe

725730735

ilegluglnaspcysglyvalthrargleuglyserleuserleuser

740745750

thrleugluthrvallysalavallysglyileiletyrsertyrphe

755760765

serthralaleuasnalaserlysasnasnproileseraspglugln

770775780

arglysglupheaspprogluleuphealaleuleuglulysleuglu

785790795800

leuileargthrarglyslyslysglnlysvalgluargilealaasn

805810815

serleuileglnthrcysleugluasnasnilelyspheilearggly

820825830

gluglyaspleuserthrthrasnasnalathrlyslyslysalaasn

835840845

serargsermetasptrpleualaargglyvalpheasnlysilearg

850855860

glnleualapromethisasnilethrleupheglycysglyserleu

865870875880

tyrthrserhisglnaspproleuvalhisargasnproasplysala

885890895

metlyscysargtrpalaalaileprovallysaspileglyasptrp

900905910

valleuarglysleuserglnasnleuargalalysasnglyglythr

915920925

glyglutyrtyrhisglnglyvallysglupheleuserhistyrglu

930935940

leuglnaspleugluglugluleuleulystrpargserasparglys

945950955960

serasnileprocystrpvalleuglnasnargleualaglulysleu

965970975

glyasnlysglualavalvaltyrileprovalargglyglyargile

980985990

tyrphealathrhislysvalalathrglyalavalserilevalphe

99510001005

aspglnlysglnvaltrpvalcysasnalaasphisvalalaalaala

101010151020

asnilealaleuthrvallysglyileglygluglnserseraspglu

1025103010351040

gluasnproaspglyserargilelysleuglnleuthrser

10451050

<210>11

<211>1056

<212>prt

<213>artificialsequence

<400>11

metserseralailelyssertyrlysservalleuargproasnglu

151015

arglysasnglnleuleulysserthrileglncysleugluaspgly

202530

seralaphephephelysmetleuglnglyleupheglyglyilethr

354045

progluilevalargpheserthrgluglnglulysglnglnglnasp

505560

ilealaleutrpcysalavalasntrppheargprovalserglnasp

65707580

serleuthrhisthrilealaseraspasnleuvalglulyspheglu

859095

glutyrtyrglyglythralaseraspalailelysglntyrpheser

100105110

alaserileglyglusertyrtyrtrpasnaspcysargglnglntyr

115120125

tyraspleucysarggluleuglyvalgluvalseraspleuthrhis

130135140

aspleugluileleucysargglulyscysleualavalalathrglu

145150155160

serasnglntyrasnserileileservalleupheglythrglyarg

165170175

lysgluaspargservallysleuargilethrlyslysileleuglu

180185190

alaileserasnleulysgluileprolysasnvalalaproilegln

195200205

gluileileleuasnvalalalysalathrlysgluthrphearggln

210215220

valtyralaglyasnleuglyalaproserthrleugluargpheile

225230235240

alalysaspglyglnlysglupheaspleulyslysleuglnthrasp

245250255

leulyslysvalileargglylysserlysgluargasptrpcyscys

260265270

glnglugluleuargsertyrvalgluglnasnthrileglntyrasp

275280285

leutrpalatrpglyglumetpheasnlysalahisthralaleulys

290295300

ilelysserthrargasntyrasnphealalysglnargleuglugln

305310315320

phelysargileglnserleuasnasnleuleuvalvallyslysleu

325330335

asnaspphepheaspsergluphepheserglyglugluthrtyrthr

340345350

ilecysvalhishisleuglyglylysargleuserlysleutyrlys

355360365

alatrpgluaspaspproalaaspprogluasnalailevalvalleu

370375380

cysaspaspleulysasnasnphelyslysgluproileargasnile

385390395400

leuargtyrilephethrileargglnglucysseralaglnaspile

405410415

leualaalaalalystyrasnglnglnleuaspargtyrlyssergln

420425430

lysalaasnproservalleuglyglyglyasnglnglyphethrtrp

435440445

argasnalavalileleuproglulysalaglnargasnaspargpro

450455460

asnserleuaspleuargiletrpleutyrleulysleuarghispro

465470475480

aspglyargtrplyslyshishisileprophetyraspthrargphe

485490495

pheglngluiletyralaalaglyasnserprovalaspthrcysgln

500505510

pheargthrproargpheglytyrhisleuprolysleuthraspgln

515520525

thralaileargvalasnlyslyshisvallysalaalalysthrglu

530535540

alaargileargleualaileglnglnglythrleuprovalserasn

545550555560

leulysilethrargileseralathrileasnserlysglyglnval

565570575

argileprovallyspheaspvalglyargglnlysglythrleugln

580585590

ileglyaspargphecysglytyraspglnasnglnthralaserhis

595600605

alatyrserleutrpgluvalvallysgluglyglntyrhislysglu

610615620

leuglycysphevalargpheileserserglyaspilevalserile

625630635640

thrgluasnargglyasnglnpheaspglnleusertyrgluglyleu

645650655

alatyrproglntyralaasptrparglyslysalaserlyspheval

660665670

serleutrpglnilethrlyslysasnlyslyslysgluilevalthr

675680685

valglualalysglulyspheaspalailecyslystyrglnproarg

690695700

leutyrlyspheasnlysglutyralatyrleuleuargaspileval

705710715720

argglylysserleuvalgluleuglnglnileargglngluilephe

725730735

argpheilegluglnaspcysglyvalthrargleuglyserleuser

740745750

leuserthrleugluthrvallysalavallysglyileiletyrser

755760765

tyrpheserthralaleuasnalaserlysasnasnproileserasp

770775780

gluglnarglysglupheaspprogluleuphealaleuleuglulys

785790795800

leugluleuileargthrarglyslyslysglnlysvalgluargile

805810815

alaasnserleuileglnthrcysleugluasnasnilelyspheile

820825830

argglygluglyaspleuserthrthrasnasnalathrlyslyslys

835840845

alaasnserargsermetasptrpleualaargglyvalpheasnlys

850855860

ileargglnleualapromethisasnilethrleupheglycysgly

865870875880

serleutyrthrserhisglnaspproleuvalhisargasnproasp

885890895

lysalametlyscysargtrpalaalaileprovallysaspilegly

900905910

asptrpvalleuarglysleuserglnasnleuargalalysasngly

915920925

glythrglyglutyrtyrhisglnglyvallysglupheleuserhis

930935940

tyrgluleuglnaspleugluglugluleuleulystrpargserasp

945950955960

arglysserasnileprocystrpvalleuglnasnargleualaglu

965970975

lysleuglyasnlysglualavalvaltyrileprovalargglygly

980985990

argiletyrphealathrhislysvalalathrglyalavalserile

99510001005

valpheaspglnlysglnvaltrpvalcysasnalaasphisvalala

101010151020

alaalaasnilealaleuthrvallysglyileglygluglnserser

1025103010351040

aspglugluasnproaspglyserargilelysleuglnleuthrser

104510501055

<210>12

<211>1055

<212>prt

<213>artificialsequence

<400>12

metserseralailelyssertyrlysservalleuargproasnglu

151015

arglysasnglnleuleulysserthrileglncysleugluaspgly

202530

seralaphephephelysmetleuglnglyleupheglyglyilethr

354045

progluilevalargpheserthrgluglnglulysglnglnglnasp

505560

ilealaleutrpcysalavalasntrppheargprovalserglnasp

65707580

serleuthrhisthrilealaseraspasnleuvalglulyspheglu

859095

glutyrtyrglyglythralaseraspalailelysglntyrpheser

100105110

alaserileglyglusertyrtyrtrpasnaspcysargglnglntyr

115120125

tyraspleucysarggluleuglyvalgluvalseraspleuthrhis

130135140

aspleugluileleucysargglulyscysleualavalalathrglu

145150155160

serasnglntyrasnserileileservalleupheglythrglyarg

165170175

lysgluaspargservallysleuargilethrlyslysileleuglu

180185190

alaileserasnleulysgluileprolysasnvalalaproilegln

195200205

gluileileleuasnvalalalysalathrlysgluthrphearggln

210215220

valtyralaglyasnleuglyalaproserthrleugluargpheile

225230235240

alalysaspglyglnlysglupheaspleulyslysleuglnthrasp

245250255

leulyslysvalileargglylysserlysgluargasptrpcyscys

260265270

glnglugluleuargsertyrvalgluglnasnthrileglntyrasp

275280285

leutrpalatrpglyglumetpheasnlysalahisthralaleulys

290295300

ilelysserthrargasntyrasnphealalysglnargleuglugln

305310315320

phelysargileglnserleuasnasnleuleuvalvallyslysleu

325330335

asnaspphepheaspsergluphepheserglyglugluthrtyrthr

340345350

ilecysvalhishisleuglyglylysargleuserlysleutyrlys

355360365

alatrpgluaspaspproalaaspprogluasnalailevalvalleu

370375380

cysaspaspleulysasnasnphelyslysgluproileargasnile

385390395400

leuargtyrilephethrileargglnglucysseralaglnaspile

405410415

leualaalaalalystyrasnglnglnleuaspargtyrlyssergln

420425430

lysalaasnproservalleuglyglyasnglnglyphethrtrparg

435440445

asnalavalileleuproglulysalaglnargasnaspargproasn

450455460

serleuaspleuargiletrpleutyrleulysleuarghisproasp

465470475480

glyargtrplyslyshishisileprophetyraspthrargphephe

485490495

glngluiletyralaalaglyasnserprovalaspthrcysglnphe

500505510

argthrproargpheglytyrhisleuprolysleuthraspglnthr

515520525

alaileargvalasnlyslyshisvallysalaalalysthrgluala

530535540

argileargleualaileglnglnglythrleuprovalserasnleu

545550555560

lysilethrargileseralathrileasnserlysglyglnvalarg

565570575

ileprovallyspheaspvalglyargglnlysglythrleuglnile

580585590

glyaspargphecysglytyraspglnasnglnthralaserhisala

595600605

tyrserleutrpgluvalvallysgluglyglntyrhislysgluleu

610615620

glycysphevalargpheileserserglyaspilevalserilethr

625630635640

gluasnargglyasnglnpheaspglnleusertyrgluglyleuala

645650655

tyrproglntyralaasptrparglyslysalaserlysphevalser

660665670

leutrpglnilethrlyslysasnlyslyslysgluilevalthrval

675680685

glualalysglulyspheaspalailecyslystyrglnproargleu

690695700

tyrlyspheasnlysglutyralatyrleuleuargaspilevalarg

705710715720

glylysserleuvalgluleuglnglnileargglngluilephearg

725730735

pheilegluglnaspcysglyvalthrargleuglyserleuserleu

740745750

serthrleugluthrvallysalavallysglyileiletyrsertyr

755760765

pheserthralaleuasnalaserlysasnasnproileseraspglu

770775780

glnarglysglupheaspprogluleuphealaleuleuglulysleu

785790795800

gluleuileargthrarglyslyslysglnlysvalgluargileala

805810815

asnserleuileglnthrcysleugluasnasnilelyspheilearg

820825830

glygluglyaspleuserthrthrasnasnalathrlyslyslysala

835840845

asnserargsermetasptrpleualaargglyvalpheasnlysile

850855860

argglnleualapromethisasnilethrleupheglycysglyser

865870875880

leutyrthrserhisglnaspproleuvalhisargasnproasplys

885890895

alametlyscysargtrpalaalaileprovallysaspileglyasp

900905910

trpvalleuarglysleuserglnasnleuargalalysasnglygly

915920925

thrglyglutyrtyrhisglnglyvallysglupheleuserhistyr

930935940

gluleuglnaspleugluglugluleuleulystrpargserasparg

945950955960

lysserasnileprocystrpvalleuglnasnargleualaglulys

965970975

leuglyasnlysglualavalvaltyrileprovalargglyglyarg

980985990

iletyrphealathrhislysvalalathrglyalavalserileval

99510001005

pheaspglnlysglnvaltrpvalcysasnalaasphisvalalaala

101010151020

alaasnilealaleuthrvallysglyileglygluglnserserasp

1025103010351040

glugluasnproaspglyserargilelysleuglnleuthrser

104510501055

<210>13

<211>1093

<212>prt

<213>artificialsequence

<400>13

metserasnlysglulysasnalasergluthrarglysalatyrthr

151015

thrlysmetileproargserhisaspargmetlysleuleuglyasn

202530

phemetasptyrleumetaspglythrproilephephegluleutrp

354045

asnglnpheglyglyglyileaspargaspileileserglythrala

505560

asnlysasplysileseraspaspleuleuleualavalasntrpphe

65707580

lysvalmetproileasnserlysproglnglyvalserproserasn

859095

leualaasnleupheglnglntyrserglysergluproaspilegln

100105110

alaglnglutyrphealaserasnpheaspthrglulyshisglntrp

115120125

lysaspmetargvalglutyrgluargleuleualagluleuglnleu

130135140

serargseraspmethishisaspleulysleumettyrlysglulys

145150155160

cysileglyleuserleuserthralahistyrilethrservalmet

165170175

pheglythrglyalalysasnasnargglnthrlyshisglnphetyr

180185190

serlysvalileglnleuleuglugluserthrglnileasnserval

195200205

gluglnleualaserileileleulysalaglyaspcysaspsertyr

210215220

arglysleuargileargcysserarglysglyalathrproserile

225230235240

leulysilevalglnasptyrgluleuglythrasnhisaspaspglu

245250255

valasnvalproserleuilealaasnleulysglulysleuglyarg

260265270

pheglutyrglucysglutrplyscysmetglulysilelysalaphe

275280285

leualaserlysvalglyprotyrtyrleuglysertyrseralamet

290295300

leugluasnalaleuserproilelysglymetthrthrlysasncys

305310315320

lysphevalleulysglnileaspalalysasnaspilelystyrglu

325330335

asnglupropheglylysilevalgluglyphepheaspserprotyr

340345350

phegluseraspthrasnvallystrpvalleuhisprohishisile

355360365

glygluserasnilelysthrleutrpgluaspleuasnalailehis

370375380

serlystyrglugluaspilealaserleusergluasplyslysglu

385390395400

lysargilelysvaltyrglnglyaspvalcysglnthrileasnthr

405410415

tyrcysglugluvalglylysglualalysthrproleuvalglnleu

420425430

leuargtyrleutyrserarglysaspaspilealavalasplysile

435440445

ileaspglyilethrpheleuserlyslyshislysvalglulysgln

450455460

lysileasnprovalileglnlystyrproserpheasnpheglyasn

465470475480

asnserlysleuleuglylysileileserprolysasplysleulys

485490495

hisasnleulyscysasnargasnglnvalaspasntyriletrpile

500505510

gluilelysvalleuasnthrlysthrmetargtrpglulyshishis

515520525

tyralaleuserserthrargpheleuglugluvaltyrtyrproala

530535540

thrsergluasnproproaspalaleualaalaargpheargthrlys

545550555560

thrasnglytyrgluglylysproalaleuseralagluglnileglu

565570575

glnileargseralaprovalglyleuarglysvallyslysarggln

580585590

metargleuglualaalaargglnglnasnleuleuproargtyrthr

595600605

trpglylysasppheasnileasnilecyslysargglyasnasnphe

610615620

gluvalthrleualathrlysvallyslyslyslysglulysasntyr

625630635640

lysvalvalleuglytyraspalaasnilevalarglysasnthrtyr

645650655

alaalaileglualahisalaasnglyaspglyvalileasptyrasn

660665670

aspleuprovallysproilegluserglyphevalthrvalgluser

675680685

glnvalargasplyssertyraspglnleusertyrasnglyvallys

690695700

leuleutyrcyslysprohisvalgluserargargserpheleuglu

705710715720

lystyrargasnglythrmetlysaspasnargglyasnasnilegln

725730735

ileaspphemetlysasppheglualailealaaspaspgluthrser

740745750

leutyrtyrpheasnmetlystyrcyslysleuleuglnserserile

755760765

argasnhisserserglnalalysglutyrargglugluilepheglu

770775780

leuleuargaspglylysleuservalleulysleuserserleuser

785790795800

asnleuserphevalmetphelysvalalalysserleuileglythr

805810815

tyrpheglyhisleuleulyslysprolysasnserlysseraspval

820825830

lysalaproproilethraspgluasplysglnlysalaaspproglu

835840845

metphealaleuargleualaleugluglulysargleuasnlysval

850855860

lysserlyslysgluvalilealaasnlysilevalalalysalaleu

865870875880

gluleuargasplystyrglyprovalleuilelysglygluasnile

885890895

seraspthrthrlyslysglylyslysserserthrasnserpheleu

900905910

metasptrpleualaargglyvalalaasnlysvallysglumetval

915920925

metmethisglnglyleugluphevalgluvalasnproasnphethr

930935940

serhisglnaspprophevalhislysasnprogluasnthrphearg

945950955960

alaargtyrserargcysthrprosergluleuthrglulysasnarg

965970975

lysgluileleuserpheleuserasplysproserlysargprothr

980985990

asnalatyrtyrasngluglyalametalapheleualathrtyrgly

99510001005

leulyslysasnaspvalleuglyvalserleuglulysphelysgln

101010151020

ilemetalaasnileleuhisglnargsergluaspglnleuleuphe

1025103010351040

proserargglyglymetphetyrleualathrtyrlysleuaspala

104510501055

aspalathrservalasntrpasnglylysglnphetrpvalcysasn

106010651070

alaaspleuvalalaalatyrasnvalglyleuvalaspileglnlys

107510801085

aspphelyslyslys

1090

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1