利用PPR基序的DNA结合性蛋白质及其应用

文档序号:34861542发布日期:2023-07-23 10:13阅读:96来源:国知局
利用PPR基序的DNA结合性蛋白质及其应用

【】本发明涉及能够与目标dna碱基或dna序列选择性或特异性结合的蛋白质。本发明中利用了三角状五肽重复序列(pentatricopeptide repeat,ppr)基序。本发明可用于dna结合性蛋白质的鉴定、设计、具有ppr基序的蛋白质的靶标dna的鉴定、dna的功能调控。本发明在医疗领域、农学领域等中有用。另外,本发明涉及利用了含有ppr基序的蛋白质与规定功能性区域的蛋白质的复合体的新的dna切割酶。

背景技术

0、
背景技术:

1、近年来,使用通过各种分析得以明确的核酸结合性蛋白质因子与目标序列结合的技术已被确立并得到了应用。通过利用该序列特异性的结合,能够进行作为靶标的核酸(dna或rna)的细胞内定位分析、作为靶标的dna序列的去除、或其下游存在的蛋白质编码基因的表达调控(活化或失活)。

2、已经进行了将作为作用于dna的蛋白质性因子的锌指蛋白(非专利文献1、非专利文献2)、tal效应因子(tale、非专利文献3、专利文献1)、crispr(非专利文献4、非专利文献5)作为蛋白质工程材料的研究和开发,但这样的蛋白质性因子的种类仍然非常有限。

3、例如,作为人工dna切割酶而已知的人工锌指核酸酶(zfn)为一种嵌合蛋白质,其通过在使特异性识别并结合3~4个碱基的dna的锌指3~6个连结而构成的、利用3~4个碱基的序列单元对碱基序列进行识别的部分上连结细菌dna切割酶(例如foki)的1个dna切割结构域而形成(非专利文献2)。这样的嵌合蛋白质中,锌指结构域是已知与dna结合的蛋白质结构域,其根据在于,已知多种转录调控因子具有该结构域,与特异的dna序列结合并进行基因的表达调控。通过使用2个具有3个锌指的该zfn,理论上能够在大约每700亿个碱基中诱导1处切断。

4、但是,由于使用该zfn的方法在制作中耗费费用等,因而并未达到广泛应用的程度。另外,功能性zfn的筛选效率差,暗示其在这方面也存在问题。此外,由n个锌指构成的锌指结构域具有识别(gnn)n这样的序列的倾向,因而还具有靶标基因序列的自由度低这样的问题。

5、另一方面,已开发出了将由能够识别每1个碱基的组件部分的组合序列构成的蛋白质、tal效应因子(tale)与细菌dna切割酶(例如foki)的dna切割结构域结合而得到的酶(talen),正在将其作为替代zfn的人工酶来进行研究(非专利文献3)。该talen是将植物病原细菌黄单胞菌(xanthomonas)所具有的转录因子的dna结合结构域与dna限制酶foki的dna切割结构域融合而成的酶,已知其与邻近的dna序列结合,形成二聚物并将双链dna切断。该分子中,从感染植物的细菌中发现的tale的dna结合结构域利用由34个氨基酸构成的tale基序中的2处氨基酸的组合识别1个碱基,因此,具有能够通过tale组件的重复结构的选择来选择与靶标dna的结合性这样的特征。利用了具有这样的特征的dna结合结构域的talen具有与zfn同样地能够向靶标基因中导入突变的特征,但与zfn相比,具有很大优越性的是,其靶标基因(碱基序列)的自由度大幅提高,而且能够编码结合碱基。

6、但是,talen的完整的立体结构并不明确,因而现状是无法鉴定talen的dna的切割部位。因此,与zfn相比,talen存在切割部位不准确、不固定、会在类似序列处进行切割的问题。因此,存在无法利用dna切割酶准确地对靶标碱基序列进行切割的问题。基于这样的情况,希望开发、提供不具有上述问题的新的人工dna切割酶。

7、基于基因组序列信息,仅在植物中就鉴定了形成500个成员的大家族的蛋白质、即ppr蛋白质(具有三角状五肽重复序列(pentatricopeptide repeat,ppr)基序的蛋白质)(非专利文献6)。ppr蛋白质为核编码蛋白,已知其是专门对细胞器官(叶绿体和线粒体)的rna水平的调控、切割、翻译、剪接、rna编辑、rna稳定性发挥基因特异性作用的蛋白质。典型地,ppr蛋白质具有约10个保守性低的35氨基酸基序、即ppr基序连续而成的结构,认为ppr基序的组合承担了与rna的序列选择性结合的作用。绝大部分ppr蛋白质仅由约10个ppr基序的重复构成,多数情况下,未发现发挥催化作用所需要的结构域。因此,认为该ppr蛋白质实质上为rna衔接子(アダプター)(非专利文献7)。

8、通常,蛋白质与dna之间的结合同蛋白质与rna之间的结合是基于不同的分子机制来进行的,dna结合型蛋白质通常不与rna结合,反过来,rna结合型蛋白质通常不与dna结合。例如,在作为rna结合因子而已知的、能够对识别rna进行编码的pumilio蛋白质的情况下,并无其与dna结合的报道(非专利文献8和9)。

9、但是,在对各种ppr蛋白质的性质进行研究的过程中,已经明确提示了几种类型的ppr蛋白质作为dna结合性因子发挥作用。

10、小麦的p63为具有9个ppr基序的ppr蛋白质,通过凝胶迁移分析提示其与dna进行序列特异性结合(非专利文献10)。

11、拟南芥(arabidopsis thaliana)的gun1蛋白质具有11个ppr基序,通过拉下分析提示其与dna结合(非专利文献11)。

12、通过连缀(run-on)分析显示,拟南芥的ptac2(具有15个ppr基序的蛋白质、非专利文献12)和拟南芥的dg1(具有10个ppr基序的蛋白质、非专利文献13)直接参与以dna作为模板来生成rna的转录,认为它们与dna结合。

13、拟南芥的grp23(具有11个ppr基序的蛋白质、非专利文献14)的基因缺陷株表现出胚致死的表现型,显示出该蛋白质与作为dna依赖型rna转录酶的真核生物型rna转录聚合酶2的主要亚基发生物理性相互作用,因此认为grp23也发挥dna结合的作用。

14、但是,关于这些ppr蛋白质,只不过间接地暗示了其与dna的结合,并未充分证明实际上进行了序列特异性结合。另外,即使这些蛋白质与dna进行了序列特异性结合,由于通常认为蛋白质与dna之间的结合同蛋白质与rna之间的结合是基于不同的分子机制来进行的,因此关于具体是通过怎样的序列规则来进行结合等,甚至连预测也完全没有。

15、【现有技术文献】

16、【专利文献】

17、专利文献1:wo2011/072246

18、专利文献2:wo2011/111829

19、【非专利文献】

20、非专利文献1:maeder,m.l.,et al.(2008).rapid“open-source”engineeringofcustomized zinc-fingernucleases for highly efficient genemodification.mol.cell 31,294-301.

21、非专利文献2:urnov,f.d.,et al.,(2010)genome editing with engineeredzinc finger nucleases,nature review genetics,11,636-646

22、非专利文献3:miller,j.c.,et al.(2011).a tale nuclease architecture forefficient genome editing.nature biotech.29,143-148.

23、非专利文献4:mali p,et al.(2013)rna-guided human genome engineeringvia cas9.science.339,823-826.

24、非专利文献5:cong l,et al.(2013)multiplex genome engineering usingcrispr/cas systems.science.339,819-823

25、非专利文献6:small,i.d.,and peeters,n.(2000).the ppr motif-a tpr-related motif prevalent in plant organellar proteins.trends biochem.sci.25,46-47.

26、非专利文献7:woodson,j.d.,and chory,j.(2008).coordination of geneexpression between organellar and nuclear genomes.nature rev.genet.9,383-395.

27、非专利文献8:wang,x.,et al.(2002).modular recognition of rna by ahuman pumilio-homology domain.cell 110,501-512.

28、非专利文献9:cheong,c.g.,and hall,t.m.(2006).engineering rna sequencespecificity of pumilio repeats.proc.natl.acad.sci.usa 103,13635-13639.

29、非专利文献10:ikeda t.m.and gray m.w.(1999)characterization of a dna-binding protein implicated in transcription in wheat mitochondria.mol cellbiol19(12):8113-8122

30、非专利文献11:koussevitzky s,et al.(2007)signals from chloroplastsconverge to regulate nuclear gene expression.science 316:715-719.

31、非专利文献12:pfalz j,et al.(2006)ptac2,-6,and-12are components of thetranscriptionally active plastid chromosome that are required for plastidgene expression.plant cell 18:176-197.

32、非专利文献13:chi w,et al.(2008)the pentratricopeptide repeatproteindelayed greening1 is involved in the regulation of early chloroplastdevelopment and chloroplast gene expression in arabidopsis.plant physiol.147:573-584.

33、非专利文献14:ding yh,et al.(2006)arabidopsis glutamine-rich protein23is essential for early embryogenesis and encodes a novel nuclear ppr motifprotein that interacts with rna polymerase ii subunit iii.plant cell 18:815-830.


技术实现思路

0、
技术实现要素:

1、【发明所要解决的课题】

2、本发明人预测,ppr蛋白质(具有ppr基序的蛋白质)作为rna衔接子的性质是由构成ppr蛋白质的各ppr基序的性质以及多个ppr基序的组合决定的,并提出了利用该ppr基序的rna结合性蛋白质的改造方法(专利文献2)。并且明确了,ppr基序与rna是一对一地对应结合的,通过连续的ppr基序来识别rna序列中的连续的rna碱基,并且是利用构成ppr基序的35个氨基酸中特定的3处氨基酸的组合来决定rna识别的;对于利用ppr基序的rna识别密码的定制rna结合蛋白质的设计方法及其应用进行了专利申请(pct/jp2012/077274;yagi,y.,et al.(2013)plos one,8,e57286;以及barkan,a.,etal.(2012)plos genet.,8,e1002910.)。

3、通常认为,蛋白质与dna之间的结合同蛋白质与rna之间的结合基于不同的分子机制。与此相对,此次,基于ppr基序所具有的rna识别规则也能够用于dna识别的预测,设定了如下课题:对于在dna结合中起作用的ppr蛋白质进行分析,探寻具有这种特征的ppr蛋白质。另外还设定了如下课题:使用如此得到的可与dna特异性结合的ppr蛋白质,进行与所期望的序列结合的定制dna结合蛋白质的制备,同时,通过与规定功能性区域的蛋白质一起使用来提供新的人工酶;并且,通过与作为功能性区域的dna切割活性区域一起使用来提供新的人工dna切割酶。

4、【用于解决课题的手段】

5、在ppr蛋白质的情况下,在各种结构域检索程序(pfam、prosite、interpro等)中,已知通常的rna结合型的ppr蛋白质所含有的ppr基序与上述几种dna结合型的ppr蛋白质所含有的ppr基序并未进行特别区分。因此认为,在ppr蛋白质中,除了核酸识别所需要的氨基酸以外,可能还含有决定与dna的结合性或与rna的结合性的氨基酸(氨基酸组)。

6、本发明人在pct/jp2012/077274中明确了,rna结合型ppr基序与rna一对一地对应结合,通过连续的ppr基序识别rna序列中的连续的rna碱基;此时,利用构成ppr基序的35个氨基酸之中特定的3处氨基酸(即,构成基序的2个α螺旋结构中的最初的螺旋(螺旋a)的1位和4位的氨基酸(第1氨基酸和第4氨基酸)以及从c末端侧起的第2位氨基酸(第“ii”(-2)氨基酸))这3处rna识别氨基酸的组合来决定与碱基选择性的rna的结合,对于利用ppr基序的rna识别密码的定制rna结合蛋白质的设计方法及其应用进行了专利申请。

7、因此,在ppr蛋白质中被提示为与dna结合的上述小麦的p63(非专利文献11、拟南芥的同源蛋白质的氨基酸序列为seq id no:1)、拟南芥的gun1蛋白质(非专利文献12、氨基酸序列为seq id no:2)、拟南芥的ptac2(非专利文献13、氨基酸序列为seq id no:3)、dg1(非专利文献14、氨基酸序列为seq id no:4)、拟南芥的grp23(非专利文献15、氨基酸序列为seq id no:5)中,将在以rna为靶标的情况下被认为重要的ppr基序中承担核酸识别密码作用的3处氨基酸(第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸)的氨基酸出现频率与rna结合型基序进行了比较,结果可知,这些被暗示为dna结合性的ppr蛋白质的ppr基序与rna结合型基序之间的氨基酸出现频率的倾向基本一致。

8、由此暗示,rna结合型ppr基序的核酸识别密码也能够应用于dna结合型ppr基序。胸腺嘧啶(t)也被称为5-甲基尿嘧啶,其为具有将尿嘧啶(u)的5位碳进行了甲基化的结构的尿嘧啶(u)衍生物。根据这样的构成核酸的碱基的性质,暗示出rna结合型ppr基序的识别尿嘧啶(u)的氨基酸的组合可用于dna情况下的胸腺嘧啶(t)的识别。

9、基于这些发现明确了,通过使用作为dna结合型ppr蛋白质的上述p63(seq id no:1的氨基酸序列)、拟南芥的gun1蛋白质(seq id no:2的氨基酸序列)、拟南芥的ptac2(seqid no:3的氨基酸序列)、dg1(seq id no:4的氨基酸序列)、拟南芥的grp23(seq id no:5的氨基酸序列)作为模板,对这些ppr蛋白质应用rna结合型ppr基序的研究结果得到的发现,配置3处氨基酸(第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸),能够制作与任意dna序列结合的定制dna结合蛋白质。

10、即,本发明人通过提供一种能够选择性地结合dna碱基或者能够特异性地结合dna碱基序列的蛋白质而完成了本发明,该蛋白质含有多个、优选2~30个、更优选5~25个、特别优选9~15个的ppr基序,该ppr基序是以seq id no:1的氨基酸序列、seq id no:2的氨基酸序列、seq id no:3的氨基酸序列、seq id no:4的氨基酸序列、seq id no:5的氨基酸序列为代表的、使各ppr基序中的3处氨基酸(第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸)为后述的特定氨基酸的ppr基序。

11、本发明提供下述方案:

12、[1]一种能够选择性地结合dna碱基或者能够特异性地结合dna碱基序列的蛋白质,其为含有1个以上的具有下述式1结构的ppr基序的蛋白质,

13、【化1】

14、(螺旋a)-x-(螺旋b)-l    (式1)

15、(式1中:

16、螺旋a为能够形成α螺旋结构的部分;

17、x不存在或者为由长度1~9个的氨基酸构成的部分;

18、螺旋b为能够形成α螺旋结构的部分;并且

19、l为由长度2~7个的氨基酸构成的部分)

20、蛋白质中含有的一个ppr基序(mn)为下述的ppr基序:

21、在将螺旋a的起始氨基酸作为第1氨基酸、将第4位的氨基酸作为第4氨基酸、并且将下述氨基酸作为第“ii”(-2)氨基酸时,所述ppr基序具有第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸作为与对象dna碱基或对象dna碱基序列对应的特定的氨基酸的组合,

22、所述作为第“ii”(-2)氨基酸的氨基酸为:

23、·在ppr基序(mn)的c末端侧连续存在下一个ppr基序(mn+1)时(在ppr基序间无氨基酸插入时),从构成ppr基序(mn)的氨基酸的最后位(c末端侧)起的第-2位氨基酸;

24、·在ppr基序(mn)与其c末端侧的下一个ppr基序(mn+1)之间发现1~20个氨基酸的非ppr基序时,从下一个ppr基序(mn+1)的第1氨基酸起向上游侧数2位、即第-2位氨基酸;或者

25、·在ppr基序(mn)的c末端侧未发现下一个ppr基序(mn+1)时、或者在与c末端侧的下一个ppr基序(mn+1)之间发现21个氨基酸以上的构成非ppr基序的氨基酸的情况下,从构成ppr基序(mn)的氨基酸的最后位(c末端侧)起的第2位氨基酸。

26、[2]如[1]所述的蛋白质,该蛋白质中,使第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸的组合与对象dna碱基或对象dna碱基序列对应,其中,氨基酸的组合基于下述任意一种情况来确定:

27、(1-1)第4氨基酸为甘氨酸(g)的情况下,第1氨基酸可以为任意的氨基酸,并且第“ii”(-2)氨基酸为天冬氨酸(d)、天冬酰胺(n)或丝氨酸(s);

28、(1-2)第4氨基酸为异亮氨酸(i)的情况下,第1氨基酸和第“ii”(-2)氨基酸均可以为任意的氨基酸;

29、(1-3)第4氨基酸为亮氨酸(l)的情况下,第1氨基酸和第“ii”(-2)氨基酸均可以为任意的氨基酸;

30、(1-4)第4氨基酸为甲硫氨酸(m)的情况下,第1氨基酸和第“ii”(-2)氨基酸均可以为任意的氨基酸;

31、(1-5)第4氨基酸为天冬酰胺(n)的情况下,第1氨基酸和第“ii”(-2)氨基酸均可以为任意的氨基酸;

32、(1-6)第4氨基酸为脯氨酸(p)的情况下,第1氨基酸和第“ii”(-2)氨基酸均可以为任意的氨基酸;

33、(1-7)第4氨基酸为丝氨酸(s)的情况下,第1氨基酸和第“ii”(-2)氨基酸均可以为任意的氨基酸;

34、(1-8)第4氨基酸为苏氨酸(t)的情况下,第1氨基酸和第“ii”(-2)氨基酸均可以为任意的氨基酸;

35、(1-9)第4氨基酸为缬氨酸(v)的情况下,第1氨基酸和第“ii”(-2)氨基酸均可以为任意的氨基酸。

36、[3]如[1]所述的蛋白质,该蛋白质中,使第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸的组合与对象dna碱基或对象dna碱基序列对应,其中,氨基酸的组合基于下述任意一种情况来确定:

37、(2-1)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、甘氨酸、天冬氨酸时,该ppr基序与g选择性地结合;

38、(2-2)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为谷氨酸、甘氨酸、天冬氨酸时,该ppr基序与g选择性地结合;

39、(2-3)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、甘氨酸、天冬酰胺时,该ppr基序与a选择性地结合;

40、(2-4)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为谷氨酸、甘氨酸、天冬酰胺时,该ppr基序与a选择性地结合;

41、(2-5)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、甘氨酸、丝氨酸时,该ppr基序与a选择性地结合,其次与c结合;

42、(2-6)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、异亮氨酸、任意的氨基酸时,该ppr基序与t和c选择性地结合;

43、(2-7)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、异亮氨酸、天冬酰胺时,该ppr基序与t选择性地结合,其次与c结合;

44、(2-8)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、亮氨酸、任意的氨基酸时,该ppr基序与t和c选择性地结合;

45、(2-9)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、亮氨酸、天冬氨酸时,该ppr基序与c选择性地结合;

46、(2-10)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、亮氨酸、赖氨酸时,该ppr基序与t选择性地结合;

47、(2-11)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、甲硫氨酸、任意的氨基酸时,该ppr基序与t选择性地结合;

48、(2-12)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、甲硫氨酸、天冬氨酸时,该ppr基序与t选择性地结合;

49、(2-13)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为异亮氨酸、甲硫氨酸、天冬氨酸时,该ppr基序与t选择性地结合,其次与c结合;

50、(2-14)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、天冬酰胺、任意的氨基酸时,该ppr基序与c和t选择性地结合;

51、(2-15)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、天冬酰胺、天冬氨酸时,该ppr基序与t选择性地结合;

52、(2-16)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为苯丙氨酸、天冬酰胺、天冬氨酸时,该ppr基序与t选择性地结合;

53、(2-17)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为甘氨酸、天冬酰胺、天冬氨酸时,该ppr基序与t选择性地结合;

54、(2-18)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为异亮氨酸、天冬酰胺、天冬氨酸时,该ppr基序与t选择性地结合;

55、(2-19)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为苏氨酸、天冬酰胺、天冬氨酸时,该ppr基序与t选择性地结合;

56、(2-20)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为缬氨酸、天冬酰胺、天冬氨酸时,该ppr基序与t选择性地结合,其次与c结合;

57、(2-21)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为酪氨酸、天冬酰胺、天冬氨酸时,该ppr基序与t选择性地结合,其次与c结合;

58、(2-22)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、天冬酰胺、天冬酰胺时,该ppr基序与c选择性地结合;

59、(2-23)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为异亮氨酸、天冬酰胺、天冬酰胺时,该ppr基序与c选择性地结合;

60、(2-24)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为丝氨酸、天冬酰胺、天冬酰胺时,该ppr基序与c选择性地结合;

61、(2-25)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为缬氨酸、天冬酰胺、天冬酰胺时,该ppr基序与c选择性地结合;

62、(2-26)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、天冬酰胺、丝氨酸时,该ppr基序与c选择性地结合;

63、(2-27)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为缬氨酸、天冬酰胺、丝氨酸时,该ppr基序与c选择性地结合;

64、(2-28)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、天冬酰胺、苏氨酸时,该ppr基序与c选择性地结合;

65、(2-29)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为缬氨酸、天冬酰胺、苏氨酸时,该ppr基序与c选择性地结合;

66、(2-30)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、天冬酰胺、色氨酸时,该ppr基序与c选择性地结合,其次与t结合;

67、(2-31)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为异亮氨酸、天冬酰胺、色氨酸时,该ppr基序与t选择性地结合,其次与c结合;

68、(2-32)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、脯氨酸、任意的氨基酸时,该ppr基序与t选择性地结合;

69、(2-33)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、脯氨酸、天冬氨酸时,该ppr基序与t选择性地结合;

70、(2-34)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为苯丙氨酸、脯氨酸、天冬氨酸时,该ppr基序与t选择性地结合;

71、(2-35)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为酪氨酸、脯氨酸、天冬氨酸时,该ppr基序与t选择性地结合;

72、(2-36)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、丝氨酸、任意的氨基酸时,该ppr基序与a和g选择性地结合;

73、(2-37)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、丝氨酸、天冬酰胺时,该ppr基序与a选择性地结合;

74、(2-38)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为苯丙氨酸、丝氨酸、天冬酰胺时,该ppr基序与a选择性地结合;

75、(2-39)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为缬氨酸、丝氨酸、天冬酰胺时,该ppr基序与a选择性地结合;

76、(2-40)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、苏氨酸、任意的氨基酸时,该ppr基序与a和g选择性地结合;

77、(2-41)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、苏氨酸、天冬氨酸时,该ppr基序与g选择性地结合;

78、(2-42)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为缬氨酸、苏氨酸、天冬氨酸时,该ppr基序与g选择性地结合;

79、(2-43)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、苏氨酸、天冬酰胺时,该ppr基序与a选择性地结合;

80、(2-44)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为苯丙氨酸、苏氨酸、天冬酰胺时,该ppr基序与a选择性地结合;

81、(2-45)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为异亮氨酸、苏氨酸、天冬酰胺时,该ppr基序与a选择性地结合;

82、(2-46)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为缬氨酸、苏氨酸、天冬酰胺时,该ppr基序与a选择性地结合;

83、(2-47)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、缬氨酸、任意的氨基酸时,该ppr基序与a、c和t结合,但不与g结合;

84、(2-48)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为异亮氨酸、缬氨酸、天冬氨酸时,该ppr基序与c选择性地结合,其次与a结合;

85、(2-49)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、缬氨酸、甘氨酸时,该ppr基序与c选择性地结合;

86、(2-50)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的氨基酸、缬氨酸、苏氨酸时,该ppr基序与t选择性地结合。

87、[4]如[1]~[3]中任一项所述的蛋白质,其含有2~30个[1]中定义的ppr基序(mn)。

88、[5]如[1]~[3]中任一项所述的蛋白质,其含有5~25个[1]中定义的ppr基序(mn)。

89、[6]如[1]~[3]中任一项所述的蛋白质,其含有9~15个[1]中定义的ppr基序(mn)。

90、[7]如[6]所述的ppr蛋白质,其由选自具有9个ppr基序的seq id no:1的氨基酸序列、具有11个ppr基序的seq id no:2的氨基酸序列、具有15个ppr基序的seq id no:3的氨基酸序列、具有10个ppr基序的seq id no:4的氨基酸序列、具有11个ppr基序的seq id no:5的氨基酸序列中的序列构成。

91、[8]一种对作为dna结合性蛋白质的靶标的dna碱基或dna碱基序列进行鉴定的方法,该dna结合性蛋白质含有1个以上(优选2~30个)的[1]中定义的ppr基序(mn),该方法中,

92、鉴定通过下述方式进行:基于[1]所述的(1-1)~(1-9)或[3]所述的(2-1)~(2-50)中的任意一种情况来认定有无与ppr基序的第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸的组合对应的dna碱基。

93、[9]一种对ppr蛋白质进行鉴定的方法,该ppr蛋白质能够与靶标dna碱基或具有特定碱基序列的靶标dna结合、且含有1个以上(优选2~30个)的[1]中定义的ppr基序(mn),该方法中,

94、鉴定通过下述方式进行:基于[1]所述的(1-1)~(1-9)或[1]所述的(2-1)~(2-50)中的任意一种情况来认定有无与靶标dna碱基或构成靶标dna的特定碱基对应的ppr基序的第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸的组合。

95、[10]一种dna的功能的调控方法,其使用[1]所述的蛋白质。

96、[11]一种复合体,其通过将由[1]所述的蛋白质构成的区域与功能性区域连结而形成。

97、[12]如[11]所述的复合体,该复合体通过在[1]所述的蛋白质的c末端侧融合功能性区域而形成。

98、[13]如[11]或[12]所述的复合体,其中,功能性区域为dna切割酶或其核酸酶结构域、或者转录调控结构域,复合体作为靶标序列特异性dna切割酶或转录调控因子发挥功能。

99、[14]如[13]所述的复合体,其中,dna切割酶为foki的核酸酶结构域(seq id no:6)。

100、[15]一种对细胞的遗传物质进行改造的方法,其包括下述步骤:

101、准备含有具有靶标序列的dna的细胞;并且

102、将[11]所述的复合体导入到细胞中,由此复合体的由蛋白质构成的区域与具有靶标序列的dna结合,因此功能性区域对具有靶标序列的dna进行改造。

103、[16]一种使用含有1个以上ppr基序的ppr蛋白质对dna碱基或具有特定碱基序列的dna进行鉴定、识别或靶标化的方法。

104、[17]如[16]所述的方法,其中,蛋白质含有1个以上的ppr基序,构成该ppr基序的氨基酸中的3个为特定的氨基酸的组合。

105、[18]如[16]或[17]所述的方法,其中,蛋白质含有1个以上的[1]中定义的ppr基序(mn)。

106、【发明的效果】

107、根据本发明,可以提供能够与对象dna碱基结合的ppr基序和含有其的蛋白质。通过配置多个ppr基序,可以提供能够与具有任意序列或长度的靶标dna结合的蛋白质。

108、根据本发明,能够预测、鉴定任意ppr蛋白质的靶标dna,另外反过来能够预测、鉴定与任意dna结合的ppr蛋白质。通过预测靶标dna序列,明确了该基因的实质,并且提高了能够利用的可能性。此外,根据本发明,对于产业上有用的ppr蛋白质基因,能够基于其靶标dna序列的差异来检测具有各种氨基酸多态性的同源基因的功能性。

109、此外,根据本发明,还可以提供利用ppr基序的新的dna切割酶,即,可以在由本发明提供的ppr基序或ppr蛋白质上连结功能性区域蛋白质,制备含有对特定核酸序列具有结合活性且具有特定功能性的蛋白质的复合体。

110、作为可以在本发明中应用的功能性区域,是指能够赋予各种功能中的dna的切割、转录、复制、修复、合成、修饰等任意功能的区域。通过调整作为本发明特征的ppr基序的序列、确定作为靶标的dna的碱基序列,能够将几乎所有的dna序列作为靶标来利用,使用该靶标,能够利用dna的切割、转录、复制、修复、合成、修饰等功能性区域所具有的功能来实现基因组编辑。

111、例如,在功能性区域具有dna的切割功能的情况下,可提供将本技术发明中制备的ppr蛋白质部分与dna的切割区域连结而成的复合体。这样的复合体可以作为人工dna切割酶发挥功能,在利用ppr蛋白质部分识别作为靶标的dna的碱基序列后,利用dna的切割区域对dna进行切割。在功能性区域具有转录调控功能的情况下,可提供将本技术发明中制备的ppr蛋白质部分与dna的转录调控区域连结而成的复合体。这样的复合体可以作为人工转录调控因子发挥功能,在利用ppr蛋白质部分识别作为靶标的dna的碱基序列后,促进目的dna的转录。

112、此外,根据本发明,还能够用于将上述复合体输送到生物体内并使其发挥功能的方法、使用编码由本发明得到的蛋白质的核酸序列(dna、rna)的转化体的制作、或者在生物(细胞、组织、个体)中的各种情况下的特异性改造、调控和功能的赋予。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1