预测蛋白质间相互作用的方法

文档序号:6417219阅读:256来源:国知局
专利名称:预测蛋白质间相互作用的方法
技术领域
本发明涉及蛋白质间相互作用的预测,涉及预测的方法及装置,以及用该方法和该装置而得到的蛋白质。
背景技术
许多蛋白质与其它蛋白质或相同蛋白质相互作用的同时发挥其功能。阐明蛋白质间的相互作用在医药品的开发和农业中的品种改良等方面很重要。特别是随着包括病原微生物的各种生物基因组解析和cDNA解析的进展,新发现的功能未知基因和其编码的蛋白质的数目急速增加。若能阐明蛋白质间的相互作用,也许能对那些功能未知的蛋白质进行功能预测。
以阐明蛋白质间的相互作用为目的,对于某一蛋白质来讲,为了寻找与其相互作用的蛋白质所采取的方法主要为双杂交法(two-hybrid)(Field,S.The two-hybrid system to detectprotein-protein interaction.METHODSA Companion to Meth.Enzymol.,5,116-124,1993)。但是,双杂交法是探索性的实验手段,操作烦琐,耗时,能够得到的蛋白质数常意想不到的少。另外,该方法的缺点是结果对所使用的cDNA文库的质量有依赖性。也就是说,对于某一蛋白质来说,所伴随的危险是与其相互作用的蛋白质的基因序列不包含在所使用的cDNA文库内。
另一方面也可采用这样的方法由于在基因组解析和cDNA解析的基础上丰富了蛋白质数据库,所以可以将细胞内的复合体进行直接MALDL-TOF质谱,在蛋白质数据库中搜索其氨基酸序列的片段信息(Yates,JR 3rd,J.Mass.Spectrom,33,1-19,1998;Hunphery-Smith,I.et al.,Electrophoresis,18,1217-1242;Kaufmann,R.,1995,J.Biotechnol.,41,155-175,1997)。但是由于该方法中可得到复合体(Complex)构成蛋白质的信息而得不到蛋白质间相互作用的信息,所以有必要对哪个蛋白质与哪个蛋白质间的相互作用进行实验确认。

发明内容
本发明的一个实施方案是蛋白质间相互作用的预测方法,是预测与特定的蛋白质或多肽(A)相互作用的蛋白质或多肽(B)的方法,其特征在于,(1)将A的氨基酸序列分解成某种长度的多个寡肽作为序列信息;(2)在蛋白质或多肽的氨基酸序列的数据库中检索具有上述各寡肽的氨基酸序列的蛋白质或多肽(C),或者检索具有与上述寡肽的氨基酸序列相同氨基酸序列的蛋白质或多肽(D);(3)对上述A与检索出的C或D间的氨基酸序列进行局部排列;(4)以根据局部排列的结果、及蛋白质或多肽的氨基酸序列数据库中氨基酸频率和/或寡肽的频率计算出的数值为指标,评价所检测出的C和/或D为与A相互作用的蛋白质或多肽(B)。
本发明的一个实施方案是,上述预测方法中寡肽的氨基酸序列的长度为4~15个氨基酸。
本发明的另一实施方案是记录介质,它搭载了实施预测与特定的蛋白质或多肽(A)相互作用的蛋白质或多肽(B)的方法的程序,是以至少具备以下(a)~(f)手段为特征的搭载蛋白质间相互作用预测程序的记录介质(a)输入、存储A的氨基酸序列信息的手段;(b)将该信息分解成某种长度的多个寡肽作为序列信息的手段和存储所得序列信息的手段;(c)存储输入的蛋白质数据库的手段;(d)调取所存储的蛋白质数据库,检索出具有上述寡肽的氨基酸序列的蛋白质或多肽(C)或者具有与上述寡肽的氨基酸序列相同氨基酸序列的蛋白质或多肽(D)的手段,和存储、计算检索结果的手段;(e)在上述A与检索出的C或D间进行局部排列的手段,和存储、计算其结果的手段;(f)得到前述局部排列的结果值以及从蛋白质数据库得到的氨基酸频率和/或寡肽频率的结果值,由这些结果值提示用于预测蛋白质间相互作用的指标的手段,以及存储、表示其结果、检索出与A相互作用的B的手段。
本发明的一实施方案是搭载上述(a)~(f)手段的记录介质至少具备选自下面(g)~(l)的一个手段(g)所检索出的B为复数时,以由局部排列的结果值及蛋白质数据库中氨基酸频率和/或寡肽的频率的结果值计算出的指标为基础,在所检索出的复数B间进行蛋白质间相互作用强度的顺序排列的手段及存储、表示其结果的手段;(h)通过局部排列,在上述A与所检索出的B间的氨基酸部分序列间进行排列时,表示该A和B的氨基酸序列全长,表示所排列的部分序列在全长上什么位置的手段;(i)当上述A或检索出的B的立体结构已知时,或者用同源性模拟制作立体结构模型时,计算其立体结构模型、在其立体结构上通过局部排列表示该A和B间所排列的氨基酸部分序列的结构的手段;(j)为了缩小检索范围将蛋白质数据库中的蛋白质进行分类、存储的手段;(k)将蛋白质数据库中的各蛋白质作为上述A顺次输入的手段;(l)存储基因组数据库的手段。
本发明的一实施方案是蛋白质间相互作用的预测装置,它具备搭载上述记录介质的手段。
本发明的一实施方案是确定具有相互作用的蛋白质或多肽的特定方法,它通过上述预测方法或预测装置得到预测与特定的蛋白质或多肽(A)相互作用的蛋白质或多肽(B),然后通过实验确认A与B间的相互作用。
再有,本发明的一实施方案是用该特定方法特定出的蛋白质或多肽。
本发明的一实施方案是利用上述预测方法或预测装置,筛选具有调节特定的蛋白质或多肽(A)与预测的与该A相互作用的蛋白质或多肽(B)间的蛋白质间相互作用功能的化合物的方法。
再有,本发明的一实施方案是用该种筛选方法而得到新型化合物,以及以所得化合物的信息为基础进行药物设计而能得到的具有调整A与B间蛋白质间相互作用功能的新型化合物。
本发明的一实施方案是根据本发明而得到的具有序列表的序列号1所示的氨基酸序列的寡肽,所述寡肽具有调整ベロ毒素2(VTII)与Bcl-2间相互作用的功能;或者是具有与该寡肽的氨基酸序列相同氨基酸序列的,并具有调整VTII与Bcl-2间相互作用的功能的寡肽;或者是包含其中任一种寡肽、并具有调整VTII与Bcl-2间相互作用的功能的多肽。
另外,本发明的一实施方案是抗细胞死亡的试剂,它含有具有序列表中序列1所示的氨基酸序列的寡肽。
本发明的一实施方案是利用上述寡肽和/或多肽筛选具有调整VTII与Bcl-2间相互作用的功能的化合物的方法。
本发明的一实施方案是寡核苷酸序列的确定方法,其特征在于,应用上述预测方法或预测装置编码,该寡核苷酸编码与特定的蛋白质或多肽(A)与预测的与该A相互作用的蛋白质或多肽(B)的蛋白质间相互作用相关的寡肽。
本发明的一实施方案是来源于人的蛋白质组群,它是通过上述预测方法或预测装置而得到的,预测有蛋白质间相互作用。另外,本发明的一实施方案是蛋白质组合的筛选方法,它是从上面的蛋白质组群中以可能与疾病相关的已知蛋白质的信息为基础进行筛选,筛选出与疾病相关的具有蛋白质间相互作用的蛋白质组合。再者,本发明的一实施方案是用该方法得到的与疾病相关的具有蛋白质间相互作用的蛋白质组群。
本发明的一实施方案是筛选化合物的方法,它是从上面得到的与疾病相关的具有蛋白质间相互作用的蛋白质组群中再筛选出调整某种组合和/或两个蛋白质相互作用的化合物。再者,本发明的一实施方案是用筛选调整该相互作用的化合物的方法所得到的化合物。
本发明的一实施方案是蛋白质加工部位的预测方法,它是应用上述预测方法或预测装置通过预测特定的蛋白质与酶切该蛋白质的酶的蛋白质间相互作用而进行。
另外,本发明的一实施方案是多肽,它所具有的预测的氨基酸序列包括用上述预测蛋白质加工部位的方法得到的蛋白质加工部位和/或与该加工部位相同的部分序列。
附图简述

图1中(a)表示来源于ベロ毒素2的氨基末端的20个残基;(b)和(c)分别表示以由这20个残基构成的氨基酸序列为基础在程序上作为序列信息分解得到的氨基酸长5个和6个的寡肽。
图2表示以ベロ毒素2来源的氨基末端的13个残基的序列为基础在程序上作为序列信息分解得到的氨基酸长5个的寡肽和具有该寡肽的氨基酸序列的人工蛋白质。
图3表示通过局部排列而得到的ベロ毒素2与人β肾上腺素能受体激酶2(ARK2)共有的寡肽。
图4的(a)表示大肠杆菌基因组中各氨基酸的频率,(b)表示组成比率。
图5是手段的构成示意图。
图6表示ベロ毒素2来源的寡肽,与人的细胞死亡相关的蛋白质所具有的寡肽的氨基酸序列,和具有该氨基酸序列的与人的细胞死亡相关的蛋白质。
图7表示通过局部排列ベロ毒素2(VTII)与Bcl-2共有的寡肽而得到的结果。
图8表示通过局部排列ベロ毒素2(VTII)与Bcl-xL共有的寡肽而得到的结果。
图9表示通过局部排列ベロ毒素2(VTII)与MCL-1共有的寡肽而得到的结果。
图10表示通过局部排列ベロ毒素1(VTI)与Bcl-2(a)或Bcl-xL(b)共有的寡肽而得到的结果。
图11是一电泳图,它表示应用Hep G2细胞和B10细胞实验性确认ベロ毒素1(VTI)与Bcl-2不相互作用[(b)的左图]、ベロ毒素2(VTII)与Bcl-2相互作用[(a)和(b)的右图]的结果。图中Bcl-2IPs及VTII IPs分别表示用抗Bcl-2抗体和抗VTII抗体进行免疫沉降。另外,(a)的左图表示应用抗Bcl-2抗体进行的蛋白质印迹结果(Bcl-2 WB),(a)的右图表示用抗VTII抗体进行的蛋白质印迹结果(VTIIWB)。另外,(b)是让ベロ毒素1(VTI)(左图)或ベロ毒素2(VTII)(右图)与B10细胞作用,分别应用抗VTI抗体及抗VTII抗体对细胞内各级分来源的蛋白质进行检测的电泳结果图。
图12表示ベロ毒素2(VTII)与Bcl-2的局部排列在什么位置相对应。
图13表示在Bcl-xL的立体结构上用金属丝模型表示与ベロ毒素2(VTII)与其部分序列的相同部分。
图14表示在同源性模拟出的ベロ毒素2的立体结构上用金属丝模型表示Bcl-xL与其部分氨基酸序列间的相同部分。
图15表示ベロ毒素2(VTII)与Bcl-2间共有的寡肽NWGRI对VTII诱导的细胞死亡的NWGRI浓度依赖性抑制。
图16表示通过局部排列人辅助性T细胞表面蛋白质CD4与HIV1病毒表面蛋白质fp120的共有寡肽而得到的结果。(a)表示CD4与gp120的共有寡肽。(b)表示CD4与gp120局部同源性高的区域的氨基酸序列。
图17表示通过局部排列与线虫的细胞死亡相关的蛋白质CED-4与CED-4结合的MAC-1蛋白质间共有的寡肽而得到的结果。
图18表示通过局部排列淀粉样前体蛋白(プレカ一サ一プロティン)(APP)与酶切该蛋白的酶BASE间的共有寡肽而得到的结果。
图19表示通过局部排列弗林前体蛋白质(furin-pre)与フォンビルブラント因子前体蛋白质(VWF-Pre)间的共有寡肽而得到的结果。(a)表示二蛋白质共有的寡肽。(b)表示二蛋白质间局部同源性高的区域的氨基酸序列。
图20表示通过局部排列淀粉样前体蛋白(APP)与认为与该蛋白的加工相关的蛋白质PC7间共有的寡肽而得到的结果。图中=表示预测可进行酶切的部位。
符号的简单说明a输入手段b寡肽分解/存储手段c存储手段d检索/存储手段e局部排列实施/存储手段f频率计算/存储显示手段g排序/存储显示手段h位置显示手段i立体结构计算/存储显示手段l蛋白质分类/存储手段k逐级输入手段l存储手段m键盘n调控手段o输出手段实施发明的最佳方式以下针对本发明的思想、方法、搭载与该方法相关的程序的记录介质、及发挥其功能的装置、以及通过该方法及该装置而得到的蛋白质或多肽进一步详细说明发明的实施方式。以下的详细说明为例示,仅为了进行说明,对本发明没有任何限定。
另外,本说明书中使用的技术及科学用语没有其它定义时,具有有本发明所属技术领域中常规知识的人员普通理解的意思。本说明书中参照业内人士已知的各种方法。公开所引用的众所周知的方法的刊物等资料通过其引用将其全体完全记载于本说明书中。
本发明的实施方案之一蛋白质间相互作用的预测方法,基于以下考虑可以立足。即,蛋白质是由20种氨基酸残基的序列构成的,其排列并非随机。因而人们认为任何生物种中,作为蛋白质部分序列的寡肽在生命活动中起着某些作用。
例如一般认为某种酶的一部分的寡肽起着识别基质的作用。另外,认为其它蛋白质中存在对于与其它蛋白质的相互作用起着重要作用的寡肽。这样就有必要从寡肽水平考察某蛋白质的功能或相互作用。再者,从寡肽的频率这一观点来看的话,一生物中其基因组所编码的全部蛋白质中某寡肽出现的频率不均一。各种蛋白质中有高频率出现的寡肽和仅稀少出现的。其中,低频率出现的寡肽是特异性存在于每个蛋白质中寡肽的可能性高,考虑能决定该蛋白质的特性和功能。
另一方面,蛋白质相互作用是指进行生命活动之外相互作用的蛋白质间协同执行一种功能。考虑一种功能对应一种寡肽以发挥其作用的话,相互作用的二种蛋白质为相同的寡肽或者共有相同的寡肽。另外考虑即使共有的寡肽以外的部分中,两个蛋白质也存在有相同序列结构的部分。
作为分析两种蛋白质的同源性的类似检索方法的一手法,已知有排列(alignment)比较两蛋白质的一次序列的方法(金久 实,グノム情报ヘの招待,共立出版株式会社,93-104,1996)。这种序列排列有全局排列和局部排列的区别,全局排列是排列所有序列,局部排列是只将类似性高的部分分别从各序列中取出在局部区域进行排列。任何排列都是尽可能阐明所比较的二者或以上数目的序列的关系的排列。该排列中存在依赖于序列长度的多种组合。作为想让该种组合最适化的方法有动态编程法。通过以动态编程的原理为基础的Smith-Waterman法(Smith,TF and Waterman,MS,J.Mol.Biol.147,195-197,1981)得到关于序列组合最适化的评价值,应用该同源性分值(以下简称分值)可评价两蛋白质的同源性。所比较的蛋白质间的分值越高这些蛋白质的同源性越高。进行局部排列时,应用动态编程探索序列组合时设定分值阈、进行局部序列的结合最适化(例如Gotoh,O.,Pattern matching of biologicalsequences with limited storage,Comput.Appl.Biosci.3,17-20,1987)。通过应用这种局部排列的方法,可在两蛋白质间共有寡肽以外的部分中检索相同的结构。
也许蛋白质间的相互作用是进化过程中保持下来的。如后述的大肠杆菌的ベロ毒素与Bcl-2,超越种相同的功能保存于蛋白质间的相互作用,因为能够保存下来,所以考虑存在结构上类似的氨基酸序列。再者,后述的淀粉样前体蛋白和冯威利布兰托因子[Von WillebrandFactor(VWF)]前体蛋白的加工过程中,蛋白质分解这一功能保存于蛋白质间的相互作用中,所以也考虑存在结构上也类似的氨基酸序列。
依据基于上述思想所开创出的蛋白质间相互作用的预测方法,依照在计算机上预测出的结果,以与由用分子生物生物学的例举主义所得事实堆积而得到的生命像不同的综合的作用相互关系为基础,可预想出向来只知道单独功能的网络,描绘出新的生命像。
此外,不仅可预测一种生物体内而且可预测两种生物间蛋白质的相互作用,例如人与其病原微生物间的蛋白质相互作用,与到目前为止尚未知的病原性的阐明相关。
具体而言,上述蛋白质间相互作用预测方法的实施方案之一是针对通过基因组分析和cDNA分析而得到的功能未知的蛋白质,或者针对功能已知的蛋白质,从蛋白质数据库等中抽出与其相互作用的蛋白质进行预测的方法,例如以以下步骤(1)~(4)为构成元素。
步骤(1)中将特定的蛋白质或多肽的氨基酸序列分解为某种长度的多个寡肽作为序列信息,(2)中寻求共有该寡肽的蛋白质或多肽,(3)中应用局部排列评价这些蛋白质间部分结构的同源性,(4)中进一步从出现频率来评价共有的寡肽。
以下详细说明各步骤。
步骤(1)针对通过基因组分析和cDNA分析而得到的功能未知的蛋白质或多肽,或者针对功能已知的蛋白质或多肽等某种特定蛋白质或多肽(A),从其氨基末端开始到羧基末端顺次每挪动一个氨基酸残基的同时将其氨基酸序列分解为寡肽,作为序列信息。
例如图1是将大肠杆菌0157H7ベロ毒素2(VTII)的氨基末端开始最初的20个残基[图1(a)]分解为氨基酸长5个的寡肽作为序列信息[图1(b)]。以下,将氨基酸和寡肽进行氨基酸的文字表述。
实施步骤(1)时,作为序列信息分解的寡肽的氨基酸长4~15个,优选4~8个为宜。寡肽的长度越长,其寡肽的特异性越高,如实施例2所示。
步骤(2)该步骤中,在蛋白质或多肽的氨基酸序列数据库中检索具有(1)中分解得到的寡肽的氨基酸序列的蛋白质或多肽(C),或者检索具有与该寡肽相同氨基酸序列的蛋白质或多肽(D)。根据所用寡肽的不同,检索出的蛋白质或多肽C或D有时存在多个,有时存在1个。
例如图2是针对从大肠杆菌0157H7的ベロ毒素2(VTII)氨基末端开始的13个残基分解出的9种5个氨基酸的寡肽,在蛋白质数据库SWISS-PROT Version 35中检索持有该寡肽的蛋白质。由于ベロ毒素2引起人的食物中毒和肾脏损害,所以以人的蛋白质为对象来调查与其相互作用蛋白质。例如,得到的检索结构是具有图2的第2项所示寡肽KCILF的人蛋白质为β肾上腺素能受体激酶2[BETA-ADRENERGIC RECEPTOR KINASE 2(ARK2 HUMAN)]。
步骤(3)对上述A与(2)中检索得到的C或D间进行局部排列。
例如图3表示ベロ毒素2(VTII)与β肾上腺素能受体激酶2(ARK2)间局部排列的结果。
步骤(4)根据(3)中局部排列的结果,若上述A与检索出的C和/或D间的部分序列有同源性,预测C和/或D为与A相互作用的蛋白质或多肽B。再对A与检索出的C和/或D间共有的寡肽,在蛋白质数据库中计算氨基酸的频率和/或寡肽的频率,评价该寡肽在蛋白质数据库中、或者在具有A或检索出的C和/或D的生物的基因组中的特异性,若特异性高则预测C和/或D为与A相互作用的蛋白质或多肽B的准确度更高。
例如,上述寡肽KCILF在由图4所示的大肠杆菌基因组编码的总蛋白质中氨基酸的频率[图4(a)]计算出的组成比[图4(b)]而计算出其特异性指标为1284.86×10-10,特异性高。同时计算出在大肠杆菌基因组中特异性低的氨基酸序列长5个的寡肽为LLLLL,其特异性指标为136344.34×10-10。另外,特异性最高的氨基酸序列长5个的寡肽为CCCCC,其特异性的指标为2.208×10-10,但该寡肽不存在于大肠杆菌基因组中。因此可以评价预测ベロ毒素2与β肾上腺素能受体激酶2相互作用,从特异性指标的值来看其准确度高。
进一步确认蛋白质间相互作用可以所得相互作用的蛋白质的信息为基础,克隆、表达其基因,进行实验性确认。例如,如后面的实施例中描述的,通过上述预测方法或搭载该预测方法的程序的预测装置而预测出的相互作用的VTII与Bcl-2间的相互作用可应用表达Bcl-2的细胞和不表达Bcl-2的细胞,用VTII处理后,使用抗Bcl-2抗体及抗VTII抗体进行免疫共沉降,从而进行实验性确认。此外,例如用众所周知的方法将突变等导入预测为相互作用部位的寡肽的氨基酸序列中,通过验证相互作用不再出现而确定该寡肽为重要的相互作用部位。实验性的相互作用的确认方法并不限定于上述方法,只要是业内人士技术范围内运用的方法均可应用。
另外,预测为相互作用部位的寡肽,若确认它阻止蛋白质间相互作用、抑制该蛋白质的功能和作用,那么这样的寡肽可作为该蛋白质作用的抑制剂使用。例如如后面的实施例所述,预测为VTII与Bcl-2的相互作用部位的寡肽NWGRI抑制VTII造成的细胞死亡,可作为抗细胞死亡剂使用。这样的低分子化合物可作为医药品和试剂利用。
下面对搭载有上述蛋白质间相互作用预测方法的程序的记录介质及装置进行说明。该记录介质及装置至少备有以下(a)~(f)的手段,如图5所示的构成例。
输入手段(a)输入特定的蛋白质或多肽(A)的氨基酸序列信息的手段,A为通过基因组分析和cDNA分析而得到的功能未知的蛋白质或多肽,或是功能已知的蛋白质或多肽等。
寡肽分析/存储手段(b)将用输入手段(a)输入的氨基酸序列信息从氨基末端向羧基末端顺次每挪动1个氨基酸残基将其分解为某种长度的多个寡肽作为序列信息的手段和存储其结果的手段。
存储手段(c)存储与蛋白质或多肽相关的输入的数据库的手段。
检索/存储手段(d)该取存储手段(c)中存储的与蛋白质或多肽相关的数据库,检索具有上述寡肽的氨基酸序列的蛋白质或多肽(C)、或检索具有与上述寡肽的氨基酸序列相同氨基酸序列的蛋白质或多肽(D)的手段和存储其结果的手段。
局部排列实施/存储手段(e)在上述A与检索出的C和/或D间进行局部排列的手段和存储其结果的手段。
频率计算/存储显示手段(f)从上面局部排列的结果及蛋白质或多肽的数据库进行氨基酸频率和/或寡肽频率的计算,根据其结果计算预测蛋白质间相互作用的指标的手段,存储显示其结果的手段。
此外上述预测蛋白质间相互作用的程序中可备有适当组合以下(g)~(l)的手段。
排序/存储显示手段(g)检索出的B为复数时在这些B之间,以局部排列的结果及从蛋白质数据库计算氨基酸频率和/或寡肽的频率所得结果为指标进行排序,具有该排序功能和存储、显示其结果功能的手段。
位置显示手段(h)A与所检测出的B间的氨基酸部分序列间进行排列时,表示A与B氨基酸序列全长的手段,表示排列的部分位于全长上什么手段。
立体结构计算/存储显示手段(i)A或检索出的B的立体结构已知时,或用同源模拟制作立体结构模型时,计算其立体结构模型,在其立体结构模型上表示A与B间排列出的氨基酸部分序列的结构的手段。
蛋白质分类/存储手段(j)为了缩小检索范围,按物理性质、功能和/或来源对蛋白质或多肽数据库中的蛋白质或多肽进行分类,具有这种分类、存储功能的手段。
依次输入手段(k)将蛋白质或多肽数据库中的各蛋白质或多肽作为A依次输入的手段。
存储手段(l)具有存储基因组数据库功能的手段。
以上手段搭载于适当的记录介质上供给使用。
另外作为使用的一实施方案是作为将这些手段作为程序选择性搭载于装置内记录介质上的装置供给。该预测蛋白质间相互作用的装置,如下运作(参照图5)。
应用寡肽分解/存储手段(b)将通过输入手段(a)输入的功能未知的蛋白质或多肽,或功能已知的蛋白质或多肽等某特定的蛋白质或多肽(A)的氨基酸序列信息分解成某长度的多个寡肽,存储这样的寡肽。此时A的输入可依照所希望的,从存储与蛋白质或多肽相关的输入的数据库的手段(c)开始,通过依次输入手段(k)进行依次输入。应用与手段(c)相对应的检索/存储手段(d)对前面存储的寡肽的氨基酸序列进行检索,检索出具有该寡肽的氨基酸序列的蛋白质或多肽(c),或者检索出具有与该寡肽的氨基酸序列相同氨基酸序列的蛋白质或多肽(D),并存储。检索时,通过蛋白质分类/存储手段(j)将数据库中的蛋白质或多肽进行分类缩小检索范围,从中进行检索。通过局部排列实施/存储手段(e)对上面A和检索出的C或D进行局部排列,存储其结果。接着,通过频率计算/存储显示手段(f)从手段(c)所存储的数据库中计算氨基酸的频率和/或寡肽的频率,根据其结果及前面所得局部排列的结果计算用于蛋白质间相互作用预测的指标,存储之。然后,在装置的画面上显示得到的预测与A相互作用的蛋白质或多肽C或D,以及这些蛋白质间共有的寡肽的氨基酸序列,该寡肽的频率以及用于预测蛋白质间相互作用的指标等。根据表示出的结果,依据用于预测蛋白质间相互作用的指标,可以得到与A具有相互作用的蛋白质或多肽(B)。另外,可以用手段(c)存储的蛋白质功能信息和来自存储根据意愿设置的基因组数据库的手段(l)的基因信息等表示B。所检索出的B为复数时,通过排列/存储显示手段(g),在这些B间,从与A相互作用特异性高的顺序开始进行排序。此外,用位置显示手段(h)表示检索出的B与A间进行排列的氨基酸的部分序列位于该A和B全长氨基酸的哪部分。再通过立体结构计算/存储显示手段(i)表示该A和B的立体结构,也可显示A和B间进行排列的部分。除了这些手段(a)~(l)以外,该装置也可备有如图5所示的键盘(m)及调控手段(n)、输出手段(o)等。
上述蛋白质间相互作用的预测方法或预测装置还可用于筛选调整特定的蛋白质或多肽(A)与蛋白质或多肽(B)间的蛋白质间相互作用的新型化合物的方法。调整上述蛋白质或多肽(A)与蛋白质或多肽(B)间的蛋白质间相互作用的新型化合物的筛选方法,依据关键的寡肽的氨基酸序列信息进行。筛选出的寡肽的氨基酸序列、或其相同寡肽的氨基酸序列、或包括其氨基酸序列或相同氨基酸序列的多肽,有可能发挥调整A与B间的蛋白质间相互作用的功能。例如与A相对应、具有受体功能的B存在时,通过上述方法筛选出的寡肽对A与B的蛋白质间相互作用有拮抗性的可能性高。又例如,在A与B相互作用时活化的情况下,通过上述方法筛选出的寡肽作为激动剂发挥功能的可能性高。
具体而言,如下面的实施例中详细所述的,由本发明预测产生相互作用的且实验确认其相互作用的VTII与Bcl-2共有的记载于序列表的序列号1中的寡肽NWGRI阻碍VTII与Bcl-2相互作用引起的复合体形成,还实验验证了它抑制VTII引发的细胞死亡诱导作用。这些表明,NWGRI寡肽,可作为调节由VTII引起的细胞死亡诱导相关疾病的药剂使用,例如可作为有VTII的大肠杆菌O 157引发的疾病的治疗药物使用,更具体而言,可作为抗细胞死亡试剂使用。另外,具有与该氨基酸序列相同氨基酸序列的寡肽,具有调整VTII与Bcl-2间相互作用功能的寡肽,或者含有该氨基酸序列或与该氨基酸序列相同氨基酸序列的多肽、具有调整VTII与Bcl-2间相互作用功能的多肽也可作为调节VTII引发的细胞死亡诱导相关疾病的药剂使用。此外可通过药物设计或适当应用众所周知的筛选方法,利用这些寡肽和多肽的具有调整VTII与Bcl-2间相互作用功能的新型化合物。
如此,以通过本发明的实施方案之一的上述筛选方法而得到的寡肽的信息为依据进行药物设计而得到的新型化合物,具有调整特定的蛋白质或多肽(A)与蛋白质或多肽(B)间的蛋白质间相互作用的功能。也就是说,通过众所周知的药物设计手法,经预测上述A与B间的蛋白质间相互作用而构筑和上述筛选方法而得到的寡肽的衍生物及具有与该寡肽相同构造的低分子化合物。
上述预测方法作为编码与特定蛋白质或多肽(A)与蛋白质或多肽(B)间的蛋白质间相互作用相关的寡肽的寡核苷酸序列确定方法极其有用,依据该信息,可应用置换、缺失、附加、插入或诱导突变等众所周知的方法,得到有用的寡核苷酸。所得寡核苷酸可用于得到在基因水平调节上述A与B间的蛋白质间相互作用的化合物。例如,可用于构建以抑制蛋白质间相互作用为目的的反义寡核苷酸等。另外,所得寡核苷酸在蛋白质间相互作用相关的疾病中可用于诊断。
另外,本发明的一实施方案是应用蛋白质间相互作用的预测方法或预测装置而得到的预测有蛋白质间相互作用的来源于人的蛋白质组群。该蛋白质组群可目录化及数据库化后进行提供。依据可能与疾病相关的已知蛋白质的信息,通过从该具有蛋白质间相互作用的蛋白质组群中筛选与疾病相关的具有蛋白质间相互作用的蛋白质,可得到与疾病相关的具有蛋白质间相互作用的蛋白质组群。可目录化及数据库化后提供它们。这些蛋白质组合可作为治疗或预防疾病的药剂或作为获得药剂的手段有用。例如,利用所得蛋白质的组合,应用众所周知的筛选方法,可探索能调整两种蛋白质间相互作用的化合物。
具有蛋白质间相互作用的两种蛋白质的组合中,尤其是一方蛋白质为具有蛋白质加工功能的酶,酶切其它蛋白质时,可通过上述蛋白质间相互作用的预测方法或预测装置进行所酶切的蛋白质加工部位的预测。
作为具体例,如下面实施例所示的那样,可预测淀粉样前体蛋白与与其加工相关的酶间的相互作用,以及冯威利布兰托因子前体蛋白与与其加工相关的酶furin间的相互作用。也就是说,上述蛋白质间相互作用的预测方法或预测装置,可以预测前体蛋白被酶切作为成熟蛋白质发挥功能时的酶切部位。如此通过预测蛋白质间的相互作用,可得到尚不知道的与疾病相关的具有蛋白质加工作用的酶以及由该酶所酶切的蛋白质。
实施例以下参照示例的实施状态对本发明的优点、特征及可能的应用进行更详细地描述,但本发明不限定于以下实施例。另外,本实施例中应用SWISS-PROT Version 35作蛋白质数据库,但也可应用其它蛋白质数据库。
(实施例1)图1作为步骤(1)的实施例,是将大肠杆菌O 157H7的ベロ毒素2(VTII)氨基末端开始最初的20个残基[图1(a)]分解成氨基酸序列长5个的寡肽[图1(b)]。图1(c)是将从ベロ毒素2(VTII)的氨基末端开始的最初20个残基分解成氨基酸序列长6个的寡肽。
(实施例2)在上述蛋白质间相互作用预测方法的步骤(4)中,应用由从蛋白质或多肽的数据库得到的氨基酸频率和寡肽频率计算出的数值作为蛋白质或多肽间相互作用的预测指标。这里作为实施例列举了寡肽的特异性,它是由图4所示的大肠杆菌基因组编码的蛋白质中的氨基酸频率计算出的。由20种氨基酸在大肠杆菌编码的全蛋白质中出现的频率[图4(a)]得出的各氨基酸ai的组成比率Ai如图4(b)所示。
求特异性的寡肽为a1a2a3a4a5时,该寡肽的特异性以A1×A2×A3×A4×A5计算。例如,寡肽为KCILF时,计算为4.406610×1.170608×6.004305×10.639652×3.898962×10-10。另外,寡肽LLLLL的特异性计算为136344.34×10-10,寡肽CCCCC的特异性为2.20×10-10。
该实施例中特异性数字越小特异性越高。氨基酸序列长为5个寡肽中特异性最高的寡肽为CCCCC,该寡肽在大肠杆菌基因组编码的全蛋白质中未表达。相反特异性最低的寡肽为LLLLL。
步骤(1)中将蛋白质或多肽(A)分解为寡肽时,寡肽的长度越长,其寡肽的特异性越高。
(实施例3)上述蛋白质间相互作用预测方法的步骤(4)中,应用局部排列的结果作为预测蛋白质或多肽间相互作用的指标,但这里作为实施例列举使用Gotoh的方法(Gotoh,O.,Pattern matching of biologicalsequences with limited storage,Comput.Appl.Biosci.3,17-20,1987)进行部分序列排列的分数的情况。在下面的本实施例中,分值达25.0以上时,蛋白质或多肽(A)与蛋白质或多肽(B)间氨基酸部分序列进行排列(相同)。
蛋白质或多肽(A)与蛋白质或多肽(B)间m个氨基酸部分序列被排列,其分值为Si(1≤i≤m),B的氨基酸序列的长度为LB。将由该局部排列的结果计算出的预测A与B间相互作用的指标定义为sum(Si)/LB。该指标越高相互作用越强。
(实施例4)(VTII与Bcl-2间相互作用的预测)大肠杆菌O 157H7的ベロ毒素2(VTII)引发人食物中素和肾脏损害,但其作用机制还不十分清楚(Sandvig,K.,et al.,Exp.Med.Biol.412,225-232,1997;Paton,JC.,and Paton,AW.,Clin.Microbiol.Rev.11,450-479,1998)。另外,由于该蛋白质是有毒性的蛋白质,所以与细胞死亡相关的人的蛋白质成为与该蛋白质相互作用的蛋白质。因此,从蛋白质数据库SWISS-PROT version 35中将检索范围缩窄到与细胞死亡相关的人蛋白质,搜索可能与该蛋白质相互作用的蛋白质,确认它们间实际上进行相互作用的例子如下所示。
ベロ毒素2的氯基酸序列长5个的寡肽中,与细胞死亡相关的人蛋白质共有的是,如图6中所示的检索结果,SWISS-PROT version 35中有LCLLL、QRVAA、EFSGN、NWGRI 4个。(图6中人蛋白质用SWISS-PROTversion 35的蛋白质ID表示),以图4所示的大肠杆菌基因组编码的全蛋白中的氨基酸频率来计算这些寡肽的特异性,LCLLL的特异性为15001.03×10-10,QRVAA、EFSGN、NWGRI的特异性分别为15584.55×10-10、3801.65×10-10、1479.85×10-10。因此这4种寡肽中特异性最高的为NWGRI。
寡肽NWGRI在ベロ毒素2与Bcl-2、Bcl-xL、MCL-1这三种人蛋白质间其有。ベロ毒素2(VTII)与Bcl-2、Bcl-xL、MCL-1间实施局部排列时其结果分别如图7、8、9所示,部分在氨基酸序列上有同源性。然后如实施例3那样,用各局部排列的分值的和除以蛋白质的长度,计算出指标Bcl-2(30.0+27.0+25.0)/239=0.343Bcl-xL(30.0+29.0+27.0)/233=0.369MCL-1(34.0+30.0+28.0+26.0)/350=0.337这3种蛋白质中,由于Bcl-2与Bcl-xL构成同一家族,Bcl-2、Bcl-xL与MCL-1间哪个容易与ベロ毒素2相互作用,依据上述方法中由局部排列而计算出的指标进行判断,得到Bcl-2与Bcl-xL。
大肠杆菌O 157H7的ベロ毒素中除ベロ毒素2之外ベロ毒素I(VTI)作为同种型存在。ベロ毒素1的毒性比ベロ毒素2弱,大约为ベロ毒素2的1/50(Tesh,VL.,et al.,1993,Infect.Immun.61,3392-3402)。蛋白质数据库SWISS-PROT version 35中,ベロ毒素1与氨基酸长5个的寡肽共有的与Q细胞死亡相关的人蛋白质为P2X1_HUMAN,其共有的寡肽为SSTLG。但是,该寡肽SSTLG的特异性用图4所示的大肠杆菌基因组编码的全蛋白质中氨基酸频率计算时为14385.63×10-10,比NWGRI相比特异性约低10倍。
另外,ベロ毒素1中有与ベロ毒素2的氨基酸序列长5个的寡肽NWGRI相对应的寡肽NWGRL,从图4可知其特异性为2622.30×10-10,比NWGRI低。Bcl-2及Bcl-xL与ベロ毒素1共有的氨基酸序列长4个的寡肽NWGR,从NWGRI与NWGRL特异性比较来看,预测Bcl-2及Bcl-xL与ベロ毒素2的相互作用比ベロ毒素1强。另外,由ベロ毒素1与Bcl-2及Bcl-xL间进行局部排列的结果(图10)而计算出的指标分别为(27.0+26.0)/239=0.222、26.0/233=0.112(除NWGR部分以外没有相同的氨基酸部分序列),可以判断毒素1与Bcl-2或Bcl-xL间的相互作用比ベロ毒素2与Bcl-2及Bcl-xL间的相互作用弱很多。
(实施例5)(实验性确认VTII与Bcl-2间相互作用的预测)实施例4中进行的ベロ毒素2与人Bcl-2或Bcl-xL间的相互作用的预测,其准确度高。以该预测结果为基础,实验性验证ベロ毒素2与Bcl-2实际间的相互作用[图11(a)及图11(b)右图]。实验中,让ベロ毒素2(VTII)作用于人肝癌细胞(原本不表达Bcl-2基因)Hep G2及Bcl-2表达载体导入该细胞从而表达Bcl-2的细胞B10,应用抗Bcl-2抗体(Bcl-2 IPs)和抗VTII抗体(VTII IPs)用众所周知的方法进行免疫共沉淀。
图11(a)左图是免疫共沉淀后用抗Bcl-2抗体进行蛋白质印迹分析的结果,图11(a)右图是用抗VTII抗体进行蛋白质印迹分析的结果。从这些图可以确认B10细胞中VTII与Bcl-2的复合体产生免疫共沉淀,即这两种蛋白质间产生相互作用。另外,用ベロ毒素1(VTI)或ベロ毒素2(VTII)作用于B10细胞,应用抗VTI抗体及抗VTII抗体确认从细胞内的哪种级分可以检测出这些蛋白质。线粒体中的Bcl-2对细胞死亡起着非常重要的作用,从线粒体级分中也可检测出ベロ毒素2(VTII)[图11(b)右图]。
另一方面,ベロ毒素1没有显示出与线粒体Bcl-2间的强相互作用,由从线粒体级分中检测不出该蛋白质可以进行实验的证明。其结果示于图11(b)左图。
(实施例6)表示ベロ毒素2(VTII)与Bcl-2的氨基酸序列全长,表示排列的部分序列在全长上什么位置的实施例示于图12中。
(实施例7)Bcl-xL的立体结构是已知的,在蛋白质立体结构数据库PDB中可记录其结构。根据该结构Bcl-xL的立体结构上,根据图8的局部排列的结果,在图13中用粗线表示与ベロ毒素2的部分氨基酸序列相同的部分。
(实施例8)人们认为ベロ毒素2通过切断核糖体RNA的一部分而停止蛋白质的合成,发挥其毒性。切断核糖体RNA的一部分的溶素蛋白的立体结构记录在蛋白质立体结构数据库PDB中,依据其结构进行ベロ毒素2的同源性模拟,在模型立体结构上依照图8局部排列的结果在图14中用粗线表示与Bcl-xL相同的氨基酸部分序列的结构。
(实施例9)(NWGRI对VTII引发的细胞死亡诱导的抑制)以下实验性验证实施例4中出现的VTII与Bcl-2共有的寡肽NWGRI对VTII与Bcl-2间相互作用的调整。首先,在NWGRI寡肽的存在下进行实施例5中使用的表达Bcl-2的B10细胞的抽提物与生物素化的VTII间的复合体形成,通过蛋白质印迹法(Far-Westen blottinganalysis)进行分析。NWGRI寡肽浓度依赖性地阻碍VTII与Bcl-2间的复合体形成。再用0、10、50、100μM的NWGRI寡肽预处理B10细胞,与10ng/ml的VTII一起处理24小时,测定凋亡造成的细胞死亡。用Hoechst 33342/PI(Propidium iodide)按一定的方法对总共约5000个核进行染色,其中引起凋亡的核的比率如图15所示。如图中所示,用VTII单独处理约85%的细胞可因凋亡而引起的细胞死亡,与此相对,通过对NWGRI寡肽预处理,NWGRI寡肽浓度依赖性抑制细胞死亡的诱导。由引可以确认,VTII与Bcl-2共有的寡肽NWGRI,抑制VTII与Bcl-2间的相互作用,由此阻碍复合体形成,结果抑制因VTII造成的细胞死亡诱导。
(实施例10)(CD4/gp120HIV1)人艾滋病病毒HIV1感染辅助性T细胞。已弄清楚,此时病毒表面的蛋白质gp120与辅助性T细胞表面的蛋白质CD4的结合作为其感染细胞的第1阶段是很重要的。本实施例中可用上述预测方法预测的gp120与CD4的结合得到确认。将蛋白质CD4的氨基酸序列分解为长5个的寡肽,在蛋白质数据库中检索顺次具有CD4来源的寡肽的氨基酸序列的蛋白质,将gp120作为共有SLWDQ这一寡肽的蛋白质抽出[图16(a)]。在SWISS-PROT version 35中,寡肽SLWDQ作为人的蛋白质只存在于蛋白质CD4中,在人蛋白质中的频率为1,特异性非常高。此外,除该寡肽以外,存在局部同源性高的区域[图16(b)]。从CD4侧与gp 120结合时该寡肽SLWDQ的直接N末端相邻的氨基酸残基精氨酸(Arg)及67-SFLTKGP-73起着重要的作用(Kwong.PD.et.al,Nature,Vol.398,648-659,1998)。另外,从gp120侧识别CD4时,图16(b)所示同源性高的区域(289-KTIIVQLNETVKINCIRPNNKT-310)的直接N末端的相邻数个氨基酸残基是起重要作用的区域之一(Kwong.PD et.al.,Nature.Vol.398,648-659,1998)。因此可以用上述预测方法预测gp120与CD4的结合是未知的部分。
(实施例11)(CED-4/MAG-1)线虫(Caenorhabditis elegans)(C.elegans)是整个基因组信息明确的最初的多细胞生物。这里以C.elegans为一实施例进行显示。蛋白质CED-4在程序性死亡的控制中起着中心的作用。MAC-1与CED-4结合,是作为抑制细胞死亡的蛋白质而被发现的(Wu et.al.,Development Vol.126,9,2021-2031 1999)。因此,MAC-1与CED-4的结合是已知的,为了验证本发明,检测这两种蛋白质间寡肽的共有性。结果判明MAC-1与CED-4间共有长5个的寡肽FPSVE,本发明得到验证。由C.elegans基因组中氨基酸的频度计算出的该寡肽的指数为5.436。另外,如图17所示,两种蛋白质间有许多相同的部分区域,这提示这些蛋白质的结合性强(上侧的序列为CED-4,下侧的序列为MAC-1)。
(实施例12)(APP/BASE)APP(amyloid precursor protein淀粉样前体蛋白)是阿尔茨海默病的原因蛋白质之一,该蛋白质通过在2个部位被切断而生成成为阿尔茨海默病原因的淀粉样蛋白。最近发现了这2个切断处中切断氨末端侧的酶(BASE)(beta secretase)(VASSAR et.al.,Science,286(5440),735-741,1999)。BASE对APP的酶切意味着这两种蛋白质间存在着相互作用。为了验证本发明,针对APP与BASE两种蛋白质检测其寡肽的共有性。APP与BASE间共有同源性高的5个氨基酸的寡肽WYFDV和WYYEV。寡肽WYFDV在SWISS-PROT version 35中仅存在于作为人蛋白质的蛋白质APP中,另外持有WYYEV的人蛋白质未记录,任一种寡肽的特异性均非常高。通过该结果验证了本发明。图18中显示了两蛋白质间相同的部分区域(上侧序列为APP,下面序列为BASE)。
(实施例13)(furin与冯·威利布兰托因子)furin是细胞内的丝氨酸蛋白酶,与冯·威利布兰托因子(VWF)、白蛋白、补体C3等分泌系统的路径(Pathway)有关。这里列举Furin与VWF间的相互作用作为实施例。VWF是由Furin由前体蛋白经过酶切作为成熟蛋白质发挥功能。这两种蛋白质间的相互作用对于Furin对VWF前体蛋白的酶切是必要的。另外,Furin自身也是Furin的前体蛋白经过酶切形成成熟蛋白质作为蛋白酶发挥功能的。于是为了验证本发明,检测Furin前体蛋白与VWF前体蛋白的寡肽的共有性。两种蛋白质中寡肽HCPPG在Furin前体蛋白处于613-617的位置,在VWF前体蛋白位于1176-1180的位置[图19(a)]。任一位置均在成熟蛋白质的区域内。寡肽HCPPG在SWISS-PROT version 35中作为人蛋白质仅在Furin前体蛋白及VWF前体蛋白中共有,从频率的观点来看特异性非常高。VWF前体蛋白在氨基酸残基763与764间的位置被Furin切断。Furin前体蛋白与VWF前体蛋白间进行局部排列时,在Fruin对VWF前体蛋白进行酶切的位置附近的区域,有与Furin前体蛋白同源性高的部分区域[图19(b)]。也就是说,弄清新型蛋白质是由活性部分基序构成的蛋白酶时,而对应的蛋白进一步在对应的蛋白质中的切断位置不清楚时,可通过本发明进行对应蛋白质的预测,进一步还可进行对应蛋白质中切断位置的预测。
(实施例14)(APP和PC7)APPα是在与淀粉样前体蛋白(amyloid precursor protein)(APP)生成淀粉样蛋白的两个切断部位不同的地方被酶切而生成的肽。最后发现生成APPα的酶切与PC7(proprotein convertasesubtilisin/kexin type 7)相关(Lopez-Perez E et.al.,J.Neurochem.,Vol.73,5,2056-2062,1999)。于是检测两种蛋白质APP与PCT寡肽的共有性,APP与PC7共有同源性高的长6个的寡肽DSDPSG与DSDPNG。寡肽DSDPSG在SWISS-PROT version 35中仅存在于人蛋白质APP中,另外持有DSDPNG的人蛋白质还未记录,任一寡肽的特异性均非常高。通过该结果本发明得到验证。图20中显示了两种蛋白质间相同的部分区域。
图20中APP的687-KLVFFAEDVGS-697的K与L间是生成APPα的切断部位,存在于PC7中的与之相同的部分序列(359-RMPFYAEECAS-369)如图20所示。即本实施例提示依照本发明可以预测与蛋白质的酶切相关的蛋白质。
产业上利用的可能性如以上详细说明的,根据本发明,应用蛋白质数据库可以预测与通过基因组分析和cDNA分析而得到的功能未知的蛋白质、或功能已知的蛋白质相互作用的对应的蛋白质。也就是说,使用近年丰富了的以基因组分析和cDNA分析为依据的蛋白质数据库,可以在计算机上进行在基因组信息明确的一生物体中蛋白质间相互作用的预测。由于在计算机上的预测成为可能,所以不采用象双杂交法那样结果依赖于所使用的cDNA文库的高风险的手法,可以计算机上的预测为依据简便获得预测有相互作用的蛋白质的信息。由于这种预测成为可能,所以可容易地推定与相互作用相关的寡肽的序列,以该信息为基础,新型的具有调整蛋白质间相互作用功能的化合物的药物设计也成为可能。根据本发明,阐明蛋白质间相互作用的实验性可非常效率化,可在生物化学、分子生物学、医药品开发、农业、生物工程学等各种领域内广泛应用。特别是在医药品开发中,预测目前未知的疾病机制成为可能,给生产新的药品提供了可能性。
序列表<110>富士通株式会社(FUJITSU LIMITED)第一制药株式会社(DAIICHI PHARMACEUTICAL CO.,LTD.)<120>预测蛋白质间相互作用的方法<130>GP01-1001<140>PCT/JP01/01846<141>2001-03-09<150>JP P2000-72485<151>2000-03-10<160>1<170>PatentIn Ver.2.1<210>1<211>5<212>PRT<213>来源<400>1Asn Trp Gly Arg Ile1 权利要求
1.寡肽,它具有调整ベロ毒素2(VTII)与Bcl-2间相互作用的功能,具有序列表的序列号1中所示的氨基酸序列。
2.抗细胞死亡剂,它含有具有序列表的序列号1中所示的氨基酸序列的寡肽。
3.寡肽,它具有与权利要求1中记载的寡肽的氨基酸序列相同的氨基酸序列,具有调整VTII与Bcl-2间相互作用的功能。
4.多肽,它是包括权利要求1或3中记载的寡肽的氨基酸序列的多肽,具有调整VTII与Bcl-2间相互作用的功能。
5.化合物的筛选方法,它利用权利要求1或3中记载的寡肽和/或权利要求4中记载的多肽,筛选具有调整VTII与Bcl-2间相互作用功能的化合物。
6.一种预测方法,它是预测与特定的蛋白质或多肽(A)相互作用的蛋白质或多肽(B)的方法,其特征在于,(1)将A的氨基酸序列分解成数个某种长度的寡肽作为序列信息;(2)在蛋白质或多肽的氨基酸序列数据库中检索具有上述各寡肽的氨基酸序列的蛋白质或多肽(C),或者检索具有与上述寡肽的氨基酸序列相同氨基酸序列的蛋白质或多肽(D);(3)对上述A与检索出的C或D间氨基酸序列进行局部排列;(4)将局部排列的分值为25.0以上的上述C或上述D预测为与A相互作用的蛋白质或多肽(B)。
7.权利要求6的预测方法,其中前述寡肽的氨基酸序列的长度为4~15个氨基酸。
8.一种预测装置,是预测与特定的蛋白质或多肽(A)相互作用的蛋白质或多肽(B)的装置,其通过实施权利要求6或7所述的预测方法的程序进行控制,该程序的特征在于至少备有以下(a)~(f)的手段(a)输入、存储A的氨基酸序列信息的手段;(b)将该信息分解成某长度的数个寡肽作为序列信息的手段,及存储其结果的序列信息的手段;(c)存储输入的蛋白质数据库的手段;(d)读取存储的蛋白质数据库,检索出具有上述寡肽的氨基酸序列的蛋白质或多肽(C)、或具有与上述寡肽的氨基酸序列相同氨基酸序列的蛋白质或多肽(D)的手段,及存储、计算其检索结果的手段;(e)在上述A与检索出的C或D间进行局部排列的手段及存储、计算该结果的手段;(f)得到上述局部排列的结果值及蛋白质数据库中氨基酸频率和/或寡肽频率的结果值,根据其结果值提示用于预测蛋白质之间相互作用的指标的手段及存储、显示其结果、检测出与A相互作用的B的手段。
9.权利要求8记载的预测装置,它是一种程序,其特征在于,程序还至少备有以下手段(g)检测出的B为复数时,依据局部排列的结果值及蛋白质数据库中氨基酸频率和/或寡肽频率的结果值计算出的指标,按蛋白质间相互作用的强度在检索出的多个B间进行依次排序的手段,及存储、显示其结果的手段。
10.权利要求8或9记载的预测装置,它是一种程序,其特征在于,程序还至少具备以下手段(h)通过局部排列,在上述A与检测出的B间进行氨基酸部分序列间的排列时,表示该A与B氨基酸序列全长,并且表示排列的部分序列在全长上什么位置的手段。
11.权利要求8至10中任一项记载的预测装置,它是一种程序,其特征在于,程序还至少具备以下手段(i)当上述A或检索出的B的立体结构已知时,或用同源模拟制作立体结构模型时,计算其立体结构模型、表示在该立体结构上通过局部排列在该A与B间排列的氨基酸部分序列的结构的手段。
12.权利要求8至11中任一项记载的预测装置,它是一种程序,其特征在于,程序还至少具备以下手段(j)具备为了缩小检索范围而将蛋白质数据库中的蛋白质进行分类、存储功能的手段。
13.权利要求8至12中任一项记载的预测装置,它是一种程序,其特征在于,程序还至少具备以下手段(k)将蛋白质数据库中的各蛋白质作为上述A顺次输入的手段。
14.权利要求8至13中任一项记载的预测装置,它是一种程序,其特征在于,程序还至少具备以下手段(l)存储基因组数据库的手段。
15.人源蛋白质组群,它是应用权利要求6或7中的预测方法或权利要求8至14中任一项记载的预测装置得到的,预测具有蛋白质间相互作用。
16.蛋白质组合的筛选方法,它是从权利要求15中的组群中,以可能与疾病相关的已知蛋白质的信息为基础进行筛选,筛选出与疾病有关的具有蛋白质间相互作用的蛋白质组合的方法。
17.蛋白质组群,它是用权利要求16中的方法筛选出的与疾病相关的具有蛋白质间相互作用的蛋白质组群。
18.化合物的筛选方法,该化合物调整选自权利要求17中记载的组群的某种组合和/或2蛋白质间的相互作用。
19.具有相互作用的蛋白质或多肽的特定方法,它是通过权利要求6或7记载的预测方法获得预测与特定的蛋白质或多肽(A)相互作用的蛋白质或多肽(B),然后通过实验确认A与B间有相互作用的方法。
20.具有相互作用的蛋白质或多肽的特定方法,它是通过权利要求8至14中任一项记载的预测装置,获得预测与特定的蛋白质或多肽(A)相互作用的蛋白质或多肽(B),然后通过实验确认A与B间有相互作用的方法。
21.利用权利要求6或7记载的预测方法、调整特定的蛋白质或多肽(A)与蛋白质或多肽(B)的蛋白质间相互作用的化合物的筛选方法。
22.利用权利要求8至14中任一项的预测装置、调整特定的蛋白质或多肽(A)与蛋白质或多肽(B)的蛋白质间相互作用的化合物的筛选方法。
23.蛋白质加工部位的预测方法,它是应用权利要求6或7中预测方法或权利要求8至14中任一项的预测装置,通过预测特定蛋白质与酶切该蛋白质的酶间的蛋白质间相互作用进行。
24.特定的蛋白质或多肽,它是应用权利要求19或20中的具有相互作用的蛋白质或多肽的特定方法特定出的。
25.新型化合物,它是应用权利要求21或22中记载的筛选方法得到的。
26.一种新型化合物,它是依据应用权利要求21或22中记载的筛选方法而得到的化合物的信息进行药物设计而得到的,具有调整特定的蛋白质或多肽(A)与蛋白质或多肽(B)间的蛋白质间相互作用的功能。
27.化合物,它是用权利要求18中的方法得到的。
28.多肽,具有预测包括用权利要求23中的方法得到的蛋白质加工部位和/或与该加工部位相同的部分序列的氨基酸序列。
全文摘要
蛋白质间相互作用的预测方法,其特征是(1)将蛋白质A的氨基酸序列分解成某种长度的寡肽,(2)在蛋白质数据库中检索具有上述寡肽的蛋白质C,或者检索具有与上述寡肽相同的寡肽的蛋白质D,(3)对上述A与栓索出的C或D进行局部排列,(4)根据局部排列的结果及蛋白质数据库中氨基酸频率或寡肽的频率计算出的数值为指标,将检索出的C或D预测为与蛋白质A相互作用的蛋白质B;搭载该预测程序的记录介质;搭载该记录介质的预测装置和由他们得到的蛋白质。
文档编号G06F19/16GK1660890SQ20041006152
公开日2005年8月31日 申请日期2001年3月9日 优先权日2000年3月10日
发明者土居洋文, 铃木敦 申请人:第一制药株式会社, 富士通株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1