技术特征:
1.一种基于分治整合策略的成对蛋白质相互作用网络比对方法,其特征在于,包括:步骤1:读取源网络和目标网络及blast相似性文件;步骤2:采用基于结点和路径相结合的方法分别计算两个网络中结点的相似性得分,结合所述相似性得分分别对两个网络进行模块划分;步骤3:获取同源蛋白对,根据同源蛋白对和blast相似性分别计算来自不同网络模块间的相似性;根据相似性将来自不同网络的模块进行一对一匹配;步骤4:根据特征向量中心性和blast相似性计算每对已匹配模块中结点间的相似性,并进行模块内比对,将得到的子比对结果合并为候选结果集;步骤5:对候选结果集使用超图匹配算法得到最终一对一比对结果。2.如权利要求1所述的基于分治整合策略的成对蛋白质相互作用网络比对方法,其特征在于,步骤2中,计算相似性得分具体如下:采用度和最短路径长度衡量两个结点间的相似性,结点相似性计算如公式(1)其中g为网络,u,v为g中的结点,deg
u
指结点u的度,deg
g
指图g中的最大度,d(g)指图g的直径,d
g
(u,v)指结点u,v的最短路径长度。3.如权利要求1所述的基于分治整合策略的成对蛋白质相互作用网络比对方法,其特征在于,步骤2中,模块划分步骤如下:(1)对源网络g使用公式(1)进行相似性计算,得到相似性矩阵s;(2)对于矩阵s中的每一行,根据数值大小,将相似性在前75%的结点构成一个模块,模块中心为该行矩阵的行名。4.如权利要求1所述的基于分治整合策略的成对蛋白质相互作用网络比对方法,其特征在于,步骤3具体如下:生成同源蛋白对,并根据蛋白对在模块中的集体行为计算模块的同源相似性,使用公式(2)将同源蛋白对文件转换为同源矩阵π,其中i,j分别为来自两个网络的蛋白质;则根据矩阵π得到的模块m1,m2的同源相似性得分为:公式(3)受限于公式(4):模块相似性计算公式为:s(m1,m2)=hs(m1,m2)+blast(c1,c2)
ꢀꢀꢀꢀꢀꢀ
(5)
其中c1,c2分别为模块m1,m2的簇中心;blast为序列相似性;根据公式(5)得到模块间相似性矩阵s,对s使用匈牙利算法求解,则可得到一对一的模块匹配关系。5.如权利要求1所述的基于分治整合策略的成对蛋白质相互作用网络比对方法,其特征在于,步骤4具体如下:对于模块比对阶段得到的每一对匹配上的模块,首先计算模块内结点的相似性矩阵,再对两个模块内的结点进行比对;更具体过程如下:根据特征向量中心性和序列相似性计算不同模块中两个结点间的相似性,见公式(6)其中t(u,v)表示结点u,v的特征向量中心性相似得分,其计算方法见公式(7):其中c
u
指结点u的特征向量中心性;将所有配对模块生成的子比对合并为候选集,此时的候选集中一个结点可能会和来自另一个网络中的多个结点形成比对关系,因此候选集为多对多匹配集合。6.如权利要求5所述的基于分治整合策略的成对蛋白质相互作用网络比对方法,其特征在于,根据公式(6)进行模块内比对步骤如下:(1)首先将模块m1,m2的模块中心c1,c2比对上;(2)分别获取c1,c2的邻居,deg(c1),deg(c2);(3)从f中提取行名和列名在deg(c1)和deg(c2)中的子矩阵,并使用匈牙利算法将deg(c1),deg(c2)结点进行比对;(4)将已扩展结点(c1,c2)移除,并对剩余已比对结点对依次重复步骤(2)(3)。7.如权利要求1所述的基于分治整合策略的成对蛋白质相互作用网络比对方法,其特征在于,步骤5具体如下:将候选集抽象为超图,其中源网络中的结点为超图的源结点,目标网络中的结点为超图的目标结点,每个子比对对应超图的一条超弧;使用加权二部超图匹配算法将超图提取为仅包含一对一比对关系的二部图,即得到最终的结点匹配关系。8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1到7任一项所述方法的步骤。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1到7任一项所述方法的步骤。10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1到7任一项所述的方法。