一种基于社团聚类特征的种子扩展社团检测方法及系统与流程

文档序号:31459238发布日期:2022-09-07 15:32阅读:256来源:国知局
一种基于社团聚类特征的种子扩展社团检测方法及系统与流程

1.本发明属于网络社团发现技术领域,尤其涉及一种基于社团聚类特征的种子扩展社团检测方法及系统。


背景技术:

2.基于种子扩展的社团检测方法首先选择种子节点作为初始社团,然后按照贪心策略来扩展社团。基于种子扩展的社团检测方法的种子节点的选择是与社团优化策略相关的。种子的选择有多种方法,cheng等人将复杂网络中度最大的节点选为种子节点;moradi等人通过链路预测给复杂网络中每个节点分配相似性值,然后用图着色算法来增强种子节点;lfm算法随机地从复杂网络中选择种子节点;hu等人提出基于投票的种子节点选择算法,在每次迭代时将票数最多的节点看作种子节点;whang等人提出节点到聚类中心的距离来选择种子节点的策略;liu等人提出将复杂网络中局部聚类系数最大的节点选择为种子节点的策略;zhang等人提出基于随机游走的种子节点选择策略。
3.模块度的概念是newman等人提出的,模块度通常被用来评估复杂网络中社团划分的优劣。模块度优化算法通过模块度最大化来检测社团,社团检测的过程也是模块度变化的过程。模块度优化算法有很多优化策略:贪心算法、极值优化、谱聚类和模拟退火(sa)等。贪心策略是最常用的策略,如fn算法、cnm算法和louvain算法都采用贪心策略。fn算法运用贪心的策略选择模块度增量最大或减小最少来合并社团,模块度最大时对应的社团划分为算法的社团检测结果。cnm算法执行过程与fn算法相同也是采用贪心策略,与fn算法不同,cnm在算法引入模块度增量矩阵等数据结构降低了算法的时间复杂度。louvain算法将复杂网络中的每个节点初始化为一个单独的社团,然后把每个节点与其模块度增量最大的邻节点合并。
4.现有的基于种子扩展的社团检测方法,在种子扩展过程中未考虑社团的聚类特征以及在社团优化过程中存在筛选稀疏社团不准确的问题。


技术实现要素:

5.为解决上述技术问题,本发明提出一种基于社团聚类特征的种子扩展社团检测方法及系统,针对未考虑社团聚类特征的问题,本发明在种子扩展过程中以社团的聚类特征来扩展社团;针对社团优化过程中筛选稀疏社团不准确的问题,在社团优化时,本发明引入模块度增量,并以模块度最大化来合并社团,进一步提高了社团检测的准确性。
6.一方面为实现上述目的,本发明提供了一种基于社团聚类特征的种子扩展社团检测方法,包括如下步骤:
7.基于社团的聚类特征,利用核心社团扩展算法,获得扩展社团;
8.利用基于模块度的社团优化算法,对所述扩展社团进行优化,完成对复杂网络的社团检测。
9.可选地,获得扩展社团的方法包括:
10.基于社团的聚类特征,获得节点的局部聚类系数;
11.基于所述局部聚类系数,获得评估社团聚类能力的社团聚类系数;
12.基于所述社团聚类系数和节点的度,获得种子节点,并对种子节点中的邻节点进行排序;
13.对排序后的所述邻节点计算聚类增量;
14.基于所述聚类增量,获得扩展社团。
15.可选地,对排序后的所述邻节点计算聚类增量的表达式为:
[0016][0017]
其中,表示复杂网络中包含节点v时社团c
t
的社团聚类系数,表示从复杂网络中去掉节点v以及与之相关联的边时的社团c
t
的社团聚类系数,表示节点v对于社团c
t
的聚类增量。
[0018]
可选地,基于所述聚类增量,获得扩展社团的方法为:
[0019]
将所述聚类增量大于0的节点扩展至所述种子节点,作为扩展社团。
[0020]
可选地,利用基于模块度的社团优化算法,对所述扩展社团进行优化的方法为:
[0021]
步骤1:建立模块度增量矩阵;
[0022]
步骤2:将所述模块度增量矩阵中模块度增量为阈值的社团进行合并;
[0023]
步骤3:重复所述步骤1和所述步骤2,直至所述模块度增量矩阵的值均小于0时,完成对所述扩展社团的优化。
[0024]
可选地,所述模块度增量矩阵为:
[0025][0026]
其中,表示社团ci和cj合并前整个复杂网络社团划分c对应的模块度,表示社团ci和cj合并后整个复杂网络的社团结果c对应的模块度。
[0027]
另一方面为实现上述目的,本发明提供了一种基于社团聚类特征的种子扩展社团检测系统,包括:种子扩展模块和社团优化模块;
[0028]
所述种子扩展模块用于基于社团的聚类特征,利用核心社团扩展算法,获得扩展社团;
[0029]
所述社团优化模块用于利用基于模块度的社团优化算法,对所述扩展社团进行优化,完成对复杂网络的社团检测。
[0030]
可选地,所述种子扩展模块包括:第一获得单元、第二获得单元、第三获得单元、计算单元和第四获得单元;
[0031]
所述第一获得单元用于基于社团的聚类特征,获得节点的局部聚类系数;
[0032]
所述第二获得单元用于基于所述局部聚类系数,获得评估社团聚类能力的社团聚类系数;
[0033]
所述第三获得单元用于基于所述社团聚类系数和节点的度,获得种子节点,并对种子节点中的邻节点进行排序;
[0034]
所述计算单元用于对排序后的所述邻节点计算聚类增量;
[0035]
所述第四获得单元用于基于所述聚类增量,获得扩展社团。
[0036]
可选地,所述社团优化模块包括:构建单元、合并单元和优化单元;
[0037]
所述构建单元用于建立模块度增量矩阵;
[0038]
所述合并单元用于将所述模块度增量矩阵中模块度增量为阈值的社团进行合并;
[0039]
所述优化单元用于重复所述构建单元和所述合并单元,直至所述模块度增量矩阵的值均小于0时,完成对所述扩展社团的优化。
[0040]
与现有技术相比,本发明具有如下优点和技术效果:
[0041]
本发明提出一种基于社团聚类特征的种子扩展社团检测方法及系统,在种子扩展阶段根据社团的聚类特征选择局部聚类系数最大且度较小的节点作为种子节点,然后以聚类增量来扩展社团。在社团优化阶段,本发明重新定义模块度增量函数,并以模块度最大化来合并社团,避免了筛选稀疏社团不准确的问题,进一步提升了社团检测的准确性。
附图说明
[0042]
构成本技术的一部分的附图用来提供对本技术的进一步理解,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
[0043]
图1为本发明实施例一的一种基于社团聚类特征的种子扩展社团检测方法流程示意图;
[0044]
图2为本发明实施例一的无向简单网络示意图;
[0045]
图3为本发明实施例一的sea算法的执行过程示意图;
[0046]
图4为本发明实施例一的lfr1网络实验结果示意图,其中,图(a)为lfr1网络实验nmi的值示意图,图(b)为lfr1网络实验q的值示意图;
[0047]
图5为本发明实施例一的lfr2网络实验结果示意图,其中,图(a)为lfr2网络实验nmi的值示意图,图(b)为lfr2网络实验q的值示意图;
[0048]
图6为本发明实施例一的lfr3网络实验结果示意图,其中,图(a)为lfr3网络实验nmi的值示意图,图(b)为lfr3网络实验q的值示意图;
[0049]
图7为本发明实施例一的lfr4网络实验结果示意图,其中,图(a)为lfr4网络实验nmi的值示意图,图(b)为lfr4网络实验q的值示意图;
[0050]
图8为本发明实施例一的sea算法以及对比算法在真实网络上对比结果示意图;
[0051]
图9为本发明实施例一的sea算法在karate网络上的社团检测结果示意图;
[0052]
图10为本发明实施例一的sea算法在dolphins网络上的社团检测结果示意图;
[0053]
图11为本发明实施例一的sea算法在football网络上的社团检测结果示意图;
[0054]
图12为本发明实施例一的sea算法在riskmap网络上的社团检测结果示意图;
[0055]
图13为本发明实施例二的一种基于社团聚类特征的种子扩展社团检测系统结构示意图。
具体实施方式
[0056]
需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
[0057]
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0058]
实施例一
[0059]
如图1所示,本发明提供一种基于社团聚类特征的种子扩展社团检测方法,包括如下步骤:
[0060]
基于社团的聚类特征,利用核心社团扩展算法,获得扩展社团;
[0061]
利用基于模块度的社团优化算法,对扩展社团进行优化,完成对复杂网络的社团检测。
[0062]
在本实施例中,定义社团聚类系数、聚类增量和模块度增量。社团聚类系数用于评估复杂网络中一组节点的聚类能力;聚类增量用来扩展社团的核心区;模块度增量用于评估两个社团合并前后是否能提升整个复杂网络社团划分的模度。
[0063]
在本实施例中,将社团中节点的局部聚类系数的求和平均称为社团聚类系数。假设c={c1,c2,......,cn}表示复杂网络中社团的集合。社团c
t
节点的集合用n(c
t
)={v
t1
,v
t2
,......,v
tm
}表示。社团聚类系数如公式1.1所示。
[0064][0065]
其中,lcc为节点的局部聚类系数。类比节点的局部聚类系数用来评估复杂网络中节点的聚类能力,社团聚类系数体现了复杂网络中一组节点的聚类能力,社团聚类系数值越大表示社团的聚类能力越强,反之越弱。
[0066]
在本实施例中,基于社团聚类系数提出聚类增量。聚类增量表示复杂网络包含节点v时社团的社团聚类系数,与复杂网络中去掉v节点以及与v节点关联的边时社团的社团聚类系数的差值。聚类增量的定义如下。
[0067]
假设v表示复杂网络中所有顶点的集合,节点v对于社团c
t
的聚类增量定义如公式1.2所示。
[0068][0069]
其中,表示复杂网络中包含节点v时社团c
t
的社团聚类系数,表示从复杂网络中去掉节点v以及与之相关联的边时的社团c
t
的社团聚类系数,表示节点v对于社团c
t
的聚类增量。当时表示节点v提升了社团的聚类能力,反之降低了社团的聚类能力。
[0070]
在本实施例中,fn算法引入了模块度增量δq的概念。e
ij
表示社团i和j之间连接的边数与整个复杂网络边数的比值,ai和aj分别表示社团i和j内各自的节点度之和分别与整个复杂网络度之和的比值。δq的公式如1.3所示
[0071]
δq=2(e
ij-a
iaj
)
ꢀꢀꢀ
(1.3)
[0072]
分析公式1.3可知,模块度增量δq是根据两个邻接社团拓扑信息计算的,忽略了两个社团合并对其他社团的影响。为此本文提出考虑所有社团的模块度增量δq',δq'是
指社团合并之后的整个复杂网络社团的模块度与社团合并前整个复杂网络社团的模块度之差。模块度增量δq'的定义如下所示。
[0073]
假设复杂网络社团划分的结果用c={c1,c2,......,ck}表示。ci和cj分别表示社团结果c中的任意两个社团,模块度增量δq'的定义如公式1.4所示。
[0074][0075]
其中,表示社团ci和cj合并前整个复杂网络社团划分c对应的模块度,表示社团ci和cj合并后整个复杂网络的社团结果c对应的模块度。δq'》0表示两个社团合并增加了整个复杂网络社团划分的模块度,δq'《0表示两个社团合并降低了整个复杂网络社团的模块度。
[0076]
在本实施例中,利用sea算法分为种子扩展阶段和社团优化阶段。在种子扩展阶段cea算法(核心社团扩展算法)在尚未被划分社团的节点中选择局部聚类系数最大且度较小的节点作为种子节点,然后把社团邻节点按局部聚类系数排序,并根据公式1.2依次计算邻节点对于社团的聚类增量,再将聚类增量大于0的节点扩展至社团。无符合条件的邻节点时新建社团。cea算法的目标是划分出复杂网络中所有社团的核心社团。当所有的节点划分好社团后cea算法执行结束。在社团优化阶段,moa算法(基于模块度的社团优化算法)根据公式1.4建立模块度增量矩阵,并选择将增量最大的社团进行合并,然后重新建立模块度增量矩阵再合并社团,直至增量矩阵的值均小于0时算法执行结束。moa算法的输入是cea算法的输出的结果,然后以模块度优化合并社团。
[0077]
本实施例的执行过程:如图2所示有7个节点,包含两个社团,这两个社团分别为c1={v1,v2,v3,v4}和c2={v5,v6,v7}。sea算法的执行过程如图3所示
[0078]
sea算法首先计算复杂网络节点的局部聚类系数(lcc),算结果如图3(a)所示。根据sea算法在尚未被划分社团的节点中选择局部聚类系数最大且节点度相对较小的原则,选择v2节点作为种子节点,如图3(b)所示。选择v2作为种子节点之后,将社团节点按局部聚类系数排序。再根据公式1.2计算v2节点的邻节点v1和v4相对于社团c1的聚类增量δlcc,节点v1对社团c1的聚类增量为节点v4对社团c1的聚类增量为按照核心社团扩展聚类增量大于0的原则,将v1和v4扩展至社团c1的核心区,如图3(c)所示。计算社团c1的邻节点v3和v5的聚类增量δlcc,节点v3对社团c1的聚类增量为节点v5对社团c1的聚类增量为的聚类增量为因此社团c1的核心区不包括v3和v5节点,c1社团结束扩展,扩展结果如图3(d)所示。同样地,sea算法从复杂网络中尚未被划分社团的节点中选择v6作为种子节点,如图3(e)所示。通过公式1.2计算节点v7和v5的聚类增量,其中节点v5对社团c2的聚类增量为节点v7对社团c2的聚类增量为将节点v7和v5扩展至社团c2的核心区,然后结束迭代,处理结果如图3(f)所示。最后选择复杂网络中尚未分配社团的节点v3作为种子节点,v3节点无任何尚未分配社团的节点,因而单独为一个社团c3,如图3(g)所示。sea算法社团优化阶段,c3社团重新分配社团。根据公式1.4计算社团模块度增量δq

(c3,c1)=0.0625,δq

(c2,c1)=-0.055,因此节点v3属于社团c1。sea法执行结果如图3(h)所示。sea算法检测的社团为c1={v1,v2,v3,v4}和c2={v5,v6,v7}。
[0079]
算法的时间复杂度和空间复杂度是评估算法性能的两个重要的方面。由于计算机硬件的快速发展,算法的空间复杂度都能满足。本实施例只从时间复杂度的角度来评估算法性能,sea算法的时间复杂度分析如下:
[0080]
假设复杂网络g=(v,e)的节点数为n边数为m,节点的最大度为d,c_pre内社团的数量为k。
[0081]
(1)cea算法计算复杂网络中每个节点的局部聚类系数时间复杂度为o(nd)。在核心社团扩展时邻节点按局部聚类系数排序的时间复杂度为o(d log
2 d),扩展邻节点的时间复杂度为o(d)。最极端情况下局部优化的次数为n,则时间复杂度为o(nd(log
2 d+1)),因此cea算法的时间复杂度为o(n(d(log2d+1)+d))
[0082]
(2)moa算法计算社团之间的模块度增量的时间复杂度为o(k2),社团合并次数最多执行k次,因此moa算法的时间复杂度为o(k3)。sea算法时间复杂度为cea算法时间复杂度与moa算法时间复杂度之和。sea算法的时间复杂度为o(n(d(log2d+1)+d))+o(k3)。
[0083]
为了验证本发明提出的sea算法检测社团的有效性,本发明在lfr基准网络和真实网络数据集上进行实验。本发明的lfr基准网络的参数设置如表1所示。
[0084]
表1
[0085][0086]
如表1所示,这4组网络的节点规模分别是50、500、1000和2000。这4组网络中本章将节点平均度设置为10。lfr1网络的最大度设置为20,其余lfr基准网络的节点最大度设置为40。本发明将lfr1网络的最小社团规模设置为5,最大社团规模设置为20。本发明将lfr2、lfr3和lfr4基准网络的最小社团规模都设置为10,最大社团规模都设置为50。本发明将四组lfr基准网络的混合参数的范围都设置在0.1至0.8之间。
[0087]
本发明采用模块度q和标准化互信息nmi作为实验的评价指标。模块度q和标准化互信息nmi这两个评价指标的侧重点不同。模块度q是从复杂网络拓扑结构的角度来评估复杂网络社团划分的优劣。nmi是从社团划分的结果与真实的结果的一致性方面来评估算法检测社团的准确性。
[0088]
本发明选用六种对比算法:lpa、walktrap、springlass、gn、louvain算法和nsa算法。lpa算法不稳定因此本文在实验过程中将lpa算法执行100次分别取其q和nmi的求和平均值。实验过程中本发明根据nsa算法的阈值在0至1之间的实验结果,阈值为0.01时效果最优,因而把nsa算法的稀疏度的阈值设置为0.01。
[0089]
图4(a)、图4(b)表示sea算法及其对比算法在lfr1网络上的实验结果。从图上可知
当μ≤0.2时sea算法社团检测对应的nmi和q值与walktrap算法、louvain算法、lpa算法、gn算法和nsa算法社团检测的nmi和q值相同。这说明在lfr1网络上,当μ≤0.2时sea算法同对比算法一样可以有效地检测出社团。当μ》0.2时sea算法社团检测的nmi和q值都在快速的下降,其原因是随着混合参数μ的增加,lfr1网络中社团的聚类特征也在降低,sea算法种子扩展的效果也在下降。从图4(a)、图4(b)上看sea算法比nsa算法对μ值的变化更敏感,sea算法是基于社团聚类特征扩展社团的,而nsa算法是基于节点相似性扩展社团的。
[0090]
图5(a)、图5(b)表示sea算法及其对比算法在lfr2网络上的实验结果。从图上可知当μ≤0.3时sea算法社团检测对应的nmi和q值与walktrap算法、louvain算法社团检测对应的nmi和q值最优。这说明在lfr2网络上,这说明当μ≤0.3时,sea算法可以有效地从lfr2网络中划分出社团。sea算法社团检测的nmi和q均优于nsa算法社团检测对应的nmi和q,说明sea算法进一步提升种子扩展算法的准确性。
[0091]
从整体上来看,随着μ值增大sea算法社团检测的准确性在降低,其原因是随着μ值的增加lfr2网络的社团聚类特征也在降低。
[0092]
图6(a)、图6(b)表示sea算法在lfr3网络上实验的结果。从图上可知当μ≤0.3时sea算法社团检测的nmi和q值略低于gn算法walktrap算法和louvain算法。从图上可知sea算法社团检测的nmi和q值均优于nsa算法,这可以说明在lfr3网络上sea算法进一步提升了种子扩展社团检测的准确性。
[0093]
图7(a)、图7(b)表示sea算法及其对比算法在lfr4网络上的实验结果。从图可知sea算法社团检测的nmi和q值略低于gn算法、louvain算法和walktrap算法社团检测的nmi和q。从图上可知,sea算法社团检测的效果优于nsa算法。这可以证明,sea算法可以提升种子扩展算法的社团检测效果。
[0094]
通过在lfr1、lfr2、lfr3和lfr4四组人工网络的对比实验。可知,随着混合参数的增大,sea算法社团检测的准确性会降低。其次,实验结果表明sea算法可以提升种子扩展社团检测的准确性。
[0095]
本发明采用karate、dolphins、football和riskmap四组真实网络进行对比实验。这四真实组网络都有参考社团,本发明采用nmi和q作为评价指标。sea算法和对比算法在真实网络上的nmi和q值如表2所示。sea算法及和对比算法在真实网络数据集上nmi和q的综合结果如图8所示。
[0096]
表2
[0097][0098]
根据表2和图8可知,在karate网络上sea算法社团划分对应的nmi值低于springlass算法,但优于nsa算法及其他对比算法。sea算法与nsa算法都是基于种子扩展的
算法,sea算法是基于社团的聚类特征的,从实验结果来看sea算法社团检测的nmi优于nsa算法,同样sea算法社团划分对应的模块度q高于nsa算法。从图8可知sea算法社团划分的nmi和q的综合值比nsa算法社团划分的nmi和q的综合值大,因此我们可知相对于nsa算法,sea算法可以更有效地从karate网络中检测出社团。在dolphins网络上sea算法社团检测的nmi和q值与springlass算法社团检测的nmi和q相同,优于其他算法。在dolphins网络上sea算法社团检测的nmi和q值均优于nsa算法,由此可知在dolphins网络上sea算法是有效的,同时sea算法可以提升种子扩展算法社团检测的准确性。从图8可知在dolphins网络上sea算法社团检测的nmi和q的综合值优于对比算法。在football网络上,sea算法和nsa算法社团检测对应的nmi和q值最高,说明在football网络上基于社团的聚类特征的sea算法与基于相似性的nsa算法的同样有效。在riskmap网络上sea算法社团检测的nmi略低于gn算法,但sea算法社团检测的nmi和q均高于nsa算法,说明在riskmap网络上sea算法基于社团聚类特征扩展的方法优于nsa算法。从图8可知,sea算法在riskmap网络上社团检测对应的nmi和q的综合值略低于gn算法,但优于其他对比算法。
[0099]
综上所述,sea算法在四个真实网络上的社团检测是有效的,其次sea算法可以进一步提升种子扩展算法社团检测的准确性。
[0100]
如图9表示sea算法在karate网络上社团检测的结果。karate网络有2个参考社团,sea算法将karate网络划分为4个社团。在参考社团中5号节点所在的橙色社团与0号节点所在的绿色社团属于同一个社团。分析sea算法的执行过程,我们可知算法在种子扩展阶段将16、5和6节点划分为核心社团。在社团优化阶段将提升整个网络社团模块度的节点合并。由于5号节点所在的橙色社团与0号节点所在的绿色社团合并,并不能提升社团的模块度,因此将它们划分为两个社团。
[0101]
图10表示sea算法在dolphins网络上社团划分的结果。dolphins网络的参考社团有2个,sea算法将dolphins网络划分成两个社团。由表3-1可知,sea算法社团划分的nmi为0.5865,q值为0.5285。虽然sea算法在dolphins网络上社团划分的有效性优于对比算法,但社团划分的结果并不理想。观察图10可知红色社团的规模较大,绿色社团的规模较小,其原因是sea算法在种子扩展阶段将局部网络中聚集性较强的一组节点划分为一个核心社团,在算法社团优化阶段以整个社团划分模块度最大化为目标将其合并至红色社团。
[0102]
图11表示sea算法在football网络上的社团检测结果。football网络参考社团有12个,sea算法将football网络划分为10个社团。在参考社团中节点93、90和50分别属于三个社团,但sea算法将其划分在一个社团内。其原因是sea算法在社团合并时模块度最大化将这三个节点所在的3个社团合并为一个大的社团。
[0103]
图12表示sea算法在riskmap网络上的社团检测结果。riskmap参考社团有6个,sea算法将riskmap网络划分为7个社团。在参考社团中节点17所在的橙色社团与22号节点所在的蓝色社团除12号节点外属于同一个社团。但sea算法将其划分为两个社团,其原因是在sea算法在种子扩展阶段将其划分为两个核心社团,在社团优化阶段由于两个社团合并不能提升社团的模块度,因此划分为两个社团。
[0104]
将本实施例应用于蛋白质相互作用网络中蛋白质复合物提取。例如,在蛋白质相互作用网络中,节点表示蛋白质,边表示蛋白质之间具有相互作用关系。研究表明,蛋白质一般不会单独起作用,多个蛋白质构成的蛋白质复合物才具有生物意义。蛋白质相互作用
网络具有社团结构的特征,社团结构中的每个社团对应一个蛋白质复合物。本技术方案根据蛋白质相互作用网络中社团的聚类特征,提出两阶段的蛋白质复合物提取方案。在种子扩展阶段完成蛋白质复合物的初步提取;社团优化阶段在蛋白质初步提取的基础上完成蛋白质复合物的优化。本方案根据社团的聚类特征定义了评估社团的社团聚类系数,并以社团聚类系数定义社团聚类增量。在种子扩展阶段,选择蛋白质相互作用网络中节点局部聚类系数最大且度相对较小的节点作为种子节点。接着,把社团的邻节点按局部聚类系数排序,再把聚类增量大于0的邻节点扩展至社团。社团优化阶段,sea算法定义了模块度增量,并在优化过程中引入模块度增量矩阵,每次迭代时选择将模块度增量最大的两个蛋白质复合物合并。
[0105]
实施例二
[0106]
如图13所示,本发明还提供了一种基于社团聚类特征的种子扩展社团检测系统,包括:种子扩展模块和社团优化模块;
[0107]
种子扩展模块用于基于社团的聚类特征,利用核心社团扩展算法,获得扩展社团;
[0108]
社团优化模块用于利用基于模块度的社团优化算法,对扩展社团进行优化,完成对复杂网络的社团检测。
[0109]
进一步地,种子扩展模块包括:第一获得单元、第二获得单元、第三获得单元、计算单元和第四获得单元;
[0110]
第一获得单元用于基于社团的聚类特征,获得节点的局部聚类系数;
[0111]
第二获得单元用于基于局部聚类系数,获得评估社团聚类能力的社团聚类系数;
[0112]
第三获得单元用于基于社团聚类系数和节点的度,获得种子节点,并对种子节点中的邻节点进行排序;
[0113]
计算单元用于对排序后的邻节点计算聚类增量;
[0114]
第四获得单元用于基于聚类增量,获得扩展社团。
[0115]
进一步地,社团优化模块包括:构建单元、合并单元和优化单元;
[0116]
构建单元用于建立模块度增量矩阵;
[0117]
合并单元用于将模块度增量矩阵中模块度增量为阈值的社团进行合并;
[0118]
优化单元用于重复构建单元和合并单元,直至模块度增量矩阵的值均小于0时,完成对扩展社团的优化。
[0119]
以上,仅为本技术较佳的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应该以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1