一种基于博弈论的符号网络社团发现方法与流程

文档序号:16472801发布日期:2019-01-02 23:17阅读:402来源:国知局

本发明属于复杂网络分析技术研究领域,具体地,涉及一种基于博弈论的符号网络社团发现方法。



背景技术:

符号网络中节点之间的边不仅包括正边,还包括负边。其中,正边表示朋友、喜欢、信任、支持等积极的关系,而负边则表示敌人、讨厌、不信任和反对等消极关系。在社会、生物、物理等领域,很多复杂系统都存在这种对立的关系。例如,在社会领域,人与人之间的朋友和敌人关系,国家之间存在合作与敌对关系;在生物领域,神经元之间存在促进和抑制关系;在物理领域中,原子之间存在吸引和排斥的关系。因此,现实世界中很多复杂系统都可以抽象为符号网络。并且,将这些复杂系统建模为符号网络,能够充分利用网络中的负边信息,得到更加准确的网络结构特征。

社团结构是复杂网络的重要特征,对其他社会计算任务的开展具有重要的意义。在无符号网络中,社团是网络内一组节点的集合,集合内节点之间连接紧密,而集合间节点之间的连接相对稀疏。在符号网络中,社团的划分不仅要考虑节点间连接的紧密程度,还要考虑边的符号属性。根据符号网络的结构平衡理论,通常将正边划分到社团内部,而将负边划分到社团之间。直观上来讲,对于可分或平衡的符号网络,通过切掉所有的负边即可得到社团的划分结果。然而,实际的符号网络通常是不可分或不平衡的网络,即在社团内部存在负边,而在社团之间存在正边。这就给符号网络的社团划分带来了难度和挑战。

针对无符号网络的社团检测技术的研究由来已久,并且产生了大量的社团发现方法,例如陈雅姗等的“囚徒困境博弈策略在社团网络中的演化”和朱小虎等的“用于重叠社团发现的社团生成博弈框架的设计与分析”等文献。然而,有学者研究发现,符号网络中的负边包含了无符号网络不具备的大量信息,在分析符号网络的结构中具有不可替代的作用。因此,不能将无符号网络的社团发现方法直接应用于符号网络中,需要针对符号网络的特点研究新的社团发现方法。

博弈论作为一种重要的数学分析工具,不仅在经济学和政治学,而且在交通运输网络、通信网络及社会关系网络方面得到了广泛的应用。它是研究独立的理性参与者的行为发生直接相互作用时,参与者如何进行决策,以及这种决策如何达到均衡的理论。复杂网络中的节点通常是理性的人或社会团体,它们通过加入或离开社团,使自己的收益最大化。因此,可以将符号网络的社团发现问题建模为博弈论模型,通过求取模型的均衡状态,得到社团划分结果。

针对符号网络中的社团发现问题,本发明提出了一种基于博弈论的符号网络社团结构发现方法。该方法能够实现对符号网络中的社团结构进行准确划分。本发明引入博弈论的思想来解决符号网络中的社团结构发现问题。



技术实现要素:

本发明的目的在于提供一种基于博弈论的社团发现方法,以准确地从符号网络中发现社团结构信息,为网络属性和节点行为等进一步研究提供基础。

实现本发明目的的技术解决方案为:一种基于博弈论的社团发现方法,所述方法包括以下步骤:

(10)人工符号网络数据集生成:为验证本方法在社团内或社团间存在噪声情况下的社团发现性能;

(20)数据预处理:初始化待处理网络中节点的社团划分;

(30)社团生成博弈:随机选取一节点i,计算其执行加入社团、离开社团和切换社团等三种决策时对应的最优效用函数值;

(40)比较并更新社团:根据效用函数值选取最佳策略,并更新节点i的社团;

(50)若博弈未达到局部纳什均衡状态,则返回步骤(30)继续执行。否则,完成社团结构划分。

优选地,步骤(10)人工符号网络数据集生成步骤包括:

(11)利用lancichinetti–fortunato–radicchi(lfr)人工数据集生成器生成无符号网络;

(12)在lfr网络的基础上,增加p+和p-两个参数分别用于调节社团间正边和社团内负边出现的概率,用于生成人工符号网络数据集。

优选地,步骤(20)数据预处理步骤为:

(21)将网络中的每个节点都划分为单独的社团,即只包含一个节点的社团;

(22)根据本方法构建的效用函数,计算初始状态下每个节点的效用函数值;

(23)将网络中的所有节点都加入待处理的节点集中。

优选地,步骤(22)中的效用函数定义如下:

ui=gi-li

其中,ui为效用函数,gi是增益函数,li为损失函数。增益函数定义如下:

式中,如果节点i与j归属于同一社团,δ(i,j)=1,否则δ(i,j)=0。aij为网络的邻接矩阵中的元素,取值为1、0和-1,当i与j之间是正边时,aij=1;为负边时,aij=-1;若i与j无连接时,aij=0。式中的前一项表示社团内的正边数与负边数之差,后一项(含负号)表示社团间负边数与正边数之差。

损失函数定义如下:

其中,m表示网络中的边数,|si|表示节点i所归属的社团数。

优选地,步骤(22)所构建的效用函数的纳什均衡存在性证明如下:

由势能博弈的性质可知,包含有限策略空间的任何势能博弈都存在纳什均衡。当增益函数和损失函数都是局部线性函数时,该博弈满足势能博弈的条件。因此,证明博弈纳什均衡的存在性转化为证明增益函数和损失函数局部线性的问题。根据已知条件,增益函数满足下列关系:

为方便起见,记节点i的增益函数为若节点i的策略从si变为s′i,那么节点i与j之间的增益从vji变为v′ji,其他节点之间的关系没有变化。所以,下式成立:

另外,由于下式成立:

由对称性知,vij=vji且v′ij=v′ji。由此可得,

g(s)-g(s-i,s′i)

=2(gi(s)-gi(s-i,s′i))

因此,增益函数的局部线性特性得证。另外,损失函数的局部线性特征是显而易见的。因此,本发明构建的效用函数的纳什均衡存在性得证。

优选地,步骤(30)社团生成博弈的具体步骤包括:

(31)执行加入社团决策:将与节点i不在同一社团的邻居节点所在的社团作为待加入的社团,循环计算节点i加入不同社团的效用函数值,记录产生最大效用函数值的操作;

(32)执行离开社团决策:若节点i归属的社团数大于1,则执行离开社团决策,待离开的社团是其当前所归属的社团,循环计算节点i执行不同操作对应的效用函数值,记录产生最大效用函数值的操作;

(33)执行切换社团决策:切换决策包括离开和加入两个操作,计算节点i所有可能的切换社团操作对应的效用函数值,记录产生最大效用函数值的操作。

优选地,所述步骤(40)比较并更新社团的步骤为:

(41)策略选择:对比(31)(32)(33)得到的效用函数值,选择具有最大效用值的策略为节点i的待选策略。然后,比较其与当前效用值的大小,若待选策略的效用值大于当前策略,则更新当前策略为待选策略,并同步更新当前效用函数值。否则,不更新当前策略。

(42)社团更新:在完成策略选择之后,同步更新节点i对应的社团归属。同时,将与节点i的策略更新相关的节点加入待处理节点集中,将节点i从待处理节点集中剔除。

本发明与现有技术相比,采用博弈论的方法完成对符号网络的社团发现,其显著优点为:

1、本发明社团划分精度高:将符号网络中的节点看做博弈论模型中的参与者,构建了启发式的效用函数,能够准确地进行符号网络中的社团划分;

2、本发明操作简单方便,无输入参数:本发明只需在初始化阶段将每个节点作为单独社团,然后无需设置任何参数如社团个数等,即可自动完成社团生成博弈,实现社团划分。

下面结合附图和具体实施方式对本发明作进一步的详细描述。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。

附图说明

图1为本发明基于博弈论的社团发现方法的主流程图。

图2为图1中执行加入社团操作步骤的流程图。

图3为图1中执行离开社团操作步骤的流程图。

图4为图1中执行切换社团操作步骤的流程图。

图5为本发明方法在真实符号网络中的社团划分结果。

其中,图5a为在slovene议会政党网络数据集上的社团划分结果;

图5b为在gahuku-gama部落网络数据集上的社团划分结果;

图5c为在美国高等法院网络数据集上的社团划分结果。

图6为本发明方法与其他三种方法在人工符号网络中的性能对比结果。

其中,图6a为准确率指标下的对比结果;

图6b为标准化互信息指标下的对比结果;

图6c为符号模块度指标下的对比结果;

图6d为纯度指标下的对比结果。

图7为四种社团发现方法在标准化互信息指标上的性能对比结果。

其中,图7(a)、(b)、(c)、(d)、(e)分别代表μ=0.1,0.2,0.3,0.4,0.5,图7(1)、(2)和(3)分别代表p-=0,0.2,0.4。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。

本发明所提方法则重点针对符号网络进行博弈建模,创建了一个全新的适用于符号网络的增益函数,为符号网络中的社团发现问题提供了一种有效的解决手段,不仅能够进行独立社团的发现,也能进行重叠社团的检测与识别。

如图1所示,本发明基于博弈论的社团发现方法,包括如下步骤:

(10)符号网络数据集的输入:本发明可接受的数据集形式为邻接矩阵和连接关系三元组,其中后者的前两列为网络中节点的序号,第三列为权重值,取正表示正连接,取负表示负连接;

(20)数据预处理:本步骤包括三个内容,分别是初始化每个节点为单独的社团、计算每个节点的初始效用函数值和将所有节点放入待处理节点集中;

(30)社团生成博弈:在待处理节点集中随机选取一个节点,计算其执行加入社团、离开社团和切换社团等三种决策时对应的最大效用函数值,并以该效用值作为选取最优策略的依据;

步骤(30)社团生成博弈的具体步骤包括:

(31)执行加入社团决策。如图2所示,加入社团操作的详细步骤包括:

(311)首先判断该节点的效用值是否大于损失值,如果不大于就返回一个较小的数值,本实施例取-100。如果大于就继续进行下一步;

(312)计算选取节点与其邻居节点的效用值总和,作为节点的当前效用值;

(313)计算与该节点不在同一社团的邻居节点所归属社团的大小;

(314)将上述(313)步骤中得到的最大社团作为选取节点待加入的社团集,这样的最大社团可能有多个;

(315)将选取节点从待加入社团集中循环选取一个社团执行加入社团操作;

(316)计算选取节点及其邻居节点的效用值总和;

(317)判断步骤(316)计算得到的效用值是否大于节点的当前效用值,若不大于则无操作,否则更新节点当前效用值为执行加入社团操作后的效用值,并保存和更新节点的社团归属;

(318)重复步骤(315)-(317)直到所有加入社团策略执行完毕,返回最优加入社团策略和其效用值。

(32)执行离开社团决策。如图3所示,离开社团操作的具体步骤如下:

(321)首先判断选取节点的社团数是否大于1,如果不大于则返回一个小值,本实施例取-100。否则,继续进行下一步;

(322)计算该节点及其邻居节点的效用值总和,作为选取节点的初始效用值;

(323)将该节点归属的社团加入待离开的社团集中;

(324)将选取节点从待离开社团集中循环选取一个社团执行离开社团操作;

(325)计算选取节点及其邻居节点的效用值总和;

(326)判断步骤(325)计算得到的效用值是否大于节点的当前效用值,若不大于则无操作,否则更新节点当前效用值为执行离开社团操作后的效用值,并保存和更新节点的社团归属;

(327)重复步骤(324)-(326)直到所有离开社团策略执行完毕,返回最优离开社团策略和其效用值。

(33)执行切换社团决策。该决策包括离开社团和加入社团两个操作,如图4所示,切换社团操作的详细步骤如下:

(331)首先求得与选取节点不在同一社团的邻居节点的集合;

(332)计算步骤(331)得到的集合中所有节点归属社团的大小,即社团的节点数;

(333)判断步骤(332)得到的最大社团的节点数是否大于与选取节点在同一社团的节点数,如果不大于则返回一个小值,本实施例取-100。否则,继续进行下一步;

(334)计算该节点及其邻居节点的效用值总和,作为选取节点的初始效用值;

(335)将与选取节点不在同一社团的邻居节点所归属的社团作为待加入的社团集;

(336)将选取节点当前所归属的社团作为待离开的社团集;

(337)从待离开社团集中循环选取一个社团执行离开操作,然后再从待加入社团集中循环选取一个社团执行加入操作;

(338)计算执行切换策略后的选取节点及其邻居节点的效用值总和;

(339)判断步骤(338)计算得到的效用值是否大于选取节点的当前效用值,若不大于则无操作,否则更新节点当前效用值为执行切换社团操作后的效用值,并保存和更新节点的社团归属;

(340)重复步骤(337)-(339)直到所有切换社团策略执行完毕,返回最优切换社团策略和其效用值。

(40)比较并更新社团。如图1所示,此步骤包括:

(41)策略选择:对比(31)(32)(33)得到的效用函数值,选择具有最大效用值的策略为选取节点的待选策略。然后,比较其与当前效用值的大小,若待选策略的效用值大于当前策略,则更新当前策略为待选策略,并同步更新当前效用函数值。否则,不更新当前策略。

(42)社团更新:在完成策略选择之后,同步更新节点i对应的社团归属。同时,将与节点i的策略更新相关的节点加入待处理节点集中,将节点i从待处理节点集中剔除。

(50)若博弈未达到局部纳什均衡状态,则返回步骤(30)继续执行。否则,完成社团结构划分。在本实施例中,纳什均衡状态的判断标准是待处理节点集是否为空,若为空则达到纳什均衡状态,否则就是未达到均衡。

为详细说明所提供方法的有效性和可扩展性,本发明通过实验进行了下面的实施例。

实验分别选取了真实世界符号网络和人工合成符号网络。为评价发明方法的性能,使用符号模块度、标准化互信息、准确率和纯度等指标来度量社团划分结果。同时,为体现本发明在符号网络中社团发现的效果,选取了其他三种经典符号网络社团发现方法进行比较,分别是fec(findingandextractingcommunities)算法、基于约束的semi-nmtf(res-nmtf)算法和符号谱聚类算法(ssc)。本发明所描述方法在实验中用em-game表示。

真实世界符号网络

本实验中选取了三个真实符号网络,分别是slovene议会政党网络(spp)、gahuku-gama部落网络(ggs)和美国高等法院网络(usc)。spp网络描述了1994年斯洛文尼亚议会中10个政党之间的关系,正边表示两个政党之间的活动比较相似,负边表示活动不相似。ggs网络来自于1954年新几内亚高地的16个部落之间的关系,正负边分别代表了两个部落之间的联盟和敌对关系。usc网络是关于2006-2007届美国最高法院中9个法官投票行为的关系网络。本方法应用于上述符号网络中进行社团发现得到如图5所示的社团划分结果。在spp网络中,得到如附图5(a)所示的社团划分结果。本方法将10个政党划分为两个社团,这与实际社团划分情况完全一致,得到的社团发现评价指标acc和nmi都为1。同样地,将本发明所述方法应用于ggs网络,可将该网络划分为3个社团,如附图5(b)示,与实际结果完全一致。最后,在usc网络上进行了社团发现,其社团划分结果如图5(c)所示。该网络包括9个法官,本发明将其划分为了2个阵营,分别是保守派c1={ginsburg,souter,breyer,steven}和自由派c2={alito,kennedy,roberts,scalia,thomas}。其中,对于kennedy的划分最为困难,因为他与c1和c2中的成员之间都存在正连接。但是,由于kennedy与c2中的正连接有4条,而与c1只有3条,且存在一条负连接,所以本方法将其划分到了c2中。在相关文献中,usc网络有两种划分:2个社团或3个社团。2个社团的划分与我们算法得到的划分完全一致。3个社团的情况是将kennedy单独作为一个社团。从博弈论的角度讲,作为理性的参与者,kennedy选择自成一派的收益是最小的,因此正如本方法得到的结果所示,他会选择加入自由派c2,以达到自身利益最大化。

人工合成符号网络

本实验中,在lfr基准人工网络基础上进行改造,生成人工合成符号网络。具体方法是,在保证社团结构不变的情况下,在lfr网络中随机选择一些归属于不同社团的节点对,将其正边改为负边。同时,在社团内部增加少量的负边作为噪声,验证本发明的性能。在本实施例中,利用这种方法,生成了4个符号网络,并在这四个符号网络上利用本发明所述方法进行了社团发现,并与其他三种方法进行了比较,得到如附图6所示的社团发现性能对比结果。在所有网络中,本发明所述方法在所有评价指标上都取得了最优的社团划分结果,较次优的res-nmtf方法在准确率、标准化互信息、符号模块度和纯度等四个指标上分别平均提高了18%、11%、33%和10%。

为系统测试本方法在网络中存在噪声时的性能,本实验利用步骤(10)的方法生成了一些人工合成符号网络,其中参数设置为:节点数n为500,k和maxk分别取15和50,minc和maxc分别为20和50,t1和t2分别是2和1。μ取0.1-0.5,间隔0.1取5个值。对于每个μ,生成p+和p-取值在0-0.8之间、间隔为0.2的各5个网络。利用本发明所述方法对这些网络进行社团发现,并与其他三种方法的社团发现性能进行对比,得到如附图7所示的结果。由图可见,本发明所述方法在绝大部分情况下都有很好的性能,除了个别情况如μ=0.3,p+=0.8等外,其他条件下都优于其他算法。甚至在社团结构较模糊、噪声水平较高的情况下,本发明所述方法也保持了较强的社团识别能力。

以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1