一种基于网络场论的识别网络中最有影响力TOPK节点的方法与流程

文档序号:16733754发布日期:2019-01-28 12:28阅读:518来源:国知局
一种基于网络场论的识别网络中最有影响力TOP K节点的方法与流程

本发明涉及网络科学领域,特别是指一种基于网络场论的识别网络中最有影响力topk节点的方法。



背景技术:

随着微博、微信等各种社交媒体的普及化,越来越多的人开始在这些平台上进行信息的发布、评论、转发、点赞,由此形成了一个庞大的社交网络。在人们的日常生活中,不仅仅存在社交网络,互联网的飞速发展,大数据时代的到来,让人们每天都需要接触各种各样的海量数据以及这些数据组合成的网络,比如高铁网络、公路网络、电力网络等等。研究这些网络的结构、功能以及它们的内在规律是目前的一个热门话题,这些研究在产品推广、舆论监测、网络安全防护、基础建设等领域有十分重要的应用价值。

节点影响力指通过网络中已知的节点信息、网络的拓扑结构等去评估网络中每一个节点在整个网络中的重要性程度,这种重要性程度,一般也描述为该节点在网络中的中心性。参考过去的经验,评估节点影响力的研究主要是基于单个节点的属性或者网络的拓扑结构特征,给出一个代表节点影响力的指标,通常这个值越大,表示节点影响力越大。得到影响力大小的指标后,一般采用sir模型、sis模型、肯德尔系数等衡量方法的优劣性。对于数据量小、结构单一的网络,许多算法都是可行的,性能差距不大,但往往在现实生活中,网络的特性都是多种多样的,数据量也是巨大的,这对评估节点影响力大小的算法的准确程度、效率都有很高的要求。一旦网络变得复杂,节点的中心性特征很难用简单的算法推导得出,从而很难对节点影响力做确切的评估。因此,一个高效、精确的评估节点影响力大小的算法研究是非常重要的。



技术实现要素:

为了克服目前评估节点影响力方法计算复杂度高、准确性低的不足,本发明提出一种准确性较高、时间复杂度较低的一种基于网络场论的识别网络中最有影响力topk节点的方法。

本发明解决其技术问题所采用的技术方案是:

一种基于网络场论的识别网络中最有影响力topk节点的方法,包括如下步骤:

步骤一:构建一个具有n个节点的网络模型g(v,e),v为节点,e为连边,初始化所有节点的k-shell数值ks=1;

步骤二:将度数为ks的节点及其连边从网络中删除,其中一个节点的度数表示与该节点有连边的邻居节点的数量;删除操作进行之后,重新计算网络中剩余节点的度数,接着将新出现的度数为ks的节点及其连边删除;重复上述操作,直到网络中不再新出现度数为ks的节点为止;此步骤中所有被删除的节点及其连边构成网络的ks-shell,记ks-shell中所有节点的k-shell数值等于ks;

步骤三:ks=ks+1,重复执行步骤2,直到获取所有节点的k-shell数值;

步骤四:在网络中任意选取节点i,获取节点i的邻域γ(i),γ(i)包含了与节点i最短路径距离不大于3的邻域内的所有节点;

步骤五:计算节点i和节点j的指数距离

rij=exp(-dij),j∈γ(i),

其中dij表示节点i与节点j的最短路径距离;

步骤六:计算节点i在节点j处的网络场强度

ei(j)=ksi×rij,j∈γ(i),

其中,ksi表示节点的k-shell数值,rij表示网络中节点i与节点j的指数距离;

步骤七:计算节点i在γ(i)邻域内的网络场强度的总和

步骤八:遍历网络,重复步骤四到步骤七,计算出网络中全部节点的网络场强度esum的值,由高到低进行排列,即为节点在网络中影响力大小的排序,其中前k个节点即为最有影响力topk节点,其中k为正整数,k≤n。

本发明的技术构思为:考虑网络中不同节点的网络场会产生相互影响,计算每个节点在自身的局部邻域内网络场强度的总和作为评价该节点在网络中影响力大小的指标,具有准确性高和计算复杂度小的特点。

本发明的有益效果为:计算网络中节点在其邻域内的网络场强度,作为影响力大小的指标,计算量较小,准确性较高,普适性较强。

附图说明

图1为网络示意图,圆点为网络中的节点,每一个节点都有对应的数字标号,节点与节点之间有线连接,代表节点与节点之间的连边,圆点及它们之间的连线构成一个网络。

具体实施方式

下面结合附图对本发明做进一步说明。

参照图1,一种基于网络场论的识别网络中最有影响力topk节点的方法,包括如下步骤:

步骤一:构建一个具有n个节点的网络模型g(v,e),v为节点,e为连边,初始化所有节点的k-shell数值ks=1;

步骤二:将度数为ks的节点及其连边从网络中删除,其中一个节点的度数表示该与节点有连边的邻居节点的数量,在图一中,节点3、6、8、9的度数为ks,将这些点删除;删除操作进行之后,重新计算网络中剩余节点的度数,接着将新出现的度数为ks的节点及其连边删除;重复上述操作,直到网络中不再新出现度数为ks的节点为止;此步骤中所有被删除的节点及其连边构成网络的ks-shell,记ks-shell中所有节点的k-shell数值等于ks,即节点3、6、8、9的k-shell数值等于ks;

步骤三:ks=ks+1,重复执行步骤2,直到获取所有节点的k-shell数值;

步骤四:在网络中任意选取节点i,获取节点i的邻域γ(i),γ(i)包含了与节点i最短路径距离不大于3的邻域内的所有节点;

步骤五:计算节点i和节点j的指数距离

rij=exp(-dij),j∈γ(i),

其中dij表示节点i与节点j的最短路径距离;

步骤六:计算节点i在节点j处的网络场强度

ei(j)=ksi×rij,j∈γ(i),

其中,ksi表示节点的k-shell数值,rij表示网络中节点i与节点jss的指数距离;

步骤七:计算节点i在γ(i)邻域内的网络场强度的总和

步骤八:遍历网络,重复步骤四到步骤七,计算出网络中全部节点的网络场强度esum的值,由高到低进行排列,即为节点在网络中影响力大小的排序,其中前k个节点即为最有影响力topk节点,其中k为正整数,k≤n。

如上所述,本专利实施的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。



技术特征:

技术总结
一种基于网络场论的识别网络中最有影响力TOP K节点的方法,建立网络模型,求出网络中每个节点的K‑shell值,再记录每个节点局部邻域内的所有节点,其中,局部邻域为距离该节点最短路径距离不大于3的领域;计算节点与邻域内所有节点的指数距离,再计算节点对其邻域内的所有节点的网络场强的大小之和,由高到低进行排列,即为节点在网络中影响力大小的排序,其中前K个节点即为最有影响力TOP K节点。本发明考虑了网络中节点在其邻域内的网络场强度,作为影响力大小的指标,计算量较小,准确性较高,普适性较强。

技术研发人员:杨旭华;熊帅;徐新黎
受保护的技术使用者:浙江工业大学
技术研发日:2018.08.30
技术公布日:2019.01.25
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1