一种不确定源的负影响力抑制最大化方法

文档序号:30223669发布日期:2022-05-31 23:40阅读:140来源:国知局
一种不确定源的负影响力抑制最大化方法

1.本发明属于社会网络科学领域,特别是一种不确定源的负影响力抑制最大化方法。


背景技术:

2.随着社会网络的日益壮大,商家消费者身份的互相转换,影响力也成为每个人的关注点。具有新型商品或者需要推广的信息就会通过寻找具有影响力的传播者进行宣传。然而,一个行业中会存在多个商家在一起竞争。例如商家a和b在宣传同一类型的产品时,商家a为了扩大自己的影响力,可能会选择一些不利于商家b的舆论来打压商家b的产品,使得商家b的影响力没有商家a的大。此时,商家b就需要寻找一些利于自身的k个个体、群体或平台,抵消商家a所散播的不利影响,以此达到抑制负影响的目的。这就是负影响力最大化问题。传统的负影响力抑制最大化方法有基于竞争的方法和基于免疫的方法,使用的传播模型有基于独立级联的模型、基于线性阈值的模型等。然而,由于社交网络隐私性,不能够完全知道负影响散播的确切源头在哪里,只能知道他们的概率分布。
3.在计算机科学领域,基于互联网和大数据的影响力传播研究也从21世纪开始兴起。影响力传播的研究主要有三大支柱:第一是影响力传播的模型,主要描述影响力在社交网络中如何传播、有何特点和性质;第二是影响力传播的学习,即如何利用网络大数据挖掘学习影响力传播模式和具体传播模型的参数;第三是影响力传播优化,着重于考虑在不同的传播模型下,如何通过施加外部作用(比如选取有影响力的初始传播用户和改变传播途径等)来扩大希望传播的影响力或者控制和减弱不希望传播的影响力,也包括有效的监控影响力的传播等。
4.负影响力抑制最大化为给定负种子节点的集合,在网络中找到k个正种子节点并通过这k个种子最大限度地抑制整个网络中地负影响力。最初由kempe等人提出的基于独立级联和线性阈值的两个基本模型并证明了这一问题是np-hard问题。几乎所有的研究都是在这两个模型之下开展的。传统的独立级联模型中,每个节点都会有一个可能被激活的概率p,假定v是被激活的种子,当节点v向其邻居节点u传达的概率大于p,则u被激活。相较于线性阈值模型,该模型的传播性能简单易懂。负影响力抑制最大化使用的贪心算法几乎是非常完美的,虽然可以找出影响力最大化的种子,但是当需要换别的种子的时候,又需要重新计算,所以在时间复杂度上是一大弱点。而且上述分析均是基于了负影响源是已知的情况下,由于社交网络的隐私性,负影响源在很多时候是不确定的,这也是一个亟待解决的问题。


技术实现要素:

5.发明目的:本发明的目的在于克服上述缺陷,设计一种不确定源的负影响力抑制最大化方法,提出了节点负影响力抑制指标

(w),针对不确定源的负影响力种子,多次抽样网络的子图,精确选择正种子集,最大限度抑制负影响力。
6.技术方案:本发明所述的一种不确定源的负影响力抑制最大化方法,具体包括以下步骤:
7.(1)根据chernoff界构建对有向图g构建r个活边子图g’=(v,e’);对于g中的每一个节点v,从v的入边集合中以p(u,v)的概率选择一条边(u,v),从g中构造活边子图g’;
8.(2)对每一个活边子图g’下,对每一个活边子图g’中以d为根,利用广度优先构建对应的传播树
9.(3)当加入一个新的正种子节点v后,在传播树上计算抑制增量

(w)和节点u在传播树g’上的节点覆盖值
10.(4)取具有最高抑制增量

(w)的节点w作为新的正种子加入种子集合s,依据种子集合个数k确定种子集合s。
11.进一步地,所述步骤(1)实现过程如下:
12.根据chernoff界定义,给定r个在[0,1]中的独立同分布的随机变量x1,x2,...,xr,设他们的均值为μ;记x为x1,x2,...,xr的和,对于给定的误差阈值ε》0,有给定误差阈值ε,计算出抽样活边子图的样本数量;设负种子集的最大大小为nd;给定概率ρ,当活边子图数量满足:
[0013][0014]
则误差概率ρ小于ε;其中n为子图gi中最大负影响力的传播值;
[0015]
当获得活边子图数量后,令w(g)为g的所有活边子图的集合,g'∈w(g)为g的一个活边子图,用δ
g'
(v,d)表示在g’中顶点d可以到达的节点数量,可得到:
[0016][0017]
其中,pr(g’|g)表示g能够构造出子图g’的概率:
[0018][0019]
其中,p(d,g’,g)表示在子图g’中顶点d至少和一条边连接的概率;设n(d)表示d的入边邻居集合,p(u,d)表示边(u,d)的传播概率,p(d,g’,g)为:
[0020][0021]
进一步地,所述步骤(2)实现过程如下:
[0022]
基于根在负种子d上的传播树,得到d对于负影响力的传播函数δ(v,d)为:
[0023][0024]
其中,pr(g’)表示的是g能够构造出g’的概率,函数定义为:
[0025]
[0026]
这里,表示中以u为根的子树中的顶点个数,将其记为传播函数改写为:
[0027][0028]
进一步地,所述步骤(3)实现过程如下:
[0029]
当给定正、负种子集合c和d,以及候选正种子节点w∈v\d\c,这里v\d\c表示节点w为从v种去除种子节点c和d后寻找;将节点w加入到c后,抑制增量值

(w)为:
[0030][0031]
其中,表示在子图g’中,去除已有的正种子集合c,以负种子节点d为根下,新加入的正种子节点的覆盖范围,后面的加1表示的是节点d本身,p-(d)表示的是负种子节点的概率分布,pr(g’)表示的是g能够构造出g’的概率。
[0032]
进一步地,所述步骤(4)实现过程如下:
[0033]
对正种子集合s的最终抑制的负影响力的衡量就可以通过新加入的正种子节点w的影响力抑制值

(w)的大小可以直观上的反应,要选取最终负影响力抑制大的正种子节点必然是那些负影响力抑制值

(w)较大的节点,对影响力抑制值

(w)从大到小进行排序后,根据种子节点的个数k,依据节点影响力抑制值

(w),从大到小进行选择种子集合s。
[0034]
有益效果:与现有技术相比,本发明的有益效果:在社会网络中构造了多个活边子图,并基于活边子图定义了传播树来预测影响力传播值,大大减少了时间损耗;由于社交网络中影响力的传播是建立在路径是否可达的基础上的,因此利用删除路径上的一个节点来阻碍影响力的传播,这样做不仅可以找到高质量的正种子集合,还可以节省很多的时间;由于不确定源的负影响力抑制最大化方法只需要进行一次的活边子图构造和传播树的计算,所以模拟次数就会减少了很多,因此可以缩短时间以及减少了存储开销;本发明的求解过程只需要利用传播树上预测计算节点负影响力抑制,方法简单易懂,实现起来也很朴实,并且没有额外的参数,因此方法的鲁棒性能很高;本发明只针对不确定源的负影响力抑制最大化问题提出不确定源的负影响力抑制最大化方法,将不确定源的负影响力抑制最大化找正种子问题化解为寻找在活边子图下的传播树中的最大抑制量节点,即在社会网络的各个活边子图中快速找到一个节点在路径中的抑制效益;大大减少了计算机模拟步骤,缩短了分析每个节点效益的时间;很好地满足了快速寻找种子用户去扩散这样的需求。
附图说明
[0035]
图1为本发明的流程图;
[0036]
图2为本发明在不同个数的正种子对负影响力的抑制效果与其它方法的比较图。
具体实施方式
[0037]
下面结合附图对本发明作进一步详细说明。
[0038]
本发明提供一种不确定源的负影响力抑制最大化方法,需要最大化抑制有向图中
为负状态的节点,即其中c为正种子集合,k为种子集合的大小,d为负种子节点,p-(d)为负种子集合的概率分布,b(c,d)为在正种子集下对d的抑制量;如图1所示,具体包括以下步骤:
[0039]
步骤1、根据chernoff界构建对有向图g构建r个活边子图g’=(v,e’)。对于g中的每一个节点v,从v的入边集合中以p(u,v)的概率选择一条边(u,v),以此从g中构造活的边子图g’。
[0040]
根据chernoff界定义,给定r个在[0,1]中的独立同分布的随机变量x1,x2,...,xr,设他们的均值为μ。记x为x1,x2,...,xr的和,对于给定的误差阈值ε》0,有对此,给定误差阈值ε,可以计算出抽样活边子图的样本数量。设负种子集的最大大小为nd。给定概率ρ,当活边子图数量满足:
[0041][0042]
则误差概率ρ小于ε。其中n为子图gi中最大负影响力的传播值。当获得活边子图数量后,令w(g)为g的所有活边子图的集合,g'∈w(g)为g的一个活边子图,δ
g'
(v,d)表示为在g’中顶点d可以到达的节点数量,这样,就可以得到:
[0043][0044]
这里pr(g’|g)表示g能够构造出子图g’的概率,可以用下式计算:
[0045][0046]
其中,p(d,g’,g)表示在子图g’中顶点d至少和一条边连接的概率。设n(d)表示d的入边邻居集合,p(u,d)表示边(u,d)的传播概率,那么,p(d,g’,g)可以用下式计算:
[0047][0048]
步骤2、基于活边子图所构造的活边子图g’下,记为活边子图g’中以d为根的传播树,利用广度优先方法对每个顶点v构建对应的传播树用传播树中以u为根的子树中的顶点个数,来计算u的影响力传播范围。具体过程如下:
[0049]
基于根在负种子d上的传播树,可以得到d对于负影响力的传播函数δ(v,d)为:
[0050][0051]
这里,
[0052][0053]
其中,表示中以u为根的子树中的顶点个数,可以将其记为则传播函数可以改写为:
[0054][0055]
步骤3、当加入一个新的正种子节点v后,在传播树上计算抑制增量

(w)和节点u在传播树g’上的节点覆盖值具体过程如下:
[0056]
当给定正、负种子集合c和d,以及候选正种子节点w∈v\d\c,这里v\d\c表示节点w为从v种去除种子节点c和d后寻找。将节点w加入到c后,抑制增量值

(w)为:
[0057][0058]
这里,表示在子图g’中,去除已有的正种子集合c,以负种子节点d为根下,新加入的正种子节点的覆盖范围,后面的加1表示的是节点d本身;p-(d)表示的是负种子节点的概率分布;pr(g’)表示的是g能够构造出g’的概率。
[0059]
步骤4、取具有最高抑制增量

(w)的节点w作为新的正种子加入集合s;依据种子集合个数k确定种子集合s;具体过程如下:
[0060]
对正种子集合s的最终抑制的负影响力的衡量就可以通过新加入的正种子节点w的影响力抑制值

(w)的大小可以直观上的反应,要选取最终负影响力抑制大的正种子节点必然是那些负影响力抑制值

(w)较大的节点,对影响力抑制值

(w)从大到小进行排序后,根据种子节点的个数k,依据节点影响力抑制值

(w),从大到小进行选择种子集合s。
[0061]
本发明采用影响力最终抑制的负影响节点数量作为衡量指标,在epinions、nethept、netphy、flickr和wiki-vote等数据集上经过测试。本发明使用matlab模拟仿真并在wiki-vote上和其他方法最终影响力扩散的大小进行比较。测试结果如图2所示,从图中可以看到,最终的抑制节点的个数比其他五种算法选取的正种子所抑制的节点数量更高,因此本发明所选择的正种子可以最大限度地抑制负影响力;且本方法可以灵活的选取种子节点的数量,并负影响力抑制较大的正种子集合s,相比于其他现有的方法,本方法一次计算,多次选取,避免了大量的计算模拟,具有较好的实用性和经济效益。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1