1.本发明属于网络技术领域,具体涉及一种基于网络动态社交话题的词条最大影响力节点预测方法。
背景技术:2.社交网络是一种由节点、链接以及文档组成的新型社交网络。其中,节点代表语义社交网络个体;链接代表节点和节点之间的关系,文档代表网络个体发表的文本,例如帖子、视频等。社交网络的流行引起了人们对信息传播的高度关注,通过网络中的节点之间的“口碑传播”,信息很快就会变得无处不在。这种扩散现象已经在许多应用出现。在线社交网络作为目前最流行的信息传播平台,其影响力可以从几个主要的影响者扩散到社交网络中的数亿用户。为了确定那些关键的影响者,影响力预测需要进行了大量工作,以寻求扩大宣传或消除影响等作用。但是,最大影响力节点预测包含两个问题假设:一是所有用户对话题都同样感兴趣,二是所有用户的兴趣不会改变。因此,在考虑网络社交的动态性的同时,也要考虑预测方法的效率性和准确性。
技术实现要素:3.本发明的目的在于提供一种更准确、更快速的基于网络动态社交话题的词条最大影响力节点预测方法。
4.本发明的目的是这样实现的:
5.一种基于网络动态社交话题的词条最大影响力节点预测方法,包括如下步骤:
6.(1)在网络中提取社交网络图t=(i,r),采集社交网络图中所有用户节点集合i、社交网络图中所有边的集合r和社交网络图中所有话题的集合m;
7.(2)将社交网络图和需要预测计算的话题m输入预测程序;
8.(3)获取基于话题的节点;
9.(4)生成基于话题的节点元组,当基于话题的节点发生变化时,更新元组;
10.(5)计算话题下,节点的传播概率,选出影响力最大的用户节点。
11.所述的步骤(3)包括:
12.(3.1)计算社交网络图中用户节点的数量a;
13.(3.2)采集用户节点iv对话题m的感兴趣程度
14.(3.3)计算社交网络图中每个节点对于话题的敏感度:
[0015][0016]
(3.4)计算敏感度阈值;
[0017][0018]
(3.5)对每一个用户节点iv,进行阈值判断;
[0019]
若则删除该节点,否则保留节点,获取节点集
[0020]
所述步骤(4)包括:
[0021]
(4.1)计算用户h
p
对话题集合m中各话题的感兴趣程度
[0022]
(4.2)生成节点集元组
[0023]kp
是激活函数,h
p
为t的子图;
[0024]
(4.3)当节点对话题的感兴趣程度发生改变时,通过节点的节点集元组判定节点是否与目标主题相关,如果不相关则删除该节点;如果相关,判断节点的话题发生改变;若节点的主题向量发生改变,则更新元组vg;
[0025]
计算节点对于话题传播概率包括:
[0026]
(5.1)计算节点之间的相关关系;
[0027]
(5.2)计算节点之间的话题相似度;
[0028]
(5.3)计算计算节点对话题的接受度;
[0029]
(5.4)计算话题下节点之间的传播概率。
[0030]
所述步骤(5.1)包括:
[0031]
(5.1.1)对于节点h,节点i和用户节点iv,提取节点h与节点iv之间的联系的次数节点i与节点iv之间的联系的次数和节点h与节点i之间的联系的次数d
h,i
;
[0032]
(5.1.2)计算节点h与节点i之间的联系紧密度:
[0033][0034]
(5.1.3)q
h,i
≥ηi则节点h与节点i之间相关;若q
h,i
《ηi,则节点之间不相关,剔除不相关节点,ηi为联系紧密度阈值。
[0035]
所述步骤(5.2)包括:
[0036]
(5.2.1)计算节点h的话题分布:
[0037][0038]
(5.2.2)计算节点h与节点i之间的话题相似度:
[0039][0040]
所述步骤(5.3)包括:
[0041]
(5.3.1)提取节点i对特定的话题m的接受数量zm;计算节点i对话题w的接受数量zw;
[0042]
(5.3.2)计算节点i对话题m的接受度:
[0043][0044]
所述步骤(5.4)包括:
[0045]
计算话题m下节点之间的传播概率:
[0046][0047]
所述的选出影响力最大的用户节点包括:
[0048]
(6.1)令g=1,选择元组vg具有感兴趣程度的节点作为种子节点,记为顶点ig;
[0049]
(6.2)检查每个草图(mv,kv,uv),如果ig∈i(uv)则将顶点ig删除;mv是目标顶点,uv是g的子图;
[0050]
(6.3)令g=g+1,在删除后的节点中选择感兴趣程度最大的顶点,重新记为顶点ig;
[0051]
(6.4)若g《x,则返回步骤(4.2);否则,输出顶点集{v1,v2,
…
,v
x
};其中x是输入参数。
[0052]
本发明的有益效果在于:
[0053]
本发明提出一种基于网络动态社交话题的词条最大影响力节点预测方法,在基于话题的传播模型下有函数的单调子模性和np难特性。本发明首先在网络中提取社交网络图;将社交网络图和需要预测计算的话题m输入预测程序;获取基于话题的节点后,生成基于话题的节点元组,当基于话题的节点发生变化时,更新元组;最后计算话题下,节点的传播概率,选出影响力最大的用户节点。本方法相比于同类预测方法在效率性和准确性优势明显。
附图说明
[0054]
图1为本发明实施例中社交平台的示意图。
[0055]
图2为本发明实施例中社交平台中节点话题的向量表。
[0056]
图3为本发明实施例应用某社交平台找到的最大影响力节点结果显示。
具体实施方式
[0057]
下面结合附图对本发明做进一步描述。
[0058]
实施例1:
[0059]
本实施例采用了某音和某手这两个目前社会用户较多的社交网络平台数据集来验证本发明方法的性能。某音和某手是两个兴趣类网络社交平台,用户通过这类平台发布的视频信息。本方法利用话题传播模型u_bit对数据集进行话题挖掘,筛选出实施排列在前8位的话题领域为{旅游,美食,养生,社会,科技,体育,军事,影视}。对目标话题的节点进行获取,在限定话题的要求下,本方法要找出影响力最大的种子集。但以往的社交平台中有大量用户节点对当前话题并不感兴趣,因此也没有信息传播能力,因此本方法要对原始的种子集根据话题进行筛选。节点之间的激活概率受节点之间的联系紧密度影响。两个节点之间的联系次数越多,说明两个节点的关系更紧密,两个节点之间更容易传播消息。
[0060]
(1)在网络中提取社交网络图t=(i,r),采集社交网络图中所有用户节点集合i、社交网络图中所有边的集合r和社交网络图中所有话题的集合m;
[0061]
(2)将社交网络图和需要预测计算的话题m输入预测程序;
[0062]
(3)获取基于话题的节点;
[0063]
(3.1)计算社交网络图中用户节点的数量a;
[0064]
(3.2)采集用户节点iv对话题m的感兴趣程度
[0065]
(3.3)计算社交网络图中每个节点对于话题的敏感度:
[0066][0067]
(3.4)计算敏感度阈值;
[0068][0069]
(3.5)对每一个用户节点iv,进行阈值判断;
[0070]
若则删除该节点,否则保留节点,获取节点集
[0071]
(4)生成基于话题的节点元组,当基于话题的节点发生变化时,更新元组;
[0072]
(4.1)计算用户h
p
对话题集合m中各话题的感兴趣程度
[0073]
(4.2)生成节点集元组
[0074]kp
是激活函数,h
p
为t的子图;
[0075]
(4.3)当节点对话题的感兴趣程度发生改变时,通过节点的节点集元组判定节点是否与目标主题相关,如果不相关则删除该节点;如果相关,判断节点的话题发生改变;若节点的主题向量发生改变,则更新元组vg;
[0076]
(5)计算话题下,节点的传播概率,选出影响力最大的用户节点。
[0077]
(5.1)计算节点之间的相关关系;
[0078]
(5.1.1)对于节点h,节点i和用户节点iv,提取节点h与节点iv之间的联系的次数节点i与节点iv之间的联系的次数和节点h与节点i之间的联系的次数d
h,i
;
[0079]
(5.1.2)计算节点h与节点i之间的联系紧密度:
[0080][0081]
(5.1.3)q
h,i
≥ηi则节点h与节点i之间相关;若q
h,i
《ηi,则节点之间不相关,剔除不相关节点,ηi为联系紧密度阈值。
[0082]
(5.2)计算节点之间的话题相似度;
[0083]
(5.2.1)计算节点h的话题分布:
[0084][0085]
(5.2.2)计算节点h与节点i之间的话题相似度:
[0086][0087]
(5.3)计算计算节点对话题的接受度;
[0088]
(5.3.1)提取节点i对特定的话题m的接受数量zm;计算节点i对话题w的接受数量zw;
[0089]
(5.3.2)计算节点i对话题m的接受度:
[0090][0091]
(5.4)计算话题下节点之间的传播概率。
[0092]
计算话题m下节点之间的传播概率:
[0093][0094]
所述的选出影响力最大的用户节点包括:
[0095]
(6.1)令g=1,选择元组vg具有感兴趣程度的节点作为种子节点,记为顶点ig;
[0096]
(6.2)检查每个草图(mv,kv,uv),如果ig∈i(uv)则将顶点ig删除;mv是目标顶点,uv是g的子图;
[0097]
(6.3)令g=g+1,在删除后的节点中选择感兴趣程度最大的顶点,重新记为顶点ig;
[0098]
(6.4)若g《x,则返回步骤(4.2);否则,输出顶点集{v1,v2,
…
,v
x
};其中x是输入参数。
[0099]
本发明同时引入了社交网络平台影响力生成过程中节点之间的传播概率的多种特征,分别是节点对话题的接受度、节点之间的话题相似度、节点之间的相关关系,这三种特征潜在成为影响用户节点的关键特征,针对网络平台的用户行为预测提供了更可靠的准确性,最后通过创新的传播概率模型,预测了关注的社交网络事件对用户节点影响的程度。
[0100]
相比于现有技术具有以下优点:
[0101]
1.本发明针对社交网络平台信息传播过程中,用户节点的影响力预测进行建模,预测用户未来可能存在的影响力。本发明扩展了社交影响力预测的深度学习方法,针对社交网络平台,设计了一种符合传播时序过程的采样方法,并建立了用户之间的影响力关系,应用了一个端到端的图神经网络模型中,可以得到更强的特征表现能力,更精准的预测了用户未来的社交影响力。
[0102]
2.本发明利用了节点状态特征等多种影响力预测中的显著特征,针对社交网络的用户行为预测提供了更可靠的准确性。针对不同的话题事件,可以根据数据训练出基于关注话题的影响力预测模型,更好的解决用户行为预测问题。可以用于监测参与人数较为集中的事件,例如热点问题、事件等的个体行为的预测与监管。
[0103]
此外,对于网络平台变化,还可以对社交网络图进行下面一些操作,包括:添加顶点、删除顶点、添加边、删除边和更新传播概率。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。