一种在线社交网络谣言传播范围的估计方法与流程

文档序号:21461935发布日期:2020-07-14 16:40阅读:362来源:国知局
一种在线社交网络谣言传播范围的估计方法与流程

本发明涉及信息传播技术领域,特别是涉及一种在线社交网络谣言传播范围的估计方法。



背景技术:

近年来,随着各种在线社会网络的兴起和壮大,如在线社交网络twitter、新浪微博和facebook等,在线社会网络上的信息传播行为也引起了研究人员的极大关注,特别是社交网络中谣言的爆炸性传播现象,传统的网络是以信息内容为主体进行传播,而在线社交网络则是以人为中心,依靠人与人之间的好友关系进行信息的传播,而且在线社交网络中存在聚类及社团结构,这种传播方式极大的增强了谣言传播的速率,将使得谣言爆发式地在网络上传播开来。

网络谣言的传播与传染病的扩散有着相似性,因此大多数针对网络信息的传播研究借鉴sir传染病模型。sir模型是kermack和mckendric提出的一种传染病传播模型。而第一个经典的谣言传播模型dk是由dally和kendal在sir模型的基础上提出的。在这个模型中,人群被分为三部分:不知道谣言的人,听到谣言并传播的人以及知道谣言但已经停止传播的人。maki和thompson对dk模型进行了修正,提出了另一个经典模型mk。随着复杂网络的发展,一些学者发现一个个体同时会受不同类型个体的相互作用,系统中同时发生的动力学过程会导致相互依赖关系,两个或多个动态过程的共存和非平凡的相互依存的现象在社会系统和自然科学中也普遍存在。例如,人类与疾病传播共存与协同进化的预防行为、不同的动力学过程在神经系统中相互作用并控制人脑中的结构-功能关系等。因此一些研究在谣言传播模型中也考虑到了复杂网络中的动力学行为,将谣言传播模型和复杂网络理论相结合进行了更深入的研究。zanette和buzna研究了在小世界网络中的谣言传播模型并得到了谣言传播的阈值。moreno等人研究了复杂网络中经典谣言传播模型的动力学行为。gu等人在精度谣言传播模型中考虑了记忆和遗忘机制的影响,并详细分析了这两种状态下对谣言传播过程的影响。nekovee等人改进了考虑遗忘机制的谣言传播模型,并运用平均场理论,得到了谣言传播阈值,分析了谣言在不同网络中传播的动力学行为。zhao等人首先研究了一个sir谣言传播模型中的谣言传播行为,并将它成功应用于一个在线社交博客平台。紧接着,zhao等人进一步分析了带有记忆机制和遗忘机制的经典谣言传播模型,建立了一个sihr模型,并将它重新引入到均质网络中分析了其动力学行为。2019年,soriano等人引入了一个双层网络模型来研究社会系统中信息传播与舆论形成的相互作用。

申请号为cn201811330229.6的中国专利公开了一种基于社交网络双谣言模型的谣言传播范围估计方法,所述方法包括以下步骤:(1)根据si模型,考虑两条谣言传播和他们之间的相互作用,构建双谣言si模型,得到双谣言si模型下不同状态用户人数比例随时间变化的微分方程组;(2)在si模型基础上,考虑有免疫者的情况,构建基于sir模型的双谣言模型,分别考虑度均匀网络和度不均匀网络,进一步得到双谣言sir模型下不同状态用户人数比例随时间变化的微分方程组;(3)对方程进行简化,推出两种网络中传播阈值表达式,得出在终态稳态中传播阈值和传播范围的关系,从而估计出谣言的传播范围。

上述专利在双谣言传播的基础上,提出了一种新的双谣言相互作用的分析方式,并推导出阈值的表达式,仿真了感染规模和传播阈值的关系,从而根据阈值估计谣言扩散的范围,估计准确度更高;但是,在当前主流社会网络中,谣言的传播过程亦会受到社会群体和人类行为的影响,比如当人们在知道消息的前提下,通过他人的提醒或议论知道这是个假消息后,人们也失去传播的兴趣了;此外,在以微信为代表的社交网络中,谣言往往通过转发群的形式传播,抑制者接收到谣言信息并加上与其相反的意见评论时,其群内所有好友节点均能接收到,即抑制者对谣言的负面评论具有广播效应。基于此,对比专利忽略了真实在线社交网络的特点,构建的模型中节点自身不具备辨识能力,故而对真实世界社交网络的模拟程度不高。



技术实现要素:

本发明的目的是提供一种基于sir模型的在线社交网络谣言传播范围的估计方法,解决现有方法忽略真实在线社交网络特点的技术问题,构建带有辟谣机制的谣言传播模型,改善以往模型中节点自身不具有一定的辨识能力的缺陷,更加真实的模拟真实世界社交网络中的谣言传播过程。

为了实现上述目的,本发明采用以下技术方案。

一种在线社交网络谣言传播范围的估计方法,包括以下步骤:(1)根据输入的节点和节点之间的连边构建对应的社交网络g;(2)在步骤1所述社交网络g的基础上,引入辟谣机制,结合复杂网络意见动力学理论,构造基于sir模型的在线社交网络谣言传播模型;(3)调节步骤2中辟谣机制的评论概率gamma,观察所述在线社交网络谣言传播模型中各节点的状态变化,得出评论概率和传播范围的关系,从而估计出谣言的传播范围。

作为优选,步骤1中,g=(v,e),其中,v表示网络节点的集合,e表示网络边的集合。

作为优选,步骤2中,sir模型中存在三种状态节点s,i和r,其中,s表示未知者,即不知道消息的人,i表示已知者,即知道消息但是不知道消息真假的人,r表示移除者,即知道消息为谣言的人,三种状态的节点可进行转化,s状态节点可转化为i状态节点,转化概率为p,i状态节点可转化为r状态节点,转化概率为(1-p)。

作为优选,所述社交网络g中共有n个节点,当时间步长t=0时,社交网络g中含有s个i状态节点,n个r状态节点,以及(n-s-n)个s状态节点,设定时间步长t的阈值为t。

作为优选,选取一个i状态节点作为谣言传播者,将该节点以及与该节点直接相连的节点构成的集合定义为群b,统计群b里r状态节点的个数,记为m,群b里所有的s状态节点分别以概率p转换为i状态节点,群里所有的i状态节点分别以概率(1-p)转换为r状态节点;定义集合a=g\b,选取集合a中的i状态节点作为谣言传播者进行谣言的传播,更新各个节点的状态,统计集合a中三种状态节点的数目,将t+1赋值给t,重复上述过程,当t与t相等时停止。

作为优选,p=pow(gamma,m),其中,pow(gamma,m)表示gamma的m次方,gamma表示群b里一个r状态节点进行评论的概率,(1-p)表示群b里所有r节点进行评论的概率。

作为优选,gamma∈[0.01,1],gamma每次变化的幅度为0.01。

本发明所述一种在线社交网络谣言传播范围的估计方法的步骤解析如下:

步骤(1).构造网络;

根据输入的节点和节点之间的连边构建对应的网络g,g=(v,e);其中,v表示网络节点的集合,g表示网络边的集合。

步骤(2).构造改进的sir谣言传播模型;

构建基于改进的sir谣言传播模型,模型中具有三种状态节点,其中s表示未知者(即不知消息的人),i表示已知者(知道消息,但不知信息真假的人),r表示移除者(明确已知信息是假消息,即为谣言),三种状态节点能进行相应的转化,s状态节点能以概率p转化成i状态节点,i状态节点能以概率(1-p)转换成r状态节点;

假设网络中共有n个节点,初始网络中含有s个i状态节点,n个r状态节点,剩余的(n-s-n)都为s状态节点,t表示传播的时间步长,t为时间步长t的阈值。

所述基于sir谣言传播模型的具体传播过程:

(1)初始时刻t=0,每次进行谣言传播之前,统计当前时刻网络中未进行传播过的i状态节点,其中每个i状态节点只能作为一次谣言传播者;

(2)选取(1)中得到的其中一个i状态节点作为谣言传播者进行谣言的传播,该节点首先会把消息传到以该节点为中心的群里,即与该节点直接相连的节点构成的集合;

(3)根据(2)过程,统计群里r状态节点个数,记为m,然后群里的所有s状态节点分别以概率p转换成i状态节点,其中s状态节点只能转换成i状态节点或者不转换,群里的所有i状态节点以及谣言传播者i分别以(1-p)概率转换成r状态节点,以p的概率保持状态不变,其中i状态节点只能转换成r状态节点或者不转换;

p=pow(gamma,m);其中pow(gamma,m)表示gamma的m次方,gamma表示群里一个r状态节点进行评论的概率,(1-p)表示群里所有r节点进行评论的概率;

(4)重新回到(2)过程,依次选取(1)过程中得到的剩余i状态节点作为传播者进行谣言的传播;

(5)统计当前时刻三种状态节点的个数,重新回到(1)过程,进行下一时刻的遍历,t=t+1,直到t=t停止遍历。

步骤(3).根据步骤(2)调节参数gamma对谣言抑制的影响;

考虑参数gamma的不同值对谣言抑制的影响,参数gamma从0.01-1,步长为0.01变化,对于每个时间步长t,重复步骤(2)中sir谣言传播模型的传播过程,首先统计没有传播过信息的i状态节点,然后将所有没有传播过的i状态节点依次作为传播者进行信息传播,更新节点的状态,统计三种状态节点的数量,然后进行下一个时间步长的传播。其中,为考虑实验结果的有效性,对每个gamma值都做了多次实验取平均值,最终对于每个不同的gamma值得到三种不同状态的节点的占比,具体的,对于每个gamma值对应的三种节点的占比是通过计算每个gamma多次实验的所有时刻三种状态节点个数占比的平均值得到的。

通过对er、ba人工网络以及真实网络的实验模拟,我们发现抑制者不同的评论概率对谣言传播范围有着不同的影响,随着抑制者评论概率的增加,谣言的传播范围先减小后增大,通过实验结果我们可以得出,不是抑制者的评论概率越大,谣言抑制的效果越好,因此对于抑制者选择合适的评论概率对于谣言传播范围有着重要的影响。

综上所述,本发明具有如下有益效果:(1)构建带有辟谣机制的谣言传播模型,改善以往模型中节点自身不具有一定的辨识能力的缺陷,更加真实的模拟真实世界社交网络中的谣言传播过程;(2)发现抑制者不同的评论概率对谣言传播范围有着不同的影响,随着抑制者评论概率的增加,谣言的传播范围先减小后增大,明确抑制者的评论概率的选择对谣言传播范围的重要性。

附图说明

图1是基于sir模型的在线社交网络谣言传播范围的估计方法的节点状态转换图。

图2是举例说明在单位时间步长内的三种状态节点状态转换图。

图3是实施例2中参数gamma与三种状态节点数量之间的关系曲线。

图4是实施例3中参数gamma与三种状态节点数量之间的关系曲线。

图5是实施例4中参数gamma与三种状态节点数量之间的关系曲线。

图中:

图2中,圆表示社交网络g中的节点,圆中的字母表示该节点的状态,连接两个圆的实线表示社交网络g中的连边,圆旁边的数字表示该节点的编号,编号与编号对应的节点通过虚线相连;

图2(b)和图2(c)中,样条曲线围成的圈表示一个i状态节点以及与该节点直接相连的节点构成的群。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。

在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

实施例1:

如图1和图2所示,一种在线社交网络谣言传播范围的估计方法,具体步骤包括:

步骤(1).构造网络;

根据输入的节点和节点之间的连边构建对应的网络g,g=(v,e);其中,v表示网络节点的集合,e表示网络边的集合,图2(a)所示的是我们构造的一个人工网络,其中含有20个节点,20条边,其中节点里的字母表示节点的状态,由s、i、r三种状态节点组成,初始网络中i状态节点有2个,r状态节点有2个,剩余的18个节点都为s状态节点,图2中的(b)(c)(d)表示传播的时间步长t=1的状态转换图。

步骤(2).构造改进的sir谣言传播模型;

构建基于改进的sir谣言传播模型,模型中具有三种状态节点,其中s表示未知者(即不知消息的人),i表示已知者(知道消息,但不知信息真假的人),r表示移除者(知道已知信息是假消息,即为谣言),三种状态节点能进行相应的转化,s状态节点能以概率p转化成i状态节点,i状态节点能以概率(1-p)转换成r状态节点。

所述基于sir谣言传播模型的具体传播过程:

(1)初始时刻t=0,每次进行谣言传播之前,统计当前时刻网络中未进行传播过的i状态节点,其中每个i状态节点只能作为一次谣言传播者,如图2(a)所示,在传播之前有2个未传播过的i状态节点,节点的编号为5号节点和7号节点;

(2)如图2(b)所示,选取(1)中得到的其中一个i状态节点,5号节点作为谣言传播者进行谣言的传播,该节点首先会把消息传到以该节点为中心的群里,其中与5号节点直接相连的节点构成谣言传播的群,传播群由1号节点、2号节点、3号节点、4号节点、5号节点构成,其中该群里含有三个s状态节点分别是1号节点、2号节点和3号节点,有1个i状态节点,节点编号为5,有一个r状态节点,节点编号为4;

(3)根据(2)过程,统计群里r状态节点个数,记为m,如图2(b)所示,群里含有1个r状态节点,即m=1;

p=pow(gamma,m);其中pow(gamma,m)表示gamma的m次方,gamma表示群里一个r状态节点进行评论的概率,(1-p)表示群里所有r节点进行评论的概率。

假定gamma=0.5,所以p=0.5,然后群里的所有s状态节点(即1号节点,2号节点和3号节点)分别以概率p(即0.5)转换成i状态节点,其中s状态节点只能转换成i状态节点或者不转换,群里的所有i状态以及谣言传播者i(即5号节点)分别以(1-p)(即0.5)概率转换成r状态节点,其中i状态节点只能转换成r状态节点或者不转换,如图2(c)所示,最终原来为s状态的2号节点转变成了i状态节点,其余的节点状态没有转变;

(4)重新回到(2)过程,依次选取(1)过程中得到的剩余i状态节点作为传播者进行谣言的传播,如图2(c)所示,我们选取剩余的i状态节点7号节点作为传播者进行谣言的传播,如图2(d)所示,最终群里的6号节点由原来的s状态节点转换成i状态节点,群里的7号节点的由原来的i状态节点转换成r状态节点;

(5)统计当前时刻三种状态节点的个数,i状态节点有3个,r状态节点有3个,s状态节点有14个,重新回到(1)过程,进行下一时刻的遍历,t=t+1,直到t=t停止遍历,由于本实施例中只举例说明时间步长为1的具体节点状态转换情况,所以至此结束。

步骤(3).根据步骤(2)调节参数gamma对谣言抑制的影响;

为考虑参数gamma的不同值对谣言抑制的影响,本发明中参数gamma从0.01到1变化,变化步长为0.01,对于每个时间步长t,重复步骤(2)中sir谣言传播模型的传播过程,首先统计没有传播过信息的i状态节点,然后将所有没有传播过的i状态节点依次作为传播者进行信息传播,更新节点的状态,统计三种状态节点的数量,然后进行下一个时间步长的传播。其中为了考虑实验结果的有效性,对每个gamma值都做了多次实验取平均值,最终对于每个不同的gamma值我们得到三种不同状态的节点的占比,对于每个gamma值对应的三种节点的占比是通过计算每个gamma多次实验的所有时刻三种状态节点个数占比的平均值得到的。

实施例2:

图3所示为er网络中参数gamma变化对三种状态节点数量的影响,其中er网络有10000个节点,平均度为10,gamma∈[0.01,0.09],gamma的变化步长为0.01,时间步长t为800,对于每个gamma值做200次重复实验,图中的每个点是,对应横坐标的gamma值,进行迭代次数为200,时间步长为800的三种状态节点个数占比的平均值。从图中可以看出随着抑制者评论概率gamma的增加,s状态节点个数逐渐变少,i状态节点个数逐渐变多,r状态节点个数先增多后减少,即随着抑制者评论概率的增加,谣言的传播范围先减小后增大,基于此可以得出,并非gamma越大,最终r状态节点个数越多,谣言抑制的效果越好,对于抑制者选择合适的评论概率对于谣言传播范围有着重要的影响,从图中可见当gamma取0.8左右,谣言传播的范围最小,谣言抑制的也越好。

实施例3:

图4所示为ba网络中参数gamma变化对三种状态节点数量的影响,其中ba网络有1000个节点,m0=2,m0表示在ba网络的构建的过程中,每增加一个新节点与已知节点连接的节点个数,gamma∈[0.01,0.09],gamma的变化步长为0.01,时间步长t为800,对于每个gamma值均进行200次重复实验,其中,我们发现三种状态节点随者gamma的变化与实施例2中的er网络有相同的变化趋势,从图中可见当gamma取0.65左右,谣言传播的范围最小,谣言抑制的也越好。

实施例4:

图5所示为facebook网络中参数gamma变化对三种状态节点数量的影响,facebook网络构成一个无向图,图中含有63731个节点,817035条边,每条边表示对应的两个用户存在好友关系,gamma∈[0.01,0.09],gamma的变化步长为0.01,时间步长t为800,对于每个gamma值均进行200次重复实验,其中,我们发现三种状态节点随者gamma的变化与实施例2中的er网络有相同的变化趋势,从图中可见当gamma取0.92左右,谣言传播的范围最小,谣言抑制的也越好。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1