本发明涉及自然语言处理,更具体的是,本发明涉及一种基于图卷积网络和社会心理学的社交媒体谣言检测方法。
背景技术:
1、随着移动互联网技术的迅猛发展,以微博、微信、抖音和今日头条为代表的社交媒体平台成为人们发表观点和表达情绪的媒介,但也为谣言的滋生及发展提供了便利,谣言是指语境上模糊或具有潜在威胁且内容上未经官方证实的言论,尤其在各类重大突发公共事件中,谣言的肆意传播具有不可低估的社会影响力,其一旦广泛传播,不仅会误导公众,还可能引发群体恐慌,甚至会导致社会动荡。
2、在现有的网络谣言检测研究中,谣言文本的上下文语义信息、主题语义信息、社会心理学情感信息和谣言传播信息尚未得到充分的运用,一方面,部分学者研究基于谣言文本的上下文语义或主题语义信息的谣言检测,未考虑其他信息,从而影响了检测效果的优化;另一方面,一些学者同时考虑了谣言文本的上下文语义和主题语义信息,却忽视了文本情感信息和谣言传播信息在谣言检测中的重要作用。
技术实现思路
1、本发明的目的是设计开发了一种基于图卷积网络和社会心理学的社交媒体谣言检测方法,综合利用谣言文本上下文语义、谣言主题语义、谣言社会心理学情感信息和谣言传播信息,提高了谣言检测的准确性。
2、本发明提供的技术方案为:
3、一种基于图卷积网络和社会心理学的社交媒体谣言检测方法,包括如下步骤:
4、步骤一、在社交媒体上爬取数据并对数据进行预处理;
5、步骤二、根据所述数据构建谣言事件图,并将所述谣言事件图转化为谣言文本序列;
6、其中,为谣言事件图,为谣言事件编号,为节点集,为源帖子,表示与源帖子相关的按时间排序的第条响应帖子,,为给定谣言事件的响应帖子总数,为边集,为帖子对帖子响应;
7、步骤三、对所述谣言文本序列进行特征提取,获得文本上下文特征、主题相似度特征和社会心理学情感特征,融合后获得谣言文本融合特征矩阵;
8、其中,所述谣言文本融合特征矩阵满足:
9、;
10、;
11、;
12、式中,为谣言事件图的谣言文本融合特征矩阵,为源帖子的文本融合特征,为响应帖子的文本融合特征,为源帖子的主题相似度特征,为响应帖子的主题相似度特征,为源帖子的文本上下文特征,为响应帖子的文本上下文特征,为源帖子的社会心理学情感特征,为响应帖子的社会心理学情感特征;
13、步骤四、将谣言文本融合特征和谣言事件图的邻接矩阵输入至特征重组网络中,获得谣言综合特征;
14、步骤五、将谣言的综合特征输入至谣言分类网络中获得谣言预测分类结果。
15、优选的是,所述预处理具体包括:
16、对重复的谣言事件进行去重处理,若谣言事件里缺失帖子内容,则使用文本“转发微博”进行填充。
17、优选的是,所述谣言事件图通过中文预训练模型转化为谣言文本序列。
18、优选的是,所述响应帖子的主题相似度特征满足:
19、;
20、式中,为响应帖子的主题相似度特征,为源帖子的文本上下文特征,为响应帖子的文本上下文特征。
21、优选的是,所述源帖子的社会心理学情感特征的取值范围为,所述响应帖子的社会心理学情感特征的取值范围为。
22、优选的是,所述谣言的综合特征满足:
23、;
24、;
25、;
26、式中,为谣言的综合特征,为正向传播的表示,为反向传播的表示,表示均值汇聚,表示合并,为通过二次卷积的具有源特征增强隐藏特征矩阵,为通过二次卷积的具有源特征增强隐藏特征矩阵,为文本融合特征矩阵经过正向传播图卷积网络的第一层变压器图卷积的隐藏特征矩阵,为文本融合特征矩阵经过反向传播图卷积网络的第一层变压器图卷积的隐藏特征矩阵。
27、优选的是,所述通过二次卷积的具有源特征增强隐藏特征矩阵和通过二次卷积的具有源特征增强隐藏特征矩阵满足:
28、;
29、;
30、式中,为通过二次卷积的隐藏特征矩阵,为通过二次卷积的隐藏特征矩阵,为通过正向传播网络卷积的源帖子隐藏特征矩阵,为通过反向传播网络卷积的源帖子隐藏特征矩阵。
31、优选的是,所述通过二次卷积的隐藏特征矩阵满足:
32、;
33、;
34、式中,为单位矩阵,为谣言事件图的正向传播邻接矩阵,为重组后的邻接矩阵,为正向传播图卷积网络的第一层变压器图卷积的隐藏特征矩阵,为正向传播图卷积网络的第二层变压器图卷积的隐藏特征矩阵,为第一隐藏特征维度,为与第一隐藏特征维度不同的第二隐藏特征维度,为正向传播图卷积网络的第一可训练参数矩阵,为正向传播图卷积网络的第二可训练参数矩阵,为激活函数。
35、优选的是,所述正向传播图卷积网络的第一层变压器图卷积的隐藏特征矩阵满足:
36、;
37、式中,为激活函数,为正向传播图卷积网络的第一可训练参数矩阵。
38、优选的是,所述谣言分类网络具体满足:
39、;
40、;
41、式中,为全连接层,为激活函数层,为真实标签,为预测标签,表示损失,表示对数函数。
42、本发明所述的有益效果:
43、本发明设计开发的一种基于图卷积网络和社会心理学的社交媒体谣言检测方法,综合地利用谣言文本上下文语义、谣言主题语义、社会心理学情感信息和谣言传播信息,在处理谣言传播过程中的动态交互特征上可能更为强大,因此在谣言检测方面具备更优越的性能,准确率更高,具有更强的分类能力。
1.一种基于图卷积网络和社会心理学的社交媒体谣言检测方法,其特征在于,包括如下步骤:
2.如权利要求1所述的基于图卷积网络和社会心理学的社交媒体谣言检测方法,其特征在于,所述预处理具体包括:
3.如权利要求2所述的基于图卷积网络和社会心理学的社交媒体谣言检测方法,其特征在于,所述谣言事件图通过bert中文预训练模型转化为谣言文本序列。
4.如权利要求3所述的基于图卷积网络和社会心理学的社交媒体谣言检测方法,其特征在于,所述响应帖子的主题相似度特征满足:
5.如权利要求4所述的基于图卷积网络和社会心理学的社交媒体谣言检测方法,其特征在于,所述源帖子的社会心理学情感特征的取值范围为,所述响应帖子的社会心理学情感特征的取值范围为。
6.如权利要求5所述的基于图卷积网络和社会心理学的社交媒体谣言检测方法,其特征在于,所述谣言的综合特征满足:
7.如权利要求6所述的基于图卷积网络和社会心理学的社交媒体谣言检测方法,其特征在于,所述通过二次卷积的具有源特征增强隐藏特征矩阵和通过二次卷积的具有源特征增强隐藏特征矩阵满足:
8.如权利要求7所述的基于图卷积网络和社会心理学的社交媒体谣言检测方法,其特征在于,所述通过二次卷积的隐藏特征矩阵满足:
9.如权利要求8所述的基于图卷积网络和社会心理学的社交媒体谣言检测方法,其特征在于,所述正向传播图卷积网络的第一层变压器图卷积的隐藏特征矩阵满足:
10.如权利要求9所述的基于图卷积网络和社会心理学的社交媒体谣言检测方法,其特征在于,所述谣言分类网络具体满足: