本发明属于网络安全,尤其涉及一种基于图纯化的中毒防御方法、系统、电子设备、介质。
背景技术:
1、随着深度学习的兴起,图神经网络作为一种被广泛应用于图数据处理的工具已经在图表示学习领域中获得了令人瞩目的成绩,它可以对非规则的图结构数据进行高效的分析和处理,并可以有效地应用于下游现实应用中(例如推荐系统、分子结构分析、交通流量预测、诈骗节点识别等),且其效率与质量较传统的图分析方法更为优秀。因此,图神经网络的安全性是保障这些实际任务可以顺利完成的关键。假如图神经网络存在漏洞,则可能引发一些严重的后果,例如:在社交网络中,一则虚假消息不能被正确检测,将会导致谣言的散播,从而影响社会稳定;在电子商务中,网络水军的评论将会对正常用户造成困扰甚至是误导;在通信网络中,一个节点的异常则有可能导致整个通信网络的瘫痪。
2、现有的研究表明,图神经网络容易受到中毒攻击的影响,即当图神经网络模型的训练数据遭受污染或恶意攻击时,经过训练的图神经网络的性能可能大幅下降,从而导致下游应用的分析出错。因此,如何提高对中毒攻击的防御能力时研究的热点。
3、针对上述问题,现有技术中不同的防御策略总的来说可以分为两类:针对数据转换的防御和针对图模型结构的防御。针对数据转换的防御方法主要通过不同节点间的相似度指标进行图纯化,然而这种方式可能会存在一些关键信息丢失的风险;针对图模型结构的防御方法主要是利用注意力机制、高斯分布吸收噪声、蒸馏等方式完成,但是这类方法存在针对性不强、防御代价较高等缺点。因此,如何提高中毒攻击的防御能力、降低防御代价和提高防御对象的多元化在现实应用中具有重要的实际意义。
技术实现思路
1、针对现有技术不足,本发明提出了一种基于图纯化的中毒防御方法、系统、电子设备、介质。
2、为实现上述发明目的,本发明的技术方案为:本发明实施例的第一方面提供了一种基于图纯化的中毒防御方法,,所述方法具体包括以下子步骤:
3、步骤1:基于原始图构建邻接矩阵a,对邻接矩阵a进行奇异值分解,经奇异值过滤后对原始图进行重构,获得纯化图与更新的邻接矩阵
4、步骤2:构建图神经网络,将原始图和纯化图分别对输入至图神经网络进行特征提取,获得原始图节点嵌入向量和纯化图节点嵌入向量;
5、步骤3:基于注意力机制对原始图节点嵌入向量和纯化图节点嵌入向量进行加权;
6、步骤4:利用图神经网络对加权后的节点嵌入向量进行分类,输出置信度,并利用置信度进行标签平滑;
7、步骤5:使用经平滑后的标签训练图神经网络模型,利用训练好的图神经网络模型进行对图中毒攻击的防御。
8、进一步地,对邻接矩阵a进行奇异值分解的公式如下:
9、a=uσvt
10、
11、其中,u=aat,为正交矩阵,满足utu=i,i为单位矩阵,σ为奇异值矩阵,其主对角线元素[λ1,...,λn]为奇异值矩阵σ的奇异值,矩阵内的其余元素均为0;v的列向量为邻接矩阵a的正交的基向量。
12、进一步地,经奇异值过滤后对原始图进行重构,获得纯化图与更新的邻接矩阵的过程包括:
13、根据预设的k值,在主对角线元素[λ1,...,λn]选择排序从大到小靠前的k个奇异值,其余元素置为0,获得经过过滤的奇异值矩阵
14、将获得的合成重新为新的邻接矩阵公式如下:
15、
16、
17、其中,⊙表示逐元素相乘。δ(g)为连边选择函数,表示取的第i行第j列的元素;最终获得经过纯化的图对应的邻接矩阵将更新的邻接矩阵转换为纯化图。
18、进一步地,所述图神经网络为双层图卷积网络。
19、进一步地,获得原始图节点嵌入向量和纯化图节点嵌入向量的过程包括:
20、双层图卷积网络提取节点嵌入向量的公式如下:
21、
22、其中,为图中节点的度矩阵,in为大小为n×n的单位矩阵,图中节点的数量为n,l为当前模型层数,wl为图卷积网络模型第l层的模型权重矩阵;σ(g)为非线性激活函数;
23、根据上述公式,使用构建好的图卷积网络模型对原始图和纯化图进行特征提取,获得原始图节点嵌入向量zori和纯化图节点嵌入向量zcle,公式如下:
24、
25、
26、进一步地,,所述步骤3中基于注意力机制,对原始图节点嵌入向量和纯化图节点嵌入向量进行加权的过程包括:
27、使用双线性模型作为注意力机制计算的打分函数,公式如下:
28、s(zori,zcle)=zoritwzcle
29、其中,w为自适应的参数矩阵;
30、基于注意力机制,在节点t的嵌入向量上第i维的注意力权重为:
31、
32、其中,m为节点嵌入向量的维数;
33、最终得到带有注意力机制的加权节点嵌入向量zatt=α⊙zori;
34、α为组成的注意力权重矩阵,且与zori的维度相同,⊙为逐元素乘积。
35、进一步地,所述步骤4中利用置信度进行标签平滑的过程包括:
36、图神经网络模型提取到的加权节点嵌入向量输入到一个基于2层的多层感知机的分类器中,获得分类器对节点预测的输出置信度:然后根据置信度p和节点的独热标签矩阵y进行标签平滑操作;
37、首先针对节点t,提取置信度p中预测概率最大的类别k及其对应的概率则:
38、
39、其中,为节点t上输出的第j类的标签,k为图中节点的标签数量;
40、最终计算经过平滑后的标签为:
41、
42、其中,ρ为控制平滑度的放缩因子。
43、本发明实施例的第二方面提供了一种基于图纯化的中毒防御系统,用于实现上述的基于图纯化的中毒防御方法,所述系统包括:
44、纯化图重构模块,基于原始图构建邻接矩阵a,对邻接矩阵a进行奇异值分解,经奇异值过滤后对原始图进行重构,获得纯化图与更新的邻接矩阵
45、节点嵌入向量获取模块,将原始图和纯化图分别对输入至图神经网络进行特征提取,获得原始图节点嵌入向量和纯化图节点嵌入向量;
46、节点嵌入向量加权模块,基于注意力机制对节点嵌入向量获取模块输出的原始图节点嵌入向量和纯化图节点嵌入向量进行加权;
47、标签平滑模块,利用图神经网络对加权后的节点嵌入向量进行分类,输出置信度,并利用置信度进行标签平滑;
48、中毒防御模块,使用经平滑后的标签训练图神经网络模型,利用训练好的图神经网络模型进行对图中毒攻击的防御。
49、本发明实施例的第三方面提供了一种电子设备,包括存储器和处理器,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述的基于图纯化的中毒防御方法。
50、本发明实施例的第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的基于图纯化的中毒防御方法。
51、与现有技术相比,本发明具有的有益效果至少包括:本发明提供的基于图纯化的中毒防御方法,首先,对输入的图对应的邻接矩阵进行奇异值分解,通过奇异值过滤的方法对图进行重构,获得经过纯化的图;其次,构建图神经网络对原图和经过纯化的图进行特征提取;然后,引入注意力机制获得加权节点嵌入;再次,利用获得的加权节点嵌入输入到分类器模型中,将输出置信度进行标签平滑;最后,利用训练好的图神经网络模型进行对图中毒攻击的防御。提高了对中毒攻击的防御能力。