基于边扰动的图数据隐私保护方法及系统

文档序号:33740234发布日期:2023-04-06 09:40阅读:116来源:国知局
基于边扰动的图数据隐私保护方法及系统

本发明涉及数据保护,具体涉及一种基于边扰动的图数据隐私保护方法及系统。


背景技术:

1、随着互联网技术的快速发展,人与人之间的虚拟关系形成了规模庞大、结构复杂的社交网络。这些社交网络可以被抽象成数据结构中的图,图作为一种复杂的数据结构类型能够很好地表征不同对象间的多种关系,蕴含的信息非常丰富。但是社交网络中存在大量用户的隐私信息,这些数据如果不进行匿名化处理直接向公众开放,就会出现泄露用户隐私信息的风险,因此社交网络的隐私安全越来越受到人们的关注。

2、传统的图隐私保护策略,先是将图数据中的用户隐私信息和敏感属性等内容进行删除,再把原始图的拓扑结构公开发布。但当使用这种策略来发布关联性较强的图数据时,已有研究成果表明其是非常容易被攻击的。常见的图匿名方法包括:基于图修改的匿名化方法、聚类匿名方法、差分隐私方法等。现有的图k匿名化方法,主要采用动态规划或者贪心算法构建匿名图,其主要操作是对节点或边进行增删。由于这些方法在构建匿名图时仅考虑节点的k度约束条件而忽略了原图的结构信息,导致匿名化后图数据的实用性大幅降低。


技术实现思路

1、本发明的目的在于提供一种在保证k度匿名的条件下同时保留原图的结构信息以提高匿名图数据的实用性的基于边扰动的图数据隐私保护方法及系统,以解决上述背景技术中存在的至少一项技术问题。

2、为了实现上述目的,本发明采取了如下技术方案:

3、一方面,本发明提供一种基于边扰动的图数据隐私保护方法,包括:

4、获取待匿名的原始图;

5、利用训练好的图嵌入模型对待匿名的原始图进行处理,得到邻接强度矩阵;

6、根据原始图的度序列与匿名度序列的差值,结合邻接强度矩阵对原始图进行边扰动,得到最终的匿名图;其中,根据原始图的度序列生成符合匿名要求且与原图度序列差异总和最小的度序列为匿名度序列。

7、优选的,训练所述图嵌入模型,包括:

8、获取训练集,所述训练集包括多个原始图以及原始图对应的匿名度序列标签;

9、通过gnn模型获取原始图中节点所对应的预测匿名度序列标签;通过预测匿名度序列标签与真实的匿名度序列标签之间的损失函数,将损失函数梯度反向传播回模型中,通过adam优化算法,更新分配矩阵;利用分配矩阵迭代更新网络中的邻接强度矩阵,直至损失函数值最小,得到训练好的图嵌入模型。

10、优选的,获取原始图的度序列,包括:无向图表示为g(v,e),其中v表示节点集合,e表示边的集合,n=|v|表示图中节点的个数,vi∈v表示图中的一个节点,eij=(vi,vj)∈e表示图中节点vi和节点vj有邻接关系;节点v的邻居节点集合为n(v)={u∈v(v,u)∈e},表示图中所有与节点v有邻接关系的节点集合;a∈rn×n表示图的邻接矩阵,表示图中节点之间的邻接关系,当eij∈e时,aij=1;当时,aij=0;节点vi的度表示为节点di,di=|n(v)|,则原始图度序列用向量d=[d1,d2,...,dn]来表示。

11、优选的,根据原始图的度序列生成符合匿名要求且与原图度序列差异总和最小的度序列为匿名度序列,包括:

12、对原始图的度序列进行排序,按照度排序从大到小划分匿名组;

13、根据匿名组划分构造差异矩阵;

14、根据差异矩阵构造束搜索概率矩阵;

15、根据束搜索概率矩阵构造匿名度序列;

16、通过匿名前后度序列差异的总和最小,选择合适的匿名度序列作为最终的匿名度序列。

17、优选的,根据原始图的度序列与匿名度序列的差值,结合邻接强度矩阵对原始图进行边扰动,得到最终的匿名图,包括:

18、通过邻接强度矩阵和原始图的邻接矩阵构造原始图每一个节点的两个辅助数组:对于原始图的每一个节点,将其邻居集合中的节点分为一组,组内每个节点按照邻接强度矩阵中与该节点对应的强度值从小到大排序,得到第一辅助数组;对于每一个节点,将不属于其邻居集合中的节点分为一组,组内每个节点按照邻接强度矩阵中与该节点对应的强度值从小到大排序,得到第二辅助数组;

19、计算原始图度序列和匿名度序列的差值,并依据第一辅助数组和第二辅助数组队原始图进行边扰动,得到匿名邻接矩阵;

20、根据匿名邻接矩阵得到最终的匿名图。

21、优选的,边扰动包括边增加、边删除、边交换:

22、当图匿名后的节点度数之和大于匿名前时,采用边增加操作;

23、当图匿名后的节点度数之和小于匿名前时,采用边删除操作;

24、图匿名后的节点度数之和等于匿名前时,采用边交换操作。

25、第二方面,本发明提供一种基于边扰动的图数据隐私保护系统,包括:

26、获取模块,用于获取待匿名的原始图;

27、图嵌入模块,用于利用训练好的图嵌入模型对待匿名的原始图进行处理,得到邻接强度矩阵;

28、边扰动模块,用于根据原始图的度序列与匿名度序列的差值,结合邻接强度矩阵对原始图进行边扰动,得到最终的匿名图;其中,根据原始图的度序列生成符合匿名要求且与原图度序列差异总和最小的度序列为匿名度序列。

29、第三方面,本发明提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如上所述的基于边扰动的图数据隐私保护方法。

30、第四方面,本发明提供一种计算机程序产品,包括计算机程序,所述计算机程序当在一个或多个处理器上运行时,用于实现如上所述的基于边扰动的图数据隐私保护方法。

31、第五方面,本发明提供一种电子设备,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如上所述的基于边扰动的图数据隐私保护方法的指令。

32、本发明有益效果:针对k匿名度序列提出新的生成算法,利用束搜索和匿名组,使得生成k匿名度序列时,算法复杂度降低,更快生成相应的k匿名度序列;使用图神经网络模型对图进行匿名化,模型采用端到端学习框架以监督的方式训练,获得训练后的分配矩阵、提取了原图的结构特征信息;基于邻接强度矩阵和匿名前后的度序列差值的边扰动方法,最大程度保留了原图的结构信息,有效解决数据可用性与隐私保护之间的平衡问题。

33、本发明附加方面的优点,将在下述的描述部分中更加明显的给出,或通过本发明的实践了解到。



技术特征:

1.一种基于边扰动的图数据隐私保护方法,其特征在于,包括:

2.根据权利要求1所述的基于边扰动的图数据隐私保护方法,其特征在于,训练所述图嵌入模型,包括:

3.根据权利要求2所述的基于边扰动的图数据隐私保护方法,其特征在于,获取原始图的度序列,包括:无向图表示为g(v,e),其中v表示节点集合,e表示边的集合,n=|v|表示图中节点的个数,vi∈v表示图中的一个节点,eij=(vi,vj)∈e表示图中节点vi和节点vj有邻接关系;节点v的邻居节点集合为n(v)={u∈v|(v,u)∈e},表示图中所有与节点v有邻接关系的节点集合;a∈rn×n表示图的邻接矩阵,表示图中节点之间的邻接关系,当eij∈e时,aij=1;当时,aij=0;节点vi的度表示为节点di,di=|n(v)|,则原始图度序列用向量d=[d1,d2,...,dn]来表示。

4.根据权利要求3所述的基于边扰动的图数据隐私保护方法,其特征在于,根据原始图的度序列生成符合匿名要求且与原图度序列差异总和最小的度序列为匿名度序列,包括:

5.根据权利要求4所述的基于边扰动的图数据隐私保护方法,其特征在于,根据原始图的度序列与匿名度序列的差值,结合邻接强度矩阵对原始图进行边扰动,得到最终的匿名图,包括:

6.根据权利要求5所述的基于边扰动的图数据隐私保护方法,其特征在于,边扰动包括边增加、边删除、边交换:

7.一种基于边扰动的图数据隐私保护系统,其特征在于,包括:

8.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如权利要求1-6任一项所述的基于边扰动的图数据隐私保护方法。

9.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序当在一个或多个处理器上运行时,用于实现如权利要求1-6任一项所述的基于边扰动的图数据隐私保护方法。

10.一种电子设备,其特征在于,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如权利要求1-6任一项所述的基于边扰动的图数据隐私保护方法的指令。


技术总结
本发明提供一种基于边扰动的图数据隐私保护方法及系统,属于数据隐私保护技术领域,获取待匿名的原始图;利用训练好的图嵌入模型对待匿名的原始图进行处理,得到邻接强度矩阵;根据原始图的度序列与匿名度序列的差值,结合邻接强度矩阵对原始图进行边扰动,得到最终的匿名图;其中,根据原始图的度序列生成符合匿名要求且与原图度序列差异总和最小的度序列为匿名度序列。本发明利用束搜索和匿名组,使得生成k匿名度序列时,降低了算法复杂度,更快生成相应的k匿名度序列;获得分配矩阵、提取了原图的结构特征信息;基于邻接强度矩阵和匿名前后的度序列差值的边扰动方法,最大程度保留了原图结构信息,有效解决数据可用性与隐私保护之间的平衡问题。

技术研发人员:孙永奇,林德聪,方荣强,原继东,李浥东
受保护的技术使用者:北京交通大学
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1