一种基于k-度匿名的社交网络隐私保护方法及存储介质与流程

文档序号:35155635发布日期:2023-08-18 08:41阅读:46来源:国知局
一种基于k-度匿名的社交网络隐私保护方法及存储介质与流程

本发明属于社交隐私保护的,具体涉及一种基于k-度匿名的社交网络隐私保护方法及存储介质。


背景技术:

1、随着在线社交网络成为人们建立、发现和维护人际关系的重要平台,与此同时也为社会行为研究提供了独特的机会。单从概念上来看,社交网络是一种图,其中顶点代表个体,边代表个体之间的关系,如友谊、信任和社会联系等。用户在社交网络中的活动产生了大量的数据,通过挖掘这些数据背后的意义,对于研究社会影响模式、病毒式营销模型、推荐系统中的协同过滤、异常用户检测等问题都非常有价值。然而,这些社交网络的应用以及对其产生的数据的挖掘分析也引起了对用户隐私泄露的严重担忧。众所周知,用户隐私信息的泄露无论对个人还是社会都将带来不可估量的危害。中国互联网信息安全中心发布的第48期《中国互联网发展报告》显示,网民遭遇的各类网络安全问题中,个人信息泄露问题所占的比例排在第一,由此可见对在线社交网络中用户的隐私进行保护的必要性。因此,使用社交网络平台产生的海量数据研究异常工作的同时,还需考虑用户的隐私泄露问题。数据挖掘的目标是从数据中发现新的和有用的知识,然而这些数据中包含着敏感信息,为了解决隐私问题,在将其提供给数据挖掘研究人员和公众之前,需要对其进行清理。数据清理是一个复杂的问题,在这个问题中,隐藏私人信息与降低效用是相伴产生的。

2、社交图是一个复杂网络,社会网络中的用户和他们产生的行为是相互依赖的,每个节点并不是相互独立的个体。为了对社交网络进行隐私保护,除了需要对节点和边的敏感属性进行处理之外,更多地是要抵抗针对图结构特性的攻击,例如子图攻击、度攻击等。现有的方法主要通过图修改和聚类两种方式实现对社交图的隐私保护。

3、以往的许多工作提出了一些隐私保护模型如k匿名模型、k-度匿名模型等,然而这些模型大都只从隐私保护角度出发,对数据进行随机化的隐匿和泛化,虽然达到了对用户信息的隐私保护,但同时也导致了大量的信息流失,大大降低了数据的可用性,使得无法进行一些有价值的数据分析工作。因此,针对社交网络中存在的隐私泄露问题,实现对社交网络中用户信息的隐私保护并且提高数据效用的可行性研究变得非常迫切。


技术实现思路

1、本发明的目的在于提供一种基于k-度匿名的社交网络隐私保护方法及存储介质,旨在解决上述的问题。

2、本发明主要通过以下技术方案实现:

3、一种基于k-度匿名的社交网络隐私保护方法,包括以下步骤:

4、步骤s100:构造度匿名序列,通过深度遍历以及剪枝操作获得符合k-度匿名的最优度修改方式:

5、步骤s110:将社交图中的节点集合u按节点的度从大到小进行排列后得到节点序列v,对节点序列v进行遍历,若节点不满足k-度匿名,则加入节点集合s中,进一步判断节点集合s中元素的个数是否大于或者等于k,若s中元素的个数小于k,则重新访问节点序列v进行遍历,若s中元素的个数大于或者等于k,则计算s的最小修改开销;若节点满足k-度匿名,则进一步判断集合s是否为空,若为空,则重新访问节点序列v进行遍历,否则计算节点集合s中的最小修改开销;

6、步骤s120:与节点集合s中当前全局最小开销进行比较,保留开销小的度匿名序列;记录当前节点的最小修改开销值,在遍历至某一节点进行修改操作后,一旦小于该节点的最小修改开销值则进行剪枝操作;

7、步骤s200:重构k-度匿名社交图,结合原图结构信息获得信息量损失代价小的边修改操作:首先不考虑边的类型,获得节点对之间的边修改方式,然后,按照边修改方式对多关系社交图进行修改;在不破坏原邻居关系前提下,在原社交图的基础上进行边的增删;在图模型中,为避免对节点邻居关系的破坏,优先对已存在连边的节点对进行边修改操作;为了降低边修改数,优先在重构节点子图上进行修改。

8、为了更好地实现本发明,进一步地,所述步骤s110中,最小修改开销的计算如下:

9、1)将节点集合s对应的节点独立为一个度相同的节点集合,集合中元素个数大于或等于k,则此时集合s的对应节点皆满足k-度匿名化要求,则此时的最小修改开销为:

10、

11、其中:j为第j个节点,

12、i为第i个节点,

13、dk为第k个节点的度,

14、2)通过增加节点的度使集合s合并至已满足k-度匿名的度集合中,合并后的集合中元素个数大于或等于k成立,则此时集合s中的对应节点皆满足k-度匿名化要求;若存在度集合w(l)的元素个数大于等于k,且对任意{w(i)|wi>dmax,wn(i)≥k}都满足wl≤wi,则可将集合中的节点度修改为wl,此时为通过增加节点度与其他已满足k-匿名的度集合合并开销最小的方式,此时的修改开销为:

15、

16、其中:dk为第k个节点的度,

17、dmax为节点集合s中节点最大的度数;

18、wi为一个节点集合,且其中节点的度皆相同;

19、wl为满足k-度匿名,且度大于dmax的集合中,度最小的度集合中的节点度数。

20、3)通过减少节点度使集合s中的节点合并至已满足k-度匿名的度集合中,即若存在度集合w(r)的元素个数大于等于k,且对任意{w(i)|wi<dmin,wn(i)≥k}都满足wr≥wi,则可将集合中节点度修改为w(r),此时为通过减少节点度与其他已满足k-匿名的度集合合并开销最小的方式,此时的修改开销为:

21、

22、其中:dmin为节点集合s中节点最小的度数,

23、wr为为满足k-度匿名,且度小于dmin的集合中,度最大的集合中的节点度数;

24、若s中的元素个数大于或者等于k,则比较公式(1)、(2)、(3)三种方式计算的修改开销大小,然后取修改开销最小的方式对集合s中的度进行修改操作;若s中的元素个数小于k,则独立不满足k-度匿名要求,将只比较公式(2)、(3)两种方式计算的修改开销大小,然后取开销最小的方式对集合s中的度进行修改操作。

25、为了更好地实现本发明,进一步地,所述步骤s200中,针对重构节点序列c={c1,c2,…,ct}中的节点对ci、cj的修改:

26、a若节点的度修改数同向,即hi*hj>0,则对节点直接进行增删边;

27、b若节点的度修改数不同向,即hi*hj<0,则按照以下方式进行边修改:

28、假设节点ci需要增加节点度,节点cj需要减少节点度,找到cj的邻居节点ut,删除cj与ut之间的连边,添加ci与ut之间的连边,使得ci的度增加,cj的度减少;

29、其中,hi、hj分别为节点对ci、cj需要修改的度数。

30、为了更好地实现本发明,进一步地,在重构节点子图中进行修改:依次选取重构节点序列c中的节点,遍历访问节点ci在重构节点子图中的邻居节点cj,获得节点ci和邻居节点cj的度修改数hi、hj,若hi、hj修改同向,则按照方式a进行修改。

31、为了更好地实现本发明,进一步地,在原社交图g中进行修改:依次选取重构节点序列c中的节点,遍历访问节点ci在重构节点子图中的邻居节点vj,在不破坏ci与vj的邻居关系,vj仍满足k-度匿名的前提下,则按照方式a进行边修改;选取重构节点序列c中修改不同向且有共同邻居的节点对ci、cj,在不破坏原邻居关系前提下,按照方式b进行边修改。

32、为了更好地实现本发明,进一步地,对同向度修改的节点ci、cj,若节点的度修改数皆为增加,即hi>0、hj>0,则对ci、cj构建连边;若节点的度修改数皆为减少,即hi<0、hj<0,则分别获取节点ci、cj的邻居节点,然后分别删除ci、cj与邻居节点之间的连边,并添加两个邻居节点之间的连边,使得ci、cj的度减少。

33、为了更好地实现本发明,进一步地,所述步骤s200中,选择关系重要度低和节点对之间连接数量多的连边类型进行边增删操作,从而减少信息损失,提高数据的可用性;对每种关系类型构造单关系社交图,从图中提取拓扑特征作为对应的关系特征,然后结合随机森林对其重要度打分;当特征重要程度越高,随机森林模型预测误差的变化值会越大,通过特征置换前后的袋外数据预测误差的变化值对每一个特征进行打分,通过随机森林算法得到关系特征得分p={p1,…,pm},对关系得分进行取倒后归一化操作得到q={q1,…,qm}:

34、

35、其中,pt为通过随机森林算出的第i个关系的特征重要度;

36、记oi,j,t为节点ui与节点uj关于关系rt的连边数进行归一化后的值,则连边类型的挑选指标如下定义:

37、qt×oi,j,t

38、其中,qt为第i个关系特征归一化后的特征得分;

39、当关系rt的重要度越低,qt值则越大,指标值越高;节点间关于关系rt的连边数越多,oi,j,t值越大;

40、挑选最大取值对应的边类型进行节点对之间边的增删,最终得到重构后的社交图。

41、一种计算机可读存储介质,存储有计算机程序指令,所述程序指令被处理器执行时实现上述的方法。

42、本发明的有益效果如下:

43、本发明考虑了研究工作中涉及的社交网络隐私保护问题,提出了一种k-度匿名化方法抵御基于社交图结构的度攻击。本发明提出的方法主要由构造度匿名序列和重构社交图两个过程组成,在构造度匿名序列时,采用深度遍历结合剪枝方法寻找度修改开销小的度匿名序列;在重构社交图时,最大程度地保留原有的图结构信息,并且结合随机森林方法降低修改过程的信息损失。并且从交网络度分布、边修改数、图结构特征信息损失多个方面进行分析验证,实验结果显示本发明提出的方法能有效降低隐私保护过程中的信息损失,提高匿名化数据的可用性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1