匿名化方法、系统、终端设备、存储介质及产品与流程

文档序号:40667297发布日期:2025-01-14 21:33阅读:10来源:国知局
匿名化方法、系统、终端设备、存储介质及产品与流程

本技术涉及信息安全,尤其涉及一种匿名化方法、系统、终端设备、存储介质及产品。


背景技术:

1、随着数字经济的发展,全球数据呈爆发式增长,数据要素的流通和应用将成为激发数据价值的重要课题。但数据的流通、应用和安全难以兼得,因此,用于流通以及应用的数据通常需要进行匿名化处理,以确保风险小到可以接受,进而避免个体敏感信息的泄露。

2、然而,传统的匿名化处理对不同风险等级的数据均进行同等程度的匿名化,将导致风险程度较高的敏感数据易泄露。并且,对于风险度较低的数据,传统的匿名化处理方式还存在着过度匿名化以致数据可用性差的现象。因此,如何提出一种灵活的数据匿名化方法,是本领域技术人员尚待解决的技术问题。


技术实现思路

1、本技术的主要目的在于提供一种匿名化方法、系统、终端设备、存储介质及产品,旨在解决如何提出一种灵活的数据匿名化方法的技术问题。

2、为实现上述目的,本技术提出一种匿名化方法,所述方法包括:

3、基于预设的各个匿名化参数值,分别对原始数据集进行匿名化处理,得到各所述匿名化参数值各自对应的数据中间态;

4、对各所述数据中间态进行攻击,得到各所述数据中间态各自对应的攻击成功率;

5、获取待匿名化数据集和所述待匿名化数据集对应的目标攻击成功率,并将所述目标攻击成功率输入预设的匿名化参数值预测模型,得到所述待匿名化数据集的目标匿名化参数值;其中,所述匿名化参数值预测模型是以各所述匿名化参数值各自对应的所述攻击成功率为模型输入数据,以各所述匿名化参数值为模型训练标签训练得到的;

6、根据所述目标匿名化参数值对所述待匿名化数据集进行匿名化处理,得到匿名化数据集。

7、在一实施例中,所述攻击成功率包括:个体攻击成功率;

8、所述对各所述数据中间态进行攻击,得到各所述数据中间态各自对应的攻击成功率的步骤,包括:

9、分别遍历各所述数据中间态,得到各所述数据中间态各自对应的数据属性;

10、根据各所述数据中间态各自对应的所述数据属性,生成各所述数据中间态各自对应的数据查询语句;

11、利用各所述数据查询语句,在所述原始数据集中进行查询,若检测到查询出的数据条目为一,则判定攻击成功,并计算成功攻击次数;

12、将所述成功攻击次数与攻击总次数的比值作为个体攻击成功率。

13、在一实施例中,所述数据属性包括不同的多个子属性,所述根据各所述数据中间态各自对应的所述数据属性,生成各所述数据中间态各自对应的数据查询语句的步骤,包括:

14、在各所述数据中间态各自对应的数据属性中各自随机选择多个所述子属性,得到各所述数据中间态各自对应的属性组合;

15、基于各所述数据中间态各自对应的所述属性组合,生成各所述数据中间态各自对应的数据查询语句。

16、在一实施例中,所述攻击成功率还包括:匹配攻击成功率;

17、所述对各所述数据中间态进行攻击,得到各所述数据中间态各自对应的攻击成功率的步骤,包括:

18、对于每一个所述数据中间态,获取预设的第一外部数据集和第二外部数据集,其中,所述第一外部数据集与所述第二外部数据集互不相交,且,所述第一外部数据集和所述第二外部数据集中的属性均属于所述数据中间态;

19、获取所述第一外部数据集对应的预设数量的第一最近邻,并获取所述第二外部数据集对应的所述预设数量的第二最近邻;

20、若检测到所述第一最近邻与所述第二最近邻之间存在重合条目,并且,检测到所述原始数据集中存在所述重合条目,则判定攻击成功,并计算成功攻击次数;

21、将所述成功攻击次数与攻击总次数的比值作为匹配攻击成功率。

22、在一实施例中,所述攻击成功率还包括:推理攻击成功率;

23、所述对各所述数据中间态进行攻击,得到各所述数据中间态各自对应的攻击成功率的步骤,包括:

24、获取各所述数据中间态各自对应预设的推理辅助信息,和,各所述推理辅助信息各自对应的真实信息;

25、在各所述数据中间态中各自确定与各所述推理辅助信息对应的目标匿名信息;

26、若检测到对应于同一所述推理辅助信息的所述目标匿名信息和所述真实信息相同,则判定攻击成功,并计算成功攻击次数;

27、将所述成功攻击次数与攻击总次数的比值作为推理攻击成功率。

28、在一实施例中,获取待匿名化数据集对应的目标攻击成功率的步骤包括:

29、根据预设的风险等级划分规则,对所述待匿名化数据集进行等级划分,得到所述待匿名化数据集对应的风险等级;

30、将所述风险等级对应预设的攻击成功率作为目标攻击成功率。

31、在一实施例中,在所述对所述待匿名化数据集进行等级划分,得到所述待匿名化数据集对应的风险等级的步骤之后,所述方法还包括:

32、若检测到所述风险等级高于预设的风险等级阈值,则执行所述将所述风险等级对应预设的攻击成功率作为目标攻击成功率的步骤;

33、若检测到所述风险等级低于所述风险等级阈值,则发布所述待匿名化数据集。

34、此外,为实现上述目的,本技术还提出一种匿名化系统,所述匿名化系统包括:

35、第一匿名化模块,用于基于预设的各个匿名化参数值,分别对原始数据集进行匿名化处理,得到各所述匿名化参数值各自对应的数据中间态;

36、攻击模块,用于对各所述数据中间态进行攻击,得到各所述数据中间态各自对应的攻击成功率;

37、匿名化参数确定模块,用于获取待匿名化数据集和所述待匿名化数据集对应的目标攻击成功率,并将所述目标攻击成功率输入预设的匿名化参数值预测模型,得到所述待匿名化数据集的目标匿名化参数值;其中,所述匿名化参数值预测模型是以各所述匿名化参数值各自对应的所述攻击成功率为模型输入数据,以各所述匿名化参数值为模型训练标签训练得到的;

38、第二匿名化模块,用于根据所述目标匿名化参数值对所述待匿名化数据集进行匿名化处理,得到匿名化数据集。

39、此外,为实现上述目的,本技术还提出一种终端设备,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如上所述的匿名化方法的步骤。

40、此外,为实现上述目的,本技术还提出一种存储介质,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上文所述的匿名化方法的步骤。

41、此外,为实现上述目的,本技术还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如上文所述的匿名化方法的步骤。

42、在本实施例中,本技术基于预设的各个匿名化参数值,分别对原始数据集进行匿名化处理,得到各所述匿名化参数值各自对应的数据中间态,可以根据不同的匿名化参数值对用于训练匿名化参数值预测模型的训练集进行匿名化;然后对各所述数据中间态进行攻击,得到各所述数据中间态各自对应的攻击成功率,可以对匿名化的数据进行攻击,得到攻击成功率;然后获取待匿名化数据集和所述待匿名化数据集对应的目标攻击成功率;然后将所述目标攻击成功率输入预设的匿名化参数值预测模型,得到所述待匿名化数据集的目标匿名化参数值,其中,所述匿名化参数值预测模型是以各所述匿名化参数值各自对应的所述攻击成功率为模型输入数据,以各所述匿名化参数值为模型训练标签训练得到的,可以根据攻击成功率和匿名化参数值之间的对应关系,训练用于根据输入的攻击成功率输出匿名化参数值的匿名化参数值预测模型,从而,对于需要匿名化的数据,可以根据预设的目标攻击成功率和模型确定用于匿名化的目标匿名化参数值;最后根据所述目标匿名化参数值对所述待匿名化数据集进行匿名化处理,得到匿名化数据集。

43、如此,针对任何需要匿名化的数据,均可以将设定的目标攻击成功率输入训练完成的匿名化参数值预测模型中得到用于匿名化的目标匿名化参数值,从而对需要匿名化的数据进行匿名化处理。从而,本技术可以基于与待匿名化数据对应预设的目标攻击成功率和训练完成的匿名化参数值预测模型确保数据的匿名化的灵活性,从而达到了在保证数据安全性和可用性的前提下对数据进行匿名化的目的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1