本申请涉及计算机,具体涉及一种基于前缀树的差分隐私轨迹发布方法及装置。
背景技术:
1、随着智能设备的普及和网络通信技术的发展,智能手机、可穿戴设备和gps设备被不断融入到智慧城市和智慧生活中,轨迹数据得到了广泛采集。用户可以通过移动智能设备中的位置传感器,采集自身的轨迹数据上传至基于位置的服务提供商。
2、服务提供商利用数据挖掘技术分析移动用户的轨迹特征,在轨迹的分析处理过程中,存在如下问题:轨迹数据中往往携带大量的个人信息,而现有的轨迹发布平台通常认为数据聚合者是可信的,轨迹数据不进行任何的隐私保护处理就进行发布,这样很容易导致第三方恶意出售数据信息或者发动共谋攻击。
技术实现思路
1、针对现有技术中的问题,本申请实施例提供一种基于前缀树的差分隐私轨迹发布方法及装置,能够至少部分地解决现有技术中存在的问题。
2、一方面,本申请提出一种基于前缀树的差分隐私轨迹发布方法,包括:
3、获取轨迹数据集中的轨迹记录,其中,所述轨迹数据集中的每条轨迹记录包括带时间戳的位置点;
4、对同一时间戳下的位置点进行聚类,根据聚类结果生成前缀树的位置节点;
5、对所述前缀树的位置节点进行差分隐私噪声扰动,得到扰动后的位置节点;
6、根据扰动后的位置节点,生成噪声轨迹前缀树;
7、根据所述噪声轨迹前缀树进行轨迹发布。
8、在一些实施例中,所述对同一时间戳下的位置点进行聚类,根据聚类结果生成前缀树的位置节点包括:
9、对于同一时间戳下的位置点,若两个位置点的距离小于预设阈值,则将该两个位置点归在同一个位置域;
10、根据所述时间戳、所述位置域以及位置域下的位置点个数,生成前缀树的位置节点。
11、在一些实施例中,所述对所述前缀树的位置节点进行差分隐私噪声扰动,得到扰动后的位置节点包括:
12、采用拉普拉斯机制对前缀树的位置节点中的位置点个数进行噪声扰动,得到扰动后的位置节点。
13、在一些实施例中,所述采用拉普拉斯机制对前缀树的位置节点中的位置点个数进行噪声扰动,得到扰动后的位置节点包括:
14、对前缀树从根节点开始遍历,使用等差级数分配策略从小到大为前缀树的每一层位置节点分配隐私预算;
15、根据为前缀树的每一层位置节点分配的隐私预算,采用拉普拉斯机制对前缀树的位置节点中的位置点个数进行噪声扰动,得到扰动后的位置节点。
16、在一些实施例中,在使用等差级数分配策略从小到大为前缀树的每一层位置节点分配隐私预算之前,所述方法还包括:
17、根据所述轨迹数据集中轨迹记录的个数、前缀树的树高、所述位置点的数据维度数以及所述数据维度的标准化坐标,生成前缀树位置节点的最小隐私预算。
18、在一些实施例中,所述根据扰动后的位置节点,生成噪声轨迹前缀树包括:
19、根据扰动后的位置节点的时间戳,将所述扰动后的位置节点依次插入前缀树的各级节点,生成噪声轨迹前缀树,其中,所述噪声轨迹前缀树的每级节点的时间戳相同。
20、在一些实施例中,所述根据所述噪声轨迹前缀树进行轨迹发布包括:
21、获取轨迹数据查询请求,所述轨迹数据查询请求中包括时间戳以及位置点信息;
22、根据所述时间戳以及位置点信息,在所述噪声轨迹前缀树中检索相关的位置节点;
23、根据检索到的所述位置节点,生成并发布差分隐私轨迹。
24、另一方面,本申请提出一种基于前缀树的差分隐私轨迹发布装置,包括:
25、获取模块,用于获取轨迹数据集中的轨迹记录,其中,所述轨迹数据集中的每条轨迹记录包括带时间戳的位置点;
26、第一生成模块,用于对同一时间戳下的位置点进行聚类,根据聚类结果生成前缀树的位置节点;
27、扰动模块,用于对所述前缀树的位置节点进行差分隐私噪声扰动,得到扰动后的位置节点;
28、第二生成模块,用于根据扰动后的位置节点,生成噪声轨迹前缀树;
29、发布模块,用于根据所述噪声轨迹前缀树进行轨迹发布。
30、在一些实施例中,所述第一生成模块具体用于:
31、对于同一时间戳下的位置点,若两个位置点的距离小于预设阈值,则将该两个位置点归在同一个位置域;
32、根据所述时间戳、所述位置域以及位置域下的位置点个数,生成前缀树的位置节点。
33、在一些实施例中,所述扰动模块具体用于:
34、采用拉普拉斯机制对前缀树的位置节点中的位置点个数进行噪声扰动,得到扰动后的位置节点。
35、在一些实施例中,所述扰动模块采用拉普拉斯机制对前缀树的位置节点中的位置点个数进行噪声扰动,得到扰动后的位置节点包括:
36、对前缀树从根节点开始遍历,使用等差级数分配策略从小到大为前缀树的每一层位置节点分配隐私预算;
37、根据为前缀树的每一层位置节点分配的隐私预算,采用拉普拉斯机制对前缀树的位置节点中的位置点个数进行噪声扰动,得到扰动后的位置节点。
38、在一些实施例中,所述装置还包括:
39、第三生成模块,用于根据所述轨迹数据集中轨迹记录的个数、前缀树的树高、所述位置点的数据维度数以及所述数据维度的标准化坐标,生成前缀树位置节点的最小隐私预算。
40、在一些实施例中,所述第二生成模块具体用于:
41、根据扰动后的位置节点的时间戳,将所述扰动后的位置节点依次插入前缀树的各级节点,生成噪声轨迹前缀树,其中,所述噪声轨迹前缀树的每级节点的时间戳相同。
42、在一些实施例中,所述发布模块具体用于:
43、获取轨迹数据查询请求,所述轨迹数据查询请求中包括时间戳以及位置点信息;
44、根据所述时间戳以及位置点信息,在所述噪声轨迹前缀树中检索相关的位置节点;
45、根据检索到的所述位置节点,生成并发布差分隐私轨迹。
46、本申请实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施例所述的基于前缀树的差分隐私轨迹发布方法的步骤。
47、本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一实施例所述的基于前缀树的差分隐私轨迹发布方法的步骤。
48、本申请实施例提供的基于前缀树的差分隐私轨迹发布方法及装置,通过对轨迹记录中的位置点进行聚合,完成位置泛化,解决了轨迹公共特征信息不足的问题,便于采集和挖掘轨迹数据的统计信息;通过构建轨迹前缀树模型,能够加快数据检索和响应速度;通过差分隐私对轨迹数据进行噪声扰动,能够防止攻击者通过已有的背景知识和特定的访问频率信息对用户的隐私信息进行推断,实现了隐私保护下的轨迹数据发布。
1.一种基于前缀树的差分隐私轨迹发布方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对同一时间戳下的位置点进行聚类,根据聚类结果生成前缀树的位置节点包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述前缀树的位置节点进行差分隐私噪声扰动,得到扰动后的位置节点包括:
4.根据权利要求3所述的方法,其特征在于,所述采用拉普拉斯机制对前缀树的位置节点中的位置点个数进行噪声扰动,得到扰动后的位置节点包括:
5.根据权利要求4所述的方法,其特征在于,在使用等差级数分配策略从小到大为前缀树的每一层位置节点分配隐私预算之前,所述方法还包括:
6.根据权利要求1至5任一项所述的方法,其特征在于,所述根据扰动后的位置节点,生成噪声轨迹前缀树包括:
7.根据权利要求6所述的方法,其特征在于,所述根据所述噪声轨迹前缀树进行轨迹发布包括:
8.一种基于前缀树的差分隐私轨迹发布装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。