1.一种用于流数据匿名保护的装置,所述装置包括:
被配置为存储包括第一数据集的流数据的存储器;以及
与所述存储器操作性连接的至少一个处理器,所述至少一个处理器被配置为:
基于用于保护所述第一数据集的差异隐私的差异水平,将所述第一数据集变换为第二数据集,其中,为变换所述第一数据集,所述处理器被配置为:
确定所述差异水平是否超出差异阈值;
当所述差异水平超出所述差异阈值时,通过添加第一噪声来变换所述第一数据集;
当所述差异水平未超出所述差异阈值时:
确定追溯计数是否大于追溯计数阈值;
当所述追溯计数大于所述追溯计数阈值时,通过添加第二噪声来变换所述第一数据集;以及
当所述追溯计数不大于所述追溯计数阈值时,通过添加第三噪声来变换所述第一数据集;以及
将所述第二数据集发送至数据处理系统以用于基于统计的服务。
2.根据权利要求1所述的装置,其中,所述至少一个处理器被进一步配置为基于所述第一数据集的数据统计分布的比较来确定所述差异水平。
3.根据权利要求1所述的装置,其中,所述至少一个处理器被进一步配置为基于使用所述第三噪声变换的先前的连续的数据集的数目来确定所述追溯计数。
4.根据权利要求3所述的装置,其中,所述至少一个处理器被进一步配置为对当前时间内从流数据中接收的用户数据进行汇总。
5.根据权利要求4所述的装置,其中,所述至少一个处理器被进一步配置为:
使用汇总的用户数据计算采样率;以及
使用所述采样率从所述汇总的用户数据中生成所述第一数据集。
6.根据权利要求1所述的装置,其中,所述至少一个处理器被进一步配置为基于所述第一数据集与来自多个数据源的先前数据集之间的比较来确定所述差异水平。
7.根据权利要求1所述的装置,其中,所述至少一个处理器被进一步配置为从多个源接收包括第一数据集的流数据。
8.一种方法,包括:
存储包括第一数据集的流数据;
基于用于保护所述第一数据集的差异隐私的差异水平,将所述第一数据集变换为第二数据集,其中,变换所述第一数据集包括:
确定所述差异水平是否超出差异阈值;
当所述差异水平超出所述差异阈值时,通过添加第一噪声来变换所述第一数据集;
当所述差异水平未超出所述差异阈值时:
确定追溯计数是否大于追溯计数阈值;
当所述追溯计数大于所述追溯计数阈值时,通过添加第二噪声来变换所述第一数据集;以及
当所述追溯计数不大于所述追溯计数阈值时,通过添加第三噪声来变换所述第一数据集;以及
将所述第二数据集发送至数据处理系统以用于基于统计的服务。
9.根据权利要求8所述的方法,进一步包括基于所述第一数据集的数据统计分布的比较来确定所述差异水平。
10.根据权利要求8所述的方法,进一步包括基于使用所述第三噪声变换的先前的连续的数据集的数目来确定所述追溯计数。
11.根据权利要求10所述的方法,进一步包括对当前时间内从流数据中接收的用户数据进行汇总。
12.根据权利要求11所述的方法,进一步包括:
使用汇总的用户数据计算采样率;以及
使用所述采样率从所述汇总的用户数据中生成所述第一数据集。
13.根据权利要求8所述的方法,进一步包括基于所述第一数据集与来自多个数据源的先前数据集之间的比较来确定所述差异水平。
14.根据权利要求8所述的方法,进一步包括从多个源接收包括第一数据集的流数据。