1.一种面向博弈控制的隐私保护方法,其特征在于,包括:
初始化博弈参与者在初始时刻的策略和局部估计状态信息;
采用基于输入扰动或输出扰动的随机聚合博弈的差分隐私分布式算法对每个参与者的下一时刻的局部估计状态和策略进行更新;
利用更新后的策略完成差分隐私保护。
2.如权利要求1所述的面向博弈控制的隐私保护方法,其特征在于,所述采用基于输入扰动的随机聚合博弈的差分隐私分布式算法对每个参与者的下一时刻的局部估计状态和策略进行更新,包括:
在时刻k,对于参与者
其中,aij,k为参与者i在时刻k分配给邻近参与者
对于每一个参与者
其中,xi,k+1为参与者i在时刻k+1的策略,xi,k为参与者i在时刻k的策略,αk为算法的步长,
3.如权利要求1所述的面向博弈控制的隐私保护方法,其特征在于,所述采用基于输出扰动的随机聚合博弈的差分隐私分布式算法对每个参与者的下一时刻的局部估计状态和策略进行更新,包括:
在时刻k,对于参与者
其中,aij,k为参与者i在第k步分配给邻近参与者
对于每一个参与者
其中,sk是第k步使用的采样梯度数,xi,k+1为参与者i在时刻k+1的策略,xi,k为参与者i在时刻k的策略,
4.如权利要求3所述的面向博弈控制的隐私保护方法,其特征在于,还包括采用小批量方法对所述基于输出扰动的随机聚合博弈的差分隐私分布式算法的差分隐私进行优化,包括:
令时刻k=0,对每个参与者
在时刻k时,对于参与者
其中,aij,k为参与者i在第k步分配给邻近参与者
对于每一个参与者
其中,sk是第k步使用的采样梯度数,xi,k+1为参与者i在时刻k+1的策略,xi,k为参与者i在时刻k的策略,
5.如权利要求3所述的面向博弈控制的隐私保护方法,其特征在于,所述基于输出扰动的随机聚合博弈的差分隐私分布式算法在时刻k迭代时的灵敏度满足:
其中,sk-1为第k-1步使用的采样梯度数,c为梯度函数的上界,α为算法的步长。
6.一种面向博弈控制的隐私保护系统,其特征在于,包括:初始化模块、更新模块以及差分隐私保护模块,其中:
初始化模块用于初始化博弈参与者在初始时刻的策略和局部估计状态信息;
更新模块用于采用基于输入扰动或输出扰动的随机聚合博弈的差分隐私分布式算法对每个参与者的下一时刻的局部估计状态和策略进行更新;
差分隐私保护模块用于利用更新后的策略完成差分隐私保护。
7.如权利要求6所述的面向博弈控制的隐私保护系统,其特征在于,所述更新模块包括第一更新单元和第二更新单元,其中:
第一更新单元用于采用基于输入扰动的随机聚合博弈的差分隐私分布式算法对每个参与者的下一时刻的局部估计状态和策略进行更新,包括:
在时刻k,对于参与者
其中,aij,k为参与者i在时刻k分配给邻近参与者
对于每一个参与者
其中,xi,k+1为参与者i在时刻k+1的策略,xi,k为参与者i在时刻k的策略,αk为算法的步长,
第二更新单元用于采用基于输出扰动的随机聚合博弈的差分隐私分布式算法对每个参与者的下一时刻的局部估计状态和策略进行更新,包括:
在时刻k,对于参与者
其中,aij,k为参与者i在第k步分配给邻近参与者
对于每一个参与者
其中,sk是第k步使用的采样梯度数,xi,k+1为参与者i在时刻k+1的策略,xi,k为参与者i在时刻k的策略,
8.如权利要求7所述的面向博弈控制的隐私保护系统,其特征在于,还包括差分隐私性能优化模块,用于采用小批量方法对所述基于输出扰动的随机聚合博弈的差分隐私分布式算法的差分隐私进行优化,包括:
令时刻k=0,对每个参与者
在时刻k时,对于参与者
其中,aij,k为参与者i在第k步分配给邻近参与者
对于每一个参与者
其中,sk是第k步使用的采样梯度数,xi,k+1为参与者i在时刻k+1的策略,xi,k为参与者i在时刻k的策略,
9.如权利要求7所述的面向博弈控制的隐私保护系统,其特征在于,所述基于输出扰动的随机聚合博弈的差分隐私分布式算法在时刻k迭代时的灵敏度满足:
其中,sk-1为第k-1步使用的采样梯度数,c为梯度函数的上界,α为算法的常步长。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行可实现如权利要求1-5中任意一项所述的面向博弈控制的隐私保护方法。