一种多方隐私数据集合求并集的方法及系统与流程

文档序号:33742618发布日期:2023-04-06 10:30阅读:235来源:国知局
一种多方隐私数据集合求并集的方法及系统与流程

本发明涉及隐私计算领域,具体而言,涉及一种多方隐私数据集合求并集的方法及系统。


背景技术:

1、隐私计算是指在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合,达到对数据“可用、不可见”的目的;在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放。

2、隐私集合求并集是隐私计算中一个典型的应用。在隐私集合求并集中,往往有多个数据拥有方,每个数据拥有方拥有部分的id(id是集合中元素的识别特征数据),同一个id可能存在于部分数据拥有方中,隐私集合求并集即是求所有数据拥有方id的并集,但要求在求解过程中不能暴露某个数据拥有方的具体id信息。隐私集合求交集有很多应用场景,比如国内外有很多的集团公司,集团下属非常多的子公司,当集团汇总子公司某些数据特征的时候会用到,例如统计大客户有哪些,集团只需要知道大客户的并集即可,不需要知道大客户来自于哪家子公司,子公司的数据也不想让集团知道;但是,目前业界关于隐私集合求并集的求解方法较少,且现有的基于密码学的求解方法通用性较低、复杂度又高,导致求解的效率较低。


技术实现思路

1、本发明的目的在于提供一种多方隐私数据集合求并集的方法,其通过参与并集计算的各数据拥有方随机抽取和随机复制自己的隐私数据,并对数据进行分片操作,将分片数据发送给其他参与方进行合并,打乱后发送给数据需求方进行解密,得到各参与方原数据的并集,本方法计算复杂度低,保证数据安全的同时提高了求并集的求解效率,且不依赖任何平台、系统或框架,通用性强。

2、本发明的实施例是这样实现的:

3、第一方面,本申请实施例提供一种多方隐私数据集合求并集的方法,包括以下步骤:

4、各数据拥有方随机复制自己拥有的第一隐私数据集合,对应得到第二隐私数据集合;

5、各数据拥有方对自己的第二隐私数据集合进行分片操作,得到自身的第三隐私数据集合;

6、各数据拥有方将自身的第三隐私数据集合中的一部分隐私数据分别发送给其他数据拥有方,各数据拥有方将获得的隐私数据和自己剩余的第三隐私数据进行组合,得到第四隐私数据集合;

7、各数据拥有方将自身的第四隐私数据集合打乱,得到第五隐私数据集合;

8、各数据拥有方将自身的第五隐私数据集合发送给数据需求方进行解密,得到各数据拥有方隐私数据集合求并集的结果。

9、在本发明的一些实施例中,所述各数据拥有方随机复制自己拥有的第一隐私数据集合,对应得到第二隐私数据集合的步骤具体包括:

10、各数据拥有方随机抽取自己第一隐私数据集合中的任意数据多次;

11、各数据拥有方对每个抽到的数据随机复制多次,并将复制得到的数据与自己的第一隐私数据集合合并,得到第二隐私数据集合。

12、在本发明的一些实施例中,所述各数据拥有方对自己的第二隐私数据集合进行分片操作,得到自身的第三隐私数据集合的步骤具体包括:

13、各数据拥有方根据数据拥有方的数目确定分片的数量;

14、各数据拥有方根据分片的数量将自己的第二隐私数据集合对应划分为包括多个数据子集的第三隐私数据集合。

15、在本发明的一些实施例中,所述各数据拥有方将自身的第四隐私数据集合打乱,得到第五隐私数据集合的步骤具体包括:

16、由数据拥有方中的任一方随机生成一个种子并发送给其他数据拥有方;

17、各数据拥有方使用所述种子将自身的第四隐私数据集合打乱,得到第五隐私数据集合。

18、在本发明的一些实施例中,所述各数据拥有方将自身的第五隐私数据集合发送给数据需求方进行解密,得到各数据拥有方隐私数据集合求并集的结果的步骤具体包括:

19、数据需求方将各数据拥有方的第五隐私数据集合进行合并,得到合并隐私数据集合;

20、对所述合并隐私数据集合进行去重处理,得到各数据拥有方隐私数据集合的并集。

21、在本发明的一些实施例中,所述数据需求方将各数据拥有方的第五隐私数据集合进行合并,得到合并隐私数据集合的步骤具体还包括:

22、数据需求方按照位置信息将各数据拥有方的第五隐私数据集合中的数据进行合并。

23、第二方面,本申请实施例提供一种多方隐私数据集合求并集的系统,其包括:

24、复制模块,用于各数据拥有方随机复制自己拥有的第一隐私数据集合,对应得到第二隐私数据集合;

25、分片模块,用于各数据拥有方对自己的第二隐私数据集合进行分片操作,得到自身的第三隐私数据集合;

26、组合模块,用于各数据拥有方将自身的第三隐私数据集合中的一部分隐私数据分别发送给其他数据拥有方,各数据拥有方将获得的隐私数据和自己剩余的第三隐私数据进行组合,得到第四隐私数据集合;

27、打乱模块,用于各数据拥有方将自身的第四隐私数据集合打乱,得到第五隐私数据集合;

28、解密模块,用于各数据拥有方将自身的第五隐私数据集合发送给数据需求方进行解密,得到各数据拥有方隐私数据集合求并集的结果。

29、在本发明的一些实施例中,所述复制模块具体包括:

30、抽取子模块,用于各数据拥有方随机抽取自己第一隐私数据集合中的任意数据多次;

31、合并子模块,用于各数据拥有方对每个抽到的数据随机复制多次,并将复制得到的数据与自己的第一隐私数据集合合并,得到第二隐私数据集合。

32、第三方面,本申请实施例提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器。当上述一个或多个程序被上述处理器执行时,实现如上述第一方面中任一项上述的方法。

33、第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项上述的方法。

34、相对于现有技术,本发明的实施例至少具有如下优点或有益效果:

35、本发明的实施例提出了一种多方隐私数据集合求并集的方法,其通过参与并集计算的各数据拥有方随机抽取和随机复制自己的隐私数据,并对数据进行分片操作,将分片数据发送给其他参与方进行合并,在向其他参与方分享数据的同时,也可以防止具体数据的暴露,提高了数据的安全性;然后各参与方将合并后的分片数据打乱后发送给数据需求方进行解密,得到各参与方原数据的并集,可以保证数据接收方无法反推原数据来自于哪一参与方,从而保证数据来源不会暴露。且本方法没有使用复杂的密码学协议,也没有复杂度高的计算逻辑,计算复杂度低,在保证数据安全的同时提高了多方隐私数据求并集的求解效率;又不依赖任何平台、系统或框架,通用性强,可以适用于任意多方的隐私数据求并集。



技术特征:

1.一种多方隐私数据集合求并集的方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种多方隐私数据集合求并集的方法,其特征在于,所述各数据拥有方随机复制自己拥有的第一隐私数据集合,对应得到第二隐私数据集合的步骤具体包括:

3.如权利要求2所述的一种多方隐私数据集合求并集的方法,其特征在于,所述各数据拥有方对自己的第二隐私数据集合进行分片操作,得到自身的第三隐私数据集合的步骤具体包括:

4.如权利要求3所述的一种多方隐私数据集合求并集的方法,其特征在于,所述各数据拥有方将自身的第四隐私数据集合打乱,得到第五隐私数据集合的步骤具体包括:

5.如权利要求4所述的一种多方隐私数据集合求并集的方法,其特征在于,所述各数据拥有方将自身的第五隐私数据集合发送给数据需求方进行解密,得到各数据拥有方隐私数据集合求并集的结果的步骤具体包括:

6.如权利要求5所述的一种多方隐私数据集合求并集的方法,其特征在于,所述数据需求方将各数据拥有方的第五隐私数据集合进行合并,得到合并隐私数据集合的步骤具体包括:

7.一种多方隐私数据集合求并集的系统,其特征在于,包括:

8.如权利要求7所述的一种多方隐私数据集合求并集的系统,其特征在于,所述复制模块具体包括:

9.一种电子设备,其特征在于,包括至少一个处理器、至少一个存储器和数据总线;其中:所述处理器与所述存储器通过所述数据总线完成相互间的通信;所述存储器存储有被所述处理器执行的程序指令,所述处理器调用所述程序指令以执行如权利要求1-6任一项所述的方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-6中任一项所述的方法。


技术总结
本发明提出了一种多方隐私数据集合求并集的方法及系统,涉及隐私计算领域。该方法通过参与并集计算的各数据拥有方随机抽取和复制自己的隐私数据,对数据进行分片操作,将分片数据发送给其他参与方进行合并,在向其他参与方分享数据的同时,也可以防止具体数据的暴露,提高了数据的安全性;各参与方将合并后的分片数据打乱后发送给数据需求方进行解密,得到各参与方原数据的并集,保证数据接收方无法反推原数据来自于哪一参与方,保证数据来源不会暴露。本方法没有使用复杂的密码学协议,也没有复杂度高的计算逻辑,计算复杂度低,提高了多方隐私数据求并集的求解效率;又不依赖任何平台、系统或框架,通用性强,适用于任意多方的隐私数据求并集。

技术研发人员:杨桂林,章庆,贺伟
受保护的技术使用者:天翼电子商务有限公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1