本公开涉及安全多方计算领域,具体地,涉及一种用于安全计算的数据处理方法、介质、设备及产品。
背景技术:
1、安全多方计算又称为多方安全计算(multi-party computation,mpc),可以由多方共同计算出一个函数的结果,而不泄露这个函数中各方的输入数据,计算的结果公开给其中的一方或多方。安全多方计算的典型应用例如有隐私保护的多方数据的联合统计分析、机器学习等。这里的函数是一个统计运算的函数、一个机器学习算法等等。
2、在多方安全计算过程中,为了不泄露各方数据以及中间计算结果,可以将数据或中间结果以共享形式由各方持有。单方持有一个数据分片,各方持有的分片融合在一起还原出相应数据。在mpc技术发展和应用推广中除了关注mpc计算协议本身的安全性外,mpc自身的准确性也需要被着重关注。其中,如何保证mpc的准确性,对于保证多方安全计算过程和结果的可靠性和有效性至关重要。
技术实现思路
1、提供该
技术实现要素:
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
2、第一方面,本公开提供一种用于安全计算的数据处理方法,所述安全计算的参与方包括第一方和第二方,所述第一方持有第一标识集,所述第一标识集中的标识对应有h维特征,所述第二方持有第二标识集,h≥1,所述方法应用于所述第一方,包括:
3、基于所述第一标识集,与所述第二方执行基于目标协议的数据处理过程,以使得所述第二方至少获得所述第一标识集与所述第二标识集的交集在所述第一标识集中的第一索引号;
4、针对所述h维特征中的至少部分维特征中的每一维特征,获取与该维特征对应的第一多项式,其中,所述第一多项式基于第三标识集中的标识对应的该维特征构建,所述第三标识集基于所述第一标识集中的标识的索引号生成;与所述第二方计算所述第一多项式在目标标识集中至少部分标识上的取值,以获得所述取值的第一分片,其中,所述目标标识集由所述第二方基于所述第一索引号生成,所述第三标识集与所述目标标识集的生成方式相同;
5、至少基于所述第一分片执行目标数据处理任务。
6、第二方面,本公开提供一种用于安全计算的数据处理方法,所述安全计算的参与方包括第一方和第二方,所述第一方持有第一标识集,所述第一标识集中的标识对应有h维特征,所述第二方持有第二标识集,h≥1,所述方法应用于所述第二方,包括:
7、基于所述第二标识集,与所述第一方执行基于目标协议的数据处理过程,至少获得所述第一标识集与所述第二标识集的交集在所述第一标识集中的第一索引号;
8、基于所述第一索引号,生成目标标识集;
9、针对至少一个第一多项式中的每一所述多项式,与所述第一方计算该第一多项式在所述目标标识集中至少部分标识上的取值,以获得所述取值的第六分片,其中,所述至少一个第一多项式由所述第一方针对所述h维特征中的至少部分维特征中的每一维特征,基于第三标识集中的标识对应的该维特征构建,所述第三标识集由所述第一方基于所述第一标识集中的标识的索引号生成,所述第三标识集与所述目标标识集的生成方式相同;
10、至少基于所述第六分片执行目标数据处理任务。
11、第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现本公开第一方面提供的所述用于安全计算的数据处理方法的步骤或本公开第二方面提供的所述用于安全计算的数据处理方法的步骤。
12、第四方面,本公开提供一种电子设备,包括:
13、存储装置,其上存储有计算机程序;
14、处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开第一方面提供的所述用于安全计算的数据处理方法的步骤或本公开第二方面提供的所述用于安全计算的数据处理方法的步骤。
15、第五方面,本公开提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本公开第一方面提供的所述用于安全计算的数据处理方法的步骤或本公开第二方面提供的所述用于安全计算的数据处理方法的步骤。
16、在上述技术方案中,首先,第一方和第二方共同执行基于目标协议的数据处理过程,第二方至少获得第一标识集与第二标识集的交集在第一标识集中的第一索引号;然后,第二方基于第一索引号,生成目标标识集,同时,第一方针对自身所持有的h维特征中的至少部分维特征中的每一维特征,获取与该维特征对应的第一多项式;接下来,第一方与第二方计算第一多项式在目标标识集中至少部分标识上的取值,以分别获得所述取值的一个分片;最后,第一方和第二方分别基于自身所持有的分片执行目标数据处理任务。这样,可以将双方所持有的标识集的交集对应的特征的分片问题巧妙地转换为多项式求值问题。其中,第一方将不具有实质物理意义的第一索引号同步至第二方,以由第二方基于第一索引号在本地生成目标标识集,而非直接将目标标识集同步至第二方,不仅可以减少通信量,还可以避免第一方数据泄露。另外,双方利用目标标识集替代交集,以计算第一多项式在交集上的取值,这样,即使是第二标识集并非为第一标识集的子集的情况,也可以保证获取到的特征分片为交集对应的特征分片的精确结果,由此,可以保证特征分片的准确性,使得目标数据处理任务能够可靠执行。此外,双方无需计算交集,而是利用目标标识集替换交集,可以避免任何一方计算交集导致的数据泄露的问题。由此,通过本方案可在模型训练、sql查询等场景下保护数据安全,并保证准确性。
17、本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
1.一种用于安全计算的数据处理方法,所述安全计算的参与方包括第一方和第二方,所述第一方持有第一标识集,所述第一标识集中的标识对应有h维特征,所述第二方持有第二标识集,h≥1,其特征在于,所述方法应用于所述第一方,包括:
2.根据权利要求1所述的方法,其特征在于,所述第二标识集中的标识对应有单维特征;
3.根据权利要求2所述的方法,其特征在于,所述与所述第二方执行不经意伪随机函数协议,得到第一盲化因子和所述第二标识集对应的所述单维特征的第二分片,包括:
4.根据权利要求2所述的方法,其特征在于,所述至少基于所述第一分片执行目标数据处理任务,包括:
5.根据权利要求1所述的方法,其特征在于,所述第二标识集中的标识未对应任何特征;
6.根据权利要求5所述的方法,其特征在于,所述与所述第二方执行不经意伪随机函数协议,得到第一盲化因子,包括:
7.根据权利要求1所述的方法,其特征在于,所述获取与该维特征对应的第一多项式,包括:
8.根据权利要求1所述的方法,其特征在于,所述与所述第二方计算所述第一多项式在目标标识集中至少部分标识上的取值,以获得所述取值的第一分片,包括:
9.根据权利要求8所述的方法,其特征在于,所述与所述第二方计算所述第二多项式在所述目标标识集中至少部分标识上的取值,以获得所述第一分片,包括:
10.一种用于安全计算的数据处理方法,所述安全计算的参与方包括第一方和第二方,所述第一方持有第一标识集,所述第一标识集中的标识对应有h维特征,所述第二方持有第二标识集,h≥1,其特征在于,所述方法应用于所述第二方,包括:
11.根据权利要求10所述的方法,其特征在于,所述第二标识集中的标识对应有单维特征;
12.根据权利要求11所述的方法,其特征在于,所述基于所述第二标识集和所述单维特征,与所述第一方执行不经意伪随机函数协议,得到所述第二标识集对应的所述单维特征的第三分片和基于所述第二标识集的第一盲文,包括:
13.根据权利要求11所述的方法,其特征在于,所述至少基于所述第六分片执行目标数据处理任务,包括:
14.根据权利要求10所述的方法,其特征在于,所述第二标识集中的标识未对应任何特征;
15.根据权利要求14所述的方法,其特征在于,所述基于所述第二标识集,与所述第一方执行不经意伪随机函数协议,得到基于所述第二标识集的第一盲文,包括:
16.根据权利要求10所述的方法,其特征在于,所述与所述第一方计算该第一多项式在所述目标标识集中至少部分标识上的取值,以获得所述取值的第六分片,包括:
17.根据权利要求16所述的方法,其特征在于,所述与所述第一方计算所述第二多项式在所述目标标识集中至少部分标识上的取值,以获得所述第六分片,包括:
18.一种计算机可读介质,其上存储有计算机程序,其特征在于,该计算机程序被处理装置执行时实现权利要求1-17中任一项所述方法的步骤。
19.一种电子设备,其特征在于,包括:
20.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-17中任一项所述的方法的步骤。