一种数据处理方法、装置和用于数据处理的装置与流程

文档序号:27912092发布日期:2021-12-11 09:55阅读:133来源:国知局
一种数据处理方法、装置和用于数据处理的装置与流程

1.本发明涉及计算机技术领域,尤其涉及一种数据处理方法、装置和用于数据处理的装置。


背景技术:

2.最小二乘估计,是指给定矩阵其中m≥n,向量求解min
x
||y

ax||2,即为求解使得y

ax(残差)的二范数最小。
3.最小二乘估计被广泛应用于各个计算场景,例如线性回归、通信信号估计等场景。然而,当矩阵a中的数据关系到用户身份保密、账户安全和个人隐私的敏感信息时,这些信息一旦泄露会给用户生活带来严重的危害。


技术实现要素:

4.本发明实施例提供一种数据处理方法、装置和用于数据处理的装置,可以在保证数据隐私安全的基础上,提高最小二乘估计的计算效率。
5.为了解决上述问题,本发明实施例公开了一种数据处理方法,用于多方安全计算系统,所述方法包括:
6.接收密文计算任务,所述密文计算任务包括最小二乘估计,所述最小二乘估计用于对给定的矩阵a和向量y,求解向量x,使得min
x
||y

ax||2;其中,矩阵a为密文数据;
7.基于密文,对所述矩阵a进行ll分解,得到第一分解结果;或者,基于密文,对所述矩阵a进行ldl分解,得到第二分解结果;
8.利用所述第一分解结果,基于密文进行最小二乘估计,得到向量x的解;或者,利用所述第二分解结果,基于密文进行最小二乘估计,得到向量x的解。
9.可选地,所述基于密文,对所述矩阵a进行ll分解,得到第一分解结果,包括:
10.根据所述矩阵a,确定实对称正定矩阵a
t
a;
11.基于密文,对所述实对称正定矩阵a
t
a进行ll分解,得到第一分解结果包括矩阵l和矩阵l
t
,使得a
t
a=l
t
l;其中,l为下三角矩阵;
12.所述利用所述第一分解结果,基于密文进行最小二乘估计,得到向量x的解,包括:
13.基于所述第一分解结果,将所述最小二乘估计转换为求解方程组l
t
lx=y,并令向量b=lx;
14.基于密文求解上三角方程组l
t
b=y,得到向量b的解;
15.根据所述向量b的解,基于密文求解下三角方程组lx=b,得到向量x的解。
16.可选地,所述基于密文,对所述矩阵a进行ldl分解,得到第二分解结果,包括:
17.根据所述矩阵a,确定实对称正定矩阵a
t
a;
18.基于密文,对所述实对称正定矩阵a
t
a进行ldl分解,得到第二分解结果包括矩阵l、矩阵d、以及矩阵l
t
,使得a
t
a=ldl
t
;其中,l为对角元素都为1的下三角矩阵,d为对角元素都为正数的对角矩阵;
19.所述利用所述第二分解结果,基于密文进行最小二乘估计,得到向量x的解,包括:
20.基于第二分解结果,将所述最小二乘估计转换为求解方程组ldl
t
x=a
t
y,并令向量z=dl
t
x;
21.基于密文求解下三角方程组lz=a
t
y,得到向量z的解;
22.根据所述向量z的解,基于密文求解上三角方程组l
t
x=d
‑1z,得到向量x的解。
23.可选地,所述密文计算任务包括线性回归计算,所述矩阵a包括至少两个参与方的密文数据,所述向量y包括所述密文数据对应的预测标签,所述向量x的解为线性回归的所述预测标签对应的各特征的权重。
24.可选地,所述密文计算任务包括通信信号估计,所述矩阵a为信道加密矩阵,所述向量y为基于矩阵a对原信号加密后得到的编码信号,所述向量x的解为估计得到的原信号。
25.另一方面,本发明实施例公开了一种数据处理装置,用于多方安全计算系统,所述装置包括:
26.任务接收模块,用于接收密文计算任务,所述密文计算任务包括最小二乘估计,所述最小二乘估计用于对给定的矩阵a和向量y,求解向量x,使得min
x
||y

ax||2;其中,矩阵a为密文数据;
27.矩阵分解模块,用于基于密文,对所述矩阵a进行ll分解,得到第一分解结果;或者,基于密文,对所述矩阵a进行ldl分解,得到第二分解结果;
28.结果计算模块,用于利用所述第一分解结果,基于密文进行最小二乘估计,得到向量x的解;或者,利用所述第二分解结果,基于密文进行最小二乘估计,得到向量x的解。
29.可选地,所述矩阵分解模块,包括:
30.矩阵变换子模块,用于根据所述矩阵a,确定实对称正定矩阵a
t
a;
31.第一分解子模块,用于基于密文,对所述实对称正定矩阵a
t
a进行ll分解,得到第一分解结果包括矩阵l和矩阵l
t
,使得a
t
a=l
t
l;其中,l为下三角矩阵;
32.所述结果计算模块,包括:
33.第一转换子模块,用于基于所述第一分解结果,将所述最小二乘估计转换为求解方程组l
t
lx=y,并令向量b=lx;
34.第一计算子模块,用于基于密文求解上三角方程组l
t
b=y,得到向量b的解;
35.第二计算子模块,用于根据所述向量b的解,基于密文求解下三角方程组lx=b,得到向量x的解。
36.可选地,所述结果计算模块,包括:
37.矩阵变换子模块,用于根据所述矩阵a,确定实对称正定矩阵a
t
a;
38.第二分解子模块,用于基于密文,对所述实对称正定矩阵a
t
a进行ldl分解,得到第二分解结果包括矩阵l、矩阵d、以及矩阵l
t
,使得a
t
a=ldl
t
;其中,l为对角元素都为1的下三角矩阵,d为对角元素都为正数的对角矩阵;
39.所述利结果计算模块,包括:
40.第二转换子模块,用于基于第二分解结果,将所述最小二乘估计转换为求解方程组ldl
t
x=a
t
y,并令向量z=dl
t
x;
41.第三计算子模块,用于基于密文求解下三角方程组lz=a
t
y,得到向量z的解;
42.第四计算子模块,用于根据所述向量z的解,基于密文求解上三角方程组l
t
x=d

1
z,得到向量x的解。
43.可选地,所述密文计算任务包括线性回归计算,所述矩阵a包括至少两个参与方的密文数据,所述向量y包括所述密文数据对应的预测标签,所述向量x的解为线性回归的所述预测标签对应的各特征的权重。
44.可选地,所述密文计算任务包括通信信号估计,所述矩阵a为信道加密矩阵,所述向量y为基于矩阵a对原信号加密后得到的编码信号,所述向量x的解为估计得到的原信号。
45.再一方面,本发明实施例公开了一种用于数据处理的装置,用于多方安全计算系统,所述装置包括有存储器,以及一个以上程序,其中一个以上程序存储于存储器中,且经配置以由一个以上处理器执行所述一个以上程序,所述一个以上程序包含用于进行如前述一个或多个所述的数据处理方法的指令。
46.又一方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当所述指令由装置的一个或多个处理器执行时,使得装置执行如前述一个或多个所述的数据处理方法。
47.本发明实施例包括以下优点:
48.本发明实施例在多方安全计算系统中,利用两种矩阵分解的方法解决最小二乘估计的求解问题。具体地,基于密文,对矩阵a进行ll分解,得到第一分解结果,利用第一分解结果,基于密文进行最小二乘估计,得到向量x的解;或者,基于密文,对矩阵a进行ldl分解,得到第二分解结果,利用第二分解结果,基于密文进行最小二乘估计,得到向量x的解。相较于显式方程求解的方法,本发明实施例通过矩阵分解,可以省略显式方程求解的中间计算步骤,不仅可以降低计算复杂度,提高计算效率,而且可以节省中间计算所需的内存开销。此外,通过多方安全计算系统执行包含最小二乘估计的密文计算任务,可以防止数据的隐私泄露,保证数据安全,使得最小二乘估计可适用于安全性和实时性要求较高的计算场景。
附图说明
49.为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
50.图1是本发明的一种数据处理方法实施例的步骤流程图;
51.图2是本发明的一种数据处理装置实施例的结构框图;
52.图3是本发明的一种用于数据处理的装置800的框图;
53.图4是本发明的一些实施例中服务器的结构示意图。
具体实施方式
54.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
55.方法实施例
56.参照图1,示出了本发明的一种数据处理方法实施例的步骤流程图,所述方法可用于多方安全计算系统,所述方法具体可以包括如下步骤:
57.步骤101、接收密文计算任务,所述密文计算任务包括最小二乘估计,所述最小二乘估计用于对给定的矩阵a和向量y,求解向量x,使得min
x
||y

ax||2;其中,矩阵a为密文数据;
58.步骤102、基于密文,对所述矩阵a进行ll分解,得到第一分解结果;或者,基于密文,对所述矩阵a进行ldl分解,得到第二分解结果;
59.步骤103、利用所述第一分解结果,基于密文进行最小二乘估计,得到向量x的解;或者,利用所述第二分解结果,基于密文进行最小二乘估计,得到向量x的解。
60.多方安全计算系统是一种保护数据隐私安全的计算系统。本发明实施例对所述多方安全计算系统采用的安全计算协议不做限制。例如,所述多方安全计算系统可以基于mpc(secure multi

party computation,多方安全计算)协议,在基于mpc协议的多方安全计算系统中,多个计算参与方可以在不泄漏自身数据的前提下,使用多方安全计算技术进行协同计算得到计算结果,参与计算的数据、中间结果、以及最终结果可以为密文。当然,所述多方安全计算系统还可以基于秘密分享、半同态、不经意传输等技术实现的多方安全计算协议。
61.所述多方安全计算系统可以包括任务管控平台、计算节点、以及数据节点。所述任务管控平台用于发布密文计算任务,并且调度计算节点执行密文计算任务。数据节点可以提供数据存储、数据提供、计算结果存储等服务。计算节点用于根据数据节点提供的密文数据执行任务管控平台下发的密文计算任务。
62.所述密文计算任务可以通过预设编程语言的计算机程序实现,多方安全计算系统通过执行该计算机程序可以实现相应的计算功能。所述密文计算任务包括但不限于数据清洗、计算、分析、模型训练、存储、数据库查询、联邦学习、线性回归、通信信号估计、xgboost、联合统计、隐匿查询、隐私求交等等。可以理解,本发明实施例对密文计算任务的具体类型不加以限制。
63.所述密文计算任务可以是藉由计算机程序语言来描述对私有数据的处理过程,该处理过程可包含一个或多个计算指令。本发明的方案适用于基于密文的任何隐私操作场景。在本发明实施例中,给定的矩阵a为密文数据。在一些示例中,所述密文数据可以为一种私有数据,如环境监控数据、用户征信数据、用户账户数据、个人健康数据等。一个密文计算任务可以包括至少一条计算指令,所述计算指令中可以包含最小二乘估计的指令。
64.在本发明实施例中,假设给定矩阵a,也即a为m*n的实数矩阵。给定向量y,也即y为m维的实数向量。最小二乘估计指对给定的矩阵a和向量y,求解向量x,也即x为n维的实数向量,使得min
x
||y

ax||2;其中,m≥n,矩阵a中的各元素为密文数据,且矩阵a中的各元素均为正数。
65.本发明实施例可以利用多方安全计算系统实现最小二乘估计,进而可以利用多方安全计算系统执行包含最小二乘估计的密文计算任务,在整个计算过程中,参与计算的数据、中间结果、以及最终结果可以为密文,不会暴露数据明文,可以保证数据的隐私安全。
66.在本发明的一种可选实施例中,所述密文计算任务可以包括线性回归计算,所述
矩阵a可以包括至少两个参与方的密文数据,所述向量y可以包括所述密文数据对应的预测标签,所述向量x的解可以为线性回归的所述预测标签对应的各特征的权重。
67.本发明提供的数据处理方法可应用于线性回归计算场景。在线性回归计算场景下,a可以为数据源,包括来自多个(两个以上)参与方的密文数据。y为标签向量,表示各密文数据对应的预测标签。待求解的x为所述预测标签对应的各特征的权重。所述参与方可以为数据方,可用于为多方安全计算提供计算数据。
68.示例性地,假设矩阵a中的元素为来自多个参与方的用户的银行存款数据和淘宝支付数据,y为违约概率,待求解的x即为线性回归各个特征的权重。在线性回归之后,各个特征对应的权重可能不同。比如,预测违约概率时,存款特征对应的权重可能高一些,性别特征对应的权重可能低一些。
69.在本发明的一种可选实施例中,所述密文计算任务可以包括通信信号估计,所述矩阵a可以为信道加密矩阵,所述向量y可以为基于矩阵a对原信号加密后得到的编码信号,所述向量x的解可以为估计得到的原信号。
70.本发明实施例的数据处理方法还可应用于通信信号估计场景。在通信信号估计场景下,a为用于对原信号x进行加密的加密矩阵。y为利用加密矩阵a对原信号x进行加密后得到的编码信号。对于发送方,可以利用加密矩阵a对原信号x进行加密,得到编码信号y,如y=a*x。发送方将编码信号y发送给接收方后,接收方利用加密矩阵a可以估计得到原信号x。
71.可以理解的是,最小二乘估计可以广泛应用于各个领域,上述线性回归、通信信号估计仅作为本发明的一种应用示例,本发明提供的数据处理方法可适用于任意需要进行最小二乘估计的应用场景。例如,本发明提供的数据处理方法还可应用于gps(global positioning system,全球定位系统)中的最小二乘估计过程。
72.对于任意的密文计算任务,假设矩阵a中的元素和向量y中的元素分别来自多个参与方,且都为密文,本发明实施例均可利用多方安全计算系统根据密文的a和y估计得到x的解。由此,通过本发明实施例,可以实现在密文基础上对多个数据方的数据进行融合计算,既可以实现数据共享,又可以保证数据的隐私安全。
73.最小二乘估计的计算效率极大影响着密文计算任务的执行效率,因此,最小二乘估计的计算效率在实时性要求高的计算场景中尤为重要。
74.在具体应用中,最小二乘估计可以通过显示方程求解,也即,可以通过x=(a
t
a)
‑1a
t
y直接得到x的解。
75.然而,通过显示方程进行最小二乘估计求解,首先需要计算矩阵乘法a
t
a,这一步的复杂度为o(2mn2)。然后需要计算矩阵的逆,即(a
t
a)
‑1,这一步的复杂度最低为接下来需要计算矩阵乘法(a
t
a)
‑1a
t
,复杂度为o(2n2m)。最后计算矩阵与向量相乘,即[(a
t
a)
‑1a
t
]y,复杂度为o(m2)。所以使用显示方程求解总的复杂度为复杂度较高,难以满足实时性要求高的计算场景。
[0076]
为提高最小二乘估计的计算效率,本发明实施例在最小二乘估计的过程中,不用显示方程直接求解,而是先对矩阵a进行矩阵分解。具体地,对矩阵a进行ll分解,得到第一分解结果;或者,对所述矩阵a进行ldl分解,得到第二分解结果。为了保证数据隐私安全,本发明实施例基于密文对矩阵a进行ll分解或者ldl分解,得到的第一分解结果或者第二分解
结果可以为密文数据。
[0077]
矩阵分解,是将矩阵拆解为数个矩阵的乘积。ll分解即cholesky分解,又称平方根法,是当矩阵a为实对称正定矩阵时,lu三角分解法的变形。ll分解是把一个对称正定的矩阵表示成一个下三角矩阵l和其转置的乘积的分解。它要求矩阵的所有特征值必须大于零,故分解的下三角的对角元也是大于零的。
[0078]
在本发明的一种可选实施例中,所述基于密文,对所述矩阵a进行ll分解,得到第一分解结果,可以包括:
[0079]
步骤s11、根据所述矩阵a,确定实对称正定矩阵a
t
a;
[0080]
步骤s12、基于密文,对所述实对称正定矩阵a
t
a进行ll分解,得到第一分解结果包括矩阵l和矩阵l
t
,使得a
t
a=l
t
l;其中,l为下三角矩阵。
[0081]
ll分解是把一个实对称正定矩阵表示成一个下三角矩阵l和其转置的乘积的分解。在本发明实施例中,并不限制密文计算任务中给定的矩阵a为实对称正定矩阵。因此,在对矩阵a进行ll分解之前,本发明实施例先对矩阵a左乘a
t
,得到实对称正定矩阵a
t
a。然后,基于密文,对所述实对称正定矩阵a
t
a进行ll分解,得到第一分解结果包括矩阵l和矩阵l
t
,使得a
t
a=l
t
l;其中,l为下三角矩阵。
[0082]
进一步地,所述利用所述第一分解结果,基于密文进行最小二乘估计,得到向量x的解,可以包括:
[0083]
步骤s21、基于所述第一分解结果,将所述最小二乘估计转换为求解方程组l
t
lx=y,并令向量b=lx;
[0084]
步骤s22、基于密文求解上三角方程组l
t
b=y,得到向量b的解;
[0085]
步骤s23、根据所述向量b的解,基于密文求解下三角方程组lx=b,得到向量x的解。
[0086]
利用ll分解,可将实对称正定矩阵a
t
a分解为a
t
a=l
t
l,其中l为下三角矩阵。由此,最小二乘估计需要求解的原方程组ax=y可以转换为求解方程组l
t
lx=y。令向量b=lx,基于密文求解上三角方程组l
t
b=y,可以得到向量b的解。再根据向量b的解,基于密文求解下三角方程组lx=b,可以得到向量x的解。
[0087]
本发明实施例先对矩阵a进行ll分解,得到第一分解结果,再利用第一分解结果,对方程组ax=y进行最小二乘估计求解得到向量x的解,使得最小二乘估计求解的总的复杂度降低为相对于显示方程求解的方法,可以提高密文计算任务的执行效率。
[0088]
一个示例中,ll分解的算法描述可以如下:
[0089][0090]
for j从2到n:
[0091][0092]
fori从2到n:
[0093]
[0094]
forj从i+1到n:
[0095][0096]
其中,a
ij
表示矩阵a的元素,l
ij
表示矩阵l的元素。
[0097]
利用ll分解虽然可以在一定程度上降低最小二乘估计求解的复杂度,提高密文计算任务的执行效率,但是,从上述ll分解的算法中可以看出,在ll分解的第3步,需要进行平方根运算;以及在ll分解的第4步,需要进行除法运算。基于秘密分享、半同态、不经意传输等技术实现的多方安全计算协议,进行开平方根运算和除法运算的开销远远大于加乘等运算带来的开销,会导致这一步速度较慢,影响计算的实时性。为了提高进一步提高计算效率,本发明实施例还可以使用ldl分解代替ll分解,以避免开平方运算。
[0098]
在本发明的一种可选实施例中,所述所述基于密文,对所述矩阵a进行ldl分解,得到第二分解结果,可以包括:
[0099]
步骤s31、根据所述矩阵a,确定实对称正定矩阵a
t
a;
[0100]
步骤s32、基于密文,对所述实对称正定矩阵a
t
a进行ldl分解,得到第二分解结果包括矩阵l、矩阵d、以及矩阵l
t
,使得a
t
a=ldl
t
;其中,l为对角元素都为1的下三角矩阵,d为对角元素都为正数的对角矩阵。
[0101]
ldl分解是把一个实对称正定矩阵表示成一个对角元素都为1的下三角矩阵l、一个对角元素都为正数的对角矩阵d、以及l的转置的乘积的分解。在本发明实施例中,并不限制密文计算任务中给定的矩阵a为实对称正定矩阵。因此,在对矩阵a进行ldl分解之前,本发明实施例先对矩阵a左乘a
t
,得到实对称正定矩阵a
t
a。然后,基于密文,对所述实对称正定矩阵a
t
a进行ldl分解,得到第二分解结果包括矩阵l、矩阵d、以及矩阵l
t
,使得a
t
a=ldl
t
;其中,l为对角元素都为1的下三角矩阵,d为对角元素都为正数的对角矩阵。
[0102]
进一步地,所述利用所述第二分解结果,基于密文进行最小二乘估计,得到向量x的解,可以包括:
[0103]
步骤s41、基于第二分解结果,将所述最小二乘估计转换为求解方程组ldl
t
x=a
t
y,并令向量z=dl
t
x;
[0104]
步骤s42、基于密文求解下三角方程组lz=a
t
y,得到向量z的解;
[0105]
步骤s43、根据所述向量z的解,基于密文求解上三角方程组l
t
x=d
‑1z,得到向量x的解。
[0106]
利用ldl分解,可将实对称正定矩阵a
t
a分解为ldl
t
,其中,l为对角元素都为1的下三角矩阵,d为对角元素都为正数的对角矩阵。由此,最小二乘估计需要求解的原方程组ax=y可以转换为求解方程组ldl
t
x=a
t
y。令向量z=dl
t
x,基于密文求解下三角方程组lz=a
t
y,可以得到向量z的解。再根据向量z的解,基于密文求解上三角方程组l
t
x=d
‑1z,可以得到向量x的解。
[0107]
本发明实施例先对矩阵a进行ldl分解,得到第二分解结果,再利用第二分解结果,对方程组ax=y进行最小二乘估计求解得到向量x的解,使得最小二乘估计求解的总的复杂度降低为相对于显示方程求解的方法,可以提高密文计算任务的执行效率。
[0108]
一个示例中,ldl分解的算法描述可以如下:
[0109]
forj从1到n:
[0110][0111]
fori从j+1到n:
[0112][0113]
其中,d
j
表示矩阵d的对角元素,l
ij
表示矩阵l的第i行第j列的元素。
[0114]
本发明实施例利用ldl分解代替ll分解,可以避免ll分解中的开根号运算。需要说明的是,在利用ldl分解求解x的过程中,在基于密文求解上三角方程组l
t
x=d
‑1z时,由于d
‑1为对角矩阵,d
‑1z等价于对z的每一个元素单独做除法。由于矩阵分解的过程需要进行迭代运算,前一轮迭代运算的误差会累积到下一轮迭代运算中。ldl分解的过程中不用进行开根号运算,可以避免误差累积,相对于ll分解可以提高计算精度。此外,本发明实施例利用ldl分解替代ll分解时,将ll分解过程中所需的开根号运算替换为ldl分解完成之后,基于密文求解上三角方程组l
t
x=d
‑1z时的一步除法运算,不仅可以避免开根号运算在迭代过程中的误差累计,提高计算精度,而且这一步除法运算可以通过向量化实现,相对于ll分解,可以进一步提高计算效率。
[0115]
在具体实施中,可以根据实际需求选择使用ll分解或者使用ldl分解的方法来加速多方安全计算系统进行最小二乘估计求解的速度。
[0116]
下面通过一个具体示例说明本发明利用ldl分解进行最小二乘估计求解的过程。
[0117]
假设给定矩阵向量需要求解min
x
||y

ax||2。
[0118]
需要说明的是,上述矩阵a和向量y中的元素可以为密文,为便于说明,此处以明文示出。
[0119]
首先,对矩阵a左乘a
t
,得到实对称正定矩阵a
t
a。
[0120]
然后,基于密文,对该实对称正定矩阵a
t
a进行ldl分解,得到第二分解结果包括矩阵l和矩阵d,使得a
t
a=ldl
t
,其中,
[0121]
矩阵矩阵
[0122]
接下来,令向量z=dl
t
x,基于密文求解下三角方程组lz=a
t
y,得到向量z的解,即,
[0123]
最后,根据向量z的解,基于密文求解上三角方程组l
t
x=d
‑1z,可以得到向量x的解。具体地,可以计算之后求解上三角方程组l
t
x=v,即,
[0124]
其中,求解可以通过从下到上求解x。具体地,首先求解然后求解最后求解由此,可以得到最终的解为
[0125]
本发明实施例在多方安全计算系统中,利用两种矩阵分解的方法解决最小二乘估计的求解问题。具体地,基于密文,对矩阵a进行ll分解,得到第一分解结果,利用第一分解结果,基于密文进行最小二乘估计,得到向量x的解;或者,基于密文,对矩阵a进行ldl分解,得到第二分解结果,利用第二分解结果,基于密文进行最小二乘估计,得到向量x的解。相较于显式方程求解的方法,本发明实施例通过矩阵分解,可以省略显式方程求解的中间计算步骤,不仅可以降低计算复杂度,提高计算效率,而且可以节省中间计算所需的内存开销。此外,通过多方安全计算系统执行包含最小二乘估计的密文计算任务,可以防止数据的隐私泄露,保证数据安全,使得最小二乘估计可适用于安全性和实时性要求较高的计算场景。
[0126]
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
[0127]
装置实施例
[0128]
参照图2,示出了本发明的一种数据处理装置实施例的结构框图,所述装置可用于多方安全计算系统,所述装置具体可以包括:
[0129]
任务接收模块201,用于接收密文计算任务,所述密文计算任务包括最小二乘估计,所述最小二乘估计用于对给定的矩阵a和向量y,求解向量x,使得min
x
||y

ax||2;其中,矩阵a为密文数据;
[0130]
矩阵分解模块202,用于基于密文,对所述矩阵a进行ll分解,得到第一分解结果;或者,基于密文,对所述矩阵a进行ldl分解,得到第二分解结果;
[0131]
结果计算模块203,用于利用所述第一分解结果,基于密文进行最小二乘估计,得到向量x的解;或者,利用所述第二分解结果,基于密文进行最小二乘估计,得到向量x的解。
[0132]
可选地,所述矩阵分解模块,包括:
[0133]
矩阵变换子模块,用于根据所述矩阵a,确定实对称正定矩阵a
t
a;
[0134]
第一分解子模块,用于基于密文,对所述实对称正定矩阵a
t
a进行ll分解,得到第一分解结果包括矩阵l和矩阵l
t
,使得a
t
a=l
t
l;其中,l为下三角矩阵;
[0135]
所述结果计算模块,包括:
[0136]
第一转换子模块,用于基于所述第一分解结果,将所述最小二乘估计转换为求解
方程组l
t
lx=y,并令向量b=lx;
[0137]
第一计算子模块,用于基于密文求解上三角方程组l
t
b=y,得到向量b的解;
[0138]
第二计算子模块,用于根据所述向量b的解,基于密文求解下三角方程组lx=b,得到向量x的解。
[0139]
可选地,所述结果计算模块,包括:
[0140]
矩阵变换子模块,用于根据所述矩阵a,确定实对称正定矩阵a
t
a;
[0141]
第二分解子模块,用于基于密文,对所述实对称正定矩阵a
t
a进行ldl分解,得到第二分解结果包括矩阵l、矩阵d、以及矩阵l
t
,使得a
t
a=ldl
t
;其中,l为对角元素都为1的下三角矩阵,d为对角元素都为正数的对角矩阵;
[0142]
所述利结果计算模块,包括:
[0143]
第二转换子模块,用于基于第二分解结果,将所述最小二乘估计转换为求解方程组ldl
t
x=a
t
y,并令向量z=dl
t
x;
[0144]
第三计算子模块,用于基于密文求解下三角方程组lz=a
t
y,得到向量z的解;
[0145]
第四计算子模块,用于根据所述向量z的解,基于密文求解上三角方程组l
t
x=d
‑1z,得到向量x的解。
[0146]
可选地,所述密文计算任务包括线性回归计算,所述矩阵a包括至少两个参与方的密文数据,所述向量y包括所述密文数据对应的预测标签,所述向量x的解为线性回归的所述预测标签对应的各特征的权重。
[0147]
可选地,所述密文计算任务包括通信信号估计,所述矩阵a为信道加密矩阵,所述向量y为基于矩阵a对原信号加密后得到的编码信号,所述向量x的解为估计得到的原信号。
[0148]
本发明实施例在多方安全计算系统中,利用两种矩阵分解的方法解决最小二乘估计的求解问题。具体地,基于密文,对矩阵a进行ll分解,得到第一分解结果,利用第一分解结果,基于密文进行最小二乘估计,得到向量x的解;或者,基于密文,对矩阵a进行ldl分解,得到第二分解结果,利用第二分解结果,基于密文进行最小二乘估计,得到向量x的解。相较于显式方程求解的方法,本发明实施例通过矩阵分解,可以省略显式方程求解的中间计算步骤,不仅可以降低计算复杂度,提高计算效率,而且可以节省中间计算所需的内存开销。此外,通过多方安全计算系统执行包含最小二乘估计的密文计算任务,可以防止数据的隐私泄露,保证数据安全,使得最小二乘估计可适用于安全性和实时性要求较高的计算场景。
[0149]
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0150]
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0151]
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0152]
本发明实施例提供了一种用于数据处理的装置,用于多方安全计算系统,所述装置包括有存储器,以及一个以上程序,其中一个以上程序存储于存储器中,且经配置以由一个以上处理器执行所述一个以上程序,所述一个以上程序包含用于进行以下操作的指令:
[0153]
接收密文计算任务,所述密文计算任务包括最小二乘估计,所述最小二乘估计用于对给定的矩阵a和向量y,求解向量x,使得min
x
||y

ax||2;其中,矩阵a为密文数据;
[0154]
基于密文,对所述矩阵a进行ll分解,得到第一分解结果;或者,基于密文,对所述矩阵a进行ldl分解,得到第二分解结果;
[0155]
利用所述第一分解结果,基于密文进行最小二乘估计,得到向量x的解;或者,利用所述第二分解结果,基于密文进行最小二乘估计,得到向量x的解。
[0156]
可选地,所述基于密文,对所述矩阵a进行ll分解,得到第一分解结果,包括:
[0157]
根据所述矩阵a,确定实对称正定矩阵a
t
a;
[0158]
基于密文,对所述实对称正定矩阵a
t
a进行ll分解,得到第一分解结果包括矩阵l和矩阵l
t
,使得a
t
a=l
t
l;其中,l为下三角矩阵;
[0159]
所述利用所述第一分解结果,基于密文进行最小二乘估计,得到向量x的解,包括:
[0160]
基于所述第一分解结果,将所述最小二乘估计转换为求解方程组l
t
lx=y,并令向量b=lx;
[0161]
基于密文求解上三角方程组l
t
b=y,得到向量b的解;
[0162]
根据所述向量b的解,基于密文求解下三角方程组lx=b,得到向量x的解。
[0163]
可选地,,所述基于密文,对所述矩阵a进行ldl分解,得到第二分解结果,包括:
[0164]
根据所述矩阵a,确定实对称正定矩阵a
t
a;
[0165]
基于密文,对所述实对称正定矩阵a
t
a进行ldl分解,得到第二分解结果包括矩阵l、矩阵d、以及矩阵l
t
,使得a
t
a=ldl
t
;其中,l为对角元素都为1的下三角矩阵,d为对角元素都为正数的对角矩阵;
[0166]
所述利用所述第二分解结果,基于密文进行最小二乘估计,得到向量x的解,包括:
[0167]
基于第二分解结果,将所述最小二乘估计转换为求解方程组ldl
t
x=a
t
y,并令向量z=dl
t
x;
[0168]
基于密文求解下三角方程组lz=a
t
y,得到向量z的解;
[0169]
根据所述向量z的解,基于密文求解上三角方程组l
t
x=d
‑1z,得到向量x的解。
[0170]
可选地,所述密文计算任务包括线性回归计算,所述矩阵a包括至少两个参与方的密文数据,所述向量y包括所述密文数据对应的预测标签,所述向量x的解为线性回归的所述预测标签对应的各特征的权重。
[0171]
可选地,所述密文计算任务包括通信信号估计,所述矩阵a为信道加密矩阵,所述向量y为基于矩阵a对原信号加密后得到的编码信号,所述向量x的解为估计得到的原信号。
[0172]
图3是根据一示例性实施例示出的一种用于数据处理的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
[0173]
参照图3,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(i/o)的接口812,传感器组件814,以及通信组件816。
[0174]
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
[0175]
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
[0176]
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
[0177]
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
[0178]
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(mic),当装置800处于操作模式,如呼叫模式、记录模式和语音信息处理模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
[0179]
i/o接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
[0180]
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
[0181]
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频信息处理(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
[0182]
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列
(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
[0183]
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd

rom、磁带、软盘和光数据存储设备等。
[0184]
图4是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,cpu)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
[0185]
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如windows servertm,mac os xtm,unixtm,linuxtm,freebsdtm等等。
[0186]
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行图1所示的数据处理方法。
[0187]
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行一种数据处理方法,所述方法包括:接收密文计算任务,所述密文计算任务包括最小二乘估计,所述最小二乘估计用于对给定的矩阵a和向量y,求解向量x,使得min
x
||y

ax||2;其中,矩阵a为密文数据;基于密文,对所述矩阵a进行ll分解,得到第一分解结果;或者,基于密文,对所述矩阵a进行ldl分解,得到第二分解结果;利用所述第一分解结果,基于密文进行最小二乘估计,得到向量x的解;或者,利用所述第二分解结果,基于密文进行最小二乘估计,得到向量x的解。
[0188]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
[0189]
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
[0190]
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
[0191]
以上对本发明所提供的一种数据处理方法、一种数据处理装置和一种用于数据处理的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所
述,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1