数据处理方法、装置和计算机可读存储介质与流程

文档序号:26838831发布日期:2021-10-08 19:44阅读:来源:国知局

技术特征:
1.一种数据处理方法,包括:标签缺失方接收标签持有方发送的对象的标签信息,所述标签信息包括:标签持有方加密后的各个标签的标签向量;所述标签缺失方根据所述标签信息,利用注意力机制确定本地持有的所述对象的各项特征相对于标签的重要度;所述标签缺失方根据所述各项特征相对于标签的重要度,调整所述各项特征对应的特征向量;所述标签缺失方将所述各项特征调整后的特征向量输入联合模型中标签缺失方所持有的模型进行联邦学习。2.根据权利要求1所述的数据处理方法,其中,所述标签缺失方所持有的模型中嵌入层之后接入注意力机制模块;所述标签缺失方根据所述标签信息,利用注意力机制确定本地持有的所述对象的各项特征相对于标签的重要度包括:所述标签缺失方将所述嵌入层输出的所述各项特征对应的特征向量,以及所述标签信息输入所述注意力机制模块,得到所述注意力机制模块输出的标签持有方加密后的所述各项特征相对于标签的权重;所述标签缺失方根据所述标签持有方加密后的所述各项特征相对于标签的权重,确定所述各项特征相对于标签的重要度。3.根据权利要求2所述的数据处理方法,其中,所述标签缺失方根据所述标签持有方加密后的所述各项特征相对于标签的权重,确定所述各项特征相对于标签的重要度包括:所述标签缺失方对所述标签持有方加密后的所述各项特征相对于标签的权重进行加密;所述标签缺失方将所述标签缺失方和标签持有方加密后的所述各项特征相对于标签的权重,发送至所述标签持有方;所述标签缺失方接收所述标签持有方进行解密后返回的标签缺失方加密后的所述各项特征相对于标签的权重;所述标签缺失方对所述标签缺失方加密后的所述各项特征相对于标签的权重进行解密,得到所述各项特征相对于标签的权重,作为所述各项特征相对于标签的重要度。4.根据权利要求2所述的数据处理方法,其中,在所述注意力机制模型内,利用预设函数计算所述标签持有方加密后的各个标签的标签向量与所述各项特征的特征向量对应的注意力得分;利用softmax激活函数将所述注意力得分映射为标签持有方加密后的所述各项特征相对于标签的权重。5.根据权利要求3所述的数据处理方法,其中,标签持有方和标签缺失方进行加密的方法为同态加密或者差分隐私或者混淆电路或者秘密共享。6.根据权利要求2所述的数据处理方法,其中,所述标签缺失方根据所述各项特征相对于标签的重要度,调整所述各项特征对应的特
征向量包括:针对每项特征,所述标签缺失方将该特征对应的特征向量分别与特征相对于标签的权重相乘,得到所述各项特征调整后的特征向量。7.根据权利要求1所述的数据处理方法,其中,所述对象为电话号码,所述标签为用户类别,所述各项特征包括用户的通信行为特征;其中,所述用户类别包括:普通用户、骚扰电话、外卖、快递、推销员中至少一项;或者,所述对象为用户,所述标签为借贷风险级别,所述各项特征包括用户消费行为数据;或者,所述对象为用户,所述标签为保险风险级别,所述各项特征包括用户出行数据。8.根据权利要求7所述的数据处理方法,还包括:在所述联合模型训练完成后,获取待识别对象的各项特征;将所述待识别对象的各项特征输入所述联合模型,得到输出的所述待识别对象对应的标签,并进行显示。9.一种数据处理装置,其中,所述数据处理装置设置于标签缺失方,包括:接收单元,用于接收标签持有方发送的对象的标签信息,所述标签信息包括:标签持有方加密后的各个标签的标签向量;确定单元,用于根据所述标签信息,利用注意力机制确定本地持有的所述对象的各项特征相对于标签的重要度;调整单元,用于根据所述各项特征相对于标签的重要度,调整所述各项特征对应的特征向量;模型输入单元,用于将所述各项特征调整后的特征向量输入联合模型中标签缺失方所持有的模型进行联邦学习。10.一种数据处理装置,包括:处理器;以及耦接至所述处理器的存储器,用于存储指令,所述指令被所述处理器执行时,使所述处理器执行如权利要求1-8任一项所述的数据处理方法。11.一种非瞬时性计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现权利要求1-8任一项所述数据处理方法的步骤。

技术总结
本公开涉及一种数据处理方法、装置和计算机可读存储介质,涉及计算机技术领域。本公开的方法包括:标签缺失方接收标签持有方发送的对象的标签信息,标签信息包括:标签持有方加密后的各个标签的标签向量;标签缺失方根据标签信息,利用注意力机制确定本地持有的对象的各项特征相对于标签的重要度;标签缺失方根据各项特征相对于标签的重要度,调整各项特征对应的特征向量;标签缺失方将各项特征调整后的特征向量输入联合模型中标签缺失方所持有的模型进行联邦学习。本公开中标签缺失方根据注意力机制可以激活重要特征,去除无效特征,减小联合模型训练难度,同时提高了联合模型的准确率和训练效率。确率和训练效率。确率和训练效率。


技术研发人员:项超 王学敏 孟维业 王建秀
受保护的技术使用者:中国电信股份有限公司
技术研发日:2020.03.31
技术公布日:2021/10/7
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1