本申请涉及数据处理,尤其是涉及一种基于区块链与合同理论的联邦学习方法、装置及设备。
背景技术:
1、机器学习是实现人工智能的一种途径,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习用于研究计算机如何模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习更加注重算法设计,使计算机能够自动地从数据中学习规律,并利用规律对未知数据进行预测。机器学习已经有了十分广泛的应用,如深度学习、数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、语音识别和手写识别等。
2、为了采用机器学习实现人工智能处理,需要获取大量样本数据(如图像数据,即具有标签数据的图像),并基于这些样本数据训练出机器学习模型(如具有目标检测功能、目标分类功能的机器学习模型),并将机器学习模型部署到终端设备,以使终端设备基于机器学习模型实现人工智能处理。
3、由于终端设备本地的样本数据的数量有限,无法训练出性能比较高的机器学习模型,因此,每个终端设备均需要将本地的样本数据发送给服务器,由服务器基于多个终端设备的大量样本数据训练出机器学习模型。
4、但是,上述方式需要在终端设备与服务器之间传输样本数据,存在数据安全隐患,无法保证数据安全,样本数据作为终端设备的数字资产,终端设备不愿意向服务器共享样本数据。由于需要在终端设备与服务器之间传输大量样本数据(如图像数据),这些样本数据需要占用大量带宽资源。
技术实现思路
1、有鉴于此,本申请提供一种基于区块链与合同理论的联邦学习方法、装置及设备,能够减少传输终端设备的数据,从而保证数据的安全性。
2、本申请提供一种基于区块链与合同理论的联邦学习方法,应用于数据处理系统中的服务器,所述数据处理系统还包括m个终端设备,所述方法包括:
3、针对每个终端设备,基于历史数据确定所述终端设备对应的第一数据质量,并从区块链获取所述终端设备对应的第二数据质量,基于所述第一数据质量和所述第二数据质量确定所述终端设备对应的目标数据质量;
4、基于每个终端设备对应的目标数据质量从所述m个终端设备中选取i个目标终端设备,将目标合同组发送给所述i个目标终端设备,所述目标合同组包括k个激励合同,每个激励合同包括最佳样本数量和合同激励值,并将初始全局模型参数发送给所述i个目标终端设备,以使每个目标终端设备从所述k个激励合同中选取一个激励合同作为目标激励合同,并基于所述目标激励合同的最佳样本数量和所述初始全局模型参数获取局部模型参数;
5、基于所述i个目标终端设备的局部模型参数确定目标全局模型参数;
6、若目标全局模型参数未收敛,则将所述目标全局模型参数确定为初始全局模型参数,返回执行将初始全局模型参数发送给所述i个目标终端设备的操作;
7、若目标全局模型参数已收敛,则将所述目标全局模型参数确定为已训练参数;其中,所述已训练参数用于对数据进行处理。
8、本申请提供一种基于区块链与合同理论的联邦学习装置,应用于数据处理系统中的服务器,所述数据处理系统还包括m个终端设备,所述装置包括:
9、确定模块,用于针对每个终端设备,基于历史数据确定所述终端设备对应的第一数据质量,并从区块链获取所述终端设备对应的第二数据质量,基于所述第一数据质量和所述第二数据质量确定所述终端设备对应的目标数据质量;
10、选取模块,用于基于每个终端设备对应的目标数据质量从所述m个终端设备中选取i个目标终端设备,i为正整数,且i小于m;
11、发送模块,用于将目标合同组发送给所述i个目标终端设备,所述目标合同组包括k个激励合同,每个激励合同包括最佳样本数量和合同激励值,并将初始全局模型参数发送给所述i个目标终端设备,以使每个目标终端设备从所述k个激励合同中选取一个激励合同作为目标激励合同,并基于所述目标激励合同的最佳样本数量和所述初始全局模型参数获取局部模型参数;
12、所述确定模块,还用于基于所述i个目标终端设备的局部模型参数确定目标全局模型参数;若目标全局模型参数未收敛,则将所述目标全局模型参数确定为初始全局模型参数,由所述发送模块将初始全局模型参数发送给所述i个目标终端设备;若目标全局模型参数已收敛,则将所述目标全局模型参数确定为已训练参数;其中,所述已训练参数用于对数据进行处理。
13、本申请提供一种电子设备,包括:处理器和机器可读存储介质,机器可读存储介质存储有能够被处理器执行的机器可执行指令;其中,处理器用于执行机器可执行指令,以实现上述的基于区块链与合同理论的联邦学习方法。
14、另一方面,本申请提供一种机器可读存储介质,所述机器可读存储介质存储有能够被处理器执行的机器可执行指令;其中,所述处理器用于执行所述机器可执行指令,以实现上述的基于区块链与合同理论的联邦学习方法。
15、另一方面,本申请提供一种计算机程序,所述计算机程序存储于机器可读存储介质,当处理器执行所述机器可读存储介质中的所述计算机程序时,促使所述处理器实现上述的基于区块链与合同理论的联邦学习方法。
16、由以上技术方案可见,本申请实施例中,终端设备向服务器发送的是局部模型参数,而不是终端设备的数据,从而保护终端设备的数字资产,保证数据安全。由于终端设备与服务器之间传输的是局部模型参数,而不是大量数据(如图像数据),节省带宽资源。将区块链引入模型训练过程,服务器通过区块链提供的数据(具有不可否认性和抗篡改性),能够准确筛选出i个高参与积极性的目标终端设备来参与模型训练过程,提高模型训练过程的效率,更快的得到已训练参数,模型训练时间更短,模型训练的收敛速度更快,模型精度更高。
1.一种基于区块链与合同理论的联邦学习方法,其特征在于,应用于数据处理系统中的服务器,所述数据处理系统还包括m个终端设备,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求1所述的方法,其特征在于,
4.根据权利要求1所述的方法,其特征在于,
5.根据权利要求1所述的方法,其特征在于,
6.根据权利要求5所述的方法,其特征在于,
7.根据权利要求1所述的方法,其特征在于,所述目标终端设备从所述k个激励合同中选取一个激励合同作为目标激励合同,包括:
8.一种基于区块链与合同理论的联邦学习装置,其特征在于,应用于数据处理系统中的服务器,所述数据处理系统还包括m个终端设备,所述装置包括:
9.根据权利要求8所述的装置,其特征在于,
10.一种电子设备,其特征在于,包括:处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令;所述处理器用于执行机器可执行指令,以实现权利要求1-7任一所述的方法。