本技术属于联邦学习和数字孪生,尤其涉及一种数字孪生模型的确定方法、装置、终端设备及介质。
背景技术:
1、工业物联网(iiot,industrial internet of things)作为物联网的延伸应用,将众多工业设备、分析部门和工作人员连接起来。工业物联网通过机械设备的精致配合,实现从汽车到农业的自动化制造应用。
2、但由于工业设备之间的异构性,以及工业环境的复杂性,使得工业设备之间数据连接变得困难。数字孪生(dt,digital-twin)技术作为一种新兴的数字化技术,为捕捉动态复杂的工业环境提供了一种可行的解决方案。它通过软件定义,在数字空间中创建虚拟对象,并根据状态、特征和演化准确地映射物理空间中的实体,其卓越的状态感知和实时分析极大地便利了决策制定。然而,数字孪生技术是由数据驱动的,工业数字孪生中的决策通常需要通过分布在各种工业设备上的设备数据来支持,而由于竞争、隐私、安全等问题,设备数据大多存在“数据孤岛”,这导致以此构建的数字孪生模型的准确性较低,难以应用于实际生产。
技术实现思路
1、本技术提供了一种数字孪生模型的确定方法、装置、终端设备及介质,可以解决目前数字孪生模型的准确性低的问题。
2、第一方面,本技术提供了一种数字孪生模型的确定方法,包括:
3、构建目标任务对应的初始数字孪生模型,并初始化初始数字孪生模型的参数,得到初始数字孪生模型参数;
4、分别针对每个参与执行目标任务的工业设备,根据初始数字孪生模型参数,构建工业设备对应的初始本地模型,并利用工业设备的本地数据对初始本地模型进行训练,得到工业设备的最终本地模型;
5、根据每个工业设备的最终本地模型的模型参数,利用预先设置的测试数据,得到每个工业设备的全局得分,并根据全局得分,确定联邦工业设备;全局得分用于表征工业设备的最终本地模型的优劣程度,联邦工业设备表示参与联邦学习的工业设备;
6、对所有联邦工业设备的最终本地模型的模型参数进行聚合,得到初始全局模型;
7、基于强化学习,对初始全局模型中的网络结构进行更新,得到最终全局模型;
8、基于联邦学习,根据最终全局模型,得到目标任务对应的最终数字孪生模型。
9、可选的,初始数字孪生模型包括用于提取目标任务特征的分支层、用于融合目标任务特征的融合层、用于给目标任务分配权重的注意力层以及输出层,分支层的输入端接收目标任务的初始特征,分支层的输出端连接融合层的输入端,融合层的输出端连接注意力层的输入端,注意力层的输出端连接输出层的输入端,输出层的输出端输出目标任务的最终特征;最终特征的表达式如下:
10、
11、其中,表示第个目标任务中第个任务数据对应的最终特征,,表示第个目标任务中任务数据的总数量,,表示目标任务总数量,表示第个目标任务中第个任务数据的输出函数,表示第个目标任务的融合特征,,表示所述融合层对应的激活函数,表示第个目标任务中第个任务数据的特征表示,,表示所述分支层的激活函数,表示第个目标任务的分支层参数,表示第个目标任务中第个任务数据的输入特征,表示第个目标任务中第个任务数据的注意力权重,,表示将注意力权重进行归一化,表示第个目标任务的注意力层参数。
12、可选的,初始数字孪生模型参数包括所有目标任务在分支层的参数,所有目标任务在融合层的参数以及所有目标任务在注意力层的参数;
13、初始化初始数字孪生模型的参数,包括:
14、分别针对分支层、融合层以及注意力层三者中的任一者,执行以下步骤:
15、步骤一,将该一者每层的初始权重矩阵初始化为符合高斯分布的小值,并将该层的初始偏置初始化为0;其中,,表示该一者的总层数;
16、步骤二,获取第个目标任务在该一者第层的输出,并分别计算的均值和方差;
17、步骤三,通过计算公式
18、
19、得到第个目标任务在该一者第层的中间权重矩阵和中间偏置;
20、步骤四,根据所述中间权重矩阵和所述中间偏置,获取第个目标任务在该一者第层的新输出;
21、步骤五,若,则分别将所述中间权重矩阵和所述中间偏置作为第个目标任务在该一者第层的最终权重矩阵和最终偏置,得到第个目标任务在该一者的参数;否则,将所述中间权重矩阵作为所述步骤三中的初始权重矩阵,将所述中间偏置作为所述步骤三中的初始偏置,返回执行步骤三。
22、可选的,初始本地模型包括分支层、融合层、注意力层以及输出层;
23、可选的,利用工业设备的本地数据对初始本地模型进行训练,得到工业设备的最终本地模型,包括:
24、通过计算公式
25、
26、得到所述工业设备的最终本地模型的模型参数;其中,表示第个工业设备的最终本地模型的模型参数,表示第个工业设备的初始本地模型的模型参数,,表示所有工业设备的总数量,表示第个所述工业设备的本地数据,表示对本地数据集中的所有数据样本进行求和,表示损失函数,损失函数与所述工业设备执行的任务相关,损失函数包括交叉熵损失函数和均方误差损失函数,表示数据样本对应的标签,表示第个工业设备的初始本地模型;
27、利用所述模型参数对初始本地模型进行更新,得到最终本地模型。
28、可选的,根据每个工业设备的最终本地模型的模型参数,利用预先设置的测试数据,得到每个工业设备的全局得分,并根据全局得分,确定联邦工业设备,包括:
29、通过计算公式,得到第个工业设备的平均损失;
30、通过计算公式,得到全局得分;其中,表示第个工业设备的全局得分,表示损失函数,表示用于控制训练误差和模型复杂度之间平衡的超参数;
31、通过计算公式
32、
33、
34、得到得分排序集合;其中,表示第个工业设备的全局得分,表示按照全局得分从大到小的排序函数,表示所述排序函数的值,表示评估函数,所述评估函数用于衡量工业设备的重要性,表示降序排列;
35、通过计算公式,得到联邦工业设备集合,联邦工业设备集合包括个联邦工业设备,表示联邦工业设备的总数量,均表示得分排序集合中的索引,表示从得分排序集合中选取前个工业设备的索引。
36、可选的,对所有联邦工业设备的最终本地模型的模型参数进行聚合,得到初始全局模型,包括:
37、通过计算公式
38、
39、得到分支层全局参数;其中,表示第个联邦工业设备的最终本地模型融合层第层的权重矩阵,表示第个联邦工业设备的最终本地模型融合层第层的偏置;
40、通过计算公式
41、
42、得到融合层全局参数;其中,表示第个所述联邦工业设备的最终本地模型融合层第层的权重矩阵,表示第个所述联邦工业设备的最终本地模型融合层第层的偏置;
43、通过计算公式
44、
45、
46、得到注意力层全局参数;其中,表示第个联邦工业设备的最终本地模型注意力层的权重矩阵,表示第个联邦工业设备的最终本地模型注意力层的偏置,表示第个联邦工业设备的权重;
47、通过计算公式,得到全局模型参数;
48、利用全局模型参数对初始数字孪生模型进行更新,得到初始全局模型。
49、可选的,基于强化学习,对初始全局模型中的网络结构进行更新,得到最终全局模型,包括:
50、步骤i,分别初始化策略网络参数和值函数网络参数,得到初始策略网络和初始值函数网络;
51、步骤ii,根据初始策略网络获取多个更新动作信息,针对多个更新动作信息中的每个更新动作信息,根据更新动作信息对初始全局模型进行更新,得到更新动作信息对应的中间全局模型,并计算更新动作信息对应的奖励;其中,更新动作信息包括更新动作和更新位置,更新动作包括增加、删除以及修改中的一种;
52、步骤iii,通过计算公式,得到所有更新动作信息的奖励加权和;其中,表示初始全局模型中第个网络结构对应的更新动作信息,表示使用初始策略网络参数和网络结构来选择更新动作信息的概率,表示对应的奖励;
53、步骤iv,通过计算公式,得到新的值函数网络参数;其中,表示根据预测的网络结构对应的价值估计,表示学习速率;
54、步骤v,通过计算公式,得到价值估计损失,价值估计损失用于最小化价值估计与实际奖励之间的差异;
55、步骤vi,通过计算公式,得到新的策略网络参数;其中,表示学习速率,表示损失函数关于策略网络的梯度;
56、步骤vii,统计步骤vi的执行次数,若执行次数大于等于预设阈值,则根据新的值函数网络参数和新的策略网络参数,对初始全局模型进行更新,得到最终全局模型;否则,将新的策略网络参数对应的新的策略网络作为步骤ii中的初始策略网络,将新的值函数网络参数作为步骤iv中的初始值函数网络参数,返回执行步骤ii。
57、第二方面,本技术提供了一种数字孪生模型的确定装置,包括:
58、初始数字孪生模块,用于构建目标任务对应的初始数字孪生模型,并初始化初始数字孪生模型的参数,得到初始数字孪生模型参数;
59、初始本地模块,用于分别针对每个参与执行目标任务的工业设备,根据初始数字孪生模型参数,构建工业设备对应的初始本地模型,并利用工业设备的本地数据对初始本地模型进行训练,得到工业设备的最终本地模型;
60、联邦工业设备模块,用于根据每个工业设备的最终本地模型的模型参数,利用预先设置的测试数据,得到每个工业设备的全局得分,并根据全局得分,确定联邦工业设备;全局得分用于表征工业设备的最终本地模型的优劣程度,联邦工业设备表示参与联邦学习的工业设备;
61、模型参数聚合模块,用于对所有联邦工业设备的最终本地模型的模型参数进行聚合,得到初始全局模型;
62、强化学习模块,用于基于强化学习,对初始全局模型中的网络结构进行更新,得到最终全局模型;
63、联邦学习模块,用于基于联邦学习,根据最终全局模型,得到目标任务对应的最终数字孪生模型。
64、第三方面,本技术提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述的数字孪生模型的确定方法。
65、第四方面,本技术提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述的数字孪生模型的确定方法。
66、本技术的上述方案有如下的有益效果:
67、本技术通过构建目标任务对应的初始数字孪生模型,并初始化数字孪生模型的参数,能够使数字孪生模型学习目标任务,提取目标任务的特征,从而提高数字孪生模型的效率和准确性;根据每个工业设备的本地模型参数,计算每个工业设备的全局得分,并根据全局得分确定参与联邦学习的工业设备,能够筛选出性能更优,适用性更强的工业设备,从而提高数字孪生模型的准确性;基于强化学习,对初始全局模型中的网络结构进行更新,得到最终全局模型,并结合联邦学习,得到最终的数字孪生模型,能够使数字孪生模型更加适配每个工业设备,从而提高数字孪生模型的准确性。
68、本技术的其它有益效果将在随后的具体实施方式部分予以详细说明。