本发明属于机械故障诊断,具体涉及一种机械设备集群的滚动轴承数据重心桥接智能诊断方法。
背景技术:
1、机械设备集群在风力发电场和柔性生产工厂等现代工业中发挥着关键作用,其依赖于多个机器节点协同工作来完成复杂的任务,确保这些机器节点的运行安全对于保持高效率和产品质量至关重要。智能故障诊断通过数据采集、特征提取、机器学习和实时监控,实现故障的早期识别、精确定位和预测性维护,是保障机器节点健康运行的重要手段。
2、随着深度迁移学习的快速发展,诊断知识可以从机械设备集群中的一个设备的滚动轴承节点(源域)转移到其他相似设备的滚动轴承节点(目标域),从而降低智能诊断模型在跨设备应用中对目标域高质量监测数据的强依赖性。多源迁移学习([1]b.yang,s.xu,y.lei,c.-g.lee,e.stewart,and c.roberts,"multisource transfer learning networkto complement knowledge for intelligent diagnosis ofmachines with unseenfaults,"mechanical systems and signal processing,vol.162,p.108095,2022.)通过从多个源域机械节点的数据中学习域不变特征,并将多源域诊断知识进行融合,应用于单一目标域机械设备的滚动轴承故障识别;然而,当前多个源域机械节点的滚动轴承数据要集中,这很难在实际中实现,原因在于:(1)数据隐私;一台机器的监控数据中包含生产质量、制造工艺等敏感信息,属于商业秘密,对于不同用户的机器更是如此,因此,大多数企业不愿意将这些数据集中起来,以防止负面信息的泄露。(2)成本;数据的集中和分析消耗了巨大的成本,快速的数据传输,特别是长距离的数据传输,需要大带宽的工业互联网。
3、联邦学习([2]t.li,a.k.sahu,a.talwalkar,and v.smith,"federatedlearning:challenges,methods,and future directions,"ieee signal processingmagazine,vol.37,no.3,pp.50-60,2020.)用多个客户端的本地数据训练一个全局模型,即构建服务器来聚合各源域的滚动轴承数据,例如源域的模型参数和高级特征,并将聚合模型广播回各个源域以进行进一步的训练;然而,现有方法存在以下缺点:(1)大多数方法在迁移特征分布适配过程中只考虑了边缘分布,没考虑条件分布,导致特征欠适配,模型迁移诊断精度不高。(2)现有方法有通过利用中间分布在桥接源域和目标域,但是中间分布的生成方式仅通过随机高斯分布模型生成,难以控制,缺乏理论指导。
4、综上所述,现有的多源域迁移诊断方法难以在保证数据隐私的条件下,充分适配多源域与目标域数据的特征分布,降低了智能诊断方法在机械设备集群中的故障诊断泛化性能。
技术实现思路
1、为了克服上述现有技术的缺陷,本发明的目的在于提供一种机械设备集群的滚动轴承数据重心桥接智能诊断方法,通过服务器与多域端的协同训练,使得训练出的通用模型能在目标域机械设备的滚动轴承数据上完成诊断任务,保护了每个节点的数据隐私,减少了传输成本,提高了诊断模型在机械设备集群上的泛化诊断性能。
2、为达到上述目的,本发明采取的技术方案为:
3、一种机械设备集群的滚动轴承数据重心桥接智能诊断方法,包括以下步骤:
4、步骤1:构建特征提取器,对提取的高级特征进行分布建模;特征提取器由堆叠的残差块构成,记为其中s表示源域机械设备滚动轴承数据集合,i表示第i个源域,θ表示该特征提取器的参数,f表示用于特征提取的网络结构;将提取到的高级特征vs:i=g(xs:i)输入到一个全连接层进行分类,其中xs:i表示第i个源域机械设备滚动轴承数据中样本的特征向量;然后通过最小化交叉熵损失来训练源域机械设备滚动轴承数据侧的深度残差网络,即:
5、
6、其中l表示分类交叉熵损失,c是与分类任务相关的成本函数,n为样本数量,y表示样本的真实标签,j表示健康状态的索引,k表示样本数,为指示函数,即当第i个源域机械设备滚动轴承数据中第k个样本的真实标签等于j时,其值为1,否则为0;表示第i个源域机械设备滚动轴承数据中分类器预测的第k个样本属于第j个健康状态的概率,即分类器的输出;分类完成后使用高斯混合模型来拟合每个源域机械设备滚动轴承数据中高级特征的分布信息,即:
7、
8、其中gs:i表示源域机械设备滚动轴承数据的高斯混合模型,θ表示高斯混合模型的参数集合,α表示高斯混合模型的权重,表示第i个源域机械设备滚动轴承数据中第t个高斯混合模型的概率密度函数,其中是均值向量,是协方差矩阵;最后利用网络服务器收集并聚合各源域机械设备滚动轴承数据的模型参数及特征分布参数,得到多源高斯混合模型参数;
9、步骤2:通过步骤1得到的多源高斯混合模型参数求解动态分布重心;定义一个分布重心φ*的集合,该集合包含了从各个源域机械设备滚动轴承数据的高斯混合模型到最终候选重心分布的所有可能的传输计划,即:
10、
11、其中inf表示寻找使加权wasserstein距离最小的传输计划,表示在时间或迭代步t时的候选重心高斯分布,表示从各个源域机械设备滚动轴承数据的高斯分布到候选重心分布的所有可能传输计划的集合,λi表示各个源域机械设备滚动轴承数据的高斯分布权重且是非负的,并且其总和等于1,表示各源域机械设备滚动轴承数据的高斯分布与候选重心分布之间的wasserstein距离的平方;计算重心的参数,即:
12、
13、其中表示各源域机械设备滚动轴承数据的重心的均值和协方差矩阵,t表示迭代步数,n表示源域机械设备滚动轴承数据的总数,n、n+1分别表示迭代步骤,使用当前迭代的重心和协方差矩阵来计算下一个迭代步骤中的重心均值和协方差矩阵,直到参数收敛到稳定值为止;
14、步骤3:进行有针对性的适应分布重心;首先根据重心分布参数随机生成中间样本的数据集其中每个样本由特征向量和标签组成;在目标适应过程中,求解相应的ot散度来评估分布差异,即:在各源域机械设备滚动轴承数据中,首先构建关系矩阵a,矩阵元素为0或1,分别表示标签不一致或一致;然后根据关系矩阵a,设计成本函数c1,即:
15、
16、其中aj,k表示源域机械设备滚动轴承数据样本和中间样本的标签关系,bc表示中间样本,ε表示极小的正数,j,k表示位置的索引;利用成本函数c1,计算源域机械设备滚动轴承数据到中间样本集的最优传输散度,即:
17、
18、其中lda表示传输过程中的ot散度值,p表示源域机械设备滚动轴承数据分布,gbc表示中间分布,γ表示从源域机械设备滚动轴承数据到中间分布重心的传输策略,通过此目标函数优化,即:
19、
20、其中π(ps:i,gbc)表示源域机械设备滚动轴承数据分布和中间分布的联合分布空间,且需满足以下约束条件:其中uk和vj分别是联合分布的边缘分布,初始化值分别为和通过sinkhorn-knopp固定点迭代算法求解γs:i→bc;最后,利用经过适配的样本和相应的标签,训练各源域机械设备滚动轴承数据的本地诊断模型,即:
21、
22、其中γ为平衡分类损失函数和目标分布自适应的权衡参数;然后使用adam优化器更新各源域机械设备滚动轴承数据的模型参数,并将更新后的模型参数上传至网络服务器;
23、步骤4:在目标域机械设备滚动轴承数据侧进行目标适应;根据fedavg的聚合算法,将步骤3中的各源域机械设备滚动轴承数据的模型参数进行聚合,得到平均参数1/n∑iθs:i,初始化目标域机械设备滚动轴承数据的诊断模型参数θt;将少量目标域机械设备滚动轴承数据的标记样本定义为锚点样本,定义锚点样本与中间样本之间的标签关系bj,i为:
24、
25、其中表示第j个锚点样本的标签,表示第i个中间样本的标签;定义锚点样本的损失函数为:
26、
27、其中x表示锚点样本集合,t表示目标域机械设备滚动轴承数据,a表示锚点样本集合,表示第i个锚点样本的标签,为指示函数,即当第i个样本的标签等于类别j时,返回1,否则返回0;表示模型对目标域机械设备滚动轴承数据中第i个锚点样本属于类别j的预测概率,r表示总类别数,nbc表示中间样本数量;对目标域机械设备滚动轴承数据样本进行高斯混合模型拟合,该高斯混合模型数等于锚点样本的健康状态数;定义未标记样本和锚点样本之间的标签关系ek,j为:
28、
29、其中是第k个未标记样本的伪标签,是第j个锚点样本的伪标签,u是无标签样本的集合;根据标签关系定义成本函数c2为:
30、
31、其中ek,j表示未标记样本和锚点样本之间的标签关系,bj,i表示锚点样本与中间样本之间的标签关系;基于成本函数,计算从目标域机械设备滚动轴承数据到中间域的ot散度:
32、
33、其中表示目标域机械设备滚动轴承数据的领域适配损失,pt表示目标域机械设备滚动轴承数据样本的分布,gbc表示中间域样本的分布,表示从目标域机械设备滚动轴承数据到中间域的传输策略,其计算方法同步骤3一致;计算目标域机械设备滚动轴承数据的梯度,即:
34、
35、其中β为平衡参数;利用adam优化器,基于梯度更新目标域机械设备滚动轴承数据的诊断模型参数θt;
36、步骤5:重复执行步骤1-步骤4以迭代更新目标域机械设备滚动轴承数据诊断模型的参数,直至模型参数收敛;
37、步骤6:保存目标域机械设备滚动轴承数据的诊断模型g(·|θt),并输出诊断结果。
38、和现有技术相比,本发明的有益效果为:
39、本发明提出了一种机械设备集群的滚动轴承数据重心桥接智能诊断方法,通过计算来自多个源域机械设备滚动轴承数据的动态重心,不断调整中间分布,同时缩小了源域机械设备滚动轴承数据和目标域机械设备滚动轴承数据的差异;生成可控的动态重心能与源域数据进行有针对性的分布调整;允许在数据去中心化的环境下训练模型,保护了每个节点的数据隐私,减少了传输成本;不仅对齐了多域数据的边缘分布,还通过目标域机械设备滚动轴承数据和中间域的适应性对齐处理了条件分布差异,从而提高了诊断模型在机械设备集群上的泛化诊断性能。