本发明涉及轨道交通基础设施安全检测,具体涉及一种基于振动加速度、信号处理和迁移学习的高速列车牵引电机轴承状态检测跨设备迁移诊断方法及系统。
背景技术:
1、随着工业物联网发展,高速列车牵引电机机械旋转系统的制造性、集成度和精度不断提高,但复杂性、非线性和不确定性也显著增强,这使得其电机轴承的故障诊断成为巨大挑战。在长期运行过程中,旋转机械会受到物料降解、载荷、温度和湿度的影响,导致关键部件容易发生故障,从而降低工厂效益,导致人员伤亡或生态污染。因此,对旋转机械的状态进行监测具有重要意义。然而,由于设备制造和运营场景的影响,训练数据(源域)和测试数据(目标域)的概率分布不可避免地会发生偏差,这使得许多现有算法在真实场景中无效,例如牵引电机系统。基于此工业场景,这便对算法中模型的外推能力提出了严峻的挑战,特别是对于跨机器故障诊断任务。
2、针对跨设备迁移诊断展开了一系列研究,如,在微调方面,luo等开发了一种改进的堆叠式自编码器;zhang等从小学习中获得启发,微调高性能特征编码器;特别针对长尾分布数据集,li等优先考虑源域不平衡样本来监测风扇故障;liu等针对目标域不平衡,提出了基于元数据的残差迁移网络;han等人结合域对抗的思想,提出一种多域鉴别器网络;在基于映射的方法中,多位学者设计或应用各种统计度量,如集成加权最大平均差异、多核局部最大平均差异、嵌入联合最大平均差异、最大均方差异等。除了减少源域和目标域的分布偏差外,某些统计度量还考虑了类内和类间的可判别特征。此外,也有学者整合了混合学习策略,包括小学习、元学习、度量学习、对比学习、因果学习、不平衡学习、多源域适应等。除此之外,jang等引入域插值自适应网络。wan等开发多级域自适应网络。综上所示,跨机迁移诊断吸收最先进训练策略,为复杂和更具体的跨机诊断任务提供更强大的诊断性能。
3、然而,大多数纯数据驱动的算法可能会削弱模型鲁棒性,并加剧对数据质量和数量的依赖。同时,许多算法采用的统计度量增加了计算复杂性,并引入了额外超参数,而且这些参数通常决定算法性能,然而搜索适当的超参数通常耗时费力。因此,将信号处理和域适应网络(domain adaptation network,dan)相结合的方法引入到跨机迁移诊断中。kim等认为数据预处理可以减少不同数据集之间的分布偏差,有助于节省训练时间,提高准确率。因此,他们利用信号处理技术将不同的数据集转换成一个公共的模式空间。然而,上述算法采用的是两阶段策略,优化信号处理的超参数仍然是一项艰巨的挑战。
4、小波变换作为一种主要的、可靠的信号处理方法,与域自适应网络相结合,具有广阔的应用前景。有的文献利用小波散射模块构建时间散射卷积网络进行跨域诊断,而不是跨机器诊断。yue等提出多尺度小波原型网络(multiscale wavelet prototypicalnetwork,mwpn),该网络将小波核卷积与小学习策略相结合来解决跨分量诊断问题。shang等设计了一种降噪故障感知小波网络(denoising fault-aware wavelet network,dfawnet),并研究了其在跨速度诊断中的优势。综上所述,laplace小波和morlet小波在基于小波的可解释诊断中表现出很强的性能。
5、虽然一些研究也利用了可解释小波技术。比如组合多个小波核;引入改进的小波核。然而,上述工作仅仅集中在故障检测任务上。普通的小波内核不能处理复杂的跨机器传输场景。现有研究缺失对于小波加权是否可以减小域内差异的探索。
技术实现思路
1、本发明的目的在于提供一种高速列车牵引电机轴承状态检测跨设备迁移诊断方法及系统,以解决上述背景技术中存在的至少一项技术问题。
2、为了实现上述目的,本发明采取了如下技术方案:
3、第一方面,本发明提供一种列车牵引电机轴承状态检测跨设备迁移诊断方法,包括:
4、获取牵引电机系统轴承振动信号;
5、利用预先训练好的诊断模型对获取的牵引电机系统轴承振动信号进行处理,得到轴承故障损伤检测结果;其中,训练所述诊断模型包括:采集来自牵引电机系统轴承振动信号样本;将神经网络的第一层的权重初始化为小波权重,即采用小波权重初始化,初始化第一层的权重;将源域和目标域分别输入网络中,计算源域的分类损失以及源域和目标域的度量差异损失;通过反向传播算法训练网络,当达到最大的迭代次数时,训练停止,保存模型的相关参数。
6、可选的,在训练网络中,对于源域和目标域,第一层权值具有特异性,没有权值共享;双流瓶颈层借助无权值共享的平滑增强的小波权重,将源域和目标域的数据转换到公共的特征表示空间;中间瓶颈和分类器共享权重,利用具有批处理归一化和relu激活函数的wdcnn,提取的特征被馈送到度量函数中以实现隐式域对齐;最后,应用softmax输出故障类别。
7、可选的,将神经网络的第一层权重初始化为改进的小波权重,包括:建立了时间与滤波器长度之间的相关性,使卷积核大小具有时间物理可解释意义;对齐缩放因子和平移因子,进一步与输出通道相关联,加强与卷积核的相关性;引入平滑因子形成平滑增强的小波核,同时,用sigmoid函数对小波基函数的以e为基底的指数分量进行修正。
8、可选的,进行跨机迁移小波权重的初始化,减轻不同机械故障数据中出现的域间概率分布偏差;
9、对于第一个卷积层,响应y1为:y1=w1x+b1
10、其中w1是权重,b1是偏差;
11、将原有的权重替换为改进的小波权重:
12、正向传播机制为:
13、
14、
15、式中l表示为第l层。
16、可选的,反向传播机制表示为:
17、
18、
19、其中α表示学习,θ1表示第一层需要更新的参数,ltotal表示总损失;
20、利用交叉熵损失lcls指导参数更新:
21、
22、其中p(k)为预测分布,q(k)为实际分布。
23、可选的,最终损失函数表示为:
24、ltotal=lcls+λlmetric
25、其中,lmetric为域差异度量损失,λ为调节反向传播过程中相应度量损失项占比的权衡系数:
26、
27、第二方面,本发明提供一种列车牵引电机轴承状态检测跨设备迁移诊断系统,包括:
28、获取模块,用于获取牵引电机系统轴承振动信号;
29、诊断模块,用于利用预先训练好的诊断模型对获取的牵引电机系统轴承振动信号进行处理,得到轴承故障损伤检测结果;其中,训练所述诊断模型包括:采集来自牵引电机系统轴承振动信号样本;将神经网络的第一层的权重初始化为小波权重,即采用小波权重初始化,初始化第一层的权重;将源域和目标域分别输入网络中,计算源域的分类损失以及源域和目标域的度量差异损失;通过反向传播算法训练网络,当达到最大的迭代次数时,训练停止,保存模型的相关参数。
30、第三方面,本发明提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如第一方面所述的列车牵引电机轴承状态检测跨设备迁移诊断方法。
31、第四方面,本发明提供一种计算机设备,包括存储器和处理器,所述处理器和所述存储器相互通信,所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令执行如第一方面所述的列车牵引电机轴承状态检测跨设备迁移诊断方法。
32、第五方面,本发明提供一种电子设备,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如第一方面所述的列车牵引电机轴承状态检测跨设备迁移诊断方法的指令。
33、术语解释:
34、源域:指模型进行预训练的数据集或领域。
35、目标域:指模型将要应用到的新数据集或领域。
36、跨机诊断:将设备a累积的带注释数据迁移到设备b的未注释数据,以评估设备b的运行健康状态。
37、可迁移性:将源域中学到的模型迁移到目标域的能力。
38、可区分性:提取的特征能够被分类器分类的能力。
39、梯度消失:在神经网络中,当前面隐藏层的学习速率低于后面隐藏层的学习速率,即随着隐藏层数目的增加,分类准确率反而下降了。这种现象叫做消失的梯度问题。
40、权重初始化:在深度学习模型训练过程的本质是对weight进行更新,但是在最开始训练的时候是无法更新的,这需要每个参数有相应的初始值。在进行权重初始化后,神经网络就可以对权重参数w不停地迭代更新,以达到较好的性能。
41、反向传播算法:是一种与最优化方法(如梯度下降法)结合使用的,用来训练人工神经网络的常见方法。
42、两阶段策略:先信号处理,再神经网络训练的策略。
43、可解释机器学习:在机器学习任务中,仅仅确定一个能够优化预测性能的机器学习模型是远远不够的。具有可解释性及可信性是一个性能较好的模型的标志。
44、输入通道:输入了几个二维信息。
45、本发明有益效果:基于物理信息的小波域自适应网络,将可解释的小波知识集成到具有独立权重的双流卷积层中,以应对跨机器诊断任务,用优化后的含有丰富信息的laplace或morlet小波权重来更新cnn的第一层权值,具有特定物理解释的尺度因子和平移因子受卷积核参数约束,同时考虑平滑辅助尺度因子以保证与神经网络权值的一致性;提高了域可迁移性,提高了跨机诊断有效性和准确性。
46、本发明附加方面的优点,将在下述的描述部分中更加明显的给出,或通过本发明的实践了解到。