基于多源最优传输的滚动轴承跨机器域适应故障诊断方法

文档序号:34378925发布日期:2023-06-08 00:42阅读:48来源:国知局
基于多源最优传输的滚动轴承跨机器域适应故障诊断方法

本发明涉及一种基于多源最优传输的滚动轴承跨机器域适应故障诊断方法。


背景技术:

1、轴承作为旋转机械设备的支撑机械旋转体,受到多种外部环境因素影响,如工作条件、负载和噪声的变化。这些因素常常导致同一机器上的数据分布存在域漂移。这种域漂移将导致应用于源域的数据的分类器不能在目标域取得一样好的结果。

2、在实际中,单工况条件下能够获取的故障数据较为稀少;并且,我们常常无法获取目标机器的大量可用标签数据,尤其是故障信息,这使得通过机器的带标签数据诊断该机器未来的状态信息变得困难。此外,许多未投入使用的新机器并没有已存在的状态信息,为了工业安全,仍要对它们进行状态检测。然而,不同机器间具有不同的采样频率、不同的机械结构与共振特性等,数据分布具有很大的差异,同一机器数据的域间差异远不如不同机器数据的域间差异;由于不同机器间更大的域漂移,许多在同一机器情况下应用较好的标签分类器会错误分类更多的样本。


技术实现思路

1、为了解决上述技术问题,本发明提供一种诊断准确率高、应用范围广的基于多源最优传输的滚动轴承跨机器域适应故障诊断方法。

2、本发明解决上述问题的技术方案是:一种基于多源最优传输的滚动轴承跨机器域适应故障诊断方法,包括以下步骤:

3、1)获取各个机器的轴承各工况的数据,建立多源域-目标域数据库;

4、2)建立特征提取深度变分自编码网络模型,提取多源域-目标域数据库中各机器的数据特征;

5、3)建立基于最优传输的深度域适应模型,将源域机器的数据与目标机器的数据共同迁移到公共子空间,并进行深度训练,减小跨机器间的域漂移;

6、4)建立标签分类模型,获得轴承故障诊断结果。

7、上述基于多源最优传输的滚动轴承跨机器域适应故障诊断方法,所述步骤1)中,获取各个机器的轴承的正常、内圈故障、球体故障、外圈故障四种状态类别的数据;将某一个轴承拥有不同工况、负载的加速度数据和对应的标签,记为源领域,简称sd;以另一个轴承的无标签的单工况的数据为目标领域,简称td;并对所有数据进行归一化处理,再通过傅里叶变换将时域信息转换为频域信息;使用t-sne可视化特征,两个域都存在4个类别,分别以四种记号表示。

8、上述基于多源最优传输的滚动轴承跨机器域适应故障诊断方法,所述步骤2)中,特征提取深度变分自编码网络模型基于vae构建,vae是自编码网络的一种,组合了神经网络和贝叶斯公式,具有基本编码和解码结构,变分自编码网络包含依次连接的输入层、隐含层、随机采样层和输出层,输入层负责获取输入数据的特征表示;隐含层负责降低输入数据的特征的维度,生成隐变量;随机采样层赋予隐变量特定的概率分布,使之具有可解释性,并根据概率分布采样出新的特征;输出层则将经过采样处理的特征重构成输入数据;隐含层将输入数据的分布拟合成高斯分布,然后在此高斯分布上进行采样以重构出原输入数据;所以,vae假定了隐变量的概率分布,使之具有可解释性;

9、记样本集{x1,x2,...,xm},其整体用x表征;对于某一个真实样本xk,k=1,2,…m,假设存在一个专属于xk的后验分布p(z|xk),用p(z|xk)描述一个由xk生成隐变量z的模型,并且假设p(z|xk)=n(0,1);

10、p(z)=p(zxk)p(xk)  (1)

11、p(z)表示隐变量z的概率分布;p(xk)表示样本xk的概率分布;根据贝叶斯公式(1),通过p(z|xk)专属于xk的假设,认为从分布p(z|xk)采样出来的z可还原到xk中,且对于样本集{x1,x2,...,xm},有m个独立、多元的高斯分布;为找到专属于xk的高斯分布p(z|xk)的均值与方差,构建两个神经网络来计算,如式(2)所示:

12、

13、得到专属于xk的均值μk和方差即可描述相应的的高斯分布p(z|xk);这样,即可从该分布中采样出一个zk,并通过一个生成器和重构损失函数将之还原成xk;为使所有的p(z|xk)向n(0,i)看齐,用kl散度来衡量高斯分布与标准正态分布的距离,即kl(n(μ,σ2)||n(0,i)),如式(3)所示:

14、

15、其中,d是采样的隐变量z的维度,μi与分别代表高斯分布的均值和方差向量的第i个分量;

16、因为采样这个操作无法计算梯度,而采样的结果是有梯度的,因此引入重参数技巧——从n(μ,σ2)中采样一个z,这个技巧相当于从标准正态分布上随机取的一个点,此点记为ε,并令z=μ+ε*σ;这样一来,采样这个操作就不用参与梯度下降,改为采样的结果参与,使得整个模型可训练;

17、为了降低计算,对原始数据进行降维处理;在vae基本结构中,加入2层隐含层z1和z2,z1、z2与输入输出层的数学关系如下:

18、

19、中ω和b分别为权重矩阵和偏置向量,为权重变量ω和偏置变量b的组合称谓;fw为激活函数,下标1和2分别对应隐含层z1和z2;类似于自编码网络,重构损失函数如下:

20、

21、结合式(3),基于vae构建的特征提取器的损失函数为

22、上述基于多源最优传输的滚动轴承跨机器域适应故障诊断方法,所述步骤3)中,源域机器的数据包含多工况数据特征及其标签,进行特征与标签的联合迁移;目标机器的数据包括单工况数据特征;

23、最优传输距离也称wasserstein距离、earth-mover距离,最优传输距离定义不重合概率分布间的距离;已知损失函数是c,考虑如何将一堆形状为μs的沙子运输到形状为μt的坑里面花费最小;kantorovich problem定义了最优传输问题的一个松弛解。存在一个运输规划γ∈γ(μs,μt),γ(μs,μt)为所有具有边际分布μs和μt的概率耦合的集合,μs和μt之间的p阶wasserstein距离wp(μs,μt)定义如式(6):

24、

25、inf表示下确界,对于函数y=f(x),在使f(x)大于等于m成立的所有常数m中,把m的最大值max(m),(即函数y=f(x)的最小值叫做函数y=f(x)的下确界;γ表示一个解;γ表示边际分布μs和μt的概率耦合;

26、对于跨机器的域适应问题,需要将最优传输距离离散化;记源域和目标域样本的边际分布分别为μs和μt,则最优传输γ*如下给出:

27、

28、

29、

30、

31、源域中第i个样本的概率分布;目标域中第i个样本的概率分布;n,m,d指的是个数,分别为每个样本集中的样本的总个数,集合之间的样本数并不相同;m*n维度的正实数测度空间,1n、1m分别为n维、m维的元素全为1的向量;和分别为源域中第i个样本和目标域中第i个样本对应的狄拉克函数,<.,.>f为frobenius距离,为代价矩阵;正写的t表示转置,斜写的t表示目标域;

32、以ot距离来减小跨机器的域漂移问题时,同时考虑特征和标签差异;对于特征空间,用欧式距离来度量;对于标签空间,用交叉熵损失度量,故,损失函数如式(11):

33、

34、其中,为源域中的第i个样本的标签,为目标域中的第j个样本;deuc(.,.)指代欧式距离,l(.,.)指代交叉熵函数,z=f(x)指代降维的特征;故,优化函数式(10)可改写为:

35、

36、其中,代表目标域中的伪标签。

37、上述基于多源最优传输的滚动轴承跨机器域适应故障诊断方法,所述步骤4)中,所述标签分类模型为softmax分类器,该分类器的输入为公共子空间的数据特征,输出为轴承各个故障的概率;

38、softmax函数用于计算某个样本属于某个类别y∈{1,2,...,k}的概率,如式(13)所示:

39、

40、k为标签的类别数量;为的转置;正写的t表示转置,斜写的t表示目标域;

41、对多分类问题,使用softmax函数作标签分类器,并将预测标签f的概率分布与真实标签的概率分布的交叉熵作为损失函数,如式(14):

42、

43、为分类损失函数;p(ypre)为预测标签的概率分布;p(yauc)为真实标签的概率分布。

44、上述基于多源最优传输的滚动轴承跨机器域适应故障诊断方法,所述步骤3)中,深度训练求解特征提取器、标签预测器g和ot规划γ的参数,通过最小化式(15)目标函数来实现:

45、

46、式(15)可固定γi,j的值来求解f和g,即式(16):

47、

48、γi,j对应于的运输规划,为整体运输规划矩阵γ的一个元素;

49、固定f和g的值来求解γi,j,即式(17):

50、

51、本发明的有益效果在于:

52、1)本发明利用与目标机器同类的机器的故障信息,建立能够良好应用到目标机器的故障诊断模型,实现端到端的故障诊断。这解决了工程实际中目标机器无法获取大量可用标签数据、尤其是故障信息的问题。

53、2)本发明通过变分自编码网络能够自动地提取出解释性良好的特征,减小分类算法的运算复杂度、提高分类算法的精度,既能弥补单工况故障数据稀少的缺陷,又能解决同一机器多工况数据融合的域漂移问题。

54、3)本发明通过最优传输距离处理变分自编码网络提取的特征,能够对源域的特征及其标签与目标域的特征联合迁移学习,提高源领域与目标领域之间特征的相似性,从而实现跨机器级别的系统的故障诊断。

55、4)本发明具有准确率高、应用范围广的优点,不仅能够运用于风电系统滚动轴承的故障诊断,更能广泛地应用到汽车、航空、高速铁路等一系列复杂系统。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1