一种模态分解预测卷积注意力网络的轴承故障诊断方法

文档序号:32657022发布日期:2022-12-23 22:04阅读:50来源:国知局
一种模态分解预测卷积注意力网络的轴承故障诊断方法
(t)与剩余分量x4(t),将其分别输入门控循环单元、循环神经网络、长短期记忆网络、双向长短期记忆网络与时间卷积网络;
18.步骤(14):将门控循环单元中每一时刻的输入信号与上一时刻的输出信号加权相加后输入重置门与更新门,用激活函数激活;
19.当当前时刻的信号c1(t)输入时,其被输入到重置门和更新门中,重置门和更新门的输出分别为:
20.r
t
=σ(c1(t)
·wxr
+y1(t-1)
·whr
+br),
21.z
t
=σ(c1(t)
·wxz
+y1(t-1)
·whz
+bz),
22.其中,r
t
是重置门的输出,z
t
是更新门的输出,y1(t-1)是上一时刻的输出,w
xr
是输入与重置门之间的连接权重,w
xz
是输入与更新门之间的连接权重,w
hr
是隐状态与重置门之间的连接权重,w
hz
是隐状态与更新门之间的连接权重,br为重置门的偏置向量,bz为更新门的偏置向量,σ(
·
)是将输入归一化到0至1的激活函数;
23.步骤(15):重置门的当前时刻输出与上一时刻输出相乘后与当前时刻输入加权相加,输入候选隐状态层,用激活函数激活;
24.计算当前时刻的候选隐状态为:
25.y

(t)=tanh(c1(t)
·wxh
+(r
t
·
y1(t-1))
·whh
+bh),
26.其中,y

(t)是当前时刻的候选隐状态,w
xh
是输入与候选隐状态之间的连接权重,w
hh
是重置门与上一时刻输出相乘之后与候选隐状态之间的连接权重,bh是候选隐状态的偏置向量,tanh(
·
)是将输入归一化到-1至1的激活函数;
27.步骤(16):当前时刻的候选隐状态与1和更新门当前时刻输出的差值相乘,加上上一时刻输出与更新门当前时刻输出相乘,得到当前时刻输出;
28.上一时刻输出结合候选隐状态与更新门能得到当前时刻的输出y1(t):
29.y1(t)=z
t
·
y1(t-1)+(1-z
t
)
·y′
(t);
30.步骤(17):不断重复从得到上一时刻输出到得到当前时刻输出的过程,得到最终门控循环单元的输出;
31.步骤(18):将循环神经网络中每一时刻的输入信号与上一时刻隐含层的输出信号加权相加后输入当前隐含层,用激活函数激活;
32.当当前时刻的信号c2(t)输入时,会与上一时刻的隐含层输出h
t-1
一同输入当前隐含层,当前时刻隐含层的输出h
t
为:
33.h
t
=fh(w
x
·
c2(t)+wh·ht-1
+bh),
34.其中,w
x
为输入与当前隐含层的连接权重,wh为上一隐含层与当前隐含层的连接权重,bh为隐含层偏置向量,fh(
·
)为隐含层激活函数;
35.步骤(19):将隐含层的输出加权后输入输出层,用激活函数激活,得到最终循环神经网络的输出;
36.隐含层的输出经过输出层后会得到当前时刻的输出y2(t):
37.y2(t)=fo(wo·ht
+bo),
38.其中,wo为隐含层与输出层的连接权重,bo为输出层的偏置向量,fo(
·
)为输出层的激活函数;
39.步骤(20):将长短期记忆网络中每一时刻的输入信号与上一时刻的输出信号加权
相加后输入遗忘门、输入门和候选记忆层,用激活函数激活;
40.当当前时刻的信号c3(t)输入时,与上一时刻输出y3(t-1)同时输入遗忘门和输入门,同时更新候选记忆s

(t),遗忘门和输入门的输出分别为:
41.f
t
=σ(wf·
[y3(t-1),c3(t)]+bf),
[0042]it
=σ(wi·
[y3(t-1),c3(t)]+bi);
[0043]
更新候选记忆s

(t)为:
[0044]s′
(t)=tanh(wc·
[y3(t-1),c3(t)]+bs),
[0045]
其中,f
t
是遗忘门的输出,i
t
是输入门的输出,wf是遗忘门的权重,wi是输入门的权重,wc是候选记忆层的权重,bf是遗忘门的偏置向量,bi是输入门的偏置向量,bs是候选记忆层的偏置向量;
[0046]
步骤(21):将当前时刻遗忘门的输出与上一时刻记忆元相乘,加上当前时刻输入门的输出与当前时刻候选记忆元相乘,得到当前时刻记忆元;
[0047]
更新上一个记忆元s
t-1
为当前记忆元s
t

[0048]st
=f
t
·st-1
+i
t
·s′
(t);
[0049]
步骤(22):将当前时刻的输入与上一时刻输出加权相加后输入输出门,用激活函数激活,得到当前时刻的输出;
[0050]
当前时刻的输入c3(t)与上一时刻输出y3(t-1)同时输入输出门,得到当前时刻的输出y3(t);
[0051]
输出门的输出o
t
为:
[0052]ot
=σ(wo·
[y3(t-1),c3(t)]+bo);
[0053]
当前时刻的输出y3(t)为:
[0054]
y3(t)=o
t
·
tanh(s
t
),
[0055]
其中,o
t
是输出门的输出,wo是输出门的权重,bo是输出门的偏置向量;
[0056]
步骤(23):不断重复从得到上一时刻输出到得到当前时刻输出的过程,得到最终长短期记忆网络的输出;
[0057]
步骤(24):将双向长短期记忆网络中的输入信号输入两个方向相反的长短期记忆网络,将两个长短期记忆网络的输出拼接,得到双向长短期记忆网络的最终输出;
[0058]
步骤(25):将时间卷积网络的输入信号输入两个分支;第一个分支是一个1x1卷积层,第二个分支是将因果膨胀卷积层、归一化层、relu激活函数和正则化层级联,并重复两次;
[0059]
步骤(26):将两个分支得到的结果进行相加,然后再重复从信号分成两个步骤处理再到相加的过程,得到时间卷积网络的最终输出结果;
[0060]
步骤(27):将门控循环单元、循环神经网络、长短期记忆网络、双向长短期记忆网络与时间卷积网最终的输出结果转换为二维灰度图像,即预测后的二维灰度图像;
[0061]
步骤(28):将每一个网络预测后的二维灰度图像分别输入一个x-volution网络,输入会进入两个分支,第一个是卷积分支,由级联的卷积层和批处理归一化层级联组成,第二个是像素位移自注意分支;
[0062]
步骤(29):将像素位移自注意分支的输入特征图分别向上、下、左、右、上左、上右、下左、下右8个方向移动l个像素点,将移动后的图像进行键转换,将原始预测后的二维灰度
图像进行查询转换,计算键转换后数据与查询转换后数据之间的元素乘积,得到转换后的特征,将转换后的特征加权相加,再级联一个批处理归一化层,得到像素位移自注意分支的输出;
[0063]
步骤(30):将两个分支的输出相加,最后输出预测后信号的分类;
[0064]
步骤(31):将分类后的输出结果进行加权求和后输出最终分类结果。
[0065]
本发明相对于现有技术具有如下的优点及效果:
[0066]
(1)输入的轴承故障检测信号在经过了vgg16的分类后,分类概率小于故障判断设定值的信号又再一次的被预测分类,使得本发明方法的轴承故障诊断精度更高。
[0067]
(2)当输入的轴承故障检测信号故障特征明显时,会直接被vgg16输出分类结果,使得本发明方法的轴承故障诊断速度更快。
[0068]
(3)本发明先用轻量化的vgg16结构进行分类,当分类概率不高时再用复杂的x-volution结构进行分类,这样的结构能使本发明同时具有高精度和高速度的优点。
[0069]
(4)第一次将把自注意力机制与卷积结合在一起的x-volution算子运用在轴承故障诊断中。自注意力机制与卷积的优点互补,使得本发明方法的轴承故障诊断技术既高效又准确。
附图说明
[0070]
图1是本发明方法的模态分解预测卷积注意力网络框架图。
[0071]
图2是本发明方法的vgg16分类流程图。
[0072]
图3是本发明方法的完全集合经验模态分解流程图。
[0073]
图4是本发明方法的门控循环单元预测流程图。
[0074]
图5是本发明方法的循环神经网络预测流程图。
[0075]
图6是本发明方法的长短期记忆网络预测流程图。
[0076]
图7是本发明方法的双向长短期记忆网络预测流程图。
[0077]
图8是本发明方法的时间卷积网络预测流程图。
[0078]
图9是本发明方法的x-volution分类流程图。
具体实施方式
[0079]
本发明提出的一种模态分解预测卷积注意力网络的轴承故障诊断方法,结合附图详细说明如下:
[0080]
图1是本发明方法的模态分解预测卷积注意力网络框架图。首先,将轴承故障检测信号转换为检测信号的二维灰度图像,然后用vgg16对检测信号的二维灰度图像进行分类。判断vgg16输出的分类概率是否大于事先设定的故障判断设定值,如果大于,则直接输出分类结果;如果小于,则将小于故障判断设定值的灰度图像所对应的原始轴承故障检测信号用完全集合经验模态分解的方法分解。输出4个模态分量c1(t)、c2(t)、c3(t)、c4(t)与1个剩余分量x4(t)。将模态分量c1(t)、c2(t)、c3(t)、c4(t)与剩余分量x4(t)分别用门控循环单元、循环神经网络、长短期记忆网络、双向长短期记忆网络与时间卷积网络进行预测,将预测后的结果转化为二维灰度图像,得到对应的输出:预测后的二维灰度图像1、预测后的二维灰度图像2、预测后的二维灰度图像3、预测后的二维灰度图像4、预测后的二维灰度图像5。将
这5个预测后的二维灰度图像分别用x-volution进行分类,将输出的结果进行加权求和后得到最终的分类结果。
[0081]
图2是本发明方法的vgg16分类流程图。它是由13个卷积层,5个最大池化层和3个全连接层组成。例如,输入是3个像素为224
×
224的轴承故障检测信号灰度图像。首先,将轴承故障检测信号灰度图像输入2个级联的3
×
3卷积层,提取特征的同时增加通道的数量,这时输入会变为64个224
×
224的灰度图像。然后级联1个2
×
2的最大池化层,减少数据的空间大小,这时输入会变为64个112
×
112的灰度图像。之后接着级联2个3
×
3卷积层、1个2
×
2最大池化层、3个3
×
3卷积层、1个2
×
2最大池化层、3个3
×
3卷积层、1个2
×
2最大池化层、3个3
×
3卷积层、1个2
×
2最大池化层,此时输入会变成512个7
×
7的灰度图像。最后级联3个全连接层将输入变为1000个1
×
1的向量,进行分类后输出原始信号的分类概率。
[0082]
图3是本发明方法的完全集合经验模态分解流程图。首先,向小于故障判断设定值的轴承故障检测信号x(t)加入不同的正负成对白噪声,得到新的信号。将新的信号进行经验模态分解,得到各个新信号的第一阶模态分量。然后将所有的第一阶模态分量进行求和平均,得到小于故障判断设定值的轴承故障检测信号的第一阶模态分量c1(t)。用小于故障判断设定值的轴承故障检测信号x(t)减去第一阶模态分量c1(t)得到第一阶的剩余分量x1(t),再给x1(t)加入不同的正负成对白噪声。重复从加入不同的正负成对白噪声到得到剩余分量这一过程,最终输出模态分量c1(t)、c2(t)、c3(t)、c4(t)与剩余分量x4(t)。
[0083]
图4是本发明方法的门控循环单元预测流程图。首先,当当前时刻的信号c1(t)输入时,其被输入到重置门和更新门中,重置门和更新门的输出分别为:
[0084]rt
=σ(c1(t)
·wxr
+y1(t-1)
·whr
+br),
[0085]zt
=σ(c1(t)
·wxz
+y1(t-1)
·whz
+bz),
[0086]
其中,r
t
是重置门的输出,z
t
是更新门的输出,y1(t-1)是上一时刻的输出,w
xr
是输入与重置门之间的连接权重,w
xz
是输入与更新门之间的连接权重,w
hr
是隐状态与重置门之间的连接权重,w
hz
是隐状态与更新门之间的连接权重,br为重置门的偏置向量,bz为更新门的偏置向量,σ(
·
)是将输入归一化到0至1的激活函数。
[0087]
然后,计算当前时刻的候选隐状态为:
[0088]y′
(t)=tanh(c1(t)
·wxh
+(r
t
·
y1(t-l))
·whh
+bh),
[0089]
其中,y

(t)是当前时刻的候选隐状态,w
xh
是输入与候选隐状态之间的连接权重,w
hh
是重置门与上一时刻输出相乘之后与候选隐状态之间的连接权重,bh是候选隐状态的偏置向量,tanh(
·
)是将输入归一化到-1至1的激活函数。
[0090]
上一时刻输出结合候选隐状态与更新门能得到当前时刻的输出y1(t):
[0091]
y1(t)=z
t
·
y1(t-1)+(1-z
t
)
·y′
(t);
[0092]
不断重复从y1(t-1)到y1(t)的过程,得到最终输出。
[0093]
图5是本发明方法的循环神经网络预测流程图。首先,当当前时刻的信号c2(t)输入时,会与上一时刻的隐含层输出h
t-1
一同输入当前隐含层,当前时刻隐含层的输出h
t
为:
[0094]ht
=fh(w
x
·
c2(t)+wh·ht-1
+bh),
[0095]
其中,w
x
为输入与当前隐含层的连接权重,wh为上一隐含层与当前隐含层的连接权重,bh为隐含层偏置向量,fh(
·
)为隐含层激活函数。
[0096]
隐含层的输出经过输出层后会得到当前时刻的输出y2(t):
[0097]
y2(t)=fo(wo·ht
+bo),
[0098]
其中,wo为隐含层与输出层的连接权重,bo为输出层的偏置向量,fo(
·
)为输出层的激活函数。
[0099]
将每个时刻的输入都重复从输入隐含层到输出结果的操作,得到最终输出。
[0100]
图6是本发明方法的长短期记忆网络预测流程图。首先,当当前时刻的信号c3(t)输入时,与上一时刻输出y3(t-1)同时输入遗忘门和输入门,同时更新候选记忆s

(t),遗忘门和输入门的输出分别为:
[0101]ft
=σ(wf·
[y3(t-1),c3(t)]+bf),
[0102]it
=σ(wi·
[y3(t-1),c3(t)]+bi);
[0103]
更新候选记忆s

(t)为:
[0104]s′
(t)=tanh(wc·
[y3(t-1),c3(t)]+bs),
[0105]
其中,f
t
是遗忘门的输出,i
t
是输入门的输出,wf是遗忘门的权重,wi是输入门的权重,wc是候选记忆层的权重,bf是遗忘门的偏置向量,bi是输入门的偏置向量,bs是候选记忆层的偏置向量。
[0106]
然后,更新上一个记忆元s
t-1
为当前记忆元s
t

[0107]st
=f
t
·st-1
+i
t
·s′
(t);
[0108]
最后,当前时刻的输入c3(t)与上一时刻输出y3(t-1)同时输入输出门,得到当前时刻的输出y3(t);
[0109]
输出门的输出o
t
为:
[0110]ot
=σ(wo·
[y3(t-1),c3(t)]+bo);
[0111]
当前时刻的输出y3(t)为:
[0112]
y3(t)=o
t
·
tanh(s
t
),
[0113]
其中,o
t
是输出门的输出,wo是输出门的权重,bo是输出门的偏置向量。
[0114]
不断重复从y3(t-1)到y3(t)的过程,得到最终输出。
[0115]
图7是本发明方法的双向长短期记忆网络预测流程图。输入c4(t)会进入两个方向相反的长短期记忆网络,两个长短期记忆网络的输出拼接后得到最终输出y4(t)。
[0116]
图8是本发明方法的时间卷积网络预测流程图。首先,信号x4(t)输入后会进入两个分支。第一个分支是一个1x1卷积层,第二个分支是将因果膨胀卷积层、归一化层、relu激活函数和正则化层级联,并重复两次。两个分支得到的结果进行相加,然后再重复从信号分成两个步骤处理再到相加的过程。最终输出结果y5(t)。
[0117]
图9是本发明方法的x-volution分类流程图。预测后的二维灰度图像作为输入会进入两个分支。第一个是卷积分支,由级联的卷积层和批处理归一化层级联组成。第二个是像素位移自注意分支,首先将输入特征图分别向上、下、左、右、上左、上右、下左、下右8个方向移动l个像素点,将移动后的图像进行键转换,将原始预测后的二维灰度图像进行查询转换,计算键转换后数据与查询转换后数据之间的元素乘积,得到转换后的特征。将转换后的特征加权相加,再级联一个批处理归一化层,得到像素位移自注意分支的输出。将两个分支的输出相加,最后输出预测后信号的分类。
[0118]
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关
的技术领域,均同理包括在本发明的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1