一种基于卷积胶囊网络的行星齿轮箱故障诊断方法

文档序号:27242846发布日期:2021-11-03 19:26阅读:131来源:国知局
一种基于卷积胶囊网络的行星齿轮箱故障诊断方法

本发明属于故障诊断领域,涉及行星齿轮箱的故障诊断技术领域,尤其涉及一种基于卷积胶囊网络的行星齿轮箱故障诊断方法。


背景技术:

行星齿轮箱是大型机械设备的核心传动环节,由于其服役环境的严酷性,如存在工况频繁变化、重载、极端天气等诸多因素,致使行星齿轮系统内部关键部件极易发生故障,进而“牵一发而动全身”,引发灾难性事故。因此,开展行星齿轮箱的故障诊断研究,对于保障大型机械设备安全稳定运行、避免人民生命财产损失具有重要意义。自深度学习问世以来,展现出强大的特征自动学习与提取能力,已广泛运用于图像识别、自然语言处理、语音识别、故障诊断等领域。典型的深度学习方法,如卷积神经网络(convolution neural network,cnn)、生成对抗网络(generative adversarial networks,gan)、深度信念网络(deep belief network,dbn)等逐步拓展至行星齿轮箱的故障诊断方法之中:有研究人员通过cnn模型对不同健康状态的行星轮故障进行诊断;还有研究人员提出了一种采用堆叠降噪自动编码器作为判别器的gan诊断模型,对多种不同健康状态的太阳轮进行诊断,在少量样本与噪声条件下呈现出较强的诊断能力;还有研究人员基于蝗虫算法提出了一种参数优化的dbn方法,对单个齿轮的多种故障类型进行识别。当前,以深度学习算法为核心的诊断模式正得到学者们的广泛关注,然而当前研究大多围绕单类齿轮部件的不同故障开展。鉴于行星齿轮箱中齿轮故障发生部位与形式多样,仅开展单类齿轮的故障诊断难以全面保障机械设备的安全运行。特别是以cnn为核心的深度学习模型,虽然对单一部件的故障识别取得了不错的效果,但应用于包含不同部件的故障数据时,恐难保证较高的诊断能力。2017年胶囊网络(capsule network,cn)模型被首次提出,突破了传统标量神经元传递信息的片面性,以向量作为网络的输入和输出,进一步挖掘出特征的空间信息。近年来,胶囊网络表现出强大的细节特征提取能力,已在机械设备故障诊断领域中初露锋芒。然而,当前国内外少有研究人员将胶囊网络应用于行星齿轮箱的故障诊断之中。


技术实现要素:

本部分的目的是在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本技术的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。鉴于上述背景技术描述中存在的问题,提出了本发明,因此,本发明其中一个目的是提供一种基于卷积胶囊网络的行星齿轮箱故障诊断方法,结合卷积神经网络和胶囊网络提出一种能提高其故障诊断能力的网络模型,效率高。为解决上述技术问题,本发明采用的技术方案是:一种基于卷积胶囊网络的行星齿轮箱故障诊断方法,包括以下步骤,
s1、获取多种健康状态下的行星齿轮箱数据,并构建样本集;s2、利用卷积池化结构实现故障特征的自动提取与降维;s3、通过胶囊结构矢量化表示特征并传递信息,同时采用动态路由机制计算不同胶囊层向量之间的相关度;s4、通过间隔损失函数与输入数据不断优化模型参数,实现对不同齿轮部件故障的精准智能诊断。进一步的,卷积胶囊网络模型包括9层:1个输入层、2个卷积层、2个池化层、1个dropout层、1个预胶囊层、1个数字胶囊层和1个输出层,其中:输入层:将原始数据经过z

score标准化处理后作为卷积胶囊网络输入数据,标准化公式为:式中,y
i
为标准化后数据;x
i
为原始数据;为原始数据均值;σ为原始数据方差;卷积层1:采用宽卷积核提取输入特征,用以降低噪声的影响;卷积层2:采用大量窄卷积核,充分提取特征的底层特性;池化层:每个卷积层后均附有一池化层,用于降低模型训练参数,提高训练速度,;dropout层:用于舍弃部分神经元防止训练阶段过拟合;预胶囊层:包含卷积运算,同时将卷积结果以矢量形式构建胶囊作为数字胶囊层的输入;数字胶囊层:通过动态路由机制计算胶囊层之间的相关度实现对故障特征的精确归类;输出层:对输出向量进行二范数求解,得到不同故障类型的概率分布。进一步的,卷积胶囊网络模型采用间隔损失函数,其表达式为:l
k
=t
k
max(0,m
+

||v
k
||)2+λ(1

t
k
)max(0,||v
k
||

m

)2式中:下标k为故障类别k;l
k
为类别k的间隔损失;t
k
为分类指示函数(分类正确取1,否则取0);v
k
表示识别为故障类别k的概率;m为上界,取0.9;m为下界,取0.1;为比例系数,取0.5,总损失为各样例损失之和。进一步的,将原始数据经过z

score标准化处理后作为卷积胶囊网络输入数据,标准化公式为:其中,y
i
为标准化后数据;x
i
为原始数据;为原始数据均值;σ为原始数据方差。进一步的,在s2中,原始数据z

score标准化处理后输入卷积层,通过卷积运算与激活函数实现对输入数据的特征提取:首先,通过n个维度相同的卷积核对输入数据进行卷积运算,同时附加偏置项得到卷积结果;然后,利用激活函数对卷积结果进行非线性映射,输出n个特征矩阵,计算公式如下所示:式中:为卷积层输出第n个特征矩阵的第j个元素;m
j
为输入数据的第j个卷积区
域;x
i
为m
j
的第i个元素;为第n个卷积核的权值矩阵;b
n
为第n个卷积核对应的偏置项;f(
·
)表示激活函数。进一步的,在s2中,提取出的初始特征输入至池化层,通过池化运算实现对特征矩阵的降维过程:将卷积层的输出数据无重叠、等宽度的划分为q个池化单元,对每个单元内的元素进行池化运算,得到池化层的输出特征矩阵。进一步的,使用的池化运算为最大池化(max pooling),池化过程表达式为:式中:为池化层输出第n个特征矩阵中的第q个元素;为池化层输入第n个特征矩阵的第q个池化单元,其中w为池化单元宽度;元素经过池化运算后,输入dropout层进行处理,舍弃部分神经元防止训练阶段过拟合;其中dropout比率=0.25。进一步的,数据通过dropout层后进入预胶囊层,将卷积结果以矢量形式构建胶囊作为数字胶囊层的输入,计算公式如下所示:其中,g1(t)是t时刻胶囊网络卷积层的输出;e
i
(t)为t时刻初级胶囊层的输出,是一系列的8维向量;为t时刻胶囊网络卷积层的权重矩阵和偏置向量;为t时刻初级胶囊层的权重矩阵和偏置向量;relu()为rectified linear unit。进一步的,通过压缩与动态路由算法对初级胶囊层的输出进行处理,得到数字胶囊层的输出,处理的具体公式为:其中,v
j
(t)是t时刻数字胶囊层第j个胶囊的输出,j∈[0,7]它是每一种行星齿轮箱健康状态所对应的索引值;l
j
(t)是t时刻从初级胶囊层到数字胶囊层的总输入向量;为t时刻预测向量,通过将初级胶囊层的输出乘以一个权重矩阵w
ij
(t)得到,i为初级胶囊层输出8维向量的个数;a
ij
(t)为t时刻的耦合系数;b
ij
(t)为t时刻动态路由算法的迭代更新参数,初始值为0;r为动态路由算法的迭代次数;计算向量v
j
(t)的长度,并比较当前t时刻所有向量长度的最大值,再将最长向量的索引值对应的电机状态作为当前数据所对应的行星轮或太阳轮的状态,并输出齿轮状态。进一步的,根据数字胶囊层的输出v
j
(t)搭建用于优化故障诊断模型的损失函数,
其计算表达式如下所示:l
k
(t)=t
k
(t)max(0,m
+

||v
k
(t)||)2+λ(1

t
k
(t))max(0,||v
k
(t)||

m

)2式中:下标k为故障类别k;l
k
(t)为类别k的间隔损失;t
k
(t)为分类指示函数(分类正确取1,否则取0);v
k
(t)表示识别为故障类别k的概率;m为上界,取0.9;m为下界,取0.1;为比例系数,取0.5。总损失为各样例损失之和;计算t时刻的损失函数值l
k
(t),再与t

1时刻的损失函数值l
k
(t

1)进行比较,如果l
k
(t)小于l
k
(t

1),则利用梯度下降法直接优化卷积神经网络和胶囊网络的权重及偏置;否则,则利用adam optimizer优化器优化卷积神经网络和胶囊网络的权重及偏置;判断当前迭代次数t是否达到最大迭代次数t,如果满足,则迭代停止,将本次更新后的权重及偏置作为卷积胶囊网络的参数,然后进行最后的状态输出;否则,将当前迭代次数t自加1,再返回卷积层1,继续选取下一batch进行训练;将采集到的行星齿轮箱振动数据按比例划分为训练集和测试集,然后输入至模型,从而输出行星齿轮箱健康状态概率分布。与现有技术相比,本发明具有的优点和积极效果如下。1、本发明提出一种故障诊断方法,可针对行星齿轮箱不同齿轮部件的多类故障进行诊断,实现从原始数据到故障类别的“端到端”自动诊断;2、本发明结合了卷积池化结构对故障特征的深度提取能力,以及胶囊结构矢量化挖掘特征空间信息的特点,实现了对行星齿轮箱故障的精确智能诊断;3、相比传统卷积神经网络与胶囊网络,本文提出的卷积胶囊网络对单类部件多故障、多类部件多故障数据混合条件下具有更高的诊断准确率,具有良好的应用前景。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。图1为本发明公开的一种基于强化胶囊网络的行星齿轮箱故障诊断方法的一种具体实施方式的流程图;图2为本发明卷积胶囊网络模型结构图;图3为健康状态和7种故障状态的行星齿轮箱原始振动信号波形图;图4为本发明卷积胶囊网络对于训练集、验证集的诊断准确率、损失曲线图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。其次,本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表
示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸再次,需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本发明中的具体含义。为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明的具体实施例做详细说明。如图1所示,一种基于卷积胶囊网络的行星齿轮箱故障诊断方法,包括如下步骤:s1、获取多种健康状态下的行星齿轮箱数据,并构建样本集;s2、利用卷积池化结构实现故障特征的自动提取与降维;s3、通过胶囊结构矢量化表示特征并传递信息,同时采用动态路由机制计算不同胶囊层向量之间的相关度;s4、通过间隔损失函数与输入数据不断优化模型参数,实现对不同齿轮部件故障的精准智能诊断。本发明提出的卷积胶囊网络,其主要结构如图2所示,包括:输入层,卷积层,池化层,dropout层,预胶囊层,数字胶囊层和输出层。其中所述的输入层将原始数据经过z

score标准化处理后作为卷积胶囊网络输入数据,所述的卷积层依次采用宽卷积核提取输入特征和大量窄卷积核,所述的dropout层用于舍弃部分神经元防止训练阶段过拟合,所述的预胶囊层将卷积结果以矢量形式构建胶囊作为数字胶囊层的输入,所述的数字胶囊层通过动态路由机制计算胶囊层之间的相关度实现对故障特征的精确归类,所述的输出层对输出向量进行二范数求解,得到不同故障类型的概率分布。具体的:输入层z

score标准化处理的计算公式为:式中,y
i
为标准化后数据;x
i
为原始数据;为原始数据均值;σ为原始数据方差。原始数据z

score标准化处理后输入卷积层,通过卷积运算与激活函数实现了对
输入数据的特征提取:首先,通过n个维度相同的卷积核对输入数据进行卷积运算,同时附加偏置项得到卷积结果;然后,利用激活函数对卷积结果进行非线性映射,输出n个特征矩阵,计算公式如下所示:式中:为卷积层输出第n个特征矩阵的第j个元素;m
j
为输入数据的第j个卷积区域;x
i
为m
j
的第i个元素;为第n个卷积核的权值矩阵;b
n
为第n个卷积核对应的偏置项;f(
·
)表示激活函数。提取出的初始特征输入至池化层,通过池化运算实现对特征矩阵的降维过程:将卷积层的输出数据无重叠、等宽度的划分为q个池化单元,对每个单元内的元素进行池化运算,得到池化层的输出特征矩阵。使用的池化运算为最大池化(max pooling),池化过程表达式为:式中:为池化层输出第n个特征矩阵中的第q个元素;为池化层输入第n个特征矩阵的第q个池化单元,其中w为池化单元宽度。元素经过池化运算后,输入dropout层进行处理,舍弃部分神经元防止训练阶段过拟合;其中dropout比率=0.25。数据通过dropout层后进入预胶囊层,将卷积结果以矢量形式构建胶囊作为数字胶囊层的输入,计算公式如下所示:其中,g1(t)是t时刻胶囊网络卷积层的输出;e
i
(t)为t时刻初级胶囊层的输出,是一系列的8维向量;为t时刻胶囊网络卷积层的权重矩阵和偏置向量;为t时刻初级胶囊层的权重矩阵和偏置向量;relu()为rectified linear unit;
[0056]
通过压缩与动态路由算法对初级胶囊层的输出进行处理,得到数字胶囊层的输出,处理的具体公式为:其中,v
j
(t)是t时刻数字胶囊层第j个胶囊的输出,j∈[0,7]它是每一种行星齿轮箱健康状态所对应的索引值;l
j
(t)是t时刻从初级胶囊层到数字胶囊层的总输入向量;
为t时刻预测向量,通过将初级胶囊层的输出乘以一个权重矩阵w
ij
(t)得到,i为初级胶囊层输出8维向量的个数;a
ij
(t)为t时刻的耦合系数;b
ij
(t)为t时刻动态路由算法的迭代更新参数,初始值为0;r为动态路由算法的迭代次数。计算向量v
j
(t)的长度,并比较当前t时刻所有向量长度的最大值,再将最长向量的索引值对应的电机状态作为当前数据所对应的行星轮或太阳轮的状态,并输出齿轮状态。根据数字胶囊层的输出v
j
(t)搭建用于优化故障诊断模型的损失函数,其计算表达式如下所示:l
k
(t)=t
k
(t)max(0,m
+

||v
k
(t)||)2+λ(1

t
k
(t))max(0,||v
k
(t)||

m

)2式中:下标k为故障类别k;l
k
(t)为类别k的间隔损失;t
k
(t)为分类指示函数(分类正确取1,否则取0);v
k
(t)表示识别为故障类别k的概率;m为上界,取0.9;m为下界,取0.1;为比例系数,取0.5。总损失为各样例损失之和。计算t时刻的损失函数值l
k
(t),再与t

1时刻的损失函数值l
k
(t

1)进行比较,如果l
k
(t)小于l
k
(t

1),则利用梯度下降法直接优化卷积神经网络和胶囊网络的权重及偏置;否则,则利用adam optimizer优化器优化卷积神经网络和胶囊网络的权重及偏置,adam optimizer优化器优化的具体公式为:其中,g(t)为t时刻的梯度;m
t
为指数移动均值;h
t
为平方梯度;β1、β2为常数,β1、β2∈[0,1];∈为常数,默认为1e

8;θ
t
表示更新后的模型参数,包括卷积神经网络和胶囊网络更新后的权重及偏置。判断当前迭代次数t是否达到最大迭代次数t,如果满足,则迭代停止,将本次更新后的权重及偏置作为卷积胶囊网络的参数,然后进行最后的状态输出;否则,将当前迭代次数t自加1,再返回卷积层1,继续选取下一batch进行训练;将采集到的行星齿轮箱振动数据按比例划分为训练集和测试集,然后输入至模型,从而输出行星齿轮箱健康状态概率分布。为了验证本发明公开的方法的有效性,使用动力故障与故障传动实验台(dynamci drivetrian simulator,dds)采集行星齿轮箱不同故障下的振动信号。实验台主要包括一台伺服驱动电机;输入、输出扭矩编码器各一个;一台行星齿轮箱;水平、垂直两个方向加速度传感器(100mv/g)获取数据;一台定轴齿轮箱以及一台可编程磁力制动器。表1 行星齿轮箱装配齿轮参数齿轮参数数值太阳轮齿数28行星轮齿数36齿圈齿数100
行星轮数4在电动机转速分别为1800r/min和3000r/min两种工况下,分别采集8类齿轮健康状态的振动数据,采集时间为19.2s,采样频率设置为10240hz。将振动信号以长度为1024个数据点截取为一个样本,并按照4:1的比例划分训练集和测试集,数据分布如表2所示。表2 训练集、测试集数据分布上述8类故障类型样本的时域信号如图3所示。本发明设计针对太阳轮与行星轮故障数据混合情况下的故障诊断实验分析,样本分布如表3所示。表3 齿轮故障样本分布表数据集的标签采用“独热(one

hot)”的编码方式:对于x种类别的故障诊断,将标签转化为x维的向量,并且其中一个值为1,其余均为0,每类故障标签互异。本发明的卷积胶囊网络模型的输入样本维度为1024
×
1,输出维度为故障类型数量。激活函数采用relu函数,损失函数采用间隔损失(margin loss)函数。模型具体结构参数设置如表4所示。表4 卷积胶囊网络模型结构参数设置
利用本发明针对8类健康状态的行星齿轮箱进行故障诊断,将训练集按9:1的比例划分为训练集和验证集,两类网络设置单次处理数据量batch

size为10,共训练50个epoch,采用adam(adaptive moment estimation)优化函数,学习率r设置为0.001。如图4所示,给出了在电动机转速为1800r/min(左)、3000r/min(右)工况下,卷积胶囊网络模型对8类健康状态的行星齿轮箱进行故障诊断的训练和验证过程。为验证本发明所提方法的优势,对比分析卷积神经网络(cnn)、传统胶囊网络(cn),利用本发明针对8类健康状态的行星齿轮箱进行多类故障诊断。为使实验结果更具信服力,对比实验采用10次十折交叉验证的训练方式,将训练集等分为10份,每次不重复的选用9份用于训练,1份用于验证。设置单次训练数据量batch

size为10,每次训练5个epochs,10次共训练50个epoch。两类模型均采用adam算法对模型参数进行优化,学习率r设置为0.001。将测试集准确率作为对比依据,取5次结果的平均值,3类模型的诊断结果如表5所示。表5不同齿轮部件多类故障测试准确率(%)
正如表5所示,在电动机转速为1800r/min工况下,tc

cn模型测试准确率达到98.19%,优于cnn模型的93.01%与cn模型的92.96%;在电动机转速为3000r/min工况下tc

cn模型达到了97.36%的测试准确率,分别高于cn模型4.47%与cnn模型10.98%。实验结果表明,本发明的卷积胶囊网络模型对于不同齿轮部件的多类故障具有更高的识别精度。应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1