
基于图正则化cnn-bilstm的多传感器故障诊断方法、介质及设备
技术领域
1.本发明涉及基于特定计算模型的计算机故障诊断系统领域,尤其涉及一种基于图正则化 cnn-bilstm的多传感器故障诊断方法、介质及设备。
背景技术:2.故障诊断作为故障预测与健康管理(prognostics and health management,phm)的关键环节,通过信号检测技术和数据分析手段,实现故障检测、隔离并识别故障类型,为系统的维修维护提供相应的解决方案和运维策略。
3.故障诊断主要包括特征提取和分类两部分。传统基于时频信号处理的故障诊断方法依赖人工经验提取特征,在当前体量浩大、多源异构、生成快速、价值稀疏的状态监测大数据的情况下使用具有局限性。而深度学习凭强大处理复杂识别任务和特征提取能力的优势在机械制造、航空航天、能源化工等领域的设备故障诊断中被广泛研究和应用。现有深度学习中的卷积神经网络(convolutional neural networks,cnn)能有效避免复杂的特征提取和数据重建过程;双向长短时记忆网络(bidirectional long short-term memory network,bilstm)在前后两个方向同时处理网络的输入,提高了模型的预测精度。因此,基于cnn和bilstm网络模型的深度学习被用于故障诊断,以下简称:现有基于深度学习的故障诊断方法。
4.现有基于深度学习的故障诊断方法基于样本独立假设,忽略了样本间关联信息。事实上,在特定特征空间中,同类别样本相似且距离较近,不同类别样本差距较大且距离较远。因此,为充分利用样本之间的几何结构信息来提高深度学习算法模型的性能,将流形学习方法以及谱图理论的知识引入传统正则化方法中,形成现有深度图正则化故障诊断方法。现有深度图正则化故障诊断方法使数据在新的投影空间中能够保持其在原特征空间中的局部几何结构,即各数据点在分布的本质几何结构中相近,在嵌入或投影到新的空间中也相近。但是,现有深度图正则化故障诊断方法的网络近邻图在原始高维空间中构建,存在计算量大、易受干扰、训练效率低的问题。
技术实现要素:5.本发明的目的在于提供一种基于图正则化cnn-bilstm的多传感器故障诊断方法、介质及设备,以提高现有深度图正则化故障诊断方法训练效率低问题。
6.为了实现上述目的,本发明所述基于图正则化cnn-bilstm的多传感器故障诊断方法,所述方法包括:
7.s1,采集多传感器的状态监测数据,并对采集的数据预处理,得到训练集、验证集和测试集;
8.s2,建立cnn-bilstm网络,将图正则化项加在cnn-bilstm网络的全连接层中,所述全连接层为距离分类器最近的全连接层,完成gr-cnn-bilstm模型构建;
9.s3,利用训练集内的数据训练所述gr-cnn-bilstm模型,利用验证集内的数据评价所述gr-cnn-bilstm模型,并获取所述gr-cnn-bilstm模型性能最优时的网络参数;
10.s4,将测试集的数据输入性能最优的gr-cnn-bilstm模型中进行故障诊断,得到故障诊断结果。
11.优选地,步骤s1中,对采集的数据进行z-score标准化、min-max标准化或归一化处理。
12.优选地,步骤s2,建立cnn-bilstm网络,具体为:
13.a1,将训练集输入cnn中进行网络结构训练,经过卷积层提取深层特征数据,再经过最大池化层处理,得到降维深层特征数据;
14.a2,将降维深层特征数据输入bilstm进行网络结构训练,将bilstm训练得到的输出数据拼接融合,得到并学习融合后的故障特征数据;
15.a3,将融合后的故障特征数据输入全连接层模块,在所述全连接层模块的输出层设置 softmax分类器,进行故障状态分类并输出,更新网络结构参数,返回a1,进行下一批数据的训练,直至训练集的数据全部参与训练后作为一次迭代;
16.a4,达到迭代预设次数后,完成cnn-bilstm网络模型的构建;
17.其中,softmax分类器使用交叉熵损失函数,所述交叉熵损失函数lc为:
[0018][0019]
式(1)中,ri为训练集中数据样本i的真实标签;yi为训练集中数据样本i的预测标签;n 为训练集中数据样本的总数。
[0020]
优选地,所述cnn-bilstm网络中设置全连接层模块,所述全连接层模块中包括顺序设置的第一全连接层fc1、第二全连接层fc2和输出层;
[0021]
cnn-bilstm将训练或测试得到的特征信息依次通过第一全连接层fc1、第二全连接层 fc2映射到输出层;
[0022]
所述全连接层模块中每个层的计算方程均为:
[0023]
oa=g(waha+ba)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0024]
式(2)中,oa为第a个全连接层的输出;ha第a个全连接层的输入;ba为第a个全连接层的偏置权重;wa为第a个全连接层的遗忘门权重;g()为第一个全连接层的relu函数。
[0025]
优选地,步骤s2中,将图正则化项加在cnn-bilstm网络的全连接层中,所述全连接层为距离分类器最近的全连接层,具体为:
[0026]
在训练集数据的基础上,构造近邻图,具体为:确认任意一个数据样本i的k个近邻点,并建立所述数据样本i的k个近邻点之间的连接;
[0027]
基于所述近邻图,在cnn-bilstm网络中距离分类器最近的全连接层的特征空间中加入近邻图正则化项,所述近邻图正则化项lg为:
[0028][0029]
其中,i表示训练集中任意一个数据样本,j表示训练集中与数据样本i近邻的数据样本, n为训练集中的数据样本总数,h
ij
表示近邻图中数据样本i和数据样本j的连接权重,si表示数据样本i对应的特征向量,sj表示数据样本j对应的特征向量,h
ij
的计算公式为:
[0030][0031]
公式(4)中,σ表示近邻图中所有近邻点之间的平均距离值,非近邻点之间的权重为0。
[0032]
优选地,步骤s3中利用训练集内的数据训练所述gr-cnn-bilstm模型,具体为:
[0033]
基于所述训练集,获得经特征工程后的训练样本集x和对应的标签集y,并输入到 gr-cnn-bilstm模型,获得所述gr-cnn-bilstm模型的网络参数;
[0034]
设置gr-cnn-bilstm模型的超参数;所述超参数包括:学习率、最大迭代次数、图正则项引入时刻、数据样本批次数、图正则化项系数和近邻点个数;
[0035]
初始化gr-cnn-bilstm模型的网络参数;
[0036]
将训练样本集x的第b批数据样本输入gr-cnn-bilstm模型,b≥1,得到预测标签,接着进行预训练阶段和调优阶段的计算,根据计算结果,利用优化器更新网络权重和偏置;完成对gr-cnn-bilstm模型的训练;
[0037]
其中,当迭代次数e<eg时,为预训练阶段,目标函数l的计算公式为:
[0038]
l=lcꢀꢀꢀꢀꢀꢀ
(5)
[0039]
当eg<e<e
max
时,为调优阶段,目标函数l的计算公式为:
[0040]
l=lc+γlgꢀꢀꢀꢀꢀ
(6)
[0041]
公式(5)和公式(6)中,l表示gr-cnn-bilstm模型的目标函数,表征期望输出与真实输出的差距;lc表示交叉熵损失函数;lg表示近邻图正则化项,γ表示图正则化项权重系数,e表示迭代次数,e
max
表示最大迭代次数;eg表示图正则项引入时刻。
[0042]
更优选地,所述优化器选用adam算法。
[0043]
优选地,利用验证集内的数据评价所述gr-cnn-bilstm模型时,当评价参数准确率和/ 或macro f
1-score为最高时,所述gr-cnn-bilstm模型性能最优。
[0044]
本发明的有益效果是:
[0045]
本发明基于图正则化cnn-bilstm的多传感器故障诊断方法通过在低维特征上构造图正则项,使网络学习到聚类效果更好、辨识度更高的几何关系特征,提升训练效率和诊断准确率,克服现有深度图正则化故障诊断方法训练效率低的缺点。
附图说明
[0046]
图1是基于图正则化cnn-bilstm的多传感器故障诊断方法的流程示意图;
[0047]
图2是cnn-bilstm网络结构的示意图;
[0048]
图3是基于gr-cnn-bilstm模型的故障诊断流程图示示意图;
[0049]
图4是gr-cnn-bilstm训练准确度和损失随epoch变化曲线的示意图;
[0050]
图5是不同e0值的测试集分类准确度和训练时间的示意图;
[0051]
图6是不同k值的测试集分类准确度的示意图;
[0052]
图7是不同γ值的测试集分类准确度的示意图;
[0053]
图8是不同模型算法测试结果的混淆矩阵的示意图,其中,(a)表示knn测试结果的
混淆矩阵的示意图,(b)表示gb bayes测试结果的混淆矩阵的示意图,(c)表示mlp算法测试结果的混淆矩阵的示意图,(d)表示cnn算法测试结果的混淆矩阵的示意图,(e)表示 cnn-bilstm网络结构测试结果的混淆矩阵的示意图,(f)表示gr-cnn-bilstm模型算法测试结果的混淆矩阵的示意图;
[0054]
图9是不同深度学习模型的全连接层fc2层特征二维可视化示意图,其中,(a)表示卷 cnn的全连接层fc2层特征二维可视化示意图,(b)表示lstm的全连接层fc2层特征二维可视化示意图,(c)表示cnn-bilstm网络结构的全连接层fc2层特征二维可视化示意图,(d)表示gr-cnn-bilstm模型的全连接层fc2层特征二维可视化示意图;
[0055]
图10是lstm单元结构。
具体实施方式
[0056]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
[0057]
对cnn和bilstm的背景进行简单介绍如下:
[0058]
cnn-bilstm结合了cnn提取空间特征信息与bilstm提取时间特征信息的优势。其中,cnn可提取多传感器数据的深层特征信息,并在保留主要特征信息的条件下降低数据维度。bilstm对时序数据从两个方向提取可能被cnn忽略的信息。bilstm同时在前后两个方向处理网络的输入,捕获过去和未来的信息;增强模型对原始信息输入开始和结束阶段的记忆。
[0059]
(一)卷积神经网络cnn
[0060]
cnn是一种包含卷积计算且具有深度结构的前馈神经网络,具有将低层的局部特征提取并组合为高层更抽象特征的能力。它的优势在于权重共享结构和平移不变特性。考虑一个l 层的cnn结构,第l层卷积特征映射可以表示为:
[0061][0062][0063]
其中,为第l个卷积层第e个特征的输出,q表示当前的输出特征个数,和分别对应第l个卷积层的权重矩阵和偏置,m表示滤波器的索引值,m为卷积层的输出个数。激活函数以修正线性单元(rectified linear unit,relu)为例,获得非线性特征,增强模型的特征表达能力,加速cnn的收敛过程,为输出结果。
[0064]
池化函数使用某一位置的相邻输出的总体统计特征来代替网络在该位置的输出。在连续的卷积层中间引入池化层,通过非线性降采样,在保持空间不变性的基础上,减少卷积后的特征空间和网络参数。为达到快速收敛和良好的泛化,本技术所述基于图正则化 cnn-bilstm的多传感器故障诊断方法采用最大池化层(max-pooling),选取区域内所有神经元的最大值:
[0065][0066]
其中,为最大池化层的输出,其中t和r分别表示池化层步长和池化层核大小,μ表示池化窗口。
[0067]
(二)双向长短时记忆神经网络bilstm
[0068]
长短时记忆网络lstm是循环神经网络rnn一种变体,通过保持单元状态中的长短时记忆,能够克服长时间序列训练过程中的梯度消失和梯度爆炸问题。lstm通过时间序列循环刻画动态特性,并建立长时关联模型。lstm单元模型主要由遗忘门(forgot gate)、输入门(input gate)和输出门(output gate)来控制信息流。lstm单元结构如图10所示。lstm 与rnn的最大不同在于输入门可以短暂存储相关信息。
[0069]
为了获得给定序列中各时间步前后更多的信息,构造了具有独立的正反向路径的 bilstm,在某一特定时间步长内,同时捕获过去和未来的信息,增强模型对原始信息输入开始和结束阶段的记忆。前向lstm可以发现变化规律,后向lstm可以减轻噪声影响,平滑预测结果。
[0070]
在时间步为t时,x
t
、h
t
分别为输入状态和隐状态,f
t
、i
t
、o
t
、c
t
分别为遗忘门、输入门、输出门和记忆单元。遗忘门决定信息的通过量,输入门决定新信息是否被细胞单元记忆, lstm单元的最终输出由输出门的输出与记忆单元输出共同决定。正向路径与后向路径理论相同,本技术仅以后向路径为例,更新方程如下:
[0071][0072]
式中,σ表示sigmoid函数,w,v,and b分别为单元中遗忘门、输入以及偏置的循环权重,为待更新的模型参数。
[0073]
遗忘门和输入门可以确定下一个单元状态c
t+1
和候选单元状态融合成当前单元状态c
t
的方式。输出门可以控制当前单元状态c
t
到隐状态h
t
的转换。
[0074][0075]
式中,tanh为双曲正切函数。
[0076]
根据输入序列(x
t
,
…
,x
t
)可以获得前向隐状态序列同样地,逆序处理输入时间序列(x
t
,
…
,x
t
),能够生成后向隐状态序列在连接前向和后向隐状态后,双向lstm 的最终输出序列y
t
可表示为u表示转置。
[0077]
实施例
[0078]
本实施例所述基于图正则化cnn-bilstm的多传感器故障诊断方法,如图1和图3所示,所述方法包括:
[0079]
s1,采集多传感器的状态监测数据,并对采集的数据预处理,得到训练集和测试集;
[0080]
s2,建立cnn-bilstm网络,将图正则化项加在cnn-bilstm网络的全连接层中,所述全连接层为距离分类器最近的全连接层,完成gr-cnn-bilstm模型构建;
[0081]
s3,利用测试集内的数据评价所述gr-cnn-bilstm模型,并获取所述gr-cnn-bilstm 模型性能最优时的参数;
[0082]
s4,将测试集的数据输入s3中已经训练完成的gr-cnn-bilstm模型中进行故障诊断,得到故障诊断结果。
[0083]
更详细的解释说明:
[0084]
(一)关于cnn-bilstm网络结构的构建
[0085]
不同故障类别分类的主要挑战在于与系统变化相关的非线性和数据不确定性,具体表现为不同特征之间的相关性以及同一特征在时域上的时变性。因此,本实施例中构建 cnn-bilstm网络结构将高维数据非线性地映射到低维空间,包含用来提取相关关系的多层 cnn和提取时序关联关系bilstm,cnn-bilstm网络结构如图2所示。
[0086]
具体来说:首先,构建一个包含输入层、输出层和多层隐藏层的多尺度一维cnn。训练集中的数据输入cnn卷积层自适应提取深层特征数据,经过最大池化层处理,在保留主要特征信息的条件下得到降低数据维度的降维深层特征数据。
[0087]
然后,将降维深层特征数据作为bilstm层的输入,进行训练网络模型并学习特征信息,具体:将bilstm训练得到的输出数据拼接融合,得到并学习融合后的故障特征数据。利用 cnn-bilstm网络结构的全连接层模块中的全连接层fc1和全连接层fc2将隐状态的特征映射到输出网络层,所述全连接层模块中每个层的计算方程均为:
[0088]
oa=g(waha+ba)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0089]
式(2)中,oa为第a个全连接层的输出;ha第a个全连接层的输入;ba为第a个全连接层的偏置权重;wa为第a个全连接层的遗忘门权重;g()为第一个全连接层的relu函数。
[0090]
最后,将融合后的故障特征数据输入全连接层模块,在所述全连接层模块的输出层设置 softmax分类器,进行故障状态分类并输出,使用优化器更新网络结构参数,接着行下一批数据的训练,直至训练集的数据全部参与训练后作为一次迭代,达到迭代预设次数后,完成 cnn-bilstm网络模型的构建。
[0091]
利用softmax分类器对故障状态进行分类的学习和诊断,softmax分类器的目标函数选用交叉熵损失函数:
[0092][0093]
式(7)中,ri为训练集中数据样本i的真实标签;yi为训练集中数据样本i的预测标签;n 为训练集中数据样本的总数。
[0094]
在cnn-bilstm网络结构中,正向传播逐层能实现非线性映射,反向传播算法更新 cnn-bilstm网络结构的参数以达到模型学习的效果。通过迭代缩减输出与真值之间的损失函数,使得每一全连接层的网络参数收敛到一个可接受的范围,即可完成cnn-bilstm网络结构优化。
[0095]
(二)关于加入图正则化项,构建gr-cnn-bilstm模型
[0096]
谱聚类方法具有高效的聚类性能,其主要思想是将所有数据视为空间中的点,各点之间由边连接,构成一个无向加权图。权值表示两点之间的距离,即构建相似度矩阵表征数据点之间的关系,然后对图进行分割,获得最终聚类结果。
[0097]
本实施例,通过对cnn-bilstm网络结构加入图正则化的限制,从样本的相似性上保证数据的局部流形结构。与传统在原始高维数据中设计图正则化项不同,本实施例在特征空间中设计近邻图,图正则化项加在距离分类器最近的第二全连接层fc2中,第二全连接层fc2 输出的特征直接输入到分类器中,所以第二全连接层fc2特征是最易分的,且第二全连接层 fc2的特征维度也是最低的,图正则化项应用于第二全连接层fc2不仅可以最大程度降低计算量,还可以提高构图的精确性。
[0098]
在特征空间中,邻接矩阵h表示两个样本间的近邻关系。若sj在si的k近邻中,即sj∈ knn(si),那么在近邻图上连接,构建有权无向的近邻图。近邻图中数据样本i和数据样本j的连接权重h
ij
采用高斯核函数定义为:
[0099][0100]
公式(8)中,σ表示近邻图中所有近邻点之间的平均距离值,非近邻点之间的权重为0。
[0101]
在训练集数据的基础上,构造近邻图,具体为:确认任意一个数据样本i的k个近邻点,并建立所述数据样本i的k个近邻点之间的连接;基于所述近邻图,在cnn-bilstm网络中距离分类器最近的全连接层的特征空间中加入近邻图正则化项,所述近邻图正则化项lg为:
[0102][0103]
公式(9)中,i表示训练集中任意一个数据样本,j表示训练集中与数据样本i近邻的数据样本,n为训练集中的数据样本总数,h
ij
表示近邻图中数据样本i和数据样本j的连接权重,si表示数据样本i对应的特征向量,sj表示数据样本j对应的特征向量。
[0104]
利用反向传播梯度下降算法不断迭代使lg最小化,减小近邻点之间的距离,使 gr-cnn-bilstm模型学习到聚类效果好和辨识度高的特征,实现高效故障分类。
[0105]
(三)利用两阶段训练法训练gr-cnn-bilstm模型
[0106]
本具体实例中,由于对cnn-bilstm网络结构的训练不充分,不易区分高阶特征,因此很难正确构建近邻图,此外过早引入图正则化项会增加gr-cnn-bilstm模型的复杂度和计算时间,表1所示的训练算法包括对gr-cnn-bilstm模型训练的两个阶段,每个阶段的网络刻画模型期望输出与真实输出的目标函数l有所不同。
[0107]
(1)预训练阶段。在迭代次数e《eg时,l仅包含分类器的损失函数lc。
[0108]
l=lcꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
[0109]
(2)调优阶段。在迭代次数eg《e《e
max
时,网络目标函数l同时包含分类器的损失函数 lc和图正则化项lg,通过分类器损失学习数据显著的低维特征,而图正则化项使学习到的特征更具有判别性。
[0110]
l=lc+γlgꢀꢀꢀꢀꢀꢀꢀ
(11)
[0111]
公式(10)和公式(11)中,l表示gr-cnn-bilstm模型的目标函数,表征期望输出与真实输出的差距;lc表示分类器的目标函数,在本实施例中lc为交叉熵损失函数;lg表示近邻图正则化项,γ表示图正则化项权重系数,e表示迭代次数,e
max
表示最大迭代次数;eg表示图正则项引入时刻,需要人为确定和调试。
[0112]
当深度学习模型的评价参数accuracy、precision、recall、macro f1-score中的任意一个或几个为最优时,即为深度学习模型模型的性能最优。而,在本实施例中,利用验证集内的数据评价所述gr-cnn-bilstm模型时,当评价参数准确率和/或macro f
1-score为最高时,所述 gr-cnn-bilstm模型性能最优。
[0113]
表1 gr-cnn-bilstm模型两阶段训练算法
[0114][0115]
在训练后的gr-cnn-bilstm模型的模型参数集包括各层网络权重和偏置。
[0116]
为了更好的说明本实施例要求保护的基于图正则化cnn-bilstm的多传感器故障诊断方法的有效性和有益效果,以下以具体实验和模型比较验证本实施例所述方法的有效性。
[0117]
实验验证和模型比较
[0118]
1.1超声电机的数据集描述
[0119]
采用实验验证本实施例所述基于图正则化cnn-bilstm的多传感器故障诊断方法的有效性。
[0120]
数据集包括超声电机在正常状态和压电陶瓷片开裂、摩擦片磨损、胶层松脱、弹性体断齿等4种故障状态下的驱动电压、驱动电流、驱动频率、孤极反馈电压、内部温度五种信号。基于采集到的多传感器数据构建训练集和测试集,并保证训练集和测试集数据完全独立,且训练集和测试集均包含不同类型故障模式。训练集和测试集中的每个样本均包含五
种信号通道传感器采集的数据,训练集和测试集的样本数均为18652。目标是通过训练集对 gr-cnn-bilstm模型进行训练,再使用测试集验证gr-cnn-bilstm模型性能。
[0121]
表2 8个电机的正常和故障数据集描述
[0122][0123]
多传感器采集的原始数据由于采样频率高、噪声大,难以直接用于故障诊断,因此采用 z-score对多传感器采集的原始数据进行归一化处理消除尺度效应,确保不同故障特征之间的有效比较。
[0124][0125]
式(12)中,xi为原始数据,为特征均值,σ
x
表示特征标准差,x
i_norm
表示z分数,以标准差为单位的离均差。
[0126]
1.2模型参数设置与敏感性分析
[0127]
经预处理后的5维多传感器信号导入gr-cnn-bilstm模型。网络超参数设置如下:cnn 的批大小为149,卷积核数量为32,卷积核大小为2,步长为2,池化窗口大小为2;bilstm 中隐藏层的单元数设为128,全连接层fc1和fc2单元数分别设为64和32;分类器输出类别为5。在对入gr-cnn-bilstm模型的训练过程中,采用adam算法,初始学习率设为0.001,权重衰减设为e-5
。采用one-hot编码方式对分类结果进行编码,因此无故障、压电陶瓷片开裂、摩擦片磨损、胶层松脱、弹性体断齿状态的输出分别为[1,0,0,0,0]、[0,1,0,0,0]、[0,0, 1,0,0]、[0,0,0,1,0]、[0,0,0,0,1]。入gr-cnn-bilstm模型的最大迭代次数epoch参数对训练集的准确度和损失的影响如图4所示。在最大迭代次数epoch值为120时,训练准确度和损失趋于稳定,过度训练会导致模型过拟合,因此最大迭代次数epoch设为120次,通过迭代优化更新模型参数,使损失函数达到最小。
[0128]
将近邻图正则项引入时刻e0设置为60,近邻点数量k设置为3,图正则项系数γ设为0.01。接下来通过分层划分的五折交叉验证,对模型中e0、k和γ等影响网络性能的关键参数的敏感性进行分析。为节省训练时间,以下分析过程中样本数取原始样本的十分之一,即样本数为1865。
[0129]
1.2.1图正则项引入时刻的确定分析
[0130]
在γ=0.01,k=3时,不同e0条件下,图正则化cnn-bilstm的测试集诊断准确度和训练时间的均值如图5所示。可以发现,随着e0增大,训练时间逐渐缩短,分类准确率先升后降,在e0为60时最大。这是因为原始样本在数据空间中存在严重混叠,很难进行区分。当过早引入图正则化项,会造成构建的近邻图精度较差,使模型学习到错误的几何关系特征,而过晚引入图正则化项,会因为临近迭代终止数造成参数优化效果不佳。为了在准确率和训练效率之间取得平衡,选取e0值为60。
[0131]
1.2.2近邻点数量的确定分析
[0132]
近邻点数量k若太大,可能会选择到错误的近邻点,导致近邻图构建准确度受影响。由于训练批大小为149,各类别平均包含30个样本,因此k值应小于30。如图6所示为e0=60,γ=0.01时,在不同k条件下,gr-cnn-bilstm的测试集诊断准确度和训练时间的均值。可以发现,随着k增大,分类准确率先提高,在k为3时取得最大值,而后逐渐下降,因此选取k值为3。
[0133]
1.2.3图正则化系数的确定分析
[0134]
图正则化系数γ若太大,可能会影响分类器的学习过程,若太小则无法起到学习样本之间的几何结构信息来提高模型性能的目的。当e0=60,k=3时,不同γ条件下gr-cnn-bilstm 模型的测试集诊断准确度的均值如图7所示。可以发现,随着γ增大,分类准确率先提高,在k为0.01时取得最大值,而后逐渐下降,因此选取γ值为0.01。
[0135]
1.3模型评价
[0136]
基于上述数据集,将本实施例中所述基于gr-cnn-bilstm模型的多传感器故障诊断方法和几个基于常用模型的故障诊断方法的效果进行比较。本实施例中为评价模型效果,采用了准确度、精度、召回率和f
1-score评价指标。除了常用的表征每种故障类型分类准确率的指标,如平均分类准确率、精密度和召回率外,还选择了不受数据不平衡影响的多分类指标macrof
1-score对不同模型的多分类性能进行比较。macro f
1-score为在f
1-score的基础上再进行取平均操作(见如下公式),对基于gr-cnn-bilstm模型的多传感器故障诊断方法的性能进行了评价,并将本实施例所述方法与常用故障诊断算法的性能进行了比较。
[0137][0138]
公式(13)中的v表示第v种故障类型,在本实验中,v=1,2,3,4,5,表示超声电机的正常状态、电陶瓷片开裂故障、摩擦片磨损故障、胶层松脱故障和弹性体断齿故障。
[0139]
传统深度图正则化网络的图正则化项是在原始数据空间中构造的,而本实施例所述基于 gr-cnn-bilstm模型的多传感器故障诊断方法的图正则化项在特征空间中构造。由于第二全连接层fc2层特征空间的维度(64)远低于原始训练数据集维度(74610=14922*5),所以本实施例所述gr-cnn-bilstm模型显然具有更高的训练效率。
[0140]
1.3.1与常用故障诊断模型的诊断结果对比
[0141]
为验证本实施例所述基于gr-cnn-bilstm模型的多传感器故障诊断方法的诊断效果,表3展示了gr-cnn-bilstm模型与其他六种常用模型的比较结果。可以发现,k-nearestneighbors(knn)和gaussian naive bayes(gb bayes)、多层感知器(multilayer perceptron,mlp) 学习算法的诊断准确率结果分别为0.8779、0.8259和0.8852,效果不如本实施例的 gr-cnn-bilstm模型,上述三种学习算法存在依赖人工提取特征、过拟合、参数选择等问题。与浅层机器学习方法相比,本实施例的gr-cnn-bilstm模型由于强大的特征提取能力,故障诊断效果显著提高,证实了建立深度网络结构的必要性。此外,还将本实施例的 gr-cnn-bilstm模型、cnn模型和cnn-bilstm三种深度学习模型进行比较,三种深度学习模型参数设置均一致的条件下,cnn模型和cnn-bilstm的准确度分别为0.9158和 0.9389,
而gr-cnn-bilstm模型准确率为0.9491,且gr-cnn-bilstm模型在精度、召回率和macro f
1-score等指标中均表现最好。这是由于cnn可以在每一步中学习到多个信号的短期相关性,而bilstm则可以在前后两个方向上学习到序列的长期关联性。通过同时学习空间和时间特征,cnn-bilstm的macro f
1-score比cnn的macro f
1-score提高了3.75%;通过引入图正则化项,gr-cnn-bilstm的macro f
1-score比cnn-bilstm的macro f
1-score提高了1.47%。图8给出了不同模型测试结果的混淆矩阵,可以发现gr-cnn-bilstm模型分类效果最好,除了对于故障1和故障4存在部分误判外,几乎可以完全正确地对测试样本中的故障类型进行分类。
[0142]
表3基于不同故障诊断分类模型的评价结果
[0143][0144]
为了直观地验证本实施例所述基于gr-cnn-bilstm的多传感器故障诊断方法效果,采用t-sne的算法将不同深度学习模型的全连接层fc2层的特征进行二维可视化,如图9所示。可以发现,gr-cnn-bilstm模型可以将正常和不同故障类型共5种状态较好地进行区分,而其他三种深度学习模型均会出现部分数据分布的界限交叠现象。
[0145]
1.3.2多传感器数据与单传感器数据的诊断结果对比
[0146]
为了验证故障诊断方法融合多传感器数据的必要性,分析了多传感器信号与单传感器信号的输入样本对诊断结果的影响。考虑使用5种信号中的每一种单独进行故障诊断,并与采用全部5种信号组合开展故障诊断的结果进行对比,结果显示gr-cnn-bilstm的模型参数均保持一致。
[0147]
表4基于多传感器与单传感器数据的故障诊断结果比较
[0148][0149]
表4所示为对比结果,可以发现,基于任何单一信号都不能达到满意的诊断结果,而结合多传感器信号可以改善诊断效果。在使用全部5种信号时,所有评价指标均达到最佳,此结果验证了基于单通道传感器数据的故障诊断难以全面反映系统的健康状态,而通
过融合多传感器数据,扩展特征空间,能显著提升故障诊断效果。
[0150]
通过采用本发明公开的上述技术方案,得到了如下有益的效果:本技术所述基于 gr-cnn-bilstm的多传感器故障诊断方法在能够在多传感器状态监测数据的条件下,同时具备cnn提取多维特征的空间相关性和bilstm提取时序特征信息的能力;还采用了近邻图正则化方法在低维特征中挖掘数据几何关系特征,构建图正则化深度学习框架;进一步设计两阶段模型训练算法,在权衡训练时间和诊断准确度的基础上实现高效故障识别和分类。经过实验验证与分析得出主要结论如下:(1)本技术所述方法依赖的gr-cnn-bilstm模型的分类性能优于knn、bayes、mlp浅层机器学习方法,以及cnn、cnn-bilstm深度学习方法;(2)与单传感器信号的输入样本相比,本技术所述方法融合多传感器数据可以提高故障诊断模型的准确性;(3)本技术所述方法克服传统深度图正则化网络训练效率低的缺点,通过在低维特征上构造图正则项,使网络学习到聚类效果更好、辨识度更高的几何关系特征,提升训练效率和诊断准确率。
[0151]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。