一种基于标准自学习数据增强的故障诊断方法及系统

文档序号：33382072发布日期：2023-03-08 06:18阅读：29来源：国知局

1.本发明属于轴承故障诊断技术领域，尤其涉及一种基于标准自学习数据增强的故障诊断方法及系统。

背景技术：

2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。
3.滚动轴承作为应用最广泛的旋转部件，是高端装备内部运动转换以及功率传输的核心；滚动轴承常常在强非平稳工况下运行，过程中载荷、转速的剧烈波动，一方面导致滚动轴承故障频发，另一方面加速损伤扩展从而加重故障危害；因此，强非平稳工况下滚动轴承故障诊断，对于保障高端装备安全、高效运行具有重要意义。
4.对健康监测设备捕捉的动态信号进行处理与分析，是诊断滚动轴承故障最常用的手段；随着健康监测朝着高精度、多方位、全时长方向的发展，现代健康监测设备采集了海量动态信号，进而使故障诊断进入了“大数据”时代，导致传统的基于信号分析的故障诊断方法难以满足诊断效率的要求，这催生了基于“大数据”驱动的深度学习智能故障诊断方法；同时，随着设备复杂度的提高，强非平稳工况下采集的信号中不仅伴有极强的噪声，而且故障冲击特征与其他分量还存在强烈的耦合、重叠、畸变等现象，大大增加了信号分析难度；因此，在强非平稳工况下，深度学习智能故障诊断方法的需求更加迫切。
5.结构的加深意味着提取精准的故障特征更加容易，同时也造成了模型对于训练数据的过拟合，这就突显出完备训练数据的重要性；对于欠完备的健康监测数据，为提取目标特征进行模型结构的加深，只能使其陷入局限性诊断知识的过拟合，无法满足实际的诊断需求，因此，完备健康监测训练数据是智能故障诊断方法实施的基本前提。
6.强非平稳工况下的完备训练数据集，要求故障、瞬时工况(转速、载荷等)、工况变化率(转速、载荷变化率等)三维连续信息的叠加完备性，即每一种故障都要在任意瞬时工况、任意工况变化率下采集样本，如此苛刻的要求在实际中是无法实现的；在实际中，设备一旦发现故障，为预防严重事故必须停机检修，故障样本只是一段匀减速的动态信号，其中的工况变化率信息极为单一，而且必然缺失一定范围的瞬时工况信息(例如转速)，这远远满足不了完备性的要求；可见，强非平稳工况下采集的训练数据极不完备，这严重制约了智能故障诊断的发展。
7.数据增强(data augmentation，da)是一种通过生成新的训练样本来处理不完备数据集最直接的方法；传统的方法起源于图像识别前处理，例如图像旋转、放大等；近年来，生成对抗神经网络(generative adversarial networks，gan)作为一种数据智能生成方法，成为数据增强的热点；在旋转机械智能故障诊断领域也提出了一些基于gan的数据增强方法；zhou等设计了gan的生成器与鉴别器，采用全局优化的方案产生更多的样本来处理数据不平衡问题；shao等和guo等分别开发了一种基于gan的辅助分类器框架和多标签一维gan，从机械传感器信号中学习并生成更接近于真实的数据，来解决数据不足的问题。
8.现有的数据增强方法主要针对数据集不平衡、数据量小等问题，通过生成更接近于原始数据的样本来扩充数据量，进而提高模型的诊断准确率。但是，以数据相似性为目的的数据生成只能得到趋同的数据；通常情况下，强非平稳工况运行时的旋转机械健康监测数据只是局限性的、信息缺失的匀减速数据集，一味追求生成数据的相似性只能扩充数据量，而无法弥补数据集欠缺的信息；只有生成多样性的样本，才能使强非平稳工况下的数据集满足三维连续信息的叠加完备性。因此，数据生成的重点是生成数据与原数据的差异性。

技术实现要素：

9.为克服上述现有技术的不足，本发明提供了一种基于标准自学习数据增强的故障诊断方法及系统，以一维卷积神经网络为基本框架，利用不完备的训练数据集，通过标准自学习与数据增强的交叉对抗训练方式，生成扰动数据，获得强非平稳工况下的故障诊断模型，提高故障诊断的准确率。
10.为实现上述目的，本发明的一个或多个实施例提供了如下技术方案：
11.本发明第一方面提供了一种基于标准自学习数据增强的故障诊断方法；
12.一种基于标准自学习数据增强的故障诊断方法，包括：
13.基于一维卷积神经网络，构建故障诊断模型；
14.通过标准自学习与数据增强的交叉对抗训练方式，对故障诊断模型进行训练，得到完备数据集和强非平稳工况下的智能故障诊断模型；
15.将采集的待诊断振动信号，输入到训练好的智能故障诊断模型中，得到轴承故障诊断结果。
16.进一步的，所述一维卷积神经网络，包括多层卷积层、池化层和全连接层；
17.所述卷积层，使用relu(rectified linear unit)作为激活函数，卷积操作的步幅均为1；
18.所有卷积层后均连接池化层，对卷积层的输出特征进行降维；
19.输入样本经过多层卷积与池化后的特征展平为一维向量，然后通过三层全连接进行故障诊断。
20.进一步的，所述标准自学习，以学习分类知识为目标，通过反复输入更新后的样本来优化故障诊断模型中的参数，自学判断样本是否为扰动样本的评价标准。
21.进一步的，所述数据增强，以模型本身的输出为指导，通过样本参数化与模型数据化的方法生成扰动样本；
22.其中，扰动样本的判断标准是其能否干扰模型判断，具体为：样本输入到模型后能引起模型后验概率的扰动。
23.进一步的，所述样本参数化，是将样本看作模型参数，通过随机梯度下降法训练出使目标函数降低的参数，进而将参数导出为生成的样本。
24.进一步的，所述模型数据化，是将故障诊断模型的参数看作数据，在训练过程中固定参数值。
25.进一步的，所述智能故障诊断模型的输出，是待诊断振动信号属于各个故障类型的后验概率，对概率进行排序，概率最高的故障类型，是最终的轴承故障诊断结果。
26.本发明第二方面提供了一种基于标准自学习数据增强的故障诊断系统。
27.一种基于标准自学习数据增强的故障诊断系统，包括模型构建模块、模型训练模块和故障诊断模块；
28.模型构建模块，被配置为：基于一维卷积神经网络，构建故障诊断模型；
29.模型训练模块，被配置为：通过标准自学习与数据增强的交叉对抗训练方式，对故障诊断模型进行训练，得到完备数据集和强非平稳工况下的智能故障诊断模型；
30.故障诊断模块，被配置为：将采集的待诊断振动信号，输入到训练好的智能故障诊断模型中，得到轴承故障诊断结果。
31.本发明第三方面提供了计算机可读存储介质，其上存储有程序，该程序被处理器执行时实现如本发明第一方面所述的一种基于标准自学习数据增强的故障诊断方法中的步骤。
32.本发明第四方面提供了电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的程序，所述处理器执行所述程序时实现如本发明第一方面所述的一种基于标准自学习数据增强的故障诊断方法中的步骤。
33.以上一个或多个技术方案存在以下有益效果：
34.本发明提出了一种标准自学习数据增强方法，以故障诊断模型自身预测结果为数据生成的评价标准，通过样本参数化与模型数据化来生成扰动样本，扩充数据集使其更接近完备数据集。
35.本发明以一维卷积神经网络为基本框架，利用不完备的训练数据集，通过标准自学习与数据增强的交叉对抗训练方式，获得强非平稳工况下的故障诊断模型，提高故障诊断的准确率。
36.本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。
附图说明
37.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。
38.图1(a)-(b)为被不完备数据集训练的人类识别常规目标和识别扰动样本的示例图。
39.图2为第一个实施例的方法流程图。
40.图3为标准自学习数据增强方法的架构图。
41.图4为标准自学习数据增强方法的训练流程图。
42.图5为故障实验台及故障轴承。
43.图6为tdr数据集中不同健康状况样本的转速变化情况。
44.图7为不同测试集的诊断结果。
45.图8为第二个实施例的系统结构图。
具体实施方式
46.下面结合附图与实施例对本发明作进一步说明。
47.应该指出，以下详细说明都是示例性的，旨在对本发明提供进一步的说明。除非另
有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
48.需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
49.实施例一
50.人类的目标识别常常被不完备的训练数据集所困扰，如图1所示，一个仅见过常规鱼类的人，在看到“鲤鱼”、“草鱼”等鱼类时，能立刻识别出来；但当其看到“飞鱼”时，脑中或许在犹豫目标是鱼还是鸟，而且极有可能识别错误。
51.上述例子中，仅见过常规鱼类的人相当于被不完备数据集训练的模型；“鲤鱼”、“草鱼”等鱼类可以看作是与训练数据相似的样本，本实施例中称为常规样本；“飞鱼”相当于与训练样本不相似的样本(本实施例中称为扰动样本)；可见，被不完备数据集训练的模型，识别扰动样本的能力大大降低。
52.强非平稳工况下采集的故障数据集是典型的不完备数据集，但模型的任务往往是在复杂多变的工况下进行诊断，这就意味着测试样本大多是扰动样本；因此，数据增强的目的是生成扰动样本来扩充训练集，进而增强训练集的完备性；基于gan的方法，其目的是生成与训练样本近似的常规样本，这显然与强非平稳工况下数据增强的目的相悖；因此，亟需转变常规智能数据增强思路，进而提出面向扰动数据的智能数据增强方法。
53.若要生成扰动样本，首要问题是阐明扰动样本的标准，即，如何评价生成的样本是扰动样本。从上述例子中可以看出，“飞鱼”作为扰动样本可以使人脑的预测结果发生错误，这就说明，只有当样本与原始训练集的差异化达到足以干扰模型判断时，才可以视其为扰动样本，受此思想启发，本发明提出了以故障诊断模型自身预测结果为数据生成的评价标准，通过样本参数化与模型数据化来生成样本的数据增强方法；由于故障诊断模型自身预测结果是模型通过训练数据学习出来的，因此称为标准自学习数据增强方法ssda(standard self-learned data augmentation)。
54.本实施例公开了一种基于标准自学习数据增强的故障诊断方法，如图2所示，具体包括：
55.步骤s1、基于一维卷积神经网络，构建故障诊断模型；
56.ssda的基本模型架构采用了目前广泛使用的一维卷积神经网络(one-dimensional convolutional neural networks，1-d-cnn)；1-d-cnn包括多层卷积层、池化层和全连接层，各层参数集如表1所示：
57.表1 1-d-cnn的逐层参数
[0058][0059]
为了减少人工工作量，原始测量的振动信号经过分段后，无需经过傅里叶变换等信号处理方法，直接输入到网络中；所构建模型的输入样本定义为其中n为样本维度，本研究将n设为1200维。
[0060]
卷积层
[0061]
对于第l层卷积层，其特征可通过下式获得：
[0062][0063]
其中，为卷积核，且k
l
为卷积核的长度，m
l-1
为前一特征层的通道数，m
l
为当前层的通道数；是前一特征层的输出特征，是n
l-1
×ml-1
的向量空间，且n
l-1
为特征维数；b
l
为偏置向量；f(
·
)为激活函数，本实施例中卷积层全部使用relu(rectified linear unit)作为激活函数；v
l-1
*k
l
为卷积操作，可通过下式计算：
[0064][0065]
其中，下标[
·
]代表矩阵中元素的序号，卷积操作的步幅均为1，因此，的维度为(n
l-1-k
l
+1)
×ml
。
[0066]
池化层
[0067]
本模型的所有卷积层后均连接池化层，对第l层卷积层的输出特征进行降维，池化层的输出特征v
l
为：
[0068][0069]
其中，s为池化长度。
[0070]
全连接层
[0071]
输入样本经过多层卷积与池化后的特征展平为一维向量u1，然后通过三层全连接进行故障诊断，全连接的前向传播为：
[0072]ul
＝f(w
lul-1
+b
l
)
……
(4)
[0073]
其中，w
l
和b
l
分别为全连接层的权值矩阵和偏置向量；前两层全连接层的激活函数为relu激活函数，最后一层全连接层特征经过softmax激活函数得到模型的输出(c代表故障类型数)，即，输出o中的元素可通过下式计算：
[0074][0075]
其中，代表w3u3+b3，即输出层未经过激活函数的特征。
[0076]
模型的输出o代表样本属于各个故障类型的后验概率，因此根据模型输出即可判断样本的故障类型，为了方便描述，样本x输入模型后转化为特征u1的过程抽象为映射φf，特征u1转化为输出o的过程抽象为映射φc，即u1＝φf(x)，o＝φc(u1)；模型的所有参数用θ表示。
[0077]
步骤s2、通过标准自学习与数据增强的交叉对抗训练方式，对故障诊断模型进行训练，得到完备数据集和强非平稳工况下的智能故障诊断模型；
[0078]
ssda包含标准自学习和数据增强两个训练步骤；在标准自学习中，以学习分类知识为目标，通过反复输入更新后的样本来优化1-d-cnn模型中的参数，此过程相当于模型自学了判断样本是否为扰动样本的评价标准；在数据增强中，通过样本参数化与模型数据化的方法，对模型输出结果的后验概率进行干扰，从而产生多样化的样本；经过两个训练步骤的交替进行，最终不仅能获得完备的训练数据集，还能建立面向强非平稳工况的故障诊断诊断模型，ssda的方法架构和训练流程分别如图3、4所示。
[0079]
标准自学习
[0080]
标准自学习步骤的主要目的是训练出能够进行故障诊断的模型，由于扰动样本的判断标准是其能否干扰模型判断，因此，模型的判断将被视为评价标准应用于数据增强步骤中。
[0081]
模型(1-d-cnn)通过训练数据集来训练的，其中，为数据集中的样本个数，xi表示数据集中的第i个样本，代表其标签，yi为独热向量，其元素的赋值规则为：
[0082][0083]
参数中，r∈[0,1,2,
…
,r]代表对抗训练的循环次数，r为总循环次数。训练数据集由训练数据集和第r次数据增强生成的数据集组成，且为原始的训练数据集。
[0084]
在标准自学习过程中，模型通过交叉熵目标函数进行训练，其定义为：
[0085][0086]
其中，oi＝φc(φf(xi))。
[0087]
模型采用自适应矩估计算法(adam)作为优化器，反向传播的迭代次数记为ts，学习率为εs；通过最小化ls(θ)，模型将具备对数据集中的样本进行正确诊断的能力。
[0088]
数据增强
[0089]
生成扰动样本是数据增强的目标，其标准是生成的样本能否干扰模型的判断；因此，以模型本身的输出为指导，通过样本参数化与模型数据化的方法生成扰动样本。
[0090]
样本参数化，即，将样本看作模型参数，通过随机梯度下降法训练出使目标函数降低的参数，进而将参数导出为生成的样本；模型数据化为将1-d-cnn模型的参数θ看作数据，即，在训练过程中固定参数θ。
[0091]
因此，首先以数据集为初值初始化参数其中，为上一次生成的样本，且这意味着模型在之前生成的样本的基础上进一步实施数据增强。
[0092]
扰动样本的标准是其输入模型后将引起模型后验概率的扰动，因此数据增强的第一项目标函数为：
[0093][0094]
其中，且且代表原初始化数据集中样本的个数；公式(8)说明数据增强的目标函数与标准自学习的目标函数是对抗的，因此能同时得到完备的数据集和诊断模型。
[0095]
若数据增强过程只关注扰动性，则容易使后验概率偏差过大而生成无意义的样本，对样本生成过程加以限制是有必要的。因此，数据增强的第二项目标函数为
[0096][0097]
其中，u
1,
＝φf(xi)，λ》0为调节系数；参与优化意味着数据增强过程限制了过大的样本变化，但允许合理的样本多样性存在。
[0098]
数据增强过程最终的目标函数为：
[0099][0100]
其中，参数同样采用adam作为优化器，反向传播的迭代次数记为tg，学习率为εg；通过最小化参数数据集将转化为不同于其初始化数据集的扰动样本数据集。
[0101]
训练策略
[0102]
如图4所示，在标准自学习数据增强故障诊断方法中，标准自学习与数据增强过程交替进行，从而得到完备数据集和强非平稳工况下的智能故障诊断模型，具体训练流程如下：
[0103]
(1)初始化数据集并随机初始化模型参数θ0，设置超参数ts、tg、εs、εg、λ、r以及对抗循环r次以后模型的额外训练次数em，初始化r＝0。
[0104]
(2)基于训练数据集进行标准自学习，直至达到最大迭代次数ts，令r＝r+1，进而得到训练的模型参数θr。
[0105]
(3)采用模型数据化与样本参数化方法进行数据增强，利用数据集经过tg次迭代，生成新的扰动样本数据集
[0106]
(4)合并与组成新的训练集
[0107]
(5)判断是否达到最大循环次数r，如果r《，返回第(2)步。否则，基于训练集进行标准自学习直至达到额外训练次数em。
[0108]
(6)完成训练，获得完备数据集和具有最优参数集θ
r+1
的用于强非平稳工况下的故障诊断模型。
[0109]
步骤s3、将采集的待诊断振动信号，输入到训练好的智能故障诊断模型中，得到轴
承故障诊断结果。
[0110]
智能故障诊断模型的输出，是待诊断振动信号属于各个故障类型的后验概率，对概率进行排序，概率最高的故障类型，是最终的轴承故障诊断结果。
[0111]
通过实验及结果的分析，验证本发明所提出的一种基于标准自学习数据增强的故障诊断方法在强非平稳工况下的准确率。
[0112]
数据描述
[0113]
选用电机驱动的强非平稳工况轴承故障实验台进行验证实验，实验台与故障零件如图5所示。试验台由电动机、转速计、联轴器、轴承座、双盘转子组成；目标故障轴承为端部轴承，型号为nu205em，加速度传感器(pcb315a)放置于端部轴承座上；轴承预设三种单一故障：内圈故障(if)、滚动体故障(rf)和外圈故障(of)，以及一种复合故障：外圈与滚动体复合故障(orf)。电机转速范围为0～1500rpm，振动信号采用lms数据采集系统，以12.8khz采样频率采集。
[0114]
为验证所提方法的有效性，数据共包含以下三种形式的工况。
[0115]
(1)匀减速工况：电机由1500rpm匀减速至静止，此过程模拟实际运转中出现故障停机时采集到的不完备数据集，为本方法的训练数据。
[0116]
(2)强非平稳工况：此工况模拟实际运行中设备的强非平稳工况，转速变化情况如图6所示，作为验证本方法的测试数据，用tdr表示。
[0117]
(3)恒转速工况：恒转速样本的转速变化率为0，相对于强非平稳工况，其与训练样本的差异性更大，可以认为恒转速工况的样本全部为扰动样本；实验采集了800rpm、1000rpm和1500rpm转速下的数据(分别用td1、td2和td3表示)来测试生成数据的有效性。
[0118]
实验结果分析
[0119]
模型待定参数ts、tg、εs、εg、λ、r以及em分别预设置为100、100、0.01、1、1、10、2000；模型利用不完备训练数据集训练后，采用td1、td2、td3和tdr数据集进行测试。为了验证所提方法的有效性，采用与本方法1-d-cnn相同结构的1-d-cnn模型，仅使用训练样本进行训练并对测试数据进行诊断，作为对比，所得结果如图7所示。
[0120]
图7中可以看出，两种方法诊断td1、td2和td3数据集的诊断准确率明显小于诊断tdr的准确率，这是由于相比于训练数据集，恒转速数据集具有更多的扰动样本；尽管1-d-cnn与ssda在故障诊断过程中的模型结构完全相同，但两种方法的诊断结果有显著差距；1-d-cnn在诊断恒转速数据集时，准确率均不足90％，诊断强非平稳工况数据集时也仅有91.67％～92.54％的准确率；本发明所提出的ssda方法相比1-d-cnn，诊断恒转速数据集时，准确率提高了10％以上，对tdr的准确率提高到了98.55％～99.07％，这说明提出的方法能够生成扰动样本来扩充数据集使其更接近完备数据集。
[0121]
实施例二
[0122]
本实施例公开了一种基于标准自学习数据增强的故障诊断系统；
[0123]
如图8所示，一种基于标准自学习数据增强的故障诊断系统，包括模型构建模块、模型训练模块和故障诊断模块；
[0124]
模型构建模块，被配置为：基于一维卷积神经网络，构建故障诊断模型；
[0125]
模型训练模块，被配置为：通过标准自学习与数据增强的交叉对抗训练方式，对故障诊断模型进行训练，得到完备数据集和强非平稳工况下的智能故障诊断模型；
[0126]
故障诊断模块，被配置为：将采集的待诊断振动信号，输入到训练好的智能故障诊断模型中，得到轴承故障诊断结果。
[0127]
实施例三
[0128]
本实施例的目的是提供计算机可读存储介质。
[0129]
计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本公开实施例1所述的一种基于标准自学习数据增强的故障诊断方法中的步骤。
[0130]
实施例四
[0131]
本实施例的目的是提供电子设备。
[0132]
电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的程序，所述处理器执行所述程序时实现如本公开实施例1所述的一种基于标准自学习数据增强的故障诊断方法中的步骤。
[0133]
以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：安增辉张玉玺闫英珑王后亮
技术所有人：山东建筑大学
我是此专利的发明人

上一篇：基站、机器人的返航方法及机器人与流程
上一篇：一种可降解塑胶材料、可降解塑胶制品及其制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、邢老师：1.机械设计及理论 2.生物医学材料及器械 3.声发射检测技术。
2、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
3、王老师：1.机器人 2.嵌入式控制系统开发
4、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。