一种基于深度学习的滚动轴承故障诊断方法

文档序号:26232260发布日期:2021-08-10 16:33阅读:216来源:国知局
一种基于深度学习的滚动轴承故障诊断方法

本发明属于故障诊断技术领域,具体涉及一种基于深度学习的滚动轴承故障诊断方法。



背景技术:

故障诊断技术作为一种融合多种技术的综合性学科,为实现工业系统安全可靠运行提供了有效的技术支持。其主要目的在于探索研究如何对出现的各类故障进行检测、定位和识别。具体内容包括定位故障发生的部位、大小以及时间,识别故障类型等。现如今,仍有诸多学者致力于对该领域的探索研究,该领域一直是国内外研究热点之一。可以在早期及时准确的发现并识别系统中某些部分的故障,便于对出现的故障采取措施阻止其进一步展,避免出现较为严重的事故,进而延长工业设备的使用寿命和相应的工作周期。现如今,工业设备机理愈加复杂化,因此故障产生时,采集的故障信号往往受到各种复杂的甚至是未知的噪声干扰,这些故障信号通常呈现非线性、非平稳,动态不确定性变化等特性。采用传统的特征提取和诊断方法,通常难以从此类复杂信号中挖掘足够的特征信息用于精确诊断。其次,由于工业设备工作强度的提升以及工作环境恶劣程度的增加,涌现出的故障类型也来越多。面对这种复杂多样的故障分类问题,传统的故障诊断技术泛化能力受到限制。此外,实际运行中多数被诊断对象即工业设备是难以建立其精确的解析模型,所以依赖于对象精准数学模型的诊断方法无法很好对各种故障进行识别。



技术实现要素:

为解决现有实际运行中多数被诊断对象即工业设备是难以建立其精确的解析模型,所以依赖于对象精准数学模型的诊断方法无法很好对各种故障进行识别的问题;本发明的目的在于提供一种基于深度学习的滚动轴承故障诊断方法。

本发明的一种基于深度学习的滚动轴承故障诊断方法,它的诊断方法如下:

步骤一:卷积神经网络基本结构:

卷积神经网络是一种前馈神经网络,是深度学习领域具有代表性的网络结构之一;其实质是一种层次模型,由若干卷积层、池化层、非线性激活函数层以及全连接层组成;在网络结构中,卷积层、池化层以及非线性激活函数层通常组合在一起,输入数据通过多个这样的层层组合,实现从底层特征逐层抽取高层语义信息;之后经由一个或多个全连接层将各个通道提取的特征整合在一起,并映射到样本标记空间;卷积神经网络中一个重要思想就是“端到端”的学习方式,它将特征提取和分类器训练集成在网络体系结构中;整个学习过程完全不需要人为划分上述两个子问题,完全交给cnn模型直接学习从原始输入到期望输出的映射;

步骤二:基于stft和cnn的故障诊断方法:

通过该变换将一维的时序信号变换成同时包含时域与频域信息的二维矩阵;其用定长的窗口函数将时域信号进行截取,并用傅里叶变换分析截取的时域信号,得到时刻t附近非常小时间段上的局部频谱;在整个时间轴上不断平移窗函数最终得到一个局部频谱集合;

首先,通过stft将原始振动信号变换到时频域,得到样本的故障谱图。然后,将多个传感器的故障谱图拼接作为输入;

振动信号经过stft得到的故障谱图,描述了频率幅值随着时间变化的特性;基于故障谱图使用cnn进行建模,通过训练使其自动提取故障谱图中有用的故障特征并用于分类;需要保证训练过程中输入到诊断模型的单一类别的带标签样本数超过一定数量,采集的所有样本被分成训练样本集和测试样本集;训练集用于通过最小化预测状态和实际状态之间的误差来训练初始cnn模型;

步骤三:基于残差神经网络的故障诊断方法:

利用残差结构的特点,搭建了一个深度学习模型进行故障预测模型;该诊断方法包含两个流程:训练流程和诊断流程;直接利用原始数据,加以处理就可以进行训练和诊断,训练模型搭建好后,在相同场景下加载训练好的权重文件进行诊断;权重文件可以动态更新,即在当前的训练参数上重新进行训练,这样潜在的增加了模型的训练代数;当发现新的故障时,动态的训练模型,使模型日趋完善。模型的预测输出就是滚动轴承的故障类型;模型训练的时候,都是带有标签的数据,标签就是轴承的故障类型;这样,只要训练好模型,就无需依赖于操作人员的经验;另外,该诊断模型的深层网络结构,能够更好地表征轴承振动信号与轴承状态之间的复杂非线性关系;

步骤四:基于深度残差收缩网络的故障诊断方法:

在对样本进行分类的时候,样本中不可避免地会有一些噪声,更广义地讲,样本中包含着与当前分类任务无关的信息,这些信息理解为噪声;软阈值化可以通过公式(1)来实现:

x表示输入特征,y表示输出特征,α表示阈值。在这里,阈值需要是一个正数,并且不能太大;

深度残差收缩网络是在残差模块里多了一个小型的子网络;这个子网络的作用就是自适应地设置阈值;子网络所设置的阈值,其实就是输入特征绝对值的平均值×一个系数α;α是一个0和1之间的数字;

阈值是在深度体系结构中自动学习的,在深度架构中将软阈值作为收缩功能进行集成减少与噪声相关的功能,从而使最终层的高级功能变得更具区分性。

与现有技术相比,本发明的有益效果为:

一、通过stft和cnn相结合的故障诊断方法,利用stft对轴承震动信号加以处理,并作为cnn识别对象,进而得到诊断模型。

二、利用轴承故障数据集对所提方法的分类效果进行了验证。

附图说明

为了易于说明,本发明由下述的具体实施及附图作以详细描述。

图1为本发明中卷积神经网络结构示意图;

图2为本发明中基于stft和cnn的故障诊断方法流程图;

图3为本发明中残差块结构示意图;

图4为本发明中残差神经网络诊断方法流程图;

图5为本发明中深度残差收缩网络模型图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明了,下面通过附图中示出的具体实施例来描述本发明。但是应该理解,这些描述只是示例性的,而并非要限制本发明的范围。本说明书附图所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容能涵盖的范围内。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。

在此,还需要说明的是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的结构和/或处理步骤,而省略了与本发明关系不大的其他细节。

本具体实施方式采用以下技术方案:它的诊断方法如下:

步骤一:卷积神经网络(cnn)基本结构:

卷积神经网络(cnn)是一种前馈神经网络,是深度学习领域具有代表性的网络结构之一。其实质是一种层次模型,由若干卷积层、池化层、非线性激活函数层以及全连接层组成。在网络结构中,卷积层、池化层以及非线性激活函数层通常组合在一起,输入数据通过多个这样的层层组合,实现从底层特征逐层抽取高层语义信息。之后经由一个或多个全连接层将各个通道提取的特征整合在一起,并映射到样本标记空间。卷积神经网络(cnn)中一个重要思想就是“端到端”的学习方式,它将特征提取和分类器训练集成在网络体系结构中。整个学习过程完全不需要人为划分上述两个子问题,完全交给cnn模型直接学习从原始输入到期望输出的映射。如图1给出了典型的cnn网络结构图。

步骤二:基于stft和cnn的故障诊断方法:

短时傅里叶变换(stft)是研究时变、非平稳信号的有力工具,作为一种时频分析方法在信号分析中起到至关重要的作用。通过该变换可以将一维的时序信号变换成同时包含时域与频域信息的二维矩阵。其基本思想是用定长的窗口函数将时域信号进行截取,并用傅里叶变换分析截取的时域信号,得到时刻t附近非常小时间段上的局部频谱。在整个时间轴上不断平移窗函数最终得到一个局部频谱集合。

cnn没有强制要求输入数据的形式,即使是原始的振动信号同样也可以作为cnn的输入。但是,采取一定的方法对输入数据进行预处理一定程度上可以提升诊断精度,如对数据进行随机裁剪、水平翻转等方式进行增强或者使用傅里叶变换、s变换等方法进行时域、频域、时频域之间的转换。首先使用stft将原始一维故障信号变换到时频域以获得故障信号的时频特性,并将变换后的结果称为故障谱图。故障谱图描述了信号频率与时间的相互关系。现在提出一种完备样本下基于stft和cnn的故障诊断方法,可实现“端到端”的故障模式识别。图3展示了所提方法的流程图。首先,通过stft将原始振动信号变换到时频域,得到样本的故障谱图。然后,将多个传感器的故障谱图拼接作为输入。

振动信号经过stft得到的故障谱图,描述了频率幅值随着时间变化的特性。但该时频特性依然满足不了分类识别的要求,需要进一步提取具有区分性的判别特征。因此要基于故障谱图使用cnn进行建模,通过训练使其自动提取故障谱图中有用的故障特征并用于分类。需要保证训练过程中输入到诊断模型的单一类别的带标签样本数超过一定数量,采集的所有样本被分成训练样本集和测试样本集。训练集用于通过最小化预测状态和实际状态之间的误差来训练初始cnn模型。如图2所示。

步骤三:基于残差神经网络的故障诊断方法:

神经网络增加深度有利于实现更高级的分类任务,但是增加网络深度的时候,出现了一个问题:网络是不是简单的层级堆叠就可以,神经网络层数比较高时,就很难被训练,实际上在增加网络深度的时候,会出现退化问题,即随着网络深度的增加,训练的过程中准确率先到达一个最大值,之后会不断退化。出现梯度爆炸、梯度消失等问题。

残差网络就是一种跳跃连接的网络,它通过将前面的激活值跳过中间的网络层而直接传到更后面的网络中,来避免梯度爆炸和梯度消失,训练更深的网络。何恺明团队提出的残差神经网络(residualnetwork,resnet)。通过引入浅层网络的权值来弥补深层网络的权值梯度弥散的问题。深度卷积神经网络的发展,为图像分类、目标识别领域带来了很多突破。深度卷积神经网络采用端到端的方式。并通过控制网络深度实现了从低端到高端的分类模型。通过大量的实验表明,网络深度对于cnn十分重要。在实现非常复杂的分类任务的时候,往往更深层次的网络结构有更优秀的表现。相对于一般的卷积神经网络,残差神经网络增加了一层恒等映射x。

恒等映射层的引入可以让网络随深度增加而不退化。在引入残差层的神经网络,一个残差块的输出h(x)=f(x)+x。实际情况下,残差块可以有多种方式实现浅层到深层的映射,但在不同的场景,选取的映射方法不一定是最有效的,因此实现的时候可以尝试不同的映射来比较、优化。采用了恒等映射,既没有引入额外的参数,也没有提高计算的复杂度。这是非常重要的一点,因为这使得resnet即兼顾了普通网络的计算复杂度又提高了分类预测效果,这也是resnet在现在深度学习算法中广泛应用的一个非常重要的原因。resnet在输入和输出层之间引入恒等映射,显著的加深网络结构,从而提高训练的效果。如图3所示。

利用残差结构的特点,搭建了一个深度学习模型进行故障预测模型。该诊断方法包含两个流程:训练流程和诊断流程。直接利用原始数据,加以处理就可以进行训练和诊断,训练模型搭建好后,在相同场景下都可以加载训练好的权重文件进行诊断。权重文件可以动态更新,即在当前的训练参数上重新进行训练,这样潜在的增加了模型的训练代数。当发现新的故障时,动态的训练模型,使模型日趋完善。模型的预测输出就是滚动轴承的故障类型。模型训练的时候,都是带有标签的数据,标签就是轴承的故障类型。这样,只要训练好模型,就无需依赖于操作人员的经验。另外,该诊断模型的深层网络结构,能够更好地表征轴承振动信号与轴承状态之间的复杂非线性关系。

步骤四:基于深度残差收缩网络的故障诊断方法:

深度残差收缩网络(deepresidualshrinkagenetworks,drsn)是残差网络(residualnetworks)的一种改进形式。顾名思义,深度残差收缩网络,就是对“残差网络”的“残差路径”进行“收缩(软阈值化)”的一种网络。深度残差收缩网络面向的是带有“噪声”的信号,将“软阈值化”作为“收缩层”引入残差模块之中。

在对样本进行分类的时候,样本中不可避免地会有一些噪声,更广义地讲,样本中很可能包含着与当前分类任务无关的信息,这些信息也可以理解为噪声。这些噪声可能会对分类效果产生不利的影响。软阈值化可以通过公式(1)来实现:

x表示输入特征,y表示输出特征,α表示阈值。在这里,阈值需要是一个正数,并且不能太大。如果阈值比所有的输入特征的绝对值都大,那么输出特征y就只能为零。这样的话,软阈值化就没有了意义。

深度残差收缩网络是在残差模块里多了一个小型的子网络。这个子网络的作用就是自适应地设置阈值。通过仔细观察这个子网络,可以发现,这个子网络所设置的阈值,其实就是(输入特征绝对值的平均值)×(一个系数α)。α是一个0和1之间的数字。在这种方式下,阈值不仅是一个正数,而且不会太大,即不会使输出全部为零。如图5所示。

阈值是在深度体系结构中自动学习的,而不是由专家手动设置的,在深度架构中将软阈值作为收缩功能进行集成可以减少与噪声相关的功能,从而使最终层的高级功能变得更具区分性。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。

此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1