基于卷积神经网络代价敏感学习的故障诊断方法及系统与流程

文档序号：21273236发布日期：2020-06-26 23:04阅读：471来源：国知局

本公开涉及机械设备故障诊断技术领域，特别是涉及一种基于卷积神经网络代价敏感学习的故障诊断方法及系统。

背景技术：

本部分的陈述仅仅是提供了与本公开相关的背景技术信息，不必然构成在先技术。

目前对故障诊断的研究已经非常广泛，但是仍然存在一些问题。比如轴承周期性的滚动使得故障具有周期性的特征，同时由于某个时间节点发生故障对后续的状态产生影响，不同周期往往还具有相关性等。故障诊断的问题可以归结为一个分类问题，但在分类前需要将获得的机械振动信号转提取为相应的机器学习模型可以使用的特征向量，特征的提取需要先验经验额外的处理，因此故障特征的提取也是故障诊断研究中一直存在的问题。

此外数据不平衡也是其中的一个明显的问题。故障诊断的数据不平衡问题体现在故障数据相对于正常数据偏少，同时不同的故障的发生频率也会有很大的区别，这使得不同类别的故障数据在数量上是差别很大的。由于深度学习是数据驱动的，在各个类别的训练数据有明显的不平衡特征时，训练得到的模型会倾向于把小样本类别的样例错分为多样本的类别，或者小样本的类别会被直接忽略。例如，假设有99％的样例属于正常的类别，有1％的样例属于异常类别，即使把异常类别全部划分为正常的类别，最后评价分类器的分类准确率仍然高达99％。在现实应用中，那些数据量缺乏的、出现频率低的类别往往是最需要重视的类别。

基于此，发明人认为，在故障诊断中，应该考虑故障发生概率相对较低的类别的分类精度，而且现有故障诊断技术中，常规的默认不同类型的数据拥有相同的权重的处理方式，不能够对低频率的类别进行精确分类，往往会出现得到的模型各种指标优秀但实用性却很差的问题。其次，发明人还发现现有技术至少存在数据不平衡、特征提取需要专家经验以及潜在特征挖掘不充分的问题。

技术实现要素：

为了解决上述问题，本公开提出了一种基于卷积神经网络代价敏感学习的故障诊断方法及系统，对机械振动数据进行维度转换，转换为应用于卷积神经网络的二维数据；构建添加代价敏感层的卷积神经网络模型，采用代价敏感学习方法进行特征学习，利用卷积神经网络模型直接完成特征提取任务，在不损害多样本类别的分类精度的情况下提高了小样本类别的分类精度。

为了实现上述目的，本公开采用如下技术方案：

第一方面，本公开提供一种基于卷积神经网络代价敏感学习的故障诊断方法，包括：

构建添加代价敏感层的卷积神经网络模型，采用代价敏感学习方法对机械振动训练数据集进行特征学习；

所述卷积神经网络模型采用vgg-11级联两层全连接层，经特征学习后的卷积神经网络模型以vgg-11对经维度转换的机械振动预分类数据集进行特征提取，将提取的特征输入全连接层进行故障诊断分类。

第二方面，本公开提供一种基于卷积神经网络代价敏感学习的故障诊断系统，包括：

特征学习模块，被配置为构建添加代价敏感层的卷积神经网络模型，采用代价敏感学习方法对机械振动训练数据集进行特征学习；

特征提取与分类模块，被配置为所述卷积神经网络模型采用vgg-11级联两层全连接层，经特征学习后的卷积神经网络模型以vgg-11对经维度转换的机械振动预分类数据集进行特征提取，将提取的特征输入全连接层进行故障诊断分类。

与现有技术相比，本公开的有益效果为：

1、本公开在不损害多样本类别的分类精度的情况下提高小样本类别的分类精度，实现代价敏感学习在多分类故障诊断上的应用，解决故障诊断中存在的数据不平衡的问题。

2、本公开使用cnn直接完成故障诊断特征提取任务，应用深度学习中特征学习的原理应用预训练好的vgg完成故障数据的特征提取，解决在故障诊断特征提取环节需要专家经验的问题。

3、本公开采用错位时序堆叠的方法把时序振动信号转换为二维图像数据，一方面充分的利用机械振动数据中存在的潜在特征，另一方面方便卷积网络进行后续的处理，解决机械故障数据潜在特征挖掘不充分的问题。

附图说明

构成本公开的一部分的说明书附图用来提供对本公开的进一步理解，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。

图1为本公开实施例1提供的基于卷积神经网络代价敏感学习的故障诊断方法；

图2为本公开实施例1提供的振动信号维度转换示意图；

图3为本公开实施例1提供的代价敏感学习方法示意图。

具体实施方式：

下面结合附图与实施例对本公开做进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本公开提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本公开的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

实施例1

如图1所示，本实施例提供一种基于卷积神经网络代价敏感学习的故障诊断方法，包括：

s1：将机械振动预分类数据集进行维度转换；

s2：构建添加代价敏感层的卷积神经网络模型，采用代价敏感学习方法对机械振动训练数据集进行特征学习；

s3：所述卷积神经网络模型采用vgg-11级联两层全连接层，经特征学习后的卷积神经网络模型以vgg-11对经维度转换的机械振动预分类数据集进行特征提取，将提取的特征输入全连接层进行故障诊断分类。

所述步骤s1中，如图2所示，采用错位时间序列方法将机械振动预分类数据集的一维的时序信号转化为m×n的二维二维图像数据。其中具体操作为堆叠m个长度为n的时序片段；

即从原始信号上截取m个长度为n的信号片段，n的选择以周期的整数倍为宜，取决于采样频率的不同，而取不同的倍数；

k的值决定了m个片段彼此之间的距离，第一个片段和第二个片段相距1k，第二个片段同第三个片段相距2k，依次类推，k的选择小于m，一般为n的一半或2/3；

参数m的选择取决相对较简单可以参考原始信号长度以及n与k的值确定并保证尽可能充分使用原始信号。

错位堆叠的方法与普通的灰度化堆叠的方法相比，更能充分的利用机械振动信号中存在的关联特征，使用原始的振动数据同使用小波变换等方法得到二维时频图的方法更为简单。

所述步骤s2中，如图3所示，相比于一般的cnn分类问题，代价敏感学习的方法是将卷积神经网络在最后的输出层添加一层代价敏感层，并使用相应的训练算法得到代价敏感层的参数，代价敏感层的参数构成代价敏感矩阵，代价敏感矩阵的基本原理是给不同的错误分类赋予不同的代价，每个样例的最后分类结果则用贝叶斯决策选择代价期望值最小的类别。

训练方法：由于传统的代价敏感学习的代价敏感矩阵是通过先验的经验预先设定的，在本实施例中代价敏感矩阵是在网络训练的过程中自动学习的，代价敏感学习的主要优势在于不需要预先指定代价而可以在神经网络的训练中自动学习，其学习的目标是为了使得综合的分类精度能够达到最大。为了实现代价敏感矩阵的自动学习，训练过程中让原始网络同代价矩阵分步训练，具体为：

(1)代价敏感层的误差函数为：

其中，d⁽ⁱ⁾代表第i个样例的真实类别向量；代表第i个样例经过网络预测得到的分类向量；m代表数据集的样本数量；θ为代价敏感层的参数；l(·)为代理误差函数；ξ为代价敏感矩阵。

(2)代理误差函数l(·)采用的是交叉熵函数：

其中，dn满足σndn＝1是每个样本的标签向量的分量，yn是前一层的神经元输出被代价层修改后的值，n代表输出向量或标签向量的第n维，p则是一个样本的真实类别满足k则代表了所有类别的代号k∈[1,n]其中ξp,k代表本来为p样本错分为k类的代价，其中ok同on分别代表没有经过代价层修改的输出层第k维与第n维度输出。

(3)cnn网络的训练，为了优化代价敏感网络的参数θ，保持代价敏感矩阵的参数值不变，参数θ的值按照普通网络的反向传播算法来优化。

(4)自动优化代价敏感矩阵ξ：控制cnn网络的参数θ不变，采用误差函数通过误差反向传播算法优化代价矩阵ξ。

学习的目标是使得误差函数最小，所述误差函数为：

其中，矩阵s代表类间可分性矩阵，矩阵r是分类误差的混淆矩阵，其中每个元素都计算为分类的正确率，eval(θ,ξ)代表在当前参数下在验证集上取得的错误率，h是根据样本分布频率直方图获得的矩阵详细定义见下述说明，参数u1σ1、u1σ1代表为了求s与r在验证集上取的两个小验证集在10次验证后求得的错误率的均值和方差。

矩阵元素sp,q代表类别p同类别q的类间可分性：

其中，n′代表属于类别p的样本数量，fi代表属于类别p的一个样例，distintrann(fi)代表在类别p中同样例fi距离最近的样例间距离，distintrann(fi)代表在类别q中的样例同样例fi距离的最小值。

矩阵h的定义如下：

其中，矩阵h是样本的类别分布直方图向量，c代表了数据集中所有类别的集合。

(5)学习参数θ与参数ξ使用如下的算法进行训练：输入训练集(x,d)和验证集(xv,dv)，初始化最大迭代次数mep,参数θ的学习率γθ以及ξ的学习率γξ；输出经过最优的参数θ与参数ξ。

具体为：(a)构建卷积神经网络模块，初始化网络参数θ，网络的前十层使用预训练的vgg-11初始化，后面的全连接层使用xavier初始化；

(b)初始化代价矩阵ξ的元素为1；

(c)固定网络计算ξ的梯度，更新矩阵ξ的值，给定网络正向传播，更新网络的参数θ，并进行迭代操作；

(d)使用验证集计算验证集误差，如果验证集上的误差反而增加了，降低代价矩阵的学习率，输出经过最优的参数θ与参数ξ。

所述步骤s3中，卷积神经网络模型采用预训练的vgg-11级联两层全连接层，vgg-11提取的4096维特征送入全连接层完成最后的分类任务。

vgg是在ilsvrc竞赛中表现优异的一种经典cnn结构，其可以完成多达1000多类的的图像分类任务，vgg-11是其中最小的一种结构且性能优异。

vgg-11的前10层提取的是一个4096维度的向量，由于其能够在百万级的不相关图像数据和多达1000类的分类任务上取得成功，vgg-11预训练的结构得到的4096维度向量能够充分的代表任一个图像的特征，因此本实施例使用在ilsvrc中训练好的vgg-11级联两层全连接层的结构完成故障诊断任务。

本实施例使用数据不平衡分类中的经典评价指标g-mean与f-measure，并扩展到多类别的分类领域，其中，

由于g-mean的定义有多种，本实施例使用：

在使用cwru与parderborns数据集在控制不平衡比不断提高的情况下分类精度和g-mean等指标保持稳定，而相同情况下不使用代价敏感学习的结构下降明显。

实施例2

本实施例提供一种基于卷积神经网络代价敏感学习的故障诊断系统，包括：

特征学习模块，被配置为构建添加代价敏感层的卷积神经网络模型，采用代价敏感学习方法对机械振动训练数据集进行特征学习；

本实施例使用cnn直接完成故障诊断特征提取任务，应用预训练好的vgg完成故障数据的特征提取，在不损害多样本类别的分类精度的情况下提高小样本类别的分类精度，实现代价敏感学习在多分类故障诊断上的应用，解决故障诊断中存在的数据不平衡以及特征提取环节需要专家经验的问题。

以上仅为本公开的优选实施例而已，并不用于限制本公开，对于本领域的技术人员来说，本公开可以有各种更改和变化。凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

上述虽然结合附图对本公开的具体实施方式进行了描述，但并非对本公开保护范围的限制，所属领域技术人员应该明白，在本公开的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李沂滨;胡晓平;高辉;宋艳;张天泽;王代超
技术所有人：山东大学
我是此专利的发明人

上一篇：一种曝光时间的确定方法、装置与流程
上一篇：一种独立式的医用手指复健指套的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。