基于二项对抗表征学习的二值化故障特征自适应挖掘与诊断方法

文档序号:33119084发布日期:2023-02-01 03:21阅读:28来源:国知局
基于二项对抗表征学习的二值化故障特征自适应挖掘与诊断方法

1.本发明涉及一种基于二项对抗表征学习的二值化故障特征自适应挖掘与诊断方法。


背景技术:

2.随着科学技术水平的进步,机械设备变得越来越复杂,且通常在复杂或恶劣条件下运行。一旦发生故障,设备可能无法完成规定的任务,甚至可能造成灾难性的事故,造成经济损失和人员伤亡。
3.机械故障诊断技术可以利用测量数据,提取关键故障特征,从而识别机械运行过程中的健康状况,是保证工业系统可靠性和安全性的有效手段。然而,在大数据时代,如何从大量的监测数据中挖掘出对故障诊断有用的信息,成为亟待研究的问题。基于数据驱动的故障诊断方法建立了监测数据与机械健康状态之间的映射关系,然后实现对不同故障模式的判别。因此,数据驱动的机械故障诊断方法已经成为热门的研究方向。
4.数据驱动的故障诊断方法一般流程包括数据预处理、特征提取和健康状态分类。其中,特征提取的质量是影响故障诊断性能的关键因素。特征提取方法包括人工特征提取和自适应特征提取。相较于人工特征提取方法,自适应特征提取方法能够自动从原始信号中提取可以表征健康状态信息的特征向量,不依赖专家知识,因此在机械故障诊断中得到了更为广泛的应用。
5.近年来,深度学习(deep learning,dl)方法因其强大的表征学习和非线性映射能力而被广泛用于故障特征提取和故障诊断任务。基于dl的故障诊断方法缓解了传统人工特征提取对专家知识的依赖,能够实现自适应的表征学习。然而,现有的基于dl的故障诊断表征学习方法有以下两个问题。
6.1)大多数基于dl的表征学习方法可被视为黑箱,其学习过程是不可控的。因此,可能会面临学习到的表征质量低和训练数据过拟合等问题。
7.2)dl模型的良好性能依赖于足够多的训练数据。因此,当训练数据不足时,会出现过拟合现象,诊断性能会不可避免地出现显著下降。


技术实现要素:

8.为克服上述问题,本发明提供一种基于二项对抗表征学习的二值化故障特征自适应挖掘与诊断方法。
9.本发明提供的一种基于二项对抗表征学习的二值化故障特征自适应挖掘与诊断方法,包括以下步骤:根据机械在各种健康状态下原始振动信号,得到所述机械在各种健康状态下的标准化振动信号及对应的真实健康状态标签;利用从二项分布中抽样得到的二项对抗样本、所述机械的标准化振动信号及对应的真实健康状态标签,以生成-判别学习机制对自动编码器中的用于二项对抗表征学习的二项表征编码器进行无监督对抗训练,得到能
够从所述机械的原始振动信号中学习服从二项分布的表征向量的二项表征编码器,作为机械故障诊断的二值化故障特征提取器;通过将所述二项表征编码器与全连接分类网络串联,形成初始的机械故障诊断分类器;利用所述机械在各种健康状态下的标准化振动信号及对应的真实健康状态标签,对所述初始的机械故障诊断分类器进行有监督微调,得到实用的机械故障诊断分类器;利用所述实用的机械故障诊断分类器,对待诊断机械进行故障诊断。
10.优选地,所述获取机械在各种健康状态下的标准化振动信号及对应的真实健康状态标签包括:收集所述机械在各种健康状态下原始振动信号,所述各种健康状态包括正常状态和各种故障状态;按固定的窗口长度,将所述原始振动信号切分成互不重叠的多个信号片段;将每个信号片段进行标准化处理,得到每个标准化振动信号;根据每个标准化振动信号对应的原始振动信号的健康状态,为每个标准化振动信号添加所述机械的真实健康状态标签。
11.优选地,所述利用从二项分布中抽样得到的二项对抗样本、所述机械的标准化振动信号及对应的真实健康状态标签,以生成-判别学习机制对自动编码器中的用于二项对抗表征学习的二项表征编码器进行无监督对抗训练,得到能够从所述机械的原始振动信号中学习服从二项分布的表征向量的二项表征编码器,作为机械故障诊断的二值化故障特征提取器包括:利用所述自动编码器中的二项表征编码器对所述机械的标准化振动信号进行编码,得到表征向量,并利用所述自动编码器中的解码器对所述表征向量进行解码,得到重构信号;利用用来辨识二项分布的二项判别器,对所述表征向量和所述二项对抗样本进行是否服从二项分布的判别,得到二项判别结果;根据所述机械的标准化振动信号和所述重构信号,确定重构损失;根据所述表征向量和所述二项判别结果,确定二项损失;不断调整所述二项表征编码器的参数、所述解码器的参数和所述二项判别器的参数,直至所述重构损失和所述二项损失最小或稳定,并将所述重构损失和所述二项损失最小或稳定时的二项表征编码器作为机械故障诊断的二值化故障特征提取器。
12.优选地,所述利用用来辨识二项分布的二项判别器,对所述表征向量和所述二项对抗样本进行是否服从二项分布的判别,得到二项判别结果包括:将所述表征向量输入至所述二项判别器,以使所述二项判别器判别所述表征向量是否服从二项分布,得到所述表征向量的二项判别结果;将所述二项对抗样本输入至所述二项判别器,以使所述二项判别器判别所述二项对抗样本是否服从二项分布,得到所述二项对抗样本的二项判别结果。
13.优选地,所述根据所述表征向量和所述二项判别结果,确定二项损失包括:根据所述表征向量和所述二项对抗样本的二项判别结果,确定所述二项判别器的二项损失;根据所述表征向量的二项判别结果,确定所述自动编码器的二项损失。
14.优选地,所述不断调整所述二项表征编码器的参数、所述解码器的参数和所述二项判别器的参数,直至所述重构损失和所述二项损失最小或稳定包括:根据所述二项判别器的二项损失和所述自编码器的二项损失调整所述二项判别器的参数;根据所述重构损失、所述二项判别器的二项损失和所述自编码器的二项损失调整所述自动编码器的参数;交替执行上述二个步骤,直至所述重构损失、所述二项判别器的二项损失和所述自编码器的二项损失最小或稳定。
15.优选地,所述全连接分类网络包括全连接层和softmax分类层。
16.优选地,所述利用所述机械在各种健康状态下的标准化振动信号及对应的真实健康状态标签,对所述初始的机械故障诊断分类器进行有监督微调,得到实用的机械故障诊断分类器包括:将所述机械在各种健康状态下的标准化振动信号输入至所述初始的机械故障诊断分类器,得到所述初始的机械故障诊断分类器输出的分类结果;不断调整所述初始的机械故障诊断分类器的参数,使输出的分类结果与输入的标准化振动信号对应的真实健康状态标签之间的交叉熵损失最小;将交叉熵损失最小时的机械故障诊断分类器作为所述实用的机械故障诊断分类器。
17.优选地,所述利用所述实用的机械故障诊断分类器,对待诊断机械进行故障诊断包括:获取所述待诊断机械的原始振动信号,并将其处理为标准化振动信号;将所述标准化震动信号输入至所述实用的机械故障诊断分类器,由所述实用的机械故障诊断分类器对所述标准化振动信号进行特征提取和故障诊断分类,得到所述待诊断机械的健康状态。
18.本发明提供的一种基于二项对抗表征学习的二值化故障特征自适应挖掘与诊断方法,其自适应故障表征学习机制可控,诱导表征空间落在较好的先验分布上,从而实现在训练数据不足的情况下,提高故障表征的鲁棒性和泛化能力。
附图说明
19.图1是本发明提供的基于二项对抗表征学习的二值化故障特征自适应挖掘与诊断方法的流程图;
20.图2是本发明提供的基于barl的机械故障诊断模型训练过程图;
21.图3是本发明提供的基于barl的机械故障诊断模型结构图;
22.图4是本发明提供的cwru数据集上四种方法的nc-index图。
具体实施方式
23.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特有的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
24.考虑到背景技术中提到的问题,本发明提出了一种用于机械故障诊断的二项式对抗表征学习(binomial adversarial representation learning,barl)方法,该方法将自动编码器(autoencoder,ae)和对抗学习结合起来,从机械的原始振动信号中学习服从二项分布的表征向量。一方面,对抗学习机制迫使模型学习到的表征空间落在先验分布上,这样就能够以可控的方式学习到更好的故障表征。另一方面,二项分布更容易使表征向量具有小的类内距离(intra-class distances,icd)和大的类间距离(cross-class distances,ccd),从而提高下游的机械故障诊断任务的鲁棒性和泛化能力,特别是在训练数据不足的条件下。
25.参见图1,本发明提供了一种基于二项对抗表征学习的二值化故障特征自适应挖掘与诊断方法,所述方法可以包括以下步骤:
26.步骤s101:根据机械在各种健康状态下原始振动信号,得到所述机械在各种健康状态下的标准化振动信号及对应的真实健康状态标签。
27.收集机械在各种健康状态下原始振动信号,所述各种健康状态包括正常状态和各
种故障状态,然后按固定的窗口长度,将所述原始振动信号切分成互不重叠的多个信号片段,并将每个信号片段进行标准化处理,得到每个标准化振动信号,根据每个标准化振动信号对应的原始振动信号的健康状态,为每个标准化振动信号添加所述机械的真实健康状态标签。
28.步骤s102:利用从二项分布中抽样得到的二项对抗样本、所述机械的标准化振动信号及对应的真实健康状态标签,以生成-判别学习机制对自动编码器中的用于二项对抗表征学习的二项表征编码器进行无监督对抗训练,得到能够从所述机械的原始振动信号中学习服从二项分布的表征向量的二项表征编码器,作为机械故障诊断的二值化故障特征提取器。
29.具体地说,利用所述自动编码器中的二项表征编码器对所述机械的标准化振动信号进行编码,得到表征向量,并利用所述自动编码器中的解码器对所述表征向量进行解码,得到重构信号;利用用来辨识二项分布的二项判别器,对所述表征向量和所述二项对抗样本进行是否服从二项分布的判别,得到二项判别结果;根据所述机械的标准化振动信号和所述重构信号,确定重构损失;根据所述表征向量和所述二项判别结果,确定二项损失;不断调整所述二项表征编码器的参数、所述解码器的参数和所述二项判别器的参数,直至所述重构损失和所述二项损失最小或稳定,并将所述重构损失和所述二项损失最小或稳定时的二项表征编码器作为机械故障诊断的二值化故障特征提取器。
30.其中,所述利用用来辨识二项分布的二项判别器,对所述表征向量和所述二项对抗样本进行是否服从二项分布的判别,得到二项判别结果包括:将所述表征向量输入至所述二项判别器,以使所述二项判别器判别所述表征向量是否服从二项分布,得到所述表征向量的二项判别结果;将所述二项对抗样本输入至所述二项判别器,以使所述二项判别器判别所述二项对抗样本是否服从二项分布,得到所述二项对抗样本的二项判别结果。
31.其中,所述根据所述表征向量和所述二项判别结果,确定二项损失包括:根据所述表征向量和所述二项对抗样本的二项判别结果,确定所述二项判别器的二项损失;根据所述表征向量的二项判别结果,确定所述自动编码器的二项损失。
32.其中,所述不断调整所述二项表征编码器的参数、所述解码器的参数和所述二项判别器的参数,直至所述重构损失和所述二项损失最小或稳定包括:根据所述二项判别器的二项损失和所述自编码器的二项损失调整所述二项判别器的参数;根据所述重构损失、所述二项判别器的二项损失和所述自编码器的二项损失调整所述自动编码器的参数;交替执行上述二个步骤,直至所述重构损失、所述二项判别器的二项损失和所述自编码器的二项损失最小或稳定。
33.步骤s103:通过将所述二项表征编码器与全连接分类网络串联,形成初始的机械故障诊断分类器。
34.所述全连接分类网络包括全连接层和softmax分类层。
35.步骤s104:利用所述机械在各种健康状态下的标准化振动信号及对应的真实健康状态标签,对所述初始的机械故障诊断分类器进行有监督微调,得到实用的机械故障诊断分类器。
36.具体地说,将所述机械在各种健康状态下的标准化振动信号输入至所述初始的机械故障诊断分类器,得到所述初始的机械故障诊断分类器输出的分类结果;不断调整所述
初始的机械故障诊断分类器的参数,使输出的分类结果与输入的标准化振动信号对应的真实健康状态标签之间的交叉熵损失最小;将交叉熵损失最小时的机械故障诊断分类器作为所述实用的机械故障诊断分类器。
37.步骤s105:利用所述实用的机械故障诊断分类器,对待诊断机械进行故障诊断。
38.具体地说,获取所述待诊断机械的原始振动信号,并将其处理为标准化振动信号;将所述标准化震动信号输入至所述实用的机械故障诊断分类器,由所述实用的机械故障诊断分类器对所述标准化振动信号进行特征提取和故障诊断分类,得到所述待诊断机械的健康状态。
39.本发明提出一种可控的自适应故障表征学习机制,诱导表征空间落在较好的先验分布上,从而实现在训练数据不足的情况下,提高故障表征的鲁棒性和泛化能力。ae是一个很好的基于dl的表征学习架构;对抗学习可以通过生成-判别学习机制迫使网络学习的表征接近某个先验分布。因此,可以将ae模型与对抗学习机制相结合,从而控制ae的表征学习过程。二项分布的值只能是0或1,它本身具有稀疏性的优势。与高斯分布等连续分布相比,二项分布的二值化特点(非0即1)使得不同健康状态的表征在表征空间中更容易分离得更远,从而使不同健康状态特征之间很难出现交叠。因此,在训练数据不足的情况下,二项分布是一个适合于鲁棒故障表征学习的分布。
40.下面结合图2和图3进行详细说明。
41.基于barl的机械故障诊断模型训练过程如图2所示,包括数据预处理、无监督对抗训练和有监督微调三个阶段。这三个阶段的具体执行过程如下。
42.阶段一:数据预处理
43.首先,收集每种健康状态(包括健康和所有故障模式)下的振动信号。为了降低样本复杂度并增加输入网络的样本数量,将原始振动信号按固定的窗口长度切分成多个片段。然后,所有的片段都被标准化为-1到1。标准化的样本及其标签是barl的输入数据,这里的n
t
是训练集中的样本数量。其中,xi是标准化的样本,yi是真实健康状态标签。
44.阶段二:无监督对抗训练
45.在无监督对抗训练阶段,交替执行两个并行的训练分支:一个是自动编码器训练分支,另一个是二项判别器(或称判别器)训练分支。自动编码器部分由二项表征编码器和解码器组成,判别器用来区分输入的表征向量是否服从二项分布。模型结构如图3所示。
46.首先执行前向传播过程。输入信号xi被输入到二项表征编码器后,经过卷积层(conv)、批归一化层(bn)、扁平层(flatten)和全连接层(fc)的处理,被编码为表征向量hi=bienc(xi),其中bienc(
·
)是由二项表征编码器表达的非线性函数映射。解码器通过转置卷积层(transconv)将hi进行解码,得到重构信号其中dec(
·
)是由解码器表达的非线性函数映射。同时,从二项分布b~b(n,p)中抽样得到二项对抗样本bi,其中n是二项式向量bi的维度,p是每个维度值为1的概率。也就是说,bi中各维度的值按概率p服从伯努利分布。将编码器输出的表征向量hi和二项对抗样本向量bi输入二项判别器,经过fc层和sigmoid输出层的处理后,得到判别结果d(hi)和d(bi)。
47.结合各部分模型的学习目标,损失函数可以写成以下形式。
48.二项判别器试图区分输入向量是否为真实的从二项分布中采样得到的向量。因此,判别器的二项损失函数为:
[0049][0050]
其中nb和nh分别是同一批次样本中的二项向量和表征向量的数量。
[0051]
自编码器的重构损失为:
[0052][0053]
其中ns为输入的振动信号样本数量,ns=nh。
[0054]
二项表征编码器与二项判别器互相博弈,并尝试从输入信号中学习服从二项分布的表征向量。因此,编码器的二项损失为:
[0055][0056]
二项判别器、二项表征编码器和解码器中的可训练参数分别表示为θd、θ
bienc
和θ
dec
。则模型三个部分的优化目标分别是:
[0057][0058][0059][0060]
根据上述优化目标,二项判别器、二项表征编码器和解码器的参数交替更新,直到损失值稳定,达到纳什均衡状态。
[0061]
阶段三:有监督微调
[0062]
经过阶段二的无监督对抗训练之后,训练得到的二项表征编码器可以从输入的振动信号中学习关键特征,并将输入信号转换为服从二项分布的表征向量。因此,将自动编码器中的二项表征编码器提取出来,作为机械故障诊断模型的特征提取器;并在其之后接入全连接层和softmax分类层,组成完整的故障诊断分类器。这一完整故障诊断分类器所表达的非线性函数映射记为c(
·
)。在有监督微调阶段,训练更新故障诊断分类器参数θc,使模型对样本xi给出的分类结果c(xi)与真实健康状态标签yi之间的交叉熵损失最小化。
[0063]
在故障诊断分类器参数收敛到最优后,模型就可以诊断出每个输入振动信号样本所属的健康状态。
[0064]
应用案例
[0065]
1.数据描述
[0066]
在本案例中,使用凯斯西储大学(cwru)所提供的滚动轴承数据集来验证所提出方法的有效性。试验台由一个2马力的电机、一个扭矩传感器/编码器、一个测力计和控制电子设备组成。电机负载为1马力。分别在不同轴承的内圈、滚动体和外圈中引入单点故障,其中每个位置注入故障的直径分别为0.007英寸、0.014英寸和0.021英寸。因此,共有包括轴承处于无故障(正常)状态在内的一共10种不同健康状态,如表1所示。
[0067]
表1.cwru数据集描述
[0068][0069]
在每种健康状态下,使用加速度计以48khz的采样频率采集振动信号,采集时间持续10秒。然后,使用长度为1200个数据点的固定宽度窗口对振动信号进行切割,切割出的片段互不重叠。因此,每种健康状态下的振动信号被切分为4000个长度为1200数据点的样本。将所有样本按一定比例划分为训练集和测试集,并将数值按训练样本的最大-最小值标准化到区间[-1,1]内。
[0070]
2.参数设置
[0071]
(1)模型参数
[0072]
按照本方法所建立的模型中,二项表征编码器和解码器的超参数如表2和表3所示。
[0073]
表2.模型中二项表征编码器的超参数
[0074]
层号超参数11d卷积,滤波器数量=8,卷积核尺寸=6421d卷积,滤波器数量=8,卷积核尺寸=3231d卷积,滤波器数量=16,卷积核尺寸=841d卷积,滤波器数量=32,卷积核尺寸=35扁平层6全连接层,单元数=2567全连接层,单元数=512
[0075]
表3.模型中解码器的超参数
[0076][0077][0078]
二项判别器是一个全连接的神经网络,每层分别有512-256-128-64-1个神经元节点,其中前4层由relu函数激活,输出层由sigmoid函数激活。有监督微调之前,在经过对抗训练的二项表征编码器之后接入一个每层包含256-128-64-10个神经元节点的4层全连接分类网络,其中分类网络的前3层由relu函数激活,输出层由softmax函数激活。经过有监督
微调之后,由二项表征编码器与全连接分类网络串联而成的模型即可构成完整的故障诊断分类模型。
[0079]
(2)训练参数
[0080]
在无监督对抗训练阶段,批大小(batch size)为100,训练轮次数为2000。在有监督微调阶段,批大小(batch size)为100,训练轮次数为200。
[0081]
为了测试模型在不同数量的可用训练样本条件下的性能,将训练样本占所有样本的比例依次设置为0.2、0.4、0.6和0.8来开展试验。
[0082]
3.对比方法
[0083]
为了说明本发明所提出方法的优越性,特别针对二项对抗表征学习机制的有效性,选择三种基于深度学习的表征学习和故障诊断方法与本发明所提出方法进行比较。对比方法的超参数设置如表4所示。
[0084]
表4.对比方法的超参数设置
[0085][0086]
4.诊断结果与讨论
[0087]
(1)在大多数情况下,尤其是在训练数据不足的条件下,与对比方法相比,barl的诊断准确度更高。
[0088]
表5.barl和对比方法在cwru数据集上的诊断结果
[0089][0090]
本发明所提出的barl和对比方法的诊断结果如表5所示。在每种训练样本比例条件下进行5次独立的试验,以消除结果随机性的影响。表中的数字由(平均准确度
±
5次实验试验的标准差)组成。根据诊断结果,barl在所有情况下都优于其他比较方法。特别是面对训练样本不足的情况时(只有20%的样本可用于模型训练),barl相对于其他对比方法的优势更为显著。
[0091]
(2)与其他方法相比,barl学习到的表征具有更大的ccd值和更小的icd值。
[0092]
如上所述,学习服从二项分布的表征目的是为了得到更大的ccd和更小的icd,也就是更好的自然聚类特性。为了验证结论,计算模型学习到的表征的4个不同指标(nc-index),这些指标能够反映表征的自然聚类特征,包括:1)在欧氏距离度量下的ccd与icd的比值,2)在余弦距离度量下的ccd与icd的比值,3)轮廓系数(silhouette coefficient,sil-coef)以及4)卡林斯基-哈拉巴斯指数(calinski-harabasz index,chi)。
[0093]
为了体现方法的泛化能力,将训练样本比例设定为0.6,从测试样本中提取表征。
barl/garl的表征向量是指它们的二项/高斯编码器的输出向量。cnn的表征向量是指其最后一个卷积层的输出向量。ssae的表征向量是指其最深隐藏层的编码向量。
[0094]
对于欧几里得和余弦距离度量下的nc-index计算,icd值是同一标签样本的表征向量之间的平均距离,而ccd值是不同标签样本的表征向量之间的平均距离。sil-coef和chi通过使用学习到的表征来训练k均值聚类模型,从而衡量自然聚类特性,然后计算聚类中的样本与聚类中心之间的距离,以及不同聚类中心之间的距离。较高的sil-coef和chi值意味着表征具有更好的自然聚类特性。
[0095]
各模型的nc-index计算结果如图4所示,barl在所有的nc-index中获得了最好的结果,通过barl学习表征得到的ccd的值比icd大得多,自然聚类特性远远好于其他对比方法。
[0096]
本发明的有益效果在于:
[0097]
(1)通过结合对抗学习机制和表征学习,本发明提出了一种用于机械故障诊断的二项对抗表征学习方法,它能够迫使模型从原始信号中学习服从指定先验分布的表征向量,从而解决了传统深度学习表征学习方法具有的不可控性问题,提升故障特征提取的质量。
[0098]
(2)本发明提出的barl可以将机械监测信号中蕴含的健康状态信息嵌入到学习的二项表征向量中,而二项分布的二值化特性使得故障表征具有类内距离小而类间距离大的良好自然聚类特性。这提高了本方法在故障诊断任务中的鲁棒性和准确性,尤其是在训练数据不足的条件下。
[0099]
以上参照附图说明了本发明的优选实施例,并非因此局限本发明的权利范围。本领域技术人员不脱离本发明的范围和实质内所作的任何修改、等同替换和改进,均应在本发明的权利范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1