多测点样本结构信息显式表征下的机械设备异常检测方法

文档序号:31864557发布日期:2022-10-19 08:10阅读:53来源:国知局
多测点样本结构信息显式表征下的机械设备异常检测方法

1.本发明涉及机械设备异常检测领域技术领域,特别涉及一种多测点样本结构信息显式表征下的机械设备异常检测方法。


背景技术:

2.机械设备异常检测是通过采用合适的信号处理技术对设备监测数据进行分析处理,提取状态特征,并制定异常识别策略进而判断机械设备运行是否正常的方法。在实际应用过程中,单一传感器易受环境中复杂背景噪声等不确定性因素的影响,为提升检测结果的可靠性,常在多个测点布置传感器采集机械设备多测点监测数据并用于分析处理。然而,复杂机械设备多部件振动响应耦合作用下各测点监测数据存在关联关系高度非线性、重要度显著差异性导致多测点监测数据难以合理利用,特征提取与融合的效果难以达到最佳,反而降低了异常检测的准确率。因此,有必要开展适用于多测点监测数据的机械设备异常检测方法研究。
3.传统异常检测方法(主成分分析、复合谱技术等)在处理多测点监测数据时依赖先验知识人工选择特征指标,在多测点监测数据特征提取与融合应用过程中效果不佳,异常检测结果的准确率低。近年来,以深度神经网络为代表的智能学习方法采用数据驱动的方式构建模型,可以通过训练模型参数自适应提取融合特征,已被应用于数据融合以及异常检测领域。然而,现有智能学习方法在特征提取时仅针对各测点数据依此进行特征提取,再对获取的特征进行融合,在特征提取阶段忽略了不同测点数据之间的潜在联系,导致融合特征难以完整表征设备监测数据中蕴含的健康状态信息。因此,需要研究一种能够充分挖掘多测点监测数据中机械设备健康状态信息的异常检测方法。


技术实现要素:

4.本发明的目的在于提供一种多测点样本结构信息显式表征下的机械设备异常检测方法,以解决现有技术存在的问题,本发明构建了多测点状态检测样本结构信息表征模块以统计各测点检测样本之间的相关性,并采用多头注意力机制自适应加权集成多次相关性分析的结果,以此为基础显式表征多测点状态检测样本的结构信息,之后构建空域图卷积神经网络、多通道解码器并与多测点状态检测样本结构信息表征模块相结合作为异常检测模型计算得到多测点监测数据的重构损失,并基于指数加权移动平均的方法计算得到异常检测阈值,最终实现多测点无故障训练样本条件下的机械设备异常检测。
5.为达到上述目的,本发明采用如下技术方案:
6.多测点样本结构信息显式表征下的机械设备异常检测方法,包括以下步骤:
7.步骤1:以被检测对象各部件多个测点的传感器采集到的一维振动信号作为目标信号,通过对采集到的一维振动信号进行预处理得到多测点状态检测样本,将机械设备正常状态下采集得到的正常多测点状态检测样本作为训练集,其他状态下采集得到的其他多测点状态检测样本作为测试集;
8.步骤2:基于自注意力层构建多测点状态检测样本结构信息表征模块,通过统计各测点检测样本之间的相关性,计算获得多测点状态检测样本的自相关矩阵,并采用多头注意力机制自适应加权集成多次相关性分析的结果,以此为基础显式表征多测点状态检测样本的结构信息,之后构建空域图卷积神经网络处理生成的多测点状态检测样本结构信息的显式表征,并实现各测点状态检测样本的有效融合;
9.步骤3:利用步骤2所构建的多测点状态检测样本结构信息表征模块、空域图卷积神经网络作为编码器,并与所构建的多通道解码器相结合作为异常检测模型,基于划分后由机械设备正常状态下采集得到的正常多测点状态检测样本所构成的训练集对异常检测模型进行训练,通过权重衰减自适应矩估计的方式更新异常检测模型参数,以此挖掘融合后的各测点状态检测样本与相应测点预处理后得到的各测点状态检测样本之间的非线性映射关系;
10.步骤4:利用步骤3中经过训练得到的异常检测模型计算得到训练集样本的重构损失,基于指数加权移动平均的方法计算得到异常检测阈值,根据异常检测阈值推断测试集样本的异常检测结果。
11.进一步地,步骤1中通过滑动窗口以及min-max数据归一化对采集到的一维振动信号进行预处理:
12.首先,利用滑动窗口截取一维振动信号的序列片段,将采集到的一维振动信号划分为长度为l的样本x;之后,利用min-max数据归一化处理划分后的样本,min-max数据归一化的计算公式如下:
[0013][0014]
式中,为归一化后的样本,x
max
为样本中的最大幅值,x
min
为样本中的最小幅值。
[0015]
进一步地,步骤2中基于多头自注意力层统计各测点检测样本之间的相关性,具体为:
[0016]
首先,利用自注意力网络模块提取各测点样本特征,自注意力网络模块的计算公式如下:
[0017][0018]
式中,fi为提取得到的特征向量,i为测点编号,n为测点总数量, w
linear
为自注意力网络模块所用的可训练权重,b
linear
为自注意力网络模块所用的可训练偏差,为第i个归一化后的样本,ο表示以矩阵乘法的方式得到w
linear
与的运算结果;
[0019]
之后,采用皮尔逊相关系数统计不同测点样本特征的相关性,皮尔逊相关系数的计算公式如下:
[0020]
[0021]
式中,l

为特征长度,j为数据点索引,与分别表示要计算皮尔逊相关系数的两个特征向量与在第j点处的值,与分别表示两个特征向量与的平均值,为计算后得到的皮尔逊相关系数。
[0022]
进一步地,步骤2中采用多头注意力机制集成多次相关性分析的结果;首先,同时初始化多个自注意力网络模块以多次提取各测点样本特征,并计算得到多个匹配后的特定测点样本对的皮尔逊相关系数,计算结果如下:
[0023][0024]
式中,k为运用多头注意力机制处理匹配后的特定测点样本对时的自注意力层的数目,i
p
,iq为处理的样本对中两个样本的序号,分别为采用不同初始化后多个自注意力网络模块计算后所得到的皮尔逊相关系数,为由以上计算所得多个皮尔逊相关系数拼接组成的向量;
[0025]
之后,使用线性转换层将拼接后得到的皮尔逊相关系数向量降维为与单头注意力机制处理相同的维度,以此实现多次相关性分析的自适应加权集成,计算结果如下:
[0026][0027]
式中,w

linear
为线性转换层所用的可训练权重,b

linear
为线性转换层所用的可训练偏差,ο表示以矩阵乘法的方式得到w

linear
与的运算结果,为降维后与单头注意力机制处理相同维度的计算结果。
[0028]
进一步地,步骤2中采用多次相关性分析的自适应加权集成结果显式表征多测点状态检测样本的结构信息,所述多测点状态检测样本结构信息的显式表征由顶点的有穷非空集合和顶点之间边的集合组成,将预处理后的各测点样本作为多测点状态检测样本结构信息显式表征的顶点,并将使用线性转换层将拼接后的皮尔逊相关系数向量降维后的运算结果作为多测点状态检测样本结构信息显式表征的边,其中,多测点状态检测样本结构信息显式表征的顶点集合v表示如下:
[0029][0030]
式中,i1,i2,
…in
为多测点状态检测样本的序号,分别表示对应序号的多测点状态检测样本在归一化后得到的预处理后的样本;
[0031]
多测点状态检测样本结构信息显式表征的边集合e表示如下:
[0032][0033]
式中,e
i,j
表示边集合e第i行第j列的数值,i1,i2,
…in
为多测点状态检测样本的序号,为相应序号样本组成的样本对在自适应加权集成后计算所得皮尔逊相关系数;
[0034]
在生成边集合e后,为了防止边集合e中特定位置的数值过大或过小从而对后续计算结果产生影响,对矩阵每一行进行softmax计算,以将每一行数值转换为所有元素权重之和为1的概率分布,softmax计算公式如下:
[0035][0036]
式中,e
i,j
表示边集合e第i行第j列的数值。
[0037]
进一步地,步骤2中构建空域图卷积神经网络处理生成的多测点状态检测样本结构信息的显式表征;首先,为了避免信号采集过程中的异常样本对计算结果产生干扰,认为边集合e中数值较小的样本对存在异常,并设定屏蔽规则对边集合e进行屏蔽,屏蔽规则如下:
[0038][0039]
式中,ξ为屏蔽规则的阈值,e

i,j
为屏蔽处理后边集合e

第i行第j列的数值;
[0040]
之后,采用卷积神经网络层处理多测点状态检测样本结构信息显式表征的顶点以进一步提取数据特征,并结合屏蔽处理后的边集合 e实现顶点集合v信息的有效融合,融合后的顶点集合v

表示如下:
[0041][0042]
式中,e

1,1
,e

1,2
,
…e′
n,n
为屏蔽处理后边集合e

中的数值,conv(
·
)表示卷积运算,ο表示以矩阵乘法的方式得到运算结果。
[0043]
进一步地,步骤3中利用步骤2所构建的多测点状态检测样本结构信息表征模块、空域图卷积神经网络作为编码器,并与所构建的多通道解码器相结合作为异常检测模型,具体为:
[0044]
首先,针对融合后顶点集合v

中的每一个数据,构建特定通道解码器模块,将维度提升为与多测点状态检测样本结构信息显式表征的顶点集合v 中各位置的数据相同的维度;之后,利用线性变化以及余弦距离计算重构数据与预处理后数据的差异性,并以此作为模型的损失函数,计算过程表示如下:
[0045][0046]
式中,i为样本序号,n为样本总个数,cos(
·
)表示计算余弦距离,linear(
·
)表示对数据进行线性变化,ο表示以矩阵乘法的方式得到运算结果, (
·
)
t
表示得到转置结果并且这里是将行向量转职为列向量,||
·
||2表示计算得到向量的2范数,loss为计算所得模型的损失函数。
[0047]
进一步地,步骤3中采用权重衰减自适应矩估计的方式更新异常检测模型参数,权重衰减自适应矩估计的参数更新公式如下:
[0048][0049][0050][0051]
式中,m
t
为参数更新的动量,v
t
为参数更新的二阶动量,t为参数更新的代数,β1,β2,λ为调节参数更新过程的参数,θ
t-1
与θ
t
分别表示第t-1次更新以及第t次更新以后的模型参数,表示求模型参数的梯度,loss为计算所得到的模型损失函数,ε为防止分母为零的平滑项,η为模型学习率。
[0052]
进一步地,步骤4中针对模型训练后得到的训练集样本重构损失,基于指数加权移动平均的方法计算得到异常检测阈值,异常检测阈值的计算公式如下:
[0053]
t1=l1[0054]
ti=λ

li+(1-λ

)t
i-1
[0055]
t

last
=βt
last
+(1-β)l
max
[0056]
式中,l1,li分别表示样本划分后按照时间排序第1次、第i次出现的样本经异常检测模型计算所得到的损失函数值,l
max
为所有样本中经异常检测模型计算后所得损失函数值中的最大值,t1,t
i-1
,ti,t
last
为计算第1次、第i-1次、第i次、及最后一次所出现样本的损失函数值所累积得到的异常检测阈值,t

last
为经过加权调整后最终所得异常检测阈值,λ

为异常检测阈值移动加权平均过程中当前重构损失的统计量权重,β为确定最终阈值时所用的统计量权重。
[0057]
与现有技术相比,本发明具有以下有益的技术效果:
[0058]
1)本发明提出基于多头注意力机制的多测点样本相关性分析方法,实现了多次皮尔逊相关系数的自适应加权集成,通过排除模型随机初始化对样本特征提取结果的干扰提高了相关性分析结果的稳定性。
[0059]
2)本发明提出采用多测点样本结构信息显式表征以及空域图卷积神经网络的多测点监测数据融合方法,制定了基于有穷非空顶点集合以及顶点之间边集合的多测点样本结构信息显式表征的生成方法,同时制定了边集合的屏蔽策略,使得对多测点监测数据中机械设备健康状态信息的挖掘更加充分。
[0060]
3)本发明构建的机械设备异常检测模型,可通过权重衰减自适应矩估计的方式,在多测点状态检测样本结构信息表征模块、空域图卷积神经网络模块和多通道解码器模块多个层次捕获融合后的各测点状态检测样本与相应测点预处理后得到的各测点状态检测样本之间的非线性映射关系,并基于指数加权移动平均的方法计算得到异常检测阈值,实现在多测点无故障训练样本条件下对机械设备异常状态的检测,具有一定的实际应用潜力。
附图说明
[0061]
说明书附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
[0062]
图1为本发明方法的流程图;
[0063]
图2为本发明方法预示模型的结构示意图;
[0064]
图3为本发明方法在多测点无故障训练样本条件下机械设备异常检测结果。
具体实施方式
[0065]
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0066]
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0067]
一种多测点样本结构信息显式表征下的机械设备异常检测方法,参见图 1,包括以下步骤:
[0068]
步骤1:以被检测对象各部件多个测点的传感器采集到的一维振动信号作为目标信号,通过滑动窗口以及min-max数据归一化对采集到的多测点一维振动信号进行预处理。利用滑动窗口截取一维振动信号的序列片段,从而将原始数据划分为长度为l的样本x;之后,利用min-max数据归一化处理划分后的样本,min-max数据归一化的计算公式如下:
[0069]
[0070]
式中,为归一化后的样本,x
max
为样本中的最大幅值,x
min
为样本中的最小幅值。
[0071]
将机械设备正常状态下采集得到检测样本作为训练集,其他状态下采集得到的样本作为测试集。
[0072]
步骤2:利用自注意力网络模块提取各测点样本特征,自注意力网络模块的计算公式如下:
[0073][0074]
式中,fi为提取得到的特征向量,i为测点编号,n为测点总数量,w
linear
为自注意力网络模块所用的可训练权重,b
linear
为自注意力网络模块所用的可训练偏差,为第i个归一化后的样本,ο表示以矩阵乘法的方式得到w
linear
与的运算结果。
[0075]
之后,采用皮尔逊相关系数统计不同测点样本特征的相关性,皮尔逊相关系数的计算公式如下:
[0076][0077]
式中,l

为特征长度,j为数据点索引,与分别表示要计算皮尔逊相关系数的两个特征向量与在第j点处的值,与表示两个特征向量与的平均值,为计算后得到的皮尔逊相关系数。
[0078]
同时初始化多个自注意力网络模块以多次提取各测点样本特征,并计算得到不同测点样本特征的皮尔逊相关系数,,计算结果如下:
[0079][0080]
式中,k为运用多头注意力机制处理匹配后的特定测点样本对时的自注意力层的数目(头数),i
p
,iq为处理的样本对中两个样本的序号,分别为采用不同初始化后多个自注意力网络模块计算后所得到的皮尔逊相关系数,为由以上计算所得多个皮尔逊相关系数拼接组成的向量。
[0081]
之后,使用线性转换层将拼接后得到的皮尔逊相关系数向量降维为与单头注意力机制处理相同的维度,以此实现多次相关性分析的自适应加权集成,计算结果如下:
[0082][0083]
式中,w

linear
为线性转换层所用的可训练权重,b

linear
为线性转换层所用的可训练偏差,ο表示以矩阵乘法的方式得到w

linear
与的运算结果,为降维后与单头注意力机制处理相同维度的计算结果。
[0084]
采用多次相关性分析的自适应加权集成结果显式表征多测点状态检测样本的结构信息,所述多测点状态检测样本结构信息的显式表征由顶点的有穷非空集合和顶点之间边的集合组成,将预处理后的各测点样本作为多测点状态检测样本结构信息显式表征的顶点,并将使用线性转换层将拼接后的皮尔逊相关系数向量降维后的运算结果作为多测点状态检测样本结构信息显式表征的边,其中,多测点状态检测样本结构信息显式表征的顶点集合v表示如下:
[0085][0086]
式中,i1,i2,
…in
为多测点状态检测样本的序号,分别表示对应序号的多测点状态检测样本在归一化后得到的预处理后的样本。
[0087]
多测点状态检测样本结构信息显式表征的边集合e表示如下:
[0088][0089]
式中,e
i,j
表示边集合e第i行第j列的数值,i1,i2,
…in
为多测点状态检测样本的序号,为相应序号样本组成的样本对在自适应加权集成后计算所得皮尔逊相关系数;
[0090]
在生成边集合e后,为了防止边集合e中特定位置的数值过大或过小从而对后续计算结果产生影响,对矩阵每一行进行softmax计算,以将每一行数值转换为所有元素权重之和为1的概率分布,softmax计算公式如下:
[0091][0092]
式中,e
i,j
表示边集合e第i行第j列的数值。
[0093]
构建空域图卷积神经网络处理生成的多测点状态检测样本结构信息的显式表征;首先,为了避免信号采集过程中的异常样本对计算结果产生干扰,认为边集合e中数值较小的样本对存在异常,并设定了屏蔽规则对边集合e 进行屏蔽,屏蔽规则如下:
[0094][0095]
式中,ξ为屏蔽规则的阈值,e

i,j
为屏蔽处理后边集合e

第i行第j列的数值。之后,采用卷积神经网络层处理多测点状态检测样本结构信息显式表征的顶点以进一步提取数据特征,并结合屏蔽处理后的边集合 e实现顶点集合v信息的有效融合,融
合后的顶点集合v

表示如下:
[0096][0097]
式中,e

1,1
,e

1,2
,
…e′
n,n
为屏蔽处理后边集合e

中的数值,conv(
·
)表示卷积运算,ο表示以矩阵乘法的方式得到运算结果。
[0098]
步骤3:利用步骤2所构建的多测点状态检测样本结构信息表征模块、空域图卷积神经网络作为编码器,并与所构建的多通道解码器相结合作为异常检测模型,所构建的异常检测模型的结构如图2所示。首先,针对融合后顶点集合v

中的每一个数据,构建特定通道解码器模块,将维度提升为与多测点状态检测样本结构信息显式表征的顶点集合v中各位置的数据相同的维度;之后,利用线性变化以及余弦距离计算重构数据与预处理后数据的差异性,并以此作为模型的损失函数,计算过程表示如下:
[0099][0100]
式中,i为样本序号,n为样本总个数,cos(
·
)表示计算余弦距离, linear(
·
)表示对数据进行线性变化,ο表示以矩阵乘法的方式得到运算结果, (
·
)
t
表示得到转置结果并且这里是将行向量转职为列向量,||
·
||2表示计算得到向量的2范数,loss为计算所得模型的损失函数。
[0101]
采用权重衰减自适应矩估计的方式更新异常检测模型参数,权重衰减自适应矩估计的参数更新公式如下:
[0102][0103][0104][0105]
式中,m
t
为参数更新的动量,v
t
为参数更新的二阶动量,t为参数更新的代数,β1,β2,λ为调节参数更新过程的参数,θ
t-1
与θ
t
分别表示第t-1次更新以及第t次更新以后的模型参数,表示求模型参数的梯度,loss为权力要求7中计算所得到的模型损失函数,ε为防止分母为零的平滑项,η为模型学习率。
[0106]
步骤4:针对模型训练后得到的训练集样本重构损失,基于指数加权移动平均的方法计算得到异常检测阈值,异常检测阈值的计算公式如下:
[0107]
t1=l1[0108]
ti=λ

li+(1-λ

)t
i-1
[0109]
t

last
=βt
last
+(1-β)l
max
[0110]
式中,l1,li分别表示样本划分后按照时间排序第1次、第i次出现的样本经异常检测模型计算所得到的损失函数值,l
max
为所有样本中经异常检测模型计算后所得损失函数值中的最大值,t1,t
i-1
,ti,t
last
为计算第1次、第i-1次、第i次、及最后一次所出现样本的损失函数值所累积得到的异常检测阈值,t

last
为经过加权调整后最终所得异常检测阈值,λ

为异常检测阈值移动加权平均过程中当前重构损失的统计量权重,β为确定最终阈值时所用的统计量权重。
[0111]
基于某自动扶梯主轴支撑轴承数据集对该方法进行验证,该方法在仅使用自动扶梯健康状态下采集到的监测数据进行训练的条件下异常检测的准确率为99.904%,异常检测结果如图3所示,这表面了所提出方法在用于建立机械设备监测数据和设备健康状态之间的非线性映射关系,以及根据多测点监测数据重构损失和检测阈值的分布关系预测机械设备健康状态所发生变化的有效性。
[0112]
最后应当说明的是:以上实施例仅用于说明本发明的技术方案而非对其保护范围的限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:本领域技术人员阅读本发明后依然可对发明的具体实施方式进行种种变更、修改或者等同替换,但这些变更、修改或者等同替换,均在发明待批的权利要求保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1