本发明属于旋转机械状态监测与寿命评估技术领域,涉及一种基于加噪样本增强深度自编码学习网络的旋转机械寿命阶段识别方法。
背景技术:
旋转机械是生产生活中的重要装备,其寿命与可靠性直接关系到生产系统运行性能及其可靠性。随着经济、社会和科学技术的发展,对旋转机械的寿命提出了越来越高的要求,而要进行旋转机械高可靠、长寿命研究,制定合理的旋转机械维护策略,减少因旋转机械维修而导致停产甚至生产事故的前提就是对旋转机械的寿命阶段进行准确评估和识别。
目前在旋转机械状态监测和寿命评估领域,国内外主要借鉴故障诊断的理论和技术,利用信号处理技术(如傅里叶变换、包络解调、阶次分析、小波变换和emd分解等)提取特征,再输入到合适分类器进行识别。这种借鉴传统故障诊断进行寿命阶段评估方法在一定条件下可取得较好效果,但这种方法严重依赖人的信号处理与评估经验提取寿命特征,还需要应用机器学习模型才能进行寿命阶段识别与评估。
为了直接从原始信号中学习寿命特征进行寿命阶段识别,国内外相继提出了特征的自学习方法。如采用稀疏编码和稀疏自编码进行特征的自学习与识别,解决了特征自学习问题。但稀疏编码在样本不充足时学习效果欠佳,需要设计合适的分类器才能实现智能识别。稀疏自编码利用非监督方式学习复杂数据的内在特征并将其简明表达,降低了分类的复杂度,进行简单的分类即可实现智能识别。但稀疏自编码仅包括输入层、隐含层和输出层,属于浅层网络,学习能力有限,特别是在面对样本复杂度高的情况下,特征学习效果欠佳。所以,将稀疏自编码网络进行堆栈则可形成包含多层稀疏自编码的深度网络,使其具有更强大的表达能力,能获得输入的“层次型分组”或者“部分-整体分解”结构,从而学习得到更好地表示输入数据的特征。包含多层稀疏自编码的深度网络无分类功能,故在堆栈多层稀疏自编码后添加分类层,最终构建出集寿命特征自动提取与寿命阶段智能识别于一体的深度稀疏自编码学习网络。同时,旋转机械寿命阶段样本不容易获取,往往只能获得有限的样本,而对于有限的样本,深度稀疏自编码学习网络具有庞大的网络参数需要训练和学习,容易导致过拟合问题。因此,通过加噪扩展样本的方法来强化训练样本,样本量的扩展及其加噪样本融入训练过程来抑制网络过拟合问题,并提高网络的鲁棒性。最终,得到基于加噪样本增强深度自编码学习网络的旋转机械寿命阶段识别方法。
技术实现要素:
有鉴于此,本发明的目的在于提供一种基于加噪样本增强深度自编码学习网络的旋转机械寿命阶段识别方法,该方法能够根据寿命阶段样本数据的内部结构自适应地学习寿命特征并对寿命阶段的智能识别,同时能够抑制网络的过学习问题和提高网络的鲁棒性。
为达到上述目的,本发明提供如下技术方案:
一种基于加噪样本增强深度自编码学习网络的旋转机械寿命阶段识别方法,该方法对训练样本进行加噪增强,并将多个稀疏自编码堆栈后添加分类层构建出集寿命特征自动提取与寿命阶段智能识别于一体的深度稀疏自编码学习网络。以未加噪样本未训练目标,通过多层稀疏自编码对加噪增强后的样本进行逐层无监督自适应学习和有监督微调,抑制深度网络过学习问题并提高网络的鲁棒性,实现旋转机械寿命特征自动提取与表达,最终在分类层完成旋转机械寿命阶段的智能识别。
进一步,该方法具体包括以下步骤:
s1:采集数据,样本加噪增强。采集数据,获得训练样本,设置加噪幅值系数k和加噪次数m对训练样本进行增强得到增强后的训练样本。计算训练样本进行预处理、计算频谱并对其归一化到[0,1];
s2:设置网络结构参数,构建深度稀疏自编码学习网络。设置稀疏自编码的层数n、各层神经元个数、稀疏目标值、分类层神经元个数等构建出深度稀疏自编码学习网络;
s3:预训练。输入加噪样本增强后的训练样本,以未加噪样本未训练目标,应用逐层贪婪法逐层训练n个稀疏自编码,即将每个稀疏自编码的输出作为下一个稀疏自编码的输入,直到完成n个稀疏自编码的预训练;
s4:有监督微调。输入有标签训练样本对预训练得到的参数进行微调,完成深度稀疏自编码学习网络的训练;
s5:输出结果。输入测试样本,由完成训练后的学习网络对旋转机械寿命特征进行提取和表达,并输出寿命阶段识别结果,完成旋转机械寿命阶段识别。
进一步,所述步骤s1具体包括:
s11:设有原始样本为x(t),依次加入m次(m>0)高斯白噪声ni(t)(i=1~m),得到每次加噪后的样本:
即样本扩展后,训练样本由原来{x(t)}扩展为{x(t),x1*(t),…,xm*(t)},样本数量为原来的m+1倍。
s12:所加入的高斯白噪声ni(t)为:
式中,σ是信号x(t)的标准差,k为幅值系数,nst(t)是标准差为1,均值为0的高斯白噪声。
s13:计算增强样本后的频谱,并对其归一化到[0,1],作为深度稀疏自编码学习神经网络的输入。由输入频谱取值范围为[0,1]选择sigmoid函数作为激活函数。
进一步,在步骤s2中,深度自编码学习网络第一层系数自编码的输入层神经元个数为频谱的谱线数,分类层神经元个数为寿命阶段个数。
进一步,所述步骤s3具体包括:
s31:其前一层稀疏自编码的输出作为后一层稀疏自编码的输入。设第l层栈式自动编码神经网络对应的网络参数为θl={w(l,1),b(l,1)}和θ'l={w(l,2),b(l,2)},则对于具有nl层栈式自动编码神经网络的编码按照从前向后的顺序执行,每一层稀疏自动编码的编码过程为:
a(l)=f(z(l))
z(l+1)=w(l,1)a(l)+b(l,1)
式中,a(l)指第l层的输出,z(l)和z(l+1)分别为第l层和第l+1层的输入。
同理,深度稀疏自编码学习网络的解码过程按照从后向前的顺序执行每一层稀疏自动编码器的解码步骤:
其中,
s32:深度稀疏自编码学习网络的目的是使得代价函数最小。稀疏自编码的代价函数定义为:
式中,j(w,b)为自编码的代价函数;β为控制稀疏性惩罚因子的权重;ρ为稀疏性参数,一般是接近于0的较小值(如ρ=0.05);ρj为第j个神经元的平均激活值。
稀疏惩罚项的实质是kullback-leibler相对熵,描述平均值分别为ρ和ρj的两个伯努利随机变量之间分布的差异性,其表达式为:
ρj可按照下式计算:
式中,aj(x(i))表示给第i个训练样本x(i)下第j个神经元的激活度。
s33:经过加噪样本扩展后,自编码的代价函数为:
式中,m为训练样本数;x(i)是原始训练样本而非加噪后的样本,是输入;
s34:通过采用反向传播算法来最小化代价函数jsparse(w,b)得到优化的w和b。同时,采用梯度下降法在每一次迭代过程中更新一次权值,公式如下:
式中,α为学习速率。
进一步,所述步骤s4具体包括:
s41:在预训练的基础上输入有标签样本(x(i),y(i)),进行一次前馈传递,对l2层、l3层直到输出lnl层,应用前向传播算法得到各层上的激活值;
s42:对输出层nl层,残差为:
式中,
对l=nl-1,nl-2,…,2层,该层残差
s43:计算得到偏导数:
从而得到总体代价函数:
这样,就可根据梯度下降法更新权值,从而微调整个网络参数。
本发明的有益效果在于:本发明对训练样本进行加噪增强,将多个稀疏自编码堆栈后添加分类层构建出集寿命特征自动提取与寿命阶段智能识别于一体的深度稀疏自编码学习网络。通过加噪样本增强抑制学习网络的过拟合问题和提高网络鲁棒性,利用稀疏自编码自动学习数据内部结构特征的优点,通过多层稀疏自编码对加噪增强样本进行逐层无监督自适应学习和有监督微调,在不同层获得“层次型”寿命特征,实现旋转机械寿命特征自动提取与表达,最终在分类层完成旋转机械寿命阶段的智能识别。该方法能根据数据内在结构特点自适应提寿命特征并进行寿命阶段智能识别,同时可抑制网络的过拟合并提高网络的鲁棒性,具有良好的应用效果。
附图说明
为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
图1为本发明所述方法的流程图;
图2为寿命数据频谱瀑布图;
图3为提取结果对比;
图4为训练误差与识别错误率。
具体实施方式
下面将结合附图,对本发明的优选实施例进行详细的描述。
图1为本发明所述方法的流程图,如图所示,本发明所述方法具体包括以下步骤:
s1:采集数据,样本加噪增强。采集数据,获得训练样本,设置加噪幅值系数k和加噪次数m对训练样本进行增强得到增强后的训练样本。计算训练样本进行预处理、计算频谱并对其归一化到[0,1]。在本实施例中,具体包括以下步骤:
s11:设有原始样本为x(t),依次加入m次(m>0)高斯白噪声ni(t)(i=1~m),得到每次加噪后的样本:
即样本扩展后,训练样本由原来{x(t)}扩展为{x(t),x1*(t),…,xm*(t)},样本数量为原来的m+1倍。
s12:所加入的高斯白噪声ni(t)为:
式中,σ是信号x(t)的标准差,k为幅值系数,nst(t)是标准差为1,均值为0的高斯白噪声。
s13:计算增强样本后的频谱,并对其归一化到[0,1],作为深度稀疏自编码学习神经网络的输入。由输入频谱取值范围为[0,1]选择sigmoid函数作为激活函数。
s2:设置网络结构参数,构建深度稀疏自编码学习网络。设置稀疏自编码的层数n、各层神经元个数、稀疏目标值、分类层神经元个数等构建出深度稀疏自编码学习网络;
s3:预训练。输入加噪样本增强后的训练样本,应用逐层贪婪法逐层训练n个稀疏自编码,即将每个稀疏自编码的输出作为下一个稀疏自编码的输入,直到完成n个稀疏自编码的预训练。在本实施例中,具体包括以下步骤:
s31:其前一层稀疏自编码的输出作为后一层稀疏自编码的输入。设第l层栈式自动编码神经网络对应的网络参数为θl={w(l,1),b(l,1)}和θ'l={w(l,2),b(l,2)},则对于具有nl层栈式自动编码神经网络的编码按照从前向后的顺序执行,每一层稀疏自动编码的编码过程为:
a(l)=f(z(l))
z(l+1)=w(l,1)a(l)+b(l,1)
式中,a(l)指第l层的输出,z(l)和z(l+1)分别为第l层和第l+1层的输入。
同理,深度稀疏自编码学习网络的解码过程按照从后向前的顺序执行每一层稀疏自动编码器的解码步骤:
其中,
s32:深度稀疏自编码学习网络的目的是使得代价函数最小。稀疏自编码的代价函数定义为:
式中,j(w,b)为自编码的代价函数;β为控制稀疏性惩罚因子的权重;ρ为稀疏性参数,一般是接近于0的较小值(如ρ=0.05);ρj为第j个神经元的平均激活值。
稀疏惩罚项的实质是kullback-leibler相对熵,描述平均值分别为ρ和ρj的两个伯努利随机变量之间分布的差异性,其表达式为:
ρj可按照下式计算:
式中,aj(x(i))表示给第i个训练样本x(i)下第j个神经元的激活度。
s33:经过加噪样本扩展后,自编码的代价函数为:
式中,m为训练样本数;x(i)是原始训练样本,是输入;
s34:通过采用反向传播算法来最小化代价函数jsparse(w,b)得到优化的w和b。同时,采用梯度下降法在每一次迭代过程中更新一次权值,公式如下:
式中,α为学习速率。
s4:有监督微调。输入有标签训练样本对预训练得到的参数进行微调,完成深度稀疏自编码学习网络的训练。在本实施例中,具体包括以下步骤:
s41:在预训练的基础上输入有标签样本(x(i),y(i)),进行一次前馈传递,对l2层、l3层直到输出lnl层,应用前向传播算法得到各层上的激活值;
s42:对输出层nl层,残差为:
式中,
对l=nl-1,nl-2,…,2层,该层残差
s43:计算得到偏导数:
从而得到总体代价函数:
这样,就可根据梯度下降法更新权值,从而微调整个网络参数。
s5:输出结果。输入测试样本,由完成训练后的学习网络对旋转机械寿命特征进行提取和表达,并输出寿命阶段识别结果,完成旋转机械寿命阶段识别。
实施例:
在本实施例中,通过以下步骤来验证本发明的有效性:
第一步:采集数据,加噪样本增强。获得某型号滚动轴承全寿命实验样本,轴承在转速为3000rpm,载荷为3kg工况条件下连续运行90天,每间隔4小时采集一次振动信号,每次依次采集两组信号,采样频率为51.2khz,采样长度为100k。求取每次采集第一组振动信号的幅值谱后按照采样时间依次作图得到频谱瀑布图如图2所示。观察该图,随着轴承运转时间(运转圈数)的增加,轴承逐步磨损,其振动信号的频谱能量和频谱结构均发生了改变,总体趋势是频谱幅值增大,频谱结构更复杂。将其划分为5个寿命阶段:t1、t2、t3、t4和t5,如图2所示,具体寿命阶段情况如表1所示。轴承运转圈数越多磨损越严重,不同的运转圈数代表了不同的寿命阶段。
表1寿命阶段
每个阶段选取4天的振动数据,以每次采集振动数据的第一组作为一个训练样本,另一组作为测试样本,即每寿命阶段各有4×6=24组训练样本和测试样本。每个寿命阶段只有24组训练样本,5个寿命阶段有5×24=120组训练样本,训练样本数相对于深度稀疏自编码神经网络庞大的网络参数显得不足。应用加噪样本强化方法扩展样本量,加噪幅值稀疏k=0.4,加噪次数m=9。
第二步:设置网络结构参数,构建稀疏自编码学习网络。设置相关参数如下:稀疏自编码为3,每层神经元个数分别是:800-500-800,500-100-500,100-60-100,分类层神经元个数与寿命阶段数相同为5,稀疏性惩罚因子的权重β=0.3,为稀疏性参数ρ=0.02。
第三步:输入训练样本,应用逐层贪婪法逐层训练3个稀疏自编码,即将每个稀疏自编码的输出作为下一个稀疏自编码的输入,直到完成3个稀疏自编码的预训练。
第四步:有监督微调。输入有标签训练样本对预训练得到的参数进行微调,完成网络的训练。完成训练后即得到自学习的寿命特征,应用主成分分析方法计算学习得到的寿命特征的前三个主分量作为特征向量,结果如图3(a)所示。观察该图,应用所发明方法得到的结果不仅同种寿命阶段特征的聚集性好,而且不同寿命阶段之间被很好的分开,说明这种方法所自适应学习提取得到的寿命特征有效的表征了寿命阶段。
同时,为了对比分析,应用人工提取特征、稀疏自编码和未进行加噪样本强化的深度稀疏自编码网络提取寿命特征。
人工提取特征方法中,提取反映轴承振动信号时、频域特征相关的30个特征值构建特征集,具体特征值如下:最大峰值、均值、平均幅值、均方值、均方根值、方差、标准差、方根幅值、偏斜度、峭度、波形因数、峰值因数、脉冲指标、裕度指标、峭度指标、偏度指标、频域幅值平均值、重心频率、均方频率、频率方差、均方根频率、频域幅值方差、标准差、频域幅值偏度指标、频域幅值峭度指标、频率标准差、变动率、频域频率歪度、频域频率峭度和平方根比率。再利用流形学习方法对其进行约简,约简目标维数为3,结果如图3(b)所示。观察该图,t4被分离出来,t2和t3部分交叉在一起,t1、t5虽被分离但分散较大,t5部分已经和其他重叠在一起。这是因为人工提取的特征依赖人的经验,所提取的特征并非对每个寿命阶段都适用,所构建的寿命特征集对寿命表征能力有限。
稀疏自编码的输入为频谱数据(取800线),即输入层神经元个数为800,网络结构为800-400-800,稀疏惩罚因子的权重β=0.5,为稀疏性参数ρ=0.05。图3(c)中,大致将五种寿命阶段区分出来,但两两间均存在不同程度交叉部分,如t1与t2、t2与t3、t3与t4等,而t1、t2、t3、t4、t5寿命阶段依次延续,即稀疏自编码学习能力有限,未完全学习到数据内在结构特征。原因在于稀疏自编码只有一层隐藏层,对数据本身特征学习不足,提取特征效果不佳。
图3(d)为未进行加噪样本强化时深度稀疏自编码得到的结果,优于稀疏自编码,t1寿命阶段被完全分离,其他也明显得到分离,说明深度稀疏自编码特征学习能力更强,但仍然存在少许重叠,如t3与t4。
第五步:输出识别结果。输入测试样本,得到识别结果如表2所示。人工提取特征方法提取特征后,利用最近邻分类器进行分类识别。其结果对t4识别率最高达到了91.67%,但对t5的识别率只有76.67%,即对不同寿命阶段识别率相差较大,平均识别率为83.5%。这是前文所述人工提取特征并非适应于每个寿命阶段,使得不同寿命阶段的识别率波动较大。稀疏自编码各个寿命阶段的识别率均较低,平均识别率是四种方法中最低的,仅有76.67%,进一步说明稀疏自编码的特征学习能力有限。深度稀疏自编码的结果优于稀疏自编码,但由于训练样本量少,网络参数多,产生的过拟合问题使其平均识别率也不高,甚至略低于人工提取特征的方法。本发明的方法对每个寿命阶段的识别率均较高、波动小,平均识别率达到98.33%,说明提出方法有效抑制了过拟合问题,且鲁棒性好,更能自适应根据数据内部结构特点的提取寿命特征,保证了识别率。为了避免偶然因素影响,该表中的试验结果都是由10次随机试验结果取平均所得。
表3识别率对比
进一步,对比不同加噪样本次数m和加噪幅值稀疏k对结果的影响。
首先,对比不同加噪次数m对结果的影响。幅值系数k=0.4,加噪次数m=0,1,…,20,其中当m=0时代表未对样本进行扩展。网络的训练误差、对训练样本和测试样本识别错误率如图4(a)所示。观察该图,在m=0未进行样本扩展时,训练误差为0.0031,对训练样本和测试样本的识别错误率分别为0.014和0.192,即对训练样本识别率高而对测试样本识别率低,两者相差超过10倍,产生了严重的过拟合问题。随着m值增大(样本量扩展)测试样本识别错误率随之下降,在m=9时对测试样本训练错误率为0.0167,即识别率达到了98.33%,说明样本量的扩展有效抑制了过拟合问题。当然,随着m值再增大识别率已趋于饱和,对识别率的影响不大。
其次,对比噪声幅值系数对结果的影响。加噪次数m=9,幅值系数k=0,0.1,…,2。网络的训练误差、对训练样本和测试样本识别错误率如图4(b)所示。观察该图,k=0时代表未加噪声将训练样本数增加为原来的9+1=10倍,相当于仅增加了训练次数,对抑制过拟合问题无益。即此时,对训练样本识别错误率接近为0,对测试样本识别错误率为0.183,两者差距很大说明仍存在严重的过拟合问题。随着k值的增大测试样本识别错误率呈现先下降再上升的趋势,其中在0.2~0.8之间均低于0.05。同时可观察到,随着k值的增大,训练误差和训练样本识别错误率逐步增大。这是因为加入噪声过大已逐步湮没原始信号,而在计算代价函数时网络的输入为加噪扩展后的训练样本,但训练目标为未加噪样本。所以训练误差会持续增大,训练样本和测试样本的识别错误率也随之而增大。综上分析,根据训练样本数与网络结构参数(层数与神经元个数)可进行m选取,如训练样本少而网络结构参数多则适当增大m,反之,则适当减小m。
本实施例对处于不同寿命阶段的轴承进行寿命特征提取与识别。通过加噪样本强化的深度稀疏自编码学习网络对寿命特征进行了自适应提取并实现了寿命阶段的识别。具体为对训练样本进行加噪增强,并将多个稀疏自编码堆栈后添加分类层构建出集寿命特征自动提取与寿命阶段智能识别于一体的深度稀疏自编码学习网络。通过多层稀疏自编码对加噪增强后的样本进行逐层无监督自适应学习和有监督微调,抑制深度网络过学习问题并提高了网络的鲁棒性,实现轴承寿命特征自动提取与表达,最终在分类层完成轴承寿命阶段的智能识别。本发明能实现小样本下对轴承寿命特征的自适应提取和对寿命阶段的智能识别,充分说明了本发明的可行性和有效性。
最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。