专利名称:机械故障的集成支持向量机混合智能诊断方法
技术领域:
本发明属机械设备故障智能诊断领域,具体涉及一种机械故障的集成支持向量机混合智能诊断方法。
背景技术:
为了摆脱机械设备故障诊断过分依赖于专业技术人员和诊断专家的问题,在线实现高效、可靠的智能诊断,近几年,人们将模糊理论、专家系统、神经网络和聚类分析等人工智能技术应用于机械设备的智能故障诊断,在实践中取得了一定的成效。但在实际应用中人们发现这些技术并非完美的,例如模糊故障诊断往往需要由先验知识人工确定隶属函数及模糊关系矩阵,但实际上,获得与设备实际情况相符的隶属函数及模糊关系矩阵存在许多困难;专家系统中也面临着许多困难,如缺乏有效的故障诊断知识的表达方法,经验知识获取困难等,另外,专家系统的操作人员也需要具备较高的水平,不易普及;神经网络分类时需要提供一定数量的标准样本,获取一个设备所有故障的标准样本是相当不易的,此外,神经网络在实际应用中都需要对原始数据进行特征提取,如果不作特征提取,而直接用原始数据参加计算,网络的结构将是非常庞大的,将无法满足实时在线监测诊断的要求;聚类分析可以不需要故障标准样本,它将数据样本组成多个类,要求类之间的数据样本差别应尽可能的大,而同一类中数据样本之间的差别应尽可能的小,即满足“最小化的类间相似性,最大化的类内相似性”的原则,因此,对早期微弱故障或者复合故障的聚类效果不理想。
在工程实践中,对于大型复杂的机械设备的故障诊断,往往被测对象多、分析处理的数据量大,进行智能诊断模型训练的故障样本严重缺乏,而且机械设备是一个复杂的系统,时变性、随机性、模糊性等多方面的因素使得模糊理论、专家系统、神经网络和聚类分析等传统的智能诊断方法难以对设备运行的故障状态做出准确有效的识别,特别是对于潜在的、早期的微弱故障缺乏有效的识别和诊断手段。为了解决智能故障诊断领域所存在的问题,急迫需要研究和引入新的理论和技术,提出新的、高效的诊断智能技术和方法。
支持向量机是近年来发展起来的一种新型的智能学习机器,适合于少样本的机器故障模式识别,并在故障诊断中取得了一定的成果。然而在实际应用中,由于时空的高度复杂性,支持向量机的执行常常是一种近似计算;同时,核函数参数的选择问题使得支持向量机极易发生过学习或欠学习现象,直接影响其推广性能。
集成支持向量机可以有效地提高单一支持向量机的分类性能,然而,当早期故障的特征非常微弱或者故障样本不典型时,仍可能会产生错误的诊断结果。故需要在特征提取的环节,通过现代信号处理方法来提高诊断信息的质量,从而提高故障诊断的准确性与可靠性。选择适当的现代信号分析方法,机器原发型故障、早期故障等难以预示的故障均可能加以识别,为早期潜在故障的智能诊断提供依据。综合运用人工智能和系统分析方法各自的优点,取长补短,优势互补,能够有效地提高诊断的快速性和准确性,降低误诊率和漏诊率,确定故障发生的准确时间和位置,估计其严重程度和发展趋势。
发明内容
本发明的目的在于克服上述现有技术的不足,提供一种机械故障的集成支持向量机混合智能诊断方法,该方法精度高、成本低、简单可靠,便于工程实践中使用,通过将提升小波包变换和经验模式分解这两种现代信号处理技术、特征距离评估技术与集成支持向量机进行有效融合,实现对故障运行状态的智能诊断。
本发明的技术方案是这样解决的按下述步骤进行
1)分别采用提升小波包按频段和经验模式分解按本征模式分量对振动信号进行分解,提取分解信号的时域统计特征,构成全体特征集;2)提出特征距离评估技术及特征评估指标,按照特征评估指标大小从全体特征集中选取最敏感特征集;3)将获得的最敏感特征集作为诊断特征,建立集成支持向量机混合智能诊断模型,实现对设备运行状态的智能诊断。
所说的特征距离评估技术及特征评估指标如下首先,对于一个原始振动信号X(t),计算l个时域统计特征Ftime,l个时域统计特征是指均值、方差、方根幅值、有效值、峰值、偏斜度、峭度、波形指标、峰值指标、裕度指标和脉冲指标中的一个或多个;利用提升小波包变换将X(t)分解m层,m取值为2、3或4,得到2m个分解信号,对每个分解信号分别计算l个统计特征,共得到l×2m个提升小波包变换后的特征Fwp;采用经验模式分解将X(t)分解得到前n个本征模式分量,n取值为4到8的整数,计算n个本征模式分量的相对能量特征Femd,从而构成全体特征集Ftotal=[FtimeFwpFemd];接着,将全体特征集Ftotal的类间距Sb与类内距Sw的比值设定为距离评估指标JA;最后,按照特征评估指标JA的大小,从全体特征集Ftotal中选择大于给定阈值ρ的特征评估指标JA所对应的特征,将最大分类准确率所对应的阈值设为ρ,从而构成最敏感特征集Fsensitivity。
所述的集成支持向量机混合智能诊断模型建立方法如下首先利用袋装算法,简称Bagging算法,从训练样本中随机生成T个训练样本子集TRt(t=1,2,…,T),T取值为10到100的整数,然后利用T个多分类支持向量机对这些子集TRt进行训练,得到T个子分类器ft;设T个子分类器ft的平均分类误差为 将f=1/E^]]>作为遗传算法的适应度函数,对T个子分类器ft的集成结果进行优化,得到分类器的优化权值大于预设阈值λ=1/T的权值向量w,从而构成集成支持向量机,用最敏感特征集Fsensitivity作为诊断特征,对集成支持向量机进行训练,即可建立混合智能诊断模型,利用混合智能诊断模型实现机械故障的智能诊断。
由于本发明实现了基于现代信号分析技术的特征提取、最敏感特征集的选择和集成智能分类方法在算法上的混合,本发明具有下列区别于传统方法的显著优势1)进行特征距离评估可以有效地去除原始特征集中的不相关或冗余信息,选择到最敏感特征集,从而提高分类器的分类准确率和运算效率;2)建立集成支持向量机混合智能模型进行智能分类,能很好地进行少样本模式识别,有效地提高了单一分类器的分类性能和抗噪能力,为准确有效的诊断提供了保证;3)整个过程实现了特征提取、特征选择和模式识别在算法上的混合,为机械故障的智能诊断提供了有效的实用新技术。
图1为机械故障的集成支持向量机混合智能诊断流程图;图2为某电力机车走行部轮对结构示意图;图3为最敏感特征集选择的距离评估图;图4为不同的特征评估指标阈值下,集成支持向量机与单一支持向量机和Bagging算法的分类性能比较图;图5为不同的噪声含量下,集成支持向量机与单一支持向量机和Bagging算法的分类性能比较图。
具体实施例方式
附图是本发明的具体实施例;下面结合附图对本发明的内容作进一步详细说明1)对设备的振动量信号分别进行提升小波包变换和经验模式分解,提取各个不同频段分量的时域统计特征,构成全体特征集,将获得的全体特征集进行特征距离评估,选取最敏感特征集;2)将获得的最敏感特征集作为诊断特征,对集成支持向量机进行训练,训练好的混合智能诊断模型即可对设备运行状态进行智能分类。
根据上述发明内容和图1的混合智能诊断结构流程,首先,构造原始特征集。
对于一个原始振动信号X(t),提取11个时域统计特征Ftime(均值、方差、方根幅值、有效值、峰值、偏斜度、峭度、波形指标、峰值指标、裕度指标和脉冲指标)。
对于原始振动信号X(t),数据长度为L,j尺度将逼近信号{sj+1(k)}剖分为奇、偶样本序列{sj(2k+1)}和{sj(2k)},采用插值细分原理用N个偶样本预测奇样本,则细节信号dj(k)为dj(k)=sj+1(2k+1)-Σm=1Np(m)sj+1(2m+k-N)---(1)]]>式(1)中p(m)为预测系数,令P=[p(1),…,p(N)]T,采用式(1)求得的 个细节信号dj(k)更新偶样本{sj(2k)},则逼近信号sj(k)为sj(k)=sj+1(2k)-Σm=1N~u(m)dj(m+k-N~/2-1)---(2)]]>式(2)中u(m)为更新系数,令U=[u(1),···,u(N~)]T.]]>在式(1)和式(2)中,选取不同的N和 将得到具有不同消失矩的尺度函数和小波函数。
以N和 构造的具有冲击信号特性的小波为基函数,采用提升策略对小波子空间Wj进行分解,从而得到小波包变换后的子空间Ujn的信号为Xj={xj,n,l,j,n,l∈Z},Xj,n,l为j尺度的第n频带的第l个数据。
对原始信号X(t),利用提升小波包变换分解3层,得到8段小波包频带系数,对每段系数各提取与原始信号处理中相同的11个统计特征,共得到88个提升小波包变换后的特征Fwp。
经验模式分解可将任意信号分解为若干个本征模式分量和一个余项。所谓本征模式分量就是满足2个条件的函数或信号①在整个数据序列中,极值点的数量与过0点的数量必须相等或最多相差一个。②在任何一点,数据序列的局部极大值点确定的上包络线和局部极小值点确定的下包络线的均值为0,即信号关于时间轴局部对称。经验模式分解的本质是一个筛选的过程,经过一系列分解后,时间序列X(t)可表示成n个本征模式分量fi(t)和一个余项rn(t)之和,即x(t)=Σi=1nfi(t)+rn(t)---(3)]]>式(3)中得到的n个本征模式分量fi(t),其频率从大到小排列,f1(t)所含频率最高,fn(t)所含频率最低,余项rn(t)是一个非震荡的单调序列。
对原始信号X(t),利用经验模式分解得到前六个本征模式分量,提取6个本征模式分量的相对能量特征Femd,得到全体特征集Ftotal=[FtimeFwpFemd]。
然后,对原始特征集Ftotal进行特征选择。
假设c个模式类ω1,ω2,…,ωc的联合特征向量集为{q(i,k),i=1,2,…,c;k=1,2,…,Ni},其中q(i,k)为ωi中的第k个特征,Ni为ωi中特征向量的数目。特征选择可分为三个步骤第一步计算ωi类中所有特征向量间的平均距离如下Si=12NiΣj=1Ni1Ni-1Σk=1Ni|q(i,j)-q(i,k)|---(4)]]>对Si(i=1,2,…,c)求平均后得到平均类内距离为Sw=1cΣi=1cSi---(5)]]>
第二步计算c个模式类的类间距离如下Sb=1cΣi=1c|μ(i)-μ|---(6)]]>其中μ(i)=1NiΣk=1Niq(i,k)]]>为ωi中所有特征的均值,μ=1cΣi=1c1NiΣk=1Niq(i,k)]]>为c个模式类样本的总体均值。
第三步定义类间距与类内距的比值JA为距离评估指标JA=SbSw---(7)]]>从(7)式的定义中可以看出,小的平均类内距离和大的平均类间距离才具有好的可分性,因此选择大于一定阈值的JA所对应的特征构成最敏感特征集Fsensitivity,将最大分类准确率所对应的阈值设为ρ。
最后,建立集成支持向量机混合智能诊断模型,对最敏感特征集Fsensitivity进行智能分类。
支持向量机(Support Vector Machines,SVMs)是基于统计学习理论和结构风险最小化原则的一种小样本模式识别算法。在集成支持向量机算法中,首先利用Bagging算法从训练样本中随机生成T个训练样本子集TRt(t=1,2,…,T),然后利用T个多分类支持向量机对这些子集TRt进行训练,得到T个子分类器ft。在本发明中,设T个子分类器ft的平均分类误差为 将f=1/E^]]>作为遗传算法的适应度函数,对T个子分类器ft的集成结果进行优化,得到分类器的优化权值大于预设阈值λ=1/T的权值向量w,从而构成集成支持向量机。其算法如表1所示。
表1集成支持向量机算法输入N个训练样本{(x1,y1),…,(xN,yN)}构成训练样本集S,yi∈Y={1,2,…,k}基于SVMs基本分类器f迭代次数T预设阈值λ计算过程步骤一循环for t=1 to T从中利用Bagging算法随机重采样,得到训练样本子集TRt
用子集TRt对基本分类器f进行训练,得到分类器ft结束步骤二利用遗传算法,优化权值w,其中wi>λ从而,从分类器{ft,t=1,2,…,T}中选择合适的支持向量机集成个体,构成集合T*输出总体分类器的判别函数f(xi)=argmaxΣT*j=1|ft(xi)=yi|;]]>其中算子|·|的含义为,当·为真时,|·|=1,否则|·|=0利用训练好的支持向量机混合智能诊断模型,即可对设备运行状态进行诊断,从而可以获得故障的类型。
参照图1所示,为机械故障的集成支持向量机混合智能诊断流程图,机械设备的振动信号经过传感器和数据采集系统的拾取,以及信号预处理系统的预处理后,可获得原始时域振动信号;计算原始时域振动信号的11个时域特征、提升小波包分解后的88个统计特征和经验模式分解后的6个相对能量特征,构成全体特征集;利用特征距离评估技术对全体特征集进行特征选择,构成最敏感特征集;用训练样本的最敏感特征集对集成支持向量机进行训练,构建集成支持向量机混合智能诊断模型,利用该模型即可对机械设备进行实时智能诊断,最后得到混合智能诊断结果。
参照图2所示,为某电力机车走行部轮对结构示意图,每个轮对由两个轴承1和5、两个车轮2和4和一根车轴3组成,将加速度传感器6安装在轴承座上方进行振动信号拾取。
参照图3所示,为最敏感特征集选择的距离评估图,根据设定的阈值ρ,从而可以确定大于该阈值的距离评估指标JA所对应的特征即为最敏感特征集,其中,横坐标为特征序号,纵坐标为距离评估指标JA。
参照图4所示,为不同的特征评估指标阈值下,集成持向量机与单一持向量机和Bagging算法的分类性能比较图,通过与传统方法的比较可以看出,在不同的阈值下,本发明都具有很好的分类效果,且当ρ=20时选择的特征即为最敏感特征集,其中,横坐标为阈值ρ,纵坐标为分类准确率。
参照图5所示,为不同的噪声含量下,集成SVMs与单一SVMs和Bagging算法的分类性能比较图,通过与传统方法的比较可以看出,在不同的噪声含量下,本发明都具有很高的诊断效率高和抗噪能力,其中,横坐标为噪声含量百分比,纵坐标为分类准确率。
实施例该实施例给出了本发明在工程实践中的具体实施过程,同时验证了该发明的有效性。
某客运型电力机车走行部由六副轮对组成。轮对由一根车轴和两个车轮组成,每副轮对再与轴箱组合在一起。轮对结构如图2所示。由安装在车轮轴承座上方的加速度传感器进行信号采集,采样频率为12.8KHz,数据长度为8192个点。
取该电力机车轴承在四种工况(正常、外圈故障、滚动体故障、外圈和滚动体复合故障)下的振动数据各36组,其中22组作为训练数据,另14组作为测试样本。从电力机车轴承振动的训练数据集中提取的全体特征集Ftotal=[FtimeFwpFemd]由105个特征组成,这些特征的距离评估指标值如图3所示。
为了验证集成SVMs方法的分类性能,同时也对单一SVMs分类算法和基于SVMs的Bagging算法分类算法进行了分析。此处取集成SVMs的数目T=20,可选择集成SVMs中的预设阈值λ=1/T=0.05。
单一SVMs、Bagging算法和集成SVMs的分类结果如表2所示。其中分类精度为每次试验重复10次的平均结果。
表2不同阈值对应的SVMs、Bagging和集成Bagging的分类精度比较
如表2所示,随着阈值的增加,特征数目逐渐减少。在训练过程中,单一SVMs的分类精度都大于98.95%,且在ρ=0.5,5或20时取得最大值(100%);然而,Bagging算法和集成SVMs的训练样本的分类精度都为100%。另外还可以看出,在集成SVMs中,平均SVMs的集成个数(9.3)大约为整体数目(20)的一半,因此与Bagging算法相比,可选择集成SVMs的测试时间将大幅度减少(从0.12秒降到0.02秒)。
针对不同的特征选择阈值,单一SVMs、Bagging算法和集成SVMs的测试样本分类结果如图4所示。
从图4中可以看出,对于单一SVMs的测试结果而言,当不进行特征选择时,其分类准确率仅为63.33%;分类准确率随着阈值的增加而提高,最高达到97.05%,此时阈值ρ=20,这表明ρ=20时选择的特征即为最敏感特征集。可以发现,集成SVMs的分类性能优于其它两种方法,当ρ=20时,集成SVMs取得最好的分类效果(100%)。
进一步验证集成SVMs的泛化性能,在测试数据中添加不同含量的随机噪声。不失一般性,在Bagging算法和集成SVMs中取集成SVMs的数目T=20进行实验,阈值ρ=20。不同噪声含量的分类准确率如图5所示。从图中可以看出,随着噪声含量的增加,对于集成SVMs来说,当噪声含量小于20%时,其分类精度都大于90%。当噪声含量在0与40%之间时,集成SVMs的分类精度都高于Bagging算法。随着噪声含量的进一步增加,集成SVMs的分类精度与Bagging算法的分类精度相当,都为70%左右,但是在集成SVMs中,平均SVMs的集成个数(9.3)大约为Bagging算法的集成个数(20)的一半,可选择集成SVMs的测试时间将大幅度减少(从0.12秒降到0.02秒)。这些都说明集成SVMs计算效率高、抗噪能力强。
从图4和图5的分析可知,集成SVMs的分类性能优于单一SVMs和Bagging算法,对于机车轮对轴承的故障诊断来说,当特征距离评估技术中的阈值设定为ρ=20时,其分类准确率为100%,这说明集成支持向量机混合智能诊断方法能够准确地诊断出轴承的外圈故障、滚动体故障和外圈和滚动体复合故障,具有很好的智能诊断能力。
权利要求
1.一种机械故障的集成支持向量机混合智能诊断方法,包括1)分别采用提升小波包按频段和经验模式分解按本征模式分量对振动信号进行分解,提取分解信号的时域统计特征,构成全体特征集;其特征在于2)提出特征距离评估技术及特征评估指标,按照特征评估指标大小从全体特征集中选取最敏感特征集;3)将获得的最敏感特征集作为诊断特征,建立集成支持向量机混合智能诊断模型,实现对设备运行状态的智能诊断。
2.根据权利要求1所述的机械故障的集成支持向量机混合智能诊断方法,其特征在于,所说的特征距离评估技术及特征评估指标如下首先,对于一个原始振动信号X(t),计算1个时域统计特征Ftime,1个时域统计特征是指均值、方差、方根幅值、有效值、峰值、偏斜度、峭度、波形指标、峰值指标、裕度指标和脉冲指标中的一个或多个;利用提升小波包变换将X(t)分解m层,m取值为2、3或4,得到2m个分解信号,对每个分解信号分别计算1个统计特征,共得到1×2m个提升小波包变换后的特征Fwp;采用经验模式分解将X(t)分解得到前n个本征模式分量,n取值为4到8的整数,计算n个本征模式分量的相对能量特征Femd,从而构成全体特征集Ftotal=[FtimeFwpFemd];接着,将全体特征集Ftotal的类间距Sb与类内距Sw的比值设定为距离评估指标JA;最后,按照特征评估指标JA的大小,从全体特征集Ftotal中选择大于给定阈值ρ的特征评估指标JA所对应的特征,将最大分类准确率所对应的阈值设为ρ,从而构成最敏感特征集Fsensitivity。
3.根据权利要求1所述的机械故障的集成支持向量机混合智能诊断方法,其特征在于,所述的集成支持向量机混合智能诊断模型建立方法如下首先利用袋装算法,简称Bagging算法,从训练样本中随机生成T个训练样本子集TRt(t=1,2,…,T),T取值为10到100的整数,然后利用T个多分类支持向量机对这些子集TRt进行训练,得到T个子分类器ft;设T个子分类器ft的平均分类误差为 将 作为遗传算法的适应度函数,对T个子分类器ft的集成结果进行优化,得到分类器的优化权值大于预设阈值λ=1/T的权值向量w,从而构成集成支持向量机,用最敏感特征集Fsensitivity作为诊断特征,对集成支持向量机进行训练,即可建立混合智能诊断模型,利用混合智能诊断模型实现机械故障的智能诊断。
全文摘要
本发明公开了一种机械故障的集成支持向量机混合智能诊断方法。该方法分别采用提升小波包按频段和经验模式分解按本征模式分量对振动信号进行分解,提取分解信号的时域统计特征,构成全体特征集;提出特征距离评估技术及特征评估指标,按照特征评估指标大小从全体特征集中选取最敏感特征集;将最敏感特征集作为诊断特征,建立集成支持向量机混合智能诊断模型,实现对故障运行状态的智能诊断。
文档编号G01M99/00GK1811367SQ20061004188
公开日2006年8月2日 申请日期2006年3月3日 优先权日2006年3月3日
发明者何正嘉, 訾艳阳, 胡桥, 雷亚国, 陈雪峰, 张周锁 申请人:西安交通大学