一种基于加权概率神经网络的故障分类方法

文档序号:31454135发布日期:2022-09-07 14:06阅读:83来源:国知局
一种基于加权概率神经网络的故障分类方法

1.本技术涉及机器学习技术领域,尤其涉及一种基于加权概率神经网络的故障分类方法。


背景技术:

2.在“工业4.0”背景下,电厂配备大量仪器,去捕获数百个变量每个时刻的值,构成巨大的数据集。当设备发生故障时,因数据中信息复杂多样,仅通过专家经验无法快速精准处理异常状态。如果故障处理不及时,故障状态进一步发展将导致工业事故进而造成人员伤亡以及严重的经济损失,甚至导致机组停机。因此,需要一套智能的故障分类工具,帮助确定故障信息并采取正确措施,保证机组的安全性和经济性。
3.故障分类是基于设备的故障检测,根据设备故障时运行参数的特征和变化,结合该设备的工作原理和热力性能,从数据中对故障进行分析,提供故障变量信息,快速准确地辨别故障类别,便于确定故障的解决方案。随着电站设备大型化、复杂化程度不断提升,不同故障往往耦合多个相同故障特征,传统的处理方式无法准确辨识故障的类别,因此精准的故障分类对于快速解决故障问题,保障机组安全稳定运行有着重要意义。


技术实现要素:

4.本技术提供了一种基于加权概率神经网络的故障分类方法,其技术目的是对故障进行精准分类,实现电站设备全工况运行下的故障实时分类,从而快速解决故障问题。
5.本技术的上述技术目的是通过以下技术方案得以实现的:
6.一种基于加权概率神经网络的故障分类方法,包括:
7.s1:基于电站设备的历史故障数据获取故障的训练样本集和测试样本集,训练样本集构成样本矩阵,对样本矩阵进行降维处理得到得分矩阵和载荷矩阵;
8.s2:采用基于重构的主成分分析法对得分矩阵和载荷矩阵中的故障特征进行提取,并将提取的故障特征作为加权概率神经网络的输入样本;
9.s3:通过所述故障特征对加权概率神经网络进行训练,得到加权概率神经网络模型;
10.s4:将测试样本集输入到训练好的加权概率神经网络模型中,获取故障分类结果。
11.本技术的有益效果在于:
12.(1)本技术提供的系统和方法学习速度快;所选用方法在训练过程中的学习规则简单,计算速度快,训练过程一次完成。
13.(2)在传统的基于贝叶斯决策的概率神经网络的基础上,在概率神经网络的模式层和求和层中添加权重因子衡量样本的类可分离性,用于进一步提供新型故障的信息用于故障分类决策。
14.(3)本技术提供的加权概率神经网络分类模型能够有效处理已知故障和新型故障,均能实现电站设备全工况运行下的故障分类。同时针对于新型故障,新的故障样本很容
易加入训练好的网络中,只需要增加相应的隐层单元,不需要重新训练,提升电厂运行的经济性和安全性。
15.(4)本技术中的故障分类模块是基于贝叶斯最小风险准则对样本进行分类的,可以最大程度的利用先验知识,无论分类问题多么复杂,只要有充足的训练样本,便可保证获得贝叶斯准则下的最优解。
附图说明
16.图1为本技术所述方法流程图;
17.图2为加权概率神经网络结构图;
18.图3为已知故障的权重分析结果示意图;
19.图4为新型故障的权重分析结果示意图。
具体实施方式
20.下面将结合附图对本技术技术方案进行详细说明。
21.凝汽器作为电厂汽轮机组的重要设备,对机组的真空指标有极其重要影响。本技术以某电厂凝汽器系统为研究对象,对其在不同工况下的故障进行分析。首先在该电厂的sis系统中采集凝汽器的数据,获取其在不同工况的运行数据以及离线历史故障数据,将故障数据做相应的标记,作为加权概率神经网络模型的训练数据。
22.表1凝汽器系统故障特征参数
23.编号名称编号名称f1凝汽器温度f
14
循环水泵功率f2凝汽器压力f
15
抽气器入口质量流量f3凝汽器液位f
16
抽气器出口混合压力f4汽轮机排汽质量流量f
17
抽气器出口混合温度f5端差f
18
凝汽器系统混合压降f6过冷度f
19
凝汽器系统混合温升f7循环冷却水质量流量f
20
附加热源f8循环冷却水入口温度f
21
空气泄漏量f9循环冷却水出口温度f
22
抽气器阀位f
10
循环冷却水入口压力f
23
循环冷却水控制阀位f
11
循环冷却水出口压力f
24
管内相对粗糙度f
12
循环冷却水温升f
25
凝结水泵出口压力f
13
循环冷却水压降f
26
循环水泵出口压力
24.当凝汽器系统发生故障时,该系统的各个运行参数均会受到不同程度的影响,这些参数包括现场利用传感器获得的实时运行数据,也包括基于热力计算获得的性能指标。用于凝汽器系统故障分类的特征参数如表1所示,并用于故障特征提取识别故障信息。
25.如图1所示,使用加权概率神经网络的故障分类方法,实现步骤包括:
26.s1:基于电站设备的历史故障数据获取故障的训练样本集和测试样本集,训练样本集构成样本矩阵,对样本矩阵进行降维处理得到得分矩阵和载荷矩阵。
27.具体地,通过传感器采集现场设备的故障数据,结合故障案例库数据、提取运行经验及故障仿真的规则,获取电站设备的故障数据,用于构建分类器的训练样本集,得到原始观测矩阵x,其中,n表示样本总数,且每个样本包括m个观测变量,则原始观测矩阵x表示为:
[0028][0029]
对原始观测矩阵x进行降维处理,包括:
[0030]
(1)对原始观测矩阵x的各列进行零均值和单位方差处理,得到协方差矩阵表示为:
[0031]
通过特征分解,协方差矩阵能够进一步分解为:
[0032][0033]
(2)则一个样本向量x能够分别投影到主元子空间和残差子空间,表示为:
[0034][0035]
(3)根据上述样本向量x的投影将原始观测矩阵x分解为得分矩阵t和载荷矩阵p;其中,原始观测矩阵x中,每一行代表一个样本,观测变量xi=[xi(1),xi(2),...,xi(n)];l表示主元个数;i=1,2,...,m。
[0036]
s2:采用基于重构的主成分分析法对得分矩阵和载荷矩阵中的故障特征进行提取,并将提取的故障特征作为加权概率神经网络的输入样本。
[0037]
为了成功辨识故障特征,采用反映残差空间的指标spe,通过计算观测变量xi的重构贡献值作为故障特征,然后基于各个样本变量的重构贡献值构成故障特征数据组。
[0038][0039][0040]
该方法可以指明真正的故障变量,其故障特征提取依据为:针对于故障变量,故障变量的spe指标重构后会有最大幅值的下降。根据重构后各变量的响应程度,响应最大的变量,将其作为主特征,此特征与重构的数据组作为提取的特征,用于此处故障的类别辨识。
[0041]
在贡献分析中,观测变量xi对于指标spe的贡献值表示为:
[0042][0043]
[0044][0045]
其中,表示单位矩阵中第i列,方向与xi相同;表示投影矩阵;表示投影矩阵的第i个对角元素。
[0046]
s3:通过所述故障特征对加权概率神经网络进行训练,得到加权概率神经网络模型。
[0047]
引入机器学习算法的加权概率神经网络,结合先验知识对设备进行详细建模,并描述特征与故障数据类型之间的联系,进行故障的分类识别。类可分离性代表着在特征向量中可以区分各种类别的能力,通常作为分类算法中的性能标准之一,即一组特征向量能通过该分类器实现最大化的类可分离性。然而传统概率神经网络为所有的模式层分配相同的权重,不能满足不同模式层的类可分离性最大化。加权概率神经网络是基于完善的统计原理,源于贝叶斯决策和非参数的核密度估计量,而不是启发式方法。由于权重因子的存在,求和层节点与模式层每个节点都相关,通过选择合适的平滑因子值可保证分类结果逼近贝叶斯最优决策,权重因子的引入与更新可提升分类器的分类精度。加权概率神经网络的网络结构图如图2所示。
[0048]
加权概率神经网络包括依次连接的样本输入层、模式层、求和层、决策输出层。
[0049]
样本输入层:输入待分类数据,其神经元个数为样本数据降维后的维度;通过高斯函数将样本层与模式层相关联。
[0050]
模式层:即径向基层,将输入数据的特征向量与各模式进行匹配,计算输入样本向量与每个神经元的中心矢量的距离。样本向量x与第i类第j个中心矢量的关系表示为:
[0051][0052]
其中,σ表示平滑因子;υ
ij
表示神经元向量x
ij
的“类间方差”和“类内方差”之比,权重因子考虑到不同模式的类分离性,对于高类可分离性(意味更好类别辨别能力),υ
ij
比值较大;对于低类可分离性,υ
ij
比值较小。x=(x1,x2,...,xm);ni表示类别ci中的样本总数。
[0053]
求和层:求和节点的数量等于训练样本的类别,神经元计算同一类别的模式节点输出总和,然后做加权平均。
[0054]
决策输出层:基于贝叶斯分类决策,决策出具备最大后验概率的类别,输出故障的类别。
[0055]
本技术基于敏感性分析推导出加权概率神经网络的权重因子的解析公式,权重因子用于在模式层和求和层之间反应第q个模式对第j个类别的重要性,权重因子的计算过程包括:
[0056]
计算所有模式下神经元的敏感度系数s,表示为:
[0057][0058]
其中,表示第j类的向量参数,则第j类的敏感度参数s表示为:
[0059][0060]
其中,sj第r列的元素表示:对于特定的输入模式q,加权概率神经网络中第j个类别对应的第r个神经元的核密度估计函数的敏感度参数的计算。由于sj中的每一项分母都是向量,因此需要确定梯度,如下:
[0061][0062]
聚合所有模式q并获取敏感向量,q=1,...,qj,则敏感向量aj表示为:
[0063][0064]
将aj中的元素归一化便得到第j类别中每个元素的权重ωj,表示为:
[0065][0066]
其中,当n=∞时,则wj被归一化为[0,1]区间,此时加权概率神经网络的求和层表示为:
[0067][0068][0069]
其中,r表示aj中第r个元素,n1,n2≥1;当计算加权概率神经网络权重因子时,n1=∞,n2=2
[0070]
s4:将测试样本集输入到训练好的加权概率神经网络模型中,获取故障分类结果。
[0071]
具体地,将实时故障数据输入到训练好的加权概率神经网络模型,随之输出故障类别,用于确定故障根源,并将分类结果传入dcs控制系统。
[0072]
作为具体实施例地,本技术将70%的数据集用于构建训练样本记为tr1,将30%的数据集用于构建测试样本记为te1。应用基于重构的主成分分析法进行特征提取,获取故障特征样本作为分类器的训练样本,输入到加权概率神经网络分类器,输出分类结果。
[0073]
为了加权概率神经网络方法的必要性和有效性,以测试集te1中一个观测值为例。
首先基于重构主成分分析法获取该样本故障特征,然后,将该样本故障特征输入到加权概率神经网络分类器,输出属于各个类别的概率值,输出最大概率类别为预测的故障类别。
[0074]
结果表明,该方法能够正确识别故障状态,并将最高概率值(1.0)分配给故障3,如表2所示,该故障对应于抽气器工作异常。通过故障提取过程,依据变量贡献值响应程度,得知f
16
是主特征即可确定引起故障的根本原因。基于以上故障的信息,提供用于解决该故障的方案。
[0075]
表2基于pnn类别概率计算
[0076]
故障类别012345概率值000100
[0077]
为了验证基于加权概率神经网络分类(wpnn)的准确性,将其与传统概率神经网络(pnn)以及其他五种常见的分类模型进行比较,包括:支持向量机(svm)、随机森林(rf)、决策树(dt)、极度随机树(et)、k最邻近法(knn)。所有分类模型均由数据集tr1进行训练,并使用数据集te1进行测试,分类结果的准确度如表3所示。
[0078]
表3六种分类方法的分类精度
[0079] wpnnpnnsvmrfdtetknn分类精度99.8%98.93%95.48%90.38%89.61%92.45%96.98%
[0080]
从表3可知,7类不同分类器精度的对比结果表明,传统概率神经网络方法和加权概率神经网络方法在故障分类模块均呈现良好的分类性能并优于其他类型的人工神经网络和分类器。加权概率神经网络方法可以训练出最优的分类器,这是因为加权概率神经网络方法基本上都拥有传统概率神经网络良好的性能,同时能够逼近多元高斯函数的概率密度函数。除此之外,加权概率神经网络还包括表征类可分离性的加权因子,对每个模式神经元对网络结果的贡献是可访问的。
[0081]
新型故障分类:为了验证加权概率神经网络方法对新型故障分类的效果,将第五类故障样本从原训练集tr1中移除,构建新的训练数据集tr2,因而故障5可作为训练集中不存在的新型故障。在测试集te1以一个第五类故障的样本为测试样本。
[0082]
表4基于wpnn类别概率计算
[0083][0084][0085]
由表4可知,分配到故障3的概率仅为0.163,无法直接作为故障类别判断依据,因此需要进一步根据权重因子计算结果判定故障类别。通过加权概率神经网络进行权重因子的计算,得到第3类故障样本的权重因子占比如图3所示,而故障测试样本的第三类故障权重因子的占比如图4所示。正常第三类故障样本的权重因子在89.45%,而故障测试样本第三类的权重仅为34.04%。测试样本权重计算结果并未展示出明显的类可分离性,因此该测试样本考虑为新型故障。
[0086]
面对新型故障,需要结合故障特征提取过程中故障变量隔离的信息,即f3变量对应的凝汽器水位为主故障特征,f
25
、f
13
为次要故障特征,因此首要考虑凝汽器满水故障。但若是单纯凝汽器满水故障,凝泵出口压力变量在重构分析中,不会存在较大幅度的相应,因此凝汽器满水只能考虑为故障征兆,而非故障主特征。选择次级响应幅度最大的f
25
变量作
为故障主特征。结合凝凝汽器水位满水征兆以及凝汽器系统的压力变化,可确定该新型故障为凝结水泵故障。
[0087]
以上为本技术示范性实施例,本技术的保护范围由权利要求书及其等效物限定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1