1.本发明涉及电气设备监测技术领域,并且更具体地,涉及一种基于决策树识别断路器操动机构振动的方法及系统。
背景技术:2.目前,高压断路器操作机构振动信号故障诊断方法方面,主要包括基于定性经验知识、统计分析以及人工智能的3类方法。基于定性经验知识的故障识别方法需要利用深厚的专业知识以及经验积累判断故障类型,但高压断路器结构复杂、不确定性强,因此这类方法的运用较少;基于统计分析的故障诊断方法利用特征信息中统计量的可重复性,通过对特定变量设定阈值等方法来判断故障类型,但对数据的准确性与完备性要求较高,方法的容错性和适应性较差。
3.因此目前主要应用的人工智能算法实现高压断路器的故障诊断,如基于粗糙集神经网络的诊断方法对正常、连接销松动、机构连接螺栓松动、合闸脱扣器卡涩、操动机构卡涩五种故障振动信号的诊断结果可靠率超过 80%;基于优化后的支持向量机诊断方法,对弹簧操动式高压断路器进行弹簧疲劳和合闸挚子卡涩故障的模拟实验和分析结果表明,振动信号的时频特性能较好反映高压断路器的机械状态,该特征分类方法对断路器模型上正常情况、弹簧疲劳、合闸挚子卡涩3种状态分类准确率达91.67%,基于tsallis熵与层次化混合分类器,将断路器机械操动机构振动信号进行时域分割,对分割后的各段信号分别直接提取7种特征,构成特征向量,将特征向量输入到基于单类支持向量机(ocsvm)与极限学习机(elm)的层次化混合分类器中开展故障诊断,在混合分类器中,首先由ocsvm区分正常与故障状态;如为故障状态,则使用elm识别故障类型,之后再以ocsvm校正elm识别结果。对正常样本20组、3种故障状态各10 组以及无训练样本类型故障识别结果表明,对已知故障类型数据诊断识别率达100%,但对无训练样本类型故障识别率不佳,在无训练样本的状态识别中,elm与svm均无法识别为未知故障类型,其中elm将10组样本中的2组样本误识别为正常,而svm将故障样本全部识别为正常状态。基于小波包、rbf神经网络与d-s证据理论的决策层信息融合诊断方法,对正常状态和2类异常状态的真空断路器振动信号进行融合分析,诊断准确率在86%至94%区间。通过将原始信号利用经验模态进行分解,得到的一组固有模态函数分量做为近似熵算法的输入,将多个分量的近似熵组成一个特征向量来表征原始信号,引入支持向量机对不同状态的样本进行有效分类,对铁心卡涩、润滑不足和底座松动各5组的数据诊断结果识别率达100%,但对8组正常状态数据诊断识别率仅为80%。
4.从目前的研究成果看,不同的人工智能诊断方法在gis设备操作机构振动信号的分析与诊断方面,但仍存在有待改进之处,如诊断准确率有待提升、诊断方法对不同故障的适应性不足、单一类型故障样本量不足,以及部分数据不是基于真型试验平台故障导致的算法的有效性不足等问题,需要继续开展基于真型试验平台的故障模拟试验同时开展诊断算法的开发工作。
技术实现要素:5.针对上述问题,本发明提出了一种基于决策树识别断路器操动机构振动的方法,包括:
6.针对断路器操动机构运行状态的初始数据,将初始数据库按照预设比例分为训练样本和测试样本,对初始数据进行预处理,确定断路器操动机构运行状态的样本属性,将样本属性作为训练样本的属性;
7.对具备样本属性的训练样本输入决策树进行训练,建立cart分类树;
8.对建立的cart分类树与测试样本进行测试,确定cart分类树,对识别断路器操动机构运行状态的准确率,并根据准确率,确定cart分类树的有效性;
9.若cart分类树具备有效性,将目标断路器操动机构的运行状态数据输入至cart分类树,通过cart分类树识别目标断路器操动机构的振动情况。
10.可选的,确定断路器操动机构运行状态的样本属性,包括:
11.根据断路器操动机构运行状态的振动声学指纹数据库,提取5种运行状态的初始数据中的振动声学指纹数据的方差,将方差作为样本特征;
12.将提取样特征的5种运行状态的初始数据,按照运行状态归类为5个样本集,将5个样本集中每两个样本集之间组成一个等效平面,共组成10 个等效平面,计算断路器操动机构中每个待测数据点到10个等效平面的等效距离,将等效距离作为样本属性;
13.所述振动声学指纹数据库,根据ct26弹簧型gis操动机构对4种故障进行了实验室模拟,利用加速度传感器建立振动声学指纹数据库。
14.可选的,计算断路器操动机构中每个待测数据点到10个等效平面的等效距离,包括:
15.定义一个三维平面的方程,如下:
16.ax+by+cz+d=0
17.其中,x,y,z是三维坐标,a、b、c为x,y,z的变量系数,d为常数项;
18.定义平面外任意一点p0(x0,y0,z0),平面上一点p1(x1,y1,z1),d为向量p1p0在法向量n上投影的长度,即d的计算公式如下:
[0019][0020]
因此,得p0(x0,y0,z0)到平面的等效距离为:
[0021][0022]
可选的,建立cart分类树,具体包括:
[0023]
将具备样本属性的训练样本输入决策树,计算训练样本的属性值,根据属性值确定基尼系数的划分阈值初始值及划分阈值,并向决策树输入停止划分的条件;
[0024]
所述停止划分的条件,包括:最大深度和基尼系数的划分阈值;
[0025]
3.1计算样本属性对训练样本的基尼系数值;
[0026]
根据训练样本的基尼系数值,判断是否找到训练样本的最优划分属性及最优划分属性的最优切分点,判断最优切分点是否满足决策树输入的停止划分的条件,若判断为是,则生成叶子节点,建立cart分类树;若否,则生成左右两个子节点;
[0027]
3.2针对样本属性,选择基尼系数值最小的样本属性及所述尼系数值最小的样本属性划分阈值作为最优属性和最佳划分阈值,并将决策树中现有节点内的训练样本划分至左右两个子节点中,返回步骤3.1。
[0028]
可选的,计算样本属性对训练样本的基尼系数,具体为:将训练样本分为两个子样本,并对两个子样本,对样本属性中的每个属性基尼系数值。
[0029]
可选的,基尼系数值的计算公式如下:
[0030][0031]
式中,s为训练样本数量,pj为第j类样本占总样本的概率,j为任意一类训练样本,n为s中样本类别的个数。
[0032]
可选的,划分阈值的计算公式如下:
[0033][0034]
其中,s1,s2是划分的两个训练样本,gini(s,a)为属性a的划分阈值为a时,训练样本s分解后集合的不确定性。
[0035]
本发明还提出了一种基于决策树识别断路器操动机构振动的系统,包括:
[0036]
数据采集单元,针对断路器操动机构运行状态的初始数据,将初始数据库按照预设比例分为训练样本和测试样本,对初始数据进行预处理,确定断路器操动机构运行状态的样本属性,将样本属性作为训练样本的属性;
[0037]
训练单元,对具备样本属性的训练样本输入决策树进行训练,建立 cart分类树;
[0038]
测试单元,对建立的cart分类树与测试样本进行测试,确定cart 分类树,对识别断路器操动机构运行状态的准确率,并根据准确率,确定 cart分类树的有效性;
[0039]
识别单元,在测试cart分类树具备有效性后,将目标断路器操动机构的运行状态数据输入至cart分类树,通过cart分类树识别目标断路器操动机构的振动情况。
[0040]
可选的,确定断路器操动机构运行状态的样本属性,包括:
[0041]
根据断路器操动机构运行状态的振动声学指纹数据库,提取5种运行状态的初始数据中的振动声学指纹数据的方差,将方差作为样本特征;
[0042]
将提取样特征的5种运行状态的初始数据,按照运行状态归类为5个样本集,将5个样本集中每两个样本集之间组成一个等效平面,共组成10 个等效平面,计算断路器操动机构中每个待测数据点到10个等效平面的等效距离,将等效距离作为样本属性;
[0043]
所述振动声学指纹数据库,根据ct26弹簧型gis操动机构对4种故障进行了实验室模拟,利用加速度传感器建立振动声学指纹数据库。
[0044]
可选的,计算断路器操动机构中每个待测数据点到10个等效平面的等效距离,包括:
[0045]
定义一个三维平面的方程,如下:
[0046]
ax+by+cz+d=0
[0047]
其中,x,y,z是三维坐标,a、b、c为x,y,z的变量系数,d为常数项;
[0048]
定义平面外任意一点p0(x0,y0,z0),平面上一点p1(x1,y1,z1),d为向量p1p0在法向量n上投影的长度,即d的计算公式如下:
[0049][0050][0051]
因此,得p0(x0,y0,z0)到平面的等效距离为:
[0052][0053]
可选的,建立cart分类树,具体包括:
[0054]
将具备样本属性的训练样本输入决策树,计算训练样本的属性值,根据属性值确定基尼系数的划分阈值初始值及划分阈值,并向决策树输入停止划分的条件;
[0055]
所述停止划分的条件,包括:最大深度和基尼系数的划分阈值;
[0056]
3.1计算样本属性对训练样本的基尼系数值;
[0057]
根据训练样本的基尼系数值,判断是否找到训练样本的最优划分属性及最优划分属性的最优切分点,判断最优切分点是否满足决策树输入的停止划分的条件,若判断为是,则生成叶子节点,建立cart分类树;若否,则生成左右两个子节点;
[0058]
3.2针对样本属性,选择基尼系数值最小的样本属性及所述尼系数值最小的样本属性划分阈值作为最优属性和最佳划分阈值,并将决策树中现有节点内的训练样本划分至左右两个子节点中,返回步骤3.1。
[0059]
可选的,计算样本属性对训练样本的基尼系数,具体为:将训练样本分为两个子样本,并对两个子样本,对样本属性中的每个属性基尼系数值。
[0060]
可选的,基尼系数值的计算公式如下:
[0061][0062]
式中,s为训练样本数量,pj为第j类样本占总样本的概率,j为任意一类训练样本,n为s中样本类别的个数。
[0063]
可选的,划分阈值的计算公式如下:
[0064][0065]
其中,s1,s2是划分的两个训练样本,gini(s,a)为属性a的划分阈值为a时,训练样本s分解后集合的不确定性。
[0066]
本发明提供了训练数据收集更为精准且迅速,且训练特征更为有效,训练出的决策树识别精度高。
附图说明
[0067]
图1为本发明方法的流程图;
[0068]
图2为本发明方法的cart分类树的流程图;
[0069]
图3为本发明方法的cart分类树识别结果图;
[0070]
图4为本发明系统的结构图。
具体实施方式
[0071]
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
[0072]
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
[0073]
本发明中提供了一种基于决策树识别断路器操动机构振动的方法,如图1所示,包括:
[0074]
针对断路器操动机构运行状态的初始数据,将初始数据库按照预设比例分为训练样本和测试样本,对初始数据进行预处理,确定断路器操动机构运行状态的样本属性,将样本属性作为训练样本的属性;
[0075]
对具备样本属性的训练样本输入决策树进行训练,建立cart分类树;
[0076]
对建立的cart分类树与测试样本进行测试,确定cart分类树,对识别断路器操动机构运行状态的准确率,并根据准确率,确定cart分类树的有效性;
[0077]
若cart分类树具备有效性,将目标断路器操动机构的运行状态数据输入至cart分类树,通过cart分类树识别目标断路器操动机构的振动情况。
[0078]
下面结合实施例对本发明进行进一步的说明:
[0079]
确定断路器操动机构运行状态的样本属性后,将断路器操动机构的5 种状态类型归类为5个样本集,5个样本集每两个之间组成一个等效平面,一共组成10个等效平面,计算每个待测数据点到10个等效平面的等效距离x1~x10,作为决策树输入样本的属性。
[0080]
确定属性步骤如下:
[0081]
对于任意一个三维平面,假设平面的方程为:
[0082]
ax+by+cz+d=0
[0083]
其中,x,y,z是三维坐标,a、b、c为x,y,z的变量系数,d为常数项;
[0084]
平面外的任意一点p0(x0,y0,z0),在平面上取一点p1(x1,y1,z1),那么点p0到平面的距离d就是向量p1p0在法向量n上投影的长度。
[0085][0086]
所以点(x0,y0,z0)到平面的等效距离为:
[0087][0088]
第二步,基于决策树算法进行训练。cart分类树的具体建立流程如图2所示,cart分类算法的具体步骤为:
[0089]
1)输入训练样本集s,计算训练样本集的属性值,输入决策树停止划分的条件,包含最大深度和基尼系数的最小阈值;
[0090]
2)计算现有属性对该样本集的基尼系数。针对每一个属性a,将样本集分为两个子样本集,计算此时的基尼系数值;
[0091]
3)判断决策树的划分阈值是否为达到最小阈值,若判断为是,则生成叶子节点;反之,根据左右子节点继续建立决策树;
[0092]
4)对于所有的属性,选择划分基尼系数最小的属性及相对应的划分阈值作为最优属性和最佳划分阈值,从现有节点生成左右两个子节点。并将现有节点内包含的训练数据集划分到这两个子节点中;
[0093]
5)对左右两个子节点继续步骤2),3),4)直至满足停止条件,cart 决策树建立完成。
[0094]
其中样本集的基尼系数与划分基尼系数定义为:
[0095]
(1)样本集的基尼系数gini(s):
[0096][0097]
式中,s为样本集,pj为第j类样本占总样本的概率,n为样本集s中样本类别的个数。
[0098]
(2)划分基尼系数
[0099]
设a为该样本集的某一属性,a表示属性a的划分阈值,由属性a是否大于a将样本集s分为两部分,对应的划分基尼系数gini(s,a)如下定义:
[0100][0101]
式中,s1,s2是由属性a将样本集s划分的两个子集。划分基尼系数 gini(s,a)表示属性a的划分阈值为a时,样本集s分解后集合的不确定性。划分基尼系数gini(s,a)越大表示分解后集合的不确定性越大。
[0102]
其中,将每类典型故障及正常状态数据均为100组,其中90组作为训练数据,10组作为预测数据,建立cart分类。
[0103]
本次试验共有6个安装位置,分别为a1:分闸弹簧筒末端;a2:合闸弹簧筒末端;a3、
a4:机构箱;a5:弹簧筒安装板;b1:分闸黄拉杆连接接头处。训练数据中每个点至5个样本集所组成的10个平面中心的等效距离: x1~x10作为决策树输入的训练属性值,利用决策树算法将所测得的训练数据分成了5类,包含gis断路器操动机构的5种设备状态,即正常运行状态与漏油、分闸弹簧疲软、合闸弹簧疲软和连杆松动故障等故障。
[0104]
第三步,将数据集中的另外10组数据作为测试集对所提出方法进行检验,测试集中数据每一种状态中10组数据的对应的状态已知,下表是结合 7个位置传感器采集到的数据,基于决策树方法对gis操动机构5种状态的状态识别准确率:
[0105]
表1
[0106][0107]
由表1状态识别准确率分析发现,基于决策树算法的诊断方法对gis 操动机构的正常情况、合闸弹簧疲软故障、分闸弹簧疲软故障、油缓冲器漏油故障、连杆松动故障等均具有较高的识别率,识别结果如图3所示,初步的诊断结果证明了本文中基于决策树诊断模型的有效性,本文研究成果可以为gis断路器操动机构机械故障现场不停电检测和诊断提供有效参考。
[0108]
本发明还提出了一种基于决策树识别断路器操动机构振动的系统200,如图4所示,包括:
[0109]
数据采集单元201,针对断路器操动机构运行状态的初始数据,将初始数据库按照预设比例分为训练样本和测试样本,对初始数据进行预处理,确定断路器操动机构运行状态的样本属性,将样本属性作为训练样本的属性;
[0110]
训练单元202,对具备样本属性的训练样本输入决策树进行训练,建立cart分类树;
[0111]
测试单元203,对建立的cart分类树与测试样本进行测试,确定 cart分类树,对识别断路器操动机构运行状态的准确率,并根据准确率,确定cart分类树的有效性;
[0112]
识别单元204,在测试cart分类树具备有效性后,将目标断路器操动机构的运行状态数据输入至cart分类树,通过cart分类树识别目标断路器操动机构的振动情况。
[0113]
其中,确定断路器操动机构运行状态的样本属性,包括:
[0114]
根据断路器操动机构运行状态的振动声学指纹数据库,提取5种运行状态的初始数据中的振动声学指纹数据的方差,将方差作为样本特征;
[0115]
将提取样特征的5种运行状态的初始数据,按照运行状态归类为5个样本集,将5个样本集中每两个样本集之间组成一个等效平面,共组成10 个等效平面,计算断路器操动机构中每个待测数据点到10个等效平面的等效距离,将等效距离作为样本属性;
[0116]
所述振动声学指纹数据库,根据ct26弹簧型gis操动机构对4种故障进行了实验室模拟,利用加速度传感器建立振动声学指纹数据库。
[0117]
其中,计算断路器操动机构中每个待测数据点到10个等效平面的等效距离,包括:
[0118]
定义一个三维平面的方程,如下:
[0119]
ax+by+cz+d=0
[0120]
其中,x,y,z是三维坐标,a、b、c为x,y,z的变量系数,d为常数项;
[0121]
定义平面外任意一点p0(x0,y0,z0),平面上一点p1(x1,y1,z1),d为向量p1p0在法向量n上投影的长度,即d的计算公式如下:
[0122][0123]
因此,得p0(x0,y0,z0)到平面的等效距离为:
[0124][0125]
其中,建立cart分类树,具体包括:
[0126]
将具备样本属性的训练样本输入决策树,计算训练样本的属性值,根据属性值确定基尼系数的划分阈值初始值及划分阈值,并向决策树输入停止划分的条件;
[0127]
所述停止划分的条件,包括:最大深度和基尼系数的划分阈值;
[0128]
3.1计算样本属性对训练样本的基尼系数值;
[0129]
根据训练样本的基尼系数值,判断是否找到训练样本的最优划分属性及最优划分属性的最优切分点,判断最优切分点是否满足决策树输入的停止划分的条件,若判断为是,则生成叶子节点,建立cart分类树;若否,则生成左右两个子节点;
[0130]
3.2针对样本属性,选择基尼系数值最小的样本属性及所述尼系数值最小的样本属性划分阈值作为最优属性和最佳划分阈值,并将决策树中现有节点内的训练样本划分至左右两个子节点中,返回步骤3.1。
[0131]
其中,计算样本属性对训练样本的基尼系数,具体为:将训练样本分为两个子样本,并对两个子样本,对样本属性中的每个属性基尼系数值。
[0132]
其中,基尼系数值的计算公式如下:
[0133][0134]
式中,s为训练样本数量,pj为第j类样本占总样本的概率,j为任意一类训练样本,n为s中样本类别的个数。
[0135]
其中,划分阈值的计算公式如下:
[0136][0137]
其中,s1,s2是划分的两个训练样本,gini(s,a)为属性a的划分阈值为a时,训练样本s分解后集合的不确定性。
[0138]
本发明提供了训练数据收集更为精准且迅速,且训练特征更为有效,训练出的决
策树识别精度高。
[0139]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本技术实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言java和直译式脚本语言javascript等。
[0140]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0141]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0142]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0143]
尽管已描述了本技术的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本技术范围的所有变更和修改。
[0144]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。