一种基于特征量相关性的发电厂厂用电系统故障选线方法及设备

文档序号:25045772发布日期:2021-05-14 12:08阅读:81来源:国知局
一种基于特征量相关性的发电厂厂用电系统故障选线方法及设备

1.本发明涉及发电厂厂用电系统故障选线技术领域,具体涉及一种基于特征量相关性的发电厂厂用电系统故障选线方法及设备。


背景技术:

2.随着我国电力工业的飞速发展,电网结构的不断变化,发电机、变压器容量的不断增加,大容量发电厂在整个电力系统中的影响也越来越大。发电厂厂用电系统因其所涉及的设备类型众多,使得其在实际运行中易发生停电事故,而单相接地故障是其中发生频率最高的一种。由于发电厂厂用电系统故障特征量种类繁多,每个特征量互相关联且各自的适用范围所有差异,同时可能伴随有外界的干扰以及系统运行状况的影响等因素,在大量的研究下,现虽有各种各样的接地故障选线方法,但在可靠性与普适性方面仍存在一定不足。
3.现有故障选线方法主要有信号注入法、稳态量选线法、暂态量选线法三种,但这些方法仅是对部分故障特征量进行处理,且选择故障特征量时存在一定的人为主观性,检测的适用范围有所局限,无法随发电厂厂用电系统连接形式作出相应的变化以适应复杂多样的故障状态,在实际使用中的适应性和可靠性并不够理想。


技术实现要素:

4.本发明的技术目的是,提供一种基于特征量相关性的发电厂厂用电系统故障选线方法及设备,适用于不同连接方式的发电厂厂用电系统故障选线,且准确度高。
5.为实现上述技术目的,本发明采用如下技术方案:
6.一种基于特征量相关性的发电厂厂用电系统故障选线方法,包括以下步骤:
7.步骤1,获取发电厂厂用电系统发生单相接地故时的n组故障特征量数据,构成历史特征样本集x=(x
i,j
)
n
×
p
,i=1,2,

,n,j=1,2,

,p;x
i,j
为第i组故障特征量数据x
i
的第j个故障特征量,p为x
i
包括的故障特征量个数;
8.步骤2,对历史特征样本集进行标准化处理得到标准化的历史特征样本集z=(z
i,j
)
n
×
p
;然后根据历史特征样本集z=(z
i,j
)
n
×
p
不同故障特征量之间的关系建立相关系数矩阵r=(r
j,j'
)
p
×
p
,j=1,2,

,p,j'=1,2,

,p,计算表达式为:
[0009][0010]
式中,r
j,j'
表示第j个故障特征量与第j'个故障特征量之间的相关系数,z
j
,z
j'
分别为历史特征样本集z的第j列和第j'列数据,cov(z
j
,z
j'
)为z
j
与z
j'
协方差,d(z
j
)和d(z
j'
)分别为z
j
和z
j'
的方差;
[0011]
步骤3,根据相关系数矩阵r,提取m个主成分进行可视化分析,进而从p个故障特征
量中优选s个故障特征量;根据优选的s个故障特征量从标准化的历史特征样本集中选取数据,重新组合形成新的历史特征样本集u=(u
i,j
)
n
×
s
,i=1,2,

,n,j=1,2,

,s;
[0012]
步骤4,将历史特征样本集u中的所有样本u
i
进行聚类分为内部故障类与外部故障类,并求得每个类别的聚类中心;
[0013]
步骤5,实时采集发电厂厂用电系统发生单相接地故障时的所述优选的s个故障特征量,作为待测样本;计算待测样本分别与内部故障类和外部故障类的聚类中心的距离,距离更短对应的故障类即为发电厂厂用电系统当前单相接地故障的类型。
[0014]
本技术方案将多个故障特征量组合形成历史样本集,并进行标准化处理,其相似性关系可以通过样本相似性度量定量地体现,按照样本性质上的相似程度来进行适合于该样本集的分类。在得到历史样本聚类模型后,可以通过将待测样本数据集中的样本依次通过距离判别法中的一种方式比较待测样本与各故障类的聚类中心之间的距离,以对待测样本与各故障类的相似程度进行量化,待测样本必与其中一类别之间的距离最短,则可以将距离最短对应的故障类作为该待测样本的故障类别,此时即可判断出待测样本当时的属性。优选后的故障特征量组成的历史样本集相较于未优选的原始样本集,每个样本包含的故障特征量更少,减少了选线所需的计算量;同时优选出的故障特征量于接地故障具有更高的相关性,能够更好的表现出故障包含的信息并进行更加精确的故障选线。
[0015]
在更优的技术方案中,步骤3中根据相关系数矩阵r提取m个主成分的具体过程为:
[0016]
计算相关系数矩阵r的特征方程,得到|r

λi
p
|=0,得到p个特征值并排序为λ1≥λ2≥

≥λ
p
≥0,其中λ
i
=var(y
i
),y
i
为重新组合形成的第i个主成分,var(y
i
)为主成分的方差,于是可以求得第i个主成分的方差贡献率为
[0017][0018]
然后从第m=1开始累计前m个主成分的方差贡献率累计量为:
[0019][0020]
当方差贡献率累计量ρ首次超过预设值σ时,保留当前参与方差贡献率累计的m个主成分。
[0021]
在更优的技术方案中,预设值σ的取值为σ=75%。
[0022]
在更优的技术方案中,从p个故障特征量中优选s个故障特征量的方法为:
[0023]
首先,按以下表达式计算前m个主成分构成的主成分矩阵y和历史特征样本集z之间的特征向量矩阵b:
[0024][0025]
式中,y=[y1,y2,

,y
m
]
t
,y1,y2,

,y
m
分别为保留的m个主成分,z1,z2,

,z
p
为历史特征样本集z中的p组故障特征量;特征向量矩阵b中的各元素表示历史特征样本集z中的
某个故障特征量对某个主成分的贡献率;
[0026]
然后,从p个故障特征量中优选s个故障特征量:
[0027]
若p个故障特征量对第一主成分的p个贡献率中,超过该第一主成分贡献率阈值的个数d≥s,则选择对第一主成分贡献率最大的s个故障特征量;
[0028]
若p个故障特征量对第一主成分的p个贡献率中,超过该第一主成分贡献率阈值的个数d<s,则选择对第一主成分贡献率最大的d个故障特征量;
[0029]
所需要的另外s

d个故障特征量,在第一主成分选择剩余的p

d个故障特征量中,依次按照第二主成分、第三主成分
……
的顺序在其他主成分中选择,直到选出s个故障特征量,且选择方法与第一主成分选择方法相同。本技术方案保留的前m个主成分作为包含有大多数原故障特征量历史样本数据的新变量,其中各个原特征量对其的贡献程度都不一样,通过对前几大主成分进行分析以特征向量表示前m个主成分与原故障特征量之间的相关性系数,其值越大,则表示相关性越强,该故障特征量对相应主成分的贡献程度越大,表明它能够更好的描述厂用电接地故障信息,达到了优选的目的。
[0030]
在更优的技术方案中,步骤5中所述的计算待测样本分别与内部故障类和外部故障类的聚类中心的距离,采用欧式距离进行计算:
[0031][0032]
式中,u
r,j
为待测样本u
r
的第j个故障特征量,为第a种故障类的聚类中心的第j个故障特征量;d
r,a
为待测样本u
r
与第a种故障类的聚类中心的欧式距离。
[0033]
在更优的技术方案中,内部故障类与外部故障类的聚类中心计算公式为:
[0034][0035][0036]
式中,为第a种故障类的聚类中心,a=1,2分别表示内部故障类和外部故障类;
[0037]
分别为中的s个故障故障特征量;为历史特征样本集u中属于第a种故障类的第n个样本的第j个故障故障特征量,n
a
为历史特征样本集u中属于第a种故障类的样本个数。
[0038]
在更优的技术方案中,x
i
包括的p个故障特征量分别为:三相电压、三相电流、正序电流、负序电流、零序电流以及零序电压。
[0039]
一种电子设备,包括处理器和存储器;其中:所述存储器用于存储计算机指令;所述处理器用于执行所述存储器存储的计算机指令,具体执行上述任一技术方案所述的方法。
[0040]
有益效果
[0041]
1、本发明提供的基于特征量相关性的发电厂厂用电系统故障选线方法,其通过研究故障特征量的相关性并以此对不同发电厂厂用电系统采集到的多种故障特征量进行择
优选择。不以物理模型为基础而是基于关联性分析的结果进行具体的分析确定出最合适该厂用电系统的几种特征量,应用系统聚类算法将基于优选后的故障特征量所组成的原始特征样本集划分至内部故障与外部故障两大类别,并通过所得聚类选线模型准确判断故障线路,提高了发电厂厂用电系统故障选线精度。
[0042]
2、本发明提供的所述方法通过主成分数统分析的方法灵活地优选最合适该发电厂厂用电系统的故障特征量,因为优选后的特征量排除了与故障相关性不高的特征因子,使得各类别间的相似性降低,而各类别中样本点的相似性增加,优化了聚类结果,使选线结果具有更高的准确性和可靠性。
[0043]
3、本发明提供的所述方法对于不同连接形式的发电厂厂用电系统单相接地故障情况,可以根据不同状况进行调整,尽可能地选择相关性更高的故障特征量来进行故障选线,扩大了聚类选线方法的适应范围,提高了故障选线方法的普适性。解决了现有故障选线方法适用范围较为单一的技术难题。
附图说明
[0044]
图1是本发明提供的发电厂厂用电中性点不接地系统电路模型图;
[0045]
图2是本发明提供的中性点经消弧线圈接地系统未优选故障特征量的原始特征样本集聚类结果图;
[0046]
图3是本发明提供的中性点经消弧线圈接地系统优选故障特征量主成分贡献率直方图;
[0047]
图4是本发明提供的中性点经消弧线圈接地系统主成分二维可视化图;
[0048]
图5是本发明提供的中性点经消弧线圈接地系统优选故障特征量后的特征样本集聚类结果图;
[0049]
图6是本发明提供的中性点不接地系统优选故障特征量主成分贡献率直方图;
[0050]
图7是本发明提供的中性点不接地系统主成分二维可视化图;
[0051]
图8是本发明提供的中性点不接地系统优选故障特征量后的特征样本集聚类结果图。
具体实施方式
[0052]
本发明提供的一种基于特征量相关性的发电厂厂用电系统故障选线方法和设备,不以物理模型为基础,而是基于关联性分析的结果进行具体分析,择优选择故障特征量进行聚类选线的发电厂厂用电系统故障选线方法,运用主成分分析的数统方法确定出最合适该发电厂厂用电系统的几种故障特征量,应用系统聚类算法将基于优选后的故障特征量所组成的特征样本集划分至不同的两个类别,构建聚类选线模型,用以进行故障准确选线。其中方法具体包括以下步骤:
[0053]
步骤1,获取发电厂厂用电系统发生单相接地故时的n组故障特征量数据,构成历史特征样本集x=(x
i,j
)
n
×
p
,i=1,2,

,n,j=1,2,

,p;x
i,j
为第i组故障特征量数据x
i
的第j个故障特征量,p为x
i
包括的故障特征量个数;本实施例中每组故障特征量数据包括的p个故障特征量分别为:三相电压、三相电流、正序电流、负序电流、零序电流以及零序电压。
[0054]
步骤2,对历史特征样本集进行标准化处理得到标准化的历史特征样本集z=
(z
i,j
)
n
×
p
;然后根据历史特征样本集z=(z
i,j
)
n
×
p
不同故障特征量之间的关系建立相关系数矩阵r=(r
j,j'
)
p
×
p
,j=1,2,

,p,j'=1,2,

,p,计算表达式为:
[0055][0056]
式中,r
j,j'
表示第j个故障特征量与第j'个故障特征量之间的相关系数,z
j
,z
j'
分别为历史特征样本集z的第j列和第j'列数据,cov(z
j
,z
j'
)为z
j
与z
j'
协方差,d(z
j
)和d(z
j'
)分别为z
j
和z
j'
的方差;
[0057]
步骤3,根据相关系数矩阵r,提取m个主成分进行可视化分析,进而从p个故障特征量中优选s个故障特征量;根据优选的s个故障特征量从标准化的历史特征样本集中选取数据,重新组合形成新的历史特征样本集u=(u
i,j
)
n
×
s
,i=1,2,

,n,j=1,2,

,s;
[0058]
其中根据相关系数矩阵r提取m个主成分的具体过程为:
[0059]
计算相关系数矩阵r的特征方程,得到|r

λi
p
|=0,得到p个特征值并排序为λ1≥λ2≥

≥λ
p
≥0,其中λ
i
=var(y
i
),y
i
为重新组合形成的第i个主成分,var(y
i
)为主成分的方差,于是可以求得第i个主成分的方差贡献率为
[0060][0061]
然后从第m=1开始累计前m个主成分的方差贡献率累计量为:
[0062][0063]
当方差贡献率累计量ρ首次超过预设值σ时,保留当前参与方差贡献率累计的m个主成分。
[0064]
从p个故障特征量中优选s个故障特征量的方法为:
[0065]
首先,按以下表达式计算前m个主成分构成的主成分矩阵y和历史特征样本集z之间的特征向量矩阵b:
[0066][0067]
式中,y=[y1,y2,

,y
m
]
t
,y1,y2,

,y
m
分别为保留的m个主成分,z1,z2,

,z
p
为历史特征样本集z中的p组故障特征量;特征向量矩阵b中的各元素表示历史特征样本集z中的某个故障特征量对某个主成分的贡献率;
[0068]
然后,从p个故障特征量中优选s个故障特征量:
[0069]
若p个故障特征量对第一主成分的p个贡献率中,超过该第一主成分贡献率阈值的个数d≥s,则选择对第一主成分贡献率最大的s个故障特征量;
[0070]
若p个故障特征量对第一主成分的p个贡献率中,超过该第一主成分贡献率阈值的个数d<s,则选择对第一主成分贡献率最大的d个故障特征量;
[0071]
所需要的另外s

d个故障特征量,在第一主成分选择剩余的p

d个故障特征量中,依次按照第二主成分、第三主成分
……
的顺序在其他主成分中选择,直到选出s个故障特征量,且选择方法与第一主成分选择方法相同。本发明中的主成分即为由原来p个故障特征量重新组成的不相关的新的故障特征量,代替了原本有较多相关性的故障特征量,并且尽可能保留原故障特征量中所包含的信息,它为原故障特征量的线性组合。对原变量做正交变换寻求原变量的线性组合即主成分,各主成分的系数即为特征向量,表示各原特征量对各主成分的贡献程度。
[0072]
特征向量矩阵b中各元素为特征向量,表示各原故障特征量对相应主成分的贡献程度,如b
21
表示第二个原故障特征量对第1主成分的贡献程度。保留的前m个主成分作为包含有大多数历史样本数据的新变量,其中各个原故障特征量对其的贡献程度都不一样,以特征向量表示前m个主成分与原评价指标之间的相关性系数,其值越大,则表示相关性越强,该评价指标对与主成分的贡献程度越大,表明它能够更好的描述数据信息,将其选择出来,可以在原本较多的故障特征量中优选出少量的更好描述故障信息的原故障特征量。
[0073]
步骤4,采用系统聚类分析方法将历史特征样本集u中的所有样本u
i
进行聚类分为内部故障类与外部故障类,并求得每个类别的聚类中心;具体可采用现有的系统聚类分析方法,本发明不做详细阐述;其中,内部故障类与外部故障类的聚类中心计算公式为:
[0074][0075][0076]
式中,为第a种故障类的聚类中心,a=1,2分别表示内部故障类和外部故障类;
[0077]
分别为中的s个故障故障特征量;为历史特征样本集u中属于第a种故障类的第n个样本的第j个故障故障特征量,n
a
为历史特征样本集u中属于第a种故障类的样本个数。
[0078]
步骤5,实时采集发电厂厂用电系统发生单相接地故障时的所述优选的s个故障特征量,作为待测样本;计算待测样本分别与内部故障类和外部故障类的聚类中心的距离,距离更短对应的故障类即为发电厂厂用电系统当前单相接地故障的类型。
[0079]
本实施例中采用欧式距离对待测样本分别与内部故障类和外部故障类的聚类中心的距离进行计算:
[0080][0081]
式中,u
r,j
为待测样本u
r
的第j个故障特征量,为第a种故障类的聚类中心的第j个故障特征量;d
r,a
为待测样本u
r
与第a种故障类的聚类中心的欧式距离。
[0082]
由于a=1,2分别表示内部故障类和外部故障类,因此:若对待测样本计算得到d
r,1
>d
r,2
,则表示待测样本属于外部故障类;若对待测样本计算得到d
r,1
<d
r,2
,则表示待测样本属于内部故障类。
[0083]
下面将提供具体实例并结合附图对本发明的发明内容作进一步的说明和解释。
[0084]
如图1所示为发电厂厂用电中性点不接地系统电路模型图。图示包括一个三相电源、一个降压变压器以及与母线相连3条发电厂厂用电负荷线路,将测量点(继电保护处)设置在线路4的入口处,用以采集多种故障特征量的实时数据,线路具体参数如表1所示。
[0085]
表1线路参数
[0086]
线路长度相间电容功率因数1300.03750.8021000.1250.803300.720.804200.0250.80
[0087]
在线路3、4上设置多种接地故障的发生,同时采集线路4上故障发生后半周期时的三相电压x
n1
,x
n2
,x
n3
、三相电流x
n4
,x
n5
,x
n6
、正序电流x
n7
、负序电流x
n8
、零序电流x
n9
以及零序电压x
n10
共10组故障特征量的实时数值,构建为原始特征样本集。
[0088]
首先,直接对该原始特征样本进行系统聚类算法分析,可以将原始特征样本分为两个类别:一类表示线路4发生接地故障(保护动作情况)g1;另一类表示线路4外部发生接地故障(保护不动作情况)g2。仿真结果如图2所示,原始样本中的x1,x2,

,x7被划分至g1,而x8,x9,

,x
14
被划分至g2。
[0089]
图2聚类结果表明了基于系统聚类分析法的配电网故障保护可以较有效地进行故障选线,但用于进行聚类模型构建的故障特征量的选择具有一定的人为主观性,并不能客观展现其与该故障的相关性大小与否,则所选的特征量中包含的故障信息可能并未被很好地利用,导致聚类结果出现错误的情况。
[0090]
因此,将包含这10种故障特征量的原始特征样本集代入主成分分析运算,利用特征量相关性的大小不同对特征量进行优选。通过分析得到各个主成分特征值、贡献率以及它们的累积贡献率,如下表2所示,同时可以得到各主成分贡献率直方图,如图3所示。其中,横坐标表示第i主成分,纵坐标表示各主成分的方差贡献率,折线表示主成分的累积贡献率。由图可知,第一主成分和第二主成分的累计贡献率就高达86%,满足包含了大多数原始数据信息的要求,可以只取前两个主成分进行分析。
[0091]
表2故障特征量的主成分特征值分布
[0092]
第i主成分特征值贡献率累积贡献率15.51620.55160.551623.08480.30850.860130.68670.06870.9288
[0093]
将第一主成分和第二主成分进行可视化,如图4所示。其中,横坐标和纵坐标分别表示第一主成分和第二主成分,散点代表所以原始样本数量,而向量的方向和长度表示了每个原始变量对新的主成分的贡献,即作为特征向量加以呈现。
[0094]
从图4可以看出,变量3,5,6(即对应于故障特征量x
n3
,x
n8
,x
n9
)在第一主成分上的贡献程度比较大(且知其与第一主成分的相关性呈现正相关)。同样,变量2,8(对应特征量x
n1
,x
n10
)在第一主成分上的贡献程度也比较大(与第一主成分的相关性呈现正相关),并且相对地,它们在第二主成分上同样有一定的贡献(与第二主成分的相关性呈现负相关),变量4,9(特征量x
n5
,x
n7
)则对第二主成分的贡献值很大(与第二主成分的相关性呈现正相
关)。因此本文选择具有较大贡献程度的变量2,3,5,6,8最为较优的故障特征量进行后续的分析。
[0095]
将这五种故障特征量构建成新的故障测试样本集,对其进行聚类分析得到两大类别g1,g2和各自的聚类中心,如图5以及表3所示。
[0096]
表3故障测试样本的聚类中心
[0097][0098]
将在2种不同故障情况下采集的实时故障数据作为待测数据样本集x
15
,x
16
,分别与两大类别的聚类中心计算距离远近,判别出距离最短的类别为测试样本的故障属性,如表4所示。
[0099]
表4待测样本判断结果
[0100]
待测样本d
1g
d
2g
保护判断判断结果x
15
1.05182.1180d
1g
<d
2g
内部故障x
16
3.15991.6227d
1g
>d
2g
外部故障
[0101]
由表4可知,x
15
因为与g1的距离比较近,与g2的距离较远,可以证明该实时待测样本为线路4上发生的内部接地短路故障,线路4上的保护必需动作;而x
16
因其与g2的距离相较于与g1的距离更近,可以证明该实时待测样本为线路4外部发生的接地短路故障,线路4上的保护不需要动作。
[0102]
由此仿真可以得出,本发明方法可以较好的进行发电厂厂用电系统故障选线工作,且与图2未经过主成分分析优选特征量的聚类结果相比较,可发现优选故障特征量后,聚类分析所形成的两个类别间的相异性加强,两者间的空间距离增大;而各类别内的样本之间的相似性增强,联系更加紧密,更好地优化了故障选线的效果,使利用历史样本集得到的模型更具有可靠性,而之后对待测样本检验结果也更加准确,同时减小了运算量。
[0103]
采用发电厂厂用电中性点不接地系统仿真模型采集故障的数据信息,同样提取出相同的10种故障特征量组成原始故障特征样本集,并运用主成分分析法进行运算,可以得到各主成分的贡献率及累积贡献率以及直观的直方图,如表5和图6所示,可以看出,第一、第二主成分的累积贡献率也基本达到了75%,基本满足包含大多数原始数据信息的要求,依然取前两个主成分做二维可视化分析,如图7所示。
[0104]
表5不接地系统故障特征量的主成分特征值分布
[0105]
第i主成分特征值贡献率累积贡献率14.25770.42580.425823.13790.31380.739631.13590.11360.853140.66740.06670.9199
[0106]
其中,变量4,8(特征量x
n1
,x
n7
)在第一主成分上的贡献程度比较大(与第一主成分的相关性呈现正相关),变量3,5,9(特征量x
n5
,x
n8
,x
n9
)在第一主成分上也有一定程度的贡
献(且与第一主成分的相关性呈现正相关),但同时,它们在第二主成分上也有着相当的贡献(其中变量3,5,8与第二主成分的相关性呈现正相关,变量4,9呈现负相关);而变量1,2(特征量x
n6
,x
n10
)则对第二主成分的贡献值更大。因此本文选择具有较大贡献程度的变量3,4,5,8,9最为较优的故障特征量,组成新的故障测试样本集。
[0107]
对该样本集进行聚类分析得到g1,g2两类别和各自的聚类中心,如图8和表6所示。并通过与各类别聚类中心的距离远近判断待测数据样本集x
13
,x
14
的故障属性,对该方法的效果进行检验,如下表7所示。
[0108]
表6测试样本聚类中心
[0109][0110]
表7不接地系统待测样本判断结果
[0111]
待测样本d
1g
d
2g
保护判断判断结果x
13
1.4832.380d
1g
<d
2g
内部故障x
14
3.9072.027d
1g
>d
2g
外部故障
[0112]
由表7可知,x
13
因为与g1的距离比较近,与g2的距离较远,可以证明该实时待测样本为线路4上发生的内部接地短路故障,线路4上的保护必需动作;而x
14
与g2的距离较近,与g1的距离更远,可以证明该实时待测样本为线路4外部发生的接地短路故障,线路4上的保护不需要动作。
[0113]
由在中性点接地系统和不接地系统的仿真综合分析,可以得出,该方法可以根据发电厂厂用电系统连接方式的不同,灵活得对采集的多种故障特征量进行相应地择优选择,选出与故障相关性更高的少数几种故障特征量进行故障选线工作,从而更好地进行聚类选线分析,扩大了单纯使用聚类选线时适用范围的局限性,具有更好的适应性和可靠性。
[0114]
以上实施例为本申请的优选实施例,本领域的普通技术人员还可以在此基础上进行各种变换或改进,在不脱离本申请总的构思的前提下,这些变换或改进都应当属于本申请要求保护的范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1