一种潜供电弧燃弧时间预测方法及系统

文档序号:29626486发布日期:2022-04-13 14:35阅读:131来源:国知局
一种潜供电弧燃弧时间预测方法及系统

1.本发明属于电力系统分析技术领域,具体涉及一种潜供电弧燃弧时间预测方法及系统。


背景技术:

2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
3.随着特高压线路应用越来越广泛,为了保证特高压线路运行的安全性,研究潜供电弧的熄灭时间是当前亟待解决的重要问题。研究表明在特高压输电线的故障超90%的故障为单相接地故障。当系统发生单相接地短路时,断路器和单项重合闸会配合工作,切断故障相,但是由于线路间的电磁耦合会导致潜供电弧的产生,重合闸重合,继电保护动作,断路器断开时潜供电弧会继续燃烧,从而导致断路器和单项重合闸动作失败。单项重合闸是继电保护的重要设备,成功的单项重合闸运作取决于对潜供电弧熄灭时间的准确预测,所以明确潜供电弧的熄灭时间特性并限制潜供电弧燃弧对单项重合闸的正确运作有很大帮助。
4.近些年,潜供电弧的参量、形成机理、运动形态等问题有着大量的研究。一种针对潜供电弧图像的边缘检测改进算法被提出,通过对得到的边缘坐标进行处理,定量分析了二次弧的半径、长度和面积,并通过曲线拟合给出了二次弧尺寸的估算公式,为克服传统边缘检测算子带来的不连续和假边。将二次电弧电流分解为自然分量和强迫分量,并且证明暂态过程具有自然分量,主要由二次弧电阻因素决定,二次电弧电流的衰减与电弧电阻成正比,与并联电抗器成反比,并且推导了这两个分量的计算公式。基于模态分解的解析相量模型被提出,并通过模型分析了交直流混合线路中稳态二次电弧电流及其各种依赖性。对于潜供电弧模型的研究,建立的电弧模型能够准确地反映一次、二次电弧阶段的动态特性,并实现了电弧模型与所研究电力系统之间所需的相互作用。有的学者在研究潜供电弧弧链模型中加入随机仿真模型,并在以后的研究中于链式模型的基础上,结合双指数函数闪电电流模型,建立了改进的二次弧减载模型的多场耦合力模型,并分析了风对电弧燃烧的影响。
5.但是据发明人了解,以上研究对于确定潜供电弧燃弧时间还比较有限,对单项重合闸合闸时间不能起到很好的指导作用。


技术实现要素:

6.本发明为了解决上述问题,提出了一种潜供电弧燃弧时间预测方法及系统,本发明基于统计学理论和多种算法对潜供电弧燃弧时间计算,不仅能在统计理论的基础上指导单项重合闸的合闸动作,尽快恢复电力传输的运行,还通过机器学习算法对结果进行更好的修正,使得结果更加准确。
7.根据一些实施例,本发明采用如下技术方案:
8.一种潜供电弧燃弧时间预测方法,包括以下步骤:
9.获取潜供电弧图像,对潜供电弧图像进行预处理,得到潜供电弧基本信息;
10.利用多因素方差分析方法,确定与燃弧时间显著相关的因素;
11.利用残差分析方法检验所述显著相关的因素是否正确,确定最终影响因素;
12.利用基于密度的噪声应用空间聚类算法,将燃弧时间的离群值进行去除,确定最终影响因素和处理后的燃弧时间的关系;
13.对燃弧时间进行多元拟合回归,得到燃弧时间回归模型;
14.利用所述燃弧时间回归模型,基于采集到的最终影响因素数据,进行燃弧时间的预测。
15.作为可选择的实施方式,对潜供电弧图像进行预处理的具体过程包括对潜供电弧图像进行图像二值化。
16.作为可选择的实施方式,潜供电弧基本信息包括潜供电弧的电弧长度、面积和直径。
17.作为可选择的实施方式,依次改变与燃弧时间可能相关的因素,进行潜供电弧模拟实验,确定了燃弧时间、最大恢复电压以及产生最大恢复电压时的潜供电流;通过对图像进行处理和计算,得到燃弧面积、最后时刻的燃弧长度和电弧直径当量,将上述变量看作为协方差进行分析。
18.作为进一步限定,分析过程包括:假设各个因素在不同水平下和协方差取不同值的情况下对燃弧时间的均值造成没有显著差异,使自变量效应交互作用为0;
19.在各个因素方差的变动下观察燃弧时间;
20.比较各因素和协方差总离差平方和各部分所占的比例,推断各因素的交互作用是否给燃弧时间有显著影响;
21.计算各因素的显著性水平,与预定阈值比较,如果大于预定阈值,则为与燃弧时间显著相关的因素。
22.作为可选择的实施方式,所述最终影响因素包括电弧长度、最大恢复电压、瞬时潜供电流以及瞬时功率。
23.作为可选择的实施方式,最终影响因素和处理后的燃弧时间的关系包括最大恢复电压和燃弧时间成反比关系,最大恢复电压越大,燃弧时间会越受抑制,越不利于潜供电弧燃烧;电弧长度越长,相应的潜供电弧燃烧时间越长。
24.作为可选择的实施方式,利用高斯过程回归模型对燃弧时间回归模型进行修正,在燃弧时间小于设定值的时候,使用幂函数回归模型,在燃弧时间大于设定值的时候使用线性回归模型。
25.一种潜供电弧燃弧时间预测系统,包括:
26.图像获取模块,被配置为获取潜供电弧图像,对潜供电弧图像进行预处理,得到潜供电弧基本信息;
27.多因素方差分析模块,被配置为利用多因素方差分析方法,确定与燃弧时间显著相关的因素;
28.验证模块,被配置为利用残差分析方法检验所述显著相关的因素是否正确,确定最终影响因素;
29.数据分析模块,被配置为利用基于密度的噪声应用空间聚类算法,将燃弧时间的离群值进行去除,确定最终影响因素和处理后的燃弧时间的关系;
30.多元拟合回归模块,被配置为对燃弧时间进行多元拟合回归,得到燃弧时间回归模型;
31.预测计算模块,被配置为利用所述燃弧时间回归模型,基于采集到的最终影响因素数据,进行燃弧时间的预测。
32.一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述方法中的步骤。
33.与现有技术相比,本发明的有益效果为:
34.本发明对潜供电弧燃弧时间计算精确度较高,为确定燃弧时间提供了新的思路,具有较大的参考价值。
35.本发明不仅能在统计理论的基础上指导单项重合闸的合闸动作,尽快恢复电力传输的运行,还通过机器学习算法对结果进行更好的修正,使得结果更加准确。
36.本发明使用两个多元回归模型对燃弧时间进行拟合,然后通过高斯回归模型的预测值与回归模型的结果进行检验,得到不同情况下,各回归模型的应用,有效提升预测准确性。
37.为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
38.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
39.图1为本实施例的模拟实验回路;
40.图2(a)、(b)为本实施例的潜供电弧原始图像和图像分割算法后图像;
41.图3为本实施例的恢复电压波形图;
42.图4为本实施例的多因素方差分析流程图;
43.图5为本实施例的多因素方差分析的方差图;
44.图6为本实施例的恢复电压-燃弧时间数据经过dbscan算法后结果;
45.图7为本实施例的瞬时潜供电流-燃弧时间经过dbscan算法后结果;
46.图8为本实施例的瞬时功率-燃弧时间数据经过dbscan算法后结果;
47.图9为本实施例的电弧长度-燃弧时间数据经过dbscan算法后结果;
48.图10为本实施例的高斯过程回归模型结果示意图;
49.图11为本实施例的高斯过程回归模型和多元幂函数回归模型预测结果比较示意图;
50.图12为本实施例的高斯过程回归模型和多元线性回归模型预测结果比较示意图。
具体实施方式:
51.下面结合附图与实施例对本发明作进一步说明。
52.应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另
有指明,本实施例使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
53.本发明通过基于统计理论的多因素方差模型对影响燃弧时间的可能因素进行了筛选,并通过残差分析充分验证了方差模型的正确性,得出对燃弧时间影响最显著的因素,结果表明回路参数、风向、最大恢复电压、瞬时潜供电流、瞬时功率、最后时刻燃弧长度对潜供电弧燃弧时间影响最为显著。
54.在此基础上通过基于密度的聚类算法dbscan对这些因素的数据进行了离群值的去除,并通过散点图分析了每个单独的因素对于燃弧时间的影响。最终通过多元线性回归模型和多元幂函数模型进行拟合,并借助高斯过程回归模型对两个回归模型进行了验证,结果表明在燃弧时间较短的时候幂函数模型与实际较为符合,燃弧时间较长的时候线性模型与实际符合的更好。该算法对潜供电弧燃弧时间计算精确度较高,为确定燃弧时间提供了新的思路,具有较大的参考价值。
55.具体的,下面对每个部分进行详细介绍:
56.一、试验和数据采集
57.本实施例所使用的简化的模拟试验回路如图1所示。潜供电弧模拟实验电路主要由交流电源(在本实施例中,电压峰值为11.6kv)、等效电容cq、电抗器l0、断路器cb1、cb2和cb3、绝缘子串、保险丝等组成。在本实施例中,电抗器l用来产生大小为1ka级的引弧电流。绝缘子串的两端通过镍铬合金线连接,以通过产生短路电弧形成引弧通道。另外,通过高速摄像机来获得清晰的图像,便于对潜供电弧图像进行分析。等效电容大小可以表示为:
[0058][0059]
其中c
p
和cg分别表示单位长度的相间电容和相对地电容,l0代表架空线的长度。通过改变等效电容cq的数值模拟15,30a,45a这3种大小的潜供电流,此处的潜供电流为通过回路计算得出的有效值,用i
ev
表示。ls,cq的取值以及对应的电流值如下表所示:
[0060]
表1.实验回路参数
[0061]
l
scqiev
0.0036h4.12μf15a0.0036h8.24μf30a0.0036h12.36μf45a
[0062]
实验开关的操作顺序为:将cb3打开,闭合cb2,闭合cb1,用于模拟特高压线路电感型短路电流的产生,引弧电流大小在1ka等级。之后cb3闭合,cb3断开用于模拟特高压线路无补偿情况下潜供电弧。电弧的电压、电流测量分别由1000:分压器和电流互感器ct获取。电弧熄灭后,在绝缘子串两端形成一定电压,即弧道恢复电压,由示波器记录恢复电压波形以及潜供电流波形。
[0063]
本实施例通过高速摄像机的拍摄获取的潜供电弧图像,如图2(a)、(b)所示,可以用matlab中的image region analyzer工具箱进行图像二值化处理,以便于获得最后时刻潜供电弧长度、面积和直径等数据。
[0064]
在潜供电弧低压模拟实验中,通过电流互感器和分压器,潜供电流和恢复电压波形得以记录在示波器内,可以在恢复电压波形图中读出最大恢复电压以及产生最大恢复电
压时的潜供电流,以及最大潜供电流等数值,如图3所示。
[0065]
二、特征选择与残差分析
[0066]
多因素方差分析
[0067]
潜供电弧燃弧时间可能由多种因素影响,但是这些因素并不全部都是明确的,为了确定潜供电弧燃弧时间与以下因素的相关关系,本实施例利用统计学中的多因素方差分析来确定这些因素的重要性,进而对因子和协方差进行筛选,目的是选择出对燃弧时间影响显著的自变量,现对因子与协方差进行多因素方差分析,以观察和筛选对燃弧时间影响显著的自变量,以便于为后文的拟合减少无谓的自变量,提高拟合的效率。
[0068]
在潜供电弧模拟实验平台中,本实施例通过改变电极长度,风速风向以及电流大小和电流性质来探究不同条件下潜供电弧的燃弧时间影响因素,这些变量是固定的,并且没有随机性,可以作为因子(factor)对燃弧时间进行分析。在潜供电弧模拟实验后,得到了燃弧时间,最大恢复电压以及产生最大恢复电压时的潜供电流,最大潜供电流。通过对图像进行处理以及对实验数据的计算,可以得到燃弧面积,最后时刻的燃弧长度,电弧直径当量。这些连续型的变量可以看作为协方差(covariance)进行分析。
[0069]
多因素方差分析有四步,第一步提出原假设,各个因子在不同水平下和协方差取不同值的情况下对燃弧时间的均值造成没有显著差异,使电弧长度,恢复电压等自变量效应交互作用为0。第二步观察燃弧时间,电流性质等自变量的方差的分解,在多因素方差分析中,自变量取值的变动会受到三个方面的影响:1.自变量独立作用的影响;2.自变量之间交互作用的影响,指多个控制变量相互搭配后对观测变量产生的影响;3.随机因素的影响,主要指抽样误差带来的影响。于是多因素方差分析将观测变量的总变差分解为:
[0070]
sst=ss
ie
+ssi+sse
ꢀꢀꢀꢀ
(2-1)
[0071]
其中,sst为观测变量的总变差;ss
ie
(independent effect)为自变量独立作用引起的变差,称为主效应,仅由自变量对燃弧时间的影响显著性决定,自变量之间的交互作用不考虑;ssi(interaction)为交互效应,表示自变量之间交互作用引起的变差;sse为随机因素引起的变差,被称为剩余效应。
[0072]
ss
el
,ss
wl
,ss
wd
,ss
cv
,ss
al
,ss
cp
,ss
mrv
,ss
tsc
,ss
tp
,ss
msc
,ssa代表电极长度,风速,风向,电流大小,电弧长度,电流性质,最大恢复电压,瞬态潜供电流大小,瞬态能量,最大潜供电流,面积引起的总变差,其中:
[0073][0074]
第三步为通过比较各因子和协方差总离差平方和各部分所占的比例,推断控制变量以及控制变量的交互作用是否给观测变量带来了显著影响,如果有一个变量的独立作用所占比例较大,则说明此变量是引起观变动的主要因素之一,观测变量的变动可以部分地由控制变量a来解释。对其他变量的独立作用和交互作用同理。第四步为给出显著性水平,与检验统计量的相伴概率p值作比较,然后选择接受原假设或者拒绝原假设。多因素方差分析过程如图4所示。
[0075]
由上述方法得到的各个参量的显著性水平结果如表2所示:
[0076]
表2.多因素方差分析结果表
[0077][0078][0079]
在进行多元方差分析之后,需要对模型的正确性和适用性进行验证,所以需要对模型进行正态检验和方差齐性检验,使用残差分析可以同时进行上述检验。
[0080]
在回归模型y=β0+β1x+ε中,假定ε的期望值为0,方差相等且服从正态分布的一个随机变量。残差分析的实质是用于检验关于ε的假定是否成立。
[0081]
残差(residual)是因变量的观测值yi与根据估计的回归方程求出的预测之差,用ei表示。反映了用估计的回归方程去预测
yi
而引起的误差。第i个观察值的残差为:
[0082][0083]
标准化残差(standardized residual)是残差除以其标准差后得到的数值,用ze表示。第i个观察值的标准化残差为:
[0084][0085]
其中se是残差的标准差的估计。如果误差ε服从正态分布的这一假定成立,则标准
化残差的分布将会服从标准正态分布,那么理论上将会有95.44%的标准化残差值在[-2~2]这个区间之间,99.74%的标准化残差值会落在[-3~3]这个区间之间,因此可以使用残差图对数据进行离散值处理,可以把残差为[-2,2]范围之外的点作为异常值的点进行去除,这是离散值处理中非常重要的一步,通过残差图寻找极值进行去除。
[0086]
由图5所示的残差图可知大部分点都在正负2以内,并且自变量的残差没有显著增加或减少的趋势,大致分布在残差值为0的两侧,因此可以验证此次所使用的多因素方差分析模型满足正态检验和方差齐性,所以多因素方差分析模型在研究燃弧时间影响因素显著性分析是适用的,验证了分析的正确性。
[0087]
由表格2可知,通过多因素方差分析得出的结果,所有自变量中电流大小,电流性质,电弧长度,最大恢复电压,瞬时潜供电流,瞬时能量,风向的显著性水平α分别为0.015,0.007,0.0016,0.022,0.007,0.004,0.047,这些变量的显著性水平都在0.05以下,所以对于以上自变量可以认为在不同水平下的燃弧时间的均值有显著性差异,以及电弧长度,最大恢复电压,瞬时潜供电流和瞬时能量取不同值的情况下即对燃弧时间有显著影响。其中瞬时潜供电流和电流性质的显著性水平到达0.01以下,所以可以认为瞬时潜供电流和电流性质对燃弧时间的影响非常显著。而最大潜供电流,燃弧面积,燃弧直径当量,电极长度和风速的显著性水平α皆大于0.05,所以认为电极长度,风速在不同水平下以及面积和直径取不同值的情况下对燃弧时间的均值没有显著差异,即对燃弧时间影响不显著。
[0088]
作为总结,电流性质,电流大小,电弧长度,最大恢复电压,瞬时潜供电流,瞬时能量和风向对燃弧时间影响最大,其中电流性质和电流大小是由线路的参数所决定的,风向是人工设置的环境变量,电弧长度,最大恢复电压,瞬时潜供电流为观测值,瞬时能量由于很难直接观测到,所以取计算值。
[0089]
作为总结,该部分以多因素方差模型为基础,分析了对燃弧时间影响显著的因子和协方差,这有利于接下来进行高效的拟合。
[0090]
离群值去除及分析
[0091]
上述分析得到对燃弧时间影响显著的连续量有:电弧长度,最大恢复电压,瞬时潜供电流以及瞬时功率。但是实验中会出现一些偶然值,会影响拟合的效果,所以为了以后更好的进行拟合,提高拟合模型的精度,使之更好的对潜供电弧燃弧时间进行预测,需要对数据进行处理,从而剔除其中可能存在的异常值。
[0092]
本发明机器学习算法对数据进行离群值的剔除,本实施例使用了dbscan算法,是一种基于密度的聚类方法。
[0093]
基于密度的噪声应用空间聚类(dbscan)是一种无监督的机器学习聚类算法。聚类是指将相似的数据点分组到人工确定的组或簇中,在参数合适的情况下,离群值会和其他数据分离开来,达到分离异常值的效果。dbscan不要求指定集群的数量,并且在任意形状和大小的集群中作用得非常好。正因为如此,本实施例可以使用dbscan算法进行对燃弧时间有显著影响的变量之间进行数据异常值的清洗。
[0094]
要实现dbscan算法首先需要定义epsilon和最小点,这是两个最基本的参数。
[0095]
epsilon(ε):簇的最大半径。如果数据点的相互距离小于或等于指定的epsilon,那么它们将是同一类的。更大的epsilon将产生数据量更大的簇,更小的epsilon将构建更小的簇。一般来说,选用较小的epsilon值是因为只需要很小一部分的数据点在彼此之间的
距离内。但是如果太小,集群分割的会越来越小,造成簇的数量越来越多,最终会造成离群点所在的簇识别困难。
[0096]
最小点(minpts):在一个邻域的半径内minpts数的邻域被认为是一个簇。一个较低的minpts帮助算法建立更多的集群与更多的噪声或离群值。较高的minpts将确保更健壮的集群,但如果集群太大,较小的集群将被合并到较大的集群中,可能离群值会被包含到比较大的集群,那么就会对去除离群值不利。
[0097]
首先,选择一个在其半径内至少有minpts的随机点。然后对核心点的邻域内的每个点进行评估,以确定它是否在epsilon距离内有minpts。如果该点满足minpts标准,它将成为另一个核心点,集群将扩展。如果一个点不满足minpts标准,它成为边界点。当集群被边界点包围时,表示这个聚类簇已经搜索完全。这时会选择一个新的随机点,并重复该过程以识别下一个簇。
[0098]
为了确定最佳的epsilon值,本实施例计算每个点与其最近/最近邻居之间的平均距离。然后绘制一个k距离,并选择一个较为合适的epsilon值。在y轴上,绘制平均距离,在x轴上绘制数据集中的所有数据点。需要注意的是,如果选取的epsilon太小,很大一部分数据将不会被聚类,那么燃弧时间影响因素数据将很有可能得到一个无效的聚类值(去除奇异值之后的值),而一个大的epsilon值将导致聚类簇被合并,大部分数据点将会在同一个簇中。一般来说,较小的值比较合适,并且作为一个经验法则,只有一小部分的点应该在这个距离内。
[0099]
通常minpts应该设置为大于或等于数据集的维数,但是这种方法也不是绝对正确的,应该根据燃弧时间影响因素数据具体调整。
[0100]
dbscan聚类的评价方式可以使用数据的可视化来解释:获得集群之后,解释每个集群非常重要。每个集群拥有越好的可解释性,那么证明该算法的效果就越好,同时离群值也就更容易去除。
[0101]
使用dbscan算法进行离群值处理的优点时不需要预先确定集群的数量,可以进行探索式分类,同时对异常值不敏感并且能将高密度数据分离成小集群,还可以聚类非线性关系(聚类为任意形状)。但是dbscan算法很难在不同密度的数据中识别集群,并且难以聚类高维数据,对极小点的参数非常敏感。但是由于数据维度为五维,维度较低,样本数量并不庞大,所以dbsan算法可以比较好的去除离群值,展现各个影响因素下于燃弧时间的相关关系,以便于进行进一步的拟合。
[0102]
调整minpts和epsilon为合适的值后对数据进行dbscan算法运算,关于恢复电压和燃弧长度的聚类结果如图6所示,在图中图形为
×
的点为通过dbscan算法后计算出来的离群点,圆点表示通过算法计算出来之后可以被认为正常的值,这些离群值可以被解释为在实验由于各种原因引起的偶然值,并且对实验结果和数据拟合引起很大的影响。
[0103]
可以看出通过dbscan算法计算后的二维可视化散点图。在原始数据的散点图中,右上角的数据点分布较为稀疏,所以这些点组成的簇在半径epsilon内没有新的散点,然后被标记为离群值。清除离群点后燃弧时间绝大部分都小于0.3秒,所有数据中有82.2%数据的最大恢复电压都位于在25kv到32kv这个区间,说明数据在这个区间分布比较紧密,在这个区间内燃弧时间和最大恢复电压的变化规律有比较好的代表性。散点图中显示最大恢复电压和燃弧时间整体呈现比较显著的负相关关系,即最大恢复电压越大,潜供电弧燃烧就
越受抑制,散点图表示出最大恢复电压和燃弧时间的显著性和前述得出的结论相符。
[0104]
图7表示的是瞬时潜供电流与燃弧时间在经过dbscan算法后的结果,同样以x点表示离群值,圆点表示正常值。由于示波器的精度限制,所以瞬时电流在散点图中显示的是离散的值,分别为0.0667,0.1667,0.6667,1.3333,1.6667,3.3333。瞬时电流值为3.3333的值只有三个,有一个在图上离着其他点比较远的点被认为是离群值。大部分被标记为离群值的点的燃弧时间都大于0.2秒。少部分瞬时电流值为0.667,1.333,1.667的数值被标记为离群值的原因是这些数值的其他维度(最大恢复电压,瞬时功率,电弧长度)与燃弧时间关系中被标记为离群值,所以在这个维度也同样被标记为离群值。
[0105]
图8表示的是瞬时功率与燃弧时间经过dbscan算法后的结果,由于恢复电压中有82.2%的数据分布在25kv-30kv范围内,瞬时潜供电流的值为离散值,瞬时功率等于最大恢复电压和瞬时潜供电流的乘积,所以造成了图3-3中的瞬时功率和燃弧时间的散点图关系。瞬时功率在20左右和40左右有一小部分点被标记为离群点,由图可以得知瞬时潜供电流值在0.667的数据的瞬时功率在20左右,并且分散性不大,瞬时电流值在1.333的数据瞬时功率大体在40左右,并且表现较大的分散性,瞬时潜供电流值为0.333和3.333的数据由于样本量太少,所以其瞬时功率的分散性不易观察得出。
[0106]
图9表示电弧长度和燃弧时间的数据经过dbscan算法运算后的结果,散点图中显示大部分离散值都分布为散点图的上半部分,在清除离群值后电弧长度和燃弧时间呈现比较显著的正相关关系,这说明潜供电弧熄灭前一时刻的电弧长度越长,燃弧时间越长,这有可能是因为潜供电弧的初始能量较大时可以支撑潜供电弧长时间燃烧,潜供电弧在燃烧过程中由于热浮力以及电磁力在竖直方向和水平方向会进行向外的不规则运动,当潜供电弧要熄灭的时候,其电弧会迅速拉长,所以燃烧时间越长的潜供电弧,会在拉长前具有更长的长度,因此在灭弧前的长度也越长。
[0107]
可以看出,得到的散点图以及离群点对潜供电弧燃弧时间与四个参量之间的关系进行进一步的分析,然而仅仅靠散点图得出的结论虽然直观,但是并不精确,仅确定相关性并不能得到潜供电弧燃弧时间与参量之间特定的函数关系,亦不能通过已知参量预估电弧的熄弧时间,所以需要建立参量和燃弧时间的数学关系。
[0108]
四、潜供电弧回归模型建立及分析
[0109]
由上面分析可知,对潜供电弧燃弧时间影响大的因素有最大恢复电压,瞬时潜供电流,电弧长度,瞬态能量,这对进行潜供电弧燃弧时间预测帮助很大。
[0110]
对于潜供电弧燃弧时间预测,通常有两个方法,第一个是进行数学上的拟合,拟合表达式的优点是简单明了,方便使用,但是很难确定一个精准的公式,并且提高拟合精度需要更加复杂的公式,并且往往带有导数等复杂公式,这大大增大了拟合难度,第二个是用机器学习和深度学习算法进行预测,机器学习算法和深度学习算法通常预测比较准确,但是缺乏一个简单明了的公式表达,所以确定一个能够清晰明了表达潜供电弧燃弧时间的公式非常重要。
[0111]
本实施例提供了两种拟合模型,第一种是多元线性回归模型,第二种是多元幂函数回归模型。若将燃弧时间设为因变量,把最大恢复电压,瞬时潜供电流,瞬时功率以及燃弧长度设为自变量,那么关于燃弧时间的多元线性回归模型为:
[0112]
t=a1+a2·umax
+a3·isc
+a4·
p+a5·
laꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4-1)
[0113][0114]
关于燃弧时间的多元幂函数拟合模型为:
[0115][0116]
为了减少运算量,方便拟合,把上式等号左右取对数,得到了一个多元线性回归式:
[0117]
lnt=lnk+b1lnla+b2lni
sc
+b3lnu
max
+b4ln p
ꢀꢀꢀꢀꢀ
(4-3)
[0118][0119]
共线性诊断
[0120]
由于参加回归的自变量中含有共线性,会对拟合引起不必要的麻烦,所以根据共线性诊断从而减少输入数据的维度,能更有效的帮助拟合。由前文可知,对燃弧时间影响显著的变量为:最大恢复电压,瞬时潜供电流,瞬时功率,最后时刻燃弧长度。瞬时潜供电流表示的是在产生最大恢复电压时的潜供电流,瞬时功率的表达式为:
[0121]
p
transient
=u
max
*i
transient
ꢀꢀꢀꢀꢀꢀꢀ
(4-4)
[0122]
由公式可以得出瞬时潜供电流和最大恢复电压乘积,所以瞬时功率和最大恢复电压,瞬时潜供电流有很强的共线性,并且瞬时功率可以被最大恢复电压和瞬时电流用公式替代,故在以下分析中,为了减少输入的变量,使拟合的效果更好,瞬时功率这个变量不再被使用。
[0123]
那么幂函数变换后的多元线性回归表达式为:
[0124]
lnt=lnk+b1lnla+b2lni
sc
+b3lnu
max
ꢀꢀ
(4-5)
[0125]
在进行拟合前,需要先让四个输入变量通过共线性诊断,之后的拟合才会有更好的效果,通过spss的共线性诊断功能可以得到输入变量之间的共线性关系,下表为多元线性回归模型的系数检验表。
[0126]
表3.多元线性回归模型结果及共线性诊断表
[0127][0128][0129]
在系数检验表中,可通过共线性统计中的容差与vif(方差膨胀因子)判断自变量的共线性。方差膨胀系数(vif)是衡量多元线性回归模型中多重共线性严重程度的一种度量,它表示回归系数估计量的方差与假设自变量间不线性相关时方差相比的比值。计算公式为:
[0130][0131]
其中ri为其中一个自变量xi对其余自变量做回归分析的负相关系数,方差膨胀系数vif越大,说明自变量之间存在共线性的可能性越大。一般来讲,如果vif的值处于0.1至10之间,自变量之间是可以认为没有很严重的共线性。在表格中,电弧长度,瞬时电流,最大恢复电压的容差分别为0.944,0.909,0.961,这三个值都在1附近,说明这三个变量的非共线性表现很好,没有共线性问题,通过了共线性检验。
[0132]
下表为多元幂函数回归模型系数检验表。
[0133]
表4.多元幂函数回归模型及共线性诊断表
[0134][0135]
在表格中,电弧长度,瞬时电流,最大恢复电压的容差分别为0.984,0.931,0.946,这三个值都在1附近,说明这三个变量的非共线性表现很好,没有共线性问题,通过了共线性检验。根据系数检验表,其中未标准化系数的b为拟合函数的各项系数,可得:ln k=4.941,b1=0.423,b2=-0.137,b3=-2.755,对ln k求e的指数,得到k的值为101.291。
[0136]
高斯过程回归
[0137]
高斯过程回归是一种机器学习回归算法,其有着严格的统计学理论基础,对高维度、小样本、非线性等复杂的问题有着比较好的效果,gpr具有容易实现,超参数自适应获取,输出函数具有概率意义等优点。高斯过程与svm一样,是一种基于核函数的机器学习算法。高斯过程先以概率分布的形式来建立整个模型的先验函数,然后在贝叶斯框架下完成先验函数到后验函数的转化,svm的核函数的选择通常依靠交叉验证或者经验,但是高斯过程可以在回归过程中完成对超参数的推算,不必刻意寻找核函数,这是高斯过程回归的优点之一。
[0138]
对于一组给定的数据集其中输入矩阵xi∈rd,其中输入矩阵为上述确定的对潜供电弧燃烧时间影响显著的自变量,输出矩阵yi∈r,为潜供电弧燃弧时间的列矩阵,在给定数据中,f(x
(1)
)、f(x
(2)
)、

、f(x
(n)
)可以构成随机变量的一个集合,其分别表示影响显著因素的数据所组成的列向量,并且具有联合高斯分布。高斯过程的统计特征由均值函数m(x)和协方差函数k(x,x'),即:
[0139]
f(x)~gp(m(x),k(x,x'))
ꢀꢀ
(4-7)
[0140]
将噪声考虑到观测目标值y中,可以建立高斯回归问题中的一般模型:
[0141]
y=f(x)+ε
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4-8)
[0142]
在上式中,ε是独立的高斯噪声,由于在电弧燃烧的过程中周围的干扰并不是随机的,所以这些干扰可以被近似看做为高斯噪声,符合高斯分布并且均值为0,方差为σ2,所以可以记为ε~n(0,σ2),由于噪声为独立于f(x)的高斯分布,难么给定输出y高斯先验分布和给定输出y和预测值y的联合高斯先验分布为:
[0143][0144][0145]
上式中:k(xi,xj)为对称正定协方差矩阵,其通过核函数来测量xi和xj之间的相关性,k(x,x)为训练集之间的协方差矩阵,in为n维单位矩阵,k(x
*
,x)=k(x,x
*
)-测试集x
*
和训练集x之间的协方差矩阵,k(x
*
,x
*
)为训练集
x
之间的协方差矩阵,p1,p2为可调整参数,所以预测值燃弧时间y的后验分布为:
[0146][0147]
因此gpr的点预测结果其95%置信水平下区间预测结果为而其第i个预测值的概率密度函数为:
[0148][0149]
模型可视化与评价指标
[0150]
为检验高斯过程回归模型的结果,需要让得出的回归结果是否真正反映燃弧时间和影响变量之间关系,用它来预测或估计的有效程度如何,是应用gpr模型时首先要解决的问题,因此对回归方程进行检验和评价也是非常重要的一个步骤。通常决定系数可以用来检验模型拟合的好坏的一个评价指标,确定系数是由ssr和sst两个参数决定的,ssr为预测数据与原始数据均值之差的平方和,公式如下:
[0151][0152]
sst为原始数据和均值之差的平方和,公式如下
[0153][0154]
因此sst=sse+ssr,确定系数定义为ssr和sst的比值,即
[0155][0156]
确定系数是反映模型拟合优度的重要的统计量,为回归平方和与总平方和之比。r-square取值在0到1之间,并且没有单位,其数值大小反映了回归贡献的相对程度,即在因变量的总变异中回归关系所能解释的百分比。
[0157]
高斯过程回归预测图如图10所示,其中横坐标为每组数据的编号,范围为[1,106],纵坐标代表燃弧时间,并且经过处理后的数据根据燃弧时间从小到大排列。离散的x点为实际燃弧时间(实际响应),折线为gpr模型预测的燃弧时间,位于gpr预测曲线的上方的虚线为gpr模型95%置信区间预测的上边界,预测曲线下方为95%置信区间预测的下边界,为了便于观察分析,将燃弧时间实际响应按从小到大排列。可以看出在gpr模型预测曲线中虽然在编号增加过程中高斯过程回归模型预测的燃弧时间有波动,但是整体上也大致随着编号增加而增加。
[0158]
通过把数据带入上式计算得sst=0.0103,ssr=0.0008086,决定系数r-square=0.917,可以看到r-square的值非常接近于1,所以可以认为gpr模型的预测结果与实际燃弧时间误差较小,可以实现较好的预测。但是gpr模型是一个机器学习算法,其不能产生具体的数学模型,不能仅仅依靠高斯过程回归模型去得出潜供电弧的燃弧时间经验公式,所以可以通过给定训练好的gpr模型来检验回归模型的好坏,从而给出一个相对较好的数学回归模型。
[0159]
基于高斯过程回归的多元回归模型评价
[0160]
由于高斯过程回归可以输出预测函数以及在给定置信水平下的上下界函数,所以可以用来检验上文的多元线性回归模型和多元幂函数模型。
[0161]
图11为高斯过程回归模型和多元幂函数回归模型预测结果,其中折线为多元幂函数回归结果,另一折线为高斯过程回归模型结果,上下95%边界用黑色虚线表示。图中显示幂函数模型在这个区间内在燃弧时间在[0.5,1]的区间内的图像与gpr模型的预测曲线相差较小,说明误差相对较小。燃弧时间在[0.1,0.25]区间内多元线性回归模型与gpr预测模型符合较好,有一段回归曲线在图中与预测曲线几乎重合。幂函数模型回归的结果在这个区间内通常远远小于gpr模型预测曲线的结果,甚至出现了有的点低于gpr模型预测曲线95%置信区间的下边界,说明在燃弧时间为[0.1,0.25]的区间内幂函数模型预测效果不好。
[0162]
图12为高斯过程回归模型和多元线性回归模型预测结果。其中一折线为多元线性回归模型结果。在图中可以看到在燃弧时间较短,燃弧时间小于0.1s时幂函数模型与gpr模型预测曲线较为相符,但是多元线性回归模型与gpr模型预测结果相差较大,线性回归模型在这个区间大部分的燃弧时间都高于0.1秒,甚至有的点超出了gpr模型预测曲线95%置信区间的上边界,说明线性回归模型在这个区间内回归效果不好。
[0163]
由上分析可知线性回归和幂函数回归只在一定的燃弧时间区间内拟合结果较好,所以为了提高数学表达式输出结果的精度,本实施例规定燃弧时间小于0.1秒的时候使用幂函数模型,燃弧时间大于0.1秒时使用线性回归模型。
[0164]
综上所述,在保证高斯回归模型准确性的基础上,可以通过高斯过程回归模型对
燃弧时间回归模型进行修正,使之更加符合实际,在燃弧时间较短的时候,使用幂函数回归模型,在燃弧时间较长的时候使用线性回归模型,这样做可以减小回归模型误差,更好的进行燃弧时间的预测。
[0165]
本实施例通过潜供电弧低压模拟实验得出的数据,详细分析了对潜供电弧燃弧时间影响显著的因素,并在此基础上对这些因素进行离群值的去除,最终对燃弧时间进行多元拟合回归,并成功较为精确的预测了燃弧时间。
[0166]
本实施例通过多因素方差分析和有关软件的计算,得出对潜供电弧燃弧时间影响最为显著的因素为回路参数,风向,最大恢复电压,瞬时潜供电流,瞬时功率,电弧长度,并且通过残差分析说明此实验的数据是满足正态齐性和方差齐性的,满足多因素方差分析的条件,验证了方差模型的正确性。
[0167]
本实施例通过基于密度的dbscan聚类算法,对潜供电弧燃弧时间的数据进行了离群值的去除,并对去除离群值之后的数据进行了详细的分析。最大恢复电压和燃弧时间成比较明显的反比关系,最大恢复电压越大,燃弧时间会越受抑制,越不利于潜供电弧燃烧。电弧长度越长,相应的潜供电弧燃烧时间越长;
[0168]
本实施例通过多元回归模型对燃弧时间进行拟合,并且通过共线性诊断去除在数据分析中重复的因素,降低拟合的难度,提高拟合的效率。通过高斯过程回归算法得出燃弧时间的预测值,并给定了燃弧时间95%的上下边界,提供了对潜供电弧燃弧时间预测模型的检验边界。最终通过多元模型和高斯过程回归模型预测结果进行对比,得出在燃弧时间小于设定值时幂函数模型精度较高、燃弧时间大于设定值时线性模型精度较高的结论。
[0169]
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1