基于LS_SVM和PCA的架空输电线路风险评估方法与流程

文档序号:11217042阅读:888来源:国知局
基于LS_SVM和PCA的架空输电线路风险评估方法与流程

本发明属于电力设备技术领域,尤其涉及基于ls_svm和pca的架空输电线路风险评估方法。



背景技术:

由于输电线路的分布位置较广,运行环境复杂,导致技术因素的特征参量信息采集困难,工作量巨大,运用国家电网规则对输电线路进行风险评估的方案也较为繁琐。在发生自然灾害时,技术因素之间具有很大的相关性,例如冰雪灾害下,舞动、冰灾和冰害对线路的影响相互叠加。为避免重复计算相关技术因素对线路的影响,更加简化线路的风险评估,减少数据采集的工作量,有必要选取关键性技术因素进行评估,除去影响较小的技术因素,同时建立一个适用性较强,且评估简易的方法对输电线路运行环境整体风险进行评估。

由于运行环境整体风险评估过程中,需要评估和搜集的特征量过多,会增加分析问题的难度和复杂度。故可以通过降维技术,除去某些冗余特征量以达到简化模型的效果。目前应用较多的有主成分分析(以下称pca)、因子分析、典型相关分析等。而因子分析主要是通过寻找潜在的、不可观测的组合变量来表达原始变量之间的数据关系。pca可以通过提取少量主成分因子,这些主成分可以通过原变量的线性组合得到,能够表征原始数据的大部分信息,从而简化了评估过程。



技术实现要素:

本发明的目的是提供一种结合最小二乘支持向量机(以下称ls_svm)和pca的架空输电线路运行环境整体风险评估模型,能够简化输电线路运行环境风险评估过程。

为实现上述目的,本发明采用的技术方案是:基于ls_svm和pca的架空输电线路风险评估方法,包括以下步骤:

步骤1、提取表征影响架空输电线路安全的运行环境技术因素的特征量,进行数据预处理;

步骤2、对于处理过的特征量,采用主成分分析,对特征量进行降维处理,选取出n个关键特征量;

步骤3、将部分包含n个关键特征量的样本作为训练数据,作为ls_svm的输入进行训练,构造一个分类器,建立用于架空输电线路运行环境整体风险评估的ls_svm模型;将包含n个关键特征量的剩余样本作为测试数据进行测试,与原有评估结果进行对比,得到预测精度;

步骤4:将新得到的架空输电线路特征量输入步骤3所建立的用于架空输电线路运行环境整体风险评估ls_svm模型,得到新评估架空输电线路风险状态等级。

在上述的基于ls_svm和pca的架空输电线路风险评估方法中,步骤2的实现包括:

步骤2.1、根据定义标准化之后得到一个p×n阶的矩阵:x=(x1,x2,...,xp)t,其中有n个样本,p个特征量;

步骤2.2、建立特征量的相关系数阵:

r=(rij)p×p=x′x,求出r的特征值λ1≥λ2≥…≥λp≥0,对应的特征向量为α1,α2,…,αp;

步骤2.3、确定主成分个数:

前m个主成分的累计贡献率为:

当前m个主成分的累计贡献率达到80%,用前m个主成分来表征原始p个特征量的信息,m<p,记f=(f1,f2,...,fm)t,实现降维的目的;

式中:a表示因子载荷矩阵;

步骤2.4、主成分得分计算

通过对得到的m个主成分进行加权,可以得到主成分的综合得分c以及每个特征量的权重k;

特征量对主成分综合得分的权重为:

k=(k1,k2,...,kp)=(λ1α1+λ2α2+…+λmαm)t(5);

步骤2.5、将特征量的权重k归一化到[0,1],得到关键特征量;选取出n个权重大于0.5的关键特征量。

本发明的有益效果是:

1、通过分析,提取出了表征影响架空输电线路安全的运行环境技术因素的特征量,便于进行数据统计,为算法训练数据分析提供坚实的数据基础。

2、针对实际数据采集的工作量和风险评估的复杂性,使用pca对特征量进行降维处理,得到权重较大的关键特征量,减小了分析问题的难度和复杂度。同时降低了一线巡检人员的工作量。

3、ls_svm算法基于结构风险最小化原理,具有较好的泛化能力,在小样本下效果尤其突出,可以通过对pca提取出的关键特征量数据进行训练分析,并得到最优的分类器,最后通过该分类器得到新线路的风险评估结果。从而简化了输电线路运行环境风险评估方法。ls_svm训练时间更短,结果也更加精确。

附图说明

图1是本发明一个实施例基于ls_svm和pca的架空输电线路风险评估流程图。

具体实施方式

下面结合附图对本发明的实施方式进行详细描述。

所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。它们仅仅为示例,并且目的不在于限制本发明。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。此外,本发明提供了各种特定的工艺和材料的例子,但是本领域普通技术人员可以意识到其它工艺的可应用性和/或其他材料的使用。另外,以下描述的第一特征在第二特征之“上”的结构可以包括第一和第二特征形成为直接接触的实施例,也可以包括另外的特征形成在第一和第二特征之间的实施例,这样第一和第二特征可能不是直接接触。

本发明的描述中,需要说明的是,除非另有规定和限定,术语“相连”“连接"应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于相关领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。

本实施例采用以下技术方案来实现,基于ls_svm和pca的架空输电线路风险评估方法,包括以下步骤:

步骤1、提取表征影响架空输电线路安全的运行环境技术因素的特征量,进行数据预处理;

步骤2、对于处理过的特征量,采用主成分分析,对特征量进行降维处理,选取出n个关键特征量;

步骤3、将部分包含n个关键特征量的样本作为训练数据,作为ls_svm的输入进行训练,构造一个分类器,建立用于架空输电线路运行环境整体风险评估的ls_svm模型;将包含n个关键特征量的剩余样本作为测试数据进行测试,与原有评估结果进行对比,得到预测精度;

步骤4:将新得到的架空输电线路特征量输入步骤3所建立的用于架空输电线路运行环境整体风险评估ls_svm模型,得到新评估架空输电线路风险状态等级。

进一步,步骤2的实现包括:

步骤2.1、根据定义标准化之后得到一个p×n阶的矩阵:x=(x1,x2,...,xp)t,其中有n个样本,p个特征量;

步骤2.2、建立特征量的相关系数阵:

r=(rij)p×p=x′x,求出r的特征值λ1≥λ2≥…≥λp≥0,对应的特征向量为α1,α2,…,αp;

步骤2.3、确定主成分个数:

前m个主成分的累计贡献率为:

当前m个主成分的累计贡献率达到80%,用前m个主成分来表征原始p个特征量的信息,m<p,记f=(f1,f2,...,fm)t,实现降维的目的;

式中:a表示因子载荷矩阵;

步骤2.4、主成分得分计算

通过对得到的m个主成分进行加权,可以得到主成分的综合得分c以及每个特征量的权重k;

特征量对主成分综合得分的权重为:

k=(k1,k2,...,kp)=(λ1α1+λ2α2+…+λmαm)t(5);

步骤2.5、将特征量的权重k归一化到[0,1],得到关键特征量;选取出n个权重大于0.5的关键特征量。

具体实施时,考虑到线路运行受较多环境技术因素影响,各技术因素对线路有叠加影响,且技术因素的特征量测量和采集工作繁重、困难。故以传统评估结果为样本,首先用pca方法对11个技术因素进行降维处理,忽略影响较少的技术因素,得到贡献率较大的技术因素来表征输电线路运行环境整体风险,即得到关键特征量,最后采用ls_svm算法对包含关键特征量的样本进行训练,并分析。

本实施例的技术方案是:

(1)pca提取关键特征量

由于运行环境整体风险评估过程中,需要评估和搜集的特征量过多,会增加分析问题的难度和复杂度。故可以通过降维技术,除去某些冗余特征量以达到简化模型的效果。pca可以通过提取少量主成分因子,这些主成分可以通过原变量的线性组合得到,能够表征原始数据的大部分信息,从而简化了评估过程。

用pca提取关键特征量的步骤如下:

1)根据定义标准化之后可以得到一个p×n

阶的矩阵:x=(x1,x2,...,xp)t,其中有n个样本,p个特征量。

2)建立特征量的相关系数阵:

r=(rij)p×p=x′x,求出r的特征值λ1≥λ2≥…≥λp≥0,对应的特征向量为α1,α2,…,αp。

3)确定主成分个数:

前m个主成分的累计贡献率为:

累计贡献率表明了前m个主成分的解释能力。当前m个主成分的累计贡献率达到80%~90%,此时可以用该m个主成分来表征原始p个特征量的信息(m<p),记f=(f1,f2,...,fm)t,从而达到了降维的目的。

式中:a表示因子载荷矩阵。

4)主成分得分计算

通过对得到的m个主成分进行加权,可以得到主成分的综合得分c以及每个特征量的权重k。

由(5)式可以得到特征量对主成分综合得分的权重

k=(k1,k2,...,kp)=(λ1α1+λ2α2+…+λmαm)t(5)

5)将特征量的权重k归一化到[0,1],可以得到关键特征量,即当特征量权重越大,表明该特征量表征的原始数据信息量越大,则该特征量就越具有代表性,因此把权重大于0.5的特征量选取为关键特征量。

通过降维选出来的关键特征量在误差允许的范围内可以代替原有数据进行风险评估,降低复杂度,同时降低一线巡检人员的工作量。

(2)基于ls-svm的风险状态评估

鉴于上述(1)的分析,引入支持向量机技术来构造风险分类器,来简化风险评估过程。支持向量机基于结构风险最小化原理,具有较好的泛化能力,在小样本下效果尤其突出。本实施例采用拓展的支持向量机,即ls-svm,其训练时间更短,结果也更加精确。

1)ls_svm算法

故障识别功能即相当于ls_svm的分类器功能,通过使用最大分类间隔来设计决策最优分类超平面,以获得良好的推广能力和预测能力。对非线性进行分类,需要用到核函数来将非线性的训练数据映射到高维空间,从而在高维空间构造最优分类超平面。其分类函数形式上相当于一个神经网络,输出是中间节点的线性组合,一个支持向量即为一个中间节点。

分类的优化方程为:

其中:ω是映射权值向量,b是阈值,ξ是松弛变量,φ为非线性映射函数,γ为惩戒函数。

引入拉格朗日函数

其中,αi为拉格朗日乘子,通过求l对应于ω、ξ、b、αi的偏导置零后,根据kkt条件消去ω和ξ后,可以得到线性方程

其中,ω=yiyjφ(xi)tφ(xj)=yiyjk(xi,xj),y=[y1,...,yn],1v=[1,...,1],k(xi,xj)为核函数,在此选用径向基核函数。其形式为:

这样就将非线性问题转化成线性问题求解,该线性方程可以用最小二乘法进行求解,简化计算复杂度,所以最小二乘支持向量机比一般向量机有更快的训练速度,从而构造了一个风险分类器。

综上所述,对技术因素的特征量进行pca,通过特征量主成分综合得分的权重提取出能够表征输电线路风险状态的关键特征量,结合ls_svm,得到输电线路运行环境整体风险评估方法。具体评估步骤可概括如下:

步骤1:提取出所有技术因素的特征量,并进行数据预处理。

步骤2:对于处理过的特征量,应用pca,对特征量进行降维处理,当前m个特征量的累计贡献率达到80%,即可认为该m个特征量可以表征原始数据结构。通过公式(5)计算,选取出n个权重大于0.5的关键特征量。

步骤3:将部分包含该n个关键特征量的样本作为训练数据,作为ls_svm的输入进行训练,构造一个分类器,建立用于架空输电线路运行环境整体风险评估的ls_svm模型。将包含该n个关键特征量的剩余样本作为测试数据进行测试,与原有评估结果进行对比,得到预测精度。

步骤4:将新得到的架空输电线路特征量输入上述建立的ls_svm风险评估模型,得到新评估架空输电线路风险状态等级。

应当理解的是,本说明书未详细阐述的部分均属于现有技术。

虽然以上结合附图描述了本发明的具体实施方式,但是本领域普通技术人员应当理解,这些仅是举例说明,可以对这些实施方式做出多种变形或修改,而不背离本发明的原理和实质。本发明的范围仅由所附权利要求书限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1