一种基于层次分析法和孤立森林的窃电辨识方法与流程

文档序号:18622929发布日期:2019-09-06 22:40阅读:203来源:国知局
一种基于层次分析法和孤立森林的窃电辨识方法与流程
本发明属于电力用户窃电分析
技术领域
,更为具体地讲,涉及一种基于层次分析法ahp(analytichierarchyprocess)和孤立森林iforest(isolationforest)的窃电辨识方法。
背景技术
:近年来,随着我国经济的迅猛发展和科学技术的日新月异,电力系统的规模日趋庞大,接入网络的用电负荷也与日俱增,用电的费用也变得非常可观,可观的经济利益使不法分子产生了违法窃电的想法,因此各种窃电技术不断地推陈出新,日益繁杂。窃电不仅损害了国家和供电企业的经济利益,严重影响了社会经济的正常发展,同时还存在着比较大的安全隐患,影响着电网的安全运行。但是,传统的窃电检测方法存在着及时性不佳、智能型不够、证据不足等缺点,因此,寻求一种能够智能精确定位窃电行为的方法成为智能电网建设的重要挑战。目前,对窃电行为分析主要集中在两个方面。一个是根据统计方法来计算电阻、线损、非技术损失等来判断。杨佳根据窃电前后的电气参量的变化,提出了利用线路电阻作为窃电的判据;danielnikolaevnikovsk等人提出了基于配电网技术损失预测方法的窃电检测,在不知道配电网的具体拓扑结构时,通过技术损失统计方法来间接估计配电网的非技术损失,当非技术损失超过一定比率时说明存在窃电。但是,对于这类方法存在一个缺点,就是配电网中的技术损失存在着多种可能,无法精确计算,并且这些方法不能对窃电用户进行精准的定位。另一种方法是采用数据挖掘和机器学习技术,如决策树、模式识别等,用来发现不正常的用电模式。bharatdangar等人提出了一种使用极限学习机(elm)、改进elm(os-elm)、支持向量机(svm)三种算法来进行电力损耗识别、检测和预测的电力损耗分析框架,并应用于印度古吉拉特邦guvnl公司,减少由于窃电导致的配电损耗,取得了较好的成果;曾虎首先利用模糊c均值(fcm)算法对负荷曲线进行聚类,得到典型特征曲线,再与用户负荷曲线进行匹配,筛选出疑似窃电用户,再使用基于粒子群算法优化的svm算法进行进一步检测,准确性较svm算法高。但是这类方法通常需要大量的窃电样本来对方法进行训练,以提高窃电辨识率,而且辨识结果高度依赖样本类型,但是实际情况中窃电样本往往很缺乏。技术实现要素:本发明的目的在于克服现有技术的不足,提供一种基于层次分析法和孤立森林的窃电辨识方法,通过计算各窃电指标权重的方式快速、精确定位窃电行为。为实现上述发明目的,本发明一种基于层次分析法和孤立森林的窃电辨识方法,其特征在于,包括以下步骤:(1)、构建窃电判别指标集构建包括电压不平衡率、电流不平衡率、负荷不平衡率、电量同比、功率因数不平衡率和电量环比的窃电判别指标集;(2)、利用层次分析法构建用户窃电辨识数据集(2.1)、构建判别矩阵基于窃电指标集对于窃电分析的重要性进行排序:电流不平衡率>电压不平衡率>负荷不平衡率=功率因数不平衡率>电量同比=电量环比;然后对于窃电分析的重要性进行两两对比,并利用9位标度法建立判别矩阵;(2.2)、计算权向量及一致性检验先计算判别矩阵的最大特征值λmax和对应的特征向量α,再计算窃电指标的一致性ci;其中,n为窃电指标个数;计算判别矩阵的一致性比例:其中,ri表示平均随机一致性指标;设置判别阈值cr*;当cr<cr*时,则判别矩阵满足一致性要求,那么,特征向量α归一化后即为指标的权向量;(2.3)、构建用户窃电辨识数据集将步骤(1)构建的用户窃电判别指标集与步骤(2.2)计算的权向量相乘,得到用户窃电辨识数据集;(3)、利用孤立森林进行窃电辨识(3.1)、利用孤立森林计算用户分割路径长度设置孤立森林的最大深度h=ceiling(log2m),m为孤立森林中用户总数;随机选择用户窃电辨识数据集特征并利用孤立森林对进行分割,然后计算每个用户被分割出来的路径长度;(3.2)、快速孤立疑似窃电用户设置路径长度阈值h*;计算每个用户在孤立森林中的平均路径长度h(i),i=1,2,…,m,将h(i)<h*的用户孤立为疑似窃电用户;(3.3)、计算疑似窃电用户的异常指数计算所有疑似窃电用户i的异常指数,其中,e(h(i))表示疑似窃电用户i在孤立森林中的平均路径长度,c(m)为m个用户在孤立森林中的平均路径长度;(3.4)、辨识窃电行为设置异常指数阈值s*;对所有异常指数进行升序排序,当疑似窃电用户i的异常指数s>s*时,表明该用户存在窃电行为,且s越接近1,该用户窃电的可能性越高;当疑似窃电用户i的异常指数s≤s*时,表明该用户正常用电。本发明的发明目的是这样实现的:本发明基于层次分析法和孤立森林的窃电辨识方法,基于用户电量计量方式和用户窃电手段的分析,构建了包括电压不平衡率、电流不平衡率、功率因数不平衡率、电量同比、电量环比、负荷不平衡率的窃电指标集;然后基于ahp算法计算各窃电指标权重,构建用户窃电辨识数据集;最后利用孤立森林算法构建用户窃电行为辨识模型,找出用户群中的离群点,定位窃电用户。同时,本发明基于层次分析法和孤立森林的窃电辨识方法还具有以下有益效果:(1)、由于iforest算法利用不放回抽样方法随机产生x个数据集生成x个子树,最终组成森林,每棵树都是独立生成的,因而非常适用于大数据下的分布式系统;(2)、本发明采用无监督算法通过发现窃电用户的电气参数异常变化来孤立用户群中的离群点,无需窃电样本数据提供标签值,也不再拘泥于样本中的窃电类型,只要用户窃电造成了电气参数的异常,本发明就能准确定位,更具有普适性。附图说明图1是本发明基于层次分析法和孤立森林的窃电辨识方法流程图;图2是利用层次分析法构建用户窃电辨识数据集的流程图;图3是窃电辨识模型一种具体实施方式结构图。具体实施方式下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。实施例图1是本发明基于层次分析法和孤立森林的窃电辨识方法流程图。在本实施例中,如图1所示,本发明一种基于层次分析法和孤立森林的窃电辨识方法,包括以下步骤:s1、构建窃电判别指标集由电能功率计算公式p=uicosφ可得,电能是由电压u、电流i以及功率因数cosφ在时间上的累积,窃电用户就是通过改变其中的一个或者多个参数从而达到减少电能计量的目的。目前窃电手段层出不穷,常见的有欠流法、欠压法、扩差法、移相法、强交流磁场法和无表法等传统窃电手段,以及高频高压窃电、红外遥控窃电等高科技手段,但其根本目的都是减少甚至不计电量,因此无论什么窃电手段均会造成电气参量以及电量的异常。因此,本发明构建了包括电压不平衡率、电流不平衡率、负荷不平衡率、电量同比、功率因数不平衡率、电量环比的窃电指标集,从而多维度分析辨识用户的窃电行为。在本实施例中,构建的窃电判别指标集如表1所示;电压不平衡率电流不平衡率负荷不平衡率电量同比功率因数不平衡率电量环比0.01430.65280.06540.16290.00690.13910.01040.19830.02780.18770.06190.04420.51780.60220.0330.03670.06480.2826………………………………表1s2、如图2所示,利用层次分析法构建用户窃电辨识数据集s2.1、构建判别矩阵考虑到不同的窃电指标对于用户窃电嫌疑分析的重要性不同,传统iforest算法不能很好地诠释用户的窃电嫌疑程度,因此本发明采用层次分析法计算窃电指标权重;下面我们基于窃电指标集对于窃电分析的重要性进行两两对比,再根据9位标度法建立判别矩阵,具体过程为:在窃电指标集中,如果指标a相对于指标b重要性相同,那么两两对比结果为9/9;如果a比b稍微重要,两两对比结果为9/7;如果a比b明显重要,两两对比结果为9/5;如果a比b强烈重要,两两对比结果为9/3;如果a比b极端重要,两两对比结果为9/1;如果a比b的重要性在上述描述的中间值,两两对比结果为{9/8,9/6,9/4,9/2}。然后我们基于专家经验给出指标集中两两对窃电分析的相对重要性并排序:电流不平衡率>电压不平衡率>负荷不平衡率=功率因数不平衡率>电量同比=电量环比;由于判别矩阵为正互反矩阵,满足条件如下:因此,通过对于窃电分析的重要性进行两两对比后,我们利用9位标度法建立判别矩阵如下:s2.2、计算权向量及一致性检验先计算判别矩阵的最大特征值λmax和对应的特征向量α,再计算窃电指标的一致性ci;其中,n为窃电指标个数;计算判别矩阵的一致性比例:其中,ri表示平均随机一致性指标,由查表得来;设置判别阈值cr*;当cr<cr*时,则判别矩阵满足一致性要求,那么,特征向量α归一化后即为指标的权向量;在本实施例中,指标的权向量如表2所示;电压不平衡率电流不平衡率负荷不平衡率电量同比功率因数不平衡率电量环比0.20250.26670.17270.09270.17270.0927表2s2.3、构建用户窃电辨识数据集将步骤s1构建的用户窃电判别指标集与步骤s2.2计算的权向量相乘,得到用户窃电辨识数据集;具体计算公式为:d′i,j=di,j*wj其中,d′i,j表示用户窃电辨识数据集d'中的元素,d'的大小为m×n,i=1,2…,m,m为用户总数,j=1,2,…,n,n为指标个数;di,j表示用户窃电判别指标集d中的元素,d的大小为m×n;wj表示指标的权向量w中的元素,w的大小为1×n。在本实施例中,构建的用户窃电辨识数据集如表3所示。电压不平衡率电流不平衡率负荷不平衡率电量同比功率因数不平衡率电量环比0.00290.17410.01130.01510.00120.01290.00210.05290.00480.01740.01070.00410.10480.16060.00570.00340.01120.0262………………………………表3s3、利用孤立森林进行窃电辨识由于用户正常用电时,用户电气参量处于一个较小波动的定值或者处于一个波动范围内,用户实施窃电后导致的指标异常就致使窃电用户成为用户群中的离群点,因此本发明采用孤立森林算法(isolationforest,iforest)挖掘窃电辨识数据集中的离群点。首先我们对孤立森林的构建进行简单描述,具体为:建立单棵itree:首先在6个窃电指标中随机选择一个特征,然后随机选择该特征的一个值k,根据该特征对每条记录进行分类,把窃电数据集中该特征小于k的记录放在左节点,把大于等于k的记录放在右节点,最后递归的构造左分支和右分支,直到满足以下条件:①树达到了限制的高度;②节点上只有一个样本;③节点上的样本所有特征都相同。这样递归分割数据集,孤立异常用户很快就会被分割出来,计算用户被孤立出来时树的高度。构建孤立森林:采用bootstrap方法随机采样x个包含m个用户的子数据集,对x个子集分别建立单棵itree,然后将x棵itree组成孤立森林。接着,我们利用孤立森林进行窃电辨识的过程进行描述,具体过程为:s3.1、利用孤立森林计算用户分割路径长度设置孤立森林的最大深度h=ceiling(log2m);随机选择用户窃电辨识数据集特征并利用孤立森林对进行分割,然后计算每个用户被分割出来的路径长度;s3.2、快速孤立疑似窃电用户设置路径长度阈值h*;计算每个用户在孤立森林中的平均路径长度h(i),i=1,2,…,m,将h(i)<h*的用户孤立为疑似窃电用户;s3.3、计算疑似窃电用户的异常指数计算所有疑似窃电用户i的异常指数,其中,e(h(i))表示疑似窃电用户i在孤立森林中的平均路径长度,c(m)为m个用户在孤立森林中的平均路径长度;其中,c(m)的计算公式为:其中,h(x)为调和函数,该值可以被估计为ln(x)+0.5772156649;s3.4、辨识窃电行为设置异常指数阈值s*=0.5;对所有异常指数进行升序排序,当疑似窃电用户i的异常指数s>s*时,表明该用户存在窃电行为,且s越接近1,该用户窃电的可能性越高;当疑似窃电用户x的异常指数s≤s*时,表明该用户正常用电。图3是窃电辨识模型一种具体实施方式结构图。如图3所示,在本实施例中,为了避免数据规模较大时出现正常点与异常点混合干扰对异常点的孤立,对窃电辨识数据集采用不放回抽样选取x个子数据集,分别构建孤立树,通过计算孤立每个用户所需的路径长度来计算用户异常指数,最后对x棵树的结果取平均值得出用户的窃电嫌疑指数,由于指数越接近0表示为正常用户的可能性越高,越接近1表示为异常用户的可能性越高,对嫌疑指数集进行阈值判断,检测出窃电和正常两类用户。尽管上面对本发明说明性的具体实施方式进行了描述,以便于本
技术领域
的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本
技术领域
的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1