本发明属于电力技术领域,更具体地说,是涉及一种基于电量曲线特征模型的线损异常诊断方法及装置。
背景技术
电网电能损耗率简称为线损,是电力企业一项重要综合性技术经济指标。它反映了一个电力网的规划设计、生产技术和运行管理水平,长期以来受到各级电力企业的重视。随着经济的发展及电力市场化的深入,为减少电网的运行成本,对电力网节能降损工作提出了更高的要求。当发生采集装置故障、采集数据传输失败、线变关系错误、系统档案错误、集中器计量误差、电能表计量误差、偷电漏电等情况都会引发线损异常。如何根据各计量装置采集的数据,进一步分析造成高损异常的原因、定位电量异常用户,是各供电公司面临的实际问题。
传统方式一般是通过抽取高损日和正常日的采集数据进行比较,发现台区或者用户用电量变化的情况,再跟据以往工作经验进行问题初步判断,进行现场人工排查。这种排查方式筛选数据随机性太强,查找问题比较繁琐,且容易出现错误判断。导致工作人员赴现场后,检查目标针对性不强,往往加大了工作量和工作难度,最终检查结果也很难准确找到高损问题原因。
技术实现要素:
本发明的目的在于提供一种基于电量曲线特征模型的线损异常诊断方法及装置,以解决现有技术中存在的筛选数据随机性太强,查找问题繁琐以及分析结果可靠性不高的技术问题。
本发明实施例的第一方面,提供了一种基于电量曲线特征模型的线损异常诊断方法,包括:
从第一系统中获取第一源数据;
在第二系统对所述第一源数据按照预设规则处理得到第二源数据,所述预设规则为使用抗差最小二乘法进行噪声数据辨识、并清除噪声数据;
使用皮尔逊相关系数算法对所述第二源数据进行第一线损异常诊断分析,计算得到线路损耗电量与所述线路用电量的相关程度;若所述相关程度超出预设阈值则判定所述第二源数据对应线路为线损异常线路;
对所述相关程度未超出所述预设阈值部分进行第二线损异常诊断分析,使用聚类分群算法选择相关变量进行聚类分群得到相关变量分群;
使用决策分析算法对所述相关变量分群进行分析得到所述相关变量对于线损异常的决定程度值;
根据所述决定程度值判断线损异常的可能性,若所述可能性大于预设可能性阈值则判定所述第二源数据对应线路为线损异常线路。
本发明实施例的第二方面,提供了一种基于电量曲线特征模型的线损异常诊断装置,其特征在于,包括:
第一源数据获取单元,用于从第一系统中获取第一源数据;
第二源数据处理单元,用于在第二系统对所述第一源数据按照预设规则处理得到第二源数据,所述预设规则为使用抗差最小二乘法进行噪声数据辨识、并清除噪声数据;
相关程度计算单元,用于使用皮尔逊相关系数算法对所述第二源数据进行第一线损异常诊断分析,计算得到线路损耗电量与所述线路用电量的相关程度;
第一线损异常线路判定单元,用于若所述相关程度超出预设阈值,则判定所述第二源数据对应线路为线损异常线路;
相关变量分群处理单元,用于对所述相关程度未超出所述预设阈值部分进行第二线损异常诊断分析,使用聚类分群算法选择相关变量进行聚类分群得到相关变量分群;
决定程度值处理单元,用于使用决策分析算法对所述相关变量分群进行分析得到所述相关变量对于线损异常的决定程度值;
第二线损异常线路判定单元,用于根据所述决定程度值判断线损异常的可能性,若所述可能性大于预设可能性阈值则判定所述第二源数据对应线路为线损异常线路。
本发明实施例的第三方面,提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的基于电量曲线特征模型的线损异常诊断方法的步骤。
本发明实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的基于电量曲线特征模型的线损异常诊断方法的步骤。
本发明提供的基于电量曲线特征模型的线损异常诊断方法及装置的有益效果在于:本发明建立了基于皮尔逊相关系数算法、聚类分群算法、决策分析算法的电量曲线特征参数模型,通过两次线损异常分析,可以有效发现导致线路或台区高损的异常用电行为,锁定问题表计,分析异常原因,进一步辅助工作人员制定降损方案,本发明提供的基于电量曲线特征参数模型的线损异常分析方法及装置计算速度快,数据获取便捷,且分析结果可靠性高。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种基于电量曲线特征模型的线损异常诊断方法的流程示意图;
图2为本发明另一实施例提供的抗差最小二乘法的函数曲线示意图。
图3为本发明一实施例提供的基于电量曲线特征模型的线损异常诊断装置的结构框图。
图4为本发明一实施例提供的一种终端设备的示意框图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参考图1,图1为本发明一实施例提供的一种基于电量曲线特征模型的线损异常诊断方法的流程示意图。所述方法包括:
s101:从第一系统中获取第一源数据。
在本实施例中,第一源数据为线路、台区和用户电量数据,第一系统为“一体化电量与线损管理系统”和“用电信息采集系统”。线路、台区和用户电量数据,可通过“一体化电量与线损管理系统”和“用电信息采集系统”的前台页面或者后台数据库批量导出,数据导出后为表格形式。连续导出多天电量数据后,通过函数公式匹配形成多日电量数据,并生成电量曲线。
上述数据可通过系统前台导出,不需要考虑数据接口问题和用户权限问题,通过简单的操作即可实现基础数据的获取,保证了本发明技术方案的可推广性和适用性。
s102:在第二系统对所述第一源数据按照预设规则处理得到第二源数据,所述预设规则为使用抗差最小二乘法进行噪声数据辨识、并清除噪声数据。
在本实施例中,由于系统导出的电量数据可能存在由于设备采集波动产生的较大误差,即噪声数据。所以在线损异常诊断分析前需要进行数据处理,可通过抗差最小二乘法来清除噪声数据,所得数据即为第二源数据。
s103:使用皮尔逊相关系数算法对所述第二源数据进行第一线损异常诊断分析,计算得到线路损耗电量与所述线路用电量的相关程度;
在本实施例中,皮尔逊相关系数又称皮尔逊积矩相关系数、简单相关系数,它可以分析两个定距变量间联系的紧密程度,用于度量两个变量之间的线性相关度。在线监测过程中,可以发现线路损耗电量与其用电量之间存在线性关系,因此本发明采用线路损耗电量与其用电量的相关程度作为判定线损异常的依据之一。
s104:若所述相关程度超出预设阈值则判定所述第二源数据对应线路为线损异常线路。
在本实施例中,当线路损耗电量与其用电量的相关程度很大时,说明存在表计计量问题,即判定第二源数据对应线路为线损异常线路。
值得注意的是,前述相关程度包括正相关程度和反相关程度。
s105:对所述相关程度未超出所述预设阈值部分进行第二线损异常诊断分析,使用聚类分群算法选择相关变量进行聚类分群得到相关变量分群。
s106:使用决策分析算法对所述相关变量分群进行分析得到所述相关变量对于线损异常的决定程度值。
s107:根据所述决定程度值判断线损异常的可能性,若所述可能性大于预设可能性阈值则判定所述第二源数据对应线路为线损异常线路。
在本实施例中,在实践应用的过程中,一些用户的用电量占线路损耗电量比重较小,根据前述皮尔逊相关系数算法计算得出的相关程度在预设阈值范围之内,即使存在异常用电行为也不能对线路线损曲线产生明显影响,即存在数据淹没的问题,因此本发明会进行第二线损异常诊断分析。
首先选定与线损异常相关的变量,采用聚类分群算法对相关变量进行聚类分群,得到相关变量的分群;再通过决策分析算法对相关变量分群进行量化分析预测,得到相关变量对线损异常的决定程度,根据决定程度判断第二源数据对应线路线损异常的可能性。其中表计计量负误差、偶发性采集失败、供带关系错误、窃电漏电都会引起线损异常,决策分析算法可以计算出各个相关变量分群对应各个异常用电原因的可能性,输出分析结果,可根据分析结果所示的可能性判断是否存在对应原因线损异常,即分析结果所示的可能性大于预设的可能性阈值时,判定第二源数据对应线路为线损异常线路,小于预设的可能性阈值时则忽略。
其中,针对多条线路进行计算,发现85%以上线路损耗电量与线路用电量的相关程度的值在-0.4至0.4之间,因此采用-0.4~0.4作为预设阈值范围。
从上述描述可知,本发明实施例建立了基于皮尔逊相关系数算法、聚类分群算法、决策分析算法的电量曲线特征参数模型,通过两次线损异常分析,可以有效发现导致线路或台区高损的异常用电行为,锁定问题表计,分析异常原因,进一步辅助工作人员制定降损方案,本发明实施例提供的基于电量曲线特征参数模型的线损异常分析方法计算速度快,数据获取便捷,且分析结果可靠性高。
参考图2,图2为本发明另一实施例提供的抗差最小二乘法的函数曲线示意图。所述方法还包括:所述抗差最小二乘法对可靠电量数据赋予较大权重进行保留,对误差明显的电量数据赋予较小权重进行抗差限制,对误差较大的电量数据进行淘汰。
本发明采用抗差最小二乘法对噪声数据进行清理,首先会根据第一源数据建立相应的函数曲线示意图,根据抗差最小二乘法将权重因子取值函数分为四个区,记为ⅰ、ⅱ、ⅲ、ⅳ。ⅰ区对可靠电量数据赋予较大权重进行保留;ⅱ区和ⅲ区对于误差明显的电量数据赋予较小权重进行抗差限制;ⅳ区对于误差较大的电量数据取权重因子为0,予以淘汰。
在本发明的再一实施例中,所述方法还包括:所述皮尔逊相关系数算法为加权后的皮尔逊相关系数算法,所述加权皮尔逊相关系数算法根据当日的线损波动程度对当日的所述相关程度进行加权。
传统皮尔逊相关系数算法表达式为:
式(7)中x、y为两个观测值,r表示两个观测值的相关度。
传统皮尔逊相关系数算法在运算过程中,不能重点体现关键节点对计算结果的影响程度。如果某条线路在一段时间内的i日出现大幅线损波动,则需要对i日所有的用电情况进行重点分析,因此可以加大i日的用电相关度对于结果r值的影响,即对i日的计算结果进行加权。
权重系数k的取值为:
式(1)中x为当日线路损耗值。
对i日的计算结果进行加权后所得的加权皮尔逊相关系数算法表达式为:
上述采用加权后的皮尔逊相关系数算法可以实现对不同情况下数据的处理分析,保证本发明实施例技术方案的适用性以及准确性。
在本发明的一个实施例中,所述方法还包括:所述聚类分群算法为k-means算法。
聚类分群算法选择曲线皮尔逊相似度、日均用电量占比、用电量变异系数和用电量变化趋势度四个变量进行聚类分群。即聚类分群算法选择的相关变量为曲线皮尔逊相似度、日均用电量占比、用电量变异系数和用电量变化趋势度。
曲线皮尔逊相似度即为通过皮尔逊相关系数算法所计算得到的相似度;日均用电量占比反映了用户负荷对线路线损率的影响程度,为变电台日均用电量与线路日均用电量的比值。
用电量变异系数反映了用户负荷曲线的波动程度,如果曲线有大幅值的波动会提升变异系数,其计算公式为:
式(9)中r为用电量变异系数,xi为日用电量,
用电量变化趋势度反映了用户负荷曲线的波动频率,如果曲线频繁产生波动会提升变化趋势度,其计算公式为:
式(10)中t为用电量变化趋势度,xi为当日用电量,xi+1为下一日用电量。
在本发明的一个实施例中,所述方法还包括:所述抗差最小二乘法为hampel抗差法。
在本发明的一个实施例中,所述方法还包括:所述决策分析算法为id3决策算法。
对应于上文实施例的基于电量曲线特征模型的线损异常诊断方法,图3为本发明一实施例提供的基于电量曲线特征模型的线损异常诊断装置的结构框图。为了便于说明,仅示出了与本发明实施例相关的部分。参考图3,该装置包括:第一源数据获取单元301、第二源数据处理单元302、相关程度计算单元303、第一线损异常线路判定单元304、相关变量分群处理单元305、决定程度值处理单元306和第二线损异常线路判定单元307。
其中,第一源数据获取单元301,用于从第一系统中获取第一源数据;
第二源数据处理单元302,用于在第二系统对所述第一源数据按照预设规则处理得到第二源数据,所述预设规则为使用抗差最小二乘法进行噪声数据辨识、并清除噪声数据;
相关程度计算单元303,用于使用皮尔逊相关系数算法对所述第二源数据进行第一线损异常诊断分析,计算得到线路损耗电量与所述线路用电量的相关程度;
第一线损异常线路判定单元304,用于若所述相关程度超出预设阈值,则判定所述第二源数据对应线路为线损异常线路;
相关变量分群处理单元305,用于对所述相关程度未超出所述预设阈值部分进行第二线损异常诊断分析,使用聚类分群算法选择相关变量进行聚类分群得到相关变量分群;
决定程度值处理单元306,用于使用决策分析算法对所述相关变量分群进行分析得到所述相关变量对于线损异常的决定程度值;
第二线损异常线路判定单元307,用于根据所述决定程度值判断线损异常的可能性,若所述可能性大于预设可能性阈值则判定所述第二源数据对应线路为线损异常线路。
参考图3,在本发明的一个实施例中,所述第二源数据处理单元302,用于所述使用抗差最小二乘法进行噪声数据辨识、并清除噪声数据的过程包括:
所述抗差最小二乘法对可靠电量数据赋予较大权重进行保留,对误差明显的电量数据赋予较小权重进行抗差限制,对误差较大的电量数据进行淘汰。
参考图3,在本发明的一个实施例中,所述相关程度计算单元303,用于所述皮尔逊相关系数算法为加权后的皮尔逊相关系数算法,所述加权皮尔逊相关系数算法根据当日的线损波动程度对当日的所述相关程度进行加权,权重系数k的取值为:
式(1)中x为当日线路损耗值。
参考图3,在本发明的一个实施例中,所述相关变量分群处理单元305,用于所述聚类分群算法为k-means算法,k-means算法将给定点集p={x1,x2,...xn}划分为k个子集,优化目标为给定点集中各点到其所属子集中心点的距离平方和最小,公式为:
式(2)中,xj为划分的第j个子集;xi为子集xj中的第i个点;cj为子集xj的中心点。
参考图3,在本发明的一个实施例中,所述第二源数据处理单元302,用于所述抗差最小二乘法为hampel抗差法,hampel抗差法采用了三段截尾ρ函数用于粗差的识别和修正,对于n个节点组成的网络,算法的ρ函数可用以下公式表达:
式(3)中a、b、c为调制阈值,一般在1.0~3.0之间,j={1,2,3...n};
式(4)中v为电量数据残差,j为平差因子阵;σ为余差的绝对中位差,j={1,2,3...n}。
参考图3,在本发明的一个实施例中,所述决定程度值处理单元306,用于所述决策分析算法为id3决策算法,所述id3决策算法计算所述相关变量分群的信息增益,所述id3决策算法的信息熵公式为:
式(5)中ent(d)表示整个信息集的熵,pk表示信息集;
所述id3决策算法的信息增益公式为:
式(6)中gain(d,a)表示a变量在整个信息集d中的信息增益,即影响程度。
参见图4,图4为本发明一实施例提供的一种终端设备的示意框图。如图4所示的本实施例中的终端600可以包括:一个或多个处理器601、一个或多个输入设备602、一个或多个则输出设备603及一个或多个存储器604。上述处理器601、输入设备602、则输出设备603及存储器604通过通信总线605完成相互间的通信。存储器604用于存储计算机程序,所述计算机程序包括程序指令。处理器601用于执行存储器604存储的程序指令。其中,处理器601被配置用于调用所述程序指令执行以下操作上述各装置实施例中各模块/单元的功能,例如图3所示模块301至307的功能。
应当理解,在本发明实施例中,所称处理器601可以是中央处理单元(centralprocessingunit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备602可以包括触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风等,输出设备603可以包括显示器(lcd等)、扬声器等。
该存储器604可以包括只读存储器和随机存取存储器,并向处理器601提供指令和数据。存储器604的一部分还可以包括非易失性随机存取存储器。例如,存储器604还可以存储设备类型的信息。
具体实现中,本发明实施例中所描述的处理器601、输入设备602、输出设备603可执行本发明实施例提供的基于电量曲线特征模型的线损异常诊断方法的第一实施例和第二实施例中所描述的实现方式,也可执行本发明实施例所描述的终端的实现方式,在此不再赘述。
在本发明的另一实施例中提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
所述计算机可读存储介质可以是前述任一实施例所述的终端的内部存储单元,例如终端的硬盘或内存。所述计算机可读存储介质也可以是所述终端的外部存储设备,例如所述终端上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述计算机可读存储介质还可以既包括所述终端的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序及所述终端所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的终端和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的终端和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。