基于机器学习的计量点电压异常检测方法及系统与流程

文档序号:21003142发布日期:2020-06-05 22:53阅读:434来源:国知局
基于机器学习的计量点电压异常检测方法及系统与流程

本发明涉及机器学习领域,具体而言,涉及一种基于机器学习的计量点电压异常检测方法及系统。



背景技术:

计量装置电压异常是一种常见的异常现象,引起的原因一般分为两类,一类是由于计量装置自身原因引起的,另外一类是由外界因素导致的。

由于计量装置自身原因导致的故障主要是由表计、互感器、采集终端(包括专变采集终端和公变采集终端)故障。常见的表计故障主要由时钟或抄表电池、显示屏、程序飞走、eeprom损坏等。常见的计量用互感器故障有ct二次开路、局部放电、串联谐振、pt保险管或熔断丝烧毁等。

外界因素主要为接线故障和变配电设备故障。接线故障主要是未拧紧接线盒螺丝导致,在直接接入表计中也存在长期大负荷运行引起接线端子严重发热产生火花。变配电设备故障主要为高压保险跌落,变压器绕组接线错误等。

以上异常虽然种类繁多,但是最终都会反映到电压、电流等工况信号上,因此可通过对用电信息采集系统中工况信号的分析,来发现现场异常。当是,这种人工判断方式效率低,准确度差。



技术实现要素:

本发明实施例提供了一种基于机器学习的计量点电压异常检测方法及系统,以至少解决相关技术中人工判断计量装置电压异常所导致的效率低,准确度差的问题。

根据本发明的一个实施例,提供了一种基于机器学习的计量点电压异常检测方法,包括:基于决策树算法构建用于电压分类的机器学习模型;对模型的性能进行评估以度量所述模型是否达到预期的分类要求;在所述模型达到预期的分类要求的情况下,基于所述模型对计量点的电压异常进行检测。

可选地,基于决策树算法构建用于电压分类的机器学习模型包括:将电压互感器pt变比、电压值和电压分类进行组合构建决策树训练集;将所述决策树训练集引入决策树算法生成决策树。

可选地,对模型的性能进行评估以度量所述模型是否达到预期的分类要求包括:采用混淆矩阵的方式对电压进行分类评价,当分类预测值与真值相同时确定为正确的分类。

可选地,基于所述模型对计量点电压的异常进行检测包括:对用电信息采集系统中的表号、日期、日整点电压,以及表计中的pt变比进行收集;将收集后的各表的日期、日整点电压、pt变比输入所述模型,并输出各计量点的电压分类结果;根据输出的分类结果判断计量点的电压是否存在异常。

可选地,统计所述日整点电压的中位值作为所述日整点电压值。

根据本发明的另一个实施例,提供了一种基于机器学习的计量点电压异常检测系统,包括:构建模块,用于基于决策树算法构建用于电压分类的机器学习模型;评估模块,用于对模型的性能进行评估以度量所述模型是否达到预期的分类要求;检测模块,在所述模型达到预期的分类要求的情况下,基于所述模型对计量点的电压异常进行检测。

可选地,所述构建模块包括:构建单元,将电压互感器pt变比、电压值和电压分类进行组合构建决策树训练集;生成单元,用于将所述决策树训练集引入决策树算法生成决策树。

可选地,所述评估模块包括:评价单元,用于采用混淆矩阵的方式对电压进行分类评价,当分类预测值与真值相同时确定为正确的分类。

可选地,所述检测模块包括:收集单元,用于对用电信息采集系统中的表号、日期、日整点电压,以及表计中的pt变比进行收集;分类单元,用于将收集后的各表的日期、日整点电压、pt变比输入所述模型,并输出各计量点的电压分类结果;判断单元,根据输出的分类结果判断计量点的电压是否存在异常。

可选地,所述检测模块还包括:统计单元,用于统计所述日整点电压的中位值作为所述日整点电压值。

根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

在本发明上述实施例中,通过引入机器学习模式对计量点的电压进行分类,避免了原有的人工分析或是单纯的阈值判断所带来的效率低和准确度差的问题,从而提高了现场异常处理的及时性和准确性。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本发明实施例的计量点电压异常检测方法流程图;

图2是根据本发明实施例的电压分类决策树示意图;

图3是根据本发明实施例的异常计量点的电压曲线示意图;

图4是根据本发明实施例的异常计量点的电流曲线示意图;

图5是根据本发明实施例的计量点电压异常检测系统的结构示意图;

图6是根据本发明可选实施例的计量点电压异常检测系统结构示意图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

机器学习是伴随概率论、统计学、凸优化、分布式计算、海量数据存储等理论和技术发展起来的一门交叉学科,通过机器学习,我们可以洞见数据背后的本质(insight),可以使数据变得更加有意义。机器学习目前在产品推荐、人脸识别、信息过滤以及疾病诊断等领域得到了广泛的应用,它本身也是一个应用驱动的学科,主要是解决分类和预测问题,而异常电压诊断本质上是一个电压分类问题。因此,为了解决现有技术中人工判断计量装置电压异常所导致的效率低,准确度差的问题,在本发明中,通过引入机器学习模式对计量点的电压进行分类,以解决原有的人工分析方式所带来的效率低和准确度差的问题。

机器学习算法从学习方式上分为有监督式学习和无监督式学习。有监督式学习主要是指通过一个给定结果的训练集(学习集)数据来建立模型,再通过建立的模型进行新数据的分类和预测;无监督式学习又称归纳性学习(clustering)利用k方式(kmeans),建立中心(centriole),通过循环和递减运算(iteration&descent)来减小误差,达到分类的目的。监督式学习的主要算法有贝叶斯学习、决策树、支持向量机(svm)、人工神经网络(anns)。本文主要应用的是决策树(decisionstree)分类算法。

决策树算法是常用的监督式机器学习算法,从直观上讲就是一种类似流程图的树状决策机制,包含决策节点(decisionblocks)和终端节点(terminatingblocks)。其中,每个决策结点表示在一个属性上的分类,而每个终端结点表示最终分类结果,对应一个具体分类标号,经过实际工程验证,决策树具有较好分类效果。迭代二分器(iterativedichotomister,id3)是决策树的原型算法,在此基础上衍生出c4.5、c5.0、cart算法,而且决策树作为基分类器,进一步形成随机森林(randomforest)算法。

决策树以信息熵(entropy)理论作为基础,使用信息增益(informationgain)来确定使用哪个变量作为各结点的判定变量。信息熵来源于香农(claudeshannon)的消息论方面的理论内容,是一种信息量的评价指标。信息熵理论的基础是期望信息,期望信息是评价某个群体中出现某种信号的不确定性的定量指标。

决策树是依据学习集信息建立,设d代表标记分组结果的学习集,假定该学习集具有m个分类,定义为ci(i=1,…,m)。定义期望信息为:

l(xi)=-log2p(x)

(1)其中p(xi)为xi在本群体内出现的概率,可以看出概率越大对应信息越确定,期望信息越小;概率越小对应信息越不确定,期望信息越大。

定义信息熵,为各期望信息的加权和,公式为:

(2)以按属性a划分d为例,在学习集中,a属性具有a1,a2,…,av个不同值,假设a是离散变量(因子变量),则这些值对应于a上的多个输出,也就是用属性a将d划分为|d1,d2,…,dv|个分区(子集),这些分区也就是由结点n生成的分枝。

(3)infoa(d)表示按a划分对d的分类之后的期望信息,其中项|dj|/|d|代表第j个子集的加权比例,该数值用以计算信息增益。

信息增益是用来表示划分前的期望信息与划分后的期望信息之间的差,即:

gain(a)=info(d)-infoa(d)

(4)换言之,gain(a)可以表征通过a划分,确定了多少信息,该节点的最优分枝点就取在使信息增益最大的属性。

id3算法可以有效解决按照什么次序来选择属性(变量)的问题,但是id3解决的是离散数据类型(因子类型)变量的分类问题,不能解决连续数类型(数值型)变量的分类问题,同时该算法倾向于采用具有大量值的属性,也就是明显倾向于选自因子类型比较多的变量,比如说在训练集(学习集)中有性别和年龄两种因子型变量,性别变量有两种因子,年龄变量有五种因子,id3算法会明显倾向于选择年龄作为分类变量。在id3算法的基础上衍生了c4.5算法,该算法对信息增益计算结果进行调整。定义分类信息值(splitinformation):

(5)该数值代表由训练集d划分为对应于变量a的v个子集后产生的信息。如果变量a中的因子类型较多,则该值较大。之后利用该值抑制因子数量对信息增益率的影响,定义信息增益率为:

(6)c4.5是目前的主要决策树算法,是一种主流的分类器,同时决策树算法还有cart,c5.0等,虽然具体算法不同,但是核心思想基本相同。决策树算法可以实现有效分类,同时也存在一定缺点,最主要缺点是容易产生过拟合。

在本实施例中提供了一种基于机器学习的计量点电压异常检测方法,图1是根据本发明实施例所提供的方法的流程图,如图1所示,该流程包括如下步骤:

步骤s102,基于决策树算法构建用于电压分类的机器学习模型;

步骤s104,对模型的性能进行评估以度量所述模型是否达到预期的分类要求;

步骤s106,在所述模型达到预期的分类要求的情况下,基于所述模型对计量点的电压异常进行检测。

在本实施例的步骤s102中,可包括步骤:将电压互感器pt变比、电压值和电压分类进行组合构建决策树训练集;将所述决策树训练集引入决策树算法生成决策树。

在本实施例的步骤s104中,可包括步骤:采用混淆矩阵的方式对电压进行分类评价,当分类预测值与真值相同时确定为正确的分类。

在本实施例的步骤s106中,可包括步骤:对用电信息采集系统中的表号、日期、日整点电压,以及表计中的pt变比进行收集;将收集后的各表的日期、日整点电压、pt变比输入所述模型,并输出各计量点的电压分类结果;根据输出的分类结果判断计量点的电压是否存在异常。

在本实施例的步骤s106中,可将统计的所述日整点电压的中位值作为所述日整点电压值。

为了便于对本发明所提供的技术方案的理解,下面将结合具体应用场景的实施例进行详细描述。

由于电压等级、变压器容量、现场安装方式等因素,计量点种类较多,按照接线方式分为三相三线、三相四线和单相接线三种。本实施例主要以监测三相计量点为例进行说明。三相四线计量点分为高压计量点和低压计量点两类,其中低压计量点又分为直接接入和经互感器接入两种方式;三相四线直接接入主要应用在50kw以下的三相公变低压用户,三相四线经互感器接入主要应用在315kva及以下容量的10kv专用变压器用户,这两种方式电能表接入电压均为3×220v;三相三线计量点只应用于315kva以上10kv计量点。

由于不同电压等级的三相计量点正常电压和异常电压范围相互重合,如果不加区分,只是简单地判断电压,是不可能判断准确的,会产生相当程度的误判,需要引入计量点基本信息。计量点基本信息在sg186系统中有很多字段进行记录,例如接线方式、表计规格、运行容量、电压等级等。但是考虑到信息质量,在本实施例中,采用pt变比进行判断,主要是pt变比规格较少,低压计量点为1,10kv计量点为100,110kv计量点为1100,pt变比能够明确表征计量点电压等级,同时该字段参与电量电费计算,数据质量较高。

在本实施例提供了一种基于机器学习的计量点电压异常检测方法,在本实施例中,通过r语言进行模型的构建,r语言是一种开源的统计分析语言,目前应用较为广泛。

本实施例的主要实现步骤包括模型构建和模型计算。

模型构建主要为:一是构建训练集,将pt变比、电压值和电压分类进行组合,构建决策树训练集;二是建立决策树,将训练集引入c4.5算法,进行决策树生成,检查决策树合理性;三是对生成的决策树进行检查,是否存在分类错误的现象。

模型计算主要为,一是准备基础数据,对用电信息采集系统的表号、日期、当日整点电压进行整理,对sg186中表计的pt变比进行整理,将两部分数据整合;二是日整点电压整理,考虑到每日整点数据为时间序列数据,而决策树主要判断截面数据,需要将每日整点数据进行统计,文本采用的是日整点电压中位值;三是数据判断,将整理后的各表日电压中位值及表号、pt变比引入模型判断,输出判断结果。

为了便于说明,实施例的训练集主要覆盖10kv三相计量点和低压三相计量点。构建的电压异常判断决策树如图2所示,电压状态一共分为四类,其中n代表电压正常,l代表电压低,h代表电压高,e代表数值错误。共计5层7个判断节点。

在模型建立之后,需要进行模型性能的评估,度量该模型是否达到了预期的分类效果。在本实施例中采用混淆矩阵的方式进行评价。混淆矩阵是一张二维表,它按照预测值是否匹配数据的真实值来进行模型性能评估。

表1

表1为模型性能评价混淆矩阵表,如表1所示,在本实施例中,对电压建立的是一个四值分类模型,所以是一个4×4的混淆矩阵,其中纵向为实际值,横向为分类预测值。当预测值与真值相同时,就是一个正确的分类,正确分类位于混淆矩阵的对角线上。

通过上述表1可以看出,训练集共计1324条数据,该模型的分类准确率为100%。在一般的分类模型中,达到100%分类成功率实际上是一种过拟合现象,这也是决策树算法的一种特点。决策树算法是以信息熵理论为基础,本质上是一种“贪婪算法”,容易对训练集数据敏感,造成模型泛化性不好,但是具体在本实施例中,由于电压判断规则较为复杂,这种过拟合反而更加利于不同计量点的电压精准分类,同时决策树对于训练集的敏感性更加有利于动态调整电压判断规则。

基于本实施例的模型对某地区的专变计量点电压进行判断,数据集共包含33975条观测,涉及1267只电能表近1个月的电压情况,共筛查出电压异常计量点6个,安排现场检查,发现其中6个用户存在问题。图3为筛选出的异常计量点的电压曲线示意图,图4为筛选出的异常计量点的电流曲线示意图。通过检查发现该用户存在计量用电压互感器a相一次侧熔断器熔断现象。

在本实施例中,可以实现三相计量点异常电压判断算法的自我学习和自动构建,避免了原有的人工分析或是单纯的阈值判断在质量和效率方面存在的缺陷,实现了计量点电压的准确、动态分析,提高了现场异常处理的工作及时性和准确性。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

在本实施例中还提供了一种基于机器学习的计量点电压异常检测系统,该系统用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”或“单元”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

图5是根据本发明实施例的基于机器学习的计量点电压异常检测系统的结构框图,如图5所示,该系统包括构建模块10、评估模块20和检测模块30。

构建模块10,用于基于决策树算法构建用于电压分类的机器学习模型;

评估模块20,用于对模型的性能进行评估以度量所述模型是否达到预期的分类要求;

检测模块30,在所述模型达到预期的分类要求的情况下,基于所述模型对计量点的电压异常进行检测。

图6是根据本发明实施例的基于机器学习的计量点电压异常检测系统的结构框图,如图6所示,该系统除包括图5所示的所有模块外,构建模块10包括:构建单元101,将电压互感器pt变比、电压值和电压分类进行组合构建决策树训练集;生成单元102,用于将所述决策树训练集引入决策树算法生成决策树。

在实施例中,评估模块20还包括:评价单元201,用于采用混淆矩阵的方式对电压进行分类评价,当分类预测值与真值相同时确定为正确的分类。

在本实施例中,检测模块30还包括:收集单元301,用于对用电信息采集系统中的表号、日期、日整点电压,以及表计中的pt变比进行收集;分类单元302,用于将收集后的各表的日期、日整点电压、pt变比输入所述模型,并输出各计量点的电压分类结果;判断单元,根据输出的分类结果判断计量点的电压是否存在异常;统计单元303,用于统计所述日整点电压的中位值作为所述日整点电压值。

需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。

本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

s1,基于决策树算法构建用于电压分类的机器学习模型;

s2,对模型的性能进行评估以度量所述模型是否达到预期的分类要求;

s3,在所述模型达到预期的分类要求的情况下,基于所述模型对计量点的电压异常进行检测。

可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(read-onlymemory,简称为rom)、随机存取存储器(randomaccessmemory,简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。

可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:

s1,基于决策树算法构建用于电压分类的机器学习模型;

s2,对模型的性能进行评估以度量所述模型是否达到预期的分类要求;

s3,在所述模型达到预期的分类要求的情况下,基于所述模型对计量点的电压异常进行检测。

可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。

显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1