本发明涉及配电网数据分析技术领域,尤其涉及一种配变电量表码数据采集自动分析方法和系统。
背景技术:
配变(配电变压器)的运行情况反映着配电网的运行情况和用户的用电情况,因此,对配变电量进行数据采集是一项非常重要的工作。现有的采集配变电量表码方式是通过远程对配变电量进行数据采集,通过计量业务系统对海量配变电量进行存储,但是往往配变数据的采集会存在数据采集失败的问题。针对配变电量表码采集失败的情况,在溯源时,需要人工进行逐步排查,由于配网中的配变数量巨大、地理分布广、布局分散性强,人工分析配网配变电量表码采集失败原因,难度大,难以保证准确性,且时效性差。因此,有必要对配网配变表码采集失败原因进行智能化分析,以解决人工分析配网配变电量表码采集失败原因难度大,难以保证准确性,且时效性差的问题。
技术实现要素:
本发明提供了一种配变电量表码数据采集自动分析方法和系统,用于解决人工分析配网配变电量表码采集失败原因,难度大,难以保证准确性,且时效性差的技术问题。
有鉴于此,本发明提供了一种配变电量表码数据采集自动分析方法,包括以下步骤:
获取电网生产台账系统的电网生产台账数据、电网计量自动化系统的回流数据和电网营销系统的营销数据,营销数据包括“变电站-线路-变压器-用户数据”关联数据;
分别对电网生产台账数据、回流数据和营销数据进行数据清洗过滤,包括:剔除无效数据、按第一预置关键字段对数据进行关联和分类存储;
按第二预置关键字段对电网生产台账数据、回流数据和营销数据进行数据关联匹配,将数据关联匹配后的数据按照“计量采集失败”、“计量采集成功”、“配变停运”、“配变退出”和“配变运行”进行分类;
对“计量采集失败”类别的数据按照预置规则进行配变电量码表采集失败原因智能分析,预置规则包括:
判断配网中的配变类型,配变类型包括:单计量点单台配变、单计量点多台配变、多计量点单台配变、多计量点多台配变;
若配变为单计量点单台配变,则判断配变的配变状态是否为“退出”或“退运”,如是,则计量表码标记为“配变关停”;
若配变为单计量点多台配变,则判断是否所有配变的配变状态均为“退出”或“退运”,若是,则计量表码标记为“配变关停”;
若配变为多计量点单台配变,则判断配变的配变状态是否为“退出”或“退运”,若是,则所有计量表码标记为“配变关停”;
若配变为多计量点多台配变,则判断是否所有配变的配变状态均为“退出”或“退运”,若是,则所有计量表码标记为“配变关停”;
对于关联匹配结果为“计量采集成功”的数据按照预置清单模式输出在“计量采集成功清单”中,对于关联匹配结果为“计量采集失败”的数据,判断计量采集失败的原因是否为“配变关停”,若是,则将对应关联匹配的配变数据按照预置清单模式输出在“计量采集失败清单”中,若否,则输出“配变表码采集过程出错”。
可选地,获取电网生产台账系统的电网生产台账数据、电网计量自动化系统的回流数据和电网营销系统的营销数据,包括:
实时获取电网生产台账系统的电网生产台账数据;
每隔24小时获取一次电网计量自动化系统的回流数据;
每隔12小时获取一次电网营销系统的营销数据。
可选地,分别对电网生产台账数据、回流数据和营销数据进行数据清洗过滤,包括:
对电网生产台账数据进行数据清洗过滤,清洗过滤逻辑包括:剔除配变id与配变名称为“空”的数据,以配变id与配变名称为关键字段,关联从属区局、供电所、配变类型、从属变电站、配网线路、配变状态、配变生产投运年限和配变型号,以配变状态为关键字段,对配变状态为“运行”、“退运”以及“退出”进行分类存储;
对回流数据进行数据清洗过滤,清洗过滤逻辑包括:剔除配变计量表码与配变名称为“空”的数据,剔除配变表码超过2年以来采集失败的数据,以“24小时96个点”等间隔进行数据过滤,剔除非00分、15分、30分和45分的数据点,以配变名称与配变计量表码为关键字段,关联从属区局、供电所、变电站、配网线路和表码数据;
对营销数据进行数据清洗过滤,清洗过滤逻辑包括:剔除配变名称、配变id和配变客户数为“空”的数据,以配变id与配变名称为关键字段,关联从属区局、供电所、变电站、配网线路和配变的用户数。
可选地,按第二预置关键字段对电网生产台账数据、回流数据和营销数据进行数据关联匹配,包括:
以配变id为关键字段,关联数据清洗过滤后得到的营销数据与电网生产台账数据,形成新的数据库,其中,关联的数据包括配变id、配变名称、从属区局、供电所、变电站、配网线路、配变所带用户数和配变状态;
将新的数据库与数据清洗过滤后的回流数据进行关联,其中,以配变名称为关键字段进行数据关联,并匹配从属区局和供电所,将匹配成功的数据以配变名称为关键字段匹配配变id和配变计量表码,关联配变id、配变名称、计量表码数据、配变所带用户数、从属区局、供电所、变电站和配变状态。
本发明第二方面提供了一种配变电量表码数据采集自动分析系统,包括:
数据获取模块,用于获取电网生产台账系统的电网生产台账数据、电网计量自动化系统的回流数据和电网营销系统的营销数据,营销数据包括“变电站-线路-变压器-用户数据”关联数据;
数据清洗过滤模块,用于分别对电网生产台账数据、回流数据和营销数据进行数据清洗过滤,包括:剔除无效数据、按第一预置关键字段对数据进行关联和分类存储;
数据关联模块,用于按第二预置关键字段对电网生产台账数据、回流数据和营销数据进行数据关联匹配,将数据关联匹配后的数据按照“计量采集失败”、“计量采集成功”、“配变停运”、“配变退出”和“配变运行”进行分类;
采集失败原因分析模块,用于对“计量采集失败”类别的数据按照预置规则进行配变电量码表采集失败原因智能分析,预置规则包括:
判断配网中的配变类型,配变类型包括:单计量点单台配变、单计量点多台配变、多计量点单台配变、多计量点多台配变;
若配变为单计量点单台配变,则判断配变的配变状态是否为“退出”或“退运”,如是,则计量表码标记为“配变关停”;
若配变为单计量点多台配变,则判断是否所有配变的配变状态均为“退出”或“退运”,若是,则计量表码标记为“配变关停”;
若配变为多计量点单台配变,则判断配变的配变状态是否为“退出”或“退运”,若是,则所有计量表码标记为“配变关停”;
若配变为多计量点多台配变,则判断是否所有配变的配变状态均为“退出”或“退运”,若是,则所有计量表码标记为“配变关停”;
输出模块,用于对于关联匹配结果为“计量采集成功”的数据按照预置清单模式输出在“计量采集成功清单”中,对于关联匹配结果为“计量采集失败”的数据,判断计量采集失败的原因是否为“配变关停”,若是,则将对应关联匹配的配变数据按照预置清单模式输出在“计量采集失败清单”中,若否,则输出“配变表码采集过程出错”。
可选地,获取电网生产台账系统的电网生产台账数据、电网计量自动化系统的回流数据和电网营销系统的营销数据,包括:
实时获取电网生产台账系统的电网生产台账数据;
每隔24小时获取一次电网计量自动化系统的回流数据;
每隔12小时获取一次电网营销系统的营销数据。
可选地,分别对电网生产台账数据、回流数据和营销数据进行数据清洗过滤,包括:
对电网生产台账数据进行数据清洗过滤,清洗过滤逻辑包括:剔除配变id与配变名称为“空”的数据,以配变id与配变名称为关键字段,关联从属区局、供电所、配变类型、从属变电站、配网线路、配变状态、配变生产投运年限和配变型号,以配变状态为关键字段,对配变状态为“运行”、“退运”以及“退出”进行分类存储;
对回流数据进行数据清洗过滤,清洗过滤逻辑包括:剔除配变计量表码与配变名称为“空”的数据,剔除配变表码超过2年以来采集失败的数据,以“24小时96个点”等间隔进行数据过滤,剔除非00分、15分、30分和45分的数据点,以配变名称与配变计量表码为关键字段,关联从属区局、供电所、变电站、配网线路和表码数据;
对营销数据进行数据清洗过滤,清洗过滤逻辑包括:剔除配变名称、配变id和配变客户数为“空”的数据,以配变id与配变名称为关键字段,关联从属区局、供电所、变电站、配网线路和配变的用户数。
可选地,按第二预置关键字段对电网生产台账数据、回流数据和营销数据进行数据关联匹配,包括:
以配变id为关键字段,关联数据清洗过滤后得到的营销数据与电网生产台账数据,形成新的数据库,其中,关联的数据包括配变id、配变名称、从属区局、供电所、变电站、配网线路、配变所带用户数和配变状态;
将新的数据库与数据清洗过滤后的回流数据进行关联,其中,以配变名称为关键字段进行数据关联,并匹配从属区局和供电所,将匹配成功的数据以配变名称为关键字段匹配配变id和配变计量表码,关联配变id、配变名称、计量表码数据、配变所带用户数、从属区局、供电所、变电站和配变状态。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明提供了一种配变电量表码数据采集自动分析方法,接口电网生产台账系统、电网计量自动化系统和电网营销系统,自动获取电网生产台账系统的电网生产台账数据、电网计量自动化系统的回流数据和电网营销系统的营销数据,对电网生产台账数据、回流数据和营销数据进行数据清洗过滤,然后对清洗过滤后的数据进行关联匹配分类处理,针对“计量采集失败”类别的数据智能进行原因分析,并输出分析结果,一方面避免了人工分析存在的问题,另一方面也智能化地将计量采集失败的原因区分为配变关停还是表码采集过程存在问题,解决了人工分析配网配变电量表码采集失败原因难度大,难以保证准确性,且时效性差的技术问题。
附图说明
为了更清楚的说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例中提供的一种配变电量表码数据采集自动分析方法的流程示意图;
图2为本发明实施例中提供的一种配变电量表码数据采集自动分析方法的原理框图;
图3为本发明实施例中提供的一种配变电量表码数据采集自动分析系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于理解,请参阅图1,本发明提供了一种配变电量表码数据采集自动分析方法的实施例,包括:
步骤101、获取电网生产台账系统的电网生产台账数据、电网计量自动化系统的回流数据和电网营销系统的营销数据,营销数据包括“变电站-线路-变压器-用户数据”关联数据。
本发明中,建立与电网生产台账系统、电网计量自动化系统和电网营销系统的数据接口,自动从电网生产台账系统、电网计量自动化系统和电网营销系统获取电网生产台账系统的电网生产台账数据、电网计量自动化系统的回流数据和电网营销系统的营销数据。
在一个实施例中,电网生产台账系统的电网生产台账数据设置为实时更新,电网计量自动化系统的回流数据更新时间间隔设置为24小时,电网营销系统的营销数据包括“变电站-线路-变压器-用户数据”关联数据,数据更新时间间隔为12小时。
步骤102、分别对电网生产台账数据、回流数据和营销数据进行数据清洗过滤,包括:剔除无效数据、按第一预置关键字段对数据进行关联和分类存储。
由于直接获取的数据存在很多噪声,且缺乏关联性,因此,需要进行清洗过滤,剔除掉无效数据,并按照关键字段进行数据关联,最后将关联的数据按照预置类别进行分类存储。具体的,数据清洗过滤按照以下逻辑执行:
对于电网生产台账数据的数据清洗过滤逻辑,包括:
剔除配变id与配变名称为“空”的数据;
以配变id与配变名称为关键字段,关联从属区局、供电所、配变类型(“专变”或“公变”)、从属变电站、配网线路、配变状态(“运行”、“退出”、“退运”等)、配变生产投运年限和配变型号等;
以配变状态为关键字段,对配变状态为“运行”、“退运”以及“退出”进行分类存储;
对于回流数据的数据清洗过滤,清洗过滤逻辑包括:
剔除配变计量表码与配变名称为“空”的数据;
剔除配变表码超过2年以来采集失败的数据;
以“24小时96个点”,即15分钟为1个点,1小时共4个点,24小时共96个点,等间隔进行数据过滤,剔除非00分、15分、30分和45分的数据点,进行数据简化;
以配变名称与配变计量表码为关键字段,关联从属区局、供电所、变电站、配网线路和表码数据;
对于营销数据的数据清洗过滤,清洗过滤逻辑包括:
剔除配变名称、配变id和配变客户数为“空”的数据;
以配变id与配变名称为关键字段,关联从属区局、供电所、变电站、配网线路和配变的用户数。
步骤103、按第二预置关键字段对电网生产台账数据、回流数据和营销数据进行数据关联匹配,将数据关联匹配后的数据按照“计量采集失败”、“计量采集成功”、“配变停运”、“配变退出”和“配变运行”进行分类。
在步骤102之后,进行多系统数据的关联匹配:按照预置关键字段对电网生产台账数据、回流数据和营销数据进行数据关联匹配,例如,以配变id为关键字段,关联数据清洗过滤后得到的营销数据与电网生产台账数据,形成新的数据库,关联相关数据为:配变id配变名称、从属区局、供电所、变电站、配网线路、配变所带用户数和配变状态,然后将新的数据库与清洗过滤后的回流数据进行关联,以配变名称为关键字段进行数据关联,并匹配配变从属区局和供电所,若匹配成功,则以配变名称为关键字段,将配变id、配变计量表码匹配,呈现的数据为配变id、配变名称、计量表码数据、配变所带用户数、从属区局、供电所、变电站和配变状态等。最后将数据关联匹配后的数据按照“计量采集失败”、“计量采集成功”、“配变停运”、“配变退出”和“配变运行”进行分类。其中,配变计量表码数据为“空”的视为“计量采集失败”。
步骤104、对“计量采集失败”类别的数据按照预置规则进行配变电量码表采集失败原因智能分析。
针对于“计量采集失败”的数据,进行配变电量码表采集失败原因分析,其中,配变电量码表采集失败原因分析规则为:
如图2所示,判断配网中的配变类型,配变类型包括:单计量点单台配变、单计量点多台配变、多计量点单台配变、多计量点多台配变;
若配变为单计量点单台配变,则判断配变的配变状态是否为“退出”或“退运”,如是,则计量表码标记为“配变关停”;
若配变为单计量点多台配变,则判断是否所有配变的配变状态均为“退出”或“退运”,若是,则计量表码标记为“配变关停”;
若配变为多计量点单台配变,则判断配变的配变状态是否为“退出”或“退运”,若是,则所有计量表码标记为“配变关停”;
若配变为多计量点多台配变,则判断是否所有配变的配变状态均为“退出”或“退运”,若是,则所有计量表码标记为“配变关停”;
步骤105、对于关联匹配结果为“计量采集成功”的数据按照预置清单模式输出在“计量采集成功清单”中,对于关联匹配结果为“计量采集失败”的数据,判断计量采集失败的原因是否为“配变关停”,若是,则将对应关联匹配的配变数据按照预置清单模式输出在“计量采集失败清单”中,若否,则输出“配变表码采集过程出错”。
对于关联匹配结果为“计量采集成功”的数据按照预置清单模式输出在“计量采集成功清单”中,输出结果可以以市局、区局以及供电所的维度分别进行呈现;对于关联匹配结果为“计量采集失败”的数据,判断计量采集失败的原因是否为“配变关停”,若是,则将对应关联匹配的配变数据按照预置清单模式输出在“计量采集失败清单”中,输出结果同样可以以市局、区局以及供电所的维度分别进行呈现,若否,则说明计量采集失败是由于采集过程出错的原因导致的,输出“配变表码采集过程出错”。
本发明实施例提供的一种配变电量表码数据采集自动分析方法,接口电网生产台账系统、电网计量自动化系统和电网营销系统,自动获取电网生产台账系统的电网生产台账数据、电网计量自动化系统的回流数据和电网营销系统的营销数据,对电网生产台账数据、回流数据和营销数据进行数据清洗过滤,然后对清洗过滤后的数据进行关联匹配分类处理,针对“计量采集失败”类别的数据智能进行原因分析,并输出分析结果,一方面避免了人工分析存在的问题,另一方面也智能化地将计量采集失败的原因区分为配变关停还是表码采集过程存在问题,解决了人工分析配网配变电量表码采集失败原因难度大,难以保证准确性,且时效性差的技术问题。
为了便于理解,请参阅图3,本发明中提供了一种配变电量表码数据采集自动分析系统,包括:
数据获取模块,用于获取电网生产台账系统的电网生产台账数据、电网计量自动化系统的回流数据和电网营销系统的营销数据,营销数据包括“变电站-线路-变压器-用户数据”关联数据;
数据清洗过滤模块,用于分别对电网生产台账数据、回流数据和营销数据进行数据清洗过滤,包括:剔除无效数据、按第一预置关键字段对数据进行关联和分类存储;
数据关联模块,用于按第二预置关键字段对电网生产台账数据、回流数据和营销数据进行数据关联匹配,将数据关联匹配后的数据按照“计量采集失败”、“计量采集成功”、“配变停运”、“配变退出”和“配变运行”进行分类;
采集失败原因分析模块,用于对“计量采集失败”类别的数据按照预置规则进行配变电量码表采集失败原因智能分析,预置规则包括:
判断配网中的配变类型,配变类型包括:单计量点单台配变、单计量点多台配变、多计量点单台配变、多计量点多台配变;
若配变为单计量点单台配变,则判断配变的配变状态是否为“退出”或“退运”,如是,则计量表码标记为“配变关停”;
若配变为单计量点多台配变,则判断是否所有配变的配变状态均为“退出”或“退运”,若是,则计量表码标记为“配变关停”;
若配变为多计量点单台配变,则判断配变的配变状态是否为“退出”或“退运”,若是,则所有计量表码标记为“配变关停”;
若配变为多计量点多台配变,则判断是否所有配变的配变状态均为“退出”或“退运”,若是,则所有计量表码标记为“配变关停”;
输出模块,用于对于关联匹配结果为“计量采集成功”的数据按照预置清单模式输出在“计量采集成功清单”中,对于关联匹配结果为“计量采集失败”的数据,判断计量采集失败的原因是否为“配变关停”,若是,则将对应关联匹配的配变数据按照预置清单模式输出在“计量采集失败清单”中,若否,则输出“配变表码采集过程出错”。
本发明中,建立与电网生产台账系统、电网计量自动化系统和电网营销系统的数据接口,自动从电网生产台账系统、电网计量自动化系统和电网营销系统获取电网生产台账系统的电网生产台账数据、电网计量自动化系统的回流数据和电网营销系统的营销数据。
在一个实施例中,电网生产台账系统的电网生产台账数据设置为实时更新,电网计量自动化系统的回流数据更新时间间隔设置为24小时,电网营销系统的营销数据包括“变电站-线路-变压器-用户数据”关联数据,数据更新时间间隔为12小时。
由于直接获取的数据存在很多噪声,且缺乏关联性,因此,需要进行清洗过滤,剔除掉无效数据,并按照关键字段进行数据关联,最后将关联的数据按照预置类别进行分类存储。具体的,数据清洗过滤按照以下逻辑执行:
对于电网生产台账数据的数据清洗过滤逻辑,包括:
剔除配变id与配变名称为“空”的数据;
以配变id与配变名称为关键字段,关联从属区局、供电所、配变类型(“专变”或“公变”)、从属变电站、配网线路、配变状态(“运行”、“退出”、“退运”等)、配变生产投运年限和配变型号等;
以配变状态为关键字段,对配变状态为“运行”、“退运”以及“退出”进行分类存储;
对于回流数据的数据清洗过滤,清洗过滤逻辑包括:
剔除配变计量表码与配变名称为“空”的数据;
剔除配变表码超过2年以来采集失败的数据;
以“24小时96个点”,即15分钟为1个点,1小时共4个点,24小时共96个点,等间隔进行数据过滤,剔除非00分、15分、30分和45分的数据点,进行数据简化;
以配变名称与配变计量表码为关键字段,关联从属区局、供电所、变电站、配网线路和表码数据;
对于营销数据的数据清洗过滤,清洗过滤逻辑包括:
剔除配变名称、配变id和配变客户数为“空”的数据;
以配变id与配变名称为关键字段,关联从属区局、供电所、变电站、配网线路和配变的用户数。
在数据清洗过滤后,进行多系统数据的关联匹配:按照预置关键字段对电网生产台账数据、回流数据和营销数据进行数据关联匹配,例如,以配变id为关键字段,关联数据清洗过滤后得到的营销数据与电网生产台账数据,形成新的数据库,关联相关数据为:配变id配变名称、从属区局、供电所、变电站、配网线路、配变所带用户数和配变状态,然后将新的数据库与清洗过滤后的回流数据进行关联,以配变名称为关键字段进行数据关联,并匹配配变从属区局和供电所,若匹配成功,则以配变名称为关键字段,将配变id、配变计量表码匹配,呈现的数据为配变id、配变名称、计量表码数据、配变所带用户数、从属区局、供电所、变电站和配变状态等。最后将数据关联匹配后的数据按照“计量采集失败”、“计量采集成功”、“配变停运”、“配变退出”和“配变运行”进行分类。其中,配变计量表码数据为“空”的视为“计量采集失败”。
针对于“计量采集失败”的数据,进行配变电量码表采集失败原因分析,其中,配变电量码表采集失败原因分析规则为:
如图2所示,判断配网中的配变类型,配变类型包括:单计量点单台配变、单计量点多台配变、多计量点单台配变、多计量点多台配变;
若配变为单计量点单台配变,则判断配变的配变状态是否为“退出”或“退运”,如是,则计量表码标记为“配变关停”;
若配变为单计量点多台配变,则判断是否所有配变的配变状态均为“退出”或“退运”,若是,则计量表码标记为“配变关停”;
若配变为多计量点单台配变,则判断配变的配变状态是否为“退出”或“退运”,若是,则所有计量表码标记为“配变关停”;
若配变为多计量点多台配变,则判断是否所有配变的配变状态均为“退出”或“退运”,若是,则所有计量表码标记为“配变关停”;
对于关联匹配结果为“计量采集成功”的数据按照预置清单模式输出在“计量采集成功清单”中,输出结果可以以市局、区局以及供电所的维度分别进行呈现;对于关联匹配结果为“计量采集失败”的数据,判断计量采集失败的原因是否为“配变关停”,若是,则将对应关联匹配的配变数据按照预置清单模式输出在“计量采集失败清单”中,输出结果同样可以以市局、区局以及供电所的维度分别进行呈现,若否,则说明计量采集失败是由于采集过程出错的原因导致的,输出“配变表码采集过程出错”。
本发明实施例提供的一种配变电量表码数据采集自动分析系统,接口电网生产台账系统、电网计量自动化系统和电网营销系统,自动获取电网生产台账系统的电网生产台账数据、电网计量自动化系统的回流数据和电网营销系统的营销数据,对电网生产台账数据、回流数据和营销数据进行数据清洗过滤,然后对清洗过滤后的数据进行关联匹配分类处理,针对“计量采集失败”类别的数据智能进行原因分析,并输出分析结果,一方面避免了人工分析存在的问题,另一方面也智能化地将计量采集失败的原因区分为配变关停还是表码采集过程存在问题,解决了人工分析配网配变电量表码采集失败原因难度大,难以保证准确性,且时效性差的技术问题。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。