本发明涉及数据处理技术领域,尤其涉及一种违约用电识别方法及装置。
背景技术:
临时用电是供电企业可以向客户提供的一种供电方式。它是指基建工地、农田基本建设、农村养殖业和非正常年景的新增抗旱、排涝用电及其他需要在电力部门立户表计之外的用电。临时用电具有集中性、分散性、隐蔽性、季节性、不安全因素多等特点。临时用电需要用电单位或个人向供电所提交申请手续,双方签订供用电协议并装设计量表计后方可用电。使用临时电源的客户不得向外转供电,也不得向其他用户转让。
由于在临时用电期间不会收取功率因数考核等费用,当施工临时用电结束后,部分用电单位可能由于手续繁琐或者不愿意投入资金进行“临时用电转正式用电”配套设施管线的建设等原因,没有及时终止临时用电。这些临电用户用电水平下降较大或从事其他用电行为,比如转供电,极易造成电压不稳和用电不正常。申请的临时用电到期后,不按时取消,属于违约用电,这种行为不仅损害了自身利益,而且侵犯了供电企业的利益。
传统的临时建筑违约用电识别多依赖于人工排查,存在人力资源耗费大、工作效率不高且覆盖率不足等问题。
技术实现要素:
有鉴于此,本发明提供了一种违约用电识别方法及装置,用以解决传统的临时建筑违约用电识别多依赖于人工排查,存在人力资源耗费大、工作效率不高且覆盖率不足等问题。具体方案如下:
一种违约用电识别方法,包括:
获取临时用电数据,其中,所述临时用电数据至少包括一个用电方及其在预设时长的用电量数据,所述预设时长由多个预设时段组成,每一个预设时段对应一个用电量数据;
基于极值检测法在所述临时用电数据中筛选出存在违约用电的第一嫌疑清单;
基于假设排查法在其余临时用电数据中筛选出存在违约用电第二嫌疑清单,其中,所述其余临时用电数据为所述零时用电数据中除去所述第一嫌疑清单中以外的临时用电数据;
对所述第一嫌疑清单和所述第二嫌疑清单取并集,得到目标嫌疑清单。
上述的方法,可选的,基于极值检测法在所述临时用电数据中筛选出存在违约用电的第一嫌疑清单,包括:
获取每一个用电方在所述预设时长内每个预设时段的用电量数据;
判断所述用电量数据是否存在全为0或者低于第一预设用电量阈值的情况;
若是,将与所述用电量数据对应的用电方添加到所述第一嫌疑清单。
上述的方法,可选的,基于假设排查法在其余临时用电数据中筛选出存在违约用电的第二嫌疑清单,包括:
确定所述其余临时用电数据中的嫌疑用户集合;
判断n+1预设时段的用电量数据是否低于n预设时段用电量数据第二预设用电量阈值且n+1预设时段后的用电量数据序列的方差是否小于第一预设方差阈值,若是,将该用电方添加第三嫌疑清单,其中,n为正整数;
判断n+1预设时刻后用电量数据变化率是否大于第一预设变化率阈值,若n+n时刻满足用电量数据变化率大于所述第一预设变化率阈值且其对应的用电量序列的方差小于第二预设方差阈值,若是,将该用电方添加第四嫌疑清单,其中,n为正整数;
基于节假日对应的用电量数据对所述第三嫌疑清单和所述第四嫌疑清单进行校验,得到第二嫌疑清单。
上述的方法,可选的,确定所述其余临时用电数据中的嫌疑用户集合,包括:
针对所述其余用电数据中的每一个用电方,获取其对应的用电量数据序列,其中,所述用电量数据序列由预设时段的各个用电量数据组成;
计算所述用电数据序列的一阶导数,得到预设时段用电量数据的变化率;
将所述其余用电数据中小于第二预设变化率阈值的数据作为嫌疑用户集合。
上述的方法,可选的,还包括:
在所述临时用电数据存在缺失值的情况下,计算所述临时用电数据中用电方各个用电量数据的均值;
将所述均值添加到所述缺失中的对应位置。
一种违约用电识别装置,包括:
获取模块,用于获取临时用电数据,其中,所述临时用电数据至少包括一个用电方及其在预设时长的用电量数据,所述预设时长由多个预设时段组成,每一个预设时段对应一个用电量数据;
第一筛选模块,用于基于极值检测法在所述临时用电数据中筛选出存在违约用电的第一嫌疑清单;
第二筛选模块,用于基于假设排查法在其余临时用电数据中筛选出存在违约用电第二嫌疑清单,其中,所述其余临时用电数据为所述零时用电数据中除去所述第一嫌疑清单中以外的临时用电数据;
确定模块,用于对所述第一嫌疑清单和所述第二嫌疑清单取并集,得到目标嫌疑清单。
上述的装置,可选的,所述第一筛选模块包括:
获取单元,用于获取每一个用电方在所述预设时长内每个预设时段的用电量数据;
第一判断单元,用于判断所述用电量数据是否存在全为0或者低于第一预设用电量阈值的情况;
添加单元,用于若是,将与所述用电量数据对应的用电方添加到所述第一嫌疑清单。
上述的装置,可选的,所述第二筛选模块包括:
确定单元,用于确定所述其余临时用电数据中的嫌疑用户集合;
第二判断单元,用于判断n+1预设时段的用电量数据是否低于n预设时段用电量数据第二预设用电量阈值且n+1预设时段后的用电量数据序列的方差是否小于第一预设方差阈值,若是,将该用电方添加第三嫌疑清单,其中,n为正整数;
第三判断单元,用于判断n+1预设时刻后用电量数据变化率是否大于第一预设变化率阈值,若n+n时刻满足用电量数据变化率大于所述第一预设变化率阈值且其对应的用电量序列的方差小于第二预设方差阈值,若是,将该用电方添加第四嫌疑清单,其中,n为正整数;
校验单元,用于基于节假日对应的用电量数据对所述第三嫌疑清单和所述第四嫌疑清单进行校验,得到第二嫌疑清单。
上述的装置,可选的,所述确定单元包括:
获取子单元,用于针对所述其余用电数据中的每一个用电方,获取其对应的用电量数据序列,其中,所述用电量数据序列由预设时段的各个用电量数据组成;
计算子单元,用于计算所述用电数据序列的一阶导数,得到预设时段用电量数据的变化率;
确定子单元,用于将所述其余用电数据中小于第二预设变化率阈值的数据作为嫌疑用户集合。
上述的装置,可选的,还包括:
计算模块,用于在所述临时用电数据存在缺失值的情况下,计算所述临时用电数据中用电方各个用电量数据的均值;
添加模块,用于将所述均值添加到所述缺失中的对应位置。
与现有技术相比,本发明包括以下优点:
本发明公开了一种违约用电识别方法及装置,该方法包括:获取临时用电数据,其中,所述临时用电数据至少包括一个用电方及其在预设时长的用电量数据,所述预设时长由多个预设时段组成,每一个预设时段对应一个用电量数据;基于极值检测法在所述临时用电数据中筛选出存在违约用电的第一嫌疑清单;基于假设排查法在其余临时用电数据中筛选出存在违约用电的第二嫌疑清单,其中,所述其余临时用电数据为所述零时用电数据中除去所述第一嫌疑清单中以外的临时用电数据;对所述第一嫌疑时间和所述第二嫌疑时间取并集,得到目标嫌疑清单。上述方法中,在进行违约用电识别过程中不再需要依赖人工排查,提高了违规用电的识别效率和覆盖率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的一种未及时销户临电用电方用电趋势示意图;
图2为本申请实施例公开的一种转供电临电用电方用电趋势示意图;
图3为本申请实施例公开的一种违约用电识别方法流程图;
图4为本申请实施例公开的一种嫌疑清单生成过程示意图;
图5为本申请实施例公开的一种违约用电识别装置结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
本发明公开了一种违约用电识别方法及装置,应用于对临时用电用户是否存在违约用电的识别过程中,其中,临时用电是指供电企业可以向客户提供的一种供电方式。它是指基建工地、农田基本建设、农村养殖业和非正常年景的新增抗旱、排涝用电及其他需要在电力部门立户表计之外的用电。临时用电具有集中性、分散性、隐蔽性、季节性、不安全因素多等特点。违约用电是指危害供用电安全、扰乱正常供用电秩序的行为:1)在电价低的供电线路上,擅自接用电价高的用电设备或私自改变用电类别;2)私自超过合同复约定的容量用电;3)擅自超过计划分配的用电指标。4)擅自使用已在供电企业办理暂停手续的电力设备或启用供电企业封存的电力设备;5)私自迁移、更动和擅自操作供电企业的用电计量装置、电制力负荷管理装置、供电设施以及约定由供电企业调度的用户受电设备;6)未经供电企业同意,擅自引入(供出)电源或将备用电源和其他电源私自并网的
现有技术中,临时用电需要用电单位或个人向供电所提交申请手续,双方签订供用电协议并装设计量表计后方可用电。使用临时电源的用户不得向外转供电,也不得向其他用户转让。
建筑业及房地产业在建筑施工阶段,会申请临时用电,很多供电公司在临时用电期间不会收取功率因数考核等费用;当施工临时用电结束后,部分用电单位可能由于手续繁琐或者不愿意投入资金进行“临时用电转正式用电”配套设施管线的建设等原因,没有及时终止临时用电。这些临电用户用电水平下降较大或从事其他用电行为,比如转供电,极易造成电压不稳和用电不正常。申请的临时用电到期后,不按时取消,属于违约用电,这种行为不仅损害了自身利益,而且侵犯了供电企业的利益。
传统的临时建筑违约用电识别多依赖于人工排查,存在人力资源耗费大、工作效率不高且覆盖率不足等问题,针对上述问题,本发明提出一种临时建筑违约用电的识别方法,利用临时建筑的用电量数据进行数据分析及挖掘,有效识别违约用电行为,大大提高了排查效率。
研究发现,施工结束后,临时用电到期,需终止临时用电,但是实际中存在很多建筑临时用电违约使用的情况,从业务经验角度考虑,主要有以下两种:第一,施工结束后,未及时申请销户,这类用户通常表现为临时用电到期后(临电到期后),用电量降低幅度大,用电水平降低到较低水平且长期维持此水平,如图1所示。
第二,施工结束后,临电用户为了某些利益,从事其它用电行为,比如转供电。这类用户通常表现为临电到期后,用电量降低幅度大,用电水平下降到极低水平后,随后出现反弹并维持在相对稳定的水平,但是上升后的用电量低于施工期间的用电量,如图2所示。
基于上述的两种违约类型,本发明提供了一种违约用电识别方法,所述识别方法的执行流程如图3所示,包括步骤:
s101、获取临时用电数据,其中,所述临时用电数据至少包括一个用电方及其在预设时长的用电量数据,所述预设时长由多个预设时段组成,每一个预设时段对应一个用电量数据;
本发明实施例中,所述临时用电数据至少包括一个用电方及其在预设时长的用电量数据,所述预设时长由多个预设时段组成,每一个预设时段对应一个用电量数据,所述预设时长和所述预设时段可以基于经验或者具体情况进行设定,本发明实施例中不进行具体限定,优选的,本发明实施例中以所述预设时长为5年,所述预设时段为一个月为例进行说明,从用电信息采集系统和营销系统中提取待排查区域内的临时用电方使用5年以上的用户一定时间(可设置为12个月,根据情况可更改)的月抄表电量数据。
s102、基于极值检测法在所述临时用电数据中筛选出存在违约用电的第一嫌疑清单;
本发明实施例中,基于所述临时用电数据筛选出存在违约用电的第一嫌疑清单的过程如下:针对每一个用电方,所述用电方为临时用电客户,对于5年间的临月用电量数据,检测用户的月用电量数据是否存在全为0或者低于第一预设用电阈值的情况,其中,所述第一预设用电阈值可以基于经验或者具体情况进行限定,优选的,所述第一预设用电阈值为50。若满足,认为存在这类情况的用电方有临时用电到期且违约使用的嫌疑,列入第一嫌疑清单。其中,所述第一嫌疑清单存储有,用电方和所述用电方的临电到期月份,该方法的原理是检测时间内一直未用电,认为其临电到期后未及时销户,其中检测时间的选取可以基于经验或者具体情况进行设定,本发明实施例中,不进行具体限定。
s103、基于假设排查法在其余临时用电数据中筛选出存在违约用电第二嫌疑清单,其中,所述其余临时用电数据为所述零时用电数据中除去所述第一嫌疑清单中以外的临时用电数据;
本发明实施例中,对于给定其余临时用电数据中用电方月用电量数据序列y={y1,y2,...,yn,yn+1,...},首先计算该序列的一阶导数y′={y′2,y′n+2,...},得到月抄表电量的变化率,测试用户的月度变化率是否存在小于第二预设变化率阈值μ0,其中,所述第二预设变化率阈值可以基于经验或者具体情况进行设定,本发明实施例中不进行限定,优选的,所述变化率阈值为负值,可设为-60%,优选的,所述第二预设变化率阈值可以基于查准率和查全率的要求,进行更改,所述查准率和所述查全率的表达式如下:
即月用电量降低幅度很大,若第n月降低幅度满足,则假设其有临电到期的嫌疑,将所述其余用电数据中小于第二预设变化率阈值的数据作为嫌疑用户集合;后续针对临时建筑用电客户违约用电的两种情况进一步判断是否属实,具体判断过程如图4所示,
判断n+1月的用电量是否均低于n月用电量的第二预设用电量阈值μ1,其中,所述第二预设用电量阈值可以基于经验或者具体情况进行设定,本发明实施例中,不进行限定,优选的,所述第二预设用电阈值可设为85%,且n+1月后的月用电量序列的方差是否小于第一预设方差阈值μ2,其中,所述第一预设方差阈值可以基于经验或者具体情况进行设定,本发明实施例中不进行限定,优选的,所述第一预设方差阈值可设为0.05,若满足则说明用电量稳定,且维持在较低水平,认为此类用电方有临时用电到期且违约使用的嫌疑,列入第三嫌疑清单。该方法的原理是认为临电到期未及时申请注销的用户,月用电量降低,且会长期维持在较低水平。
判断n+1月以后的用电量序列的导数值y′1={y′n+1,y′n+2,...}是否大于某一阈值μ3(该值为正值)的情况,若第n+n月满足此情况,且确定所述其余临时用电数据中的嫌疑用户集合,假设n=2,则判断n+2月后的月用电量yn+2是否低于n月的用电量yn,且用电量序列的方差cov(yn+2,yn+3,...)是否小于第二预设方差阈值μ4,其中,所述第二预设方差阈值可以基于经验或者具体情况进行限定,优选的,所述第二预设方法阈值可设为0.05。若满足则当前用电方用电量反弹后,用电量稳定,且维持在低于临电到期前的水平,认为此用电方有临时用电到期且违约使用的嫌疑,列入第四嫌疑清单。该方法的原理是认为临电到期后进行转供电的用户,用电量出现反弹,反弹后的用电量低于正常使用时的用电量且长期维持在该水平。
对第三和第四嫌疑清单中的用户进行数据校验。考虑节假日对月用电量的影响,本发明实施例中,节假日主要考虑节假日时间较长的国庆节和春节的影响。若嫌疑用户临电到期后的节假日所在月份的月用电量低于其后月份的月用电量,即将其列入第二嫌疑清单。该校验的原理是临电到期后,未及时终止用电或者存在转供电行为的用户在节假日期间的用电量不会高于工作日的用电量,故与无节假日的月份相比,其月用电量较低。
s104、对所述第一嫌疑清单和所述第二嫌疑清单取并集,得到目标嫌疑清单。
本发明实施例中,将所述第一嫌疑清单和所述第二嫌疑其清单合并,将所述第一嫌疑清单和所述第二嫌疑清单的并集作为所述目标嫌疑清单。
本发明公开了一种违约用电识别方法,包括:获取临时用电数据,其中,所述临时用电数据至少包括一个用电方及其在预设时长的用电量数据,所述预设时长由多个预设时段组成,每一个预设时段对应一个用电量数据;基于极值检测法在所述临时用电数据中筛选出存在违约用电的第一嫌疑清单;基于假设排查法在其余临时用电数据中筛选出存在违约用电的第二嫌疑清单,其中,所述其余临时用电数据为所述零时用电数据中除去所述第一嫌疑清单中以外的临时用电数据;对所述第一嫌疑时间和所述第二嫌疑时间取并集,得到目标嫌疑清单。上述方法中,在进行违约用电识别过程中不再需要依赖人工排查,提高了违约用电的识别效率和覆盖率。
进一步的,由于存在采集错误或者漏采等原因,所述临时用电数据中出现许多与实际业务存在偏差的数据,可将这些用户数据去掉,比如抄表电量为负、抄表电量为空值的比例达到某个阈值(可根据实际情况设定阈值,可设30%)的用户标识。为了不遗漏用户,对于数据缺失不严重的用户,比如缺失率小于某个阈值(可根据实际情况设定阈值,可设20%),采用使用同一用电户已有的月用电量的均值对月用电量缺失值进行填充。
本发明从用电量变化角度出发提出了一种违约用电识别方法,直接和业务对接,解决了人工排查或者对重点用户进行长期观测存在的人力资源耗费大、人员素质依赖明显、工作效率不高、覆盖率不足等问题,而且该方法具有从数据角度进行批量分析的能力。
基于上述的一种违约用电识别方法,本发明实施例中还提供了一种违约用电识别装置,所述识别装置的结构框图如图5所示,包括:
获取模块201、第一筛选模块202、第二筛选模块203和确定模块204。
其中,
所述获取模块201,用于获取临时用电数据,其中,所述临时用电数据至少包括一个用电方及其在预设时长的用电量数据,所述预设时长由多个预设时段组成,每一个预设时段对应一个用电量数据;
所述第一筛选模块202,用于基于极值检测法在所述临时用电数据中筛选出存在违约用电的第一嫌疑清单;
所述第二筛选模块203,用于基于假设排查法在其余临时用电数据中筛选出存在违约用电第二嫌疑清单,其中,所述其余临时用电数据为所述零时用电数据中除去所述第一嫌疑清单中以外的临时用电数据;
所述确定模块204,用于对所述第一嫌疑清单和所述第二嫌疑清单取并集,得到目标嫌疑清单。
本发明公开了一种违约用电识别装置,包括:获取临时用电数据,其中,所述临时用电数据至少包括一个用电方及其在预设时长的用电量数据,所述预设时长由多个预设时段组成,每一个预设时段对应一个用电量数据;基于极值检测法在所述临时用电数据中筛选出存在违约用电的第一嫌疑清单;基于假设排查法在其余临时用电数据中筛选出存在违约用电的第二嫌疑清单,其中,所述其余临时用电数据为所述零时用电数据中除去所述第一嫌疑清单中以外的临时用电数据;对所述第一嫌疑时间和所述第二嫌疑时间取并集,得到目标嫌疑清单。上述装置中,在进行违约用电识别过程中不再需要依赖人工排查,提高了违约用电的识别效率和覆盖率。
本发明实施例中,所述第一筛选模块202包括:
获取单元205、第一判断单元206和添加单元207。
所述获取单元205,用于获取每一个用电方在所述预设时长内每个预设时段的用电量数据;
所述第一判断单元206,用于判断所述用电量数据是否存在全为0或者低于第一预设用电量阈值的情况;
所述添加单元207,用于若是,将与所述用电量数据对应的用电方添加到所述第一嫌疑清单。
本发明实施例中,所述第二筛选模块203包括:
确定单元208、第二判断单元209、第三判断单元210和检验单元211。
其中,
所述确定单元208,用于确定所述其余临时用电数据中的嫌疑用户集合;
所述第二判断单元209,用于判断n+1预设时段的用电量数据是否低于n预设时段用电量数据第二预设用电量阈值且n+1预设时段后的用电量数据序列的方差是否小于第一预设方差阈值,若是,将该用电方添加第三嫌疑清单,其中,n为正整数;
所述第三判断单元210,用于判断n+1预设时刻后用电量数据变化率是否大于第一预设变化率阈值,若n+n时刻满足用电量数据变化率大于所述第一预设变化率阈值且其对应的用电量序列的方差小于第二预设方差阈值,若是,将该用电方添加第四嫌疑清单,其中,n为正整数;
所述校验单元211,用于基于节假日对应的用电量数据对所述第三嫌疑清单和所述第四嫌疑清单进行校验,得到第二嫌疑清单。
本发明实施例中,所述确定单元208包括:
获取子单元212、计算子单元213和确定子单元214。
其中,
所述获取子单元212,用于针对所述其余用电数据中的每一个用电方,获取其对应的用电量数据序列,其中,所述用电量数据序列由预设时段的各个用电量数据组成;
所述计算子单元213,用于计算所述用电数据序列的一阶导数,得到预设时段用电量数据的变化率;
所述确定子单元214,用于将所述其余用电数据中小于第二预设变化率阈值的数据作为嫌疑用户集合;
本发明实施例中,所述识别装置还包括:
计算模块215和添加模块216。
其中,
所述计算模块215,用于在所述临时用电数据存在缺失值的情况下,计算所述临时用电数据中用电方各个用电量数据的均值;
所述添加模块216,用于将所述均值添加到所述缺失中的对应位置。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
以上对本发明所提供的一种违约用电识别方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。