本说明书一个或多个实施例涉及居民空置住户识别技术领域,尤其涉及基于电力大数据的居民空置住户识别方法及设备。
背景技术:
第七次全国人口普查工作于今年初全面启动,由于人口普查工作要求全覆盖,所以普查最大的痛点就是入户难,找不到人,从而影响普查效率以及普查质量。主要表现在以下几方面,一是入户找不到人造成多次入户,影响普查效率;二是多次入户找不到人,通常会定义为“空户”,但可能造成普查遗漏,影响普查质量;三是普查员责任心不强,一次普查找不到人,就直接上报为空户,也会影响普查质量。而准确判断“空户”是解决上述问题的一个重要因素。
目前,国内外没有标准的住宅空置识别方法,常用的方法主要是通过某一时刻空置房屋面积占房屋总面积的比率判断房屋空置率,而且主要是面向商业楼宇开展的空置率分析,因此此类技术普遍不适用于居民住户空置识别。对于判断居民住户周、月和半年时间内是否空置不适用。
技术实现要素:
有鉴于此,本说明书一个或多个实施例的目的在于提出基于电力大数据的居民空置住户识别方法及设备,以解决现有技术中居民住户空置无法准确识别的问题。
基于上述目的,本说明书一个或多个实施例提供了基于电力大数据的居民空置住户识别方法,包括:
获取住户的日用电量数据,对获取的数据进行剔除处理;
基于处理后的数据,计算住户周用电量均值、月用电量均值和半年用电量均值;
基于处理后的数据,构建空置住户识别模型,确定空置住户识别模型的参数阈值;
将周用电量均值、月用电量均值和半年用电量均值依次输入到空置住户识别模型中进行居民空置住户识别。
可选的,所述对获取的数据进行剔除处理,包括:剔除数据中小于0的值和大于2500的值。
可选的,所述基于处理后的数据,构建空置住户识别模型,确定空置住户识别模型的参数阈值,包括:
基于处理后的数据,构建空置住户识别模型,所述空置住户识别模型含括如下参数:周平均用电量和周变异系数,所述周平均用电量包括阈值1和阈值3,所述周变异系数包括阈值2和阈值4;
计算住户用电量的周平均用电量、周变异系数;
根据分位数法,取所有住户的周平均用电量、周变异系数的a分位数;调整a的值,使小于周平均用电量且小于周变异系数的户数占比≤5%;
此时a值对应的周用电量均值、周变异系数即分别为周用电量均值的阈值1、周变异系数的阈值2;
取所有住户的周用电量均值的a分位数,周变异系数的2a分位数;调整a的值,使小于周用电量均值且小于周变异系数的户数占比≤1%;
此时a值对应的周用电量均值、周变异系数即分别为周用电量均值的阈值3、周变异系数的阈值4。
可选的,所述将周用电量均值、月用电量均值和半年用电量均值依次输入到空置住户识别模型中进行居民空置住户识别,包括:
将周用电量均值、月用电量均值和半年用电量均值依次输入到空置住户识别模型中,并与模型中的参数阈值进行比较;
当住户周用电量均值满足如下关系中的一个时,则输出该住户在这一周为空置:
(1)周用电量均值<阈值1,
(2)周用电量均值≥阈值1且周变异系数<阈值2,
(3)周变异系数≥阈值2且周用电量均值<阈值3且周变异系数<阈值4;
根据住户一周空置情况,判断住户连续两周空置情况,若住户连续两周空置,则判断该住户在这两周为空置;
月空置、半年空置按上述方法依此类推。
可选的,所述确定空置住户识别模型的参数阈值,包括:
参考各类型电器的功率及使用时间,设置多个空置住户日用电水平阈值n;
计算并测试区域内住户的空置情况,对空置住户判定阈值进行分析确定。
可选的,所述各类型电器至少包括如下中的其中一种,收音机、省电灯泡、日光灯、40w灯泡、60w灯泡和冰箱。
可选的,所述周变异系数的计算公式如下:
周变异系数=周用电量标准差/周用电量平均值。
一种装置,用于执行基于电力大数据的居民空置住户识别方法,包括:
获取、剔除数据模块,用于获取住户的日用电量数据,对获取的数据进行剔除处理;
数据计算模块,用于基于处理后的数据,计算住户周用电量均值、月用电量均值和半年用电量均值;
模型构建模块,用于基于处理后的数据,构建空置住户识别模型,确定空置住户识别模型的参数阈值;
判断输出模块,用于将周用电量均值、月用电量均值和半年用电量均值依次输入到空置住户识别模型中进行居民空置住户识别。
从上面所述可以看出,本说明书一个或多个实施例提供的基于电力大数据的居民空置住户识别方法及设备,通过住户的用电量,构建空置住户识别模型,结合用户的周用电量均值、月用电量均值和半年用电量均值等用电数据、行为和规律进行空置居民住户的分析,通过数理统计的方法,充分考虑了周平均用电量、变异系数两个用电特征因素,能够实现对空置居民住户的精准识别。对阈值参数确定,参考了各类型电器的功率及使用时间,对空置户判定阈值进行探索。有利于结合业务,对生活中各种空置场景进行分类,且构建的模型有效覆盖了空置场景。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例空置住户识别方法流程图;
图2为本说明书一个或多个实施例周空置住户识别流程图;
图3为本说明书一个或多个实施例两周、月、半年空置住户识别流程图;
图4为本说明书一个或多个实施例执行空置住户识别方法的设备内部模块框图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,对本公开进一步详细说明。
在判断居民空置的的技术领域,公知的是国内外没有标准的住宅空置识别方法,常用的方法主要是通过某一时刻空置房屋面积占房屋总面积的比率判断房屋空置率,而且主要是面向商业楼宇开展的空置率分析,因此此类技术普遍不适用于居民住户空置识别。对于判断居民住户周、月和半年时间内是否空置不适用。
为了解决上述问题,本说明书一个或多个实施例提供了基于电力大数据的居民空置住户识别方法,包括:
获取住户的日用电量数据,对获取的数据进行剔除处理;
基于处理后的数据,计算住户周用电量均值、月用电量均值和半年用电量均值;
基于处理后的数据,构建空置住户识别模型,确定空置住户识别模型的参数阈值;
将周用电量均值、月用电量均值和半年用电量均值依次输入到空置住户识别模型中进行居民空置住户识别。
同时本说明书一个或多个实施例提供了一种装置,用于执行基于电力大数据的居民空置住户识别方法,包括:
获取、剔除数据模块,用于获取住户的日用电量数据,对获取的数据进行剔除处理;
数据计算模块,用于基于处理后的数据,计算住户周用电量均值、月用电量均值和半年用电量均值;
模型构建模块,用于基于处理后的数据,构建空置住户识别模型,确定空置住户识别模型的参数阈值;
判断输出模块,用于将周用电量均值、月用电量均值和半年用电量均值依次输入到空置住户识别模型中进行居民空置住户识别。
通过住户的用电量,构建空置住户识别模型,结合用户的周用电量均值、月用电量均值和半年用电量均值等用电数据、行为和规律进行空置居民住户的分析,通过数理统计的方法,充分考虑了周平均用电量、变异系数两个用电特征因素,能够实现对空置居民住户的精准识别。
本说明书一个或多个实施例提供了基于电力大数据的居民空置住户识别方法,流程图如图1所示,包括:
步骤101:获取住户的日用电量数据,对获取的数据进行剔除处理。
具体的,数据准备,获取某个区域最近三年的居民住户的日用电量数据,剔除数据中小于0的值和大于2500的值。
举例来说,以最近三年的黑龙江省某区域内所有家庭的日用电量作为统计数据,数据特征是从区域内三个小区样例数据中加工计算得到,剔除数据中小于0的值、以及大于2500的值。
步骤102:基于处理后的数据,计算住户周用电量均值、月用电量均值和半年用电量均值。
步骤103:基于处理后的数据,构建空置住户识别模型,确定空置住户识别模型的参数阈值。
具体的,基于处理后的数据,构建空置住户识别模型,所述空置住户识别模型含括如下参数:周平均用电量和周变异系数,所述周平均用电量包括阈值1和阈值3,所述周变异系数包括阈值2和阈值4;
计算住户用电量的周平均用电量、周变异系数;
根据分位数法,取所有住户的周平均用电量、周变异系数的a分位数;调整a的值,使小于周平均用电量且小于周变异系数的户数占比≤5%;
此时a值对应的周用电量均值、周变异系数即分别为周用电量均值的阈值1、周变异系数的阈值2;
取所有住户的周用电量均值的a分位数,周变异系数的2a分位数;调整a的值,使小于周用电量均值且小于周变异系数的户数占比≤1%;
此时a值对应的周用电量均值、周变异系数即分别为周用电量均值的阈值3、周变异系数的阈值4。
在确定空置住户识别模型的参数阈值,包括:参考各类型电器的功率及使用时间,设置多个空置住户日用电水平阈值n;
计算并测试区域内住户的空置情况,对空置住户判定阈值进行分析确定。
周变异系数的计算公式如下:
周变异系数=周用电量标准差/周用电量平均值。
举例来说:用步骤101处理后的数据计算,小区每个住户的用电量周平均值、周变异系数。取所有住户的周平均用电量、周变异系数的a分位数;调整a的值,使小于周平均用电量且小于周变异系数的户数占比≤5%,此时a值对应的周用电量均值、周变异系数即分别为周用电量均值的阈值1、周变异系数的阈值2,(a约为25%)。
考虑到阈值3和阈值4的设置的主要目的是发现存在偶尔一次使用的空置住房此类情况,所以其取值应该使变异系数的分位数大于平均值。
取所有住户的周用电量均值的a分位数,周变异系数的2a分位数;调整a的值,使小于周用电量均值且小于周变异系数的户数占比≤1%;
此时a值对应的周用电量均值、周变异系数即分别为周用电量均值的阈值3、周变异系数的阈值4,(a约为30%,2a约为60%)。
空置户的用电量水平一般处于较低水平,本次阈值确定参考各类型电器的功率及使用时间(如表1所示),设置多个空置户日用电水平阈值n,计算并观测区域内用户的空置情况,对空置户判定阈值进行分析确定。
表1类型电器的功率及使用时间
通过上述的步骤,确定的空置住户识别模型的参数阈值见表2所示。
表2空置住户识别模型参数阈值表
步骤104:将周用电量均值、月用电量均值和半年用电量均值依次输入到空置住户识别模型中进行居民空置住户识别。
具体的,如图2、3所示,将周用电量均值、月用电量均值和半年用电量均值依次输入到空置住户识别模型中,并与模型中的参数阈值进行比较;
当住户周用电量均值满足如下关系中的一个时,则输出该住户在这一周为空置:
(1)周用电量均值<阈值1,
(2)周用电量均值≥阈值1且周变异系数<阈值2,
(3)周变异系数≥阈值2且周用电量均值<阈值3且周变异系数<阈值4;
根据住户一周空置情况,判断住户连续两周空置情况,若住户连续两周空置,则判断该住户在这两周为空置;
月空置、半年空置按上述方法依此类推。
举例来说,以周为例,将步骤102计算得到的住户周用电量均值输入到步骤103确定的空置住户识别模型中,首先采用日用电量衡量法,当住户周用电量均值<阈值1时,判断该住户在这一周为空置,当住户周用电量均值≥阈值1时,则采用电量波动幅度(变异系数)衡量法继续判断,判断周变异系数,若周变异系数<阈值2,判断该住户在这一周为空置,若周变异系数≥阈值2,采用用电量少衡量法,同时判断住户的周平均用电量和周用电量变异系数,若周用电量均值<阈值3且周变异系数<阈值4,判断该住户在这一周为空置,根据住户一周空置情况,判断住户连续两周空置情况,若住户连续两周空置,则判断该住户在这两周为空置。
月空置、半年空置按上述方法依此类推。
通过本说明书的空置住户识别模型并对生活中各种空置场景进行分类,判断模型是否有效覆盖空置场景。结果如表3所示。
表3空置模型场景分类和判断结果
空置住户识别模型按照空置时间长短分为一周空置、两周空置、一月空置、半年空置四类。空置住户的判断,通过数据分析的方法实现空置住户的识别。
本说明书一个或多个实施例提供了一种装置,用于执行基于电力大数据的居民空置住户识别方法,内部模块框图如图4所示,包括:获取、剔除数据模块401,数据计算模块402,模型构建模块403,判断输出模块。
获取、剔除数据模块401,用于获取住户的日用电量数据,对获取的数据进行剔除处理。
具体的,用于数据准备,获取某个区域最近三年的居民住户的日用电量数据,剔除数据中小于0的值和大于2500的值。
数据计算模块402,用于基于处理后的数据,计算住户周用电量均值、月用电量均值和半年用电量均值。
模型构建模块403,用于基于处理后的数据,构建空置住户识别模型,确定空置住户识别模型的参数阈值。
具体的,基于处理后的数据,构建空置住户识别模型,所述空置住户识别模型含括如下参数:周平均用电量和周变异系数,所述周平均用电量包括阈值1和阈值3,所述周变异系数包括阈值2和阈值4;
计算住户用电量的周平均用电量、周变异系数,
根据分位数法,取所有住户的周平均用电量、周变异系数的a分位数;调整a的值,使小于周平均用电量且小于周变异系数的户数占比≤5%;
此时a值对应的周用电量均值、周变异系数即分别为周用电量均值的阈值1、周变异系数的阈值2;
取所有住户的周用电量均值的a分位数,周变异系数的2a分位数;调整a的值,使小于周用电量均值且小于周变异系数的户数占比≤1%;
此时a值对应的周用电量均值、周变异系数即分别为周用电量均值的阈值3、周变异系数的阈值4。
在确定空置住户识别模型的参数阈值,包括:参考各类型电器的功率及使用时间,设置多个空置住户日用电水平阈值n;
计算并测试区域内住户的空置情况,对空置住户判定阈值进行分析确定。
周变异系数的计算公式如下:
周变异系数=周用电量标准差/周用电量平均值。
判断输出模块404,用于将周用电量均值、月用电量均值和半年用电量均值依次输入到空置住户识别模型中进行居民空置住户识别。
具体的,将周用电量均值、月用电量均值和半年用电量均值依次输入到空置住户识别模型中,并与模型中的参数阈值进行比较;
当住户周用电量均值满足如下关系中的一个时,则输出该住户在这一周为空置:
(1)周用电量均值<阈值1,
(2)周用电量均值≥阈值1且周变异系数<阈值2,
(3)周变异系数≥阈值2且周用电量均值<阈值3且周变异系数<阈值4;
根据住户一周空置情况,判断住户连续两周空置情况,若住户连续两周空置,则判断该住户在这两周为空置;
月空置、半年空置按上述方法依此类推。
通过空置住户识别模型识别的空置居民住宅,可以帮助调查员判断一户住房是否为空。也可以用于核实调查员的调查结果是否为真,提高普查效率及普查质量。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。