基于用户用电量大数据的居民住房空置率预测方法与流程

文档序号:30328681发布日期:2022-06-08 05:02阅读:330来源:国知局
基于用户用电量大数据的居民住房空置率预测方法与流程

1.本发明涉及电力用户大数据与住房空置率分析领域,具体涉及一种基于用户用电量大数据的居民住房空置率预测方法。


背景技术:

2.随着大数据技术的迅猛发展与应用,以谷歌、华为等为首的国内外大型企业率先展开了大数据技术的研究与应用,电力行业同样需要借助大数据技术挖掘数据价值,提升服务能力。
3.电力行业作为国民经济的重要基础部分,其智能化程度高低对国家发展水平具有较大影响作用;电网公司作为电力市场分析和预测的重要力量,通过深度挖掘数据背后的价值对精准把握整体运行规律具有重大意义;而用户的日常用电数据隐藏着用户对住宅的使用情况,通过用户对住宅的使用情况反向分析出住房空置率,可以很好地帮助政府相关工作部门制定更加合理地调节政策,也更有利于国民经济的发展。
4.由于住房空置率是基于用户用电大数据进行统计计算的,传统的空置率计算与预测全部依靠人工线下操作,耗时长、投入大,而且由于人为的疏忽造成的失误概率也比较大。


技术实现要素:

5.鉴于上述背景技术中存在的技术问题,本发明目的在于提供一种基于用户用电量大数据的居民住房空置率预测方法,该方法基于电力用户大数据,通过设置阈值和分析用户用电场景,建立数据分析模型,最终实现对用户空置类型的判别、空置率的精准计算和评估。
6.本发明为实现上述目的采用的技术方案是:基于用户用电量大数据的居民住房空置率预测方法,其特征在于,该方法包括以下步骤:
7.步骤1:获取检测范围内所有居民客户近半年的用电量数据(峰、平、谷电量数据)及用户基本信息数据(电力用户表码及其所对应的配变、线路、供电区域信息),选取居民客户近半年的峰、平、谷电量数据,清洗后按照峰平谷段标记,形成居民用户历史用电曲线。
8.步骤2:根据步骤1处理后的数据计算日均电量,并按照日均电量由低到高原则进行排序汇总;
9.步骤3:根据步骤2的汇总排序情况,分析用电量分布水平,获取用电量在20%以下的低用电水平用户;
10.步骤4:根据步骤3获得的低用电水平用户,通过聚类分析算法建立数据模型;
11.步骤5:根据步骤4所建立的数据模型,对低用电水平用户设定阈值,将用户划分为四个空置类别,分别为空置户、闲置户、迁徙户和流动户;
12.步骤6:对已划分类别的居民住宅用户进行研判,按照不同类别用户电量阈值计算住房空置率。
13.进一步,步骤1中,所述用户基本信息数据包括电力用户表码及其所对应的配变、线路、供电区域信息。
14.进一步,所述步骤1包括如下子步骤:
15.步骤1-1:从营销业务系统与用电采集系统获取用电量数据(峰、平、谷电量数据)及辅助数据(电力用户表码及其所对应的配变、线路、供电区域信息);以营销系统内十一大行业类别对用电量信息按照日、月不同频度进行汇总;
16.步骤1-2:对步骤1-1中采集的数据进行筛选、清洗,存在缺失、异常现象的用电量数据,根据居民用户峰平谷电量数据特征进行缺失数据补齐或异常数据剔除;
17.所述缺失数据补齐是对用电量数据进行线性均值插补处理,即相邻两点的均值算法对缺失数据进行补齐;对补齐时刻的数据记作tn:
18.式中t
n-1
为n时刻的前一时刻数据,t
n+1
为n时刻的后一时刻数据;
19.所述异常数据剔除是对明显不符合实际情况或异常高、低的数据进行剔除,包括:未配置自用电源的用户用电量出现负值、电量数据异常大情况。
20.进一步,所述步骤2中日均电量的计算过程如下:式中e
ave
为日均电量,e为用户用电量,t为统计时长,d为统计时段的天数。
21.进一步,步骤3中,获取用电量在20%以下的低用电水平用户的计算方式如下:式中c为低用电水平用户总数,e为用户用电量,e
max
为用电量最高的单个用户的用电量数值,e
min
为用电量最低的单个用户的用电量数值。
22.进一步,步骤4中,所述根据步骤3获得的低用电水平用户,通过聚类分析算法建立数据模型的过程如下:
23.步骤4-1:数据聚合,对低水平用电用户,将所获取的所有时段电量数据整合为一组完整的数据a1,将夜间0:00~6:00时段内测得的电量数据整理为数据集a2;
24.步骤4-2:对a1和a2两个数据集,分别按照聚类树距离选择最优聚类数目k1和k2;
25.步骤4-3:按照给定聚类数目k1和k2分别对a1和a2两个数据集进行k-means聚类;
26.步骤4-4:按照聚类结果,计算数据集分类子集均值,分别从a1和a2聚类子集中选取均值最小的子集,记为a
1min
和a
2min

27.步骤4-5:比较数据子集a
1min
和a
2min
的均值,若a
2min
均值小于a
1min
,则该用户为夜间稳定型用户,夜间电量为家庭基础电量;若a
1min
均值小于a
2min
,则该用户为非夜间稳定型用户;选择a
1min
和a
2min
中均值较小的一组,记为a
min
;通过比较全天用电最低值与夜间最低用电最低值,来判断属于哪一类型空置类别,
28.mean(a
2min
)>mean(a
1min
),夜间平稳型;
29.mean(a
2min
)<mean(a
1min
),夜间活跃型;
30.式中,mean为均值函数,用于求输入数据集的均值;
31.步骤4-6:对数据集a
min
,计算其标准差,若不满足下式,则去除a
min
中的最大值后,
再次计算剩余数据集中数据均值和标准差是否满足下式:
32.0.1*mean(a
min
)>δ(a
min
),式中:mean和δ分别为均值函数和标准差函数;最后,得出满足条件的电量集合b;
33.步骤4-7:基于电量集合b计算各类别用户的阈值,计算方法如下:
34.yb=mean(a
min
)+δ
min
,式中:yb为用户电量阈值,δ
min
即δ(a
min
)。
35.进一步,步骤5中,所述根据步骤4建立的数据模型,对低用电水平用户设定阈值,将用户划分为四个空置类别,分别为空置户、闲置户、迁徙户和流动户的过程如下:所述居民空置住房的用电指标特征包括三类用电指标特征,第一类:用电指标特征是家庭长期无人居住,处于断电状态,电量持续为零的为空置户,其阈值y
b空
=0;第二类:用电指标特征为家庭长期无人居住,处于断电状态,偶尔临时有人产生用电的用户为迁徙户或流动户,e为用户用电量,表示某些时段会出现用电负荷;第三类:长期无人居住,但并未断电,家中基础性负荷持续存在的用户为闲置户式中e1、e2均为用电量,表示长时间有基础负荷,且用电量会在一段时间发生变化。
36.进一步,步骤6中,各类别用户的住房空置率计算公式为:式中k

为空置户在相应y
b空
阈值下对应得住房空置率,c

为阈值条件下低用电水平空置户的数量,c

为用户总数。
37.通过上述设计方案,本发明可以带来如下有益效果:
38.1、极大的改善了传统工作方式,提高了工作效率;
39.2、引入了多项对用户状态的判别因素,实现了精准的判断用户空置类型与计算用户空置率。
附图说明
40.图1为基于用户用电量大数据的居民住房空置率预测方法的流程图。
具体实施方式
41.为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
42.如图1所示,基于用户用电量大数据的居民住房空置率预测方法,本发明精准的对住房空置率进行预测,极大地改变了传统依靠人工预测的状况,具体方法包括如下步骤:
43.步骤1:获取检测范围内所有居民客户近半年的用电量数据(峰、平、谷电量数据)
及用户基本信息数据(电力用户表码及其所对应的配变、线路、供电区域信息),进行数据的筛选、清洗、加工和插补;
44.步骤2:根据完成插补或完整的数据,计算日均电量,并进行排序汇总;
45.步骤3:分析记录用电量的分布水平情况,获取用电量在20%以下的低用电水平用户;
46.步骤4:对所述低用电水平用户通过k-means、dbscan等聚类算法建立数据模型;
47.步骤5:依据所述数据模型对用户设定阈值,将所有居民客户分为空置户、闲置户、迁徙或流动户;
48.步骤6:对已划分类别的居民住宅用户进行研判,按照不同类别用户电量阈值计算住房空置率。
49.基于用户用电量大数据的居民住房空置率预测方法所述步骤1包括如下子步骤:
50.步骤1-1:从营销业务应用系统和用电信息采集系统获取用户基本信息与用电量信息;针对用电量信息按照日、月不同频度,根据行业进行汇总;
51.步骤1-2:对步骤1-1中采集的数据进行筛选、清洗,存在缺失、异常现象的用电量数据,根据数据的业务含义对缺失数据补齐或异常数据剔除;
52.所述缺失数据补齐是采用对用电量数据做线性均值插补,即相邻两点的均值算法对缺失数据进行补齐;对补齐时刻的数据记作tn:
53.式中t
n-1
为n时刻的前一时刻数据,t
n+1
为n时刻的后一时刻数据;
54.所述异常数据剔除是对明显不符合实际情况或异常高、低的数据进行剔除,包括:未配置自用电源的用户用电量出现负值、电量数据异常大情况。
55.基于用户用电量大数据的居民住房空置率预测方法所述步骤2中日均电量的计算方法如下:
56.式中e
ave
为日均电量,e为用户用电量,t为统计时长,d为统计时段的天数。
57.基于用户用电量大数据的居民住房空置率预测方法,所述步骤3中依据用户用电“二八原则”,获取用电量在20%以下的低用电水平用户,计算公式如下:
58.式中c为低用电水平用户总数,e为用户用电量,e
max
为用电量最高的单个用户的用电量数值,e
min
为用电量最低的单个用户的用电量数值。
59.基于用户用电量大数据的居民住房空置率预测方法,步骤4中对低用电水平用户通过k-means聚类算法建立数据模型,其中包括子步骤如下:
60.步骤4-1:数据聚合,对低水平用电用户,将所获取的所有时段电量数据整合为一组完整的数据a1,将夜间0:00~6:00时段内测得的电量数据整理为数据集a2;
61.步骤4-2:针对a1和a2两个数据集,分别按照聚类树距离选择最优聚类数目k1和k2;
62.步骤4-3:按照给定聚类数k1和k2分别对a1和a2两个数据集进行k-means聚类;
63.步骤4-4:按照聚类结果,计算数据集分类子集均值,分别从a1和a2聚类子集中选取均值最小的子集,记为a
1min
和a
2min

64.步骤4-5:比较数据子集a
1min
和a
2min
的均值,若a
2min
均值小于a
1min
,则该用户为夜间稳定型用户,夜间电量近似为家庭基础电量;若a
1min
均值小于a
2min
,则该用户为非夜间稳定型用户;选择a
1min
和a
2min
中均值较小的一组,记为a
min
;通过比较全天用电最低值与夜间最低用电最低值,来判断属于哪一类型空置类别,
65.mean(a
2min
)>mean(a
1min
),夜间平稳型;
66.mean(a
2min
)<mean(a
1min
),夜间活跃型;
67.式中,mean为均值函数,用于求输入数据集的均值;
68.步骤4-6:针对数据集a
min
,计算其标准差,若不满足下式,则去除a
min
中的最大值后,再次计算剩余数据集中数据均值和标准差是否满足下式:
69.0.1*mean(a
min
)>δ(a
min
),式中:mean和δ分别为均值函数和标准差函数;最后,得出满足条件的电量集合b;
70.步骤4-7:基于电量集合b的计算各类别用户的阈值,计算方法如下:
71.yb=mean(a
min
)+δ
min
,yb为用户电量阈值,δ
min
即δ(a
min
)。
72.基于用户用电量大数据的居民住房空置率预测方法,步骤5所述依据所述数据模型对用户设定阈值,将所有居民客户分为空置户、闲置户、迁徙或流动户等类别的过程如下:所述居民空置住房的用电指标特征包括三类用电指标特征,其中,一是用电指标特征是家庭长期无人居住,处于断电状态,电量持续为零的为空置户,其阈值y
b空
=0;二是用电指标特征为家庭长期无人居住,处于断电状态,偶尔临时有人产生用电的用户为迁徙户或流动户,e为用户用电量,表示某些时段会出现用电负荷;三是长期无人居住,但并未断电,家中基础性负荷持续存在的用户为闲置户式中e1、e2均为用电量,表示长时间有基础负荷,但用电量会在一段时间发生变化。
73.基于用户用电量大数据的居民住房空置率预测方法,步骤6如下:所述各类别用户的住房空置率计算公式为:式中k

为空置户在相应y
b空
阈值下对应得住房空置率,c

为阈值条件下低用电水平空置户的数量,c

为用户总数。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1