一种基于细粒度用能数据的群租房识别方法

文档序号:28100825发布日期:2021-12-22 11:15阅读:182来源:国知局
一种基于细粒度用能数据的群租房识别方法

1.本发明属于电力大数据应用技术领域,涉及一种基于细粒度用能数据的群租房识别方法。


背景技术:

2.群租房是城市发展进程中的“顽疾”,由其引发的公共安全事故和社区纠纷屡见不鲜。多地政府纷纷出台相关政策措施,对群租房进行整治,但群租现象依旧屡禁不止。
3.现有的群租房有两种:一种是统计记录小区的进出人流量;另一种是水电气用量进行统计分析。前者操作困难,且所需成本很高;后者使用数据过于粗略,容易对水电大户造成误识别。


技术实现要素:

4.为解决现有技术中的不足,本技术提供一种基于细粒度用能数据的群租房识别方法,基于群租居民的用电特点,从用户的每日和每月用电中提取用户用电行为特征,运用权重、聚类算法,区分正常用户与群租用户,识别疑似群租房用户。
5.为了实现上述目标,本发明采用如下技术方案:
6.一种基于细粒度用能数据的群租房识别方法,其特征在于:
7.所述方法包括以下步骤:
8.步骤1:综合居民用户的电器功能、使用数量、使用频率情况,对电器进行层级细分,并选取用于群租房识别的细分电器;
9.步骤2:采集步骤1所选细分电器的细粒度用能数据并进行预处理;
10.步骤3:提取居民用户的用电行为特征,包括用电量特性、变动特性、波动特性;
11.步骤4:采用critic权重法,配置步骤3所提取用电行为特征的特征指标权重;
12.步骤5:基于用电行为特征值及其权重,采用基于som神经网络的聚类算法,识别疑似群租房用户与正常居民用户。
13.本发明进一步包括以下优选方案:
14.优选地,步骤1中,将电器划分为两个层级,第一层级电器包括:空调类电器、电热类电器、电暖类电器、厨房类电器、其他类电器;
15.空调类电器的第二层级电器包括:定频空调类电器和变频空调类电器;
16.电热类电器的第二层级电器包括:储水式电热水器、即热式电热水器、普通烧水式电水壶、带温控储水式电水壶、电吹风、储水式小厨宝、即热式小厨宝;
17.电暖类电器的第二层级电器包括:油汀、风暖式浴霸、灯暖式浴霸;
18.厨房类电器的第二层级电器包括:电磁炉、定频微波炉、变频微波炉、电饭煲、电烤箱;
19.其他类电器的第二层级电器包括:定频波纹洗衣机、定频滚筒洗衣机、变频滚筒洗衣机。
20.优选地,步骤1中,选取空调类电器、电热类电器和厨房类电器,用于群租房识别的细分电器。
21.优选地,步骤2具体包括以下步骤:
22.步骤2

1:采用非入户智能终端,对细分电器的运行数据进行辨识提取;
23.步骤2

2:对提取数据进行数据清洗及异常值剔除;
24.步骤2

3:筛选得到细分电器15min/点的细分电器用电量及总用电量。
25.优选地,步骤2

2具体为:选取工作日数据,剔除周末及特殊节假日,并剔除1天内连续4h低于事件期间平均用电量的75%或高于其125%的日用电量。
26.优选地,步骤3所述用电量特性,包括以下特征指标:
27.(1)每个用户h个月月均用电量
[0028][0029]
e
j
(n)为用户n在j月的用电量;
[0030]
(2)每个用户h个月空调类电器月均电量
[0031][0032]
e
d1_j
(n)为用户n在j月的空调类电器用电量;
[0033]
(3)每个用户h个月电热类电器月均用电量
[0034][0035]
e
d2_j
(n)为用户n在j月的电热类电器用电量;
[0036]
(4)每个用户h个月厨房类电器月均用电量
[0037][0038]
e
d3_j
(n)为用户n在j月的厨房类电器用电量;
[0039]
(5)每个用户h个月月均夜间用电率
[0040][0041]
r
night_j
(n)为用户n在j月的夜间用电率:
[0042][0043]
e
night_j
(n)为用户n在j月的夜均用电量;
[0044]
1≤h≤12,1≤j≤12。
[0045]
优选地,步骤3所述变动特性,包括以下特征指标:
[0046]
(1)每个用户前r个月与后h

r个月平均用电量差值:davg_r(n);
[0047][0048]
(2)每个用户前r个月与后h

r个月电热类电器用电量差值:davg_r2(n);
[0049]
(3)每个用户前r个月与后h

r个月厨房类电器用电量差值:davg_r3(n);(4)每个用户h个月用电用电量线性拟合的斜率:r(n);
[0050]
其中,h取12,r取7。
[0051]
优选地,步骤3所述波动特性,包括以下特征指标:
[0052]
(1)每个用户h个月总用电量标准差sd(n);
[0053]
(2)每个用户h个月电热类电器标准差sd_d2(n);
[0054]
(3)每个用户h个月厨房类电器用电量标准差sd_d3(n);
[0055]
(4)每个用户前r个月总用电量序列的标准差/后h

r月用电量序列的标准差:be_sd(n);
[0056]
(5)每个用户前r个月电热类电器序列的标准差/后h

r电热类电器序列的标准差:be_sd2;
[0057]
(6)每个用户前r个月厨房类电器用电量序列的标准差/后h

r月用电量序列的标准差:be_sd3(n);
[0058]
(7)每个用户h个月月均日用电波动性
[0059][0060]
其中t
j
(n)为j月均用电波动性:
[0061][0062]
t
i
(n)为i日的日用电波动性:
[0063][0064]
其中,|t
d
(n)|的取值方式为:
[0065]
将1天以2h为一个时间段平均分成12段,计算每个时间的用电量为t
d
,d=1,2,
……
,12,计算12个时间段的用电均值,12,计算12个时间段的用电均值
[0066]
优选地,步骤4具体包括以下步骤:
[0067]
步骤4

1:计算各特征指标标准差s
i

[0068]
[0069][0070]
其中,x
ni
表示用户n第i项特征指标的数值,n为用户数量;
[0071]
s
i
表示第i个特征指标的标准差;
[0072]
计算各特征指标相关系数r
j

[0073][0074]
其中,r
ji
表示特征指标j和i之间的相关系数,j为特征指标数量;
[0075]
步骤4

2:计算各特征指标信息量c
i

[0076][0077]
步骤4

3:计算第i个特征指标的客观权重w
i

[0078][0079]
优选地,步骤5中,所述som神经网络训练流程包括:
[0080]
步骤5

1:对特征值进行归一化处理;
[0081]
步骤5

2:初始化:设置竞争层各神经元初始权重,权重μ
j
=(μ
1j

2j

μ
jj
),j=1,2,

j(j>n);确定优胜邻域σ0及学习率η0初始值;
[0082]
步骤5

3:每次从数据集中随机选出一个样本,每个输入变量为j维的特征向量x
i
=(x1,x2,

,x
j
),样本数为n;
[0083]
步骤5

4:对输入变量x
i
赋予权重w=(w1,w2,

w
i
,

w
j
),每个输入变量更新为w
i
x
i
=(w1x1,w2x2,

,w
j
x
j
);
[0084]
步骤5

5:计算每个输入样本wx
i
与每个输出神经元j之间的欧氏距离d
j

[0085][0086]
选择距离最小的神经元为获胜神经元;
[0087]
步骤5

6:更新学习率:学习率为递减函数,计算表达式为:η(t)=η0×
e

t/(t/3)

[0088]
其中,t为总训练次数,t为当前训练次数;
[0089]
步骤5

7:确定优胜邻域:以获胜神经元g为中心的优胜邻域半径与运行步数呈负相关,其内的所有节点均可获得权值更新机会,邻域函数随邻域半径的减小而减小;
[0090]
邻域半径及邻域de计算表达式为:
[0091][0092][0093]
μ
g
为获胜神经元的权重值,μ
j
为其他竞争神经元的权重值;
[0094]
步骤5

8:更新权重值:对优胜邻域de内每个神经元进行权值更新,更新公式为:
[0095]
μ
j

(t+1)=μ
j'
(t)+η(t)[w
i
x
i
(t)

μ
j’(t)],j'∈de(t)
[0096]
步骤5

9:判断训练次数t是否已经达到总训练次数t,若t≥t,则结束训练,否则进行下一轮训练。
[0097]
本技术所达到的有益效果:
[0098]
本发明基于居民用户15min/点的细粒度数据,在获得居民用户的总用电数据的基础上,还可以通过智臻ndtu非入户智能端辨识,分析出居民各分项电器的用电数据,从而对居民的用电行为做更详细的分类与描述,增加辨识准确性。
[0099]
本发明针对群租房内人员密度大、流动性高的特点,构建居民用电特征集,进一步从每户居民的用电细粒度数据中提取用电特征量,并通过som聚类算法区分正常用户和群租用户。有效解决了群租辨识困难的现象,有助于社区群租房排查管理,提高广大居民的居住和用电安全。
[0100]
本发明的critic权重法不仅考虑到了变异对于指标的影响.而且同时还考虑了关联性对于指标的影响,得到的评价指标权重更加全面。
[0101]
本发明基于som神经模型的聚类算法,与其他聚类算法相比,不需要提前设定聚类簇数,可视化强,将多维数据映射到二维平面上,具有数据降维的作用,同时可以展示数据间的拓扑关系。
附图说明
[0102]
图1是本发明的基于细粒度用能数据的群租房识别方法步骤;
[0103]
图2是som神经网络典型结构;
[0104]
图3是本发明实施例中的som神经网络训练流程图。
具体实施方式
[0105]
下面结合附图对本技术作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本技术的保护范围。
[0106]
如图1所示,本发明的一种基于细粒度用能数据的群租房识别方法,包括以下步骤:
[0107]
步骤1:综合居民用户的电器功能、使用数量、使用频率情况,对电器进行层级细分,并选取用于群租房识别的细分电器;
[0108]
具体实施时,综合电器功能、使用数量、使用频率等对电器从两个层级进行细分,如表1所示。
[0109]
表1
[0110][0111]
总用电量数据反应居民总用电情况和峰谷用电偏好,电器的使用情况更详细地反应居民日常活动情况。其中空调类电器类和电热类占据家庭电器用电中的主要部分,同时厨房类电器的使用反应了居民的日常烹饪习惯。
[0112]
因此在本发明使用的电器数据包括空调类电器、电热类电器和厨房类电器。
[0113]
步骤2:采集步骤1所选细分电器的细粒度用能数据并进行预处理;
[0114]
通过非入户用电量辨识技术,通过对空调类电器、电热、厨电等分项电器的辨识提取,获到15min/点的总用电量及细分电器的数据。
[0115]
具体包括:
[0116]
步骤2

1:采用智臻ndtu非入户智能终端,对细分电器的运行数据进行辨识提取;
[0117]
步骤2

2:对提取数据进行数据清洗及异常值剔除:
[0118]
选取工作日数据,剔除周末及特殊节假日,并剔除1天内连续4h低于事件期间平均用电量的75%或高于其125%的日用电量;
[0119]
步骤2

3:筛选得到细分电器15min/点的细分电器用电量及总用电量。
[0120]
基于15min/点的细粒度数据不仅可以获得居民用电的总用电数据,同时通过ndtd非入户智能端对细粒度数据作进一步处理,获得居民各分项电器的用电数据。在相同的负荷曲线下居民的用电行为也存在着巨大的差异。结合居民电器使用数据,可对居民的用电行为做更详细的分类与描述,增加辨识准确性。
[0121]
步骤3:提取居民用户的用电行为特征,包括用电量特性、变动特性、波动特性;
[0122]
据相关数据统计群租房中超八成为青年流动人口,其中87.5%的人从事第三产业,集中在批发零售、住宿餐饮、居民服务、租赁商务、信息技术等。
[0123]
表2所示为群租户的相关信息。
[0124]
表2
[0125][0126]
从上述群租户的特点出发,将从三个方面分析居民用电行为特征,来区分群组用户和正常居民用户,分别为:用电量特性、变动特性、波动特性。
[0127]
所述用电量特性,包括以下特征指标:
[0128]
(1)每个用户h个月月均用电量
[0129][0130]
e
j
(n)为用户n在j月的用电量;
[0131]
(2)每个用户h个月空调类电器月均电量
[0132][0133]
e
d1_j
(n)为用户n在j月的空调类电器用电量;
[0134]
(3)每个用户h个月电热类电器月均用电量
[0135][0136]
e
d2_j
(n)为用户n在j月的电热类电器用电量;
[0137]
(4)每个用户h个月厨房类电器月均用电量
[0138][0139]
e
d3_j
(n)为用户n在j月的厨房类电器用电量;
[0140]
(5)每个用户h个月月均夜间用电率
[0141][0142]
r
night_j
(n)为用户n在j月的夜间用电率:
[0143][0144]
e
night_j
(n)为用户n在j月的夜均用电量(平均夜间用电量),1≤h≤12,1≤j≤12。
[0145]
夜间时间段为22:00

4:00。
[0146]
所述变动特性,包括以下特征指标:
[0147]
(1)每个用户前r个月与后h

r个月平均用电量差值:davg_r(n);
[0148]
(2)每个用户前r个月与后h

r个月电热类电器用电量差值:davg_r2(n);
[0149]
(3)每个用户前r个月与后h

r个月厨房类电器用电量差值:davg_r3(n);
[0150]
(4)每个用户h个月用电用电量线性拟合的斜率:r(n);
[0151]
其中,h取12,r取7。
[0152]
变动特性是指用户用电模式的首尾差异度量。
[0153]
群租房因为居住人员性质原因,流动性大,尤其是到租房高峰季。
[0154]
不同的人群由于生活习惯的不同,导致群租房内用电行为差异较大。
[0155]
davg_r代表前r个月与后h

r个月平均用电量的差值,即:
[0156][0157]
特征指标r的选择,选择以夏季7月份为分界点;考虑到夏季是租房旺季,出租房内人群变化大,会引起该户居民用电行为习惯发生明显地变化。
[0158]
所述波动特性,包括以下特征指标:
[0159]
(1)每个用户h个月总用电量标准差sd(n);
[0160]
(2)每个用户h个月电热类电器标准差sd_d2(n);
[0161]
(3)每个用户h个月厨房类电器用电量标准差sd_d3(n);
[0162]
(4)每个用户前r个月总用电量序列的标准差/后h

r月用电量序列的标准差:be_sd(n)=bsd(n)/esd(n);
[0163]
(5)每个用户前r个月电热类电器序列的标准差/后h

r电热类电器序列的标准差:be_sd2=bsd2(n)/esd2(n);
[0164]
(6)每个用户前r个月厨房类电器用电量序列的标准差/后h

r月用电量序列的标准差:be_sd3(n)=bsd3(n)/esd3(n);
[0165]
(7)每个用户h个月月均日用电波动性
[0166][0167]
其中t
j
(n)为j月均用电波动性:
[0168][0169]
t
i
(n)为i日的日用电波动性:
[0170]
[0171]
其中,|t
d
(n)|的取值方式为:
[0172]
将1天以2h为一个时间段平均分成12段,计算每个时间的用电量为t
d
,d=1,2,
……
,12,计算12个时间段的用电均值,12,计算12个时间段的用电均值
[0173]
步骤4:采用critic权重法,配置步骤3所提取用电行为特征的特征指标权重;
[0174]
计算权重系数的方法有很多,主要包括主赋权法和客观赋权法两类,客观权重法包括熵权法、标准离差法和critic法。主观权重法主要依靠专家经验,在一些新领域中使用容易受到条件限制。而在客观权重法中,critic权重法是一种基于评价特征指标的对比强度和特征指标之间的冲突性来综合衡量特征指标的客观权重。对比强度是指同一个特征指标各个评价方案之间取值差距的大小,以标准差的形式来表现。标准差越大,说明波动越大,即各方案之间的取值差距越大,权重会越高。与另两个指标相比,critic法在计算权值时,不仅考虑到了变异对于指标的影响.而且同时还考虑了关联性对于指标的影响,比前两种方法评价指标权重更加全面。
[0175]
步骤4具体包括:
[0176]
步骤4

1:计算各特征指标标准差s
i

[0177][0178][0179]
其中,x
ni
表示用户n第i项特征指标的数值,n为用户数量;
[0180]
s
i
表示第i个特征指标的标准差;
[0181]
计算各特征指标相关系数r
j

[0182][0183]
其中,r
ji
表示特征指标j和i之间的相关系数,j为特征指标数量;
[0184]
步骤4

2:计算各特征指标信息量c
i

[0185][0186]
步骤4

3:计算第i个特征指标的客观权重w
i

[0187][0188]
步骤5:基于用电行为特征值及其权重,采用基于som神经网络的聚类算法,识别疑似群租房用户与正常居民用户,将用电量异常高、波动性和变异性异常大的簇群视为疑似群租房用户簇。
[0189]
本发明som是一种无监督自学习竞争型神经网络,具有自组织功能,其含有双层网络结构,可以对神经网络的输入数据进行自动分类。任意维度输入数据经som神经网络作用后,均可在原有拓扑结构保持不变的情况下映射到一维或二维竞争层平面。与其他聚类算法相比,som不需要提前设定聚类簇数,可视化强,将多维数据映射到二维平面上,具有数据
降维的作用,同时可以展示数据间的拓扑关系。
[0190]
som神经网络的典型结构如图2所示。
[0191]
输入层神经元由输入数据的维数决定,其与竞争层神经元实现全连接,竞争层神经元内部相互连接,根据对输入数据的响应程度竞争输出,最终形成输入数据的拓扑神经网络分布。其具体训练流程:
[0192]
如图3所示,所述som神经网络训练流程包括:
[0193]
步骤5

1:对特征值进行归一化处理;
[0194]
为了消除特征指标之间的量纲影响,对进行数据标准化处理,以解决数据特征指标之间的可比性,对特征量x进行归一化处理:
[0195][0196]
步骤5

2:初始化:设置竞争层各神经元(特征量)初始权重,权重μ
j
=(μ
1j

2j

μ
jj
),j=1,2,

j(j>n),为标准化小型随机值;
[0197]
确定优胜邻域σ0及学习率η0初始值,分别为2和0.2;
[0198]
步骤5

3:每次从数据集中随机选出一个样本(就是一个用户n),每个输入变量为j维的特征向量x
i
=(x1,x2,

,x
j
),样本数为n;
[0199]
步骤5

4:对输入变量x
i
赋予权重w=(w1,w2,

w
i
,

w
j
),每个输入变量更新为w
i
x
i
=(w1x1,w2x2,

,w
j
x
j
);
[0200]
步骤5

5:计算每个输入样本wx
i
与每个输出神经元j之间的欧氏距离d
j

[0201][0202]
选择距离最小的神经元为获胜神经元;
[0203]
步骤5

6:更新学习率:学习率为递减函数,计算表达式为:η(t)=η0×
e

t/(t/3)
[0204]
其中,t为总训练次数,设置为1000次,t为当前训练次数;
[0205]
步骤5

7:确定优胜邻域:以获胜神经元g为中心的优胜邻域半径与运行步数呈负相关,其内的所有节点均可获得权值更新机会,邻域函数随邻域半径的减小而减小;
[0206]
邻域半径及邻域de计算表达式为:
[0207][0208][0209]
μ
g
为获胜神经元的权重值,μ
j
为其他竞争神经元的权重值;
[0210]
步骤5

8:更新权重值:对优胜邻域de内每个神经元进行权值更新,更新公式为:
[0211]
μ
j

(t+1)=μ
j'
(t)+η(t)[w
i
x
i
(t)

μ
j’(t)],j'∈de(t)
[0212]
步骤5

9:判断训练次数t是否已经达到总训练次数t,若t≥t,则结束训练,否则进行下一轮训练。
[0213]
综上所述,本发明所使用的细粒度数据一方面获取15min/点的总用电量,另一方面获取较详细的居民电器使用情况。利用电力大数据分析及人工智能算法,对住户用电行为进行精准分析,快速定位高可疑的群租房居民,方便准确上门抽样排查,有效打击群租现象。
[0214]
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1