本发明属于配用用电领域,具体涉及一种基于smote函数的非介入式负荷辨识数据样本均衡化方法和系统。
背景技术:
1、随着智能电网的发展,传统电力行业将向高度集约化、知识化、技术化方向发展,除关注发电侧的数量和质量外,还应重视对需求侧的管理。因此,在功率分配和消耗方面的智能化需求越来越大。应用需求侧管理优化低压用户客户端,实现有效的负荷管理。功耗侧的智能技术引起了越来越多的关注。电力需求侧管理的关键是获取家庭能源效率的详细信息,分析家庭用电能耗结构,更好地了解用户行为对家庭能源效率的影响,引导用户自觉采取节能行动,负荷辨识是负荷管理的核心技术。
2、然而对于实际场景中,不同家庭用电设备使用次数存在较大的差异,数据样本的不均衡对于分类器的分类结果影响巨大,往往在高频繁使用的电器中,低频率使用电器被淹没。
3、现有技术文件1(cn113406433a)公开了一种基于非侵入式电力负荷的模糊聚类感知方法,包括:s1、电网数据采集:通过spi总线,将计量芯片实时推送的负荷信息数据传送到嵌入式终端,嵌入式模块采用dma的方式进行数据的传输,从而降低mcu的cpu消耗。在本项目中,将这个数据采集作为一个任务并通过信号量等方式传递给下一个任务,及负荷事件检测;s2、特征分析:在获取得到的实时数据中,为了降低数据纬度,采用了谐波统计方法,从而将每次采样得到的数据压缩到15*4个字节范围了,以降低数据的储存量;同时,在特征分析上,主要以谐波特征为主,结合一些潜在的负荷特征;s3、模糊聚类感知:在辨识过程中,尤其是检测到负荷事件,考虑到上述三类的负荷特征,模糊感知算法的输入需要结合三种特征进行负荷辨识,每一种负荷特征作为一个隶属度度量标准,依次实现多个特征的隶属度评价,综合这些隶属度,获取概率密度最大的情况下的负荷匹配,实现负荷辨识。现有技术文件1中阐述了负荷辨识的三个步骤,包括数据采集、特征分析和模糊聚类,其在s2特征分析步骤中基于s1中计量芯片采集的数据进行特征提取,出于存储量限制做了简单数据降维,但是并未考虑负荷设备类型,如使用频率高低、人均占有率高低等因素,未对计量芯片采集的数据进行数据质量层面的降噪、均衡化等二次处理,导致低频率使用电器的特征淹没在家庭总负荷波形中。
技术实现思路
1、为解决现有技术中存在的不足,提高负荷辨识精确度,本发明提供一种基于smote函数的非介入式负荷辨识数据样本均衡化方法和系统。
2、本发明采用如下的技术方案。
3、一种基于smote函数的非介入式负荷辨识数据样本均衡化方法,包括如下步骤:
4、步骤1,将多个家庭设备作为多个样本,分别采样每一个样本的负荷波形,提取出对应的电压电流信号;
5、步骤2,基于电压电流信号,计算各个样本的有功功率、无功功率与谐波有效值,并得到每一个样本对应的启停特征;
6、步骤3,将启停特征作为特征向量,并基于smote函数,均衡化不同种类的家庭设备的样本数量。
7、优选地,所述步骤2具体包括:
8、步骤2.1,基于傅里叶变换将电压电流信号从时序信号转变为频域信号,从而得到谐波有效值;
9、步骤2.2,根据谐波有效值,计算得到有功功率、无功功率、二次谐波与三次谐波;
10、步骤2.3,根据有功功率、无功功率、二次谐波与三次谐波形成计算每一个家庭设备的事件特征;
11、步骤2.4,根据事件特征得到启停特征,包括:开启有功功率、开启无功功率、开启三次谐波、开启二次谐波、变档有功功率、变档无功功率、变档三次谐波、变档二次谐波、变档次数、关断有功功率、关断无功功率、关断三次谐波、关断二次谐波、电器运行时长。
12、优选地,所述步骤2.1具体包括:
13、电流k次谐波有效值i(k)为:
14、i(k)=a(k)+jb(k)
15、
16、其中,n为采样周期,ns为周期采样点数,i(k)为频域信号;
17、a(k)和b(k)分别为k阶频域信号的实部和虚部,j为虚数单位。
18、优选地,所述步骤2.2具体包括:
19、有功功率p与无功功率q分别为:
20、
21、式中,为k次电压谐波相位角,为k次电流谐波相位角,u(k)为电流k次谐波的有效值,u(0),i(0)分别为电压与电流的基波有效值,u(k),i(k)分别为电压与电流的k次谐波有效值,nk为最高谐波次数。
22、优选地,所述步骤2.3具体包括:
23、事件特征为:
24、p={p1,…,pt,…,pn}
25、事件特征的约束条件为:
26、
27、
28、w=te-ts
29、其中,ths为上升事件功率阈值,the为事件下降功率阈值,tth为事件扫描时间阈值,ts为窗口开启时间,te为窗口结束时间,ns为设备开启时长阈值,ne为设备关断时长阈值,w为窗口大小。
30、优选地,所述步骤3具体包括:
31、步骤3.1,统计不同种类的家庭设备的样本数量,判断每一种种类的样本数量与其他种类的样本数量是否均衡;
32、步骤3.2,若所述种类的样本数量不均衡,获取所述种类下的所有样本的特征向量;
33、步骤3.3,基于所述种类下的所有样本的特征向量,进行样本扩张,直到满足所述种类的样本数量与其他种类的样本数量均衡为止。
34、优选地,所述步骤3.1具体包括:
35、对不同种类的家庭设备的样本数量按照从小到大进行排序,得到序列[n1,n2,…,nc,…,nc];
36、
37、其中,c为种类数量,nc为种类为c的家庭设备的样本数量,[]为取整符号,σ,ε均为介于0至1之间的固定实数;
38、若上式成立,则判定为种类为c的样本数量与其他种类的样本数量不均衡,否则判定为种类为c的样本数量与其他种类的样本数量均衡。
39、优选地,步骤3.3中样本扩张具体包括:
40、选取所述种类下的其中一个样本的特征向量x;
41、计算所述种类下的所有其他样本的特征向量与特征向量x的欧氏距离,从小到大排序,以选出特征向量x的k近邻,依次为x(1),x(2),…,x(k),k为固定值;
42、计算出新的特征向量xnew:
43、xnew=x+rand(0,1)×(x(i)-x)
44、其中,rand(0,1)为随机数公式,i=1,2,…,k;
45、将新的样本xnew也纳入到所述种类的样本之内。
46、优选地,还包括步骤4,根据均衡化后的样本,利用支持向量机,对待辨识样本进行负荷辨识。
47、优选地,所述步骤4具体包括:
48、步骤4.1,均衡化的样本包括待辨识样本与测试样本,将待辨识样本划分为正样本x1,将测试样本划分为负样本x2;
49、步骤4.2,根据划分后的正、负样本,构造超平面将正、负样本分开;
50、步骤4.3,基于超平面对每一个待辨识样本xr进行辨识,若满足:
51、w·xr+b≤0
52、则判定待辨识样本xr为x1类;否则,为x2类,从而完成负荷辨识。
53、优选地,所述步骤4.2具体包括:
54、超平面为:
55、h:w·x+b=0
56、其中,参数w与b如下式所示:
57、
58、式中,εi为第i个样本的惩罚因子,ξ为惩罚参数,xi为第i个样本的特征向量,n1为正样本x1的样本个数,n2为正样本x2的样本个数,用f函数表达样本特征向量距离超平面h距离的倒数。
59、一种基于smote函数的非介入式负荷辨识数据样本均衡化系统,包括:电流电压采集模块、逻辑计算模块、样本扩张模块;
60、其中,电流电压采集模块用于分别采样每一个样本的负荷波形,提取出对应的电压电流信号;
61、逻辑计算模块用于计算各个样本的有功功率、无功功率与谐波有效值,并得到每一个样本对应的启停特征;
62、样本扩张模块用于均衡化不同种类的家庭设备的样本数量。
63、一种终端,包括处理器及存储介质;所述存储介质用于存储指令;
64、所述处理器用于根据所述指令进行操作以执行所述方法的步骤。
65、计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述方法的步骤。
66、本发明的有益效果在于,与现有技术相比,本发明增加了数据均衡化处理的环节,以居民家庭中全年使用频率相对较低的加湿器为例,冬季供暖时居民家庭每天使用1-2小时,在春夏秋三个季节基本不用使用,如果没有数据均衡化处理,那么在春、夏、秋三季辨识时,加湿器的负荷特征会淹没在电热水壶、热水器等高频使用电器,因为数据样本质量与负荷辨识准确度直接相关,所以本发明对数据样本,尤其是使用频率低的负荷进行数据均衡化处理,能够提升不同的负荷辨识分类器低频率使用电器的敏感性,从而提升负荷辨识准确性。