本发明涉及窃电检测,具体涉及一种基于改进的寄生捕食优化算法的窃电辨识方法及系统。
背景技术:
1、随着社会进步和经济的高速发展,用户用电量需求不断增大,近些年来,尽管电力企业采取了一系列方法来避免用户异常用电行为的发生。但是仍有些用户采用更加隐蔽、高科技的手段、智能化的设备和更加专业的方式进行窃电、漏电等异常用电行为,大大增加了供电企业对异常用电行为的稽查难度,而且异常用电行为发生的比例越来越高、越来越普遍,造成的社会影响和危害巨大。高级量测体系的逐渐完善和用户侧智能电表安装普及率提升,使得供电企业积累了大量的用电数据,利用大数据、数据挖掘等技术对用电数据进行准确的挖掘和分析为窃电检测提供了新的思路和方法。
2、国内外研究人员基于用电数据进行窃电行为的检测做了大量的研究,并提出了多种解决方法,现有的基于用电数据进行窃电行为检测的方法主要是基于统计学、机器学习和聚类算法等。然而,已有方法还存在一些问题。首先,现有窃电检测方法主要采用单一算法,面对大量的用电数据时存在处理时间长、判断不准确、信息冗余等问题;其次,利用机器学习方法在进行窃电检测时,很难获得足够多的带结果标签的训练数据,加上现有用于窃电检测的数据也来源不足,一般仅限于用户电量数据;最后,仅通过对用户负荷数据聚类来对用户用电行为进行分析也只能锁定“嫌疑”窃电用户,且用户用电行为也会因外出、天气、电价等因素影响较大,需要工作人员进行现场排查,导致了电力企业对异常用电行为判别效率较低,而且也造成了大量用电数据的浪费,致使电力企业不能通过分析这些数据挖掘出对其有价值的信息;针对上述问题本发明提出了一种基于改进的寄生捕食优化算法的窃电辨识方法,通过模糊c均值聚类算法初步确定窃电用户,通过改进的寄生捕食优化算法进一步确定窃电用户。
技术实现思路
1、本发明的目的在于提供一种基于改进的寄生捕食优化算法的窃电辨识方法为电力企业提供新的窃电检测方法。
2、本发明的技术方案:一种基于改进的寄生捕食优化算法的窃电辨识方法,步骤如下:
3、步骤s1:从电力用户用电采集系统中导出台区所有用户历史时刻的用电数据并且对用电数据进行预处理;所述用电数据包括电量、负荷、电压和电流;
4、步骤s2:提取每个用户的典型日负荷曲线,对每个用户的典型日负荷曲线进行分类,形成每类用户的典型日负荷曲线,再对用户用电行为进行分析;
5、步骤s3:提取用户待检测时间段的日负荷曲线和所属类的典型日负荷曲线,采用欧式距离和皮尔逊相关系数计算匹配度,将低于匹配度阈值的用户初步确定为窃电用户;
6、步骤s4:将步骤s3初步确定的窃电用户,构造窃电目标检测函数计算一组窃电系数序列,使用改进的寄生捕食优化算法进行检测,得出一组最优窃电系数序列,设置窃电系数阈值,进一步确定窃电用户。
7、进一步,预处理依次为异常数据剔除处理、缺失数据填充处理、重复数据过滤处理、数据标准化处理。
8、进一步,利用指数加权平均方法提取每个用户的典型日负荷曲线,公式为:
9、;
10、其中,为t时刻用户平均预测负荷值, 为t时刻用户的真实负荷值,为权重。
11、进一步,通过模糊c均值聚类算法对每个用户的典型日负荷曲线进行分类,方法如下:
12、将a个用户n个时刻的典型日负荷数据集形成的用户负荷矩阵划分为个簇;
13、构造目标函数,目标函数定义为:
14、;
15、其中,表示为聚类能产生最小的簇数,为相似分类矩阵,为聚类中心,为第a个用户隶属于第个簇的隶属度,为第a个用户与第个簇的聚类中心的距离,为模糊加权指数;
16、第a个用户隶属于第个簇的隶属度的计算公式如下:
17、;
18、其中,表示第j类用户与第k个簇的聚类中心的距离。
19、聚类中心的计算公式如下:
20、;
21、其中,为第k个聚类中心;
22、进一步,用户待检测时间段的日负荷曲线和所属类的典型日负荷曲线的匹配度公式如下:
23、;
24、;
25、其中,为用户待检测时间段的日负荷曲线和所属类的典型日负荷曲线的匹配度, 和为权重系数, 为用户待检测时间段的日负荷曲线与用户待检测时间段负荷特征曲线的皮尔逊相关系数,为用户待检测时间段中时刻n的负荷值与用户待检测时间段负荷特征曲线时刻n对应的值之间的欧式距离;
26、用户待检测时间段的日负荷曲线与用户待检测时间段负荷特征曲线的皮尔逊相关系数的计算公式如下:
27、;
28、其中,为台区所有用户待检测时间段中时刻n的负荷值的平均值,为台区所有用户待检测时间段负荷特征曲线时n对应的值的平均值;
29、给用户待检测时间段的日负荷曲线和所属类的典型日负荷曲线的匹配度设置一个阈值,若用户的匹配度小于这个阈值则初步判断为窃电用户。
30、进一步,构造窃电目标检测函数,窃电目标检测函数定义为:
31、;
32、其中,b为初步判断为窃电用户的个数,为第b个初步判断为窃电用户的窃电系数,为台区正常线损率,为所有被初步判断为窃电用户的电量数据,为台区对所有被初步判断为窃电用户的供电量数据。
33、进一步,改进的寄生捕食优化算法中分为筑巢、寄生和捕食阶段,分别更新鸟巢的位置,不同阶段鸟巢的位置更新规则不同,步骤如下:
34、步骤s41:种群初始化,初始化的公式如下:
35、;
36、其中,为种群初始解,为下限,为上限,是从0到1的均匀高斯分布中抽取的随机变量;
37、在种群初始化中引入circle混沌映射,初始化的公式更新为:
38、;
39、其中,为求余函数,为引入circle混沌映射后种群初始解;
40、步骤s42:计算种群中各个鸟巢的位置的适应度值,并按照数值大小进行排序筛选当前种群内最优与最劣的鸟巢的位置的适应度值,所有鸟巢的位置的适应度值可以表示为:
41、;
42、其中,为所有鸟巢的位置的适应度值向量即窃电系数向量,为单个鸟巢的位置的适应度值,为第u个鸟巢在第d个维度的位置;
43、步骤s43:筑巢阶段被评估为模拟乌鸦通过两个状态飞行;第一个状态是通过生成随机的候选乌鸦,为乌鸦生成一个新的鸟巢位置,公式如下:
44、;
45、其中,为飞行步长,为第i个乌鸦新的鸟巢的位置,为第i个乌鸦旧的鸟巢的位置,为随机生成的乌鸦鸟巢位置,为乌鸦的种群数量;
46、第二个状态是通过重新初始化被违反的维度,从先前的状态修改被违反的维度如下所示:
47、;
48、其中,为超出维度的第i个乌鸦的鸟巢的位置,为超出维度最小的第i个乌鸦的鸟巢的位置,为超出维度最大的第i个乌鸦的鸟巢的位置,为0到1的随机变量。
49、在第一个状态中加入曲线自适应权重,曲线自适应权重的计算公式如下:
50、;
51、其中,为当前迭代次数;是最大迭代次数;是调整系数;为曲线自适应权重的最大值,为曲线自适应权重的最小值;
52、乌鸦的鸟巢的位置公式更新为:
53、;
54、步骤s44:寄生阶段杜鹃的鸟巢位置表示为:
55、;
56、;
57、;
58、其中,为第i个杜鹃鸟旧的鸟巢的位置,为第i个杜鹃鸟新的鸟巢的位置,为服从高斯分布的随机变量,为二进制矩阵,和均为随机生成的鸟巢位置,为给出的递增因子;
59、在杜鹃的鸟巢位置公式中增加柯西变异扰动策略,杜鹃的鸟巢位置公式更新为:
60、;
61、其中,为区间内满足柯西分布的随机相量;
62、步骤s45:捕食阶段猫开始追踪猎物,更新猫在各个维度上的速度,公式如下:
63、;
64、其中,为更新后第i个猫在第d个维度上新的速度,为第i个猫在第d个维度上的速度,r为[0,1]范围内的随机数,c为常数,为适应度值最高的猫在第d个维度的位置,为第i个猫在第d个维度的位置;
65、检查更新速度猫的速度是否超过最大速度范围,如果新的速度大于最大速度,则将新的速度设置为等于限制速度;
66、更新第i个猫在第d个维度的位置,公式如下:
67、;
68、其中,为更新后第i个猫在第d个维度的位置;
69、在第i个猫在第d个维度的位置中加入反向学习策略,公式如下:
70、;
71、;
72、;
73、其中,为适应度值最高的猫在第d个维度的位置的反向解,ub为猫种群的上界,lb为猫种群的下界,r是服从标准均匀分布的1xd的随机矩阵,为信息交换控制参数;
74、在筑巢阶段和捕食阶段分别加入曲线自适应权重和柯西变异扰动策略后,通过贪婪规则比较新旧两个鸟巢的位置的适应度值,若新的鸟巢的位置的适应度大于旧的鸟巢的位置的适应度则用新的鸟巢的位置代替旧的鸟巢的位置,将所有适应度大于旧的鸟巢的位置的新的鸟巢的位置的适应度值按照大小排序并输出得到最优适应度,若新的鸟巢的位置的适应度值小于旧的鸟巢的位置的适应度值则返回步骤s43。
75、本发明提供了一种基于改进的寄生捕食优化算法的窃电辨识系统,包括数据采集与预处理模块、用户用电行为分析模块、窃电用户初步确定模块和窃电用户确定模块;数据采集与预处理模块用于获取用户用电数据并且对用电数据进行预处理;用户用电行为分析模块用于提取每个用户的典型日负荷曲线,并且使用模糊c均值聚类算法对每个用户的典型日负荷曲线进行分类;窃电用户初步确定模块用于提取用户待检测时间段的日负荷曲线和所属类的典型日负荷曲线并计算匹配度,对低于匹配度阈值的用户初步确定为窃电用户;窃电用户确定模块用于改进的寄生捕食优化算法生成一组最优窃电系数序列,进一步确定窃电用户。
76、本发明还提供一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述一种基于改进的寄生捕食优化算法的窃电辨识方法。
77、本发明还提供一种电子设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,其特在在于,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行一种基于改进的寄生捕食优化算法的窃电辨识方法。
78、本发明的有益效果:本发明采用采用欧式距离和皮尔逊相关系数计算匹配初步确定窃电用户,使用改进的寄生捕食优化算法获取窃电系数并且按照数值大小进行排序进一步确定窃电用户减少了工作人员的工作强度,提高效率,节省物力财力;引入circle混沌映射初始化种群,提高初始解的质量,增强改进的寄生捕食优化算法的全局搜索能力;在乌鸦第一个状态飞行中加入曲线自适应权重,迭代前期保持缓慢下降,中期下降速度加快,后期再次减缓下降速度,使改进的寄生捕食优化算法在迭代初期具有较强的全局搜索能力,在迭代后期能够有效地协调局部收敛和陷入局部最优两者的关系。