本发明涉及一种基于ecod(empirical cumulative distribution basedoutlier detection,ecod)的台区光伏线损率异常检测方法与装置,属于计算机、智能电网。
背景技术:
1、光伏并网发电系统把光伏发电系统与常规电网相连,则容易引起局部的潮流分布变化,从而对配电网线损率造成一定影响。实际使用过程中难免造成配电线路损耗问题,对供电造成明显影响。若能对光伏接入的配电线路的线损率进行有效计算和分析,将对开展光伏产业并网配电研究具有较好的经济价值。但对光伏接入配电线路的线损率进行有效计算和分析,会涉及到以下问题需要解决:
2、(1)光伏线损率与光伏发电的特征重要性关系分析;
3、(2)如何通过台区光伏发电和用电数据集,计算光伏线损率的异常分数判定光伏线损率是否异常。
技术实现思路
1、本发明的目的在于提供一种基于ecod的台区光伏线损率异常检测方法与装置,通过台区光伏线损数据集计算光伏线损率的异常分数判定光伏线损率是否异常。
2、为实现上述目的,本发明采取的技术方案如下:
3、一种基于ecod的台区光伏线损率异常检测方法,其包括如下步骤:
4、步骤一、收集数据:收集的多光伏样本数据集包含n个光伏样本,每个光伏样本包含d个特征;
5、步骤二、计算相关系数:分别计算光伏线损数据与数据集中特征的相关系数,相关系数计算公式如式(1)所示:
6、
7、其中x表示某个特征,y表示光伏线损率,e(x)计算如式(2)所示:
8、
9、其中n为样本数量,xk为第k个样本的值,pk为第k个样本出现的概率;
10、步骤三、选择特征:根据相关系数计算结果对特征按照相关性强弱进行排序,选择出与光伏线损率其中相关性较强的特征,用于光伏线损率异常的特征选择;
11、步骤四、ecod电力负荷异常检测:通过计算样本的最终异常分数来确定样本是否为异常。
12、进一步的,所述光伏样本的特征包括时间、辐照度、温度、湿度、风向、风速、压强、实际辐照度以及供电量。
13、进一步的,所述步骤四中,首先计算每个特征的左尾经验累积分布函数与右尾经验累积分布函数;之后计算每个特征的样本偏度系数,通过聚合每个样本的左尾经验累积分布函数计算左尾的异常分数,聚合每个样本的右尾经验累积分布函数计算右尾的异常分数;再根据维度的偏度系数自动决定使用左尾经验累积分布函数还是右尾经验累积分布函数,得到聚合后的自动异常分数;最后,从三个异常分数值中选出最大的异常分数。
14、更进一步的,计算特征的经验累积分布函数过程如下:
15、输入的光伏发电数据有n个采样点和d个特征;表示,第i个光伏发电采样点xi的第j维的特征的值;假设t是光伏发电数据x中某一采样点的数据,那么采样点第j个维度的特征的左尾经验累积分布函数的计算如式(3)所示;第j个特征的右尾经验累积分布函数的计算如式(4)所示:
16、
17、
18、更进一步的,获得光伏发电数据采样点的特征的左尾经验累积分布函数与右尾经验累积分布函数之后,计算特征的样本偏移系数,第j个特征的样本偏度系数γj计算如式(5)所示:
19、
20、当γj<0,可以认为左尾的点更加偏远;当γj>0时,认为右尾的点更加偏远;如果数据来自连续随机变量,则γj=0,概率为0。
21、更进一步的,光伏发电数据采样点xi的左尾异常分数计算如式(6)所示,右尾异常分数计算如式(7)所示:
22、
23、
24、更进一步的,通过偏移系数计算样本自动异常分数得到光伏发电数据采样点的自动异常分数,光伏发电数据采样点xi的自动异常分数如式(8)所示:
25、
26、更进一步的,对每个光伏发电数据采样点选择其左尾异常分数、右尾异常分数和自动异常分数中最大的值作为采样点的最终异常分数,采样点xi最终的异常分数如式(9)所示。
27、oi=max{oleft-only(xi),oright-only(xi),oauto(xi)} (9)
28、最终得到伏发电数据中所有采样点的异常分数o=(o1,o2,...,on),通过异常分数判断伏发电采样点是否异常。
29、更进一步的,异常分数越高则所处百分位数越高,越可能是异常值;将异常分数与预设的阀值比较,超过阀值的异常分数的采样点为异常。
30、一种基于ecod的台区光伏线损率异常检测装置,其包括:
31、数据采集模块,用于采集光伏样本数据集;
32、数据分析模块,用于计算光伏线损数据与数据集中特征的相关系数;
33、特征选择模块,用于选择合适的特征用于光伏线损率异常检测;
34、异常检测模块,通过计算样本的最终异常分数来确定样本是否为异常。
35、本发明的有益效果如下:
36、(1)使用经验累积分布函数进行光伏线损率离群点检测,使用估计数据的经验累积分布函数,避免了参数调优的问题,并在不做任何参数假设的情况下逼近整个分布;
37、(2)通过估计数据的经验累积分布函数避免了维数诅咒,即使数据点数量和维度有所增加,也能实现对光伏线损率的有效检测;
38、(3)ecod在维度基础上评估光伏线损率离群行为,可以使用ecod作为维度贡献的可解释检测器。通过绘制光伏线损率异常值图,直观地表示数据点每个维度对异常分数的影响,从而可以直接观察到光伏线损率数据内部的判定状态,具有良好的解释性。
1.一种基于ecod的台区光伏线损率异常检测方法,其特征在于包括如下步骤:
2.根据权利要求1所述的一种基于ecod的台区光伏线损率异常检测方法,其特征在于,所述光伏样本的特征包括时间、辐照度、温度、湿度、风向、风速、压强、实际辐照度以及供电量。
3.根据权利要求1所述的一种基于ecod的台区光伏线损率异常检测方法,其特征在于,所述步骤四中,首先计算每个特征的左尾经验累积分布函数与右尾经验累积分布函数;之后计算每个特征的样本偏度系数,通过聚合每个样本的左尾经验累积分布函数计算左尾的异常分数,聚合每个样本的右尾经验累积分布函数计算右尾的异常分数;再根据维度的偏度系数自动决定使用左尾经验累积分布函数还是右尾经验累积分布函数,得到聚合后的自动异常分数;最后,从三个异常分数值中选出最大的异常分数。
4.根据权利要求3所述的一种基于ecod的台区光伏线损率异常检测方法,其特征在于,计算特征的经验累积分布函数过程如下:
5.根据权利要求3或4所述的一种基于ecod的台区光伏线损率异常检测方法,其特征在于,获得光伏发电数据采样点的特征的左尾经验累积分布函数与右尾经验累积分布函数之后,计算特征的样本偏移系数,第j个特征的样本偏度系数γj计算如式(5)所示:
6.根据权利要求5所述的一种基于ecod的台区光伏线损率异常检测方法,其特征在于,光伏发电数据采样点xi的左尾异常分数计算如式(6)所示,右尾异常分数计算如式(7)所示:
7.根据权利要求6所述的一种基于ecod的台区光伏线损率异常检测方法,其特征在于,通过偏移系数计算样本自动异常分数得到光伏发电数据采样点的自动异常分数,光伏发电数据采样点xi的自动异常分数如式(8)所示:
8.根据权利要求7所述的一种基于ecod的台区光伏线损率异常检测方法,其特征在于,对每个光伏发电数据采样点选择其左尾异常分数、右尾异常分数和自动异常分数中最大的值作为采样点的最终异常分数,采样点xi最终的异常分数如式(9)所示。
9.根据权利要求7所述的一种基于ecod的台区光伏线损率异常检测方法,其特征在于,异常分数越高则所处百分位数越高,越可能是异常值;将异常分数与预设的阀值比较,超过阀值的异常分数的采样点为异常。
10.一种基于ecod的台区光伏线损率异常检测装置,其特征在于包括: