一种光伏设备异常检测方法与流程

文档序号:36237775发布日期:2023-12-01 20:41阅读:58来源:国知局
一种光伏设备异常检测方法与流程

本发明涉及光伏,尤其涉及一种光伏设备异常检测方法。


背景技术:

1、当前,过度开采与使用化石能源导致生态环境急剧恶化,严重威胁人类的生存和社会的可持续发展。化解能源和生态环境危机的有效方法之一就是减少对化石能源的过度依赖,积极开展可再生能源的利用,其中,光伏发电以其独特的发电特性取得了广泛地发展与应用。光伏电站装机容量也在不断扩大,增加了光伏厂站的运维难度,以及对光伏设备的智能化管理水平的新需求。

2、然而,数据量的暴增使得仅依靠常规信息化手段已很难发现光伏板运行的状况。且由于光伏组件长期工作在比较恶劣的环境中,各种故障情况难以避免,使得实际使用寿命大为降低。一旦光伏组件发生运行故障,直接危害是损坏组件本身,降低发电效率;间接危害则是造成整个光伏发电系统不能正常运行或对电网造成影响,进而酿成重大经济损失。

3、中国专利申请号为201610875514.0的方法公开了一种光伏电站功率异常数据辨识方法及装置,通过考虑光伏电站现场环境,结合光伏电站功率数据的影响因素对功率曲线进行聚类,以对光伏电站的异常数据进行准确的辨识。但现有技术中,仅仅是对光伏数据是否异常进行二分类的识别,而没有更深一步的对光伏数据的异常种类进行辨别和预测,即针对光伏数据的异常检测的精度还达不到需求。


技术实现思路

1、有鉴于此,本发明提出了一种光伏设备异常检测方法,通过对光伏数据进行异常判定、异常种类判定、异常影响范围标记,而得到更精确的异常检测结果,以提高光伏数据的检测和应用效率。

2、本发明的技术方案是这样实现的:本发明提供了一种光伏设备异常检测方法,包括

3、s1获取经预处理的光伏样本数据;

4、s2构建异常检测模型,利用光伏样本数据对异常检测模型进行迭代训练:

5、s21异常检测模型包括异常检测模块、异常分类模块和异常识别模块;

6、s22将光伏样本数据输入异常检测模块,得到异常样本数据;

7、s23确定异常样本数据的异常种类,根据异常分类模块基于异常种类对异常样本数据进行判定,得到第一类异常样本数据、第二类异常样本数据、第三类异常样本数据和第四类异常样本数据;

8、s24基于异常识别模块分别对第一类异常样本数据、第二类异常样本数据、第三类异常样本数据和第四类异常样本数据进行识别,得到第一类异常样本数据、第二类异常样本数据、第三类异常样本数据和第四类异常样本数据的影响范围;

9、s25重复步骤s22-s24,对异常检测模型迭代训练,直至达到迭代停止条件,得到训练后的异常检测模型;

10、s3获取新的光伏数据,利用训练后的异常检测模型对新的光伏数据进行异常检测,得到异常结果。

11、在以上技术方案的基础上,优选的,步骤s22包括:

12、异常检测模块包括特征提取单元、特征转换单元和特征分类单元;

13、将光伏样本数据输入特征提取单元进行特征提取,得到第一时序特征;

14、利用特征转换单元中的角场转换算法将第一时序特征转换为时序特征图;

15、根据特征分类单元对时序图进行异常检测,基于异常检测算法得到时序特征图的异常分数,根据异常分数对时序特征图进行分类得到异常样本数据。

16、在以上技术方案的基础上,优选的,角场转换算法为:

17、记第一时序特征为x={x1,x2,...,xn},采用归一化方法将第一时序特征归一化为[-1,1]的特征归一值x':

18、

19、式(1)中,i∈[1,n],max(x)为第一时序特征中特征值的最大值,min(x)为第一时序特征中特征值的最小值;

20、将特征归一值编码为角余弦,将时间戳编码为半径,得到用三角函数表示的第二时序特征

21、

22、式(2)中,i∈[1,n],ti为时间戳,n为调整极坐标跨度的常数因子,θ为余弦角,r为半径;

23、利用格拉姆角场对第二时序特征进行映射,得到时序特征图g,其中,格拉姆角场为:

24、

25、式(3)中,i为单位向量[1,1,...,1],为的转置向量。

26、在以上技术方案的基础上,优选的,所述基于异常检测算法得到时序特征图的异常分数,根据异常分数对时序特征图进行分类得到异常样本数据,包括:

27、对时序特征图按照公式(4)进行计算,得到第一异常分数s1:

28、

29、式中,为衡量第二时序特征与第一时序特征之间相似程度的分数值,为衡量第二时序特征与第一时序特征之间差异的潜在分数值,a为控制两种分数值相对重要性的加权参数;

30、对时序特征图采用孤立森林算法得到第二异常分数s2:

31、

32、式中,m为第二时序特征的个数,为从孤立树的根节点到叶子节点所经过的边的数量,h为调和数,为第二时序特征在一批孤立树种的路径长度的期望;

33、将第一异常分数和第二异常分数分别归一化为[0,1]的数值后取算术平均数,作为第二时序特征最终的异常分数s,其中,归一化公式为:

34、

35、式中,j=1or 2,为第一异常分数或第二异常分数的归一化结果,min(sj)为第二时序特征的最小的异常结果,max(sj)为第二时序特征的最大的异常结果;

36、根据第一异常分数和第二异常分数对应的均衡分值设定目标阈值t,将最终的异常分数s与目标阈值t做比较,若s≥t,则将对应的光伏样本数据判为异常样本数据,若s<t,则将对应的光伏样本数据判为正常样本数据。

37、在以上技术方案的基础上,优选的,目标阈值t的设置方法为:

38、步骤一、初始设置一个阈值集合t={t1,t2,...,tc},该阈值集合中包括c个阈值;

39、步骤二、在阈值集合t中选取tm作为当前阈值,m=[1,c],根据当前阈值将光伏样本数据进行二分类,二分类结果为每个光伏样本数据为预测异常样本或预测正常样本;

40、步骤三、计算二分类结果的均衡值fm:

41、

42、式中,rm为召回率,pm为精确率,其中,tp指的是实际为正常样本而预测也为正常样本的数量,fp指的是实际为异常样本而预测为正常样本的数量,fp指的是实际为正常样本而预测为异常样本的数量;

43、步骤四、重复步骤二和步骤三,得到阈值集合中所有阈值对应的均衡值将c个均衡值中数值最大的阈值作为目标阈值t。

44、在以上技术方案的基础上,优选的,步骤s23包括:

45、s231异常种类包括第一类异常种类、第二类异常种类、第三类异常种类和第四类异常种类;

46、s232针对第一类异常种类、第二类异常种类、第三类异常种类和第四类异常种类分别设定第一类判定规则、第二类判定规则、第三类判定规则和第四类判定规则;

47、s233基于异常种类对异常样本数据进行判定:

48、根据第一类判定规则对异常样本数据进行第一类异常种类的判定,若该异常样本数据符合第一类判定规则,则将该异常样本数据纳入第一类异常样本数据;

49、根据第二类判定规则对异常样本数据进行第二类异常种类的判定,若该异常样本数据符合第二类判定规则,则将该异常样本数据纳入第二类异常样本数据;

50、根据第三类判定规则对异常样本数据进行第三类异常种类的判定,若该异常样本数据符合第三类判定规则,则将该异常样本数据纳入第三类异常样本数据;

51、根据第四类判定规则对异常样本数据进行第四类异常种类的判定,若该异常样本数据符合第四类判定规则,则将该异常样本数据纳入第四类异常样本数据。

52、在以上技术方案的基础上,优选的:

53、第一类异常种类指的是异常样本数据中存在预设比例的重复数据,对应的第一类判定规则为预设比例≥10%;

54、第二类异常种类指的是异常样本数据中存在超限的数据,对应的第二类判定规则为异常样本数据中的数据最大值大于数据上限值;

55、第三类异常种类指的是异常样本数据的发电效率低,对应的第三类判定规则为kmax<0.8且k95<0.8,其中,kmax=当前异常样本数据的数据最大值/其它异常样本数据的数据最大值,k95=当前异常样本数据的百分位数/其它异常样本数据的百分位数;

56、第四类异常种类指的是除去第一类异常种类、第二类异常种类和第三类异常种类后的异常样本数据的异常类别统称,对应的第四类判定规则为该异常样本数据不符合第一判定规则、不符合第二判定规则和不符合第三判定规则。

57、在以上技术方案的基础上,优选的,步骤s24包括:

58、将第一类异常样本数据的异常分数进行百分比转换,得到第一类异常样本数据的异常百分值,将第一类异常样本数据的异常百分值作为第一类异常样本的影响范围;

59、将第二类异常样本数据的异常分数进行百分比转换,得到第二类异常样本数据的异常百分值,将第二类异常样本数据的异常百分值作为第二类异常样本的影响范围;

60、将第三类异常样本数据的电流-电压关系常数、电量值和功率值分别作为表格的列数据,形成数据表格,数据表格的每一行为一个第三类异常样本数据的电流-电压关系常数、电量值和功率值,对数据表格以行为单位进行数据分析,结合第三类异常样本数据的异常分数进行百分比转换,得到第三类异常样本数据的异常百分值,将第三类异常样本数据的异常百分值作为第三类异常样本的影响范围;

61、将第四类异常样本数据的电流-电压关系常数、电量值和功率值分别作为表格的列数据,形成数据表格,数据表格的每一行为一个第四类异常样本数据的电流-电压关系常数、电量值和功率值,对数据表格以行为单位进行数据分析,结合第四类异常样本数据的异常分数进行百分比转换,得到第四类异常样本数据的异常百分值,将第四类异常样本数据的异常百分值作为第四类异常样本的影响范围。

62、在以上技术方案的基础上,优选的,步骤s25中,迭代停止条件为模型损失函数趋于平稳,其中,模型损失函数为:

63、ltotal=l1+l2+l3 (8)

64、式中,ltotal为模型损失函数,l1为第一损失函数,l2为第二损失函数,l3为第三损失函数;

65、第一损失函数的计算公式为:

66、

67、式中,e表示期望,||·||1为l1范数,||·||2为l2范数,xi为第一时序特征,为第二时序特征;

68、第二损失函数的计算公式为:

69、

70、式中,y代表经过logsoftmax运算后的值,c代表真实的异常种类,u表示预测的异常种类;

71、第三损失函数的计算公式为:

72、

73、式中,z代表经过logsoftmax运算后的值,e代表真实的影响范围,v表示预测的影响范围。

74、在以上技术方案的基础上,优选的,步骤s1中,光伏样本数据的预处理包括数据清洗,数据清洗包括空值处理、死数据删除、零数据删除和重复数据删除。

75、本发明的方法相对于现有技术具有以下有益效果:

76、(1)通过搭建一个集异常检测、异常分类、异常识别于一体的异常检测模型,对光伏数据进行深度的细分类,并标记异常数据的影响范围,从而提高了异常检测的准确性,并且能够辅助判断光伏数据的有效利用率。

77、(2)采用convgru卷积操作来捕获时空特征,对于时序图像能够有更好的时序处理,所提取的第一时序特征具有更丰富的信息,从而提高异常检测的精度。(3)通过角场转换算法将原始的时间序列数据转换为沿对角线对称的第二时序特征,由于第二时序特征蕴含时间相关信息,因此根据格拉姆角场来对时间序列进行重构。根据这样的方式将光伏时序数据映射为二维图像,在利用模型对其进行异常检测时是十分有利的,将提高异常检测的准确度。

78、(4)通过最优化准则来寻找目标阈值t,能够找到最优的阈值,通过异常分数和目标阈值的比较来判定正常样本和异常样本,能增加异常分类的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1