本申请属于能源领域中的大数据分析,尤其涉及光伏场站性能综合评估的方法及系统。基于机器学习对光伏场站性能综合评估属于能源领域中的大数据分析。这个主要利用机器学习算法来分析和挖掘光伏场站的运行数据,以综合评估其性能和预测输出能力。通过使用机器学习模型,可以对光伏场站的关键参数、天气信息以及其他相关数据进行分析和建模,以得出对场站性能的综合评估结果。这样的综合评估可以为光伏场站的日常运维和性能优化提供参考,并帮助实现更高的发电效率和能源产出。
背景技术:
1、层次聚类算法是一种无监督学习方法,用于将样本集合划分为不同的聚类或簇。它的主要特点是可以根据数据点之间的相似性来构建一个层次化的聚类结构。每个样本都以逆变器为单位,逆变器所记录的故障类型、发生故障的频次、故障持续的时间、清洁指数、单个逆变器的pr(能效比,performance ratio)、单个逆变器的pba(可利用率productionbased availability)以及气象数据等组成特征矩阵。基本原理就是从单个样本开始,每次迭代将最相似的两个聚类或样本点合并。该算法的输入是一个相似度矩阵,用于计算数据点之间的相似性。
2、现有技术通常是基于专家经验和规则制定的,依赖于熟练的操作和人工判断。并且在未进行优化的层次聚类算法对样本中的奇异值非常敏感,导致在相似度计算中出现较大误差。另一方面基于机器学习的方法则是通过对大量真实数据的学习和分析,自动学习数据之间的相互关系,并推断隐藏在数据中的规律和模式。并且传统方法通常基于固定的规则和指标对光伏场站的性能进行评估,缺乏灵活性和适应性。而机器学习方法可以根据实际数据情况自适应地生成模型,提高模型的泛化能力灵活地处理不同类型的光伏场站性能的评估。
技术实现思路
1、本发明的目的在于克服现有技术缺陷,提出了光伏场站性能综合评估的方法及系统。
2、为了实现上述目的,本发明提出了一种光伏场站性能综合评估的方法,所述方法包括:
3、收集光伏场站的运行数据构成特征矩阵,进行优化处理;
4、对优化处理后特征矩阵的数据进行聚类合并,输出聚类结果;
5、对聚类结果进行连续性特征变量的离散化处理,根据预先定义的分段函数,结合特征权重进行累加,得到待评估的光伏场站综合评估分数;
6、所述优化处理包括:
7、对特征矩阵中的数据进行清洗和预处理;
8、针对特征矩阵的不同特征引入权重,对预处理后的特征矩阵进行加权处理;
9、通过马氏距离度量减少特征矩阵中的异常值。
10、优选的,所述光伏场站的运行数据包括:场站故障类型、场站发生故障的频次、故障持续的时间、场站清洁指数、场站pr、场站pba和气象数据。
11、优选的,所述场站清洁指数的获取方法为:
12、将时间、实际发电量、辐射强度、环境温度和风速输入预先建立的理论发电量预测模型,得到理论发电量;再结合逆变器的运行状态计算得到积灰损失电量,进而得到场站清洁指数,所述运行状态包括故障、检修、限电和停机状态。
13、优选的,所述场站pr为通过电站实际发电量、日照小时和电站实际装机容量计算得到。
14、优选的,所述场站pba通过实发电量和总损失电量计算得到。
15、优选的,所述预处理包括对清洗后的数据根据下式进行标准化处理,将数据规范化到相同的尺度或范围:
16、
17、其中,x是一种数据样本,μ、σ分别为均值和标准差,z是x标准化后的数值。
18、优选的,所述针对特征矩阵的不同特征引入权重,包括:
19、根据光伏场站的特性和目标,选择关键特征进行提取和转换;
20、根据对关键特征进行相关性分析,引入权重,以降低奇异值的影响,同时采用马氏距离来度量相似性,通过结合数据的协方差矩阵,以减小异常值对计算距离的影响:
21、
22、其中,pi和pj分别为两个关键特征,dist(pi-pj)表示马氏距离,s表示协方差矩阵,t表示转置。
23、另一方面,本发明提出了一种光伏场站性能综合评估系统,所述系统包括:
24、优化处理模块,用于收集光伏场站的运行数据构成特征矩阵,进行优化处理;
25、聚类合并模块,用于对优化处理后特征矩阵的数据进行聚类合并,输出聚类结果;和
26、评估输出模块,用于对聚类结果进行连续性特征变量的离散化处理,根据预先定义的分段函数,结合特征权重进行累加,得到待评估的光伏场站综合评估分数;
27、所述优化处理模块的包括:
28、预处理单元,用于对特征矩阵中的数据进行清洗和预处理;
29、加权处理单元,用于针对特征矩阵的不同特征引入权重,对预处理后的特征矩阵进行加权处理;
30、相似度计算单元,用于通过马氏距离度量减少特征矩阵中的异常值。
31、与现有技术相比,本发明的优势在于:
32、本发明对光伏场站的关键参数、天气信息以及其他相关数据进行分析和建模,以得出对场站性能的综合评估结果。这样的综合评估可以为光伏场站的日常运维和性能优化提供参考,并帮助实现更高的发电效率和能源产出。与单一方法相比,融合多种减小异常值影响的方法具有更全面的考量,能够综合考虑数据的多个方面,从而更加准确地分析数据并得出更可靠的聚类结果。这种方法可以更好地应对数据中存在的异常值和噪声,提高了聚类的鲁棒性和可靠性。由于考虑了多个因素,融合多种方法的层次聚类可以更好地适应不同数据特点并发现隐藏的规律和模式。
1.一种光伏场站性能综合评估的方法,所述方法包括:
2.根据权利要求1所述的光伏场站性能综合评估的方法,其特征在于,所述光伏场站的运行数据包括:场站故障类型、场站发生故障的频次、故障持续的时间、场站清洁指数、场站pr、场站pba和气象数据。
3.根据权利要求2所述的光伏场站性能综合评估的方法,其特征在于,所述场站清洁指数的获取方法为:
4.根据权利要求2所述的光伏场站性能综合评估的方法,其特征在于,所述场站pr为通过电站实际发电量、日照小时和电站实际装机容量计算得到。
5.根据权利要求2所述的光伏场站性能综合评估的方法,其特征在于,所述场站pba通过实发电量和总损失电量计算得到。
6.根据权利要求1所述的光伏场站性能综合评估的方法,其特征在于,所述预处理包括对清洗后的数据根据下式进行标准化处理,将数据规范化到相同的尺度或范围:
7.根据权利要求1所述的光伏场站性能综合评估的方法,其特征在于,所述针对特征矩阵的不同特征引入权重,包括:
8.一种光伏场站性能综合评估的系统,其特征在于,所述系统包括: