本技术涉及电力,尤其涉及分布式光伏虚拟数据采集及特性分析方法、系统及设备。
背景技术:
1、随着全球对可再生能源需求的持续增长,分布式光伏系统已成为一个关键领域,尤其是在电力行业中。这些系统通常涉及大量的光伏电站,它们分散在地理上不同的位置,每个电站的运行条件和性能特征各不相同。因此,对分布式光伏电站进行有效的数据采集和特性分析变得至关重要。
2、传统的数据采集方法通常依赖于人工巡查和现场数据采集设备,这种方法不仅成本高昂,而且效率低下,难以适应大规模分布式光伏电站的需求。随着物联网和传感器技术的发展,越来越多的光伏电站开始采用自动化数据采集系统,但这些系统通常只关注特定类型的数据,如性能数据或环境数据,而忽略了数据之间的关联性和整体性能分析。
3、此外,由于分布式光伏电站的地理位置分散,数据传输和通信成为一个挑战。传统的数据传输方法可能无法适应不同的通信条件和带宽限制,导致数据传输延迟或丢失,进一步影响数据分析和预测的准确性。
4、在特性分析方面,目前的方法通常只关注单一因素,如电站的装机容量或历史运行数据,而忽略了多种因素的综合影响。此外,预测模型的准确性和泛化能力也受限于训练数据的质量和数量。
5、因此,开发一种能够综合考虑多种因素、自适应不同通信条件、并具有高预测准确性的分布式光伏虚拟数据采集及特性分析方法,电站性能进行准确的预测和分析。
技术实现思路
1、本技术的目的在于提供分布式光伏虚拟数据采集及特性分析方法、系统及设备,实现数据采集的效率和准确性,数据传输的高效性和稳定性以及提高预测模型的准确性和适应性。
2、本技术的目的采用以下技术方案实现:
3、本技术提供分布式光伏虚拟数据采集及特性分析方法,所述方法包括:
4、s1、获取目标采集区域信息,基于目标采集区域信息的聚类分析结果划分子区域,对区域内的光伏电站信息进行评分,获得第一评分,根据评分结果确定子区域内的标杆电站;
5、s2、设置传感器采集标杆电站的数据,并将采集的数据传输至数据处理平台;根据数据评分结果和所述第一评分结果确定数据传输顺序;根据所述数据评分结果、实时带宽以及通信延迟,调整采样频率;
6、s3、通过标杆电站的数据建立多种预测模型,对区域内其它光伏电站的性能进行预测;针对每项预测目标,获得基于多种预测模型的第一预测结果;将多个第一预测结果进行加权平均作为该预测目标的最终预测结果;
7、s4、定期获取其它光伏电站的实际数据;将实际数据与预测结果对比;根据对比结果更新预测模型以及每种预测模型的权重。
8、进一步地,所述分布式光伏虚拟数据采集及特性分析方法,所述s1包括:
9、获取目标采集区域信息;其中,所述目标采集区域信息包括地形地貌、气候信息、年平均光照;
10、对目标采集区域信息进行聚类分析;根据聚类分析结果划分子区域;
11、获取区域内的光伏电站信息,所述光伏电站信息包括装机容量、设计参数以及历史运行数据;所述历史运行数据包括发电量、效率、电站故障率以及通信故障率;
12、根据光伏电站信息确定子区域内的标杆电站。
13、进一步地,所述分布式光伏虚拟数据采集及特性分析方法,所述根据光伏电站信息确定子区域内的标杆电站,包括:
14、基于所述装机容量和设计参数对子区域内光伏电站进行分类获得第一类别;
15、根据最近一段时间内的历史运行数据,对第一类别各光伏电站的评分;获得第一评分;
16、根据评分结果选取标杆电站;选择前n个评高的光伏电站为标杆电站;
17、
18、为子区域内每个第一类别光伏电站总数,a为正整数;a<;ceiling()为向上取整;
19、其中,评分结果为:
20、
21、其中,为子区域内第一类别中第i个光伏电站最终评分,为子区域内第一类别中第i个光伏电站日均发电量归一化处理结果;为子区域内第一类别中第i个光伏电站日均发电效率归一化处理结果;为子区域内第一类别中第i个光伏电站的电站故障率归一化处理结果;为子区域内第一类别中第i个光伏电站通信故障率归一化处理结果,w1、w2、w3、w4为权重系数。
22、进一步地,所述分布式光伏虚拟数据采集及特性分析方法,所述s2包括:
23、根据数据的重要性对采样数据进行评分,获得第二评分;
24、将所述第一评分和所述第二评分进行加权平均,获得第三评分;
25、根据所述第三评分确定数据传输顺序;第三评分高的优先传输;
26、根据所述第二评分、实时带宽以及通信延迟,调整采样频率;
27、
28、其中,为调整后的采样频率,为对应数据的第二评分;为预设采样频率;为预设带宽;为预设通信延迟;为当前带宽;为当前通信延迟。
29、进一步地,所述分布式光伏虚拟数据采集及特性分析方法, s3包括:
30、获取最近一段预设时间内标杆电站的历史数据;
31、对收集到的数据进行清洗和预处理,包括处理缺失值、异常值、数据格式转换;
32、基于光照条件,通过聚类分析结合时间序列识别并划分第一分组;
33、在同一第一分组下,使用标杆电站的数据,训练多种预测模型;所述多种预测模型包括线性回归、决策树、随机森林以及神经网络;
34、针对每项预测目标,基于每种训练模型,分别获得第一预测结果;
35、将多个第一预测结果进行加权平均,获得每项预测目标的最终预测结果。
36、进一步地,所述分布式光伏虚拟数据采集及特性分析方法,将多个第一预测结果进行加权平均,获得每项预测目标的最终预测结果,包括:
37、基于预测目标,将历史数据中实际数据与对应预测数据进行对比,获得对比结果;
38、根据对比结果获得对应预测模型的权重。
39、进一步地,所述分布式光伏虚拟数据采集及特性分析方法,所述根据对比结果获得对应预测模型的权重,包括:
40、获得最近一次采集的光伏电站的实际数据;
41、将实际数据分别与对应的多个第一预测结果对比,获得多个第一差值;
42、基于同一预测目标,将区域内多个站点基于同一预测模型获得的多个第一差值进行统计分析,获得基于对应预测模型的第一差值的第一均值以及第一最大值;
43、根据所述第一均值以及第一最大值,获得对应预测模型的权重。
44、进一步地,所述分布式光伏虚拟数据采集及特性分析方法,所述根据所述第一均值以及第一最大值,获得对应预测模型的权重,包括:
45、所述对应预测模型的权重通过如下公式获取:
46、
47、其中,为基于第k个预测模型获取的第一均值;为基于第k个预测模型获取的第一最大值,、为系数,+=1。
48、本技术提供分布式光伏虚拟数据采集及特性分析系统,所述系统包括:
49、第一确定模块,用于获取目标采集区域信息,基于目标采集区域信息的聚类分析结果划分子区域,对区域内的光伏电站信息进行评分,获得第一评分,根据评分结果确定子区域内的标杆电站;
50、数据采集与传输模块,用于设置传感器采集标杆电站的数据,并将采集的数据传输至数据处理平台;根据数据评分结果和所述第一评分结果确定数据传输顺序;根据所述数据评分结果、实时带宽以及通信延迟,调整采样频率;
51、模型预测模块,用于通过标杆电站的数据建立多种预测模型,对区域内其它光伏电站的性能进行预测;针对每项预测目标,获得基于多种预测模型的第一预测结果;将多个第一预测结果进行加权平均作为该预测目标的最终预测结果;
52、优化更新模块,用于定期获取其它光伏电站的实际数据;将实际数据与预测结果对比;根据对比结果更新预测模型以及每种预测模型的权重。
53、本技术还提出一种电子设备,所述电子设备用于分布式光伏虚拟数据采集及特性分析,所述电子设备包括至少一个处理器和至少一个存储器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利本技术任一项所述方法的步骤。
54、本发明的有益效果包括:通过聚类分析将目标采集区域划分为子区域,并基于光伏电站信息的评分确定标杆电站,可以更加精准地采集数据,提高数据采集的效率和准确性。根据数据评分结果和电站评分结果确定数据传输顺序,以及根据实时带宽和通信延迟调整采样频率,可以确保数据传输的高效性和稳定性。有助于减少数据传输过程中的延迟和丢失,提高数据的可用性和可靠性。通过标杆电站的数据建立多种预测模型,并对区域内其他光伏电站的性能进行预测,可以更加全面地考虑各种影响因素,从而提高预测模型的准确性和泛化能力。同时,将多个预测结果进行加权平均作为最终预测结果,可以进一步减少预测误差,提高预测的稳定性。定期获取其他光伏电站的实际数据,并与预测结果进行对比,可以及时发现预测模型的不足和误差,从而进行必要的调整和优化,有助于提高预测模型的准确性和适应性,使其能够更好地适应不同环境和条件下的光伏电站性能预测。通过对光伏电站性能的预测和分析,为电站的运行和维护提供了有力支持。