本发明涉及通信,尤其涉及一种基于多维贡献联邦激励机制的光伏电站功率预测方法。
背景技术:
1、对光伏电站发电效率的准确评估和激励,可以更科学地对低效电站进行诊断,有利于识别导致电站低效的相关因素,从而,推动光伏行业发电效率的整体提升,促进业内合理竞争格局的形成,助推光伏行业进一步高质量发展。
2、现在的光伏发电预测多采用的是分布式中心化集体学习方法,它要求各站点统一将数据上传至中心服务器,然后中心的服务器利用各站点上传的数据再训练出合适的预测模型。这种方法的缺陷在于,数据传输过程中可能会因服务器泄露而带来数据泄密和隐私风险。
技术实现思路
1、基于上述技术背景,发明人发现,联邦学习(federated learning,fl)是一种分布式机器学习技术,能够实现分散的各电站在不向其他电站泄露隐私数据的前提下协作完成全局模型的训练,从而保护其数据隐私。在训练过程中,各电站仅需要向中央服务器发送模型参数而不传递电站的原始数据,既可以达到准确预测光伏行业平均发电效率的目的,又能够弥补集中式训练中数据隐私方面的不足。然而,各光伏电站可能不愿意无偿参与联邦学习,因为训练本地模型需要消耗大量的本地计算资源和通信资源。如果根据他们对fl的贡献进行公平的收益分配,则可以鼓励不同的客户端贡献本地数据并积极参与到联邦学习模型训练中。基于此,本申请设计了一个公平的激励机制,给予参与客户端合理的奖励,从而鼓励不同的客户端贡献本地数据并积极参与到联邦学习模型训练中。
2、具体的,本发明提出了一种多维贡献联邦激励机制的光伏电站功率预测方法,采用多维贡献奖励分配函数,将数据质量评估和模型贡献相结合,在保持公平的同时激励各光伏电站的积极参与。
3、基于上述目的,本发明提供的基于多维贡献联邦激励机制的光伏电站功率预测方法的技术方案如下:
4、确定预设区域内各个参与联邦学习模型训练的光伏电站,收集预设时间段内各个光伏电站的数据,按时间顺序采集各个光伏电站的数据构成样本数据集,光伏电站的数据包括所处地理位置的风速w、湿度h、太阳辐照度s、温度t以及对应的光伏电站发电功率p;
5、将收集的各个光伏电站的数据进行预处理,采用k平均来确定缺失值的替代值,将丢失数据补齐;为了将不同量级的数据转化为统一量度,对修正后的数据进行z-score标准化操作,对样本数据集进行分割,按照8:2或7:3的比例不打乱地分为训练集与测试集;
6、分析各光伏电站的历史发电功率和天气数据与实际发电功率数据之间的相关性来评估每个参与者的数据质量,如果相关性强,则历史发电功率和天气数据的质量高;反之,数据质量较差,其表达公式为:
7、
8、其中,xi和yi分别代表参与者i连续t天的历史发电功率及天气数据和相应的实际发电功率数据,di为参与者i的样本总数,d为所有参与者的样本总数;
9、为了将数据缩放到相似的范围并减少偏差,将每个参与者的质量贡献归一化如下:
10、
11、服务器端采用预测的神经网络模型作为基础全局模型,初始化各参数,并下发模型到各客户端,客户端接收下发的模型,用该模型参数更新自身局部模型参数,并以自身数据训练局部模型,最后将已训练完成的局部模型以及自身的数据质量贡献评估值上传至服务器端;
12、服务器端接收各客户端上传的局部模型参数和数据质量贡献评估值并进行聚合,从而更新全局模型,根据如下公式对全局模型进行更新:
13、
14、
15、其中,gi为各个参与方的数据质量贡献度,w为已更新后模型参数,wi为各个参与者上传的本地模型参数;
16、从每个参与者局部模型贡献的角度出发,对数据进行了评估,为了准确地评估每个参与者在联邦学习过程中的贡献,每个参与者将利用本地数据训练出局部模型后,再根据其局部模型预测连续t天的光伏发电功率,并将结果与实际光伏发电功率进行比较,以计算对称平均绝对百分比误差smape,smape是预测和时间序列分析中常用的评价度量,它通过比较时间序列的实际值和预测值来衡量模型预测的准确性,由于smape度量产生的值范围很广(0%到200%),对其进行归一化修正,以确保其结果始终落在0到100%的范围内,以便于后续的计算,采用修正后smape值计算参与者i的局部模型的发电功率预测误差:
17、
18、其中,表示参与者i在t时刻的实际发电功率,表示参与者i在t时刻的本地模型的预测结果;
19、计算全局模型对参与者i的发电功率的预测误差:
20、
21、其中,表示采用全局模型预测的参与者i在t时刻的发电功率;
22、进而可以得到局部模型和全局模型的精度:
23、
24、
25、最后,计算出参与者j局部模型对联邦学习的贡献为:
26、
27、归一化:
28、其中,代表参与者i通过参加联邦学习训练从其他参与者的贡献中获得的利益;
29、设rdata和rmodel分别表示数据质量和模型贡献的总回报,,参与者i的数据质量奖励ri和模型贡献奖励mi分别为:
30、
31、
32、本发明的技术方案中,首先构建联邦学习框架,各光伏电站仅需要向中央服务器发送模型参数而不传递电站的原始数据,既可以达到准确预测光伏行业平均发电效率的目的,又能够弥补集中式训练中数据隐私方面的不足。即服务器在不获取光伏电站数据的前提下对各个电站的发电功率进行预测。同时,为了激励各光伏电站积极参与联邦学习模型训练并确保公平,本发明提出了一个多维贡献奖励分配函数,该函数考虑了各光伏电站的数据质量和各光伏电站的本地模型对联邦学习全局模型的贡献。
1.基于多维贡献联邦激励机制的光伏电站功率预测方法,其特征在于,包括如下步骤: