1.本发明涉及风力发电技术领域,尤其涉及风速预测模型的训练方法、装置、电子设备和存储介质。
背景技术:2.风电是当前我国风能综合利用方式中最为重要的一种形式,提高风速预测的准确性是解决大规模风电开发过程中遇到的问题的最有效途径。准确的风速预测能够有效缓解风电并网给电力系统带来的不利因素,提高发电量和降低损失,同时提高风电在电力交易市场的竞争力,精准的风电场风速预测对风力发电系统具有非常重要的意义。
3.风速由于受地形、大气环境多种因素的影响呈现复杂非线性的特征,目前,基于深度学习的时间序列预测技术发展迅速,更适用于短临天气预测,而日前的风速预测技术仍以物理模型为主,即基于数值天气预报模式(numerical weather prediction,nwp)的风速预报数据,进行模式后处理,改善风速预报准确性,常用的方法有mos、统计订正、机器学习等订正方法。
4.由于大气混沌的特性,数值天气模式的预报偏差主要来源于初始场的误差和模式本身的误差,虽然通过后处理技术能够在一定程度上降低这种偏差,但这种偏差对风力发电预测的影响仍然是很明显,尤其是大风过程中的出力变化。
技术实现要素:5.本发明提供风速预测模型的训练方法、装置、电子设备和存储介质,用以解决现有技术中单个天气模式的预报存在误差导致风速预测不精确的缺陷。
6.本发明提供一种风速预测模型的训练方法,包括:根据风电场的历史实测风速数据和与历史实测风速数据对应的风电场出力数据,得到观测风速;获取至少两个天气模式对应的至少两组预报数据,并根据每组预报数据分别构建气象特征;将观测风速和至少两组气象特征输入lasso回归模型,得到至少两个初步预测值;对每个初步预测值进行偏差修正,得到至少两组预测风速;将预测风速作为初始风速预测模型的输入特征进行训练,获得风速预测模型。
7.根据本发明提供的一种风速预测模型的训练方法,lasso回归模型内置k折交叉验证策略,将观测风速和至少两组气象特征输入lasso回归模型,得到至少两个初步预测值,包括:将观测风速分别与每组气象特征进行k折交叉验证,得到至少两个初步预测值。
8.根据本发明提供的一种风速预测模型的训练方法,对每个初步预测值进行偏差修正,得到至少两组预测风速,包括:以气象特征和初步预测值作为特征,以初步预测值和历史实测风速数据的偏差作为标签,采用xgboost进行模型训练,得到每组天气模式的预测偏差;基于每组天气模式的预测偏差及其对应的初步预测值,得到每组的预测风速。
9.根据本发明提供的一种风速预测模型的训练方法,获得风速预测模型之后,还包括:根据风电场的历史实测风速数据和与历史实测风速数据对应的风电场出力数据,进行
风速数据的质量控制,从而获得对应时段的气象特征作为测试集;将测试集输入风速预测模型,获得预测结果。
10.根据本发明提供的一种风速预测模型的训练方法,根据风电场的历史实测风速数据和与历史实测风速数据对应的风电场出力数据,得到观测风速之前,包括:删除风电场的历史实测风速数据中的异常数据。
11.根据本发明提供的一种风速预测模型的训练方法,初始风速预测模型为dbn模型,将预测风速作为初始风速预测模型的输入特征进行训练,包括:将预测风速作为dbn模型的输入特征后,对dbn模型进行深度学习网络的预训练和微调,得到网络模型参数;基于网络模型参数对初始风速预测模型进行调整,获得风速预测模型。
12.根据本发明提供的一种风速预测模型的训练方法,根据每组预报数据分别构建气象特征,包括:根据每个天气模式的预报数据获取对应的气象因子,其中气象因子包括风电场在预设高度的水平风速风量和垂直风速风量以及近地面层的温度、湿度和气压;根据气象因子分别构建对应天气模式的气象特征,其中,气象特征包括特征矩阵。
13.本发明还提供一种风速预测模型的训练装置,包括:观测风速模块,用于根据风电场的历史实测风速数据和与历史实测风速数据对应的风电场出力数据,得到观测风速;天气模式模块,用于获取至少两个天气模式对应的至少两组预报数据,并根据每组预报数据分别构建气象特征;lasso回归模型模块,用于将观测风速和至少两组气象特征输入lasso回归模型,得到至少两个初步预测值;预测风速模块,用于对每个初步预测值进行偏差修正,得到至少两组预测风速;风速预测模型模块,用于将预测风速作为初始风速预测模型的输入特征进行训练,获得风速预测模型。
14.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如上述任一种风速预测模型的训练方法。
15.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种风速预测模型的训练方法。
16.本发明提供的风速预测模型的训练方法、装置、电子设备和存储介质,通过获取至少两个天气模式对应的至少两组预报数据,并根据每组预报数据分别构建气象特征,将观测风速和至少两组气象特征输入lasso回归模型得到至少两个初步预测值;对每个初步预测值进行偏差修正,得到至少两组预测风速,将至少两组预测风速作为初始风速预测模型的输入特征进行训练,最后获得两个天气模式融合后的风速预测模型。通过上述方式,本发明基于初始风速预测模型,利用深度神经网络进行多数值预报模式的深度融合,风速预测模型可以提供更准确的预报风速。
附图说明
17.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
18.图1是本发明风速预测模型的训练方法一实施例的流程示意图;图2是本发明风速预测模型的训练方法一实施例的原理框图;
图3是本发明风速预测模型的训练装置一实施例的结构示意图;图4是本发明电子设备一实施例的结构示意图。
具体实施方式
19.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
20.本发明提供一种风速预测模型的训练方法,请参阅图1,图1是本发明风速预测模型的训练方法一实施例的流程示意图。在本实施例中,风速预测模型的训练方法包括步骤s110~s150,各步骤具体如下:s110:根据风电场的历史实测风速数据和与历史实测风速数据对应的风电场出力数据,得到观测风速。
21.获取需要进行风速预测的风电场的历史实测风速数据,以及该历史实测风速数据对应的风电场出力数据。并根据风电场的历史实测风速数据和对应的出力数据,得到观测风速,以作为预测标签。
22.可选地,根据风电场的历史实测风速数据和与历史实测风速数据对应的风电场出力数据,得到观测风速之前,包括:对风电场的历史实测风速数据进行质量控制,删除风电场的历史实测风速数据中的异常数据。其中异常数据可以是不合理的异常值和/或采集异常的值。
23.举个例子,不合理的异常值可以是连续3个以上相同的风速值、风速小于0的值和风速大于40m/s的值。采集异常的值是指风电场在非限电非检修时段的风速对应的出力值超出出力曲线加上
∆
p以上的值,其中
∆
p是设定阈值。
24.优选地,可以先去除历史实测风速数据中的不合理异常值,即连续3个以上相同的风速值,风速小于0的值以及风速大于40m/s的值。在此基础上,用非限电非检修时段的风电场出力数据对风速进行二次校验。设定阈值
∆
p,将历史实测风速数据对应的出力值超出出力曲线加上
∆
p以上的值判定为采集异常,直接剔除。
25.通过对获取的风电场的历史实测风速数据和与历史实测风速数据对应的出力数据进行预处理,可以提高风速预测的准确度。
26.s120:获取至少两个天气模式对应的至少两组预报数据,并根据每组预报数据分别构建气象特征。
27.由于大气混沌的特性,数值天气模式的预报偏差主要来源于初始场的误差和模式本身的误差。基于此,本实施例采用多个天气模式的数据进行融合,从而消除单一天气模式提供的数据带来的误差。
28.其中,天气模式对应的预报数据可以来源于不同的预报系统,如:欧洲中期天气预报中心(european centre for medium-range weather forecasts)的综合预测系统(integrated forecasting system)、美国环境预报中心的全球预报系统(global forecasting system),或区域数值天气模式的预报产品。
29.可选地,根据每组预报数据分别构建气象特征,包括:
根据每个天气模式的预报数据分别获取气象因子,其中气象因子包括风电场在预设高度的水平风速风量和垂直风速风量以及近地面层的温度、湿度和气压;根据气象因子分别构建对应天气模式的气象特征,其中气象特征包括特征矩阵。
30.获取对应的各类数值天气模式的预报数据,分别构建气象特征,,其中,n为数值天气预报数据的个数;d是样本个数。
31.风电场预设高度可以选择10m、30m、50m、80m、100m、120m、150m、950hpa高度、900hpa高度、850hpa高度、800hpa高度、700hpa高度、600hpa高度、500hpa高度。
32.即,气象因子包括10m的水平风速风量和垂直风速风量、30m的水平风速风量和垂直风速风量、50m的水平风速风量和垂直风速风量、80m的水平风速风量和垂直风速风量、100m的水平风速风量和垂直风速风量、120m的水平风速风量和垂直风速风量、150m的水平风速风量和垂直风速风量、950hpa高度的水平风速风量和垂直风速风量、900hpa高度的水平风速风量和垂直风速风量、850hpa高度的水平风速风量和垂直风速风量、800hpa高度的水平风速风量和垂直风速风量、700hpa高度的水平风速风量和垂直风速风量、600hpa高度的水平风速风量和垂直风速风量、500hpa高度的水平风速风量和垂直风速风量、以及近地面层温度、湿度、气压等气象要素。近地面层的高度通常在50-100m左右。
33.需要说明的是,以上预设高度只是本实施例给出例子,在本发明的其他实践方法中,还可以根据实际情况选择适合的预设高度以获得预设高度的水平风速风量和垂直风速风量。
34.s130:将观测风速和至少两组气象特征输入lasso回归模型,得到至少两个初步预测值。
35.由上述步骤可知,每个天气模式对应的气象特征个数较多,基于此,本实施例中将采用lasso回归模型进行处理,得到每组的预测风速。
36.lasso回归模型是一种压缩估计,它通过构造一个惩罚函数得到一个较为精炼的模型,使得它压缩一些回归系统,即强制系数绝对值之和小于某个固定值;同时设定一些回归系数为零。因此保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。
37.lasso是在rss最小化的计算中加入一个范数作为罚约束。范数的好处是调整参数当充分大时,可以把某些待估系数精确地收缩到零。其中,调整参数可以通过交叉验证法确定。具体地,通过对调整参数的给定值,进行交叉验证,选取交叉验证误差最小的调整参数值,然后按照得到的调整参数值,用全部数据重新拟合模型即可。
38.可选地,lasso回归模型内置k折交叉验证策略,将观测风速和至少两组气象特征输入lasso回归模型,得到至少两个初步预测值,包括:将观测风速分别与每组气象特征进行k折交叉验证,得到至少两个初步预测值。
39.k折交叉验证是将数据集等比例划分成k份,以其中的一份作为测试数据,其他的k-1份数据作为训练数据。k折交叉验证只有实现k次才算完成的一次,即k折交叉验证是把实验重复做了k次,每次实验都是从k个部分选取一份不同的数据部分作为测试集,剩下的k-1个当做训练集,最后把得到的k个实验结果进行平分。
40.s140:将观测风速和至少两组气象特征输入lasso回归模型,得到至少两个初步预测值。
41.以气象特征和初步预测值作为特征,以初步预测值和历史实测风速数据的偏差作为标签,采用xgboost进行模型训练,得到每组天气模式的预测偏差;基于每组天气模式的预测偏差及其对应的初步预测值,得到每组的预测风速。
42.xgboost是一个加法模型,在每一步迭代中只优化当前步中的子模型。xgboost支持并行。先对每个特征进行分块(block)并排序,使得在寻找最佳分裂点的时候能够并行化计算。这个结构加速了split finding的过程,只需要在建树前排序一次,后面节点分裂时直接根据索引得到梯度信息。
43.s150:将预测风速作为初始风速预测模型的输入特征进行训练,获得风速预测模型。
44.本实施例中采用dbn模型作为初始风速预测模型,进行多模式数据的融合,具体地,将预测风速作为初始风速预测模型的输入特征进行训练,包括:将预测风速作为dbn模型的输入特征后,对dbn模型进行深度学习网络的预训练和微调,得到网络模型参数;基于网络模型参数对初始风速预测模型进行调整,获得风速预测模型。
45.dbn模型可以认为是由多层无监督的rbm网络和一种有监督的反向传播bp网络组成的。dbn模型的训练可以分为预训练和微调,预训练是指无监督下的自由训练;微调是认为操控或是引入调节技术进行更进一步的调节。
46.rbm网络 ( restricted boltzmann machines,受限波尔兹曼机)是一种根植于统计力学的随机神经网络。这种神经网络层内无连接,层间全连接。它的神经元是随机神经元,神经元的输出只有两种状态(未激活、激活),一般用二进制的0和1表示,状态的取值根据统计法则决定。
47.bp网络是一种按误差反向传播(简称误差反传)训练的多层前馈网络,其算法称为bp算法,它的基本思想是梯度下降法,利用梯度搜索技术,以期使网络的实际输出值和期望输出值的误差均方差为最小。基本bp算法包括信号的前向传播和误差的反向传播两个过程。即计算误差输出时按从输入到输出的方向进行,而调整权值和阈值则从输出到输入的方向进行。正向传播时,输入信号通过隐含层作用于输出节点,经过非线性变换,产生输出信号,若实际输出与期望输出不相符,则转入误差的反向传播过程。
48.预训练采用逐层训练,低一层的输出作为上一层的输入。微调是有监督地对最后一层bp网络进行训练,结果比较产生的误差逐层向后传播,对整体权值进行微调。预训练过程可以看作bp网络权值的初始化,这里代替了之前bp网络权值随机初始化,进而避免了训练时间过长以及陷入内部极小值的问题。
49.可选地,预训练和微调的训练过程包括:1)通过经验公式m = 2n + 1确定最佳隐藏层单元数m,n为输入层单元数。
50.2) 由输入层输入网络结构,产生一个向量v,通过权值w映射到隐藏层,获得新的隐藏单元h。
51.3) 以隐藏层激活单元和输入数据层输入之间的相关性差别为主要依据,更新权值,无监督训练每一层rbm网络,并将结果作为高一层的输入。
52.4) 预训练结束后,将rbm的输出特征向量作为bp网络的输入特征向量,并输入相应的标签数据,反向传播网络自顶向下将信息传播给每一层rbm,进行bp网络训练。
53.5) 微调整个dbn网络,进行有监督的训练至收敛,最终得到网络中的权重和偏置。
54.在一些实施例中,获得风速预测模型之后,风速预测模型训练方法,还包括:根据风电场的历史实测风速数据和与历史实测风速数据对应的风电场出力数据进行风速数据的质量控制,从而获得对应时段的气象特征作为测试集;将测试集输入风速预测模型,获得预测结果。
55.测试集可以用来检验最终选择最优的模型的性能如何。当样本数量过少,需要留在总样本中留少部分做测试集。然后对其余n个样本采用k折交叉验证法,将样本打乱,然后均分成k份,轮流选择其中k-1份训练,剩余的一份做验证,计算预测误差平方和,最后把k次的预测误差平方和再做平均作为选择最优模型结构的依据。特别的k取n,就是留一法。
56.k折交叉验证用于风速预测模型调优,可以找到风速预测模型泛化性能最优的超参值。找到后,在全部训练集上重新训练风速预测模型,并使用独立测试集对风速预测模型性能作出最终评价,当满足预设条件时,确定风速预测模型训练完成。k折交叉验证使用了无重复抽样技术的好处:每次迭代过程中每个样本点只有一次被划入训练集或测试集的机会。
57.需要说明的是,本实施例中可以在两处用到测试集。一次是采用lasso回归模型进行k折交叉验证,分别得到各模式数据集的预测值。在测试集中进行预报时,可采用各折交叉验证的模型预测值的平均值作为测试集的预测值。一次是将测试集经过二次修正的预测风速,代入训练好的dbn模型,得到多模式融合后风速预测。
58.本实施例提供了一种基于深度学习网络的多模式融合的风速预测模型训练方法,通过获取至少两个天气模式对应的至少两组预报数据,并根据每组预报数据分别构建气象特征,将观测风速和至少两组气象特征输入lasso回归模型并进行k折交叉验证和偏差修正,得到至少两组预测风速,将至少两组预测风速作为dbn模型的输入特征进行训练,最后获得两个天气模式融合后的风速预测模型,以提供更准确的预报风速,解决了单一数值天气模式带来的预报偏差。
59.本发明至少需要两个天气预报系统来带不同的天气模式。请参阅图2,图2是本发明风速预测模型的训练方法一实施例的原理框图。
60.其中,天气模式可以包括第一天气模式、第二天气模式
……
第n天气模式。具体地:获取第一天气模式对应的第一预报数据(即数值天气预报1),并根据第一预报数据构建第一气象特征;获取第二天气模式对应的第二预报数据(即数值天气预报2),并根据第二预报数据构建第二气象特征;
……
获取第n天气模式对应的第n预报数据(即数值天气预报n),并根据第n预报数据构建第n气象特征。
61.根据第一气象特征和观测风速进行k折交叉验证和偏差修正,得到第一天气模式对应的第一预测风速;根据第二气象特征和观测风速进行k折交叉验证和偏差修正,得到第二天气模式对应的第二预测风速;
……
根据第n气象特征和观测风速进行k折交叉验证和偏差修正,得到第n天气模式对应的第n预测风速。
62.将第一预测风速、第二预测风速
……
第n预测风速输入dbn模型进行训练,获得多模式融合的风速预测模型。
63.风速误差模型是采用xgboost进行模型训练,得到每组天气模式的预测偏差
,并基于每组天气模式的预测偏差及其对应的初步预测值,得到每组二次修正的预测风速。其中,。
64.需要说明的是,数值天气预报与天气模式对应,本领域技术人员可以根据实际情况选择数值天气预报的个数n。
65.下面对本发明提供的风速预测模型的训练装置进行描述,下文描述的风速预测模型的训练装置与上文描述的风速预测模型的训练方法可相互对应参照。
66.请参阅图3,图3是本发明风速预测模型的训练装置一实施例的结构示意图。在本实施例中,风速预测模型的训练装置300包括观测风速模块310、天气模式模块320、lasso回归模型模块330、预测风速模块340和风速预测模型模块350。具体地:观测风速模块310,用于根据风电场的历史实测风速数据和与历史实测风速数据对应的风电场出力数据,得到观测风速。
67.天气模式模块320,用于获取至少两个天气模式对应的至少两组预报数据,并根据每组预报数据分别构建气象特征。
68.lasso回归模型模块330,用于将观测风速和至少两组气象特征输入lasso回归模型,得到至少两个初步预测值。
69.预测风速模块340,用于对每个初步预测值进行偏差修正,得到至少两组预测风速。
70.风速预测模型模块350,用于将预测风速作为初始风速预测模型的输入特征进行训练,获得风速预测模型。
71.在一些实施例中,lasso回归模型模块330用于:将观测风速分别与每组气象特征进行k折交叉验证,得到至少两个初步预测值。
72.在一些实施例中,预测风速模块340,用于:以气象特征和初步预测值作为特征,以初步预测值和历史实测风速数据的偏差作为标签,采用xgboost进行模型训练,得到每组天气模式的预测偏差;基于每组天气模式的预测偏差及其对应的初步预测值,得到每组的预测风速。
73.在一些实施例中,风速预测模型的训练装置还包括测试模块。
74.测试模块用于根据风电场的历史实测风速数据和与历史实测风速数据对应的风电场出力数据进行风速数据的质量控制,从而获得对应时段的气象特征作为测试集;将测试集输入风速预测模型,获得预测结果。
75.在一些实施例中,观测风速模块310用于:删除风电场的历史实测风速数据中的异常数据。
76.在一些实施例中,风速预测模型模块350用于:将预测风速作为dbn模型的输入特征后,对dbn模型进行深度学习网络的预训练和微调,得到网络模型参数;基于网络模型参数对初始风速预测模型进行调整,获得风速预测模型。
77.在一些实施例中,天气模式模块320用于:根据每个天气模式的预报数据获取对应的气象因子,其中气象因子包括风电场在
预设高度的水平风速风量和垂直风速风量以及近地面层的温度、湿度和气压;根据气象因子分别构建对应天气模式的气象特征,其中,气象特征包括特征矩阵。
78.本发明还提供一种电子设备,请参阅图4,图4是本发明电子设备一实施例的结构示意图。在本实施例中,电子设备400可以包括存储器(memory)410、处理器(processor)420及存储在存储器420上并可在处理器410上运行的计算机程序。处理器410执行程序时实现上述各方法所提供的风速预测模型的训练方法。
79.可选地,电子设备400还可以包括通信总线430和通信接口(communications interface)440,其中,处理器410,通信接口440,存储器420通过通信总线430完成相互间的通信。处理器410可以调用存储器420中的逻辑指令,以执行风速预测模型的训练方法,该方法包括:根据风电场的历史实测风速数据和与历史实测风速数据对应的风电场出力数据,得到观测风速;获取至少两个天气模式对应的至少两组预报数据,并根据每组预报数据分别构建气象特征;将观测风速和至少两组气象特征输入lasso回归模型,得到至少两个初步预测值;对每个初步预测值进行偏差修正,得到至少两组预测风速;将预测风速作为初始风速预测模型的输入特征进行训练,获得风速预测模型。
80.此外,上述的存储器420中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
81.另一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的风速预测模型的训练方法,其步骤和原理在上述方法已详细介绍,在此不再赘述。
82.以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
83.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
84.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;
而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。