风机输出功率预测方法和系统

文档序号:28114627发布日期:2021-12-22 14:29阅读:187来源:国知局
风机输出功率预测方法和系统

1.本发明涉及电力领域,特别是涉及一种风机输出功率预测方法和系统。


背景技术:

2.新能源中风能的利用对经济发展有很大的促进作用,因此,准确地预测风力发电机的输出功率具有重要的意义。传统的风电功率预测方法是使用制造商提供的风机功率曲线(wtpc)模型。但该模型只显示风机输出功率与风速的关系,没有考虑风向、转子速度和桨距角等因素的影响,具有一定的局限性。此外,在预测风机输出功率的过程中,需要采用多变量回归模型,但影响风机输出功率的因素在不同的风电场环境中是不同的,如何针对于不同的影响因素下风机运行特性确定多变量回归模型的输入特征,也是一个亟待解决的问题。
3.针对上述相关技术问题,目前尚未提出有效地解决方案。


技术实现要素:

4.基于此,有必要针对如何考虑不同影响因素预测风机输出功率的问题,提供一种风机输出功率预测方法和系统,该方法和系统考虑了多个重要变量、预测模型效率高以及预测结果也有较高的准确率。
5.一种风机输出功率预测方法,包括以下步骤:
6.基于最大信息系数和多元多项式回归,建立多元多项式回归模型;
7.确定测试集,利用多元多项式回归模型在测试集上对风机输出功率进行预测。
8.在其中一个实施例中,所述基于最大信息系数和多元多项式回归,建立多元多项式回归模型包括以下步骤:
9.获取第一数据集,从第一数据集中去除异常数据,得到第二数据集;
10.在第二数据集上,利用最大信息系数方法进行特征选择,得到第三数据集;
11.在第三数据集上训练多元多项式回归模型。
12.在其中一个实施例中,所述获取第一数据集,从第一数据集中去除异常数据,得到第二数据集包括以下步骤:
13.在第一数据集中基于风速和风机输出功率的特征进行采样,构建孤立树;
14.基于给定样本数和调和数,计算孤立树的平均路径;
15.基于孤立树的平均路径和样本点在一批孤立树中的路径长度的期望,计算样本点的异常分数;
16.去掉第一数据集中异常分数处于预设异常分数范围内的异常数据,得到第二数据集。
17.在其中一个实施例中,所述在第二数据集上,利用最大信息系数方法进行特征选择,得到第三数据集包括以下步骤:
18.基于每个变量与风机输出功率的互信息和限制条件,在第二数据集上计算每个变
量和风机输出功率的最大信息系数;
19.将计算出的最大信息系数与预设阈值进行比较,将最大信息系数大于预设阈值的变量组成第三数据集。
20.在其中一个实施例中,所述在第三数据集上训练多元多项式回归模型包括以下步骤:
21.基于多项式阶数和第三数据集中的特征,将风机输出功率的预测量表示为多个自变量的线性函数;
22.基于风机输出功率的预测量和风机输出功率的真实值,确定多元多项式回归模型的目标函数;
23.基于多元多项式回归模型的目标函数,采用梯度下降法求解多元多项式回归模型;
24.基于多项式阶数,计算多元多项式回归模型的平均绝对百分比误差,获取平均绝对百分比误差最小的多元多项式回归模型。
25.在其中一个实施例中,所述风机输出功率的预测量为:
[0026][0027]
其中,w0‑
w
q
是权重,且取值为常数,a
1j
a
2j
a
3j
a
4j
≤m,x1、x2、x3、x4均为第三数据集中的变量,m为多项式阶数。
[0028]
在其中一个实施例中,所述多元多项式回归模型的目标函数为:
[0029][0030]
其中,α是学习速率。
[0031]
在其中一个实施例中,还包括以下步骤:
[0032]
利用残差控制图预测测试集上的异常值。
[0033]
一种风机输出功率预测系统,包括,
[0034]
建立模块,用于基于最大信息系数和多元多项式回归,建立多元多项式回归模型;
[0035]
第一预测模块,用于确定测试集,利用多元多项式回归模型在测试集上对风机输出功率进行预测。
[0036]
在其中一个实施例中,还包括,
[0037]
第二预测模块,用于利用残差控制图预测测试集上的异常值。
[0038]
上述风机输出功率预测方法在建立多元多项式回归模型的过程中使用最大信息系数来选择影响风机输出功率的重要变量,全面的考虑了多个重要变量,解决了依靠人力分析风机输出功率的影响因素,导致分析不够全面的问题,进一步,通过多项式的方法来建模多变量与风机输出功率的关系,从而使得对风机输出功率的预测具有较高的准确率和较低的模型复杂度。
[0039]
进一步,从第一数据集中去除异常数据,得到第二数据集能够有效地消除风机输出功率预测过程中的异常数据,从而使得风机输出功率预测所使用的数据集更加有效,提高了风机输出功率预测的准确率。
[0040]
此外,在训练多元多项式回归模型的过程中,充分来了多形式的阶数以及通过计
算多元多项式回归模型的平均绝对百分比误差,获取平均绝对百分比误差最小的多元多项式回归模型,使得获得多元多项式回归模型预测效果更佳。
附图说明
[0041]
图1为风机输出功率预测方法流程示意图;
[0042]
图2为建立多元多项式回归模型的过程示意图;
[0043]
图3为使用孤立森林算法去除异常数据结果示意图;
[0044]
图4为平均绝对百分比误差(mape)随多项式阶数m变化情况示意图;
[0045]
图5为测试集d0上预测风速

风机输出功率散点示意图;
[0046]
图6为测试集d0上预测时间

风机输出功率示意图;
[0047]
图7为残差控制图;
[0048]
图8为风机输出功率预测系统结构示意图。
具体实施方式
[0049]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0050]
请参见图1,本发明实施例中公开了一种风机输出功率预测方法,包括以下步骤:
[0051]
步骤s100,基于最大信息系数和多元多项式回归,建立多元多项式回归模型。其中,使用最大信息系数(mic)来选择影响风机输出功率的重要变量,充分考虑了与风机输出功率相关的多个重要变量,解决了依靠专家分析影响因素导致的不够全面的困难,进一步,通过多项式的方法来建模多个变量与风机输出功率的关系,从而使得对风机输出功率的预测具有较高的准确率和较低的模型复杂度。此外,在建立多元多项式回归模型的过程中,还使用了孤立森林算法消除异常值,以获得更加有效的数据集。具体的,请参见图2,基于最大信息系数和多元多项式回归,建立多元多项式回归模型的过程具体包括以下步骤:
[0052]
步骤1001,初始化多项式阶数m为1,e[1]=1,e为均值符号。
[0053]
步骤1002,读入训练数据;示例性的,以某台风机额定功率为2mw(兆瓦),scada(supervisory control and data acquisition:数据采集与监视控制系统)采样时间为30s(秒),以运行13天的scada数据d1作为训练集。
[0054]
步骤1003,使用孤立森林算法去除训练集d1中的异常数据,包括以下步骤:
[0055]
首先,从训练集d1中以风速和风机输出功率为特征进行采样,构建孤立树,对孤立森林中的每棵孤立树进行测试,根据以下公式计算树的平均路径长度:
[0056]
c(n)=2h(n

1)

2(n

1)/n
[0057]
其中,c(n)为给定样本数n时孤立树的路径长度的平均值,h(i)为调和数,i∈n

1,本发明实施例中,h(i)的值可以被估计为ln(i)+0.58,但不限于此。
[0058]
然后,根据以下公式计算每个样本点的异常分数:
[0059]
[0060]
其中,e(h(x))为样本x在一批孤立树中的路径长度的期望。
[0061]
最后,去掉d1中异常分数处于预设异常分数范围内的异常数据,得到数据集d2,具体的,异常分数接近1时,被判定为异常,将去除异常值的数据集d1记为d2,从而预设异常分数范围可以为[0.99

1)等,但不限于此,[0.98

1)等也适用于本发明。进一步,详见图3中,正三角形标记的散点代表由孤立森林(100棵孤立树)标识的异常值,圆点的散点代表正常数据,记为数据集d2。可以看出,风速和风机的输出功率呈现“带状”分布。进一步如图中三个标记区域所示,区域1中的风速高于切出风速22m/s的异常值,区域2中的“欠载”异常值,区域3中的风速低于切入风速3m/s的异常值被消除。即区域1

3中的风速值均为异常值。在标准数据中,风速范围为3.02m/s(米/秒)

21.19m/s,功率范围为14kw(千瓦)

2072kw,符合实际情况,可用于风机输出功率的预测。采用孤立森林算法有效地消除风机输出功率预测过程中的异常数据(不符合标准的数据),从而使得风机输出功率预测所使用的数据集更加有效,提高了风机输出功率预测的准确率。
[0062]
步骤1004,利用最大信息系数方法进行特征选择,包括以下步骤:
[0063]
首先,在数据集d2上计算每个变量和风机输出功率的最大信息系数(mic:maximal information coefficient)),mic定义如下式:
[0064][0065]
其中,i(d2,x,y)表示在数据集d2上变量x和输出功率y的互信息,b(n)=n
0.6
,b为数据总量,n为样本数。进一步,|x||y|<b(n)为建立模型过程中的限制条件。
[0066]
然后,将计算出的最大信息系数与预设阈值进行比较,将最大信息系数大于预设阈值的变量组成数据集d3。其中,mic越大变量对输出功率影响越大,mic的取值范围为[0,1],本发明实施例中,mic的预设阈值设定为0.1,但不限于此,0.2等也适用于本发明,然后选择mic大于阈值的变量,在步骤1002的示例性数据下,结果如下表所示:
[0067]
表1 mic特征选择结果
[0068][0069]
即在数据集d2上,上述mic选择的4个变量(即4个特征):风速、转速、桨距角、风向组成数据集d3。在风机输出功率建模的过程中使用最大信息系数来选择影响风机输出功率的重要变量,全面的考虑了与风机输出功率相关的多个重要变量,解决了人为分析风机输出功率的影响因素,导致分析不够全面的问题。
[0070]
本发明实施例中,数据集d3中还包括风机输出功率。
[0071]
步骤1005,基于多项式阶数和数据集d3中的特征,将风机输出功率的预测量表示为多个自变量的线性函数,具体的,将第i个样本的预测量表示为q个自变量(j=1,2,...,q)的线性函数,如下式:
[0072][0073]
其中,w0_w
q
是权重,且w0‑
w
q
的取值为常数,a
1j
a
2j
a
3j
a
4j
≤m,x1、x2、x3、x4均为第三数据集中的变量,即为步骤1004中选取的4个特征,m为多项式阶数。
[0074]
步骤1006,基于风机输出功率的预测量和风机输出功率的真实值,确定多元多项式回归模型的目标函数。其中,所述多元多项式回归模型的目标函数为:
[0075][0076]
其中,y
(i)
表示真实值,n表示样本数,n>0,n为整数,w可以取w0_w
q
中的一个。
[0077]
步骤1007,基于多元多项式回归模型的目标函数,采用梯度下降法求解多元多项式回归模型;具体的,求解的目标是找到一系列参数w
k
,使目标函数最小,从而即采用下式的梯度下降法求解权值w
k

[0078][0079]
其中,α是学习速率,本发明实施例中,α取0.01,但不限于此,0.01,0.001等数值也适用于本发明。
[0080]
步骤1008,基于多项式阶数,计算多元多项式回归模型的平均绝对百分比误差,具体的,多元多项式回归模型的平均绝对百分比误差(mape)公式如下:
[0081][0082]
其中,n为样本数,y
(i)
为真实值,为预测值,
[0083]
进一步,m的值从1变化到10,合适的m值是使模型预测的平均绝对百分比误差(mape)最小对应的阶数。
[0084]
步骤1009,判断m是否小于11,若小于,则m=m+1,e[m]=mape,返回步骤1005,若大于或等于11,则输出mape最小的m阶多元多项式回归模型。本发明实施例中,训练过程mape随阶数m变化,如图4所示。当多项式阶数m从1变为6过程中,多元多项式回归模型的误差逐渐减小。当m=6时,多元多项式回归模型预测的mape最小为0.08,此时多元多项式回归模型是最佳的。当多项式阶数m>6时,误差逐渐增加。同时,多元多项式回归模型更复杂,训练时间更长。最后,确定适当的m值为6。在训练多元多项式回归模型的过程中,充分来了多项式的阶数以及通过计算多元多项式回归模型的平均绝对百分比误差,获取平均绝对百分比误差最小的多元多项式回归模型,使得获得多元多项式回归模型预测效果更佳。
[0085]
步骤s200,确定测试集,利用多元多项式回归模型在测试集上对风机输出功率进行预测。具体的,利用s100建立好的4变量6阶多项式回归模型,在测试集d0上进行风机输出功率预测,结果如图5和图6所示,其中,测试集d0为当前未来3小时的scada数据。图5是测试集d0上预测风速

风机输出功率散点图,圆点表示实际的scada数据,正三角形表示预测值。
预测结果显示风速和功率呈“带状”关系。图6是测试集d0上预测时间

风机输出功率的示意图,实线表示真实数据值,虚线表示预测值。从两个图中可以看出,该模型可以预测大多数功率值。
[0086]
本实施例中,所述风机输出功率预测方法还包括以下步骤:利用残差控制图预测测试集上的异常值。残差定义为预测功率值与真实scada数据之差,训练集d3上残差的均值e=0,残差σ=28.6。记cl=e,lcl=e

3σ,ucl=e+3σ,残差服从正态分布,99.73%的残差值集中在(lcl,ucl),即下次预测残差小于lcl=

86或大于ucl=86,将其视为异常值,异常值检测结果如图7残差控制图所示,图中,由上而下,第一条直线为ucl,第二条直线为cl,第三条直线为lcl,波动线为功率残差,图中明显的3个功率残差峰值被识别为异常值。
[0087]
请参见图8,本发明实施例中还介绍了一种能够执行上述方法的风机输出功率预测系统,包括建立模块、第一预测模块和第二预测模块,其中,建立模块用于基于最大信息系数和多元多项式回归,建立多元多项式回归模型;第一预测模块用于确定测试集,利用多元多项式回归模型在测试集上对风机输出功率进行预测,第二预测模块用于利用残差控制图预测测试集上的异常值。
[0088]
上述风机输出功率预测系统在建立多元多项式回归模型的过程中使用最大信息系数来选择影响风机输出功率的重要变量,全面的考虑了多个重要变量,解决了依靠工作人员分析风机输出功率的影响因素,导致不够全面的问题,进一步,通过多项式的方法来建模多变量与风机输出功率的关系,从而使得对风机输出功率的预测具有较高的准确率和较低的模型复杂度。
[0089]
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1