一种风电机组的风速-发电功率数据的清洗方法及装置与流程

文档序号:21933431发布日期:2020-08-21 15:02阅读:256来源:国知局
一种风电机组的风速-发电功率数据的清洗方法及装置与流程

本发明涉及数据处理技术领域,具体涉及一种风电机组的风速-发电功率数据的清洗方法及装置。



背景技术:

风电机组功率曲线是衡量其发电性能的重要指标,基于运行数据的实际功率曲线是多种影响因素作用下的单机来流风速与发电功率关系的综合表征。

目前,由于调度指令变化、机组故障、信号中断以及人为因素的影响,风电机组的运行数据会存在大量异常数据。针对风电机组的风速-发电功率数据的清洗,现有技术中存在四分位法、最优组内方差法、密度聚类法。四分位法在异常数据占比较高时,识别效果会变差;最优组内方差法可以识别功率曲线下方异常点,但对曲线上方异常点则无法识别;密度聚类方法对于离群散点有较好的识别效果,但对于高密度呈带状分布的堆积异常点则无法识别。而且,在数据清洗过程中存在对异常数据删除不彻底或误删量大、清洗后散点呈锯齿状等欠光滑分布以及方法应用的鲁棒性差等问题。因此,现有技术中的方法,对于风电机组的风速-发电功率数据难以全面识别异常数据,进而限制了风电机组发电性能评估的准确性。



技术实现要素:

针对现有技术中的问题,本发明实施例提供一种风电机组的风速-发电功率数据的清洗方法及装置,能够至少部分地解决现有技术中存在的问题。

一方面,本发明提出一种风电机组的风速-发电功率数据的清洗方法,包括:

基于风电机组的风速-发电功率数据,绘制所述风电机组的标准化风速-发电功率散点图;

根据异常点识别模型以及所述风电机组的标准化风速-发电功率散点图剔除所述风电机组的离群噪声点,获得离群噪音点清洗后的标准化风速-发电功率散点图;其中,所述异常点识别模型是预先建立的;

根据标准化切入风速以及离群噪音点清洗后的标准化风速-发电功率散点图剔除所述风电机组的零功率异常点,获得零功率异常点清洗后的标准化风速-发电功率散点图;

根据1功率最低风速以及零功率异常点清洗后的标准化风速-发电功率散点图的1功率区间对应的标准化风速剔除所述风电机组的1功率异常点,获得1功率异常点清洗后的标准化风速-发电功率散点图;其中,1功率最低风速和1功率区间是预先获得的;

从1功率异常点清洗后的标准化风速-发电功率散点图剔除所述风电机组的恒功率堆积点,获得所述风电机组清洗后的标准化风速-发电功率散点图。

另一方面,本发明提供一种风电机组的风速-发电功率数据的清洗装置,包括:

绘制单元,用于基于风电机组的风速-发电功率数据,绘制所述风电机组的标准化风速-发电功率散点图;

第一剔除单元,用于根据异常点识别模型以及所述风电机组的标准化风速-发电功率散点图剔除所述风电机组的离群噪声点,获得离群噪音点清洗后的标准化风速-发电功率散点图;其中,所述异常点识别模型是预先建立的;

第二剔除单元,用于根据标准化切入风速以及离群噪音点清洗后的标准化风速-发电功率散点图剔除所述风电机组的零功率异常点,获得零功率异常点清洗后的标准化风速-发电功率散点图;

第三剔除单元,用于根据1功率最低风速以及零功率异常点清洗后的标准化风速-发电功率散点图的1功率区间对应的标准化风速剔除所述风电机组的1功率异常点,获得1功率异常点清洗后的标准化风速-发电功率散点图;其中,1功率最低风速和1功率区间是预先获得的;

第四剔除单元,用于从1功率异常点清洗后的标准化风速-发电功率散点图剔除所述风电机组的恒功率堆积点,获得所述风电机组清洗后的标准化风速-发电功率散点图。

再一方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施例所述风电机组的风速-发电功率数据的清洗方法的步骤。

又一方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一实施例所述风电机组的风速-发电功率数据的清洗方法的步骤。

本发明实施例提供的风电机组的风速-发电功率数据的清洗方法及装置,基于风电机组的风速-发电功率数据,绘制风电机组的标准化风速-发电功率散点图,根据异常点识别模型以及风电机组的标准化风速-发电功率散点图剔除风电机组的离群噪声点,获得离群噪音点清洗后的标准化风速-发电功率散点图,根据标准化切入风速以及离群噪音点清洗后的标准化风速-发电功率散点图剔除风电机组的零功率异常点,获得零功率异常点清洗后的标准化风速-发电功率散点图,根据1功率最低风速以及零功率异常点清洗后的标准化风速-发电功率散点图的1功率区间对应的标准化风速剔除风电机组的1功率异常点,获得1功率异常点清洗后的标准化风速-发电功率散点图,从1功率异常点清洗后的标准化风速-发电功率散点图剔除风电机组的恒功率堆积点,获得风电机组清洗后的标准化风速-发电功率散点图,依次将不同类型的异常点从风电机组的风速-发电功率数据中去除,提高了风电机组运行数据的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:

图1是本发明一实施例提供的风电机组的风速-发电功率数据的清洗方法的流程示意图。

图2是本发明一实施例提供的风电机组的标准化风速-发电功率散点图。

图3是本发明另一实施例提供的风电机组的风速-发电功率数据的清洗方法的流程示意图。

图4是本发明又一实施例提供的风电机组的风速-发电功率数据的清洗方法的流程示意图。

图5是本发明一实施例提供的第二风速区间的标准化发电功率概率密度曲线示意图。

图6是本发明另一实施例提供的第二风速区间的标准化发电功率概率密度曲线示意图。

图7是本发明一实施例提供的风电机组a的标准化风速-发电功率散点图。

图8是本发明一实施例提供的风电机组a的离群噪音点清洗后的标准化风速-发电功率散点图。

图9是本发明一实施例提供的风电机组a的零功率异常点清洗后的标准化风速-发电功率散点图。

图10是本发明一实施例提供的风电机组a的1功率异常点清洗后的标准化风速-发电功率散点图。

图11是本发明一实施例提供的风电机组a清洗后的标准化风速-发电功率散点图。

图12是本发明一实施例提供的风电机组的风速-发电功率数据的清洗装置的结构示意图。

图13是本发明另一实施例提供的风电机组的风速-发电功率数据的清洗装置的结构示意图。

图14是本发明又一实施例提供的风电机组的风速-发电功率数据的清洗装置的结构示意图。

图15是本发明一实施例提供的电子设备的实体结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。

图1是本发明一实施例提供的风电机组的风速-发电功率数据的清洗方法的流程示意图,如图1所示,本发明实施例提供的风电机组的风速-发电功率数据的清洗方法,包括:

s101、基于风电机组的风速-发电功率数据,绘制所述风电机组的标准化风速-发电功率散点图;

具体地,数据采集与监视控制(supervisorycontrolanddataacquisition,简称scada)系统可以采集风电机组的运行数据。服务器通过风电机组的运行数据可以获取到风电机组的风速-发电功率数据,然后对风电机组的风速-发电功率数据进行归一化处理,获得风电机组的标准化风速-发电功率数据,再根据风电机组的标准化风速-发电功率数据绘制所述风电机组的标准化风速-发电功率散点图。本发明实施例提供的风电机组的风速-发电功率数据的清洗方法的执行主体包括但不限于服务器。

例如,图2是本发明一实施例提供的风电机组的标准化风速-发电功率散点图,如图2所示,横坐标为风电机组的标准化风速,标准化风速的数值大于等于0且小于等于1,纵坐标为风电机组的标准化发电功率,标准化发电功率的数值大于等于0且小于等于1。由图2可以看出风电机组存在异常数据,可以将异常数据分为四种类型,从图2中自下而上依次标识为①、②、③、④,其中:标识为①的异常点为零功率异常点,零功率异常点通常是由风电机组故障、计划外停电检修或是通讯设备故障等原因产生的;标识为②的异常点为恒功率堆积点,恒功率堆积点通常是因为风电场跟踪调度计划的要求,而使风电机组的发电功率被控制在某一给定功率而产生的;标识为③的异常点为离群噪声点,离群噪声点通常由极端天气、信号传播噪声等较为随机的因素所导致;标识为④的异常点为1功率异常点,1功率异常点通常由通讯错误或是传感器故障等非运行因素所导致。

s102、根据异常点识别模型以及所述风电机组的标准化风速-发电功率散点图剔除所述风电机组的离群噪声点,获得离群噪音点清洗后的标准化风速-发电功率散点图;其中,所述异常点识别模型是预先建立的;

具体地,所述服务器可以将所述风电机组的标准化风速-发电功率散点图对应的标准化风速和标准化发电功率输入到异常点识别模型中,获得风电机组的离群噪声点,然后将风电机组的离群噪声点从所述风电机组的标准化风速-发电功率散点图中剔除,获得离群噪音点清洗后的标准化风速-发电功率散点图。其中,所述异常点识别模型是预先建立的。优先剔除离群噪声点,可以避免离群噪声点对其它三种类型的异常数据清洗时的干扰。

s103、根据标准化切入风速以及离群噪音点清洗后的标准化风速-发电功率散点图剔除所述风电机组的零功率异常点,获得零功率异常点清洗后的标准化风速-发电功率散点图;

具体地,所述服务器在获得离群噪音点清洗后的标准化风速-发电功率散点图之后,将离群噪音点清洗后的标准化风速-发电功率散点图中的每个标准化风速分别与标准化切入风速进行比较,如果所述标准化风速大于标准化切入风速,并且所述标准化风速对应的标准化发电功率等于0,那么所述标准化风速在离群噪音点清洗后的标准化风速-发电功率散点图中对应的点为零功率异常点。所述服务器将上述零功率异常点从离群噪音点清洗后的标准化风速-发电功率散点图中剔除,可以获得零功率异常点清洗后的标准化风速-发电功率散点图。

其中,风电机组的切入风速是风电机组开始并网发电的最低风速,也就是说风电机组的来流风速高于切入风速后,风电机组理应开始并网发电,发电功率会大于零。将切入风速作为判断零功率堆积点异常与否的边界风速,即:来流风速大于切入风速但发电功率依然为0的点,被判定为零功率异常点,来流风速小于等于切入风速但发电功率为0的点,被判定为零功率值正常点。切入风速经过归一化处理之后,获得标准化切入风速,风电机组的来流风速经过归一化处理之后,得到风电机组的标准化风速。风电机组的切入风速是预设的。

s104、根据1功率最低风速以及零功率异常点清洗后的标准化风速-发电功率散点图的1功率区间对应的标准化风速剔除所述风电机组的1功率异常点,获得1功率异常点清洗后的标准化风速-发电功率散点图;其中,1功率最低风速和1功率区间是预先获得的;

具体地,所述服务器在获得零功率异常点清洗后的标准化风速-发电功率散点图之后,将零功率异常点清洗后的标准化风速-发电功率散点图的1功率区间对应的每个标准化风速分别与1功率最低风速进行比较,如果1功率区间对应的所述标准化风速小于1功率最低风速,那么1功率区间对应的所述标准化风速在零功率异常点清洗后的标准化风速-发电功率散点图中对应的点为1功率异常点。所述服务器将所述风电机组的1功率异常点从零功率异常点清洗后的标准化风速-发电功率散点图中剔除,获得1功率异常点清洗后的标准化风速-发电功率散点图。其中,1功率最低风速和1功率区间是预先获得的。可理解的是,1功率异常点对应标准发电功率可以为1,也可以接近1,即略高于或略低于1。

需要说明的是,当风电机组的来流风速高于风电机组的切入风速后,风电机组的发电功率会随着来流风速的增加而增大直至达到满发功率(来流风速达到额定风速)。但在实际运行中,由于环境条件的变化以及风电机组的控制策略等因素的影响,风电机组达到满发功率的风速可能会略高于设计的额定风速。如果在来流风速显著低于额定风速时,发电功率便已达到满发功率(对应的标准化功率为1),此类风速-发电功率数据属于异常数据,通常由通讯错误或是传感器故障等非运行因素所导致,需要予以剔除。

s105、从1功率异常点清洗后的标准化风速-发电功率散点图剔除所述风电机组的恒功率堆积点,获得所述风电机组清洗后的标准化风速-发电功率散点图。

具体地,所述服务器在获得1功率异常点清洗后的标准化风速-发电功率散点图之后,会从1功率异常点清洗后的标准化风速-发电功率散点图中识别出恒功率堆积点,然后将所述风电机组的恒功率堆积点从1功率异常点清洗后的标准化风速-发电功率散点图中剔除,获得所述风电机组清洗后的标准化风速-发电功率散点图。

例如,所述服务器将恒功率堆积点对应的第一风速区间等分为多个第二风速区间;所述第一风速区间是基于1功率异常点清洗后的标准化风速-发电功率散点图预设的;然后根据每个第二风速区间的标准化发电功率以及核密度估计算法,获得每个第二风速区间的标准化发电功率概率密度曲线;接着根据每个第二风速区间的削峰极值点获得每个第二风速区间的标准化发电功率概率密度曲线对应的恒功率堆积点;其中,每个第二风速区间削峰极值点是基于每个第二风速区间的标准化发电功率概率密度曲线设定的;再将每个第二风速区间的标准化发电功率概率密度曲线对应的恒功率堆积点从1功率异常点清洗后的标准化风速-发电功率散点图去除,获得所述风电机组清洗后的标准化风速-发电功率散点图。

本发明实施例提供的风电机组的风速-发电功率数据的清洗方法,基于风电机组的风速-发电功率数据,绘制风电机组的标准化风速-发电功率散点图,根据异常点识别模型以及风电机组的标准化风速-发电功率散点图剔除风电机组的离群噪声点,获得离群噪音点清洗后的标准化风速-发电功率散点图,根据标准化切入风速以及离群噪音点清洗后的标准化风速-发电功率散点图剔除风电机组的零功率异常点,获得零功率异常点清洗后的标准化风速-发电功率散点图,根据1功率最低风速以及零功率异常点清洗后的标准化风速-发电功率散点图的1功率区间对应的标准化风速剔除风电机组的1功率异常点,获得1功率异常点清洗后的标准化风速-发电功率散点图,从1功率异常点清洗后的标准化风速-发电功率散点图剔除风电机组的恒功率堆积点,获得风电机组清洗后的标准化风速-发电功率散点图,实现依次将不同类型的异常点从风电机组的风速-发电功率数据中去除,提高了风电机组运行数据的准确性。

在上述各实施例的基础上,进一步地,所述异常点识别模型是采用具有噪声的基于密度的聚类算法建立的。

具体地,为了建立所述异常点识别模型,需要收集风电机组的历史风速-发电功率数据,并进行归一化处理,获得风电机组的标准化历史风速-发电功率数据,然后采用具有噪声的基于密度的(density-basedspatialclusteringofapplicationswithnoise,简称dbscan)聚类算法对风电机组的标准化历史风速-发电功率数据进行聚类,调整dbscan聚类算法的邻域参数:半径(eps)和最小样本数目(minpts),建立所述异常点识别模型。

其中,dbscan聚类算法能够通过样本分布的紧密程度来确定聚类的结构,将具有足够密度的区域划分为簇,利用邻域参数来刻画样本分布的紧密程度。基于邻域参数,dbscan算法将样本点分为核心点、边界点和噪音点三类。在半径eps内含有超过minpts的点为核心点;在核心点的邻域内的样本点,其半径eps内含有少于minpts的点,即为边界点;既不是核心点也不是边界点的点为噪音点,噪音点即本发明实施例中数据清洗时需要识别的离群异常点。

例如,将风电机组的过去一年的标准化风速-发电功率数据作为输入数据,通过sklearn工具包建立所述异常点识别模型,在模型的建立过程中需要调整eps和minpts。其中,sklearn工具包对常用的机器学习算法进行了封装,其中包括dbscan聚类算法。

在上述各实施例的基础上,进一步地,所述根据切入风速以及离群噪音点清洗后的标准化风速-发电功率散点图剔除所述风电机组的零功率异常点,获得功率值堆积点清洗后的标准化风速-发电功率散点图包括:

若判断获知离群噪音点清洗后的标准化风速-发电功率散点图的标准化风速大于所述标准化切入风速且所述标准化风速对应的标准化发电功率为零,则将所述标准化风速在离群噪音点清洗后的标准化风速-发电功率散点图中对应的点作为零功率异常点。

具体地,所述服务器将离群噪音点清洗后的标准化风速-发电功率散点图中的每个标准化风速分别与标准化切入风速进行比较,如果所述标准化风速大于标准化切入风速,并且所述标准化风速对应的标准化发电功率等于0,那么将所述标准化风速在离群噪音点清洗后的标准化风速-发电功率散点图中对应的点作为零功率异常点,遍历离群噪音点清洗后的标准化风速-发电功率散点图中的每个标准化风速,重复上述比较过程,即可以获得所述风电机组的零功率异常点。

图3是本发明另一实施例提供的风电机组的风速-发电功率数据的清洗方法的流程示意图,如图3所示,在上述各实施例的基础上,进一步地,预先获得1功率最低风速和1功率区间的步骤包括:

s301、将标准化功率区间划分为m个等分区间,并设置最后一个等分区间为1功率区间;其中,m是预设的且m为大于10的整数;

具体地,所述服务器将标准化功率区间划分为m个等分区间,即将最后一个等分区间设置为1功率区间,1功率区间对应的点中存在1功率异常点。其中,m是预设的且m为大于10的整数,m根据实际需要进行设置,本发明实施例不做限定。

s302、根据1功率区间的上一个等分区间对应的低风速点,确定低风速边界线;

具体地,1功率区间的上一个等分区间为是最接近1功率区间的等分区间,对应的标准化风速-发电功率中,每个标准化发电功率对应至少一个标准化风速,取每个标准化发电功率对应的最低标准化风速,对应的每个标准化发电功率以及每个标准化发电功率对应的最低标准化风速构成低风速点,所述服务器对上述每个标准化发电功率以及每个标准化发电功率对应的最低标准化风速构成的低风速点进行线性拟合,获得低风速边界线。其中,低风速边界线为一条直线。

s303、根据低风速边界线以及1功率区间的中值功率,确定1功率最低风速。

具体地,在获得所述低风速边界线之后,将1功率区间的中值功率带入到第风速边界线中,可以求得1功率区间的中值功率对应的标准化风速,1功率区间的中值功率对应的标准化风速即为1功率最低风速。其中,1功率区间的中值功率为

图4是本发明又一实施例提供的风电机组的风速-发电功率数据的清洗方法的流程示意图,如图4所示,在上述各实施例的基础上,进一步地,所述从1功率异常点清洗后的标准化风速-发电功率散点图剔除所述风电机组的恒功率堆积点,获得所述风电机组清洗后的标准化风速-发电功率散点图包括:

s1051、将恒功率堆积点对应的第一风速区间等分为多个第二风速区间;所述第一风速区间是基于1功率异常点清洗后的标准化风速-发电功率散点图预设的;

具体地,由于恒功率堆积点通常是因为风电场跟踪调度计划的要求,而使风电机组的发电功率被控制在某一给定功率而产生的,会对应一个风速范围,基于1功率异常点清洗后的标准化风速-发电功率散点图,可以设定第一风速区间,所述第一风速区间内存在恒功率堆积点,即所述第一风速区间与恒功率堆积点对应。所述服务器可以将恒功率堆积点对应的第一风速区间等分为多个第二风速区间。其中,所述第二风速区间的数量根据实际经验进行设置,本发明实施例不做限定。

s1052、根据每个第二风速区间的标准化发电功率以及核密度估计算法,获得每个第二风速区间的标准化发电功率概率密度曲线;

具体地,所述服务器在获得多个第二风速区间之后,采用核密度估计算法(kerneldensityestimation,简称kde)对每个第二风速区间的发电功率进行核密度估计,可以获得每个第二风速区间的标准化发电功率概率密度曲线。

例如,所述核密度估计算法的公式为:

其中,x为第二风速区间的标准化发电功率,xi为第二风速区间的第i个标准化发电功率,i为正整数且i≤n,n为第二风速区间的标准化发电功率的数据量,k(x)为核函数,可以选用高斯核函数,h为标准化发电功率的核密度估计带宽,h>0且h越大曲线越平缓,kh(x)为缩放核函数,其中:

s1053、根据每个第二风速区间的削峰极值点获得每个第二风速区间的标准化发电功率概率密度曲线对应的恒功率堆积点;其中,每个第二风速区间削峰极值点是基于每个第二风速区间的标准化发电功率概率密度曲线设定的;

具体地,由于恒功率堆积点的存在,在获得每个第二风速区间的标准化发电功率概率密度曲线之后,每个第二风速区间的标准化发电功率概率密度曲线可以呈现出双峰或者多峰,为每个第二风速区间的标准化发电功率概率密度曲线设置削峰极值点。所述服务器根据每个第二风速区间的削峰极值点,可以获得每个第二风速区间的标准化发电功率概率密度曲线对应的恒功率堆积点。其中,削峰极值点根据实际情况进行设置,本发明实施例不做限定。

例如,图5是本发明一实施例提供的第二风速区间的标准化发电功率概率密度曲线示意图,图6是本发明另一实施例提供的第二风速区间的标准化发电功率概率密度曲线示意图,如图5和图6所示,图5中第二风速区间标准化发电功率概率密度曲线出现双峰,图6中第二风速区间的标准化发电功率概率密度曲线只有单峰,图6的第二风速区间的标准化发电功率概率密度曲线是通过设定的削峰极值点将图5的第二风速区间标准化发电功率概率密度曲线中标准化发电功率小于削峰极值点的散点去除之后获得的,小于削峰极值点的散点即为第二风速区间的标准化发电功率概率密度曲线对应的恒功率堆积点。

s1054、将每个第二风速区间的标准化发电功率概率密度曲线对应的恒功率堆积点从1功率异常点清洗后的标准化风速-发电功率散点图去除,获得所述风电机组清洗后的标准化风速-发电功率散点图。

具体地,所述服务器在获得每个第二风速区间的标准化发电功率概率密度曲线对应的恒功率堆积点之后,将各个第二风速区间的标准化发电功率概率密度曲线对应的恒功率堆积点从1功率异常点清洗后的标准化风速-发电功率散点图去除,从而获得所述风电机组清洗后的标准化风速-发电功率散点图。

以实际风电场的一个发电机组a为例,采用本发明实施例提供的风电机组的风速-发电功率数据的清洗方法对发电机组a的风速-发电功率数据进行清洗。

第一步、通过scada系统获取到风电机组a的风速-发电功率数据,并进行归一化处理,获得风电机组a的标准化风速-发电功率数据,然后根据风电机组a的标准化风速-发电功率数据绘制出风电机组a的标准化风速-发电功率散点图,如图7所示。其中,风电机组a的标准化风速-发电功率数据包括标准化风速和标准化发电功率。

第二步、通过风电机组a的异常点识别模型对风电机组a的标准化风速-发电功率数据进行识别,获得风电机组a离群噪声数据,风电机组a离群噪声数据在风电机组a的标准化风速-发电功率散点图中对应风电机组a的离群噪声点,将风电机组a的离群噪声点从风电机组a的标准化风速-发电功率散点图中剔除,获得风电机组a的离群噪音点清洗后的标准化风速-发电功率散点图,如图8所示。其中,风电机组a的异常点识别模型是预先建立的。

第三步、将风电机组a的离群噪音点清洗后的标准化风速-发电功率散点图中,风电机组a的标准化风速大于风电机组a的标准化切入风速,但是标准化风速对应的标准化发电功率为0的点剔除,实现风电机组a的零功率异常点的剔除,获得风电机组a的零功率异常点清洗后的标准化风速-发电功率散点图,如图9所示。风电机组a的标准化切入风速是对风电机组a的切入风速进行归一化处理获得的,风电机组a的切入风速是预设的。

第四步、将风电机组a的零功率异常点清洗后的标准化风速-发电功率散点图中,1功率区间对应的标准化风速小于1功率最低风速的点剔除,实现风电机组a的1功率异常点的剔除,获得风电机组a的1功率异常点清洗后的标准化风速-发电功率散点图,如图10所示。其中,风电机组a的1功率区间和1功率最低风速是预先获得的。

第五步、从风电机组a的1功率异常点清洗后的标准化风速-发电功率散点图剔除风电机组a的恒功率堆积点,获得风电机组a清洗后的标准化风速-发电功率散点图,如图11所示。

对比图7和图11可以看出,通过依次对风电机组a的离群噪声点、零功率异常点、1功率异常点和恒功率堆积点进行剔除之后,图11的散点图呈现光滑的功率曲线区间带分布,数据更合理性,并且清洗后数据分布带宽较宽,最大程度的保留了风电机组a的标准化风速-发电功率数据的完整性。

随着风电场建设的大型化,风电机组运行的海量数据的收集与治理问题日益突出,严重影响了基于数据挖掘的风电场优化运行的准确性和经济性。本发明实施例提供的风电机组的风速-发电功率数据的清洗方法,以提高服务于风电场功率预测等应用的风电机组风速-功率运行数据质量为目标,在考虑风电机组实际功率曲线中存在的多种常见异常数据类型的基础上,提出基于多种统计方法集合的四阶段递进式异常数据清洗方法,本发明实施例提供的风电机组的风速-发电功率数据的清洗方法具有较高的计算效率且通用性强。在风电场优化模型建立前,对建模数据进行有效清洗,能够降低异常数据干扰,使所建模型对风电机组无故障运行数据具有更强的针对性和鲁棒性,有助于支撑风电场优化运行的准确性提升。

图12是本发明一实施例提供的风电机组的风速-发电功率数据的清洗装置的结构示意图,如图12所示,本发明实施例提供的风电机组的风速-发电功率数据的清洗装置包括绘制单元1201、第一剔除单元1202、第二剔除单元1203、第三剔除单元1204和第四剔除单元1205,其中:

绘制单元1201用于基于风电机组的风速-发电功率数据,绘制所述风电机组的标准化风速-发电功率散点图;第一剔除单元1202用于根据异常点识别模型以及所述风电机组的标准化风速-发电功率散点图剔除所述风电机组的离群噪声点,获得离群噪音点清洗后的标准化风速-发电功率散点图;其中,所述异常点识别模型是预先建立的;第二剔除单元1203用于根据标准化切入风速以及离群噪音点清洗后的标准化风速-发电功率散点图剔除所述风电机组的零功率异常点,获得零功率异常点清洗后的标准化风速-发电功率散点图;第三剔除单元1204用于根据1功率最低风速以及零功率异常点清洗后的标准化风速-发电功率散点图的1功率区间对应的标准化风速剔除所述风电机组的1功率异常点,获得1功率异常点清洗后的标准化风速-发电功率散点图;其中,1功率最低风速和1功率区间是预先获得的;第四剔除单元1205用于从1功率异常点清洗后的标准化风速-发电功率散点图剔除所述风电机组的恒功率堆积点,获得所述风电机组清洗后的标准化风速-发电功率散点图。

具体地,scada系统可以采集风电机组的运行数据。绘制单元1201通过风电机组的运行数据可以获取到风电机组的风速-发电功率数据,然后对风电机组的风速-发电功率数据进行归一化处理,获得风电机组的标准化风速-发电功率数据,再根据风电机组的标准化风速-发电功率数据绘制所述风电机组的标准化风速-发电功率散点图。

第一剔除单元1202可以将所述风电机组的标准化风速-发电功率散点图对应的标准化风速和标准化发电功率输入到异常点识别模型中,获得风电机组的离群噪声点,然后将风电机组的离群噪声点从所述风电机组的标准化风速-发电功率散点图中剔除,获得离群噪音点清洗后的标准化风速-发电功率散点图。其中,所述异常点识别模型是预先建立的。优先剔除离群噪声点,可以避免离群噪声点对其它三种类型的异常数据清洗时的干扰。

在获得离群噪音点清洗后的标准化风速-发电功率散点图之后,第二剔除单元1203将离群噪音点清洗后的标准化风速-发电功率散点图中的每个标准化风速分别与标准化切入风速进行比较,如果所述标准化风速大于标准化切入风速,并且所述标准化风速对应的标准化发电功率等于0,那么所述标准化风速在离群噪音点清洗后的标准化风速-发电功率散点图中对应的点为零功率异常点。第二剔除单元1203将上述零功率异常点从离群噪音点清洗后的标准化风速-发电功率散点图中剔除,可以获得零功率异常点清洗后的标准化风速-发电功率散点图。

在获得零功率异常点清洗后的标准化风速-发电功率散点图之后,第三剔除单元1204将零功率异常点清洗后的标准化风速-发电功率散点图的1功率区间对应的每个标准化风速分别与1功率最低风速进行比较,如果1功率区间对应的所述标准化风速小于1功率最低风速,那么1功率区间对应的所述标准化风速在零功率异常点清洗后的标准化风速-发电功率散点图中对应的点为1功率异常点。第三剔除单元1204将所述风电机组的1功率异常点从零功率异常点清洗后的标准化风速-发电功率散点图中剔除,获得1功率异常点清洗后的标准化风速-发电功率散点图。其中,1功率最低风速和1功率区间是预先获得的。可理解的是,1功率异常点对应标准发电功率可以为1,也可以接近1,即略高于或略低于1。

在获得1功率异常点清洗后的标准化风速-发电功率散点图之后,第四剔除单元1205会从1功率异常点清洗后的标准化风速-发电功率散点图中识别出恒功率堆积点,然后将所述风电机组的恒功率堆积点从1功率异常点清洗后的标准化风速-发电功率散点图中剔除,获得所述风电机组清洗后的标准化风速-发电功率散点图。

本发明实施例提供的风电机组的风速-发电功率数据的清洗装置,基于风电机组的风速-发电功率数据,绘制风电机组的标准化风速-发电功率散点图,根据异常点识别模型以及风电机组的标准化风速-发电功率散点图剔除风电机组的离群噪声点,获得离群噪音点清洗后的标准化风速-发电功率散点图,根据标准化切入风速以及离群噪音点清洗后的标准化风速-发电功率散点图剔除风电机组的零功率异常点,获得零功率异常点清洗后的标准化风速-发电功率散点图,根据1功率最低风速以及零功率异常点清洗后的标准化风速-发电功率散点图的1功率区间对应的标准化风速剔除风电机组的1功率异常点,获得1功率异常点清洗后的标准化风速-发电功率散点图,从1功率异常点清洗后的标准化风速-发电功率散点图剔除风电机组的恒功率堆积点,获得风电机组清洗后的标准化风速-发电功率散点图,实现依次将不同类型的异常点从风电机组的风速-发电功率数据中去除,提高了风电机组运行数据的准确性。

在上述各实施例的基础上,进一步地,所述异常点识别模型是采用具有噪声的基于密度的聚类算法建立的。

具体地,为了建立所述异常点识别模型,需要收集风电机组的历史风速-发电功率数据,并进行归一化处理,获得风电机组的标准化历史风速-发电功率数据,然后采用dbscan聚类算法对风电机组的标准化历史风速-发电功率数据进行聚类,调整dbscan聚类算法的邻域参数:半径(eps)和最小样本数目(minpts),建立所述异常点识别模型。

在上述各实施例的基础上,进一步地,第二剔除单元1203具体用于:

在判断获知离群噪音点清洗后的标准化风速-发电功率散点图的标准化风速大于所述标准化切入风速且所述标准化风速对应的功率为零之后,将所述标准化风速在离群噪音点清洗后的标准化风速-发电功率散点图中对应的点作为零功率异常点。

具体地,第二剔除单元1203将离群噪音点清洗后的标准化风速-发电功率散点图中的每个标准化风速分别与标准化切入风速进行比较,如果所述标准化风速大于标准化切入风速,并且所述标准化风速对应的标准化发电功率等于0,那么将所述标准化风速在离群噪音点清洗后的标准化风速-发电功率散点图中对应的点作为零功率异常点,遍历离群噪音点清洗后的标准化风速-发电功率散点图中的每个标准化风速,重复上述比较过程,即可以获得所述风电机组的零功率异常点。

图13是本发明另一实施例提供的风电机组的风速-发电功率数据的清洗装置的结构示意图,如图13所示,在上述各实施例的基础上,进一步地,本发明实施例提供的风电机组的风速-发电功率数据的清洗装置还包括划分单元1206、第一确定单元1207和第二确定单元1208,其中:

划分单元1206用于将标准化功率区间划分为m个等分区间,并设置最后一个等分区间为1功率区间;其中,m是预设的且m为大于10的整数;第一确定单元1207用于根据1功率区间的上一个等分区间对应的低风速点,确定低风速边界线;第二确定单元1208用于根据标准化风速边界线以及1功率区间的中值功率,确定1功率最低风速。

具体地,划分单元1206将标准化功率区间划分为m个等分区间,即将最后一个等分区间设置为1功率区间,1功率区间对应的点中存在1功率异常点。其中,m是预设的且m为大于10的整数,m根据实际需要进行设置,本发明实施例不做限定。

1功率区间的上一个等分区间为是最接近1功率区间的等分区间,对应的标准化风速-发电功率中,每个标准化发电功率对应至少一个标准化风速,取每个标准化发电功率对应的最低标准化风速,对应的每个标准化发电功率以及每个标准化发电功率对应的最低标准化风速构成低风速点,第一确定单元1207对上述每个标准化发电功率以及每个标准化发电功率对应的最低标准化风速构成的低风速点进行线性拟合,获得低风速边界线。其中,低风速边界线为一条直线。

在获得所述低风速边界线之后,第二确定单元1208将1功率区间的中值功率带入到第风速边界线中,可以求得1功率区间的中值功率对应的标准化风速,1功率区间的中值功率对应的标准化风速即为1功率最低风速。其中,1功率区间的中值功率为

图14是本发明又一实施例提供的风电机组的风速-发电功率数据的清洗装置的结构示意图,如图14所示,在上述各实施例的基础上,进一步地,第四剔除单元1205包括等分子单元12051、第一获得子单元12052、第二获得子单元12053和去除子单元12054,其中:

等分子单元12051用于将恒功率堆积点对应的第一风速区间等分为多个第二风速区间;所述第一风速区间是基于1功率异常点清洗后的标准化风速-发电功率散点图预设的;第一获得子单元12052用于根据每个第二风速区间的标准化发电功率以及核密度估计算法,获得每个第二风速区间的标准化发电功率概率密度曲线;第二获得子单元12053用于根据每个第二风速区间的削峰极值点获得每个第二风速区间的标准化发电功率概率密度曲线对应的恒功率堆积点;其中,每个第二风速区间削峰极值点是基于每个第二风速区间的标准化发电功率概率密度曲线设定的;去除子单元12054用于将每个第二风速区间的标准化发电功率概率密度曲线对应的恒功率堆积点从1功率异常点清洗后的标准化风速-发电功率散点图去除,获得所述风电机组清洗后的标准化风速-发电功率散点图。

具体地,由于恒功率堆积点通常是因为风电场跟踪调度计划的要求,而使风电机组的发电功率被控制在某一给定功率而产生的,会对应一个风速范围,基于1功率异常点清洗后的标准化风速-发电功率散点图,可以设定第一风速区间,所述第一风速区间内存在恒功率堆积点,即所述第一风速区间与恒功率堆积点对应。等分子单元12051可以将恒功率堆积点对应的第一风速区间等分为多个第二风速区间。其中,所述第二风速区间的数量根据实际经验进行设置,本发明实施例不做限定。

在获得多个第二风速区间之后,第一获得子单元12052采用核密度估计算法(kerneldensityestimation,简称kde)对每个第二风速区间的发电功率进行核密度估计,可以获得每个第二风速区间的标准化发电功率概率密度曲线。

由于恒功率堆积点的存在,在获得每个第二风速区间的标准化发电功率概率密度曲线之后,每个第二风速区间的标准化发电功率概率密度曲线可以呈现出双峰或者多峰,为每个第二风速区间的标准化发电功率概率密度曲线设置削峰极值点。第二获得子单元12053根据每个第二风速区间的削峰极值点,可以获得每个第二风速区间的标准化发电功率概率密度曲线对应的恒功率堆积点。其中,削峰极值点根据实际情况进行设置,本发明实施例不做限定。

在获得每个第二风速区间的标准化发电功率概率密度曲线对应的恒功率堆积点之后,去除子单元12054将各个第二风速区间的标准化发电功率概率密度曲线对应的恒功率堆积点从1功率异常点清洗后的标准化风速-发电功率散点图去除,从而获得所述风电机组清洗后的标准化风速-发电功率散点图。

本发明实施例提供的装置的实施例具体可以用于执行上述各方法实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。

图15是本发明一实施例提供的电子设备的实体结构示意图,如图15所示,该电子设备可以包括:处理器(processor)1501、通信接口(communicationsinterface)1502、存储器(memory)1503和通信总线1504,其中,处理器1501,通信接口1502,存储器1503通过通信总线1504完成相互间的通信。处理器1501可以调用存储器1503中的逻辑指令,以执行如下方法:基于风电机组的风速-发电功率数据,绘制所述风电机组的标准化风速-发电功率散点图;根据异常点识别模型以及所述风电机组的标准化风速-发电功率散点图剔除所述风电机组的离群噪声点,获得离群噪音点清洗后的标准化风速-发电功率散点图;其中,所述异常点识别模型是预先建立的;根据标准化切入风速以及离群噪音点清洗后的标准化风速-发电功率散点图剔除所述风电机组的零功率异常点,获得零功率异常点清洗后的标准化风速-发电功率散点图;根据1功率最低风速以及零功率异常点清洗后的标准化风速-发电功率散点图的1功率区间对应的标准化风速剔除所述风电机组的1功率异常点,获得1功率异常点清洗后的标准化风速-发电功率散点图;其中,1功率最低风速和1功率区间是预先获得的;从1功率异常点清洗后的标准化风速-发电功率散点图剔除所述风电机组的恒功率堆积点,获得所述风电机组清洗后的标准化风速-发电功率散点图。

此外,上述的存储器1503中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:基于风电机组的风速-发电功率数据,绘制所述风电机组的标准化风速-发电功率散点图;根据异常点识别模型以及所述风电机组的标准化风速-发电功率散点图剔除所述风电机组的离群噪声点,获得离群噪音点清洗后的标准化风速-发电功率散点图;其中,所述异常点识别模型是预先建立的;根据标准化切入风速以及离群噪音点清洗后的标准化风速-发电功率散点图剔除所述风电机组的零功率异常点,获得零功率异常点清洗后的标准化风速-发电功率散点图;根据1功率最低风速以及零功率异常点清洗后的标准化风速-发电功率散点图的1功率区间对应的标准化风速剔除所述风电机组的1功率异常点,获得1功率异常点清洗后的标准化风速-发电功率散点图;其中,1功率最低风速和1功率区间是预先获得的;从1功率异常点清洗后的标准化风速-发电功率散点图剔除所述风电机组的恒功率堆积点,获得所述风电机组清洗后的标准化风速-发电功率散点图。

本实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,所述计算机程序使所述计算机执行上述各方法实施例所提供的方法,例如包括:基于风电机组的风速-发电功率数据,绘制所述风电机组的标准化风速-发电功率散点图;根据异常点识别模型以及所述风电机组的标准化风速-发电功率散点图剔除所述风电机组的离群噪声点,获得离群噪音点清洗后的标准化风速-发电功率散点图;其中,所述异常点识别模型是预先建立的;根据标准化切入风速以及离群噪音点清洗后的标准化风速-发电功率散点图剔除所述风电机组的零功率异常点,获得零功率异常点清洗后的标准化风速-发电功率散点图;根据1功率最低风速以及零功率异常点清洗后的标准化风速-发电功率散点图的1功率区间对应的标准化风速剔除所述风电机组的1功率异常点,获得1功率异常点清洗后的标准化风速-发电功率散点图;其中,1功率最低风速和1功率区间是预先获得的;从1功率异常点清洗后的标准化风速-发电功率散点图剔除所述风电机组的恒功率堆积点,获得所述风电机组清洗后的标准化风速-发电功率散点图。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在本说明书的描述中,参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1