基于k均值聚类改进广义天气的光伏发电预测方法
【专利摘要】一种基于K均值聚类改进广义天气的光伏发电预测方法,所述方法将光伏电站逐日历史出力数据聚类为K个簇,并为簇内数据附上数字标签;统计逐日历史出力数据所对应的数字标签和气象专业天气,构成一个气象专业天气对应一个或多个数字标签的改进广义天气映射;对于每相邻两日的历史出力数据,以第一日历史出力数据和其对应的数字标签、第二日历史出力数据对应的数字标签作为输入,以第二日历史出力数据作为输出,建立光伏发电的BP神经网络预测模型并利用所述模型预测发电量。本发明克服了现有广义天气映射中,关于气象专业天气划分过于绝对化的缺点,不仅可以在晴朗天气下精确预测光伏发电量,在多云转阴、阴雨等多变天气下也具有良好的预测精度。
【专利说明】
基于K均值聚类改进广义天气的光伏发电预测方法
技术领域
[0001] 本发明设及一种能够对光伏电站的发电量进行准确预测的方法,属于光伏发电技 术领域。
【背景技术】
[0002] 光伏电源是一种间歇性能源,具有受季节特性、日特性、天气特性和波动特性等诸 因素影响的特点。在众多复杂因素的影响下,光伏预测模型的建立过程略显复杂,但多数情 况下,仍采用间接预测法,即根据光伏历史出力数据建立数学模型。此种方法认为数据本身 就涵盖有地域、气候等信息,对数据进行统计和分类处理后,通过一些具有自学习等能力的 算法来建立光伏发电模型。
[0003] 光伏发电模型的建立,从输入端看,需要两个方面的内容:一是光伏电站的逐日出 力数据,二是每日数据所对应的气象专业天气数据。逐日出力数据一般W每天光照时段整 点时刻发出功率为取样点,如夏季日是早上六点至晚上六点,共十=个时刻,即夏季日每一 组历史出力数据都包含有十=个整点时刻的发电功率。气象专业天气由当地气象部口发 布,表明光伏电站运行日的天气状况概念。根据GB/T 22164-2008国家标准,中国气象局将 所有气象天气标划分为33种专业天气类型。不同气象专业天气下,光伏出力的曲线各有不 同。为了能将气象专业天气转变为计算机能够识别的参数,广义天气的概念应运而生。即通 过某种事先定义好的评价指标(如太阳光福照度、相对湿度、云量等),将33种气象专业天气 再人为地分为几个集合,每一集合都包含多种气象专业天气,并且对应地为所述集合分配 一个数字或字母标签。同时,由于在光伏电站运行过程中,每天都可W从当地气象部口获取 当天的气象专业天气状况,结合已经划分好的广义天气集合,便使得逐日历史出力数据也 都带上广义天气的标签。
[0004] 将相邻两组逐日历史出力数据及其对应的广义天气标签输入至算法中,经过大量 训练,可W得到W第一日光伏出力数据、第一日广义天气标签、第二日广义天气标签为自变 量,W第二日光伏出力数据为因变量的数据之间的拟合关系。最后,再由已经训练好的预测 模型,根据预测日前一日各时刻的光伏出力数据、预测日前一日的广义天气状态标签,结合 气象部口发布的预测日气象专业天气,就可W得到预测日各时刻的光伏出力数据。
[0005] 目前,利用广义天气预测光伏电站的发电量时,存在广义天气的划分过于绝对化 的问题,即在构建广义天气映射集时,某一种用于划分广义天气的评价指标一旦确定,便会 将气象专业天气定性地归类于某一集合的广义天气类型中,从而使所述气象专业天气带有 所述集合所对应的广义天气标签。由于光伏出力易受当日风力、云量等因素的影响,即便是 在相同的气象专业天气下(比如晴转多云天气),也往往会出现各自发电功率曲线相差较大 的情况,如果此时再给历史出力数据带上广义天气状态标签,单独地用某一种广义天气状 态来描述,将会使预测误差增大,特别是在晴转多云、阴雨等多变天气下,光伏发电量的预 测精度更低。
【发明内容】
[0006] 本发明的目的在于针对现有技术之弊端,提供一种基于K均值聚类改进广义天气 的光伏发电预测方法,W提高光伏发电量的预测精度。
[0007] 本发明所述问题是W下述技术方案解决的:
[000引一种基于K均值聚类改进广义天气的光伏发电预测方法,所述方法将光伏电站逐 日历史出力数据聚类为K个簇,并为数据附上数字标签;统计逐日历史出力数据所对应的数 字标签和气象专业天气,构成一个气象专业天气对应一个或多个数字标签的改进广义天气 映射;对于每相邻两日的历史出力数据,W第一日历史出力数据和其对应的数字标签、第二 日历史出力数据对应的数字标签作为输入,W第二日历史出力数据作为输出,建立光伏发 电的BP神经网络预测模型并利用所述模型预测发电量。预测结果可能是一组或多组。如果 是一组预测结果,则所述预测结果为最终预测结果;如果是多组预测结果,计算每组预测结 果与其数字编号所对应的聚类中屯、的欧式距离,欧式距离最小值者为最终预测结果。
[0009] 上述基于K均值聚类改进广义天气的光伏发电预测方法,具体预测按W下步骤进 行:
[0010] ①聚类逐日历史出力数据
[0011] a.根据需要确定分类状态数K;
[0012] b.从光伏电站的逐日历史出力数据中任意选取K个对象作为聚类中屯、,按距离最 短原则将其它数据分别分配给最相近的聚类中屯、,形成K个簇;
[OOK] C.将K个簇的均值作为K个新的聚类中屯、,计算所有对象与K个新聚类中屯、的距离, 用与各个新聚类中屯、距离最小的对象对聚类中屯、进行更新,并按距离最短原则将其它数据 重新分配给更新后的聚类中屯、,得到更新后的K个簇;
[0014] d.重复步骤C,直至化个聚类中屯、不发生变化为止;
[0015] ②为逐日历史出力数据附上相应的数字标签
[0016] 同一簇内的逐日历史出力数据具有相同的数字标签,不同簇内的逐日历史出力数 据具有不同的数字标签;
[0017] ③建立改进广义天气映射
[0018] 统计逐日历史出力数据所对应的数字标签和气象专业天气,构成一个气象专业天 气对应一个或多个数字标签的改进广义天气映射;
[0019 ] ④训练和验证BP神经网络预测模型
[0020] 从所有逐日历史出力数据中,选择一部分逐日历史出力数据作为训练样本,在每 相邻两日的逐日历史出力数据中,W第一日历史出力数据、第一日历史出力数据对应的数 字标签、第二日历史出力数据对应的数字标签作为输入,W第二日历史出力数据作为输出, 通过BP神经网络拟合输入输出间的非线性映射关系,建立光伏发电的BP神经网络预测模 型;用余下的逐日历史出力数据检验模型的预测精度;
[0021] ⑤利用光伏发电的BP神经网络预测模型预测光伏发电量
[0022] 从气象部口获取预测日的气象专业天气,根据改进广义天气映射,找到与此气象 专业天气相对应的一个或多个数字标签,将预测日前一日历史出力数据、预测日前一日对 应的数字标签、预测日的一个或多个数字标签输入到光伏发电的BP神经网络预测模型,得 到一组或分别与多个数字标签相对应的多组预测结果,如果是一组预测结果,则所述预测 结果为最终预测结果;如果是多组预测结果,根据欧式距离公式:
[0023]
(1)
[0024] 计算每组预测结果与其数字编号所对应的聚类中屯、的欧式距离,欧式距离最小值 者为最终预测结果。
[0025] 式中:d为欧式距离值,i = 1,2,3,…,13,表示早上6点开始到下午18点的13个整点 时刻,Xi为每日整点时刻出力值,yi为Xi所属簇的聚类中屯、的各整点时刻值,n表示当日总的 出力时刻个数,本文示例中n取13。
[00%]上述基于K均值聚类改进广义天气的光伏发电预测方法,所述分类状态数K为4。 [0027]本发明通过对现有广义天气映射关系的改进,克服了现有广义天气映射的映射结 果过于绝对化的缺点,从而提高了光伏发电量的预测精度。所述方法不仅可在晴朗天气下 精确预测光伏发电量,在多云转阴、阴雨等多变天气下也具有良好的预测精度。
【附图说明】
[002引图1是本发明的光伏发电预测方法流程图;
[0029] 图2是某光伏电站同属于"多云转阴"气象专业天气下的光伏出力曲线情况,用W 说明现有广义天气概念对天气划分过于绝对的缺点;
[0030] 图3为28日雷阵雨气象专业天气下预测结果;
[0031] 图4为26日多云转阴气象专业天气下预测结果;
[0032] 图5为23日小雨气象专业天气下预测结果。
【具体实施方式】
[0033] 下面结合附图对本发明作进一步说明。
[0034] 针对现有广义天气在使用过程中过于绝对化的缺点,本方法在广义天气映射构建 方面,通过K均值聚类算法将逐日历史出力数据聚为四个簇,每个簇均对应一个聚类中屯、。 先使每个簇内带上数字标签,则簇内历史出力数据也带上数字标签。统计簇内历史出力数 据所对应的气象专业天气,根据此对应关系,得到改进广义天气映射。在改进广义天气映射 中,同一气象专业天气对应一个或多个广义天气标签,从而适应于同一预测日气象专业天 气下,可能存在的多变性特点。
[0035] 本发明包括W下步骤:
[0036] ①聚类逐日历史出力数据
[0037] 聚类流程为:
[0038] a.输入所需要的分类状态数K,本发明取K为4。
[0039] b.从逐日历史出力数据中选取任意4个对象作为聚类中屯、,其它数据分别被分配 给最相近的聚类中屯、,形成K个簇。
[0040] C.取K个簇的均值作为4个新的聚类中屯、,计算所有对象和K个新的聚类中屯、的距 离。取产生最小距离的对象作为下一个新的聚类中屯、,并按步骤b中的分配方法将其它数据 重新分配给更新后的聚类中屯、,得到更新后的K个簇。
[0041 ] d.重复步骤C,一直到4个聚类中屯、不发生变化为止。
[0042] 通过K均值聚类算法,将逐日历史出力数据中具有相似出力特性的数据聚类到同 一个簇内,实现了 W数据内在联系为基础的数据合理划分。4个簇内生成的4个聚类中屯、,作 为每个簇内的基准数据,为最后多组预测结果的筛选奠定基础。
[0043] ②为4个簇内的逐日历史出力数据附上数字标签
[0044] 逐日历史出力数据经聚类后,分散于4个簇内,为每个簇附上数字标签,4个簇内的 逐日历史出力数据便带有统一的数字标签。
[0045] ③建立改进广义天气映射
[0046] 统计逐日历史出力数据所对应的数字标签和逐日历史出力数据所对应的气象专 业天气于表格中,构成了一个气象专业天气对应一个或多个数字标签的改进广义天气映 射。
[0047] 现有广义天气映射和改进广义天气映射对比:
[0048] 表1为现有广义天气映射关系,表2为改进广义天气映射关系。
[0049] 夫1广公天气类巧对脉夫
[(K)加 ]
[0化1 ]
[0化2]
[0053]对比二者发现,当预测日的气象专业天气确定时,前者对应的广义天气类型是固 定的,而改进广义天气的同一个专业气象天气可W对应多个数字编号,其内包含更多种预 测可能。下面W预测日天气为气象专业天气中的"多云转阴"天气为例,分析一下改进的必 要性:
[0054] W现有广义天气概念处理"多云转阴"气象专业天气时,一旦经过评价指标评价, "多云转阴"气象专业天气将永远对应"B"状态。但是从图2所示的某光伏电站同属于"多云 转阴"气象专业天气下的光伏出力曲线可W看出,在同样的气象专业天气下,=条光伏出力 曲线仍然相差较大,其中7月8日的曲线更接近于晴天,但是7月15日的曲线和阴雨天气下的 曲线很相似。所W,如果单纯W "B"状态来描述,无疑会使预测结果误差偏大。而且此现象也 可W解释为什么在晴朗天气下,现有预测方法精度都很高(因为没有较多多变因素干扰), 而在多变天气下,预测精度就会大幅降低。
[0化日]④训练和验证BP神经网络预测模型
[0056] 在所有数据中,选择一部分逐日历史出力数据作为训练样本。在每相邻两日的逐 日历史出力数据中,W第一日历史数据、第一日历史数据对应的数字标签、第二日数据对应 的数字标签作为输入,W第二日历史数据作为输出,通过BP神经网络拟合输入输出间的非 线性映射关系,建立光伏发电的BP神经网络预测模型。用余下的逐日历史出力数据检验模 型的预测精度。
[0057] ⑤利用光伏发电的BP神经网络预测模型预测光伏发电量
[0058] 根据从气象部口获取的预测日气象专业天气,结合改进广义天气映射,找到此气 象专业天气对应的一个或多个数字标签。将预测日前一日历史数据、预测日前一日对应的 数字标签、预测日的一个或多个数字标签作为BP神经网络预测模型输入,得到一组或多组 预测结果。如果是一组预测结果的情况,则为最终预测结果;如果是多组预测结果的情况, 则通过欧式距离公式,计算每组预测结果和其数字编号所对应的聚类中屯、的欧式距离,所 得到欧式距离最小值者,为最终预测结果。
[0059] 图1为本发明所述基于K均值聚类改进广义天气的光伏发电预测方法流程图,下面 结合图1对本发明实施的技术方案进行详细、准确地描述。
[0060] W某光伏电站2015年屯月份前=十日发电数据为例,基于K均值聚类改进广义天 气的光伏发电预测方法流程如下:
[0061 ]表3某光伏电站屯月份前=十日各时刻发电数据
[0062]
[0063] 步骤I:根据图I流程图中K均值聚类过程W及上述聚类逐日历史出力数据的步骤, 在MATLAB中实现对30组历史数据的K均值聚类。其中,K值定义为4,即30组数据经过聚类划 分后,将分布于4个簇中。聚类结果W及各簇的聚类中屯、如表4、表5所示:
[0064] 表4 30组数据经K均值聚类后的结果
[00 化]
[0066]表5各簇的聚类中屯、
[0067]
[0068] 其中,可认为簇T'具备广义上的"晴天"特性,簇"2"具备广义上的"多云"特性、簇 "3"具备广义上的"阵雨"特性、簇"4"具备广义上的"大雨"特性。
[0069] 步骤2:同一个簇内的数据带有相同的数字标签,不同簇带有不同的数字标签,30 组数据经过聚类后,均带有数字标签。
[0070] 步骤3:按照步骤1和步骤2所述步骤,对2015年全年每日光伏发电数据进行聚类, 根据数字标签和专业气象天气的对应情况,分类统计归纳后,得到如上述表2所示的改进后 的广义天气类型对应表,实现对33种气象专业天气的重新归类。
[0071] 步骤4:在每相邻两日的逐日历史出力数据中,W第一日历史数据、第一日历史数 据对应的数字标签、第二日历史数据对应的数字标签作为输入,W第二日历史数据作为输 出,循环此过程,一直到预测日前一日为止。通过BP神经网络拟合输入输出间的非线性映射 关系,建立光伏发电的BP神经网络预测模型。
[0072] 步骤5:由步骤4得到已经训练好的神经网络模型,W预测7月28日光伏出力值为 例,预测该日专业气象天气下的各时刻光伏出力值。气象部口发布的当天气象专业天气为 "雷阵雨",根据表2中改进后的广义天气对应表,其对应"1、2、3、4"运四种数字标签。所W, 根据训练好的神经网络模型,可W得到四组预测结果。为了从四组预测结果中筛选出最终 预测结果,可W通过欧式距离公式,计算四组预测结果及其对应聚类中屯、的欧式距离,欧式 距离最小者为最终预测值。计算结果如表6所示。
[0073] 表6四组预测结果与其聚类中屯、的欧式距离
[0074]
[0075] 由表6可知,当28日天气定义为数字标签"r时,其预测值和其对应的聚类中屯、最 为贴近,所W数字标签"r对应的预测值即为最终预测值。
[0076] 用改进前后两种广义天气法同时预测7月28日"雷阵雨"天气,预测结果及精度如 表7所示。
[0077] 表7改进前后两种预测方法结果及精度对比 [007引
[0079]从表7均方根误差可W看出,改进后广义天气预测方法相比于未改进方法,在预测 精度上有大幅提高。图3、图4、图5分别是在"雷阵雨"、"多云转阴"和"小雨"气象专业天气下 的预测结果。从图中也可W看出,本文改进后的广义天气光伏出力预测方法具有较高的预 测精度。
【主权项】
1. 一种基于K均值聚类改进广义天气的光伏发电预测方法,其特征是,所述方法将光伏 电站逐日历史出力数据聚类为Κ个簇,并为簇内数据附上数字标签;统计逐日历史出力数据 所对应的数字标签和气象专业天气,构成一个气象专业天气对应一个或多个数字标签的改 进广义天气映射;对于每相邻两日的历史出力数据,以第一日历史出力数据和其对应的数 字标签、第二日历史出力数据对应的数字标签作为输入,以第二日历史出力数据作为输出, 建立光伏发电的ΒΡ神经网络预测模型并利用所述模型预测发电量。2. 根据权利要求1所述的一种基于Κ均值聚类改进广义天气的光伏发电预测方法,其特 征是,所述方法包括以下步骤: ① 聚类逐日历史出力数据 a. 根据需要确定分类状态数Κ; b. 从光伏电站的逐日历史出力数据中任意选取K个对象作为聚类中心,按距离最短原 则将其它数据分别分配给最相近的聚类中心,形成K个簇; c. 将K个簇的均值作为K个新的聚类中心,计算所有对象与K个新聚类中心的距离,用与 各个新聚类中心距离最小的对象对聚类中心进行更新,并按距离最短原则将其它数据重新 分配给更新后的聚类中心,得到更新后的K个簇; d. 重复步骤c,直到K个聚类中心不发生变化为止; ② 为逐日历史出力数据附上相应的数字标签 同一簇内的逐日历史出力数据具有相同的数字标签,不同簇内的逐日历史出力数据具 有不同的数字标签; ③ 建立改进广义天气映射 统计逐日历史出力数据所对应的数字标签和气象专业天气,构成一个气象专业天气对 应一个或多个数字标签的改进广义天气映射; ④ 训练和验证BP神经网络预测模型 从所有逐日历史出力数据中,选择一部分逐日历史出力数据作为训练样本,在每相邻 两日的逐日历史出力数据中,以第一日历史出力数据、第一日历史出力数据对应的数字标 签、第二日历史出力数据对应的数字标签作为输入,以第二日历史出力数据作为输出,通过 BP神经网络拟合输入输出间的非线性映射关系,建立光伏发电的BP神经网络预测模型;用 余下的逐日历史出力数据检验模型的预测精度; ⑤ 利用光伏发电的BP神经网络预测模型预测光伏发电量 从气象部门获取预测日的气象专业天气,根据改进广义天气映射,找到与此气象专业 天气相对应的一个或多个数字标签,将预测日前一日历史出力数据、预测日前一日对应的 数字标签、预测日的一个或多个数字标签输入到光伏发电的BP神经网络预测模型,得到一 组或分别与多个数字标签相对应的多组预测结果,如果是一组预测结果,则所述预测结果 为最终预测结果;如果是多组预测结果,计算每组预测结果与其数字编号所对应的聚类中 心的欧式距离,欧式距离最小值者为最终预测结果。3. 根据权利要求2所述的一种基于K均值聚类改进广义天气的光伏发电预测方法,其特 征是,所述分类状态数K为4。
【文档编号】G06Q10/04GK106022538SQ201610380692
【公开日】2016年10月12日
【申请日】2016年5月31日
【发明人】张栋梁, 严健, 纵兆丹, 任晓达, 李国欣, 刘建华
【申请人】中国矿业大学