本发明涉及电力时序数据预测,具体涉及一种电力时序数据预测算法集成管理系统及方法。
背景技术:
1、电力系统运行所产生的时序数据不仅种类繁多,而且体量庞大,包含风光功率、电力负荷、电价信息和设备运行状态数据等,对不同类型电力时序数据进行预测可以起到提高电网运行效率、优化电力交易以及提高新能源消纳等作用。近年来,随着人工智能等新兴技术的发展,应用于电力时序数据预测任务的算法层出不穷,但各种算法对不同数据类型和预测周期任务的适应性存在差异,现有技术针对各类算法的选择主要依靠人工经验,无法满足电力系统未来发展的需求。因此需要一种能够集成多种预测算法,并且能够针对不同电力时序数据预测任务快速实现算法建模和优选的算法集成管理系统。
技术实现思路
1、发明目的:本发明的目的在于提供一种电力时序数据预测算法集成管理系统及方法,针对不同电力时序数据预测任务,在多种算法中实现快速选型和超参数优选,以解决上述背景技术中的问题。
2、技术方案:第一方面,提供一种电力时序数据预测算法集成管理系统,包括:
3、算法集成模块,内置多种预测算法,支持多种算法的并行计算;
4、建模训练模块,对输入数据中存在的异常数据、缺失数据进行清洗和填充,并对处理后的数据进行特征工程并构建训练数据集,根据不同预测任务进行建模训练和测试;
5、算法评价模块,内置多个评价指标,从不同维度评价算法的效果;
6、算法优选模块,通过优选策略,实现算法和超参数的自动选择。
7、根据第一方面的某些实施方式,算法集成模块内置多种算法的实现基于统一的基类,各具体算法继承该类实现标准化的关键接口。
8、根据第一方面的某些实施方式,算法集成模块采用线程池实现多种算法的并行计算,包括以下步骤:
9、定义一个包含具体算法计算逻辑的类,用于计算任务的封装;
10、初始化一个固定大小的线程池,在启动时创建指定数量的线程;
11、每次需要运行算法时,使用线程池的执行方法,按顺序提交并执行多个算法任务。
12、根据第一方面的某些实施方式,建模训练模块包括缺失数据识别单元,被配置为:根据预期采集的开始时间、结束时间和时间颗粒度,生成时间序列,将采集到的数据的时间标签与该时间序列进行对比,判断出缺失数据。
13、根据第一方面的某些实施方式,建模训练模块包括异常数据检测单元,被配置为:采用基于统计的异常数据检测方法对输入数据中的异常数据进行检测,包括:
14、对于输入数据集x中每个样本x,检查是否满足μ-kσ≤δx≤μ+kσ,若不满足,则识别x为异常数据;
15、其中,k是一个可调节的系数,δx为相邻样本的差值,其计算公式为:δxi=xi+1-xi;μ为δx的均值,其计算公式为:其中n表示样本数量;δxi表示第i个δx样本的值;σ表示δx的标准差,计算公式为:
16、根据第一方面的某些实施方式,建模训练模块包括特征构造单元,被配置为:对输入特征进行两两相乘,构造乘积特征,再采用相关系数法进行特征选择,通过计算每个特征与预测数据之间的皮尔逊相关系数,来评估各个特征与预测数据的相关程度,并选择与目标变量高度相关的特征作为模型的输入变量。
17、根据第一方面的某些实施方式,算法评价模块内置多个评价指标包括均方根误差rmse和平均绝对百分比误差mape。
18、根据第一方面的某些实施方式,算法优选模块对于算法集成模块中每个算法,均执行网格搜索进行超参数寻优,再依据最佳评价指标选择算法,其中超参数寻优包含步骤:
19、依据不同算法确定待优化的超参数,定义每个超参数的可选值,构成参数空间;
20、使用嵌套循环,遍历参数空间中的每个参数组合,形成参数组合的网格;
21、使用网格中的每个参数组合,训练模型得到结果;
22、调用算法评价模块中的评价指标;
23、选择产生最佳评价指标的参数组合。
24、第二方面,提供一种电力时序数据预测算法集成管理方法,包括以下步骤:
25、通过继承统一的基类构建多种预测算法,实现标准化的关键接口,并采用线程池技术实现多种算法的并行计算;
26、对输入数据中存在的异常数据、缺失数据进行清洗和填充,并对处理后的数据进行特征工程并构建训练数据集,根据不同预测任务进行建模训练和测试;
27、测试结果采用均方根误差rmse和平均绝对百分比误差mape作为评价指标;
28、对于构建的多种预测算法中每个算法,均执行网格搜索进行超参数寻优,再依据最佳评价指标自动选择最优算法和超参数组合。
29、第三方面,提供一种计算机设备,包括:一个或多个处理器;存储器;以及一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置为由所述一个或多个处理器执行,所述程序被处理器执行时实现第二方面所述的电力时序数据预测算法集成管理方法的步骤。
30、有益效果:本发明通过算法集成模块内置多种预测算法,支持多种算法的并行计算,可以有效提高计算效率;建模训练模块对输入数据中存在的异常数据、缺失数据进行清洗和填充,提高数据质量,并对处理后的数据进行特征工程并构建训练数据集,根据不同预测任务进行建模训练和测试;算法评价模块内置多个评价指标,从不同维度评价算法的效果;算法优选模块通过优选策略,实现算法和超参数的自动选择。本发明针对不同电力时序数据预测任务,在多种算法中实现快速选型和超参数优选,能够很大程度上减少对人工经验的依赖,进一步提高建模效率。
1.一种电力时序数据预测算法集成管理系统,其特征在于,包括:
2.根据权利要求1所述的系统,其特征在于,算法集成模块内置多种算法的实现基于统一的基类,各具体算法继承该类实现标准化的关键接口。
3.根据权利要求1所述的系统,其特征在于,算法集成模块采用线程池实现多种算法的并行计算,包括以下步骤:
4.根据权利要求1所述的系统,其特征在于,建模训练模块包括缺失数据识别单元,被配置为:根据预期采集的开始时间、结束时间和时间颗粒度,生成时间序列,将采集到的数据的时间标签与该时间序列进行对比,判断出缺失数据。
5.根据权利要求1所述的系统,其特征在于,建模训练模块包括异常数据检测单元,被配置为:采用基于统计的异常数据检测方法对输入数据中的异常数据进行检测,包括:
6.根据权利要求1所述的系统,其特征在于,建模训练模块包括特征构造单元,被配置为:对输入特征进行两两相乘,构造乘积特征,再采用相关系数法进行特征选择,通过计算每个特征与预测数据之间的皮尔逊相关系数,来评估各个特征与预测数据的相关程度,并选择与目标变量高度相关的特征作为模型的输入变量。
7.根据权利要求1所述的方法,其特征在于,算法评价模块内置多个评价指标包括均方根误差rmse和平均绝对百分比误差mape。
8.根据权利要求1所述的方法,其特征在于,算法优选模块对于算法集成模块中每个算法,均执行网格搜索进行超参数寻优,再依据最佳评价指标选择算法,其中超参数寻优包含步骤:
9.一种电力时序数据预测算法集成管理方法,其特征在于,包括以下步骤:
10.一种计算机设备,其特征在于,包括: