1.本技术属于预测或优化技术领域,尤其涉及一种分布式光伏电站智能选址方法及系统。
背景技术:2.光伏发电作为一种开发较为便利的绿色能源,正日益受到人们的重视,但是,为了优化光伏电站选址布局,保证分布式光伏电站的合理系统配置、提高光电转换效率、降低光伏发电成本,光伏电站的评估和选址研究显得尤为重要。
3.但是,当前光伏电站的选址仍存在以下问题:(1)目前的光伏电站选址一般是将其描述成一个优化问题,如将年运行费用最小、电压偏差最小等作为选址定容依据,或者构建电网动态特性的多目标优化,这些问题基本上都属于np-hard问题,求解过程容易陷入局部最优;(2)光伏电站的发电量预测是选址的关键,但目前发电预测的相关研究,一般根据某个电站的历史发电时序数据,结合影响发电的相关因素对其进行发电预测;主要存在的问题表现在两个方面:一是只能针对一个或多个具体已经存在的电站进行预测;二是针对候选地点,如果没有历史发电数据,无法进行有效的评估;(3)除了发电的历史时序数据和预测时序数据之外,太阳辐射量、规划控制情况、交通运输条件、电网接入方式、自然资源及环境情况、社会经济、运维成本、运维过程等信息也是选址的重要因素,现有方法并未对其进行有效考虑,同时,现有的评估方法有层次分析法、灰色关联分析、模糊评价等,上述评估方法的主要缺点表现在两个方面,一是各影响因素权重设置比较主观,缺乏科学客观的量化依据,另一方面,影响选址的重要因素大多采用自然语言进行描述,在特征提取过程中一般采用one-hot编码,丢失了选址重要因素中的文本语义理解。
4.(4)现有的光伏选址方法,大多从上述单一视域(如发电量时序信息、文本语义信息以及数值型数据信息中的任意一种)去考虑,即便多个视域,也只是将所有视域特征进行简单组合,导致无法对多视域特征进行充分利用。
5.(5)已有的相关研究中,大多针对已有电站进行预测或评估,但是在某个区域中,已经进行发电的电站,相对整个区域来说,是相对稀疏的,如果需要对该区域进行整体分布式电站规划,目前研究中缺乏对细粒度网格划分下所有网格位置全面的和对比性评估。
技术实现要素:6.本技术为了解决上述问题,提供了一种分布式光伏电站智能选址方法及系统,所述方案基于预选区域内已有电站的相关数据,利用时空相关性对区域内细网格划分下所有网格位置进行发电预测,并进一步基于影响光伏电站选址的多种因素,对细网格划分下网格位置进行综合评估,从而对光伏电站的智能选址提供合理准确的决策支持。
7.根据本技术实施例的第一个方面,提供了一种分布式光伏电站智能选址方法,包
括:对预选区域进行细粒度网格划分;获取所有网格位置的发电量时序信息、文本语义信息以及数值型数据信息;并基于预先训练的深度学习模型,分别进行时序信息特征、文本语义信息特征及数值型信息特征的提取;基于提取的特征及预先训练的多核学习模型,获得区域内细网格划分下所有网格位置的评估分值,基于所述评估分值为智能选址提供决策依据;其中,所述发电量时序信息包括发电量历史数据和发电量预测数据;所述发电量预测数据的获取具体为:预先获取电站时空数据以及气象数据;基于深度残差网络和所述时空数据,从时间的邻近性和趋势性上分别进行发电量预测;同时,基于所述气象数据,利用深度学习模型进行发电量预测;将获得的预测结果进行融合实现细粒度网格划分下所有网格位置的发电量预测。
8.进一步的,所述基于提取的特征及预先训练的多核学习模型,获得区域内细网格划分下所有网格位置的评估分值,具体为:基于所述时序信息特征、文本语义信息特征及数值型信息特征,构建训练数据集;基于所述训练数据集对所述多核学习模型进行训练,利用训练好的多核学习模型对不同网格位置进行评估分值;其中,所述训练过程中不同特征对应于不同的核函数。
9.进一步的,基于预先训练的长短期记忆网络中隐藏状态向量对发电量时序信息进行编码,获得所述时序信息特征。
10.进一步的,所述文本语义信息特征的提取,具体为:预先对获得的文本语义信息进行词向量转化,并利用训练好的多层卷积神经网络进行特征提取,其中,所述特征提取过程采用注意力机制赋予特征权重,获得文本语义信息特征。
11.进一步的,所述获取电站时空数据,具体为:获取预设区域内细网格划分下所有网格内的电站位置数据及电站发电量数据并进行相应预处理;从处理后的数据中提取电站的空间位置特征和电站发电量的时序特征,通过三维张量表示时空数据,并利用张量分解进行稀疏数据的填充。
12.进一步的,所述通过三维张量表示时空数据及张量分解,具体为:根据目前已经存在的电站分布的经纬度,将预选区域内的所有电站映射到能覆盖的矩形空间内,实现细粒度网格图构建;基于已知位置信息将日发电量数据映射到网格图中,利用连续时间段的二维网格图构建三维张量,并通过张量分解的方法对三维张量中的稀疏数据进行填充。
13.进一步的,所述基于所述评估分值为智能选址提供决策依据,具体为:基于所述评估分值获得光伏电站智能选址的决策依据,将网格评估分值大于等于预设阈值的位置,结合预选区域地图进行可视化输出,用于选址规划。
14.根据本技术实施例的第二个方面,提供了一种分布式光伏电站智能选址系统,包括:网格划分单元,其用于对预选区域进行细粒度网格划分;多视域特征提取单元,其用于获取所有网格位置的发电量时序信息、文本语义信息以及数值型数据信息;并基于预先训练的深度学习模型,分别进行时序信息特征、文本语义信息特征及数值型信息特征的提取;
智能选址单元,其用于基于提取的特征及预先训练的多核学习模型,获得区域内细网格划分下所有网格位置的评估分值,基于所述评估分值为智能选址提供决策依据;其中,所述发电量时序信息包括发电量历史数据和发电量预测数据;所述发电量预测数据的获取具体为:预先获取电站时空数据以及气象数据;基于深度残差网络和所述时空数据,从时间的邻近性和趋势性上分别进行发电量预测;同时,基于所述气象数据,利用深度学习模型进行发电量预测;将获得的预测结果进行融合实现细粒度网格划分下所有网格位置的发电量预测。
15.与现有技术相比,本技术的有益效果是:(1)本技术所述方案提供了一种分布式光伏电站智能选址方法及系统,所述方案基于预选区域内已有电站的相关数据,利用时空相关性进行细粒度网格划分下所有网格位置的发电量预测,并进一步基于多种影响选址因素,对网格划分下的网格位置进行综合评估;针对细粒度网格划分下所有网格位置,从三种视域,即发电量时序数据(包括历史和预测数据)、影响选址因素的文本语义信息和影响选址因素的数值型信息,分别提取三种特征,并通过数据融合和模型融合,实现了网格位置的综合评估,为光伏电站选址提供全面快速准确的决策依据。
16.(2)本技术所述方案充分考虑电站发电量的时空特点,通过构建三维时空张量,以及张量分解的方式进行三维张量中稀疏数据的填充;基于时空相关性、气象数据等进行细粒度网格划分下所有网格位置的发电量预测。
17.(3)本技术所述方案在光伏电站选址过程中,将电站发电量历史数据与未来预测数据相结合,一方面,发电量历史和预测数据构成了尽量长的时序段,为时序特征的提取提供了关键的步骤,另一方面,也可以解决部分电站历史数据的数据稀疏问题,提高了智能选址的有效性和准确性。
18.本技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
附图说明
19.构成本技术的一部分的说明书附图用来提供对本技术的进一步理解,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。
20.图1为本技术实施例一中所述的分布式光伏电站智能选址方法处理流程示意图;图2为本技术实施例一中所述的细粒度网格划分下所有位置发电预测模型示意图;图3为本技术实施例一中所述的时空数据的三维张量构建及其数据填补示意图。
具体实施方式
21.下面结合附图与实施例对本技术做进一步说明。
22.应该指出,以下详细说明都是示例性的,旨在对本技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本技术所属技术领域的普通技术人员通常理解的相同含义。
23.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根
据本技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和“包括”时,其指明存在特征、步骤、操作、器件、组件和它们的组合。
24.在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。
25.实施例一:本实施例的目的是提供一种分布式光伏电站智能选址方法。
26.如图1所示,一种分布式光伏电站智能选址方法,包括:对预选区域进行细粒度网格划分;获取所有网格位置的发电量时序信息、文本语义信息以及数值型数据信息;并基于预先训练的深度学习模型,分别进行时序信息特征、文本语义信息特征及数值型信息特征的提取;基于提取的特征及预先训练的多核学习模型,获得区域内细网格划分下所有网格位置的评估分值,基于所述评估分值为智能选址提供决策依据;其中,所述发电量时序信息包括发电量历史数据和发电量预测数据;所述发电量预测数据的获取具体为:预先获取电站时空数据以及气象数据;基于深度残差网络和所述时空数据,从时间的邻近性和趋势性上分别进行发电量预测;同时,基于所述气象数据,利用深度学习模型进行发电量预测;将获得的预测结果进行融合实现细粒度网格划分下所有网格位置的发电量预测。
27.进一步的,所述基于提取的特征及预先训练的多核学习模型,获得区域内细网格划分下所有网格位置的评估分值,具体为:基于所述时序信息特征、文本语义信息特征及数值型信息特征,构建训练数据集;基于所述训练数据集对所述多核学习模型进行训练,利用训练好的多核学习模型对不同网格位置进行评估分值;其中,所述训练过程中不同特征对应于不同的核函数。
28.进一步的,基于预先训练的长短期记忆网络中隐藏状态向量对所述发电量时序信息进行编码,获得所述时序信息特征。
29.进一步的,所述文本语义信息包括但不限于gis(geographic information system:地理信息系统)数据、规划控制、交通运输条件、电网接入、自然资源及环境、社会经济以及运维过程等以自然语言形式存在的文本信息;其特征的提取具体为:预先对获得的文本语义信息进行词向量转化,并利用训练好的多层卷积神经网络进行特征提取,其中,所述特征提取过程采用注意力机制赋予特征权重,获得文本语义信息特征。
30.进一步的,所述数值型信息包括但不限于经纬度、太阳辐射量及运维成本等以数值数据存在的信息,所述数值型信息特征提取采用预先训练的卷积神经网络模型。
31.进一步的,所述获取电站时空数据,具体为:获取所有网格内电站位置数据及电站发电量数据并进行相应预处理;从处理后的数据中提取电站的空间位置特征核电站发电量的时序特征,并通过三维张量表示时空数据,利用张量分解进行稀疏数据的填充。
32.进一步的,所述通过三维张量表示时空数据及张量分解,具体为:根据目前已经存在的电站分布的经纬度,将预选区域内的所有电站映射到能覆盖的矩形空间内,实现细粒度网格图构建;基于已知位置信息将日发电量数据映射到网格图中,利用连续时间段的二维网格图构建三维张量,并通过张量分解的方法对三维张量中的稀疏数据进行填充。其中,
网格图内的每个网格表示该区域内的发电量数据;对于不存在电站的网格,初始化为零,对于存在多个电站的网格,用平均值表示。
33.进一步的,所述多核学习存在三种方式对内核的结果进行组合:线性,非线性和数据相关的组合;其中:(1)线性组合,由未加权(即平均)和加权求和组成。
34.(2)非线性组合方法,使用内核的非线性函数,即乘法、幂和乘方。
35.(3)数据依赖组合方法为每个数据实例分配特定的内核权重。
36.通过这样做,可以有效识别数据中的局部分布,并对每个局部区域的数据学习适当的内核组合规则,在本实施例中选择非线性组合的方式对内核的结果进行组合。
37.进一步的,本技术采用的多核学习算法使用迭代法进行训练,在每次迭代中,结合图1,我们首先更新组合核函数的训练参数,同时固定基本核函数(即图1中的核函数1、核函数2以及核函数3)的参数;然后更新基本核函数的参数,同时固定组合核函数的参数,重复上述过程直至收敛。
38.具体的,为了便于理解,以下结合附图对本技术所述方案进行详细说明:步骤1:对预选区域进行细粒度网格划分;其中,所述步骤1具体为:对某一预选区域,将已存在的电站按其地理位置映射到能覆盖所有电站的矩形空间上,实现对当前区域地图的网格划分,其中,所述网格的大小可根据实际需求进行设定。
39.步骤2:针对发电量时序信息(包括历史时序数据和预测时序数据),基于长短期记忆神经网络(lstm)处理时间序列数据,利用lstm隐藏状态所对应的向量对时间序列的相关信息进行编码,获得时间序列信息特征;其中,所述步骤2具体为:通过三维张量表示网格的时空发电数据,并采用张量分解的方法解决数据稀疏问题(对应于划分的网格内无电站的情况),然后,基于时空相关性和天气情况进行发电预测,获得细粒度网格划分下所有网格位置的历史和未来时序数据信息;进一步的,所述基于时空相关性和天气情况进行发电预测,其具体构思为是基于分布式光伏电站的时空相关性,光伏发电从时间属性来看具有波动性、间歇性、趋势性、邻近性及周期性等特点,从空间属性来看具有邻近性相关的特点,因此,如图2所示,本技术在细粒度网格划分下所有位置发电预测中,利用残差网络模型对分布式光伏电站的时空相关性进行模拟,其中,时空相关性通过残差网络进行模拟;天气因素通过深度学习模型(本实施例中采用cnn+全连接网络实现)来模拟。
40.以下结合附图2对所述邻近性和趋势性的具体含义进行说明:(1)邻近性:包括时间邻近性和空间邻近性,其中:时间邻近性表示电站日或时发电量之间的相关性;空间邻近性表示相邻位置的电站日或时发电量之间的相关性;(2)趋势性:具体为不同时间阶段(如每周之间、每个月之间、每季度之间以及各季节之间)电站发电量的变化趋势。
41.具体的,所述发电预测的具体预测步骤如下:(1)数据收集:进行数据集的搭建,即利用光伏电站运维系统的接口和网络爬取方
法来获得相关数据集,包括电站位置数据集、电站发电量数据集以及气象数据集;(2)数据预处理:需要对数据集进行预处理,如缺失数据的填充、数据合并以及特征选择;(3)时空数据的表示:提取电站的空间位置和电站发电量的时序特征,通过三维张量表示时空数据,利用张量分解进行稀疏数据的填充;(4)发电量预测:在数据统计分析发现光伏发电量的时序数据具有时间上的邻近性和趋势性特点的基础上,基于深度残差网络及其内部的卷积层分别从邻近性和趋势性上进行时空特征的预测模拟,获得从邻近性上的发电量预测结果y
ttre ,以及从趋势性上的发电量预测结果y
tadj ;同时,基于深度学习模型(本实施例中采用cnn+全连接神经网络的方式)进行气象数据的预测模拟,获得发电量预测结果y
tmet ,最后将以上预测结果通过线性回归进行模型结果的融合,输出最后的预测结果,具体训练过程如图2所示,其中,所述融合过程并不限于线性回归方式,还可以采用其他机器学习算法(如采用全连接层),通过训练确定上述各预测结果的权重,进而实现多预测结果的融合,图2中的参数y
t
表示训练过程中训练样本中的发电量实际结果;同时,图2中的损失函数具体以最小化预测结果与发电量实际结果y
t
之间的差为目标。
42.进一步的,所述从邻近性上进行时空特征的预测模拟和从趋势性上的预测模拟,采用的模型均为如图2所示的深度残差网络模型,它们具有相同的网络结构,即经过一个卷积层、一个残差单元序列和另外一个卷积层,这种结构利用卷积运算能够很好的捕获本地和邻近区域之间的空间依赖关系,区别在于两者输入的训练数据的不同,其中,在邻近性上的预测,所采用的数据为相邻的日发电量数据,在趋势性上的预测,所采用的数据为间隔预设周期(如间隔一周、间隔一月,可根据实际需求进行选择)的发电量数据。该模型可以较好的解决梯度消失问题。
43.进一步的,如图3所示,所述步骤(3)中的时空数据的三维张量表示以及张量分解,依次分别进行空间划分、张量构建和张量分解,具体如下:(1)基于地理位置的空间划分首先,基于电站位置数据和电站发电量数据,将电站映射到地图上,根据电站分布的经纬度,将所有电站进一步映射到一个能覆盖所有电站的矩形空间上;把所述地图划分成若干网格。其中,每一个网格表示的是该区域发电站的发电量数据,对于没有电站的网格初始值置零;对于存在多个电站的网格,则取多个电站发电量的平均值。
44.(2)张量的构建把时空数据处理为三维张量,即利用已知的位置信息(本实施例中采用经纬度)把日发电量数据映射到网格图上。网格图中(i,j)位置区域的发电量计算公式如公式(1)所示:(1)其中,x
t(i,j)
表示t时刻网格图中第i行第j列的发电量,n是(i,j)区域所包含的发
电站个数,p
tl
表示属于(i,j)区域中t时刻,第l个发电站的单位容量发电量。注意:考虑到投入产出比更能较好的为故障发现和电站选址提供有力的支持,每个区域的值是电站单位容量的发电量。
45.(3)张量分解对于某些网格可能是不存在发电站,导致数据稀疏问题;针对数据稀疏问题,基于张量分解的方法利用已有的数据对无电站的区域进行数据填充。
46.其中,张量分解(即tucker分解)是其中一种常用的方法,它是把原三维张量的矩阵x,分解成三个因素矩阵和一个和核心张量,然后三个因素矩阵和核心向量相乘得到一个约等于原矩阵的矩阵x’,这样即把空数据的区域填充上,也基本保留原数据。其中,三个因素矩阵和核心张量的计算依据,是根据梯度下降算法使误差最小。
47.步骤3:获取影响光伏电站选址因素中的文本数据,包括gis、规划控制、交通运输条件、电网接入、自然资源及环境、社会经济以及运维过程等自然语言描述的文本数据,并基于机器学习模型提取其语义特征,获得细粒度网格划分下所有网格位置的文本语义信息;其中,所述步骤3具体为:针对影响光伏电站选址因素中的文本数据,首先基于word2vec技术进行词向量转化,将语义映射到一个几何空间中,经过多层卷积神经网络(cnn)捕捉到语义特征,再经过注意力机制赋予特征权重,得到文本信息编码,即文本语义信息特征;步骤4:针对影响光伏电站选址因素中的数值型数据,经过cnn提取输入数据的特征,获得数值型信息特征。
48.步骤5:基于提取的特征及预先训练的多核学习模型,获得所有网格位置的评估分值,基于所述评估分值获得最优的光伏电站选址结果;其中,所述步骤5具体为:基于获取的不同视域下的特征,即时序信息特征、文本语义信息特征及数值型信息特征(各视域的特征均包括其他视域不具备的信息),本技术所述方案采用多视域特征,具有以下优点:(a)从特征空间的角度:时间序列信息特征、文本语义信息特征和数值型信息特征这三类信息特征之间没有任何重叠,能够对智能选址提供不同方面的指导;(b)从模型的角度:分别从时序数据、自然语言文本数据、数值型数据模拟影响选址的相关因素,具有显着不同的性质;(c)从参数学习的角度:将所有的特征提供到单个模型中生成具有大量参数待学习的大模型,其训练效率以及训练效果均依赖于大量的训练数据,然而,实际应用过程中的训练数据是有限的。本技术所述方案将大模型分解为三个有机耦合的分模型,极大地缩小参数空间,能更准确的实现参数的学习;因此融合多个视域可以全面准确为选址进行评价(例如:可以定义分值区间为1-10分),通过这种方法获得细粒度网格划分下所有位置的评估分值,该预测值能够为区域内多站选址的决策提供量化依据,保证了选址效率及准确率。
49.进一步的,基于多核学习模型(mkl:multi-kernel learning),对以上提取到的时间序列信息、文本语义信息和数值型这三类信息特征,分别学习对应三个视域的三个核函数,然后通过线性或者非线性的方法进行融合来优化学习,进行细粒度网格划分下所有位置的评估分值预测。
50.实施例二:本实施例的目的是提供一种分布式光伏电站智能选址系统。
51.一种分布式光伏电站智能选址系统,包括:网格划分单元,其用于对预选区域进行细粒度网格划分;多视域特征提取单元,其用于获取所有网格位置的发电量时序信息、文本语义信息以及数值型数据信息;并基于预先训练的深度学习模型,分别进行时序信息特征、文本语义信息特征及数值型信息特征的提取;智能选址单元,其用于基于提取的特征及预先训练的多核学习模型,获得区域内细网格划分下所有网格位置的评估分值,基于所述评估分值为智能选址提供决策依据;其中,所述发电量时序信息包括发电量历史数据和发电量预测数据;所述发电量预测数据的获取具体为:预先获取电站时空数据以及气象数据;基于深度残差网络和所述时空数据,从时间的邻近性和趋势性上分别进行发电量预测;同时,基于所述气象数据,利用深度学习模型进行发电量预测;将获得的预测结果进行融合实现细粒度网格划分下所有网格位置的发电量预测。
52.本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
53.上述实施例提供的一种分布式光伏电站智能选址方法及系统可以实现,具有广阔的应用前景。
54.以上所述仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。