本发明涉及数据分析和系统决策问题,主要涉及一种基于对抗-扩散混合模型的能源系统样本生成方法。
背景技术:
1、在现代能源系统中,数据是实施决策与问题诊断的基础,其直接影响着建模、预测和优化的准确性与可靠性。但由于当前大部分能源系统都存在工况样本空间不均衡的问题,即极端工况样本缺失。而样本生成方法通过生成对应工况样本,从而平衡工况样本空间。高质量的样本生成可以有效反映能源系统的复杂动态特征,支持后续的数据驱动决策。然而,目前的样本生成方法存在一些显著的不足,限制了其在能源系统中的应用。
2、近年来,对抗生成网络(gan)和扩散模型(ddpm)作为先进的生成模型,展现出了强大的样本生成能力。gan通过生成器和判别器的对抗训练,能够生成高质量的样本,但其训练过程容易出现模式崩溃和不稳定的问题。扩散模型通过逐步添加噪声并反向去噪的过程生成数据,具有较高的生成质量和稳定性,但生成效率相对较低。
3、针对现有技术的不足和能源系统对高质量样本生成的迫切需求,亟需一种新的能源系统样本生成方法。
技术实现思路
1、为解决能源系统中运行工况样本空间不均衡的难题,本发明提供了一种基于对抗-扩散混合模型的能源系统样本生成方法,该方法结合了gan和扩散模型的优点,不仅能生成高质量和均匀分布的样本,还能有效捕捉能源系统数据中的复杂模式和非线性特征。这一创新方法为能源系统的建模、预测和优化提供了更加可靠和精确的数据支持,有望显著提升能源管理和调度的智能化水平。该方法能够依据现有的工况样本关联特征,生成准确的能源系统工况样本,从而扩充能源系统运行工况样本库,提升能源系统运行、调度、预测过程面对极端工况的应对能力。
2、本发明采用以下技术方案实现:
3、一种基于对抗-扩散混合模型的能源系统样本生成方法,所述对抗-扩散混合模型的获取方法,包括如下步骤:
4、步骤s1:构建能源系统工况库以及与能源系统工况相关的特征库。具体而言:
5、s11工况库的构建:收集并整理能源系统的历史运行数据,提取关键工况参数,构建工况库。工况库中的样本可以表示为一个矩阵x,具体形式为式(1):
6、x=[x1,x2,x3,…,xi] (1)
7、其中,xi表示样本x中的第i个时序向量。以锅炉系统为例,x1,x2,x3可分别表示一次风量、二次风量、炉膛温度。
8、s12特征库的构建:寻找和样本x有关的特征,构建特征库。特征库可以表示为一个矩阵f,具体形式为式(2):
9、f=[f1,f2,f3,…,fj] (2)
10、其中,fj表示特征矩阵中f的第j个时序向量。以锅炉系统为例,f1,f2,f3可分别表示燃料种类、炉膛结构、空气量。
11、s13数据预处理:对样本矩阵和特征矩阵中的数据进行预处理,包括缺失值填补、数据标准化和异常值检测等。预处理后的样本矩阵x`和特征矩阵f`分别表示为式(3)-(4)。
12、x`=[x`1,x`2,x`3,…,x`i] (3)
13、f`=[f`1,f`2,f`3,…,f`j] (4)
14、其形式与原矩阵相同,但数值经过处理,以便后续建模使用。
15、步骤s2:对步骤s1所构建的能源系统工况库中的样本进行扩散处理。该步骤旨在通过向样本中逐步添加噪声数据,从而使样本最后趋近于高斯噪声,以便后续从随机噪声数据中间还原加噪过程,生成对应样本。具体而言:
16、将预处理后的样本x进行扩散处理,构建扩散处理的核心是逐步添加噪声,得到不同噪声水平下的样本分布。
17、s21构造噪声矩阵n,其形式为式(5)。
18、n=[n1,n2,n3,…,ni] (5)
19、其中,ni表示于样本矩阵x`中x`i对应的噪声数据。
20、s22噪声添加:通过将噪声矩阵n加入到预处理后的样本矩阵x`中,得到带噪声的样本矩阵x``,计算过程可表示为式(6)。
21、x``=x`+αn (6)
22、其中,α表示噪声强度系数,同于控制每一次加噪过程的强弱。
23、s23扩散过程:通过多次迭代扩散过程,逐步增加噪声水平,每次迭代后的样本矩阵可以表示为式(7)。
24、x``t=x``t-1+αtn (7)
25、其中,t表示迭代次数,通常根据经验选择即可;αt表示第t次迭代的噪声强度系数,其选取通常采用cos曲线。
26、s24扩散结果:在完成多次迭代后,得到最终的扩散样本矩阵x``t。且扩散的中间过程样本库i被用于构建gan的训练材料,过程样本库i如式(8)所示。
27、i=[x``1,x``2,x``3,…,x``t,…,x``t] (8)
28、步骤s3构建用于特征提取的对抗生成网络模型,并利用步骤s1与步骤s2所得结果作为训练数据集训练对抗生成网络模型。该步骤旨在构建一个以步骤s13中提到的特征矩阵f`为输入,以步骤s24中提到过程样本库i为目标输出带有特征信息的样本i`的对抗生成网络。同时由于以特征矩阵f`为输入,所生成的样本i`包含特征矩阵f`的特征。具体而言:
29、s31构建对抗生成网络模型:对抗生成网络模型主要由生成器(g)和判别器(d)组成。生成器负责从输入中提取有用信息,建立输入与目标特征g(z)之间的映射关系,其中z为输入的外部条件。判别器通过训练来判断带有标签的输入目标特征的真实性,并提供0~1之间的分数d(g(z))或d(x)来衡量真实性,其中x为真实的目标特征。对抗生成网络模型的损失函数可以表示为式(9)-式(10)
30、l(g)=ex~i(x)[1-d(x)] (9)
31、
32、其中,l(g)和l(d)分别为生成器损失和判别器损失;ex~i(x)[1-d(x)]表示计算随机变量[1-d(x)]数学期望,其中x遵循i(x)分布;d(x)和g(z)分别表示判别器的输出和生成器的输出,pz(z)表示随机高斯噪声的数学分布。
33、s32训练对抗生成网络模型:通过梯度下降算法对构建的对抗生成网络进行训练;生成器以特征矩阵f`为输入,以过程样本库i为目标输出带有特征信息的样本i`;判别器以生成器输出的带有特征信息的样本i`和过程样本库i为输入,输出为对于过程样本库i的真实性评判。
34、通过向生成器输入特征矩阵f`从而生成带有特征信息的样本i`,可表示为式(11)。
35、i`=g(f`) (11)
36、步骤s4:构建预测噪声的神经网络,并以随机高斯噪声作为训练数据集训练预测噪声的神经网络。所述预测噪声的神经网络用于预测在扩散过程中添加的噪声数据,以便从任意随机噪声中重构工况样本。通过神经网络预测扩散过程中的每一步加入噪声数据,从随机高斯噪声中重构样本。预测噪声的神经网络的输入为扩散过程中的样本x``t,输出为根据样本x``t获得的重构样本。具体而言:
37、所述预测噪声的神经网络的损失函数表示如下:
38、l(θ)=e[||∈-∈θ(x``t,t)||2] (12)
39、其中,l(θ)表示预测噪声损失,e[||∈-∈θ(x``t,t)||2]表示对||∈-∈θ(x``t,t)||2计算期望,∈θ表示预测噪声的神经网络,∈表示噪声数据,t表示第t次迭代;
40、利用所述预测噪声的神经网络生成重构样本,计算过程见下式:
41、
42、其中,x```t表示初始重构样本,为随机噪声;x```t-1表示第t-1次迭代获得的重构样本。
43、进一步地,利用所述对抗-扩散混合模型生成能源系统样本,具体步骤为:
44、利用训练好的对抗生成网络模型生成带有特征信息的样本i`,利用训练好的预测噪声的神经网络生成重构样本x```1,将二者加权平均生成样本,具体计算公式见下式:
45、i``=βi`+(1-β)x```1 (14)
46、其中,i``表示最终获得的样本,β为加权权重,通常按照经验选取。
47、本发明的有益效果为:
48、本发明提供了一种基于对抗-扩散混合模型的能源系统样本生成方法,通过对gan和ddpm网络与模型结构的深度融合,有效整合了两种模型的优点,获取了兼顾准确性、鲁棒性、有效性的对抗-扩散混合模型。通过该模型可以生成高质量、均匀分布的工况样本,特别是稀缺的极端工况样本,从而平衡样本空间,对能源系统运行、调度、预测提供数据支撑。本发明方法为能源系统的建模、预测和优化提供了更加可靠和精确的数据支持,有望显著提升能源管理和调度的智能化水平。