一种面向发电设备状态参量参考值的增量式计算方法与流程

文档序号:26642757发布日期:2021-09-15 00:54阅读:107来源:国知局
一种面向发电设备状态参量参考值的增量式计算方法与流程

1.本技术涉及智慧电厂发电设备领域,尤其是针对发电机定子部件重要状态参量的参考值计算方式的一种面向发电设备状态参量参考值的增量式计算方法。


背景技术:

2.随着“互联网+”智慧能源发展意见的推进,以智能管控一体化系统为核心的智慧电厂应运而生。智慧电厂对传感器采集数据进行全面整合处理,进行管理决策制定,以期形成一套覆盖火力发电厂全生命周期的智能传感、智能执行、智能控制、智能优化和智能管控的技术方案。其中智能管控技术以自学习、自分析为依托,通过对设备机组的海量历史数据进行数据挖掘,结合输入和输出对象建立系统工况模型,再通过实时运行数据与建立的历史工况模式进行比对,实现对设备缺陷或故障的预判或诊断。因此,准确地对设备重要状态参量进行参考值计算和阈值分析,是智能管控模块的关键技术。
3.目前,针对发电设备状态参量参考值的计算方法主要包括基于统计学的计算方法,基于机器学习和深度学习的回归计算方法。前者通过状态参量及其相关特征的因果关系和关联关系进行相关回归,如最小二乘法等,但计算效果通常受制于回归函数复杂程度。后者通过建立有监督的输入和输出黑盒模型,对状态参量进行不同工况下的数值拟合,得益于机器学习和深度学习模型的非线性函数组合和复杂度可调节网络,目前在参考值计算精度上获得了广泛的应用。
4.在设备正常老化和负荷峰谷周期交替等多中因素的影响下,设备状态参量存在多变性,为保证模型的时效性,状态参量计算模型需要定期对新采集数据进行增量式计算。目前采用的增量式计算模型,直接将新采集数据与历史数据在时间维度上进行拼接,视作新的训练集对模型进行校验更新。在传感器采样频率高、采样点繁多的背景下,上述增量式计算方法容易造成训练集数据爆发式增长,对计算硬件的内存和性能要求极为严苛。
5.虽然发电设备具有工况多变的特性,但也不乏长时间工作于同一工况下的情况,导致同一时段内所采集的数据通常富有冗余性。因此,对发电设备相关数据在保留信息特征的前提下,适当进行数据聚合,可以通过减少计算开销,而非更新计算硬件的方式达到增量计算的目的,具有一定的实际应用意义。


技术实现要素:

6.本发明的目的在于解决发电机定子部件重要状态参量参考值的增量式计算问题,提供了一种面向发电设备状态参量参考值的增量式计算框架方法,主要应用于发电设备中大数据的增量式计算过程,减少数据大量增长对计算硬件的压力。
7.本发明的技术内容如下:
8.一种面向发电设备状态参量参考值的增量式计算方法,其特征在于,包括如下步骤:
9.步骤一、从离线存储数据库以最小时间单位提取历史数据;这里最小时间单位可
以自定义为周、月、年等时间单位用以提取历史数据。
10.步骤二、以每个最小时间单位历史数据为待聚合数据z;
11.步骤三、对待聚合数据z进行基于局部敏感哈希算法的数据聚合,得到聚合后的数据z


12.步骤四、将各历史数据中最小时间单位聚合后的数据进行级联拼接,作为新的待聚合数据,通过步骤三基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板d0保存至在线计算数据库中;
13.步骤四具体是将原始数据按照最小时间单位分为多个待聚合数据z,对每个 z分别进行基于局部敏感哈希算法的数据聚合得到每个最小时间单位的聚合后数据z

,其中每个z

与z对应,将所有z

进行级联拼接,组合成新的待聚合数据,再次进行数据聚合,生成小样本数据模板d0。
14.步骤五、建立基于深度神经网络搭建待计算状态参量的回归计算模型,loss 损失函数选取均方根误差;
15.步骤六、以小样本数据模板d0为训练集,所有历史最小时间单位源数据z0为验证集,对步骤五所建立的回归计算模型进行训练和误差评估,若验证集状态参量实测值与计算值的均方根小于预设阈值ρ2,将该模型保存至在线计算数据库中作为后续状态参量计算的初始化模型;
16.步骤七、对离线存储数据库最近新增一个最小时间单位的数据z
t
,将其与过去3

12个最小时间单位数据组成新的验证模板z
v
,保存至在线计算数据库中;
17.这里提到的过去3

12个最小时间单位数据与本次小时间单位源新增数据共同组成了验证数据模板z
v
,用来验证后续预测模型的精度。
18.步骤八、将新增数据z
t
作为待聚合数据进行步骤三所述的基于局部敏感哈希算法的数据聚合,得到聚合后的数据z

t
,并将其与上一最小时间单位小样本数据模板d
t
‑1级联拼接,作为新的待聚合数据,通过步骤三所述的基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板d
t
保存至在线计算数据库中,此时,小样本数据模板d
t
既包含历史数据信息,也涵盖本最小时间单位新增的模式特点;
19.步骤九、以小样本数据模板d
t
为训练集,验证数据模板z
v
为验证集,对与步骤五中相同结构的回归计算模型进行训练,若新训练模型在验证数据模板z
v
上的均方根误差小于在线计算数据库中保存的回归计算模型误差,则用新训练回归模型替代原模型,保存在在线计算数据库中;
20.步骤十、提取在线计算数据库中回归计算数据模型,以待计算状态参量的相关特征数据x
c
为输入,计算得到状态参量的参考值y
c

21.进一步地,所述步骤一中,所示每最小时间单位历史数据其中l代表该最小时间单位所记录的时序数据条数,每条数据由需计算的状态参量的测量值及该参量相关的特征测量值组成,l代表该最小时间单位的第l条数据,n代表每条数据所记录的特征维数,通常情况下l>>200000,n>>15。
22.进一步地,所述步骤三中的基于局部敏感哈希算法的数据聚合算法,具体步骤如下:
23.步骤(1).对每条数据经哈希函数映射后的数值
[0024][0025]
上式中,随机矩阵均满足n~(0,1)标准正态分布,r0为预设敏感阈值,共同构成哈希函数h(.),t表示矩阵转置;
[0026]
步骤(2).对映射后的h
l
=[h1,h2,...,h
s
]的每一维数值h
s
通过符号函数进行0, 1二进制编码,作为每条数据的键值k
l
=[k1,k2,...,k
s
]进行标记,每条数据可记为 (k
l
,z
l
);提取该最小时间单位数据的键值集合k={k1,k2,...,k
q
},对每个键值建立q 个独立的哈希桶,并将具有相同键值的数据归入对应的哈希桶中;
[0027][0028]
上式中,sgn(.)为符号函数;
[0029]
步骤(3).对每个哈希桶中数据每次取出两条数据作为数据对进行欧式距离计算,其中j代表键值为k
q
的哈希桶中的数据条数,分别代表键值为k
q
哈希桶中的第i条和第m条不同的数据,i≠m;若两者间距离小于预设距离阈值ρ1,则对数据对进行中心聚合为新数据加入桶中进行后续距离计算比较,数据对不放回桶中;反之则将数据对放回桶中,直至该哈希桶中不存在小于预设距离阈值的数据对。
[0030][0031][0032]
上式中,且
[0033]
步骤(4)、将q个哈希桶中剩余数据,进行级联拼接,得到原始数据z对应的聚合数据其中z
q

为键值为k
q
哈希桶的剩余数据,l

为聚合数据样本数,且l

<<l,通常在5000以内;
[0034]
进一步地,步骤五中模型具体为:
[0035]
g
i+1
=σ(a
i
·
g
i
+c
i
)
[0036][0037]
上式中a
i
和b
i
代表第i层神经网络的神经元权重和偏置,σ(.)为激活函数,可取sigmoid、tanh或relu,g
i
和g
i+1
分别代表第i层神经网络的输入和输出,y
j
和分别代表第j个样本的实测值和模型计算值。
[0038]
本发明的有益效果如下:
[0039]
1、本发明的目的在于解决发电机定子部件重要状态参量参考值的增量式计算问题,提供了一种面向发电设备状态参量参考值的增量式计算框架方法,主要应用于发电设备中大数据的增量式计算过程,减少数据大量增长对计算硬件的压力。同一时段内所采集的数据通常富有冗余性,本发明通过步骤三、步骤八

九所述的基于局部敏感哈希算法分别
对发电设备相关历史数据和新增数据在保留信息特征的前提下,适当进行数据聚合,可以通过减少计算开销,而非更新计算硬件的方式达到增量计算的目的。并且本发明相较于传统的增量式计算方法,具有计算速度快,计算开销小,计算精度高等特点。
[0040]
2、本发明面向发电设备状态参量参考值的增量式计算,首先利用局部敏感哈希算法对离线存储数据库中各历史周期的采样数据进行数据聚合生成小样本数据模板,利用小样本数据模板作为训练集,历史源数据为验证集对基于深度神经网络的回归计算模型进行训练,并存储于在线计算数据库中。对新采集周期数据,同样利用局部敏感哈希进行数据聚合,并与历史存储的小样本数据模板进行级联拼接,再进行一次数据聚合得到涵盖最新特征的小样本数据模板。以历史最近6个周期数据为验证数据模板,并作为回归计算模型的验证集,用最新数据模板为训练集进行回归计算模型更新。利用在线计算数据库中最新的回归计算模型对待计算数据进行状态参量的参考值计算。本发明实现过程中,在保证发电设备状态参量计算精度的情况下,缓解了状态参量数据日益积累造成的计算开销,提升了计算模型更新速度,与传统的直接拼接增量式计算模型相比,简单实用,对计算硬件要求简单,并可以实现多项状态参量的参考值计算具备通用性。
附图说明
[0041]
图1为本发明的基于局部敏感哈希的数据聚合示意图。
[0042]
图2为本发明的流程示意图。
具体实施方式
[0043]
实施例1
[0044]
一种面向发电设备状态参量参考值的增量式计算方法,其特征在于,包括如下步骤:
[0045]
步骤一、从离线存储数据库以最小时间单位提取历史数据;这里最小时间单位可以自定义为周、月、年等时间单位用以提取历史数据。进一步地,所示每最小时间单位历史数据其中l代表该最小时间单位所记录的时序数据条数,每条数据由需计算的状态参量的测量值及该参量相关的特征测量值组成,l代表该最小时间单位的第l条数据,n代表每条数据所记录的特征维数,通常情况下l>>200000,n>>15。
[0046]
步骤二、以每个最小时间单位历史数据为待聚合数据z;
[0047]
步骤三、对待聚合数据z进行基于局部敏感哈希算法的数据聚合,得到聚合后的数据z


[0048]
具体步骤如下:
[0049]
步骤(1).对每条数据经哈希函数映射后的数值
[0050][0051]
上式中,随机矩阵均满足n~(0,1)标准正态分布,r0为预设敏感阈值,共同构成哈希函数h(.),t表示矩阵转置;
[0052]
步骤(2).对映射后的h
l
=[h1,h2,...,h
s
]的每一维数值h
s
通过符号函数进行0, 1二进制编码,作为每条数据的键值k
l
=[k1,k2,...,k
s
]进行标记,每条数据可记为 (k
l
,z
l
);提取该最小时间单位数据的键值集合k={k1,k2,...,k
q
},对每个键值建立q 个独立的哈希桶,并将具有相同键值的数据归入对应的哈希桶中;
[0053][0054]
上式中,sgn(.)为符号函数;
[0055]
步骤(3).对每个哈希桶中数据每次取出两条数据作为数据对进行欧式距离计算,其中j代表键值为k
q
的哈希桶中的数据条数,分别代表键值为k
q
哈希桶中的第i条和第m条不同的数据,i≠m;若两者间距离小于预设距离阈值ρ1,则对数据对进行中心聚合为新数据加入桶中进行后续距离计算比较,数据对不放回桶中;反之则将数据对放回桶中,直至该哈希桶中不存在小于预设距离阈值的数据对。
[0056][0057][0058]
上式中,且
[0059]
步骤(4)、将q个哈希桶中剩余数据,进行级联拼接,得到原始数据z对应的聚合数据其中z
q

为键值为k
q
哈希桶的剩余数据,l

为聚合数据样本数,且l

<<l,通常在5000以内;
[0060]
步骤四、将各历史数据中最小时间单位聚合后的数据进行级联拼接,作为新的待聚合数据,通过步骤三基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板d0保存至在线计算数据库中;
[0061]
步骤四具体是将原始数据按照最小时间单位分为多个待聚合数据z,对每个 z分别进行基于局部敏感哈希算法的数据聚合得到每个最小时间单位的聚合后数据z

,其中每个z

与z对应,将所有z

进行级联拼接,组合成新的待聚合数据,再次进行数据聚合,生成小样本数据模板d0。
[0062]
步骤五、建立基于深度神经网络搭建待计算状态参量的回归计算模型,loss 损失函数选取均方根误差;
[0063]
步骤五中模型具体为:
[0064]
g
i+1
=σ(a
i
·
g
i
+c
i
)
[0065][0066]
上式中a
i
和b
i
代表第i层神经网络的神经元权重和偏置,σ(.)为激活函数,可取sigmoid、tanh或relu,g
i
和g
i+1
分别代表第i层神经网络的输入和输出,y
j
和分别代表第j个样本的实测值和模型计算值。
[0067]
步骤六、以小样本数据模板d0为训练集,所有历史最小时间单位源数据z0为验证
集,对步骤五所建立的回归计算模型进行训练和误差评估,若验证集状态参量实测值与计算值的均方根小于预设阈值ρ2,将该模型保存至在线计算数据库中作为后续状态参量计算的初始化模型;
[0068]
步骤七、对离线存储数据库最近新增一个最小时间单位的数据z
t
,将其与过去3

12个最小时间单位数据组成新的验证模板z
v
,保存至在线计算数据库中;
[0069]
这里提到的过去3

12个最小时间单位数据与本次小时间单位源新增数据共同组成了验证数据模板z
v
,用来验证后续预测模型的精度。
[0070]
步骤八、将新增数据z
t
作为待聚合数据进行步骤三所述的基于局部敏感哈希算法的数据聚合,得到聚合后的数据z

t
,并将其与上一最小时间单位小样本数据模板d
t
‑1级联拼接,作为新的待聚合数据,通过步骤三所述的基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板d
t
保存至在线计算数据库中,此时,小样本数据模板d
t
既包含历史数据信息,也涵盖本最小时间单位新增的模式特点;
[0071]
步骤九、以小样本数据模板d
t
为训练集,验证数据模板z
v
为验证集,对与步骤五中相同结构的回归计算模型进行训练,若新训练模型在验证数据模板z
v
上的均方根误差小于在线计算数据库中保存的回归计算模型误差,则用新训练回归模型替代原模型,保存在在线计算数据库中;
[0072]
步骤十、提取在线计算数据库中回归计算数据模型,以待计算状态参量的相关特征数据x
c
为输入,计算得到状态参量的参考值y
c

[0073]
本发明提供了一种面向发电设备状态参量参考值的增量式计算框架方法,主要应用于发电设备中大数据的增量式计算过程,减少数据大量增长对计算硬件的压力。同一时段内所采集的数据通常富有冗余性,本发明通过步骤三、步骤八
‑ꢀ
九所述的基于局部敏感哈希算法分别对发电设备相关历史数据和新增数据在保留信息特征的前提下,适当进行数据聚合,可以通过减少计算开销,而非更新计算硬件的方式达到增量计算的目的。并且本发明相较于传统的增量式计算方法,具有计算速度快,计算开销小,计算精度高等特点。
[0074]
本发明首先利用局部敏感哈希算法对离线存储数据库中各历史周期的采样数据进行数据聚合生成小样本数据模板,利用小样本数据模板作为训练集,历史源数据为验证集对基于深度神经网络的回归计算模型进行训练,并存储于在线计算数据库中。对新采集周期数据,同样利用局部敏感哈希进行数据聚合,并与历史存储的小样本数据模板进行级联拼接,再进行一次数据聚合得到涵盖最新特征的小样本数据模板。以历史最近6个周期数据为验证数据模板,并作为回归计算模型的验证集,用最新数据模板为训练集进行回归计算模型更新。利用在线计算数据库中最新的回归计算模型对待计算数据进行状态参量的参考值计算。本发明实现过程中,在保证发电设备状态参量计算精度的情况下,缓解了状态参量数据日益积累造成的计算开销,提升了计算模型更新速度,与传统的直接拼接增量式计算模型相比,简单实用,对计算硬件要求简单,并可以实现多项状态参量的参考值计算具备通用性。
[0075]
实施例2
[0076]
根据图2所示,本发明设计的一种面向发电设备状态参量参考值的增量式计算框架方法,其计算步骤如下:
[0077]
(1)从离线存储数据库以月为单位提取历史数据。
[0078]
所示每月历史数据其中l代表该月所记录的时序数据条数,每条数据由需计算的状态参量的测量值及该参量相关的特征测量值组成,l代表该月的第 l条数据,n代表每条数据所记录的特征维数,通常情况下l>>200000,n>>15。
[0079]
(2)以每月历史数据为待聚合数据z进行步骤(3)所述的基于局部敏感哈希算法进行数据聚合。
[0080]
(3)对待聚合数据z进行基于局部敏感哈希算法的数据聚合,得到聚合后的数据z

。所述的基于局部敏感哈希算法的数据聚合算法,具体步骤如下:
[0081]

对每条数据经哈希函数映射后的数值
[0082][0083]
上式中,随机矩阵均满足n~(0,1)标准正态分布,r0为预设敏感阈值,共同构成哈希函数h(.),t表示矩阵转置。
[0084]

对映射后的h
l
=[h1,h2,...,h
s
]的每一维数值h
s
通过符号函数进行0,1 二进制编码,作为每条数据的键值k
l
=[k1,k2,...,k
s
]进行标记,每条数据可记为(k
l
,z
l
)。提取该月数据的键值集合k={k1,k2,...,k
q
},对每个键值建立q个独立的哈希桶,并将具有相同键值的数据归入对应的哈希桶中。
[0085][0086]
上式中,sgn(.)为符号函数。
[0087]

对每个哈希桶中数据每次取出两条数据作为数据对进行欧式距离计算,其中j代表键值为k
q
的哈希桶中的数据条数,分别代表键值为k
q
哈希桶中的第i条和第m条不同的数据, i≠m。若两者间距离小于预设距离阈值ρ1,则对数据对进行中心聚合为新数据加入桶中进行后续距离计算比较,数据对不放回桶中;反之则将数据对放回桶中,直至该哈希桶中不存在小于预设距离阈值的数据对。
[0088][0089][0090]
上式中,且
[0091]

将q个哈希桶中剩余数据,进行级联拼接,得到原始数据z对应的聚合数据其中z
q

为键值为k
q
哈希桶的剩余数据, l

为聚合数据样本数,且l

<<l,通常在5000以内。
[0092]
(4)将各历史月份聚合后的数据进行级联拼接,作为新的待聚合数据,通过步骤(3)所述的基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板d0保存至在线计算数据库中。 (5)建立基于深度神经网络搭建待计算状态参量的回归计算模型,loss损失函数选取均方根误差。
[0093]
g
i+1
=σ(a
i
·
g
i
+c
i
)
[0094][0095]
上式中a
i
和b
i
代表第i层神经网络的神经元权重和偏置,σ(.)为激活函数,可取sigmoid、tanh或relu,g
i
和g
i+1
分别代表第i层神经网络的输入和输出,y
j
和分别代表第j个样本的实测值和模型计算值。
[0096]
(6)以小样本数据模板d0为训练集,所有历史月份源数据z0为验证集,对步骤(5)所建立的回归计算模型进行训练和误差评估,若验证集状态参量实测值与计算值的均方根小于预设阈值ρ2,将该模型保存至在线计算数据库中作为后续状态参量计算的初始化模型。
[0097]
(7)对离线存储数据库最近新增一个月的数据z
t
,将其与过去5个月数据组成新的验证模板z
v
,保存至在线计算数据库中。
[0098]
(8)将新增数据z
t
作为待聚合数据进行步骤(3)所述的基于局部敏感哈希算法的数据聚合,得到聚合后的数据z

t
,并将其与上一月小样本数据模板d
t
‑1级联拼接,作为新的待聚合数据,通过步骤(3)所述的基于局部敏感哈希算法进行数据聚合,将得到的聚合后的数据作为原始小样本数据模板d
t
保存至在线计算数据库中。此时,小样本数据模板d
t
既包含历史数据信息,也涵盖本月新增的模式特点。
[0099]
(9)以小样本数据模板d
t
为训练集,验证数据模板z
v
为验证集,对与步骤(5)中相同结构的回归计算模型进行训练,若新训练模型在验证数据模板z
v
上的均方根误差小于在线计算数据库中保存的回归计算模型误差,则用新训练回归模型替代原模型,保存在在线计算数据库中。
[0100]
(10)提取在线计算数据库中回归计算数据模型,以待计算状态参量的相关特征数据x
c
为输入,计算得到状态参量的参考值y
c

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1