本发明涉及风电机组运行监测,具体涉及一种考虑多机组状态相似性的风电机组异常检测方法。
背景技术:
1、随着风力发电技术的不断发展,风电机组作为一种重要的清洁能源发电设备,其运行状态的监测和异常检测受到了广泛关注。目前,已存在多种风电机组异常检测方法,这些方法大致可以分为基于模型的方法和基于数据驱动的方法。
2、基于模型的方法通常依赖于风电机组的物理模型,通过建立精确的数学模型来描述风电机组的运行特性,并根据模型的输出与实际测量值之间的差异来检测异常。如,利用空气动力学模型、机械动力学模型等来预测风电机组的功率输出、转速等关键参数,并将预测值与实际值进行比较。然而,这类方法存在一些局限性:模型复杂度高,风电机组是一个复杂的机电系统,受到多种物理因素的影响,建立精确的物理模型需要考虑大量的参数和复杂的物理过程,这使得模型的构建和求解过程非常复杂,计算成本高昂;对模型准确性依赖强,模型的准确性直接影响异常检测的结果。由于实际运行环境的复杂性和多变性,如风速的随机性、风向的不确定性以及空气密度的变化等,很难保证模型能够准确地描述风电机组的实际运行状态,从而导致检测结果出现误判。
3、基于数据驱动的方法则是利用风电机组的历史运行数据,通过数据分析和挖掘技术来发现数据中的异常模式。常见的方法包括统计分析方法、机器学习方法等。如,利用统计指标如均值、标准差等来判断数据是否异常,或者使用机器学习算法如神经网络、支持向量机等来对风电机组的运行状态进行分类和预测。然而,这类方法也存在一些不足之处:缺乏对机组状态相似性的考虑,在实际的风电场中,通常有多台风电机组同时运行,这些机组在设计参数、运行环境和运行状态等方面可能存在相似性。然而,现有的数据驱动方法大多是针对单台机组进行分析,没有充分利用机组之间的相似性信息,导致在异常检测时可能会忽略一些与机组相似性相关的异常特征,降低了检测的准确性和可靠性;数据质量问题影响大,数据驱动方法对数据的质量要求较高,如数据的完整性、准确性和一致性等。然而,风电机组在运行过程中采集到的数据可能会受到多种因素的干扰,如传感器故障、数据传输错误、环境噪声等,这些数据质量问题可能会导致数据分析结果出现偏差,从而影响异常检测的效果。
4、为此,我们提出一种考虑多机组状态相似性的风电机组异常检测方法。
技术实现思路
1、根据以上现有技术中的不足,本发明的目的在于提供一种考虑多机组状态相似性的风电机组异常检测方法,以提高风电机组异常检测的准确性和可靠性。
2、为了实现以上目的,本
技术实现要素:
采用如下技术方案:
3、考虑多机组状态相似性的风电机组异常检测方法,包括以下步骤:
4、s1.构建评估指标体系,分析风电机组的设计参数和历史运行数据,识别风电机组的性能指标和环境因素;
5、s2.数据采集与预处理,通过使用scada系统自动、实时地采集风电机组的运行数据,并结合局部离群因子(lof)算法对风电机组的运行数据进行预处理,选择小波基函数和分解层数,针对不同类型的数据进行去噪;
6、s3.定性评估,利用s2中处理后的数据构建云模型描述实时运行数据的不确定性和模糊性,计算数据点不同评价等级的隶属度,将定量数据转化为定性评价;通过隶属度的计算结果动态调整集群以反映风电机组的实时运行状态的变化;
7、s4.综合评估,利用s3确定的风电机组的实时运行状态,通过层次分析法(ahp)构建判断矩阵和进行一致性检验,确定各评估指标权重,结合隶属度和权重计算综合评估分数;
8、s5.异常检测,基于综合评估的结果设定异常检测的阈值,结合动态集群方法,利用滑动时窗与相似机组预测残差的分位数作为实时预警阈值,对风电机组异常状态进行实时检测。
9、进一步地,所述s1中,设计参数包括叶片长度、轮毂高度、额定功率、发电机类型等,设计参数直接影响风电机组的性能和运行特性。
10、进一步地,所述s1中,历史运行数据包括功率输出、转速、温度、振动等参数,历史运行数据反映了风电机组在不同环境条件下的运行状态和性能表现。
11、进一步地,所述s1中,风电机组性能指标和环境因素的识别方法:
12、设风电机组的性能指标为y,设计参数和环境因素为x1,x2,……,xn,则多元回归模型可以表示为:
13、y=β0+β1x1+β2x2+…+βnxn+ε;
14、其中,β0,β1,β2,βn为回归系数,ε为误差项;
15、通过对历史运行数据进行回归分析,确定各个因素对性能指标的影响程度,回归系数的大小和符号反映了因素的重要性和影响方向;
16、如果回归系数βi为正且较大,则说明因素xi对性能指标y有正向影响,且影响程度较大;反之,如果回归系数为负或较小,则说明因素的影响较小或为负向影响。
17、进一步地,所述s2中,scada系统通过传感器和数据采集设备将风电机组的运行数据传输到中央控制系统,进行实时监测和分析。
18、进一步地,所述s2中,局部离群因子(lof)算法是一种用于检测数据中异常值的算法;如果在风电机组的运行数据中,存在一些异常值,这些异常值会影响后续的分析和评估结果;局部离群因子(lof)算法对风电机组的运行数据进行预处理方法:
19、首先计算其局部可达密度(lrd);
20、设点p与点o的距离为d(p,o),p点的k-距离邻域为nk(p),即距离p点最近的k个点的集合;o点的k-距离邻域为nk(o),即距离o点最近的k个点的集合;
21、p点的可达距离rdk(p,o)反映了从点p到点o的可达程度,其表达式为:
22、rdk(p,o)=max{k-dt(o),d(p,o)};
23、o点的可达距离rdk(o,p)反映了从点o到点p的可达程度,其表达式为:
24、rdk(o,p)=max{k-dt(p),d(o,p)};
25、其中,k-dt(o)为点o到其第k近邻点的距离;可达距离的计算综合考虑了点o的k距离和点p与点o之间的实际距离;k-dt(p)为点p到其第k近邻点的距离;可达距离的计算综合考虑了点o的k距离和点p与点o之间的实际距离
26、点p的局部可达密度lrdk(p)为:
27、
28、nk(p)为p点的k-距离邻域;点p局部可达密度lrdk(p)反映了点p周围数据点的密度情况;局部可达密度越大,说明点p周围的数据点越密集;局部可达密度越小,说明点p周围的数据点越稀疏;
29、点o的局部可达密度lrdk(o)为:
30、
31、点o的局部可达密度lrdk(o)反映了点o周围数据点的密度情况;局部可达密度越大,说明点o周围的数据点越密集;局部可达密度越小,说明点o周围的数据点越稀疏;
32、然后计算点p的局部离群因子:
33、
34、点p的局部离群因子衡量了点p相对于其周围数据点的离群程度;如果lofk(p)远大于1,则点p是异常值;局部离群因子通过比较点p与其周围数据点的局部可达密度之比来判断点p是否为异常值;如果点p的局部可达密度明显低于其周围数据点的局部可达密度,那么它是一个异常值,可能是由于传感器故障、数据传输错误等原因导致的;
35、进一步地,所述s2中,选择小波基函数和分解层数的方法包括:
36、s21.小波基函数选择,选择morlet小波等基函数,morlet小波在时频域有较好的局部化特性,能够较好地捕捉振动信号中的突变和高频成分;
37、s22.确定分解层数,根据信号的采样频率和最高频率成分来确定分解层数,设信号的采样频率为fs,最高频率成分为fmax,则可以根据公式来估算一个初始的分解层数j;
38、s23.去噪处理,应用小波变换对数据进行分解,将信号分解为不同频率的成分;
39、s231.小波分解,设原始信号为s(t),通过小波变换可以得到不同尺度下的小波系数dj,k和尺度系数cj,k;j表示分解层,j的取值范围从j到1;k表示时间索引,小波变换公式为:
40、
41、
42、其中,ψj,k(t)表示小波函数ψj,k(t);表示尺度函数;
43、
44、
45、s232.阈值处理:
46、根据阈值处理方法去除噪声成分;设小波系数固定阈值为λ,则处理后的小波系数为:
47、
48、根据阈值处理方法去除噪声成分;设尺度系数固定阈值为λ′,则处理后的尺度系数为:
49、
50、其中,sign(dj,k)表示取dj,k的符号,sign(cj,k)表示取cj,k的符号;
51、s233.重构信号,通过逆小波变换重构去噪后的信号;重构公式为:
52、
53、表示通过逆小波变换重构去噪后的信号;通过将处理后的尺度系数和小波系数与相应的尺度函数和小波函数进行组合,实现对信号的重构,得到去噪后的信号。
54、进一步地,所述s3包括:
55、s31.构建云模型,利用s2中处理后的数据构建云模型,用期望ex、熵en和超熵he三个数字特征来描述实时运行数据的不确定性和模糊性;期望ex表示概念的中心值,熵en反映概念的不确定性程度,超熵he则进一步描述熵的不确定性;其中,
56、
57、
58、
59、公式中,ex表示期望,是数据的中心趋势或平均水平;en表示熵,它反映了概念的不确定性程度;he表示超熵,进一步描述了熵en的不确定性;xi表示数据点;n表示数据点的数量;eni表示每个数据点对应的熵值;表示熵eni的平均值;
60、s32.计算隶属度和定性评价,使用正态云模型计算每个数据点在不同评价等级的隶属度;通过计算隶属度,将定量的数据转化为定性的评价,即确定不同评价等级的隶属度;
61、隶属度表示数据点属于某个评价等级的程度;例如,可以将风电机组的运行状态分为“良好”、“一般”、“较差”等几个等级,然后计算每个数据点在这些等级上的隶属度;
62、正态云模型的隶属度函数计算公式为:
63、
64、
65、式中,u(x)表示隶属度函数值;x表示数据点的值,x是通过传感器和数据采集设备得到的风电机组的运行数据;en′用于调整函数的形状或宽度,表示宽度分布中心的概率或者不确定性;
66、s33.动态调整集群的划分,利用s32确定的不同评价等级的隶属度,将具有相似隶属度的数据点划分到同一个集群中,使得集群更能反映风电机组的实际运行状态;
67、进一步地,所述s33包括:
68、s331.设隶属度阈值范围为[umin,umax,],将隶属度在该范围内的数据点归为一个初步集群c={c1,c1,c3,…cn};
69、s332.计算集群间相似度,采用余弦相似度计算集群间的相似度,余弦相似度公式为:
70、
71、公式中,ci和cj分别表示两个集群;和分别表示集群ci和集群cj的向量;|ci|和|cj|分别表示表示集群ci和集群cj中数据点的数量;θ表示两个向量之间的夹角;其中,
72、
73、
74、其中,和分别是初步集群c中的数据点x和y的向量表示;
75、s333.合并相似集群,如果两个集群ci和cj的余弦相似度超过预设的阈值t,即cos(θ)>t,则将集群ci和cj合并为一个新的集群:
76、
77、s334.更新集群信息,合并集群后,更新新集群的中心位置:
78、
79、其中,是新集群的中心位置;z是新集群的数据点;是新集群的数据点z的向量表示;cij是集群中数据点的数量;
80、s335.重复迭代,不断重复s332-s334,直到集群的划分不再发生明显变化或达到预设的迭代次数;
81、s336.动态调整,随着新数据的不断加入,重新计算数据点的隶属度u′(x),根据新的隶属度,将新数据点x′划分到相应的集群中;如果u′(x′)∈[umin,umax]且与某个现有集群ck的余弦相似度较高,则将x′加入ck;否则,根据需要创建新的集群;
82、s337.反映实际运行状态,通过不断地动态调整,使得集群能够更准确地反映风电机组的实际运行状态。
83、进一步地,所述s4包括:
84、s41.通过层次分析法(ahp)构建判断矩阵和进行一致性检验,确定各评估指标的权重;
85、s42.结合隶属度和权重计算综合评估分数,设数据点在不同评价等级的隶属度为uik,各评估指标的权重为ωi,则综合评估分数表示为:
86、
87、其中n为判断矩阵元素的个数,m为评价等级的数量,sik为数据点在指标i下对应评价等级k的得分函数。
88、进一步地,所述评估指标是指用于衡量风电机组运行状态和性能的各个具体指标,评估指标是通过对风电机组的设计参数和历史运行数据进行分析而确定的,它们能够反映风电机组在不同条件下的运行状态和性能表现。
89、进一步地,所述s41包括:
90、s411.建立层次结构模型,将将风电机组的评估问题分解为目标层、准则层和指标层;目标层是评估风电机组的综合运行状态,准则层可以包括性能、可靠性、安全性等方面,指标层则是具体的评估指标;
91、对于同一层次的元素,进行两两比较,确定相对重要性;设指标i和指标l的重要性比较值为ail,满足ail>0,且aii=1;
92、s412.构建判断矩阵a=(ail)n×n,a为判断矩阵,n为判断矩阵元素的个数,
93、s413.计算判断矩阵的最大特征值,包括:
94、初始化特征向量,选择一个任意的非零初始向量
95、迭代计算,设向量然后对向量进行归一化,得到特征向量
96、其中,是向量的模长;是上一次迭代得到的特征向量;
97、重复迭代,重复迭代计算步骤,直到特征向量收敛;
98、计算最大特征值,当特征向量收敛时,最大特征值计算公式为:
99、
100、表示将特征向量与判断矩阵a相乘,然后将结果向量与的转置进行点积,这个值表示在当前特征向量下,判断矩阵a的“加权影响”;表示计算特征向量自身的点积,这实际上是特征向量长度的平方,表示特征向量的“自我影响”;
101、s414.对特征向量进行归一化处理,得到各指标的权重;
102、s415.进行一致性检验,计算一致性指标ci,并查找相应的平均随机一致性指标ri,计算一致性比例cr,若,cr<0.1则认为判断矩阵具有满意的一致性,否则需要重新调整判断矩阵;
103、其中,
104、式中,λmax为最大特征值;n为判断矩阵元素的个数。
105、进一步地,所述s5包括:
106、s51.设定阈值,基于s4综合评估的结果,分析历史数据,计算相关指标的均值μ和标准σ,将阈值设定为f=μ±kσ,其中,f为设定的阈值,k为根据经验或实际需求确定的常数;
107、s52.实时预警阈值,
108、s521.结合动态集群方法,利用滑动时窗与相似机组预测残差的分位数作为实时预警阈值,滑动时窗的大小根据实际情况进行设定,例如可以选择过去的一段时间作为滑动时窗;
109、s522.对于风电机组的数据点,在滑动时窗内计算其与相似机组的数据点的预测残差e:
110、
111、其中,y为实际值,为预测值;
112、相似机组的选择可以基于机组的性能指标、运行参数、地理位置等因素进行确定;
113、s523.使用统计方法计算预测残差的分位数,如中位数、上四分位数q3和下四分位数q1等;
114、s524.将得到分位数作为实时预警阈值,当e>q3或e<q1时,触发预警。
115、综上所述,由于采用了上述技术方案,发明内容的有益技术效果是:
116、综合考虑多种因素,通过构建评估指标体系,不仅考虑了风电机组的设计参数和历史运行数据,还分析了这些因素之间的相互关系,从而更全面地了解风电机组的运行特性。这种综合考虑多种因素的方法有助于提高异常检测的准确性,避免因单一因素的局限性而导致的误判。
117、充分利用机组相似性,本发明在异常检测过程中充分考虑了多机组状态相似性。通过对多台机组的数据进行分析和处理,挖掘机组之间的相似性特征,并利用这些特征来辅助异常检测。如,在数据预处理阶段,可以利用相似机组的数据来对异常值进行更准确的判断;在定性评估和综合评估阶段,可以根据机组相似性来调整评估指标和权重,从而提高评估结果的准确性和可靠性。
118、有效处理数据质量问题,针对数据质量问题,本发明采用了一系列的数据预处理方法。如,利用局部离群因子(lof)算法对采集到的数据进行预处理,能够有效地识别和去除数据中的异常值,提高数据的质量。同时,通过选择合适的小波基函数和分解层数对数据进行去噪处理,进一步提高了数据的准确性和可靠性,从而为后续的异常检测提供了良好的数据基础。