一种基于迁移成分分析的陆上风电机组叶片结冰诊断方法与流程

文档序号:22588344发布日期:2020-10-20 18:01阅读:73来源:国知局
一种基于迁移成分分析的陆上风电机组叶片结冰诊断方法与流程

技术领域:

本发明涉及陆上风电机组状态监测及故障诊断领域,具体涉及一种基于迁移成分分析的陆上风电机组叶片结冰诊断方法。



背景技术:

风能因其具有储量丰富、清洁无污染、绿色可持续等特点,受到全世界范围内的广泛关注。在实际运行当中,风电机组发电效率往往受到环境因素的制约,其中在低温潮湿环境下的叶片结冰问题尤为突出。当叶片发生结冰时会导致不同程度的危害,轻则使得风电机组发电效率降低,影响风电场收益;重则诱发叶片断裂,危及风电机组及风电场运维人员安全。传统的风电机组状态监测系统及控制系统无法对叶片早期结冰状态进行诊断与预警,当机组由于结冰停机时,风电机组叶片往往已经发生大面积结冰现象,严重危及风电机组及运维人员安全。风电场亟需准确的叶片早期结冰状态诊断方法。现有的结冰诊断方法多使用机器学习算法以一台或多台风电机组的历史scada数据为输入,叶片结冰状态数据为输出通过反复迭代训练拟合最优结冰状态诊断模型。上述方法对于scada数据分布相同或相似的风电机组具有较为准确的诊断能力,能够准确识别叶片结冰故障,但是对于scada数据分布差异较大的风电机组则泛化能力较差,无法对叶片结冰故障进行准确识别。



技术实现要素:

针对现有技术的不足,本发明提供一种基于迁移成分分析的陆上风电机组叶片结冰诊断方法,针对不同风电机组scada数据分布存在差异的问题,采用迁移成分分析方法对源域(训练集风电机组scada数据)与目标域(待诊断的风电机组scada数据)进行处理,最小化源域与目标域的边缘概率分布距离;基于迁移成分分析方法处理后的数据,使用机器学习方法进行模型训练与诊断。本发明提供的方法能够降低不同风电机组scada数据之间的分布差异进而实现对处于不同分布的风电机组进行准确的结冰诊断,为陆上风电机组运行维护、状态监测及故障诊断等领域的研究提供可靠的方法基础。

本发明由如下技术方案实施:一种基于迁移成分分析的陆上风电机组结冰诊断方法,所述方法包括步骤:

步骤1:监测记录风电机组结冰状态,给scada系统对应的scada数据增加结冰标签及时间连续性标签进而形成模型训练数据集;

步骤2:计算scada数据的瞬态与时序特征,并使用贪心算法进行特征选择;

步骤3:利用迁移成分分析方法最小化训练集风电机组与待诊断风电机组特征数据集之间的差异,采用机器学习算法对迁移成分分析方法处理后的数据进行多次迭代训练风电机组叶片结冰状态诊断模型;

步骤4:部署以及应用在线叶片结冰状态诊断模型。

进一步的,所述步骤1包括:

步骤11:选取a台处于结冰期的运行状态良好的风电机组组成用于训练模型的参考机组集;

步骤12:观测记录结冰期内参考机组集中每台机组的结冰时段、正常时段;

步骤13:从原始scada数据中选取与叶片结冰相关性较大的b个特征变量,特征变量包括:风速、变桨电机温度、发电机转速、叶片速度、网侧有功功率、ng5温度、对风角、x方向加速度、y方向加速度、25秒平均风向角、偏航位置、环境温度、偏航速度、机舱温度、叶片角度、ng5充电器直流电流,并对结冰期内的上述变量及时间戳进行导出;

步骤14:根据步骤12得到的结冰时段及正常时段数据,给步骤13导出的scada增加结冰状态标签,结冰状态标签设置方式如下表所示:

步骤15:设定时间连续性阈值m秒,对经过步骤14处理后的数据进行时间连续性判断;判断方式如下:若连续两点之间的时间间隔小于m秒,则判断两点属于相同连续时间段;若连续两点之间的时间间隔大于m秒,则判断两点属于不同连续时间段;对于处于不同时间段的数据添加不同的时间连续性标签。

进一步的,所述步骤2包括:

步骤21:采用bin方法将正常状态的scada数据按照风速等间隔的划分成n个宽度相等的风速区间,计算每个风速区间内的平均风速及功率;

步骤22:采用savitzky-golay平滑算法对平均风速及平均功率数据进行拟合,形成理论功率曲线及函数;

步骤23:构建影响结冰的瞬态特征,新构建的瞬态特征及公式如下所示:

结冰严重程度wβ

式(1)中:preal为实际功率,ppred为根据拟合功率曲线得到的理论应发功率;

风速平方v2

式(2)中:v∞为风速;

风能综合利用率ctotal

式(3)中:preal为实际功率,ppred为根据拟合功率曲线得到的理论应发功率;

步骤24:采用滑窗方法计算连续时间段内结冰严重程度和风能综合利用率的最大值、标准差、平均变化率及总和等时序特征,设定滑窗窗口大小为h,步长为i;

步骤25:采用贪心算法通过多次迭代训练,剔除无效或不利于模型训练的特征,最终形成特征数据集。

进一步的,所述步骤3包括:

步骤31:对训练集风电机组进行上述步骤1与步骤2的操作,根据步骤11得到的叶片结冰状态标签剔除数据中的无效数据,最终得到训练集风电机组的特征数据集及结冰状态标签;

步骤32:对待诊断风电机组进行步骤1中步骤12至15及步骤2所有操作,得到待诊断风电机组的特征数据集;

步骤33:对特征数据集内的数据进行归一化操作,归一化公式如下:

步骤34:利用迁移成分分析方法对步骤31和步骤32的特征数据集进行处理,建立特征映射φ,使得映射后的训练集风电机组与待诊断风电机组数据的边缘概率分布距离最小化;

步骤35:以特征数据集为输入,叶片结冰状态标签为输出,采用机器学习算法a经过多次迭代训练风电机组叶片结冰状态诊断模型。

进一步的,所述步骤4包括:

步骤41:设定时间灵敏度阈值k秒,当更新的scada数据持续时间超过k秒时,将更新的scada数据与历史scada数据合并,形成新的待诊断风电机组数据集;

步骤42:对新的待诊断风电机组数据集进行步骤11至15及步骤2所有操作,形成新的待诊断风电机组特征数据集;

步骤43:对训练集风电机组特征数据集与更新后的待诊断风电机组特征数据集进行步骤3所述操作;

步骤44:根据步骤43得到的训练模型诊断更新时段的叶片结冰状态,并根据结冰诊断状态发布预警。

本发明提供的一种基于迁移成分分析的陆上风电机组结冰诊断方法,采用迁移成分分析方法,最小化建模机组与目标机组之间的边缘概率分布,缩小数据之间的分布差距。本发明所提方法泛化能力强,能结合不同算法使用,可以有效的缩小不同机组结冰数据之间的差距,提高风电机组叶片结冰的诊断准确性,具备应用价值。

附图说明:

图1为风电机组功率曲线拟合曲线图;

图2为贪心算法特征选择数量与诊断准确率关系图。

具体实施方式:

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1:

本实施例涉及一种基于迁移成分分析的陆上风电机组叶片结冰诊断方法,具体步骤如下:

步骤1:监测记录风电机组结冰状态,给对应scada数据增加结冰标签及时间连续性标签进而形成模型训练数据集;

步骤11:选取1台处于结冰期的运行状态良好的风电机组组成用于训练模型的参考机组集;

步骤12:观测记录结冰期内参考机组集中每台机组的结冰时段、正常时段;

步骤13:从原始scada数据中选取与叶片结冰相关性较大的26个特征变量,包括:风速、发电机转速、网侧有功功率、对风角、平均风向角、偏航位置、偏航速度、叶片角度、变桨电机温度、叶片速度、ng5温度、x方向加速度、y方向加速度、环境温度、机舱温度、ng5充电器直流电流,并对结冰期内的上述变量及时间戳进行导出;

步骤14:根据步骤12得到的结冰时段及正常时段数据,给步骤13导出的scada增加结冰状态标签,结冰状态标签设置方式如下表所示:

步骤15:设定时间连续性阈值3000秒,对经过步骤14处理后的数据进行时间连续性判断;判断方式如下:若连续两点之间的时间间隔小于3000秒,则判断两点属于相同连续时间段;若连续两点之间的时间间隔大于3000秒,则判断两点属于不同连续时间段;对于处于不同时间段的数据添加不同的时间连续性标签;

步骤2:根据步骤15得到的数据,计算scada数据的瞬态与时序特征,并使用贪心算法进行特征选择,具体步骤如下:

步骤21:采用bin方法将正常状态的scada数据按照风速等间隔的划分成180个宽度相等的风速区间,计算每个风速区间内的平均风速及功率;

步骤22:采用savitzky-golay平滑算法对平均风速及平均功率数据进行拟合,形成理论功率曲线(如附图1所示)及函数;

步骤23:构建影响结冰的瞬态特征,新构建的瞬态特征及公式如下所示:

结冰严重程度wβ

式(1)中:preal为实际功率,ppred为根据拟合功率曲线得到的理论应发功率。

风速平方v2

式(2)中:v∞为风速。

风能综合利用率ctotal

式(3)中:preal为实际功率,ppred为根据拟合功率曲线得到的理论应发功率。

步骤24:采用滑窗方法(设定滑窗窗口大小为50,步长为1)计算连续时间段内结冰严重程度和风能综合利用率的最大值、标准差、平均变化率及总和等时序特征;

步骤25:采用贪心算法通过多次迭代训练,确定最佳特征数量(如附图2所示),剔除无效或不利于模型训练的特征,最终形成特征数据集;

步骤3:利用迁移成分分析方法最小化训练集风电机组与待诊断风电机组特征数据集分布之间的差异,采用机器学习算法对迁移成分分析方法处理后的数据进行多次迭代训练风电机组叶片结冰诊断模型,具体步骤如下:

步骤31:对训练集风电机组进行上述步骤1与步骤2的操作,根据步骤11得到的叶片结冰状态标签剔除数据中的无效数据,最终得到训练集风电机组的特征数据集及结冰状态标签;

步骤32:对待诊断风电机组进行步骤1中步骤12至15及步骤2所有操作,得到待诊断风电机组的特征数据集;

步骤33:对特征数据集内的数据进行归一化操作,归一化公式如下:

步骤34:利用迁移成分分析方法对步骤31和步骤32的特征数据集进行处理,建立特征映射φ,使得映射后的训练集风电机组与待诊断风电机组数据的边缘概率分布距离最小化;

步骤35:以特征数据集为输入,叶片结冰状态标签为输出,采用线性判别分析、k-最邻近、朴素贝叶斯等机器学习算法,经过多次迭代训练风电机组叶片结冰状态诊断模型;

步骤4:应用以及部署在线叶片结冰状态诊断模型,具体步骤如下:

步骤41:设定时间灵敏度阈值600秒,当更新的scada数据持续时间超过600秒时,将更新的scada数据与历史scada数据合并,形成新的待诊断风电机组数据集;

步骤42:对新的待诊断风电机组数据集进行步骤11至15及步骤2所有操作,形成新的待诊断风电机组特征数据集;

步骤43:对训练集风电机组特征数据集与更新后的待诊断风电机组特征数据集进行步骤3所述操作;

步骤44:根据步骤43得到的训练模型诊断更新时段的叶片结冰状态,并根据结冰诊断状态发布预警;

将原始数据集按照8:2的比例划分为训练集和测试集,训练集数据用于训练模型,测试集用于测试模型性能。使用三个实施例对比分析本文所提出的迁移成分分析方法的准确性及泛化能力。

实施例2:

首先,利用训练集数据结合朴素贝叶斯算法通过多次迭代得到基于朴素贝叶斯算法的结冰诊断模型,将测试集数据输入至训练好的模型中得到诊断准确率指标;然后,使用实施例1所述迁移成分分析方法调整训练集与测试集的数据分布差异得到迁移后训练集与迁移后测试集,利用迁移后训练集数据结合朴素贝叶斯算法通过多次迭代得到基于朴素贝叶斯算法的结冰诊断模型,将迁移后训练集数据输入至训练好的模型中得到诊断准确率指标。

实施例3:首先,利用训练集数据结合线性判别分析算法通过多次迭代得到基于线性判别分析算法的结冰诊断模型,将测试集数据输入至训练好的模型中得到诊断准确率指标;然后,使用实施例1所述迁移成分分析方法调整训练集与测试集的数据分布差异得到迁移后训练集与迁移后测试集,利用迁移后训练集数据结合线性判别算法通过多次迭代得到基于线性判别算法的结冰诊断模型,将迁移后训练集数据输入至训练好的模型中得到诊断准确率指标。

实施例4:首先,利用训练集数据结合k-最邻近算法通过多次迭代得到基于k-最邻近算法的结冰诊断模型,将测试集数据输入至训练好的模型中得到诊断准确率指标;然后,使用实施例1所述迁移成分分析方法调整训练集与测试集的数据分布差异得到迁移后训练集与迁移后测试集,利用迁移后训练集数据结合k-最邻近算法通过多次迭代得到基于k-最邻近算法的结冰诊断模型,将迁移后训练集数据输入至训练好的模型中得到诊断准确率指标。

上述三个实施例的结果汇总如下表所示:

通过不同算法的结果对比分析,在使用迁移成分分析方法后,三种算法的诊断准确率均得到不同程度的提升,可以得到以下结论:1)本文所提方法具有较好的泛化能力,能结合不同算法使用;2)本文所提方法对于不同算法均能提升其诊断准确率,具备应用价值。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1