本发明涉及数据分析,具体涉及一种基于图嵌入极限学习机的图像分类方法、装置及介质。
背景技术:
1、目前,风力发电机组主要集中在维度较高的地区,且多安装于丘陵和浅山地区,工况环境恶劣,长期处于寒冷潮湿地区极容易产生风电机组叶片上覆冰现象。覆冰现象不仅会影响供电稳定性,同时还会造成风机运行寿命,造成经济损失。风电机组叶片是风力发电机组关键部件之一,因此,实时的风机叶片覆冰故障检测方法研究具有重要意义。
2、多数学者对风机叶片覆冰预测的研究包括:风洞试验、数值计算和风机scada系统数据分析三个方面。模拟风洞实验在叶片结冰预测方面,通过风机理论功率与实际功率的差值进行判断;较多覆冰检测研究以数值研究计算冰层产生机理的基本参数,进行相关故障检测;基于机器学习的scada数据分析方法进行风机叶片覆冰预测,具有高效和精确度高等优点。虽然近年来学者们在风机叶片结冰预测中提出了许多基于深度学习和数据挖掘的分类方法,但这些方法由于一些技术上的问题尚未攻克,以致于实际预测能力往往受到一些制约。如在风机监控系统scada数据中,现存方法普遍无法正确处理数据内在结构中类别不平衡问题以及少数样本数据形成噪声的问题;在特征层面上,现有基于传统模式识别分类方法普遍无法处理数据样本特征关联性不强造成决策识别率不高的问题。
3、综上所述,急需一种基于图嵌入极限学习机的图像分类方法、装置及介质以解决现有技术中存在的问题。
技术实现思路
1、本发明目的在于提供一种基于图嵌入极限学习机的图像分类方法、装置及介质,充分利用每个自动编码器的特征降维能力,解决现有的自动编码器特征表示能力不足以及特征重构不完全的问题,具体技术方案如下:
2、一种基于图嵌入极限学习机的图像分类方法,其特征在于,步骤如下:
3、步骤s1:获取数据集并对其进行预处理,得到训练集和测试集;
4、步骤s2:采用多层图嵌入极限学习机算法对训练集进行模型训练,得到分类模型;
5、步骤s3:将测试集输入所述分类模型,得到图像分类结果;
6、其中,步骤s2中的多层图嵌入极限学习机算法具体是:构建多个图嵌入自动编码器,将图嵌入自动编码器以循环的方式形成信息交互,转化为多层图嵌入极限学习机,将单个图嵌入自动编码器作为子节点,所述训练集中的数据通过所述子节点输出至下一层网络,得到信息交互的权值输出,采用逐层最优的方法训练多层网络,得到最终的特征输出。
7、优选的,所述图嵌入自动编码器包括以下步骤:
8、1)获取训练集中的数据并设置激活函数;其中,x=[x1,...,xn];xi表示数据中第i个样本,xi∈rd,d表示每个样本特征维度;t=[t1,…,tn];ti表示数据中第i个类别,ti∈rf;n表示数据量;f表示每个类别特征维度;
9、2)计算重构误差权重wij;生成图嵌入矩阵s;初始化权重参数a,a∈rd×l,d表示误差权重的对角矩阵,l为隐层节点数量;
10、3)计算优化后的输出权值β,表达式如下:
11、β=[htdh+(il+λs)/c]-1htwx;
12、其中,i表示单位矩阵,λ表示平衡参数,c表示正则化系数,h表示隐层输出矩阵。
13、优选的,所述激活函数为sigmod激活函数g(x),表达式为
14、优选的,所述重构误差权重wij的计算表达式如下:
15、
16、其中,表示基于样本xi邻域内类别t所有特征集合,设置近邻点个数为p,ω为所有成对输入数据平方距离中位数。
17、优选的,计算图嵌入矩阵s的表达式如下:
18、s=swsb=h(dw-aw)hth(db-ab)ht;
19、
20、
21、
22、
23、其中,对角矩阵h代表特征空间输出矩阵,c代表数据类别,n为输入数据的个数。
24、优选的,隐层数据矩阵的计算表达式为:h=g(a*x+b);其中,b为偏置参数。
25、优选的,所述多层图嵌入极限学习机中的训练方法具体是:对数据集中的数据基于图嵌入自动编码器从k=1到k=k进行循环计算,取第k次信息交互的输出为最终的特征输出,表达式如下:
26、hk=g(g(k-1)(βk)t);
27、其中,hk表示第k次输出矩阵的特征表示;gk=σ(∑f(gk-1,gk-2)),σ表示缩放参数,gk表示第k次信息交互的输入或者第k-1次信息交互的输出;βk表示第k次信息交互的输出权值;t表示矩阵转置。
28、优选的,所述数据集为风机故障检测数据集。
29、另外,本发明还包括基于图嵌入极限学习机的风机故障检测装置,包括:
30、至少一个处理器;
31、以及与所述至少一个处理器通信连接的存储器;
32、其中,所述存储器用于存储计算机程序;
33、所述处理器用于执行所述计算机程序时实现如上述的图像分类方法。
34、另外,本发明还包括一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的图像分类方法。
35、应用本发明的技术方案,具有以下有益效果:
36、(1)本发明中的图像分类方法结合图理论利用风机叶片覆冰故障数据标签信息将权重嵌入至极限学习机自动编码器重构误差函数上,在elm特征空间中施加图嵌入矩阵保持特征数据全局结构信息、保留数据之间全局相似性,从而使算法在特征空间中找出更有效的特征判别边界。区别于现有的极限学习机,本发明采用极限学习机自动编码器对特征数据进行重构,同时基于图权重考虑压缩特征表示与其它特征之间的关系,在数据原始特征空间中计算每个数据特征与其它数据特征的相似性,由数据标签信息根据距离在elm特征空间中重构原始数据,在自动编码器重新构建数据误差项,然后特征子空间中增加图嵌入惩罚项,最大化类间可分性和缩小类内局部结构,从而在特征空间中找出更有效的特征判别边界。
37、(2)本发明提出一种基于循环结构的多层图嵌入极限学习机(ml-geelm)结构,充分利用每个自动编码器特征降维能力。区别于现有的堆叠极限学习机,本发明利用多层输出权重基于图理论的方法有效聚合不同权重特征,保持特征降维后的全局数据结构与原始空间结构的相似性。
38、除了上面所描述的目的、特征和优点之外,本发明还有其它的目的、特征和优点。下面将参照图,对本发明作进一步详细的说明。
1.一种基于图嵌入极限学习机的图像分类方法,其特征在于,步骤如下:
2.根据权利要求1所述的图像分类方法,其特征在于,所述图嵌入自动编码器包括以下步骤:
3.根据权利要求2所述的图像分类方法,其特征在于,所述激活函数为sigmod激活函数g(x),表达式为
4.根据权利要求3所述的图像分类方法,其特征在于,所述重构误差权重wij的计算表达式如下:
5.根据权利要求4所述的图像分类方法,其特征在于,计算图嵌入矩阵s的表达式如下:
6.根据权利要求5所述的图像分类方法,其特征在于,隐层数据矩阵的计算表达式为:h=g(a*x+b);其中,b为偏置参数。
7.根据权利要求6所述的图像分类方法,其特征在于,所述多层图嵌入极限学习机中的训练方法具体是:对数据集中的数据基于图嵌入自动编码器从k=1到k=k进行循环计算,取第k次信息交互的输出为最终的特征输出,表达式如下:
8.根据权利要求1所述的图像分类方法,其特征在于,所述数据集为风机故障检测数据集。
9.一种基于图嵌入极限学习机的图像分类装置,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8任意一项所述的图像分类方法。