本发明涉及高光谱图像领域,尤其涉及一种面向高光谱图像的深度空谱子空间聚类方法。
背景技术:
高光谱图像通常由覆盖一定波谱范围的成像光谱仪采集获得,其在表征地表物体空间位置的同时提供了丰富的光谱信息,目前已广泛应用于农业、地质、生态、海洋、大气、资源等诸多领域。作为高光谱图像应用中的一项基础任务,高光谱图像像素的识别分类受到了研究人员的广泛关注。取得了较好的分类性能,但该类依赖于有监督学习的分类方法通常需要大量有标记的数据以监督网络模型的学习。实际应用中,获得带标记的高光谱图像数据仍需要大量人工参与,且需要耗费大量时间。因此,以无监督的方式对高光谱图像进行聚类以实现类别划分具有重要研究意义。无监督高光谱图像聚类旨在没有任何标记样本的情况下,根据像素之间的内在相似性对各像素进行归类划分。然而,由于高光谱图像具有复杂的空谱结构、较高的数据维度、以及较大的光谱形状畸变等特性,无监督高光谱图像聚类仍是一项具有挑战性的任务。
传统的高光谱图像聚类方法包括基于光谱信息和基于空间-光谱信息的两类方法。基于光谱信息的方法通常仅利用高光谱图像像素的光谱信息以获得聚类结果,该类方法没有充分利用像素的空间信息。基于空间-光谱信息的聚类方法综合利用高光谱图像像素的空间信息和光谱信息,从而得到更具区分性的特征表示。此外,稀疏子空间聚类算法作为一种有效的高维数据处理方法,已被广泛应用于高光谱图像聚类任务。例如,zhang等人提出了一种空间-光谱稀疏子空间聚类算法,该算法通过计算局部邻域的光谱相似性来挖掘空间信息。然而,该类子空间聚类方法使用浅层和线性嵌入函数以构建高光谱图像像素点间的稀疏子空间结构,因此难以捕获复杂高维数据的非线性特性。
近年来,基于深度学习的聚类方法在处理非线性特征表示方面获得了较好性能,目前已广泛应用于自然图像聚类任务。受到深度聚类方法启发,zeng等人提出了一种拉普拉斯正则化的深度子空间聚类方法,该方法利用深度网络提取空谱特征,在网络训练结束后利用谱聚类算法得到聚类结果。然而,该方法忽略了高光谱图像像素丰富的多尺度空间信息。有效地挖掘不同像素的多尺度空间特征将有助于表征地表物体的空间结构信息,从而提高聚类性能。
技术实现要素:
综合考虑高光谱图像的复杂空谱结构、以及光谱形状畸变的非线性特性,本发明提出了一种面向高光谱图像的深度空谱子空间聚类方法,其利用深度卷积网络提取多尺度像素块的非线性特征表示,并设计协同约束的多尺度自表达层以挖掘多尺度特征的自表达子空间结构特性,从而获得较好的聚类性能,详见下文描述:
一种面向高光谱图像的深度空谱子空间聚类方法,所述方法包括:
构建多尺度编码器网络以提取不同尺度像素块的多尺度空谱特征,编码器网络利用m层2d卷积操作提取不同尺度像素块的空谱特征表示;
基于多尺度空谱特征表示构建协同约束的多尺度自表达层,各自表达层以各像素块的空谱特征表示为字典,通过像素块空谱特征表示间的相互表达重建各像素块特征;
引入多尺度解码器网络,所述多尺度解码器网络利用m层2d反卷积操作重建出输入的像素块;
构建由单一尺度自表达损失函数、不同尺度间自表达相似性损失函数、重建损失函数组成的总体损失函数;
基于总体损失函数训练模型,以获得各自表达层参数矩阵,进而获取到最终的自表达重建系数矩阵以此计算相似度矩阵,获取最终聚类结果。
其中,所述编码器网络利用m层2d卷积操作提取不同尺度像素块的空谱特征表示具体为:
其中,
编码器网络表示为:
其中,
进一步地,所述基于多尺度空谱特征表示构建协同约束的多尺度自表达层用于建模不同尺度像素块的自表达子空间特性;
对于尺度i上的空谱特征矩阵
其中,所述多尺度解码器网络与多尺度编码器网络结构对称,公式表示为:
其中,
具体实现时,所述单一尺度自表达损失函数用于通过最小化空谱特征表示与自表达层输出特征之间的误差,激励编码器学习到更适合子空间聚类的特征表示。
具体实现时,所述不同尺度间自表达相似性损失函数用于保证各自表达层参数间的一致性,最小化不同自表达层参数之间的差异。
进一步地,所述重建损失函数用于计算输入像素块和重建像素块之间的重建误差。
本发明通过挖掘高光谱图像像素的多尺度特征,提出了一种面向高光谱图像的深度空谱子空间聚类方法,有益效果如下:
1、考虑高光谱图像像素间的结构相关性,设计了多尺度自编码器网络,以不同尺度的像素块作为输入提取各像素不同尺度的空谱特征;
2、在多尺度编码器网络和解码器网络间引入协同约束的多尺度自表达层,以捕获像素间的自表达子空间结构;
3、通过设计自表达相似性损失,以协同方式训练多尺度自编码器网络,并以端到端的方式学习特征表达的自表达系数矩阵,从而获得最终的聚类结果。
附图说明
图1为一种面向高光谱图像的深度空谱子空间聚类方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面对本发明实施方式作进一步地详细描述。
一种面向高光谱图像的深度空谱子空间聚类方法,参见图1,该方法包括以下步骤:
一、获取多尺度像素块
其中,高光谱图像数据表示为x∈rh×w×d,其中h×w表示高光谱图像的空间尺寸,d表示每个像素的光谱波段数。为了捕获各像素的空间结构信息,以各像素作为中心像素,选取中心像素xm,n周围的wi*wi区域,以构成第i个尺度的初始3d像素块
基于初始3d像素块
二、构建多尺度编码器网络提取像素块多尺度空谱特征
构建多尺度编码器网络以提取不同尺度像素块的多尺度空谱特征,编码器网络利用m层2d卷积操作提取不同尺度像素块的空谱特征表示。第i个尺度上所有中心像素的像素块表示为
本发明中,首先利用编码器网络提取像素块
其中
三、构建协同约束的多尺度自表达层
为了学习多尺度像素块的自表达子空间结构,基于多尺度空谱特征表示构建协同约束的多尺度自表达层。其中,基于不同尺度的空谱特征表示分别构建自表达层,各自表达层以各像素块的空谱特征表示为字典,通过像素块空谱特征表示间的相互表达重建各像素块特征。对于尺度i上的空谱特征矩阵
本发明中,自表达层采用没有偏置、没有激活函数的全连接层构建。通过使用该协同约束的多尺度自表达层,可以有效关联不同尺度的空谱特征表示
四、构建多尺度解码器网络重建多尺度像素块
为了实现无监督的特征提取,在自表达层之后引入多尺度解码器网络,多尺度解码器网络利用m层2d反卷积操作重建出输入的像素块,该多尺度解码器网络与多尺度编码器网络结构对称。尺度i的重建像素块表示为
其中,
五、构建网络优化的损失函数
(1)单一尺度自表达损失函数
单一尺度自表达损失函数lsc旨在鼓励编码器网络学习适合于子空间聚类的特征表示。单一尺度自表达损失函数通过最小化空谱特征表示
其中,
(2)不同尺度间自表达相似性损失函数
多尺度自编码器网络利用多个相互独立的自表达层来捕获多尺度像素块的自表达子空间结构。通过利用该多尺度自表达层,以有效关联不同尺度的空谱特征表示
基于此,本发明设计了不同尺度间自表达相似性损失函数以保证各自表达层参数间的一致性,通过最小化不同自表达层参数之间的差异,该损失函数公式表示为:
(3)重建损失函数
通过解码器网络获得高质量的重建像素块,有助于编码器网络提取更具辨析力的特征表示。因此,解码器网络得到的重建像素块应该与输入像素块尽可能相似。基于此,利用输入像素块和重建像素块之间的重建误差构建重建损失函数,公式表示为:
其中,n表示多尺度的数目,
(4)构建总体损失函数
为了联合学习多尺度像素块的空谱特征和自表达系数矩阵,融合各损失函数得到网络优化的总体损失函数,以训练整个网络。网络训练的总损失函数ltotal表示为:
ltotal=lre+αlsc+βlssc(6)
其中,α和β表示平衡不同损失的权重系数。具体而言,重建损失lre旨在激励网络通过重建输入像素块以无监督的方式学习空谱特征表示,自表达损失lsc旨在挖掘高光谱图像像素的自表达子空间特性,自表达相似性损失lssc旨在保证不同尺度的自表达层的重建系数矩阵具有一致性。通过利用总体损失函数ltotal训练网络,以学习更具辨析力的空谱特征以及自表达系数矩阵。
六、高光谱图像聚类
利用公式(6)中的总体损失函数训练网络模型(即上述第二、第三、第四部分共同组成的网络模型),以获得各自表达层参数矩阵
其中,相似度矩阵的第i行第j列元素表示第i个像素和第j个像素之间的相似度,将上述相似度矩阵作为谱聚类算法输入,以获得高光谱图像聚类结果。
本发明实施例对各器件的型号除做特殊说明的以外,其他器件的型号不做限制,只要能完成上述功能的器件均可。
本领域技术人员可以理解附图只是一个优选实施例的示意图,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。