专利名称:基于最小生成树的多尺度多层次影像分割方法
技术领域:
本方法属于图像处理与识别技术领域,特别是涉及一种新的基于最小生成树最优 化理论以及图模型特点的多层次多尺度金字塔影像分割方法。
背景技术:
高空间分辨率遥感影像为我们提供了地面景观的高精度空间几何信息、丰富的纹 理信息以及多光谱信息,使得传统的基于像素的遥感影像分类方法已不适用,因此,高分辨 率遥感影像处理面临影像所提供的细节的挑战。为此,BaatZ*khape于1999年在[1]中 指出重要的语义解释更需要用有意义的影像中对象及对象之间的相互关系而不是用一个 个像素来表示,因此,提出了面向对象的高分辨率遥感影像目标识别与分类方法,即首先对 影像进行分割生成对象区域,并用分层网络来描述对象,再以对象为单位进行目标识别。基 于对象的光谱、形状、纹理、空间关系以及人的知识进一步推理的新分类器证明在高空间分 辨率领域非常有用,它符合人类识别目标的规律,提高了分类精度和细节。面向对象的图像 分割是对象获取的主要方法之一,面向对象的目标识别技术是通过对对象的光谱、几何、纹 理、空间邻域关系等信息组合来识别目标,从理论和实际应用中发现,对象分割的好坏直接 影响影像分类识别的效果和精度,因为它直接关系到能否准确、有效地提取图像上中目标 的几何信息和结构信息,因此,面向对象高分辨率遥感影像分割成为遥感图像处理中的关 键和基础,面向对象分割方法的研究也成为高空间分辨率热点和难点之一。图像分割在图像理解中扮演着重要角色,由它得到的满足一定准则的同质区域, 区域的内部属性和外部属性(区域之间的包含、邻接关系)的组合对目标识别具有重要意 义。然而,到目前为止还没有一种图像分割方法能将影像中的所有目标完全区分开来,往 往会有过分割或欠分割现象,分割方法中参数设置的不同必然会产生不同的分割结果,而 且通常,同一分割方法在某参数下可能对某类目标达到较好的分割效果,而与此同时,其它 类型目标可能出现过分割或欠分割,很难实现某一尺度参数的设置就能达到对所有目标的 完全划分,往往只能针对某类目标在某种数据源下选择合适的分割参数,这也就是说细节 保留和大尺度在同一分割算法中很难并存,特别是对于高分辨率遥感影像,因此,通常研究 的图像分割只是一种可以实现从影像中将特定尺度目标划分开来的分割算法,选择不同参 数将从影像中获取不同细节(尺度大小)的对象。图像分割的主要目的是为了目标识别, 为目标识别提供所需特征。因此,提供可以提高分类和识别精度的分割结果以及有利于提 供目标识别所需对象也就成了是分割方法主要任务。图像分割中分割精确性与易分割性 的矛盾、过分割与欠分割的矛盾用固定尺度的分割技术难以解决,但通过多尺度分割技术 有可能解决这些矛盾,这方面研究和有待改进的主要内容包括基于多尺度的图像预处理; 更为合适的多尺度数据结构(描述和存储数据);与之配合更好的多尺度分割策略(抽取 数据的准则)。目前大多数多尺度分割都是结合多尺度分析理论,以事物在某一尺度下表现 为异质的结构要素,在大一级尺度上观测却是同质的这样一个尺度效应为分割准则,设置 不同的尺度参数来得到不同尺度上的分割结果,即大尺度粗分,小尺度细分,但没有建立大小尺度分割结果之间的联系以及分割结果的空间关系。同时,这种在多尺度图像预处理后 进行的图像分割,在高层次上会出现边界模糊不准确问题,从而不利于高层次目标准确提 取。地物本身属性、地物组成结构以及地物之间的邻接关系等对目标识别与分类具有重要 意义,因此,设计满足多尺度多层次表达的分割算法非常有意义。从目标识别角度考虑,人类认知世界、识别目标是将不同尺度组合,由粗到细、由 细到粗的认知过程,从一幅影像中判断出不同目标时,是综合了从图像中所观察到的各种 对象不同细节及其相互之间关系,如颜色、形状、纹理、大小、邻接、包含等关系才获得很高 的识别准确度,因此,在计算机目标识别、高分辨率遥感影像分类以及目标识别时,充分利 用影像所提供的目标的光谱、几何以及邻接、包含等特征,将会大大提高识别和分类精度, 正因如此,建立智能目标识别与分类系统,需要获取不同尺度对象的光谱、形状、纹理和邻 接关系,建立不同尺度的分类层次,这也就是说我们需要从影像中获取不同尺度、不同层次 的综合信息,而这也正是图像分割所要提供的信息。由前面分析可知,通过某一组特定尺度 参数得到的分割结果并不能达到完全描述这些信息的目的,因此,需要将不同尺度参数得 到的分割结果,由粗到细或由细到粗的分割信息进行描述,这就涉及到影像的多尺度多层 次分割与表达,为高分辨率遥感影像的目标识别提供有利证据。目前国外已有eCognition商业软件实现了基于区域增长考虑光谱与形状特征的 多尺度多层次影像分割,国内目前还没有这方面的软件来实现多尺度多层次分割,大多数 分割都是基于影像多尺度空间选择不同尺度影像进行分割,缺少层次之间以及邻接区域之 间空间关系的联系与描述。为了更好地分析和利用同一层对象之间的空间邻接关系、多尺度多层次信息、上 下层对象之间存在包含与被包含的关系,需要实现将小尺度目标合并得到大尺度目标的多 层次分割,这也正符合实际事物、地物层次划分思想。本发明研究并实现了基于最小生成树 的多层次多尺度影像分割,用金字塔图模型来表示各层数据以及层内、层间联系。目前金字 塔图模型主要有简单图(simple graph)、对偶图(dual graph)和组合图(combinatorial maps)三种金字塔表达模型。简单图是无自环、无重边的图,其结构简单、容易实现,计算效 率高,映射节点的父子关系方便,容易获取顶点间的邻接关系,具有很强的实用性,因此,广 泛应用于金字塔分割图模型中。金字塔收缩方法是指如何由G1得到G1+1,特别是对于图像分割来说,它确定了金字 塔的收敛高度以及所生成的每层数据的性质,合理的收缩方法可以避免金字塔过高而产生 存储空间消耗太大,这实际上就是分割准则的设置,准则设置的好坏也决定了生成的分割 区域性质。Haxhimusa等分别用对偶图[2_4]和组合图[5]构造金字塔,用Boruvka最小生 成树算法和文献W]中的分割准则实现了影像的多层次多尺度分割。构造最小生成树的图像分割思想省去了构建整幅图像最小生成树的过程,提高了 效率。但是,简单阈值准则对噪声敏感,而且此类方法在分裂或合并过程中,与原始数据无 关,仅与边权值有关。当然,也可以在算法实现和准则设置中将原始数据及其邻域关系考虑 进来,但这样将会增加计算复杂度。
背景技术:
中的引用文献1. Blaschke, T. and J. Strobl, What ‘ s wrong with pixels ? Some recent developmentsinterfacing remote sensing and GIS. GIS-Zeitschrift
4fiirGeoinformationssysteme, 2001. 14(6) :ρ· 12-17.2. Haxhimusa, Y. and W. Kropatsch, Hierarchy of Partitions with Dual GraphContraction, in Pattern Recognition.2003, Springer Berlin/Heidelberg, p. 338-345.3. Haxhimusa, Y. and W. Kropatsch, Segmentation Graph Hierarchies, in Proceedingsof Joint Workshops on Structural, Syntactic, and Statistical PatternRecognition S+SSPR. 2004, Springer Berlin/Heidelberg, p. 343-351.4. Kropatsch, W. G. and Y. Haxhimusa. Grouping and segmentation in a hierarchy ofgraphs, in Proceeding of the 16th IS&T/SPIE Annual Symposium. 2004.5. Ion, A. , Y. Haxhimusa, W. G. Kropatsch, and L. Brunz, Hierarchical ImagePartitioning using Combinatorial Maps, in Proceeding of the JointHungarian-Austrian Conference on Image Processing and Pattern Recognition, D.Chetverikov, L.Czuni, and M. Vincze, Editors. May 2005 :Hungary. p. 179—186.6. Felzenszwalb, P. F. and D. P. Huttenlocher, Efficient Graph-Based ImageSegmentation. International Journal of Computer Vision 200459(2) :p. 167-18
发明内容
针对多尺度多层次影像分割与描述问题,为避免多尺度空间中出现的边界模糊不 准确问题,同时能描述对象之间邻接关系以及上下层之间的关系,本发明提供了一种基于 最小生成树的多尺度多层次影像分割方法。本发明的技术方案包括如下步骤步骤一、将图像用简单图模型来表示,简单图模型的每个顶点对应图像的一个像 素,每两个邻接顶点之间用边连接,每条边的边权值为该边连接的两个顶点所对应两像素 之间的差异;步骤二、根据预先设定的区域合并准则以及分割参数对步骤一所得简单图模型进 行基于最小生成树的影像分割,分割时从简单图模型中的最小权值边开始按区域合并准则 进行增长直到最大权值边,合并生成的每个最小生成树代表一个连通的区域,得到初始的 分割结果;步骤三、以分割结果所得每个区域为顶点,每个区域与其邻接区域之间由边连接, 以区域与邻接区域间的直方图距离作为边权值,构造出新的简单图模型;步骤四、对步骤三所得简单图模型根据边权值进行基于最小生成树的影像分割, 得到新的分割结果,然返回到步骤三循环执行构造新的简单图模型并分割,每轮循环中进 行分割时采用的区域合并准则设置不同大小相似度阈值,经多次循环完成得到所需的多尺
度多层次影像分割,每轮循环得到的简单图模型和步骤一得到的简单图模型形成影像金字 +
-tB。而且,在步骤一,简单图模型中边权值为每条边的权重,采用波段加权欧氏距离来
计算权重。或者,在步骤一,简单图模型中边权值为每条边的权重,在图像为多波段影像时采用余弦角距离来计算权重。而且,在步骤二,预先设定的区域合并准则综合多种区域特性,包括考虑光谱、形 状和纹理。而且,在步骤二,分割参数根据预先设定的区域合并准则来进行设定,分割参数中 包含一个用于防止生成过小区域的最小区域面积大小参数。而且,在步骤三,邻接区域间的直方图距离采用适合于多波段统计特性比较的直 方图距离。而且,直方图距离采用的是卡方距离,邻接区域间的直方图距离取值范围为0-1。而且,影像金字塔每一层对应一个简单图模型,步骤一得到的简单图模型是影像 金字塔的最底层;整个影像金字塔用一个树结构来描述,该树结构反映上层某个区域由下 一层多个区域组成的对应关系。本发明采用图模型来描述影像以及分割所生成的每一层对象以及对象之间的邻 接关系,采用基于最小生成树理论的图像分割,以区域之间的直方图距离构建边权,通过设 置不同大小相似度阈值实现多尺度多层次影像分割。
图1为本发明的多层次多尺度分割金字塔构建示意图。
具体实施例方式以下结合附图和本发明的实施例,对本发明技术方案进行详细说明。实施例的实 现过程如下步骤一、将图像用简单图模型来表示,简单图模型的每个顶点对应图像的一个像 素,每两个邻接顶点之间用边连接,每条边的边权值为该边连接的两个顶点所对应两像素 之间的差异。简单图模型中边权值为每条边的权重,实施例采用波段加权欧氏距离来计算权 重。特别地,当图像为多波段影像时,还可以采用余弦角距离来计算权重。具体计算方式为 现有技术,本发明不予赘述。步骤二、根据预先设定的区域合并准则以及分割参数对步骤一所得简单图模型进 行基于最小生成树的影像分割,分割时从简单图模型中的最小权值边开始按区域合并准则 进行增长直到最大权值边,合并生成的每个最小生成树代表一个连通的区域,得到初始的 分割结果。最小生成树问题描述为寻找边权和最小的生成树,对于图像分割来说,寻找差异 最小的连通区域问题就可以转化为最小生成树问题。因此,在步骤一实现了将图像表示的 像素之间关系用简单图模型表示后,可以基于最小生成树对步骤一所得简单图模型进行影 像分割。基于最小生成树的图像分割主要有自顶向下分裂最小生成树与自底向上合并生成 多个最小生成树两种策略。实施例采用Kruskal最小生成树算法以及自底向上的合并策略 实现基于最小生成树的影像分割,具体算法和策略为现有技术,本发明不予赘述。在预先设定区域合并准则时,建议综合多种区域特性,包括考虑光谱、形状和纹理 等,具体实施可以根据需要设定。为方便实施参考起见,以下提供三种准则设定方案
6
A基于最小类内方差的考虑光谱和形状特征的分割准则,设判断是否能够合并的 对象为区域S1和区域&,两区域合并后所得对象的类内差异由( 式计算,若差异小于某 阈值th,则区域S1和区域&可以合并,若大于该阈值th则不合并,该准则表示为(1)式
权利要求
1.基于最小生成树的多尺度多层次影像分割方法,其特征是包括以下步骤, 步骤一、将图像用简单图模型来表示,简单图模型的每个顶点对应图像的一个像素,每两个邻接顶点之间用边连接,每条边的边权值为该边连接的两个顶点所对应两像素之间的差异;步骤二、根据预先设定的区域合并准则以及分割参数对步骤一所得简单图模型进行基 于最小生成树的影像分割,分割时从简单图模型中的最小权值边开始按区域合并准则进行 增长直到最大权值边,合并生成的每个最小生成树代表一个连通的区域,得到初始的分割结果;步骤三、以分割结果所得每个区域为顶点,每个区域与其邻接区域之间由边连接,以区 域与邻接区域间的直方图距离作为边权值,构造出新的简单图模型;步骤四、对步骤三所得简单图模型根据边权值进行基于最小生成树的影像分割,得到 新的分割结果,然后返回到步骤三循环执行构造新的简单图模型并分割,每轮循环中进行 分割时采用的区域合并准则设置不同大小相似度阈值,经多次循环完成得到所需的多尺度多层次影像分割,每轮循环得到的简单图模型和步骤一得到的简单图模型形成影像金字 + -tB。
2.根据权利要求1所述的多尺度多层次影像分割方法,其特征是在步骤一,简单图模 型中边权值为每条边的权重,采用波段加权欧氏距离来计算权重。
3.根据权利要求1所述的多尺度多层次影像分割方法,其特征是在步骤一,简单图模 型中边权值为每条边的权重,在图像为多波段影像时采用余弦角距离来计算权重。
4.根据权利要求1所述的多尺度多层次影像分割方法,其特征是在步骤二,预先设定 的区域合并准则综合多种区域特性,包括考虑光谱、形状和纹理。
5.根据权利要求1所述的多尺度多层次影像分割方法,其特征是在步骤二,分割参数 根据预先设定的区域合并准则来进行设定,分割参数中包含一个用于防止生成过小区域的 最小区域面积大小参数。
6.根据权利要求1所述的多尺度多层次影像分割方法,其特征是在步骤三,邻接区域 间的直方图距离采用适合于多波段统计特性比较的直方图距离。
7.根据权利要求6所述的多尺度多层次影像分割方法,其特征是直方图距离采用的 是卡方距离,邻接区域间的直方图距离取值范围为0-1。
8.根据权利要求1所述的多尺度多层次影像分割方法,其特征是影像金字塔每一层 对应一个简单图模型,步骤一得到的简单图模型是影像金字塔的最底层;整个影像金字塔 用一个树结构来描述,该树结构反映上层某个区域由下一层多个区域组成的对应关系。
全文摘要
本发明提出了一种基于最小生成树的多尺度多层次影像分割方法,采用图模型表达及实现多尺度多层次图像分割。该分割方法适合于各种影像以及各种准则得到的初始分割结果,有效地将过分割区域在高层分割中进行合并,避免了过分割现象;同时,不同层次多尺度分割结果对分析目标结构组成提供了不同层次的特征描述信息,对目标识别具有重要意义。
文档编号G06T7/00GK102096816SQ20111003181
公开日2011年6月15日 申请日期2011年1月28日 优先权日2011年1月28日
发明者崔卫红, 潘斌 申请人:武汉大学