专利名称:基于作者-流派主题模型的遥感图像自动类别标注方法
技术领域:
本发明涉及数字图像技术,特别涉及遥感图像智能处理技术。
背景技术:
遥感图像标注是遥感图像分析和理解的重要内容之一。遥感图像标注指的是以注释的形式给遥感图像分配数据,比如,自动标注出图像中的商业区、居民区、农田等类别区域。遥感图像标注在遥感图像检索系统中发挥着重要作用。对遥感图像进行自动类别标注的过程就是根据预先定义的遥感图像目标类对图像中的多类目标进行分类的过程。现有遥感图像的类别标注方法主要分为三类(I)基于机器学习的方法;(2)基于 系统的方法;(3)通过挖掘多种类型的数据信息或附加的数量和种类信息来进行图像标注的方法。这些方法主要结合低级别(Low-level)特征来进行遥感图像标注。但是由于语义鸿沟(Semantic Gap)的存在,低级别特征往往不能准确描述图像语义。因此,人们发展了一些可以将低级语义特征映射到高级语义特征的方法,从而填补了语义鸿沟,这些方法包括概率潜在语义分析(Probabilistic Latent Semantic Analysis, PLSA)模型、潜在狄利克雷分配(Latent Dirichlet Allocation, LDA)模型和作者主题模型(Author TopicModel, ATM)等方法。Lienou提出了一种基于LDA模型的遥感图像类别标注方法。其中,作者即为类别,LDA模型可以将每一类的集合看做是潜在主题的随机混合,每一个主题可以用视觉单词的分布来描述。该方法主要针对QuickBird卫星的全色图像,采用图像的均值和方差作为特征。但是,不同传感器获取的遥感图像,其特征也存在很大的不同,对于多光谱遥感图像,采用均值和方差来描述图像特征是不够的。为了克服基于LDA模型的遥感图像类别标注方法不能对多光谱遥感图像进行类别标注的缺陷,Luo等人提出了基于作者主题模型(Author-Topic Model, ATM)的遥感图像类别标注方法,该方法采用了一种新的基于颜色和形状特征的描述符,并结合ATM对遥感图像进行类别标注。通过对实际的遥感图像进行类别标注实验,可以得出,提出的基于ATM的遥感图像标注方法在区域类别较少的情况下具有较高的分类准确率。但是,在区域类别较多的情况下,由于存在特征相似的不同类区域,使得基于ATM的遥感图像类别标注方法的分类准确率严重下降。
发明内容
本发明所要解决的技术问题是,提供一种在区域类别较多,不同区域之间特征相似情况下提高类别标注精度的遥感图像自动类别标注方法。本发明为解决上述技术问题所采用的技术方案是,基于作者-流派主题模型的遥感图像自动类别标注方法,包括以下步骤一、训练与作者-流派主题模型生成步骤
I)对训练图像设置每个视觉单词Wi和作者Xa、主题Zt和流派Cg的总个数以及视觉单词Wi分别与主题Zt、流派Cg之间匹配关系;作者Xa表示图像块的类别标签,流派Cg表示图像块的场景标签;其中,i e {1,一,1^},1^为不同视觉单词的个数;&£ {1,···,Α},Α为作者总数;t e {1,…,Τ},T为主题总数;g e {I,…,G},G为流派总数;2)通过吉布斯采样得到视觉单词Wi在主题Zt中出现的概率、主题Zt下的视觉单词在作者Xa中出现的概率 ta、流派Cg下的视觉单词在作者Xa中出现的概率Vga ;二、遥感图像的视觉单词计算步骤将遥感图像分割为互不重叠的,大小相同的图像块Id,计算各图像块Id包含的各视觉单词Wi ;所述视觉单词Wi由各图像块Id进一步划分为均匀采样块,并将均匀采样块表示为特征描述符,通过k均值聚类方法将特征描述符量化得到;每一个图像块Id均映射为一系列视觉单词;三、遥感图像的类别判定与标注步骤I)利用各图像块Id对应的视觉单词Wi以及作者-流派主题模型的三种概率分布对各图像块Id对应的场景、别进行估计
权利要求
1.基于作者-流派主题模型的遥感图像自动类别标注方法,其特征在于,包括以下步骤 一、训练与作者-流派主题模型生成步骤 1)对训练图像设置每个视觉单词Wi和作者Xa、主题Zt和流派Cg的总个数以及视觉单词Wi分别与主题Zt、流派Cg之间匹配关系;作者Xa表示图像块的类别标签,流派Cg表示图像块的场景标签;其中,i e U,一,khk为不同视觉单词的个数;a e {1,…,A},A为作者总数;t e {1,…,T},T为主题总数;g e {I, ...,G},G为流派总数; 2)通过吉布斯采样得到视觉单词Wi在主题Zt中出现的概率、主题Zt下的视觉单词在作者Xa中出现的概率 ta、流派Cg下的视觉单词在作者Xa中出现的概率Vga; 二、遥感图像的视觉单词计算步骤将遥感图像分割为互不重叠的,大小相同的图像块Id,计算各图像块Id包含的各视觉单词Wi ;所述视觉单词Wi由各图像块Id进一步划分为均匀采样块,并将均匀采样块表示为特征描述符,通过k均值聚类方法将特征描述符量化得到;每一个图像块Id均映射为一系列视觉单词; 三、遥感图像的类别判定与标注步骤 1)利用各图像块Id对应的视觉单词Wi以及作者-流派主题模型的三种概率分布对各图像块Id对应的场景一分别进行估计
2.如权利要求I所述基于作者-流派主题模型的遥感图像自动类别标注方法,其特征在于,所述采样块的特征描述符为颜色和形状特征描述符。
3.基于作者-流派主题模型的遥感图像自动类别标注方法,其特征在于,描述符和形状特征描述符;颜色描述符用来描述采样块的颜色特征,形状描述符用来描述采样块的形状特征; 采样块的颜色特征用颜色直方图表示,分别将红、绿、蓝三个通道的直方图归一化到[O,I],再将三个通道的直方图连接起来就构成了一个高维的颜色通道直方图,颜色特征描述符通过该高维颜色直方图表示; 形状特征描述符采用归一化到[O,I]的金字塔方向梯度直方图表示; 将颜色特征描述符和形状特征描述符连接起来得到的高维特征描述符为颜色和形状描述符。
4.如权利要求I所述基于作者-流派主题模型的遥感图像自动类别标注方法,其特征在于,视觉单词Wi在主题Zt中出现的概率Φη为··
全文摘要
本发明提供一种在区域类别较多,不同区域之间特征相似情况下提高类别标注精度的遥感图像自动类别标注方法。基于作者-流派主题模型的遥感图像自动类别标注方法,包括步骤一、训练与作者-流派主题模型生成步骤;二、遥感图像的视觉单词计算步骤;三、遥感图像的类别判定与标注步骤,在步骤中增加了作者的流派这个信息,使得同一个图像块同时具有作者和流派两个标注信息,再估计得到图像块的流派信息之后,再对估计的作者信息进行纠正,有效地提高了类别标注的精度。
文档编号G06K9/62GK102819746SQ20121023666
公开日2012年12月12日 申请日期2012年7月10日 优先权日2012年7月10日
发明者李宏亮, 罗旺 申请人:电子科技大学