专利名称:一种基于改进支持向量机相关反馈的遥感图像检索方法
技术领域:
本发明涉及计算机图像检索技术领域,具体的说是一种基于改进支持向量机相关反馈的遥感图像检索方法。
背景技术:
STrtWWS^ISft^^ (Content-based Remote Sensing Image Retrieval, CBRSIR),即所谓的“图找图”,它是在基于内容的图像检索(Content-based Image Retrieval,CBIR)的基础上发展起来的一种新的媒体信息检索技术。它通过提取遥感图像中的视觉特征(颜色、形状、纹理、光谱等)来表达图像的内容。从媒体内容中提取信息线索,利用近似匹配技术,以相关反馈为有效手段,实现在大型数据库的快速检索。而要想满足遥感图像检索的精度要求,必须加入相关反馈技术,由简单的一次检索转向交互学习的多次检索。(参考文献:R. LU0, Y. S. ZHANG, Y. H. FAN, et al. Research on content-based remote sensing image retrieval the strategy for visual feature selection, extraction, description and similarity measurement[C]//2001 International Conferences on Info-tech and Info-net, Beijing, 2001, vol. 1 :321-325.[罗眷,张永生,范永红,等.基于内容的遥感图像检索研究视觉特征选择,提取,描述和相似性度量策略[C]//2001年国际信息科技与信息网络大会,北京,2001,第1卷321-325.])相关反馈(Relevance Feedback, RF)是指按照最初的查询条件,查询系统返回给用户查询结果,用户可以人为介入(或者自动)来选择几个最符合他查询意图的返回结果 (正反馈),也可以选择最不符合他查询意图的几个返回结果(负反馈)。这些反馈信息被送入系统用来更新查询条件,重新进行查询。从而让随后的搜索更符合查询者的真实意图。 图像检索中的相关反馈也是一个人机交互的过程,用户根据系统的初始检索结果,标记出相关和不相关图像,检索系统根据这个反馈信息调整检索方式,再次给出检索结果,如此反复,直到用户满意为止。通过相关反馈过程,图像检索的精度可以得到有效地提高。(参考文献:Yong Rui,T. S. Huang,Μ. Ortega,S. Mehrotra. Relevance feedback :a power tool for interactive content-based image retrieval[J]. IEEE Transactions on Circuits and Systems for Video Technology,1998,8 (5) :644-655.[芮勇,托马斯 黄,迈克尔 奥尔特加,沙拉德特拉·贝克曼.相关反馈交互式基于内容图像检索的强大工具[J]. IEEE会刊——关于视频技术的电路与系统,1998,8(5) :644-655.] ;Karthik P. Suman, C.V. Jawahar. Analysis of Relevance Feedback in Content Based Image Retrieval. [C]//9th International Conference on Control, Automation, Robotics and Vision, Singapore, 2006 :1-6.[卡斯克·皮·苏曼,贾瓦.基于内容的图像检索的相关反馈分析 [C] //第九届国际控制,自动化,机器人及视觉大会,新加坡,2006 1-6.])视觉特征相似性度量是一个距离函数,通过遥感图像特征值的之间的距离来判断图像之间的相似性。它将数据库中每幅遥感图像看作高维空间中的一个点,使用欧几里德距离(欧式距离)等距离公式计算查询图像和数据库中遥感图像的视觉特征的相似度。距离较近的遥感图像与查询图像的特征较相似,距离较远的图像则与查询图像的特征差异较大。现在常用的相似性度量方法有欧几里得距离(Euclid)、马氏距离(Mahalanobis)、二次式距离(Quadratic)以及直方图交(Histogram Intersection)等。(参考文献Q. ΒΑ0, P. GUO. Comparative studies on similarity measures for remote sensing image retrieval[C]//IEEE International Conference on Systems, Man and Cybernetics, Hague,2004 :1112-1116.[包倩,郭平.遥感图像检索中相似性度量方法的比较研究[J]· IEEE国际系统,人类与控制论大会,海牙(荷兰),2004:1112-1116.];陈兴峰.基于内容的遥感图像数据库检索研究及实现[D].电子科技大学,2008.)支持向量机(SupportVector Machine,SVM)是 Vladimir N. Vapnik 等人提出的一种基于统计学习理论的机器学习算法。由于SVM有统计学习理论作为其坚实的数学基础,是基于结构风险最小化准则的,因此其推广能力明显优于一些传统的学习方法,可以较好地解决小样本、非线性问题以及克服维数灾难和过拟合等传统算法所不可规避的问题。其核心思想是采用最大间隔分类面思想和基于核的方法,通过在原空间或经投影后在高维空间中构造最优分类面,将给定的属于两个类别的训练样本分开,构造超平面的依据是两类样本离超平面的距离最大化,表现出了很好的泛化能力。(参考文献Vapnik V N. Statistical Learning Theory [Μ]. New York :Wiley,1998.[弗拉基米尔 维普尼克.统计学习理论[M].纽约威利,1998. ] ;Vapnik V N. The nature of statistical learning theory [M]. New York Springer-Ver lag, 1999. [^ /]^ · S1M^ -统计学习理论的本质[Μ].纽约斯普林格出版社,1999. ] ;Cristianini N, Shawe Taylor J. An introduction to support vector machine[M]. New York Cambridge University Press, 2000.[克里斯蒂亚尼尼,绍依 泰勒.支持向量机导论[M].纽约剑桥大学出版社, 2000.])基于支持向量机的相关反馈是将支持向量机理论与传统的遥感图像检索相关反馈过程相结合的产物,将遥感图像检索的相关反馈过程看作模式识别的二分类问题,从而很好地发挥支持向量机的强大分类学习功能。具体来讲,就是将检索结果图像作为训练样本,由用户标记出正例样本(其他为反例样本),并与旧的正例集合组成一个新的正例集合,而反例样本则与旧的反例集合组成一个新的反例集合。通过对这些正例和反例进行SVM 学习,可以得到一个代表用户检索目标的SVM分类器。然后用该分类器对图像库中的所有遥感图像进行分类,对于分为正类的遥感图像,求出每幅图像相对于分类面的距离,离分类面越远的图像就越接近查询样例,按此距离从大到小再次排序返回结果。目前,这种基于支持向量机相关反馈的遥感图像检索技术能够充分挖掘用户的语义信息,根据用户提供的反馈信息来学习用户的检索要求,从而进一步提高遥感图像检索的精度。(参考文献Lei Zhang, Fuzong, Lin Bo.Support vector machine learning for image retrieval[C]// Proceedings of 2001 International Conference on Image Processing,Thessaloniki, 2001,vol. 2 :721-7 .[张磊,林福宗,博林.图像检索的支持向量机学习[C]//2001年国际图像处理大会,萨罗尼加(希腊),2001,第2卷721-724.] ;Xuejun Wang, Lingling Yang. Application of SVM Relevance Feedback Algorithms in Image Retrieval[C]// International Symposium on Information Science and Engineering, Shanghai,2008, vol. 1 :210-213.[王学军,杨玲玲.基于支持向量机的相关反馈算法在图像检索中的应用[C]//国际信息科学与工程专题论文集,上海,2008,第1卷210-213.])虽然这种基于支持向量机相关反馈的遥感图像检索算法能够根据用户提供的小样本进行学习并构造代表用户检索目标的分类器,并通过这一分类器对图像库中的所有图像进行相似性大小的判别,进而有效地提高图像检索的精度,很好地解决了图像低层视觉特征与用户查询的高层语义特征之间的“鸿沟”。但是,该算法没有考虑到返回的检索结果图像在排序上的先后顺序问题,即这种策略有时在返回检索结果时,会将不相关遥感图像排在前面,而相关遥感图像则被排在了后面。视觉特征相似性度量函数能够抓住遥感图像的视觉特征信息,对于具有相似特征的同类图像具有很好的聚类作用,且在特征区分度较高的情况下,能够将视觉特征相似的遥感图像排序在一起。尽管这种方法对于特征差异明显的遥感图像能够很好地在欧式空间中进行区分,但对于特征相近但语义类别不同的遥感图像则区分效果欠佳。与基于支持向量机的相关反馈分类方法相比,缺少通过对特征空间维度变化来增加特征区分度的能力。
发明内容
针对上述现有技术中存在的遥感图像检索及模式识别领域的问题,由于往往因为相关反馈的相似性度量策略不同,其反馈检索的结果在内容和顺序上具有一定的差异,本发明要解决的技术问题是提供一种既提高遥感图像检索精度,又能够将检索结果进行合理排序的相关反馈策略的基于改进支持向量机相关反馈的遥感图像检索方法。为解决上述技术问题,本发明采用的技术方案是本发明一种基于改进支持向量机相关反馈的遥感图像检索方法包括以下步骤(1)建立遥感图像数据库,并从库中选择一幅满足检索目标的图像作为查询图像;(2)在上述遥感图像数据库中进行遥感图像特征提取,得到特征向量;(3)基于上述特征向量,计算遥感图像库中图像与查询图像特征向量的欧式距离, 并按照该距离大小,从小到大排序返回规定数目的遥感图像作为初始检索的结果;(4)相关反馈对初始检索的结果进行评价,如果满意则检索结束。遥感图像特征提取包括以下步骤(2-1)颜色特征提取从遥感图像数据库的所有遥感图像中选择三个波段作为彩色空间中R,G,B三个通道的分量,分别计算遥感图像数据库中每个遥感图像三个颜色分量的均值和方差,并以此构造颜色特征向量;(2-2)Gabor纹理特征提取分别计算遥感图像数据库中所有遥感图像在图像坐标多个方向上、多个空间频率的Gabor滤波能量值的均值和方差,并构成Gabor纹理特征向量;(2-3)小波纹理特征对遥感图像数据库中所有遥感图像进行多级小波分解,并舍去低频信息的子图像,对剩余的子图像计算其熵值和能量值构成小波纹理特征向量;(2-4)灰度共生矩阵的纹理特征提取分别计算遥感图像数据库中所有遥感图像在图像坐标多个方向、相邻距离为d的灰度共生矩阵,然后基于所得到的灰度共生矩阵分别计算其对比度,能量和相关性构成灰度共生矩阵的纹理特征向量,d为正整数;(2-5)光谱特征提取分别计算遥感图像数据库中所有遥感图像的各种光谱指数,并构成光谱特征向量。所述相关反馈的步骤如下(4-1)用户反馈由用户标记出与查询遥感图像相似的相关遥感图像和与查询遥感图像不相似的不相关遥感图像;(4-2)构造训练样本将相关遥感图像作为正类样本,不相关遥感图像作为负类样本;(4-3)训练SVM分类器将上述正类样本和负类样本作为训练样本进行SVM学习, 得到一个代表用户检索目标的SVM分类器;(4-4)图像数据库图像分类利用SVM分类器对遥感图像数据库中的所有遥感图像进行分类,得到正类和负类两个类别;(4-5)运用相关反馈的相似性度量准则,针对正类和负类遥感图像分别运用不同的相似性度量计算公式,计算得到图像库中遥感图像与查询图像的相似度。相关反馈中计算正类遥感图像的相似性的公式为D(I) =WsvmDsvm (I)+WsifflDsim (I)Dsvm(I) = 1/f (χ),f (χ)彡 0相关反馈中计算负类遥感图像的相似性的公式为D(I) =WsvmDsvm (I)+WsifflDsim (I)Dsvm(I) = e-f(x),f (χ) < 0其中,I为遥感图像库中的遥感图像;D (I)为相关反馈中的相似性度量函数;f (X) 为SVM的分类超平面函数;Dsvm(I)为关于SVM的分类超平面函数的函数,用于衡量图像I与查询图像的相似度;Dsim(I)为欧式空间中度量视觉特征相似性的距离函数,用于计算图像 I与查询图像的相似性距离;Wsvs^Pffsim分别是Dsvm(I)和Dsim(I)的权值。如果正类遥感图像数多于所需的相似图像数目,则只对正类图像运用针对正类的相似性度量公式,否则,在对正类图像进行相似性计算排序后,再对负类图像运用其相应的相似性度量公式,并进行相似性排序,在正类图像之后依序补充不足所需的相似图像数目的部分。所述的检索结果评价包括如下评价指标假设仏,…,%为查询图像,对第i个查询图像仏,I,),…,Iai(i)为正确的检索结果,Λω,…,Jbiω为错误的检索结果,设rankC/^)为if在检索结果的排序值,则
权利要求
1.一种基于改进支持向量机相关反馈的遥感图像检索方法,其特征在于包括以下步骤(1)建立遥感图像数据库,并从库中选择一幅满足检索目标的图像作为查询图像;(2)在上述遥感图像数据库中进行遥感图像特征提取,得到特征向量;(3)基于上述特征向量,计算遥感图像库中图像与查询图像特征向量的欧式距离,并按照该距离大小,从小到大排序返回规定数目的遥感图像作为初始检索的结果;(4)相关反馈对初始检索的结果进行评价,如果满意则检索结束。
2.按权利要求1所述的基于改进支持向量机相关反馈的遥感图像检索方法,其特征在于遥感图像特征提取包括以下步骤(2-1)颜色特征提取从遥感图像数据库的所有遥感图像中选择三个波段作为彩色空间中R,G,B三个通道的分量,分别计算遥感图像数据库中每个遥感图像三个颜色分量的均值和方差,并以此构造颜色特征向量;(2-2)Gabor纹理特征提取分别计算遥感图像数据库中所有遥感图像在图像坐标多个方向上、多个空间频率的Gabor滤波能量值的均值和方差,并构成Gabor纹理特征向量; (2-3)小波纹理特征对遥感图像数据库中所有遥感图像进行多级小波分解,并舍去低频信息的子图像,对剩余的子图像计算其熵值和能量值构成小波纹理特征向量;(2-4)灰度共生矩阵的纹理特征提取分别计算遥感图像数据库中所有遥感图像在图像坐标多个方向、相邻距离为d的灰度共生矩阵,然后基于所得到的灰度共生矩阵分别计算其对比度,能量和相关性构成灰度共生矩阵的纹理特征向量,d为正整数;(2-5)光谱特征提取分别计算遥感图像数据库中所有遥感图像的各种光谱指数,并构成光谱特征向量。
3.按权利要求1所述的基于改进支持向量机相关反馈的遥感图像检索方法,其特征在于所述相关反馈的步骤如下(4-1)用户反馈由用户标记出与查询遥感图像相似的相关遥感图像和与查询遥感图像不相似的不相关遥感图像;(4-2)构造训练样本将相关遥感图像作为正类样本,不相关遥感图像作为负类样本; (4-3)训练SVM分类器将上述正类样本和负类样本作为训练样本进行SVM学习,得到一个代表用户检索目标的SVM分类器;(4-4)图像数据库图像分类利用SVM分类器对遥感图像数据库中的所有遥感图像进行分类,得到正类和负类两个类别;(4-5)运用相关反馈的相似性度量准则,针对正类和负类遥感图像分别运用不同的相似性度量计算公式,计算得到图像库中遥感图像与查询图像的相似度。
4.按权利要求3所述的基于改进支持向量机相关反馈的遥感图像检索方法,其特征在于相关反馈中计算正类遥感图像的相似性的公式为D(I) = WsvmDsvm (I)+WsimDsim (I)Dsvm(I) = l/f(x), f(x) ^ O相关反馈中计算负类遥感图像的相似性的公式为D(I) = WsvmDsvm (I)+WsimDsim (I)
5.按权利要求3所述的基于改进支持向量机相关反馈的遥感图像检索方法,其特征在于如果正类遥感图像数多于所需的相似图像数目,则只对正类图像运用针对正类的相似性度量公式,否则,在对正类图像进行相似性计算排序后,再对负类图像运用其相应的相似性度量公式,并进行相似性排序,在正类图像之后依序补充不足所需的相似图像数目的部分。
6.按权利要求1所述的基于内容的遥感图像检索中相关反馈的实现方法,其特征在于所述的检索结果评价包括如下评价指标假设仏,…,A为查询图像,对第i个查询图像Qi, 1严,…,Iai(i)为正确的检索结果, Λω,…,Jbi(i)为错误的检索结果,设
全文摘要
本发明涉及一种基于改进支持向量机相关反馈的遥感图像检索方法包括以下步骤建立遥感图像数据库,并从库中选择一幅满足检索目标的图像作为查询图像;在上述遥感图像数据库中进行遥感图像特征提取,得到特征向量;基于上述特征向量,计算遥感图像库中图像与查询图像特征向量的欧式距离,并按照该距离大小,从小到大排序返回规定数目的遥感图像作为初始检索的结果;相关反馈对初始检索的结果进行评价,如果满意则检索结束。本发明很好地解决了原有基于支持向量机的相关反馈算法在检索结果排序上存在的问题,可用于遥感图像检索相关的多个应用领域,尤其是高维特征空间的分类识别问题,可有效提高遥感图像检索的精度和检索结果排序的合理性。
文档编号G06F17/30GK102467564SQ20101055236
公开日2012年5月23日 申请日期2010年11月12日 优先权日2010年11月12日
发明者于新菊, 唐家奎, 张成雯, 李勇志, 王后茂, 王春磊, 米素娟, 赵理君 申请人:中国科学院烟台海岸带研究所