专利名称:一种基于图像分类的图像检索方法
技术领域:
本发明属于多媒体信息检索领域,具体涉及一种基于图像分类的图像检索方法, 该方法涉及图像处理、计算机视觉、机器学习和图像检索等领域,可直接用于Web环境下和单台计算机下的基于内容的图像检索。
背景技术:
随着互联网的发展,多媒体信息特别是图像信息正以爆炸性的速度在产生和传播。面对这浩如烟海的图像宝库,如何挖掘那些符合自己需求的图像已经成为了一个十分棘手的问题,所以近年来图像检索领域正成为一个研究和工程实践的热点。目前,图像检索的方法主要有两种基于文本的图像检索和基于内容的图像检索。目前主流的图像搜索引擎采取的都是基于文本的图像检索技术,这种技术的实质还是传统意义上的文本检索技术,其过程是将与网络图像相关的文本信息如图像标题、链接文本、内容描述等建立索引来标注图像,最后采用关键字匹配技术来进行检索。然而由于语义的多义性以及描述的模糊性问题,使基于文本的图像检索技术的准确度受到比较大的限制,所返回的结果通常不符合用户的预期。基于内容的图像检索通过引入计算机视觉领域的技术,对图像像素级对象进行数学建模与求解,这样就用图像本身的内容特征作为了图像的标识。针对图像的内容特征提取方面,图像检索目前有一些转变从基于整幅图像的特征提取转变为基于区域(或对象) 的特征提取,这个转变的过程使得所提取的图像的特征更加的鲁棒,使特征在图像发生旋转和平移前后保持不变,并且在图像光照变化的前后也保持相对的不变性。基于内容的图像分类技术是计算机视觉与模式分类技术融合的结果,是在提取图像内容特征后运用模式分类的方法对图像进行自动学习和分类的技术。近十年,分类技术也得到了长足的进步,产生了基于统计概率理论的支持向量机方法,建立在底层简单分类器上的Adaboost方法,这些方法相较于之前的决策树、神经网络等方法分类准确率都大大的提升了。但是,原来的基于内容的图像检索由于计算量大很难应用到大型图像库系统中,在因特网上的应用就更少了,图像的分类方法也只是找出图像属于某一类别而没有进一步在这一类别中进行检索操作。
发明内容
本发明的目的在于提供一种基于图像分类的图像检索方法,该方法将图像分类技术融入到图像检索中,解决了当前基于内容的图像检索中检索速度慢的局限性。本发明提供的一种基于图像分类的图像检索方法,其步骤包括
A:确定在图像分类中图像的类别数Cm,各详细类别(C1,C2,…,Cm)以及与各类别对应的训练图像集(P1,P2,-,Pm);
B:提取训练图像集的内容特征用以训练分类器得到分类器C ;
C:输入待检索图像M,提取待检索图像M的内容特征作为分类器C的输入,分类器C的输出结果Co即为M的类别;
D:获得与类别Co对应的检索图像集IPo,并提取检索图像集IPo内每幅图像的内容特
征;
E:根据C、D获得的内容特征运用相似度计算算法得到待检索图像M与检索图像集IPo 内每幅图像的相似度距离,对距离进行排序最后得到与待检索图像M距离最小的N幅图像并输出。优选的,所述步骤B中提取的图像内容特征为SIFT特征,其具体步骤包括
Bll:提取训练图像集中每幅图像的SIFT特征点,构成一个特征点库,其中每个SIFT 特征点都是由1 维特征点描述子向量表示;
B12:对这个特征点库采用k均值聚类方法进行聚类操作,得到K类; B13:对于训练图像库中的单幅图像,将它的所有SIFT特征点根据最小距离原则各自映射到K类得到K维的特征向量VI,将特征向量Vl中的每个值除以该幅图像的特征点总数得到频率特征向量V2,V2即为该幅图像的SIFT特征。优选的,诉述步骤B中采用的分类器为支持向量机,可以采用开源的Iibsvm库进行开发,训练分类器的具体步骤包括
B21:选择RBF为支持向量机的核函数;
B22:将训练图像库中的特征向量结合每幅图像的类别信息作为支持向量机的输入; B23:采用交叉印证方法确定分类准确率最高时候的RBF核函数参数,确定参数后即得到支持向量机分类器C。优选的,步骤C中提取待检索图像M的内容特征的具体步骤包括
Cl:提取待检索图像M的SIFT特征点,其中每个SIFT特征点都是由1 维特征点描述子向量表示;
C2:将待检索图像M的所有SIFT特征点根据最小距离原则各自映射到B12的K类得到K维的特征向量VI,将特征向量Vl中的每个值除以该幅图像的特征点总数得到频率特征向量Vm,Vm即为M的SIFT特征。优选的,步骤E中采用的相似度计算算法为欧式距离法,相似度的度量准则为欧式距离越小越相似。本发明的有益效果本发明在传统基于内容的图像检索方法基础上融入了图像分类技术,大大提高了图像检索的速度。在图像的内容特征部分,采用了 SIFT特征,具有对图像的尺度缩放、亮度变化、旋转保持不变性的特点,使算法更加的鲁棒。
为了更清楚地说明本发明实施实例或现有技术中的技术方案,下面将对实施实例或现有技术描述中所需要使用的附图作简单地介绍。显而易见的,下面描述中的附图仅仅是本发明的一些实施实例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本发明整体构架流程图。图2是高斯差分尺度空间的构建过程。图3是尺度空间中寻找极值点的示意图。
图4是关键点邻域梯度信息生成特征向量的示意图。
具体实施例方式本发明的目的在于提供一种基于图像分类的图像检索方法,该方法将图像分类技术融入到图像检索中,解决了当前基于内容的图像检索中检索速度慢得局限性,为了使本发明的目的、技术方案和优点更加的清楚,下面将结合附图对本发明实施方式做具体的阐述。在具体介绍本发明的细节流程之前,对本发明需要用到的基础知识进行一下简要的介绍
A 图像的SIFT内容特征提取
图像的SIFT内容特征提取里面包含了两个基础的算法SIFT特征点描述子的提取和图像SIFT内容特征构造。Al: SIFT特征点描述子提取
SIFT算法由D. G. Lowe 1999年提出,2004年完善总结。SIFT算法是一种提取图像局部特征的算法,具有如下特点a) SIFT特征是图像的局部特征,其对图像的尺度缩放、亮度变化、旋转保持不变性,对放射变换、视角变化、噪声也保持一定程度的稳定性。b)信息量丰富,独特性好,适用于在海量特征数据库中进行快速、准确的匹配。c)即使少数的几幅不同的图像也可以产生大量不同的SIFT特征点描述子。d)可扩展性,可以很方便的与其他形式的特征向量进行融合。SIFT特征点描述子提取算法步骤如下1)检测尺度空间上的极值点2)精确定位极值点3)计算每个关键点的方向参数4)生成关键点的描述子。下面就每一步做一个详细的解释。All:尺度空间的生成
尺度空间理论目的是模拟图像数据的多尺度特性。实现尺度变换的唯一线性核只有高斯卷积核,一幅二维图像 /(U)的尺度空间定义为
权利要求
1.一种基于图像分类的图像检索方法,其特征在于该方法包括以下步骤A:确定在图像分类中图像的类别数Cm,各详细类别(C1,C2,…,Cm)以及与各类别对应的训练图像集(P1,P2,-,Pm);B:提取训练图像集的内容特征用以训练分类器得到分类器C ;C:输入待检索图像M,提取待检索图像M的内容特征作为分类器C的输入,分类器C的输出结果Co即为M的类别;D:获得与类别Co对应的检索图像集IPo,并提取检索图像集IPo内每幅图像的内容特征;E:根据C、D获得的内容特征运用相似度计算算法得到待检索图像M与检索图像集IPo 内每幅图像的相似度距离,对距离进行排序最后得到与待检索图像M距离最小的N幅图像并输出。
2.根据权利要求1所述的图像检索方法,其特征在于所述步骤B中提取的内容特征为SIFT特征,其具体步骤包括Bll:提取训练图像集中每幅图像的SIFT特征点,构成一个特征点库,其中每个SIFT 特征点都是由1 维特征点描述子向量表示;B12:对这个特征点库采用k均值聚类方法进行聚类操作,得到K类;B13:对于训练图像库中的单幅图像,将它的所有SIFT特征点根据最小距离原则各自映射到K类得到K维的特征向量VI,将特征向量Vl中的每个值除以该幅图像的特征点总数得到频率特征向量V2,V2即为该幅图像的SIFT特征。
3.根据权利要求1所述的图像检索方法,其特征在于所述步骤B中采用的分类器为支持向量机,可以采用开源的Iibsvm库进行开发,训练分类器的具体步骤包括B21:选择RBF为支持向量机的核函数B22:将训练图像库中的特征向量结合每幅图像的类别信息作为支持向量机的输入;B23:采用交叉印证方法确定分类准确率最高时候的RBF核函数参数,确定参数后即得到支持向量机分类器C。
4.根据权利要求1所述的图像检索方法,其特征在于所述步骤C中提取待检索图像M 的内容特征的具体步骤包括Cl:提取待检索图像M的SIFT特征点,其中每个SIFT特征点都是由1 维特征点描述子向量表示;C2:将待检索图像M的所有SIFT特征点根据最小距离原则各自映射到B12的K类得到K维的特征向量VI,将特征向量Vl中的每个值除以该幅图像的特征点总数得到频率特征向量Vm,Vm即为M的SIFT特征。
5.根据权利要求1所述的图像检索方法,其特征在于步骤E中采用的相似度计算算法为欧式距离法,相似度的度量准则为欧式距离越小越相似。
全文摘要
本发明涉及一种基于图像分类的图像检索方法,现有的方法检索速度比较慢。本发明首先确定在图像分类中图像的类别数以及与训练图像集;其次提取训练图像集的内容特征用以训练分类器得到分类器;然后输入待检索图像,提取待检索图像的内容特征作为分类器的输入,获得与类别对应的检索图像集,并提取检索图像集内每幅图像的内容特征;最后根据获得的内容特征运用相似度计算算法得到待检索图像与检索图像集内每幅图像的相似度距离,对距离进行排序最后得到与待检索图像距离最小的N幅图像并输出。本发明在传统基于内容的图像检索方法基础上融入了图像分类技术,大大提高了图像检索的速度。
文档编号G06F17/30GK102402621SQ20111044343
公开日2012年4月4日 申请日期2011年12月27日 优先权日2011年12月27日
发明者张明敏, 张辉, 李文庆, 潘志庚 申请人:浙江大学