一种基于最大相似度匹配的图片检索方法
【技术领域】
[0001] 本发明涉及一种相似图片检索方法,尤其是涉及一种基于最大相似度匹配的图片 检索方法。
【背景技术】
[0002] 计算机视觉在近几年内得到了快速发展,尤其是图像检索,由于其丰富的应用场 景而备受关注。
[0003] 图像局部特征是用于图像处理领域的一类特征,在尺度空间寻找极值点,提取位 置、尺度、旋转不变量,可在图像中检测出关键点。
[0004] 非聚合模型是特征匹配的一种近似方法。在此模型中,局部特征被量化到与它最 近的事先训练好的字典中的视觉词语上,并存储下此特征与相应视觉词语的残差向量,置 入倒排索引中以作查询使用。
[0005] 现如今,基于局部特征和非聚合模型的图像检索系统是最为常用的系统之一,它 具有精度高、速度快等特点,但是,此模型还存在以下问题:
[0006] 由于非聚合模型的近似特性,使得多重匹配问题不可避免地出现在视觉匹配过程 中,从而影响了最终的精度。
【发明内容】
[0007] 本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种鲁棒性好、计算 效率高的基于最大相似度匹配的图片检索方法。
[0008] 本发明的目的可以通过以下技术方案来实现:
[0009] 一种基于最大相似度匹配的图片检索方法,包括以下步骤:
[0010] 1)获取训练图片集;
[0011] 2)在多尺度空间上对获取的图片进行特征点检测和描述;
[0012] 3)对步骤2)提取的特征集进行聚类并生成包含k个视觉词汇的视觉字典;
[0013] 4)将步骤2)提取的每个特征映射到与当前特征12距离最小的视觉词汇上,并将 当前特征与相应视觉词汇的归一化残差向量存储在倒排索引结构中,形成查询数据库;
[0014] 5)获取待检索图片,执行步骤2)和4),获得待检索图片的倒排索引结构,根据该 倒排索引结构检索查询数据库,基于最大相似度匹配,获得待检索图片的检索结果。
[0015] 所述步骤2)中,采用改进版本Hessian-Affine特征点检测算法和SIFT局部特征 描述子在多尺度空间上进行特征点检测和描述,具体为:
[0016] la)使用Hessian-Affine特征点检测算法对图片进行检测,得到局部特征点集Z ={zp. . .,zn},n为特征点数量;
[0017] lb)对于Z,使用SIFT局部特征描述子进行描述,得到对应的特征向量X= {xp? ? ?,xn},其中,128 维特征向量,i= 1,? ? ?,n。
[0018]所述改进版本Hessian-Affine特征点检测算法中,固定特征点主方向为垂直向 下。
[0019] 所述步骤3)具体为:
[0020] 3a)利用k均值聚类算法将提取出的特征集F中的所有特征聚成k个类,其中,F ={Fp. . .,Fs},为从拥有s张图片的图片集N中提取出的特征集;
[0021] 3b)记录并保存每个类的中心点,组成视觉词典:C= {Cl,. . .,ck},其中,每一个视 觉词汇(^都是一个128维向量,i= 1,. . .,k。
[0022] 所述步骤4)具体为:
[0023] 4a)对于某一特征X,依次计算其与每一个视觉词汇的12距离d,并找出距离最小 的视觉词汇c:
【主权项】
1. 一种基于最大相似度匹配的图片检索方法,其特征在于,包括以下步骤: 1) 获取训练图片集; 2) 在多尺度空间上对获取的图片进行特征点检测和描述; 3) 对步骤2)提取的特征集进行聚类并生成包含k个视觉词汇的视觉字典; 4) 将步骤2)提取的每个特征映射到与当前特征12距离最小的视觉词汇上,并将当前 特征与相应视觉词汇的归一化残差向量存储在倒排索引结构中,形成查询数据库; 5) 获取待检索图片,执行步骤2)和4),获得待检索图片的倒排索引结构,根据该倒排 索引结构检索查询数据库,基于最大相似度匹配,获得待检索图片的检索结果。
2. 根据权利要求1所述的基于最大相似度匹配的图片检索方法,其特征在于,所述步 骤2)中,采用改进版本Hessian-Affine特征点检测算法和SIFT局部特征描述子在多尺度 空间上进行特征点检测和描述,具体为: la) 使用Hessian-Affine特征点检测算法对图片进行检测,得到局部特征点集Z = 仏,…,zn},n为特征点数量; lb) 对于Z,使用SIFT局部特征描述子进行描述,得到对应的特征向量X = {Xi,…,xn}, 其中,14为128维特征向量,i = 1,…,n。
3. 根据权利要求2所述的基于最大相似度匹配的图片检索方法,其特征在于,所述改 进版本Hessian-Affine特征点检测算法中,固定特征点主方向为垂直向下。
4. 根据权利要求1所述的基于最大相似度匹配的图片检索方法,其特征在于,所述步 骤3)具体为: 3a)利用k均值聚类算法将提取出的特征集F中的所有特征聚成k个类,其中,F = {Fi,…,FJ,为从拥有s张图片的图片集N中提取出的特征集; 3b)记录并保存每个类的中心点,组成视觉词典:C= {Cl,…,ck},其中,每一个视觉词 汇(^都是一个128维向量,i = 1,…,k。
5. 根据权利要求2所述的基于最大相似度匹配的图片检索方法,其特征在于,所述步 骤4)具体为: 4a)对于某一特征X,依次计算其与每一个视觉词汇的12距离d,并找出距离最小的视 觉词汇c :
4b)对X进行上述操作,则获得X中属于词汇c的特征子集: Xc= {x G X:q(x) = c} 4c)将每一个特征x与所属的视觉词汇向量c的归一化残差向量r (x)存储在倒排索引 结构中,其中:
6. 根据权利要求1所述的基于最大相似度匹配的图片检索方法,其特征在于,所述步 骤5)中,根据待检索图片倒排索引结构采用最大相似度匹配在查询数据库中进行检索,获 得与该待检索图片的检索结果,所述最大相似度匹配的核函数为:
其中,乂。= {x G父:9(1)},¥。= {y G Y:q(y)}分别表示待检索图片特征点集合X和与 其对应的训练图片特征点集合Y中属于视觉词汇c的特征子集,m = max (#X。,#Y。),#Xe、#Y。 分别为集合X。、Y。的基数,r (x J为X。中第i个特征所对应的归一化残差向量,r (y p为Y。 中第j个特征所对应的归一化残差向量,k表示集合X。的第k种排列,〇 (?)为非线性函 数,定义为:
〇
【专利摘要】本发明涉及一种基于最大相似度匹配的图片检索方法,包括以下步骤:1)获取训练图片集;2)在多尺度空间上对获取的图片进行特征点检测和描述;3)对步骤2)提取的特征集进行聚类并生成包含k个视觉词汇的视觉字典;4)将步骤2)提取的每个特征映射到与当前特征l2距离最小的视觉词汇上,并将当前特征与相应视觉词汇的归一化残差向量存储在倒排索引结构中,形成查询数据库;5)获取待检索图片,执行步骤2)和4),获得待检索图片的倒排索引结构,根据该倒排索引结构检索查询数据库,基于最大相似度匹配,获得待检索图片的检索结果。与现有技术相比,本发明具有鲁棒性好、计算效率高等优点。
【IPC分类】G06K9-66, G06F17-30
【公开号】CN104615676
【申请号】CN201510028073
【发明人】王瀚漓, 王雷, 朱冯贶天
【申请人】同济大学
【公开日】2015年5月13日
【申请日】2015年1月20日