一种相似图像检索方法与流程

文档序号:17662594发布日期:2019-05-15 22:29阅读:299来源:国知局
一种相似图像检索方法与流程

本发明涉及计算机技术领域,尤其涉及一种相似图像检索方法。



背景技术:

参见图1,图中给出的是现有的相似图像检索方法,其采用的是顺序遍历方式,基本过程为:1、依次对已有图像提取特征值,并将提取到的已有图像的特征值建立图像特征值数据库;2、提取待检索图像的特征值;3、将待检索图像的特征值通过顺序遍历方式与图像特征值数据库中每一幅图像的特征值进行比对,并计算待检索图像与图像特征值数据库中每一幅图像之间的特征值距离;4、确定图像特征值数据库中与待检索图像的特征值距离最小的图像,并判断该特征值距离是否小于预设的阈值;5、若该特征值距离小于预设的阈值,则这一幅图像为待检索图像的相似图像,完成整个检索过程。但是,这种检索方法存在以下一些问题:1、计算速度慢。每次检索相似图像都需要遍历整个图像特征值数据库并计算特征值距离,随着图像特征值数据库的扩大,检索时间也会相应增加,当图像数量达到千万级时,可能需要数秒时间才能完成一次检索;2、磁盘读写压力大。由于每次图像检索都需要遍历整个图像特征值数据库,对整个图像特征值数据库进行读取,占用大量的磁盘读写时间。

为此,本申请人经过有益的探索和研究,找到了解决上述问题的方法,下面将要介绍的技术方案便是在这种背景下产生的。



技术实现要素:

本发明所要解决的技术问题在于:针对现有技术的不足而提供一种在保证检索精度的情况下提高图像检索速度、降低磁盘读写压力的相似图像检索方法。

本发明所要解决的技术问题可以采用如下技术方案来实现:

一种相似图像检索方法,包括以下步骤:

获取待检索图像,并计算所述待检索图像的二进制哈希特征值;

对所述待检索图像所计算得到的二进制哈希特征值进行分段处理,使得所述二进制哈希特征值被分隔成若干段哈希特征值;

在已构建的图像特征值数据库中进行检索,找出含有至少任意一段哈希特征值的所有图像,并将这些图像整理成最终的候选图像列表;

计算所述待检索图像与所述候选图像列表中每一幅图像之间的特征值距离,并根据计算结果确定所述候选图像列表中与所述待检测图像的特征值距离最小的图像;

判断该图像与所述待检索图像之间的特征值距离是否小于预设的阈值;

若小于预设的阈值,则该图像即为所述待检索图像的相似图像。

在本发明的一个优选实施例中,所述图像特征值数据库的构建方法包括以下步骤:

依次获取已有图像,并计算每一幅已有图像的二进制哈希特征值;

对每一幅已有图像所计算得到的二进制哈希特征值进行分段处理;

根据所有的经过分段处理的已有图像的二进制哈希特征值建立图像特征值数据库。

由于采用了如上的技术方案,本发明的有益效果在于:本发明通过对待检索图像的二进制哈希特征值进行分段的方式进行图像检索,极大地提高了相似图像检索的速度,降低了磁盘读写压力,同时也不会降低图像的检索精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是现有的相似图像检索方法的流程图。

图2是本发明的相似图像检索方法的流程图。

具体实施方式

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明。

参见图2,图中给出的是一种相似图像检索方法,包括以下步骤:

步骤s1,获取图像,并计算该图像的二进制哈希特征值。

步骤s2,对该图像所计算得到的二进制哈希特征值进行分段处理,使得二进制哈希特征值被分隔成若干段哈希特征值。

步骤s3,判断该图像是否为待检测图像;若判断为是,则进入步骤s5;若判断为否,则进入步骤s4。

步骤s4,将该图像的二进制哈希特征值写入已构建的图像特征值数据库中进行存储。

步骤s5,在已构建的图像特征值数据库中进行检索,找出含有至少任意一段哈希特征值的所有图像,并将这些图像整理成最终的候选图像列表。具体地,在图像特征值数据库中进行检索时,可并行地检索每一段哈希特征值,得到具有相同特征值的候选图像列表,再将每一段哈希特征值所对应的候选图像列表进行并集处理,得到最终的候选图像列表。

步骤s6,计算待检索图像与候选图像列表中每一幅图像之间的特征值距离,并根据计算结果确定候选图像列表中与待检测图像的特征值距离最小的图像。

步骤s7,判断步骤s6中所确认的图像与待检索图像之间的特征值距离是否小于预设的阈值。

步骤s8,若小于预设的阈值,则步骤s6中所确认的图像即为待检索图像的相似图像。若不小于预设的阈值,则待检索图像在图像特征值数据库中不存在相似图像。

其中,图像特征值数据库的构建方法,包括以下步骤:

依次获取已有图像,并计算每一幅已有图像的二进制哈希特征值;

对每一幅已有图像所计算得到的二进制哈希特征值进行分段处理;

根据所有的经过分段处理的已有图像的二进制哈希特征值建立图像特征值数据库。

在步骤s1中,对图像计算二进制哈希特质值时,可采用满足局部敏感的哈希方法,如感知哈希(perceptualhashing)、差异哈希(differencehashing)等方法,使得图像能够容忍颜色改变、旋转、缩放等改变。

在步骤s2中,在对二进制哈希特征值进行分段处理时,每一段哈希特征值的长度需要根据需求进行权衡:每一段哈希特征值的长度越小,图像检索的精度越高,但是最终的候选图像列表也越大,图像检索所需时间也会越长;每一段哈希特征值的长度越大,图像检索的精度越低,但是最终的候选图像列表也越小,图像检索所需时间越短。对二进制哈希特征值进行分段处理时,相邻的两段哈希特征值之间可以有重叠的部分,这样可以提高图像检索的精度,但同时会增加图像特征值数据库中存储的数据量。具体可以采用随机采样的方式,从原哈希值中随机取出n位,作为分段哈希。

本发明采用二进制哈希特征值作为图像特征值,图像特征值之间的距离计算可以使用汉明距离,汉明距离的计算速度相比传统采用的欧式距离、余弦距离等快许多。若两张图像相似,根据局部敏感哈希的思想,那么这两张图像的二进制哈希特征值也应该相似,即汉明距离不会相距较大,这两张图像的二进制哈希特征值之间必然有一定的位数是相同的。因此,只需要遍历某一段哈希特征值与目标图像相同的图片,即可找到相似图片,这样就会大大减少了需要遍历图像的数量,降低图像检索的时间。例如,假设有2000万张图片,将哈希特征值每16位分成一段,则平均具有相同的一段哈希值的图片数量约为305张,即每次只需要遍历约305张的图片,即可检索到相似图片,极大地提高了图像检索的速度,降低了图像检索的时间。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1