基于用户搜索意图定位的图像检索方法及系统的制作方法
【技术领域】
[0001] 本发明涉及数据库检索领域,尤其涉及一种基于用户搜索意图定位的图像检索方 法及系统。
【背景技术】
[0002]网络图像的爆炸式增长,衍生了很多图像检索方法。例如,用户可使用如谷歌 (Google)和必应(Bing)等搜索引擎来从互联网上检索图像。
[0003]目前的图像检索方法主要有以下几种:
[0004] ①基于关键字的检索方法:将查询关键字与图像数据库中存储的描述关键字来进 行匹配,并返回匹配成功的图像。这种方法广泛应用于传统的图像检索中。基于此方法的 改进有,找到查询关键字的同义词或者具有与之相关性的文本来检索,或者为用户提供更 加详细的文本关键字的选择项。
[0005] ②基于图像的检索方法:通过提取图像的固有特征(颜色、纹理等图像特征)来进 行检索。当用户上传一张图像后,利用基于内容的图像检索(CBIR,Content-basedimage retrieval,基于图像内容的检索--改为:基于内容的图像检索),图像搜索引擎可以检索 出与之相似的图像。
[0006] ③基于语义的检索方法:将图像的本体描述作为语义标注,并将这些标注保存到 数据库中,搜索引擎将会基于这些标注来进行图像检索。图像的本体描述是指图像作为一 个对象,其本身包含的特征和属性。
[0007] 以上三类检索方法分别存在以下缺陷:
[0008] 对于方法①,需要监管培训并消耗大量的计算资源,此外,它并不能保证在图像的 扩展列表中包含用户的理想的关键字。
[0009] 对于方法②,基于内容的图像检索方法中,提取图像特征需要消耗计算资源,而寻 找图像特征提取的精确度和计算时间之间的一个平衡点尤为重要。此外,这种方法忽略了 对用户的意图的理解,导致无法搜索到满足用户意图的相似结果。
[0010] 对于方法③,在基于语义的方法中,对图像进行标注工作量大,同时,无法保证所 有图像都被标注正确,此外,如果图像被复制或移动到其它位置,重建它们的语义信息是一 个非常复杂的工作。
【发明内容】
[0011] 本发明目的在于提供一种基于用户搜索意图定位的图像检索方法及系统,以解决 网络图像搜索技术消耗大且不能准确贴合用户搜索意图的技术问题。
[0012] 为实现上述目的,本发明提供了一种基于用户搜索意图定位的图像检索方法,包 括以下步骤:
[0013] S2:根据用户输入的检索关键字,使用任意一个图像检索平台进行检索获取图像 结果集;
[0014] S4 :根据图像结果集中的图像的文本信息,对图像结果集中的图像进行分类;
[0015] S6:将分类后的图像返回给用户,并引导用户在分类后的图像中选取一个类别中 的至少一个图像;
[0016] S8 :将被选取的图像及与被选取的图像相关的文本信息作为检索条件,进行二次 检索。
[0017] 作为本发明的方法的进一步改进:
[0018] 对图像结果集中的图像进行分类,包括以下步骤:
[0019] S401 :根据图像结果集中的图像的文本信息,将每个图像在维基百科分类索引中 所属的二级类目作为图像的类别;
[0020] S402:并将图像的类别对应的所有三级类目作为类别的同义词保存到关系型数据 库中。
[0021] 步骤S401,包括以下步骤:
[0022] S4011 :根据图像结果集中的图像的文本信息,建立如下的信息矩阵:
[0023]
[0024] 其中,N表示图像结果集中的图像的图像数目,L表示图像结果集中的一张图像, 其中0〈 =i〈 =Ν,?\表示图像的文本信息,其中0〈 =i〈 =N,(^表示与图像相关的类别 名,其中0〈 =i〈 =N;
[0025] S4012:根据维基百科分类索引定义分类图G,遍历图像结果集中的N个图像,将图 像中图像的文本信息中包含的每个词语或短语作为一个文本结点,对于每个图像中的每个 文本结点,如果文本结点与分类图G中的结点相匹配,则计算该文本结点出现在图像的文 本信息!\中的频率,最后将出现频率最大的文本结点所对应的分类图G中的分类名称作为 该图像的分类。
[0026] 步骤S8中的与被选取的图像相关的文本信息,包括:被选取的图像的类别名称、 用户输入的检索关键字和\或HTML中的图像描述信息。
[0027] 步骤S8中,进行二次检索,包括以下步骤:
[0028] S801 :根据与被选取的图像相关的文本信息的文本内容,在图像结果集中被选取 的图像所在的分类中进行基于文本的图像检索;
[0029] S802:提取被选取的图像的视觉特征,采用感知哈希算法计算被选取的图像以及 图像结果集中被选取的图像所在的分类中的图像的图像相似度,在图像结果集中被选取的 图像所在的分类中进行图像检索。
[0030] 步骤S802中,采用感知哈希算法计算被选取的图像以及图像结果集中被选取的 图像所在的分类中的图像的图像相似度,包括以下步骤:
[0031] S8021 :将图像转化为灰度图像,转化公式如下:
[0032] Gray=RXO. 299+GXO. 587+BX0. 114 (1)
[0033] 其中,Gray表示灰度值,R、G和B分别表示原始像素中的红、绿和蓝的分量;
[0034] S8022 :将灰度图像分为8X8块,将每个块的灰度设置为该块的灰度平均值,使用 Gray[8, 8]矩阵来存储每个块的灰度值,生成一个感知哈希矩阵H[8, 8],满足以下条件:
[0035]
⑵
[0036] 其中,avg是整张灰度图像的灰度平均值,Gray[i,j]是图像被划分后,第i行、第 j列个块的灰度值,others是指第i行、第j列个块的灰度值小于avg时的情况,H[i,j]是 由第i行、第j列个块的灰度值得到的感知哈希矩阵H[8, 8]的第i行、第j列个元素的值, 并满足以下条件:
[0037]
⑶
[0038] 其中,Μ是指图像划分后的行数且M= 8,N是指图像划分后的列数且N= 8,将获 得的64位的二进制数值作为图像的感知哈希值;
[0039] S8023 :采用步骤S8021至步骤S8022分别提取被选取的图像以及检索结果所对应 的图像的感知哈希值,采用按位异或方式计算两张图像的相似度,图像H1和图像H2的相似 度PO^HJ可以表示为位0的异或结果的百分比,公式如下:
[0040]
(4)
[0041] 其中,C。是一个计算0异或结果的函数。
[0042] 步骤S801完成后,在步骤S801所获得的结果集中,采用步骤S802进行检索排序, 将排序后的结果集返回给用户。
[0043] 作为一个总的技术构思,本发明还提供了一种基于用户搜索意图定位的图像检索 系统,包括:
[0044] -次检索模块,用于根据用户输入的检索关键字,使用任意一个图像检索平台进 行检索获取图像结果集;
[0045] 分类模块,用于根据图像结果集中的图像的文本信息,对图像结果集中的图像进 行分类;
[0046] 用户交互模块,用于将分类后的图像返回给用户