基于用户搜索意图定位的图像检索方法及系统的制作方法_4

文档序号:9667478阅读:来源:国知局
[0107] 与现有图像搜索引擎相比,本发明优选实施例中的技术增加了四个步骤,对一次 搜索结果分类,供用户选择较满意的图像,利用此用户选择作为用户搜索意图的猜测,并进 一步对搜索结果进行重新搜索和排序,很明显,利用本发明实施例中的技术搜索获取的图 像更加接近用户的检索意图,因而具有更高的精确性。而对于时间消耗问题,根据实验初步 证明,当用户需要小数目的符合搜索意图的图像时,本技术没有明显的优势,但当用户的需 求变大时,该方法将会比现有的主流搜索引擎消耗更少的时间。
[0108] 以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技 术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修 改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种基于用户搜索意图定位的图像检索方法,其特征在于,包括以下步骤: S2 :根据用户输入的检索关键字,使用任意一个图像检索平台进行检索获取图像结果 集; S4:根据所述图像结果集中的图像的文本信息,对所述图像结果集中的图像进行分 类; S6 :将所述分类后的图像返回给用户,并引导用户在所述分类后的图像中选取一个类 别中的至少一个图像; S8:将所述被选取的图像及与所述被选取的图像相关的文本信息作为检索条件,进行 二次检索。2. 根据权利要求1所述的图像检索方法,其特征在于,所述对所述图像结果集中的图 像进行分类,包括以下步骤: 5401 :根据所述图像结果集中的图像的文本信息,将每个所述图像在维基百科分类索 引中所属的二级类目作为所述图像的类别; 5402 :并将所述图像的类别对应的所有三级类目作为所述类别的同义词保存到关系型 数据库中。3. 根据权利要求2所述的图像检索方法,其特征在于,所述步骤S401,包括以下步骤: 54011 :根据所述图像结果集中的图像的文本信息,建立如下的信息矩阵:其中,N表示图像结果集中的图像的图像数目,^表示图像结果集中的一张图像,其中 〇 < = i < = N Ji表示所述图像的文本信息,其中O < = i < = N ;Ci表示与所述图像相关 的类别名,其中〇 <= i <=N; 54012 :根据维基百科分类索引定义分类图G,遍历图像结果集中的N个图像,将图像中 图像的文本信息中包含的每个词语或短语作为一个文本结点,对于每个所述图像中的每个 文本结点,如果所述文本结点与所述分类图G中的结点相匹配,则计算该文本结点出现在 所述图像的文本信息!\中的频率,最后将出现频率最大的文本结点所对应的分类图G中的 分类名称作为该图像的分类。4. 根据权利要求1至3中任一项所述的图像检索方法,其特征在于,所述步骤S8中的 与所述被选取的图像相关的文本信息,包括:所述被选取的图像的类别名称、用户输入的检 索关键字和\或HTML中的图像描述信息。5. 根据权利要求4所述的图像检索方法,其特征在于,所述步骤S8中,所述进行二次检 索,包括以下步骤: 5801 :根据与所述被选取的图像相关的文本信息的文本内容,在所述图像结果集中所 述被选取的图像所在的分类中进行基于文本的图像检索; 5802 :提取所述被选取的图像的视觉特征,采用感知哈希算法计算被选取的图像以及 所述图像结果集中所述被选取的图像所在的分类中的图像的图像相似度,在所述图像结果 集中所述被选取的图像所在的分类中进行图像检索。6. 根据权利要求5所述的图像检索方法,其特征在于,所述步骤S802中,采用感知哈希 算法计算被选取的图像以及图像结果集中所述被选取的图像所在的分类中的图像的图像 相似度,包括以下步骤: 58021 :将图像转化为灰度图像,转化公式如下: Gray = RXO. 299+GXO. 587+BX0. 114 (1) 其中,Gray表示灰度值,R、G和B分别表示原始像素中的红、绿和蓝的分量; 58022 :将所述灰度图像分为8X8块,将每个块的灰度设置为该块的灰度平均值,使用 Gray [8, 8]矩阵来存储每个块的灰度值,生成一个感知哈希矩阵H[8, 8],满足以下条件:其中,avg是整张所述灰度图像的灰度平均值,Gray[i,j]是图像被划分后,第i行、第 j列个块的灰度值,others是指第i行、第j列个块的灰度值小于avg时的情况,H[i, j]是 由第i行、第j列个块的灰度值得到的感知哈希矩阵H[8, 8]的第i行、第j列个元素的值, 并满足以下条件:其中,M是指图像划分后的行数且M = 8, N是指图像划分后的列数且N = 8,将获得的 64位的二进制数值作为所述图像的感知哈希值; 58023 :采用步骤S8021至步骤S8022分别提取所述被选取的图像以及检索结果所对应 的图像的感知哈希值,采用按位异或方式计算两张图像的相似度,图像H 1和图像H2的相似 度P (H1, H2)可以表示为位0的异或结果的百分比,公式如下:其中,C。是一个计算0异或结果的函数。7. 根据权利要求6所述的图像检索方法,其特征在于,所述步骤S801完成后,在所述步 骤S801所获得的结果集中,采用步骤S802进行检索排序,将排序后的结果集返回给用户。8. -种基于用户搜索意图定位的图像检索系统,其特征在于,包括: 一次检索模块,用于根据用户输入的检索关键字,使用任意一个图像检索平台进行检 索获取图像结果集; 分类模块,用于根据所述图像结果集中的图像的文本信息,对所述图像结果集中的图 像进行分类; 用户交互模块,用于将所述分类后的图像返回给用户,并引导用户在所述分类后的图 像中选取一个类别中的至少一个图像; 二次检索模块,用于将所述被选取的图像及与所述被选取的图像相关的文本信息作为 检索条件,进行二次检索。9. 根据权利要求8所述的图像检索系统,其特征在于,所述二次检索模块包括: 文本检索单元,用于根据与所述被选取的图像相关的文本信息的文本内容,在所述图 像结果集中所述被选取的图像所在的分类中进行基于文本的图像检索; 图像检索单元,用于提取所述被选取的图像的视觉特征,采用感知哈希算法计算被选 取的图像以及所述图像结果集中所述被选取的图像所在的分类中的图像的图像相似度,在 所述图像结果集中所述被选取的图像所在的分类中进行图像检索。10.根据权利要求8或9所述的图像检索系统,其特征在于,所述系统还包括: 排序模块,用于在文本检索单元完成后,在所述文本检索单元所获得的结果集中,采用 所述图像检索单元进行检索排序,将排序后的结果集返回给用户。
【专利摘要】本发明公开了一种基于用户搜索意图定位的图像检索方法及系统,该方法包括步骤:根据用户输入的检索关键字,使用任意一个图像检索平台进行检索获取图像结果集;根据图像结果集中的图像的文本信息,对图像结果集中的图像进行分类后返回给用户,引导用户在分类后的图像中选取一个类别中的至少一个图像;将被选取的图像及与被选取的图像相关的文本信息作为检索条件,进行二次检索。该系统包括一次检索模块、分类模块、用户交互模块和二次检索模块。本发明通过较小的计算量、消耗更少的时间达到较高精确度的效果,节省了计算资源,提高了计算效率。
【IPC分类】G06F17/30
【公开号】CN105426529
【申请号】CN201510933574
【发明人】郭克华, 张瑞芳
【申请人】中南大学
【公开日】2016年3月23日
【申请日】2015年12月15日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1