一种空间图像查询方法和系统的制作方法
【技术领域】
[0001] 本发明属于基于路网空间的图像搜索技术领域,尤其涉及一种空间图像查询方法 和系统。
【背景技术】
[0002] 随着移动终端、移动互联网及GPS (Global Positioning System,全球定位系统) 设备的普及,路网空间的图像搜索逐渐成为人们日常生活中的热门需求。
[0003] 路网空间的图像搜索,是一种包含图像信息和空间位置约束的查询技术,通过对 路网范围内带位置标签的图像数据集进行搜索,向用户返回其感兴趣的区域内较为感兴趣 的商品或服务(图像),譬如,用户在某商场看中一款鞋子,采用空间图像搜索即可获知周 边哪些商场具有相同或类似款式的鞋子,以进行对比购买。传统的基于文字描述的图像查 询技术依赖于图像的文本标注,通过用户提交关键词实现查询,然而,一个图像通常包含上 百个特征点,每个特征点可以被量化为上百个视觉词汇,而目前较为成熟的t 0p-k空间关 键词查询模型,仅局限于处理包含较少个数(一般不超8个)关键词的查询,不能有效扩展 处理多个关键词,从而,无法有效解决空间图像的查询问题。
【发明内容】
[0004] 有鉴于此,本发明的目的在于提供一种空间图像查询方法和系统,旨在克服基于 文字描述的传统图像查询技术存在的上述缺陷,有效解决空间图像的查询问题。
[0005] 为此,本发明公开如下技术方案:
[0006] -种空间图像查询方法,包括:
[0007] 接收用户提交的空间图像查询请求,所述空间图像查询请求包括携带第一位置信 息的查询图像;
[0008] 对所述查询图像进行预设处理,得到所述查询图像的视觉词袋模型;
[0009] 利用所述查询图像的视觉词袋模型及第一位置信息,从预设的图像数据集中查询 出k个目标图像;所述k个目标图像为图像数据集中与查询图像间的图像内容相似度及空 间邻近度的综合评价得分最优的k个图像,图像数据集中的每个图像对应一个位置信息,k 为自然数。
[0010] 上述方法,优选的,所述对所述查询图像进行预设处理,得到所述查询图像的视觉 词袋模型包括:
[0011] 提取所述查询图像的各个局部特征;
[0012] 基于预先训练的图像索引视觉词汇树,将所述查询图像的各个局部特征量化为相 应的视觉词汇,各视觉词汇的视觉词汇向量构成所述查询图像的视觉词袋模型。
[0013] 上述方法,优选的,所述利用所述查询图像的视觉词袋模型及第一位置信息,从预 设的图像数据集中查询出k个目标图像包括:
[0014] 利用图像索引视觉词汇树,对图像数据集进行基于图像内容的图像搜索;
[0015] 利用路网索引G-tree,对图像数据集进行基于位置信息的图像搜索;
[0016] 在利用视觉词汇树及G-tree进行分离式索引搜索的基础上,从搜索出的图像中 查询出与查询图像间的图像内容相似度及空间邻近度的综合评价得分最优的k个图像。
[0017] 上述方法,优选的,所述从搜索出的图像中查询出与查询图像间的图像内容相似 度及空间邻近度的综合评价得分最优的k个图像为:
[0018] 基于所搜索出的潜在图像的上界聚合得分,判断是否需计算所述潜在图像的综合 评价得分;
[0019] 若判断结果为是,则计算所述潜在图像的综合评价得分;否则,舍弃所述潜在图 像;
[0020] 基于所述潜在图像的综合评价得分,确定所述潜在图像是否属于目标图像。
[0021] 上述方法,优选的,所述图像内容相似度及空间邻近度的综合评价得分的计算公 式为:F (Q,I) = a D (Q. loc,I. loc) + (I- a ) S (Q. content, I. content),
[0022] 其 中:D(Q. loc, I. loc) = d(Q.loc,I.loc)/dmax;
【主权项】
1. 一种空间图像查询方法,其特征在于,包括: 接收用户提交的空间图像查询请求,所述空间图像查询请求包括携带第一位置信息的 查询图像; 对所述查询图像进行预设处理,得到所述查询图像的视觉词袋模型; 利用所述查询图像的视觉词袋模型及第一位置信息,从预设的图像数据集中查询出k个目标图像;所述k个目标图像为图像数据集中与查询图像间的图像内容相似度及空间邻 近度的综合评价得分最优的k个图像,图像数据集中的每个图像对应一个位置信息,k为自 然数。
2. 根据权利要求1所述的方法,其特征在于,所述对所述查询图像进行预设处理,得到 所述查询图像的视觉词袋模型包括: 提取所述查询图像的各个局部特征; 基于预先训练的图像索引视觉词汇树,将所述查询图像的各个局部特征量化为相应的 视觉词汇,各视觉词汇的视觉词汇向量构成所述查询图像的视觉词袋模型。
3. 根据权利要求2所述的方法,其特征在于,所述利用所述查询图像的视觉词袋模型 及第一位置信息,从预设的图像数据集中查询出k个目标图像包括: 利用图像索引视觉词汇树,对图像数据集进行基于图像内容的图像搜索; 利用路网索引G-tree,对图像数据集进行基于位置信息的图像搜索; 在利用视觉词汇树及G-tree进行分离式索引搜索的基础上,从搜索出的图像中查询 出与查询图像间的图像内容相似度及空间邻近度的综合评价得分最优的k个图像。
4. 根据权利要求3所述的方法,其特征在于,所述从搜索出的图像中查询出与查询图 像间的图像内容相似度及空间邻近度的综合评价得分最优的k个图像包括: 基于所搜索出的潜在图像的上界聚合得分,判断是否需计算所述潜在图像的综合评价 得分; 若判断结果为是,则计算所述潜在图像的综合评价得分;否则,舍弃所述潜在图像; 基于所述潜在图像的综合评价得分,确定所述潜在图像是否属于目标图像。
5. 根据权利要求4所述的方法,其特征在于,所述图像内容相似度及空间邻近度 的综合评价得分的计算公式为:F(Q,I) =aD(Q.loc,I.loc) + (1-a)S(Q.content,I. content), 其中:D(Q.loc,I.loc) =d(Q.loc,I.loc)/dmax
以 上各式中: Q、I分别表示查询图像及图像数据集中的图像;Q.loc,I.loc分别表示图像Q及图像I在路网上的地理位置;Q.content,I.content分别表示图像Q及图像I采用视觉词袋模型 编码的图像内容; F(Q,I)表示综合评价函数;D(Q.loc,I.loc)为查询图像Q与图像I基于路网路径的距 离计算函数,S(Q.content,I.content)为查询图像Q与图像I间图像内容相异度的计算函 数;a为平衡空间距离远近及图像内容相关性的尺度参数,ae(〇,1); d(Q.loc,I.loc)表示Q.loc与I.loc在路网上的最短路径长度,dmax表示路网中任意 位置与任何图像对象之间的最长距离; q表示查询图像向量,1为其每个维度分量;d表示匹配图像向量,七为其每个维度分 量;I|q|I为向量q的范数,I|d| |为向量d的范数;
为归 一化后向量q和d差的范数。
6. 根据权利要求4所述的方法,其特征在于,所述上界聚合得分的计算公式为: Boundk=a?Bounds (i) + (1_a) ?m?Boundt (i) 其中:a为平衡空间距离远近及图像内容相关性的尺度参数,ae(〇, 1) ;Boundk为第i次迭代后空间图像的聚合得分上界,i表示迭代次数,Bounds(i)表示第i次迭代后空间 上得分的上界,Boundt (i)表示第i次迭代在视觉词汇单个关键字的上界,m?Boundt (i)表 示表示图片中m个视觉词汇的聚合得分上界。
7. -种空间图像查询系统,其特征在于,包括: 接收模块,用于接收用户提交的空间图像查询请求,所述空间图像查询请求包括携带 第一位置信息的查询图像; 处理模块,用于对所述查询图像进行预设处理,得到所述查询图像的视觉词袋模型; 查询模块,用于利用所述查询图像的视觉词袋模型及第一位置信息,从预设的图像数 据集中查询出k个目标图像;所述k个目标图像为图像数据集中与查询图像间的图像内容 相似度及空间邻近度的综合评价得分最优的k个图像,图像数据集中的每个图像对应一个 位置信息,k为自然数。
8. 根据权利要求7所述的系统,其特征在于,所述处理模块包括: 提取单元,用于提取所述查询图像的各个局部特征; 词袋模型获取单元,用于基于预先训练的图像索引视觉词汇树,将所述查询图像的各 个局部特征量化为相应的视觉词汇,各视觉词汇的视觉词汇向量构成所述查询图像的视觉 词袋模型。
9. 根据权利要求8所述的系统,其特征在于,所述查询模块包括: 第一搜索单元,用于利用图像索引视觉词汇树,对图像数据集进行基于图像内容的图 像搜索; 第二搜索单元,用于利用路网索引G-tree,对图像数据集进行位置信息的图像搜索; 查询单元,用于在利用视觉词汇树及G-tree的进行分离式索引搜索的基础上,从搜索 出的图像中查询出与查询图像间的图像内容相似度及空间邻近度的综合评价得分最优的k 个图像。
10. 根据权利要求9所述的系统,其特征在于,所述查询单元包括: 判断子单元,用于基于所搜索出的潜在图像的上界聚合得分,判断是否需计算所述潜 在图像的综合评价得分; 计算子单元,用于在所述判断子单元的判断结果为是时,计算所述潜在图像的综合评 价得分,以及在判断结果为否时,舍弃所述潜在图像; 确定子单元,用于基于所述潜在图像的综合评价得分,确定所述潜在图像是否属于目 标图像。
【专利摘要】本发明的空间图像查询方法和系统,在接收到用户提交的空间图像查询请求后,对该请求中所包含的携带位置信息的查询图像进行预设处理,得到查询图像的视觉词袋模型;之后,利用查询图像的视觉词袋模型及位置信息,对图像数据集进行基于图像内容及位置信息的搜索,实现基于图像内容相似度及空间临近度的top-k图像(最优的k个图像)查询,供用户参考。可见,区别于传统的图像查询技术依据关键词进行文本查询,本发明依据用户提交的图像进行基于图像内容(采用视觉词袋模型表征)的查询,不存在文本查询中所存在的局限性问题,可有效处理空间图像的查询问题。
【IPC分类】G06F17-30
【公开号】CN104778284
【申请号】CN201510236691
【发明人】赵朋朋, 许佳捷, 吴健, 崔志明
【申请人】苏州大学
【公开日】2015年7月15日
【申请日】2015年5月11日