一种基于视觉词典库实现图像快速检索的方法及系统与流程

文档序号：13805587阅读：140来源：国知局

本发明涉及一种图像检索领域，尤其涉及一种基于视觉词典库实现图像快速检索的方法及系统

背景技术：

在当今快速发展的互联网技术和多媒体信息时代的背景下，人们对于多媒体信息的利用得到了充分的展示，而人们在商城中购买某个物品时只知道物品的图像，却总是需要东奔西走才能找到对应商品的陈列位置，在寻找的过程中既浪费了时间还可能无法购买到心仪的商品。

随着多媒体技术的快速发展，以计算机技术为基础的视觉研究和数据库技术的广泛使用，使得图像检索技术快速发展，通过从图像的自身来提取到图像的特征，以图像自身的特征来检索得到类似的图像，将商城的商品图像的特征信息先提取出来，再建立视觉词典库，当人们在购买商品时就可以通过输入想要的商品的图像直接检索到对应的商品信息，能够节省购买者大量的寻找时间。

专利号为cn102208038a的专利提供了一种基于视觉词典的图像分类方法，包括以下步骤：s1：抽取训练图像数据集的联合局部特征；s2：通过基于移动均值和区域哈希法的聚类算法对所述联合局部特征进行向量矢量化，从而选择聚类中心个数，以形成视觉词典；s3：根据所述视觉词典生成图像的特征表示，以建立图像分类器；s4：根据所述图像分类器分类所述训练图像数据集中的图像。该发明通过形成视觉词典，通过视觉词典生成的图像特征建立图像分类器并将图像进行分类，但是该发明无法达到检索图像的目的，在用户需要通过图像无法检索到对应的目标图像。

技术实现要素：

本发明要解决的技术问题目的在于提供一种基于视觉词典库实现图像快速检索的方法及系统，用以解决用户在购买商品时无法快速的寻找到对应商品位置信息的问题。

为了实现上述目的，本发明采用的技术方案为：

一种基于视觉词典库实现图像快速检索的方法，包括步骤：

s1：接收样本图像数据集，提取所述样本图像的所有视觉特征，并通过所述样本图像id名称标识该样本图像的所有视觉特征；

s2：将所述视觉特征量化成样本图像特征向量以生成视觉词典库；

s3：提取待检索图像的视觉特征，并量化成待检索图像特征向量；

s4：将所述待检索图像的特征向量与视觉词典库中的样本图像特征向量进行度量对比，输出与所述检索图像相匹配的样本图像。

进一步的，所述步骤s2还包括步骤：

将提取到的所述样本图像的视觉特征集合按照层次聚类法进行聚类以形成聚类簇并对聚类簇进行分裂，当所述聚类簇达到预设分裂次数时，完成聚类。

进一步的，所述步骤s2还包括步骤：

将所述样本图像提取到的特征向量映射到聚类形成的聚类簇上，获取所述样本图像的视觉表示词汇；

进一步的，还包括步骤：

提取所述样本图像对应的id名称及所述图像的视觉词汇表示，生成视觉词典库。

进一步的，所述步骤s3还包括步骤：

计算待检索图像的特征向量与视觉词典库中的样本图像特征向量的欧式距离；

获取所述欧式距离小于预设阈值的特征向量对应的样本图像id名称，并将所述样本图像输出。

一种基于视觉词典库实现图像快速检索的系统，包括：

标识模块：用于接收图像样本数据集，提取所述样本图像的视觉特征，并通过所述样本图像id名称标识该样本图像的所有视觉特征；

生成模块：用于将所述视觉特征量化成样本图像特征向量以生成视觉词典库；

量化模块：用于提取待检索图像的视觉特征，并量化成待检索图像特征向量；

对比输出模块：用于将所述待检索图像的特征向量与视觉词典库中的样本图像特征向量进行对比，输出与所述检索图像相匹配的样本图像。

进一步的，所述生成模块还包括：

聚类单元：用于将提取到的所述样本图像的视觉特征集合按照层次聚类法进行聚类以形成聚类簇并对聚类簇进行分裂，当所述聚类簇达到预设分裂次数时，完成聚类。

进一步的，所述生成模块还包括：

映射单元：用于将所述图像提取到的特征向量映射到聚类形成的聚类簇上，获取所述样本图像的视觉表示词汇；

进一步的，还包括：

生成单元：用于提取所述样本图像对应的id名称及所述图像的视觉词汇表示，生成视觉词典库。

进一步的，所述对比输出模块还包括：

计算单元：用于计算待检索图像的特征向量与视觉词典库中的样本图像特征向量的欧式距离；

输出单元：用于获取所述欧式距离小于预设阈值的特征向量对应的样本图像id名称，并将所述样本图像输出。

采用本发明，用户在商城购买商品时，可以通过商品的图像检索到对应的商品的信息，从而能够快速的找到对应的商品，提高购买的效率同时又节省了购买商品时寻找商品花费的大量时间。

附图说明

图1是实施例一提供的一种基于视觉词典库实现图像快速检索的方法流程图；

图2是实施例一提供的一种基于视觉词典库实现图像快速检索的系统结构图；

图3是实施例二提供的一种基于视觉词典库实现图像快速检索的方法流程图；

图4是实施例二提供的一种基于视觉词典库实现图像快速检索的系统结构图。

具体实施方式

以下是本发明的具体实施例并结合附图，对本发明的技术方案作进一步的描述，但本发明并不限于这些实施例。

本发明中，通过采集商城中商品的样本图像集，提取样本图像集的图像特征，建立视觉词典库，当用户在购买商品时可直接输入需要购买商品的图像，通过检索从而快速的得到与购买商品相似的商品图像，以及其商品信息。

实施例一

本实施例提供了一种基于视觉词典库实现图像快速检索的方法，如图1所示，包括步骤：

s11：接收样本图像数据集，提取所述样本图像的所有视觉特征，并通过所述样本图像id名称标识该样本图像的所有视觉特征；

s12：将提取到的所述样本图像的视觉特征集合按照层次聚类法进行聚类形成聚类簇，当所述聚类簇达到预设分裂次数时，完成聚类；

s13：将样本图像提取到的特征向量映射到聚类形成的聚类簇上，获取所述样本图像的视觉表示词汇；

s14：提取所述样本图像对应的id名称及所述图像的视觉词汇表示，生成视觉词典库；

s15：提取待检索图像的视觉特征，并量化成待检索图像特征向量；

s16：将所述待检索图像的特征向量与视觉词典库中的样本图像特征向量进行度量对比，输出与所述检索图像相匹配的样本图像。

对商城中商品的图像进行采集，生成样本图像数据集，提取样本图像中的图像特征，建立视觉词典库，当用户需要查找对应商品时，只需将对应商品图像输入，通过检索后从而输出与之相似度匹配的商品图像及信息。

本实施例中，步骤s11为接收样本图像数据集，提取所述样本图像的所有视觉特征，并通过所述样本图像id名称标识该样本图像的所有视觉特征。

具体地，

商城采集所有商品的图像作为样本图像数据集，通过算法提取出图像的视觉特征，同时为每一副样本图像分配一个id名称，id名称是图像数据库中每幅图想的独一无二的身份标识，通过id名称与id名称对应的图像中的所有视觉特征进行单一映射关联。

本实施例中，步骤s12为将提取到的所述样本图像的视觉特征集合按照层次聚类法进行聚类形成聚类簇，当所述聚类簇达到预设分裂次数，完成聚类。

具体地，

通过图像id名称映射该图像所有的视觉特征后，将提取出来的视觉特征量化成特征向量，通过层次聚类法对所有的视觉特征进行聚类，形成聚类簇，对聚类簇进行不断的分裂，当聚类簇中的特征向量数量小于预设阈值或者分层层数达到预设层数阈值，停止分裂，完成聚类。

本实施例中，步骤s13为将样本图像提取到的特征向量映射到聚类形成的聚类簇上，获取所述样本图像的视觉表示词汇。

具体地，

当所有聚类完成后，再将从样本图像中提取到的特征向量映射到聚类形成的聚类簇上，从而形成了每一幅图像的视觉词汇表示。

本实施例中，步骤s14为提取所述样本图像对应的id名称及所述图像的视觉词汇表示，生成视觉词典库。

具体地，通过某一特征向量，能够获取到该特征向量对应的视觉表示词汇和文件名id，通过文件名id可以检索输出相似的图片。

本实施例中，步骤s15为提取待检索图像的视觉特征，并量化成待检索图像特征向量。

通过用户提供的待检索的商品图像，将其视觉特征量化成特征向量，与视觉词典库中的特征向量进行度量比对。

本实施例中，步骤s16为将所述待检索图像的特征向量与视觉词典库中的样本图像特征向量进行度量对比，输出与所述检索图像相匹配的样本图像。

具体的，

将待检索图像的特征向量与视觉词典库中的特征向量进行相似度匹配，比较两个向量的欧式距离，当小于预设距离阈值时，提取出该相似的特征向量对应的图像，将对应图像输出，获得用户需要的相似商品。

本实施例还提供一种基于视觉词典库实现图像快速检索的系统，如图2所示，包括：

标识模块21：用于接收样本图像数据集，提取所述样本图像的所有视觉特征，并通过所述样本图像id名称标识该样本图像的所有视觉特征；

生成模块22：用于将所述视觉特征量化成样本图像特征向量以生成视觉词典库；

量化模块23：用于提取待检索图像的视觉特征，并量化成待检索图像特征向量；

对比输出模块24：用于将所述待检索图像的特征向量与视觉词典库中的样本图像特征向量进行度量对比，输出与所述检索图像相匹配的样本图像。

其中生成模块22还包括：聚类单元221、映射单元222、生成单元223。

本实施例中，聚类单元221用于将提取到的所述样本图像的视觉特征集合按照层次聚类法进行聚类形成聚类簇，当所述聚类簇达到预设分裂次数时，完成聚类。

具体地，

将所有的特征向量集合进行聚类，并对聚类形成的聚类簇进行分裂，到聚类簇中的特征向量数量小于预设阈值时或分裂层数达到预设分层层数时，完成聚类。

本实施例中，映射单元222用于将样本图像提取到的特征向量映射到聚类形成的聚类簇上，获取所述样本图像的视觉表示词汇。

本实施例中，生成单元223用于提取所述样本图像对应的id名称及所述图像的视觉词汇表示，生成视觉词典库。

通过建立视觉词典库，用户可以通过需要购买的商品图像，检索得到与其相似的商品信息，节省用户逛商城所花费的时间，同时也能为用户提供多种相似商品的参考信息，既满足的用户的购买需求也为用户提供了方便快捷的购买方式。

实施例二

本实施例提供了一种基于视觉词典库实现图像快速检索的方法，如图3所示，包括步骤：

s31：接收样本图像数据集，提取所述样本图像的所有视觉特征，并通过所述样本图像id名称标识该样本图像的所有视觉特征；

s32：将所述视觉特征量化成样本图像特征向量以生成视觉词典库；

s33：提取待检索图像的视觉特征，并量化成待检索图像特征向量；

s34：计算待检索图像的特征向量与视觉词典库中的样本图像特征向量的欧式距离；

s35：获取所述欧式距离小于预设阈值的特征向量对应的样本图像id名称，并将所述样本图像输出。

欧式距离是一个通常采用的距离定义，指在m维空间中两个点之间的真实距离，或者向量的自然长度。在二维和三维空间中的欧氏距离就是两点之间的实际距离。

与实施例一不同之处在于，本实施例还包括步骤s34、s35。

步骤s34为计算待检索图像的特征向量与视觉词典库中的样本图像特征向量的欧式距离。

具体地，

通过计算特征向量之间的欧式距离来进行相似度匹配，当向量之间的欧式距离小于预设阈值时，获取该视觉词典库中的特征向量。

步骤s35为获取所述欧式距离小于预设阈值的特征向量对应的样本图像id名称，并将所述样本图像输出。

具体地，

视觉词典库中的特征向量对应商城商品的图像id，通过图像id检索获得对应商品图像，并将与待检索图像相似度接近的图像输出，显示给用户。

本实施例还包括一种基于视觉词典库实现图像快速检索的系统，如图4所示，包括：

标识模块41：用于接收样本图像数据集，提取所述样本图像的所有视觉特征，并通过所述样本图像id名称标识该样本图像的所有视觉特征；

生成模块42：将所述视觉特征量化成样本图像特征向量以生成视觉词典库；

量化模块43：提取待检索图像的视觉特征，并量化成待检索图像特征向量；

对比输出模块44：获取所述欧式距离小于预设阈值的特征向量对应的样本图像id名称，并将所述样本图像输出。

本实施例中，对比输出模块44还包括：计算单元441、输出单元442。

本实施例中，计算单元441用于计算待检索图像的特征向量与视觉词典库中的样本图像特征向量的欧式距离。

本实施例中，输出单元442用于获取所述欧式距离小于预设阈值的特征向量对应的样本图像id名称，并将所述样本图像输出。

具体地，通过将待检索的特征向量与视觉词典库中对应的特征向量进行匹配对比，计算两个向量之间的欧式距离，当小于预设阈值时，获取该匹配的特征向量对应的图像id，并将图像id对应的图像输出。

通过检索视觉词典库，得到与用户输入的商品图像相类似的商品的图像后，将类似的商品图像对应的商品信息发送给用户，用户可以直接获得类似商品的信息，而不需要去逛商场寻找，极大的方便了用户购物过程，提高了用户的购物体验。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李杰
技术所有人：上海斐讯数据通信技术有限公司
我是此专利的发明人

上一篇：一种产品的营销模式及系统的制作方法
上一篇：玩具提供共享方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。