一种基于数字图像内容的图书检索方法

文档序号：9646615阅读：571来源：国知局

一种基于数字图像内容的图书检索方法
【技术领域】
[0001]本发明属于计算机视觉领域，是图像检索领域中的一项重要应用，尤其是涉及一种基于数字图像内容的图书检索方法。
【背景技术】
[0002]模糊C均值聚类算法是一种自适应聚类学习算法，它能够根据不同类别的输入训练样本特征值自动计算出对应的特征中心，从而为后续的识别与检测工作提供可靠的先验知识。这种方法的优点是，在样本特征表征全面且样本量充足的条件下能够进行很好的分类工作，同时对于不良数据的容忍力较强，可以适应多种不同的数据环境。因此该算法广泛应用于数据挖掘、图像分类、图像检索、图像物体识别、视频对象跟踪等多个图像处理领域。近年来伴随数据量的不断增加，该技术的应用在一定程度上推动了计算机视觉技术的发展。
[0003]基于图像的图书检索是图像检索的一项重要应用。一方面它可以根据图像快速的检索出对应的图书信息，从而免去了人工手动输入文字查询图书信息的环节；另一方面通过图像检索大大简化了信息查找的难度，完成了所见即所得的查找模式。
[0004]目前有一些有关基于图像的图书检索方面的研究，也出现了一些相应的方法，其中相当多的方法都用到了图像特征和先验学习。从基于图像的图书检索技术角度来分，大致可以分为两大类:基于图像特征描述的图书图像检索和基于信息标注的图书图像检索，本文关注的重点在于前者。总体来说，基于信息标注的图书图像检索，由于会受到标注信息不准，标注信息不全面不能有效地满足各类识别情况等影响，使得该类方法的识别容易受到影响，并且适应的环境也相对局限，不具有有效地进行一对一检索，此外由于信息标注工作量大维护困难，所以该方法在一定程度上受到了应用限制。相对来讲基于图像特征的方法准确率较高，图像的多特征描述能够有效的分析图书的边缘、颜色、角点等信息，再通过聚类分析能够在训练样本足够大的情况下找到不同图书之间的分界线，此外该类方法对于无关数据的干扰有较强的容忍度，能够适应较多的识别场景。但是基于训练学习的方法需要选取全面描述图像的特征以充分的获取分类面，另外，对于不同聚类学习算法的输出需要寻找一种合适的结果获取规则进行最终结果的获取。
[0005]伴随图形图像专业方向的不断发展，图像检索的功能会越来越完善，对于图书图像检索要求会越来越高，但是检索识别的环境却越来越复杂。因此制定出一种可靠、鲁棒的图书检索识别算法是十分有必要的。

【发明内容】

[0006]本发明的目的在于针对现有技术存在的不足，提出了一种基于数字图像内容的图书检索方法。该方法以描述图书图像的多种特征为基础，融入了聚类学习与概率分布确立的思想，充分提高了图书检索的效率，可以有效地进行不同场景下的图书图像检索识别，对于图像检索系统是有积极意义的。
[0007]为实现上述目的，本发明公开了一种基于数字图像内容的图书检索方法，该方法包括以下步骤:
[0008]将选取出的样本图书图像进行分辨率归一化操作，并进行多特征层面的图像描述，然后对每种图书进行学习训练，以此得到不同的训练识别模型；
[0009]将获取的待检索图书图像矫正为矩形，然后对其进行分辨率归一化，在获取出相应的图像后对其进行多特征层面的图像描述，将特征数据输入所述训练识别模型中进行初始结果的预测；所述预测结果中包含当前待检索图书最大可能的前两种结果；
[0010]在得到初始预测结果后，分别判断最大可能的两类结果与其判别中心的高斯分布，概率值最高的那一类，确定为最终的检索结果。
[0011]优选地，多特征层面的图像描述包括:描述图书图像整体颜色分布的颜色矩特征、描述整幅图像边缘的边缘直方图特征和用于描述图书图像角点的角点特征中的一种或多种；
[0012]优选地，样本图书图像在进行图书图像特征提取时全部进行分辨率归一化操作。
[0013]优选地，样本图书图像在进行颜色矩特征提取时，在分辨率归一化操作结束后，先进行伽马滤波，接着将样本图书图像分解成有交叠的图像区块，其中每两个相邻的图像区块重叠率是其面积的0.3到0.5倍，然后计算图像中相应区块的颜色特征值，最后统计输出整幅图像的颜色信息。
[0014]优选地，样本图书图像在进行颜色矩特征提取时，首先对样本图书图像进行分块处理。
[0015]优选地，样本图书图像在进行角点特征提取时，在分辨率归一化操作结束后对彩色图像进行灰度化处理。
[0016]优选地，样本图书图像在进行边缘直方图特征提取时，在分辨率归一化操作结束后对彩色图像中的每个颜色通道图像都进行高斯滤波，将图像分解成有交叠的图像区块，其中每两个相邻的图像区块重叠率是其面积的0.3到0.5倍，然后在每个图像区块中统计图像在360度范围内的梯度分布情况，最后统计输出整幅图像的边缘信息描述值。
[0017]优选地，在得到描述图像的各类特征后，用模糊C均值聚类算法对样本特征进行聚类学习，在训练学习之前要对所选样本特征数据进行合并以得到整体的训练学习参数。
[0018]优选地，进行初始结果的预测步骤包括:
[0019]在计算获得初始结果前，按照树的广度优先策略进行中心遍历并计算相似度，最后相似度最大的两类被作为初始候选结果。
[0020]优选地，训练识别模型是通过基于聚类思想的学习算法，对每种图书进行学习训练后获取。
[0021]本发明能够全面的描述图像的颜色、角点和边缘信息，特征数据聚类技术能够对无关数据的干扰有较强的容忍度，并且能够适应多种识别场景。在获得初始预测结果后为精确的融合结果采用了高斯概率判别理论，有效的提高了图书检索的准确率。
【附图说明】
[0022]图1为本发明实施例提供的一种基于数字图像内容的图书检索方法流程示意图；
[0023]图2为本发明实施例提供的颜色矩特征提取方法流程示意框图；
[0024]图3为本发明实施例提供的边缘直方图特征提取方法流程示意框图；
[0025]图4为本发明实施例提供的角点特征提取方法流程示意框图。
【具体实施方式】
[0026]结合附图，本发明实施例的基本思想是针对图书图像检索的实际情况，将整个识别工作分为三个部分。在进行图书图像检索之前，首先对图书图像进行矩形矫正、归一化再进行一系列特征提取以及基于聚类思想的学习与训练，以得到图书图像库的特征聚类中心；然后在识别阶段根据得到的待检索图书图像再进矩形矫正、行归一化与特征提取，将所得特征放入图书图像库模型中得到初始结果；最后再根据高斯概率分布理论对初始结果进行融合以得到最后的检索结果。以上方法可以适应多种识别场景，并在相当的程度上提高了识别精度。
[0027]图1为本发明实施例提供的一种基于数字图像内容的图书检索方法流程示意框图。如图1所示，该方法包括步骤101-103:
[0028]在步骤101、将选取出的样本图书图像进行分辨率归一化操作，并进行多特征层面的图像描述，然后对每种图书进行学习训练，以此得到不同的训练识别模型。
[0029]具体地，在图书图像检索的学习训练阶段，首先对相应的样本图书图像进行矩形矫正、分辨率归一化操作，再提取描述图像整体边缘信息的边缘直方图特征(提取方法流程图如图2所示)、描述图像颜色信息的颜色矩特征(提取方法流程图如图3所示)和用于描述图像角点的角点特征(提取方法流程图如图4所示)，然后通过基于聚类思想的学习算法进行归类学习，旨在为后续的具体识别过程提供良好的判别识别模型。
[0030]优选地，样本图书图像在进行多类特征提取时，分辨率按照图像的原始尺度，归一化为合适的大小；样本图书像

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：公绪超;吴柯维;郭长全;
技术所有人：北京卓视智通科技有限责任公司;公绪超;
我是此专利的发明人

上一篇：一种版式文档处理方法及装置的制造方法
上一篇：直播情感分类方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。