图像识别方法和系统的制作方法

文档序号：6488781阅读：187来源：国知局

图像识别方法和系统的制作方法
【专利摘要】一种图像识别方法包括：通过不同尺寸的扫描窗口对影像进行扫描，得到多个窗口图像；提取各个窗口图像的HOG-LBP特征向量；将多个HOG-LBP特征向量依次通过预设的HOG-LBP分类器进行识别，得到多个初步判定为目标的窗口图像；通过预设的PHOW字典提取初步判定为目标的多个窗口图像的图像特征；将多个窗口图像的图像特征通过预设的PHOW分类器进行识别，得到目标图像窗口图像；聚类处理得到目标图像。本发明还提供对应的图像识别系统。上述两个分类器通过级联方式对窗口图像进行过滤，避免了在全图像、多尺度上同时扫描计算多种窗口特征的大计算量问题，而且PHOW分类器独立于HOG-LBP分类器，从而降低误判率。
【专利说明】图像识别方法和系统
【技术领域】
[0001]本发明涉及图像处理分析技术，特别是涉及一种图像识别方法和系统。
【背景技术】
[0002]图像识别，如行人检测是目前机器视觉研究的一个重要方向，检测并跟踪行人在人们的生活中得到了越来越多的应用，这主要包括智能交通与监控，机器人自动检测，照顾老人，及目前流行的基于图像内容的搜索等。目前流行的技术都是采用二分类方法，即用窗口扫描图像，然后利用训练好的分类器来判断该窗口是行人还是非行人。
[0003]目前大量的有效算法都是以HOG (Histograms of Oriented Gradients,方向梯度直方图)为基础的。一些其他的特征与HOG特征组合起来，形成一系列新的检测方法，这些方法相比其中单个的特征效果都有明显的改进。如类Haar特征与HOG组合等，结果显示这些组合特征要明显优于单个特征。Walk加入局部色彩特征，Wu等加入edgelet及协方差特征，Wang等加入局部二进模式(LBP)特征。考虑到检测速度等问题，一般都采用线性支持向量机来训练分类器，为了改进速度并且使用更为复杂的分类器，Maji提出了 HIKSVM，Felzenszwalb等提出了 LATSVM，这些分类器较线性SVM更为复杂，检测效果也有所提高。
[0004]现在大多数的行人检测系统都是以多种特征为基础。计算不同种类特征后，将各种特征组合成高维特征向量以便用在线性支持向量机中；或者把不同类型的特征放在一起,用Boosting多核学习等方法依据特定的代价函数从中选择代价最小的特征组合。这些方法虽然取得了较好的检测效果，但仍然存在两个主要的局限性:
[0005]1，多种特征组合的计算量大。
[0006]2,在保证较低丢失率(Miss Rate)的情况下,系统的误判率(False Positive)仍然较高。

【发明内容】

[0007]基于此，有必要提供一种计算量小且误判率低的图像识别方法和系统。
[0008]一种图像识别方法，包括如下步骤:
[0009]获取影像，并通过不同尺寸的扫描窗口对影像进行扫描，得到多个窗口图像；
[0010]提取各个所述窗口图像的HOG-LBP特征向量；
[0011]将所述多个HOG-LBP特征向量依次通过预设的HOG-LBP分类器进行识别，得到多个初步判定为目标的窗口图像；
[0012]通过预设的PHOW字典提取所述初步判定为目标的多个窗口图像的图像特征；
[0013]将所述多个窗口图像的图像特征通过预设的PHOW分类器进行识别，过滤掉非目标窗口图像，得到目标图像窗口图像；
[0014]对所述目标窗口图像进行聚类处理，得到目标图像。
[0015]一种图像识别系统，包括:
[0016]扫描模块，用于获取影像，并通过不同尺寸的扫描窗口对影像进行扫描，得到多个窗口图像；
[0017]HOG-LBP特征提取模块，用于提取各个所述窗口图像的HOG-LBP特征向量；
[0018]HOG-LBP识别模块，用于将所述多个HOG-LBP特征向量依次通过预设的HOG-LBP分类器进行识别，得到多个初步判定为目标的窗口图像；
[0019]PHOff特征提取模块，用于通过预设的PHOW字典提取所述初步判定为目标的多个窗口图像的图像特征；
[0020]PHOff识别模块，用于将所述多个窗口图像的图像特征通过预设的PHOW分类器进行识别，过滤掉非目标窗口图像，得到目标图像窗口图像；
[0021]聚类模块，用于对所述目标窗口图像进行聚类处理，得到目标图像
[0022]其中一个实施例中，所述聚类处理是使用带权值的MeanShift方法对目标窗口图像进行聚类处理。
[0023]其中一个实施例中，所述预设的HOG-LBP分类器可通过以下动作得到:
[0024]计算每个归一化的目标样本的特征向量作为正样本；
[0025]在多个尺度中扫描负样本计算其特征向量，与正样本的特征向量一起用SVM训练初步线性分类器；
[0026]保留正样本的特征向量与负样本的支持向量，其余的负样本特征向量丢弃；
[0027]使用训练好的线性分类器继续扫描负样本，将分类结果大于O的特征向量替换丢弃掉的特征向量，直至所有的负样本都被扫描，得到的分类器作为最终的分类器。
[0028]其中一个实施例中，所述预设的PHOW分类器可通过以下动作得到:
[0029]计算每个归一化的行人样本的特征向量作为正样本；
[0030]在多个尺度中扫描负样本计算其特征向量，与正样本的特征向量一起用SVM训练初步线性分类器；
[0031]保留正样本的特征向量与负样本的支持向量，其余的负样本特征向量丢弃；
[0032]使用训练好的线性分类器继续扫描负样本，将分类结果大于O的特征向量替换丢弃掉的特征向量，重新使用SVM训练线性分类器，直至所有的负样本都被扫描，得到的分类器作为最终的分类器。
[0033]其中一个实施例中，所述通过预设的PHOW字典提取所述初步判定为目标的多个窗口图像的图像特征包括两个步骤，首先对窗口图像进行金字塔SIFT特征提取，然后利用预设的PHOW字典对窗口图像进行金字塔直方图投票。
[0034]上述图像识别方法和系统把多类特征分散到两级分类器中。一方面没有一次性将多种特征组合成高维特征，避免了在全图像、多尺度上同时扫描计算多种窗口特征的大计算量问题。另一方面第二级采用了形态特征描述子PH0W，并且PHOW分类器的训练独立于第一级分类器(H0G-LBP分类器)，这样第二级分类器就能过滤掉第一级分类器无法去除的非目标的检测窗口，降低误判率。
【专利附图】

【附图说明】
[0035]图1为一实施例的图像识别方法的步骤流程图；
[0036]图2为窗口图像的HOG计算示意图；
[0037]图3为N=8，R=I时的LBP计算示意图；[0038]图4为一实施例的图像识别系统的功能模块图；
[0039]图5为实验结果曲线图。
【具体实施方式】[0040]请参阅图1，其为一实施例的图像识别方法的步骤流程图，包括如下步骤:
[0041]步骤S101，获取影像，并通过不同尺寸的扫描窗口对影像进行扫描，得到多个窗口图像。
[0042]步骤S102,提取各个窗口图像的H0G-LBP特征【Histograms of OrientedGradients (HOG) and Local Binary Pattern (LBP)】向量。
[0043]步骤S103，将所述多个HOG-LBP特征向量依次通过预设的HOG-LBP分类器进行识另O，得到多个初步判定为目标的窗口图像。
[0044]步骤S104,通过预设的PHOW(Pyramid Histogram of Words,塔式关键词直方图)字典提取所述初步判定为目标的多个窗口图像的图像特征。
[0045]步骤S105，将所述多个窗口图像的图像特征通过预设的PHOW分类器进行识别，过滤掉非目标窗口图像，得到目标图像窗口图像。
[0046]步骤S106，对所述目标窗口图像进行聚类处理，得到目标图像。
[0047]本实施例中，使用带权值的MeanShift方法对目标窗口图像进行聚类处理。
[0048]一实施例中，上述步骤SlOl中假设选定扫描窗口大小为[Hn，Wn]，即窗口图像大小也为[Hn，Wn]，并将所有的训练图像转化为灰度图像。再确定扫描尺度，设输入图像的大小为[Hi，Wi]，初始扫描尺度为Ss，最终扫描尺度为Se=min {Hi/Hn，Wi/Wn}，每级扫描放大倍数为Sp那么扫描的放大倍数为S= {Ss，SsSr, SsSrSr,..., SJ , Sn<Se0
[0049]一实施例中，上述步骤S102可包括如下动作:
[0050](I)使用一维梯度模板m=[-l，0，l]求取窗口图像的每个像素点的梯度方向与权重值。Ix = I?.m ly = l?mT，發表示卷积运算，方向 O(x, y) =atan(Iy (x, y)/Ix(x, y)),
0(x, y) e [0，π ]，模值M(x，y) = ^Ix2(x,y)+Iy2(x,y)
[0051](2)将窗口图像[Hn，Wn]分割成sBin XsBin大小的小单元，如图2所示，统计每个小单元201在oBin个方向上的梯度投影统计直方图，这些方向为
=统计直方图时，累计像素点的梯度权值。为了防止小单.元201的
边界影响，累计时在位置与方向上都进行线性插值。
[0052](3)将相邻的四个小单元201组成一个块202，如图2所示，将一个块202内的统计直方图连接起来，并除以标准方差进行归一化处理。这些块之间有交叠区域203。如果窗口图像分割成nrowXnvol个小单元,共有(nrow_l) X (nvol-1)个块,每个块的特征向量长度为4XoBin,那么窗口图像的HOG特征长度为NI = (nrow-1) X (nvol-1) X4XoBin。
[0053](4)计算窗口图像的局部二进模式^^卩二值，其中N表示比较像素个数，R表示距离，u表示均匀模式的阈值(uniformity measure)。LBPN,K的计算如下:
[0054]LBPnr =艺‘V(n)

H=O[0055]其中，g。为中心点的像素灰度值，gn为周围点的像素灰度值,
【权利要求】
1.一种图像识别方法，其特征在于，包括如下步骤: 获取影像，并通过不同尺寸的扫描窗口对影像进行扫描，得到多个窗口图像；提取各个所述窗口图像的HOG-LBP特征向量；将所述多个HOG-LBP特征向量依次通过预设的HOG-LBP分类器进行识别，得到多个初步判定为目标的窗口图像；通过预设的PHOW字典提取所述初步判定为目标的多个窗口图像的图像特征；将所述多个窗口图像的图像特征通过预设的PHOW分类器进行识别，过滤掉非目标窗口图像，得到目标图像窗口图像；对所述目标窗口图像进行聚类处理，得到目标图像。
2.根据权利要求1所述的图像识别方法，其特征在于，所述聚类处理是使用带权值的MeanShift方法对目标窗口图像进行聚类处理。
3.根据权利要求1所述的图像识别方法，其特征在于，所述预设的HOG-LBP分类器可通过以下动作得到: 计算每个归一化的目标样本的特征向量作为正样本；在多个尺度中扫描负样本计算其特征向量，与正样本的特征向量一起用SVM训练初步线性分类器；保留正样本的特征向量与负样本的支持向量，其余的负样本特征向量丢弃；使用训练好的线性分类器继续扫描负样本，将分类结果大于O的特征向量替换丢弃掉的特征向量，直至所有的负样本都被扫描，得到的分类器作为最终的分类器。
4.根据权利要求1所述的图像识别方法，其特征在于，所述预设的PHOW分类器可通过以下动作得到: 计算每个归一化的行人样本的特征向量作为正样本；在多个尺度中扫描负样本计算其特征向量，与正样本的特征向量一起用SVM训练初步线性分类器；保留正样本的特征向量与负样本的支持向量，其余的负样本特征向量丢弃；使用训练好的线性分类器继续扫描负样本，将分类结果大于O的特征向量替换丢弃掉的特征向量，重新使用SVM训练线性分类器，直至所有的负样本都被扫描，得到的分类器作为最终的分类器。
5.根据权利要求1所述的图像识别方法，其特征在于，所述通过预设的PHOW字典提取所述初步判定为目标的多个窗口图像的图像特征包括两个步骤，首先对窗口图像进行金字塔SIFT特征提取，然后利用预设的PHOW字典对窗口图像进行金字塔直方图投票。
6.一种图像识别系统，其特征在于，包括: 扫描模块，用于获取影像，并通过不同尺寸的扫描窗口对影像进行扫描，得到多个窗口图像； HOG-LBP特征提取模块，用于提取各个所述窗口图像的HOG-LBP特征向量； HOG-LBP识别模块，用于将所述多个HOG-LBP特征向量依次通过预设的HOG-LBP分类器进行识别，得到多个初步判定为目标的窗口图像； PHOff特征提取模块，用于通过预设的PHOW字典提取所述初步判定为目标的多个窗口图像的图像特征；PHOff识别模块，用于将所述多个窗口图像的图像特征通过预设的PHOW分类器进行识别，过滤掉非目标窗口图像，得到目标图像窗口图像；聚类模块，用于对所述目标窗口图像进行聚类处理，得到目标图像。
7.根据权利要求1所述的图像识别系统，其特征在于，所述聚类模块是使用带权值的MeanShift方法对目标窗口图像进行聚类处理。
8.根据权利要求1所述的图像识别系统，其特征在于，所述预设的HOG-LBP分类器可通过以下动作得到: 计算每个归一化的目标样本的特征向量作为正样本；在多个尺度中扫描负样本计算其特征向量，与正样本的特征向量一起用SVM训练初步线性分类器；保留正样本的特征向量与负样本的支持向量，其余的负样本特征向量丢弃；使用训练好的线性分类器继续扫描负样本，将分类结果大于O的特征向量替换丢弃掉的特征向量，直至所有的负样本都被扫描，得到的分类器作为最终的分类器。
9.根据权利要求1所述的图像识别系统，其特征在于，所述预设的PHOW分类器可通过以下动作得到: 计算每个归一化的行人样本的特征向量作为正样本；在多个尺度中扫描负样本计算其特征向量，与正样本的特征向量一起用SVM训练初步线性分类器；保留正样本的特征向量与负样本的支持向量，其余的负样本特征向量丢弃；使用训练好的线性分类器继续扫描负样本，将分类结果大于O的特征向量替换丢弃掉的特征向量，重新使用SVM训练线性分类器，直至所有的负样本都被扫描，得到的分类器作为最终的分类器。
10.根据权利要求1所述的图像识别系统，其特征在于，所述通过预设的PHOW字典提取所述初步判定为目标的多个窗口图像的图像特征包括两个步骤，首先对窗口图像进行金字塔SIFT特征提取，然后利用预设的PHOW字典对窗口图像进行金字塔直方图投票。
【文档编号】G06K9/00GK103679187SQ201210336518
【公开日】2014年3月26日申请日期:2012年9月12日优先权日:2012年9月12日
【发明者】马颖东, 邓亮, 陈先开申请人:深圳先进技术研究院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马颖东;邓亮;陈先开;
技术所有人：深圳先进技术研究院;
我是此专利的发明人

上一篇：一种移动终端获取图片缩略图的方法及装置制造方法
上一篇：一种在用户界面中标识选中对象的方法及装置制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。