大数据环境下的行人检测的方法
【专利摘要】本发明公开了一种大数据环境下的行人检测的方法,步骤如下:1)将所选取的训练样本图像统一为相同尺寸大小的图像,计算样本图像的特征;2)使用汉明码距离相似性度量方法,计算特征相似性;3)根据特征的相似性对样本进行聚类,将样本分为多个类别;4)对于每一个类别分别进行训练,得到多个分类器模型;5)联合多个分类器对新样本进行测试。?本发明计算效率高,为实时处理提供了有利条件。
【专利说明】大数据环境下的行人检测的方法
【技术领域】
[0001] 本发明涉及计算机视觉和模式识别领域,更具体地说,是一种在大数据环境下对 行人检测的方法。
【背景技术】
[0002] 行人检测是指在输入图像或者视频序列中将人体区域从背景中分割出来的过程。 随着信息化时代的高速发展,图像数据规模日益增大,如何有效利用大规模图像数据进行 行人检测,成为一个新的挑战。
[0003] 大规模图像数据行人检测的主要难点在于数据规模庞大、数据维度高,对计算机 的处理效率要求高,以及数据本身的低信噪比和弱配准。低信噪比是指人体数据中噪声所 占比例较大而能够被用于对人体进行判别的信息相对较少。弱配准是指因人体形态上的差 异而很难将人体的各个部分进行比较好的对齐。这些难点问题综合作用结果就是人体数据 具有非常大的类内散度。因此如何从大规模图像数据中提取有效的特征信息对行人检测至 关重要,直接影响到行人检测的准确率。
[0004] 常见的行人检测特征提取方法有方向梯度直方图(Histogram of Oriented Gradient, HOG)、局部二值模式(Local Binary Pattern, LBP)、局部轮廓方向特征 (Edgelet)等方法。HOG特征主要是通过刻画图像的局部梯度幅值和方向特征来描述行人, 这种方法可以有效的提取人体的边缘特征,其缺点在于维度高、计算慢等;LBP是一种用于 描述图像局部纹理特征的算子,对于单调变化的灰度特征具有不变性,但是对于低分辨率 的图像其判别能力较差;Edgelet主要是用于描述行人的局部轮廓方向特征,缺点主要是 该特征的计算比较复杂。这些特征在大规模图像数据环境下表现为特征数据维度高,计算 开销大,以及难以有效的描述行人的多变性。另外,在大规模图像数据下的行人检测需虑到 大规模图像数据本身特征信息的相关性,直接训练分类器对行人进行检测,会使得特征本 身对行人的描述能力不够强,检测准确率不高。
【发明内容】
[0005] 本发明的目的在于针对大规模图像数据环境下的数据规模大和类内散度大的问 题,提出一种随机特征的方法来对大规模图像数据进行聚类和训练分类器,最终完成在大 规模图像数据环境下的行人检测的方法。
[0006] 实现本发明目的的技术方案为:该方法主要包括以下步骤:
[0007] 1)将所选取的训练样本图像统一为相同尺寸大小的图像,计算样本图像的特征;
[0008] 2)使用汉明码距离相似性度量方法,计算特征相似性;
[0009] 3)根据特征的相似性对样本进行聚类,将样本分为多个类别;
[0010] 4)对于每一个类别分别进行训练,得到多个分类器模型;
[0011] 5)联合多个分类器对新样本进行测试。
[0012] 上述方法中,所述步骤1)中样本分为正例样本和反例样本,正例样本是指含有 行人的图像,反例样本是指不含有行人的图像。
[0013] 所述步骤1)中计算样本图像的特征包括以下具体步骤:
[0014] 11)针对样本图像随机初始化fn个的相同大小的区域块,fn的取值范围为 1000?10000,每个区域块随机初始化tn个的坐标点对,这里可以设tn = {4, 8, 16, 32};
[0015] 12)针对每一个区域块,计算坐标点对的像素差值,若差值大于自定义的阈值P, 则该坐标点对的形成的特征值为1,若差值小于或等于自定义的阈值P则为0。每个区域 块的特征是由〇和1组成,长度为tn的序列;
[0016] 13)对于每一个样本图像,计算fn个区域块的特征,所有区域块的特征最终形成 样本图像的特征T,特征T是由fn个长度为tn的序列组成。
[0017] 上述方法中,所述步骤2)中计算特征相似性包括以下具体步骤:
[0018] 21)计算码长为tn的汉明码距离,并将其存储于查找表LUT中;
[0019] 22)计算特征的汉明码距离,例如,对于样本图像\的特征凡和样本图像Χ』的特 征I,计算公式如下 :
[0020]
【权利要求】
1. 一种大数据环境下的行人检测的方法,其特征在于步骤如下: 1) 将所选取的训练样本图像统一为相同尺寸大小的图像,计算样本图像的特征; 2) 使用汉明码距离相似性度量方法,计算特征相似性; 3) 根据特征的相似性对样本进行聚类,将样本分为多个类别; 4) 对于每一个类别分别进行训练,得到多个分类器模型; 5) 联合多个分类器对新样本进行测试。
2. 根据权利要求1所述的大数据环境下的行人检测的方法,其特征在于:所述步骤1) 包括以下具体步骤: 11) 针对样本图像随机初始化fn个的相同大小的区域块,fn的取值范围为1000? 10000,每个区域块随机初始化tn个的坐标点对,设tn = {4, 8, 16, 32}; 12) 针对每一个区域块,计算坐标点对的像素差值,若差值大于自定义的阈值P,则该 坐标点对的形成的特征值为1,若差值小于或等于自定义的阈值P则为〇,因此,每个区域 块的特征是由〇和1组成,长度为tn的序列; 13) 对于每一个样本图像,计算fn个区域块的特征,所有区域块的特征最终形成样本 图像的特征T,特征T是由fn个长度为tn的序列组成。
3. 根据权利要求1所述的大数据环境下的行人检测的方法,其特征在于:所述步骤2) 计算特征相似性包括以下具体步骤: 21) 计算码长为tn的汉明码距离,并将其存储于查找表LUT中; 22) 计算特征的汉明码距离,对于样本图像\的特征?\和样本图像X」的特征Τ」,计算 公式如下:
(1) 其中,If表示特征Ti第k段序列,:Γ,4表示特征L第k段序列,符号·'表示异或运算,符 号?表示取反运算。
4. 根据权利要求1所述的大数据环境下的行人检测的方法,其特征在于:样本分为正 例样本和反例样本,正例样本是指含有行人的图像,反例样本是指不含有行人的图像,所述 步骤3)样本聚类包括以下具体步骤: 31) 正例样本聚类; 32) 反例样本聚类。
5. 根据权利要求4所述的大数据环境下的行人检测的方法,其特征在于:所述步骤31) 包括以下具体步骤: 311) 初始化类个数为零,即c = 0,类的特征向量为空,即V = NULL ; 312) 对于正例样本\的特征1\,利用步骤2)分别计算?\与现有类的特征向量Vj的汉 明码距离 Du, j = 0, 1,. . . c ; 313) 在Di」,j = 0, l,...c中,其最大值记为Max{Dik},若Max{Dik}为负或小于阈值Pp 则该样本归为新的一类,并且该类的特征向量为否则该样本归为第k类; 314) 重复312)?313)直至计算完所有正样本,最终生成c个类别。
6. 根据权利要求4所述大数据环境下的行人检测的方法,其特征在于:所述步骤32) 包括以下具体步骤: 321) 对于反例样本Xi的特征1\,利用步骤2)分别计算?\与c个类的特征向量'的汉 明码距离 Du, j = 0, 1,. . . c ; 322) 在Di」,j = 0, 1,· · · c中,其最大值记为Max {Dik},若Max {Dik}大于或等于阈值P N 则该样本归为第k类,否则该样本归为第c+1类; 323) 重复321)?322)直至计算完所有负样本。
7. 根据权利要求1所述的大数据环境下的行人检测的方法,其特征在于:所述步骤4) 训练分类器模型包括以下具体步骤: 41) 对于第i类,分别将正例样本和反例样本的第i类对应所有样本特征载入libsvm 分类器中,得到该类的分类器模型Mi ; 42) 重复步骤41)直至所有的类别都已经训练完。
8. 根据权利要求1所述的大数据环境下的行人检测的方法,其特征在于:所述步骤5) 包括以下具体步骤: 51) :对于每一个测试样本\,按照步骤1)提取特征1\,选取所有c个分类器模型作为 组合分类器; 52) :将特征?\载入到模型%中进行测试得到测试分数Sj ; 53) :重复步骤52)直至所有的模型已经测试完并且得到总分数:
(2) 54) :若Sum大于0,则该样本测试为正例,否则该样本测试为反例; 55) :重复上述步骤51)?步骤54)直至所有的样本测试完毕。
【文档编号】G06K9/62GK104091152SQ201410308037
【公开日】2014年10月8日 申请日期:2014年6月30日 优先权日:2014年6月30日
【发明者】刘亚洲, 袁文, 孙权森 申请人:南京理工大学