一种基于多特征融合的行人检测方法

文档序号:8396158阅读:489来源:国知局
一种基于多特征融合的行人检测方法
【技术领域】
[0001] 本发明涉及一种行人跟踪方法,尤其涉及一种基于多特征融合的行人跟踪方法。
【背景技术】
[0002] 行人检测在视频监控、机器人学、虚拟现实等领域有着广泛的应用,也是计算机视 觉和模式识别领域中的重要研宄方向。不同的身材、姿势、衣着、光照,复杂的背景场景及摄 像头自身的移动和晃动,这都是行人检测问题的难点。如何快速、准确地从视频或图像背景 中将行人检测出来,仍是目前的一个研宄热点。
[0003]目前的行人检测方法可以分为以下三类:基于运动特性的行人检测、基于多部位 模板匹配的行人检测、基于机器学习的行人检测。
[0004] 基于运动特性的行人检测,是在对多幅连续图像进行检测和分析的基础上,实现 目标检测。如Vola等人提出使用连续两帧图像间上、下、左、右的位移差值,作为行人运动 特征的描述。这种方法的优势在于它不易受外观变化,如光照情况、衣着颜色等;而它的不 足之处在于需一系列连续的图片及运动的目标,实时性不佳且无法识别出静止的行人。
[0005] 基于多部位模板匹配的行人检测,这种方法首先利用模板匹配实现人体各个部位 的检测,如腿、头部等;然后,将这些部位的检测结果综合成对行人的检测。这类方法的有点 在于能较好地解决遮挡问题;而它的不足之处在于实时性欠佳,且由于行人的高矮胖瘦、运 动姿势等方面的不同,会导致检测率的降低。这类方法中的模板匹配包括固定模板与可变 形模板,如Zhao和Masoud提出的基于轮廓模型的目标跟踪能依据目标轮廓的运动进行模 板的自我修正。
[0006] 基于机器学习的行人检测,是通过特征提取和分类学习进行行人检测。这种方法 能解决因外形差异、运动姿势等引起的漏检、误检问题。特征提取是这个方法的核心之一, 如何提取高效的,能够迅速准确的区分出行人的特征是一个关键问题。

【发明内容】

[0007] 本发明目的在于克服现有行人跟踪方法的不足,提供了一种基于多特征融合的行 人跟踪方法,该方法是将HOG和LBP的融合特征用支持向量机分类进行分类,具有更强的行 人表征能力,在复杂背景下行人检测正确率明显提高。
[0008] 方法流程:
[0009] 步骤1 :对得到的深度图像进行降噪处理,以获得清晰的深度图像信息;
[0010] 步骤2 :基于阈值方法实现深度图像感兴趣区域检测,以获得图像目标的区域位 置信息;
[0011] 步骤3 :基于H0G-LBP特征,实现图像目标的检测。
[0012] 本发明是基于动态阈值实现深度图像的降噪,包括:
[0013] (1)将原图像分割成若干个子图像,其中为保留图像边缘、纹理等细节特征的连续 性,各子图像间存在一定的区域重叠,且自动设定重叠区域的大小。
[0014] (2)构造一种自适应识别边缘区域与非边缘区域;由于边缘、纹理等细节特征仅 占整幅图像的很小一部分,且梯度直方图中边缘区域与非边缘间并无明显界限,因而并不 能直接通过灰度直方图双峰实现梯度直方图的分割,而是在梯度直方图特性的基础上,构 造一种自适应识别边缘区域与非边缘区域的方法。
[0015] (3)自适应动态阈值是相对的,在全局最优原则下,按照子图像的局部特征,确定 不同图像区域的阈值。动态阈值的优点是可兼顾整体最优与局部细节,具有很好的实用性。
[0016] 本发明采用基于阈值的方法实现感兴趣区域的检测,该方法包括以下两个步骤: 一是计算行人的深度距离;二是选择合适的阈值,实现感兴趣区域的检测。具体过程包括:
[0017] (1)设Kinect返回行人头肩某一像素点的深度值为<,摄像头的最大视野距离为 L_,则根据Kinect的校准过程,可求得行人头肩实际的距离深度值为:
[0018] d = ktan (dt/Lmax+l. 187)-s
[0019] 通过实际距离与深度值的转换,可求得行人头肩某一像素点(i,j,d)的实际坐标 (x,y,z),进而求得行人的深度距离。
[0020] (2)通过距离与灰度值的换算关系,设置合适的阈值,实现感兴趣区域的检测。
[0021] 本发明是基于HOG-LBP特征,实现图像目标的检测,其具体实现过程包括:
[0022] (1)分别提取HOG特征和LBP特征;
[0023] (2)利用分类器实现目标检测。
[0024] 本发明应用于视频监控、机器人学、虚拟现实技术领域。
[0025] 有益效果:
[0026] 1、本发明依据一种基于多特征融合的行人检测方法,将HOG和LBP的融合特征用 支持向量机分类进行分类,更好地实现了向量机分类。
[0027] 2、本发明提出的方法具有更强的行人表征能力,在复杂背景下行人检测正确率明 显提尚。
【附图说明】
[0028] 图1为本发明的深度成像获取过程示意图。
[0029] 图2为本发明的深度成像原理图。
[0030] 图3为本发明的相同梯度对应不同的局部结构示意图。
[0031 ] 图4为本发明的方法流程图。
【具体实施方式】
[0032] 下面结合说明书附图对本发明创造作进一步的详细说明。
[0033] 本发明提供了一种基于多特征融合的行人检测方法,该方法首先利用Kinnect获 取深度图像,并对深度图像进行降噪处理;然后基于深度阈值的方法实现感兴趣区域的检 测;最后提取H0G-LBP联合特征,并用SVM分类器实现目标检测。
[0034] 本发明的基于多特征融合的行人检测方法的一个优选实施方式,具体包括以下步 骤:
[0035] 步骤1、利用Kinnect获取深度图像,并对深度图像进行降噪处理。
[0036] (1)深度成像的获取过程如图1所示,其具体过程如下描述:
[0037] 标定;首先在距光源的多个位置,分别用CMOS感光元件采集散斑图案;然后,分别 记录这些参考图像的位置(如图2所示的Xp x2, x3, x4),完成标定。
[0038] 取样;当物体在场景中运动时,会在物体表面形成新的散斑,且得到的散斑与所有 参考图像的散斑均不同,如图2中物体V、W形成的散斑是ZJP Z B。
[0039] 定位;将测试图像与所有参考图像分别计算相关系数,选取产生相关系数最大的 参考图像,即物体在该参考图像所在位置的可能性最大,如图2中V物体的散斑位置^与 x 2处参考图像的相关系数最大,即认为V物体在x 2位置;同理,W物体在x 3位置。
[0040] 重建;首先,根据所选参考图像与光源间的标定关系,通过几何变换得到物体到光 源的距离,依此构建3D图像,并归一化;然后,进行灰度转换,并将生成的深度图像输出;最 后,继续执行第2步,最终得到连续不断的深度图像视频流。
[0041] (2)深度图像的预处理,利用自适应阈值的中值滤波去除深度图像的噪声。
[0042] 将原图像分割成若干个子图像。为保留图像边缘、纹理等细节特征的连续性,分割 图像时,要使子图像间存在一定的区域重叠,且按梯度直方图统计特性,自动设定各子图像 与重叠区域的比值。
[0043] 计算子图像中各个像素(i,j)八邻域内四个方向的一阶偏导,以确定各个像素 (i,j)的梯度值N(i,j):
【主权项】
1. 一种基于多特征融合的行人检测方法,其特征在于,所述方法包括如下步骤: 步骤1;对得到的深度图像进行降噪处理,W获得清晰的深度图像信息; 步骤2 ;采用基于阔值方法实现深度图像感兴趣区域检测,W获得图像目标的区域位 置信息; 步骤3 ;采用基于HOG-LBP特征,实现图像目标的检测。
2. 根据权利要求1所述的一种基于多特征融合的行人检测方法,其特征在于,所述方 法的的步骤2是基于动态阔值对深度图像进行降噪处理,包括: (1) 将原图像分割成若干个子图像;为保留图像边缘、纹理等细节特征的连续性,分割 图像时,要使子图像间存在一定的区域重叠,且按梯度直方图统计特性,自动设定各子图像 与重叠区域的比值; (2) 在获得梯度直方图特性的基础上,构造一种自适应识别边缘区域与非边缘区域的 方法。
3. 根据权利要求1所述的一种基于多特征融合的行人检测方法,其特征在于;所述方 法的步骤2是基于距离阔值对感兴趣区域进行确定,W实现将前景目标所在区域从背景中 提取出来,包括: (1) 通过实际距离与深度值的转换,获得目标的深度距离; (2) 通过距离与灰度值的换算关系,设置合适的阔值,实现感兴趣区域的检测,获得图 像目标的区域位置信息。
4. 根据权利要求1所述的一种基于多特征融合的行人检测方法,其特征在于;所述方 法的步骤2是采用基于阔值的方法实现感兴趣区域的检测,该方法包括W下两个步骤;一 是计算行人的深度距离;二是选择合适的阔值,实现感兴趣区域的检测,包括: (1) 设Kinect返回行人头肩某一像素点的深度值为dy,摄像头的最大视野距离为Lm", 则根据Kinect的校准过程,可求得行人头肩实际的距离深度值为: d=ktan(dt/Lmax+L187)-s 通过实际距离与深度值的转换,可求得行人头肩某一像素点(i,j,d)的实际坐标 (X,y,Z),进而求得行人的深度距离; (2) 通过距离与灰度值的换算关系,设置合适的阔值,实现感兴趣区域的检测。
5. 根据权利要求1所述的一种基于多特征融合的行人检测方法,其特征在于;所述方 法的步骤3是基于册G-LBP特征,实现图像目标的检测,包括: (1) 分别提取HOG特征和LBP特征; (2) 利用分类器实现目标检测。
6. 根据权利要求1所述的一种基于多特征融合的行人检测方法,其特征在于;所述方 法首先利用Kinnect获取深度图像,并对深度图像进行降噪处理;然后基于深度阔值的方 法实现感兴趣区域的检测;最后提取H0G-LBP联合特征,并用SVM分类器实现目标检测。
7. 根据权利要求1所述的一种基于多特征融合的行人检测方法,其特征在于;所述方 法应用于视频监控、机器人学、虚拟现实技术领域。
【专利摘要】本发明公开了一种基于多特征融合的行人检测方法,该方法包括如下步骤:对获取的深度图像进行降噪处理;利用深度阈值实现感兴趣区域检测;在获取HOG-LBP联合特征的基础上,利用分类器实现目标检测。本发明依据一种基于多特征融合的行人检测方法,将HOG和LBP的融合特征用支持向量机分类进行分类。本发明具有更强的行人表征能力,在复杂背景下行人检测正确率明显提高。
【IPC分类】G06K9-00, G06K9-62
【公开号】CN104715238
【申请号】CN201510106784
【发明人】朱松豪, 陈玲玲, 李向向
【申请人】南京邮电大学
【公开日】2015年6月17日
【申请日】2015年3月11日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1