一种基于方向倒角距离特征的行人检测方法
【技术领域】
[0001] 本发明设及模式识别、机器学习、计算机视觉领域,直接应用于行人检测等领域。
【背景技术】
[0002] 作为多数计算机视觉问题中的重要组成部分,人及人的个体动作、人与人之间的 交互、人与机器的交互等越来越引起人们的重视。检测、识别和跟踪人体成为近些年最具有 挑战性的课题之一。仅在美国本±,每年近35000起意外交通事故中就有约5000起与行人直 接相关,所W设计实现自动行人检测系统已刻不容缓。
[0003] 行人检测作为识别和跟踪的基础步骤,在诸多领域应用广泛:
[0004] 1)视频监控
[0005] 随着监控摄像头的普及,公共场所的监控已经在交通疏导、疑犯追踪、人流量监测 等方面起到了重要作用。较大的监控区域和持续的监控时间都不利于人工监控。同时,人工 进行视频监控难W在监控同时完成对视频主体的有效跟踪与分析。自动行人检测技术的应 用可W有效提高视频监控的准确率和效率,必要时完成对异常情况的报警和追踪,大大减 少人力、物力、财力的投入。
[0006] 2)智能交通
[0007] 根据2013年南京市统计局公布的数据显示,南京全市机动车拥有量已达180.68万 辆,其中私家车拥有量为117.73万辆,W目前常住人口818.78万人计算,平均每7人中就有1 辆私家车。交通拥堵、事故频发、疲劳驾驶、停车难等一系列问题逐渐涌现。将行人检测技术 作为辅助驾驶系统的一部分,用于提醒驾驶员前方的行人,将极大提高行车安全。事实上, 目前已有一些行人检测技术被应用于实际的智能交通系统中,但是其性能仍未令人满意。 从Google公司的自动驾驶汽车Google化r上,我们能够看到行人检测技术在智能交通领域 的巨大潜力。
[000引3)多媒体检索与理解
[0009] 数字多媒体技术的迅猛发展无疑为当今的大数据时代创造了更多了解世界、了解 我们自身的契机。由于数据的爆炸性增长,对多媒体数据的检索与理解就显得尤为重要。 现有的多媒体检索多依靠于捜索引擎,包括Google、百度、Bing、化hoo!等,然而现有的捜索 技术在图像和视频捜索上远不如文档捜索成熟和高效。作为多媒体的信息来源主体之一, 有关于人的行为动作等相关多媒体数据极为丰富,也是我们最为关注的热点之一。利用行 人检测技术实现对于多媒体数据的人物信息检索和理解,将为下一步的数据分类和进一步 数据理解提供了极大帮助。
[0010] 除了相较于一般人体检测所具有的兼具刚性和柔性物体的特征,外观、姿态、尺 度、遮挡、视角等多变的情况,行人检测更多面临的是开放的环境,不同的光照、天气、路况 对检测结果的影响很大;运动的摄像机带来的行人检测问题使得普通的动态目标检测算法 并不能完全照搬照套,运动摄像机对于运动行人的检测更是难上加难;多数行人检测设备 多采用普通监控摄像机,原始图像和视频质量得不到保证,也基本没有红外和雷达等的额 外辅助设备;针对设及图像和视频理解的行人检测对于具体的情景更加敏感,有时甚至要 求算法达到实时性,运都对行人检测的研究提出了更多的要求。
[0011] 由于行人检测技术的挑战性和巨大的应用前景,越来越多的研究机构、高等院校、 研发型公司等都投入到运项研究中来,包括美国麻省理工学院、卡内基梅隆大学、日本丰田 汽车研究中屯、、戴姆勒-克莱斯勒研发中屯、、清华大学、中科院自动化所、中国科学技术大学 等。经过十余年的发展,1顺14、61'山1'师-8^33613、1)日111116'、(:日116油-1]54、1(11'1'1等行人检 测数据集也成为本领域里最具有代表性的一批数据集。
[0012] 行人特征描述子一般可W分为底层特征、基于学习的特征和混合特征。底层特征 从图像纹理、梯度等方向描述行人,计算速度较快,但判别能力较弱,鲁棒性不够;基于学习 的特征采用监督学习技术,从大量样本从学习判别能力较强的特征,训练使用的正样本是 否具有代表性直接决定了最终生成特征的判别能力,训练时间也随之变化;混合特征则多 为多个底层的融合,有些也添加了学习特征的高阶统计特征,一般情况下准确率更高,但特 征维数增加,计算复杂度较高,不利于实现算法的实时性。表1给出了十余年来典型的行人 检测算法特点。
[0013]
[0014]
[0015]
[0016] 表1典型行人检测算法特点
[0017] 可W发现,行人检测方法一般可W分为基于表观的表示方法和基于人体模型的表 示方法。基于表观的表示方法侧重于寻找特定的行人描述,可W是单纯的图像颜色信息、灰 度信息、甚至是网格特征等。表观也可W是行人轮廓或区域,如Kale等使用行人轮廓判别步 态,Veerara曲aVan等使用轮廓标记点分析人体运动。人体运动信息也可W通过光流、目标 轨迹、速度等表现。表1中列出的行人特征也都属于基于表观的表示方法。基于人体模型的 表示方法重屯、在于对人体及其运动姿态建模,分析参数变化识别行人及其运动,一般可W 用于手势识别等比较精细的运动识别。某些行人姿态检测算法也采用了类似的方法。对行 人进行建模一般使用线图模型和2D模型。3D模型由于计算复杂度过高并且参数整定困难, 在单一摄像机或缺乏图像深度信息的情况下应用较少。
[0018] 尽管在行人检测领域已经成果颇丰,但离大规模实用化仍有相当一段距离,许多 问题仍有待解决,需要我们进一步努力探索。
【发明内容】
[0019] 本发明提供了一种基于方向倒角距离(化iented化amfer Distance,0CD)特征的 行人检测方法,在回顾了行人检测领域十余年的研究成果的基础上,集中不同特征描述方 法各自的优势,设计了一种行人轮廓特征描述子OCD特征。同时,使用Bag Of Words(BOW)模 型中的特征量化方法,提高了特征对噪声的抗干扰能力,并为OCD特征添加了图像的多尺度 特征,进一步提高了 OCD特征对于行人轮廓的描述能力。
[0020] -种基于方向倒角距离特征的行人检测方法,其特征在于:包括如下步骤:
[0021] 步骤(1):输入待检测图像,对待检测图像进行预处理得到待检测边缘图像;
[0022] 步骤(2):提取方向倒角距离特征,所述方向倒角距离特征为
[0023] dA(X) = (l-人)?山ham'T(X)+A ?山rient(x) (8)
[0024] 其中,A为方向特异性参数,表征基本倒角距离定义和其方向定义的权重;
[0025] 步骤(3): W方向倒角距离作为距离度量比较经步骤(1)处理的待检测边缘图像 轮廓与模板图像轮廓的相似性判断待检测边缘图像是否为行人图像;模板图像为已判断为 是行人轮廓的图像。
[0026] 对所述步骤(1)得到的所述待检测边缘图像进行图像块有效性判断,过程如下:
[0027] 步骤(11):获取步骤(1)处理后待检测边缘图像的图像块序列;
[0028] 步骤(12):选取其中某一图像块,判断选取的图像块是否有效;若无效,则重复本 步骤重新选取另一图像块;若有效,贝峭巧专到步骤(13);其中,所述图像块的有效性根据图 像块间的方向倒角距离大小判断;
[0029] 步骤(13):得到有效图像块序列;确定所有图像块的有效性是否已经判断完毕;若 未判断完毕,则返回步骤(12);若已经判断完毕,则得到有效图像块序列。
[0030] 本发明提供了一种基于方向倒角距离特征的行人检测方法,本发明将原始倒角距 离特征进行扩展,加入轮廓方向特征,并进一步对特征进行码本和多尺度描述,形成具有尺 度不变性的强OCD特征,针对人体轮廓特征表示的特点,并使用BOW模型和图像多尺度结构, 提高了 OCD特征对噪声的抗干扰能力,充分提升了行人检测系统的正确率。
【附图说明】
[0031 ]图1为传统模式识别流程。
[0032] 图2为方向倒角距离示意图。
[0033] 图3为本发明行人检测实验流程图。
[0034] 图4为本发明OCD特征提取流程图。
[0035] 图5为化nny算子边缘检测流程图。
[0036] 图6为不同轮廓检测方法在Weizmann数据集上的匹配结果。
[0037] 图7为实验正样本举例。
[003引图8为CART示例图。
[0039] 图9为两层CART的5-fold交叉验证特征选择结果对比图。
[0040] 图10为S层CART特征选择结果对比图。
[0041] 图11为分类器过拟合示意图。
[0042] 图12为5-fold SVM参数grid-search优化结果对比图。
[0043] 图13为SVM参数PSO优化结果对比图。
[0044] 图14为SVM参数GA优化结果对比图。
[0045] 图15为不同采样窗口数下的OCD特征统计分布图。
[0046] 图16为不同融合阔值下的OCD特征统计分布图。
【具体实施方式】
[0047] 下面结合附图对本发明的技术方案进行详细说明:
[0048] 按照传统模式识别理论,行人检测问题可W按照图1转化为一个二分类问题,即判 别输入图像是否为行人。运样,行人检测的重点在于特征提取和分类器设计两个部分。
[0049] 行人检测领域的经典特征包括Haar-Iike特征、HOG化istOgram ofOriented Gradient)特征、轮廓特征等。作为普通的目标分类问题,贝有SIFT(Scale Invariant Fea1:ure Transform)特征、SURF(Speeded-Up Robust Fea1:ures)特征和其他特征描述子。 分类器也已经存在较