一种基于稀疏编码和神经网络的行人图片检测方法_3

文档序号:9911596阅读:来源:国知局
其检测分数为 Sd、高度为hu,被抑制窗口(较小窗口)为BBd,其检测分数为sd、高度 为hd,则抑制窗口 BBU与被抑制窗口 BBd的重合面积阈值为:
[0105]
[0106] 当重合面积阈值结果为0.65时,不采用动态阈值抑制,其中α = 〇. 7;
[0107] 当重合面积阈值小于0.65时,采用动态阈值抑制;
[0108]最终得到准确的定位窗口。
[0109] 其中,所述步骤S901中,标记检测窗口进行并进行转换具体为:
[0110] 假设Β是Η点在层图像中的坐标,Β '是Η点视频帧原图像中的坐标,坐标Α为检测窗 口左上角的坐标,计算公式如下:
[0111] B'=B_pad
[0112] A = B' + (modelDsPad-modelDs)/2 = B+(modelDsPad-modelDs)/2-pad
[0113] 其中,modelDsPad是检测窗口对行人的扩展,modelDs为行人尺寸,pad是计算特征 时对输入图像的扩展;将检测窗口左上角坐标A除以缩放因子,得到检测窗口左上角在视频 帧原图像中对应的坐标;
[0114]窗口高度和窗口宽度除以缩放因子得到转换后的窗口高度和窗口宽度;
[0115]置信分数不变,其中置信分数为检测窗口对应特征向量距离BP-adaboost决策平 面的距离。
[0116]以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和 原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种基于稀疏编码和神经网络的行人图片检测方法,其特征在于,所述图片检测方 法具体为: 步骤S101:首先对样本数据集中的正样本和负样本做图像预处理,然后再提取聚合通 道特征; 步骤S102:构建BP-AdaBoost强分类器模型,并利用步骤S101得到的聚合通道特征对 BP-AdaBoost强分类器进行训练; 步骤S103:获取待检测视频帧,并对视频帧进行图像预处理,并根据缩放因子进行不同 尺度的缩放得到图片金字塔,所述图片金字塔是由视频帧的原图像和若干缩放图像组成的 层图像集; 步骤S104:利用快速图像特征金字塔计算方法结合滑动窗口检测法,对层图像集每一 层层图像所处的窗口图像进行计算得出聚合通道特征,并利用训练好的BP-AdaBoost强分 类器进行分类识别; 步骤S105:当窗口图像的检测结果为正样本,则BP-AdaBoost强分类器输出检测窗口, 将所有层图像对应的检测窗口进行融合得到准确的定位窗口;当窗口图像的检测结果为负 样本,则无输出。2. 根据权利要求1所述的基于稀疏编码和神经网络的行人图片检测方法,其特征在于, 所述步骤S101中,所述样本数据集包括INRIA训练样本集和INRIA训练样本集的对称变换样 本集。3. 根据权利要求1所述的基于稀疏编码和神经网络的行人图片检测方法,其特征在于, 所述步骤S101和所述步骤S103中,所述图像预处理包括尺寸归一化处理和图像降噪处理; 所述图像降噪处理采用的滤波器为小波滤波器。4. 根据权利要求1所述的基于稀疏编码和神经网络的行人图片检测方法,其特征在于, 所述步骤S101和所述步骤S103中,所述聚合通道特征包括三种通道特征:HSV颜色空间、梯 度方向直方图和梯度强度特征。5. 根据权利要求4所述的基于稀疏编码和神经网络的行人图片检测方法,其特征在于, 所述HSV颜色空间由视频帧的RGB颜色空间转换得到,具体为: 设RGB颜色空间中红、绿和蓝颜色的坐标均为(r,g,b),r、g、b的值是在0到1之间的实 数,设max等价于r、g和b中的最大者,设min等于r、g和b中值中的最小者,设HSV空间坐标值 为(h,s,v),其中he[〇° ,360°)为色调,8 6[〇,1]为颜色,¥6[〇,1]为饱和度,计算公式为:v=max; 所述梯度强度的计算公式为:所述梯度方向直方图的计算公式为: 0(x,y)=arctan((I(x,y+l)-I(x,y-l))/(1 (x+l ,y)-I(x-l ,y)))〇6. 根据权利要求1所述的基于稀疏编码和神经网络的行人图片检测方法,其特征在于, 所述步骤S102中,构建BP-AdaBoost强分类器具体为: 步骤S601:从样本数据集中随机选择m组训练数据(XI,yi) (X2,y2)…(xm,ym),其中xi为训 练样本数据,yie{l,-l}为样本期望分类结果,其中i = l,2, ···,!!!;初始化训练数据的分布 权值Di(i) = 1/m,i = 1,2,…,m,根据样本输入和输出的维数确定BP神经网络的网络结构, 即输入层和输出层节点的个数;并初始化BP神经网络的其他参数值包括权值、学习效率、隐 含层节点个数和决策阈值; 步骤S602 :训练第t(t = 1,2,…,m)个弱分类器时,用训练样本集训练BP神经网络,并得 到预测训练数据的网络输出,得到弱分类器序列g(t)的预测误差和ei,其计算公式为:其中,g(t)为网络的实际输出,y为样本期望分类结果; 步骤S603:根据计算出的预测误差和ei,计算弱分类器的权重&1,计算公式为:步骤S604:根据权重计算结果,调整下一次训练时样本的权重,调整公式如下:其中i = l,2,···,m,Bi为归一化算子; 步骤S605:t次迭代后,得到t组弱分类器函数f(gl,ai),并由这些弱分类器函数共同构 成了最终的BP-AdaBoost强分类器:7. 根据权利要求1所述的基于稀疏编码和神经网络的行人图片检测方法,其特征在于, 所述步骤S103中,所述图片金字塔通过如下方式得到: 使用缩放因子s = 2_k/8,将视频帧的原图像进行缩放得到19层的精密采样金字塔,所述 精密采样金字塔为由视频帧的原图像和18张缩放图像组成的层图像集,其中最小缩放图像 与滑动窗口检测法采用的窗口大小相同。8. 根据权利要求1所述的基于稀疏编码和神经网络的行人图片检测方法,其特征在于, 所述步骤S104中,所述快速图像特征金字塔计算方法具体为: 先计算出缩放因子为1、1/2、1/4的层图像的特征层,依据计算好的层图像的特征层估 算其左右层图像的特征层,特征估算公式为: Cs ? R(CS,,s/s')(s/s')-λΩ 其中,Cs为待估算的特征层,其缩放因子为s,s'为事先己经计算好的层中与s距离最近的层的缩放因子 ^((^,8/8')表示将(^的尺寸缩放为原来的 8/8'倍; , λΩ取决于具体特征的常系数,通过训练样本估计得出。9. 根据权利要求1所述的基于稀疏编码和神经网络的行人图片检测方法,其特征在于, 所述步骤S105中,融合具体为: 步骤S901、标记BP-AdaBoost强分类器输出的检测窗口并进行转换,得到与视频帧原图 像对应的位置窗口,其中检测窗口和位置窗口由四个元素组成:左上角坐标、窗口高度、窗 口宽度和分类算法计算得到的置信分数; 步骤S902、采用非极大值抑制算法将位置窗口进行融合,具体为: 假设两个位置窗口分别为bbl和bb2,二者重合率ao计算公式如下:当重合率εω〈θ时,两个位置窗口不做任何处理,其中Θ = 〇. 5; 当重合率aQ>0时,则再计算两个位置窗口的重合面积阈值,假设抑制窗口为BBU,其检测 分数为sd、高度为hu,被抑制窗口为BBd,其检测分数为sd、高度为hd,则抑制窗口 BBU与被抑制 窗口 BBd的重合面积阈值为:当重合面积阈值结果为〇. 65时,不采用动态阈值抑制,其中α = 〇. 7; 当重合面积阈值小于〇 .65时,采用动态阈值抑制; 最终得到准确的定位窗口。10. 根据权利要求9所述的基于稀疏编码和神经网络的行人图片检测方法,其特征在 于,所述步骤S901中,标记检测窗口进行并进行转换具体为: 假设Β是Η点在层图像中的坐标,Β'是Η点视频帧原图像中的坐标,坐标Α为检测窗口左 上角的坐标,计算公式如下: B' = B_pad A = B,+ (modelDsPad-modelDs)/2 = B+(modelDsPad-modelDs)/2-pad 其中,modelDsPad是检测窗口对行人的扩展,modelDs为行人尺寸,pad是计算特征时对 输入图像的扩展;将检测窗口左上角坐标A除以缩放因子,得到检测窗口左上角在视频帧原 图像中对应的坐标; 窗口高度和窗口宽度除以缩放因子得到转换后的窗口高度和窗口宽度; 置信分数不变。
【专利摘要】本发明公开了一种基于稀疏编码和神经网络的行人图片检测方法,具体为:先预处理样本数据集中的样本并提取聚合通道特征;构建BP-AdaBoost强分类器模型并训练;对视频帧进行预处理,并进行不同尺度的缩放得到图片金字塔;利用快速图像特征金字塔计算方法结合滑动窗口检测法,对窗口图像进行计算得出聚合通道特征,并利用训练好的强分类器进行分类;当窗口图像的检测结果为正样本,则输出检测窗口,将所有检测窗口进行融合得到准确的定位窗口。本发明的有益效果是:本发明的检测方法在训练样本很大时仍能够具有计算速度快、精确度高的优势。
【IPC分类】G06K9/00, G06K9/46, G06K9/62
【公开号】CN105678231
【申请号】CN201511020817
【发明人】舒泓新, 蔡晓东, 陈昀, 王爱华
【申请人】中通服公众信息产业股份有限公司
【公开日】2016年6月15日
【申请日】2015年12月30日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1