专利名称:一种窗口分割和重组的跟踪方法
技术领域:
本发明涉及一种基于Mean-Shift的窗口分割和重组的跟踪方法。
背景技术:
Mean-Shift算法是一种常用的跟踪方法,现在广泛应用于视频监控系统中。 该算法鲁棒性较强,实时性较好,符合大部分视频监控系统对时间的要求。
在目前、基于Mean-Shift的跟踪方法中,跟踪窗口一般是以矩形或者椭圆形等 简单的几何形状来表示。随着目标在场景中的移动,跟踪窗口尺寸的选择是一个 难点,尺寸太大或者太小都会引起问题,所以关键是找到一个合适的窗口。
发明内容
发明目的本发明的目的是针对现有技术的不足,提供一种基于Mean-Shift 的窗口分割和重组的跟踪方法。
技术方案本发朋根据运动目标的颜色分布的规律进行一次划分,得到运动 目标的两个子部分,同时保证划分的这两部分在颜色的差异上尽可能的大,然后 对这两个划分的子部分分别用Mean-Shift方法进行跟踪,得到两个子部分新的位 置,再在当前帧通过边缘的分割得到一个近似的矩形,最后通过结合上述两步的 结果得到目标现在的跟踪窗口。该方法包括以下步骤(l)在第一帧初始化跟踪 窗口的尺寸;(2)根据目标的颜色信息找出一个划分位置,使划分的两个子部分 颜色之间的方差最大;(3)对步骤(2)划分的子部分和原目标框分别用Mean-Shift 方法进行跟踪;(4)在步骤(3)跟踪结果的边缘部分根据颜色信息进行划分, 得到近似的跟踪窗口; (5)用加权的方法结合(3)和(4)的结构得到目标的位 置;(6)取下一帧图片,重复步骤(2)到(5),进行跟踪。
有益效果本发明与现有技术相比,其显著优点是能够更准确地用尺寸比 较合适的跟踪窗口来跟踪运动物体。
图l是本发明方法追踪目标的动态过程图,共三页9幅图;图2是本发明方 法的组成结构图。图3是本发明方法的流程图。
具体实施例方式
如图1所示,本发明方法包含初始化模块,运动目标划分模块、Mean-Shift
4子部分跟踪模块、边缘分割模块和跟踪窗口重组模块。
本发明方法流程如图2所示,下面详细说明
步骤l,从外部设备(如摄像头)读入第一张图片。
步骤2,手动用外接矩形把图中要跟踪的物体框定出来。
步骤3,记录下步骤2中目标框外围四点的坐标,如目标框的左上角坐标是 (:ro,yo),右上角坐标是Oro,w),左下角坐标是(&,的),右下角坐标是(^,仏),则 窗口的高度是A-w,窗口的宽度是w-w。并计算它所包围的封闭区域的颜色 直方图(RGB,灰度都可)信息。
步骤4,根据步骤3中的目标框的位置定义一个矩形的中心区域。如目标框 的左上角坐标是Oro,yo),右上角坐标是Oro,w),左下角坐标是(an,饰),右下角坐 标是(A,yO,则此目标框中的中心区域的四个角的坐标位置为左上角为 (a;o + Q!(;ri — x0), y0 + —2/o))'右上角为(工0 + o;(;^ — ;r0),?/i 一 — y。)), 左 下 角 为 (a;i — — ro),yo + — y0)), 右 下 角 为 (o;i — a(a — ;ro),w — a(仏—y0))。其中a, (0 < a < 0.5)衡量中心区域到目标框的 距离,a越小表示中心区域离目标框的距离越小,反之越远。
步骤5,在步骤4中定义的中心区域中找出一条直线来划分这个目标框区域, 可以垂直的划分,也可以水平的划分,划分评价的依据是使划分的左右两部分或 者上下两部分区域所包围的像素点之间颜色平均值的方差最大。
步骤6,取下一帧的图片,目标框保持不动。
步骤7,对步骤5中的划分出的两部分以及原目标框这三部分分别进行 Mean-Shift的跟踪,得到三个新的窗口。 其中Mean-Shift算法的具体步骤是
(1) 计算当前目标区域直方图与原目标模型直方图的巴氏距离/01;
(2) 计算当前帧与上一帧的相似性权值,比如现有一个像素点灰度是x,则 分别统计当前目标区域直方图与原模型直方图中灰度是T的像素点个数分别是
iVwm与iVwm2,则此像素点的权值为^/|^;
(3) 根据(2)中的权重计算现在目标中心的位置,现在中心的位置是
5其中&表示区域中像素点的颜色值(灰度,RGB都可),n表示区域中像素 点的个数,wOc,)表示用(2)的方法计算出的^这个点的相似性权值;
(4) 计算目标区域直方图与原目标模型直方图的巴氏距离P2;
(5) 根据计算巴氏距离的差值判断是否已经达到收敛的条件,即h -化l是 否小于指定的阈值,否就回到(2)继续循环,是就停止。
步骤8,把步骤7中的三个窗口组合起来,在该方法中,假定划分是水平 划分的,经过步骤7以后两个子窗口的四条边界分别是 (m外,dow ,Ze/"1), Wp/i", (m仍,down2, Ze/力(2), /^似2),和整个窗口的跟踪结 果(邵e,doume,Ze/i(e),r^似e),则组合以后的窗口H^的结果是上边界是 3/4氺tift + l/4*M/)e,下边界是3/4 * <iown2 + 1/4* downe,左,右边界分别是 3/7 * ZeA + 3/7 * Ze/i2 + 1/7 * Ze仏,3〃 * 一^ + 3〃 *吻似2 + 1〃 * Hp似e; 同理,垂直划分的情况与此类似。
步骤9,边缘分割,在上一次跟踪窗口四条边缘的邻域内找出一条使分开 的两部分区域的颜色平均值的方差最大,把新的四条边缘组成新的窗口H^。在 本发明的方法中,假设目标框的左上角坐标是(:r。,加),右上角坐标是(xo,y。,左 下角坐标是(^,yo),右下角坐标是(^,w),则目标框的高是/i,宽是w,则上边界 的矩形邻域的四个点的坐标是(xo —V4,饰),—V4,W), 0ro + V4,的), (a;o + V4,yO,下,左,右边界的邻域以此类推。
步骤10,把l^和W2的边界以加权平均的方式求平均的新的跟踪窗口Ww^。
假定H^和^2的上,下,左,右的边界分别是(t^,dow ,k/力(l),r^/^),和
(Mp2,d0Wri2,k/i(2),r^似2),在本发明中W^ew的上,下,左,右边界分别是
顺/2 +顺/2, do濯i/2 + do簡2/2, + Ze/t2/2, + 一似2/2。
步骤ll,回到步骤l,进行下一次跟踪。
权利要求
1、一种窗口分割和重组的跟踪方法,其特征在于该方法包括以下步骤(1)在第一帧初始化跟踪窗口的尺寸;(2)根据目标的颜色信息找出一个划分位置,使划分的两个子部分颜色之间的方差最大;(3)对步骤(2)划分的子部分和原目标框分别用Mean-Shift方法进行跟踪;(4)在步骤(3)跟踪结果的边缘部分根据颜色信息进行划分,得到近似的跟踪窗口;(5)用加权的方法,结合步骤(3)和(4)的结果得到目标的位置;(6)取下一帧图片,重复步骤(2)到(5),进行跟踪。
2、 根据权利要求l所述的一种窗口分割和重组的跟踪方法,其特征在于步 骤(1)所述的在第一帧初始化跟踪窗口的尺寸的步骤是(2.1) 从外部设备读入第一张图片;(2.2) 手动用外接矩形把图中要跟踪的物体框定出来;(2.3) 记录下步骤(2.2)中目标框外围四点的坐标,计算出窗口的高度及 宽度,并计算它所包围的封闭区域的颜色直方图的RGB或灰度信息。
3、 根据权利要求l所述的一种窗口分割和重组的跟踪方法,其特征在于步 骤(2)所述的根据目标的颜色信息找出一个划分,使划分的两个子部分颜色之 间的方差最大的步骤是(3.1) 根据目标框的位置定义一个矩形的中心区域;(3.2) 在步骤(3.1)中定义的中心区域中找出一条直线来划分这个目标框 区域,使划分的左右两部分或者上下两部分区域所包围的像素点之间颜色平均值 的方差最大。
4、 根据权利要求l所述的一种窗口分割和重组的跟踪方法,其特征在于步 骤(3)所述的对步骤(2)划分的子部分及原目标框分别用Mean-Shift方法进行 跟踪的步骤是(4.1) 取下一帧的图片,目标框保持不动;(4.2) 对步骤(2)中的划分出的两部分以及原目标框这三部分分别进行 Mean-Shift的跟踪,得到三个新的窗口 。
5、 根据权利要求1或4所述的一种窗口分割和重组的跟踪方法,其特征在 于Mean-Shift算法的步骤是(5.1) 计算当前目标区域直方图与原目标模型直方图的巴氏距离化;(5.2) 计算当前帧与上一帧的相似性权值;(5.3) 根据(2)中的权重计算现在目标中心的位置;(5.4) 计算目标区域直方图与原目标模型直方图的巴氏距离P2;(5.5) 根据计算巴氏距离的差值判断是否已经达到收敛的条件,即l^-化l 是否小于指定的阈值,否就回到步骤(2)继续循环,是就停止;(5.6) 将步骤(3)跟踪得到的三个新窗口组合起来,组合后的窗口M^。
6、 根据权利要求1所述的一种窗口分割和重组的跟踪方法,其特征在于步 骤(4)所述的在上一次跟踪结果的边缘部分根据颜色信息进行划分,得到近似 的跟踪窗口的步骤是在步骤(3)跟踪得到窗口四条边缘的邻域内找出一条使 分开的两部分区域的颜色平均值的方差最大,把新的四条边缘组成新的窗口#2。
7、 根据权利要求l所述的一种窗口分割和重组的跟踪方法,其特征在于步 骤(5)所述的用加权的方法,结合步骤(3)和(4)的结果得到目标的位置的步骤是 把^和V^的边界以加权平均的方式求平均得到新的跟踪窗口H^^。
全文摘要
本发明公开了一种窗口分割和重组的跟踪方法,包括如下步骤(1)在第一帧初始化跟踪窗口的尺寸;(2)根据目标的颜色信息找出一个划分,使划分的两个子部分颜色之间的方差最大;(3)对步骤(2)划分的子部分及原目标框分别用Mean-Shift方法进行跟踪;(4)在步骤(3)跟踪结果的边缘部分根据颜色信息进行划分,得到近似的跟踪窗口;(5)用加权的方法,结合步骤(3)和(4)的结果得到目标的位置;(6)取下一帧图片,重复(2)到(5),进行跟踪。本发明能够更准确地用尺寸比较合适的跟踪窗口来跟踪运动物体。
文档编号H04N5/222GK101442609SQ20081019518
公开日2009年5月27日 申请日期2008年11月7日 优先权日2008年11月7日
发明者史颖欢, 阳 高 申请人:南京大学