基于随机投影蕨的实时目标跟踪算法

文档序号：9288817阅读：643来源：国知局

基于随机投影蕨的实时目标跟踪算法
【技术领域】
[0001] 本发明涉及计算机视觉与模式识别技术，具体涉及一种基于随机投影蕨的实时目标跟踪算法，可应用于人机交互，视频监控等领域。
【背景技术】
[0002] 目标跟踪一直是计算机视觉，模式识别领域中的热点问题，它在视频监控，人机交互，车辆导航等方面都有广泛的应用。目前，目标跟踪面临着很多挑战，例如，光照变化，姿态变化，遮挡干扰等等。当前跟踪算法可以从目标外观表达机制分为两大类：基于生成模型的目标跟踪算法和基于判别模型的目标跟踪算法。其中，生成模型是指构建一个自适应模型，即学习一个具有代表性的外观模型，通过此模型按照某种相似性度量去搜索图像区域，并最小化重构误差。然而，由于生成模型仅仅利用了目标外观信息，因此在背景复杂等情况下容易出现目标框漂移，甚至跟踪失败的情况。判别模型的重点在于设计一种鲁棒的分类器，用以区分前景和背景，分类器的好坏直接决定了算法跟踪性能的优劣。与生成模型相比，基于判别模型的算法由于在训练分类器的过程中添加了来自背景的负样本，因此为目标跟踪提供了更高的鲁棒性，并且分类器的在线训练过程也可以很好的解决目标外观的变化问题。
[0003] 近些年来，越来越多的机器学习方法被应用于分类器设计中，Zhang等人利用随机投影实现一种基于压缩感知的跟踪算法，将原始图像从高维空间映射到低位空间，并完成分类。在目标识别领域中，Ozuysal等人提出一种简单有效的方法对图像进行描述，即随机蕨（Random fern)，通过利用随机选择的像素点对的灰度值比较，将一个图像片离散表示为一个二值编码，每个二值编码对应一个后验概率，因此可以利用贝叶斯定理完成对样本的分类。Kalal等人成功将随机蕨作为分类器应用在目标跟踪之中。然而，随机蕨也存在着一些缺陷：首先，每个像素对的灰度值比较仅仅有两个输出，〇或者1，因此不能充分地表达目标信息。其次，该方法对内存需求较大，与每棵蕨上的像素点对数呈指数倍关系，因此对于嵌入式系统移植或一些要求高帧率的应用场合是不利的。有关基于随机蕨的目标跟踪的改进算法及技术，在公开号为CN102982340A的申请文件中已有披露，但该方法并没有解决随机蕨的自身缺陷，而且在跟踪的过程中结合了光流法，对内存的消耗更大。
[0004] 针对以上问题，本发明采用判别模型作为算法设计架构，提出一种基于随机蕨和随机投影的目标跟踪算法，该算法不仅能够实时、鲁棒地对目标进行跟踪，而且内存需求低，十分适合应用在嵌入式系统。

【发明内容】

[0005] 1.目的：本发明的目的是提供一种基于随机投影蕨的实时目标跟踪算法，通过选取包含目标更多信息的特征，并引入随机投影矩阵，提高了跟踪效果的实时性和鲁棒性，同时减少算法的内存需求，易于嵌入式系统移植。
[0006] 2.技术方案：本发明提供一种基于随机投影蕨的实时目标跟踪算法，该算法包括如下步骤：
[0007] 步骤1、算法初始化模块：在视频序列第一帧中人工标记或自动识别出待跟踪目标，并将图像转换为灰度图像，根据初始目标宽和高的尺寸信息，生成遍历整幅图像的η种尺度的矩形扫描窗口，并计算当前帧所有扫描窗口与目标框的重叠率，取重叠率大于设定阈值的窗口图像作为正样本，在重叠率小于设定阈值的窗口图像中随机选择若干个作为负样本；
[0008] 步骤2、随机投影蕨训练模块：对当前帧得到的正负样本，提取图像特征，利用高斯投影矩阵将特征值转换至投影空间，完成对分类器的训练；
[0009] 步骤3、随机投影蕨分类模块：读入视频序列下一帧，并将图像转换为灰度图像，利用步骤二训练得到的分类器，对当前帧待检测扫描窗口是正样本的后验概率和负样本的后验概率分别进行计算，利用判别函数求得当前帧目标所在位置；
[0010] 步骤4、训练集更新模块：利用步骤三得到的跟踪结果，在当前帧提取正负样本，完成训练集的更新。
[0011] 其中，步骤1所述算法初始化模块的具体过程为：在视频序列第一帧中人工标记或自动识别出待跟踪目标，并将图像转换为灰度图像，根据初始目标宽和高的尺寸信息，按照一定的尺度缩放比，水平步长，垂直步长，以及限定扫描窗口的最小尺寸，遍历整幅图像生成η种尺度下的矩形扫描窗口，计算当前帧所有扫描窗口与目标框的重叠率，取重叠率大于设定阈值的窗口图像作为正样本，在重叠率小于设定阈值的窗口图像中随机选择若干个作为负样本；
[0012] 其中，步骤2所述随机投影蕨训练模块的具体过程为：首先建立随机投影蕨，蕨的个数为Μ，每棵蕨包含的像素点对数为S ;利用当前帧得到的正负样本，选取像素点对的灰度差值4 j作为特征：
[0013] fi_ j= I (d 1 (i, j))-I (d2(i, j)) (I)
[0014] 其中，I表示当前帧待处理的窗口图像，Cl1(Lj)和d2(i，j)表示第i棵蕨中第j 个像素对的像素点坐标；
[0015] 利用高斯投影矩阵将所有特征值转换至投影空间，每棵蕨得到一个对应的实数值 F1:
[0016]
(2)
[0017] 其中，〇^是一个随机生成的符合高斯分布的实数值；
[0018] 利用高斯分布模型分别对正样本，负样本的后验概率进行建模，每棵蕨的参数 (///，<)可根据下式进行更新：
[0021] 其中，步骤3所述随机投影蕨分类模块的具体过程为：读入视频序列下一帧，并将图像转换为灰度图像；以上一帧跟踪目标框的中心为圆心，以y = aXmax (height, width) 为搜索半径，其中，width，height表示上一帧跟踪目标框的宽和高，a为调整搜索半径的系数，γ的取值可根据上一帧目标框的尺寸进行自适应调整；在当前帧，采用步骤二所述方式求得圆状搜索区域内所有窗口图像的蕨类特征值fu，并通过高斯投影矩阵求得每棵蕨对应的实数值F 1，然后利用F1对当前帧窗口图片是正样本的后验概率和负样本的后验概率分别进行计算，窗口图像所属类别的判别函数为：
[0022]
(4)
[0023] 其中，ye {〇，1}表示正负样本标签，F ={&，&，...&}表示对于当前帧任一窗口图像的各个蕨的计算结果总集；
[0024] 通过求解H(F)最大值所在位置，即为当前帧的跟踪结果；
[0025] 其中，步骤4所述训练集更新模块的具体过程为：利用步骤三求得当前帧的目标位置，计算当前帧所有扫描窗口与目标框的重叠率，取重叠率大于设定阈值的窗口图像作为正样本，在重叠率小于设定阈值的窗口图像中随机选择若干个作为负样本；转至步骤二，利用这些正负样本对分类器在线训练；
[0026] 至此，当前帧图像中目标的位置，尺度参数已经全部得到，接下来要继续对后续帧中的目标进行跟踪，直到跟踪结束。
[0027] 3.本发明与现有技术相比的优点在于：
[0028] (1)相比较于传统随机蕨分类器采用的二值特征，本发明采用了一种取值范围为整个实数域的特征，该特征可以更具体地表达每个像素对的具体灰度值差异，因此对目标的表达更充分；
[0029] (2)引入随机投影矩阵，降低了内存需求，易于嵌入式系统移植；
[0030] (3)跟踪步骤简单，易于实现，实时性高。
[0031] (4)本发明方法不仅可以得到每帧图像中运动目标的位置，而且可以得到运动目标的尺度信息，即可以为具有PTZ功能的摄像机和基于目标跟踪的视觉导引提供控制参数，从而提高整个跟踪系统运行的稳定性。
【附图说明】
[0032] 图1为本发明所述的基于随机投影蕨的实时目标跟踪算法的流程图。
【具体实施方式】
[0033] 下面结合附图进一步说明本发明。应指出，此处所描述的【具体实施方式】仅是用于解释本发明，使本发明的目的、技术方案及优点更清晰具体，并不用于限定本发明的保护范围，凡其他围绕本发明的原理而进行的任何改进和完善，应当视为本发明的保护范围。
[0034] 参照附图1，本发明提供的一种基于随机投影蕨的实时目标跟踪算法，主要包括以下步骤：
[0035] 步骤1、算法初始化模块：在视频序列第一帧中人工标记或自动识别出待跟踪目标，并将图像转换为灰度图像，根据初始目标宽和高的尺寸信息，生成遍历整幅图像的η种尺度的矩形扫描窗口，并计算当前帧所有扫描窗口与目标框的重叠率，取重叠率大于设定阈值的窗口图像作为正样本，在重叠率

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王睿;董浩;
技术所有人：北京航空航天大学;
我是此专利的发明人

上一篇：一种基于投影图像的ct扫描实时运动监测方法
上一篇：自动图像抠图方法和装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。