小于设定阈值的窗口图像中随机选择若干个作为负 样本;
[0036] 步骤2、随机投影蕨训练模块:对当前帧得到的正负样本,提取图像特征,利用高 斯投影矩阵将特征值转换至投影空间,完成对分类器的训练;
[0037] 步骤3、随机投影蕨分类模块:读入视频序列下一帧,并将图像转换为灰度图像, 利用步骤二训练得到的分类器,对当前帧待检测扫描窗口是正样本的后验概率和负样本的 后验概率分别进行计算,利用判别函数求得当前帧目标所在位置;
[0038] 步骤4、训练集更新模块:利用步骤三得到的跟踪结果,在当前帧提取正负样本, 完成训练集的更新。
[0039] 上述各个步骤的具体实现过程如下:
[0040] 1.算法初始化模块
[0041] 读入一段视频序列,在第一帧中人工标记或自动识别出待跟踪的目标,并将图像 转换为灰度图像;根据初始目标框的尺寸信息,一般按照如下参数生成各种尺度下的矩形 扫描窗口:尺度缩放比取值范围为1.2~1.8,水平步长取图像帧宽度的10%~15%,垂 直步长取图像帧高度的10%~15%,最小尺寸限定为15~25个像素,生成遍历整幅图 像的10~20种尺度的扫描窗口;计算当前帧所有扫描窗口与目标框的重叠率,取重叠 率大于设定阈值(overlapX). 6~0.8)的窗口图像作为正样本,在重叠率小于设定阈值 (overlap〈0. 2~0. 4)的窗口图像中随机选择50~100个作为负样本。
[0042] 2.随机投影蕨训练模块
[0043] 首先建立随机投影蕨,蕨的个数通常取值为M < 50,每棵蕨包含的像素点对数为 S < 6 ;利用当前帧得到的正负样本,选取像素点对的灰度差值& ,作为特征:
[0044] ^j j= Kd^i, j))-I(d2(i, j)) (I)
[0045] 其中,I表示当前帧待处理的窗口图像,Cl1(Lj)和d2(i,j)表示第i棵蕨中第j 个像素对的像素点坐标;
[0046] 利用高斯投影矩阵将所有特征值转换至投影空间,每棵蕨得到一个对应的实数值 F1:
[0047]
[0048] 其中,O j是一个随机生成的符合标准高斯分布的实数值;
[0049] 利用高斯分布模型分别对正样本,负样本的后验概率进行建模,每棵蕨的参数 可根据下式进行更新:
[0050]
[0051] 其中,λ取值一般为〇· 6~0· 9,
[0052] 3.随机投影蕨分类模块
[0053] 读入视频序列下一帧,并将图像转换为灰度图像;以上一帧跟踪目标框的中心为 圆心,以γ =aXmax(height,width)为搜索半径,其中,width,height表示上一帧目标框 的宽和高,a取值一般为3~5, γ的取值可根据上一帧目标框的尺寸进行自适应调整;在 当前帧,采用步骤二所述方式求得圆状搜索区域内所有窗口图像的蕨类特征值fu,并通过 高斯投影矩阵求得每棵蕨对应的实数值F 1,然后利用F1对当前帧窗口图片是正样本的后验 概率和负样本的后验概率分别进行计算,窗口图像所属类别的判别函数为:
[0054]
[0055] 其中,ye {〇,1}表示正负样本标签,F= ^F2,... FN}表示对于当前帧任一窗口 图像的各个蕨的计算结果总集;
[0056] 通过求解H(F)最大值所在位置,即为当前帧的跟踪结果。
[0057] 4.训练集更新模块
[0058] 利用步骤三求得当前帧的目标位置,计算当前帧所有扫描窗口与目标框的重叠 率,取重叠率大于设定阈值(overlapX). 6~0. 8)的窗口图像作为正样本,在重叠率小于设 定阈值(〇verlap〈0. 2~0. 4)的窗口图像中随机选择50~100个作为负样本;转至步骤 二,利用这些正负样本对分类器在线训练;
[0059] 至此,当前帧图像中目标的位置,尺度参数已经全部得到,接下来要继续对后续帧 中的目标进行跟踪,直到跟踪结束。
【主权项】
1. 一种基于随机投影藤的实时目标跟踪算法,其特征在于,该方法包括如下步骤: 步骤1、算法初始化模块:在视频序列第一帖中人工标记或自动识别出待跟踪目标,并 将图像转换为灰度图像,根据初始目标宽和高的尺寸信息,生成遍历整幅图像的n种尺度 的矩形扫描窗口,并计算当前帖所有扫描窗口与目标框的重叠率,取重叠率大于设定阔值 的窗口图像作为正样本,在重叠率小于设定阔值的窗口图像中随机选择若干个作为负样 本; 步骤2、随机投影藤训练模块:对当前帖得到的正负样本,提取图像特征,利用高斯投 影矩阵将特征值转换至投影空间,完成对分类器的训练; 步骤3、随机投影藤分类模块:读入视频序列下一帖,并将图像转换为灰度图像,利用 步骤二训练得到的分类器,对当前帖待检测扫描窗口是正样本的后验概率和负样本的后验 概率分别进行计算,利用判别函数求得当前帖目标所在位置; 步骤4、训练集更新模块:利用步骤=得到的跟踪结果,在当前帖提取正负样本,完成 训练集的更新。2. 根据权利要求1所述的基于随机投影藤的实时目标跟踪算法,其特征在于,步骤1所 述生成遍历整幅图像的n种尺度的矩形扫描窗口的具体过程为:根据初始目标宽和高的尺 寸信息,按照一定的尺度缩放比,水平步长,垂直步长,W及限定扫描窗口的最小尺寸,遍历 整幅图像生成n种尺度下的扫描窗口。3. 根据权利要求1所述的基于随机投影藤的实时目标跟踪算法,其特征在于,步骤1所 述的扫描窗口与目标框的重叠率为:扫描窗口与目标框交集的面积除W扫描窗口与目标框 并集的面积。4. 根据权利要求1所述的基于随机投影藤的实时目标跟踪算法,其特征在于,步骤2所 述的随机投影藤训练模块的具体过程为:首先建立随机投影藤,藤的个数为M,每棵藤包含 的像素点对数为S;利用当前帖得到的正负样本,选取像素点对的灰度差值fV,作为特征: fi'i=I(di(iJ))-I(d2(i,j)) (1) 其中,I表示当前帖待处理的窗口图像,di(ij)和d2(ij)表示第i棵藤中第j个像 素对的像素点坐标; 利用高斯投影矩阵将所有特征值转换至投影空间,每棵藤得到一个对应的实数值Fi:鮮 其中,W,是一个随机生成的符合高斯分布的实数值; 利用高斯分布模型分别对正样本,负样本的后验概率进行建模,每棵藤的参数(片, 可根据下式进行更新:5. 根据权利要求1所述的基于随机投影藤的实时目标跟踪算法,其特征在于,步骤3 所述的随机投影藤分类模块的具体过程为上一帖跟踪目标框的中屯、为圆屯、,W丫 = aXmaxOiei曲t,wi化h)为捜索半径,其中,wi化h,hei曲t表示上一帖跟踪目标框的宽和 高,a为调整捜索半径的系数,丫的取值可根据上一帖目标框的尺寸进行自适应调整;在当 前帖,采用步骤二所述方式求得圆状捜索区域内所有窗口图像的藤类特征值fV,,并通过高 斯投影矩阵求得每棵藤对应的实数值Fi,然后利用Fi对当前帖窗口图片是正样本的后验概 率和负样本的后验概率分别进行计算,窗口图像所属类别的判别函数为:(4) 其中,yG{〇, 1}表示正负样本标签,F=伊1,Fz, . . . 表示对于当前帖任一窗口图像 的各个藤的计算结果总集; 通过求解H(巧最大值所在位置,即为当前帖的跟踪结果。6. 根据权利要求1所述的基于随机投影藤的实时目标跟踪算法,其特征在于,步骤4所 述的训练集更新模块的具体过程为:利用步骤=求得当前帖的目标位置,计算当前帖所有 扫描窗口与目标框的重叠率,取重叠率大于设定阔值的窗口图像作为正样本,在重叠率小 于设定阔值的窗口图像中随机选择若干个作为负样本;转至步骤二,利用运些正负样本对 分类器在线训练; 至此,当前帖图像中目标的位置,尺度参数已经全部得到,接下来要继续对后续帖中的 目标进行跟踪,直到跟踪结束。
【专利摘要】本发明公开了一种基于随机投影蕨的实时目标跟踪算法,涉及机器视觉与模式识别技术。它有四大步骤:步骤一:算法初始化模块;步骤二:随机投影蕨训练模块;步骤三:随机投影蕨分类模块;步骤四:训练集更新模块;本发明在随机蕨的基础上引入随机投影,具有计算速度快,内存需求少,跟踪准确,易于嵌入式系统移植等优点,可广泛应用于视觉导航,人机交互,监控系统等诸多领域。
【IPC分类】G06T7/20, G06K9/62
【公开号】CN105006003
【申请号】CN201510401866
【发明人】王睿, 董浩
【申请人】北京航空航天大学
【公开日】2015年10月28日
【申请日】2015年7月9日