一种基于随机蕨分类器的半自主在线学习方法

文档序号:6552291阅读:242来源:国知局
一种基于随机蕨分类器的半自主在线学习方法
【专利摘要】本发明提供基于随机蕨分类器的半自主在线学习方法,包括以下步骤:1)准备初始训练分类器的样本集;2)随机蕨分类器初始训练;3)获得在线学习样本;4)随机蕨分类器的在线训练。本发明提出了随机蕨分类器的在线学习算法使目标检测系统能够逐步提高其性能,最终达到检测精度要求;此外,通过人工判断获取在线学习样本的方法保证了在线学习样本类别标注的正确性;相对于传统的分类器训练方法,本发明不需要事先准备大量的正负训练样本,减轻了人工标注的工作量,并可验证随机蕨分类器的分类性能。
【专利说明】-种基于随机蕨分类器的半自主在线学习方法 【技术领域】
[〇〇〇1] 本发明属于模式识别方法,具体涉及一种通过在线学习算法训练分类器,以提高 分类器性能的方法。 【背景技术】
[0002] 在线学习属于增量学习的研究范畴,在这一类方法中分类器对每个样本只学一 次,而不是重复的学习,这样在线学习算法运行过程中不需要大量的存储空间来存储训练 样本,分类器每获得一个样本,即对其进行在线学习,通过在线学习使分类器在使用过程中 仍然能根据新样本自我更新和改进,进一步提高分类效果。
[0003] 早期的在线学习算法有Winnow算法,统一线性预测算法等,2001年学者Oza将 这些算法与boosting算法进行结合,提出了在线boosting算法(该算法引自"Online bagging and boosting^N. Oza and S. Russell, In Proc. Artificial Intelligence and Statistics,105-112, 2001),在Oza的方法中,强分类器是一定数量的弱分类器的加权和, 这些弱分类器都是从弱分类器集合中挑选出来的。在线学习时,每个训练样本逐一的更新 弱分类器集合中的每个弱分类器,包括调整正负样本的分类阈值以及该分类器的权重,使 好的弱分类器权重越来越高,而较差的弱分类器权重越来越低,从而每次在线学习一个样 本就可以挑选出一个当前权重最高的弱分类器加入强分类器中使最终训练出来的分类器 有较强的分类能力。但是,在线boosting算法的弱分类器集合中每个弱分类器都要对新 样本进行在线学习,当弱分类器个数较多时,在线学习速度必然会变慢。Grabner对在线 boosting算法进行了改进,使其也象Adaboost算法一样可以进行特征选择,并且这种特 征选择以及对分类器的更新都是在线进行的,称为在线Adaboost (该算法引自"On-line boosting and vision"Η· Grabner and Η· Bischof, In Proc. CVPR, (1) :260-267, 2006)。但 是在线Adaboost用特征选择算子代替一般的弱分类器合成强分类器,特征选择算子数以 及特征选择算子对应的弱分类器数都是固定的,相应的在线学习分类器结构比较僵化。当 发现其分类能力无法满足检测性能的要求时,即使持续的在线学习下去也无法提高检测精 度。
【发明内容】

[0004] 本发明要解决的技术问题是:提供一种基于随机蕨分类器的半自主在线学习方 法,能够提高分类性能。
[0005] 本发明为解决上述技术问题所采取的技术方案为:一种基于随机蕨分类器的半自 主在线学习方法,其特征在于:它包括以下步骤:
[0006] 1)准备初始训练分类器的样本集:
[0007] 针对待检测目标类,在视频图像的第一帧中框选出一个目标,对该目标图片进行 仿射变换得到的图片作为正样本;以不含有目标的背景图像区域作为负样本;如此随机的 获取一定数量的正样本和负样本作为初始训练分类器的样本集;
[0008] 2)随机蕨分类器初始训练:
[0009] 使用准备好的初始训练分类器的样本集对随机蕨分类器进行初始训练,初始训练 好的随机蕨分类器即为当前目标检测器,遍历待检测的视频图像进行目标检测;
[〇〇1〇] 3)获得在线学习样本:
[0011] 对于步骤2)中得到的检测后的视频图像,采用人工判断其检测结果的正确性,对 于正确的检测结果人工标注为正样本,否则为负样本,对漏检的视频图像标注为正样本;判 断后的正负样本为在线学习样本;
[0012] 4)随机蕨分类器的在线训练:
[0013] 使用步骤3)获得的正负样本对随机蕨分类器进行在线学习,逐渐提高其分类精 度。
[0014] 按上述方法,步骤2)的具体方法如下:
[0015] 2.1)构造随机蕨:
[〇〇16] 对样本集中的单个样本上随机取s对特征点作为一组随机蕨,每个样本取特征点 的位置相同,每对特征点进行像素值的比较,每对特征点中前一个特征点像素值大则取特 征值为1,反之则取特征值为〇, S对特征点比较后得到的S个特征值按照随机的顺序构成 一个S位的二进制数,即为该组随机蕨的随机蕨数值,每个样本的随机蕨中特征值的顺序 一致;
[0017] 2. 2)计算随机蕨数值在正负样本类上的后验概率:
[0018] 随机蕨中,有一部分为正样本得到的,其它为负样本得到的;随机蕨数值的取值种 类有2S个;
[0019] 统计每种随机蕨数值的取值的正样本个数,从而获得随机蕨数值在正样本类q上 的后验概率分布PFilCi);同理获得随机蕨数值在负样本类Q上的后验概率分布PFilQ); 联合所有随机蕨对初始训练分类器的样本集进行分类,即为随机蕨分类器;
[0020] 2. 3)采用随机蕨分类器在每帧视频图像中进行目标检测:
[0021] 遍历待检测的每帧视频图像,在每帧视频图像中提取相同大小的图像块作为待测 样本,待测样本的大小与步骤1)中正样本的大小相等,计算每个待测样本的随机蕨数值, 从而得到相应的后验概率,最后由随机蕨分类器计算其类别;
[0022] 对于类别为正样本的图像块,则作为目标被检测出来。
[0023] 按上述方法,步骤4)随机蕨分类器的在线学习通过更新后验概率分布实现。
[0024] 按上述方法,步骤4)的具体方法如下:
[0025] 4. 1)将步骤3)获得的正负样本作为在线学习样本;设一个在线学习样本为(fnew, ck),其中为随机蕨s位的二进制数,ck为样本类别,计算该在线学习样本的随机蕨数 值;
[0026] 4. 2)对步骤2. 1)样本集中类别为ck的样本总数加1,类别为ck的与该在线学习 样本的随机蕨数值相同的样本数加1;其它随机蕨数值的样本数不变;
[0027] 4. 3)根据更新后的样本数,重新计算随机蕨数值在该样本类上的后验概率分布;
[0028] 4. 4)每新增一个在线学习样本,便重复4. 1)至4. 3)对后验概率分布进行更新一 次。
[0029] -种利用上述基于随机蕨分类器的半自主在线学习方法实现的目标检测方法,其 特征在于:当基于随机蕨分类器的半自主在线学习方法的步骤3)人工判断其结果为全部 正确时,采用随机蕨分类器对目标进行检测。
[0030] 本发明的有益效果为:本发明提出了随机蕨分类器的在线学习算法使目标检测系 统能够逐步提高其性能,最终达到检测精度要求;此外,通过人工判断获取在线学习样本的 方法保证了在线学习样本类别标注的正确性;相对于传统的分类器训练方法,本发明不需 要事先准备大量的正负训练样本,减轻了人工标注的工作量,并可验证随机蕨分类器的分 类性能。 【专利附图】

【附图说明】
[0031] 图1为本发明一实施例的流程框图。
[0032] 图2为分层描述的随机蕨分类器在线训练结构图。
[0033] 图3为两组实验数据的效果图,图3(a)为初始训练分类器对目标检测的效果图, 图3(b)为训练了一定时间后的随机蕨分类器对目标检测的效果图。
[0034] 图4为不同背景下对目标检测的效果图。
[0035] 图5为不同类型目标下对目标检测的效果图。 【具体实施方式】
[0036] 下面结合具体实例和附图对本发明做进一步说明。
[0037] 图1为本发明一实施例的流程框图,包括以下步骤:
[0038] 1)准备初始训练分类器的样本集:
[0039] 针对待检测目标类,在视频图像的第一帧中框选出一个目标,对该目标图片进行 仿射变换得到的图片作为正样本;以不含有目标的背景图像区域作为负样本;如此随机的 获取一定数量的正样本和负样本作为初始训练分类器的样本集。
[0040] 所述的样本集中的样本在本实施例中就是相同大小的图像块,一般尺寸为 15 X 15 (像素),若图像块中含有待检测的目标则该样本为正样本,没有则为负样本。
[0041] 2)随机蕨分类器初始训练:
[0042] 使用准备好的初始训练分类器的样本集对随机蕨分类器进行初始训练,初始训练 好的随机蕨分类器即为当前目标检测器,遍历待检测的视频图像进行目标检测。
[0043] 具体方法如下:
[0044] 2· 1)构造随机蕨:
[0045] 对样本集中的单个样本上随机取s对特征点作为一组随机蕨(本实施例选5对), 每个样本取特征点的位置相同,每对特征点进行像素值的比较,每对特征点中前一个特征 点像素值大则取特征值为1,反之则取特征值为〇, S对特征点比较后得到的S个特征值按 照随机的顺序构成一个S位的二进制数,即为该组随机蕨的随机蕨数值,每个样本的随机 蕨中特征值的顺序一致;
[0046] 2. 2)计算随机蕨数值在正负样本类上的后验概率:
[〇〇47] 随机蕨中,有一部分为正样本得到的,其它为负样本得到的;每个样本的随机蕨匕 包含的特征可联合在一起形成一个十进制数,由于该十进制数通过S位二进制码获得,因 此随机蕨数值的取值种类有2s个,即有2s种可能(本实施例中为25种可能);
[0048] 统计每种随机蕨数值的取值的正样本个数,从而获得随机蕨数值在正样本类上 的后验概率分布PFilCi);同理获得随机蕨数值在负样本类Q上的后验概率分布PFilQ); 联合所有随机蕨对初始训练分类器的样本集进行分类,即为随机蕨分类器;
[0049] 2. 3)采用随机蕨分类器在每帧视频图像中进行目标检测:
[0050] 遍历待检测的每帧视频图像,在每帧视频图像中提取相同大小的图像块作为待测 样本,待测样本的大小与步骤1)中正样本的大小相等,计算每个待测样本的随机蕨数值, 从而得到相应的后验概率,最后由随机蕨分类器计算其类别;
[0051] 对于类别为正样本的图像块,则作为目标被检测出来。
[0052] 3)获得在线学习样本:
[0053] 对于步骤2)中得到的检测后的视频图像,采用人工判断其检测结果的正确性,对 于正确的检测结果人工标注为正样本(本实施例中用鼠标点击进行标注),否则为负样本, 对漏检的视频图像标注为正样本;判断后的正负样本为在线学习样本;
[0054] 4)随机蕨分类器的在线训练:
[0055] 使用步骤3)获得的正负样本,通过更新后验概率分布实现对随机蕨分类器进行 在线学习,逐渐提高其分类精度。
[0056] 具体方法如下:
[0057] 4. 1)将步骤3)获得的正负样本作为在线学习样本;设一个在线学习样本为(fnew, ck),其中fMW为随机蕨s位的二进制数(本实施例中fnOT为00101,即十进制数5),c k为样 本类别,计算该在线学习样本的随机蕨数值;
[0058] 4. 2)如图2所示,对步骤2. 1)样本集中类别为ck的样本总数加1,类别为ck的与 该在线学习样本的随机蕨数值相同的样本数加1 ;其它随机蕨数值的样本数不变(本实施 例中,类别为ck的样本总数Μ加1,随机蕨匕的数值为5的样本数N加1,其它数值的样本 数N。^不变);
[0059] 4. 3)根据更新后的样本数,重新计算随机蕨数值在该样本类上的后验概率分布 (本实施例中,随机蕨匕的数值为5的后验概率变为
【权利要求】
1. 一种基于随机蕨分类器的半自主在线学习方法,其特征在于:它包括以下步骤: 1) 准备初始训练分类器的样本集: 针对待检测目标类,在视频图像的第一帧中框选出一个目标,对该目标图片进行仿射 变换得到的图片作为正样本;以不含有目标的背景图像区域作为负样本;如此随机的获取 一定数量的正样本和负样本作为初始训练分类器的样本集; 2) 随机蕨分类器初始训练: 使用准备好的初始训练分类器的样本集对随机蕨分类器进行初始训练,初始训练好的 随机蕨分类器即为当前目标检测器,遍历待检测的视频图像进行目标检测; 3) 获得在线学习样本: 对于步骤2)中得到的检测后的视频图像,采用人工判断其检测结果的正确性,对于正 确的检测结果人工标注为正样本,否则为负样本,对漏检的视频图像标注为正样本;判断后 的正负样本为在线学习样本; 4) 随机蕨分类器的在线训练: 使用步骤3)获得的正负样本对随机蕨分类器进行在线学习,逐渐提高其分类精度。
2. 根据权利要求1所述的基于随机蕨分类器的半自主在线学习方法,其特征在于:步 骤2)的具体方法如下: 2. 1)构造随机蕨: 对样本集中的单个样本上随机取s对特征点作为一组随机蕨,每个样本取特征点的位 置相同,每对特征点进行像素值的比较,每对特征点中前一个特征点像素值大则取特征值 为1,反之则取特征值为0, s对特征点比较后得到的s个特征值按照随机的顺序构成一个s 位的二进制数,即为该组随机蕨的随机蕨数值,每个样本的随机蕨中特征值的顺序一致; 2. 2)计算随机蕨数值在正负样本类上的后验概率: 随机蕨中,有一部分为正样本得到的,其它为负样本得到的;随机蕨数值的取值种类有 2s个; 统计每种随机蕨数值的取值的正样本个数,从而获得随机蕨数值在正样本类q上的后 验概率分布PFilCi);同理获得随机蕨数值在负样本类Q上的后验概率分布PFilQ);联合 所有随机蕨对初始训练分类器的样本集进行分类,即为随机蕨分类器; 2. 3)采用随机蕨分类器在每帧视频图像中进行目标检测: 遍历待检测的每帧视频图像,在每帧视频图像中提取相同大小的图像块作为待测样 本,待测样本的大小与步骤1)中正样本的大小相等,计算每个待测样本的随机蕨数值,从 而得到相应的后验概率,最后由随机蕨分类器计算其类别; 对于类别为正样本的图像块,则作为目标被检测出来。
3. 根据权利要求2所述的基于随机蕨分类器的半自主在线学习方法,其特征在于:步 骤4)随机蕨分类器的在线学习通过更新后验概率分布实现。
4. 根据权利要求3所述的基于随机蕨分类器的半自主在线学习方法,其特征在于:步 骤4)的具体方法如下: 4. 1)将步骤3)获得的正负样本作为在线学习样本;设一个在线学习样本为(fnew,ck), 其中f_为随机蕨s位的二进制数,ck为样本类别,计算该在线学习样本的随机蕨数值; 4. 2)对步骤2. 1)样本集中类别为ck的样本总数加1,类别为ck的与该在线学习样本 的随机蕨数值相同的样本数加1 ;其它随机蕨数值的样本数不变; 4. 3)根据更新后的样本数,重新计算随机蕨数值在该样本类上的后验概率分布; 4.4)每新增一个在线学习样本,便重复4. 1)至4. 3)对后验概率分布进行更新一次。
5. -种利用权利要求1至4中任意一项所述的基于随机蕨分类器的半自主在线学习方 法实现的目标检测方法,其特征在于:当基于随机蕨分类器的半自主在线学习方法的步骤 3)人工判断其结果为全部正确时,采用随机蕨分类器对目标进行检测。
【文档编号】G06K9/62GK104063713SQ201410317479
【公开日】2014年9月24日 申请日期:2014年7月4日 优先权日:2014年7月4日
【发明者】罗大鹏, 韩家宝, 魏龙生, 王勇, 马丽 申请人:中国地质大学(武汉)
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1