一种基于样例迁移学习的人体检测方法
【专利摘要】本发明公开了一种基于样例迁移学习的人体检测方法,该方法包括以下步骤:提取训练集中正样本和负样本的多维人体特征;利用支持向量机进行训练,得到初始人体检测器;将人体检测器划分为多个小网格,每个网格代表一个小部件,并用相应网格里的权重来表示这个部件;对于网格权重进行更新;采用多尺度滑动框扫描的方式对于待检测图像进行人体检测,得到人体检测结果。本发明中的检测器能够自适应的进行结构调整与测试框里的样例的结构进行匹配,并将匹配的损失计入得分函数中,因此本发明方法能够自适应地对每个样例进行结构迁移,可以处理人体的形变等情况。
【专利说明】一种基于样例迁移学习的人体检测方法【技术领域】
[0001]本发明属于智能视频监控【技术领域】,具体涉及一种基于样例迁移学习的人体检测方法。
【背景技术】
[0002]人体检测是视频监控中高层语义理解的基础,这种技术的进步可以极大地促进视频监控技术的发展。尽管特定场景下的行人检测技术已经得到了很好的发展,但是广义场景下的人体检测技术还存在许多的挑战,这主要是由于人体外观的变化和人体姿态的变化。为了解决人体外观的变化,很多研究者提出了对于背景、光照、衣服颜色等鲁棒的特征。Dalal等人提出一种梯度直方图的特征,该特征对于光照具有很强的鲁棒性。Tuzel等人利用幅值、梯度、空间位置信息来进一步提高梯度直方图特征的性能。Mu等人提出一种局部二元特征的扩展方法来克服梯度直方图特征的一些缺陷。Schwartz等人利用纹理和颜色信息来增加梯度直方图特征的判别性能。对于人体姿态的变化,许多研究者提出将一个整体的人体划分成几个局部的子部件,然后基于这些局部的子部件之间的空间关系进行建模。Felzenszwalb等人提出一种目标检测的框架:图形结构,该方法将一个目标表示成一个局部子部件的空间关系集合。他进一步发展了这种方法,提出一种判别式学习的方法,通过判别式学习得到的模型能够区分人体和背景。Yang等人进一步发展了这种方法,将以前的子部件分解成更加细小的部件。由于这些细小的部件忽略了方向信息,因此这种表示方法能够大大减少搜索的空间,而且他们对这些细小子部件之间的共生关系进行了建模。Andriluka等人利用运动学上的先验对各部分之间的关系进行了建模,而且通过判别式学习的方法得到了各子部件的外观信息。
【发明内容】
[0003]本发明的目的是为了解决复杂场景下的人体检测问题,为此,本发明提供一种基于样例迁移学习的人体检测方法。
[0004]为了实现所述目的,本发明提出一种基于样例迁移学习的人体检测方法,该方法包括以下步骤:
[0005]步骤SI,对于训练集中的每个正样本进行归一化,并在得到的归一化图像上分别提取梯度直方图特征;对于所述训练集中的负样本,随机从不包含人体的图片上选取与所述归一化图像相同大小的图像,并提取其梯度直方图特征,从而分别得到所述正样本和负样本的多维的人体特征;
[0006]步骤S2,基于所述步骤SI得到的所述正样本和负样本的人体特征,利用支持向量机对所述训练集中的正样本和负样本图片进行训练,得到一个初始的人体检测器;
[0007]步骤S3,将所述步骤S2得到的初始的人体检测器划分为V个小的网格,每一个网格代表一个小的部件,并用相应网格里的权重来表不这个部件;同时基于所述网格建立一个图G=(v,ε),其中,V表示图G中的节点,ε表示图G中的边;根据所述步骤SI提取得、到的人体特征,分别建立图(V =( V / , ε / )来表示对应的正样本和负样本;
[0008]步骤S4,对于所述步骤S3中的网格权重进行更新,得到更新后的人体检测器;
[0009]步骤S5,基于所述更新后的人体检测器,采用多尺度滑动框扫描的方式对于待检测图像进行人体检测,得到人体检测结果。
[0010]本发明方法对于输入图像提取梯度直方图特征,通过多尺度滑动框扫描进行检测,同时本发明中的检测器能够自适应的进行结构调整与测试框里的样例的结构进行匹配,并将匹配的损失计入得分函数中。总之,本发明方法能够自适应地对每个样例进行结构迁移,因此可以处理人体的形变等情况。
【专利附图】
【附图说明】
[0011]图1是本发明提出的基于样例迁移学习的人体检测方法流程图;
[0012]图2是本发明方法在INRIA数据库上学习得到的权重可视化示意图;
[0013]图3是本发明方法与其他方法在INRIA数据库上的检测结果对比示意图。
【具体实施方式】
[0014]为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
[0015]图1是本发明提出的基于样例迁移学习的人体检测方法流程图,如图1所示,所述基于样例迁移学习的人体检测方法包含以下步骤:
[0016]步骤SI,对于训练集中的每个正样本进行归一化,并在得到的归一化图像上分别提取梯度直方图特征;对于所述训练集中的负样本,随机从不包含人体的图片上选取与所述归一化图像相同大小的图像,并提取其梯度直方图特征,从而分别得到所述正样本和负样本的多维的人体特征;
[0017]在本发明一实施例中,可将所有正样本归一化成128*64的图像,再将归一化后的图像划分为32*16个4*4的图像块,对于每个图像块分别提取36维的梯度直方图特征,从而得到与该正样本对应的32*16*36维的人体特征;如此,对于负样本选取得到的图像大小也是128*64,按照类似的步骤,最终得到与该负样本对应的32*16*36维的人体特征。
[0018]步骤S2,基于所述步骤SI得到的所述正样本和负样本的人体特征,利用支持向量机对所述训练集中的正样本和负样本图片进行训练,得到一个初始的人体检测器;
[0019]支持向量机是现有技术中常用的一种分类器,在此不做赘述。
[0020]步骤S3,将所述步骤S2得到的初始的人体检测器划分为V个小的网格,每一个网格代表一个小的部件,并用相应网格里的权重来表不这个部件;同时基于所述网格建立一个图G=(v,ε),其中,V表示图G中的节点,ε表示图G中的边,其代表节点与节点之间的连接情况,图中的每个节点表示一个部件,每个节点和周围的四个近邻节点相连;类似的,根据所述步骤SI提取得到的人体特征,分别建立图G' =(ν',ε')来表示对应的正样本和负样本;
[0021]步骤S4,对于所述步骤S3中的网格权重进行更新,得到更新后的人体检测器;
[0022]该步骤中,通过最小化如下的目标函数来更新所述权重:[0023]
【权利要求】
1.一种基于样例迁移学习的人体检测方法,其特征在于,该方法包括以下步骤: 步骤SI,对于训练集中的每个正样本进行归一化,并在得到的归一化图像上分别提取梯度直方图特征;对于所述训练集中的负样本,随机从不包含人体的图片上选取与所述归一化图像相同大小的图像,并提取其梯度直方图特征,从而分别得到所述正样本和负样本的多维的人体特征; 步骤S2,基于所述步骤SI得到的所述正样本和负样本的人体特征,利用支持向量机对所述训练集中的正样本和负样本图片进行训练,得到一个初始的人体检测器; 步骤S3,将所述步骤S2得到的初始的人体检测器划分为V个小的网格,每一个网格代表一个小的部件,并用相应网格里的权重来表不这个部件;同时基于所述网格建立一个图G=(v, ε),其中,V表示图G中的节点,ε表示图G中的边;根据所述步骤SI提取得到的人体特征,分别建立图(V =( V / , ε / )来表示对应的正样本和负样本; 步骤S4,对于所述步骤S3中的网格权重进行更新,得到更新后的人体检测器; 步骤S5,基于所述更新后的人体检测器,采用多尺度滑动框扫描的方式对于待检测图像进行人体检测,得到人体检测结果。
2.根据权利要求1所述的方法,其特征在于,所述图G=(V,ε)中,每个节点表示一个部件,边代表节点与节点之间的连接情况,且图中的每个节点和周围的四个近邻节点相连。
3.根据权利要求1所述的方法,其特征在于,所述步骤S4中,通过最小化如下的目标函数来更新所述权重:
4.根据权利要求3所述的方法,其特征在于,利用轮替下降法来得到优化的权重。
5.根据权利要求1所述的方法,其特征在于,所述步骤S5进一步包括以下步骤: 步骤S51,对所述待检测图像建立空间金字塔,在所述金字塔的每层中以一定的滑动步长进行滑动框扫描,对于每个扫描框扫描得到的图像块提取其梯度直方图特征; 步骤S52,通过最小化损失函数得到所述人体检测器的变形程度; 步骤S53,得到所述变形程度^后,将加入到得分函数中,根据所述得分函数的值判断每个扫描框里的图像是否为人体; 步骤S54,根据每个扫描框的检测结果判断所述待检测图像是否为人体图像。
6.根据权利要求5所述的方法,其特征在于,所述金字塔由许多图像组成,金字塔中的最底层为原始待检测图像,金字塔中第i层的图像为将原始图像缩小为Zi大小的图像,其中,0〈ζ〈1。
7.根据权利要求5所述的方法,其特征在于,所述步骤S52中,所述损失函数表示为:
8.根据权利要求5所述的方法,其特征在于,所述步骤S53中,如果得分函数的值低,则相应扫描框里的图像是人体的概率就低;反之如果得分函数的值高,则相应扫描框里的图像是人体的概率就1?。
9.根据权利要求5所述的方法,其特征在于,所述步骤S53中,所述得分函数表示为:
10.根据权利要求5所述的方法,其特征在于,所述步骤S54中,利用阈值方法来根据多个扫描框的检测结果判断所述待检测图像是否为人体图像。
【文档编号】G06K9/00GK103473538SQ201310432350
【公开日】2013年12月25日 申请日期:2013年9月22日 优先权日:2013年9月22日
【发明者】王春恒, 周文, 肖柏华, 张重 申请人:中国科学院自动化研究所