基于迁移学习的行人重识别方法
【技术领域】
[0001] 本发明属于智能监控领域,具体涉及一种监控视频中行人重识别方法。
【背景技术】
[0002] 近年来,视频监控系统大量普及,特别在公共安全方面显得尤为突出,对打击犯 罪、维护社会稳定方面起着举足轻重的作用。在监控系统中对特定目标进行重识别是公共 安全领域的重要组成部分。随着技术的发展和应用需求的增加,重识别问题正逐渐发展为 研究的热点。但是在实际条件下,如果待重识别目标在摄像头下出现的次数较少时,以致于 能使用的样本数据比较少,影响对重识别模型的建立,最后容易造成目标的错误识别。
【发明内容】
[0003] 针对现有技术中存在监控网络中行人重识别准确率低、精度不高,当目标行人在 已知摄像头下出现的不频繁时,可使用的样本就比较少等一系列问题,本发明提出使用迀 移学习的方法去解决行人重识别问题,它是一种运用已存有的知识对不同但相关领域问题 进行求解的新的机器学习方法。其中,具有已知知识的领域称为源领域,待学习的领域称为 目标领域,将关于已知行人的摄像机的模型参数作为源领域,将关于待重识别行人的摄像 机模型参数作为目标领域。
[0004] 一种基于迀移学习的行人重识别方法,包括步骤如下: 步骤一、行人前景分割; 步骤二、行人特征提取; 步骤三、源领域改进的神经网络模型学习; 步骤四、源领域到目标领域的迀移学习; 步骤五、进行行人重识别。
[0005] 进一步的,所述步骤一包括如下步骤:采用GrabCut算法对出现已知行人的所有 摄像头视频序列的每一帧进行已知行人前景分割,该算法利用了图像中的纹理(颜色)信息 和边界(反差)信息,再通过用户指定一些像素属于行人目标,即可得到比较好的分割结果。
[0006] 进一步的,所述骤二包括如下步骤:采用人体对称模型将提取出的已知行人分为 头部、左上肢、右上肢、左腿、右腿五个感兴趣区域,提取每个区域的颜色特征、边缘特征、纹 理特征,那么,第z个区域的特征标记为:?,z=l,2, 3,4, 5。
[0007] 进一步的,所述步骤三包括如下步骤:采用改进的三层神经网络模型作为行人重 识别判别模型,即:将两个在不同场景不同摄像头下的行人特征作为模型的输入,并将两个 行人的第z个区域的特征同时且仅输入到隐藏层的第z个节点,再将隐藏层所有节点的值 输入到输出层,输出最后的值代表着输入的两个行人特征是否为同一人的: (3a)选择源领域训练样本:选择两个在不同摄像头下的已知行人的特征作为改进的神 经网络的输入向量:
;同时,对其进行人工进行标注,得到 源领域训练样本;其中,肖表示在源领域下改进的神经网络模型输入层的输入向量,(Gd 表示在场景a下第i个摄像头中行人m的第z个感兴趣区域的特征,表示在场景k下第j 个摄像头中行人η的第z个感兴趣区域的特征;相对应的,Y={1,-1},当行人m与行人η为 同一个人时,输出标签为Y=I ;当行人m与行人η不是同一个人时,输出标签为Y=-I ; (3b)将步骤(3a)得到的源领域训练样本(?,?输入到改进的神经网络模型中; 则第z个隐藏层的节点的输入为
接着从隐藏层到输出层,满足
通过误差反向传播算法,得到改进的神经网络模型参数,反映了摄像头i与j之间的联 系;其中,^:是输入向量到隐藏层对应的连接权值,%:是输入向量(CJf到隐藏层 对应的连接权值是隐藏层节点到输出层对应的连接权值,各是隐藏层各个神经元的阈 值,獍是输出层神经元的阈值。
[0008] 进一步的,所述步骤四包括如下步骤:通过源领域的模型参数^^_辅助学习在目 标领域中待重识别行人M的神经网络模型参数: (4a)如步骤1所述,将场景a下的摄像头I、/中的待重识别行人M进行行人前景分割, 如步骤2所述,对场景a下的两个摄像头中的待重识别行人M进行特征提取,并对其特征 向量进行组合,记为:
?示待重识别行人M在 场景a中的第|、,个摄像头下的第ζ个感兴趣区域的特征表示,同时,对其进行人工进行标 注;此时可以得到目标领域训练样本: (??,因为两者均是行人M的特征表示,可得标签 Y=I ; (4b)将第(4a)步得到的観结合步骤3得到的_去学习 :
最小化优化方程L,通过将??#无限接近源领域知识声丨::,获得最优的
;t表示源领域中得到的第t个模型参数,U是根据步骤三得到 的在源领域中模型参数的总个数;1是一个损失函数,用于评估实际模型的有效性是松 弛变量,用于测量误分类的程度,N表示步骤(4a)中得到的训练样本的总数。
[0009] 进一步的,步骤五包括如下步骤:判断摄像头j的视频中是否出现了摄像头i视频 中出现的彳丁人M ; (5a)通过步骤4得到,可以获得关于行人M的改进的神经网络行人重识别判别模 型; (5b )根据步骤1所述,对摄像头j的视频序列中的所有行人进行分割,假设一共有R个 行人,根据步骤2所述,对这些行人进行特征提取,记为,表示在场景k下的摄像头j 下的第e个行人的第z个区域的特征表示,将这R个行人分别与摄像头a下的行人M进行 组合,得到测试输入向量:
=1,2,. . .,R ;将Zr输入 到步骤(5a)得到的改进的神经N络行人重识别判别模型中,得到;此时,取最接近1的 _,且;则场景k中存在行人M ;否则,不存在;其中媒:为波动参数,使得得到 的标签值能在一定范围内浮动。
【附图说明】
[0010] 图1是本发明的基于迀移学习的行人重识别方法的总流程图。
[0011] 图2是本发明的场景示意图。
[0012] 图3是改进的神经网络模型示意图。
【具体实施方式】
[0013] 下面结合附图对本发明作进一步说明。如图1、2、3所示,本发明基于迀移学习的 行人重识别方法包括步骤如下: 步骤1、行人前景分割。采用GrabCut算法对出现已知行人的所有摄像头视频序列的每 一帧进行已知行人前景分割,该算法利用了图像中的纹理(颜色)信息和边界(反差)信息, 再通过用户指定一些像素属于目标,即可得到比较好的分割结果。并且,我们已经知道这些 已知行人在摄像头中的出现情况。
[0014] 步骤2、行人特征提取。采用人体对称模型将提取出的已知行人分为头部、左上 肢、右上肢、左腿、右腿五个感兴趣区域,提取每个区域的颜色特征、边缘特征、纹理特征,第 z个区域的特征标记为:q,z=l,2,3,4,5。
[0015] 步骤3、源领域改进的神经网络模型学习。采用改进的三层神经网络模型作为行人 重识别判别模型,即:将两个在不同场景不同摄像头下的行人特征作为模型的输入,并将两 个行人的第z个区域的特征同时且仅输入到隐藏层的第z个节点,再将隐藏层所有节点的 值输入到输出层,输出最后的值,代表着输入的两个行人特征是否为同一人的。改进的神经 网络模型如图3所示。
[0016] (3a)选择源领域训练样本:选择两个在不同摄像头下的已知行人的特征作为改进 的神经网络的输入向量:
司时,对其进行人工进行标注,得到 源领域训练样本;其中,@表示在源领域下改进的神经网络模型输入层的输入向量,(cvK 表示在场景a下第i个摄像头中行人m的第z个感兴趣区域的特征,表示在场景k下第j 个摄像头中行人η的第z个感兴趣区域的特征;相对应的,Y={1,-1},当行人m与行人η为 同一个人时,输出标签为Y=I ;当行人m与行人η不是同一个人时,输出标签为Y=-I ; (3b)将步骤(3a)得到的源领域训练样本输入到改进的神经网络模型中; 则第z个隐藏层的节点的输入为:
接着从隐藏层到输出层,满足:
通过误差反向传播算法,得到改进的神经网络模型参数,反映了摄像头i与j之