一种行人重识别方法、装置及计算机设备与流程

文档序号:27684644发布日期:2021-12-01 00:53阅读:来源:国知局

技术特征:
1.一种行人重识别方法,其特征在于,包括:s10:获取输入图像x,对x进行图像全局特征提取,得到全局特征图g;s20:基于注意力机制,将g作为待提取特征图,对所述待提取特征图进行图像局部特征提取,得到局部特征图x1;基于注意力机制,将x
i
‑1作为待提取特征图,对所述待提取特征图进行图像局部特征提取,得到局部特征图x
i
,其中,i为整数,i=2、

、n,n为大于或等于2的整数;s30:将g作为高层特征图f
high
,将x1作为低层特征图f
low
,对f
high
和f
low
进行非局部特征融合,得到非局部特征图;将x
j
‑1作为f
high
,将x
j
作为f
low
,对f
high
和f
low
进行非局部特征融合,得到非局部特征图,其中,j为整数,j=2、

、n;s40:利用卷积运算对、

、进行融合,得到融合特征图f
f
;基于f
f
,利用全连接层预测x对应的行人编号。2.如权利要求1所述的行人重识别方法,其特征在于,s10中,所述对x进行图像全局特征提取,得到全局特征图g包括:使用卷积神经网络cnn作为骨干网络,将x输入所述cnn中进行图像全局特征提取,得到g。3.如权利要求1所述的行人重识别方法,其特征在于,s20中,所述对所述待提取特征图进行图像局部特征提取,得到局部特征图包括:s21:利用通道维度的注意力机制,将所述待提取特征图在通道维度分别进行最大值池化以及平均值池化,将池化结果进行通道维度的整合,得到通道维度的特征图;将所述通道维度的特征图进行非线性激活,得到多个通道的权重;将所述多个通道的权重与所述待提取特征图在通道维度上相乘,得到带有通道维度注意力的特征图a
c
;s22:利用空间维度的注意力机制,将a
c
在空间维度分别进行最大值池化以及平均值池化,将池化结果进行空间位置的整合,得到空间维度的特征图;对所述空间维度的特征图进行n步迭代计算,在每一步迭代计算中进行残差融合,将第n步残差融合后的特征图进行非线性激活,得到多个空间位置的权重;将所述多个空间位置的权重与a
c
在空间维度进行乘法运算,得到带有空间维度注意力的特征图,其中,n为大于或等于2的整数;s23:将作为所述局部特征图。4.如权利要求3所述的行人重识别方法,其特征在于,s22包括:s221:利用空间维度的注意力机制,将a
c
在空间维度进行最大值池化,得到特征图;将a
c
在空间维度进行平均值池化,得到特征图;将和通过空间维度的卷积层进行空间位置的整合,得到空间维度的特征图f1:,其中,w1表示所述空间维度的卷积层的参数;s222:对所述空间维度的特征图进行n步迭代计算,在每一步迭代计算中,通过可学习的残差保留系数λ将当前步的第一中间特征图与上一步输出的空间维
度的特征图进行残差融合,得到当前步的第二中间特征图f
l
:,其中,l为整数,l=2、

、n;s223:将第n步的第二中间特征图f
n
作为所述第n步残差融合后的特征图,进行非线性激活,得到所述多个空间位置的权重;将所述多个空间位置的权重与a
c
在空间维度进行乘法运算,得到:,其中,θ表示激活函数,表示所述多个空间位置的权重。5.如权利要求1所述的行人重识别方法,其特征在于,s30中,所述对f
high
和f
low
进行非局部特征融合,得到非局部特征图,包括:s31:将f
high
通过一个卷积,得到卷积后的高层特征图,其中,表示所述一个卷积的卷积核;s32:将f
low
分别通过两个卷积,得到两个卷积后的低层特征图:和 ,其中,和分别表示所述两个卷积的卷积核;s33:将f
v
作为待池化特征图,对所述待池化特征图进行金字塔池化,得到池化后的特征向量;将f
k
作为待池化特征图,对所述待池化特征图进行金字塔池化,得到池化后的特征向量;s34:将与f
q
进行矩阵乘法,再进行softmax激活,得到相似性矩阵m;s35:将与m进行矩阵乘法,将相乘后的结果与f
high
拼接,再经过一个卷积,得到所述非局部特征图。6.如权利要求5所述的行人重识别方法,其特征在于,s33中,所述对所述待池化特征图进行金字塔池化,得到池化后的特征图,包括:s331:四个池化层分别以n1×
n1、n2×
n2、n3×
n3和n4×
n4四种不同尺度的网格,将所述待池化特征图划分为和块,其中,n1、n2、n3和n4均为正整数;s332:所述四个池化层在各自划分得到的块上进行最大池化操作,分别提取到维度为和的四个特征向量;s333:将所述四个特征向量进行融合,得到所述池化后的特征向量,其中,所述池化后的特征向量的维度为s, 。7.如权利要求1所述的行人重识别方法,其特征在于,s40中,所述基于f
f
,利用全连接层预测x对应的行人编号,包括:s41:利用所述全连接层,将f
f
映射为预测向量;
s42:选取所述预测向量中数值最大的元素,将所述数值最大的元素对应的行人编号作为预测的行人编号。8.一种行人重识别装置,其特征在于,包括:全局特征提取模块,用于获取输入图像x,对x进行图像全局特征提取,得到全局特征图g;局部特征提取模块,用于基于注意力机制,将g作为待提取特征图,对所述待提取特征图进行图像局部特征提取,得到局部特征图x1;基于注意力机制,将x
i
‑1作为待提取特征图,对所述待提取特征图进行图像局部特征提取,得到局部特征图x
i
,其中,i为整数,i=2、

、n,n为大于或等于2的整数;非局部特征融合模块, 用于将g作为高层特征图f
high
,将x1作为低层特征图f
low
,对f
high
和f
low
进行非局部特征融合,得到非局部特征图;将x
j
‑1作为f
high
,将x
j
作为f
low
,对f
high
和f
low
进行非局部特征融合,得到非局部特征图,其中,j为整数,j=2、

、n;编号预测模块,用于利用卷积运算对、

、进行融合,得到融合特征图f
f
;基于f
f
,利用全连接层预测x对应的行人编号。9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1

7中任意一项所述的行人重识别方法。

技术总结
本发明公开了一种行人重识别方法、装置及计算机设备。该方法包括:获取输入图像X,对X进行图像全局特征提取,得到全局特征图G;基于注意力机制,对G进行图像局部特征提取,得到局部特征图X1;对X


技术研发人员:张凯 黄瑾 宫永顺 逯天斌
受保护的技术使用者:山东力聚机器人科技股份有限公司
技术研发日:2021.10.25
技术公布日:2021/11/30
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1