基于孪生网络的行人搜索模型的训练方法及相关设备

文档序号:34461385发布日期:2023-06-15 03:19阅读:23来源:国知局
基于孪生网络的行人搜索模型的训练方法及相关设备

本发明涉及图像识别,尤其涉及一种基于孪生网络的行人搜索模型的训练方法、装置、电子设备和存储介质。


背景技术:

1、行人搜索由于其在现实环境中的广泛应用,目前已经受到了越来越多的关注。行人搜索旨在一组场景图像中定位并检索出一个特定的行人,所以也可以被看作行人检测任务和行人重识别任务的组合。

2、现有的行人搜索任务可以分为两种方式:端到端的完成行人检测和行人重识别任务;首先进行行人检测,并将图像中的行人按照检测结果剪裁、保留,进而用剪裁后的图像完成行人重试别任务。

3、但是上述两种方法,都是以监督的方式进行训练,这就需要给大量图片内的所有行人都进行边框和编号标注,对海量的行人图像进行标注以支持监督学习需要大量的人力成本,严重限制了有监督式行人搜索方法的可扩展性,同时也难以处理行人的尺度变化问题,即对尺度变化较大的行人的搜索准确性有待提高。


技术实现思路

1、本发明提供一种基于孪生网络的行人搜索模型的训练方法、装置、电子设备和存储介质,用以解决现有技术中在不同尺度下的行人搜索准确不高的问题。

2、本发明提供一种基于孪生网络的行人搜索模型的训练方法,包括:

3、确定训练图像;

4、根据孪生网络的下分支对所述训练图像进行特征提取,得到所述训练图像中各行人的特征向量;

5、对所述训练图像进行处理得到多尺度行人图像,并根据孪生网络的上分支对所述多尺度行人图像进行特征提取,得到所述训练图像中各行人的多尺度特征向量;

6、根据所述特征向量和所述多尺度特征向量进行训练,并在训练完成时得到训练好的行人搜索模型。

7、根据本发明提供的一种基于孪生网络的行人搜索模型的训练方法,所述根据孪生网络的下分支对所述训练图像进行特征提取,得到所述训练图像中各行人的特征向量,包括:

8、根据孪生网络的下分支对所述训练图像中所包含的行人检测,确定所述训练图像中各行人对应的行人边框;

9、根据所述行人边框确定所述训练图像中的行人位置,并根据所述行人边框对所述行人位置进行特征提取,得到所述训练图像对应各行人的特征向量。

10、根据本发明提供的一种基于孪生网络的行人搜索模型的训练方法,所述对所述训练图像进行处理得到多尺度行人图像,并根据孪生网络的上分支对所述多尺度行人图像进行特征提取,得到所述训练图像中各行人的多尺度特征向量,包括:

11、对所述训练图像进行处理,得到多尺度的行人图像;

12、根据孪生网络的上分支对所述多尺度的行人图像进行特征提取,得到各行人对应的多尺度的特征向量;

13、将所述多尺度的特征向量进行特征融合,得到所述训练图像中各行人的多尺度特征。

14、根据本发明提供的一种基于孪生网络的行人搜索模型的训练方法,所述对所述训练图像进行处理,得到多尺度的行人图像,包括:

15、对所述训练图像进行裁剪处理,得到若干行人图像,其中每一个行人图像中包含一个行人;

16、对所述行人图像进行掩码处理,并对掩码处理后的所述行人图像进行尺寸放缩,得到多尺度的行人图像。

17、根据本发明提供的一种基于孪生网络的行人搜索模型的训练方法,所述方法还包括:

18、将所述特征向量和所述多尺度特征向量进行特征混合,得到混合特征向量;

19、对所述混合特征向量进行聚类处理,得到若干聚类簇以及聚类标签,其中一个聚类簇对应一个聚类标签。

20、根据本发明提供的一种基于孪生网络的行人搜索模型的训练方法,所述根据所述特征向量和所述多尺度特征对初始行人搜索模型进行训练之后,还包括:

21、当确定训练未完成时,对所述特征向量和所述多尺度特征向量进行更新;

22、根据更新后的所述特征向量和所述多尺度特征向量再次进行训练,至在训练完成时得到训练好的行人搜索模型。

23、根据本发明提供的一种基于孪生网络的行人搜索模型的训练方法,所述方法还包括:

24、确定目标图像,并对所述目标图像进行行人识别和特征提取,得到所述目标图像中各行人的目标特征;

25、根据所提取到的目标特征在查询集合中进行匹配,确定所述目标图像对应的行人检索结果。

26、本发明还提供一种基于孪生网络的行人搜索模型的训练装置,包括:

27、图像确定模块,用于确定训练图像;

28、第一提取模块,用于根据孪生网络的下分支对所述训练图像进行特征提取,得到所述训练图像中各行人的特征向量;

29、第二提取模块,用于对所述训练图像进行处理得到多尺度行人图像,并根据孪生网络的上分支对所述多尺度行人图像进行特征提取,得到所述训练图像中各行人的多尺度特征向量;

30、训练优化模块,用于根据所述特征向量和所述多尺度特征对初始行人搜索模型进行训练,并在训练完成时得到训练好的行人搜索模型。

31、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的基于孪生网络的行人搜索模型的训练方法。

32、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的基于孪生网络的行人搜索模型的训练方法。

33、本发明提供的基于孪生网络的行人搜索模型的训练方法、装置、电子设备和存储介质,在进行行人搜索模型的训练时,在确定了训练图像之后,根据孪生网络的上分支和下分支分别进行特征信息的提取,具体根据下分支得到训练图像中各行人的特征向量,以及在对训练图像完成图像处理得到多出度行人图像之后,根据下分支得到训练图像中各行人的多尺度特征向量,最后根据所得到的特征向量和多尺度特征向量进行模型的训练。实现了在训练过程中,无需进行样本的手动标记,减少标记成本,同时利用少量样本通过尺度变换等处理,增加样本数据,降低对样本的需求,同时提高了在进行行人搜索时对在不同尺度下的行人进行准确的搜索。



技术特征:

1.一种基于孪生网络的行人搜索模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的基于孪生网络的行人搜索模型的训练方法,其特征在于,所述根据孪生网络的下分支对所述训练图像进行特征提取,得到所述训练图像中各行人的特征向量,包括:

3.根据权利要求1所述的基于孪生网络的行人搜索模型的训练方法,其特征在于,所述对所述训练图像进行处理得到多尺度行人图像,并根据孪生网络的上分支对所述多尺度行人图像进行特征提取,得到所述训练图像中各行人的多尺度特征向量,包括:

4.根据权利要求3所述的基于孪生网络的行人搜索模型的训练方法,其特征在于,所述对所述训练图像进行处理,得到多尺度的行人图像,包括:

5.根据权利要求1所述的基于孪生网络的行人搜索模型的训练方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的基于孪生网络的行人搜索模型的训练方法,其特征在于,所述根据所述特征向量和所述多尺度特征对初始行人搜索模型进行训练之后,还包括:

7.根据权利要求1所述的基于孪生网络的行人搜索模型的训练方法,其特征在于,所述方法还包括:

8.一种基于孪生网络的行人搜索模型的训练装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述基于孪生网络的行人搜索模型的训练方法。

10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于孪生网络的行人搜索模型的训练方法。


技术总结
本发明提供一种基于孪生网络的行人搜索模型的训练方法、装置、电子设备和存储介质,其中方法包括:确定训练图像;根据孪生网络的下分支对训练图像进行特征提取,得到训练图像中各行人的特征向量;对训练图像进行处理得到多尺度行人图像,并根据孪生网络的上分支对多尺度行人图像进行特征提取,得到训练图像中各行人的多尺度特征向量;根据特征向量和多尺度特征向量进行训练,并在训练完成时得到训练好的行人搜索模型。提高了在进行行人搜索时对在不同尺度下的行人进行准确的搜索。

技术研发人员:杨阳,雷震,王本智
受保护的技术使用者:中国科学院自动化研究所
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1