一种追踪方法、装置及计算机设备与流程

文档序号:21547559发布日期:2020-07-17 17:59阅读:147来源:国知局
一种追踪方法、装置及计算机设备与流程

本发明涉及图像处理技术领域,尤其涉及一种追踪方法、装置及计算机设备。



背景技术:

目前,随着深度学习算法的成熟,基于深度学习算法的人脸识别技术近年来获得了巨大的发展与进步。现有的人脸跟踪方法采用前后帧人脸检测框进行关联匹配,通过连续帧之间人脸检测框的相关性,来确定人脸在视频中的运动轨迹。

但是,在遇到大面积遮挡的情况下,特别是人脸之间相互遮挡的时候,主动跟踪预测的人脸位置准确度不高,仅仅通过人脸检测框关联匹配的方式很容易造成跟踪目标丢失或跟踪错误。可见,现有技术中,多人脸相互遮挡情况下人脸跟踪的准确性较低。



技术实现要素:

本发明实施例提供一种追踪方法,用于解决现有技术中存在的多人脸相互遮挡情况下人脸跟踪的准确性较低的技术问题。

第一方面,提供一种追踪方法,所述方法包括:

确定追踪目标和所述追踪目标的人脸预测框信息,并将所述人脸预测框信息与第一帧图像中的多个头肩框信息进行交并比计算,以确定出遮挡区域,其中,所述追踪目标用于表征第二帧图像中的人脸信息未关联匹配的第一帧图像的人脸头像信息对应的信息,所述第一帧图像和所述第二帧图像属于第一视频流且所述第一视频流包括多帧图像,所述第二帧图像和所述第一帧图像相邻;

从所述第二帧图像的帧数之后的预定帧数的图像中,确定所述遮挡区域对应的预定范围内是否出现未关联匹配的人脸信息;

当出现未关联匹配的人脸信息时,将所述遮挡区域的检测区域扩大预定倍数,以获得第一遮挡区域信息,并计算所述第一遮挡区域信息和所述未关联匹配的人脸信息的交并比值;

若所述交并比值大于或等于第一阈值,则确定所述未关联的人脸信息为所述追踪目标对应的人脸信息。

在一种可能的实施方式中,所述方法还包括:

若所述交并比小于第一阈值时,则提取所述未关联匹配的人脸信息的特征,并将所述未关联匹配的人脸信息的特征和第一人脸信息的特征进行交并比计算,其中,所述第一人脸信息是根据所述第一帧图像确定的所述追踪目标对应的人脸信息;

若所述未关联匹配的人脸信息的特征和第一人脸信息的特征的交并比值大于或等于第二阈值,则确定所述未关联匹配的人脸信息为所述追踪目标对应的人脸信息。

在一种可能的实施方式中,确定追踪目标和所述追踪目标的人脸预测框信息,包括:

接收输入的第一帧图像和第二帧图像,其中,所述第一帧图像和所述第二帧图像中均包括多个人脸信息和多个头肩区域信息;

对所述第一帧图像和所述第二帧图像进行关联匹配,确定追踪目标,并根据所述第一视频流中第二帧图像之前的第一预定帧数的图像信息,确定所述追踪目标的人脸预测框信息。

在一种可能的实施方式中,对所述第一帧图像和所述第二帧图像进行关联匹配,确定追踪目标包括:

对所述第一帧图像进行检测处理,获得多个人脸图像信息和多个头肩框区域信息,并将与所述多个头肩框信息具有第一关联匹配关系的所述多个人脸图像信息作为多个跟踪目标;

对所述第二帧图像进行检测处理,获得多个人脸图像信息和多个头肩框区域信息;

将所述多个跟踪目标和所述第二帧图像中的多个人脸图像信息进行交并比计算,以确定所述多个跟踪目标是否与所述第二帧图像中的多个人脸图像信息关联匹配;

若第一跟踪目标和所述第二帧图像中的多个人脸图像信息的交并比值均小于第三阈值,则确定所述第一跟踪目标为追踪目标,其中,所述第一跟踪目标用于表征未与所述第二帧图像中的多个人脸图像信息关联匹配的人脸信息。

在一种可能的实施方式中,根据所述第二帧图像之前的第一预定帧数的图像信息,确定所述追踪目标的人脸预测框信息,包括:

确定所述第二帧图像之前的第一预定帧数的图像信息,并计算所述第一预定帧数的图像信息中所述追踪目标的人脸检测框的中心位置的坐标;

根据所述人脸检测框的中心位置的坐标,确定所述第二帧图像中所述追踪目标的人脸预测框的对角位置的坐标,以根据所述对角位置的坐标获得所述追踪目标的人脸预测框信息。

第二方面,提供一种追踪装置,所述装置包括:

确定模块,确定追踪目标和所述追踪目标的人脸预测框信息,并将所述人脸预测框信息与第一帧图像中的多个头肩框信息进行交并比计算,以确定出遮挡区域,其中,所述追踪目标用于表征第二帧图像中的人脸信息未关联匹配的第一帧图像的人脸头像信息对应的信息,所述第一帧图像和所述第二帧图像属于第一视频流且所述第一视频流包括多帧图像,所述第二帧图像和所述第一帧图像相邻;

判断模块,用于从所述第二帧图像的帧数之后的预定帧数的图像中,确定所述遮挡区域对应的预定范围内是否出现未关联匹配的人脸信息;

追踪模块,用于当出现未关联匹配的人脸信息时,将所述遮挡区域的检测区域扩大预定倍数,以获得第一遮挡区域信息,并计算所述第一遮挡区域信息和所述未关联匹配的人脸信息的交并比值;若所述交并比值大于或等于第一阈值,则确定所述未关联的人脸信息为所述追踪目标对应的人脸信息。

在一种可能的实施方式中,所述追踪模块,用于:

若所述交并比小于第一阈值时,则提取所述未关联匹配的人脸信息的特征,并将所述未关联匹配的人脸信息的特征和第一人脸信息的特征进行交并比计算,其中,所述第一人脸信息是根据所述第一帧图像确定的所述追踪目标对应的人脸信息;

若所述未关联匹配的人脸信息的特征和第一人脸信息的特征的交并比值大于或等于第二阈值,则确定所述未关联匹配的人脸信息为所述追踪目标对应的人脸信息。

在一种可能的实施方式中,所述确定模块,用于:

接收输入的第一帧图像和第二帧图像,其中,所述第一帧图像和所述第二帧图像中均包括多个人脸信息和多个头肩区域信息;

对所述第一帧图像和所述第二帧图像进行关联匹配,确定追踪目标,并根据所述第一视频流中第二帧图像之前的第一预定帧数的图像信息,确定所述追踪目标的人脸预测框信息。

在一种可能的实施方式中,所述确定模块,用于:

对所述第一帧图像进行检测处理,获得多个人脸图像信息和多个头肩框区域信息,并将与所述多个头肩框信息具有第一关联匹配关系的所述多个人脸图像信息作为多个跟踪目标;

对所述第二帧图像进行检测处理,获得多个人脸图像信息和多个头肩框区域信息;

将所述多个跟踪目标和所述第二帧图像中的多个人脸图像信息进行交并比计算,以确定所述多个跟踪目标是否与所述第二帧图像中的多个人脸图像信息关联匹配;

若第一跟踪目标和所述第二帧图像中的多个人脸图像信息的交并比值均小于第三阈值,则确定所述第一跟踪目标为追踪目标,其中,所述第一跟踪目标用于表征未与所述第二帧图像中的多个人脸图像信息关联匹配的人脸信息。

在一种可能的实施方式中,所述确定模块,用于:

确定所述第二帧图像之前的第一预定帧数的图像信息,并计算所述第一预定帧数的图像信息中所述追踪目标的人脸检测框的中心位置的坐标;

根据所述人脸检测框的中心位置的坐标,确定所述第二帧图像中所述追踪目标的人脸预测框的对角位置的坐标,以根据所述对角位置的坐标获得所述追踪目标的人脸预测框信息。

第三方面,提供一种计算机设备,所述计算机设备包括:

存储器,用于存储程序指令;

处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行第一方面中的任一方法包括的步骤。

第四方面,提供一种存储介质,该存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行第一方面中的任一方法包括的步骤。

第五方面,提供一种计算机程序产品,当所述计算机程序产品在计算机设备上运行时,使得计算机设备能够执行第一方面中任一方法包括的步骤。

本发明的实施例提供的技术方案至少带来以下有益效果:

在本发明实施例中,可以通过将输入的第一帧图像和第二帧图像进行关联匹配计算,从而可以确定追踪目标。进一步地,还可以确定追踪目标的人脸预测框信息,并将人脸预测框信息和第一帧图像中的多个头肩框信息进行交并比计算,以确定出遮挡区域。然后可以判断从第二帧图像的帧数之后的预定帧数的图像中,确定遮挡区域对应的预定范围内是否出现未关联匹配的人脸信息,也就是说,通过计算人脸预测框信息和头肩框信息的交并比值来确定遮挡区域,即确定追踪目标的人脸信息可能被遮挡的区域。

进一步地,当出现未关联匹配的人脸信息时,将遮挡区域的检测区域扩大预定倍数,以获得第一遮挡区域信息,并计算第一遮挡区域信息和未关联匹配的人脸信息的交并比值;若交并比值大于或等于第一阈值,则确定未关联的人脸信息为追踪目标对应的人脸信息。

也就是说,在本发明实施例中,当出现追踪目标时,可以采用追踪目标对应的人脸预测框和前一帧图像中多个头肩框信息进行交并比计算,从而可以确定出遮挡区域,即确定出人脸信息可能被遮挡的区域,从而在该帧图像之后,判断遮挡区域对应的预定范围内是否出现未关联匹配的人脸信息,从而判断该人脸信息是否为追踪目标对应的人脸信息,从而完成对追踪目标的匹配,进而可以在多人脸相互遮挡情况下,提高人脸跟踪的准确性。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或通过实施本而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。

图1为本发明实施例中应用场景示意图;

图2为本发明实施例中的追踪方法的流程图;

图3为本发明实施例中的确定追踪目标的示意图;

图4为本发明实施例中的确定追踪目标的又一示意图;

图5为本发明实施例中的追踪装置的结构框图;

图6为本发明实施例中的计算机设备的结构示意图;

图7为本发明实施例中的计算机设备的又一结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互任意组合。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

本发明的说明书和权利要求书及上述附图中的术语“第一”和“第二”是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的保护。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明实施例中,“多个”可以表示至少两个,例如可以是两个、三个或者更多个,本发明实施例不做限制。

如前所述,现有技术中,在进行人脸跟踪研究时,可以使用人脸检测框关联匹配来确定跟踪目标。但是,在遇到人脸之间相互遮挡的时候,主动跟踪预测的人脸位置准确度不高,只通过关联匹配来确定跟踪目标很容易造成从跟踪一个人变成跟踪成另一个人,即很容易造成跟踪目标丢失或跟踪目标错误。可见,现有技术中,多人脸相互遮挡情况下人脸跟踪的准确性较低。

鉴于此,本发明实施例提供一种追踪方法,该方法可以采用计算人脸预测框信息和头肩框信息的交并比值,来进行追踪目标的追踪。也就是说,本发明实施例中提供的追踪方法是通过计算人脸框信息和头肩框信息之间的关联,来确定追踪目标,这样的方式,可以较为准确的在多人脸遮挡的场景中,准确的实现对追踪目标的追踪。

在介绍完本发明实施例的设计思想之后,下面对本发明实施例的技术方案能够适用的应用场景做一些简单介绍,需要说明的是,以下介绍的应用场景仅用于说明本发明实施例而非限定。在具体实施过程中,可以根据实际需要灵活地应用本发明实施例提供的技术方案。

请参见图1所示,为发明实施例能够适用的一种场景示意图,该场景中包括视频采集设备101、计算机设备102以及处理设备103,本发明实施例的追踪方法可以通过图1中视频采集设备101、处理设备103以及计算机设备102协同来实现。

在具体的实施过程中,前述的视频采集设备101可以安装在机场、高铁、地铁、火车站、校园以及商圈等等需要进行人物追踪的场景,例如安装在机场出入口或者高铁站内部等等,以获取人群不断流动变化的视频流数据;或者,视频采集设备101还可以安装在各大交通路口,同样可以获取人群不断流动变化的视频流数据。

以视频采集设备101安装在高铁站的应用场所为例,当视频采集设备101采集到视频流数据之后,可以将是视频流数据通过网络104发送给计算机设备102。

计算机设备102可以包括一个或多个处理器1021、存储器1022、与视频采集设备交互的i/o接口1023以及与处理设备交互的i/o接口1024等。在具体的实施过程中,可以是多个计算机设备可能与多个视频采集设备交互,也可以是一个计算机设备与多个视频采集设备交互,还可以是一个计算机设备与一个视频采集设备交互,本发明实施例中不做限制。具体的,计算机设备还可以接收来自处理设备发送的处理后的视频流数据,图1中以一个计算机设备与一个视频采集设备和一个处理设备进行交互为例进行示出。

在本发明实施例中,计算机设备102可以通过i/o接口1023接收视频采集设备101发送的视频流数据,然后采用处理器1021对视频流数据进行处理,并将处理后的信息存储在存储器1022中。当然,计算机设备可以通过i/o接口1024接收处理设备103发送的视频流数据,然后采用处理器1021对视频流数据进行处理,并将处理后的信息存储在存储器1022中。

具体的,计算机设备102对视频采集设备101发送的视频流数据和处理设备103发送的视频流数据,可以采用相同类型的处理器,也可以采用不同类型的处理器,本发明实施例中不做限制。在具体的实施过程中,视频采集设备101可以将采集的视频流数据发送给处理设备103,即视频采集设备101与处理设备103之间可以进行交互。需要说明的是,在图1中,以视频采集设备101采集的视频流数据未发给处理设备103为例进行说明。

视频采集设备101与计算机设备102之间可以通过一个或者多个网络104进行通信连接。处理设备103与计算机设备102之间也可以通过一个或者多个网络104进行通信连接。该网络104可以是有线网络,也可以是无线网络,例如无线网络可以是移动蜂窝网络,或者可以是无线保真(wireless-fidelity,wifi)网络,当然还可以是其他可能的网络,本发明实施例对此不做限制。

在具体的实施过程中,当计算机设备接收到视频流数据之后,可以对视频流数据进行目标追踪处理,从而可以较为准确的确定人的运行轨迹。下面结合图1的应用场景,参考图2来描述根据本发明示例性实施方式提供的追踪方法。需要注意的是,上述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。

如图2所示,为本发明实施例提供的追踪方法的流程示意图,该方法例如可以由图1中所示的计算机设备来执行,下面对本发明实施例的方法流程进行介绍。

步骤201:确定追踪目标和追踪目标的人脸预测框信息,并将人脸预测框信息与第一帧图像中的多个头肩框信息进行交并比计算,以确定出遮挡区域,其中,追踪目标用于表征第二帧图像中的人脸信息未关联匹配的第一帧图像的人脸头像信息对应的信息。

在本发明实施例中,可以接收视频采集设备输入到计算机设备的多个视频流,其中,该多个视频流可以是根据预设的条件触发输入到计算机设备,例如按照预设的时间周期将采集的视频流输入到计算机设备,或者是输入预定路数的视频流等等,本发明实施例中不做限定。当然,该多个视频流也可以是用户根据实际的需求进行选择,从而可以确定出输入的视频流,即可以理解为图1中处理设备处理后的视频流。后文中为了便于描述,将输入的视频流称为第一视频流。

在本发明实施例中,第一视频流中包括多帧图像,且多帧图像中每一帧图像包括多个人脸信息和多个头肩区域信息。在本发明实施例中,可以获得属于第一视频流的第一帧图像和第二帧图像,其中,第一帧图像与第二帧图像相邻。

例如,第一视频流包括60帧图像,且该60帧图像按照从1-60的顺序依次排序,若将第45帧图像称作第一帧图像,则可以将第46帧图像称作第二帧图像。

在本发明实施例中,可以对第一帧图像和第二帧图像进行关联匹配,确定追踪目标,其中,追踪目标用于表征第一帧图像中的人脸信息未关联匹配的第二帧图像的人脸头像信息对应的信息。

在本发明实施例中,可以对第一帧图像进行检测处理,从而可以获得第一帧图像中的多个人脸图像信息和多个头肩框区域信息,并将与多个头肩框区域具有第一关联匹配关系的多个人脸图像信息作为多个跟踪目标。然后可以对第二帧图像进行检测处理,从而可以获得第二帧图像中多个人脸图像信息和多个头肩框区域信息。即计算机设备可以对输入的第一视频流的图像进行检测处理,从而可以获得该图像中多个人脸图像信息和多个头肩框区域信息。

在具体的实施过程中,在对第一帧图像和第二帧图像进行关联匹配时,可以先将第一帧图像中的多个人脸图像信息和多个头肩框区域信息进行第一关联匹配,即可以确定人脸图像信息和头肩框区域信息是否关联匹配,从而可以确定出多个跟踪目标。

为了更好的理解对人脸图像信息和头肩区域信息进行第一关联匹配的过程,下面以一个人脸图像信息和一个头肩区域信息为例,对本发明实施例中的人脸图像信息和头肩区域信息进行交并比计算的过程进行说明。若确定出人脸图像信息对应的矩形框t的左下角坐标为(x0,y0),右上角坐标为(x1,y1),以及头肩区域信息对应的矩形框g的左下角坐标为(m0,n0),右上角坐标为(m1,n1),则交并比当确定出交并比大于预定阈值时,则可以确定该人脸图像信息与该头肩区域信息具有第一关联匹配关系,即该帧图像中可以完全确定出人脸图像信息和头肩区域信息。

在本发明实施例中,可以将前述从第一帧图像中确定的多个跟踪目标和第二帧图像中的多个人脸图像信息进行交并比计算,并具体根据计算出的交并比值,确定多个跟踪目标是否与第二帧图像中的多个人脸图像信息关联匹配。也就是说,当确定出跟踪目标后,可以将该跟踪目标对应的人脸图像信息和第二帧图像中多个人脸图像信息进行人脸图像信息与人脸图像信息之间的交并比计算,从而对跟踪目标的运动轨迹进行追踪。

在具体的实施过程中,可以以一个跟踪目标与第二帧图像中多个人脸信息进行交并比计算的方式,将第一帧图像中确定的多个跟踪目标均与第二帧图像中多个人脸信息进行交并比计算,从而可以确定出追踪目标。这样的方式,可以较为准确的确定出追踪目标。

在本发明实施例中,若第一跟踪目标和第二帧图像中的多个人脸图像信息的交并比值均小于第三阈值,则确定第一跟踪目标为追踪目标,其中,第一跟踪目标用于表征未与第二帧图像中的多个人脸图像信息关联匹配的人脸信息。

在具体的实施过程中,当确定多个跟踪目标中的第一跟踪目标和第二帧图像中的多个人脸图像信息的交并比值均小于第三阈值,则可以理解为第一跟踪目标与第二帧图像中的多个人脸图像信息均未关联匹配上,也就是说,第一跟踪目标可能被第二帧图像中的多个人脸图像信息中任意一个人脸图像信息对应的人脸给遮挡住了,为了便于区别描述,则将第一跟踪目标称作追踪目标,以实现对第一跟踪目标的运动轨迹的追踪。

在本发明实施例中,可以根据第一视频流中的第二帧图像之前的预定帧数的图像信息,确定追踪目标的人脸预测框信息,并将人脸预测框信息与第一帧图像中的多个头肩框信息进行交并比计算,以确定出遮挡区域,其中,遮挡区域用于表征追踪目标对应人脸信息被遮挡的区域。

在本发明实施例中,当确定出追踪目标之后,可以确定追踪目标在第二帧图像中的人脸图像预测框信息,进而可以根据人脸预测框信息确定该追踪目标被遮挡的区域。

在本发明实施例中,在确定出追踪目标之后,可以确定第一视频流中的第二帧图像之前的第一预定帧数的图像信息,例如确定第一视频流中的第二帧图像之前的10帧图像的图像信息,然后可以计算预定帧数的图像信息中追踪目标的人脸检测框的中心位置的坐标,从而可以根据人脸检测框的中心位置的坐标,确定第二帧图像中追踪目标的人脸预测框的对角位置的坐标,从而可以根据对角位置的坐标获得追踪目标的人脸预测框信息。

在具体的实施过程中,若预定帧数为5帧,则可以确定第一视频流中第二帧图像之前的5帧图像的图信息,从而可以确定出5帧图像信息中追踪目标的人脸检测框的中心位置的坐标,然后可以根据人脸检测框的中心位置的坐标,确定第二帧图像中追踪目标的人脸预测框的对角位置的坐标。

在实际实施过程中,考虑到图像中人脸之间相互遮挡时,若只使用人脸检测框对应的图像来作为遮挡图像,可能会因为人脸检测框较小,无法准确的确定遮挡区域而造成追踪目标确定错误的问题,并且头肩框相对于人脸的检测较为稳定,两者相辅相成使得计算机设备采用的检测算法的实施稳定性大大提高。当跟踪目标在第二帧图像中没有被检测到时,可以选取在第二帧图像之前临近5帧的跟踪目标框的运动轨迹信息,从而可以较为准确的预测框的确定。

具体的,可以采用以下公式计算出追踪目标的人脸预测框的对角位置的坐标:

其中,x用于表征矩形框的横坐标,y用于表征矩形框的纵坐标,其中,x′1用于表示人脸预测框左上角点的横坐标,x1用于表示追踪目标被遮挡前人脸检测框左上角点的横坐标,y′1用于表示人脸预测框左上角点的纵坐标,y1用于表示追踪目标被遮挡前人脸检测框左上角点的纵坐标,n表示预定帧数的检测框的信息,i为计数单位,表示相邻两帧中心点横坐标的差值,表示相邻两帧中心点纵坐标的差值。

步骤202:从第一视频流中的第二帧图像的帧数之后的预定帧数的图像中,确定遮挡区域对应的预定范围内是否出现未关联匹配的人脸信息,若未出现则执行步骤203,如出现,则返回步骤201。

步骤203:当出现未关联匹配的人脸信息时,将遮挡区域的检测区域扩大预定倍数,以获得第一遮挡区域信息,并计算第一遮挡区域信息和未关联匹配的人脸信息的交并比值。

步骤204:若交并比值大于或等于第一阈值,则确定未关联的人脸信息为追踪目标对应的人脸信息。

在本发明实施例中,当确定遮挡区域之后,可以确定对该追踪目标的追踪周期。例如追踪30帧图像,或者是追踪20帧图像,即预定帧数可以为30帧或者是20帧等等。然后判断在第二帧图像的帧数之后的预定帧数的图像中,遮挡区域对应的预定范围内是否出现未关联匹配的人脸信息。

需要说明的是,在本发明实施例中,预定帧数和第一预定帧数对应的帧数均为大于0的正整数,且预定帧数和第一预定帧数可以是相同的,也可以是不同的,本发明实施例中不做限制。

在本发明实施例中,当从第一视频流中的第二帧图像的帧数之后的预定帧数的图像中,确定遮挡区域对应的预定范围内出现未关联匹配的人脸信息时,则可以将遮挡区域的检测区域扩大预定倍数,具体的,该预定倍数可以是将遮挡区域的检测区域对应的长度和宽度同时扩大两倍,也可以是将遮挡区域的检测区域对应的长度和宽度同时扩大三倍,本发明实施例中不做限定。

在具体的实施过程中,当将遮挡区域的检测区域扩大预定倍数,可以获得第一遮挡区域信息,然后可以计算第一遮挡区域信息和未关联匹配的人脸信息的交并比值,当交并比值大于或等于第一阈值时,则确定未关联的人脸信息为追踪目标对应的人脸信息。

例如,第一阈值为0.3,当第一遮挡区域信息和未关联匹配的人脸信息的交并比值为0.4时,则可以确定未关联的人脸信息为追踪目标对应的人脸信息。

在具体的实施过程中,请参见图3,其中,图3.1可以理解为本发明实施例中的第一帧图像,且可以将图3.1中的实体框框出且跟踪id为1的对象作为本发明实施例中的第一跟踪目标即追踪目标。请继续参见图3中的3.2图,其中,虚框确定的则为本发明实施例中前述的遮挡区域,图3中的3.3图用于表示没有出现未关联人脸图像信息的图像。当确定遮挡区域附近出现未关联的人脸图像信息时,则可以将该遮挡区域扩大预定倍数,则确定为第一遮挡区域信息,即图3中的3.4图的虚框区域,进而可以计算图3.4中实体框对应的人脸信息和虚框对应的区域信息的交并比,当确定交并比值大于或等于第一阈值时,则可以确定实体框对应的人脸信息为追踪目标,还可以对该追踪目标进行对应的跟踪id的标注,具体可以标注为1。

步骤205:若交并比小于第一阈值时,则提取未关联匹配的人脸信息的特征,并将未关联匹配的人脸信息的特征和第一人脸信息的特征进行交并比计算,其中,第一人脸信息是根据第一帧图像确定的追踪目标对应的人脸信息。

步骤206:若未关联匹配的人脸信息的特征和第一人脸信息的特征的交并比值大于或等于第二阈值,则确定未关联匹配的人脸信息为追踪目标对应的人脸信息。

在本发明实施例中,若确定计算出第一遮挡区域信息和未关联匹配的人脸信息的交并比值小于第一阈值时,则可以提取未关联匹配的人脸信息的特征,然后将未关联匹配的人脸信息的特征和第一人脸信息的特征进行交并比计算,其中,第一人脸信息用于表征第一帧图像中未与第二帧图像关联匹配的目标人脸信息。

在具体的实施过程中,可以采用深度网络算法确定未关联匹配的人脸信息的特征向量和第一人脸信息的特征向量,从而可以提取未关联匹配的人脸信息的特征和第一人脸信息的特征,当然,也可以采用其它算法,本发明实施例中不做限定。具体的,当确定未关联匹配的人脸信息的特征和第一人脸信息的特征的交并比值大于或等于第二阈值,则可以确定未关联匹配的人脸信息为追踪目标对应的人脸信息。具体的,第二阈值可以为0.6,也可以是0.7等等。也就是说,当在第二帧图像的帧数之后的预定帧数中,确定出与未关联的人脸图像信息,则可以将该人脸图像信息和第一帧图像中的跟踪目标进行交并比计算,即确定该人脸图像信息是否为追踪目标。

在本发明实施例中,请参见图4,图4为采用本发明实施例中的追踪方法确定出的追踪目标的又一示意图。请继续参见图4,在图4中的4.1图中,可以确定出追踪目标的人脸检测框,即可以确定追踪目标的人脸图像信息。具体的,在图4.2中可以确定追踪目标的对应的遮挡区域的遮挡框,然后可以确定出图4.3中追踪目标对应的人脸图像信息。即采用本发明实施例提供的追踪方法,可以较为准确的实现在多人脸相互遮挡的场景下确定追踪目标。

基于同一发明构思,本发明实施例提供了一种追踪装置,该追踪装置能够实现前述的追踪方法对应的功能。该追踪装置可以是硬件结构、软件模块、或硬件结构加软件模块。该追踪装置可以由芯片系统实现,芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。请参见图5所示,该追踪装置包括确定模块501、判断模块502以及追踪模块503。其中:

确定模块501,确定追踪目标和所述追踪目标的人脸预测框信息,并将所述人脸预测框信息与第一帧图像中的多个头肩框信息进行交并比计算,以确定出遮挡区域,其中,所述追踪目标用于表征第二帧图像中的人脸信息未关联匹配的第一帧图像的人脸头像信息对应的信息,所述第一帧图像和所述第二帧图像属于第一视频流且所述第一视频流包括多帧图像,所述第二帧图像和所述第一帧图像相邻;

判断模块502,用于从所述第二帧图像的帧数之后的预定帧数的图像中,确定所述遮挡区域对应的预定范围内是否出现未关联匹配的人脸信息;

追踪模块503,用于当出现未关联匹配的人脸信息时,将所述遮挡区域的检测区域扩大预定倍数,以获得第一遮挡区域信息,并计算所述第一遮挡区域信息和所述未关联匹配的人脸信息的交并比值;若所述交并比值大于或等于第一阈值,则确定所述未关联的人脸信息为所述追踪目标对应的人脸信息。

在一种可能的实施方式中,所述追踪模块505,用于:

若所述交并比小于第一阈值时,则提取所述未关联匹配的人脸信息的特征,并将所述未关联匹配的人脸信息的特征和第一人脸信息的特征进行交并比计算,其中,所述第一人脸信息是根据所述第一帧图像确定的所述追踪目标对应的人脸信息;

若所述未关联匹配的人脸信息的特征和第一人脸信息的特征的交并比值大于或等于第二阈值,则确定所述未关联匹配的人脸信息为所述追踪目标对应的人脸信息。

在一种可能的实施方式中,所述确定模块501,用于:

接收输入的第一帧图像和第二帧图像,其中,所述第一帧图像和所述第二帧图像中均包括多个人脸信息和多个头肩区域信息;

对所述第一帧图像和所述第二帧图像进行关联匹配,确定追踪目标,并根据所述第一视频流中第二帧图像之前的第一预定帧数的图像信息,确定所述追踪目标的人脸预测框信息。

在一种可能的实施方式中,所述确定模块501,用于:

对所述第一帧图像进行检测处理,获得多个人脸图像信息和多个头肩框区域信息,并将与所述多个头肩框信息具有第一关联匹配关系的所述多个人脸图像信息作为多个跟踪目标;

对所述第二帧图像进行检测处理,获得多个人脸图像信息和多个头肩框区域信息;

将所述多个跟踪目标和所述第二帧图像中的多个人脸图像信息进行交并比计算,以确定所述多个跟踪目标是否与所述第二帧图像中的多个人脸图像信息关联匹配;

若第一跟踪目标和所述第二帧图像中的多个人脸图像信息的交并比值均小于第三阈值,则确定所述第一跟踪目标为追踪目标,其中,所述第一跟踪目标用于表征未与所述第二帧图像中的多个人脸图像信息关联匹配的人脸信息。

在一种可能的实施方式中,所述确定模块501,用于:

确定所述第二帧图像之前的第一预定帧数的图像信息,并计算所述第一预定帧数的图像信息中所述追踪目标的人脸检测框的中心位置的坐标;

根据所述人脸检测框的中心位置的坐标,确定所述第二帧图像中所述追踪目标的人脸预测框的对角位置的坐标,以根据所述对角位置的坐标获得所述追踪目标的人脸预测框信息。

前述的如图2所示追踪方法的实施例涉及的各步骤的所有相关内容均可以援引到本发明实施例中的追踪装置所对应的功能模块的功能描述,在此不再赘述。

本发明实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,另外,在本发明各个实施例中的各功能单元可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

基于同一发明构思,本发明实施例还提供一种计算机设备的示意图,如图6所示,本发明实施例中的计算机设备包括至少一个处理器601,以及与至少一个处理器601连接的存储器602和通信接口603,其中,该通信接口603可以是图1中的i/o接口的总称。本发明实施例中不限定处理器601与存储器602之间的具体连接介质,图6中是以处理器601和存储器602之间通过总线600连接为例,总线600在图6中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线600可以分为地址总线、数据总线、控制总线等,为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

在本发明实施例中,存储器602存储有可被至少一个处理器601执行的指令,至少一个处理器601通过执行存储器602存储的指令,可以执行前述的追踪方法中所包括的步骤。

其中,处理器601是计算机设备的控制中心,可以利用各种接口和线路连接整个故障检测设备的各个部分,通过运行或执行存储在存储器602内的指令以及调用存储在存储器602内的数据,计算设备的各种功能和处理数据,从而对计算设备进行整体监控。可选的,处理器601可包括一个或多个处理单元,处理器601可集成应用处理器和调制解调处理器,其中,处理器601主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器601中。在一些实施例中,处理器601和存储器602可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。

处理器601可以是通用处理器,例如中央处理器(cpu)、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。

存储器602作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器602可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(randomaccessmemory,ram)、静态随机访问存储器(staticrandomaccessmemory,sram)、可编程只读存储器(programmablereadonlymemory,prom)、只读存储器(readonlymemory,rom)、带电可擦除可编程只读存储器(electricallyerasableprogrammableread-onlymemory,eeprom)、磁性存储器、磁盘、光盘等等。存储器602是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本发明实施例中的存储器602还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。通信接口603是能够用于进行通信的传输接口,可以通过通信接口603接收数据或者发送数据。

参见图7所示的计算机设备的进一步地的结构示意图,该计算机设备还包括帮助计算机设备内的各个器件之间传输信息的基本输入/输出系统(i/o系统)701、用于存储操作系统702、应用程序703和其他程序模块704的大容量存储设备705。

基本输入/输出系统701包括有用于显示信息的显示器706和用于用户输入信息的诸如鼠标、键盘之类的输入设备707。其中显示器706和输入设备707都通过连接到系统总线600的基本输入/输出系统701连接到处理器601。所述基本输入/输出系统701还可以包括输入输出控制器以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器还提供输出到显示屏、打印机或其他类型的输出设备。

所述大容量存储设备705通过连接到系统总线600的大容量存储控制器(未示出)连接到处理器601。所述大容量存储设备705及其相关联的计算机可读介质为该服务器包提供非易失性存储。也就是说,大容量存储设备705可以包括诸如硬盘或者cd-rom驱动器之类的计算机可读介质(未示出)。

根据本发明的各种实施例,该计算设备包还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即该计算设备可以通过连接在所述系统总线600上的通信接口603连接到网络708,或者说,也可以使用通信接口603来连接到其他类型的网络或远程计算机系统(未示出)。

在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器602,上述指令可由装置的处理器601执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

在一些可能的实施方式中,本发明提供的追踪方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算机设备上运行时,所述程序代码用于使该计算机设备执行本说明书上述描述的根据本发明各种示例性实施方式的追踪方法中的步骤。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由权利要求指出。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1