一种对象检测方法、装置、电子设备及存储介质与流程

文档序号:22183625发布日期:2020-09-11 21:47阅读:141来源:国知局
一种对象检测方法、装置、电子设备及存储介质与流程

本公开涉及追踪技术领域,具体而言,涉及一种对象检测方法、装置、电子设备及存储介质。



背景技术:

随着车辆网的发展,公共交通工具为越来越多的人提供出行方便,在乘车环境中,乘客或者驾驶员通常会携带私人物品,因此在乘车环境中,经常存在乘客丢失个人物品的事件,如何能够有效防止乘车环境中的物品遗失,提高乘车环境下的物品安全,为本公开实施例要解决的问题。



技术实现要素:

本公开实施例至少提供一种对象检测方案。

第一方面,本公开实施例提供了一种对象检测方法,包括:

获取待检测的车舱内图像;在车舱内人员减少时,对所述待检测的车舱内图像进行目标检测,确定所述待检测的车舱内图像中是否存在待检测对象;响应于所述待检测的车舱内图像中存在待检测对象的状态的持续时长超过预设时长,发出提示信息。

本公开实施例中,提供了一种针对车舱场景下的遗留物品检测的方式,通过获取待检测的车舱内图像,这样在车舱内人员减少时,可以对获取的待检测车舱内图像进行目标检测,从而可以确定待检测的车舱内图像中是否存在待检测对象,示例性地,该待检测对象可以为车舱内人员遗失的物品,这样在检测到存在车舱内人员遗失的物品时,可以进行相应提示,从而降低乘车环境中的物品丢失概率,提高乘车环境中的物品安全性。

在一种可能的实施方式中,所述响应于所述待检测的车舱内图像中存在待检测对象的状态的持续时长超过预设时长,发出提示信息,包括:

在减少的车舱内人员为乘客的情况下,响应于所述待检测的车舱内图像中存在待检测对象的状态的持续时长超过第一预设时长,发出第一提示信息,所述第一提示信息用于提示乘客物品遗留;在减少的车舱内人员为驾驶员的情况下,响应于所述待检测的车舱内图像中存在待检测对象的状态的持续时长超过第二预设时长,发出第二提示信息,所述第二提示信息用于提示驾驶员物品遗留。

本公开实施例中,针对不同类型的车舱内人员,在检测到车舱内存在遗留物品时,分别进行提示,从而提高乘车安全。

在一种可能的实施方式中,减少的车舱内人员为驾驶员和乘客,在确定所述待检测的车舱内图像中存在待检测对象后,在发出提示信息之前,所述对象检测方法还包括:

根据所述待检测对象在所述车舱中位置,确定所述待检测对象的归属人员;其中,所述待检测对象的归属人员为驾驶员和/或乘客。

本公开实施例中,可以基于待检测对象在车舱中位置,确定出待检测对象的归属人员,从而便于后续进行分类提示。

在一种可能的实施方式中,对所述待检测的车舱内图像进行目标检测,包括:

对所述待检测的车舱内图像进行特征提取,得到与多个通道中每个通道对应的第一特征图;其中每个通道对应的第一特征图,为将待检测对象在该通道对应的图像特征类别下的特征进行增强处理后的特征图;针对每个所述通道,将该通道对应的第一特征图与其它通道分别对应的第一特征图进行特征信息融合,得到融合后的第二特征图;基于所述融合后的第二特征图,检测所述待检测的车舱内图像中的所述待检测对象。

本公开实施例中,通过特征提取得到的每张第一特征图中包含的待检测对象的特征信息较非待检测对象的特征信息的进行了增强处理,这样能够通过特征信息明显区分待检测对象和待检测的车舱内图像中的背景区域;然后针对每个通道,将该通道对应的第一特征图与其它通道分别对应的第一特征图进行特征信息融合,从而得到特征信息更加全面的待检测对象,然后基于这样的第二特征图完成针对待检测的车舱内图像中待检测对象的检测,即能够准确地检测待检测的车舱内图像中的待检测对象。

在一种可能的实施方式中,所述针对每个所述通道,将该通道对应的第一特征图与其它通道分别对应的第一特征图进行特征信息融合,得到融合后的第二特征图,包括:

针对进行特征信息融合的多个第一特征图,确定所述多个第一特征图所对应的权重矩阵;基于所述权重矩阵,对所述多个第一特征图的特征信息进行加权求和,得到包含各个融合特征信息的第二特征图。

本公开实施例中,通过丰富待检测对象包含的特征信息,以及增加车舱内图像中待检测对象和背景区域的区分度,从而便于后期基于更加丰富且与背景区域区分度较大的特征信息,准确地确定该待检测的车舱内图像中,是否存在待检测对象,以及待检测对象的位置信息。

在一种可能的实施方式中,所述基于所述融合后的第二特征图,检测所述待检测的车舱内图像中的所述待检测对象,包括:

基于所述融合后的第二特征图,确定设定个数的候选区域,每个候选区域包含设定个数的特征点;基于每个候选区域包含的特征点的特征数据,确定该候选区域对应的置信度;每个候选区域对应的置信度用于表征该候选区域中包含所述待检测对象的可信程度;基于每个候选区域对应的置信度以及不同候选区域之间的重叠区域,从所述设定个数的候选区域中筛选出待检测对象对应的检测区域;所述检测区域用于标识所述待检测对象在所述待检测的车舱内图像中的位置。

本公开实施例中,通过的融合后的第二特征图来确定候选区域,因为融合后的第二特征图包含的待检测对象的特征信息与背景区域的特征信息的区分度较大,且包含的待检测对象的特征信息更加丰富,从而基于该融合后的第二特征图,能够准确得到表示待检测区域中待检测对象位置的候选区域以及每个候选区域的置信度,另外这里提出通过考虑候选区域的重叠区域对待检测对象存在的可能位置信息进一步筛选,即能够准确得到该待检测的车舱内图像中是否存在待检测对象以及待检测对象的位置信息。

在一种可能的实施方式中,根据以下步骤获取所述待检测的车舱内图像:

获取待检测的车舱内视频流;从所述待检测的车舱内视频流包含的连续多帧车舱内图像中,间隔提取待检测的车舱内图像。

本公开实施例中,按照间隔提取待检测的车舱内图像的方式,从待检测视频流中得到需要进行检测的待检测的车舱内图像,可以提高检测效率。

在一种可能的实施方式中,对所述待检测的车舱内图像进行目标检测,还包括:

将所述待检测的车舱内视频流中的每个车舱内图像作为待追踪图像,针对每个非首帧待追踪图像,基于该非首帧待追踪图像的前一帧待追踪图像中的所述待检测对象的位置信息以及该非首帧待追踪图像,确定所述待检测对象在该非首帧待追踪图像中的预测位置信息;确定该非首帧待追踪图像是否为检测出待检测对象的待检测的车舱内图像;在确定该非首帧待追踪图像是检测出待检测对象的待检测的车舱内图像时,将检测出的位置信息作为待检测对象在该非首帧待追踪图像中的位置信息;在确定该非首帧待追踪图像不是检测出待检测对象的待检测的车舱内图像时,将确定的预测位置信息作为待检测对象在该非首帧待追踪图像中的位置信息。

本公开实施例中,可以基于非首帧待追踪图像的前一帧待追踪图像中待检测对象的位置信息对该非首帧待追踪图像进行追踪,确定出待检测对象在该非首帧待追踪图像中的预测位置信息,并且在追踪过程中,还可以基于检测出的位置信息调整预测的位置信息,这样,能够提高对待检测对象追踪的效率和准确度。

在一种可能的实施方式中,所述待检测的车舱内图像进行目标检测由神经网络执行;

所述神经网络利用包含了待检测样本对象的车舱内样本图像和未包含待检测样本对象的车舱内样本图像训练得到。

第二方面,本公开实施例提供了一种对象检测装置,包括:

图像获取模块,用于获取待检测的车舱内图像;图像检测模块,用于在车舱内人员减少时,对所述待检测的车舱内图像进行目标检测,确定所述待检测的车舱内图像中是否存在待检测对象;提示模块,用于响应于所述待检测的车舱内图像中存在待检测对象的状态的持续时长超过预设时长,发出提示信息。

在一种可能的实施方式中,所述提示模块在用于响应于所述待检测的车舱内图像中存在待检测对象的状态的持续时长超过预设时长,发出提示信息时,包括:

在减少的车舱内人员为乘客的情况下,响应于所述待检测的车舱内图像中存在待检测对象的状态的持续时长超过第一预设时长,发出第一提示信息,所述第一提示信息用于提示乘客物品遗留;在减少的车舱内人员为驾驶员的情况下,响应于所述待检测的车舱内图像中存在待检测对象的状态的持续时长超过第二预设时长,发出第二提示信息,所述第二提示信息用于提示驾驶员物品遗留。

在一种可能的实施方式中,减少的车舱内人员为驾驶员和乘客,在图像检测模块确定所述待检测的车舱内图像中存在待检测对象后,在提示模块发出提示信息之前,所述图像检测模块还用于:

根据所述待检测对象在所述车舱中位置,确定所述待检测对象的归属人员;其中,所述待检测对象的归属人员为驾驶员和/或乘客。

在一种可能的实施方式中,所述图像检测模块在用于对所述待检测的车舱内图像进行目标检测时,包括:

对所述待检测的车舱内图像进行特征提取,得到与多个通道中每个通道对应的第一特征图;其中每个通道对应的第一特征图,为将待检测对象在该通道对应的图像特征类别下的特征进行增强处理后的特征图;针对每个所述通道,将该通道对应的第一特征图与其它通道分别对应的第一特征图进行特征信息融合,得到融合后的第二特征图;基于所述融合后的第二特征图,检测所述待检测的车舱内图像中的所述待检测对象。

在一种可能的实施方式中,所述图像检测模块在用于针对每个所述通道,将该通道对应的第一特征图与其它通道分别对应的第一特征图进行特征信息融合,得到融合后的第二特征图时,包括:

针对进行特征信息融合的多个第一特征图,确定所述多个第一特征图所对应的权重矩阵;基于所述权重矩阵,对所述多个第一特征图的特征信息进行加权求和,得到包含各个融合特征信息的第二特征图。

在一种可能的实施方式中,所述图像检测模块在用于基于所述融合后的第二特征图,检测所述待检测的车舱内图像中的所述待检测对象时,包括:

基于所述融合后的第二特征图,确定设定个数的候选区域,每个候选区域包含设定个数的特征点;基于每个候选区域包含的特征点的特征数据,确定该候选区域对应的置信度;每个候选区域对应的置信度用于表征该候选区域中包含所述待检测对象的可信程度;基于每个候选区域对应的置信度以及不同候选区域之间的重叠区域,从所述设定个数的候选区域中筛选出待检测对象对应的检测区域;所述检测区域用于标识所述待检测对象在所述待检测的车舱内图像中的位置。

在一种可能的实施方式中,所述图像获取模块用于根据以下步骤获取所述待检测的车舱内图像:

获取待检测的车舱内视频流;从所述待检测的车舱内视频流包含的连续多帧车舱内图像中,间隔提取得到所述待检测的车舱内图像。

在一种可能的实施方式中,所述图像检测模块在用于对所述待检测的车舱内图像进行目标检测时,还包括:

将所述待检测的车舱内视频流中的每个车舱内图像作为待追踪图像,针对每个非首帧待追踪图像,基于该非首帧待追踪图像的前一帧待追踪图像中的所述待检测对象的位置信息以及该非首帧待追踪图像,确定所述待检测对象在该非首帧待追踪图像中的预测位置信息;确定该非首帧待追踪图像是否为检测出待检测对象的待检测的车舱内图像;在确定该非首帧待追踪图像是检测出待检测对象的待检测的车舱内图像时,将检测出的位置信息作为待检测对象在该非首帧待追踪图像中的位置信息;在确定该非首帧待追踪图像不是检测出待检测对象的待检测的车舱内图像时,将确定的预测位置信息作为待检测对象在该非首帧待追踪图像中的位置信息。

在一种可能的实施方式中,所述对象检测装置还包括神经网络训练模块,所述神经网络训练模块用于:

训练对所述待检测的车舱内图像进行目标检测的神经网络,所述神经网络利用包含了待检测样本对象的车舱内样本图像和未包含待检测样本对象的车舱内样本图像训练得到。

第三方面,本公开实施例提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如第一方面所述的对象检测方法的步骤。

第四方面,本公开实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如第一方面所述的对象检测方法的步骤。

为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本公开实施例所提供的一种对象检测方法的流程示意图;

图2示出了本公开实施例所提供的一种对待检测对象进行检测的方法流程图;

图3示出了本公开实施例所提供的一种确定待检测的车舱内图像中待检测对象的检测区域的方法流程图;

图4示出了本公开实施例所提供的一种对待检测对象进行追踪的方法流程图;

图5示出了本公开实施例所提供的一种神经网络中的目标检测网络的训练方法流程图;

图6示出了本公开实施例所提供的一种神经网络中的目标追踪网络的训练方法流程图;

图7示出了本公开实施例所提供的一种对象检测装置的结构示意图图;

图8示出了本公开实施例所提供的一种电子设备的示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

针对一些公共场景中,经常发生遗失物品的现象,比如在乘车环境中,经常存在乘客丢失个人物品的事件,一般当乘客丢失物品后,在想起后才会返回寻找丢失的物品,该过程时间较久,且比较繁琐,如何能够有效防止乘车环境中的物品遗失,提高乘车环境下的物品安全,为本公开实施例要解决的问题。

基于上述研究,本公开提供了一种针对车舱场景下的遗留物品检测的方式,通过获取待检测的车舱内图像,这样在车舱内人员减少时,可以对获取的待检测车舱内图像进行目标检测,从而可以确定待检测的车舱内图像中是否存在待检测对象,示例性地,该待检测对象可以为车舱内人员遗失的物品,这样在检测到存在车舱内人员遗失的物品时,可以进行相应提示,从而降低乘车环境中的物品丢失概率,提高乘车环境中的物品安全性。

为便于对本实施例进行理解,首先对本公开实施例所公开的一种对象检测方法进行详细介绍,本公开实施例所提供的对象检测方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(userequipment,ue)、移动设备、用户终端等。在一些可能的实现方式中,该对象检测方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。

参见图1所示,为本公开实施例提高的对象检测方法的流程图,包括以下s101~s103:

s101,获取待检测的车舱内图像。

其中,该车舱可以为出租车车舱、火车车舱或者飞机车舱等公共交通工具的车舱;待检测的车舱内图像可以根据设置于车舱内固定位置的图像采集设备拍摄得到的待检测的车舱内图像。

s102,在车舱内人员减少时,对待检测的车舱内图像进行目标检测,确定待检测的车舱内图像中是否存在待检测对象。

示例性地,可以根据获取到的待检测的车舱内图像来监测车舱内是否存在人员增加以及是否存在人员减少,当检测到车舱内存在人员减少时,可以对获取到的待检测的车舱内图像进行目标检测,比如检测车舱内是否还存在有减少人员的遗留物品。

示例性地,对待检测的车舱内图像进行目标检测,可以为用于检测预先设置好的容易被乘客或者驾驶员遗失的物品,比如手机、钱包、手包、行李箱等物品。

s103,响应于待检测的车舱内图像中存在待检测对象的状态的持续时长超过预设时长,发出提示信息。

示例性地,当车舱内存在人员减少时,即检测到人员出车舱时,若检测出车舱内仍然存在出车舱人员的遗留物品时,可以进行提示,以对出车舱人员进行提示。

本公开提供了一种针对车舱场景下的遗留物品检测的方式,通过获取待检测的车舱内图像,这样在车舱内人员减少时,可以对获取的待检测车舱内图像进行目标检测,从而可以确定待检测的车舱内图像中是否存在待检测对象,示例性地,该待检测对象可以为车舱内人员遗失的物品,这样在检测到存在车舱内人员遗失的物品时,可以进行相应提示,从而降低乘车环境中的物品丢失概率,提高乘车环境中的物品安全性。

针对上述s103,在响应于待检测的车舱内图像中存在待检测对象的状态的持续时长超过预设时长,发出提示信息时,可以包括:

在减少的车舱内人员为乘客的情况下,响应于待检测的车舱内图像中存在待检测对象的状态的持续时长超过第一预设时长,发出第一提示信息,第一提示信息用于提示乘客物品遗留;

在减少的车舱内人员为驾驶员的情况下,响应于待检测的车舱内图像中存在待检测对象的状态的持续时长超过第二预设时长,发出第二提示信息,第二提示信息用于提示驾驶员物品遗留。

示例性地,这里的第一预设时长和第二预设时长可以相同,也可以不相同,考虑到驾驶员可能仅仅是短暂出车舱,这里的第二预设时长可以大于第一预设时长。

示例性地,第一提示信息与第二提示信息均可以为语言播报,其中第一提示信息用于提示乘客或者驾驶员,第二提示信息用于提示驾驶员。

在一种可能的实施方式中,减少的车舱内人员为驾驶员和乘客,在确定待检测的车舱内图像中存在待检测对象后,在发出提示信息之前,对象检测方法还包括:

根据待检测对象在车舱中位置,确定待检测对象的归属人员;其中,待检测对象的归属人员为驾驶员和/或乘客。

根据获取到的待检测的车舱内图像,可以确定出每个车舱内人员在车舱内的位置,以及该车舱内人员对应的待检测物品,这样可以建立待检测对象与位置的关联关系,以及位置与车舱内人员之间的关联关系,然后进一步可以根据待检测对象在车舱中位置,确定该待检测对象的归属人员。在确定出待检测对象的归属人员之后根据归属人员发出相应的提示信息。

在一种实施方式中,针对上述s102,在对待检测的车舱内图像进行目标检测时,参见图2所示,包括以下步骤s201~s203,其中:

s201,对待检测的车舱内图像进行特征提取,得到与多个通道中每个通道对应的第一特征图;其中每个通道对应的第一特征图,为将待检测对象在该通道对应的图像特征类别下的特征进行增强处理后的特征图。

对待检测的车舱内图像进行特征提取,可以是通过提前训练好的特征提取网络进行特征提取,得到多个预设通道对应的第一特征图,这里每个通道可以理解为对应待检测的车舱内图像的一种图像特征类别,比如对待检测的车舱内图像进行特征提取后,可以得到三个通道分别对应的第一特征图,其中第一个通道可以对应待检测的车舱内图像的纹理特征、第二个通道可以对应待检测的车舱内图像的颜色特征、第三个通道可以对应待检测的车舱内图像的尺寸特征,这样即可以得到待检测的车舱内图像在各个图像特征类别下的特性图。

为了明显地区分待检测对象和车舱内背景,在对待检测的车舱内图像进行特征提取,得到第一特征图的过程中,会对每个通道对应的第一特征图中代表待检测对象的特征信息和代表车舱内背景的特征信息进行区分处理,比如可以对代表待检测对象的特征信息进行增强处理,对代表车舱内背景的特征信息进行弱化处理,或者,可以仅对代表待检测对象的特征信息进行增强处理,或者,可以仅对代表车舱内背景的特征信息进行弱化处理,从而使得得到的每个第一特征图中表示待检测对象的特征信息的强度大于表示车舱内背景的特征信息的强度。

s202,针对每个通道,将该通道对应的第一特征图与其它通道分别对应的第一特征图进行特征信息融合,得到融合后的第二特征图。

因为每个通道趋向表示待检测的车舱内图像在该通道对应的图像特征类别下的特征信息,为了得到特征信息更加完善的特征图,这里针对每个通道,将该通道对应的第一特征图与其它通道分别对应的第一特征图进行特征信息融合,即可以得到包含多种图像特征类别的第二特征图。

这里每个通道对应的第一特征图中的特征信息可以通过该通道对应的第一特征图中的特征数据进行表示,特征信息融合是指通过融合每个第一特征图中的特征数据,得到融合后的第二特征图。

具体如何基于第一特征图进行特征信息融合,得到第二特征图的详细过程将在后文以具体实施例的形式进行详细阐述。

s203,基于融合后的第二特征图,检测待检测的车舱内图像中的待检测对象。

这里基于融合后的第二特征图,检测待检测的车舱内图像中的待检测对象的过程,可以是基于预先训练的神经网络中的目标检测网络,对待检测的车舱内图像中的待检测对象进行检测,即将融合后的第二特征图输入该预先训练的神经网络中的目标检测网络,即可以完成对待检测的车舱内图像中的待检测对象进行检测。

这里检测待检测的车舱内图像中的待检测对象可以是指检测待检测的车舱内图像中是否存在待检测对象,且在确定待检测的车舱内图像中存在待检测对象的情况下,确定待检测对象在该待检测的车舱内图像中的位置信息。

本公开实施例中,通过特征提取得到的第一特征图为针对待检测对象在该通道对应的图像特征类别下的特征进行增强处理后的特征图,即每张第一特征图中包含的待检测对象的特征信息较非待检测对象的特征信息进行了增强处理,这样能够通过特征信息明显区分待检测对象和待检测的车舱内图像中的背景区域;然后针对每个通道,将该通道对应的第一特征图与其它通道分别对应的第一特征图进行特征信息融合,从而得到特征信息更加全面的待检测对象,然后基于这样的第二特征图完成针对待检测的车舱内图像中待检测对象的检测,即能够准确地检测待检测的车舱内图像中的待检测对象。

针对上述s202,在针对每个通道,将该通道对应的第一特征图与其它通道分别对应的第一特征图进行特征信息融合,得到融合后的第二特征图时,可以包括:

(1)针对进行特征信息融合的多个第一特征图,确定多个第一特征图所对应的权重矩阵;

(2)基于权重矩阵,对多个第一特征图的特征信息进行加权求和,得到包含各个融合特征信息的第二特征图。

具体地,对待检测的车舱内图像进行特征提取后,得到大小为h*w*c的第一特征图,其中c表示第一特征图的个数,即待检测的车舱内图像进行特征提取后得到的通道个数,每个通道对应一个第一特征图,h*w表示每个第一特征图的尺寸,且每个第一特征图包含h*w个特征点对应的特征数据。

这里通过对多个第一特征图进行特征信息融合,得到的融合后的第二特征图的大小同样为h*w*c,即同样每个通道对应一个第二特征图,每个第二特征图的尺寸为h*w,第二特征图中任一特征点对应的特征数据是通过每个通道对应的第一特征图中与第二特征图中该任一特征点相同位置的特征点对应的特征数据融合得到的,具体融合方式如下:

这里的权重矩阵包含c个通道分别对应的权重向量,每个通道对应的权重向量中的权重值表示每个第一特征图中的特征数据在确定该通道对应的第二特征图时的权重值。

比如,c等于3,即表示对待检测的车舱内图像进行特征提取后,得到3个通道对应的第一特征图,即得3个第一特征图,每个第一特征图中包含h*w个特征点对应的特征数据,这h*w个特征数据即可以构成h*w维度的特征向量,特征向量中的各个特征数据,即对应第一特征图中各个特征点的特征数据。

这样,在确定每个通道对应的第一特征图的特征向量以及该第一特征图在构成该通道的第二特征图时对应的权重值后,即可以根据该通道对应的权重矩阵,对各个通道对应的第一特征图中的特征数据进行加权求和,得到该通道对应的第二特征图中的特征数据。

下面以一个具体的实施例进行解释,如何通过对每个通道对应的第一特征图进行融合得到融合后的第二特征图:

对待检测的车舱内图像进行特征提取,得到3个通道对应的第一特征图,每个第一特征图的尺寸为h*w,即每个第一特征图包含h*w个特征数据,假设每个第一特征图对应的特征向量构成的特征矩阵为:

其中,(a1a2...ah*w)t可以用于表示第1个通道对应的第一特征图的特征向量;a1表示第1个通道对应的第一特征图中第1个特征点的特征数据,a2表示第1个通道对应的第一特征图中第2个特征点的特征数据;ah*w表示第1个通道对应的第一特征图中第h*w个特征点的特征数据;

(b1b2...bh*w)t可以用于表示第2个通道对应的第一特征图的特征向量;b1表示第2个通道对应的第一特征图中第1个特征点的特征数据;b2表示第2个通道对应的第一特征图中第2个特征点的特征数据;bh*w表示第2个通道对应的第一特征图中第h*w个特征点的特征数据;

(d1d2...dh*w)t可以用于表示第3个通道对应的第一特征图的特征向量;d1表示第3个通道对应的第一特征图中第1个特征点的特征数据,d2表示第3个通道对应的第一特征图中第2个特征点的特征数据,dh*w表示第3个通道对应的第一特征图中第h*w个特征点的特征数据。

假设3个第一特征图所对应的权重矩阵为:

其中,(m1m2m3)t表示确定第1个通道对应的第二特征图时,不同第一特征图各自对应的权重向量,m1表示第1个通道对应的第一特征图中各个特征数据在确定第1个通道对应的第二特征图时的权重值;m2表示第2个通道对应的第一特征图中各个特征数据在确定第1个通道对应的第二特征图时的权重值;m3表示第3个通道对应的第一特征图中各个特征数据在确定第1个通道对应的第二特征图时的权重值。

其中,(k1k2k3)t表示确定第2个通道对应的第二特征图时,不同第一特征图各自对应的权重向量,k1表示第1个通道对应的第一特征图中各个特征数据在确定第2个通道对应的第二特征图时的权重值;k2表示第2个通道对应的第一特征图中各个特征数据在确定第2个通道对应的第二特征图时的权重值;k3表示第3个通道对应的第一特征图中各个特征数据在确定第2个通道对应的第二特征图时的权重值。

其中,(l1l2l3)t表示确定第3个通道对应的第二特征图时,不同第一特征图各自对应的权重向量,l1表示第1个通道对应的第一特征图中各个特征数据在确定第3个通道对应的第二特征图时的权重值;l2表示第2个通道对应的第一特征图中各个特征数据在确定第3个通道对应的第二特征图时的权重值;l3表示第3个通道对应的第一特征图中各个特征数据在确定第3个通道对应的第二特征图时的权重值。

具体地,在基于权重矩阵,对多个第一特征图的特征信息进行加权求和时,确定第1个通道对应的第二特征图时,可以按照以下公式(1)确定:

t1=(a1a2...ah*w)t*m1+(b1b2...bh*w)t*m2+(d1d2...dh*w)t*m3(1)

其中,第1个通道对应的第二特征图中第1个特征点的特征数据即为a1m1+b1m2+d1m3;第1个通道对应的第二特征图中第2个特征点的特征数据即为a2m1+b2m2+d3m3;第1个通道对应的第二特征图中第h*w个特征点的特征数据即为ah*wm1+bh*wm2+dh*wm3。

同理,可以按照相同的方式确定第2个通道对应的第二特征图以及第3个通道对应的第二特征图。

上述确定融合后的第二特征图的方式,通过确定第一特征图所对应的权重矩阵,得到包含各个通道对应的第二特征图,这样每个第二特征图均是通过多个通道对应的图像特征类别下的特征进行融合得到的,若待检测的车舱内图像中包含待检测对象,则融合后的第二特征图中能够包含待检测对象更加丰富的特征信息,又因为第一特征图中针对检测对象的特征进行了增强处理,则基于第一特征图得到的融合后的第二特征图中待检测对象的特征信息和背景区域的特征信息之间的区分度也较大,从而便于后期基于更加丰富且与背景区域区分度较大的特征信息,准确地确定该待检测的车舱内图像中,是否存在待检测对象,以及待检测对象的位置信息。

在得到融合后的第二特征图后,就可以根据融合后的第二特征图来检测待检测的车舱内图像中的待检测对象,具体地,在基于融合后的第二特征图,检测待检测的车舱内图像中的待检测对象时,如图3所示,可以包括以下步骤s301~s303:

s301,基于融合后的第二特征图,确定设定个数的候选区域,每个候选区域包含设定个数的特征点。

这里候选区域是指可能包含待检测对象的区域,这里候选区域的个数和每个候选区域中包含的特征点的设定个数可以为预先训练的神经网络中的候选区域提取网络来确定的。

具体地,候选区域的设定个数基于目标检测网络的测试精度考虑,比如在网络训练过程中,针对大量待检测样本图像分别对应的融合后的第二样本特征图,不断调整候选区域的个数,然后在测试过程中,对训练的目标检测网络进行测试,通过不同候选区域对应的测试精度,确定候选区域的设定个数。

这里每个候选区域包含的设定个数,可以基于目标检测网络的测试速度和测试精度综合考虑来提前确定,比如在网络训练过程中,首先保持候选区域的个数不变,不断调整每个候选区域包含的特征点的个数,然后在测试过程中,对目标检测网络进行测试,综合考虑测试速度以及测试精度,确定每个候选区域包含的特征点的设定个数。

s302,基于每个候选区域包含的特征点的特征数据,确定该候选区域对应的置信度;每个候选区域对应的置信度用于表征该候选区域中包含待检测对象的可信程度。

每个候选区域中包含的特征点均对应有特征数据,根据这些特征数据,可以确定该候选区域包含待检测对象的可信程度,具体地,针对每个候选区域对应的置信度,可以通过预先训练的神经网络中的目标检测网络来确定,即将该候选区域中的特征数据输入预先训练的神经网络中的目标检测网络,即可以得到该候选区域对应的置信度。

s303,基于每个候选区域对应的置信度以及不同候选区域之间的重叠区域,从设定个数的候选区域中筛选出待检测对象对应的检测区域;检测区域用于标识待检测对象在待检测的车舱内图像中的位置。

具体地,在基于每个候选区域对应的置信度以及不同候选区域之间的重叠区域,从设定个数的候选区域中筛选出待检测对象对应的检测区域时,这里可以先从设定个数的候选区域中筛选出置信度排序前设定个数的目标候选区域,然后可以基于预先设置置信度阈值以及不同候选区域之间的重叠区域,再确定待检测对象对应的检测区域。

比如,认为对应置信度高于该置信度阈值的目标候选区域为待检测对象对应的检测区域的概率较大,且综合考虑候选区域之间存在重叠的候选区域的情况下,若发生重叠的候选区域的重叠面积大于设定面积阈值,可以说明发生重叠的候选区域包含的待检测对象可能为同一个待检测对象,基于该考虑,进一步在目标候选区域中选择出待检测对象对应的检测区域,比如,可以在目标候选区域中保留置信度高于置信度阈值的目标候选区域,且在发生重叠区域的目标候选区域中保留置信度最高的目标候选区域,即得到待检测对象对应的检测区域。

以上在执行从设定个数的候选区域中筛选出置信度排序前设定个数的目标候选区域的过程中,可以根据目标检测网络来确定的,具体可以基于进行目标检测网络的测试速度和测试精度综合考虑来提前确定,比如在网络训练过程中,不断调整目标候选区域的个数,然后在测试过程中,对目标检测网络进行测试,综合考虑测试速度以及测试精度,确定这里目标候选区域的设定个数。

当然,若这里的每个候选区域对应的置信度均小于设定阈值,则可以说明该待检测的车舱内图像中不存在待检测对象,该情况本公开不做详细阐述。

按照上述s301~s303可以获取到待检测的车舱内图像中包含待检测对象的检测区域,即得到待检测对象在待检测的车舱内图像中的位置,这里通过的融合后的第二特征图来确定候选区域,因为融合后的第二特征图包含的待检测对象的特征信息与背景区域的特征信息的区分度较大,且包含的待检测对象的特征信息更加丰富,从而基于该融合后的第二特征图,能够准确得到表示待检测区域中待检测对象位置的候选区域以及每个候选区域的置信度,另外这里提出通过考虑候选区域的重叠区域对待检测对象存在的可能位置信息进一步筛选,即能够准确得到该待检测的车舱内图像中是否存在待检测对象以及待检测对象的位置信息。

因为本公开实施例提出的对象检测方法在很多应用场景下,需要不断获取待检测的车舱内图像,并对待检测的车舱内图像进行检测,比如针对交通运输场景下的遗留物品进行检测的情况,则可以通过在车内设置图像采集部件,比如在车内安装摄像机,且令该摄像机朝向设定位置进行拍摄,此时,可以根据以下步骤获取待检测的车舱内图像:

(1)获取待检测的车舱内视频流;

(2)从待检测的车舱内视频流包含的连续多帧车舱内图像中,间隔提取得到待检测的车舱内图像。

示例性地,在针对交通运输场景下的遗留物品进行检测时,这里的待检测的车舱内视频流可以为图像采集部件针对车内设定位置拍摄的视频流,每秒采集的视频流可以包含连续多帧车舱内图像,考虑到相邻两帧图像之间的间隔时间较短,因此相邻两帧车舱内图像的相似度较高,为了提高检测效率,这里提出可以在连续多帧车舱内图像中进行间隔提取,得到上述提到的待检测的车舱内图像,比如,若在某个时间段内得到的待检测的车舱内视频流中包含1000帧图像,则按照每间隔一帧提取一次,可以得到500帧待检测的车舱内图像,这里针对这500帧待检测的车舱内图像进行检测,即可以完成车舱内的遗留物品进行检测的目的。

这里按照间隔方式提取待检测的车舱内图像,从待检测的车舱内视频流中得到需要进行检测的待检测的车舱内图像,可以提高检测效率。

在另一种实施方式中,针对上述s102,在对所述待检测的车舱内图像进行目标检测时,还可以对待检测对象在每帧车舱内图像中的位置信息进行追踪,如图4所示,还包括以下s401~s404:

s401,将待检测的车舱内视频流中的每个车舱内图像作为待追踪图像,针对每个非首帧待追踪图像,基于该非首帧待追踪图像的前一帧待追踪图像中的待检测对象的位置信息以及该非首帧待追踪图像,确定待检测对象在该非首帧待追踪图像中的预测位置信息。

在对待检测对象进行追踪时,可以从待检测的车舱内视频流中的第二帧车舱内图像开始,依次对待检测对象进行追踪,第一帧车舱内图像中待检测对象的位置信息可以通过上述目标检测方式进行确定,比如按照上述方式,对间隔提取车舱内图像进行了对象检测,分别确定出了待检测对象在间隔提取的车舱内图像中的位置信息,示例性地,比如对第1帧车舱内图像、第3帧车舱内图像、第5帧车舱内图像等单数帧车舱内图像进行了目标检测,在追踪待检测对象在第2帧车舱内图像中的位置信息时,可以基于第1帧车舱内图像中的待检测对象的位置信息以及该第2帧车舱内图像,确定待检测对象在第2帧车舱内图像中的预测位置信息。

具体在对待检测对象进行追踪时,可以基于预先训练的神经网络中的目标追踪网络来进行追踪,比如针对第1帧待追踪图像和第2帧待追踪图像,根据待检测对象在该第1帧待追踪图像中的检测区域,以及该检测区域中包含的特征点的特征数据,这里的检测区域具有对应的坐标信息,然后将该检测区域、该检测区域中包含的特征点的特征数据以及第2帧待追踪图像输入目标追踪网络中,即可以基于待检测对象在第1帧待追踪图像中的检测区域对应的坐标信息,在第2帧待追踪图像中与该坐标信息对应的局部区域内寻找是否存在与该检测区域中包含的特征点的特征数据相似度超过阈值的检测区域,若有,即可以确定第2帧待追踪图像包含第1帧待追踪图像中的待检测对象,且得到第1帧待追踪图像中的待检测对象在第2帧待追踪图像中的位置信息,即完成了对待检测对象的追踪。

当然,若第2帧待追踪图像中与该坐标信息对应的局部区域内不存在与该检测区域中包含的特征点的特征数据相似度超过阈值的检测区域,则可以说明第2帧待追踪图像中不包含第1帧待追踪图像中的待检测对象,可以确定该待检测对象发生了位置移动。

s402,确定该非首帧待追踪图像是否为检测出待检测对象的待检测的车舱内图像。

在得到该非首帧待追踪图像中包含的待检测对象的预测位置信息后,可以基于待检测对象在该非首帧待追踪图像中的位置信息,预测该待检测对象在下一帧待追踪图像中的位置信息。

在此之前,可以先确定出该非首帧待追踪图像是否为检测出待检测对象的待检测的车舱内图像,以便考虑是否基于检测出的待检测对象在该非首帧待追踪图像中的位置信息对该待检测对象在该非首帧待追踪图像中的预测位置信息进行修正,从而基于修正后的位置信息,追踪待检测对象在下一帧待追踪图像中的位置。

s403,在确定该非首帧待追踪图像是检测出待检测对象的待检测的车舱内图像时,将检测出的位置信息作为待检测对象在该非首帧待追踪图像中的位置信息。

将检测出的位置信息作为待检测对象在该非首帧待追踪图像中的位置信息,即完成了对该待检测对象在该非首帧待追踪图像中的预测位置信息的修正,后续在基于该待检测对象在该非首帧待追踪图像中的位置信息,对该待检测对象进行追踪时,能够更加准确。

s404,在确定该非首帧待追踪图像不是检测出待检测对象的待检测的车舱内图像时,将确定的预测位置信息作为待检测对象在该非首帧待追踪图像中的位置信息。

若该非首帧待追踪图像不是检测出待检测对象的待检测的车舱内图像,此时可以基于将待检测对象在该非首帧待追踪图像中的预测位置信息,对该待检测对象在下一帧待追踪图像中的位置进行继续追踪,该方式可以估算出每个时刻待检测对象在车舱内的位置,从而提高追踪效率。

本公开实施例中,可以基于非首帧待追踪图像的前一帧待追踪图像中待检测对象的位置信息对该非首帧待追踪图像进行追踪,确定出待检测对象在该非首帧待追踪图像中的预测位置信息,并且在追踪过程中,还可以基于检测出的位置信息调整预测的位置信息,这样,能够提高对待检测对象追踪的效率和准确度。

在一种实施方式中,本公开实施例提出的对待检测的车舱内图像进行目标检测由神经网络执行,这里的神经网络利用包含了待检测样本对象的车舱内图像和未包含待检测样本对象的车舱内样本图像训练得到。

示例性地,神经网络中进行目标检测的网络可以按照以下方式训练得到,如图5所示,具体包括s501~s505:

s501,获取待检测的车舱内样本图像。

这里的待检测的车舱内样本图像即包括包含待检测样本对象的车舱内样本图像,可以记为正样本图像,以及包括未包含待检测样本对象的车舱内样本图像,可以记录为负样本图像。

考虑到针对车内场景下的物品检测时,遗留物品在车舱内样本图像中的形貌可能为各种色块,比如手机、行李箱等可以通过矩形色块表示,水杯可以通过圆柱形色块进行表示,为了使得进行神经网络能够更好地识别出哪些是待检测对象,哪些是车内背景,比如车座、窗户等背景,这里可以在车舱内样本图像中加入一些非待检测物品的随机色块,用以表示非待检测对象,通过训练神经网络不断对真实的待检测对象以及对非真实的随机色块以及车内背景进行区分,从而得到准确度较高的神经网络。

s502,对待检测的车舱内样本图像进行特征提取,得到与多个通道中每个通道对应的第一样本特征图;其中每个通道对应的第一样本特征图,为将待检测样本对象在该通道对应的图像特征类别下的特征进行增强处理后的样本特征图。

这里对待检测样本图像进行特征提取,得到与多个通道中每个通道对应的第一样本特征图的过程,与上文提到的对待检测的车舱内图像进行特征提取,得到与多个通道中每个通道对应的第一特征图的过程相似,在此不再赘述。

s503,针对每个通道,将该通道对应的第一样本特征图与其它通道分别对应的第一样本特征图进行特征信息融合,得到融合后的第二样本特征图。

这里基于第一样本特征图,得到融合后的第二样本特征图的过程,与上文提到的基于第一特征图,得到融合后的第二特征图的过程相似,在此不再赘述。

s504,基于融合后的第二样本特征图,预测待检测的车舱内样本图像中的待检测样本对象。

这里基于融合后的第二样本特征图,预存车舱内样本图像中的待检测样本对象,与上文提到的基于融合后的第二特征图,检测待检测的车舱内图像中的待检测对象的过程相似,在此不再赘述。

s505,基于预测出的待检测的车舱内样本图像中的待检测样本对象、包含待检测样本的待检测的车舱内样本图像中和不包含待检测样本的待检测的车舱内样本图像,对神经网络中的网络参数值进行调整。

这里通过预测出的待检测的车舱内样本图像中的待检测样本对象的位置信息、包含待检测样本的待检测的车舱内样本图像和不包含待检测样本的待检测的车舱内样本图像,来确定预测出的待检测的车舱内样本图像中的待检测样本对象的位置信息的损失值,通过损失值来对神经网络中的网络参数值进行调整,经过多次训练后,比如使得损失值小于设定阈值时,即可以停止训练,从而得到训练完成的神经网络。

另外,针对上文提到的对待检测图像进行追踪的过程,本公开实施例还包括对神经网络中的目标追踪网络进行训练的过程,这里可以通过待检测样本对象、包含待检测样本对象的待追踪样本图像和未包含待检测样本对象的待追踪样本图像训练得到。

这里的待检测样本对象即可以指需要进行追踪的样本对象,比如针对车内场景下的物品检测时,这里的待检测样本对象即可以为各种车内场景下的乘客物品。

示例性地,神经网络中的目标追踪网络可以按照以下方式训练得到,如图6所示,具体包括s601~s603:

s601,获取待追踪样本图像以及待检测样本对象对应的待检测样本对象信息。

这里的待追踪样本图像即可以指需要对待检测样本对象进行追踪的样本图像,这里的待追踪样本图像可以包括包含待检测样本对象的正样本图像和不包含待检测样本对象的负样本图像。

在对神经网络中的目标追踪网络进行训练时,可以将待检测样本对象的检测区域图像以及待追踪样本图像同时输入进行神经网络,该待检测样本对象的检测区域图像包含待检测样本对象对应的待检测样本对象信息,即可以包括待检测对象的检测区域,以及该检测区域中包含的特征点的特征数据。

当然,同样针对车舱内场景下的物品检测时,为了使得进行神经网络能够更好地识别出哪些是待检测对象,哪些是车内背景,比如车座、窗户等背景,这里可以在待追踪样本图像中加入一些非待检测对象的随机色块,用以表示非待检测对象,通过训练神经网络不断对真实的待检测对象以及对非真实的随机色块以及车内背景进行区分,从而得到准确的进行目标追踪的神经网络。

s602,基于待检测样本对象信息和待追踪样本图像,对待检测样本对象在样本图像中的位置进行追踪,预测待检测样本对象在样本图像中的位置信息。

具体地,若针对同一区域连续获取的样本图像中的待检测样本对象进行追踪时,可以先基于待检测样本对象信息中待检测样本对象对应的检测区域,确定该待检测样本对象在待追踪样本图像中的局部区域,这里的局部区域与待检测样本对象对应的检测区域接近,从而可以在局部区域中基于特征数据查出待检测样本对象,从而预测出待检测样本对象在待追踪样本图像中的位置信息。

s603,基于预测的待检测样本对象在待追踪样本图像中的位置信息、包含待检测样本对象的待追踪样本图像和未包含待检测样本对象的待追踪样本图像,对进行神经网络中的网络参数值进行调整。

这里可以通过预测出的待检测样本对象在待追踪样本图像中的位置信息,包含待检测样本对象的待追踪样本图像和未包含待检测样本对象的待追踪样本图像,来确定待追踪样本图像中的待检测样本对象的位置信息的损失值,经过多次训练后,通过损失值来对神经网络中的网络参数值进行调整,比如使得损失值小于设定阈值时,即可以停止训练,从而得到神经网络的目标追踪网络。

本公开实施例提供的神经网络的目标追踪网络的训练过程,通过获取待追踪样本图像以及待检测样本对象对应的待检测样本对象信息,对待检测样本对象在待追踪样本图像中的位置进行追踪,从而快速确定待检测样本对象在待追踪样本图像中的位置,然后通过预测的待检测样本对象在待追踪样本图像中的位置信息、包含待检测样本对象的待追踪样本图像和未包含待检测样本对象的待追踪样本图像,对神经网络的网络参数值进行调整,从而得到准确度较高的神经网络,基于该准确度较高的神经网络即可以对待检测对象进行准确追踪。

本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

基于同一技术构思,本公开实施例中还提供了与对象检测方法对应的对象检测装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述对象检测方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。

参照图7所示,为本公开实施例,提供的一种对象检测装置700的示意图,该对象检测装置700包括:图像获取模块701、图像检测模块702、提示模块703。

图像获取模块701,用于获取待检测的车舱内图像;

图像检测模块702,用于在车舱内人员减少时,对待检测的车舱内图像进行目标检测,确定待检测的车舱内图像中是否存在待检测对象;

提示模块703,用于响应于待检测的车舱内图像中存在待检测对象的状态的持续时长超过预设时长,发出提示信息。

在一种可能的实施方式中,提示模块703在用于响应于待检测的车舱内图像中存在待检测对象的状态的持续时长超过预设时长,发出提示信息时,包括:

在减少的车舱内人员为乘客的情况下,响应于待检测的车舱内图像中存在待检测对象的状态的持续时长超过第一预设时长,发出第一提示信息,第一提示信息用于提示乘客物品遗留;

在减少的车舱内人员为驾驶员的情况下,响应于待检测的车舱内图像中存在待检测对象的状态的持续时长超过第二预设时长,发出第二提示信息,第二提示信息用于提示驾驶员物品遗留。

在一种可能的实施方式中,减少的车舱内人员为驾驶员和乘客,在图像检测模块702确定待检测的车舱内图像中存在待检测对象后,在提示模块703发出提示信息之前,图像检测模块702还用于:

根据待检测对象在车舱中位置,确定待检测对象的归属人员;其中,待检测对象的归属人员为驾驶员和/或乘客。

在一种可能的实施方式中,图像检测模块702在用于对待检测的车舱内图像进行目标检测时,包括:

对待检测的车舱内图像进行特征提取,得到与多个通道中每个通道对应的第一特征图;其中每个通道对应的第一特征图,为将待检测对象在该通道对应的图像特征类别下的特征进行增强处理后的特征图;

针对每个通道,将该通道对应的第一特征图与其它通道分别对应的第一特征图进行特征信息融合,得到融合后的第二特征图;

基于融合后的第二特征图,检测待检测的车舱内图像中的待检测对象。

在一种可能的实施方式中,图像检测模块702在用于针对每个通道,将该通道对应的第一特征图与其它通道分别对应的第一特征图进行特征信息融合,得到融合后的第二特征图时,包括:

针对进行特征信息融合的多个第一特征图,确定多个第一特征图所对应的权重矩阵;

基于权重矩阵,对多个第一特征图的特征信息进行加权求和,得到包含各个融合特征信息的第二特征图。

在一种可能的实施方式中,图像检测模块702在用于基于融合后的第二特征图,检测待检测的车舱内图像中的待检测对象时,包括:

基于融合后的第二特征图,确定设定个数的候选区域,每个候选区域包含设定个数的特征点;

基于每个候选区域包含的特征点的特征数据,确定该候选区域对应的置信度;每个候选区域对应的置信度用于表征该候选区域中包含待检测对象的可信程度;

基于每个候选区域对应的置信度以及不同候选区域之间的重叠区域,从设定个数的候选区域中筛选出待检测对象对应的检测区域;检测区域用于标识待检测对象在待检测的车舱内图像中的位置。

在一种可能的实施方式中,图像获取模块701用于根据以下步骤获取待检测的车舱内图像:

获取待检测的车舱内视频流;

从待检测的车舱内视频流包含的连续多帧车舱内图像中,间隔提取得到待检测的车舱内图像。

在一种可能的实施方式中,图像检测模块在用于对待检测的车舱内图像进行目标检测时,还包括:

将待检测的车舱内视频流中的每个车舱内图像作为待追踪图像,针对每个非首帧待追踪图像,基于该非首帧待追踪图像的前一帧待追踪图像中的待检测对象的位置信息以及该非首帧待追踪图像,确定待检测对象在该非首帧待追踪图像中的预测位置信息;

确定该非首帧待追踪图像是否为检测出待检测对象的待检测的车舱内图像;

在确定该非首帧待追踪图像是检测出待检测对象的待检测的车舱内图像时,将检测出的位置信息作为待检测对象在该非首帧待追踪图像中的位置信息;

在确定该非首帧待追踪图像不是检测出待检测对象的待检测的车舱内图像时,将确定的预测位置信息作为待检测对象在该非首帧待追踪图像中的位置信息。

在一种可能的实施方式中,对象检测装置还包括神经网络训练模块704,神经网络训练模块704用于:

训练对待检测的车舱内图像进行目标检测的神经网络,神经网络利用包含了待检测样本对象的车舱内样本图像和未包含待检测样本对象的车舱内样本图像训练得到。

对应于图1中的对象检测方法,本公开实施例还提供了一种电子设备800,如图8所示,为本公开实施例提供的电子设备800结构示意图,包括:

处理器81、存储器82、和总线83;存储器82用于存储执行指令,包括内存821和外部存储器822;这里的内存821也称内存储器,用于暂时存放处理器81中的运算数据,以及与硬盘等外部存储器822交换的数据,处理器81通过内存821与外部存储器822进行数据交换,当电子设备800运行时,处理器81与存储器82之间通过总线83通信,使得处理器81执行以下指令:获取待检测的车舱内图像;在车舱内人员减少时,对待检测的车舱内图像进行目标检测,确定待检测的车舱内图像中是否存在待检测对象;响应于待检测的车舱内图像中存在待检测对象的状态的持续时长超过预设时长,发出提示信息。

本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中的对象检测方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。

本公开实施例所提供的对象检测方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行上述方法实施例中的对象检测方法的步骤,具体可参见上述方法实施例,在此不再赘述。

本公开实施例还提供一种计算机程序,该计算机程序被处理器执行时实现前述实施例的任意一种方法。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(softwaredevelopmentkit,sdk)等等。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1