本技术涉及计算机,尤其涉及目标检测方法、装置、设备、存储介质及程序产品。
背景技术:
1、在计算机视觉众多的技术领域中,目标检测(object detection)是一项基础的任务,图像分割、关键点检测等通常都要依赖于目标检测。在目标检测系统中,非极大值抑制(non maximum suppression,nms)算法用于抑制相邻的检测结果,以去除重复的检测框。常用的nms算法的流程是:获取指定图像中各个检测框为目标对象的检测框的置信度;确定置信度最高的目标检测框,将与目标检测框的重叠度(intersection over union,iou)高于预设阈值的检测框确定为目标检测框的重复检测框,并删除该重复检测框,预设阈值可以为0.5。
2、在目标对象分布密集的情况下,极有可能存在某个真实的目标对象的检测框与目标检测框的iou较高,但是该nms算法会导致真实目标对象的检测框被错误的删除。另外,与目标检测框的iou较低的检测框也有可能是重复检测框,可是通过上述nms算法无法将该检测框识别出来,也就是说,现有的nms算法无法抑制iou小于预设阈值的误检测结果。由此可知,现有的目标检测的准确性较低。
技术实现思路
1、本技术实施例提供了目标检测方法、装置、设备、存储介质及程序产品,能够有效提高目标检测的准确性。
2、一方面,本技术实施例提供一种目标检测方法,该方法包括:
3、获取目标图像的目标检测框和至少一个候选检测框,所述目标检测框和所述至少一个候选检测框是对所述目标图像进行目标检测得到的,所述目标检测框的置信度高于任一候选检测框的置信度,所述置信度用于指示相应检测框为目标对象的检测框的概率;
4、对所述目标检测框对应的局部图像进行特征提取,得到所述目标检测框的第一特征向量,并对各个候选检测框对应的局部图像进行特征提取,得到所述各个候选检测框的第二特征向量;
5、以所述第一特征向量为聚类中心,基于所述第一特征向量和至少一个第二特征向量之间的差异,对所述至少一个候选检测框进行聚类,得到各个候选检测框与所述目标检测框属于同一聚类的概率;
6、将与所述目标检测框属于同一聚类的概率小于或等于预设阈值的候选检测框,以及所述目标检测框,识别为所述目标图像中目标对象的检测框。
7、在一个实施例中,所述以所述第一特征向量为聚类中心,基于所述第一特征向量和至少一个第二特征向量之间的差异,对所述至少一个候选检测框进行聚类,得到各个候选检测框与所述目标检测框属于同一聚类的概率,包括:
8、获取所述第一特征向量和各个第二特征向量之间的特征方差;
9、以所述第一特征向量为聚类中心,基于各个特征方差,对所述至少一个候选检测框进行聚类,得到所述各个候选检测框与所述目标检测框属于同一聚类的概率。
10、在一个实施例中,所述将与所述目标检测框属于同一聚类的概率小于或等于预设阈值的候选检测框,以及所述目标检测框,识别为所述目标图像中目标对象的检测框,包括:
11、确定与所述目标检测框属于同一聚类的概率小于或等于预设阈值的候选检测框;
12、在确定的候选检测框中选取置信度最高的候选检测框;
13、将选取的候选检测框作为所述目标检测框,并将所述确定的候选检测框中除所述目标检测框以外的候选检测框作为所述至少一个候选检测框,直至与所述目标检测框属于同一聚类的概率小于或等于预设阈值的候选检测框的数量小于或者等于1;
14、将数量小于或者等于1的候选检测框,以及各个目标检测框,识别为所述目标图像中目标对象的检测框。
15、在一个实施例中,所述获取目标图像的目标检测框和至少一个候选检测框,包括:
16、对所述目标图像进行目标检测,得到多个初始检测框,以及各个初始检测框的置信度;
17、将所述多个初始检测框中置信度最高的初始检测框作为所述目标检测框;
18、将所述多个初始检测框中除所述目标检测框以外的初始检测框作为所述至少一个候选检测框。
19、在一个实施例中,所述方法还包括:
20、将与所述目标检测框属于同一聚类的概率大于所述预设阈值的候选检测框,识别为所述目标检测框的重复检测框;
21、删除所述重复检测框;
22、在所述目标图像中显示所述目标检测框,以及所述至少一个候选检测框中除所述重复检测框以外的检测框。
23、在一个实施例中,所述各个候选检测框与所述目标检测框属于同一聚类的概率是通过聚类模型得到的;所述方法还包括:
24、获取训练样本,所述训练样本包括训练图像中训练对象的目标检测框,以及与所述训练对象的目标检测框的重叠度最高的候选检测框;
25、调用初始聚类模型,对所述训练对象的目标检测框对应的局部图像进行特征提取,得到所述训练对象的目标检测框的第一特征向量,并对所述训练对象的候选检测框对应的局部图像进行特征提取,得到所述训练对象的候选检测框的第二特征向量;
26、以所述训练对象的目标检测框的第一特征向量为聚类中心,按照所述训练对象的目标检测框的第一特征向量和所述训练对象的候选检测框的第二特征向量满足高斯分布的方向,对所述初始聚类模型进行训练,得到所述聚类模型。
27、另一方面,本技术实施例提供了一种目标检测装置,该目标检测装置包括:
28、获取单元,用于获取目标图像的目标检测框和至少一个候选检测框,所述目标检测框和所述至少一个候选检测框是对所述目标图像进行目标检测得到的,所述目标检测框的置信度高于任一候选检测框的置信度,所述置信度用于指示相应检测框为目标对象的检测框的概率;
29、特征提取单元,用于对所述目标检测框对应的局部图像进行特征提取,得到所述目标检测框的第一特征向量,并对各个候选检测框对应的局部图像进行特征提取,得到所述各个候选检测框的第二特征向量;
30、聚类单元,用于以所述第一特征向量为聚类中心,基于所述第一特征向量和至少一个第二特征向量之间的差异,对所述至少一个候选检测框进行聚类,得到各个候选检测框与所述目标检测框属于同一聚类的概率;
31、识别单元,用于将与所述目标检测框属于同一聚类的概率小于或等于预设阈值的候选检测框,以及所述目标检测框,识别为所述目标图像中目标对象的检测框。
32、另一方面,本技术实施例提供一种计算机设备,包括处理器、存储装置和通信接口,处理器、存储装置和通信接口相互连接,其中,存储装置用于存储支持计算机设备执行上述方法的计算机程序,计算机程序包括程序指令,处理器被配置用于调用程序指令,执行如下步骤:
33、获取目标图像的目标检测框和至少一个候选检测框,所述目标检测框和所述至少一个候选检测框是对所述目标图像进行目标检测得到的,所述目标检测框的置信度高于任一候选检测框的置信度,所述置信度用于指示相应检测框为目标对象的检测框的概率;
34、对所述目标检测框对应的局部图像进行特征提取,得到所述目标检测框的第一特征向量,并对各个候选检测框对应的局部图像进行特征提取,得到所述各个候选检测框的第二特征向量;
35、以所述第一特征向量为聚类中心,基于所述第一特征向量和至少一个第二特征向量之间的差异,对所述至少一个候选检测框进行聚类,得到各个候选检测框与所述目标检测框属于同一聚类的概率;
36、将与所述目标检测框属于同一聚类的概率小于或等于预设阈值的候选检测框,以及所述目标检测框,识别为所述目标图像中目标对象的检测框。
37、另一方面,本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序包括程序指令,程序指令当被处理器执行时使处理器执行上述任一方面所述的目标检测方法。
38、另一方面,本技术实施例提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序适于由处理器加载并执行上述任一方面所述的目标检测方法。
39、本技术实施例中,即使在目标对象分布密集的情况下,置信度最高的目标检测框对应的第一特征向量,和与目标检测框不重复的任一候选检测框(即该候选检测框不是目标检测框的重复检测框)对应的第二特征向量之间的差异较大,那么该候选检测框与目标检测框属于同一聚类的概率就会较小。基于此,本技术实施例将与目标检测框属于同一聚类的概率小于或等于预设阈值的候选检测框,以及目标检测框,识别为目标图像中目标对象的检测框,不会导致真实目标的检测框被错误的删除。另外,即使置信度最高的目标检测框与某个候选检测框的iou小于预设阈值,但是在该候选检测框属于目标检测框的重复检测框的情况下,目标检测框对应的第一特征向量,和该候选检测框对应的第二特征向量之间的差异较小,那么该候选检测框与目标检测框属于同一聚类的概率就会较大,因此通过本技术实施例会将该候选检测框识别为目标检测框的重复检测框,即不将该候选检测框识别为目标图像中目标对象的检测框,也就是说,本技术实施例可以抑制iou小于预设阈值的误检测结果。通过上述分析可知,本技术实施例可有效提高目标检测的准确性。