一种目标检测方法、装置及设备与流程

文档序号:30424928发布日期:2022-06-15 14:39阅读:100来源:国知局
一种目标检测方法、装置及设备与流程

1.本技术涉及图像处理领域,具体涉及一种目标检测方法、装置及设备。


背景技术:

2.目标检测技术是计算机视觉领域的基础问题之一,目的是识别图像中的特定类别的目标对象,并标定出各个特定类别目标对象在图像中的位置。该技术在行人识别、车牌识别、无人驾驶、瑕疵检测等领域都有重要的应用价值和研究价值。随着深度学习技术的发展,目标检测技术与卷积神经网络的结合愈发紧密,目标检测算法的精度和速度相较以前都有了较大的提升。
3.基于深度学习的目标检测算法往往需要大量匹配实际情况的训练数据,还需要耗费大量的算力资源和时间来训练网络参数,才能在实际应用中取得较好的检测效果。但是,目前目标检测网络通常会存在目标尺度不匹配的问题,造成目标检测结果不准确。


技术实现要素:

4.有鉴于此,本技术实施例提供一种目标检测方法、装置及设备,以解决目标检测结果不准确的技术问题。
5.为解决上述问题,本技术实施例提供的技术方案如下:
6.一种目标检测方法,所述方法包括:
7.将待检测图像输入目标检测网络,得到所述待检测图像的第一目标检测结果,所述第一目标检测结果包括至少一个针对目标对象的第一矩形检测框;
8.对所述待检测图像进行分块,得到多个分块图像;
9.通过将所述第一目标检测结果进行坐标轴投影统计,得到所述待检测图像中目标对象密度小于第一阈值的感兴趣区域;
10.确定每一所述分块图像中所述感兴趣区域的占比,将所述占比大于第二阈值的分块图像确定为目标分块图像;
11.将所述目标分块图像进行尺度变换后输入所述目标检测网络,得到所述目标分块图像的第二目标检测结果,所述第二目标检测结果包括至少一个针对所述目标对象的第二矩形检测框;
12.根据所述待检测图像的第一目标检测结果以及所述目标分块图像的第二目标检测结果,确定所述待检测图像的最终目标检测结果。
13.在一种可能的实现方式中,所述对所述待检测图像进行分块,得到多个分块图像,包括:
14.确定各个所述第一矩形检测框的尺寸等级,计算各个所述尺寸等级的数量占比;
15.根据各个所述尺寸等级的数量占比以及所述待检测图像的尺寸,确定所述待检测图像在水平坐标轴方向以及垂直坐标轴方向的划分数量;
16.按照所述待检测图像在水平坐标轴方向以及垂直坐标轴方向的划分数量,对所述
待检测图像进行分块,得到多个分块图像。
17.在一种可能的实现方式中,所述根据各个所述尺寸等级的数量占比以及所述待检测图像的尺寸,确定所述待检测图像在水平坐标轴方向以及垂直坐标轴方向的划分数量,包括:
18.计算1除以所述各个所述尺寸等级的数量占比中的最小值,得到第一数值;
19.计算所述待检测图像的长度值除以目标和值,得到第二数值,所述目标和值为所述待检测图像的长度值与所述待检测图像的宽度值之和;
20.计算所述待检测图像的宽度值除以所述目标和值,得到第三数值;
21.计算所述第一数值乘以所述第二数值后取整,得到所述待检测图像在水平坐标轴方向的划分数量;
22.计算所述第一数值乘以所述第三数值后取整,得到所述待检测图像在垂直坐标轴方向的划分数量。
23.在一种可能的实现方式中,所述通过将所述第一目标检测结果进行坐标轴投影统计,得到所述待检测图像中目标对象密度小于第一阈值的感兴趣区域,包括:
24.将所述第一矩形检测框投影到水平坐标轴,得到所述水平坐标轴上的投影数量以及各个所述水平坐标轴上的投影数量分别对应的水平坐标轴范围;
25.将所述第一矩形检测框投影到垂直坐标轴,得到所述垂直坐标轴上的投影数量以及各个所述垂直坐标轴上的投影数量分别对应的垂直坐标轴范围;
26.将所述水平坐标轴上的投影数量小于或等于第三阈值的水平坐标轴范围以及所述垂直坐标轴上的投影数量小于或等于第四阈值的垂直坐标轴范围确定为目标区间;
27.将所述待检测图像中所述目标区间对应的区域,确定为所述待检测图像中目标对象密度小于第一阈值的感兴趣区域。
28.在一种可能的实现方式中,所述第三阈值是根据所述水平坐标轴上的投影数量的计数中位数确定,所述第四阈值是根据所述垂直坐标轴上的投影数量的计数中位数确定。
29.在一种可能的实现方式中,所述方法还包括:
30.将所述目标分块图像的预设边缘区域内的第二矩形检测框进行滤除。
31.在一种可能的实现方式中,所述根据所述待检测图像的第一目标检测结果以及所述目标分块图像的第二目标检测结果,确定所述待检测图像的最终目标检测结果,包括:
32.利用非极大值抑制算法对所述待检测图像的第一目标检测结果以及所述目标分块图像的第二目标检测结果进行融合,确定所述待检测图像的最终目标检测结果。
33.一种目标检测装置,所述装置包括:
34.第一检测单元,用于将待检测图像输入目标检测网络,得到所述待检测图像的第一目标检测结果,所述第一目标检测结果包括至少一个针对目标对象的第一矩形检测框;
35.分块单元,用于对所述待检测图像进行分块,得到多个分块图像;
36.投影单元,用于通过将所述第一目标检测结果进行坐标轴投影统计,得到所述待检测图像中目标对象密度小于第一阈值的感兴趣区域;
37.第一确定单元,用于确定每一所述分块图像中所述感兴趣区域的占比,将所述占比大于第二阈值的分块图像确定为目标分块图像;
38.第二检测单元,用于将所述目标分块图像输入所述目标检测网络,得到所述目标
分块图像的第二目标检测结果,所述第二目标检测结果包括至少一个针对所述目标对象的第二矩形检测框;
39.第二确定单元,用于根据所述待检测图像的第一目标检测结果以及所述目标分块图像的第二目标检测结果,确定所述待检测图像的最终目标检测结果。
40.一种目标检测设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上述的目标检测方法。
41.一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如上述的目标检测方法。
42.由此可见,本技术实施例具有如下有益效果:
43.本技术实施例将待检测图像输入目标检测网络,得到第一目标检测结果,第一目标检测结果包括针对目标对象的第一矩形检测框。对待检测图像进行分块,得到多个分块图像,并将第一目标检测结果进行坐标轴投影统计,筛选出目标对象密度较少的分块图像。这些分块图像被认为是检测效果不佳的区域,然后通过缩放这些分块图像进行尺度变换,送入目标检测网络再次检测,得到目标分块图像的第二目标检测结果。融合第一目标检测结果和第二目标检测结果,确定待检测图像的最终目标检测结果。从而使目标检测网络的检测尺度与待检测图像的实际尺度尽可能匹配,达到检测精度增强的目的。
附图说明
44.图1为本技术实施例提供的一种场景示例的示意图;
45.图2为本技术实施例提供的一种目标检测方法流程图;
46.图3为本技术实施例提供的目标检测结果示意图;
47.图4为本技术实施例提供的目标检测方法具体步骤流程图;
48.图5为本技术实施例提供的另一个目标检测方法具体步骤流程图;
49.图6为本技术实施例提供的又一个目标检测方法具体步骤流程图;
50.图7为本技术实施例提供的第一矩形检测框投影数量示意图;
51.图8为本技术实施例提供的目标分块图像示意图;
52.图9为本技术实施例提供的一种目标检测装置结构图。
具体实施方式
53.为使本技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本技术实施例作进一步详细的说明。
54.为了便于理解和解释本技术实施例提供的技术方案,下面对本技术实施例的背景技术进行说明。
55.基于深度学习的目标检测算法往往需要大量匹配实际情况的训练数据,还需要耗费大量的算力资源和时间来训练网络参数,才能在实际应用中取得较好的检测效果。但是,目前目标检测网络在实际测试过程中,通常会存在目标尺度不匹配的问题,造成目标检测结果不准确。出现目标尺度不匹配问题的原因主要有两方面:
56.第一方面,训练集和实际测试数据之间存在着目标尺度不匹配,例如训练集中的
训练数据都是大目标,如果实际测试中却都是小目标,检测效果会显著下降。
57.第二方面,目标检测网络的训练策略对实际结果造成影响,以yolov3网络为例,yolov3网络虽然对原图像下采样了8倍、16倍、32倍的特征进行了特征融合,但是其使用的coco2014训练数据集中,占图像大小5%的目标数量达到了目标总数的80.74%,经过高倍率的下采样后这些只占5%大小的目标信息必然已经丢失,成为了无效的训练数据。从yolov3网络的实验结果中来看,小目标的检测结果map(mean average precision,平均精度均值)为18.3,中等目标的检测结果map为35.4,大目标的检测结果map为41.9,所以实际上该网络对大目标的训练是最成功的,对小目标的训练是最失败的。
58.基于此,本技术实施例提供了一种目标检测方法、装置及设备。为了便于理解本技术实施例提供的目标检测方法,下面将结合图1所示的场景示例进行说明。其中,图1为本技术实施例提供的一种场景示例的示意图。该方法可以应用于终端设备101中。
59.在实际应用中,终端设备101获取待检测图像,将待检测图像输入目标检测网络,得到第一目标检测结果,第一目标检测结果包括针对目标对象的第一矩形检测框。对待检测图像进行分块,得到多个分块图像,并将第一目标检测结果进行坐标轴投影统计,筛选出目标对象密度较少的分块图像。这些分块图像被认为是检测效果不佳的区域,然后通过缩放这些分块图像进行尺度变换,送入目标检测网络再次检测,得到目标分块图像的第二目标检测结果。融合第一目标检测结果和第二目标检测结果,确定待检测图像的最终目标检测结果。
60.本领域技术人员可以理解,图1所示的框架示意图仅是本技术的实施方式可以在其中得以实现的一个示例。本技术实施方式的适用范围不受到该框架任何方面的限制。
61.基于上述说明,下面将结合附图对本技术实施例提供的目标检测方法进行详细说明。
62.图2为本技术实施例提供的一种目标检测方法的流程图,如图1所示该方法包括s10-s60:
63.s10、将待检测图像输入目标检测网络,得到待检测图像的第一目标检测结果,第一目标检测结果包括至少一个针对目标对象的第一矩形检测框。
64.其中,第一矩形检测框为定位目标的矩形框。
65.目标检测网络可以为任意一种输出为检测框的目标检测网络。目标检测网络主要分为两个类别,一类是二阶检测网络,例如fast rcnn(fast region-based convolutional neural network,快速区域的卷积网络、faster rcnn(faster region-based convolutional neural network,更快速区域的卷积网络)、mask rcnn(mask region-based convolutional neural network,掩膜区域的卷积神经网络)等,该类方法的特点是检测精度较好,但是速度较慢。另一类是一阶检测网络,例如yolo(you only look once)系列网络、retinanet、ssd(single shot multibox detector,单个深层神经网络)等。
66.在一个具体示例中,将待检测图像输入目标检测网络之前,需要将待检测图像尺度变换(即放缩)至输入的目标检测网络所需尺度。
67.在一个具体示例中,图3为本技术实施例提供的第一目标检测结果示意图,如图3所示,待检测图像的第一目标检测结果001,包括对目标对象的第一矩形检测框002、003、004、005。
68.s20、对待检测图像进行分块,得到多个分块图像。
69.由于目标不匹配,导致待测图像中有的区域检测效果好,有的区域检测效果不好,为了针对待测图像中检测效果不好的区域进行二次检测,可以通过预设的方式对待检测图像进行分块,以便后续从分块图像中进一步确定需要二次检测的目标分块图像。
70.在一种可能的实现方式中,可以依据待检测图像的尺寸对待检测图像进行分块。则图4为本技术实施例提供的步骤s20的具体步骤流程图,如图4所示,s20包括s201-s203:
71.s201、确定各个第一矩形检测框的尺寸等级,计算各个尺寸等级的数量占比。
72.在一个具体示例中,第一矩形检测框的尺寸等级的定义为:尺寸为96*96以上的第一矩形检测框为大目标检测框,尺寸为96*96-32*32之间的第一矩形检测框为中等目标检测框,尺寸为32*32以下的第一矩形检测框针为小目标检测框。
73.需要说明的是,尺寸等级及其标准可根据实际需求做定义,本技术实施例对此不做限定。
74.在一个具体示例中,根据第一目标检测结果中的各个尺寸等级的目标检测框数量统计直方图,计算各个尺寸等级的数量占比。
75.s202、根据各个尺寸等级的数量占比以及待检测图像的尺寸,确定待检测图像在水平坐标轴方向以及垂直坐标轴方向的划分数量。
76.为了将待测图像划分为合适大小的图像块,根据各个尺寸等级的数量占比结合待测图像的尺寸(长、宽两个维度)进行科学的划分,待检测图像在水平坐标轴方向以及垂直坐标轴方向的划分数量即为待测图像长或宽上的划分数量。
77.图5为本技术实施例提供的步骤s202的具体步骤流程图,如图5所示,s202包括s2021-s2025:
78.s2021、计算1除以各个尺寸等级的数量占比中的最小值,得到第一数值。
79.s2022、计算待检测图像的长度值除以目标和值,得到第二数值,目标和值为待检测图像的长度值与待检测图像的宽度值之和。
80.s2023、计算待检测图像的宽度值除以目标和值,得到第三数值。
81.s2024、计算第一数值乘以第二数值后取整,得到待检测图像在水平坐标轴方向的划分数量。
82.s2025、计算第一数值乘以第三数值后取整,得到待检测图像在垂直坐标轴方向的划分数量。
83.在一个具体示例中,水平坐标轴方向的划分数量计算式为:
[0084][0085]
垂直坐标轴方向的划分数量计算式为:
[0086][0087]
其中,m为水平坐标轴方向的划分数量,n为垂直坐标轴方向的划分数量,i为待测图像的长,j为待测图像的宽,a、b、c分别为第一矩形检测框里大、中等、小目标检测框数量占比,[]为取整符号。
[0088]
需要说明的是,本技术实施例不限定s2021、s2022和s2023的执行顺序,在一种可
能的实现方式中,可以同时执行s2021、s2022和s2023,也可以先执行s2022和s2023,再执行s2021,还可以先执行s2023,再执行s2022,最后执行再执行s2021,还可以先执行s2022,再执行s2023,最后执行再执行s2021等。本技术实施例不限定s2024和s2025的执行顺序。在一种可能的实现方式中,可以同时执行s2024和s2025,也可以先执行s2024,再执行s2025。
[0089]
s203、按照待检测图像在水平坐标轴方向以及垂直坐标轴方向的划分数量,对待检测图像进行分块,得到多个分块图像。
[0090]
在一个具体示例中,将待测图像划分为m*n个分块图像。
[0091]
s30、通过将第一目标检测结果进行坐标轴投影统计,得到待检测图像中目标对象密度小于第一阈值的感兴趣区域。
[0092]
为了筛选出检测效果不佳的区域,第一目标检测结果即第一矩形检测框进行坐标轴投影统计,投影统计结果可以体现在坐标轴不同范围上的目标对象的密度分布情况,进而能确定目标密度低的区域,即为感兴趣区域。
[0093]
图6为本技术实施例提供的s30的具体步骤的流程图,如图6所示该方法s30包括s301-s304:
[0094]
s301、将第一矩形检测框投影到水平坐标轴,得到水平坐标轴上的投影数量以及各个水平坐标轴上的投影数量分别对应的水平坐标轴范围。
[0095]
如果有n第一矩形检测框的投影在水平坐标轴上有重合,则水平坐标轴上重合的范围计数需要增加n,没有第一矩形检测框投影的水平坐标轴范围计数为0。
[0096]
s302、将第一矩形检测框投影到垂直坐标轴,得到垂直坐标轴上的投影数量以及各个垂直坐标轴上的投影数量分别对应的垂直坐标轴范围。
[0097]
同理,如果有m第一矩形检测框的投影在垂直坐标轴上有重合,则垂直坐标轴上重合的范围计数需要增加m,没有第一矩形检测框投影的垂直坐标轴范围计数为0。
[0098]
s303、将水平坐标轴上的投影数量小于或等于第三阈值的水平坐标轴范围以及垂直坐标轴上的投影数量小于或等于第四阈值的垂直坐标轴范围确定为目标区间。
[0099]
在一个可能的实现方式中,第三阈值是根据水平坐标轴上的投影数量的计数中位数确定,第四阈值是根据垂直坐标轴上的投影数量的计数中位数确定。
[0100]
其中,在确定中位数时排除0计数。
[0101]
s304、将待检测图像中目标区间对应的区域,确定为待检测图像中目标对象密度小于第一阈值的感兴趣区域。
[0102]
需要说明的是,本技术实施例不限定s301和s302的执行顺序。在一种可能的实现方式中,可以同时执行s301和s302,也可以先执行s302,再执行s301。
[0103]
通过图7所展示的可选示例对s301-s304进行说明。
[0104]
图7为本技术实施例提供的第一矩形检测框投影数量示意图,如图7所示,将图3中的检测结果进行坐标轴投影统计分析,将第一矩形检测框002-005投影到水平坐标轴,得到水平坐标轴上范围x2-x3投影数量为2,范围x3-x4、x5-x6、x7-x8投影数量分别为1。
[0105]
将第一矩形检测框002-005投影到垂直坐标轴,得到垂直坐标轴上范围y2-y3投影数量为1,范围y3-y4投影数量为3,范围y5-y6投影数量为1。
[0106]
水平坐标轴上的投影数量的计数1、1、1、2的中位数为1,确定第三阈值为1。根据垂直坐标轴上的投影数量的计数1、1、3的中位数为1,确定第四阈值为1。
[0107]
水平坐标轴上的投影数量小于或等于第三阈值1的水平坐标轴范围为:x1-x2、x3-x9。垂直坐标轴上的投影数量小于或等于第四阈值1的垂直坐标轴范围为:y1-y3、y4-y7。目标区间确定为x1-x2、x3-x9与y1-y3、y4-y7。
[0108]
将待检测图像001中目标区间对应的区域,即水平坐标轴范围为:x1-x2、x3-x9,垂直坐标轴范围为:y1-y3、y4-y7所组成的区域,确定为待检测图像中目标对象密度小于第一阈值的感兴趣区域,如图7中斜线填充区域。
[0109]
s40、确定每一分块图像中感兴趣区域的占比,将占比大于第二阈值的分块图像确定为目标分块图像。
[0110]
感兴趣区域为目标对象密度小于第一阈值的区域,即目标密度低的区域,若某分块图像中的感兴趣区域占比大的也就是分块图像大部分面积中目标密度低,则有很大的可能是由于目标尺度不匹配导致的检测效果不佳,则将该分块图像确定为目标分块图像,即目标分块图像被认为是检测效果不佳的区域。
[0111]
其中,第二阈值可根据需求设定,本技术对此不做限定。
[0112]
在一个具体示例中,图8为本技术实施例提供的目标分块图像示意图,如图8所示,801、802、803、804四块分块图像中,将感兴趣区域的占比大于40%的802、804作为目标分块图像。
[0113]
s50、将目标分块图像进行尺度变换后输入目标检测网络,得到目标分块图像的第二目标检测结果,第二目标检测结果包括至少一个针对目标对象的第二矩形检测框。
[0114]
将检测不佳的区域进行尺度变换,使其尺度与目标检测网络的检测尺度尽可能匹配。
[0115]
s60、根据待检测图像的第一目标检测结果以及目标分块图像的第二目标检测结果,确定待检测图像的最终目标检测结果。
[0116]
在一个可能的实现方式中,s60包括:利用非极大值抑制算法对待检测图像的第一目标检测结果以及目标分块图像的第二目标检测结果进行融合,确定待检测图像的最终目标检测结果。
[0117]
在一个可能的实现方式中,目标检测方法还包括:
[0118]
将目标分块图像的预设边缘区域内的第二矩形检测框进行滤除。
[0119]
在一个具体实例中,待测图像中一条狗作为一个目标,而一个目标分块图像的预设边缘区域内只划分到一条狗的头,此时第二矩形检测框对应的目标为一条狗的头,但实际上只是一个目标的一小部分,因此,要把此类第二矩形检测框进行滤除。
[0120]
本技术实施例将待检测图像输入目标检测网络,得到第一目标检测结果,第一目标检测结果包括针对目标对象的第一矩形检测框。对待检测图像进行分块,得到多个分块图像,并将第一目标检测结果进行坐标轴投影统计,筛选出目标对象密度较少的分块图像。这些分块图像被认为是检测效果不佳的区域,然后通过缩放这些分块图像进行尺度变换,送入目标检测网络再次检测,得到目标分块图像的第二目标检测结果。融合第一目标检测结果和第二目标检测结果,确定待检测图像的最终目标检测结果。从而使目标检测网络的检测尺度与待检测图像的实际尺度尽可能匹配,达到检测精度增强的目的。
[0121]
图9为本技术实施例提供的一种目标检测装置结构图,如图9所示,该装置包括:
[0122]
第一检测单元901,用于将待检测图像输入目标检测网络,得到待检测图像的第一
目标检测结果,第一目标检测结果包括至少一个针对目标对象的第一矩形检测框;
[0123]
分块单元902,用于对待检测图像进行分块,得到多个分块图像;
[0124]
投影单元903,用于通过将第一目标检测结果进行坐标轴投影统计,得到待检测图像中目标对象密度小于第一阈值的感兴趣区域;
[0125]
第一确定单元904,用于确定每一分块图像中感兴趣区域的占比,将占比大于第二阈值的分块图像确定为目标分块图像;
[0126]
第二检测单元905,用于将目标分块图像输入目标检测网络,得到目标分块图像的第二目标检测结果,第二目标检测结果包括至少一个针对目标对象的第二矩形检测框;
[0127]
第二确定单元906,用于根据待检测图像的第一目标检测结果以及目标分块图像的第二目标检测结果,确定待检测图像的最终目标检测结果。
[0128]
在一种可能的实现方式中,分块单元包括:
[0129]
计算子单元,用于确定各个第一矩形检测框的尺寸等级,计算各个尺寸等级的数量占比;
[0130]
第一确定子单元,用于根据各个尺寸等级的数量占比以及待检测图像的尺寸,确定待检测图像在水平坐标轴方向以及垂直坐标轴方向的划分数量;
[0131]
分块子单元,用于按照待检测图像在水平坐标轴方向以及垂直坐标轴方向的划分数量,对待检测图像进行分块,得到多个分块图像。
[0132]
在一种可能的实现方式中,第一确定子单元具体用于:
[0133]
计算1除以各个尺寸等级的数量占比中的最小值,得到第一数值;
[0134]
计算待检测图像的长度值除以目标和值,得到第二数值,目标和值为待检测图像的长度值与待检测图像的宽度值之和;
[0135]
计算待检测图像的宽度值除以目标和值,得到第三数值;
[0136]
计算第一数值乘以第二数值后取整,得到待检测图像在水平坐标轴方向的划分数量;
[0137]
计算第一数值乘以第三数值后取整,得到待检测图像在垂直坐标轴方向的划分数量。
[0138]
在一种可能的实现方式中,投影单元包括:
[0139]
第一投影子单元,用于将第一矩形检测框投影到水平坐标轴,得到水平坐标轴上的投影数量以及各个水平坐标轴上的投影数量分别对应的水平坐标轴范围;
[0140]
第二投影子单元,用于将第一矩形检测框投影到垂直坐标轴,得到垂直坐标轴上的投影数量以及各个垂直坐标轴上的投影数量分别对应的垂直坐标轴范围;
[0141]
第二确定子单元,用于将水平坐标轴上的投影数量小于或等于第三阈值的水平坐标轴范围以及垂直坐标轴上的投影数量小于或等于第四阈值的垂直坐标轴范围确定为目标区间;
[0142]
第三确定子单元,用于将待检测图像中目标区间对应的区域,确定为待检测图像中目标对象密度小于第一阈值的感兴趣区域。
[0143]
在一种可能的实现方式中,第三阈值是根据水平坐标轴上的投影数量的计数中位数确定,第四阈值是根据垂直坐标轴上的投影数量的计数中位数确定。
[0144]
在一种可能的实现方式中,装置还包括:
[0145]
滤除单元,用于将目标分块图像的预设边缘区域内的第二矩形检测框进行滤除。
[0146]
在一种可能的实现方式中,第二确定单元具体用于:
[0147]
利用非极大值抑制算法对待检测图像的第一目标检测结果以及目标分块图像的第二目标检测结果进行融合,确定待检测图像的最终目标检测结果。
[0148]
本技术实施例将待检测图像输入目标检测网络,得到第一目标检测结果,第一目标检测结果包括针对目标对象的第一矩形检测框。对待检测图像进行分块,得到多个分块图像,并将第一目标检测结果进行坐标轴投影统计,筛选出目标对象密度较少的分块图像。这些分块图像被认为是检测效果不佳的区域,然后通过缩放这些分块图像进行尺度变换,送入目标检测网络再次检测,得到目标分块图像的第二目标检测结果。融合第一目标检测结果和第二目标检测结果,确定待检测图像的最终目标检测结果。从而使目标检测网络的检测尺度与待检测图像的实际尺度尽可能匹配,达到检测精度增强的目的。
[0149]
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0150]
应当理解,在本技术中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
[0151]
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0152]
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
[0153]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1