目标检测方法、装置、电子设备和计算机可读存储介质与流程

文档序号:33248654发布日期:2023-02-18 00:08阅读:59来源:国知局
目标检测方法、装置、电子设备和计算机可读存储介质与流程

1.本技术涉及计算机技术领域,具体涉及一种目标检测方法、装置、电子设备和计算机可读存储介质。


背景技术:

2.近年来,目标检测的研究涉及各种领域,如监控安全、自动驾驶、交通监控、无人机场景分析和机器人视觉等。目标检测是一种与计算机视觉和图像处理相关的计算机技术,用于检测图像或视频中某一类别的对象(如人、建筑物或汽车等)。例如,利用深度学习网络从输入图像或视频中提取对象的特征,并利用该特征对对象进行分类和确定对象在图像或视频中的位置。
3.目前,目标检测方法很难检测出图像或视频中所有感兴趣的对象,导致目标检测性能较差。


技术实现要素:

4.本技术提供一种目标检测方法、装置、电子设备和计算机可读存储介质,可以提升目标检测的性能。
5.本技术提供一种目标检测方法,包括:
6.获取待检测图像,待检测图像中包括至少一个目标对象;
7.对待检测图像进行特征提取,得到多个不同尺度的首部特征;
8.对首部特征进行分支特征提取,得到多个分支对应的分支特征,分支特征为待检测图像中不同类别的目标对象对应的特征;
9.对多个分支对应的分支特征进行特征交互处理,得到分支对应的分支交互特征;
10.基于分支对应的分支交互特征检测出待检测图像中的目标对象。
11.本技术还提供一种目标检测装置,包括:
12.获取单元,用于获取待检测图像,待检测图像中包括至少一个目标对象;
13.特征提取单元,用于对待检测图像进行特征提取,得到多个不同尺度的首部特征;
14.分支特征提取单元,用于对首部特征进行分支特征提取,得到多个分支对应的分支特征,分支特征为待检测图像中不同类别的目标对象对应的特征;
15.交互单元,用于对多个分支对应的分支特征进行特征交互处理,得到分支对应的分支交互特征;
16.检测单元,用于基于分支对应的分支交互特征检测出待检测图像中的目标对象。
17.在一些实施例中,交互单元具体用于:
18.获取注意力交互网络;
19.采用注意力交互网络对多个分支对应的分支特征进行特征交互处理,得到分支对应的分支交互特征。
20.在一些实施例中,注意力交互网络包括注意力子网络和特征提取子网络,交互单
元具体用于:
21.对多个分支对应的分支特征进行特征融合处理,得到分支融合特征;
22.采用特征提取子网络对分支融合特征进行特征提取,得到多个新分支特征;
23.采用注意力子网络对新分支特征进行注意力调整,得到调整后的新分支特征;
24.对调整后的新分支特征和对应的分支特征进行残差处理,得到分支对应的分支交互特征。
25.在一些实施例中,分支特征包括第一子分支特征和第二子分支特征,分支融合特征包括第一子分支融合特征和第二子分支融合特征,交互单元具体用于:
26.对多个分支对应的第一子分支特征进行特征融合处理,得到第一子分支融合特征;
27.对多个分支对应的第二子分支特征进行特征融合处理,得到第二子分支融合特征。
28.在一些实施例中,目标检测装置还用于:
29.获取分支对应的第一子分支输出网络和第二子分支输出网络;
30.分支对应的分支交互特征包括第一子分支特征对应的分支交互特征和第二子分支特征对应的分支交互特征,检测单元具体用于:
31.采用第一子分支输出网络对第一子分支特征对应的分支交互特征进行卷积运算,得到待检测图像中像素点的类别和中心度;
32.采用第二子分支输出网络对第二子分支特征对应的分支交互特征进行卷积运算,得到待检测图像中像素点的距离回归值;
33.基于待检测图像中像素点的类别、中心度和距离回归值,检测出待检测图像中的目标对象。
34.在一些实施例中,分支特征提取单元具体用于:
35.获取分支提取网络,采用分支提取网络对首部特征进行分支特征提取,得到多个分支对应的分支特征;
36.分支包括第一分支和第二分支,分支提取网络包括第一分支提取网络和第二分支提取子网络,采用分支提取网络对首部特征进行分支特征提取,得到多个分支对应的分支特征,包括:
37.采用第一分支提取网络对首部特征进行分支特征提取,得到第一分支对应的第一分支特征;
38.采用第二分支提取网络对首部特征进行分支特征提取,得到第二分支对应的第二分支特征。
39.在一些实施例中,特征提取单元具体用于:
40.获取骨干网络和特征金字塔网络;
41.采用骨干网络对待检测图像进行特征提取,得到多个骨干特征;
42.采用特征金字塔网络对多个骨干特征进行特征提取,得到多个不同尺度的首部特征。
43.在一些实施例中,目标检测装置还用于:
44.获取多个训练集,以及预设目标检测模型,多个训练集与预设目标检测模型中的
多个分支一一对应,多个训练集中训练图像的标签各不相同,标签用于对训练图像中不同类别的目标对象进行区分;
45.采用训练图像对预设目标检测模型进行训练,得到目标检测模型。
46.在一些实施例中,预设目标检测模型中每个分支都包括预设的第一子分支输出网络和第二子分支输出网络,目标检测装置还用于:
47.采用预设目标检测模型对训练图像进行目标对象检测,得到分支对应的预设的第一子分支输出网络的第一输出结果和预设的第二子分支输出网络的第二输出结果;
48.根据分支对应的第一输出结果、第二输出结果以及训练图像的标签,确定分支对应的第一损失值和第二损失值;
49.基于分支对应的第一损失值和第二损失值,确定分支对应的损失值;
50.基于分支对应的损失值,确定预设目标检测模型的损失值;
51.根据预设目标检测模型的损失值,对预设目标检测模型的参数进行更新,返回执行采用预设目标检测模型对训练图像进行目标对象检测的步骤,迭代至预设目标检测模型的损失值满足预设条件,得到目标检测模型。
52.在一些实施例中,目标检测装置还用于:
53.确定分支对应的损失变化率;
54.根据分支对应的损失变化率,确定分支对应的损失权重;
55.基于分支对应的损失权重和分支对应的损失值,确定预设目标检测模型的损失值。
56.在一些实施例中,目标检测装置还用于:
57.确定当前迭代滑动窗口分支对应的历史平均损失值,以及当前迭代滑动窗口预设目标检测模型的历史平均损失值,当前迭代滑动窗口表示从第n次迭代到第m次迭代;
58.确定上一迭代滑动窗口分支对应的历史平均损失值,上一迭代滑动窗口表示从第n-j次迭代到第m-j次迭代,j、n和m均为正整数;
59.基于上一迭代滑动窗口分支对应的历史平均损失值、当前迭代滑动窗口分支对应的历史平均损失值以及当前迭代滑动窗口预设目标检测模型的历史平均损失值,确定分支对应的损失变化率。
60.在一些实施例中,目标检测装置还用于:
61.确定当前迭代滑动窗口预设目标检测模型的历史平均损失值;
62.根据分支对应的损失变化率,确定分支对应的损失权重,包括:
63.基于当前迭代滑动窗口分支对应的历史平均损失值和当前迭代滑动窗口预设目标检测模型的历史平均损失值确定分支对应的损失量级;
64.根据分支对应的损失量级和分支对应的损失变化率,确定分支对应的损失权重。
65.本技术还提供一种电子设备,包括存储器和处理器,存储器存储有多条指令;所述处理器从所述存储器中加载指令,以执行本技术所提供的任一种目标检测方法中的步骤。
66.本技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本技术所提供的任一种目标检测方法中的步骤。
67.本技术可以获取待检测图像,待检测图像中包括至少一个目标对象;对待检测图像进行特征提取,得到多个不同尺度的首部特征;对首部特征进行分支特征提取,得到多个
分支对应的分支特征,分支特征为待检测图像中不同类别的目标对象对应的特征;对多个分支对应的分支特征进行特征交互处理,得到分支对应的分支交互特征;基于分支对应的分支交互特征检测出待检测图像中的目标对象。
68.在本技术中,在得到待检测图像的首部特征后,通过不同的分支来提取不同类别的目标对象的特征,并对不同分支的特征进行特征交互处理,从而发现不同类别的目标对象之间的潜在信息,有助于检测出待检测图像中所有感兴趣的对象。由此,提升了目标检测的性能。
附图说明
69.为了更清楚地说明本技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
70.图1a是本技术提供的目标检测方法的流程示意图;
71.图1b是本技术提供的目标检测模型的结构示意图;
72.图1c是本技术提供的注意力交互网络的结构示意图;
73.图2a是本技术提供的目标检测方法的另一种流程示意图;
74.图2b是本技术提供的目标检测可视化的示意图;
75.图2c是本技术提供的目标对象的检测结果的示意图;
76.图3是本技术提供的目标检测装置的一种结构示意图;
77.图4是本技术提供的电子设备的结构示意图。
具体实施方式
78.下面将结合本技术中的附图,对本技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
79.本技术提供一种目标检测方法、装置、电子设备和计算机可读存储介质。
80.其中,该目标检测装置具体可以集成在电子设备中,该电子设备可以为终端、服务器等设备。其中,终端可以为手机、平板电脑、智能蓝牙设备、笔记本电脑、或者个人电脑(personal computer,pc)等设备;服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群。在一些实施例中,服务器也可以以终端的形式来实现。
81.在一些实施例中,该目标检测装置还可以集成在多个电子设备中,比如,目标检测装置可以集成在多个服务器中,由多个服务器来实现本技术的目标检测方法。
82.例如,该电子设备可以获取待检测图像,待检测图像中包括至少一个目标对象;对待检测图像进行特征提取,得到多个不同尺度的首部特征;对首部特征进行分支特征提取,得到多个分支对应的分支特征,分支特征为待检测图像中不同类别的目标对象对应的特征;对多个分支对应的分支特征进行特征交互处理,得到分支对应的分支交互特征;基于分支对应的分支交互特征检测出待检测图像中的目标对象。
83.在本实施例中,电子设备在得到待检测图像的首部特征后,通过不同的分支来提
level feature)。高层特征更关注语义信息,更少关注细节信息,而低层特征包含更多细节信息,因此可以让每一种尺度的特征图都具有较强的语义信息。
96.130、对首部特征进行分支特征提取,得到多个分支对应的分支特征,分支特征为待检测图像中不同类别的目标对象对应的特征。
97.其中,不同分支可以用于对待检测图像中不同类别的目标对象进行检测。
98.电子设备可以获取分支提取网络,采用分支提取网络对首部特征进行分支特征提取,得到多个分支对应的分支特征。其中,分支提取网络可以为卷积神经网络,例如可以为通道为256的4个卷积层。分支的个数与能够检测的目标对象的类别对应,例如,可以检测两个类别的目标对象则分支的个数可以2;目标对象的类别的划分规则不做限制,类别还可以包括多个子类别。例如,可以在训练时,将每个训练集中标签标注的对象的类别作为同一个类别;比如,也可以根据车、交通灯标识等分类来划分类别。
99.在一些实施例中,分支包括第一分支和第二分支,分支提取网络包括第一分支提取网络和第二分支提取子网络。则采用分支提取网络对首部特征进行分支特征提取,得到多个分支对应的分支特征可以包括:采用第一分支提取网络对首部特征进行分支特征提取,得到第一分支对应的第一分支特征;采用第二分支提取网络对首部特征进行分支特征提取,得到第二分支对应的第二分支特征。
100.在一些实施例中,每个分支还可以包括第一子分支和第二子分支,分支提取网络可以两个通道为256的4个卷积层,每个子分支对应一个通道为256的4个卷积层。因此,对于每个分支:
101.采用第一子分支对应的卷积层对首部特征进行分支特征提取,得到对应的第一子分支特征;采用第二子分支对应的卷积层对首部特征进行分支特征提取,得到对应的第二子分支特征。
102.140、对多个分支对应的分支特征进行特征交互处理,得到分支对应的分支交互特征。
103.电子设备可以获取注意力交互网络;采用注意力交互网络对多个分支对应的分支特征进行特征交互处理,得到分支对应的分支交互特征。本实施例通过在不同的分支间加入注意力交互网络,为每个分支提供跨分支的潜在信息,有助于发现不同类别的目标对象之间的潜在关系。
104.在一些实施例中,注意力交互网络可以包括注意力子网络和特征提取子网络,采用注意力交互网络对多个分支对应的分支特征进行特征交互处理可以包括但不限于:
105.i、对多个分支对应的分支特征进行特征融合处理,得到分支融合特征;可以融合分支特征之间的潜在语义信息。融合的方式不做限制,例如,可以通过将多个分支特征进行拼接,得到分支融合特征。
106.ii、采用特征提取子网络对分支融合特征进行特征提取,得到多个新分支特征。其中,特征提取子网络可以为卷积核为3的两个卷积层,即对分支融合特征进行两次卷积核为3的自适应卷积运算,生成包含潜在语义信息的适合每个分支的新分支特征。
107.iii、采用注意力子网络对新分支特征进行注意力调整,得到调整后的新分支特征。其中,注意力子网络可以为卷积块的注意力模块(convolutional block attention module,cbam)等。例如采用cbam进行对新分支特征进行注意力调整,cbam可以包括通道注
意力模块和空间注意力模块;可以为将新分支特征按照取每个通道进行最大池化(max pooling)和平均值池化(global average pooling),然后分别输入三层感知机,将感知机的输出结果相加后输入线性整流(rectified linear unit,relu)激活函数,得到通道注意力模块的特征图;在通道维度上计算出该特征图的全局最大值池化和全局平均值池化的两张特征图,将两张特征图拼接,再进行一次卷积运算,最后使用交叉熵损失函数(sigmoid)得到空间注意力模块的特征图;将通道注意力模块的特征图和空间注意力模块的特征图作用于新分支特征,对新分支特征进行调整。注意力子网络可以更注重新分支特征中的重要的信息,抑制不重要的信息,使调整后的新分支特征具有相关目标对象的关键信息。
108.iv、对调整后的新分支特征和对应的分支特征进行残差处理,得到分支对应的分支交互特征。将注意力子网络输出的特征和原分支特征进行残差处理,可以进一步增强相关目标对象的信息。
109.在一些实施例中,每个分支还可以包括第一子分支和第二子分支,每个分支对应的分支特征包括第一子分支特征和第二子分支特征,对应的分支融合特征包括第一子分支融合特征和第二子分支融合特征。因此,还可以对多个分支对应的第一子分支特征进行特征融合处理,得到第一子分支融合特征。对多个分支对应的第二子分支特征进行特征融合处理,得到第二子分支融合特征。
110.然后对于每个分支:采用对应的特征提取子网络对第一子分支融合特征进行特征提取,得到多个新第一子分支特征;采用对应的特征提取子网络对第二子分支融合特征进行特征提取,得到多个新第二子分支特征。
111.采用对应的注意力子网络对新第一子分支特征进行注意力调整,得到调整后的新第一子分支特征;采用对应的注意力子网络对新第二子分支特征进行注意力调整,得到调整后的新第二子分支特征。
112.对调整后的新第一子分支特征和对应的第一子分支特征进行残差处理,得到第一子分支对应的分支交互特征;对调整后的新第二子分支特征和对应的第二子分支特征进行残差处理,得到第二子分支对应的分支交互特征。
113.可选地,可以通过归一化子网络对残差处理后的分支交互特征进行归一化处理,用于后续的目标检测。比如,采用3
×
3的组归一化(group-normalization)卷积运算和relu激活函数对残差处理后的分支交互特征进行细化,用于后续的目标检测。
114.步骤130和140仅以某个尺度的首部特征对应的分支为例进行阐述,可以理解的是,也可对其他尺度的首部特征对应的分支执行步骤130和140,得到每个首部特征对应的分支交互特征。
115.150、基于分支对应的分支交互特征检测出待检测图像中的目标对象。
116.本实施例中,可以综合每个首部特征对应的每个分支的输出结果,将待检测图像中的目标对象检测出来。每个分支对应的输出结果即可以为每个分支对应的待检测图像中像素点的类别、中心度和距离回归值。检测出目标对象的具体表现形式不做限制,例如可以采用目标框对目标对象进行标记,并标出类别;或者可以采用不同颜色的目标框将目标对象进行标记;或者可以以热力图的形式将目标对象的所有像素点进行标记,等等。
117.对于每个分支:可以获取分支对应的第一子分支输出网络和第二子分支输出网络;采用第一子分支输出网络对第一子分支特征对应的分支交互特征进行卷积运算,得到
待检测图像中像素点的类别(cls)和中心度(ctr);采用第二子分支输出网络对第二子分支特征对应的分支交互特征进行卷积运算,得到待检测图像中像素点的距离回归值(reg)。可以理解的是,可以通过建立分支交互特征中像素点的位置和待检测图像中像素点的位置之间的关系,来得到待检测图像中像素点的类别、中心度和距离回归值。假设以目标框将目标对象标记,像素点的类别可以表示该像素点对应目标对象的类别;中心度为每个像素点和目标中心点(目标框的中心点)的距离,可以用于减少离目标中心点较远的预测点(预测属于目标对象的点);距离回归值可以为目标框内某个像素点离目标框的左边、上边、右边、下边的距离。
118.基于待检测图像中像素点的类别、中心度和距离回归值,检测出待检测图像中的目标对象。即综合每个首部特征对应的每个分支对应的待检测图像中像素点的类别、中心度和距离回归值,就可以检测出待检测图像中所有感兴趣的目标对象。
119.在一些实施例中,在步骤获取待检测图像之前,电子设备还可以对预设目标检测模型进行训练,得到目标检测模型。该目标检测模型可以包括但不限于上述步骤110-150涉及的所有网络;即目标检测模型可以包括骨干网络、特征金字塔网络、分支提取网络、注意力交互网络、分支输出网络(第一子分支输出网络和第二子分支输出网络)等。如图1b所示,是本实施例提供的目标检测模型的一种结构示意图。本技术附图中的立方体可以表示网络输出的特征,如图1b所示,特征金字塔网络的每一卷积层输出的首部特征都输入一个注意力特征交互器(branch-inter-active head,mib-head);本实施例以分支个数为2进行阐述,为方便描述,称为第一分支和第二分支,第一分支包括第一子分支和第二子分支。该注意力特征交互器可以包括第一分支提取网络和第二分支提取网络、与第一子分支对应的注意力交互网络和第二子分支对应的注意力交互网络、第一分支输出网络和第二分支输出网络。如图1c所示,图1c是本技术提供的注意力交互网络的结构示意图;注意力交互网络可以包括特征提取子网络、注意力子网络、归一化子网络。
120.对预设目标检测模型进行训练的具体实施方式不做限制,可以包括但不限于如下步骤:
121.s10、获取多个训练集,以及预设目标检测模型。
122.其中,预设目标检测模型为还未进行训练的目标检测模型。多个训练集与预设目标检测模型中的多个分支一一对应,多个训练集中训练图像的标签各不相同,标签用于对训练图像中不同类别的目标对象进行区分。训练一个分支对应得到网络也可以称为一个任务,则每个分支对应一个任务,从而任务与训练集也一一对应。
123.在一些实施例中,训练集的个数为2(即分支的个数为2)。由于在标签缺失下,很难检测出所有感兴趣的对象;目标检测模型解决了标签缺失的情况下,所有感兴趣目标对象的检测。因此,本实施例可以将数据集coco拆分为训练集coco_a与训练集coco_b,coco_a对应第一分支,coco_b对应第二分支。coco_a中训练图像的标签只标注了第一类别的目标对象,但是训练图像中包括第二类别的目标对象;第一类别可以包括32种子类别。coco_b中训练图像的标签只标注了第二类别的目标对象,但是包括第一类别的目标对象;第二类别可以包括48种子类别。第一类别和第二类别对应的目标对象不重合。
124.s20、采用训练图像对预设目标检测模型进行训练,得到目标检测模型。
125.在一些实施例中,采用训练图像对预设目标检测模型进行训练可以包括但不限于
如下步骤:
126.1)采用预设目标检测模型对训练图像进行目标对象检测,得到分支对应的预设的第一子分支输出网络的第一输出结果和预设的第二子分支输出网络的第二输出结果。
127.在一些实施例中,训练时参数可以根据实际应用情况自定义设置,例如批次大小可以为任一整数;例如批次大小可以等于8,该8张训练图像其中4张可以来自于coco_a,另外4张可以来自于coco_b。通常会有来自不同数据集的相关目标对象出现在同一训练图像中,如电视、鼠标等。
128.采用骨干网络对训练图像进行特征提取,得到多个训练图像的骨干特征;采用特征金字塔网络对多个骨干特征进行特征提取,得到多个训练图像的不同尺度的首部特征。然后对每个尺度的首部特征对应的注意力特征交互器进行训练。以一个注意力特征交互器为例进行阐述,可以包括但不限于:
129.对于注意力特征交互器中的每个分支:采用第一子分支对应的卷积层对首部特征进行分支特征提取,得到对应的第一子分支特征;采用第二子分支对应的卷积层对首部特征进行分支特征提取,得到对应的第二子分支特征。
130.在对应的注意力交互网络中,可以对两个分支对应的第一子分支特征进行特征融合处理,得到第一子分支融合特征;对两个分支对应的第二子分支特征进行特征融合处理,得到第二子分支融合特征。由此,可以融合不同数据集中不同目标对象的特征之间的潜在语义信息。
131.在对应的注意力交互网络中,还可以采用对应的特征提取子网络对第一子分支融合特征进行特征提取,得到第一分支对应的新第一子分支特征,以及第二分支对应的新第一子分支特征;采用对应的特征提取子网络对第二子分支融合特征进行特征提取,得到第一分支对应的新第二子分支特征,以及第二分支对应的新第二子分支特征。可以生成包含潜在语义信息的适合每个分支的新分支特征。
132.然后再针对每个分支:还可以采用对应的注意力子网络对新第一子分支特征进行注意力调整,得到调整后的新第一子分支特征;采用对应的注意力子网络对新第二子分支特征进行注意力调整,得到调整后的新第二子分支特征。注意力子网络可以更注重新分支特征中的重要的信息,抑制不重要的信息,使调整后的新分支特征具有相关目标对象的关键信息。
133.对调整后的新第一子分支特征和对应的第一子分支特征进行残差处理,得到第一子分支对应的分支交互特征;对调整后的新第二子分支特征和对应的第二子分支特征进行残差处理,得到第二子分支对应的分支交互特征。可以在抑制易混淆特征的同时,增强相关语义信息的特征。
134.在一些实施例中,可以根据coco_a与coco_b中训练图像的标识(如图像的id)来对分支交互特征进行筛选,每个子分支对应的分支交互特征进行筛选后,留下对应数据集中训练图像的特征,以便每个数据集对应的分支只计算具有真实的标签(ground truth)的训练图像的损失。如第一分支的第一子分支和第二子分支只包括coco_a中训练图像对应的分支交互特征。例如,如图1c所示,输入注意力交互网络的特征为2n张训练图像对应的特征,2n为批次大小,h,w表示特征的大小,c表示通道;经过筛选之后,则第一分支对应的分支交互特征为coco_a中n张训练图像对应的特征,第二分支对应的分支交互特征为coco_b中n张
训练图像对应的特征。
135.采用归一化子网络对筛选后的第一子分支对应的分支交互特征进行归一化处理,得到归一化后的第一子分支对应的分支交互特征;采用归一化子网络对筛选后的第二子分支对应的分支交互特征进行归一化处理,得到归一化后的第二子分支对应的分支交互特征。
136.最后,基于第一子分支对应的分支交互特征和第二子分支对应的分支交互特征,得到每个分支对应的预设的第一子分支输出网络的第一输出结果和预设的第二子分支输出网络的第二输出结果。
137.2)根据分支对应的第一输出结果、第二输出结果以及训练图像的标签,确定分支对应的第一损失值和第二损失值。
138.在一些实施例中,可以根据损失函数计算损失值。
139.3)基于分支对应的第一损失值和第二损失值,确定分支对应的损失值。
140.在一些实施例中,可以将每个分支的第一损失值和第二损失值相加,得到每个分支对应的损失值。然后可以将所有注意力特征交互器中第一分支对应的损失值相加,得到所有第一分支对应的损失值;将所有注意力特征交互器中第二分支对应的损失值相加,得到第二分支的损失值。
141.在一些实施例中,也可以为每个注意力特征交互器预设权重,在确定第一分支的损失值和第二分支的损失值时,根据该预设权重进行加权求和。
142.4)基于分支对应的损失值,确定预设目标检测模型的损失值。
143.本实施例中,提出一种基于迭代滑动窗口的动态损失均衡策略,通过同时考虑一段迭代次数内的损失变化率和损失量级。如某个分支对应的损失值下降较快,即损失变化率越小;或者某个分支损失值更小,则可以体现该分支训练过程中学习得好,可以给该分支分配较小的损失权重,将整个目标检测模型学习的侧重在更难学的分支上;从而平衡每个分支的损失值的权重,在每个分支上产生更有效和稳定的反向传播性能。
144.在一些实施例中,确定分支对应的损失变化率包括确定当前迭代滑动窗口分支对应的历史平均损失值,以及当前迭代滑动窗口预设目标检测模型的历史平均损失值,当前迭代滑动窗口表示从第n次迭代到第m次迭代。确定上一迭代滑动窗口分支对应的历史平均损失值,上一迭代滑动窗口表示从第n-j次迭代到第m-j次迭代;j可以表示滑动的步长,m-n的值可以称为迭代滑动窗口的窗口尺寸,j、n和m均为正整数,其取值可以根据实际应用情况自定义设置。基于上一迭代滑动窗口分支对应的历史平均损失值、当前迭代滑动窗口分支对应的历史平均损失值以及当前迭代滑动窗口预设目标检测模型的历史平均损失值,确定分支对应的损失变化率。
145.在一些实施例中,还可以确定当前迭代滑动窗口预设目标检测模型的历史平均损失值;基于当前迭代滑动窗口分支对应的历史平均损失值和当前迭代滑动窗口预设目标检测模型的历史平均损失值确定分支对应的损失量级;根据分支对应的损失量级和分支对应的损失变化率,确定分支对应的损失权重。
146.例如,可以采用如下公式计算损失权重的参数:
[0147][0148]
其中,λk(s
t-1
)表示第t次迭代时k分支对应的损失权重的参数;k表示不同的分支对应的任务;t表示迭代次数,t等于m+1;s
t-1
表示当前迭代滑动窗口,s
t-2
表示上一迭代滑动窗口;表示上一迭代滑动窗口分支对应的历史平均损失值;表示当前迭代滑动窗口分支对应的历史平均损失值;表示当前迭代滑动窗口预设目标检测模型的历史平均损失值;表示第t次迭代时k分支对应的损失变化率;表示第t次迭代时k分支对应的损失量级。
[0149]
根据分支对应的损失变化率和分支对应的损失量级(即损失权重的参数),确定分支对应的损失权重。例如,可以采用如下公式分支对应的损失权重:
[0150][0151]
其中,k表示任务总数(分支总数);t表示调整任务权重柔软性的温度,可根据实际应用情况进行设置,t越大则每个分支对应的损失权重越接近。
[0152]
基于分支对应的损失权重和分支对应的损失值,确定预设目标检测模型的损失值。在一些实施例中,可以利用分支对应的损失权重对分支对应的损失值进行加权求和,得到预设目标检测模型的损失值。
[0153]
5)根据预设目标检测模型的损失值,对预设目标检测模型的参数进行更新,返回执行采用预设目标检测模型对训练图像进行目标对象检测的步骤,迭代至预设目标检测模型的损失值满足预设条件,得到目标检测模型。其中,预设条件可以为预设目标检测模型收敛。
[0154]
本技术提供的目标检测方案可以应用在各种计算机视觉对应的场景中。比如,可以以实际生活中的监控场景中,等等。
[0155]
由上可知,本技术可以获取多个训练集,多个训练集与预设目标检测模型中的多个分支一一对应,该训练集中训练图像的标签各不相同,标签用于对训练图像中不同类别的目标对象进行区分;采用训练图像对预设目标检测模型进行训练时,在不同分支之间加入注意力特征交互器,为每个分支提供跨分支的潜在信息,有助于从不同的数据集中发现目标对象之间的潜在关系,然后提出了一种基于迭代滑动窗口的动态损失均衡策略,通过同时考虑一段迭代次数内的损失变化率和损失量级,在每个分支上产生更有效和稳定的反向传播性能。最后,采用训练好的目标检测网络对待检测图像进行目标检测,可以检测出待检测图像中所有感兴趣的对象,从而提升了目标检测的性能。
[0156]
根据上述实施例所描述的目标检测方法,以下将作进一步详细说明。
[0157]
如图2a所示,一种目标检测方法具体流程如下:
[0158]
210、获取多个训练集,以及预设目标检测模型。
[0159]
数据集是基于coco与pascal voc生成的子数据集。其中训练集和测试集的划分结
果如表1所示。
[0160]
表1:在coco和pascal voc上的数据集划分结果。
[0161][0162]
voc训练集是从voc2007和voc2012的训练集以及验证集中划分出来,voc_a中训练图像的标签包括17种子类别,voc_b训练图像的标签包括3种子类别;测试集基于voc2007的测试集。coco是基于coco2017数据集进行划分的,coco_a中训练图像的标签只标注了第一类别的目标对象,但是训练图像中包括第二类别的目标对象;第一类别可以包括32种子类别。coco_b中训练图像的标签只标注了第二类别的目标对象,但是包括第一类别的目标对象;第二类别可以包括48种子类别。
[0163]
220、采用训练图像对预设目标检测模型进行训练,得到目标检测模型。
[0164]
骨干网络为resnet50;对于基于迭代滑动窗口的动态损失均衡策略中,在coco数据集对应的训练中窗口尺寸和步长设置为15,5;在voc数据集对应的训练中窗口尺寸和步长设置为20,1。该步骤的具体实现方式可参照步骤s20,这里不再赘述。
[0165]
230、获取待检测图像,待检测图像中包括至少一个目标对象。
[0166]
待检测图像可以为步骤210中的测试集中的图像。
[0167]
240、采用目标检测模型中的骨干网络和特征金字塔网络对待检测图像进行特征提取,得到多个不同尺度的首部特征。
[0168]
250、采用目标检测模型中的分支提取网络对首部特征进行分支特征提取,得到多个分支对应的分支特征,分支特征为待检测图像中不同类别的目标对象对应的特征。
[0169]
260、采用目标检测模型中的注意力交互网络对多个分支对应的分支特征进行特征交互处理,得到分支对应的分支交互特征。
[0170]
270、基于分支对应的分支交互特征检测出待检测图像中的目标对象。
[0171]
步骤230至270可以参照步骤110至150所述,这里不再赘述。检测出测试集中待检测图像中的目标对象后可以计算检测结果。并与常见的结果的解决方案进行比较,如表2。“single”指用单个模型来训练每个训练集。“brutal”指的是将多训练集简单地联合在一起进行训练。“mtb”指应用一个共享的骨干网络以及对应不同数据集有不同检测分支的多分支网络进行训练。
[0172]
结果表明,在这些常见的解决方案中,single和mtb模型的结果最好,而brutal方法的结果最差。该结果表明,目标检测任务融合与单标签图像分类任务融合的语义冲突问题是完全不同的。对于目标检测,图像可能包含许多感兴趣的对象,而对于单标签图像分类,大多只有一个感兴趣的目标。在没有对训练图像中的所有对象进行完整标注的情况下,
目标检测模型很容易将未标注的感兴趣目标对象识别为背景。这给目标检测模型留下了很大的混乱,因为在某些图像中预测是正确的,而在其他图像中对同一物体的预测可能是错误的。与单一模型相比,本技术方案在pascal-voc2007测试集上的均值平均精度(mean average precision,map)结果都提高了2%,证明了该方法在不完全标注的目标检测问题上有较大的改进。
[0173]
同时采用基于迭代滑动窗口的动态损失均衡策略(mdwas)、注意力特征交互器(mib-head)进行了消融研究,以评估各模块的效果。结果在表2中,说明了各模块都发挥了相应的作用,而不妨碍其他模块的积极影响。
[0174]
表2:对划分的coco、voc数据集的map与其他常用方法的比较结果,以及相应提出的方法的消融实验结果。
[0175][0176]
将本技术提出的基于迭代滑动窗口的动态损失均衡策略(mdwas)方法与基于基线mtb的dwa方法进行比较。结果如表3所示。在不同的数据集上证明了该方法在平衡目标检测多任务方面的有效性。与dwa相比,本技术的方法产生了积极的影响,明显优于dwa,特别是在coco_a上。
[0177]
表3:与dwa和基线mtb相比,基于迭代滑动窗口的动态损失均衡策略的结果
[0178][0179][0180]
通过多个不同的窗口大小和步长组合,来研究迭代滑动窗口在平衡分支损失中的作用,结果如表4所示。在迭代滑动窗口的所有参数设置中,与coco_b相比,coco_a有更多的改进。并且可以观察到,即使没有迭代滑动窗口,其中大小和步长都是1,本技术的方法也比dwa更有效,这意味着考虑损失的大小是非常有用的。当窗口大小为10,步长为3时,coco的性能最好。
[0181]
表4:基于迭代滑动窗口的动态损失均衡策略在不同窗口大小和步长设置下的结

[0182][0183]
将本技术提出的注意力特征交互器与cbam、分层特征融合网络(neural discriminative dimensionality reduction,nddr)和resatt模块进行比较,评估其效果。结果如表5所示。本技术提出的方法都取得了明显的效果,在coco分区上的map与mtb相比分别提高了1.7%和1.1%。
[0184]
表5:注意力特征交互器作用与其他方法的结果比较
[0185][0186]
为了说明注意力特征交互器在挖掘相关目标对象语义信息中的作用,本技术将在不同子任务上检测到的一些相关对象的map结果如表6所示。可以观察到,与单一模型和mtb相比,mib-head在每个相关对象(如电视tv、鼠标mouse)或混淆对象(如猫cat、狗dog)上的性能都有显著提高。
[0187]
为了进一步观察注意力特征交互器对相关或混淆物体的影响,将其中一些样例的目标检测可视化在图2b中。在第一排,笔记本被错当成了老鼠,猫被错当成了狗,电视被误当成了电视。相反,本技术提出的注意力特征交互器有效地避免了这些误检和漏检,如第二行所示。在热力图上,被误检测到的笔记本和猫的区域热度更低,而被漏检的电视热度则变高。
[0188]
表6:注意力特征交互器、单一模型和mtb网络的研究结果
[0189][0190]
为了准确地观察本技术提出的目标检测方案是如何起作用的,可视化了从coco测试集的一些图像的目标对象的检测结果,如图2c所示。一般来说,很容易看到,单个模型只能检测自己感兴趣的目标对象的类别,而本技术的目标检测模型可以定位所有感兴趣的目标对象。此外,值得注意的是,本技术的方案成功地减少了丢失目标或错误预测的次数。
[0191]
由上可知,本技术可以获取多个训练集,多个训练集与预设目标检测模型中的多个分支一一对应,该训练集中训练图像的标签各不相同,标签用于对训练图像中不同类别的目标对象进行区分;采用训练图像对预设目标检测模型进行训练时,在不同分支之间加入注意力特征交互器,为每个分支提供跨分支的潜在信息,有助于从不同的数据集中发现目标对象之间的潜在关系,然后提出了一种基于迭代滑动窗口的动态损失均衡策略,通过同时考虑一段迭代次数内的损失变化率和损失量级,在每个分支上产生更有效和稳定的反向传播性能。最后,采用训练好的目标检测网络对待检测图像进行目标检测,可以检测出待检测图像中所有感兴趣的对象,从而提升了目标检测的性能。
[0192]
为了更好地实施以上方法,本技术还提供一种目标检测装置,该目标检测装置具体可以集成在电子设备中,该电子设备可以为终端、服务器等设备。其中,终端可以为手机、平板电脑、智能蓝牙设备、笔记本电脑、个人电脑等设备;服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群。
[0193]
比如,在本实施例中,将以目标检测装置具体集成在电子设备为例,对本技术的方法进行详细说明。
[0194]
例如,如图3所示,该目标检测装置可以包括获取单元301、特征提取单元302、分支特征提取单元303、交互单元304以及检测单元305,如下:
[0195]
(一)获取单元301
[0196]
获取单元301,用于获取待检测图像,待检测图像中包括至少一个目标对象。
[0197]
(二)特征提取单元302
[0198]
特征提取单元302,用于对待检测图像进行特征提取,得到多个不同尺度的首部特征。
[0199]
(三)分支特征提取单元303
[0200]
分支特征提取单元303,用于对首部特征进行分支特征提取,得到多个分支对应的分支特征,分支特征为待检测图像中不同类别的目标对象对应的特征。
[0201]
(4)交互单元304
[0202]
交互单元304,用于对多个分支对应的分支特征进行特征交互处理,得到分支对应的分支交互特征。
[0203]
(5)检测单元305
[0204]
检测单元305,用于基于分支对应的分支交互特征检测出待检测图像中的目标对象。
[0205]
在一些实施例中,交互单元304具体用于:
[0206]
获取注意力交互网络;
[0207]
采用注意力交互网络对多个分支对应的分支特征进行特征交互处理,得到分支对应的分支交互特征。
[0208]
在一些实施例中,注意力交互网络包括注意力子网络和特征提取子网络,交互单元304具体用于:
[0209]
对多个分支对应的分支特征进行特征融合处理,得到分支融合特征;
[0210]
采用特征提取子网络对分支融合特征进行特征提取,得到多个新分支特征;
[0211]
采用注意力子网络对新分支特征进行注意力调整,得到调整后的新分支特征;
[0212]
对调整后的新分支特征和对应的分支特征进行残差处理,得到分支对应的分支交互特征。
[0213]
在一些实施例中,分支特征包括第一子分支特征和第二子分支特征,分支融合特征包括第一子分支融合特征和第二子分支融合特征,交互单元304具体用于:
[0214]
对多个分支对应的第一子分支特征进行特征融合处理,得到第一子分支融合特征;
[0215]
对多个分支对应的第二子分支特征进行特征融合处理,得到第二子分支融合特征。
[0216]
在一些实施例中,目标检测装置还用于:
[0217]
获取分支对应的第一子分支输出网络和第二子分支输出网络;
[0218]
分支对应的分支交互特征包括第一子分支特征对应的分支交互特征和第二子分支特征对应的分支交互特征,检测单元具体用于:
[0219]
采用第一子分支输出网络对第一子分支特征对应的分支交互特征进行卷积运算,得到待检测图像中像素点的类别和中心度;
[0220]
采用第二子分支输出网络对第二子分支特征对应的分支交互特征进行卷积运算,得到待检测图像中像素点的距离回归值;
[0221]
基于待检测图像中像素点的类别、中心度和距离回归值,检测出待检测图像中的目标对象。
[0222]
在一些实施例中,分支特征提取单元303具体用于:
[0223]
获取分支提取网络,采用分支提取网络对首部特征进行分支特征提取,得到多个分支对应的分支特征;
[0224]
分支包括第一分支和第二分支,分支提取网络包括第一分支提取网络和第二分支提取子网络,采用分支提取网络对首部特征进行分支特征提取,得到多个分支对应的分支特征,包括:
[0225]
采用第一分支提取网络对首部特征进行分支特征提取,得到第一分支对应的第一
分支特征;
[0226]
采用第二分支提取网络对首部特征进行分支特征提取,得到第二分支对应的第二分支特征。
[0227]
在一些实施例中,特征提取单元302具体用于:
[0228]
获取骨干网络和特征金字塔网络;
[0229]
采用骨干网络对待检测图像进行特征提取,得到多个骨干特征;
[0230]
采用特征金字塔网络对多个骨干特征进行特征提取,得到多个不同尺度的首部特征。
[0231]
在一些实施例中,目标检测装置还用于:
[0232]
获取多个训练集,以及预设目标检测模型,多个训练集与预设目标检测模型中的多个分支一一对应,多个训练集中训练图像的标签各不相同,标签用于对训练图像中不同类别的目标对象进行区分;
[0233]
采用训练图像对预设目标检测模型进行训练,得到目标检测模型。
[0234]
在一些实施例中,预设目标检测模型中每个分支都包括预设的第一子分支输出网络和第二子分支输出网络,目标检测装置还用于:
[0235]
采用预设目标检测模型对训练图像进行目标对象检测,得到分支对应的预设的第一子分支输出网络的第一输出结果和预设的第二子分支输出网络的第二输出结果;
[0236]
根据分支对应的第一输出结果、第二输出结果以及训练图像的标签,确定分支对应的第一损失值和第二损失值;
[0237]
基于分支对应的第一损失值和第二损失值,确定分支对应的损失值;
[0238]
基于分支对应的损失值,确定预设目标检测模型的损失值;
[0239]
根据预设目标检测模型的损失值,对预设目标检测模型的参数进行更新,返回执行采用预设目标检测模型对训练图像进行目标对象检测的步骤,迭代至预设目标检测模型的损失值满足预设条件,得到目标检测模型。
[0240]
在一些实施例中,目标检测装置还用于:
[0241]
确定分支对应的损失变化率;
[0242]
根据分支对应的损失变化率,确定分支对应的损失权重;
[0243]
基于分支对应的损失权重和分支对应的损失值,确定预设目标检测模型的损失值。
[0244]
在一些实施例中,目标检测装置还用于:
[0245]
确定当前迭代滑动窗口分支对应的历史平均损失值,以及当前迭代滑动窗口预设目标检测模型的历史平均损失值,当前迭代滑动窗口表示从第n次迭代到第m次迭代;
[0246]
确定上一迭代滑动窗口分支对应的历史平均损失值,上一迭代滑动窗口表示从第n-j次迭代到第m-j次迭代,j、n和m均为正整数;
[0247]
基于上一迭代滑动窗口分支对应的历史平均损失值、当前迭代滑动窗口分支对应的历史平均损失值以及当前迭代滑动窗口预设目标检测模型的历史平均损失值,确定分支对应的损失变化率。
[0248]
在一些实施例中,目标检测装置还用于:
[0249]
当前迭代滑动窗口预设目标检测模型的历史平均损失值;
[0250]
根据分支对应的损失变化率,确定分支对应的损失权重,包括:
[0251]
基于当前迭代滑动窗口分支对应的历史平均损失值和当前迭代滑动窗口预设目标检测模型的历史平均损失值确定分支对应的损失量级;
[0252]
根据分支对应的损失量级和分支对应的损失变化率,确定分支对应的损失权重。
[0253]
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
[0254]
由上可知,本实施例的目标检测装置可以获取待检测图像,待检测图像中包括至少一个目标对象;对待检测图像进行特征提取,得到多个不同尺度的首部特征;对首部特征进行分支特征提取,得到多个分支对应的分支特征,分支特征为待检测图像中不同类别的目标对象对应的特征;对多个分支对应的分支特征进行特征交互处理,得到分支对应的分支交互特征;基于分支对应的分支交互特征检测出待检测图像中的目标对象。在得到待检测图像的首部特征后,通过不同的分支来提取不同类别的目标对象的特征,并对不同分支的特征进行特征交互处理,从而发现不同类别的目标对象之间的潜在信息,有助于检测出待检测图像中所有感兴趣的对象。由此,提升了目标检测的性能。
[0255]
本技术还提供一种电子设备,该电子设备可以为终端、服务器等设备。其中,终端可以为手机、平板电脑、智能蓝牙设备、笔记本电脑、个人电脑,等等;服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群,等等。
[0256]
在一些实施例中,该目标检测装置还可以集成在多个电子设备中,比如,目标检测装置可以集成在多个服务器中,由多个服务器来实现本技术的目标检测方法。
[0257]
在本实施例中,将以本实施例的电子设备是电子设备为例进行详细描述,比如,如图4所示,其示出了本技术所涉及的电子设备的结构示意图,具体来讲:
[0258]
该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403、输入模块404以及通信模块405等部件。本领域技术人员可以理解,图4中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
[0259]
处理器401是该电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。在一些实施例中,处理器401可包括一个或多个处理核心;在一些实施例中,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
[0260]
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包
括存储器控制器,以提供处理器401对存储器402的访问。
[0261]
电子设备还包括给各个部件供电的电源403,在一些实施例中,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
[0262]
该电子设备还可包括输入模块404,该输入模块404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
[0263]
该电子设备还可包括通信模块405,在一些实施例中通信模块405可以包括无线模块,电子设备可以通过该通信模块405的无线模块进行短距离无线传输,从而为用户提供了无线的宽带互联网访问。比如,该通信模块405可以用于帮助用户收发电子邮件、浏览网页和访问流式媒体等。
[0264]
尽管未示出,电子设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,电子设备中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
[0265]
获取待检测图像,待检测图像中包括至少一个目标对象;
[0266]
对待检测图像进行特征提取,得到多个不同尺度的首部特征;
[0267]
对首部特征进行分支特征提取,得到多个分支对应的分支特征,分支特征为待检测图像中不同类别的目标对象对应的特征;
[0268]
对多个分支对应的分支特征进行特征交互处理,得到分支对应的分支交互特征;
[0269]
基于分支对应的分支交互特征检测出待检测图像中的目标对象。
[0270]
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
[0271]
由上可知,电子设备可以获取待检测图像,待检测图像中包括至少一个目标对象;对待检测图像进行特征提取,得到多个不同尺度的首部特征;对首部特征进行分支特征提取,得到多个分支对应的分支特征,分支特征为待检测图像中不同类别的目标对象对应的特征;对多个分支对应的分支特征进行特征交互处理,得到分支对应的分支交互特征;基于分支对应的分支交互特征检测出待检测图像中的目标对象。在得到待检测图像的首部特征后,通过不同的分支来提取不同类别的目标对象的特征,并对不同分支的特征进行特征交互处理,从而发现不同类别的目标对象之间的潜在信息,有助于检测出待检测图像中所有感兴趣的对象。由此,提升了目标检测的性能。
[0272]
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
[0273]
为此,本技术提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本技术所提供的任一种目标检测方法中的步骤。例如,该指令可以执行如下步骤:
[0274]
获取待检测图像,待检测图像中包括至少一个目标对象;
[0275]
对待检测图像进行特征提取,得到多个不同尺度的首部特征;
[0276]
对首部特征进行分支特征提取,得到多个分支对应的分支特征,分支特征为待检测图像中不同类别的目标对象对应的特征;
[0277]
对多个分支对应的分支特征进行特征交互处理,得到分支对应的分支交互特征;
[0278]
基于分支对应的分支交互特征检测出待检测图像中的目标对象。
[0279]
其中,该存储介质可以包括:只读存储器(rom,read only memory)、随机存取记忆体(ram,random access memory)、磁盘或光盘等。
[0280]
根据本技术的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中提供的计算机视觉方面或者监控方面的各种可选实现方式中提供的方法。
[0281]
由于该存储介质中所存储的指令,可以执行本技术所提供的任一种目标检测方法中的步骤,因此,可以实现本技术所提供的任一种目标检测方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
[0282]
以上对本技术所提供的一种目标检测方法、装置、电子设备和计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1