一种基于改进ATSS的目标检测方法及装置与流程

文档序号:32159920发布日期:2022-11-12 02:04阅读:66来源:国知局
一种基于改进ATSS的目标检测方法及装置与流程
一种基于改进atss的目标检测方法及装置
技术领域
1.本发明涉及图像处理、智慧停车、目标检测,特别涉及一种基于改进atss的目标检测方法及装置。


背景技术:

2.目标检测是指计算机和软件系统在图像/场景中定位并识别出每个目标的能力,已广泛应用于人脸检测、车辆检测、行人计数、网络图像、安全系统和无人驾驶汽车等领域。
3.在实际运用中,目标检测要求保证实时性的同时,对视频中的小目标、遮挡目标也有较高的检测率和准确率。
4.现有的基于atss(adaptive training sample selection)的目标检测方法,在模型训练中,在样本分配阶段存在样本分配不均、不同目标样本点分配重叠等问题,从而造成遮挡目标漏检、检测框不稳定的问题。
5.综上所述,目前迫切需要提出一种解决上述问题的基于改进atss的目标检测方法。


技术实现要素:

6.有鉴于此,本发明的主要目的在于提供一种基于改进atss的目标检测方法,能够实现精度和速度并重。
7.为达到上述目的,按照本发明的第一个方面,提供了一种基于改进atss的目标检测方法,该方法包括:
8.第一步骤,搜集样本图像,并进行标注,以获得已标注的样本图像;
9.第二步骤,对已标注的样本图像进行图像预处理,获取训练数据;
10.第三步骤,将训练数据输入基于改进atss的目标检测网络,进行反复训练,得到训练好的目标检测模型;
11.第四步骤,将待检测图像输入目标检测模型,获得目标检测结果并输出。
12.进一步地,所述图像预处理包括以下的一种或多种:亮度颜色调整、图像缩放、图像翻转、遮挡目标随机裁剪。将已标注的样本图像经过图像预处理后的图像作为训练数据。
13.所述遮挡目标随机裁剪包括以下步骤:
14.随机裁剪步骤,在已标注的样本图像上随机选择左上坐标点和右下坐标,作为裁剪小图起始点和终点,同时更新裁剪小图的目标坐标值;
15.裁剪率判断步骤,分别计算已标注的样本图像中目标的面积a、裁剪小图中目标的面积ca;计算裁剪率如果裁剪率rc高于裁剪率阈值,则裁剪小图无效;
16.被遮挡率判断步骤,在裁剪小图上,针对每个目标,分别计算目标的面积ca、目标与其他目标的重叠面积coa,计算目标的被遮挡率如果目标的被遮挡率ro高于遮
挡阈值,则裁剪小图无效;
17.随机裁剪输出步骤,若裁剪小图无效,则输出已标注的样本图像作为训练数据,否则认为裁剪小图有效,则输出裁剪小图作为训练数据。
18.进一步地,所述第三步骤包括:
19.特征金字塔获取步骤,输入训练数据,经过基于改进atss的目标检测网络的骨干网络和特征融合网络后,得到3个不同维度的特征层;
20.分类定位预测结果获取步骤,特征层经过基于改进atss的目标检测网络的分类定位网络后,分别得到对应特征层的锚点的分类预测结果和定位预测结果;
21.分类定位真实结果获取步骤,针对每个特征层,在基于改进atss的目标检测网络的检测网络的训练过程中,在特征层上,为检测目标铺设正样本点和负样本点;铺设样本点完成后,即为各锚点分配了真实的分类和定位框信息;
22.检测网络的网络损失计算步骤,针对每个特征层,计算特征层分类预测结果、定位预测结果与真实分类结果、真实定位结果的差异,得到检测网络的网络损失;
23.反向传播步骤,根据网络损失反向传播,不断优化基于改进atss的目标检测网络,直至基于改进atss的目标检测网络收敛,得到训练好的目标检测模型。
24.其中,所述3个不同维度的特征层分别为:低层特征层金字塔、中层特征层金字塔、高层特征层金字塔。
25.进一步地,所述分类定位真实结果获取步骤包括:
26.预选正样本点获取步骤,在每个特征层上,选择与目标中心点距离最近的n个样本点,作为预选正样本点,所有特征层的预选样本点的集合标记为u0;
27.正样本阈值计算步骤,计算预选正样本点集合u0中所有预选正样本点的iou平均值,作为正样本阈值ptr;
28.正样本点和负样本点获取步骤,针对预选正样本点集合u0中的预选正样本点,将与目标的iou值大于正样本阈值ptr的预选正样本点定义为正样本点;如果目标的正样本点数量小于n,则在所有预选正样本中选择iou值最高的n个样本点,定义为正样本点;将特征层的所有锚点中,除正样本点以外的样本点都定义为负样本点;
29.多目标正样本点分配步骤,在同一特征层或不同特征层上,若正样本点同时分配给两个或多个目标,则将对应的正样本点分配给与目标中心点距离较近的目标;
30.真实的分类和定位框获取步骤,根据锚点的锚框获取真实的定位框;当锚点检测为正样本点时,则将锚点对应的真实的定位框分类为目标类;当锚点检测结果为负样本点时,将锚点对应的真实的定位框分类为背景类。
31.其中,所述预选正样本的iou为预选正样本点锚框与目标框的交并比;;n表示样本点数量阈值。
32.进一步地,所述真实的分类和定位框获取步骤中根据锚点的锚框获取真实的定位框包括:假设锚点的横坐标和纵坐标分别为x、y,锚框的宽度和高度分别为w、h,基于改进atss的目标检测网络预测的目标框偏差值分别为dx、dy、dw、dh,则锚点对应的真实的定位框的宽度为pw=w*exp(dw)、高度为ph=h*exp(dh),真实的定位框的中心点横坐标为px=x+dx*pw、纵坐标为py=y+dy*pw,真实的定位框的左上顶点横坐标为px1=px-0.5*pw、纵坐标为py1=py-0.5*ph,真实的定位框的右下顶点横坐标为px2=px+0.5*pw、纵坐标为py2=
py+0.5*ph。
33.按照本发明的另一个方面,提供了一种基于改进atss的目标检测装置,该装置包括:
34.样本图像搜集标注模块,用于搜集样本图像,并进行标注,以获得已标注的样本图像;
35.图像预处理模块,用于对已标注的样本图像进行图像预处理,获取训练数据;
36.基于改进atss的目标检测网络训练模块,用于将训练数据输入基于改进atss的目标检测网络,进行反复训练,得到训练好的目标检测模型;
37.目标检测模型检测模块,用于将待检测图像输入目标检测模型,获得目标检测结果并输出。
38.进一步地,所述图像预处理模块包括以下的一种或多种模块:亮度颜色调整模块、图像缩放模块、图像翻转模块、遮挡目标随机裁剪模块。将已标注的样本图像经过图像预处理后的图像作为训练数据。
39.进一步地,所述遮挡目标随机模块包括:
40.随机裁剪模块,用于在已标注的样本图像上随机选择左上坐标点和右下坐标,作为裁剪小图起始点和终点,同时更新裁剪小图的目标坐标值;
41.裁剪率判断模块,用于分别计算已标注的样本图像中目标的面积a、裁剪小图中目标的面积ca;计算裁剪率如果裁剪率rc高于裁剪率阈值,则裁剪小图无效;
42.被遮挡率判断模块,用于在裁剪小图上,针对每个目标,分别计算目标的面积ca、目标与其他目标的重叠面积coa,计算目标的被遮挡率如果目标的被遮挡率ro高于遮挡阈值,则裁剪小图无效;
43.随机裁剪输出模块,用于若裁剪小图无效,则输出已标注的样本图像作为训练数据,否则认为裁剪小图有效,则输出裁剪小图作为训练数据。
44.进一步地,所述基于改进atss的目标检测网络训练模块包括:
45.特征金字塔获取模块,用于输入训练数据,经过基于改进atss的目标检测网络的骨干网络和特征融合网络后,得到3个不同维度的特征层;
46.分类定位预测结果获取模块,用于特征层经过基于改进atss的目标检测网络的分类定位网络后,分别得到对应特征层的锚点的分类预测结果和定位预测结果;
47.分类定位真实结果获取模块,用于针对每个特征层,在基于改进atss的目标检测网络的检测网络的训练过程中,在特征层上,为检测目标铺设正样本点和负样本点;铺设样本点完成后,即为各锚点分配了真实的分类和定位框信息;
48.检测网络的网络损失计算模块,用于针对每个特征层,计算特征层分类预测结果、定位预测结果与真实分类结果、真实定位结果的差异,得到检测网络的网络损失;
49.反向传播模块,用于根据网络损失反向传播,不断优化基于改进atss的目标检测网络,直至基于改进atss的目标检测网络收敛,得到训练好的目标检测模型。
50.其中,所述3个不同维度的特征层分别为:低层特征层金字塔、中层特征层金字塔、高层特征层金字塔。
51.进一步地,所述分类定位真实结果获取模块包括:
52.预选正样本点获取模块,用于在每个特征层上,选择与目标中心点距离最近的n个样本点,作为预选正样本点,所有特征层的预选样本点的集合标记为u0;
53.正样本阈值计算模块,用于计算预选正样本点集合u0中所有预选正样本点的iou平均值,作为正样本阈值ptr;
54.正样本点和负样本点获取模块,用于针对预选正样本点集合u0中的预选正样本点,将与目标的iou值大于正样本阈值ptr的预选正样本点定义为正样本点;如果目标的正样本点数量小于n,则在所有预选正样本中选择iou值最高的n个样本点,定义为正样本点;将特征层的所有锚点中,除正样本点以外的样本点都定义为负样本点;
55.多目标正样本点分配模块,用于在同一特征层或不同特征层上,若正样本点同时分配给两个或多个目标,则将对应的正样本点分配给与目标中心点距离较近的目标;
56.真实的分类和定位框获取模块,用于根据锚点的锚框获取真实的定位框;当锚点检测为正样本点时,则将锚点对应的真实的定位框分类为目标类;当锚点检测结果为负样本点时,将锚点对应的真实的定位框分类为背景类。
57.其中,所述预选正样本的iou为预选正样本点锚框与目标框的交并比;n表示样本点数量阈值。
58.与现有的目标检测技术相比,本发明的一种基于改进atss的目标检测方法的优点在于:对视频中的小目标、遮挡目标也有较高的检测率和准确率。
附图说明
59.图1示出了按照本发明的一种基于改进atss的目标检测方法的流程图。
60.图2示出了按照本发明的一种基于改进atss的目标检测装置的框架图。
具体实施方式
61.为使本领域的技术人员能进一步了解本发明的结构、特征及其他目的,现结合所附较佳实施例详细说明如下,所说明的较佳实施例仅用于说明本发明的技术方案,并非限定本发明。
62.图1给出了按照本发明的一种基于改进atss的目标检测方法的流程图。如图1所示,按照本发明的一种基于改进atss的目标检测方法包括:
63.第一步骤s1,搜集样本图像,并进行标注,以获得已标注的样本图像;
64.第二步骤s2,对已标注的样本图像进行图像预处理,获取训练数据;
65.第三步骤s3,将训练数据输入基于改进atss的目标检测网络,进行反复训练,得到训练好的目标检测模型;
66.第四步骤s4,将待检测图像输入目标检测模型,获得目标检测结果并输出。
67.其中,所述第一步骤s1包括:搜集不同场景、不同光照情况下含有目标的图像,作为样本图像;对样本图像中的目标进行标注,标注目标的位置和信息,从而获得已标注的样本图像。所述目标包括以下的一种或多种:车辆、车牌、行人、人脸、动物等。
68.进一步地,所述图像预处理包括以下的一种或多种:亮度颜色调整、图像缩放、图像翻转、遮挡目标随机裁剪。将已标注的样本图像经过图像预处理后的图像作为训练数据。
69.示例性地,所述图像预处理采用亮度颜色调整、图像缩放、图像翻转、遮挡目标随机裁剪4种图像处理,所述训练数据包括:已标注的样本图像经过亮度颜色调整处理后的图像、已标注的样本图像经过图像缩放处理后的图像、已标注的样本图像经过图像翻转处理后的图像、已标注的样本图像经过遮挡目标随机裁剪处理后的图像。
70.所述亮度颜色调整、图像缩放、图像翻转可以通过现有的图像处理软件实现。
71.所述遮挡目标随机裁剪包括以下步骤:
72.随机裁剪步骤s21,在已标注的样本图像上随机选择左上坐标点和右下坐标,作为裁剪小图起始点和终点,同时更新裁剪小图的目标坐标值;
73.裁剪率判断步骤s22,分别计算已标注的样本图像中目标的面积a、裁剪小图中目标的面积ca;计算裁剪率如果裁剪率rc高于裁剪率阈值,则裁剪小图无效;
74.被遮挡率判断步骤s23,在裁剪小图上,针对每个目标,分别计算目标的面积ca、目标与其他目标的重叠面积coa,计算目标的被遮挡率如果目标的被遮挡率ro高于遮挡阈值,则裁剪小图无效;
75.随机裁剪输出步骤s24,若裁剪小图无效,则输出已标注的样本图像作为训练数据,否则认为裁剪小图有效,则输出裁剪小图作为训练数据。
76.所述第二步骤s2中遮挡目标随机裁剪是获取经过遮挡目标随机裁剪处理后的训练数据,从而保证训练数据中目标保持合适的尺寸和遮挡率。
77.其中,所述裁剪率判断步骤s22是为了保证裁剪后的目标保留基本的语义信息,以避免因为裁剪小图的尺寸过小而导致目标的误检。
78.所述被遮挡率判断步骤s23是为了保证裁剪后不出现被极端遮挡的目标,从而避免因为裁剪小图中目标被极端遮挡而导致目标的误检。
79.进一步地,所述裁剪率阈值的取值范围为0.1~0.6,所述遮挡阈值的取值范围为0.5~0.9。示例性地,所述裁剪率阈值选为0.5,所述选为0.8。
80.其中,所述基于atss(adaptive training sample selection)的目标检测网络能够自动根据目标的相关统计特征选择合适的anchor box作为正样本,在不带来额外计算量和参数的情况下,能够大幅提升目标检测模型的性能。示例性地,可参见参考文献“bridging the gap between anchor-based and anchor-free detection via adaptive training sample selection.s zhang,c chi,y yao,z lei,sz li.2020ieee/cvf conference on computer vision and pattern recognition(cvpr)”。
81.进一步地,所述第三步骤s3包括:
82.特征金字塔获取步骤s31,输入训练数据,经过基于改进atss的目标检测网络的骨干网络和特征融合网络后,得到3个不同维度的特征层;
83.分类定位预测结果获取步骤s32,特征层经过基于改进atss的目标检测网络的分类定位网络后,分别得到对应特征层的锚点的分类预测结果和定位预测结果;
84.分类定位真实结果获取步骤s33,针对每个特征层,在基于改进atss的目标检测网络的检测网络的训练过程中,在特征层上,为检测目标铺设正样本点和负样本点;铺设样本点完成后,即为各锚点分配了真实的分类和定位框信息;
85.检测网络的网络损失计算步骤s34,针对每个特征层,计算特征层分类预测结果、定位预测结果与真实分类结果、真实定位结果的差异,得到检测网络的网络损失;
86.反向传播步骤s35,根据网络损失反向传播,不断优化基于改进atss的目标检测网络,直至基于改进atss的目标检测网络收敛,得到训练好的目标检测模型。
87.其中,所述3个不同维度的特征层分别为:低层特征层金字塔、中层特征层金字塔、高层特征层金字塔。各特征层语义信息和感受野不同,低层特征层负责检测小目标、中层特征层负责检测中目标,高层特征层负责检测大目标。
88.进一步地,所述分类定位真实结果获取步骤s33包括:
89.预选正样本点获取步骤s331,在每个特征层上,选择与目标中心点距离最近的n个样本点,作为预选正样本点,所有特征层的预选样本点的集合标记为u0;
90.正样本阈值计算步骤s332,计算预选正样本点集合u0中所有预选正样本点的iou平均值,作为正样本阈值ptr;
91.正样本点和负样本点获取步骤s333,针对预选正样本点集合u0中的预选正样本点,将与目标的iou值大于正样本阈值ptr的预选正样本点定义为正样本点;如果目标的正样本点数量小于n,则在所有预选正样本中选择iou值最高的n个样本点,定义为正样本点;将特征层的所有锚点中,除正样本点以外的样本点都定义为负样本点;
92.多目标正样本点分配步骤s334,在同一特征层或不同特征层上,若正样本点同时分配给两个或多个目标,则将对应的正样本点分配给与目标中心点距离较近的目标;
93.真实的分类和定位框获取步骤s335,根据锚点的锚框获取真实的定位框;当锚点检测为正样本点时,则将锚点对应的真实的定位框分类为目标类;当锚点检测结果为负样本点时,将锚点对应的真实的定位框分类为背景类。
94.其中,所述预选正样本的iou为预选正样本点锚框与目标框的交并比;n表示样本点数量阈值。
95.进一步地,所述样本点数量阈值n的取值范围为9~16。示例性地,所述样本点数量阈值n选为12。
96.所述基于改进atss的目标检测网络与基于atss的目标检测网络的区别在于:(1)将预选正样本点的iou平均值作为正样本阈值ptr;(2)在所述正样本点和负样本点获取步骤s333中增加了正样本点数量的判断机制;(3)增加了所述多目标正样本点分配步骤s334。
97.基于atss的目标检测网络的正样本阈值ptr定义为iou平均值与均方差的和。由于均方差只是描述样本iou与均值的离散程度,若低于平均值的样本偏差更远时,该阈值的设置偏大,则所有预选正样本点都会被舍弃掉,从而导致目标漏检。为了解决该问题,所述正样本阈值计算步骤s332中将预选正样本的iou平均值作为正样本阈值ptr。
98.所述正样本点和负样本点获取步骤s333与基于atss的目标检测网络的区别在于:增加了正样本点数量的判断机制,当目标的正样本点的数量小于n时,自动选择iou值最高的n个锚点为正样本点,以提升目标的检测率。
99.基于atss的目标检测网络中,只是针对同一特征层同一锚点分配给多个目标的正样本分配做了处理,但未对不同特征层上的此类情况做处理。故若在图像的同一位置的不同特征层的两个锚点,同时分配给不同的目标,就会造成该锚点的检测框标注信息不明确,从而在实际检测中出现互相遮挡目标的检测框来回跳变的情况。所述多目标正样本点分配
步骤s334解决了上述问题。
100.所述真实的分类和定位框获取步骤s335中根据锚点的锚框获取真实的定位框包括:假设锚点的横坐标和纵坐标分别为x、y,锚框的宽度和高度分别为w、h,基于改进atss的目标检测网络预测的目标框偏差值分别为dx、dy、dw、dh,则锚点对应的真实的定位框的宽度为pw=w*exp(dw)、高度为ph=h*exp(dh),真实的定位框的中心点横坐标为px=x+dx*pw、纵坐标为py=y+dy*pw,真实的定位框的左上顶点横坐标为px1=px-0.5*pw、纵坐标为py1=py-0.5*ph,真实的定位框的右下顶点横坐标和纵坐标分别为px2=px+0.5*pw、py2=py+0.5*ph。
101.图2给出了按照本发明的一种基于改进atss的目标检测装置的框架图。如图2所示,按照本发明的一种基于改进atss的目标检测装置包括:
102.样本图像搜集标注模块1,用于搜集样本图像,并进行标注,以获得已标注的样本图像;
103.图像预处理模块2,用于对已标注的样本图像进行图像预处理,获取训练数据;
104.基于改进atss的目标检测网络训练模块3,用于将训练数据输入基于改进atss的目标检测网络,进行反复训练,得到训练好的目标检测模型;
105.目标检测模型检测模块4,用于将待检测图像输入目标检测模型,获得目标检测结果并输出。
106.其中,所述样本图像搜集标注模块1包括:用于搜集不同场景、不同光照情况下含有目标的图像,作为样本图像;对样本图像中的目标进行标注,标注目标的位置和信息,从而获得已标注的样本图像。所述目标包括以下的一种或多种:车辆、车牌、行人、人脸、动物等。
107.进一步地,所述图像预处理模块2包括以下的一种或多种模块:亮度颜色调整模块、图像缩放模块、图像翻转模块、遮挡目标随机裁剪模块。将已标注的样本图像经过图像预处理后的图像作为训练数据。
108.进一步地,所述遮挡目标随机模块包括:
109.随机裁剪模块21,用于在已标注的样本图像上随机选择左上坐标点和右下坐标,作为裁剪小图起始点和终点,同时更新裁剪小图的目标坐标值;
110.裁剪率判断模块22,用于分别计算已标注的样本图像中目标的面积a、裁剪小图中目标的面积ca;计算裁剪率如果裁剪率rc高于裁剪率阈值,则裁剪小图无效;
111.被遮挡率判断模块23,用于在裁剪小图上,针对每个目标,分别计算目标的面积ca、目标与其他目标的重叠面积coa,计算目标的被遮挡率如果目标的被遮挡率ro高于遮挡阈值,则裁剪小图无效;
112.随机裁剪输出模块24,用于若裁剪小图无效,则输出已标注的样本图像作为训练数据,否则认为裁剪小图有效,则输出裁剪小图作为训练数据。
113.进一步地,所述裁剪率阈值的取值范围为0.1~0.6,所述遮挡阈值的取值范围为0.5~0.9。示例性地,所述裁剪率阈值选为0.5,所述选为0.8。
114.其中,所述基于atss(adaptive training sample selection)的目标检测网络能
够自动根据目标的相关统计特征选择合适的anchor box作为正样本,在不带来额外计算量和参数的情况下,能够大幅提升目标检测模型的性能。示例性地,可参见参考文献“bridging the gap between anchor-based and anchor-free detection via adaptive training sample selection.s zhang,c chi,y yao,z lei,sz li.2020ieee/cvf conference on computer vision and pattern recognition(cvpr)”。
115.进一步地,所述基于改进atss的目标检测网络训练模块3包括:
116.特征金字塔获取模块31,用于输入训练数据,经过基于改进atss的目标检测网络的骨干网络和特征融合网络后,得到3个不同维度的特征层;
117.分类定位预测结果获取模块32,用于特征层经过基于改进atss的目标检测网络的分类定位网络后,分别得到对应特征层的锚点的分类预测结果和定位预测结果;
118.分类定位真实结果获取模块33,用于针对每个特征层,在基于改进atss的目标检测网络的检测网络的训练过程中,在特征层上,为检测目标铺设正样本点和负样本点;铺设样本点完成后,即为各锚点分配了真实的分类和定位框信息;
119.检测网络的网络损失计算模块34,用于针对每个特征层,计算特征层分类预测结果、定位预测结果与真实分类结果、真实定位结果的差异,得到检测网络的网络损失;
120.反向传播模块35,用于根据网络损失反向传播,不断优化基于改进atss的目标检测网络,直至基于改进atss的目标检测网络收敛,得到训练好的目标检测模型。
121.其中,所述3个不同维度的特征层分别为:低层特征层金字塔、中层特征层金字塔、高层特征层金字塔。各特征层语义信息和感受野不同,低层特征层负责检测小目标、中层特征层负责检测中目标,高层特征层负责检测大目标。
122.进一步地,所述分类定位真实结果获取模块33包括:
123.预选正样本点获取模块331,用于在每个特征层上,选择与目标中心点距离最近的n个样本点,作为预选正样本点,所有特征层的预选样本点的集合标记为u0;
124.正样本阈值计算模块332,用于计算预选正样本点集合u0中所有预选正样本点的iou平均值,作为正样本阈值ptr;
125.正样本点和负样本点获取模块333,用于针对预选正样本点集合u0中的预选正样本点,将与目标的iou值大于正样本阈值ptr的预选正样本点定义为正样本点;如果目标的正样本点数量小于n,则在所有预选正样本中选择iou值最高的n个样本点,定义为正样本点;将特征层的所有锚点中,除正样本点以外的样本点都定义为负样本点;
126.多目标正样本点分配模块334,用于在同一特征层或不同特征层上,若正样本点同时分配给两个或多个目标,则将对应的正样本点分配给与目标中心点距离较近的目标;
127.真实的分类和定位框获取模块335,用于根据锚点的锚框获取真实的定位框;当锚点检测为正样本点时,则将锚点对应的真实的定位框分类为目标类;当锚点检测结果为负样本点时,将锚点对应的真实的定位框分类为背景类。
128.其中,所述预选正样本的iou为预选正样本点锚框与目标框的交并比;;n表示样本点数量阈值。
129.进一步地,所述样本点数量阈值n的取值范围为9~16。
130.所述基于改进atss的目标检测网络与基于atss的目标检测网络的区别在于:(1)将预选正样本点的iou平均值作为正样本阈值ptr;(2)在所述正样本点和负样本点获取模
块333中增加了正样本点数量的判断机制;(3)增加了所述多目标正样本点分配模块334。
131.进一步地,所述真实的分类和定位框获取模块335中根据锚点的锚框获取真实的定位框包括:假设锚点的横坐标和纵坐标分别为x、y,锚框的宽度和高度分别为w、h,基于改进atss的目标检测网络预测的目标框偏差值分别为dx、dy、dw、dh,则锚点对应的真实的定位框的宽度为pw=w*exp(dw)、高度为ph=h*exp(dh),真实的定位框的中心点横坐标为px=x+dx*pw、纵坐标为py=y+dy*pw,真实的定位框的左上顶点横坐标为px1=px-0.5*pw、纵坐标为py1=py-0.5*ph,真实的定位框的右下顶点横坐标为px2=px+0.5*pw、纵坐标为py2=py+0.5*ph。
132.与现有的目标检测技术相比,本发明的一种基于改进atss的目标检测方法的优点在于:对视频中的小目标、遮挡目标也有较高的检测率和准确率。
133.以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,应当理解,本发明并不限于这里所描述的实现方案,这些实现方案描述的目的在于帮助本领域中的技术人员实践本发明。任何本领域中的技术人员很容易在不脱离本发明精神和范围的情况下进行进一步的改进和完善,因此本发明只受到本发明权利要求的内容和范围的限制,其意图涵盖所有包括在由所附权利要求所限定的本发明精神和范围内的备选方案和等同方案。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1