本发明涉及目标检测,具体而言,涉及一种目标检测方法、装置、计算机设备及可读存储介质。
背景技术:
1、目标检测是计算机视觉领域内的一项基本技术,它被直接或间接的应用于各个行业领域,例如自动驾驶,人脸识别,监控安防等等。目标检测的性能直接影响了后续任务的效果,所以目标检测技术的研究也趋向于高精度和高效率的方向发展。
2、随着计算机视觉技术和人工智能技术的发展,卷积神经网络成为当前目标检测技术的主流框架,当前主流的检测方式采用了直接预测的方式输出目标的位置和尺度,这种直接预测的方式在模型训练过程中容易受到训练集中目标尺度分布的影响,使得模型在预测不同尺度目标时预测值范围波动较大,影响网络收敛和模型性能。
技术实现思路
1、本发明的目的之一在于提供一种目标检测方法、装置、计算机设备及可读存储介质,用以提高目标检测准确性和效率,本发明的实施例可以这样实现:
2、第一方面,本发明提供一种目标检测方法,所述方法包括:获取待检测图像;利用训练后的目标检测模型,检测所述待检测图像中是否存在目标;若存在,利用所述目标检测模型的检测头模块,从所述待检测图像的特征图中,确定所述目标对应的坐标偏移量预测值、尺度偏移量预测值以及最大概率尺度分类;根据所述坐标偏移量预测值,确定所述目标对应的预测框的坐标,并根据所述尺度偏移量预测值和所述最大概率尺度分类确定所述预测框的尺度。
3、第二方面,本发明提供一种目标检测装置,所述方法包括:获取模块,用于获取待检测图像;检测模块,用于利用训练后的目标检测模型,检测所述待检测图像中是否存在目标;预测模块,用于若存在,利用所述目标检测模型的检测头模块,从所述待检测图像的特征图中,确定所述目标对应的坐标偏移量预测值、尺度偏移量预测值以及最大概率尺度分类;所述预测模块,还用于根据所述坐标偏移量预测值,确定所述目标对应的预测框的坐标,并根据所述尺度偏移量预测值和所述最大概率尺度分类确定所述预测框的尺度。
4、第三方面,本发明提供一种计算机设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机程序,所述处理器可执行所述计算机程序以实现第一方面所述的方法。
5、第四方面,本发明提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的方法。
6、本发明提供的目标检测方法、装置、计算机设备及可读存储介质,首先通过目标检测模型检测待检测图像中是否存在目标,若存在,则利用目标检测模型的检测头模块,从待检测图像的特征图中,确定目标对应的坐标偏移量预测值、尺度偏移量预测值以及最大概率尺度分类,最后根据坐标偏移量预测值,确定目标对应的预测框的坐标,并根据尺度偏移量预测值和最大概率尺度分类确定预测框的尺度。上述过程通过目标检测模型可以预测目标对应的最大概率尺度分类,然后基于最大概率尺度分类来计算目标的尺度,整个将直接预测尺度的问题转换为尺度的多尺度分类问题,相比较于直接预测目标尺度的方法,本发明不受目标实际尺度的影响,提高了检测结果的准确性和效率。
1.一种目标检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的目标检测方法,其特征在于,若存在,利用所述目标检测模型的检测头模块,从所述待检测图像的特征图中,确定所述目标对应的坐标偏移量预测值、尺度偏移量预测值以及最大概率尺度分类,包括:
3.根据权利要求1所述的方法,其特征在于,利用训练后的目标检测模型,检测所述待检测图像中是否存在目标,包括:
4.根据权利要求3所述的方法,其特征在于,在当存在对象预测值大于预设阈值的目标特征点,则确定所述目标特征点对应的图像位置上存在所述目标之后,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,根据所述坐标偏移量预测值,确定所述目标对应的预测框的坐标,并根据所述尺度偏移量预测值和所述最大概率尺度分类确定所述预测框的尺度,包括:
6.根据权利要求1-5任意一项所述的方法,其特征在于,所述目标检测模型是通过如下方式训练得到的:
7.根据权利要求6所述的方法,其特征在于,所述损失函数包括均方误差损失项和交叉熵损失项;其中,所述均方误差损失项分别由坐标偏移量损失和尺度偏移量损失求和得到;所述交叉熵损失项是由对象损失、类别损失以及尺度分类损失求和得到。
8.根据权利要求6所述的方法,其特征在于,当所述特征点存在目标框,利用所述目标检测模型的特征检测头模块,基于所述特征图,确定各个所述特征点对应的实际特征值,包括:
9.一种目标检测装置,其特征在于,包括:
10.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机程序,所述处理器可执行所述计算机程序以实现权利要求1至8任一项所述的方法。
11.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的方法。