本申请涉及目标检测领域,具体涉及目标检测方法、装置及相应模型训练方法、装置。
背景技术:
在现有的自动驾驶场景中,利用激光雷达对场景中目标进行检测,确定目标与自动驾驶设备之间的相对位置、目标的种类等信息是一种常用手段。但是现有技术所能够检测的目标类别较少,例如,只能判断出一个目标是汽车,而无法识别出具体是大型车还是中型车,是面包车还是suv(运动型实用汽车),也就是仅能够支持小类别识别的场景,不能有效地对大类别目标进行有效的识别。
技术实现要素:
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的目标检测方法、装置及相应模型训练方法、装置。
依据本申请的一个方面,提供了一种目标检测模型的训练方法,所述目标为自动驾驶场景中的待关注对象,所述方法包括:
对带有标注的原始训练数据进行分析,确定原始训练数据所包含的标注类别分布;
依据所述标注类别分布对原始训练数据进行数据增广,得到训练数据;
根据所述训练数据对目标检测模型进行迭代训练,直至满足训练停止条件。
可选地,所述原始训练数据为三维点云图,所述依据所述标注类别分布对原始训练数据进行数据增广,得到训练数据包括:
依据所述标注类别分布,确定待增广类别;
选取带有待增广类别的标注的三维点云图,对选取的三维点云图进行若干次整图复制;和/或,从选取的三维点云图中复制出与待增广类别的标注对应的三维点云,将复制出的三维点云与基础点云图进行融合,得到融合点云图。
可选地,所述基础点云图是从原始数据中随机选取的,所述将复制出的三维点云与基础点云图进行融合包括:
根据复制出的三维点云在原始三维点云图中距离激光坐标系原点的相对位置,确定复制出的三维点云在基础点云图中的可放置区域;
从所述可放置区域中选取与指定空间元素相近,且不与已标注目标重合的区域放置复制出的三维点云。
可选地,所述根据所述训练数据对目标检测模型进行迭代训练包括:
根据标注所对应的目标的尺寸划分多个尺寸区间,为每个尺寸区间分别确定一个特征图尺度;
根据输入到目标检测模型的一条训练数据所包含目标的尺寸,确定与该条训练数据包含的各目标分别对应的指定特征图尺度;
由目标检测模型对该条训练数据进行卷积,得到各指定特征图尺度下的特征图,利用得到的各特征图分别对相应的目标进行检测框回归训练。
可选地,所述根据所述训练数据对目标检测模型进行迭代训练还包括:
对训练数据进行统计分析,确定每个特征图尺度下,各类目标的标注数量分布;
根据标注数量分布将目标划分为多个训练类别;
在利用得到的各特征图分别对相应的目标进行检测框回归训练时,使用多头注意力,在同一特征图中对每个训练类别的下的各目标分别进行检测框回归和分类。
可选地,所述使用多头注意力,在同一特征图中对每个训练类别的下的各目标分别进行检测框回归和分类包括:
根据各目标的出现频率和/或次数,确定相应的多头注意力权重。
依据本申请的另一个方面,提供了一种目标检测方法,包括:
利用如上述任一项所述的方法训练得到的目标检测模型对三维点云图进行检测。
依据本申请的又一个方面,提供了一种目标检测模型的训练装置,所述目标为自动驾驶场景中的待关注对象,所述装置包括:
分析单元,用于对带有标注的原始训练数据进行分析,确定原始训练数据所包含的标注类别分布;
增广单元,用于依据所述标注类别分布对原始训练数据进行数据增广,得到训练数据;
训练单元,用于根据所述训练数据对目标检测模型进行迭代训练,直至满足训练停止条件。
可选地,所述原始训练数据为三维点云图,所述增广单元,用于依据所述标注类别分布,确定待增广类别;选取带有待增广类别的标注的三维点云图,对选取的三维点云图进行若干次整图复制;和/或,从选取的三维点云图中复制出与待增广类别的标注对应的三维点云,将复制出的三维点云与基础点云图进行融合,得到融合点云图。
可选地,所述基础点云图是从原始数据中随机选取的,所述增广单元,用于根据复制出的三维点云在原始三维点云图中距离激光坐标系原点的相对位置,确定复制出的三维点云在基础点云图中的可放置区域;从所述可放置区域中选取与指定空间元素相近,且不与已标注目标重合的区域放置复制出的三维点云。
可选地,所述训练单元,用于根据标注所对应的目标的尺寸划分多个尺寸区间,为每个尺寸区间分别确定一个特征图尺度;根据输入到目标检测模型的一条训练数据所包含目标的尺寸,确定与该条训练数据包含的各目标分别对应的指定特征图尺度;由目标检测模型对该条训练数据进行卷积,得到各指定特征图尺度下的特征图,利用得到的各特征图分别对相应的目标进行检测框回归训练。
可选地,所述训练单元,还用于对训练数据进行统计分析,确定每个特征图尺度下,各类目标的标注数量分布;根据标注数量分布将目标划分为多个训练类别;在利用得到的各特征图分别对相应的目标进行检测框回归训练时,使用多头注意力,在同一特征图中对每个训练类别的下的各目标分别进行检测框回归和分类。
可选地,所述训练单元,用于根据各目标的出现频率和/或次数,确定相应的多头注意力权重。
依据本申请的再一个方面,提供了一种目标检测装置,包括:
检测单元,用于利用如目标检测模型的训练方法训练得到的目标检测模型对三维点云图进行检测。
依据本申请的再一方面,提供了一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如目标检测模型的训练方法,或者使所述处理器执行如上任一所述的目标检测模型的训练方法,或者,执行如上所述的目标检测方法。
依据本申请的再一方面,提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如上任一所述的目标检测模型的训练方法,或者实现如上所述的目标检测方法。
由上述可知,本申请的技术方案,通过对带有标注的原始训练数据进行分析,确定原始训练数据所包含的标注类别分布;依据所述标注类别分布对原始训练数据进行数据增广,得到训练数据;根据所述训练数据对目标检测模型进行迭代训练,直至满足训练停止条件。其有益效果在于,可以根据原始训练数据类别的分布情况对原始训练数据中的少样本类别进行数据增广,得到训练数据再根据增广后的原始数据进行迭代训练,缓解了原始数据不均衡造成的检测结果的长尾效应,提高了多种类别的检测准确性,实现大类别的目标检测。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本申请一个实施例的目标检测模型的训练方法的流程示意图;
图2示出了根据本申请一个实施例的目标检测方法的流程示意图;
图3示出了根据本申请一个实施例的目标检测模型的训练装置的结构示意图;
图4示出了根据本申请一个实施例的目标检测装置的结构示意图;
图5示出了根据本申请一个实施例的电子设备的结构示意图;
图6示出了根据本申请一个实施例的计算机可读存储介质的结构示意图。
具体实施方式
利用激光雷达对目标物进行检测可以使用基于体积元素的神经网络voxelnet、基于点云柱的算法pointpillars、基于稀疏卷积second(sparselyembeddedconvolutionaldetection,稀疏嵌入卷积检测)等方案,这些方案基于体积元素voxel化的特征或3d卷积等特征提取方式对点云进行特征提取,再在bev(鸟瞰图)视角下通过rpn(regionproposalnetwork,特征堆叠来进行区域生成网络)在相同尺度上进行目标的回归和分类。这里需要说明的是,目标检测领域中的回归,是指将检测框的确定作为一个数学上的回归问题来解决,而检测框是指能够确定目标的最小包围框,例如在2d场景下通常为矩形,在3d场景下通常为长方体。
但是,这些方案下仍然存在诸多缺陷,例如:1)虽然可以针对多种类目标进行识别,但可以处理的类别数较少,主要在4~5类;2)一般只能在相同的特征图尺度上进行目标物的回归和分类;3)在存在多种类别情况下,出现频率不同的目标物的识别效果差别明显,有明显的长尾效应,即检测效果随目标在训练集中的出现频次减少而递减,出现频次高的目标检测效果则较好。
针对上述缺陷,本申请提出的技术方案,可以有效地缓解原始数据不均衡造成的检测结果的长尾效应,提高了多种类别的检测准确性,实现大类别的目标检测。
下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
图1示出了根据本申请一个实施例的目标检测模型的训练方法的流程示意图,其中,目标为自动驾驶场景中的待关注对象,如图1所示,该目标检测模型的训练方法包括:
步骤s110,对带有标注的原始训练数据进行分析,确定原始训练数据所包含的标注类别分布。
本申请可以针对多种类别的目标进行识别检测,因此为了确定原始数据的类别分布,可以预先对原始数据进行相应的标注,然后对带有标注的原始训练数据进行分析。这样,就可以实现确定出原始训练数据所包含的标注类别分布。
例如,这些目标可以是行人、车辆、建筑物等真实场景下存在的多种类别目标物。与现有技术相区别,标注的类别可以更细、更多,即原始训练数据为大类别标注数据。以车辆为例,现有技术可能仅统一标注为汽车,或者标注为大型车、小型车等类别,但在本申请的实施例中可以标注为铲车、救护车、大型货车、小汽车、消防车等不同类别。
步骤s120,依据标注类别分布对原始训练数据进行数据增广,得到训练数据。
在分析原始训练数据中的多个类别的数据分布之后,可以对进行数据增广操作,即增加标注数量较少类别的标注量,这样依据标注类别分布对原始训练数据进行数据增广,可以得到类别较为均衡的训练数据。
步骤s130,根据训练数据对目标检测模型进行迭代训练,直至满足训练停止条件。
可以根据经过原始数据增广的原始数据对目标检测模型进行迭代训练,并预设训练停止条件,直至满足训练停止条件时停止训练。这样,在满足迭代训练条件以后,目标检测模型即训练完成,可以实现自动化地对目标进行检测。
可见,如图1所示的方法,可以根据原始训练数据类别的分布情况对原始训练数据中的少样本类别进行数据增广,得到训练数据再根据增广后的原始数据进行迭代训练,缓解了原始数据不均衡造成的检测结果的长尾效应,提高了多种类别的检测准确性,实现大类别的目标检测,在无人驾驶、物流配送、外卖等领域有着较好的应用。
在本申请的一个实施例中,上述目标检测模型的训练方法中,原始训练数据为三维点云图,依据标注类别分布对原始训练数据进行数据增广,得到训练数据包括:依据标注类别分布,确定待增广类别;选取带有待增广类别的标注的三维点云图,对选取的三维点云图进行若干次整图复制;和/或,从选取的三维点云图中复制出与待增广类别的标注对应的三维点云,将复制出的三维点云与基础点云图进行融合,得到融合点云图。
原始训练数据可以是通过激光雷达获取的三维点云图,在依据标注类别分布对原始训练数据进行数据增广时,即增加标注数量较少,出现频次较少的类别目标物,可以通过将含有少类别标注的标注文件进行直接复制,也可以在3d点云中将标注量比较少的物体的3d框抠出来,然后放在另外一张不同的点云图的合适位置上。这样,就依据标注类别分布,对待增广类别进行了原始数据的增广,将复制出的三维点云与基础点云图进行融合,从而得到了融合点云图。
在本申请的一个实施例中,上述目标检测模型的训练方法中,基础点云图是从原始数据中随机选取的,将复制出的三维点云与基础点云图进行融合包括:根据复制出的三维点云在原始三维点云图中距离激光坐标系原点的相对位置,确定复制出的三维点云在基础点云图中的可放置区域;从可放置区域中选取与指定空间元素相近,且不与已标注目标重合的区域放置复制出的三维点云。
在根据复制出的三维点云在原始三维点云图中距离激光坐标系原点的相对位置时,可以确定复制出的三维点云在基础点云图中的可放置区域,这些合适位置可以是与指定空间元素相近,且不与已标注目标重合的区域放置复制出的三维点云,具体可以是距离激光坐标系距离和原始点云中距离相近、放置在地面、不和当前帧点云中已有标注3d框重叠的位置上。这样,就可以在不干扰原始数据的基础上对实现原始数据的增广。
例如,以真实场景中出现频率较低的消防车辆为例,为了在不干扰原始数据的基础上对实现原始数据的增广,可以首先确定并复制出其他原始数据中的消防车辆三维点云,然后将这些消防车辆三维点云放置在基础点云图中合适的可放置区域,这些合适的可放置区域可以是与指定空间元素相近,如同样是车辆目标的空间中,在放置消防车辆三维点云时应保证消防车辆三维点云不与已标注车辆目标重合,具体可以是距离激光坐标系距离和原始点云中距离相近、放置在地面、不和当前帧点云中已有标注车辆3d框重叠的位置上。
在本申请的一个实施例中,上述目标检测模型的训练方法中,根据训练数据对目标检测模型进行迭代训练包括:根据标注所对应的目标的尺寸划分多个尺寸区间,为每个尺寸区间分别确定一个特征图尺度;根据输入到目标检测模型的一条训练数据所包含目标的尺寸,确定与该条训练数据包含的各目标分别对应的指定特征图尺度;由目标检测模型对该条训练数据进行卷积,得到各指定特征图尺度下的特征图,利用得到的各特征图分别对相应的目标进行检测框回归训练。
可以根据标注所对应的目标的尺寸的不同将目标划分多个尺寸区间,并为每个尺寸区间分别确定一个特征图尺度。
以现有技术中基于体积元素voxel进行目标检测的神经网络voxelnet为例,其从点云中检测出目标的大致流程如下:
首先,将完整点云划分为小的voxel,在每个voxel中进行grouping(分组)、sampling(抽样)操作后,再进行全连接层提取pointwise(点态)特征,最后在z轴上将特征叠加,再进行rpn操作,在同一层级的特征图上对各个类别的目标进行分类和回归。
这样的缺点在于,特征图的尺度是固定的,也就是说在固定尺度的特征图上,每个特征值可以对应一个原始的voxel大小。如果此voxel和需要检测的目标的大小尺寸匹配,那么检测效果就会较好,反之,如果一个像素点所代表的体积元素voxel远大于一个目标物体时,检测效果就会很差。
举例而言,如果原始点云图大小为x-(-78m,78m),y-(-78m,78m),z-(-3.5m,1m),x、y、z分别指代在各个轴向上的区间,每个体积元素voxel的大小设定为(0.3,0.3,0.5),那么原始点云图就会被重新划分为x-520,y-520,z-9的三维网格,每个格中有固定维度的特征向量,特征图大小尺寸(hwc——高、宽、通道)为520x520x9。为了减少计算量,特征图大小会不断缩减,例如从520x520x9缩减到260x260x9,或者再到130x130x9。
那么可见,在520x520x9的特征图上每个像素点对应的voxel大小为(0.3,0.3,0.5),在260x260x9的特征图上每个像素点则对应体积元素voxel大小为(0.6,0.6,0.5),以此类推,如果一个物体的大小为(0.3,0.3,0.5),那么在520x520x9的特征图上是正好对应一个像素点的,但是在260x260x9的特征图上就存在一个特征点对应多个物体的关系,特征就会存在混乱,影响最终检测效果。
因此,本申请实施例所作出的改进是,根据标注所对应的目标的尺寸划分多个尺寸区间,为每个尺寸区间分别确定一个特征图尺度。例如,大尺寸目标,在大特征图尺度上进行回归;小尺寸目标,在小特征图尺度上进行回归。
那么对于一条训练数据,在进入目标检测模型后,会依据其包含的标注目标的尺寸,确定特征图尺度,由目标检测模型对该条训练数据进行卷积,得到各指定特征图尺度下的特征图,利用得到的各特征图分别对相应的目标进行检测框回归训练。
在本申请的一个实施例中,上述目标检测模型的训练方法中,根据训练数据对目标检测模型进行迭代训练还包括:对训练数据进行统计分析,确定每个特征图尺度下,各类目标的标注数量分布;根据标注数量分布将目标划分为多个训练类别;在利用得到的各特征图分别对相应的目标进行检测框回归训练时,使用多头注意力,在同一特征图中对每个训练类别的下的各目标分别进行检测框回归和分类。
该实施例进一步对于同一特征图尺度所包含的不同类别目标,进行了训练上的优化。具体而言,可以对训练数据进行统计分析并确定出每个特征图尺度下,各类目标的标注数量分布。
例如,对于同一特征图尺度上的目标,分析目标物体的标注数量,如在此尺度一共有轿车、suv、面包车三个目标类别,其中,轿车的标注数量为10万,suv为1万,面包车为1.5万。那么可见,suv、面包车是同一数量级(104级别),而轿车是另一数量级(105级别)。那么可以依据数量级,将suv和面包车作为同一训练类别,将轿车作为另一训练类别加以关注。
除了数量级之外,也可以依据其他分布特征实现训练类别的划分,例如通过聚类算法等方式实现。
将同一特征图尺度上的目标划分为多个类别,是为了能够针对不同类别进行不同的关注,优化目标检测效果,具体所使用的技术可以是多头注意力(multihead)技术,每个头对应一个训练类别。注意力机制可以实现从众多信息中选择出对当前任务目标更关键的信息,可以使用多头注意力机制multihead在同一特征图上分别对不同数量级的目标按照不同的权重进行回归和分类。权重调整中可以使标注数量较少的目标权重相对占比较高。这样,就可以是实现针对具有不同标注数量的每个训练类别下的各目标分别进行检测框的回归和分类。
在本申请的一个实施例中,上述目标检测模型的训练方法中,使用多头注意力,在同一特征图中对每个训练类别的下的各目标分别进行检测框回归和分类包括:根据各目标的出现频率和/或次数,确定相应的多头注意力权重。
真实场景下,不同目标出现的频次和/或次数具有明显差别,由此可能造成类别的不均衡和检测结果的长尾效应,因此为了缓解这一问题,平衡不同目标的不同权重,可以采用多头注意力机制multihead,从而控制全局损失loss,使不同类别的目标数量尽可能保持平衡。然后,可以针对在同一特征图中对每个训练类别的下的各目标分别进行检测框回归和分类。这样,就可以实现缓解目标类别的不均衡和检测结果的长尾效应。
图2示出了根据本申请一个实施例的目标检测方法的流程示意图。如图2所示,该目标检测方法包括:
步骤s210,利用通过目标检测模型的训练方法训练得到的目标检测模型对三维点云图进行检测。该目标检测模型的训练方法可以参照如上述任一实施例所述单独实现或结合实现。
在针对目标进行检测时,为了高效处理数量庞大的图像,可以基于以上方法,建立目标检测模型,然后利用以上方法对目标检测模型进迭代训练,并设置训练结束条件。目前,可以将以上方法应用到如fasterr-cnn网络、ssd网络(singleshotmultiboxdetector,目前无统一中文名称)和yolo网络(youonlylookonce,目前无统一中文名称)等目标检测模型的迭代训练中。这样,就可以实现利用目标检测模型对三维点云图进行高效处理。
图3示出了根据本申请一个实施例的目标检测模型的训练装置的结构示意图,其中,目标为自动驾驶场景中的待关注对象。如图3所示,该目标检测模型的训练装置300包括:
分析单元310,用于对带有标注的原始训练数据进行分析,确定原始训练数据所包含的标注类别分布。
本申请可以针对多种类别的目标进行识别检测,因此为了确定原始数据的类别分布,可以预先对原始数据进行相应的标注,然后对带有标注的原始训练数据进行分析。这样,就可以实现确定出原始训练数据所包含的标注类别分布。
例如,这些目标可以是行人、车辆、建筑物等真实场景下存在的多种类别目标物。与现有技术相区别,标注的类别可以更细、更多,即原始训练数据为大类别标注数据。以车辆为例,现有技术可能仅统一标注为汽车,或者标注为大型车、小型车等类别,但在本申请的实施例中可以标注为铲车、救护车、大型货车、小汽车、消防车等不同类别。
增广单元320,用于依据标注类别分布对原始训练数据进行数据增广,得到训练数据。
在分析原始训练数据中的多个类别的数据分布之后,可以对进行数据增广操作,即增加标注数量较少类别的标注量,这样依据标注类别分布对原始训练数据进行数据增广,可以得到类别较为均衡的训练数据。
训练单元330,用于根据训练数据对目标检测模型进行迭代训练,直至满足训练停止条件。
可以根据经过原始数据增广的原始数据对目标检测模型进行迭代训练,并预设训练停止条件,直至满足训练停止条件时停止训练。这样,在满足迭代训练条件以后,目标检测模型即训练完成,可以实现自动化地对目标进行检测。
可见,如图3所示的装置,可以根据原始训练数据类别的分布情况对原始训练数据中的少样本类别进行数据增广,得到训练数据再根据增广后的原始数据进行迭代训练,缓解了原始数据不均衡造成的检测结果的长尾效应,提高了多种类别的检测准确性,实现大类别的目标检测,在无人驾驶、物流配送、外卖等领域有着较好的应用。
在本申请的一个实施例中,上述目标检测模型的训练装置中,原始训练数据为三维点云图,增广单元320,用于依据标注类别分布,确定待增广类别;选取带有待增广类别的标注的三维点云图,对选取的三维点云图进行若干次整图复制;和/或,从选取的三维点云图中复制出与待增广类别的标注对应的三维点云,将复制出的三维点云与基础点云图进行融合,得到融合点云图。
在本申请的一个实施例中,上述目标检测模型的训练装置中,基础点云图是从原始数据中随机选取的,增广单元320,用于根据复制出的三维点云在原始三维点云图中距离激光坐标系原点的相对位置,确定复制出的三维点云在基础点云图中的可放置区域;从可放置区域中选取与指定空间元素相近,且不与已标注目标重合的区域放置复制出的三维点云。
在本申请的一个实施例中,上述目标检测模型的训练装置中,训练单元330,用于根据标注所对应的目标的尺寸划分多个尺寸区间,为每个尺寸区间分别确定一个特征图尺度;根据输入到目标检测模型的一条训练数据所包含目标的尺寸,确定与该条训练数据包含的各目标分别对应的指定特征图尺度;由目标检测模型对该条训练数据进行卷积,得到各指定特征图尺度下的特征图,利用得到的各特征图分别对相应的目标进行检测框回归训练。
在本申请的一个实施例中,上述目标检测模型的训练装置中,训练单元330,还用于对训练数据进行统计分析,确定每个特征图尺度下,各类目标的标注数量分布;根据标注数量分布将目标划分为多个训练类别;在利用得到的各特征图分别对相应的目标进行检测框回归训练时,使用多头注意力,在同一特征图中对每个训练类别的下的各目标分别进行检测框回归和分类。
在本申请的一个实施例中,上述目标检测模型的训练装置中,训练单元330,用于根据各目标的出现频率和/或次数,确定相应的多头注意力权重。
图4示出了根据本申请一个实施例的目标检测装置的结构示意图。如图4所示,该目标检测装置400包括:
检测单元410,用于利用目标检测模型的训练装置训练得到的目标检测模型对三维点云图进行检测。
在针对目标进行检测时,为了高效处理数量庞大的图像,可以基于以上方法,建立目标检测模型,然后利用以上方法对目标检测模型进迭代训练,并设置训练结束条件。目前,可以将以上方法应用到如fasterr-cnn网络、ssd网络(singleshotmultiboxdetector,目前无统一中文名称)和yolo网络(youonlylookonce,目前无统一中文名称)等目标检测模型的迭代训练中。这样,就可以实现利用目标检测模型对三维点云图进行高效处理。
需要说明的是,上述各装置实施例的具体实施方式可以参照前述对应方法实施例的具体实施方式进行,在此不再赘述。
综上所述,本申请的技术方案,通过对带有标注的原始训练数据进行分析,确定原始训练数据所包含的标注类别分布;依据所述标注类别分布对原始训练数据进行数据增广,得到训练数据;根据所述训练数据对目标检测模型进行迭代训练,直至满足训练停止条件。其有益效果在于,可以根据原始训练数据类别的分布情况对原始训练数据中的少样本类别进行数据增广,得到训练数据再根据增广后的原始数据进行迭代训练,缓解了原始数据不均衡造成的检测结果的长尾效应,提高了多种类别的检测准确性,实现大类别的目标检测。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本申请并帮助理解各个发明方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本申请实施例的目标检测模型的训练装置和目标检测装置中的一些或者全部部件的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
例如,图5示出了根据本申请一个实施例的电子设备的结构示意图。该电子设备500包括处理器510和被安排成存储计算机可执行指令(计算机可读程序代码)的存储器520。存储器520可以是诸如闪存、eeprom(电可擦除可编程只读存储器)、eprom、硬盘或者rom之类的电子存储器。存储器520具有存储用于执行上述方法中的任何方法步骤的计算机可读程序代码531的存储空间530。例如,用于存储计算机可读程序代码的存储空间530可以包括分别用于实现上面的方法中的各种步骤的各个计算机可读程序代码531。计算机可读程序代码531可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,紧致盘(cd)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为例如图6所述的计算机可读存储介质。图6示出了根据本申请一个实施例的一种计算机可读存储介质的结构示意图。该计算机可读存储介质600存储有用于执行根据本申请的方法步骤的计算机可读程序代码531,可以被电子设备500的处理器510读取,当计算机可读程序代码531由电子设备500运行时,导致该电子设备500执行上面所描述的方法中的各个步骤,具体来说,该计算机可读存储介质存储的计算机可读程序代码531可以执行上述任一实施例中示出的方法。计算机可读程序代码531可以以适当形式进行压缩。
应该注意的是上述实施例对本申请进行说明而不是对本申请进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。