针对密集堆叠物体的数据集构建方法以及相关设备与流程

文档序号:33649803发布日期:2023-03-29 07:14阅读:122来源:国知局
针对密集堆叠物体的数据集构建方法以及相关设备与流程

1.本技术实施例涉及数据集构建领域,尤其涉及针对密集堆叠物体的数据集构建方法以及相关设备。


背景技术:

2.大规模密集堆叠目标数据集是密集堆叠目标检测算法研究的重要基础,是评估不同密集堆叠目标检测算法性能的基准。当前目标检测领域的大规模数据集可以划分为通用物体检测数据集,比如pascal voc、ms coco等,和单一物体检测数据集,比如行人检测数据集kitti,人脸检测数据集fddb以及场景文本检测数据集msra-td500等。然而,当前业界缺乏公开的大规模密集堆叠目标数据集,这严重制约了密集堆叠目标检测算法等研究和应用。
3.通过仿真软件来对实际应用场景进行建模,并大规模生成包含密集堆叠物体的样本也是构建数据集的一种方法。这种方法能够以较低的成本来极大地扩增仿真数据集。
4.但是,仿真样本往往与真实样本之间存在偏差,那么单一的仿真数据集往往与真实数据集之间存在偏差,仿真数据集中仿真样本的有效性和可信度无法保证,从而导致训练出来的网络模型在实际场景中的应用受限。


技术实现要素:

5.本技术实施例提供了针对密集堆叠物体的数据集构建方法以及相关设备,用于减少数据集构建过程的人工操作、提升数据集构建效率以及增强数据集可靠性。
6.本技术实施例第一方面提供一种针对密集堆叠物体的数据集构建方法,包括:
7.获取初始数据集,所述初始数据集包括多个初始样本,每个初始样本均包括密集堆叠的多个物体;
8.轮流将所述初始数据集中的每个初始样本确定为待处理样本;
9.从预先构建的纹理数据库中获取至少一个真实纹理;
10.基于所述真实纹理,对所述待处理样本中每个物体的初始表面纹理执行纹理替换,得到目标样本;
11.确定包括每个所述目标样本的目标数据集。
12.在一种具体实现方式中,所述初始数据集包括仿真数据集和\或真实数据集。
13.在一种具体实现方式中,所述初始数据集包括仿真数据集;所述方法还包括:
14.基于操作人员输入的约束空间尺寸,构建约束空间;
15.获取操作人员输入的至少一个其他场景约束,所述其他场景约束包括:光源约束、视角约束和/或物体约束;
16.基于所述至少一个场景约束在所述约束空间内,生成不同场景下密集堆叠的多个物体,以获得所述多个初始样本。
17.在一种具体实现方式中,所述每个初始样本包括所述每个初始样本中每个物体的
表面轮廓;
18.所述基于所述真实纹理,对所述待处理样本中每个物体的初始表面纹理执行纹理替换,得到目标样本,包括:
19.基于仿射变换原理以及所述真实纹理,对所述待处理样本中每个物体的表面轮廓中的初始表面纹理执行纹理替换,得到目标样本。
20.在一种具体实现方式中,所述光源约束包括:光源类型、光源强度和/或光源方向;所述视角约束包括相机内参、采集视角、采集方向和/或采集距离;所述物体约束包括:表面纹理类型、堆叠方式、物体数量、物体姿态和/或物体大小。
21.在一种具体实现方式中,所述初始数据集包括真实数据集;所述方法还包括:
22.基于图像采集设备采集不同场景下密集堆叠的多个物体,获得多个原始样本;
23.轮流将每个原始样本确定为待标记样本;
24.响应于操作人员针对所述待标记样本的每条表面轮廓线的标记操作,获得已标记样本;
25.基于轮廓提取算法处理所述已标记样本,获得所述初始样本,所述初始样本包括所述初始样本中每个物体的表面轮廓;
26.所述基于所述真实纹理,对所述待处理样本中每个物体的初始表面纹理执行纹理替换,得到目标样本,包括:
27.基于仿射变换原理以及所述真实纹理,对所述待处理样本中每个物体的表面轮廓中的初始表面纹理执行纹理替换,得到目标样本。
28.在一种具体实现方式中,在所述从预先构建的纹理数据库中获取至少一个真实纹理之前,所述方法还包括:
29.基于网络爬虫技术获取多个初始纹理样本,所述初始纹理样本中物体的物体类型与所述密集堆叠的多个物体的目标物体类型一致,所述初始纹理样本为真实样本;
30.基于实例分割算法提取每个初始纹理样本中物体的表面纹理,获得多个目标纹理样本;
31.基于所述多个目标纹理样本构建所述纹理数据库。
32.本技术实施例第二方面提供一种检测模型训练方法,包括:
33.基于第一方面所述的方法构建的目标数据集训练初始检测模型,以获得训练好的目标检测模型。
34.本技术实施例第三方面提供一种数据集构建装置,包括:
35.获取单元,用于获取初始数据集,所述初始数据集包括多个初始样本,每个初始样本均包括密集堆叠的多个物体;
36.确定单元,用于轮流将所述初始数据集中的每个初始样本确定为待处理样本;
37.所述获取单元,还用于从预先构建的纹理数据库中获取至少一个真实纹理;
38.替换单元,用于基于所述真实纹理,对所述待处理样本中每个物体的初始表面纹理执行纹理替换,得到目标样本;
39.所述确定单元,还用于确定包括每个所述目标样本的目标数据集。
40.在一种具体实现方式中,所述初始数据集包括仿真数据集和\或真实数据集。
41.在一种具体实现方式中,所述初始数据集包括仿真数据集;所述装置还包括:构建
单元以及生成单元;
42.所述构建单元,用于基于操作人员输入的约束空间尺寸,构建约束空间;
43.所述获取单元,还用于获取操作人员输入的至少一个其他场景约束,所述其他场景约束包括:光源约束、视角约束和/或物体约束;
44.所述生成单元,用于基于所述至少一个场景约束在所述约束空间内,生成不同场景下密集堆叠的多个物体,以获得所述多个初始样本。
45.在一种具体实现方式中,所述每个初始样本包括所述每个初始样本中每个物体的表面轮廓;
46.所述替换单元,具体用于基于仿射变换原理以及所述真实纹理,对所述待处理样本中每个物体的表面轮廓中的初始表面纹理执行纹理替换,得到目标样本。
47.在一种具体实现方式中,所述光源约束包括:光源类型、光源强度和/或光源方向;所述视角约束包括相机内参、采集视角、采集方向和/或采集距离;所述物体约束包括:表面纹理类型、堆叠方式、物体数量、物体姿态和/或物体大小。
48.在一种具体实现方式中,所述初始数据集包括真实数据集;所述装置还包括:标记单元;
49.所述获取单元,还用于基于图像采集设备采集不同场景下密集堆叠的多个物体,获得多个原始样本;
50.所述确定单元,还用于轮流将每个原始样本确定为待标记样本;
51.所述标记单元,用于响应于操作人员针对所述待标记样本的每条表面轮廓线的标记操作,获得已标记样本;
52.所述获取单元,还用于基于轮廓提取算法处理所述已标记样本,获得所述初始样本,所述初始样本包括所述初始样本中每个物体的表面轮廓;
53.所述替换单元,具体用于基于仿射变换原理以及所述真实纹理,对所述待处理样本中每个物体的表面轮廓中的初始表面纹理执行纹理替换,得到目标样本。
54.在一种具体实现方式中,在所述从预先构建的纹理数据库中获取至少一个真实纹理之前,所述装置还包括:构建单元;
55.所述获取单元,还用于基于网络爬虫技术获取多个初始纹理样本,所述初始纹理样本中物体的物体类型与所述密集堆叠的多个物体的目标物体类型一致,所述初始纹理样本为真实样本;
56.所述获取单元,还用于基于实例分割算法提取每个初始纹理样本中物体的表面纹理,获得多个目标纹理样本;
57.所述构建单元,用于基于所述多个目标纹理样本构建所述纹理数据库。
58.本技术实施例第四方面提供一种检测模型训练装置,包括:
59.训练单元,用于基于第一方面所述的方法构建的目标数据集训练初始检测模型,以获得训练好的目标检测模型。
60.本技术实施例第五方面提供一种计算机设备,包括:
61.中央处理器,存储器以及输入输出接口;
62.所述存储器为短暂存储存储器或持久存储存储器;
63.所述中央处理器配置为与所述存储器通信,并执行所述存储器中的指令操作以执
行第一方面或第二方面所述的方法。
64.本技术实施例第六方面提供一种包含指令的计算机程序产品,当所述计算机程序产品在计算机上运行时,使得计算机执行如第一方面或第二方面所述的方法。
65.本技术实施例第七方面提供一种计算机存储介质,所述计算机存储介质中存储有指令,所述指令在计算机上执行时,使得所述计算机执行如第一方面或第二方面所述的方法。
66.从以上技术方案可以看出,本技术实施例具有以下优点:使用预先构建的纹理数据库中的至少一个真实纹理,将每个初始样本中每个物体的初始表面纹理,替换为前述真实纹理,获得相应的目标样本。最终,得到包含每个目标样本的目标数据集。基于纹理数据库中的真实纹理,将初始样本(如仿真样本)中与真实样本之间存在偏差的初始表面纹理替换掉,得到的目标表样本集中的每个目标样本的表面纹理都与真实样本的表面纹理之间不存在偏差,得到了可靠性和鲁棒性更强的目标数据集,进而使得训练出来的网络模型在实际场景中的应用更为广泛。
附图说明
67.图1为本技术实施例公开的数据集构建方法的一种流程示意图;
68.图2为本技术实施例公开的场景约束方法的一种示例示意图;
69.图3为本技术实施例公开的数据集构建装置的一个结构示意图;
70.图4为本技术实施例公开的检测模型训练装置的一个结构示意图;
71.图5为本技术实施例公开的计算机设备的一个结构示意图。
具体实施方式
72.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
73.现有的真实数据集构建方法需要耗费大量的人力、物力以及时间来进行场景拍摄、数据清洗、图像标注等工作,很难满足高效扩增数据集的需求,且无法保持数据集在实际应用场景中的持续扩增与多样性。scd是基于网络爬虫以及真实场景拍摄生成的货箱堆叠数据集。其中,通过爬虫获得的数据集oscd含有图像8401幅,但质量较差,很难用于训练;而基于真实场景拍摄的数据集lscd仅含有7735幅图像,仍然较难满足神经网络的大规模训练需求。
74.为了处理现有的真实数据集构建以及仿真数据集构建过程中的样本可靠性和数据集扩增的问题,本技术实施例提供了针对密集堆叠物体的数据集构建方法以及相关设备,用于减少数据集构建过程的人工操作、提升数据集构建效率以及增强数据集可靠性。
75.请参阅图1,本技术实施例提供一种针对密集堆叠物体的数据集构建方法,包括以下步骤:
76.101、获取初始数据集,初始数据集包括多个初始样本,每个初始样本均包括密集堆叠的多个物体。
77.本技术技术方案,可以在保证初始数据集的可靠性前提下,通过以下方法实现针对不同的初始数据集的样本扩增。因此,在执行样本扩增之前,需要获取初始样本集,以在初始样本集的基础上,实现数据集可靠性提升和/或数据集扩增。
78.需要注意的是,按照数据集中样本的获取方式的不同,可以将初始数据集划分为仿真数据集以及真实数据集。其实,无论是仿真数据集还是真实数据集,数据集中的每个样本都包含密集堆叠的多个物体,具体地不同样本在物体的数量和/或堆叠方式等内容上不完全一致。需要说明的是,无论是仿真数据集还是真实数据集,数据集中的每个样本都可以认为是针对其包含的密集堆叠的多个物体在某个角度上拍摄的图像,区别在于,仿真数据集中的样本是在三维仿真引擎中构建不同物体的数量和/或堆叠方式等内容上不完全一致的样本,然后在三维仿真引擎中从某个角度上拍摄获取的;真实数据集中的样本是在真实环境中搭建不同物体的数量和/或堆叠方式等内容上不完全一致的样本,然后在使用图像采集设备中从某个角度上采集的。因为以上构建方式的不同,决定了仿真数据集中样本的可靠性不足,但数据集大量扩增较为容易实现;相反真实数据集中样本的可靠性有保障但数据集的大量扩增需要耗费大量人力物力,难以实现。
79.102、轮流将初始数据集中的每个初始样本确定为待处理样本。
80.在步骤101中获取到初始数据集后,轮流处理初始数据集中的每个样本,最终得到处理后的对应的目标样本。具体地,可以轮流将每个未曾被确定为待处理样本的初始样本,即未曾被确定相应对的目标样本的初始样本,确定为待处理样本。
81.103、从预先构建的纹理数据库中获取至少一个真实纹理。
82.在确定当前处理的待处理样本后,从预先构建的纹理数据库中获取至少一个真实纹理,并基于从纹理数据库中获取到的每个真实纹理,执行纹理替换操作,即步骤104所述操作。
83.需要注意的是,在一些具体实现方式中,此处确定的真实纹理个数应当不大于待处理样本中多个物体的表面个数,以保证确定出的每个真实纹理都是可能被使用的。
84.104、基于真实纹理,对待处理样本中每个物体的初始表面纹理执行纹理替换,得到目标样本。
85.为了使经目标数据集训练得到的网络模型更具鲁棒性,可以使用真实纹理,将待处理样本中每个物体的初始表面纹理替换掉。具体地,参照步骤203确定的真实纹理的个数,可随机采用不同的纹理替换方式,若真实纹理个数为一个,则需要将待处理样本中每个物体的初始表面纹理替换为该真实纹理;若真实纹理个数为多个,则需要基于多个真实纹理替换待处理样本中每个物体的初始表面纹理,得到的对应的目标样本中物体的目标表面纹理的种类数不大于确定的真实纹理数,此处不对纹理替换方式做具体限定。
86.另外,参照前述纹理替换方法可知,基于相同个数的多个真实纹理,对待处理样本中每个物体的初始表面纹理执行一次纹理替换得到的结果可以不同,因此,根据实际需求,本步骤中为待处理样本执行纹理替换后,可获得对应的一个或者多个目标样本,其中每个目标样本中物体的表面纹理不完全相同。
87.需要说明的是,纹理替换可以指将初始表面纹理为空或者为任意仿真纹理的表面纹理替换为相应的真实纹理,此处不作限定。
88.105、确定包括每个目标样本的目标数据集。
89.循环针对步骤101获取的初始数据集中的每个初始样本执行一次步骤102只步骤104之后,可以获得数量不少初始数据集中初始样本个数的、各不相同的目标样本,将每个目标样本作为目标数据集的数据样本,便可以获得可靠性强的目标数据集。
90.本技术实施例中,使用预先构建的纹理数据库中的至少一个真实纹理,将每个初始样本中每个物体的初始表面纹理,替换为前述真实纹理,获得相应的目标样本。最终,得到包含每个目标样本的目标数据集。若初始纹理数据集为仿真纹理数据集,则基于纹理数据库中的真实纹理,将初始样本(如仿真样本)中与真实样本之间存在偏差的初始表面纹理替换掉,得到的目标表样本集中的每个目标样本的表面纹理都与真实样本的表面纹理之间不存在偏差,得到了可靠性和鲁棒性更强的目标数据集,进而使得训练出来的网络模型在实际场景中的应用更为广泛。若初始纹理数据集为真实数据集,则通过纹理数据库中的多种真实纹理,将初始样本(如真实样本)中的初始表面纹理替换掉,在不改变数据可靠性(物体的表面纹理都是真实纹理)且上下文关系不变(不改变样本的深度信息及各种非结构化背景信息)的情况下,通过表面纹理的替换迅速实现了真实数据集的大量扩增,可有效提升数据集构建效率。
91.在前述实施例的基础上,在一些具体实现方式中,针对于初始数据集的类型的不同,构建初始数据集的方式也有所不同,详见下文。
92.1)若初始数据集包括仿真数据集,则本技术实施例的数据集构建方法还包括以下步骤:基于操作人员输入的约束空间尺寸,构建约束空间;获取操作人员输入的至少一个其他场景约束,其他场景约束包括:光源约束、视角约束和/或物体约束;基于至少一个场景约束在约束空间内,生成不同场景下密集堆叠的多个物体,以获得多个初始样本。在一种具体实现方式中,光源约束包括:光源类型、光源强度和/或光源方向;视角约束包括相机内参、采集视角、采集方向和/或采集距离;物体约束包括:表面纹理类型、堆叠方式、物体数量、物体姿态和/或物体大小。
93.具体地,可以通过包括但不限于:c4d或blender等三维仿真引擎实现约束空间、约束空间内不同场景下密集堆叠的多个物体的构建、以及针对约束空间内不同场景下构建密集堆叠的多个物体在不同视角上的图像采集。结合开发基于多维度模拟的3d智能密集堆叠算法执行上述仿真数据集构建流程,得到多个初始样本。
94.在实际应用中,每个初始样本通常包括:rgb图像、深度信息以及掩码标注,纹理替换的过程,就是将rgb图像中物体的表面纹理进行相应替换,获得的目标样本与对应的待处理样本的深度信息以及掩码标注均保持一致。
95.2)若初始数据集包括真实数据集,则本技术实施例的数据集构建方法还包括以下步骤:基于图像采集设备采集不同场景下密集堆叠的多个物体,获得多个原始样本;轮流将每个原始样本确定为待标记样本;响应于操作人员针对待标记样本的每条表面轮廓线的标记操作,获得已标记样本;基于轮廓提取算法处理已标记样本,获得初始样本,初始样本包括初始样本中每个物体的表面轮廓。
96.具体地,通过操作人员在实际环境(可以是可能需要执行目标检测的环境)中搭建不同场景下密集堆叠的多个物体,然后通过图像采集设备在不同视角采集搭建的密集堆叠的多个物体,得到不同场景下不同角度的原始样本。然后,按照预设的掩码标注规则,对待标记样本的每条表面轮廓线进行标记得到已标记样本,然后,基于已标记样本和轮廓提取
算法获得已标记样本中每个物体的每个(闭合的)表面轮廓(即每个闭合的表面的多边形)以解耦纹理,并针对已标记样本中密集堆叠的多个物体为整体执行轮廓重建。
97.可以理解的是,在实际应用中,若完成初始数据集的构建后,前述步骤104具体可以通过以下方式实现:基于仿射变换原理以及步骤103中确定的每个真实纹理,对所述待处理样本中每个物体的表面轮廓中的初始表面纹理执行纹理替换,得到前述待处理样本对应的至少一个目标样本。
98.在必要的时候,为了进一步的提升基于目标训练集训练得到的网络模型的鲁棒性和可靠性,可以同时使用仿真数据集和/或真实数据集作为初始数据集,以获得基于真实样本和/或仿真样本处理得到的目标数据集,并基于目标数据集训练初始检测模型,以获得针对密集堆叠物体的物体识别效果良好的目标检测模型。
99.在前述实施例的基础上,在一些具体实现方式中,在前述步骤103之前,还可以通过以下步骤实现纹理数据库的重建:基于网络爬虫技术获取多个初始纹理样本,初始纹理样本中物体的物体类型与密集堆叠的多个物体的目标物体类型一致,初始纹理样本为真实样本;基于实例分割算法提取每个初始纹理样本中物体的表面纹理,获得多个目标纹理样本;基于多个目标纹理样本构建纹理数据库。
100.具体地,也就是若初始样本中的物体包括货箱,则基于网络爬虫技术获取的初始纹理样本是任意真实拍摄的真实图像,该真实图像中包括货箱,便可以从该初始纹理样本中提取货箱的表面纹理。在实际应用中,初始样本中的物体还可以是密集堆叠的纸箱或者其他可进行密集堆叠的物体,每个初始样本中可以包含一类或多类密集堆叠物体,此处不做具体限定。其中,实例分割算法可以包括但不限于:mask rcnn算法和/或panet算法。
101.另外,除了通过实例分割算法提取初始纹理样本中物体的表面纹理,还可以由操作人员手动从初始纹理样本中剪切出物体的表面纹理作为目标纹理样本。
102.进一步的,在实际应用中,为了保证纹理数据库中每个目标纹理样本都是可用的,还可由操作人员在多个目标纹理样本中进行进一步筛选,确定出符合需求的目标纹理样本,并只基于符合需求的目标纹理样本构建纹理数据库,而非全部目标纹理样本。
103.前面描述了本技术提供的多种实施例,下面在具体实现场景下,描述本技术提供的数据集构建方法,下面分为基于多维度模拟的数据集构建方法以及基于上下文不变的真实数据集的构建方法进行描述。
104.1)基于多维度模拟的数据集构建方法
105.首先,本方法直接通过blender软件平台的可视化界面搭建一个约束空间作为放置密集堆叠的物体的空间,并在该场景中设置随机位姿的光源与采集角度,基于多维度模拟的三维智能密集堆叠算法来实现初始样本集的生成。三维智能密集堆叠算法旨在通过多维度模拟,生成充足且多样的密集堆叠的物体。为了更好地贴合真实场景,尽可能覆盖所有情况,使得仿真数据能够较好地提升网络的泛化性能以及鲁棒性,基于多维度模拟的三维智能密集堆叠算法在生成仿真数据集时对以下变量进行了考虑:约束空间的尺寸,不同类型、强度、方向、位置的光源,方向与位置相对于待采集的密集堆叠的物体略有偏移的仿真采集视角,不同纹理、数量、堆叠方式、大小的密集堆叠的物体等。
106.由于真实密集堆叠物体表面的纹理各异,为了尽量减少仿真数据集与真实场景之间的差距,随机从纹理数据库中抽取相同物体类型的纹理,即可用纹理替换初始样本中的
初始表面纹理。为了更好地贴合真实场景,使得仿真数据能够较好地提升网络的泛化性能以及鲁棒性,纹理数据库中目标纹理的采集需要考虑的因素包括但不限于木纹色、白色、贴膜、唛头以及logo等。
107.最后,本方法通过多维度模拟,生成多样且充足的目标样本,并以此输出各目标样本包含的rgb图像、深度信息以及掩码标注,实现仿真数据集的构建。
108.2)基于上下文不变的真实数据集的构建方法
109.首先,本方法使用rgb-d相机对自搭建的堆叠目标采集图像与深度信息,采用多场景约束形成采集方案,场景约束包括但不限于:光线、堆叠目标间距、目标数量、目标大小、目标摆放姿态、拍摄距离、拍摄角度和/或目标是否混装摆放,不同场景约束组合(也就是不同的相机拍照视点以及不同数量货箱在不同姿态下的摆放)采集一到两张图像作为原始样本,之后由操作人员对采集到的原始样本进行掩码标注(或者说表面轮廓线的标记),根据拍摄角度,原始样本中每个物体可能包含一个,两个或三个可见表面,为了分割每个物体的不同表面,设计的标注规则如下:1)选择两条边线的交点作为起点,而非三条;2)按顺时针方向标记这些点;3)两个表面的公共线重复标记两次。通过ltsp算法获得目标的所有闭合多边形以解耦纹理。其中,场景约束具体可参照图2。
110.随后,基于不可见轮廓重建算法实现对待标记样本包括的每个物体组成的整体执行轮廓重建,从不可见轮廓的边缘选择一条表示为a的线作为构造线,当其与邻边b都满足凸多边形条件时,计算曲面p中距离a最远的pa和距离b最远的pb,然后计算表示为ka,kb的a和b的斜率,并构造具有ka,pa和kb,pb的平行四边形的其他边c,d,最后计算a,b,c,d中每条边的交点,得到平行四边形,重复以上过程完成目标轮廓重建。
111.最后随机调用纹理数据库中的可用纹理,并基于仿射变换远离对掩码区域内(即每个表面轮廓线围合而成的表面轮廓中的表面纹理)的表面纹理进行纹理替换,以生成大量与对应的原始样本的深度信息及背景信息不变的,或者说上下文关系不变的目标样本。
112.更具体的,搭建密集堆叠的物体,使用realsense l515相机按照球面变动相机的方位和角度采集不同场景约束下密集堆叠的物体的图像与深度信息,并依次完成rgb图与深度图对齐、按照设计的掩码标注规则使用lableme进行人工标注,之后运行基于本技术实施例流程的代码,以自动完成表面分割与不可见轮廓重建,并随机调用纹理数据库中的可用替换初始数据集的前景纹理(即物体的初始表面纹理),实现目标数据集的海量有效扩充,完成真实数据集的构建。
113.上述实施例可带来以下几点技术效果:1)大大减少了针对密集堆叠物体的数据集构建过程中所需的重复人工操作以及资源耗费,提高了扩增数据集的效率。2)能够以较少的真实样本进行密集堆叠的物体的真实数据集的有效扩增,满足神经网络大规模训练的需求。3)减少了单一仿真数据集与真实应用场景的偏差,增强了仿真数据集的有效性和可信度。4)能够在实际应用场景中保持数据集的持续扩增与多样性。
114.请参阅图3,本技术实施例提供一种数据集构建装置,包括:
115.获取单元301,用于获取初始数据集,初始数据集包括多个初始样本,每个初始样本均包括密集堆叠的多个物体;
116.确定单元302,用于轮流将初始数据集中的每个初始样本确定为待处理样本;
117.获取单元301,还用于从预先构建的纹理数据库中获取至少一个真实纹理;
118.替换单元303,用于基于真实纹理,对待处理样本中每个物体的初始表面纹理执行纹理替换,得到目标样本;
119.确定单元302,还用于确定包括每个目标样本的目标数据集。
120.在一种具体实现方式中,初始数据集包括仿真数据集和\或真实数据集。
121.在一种具体实现方式中,初始数据集包括仿真数据集;装置还包括:构建单元以及生成单元;
122.构建单元,用于基于操作人员输入的约束空间尺寸,构建约束空间;
123.获取单元301,还用于获取操作人员输入的至少一个其他场景约束,其他场景约束包括:光源约束、视角约束和/或物体约束;
124.生成单元,用于基于至少一个场景约束在约束空间内,生成不同场景下密集堆叠的多个物体,以获得多个初始样本。
125.在一种具体实现方式中,每个初始样本包括每个初始样本中每个物体的表面轮廓;
126.替换单元303,具体用于基于仿射变换原理以及真实纹理,对待处理样本中每个物体的表面轮廓中的初始表面纹理执行纹理替换,得到目标样本。
127.在一种具体实现方式中,光源约束包括:光源类型、光源强度和/或光源方向;视角约束包括相机内参、采集视角、采集方向和/或采集距离;物体约束包括:表面纹理类型、堆叠方式、物体数量、物体姿态和/或物体大小。
128.在一种具体实现方式中,初始数据集包括真实数据集;装置还包括:标记单元;
129.获取单元301,还用于基于图像采集设备采集不同场景下密集堆叠的多个物体,获得多个原始样本;
130.确定单元302,还用于轮流将每个原始样本确定为待标记样本;
131.标记单元,用于响应于操作人员针对待标记样本的每条表面轮廓线的标记操作,获得已标记样本;
132.获取单元301,还用于基于轮廓提取算法处理已标记样本,获得初始样本,初始样本包括初始样本中每个物体的表面轮廓;
133.替换单元303,具体用于基于仿射变换原理以及真实纹理,对待处理样本中每个物体的表面轮廓中的初始表面纹理执行纹理替换,得到目标样本。
134.在一种具体实现方式中,在从预先构建的纹理数据库中获取至少一个真实纹理之前,装置还包括:构建单元;
135.获取单元301,还用于基于网络爬虫技术获取多个初始纹理样本,初始纹理样本中物体的物体类型与密集堆叠的多个物体的目标物体类型一致,初始纹理样本为真实样本;
136.获取单元301,还用于基于实例分割算法提取每个初始纹理样本中物体的表面纹理,获得多个目标纹理样本;
137.构建单元,用于基于多个目标纹理样本构建纹理数据库。
138.请参阅图4,本技术实施例提供一种检测模型训练装置,包括:
139.训练单元401,用于基于第一方面的方法构建的目标数据集训练初始检测模型,以获得训练好的目标检测模型。
140.图5是本技术实施例提供的一种计算机设备结构示意图,该计算机设备500可以包
括一个或一个以上中央处理器(central processing units,cpu)501和存储器505,该存储器505中存储有一个或一个以上的应用程序或数据。
141.其中,存储器505可以是易失性存储或持久存储。存储在存储器505的程序可以包括一个或一个以上模块,每个模块可以包括对计算机设备中的一系列指令操作。更进一步地,中央处理器501可以设置为与存储器505通信,在计算机设备500上执行存储器505中的一系列指令操作。
142.计算机设备500还可以包括一个或一个以上电源502,一个或一个以上有线或无线网络接口503,一个或一个以上输入输出接口504,和/或,一个或一个以上操作系统,例如windows servertm,mac os xtm,unixtm,linuxtm,freebsdtm等。
143.该中央处理器501可以执行前述图1至图4所示实施例中数据集构建装置和/或检测模型训练装置所执行的操作,具体此处不再赘述。
144.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
145.在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
146.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
147.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
148.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
149.本技术实施例还提供一种包含指令的计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行如上述的数据集构建方法以及检测模型训练方法。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1