一种图像目标三维信息标注方法及图像标注工具与流程

文档序号：29440343发布日期：2022-03-30 10:02阅读：416来源：国知局

1.本分明涉及图像信息标注，具体涉及一种图像目标三维信息标注方法。

背景技术：

2.现有的三维标注方法是在点云数据中进行三维框标注，但是某些场景中无法使用雷达获得点云数据，但是又想获得二维图像中的三维数据。
3.目前的三维框标注是在二维框的基础上，根据角点匹配关系生成三维检测框，手动调整三维检测框的8个顶点位置，生成准确的三维检测框，再根据三维检测框的顶点位置，计算目标的物理尺寸信息，但是由于三维检测框手动一步一步修改，人工调整次数多，效率低，其次利用顶点坐标位置星计算物理尺寸信息，无法保证物理尺寸信息的准确度，容易失真。

技术实现要素：

4.本发明的目的是提供一种图像目标三维信息标注方法，解决现有标注方法直接对图像目标的三维信息进行标注，从而将标注信息用于标注三维目标检测的训练数据。
5.一种图像目标三维信息标注方法，包括以下步骤：1)读取待标注的图像； 2)设置目标物体的高度，宽度，长度；3)设置三维检测框初始x轴数值，y轴数值，z轴数值，朝向α的数值；4)设置拍摄待标注的图像的摄像头内参；5)根据（1），（2），（3），（4）将待标注的图像中的目标物体投影到待标注的图像上，形成三维检测框；6)调整x轴数值，y轴数值，z轴数值，朝向α的数值，使得三维检测框准确覆盖待标注的图像上的目标物体；7)保存调整后的x轴数值，y轴数值，z轴数值，朝向α的数值形成三维目标检测的训练数据。
6.进一步地，步骤(6)包括，调整z轴数值，对三维检测框进行放大或缩小。进一步地，步骤(6)包括，调整x轴数值，对三维检测框进行水平向左或向右平移。
7.进一步地，步骤(6)包括，调整y轴数值，对三维检测框进行竖直向上或向下平移。
8.进一步地，步骤(6)包括，调整α朝向，对三维检测框的朝向进行调节。
9.进一步地，所述步骤(1)包括，输入待标注的图像中目标物体类型，目标物体的截断属性，目标物体的遮挡属性。
10.一种图像标注工具，包括：文件读取单元，用于读取待标注的图像；目标物体物体尺寸输入单元，用于输入目标物体的长，宽，高；目标物体位置输入单元，用于输入目标物体在相机坐标系下的位置，包括x轴数值，y轴数值，z轴数值；目标物体朝向输入单元，用于输入目标物体在相机坐标系下的朝向α的数值；三维检测框绘制单元，将待标注的图像中的目标物体投影到待标注的图像上，形成三维检测框；目标物体属性输入单元，用于输入目标物体的类别，截断属性，遮挡属性；数据保存单元，用于保存调整后的x轴数值，y轴数值，z轴数值，朝向α的数值数据形成三维目标检测的训练数据。
11.进一步地，三维检测框绘制单元还包括：矩形框绘制单元，根据摄像头内参，目标物体尺寸输入单元，目标物体位置输入单元，目标物体朝向输入单元中的数据计算三维检
测框的9个点的坐标，其中9个点包括8个顶点和1个中心点，连接8个顶点的形成三维检测框；方向线绘制单元，连接上下两点形成x线，其中x线作为目标物体的朝向。
12.本发明的有益效果：通过直接调整目标物体的长，宽，高，x，y，z轴位置，将三维检测框直接绘制到待标注的图像中，使得三维检测框覆盖待标注的图像中的目标物体，最后保存所有调整的参数信息，能够方便，快捷得到深度学习的训练数据，有利于三维目标检测算法的实现。
附图说明
13.图1是本发明的目标物体投影到待标注的图像上形成三维检测框的示意图；图2是本发明三维检测框示意图；图3是本发明三维检测框可视化界面图；图4是本发明三维检测框效果图。
具体实施方式
14.下面结合附图对本发明进行进一步说明。
15.本发明公开一种图像目标三维信息标注方法，包括以下步骤：1)读取待标注的图像，并将待标注的图像通过可视化窗口单独显示；待标注的图像为包含人体的图像，目标对象是人体，待标注图像的格式为person.png。通过待标注图像中读取目标物体在待标注的图像中检测出来的二维坐标地址。
16.2)设置目标物体的高度，宽度，长度；人体的高度为1.75，宽度为0.4，长度为0.3。
17.3)设置三维检测框初始x轴数值，y轴数值，z轴数值，朝向α数值；x轴数值为-0.08，y轴数值为1.23，z轴数值4.84，朝向α数值为1.11，α=rotation_y。
18.4)设置拍摄待标注的图像的摄像头内参；从文本数据1.txt中读取摄像头的内参数据，在本实施例中摄像头的内参数据为。
19.5)根据（1），（2），（3），（4）将待标注的图像中的目标物体投影到待标注的图像上，形成三维检测框；如图1-2中显示了在待标注的图像上显示了带有朝向的三维检测框。
20.6)调整x轴数值，y轴数值，z轴数值，朝向α的数值，使得三维检测框准确覆盖待标注的图像上的目标物体。
21.在目标物体的三维尺寸信息，x轴数值，y轴数值，z轴数值匹配的情况下，使得三维检测框的朝向与目标物体的朝向大致一致，记录朝向α的数值。
22.7)保存调整后的x轴数值，y轴数值，z轴数值，朝向α的数据形成三维目标检测的训练数据。
23.本实施例中设定保存路径，保存所有调整参数形成三维目标检测的训练数据。保存后的文件格式为txt，文件内容包括：person 0 1
ꢀ‑
0.49 859 251 1125 867 1.85 0.32 0.39
ꢀ‑
0.08 1.27 4.75
ꢀ‑
0.51。
24.步骤(6)包括，调整z轴数值，对三维检测框进行放大或缩小。步骤(6)包括，调整x轴数值，对三维检测框进行水平向左或向右平移。
25.步骤(6)包括，调整y轴数值，对三维检测框进行竖直向上或向下平移。
26.步骤(6)包括，调整α朝向，对三维检测框的朝向进行调节。
27.所述步骤(1)包括，输入待标注的图像中目标物体类型，目标物体的截断属性，目标物体的遮挡属性。
28.图3是三维检测框可视化界面，在图像窗口中可视化标注结果，可对标注结果进行相应修改。
29.本发明还包括一种图像标注工具，包括：文件读取单元，用于读取摄像头内参，待标注图像，物体二维坐标地址文件；目标物体尺寸输入单元，用于输入目标物体的长，宽，高；目标物体位置输入单元，用于输入目标物体在相机坐标系下的位置，包括x轴数值，y轴数值，z轴数值；目标物体朝向输入单元，用于输入目标物体在相机坐标系下的方向，朝向α的数值；三维检测框绘制单元，根据目标物体尺寸输入单元，目标物体位置输入单元，目标物体朝向输入单元中的数据在待标注图像上绘制三维检测框；三维检测框绘制单元包括：矩形框绘制单元，根据摄像头内参，目标物体尺寸输入单元，目标物体位置输入单元，目标物体朝向输入单元中的数据计算三维检测框的9个点的坐标，其中9个点包括8个顶点和1个中心点，连接8个顶点的形成三维检测框；方向线绘制单元，连接上下两点形成x线；目标物体属性输入单元，用于输入目标物体的类别，截断属性，遮挡属性；数据保存单元，保存结合目标物体的类别，截断属性，遮挡属性，目标物体二维坐标，调整后的目标物体尺寸输入单元，目标物体位置输入单元，目标物体朝向输入单元中的数据，保存为三维目标检测的训练数据。
30.本发明的标注原理是：首先生成目标物体在相机坐标系下的长度，宽度，高度；其次导入包含目标物体的待标注的图像，根据拍摄待标注的图像的摄像头的内参，将目标物体投影到待标注的图像上，形成三维检测框；最后，调整目标物体在相机坐标系下的x，y，z，朝向的数值，使得三维检测框准确覆盖待标注的图像上的目标物体。最后，保存调整后的x，y，z，朝向的数值和其他输入数据形成三维目标检测的训练数据。
31.如图4中所示，相比于传统三维检测训练数据标注，本实施例通过输入数值生成三维检测框，进而动态调整三维检测框，快速使得三维检测框完整覆盖待标注的图像中的目标，快速保存三维目标检测的训练数据。不需要手动框选形成三维检测框，减小手动框选的误差调整。
32.尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：丁柏宇辉王韬
技术所有人：南京猫头鹰智能科技有限公司
我是此专利的发明人

上一篇：一种石英矿石吨袋的卸料装置的制作方法
上一篇：一种处理高温气冷堆元件核芯制备工艺废水的新方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。