一种基于AI大模型的半自动标注与半自动审核方法与流程

文档序号:40930115发布日期:2025-02-14 21:43阅读:16来源:国知局
一种基于AI大模型的半自动标注与半自动审核方法与流程

本发明涉及图像处理、目标检测和人工智能应用领域,具体涉及一种基于ai大模型的半自动标注与半自动审核方法。


背景技术:

1、数据标注是人工智能领域中的关键环节,近年来随着深度学习和机器学习技术的快速发展,对高质量标注数据的需求日益增长。全球范围内的数据标注市场规模持续扩大,预计未来几年仍会保持较高增速。当前样本标注工作已成为了人工智能领域中耗时最长、成本最高的一环,在众多的数据标注任务中,类似目标框检测定位、语义分割等复杂任务成本相对较高,对于高精度需求需要多次审核来保障样本的质量,这使得成本进一步增加,据网上能查询的相关信息,一个较为基础的图像标注任务单价在0.01元至0.5元之间,而对于更复杂的标注工作,单价可能会达到几元,甚至更高,包含一万张图像的数据集标注成本可能达到数万元。如何切实地提高样本标注速度和质量成为了人工智能领域的一个关键命题,而减少样本标注的工作量,并对标注过程中产生的错误进行检查则是其中的关键。

2、当前数据标注行业正经历着由粗放式增长向精细化、智能化发展的过程,同时也在寻求降低人力密集型工作的成本,寻求技术创新来提升整体行业的经济效益和可持续发展能力。为迎合行业发展需求,解决行业发展问题,本发明针对模型标注和审核的成本高、耗时长等问题,着手于样本标注环节的智能化,设计了一种基于ai大模型的半自动标注与半自动审核方法。在标注图片的同时,捕获标注目标周围的背景信息,借鉴现今蓬勃发展的大模型以及无监督技术,采用自监督方法以及传统分割方法,对目标进行预标注,并在标注完成后,结合背景信息对标注完成的标注框进行检查,减少人工审核的工作量。


技术实现思路

1、针对现有技术的不足,本发明提供了一种基于ai大模型的半自动标注与半自动审核方法,减少样本标注的工作量,提升人工智能部署的效率具体流程如图1所示,通过改进人工标注过程中的预选框和审核环节内容,减少了人工标注的工作量,主要包括以下步骤:

2、一种基于ai大模型的半自动标注与半自动审核方法,包括以下步骤:

3、s01:建立标注框预提取模型,提供标注过程的初始标注提示;

4、s02:基于自监督学习方法,训练得到目标检测框置信度检测模型;

5、s03:根据s01和s02得到的模型,输入图像至标注框预提取模型,得到图像的标注框,标注框切片后输入目标检测框置信度检测模型得出标注框置信度,提供初始审核建议和初步筛选标签,并在人工标注后,根据人工标注结果和图像特征,再次计算标注框置信度,提供标签分数排名,得到校正过的数据集结果。

6、进一步的,在s01中,包括:

7、s101:针对输入图像预处理后的结果,基于多个深度目标检测大模型得到图像的目标提示框以及置信度;

8、s102:基于已经得到的目标提示框,进行目标框极大值抑制得到最终的前景目标检测框;

9、s103:基于目标检测框的边长、面积信息,筛出明显不符合的检测目标。

10、进一步的,在步骤s02中,包括:

11、s201:基于公开的各类目标检测数据集,首先生成目标框图像切片;

12、s202:针对s201得到目标框图像切片和标注框坐标信息,结合特征信息生成检测框的参考置信度,计算iou作为目标框参考置信度,从而得到可使用的训练数据集;

13、s203:基于在s202中的图像切片、标注框和参考置信度进行网络训练,其中,网络输入为图像切片和标注框,输出为参考置信度,训练得到审核网络模型;

14、在s203的训练过程,引入目标框坐标信息:图像在经过基础网络框架后获得特征图f,基于目标框对特征图f进行裁剪,裁剪前和裁剪后的特征图分别下采样得到等长的特征向量,将两个特征向量合并后作为新的特征传入网络。

15、进一步的,在s03中,包括:

16、s301:输入在s01中获取的目标检测框和原始图像,生成目标切片;

17、s302:基于分割大模型,以目标检测框和目标切片为基础,获取图像中目标的轮廓信息,基于轮廓信息筛选,剔除不符合要求的目标框,再基于s02中训练得到的目标检测框置信度检测模型,筛除不合格的标注样本;

18、s303:在筛选过后的图像和标注框中,进行人工的校正,并补充类别信息;

19、s304:通过s02中训练得到的目标检测框置信度检测模型进行检查,无误后保存入库形成新的数据集。

20、与现有技术相比,本发明的有益效果在于:

21、针对深度学习任务标注任务目标多,成本高,审核耗时长的问题,提出了一种基于ai大模型的半自动标注与半自动审核方法,相比现有技术流程,本发明具有以下优点:

22、1.通过预标注算法,提取出图像中可能存在的目标,减少人工标注的工作量,提高样本标注效率。

23、2.可通过计算样本框和其背景的匹配程度,得出参考置信度,提供样本标注辅助审核建议,减少审核所需的工作量。



技术特征:

1.一种基于ai大模型的半自动标注与半自动审核方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于ai大模型的半自动标注与半自动审核方法,其特征在于,在s01中,包括:

3.根据权利要求1所述的一种基于ai大模型的半自动标注与半自动审核方法,其特征在于,在步骤s02中,包括:

4.根据权利要求1所述的一种基于ai大模型的半自动标注与半自动审核方法,其特征在于,在s03中,包括:


技术总结
本发明公开了一种基于AI大模型的半自动标注与半自动审核方法,涉及图像处理、目标检测和人工智能应用领域。包括:第一步:运用一种大模型和无监督标注技术得到了预标注模型,得到初步的预选标注框;第二步:训练一个标注效果审核网络,用于筛除不符合要求的目标框;第三步:基于前两个步骤得到了目标框预提取和目标框置信度分析两个网络模型,人工在筛选过的预标注标签上进行进一步标注,完善标签;随后,针对完善的标签结果,基于SAM语义分割大模型获取目标轮廓,以该目标轮廓进一步筛选目标框,并采用标注框检测模型对标注结果进行审核,审核完善后形成最终标注结果。

技术研发人员:陈德跃,朱长仁,杨晓亮,韦广立,张刚,李旭佳,赵会盼,伍祐锟,胡俊,赵飞
受保护的技术使用者:中国电子科技集团公司第五十四研究所
技术研发日:
技术公布日:2025/2/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1