基于AIGC的训练数据集确定方法及装置、存储介质、终端与流程

文档序号:36085113发布日期:2023-11-18 02:45阅读:来源:国知局

技术特征:

1.一种基于aigc的训练数据集确定方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在将第二训练数据集输入所述预训练模型进行再次迭代训练之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,基于aigc技术,对所述第一训练数据集进行数据扩充,得到扩充产品缺陷图像集,包括:

4.根据权利要求3所述的方法,其特征在于,对每个产品样本图像子集,基于其中的产品样本图像的特征向量进行特征融合,以得到该产品样本图像子集对应的多个融合特征向量,包括:

5.根据权利要求2或3所述的方法,其特征在于,所述扩充产品缺陷图像集的产品缺陷标签,是采用所述预训练模型进行产品缺陷预测得到的。

6.根据权利要求3所述的方法,其特征在于,在对所述第一训练数据集中的产品样本图像进行特征提取之前,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述第一训练数据集的每张产品样本图像是对单张产品样本子图进行一次或多次正反倒转拼接得到的;其中,所述产品样本图像包含的每张产品样本子图均具有各自的产品缺陷标签。

8.根据权利要求7所述的方法,其特征在于,采用下述表达式表示所述第一损失函数:

9.根据权利要求1所述的方法,其特征在于,采用下述表达式表示所述第二损失函数:

10.根据权利要求1所述的方法,其特征在于,在得到所述第三训练数据集之后,所述方法还包括:

11.一种基于aigc的训练数据集确定装置,其特征在于,包括:

12.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1至10任一项所述基于aigc的训练数据集确定方法的步骤。

13.一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算机程序时执行权利要求1至10任一项所述基于aigc的训练数据集确定方法的步骤。


技术总结
一种基于AIGC的训练数据集确定方法及装置、存储介质、终端,方法包括:将第一训练数据集输入初始模型进行初步迭代训练得到预训练模型;将第二训练数据集输入预训练模型进行再次迭代训练得到再训练模型,所述第二训练数据集是基于AIGC技术对所述第一训练数据集进行扩充得到的;将多张待标注图像输入再训练模型进行产品缺陷预测,并采用产品缺陷预测结果对待标注图像进行标注,得到第三训练数据集;其中,第二训练数据集与第一训练数据集的图像数量的比值大于等于10,初步迭代训练采用的第一损失函数与再次迭代训练采用的第二损失函数的收敛阈值的比值大于等于2。上述方案可以快速获得大量标注有准确的产品缺陷标签的训练数据集。

技术研发人员:余炯,王予津
受保护的技术使用者:华院计算技术(上海)股份有限公司
技术研发日:
技术公布日:2024/1/16
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1