本公开涉及人工智能领域,具体涉及计算机视觉、深度学习和图像融合等,可应用于自动驾驶、安防与工业自动化等场景。
背景技术:
1、随着计算机技术和电子技术的发展,深度学习技术提供了从海量数据与信息中获取知识的可能性。该深度学习技术在计算机视觉、自然语言处理和语音信号处理等领域不断取得重要突破,展现出良好的应用场景,并在自动驾驶、安防与工业自动化等方向得到了广泛应用。
2、深度学习的效果依赖于大量高质量的标注数据,如果标注数据的质量较低,则会使得深度学习模型学习到的信息存在偏差,影响深度学习模型的精度和泛化能力。
技术实现思路
1、本公开旨在提供一种利于提高标注数据质量、降低标注数据生成成本的样本图像的生成方法和图像处理模型的训练方法、装置、电子设备和存储介质。
2、根据本公开的第一方面,提供了一种样本图像的生成方法,包括:对标注有类别的至少两个图像进行融合,得到融合图像;根据至少两个图像标注的类别,确定融合图像针对多个预定类别的概率向量;概率向量包括融合图像属于每个预定类别的概率值,至少两个图像标注的类别属于该多个预定类别;以及根据概率向量确定融合图像的标注信息,得到样本图像,其中,标注信息指示融合图像所属的类别。
3、根据本公开的第二方面,提供了一种图像处理模型的训练方法,包括:将训练集中的第一样本图像输入图像处理模型,得到第一样本图像针对多个预定类别的特征向量;特征向量包括第一样本图像针对多个预定类别中每个预定类别的特征数据;第一样本图像标注有第一类别;根据特征向量中针对第一类别的特征数据,确定图像处理模型的损失值;以及根据图像处理模型的损失值,对图像处理模型进行训练,其中,训练集中的第一样本图像包括本公开第一方面提供的方法生成的样本图像。
4、根据本公开的第三方面,提供了一种样本图像的生成装置,包括:图像融合模块,用于对标注有类别的至少两个图像进行融合,得到融合图像;概率确定模块,用于根据至少两个图像标注的类别,确定融合图像针对多个预定类别的概率向量;概率向量包括融合图像属于每个预定类别的概率值,至少两个图像标注的类别属于该多个预定类别;以及类别标注模块,用于根据概率向量确定融合图像的标注信息,得到样本图像,其中,标注信息指示融合图像所属的类别。
5、根据本公开的第四方面,提供了一种图像处理模型的训练装置,包括:特征向量获得模块,用于将训练集中的第一样本图像输入图像处理模型,得到第一样本图像针对多个预定类别的特征向量;特征向量包括第一样本图像针对多个预定类别中每个预定类别的特征数据;第一样本图像标注有第一类别;损失值确定模块,用于根据特征向量中针对第一类别的特征数据,确定图像处理模型的损失值;以及模型训练模块,用于根据图像处理模型的损失值,对图像处理模型进行训练,其中,训练集中的第一样本图像本公开第三方面提供的装置生成的样本图像。
6、根据本公开的第五方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少-个处理器能够执行本公开提供的样本图像的生成方法和/或图像处理模型的训练方法。
7、根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开提供的样本图像的生成方法和/或图像处理模型的训练方法。
8、根据本公开的第七方面,提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令存储于可读存储介质和电子设备其中至少之一上,所述计算机程序/指令在被处理器执行时实现本公开提供的样本图像的生成方法和/或图像处理模型的训练方法。
9、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
1.一种样本图像的生成方法,包括:
2.根据权利要求1所述的方法,其中,所述根据所述概率向量确定所述融合图像的标注信息,得到样本图像包括:
3.根据权利要求1所述的方法,其中,所述根据所述概率向量确定所述融合图像的标注信息,得到样本图像包括:
4.根据权利要求3所述的方法,其中:所述对标注有类别的至少两个图像进行融合,得到融合图像包括:
5.根据权利要求4所述的方法,其中,所述根据所述至少两个图像标注的类别,确定所述融合图像针对所述多个预定类别的概率向量包括:
6.根据权利要求5所述的方法,其中,所述根据所述预定权重系数组对指示所述至少两个图像标注的类别的数值按类别进行加权,得到所述融合图像属于所述每个预定类别的概率值包括:
7.一种图像处理模型的训练方法,包括:
8.根据权利要求7所述的方法,其中,所述训练集包括多个第一样本图像;所述根据所述特征向量中针对所述第一类别的特征数据,确定所述图像处理模型的损失值包括:针对所述每个预定类别:
9.根据权利要求8所述的方法,其中,所述第一图像为多个;所述确定所述图像处理模型将所述第一图像分类为所述每个预定类别的第一子分类损失值包括:
10.根据权利要求8所述的方法,其中,所述第二图像为多个;确定所述图像处理模型将所述第二图像分类为所述每个预定类别的第二子分类损失值包括:
11.根据权利要求10所述的方法,其中,所述根据所述第一值和所述第二值,确定所述第二子分类损失值包括:
12.根据权利要求11所述的方法,其中,所述根据所述第一值与所述第二值的预定倍数的差值,确定所述第二子分类损失值包括:
13.根据权利要求9或10所述的方法,其中,所述根据所述第一子分类损失值和所述第二子分类损失值,确定所述图像处理模型针对所述每个预定类别的总损失值包括:
14.根据权利要求7所述的方法,其中,所述图像处理模型包括特征提取网络和激活网络;所述将训练集中的第一样本图像输入图像处理模型,得到所述第一样本图像针对多个预定类别的特征向量包括:
15.根据权利要求14所述的方法,还包括:
16.一种样本图像的生成装置,包括:
17.一种图像处理模型的训练装置,包括:
18.一种电子设备,包括:
19.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1~15中任一项所述的方法。
20.一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令存储于可读存储介质和电子设备其中至少之一上,所述计算机程序/指令在被处理器执行时实现根据权利要求1~15中任一项所述方法的步骤。