图片识别模型的训练方法、装置、存储介质及电子设备与流程

文档序号:37264297发布日期:2024-03-12 20:46阅读:14来源:国知局
图片识别模型的训练方法、装置、存储介质及电子设备与流程

本发明涉及图片识别领域,具体而言,涉及一种图片识别模型的训练方法、装置、存储介质及电子设备。


背景技术:

1、在深度学习领域,已经提出了很多的人脸识别训练算法,并且取得了很好的识别性能。目前人脸识别算法将图片通过卷积运算、下采样运算及线性映射等算子运算之后,提取到图片的特征,而后在分类训练时将特征向量与分类参数向量的计算转换到角度空间进行,也就是说将两个向量的点乘运算从代数形式转换到几何角度进行运算。

2、比如sphereface、cosineface、arcface等,目前人脸识别算法比较领先的是arcface,其在训练过程中通过卷积神经网络提取图片的特征,而后在分类时将提取到的人脸特征向量与分类参数向量的计算转换到角度空间进行,也就是说将两个向量的点乘运算从代数形式转换到几何形式进行运算。在两个向量进行几何运行时,在角度空间上增加了角度距离约束。arcface算法里定义了一个超参数m(m是大于0的数),用于角度距离约束,其在获得的两个向量夹角结果的基础上又加上了m,而后用相加之后的结果再用余弦函数进行计算,增加的角度距离约束,使得角度的取值范围会超过180度,这样几何运算时采用的余弦函数在定义域上不再有单调性。这样得到的人脸特征不具有更大的区分度,会导致训练的模型不容易收敛,因此存在模型训练效率低。

3、针对上述图片识别模型的训练效率低的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本发明实施例提供了一种图片识别模型的训练方法、装置、存储介质及电子设备,以至少解决图片识别模型的训练效率低的技术问题。

2、根据本发明实施例的一个方面,提供了一种图片识别模型的训练方法,包括:获取图片训练集合,其中,所述图片训练集合包括:多个样本图片,和每个所述样本图片的图片标签,所述图片标签用于表示所述样本图片的图片类别,所述图片类别至少包括:第一图片类别和第二图片类别;对所述图片训练集合进行特征提取,得到每个所述样本图片的样本分类向量,其中,所述样本分类向量基于特征向量和参数向量确定,所述特征向量为从所述样本图片中提取的,所述参数向量为依据所述样本图片的样本分类向量和所述图片类别对图片识别模型的训练结果,所述样本分类向量包括:属于所述第一图片类别的第一分类向量和属于所述第二图片类别的第二分类向量;根据所述第一分类向量对应的向量夹角确定第三分类向量,其中,所述向量夹角为所述第一分类向量的特征向量和参数向量之间的夹角,所述第三分类向量与所述第二分类向量的区分度大于所述第一分类向量与所述第二分类向量的区分度;基于所述第二分类向量和所述第三分类向量,确定所述图片识别模型的模型损失函数,其中,所述模型损失函数用于调整所述图片识别模型的参数向量。

3、可选地,对所述图片训练集合进行特征提取,得到每个所述样本图片的样本分类向量包括:从所述图片训练集合中随机抽取样本图片作为目标图片;对所述目标图片进行特征提取,得到目标分类向量;为所述目标分类向量添加类别标签,得到所述样本分类向量,其中,所述类别标签根据所述图片类别确定。

4、可选地,对所述目标图片进行特征提取,得到目标分类向量包括:对所述目标图片进行特征提取,得到所述目标图片的图片特征;对所述图片特征进行线性映射,得到所述目标图片的特征向量;将所述特征向量与所述参数向量进行点乘处理,得到所述目标分类向量。

5、可选地,将所述特征向量与所述参数向量进行点乘处理,得到所述目标分类向量包括:对所述特征向量与所述参数向量进行点乘运算,得到所述目标分类向量的运算模型,其中,所述运算模型表示所述目标分类向量为所述特征向量的特征模长,与所述参数向量的参数模长,以及所述特征向量和所述参数向量的夹角余弦值的乘积;对所述特征向量和所述参数向量进行归一化处理,使所述特征模长和所述参数模长均为1;在所述特征模长和所述参数模长为1的情况下,确定所述目标分类向量为所述特征向量和所述参数向量的夹角余弦值。

6、可选地,为所述目标分类向量添加类别标签,得到所述样本分类向量包括:获取所述目标图片的图片标签;检测所述图片标签是否表示所述目标图片为所述第一图片类别;在所述目标图片属于所述第一图片类别的情况下,为所述目标分类向量添加第一类别标签,其中,所述第一类别标签用于指示所述目标分类向量为所述第一分类向量;在所述目标图片不属于所述第一图片类别的情况下,确定所述目标图片属于所述第二图片类别,并为所述目标分类向量添加第二类别标签,其中,所述第二类别标签用于指示所述目标分类向量为所述第二分类向量,所述第二图片类别包括:多个图片子类别。

7、可选地,根据所述第一分类向量对应的向量夹角确定第三分类向量包括:利用反三角函数处理所述第一分类向量,得到所述向量夹角,其中,所述向量夹角的取值范围为[0°-180°];确定所述向量夹角与预设夹角的角度和为目标夹角,其中,所述预设夹角的取值范围为[0°-180°];检测所述目标夹角对应的角度区间,其中,所述角度区间包括:第一角度区间和第二角度区间,所述第一角度区间为(0°-180°],所述第二角度区间为(180°-360°];确定所述角度区间对应的预设分类向量为所述第三分类向量,其中,所述预设分类向量包括:所述第一角度区间对应的第一预设向量,和所述第二角度区间对应的第二预设向量,所述第一预设向量基于所述目标夹角的余弦值确定,所述第二预设向量基于所述目标夹角的余弦值的相反数与预设常数的差确定。

8、可选地,基于所述第二分类向量和所述第三分类向量,确定所述图片识别模型的模型损失函数包括:通过交叉熵损失函数分析所述第二分类向量和所述第三分类向量的差异,确定所述模型损失函数。

9、根据本发明实施例的另一方面,还提供了一种图片识别模型的训练装置,包括:图片获取模块,用于获取图片训练集合,其中,所述图片训练集合包括:多个样本图片,和每个所述样本图片的图片标签,所述图片标签用于表示所述样本图片的图片类别,所述图片类别至少包括:第一图片类别和第二图片类别;特征提取模块,用于对所述图片训练集合进行特征提取,得到每个所述样本图片的样本分类向量,其中,所述样本分类向量基于特征向量和参数向量确定,所述特征向量为从所述样本图片中提取的,所述参数向量为依据所述样本图片的样本分类向量和所述图片类别对图片识别模型的训练结果,所述样本分类向量包括:属于所述第一图片类别的第一分类向量和属于所述第二图片类别的第二分类向量;第一确定模块,用于根据所述第一分类向量对应的向量夹角确定第三分类向量,其中,所述向量夹角为所述第一分类向量的特征向量和参数向量之间的夹角,所述第三分类向量与所述第二分类向量的区分度大于所述第一分类向量与所述第二分类向量的区分度;第二确定模块,用于基于所述第二分类向量和所述第三分类向量,确定所述图片识别模型的模型损失函数,其中,所述模型损失函数用于调整所述图片识别模型的参数向量。

10、根据本发明实施例的另一方面,还提供了一种非易失性存储介质,所述非易失性存储介质用于存储程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行上述图片识别模型的训练方法。

11、根据本发明实施例的另一方面,还提供了一种电子设备,包括:存储器和处理器,所述处理器用于运行存储在所述处理器中的程序,其中,所述程序运行时执行上述图片识别模型的训练方法。

12、在本发明实施例中,将图片训练集合中属于第一图片类别和第二图片类别的样本图片进行特征提取,可以得到属于第一图片类别的第一分类向量和属于第二图片类别的第二分类向量,然后基于特征向量和参数向量的向量夹角对第一分类向量进行处理,可以得到属于第一图片类别的第三分类向量,使第三分类向量与第二分类向量相比第一分类向量与第二分类向量具有更大的区分度,进而在训练图片识别模型过程中,可以通过模型损失函数可以根据第二分类向量和第三分类向量调整图片识别模型的参数向量,优化图片识别模型对第一图片类别和第二图片类别的区分能力,使训练过程稳定且快速收敛,从而实现了图片识别模型的训练效的技术效果,进而解决了图片识别模型的训练效率低技术问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1