本申请涉及计算机,尤其涉及一种样本数据采样方法及人脸识别方法。
背景技术:
1、传统人脸识别算法中,经常出现训练数据类别不平衡的问题,针对数据不平衡问题的解决方法之一是改进采样方法,目前最常使用数据采样方法,分别是常规采样法和均匀采样法。
2、常规采样法采用头部类别采样概率高,尾部类别采样概率低的方式采样,这种采样方法会导致人脸识别算法对尾部类别欠拟合;均匀采样法是对每种类别保持相同的采样概率进行采样,但是这种方法会导致人脸识别算法对尾部类别严重过拟合,头部类别也训练不充分。因此,现有的样本数据采样方法,会影响算法对尾部类别输入图片的预测精度,降低人脸识别算法的整体精度,进而降低人脸识别算法的效果。
技术实现思路
1、有鉴于此,本申请实施例提供了一种样本数据采样方法及人脸识别方法,以解决现有技术存在的降低人脸识别算法的整体精度,进而降低人脸识别算法的效果的问题。
2、本申请实施例的第一方面,提供了一种样本数据采样方法,包括:获取原始数据集,原始数据集中包含至少一个样本类别和样本类别对应的样本数据;依据每个样本类别对应的样本数据的个数,确定每个样本类别对应的常规采样率;依据原始数据集中样本类别的个数,确定每个样本类别对应的均匀采样率;依据预设的常规采样率和均匀采样率分别对应的加权参数,确定每个样本类别对应的平衡采样率;对每个样本类别对应的平衡采样率执行归一化操作,得到归一化后的样本类别对应的平衡采样率;基于归一化后的样本类别对应的平衡采样率确定每个样本类别对应的目标样本数,利用无放回随机采样从样本类别对应的样本数据中获取与目标样本数相匹配的目标数据。
3、本申请实施例的第二方面,提供了一种基于第一方面的样本数据采样方法的人脸识别方法,包括:利用样本数据采样方法对原始数据集中的原始人脸图像进行采样,得到目标人脸图像;将目标人脸图像输入到人脸识别模型的主干网络,利用主干网络对目标人脸图像进行特征提取和融合,得到特征图;将特征图输入到人脸识别模型的颈部模块,利用颈部模块中的展平层和全连接层对特征图进行处理,得到特征向量;将特征向量输入到人脸识别模型的头部模块,利用头部模块中的全连接层对特征向量进行处理,输出目标人脸图像对应的类别。
4、本申请实施例的第三方面,提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述方法的步骤。
5、本申请实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
6、本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
7、通过获取原始数据集,原始数据集中包含至少一个样本类别和样本类别对应的样本数据;依据每个样本类别对应的样本数据的个数,确定每个样本类别对应的常规采样率;依据原始数据集中样本类别的个数,确定每个样本类别对应的均匀采样率;依据预设的常规采样率和均匀采样率分别对应的加权参数,确定每个样本类别对应的平衡采样率;对每个样本类别对应的平衡采样率执行归一化操作,得到归一化后的样本类别对应的平衡采样率;基于归一化后的样本类别对应的平衡采样率确定每个样本类别对应的目标样本数,利用无放回随机采样从样本类别对应的样本数据中获取与目标样本数相匹配的目标数据。本申请将常规采样率和均匀采样率进行加权结合,使归一化后的平衡采样率能够对头部和尾部类别数据进行合适平衡的采样,从而提高了人脸识别算法的整体精度和识别效果。
1.一种样本数据采样方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述依据每个所述样本类别对应的样本数据的个数,确定每个所述样本类别对应的常规采样率,包括:
3.根据权利要求1所述的方法,其特征在于,所述依据所述原始数据集中所述样本类别的个数,确定每个所述样本类别对应的均匀采样率,包括:
4.根据权利要求1所述的方法,其特征在于,所述依据预设的所述常规采样率和所述均匀采样率分别对应的加权参数,确定每个所述样本类别对应的平衡采样率,包括:
5.根据权利要求4所述的方法,其特征在于,利用以下公式计算每个所述样本类别对应的平衡采样率:
6.根据权利要求1所述的方法,其特征在于,利用以下公式对每个所述样本类别对应的平衡采样率执行归一化操作:
7.根据权利要求1所述的方法,其特征在于,所述基于归一化后的所述样本类别对应的平衡采样率确定每个所述样本类别对应的目标样本数,包括:
8.根据权利要求1所述的方法,其特征在于,所述利用无放回随机采样从所述样本类别对应的样本数据中获取与所述目标样本数相匹配的目标数据,包括:
9.根据权利要求1-8中任一项所述的方法,其特征在于,所述样本类别为人脸类别,所述样本数据为原始人脸图像。
10.一种基于如权利要求1-9中任一项所述样本数据采样方法的人脸识别方法,其特征在于,包括: