样本数据采样方法及人脸识别方法与流程

文档序号：33955491发布日期：2023-04-26 15:01阅读：51来源：国知局

本申请涉及计算机，尤其涉及一种样本数据采样方法及人脸识别方法。

背景技术：

1、传统人脸识别算法中，经常出现训练数据类别不平衡的问题，针对数据不平衡问题的解决方法之一是改进采样方法，目前最常使用数据采样方法，分别是常规采样法和均匀采样法。

2、常规采样法采用头部类别采样概率高，尾部类别采样概率低的方式采样，这种采样方法会导致人脸识别算法对尾部类别欠拟合；均匀采样法是对每种类别保持相同的采样概率进行采样，但是这种方法会导致人脸识别算法对尾部类别严重过拟合，头部类别也训练不充分。因此，现有的样本数据采样方法，会影响算法对尾部类别输入图片的预测精度，降低人脸识别算法的整体精度，进而降低人脸识别算法的效果。

技术实现思路

1、有鉴于此，本申请实施例提供了一种样本数据采样方法及人脸识别方法，以解决现有技术存在的降低人脸识别算法的整体精度，进而降低人脸识别算法的效果的问题。

2、本申请实施例的第一方面，提供了一种样本数据采样方法，包括：获取原始数据集，原始数据集中包含至少一个样本类别和样本类别对应的样本数据；依据每个样本类别对应的样本数据的个数，确定每个样本类别对应的常规采样率；依据原始数据集中样本类别的个数，确定每个样本类别对应的均匀采样率；依据预设的常规采样率和均匀采样率分别对应的加权参数，确定每个样本类别对应的平衡采样率；对每个样本类别对应的平衡采样率执行归一化操作，得到归一化后的样本类别对应的平衡采样率；基于归一化后的样本类别对应的平衡采样率确定每个样本类别对应的目标样本数，利用无放回随机采样从样本类别对应的样本数据中获取与目标样本数相匹配的目标数据。

3、本申请实施例的第二方面，提供了一种基于第一方面的样本数据采样方法的人脸识别方法，包括：利用样本数据采样方法对原始数据集中的原始人脸图像进行采样，得到目标人脸图像；将目标人脸图像输入到人脸识别模型的主干网络，利用主干网络对目标人脸图像进行特征提取和融合，得到特征图；将特征图输入到人脸识别模型的颈部模块，利用颈部模块中的展平层和全连接层对特征图进行处理，得到特征向量；将特征向量输入到人脸识别模型的头部模块，利用头部模块中的全连接层对特征向量进行处理，输出目标人脸图像对应的类别。

4、本申请实施例的第三方面，提供了一种电子设备，包括存储器，处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时实现上述方法的步骤。

5、本申请实施例的第四方面，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述方法的步骤。

6、本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：

7、通过获取原始数据集，原始数据集中包含至少一个样本类别和样本类别对应的样本数据；依据每个样本类别对应的样本数据的个数，确定每个样本类别对应的常规采样率；依据原始数据集中样本类别的个数，确定每个样本类别对应的均匀采样率；依据预设的常规采样率和均匀采样率分别对应的加权参数，确定每个样本类别对应的平衡采样率；对每个样本类别对应的平衡采样率执行归一化操作，得到归一化后的样本类别对应的平衡采样率；基于归一化后的样本类别对应的平衡采样率确定每个样本类别对应的目标样本数，利用无放回随机采样从样本类别对应的样本数据中获取与目标样本数相匹配的目标数据。本申请将常规采样率和均匀采样率进行加权结合，使归一化后的平衡采样率能够对头部和尾部类别数据进行合适平衡的采样，从而提高了人脸识别算法的整体精度和识别效果。

技术特征：

1.一种样本数据采样方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述依据每个所述样本类别对应的样本数据的个数，确定每个所述样本类别对应的常规采样率，包括：

3.根据权利要求1所述的方法，其特征在于，所述依据所述原始数据集中所述样本类别的个数，确定每个所述样本类别对应的均匀采样率，包括：

4.根据权利要求1所述的方法，其特征在于，所述依据预设的所述常规采样率和所述均匀采样率分别对应的加权参数，确定每个所述样本类别对应的平衡采样率，包括：

5.根据权利要求4所述的方法，其特征在于，利用以下公式计算每个所述样本类别对应的平衡采样率：

6.根据权利要求1所述的方法，其特征在于，利用以下公式对每个所述样本类别对应的平衡采样率执行归一化操作：

7.根据权利要求1所述的方法，其特征在于，所述基于归一化后的所述样本类别对应的平衡采样率确定每个所述样本类别对应的目标样本数，包括：

8.根据权利要求1所述的方法，其特征在于，所述利用无放回随机采样从所述样本类别对应的样本数据中获取与所述目标样本数相匹配的目标数据，包括：

9.根据权利要求1-8中任一项所述的方法，其特征在于，所述样本类别为人脸类别，所述样本数据为原始人脸图像。

10.一种基于如权利要求1-9中任一项所述样本数据采样方法的人脸识别方法，其特征在于，包括：

技术总结
本申请提供一种样本数据采样方法及人脸识别方法。该方法包括：获取原始数据集，依据每个样本类别对应的样本数据的个数，确定每个样本类别对应的常规采样率；依据原始数据集中样本类别的个数，确定每个样本类别对应的均匀采样率；依据预设的常规采样率和均匀采样率分别对应的加权参数，确定每个样本类别对应的平衡采样率；对每个样本类别对应的平衡采样率执行归一化操作，得到归一化后的样本类别对应的平衡采样率；基于归一化后的样本类别对应的平衡采样率确定每个样本类别对应的目标样本数，利用无放回随机采样从样本类别对应的样本数据中获取与目标样本数相匹配的目标数据。本申请提升了人脸识别算法的整体精度和识别效果。

技术研发人员：何翔,黄泽元
受保护的技术使用者：北京龙智数科科技服务有限公司
技术研发日：
技术公布日：2024/1/11

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：何翔黄泽元
技术所有人：北京龙智数科科技服务有限公司
我是此专利的发明人

上一篇：一种传染病再生模型构建方法与流程
上一篇：一种土工膜铺设装置及铺设方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。