一种增加不确定性预测的年龄估计方法

文档序号：35352345发布日期：2023-09-07 22:33阅读：23来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明涉及计算机视觉，具体涉及一种增加不确定性预测的年龄估计方法。

背景技术：

1、年龄估计在视频监控、社交网络和人机交互等方面有着广泛的应用。许多已发表的方法仅将年龄估计视为一个精确的年龄计算问题，因此忽略了人脸图像和年龄之间本身存在歧义性和不确定性。

技术实现思路

1、本发明提出一种增加不确定性预测的年龄估计方法，旨在将人脸图像和年龄之间本身存在歧义性和不确定性引入年龄估计中，让年龄估计结果更加符合现实情况。

2、为实现以上的目的，本发明是通过以下技术方案来实现的：

3、步骤1：对输入的批量人脸图像进行预处理和图像增强；

4、步骤2：将处理后的图像输入到特征提取网络进行特征提取，将提取到的特征值输入到年龄均值网络f和不确定性网络n进行计算；

5、步骤3：以年龄均值网络输出f(x)和对应年龄不确定性网络输出n(x)分别为正态分布的均值和方差，从该正态分布中采样得到预测年龄p(x)；

6、步骤4：通过mse计算损失函数，反向传播更新参数；

7、步骤5：针对数据集中所有数据重复50次步骤1到步骤4。

8、进一步的，步骤1中输入图像是rgb三通道的彩色原图。

9、进一步的，步骤1中预处理将大小不一致的彩色原图通过双线性插值的方式转换成长宽为256*256的图像然后进行随即边缘裁剪，裁剪到长宽为224*224的图像。

10、进一步的，所以图像增强包括将彩色图像转换为黑白图像，以及随机微调彩色图像亮度，最终输出到神经网络的图像包括裁剪到长宽为224*224的原始彩色图像x1、黑白图像x2和调整亮度之后的图像x3。

11、进一步的，所述的特征提取网络是改进后resnet18网络，具体将resnet18网络的最后一层全连接层裁剪掉。

12、进一步的，步骤2具体实现如下：年龄均值网络f和不确定性网络n都先经过三层全连接网络，且前两层全连接网络的结构相同：512*256和256*128；最后一层全连接网络根据任务不同而不同：年龄均值网络f采用分类的方式进行年龄预测，最后一层的结构对应年龄标签的范围，设最小年龄0最大年龄69，则f的最后一层的结构就是128*70，最后从维度为70的数据取最大值所对应的下标就是f所预测的年龄f(x)；不确定性网络n的输出n(x)表示的是年龄的不确定性，作为f输出年龄的方差参与定量计算，采用回归的方式进行预测，因此不确定性网络n最后一层的结构为128*1，输出为1维，即代表方差。

13、经过测试，本发明具有的有益效果是：

14、本发明旨在将人脸图像和年龄之间本身存在歧义性和不确定性引入年龄估计中，让年龄估计结果更加符合现实情况。其中的关键就在于引入了不确定性网络，该网络针对图像进行年龄不确定性的评估，最终结合年龄均值网络将这种不确定性体现在了年龄预测的结果中。

15、根据人脸年龄估计特点所设计的图像增强以及年龄不确定性的定量引入，使得模型泛化能力更强，可以更有效的预测人脸年龄。在仅有900张图片参与训练的数据集fgnet上，平均预测年龄误差相比没有不确定性预测的方法降低了半岁，从3.3岁降低到2.8岁。

技术特征：

1.一种增加不确定性预测的年龄估计方法，其特征在于包括如下步骤：

2.根据权利要求1所述的一种增加不确定性预测的年龄估计方法，其特征在于步骤1中输入图像是rgb三通道的彩色原图。

3.根据权利要求2所述的一种增加不确定性预测的年龄估计方法，其特征在于步骤1中预处理将大小不一致的彩色原图通过双线性插值的方式转换成长宽为256*256的图像然后进行随即边缘裁剪，裁剪到长宽为224*224的图像。

4.根据权利要求2或3所述的一种增加不确定性预测的年龄估计方法，其特征在于所以图像增强包括将彩色图像转换为黑白图像，以及随机微调彩色图像亮度，最终输出到神经网络的图像包括裁剪到长宽为224*224的原始彩色图像x1、黑白图像x2和调整亮度之后的图像x3。

5.根据权利要求4所述的一种增加不确定性预测的年龄估计方法，其特征在于所述的特征提取网络是改进后resnet18网络，具体将resnet18网络的最后一层全连接层裁剪掉。

6.根据权利要求4所述的一种增加不确定性预测的年龄估计方法，其特征在于步骤2具体实现如下：年龄均值网络f和不确定性网络n都先经过三层全连接网络，且前两层全连接网络的结构相同：512*256和256*128；最后一层全连接网络根据任务不同而不同：年龄均值网络f采用分类的方式进行年龄预测，最后一层的结构对应年龄标签的范围，设最小年龄0最大年龄69，则f的最后一层的结构就是128*70，最后从维度为70的数据取最大值所对应的下标就是f所预测的年龄f(x)；不确定性网络n的输出n(x)表示的是年龄的不确定性，作为f输出年龄的方差参与定量计算，采用回归的方式进行预测，因此不确定性网络n最后一层的结构为128*1，输出为1维，即代表方差。

7.根据权利要求6所述的一种增加不确定性预测的年龄估计方法，其特征在于步骤3具体是先从标准正态分布中随机采样，然后乘以不确定性网络的结果，最后加上年龄均值网络的结果得到的就是预测的年龄。

8.根据权利要求6或7所述的一种增加不确定性预测的年龄估计方法，其特征在于步骤4损失函数计算如下：

技术总结
本发明公开了一种增加不确定性预测的年龄估计方法。本发明包括如下步骤：1：对输入的批量人脸图像进行预处理和图像增强；2：将处理后的图像输入到特征提取网络进行特征提取，将提取到的特征值输入到年龄均值网络F和不确定性网络N进行计算；步骤3：以年龄均值网络输出和对应年龄不确定性网络输出分别为正态分布的均值和方差，从该正态分布中采样得到预测年龄；步骤4：通过MSE计算损失函数，反向传播更新参数；步骤5：针对数据集中所有数据重复50次步骤1到步骤4。本发明根据人脸年龄估计特点所设计的图像增强以及年龄不确定性的定量引入，使得模型泛化能力更强，可以更有效的预测人脸年龄。

技术研发人员：李建军,郑祥,田万勇,赵露露
受保护的技术使用者：杭州电子科技大学
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李建军郑祥田万勇赵露露
技术所有人：杭州电子科技大学
我是此专利的发明人

上一篇：视频处理方法、装置、电子设备和存储介质与流程
上一篇：一种柔性瓶夹的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。