人像背景相似度的数据集构建方法及其模型构建方法与流程

文档序号:38109320发布日期:2024-05-28 19:30阅读:20来源:国知局
人像背景相似度的数据集构建方法及其模型构建方法与流程

本发明涉及计算机图像处理,尤其是涉及一种人像背景相似度的数据集构建方法及其模型构建方法。


背景技术:

1、随着金融业数字化转型,银行系统朝着智能化、机具化、无人化不断发展,基于金融图像相似度计算的应用场景越来越广泛。数据是基础,模型是支撑,智能化是目标;图像数据质量决定了有监督学习模型的能力上限,构建优质的图像对数据能够提升模型对相似图像的区分度。在严格的金融领域场景中,监管力度的加强对模型能力提出了更高要求,模型需要不断从新图像中自动学习两两之间的区分性,持续更新模型的辨别能力。同时,因为数据标注是一项高人力成本的活动,需要占用大量业务人员的工作时间,为了保证数据质量还要定期安排专人对数据进行审核与纠察,才能达到持续更新模型的人像自拍照背景的相似辨别能力。

2、现有的人像背景相似度的数据集构建方法通常利用非人像照片背景相似图像对的开源数据作为人像相似度的数据集,由于可使用的开源数据种类和领域较多,利用开源数据作为人像相似度的数据集无法准确识别人像相似度。


技术实现思路

1、本发明提供一种人像背景相似度的模型构建方法及其模型构建方法,以解决通常利用非人像照片背景相似图像对的开源数据作为人像相似度的数据集,由于可使用的开源数据种类和领域较多,利用开源数据作为人像相似度的数据集无法准确识别人像相似度的技术问题。

2、本发明提供了一种人像背景相似度的模型构建方法,包括:

3、确定场景识别开源数据集,从人像语义数据集的标签获取人像区域信息,得到标签图像;所述场景识别开源数据集包括若干场景识别图像;

4、基于所述场景识别图像的尺寸对所述标签图像进行转换得到转换图像;

5、根据所述转换图像确定映射到场景识别图像中的人像区域,对所述人像区域进行填充,得到人像背景数据集。

6、进一步的,所述基于所述场景识别图像的尺寸对所述标签图像进行转换得到转换图像,包括:

7、将所述标签图像的尺寸,转换成与所述场景识别图像适合的尺寸,得到转换图像。

8、进一步的,所述场景识别开源数据集包括maillary、pittsburgh30k和tokyo247数据集的其中一种。

9、进一步的,本方法还包括:

10、采用automatic portrait matting作为所述人像语义数据集。

11、本发明还提供了一种人像背景相似度的模型构建方法,采用上述的人像背景相似度的数据集构建方法得到的人像背景数据集;

12、将所述人像背景数据集输入到深度学习模型中进行度量学习和二分类学习,在所述深度学习模型收敛时,得到人像相似度识别模型。

13、进一步的,所述将所述人像背景数据集输入到深度学习模型中进行度量学习和二分类学习,还包括:

14、在训练过程中,对于每一正实例图像,采样一对与所述正实例图像相似和不相似的样本图像对,所述正实例图像和所述样本图像对均为实例图像;

15、将所有的所述实例图像中的人像部分涂黑,得到处理后的实例图像;

16、将所述处理后的实例图像和所述样本图像对输入至所述深度学习模型中进行编码,得到对应的三个特征向量;

17、根据三个所述特征向量和三元组损失函数计算得到损失值;

18、根据所述损失值进行梯度回传和权重更新。

19、进一步的,所述三元组损失函数为:

20、l(a,p,n)=max[(d(a,p)-d(a,n)+α,0]

21、其中,a为正实例,p为正样本、n为负样本,d为距离函数,α为超参数。

22、本发明还提供了一种人像相似度识别方法,包括:

23、获取待识别人像图像;

24、将所述待识别人像图像输入至如上述的人像背景相似度的模型构建方法构建得到的人像相似度识别模型,得到待识别人像图像的相似度识别结果。

25、本发明还提供了一种人像背景相似度的数据集构建装置,包括:

26、标签图像确定模块,用于确定场景识别开源数据集,从人像语义数据集的标签获取人像区域信息,得到标签图像;所述场景识别开源数据集包括若干场景识别图像;

27、转换图像获取模块,用于基于所述场景识别图像的尺寸对所述标签图像进行转换得到转换图像;

28、人像区域填充模块,用于根据所述转换图像确定映射到场景识别图像中的人像区域,对所述人像区域进行填充,得到人像背景数据集。

29、本发明还提供了一种电子设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序;所述存储器与所述处理器耦接,且所述处理器执行所述计算机程序时实现如上述的人像背景相似度的数据集构建方法。

30、本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序;其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上述的人像背景相似度的模型构建方法。

31、本发明实施例通过场景识别开源数据集与人像语义分割数据集进行融合,生成模拟特定场景,如金融场景的人像背景数据集,从而能够使得人像相似度识别模型的训练数据更加准确和可靠;本发明实施例基于所述场景识别图像的尺寸对所述标签图像进行转换得到转换图像,使得标签图像与场景识别图像具有相同的尺寸和比例,从而能够准确确定映射到场景图像中的人像区域,且通过对人像区域进行填充,能够得到准确的人像背景数据集,能够扩充人像相似度识别的训练数据,增加样本的多样性和数量,从而能够基于该人像背景数据集准确构建人像相似度识别模型,有利于提高人像相似度识别的准确性。

32、进一步的,本发明实施例无需依赖人工标注和人工审核,不仅能够有效减少人工工作量,还能够有效避免人工对背景相似度评判标准不一致产生的人为误差,能够进一步提高人像相似度识别的准确性



技术特征:

1.一种人像背景相似度的数据集构建方法,其特征在于,包括:

2.如权利要求1所述的人像背景相似度的数据集构建方法,其特征在于,所述基于所述场景识别图像的尺寸对所述标签图像进行转换得到转换图像,包括:

3.如权利要求1所述的人像背景相似度的数据集构建方法,其特征在于,所述场景识别开源数据集包括maillary、pittsburgh30k和tokyo247数据集的其中一种。

4.如权利要求1所述的人像背景相似度的数据集构建方法,其特征在于,还包括:

5.一种人像背景相似度的模型构建方法,其特征在于,包括:

6.如权利要求5所述的人像背景相似度的模型构建方法,其特征在于,所述将所述人像背景数据集输入到深度学习模型中进行度量学习和二分类学习,还包括:

7.如权利要求6所述的人像背景相似度的模型构建方法,其特征在于,所述三元组损失函数为:

8.一种人像相似度识别方法,其特征在于,包括:

9.一种人像背景相似度的数据集构建装置,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序;其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行根据权利要1-4任意一项所述的人像背景相似度的数据集构建方法。


技术总结
本发明公开了一种人像背景相似度的数据集构建方法及其模型构建方法,其数据集构建方法包括:确定场景识别开源数据集,从人像语义数据集的标签获取人像区域信息,得到标签图像;场景识别开源数据集包括若干场景识别图像;基于场景识别图像的尺寸对标签图像进行转换得到转换图像;根据转换图像映射到场景识别图像中的人像区域,对场景识别图像中的人像区域进行填充,得到人像背景数据集。本发明通过场景识别开源数据集与人像语义分割数据集进行融合,生成模拟特定场景,如金融场景的人像背景数据集,有利于提高人像相似度识别的准确性。

技术研发人员:罗建明
受保护的技术使用者:广发银行股份有限公司
技术研发日:
技术公布日:2024/5/27
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1