本说明书涉及数据处理,尤其涉及一种伪造检测模型训练的方法、装置及设备。
背景技术:
1、近年来,生成式对抗网络(generative adversarial networks,gans)在计算机视觉领域发展迅速。以该技术为依托的深度伪造(deepfake)在全世界范围内掀起了一股伪造热潮。与此同时,伪造技术的恶意应用在社会安全、个人隐私数据(包括敏感信息和私密信息)保护等领域造成了巨大的风险。针对深度伪造数据的检测,对于促进网络空间的健康发展以及社会的稳定具有极其重要的意义。
2、目前,使用卷积神经网络(convolutional neural networks,cnn)这一深度学习模型对文本图像、人脸图像或视频进行深度伪造检测的方法引起了广泛研究。但是,这些基于卷积神经网络的深度伪造检测模型,在训练过程中并没有专门针对篡改伪造的数据增强方法。因此,目前亟需提供一种更优的伪造检测模型训练方案。
技术实现思路
1、本说明书实施例提供一种伪造检测模型训练的方法、装置及设备,以提供一种符合模型训练相关人员预期的伪造检测模型训练方案。
2、第一方面,本说明书一个或多个实施例提供一种伪造检测模型训练的方法,包括:获取用于检测伪造数据的目标伪造检测模型和对所述目标伪造检测模型进行训练的原始训练数据集;在对所述目标伪造检测模型进行模型训练的过程中,基于所述原始训练数据集中包含的原始训练数据对应的数据类型,确定与所述原始训练数据对应的至少一个数据伪造策略,所述数据伪造策略中至少包括对所述原始训练数据中的局部数据进行数据伪造处理的策略;基于所述数据伪造策略,对所述原始训练数据集中与所述数据伪造策略对应的所述原始训练数据进行数据伪造处理,得到伪造训练数据;根据所述伪造训练数据对所述目标伪造检测模型进行训练。
3、第二方面,本说明书实施例提供了一种伪造检测模型训练的装置,包括:获取用于检测伪造数据的目标伪造检测模型和对所述目标伪造检测模型进行训练的原始训练数据集;在对所述目标伪造检测模型进行模型训练的过程中,基于所述原始训练数据集中包含的原始训练数据对应的数据类型,确定与所述原始训练数据对应的至少一个数据伪造策略,所述数据伪造策略中至少包括对所述原始训练数据中的局部数据进行数据伪造处理的策略;基于所述数据伪造策略,对所述原始训练数据集中与所述数据伪造策略对应的所述原始训练数据进行数据伪造处理,得到伪造训练数据;根据所述伪造训练数据对所述目标伪造检测模型进行训练。
4、第三方面,本说明书实施例提供了一种电子设备,该电子设备包括:处理器,以及被安排成存储计算机可执行指令的存储器,在所述可执行指令被执行时,能够使得所述处理器:获取用于检测伪造数据的目标伪造检测模型和对所述目标伪造检测模型进行训练的原始训练数据集;在对所述目标伪造检测模型进行模型训练的过程中,基于所述原始训练数据集中包含的原始训练数据对应的数据类型,确定与所述原始训练数据对应的至少一个数据伪造策略,所述数据伪造策略中至少包括对所述原始训练数据中的局部数据进行数据伪造处理的策略;基于所述数据伪造策略,对所述原始训练数据集中与所述数据伪造策略对应的所述原始训练数据进行数据伪造处理,得到伪造训练数据;根据所述伪造训练数据对所述目标伪造检测模型进行训练。
5、第四方面,本说明书实施例提供一种存储介质,用于存储计算机程序,所述计算机程序能够被处理器执行以实现以下流程:获取用于检测伪造数据的目标伪造检测模型和对所述目标伪造检测模型进行训练的原始训练数据集;在对所述目标伪造检测模型进行模型训练的过程中,基于所述原始训练数据集中包含的原始训练数据对应的数据类型,确定与所述原始训练数据对应的至少一个数据伪造策略,所述数据伪造策略中至少包括对所述原始训练数据中的局部数据进行数据伪造处理的策略;基于所述数据伪造策略,对所述原始训练数据集中与所述数据伪造策略对应的所述原始训练数据进行数据伪造处理,得到伪造训练数据;根据所述伪造训练数据对所述目标伪造检测模型进行训练。
1.一种伪造检测模型训练的方法,包括:
2.根据权利要求1所述的方法,所述基于所述原始训练数据集中包含的原始训练数据对应的数据类型,确定与所述原始训练数据对应的至少一个数据伪造策略,包括:
3.根据权利要求2所述的方法,所述基于所述目标训练数据对应的数据类型,确定与所述目标训练数据对应的至少一个数据伪造策略,包括:
4.根据权利要求3所述的方法,所述从每个所述目标训练数据对应的多组所述局部数据中,随机确定至少一组目标局部数据,包括:
5.根据权利要求3所述的方法,所述原始训练数据为人脸图像数据,所述局部数据的确定过程,包括:
6.根据权利要求5所述的方法,所述从每个所述目标训练数据对应的多组所述局部数据中,随机确定至少一组目标局部数据,包括:
7.根据权利要求5所述的方法,所述从每个所述目标训练数据对应的多组所述局部数据中,随机确定至少一组目标局部数据,包括:
8.根据权利要求5所述的方法,在确定所述关键数据之前,所述局部数据的确定过程,还包括:
9.一种伪造检测模型训练的装置,包括:
10.一种电子设备,包括: