一种伪造检测模型训练的方法、装置及设备与流程

文档序号：36146772发布日期：2023-11-23 01:12阅读：28来源：国知局

本说明书涉及数据处理，尤其涉及一种伪造检测模型训练的方法、装置及设备。

背景技术：

1、近年来，生成式对抗网络(generative adversarial networks，gans)在计算机视觉领域发展迅速。以该技术为依托的深度伪造(deepfake)在全世界范围内掀起了一股伪造热潮。与此同时，伪造技术的恶意应用在社会安全、个人隐私数据(包括敏感信息和私密信息)保护等领域造成了巨大的风险。针对深度伪造数据的检测，对于促进网络空间的健康发展以及社会的稳定具有极其重要的意义。

2、目前，使用卷积神经网络(convolutional neural networks,cnn)这一深度学习模型对文本图像、人脸图像或视频进行深度伪造检测的方法引起了广泛研究。但是，这些基于卷积神经网络的深度伪造检测模型，在训练过程中并没有专门针对篡改伪造的数据增强方法。因此，目前亟需提供一种更优的伪造检测模型训练方案。

技术实现思路

1、本说明书实施例提供一种伪造检测模型训练的方法、装置及设备，以提供一种符合模型训练相关人员预期的伪造检测模型训练方案。

2、第一方面，本说明书一个或多个实施例提供一种伪造检测模型训练的方法，包括：获取用于检测伪造数据的目标伪造检测模型和对所述目标伪造检测模型进行训练的原始训练数据集；在对所述目标伪造检测模型进行模型训练的过程中，基于所述原始训练数据集中包含的原始训练数据对应的数据类型，确定与所述原始训练数据对应的至少一个数据伪造策略，所述数据伪造策略中至少包括对所述原始训练数据中的局部数据进行数据伪造处理的策略；基于所述数据伪造策略，对所述原始训练数据集中与所述数据伪造策略对应的所述原始训练数据进行数据伪造处理，得到伪造训练数据；根据所述伪造训练数据对所述目标伪造检测模型进行训练。

3、第二方面，本说明书实施例提供了一种伪造检测模型训练的装置，包括：获取用于检测伪造数据的目标伪造检测模型和对所述目标伪造检测模型进行训练的原始训练数据集；在对所述目标伪造检测模型进行模型训练的过程中，基于所述原始训练数据集中包含的原始训练数据对应的数据类型，确定与所述原始训练数据对应的至少一个数据伪造策略，所述数据伪造策略中至少包括对所述原始训练数据中的局部数据进行数据伪造处理的策略；基于所述数据伪造策略，对所述原始训练数据集中与所述数据伪造策略对应的所述原始训练数据进行数据伪造处理，得到伪造训练数据；根据所述伪造训练数据对所述目标伪造检测模型进行训练。

4、第三方面，本说明书实施例提供了一种电子设备，该电子设备包括：处理器，以及被安排成存储计算机可执行指令的存储器，在所述可执行指令被执行时，能够使得所述处理器：获取用于检测伪造数据的目标伪造检测模型和对所述目标伪造检测模型进行训练的原始训练数据集；在对所述目标伪造检测模型进行模型训练的过程中，基于所述原始训练数据集中包含的原始训练数据对应的数据类型，确定与所述原始训练数据对应的至少一个数据伪造策略，所述数据伪造策略中至少包括对所述原始训练数据中的局部数据进行数据伪造处理的策略；基于所述数据伪造策略，对所述原始训练数据集中与所述数据伪造策略对应的所述原始训练数据进行数据伪造处理，得到伪造训练数据；根据所述伪造训练数据对所述目标伪造检测模型进行训练。

5、第四方面，本说明书实施例提供一种存储介质，用于存储计算机程序，所述计算机程序能够被处理器执行以实现以下流程：获取用于检测伪造数据的目标伪造检测模型和对所述目标伪造检测模型进行训练的原始训练数据集；在对所述目标伪造检测模型进行模型训练的过程中，基于所述原始训练数据集中包含的原始训练数据对应的数据类型，确定与所述原始训练数据对应的至少一个数据伪造策略，所述数据伪造策略中至少包括对所述原始训练数据中的局部数据进行数据伪造处理的策略；基于所述数据伪造策略，对所述原始训练数据集中与所述数据伪造策略对应的所述原始训练数据进行数据伪造处理，得到伪造训练数据；根据所述伪造训练数据对所述目标伪造检测模型进行训练。

技术特征：

1.一种伪造检测模型训练的方法，包括：

2.根据权利要求1所述的方法，所述基于所述原始训练数据集中包含的原始训练数据对应的数据类型，确定与所述原始训练数据对应的至少一个数据伪造策略，包括：

3.根据权利要求2所述的方法，所述基于所述目标训练数据对应的数据类型，确定与所述目标训练数据对应的至少一个数据伪造策略，包括：

4.根据权利要求3所述的方法，所述从每个所述目标训练数据对应的多组所述局部数据中，随机确定至少一组目标局部数据，包括：

5.根据权利要求3所述的方法，所述原始训练数据为人脸图像数据，所述局部数据的确定过程，包括：

6.根据权利要求5所述的方法，所述从每个所述目标训练数据对应的多组所述局部数据中，随机确定至少一组目标局部数据，包括：

7.根据权利要求5所述的方法，所述从每个所述目标训练数据对应的多组所述局部数据中，随机确定至少一组目标局部数据，包括：

8.根据权利要求5所述的方法，在确定所述关键数据之前，所述局部数据的确定过程，还包括：

9.一种伪造检测模型训练的装置，包括：

10.一种电子设备，包括：

技术总结
本说明书一个或多个实施例公开了一种伪造检测模型训练的方法、装置及设备。所述方法包括：获取用于检测伪造数据的目标伪造检测模型和对所述目标伪造检测模型进行训练的原始训练数据集；在对所述目标伪造检测模型进行模型训练的过程中，基于所述原始训练数据集中包含的原始训练数据对应的数据类型，确定与所述原始训练数据对应的至少一个数据伪造策略，所述数据伪造策略中至少包括对所述原始训练数据中的局部数据进行数据伪造处理的策略；基于所述数据伪造策略，对所述原始训练数据集中与所述数据伪造策略对应的所述原始训练数据进行数据伪造处理，得到伪造训练数据；根据所述伪造训练数据对所述目标伪造检测模型进行训练。

技术研发人员：罗曼
受保护的技术使用者：支付宝（杭州）信息技术有限公司
技术研发日：
技术公布日：2024/1/16

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：罗曼
技术所有人：支付宝（杭州）信息技术有限公司
我是此专利的发明人

上一篇：一种装配式建筑钢结构的制作方法
上一篇：一种行星齿轮支架车削定位装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。