一种基于对抗对比学习的黄暴内容识别方法与系统与流程

文档序号：34393018发布日期：2023-06-08 10:55阅读：来源：国知局

技术特征：

1.一种基于对抗对比学习的黄暴内容识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述利用预训练数据集对预设的训练模型进行预训练，构建初始的识别模型，包括：

3.根据权利要求2所述的方法，其特征在于，所述按照n-gram掩码策略对每个句子的子词序列进行掩码处理，包括：

4.根据权利要求2或3所述的方法，其特征在于，所述对预训练数据集中的样本进行增强处理，获得增强后的新样本，包括：

5.根据权利要求4所述的方法，其特征在于，所述采用引入扰动的对抗对比损失函数，基于训练数据集对初始的识别模型进行训练，得到最终的黄暴内容识别模型，包括：

6.根据权利要求5所述的方法，其特征在于，所述对训练数据集进行重构，包括：

7.根据权利要求6所述的方法，其特征在于，所述建立引入扰动的对抗对比损失函数，包括：

8.根据权利要求7所述的方法，其特征在于，所述基于对抗对比损失函数，利用重构后训练数据集中的样本训练初始的识别模型，获得最终的黄暴内容识别模型，包括：

9.一种基于对抗对比学习的黄暴内容识别系统，其特征在于，包括：

技术总结
本发明实施例公开一种基于对抗对比学习的黄暴内容识别方法与系统，首先，建立预训练数据集，利用预训练数据集对预设的训练模型进行预训练，构建初始的识别模型；然后，对预训练数据集中的样本进行增强处理，获得增强后的新样本。利用增强后的新样本和预训练数据集中的样本建立训练数据集；最后，采用引入扰动的对抗对比损失函数，基于训练数据集对初始的识别模型进行训练，得到最终的黄暴内容识别模型。将待判断的句子输入黄暴内容识别模型，确定待判断句子是否包含黄暴内容。本发明实施例通过引入对比学习，克服黄暴内容样本较少，难以有效识别信息中黄暴内容的情况。同时，采用引入扰动的对抗训练，强化黄暴内容识别模型的鲁棒性和泛化能力。

技术研发人员：邹游
受保护的技术使用者：重庆特斯联启智科技有限公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

当前第2页1 2