水印识别模型生成方法、水印识别方法、装置及电子设备与流程

文档序号:35366204发布日期:2023-09-08 04:15阅读:25来源:国知局
本公开涉及人工智能,尤其涉及一种水印识别模型生成方法、水印识别方法、装置及电子设备。
背景技术
::1、文档中通常用一段话来说明版权信息,这段话就叫做水印。水印可以在文本,pdf(portable document format,便携式文件格式),图片等多种存储介质中展示。识别出水印信息可以更方便地进行版权保护。2、现有的水印识别方法多是针对图片,pdf等富文本进行识别,这些方法可以通过充分利用文本及版面位置等信息获取到其中的水印信息。而对于纯文本格式的水印识别难度较大,其主要表现在,数据集多,所属的文本类型不一样,且其中所含有的水印类型也不尽相同,若针对不同文本类型的数据集设计不同的处理规则,处理效率会很低。技术实现思路1、有鉴于上述存在的技术问题,本公开提出了一种水印识别模型生成方法、水印识别方法、装置及电子设备。2、根据本公开实施例的一方面,提供一种水印识别模型生成方法,包括:3、获取多个文本类型对应的样本文本信息集和所述样本文本信息集中每个样本文本信息对应的标签水印信息;所述样本文本信息集和所述标签水印信息为基于所述多个文本类型各自对应的至少一个预设文本信息生成的;所述样本文本信息集中多个样本文本信息对应的标签水印信息属于多个不同的水印类型;4、将所述样本文本信息集输入至预设机器学习模型进行水印识别,得到所述样本文本信息集对应的样本水印预测信息;所述样本水印预测信息表征所述每个样本文本信息中的每个文本单元属于水印信息的概率;5、基于所述样本水印预测信息和所述标签水印信息,确定目标损失信息;6、基于所述目标损失信息,对所述预设机器学习模型进行训练,得到目标水印识别模型。7、根据本公开实施例的另一方面,提供一种水印识别方法,包括:8、获取待识别文本信息;9、将所述待识别文本信息输入至目标水印识别模型进行水印识别,得到所述待识别文本信息对应的目标水印预测信息;所述目标水印预测信息表征所述待识别文本信息中每个文本单元属于水印信息的概率;10、基于所述目标水印预测信息,确定所述待识别文本信息中的目标水印信息;11、其中,所述目标水印识别模型为基于上述的水印识别模型生成方法得到的。12、根据本公开实施例的另一方面,提供一种水印识别模型生成装置,包括:13、第一信息获取模块,用于获取多个文本类型对应的样本文本信息集和所述样本文本信息集中每个样本文本信息对应的标签水印信息;所述样本文本信息集和所述标签水印信息为基于所述多个文本类型各自对应的至少一个预设文本信息生成的;所述样本文本信息集中多个样本文本信息对应的标签水印信息属于多个不同的水印类型;14、第一识别模块,用于将所述样本文本信息集输入至预设机器学习模型进行水印识别,得到所述样本文本信息集对应的样本水印预测信息;所述样本水印预测信息表征所述每个样本文本信息中的每个文本单元属于水印信息的概率;15、损失获取模块,用于基于所述样本水印预测信息和所述标签水印信息,确定目标损失信息;16、模型训练模块,用于基于所述目标损失信息,对所述预设机器学习模型进行训练,得到目标水印识别模型。17、根据本公开实施例的另一方面,提供一种水印识别装置,包括:18、第二信息获取模块,用于获取待识别文本信息;19、第二识别模块,用于将所述待识别文本信息输入至目标水印识别模型进行水印识别,得到所述待识别文本信息对应的目标水印预测信息;所述目标水印预测信息表征所述待识别文本信息中每个文本单元属于水印信息的概率;其中,所述目标水印识别模型为基于上述的水印识别模型生成方法得到的;20、水印确定模块,用于基于所述目标水印预测信息,确定所述待识别文本信息中的目标水印信息。21、根据本公开实施例的另一方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现上述水印识别模型生成方法或上述水印识别方法。22、根据本公开实施例的另一方面,提供一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行上述水印识别模型生成方法或上述水印识别方法。23、根据本公开实施例的另一方面,提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述水印识别模型生成方法或上述水印识别方法。24、本公开的实施例提供的技术方案至少带来以下有益效果:25、通过获取多个文本类型对应的样本文本信息集和样本文本信息集中每个样本文本信息对应的标签水印信息,其中,样本文本信息集和标签水印信息为基于多个文本类型各自对应的至少一个预设文本信息生成的;样本文本信息集中多个样本文本信息对应的标签水印信息属于多个不同的水印类型,可以实现存在多个不同文本类型的样本文本信息集的获取以及存在多个不同水印类型的标签水印信息的获取,再将样本文本信息集输入至预设机器学习模型进行水印识别,得到样本文本信息集对应的样本水印预测信息,基于样本水印预测信息和标签水印信息,确定目标损失信息,基于目标损失信息,对预设机器学习模型进行训练,得到目标水印识别模型,可以使目标水印识别模型能够对多种不同的文本类型的文本信息中不同水印类型的水印信息进行识别,进而可以实现水印识别模型针对纯文本格式的信息中水印信息的准确且高效地识别。26、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。技术特征:1.一种水印识别模型生成方法,其特征在于,所述方法包括:2.根据权利要求1所述的方法,其特征在于,所述方法还包括:3.根据权利要求2所述的方法,其特征在于,所述至少一个预设文本信息包括至少一个第一预设文本信息,所述至少一个第一预设文本信息中均不包含水印信息,所述方法还包括:4.根据权利要求2所述的方法,其特征在于,所述方法还包括:5.根据权利要求4所述的方法,其特征在于,所述至少一个预设文本信息包括至少一个第二预设文本信息,所述至少一个第二预设文本信息中均包含水印信息;所述基于所述至少一个预设文本信息和所述至少一个预设水印模板,生成所述样本文本信息集和所述标签水印信息,包括:6.根据权利要求4所述的方法,其特征在于,所述至少一个预设文本信息包括至少一个第三预设文本信息,所述至少一个第三预设文本信息中均不包含水印信息;所述基于所述至少一个预设文本信息和所述至少一个预设水印模板,生成所述样本文本信息集和所述标签水印信息,包括:7.一种水印识别方法,其特征在于,所述方法包括:8.根据权利要求7所述的方法,其特征在于,所述方法还包括:9.根据权利要求8所述的方法,其特征在于,所述修改类型包括修正类型,所述结果修改集合还包括所述修正类型下的参考水印信息对应的修正水印信息;所述基于所述第二匹配水印信息对应的修改类型,对所述第二匹配水印信息对应的水印识别结果进行修改处理,得到修改后的水印识别结果,包括:10.根据权利要求8所述的方法,其特征在于,所述修改类型包括丢弃类型;所述基于所述第二匹配水印信息对应的修改类型,对所述第二匹配水印信息对应的水印识别结果进行修改处理,得到修改后的水印识别结果,包括:11.根据权利要求8所述的方法,其特征在于,所述修改类型包括增补类型;所述方法还包括:12.根据权利要求8所述的方法,其特征在于,所述方法还包括:13.一种水印识别模型生成装置,其特征在于,所述装置包括:14.一种水印识别装置,其特征在于,所述装置包括:15.一种电子设备,其特征在于,包括:技术总结本公开关于水印识别模型生成方法、水印识别方法、装置及电子设备,涉及人工智能
技术领域
:,包括:获取多个文本类型对应的样本文本信息集和每个样本文本信息对应的标签水印信息;样本文本信息集和标签水印信息为基于多个文本类型对应的预设文本信息生成的;多个样本文本信息的标签水印信息属于多个不同的水印类型;将样本文本信息集输入至预设机器学习模型进行水印识别,得到样本水印预测信息;基于样本水印预测信息和标签水印信息,确定目标损失信息;基于目标损失信息,对预设机器学习模型进行训练,得到目标水印识别模型。利用本公开实施例可以实现目标水印识别模型对于多种不同文本类型的文本信息中不同水印类型的水印信息的识别。技术研发人员:徐程程,冯晓受保护的技术使用者:腾讯科技(深圳)有限公司技术研发日:技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1