一种合同校验方法、装置、计算机设备及存储介质与流程

文档序号:39861227发布日期:2024-11-01 19:45阅读:21来源:国知局
一种合同校验方法、装置、计算机设备及存储介质与流程

本公开涉及计算机,具体而言,涉及一种合同校验方法、装置、计算机设备及存储介质。


背景技术:

1、在一些合同文件的校验场景中,通常需要对合同文件中的内容进行合规性校验。但是某些情况下,不允许直接对原始合同文件进行校验,而是可以对原始合同文件进行拍照,得到合同文件照片,然后对合同文件照片中的内容进行校验。

2、然而,合同文件的内容具有复杂性和多样性,尤其是针对大量合同文件,依靠人工校验的方式难以快速、准确地完成对合同文件的校验。


技术实现思路

1、本公开实施例至少提供一种合同校验方法、装置、计算机设备及存储介质。

2、第一方面,本公开实施例提供了一种合同校验方法,包括:

3、获取待校验合同文档的合同图片集合;所述合同图片集合包含按照顺序排列的合同图片;每个所述合同图片对应一个合同页面;

4、通过对所述合同图片集合中的各个合同图片进行特征识别,确定所述待校验合同文档包含的各份待校验合同,以及所述待校验合同的合同类型,并提取每份所述待校验合同的文本内容;

5、根据每份所述待校验合同的合同类型,确定所述待校验合同对应的信息提取字段;

6、按照所述信息提取字段,从所述待校验合同的文本内容中提取所述信息提取字段下的字段信息;

7、针对每份所述待校验合同,根据在所述待校验合同的合同类型下,针对不同类型信息提取字段的合规性要求,对各所述信息提取字段下的字段信息进行信息校验,得到针对所述待校验合同的合规性校验结果。

8、一种可选的实施方式中,所述通过对所述合同图片集合中各个合同图片进行特征识别,确定所述待校验合同文档包含的各份待校验合同,以及所述待校验合同的合同类型,并提取每份所述待校验合同的文本内容,包括:

9、对所述合同图片集合中的各个合同图片分别进行特征提取处理,得到各个所述合同图片的图片特征;

10、根据所述图片特征,确定各个所述合同图片所属的合同类型;

11、按照所述合同图片在所述合同图片集合中的排列顺序,将连续属于同一合同类型的合同图片划分到同一份待校验合同中,得到属于同一份待校验合同的合同图片;

12、将划分到同一份待校验合同中的各个合同图片的合同类型作为该份待校验合同的合同类型,并提取该份待校验合同包含的各个合同图片的文本内容。

13、一种可选的实施方式中,从所述待校验合同的文本内容中提取所述信息提取字段下的字段信息之后,对各所述信息提取字段下的字段信息进行信息校验之前,所述方法还包括:

14、根据所述信息提取字段的目标类型,判断所述字段信息的信息格式是否符合所述目标类型对应的目标格式;

15、若不符合,则按照所述目标格式对所述字段信息进行处理,得到所述目标格式下的字段信息。

16、一种可选的实施方式中,按照所述信息提取字段,从所述待校验合同的文本内容中提取所述信息提取字段下的字段信息,包括:

17、将各个所述信息提取字段和所述文本内容输入至训练好的字段信息提取模型中,利用所述训练好的字段信息提取模型,从所述文本内容中,提取各个信息提取字段下的字段信息;

18、针对各个信息提取字段,按照信息提取字段下的字段信息的置信度从大到小的顺序,确定所述信息提取字段下的、所述置信度的排名位于前n位的字段信息;所述n为大于或等于1的正整数。

19、一种可选的实施方式中,所述训练好的字段信息提取模型是按照以下步骤确定的:

20、获取各份样本合同的目标文本内容;所述目标文本内容是根据预设信息提取字段对样本合同的原始文本内容进行字段标注后得到的;

21、将部分样本合同的目标文本内容作为训练样本集,输入至字段信息提取模型中,对所述字段信息提取模型进行训练,得到当前训练完成的字段信息提取模型;

22、将剩余样本合同的目标文本内容作为测试样本集,输入至所述当前训练完成的字段信息提取模型中,得到测试字段信息;

23、根据所述测试字段信息与所述测试样本集中标注的字段信息,确定所述测试结果;

24、若所述测试结果指示达到预设要求,则将当前训练完成的字段信息提取模型作为训练好的字段信息提取模型;若所述测试结果指示未达到预设要求,则继续执行将所述训练样本集输入至字段信息提取模型中,对所述字段信息提取模型进行训练,得到当前训练完成的字段信息提取模型的步骤,直至得到训练好的字段信息提取模型。

25、一种可选的实施方式中,从所述待校验合同的文本内容中提取所述信息提取字段下的字段信息,包括:

26、从所述待校验合同的文本内容中确定与所述信息提取字段匹配的字段描述信息;

27、若所述字段描述信息与所述信息提取字段直接对应,从所述字段描述信息中提取所述字段信息;

28、若所述信息提取字段与所述字段描述信息间接对应,从所述字段描述信息中提取待加工信息,对所述待加工信息进行处理得到所述字段信息。

29、一种可选的实施方式中,所述信息提取字段包括印章数量和签名数量;所述字段描述信息包括印章信息和签名信息;所述合规性要求包括对印章数量和签名数量的要求;

30、从所述字段描述信息中提取待加工信息,对所述待加工信息进行处理得到所述字段信息,包括:

31、在从所述待校验合同的合同图片中提取印章信息和签名信息后,根据各个所述印章信息,确定印章数量,以及根据各个所述签名信息,确定签名数量。

32、第二方面,本公开实施例还提供一种合同校验装置,包括:

33、获取模块,用于获取待校验合同文档的合同图片集合;所述合同图片集合包含按照顺序排列的合同图片;每个所述合同图片对应一个合同页面;

34、第一提取模块,用于通过对所述合同图片集合中的各个合同图片进行特征识别,确定所述待校验合同文档包含的各份待校验合同,以及所述待校验合同的合同类型,并提取每份所述待校验合同的文本内容;

35、确定模块,用于根据每份所述待校验合同的合同类型,确定所述待校验合同对应的信息提取字段;

36、第二提取模块,用于按照所述信息提取字段,从所述待校验合同的文本内容中提取所述信息提取字段下的字段信息;

37、校验模块,用于针对每份所述待校验合同,根据在所述待校验合同的合同类型下,针对不同类型信息提取字段的合规性要求,对各所述信息提取字段下的字段信息进行信息校验,得到针对所述待校验合同的合规性校验结果。

38、第三方面,本公开实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可选的实施方式中的步骤。

39、第四方面,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可选的实施方式中的步骤。

40、本公开实施例提供的合同校验方法,可以在获取到待校验合同文档的合同图片集合后,通过对合同图片集合中的各个合同图片进行特征识别,确定待校验合同文档包含的各份待校验合同,以及待校验合同的合同类型,并提取每份待校验合同的文本内容,然后可以针对不同的合同类型,针对性地提取待校验合同的信息提取字段,继而可以针对不同类型信息提取字段的合规性要求,对各信息提取字段下的字段信息进行信息校验,上述过程,不仅可以针对性地对不同合同类型的待校验合同进行校验,而且可以通过自动提取信息提取字段以及提取字段信息的方式,对待校验合同的文本内容进行校验,使得校验过程更加快速、准确,从而可以提高合同校验效率。

41、为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1