1.本发明属于自然语言处理技术领域,具体涉及一种基于自然语言处理的新增条款位置确认方法及系统。
背景技术:2.合同是民事主体之间设立、变更、终止民事法律关系的协议。在当代的社会下,人们的日常生活或工作时会产生很多合同,如员工劳务合同,运输合同、采购销售合同、工程合同、贸易合同等。为了保证签订的合同的合法性,需对合同进行审核。
3.在线审核合同时,想要对合同增加条款,只能是把光标点击到想要增加条款的地方,然后点击新增,用户还需要通过人工手动将新增的条款增加到相应的位置,并根据原有的条款对新增的条款进行人工标号,再调节上下文中的条款序号,使得用户在新增条款时较为繁琐。
技术实现要素:4.针对背景技术中存在的技术缺陷,本发明提出一种基于自然语言处理的新增条款位置确认方法及系统,解决了上述技术问题以及满足了实际需求,具体的技术方案如下所示:根据本发明第一方面实施例的基于自然语言处理的新增条款位置确认方法,包括以下步骤:获取第一合同内容;根据所述第一合同内容,识别合同类型,并根据所述合同类型显示风险点和提示新增条款,其中,所述风险点为所述合同类型的常见风险点,所述新增条款与所述风险点所涉及的风险类型对应;根据所述新增条款、所述第一合同的正文内容和所述合同类型,得到所述新增条款所属的合同章节主题;根据所述新增条款所属的所述合同章节主题,使用所述第一合同的正文内容获取所述新增条款所属的合同章节的正文内容;将所述新增条款所属的所述合同章节的正文内容、所述新增条款、所述新增条款所属的所述合同章节主题以及所述合同类型输入条款顺序模型,得到更新后的条款顺序,所述更新后的条款顺序为添加所述新增条款后的条款顺序;根据章节条款格式,增加所述新增条款的条款编号,根据所述更新后的条款顺序将带有所述条款编号的所述新增条款增加到对应的合同章节的对应位置,并相应调整上下文的条款编号;输出增加所述新增条款后的第二合同内容。
5.本发明第一方面实施例的具有的有益效果在于:根据第一合同的内容识别出合同的类型,使用识别出来的合同类型来获取并显示当前合同类型的合同常见的风险点和提示
需要新增的新增条款,可以减少人工分析所需新增的新增条款所花费的时间,并且使得新增条款更加全面准确。通过识别新增条款所属的合同章节,自动增加到相应的合同章节的对应位置,并增加新增条款的条款编号和相应调整上下文的条款编号,实现了自动添加和编号调序。用户在审核合同增加条款时,只需要点击新增,可以自动分析条款所属的章节和在章节中的顺序,从而自动把新增的条款增加到相应的章节,新增的条款自动根据原有的条款自动标号,方便快捷,提高了工作效率。
6.根据本发明的一些实施例,所述根据所述新增条款、所述第一合同的正文内容和所述合同类型,得到所述新增条款所属的合同章节主题的步骤,包括:将所述第一合同的正文内容输入章节主题模型,得到所述第一合同的正文内容的章节主题和章节正文;将所述新增条款输入条款主题模型,得到所述新增条款的条款类型;根据所述合同类型、所述章节主题、所述新增条款的所述条款类型,得到所述新增条款所属的合同章节主题。
7.根据本发明的一些实施例,所述将所述新增条款所属的所述合同章节的正文内容、所述新增条款、所述新增条款所属的所述合同章节主题以及所述合同类型输入条款顺序模型,得到更新后的条款顺序的步骤,包括:将所述新增条款所属的合同章节的正文内容和所述新增条款进行合并,得到更新后的章节内容;使用条款主题模型对所述更新后的章节内容中的合同条款进行分类,得到所述更新后的章节内容中的所述合同条款的条款类型;根据所述更新后的章节内容中的所述合同条款的所述条款类型、所述新增条款所属的所述合同章节以及所述合同类型,得到更新后的条款顺序。
8.根据本发明的一些实施例,所述条款主题模型由以下步骤确定:获取合同训练数据集,所述合同训练数据集包括合同类型训练数据和对应的合同正文训练数据;对于所述合同类型训练数据中的每一合同类型,使用所述章节主题模型对所述合同类型对应的每一所述合同正文训练数据划分章节,得到每一所述合同类型中的章节主题训练数据和章节正文训练数据;对于所述合同类型训练数据中的每一合同类型,使用条款标签模型对所述合同类型对应的每一所述章节正文训练数据的条款进行分类,得到每一所述合同类型的条款类别训练数据;对于所述合同类型训练数据中的每一合同类型,使用所述章节主题训练数据和所述条款类别训练数据,分别计算所述条款类别训练数据中的每一条款类别属于所述章节主题训练数据中的每一章节主题的频率,将频率最高的所述章节主题作为所述条款类别的主题。
9.根据本发明的一些实施例,所述条款标签模型由以下步骤确定:获取合同条款训练数据集,所述合同条款训练数据集包括合同条款正文训练数据和合同条款标签训练数据;以所述合同条款正文训练数据为输入,以所述合同条款标签训练数据为输出,训
练albert-textcnn模型,得到所述条款标签模型。
10.根据本发明的一些实施例,所述章节主题模型包括章节分段模型和正文主题模型。
11.根据本发明的一些实施例,所述章节分段模型和所述正文主题模型由以下步骤确定:获取所述合同训练数据集;根据所述合同类型训练数据和所述合同正文训练数据,得到章节主题训练数据和章节正文训练数据,对所述章节主题训练数据进行合并;使用bems标注方法对所述章节正文训练数据的文本进行标注,其中,章节开始标注为b,结尾标注为e,中间部分标注为m,其他部分标注为s,得到标注训练数据;根据使用bems标注方法获得的所述标注训练数据得到符合阅读理解模型的训练数据,训练经过矢量量化的长短期记忆网络、机器阅读理解模型以及由注意力解耦的、增强解码的、基于变换器的双向编码器表征模型组成的命名实体识别模型,得到所述章节分段模型;以所述章节正文训练数据为输入,以所述章节主题训练数据为输出,训练bert-bilstm-attention-rcnn模型,得到所述正文主题模型。
12.根据本发明的一些实施例,所述条款顺序模型由以下步骤确定:获取所述合同训练数据集对于所述合同类型训练数据中的每一合同类型,使用所述章节主题模型对所述合同正文训练数据中的每一份合同正文划分章节,得到章节主题训练数据和章节正文训练数据;对于所述合同类型训练数据中的每一合同类型,对于每一章节,使用所述条款标签模型对所述章节正文训练数据中的章节正文的条款进行分类,得到每一条款的条款类别;对于所述合同类型训练数据中的每一合同类型,对于每一章节,根据条款在章节中出现的顺序,得到该章节中每一所述条款类别出现的顺序;对于所述合同类型训练数据中的每一合同类型,对于所述章节主题训练数据中章节主题相同的章节,使用所述章节正文训练数据获取章节主题相同的章节正文,并将每一所述条款类别出现的次序数值相加,并根据所述章节主题训练数据每一章节主题对应的条款类别进行筛选,得到每一所述合同类型下每一所述章节主题中所述条款类别的排序。
13.根据本发明第二方面实施例的基于自然语言处理的新增条款位置确认系统,包括:数据输入单元,用户通过所述数据输入单元输入第一合同内容,并通过所述数据输入单元选择添加新增条款;数据处理单元,用于实现如第一方面实施例所述的基于自然语言处理的新增条款位置确认方法,计算得到所述新增条款并确认所述新增条款位置;数据输出单元,用于将所述新增条款展示,并输出所述第一合同内容添加所述新增条款后自动确认位置并重新自动标号的第二合同内容。
14.本发明第二方面实施例的具有的有益效果在于:用户在审核合同增加条款时,将
合同内容通过数据输入单元输入系统,只需要点击新增,使用系统的数据处理单元可以自动分析新增条款所属的章节和在章节中的顺序,并且实现自动把新增的条款增加到相应的章节,新增的条款自动根据原有的条款自动标号,使得用户在新增条款时的操作不再繁琐,提高了工作效率。
15.根据本发明第三方面实施例的计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如本发明第一方面实施例所述的基于自然语言处理的新增条款位置确认方法。
附图说明
16.图1是本发明一个实施例提供的基于自然语言处理的新增条款位置确认方法的流程图;图2是本发明一个实施例提供的条款主题模型的确定的流程图;图3是本发明一个实施例提供的条款标签模型的确定的流程图;图4是本发明一个实施例提供的章节分段模型和正文主题模型的确定的流程图;图5是本发明一个实施例提供的条款顺序模型的确定的流程图。
具体实施方式
17.下面结合附图与相关实施例对本发明的实施方式进行说明,本发明的实施方式不局限于如下的实施例中,并且本发明涉及本技术领域的相关必要部件,应当视为本技术领域内的公知技术,是本技术领域所属的技术人员所能知道并掌握的。
18.下面参考图1至图5描述根据本发明第一方面实施例的基于自然语言处理的新增条款位置确认方法。
19.如图1所示,图1是本发明一个实施例提供的一种基于自然语言处理的新增条款位置确认方法的流程图。根据本发明实施例的基于自然语言处理的新增条款位置确认方法,包括但不限于有步骤s100、步骤s200、步骤s300、步骤s400、步骤s500、步骤s600和步骤s700。
20.步骤s100,获取第一合同内容;步骤s200,根据第一合同内容,识别合同类型,并根据合同类型显示风险点和提示新增条款,其中,风险点为合同类型的常见风险点,新增条款与风险点所涉及的风险类型对应;步骤s300,根据新增条款、第一合同的正文内容和合同类型,得到新增条款所属的合同章节主题;步骤s400,根据新增条款所属的合同章节主题,使用第一合同的正文内容获取新增条款所属的合同章节的正文内容;步骤s500,将新增条款所属的合同章节的正文内容、新增条款、新增条款所属的合同章节主题以及合同类型输入条款顺序模型,得到更新后的条款顺序,更新后的条款顺序为添加新增条款后的条款顺序;步骤s600,根据章节条款格式,增加新增条款的条款编号,根据更新后的条款顺序将带有条款编号的新增条款增加到对应的合同章节的对应位置,并相应调整上下文的条款
编号;步骤s700,输出增加新增条款后的第二合同内容。
21.获取第一合同的内容,并根据第一合同的内容识别出合同的类型,使用识别出来的合同类型来获取并显示当前合同类型的合同常见的风险点和提示需要新增的新增条款。根据新增条款、第一合同的正文内容和合同类型,分析得到新增条款所属的合同章节主题,从而根据新增条款所属的合同章节主题,来获取新增条款所属的合同章节的正文内容。将新增条款所属的合同章节的正文内容、新增条款、新增条款所属的合同章节以及合同类型输入条款顺序模型,条款顺序模型通过计算输出更新后的条款顺序,再根据章节条款格式,增加新增条款的条款编号,将带有条款编号的新增条款增加到对应的合同章节的对应位置,并相应调整上下文的条款编号,将条款重新编号,输出新增合同条款后的第二合同内容,完成新增条款的插入。
22.根据第一合同的内容识别出合同的类型,使用识别出来的合同类型来获取并显示当前合同类型的合同常见的风险点和提示需要新增的新增条款,可以减少人工分析所需新增的新增条款所花费的时间,并且使得新增条款更加全面准确。通过识别新增条款所属的合同章节,自动增加到相应的合同章节的对应位置,并增加新增条款的条款编号和相应调整上下文的条款编号,实现了自动添加和编号调序。用户在审核合同增加条款时,只需要点击新增,可以自动分析条款所属的章节和在章节中的顺序,从而自动把新增的条款增加到相应的章节,新增的条款自动根据原有的条款自动标号,方便快捷,提高了工作效率。
23.在一些实施例中,用户对笔记本电脑买卖合同进行审核,系统识别出合同类型为买卖合同,并在特定区域显示风险点为定金金额,显示提示需要新增的新增条款为:双方达成买卖合同___日内,乙方应向甲方支付定金___元。在一些实施例中,特定区域为合同文本框的右侧。
24.在一些实施例中,用户点击提示新增条款,系统根据提示新增条款“双方达成买卖合同___日内,乙方应向甲方支付定金___元”、当前合同的正文内容、当前合同的合同类型为买卖合同,得到提示新增条款所属的合同章节主题为:定金条款。
25.在一些实施例中,系统将提示新增条款所属的合同章节的正文内容、提示新增条款“双方达成买卖合同___日内,乙方应向甲方支付定金___元”、提示新增条款所属的合同章节主题为定金条款以及合同类型为买卖合同皆输入条款顺序模型,得到更新后的条款顺序为:定金金额排在第一位。
26.在一些实施例中,上下文为:1. 买卖标的;1.1 产品名称
……
2. 定金条款;2.1 如乙方未按约定期限付全款,则甲方有权扣留全部押金。根据章节条款格式,为提示增加的“双方达成买卖合同___日内,乙方应向甲方支付定金___元”增加条款编号,得到“2.1 双方达成买卖合同___日内,乙方应向甲方支付定金___元”。相应调整上下文的条款编号后,得到:2. 定金条款;2.1 双方达成买卖合同___日内,乙方应向甲方支付定金___元;2.2 如乙方未按约定期限付全款,则甲方有权扣留全部押金。
27.在一些实施例中,合同的类型包括但不限于买卖合同,供用电、水、气、热力合同,赠与合同,借款合同,租赁合同,融资租赁合同,承揽合同,建筑工程合同,运输合同,技术合同,保管合同,仓储合同,委托合同,行纪合同,居间合同,无名合同。
28.在本发明的一些实施例中,根据新增条款、第一合同的正文内容和合同类型,得到
新增条款所属的合同章节主题,包括但不限于有以下步骤:将第一合同的正文内容输入章节主题模型,得到第一合同的正文内容的章节主题和章节正文;将新增条款输入条款主题模型,得到新增条款的条款类型;根据合同类型、章节主题、新增条款的条款类型,得到新增条款所属的合同章节主题。
29.把第一合同的正文内容输入章节主题模型,然后得到第一合同的正文内容包括的章节主题和章节正文,再将新增条款输入条款主题模型,得到新增条款的条款类型,使用合同类型、章节主题、新增条款的条款类型,分析得到新增条款所属的合同章节主题。实现了新增条款所属的合同章节主题的分析和判断,为判断新增条款的所需添加的位置提供了判断基础。
30.在一些实施例中,将当前合同的正文输入章节主题模型,得到当前的正文内容包括的章节主题和章节正文,其中章节主题包括:价款与支付、定金条款、权利与义务以及违约责任。将提示新增条款“双方达成买卖合同___日内,乙方应向甲方支付定金___元”输入条款主题模型,得到提示新增条款的条款类型为定金金额。根据当前合同类型为买卖合同、当前的正文内容包括的章节主题、提示新增条款的条款类型为定金金额,得到提新增条款所属的合同章节。
31.在本发明的一些实施例中,将新增条款所属的合同章节的正文内容、新增条款、新增条款所属的合同章节主题以及合同类型输入条款顺序模型,得到更新后的条款顺序,更新后的条款顺序为添加新增条款后的条款顺序,包括但不限于有以下步骤:将新增条款所属的合同章节的正文内容和新增条款进行合并,得到更新后的章节内容;使用条款主题模型对更新后的章节内容中的合同条款进行分类,得到更新后的章节内容中的合同条款的条款类型;根据更新后的章节内容中的合同条款的条款类型、新增条款所属的合同章节以及合同类型,得到更新后的条款顺序。
32.将新增条款所属的合同章节的正文内容和新增条款进行合并,得到更新后的章节内容,再使用条款主题模型对更新后的章节内容中的合同条款进行分类,根据分类结果得到更新后的章节内容中的合同条款的条款类型,最后根据更新后的章节内容中的合同条款的条款类型、新增条款所属的合同章节以及合同类型,分析得到更新后的条款顺序。实现了对条款顺序的分析,得到更新后的条款顺序。
33.在一些实施例中,提示新增条款为:双方达成买卖合同___日内,乙方应向甲方支付定金___元。将提示新增条款所属的合同章节的正文内容和提示增加的条款进行合并,得到更新后的章节内容。再使用条款主题模型对更新后的章节内容中的合同条款进行分类,得到更新后的章节内容中的合同条款的条款类型为定金金额和定金扣留。根据更新后的章节内容中的合同条款的条款类型“定金金额和定金扣留”、提示增加的内容所属的合同章节为定金条款、以及合同类型为买卖合同,得到更新后的条款顺序为:先定金金额,后定金扣留。
34.参考图2,在本发明的一些实施例中,条款主题模型的确定包括但不限于以下步
骤:步骤s311,获取合同训练数据集,合同训练数据集包括合同类型训练数据和对应的合同正文训练数据;步骤s312,对于合同类型训练数据中的每一合同类型,使用章节主题模型对合同类型对应的每一份合同正文训练数据划分章节,得到每一合同类型中的章节主题训练数据和章节正文训练数据;步骤s313,对于合同类型训练数据中的每一合同类型,使用条款标签模型对合同类型对应的每一章节正文训练数据的条款进行分类,得到每一合同类型的条款类别训练数据;步骤s314,对于合同类型训练数据中的每一合同类型,使用章节主题训练数据和条款类别训练数据,分别计算条款类别训练数据中的每一条款类别属于章节主题训练数据中的每一章节主题的频率,将频率最高的章节主题作为条款类别的主题。
35.获取合同训练数据集,合同训练数据集包括合同类型训练数据和对应的合同正文训练数据,再对于合同类型训练数据中的每一合同类型,使用章节主题模型对合同类型对应的每一份合同正文训练数据划分章节,得到章节主题训练数据和章节正文训练数据;对于合同类型训练数据中的每一合同类型,使用条款标签模型对合同类型对应的每一章节正文训练数据的条款进行分类,得到每一合同类型的条款类别训练数据,最后对于合同类型训练数据中的每一合同类型,计算每一条款类别属于每一章节主题的频率,将频率最高的章节主题作为该条款类别的章节主题。通过对章节正文的条款分类,获取到条款类别,再通过计算章节主题和条款类别的关系,将概率最高的章节主题作为该条款类别的章节主题,实现了对该条款类别的章节主题的确定,通过训练条款主题模型可以得到每一合同类型下的每一条款类别对应的章节主题以及每一合同类型下的每一章节主题包括的条款类别。
36.在一些实施例中,定金金额共出现10次,8次在定金条款,2次在价款与支付,则定金金额条款属于定金条款。
37.参考图3,在本发明的一些实施例中,条款标签模型的确定包括但不限于以下步骤:步骤s321,获取合同条款训练数据集,合同条款训练数据集包括合同条款正文训练数据和合同条款标签训练数据;步骤s322,以合同条款正文训练数据为输入,以合同条款标签训练数据为输出,训练albert-textcnn模型,得到条款标签模型。
38.获取合同条款训练数据集,其中,合同条款训练数据集包括合同条款正文训练数据与合同条款标签训练数据,再将合同条款标签训练数据作为输出,将合同条款正文训练数据作为输入,训练albert-textcnn模型,得到条款标签模型,条款标签模型用于根据合同条款正文得到合同的条款类别。albert层训练速度快、语言表征效果佳,捕捉上下文中指定位置的特定信息,textcnn层捕捉文本局部特征,通过训练得到的条款标签模型,实现了根据合同条款正文得到合同的条款类别。
39.在本发明的一些实施例中,章节主题模型包括章节分段模型和正文主题模型。
40.先通过章节分段模型将一定数量的文本划分为一个章节,再使用正文主题模型分类到一个章节主题,实现了对章节主题的确定。
41.参考图4,在本发明的一些实施例中,章节分段模型和正文主题模型的确定包括但不限于有步骤s331、步骤s332、步骤s333、步骤s334和步骤s335。
42.步骤s331,获取合同训练数据集;步骤s332,根据合同类型训练数据和合同正文训练数据,得到章节主题训练数据和章节正文训练数据,对章节主题训练数据进行合并;步骤s333,使用bems标注方法对于章节正文训练数据的文本进行标注,其中,章节开始标注为b,结尾标注为e,中间部分标记为m,其他部分标注为s,得到标注训练数据;步骤s334,以章节正文训练数据为输入,使用bems标注方法得到的标注训练数据为输出,训练经过矢量量化的长短期记忆网络、机器阅读理解模型以及由注意力解耦的、增强解码的、基于变换器的双向编码器表征模型组成的命名实体识别模型,得到所述章节分段模型;步骤s335,以章节正文训练数据为输入,以章节主题训练数据为输出,训练bert-bilstm-attention-rcnn模型,得到正文主题模型。
43.获取合同训练数据集,根据合同训练数据集中的合同类型训练数据和合同训练数据集中的合同正文训练数据,得到章节主题训练数据和章节正文训练数据,对章节主题训练数据进行合并。对于章节正文训练数据的文本,使用bems标注方法进行标注,章节开始标注为b,结尾标注为e,中间部分标注为m,其他部分标注为s,得到标注训练数据,再以章节正文训练数据为输入、以使用bems标注方法得到的标注训练数据为输出,训练经过矢量量化的长短期记忆网络、机器阅读理解模型以及由注意力解耦的、增强解码的、基于变换器的双向编码器表征模型组成的命名实体识别模型,得到所述章节分段模型,得到章节分段模型。以章节正文训练数据为输入,以章节主题训练数据为输出,训练bert-bilstm-attention-rcnn模型,得到正文主题模型。
44.使用合同训练数据集训练得到了章节分段模型和正文主题模型,章节分段模型用于根据文本的内容将一定数量的文本划分为一个章节,使用经过矢量量化的长短期记忆网络、机器阅读理解模型以及由注意力解耦的、增强解码的、基于变换器的双向编码器表征模型组成的命名实体识别模型,得到所述章节分段模型可以将多句文本划分成不同的章节,以便在新增条款后对合同文本重新进行排序,正文主题模型用于将一定数量的文本分类到一个章节主题。先利用章节分段模型将一定数量的文本划分为一个章节,再利用正文主题模型分类到一个章节主题,实现了对章节主题的确定。
45.在一些实施例中,经过矢量量化的长短期记忆网络、机器阅读理解模型以及由注意力解耦的、增强解码的、基于变换器的双向编码器表征模型组成的命名实体识别模型包括注意力解耦的增强解码的基于变换器的双向编码器表征模型、经过矢量量化的长短期记忆网络和机器阅读理解模型。注意力解耦的增强解码的基于变换器的双向编码器表征模型包括:用于生成词内容嵌入向量、位置向量的第一词嵌入层,用于基于单词的内容和相对位置计算单词之间注意力权重的变换器层,用于生成词绝对位置向量的第二词嵌入层,用于根据词内容和位置的聚合上下文嵌入对掩码词进行解码的加强解码层;经过矢量量化的长短期记忆网络包括:两层不同向的长短期记忆网络,每个长短期记忆网络对应的矢量量化模块、每个矢量量化模块对应的解码模块;机器阅读理解模型包括:用于预测开始位置标签的二分类器、用于预测结束位置标签的二分类器和概率矩阵分类器。注意力解耦的增强解
码的基于变换器的双向编码器表征模型根据输入的文本生成关于上下文信息的向量,将生成的向量作为经过矢量量化的长短期记忆网络的输入,通过经过矢量量化的长短期记忆网络中两层不同向的长短期记忆网络,每个长短期记忆网络对应的矢量量化模块、每个矢量量化模块对应的解码模块的运算后,将各自的预测结果进行拼接,然后将拼接结果作为下一层机器阅读理解模型的输入,经过机器阅读理解模型对输出序列的约束,能够很好的避免矢量量化的长短期记忆网络输出的错误信息,提高了识别结果的准确性。注意力解耦的增强解码的基于变换器的双向编码器表征模型可以对文本内容、文本相对位置、文本绝对位置进行向量表示,合同文本中的履约信息通常需要结合文本相对位置和文本绝对位置才能判定,因此将文本相对位置和文本绝对位置加入向量表示可以提升模型的准确率。经过矢量量化的长短期记忆网络可以压缩长短期记忆网络生成的结果的数据量,提升后续模型计算的速度。机器阅读理解模型编码了先验知识,能够降低标注数据较少导致的训练数据稀疏的影响。
46.参考图5,在本发明的一些实施例中,条款顺序模型的确定包括但不限于以下步骤:步骤s510,获取合同训练数据集;步骤s520,对于合同类型训练数据中的每一合同类型,使用章节主题模型对合同正文训练数据中的每一份合同正文划分章节,得到章节主题训练数据和章节正文训练数据;步骤s530,对于合同类型训练数据中的每一合同类型,对于每一章节,使用条款标签模型对章节正文训练数据中的章节正文的条款进行分类,得到每一条款的条款类别;步骤s540,对于合同类型训练数据中的每一合同类型,对于每一章节,根据条款在章节中出现的顺序,得到该章节中每一条款类别出现的顺序;步骤s550,对于合同类型训练数据中的每一合同类型,对于章节主题训练数据中章节主题相同的章节,使用章节正文训练数据获取章节主题相同的章节正文,并将每一条款类别出现的次序数值相加,并根据章节主题训练数据每一章节主题对应的条款类别进行筛选,得到每一合同类型下每一章节主题中条款类别的排序。
47.获取合同训练数据集,合同训练数据集包括合同类型训练数据和合同正文训练数据;对于合同类型训练数据中的每一合同类型,使用章节主题模型对每一份合同正文划分章节,得到章节主题和章节正文,对于每一章节,使用条款主题模型对章节正文的条款进行分类,得到每一条款的条款类别;并根据条款在章节中出现的顺序,得到该章节中每一条款类别出现的顺序;对于章节主题相同的章节,将每一条款类别出现的次序数值相加,并根据每一章节主题对应的条款类别对排序进行筛选,得到每一合同类型下每一章节主题中条款类别的排序。条款的顺序存在一定的逻辑性,条款顺序模型使用合同训练数据集,获取了条款顺序的内在关系,可以实现对新增条款后的排序。
48.在一些实施例中,在一份买卖合同中,定金条款的内容中,根据条款在章节中出现的顺序,定金金额条款序数为1,定金返还条款的序数为2,此时定金金额条款在定金返还条款之前,定金金额条款和定金返还条款按照序数排列。
49.在一些实施例中,买卖合同共100份,其中,定金金额条款序数为1的有80份,序数为2的有20份,则定金金额条款的序数和为1*80+2*20=120,定金归还条款序数为1的有20
份,序数为2的有80份,则定金归还条款序数和为1*20+2*80=180。定金金额条款的序数和小于定金归还条款序数和,因此在买卖合同中,定金条款中,定金金额条款排序为1,定金归还条款排序为2。
50.下面参考图1至图5描述根据本发明第二方面实施例的基于自然语言处理的新增条款位置确认系统。
51.基于自然语言处理的新增条款位置确认系统包括数据输入单元、数据处理单元和数据输出单元。数据输入单元,用户通过数据输入单元输入第一合同内容,并通过数据输入单元选择添加新增条款;数据处理单元,用于实现第一方面实施例中任一实施例的基于自然语言处理的新增条款位置确认方法,计算得到新增条款并确认新增条款位置;数据输出单元,用于将新增条款展示,并输出第一合同内容添加新增条款后自动确认位置并重新自动标号的第二合同内容。
52.基于自然语言处理的新增条款位置确认系统包通过数据输入单元获取输入的第一合同内容,并使用数据处理单元利用第一方面实施例中的基于自然语言处理的新增条款位置确认方法识别出合同的类型,利用识别出来的合同类型来获取当前合同类型的合同常见的风险点和提示需要新增的新增条款,通过数据输出单元将合同常见的风险点和提示需要新增的新增条款显示,用户通过数据输入单元选择新增时,再通过数据处理单元利用第一方面实施例中的基于自然语言处理的新增条款位置确认方法来自动分析新增条款所属的章节和在章节中的顺序,并且实现自动把新增条款增加到相应的章节,新增的条款自动根据原有的条款自动标号,最后再通过数据输出单元第一合同内容添加新增条款后自动确认位置并重新自动标号的第二合同内容,实现对新增条款的添加。
53.用户在审核合同增加条款时,将合同内容通过数据输入单元输入系统,只需要点击新增,系统的数据处理单元可以自动分析新增条款所属的章节和在章节中的顺序,并且实现自动把新增条款增加到相应的章节,新增的条款自动根据原有的条款自动标号,使得用户在新增条款时的操作不再繁琐,提高了工作效率。
54.根据本发明第三方面实施例的计算机可读存储介质存储,计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个处理器或控制器执行,例如,被上述装置实施例中的一个处理器执行,可使得上述处理器执行上述任一实施例中的基于自然语言处理的新增条款位置确认方法,例如,执行以上图1至图5中方法。
55.以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。