本发明涉及一种法律法规数据库时效性动态更新的方法和系统,属于自然语言数据处理。
背景技术:
1、根据规定,法律应当明确规定施行日期。法律被修改的,应当公布新的法律文本。法律被废止的,除由其他法律规定废止该法律的以外,会予以公布。
2、通过收集和整理公开发布的法律法规建立一个非官方的法律法规库,可用于作为后续法律法规垂直领域大数据分析的基础。但由于法律法规本身规定了有效时限或随新的法律法规发布施行而终止,所以构建的法律法规库,需要不断维护其法律法规时效性的变更。法律法规的时效,是法律法规本身及法律行为保持效力的时间性规定,是法律法规的构成要素,对时效加以明确规定是法律的必备内容。由于不断有新的法规发布,旧的法规修正或废止,如何高效的维护法规法规数据库时效性的变更就是保证法律法规数据库时效性准确性的关键。
3、对于法规的时效性,法理上规定了以下三种情形:
4、(1)该法律法规本身规定了有效时限,则以此规定为准;
5、(2)该法律法规的有效时限自新的法律法规施行日终止;
6、(3)该法律法规的有效时限自宣布作废之日终止。
7、在相关现有技术中,对于法律法规数据库的构建方法,中国专利cn108073673a公开了一种基于机器学习的法律知识图谱构建方法,包括步骤:s1、识别更新后的法律法规,并生成带有法律特征的文本语料库;s2、利用文本语料库以及法律法规库识别法律实体和/或法律关系,进行法律规则处理并生成法律知识特征库;s3、梳理建立法律规则模型,利用法律规则模型识别法律概念,并作为法律知识特征存储于法律知识特征库;s4、基于文本语料库进行语意理解和/或识别文本意图,对文本语料上下文语境分析抽取文本特征并存储于法律知识特征库;s5、利用法律知识特征库进行机器学习训练,并对机器学习训练后的法律特征存储于法律知识特征库;s6、利用自然语言理解模块抽取得到的文本特征、特征机器学习模块得到的法律知识特征和/或知识工程模块识别得到的法律概念,识别法律知识点,并通过法律概念框架建立法律知识点的关联;s7、展示通过已进行关联处理的法律知识点的法律知识图谱并保存所述法律知识图谱。这样,可以将法律法规内容结构化并存储到知识图谱中,从而为法律法规知识。
8、当前现有技术在构建法律知识图谱时,没有考虑新法律和旧法律之间的衔接适用关系,无法确保法律知识的准确性。中国专利cn202011373245公开了一种法律知识图谱构建系统及方法,包括步骤:s1、从权威法律数据库中获取发布的更新的法律法规,并根据更新的法律法规对法律法规库中原始的法律法规进行更新;s2、识别更新后的法律法规,生成带有法律特征的文本语料库;并利用文本语料库以及法律法规库识别法律实体和/或法律关系,生成法律知识特征库;s3、建立法律规则模型,利用法律规则模型识别法律概念;并基于文本语料库进行语意理解,对文本语料上下文进行语境分析,抽取文本特征;s4、将法律概念、文本特征作为法律知识特征存储于法律知识特征库,利用法律知识特征库进行机器学习训练,并将学习训练后的法律特征存储于法律知识特征库;s5、利用文本特征、法律知识特征和/或法律知识概念识别法律知识点,通过法律概念框架建立法律知识点的关联,并生成法律知识图谱。这样,可以将法律法规数据库中的旧法律进行更新,并更新法律知识图谱,从而构建有价值的法律知识图谱。
9、然而在上述现有技术中,从权威法律数据库中获取发布的更新的法律法规,并根据最新的法律法规对原始的法律法规进行更新,没有考虑新发布的法律法规可能会导致不属于同一部法律法规的其他法律法规时效性发生变更,比如民法典的发布,会导致其他的比如婚姻法、继承法的时效性发生变更;而且由于只是单向的根据最新变化的法规对原始法律法规数据库进行更新,没有考虑法律法规数据库中原始法律法规本身规定的有效时限导致其时效性发生变更的情况。
技术实现思路
1、本技术的目的在于提供一种法律法规库时效性动态更新的方法和系统,以解决目前相关技术中,在构建法律库数据库时没有整体的考虑法律法规数据库法律法规时效性变更的问题。
2、为实现上述目的,本发明采取的技术方案如下:
3、第一方面,本发明提供一种法律法规数据库时效性动态更新的方法,其包括以下步骤:
4、s1、从公开权威法律数据库中获取法律法规全量数据,构建法律法规数据库;
5、s2、标注法律法规时效性变更数据集,构建识别法律法规时效性变更的语言模型;
6、s3、根据法律法规时效性变更触发规则,构建时效性变更触发处理模块;
7、s4、根据s3中的规则对法律法规库中数据进行检索并筛查出“现行有效待处理清单”;
8、s5、使用s2中得到的模型对现行有效待处理清单中的法律数据进行识别得出“时效性变更待处理清单”;
9、s6、将“时效性变更待处理清单” 发送给人工审核处理,人工审核完提交系统执行变更。
10、进一步的,所述步骤s1具体包括:
11、s1.1、从公开权威的法律法规数据库获取全量法律法规文本数据;
12、s1.2、对全量法律法规文本数据进行属性信息解析,其中属性信息包括:法规名称、发布日期、实施日期、效力级别;
13、s1.3、对全量法律法规文本数据进行分条解析,得到法律法规编、章、节、条、款、项。
14、进一步的,所述步骤s2具体包括:
15、s2.1、从法律法规库中抽取样本数据导入标注工具,对法规中规定的修改或废止的法律法规进行标注,作为法律法规时效性变更标注数据集;
16、s2.2、将s2.1标注好的数据按照一定比例随机划分为训练数据集和测试数据集;
17、s2.3、将s2.2得到的训练数据集导入模型训练程序,进行法律法规时效性变更识别模型训练,得到能够识别给定文本中需要进行法律法规时效性变更的模型,作为模型a;
18、s2.4、使用s2.2得到的测试数据集测试模型a,将模型a的识别结果和基础模型的基准测试评估结果进行比对,如果没有达到基准测试的效果,则调整模型训练程序参数,并重复步骤s2.2、s2.3,相应的得到模型n,直到模型n的识别结果达到模型基准测试结果,则结束s2得到最终的模型n。
19、进一步的,所述步骤s3的法律法规时效性变更触发规则为:
20、s3.1、从法律法规库中检索实施日期大于当前日期且时效性不为“尚未生效”的法律法规,将其时效性修改为“尚未生效”,并加入“尚未生效待处理清单”;
21、s3.2、从法律法规库中检索实施日期为当前日期且时效性等于“尚未生效”的法律法规,将其时效性修改为“现行有效”,并加入“现行有效待处理清单”。
22、进一步的,所述步骤s4具体包括:
23、s4.1、通过s3的时效性变更触发处理模块,定时获取时效性需要变更为现行有效的法律法规,即“现行有效待处理清单”;
24、s4.2、对“现行有效待处理清单”中的每一个法律法规,用s2得到的模型内容进行识别,并将其移到“时效性变更待处理清单”,同时识别得到的进行时效性变更的法律法规也一并加入“时效性变更待处理清单”。
25、进一步的,在模型识别得到 “时效性变更待处理清单”后,先将清单中属于相同法律法规的条款分到同一个分组中,然后将分组后的清单发送至给人工审核处理。
26、第二方面,本发明还提供一种法律法规数据库时效性动态更新的系统,其包括:
27、法律法规数据采集与模块,用于从公开权威法律数据库中获取法律法规全量数据;
28、法律法规内容解析模块,用于对全量法律法规文本数据进行属性信息解析以及分条解析;
29、法律法规时效性变更触发处理模块,用于根据法律法规时效性变更触发规则从法律法规库中检索实施日期大于当前日期且时效性不为“尚未生效”的法律法规,将其时效性修改为“尚未生效”,并加入“尚未生效待处理清单”,以及从法律法规库中检索实施日期为当前日期且时效性等于“尚未生效”的法律法规,将其时效性修改为“现行有效”,并加入“现行有效待处理清单”;
30、法律法规时效性变更识别模型,用于对“现行有效待处理清单”中的每一个法律法规进行识别,并将其移到“时效性变更待处理清单”,同时识别得到的需要进行时效性变更的法律法规也一并加入“时效性变更待处理清单”;
31、人工审核模块,用于供人工进行审核处理;
32、时效性变更执行模块,用于执行变更。
33、第三方面,本发明还提供一种电子设备,其包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的法律法规数据库时效性动态更新的方法的步骤。
34、与现有技术相比,本发明的有益效果是:
35、(1)本发明提出了法律法规时效性变更识别模型构建的方法,能够更加全面和准确的发现需要进行时效性变更的法律法规。
36、(2)本发明提出了法律法规时效性变更触发处理规则,并结合模型识别以及人工审核的流程,保证了法规库时效性更新的最终准确性。