一种法律法规结构化处理的方法、系统与流程

文档序号:32776238发布日期:2022-12-31 13:32阅读:75来源:国知局
一种法律法规结构化处理的方法、系统与流程

1.本发明涉及结构化处理技术领域,尤其涉及一种法律法规结构化处理的方法、系统。


背景技术:

2.从法律领域的法律法规数据处理和法规检索上来看,纪检监察在处理案件时,定性量纪和定罪量刑难度大、标准不统一,办案效率低,需要挖掘利用历史大数据规律,构建纪检监察法律法规存储库可以为办案人员提供定性量纪、定罪参考多维度知识服务,打破信息壁垒,降低审理工作成本,提高工作效率和质量,实现智能化办案辅助。现在市面上急需一种对法律法规基本信息、文本内容进行结构化处理的方法和系统。


技术实现要素:

3.本发明提供了一种法律法规结构化处理的方法、系统,以解决现有技术中存在的从法律领域的法律法规数据处理和法规检索上来看,纪检监察在处理案件时,定性量纪和定罪量刑难度大、标准不统一,办案效率低,需要挖掘利用历史大数据规律,构建纪检监察法律法规存储库可以为办案人员提供定性量纪、定罪参考多维度知识服务,打破信息壁垒,降低审理工作成本,提高工作效率和质量,实现智能化办案辅助。现在市面上急需一种对法律法规基本信息、文本内容进行结构化处理的方法和系统的上述问题。
4.为了达到上述目的,本发明提供如下技术方案:
5.一种法律法规结构化处理的方法,包括:
6.s101:基于执法大数据获取法律法规文件,对法律法规文件进行预处理;
7.s102:对法律法规文件进行结构化处理,将法律法规基本信息、文本内容进行拆解并赋码,构建法律法规结构化模型;
8.s103:将法律法规结构化模型进行可视化,工作人员通过终端查看对应的法律法规条款。
9.其中,所述s101步骤包括:
10.s1011:通过爬虫技术从执法大数据中的纪检委网站爬取行政执法部门的法律法规文件;
11.s1012:将法律法规文件进行分词预处理,去除法律法规文件的无效内容,将法律法规文件的有效内容按照一定的规律分割为字符串匹配的法律法规文件;
12.s1013:去除字符串匹配的法律法规文件中重复出现的分词,将保留的法律法规文件分词组成数据集。
13.其中,所述s102步骤包括:
14.s1021:通过算法将法律法规文件内容按照编、章、节、条、款、项、目的形式进行拆解;
15.s1022:将拆解后的法律法规文件按照版本号、效力级别、时效性、法律法规文件条
款内容进行编码操作;
16.s1023:编码后的法律法规文件经过处理形成结构化数据,将结构化数据按照关键词出现频率进行分级存储。
17.其中,所述s103步骤包括:
18.s1031:将法律法规结构化模型以图网络或列表的形式展示于法律法规平台终端,工作人员通过法律法规平台终端查看对应的法律法规条款;
19.s1032:当工作人员通过在法律法规平台终端输入关键词查看对应的法律法规条款时,相关法律法规推荐模块将相似的法律法规信息推送至法律法规平台终端。
20.其中,所述s1021步骤包括:
21.将拆解后的法律法规文件按编、章、节、条、款、项、违纪行为、违纪程度、违纪处罚、法律法规作为实体,设定对应的关系类别,关系类别包括属于、给予、相关,将每相邻的两个实体与对应的关系类别进行组合,构成实体—关系—实体的三元组形式数据。
22.一种法律法规结构化处理的系统,包括:
23.法律法规文件获取单元用于基于执法大数据获取法律法规文件,对法律法规文件进行预处理;
24.数据结构化处理单元用于对法律法规文件进行结构化处理,将法律法规基本信息、文本内容进行拆解并赋码,构建法律法规结构化模型;
25.数据可视化单元用于将法律法规结构化模型进行可视化,工作人员通过终端查看对应的法律法规条款。
26.其中,所述法律法规文件获取单元包括:
27.爬取采集子单元用于通过爬虫技术从执法大数据中的纪检委网站爬取行政执法部门的法律法规文件;
28.分词预处理第一子单元用于将法律法规文件进行分词预处理,去除法律法规文件的无效内容,将法律法规文件的有效内容按照一定的规律分割为字符串匹配的法律法规文件;
29.分词预处理第二子单元用于去除字符串匹配的法律法规文件中重复出现的分词,将保留的法律法规文件分词组成数据集。
30.其中,所述数据结构化处理单元包括:
31.数据结构化处理第一子单元用于通过算法将法律法规文件内容按照编、章、节、条、款、项、目的形式进行拆解;
32.数据结构化处理第二子单元用于将拆解后的法律法规文件按照版本号、效力级别、时效性、法律法规文件条款内容进行编码操作;
33.数据结构化处理第三子单元用于编码后的法律法规文件经过处理形成结构化数据,将结构化数据按照关键词出现频率进行分级存储。
34.其中,所述数据可视化单元包括:
35.法律法规平台终端子单元用于将法律法规结构化模型以图网络或列表的形式展示于法律法规平台终端,工作人员通过法律法规平台终端查看对应的法律法规条款;
36.法律法规推荐子单元用于当工作人员通过在法律法规平台终端输入关键词查看对应的法律法规条款时,相关法律法规推荐模块将相似的法律法规信息推送至法律法规平
台终端。
37.其中,所述数据结构化处理第一子单元包括:
38.将拆解后的法律法规文件按编、章、节、条、款、项、违纪行为、违纪程度、违纪处罚、法律法规作为实体,设定对应的关系类别,关系类别包括属于、给予、相关,将每相邻的两个实体与对应的关系类别进行组合,构成实体—关系—实体的三元组形式数据。
39.与现有技术相比,本发明具有以下优点:
40.一种法律法规结构化处理的方法,包括:基于执法大数据获取法律法规文件,对法律法规文件进行预处理;对法律法规文件进行结构化处理,将法律法规基本信息、文本内容进行拆解并赋码,构建法律法规结构化模型;将法律法规结构化模型进行可视化,工作人员通过终端查看对应的法律法规条款。通过法律法规结构化处理促进了执法人员查询对应法律法规的效率,提高了依照事项进行执法的效率,有效提升了全流程网上办案、移动办案。
41.本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
42.下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
43.附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
44.图1为本发明实施例中一种法律法规结构化处理的方法的流程图;
45.图2为本发明实施例中一种法律法规结构化处理的方法中的获取法律法规文件流程图;
46.图3为本发明实施例中一种法律法规结构化处理的方法中的结构化处理流程图。
具体实施方式
47.以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
48.本发明实施例提供了一种法律法规结构化处理的方法、系统,请参考图1至图3,其中,一种法律法规结构化处理的方法,包括:
49.s101:基于执法大数据获取法律法规文件,对法律法规文件进行预处理;
50.s102:对法律法规文件进行结构化处理,将法律法规基本信息、文本内容进行拆解并赋码,构建法律法规结构化模型;
51.s103:将法律法规结构化模型进行可视化,工作人员通过终端查看对应的法律法规条款。
52.上述技术方案的工作原理为:基于执法大数据获取法律法规文件,对法律法规文件进行预处理;对法律法规文件进行结构化处理,将法律法规基本信息、文本内容进行拆解并赋码,构建法律法规结构化模型;将法律法规结构化模型进行可视化,工作人员通过终端查看对应的法律法规条款。将法律法规属性、法律法规对应的文本数据和法律法规内容属性进行结构化处理,使用排名算法、权重重构和多模态数据融合等方法,构建一个图谱矩
阵,达到增强数据集中法律法规之间语义关联度的目的。
53.上述技术方案的有益效果为:基于执法大数据获取法律法规文件,对法律法规文件进行预处理;对法律法规文件进行结构化处理,将法律法规基本信息、文本内容进行拆解并赋码,构建法律法规结构化模型;将法律法规结构化模型进行可视化,工作人员通过终端查看对应的法律法规条款。通过法律法规结构化处理促进了执法人员查询对应法律法规的效率,提高了依照事项进行执法的效率,有效提升了全流程网上办案、移动办案。
54.在另一实施例中,所述s101步骤包括:
55.s1011:通过爬虫技术从执法大数据中的纪检委网站爬取行政执法部门的法律法规文件;
56.s1012:将法律法规文件进行分词预处理,去除法律法规文件的无效内容,将法律法规文件的有效内容按照一定的规律分割为字符串匹配的法律法规文件;
57.s1013:去除字符串匹配的法律法规文件中重复出现的分词,将保留的法律法规文件分词组成数据集。
58.上述技术方案的工作原理为:通过爬虫技术从执法大数据中的纪检委网站爬取行政执法部门的法律法规文件;将法律法规文件进行分词预处理,去除法律法规文件的无效内容,将法律法规文件的有效内容按照一定的规律分割为字符串匹配的法律法规文件;去除字符串匹配的法律法规文件中重复出现的分词,将保留的法律法规文件分词组成数据集。
59.该方案中的爬虫技术是通过创建专门针对法律法规文件的聚焦型网络爬虫,针对法律法规文件的目标数据进行爬取,以python语言和scrapy框架创建scrapy项目,在cmd窗口中,运行scrapy startproject命令创建爬虫项目框架,其中包括项目配置文件、python模块、item文件、piplines管道文件、爬虫目录,通过建立cookie池定时更换cookie、伪装user-agent、设置爬取时间间隔来应对执法大数据网页的反爬。
60.将法律法规文件进行数据预处理过程中还将获取的原始数据做进一步的处理与分析,消除网页噪声、去除重复网页及利用网页文字分词技术进行网页内容和特征项的提取;在数据清洗环节,从数据的合法性、完整性、唯一性和正确性对采集的数据进行检验,并使用排序算法以及isnull和drop的技术对数据进行检验和清洗,清洗之后的法律法规文件数据信息完整准确。
61.上述技术方案的有益效果为:通过爬虫技术从执法大数据中的纪检委网站爬取行政执法部门的法律法规文件;将法律法规文件进行分词预处理,去除法律法规文件的无效内容,将法律法规文件的有效内容按照一定的规律分割为字符串匹配的法律法规文件;去除字符串匹配的法律法规文件中重复出现的分词,将保留的法律法规文件分词组成数据集。从而在执法大数据中快速获取所需法律法规文件。
62.在另一实施例中,所述s102步骤包括:
63.s1021:通过算法将法律法规文件内容按照编、章、节、条、款、项、目的形式进行拆解;
64.s1022:将拆解后的法律法规文件按照版本号、效力级别、时效性、法律法规文件条款内容进行编码操作;
65.s1023:编码后的法律法规文件经过处理形成结构化数据,将结构化数据按照关键
词出现频率进行分级存储。
66.上述技术方案的工作原理为:通过算法将法律法规文件内容按照编、章、节、条、款、项、目的形式进行拆解;将拆解后的法律法规文件按照版本号、效力级别、时效性、法律法规文件条款内容进行编码操作;编码后的法律法规文件经过处理形成结构化数据,将结构化数据按照关键词出现频率进行分级存储。其中,将存储分为一级存储、二级存储、三级存储,将结构化数据按关键词频率出现的高低分为最频繁数据、较频繁数据、非频繁数据,然后按照顺序分别存储于一级存储、二级存储、三级存储。
67.将拆解后的法律法规文件进行编码采用混合分类法的分类方法,在编码方法上将层次码与顺序码结合,使用数字编码的形式,使分类代码层次明晰、结构合理,满足各地方执法部门对使用大数据手段的统计与分析的需求。
68.分类代码的代码设计长度为20位,由5个层次结构组成,各层级针对不同的分类对象,在每一层代码中使用递增顺序码进行具体标识和参照,在部分层级中使用系列顺序码对编码对象确定类别并划定各类代码取值范围;在本分类代码中,第一层级有2位代码,表示违纪程度情节较轻类型;第二层级有2位代码,表示违纪程度情节较重;第三层级有4位,表示违纪程度情节严重;第四层级有7位,分为三级代码,表示违法情节;第五层级有5位,为法律法规文件信息扩展位。
69.上述技术方案的有益效果为:通过算法将法律法规文件内容按照编、章、节、条、款、项、目的形式进行拆解;将拆解后的法律法规文件按照版本号、效力级别、时效性、法律法规文件条款内容进行编码操作;编码后的法律法规文件经过处理形成结构化数据,将结构化数据按照关键词出现频率进行分级存储。
70.在另一实施例中,所述s103步骤包括:
71.s1031:将法律法规结构化模型以图网络或列表的形式展示于法律法规平台终端,工作人员通过法律法规平台终端查看对应的法律法规条款;
72.s1032:当工作人员通过在法律法规平台终端输入关键词查看对应的法律法规条款时,相关法律法规推荐模块将相似的法律法规信息推送至法律法规平台终端。
73.上述技术方案的工作原理为:将法律法规结构化模型以图网络或列表的形式展示于法律法规平台终端,工作人员通过法律法规平台终端查看对应的法律法规条款;当工作人员通过在法律法规平台终端输入关键词查看对应的法律法规条款时,相关法律法规推荐模块将相似的法律法规信息推送至法律法规平台终端。
74.上述技术方案的有益效果为:将法律法规结构化模型以图网络或列表的形式展示于法律法规平台终端,工作人员通过法律法规平台终端查看对应的法律法规条款;当工作人员通过在法律法规平台终端输入关键词查看对应的法律法规条款时,相关法律法规推荐模块将相似的法律法规信息推送至法律法规平台终端。从而方便了用户的查询。
75.在另一实施例中,所述s1021步骤包括:
76.将拆解后的法律法规文件按编、章、节、条、款、项、违纪行为、违纪程度、违纪处罚、法律法规作为实体,设定对应的关系类别,关系类别包括属于、给予、相关,将每相邻的两个实体与对应的关系类别进行组合,构成实体—关系—实体的三元组形式数据。
77.上述技术方案的工作原理为:将拆解后的法律法规文件按编、章、节、条、款、项、违纪行为、违纪程度、违纪处罚、法律法规作为实体,设定对应的关系类别,关系类别包括属
于、给予、相关,将每相邻的两个实体与对应的关系类别进行组合,构成实体—关系—实体的三元组形式数据。
78.对法律法规文件中的实体进行抽取,法律法规文件的名称对应唯一的数字标注,法律法规文件中的内容为相关法律法规的内容属性,通过数字将条与法律法规两种实体类型进行相关联处理,法律法规与其内容构成实体—属性—属性值的三元组形式数据。将法律法规文件按照三元组的形式进行存储,从而使庞大的数据构成了法律法规文件的实体,属性,关系等。通过对实体进行抽取使法律法规范围相对变窄且知识精度提高。
79.上述技术方案的有益效果为:将拆解后的法律法规文件按编、章、节、条、款、项、违纪行为、违纪程度、违纪处罚、法律法规作为实体,设定对应的关系类别,关系类别包括属于、给予、相关,将每相邻的两个实体与对应的关系类别进行组合,构成实体—关系—实体的三元组形式数据。将法律法规文件按照三元组的形式进行存储,从而使庞大的数据构成了法律法规文件的实体,属性,关系等。
80.在另一实施例中,法律法规文件获取单元用于基于执法大数据获取法律法规文件,对法律法规文件进行预处理;
81.数据结构化处理单元用于对法律法规文件进行结构化处理,将法律法规基本信息、文本内容进行拆解并赋码,构建法律法规结构化模型;
82.数据可视化单元用于将法律法规结构化模型进行可视化,工作人员通过终端查看对应的法律法规条款。
83.上述技术方案的工作原理为:法律法规文件获取单元用于基于执法大数据获取法律法规文件,对法律法规文件进行预处理;数据结构化处理单元用于对法律法规文件进行结构化处理,将法律法规基本信息、文本内容进行拆解并赋码,构建法律法规结构化模型;数据可视化单元用于将法律法规结构化模型进行可视化,工作人员通过终端查看对应的法律法规条款。将法律法规属性、法律法规对应的文本数据和法律法规内容属性进行结构化处理,使用排名算法、权重重构和多模态数据融合等方法,构建一个图谱矩阵,达到增强数据集中法律法规之间语义关联度的目的。
84.上述技术方案的有益效果为:法律法规文件获取单元用于基于执法大数据获取法律法规文件,对法律法规文件进行预处理;数据结构化处理单元用于对法律法规文件进行结构化处理,将法律法规基本信息、文本内容进行拆解并赋码,构建法律法规结构化模型;数据可视化单元用于将法律法规结构化模型进行可视化,工作人员通过终端查看对应的法律法规条款。将法律法规属性、法律法规对应的文本数据和法律法规内容属性进行结构化处理,使用排名算法、权重重构和多模态数据融合等方法,构建一个图谱矩阵,达到增强数据集中法律法规之间语义关联度的目的。
85.在另一实施例中,所述法律法规文件获取单元包括:
86.爬取采集子单元用于通过爬虫技术从执法大数据中的纪检委网站爬取行政执法部门的法律法规文件;
87.分词预处理第一子单元用于将法律法规文件进行分词预处理,去除法律法规文件的无效内容,将法律法规文件的有效内容按照一定的规律分割为字符串匹配的法律法规文件;
88.分词预处理第二子单元用于去除字符串匹配的法律法规文件中重复出现的分词,
将保留的法律法规文件分词组成数据集。
89.上述技术方案的工作原理为:爬取采集子单元用于通过爬虫技术从执法大数据中的纪检委网站爬取行政执法部门的法律法规文件;分词预处理第一子单元用于将法律法规文件进行分词预处理,去除法律法规文件的无效内容,将法律法规文件的有效内容按照一定的规律分割为字符串匹配的法律法规文件;分词预处理第二子单元用于去除字符串匹配的法律法规文件中重复出现的分词,将保留的法律法规文件分词组成数据集。
90.该方案中的爬虫技术是通过创建专门针对法律法规文件的聚焦型网络爬虫,针对法律法规文件的目标数据进行爬取,以python语言和scrapy框架创建scrapy项目,在cmd窗口中,运行scrapy startproject命令创建爬虫项目框架,其中包括项目配置文件、python模块、item文件、piplines管道文件、爬虫目录,通过建立cookie池定时更换cookie、伪装user-agent、设置爬取时间间隔来应对执法大数据网页的反爬。
91.将法律法规文件进行数据预处理过程中还将获取的原始数据做进一步的处理与分析,消除网页噪声、去除重复网页及利用网页文字分词技术进行网页内容和特征项的提取;在数据清洗环节,从数据的合法性、完整性、唯一性和正确性对采集的数据进行检验,并使用排序算法以及isnull和drop的技术对数据进行检验和清洗,清洗之后的法律法规文件数据信息完整准确。
92.上述技术方案的有益效果为:爬取采集子单元用于通过爬虫技术从执法大数据中的纪检委网站爬取行政执法部门的法律法规文件;分词预处理第一子单元用于将法律法规文件进行分词预处理,去除法律法规文件的无效内容,将法律法规文件的有效内容按照一定的规律分割为字符串匹配的法律法规文件;分词预处理第二子单元用于去除字符串匹配的法律法规文件中重复出现的分词,将保留的法律法规文件分词组成数据集。从而在执法大数据中快速获取所需法律法规文件。
93.在另一实施例中,所述数据结构化处理单元包括:
94.数据结构化处理第一子单元用于通过算法将法律法规文件内容按照编、章、节、条、款、项、目的形式进行拆解;
95.数据结构化处理第二子单元用于将拆解后的法律法规文件按照版本号、效力级别、时效性、法律法规文件条款内容进行编码操作;
96.数据结构化处理第三子单元用于编码后的法律法规文件经过处理形成结构化数据,将结构化数据按照关键词出现频率进行分级存储。
97.上述技术方案的工作原理为:数据结构化处理第一子单元用于通过算法将法律法规文件内容按照编、章、节、条、款、项、目的形式进行拆解;数据结构化处理第二子单元用于将拆解后的法律法规文件按照版本号、效力级别、时效性、法律法规文件条款内容进行编码操作;数据结构化处理第三子单元用于编码后的法律法规文件经过处理形成结构化数据,将结构化数据按照关键词出现频率进行分级存储。其中,将存储分为一级存储、二级存储、三级存储,将结构化数据按关键词频率出现的高低分为最频繁数据、较频繁数据、非频繁数据,然后按照顺序分别存储于一级存储、二级存储、三级存储。
98.将拆解后的法律法规文件进行编码采用混合分类法的分类方法,在编码方法上将层次码与顺序码结合,使用数字编码的形式,使分类代码层次明晰、结构合理,满足各地方执法部门对使用大数据手段的统计与分析的需求。
99.分类代码的代码设计长度为20位,由5个层次结构组成,各层级针对不同的分类对象,在每一层代码中使用递增顺序码进行具体标识和参照,在部分层级中使用系列顺序码对编码对象确定类别并划定各类代码取值范围;在本分类代码中,第一层级有2位代码,表示违纪程度情节较轻类型;第二层级有2位代码,表示违纪程度情节较重;第三层级有4位,表示违纪程度情节严重;第四层级有7位,分为三级代码,表示违法情节;第五层级有5位,为法律法规文件信息扩展位。
100.结构化数据中的关键词出现频率越高,该关键词的文档词频值就越高,从而该词法律法规的重要程度,文档词频值的公式为:
[0101][0102]
其中,h表示文档词频值;法律法规的n维特征的对象为x和y,x=(x1,x2,x3,
……
,xn),y=(y1,y2,y3,
……
,yn);n表示有n个x或y;i表示第i个x或y。
[0103]
通过计算文档词频值的方式来度量法律法规数据库中所有语句相似的程度,从而更精准的对法律法规数据进行分级存储。
[0104]
上述技术方案的有益效果为:数据结构化处理第一子单元用于通过算法将法律法规文件内容按照编、章、节、条、款、项、目的形式进行拆解;数据结构化处理第二子单元用于将拆解后的法律法规文件按照版本号、效力级别、时效性、法律法规文件条款内容进行编码操作;数据结构化处理第三子单元用于编码后的法律法规文件经过处理形成结构化数据,将结构化数据按照关键词出现频率进行分级存储。
[0105]
在另一实施例中,所述数据可视化单元包括:
[0106]
法律法规平台终端子单元用于将法律法规结构化模型以图网络或列表的形式展示于法律法规平台终端,工作人员通过法律法规平台终端查看对应的法律法规条款;
[0107]
法律法规推荐子单元用于当工作人员通过在法律法规平台终端输入关键词查看对应的法律法规条款时,相关法律法规推荐模块将相似的法律法规信息推送至法律法规平台终端。
[0108]
上述技术方案的工作原理为:法律法规平台终端子单元用于将法律法规结构化模型以图网络或列表的形式展示于法律法规平台终端,工作人员通过法律法规平台终端查看对应的法律法规条款;法律法规推荐子单元用于当工作人员通过在法律法规平台终端输入关键词查看对应的法律法规条款时,相关法律法规推荐模块将相似的法律法规信息推送至法律法规平台终端。从而方便了用户的查询。
[0109]
上述技术方案的有益效果为:法律法规平台终端子单元用于将法律法规结构化模型以图网络或列表的形式展示于法律法规平台终端,工作人员通过法律法规平台终端查看对应的法律法规条款;法律法规推荐子单元用于当工作人员通过在法律法规平台终端输入关键词查看对应的法律法规条款时,相关法律法规推荐模块将相似的法律法规信息推送至法律法规平台终端。从而方便了用户的查询。
[0110]
在另一实施例中,所述数据结构化处理第一子单元包括:
[0111]
将拆解后的法律法规文件按编、章、节、条、款、项、违纪行为、违纪程度、违纪处罚、法律法规作为实体,设定对应的关系类别,关系类别包括属于、给予、相关,将每相邻的两个
实体与对应的关系类别进行组合,构成实体—关系—实体的三元组形式数据。
[0112]
上述技术方案的工作原理为:将拆解后的法律法规文件按编、章、节、条、款、项、违纪行为、违纪程度、违纪处罚、法律法规作为实体,设定对应的关系类别,关系类别包括属于、给予、相关,将每相邻的两个实体与对应的关系类别进行组合,构成实体—关系—实体的三元组形式数据。
[0113]
对法律法规文件中的实体进行抽取,法律法规文件的名称对应唯一的数字标注,法律法规文件中的内容为相关法律法规的内容属性,通过数字将条与法律法规两种实体类型进行相关联处理,法律法规与其内容构成实体—属性—属性值的三元组形式数据。将法律法规文件按照三元组的形式进行存储,从而使庞大的数据构成了法律法规文件的实体,属性,关系等。通过对实体进行抽取使法律法规范围相对变窄且知识精度提高。
[0114]
上述技术方案的有益效果为:将拆解后的法律法规文件按编、章、节、条、款、项、违纪行为、违纪程度、违纪处罚、法律法规作为实体,设定对应的关系类别,关系类别包括属于、给予、相关,将每相邻的两个实体与对应的关系类别进行组合,构成实体—关系—实体的三元组形式数据。将法律法规文件按照三元组的形式进行存储,从而使庞大的数据构成了法律法规文件的实体,属性,关系等。
[0115]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1