基于人工智能的非结构化文档监管方法及存储介质与流程

文档序号:28951310发布日期:2022-02-19 10:42阅读:103来源:国知局
基于人工智能的非结构化文档监管方法及存储介质与流程

1.本发明涉及文档监管技术领域,特别涉及一种基于人工智能的非结构化文档监管方法及存储介质。


背景技术:

2.在企业运营或者项目管理过程中存在各种工程项目过程文档、财务文件、制度规范文档等等,从中挖掘项目过程纰漏、环节缺失、财务资金混乱、制度执行不到位等信息,并予以集中发现、监管和风险评估;以往这些工作从海量文档中人工批阅且分析发现文档信息问题的监管模式,需要投入大量的人力,存在效率低下、遗漏多、监管滞后等等众多问题。而现有的文档监管的技术方案中,如申请号为cn202111021148.x公开的一种基于综合安全审计的文档监控管理系统,如申请号为cn202110759545.0基于云平台的电子文档分类监管系统,虽然可以对文档进行监控或者监管,但是均未解决发现多个文档潜在关系,并对文档内容实体或者实体关系进行监管,同时数据补入均采用人工录入方式,人工成本高。


技术实现要素:

3.为此,需要提供一种基于人工智能的非结构化文档监管方法及存储介质,解决现有的企业运营或者项目管理过程中的各种文档监管需要投入大量人力,效率低下、遗漏多、监管滞后以及无法解决发现多个文档潜在关系等监管问题。
4.为实现上述目的,发明人提供了一种基于人工智能的非结构化文档监管方法,包括以下步骤:
5.从企业或者项目中获取监管文档作为双向lstm+rnn实体及实体关系抽取联合模型训练的素材,并通过模型训练输出实体及实体关系抽取联合模型;
6.将训练得到的实体及实体关系抽取联合模型封装为实体及实体关系识别服务;
7.监管过程中,不断输入监管文档供实体及实体关系识别服务进行信息抽取,构建监管知识图谱;
8.通过监管知识图谱,对非结构文档进行监管。
9.进一步优化,所述“通过监管知识图谱,对非结构文档进行监管”具体包括以下步骤:
10.通过监管知识图谱及监管规则库,对企业或者项目的风险进行评估。
11.进一步优化,所述监管规则库为通过平台预置并后续不断录入完善。
12.进一步优化,所述“通过监管知识图谱,对非结构文档进行监管”具体还包括以下步骤:
13.通过监管知识图谱对监管问题溯源分析定位根源或者影响因子。
14.进一步优化,所述步骤“通过监管知识图谱对监管问题溯源分析定位根源或者影响因子”之后还包括步骤:
15.根据可视化技术呈现监管问题的影响范围。
16.还提供了另一个实施例,一种存储介质,所述存储介质内存储有计算机程序,所述计算机程序被处理器运行时执行以下步骤:
17.从企业或者项目中获取监管文档作为双向lstm+rnn实体及实体关系抽取联合模型训练的素材,并通过模型训练输出实体及实体关系抽取联合模型;
18.将训练得到的实体及实体关系抽取联合模型封装为实体及实体关系识别服务;
19.监管过程中,不断输入监管文档供实体及实体关系识别服务进行信息抽取,构建监管知识图谱;
20.通过监管知识图谱,对非结构文档进行监管。
21.进一步优化,所述步骤“通过监管知识图谱,对非结构文档进行监管”具体包括以下步骤:
22.通过监管知识图谱及监管规则库,对企业或者项目的风险进行评估。
23.进一步优化,所述监管规则库为通过平台预置并后续不断录入完善。
24.进一步优化,所述步骤“通过监管知识图谱,对非结构文档进行监管”具体还包括以下步骤:
25.通过监管知识图谱对监管问题溯源分析定位根源或者影响因子。
26.进一步优化,所述步骤“通过监管知识图谱对监管问题溯源分析定位根源或者影响因子”之后还包括步骤:
27.根据可视化技术呈现监管问题的影响范围。
28.区别于现有技术,上述技术方案,通过分析海量文档中的潜在实体及实体关系构建监管知识图谱,代替原有的人力梳理工作,优势明显,更专注于同一或者不同文档中实体关系的识别;同时采用了人工智能双向lstm+rnn实体及实体关系抽取联合模型训练,从中提炼的模型针对实际输入文档的抽取识别更全面,并且可以配合模型训练不断丰富,代替原有的通过人工梳理规则,效果更显著,覆盖更全面。并且通过结合知识图谱相关技术,让抽取的实体和关系在实际监管应用分析中能满足灵活多面的分析诉求。
附图说明
29.图1为具体实施方式所述基于人工智能的非结构化文档监管方法的一种流程示意图;
30.图2为具体实施方式所述基于人工智能的非结构化文档监管方法的另一种流程示意图。
具体实施方式
31.为详细说明技术方案的技术内容、构造特征、所实现目的及效果,以下结合具体实施例并配合附图详予说明。
32.请参阅图1-2,本实施例提供一种基于人工智能的非结构化文档监管方法,包括以下步骤:
33.步骤s110:从企业或者项目中获取监管文档作为双向lstm+rnn实体及实体关系抽取联合模型训练的素材,并通过模型训练输出实体及实体关系抽取联合模型;
34.步骤s120:将训练得到的实体及实体关系抽取联合模型封装为实体及实体关系识
别服务;
35.步骤s130:监管过程中,不断输入监管文档供实体及实体关系识别服务进行信息抽取,构建监管知识图谱;
36.步骤s140:通过监管知识图谱,对非结构文档进行监管。
37.通过从企业或者项目中获取如项目过程文档、财务文档、制度文档、合同文档等监管文档作为双向lstm+rnn实体及实体关系抽取联合模型训练的素材,通过模型训练输出模型,将训练出的模型封装为实体及实体关系识别服务,监管过程中不断输入相关监管文档供实体及实体关系服务进行信息抽取,通过不断的实体及实体关系抽取监管实体、监管要素以及其中潜在关系,构建监管知识图谱为后续应用及应用分析提供数据基础,通过监管知识图谱对非结构文档进行监管。通过分析海量文档中的潜在实体及实体关系构建监管知识图谱,代替原有的人力梳理工作,优势明显,更专注于同一或者不同文档中实体关系的识别;同时采用了人工智能双向lstm+rnn实体及实体关系抽取联合模型训练,从中提炼的模型针对实际输入文档的抽取识别更全面,并且可以配合模型训练不断丰富,代替原有的通过人工梳理规则,效果更显著,覆盖更全面。并且通过结合知识图谱相关技术,让抽取的实体和关系在实际监管应用分析中能满足灵活多面的分析诉求。
38.在本实例中,可以通过监管知识图谱可以应用于企业或者项目的风险评估等,所述“通过监管知识图谱,对非结构文档进行监管”具体包括以下步骤s141:
39.通过监管知识图谱及监管规则库,对企业或者项目的风险进行评估。
40.建立整套完善的监管规则库,其中,所述监管规则库为通过平台预置并后续不断录入完善,通过构建的监管知识图谱结合监管规则库,可以对企业或者项目的风险进行评估,代替原有的人力梳理工作。
41.在本实施例中,可以实现监管问题的溯源,所述“通过监管知识图谱,对非结构文档进行监管”具体还包括以下步骤s142:
42.通过监管知识图谱对监管问题溯源分析定位根源或者影响因子。
43.构建监管知识图谱,可视化呈现企业或者项目监管中的各个环节问题,同时,通过监管知识图谱的溯源分析支管展现环节问题根源和环节问题影响。其中,所述步骤“通过监管知识图谱对监管问题溯源分析定位根源或者影响因子”之后还包括步骤:
44.根据可视化技术呈现监管问题的影响范围。
45.还提供了另一个实施例,一种存储介质,所述存储介质内存储有计算机程序,所述计算机程序被处理器运行时执行以下步骤:
46.从企业或者项目中获取监管文档作为双向lstm+rnn实体及实体关系抽取联合模型训练的素材,并通过模型训练输出实体及实体关系抽取联合模型;
47.将训练得到的实体及实体关系抽取联合模型封装为实体及实体关系识别服务;
48.监管过程中,不断输入监管文档供实体及实体关系识别服务进行信息抽取,构建监管知识图谱;
49.通过监管知识图谱,对非结构文档进行监管。
50.通过从企业或者项目中获取如项目过程文档、财务文档、制度文档、合同文档等监管文档作为双向lstm+rnn实体及实体关系抽取联合模型训练的素材,通过模型训练输出模型,将训练出的模型封装为实体及实体关系识别服务,监管过程中不断输入相关监管文档
供实体及实体关系服务进行信息抽取,通过不断的实体及实体关系抽取监管实体、监管要素以及其中潜在关系,构建监管知识图谱为后续应用及应用分析提供数据基础,通过监管知识图谱对非结构文档进行监管。通过分析海量文档中的潜在实体及实体关系构建监管知识图谱,代替原有的人力梳理工作,优势明显,更专注于同一或者不同文档中实体关系的识别;同时采用了人工智能双向lstm+rnn实体及实体关系抽取联合模型训练,从中提炼的模型针对实际输入文档的抽取识别更全面,并且可以配合模型训练不断丰富,代替原有的通过人工梳理规则,效果更显著,覆盖更全面。并且通过结合知识图谱相关技术,让抽取的实体和关系在实际监管应用分析中能满足灵活多面的分析诉求。
51.在本实例中,可以通过监管知识图谱可以应用于企业或者项目的风险评估等,所述步骤“通过监管知识图谱,对非结构文档进行监管”具体包括以下步骤:
52.通过监管知识图谱及监管规则库,对企业或者项目的风险进行评估。
53.建立整套完善的监管规则库,其中,所述监管规则库为通过平台预置并后续不断录入完善,通过构建的监管知识图谱结合监管规则库,可以对企业或者项目的风险进行评估,代替原有的人力梳理工作。
54.在本实施例中,可以实现监管问题的溯源,所述步骤“通过监管知识图谱,对非结构文档进行监管”具体还包括以下步骤:
55.通过监管知识图谱对监管问题溯源分析定位根源或者影响因子。
56.构建监管知识图谱,可视化呈现企业或者项目监管中的各个环节问题,同时,通过监管知识图谱的溯源分析支管展现环节问题根源和环节问题影响。其中,所述步骤“通过监管知识图谱对监管问题溯源分析定位根源或者影响因子”之后还包括步骤:
57.根据可视化技术呈现监管问题的影响范围。
58.需要说明的是,尽管在本文中已经对上述各实施例进行了描述,但并非因此限制本发明的专利保护范围。因此,基于本发明的创新理念,对本文所述实施例进行的变更和修改,或利用本发明说明书及附图内容所作的等效结构或等效流程变换,直接或间接地将以上技术方案运用在其他相关的技术领域,均包括在本发明的专利保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1