1.本技术涉及大数据技术领域,尤其涉及一种基于知识图谱的企业异常监控方法及其相关设备。
背景技术:2.随着企业的高速发展,市场的快速变化,业务复杂性的增加,为了快速应对市场变化,需要企业对经营过程中的风险、异常进行灵活感知。使得,当企业的异常发生后,企业能及时准确地找到问题发生的原因,加以针对性的预防补救措施。
3.企业异常的查找往往需要对大量的数据进行分析,而后得出结果。然而,当前针对于大批量数据的查找和分析仍然是采用人为地操作,即便采用计算机对数据进行分析,亦只能进行简单的数据逻辑处理,无法实现对企业异常的高效定位及分析。最终,导致企业异常定位效率低下的问题。
技术实现要素:4.本技术实施例的目的在于提出一种基于知识图谱的企业异常监控方法及其相关设备,以解决企业异常定位效率低下的技术问题。
5.为了解决上述技术问题,本技术实施例提供一种基于知识图谱的企业异常监控方法,采用了如下所述的技术方案:
6.采集目标企业的状态数据作为参考指标,获取所述参考指标的固有属性,根据所述固有属性确定所述参考指标之间的关联关系;
7.基于所述固有属性和所述关联关系对所述参考指标进行指标图谱构建操作,得到目标指标图谱;
8.获取所述参考指标对应的数据库,从所述数据库获取所述目标企业的当期数据,根据所述当期数据确定监控指标是否存在异常,在所述监控指标存在异常时,基于所述目标指标图谱查找得到与所述监控指标关联的所有关联指标;
9.将所述关联指标输入至目标图表模版中,得到所述目标企业的异常监控报告。
10.进一步的,所述采集目标企业的状态数据作为参考指标的步骤包括:
11.获取所述目标企业的报告文本,对所述报告文本进行分词处理,得到多个分词词语;
12.对所述分词词语进行实体识别,得到所述目标企业的状态数据。
13.进一步的,所述获取所述参考指标的固有属性的步骤包括:
14.获取所述参考指标的指标名称、代码、版本、所属报表、状态和参数信息,将所述名称、代码、版本、报表名称、状态和参数信息作为所述参考指标的固有属性。
15.进一步的,所述根据所述固有属性确定所述参考指标之间的关联关系的步骤包括:
16.获取所述固有属性所属的分类属性,在所述分类属性为派生类型时,确定所述参
考指标为派生指标;
17.获取所述派生指标的计算关系,根据所述计算关系确定所述派生指标的关联关系。
18.进一步的,所述基于所述固有属性和所述关联关系对所述参考指标进行指标图谱构建操作,得到目标指标图谱的步骤包括:
19.基于所述固有属性和所述关联关系构建所述参考指标的三元组;
20.获取训练好的三元组评估模型,根据所述三元组评估模型对所述三元组进行置信度评估,得到所述三元组的评估值;
21.确定所述评估值是否大于等于预设阈值,在所述评估值大于等于所述预设阈值时,确定所述三元组验证通过,根据验证通过的三元组构建得到所述目标指标图谱。
22.进一步的,所述基于所述固有属性和所述关联关系构建所述参考指标的三元组的步骤包括:
23.根据所述固有属性计算所述参考指标和标准实体之间的文本相似度,比对所述文本相似度和预设相似度阈值;
24.在所述文本相似度大于等于所述预设相似度阈值时,根据所述标准实体对所述参考指标进行消歧归一,得到目标指标;
25.基于所述目标指标和所述关联关系,构建所述三元组。
26.进一步的,所述基于所述目标指标图谱查找得到与所述监控指标关联的所有关联指标的步骤包括:
27.确定所述监控指标的目标层级,在所述目标层级非最小级时,获取层级小于所述目标层级且与所述监控指标关联的疑似指标;
28.获取所述疑似指标的历史数据,计算所述疑似指标的当期数据与所述历史数据的差值,得到浮动范围;
29.在所述浮动范围大于等于预设范围时,确定所述疑似指标为所述关联指标。
30.为了解决上述技术问题,本技术实施例还提供一种基于知识图谱的企业异常监控装置,采用了如下所述的技术方案:
31.获取模块,用于采集目标企业的状态数据作为参考指标,获取所述参考指标的固有属性,根据所述固有属性确定所述参考指标之间的关联关系;
32.构建模块,用于基于所述固有属性和所述关联关系对所述参考指标进行指标图谱构建操作,得到目标指标图谱;
33.确认模块,用于获取所述参考指标对应的数据库,从所述数据库获取所述目标企业的当期数据,根据所述当期数据确定监控指标是否存在异常,在所述监控指标存在异常时,基于所述目标指标图谱查找得到与所述监控指标关联的所有关联指标;
34.生成模块,用于将所述关联指标输入至目标图表模版中,得到所述目标企业的异常监控报告。
35.为了解决上述技术问题,本技术实施例还提供一种计算机设备,采用了如下所述的技术方案:
36.采集目标企业的状态数据作为参考指标,获取所述参考指标的固有属性,根据所述固有属性确定所述参考指标之间的关联关系;
37.基于所述固有属性和所述关联关系对所述参考指标进行指标图谱构建操作,得到目标指标图谱;
38.获取所述参考指标对应的数据库,从所述数据库获取所述目标企业的当期数据,根据所述当期数据确定监控指标是否存在异常,在所述监控指标存在异常时,基于所述目标指标图谱查找得到与所述监控指标关联的所有关联指标;
39.将所述关联指标输入至目标图表模版中,得到所述目标企业的异常监控报告。
40.为了解决上述技术问题,本技术实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
41.采集目标企业的状态数据作为参考指标,获取所述参考指标的固有属性,根据所述固有属性确定所述参考指标之间的关联关系;
42.基于所述固有属性和所述关联关系对所述参考指标进行指标图谱构建操作,得到目标指标图谱;
43.获取所述参考指标对应的数据库,从所述数据库获取所述目标企业的当期数据,根据所述当期数据确定监控指标是否存在异常,在所述监控指标存在异常时,基于所述目标指标图谱查找得到与所述监控指标关联的所有关联指标;
44.将所述关联指标输入至目标图表模版中,得到所述目标企业的异常监控报告。
45.本技术提出的基于知识图谱的企业异常监控方法,通过采集目标企业的状态数据作为参考指标,获取所述参考指标的固有属性,根据所述固有属性确定所述参考指标之间的关联关系;之后,基于所述固有属性和所述关联关系对所述参考指标进行指标图谱构建操作,得到目标指标图谱,使得通过该目标指标图谱能够对指标进行高效精确地溯源;而后,获取所述参考指标对应的数据库,从所述数据库获取所述目标企业的当期数据,根据所述当期数据确定监控指标是否存在异常,在所述监控指标存在异常时,基于所述目标指标图谱查找得到与所述监控指标关联的所有关联指标,由此提高了数据异常的处理效率;最后,将所述关联指标输入至目标图表模版中,得到所述目标企业的异常监控报告,实现了对指标以及其关联关系的快速溯源,使得通过该指标能够快速发现数据异常,提高了企业异常监控及定位的准确率和效率。
附图说明
46.为了更清楚地说明本技术中的方案,下面将对本技术实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
47.图1是本技术可以应用于其中的示例性系统架构图;
48.图2根据本技术的基于知识图谱的企业异常监控方法的一个实施例的流程图;
49.图3是根据本技术的基于知识图谱的企业异常监控装置的一个实施例的结构示意图;
50.图4是根据本技术的计算机设备的一个实施例的结构示意图。
51.附图标记:基于知识图谱的企业异常监控装置300、获取模块301、构建模块302、确认模块303以及生成模块304。
具体实施方式
52.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本技术;本技术的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本技术的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
53.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
54.为了使本技术领域的人员更好地理解本技术方案,下面将结合附图,对本技术实施例中的技术方案进行清楚、完整地描述。
55.如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
56.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
57.终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、mp3播放器(moving picture expertsgroup audio layer iii,动态影像专家压缩标准音频层面3)、mp4(moving pictureexperts group audio layer iv,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
58.服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
59.需要说明的是,本技术实施例所提供的基于知识图谱的企业异常监控方法一般由服务器/终端设备执行,相应地,基于知识图谱的企业异常监控装置一般设置于服务器/终端设备中。
60.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
61.继续参考图2,示出了根据本技术的基于知识图谱的企业异常监控的方法的一个实施例的流程图。所述的基于知识图谱的企业异常监控方法,包括以下步骤:
62.步骤s201,采集目标企业的状态数据作为参考指标,获取所述参考指标的固有属性,根据所述固有属性确定所述参考指标之间的关联关系。
63.在本实施例中,状态数据包括目标企业的内部状态数据和外部状态数据数据,通过该状态数据可以对企业的执行策略进行决策。例如,目标企业的外部状态数据则包括资产流动比率、存货周转率和企业利润等不同的数据;企业固有资产和企业人力等则为目标企业的内部状态数据。通过数据库或网络爬虫可以得到该目标企业的状态数据。在得到该
状态数据时,将该状态数据作为参考指标,并获取该参考指标的固有属性,其中,固有属性为参考指标本身的固有标识属性,如名称、代码和版本等。根据该固有属性对应的划分类别对参考指标进行划分,得到不同参考指标之间的关联关系。具体地,不同的固有属性可能对应不同的划分类别也可能对应相同的划分类别,获取每个参考指标对应的划分类别,而后从预设的数据表中获取不同划分类别之间的层级关系;根据该不同划分类别对应的层级关系,即可确定不同划分类别下参考指标的关联关系,如指标的父子关系、总分关系等。
64.步骤s202,基于所述固有属性和所述关联关系对所述参考指标进行指标图谱构建操作,得到目标指标图谱。
65.在本实施例中,在得到参考指标的固有属性和关联关系时,将该参考指标的固有属性中的指标名称作为该参考指标的实体名称,根据该实体名称和该关联关系通过图谱构建工具构建得到目标企业的目标指标图谱。
66.步骤s203,获取所述参考指标对应的数据库,从所述数据库获取所述目标企业的当期数据,根据所述当期数据确定监控指标是否存在异常,在所述监控指标存在异常时,基于所述目标指标图谱查找得到与所述监控指标关联的所有关联指标。
67.在本实施例中,当期数据为目标企业的参考指标在当前阶段的数据信息,监控指标为目标企业预设的需要进行监控的指标数据。获取参考指标对应的数据库,从该数据库中获取目标企业的当期数据,根据该当期数据对监控指标进行监测,确定该监控指标是否存在异常。具体地,在获取到当期数据时,获取该当期数据中监控指标相比于最近一期的历史指标的浮动范围,在该浮动范围在预设范围内时,确定该监控指标不存在异常;在该浮动范围不在该预设范围内时,确定该监控指标存在异常,确定该存在异常的监控指标为异常指标;根据目标指标图谱查找到与该异常指标关联的所有关联指标,该关联指标为在目标指标图谱中与异常指标存在关联关系,且存在异常波动的指标。在得到存在异常的监控指标时,从目标指标图谱中查找到与该异常指标存在关联关系的指标,之后,从该存在关联关系的指标中查找指标波动范围超过标准范围的指标,该指标即为与异常指标关联的关联指标。
68.步骤s204,将所述关联指标输入至目标图表模版中,得到所述目标企业的异常监控报告。
69.在本实施例中,在得到与存在异常的监控指标关联的所有关联指标时,根据该关联指标生成目标企业的异常监控报告。具体地,该异常监控报告由关联指标的波动情况组成,该关联指标的波动情况可通过报表或图表的形式展示;在得到与存在异常的监控指标关联的所有关联指标时,根据该关联指标的指标类型输入至对应类型的目标图表模版中,基于该目标图表模版生成对应的异常监控报告。除此之外,在得到异常监控报告之后,还可以根据该异常监控报告中关联指标的指标类型从存储的决策方案中选取最终的决策结果,并将该决策结果反馈至用户端的目标显示界面。
70.需要强调的是,为进一步保证上述异常监控报告的私密和安全性,上述异常监控报告还可以存储于一区块链的节点中。
71.本技术所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验
证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
72.本技术实现了对指标以及其关联关系的快速溯源,使得通过该指标能够快速发现数据异常,提高了企业异常监控及定位的准确率和效率。
73.在本实施例的一些可选的实现方式中,上述采集目标企业的状态数据作为参考指标的步骤包括:
74.获取所述目标企业的报告文本,对所述报告文本进行分词处理,得到多个分词词语;
75.对所述分词词语进行实体识别,得到所述目标企业的状态数据。
76.在本实施例中,在获取状态数据时,可以通过目标企业的报告文本得到该状态数据。具体地,从企业的公开网站上获取该目标企业的报告文本,对该报告文本进行分词处理并去除停用词、助词等非关联词,得到多个分词词语;之后,对该分词词语进行命名实体识别,即得到该目标企业的状态数据。
77.本实施例通过对目标企业的报告文本进行处理,得到目标企业的状态数据,实现了对目标企业状态数据的精确且高效的获取。
78.在本实施例的一些可选的实现方式中,上述获取所述参考指标的固有属性的步骤包括:
79.获取所述参考指标的指标名称、代码、版本、所属报表、状态和参数信息,将所述名称、代码、版本、报表名称、状态和参数信息作为所述参考指标的固有属性。
80.在本实施例中,在得到参考指标时,对每个参考指标进行溯源,找到每个参考指标对应的指标名称、代码、版本、所属报表、状态和参数信息。其中,参数信息还包括每个参考指标对应的值域、精度、长度、取值范围最大值和取值范围最小值等数值信息。将该指标名称、代码、版本、所属报表、状态和参数信息作为参考指标的固有属性。
81.本实施例通过指标名称、代码、版本、所属报表、状态和参数信息作为参考指标的固有属性,实现了对参考指标的精确表示,进一步提高了通过该参考指标构建目标指标图谱的准确性。
82.在本实施例的一些可选的实现方式中,上述根据所述固有属性确定所述参考指标之间的关联关系的步骤包括:
83.获取所述固有属性所属的分类属性,在所述分类属性为派生类型时,确定所述参考指标为派生指标;
84.获取所述派生指标的计算关系,根据所述计算关系确定所述派生指标的关联关系。
85.在本实施例中,获取固有属性的分类属性,该分类属性为每个参考指标的固有属性对应的预设划分类别,该预设划分类别可根据参考指标的数据源确定,若两个参考指标分属两个不同的数据源,且该两个数据源之间为父子关系,则该两个参考指标的分类属性为参考指标分别对应的数据源的类别属性。除此之外,该分类属性亦可通过参考指标关联的分类数据表确定,在对参考指标的分类属性进行获取时,从数据库中抽取分类数据表,从该分类数据表中查找到该固有属性对应的分类属性。根据该分类属性得到每个参考指标的关联关系,其中,分类属性在存储时为按照分类属性的层级关系进行存储的,因此,在得到
参考指标对应的分类属性时,根据该分类属性的所属层级即可确定参考指标之间的关联关系。
86.除了从预设的分类数据表中获取不同划分类别之间的关联关系,将该关联关系作为参考指标的关联关系以外,还可以通过在得到参考指标的分类属性时,获取该分类属性对应的标识,根据该标识确定该分类属性是否为派生类型。具体地,根据标识可以将分类属性划分为两种类型,一种为独立类型,另一种为派生类型;在参考指标的分类属性为独立类型时,即确定该参考指标为独立指标;在该参考指标的分类属性为派生类型时,即确定该参考指标为派生指标。若该参考指标为独立指标,则表示该参考指标与其他的参考指标之间无计算关系;若该参考指标为派生指标,则表示该参考指标与其他的参考指标之间存在计算关系。以总资产周转率=主营业务收入净额/资产总额为例,该“总资产周转率=主营业务收入净额/资产总额”即为“总资产周转率”该派生指标与其他参考指标“主营业务收入净额”和“资产总额”之间计算关系。根据该计算关系确定该派生指标的关联关系。
87.本实施例通过获取参考指标的固有属性,之后,根据固有属性的分类属性确定参考指标之间的关联关系,实现了对关联关系的精确获取,进一步提高了目标指标图谱构建的准确性。
88.在本实施例的一些可选的实现方式中,上述基于所述固有属性和所述关联关系对所述参考指标进行指标图谱构建操作,得到目标指标图谱的步骤包括:
89.基于所述固有属性和所述关联关系构建所述参考指标的三元组;
90.获取训练好的三元组评估模型,根据所述三元组评估模型对所述三元组进行置信度评估,得到所述三元组的评估值;
91.确定所述评估值是否大于等于预设阈值,在所述评估值大于等于所述预设阈值时,确定所述三元组验证通过,根据验证通过的三元组构建得到所述目标指标图谱。
92.在本实施例中,为了得到高质量的目标指标图谱,在基于固有属性和关联关系构建该目标指标图谱之前,获取参考指标对应的三元组,并对该三元组的置信度进行评估,将置信度高的三元组确定为验证通过的三元组;根据该验证通过的三元组建立对应的目标指标图谱。具体地,三元组为指标名称-关联关系-指标名称的表述,根据每个参考指标对应的固有属性中指标名称和关联关系,建立多个三元组。获取训练好的三元组评估模型,该三元组评估模型可采用知识图谱三元组置信度评估模型(knowledge graphtriple trustworthiness measurement model,kgttm),根据该三元组评估模型对输入的三元组进行评估,得到每个三元组对应的评估值。确定该评估值是否大于等于预设阈值,在该评估值大于等于预设阈值时,确定该三元组验证通过,基于该验证通过的三元组构建得到目标指标图谱;在该评估值小于预设阈值时,确定该三元组验证未通过。
93.本实施例通过三元组评估模型对三元组进行评估,使得通过三元组评估模型能够对三元组的质量进行校验,进一步提高目标指标图谱的生成质量。
94.在本实施例的一些可选的实现方式中,上述基于所述固有属性和所述关联关系构建所述参考指标的三元组的步骤包括:
95.根据所述固有属性计算所述参考指标和标准实体之间的文本相似度,比对所述文本相似度和预设相似度阈值;
96.在所述文本相似度大于等于所述预设相似度阈值时,根据所述标准实体对所述参
考指标进行消歧归一,得到目标指标;
97.基于所述目标指标和所述关联关系,构建所述三元组。在本实施例中,在建立参考指标对应的目标指标图谱之前,还可以对所有的参考指标进行消歧归一操作,以避免两个参考指标之间实体歧义造成的影响,从而提高目标指标图谱的生成质量。具体地,获取预设的余弦向量相似性模型,根据该余弦向量相似性模型计算参考指标对应的固有属性中指标名称和标准实体之间的文本相似度;其中,标准实体为预先采集的标准实体文本。比对该文本相似度和预设相似度阈值,在该文本相似度小于预设相似度阈值时,确定该参考指标和标准实体为不同的文本;在该文本相似度大于等于预设相似度阈值时,确定该参考指标和标准实体为相同的两个指标,将所有与该标准实体的文本相似度大于等于预设相似度阈值的参考指标,归一为同一个指标,即目标指标,该目标指标即为该标准实体。由此,即实现了对参考指标的消歧归一。基于该目标指标和关联关系,构建得到三元组。
98.本实施例通过对参考指标进行消歧归一,实现了对参考指标的筛选,避免了两个参考指标之间实体歧义造成的影响,进一步提高了目标指标图谱的生成质量。
99.在本实施例的一些可选的实现方式中,上述基于所述目标指标图谱查找得到与所述监控指标关联的所有关联指标的步骤包括:
100.确定所述监控指标的目标层级,在所述目标层级非最小级时,获取层级小于所述目标层级且与所述监控指标关联的疑似指标;
101.获取所述疑似指标的历史数据,计算所述疑似指标的当期数据与所述历史数据的差值,得到浮动范围;
102.在所述浮动范围大于等于预设范围时,确定所述疑似指标为所述关联指标。
103.在本实施例中,关联指标为与异常的监控指标关联的且存在异常波动的参考指标;在监控指标存在异常时,确定该监控指标的所属层级,其中,在对参考指标进行目标指标图谱的构建时,对于参考指标之间的关联关系为父子关系等从属关系的指标,其对应的层级应为上下级。该监控指标的所属层级即为目标层级。在该目标层级非最小级时,从该目标指标图谱中获取层级小于该目标层级且与该监控指标存在关联关系的所有参考指标,将层级小于该目标层级且与该监控指标存在关联关系的所有参考指标作为疑似指标;而后,获取该疑似指标的最近一次历史数据,计算该疑似指标的当期数据与其历史数据的差值,得到浮动范围;确定该浮动范围是否大于等于预设范围,在该浮动范围大于等于预设范围时,确定该疑似指标为该监控指标的关联指标。
104.本实施例通过获取监控指标的目标层级,根据该目标层级确定疑似指标,从而进一步找到关联指标,实现了对可能会对监控指标造成影响的指标的精确确定,提高了异常监控报告的准确性。
105.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,该计算机可读指令可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)等非易失性存储介质,或随机存储记忆体(random access memory,ram)等。
106.应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤
的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
107.进一步参考图3,作为对上述图2所示方法的实现,本技术提供了一种基于知识图谱的企业异常监控装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
108.如图3所示,本实施例所述的基于知识图谱的企业异常监控装置300包括:获取模块301、构建模块302、确认模块303以及生成模块304。其中:
109.获取模块301,用于采集目标企业的状态数据作为参考指标,获取所述参考指标的固有属性,根据所述固有属性确定所述参考指标之间的关联关系;
110.在本实施例的一些可选的实现方式中,获取模块301包括:
111.第一处理单元,用于获取所述目标企业的报告文本,对所述报告文本进行分词处理,得到多个分词词语;
112.识别单元,用于对所述分词词语进行实体识别,得到所述目标企业的状态数据。
113.在本实施例中,状态数据包括目标企业的内部状态数据和外部状态数据数据,通过该状态数据可以对企业的执行策略进行决策。例如,目标企业的外部状态数据则包括资产流动比率、存货周转率和企业利润等不同的数据;企业固有资产和企业人力等则为目标企业的内部状态数据。通过数据库或网络爬虫可以得到该目标企业的状态数据。在得到该状态数据时,将该状态数据作为参考指标,并获取该参考指标的固有属性,其中,固有属性为参考指标本身的固有标识属性,如名称、代码和版本等。根据该固有属性对应的划分类别对参考指标进行划分,得到不同参考指标之间的关联关系。具体地,不同的固有属性可能对应不同的划分类别也可能对应相同的划分类别,获取每个参考指标对应的划分类别,而后从预设的数据表中获取不同划分类别之间的层级关系;根据该不同划分类别对应的层级关系,即可确定不同划分类别下参考指标的关联关系,如指标的父子关系、总分关系等。
114.获取单元,用于获取所述参考指标的指标名称、代码、版本、所属报表、状态和参数信息,将所述名称、代码、版本、报表名称、状态和参数信息作为所述参考指标的固有属性。
115.在本实施例中,在得到参考指标时,对每个参考指标进行溯源,找到每个参考指标对应的指标名称、代码、版本、所属报表、状态和参数信息。其中,参数信息还包括每个参考指标对应的值域、精度、长度、取值范围最大值和取值范围最小值等数值信息。将该指标名称、代码、版本、所属报表、状态和参数信息作为参考指标的固有属性。
116.第一确认单元,用于获取所述固有属性所属的分类属性,在所述分类属性为派生类型时,确定所述参考指标为派生指标;
117.第二确认单元,用于获取所述派生指标的计算关系,根据所述计算关系确定所述派生指标的关联关系。
118.在本实施例中,获取固有属性的分类属性,该分类属性为每个参考指标的固有属性对应的预设划分类别,该预设划分类别可根据参考指标的数据源确定,若两个参考指标分属两个不同的数据源,且该两个数据源之间为父子关系,则该两个参考指标的分类属性为参考指标分别对应的数据源的类别属性。除此之外,该分类属性亦可通过参考指标关联
的分类数据表确定,在对参考指标的分类属性进行获取时,从数据库中抽取分类数据表,从该分类数据表中查找到该固有属性对应的分类属性。根据该分类属性得到每个参考指标的关联关系,其中,分类属性在存储时为按照分类属性的层级关系进行存储的,因此,在得到参考指标对应的分类属性时,根据该分类属性的所属层级即可确定参考指标之间的关联关系。
119.构建模块302,用于基于所述固有属性和所述关联关系对所述参考指标进行指标图谱构建操作,得到目标指标图谱;
120.在本实施例的一些可选的实现方式中,构建模块302包括:
121.第一构建单元,用于基于所述固有属性和所述关联关系构建所述参考指标的三元组;
122.评估单元,用于获取训练好的三元组评估模型,根据所述三元组评估模型对所述三元组进行置信度评估,得到所述三元组的评估值;
123.第二构建单元,用于确定所述评估值是否大于等于预设阈值,在所述评估值大于等于所述预设阈值时,确定所述三元组验证通过,根据验证通过的三元组构建得到所述目标指标图谱。
124.在本实施例的一些可选的实现方式中,第一构建单元包括:
125.第一计算单元,用于根据所述固有属性计算所述参考指标和标准实体之间的文本相似度,比对所述文本相似度和预设相似度阈值;
126.第二处理单元,用于在所述文本相似度大于等于所述预设相似度阈值时,根据所述标准实体对所述参考指标进行消歧归一,得到目标指标;
127.第三构建单元,用于基于所述目标指标和所述关联关系,构建所述三元组。
128.在本实施例中,在得到参考指标的固有属性和关联关系时,将该参考指标的固有属性中的指标名称作为该参考指标的实体名称,根据该实体名称和该关联关系通过图谱构建工具构建得到目标企业的目标指标图谱。
129.确认模块303,用于获取所述参考指标对应的数据库,从所述数据库获取所述目标企业的当期数据,根据所述当期数据确定监控指标是否存在异常,在所述监控指标存在异常时,基于所述目标指标图谱查找得到与所述监控指标关联的所有关联指标;
130.在本实施例的一些可选的实现方式中,确认模块303包括:
131.第三确认单元,用于确定所述监控指标的目标层级,在所述目标层级非最小级时,获取层级小于所述目标层级且与所述监控指标关联的疑似指标;
132.第二计算单元,用于获取所述疑似指标的历史数据,计算所述疑似指标的当期数据与所述历史数据的差值,得到浮动范围;
133.第四确认单元,用于在所述浮动范围大于等于预设范围时,确定所述疑似指标为所述关联指标。
134.在本实施例中,当期数据为目标企业的参考指标在当前阶段的数据信息,监控指标为目标企业预设的需要进行监控的指标数据。获取参考指标对应的数据库,从该数据库中获取目标企业的当期数据,根据该当期数据对监控指标进行监测,确定该监控指标是否存在异常。具体地,在获取到当期数据时,获取该当期数据中监控指标相比于最近一期的历史指标的浮动范围,在该浮动范围在预设范围内时,确定该监控指标不存在异常;在该浮动
范围不在该预设范围内时,确定该监控指标存在异常,确定该存在异常的监控指标为异常指标;根据目标指标图谱查找到与该异常指标关联的所有关联指标,该关联指标为在目标指标图谱中与异常指标存在关联关系,且存在异常波动的指标。在得到存在异常的监控指标时,从目标指标图谱中查找到与该异常指标存在关联关系的指标,之后,从该存在关联关系的指标中查找指标波动范围超过标准范围的指标,该指标即为与异常指标关联的关联指标。
135.生成模块304,用于将所述关联指标输入至目标图表模版中,得到所述目标企业的异常监控报告。
136.在本实施例中,在得到与存在异常的监控指标关联的所有关联指标时,根据该关联指标生成目标企业的异常监控报告。具体地,该异常监控报告由关联指标的波动情况组成,该关联指标的波动情况可通过报表或图表的形式展示;在得到与存在异常的监控指标关联的所有关联指标时,根据该关联指标的指标类型输入至对应类型的目标图表模版中,基于该目标图表模版生成对应的异常监控报告。除此之外,在得到异常监控报告之后,还可以根据该异常监控报告中关联指标的指标类型从存储的决策方案中选取最终的决策结果,并将该决策结果反馈至用户端的目标显示界面。
137.需要强调的是,为进一步保证上述异常监控报告的私密和安全性,上述异常监控报告还可以存储于一区块链的节点中。
138.本技术所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
139.本实施例提出的基于知识图谱的企业异常监控装置,实现了对指标以及其关联关系的快速溯源,使得通过该指标能够快速发现数据异常,提高了企业异常监控及定位的准确率和效率。
140.为解决上述技术问题,本技术实施例还提供计算机设备。具体请参阅图4,图4为本实施例计算机设备基本结构框图。
141.所述计算机设备6包括通过系统总线相互通信连接存储器61、处理器62、网络接口63。需要指出的是,图中仅示出了具有组件61-63的计算机设备6,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit,asic)、可编程门阵列(field-programmable gate array,fpga)、数字处理器(digital signal processor,dsp)、嵌入式设备等。
142.所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
143.所述存储器61至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访
问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器61可以是所述计算机设备6的内部存储单元,例如该计算机设备6的硬盘或内存。在另一些实施例中,所述存储器61也可以是所述计算机设备6的外部存储设备,例如该计算机设备6上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。当然,所述存储器61还可以既包括所述计算机设备6的内部存储单元也包括其外部存储设备。本实施例中,所述存储器61通常用于存储安装于所述计算机设备6的操作系统和各类应用软件,例如基于知识图谱的企业异常监控方法的计算机可读指令等。此外,所述存储器61还可以用于暂时地存储已经输出或者将要输出的各类数据。
144.所述处理器62在一些实施例中可以是中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器62通常用于控制所述计算机设备6的总体操作。本实施例中,所述处理器62用于运行所述存储器61中存储的计算机可读指令或者处理数据,例如运行所述基于知识图谱的企业异常监控方法的计算机可读指令。
145.所述网络接口63可包括无线网络接口或有线网络接口,该网络接口63通常用于在所述计算机设备6与其他电子设备之间建立通信连接。
146.本实施例提出的计算机设备,实现了对指标以及其关联关系的快速溯源,使得通过该指标能够快速发现数据异常,提高了企业异常监控及定位的准确率和效率。
147.本技术还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的基于知识图谱的企业异常监控方法的步骤。
148.本实施例提出的计算机可读存储介质,实现了对指标以及其关联关系的快速溯源,使得通过该指标能够快速发现数据异常,提高了企业异常监控及定位的准确率和效率。
149.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本技术各个实施例所述的方法。
150.显然,以上所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例,附图中给出了本技术的较佳实施例,但并不限制本技术的专利范围。本技术可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本技术的公开内容的理解更加透彻全面。尽管参照前述实施例对本技术进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本技术说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本技术专利保护范围之内。