本发明涉及数据分析,具体涉及一种面向电网的数据中台告警源定位方法及装置。
背景技术:
1、数据中台是指通过数据技术对海量数据进行采集、计算、存储和处理,同时统一标准和口径,形成全域级、可复用的数据资产中心和数据存储能力中心,形成大数据资产层,进而为客户提供高效的服务。
2、目前,价值数据被全面高质量实时采集,统一数据的标准和质量,跨越了数据孤岛,实现了数据共享。数据中台在日常运行中通过多种方式记录系统的运行状态,日志是系统在运行时信息记录的一种方式,一般以静态文本和自由文本组合的形式存储。日志中包含告警信息,反映了数据中台的模块运行异常。传统的告警信息处理方式是通过人工判定或专家系统判定的方式,识别告警数据间的关系,推断告警根因,难以支撑如今访问量庞大的电网数据中台运行,效率低,准确率也低。同时,传统的告警源定位方法基于各类大数据挖掘算法实现,难以适应电网的数据中台架构特点。因此,为了维护系统的正常运行,维护人员需要结合电网数据中台的特征,快速精准地定位告警源,实现智能的告警源定位。
技术实现思路
1、为了克服上述缺陷,本发明提出了一种面向电网的数据中台告警源定位方法及装置。
2、第一方面,提供一种面向电网的数据中台告警源定位方法,所述面向电网的数据中台告警源定位方法包括:
3、获取电网数据中台的告警特征信息;
4、在预先构建的关键告警特征信息关联规则库中获取包含所述告警特征信息的关键告警特征信息关联规则;
5、将关键告警特征信息关联规则中的起始告警特征信息作为告警源。
6、优选的,所述告警特征信息包括下述中的至少一种:告警时间、告警设备ip地址、告警类型、告警内容、告警所处业务。
7、优选的,所述获取电网数据中台的告警特征信息,包括:采用爬虫技术在电网数据中台的日志文件中抓取告警特征信息。
8、优选的,所述预先构建的关键告警特征信息关联规则库的获取过程包括:
9、基于各告警事件中相邻告警特征信息之间的相似性系数确定各告警事件的特征支持度;
10、将特征支持度超过预设阈值的告警事件作为频繁项;
11、获取频繁项中告警特征信息关联规则,并确定所述告警特征信息关联规则的特征置信度;
12、将特征置信度超过预设阈值的告警特征信息关联规则作为关键告警特征信息关联规则,并构建关键告警特征信息关联规则库;
13、其中,所述告警事件为一个时间窗口内的告警特征信息组成的集合。
14、进一步的,所述告警事件的特征支持度的计算式如下:
15、supportsim(x)=count(x)*sim(x)
16、上式中,supportsim(x)为告警事件x的特征支持度,count(x)为告警事件x的出现次数,sim(x)为告警事件x的相似性系数。
17、进一步的,所述告警事件x的相似性系数的计算式如下:
18、
19、上式中,sim(xi,i+1)为告警事件x中第i个告警特征信息与第i+1个告警特征信息之间的相似性系数,i为告警事件x中告警特征信息总数量。
20、进一步的,所述预设阈值的取值范围为0.5至0.9。
21、进一步的,所述获取频繁项中告警特征信息关联规则,包括:
22、获取频繁项中全部告警特征信息非空真子集;
23、将互补的告警特征信息非空真子集拼接得到的集合作为告警特征信息关联规则。
24、进一步的,所述告警特征信息关联规则的特征置信度的计算式如下:
25、
26、上式中,confidencesim(a)为告警特征信息关联规则a的特征置信度,a为由告警特征信息集合a和告警特征信息集合b拼接得到的告警特征信息关联规则,p(a)为告警特征信息关联规则a的发生概率,sim(a)为告警特征信息关联规则a的相似性系数,p(a)为告警特征信息集合a的发生概率,sim(a)为告警特征信息集合a的相似性系数。
27、第二方面,提供一种面向电网的数据中台告警源定位装置,所述面向电网的数据中台告警源定位装置包括:
28、获取模块,用于获取电网数据中台的告警特征信息;
29、第一分析模块,用于在预先构建的关键告警特征信息关联规则库中获取包含所述告警特征信息的关键告警特征信息关联规则;
30、第二分析模块,用于将关键告警特征信息关联规则中的起始告警特征信息作为告警源。
31、优选的,所述告警特征信息包括下述中的至少一种:告警时间、告警设备ip地址、告警类型、告警内容、告警所处业务。
32、优选的,所述获取模块具体用于:采用爬虫技术在电网数据中台的日志文件中抓取告警特征信息。
33、优选的,所述预先构建的关键告警特征信息关联规则库的获取过程包括:
34、基于各告警事件中相邻告警特征信息之间的相似性系数确定各告警事件的特征支持度;
35、将特征支持度超过预设阈值的告警事件作为频繁项;
36、获取频繁项中告警特征信息关联规则,并确定所述告警特征信息关联规则的特征置信度;
37、将特征置信度超过预设阈值的告警特征信息关联规则作为关键告警特征信息关联规则,并构建关键告警特征信息关联规则库;
38、其中,所述告警事件为一个时间窗口内的告警特征信息组成的集合。
39、进一步的,所述告警事件的特征支持度的计算式如下:
40、supportsim(x)=count(x)*sim(x)
41、上式中,supportsim(x)为告警事件x的特征支持度,count(x)为告警事件x的出现次数,sim(x)为告警事件x的相似性系数。
42、进一步的,所述告警事件x的相似性系数的计算式如下:
43、
44、上式中,sim(xi,i+1)为告警事件x中第i个告警特征信息与第i+1个告警特征信息之间的相似性系数,i为告警事件x中告警特征信息总数量。
45、进一步的,所述预设阈值的取值范围为0.5至0.9。
46、进一步的,所述获取频繁项中告警特征信息关联规则,包括:
47、获取频繁项中全部告警特征信息非空真子集;
48、将互补的告警特征信息非空真子集拼接得到的集合作为告警特征信息关联规则。
49、进一步的,所述告警特征信息关联规则的特征置信度的计算式如下:
50、
51、上式中,confidencesim(a)为告警特征信息关联规则a的特征置信度,a为由告警特征信息集合a和告警特征信息集合b拼接得到的告警特征信息关联规则,p(a)为告警特征信息关联规则a的发生概率,sim(a)为告警特征信息关联规则a的相似性系数,p(a)为告警特征信息集合a的发生概率,sim(a)为告警特征信息集合a的相似性系数。
52、第三方面,提供一种计算机设备,包括:一个或多个处理器;
53、所述处理器,用于存储一个或多个程序;
54、当所述一个或多个程序被所述一个或多个处理器执行时,实现所述的面向电网的数据中台告警源定位方法。
55、第四方面,提供一种计算机可读存储介质,其上存有计算机程序,所述计算机程序被执行时,实现所述的面向电网的数据中台告警源定位方法。
56、本发明上述一个或多个技术方案,至少具有如下一种或多种有益效果:
57、本发明提供了一种面向电网的数据中台告警源定位方法及装置,包括:获取电网数据中台的告警特征信息;在预先构建的关键告警特征信息关联规则库中获取包含所述告警特征信息的关键告警特征信息关联规则;将关键告警特征信息关联规则中的起始告警特征信息作为告警源。本发明提供的技术方案能够充分结合电网数据中台的实际架构特点,从数据模块的功能性出发,补充关联规则的识别依据,提高告警源定位的准确性和效率。