一种服务器告警库更新方法、装置、电子设备及存储介质与流程

文档序号:24197398发布日期:2021-03-09 18:23阅读:85来源:国知局
一种服务器告警库更新方法、装置、电子设备及存储介质与流程

1.本发明涉及服务器技术领域,尤其是涉及一种服务器告警库更新方法、装置、电子设备及存储介质。


背景技术:

2.在云计算大行其道的时代,服务器的需求量与日俱增,大量服务器长时间不间断的运行必然导致故障率的提升,快速的发现并处理故障成为一种难以解决的问题。针对服务器的故障甄别,需要依赖服务器的告警规则库,随着时间的推移,大规模或者不同品牌及系统的服务器可能产生不同信息的故障告警。而告警规则库的维护是一个长期而繁杂的工作,绝大多数的告警规则库的维护,需要依赖人工处理。所以,目前服务器告警规则库的维护效率较低。


技术实现要素:

3.本发明的目的在于提供一种服务器告警库更新方法、装置、电子设备以及存储介质,缓解了现有技术中存在的服务器告警库更新效率较低的技术问题。
4.第一方面,本发明提供的服务器告警库更新方法,包括以下步骤:
5.获取服务器节点的故障信息;
6.将故障信息进行解析分词,并获得临时关键词;
7.计算临时关键词的频繁系数;
8.判断频繁系数是否达到预设阈值;
9.若是,则将临时关键词作为原始关键词放入告警库。
10.进一步的,所述将临时关键词作为原始关键词放入告警库的步骤之后,还包括:
11.记录关联的原始关键词的故障系数。
12.进一步的,所述获取服务器节点的故障信息的步骤,具体包括:
13.将故障收集命令发送至服务器节点,使服务器节点根据命令采集故障信息;
14.接收来自服务器节点的故障信息。
15.进一步的,所述获取服务器节点的故障信息的步骤,具体包括:
16.将日志配置命令发送至服务器节点,使服务器节点将日志接收地址设置为管理中心的ip地址;
17.管理中心获取日志上传的故障信息。
18.进一步的,所述服务器告警库更新方法,还包括:
19.创建初始的告警库;
20.所述告警库包括包含故障的原始关键词以及对应的故障系数。
21.进一步的,所述计算临时关键词的频繁系数的步骤,具体包括:
22.从初始的告警库中获取原始关键词;
23.记录原始关键词与临时关键词同时出现的故障信息;
24.根据原始关键词与临时关键词计算每项故障信息的支持度与置信度;
25.若所述故障信息的支持度与置信度同时大于对应的预设阈值,则记录为一次频繁系数。
26.第二方面,本发明还提供一种服务器告警库更新装置,包括:
27.收集模块,用于获取服务器节点的故障信息;
28.分词模块,用于将故障信息进行解析分词,并获得临时关键词;
29.统计模块,用于计算临时关键词的频繁系数;
30.决策模块,用于判断频繁系数是否达到预设阈值;
31.执行模块,用于将临时关键词作为原始关键词放入告警库。
32.第三方面,本发明还提供一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的方法的步骤。
33.第四方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上一项所述的方法。
34.本发明提供的服务器告警库更新方法通过收集故障信息,对故障信息进行解析分词,提取临时关键词,并根据临时关键词计算频繁系数,当频繁系数大于预设阈值时,即将临时关键词添加到告警库中,通过上述步骤,完成对故障信息的自动解析,将新出现的问题的关键词添加到告警库中,避免了人工进行添加,提升告警库的维护效率,极大的降低维护成本,减小人力的消耗。
35.相应地,本发明实施例提供的一种服务器告警库更新装置、电子设备及计算机可读存储介质,也同样具有上述技术效果。
附图说明
36.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
37.图1为本发明实施例提供的服务器告警库更新方法流程图;
38.图2为本发明实施例提供的服务器告警库更新方法详细流程图;
39.图3为本发明实施例提供的服务器告警库更新装置示意图。
具体实施方式
40.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
41.本发明实施例中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定
于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
42.如图1所示,本发明实施例提供一种服务器告警库更新方法,包括以下步骤:
43.s11:获取服务器节点的故障信息;
44.s12:将故障信息进行解析分词,并获得临时关键词;
45.s13:计算临时关键词的频繁系数;
46.s14:判断频繁系数是否达到预设阈值,若是,则执行步骤s15,反之则执行步骤s16;
47.s15:将临时关键词作为原始关键词放入告警库;
48.s16:结束进程。
49.本发明实施例提供的服务器告警库更新方法通过收集故障信息,对故障信息进行解析分词,提取临时关键词,并根据临时关键词计算频繁系数,当频繁系数大于预设阈值时,即将临时关键词添加到告警库中,通过上述步骤,完成对故障信息的自动解析,将新出现的问题的关键词添加到告警库中,避免了人工进行添加,提升告警库的维护效率,极大的降低维护成本,减小人力的消耗。
50.如图1所示,在一种可能的实施方式中,所述将临时关键词作为原始关键词放入告警库的步骤之后,还包括:
51.s17:记录关联的原始关键词的故障系数。
52.记录关联的故障系数后,后续再次执行更新方法的步骤时,即将本次的临时关键词作为原始关键词参与关联规则计算。
53.如图2所示,在一种可能的实施方式中,所述步骤s11具体包括:
54.s2111:将故障收集命令发送至服务器节点,使服务器节点根据命令采集故障信息;
55.s2112:接收来自服务器节点的故障信息。
56.通过上述方式,管理中心可以主动的获取服务器的故障信息。
57.如图2所示,在一种可能的实施方式中,所述步骤s11具体包括:
58.s2121:将日志配置命令发送至服务器节点,使服务器节点将日志接收地址设置为管理中心的ip地址;
59.s2122:管理中心获取日志上传的故障信息。
60.通过上述的方式,更改日志的接收地址后,日志上传时可以将故障信息直接发送至管理中心,这种被动式的接收也可以直接获取故障信息,且无需再发出主动获取命令。
61.如图2所示,在一种可能的实施方式中,所述服务器告警库更新方法,还包括:
62.s201:创建初始的告警库;
63.所述告警库包括包含故障的原始关键词以及对应的故障系数。
64.在初始的告警库中,包含了原始关键词以及对应的故障系数,这些数据是最常出现的故障信息的关键词,作为后续告警库更新数据的数据基础,为后续的计算提供数据依据。
65.如图2所示,在一种可能的实施方式中,所述步骤s13具体包括:
66.s231:从初始的告警库中获取原始关键词;
67.s232:记录原始关键词与临时关键词同时出现的故障信息;
68.s233:根据原始关键词与临时关键词计算每项故障信息的支持度与置信度;
69.s234:判断支持度与置信度是否同时大于对应的阈值,若是,则执行步骤s235,反之则执行步骤s236;
70.s235:为所述临时关键词记录一次频繁系数。
71.s236:结束进程。
72.通过上述的方式,可以很直接的计算出每一个与原始关键词同时出现的临时关键词的频繁系数,为后续是否将临时关键词添加到告警库提供频繁系数的数据基础。
73.本发明实施例提供的服务器告警库更新方法,具体实施方式如下:
74.首先需要创建初始服务器告警规则库以及临时规则库,服务器告警库包含故障的原始关键词以及对应的故障严重程度系数。
75.执行采集信息的步骤,导入个服务器节点带内(管理控制信息与数据信息使用统一物理通道进行传送)ip地址,自动定时下发故障收集命令到各服务器节点。
76.服务器接地那执行故障采集的命令,并将结果发送至管理中心,即可以完成主动故障采集。
77.将带内、带外(核心理念在于通过不同的物理通道传送管理控制信息和数据信息,独立于带内网络之外的专用管理通道,两者完全独立,互不影响)日志接收地址设置为管理中心所在的服务器ip。
78.管理中心接收日志上传的故障信息,即可以完成被动故障采集。
79.将故障信息进行解析,录入分词去除磁性,包括连词、叹词、助词以及标点等。
80.从告警库中获取原始关键词,依据录入的去除词词性对接收到的故障信息进行分词解析,同时将分词得到的临时关键词与出现的原始关键词保存为一项,以单次故障为单位,保存为一个项集。以2项集为例,每一项包含原始关键词与临时关键词,若以k项集为例,则每一项包含1个原始关键词与k-1个临时关键词。
81.若为k(k>2)项集时,可采用apriori算法获取新增关键词,步骤如下:
82.a:找出出现频率最大的一个项l1;
83.b:根据l1找频繁“2项集”的集合c2;
84.c:从c2中去除不满足支持度β的项得到l2;
85.d:根据l2找频繁“3项集”的集合c3;
86.e:根据支持度β进行去除得到l3;
87.f:循环上述过程,直到得到空集c,即直到不能发现更大的频集l;
88.g:计算最大频集l的非空子集,两两计算置信度,得到满足置信度γ的强关联规则。
89.设定α=10,δ=100,β=0.6,γ=0.8,分别为故障信息接收次数,转换为原始关键词的故障信息次数,关联规则的支持度,关联规则的置信度。
90.设当前原始关键词的个数为n,第一个原始关键词记为o1,其故障系数记为f1,第n个记为o
n
和f
n
,临时关键词记录为p1,p2,
……
p
n

91.第一次接收到故障信息时,若原始关键词与临时关键词同时出现,则纪录为一项(每组必然包含一个原始关键词与临时关键词),如下所示,记录出现o和p组合,只记录出现
过的o的组合即可,以2项集为例:
92.{o1,p1},{o2,p2},
……
{o
n
,p
n
}
93.当接收到a次故障信息后,a若为α的倍数,以单次接收到的故障信息记录的项作为一个项集,计算第a次后,每个关联规则支持度s;
94.s(o
n
,p
n
)=f(o
n
∩p
n
)/a
95.f(o
n
∩p
n
)(frequency)为原始关键词与临时关键词同时出现的次数;
96.同时计算每项相对于原始关键词的置信度c;
97.c=f(o
n
∩p
n
)/f(o
n
)
98.f为(o
n
)为o
n
出现的次数;
99.若(s>β)且(c>γ),则记录一次频繁系数次数,当解析的故障信息次数n满足α<n<δ,且(s>β)且(c>γ)时,将临时关键词放入临时规则库中;当解析的故障信息次数n=δ时,将临时关键词放入告警库,转换为原始关键词,并录入关联的原始关键词故障系数,并删除临时规则库中临时关键词。
100.如图3所示,本发明实施例还提供一种服务器告警库更新装置,包括:
101.收集模块1,用于获取服务器节点的故障信息;
102.分词模块2,用于将故障信息进行解析分词,并获得临时关键词;
103.统计模块3,用于计算临时关键词的频繁系数;
104.决策模块4,用于判断频繁系数是否达到预设阈值;
105.执行模块5,用于将临时关键词作为原始关键词放入告警库。
106.对应于上述方法,本发明实施例还提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项方法的步骤。
107.对应于上述方法,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述方法的步骤。
108.本发明实施例所提供的装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
109.在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基
于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
110.又例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,再例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
111.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
112.另外,在本发明提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
113.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等各种可以存储程序代码的介质。
114.最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1