本技术涉及网络运维,特别涉及一种告警处理方法、装置及相关设备。
背景技术:
1、目前,sd-wan(software defined networking in a wide area network,软件定义网络)已经成为当前业界的焦点。sd-wan的引入不仅能简化网络管理和部署,还可以降低人力服务成本和专线费用。然而,随着sd-wan场景的扩大,网络规模、网元数和链路数急剧增加,导致告警数量成指数级增长。尤其在网络振荡时,不断产生的告警给客户带来了极大的困扰,难以承受。
2、那么,如何解决网络振荡时告警海量发送的问题,成为目前亟待解决的问题。
技术实现思路
1、本技术提供了一种告警处理方法、装置及相关设备。
2、第一方面,本技术提供了一种告警处理方法,所述方法包括:
3、基于目标设备的网络质量参数,计算所述目标设备的当前健康度分值;
4、判断所述当前健康度分值是否大于设定阈值,其中,所述当前健康度分值用于表征所述目标设备当前的告警振荡程度,所述当前健康度分值越大,所述目标设备当前的告警振荡程度越低,所述当前健康度分值越小,所述目标设备当前的告警振荡程度越高;
5、若判定所述目标告警源的当前健康度分值不大于设定阈值,则抑制所述目标设备的告警事件。
6、可选地,所述目标设备的网络质量参数包括链路的时延、抖动、丢包率、带宽利用率、应用选路变化。
7、可选地,针对所述目标设备设置有健康度初始分值,针对每一维度网络质量参数设置有对应的时间窗口和健康度加减分规则;
8、基于目标设备的网络质量参数,计算所述目标设备的当前健康度分值的步骤包括:
9、针对每一维度的网络参数质量,若确定该维度的网络质量参数在当前时间窗口内产生了对应的告警事件和告警恢复,则基于该维度的网络质量参数对应的减分规则对所述目标设备的当前健康度分值进行减分处理;若确定该维度的网络质量参数在当前时间窗口内未产生对应的告警事件,则基于该维度的网络质量参数对应的加分规则对所述目标设备的当前健康度分值进行加分处理。
10、可选地,基于该维度的网络质量参数对应的减分规则对所述目标设备的当前健康度分值进行减分处理的步骤包括:
11、计算该维度的网络质量参数在当前时间窗口内产生的告警事件和告警恢复的时间间隔;
12、根据所述时间间隔的值,确定对所述目标设备的当前健康度分值进行减分的减分参考值,其中,时间间隔的值越小,减分参考值越大;
13、将所述减分参考值和针对该维度的网络质量参数设置的权重值的乘积作为具体减分值;
14、将所述目标设备的当前健康度分值与所述具体减分值之差值作为最新的当前健康度分值,并重置该维度的网络质量参数对应的时间窗。
15、可选地,基于该维度的网络质量参数对应的加分规则对所述目标设备的当前健康度分值进行加分处理的步骤包括:
16、确定对所述目标设备的当前健康度分值进行加分的加分参考值;
17、将所述加分参考值和针对该维度的网络质量参数设置的权重值的乘积作为具体加分值;
18、将所述目标设备的当前健康度分值与所述具体加分值之和值作为最新的当前健康度分值,并重置该维度的网络质量参数对应的时间窗。
19、可选地,抑制所述目标设备的告警事件的步骤包括:
20、向所述目标设备发送停止发送告警事件对应的trap消息的指令;或者,
21、接收到所述目标设备发送的告警事件对应的trap消息后,不对接收到的trap消息进行告警生成处理。
22、第二方面,本技术提供了一种告警处理装置,所述装置包括:
23、计算单元,用于基于目标设备的网络质量参数,计算所述目标设备的当前健康度分值;
24、判断单元,用于判断所述当前健康度分值是否大于设定阈值,其中,所述当前健康度分值用于表征所述目标设备当前的告警振荡程度,所述当前健康度分值越大,所述目标设备当前的告警振荡程度越低,所述当前健康度分值越小,所述目标设备当前的告警振荡程度越高;
25、抑制单元,若所述判断单元判定所述目标告警源的当前健康度分值不大于设定阈值,则所述抑制单元用于,抑制所述目标设备的告警事件。
26、可选地,所述目标设备的网络质量参数包括链路的时延、抖动、丢包率、带宽利用率、应用选路变化。
27、可选地,针对所述目标设备设置有健康度初始分值,针对每一维度网络质量参数设置有对应的时间窗口和健康度加减分规则;
28、基于目标设备的网络质量参数,计算所述目标设备的当前健康度分值时,所述计算单元具体用于:
29、针对每一维度的网络参数质量,若确定该维度的网络质量参数在当前时间窗口内产生了对应的告警事件和告警恢复,则基于该维度的网络质量参数对应的减分规则对所述目标设备的当前健康度分值进行减分处理;若确定该维度的网络质量参数在当前时间窗口内未产生对应的告警事件,则基于该维度的网络质量参数对应的加分规则对所述目标设备的当前健康度分值进行加分处理。
30、可选地,基于该维度的网络质量参数对应的减分规则对所述目标设备的当前健康度分值进行减分处理时,所述计算单元具体用于:
31、计算该维度的网络质量参数在当前时间窗口内产生的告警事件和告警恢复的时间间隔;
32、根据所述时间间隔的值,确定对所述目标设备的当前健康度分值进行减分的减分参考值,其中,时间间隔的值越小,减分参考值越大;
33、将所述减分参考值和针对该维度的网络质量参数设置的权重值的乘积作为具体减分值;
34、将所述目标设备的当前健康度分值与所述具体减分值之差值作为最新的当前健康度分值,并重置该维度的网络质量参数对应的时间窗。
35、可选地,基于该维度的网络质量参数对应的加分规则对所述目标设备的当前健康度分值进行加分处理时,所述计算单元具体用于:
36、确定对所述目标设备的当前健康度分值进行加分的加分参考值;
37、将所述加分参考值和针对该维度的网络质量参数设置的权重值的乘积作为具体加分值;
38、将所述目标设备的当前健康度分值与所述具体加分值之和值作为最新的当前健康度分值,并重置该维度的网络质量参数对应的时间窗。
39、可选地,抑制所述目标设备的告警事件时,所述抑制单元具体用于:
40、向所述目标设备发送停止发送告警事件对应的trap消息的指令;或者,
41、接收到所述目标设备发送的告警事件对应的trap消息后,不对接收到的trap消息进行告警生成处理。
42、第三方面,本技术实施例提供一种告警处理装置,该告警处理装置包括:
43、存储器,用于存储程序指令;
44、处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行如上述第一方面中任一项所述的方法的步骤。
45、第四方面,本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行如上述第一方面中任一项所述方法的步骤。
46、综上可知,本技术实施例提供的告警处理方法,基于目标设备的网络质量参数,计算所述目标设备的当前健康度分值;判断所述当前健康度分值是否大于设定阈值,其中,所述当前健康度分值用于表征所述目标设备当前的告警振荡程度,所述当前健康度分值越大,所述目标设备当前的告警振荡程度越低,所述当前健康度分值越小,所述目标设备当前的告警振荡程度越高;若判定所述目标告警源的当前健康度分值不大于设定阈值,则抑制所述目标设备的告警事件。
47、采用本技术实施例提供的告警处理方法,通过判断告警源的当前健康度值,来确定是否需要对告警源的后续告警事件进行抑制,若某一告警源在多个维度(比如链路的时延、抖动、丢包率、带宽利用率等)产生了振荡,系统会抑制其他告警的产生,以防止持续不断的告警对管理员造成不便,显著减少了告警源振荡阶段产生的告警数量,控制器无需为处理这种异常情况而提供额外的计算和存储资源。该优化措施在提高系统性能的同时,还有效降低了系统处理异常情况所需的资源消耗。