系统层进程的检测方法、装置、设备及可读存储介质与流程

文档序号:34072166发布日期:2023-05-06 19:20阅读:21来源:国知局
系统层进程的检测方法、装置、设备及可读存储介质与流程

本发明涉及进程监控,具体涉及一种系统层进程的检测方法、装置、设备及可读存储介质。


背景技术:

1、分布式存储软件通常部署在操作系统(operating system,os)的系统层,os的健康状态对于分布式存储软件的运行状态和集群健康状态起到关键性因素。分布式存储软件能够提供分布式冗余模式来提高系统高可用,其对于os的系统层的进程监控亦至关重要。

2、然而,现有的as13000等分布式存储软件报警器只有在发生系统资源耗尽等宕机问题时才会触发系统报警提醒维护人员介入分析,其难以对os的系统层的进程监控,由此严重影响了分布式存储系统的运行稳定性。


技术实现思路

1、有鉴于此,本发明实施例提供了一种系统层进程的检测方法、装置、设备及可读存储介质,以解决难以系统层进程进行检测的问题。

2、根据第一方面,本发明实施例提供了一种系统层进程的检测方法,包括:检测分布式存储系统中的系统层进程,确定系统层进程的运行状态参数;判断所述运行状态参数是否存在异常;当所述运行状态参数存在异常时,发出告警信息。

3、本发明实施例提供的系统层进程的检测方法,通过检测分布式存储系统中针对于系统层进程的运行状态参数,当检测到运行状态参数存在异常时,及时发出告警信息,由此能够对系统层进程进行实时监控,便于进行有效运维,避免出现宕机,保证了存储系统的运行稳定性。

4、结合第一方面,在第一方面的第一实施方式中,所述运行状态参数包括进程总数量,所述判断所述运行状态参数是否存在异常,包括:判断所述进程总数量是否超过预设数量阈值;当所述进程总数量超过所述预设数量阈值时,判定所述运行状态参数存在异常。

5、本发明实施例提供的系统层进程的检测方法,在进程总数量超过预设数量阈值时,判定运行参数异常,继而发出告警信息,由此能够避免进程数量异常增加而导致资源耗尽的现象,从而进一步避免了因资源耗尽而引起的宕机。

6、结合第一方面第一实施方式,在第一方面的第二实施方式中,当所述运行状态参数存在异常时,发出告警信息,包括:对比所述进程总数量以及所述预设数量阈值,确定所述进程总数量超出所述预设数量阈值的数值;基于所述数值所处的目标范围,确定相应的告警级别;发出与所述告警级别相对应的告警信息。

7、本发明实施例提供的系统层进程的检测方法,通过进程总数量的超出预设数量阈值的数据所处目标范围,确定相应的告警级别,能够实现精准告警,便于维护人员根据告警级别进行有效运维。

8、结合第一方面,在第一方面的第三实施方式中,所述运行状态参数包括进程名称,所述判断所述运行状态参数是否存在异常,包括:获取所述系统层进程的名称;判断所述系统层进程的名称是否处于进程白名单;当所述系统层进程的名称未处于所述进程白名单时,判定所述运行状态参数存在异常。

9、本发明实施例提供的系统层进程的检测方法,通过设定进程白名单以对运行中的系统层进程进行筛选,避免异常进程侵入或无用进程占用系统资源。

10、结合第一方面第三实施方式,在第一方面的第四实施方式中,在所述当所述运行状态参数存在异常时,发出告警信息之后,还包括:当所述系统层进程为正常进程时,响应于对所述进程白名单的编辑操作,基于所述编辑操作将所述系统层进程的名称添加至所述进程白名单。

11、本发明实施例提供的系统层进程的检测方法,支持进程白名单的编辑,在确定出当前未处于进程白名单的系统层进程为正常进程时,可以通过编辑进程白名单将该系统层进程添加至进程白名单,保证了正常进程的运转。

12、结合第一方面,在第一方面的第五实施方式中,所述运行状态参数包括内存用量,所述判断所述运行状态参数是否存在异常,包括:判断所述内存用量是否超过预设用量阈值;当所述内存用量超过所述预设用量阈值时,判定所述运行状态参数存在异常。

13、本发明实施例提供的系统层进程的检测方法,通过检测内存用量,在内存用量超限时,判定运行参数异常,继而发出告警信息,由此能够避免内存持续上升而导致重启,从而进一步避免了因重启而引起的宕机。

14、结合第一方面或第一方面第一实施方式至第五实施方式中的任一实施方式,在第一方面的第六实施方式中,所述检测分布式存储系统中的系统层进程,确定所述系统层进程的运行状态参数,包括:获取所述系统层进程的检测周期;按照所述检测周期拉取所述系统层进程的运行状态参数。

15、本发明实施例提供的系统层进程的检测方法,按照系统层进程的检测周期进行运行状态参数的拉取,由此能够最大程度上实现对于系统层进程的实时监控,便于及时发现异常情况而进行规避。

16、根据第二方面,本发明实施例提供了一种系统层进程的检测装置,包括:检测模块,用于检测分布式存储系统中的系统层进程,确定系统层进程的运行状态参数;判断模块,用于判断所述运行状态参数是否存在异常;告警模块,用于当所述运行状态参数存在异常时,发出告警信息。

17、根据第三方面,本发明实施例提供了一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面或第一方面任一实施方式所述的系统层进程的检测方法。

18、根据第四方面,本发明实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行第一方面或第一方面任一实施方式所述的系统层进程的检测方法。

19、需要说明的是,本发明实施例提供的系统层进程的检测装置、电子设备以及计算机可读存储介质的相应有益效果,请参见系统层进程的检测方法中相应内容的描述,在此不再赘述。



技术特征:

1.一种系统层进程的检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述运行状态参数包括进程总数量,所述判断所述运行状态参数是否存在异常,包括:

3.根据权利要求2所述的方法,其特征在于,当所述运行状态参数存在异常时,发出告警信息,包括:

4.根据权利要求1所述的方法,其特征在于,所述运行状态参数包括进程名称,所述判断所述运行状态参数是否存在异常,包括:

5.根据权利要求4所述的方法,其特征在于,在所述当所述运行状态参数存在异常时,发出告警信息之后,还包括:

6.根据权利要求1所述的方法,其特征在于,所述运行状态参数包括内存用量,所述判断所述运行状态参数是否存在异常,包括:

7.根据权利要求1-6任一项所述的方法,其特征在于,所述检测分布式存储系统中的系统层进程,确定所述系统层进程的运行状态参数,包括:

8.一种系统层进程的检测装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行权利要求1-7任一项所述的系统层进程的检测方法。


技术总结
本发明涉及进程监控技术领域,公开了一种系统层进程的检测方法、装置、设备及可读存储介质。其中,该方法包括:检测分布式存储系统中的系统层进程,确定系统层进程的运行状态参数;判断运行状态参数是否存在异常;当运行状态参数存在异常时,发出告警信息。通过实施本发明,能够对系统层进程进行实时监控,便于进行有效运维,避免出现宕机,保证了存储系统的运行稳定性。

技术研发人员:赵晋磊
受保护的技术使用者:苏州浪潮智能科技有限公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1