一种集群告警方法、装置、设备及介质与流程

文档序号:36175158发布日期:2023-11-24 23:48阅读:88来源:国知局
一种集群告警方法与流程

本发明涉及计算机,尤其涉及一种集群告警方法、装置、设备及介质。


背景技术:

1、近些年来,随着互联网开放环境,一些非法软件能够绕过防火墙,或者利用管理上的一些失误对信息进行篡改或窃取。与此同时还可以利用计算机的电磁波来窃取和篡改信息。信息窃取者可以搜集计算机工作时传播的电磁波,获得更加准确和及时的信息。非法获取信息的方式很难被管理员所察觉。这就要求大型企业等重要的部门在使用计算机时必须使用屏蔽设备。在存储信息时必然会使用到一些存储设备,例如移动硬盘、u盘、光盘等等,这些设备不仅具有较快的复制速度、携带较为方便,而且可以消除复制的痕迹,并且对被销毁的数据进行重建,严重的威胁到了数据的安全。

2、目前很多用户生产环境应用运行在数据中心专网或内网段,目前很多攻击发生在内网中,在实际应用中,往往因为运维人员使用不规范等原因导致个人u盘公用或者工作u盘私用,或者点击了木马链接,导致病毒趁机进入某个系统,目前在很多生产环境中,业务运行在非常多的内网虚拟机上,并且相互之间免密登录,也就是说一旦病毒攻陷一台主机,就可以迅速蔓延到其他主机上,从而整个集群全部中招。


技术实现思路

1、有鉴于此,有必要针对以上技术问题,提供一种集群告警方法、装置、设备及介质。

2、根据本发明的第一方面,提供了一种集群告警方法,所述方法包括:

3、将集群中的每个节点均设置为持续使用预设算法计算系统危险值;

4、响应于某个节点对应的系统危险值超过第一预设系统危险值,则将系统危险值写入所述某个节点的告警文件中;

5、遍历查看所有节点的告警文件,以获取已记录有系统危险值的所有告警文件的文件数量;

6、响应于所述文件数量超过预设文件数量,则隔离所有记录有系统危险值的告警文件对应的系统,并向管理员发出告警。

7、在一些实施例中,所述将集群中的每个节点均设置为持续使用预设算法计算系统危险值的步骤,包括:

8、以预设时间为间隔执行所述预设算法以得到系统危险值;

9、响应于预设条件被触发,则执行所述预设算法以得到系统危险值。

10、在一些实施例中,所述预设算法包括对每个节点的系统执行以下操作:

11、根据当前时刻所有进程中占用资源量获取十个进程;

12、将所获取的十个进程分别与预设进程与熵值赋值策略对应关系进行匹配,以得到与每个进程对应的熵值赋值策略;

13、利用每个进程对应的熵值赋值策略进行赋值,以得到与每个进程对应的熵值;

14、将所得到的熵值代入下述公式以得到系统危险值:

15、valuei=rand(valueuser)+5*rand(valueprocess)+3*rand(valuecpu)+2*rand(valuemem);

16、其中,公式中valuei表示系统危险值;rand(valueuser)表示使用新增账号进程对应的熵值赋值策略得到的熵值,rand(valueprocess)表示使用特殊进程对应的熵值赋值策略得到的熵值,rand(valuecpu)表示使cpu占用突然增加到90%的进程对应的熵值赋值策略得到的熵值,rand(valuemem)表示使内存占用突然增高到50%的进程对应的熵值赋值策略得到的熵值。

17、在一些实施例中,所述根据当前时刻所有进程中占用资源量获取十个进程的步骤,包括:

18、获取系统当前所有进程的cpu占用率;

19、按照cpu占用率由大到小进行排序,并获取序列中的前十个进程。

20、在一些实施例中,所述根据当前时刻所有进程中占用资源量获取十个进程的步骤,包括:

21、获取系统当前所有进程的内存占用率;

22、按内存占用率由大到小进行排序,并获取序列中的前十个进程。

23、在一些实施例中,所述方法还包括:

24、响应于遍历查看告警文件的过程中某个节点的告警文件中存在超过第二预设系统危险值的记录,则立即向管理员发出告警,将所述某个节点系统状态设置为危险并封锁系统,其中,所述第二预设系统危险值大于所述第一预设系统危险值。

25、在一些实施例中,所述方法还包括:

26、响应于接收到管理员的解封指示,则对节点的系统进行解封。

27、根据本发明的第二方面,提供了一种集群告警装置,所述装置包括:

28、计算模块,所述计算模块配置用于将集群中的每个节点均设置为持续使用预设算法计算系统危险值;

29、写入模块,所述写入模块配置用于响应于某个节点对应的系统危险值超过第一预设系统危险值,则将系统危险值写入所述某个节点的告警文件中;

30、查看模块,所述查看模块配置用于遍历查看所有节点的告警文件,以获取已记录有系统危险值的所有告警文件的文件数量;

31、告警模块,所述告警模块配置用于响应于所述文件数量超过预设文件数量,则隔离所有记录有系统危险值的告警文件对应的系统,并向管理员发出告警。

32、根据本发明的第三方面,还提供了一种电子设备,该电子设备包括:

33、至少一个处理器;以及

34、存储器,存储器存储有可在处理器上运行的计算机程序,处理器执行程序时执行前述的集群告警方法。

35、根据本发明的第四方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时执行前述的集群告警方法。

36、上述一种集群告警方法,通过在集群的每个节点部署预设算法用以计算系统危险值,进而在系统危险值超过第一预设系统危险值时写入到节点的告警文件中,然后遍历查看所有节点的告警文件,记录有系统危险值的告警文件的文件数量超过设定值后向管理员发出报警,实现了自动评估集群中节点的系统健康状态,并自动触发异常预警,极大的提升了异常发现和解决的效率,显著提升集群的安全性、稳定性。

37、此外,本发明还提供了一种集群告警装置、一种电子设备和一种计算机可读存储介质,同样能实现上述技术效果,这里不再赘述。



技术特征:

1.一种集群告警方法,其特征在于,所述方法包括:

2.根据权利要求1所述的集群告警方法,其特征在于,所述将集群中的每个节点均设置为持续使用预设算法计算系统危险值的步骤,包括:

3.根据权利要求1或2所述的集群告警方法,其特征在于,所述预设算法包括对每个节点的系统执行以下操作:

4.根据权利要求3所述的集群告警方法,其特征在于,所述根据当前时刻所有进程中占用资源量获取十个进程的步骤,包括:

5.根据权利要求3所述的集群告警方法,其特征在于,所述根据当前时刻所有进程中占用资源量获取十个进程的步骤,包括:

6.根据权利要求1所述的集群告警方法,其特征在于,所述方法还包括:

7.根据权利要求6所述的集群告警方法,其特征在于,所述方法还包括:

8.一种集群告警装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时执行权利要求1-7任意一项所述的方法。


技术总结
本发明涉及计算机技术领域,尤其涉及一种集群告警方法、装置、设备及介质。所述方法包括:将集群中的每个节点均设置为持续使用预设算法计算系统危险值;响应于某个节点对应的系统危险值超过第一预设系统危险值,则将系统危险值写入所述某个节点的告警文件中;遍历查看所有节点的告警文件,以获取已记录有系统危险值的所有告警文件的文件数量;响应于所述文件数量超过预设文件数量,则隔离所有记录有系统危险值的告警文件对应的系统,并向管理员发出告警。本发明的方案实现了自动评估集群中节点的系统健康状态,并自动触发异常预警,极大的提升了异常发现和解决的效率,显著提升集群的安全性、稳定性。

技术研发人员:路廷文
受保护的技术使用者:济南浪潮数据技术有限公司
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1