一种监控机房动力设备的方法、设备及介质与流程

文档序号:34066977发布日期:2023-05-06 15:36阅读:37来源:国知局
一种监控机房动力设备的方法、设备及介质与流程

本说明书涉及计算机,尤其涉及一种监控机房动力设备的方法、设备及介质。


背景技术:

1、随着信息技术的发展和普及,计算机系统及通信设备数量与日俱增,规模越来越大,中心机房已成为各大单位业务管理的核心。机房动力设备运行环境监控作为机房的重要监管工作,其需要采集设备、监控服务器和远程监控终端的通信配合实现数据的交互,因此为了保障机房动力设备运行安全,对于机房动力设备的监控是一项重要的环节。

2、现有方式中对于机房动力设备的监控方法,一般是通过监控服务器对采集设备下发心跳监测指令,然后根据采集设备的响应来生成监测信息,从而形成采集设备监控表和记录其中的心跳时间数据,而随着当前机房动力设备的数量越来越多,仅基于监控服务器主导动力设备进行故障信息上传方式进行排查异常状况,可能会由于监控指令下发不及时的问题,以及监控服务器的故障监控指令无法及时更新导致故障遗漏的问题,使得动力设备的故障信息无法及时获取导致在动力设备故障排查上,需要耗费大量的人力物力。


技术实现思路

1、为了解决上述技术问题,本说明书一个或多个实施例提供了一种监控机房动力设备的方法、设备及介质。

2、本说明书一个或多个实施例采用下述技术方案:

3、本说明书一个或多个实施例提供一种监控机房动力设备的方法,方法包括:

4、基于待监控机房中预置传感器,获取所述待监控机房中各动力设备的运行环境数据;

5、根据各所述动力设备响应于预置监控服务器监控指令的数据传输时间,确定所述待监控机房的第一响应时间与第一响应时间;其中,所述预置监控服务器用于监控所述待监控机房中各所述动力设备的运行状态;

6、在第一响应时间内,获取所述动力设备的第一运行环境数据,以及根据预置监控服务器的监控指令采集的回传相关信息,并基于主成分分析算法提取所述回传相关信息和所述第一运行环境数据中的故障特征,根据所述故障特征确定所述待监控机房中各动力设备的第一故障告警类型;

7、获取与所述第一故障告警类型相对应的第一告警参数,以基于所述第一告警参数生成第一告警信息传输给所述预置监控服务器;

8、在第二响应时间内,获取所述动力设备的第二运行环境数据与运行日志数据,将所述运行日志数据以及所述第二运行环境数据输入预置故障预测模型,以基于预测结果确定是否生成第二告警信息传输给所述预置监控服务器。

9、可选地,在本说明书一个或多个实施例中,基于待监控机房中预置多类型传感器,获取所述待监控机房中各动力设备的运行环境数据,具体包括:

10、根据各所述预置传感器的有效检测范围,确定所述有效检测范围下所覆盖的动力设备;

11、判断所述覆盖的动力设备是否存在于同类型传感器的有效检测范围下;

12、若是,则基于所述预置传感器的位置与所述覆盖的动力设备的位置,确定第一距离数据,并基于所述同类型传感器的位置与所述覆盖的动力设备的位置,确定第二距离数据;

13、根据所述第一距离数据与所述第二距离数据的倒数,分别确定所述预置传感器与所述同类型传感器的第一权重值与第二权重值,并分别基于所述预置传感器与所述同类型传感器的检测精度确定所述预置传感器与所述同类型传感器的第三权重值与第四权重值;

14、基于所述第一权重值与所述第三权重值的乘积确定所述预置传感器的权重值,并基于所述第二权重值与所述第四权重值的乘积确定所述同类型传感器的权重值;

15、对于所述预置传感器的权重值与所述同类型传感器的权重值,确定与所述覆盖的动力设备相匹配的传感器,以基于所述相匹配的传感器采集获得运行环境数据。

16、可选地,在本说明书一个或多个实施例中,基于待监控机房中预置多类型传感器,获取所述待监控机房中各动力设备的运行环境数据之前,所述方法还包括:

17、获取待监控机房的地理位置,以确定所述待监控机房的基本气候变化信息,并基于所述基本气候变化信息,确定所述待监控机房的易变环境参数;其中,所述易变环境参数包括:温度、湿度、灰尘;

18、根据所述易变环境参数以及所述待监控机房的预置安全防护规则,确定所述待监控机房的待安装传感器类型;

19、根据各动力设备的位置信息确定所述待监控机房的典型散点位置;其中,所述典型散点位置包括:动力设备机架、动力设备通风口、温度调节设备出风口、机房配电柜;

20、根据各典型散点位置所对应的环境属性匹配对应的待安装传感器类型,以基于所述典型散点位置与各所述待安装传感器类型的匹配关系布设预置传感器。

21、

22、可选地,在本说明书一个或多个实施例中,根据所述待监控机房中各所述动力设备,响应于预置监控服务器监控指令的数据传输时间,确定所述待监控机房的第一响应时间与第一响应时间,具体包括:

23、基于与所述待监控机房相对应的设备数据库调用各所述动力设备的相关故障信息;

24、根据所述相关故障信息确定各所述动力设备响应于预置监控服务器监控指令的数据传输时间;

25、将所述待监控机房中各所述动力设备的数据传输时间进行排序,以获取最大数据传输时间,基于所述最大数据传输时间与预设冗余时间生成所述待监控机房中各所述动力设备的响应周期;

26、将所述响应周期划分为第一响应时间与第一响应时间;所述第一响应时间用于所述动力设备根据所述预置监控服务器的监控指令回传告警信息,所述第二响应时间用于所述动力设备自主向所述预置监控服务器回传告警信息。

27、可选地,在本说明书一个或多个实施例中,获取所述动力设备的第一运行环境数据,以及根据预置监控服务器的监控指令采集的回传相关信息,并基于主成分分析算法提取所述回传相关信息和所述第一运行环境数据中的故障特征,根据所述故障特征确定所述待监控机房中各动力设备的第一故障告警类型,具体包括:

28、根据预置监控服务器的监控指令,控制所述动力设备基于预设接口查询回传相关信息,并基于所述预置传感器获取所述动力设备在第一响应时间内的第一运行环境数据;

29、对所述回传相关信息与所述第一运行环境数据进行归一化处理,获得待提取数据;

30、将所述待提取数据基于预设映射函数,映射到对应的高维特征空间获得所述待提取数据的特征空间数据矩阵;其中,所述预设映射函数为非线性高斯径向基函数;

31、根据最大方差理论生成所述特征空间数据矩阵获得协方差矩阵,以确定与所述协方差矩阵相对应的雅克比矩阵,并根据所述雅克比矩阵进行特征值分解获得所述待提取数据的特征值以及与所述特征值相对应的特征向量;

32、根据所述待提取数据的特征值的数值大小进行排序,以提取预设数量的特征值以及与所述特征值相对应的特征向量作为所述回传相关信息和所述第一运行环境数据中的故障特征;

33、根据选定的故障特征中心对所述故障特征进行迭代聚类,确定所述待监控机房中各动力设备的第一故障告警类型。

34、可选地,在本说明书一个或多个实施例中,根据选定的故障特征中心对所述故障特征进行迭代聚类,确定所述待监控机房中各动力设备的第一故障告警类型,具体包括:

35、根据各所述故障特征与所述故障特征中心之间的距离,确定各所述故障特征与所述故障特征中心之间的相似度;

36、基于所述相似度将各所述故障特征进行集合划分,获得多个故障中心的聚类簇;

37、获取各所述聚类簇中故障特征的平均值,以确定各所述聚类簇的更新故障特征中心;

38、若所述更新故障特征中心与所述故障特征中心相对应,则基于各所述故障特征中心所对应的聚类簇确定所述待监控机房中各动力设备的第一故障告警类型。

39、可选地,在本说明书一个或多个实施例中,获取与所述第一故障告警类型相对应的第一告警参数,以基于所述第一告警参数生成第一告警信息传输给所述预置监控服务器,具体包括:

40、根据预置故障因果树,确定与所述第一故障告警类型相对应的告警参数名称,以基于所述告警参数名称获取与所述第一故障告警类型相对应的第一告警参数;其中,所述预置故障因果树中存储有与各故障告警类型相对应的告警参数名称;

41、根据所述第一告警参数中各参数的数值确定对应的第一告警等级,以基于所述第一告警等级、所述第一故障告警类型与所述第一告警参数生成第一告警信息,并将所述第一告警信息加入等待消息队列中;

42、若基于所述第一告警信息,确定所述第一告警等级小于等于所述等待消息队列中的前序告警信息,则所述第一告警信息在所述第一响应时间内等待传输;

43、若基于所述第一告警信息,确定所述第一告警等级大于所述等待消息队列中的前序告警信息,则移动所述第一告警信息到对应的位置,确定所述第一告警信息当前的前序告警信息;

44、基于所述当前的前序告警信息的数据传输长度与数据传输速度,确定所述第一告警信息的传输开始时间,以基于所述传输开始时间将所述第一告警信息传输给所述预置监控服务器。

45、可选地,在本说明书一个或多个实施例中,在第二响应时间内,获取所述动力设备的第二运行环境数据与运行日志数据,将所述运行日志数据以及所述第二运行环境数据输入预置故障预测模型,以基于预测结果确定是否生成第二告警信息传输给所述预置监控服务器,具体包括:

46、在第二响应时间内,获取所述动力设备的第二运行环境数据与运行日志数据,将所述运行日志数据以及所述第二运行环境数据输入预置故障预测模型;

47、通过所述预置故障预测模型的滑动窗口对所述运行日志数据以及所述第二运行环境数据进行扫描,获得多个故障特征向量;

48、根据预设随机森林的决策树对所述多个故障特征向量进行分类,获得多个故障特征类向量,并根据所述滑动窗口对所述多个故障特征类向量进行扫描,获得多维度特征向量;

49、根据所述预置故障预测模型中的多层级联随机森联对所述多维度特征向量进行预测获得预测结果;

50、若基于所述预测结果确定所述动力设备不存在故障,则确定不生成第二告警信息;

51、若基于所述预测结果确定所述动力设备存在故障,则根据所述故障结果确定第二故障告警类型,以基于所述第二故障告警类型生成第二告警信息传输给所述预置监控服务器。

52、本说明书一个或多个实施例提供一种监控机房动力设备的设备,设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述方法。

53、本说明书一个或多个实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,所述可执行指令被计算机执行,以使计算机能够执行上述方法。

54、本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:

55、通过将响应时间拆分为监控服务器获取告警信息的第一响应时间与动力设备主动上传告警信息的第二响应时间,使得第一响应时间内监控服务器基于指令获取动力设备的告警信息,在第二响应时间内动力设备能够主动上传告警信息,实现监控服务器获取与动力设备主动上传相结合。解决了监控服务器的故障监控指令可能无法及时更新时,所导致的存在故障的动力设备不能及时接收到相应类型的监控指令,使得动力设备故障遗漏的问题,提高了动力设备监控的可靠性。同时在第一响应时间内动力设备根据主成分分析算法提取故障特征,实现了对于主要故障特征的提取实现了数据降维,降低了后续的计算成本。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1