一种机房异常检测方法、终端设备及存储介质与流程

文档序号:38846860发布日期:2024-07-30 17:45阅读:22来源:国知局
一种机房异常检测方法、终端设备及存储介质与流程

本申请实施例属于计算机处理的,特别是涉及一种机房异常检测方法、终端设备及存储介质。


背景技术:

1、随着云计算、大数据等新一代信息技术的快速发展,数据中心的机房规模急速扩大,机房中计算设备的数量不断增加,数据中心的数据处理能力不断提高。

2、大量的计算设备在规模化运行的过程中可能会发生异常,为了保障数据中心的正常运行,通常会在数据中心中部署监控程序,对各台计算设备的状态进行监控。

3、目前,监控的方法主要是阈值法与深度学习,阈值法是指对计算设备中处理器占用率、内存占用率等指标设置一个阈值,在指标超过阈值时认为发生异常,深度学习是指训练一个神经网络,将计算设备中处理器占用率、内存占用率等指标输入神经网络中检测是否发生异常。

4、阈值法与深度学习均是在计算设备的系统层面上监控的方法,较为依赖系统层面的数据采集、数据传输,存在局限性,在某些情况下,系统层面的驱动层或硬件层发生异常时,会影响数据采集、数据传输等操作,导致这些监控的方法失效。


技术实现思路

1、有鉴于此,本申请实施例提供了一种机房异常检测方法、终端设备及存储介质,用以提高对机房中计算设备进行异常监控的全面性。

2、本申请实施例的第一方面提供了一种机房异常检测方法,包括:

3、将机房中的各个计算设备以机柜为单位划分至多个设备组中;同一所述设备组中的计算设备部署容器集群kubernetes中的同一组容器,同一组所述容器中部署有相互具有依赖关系的微服务;

4、在同一所述设备组中的所述微服务执行业务操作时,对所述设备组采集振动信号与红外图像数据,将所述振动信号转换为频谱信号与将所述红外图像数据转换为光流场图像数据;

5、分别计算所述业务操作与所述振动信号之间的第一相关系数、所述业务操作与所述红外图像数据之间的第二相关系数;

6、加载异常检测网络;所述异常检测网络中具有第一骨干结构、第二骨干结构与检测头结构;

7、将所述振动信号与所述频谱信号共同输入所述第一骨干结构中提取目标振动特征;

8、将所述红外图像数据与所述光流场图像数据共同输入所述第二骨干结构中提取目标图像特征;

9、将所述第一相关系数、所述第二相关系数、所述目标振动特征与所述目标图像特征拼接为目标运行特征;

10、将所述目标运行特征输入所述检测头结构中检测表征所述设备组运行异常的目标检测框;

11、依据所述目标检测框对所述设备组执行警报操作。

12、本申请实施例的第二方面提供了一种机房异常检测装置,包括:

13、设备分组模块,用于将机房中的各个计算设备以机柜为单位划分至多个设备组中;同一所述设备组中的计算设备部署容器集群kubernetes中的同一组容器,同一组所述容器中部署有相互具有依赖关系的微服务;

14、数据采集模块,用于在同一所述设备组中的所述微服务执行业务操作时,对所述设备组采集振动信号与红外图像数据,将所述振动信号转换为频谱信号与将所述红外图像数据转换为光流场图像数据;

15、相关系数计算模块,用于分别计算所述业务操作与所述振动信号之间的第一相关系数、所述业务操作与所述红外图像数据之间的第二相关系数;

16、异常检测网络加载模块,用于加载异常检测网络;所述异常检测网络中具有第一骨干结构、第二骨干结构与检测头结构;

17、目标振动特征提取模块,用于将所述振动信号与所述频谱信号共同输入所述第一骨干结构中提取目标振动特征;

18、目标图像特征提取模块,用于将所述红外图像数据与所述光流场图像数据共同输入所述第二骨干结构中提取目标图像特征;

19、目标运行特征拼接模块,用于将所述第一相关系数、所述第二相关系数、所述目标振动特征与所述目标图像特征拼接为目标运行特征;

20、目标检测框生成模块,用于将所述目标运行特征输入所述检测头结构中检测表征所述设备组运行异常的目标检测框;

21、警报操作执行模块,用于依据所述目标检测框对所述设备组执行警报操作。

22、本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的机房异常检测方法。

23、本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的机房异常检测方法。

24、本申请实施例的第五方面提供了一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行上述第一方面所述的机房异常检测方法。

25、与背景技术相比,本申请实施例具有以下有益效果:

26、在本实施例中,将机房中的各个计算设备以机柜为单位划分至多个设备组中;同一设备组中的计算设备部署容器集群kubernetes中的同一组容器,同一组容器中部署有相互具有依赖关系的微服务;在同一设备组中的微服务执行业务操作时,对设备组采集振动信号与红外图像数据,将振动信号转换为频谱信号与将红外图像数据转换为光流场图像数据;分别计算业务操作与振动信号之间的第一相关系数、业务操作与红外图像数据之间的第二相关系数;加载异常检测网络;异常检测网络中具有第一骨干结构、第二骨干结构与检测头结构;将振动信号与频谱信号共同输入第一骨干结构中提取目标振动特征;将红外图像数据与光流场图像数据共同输入第二骨干结构中提取目标图像特征;将第一相关系数、第二相关系数、目标振动特征与目标图像特征拼接为目标运行特征;将目标运行特征输入检测头结构中检测表征设备组运行异常的目标检测框;依据目标检测框对设备组执行警报操作。本实施例以同一设备组中的微服务执行业务操作为参考,使用振动、热量这两方面的信息去联合评估同一设备组中的计算设备是否发生异常,以硬件层面的监控为主,融入了容器集群kubernetes在系统层面与硬件层面之间多模态的关联性,以关联性为先验知识,可保证异常检测的精确度,减少对系统层面的数据采集、数据传输的依赖,为容器集群kubernetes提供多样化的监控,在系统层面的驱动层或硬件层发生异常时,仍然保证监控的有效。



技术特征:

1.一种机房异常检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述分别计算所述业务操作与所述振动信号之间的第一相关系数、所述业务操作与所述红外图像数据之间的第二相关系数,包括:

3.根据权利要求2所述的方法,其特征在于,所述将同一所述时间点内所有所述微服务的负载量融合为所述业务操作的运算量,包括:

4.根据权利要求1所述的方法,其特征在于,所述第一骨干结构包括第一卷积层、第二卷积层、双向长短期记忆网络、自注意力机制层、第一多层感知机与三个时序块结构;各个所述时序块结构中依次分布有长短期记忆网络、第三卷积层与最大池化层;

5.根据权利要求4所述的方法,其特征在于,所述第二骨干结构包括三个第一卷积块结构、三个第二卷积块结构、三个第三卷积块结构、空洞空间金字塔池化层与第二多层感知机;各个所述第一卷积块结构均依次分布多个第四卷积层与第一平均池化层;各个所述第二卷积块结构均依次分布多个第五卷积层与第二平均池化层;各个所述第三卷积块结构均依次分布瓶颈层与多个第六卷积层;

6.根据权利要求5所述的方法,其特征在于,所述检测头结构包括多个第七卷积层、候选区域网络和多个全连接层;

7.根据权利要求1-6中任一项所述的方法,其特征在于,所述依据所述目标检测框对所述设备组执行警报操作,包括:

8.根据权利要求7所述的方法,其特征在于,所述在所述三维虚拟模型中分别对所述第一目标模型与所述第二目标模型执行符合警报操作的渲染操作,包括:

9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-8任一项所述的机房异常检测方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8任一项所述的机房异常检测方法。


技术总结
本申请实施例提供了一种机房异常检测方法、终端设备及存储介质,该方法包括:将振动信号转换为频谱信号与将红外图像数据转换为光流场图像数据;分别计算业务操作与振动信号之间的第一相关系数、业务操作与红外图像数据之间的第二相关系数;加载异常检测网络;将振动信号与频谱信号共同输入第一骨干结构中提取目标振动特征;将红外图像数据与光流场图像数据共同输入第二骨干结构中提取目标图像特征;将第一相关系数、第二相关系数、目标振动特征与目标图像特征拼接为目标运行特征;将目标运行特征输入检测头结构中检测表征设备组运行异常的目标检测框;依据目标检测框对设备组执行警报操作。为容器集群提供多样化的监控。

技术研发人员:金伟,熊旭东,林亚波,邓美容,钟佰发
受保护的技术使用者:科学城(广州)数字科技集团有限公司
技术研发日:
技术公布日:2024/7/29
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1