一种内存条故障预测方法、装置及电子设备与流程

文档序号:35849991发布日期:2023-10-25 19:04阅读:62来源:国知局
一种内存条故障预测方法、装置及电子设备与流程

本技术涉及数据处理的,具体涉及一种内存条故障预测方法、装置及电子设备。


背景技术:

1、随着互联网业务的快速发展,基础设施的可用性也越来越受到业界的关注。然而硬件故障一直以来都是一种普遍存在的现象,由于硬件故障而造成的损失往往是巨大的。

2、在服务器各个部件中,除硬盘故障以外,内存条故障是第二大常见的硬件故障类型。并且服务器内存条的数量众多,内存条故障造成的最严重的后果是会直接导致系统崩溃,服务器宕机。因此,对内存条存在的潜在故障进行预测显得十分必要。目前,相关技术中通常采用外设工具来对内存条进行故障预测,由于外设工具本身存在不可控的数据检测风险,使得检测数据发生偏差,从而导致对内存条故障的预测准确性较低。

3、因此,急需一种内存条故障预测方法、装置及电子设备。


技术实现思路

1、本技术提供了一种内存条故障预测方法、装置及电子设备,便于提高对内存条故障的预测准确性。

2、在本技术的第一方面提供了一种内存条故障预测方法,应用于服务器,所述方法包括:获取内存条的监控数据包;将所述监控数据包输入至预设故障预测模型中,得到输出结果;基于所述输出结果,并结合历史故障信息,生成故障预测信息,所述故障预测信息用于表示所述内存条存在潜在故障。

3、通过采用上述技术方案,服务器首先将获取内存条的监控数据包,再将监控数据包输入至预设故障预测模型中,从而得到预设故障预测模型的输出结果。接下来,服务器将根据输出结果,并结合历史故障信息,从而生成故障预测信息。相比于相关技术,降低了外设工具检测数据发生偏差的概率,根据故障预测信息对内存条故障进行预测,便于提高对内存条故障的预测准确性。

4、可选的,所述监控数据包包括温度数据和电压数据,所述将所述监控数据包输入至预设故障预测模型中,得到输出结果,具体包括:获取所述温度数据和电压数据;根据所述温度数据和电压数据,确定温度值和电压值;判断所述温度值是否在预设温度范围内,若所述温度值未在所述预设温度范围内,则输出第一结果,所述第一结果用于指示所述温度数据异常;判断所述电压值是否在预设电压范围内,若所述电压值未在所述预设电压范围内,则输出第二结果,所述第二结果用于指示所述电压数据异常;将所述第一结果和所述第二结果进行融合,以得到所述输出结果。

5、通过采用上述技术方案,服务器首先将获取温度数据和电压数据,从而根据温度数据和电压数据,计算得到温度值和电压值。接下来,服务器将判断温度值是否在预设温度范围内,当温度值未在预设温度范围内时,服务器将输出第一结果。同时,服务器还将判断电压值是否在预设电压范围内,当电压值未在预设电压范围内时,服务器将输出第二结果。最后,服务器将第一结果和第二结果进行融合,从而得到输出结果。由此,服务器实现了对异常温度和异常电压的监控,从而实现对由温度异常和/或电压异常导致的内存条故障进行预测的目的,便于提高对内存条故障的预测准确性。

6、可选的,所述基于所述输出结果,并结合历史故障信息,生成故障预测信息,具体包括:获取历史故障信息,所述历史故障信息包括故障现象集合;对所述输出结果进行识别,确定第一故障现象,所述第一故障现象为温度数据异常和电压数据异常中的一种或两种;判断所述第一故障现象是否存在于所述故障现象集合中;若所述第一故障现象存在于所述故障现象集合中,则生成第一故障预测信息,所述第一故障预测信息包括第一故障概率。

7、通过采用上述技术方案,服务器首先将获取历史故障信息,再对输出结果进行识别,以确定第一故障现象。接下来,服务器将确定第一故障现象是否存在于故障现象集合中。当第一故障现象存在于故障现象集合中时,服务器将生成第一故障预测信息,并且对应生成第一故障概率。由此,服务器实现根据历史故障信息进一步确定第一故障概率的目的,并且有助于提高第一故障概率的准确性。

8、可选的,在所述将所述监控数据包输入至预设故障预测模型中之前,训练所述预设故障预测模型;所述训练所述预设故障预测模型,具体包括:获取训练信息,所述训练信息包括监控数据包和故障预测信息;将所述训练信息输入至自适应特征融合网络中进行训练,得到第一训练结果;将所述第一训练结果与所述训练信息进行叠加与标准化处理后,得到第二训练结果;将所述第二训练结果输入至所述自适应特征融合网络中进行处理,得到第三训练结果;将所述第三训练结果与所述第二训练结果进行叠加与标准化处理,直至输出所述训练信息相似度矩阵,所述训练信息相似度矩阵满足预设逻辑回归条件。

9、通过采用上述技术方案,服务器在将监控数据包输入至预设故障预测模型之前,将会对预设故障预测模型进行训练。首先,服务器将会获取训练信息,再将训练信息输入至自适应特征融合网络中进行训练,从而得到第一训练结果。接下来,服务器将第一训练结果与训练信息进行叠加与标准化处理后,得到第二训练结果。其次,服务器再将第二训练结果输入至自适应特征融合网络中进行处理,从而得到第三训练结果。最后,服务器将第三训练结果和第二训练结果进行叠加与标准化处理,直至输出训练信息相似度矩阵。由此,通过不断地训练和处理的过程,可以提高模型的准确性和稳定性,使其能够更好地适应不同的数据情况并进行有效的预测和分析。

10、可选的,若所述第一故障现象未存在于所述故障现象集合中,则生成第二故障预测信息,所述第二故障预测信息包括第二故障概率,所述第二故障概率低于所述第一故障概率。

11、通过采用上述技术方案,当第一故障现象未存在于故障现象集合中时,服务器将生成第二故障预测信息,以及生成对应的第二故障概率,且第二故障概率低于第一故障概率。由此,提供不同等级的故障概率,能够不同程度地提醒管理人员进行相应的内存条检查,便于提高预测数据的时效性和鲁棒性。

12、可选的,所述监控数据包还包括日志数据,所述将所述监控数据包输入至预设故障预测模型中,得到输出结果,具体还包括:根据多尺度通道注意力机制,对所述日志数据进行多尺度特征提取,得到多尺度特征信息;将所述多尺度特征信息输入至所述预设故障预测模型中,得到第三结果,所述输出结果包括所述第三结果。

13、通过采用上述技术方案,当监控数据包包括日志数据时,服务器将根据多尺度通道注意力机制,对日志数据进行多尺度特征提取,从而得到多尺度特征信息。最后,服务器将多尺度特征信息输入至预设故障预测模型中后,得到第三结果。由此,服务器通过对日志数据的实时检测,能够全面、及时地比较异常日志数据,从而便于对内存条的故障进行预测,与此同时提高了预测精度。

14、可选的,所述将所述多尺度特征信息输入至所述预设故障预测模型中,得到第三结果,具体包括:计算所述多尺度特征信息与预设异常特征信息之间的相似度值,所述预设故障预测模型中预先存储有多种所述预设异常特征信息;将所述相似度值与预设相似度阈值进行比较,得到所述第三结果,所述预设相似度阈值由历史故障信息中的故障日志集合确定。

15、通过采用上述技术方案,服务器首先将计算多尺度特征信息与异常特征信息之间的相似度值,并将相似度值与预设相似度阈值进行比较,从而得到第三结果。由此,服务器能够实现对异常日志数据的精细化分析,从而提高对内存条故障的全面预测,便于提高内存条故障预测的准确性。

16、可选的,所述基于所述输出结果,并结合历史故障信息,生成故障预测信息,具体还包括:若所述第三结果指示所述相似度值大于或等于所述预设相似度阈值,则生成第三故障预测信息,所述第三故障预测信息包括第三故障概率,所述第三故障概率高于第一故障概率。

17、通过采用上述技术方案,当预设故障预测模型输出的第三结果指示相似度值大于或等于预设相似度阈值后,服务器将生成第三故障预测信息,以及生成对应的第三故障概率,并且第三故障概率高于第一故障概率。由此,历史故障信息能够提供宝贵的经验和知识,帮助预测未来可能发生的故障。同时,高概率的故障预测信息更具参考价值,可以帮助操作人员更好地做出决策和采取相应的措施。故障预测的准确性和可靠性得到提升,有助于提前发现潜在的故障并及时采取预防措施,从而减少故障带来的损失和影响,提高系统的可靠性和稳定性。

18、在本技术的第二方面提供了一种内存条故障预测装置,所述内存条故障预测装置为服务器,所述服务器包括获取模块和处理模块,其中,所述获取模块,用于获取内存条的监控数据包;所述处理模块,用于将所述监控数据包输入至预设故障预测模型中,得到输出结果;所述处理模块,还用于基于所述输出结果,并结合历史故障信息,生成故障预测信息,所述故障预测信息用于表示所述内存条存在潜在故障。

19、在本技术的第三方面提供了一种电子设备,所述电子设备包括处理器、存储器、用户接口以及网络接口,所述存储器用于存储指令,所述用户接口和所述网络接口均用于给其他设备通信,所述处理器用于执行所述存储器中存储的指令,以使所述电子设备执行如上所述的方法。

20、综上所述,本技术实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:

21、1.服务器首先将获取内存条的监控数据包,再将监控数据包输入至预设故障预测模型中,从而得到预设故障预测模型的输出结果。接下来,服务器将根据输出结果,并结合历史故障信息,从而生成故障预测信息。相比于相关技术,降低了外设工具检测数据发生偏差的概率,根据故障预测信息对内存条故障进行预测,便于提高对内存条故障的预测准确性;

22、2.服务器通过对温度数据、电压数据以及日志数据进行实时监控,并结合历史故障现象和故障日志,采用预设故障预测模型来进行识别分析,并通过训练可以提高模型的准确性和稳定性,使其能够更好地适应不同的数据情况并进行有效的预测和分析,极大地帮助服务器进行内存条故障预测;

23、3.服务器结合历史故障信息能够提供宝贵的经验和知识,帮助预测未来可能发生的故障。同时,高概率的故障预测信息更具参考价值,可以帮助操作人员更好地做出决策和采取相应的措施。故障预测的准确性和可靠性得到提升,有助于提前发现潜在的故障并及时采取预防措施,从而减少故障带来的损失和影响,提高系统的可靠性和稳定性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1