本发明涉及健康状态预测领域,尤其涉及一种用于scada系统的健康状态预测方法。
背景技术:
1、随着互联网技术的发展,大规模服务器集群已经成为现代企业进行业务处理和数据存储的主要方式之一,然而由于服务器集群运行环境的复杂性以及日益增长的业务需求,服务器集群管理成本逐渐升高,管理员需要花费大量精力进行监控和管理,传统的服务器监控方法往往只能提供静态的指标,比如cpu使用率、内存占用等,难以反映服务器集群的动态变化,这种监控方式往往只能在出现问题时才能发现异常情况,无法及时预测服务器集群的未来状态,给管理员带来了很大的困扰,因此如何实现对服务器集群健康状态的准确监控和预测成为了一个热门的研究方向。
2、而近年来,深度学习技术在服务器集群健康状态预测方面取得了显著的进展,深度学习模型能够从大规模的监控数据中提取关键特征,建立对服务器集群健康状态的动态建模,从而实现对未来状态的预测,同时针对服务器集群的整体健康管理需求,采用迁移学习技术在预训练的深度学习模型的基础上,通过微调模型的权重参数,使其适用于新的任务,新的数据集,从而提高模型的性能可以快速构建适用于新服务器的预测模型,同时还可以利用已有的模型知识,提高新模型的训练效率和预测精度。
3、此外,由于深度学习模型中的参数设置对于模型的性能和鲁棒性起着至关重要的作用,进而参数优化也成为了一个热门的研究方向,贝叶斯超参数优化技术可以在多个参数设置中选择最优的配置,从而提高了模型的性能和鲁棒性,综上所述,深度学习、迁移学习和参数优化技术的发展,为服务器集群健康预测系统的研究和应用提供了更加广阔的空间和机遇。
4、例如,中国专利cn116627766a公开了一种应用服务器健康检查方法及装置,包括:获取通过由负载均衡设备发起模拟交易来对目标应用的各服务器进行健康检查,得到的各服务器中的目标服务器的健康检查参数数据;根据健康检查参数数据生成特征向量;将特征向量输入到预设的服务器健康检查模型中,得到服务器健康检查模型输出的目标服务器的健康检查结果。
5、基于上述方案其通过深度森林模型来训练出服务器健康检查模型,深度森林模型需要同时训练多个决策树,进而增加了训练的复杂性,同时该方法较为单一且预测准确度有待考量。
6、中国专利cn114860540a公开了一种云数据中心服务器健康度评估方法,包括采集服务器设定时间的各项指标数据得到服务器实时数据的最终特征集合;对最终特征集合进行降维可视化,分析数据样本的分布情况得到故障样本的样本簇数量获取待评估服务器的健康度将待评估服务器的健康度与设定的阈值比较,如果健康度大于阈值,则判断待评估服务器为正常,否则认为待评估服务器将要发生故障,进行故障告警。
7、基于上述方案其主要是通过分类划分健康和故障样本,只能对该服务器是否存在故障给出判断,而无法对多个服务器的性能给出故障趋势预测。
8、中国专利cn112070283a公开了一种基于机器学习的服务器运行健康度预测方法及系统,根据构建的基于支持向量机的服务器状态预测模型和故障报警信息,对服务器排查故障,并提供基于机器学习的服务器运行健康度预测系统,实现服务器健康状态的预测,从而实现服务器的故障预警。
9、基于上述方案其使用bp神经网络结合支持向量机的机器学习方法进行状态预测,支持向量机算法较为经典,而bp神经网络主要用于分类和回归问题,对于序列数据的处理能力较弱,在处理时序数据时,需要将时间作为独立的输入特征输入网络,这会导致输入维度过高,训练难度增加,并且无法捕捉到序列之间的时序关系。
10、针对相关技术中的问题,目前尚未提出有效的解决方案。
技术实现思路
1、本发明为了解决上述问题,提出了一种用于scada系统的健康状态预测方法,实现准确捕捉服务器集群的健康状态,并在出现异常情况时发出预警的目的。
2、为了实现上述目的,本发明采用如下技术方案:
3、一种用于scada系统的健康状态预测方法,该健康状态预测方法包括以下步骤:
4、基于应用数据构建控制系统状态评测模型,并利用迁移算法与控制系统状态评测模型构建服务器集群相应的状态预测模型群;
5、根据客户端发送需求提取需求服务器对应的应用数据并输入至状态预测模型群,获取控制系统健康状态的预测结果;
6、基于预测结果对控制系统健康状态进行打分,并利用打分结果生成告警提醒,客户端根据提醒执行服务器状态调整操作。
7、优选的,基于应用数据构建控制系统状态评测模型,并利用迁移算法与控制系统状态评测模型构建服务器集群相应的状态预测模型群包括以下步骤:
8、在各服务器内部署时库数据采集器获取控制系统对应的应用数据,并将各服务器内的应用数据整合为服务集群应用数据;
9、对服务集群应用数据执行预处理,并将处理完成服务集群应用数据存储至时序库;
10、选取任一组服务器对应的应用数据作为模型参数,与状态预测算法结合构建控制系统状态评测模型;
11、基于控制系统状态评测模型应用迁移算法构建各服务器状态预测模型,将各服务器状态预测模型集成得到服务器集群相应的状态预测模型群。
12、优选的,控制系统对应的应用数据包括服务集群健康数据与控制系统进程数据;
13、其中,服务集群健康数据包括服务集群运行处理器利用率与服务集群的内存占用率;
14、控制系统进程数据包括系统进程中处理器利用率与系统进程的内存占用率。
15、优选的,选取任一组服务器对应的应用数据作为模型参数,与状态预测算法结合构建控制系统状态评测模型包括以下步骤:
16、基于预设的选取要求确定控制系统状态评测模型的学习框架,并根据学习框架定义控制系统状态评测模型架构,评测模型架构包括双向依赖网络层、特征映射层、依赖学习网络层、全连接层与门控递归单元层;
17、应用寻优算法寻找控制系统状态评测模型架构内待寻优的超参数,并定义超参数的搜索空间;
18、在超参数搜索空间内应用优化算法进行超参数寻优,并将寻优结果与性能指标结合选取超参数的最优组合确定控制系统状态评测模型的架构;
19、基于控制系统状态评测模型架构选取任一组服务器对应的应用数据作为模型输入参数,获取控制系统状态评测模型。
20、优选的,基于控制系统状态评测模型架构选取任一组服务器对应的应用数据作为模型输入参数,获取控制系统状态评测模型包括以下步骤:
21、基于控制系统状态评测模型架构从时序库内选取任一组服务器对应的应用数据作为模型输入参数输入至特征映射层;
22、将特征映射层的输出结果按照正反向时间表示,并将正反向时间表示结果输入至双向依赖网络层获取序列数据;
23、将序列数据输入至依赖学习网络层连接获取输出序列,并将输出序列输入至门控递归单元层内得到任一组服务器对应的控制系统状态输出结果;
24、将状态输出结果输入至全连接层执行映射操作获取状态预测结果,并基于状态预测结果确定控制系统状态评测模型的架构得到控制系统状态评测模型。
25、优选的,将特征映射层的输出结果按照正反向时间表示,并将正反向时间表示结果输入至双向依赖网络层获取序列数据包括以下步骤:
26、将特征映射层的输出结果表示为正向时间与反向时间,并将正向时间与反向时间分别输入至双向依赖网络层的正向学习层与反向学习层;
27、利用正向学习层与反向学习层更新获取正向与反向候选单元状态,并基于正向与反向候选单元状态获取双向依赖网络层的输出结果得到序列数据。
28、优选的,序列数据的计算公式为:
29、
30、式中,表示双向依赖网络层的输出结果,表示t时刻的反向输出门,表示t时刻反向候选单元状态,表示t时刻正向候选单元状态。
31、优选的,将状态输出结果输入至全连接层执行映射操作获取状态预测结果,并基于状态预测结果确定控制系统状态评测模型的架构得到控制系统状态评测模型包括以下步骤:
32、将状态输出结果输入至全连接层,利用权重矩阵与偏置向量对状态输出结果执行映射操作得到状态预测结果;
33、基于状态预测结果与预设的状态结果之间平方差的平均值评估控制系统状态评测模型效果,若评测效果满足预设要求,则将当前的架构作为控制系统状态评测模型的架构;
34、若评测效果未满足预设要求,则重新选取超参数的最优组合调整控制系统状态评测模型的架构,将评测效果满足预设要求后的架构作为控制系统状态评测模型。
35、优选的,基于控制系统状态评测模型应用迁移算法构建各服务器状态预测模型,将各服务器状态预测模型集成得到服务器集群相应的状态预测模型群包括以下步骤:
36、基于控制系统状态评测模型获取服务器对应的特征输出值,并根据特征输出值提取权重与偏置;
37、应用迁移算法将权重与偏置迁移至各服务器对应的目标域特征网络中,作为初始权重与偏置;
38、应用深度特征网络提取各服务器对应应用数据的参数特征,计算特征输出值与参数特征之间的最大均值化差异得到迁移误差;
39、将迁移误差最小化作为优化目标与梯度下降迭代法结合生成偏置梯度,更新控制系统状态评测模型的权重与偏置得到各服务器相应的状态预测模型;
40、获取全部服务器的状态预测模型集成得到服务器集群相应的状态预测模型群。
41、优选的,最大均值化差异的计算公式为:
42、
43、式中,表示最大均值化差异,g1表示特征输出值,表示参数特征,||||g表示求取范数,表示求取特征输出值的均值,n表示特征输出值个数,i表示当前服务器编号,表示参数特征的均值,m表示参数特征个数,j表示待迁移的服务器编号。
44、本发明的有益效果为:
45、1、本发明综合监控系统和进程的性能数据,包括cpu使用率和内存占用等存储在时序库中,以便后续的模型训练和预测使用,同时采用多种不同类型的循环神经网络算法,对服务器集群的健康状态进行建模,从而提高了模型的性能和泛化能力,使得能够准确地捕捉服务器集群的健康状态,进一步提高模型的性能和鲁棒性。
46、2、本发明通过贝叶斯超参数优化方法对深度学习模型的关键参数进行调整,以选择最优配置,同时引入迁移学习技术,将已有的监控数据和模型迁移到其他的服务器上,并结合其他服务器的监控数据进行训练,进而快速构建适用于其他服务器的预测模型,使得既可以减少其他服务器上的数据量,又可以利用已有的模型知识提高新模型的训练效率和预测精度。
47、3、本发明将控制系统状态评测模型部署在服务端,响应客户端的预测请求,预测未来系统和相关进程的性能情况,通过准确捕捉服务器集群的健康状态,并在出现异常情况时发出预警,对于保障服务器集群的稳定运行和提高业务可靠性具有重要意义。