本发明涉及计算机,尤其涉及一种应用故障处理方法、装置、终端设备及计算机可读存储介质。
背景技术:
1、近年来,随着业务系统规模逐渐扩大,对于系统的监控运维要求日渐突显,监控系统产品应需而生。但是,当前监控方式至少普遍以下问题:
2、(1)当前监控方式普遍应用于大型项目,用户操作复杂,使用难度较高;
3、(2)监控准度根据用户自定义的静态阈值确定,容易发生异常漏报或者误报的情况;
4、(3)系统缺乏一定的自愈能力。比如,在监控系统发现问题并告警后,需要等待运维或者开发人员进一步处理。
5、总的来说,现有的应用异常处理方式,存在应用监控精度低以及故障处理效率低下等问题。
技术实现思路
1、本发明的主要目的在于提供一种应用故障处理方法、装置、终端设备及计算机可读存储介质,旨在对故障应用进行自愈处理,在实现应用精准监控的基础上,也实现应用故障的高效处理,进而提升运维效率。
2、为实现上述目的,本发明提供一种应用故障处理方法,所述方法包括以下步骤:
3、获取当前应用的采样数据,并基于预设动态阈值,对所述采样数据进行误差检测,以判断所述当前应用是否处于故障状态;
4、在所述当前应用处于故障状态时,控制所述当前应用进行故障自愈处理。
5、可选地,所述基于预设动态阈值,对所述采样数据进行误差检测的步骤,包括:
6、基于所述预设动态阈值,通过预训练的受限玻尔兹曼机,对所述采样数据进行误差检测,其中,所述预设动态阈值通过对所述受限玻尔兹曼机进行迭代训练得到。
7、可选地,所述基于所述预设动态阈值,通过预训练的受限玻尔兹曼机,对所述采样数据进行误差检测的步骤,包括:
8、将所述采样数据输入所述预训练的受限玻尔兹曼机,得到对应的重构特征;
9、获取所述重构特征与所述采样数据的原始特征之间的特征误差,并将所述特征误差与所述预设动态阈值进行比对,以对所述采样数据进行误差检测,并在所述特征误差超过或者等于所述预设动态阈值时,确定所述当前应用处于故障状态。
10、可选地,在所述获取所述重构特征与所述采样数据的原始特征之间的特征误差,并将所述特征误差与所述预设动态阈值进行比对的步骤之后,还包括:
11、在所述特征误差未超过所述预设动态阈值时,将所述采样数据导入预设循环列队进行临时缓存,或者,将所述采样数据导入预设硬盘进行长期存储。
12、可选地,所述控制所述当前应用进行故障自愈处理的步骤,包括:
13、针对所述当前应用进行容器编排,以控制所述当前应用进行故障自愈处理;
14、所述针对所述当前应用进行容器编排的步骤,包括:
15、确定所述当前应用对应的容器异常节点,并根据所述容器异常节点的状态,创建新的节点;
16、将所述异常应用的流量负载转移至所述新的节点,并根据所述特征误差进行扩容重启,以对所述当前应用进行容器编排。
17、可选地,所述获取当前应用的采样数据的步骤,包括:
18、针对当前应用分别进行虚拟机信息采样、线程信息采样和内存堆采样,得到采样数据。
19、可选地,所述应用故障处理方法,还包括:
20、在所述当前应用处于故障状态时,执行异常告警操作,并将所述当前应用的异常数据进行可视化显示。
21、为实现上述目的,本发明还提供一种应用故障处理装置,所述应用故障处理装置包括:
22、误差检测模块,用于获取当前应用的采样数据,并基于预设动态阈值,对所述采样数据进行误差检测,以判断所述当前应用是否处于故障状态;
23、故障处理模块,用于在所述当前应用处于故障状态时,控制所述当前应用进行故障自愈处理。
24、为实现上述目的,本发明还提供一种终端设备,所述终端设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的应用故障处理程序,所述应用故障处理程序被所述处理器执行时实现如上所述的应用故障处理方法的步骤。
25、此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有应用故障处理程序,所述应用故障处理程序被处理器执行时实现如上所述的应用故障处理方法的步骤。
26、为实现上述目的,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如上所述的应用故障处理方法的步骤。
27、本发明提供一种应用故障处理方法、装置、终端设备、计算机可读存储介质以及计算机程序产品,通过获取当前应用的采样数据,并基于预设动态阈值,对所述采样数据进行误差检测,以判断所述当前应用是否处于故障状态;在所述当前应用处于故障状态时,控制所述当前应用进行故障自愈处理。
28、相比于现有的应用故障处理方式,在本发明中,监控组件在对应用进行采样得到采样数据后,根据动态阈值对获取的采样数据进行误差检测,并在判断到采样数据为异常状态时,监控组件可直接控制其进行自愈处理。因此,一方面,本发明采用了动态阈值判断当前应用是否处于故障状态,相比于现有的静态阈值,实现了更为精准和灵活地应用故障监控;另一方面,本发明在检测到应用故障后,可直接控制故障的应用进行自愈处理,无需等待人工处理,在提升了系统维修效率的基础上,也降低了人工运维成本。
1.一种应用故障处理方法,其特征在于,所述应用故障处理方法包括:
2.如权利要求1所述的应用故障处理方法,其特征在于,所述基于预设动态阈值,对所述采样数据进行误差检测的步骤,包括:
3.如权利要求2所述的应用故障处理方法,其特征在于,所述基于所述预设动态阈值,通过预训练的受限玻尔兹曼机,对所述采样数据进行误差检测的步骤,包括:
4.如权利要求3所述的应用故障处理方法,其特征在于,在所述获取所述重构特征与所述采样数据的原始特征之间的特征误差,并将所述特征误差与所述预设动态阈值进行比对的步骤之后,还包括:
5.如权利要求1所述的应用故障处理方法,其特征在于,所述控制所述当前应用进行故障自愈处理的步骤,包括:
6.如权利要求1所述的应用故障处理方法,其特征在于,所述获取当前应用的采样数据的步骤,包括:
7.如权利要求1所述的应用故障处理方法,其特征在于,所述应用故障处理方法,还包括:
8.一种应用故障处理装置,其特征在于,所述应用故障处理装置包括:
9.一种终端设备,其特征在于,所述终端设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的应用故障处理程序,所述应用故障处理程序被所述处理器执行时实现如权利要求1至7中任一项所述的应用故障处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有应用故障处理程序,所述应用故障处理程序被处理器执行时实现如权利要求1至7中任一项所述的应用故障处理方法的步骤。