原生云应用程序的故障定位的制作方法

文档序号:34313900发布日期:2023-05-31 23:00阅读:36来源:国知局
原生云应用程序的故障定位的制作方法


背景技术:

1、本申请一般涉及信息技术,并且尤其涉及发行管理技术。更具体地,异常检测涉及识别事件集合中的潜在问题和/或异常事件,并且故障定位涉及缩小已经检测到的问题的潜在原因集合。


技术实现思路

1、本发明实施例中,提供了云本机应用程序的故障定位技术。一种示例性的计算机实现的方法可以包括:通过处理针对至少一个系统的事件相关警报的一个或多个特性来对所述事件相关警报进行分类;以及至少部分地基于所述事件相关警报的所述分类来获取并处理多个应用程序日志。该方法还包括至少部分地基于多个应用程序日志的处理来在多个应用程序日志中识别错误日志,使用一个或多个优先化技术来对错误日志进行排序,以及至少部分地基于错误日志的排序来执行至少一个自动化动作。

2、本发明的另一实施例或其元素可以以有形地体现计算机可读指令的计算机程序产品的形式来实现,这些指令在被实现时使计算机执行如本文描述的多个方法步骤。此外,本发明的另一个实施例或其元件可以以系统的形式实现,所述系统包括存储器和至少一个处理器,所述至少一个处理器耦合到所述存储器并且被配置为执行所述方法步骤。更进一步,本发明的另一实施例或其元素能够以用于执行本文描述的方法步骤的装置或其元素的形式来实现;该装置可以包括硬件模块或硬件和软件模块的组合,其中,软件模块被存储在有形的计算机可读存储介质(或多个这样的介质)中。

3、本发明的这些和其他目的、特征和优点将从以下将结合附图阅读的本发明的说明性实施例的详细描述中变得明显。



技术特征:

1.一种计算机实现的方法,包括:

2.根据权利要求1所述的计算机实现的方法,其中,所述处理所述事件相关警报的一个或多个特性包括:处理与所述事件相关警报的至少持续时间有关的时间信息。

3.根据权利要求1所述的计算机实现的方法,其中,所述获取多个应用程序日志包括获取一个或多个错误日志。

4.根据权利要求3所述的计算机实现的方法,其中,所述处理多个应用程序日志包括将所述一个或多个错误日志的至少一部分转换成一个或多个模板。

5.根据权利要求1所述的计算机实现的方法,其中,所述获取多个应用程序日志包括获取一个或多个入口日志。

6.根据权利要求1所述的计算机实现的方法,其中,使用一个或多个优先化技术对所述错误日志进行排序包括使用应用程序拓扑对所述错误模板进行排序。

7.根据权利要求1所述的计算机实现的方法,其中,使用一个或多个优先化技术对所述错误日志进行排序包括基于错误分布对所述错误日志进行排序。

8.根据权利要求1所述的计算机实现的方法,其中,使用一个或多个优先化技术对所述错误日志进行排序包括从所述警报描述和一个或多个日志消息中提取一个或多个实体。

9.根据权利要求1所述的计算机实现的方法,其中,所述识别错误日志包括实现一个或多个跟踪技术。

10.根据权利要求1所述的计算机实现的方法,其中,所述识别错误日志包括基于一个或多个错误频率从所述多个应用程序日志提取错误消息。

11.根据权利要求1所述的计算机实现的方法,其中,所述执行至少一个自动化动作包括至少部分地基于所述错误日志的所述排序确定一个或多个受影响的服务。

12.根据权利要求1所述的计算机实现的方法,其中,执行所述至少一个自动化动作包括:至少部分基于所述错误日志的所述排序和从所述错误日志的至少一部分导出的pod识别信息,一旦有所述至少一个pod不起作用的指示,重启所述至少一个容器。

13.根据权利要求1所述的计算机实现的方法,其中,实现所述方法的软件作为云环境中的服务提供。

14.一种计算机程序产品,包括计算机可读存储介质,所述计算机可读存储介质具有包含在其中的程序指令,所述程序指令可由计算设备执行以使所述计算设备:

15.根据权利要求14所述的计算机程序产品,其中,所述处理所述事件相关警报的一个或多个特性包括:处理与所述事件相关警报的至少持续时间有关的时间信息。

16.根据权利要求14所述的计算机程序产品,其中,使用一个或多个优先化技术对所述错误日志进行排序包括使用应用程序拓扑对所述错误模板进行排序。

17.根据权利要求14所述的计算机程序产品,其中,使用一个或多个优先化技术对所述错误日志进行排序包括基于错误分布对所述错误日志进行排序。

18.一种系统,包括:

19.根据权利要求18所述的系统,其中,所述处理所述事件相关警报的一个或多个特性包括:处理与所述事件相关警报的至少持续时间有关的时间信息。

20.根据权利要求18所述的系统,其中,使用一个或多个优先化技术对所述错误日志进行排序包括使用应用程序拓扑对所述错误模板进行排序和基于错误分布对所述错误日志进行排序中的至少一个。


技术总结
本文提供了用于原生云应用程序的故障定位的方法、系统和计算机程序产品。一种计算机实现的方法,包括:通过处理针对至少一个系统的事件相关警报的一个或多个特性来对所述事件相关警报进行分类;至少部分地基于所述事件相关警报的所述分类来获取并处理多个应用程序日志;至少部分地基于所述多个应用程序日志的所述处理,在所述多个应用程序日志中识别错误日志;以及至少部分地基于所述错误日志的所述排序来执行至少一个自动化动作。

技术研发人员:A·M·帕拉德卡尔,P·阿格瓦尔,A·曼达尔,A·古普塔
受保护的技术使用者:国际商业机器公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1