分布式服务的监控方法及装置的制造方法

文档序号:9455697阅读:271来源:国知局
分布式服务的监控方法及装置的制造方法
【技术领域】
[0001] 本发明涉及数据处理技术领域,尤其涉及一种分布式服务的监控方法及装置。
【背景技术】
[0002] 目前,互联网应用大多为分布式在线服务系统,每个请求需要经过几十甚至几百 台计算机上的不同模块完成,并且随着业务的快速发展,模块的数量也在不断增加,模块间 的交互关系变得异常复杂。相应地,如何实现对分布式服务的监控,以及时分析出分布式服 务异常的原因也变得复杂起来。
[0003] 现有的监控系统通常针对分布式服务中的单个模块或单台计算机进行监控。具体 地,监控系统定期采样关心的信息进行统计并分析,如果发现业务请求的处理结果异常,启 动监控系统的报警功能。
[0004] 由于上述监控系统在业务请求异常时,仅提供相应的报警服务。所以在收到报警 信息后,需人工确定相应业务请求的各模块之间的调用关系,再根据调用关系具体分析业 务请求异常的原因,效率较低,不利于分布式服务中异常业务请求的快速止损。

【发明内容】

[0005] 本发明的目的在于提供一种分布式服务的监控方法及装置,以自动生成异常业务 请求的请求调用关系拓扑图,实现异常业务请求的快速止损。
[0006] 根据本发明的一方面,本发明提供一种分布式服务的监控方法,所述方法包括:日 志获取步骤:获取从分布式服务的多个模块采集的业务请求处理日志,其中,在所述从所述 多个模块采集的业务请求处理日志的日志记录当中被记录的同一业务请求具有相同的业 务请求标识,并且所述日志记录包括当前模块的第一模块标识和调用所述当前模块的调用 模块的第二模块标识;日志聚合步骤:将具有相同的业务请求标识的日志记录分别聚合为 日志记录集合;日志分析步骤:对聚合得到的日志记录集合分别进行分析,其中,对处理结 果发生异常的业务请求,根据所述业务请求在模块之间的调用关系生成所述业务请求的请 求调用关系拓扑图。
[0007] 可选地,所述方法还包括日志结构化步骤:从所述日志记录分别提取业务请求标 识、第一模块标识、第二模块标识以及关于处理结果状态的数据,生成相应的日志记录索 引。
[0008] 可选地,在所述日志聚合步骤,将具有相同的业务请求标识的日志记录索引分别 聚合为日志记录索引集合;在所述日志分析步骤,对聚合得到的日志记录索引集合分别进 行分析,其中,对处理结果发生异常的业务请求,根据所述业务请求在模块之间的调用关系 生成异常模块被标注的所述业务请求的请求调用关系拓扑图。
[0009] 可选地,所述方法还包括报警信息生成步骤:根据所述请求调用关系拓扑图和相 应的日志记录索引集合生成所述业务请求的报警信息。
[0010] 可选地,所述方法还包括报警信息提供步骤:发送或展示所述报警信息。
[0011] 根据本发明的另一方面,本发明还提供一种分布式服务的监控装置,所述装置包 括:日志获取单元,用于获取从分布式服务的多个模块采集的业务请求处理日志,其中,在 所述从所述多个模块采集的业务请求处理日志的日志记录当中被记录的同一业务请求具 有相同的业务请求标识,并且所述日志记录包括当前模块的第一模块标识和调用所述当前 模块的调用模块的第二模块标识;日志记录聚合单元,用于将具有相同的业务请求标识的 日志记录分别聚合为日志记录集合;日志记录集合分析单元,用于对聚合得到的日志记录 集合分别进行分析,其中,对处理结果发生异常的业务请求,根据所述业务请求在模块之间 的调用关系生成所述业务请求的请求调用关系拓扑图。
[0012] 可选地,所述装置还包括日志记录索引生成单元,用于从所述日志记录分别提取 业务请求标识、第一模块标识、第二模块标识以及关于处理结果状态的数据,生成相应的日 志记录索引。
[0013] 可选地,所述日志记录聚合单元用于将具有相同的业务请求标识的日志记录索引 分别聚合为日志记录索引集合;所述日志记录集合分析单元用于对聚合得到的日志记录索 引集合分别进行分析,其中,对处理结果发生异常的业务请求,根据所述业务请求在模块之 间的调用关系生成异常模块被标注的所述业务请求的请求调用关系拓扑图。
[0014] 可选地,所述装置还包括报警信息生成单元,用于根据所述请求调用关系拓扑图 和相应的日志记录索引集合生成所述业务请求的报警信息。
[0015] 可选地,所述装置还包括报警信息提供单元,用于发送或展示所述报警信息。
[0016] 本发明实施例所提供的分布式服务的监控方法及装置,对同一业务请求的多个处 理模块配置相同的业务请求标识,并记录在包括业务请求标识、当前模块的第一模块标识 和调用当前模块的调用模块的第二模块标识的日志记录中,然后分析具有相同的业务请求 标识的日志记录聚合得到的日志记录集合。当某一业务请求的处理结果发生异常时,根据 日志记录集合中记录的该业务请求的模块之间的调用关系自动生成相应的请求调用关系 拓扑图,以方便异常业务请求的快速止损。
【附图说明】
[0017] 图1是示出本发明示例性实施例分布式服务的监控方法的流程示意图;
[0018] 图2是示出本发明具体实施例的业务请求处理日志的日志记录的示意图;
[0019] 图3是示出本发明具体实施例的请求调用关系拓扑图的示意图;
[0020] 图4是示出本发明示例性实施例分布式服务的监控装置的结构示意图。
【具体实施方式】
[0021] 本发明的基本构思是,提供一种分布式服务的监控方法以及实现所述方法的装 置。针对同一业务请求,在其各模块的业务请求处理日志中采用相同的业务请求标识,且在 各日志记录中,录入有当前模块的第一模块标识和调用所述当前模块的调用模块的第二模 块标识。由此,当某一业务请求的处理结果发生异常时,可根据该业务请求在模块之间的调 用关系自动生成相应的请求调用关系拓扑图,实现异常业务请求的快速止损。
[0022] 下面结合附图对本发明示例性实施例的分布式服务的监控方法及装置进行详细 描述。
[0023] 实施例一
[0024] 图1是示出本发明示例性实施例分布式服务的监控方法的流程示意图。
[0025] 参照图1,在步骤S110,获取从分布式服务的多个模块采集的业务请求处理日志。
[0026] 其中,在从多个模块采集的业务请求处理日志的日志记录当中被记录的同一业务 请求具有相同的业务请求标识,并且日志记录包括当前模块的第一模块标识和调用所述当 前模块的调用模块的第二模块标识。除此之外,日志记录中还可包括第一模块的IP地址、 第二模块的IP地址、到达当前模块的时间、业务请求在当前模块的耗时及处理结果等信 息。其中,处理同一业务请求的各模块的业务请求标识通过以下方式获得:将处理该业务请 求的第一个模块配置一个相应的业务请求标识,之后处理该业务请求的各模块均配置与第 一个模块相同的业务请求标识,并记录在各模块的业务请求处理日志的日志记录中。
[0027] 在步骤S120,将具有相同的业务请求标识的日志记录分别聚合为日志记录集合。
[0028] 具体地,根据业务请求标识对所有的日志记录进行分组,将业务请求标识相同的 所有的日志记录划分为一组,生成一个或多个日志记录集合,方便后续处理。
[0029] 在步骤S130,对聚合得到的日志记录集合分别进行分析,其中,对处理结果发生 异常的业务请求,根据业务请求在模块之间的调用关系生成业务请求的请求调用关系拓扑 图。
[0030] 具体地,将步骤S120中得到的日志记录集合进行分析。分析过程如下:检测任一 日志记录集合中的每一日志记录的标识处理结果状态的数据是否正常,若上述标识处理结 果状态的数据有一个或多个异常,则认为相应的业务请求的处理结果发生异常。此后,根据 该业务请求在模块之间的调用关系生成该业务请求的请求调用关系拓扑图。其中,可从该 业务请求对应的日志记录集合中获取处理业务请求的模块之间的调用关系的数据,即日志 记录中的第一模块标识和第二模块标识。
[0031] 这里所说的请求调用关系拓扑图可以是实际绘制的请求调用关系拓扑图,也可以 是从逻辑上反映各个模块之间调用关系的数据,以基于所述数据构建所述请求调用关系拓 扑图。
[0032] 在此,为快速定位发生异常的模块,可将上述请求调用关系拓扑图中的异常模块 做标注。
[0033] 本发明实施例所提供的分布式服务的监控方法对同一业务请求的多个处理模块 配置相同的业务请求标识,并记录在包括业务请求标识、当前模块的第一模块标识和调用 当前模块的调用模块的第二模块标识的日志记录中,然后分析具有相同的业务请求标识的 日志记录聚合得到的日志记录集合。当某一业务请求的处理结果发生异常时,根据日志记 录集合中记录的该业务请求的模块之间的调用关系自动生成相应的请求调用关系拓扑图, 以方便异常业务请求的快速止损。
[0034] 通常由于各个模块执行的功能不同,其记录的业务请求处理日志包含的数据大多 不同。为了提高数据处理效率,可将从各个模块采集的业务请求处理日志的日志记录处理 为统一的结构格式。
[0035] 因此,可选地,上述实施例中的分布式服务的监控方法还可包括日志结构化步骤: 从日志记录分别提取业务请求标识、第一模块标识、第二模块标识以及关于处理结果状态 的数据,生成相应的日志记录索引。此外,日志记录索引中还可包括第一模块的IP地址、第 二模块的IP地址等信息,以获取关于模块更为确切、丰富的信息。
[0036] 进一步地,步骤S120的处理可包括:将具有相同的业务请求标识的日志记录索引 分别聚合为日志记录索引集合。
[0037] 相应地,步骤S130的处理可包括:对聚合得到的日志记录索引集合分别进行分 析,其中,对处理结果发生异常的业务请求,根据业务请求在模块之间的调用关系生成异常 模块被标注的业务请求的请求调用关系拓扑图。
[0038] 上述分布式服务的监控方法,对聚合得到的业务请求的日志记录索引集合进行分 析,当分析出某一业务请求的处理结果发生异常时,根据该业务请求的模块之间的调用关 系构建出请求调用关系拓扑图。由于日志记录索引集合的数据量比日志记录集合的数据量 小得多,所以分析日志记录索引集合和从日志记录索引集合获知业务请求的模块之间的调 用关系的计算量也要小得多,这提高了生成请求调用关系拓扑图的效率,更有利于异常业 务请求的快速止损。
[0039]
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1