服务的监控方法、装置、计算机设备及存储介质与流程

文档序号:19385423发布日期:2019-12-11 00:54阅读:158来源:国知局
服务的监控方法、装置、计算机设备及存储介质与流程

本发明实施例涉及数据处理领域,尤其涉及一种服务的监控方法、装置、计算机设备及存储介质。



背景技术:

随着互联网时代的发展,计算机设备的功能种类越来越多,对应的业务功能的扩大,监控业务的服务数量也在增多,在监控业务的服务资源有限的情况下,实时了解服务的监控情况成为必要。

然而现有的业务的监控,通常采用nginx的各业务的业务接口错误码zabbix报警,然而,在出现服务每秒查询率突增或java虚拟机异常造成的服务内存溢出或者假死时,通常先服务宕机后进行告警,当宕机后告警的方式无法提前预判服务的告警,严重影响服务的稳定性。



技术实现要素:

鉴于此,为解决上述技术问题或部分技术问题,本发明实施例提供一种服务的监控方法、装置、计算机设备及存储介质。

第一方面,本发明实施例提供一种服务的监控方法,包括:

基于决策树模型确定服务对应的预警条件;

实时获取所述服务对应的日志文件;

从所述日志文件中确定监控对象的数据信息;

判断所述数据信息是否符合所述预警条件;

若所述数据信息符合所述预警条件,则发出预警信息。

在一个可能的实施方式中,所述基于决策树模型确定服务对应的预警条件,包括:

将所述服务的属性信息作为决策树模型的输入,以使所述决策树模型输出所述服务触发所述预警条件时对应的第一阈值和/或第二阈值;

将垃圾回收率大于所述第一阈值作为预警条件;和/或,将内存回收比例大于所述第二阈值作为预警条件。

在一个可能的实施方式中,所述实时获取所述服务对应的日志文件,包括:

配置java虚拟机jvm服务对应垃圾回收gc的日期参数、时间戳参数以及存储路径参数;

基于所述gc的所述日期参数、所述时间戳参数以及所述存储路径参数,获取所述jvm服务对应的gc日志文件。

在一个可能的实施方式中,所述方法还包括:

将所述gc日志文件与所述服务的属性信息进行关联,生成gc日志记录,以使在所述gc日志记录中的所述gc日志文件与所述服务一一对应;

将所述gc日志记录存储于分布式消息集群kafka。

在一个可能的实施方式中,所述从所述日志文件中确定监控对象的数据信息,包括:

调用流处理框架flink进程,根据属性信息查询所述kafka,确定所述属性信息对应的所述gc日志记录;

从所述gc日志记录中获取待监控的垃圾回收信息和/或内存回收信息。

在一个可能的实施方式中,所述从所述gc日志记录中获取待监控的垃圾回收信息和/或内存回收信息,包括:

基于设定的时间窗口对多个所述gc日志记录进行过滤,得到处于所述时间窗口内的多个gc日志记录;

对处于所述时间窗口内的多个gc日志记录进行聚合;

统计聚合后所述gc日志记录中的垃圾回收信息和/或内存回收信息,其中,所述垃圾回收信息中包括不同类型gc的信息;

存储所述垃圾回收信息和/或所述内存回收信息。

在一个可能的实施方式中,所述决策树模型通过以下方式训练:

将存储的历史垃圾回收信息作为训练样本;

将所述训练样本输入所述决策树模型计算垃圾回收率;

基于所述服务宕机时对应的垃圾回收率调整所述决策树模型输出的第一阈值;

当所述第一阈值与所述服务宕机时对应的垃圾回收率的差值小于第三阈值时,则确定所述决策树模型训练完成。

在一个可能的实施方式中,所述决策树模型通过以下方式训练:

将存储的历史内存回收信息作为训练样本;

将所述训练样本输入所述决策树模型计算内存回收比例;

基于所述服务宕机时对应的内存回收比例调整所述决策树模型输出的第二阈值;

当所述第二阈值与所述服务宕机时对应的内存回收比例的差值小于第三阈值时,则确定所述决策树模型训练完成。

第二方面,本发明实施例提供一种服务的监控装置,包括:

确定模块,用于基于决策树模型确定服务对应的预警条件;

获取模块,用于实时获取所述服务对应的日志文件;

所述确定模块,还用于从所述日志文件中确定监控对象的数据信息;

判断模块,用于判断所述数据信息是否符合所述预警条件;

预警模块,用于确定若所述数据信息符合所述预警条件,则发出预警信息。

第三方面,本发明实施例提供一种计算机设备包括:处理器和存储器,所述处理器用于执行所述存储器中存储的数据处理程序,以实现上述第一方面中任一项所述的服务的监控方法。

第四方面,本发明实施例提供一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述第一方面中任一项所述的服务的监控方法。

本发明实施例提供的服务的监控方案,通过基于决策树模型确定服务对应的预警条件,实时获取服务对应的日志文件;从所述日志文件中确定监控对象的数据信息;判断所述数据信息是否符合预警条件;若所述数据信息符合预警条件,则发出预警信息,通过设置预警条件,触发预警条件进行预警的方式可以有效地对运行中的服务进行监控,再通过预警信息进行提示,便于确定符合预警条件的服务,及时对该服务的运行参数进行相应调整,保证服务运行过程中的稳定性。

附图说明

图1为本发明实施例提供的一种服务的监控方法流程示意图;

图2为本发明实施例提供的另一种服务的监控方法流程示意图;

图3为本发明实施例提供的服务的监控系统结构示意图;

图4为本发明实施例提供一种服务的监控装置的结构示意图;

图5为本发明实施例提供的一种的计算机设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。

图1为本发明实施例提供的一种服务的监控方法流程示意图,如图1所示,该方法具体包括:

s11、基于决策树模型确定服务对应的预警条件。

本发明实施例的服务的监控方法应用于计算机设备,在计算机设备中通过服务对某类业务进行监控,在监控到该类业务的业务量突增,在服务压力过大导致计算机设备宕机前,对监控该类业务的服务进行预警。

决策树模型通过服务出现内存溢出或假死使得计算机设备出现宕机时服务的历史运行参数,再根据该历史运行参数确定服务对应的预警条件。

s12、实时获取服务对应的日志文件。

计算机设备实时获取服务在监控业务时对应的日志文件。

s13、从所述日志文件中确定监控对象的数据信息。

确定服务监控业务时的监控对象,从该日志文件中获取监控对象的数据信息,例如,监控某业务时的垃圾回收信息或内存回收信息。

s14、判断所述数据信息是否符合预警条件。

在本实施例中,为预防现有技术中计算机设备先出现宕机后进行告警的弊端,预先通过决策树模型设置预警条件(其中,预警条件低于该服务使计算机设备宕机时对应的运行参数),并将该预警条件存储于计算机设备中;例如,若服务的某数据值达到85%时,计算机设备出现宕机,则将预警条件设置为某数据值达到75%。

s15、若所述数据信息符合预警条件,则发出预警信息。

对监控对象的数据信息进行实时判断,判断该数据信息是否符合预警条件,若符合预警条件,则将该预警信息发送给该服务对应的终端设备,终端设备显示或语音播报该预警信息,以进行相应提示,通过该预警信息可调整服务的运行参数,保证该服务处于正常运行状态。

本发明实施例提供的服务的监控方法,通过基于决策树模型确定服务对应的预警条件,实时获取服务对应的日志文件;从所述日志文件中确定监控对象的数据信息;判断所述数据信息是否符合预警条件;若所述数据信息符合预警条件,则发出预警信息,通过设置预警条件,触发预警条件进行预警的方式可以有效地对运行中的服务进行监控,再通过预警信息进行提示,便于确定符合预警条件的服务,及时对该服务的运行参数进行相应调整,保证服务运行过程中的稳定性。

图2为本发明实施例提供的另一种服务的监控方法流程示意图,如图2所示,该方法具体包括:

s21、基于决策树模型确定服务对应的预警条件。

本实施例的服务的监控方法解决服务的每秒查询率(querypersecond,qps)突增,或java虚拟机(javavirtualmachine,jvm)异常时,出现先宕机后预警的问题,采用监控jvm服务的垃圾回收(garbagecollection,gc)日志文件形式对jvm服务进行监控。

为了方便描述,下文中将jvm服务和垃圾回收gc采用小写的形式表述,如,jvm服务、垃圾回收gc。

具体地,将所述服务的属性信息作为决策树模型的输入,以使所述决策树模型输出所述服务触发所述预警条件时对应的第一阈值和/或第二阈值;将垃圾回收率大于所述第一阈值作为预警条件;和/或,将内存回收比例大于所述第二阈值作为预警条件。

进一步地,决策树模型通过以下方式训练:

针对历史垃圾回收信息,将存储的历史垃圾回收信息作为训练样本;将所述训练样本输入所述决策树模型计算垃圾回收率;基于所述服务宕机时对应的垃圾回收率调整所述决策树模型输出的第一阈值;当所述第一阈值与所述服务宕机时对应的垃圾回收率的差值小于第三阈值时,则确定所述决策树模型训练完成。

例如,将存储的历史垃圾回收信息输入决策树模型,决策树模型根据该历史垃圾回收信息计算其对应的垃圾回收率(例如,采用标记算法确定垃圾回收率,在标记阶段遍历历史垃圾回收信息中所有的对象,在活动的对象头打上活动的标记,在清除阶段再次遍历所有对象,检查对象头,对于没有活动标记的对象,将其内存空间释放;对于有活动标记的对象,去掉标记,通过标记阶段和清除阶段有无活动标记确定对象的垃圾回收率。)

再根据服务使计算机设备宕机时的历史垃圾回收信息,确定对应的垃圾回收率;将该垃圾回收率作为训练目标,调整决策树模型以使决策树模型输出的第一阈值与训练目标之间的差值小于第三阈值时,则确定所述决策树模型训练完成。

例如,训练目标为70%,第三阈值为1%,当决策树模型输出的第一阈值处于69%-71%时,则确定决策树模型训练完成。

针对历史内存回收信息,将存储的历史内存回收信息作为训练样本;将所述训练样本输入所述决策树模型计算内存回收比例;基于所述服务宕机时对应的内存回收比例调整所述决策树模型输出的第二阈值;当所述第二阈值与所述服务宕机时对应的内存回收比例的差值小于第三阈值时,则确定所述决策树模型训练完成。

对于根据历史内存回收信息对决策树模型进行训练的过程与上述根据历史垃圾回收信息对决策树模型进行训练的过程类型,可参照上述相关描述,为简洁描述,在此,不作赘述。

s22、配置java虚拟机jvm服务对应垃圾回收gc的日期参数、时间戳参数以及存储路径参数。

s23、基于所述gc的所述日期参数、所述时间戳参数以及所述存储路径参数,获取所述jvm服务对应的gc日志文件。

对于配置java虚拟机jvm服务对应垃圾回收gc的日期参数、时间戳参数以及存储路径参数中的各参数可通过代码的形式进行配置。

例如,gc的日期参数对应的配置代码为:-xx:+printgcdetails;gc时间戳参数对应的配置代码为:-xx:+printgcdatestamps;gc的存储路径参数对应的配置代码为:-xloggc:../logs/gc.log。

在通过代码配置完成获取gc日志文件的参数后,执行上述配置代码,获取jvm服务对应的gc日志文件。

在本发明发明实施例的一可选方案中,对gc日志文件按照设定格式进行打印,并对gc日志文件进行数据抽取、清洗、转换、装载(extract,transform,load,etl),确保获取到gc日志文件格式统一,设定格式可包括如下信息:gc时间、垃圾回收类型(minorgc或fullgc),新生代gc还是老年代gc,gc发生区域,gc前后内存变化或垃圾回收器等。

其中,新生代gc(主要是用来存放新生的对象)对应的垃圾回收类型为minorgc,老年代gc(主要存放应用程序中生命周期长的内存对象)对应的垃圾回收类型为fullgc;gc前后内存变化为垃圾回收前和垃圾回收后运行该服务的计算机设备的内存的变化;垃圾回收器为回收垃圾的容器。

s24、将所述gc日志文件与所述服务的属性信息进行关联生成gc日志记录,以使在所述gc日志记录中的所述gc日志文件与所述服务一一对应。

s25、将所述gc日志记录存储于分布式消息集群kafka。

将gc日志文件对服务的属性信息进行关联,例如,gc日志文件a,对应服务的属性信息a,gc日志文件b,对应服务的属性信息b,将a和a进行关联,将b和b进行关联。

其中,属性信息可以包括,但不限于:服务名、机房、集群、应用名等。

在本实施例的一可选方案中,参照图3,通过容器服务器将服务的属性信息与gc日志文件进行关联,具体采用venus-agent脚本获取gc日志文件,使用venus-sdk将容器服务的属性信息与gc日志文件进行合并,生成gc日志记录(生成gc日志记录的目的在于通过查询属性信息可调取服务相应的gc日志文件),并将gc日志记录发送到分布式消息集群kafka。

s26、调用流处理框架flink进程,根据属性信息查询所述kafka,确定所述属性信息对应的所述gc日志记录。

s27、从所述gc日志记录中获取待监控的垃圾回收信息和/或内存回收信息。

参照图3,通过调用flink进程对存储于kafka各节点中的gc日志记录进行监听,根据服务的属性信息查询存储于kafka中的gc日志记录,并对获取到的gc日志记录进行数据清洗,flink进程调用实时计算服务,实时计算服务根据时间窗口进行消费,得到待监控的垃圾回收信息和/或内存回收信息。

对获取到的gc日志记录进行数据清洗,实时计算服务根据时间窗口进行消费具体包括:

基于设定的时间窗口对多个所述gc日志记录进行过滤,得到处于所述时间窗口内的多个gc日志记录;对处于所述时间窗口内的多个gc日志记录进行聚合;统计聚合后所述gc日志记录中的垃圾回收信息和/或内存回收信息,其中,所述垃圾回收信息中包括不同类型gc的信息;存储所述垃圾回收信息和/或所述内存回收信息。

例如,以时间窗口为依据对gc日志记录进行过滤,去除不在该时间窗口的gc日志记录;对处于该时间窗口期内的多个gc日志记录,按照不同服务、不同机房及不同应用分别进行数据聚合;flink进程再调用实时计算服务,实时统计聚合后gc日志记录中不同gc类型的垃圾回收信息和/或内存回收信息(例如,实时计算minorgc对应的垃圾回收信息,又如,实时计算fullgc对应的垃圾回收信息)。

在本发明实施例的一可选方案中,参照图3,flink进程将获取到的垃圾回收信息和/或内存回收信息存储于数据连接池durid。

在本发明实施例的一可选方案中,还可采用搜索服务器(elasticsearch,es)代替durid。

在本发明实施例的一可选方案中,根据durid中存储的监控信息按照多个维度生成显示信息对应的数据包,通过接口调用提供web界面,在所述web界面上对该数据包对应的显示信息进行显示。

具体地,对durid中存储的监控信息设置技术count指标,定义多个维度指标,根据多个维度指标生产显示信息。多个维度可以是,但不限于:名称、簇(磁盘是由一个一个扇区组成的,若干个扇区合为一个簇)、系统文件、垃圾原因及gc前后内容变化等。

通过granfana开源工具为服务的监控提供web界面,通过调用接口将数据包发送至web界面,在web界面加载该数据包,进而显示该显示信息;通过web界面便于对服务进行查询和监控。

s28、基于所述垃圾回收信息确定所述服务对应的垃圾回收率是否大于第一阈值;和/或,基于所述内存回收信息确定所述服务对应的内存回收比例是否大于第二阈值。

flink进程实时监控存储于durid中垃圾回收信息,在durid中垃圾回收信息更新后,flink进程根据垃圾回收信息计算得到服务对应的垃圾回收率,可采用标记算法确定垃圾回收率(参照s21中的相关描述,在此不作赘述),判断垃圾回收率是否大于第一阈值。

和/或,

flink进程实时监控存储于durid中内存回收信息,在durid中内存回收信息更新后,flink进程根据内存回收信息计算得到服务对应的内存回收比例,可采用标记算法确定内存回收比例(参照s21中的相关描述,在此不作赘述),判断的内存回收比例是否大于第二阈值。

若确定所述垃圾回收率大于第一阈值或所述内存回收比例大于第二阈值,则执行s29;否则继续执行s22-s27获取垃圾回收信息和/或内存回收信息。

其中,触发预警的条件包括:所述垃圾回收率大于第一阈值且所述内存回收比例大于第二阈值、所述垃圾回收率大于第一阈值且所述内存回收比例小于等于第二阈值,或所述垃圾回收率小于等于第一阈值且所述内存回收比例大于第二阈值。

不触发预警的条件包括:所述垃圾回收率小于等于第一阈值且所述内存回收比例小于等于第二阈值。

s29、若确定所述垃圾回收率大于第一阈值或所述内存回收比例大于第二阈值,则发出预警信息。

若确定所述垃圾回收率大于第一阈值或所述内存回收比例大于第二阈值,则调用应用程序编程(applicationprogramminginterface,api)接口,预警服务器通过api接口将预警信息发送给该服务对应的终端设备,终端设备显示或语音播报该预警信息,以进行相应提示,通过该预警信息可调整服务的运行参数,保证该服务处于正常运行状态。

图4为本发明实施例提供一种服务的监控装置的结构示意图,如图4所示,该结构具体包括:

确定模块401,用于基于决策树模型确定服务对应的预警条件;

获取模块402,用于实时获取所述服务对应的日志文件;

所述确定模块401,还用于从所述日志文件中确定监控对象的数据信息;

判断模块403,用于判断所述数据信息是否符合所述预警条件;

预警模块404,用于若所述数据信息符合所述预警条件,则发出预警信息。

可选地,确定模块401,具体用于将所述服务的属性信息作为决策树模型的输入,以使所述决策树模型输出所述服务触发所述预警条件时对应的第一阈值和/或第二阈值;将垃圾回收率大于所述第一阈值作为预警条件;和/或,将内存回收比例大于所述第二阈值作为预警条件。

可选地,获取模块402,具体用于配置java虚拟机jvm服务对应垃圾回收gc的日期参数、时间戳参数以及存储路径参数;基于所述gc的所述日期参数、所述时间戳参数以及所述存储路径参数,获取所述jvm服务对应的gc日志文件。

可选地,所述装置还包括:存储模块405,用于将所述gc日志文件与所述服务的属性信息进行关联,生成gc日志记录,以使在所述gc日志记录中的所述gc日志文件与所述服务一一对应;将所述gc日志记录存储于分布式消息集群kafka。

可选地,确定模块401,具体用于调用流处理框架flink进程,根据属性信息查询所述kafka,确定所述属性信息对应的所述gc日志记录;从所述gc日志记录中获取待监控的垃圾回收信息和/或内存回收信息。

可选地,确定模块401,具体用于基于设定的时间窗口对多个所述gc日志记录进行过滤,得到处于所述时间窗口内的多个gc日志记录;对处于所述时间窗口内的多个gc日志记录进行聚合;统计聚合后所述gc日志记录中的垃圾回收信息和/或内存回收信息,其中,所述垃圾回收信息中包括不同类型gc的信息;存储所述垃圾回收信息和/或所述内存回收信息。

可选地,所述装置还包括:训练模块406,用于将存储的历史垃圾回收信息作为训练样本;将所述训练样本输入所述决策树模型计算垃圾回收率;基于所述服务宕机时对应的垃圾回收率调整所述决策树模型输出的第一阈值;当所述第一阈值与所述服务宕机时对应的垃圾回收率的差值小于第三阈值时,则确定所述决策树模型训练完成。

可选地,训练模块406,用于将存储的历史内存回收信息作为训练样本;将所述训练样本输入所述决策树模型计算内存回收比例;基于所述服务宕机时对应的内存回收比例调整所述决策树模型输出的第二阈值;当所述第二阈值与所述服务宕机时对应的内存回收比例的差值小于第三阈值时,则确定所述决策树模型训练完成。

本实施例提供的服务的监控装置可以是如图4中所示的服务的监控装置,可执行如图1-2中服务的监控方法的所有步骤,进而实现图1-2所示服务的监控方法的技术效果,具体请参照图1-2相关描述,为简洁描述,在此不作赘述。

图5为本发明实施例提供的一种的计算机设备的结构示意图,图5所示的计算机设备500包括:至少一个处理器501、存储器502、至少一个网络接口504和其他用户接口503。计算机设备500中的各个组件通过总线系统505耦合在一起。可理解,总线系统505用于实现这些组件之间的连接通信。总线系统505除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图5中将各种总线都标为总线系统505。

其中,用户接口503可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。

可以理解,本发明实施例中的存储器502可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-onlymemory,rom)、可编程只读存储器(programmablerom,prom)、可擦除可编程只读存储器(erasableprom,eprom)、电可擦除可编程只读存储器(electricallyeprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(randomaccessmemory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(staticram,sram)、动态随机存取存储器(dynamicram,dram)、同步动态随机存取存储器(synchronousdram,sdram)、双倍数据速率同步动态随机存取存储器(doubledataratesdram,ddrsdram)、增强型同步动态随机存取存储器(enhancedsdram,esdram)、同步连接动态随机存取存储器(synchlinkdram,sldram)和直接内存总线随机存取存储器(directrambusram,drram)。本文描述的存储器502旨在包括但不限于这些和任意其它适合类型的存储器。

在一些实施方式中,存储器502存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统5021和应用程序5022。

其中,操作系统5021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序5022,包含各种应用程序,例如媒体播放器(mediaplayer)、浏览器(browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序5022中。

在本发明实施例中,通过调用存储器502存储的程序或指令,具体的,可以是应用程序5022中存储的程序或指令,处理器501用于执行各方法实施例所提供的方法步骤,例如包括:

基于决策树模型确定服务对应的预警条件;实时获取所述服务对应的日志文件;从所述日志文件中确定监控对象的数据信息;判断所述数据信息是否符合所述预警条件;若所述数据信息符合所述预警条件,则发出预警信息。

可选地,将所述服务的属性信息作为决策树模型的输入,以使所述决策树模型输出所述服务触发所述预警条件时对应的第一阈值和/或第二阈值;将垃圾回收率大于所述第一阈值作为预警条件;和/或,将内存回收比例大于所述第二阈值作为预警条件。

可选地,配置java虚拟机jvm服务对应垃圾回收gc的日期参数、时间戳参数以及存储路径参数;基于所述gc的所述日期参数、所述时间戳参数以及所述存储路径参数,获取所述jvm服务对应的gc日志文件。

可选地,将所述gc日志文件与所述服务的属性信息进行关联,生成gc日志记录,以使在所述gc日志记录中的所述gc日志文件与所述服务一一对应;将所述gc日志记录存储于分布式消息集群kafka。

可选地,调用流处理框架flink进程,根据属性信息查询所述kafka,确定所述属性信息对应的所述gc日志记录;从所述gc日志记录中获取待监控的垃圾回收信息和/或内存回收信息。

可选地,基于设定的时间窗口对多个所述gc日志记录进行过滤,得到处于所述时间窗口内的多个gc日志记录;对处于所述时间窗口内的多个gc日志记录进行聚合;统计聚合后所述gc日志记录中的垃圾回收信息和/或内存回收信息,其中,所述垃圾回收信息中包括不同类型gc的信息;存储所述垃圾回收信息和/或所述内存回收信息。

可选地,将存储的历史垃圾回收信息作为训练样本;将所述训练样本输入所述决策树模型计算垃圾回收率;基于所述服务宕机时对应的垃圾回收率调整所述决策树模型输出的第一阈值;当所述第一阈值与所述服务宕机时对应的垃圾回收率的差值小于第三阈值时,则确定所述决策树模型训练完成。

可选地,将存储的历史内存回收信息作为训练样本;将所述训练样本输入所述决策树模型计算内存回收比例;基于所述服务宕机时对应的内存回收比例调整所述决策树模型输出的第二阈值;当所述第二阈值与所述服务宕机时对应的内存回收比例的差值小于第三阈值时,则确定所述决策树模型训练完成。

上述本发明实施例揭示的方法可以应用于处理器501中,或者由处理器501实现。处理器501可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器501中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器501可以是通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(fieldprogrammablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器502,处理器501读取存储器502中的信息,结合其硬件完成上述方法的步骤。

可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(applicationspecificintegratedcircuits,asic)、数字信号处理器(digitalsignalprocessing,dsp)、数字信号处理设备(dspdevice,dspd)、可编程逻辑设备(programmablelogicdevice,pld)、现场可编程门阵列(field-programmablegatearray,fpga)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

本实施例提供的计算机设备可以是如图5中所示的计算机设备,可执行如图1-2中服务的监控方法的所有步骤,进而实现图1-2所示服务的监控方法的技术效果,具体请参照图1-2相关描述,为简洁描述,在此不作赘述。

本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。

当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在服务的监控设备侧执行的服务的监控方法。

所述处理器用于执行存储器中存储的服务的监控程序,以实现以下在服务的监控设备侧执行的服务的监控方法的步骤:

基于决策树模型确定服务对应的预警条件;实时获取所述服务对应的日志文件;从所述日志文件中确定监控对象的数据信息;判断所述数据信息是否符合所述预警条件;若所述数据信息符合所述预警条件,则发出预警信息。

可选地,将所述服务的属性信息作为决策树模型的输入,以使所述决策树模型输出所述服务触发所述预警条件时对应的第一阈值和/或第二阈值;将垃圾回收率大于所述第一阈值作为预警条件;和/或,将内存回收比例大于所述第二阈值作为预警条件。

可选地,配置java虚拟机jvm服务对应垃圾回收gc的日期参数、时间戳参数以及存储路径参数;基于所述gc的所述日期参数、所述时间戳参数以及所述存储路径参数,获取所述jvm服务对应的gc日志文件。

可选地,将所述gc日志文件与所述服务的属性信息进行关联,生成gc日志记录,以使在所述gc日志记录中的所述gc日志文件与所述服务一一对应;将所述gc日志记录存储于分布式消息集群kafka。

可选地,调用流处理框架flink进程,根据属性信息查询所述kafka,确定所述属性信息对应的所述gc日志记录;从所述gc日志记录中获取待监控的垃圾回收信息和/或内存回收信息。

可选地,基于设定的时间窗口对多个所述gc日志记录进行过滤,得到处于所述时间窗口内的多个gc日志记录;对处于所述时间窗口内的多个gc日志记录进行聚合;统计聚合后所述gc日志记录中的垃圾回收信息和/或内存回收信息,其中,所述垃圾回收信息中包括不同类型gc的信息;存储所述垃圾回收信息和/或所述内存回收信息。

可选地,将存储的历史垃圾回收信息作为训练样本;将所述训练样本输入所述决策树模型计算垃圾回收率;基于所述服务宕机时对应的垃圾回收率调整所述决策树模型输出的第一阈值;当所述第一阈值与所述服务宕机时对应的垃圾回收率的差值小于第三阈值时,则确定所述决策树模型训练完成。

可选地,将存储的历史内存回收信息作为训练样本;将所述训练样本输入所述决策树模型计算内存回收比例;基于所述服务宕机时对应的内存回收比例调整所述决策树模型输出的第二阈值;当所述第二阈值与所述服务宕机时对应的内存回收比例的差值小于第三阈值时,则确定所述决策树模型训练完成。

专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1