流媒体故障监测方法、装置、电子设备及存储介质与流程

文档序号:20614955发布日期:2020-05-06 20:02阅读:280来源:国知局
流媒体故障监测方法、装置、电子设备及存储介质与流程

本申请涉及互联网技术领域,特别涉及一种流媒体故障监测的方法、装置、电子设备及存储介质。



背景技术:

随着互联网技术的发展,流媒体已经成为当今互联网中最主要的服务之一。由于流媒体占用带宽较大,延时要求较高,媒体流的传输出现故障直接影响到用户的体验。因此,在用户使用流媒体的过程中,需要对流媒体进行故障监测。

相关技术提供了一种流媒体故障监测方法,该过程可以为:电子设备获取流媒体的多个质量指标,该多个质量指标包括卡顿率、开播失败率、卡顿时长和重试次数等中的多个质量指标;定时监测各个质量指标是否超出其预定的阈值;当任一质量指标超出该指标预定的阈值时,则确定流媒体服务出现故障。

该种方案只能检测流媒体出现故障,但是无法定位到具体故障位置。



技术实现要素:

本申请实施例提供了一种流媒体故障监测方法、装置、电子设备及存储介质,能够解决无法定位到具体故障位置的问题。所述技术方案如下:

第一方面,提供了一种流媒体故障监测方法,所述方法包括:

获取发送流媒体的第一终端的第一监控信息、接收所述流媒体的第二终端的第二监控信息和流媒体服务器的第三监控信息,所述第一监控信息、所述第二监控信息和所述第三监控信息包括多个监测指标的维度信息;

根据所述流媒体的流标识,将所述第一监控信息、所述第二监控信息和所述第三监控信息在同一时间窗口内进行关联;

根据预设的目标质量参数的监测条件和目标时间点,以及所述第一监控信息、所述第二监控信息和所述第三监控信息,对所述流媒体进行故障监测;

如果根据所述目标质量参数的监测条件和所述目标时间点监测到所述流媒体出现故障,根据所述第一监控信息、所述第二监控信息和所述第三监控信息,确定导致所述流媒体出现故障的至少一个维度信息。

在一种可能的实现方式中,所述根据所述第一监控信息、所述第二监控信息和所述第三监控信息,确定导致所述流媒体出现故障的至少一个维度信息,包括:

将所述第一监控信息、所述第二监控信息和所述第三监控信息输入故障归因器,输出维度列表,所述维度列表中包括出现故障的多个第一维度信息;

从所述多个监测指标中选择第一目标监测指标;

按照所述第一目标监测指标,对所述维度列表中的所述多个第一维度信息进行聚合,得到多个第二维度信息;

根据所述多个第二维度信息,确定导致所述流媒体出现故障的所述至少一个维度信息。

在另一种可能的实现方式中,所述根据所述多个第二维度信息,确定导致所述流媒体出现故障的所述至少一个维度信息,包括:

如果所述多个第二维度信息中没有相同维度信息的报警,则停止聚合,将所述多个第二维度信息确定为导致所述流媒体出现故障的所述维度信息;

如果所述多个第二维度信息中有相同维度信息的报警,则从所述多个监测指标中重新选择一个未选择的第一目标监测指标,然后按照所述重新选择的第一目标监测指标,对所述多个第二维度信息进行聚合,得到至少一个第三维度信息;

根据所述至少一个第三维度信息,确定导致所述流媒体出现故障的所述至少一个维度信息。

在另一种可能的实现方式中,所述根据所述至少一个第三维度信息,确定导致所述流媒体出现故障的所述至少一个维度信息,包括:

如果所述至少一个第三维度信息中没有相同维度信息的报警,则停止聚合,将所述至少一个第三维度信息确定为导致所述流媒体出现故障的所述维度信息;

如果所述至少一个第三维度信息中有相同维度信息的报警,则执行所述从所述多个监测指标中重新选择一个未选择的第一目标监测指标,然后按照所述重新选择的第一目标监测指标,对所述多个第二维度信息进行聚合的步骤,直到聚合得到的维度信息中没有相同维度信息的报警为止,将所述没有相同维度信息的报警得到的维度信息确定为导致所述流媒体出现故障的维度信息。

在另一种可能的实现方式中,所述根据所述第一监控信息、所述第二监控信息和所述第三监控信息,确定导致所述流媒体出现故障的至少一个维度信息,包括:

按照第二目标监测指标对所述第一监控信息、所述第二监控信息和所述第三监控信息进行拆分,得到多个第四维度信息,所述第二目标监测指标为所述多个监测指标中的任一指标;

如果所述多个第四维度信息均出现故障,则将所述多个第四维度信息确定为导致所述流媒体出现故障的所述维度信息;

如果所述多个第四维度信息中存在没有出现故障的第四维度信息,从所述多个监测指标中重新选择一个未选择的第二目标监测指标,按照所述重新选择的第二目标监测指标,对所述多个第二维度信息进行拆分,直到按照所述多个监测指标中的每个监测指标拆分完成为止。

在另一种可能的实现方式中,所述根据预设的目标质量参数的监测条件和目标时间点,以及所述第一监控信息、所述第二监控信息和所述第三监控信息,对所述流媒体进行故障监测,包括:

根据所述目标质量参数的监测条件,判断所述第一监控信息、所述第二监控信息和所述第三监控信息,在所述目标时间点是否满足所述目标质量参数的监测条件;

如果所述第一监控信息、所述第二监控信息和所述第三监控信息,在所述目标时间点满足所述目标质量参数的监测条件,确定所述流媒体的故障监测结果为根据所述目标质量参数的监测条件和所述目标时间点监测到所述流媒体出现故障;

如果所述第一监控信息、所述第二监控信息和所述第三监控信息,在所述目标时间点不满足所述目标质量参数的监测条件,确定所述流媒体的监测结果为根据所述目标质量参数的监测条件和所述目标时间点监测到所述流媒体没有出现故障。

在另一种可能的实现方式中,所述获取发送流媒体的第一终端的第一监控信息、接收所述流媒体的第二终端的第二监控信息和流媒体服务器的第三监控信息之后,所述方法还包括:

确定目标监控信息中的任一监测指标的维度信息的规范,所述目标监控信息为所述第一监控信息、所述第二监控信息和所述第三监控信息中的至少一个监控信息;

如果所述目标监控信息中的任一监测指标的维度信息不符合所述规范,确定所述任一监测指标的维度信息是非法数据,将所述目标监控信息中的所述任一监测指标的维度信息过滤。

在另一种可能的实现方式中,所述获取发送流媒体的第一终端的第一监控信息、接收所述流媒体的第二终端的第二监控信息和流媒体服务器的第三监控信息之后,所述方法还包括:

如果所述第一监控信息和所述第二监控信息中的任一监控信息中包括的维度信息不全时,从外部系统查询缺少的维度信息,将获取的维度信息添加到所述任一监控信息中。

在另一种可能的实现方式中,所述多个监测指标的维度信息包括所述第一终端所在位置信息、所述第二终端所在位置信息、内容分发网络cdn的网络信息、互联网服务提供商isp的服务信息、域名信息、所述流媒体服务器的服务器标识、所述第二终端的版本标识、所述第二终端的权限信息中的一个或者多个维度信息。

第二方面,提供了一种流媒体故障监测装置,所述装置包括:

获取模块,用于获取发送流媒体的第一终端的第一监控信息、接收所述流媒体的第二终端的第二监控信息和流媒体服务器的第三监控信息,所述第一监控信息、所述第二监控信息和所述第三监控信息包括多个监测指标的维度信息;

关联模块,用于根据所述流媒体的流标识,将所述第一监控信息、所述第二监控信息和所述第三监控信息在同一时间窗口内进行关联;

监测模块,用于根据预设的目标质量参数的监测条件和目标时间点,以及所述第一监控信息、所述第二监控信息和所述第三监控信息,对所述流媒体进行故障监测;

确定模块,用于如果根据所述目标质量参数的监测条件和所述目标时间点监测到所述流媒体出现故障,根据所述第一监控信息、所述第二监控信息和所述第三监控信息,确定导致所述流媒体出现故障的至少一个维度信息。

在一种可能的实现方式中,所述确定模块,还用于将所述第一监控信息、所述第二监控信息和所述第三监控信息输入故障归因器,输出维度列表,所述维度列表中包括出现故障的多个第一维度信息;从所述多个监测指标中选择第一目标监测指标;按照所述第一目标监测指标,对所述维度列表中的所述多个第一维度信息进行聚合,得到多个第二维度信息;根据所述多个第二维度信息,确定导致所述流媒体出现故障的所述至少一个维度信息。

在另一种可能的实现方式中,所述确定模块,还用于如果所述多个第二维度信息中没有相同维度信息的报警,则停止聚合,将所述多个第二维度信息确定为导致所述流媒体出现故障的所述维度信息;如果所述多个第二维度信息中有相同维度信息的报警,则从所述多个监测指标中重新选择一个未选择的第一目标监测指标,然后按照所述重新选择的第一目标监测指标,对所述多个第二维度信息进行聚合,得到至少一个第三维度信息;根据所述至少一个第三维度信息,确定导致所述流媒体出现故障的所述至少一个维度信息。

在另一种可能的实现方式中,所述确定模块,还用于如果所述至少一个第三维度信息中没有相同维度信息的报警,则停止聚合,将所述至少一个第三维度信息确定为导致所述流媒体出现故障的所述维度信息;如果所述至少一个第三维度信息中有相同维度信息的报警,则执行所述从所述多个监测指标中重新选择一个未选择的第一目标监测指标,然后按照所述重新选择的第一目标监测指标,对所述多个第二维度信息进行聚合的步骤,直到聚合得到的维度信息中没有相同维度信息的报警为止,将所述没有相同维度信息的报警得到的维度信息确定为导致所述流媒体出现故障的维度信息。

在另一种可能的实现方式中,所述确定模块,还用于按照第二目标监测指标对所述第一监控信息、所述第二监控信息和所述第三监控信息进行拆分,得到多个第四维度信息,所述第二目标监测指标为所述多个监测指标中的任一指标;如果所述多个第四维度信息均出现故障,则将所述多个第四维度信息确定为导致所述流媒体出现故障的所述维度信息;如果所述多个第四维度信息中存在没有出现故障的第四维度信息,从所述多个监测指标中重新选择一个未选择的第二目标监测指标,按照所述重新选择的第二目标监测指标,对所述多个第二维度信息进行拆分,直到按照所述多个监测指标中的每个监测指标拆分完成为止。

在另一种可能的实现方式中,所述监测模块,还用于根据所述目标质量参数的监测条件,判断所述第一监控信息、所述第二监控信息和所述第三监控信息,在所述目标时间点是否满足所述目标质量参数的监测条件;如果所述第一监控信息、所述第二监控信息和所述第三监控信息,在所述目标时间点满足所述目标质量参数的监测条件,确定所述流媒体的故障监测结果为根据所述目标质量参数的监测条件和所述目标时间点监测到所述流媒体出现故障;如果所述第一监控信息、所述第二监控信息和所述第三监控信息,在所述目标时间点不满足所述目标质量参数的监测条件,确定所述流媒体的监测结果为根据所述目标质量参数的监测条件和所述目标时间点监测到所述流媒体没有出现故障。

在另一种可能的实现方式中,所述装置还包括:

过滤模块,用于确定目标监控信息中的任一监测指标的维度信息的规范,所述目标监控信息为所述第一监控信息、所述第二监控信息和所述第三监控信息中的至少一个监控信息;如果所述目标监控信息中的任一监测指标的维度信息不符合所述规范,确定所述任一监测指标的维度信息是非法数据,将所述目标监控信息中的所述任一监测指标的维度信息过滤。

在另一种可能的实现方式中,所述装置还包括:

添加模块,用于如果所述第一监控信息和所述第二监控信息中的任一监控信息中包括的维度信息不全时,从外部系统查询缺少的维度信息,将获取的维度信息添加到所述任一监控信息中。

在另一种可能的实现方式中,所述多个监测指标的维度信息包括所述第一终端所在位置信息、所述第二终端所在位置信息、内容分发网络cdn的网络信息、互联网服务提供商isp的服务信息、域名信息、所述流媒体服务器的服务器标识、所述第二终端的版本标识、所述第二终端的权限信息中的一个或者多个维度信息。

第三方面,提供了一种电子设备,所述电子设备包括:一个或多个处理器;

用于存储所述一个或多个处理器可执行指令的易失性或非易失性存储器;

其中,所述一个或多个处理器被配置为执行上述第一方面的任一可能实现方式所述的流媒体故障监测方法。

第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,所述指令被电子设备的处理器执行时实现上述第一方面的任一可能实现方式所述的流媒体故障监测方法。

本申请实施例提供的技术方案带来的有益效果是:通过获取第一终端的第一监控信息、第二终端的第二监控信息和流媒体服务器的第三监控信息,根据这三个监控信息确定导致流媒体出现故障的维度信息。由于能够获取第一终端、第二终端和流媒体服务器这三端的监控信息,这三端的监控信息中包括了多个监测指标的维度信息,因此能够根据这三端的监控信息准确定位出现故障的维度信息,提高了故障监测的实时性和准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的实施环境的示意图;

图2是本申请实施例提供的流媒体故障监测的方法流程图;

图3是本申请实施例提供的流媒体故障监测的处理流程示意图;

图4是本申请实施例提供的流媒体故障监测的故障归因的示意图;

图5是本申请实施例提供的流媒体故障监测的故障归因的示意图;

图6是本申请实施例提供的流媒体故障监测的装置结构示意图;

图7是本申请实施例提供的电子设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

图1是本申请实施例提供的一种实施环境的示意图。参见图1,该实施环境中包括第一终端101、第二终端102、流媒体服务器103和电子设备104。

第一终端101和第二终端102分别与流媒体服务器103之间通过无线或者有线网络连接。并且,第一终端101和第二终端102上可以安装有流媒体服务器103提供服务的客户端。第一终端101和第二终端102对应的用户可以通过该客户端实现例如数据传输、消息交互等功能。客户端可以短视频客户端或者直播客户端等。

其中,第一终端101可以为发送流媒体的终端;第二终端102为接收流媒体的终端。例如,当客户端为直播客户端时,第一终端101为主播使用的终端;第二终端102为观众使用的终端。

需要说明的一点是,第一终端101和/或第二终端102上也可以不安装客户端,而是通过web(网络)端访问流媒体服务器103,从而实现例如数据传输、消息交互等功能。

在本申请实施例中,通过增加了一个电子设备104,电子设备104分别与第一终端101、第二终端102和流媒体服务器103之间通过有线或者无线网络连接,从而通过电子设备104实现对第一终端101、第二终端102和流媒体服务器103的流媒体进行故障监测。

第一终端101和第二终端102均可以为电脑、手机、平板电脑或者其他电子设备。流媒体服务器103和可以为一台服务器,或者由若干服务器组成的服务器集群,或者是一个云计算服务中心。电子设备104可以为终端,也可以为服务器;在本申请实施例中,对电子设备104不作具体限定。

图2是本申请实施例提供的一种流媒体故障监测的流程图。参见图2,该实施例包括:

201、获取发送流媒体的第一终端的第一监控信息、接收流媒体的第二终端的第二监控信息和流媒体服务器的第三监控信息。

第一监控信息、第二监控信息和第三监控信息包括多个监测指标的维度信息。多个监测指标可以为cdn(contentdeliverynetwork,内容分发网络)厂商、域名、isp(internetserviceprovider,互联网服务提供商)、省份、平台、版本、免流类型中的一个或者多个监测指标。多个监测指标的维度信息包括第一终端所在位置信息、第二终端所在位置信息、cdn的网络信息、isp的服务信息、域名信息、流媒体服务器的服务器标识、第二终端的版本标识和第二终端的权限信息中的一个或者多个维度信息。

其中,第一监控信息包括第一终端所在位置信息。例如,第一终端所在位置信息至少包括第一终端所在省份,还可以包括第一终端所在的城市,还可以包括第一终端所在的县区。在本申请实施例中,以第一终端所在位置信息包括第一终端所在省份为例进行说明。第一监控信息还可以包括第一终端的质量参数。质量参数可以为卡顿率、卡顿时长、网络延时、开播失败率、重试次数等中的一个或者多个质量参数。

第一监控信息中还可以包括第一流媒体信息,第一流媒体信息可以包括第一用户的用户标识、该流媒体的流标识和该流媒体的缓存时间中的一个或者多个。第一监控信息中还可以包括第一终端的版本标识。参见图3,例如,第一监控信息中还包括第一用户的user_id(用户标识):123;流媒体的stream_id(流标识):xxx;该流媒体的buffer_time(缓存时间):yy。

第二监控信息包括第二终端所在位置信息、第二终端的版本标识和第二终端的权限信息中的一个或者多个。例如,第二终端所在位置信息至少包括第二终端所在省份,还可以包括第二终端所在的城市,还可以包括第二终端所在的县区。第二终端的版本标识可以为第二终端上安装的客户端的版本标识。其中,第二终端的权限信息可以包括用户免流量类型、短视频观看数量、所在ab(web/app)实验等至少一个信息。第二监控信息还可以包括第二终端的质量参数,同样质量参数可以为卡顿率、卡顿时长、网络延时、开播失败率、重试次数等中的一个或者多个质量参数。第二监控信息还包括第二用户的user_id:123;流媒体的stream_id:xxx;该流媒体的buffer_time:yy

第三监控信息包括cdn的网络信息、isp的服务信息、域名信息和流媒体服务器的服务器标识中的一个或者多个。其中,cdn的网络信息可以为tx、js或者ali;isp的服务信息可以为移动、联通或者电信等。第三监控信息还可以流媒体的质量参数。质量参数可以为卡顿率、卡顿时长、网络延时、开播失败率、重试次数等中的一个或者多个质量参数。例如,继续参见图3,第三监控信息包括流媒体类型:zzz,流媒体。

需要说明的一点是,电子设备可以通过获取第一终端的第一流媒体日志(观众日志)、第二终端的第二流媒体日志(主播日志)和流媒体服务器的第三流媒体日志(流媒体日志),从第一流媒体日志中获取第一监控信息,从第二流媒体日志中获取第二监控信息,以及从第三流媒体日志中获取第三监控信息。

在本申请实施例中,电子设备通过获取到第一监控信息、第二监控信息和第三监控信息,这样能够获取多端数据,进而能够提高后续监测的准确性。

需要说明的一点是,电子设备还可以增加第一监控信息和第二监控信息中的任一监控信息包括的维度信息。该过程可以为:如果第一监控信息中包括的维度信息不全时,电子设备从外部系统查询第一监控信息缺少的维度信息,将获取的维度信息添加到第一监控信息中。和/或,如果第二监控信息中包括的维度信息不全时,电子设备从外部系统查询第二监控信息缺少的维度信息,将获取的维度信息添加到第二监控信息中。例如,当第二监控信息缺少的维度信息是第二终端的权限信息,电子设备从外部系统查询第二终端的权限信息,将第二终端的权限信息添加到第一监控信息中。

需要说明的一点是,外部系统是指除第一终端、第二终端和电子设备以外的系统。例如,外部系统可以为权限服务器,权限服务器中存储第一终端的权限信息。相应的,电子设备从外部系统查询第一终端的权限信息的步骤可以为:电子设备向权限服务器发送获取请求,该获取请求携带第一终端的终端标识。权限服务器接收获取请求,根据第一终端的终端标识,获取第一终端的权限信息,将第一终端的权限信息返回给电子设备。电子设备接收第一终端的权限信息。例如,继续参见图3,电子设备获取到第一终端的权限信息为mm。

同样,电子设备还可以获取第二终端的权限信息,该过程和电子设备获取第一终端的权限信息的过程相同,在此不再赘述。

在本申请实施例中,通过获取第一监控信息缺少的维度信息和/或获取第二监控信息缺少的维度信息,将第一监控信息缺少的维度信息添加到第一监控信息中和/或将第二监控信息缺少的维度信息添加到第二监控信息中,从而能够完善数据维度,进一步提高后续故障监测的准确性。

202、确定目标监控信息中的任一监测指标的维度信息的规范,如果目标监控信息中的任一监测指标的维度信息不符合该规范,确定该任一监测指标的维度信息是非法数据,将该目标监控信息中的该任一监测指标的维度信息过滤。

目标监控信息可以为第一监控信息、第二监控信息和第三监控信息中的至少一个监控信息。电子设备中存储了每个监测指标的维度信息的规范,并且以监测指标和规范的对应关系的形式进行存储;当对该任一监测指标的维度信息进行非法判断时,电子设备根据该任一监测指标,从监测指标和规范的对应关系中获取该监测指标的规范。如果该任一监测指标的维度信息不符合该规范,电子设备确定该任一监测指标的维度信息是非法数据;如果该任一监测指标的维度信息符合该规范,电子设备确定该任一监测指标的维度信息是合法数据。

例如,当该任一监测指标为省份;则该监测指标的维度信息的规范为省份集合,该省份集合中存储了多个合法省份名称。例如,当该省份为北京,该省份在该省份集合中,电子设备确定该省份的维度信息是合法数据;如果该省份不在该省份集合中,电子设备确定该省份的维度信息是非法数据,将该目标监控信息中的该省份的维度信息过滤。例如,继续参见图3,电子设备过滤出的非法数据为流媒体类型zzz。

在一种可能的实现方式中,电子设备过滤非法数据之后,还可以统计非法数据的数据在目标监控信息中的比例;当非法数据的数据比例超过预设比例时,输出第一报警信号,第一报警信号用于提示非法数据的数据比例超过预设比例。

在本申请实施例中,当非法数据的数据比例超过预设比例时,输出第一报警信号,从而提示工作人员非法数据的数据比例超过预设比例,工作人员可以及时进行故障排查,以降低非法数据的数据比例。

在另一种可能的实现方式中,电子设备过滤非法数据之后,还可以统计非法数据的数据量;当非法数据的数据量超过预设数据量时,输出第二报警信号,第二报警信号用于提示非法数据的数据量超过预设数据量。

在本申请实施例中,当非法数据的数据量超过预设数据量时,输出第二报警信号,从而提示工作人员非法数据的数据量超过预设数据量,工作人员可以及时进行故障排查,以降低非法数据的数据量。

在另一种可能的实现方式中,电子设备还可以确定目标监控信息的延迟时长;当该延迟时长超过预设时长时,输出第三报警信号,第三报警信号用于提示工作人员数据延时较大,工作人员可以进行故障排查,进一步降低故障率。

203、根据流媒体的流标识,将第一监控信息、第二监控信息和第三监控信息在同一时间窗内进行关联。

电子设备根据流媒体的流标识,确定同一流媒体标识的第一监控信息、第二监控信息和第三监控信息,在同一时间窗内将第一监控信息、第二监控信息和第三监控信息进行关联。

在本申请实施例中,在同一时间窗口内,将第一监控信息、第二监控信息和第三监控信息进行关联,从而使得观众的监控信息包含主播的监测指标的维度信息,从而监控信息关联后将有助于在监控信息中排除主播或者流媒体服务器导致流媒体出现故障等。

电子设备排除主播导致流媒体出现故障的过程可以为:电子设备根据目标质量参数的监测条件和目标时间点,判断第一监控信息在目标时间点是否满足目标质量参数的监测条件;如果第一监控信息在目标时间点满足目标质量参数的监测条件,确定导致流媒体出现故障的原因为第一终端;如果第一监控信息在目标时间点不满足目标质量参数的监测条件,确定导致流媒体出现故障的原因不是第一终端,执行步骤204。

电子设备排除流媒体服务器导致流媒体出现故障的过程可以为:电子设备根据目标质量参数的监测条件和目标时间点,确定第二监控信息在目标时间点是否满足目标质量参数的监测条件;如果第二监控信息在目标时间点满足目标质量参数的监测条件,确定导致流媒体出现故障的原因为流媒体服务器;如果第二监控信息在目标时间点不满足目标质量参数的监测条件,确定导致流媒体出现故障的原因不是流媒体服务器,执行步骤204。

需要说明的另一点是,电子设备根据流媒体的流标识,将第一监控信息、第二监控信息和第三监控信息在同一时间窗内进行关联后,可以按照预设的维度信息和时间窗口进行聚合,将聚合后的维度信息输出至druid(一种数据库名称)等数据库进行存储,以便于后续查询。当进行故障监测时,可以基于已存储的信息,执行步骤204。

204、根据预设的目标质量参数的监测条件和目标时间点,以及第一监控信息、第二监控信息和第三监控信息,对流媒体进行故障监测。

电子设备根据目标质量参数的监测条件,判断第一监控信息、第二监控信息和第三监控信息,在目标时间点是否满足目标质量参数的监测条件;如果第一监控信息、第二监控信息和第三监控信息,在目标时间点满足目标质量参数的监测条件,确定流媒体的监测结果为根据目标质量参数的监测条件和目标时间点监测到流媒体出现故障;如果第一监控信息、第二监控信息和第三监控信息,在目标时间点不满足目标质量参数的监测条件,确定流媒体的监测结果为根据目标质量参数的监测条件和目标时间点监测到流媒体没有出现故障。

其中,目标质量参数可以为卡顿率、卡顿时长、网络延时、开播失败率或者重试次数;在本申请实施例中对目标质量参数不作具体限定。目标时间点可以为传输流媒体的任一时间点。

对于第一种实现方式,目标质量参数的监测条件可以为目标质量参数超过其对应的参数阈值。例如,当目标质量参数为卡顿率时,卡顿率的监测条件为卡顿率超过3;则如果第一监控信息、第二监控信息和第三监控信息在目标时间点的卡顿率均不超过3,电子设备确定流媒体的卡顿率没有出现故障;如果第一监控信息、第二监控信息和第三监控信息中存在在目标时间点的卡顿率超过3的监控信息,电子设备确定该流媒体的卡顿率出现故障。

需要说明的一点是,在本步骤中,电子设备可以通过第一故障分类器进行故障监测;第一故障分类器为固定阈值分类器;相应的,本步骤可以为:电子设备将目标时间点的第一监控信息、第二监控信息和第三监控信息以及目标质量参数的监测条件分别输入第一故障分类器中,输出流媒体的故障监测结果;该故障监测结果包括出现故障或者没有出现故障。

在本申请实施例中,通过第一故障分类器进行故障监测,该方法比较简单,能够提高监测效率。

对于第二种实现方式,电子设备获取第一历史时刻的目标质量参数的第一参数值,获取在目标时间点的第一监控信息、第二监控信息和第三监控信息中的任一监控信息中的目标质量参数的第二参数值;确定第一质量参数和第二质量参数之间的第一差值;当该第一差值没在预设第一差值范围内时,电子设备确定该流媒体出现故障;当该第一差值在预设第一差值范围内时,电子设备确定该流媒体没有出现故障。

其中,第一历史时刻可以为当前时刻之前的任一时刻;例如,当前时刻可以为当前时刻之前1小时的时刻,当前时刻之前5小时的时刻。第一历史时刻还可以为当前时刻之前第一预设周期的任一时刻;例如,第一历史时刻可以为一天前的当前时刻或者一周前的当前时刻。

需要说明的一点是,在本步骤中,电子设备可以通过第二故障分类器进行故障监测;第二故障检测器为同比分类器;相应的,本步骤可以为:电子设备将目标时间点的第一监控信息、第二监控信息和第三监控信息,以及目标质量参数的监控条件分别输入第二故障分类器中,输出流媒体的故障监测结果,该故障监测结果包括出现故障或者没有出现故障。

当第一历史时刻为一天前的当前时刻时,该第二故障检测器可以为日同比分类器;当第一历史时刻为一周前的当前时刻时,该第二故障检测器可以为周同比分类器。

需要说明的一点是,日同比分类器或者周同比分类器可以替换为一种多层级的同比分类器;也即根据配置监测从短到厂多个时间区间,分别监测各个时间区间中的质量参数的同比变化值;并且相应的使用指数下降的不同大小的变化阈值进行分类,从而能够检测出长时间但是并不严重的故障。

在本申请实施例中,通过日同比分类器或者周同比分类器进行故障监测,能够提高监测的准确性。

对于第三种实现方式,电子设备获取第二历史时刻的目标质量参数的第三参数值,获取在目标时间点的第一监控信息、第二监控信息和第三监控信息中的任一监控信息中的目标质量参数的第二参数值;确定第二参数值和第三参数值之间的第二差值,以及目标时间点和第二历史时刻之间的第三差值;确定第二差值与第三差值的比值;当该比值小于第一预设阈值时,确定该流媒体的目标质量参数没有出现故障。当该比值不小于第一预设阈值时,确定该流媒体出现故障。

其中,第二历史时刻可以为当前时刻之前第二预设周期的任一时刻;第二预设周期可以为1个星期或者一个月。

需要说明的一点是,在本步骤中,电子设备可以通过第三故障分类器进行故障监测;第三故障检测器为环比分类器;相应的,本步骤可以为:电子设备将目标时间点的第一监控信息、第二监控信息和第三监控信息和目标质量参数的监测条件分别输入第三故障分类器中,输出流媒体的故障监测结果,该故障监测结果包括出现故障或者没有出现故障。

第三故障检测器可以为环比分类器;在本申请实施例中,通过环比分类器进行故障监测,能够提高监测的准确性。

对于第四种实现方式,电子设备获取历史客户端版本的目标质量参数的第四参数值,获取在目标时间点的第一监控信息、第二监控信息和第三监控信息中的任一监控信息中的目标质量参数的第二参数值,确定第四参数值和第二参数值之间的第四差值;当第四差值不在第二预设差值范围内时,确定该流媒体出现故障;当第四差值在第二预设差值范围内时,确定该流媒体没有出现故障。

需要说明的一点是,在本步骤中,电子设备可以通过第四分类器进行故障监测;第四分类器为大盘比较分类器;相应的,本步骤可以为:电子设备将目标时间点的第一监控信息、第二监控信息和第三监控新以及目标质量参数的监测条件分别输入第四故障分类器中,输出流媒体的故障监测结果,该故障监测结果包括出现故障或者没有出现故障。

在本申请实施例中,通过大盘比较分类器,对质量参数进行比对,从而确定质量参数是否出现故障,能够提高准确性。

205、如果根据目标质量参数的监测条件和目标时间点监测到流媒体出现故障,根据第一监控信息、第二监控信息和第三监控信息,确定导致流媒体出现故障的至少一个维度信息。

在本步骤中,可以使用从上到下的第一归因器,进行故障归因,也即以下第一种实现方式;也可以使用从下到上的第二归因器进行故障归因,也即以下第二种实现方式。

对于第一种实现方式,本步骤可以通过以下步骤(1)至(3)实现,包括:

(1)按照第二目标监测指标对第一监控信息、第二监控信息和第三监控信息进行拆分,得到多个第四维度信息,第二目标监测指标为多个监测指标中的任一指标。

(2)如果多个第四维度信息均出现故障,则将多个第四维度信息确定为导致流媒体出现故障的维度信息。

(3)如果多个第四维度信息中存在没有出现故障的第四维度信息,从多个监测指标中重新选择一个未选择的第二目标监测指标,按照重新选择的第二目标监测指标,对多个第四维度信息进行拆分,直到按照多个监测指标中的每个监测指标拆分完成为止。

电子设备重新选择的第二目标监测指标,与之前选择的第二目标监测指标为不同的监测指标。电子设备按照重新选择的第二目标监测指标,对多个第四维度信息进行拆分,得到多个第三维度信息;如果多个第三维度信息均出现故障;则电子设备将多个第三维度信息确定为导致流媒体出现故障的维度信息。如果多个第三维度信息均没有出现故障,则电子设备再从多个监测指标中重新选择一个第二目标监测指标,这次选择的第二目标监测指标与前两次选择的第二目标监测指标是不同的监测指标,也即每次都选择之前未选择过的第二目标监测指标,按照这次选择的第二目标监测指标,对多个点维度信息进行拆分,直到多个监测指标中的每个监测指标拆分完成为止,这样就能得到导致流媒体出现故障的至少一个维度信息。

在本步骤中,电子设备也可以将第一监控信息、第二监控信息和第三监控信息分别输入从上至下归因检测器,通过该从上至下归因检测器,确定出导致流媒体出现故障的至少一个监测指标。

在本申请实施例中,通过从上至下归因检测器首先检测大盘是否异常,若检测出异常,则其按照预定义的监测指标逐步向下拆分。每一步拆分的过程中,选择最精确的一个维度,提高了准确性。

在本申请实施例中,参见图4,以省份维度、isp维度、域名维度三个预定义维度为例,从上至下归因检测器的步骤为:电子设备监测到卡顿率出现故障时,则分别按照省份、isp和域名对第一监控信息、第二监控信息和第三监控信息进行拆分,得到多个第四维度信息,该多个第四维度信息为北京卡顿率异常和河北卡顿率异常、所有isp卡顿率异常和tx.pull卡顿率异常。电子设备将tx.pull卡顿率异常的第四维度信息按照除了域名维度以外其余的两个维度拆分,即将tx.pull卡顿率异常的数据按照省份和isp进行拆分,得到多个第三维度信息为北京卡顿率异常、河北卡顿率异常和天津卡顿率异常,以及所有isp卡顿率异常。电子设备将北京卡顿率异常、河北卡顿率异常和天津卡顿率异常的第三维度信息按照除了域名和省份以外其余的维度进行拆分,即将北京卡顿率异常、河北卡顿率异常和天津卡顿率异常的第三维度信息按照isp维度进行拆分,得到所有isp卡顿率异常。则电子设备确定导致流媒体出现故障至少一个监测指标的维度信息为(北京、河北、天津)tx.pull卡顿率异常。

需要说明的一点是,在本申请实施例中,是以省份维度、isp维度、域名维度三个预定义维度为例来说明从上至下归因的方法,除了这三个维度外还可以包括其他维度,例如平台维度、版本维度等,不论包括几种维度,从上至下归因检测器都按照类似的方法进行归因。

对于第二种实现方式,本步骤可以通过以下步骤(a)至(d)实现,包括:

(a)将第一监控信息、第二监控信息和第三监控信息输入故障归因器,输出维度列表,该维度列表中包括出现故障的多个第一维度信息。

(b)从多个监测指标中选择第一目标监测指标。

电子设备从多个监测指标中随机选择第一目标监测指标,也可以从多个监测指标中选择一个准确度最高的目标监测指标。

(c)按照第一目标监测指标,对维度列表中的多个第一维度信息进行聚合,得到多个第二维度信息。

(d)根据多个第二维度信息,确定导致流媒体出现故障的至少一个维度信息。

根据多个第二维度信息,确定多个第二维度信息中是否有相同维度信息的报警;如果多个第二维度信息中没有相同维度信息的报警,则停止聚合,将多个第二维度信息确定为导致流媒体出现故障的维度信息。

如果多个第二维度信息中有相同维度信息的报警,则从多个监测指标中重新选择一个未选择的第一目标监测指标,然后按照重新选择的第一目标监测指标,对多个第二维度信息进行聚合,直到聚合得到的维度信息中没有相同维度信息的报警位置,将没有相同维度信息的报警得到的维度信息确定为导致流媒体出现故障的维度信息。

其中,在本步骤中使用从下至上归因检测器。从下至上归因检测器会线列出所有异常的维度列表,然后按照预定的维度顺序向上聚合。若每次聚合中,没有相同维度的报警,则这些报警将停止聚合;若聚合后,新的维度条件检查正常,则这些报警聚合失败。

在本申请实施例中,参见图5,以省份维度、isp维度、cdn维度三个预定义维度为例,从下至上归因检测器的步骤为:

电子设备监测到卡顿率出现故障时,将出现故障的多个维度信息生成维度列表;其中,维度列表中列出所有异常数据,例如在本申请实施例中,维度列表为北京-tx-移动异常、北京-ali-移动异常、广东-js-电信异常、广东-js-移动异常、北京-js-电信异常、北京-tx-联通异常、北京-ali-联通异常、广东-js-鹏博士异常、北京-tx-电信异常、北京-ali-鹏博士异常,将异常数据按照预定义的维度聚合,例如将异常数据按照省份维度聚合,则电子设备将广东-js-电信异常和北京-js-电信异常聚合后,该异常数据在省份维度条件下检测为正常,即聚合后的结果是js-电信正常,则聚合失败遗留的报警为北京-tx-移动异常、北京-ali-移动异常、广东-js-电信异常、广东-js-移动异常、北京-js-电信异常、北京-tx-联通异常、北京-ali-联通异常、广东-js-鹏博士异常、北京-tx-电信异常、北京-ali-鹏博士异常。

电子设备将聚合失败遗留的报警按照除省份维度以外的其他维度聚合,例如将异常数据按照isp维度聚合,则将北京-tx-移动异常、北京-tx-联通异常和北京-tx-电信异常按照isp维度聚合后的数据在isp维度下的聚合结果为北京-tx异常,将北京-ali-移动异常、北京-ali-联通异常和北京-ali-鹏博士异常聚合后的数据在isp维度条件下的聚合结果为北京-ali异常,将广东-js-电信异常、广东-js-移动异常和广东-js-鹏博士异常按照jsp维度聚合后的数据在jsp维度条件下的聚合结果为广东-js异常,北京-js-电信异常停止聚合,此时聚合失败遗留的报警为空。

电子设备按照cdn维度对上一次的聚合结果进行聚合,也即将北京-tx异常和背景-ali异常进行聚合,得到的聚合结果为北京异常,则最终得到的导致流媒体出现异常的维度信息是北京异常、广东-js异常。

其中,故障归因系统也可以使用更为简单的平坦检测器。即仅仅检测配置的若干维度所形成的各个维度条件,即将所述异常的性能指标线列出来,这对于简单的指标监测非常快速和有效。

需要说明的一点是,故障归因系统还可以使用更为简单的平坦检测器,即仅仅监测配置的若干维度所形成的各个维度条件,这对于简单的指标监测非常快速和有效。

在本申请实施例中,通过获取第一终端的第一监控信息、第二终端的第二监控信息和流媒体服务器的第三监控信息,根据这三个监控信息确定导致流媒体出现故障的维度信息。由于能够获取第一终端、第二终端和流媒体服务器这三端的监控信息,这三端的监控信息中包括了多个监测指标的维度信息,因此能够根据这三端的监控信息准确定位出现故障的维度信息,提高了故障监测的实时性和准确性。

上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。

图6是本申请实施例提供的一种流媒体故障监测装置,参见图6,该装置包括:

获取模块601,用于获取发送流媒体的第一终端的第一监控信息、接收流媒体的第二终端的第二监控信息和流媒体服务器的第三监控信息,第一监控信息、第二监控信息和第三监控信息包括多个监测指标的维度信息;

关联模块602,用于根据流媒体的流标识,将第一监控信息、第二监控信息和第三监控信息在同一时间窗口内进行关联;

监测模块603,用于根据预设的目标质量参数的监测条件和目标时间点,以及第一监控信息、第二监控信息和第三监控信息,对流媒体进行故障监测;

确定模块604,用于如果根据目标质量参数的监测条件和目标时间点监测到流媒体出现故障,根据第一监控信息、第二监控信息和第三监控信息,确定导致流媒体出现故障的至少一个维度信息。

在一种可能的实现方式中,确定模块604,还用于将第一监控信息、第二监控信息和第三监控信息输入故障归因器,输出维度列表,维度列表中包括出现故障的多个第一维度信息;从多个监测指标中选择第一目标监测指标;按照第一目标监测指标,对维度列表中的多个第一维度信息进行聚合,得到多个第二维度信息;根据多个第二维度信息,确定导致流媒体出现故障的至少一个维度信息。

在另一种可能的实现方式中,确定模块604,还用于如果多个第二维度信息中没有相同维度信息的报警,则停止聚合,将多个第二维度信息确定为导致流媒体出现故障的维度信息;如果多个第二维度信息中有相同维度信息的报警,则从多个监测指标中重新选择一个未选择的第一目标监测指标,然后按照重新选择的第一目标监测指标,对多个第二维度信息进行聚合,得到至少一个第三维度信息;根据至少一个第三维度信息,确定导致流媒体出现故障的至少一个维度信息。

在另一种可能的实现方式中,确定模块604,还用于如果至少一个第三维度信息中没有相同维度信息的报警,则停止聚合,将至少一个第三维度信息确定为导致流媒体出现故障的维度信息;如果至少一个第三维度信息中有相同维度信息的报警,则执行从多个监测指标中重新选择一个未选择的第一目标监测指标,然后按照重新选择的第一目标监测指标,对多个第二维度信息进行聚合的步骤,直到聚合得到的维度信息中没有相同维度信息的报警为止,将没有相同维度信息的报警得到的维度信息确定为导致流媒体出现故障的维度信息。

在另一种可能的实现方式中,确定模块604,还用于按照第二目标监测指标对第一监控信息、第二监控信息和第三监控信息进行拆分,得到多个第四维度信息,第二目标监测指标为多个监测指标中的任一指标;如果多个第四维度信息均出现故障,则将多个第四维度信息确定为导致流媒体出现故障的维度信息;如果多个第四维度信息中存在没有出现故障的第四维度信息,从多个监测指标中重新选择一个未选择的第二目标监测指标,按照重新选择的第二目标监测指标,对多个第二维度信息进行拆分,直到按照多个监测指标中的每个监测指标拆分完成为止。

在另一种可能的实现方式中,监测模块603,还用于根据目标质量参数的监测条件,判断第一监控信息、第二监控信息和第三监控信息,在目标时间点是否满足目标质量参数的监测条件;如果第一监控信息、第二监控信息和第三监控信息,在目标时间点满足目标质量参数的监测条件,确定流媒体的故障监测结果为根据目标质量参数的监测条件和目标时间点监测到流媒体出现故障;如果第一监控信息、第二监控信息和第三监控信息,在目标时间点不满足目标质量参数的监测条件,确定流媒体的监测结果为根据目标质量参数的监测条件和目标时间点监测到流媒体没有出现故障。

在另一种可能的实现方式中,装置还包括:

过滤模块,用于确定目标监控信息中的任一监测指标的维度信息的规范,目标监控信息为第一监控信息、第二监控信息和第三监控信息中的至少一个监控信息;如果目标监控信息中的任一监测指标的维度信息不符合规范,确定任一监测指标的维度信息是非法数据,将目标监控信息中的任一监测指标的维度信息过滤。

在另一种可能的实现方式中,装置还包括:

添加模块,用于如果第一监控信息和第二监控信息中的任一监控信息中包括的维度信息不全时,从外部系统查询缺少的维度信息,将获取的维度信息添加到任一监控信息中。

在另一种可能的实现方式中,多个监测指标的维度信息包括第一终端所在位置信息、第二终端所在位置信息、内容分发网络cdn的网络信息、互联网服务提供商isp的服务信息、域名信息、流媒体服务器的服务器标识、第二终端的版本标识、第二终端的权限信息中的一个或者多个维度信息。

在本申请实施例中,通过获取第一终端的第一监控信息、第二终端的第二监控信息和流媒体服务器的第三监控信息,根据这三个监控信息确定导致流媒体出现故障的维度信息。由于能够获取第一终端、第二终端和流媒体服务器这三端的监控信息,这三端的监控信息中包括了多个监测指标的维度信息,因此能够根据这三端的监控信息准确定位出现故障的维度信息,提高了故障监测的实时性和准确性。

需要说明的是:上述实施例提供的流媒体故障监测装置在流媒体故障监测时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将电子设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的流媒体故障监测装置与流媒体故障监测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

图7是本申请实施例提供的一种电子设备的结构示意图,该电子设备700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessingunits,cpu)701和一个或一个以上的存储器702,其中,所述存储器702中存储有至少一条指令,所述至少一条指令由所述处理器701加载并执行以实现上述各个方法实施例提供的流媒体故障监测方法。当然,该电子设备还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该电子设备还可以包括其他用于实现设备功能的部件,在此不做赘述。

在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述实施例中流媒体故障监测方法。例如,所述计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1