一种云环境下基于标靶拨测的应用可用性监测方法与流程

文档序号:36286780发布日期:2023-12-07 01:15阅读:39来源:国知局
一种云环境下基于标靶拨测的应用可用性监测方法与流程

本发明涉及云服务,特别涉及一种云环境下基于标靶拨测的应用可用性监测方法。


背景技术:

1、随着云计算技术的成熟和发展,为了降低it的硬件和运维成本、获得更高的扩展性和灵活性,越来越多的企事业单位选择把应用部署到云端,从而在云原生下应用的可观测性就显得愈发重要。租户需要掌握应用的运行质量,最基本的就是实时掌握应用是否可以访问,一般的做法是通过部署在全国的监测节点,模拟用户的访问行为,对应用进行周期性的监测,对应用的性能指标进行采集与分析,从而协助用户实现应用可用性性能质量的判断以便提升用户使用体验。但是这种监测方法有一定局限性,具体表现在:由于是周期性的拨测,如果发生了网络抖动的情况,会出现在拨测的那一刻应用的访问是正常的,而在没有拨测的间隔时间内应用实际是无法访问的情况,结果造成无法及时上报应用的网络问题,相反的,也会出现在拨测的那一刻网络恰好无法访问,但是当用户真正访问的时候网络却是正常的情况,会造成一定程度的误报。另一方面,当出现拨测异常的情况下,也很难区分是网络原因引起的拨测异常还是应用本身原因(比如应用未正常启动)造成的拨测异常,无法进一步定位问题。

2、基于此,本发明提出了一种云环境下基于标靶拨测的应用可用性监测方法。


技术实现思路

1、本发明为了弥补现有技术的缺陷,提供了一种简单高效的云环境下基于标靶拨测的应用可用性监测方法。

2、本发明是通过如下技术方案实现的:

3、一种云环境下基于标靶拨测的应用可用性监测方法,其特征在于:在云环境下,采用多个节点周期性地对所监测应用对象进行仿真拨测的同时,通过部署与所监测应用对象环境完全一致的标靶节点,并同时对标靶节点上的应用也进行仿真拨测,最后综合应用拨测结果和标靶的拨测结果,基于内置规则对应用运行质量进行分析和根因定位;

4、具体包括以下步骤:

5、步骤s1、部署阶段

6、在云环境下,采用中心center与本地local相结合模式部署拨测节点;同时,部署一个或多个与所监测应用对象环境完全一致的标靶节点;

7、步骤s2、采集阶段

8、通过curl命令请求应用外网地址,获取应用的响应状态码和其他的页面加载性能指标数据,包括应用的仿真拨测与标靶的仿真拨测;

9、步骤s3、分析阶段

10、对获取到的性能指标数据进行展示分析,通过图表/列表展示汇聚后各个标靶节点的拨测结果,并基于内置规则,综合分析相同环境下标靶节点的拨测结果和最近一次应用的拨测结果,对应用运行质量进行分析和根因定位。

11、所述步骤s1中,部署阶段包括以下步骤:

12、步骤s1.1、部署拨测节点

13、为保证对应用仿真拨测数据的准确性,拨测节点采用中心center与本地local相结合模式,即创建一个公有云节点作为中心center节点部署拨测服务端,然后在不同地域创建多个公有云节点作为本地local节点部署拨测客户端;

14、所述中心center节点和本地local节点均具备弹性公网ip,并设置安全组开启必要的端口,以便通过外网地址互联;所述本地local节点还能够通过外网访问被监测。

15、步骤s1.2、部署标靶节点

16、在被监测应用所在的云平台上创建标靶节点,所述标靶节点选择与被监测应用网络和存储环境一致的云服务器,部署有且安全可靠的简易应用,简易应用在访问时连接数据库。

17、所述步骤s2中,采集阶段包括以下步骤:

18、步骤s2.1、应用的仿真拨测

19、由部署在中心center节点的拨测服务端执行定时任务,周期性地调用各个本地local节点拨测客户端的restful接口下达拨测任务;各个拨测客户端在接到任务后,通过curl命令请求所监测应用的外网地址,获取应用的响应状态码和页面加载性能指标数据后,再通过restful接口上报性能数据给拨测服务端;

20、步骤s2.1、标靶的仿真拨测

21、当位于local节点上的拨测客户端在拨测应用时,也对相同环境下的标靶节点上的简易应用进行拨测,以获取对应的性能指标数据作为分析时的参考;且所述标靶应用的监测频率远高于所检测应用的监测频率。

22、所述步骤s2.1中,应用的仿真拨测实现流程如下:

23、步骤s2.1.1、用户首先在页面配置监测任务,配置信息包括但不限于监测应用的名称、监测应用的外网统一资源定位符url(uniform resource locator)、请求方式(get或post)、拨测客户端地址列表、监测的频率。

24、步骤s2.1.2、拨测服务端根据任务生成采集指令,然后以键值对(key-value)的形式缓存到redis内存数据库;所述键key为拨测客户端地址,值value为采集任务指令;拨测服务端根据监测频率定时生成每个拨测客户端的采集任务指令;

25、步骤s2.1.3、在各个拨测客户端配置拨测服务端的回调地址,并定时请求拨测服务端的心跳接口;拨测服务端收到心跳请求后,查询redis内存数据库,检查对应的拨测客户端是否有符合该心跳请求时间点的拨测任务,若有,则随着心跳响应下达拨测任务;

26、所述拨测客户端的心跳周期小于监测频率;

27、步骤s2.1.4、拨测客户端收到心跳响应后,若发现其中有拨测任务下达,则执行相关的拨测任务,通过curl命令请求所监测的应用,获取响应状态码和页面性能指标数据后,再次调用拨测服务端的回调接口回传性能数据;

28、步骤s2.1.5、拨测服务端收到回传的性能数据后,将性能数据存入influxdb时序数据库,然后通过定时任务汇聚多个拨测节点对同一个应用的拨测结果,并将拨测的汇聚结果存入influxdb时序数据库;

29、汇聚拨测结果时,只要有一个节点的拨测结果正常则认为应用能够正常访问,如果所有拨测节点都返回异常则认为应用无法访问。

30、所述页面加载性能指标数据包括网络性能指标和网页性能指标,所述网络性能指标包括但不限于响应时延与http状态码,所述网页性能指标包括但不限于首屏时间和首次渲染时间。

31、所述步骤s3中,通过图表展示汇聚后应用的监测性能数据,展示图表包括但不限于网络指标和http状态码的历史趋势图;所述网络指标包括但不限于页面加载时间、网络层时间、页面下载速度、页面下载大小、dns解析时延、tcp连接时延、ssl握手时延、服务器处理时延、内如传输时延;

32、同时通过列表展示无法访问的应用top5(前五名)、访问速度慢的应用top5、监测请求耗时top10(前十名)与应用下载速率bottom10(倒数前十名)数据。

33、所述步骤s3中,当拨测服务端每次汇聚各个标靶节点的拨测结果后,对应用运行质量进行分析和根因定位时,内置规则如下:

34、(1)如果应用拨测异常,同时标靶拨测也异常,则说明网络环境异常,立即产生告警;

35、(2)如果应用拨测异常,但是标靶拨测正常,并且这种情况连续发生达10次,则说明网络环境是正常状态,是应用本身无法访问,立即产生告警;

36、(3)如果应用拨测正常,但是标靶拨测异常,则说明网络环境与应用本身均为正常状态,无需处理。

37、一种云环境下基于标靶拨测的应用可用性监测设备,其特征在于:包括存储器和处理器;所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现如上所述的方法步骤。

38、一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法步骤。

39、本发明的有益效果是:该云环境下基于标靶拨测的应用可用性监测方法,即避免了应用拨测间隔时间内无法及时发现网络问题的情况,又能明确拨测异常的原因,提高了应用监测的准确率,同时通过判断标靶节点上数据库的连通性,也能在一定程度上反应出云平台存储的问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1