监控系统的部署方法及部署装置与流程

文档序号:19905860发布日期:2020-02-11 14:28阅读:438来源:国知局
监控系统的部署方法及部署装置与流程

本公开的实施例涉及数据监控技术领域,特别是涉及一种监控系统的部署方法及部署装置。



背景技术:

应用软件的发展趋于复杂化,其运行器件内部的依赖关系复杂,需要对软件的运维和管理进行监控。

通常的,应用软件被部署于一可用区(availabilityzone,简写az),在该az中同时部署有监控应用软件的监控系统。监控系统在监控到应用软件运行出现异常后,可及时地通过社交软件或者手机短信通知软件工程师,以便于快速处理并恢复软件服务,能够提高应用软件的服务质量。

然而,监控系统也由于各种原因存在着失效的风险,现有的这种部署方法却无法让软件工程师及时获知监控系统何时失效,从而容易长时间发生应用软件故障事件。



技术实现要素:

本公开为解决现有技术中监控系统失效风险较大的技术问题,提供了一种监控系统的部署方法及部署装置,以降低监控系统的失效风险。

本公开的实施例主要提供如下技术方案:

第一方面,本公开的实施例提供了一种监控系统的部署方法,所述方法包括:

将第一监控程序部署于第一可用区,所述第一监控程序用于监控所述待监控应用程序,所述第一可用区用于部署待监控应用程序;

将第二监控程序部署于第二可用区,所述第二监控程序用于监控所述第一监控程序,所述第二可用区用于部署待监控应用程序。

在一些实施例中,将第一监控程序部署于用于部署待监控应用程序的第一可用区,包括:

将所述第一监控程序中第一子监控程序部署于所述第一可用区中的第一子可用区,将所述第一监控程序中第二子监控程序部署于所述第一可用区中的第二子可用区。

在一些实施例中,所述第一子监控程序与所述第二子监控程序相互监控。

在一些实施例中,所述第二监控程序监控所述第二子监控程序;

所述第一子监控程序与所述第二监控程序相互监控。

在一些实施例中,所述第二监控程序监控所述第一子监控程序;所述第二子监控程序与所述第二监控程序相互监控。

在一些实施例中,在第一子可用区备份所述第二子监控程序;

在第二子可用区备份所述第一子监控程序。

在一些实施例中,若所述第一子监控程序监测到所述第二子监控程序失效,则启动所述第一子监控程序备份的监控程序执行监控所述第二子可用区的待监控应用程序;

若所述第二子监控程序监测到所述第一子监控程序失效,则启动所述第二子监控程序备份的监控程序执行监控所述第一子可用区的待监控应用程序。

第二方面,本公开的实施例提供了一种监控系统的部署装置,所述部署装置主要包括:

第一部署单元,用于将第一监控程序部署于第一可用区,所述第一监控程序用于监控所述待监控应用程序,所述第一可用区用于部署待监控应用程序;

第二部署单元,用于将第二监控程序部署于第二可用区,所述第二监控程序用于监控所述第一监控程序,所述第二可用区用于部署待监控应用程序。

在一些实施例中,第一部署单元,包括:

第一子部署模块,用于将所述第一监控程序中第一子监控程序部署于所述第一可用区中的第一子可用区;

第二子部署模块,用于将所述第一监控程序中第二子监控程序部署于所述第一可用区中的第二子可用区。

在一些实施例中,所述第一子监控程序与所述第二子监控程序相互监控。

在一些实施例中,所述第一子监控程序与所述第二监控程序相互监控;或

所述第二子监控程序与所述第二监控程序相互监控。

在一些实施例中,第一子备份单元,用于在第一子可用区备份所述第二子监控程序;

第二子备份单元,用于在第二子可用区备份所述第一子监控程序。

在一些实施例中,第一启动单元,用于若所述第一子监控程序监测到所述第二子监控程序失效,则启动所述第一子监控程序备份的监控程序执行监控所述第二子可用区的待监控应用程序;

第二启动单元,用于若所述第二子监控程序监测到所述第一子监控程序失效,则启动所述第二子监控程序备份的监控程序执行监控所述第一子可用区的待监控应用程序。

第三方面,本公开的实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行第一方面所述的监控系统的部署方法。

第四方面,本公开的实施例提供了一种监控系统的部署装置,所述监控系统的部署装置包括存储介质;及一个或者多个处理器,所述存储介质与所述处理器耦合,所述处理器被配置为执行所述存储介质中存储的程序指令;所述程序指令运行时执行第一方面所述的监控系统的部署方法。

借由上述技术方案,本发明技术方案提供的监控系统的部署方法及部署装置至少具有下列优点:

本公开的实施例提供的技术方案中,在第一可用区部署监控待监控应用程序的第一监控程序,在第二可用区部署第二监控程序,第二监控程序监控第一监控程序。若是第一可用区的第一监控程序出现故障,可通过第二可用区部署的第二监控程序获知。相对于现有技术,在第一可用区第一监控程序发生故障的状态下,仍能够通过第二监控程序及时的通过监控程序获知,从而能够及时的对第一可用区的第一监控程序进行维修,使得待监控应用程序的存活性较高。

上述说明仅是本公开的实施例技术方案的概述,为了能够更清楚了解本公开的实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本公开的实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本公开的实施例的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本公开的实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本公开的实施例提供的一种监控系统的部署方法的流程图;

图2示出了本公开的实施例提供的一种监控系统的部署方法示例图;

图3示出了本公开的实施例提供的一种监控系统的部署装置的结构示意图;

图4示出了本公开的实施例提供的一种具体的监控系统的部署装置的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

第一方面,如图1所示,本公开的实施例提供了一种监控系统的部署方法,所述方法包括:

101、将第一监控程序部署于第一可用区,所述第一监控程序用于监控所述待监控应用程序,所述第一可用区用于部署待监控应用程序;

其中,一个可用区可以由多个数据中心组成,不同可用区之间在供电、网络上是相互独立的,当一个可用区出现问题时也不会影响另外的可用区。在一个区域内,可用区与可用区之间是通过高速网络连接,从而保证有很低的延时。

其中,本申请中的可用区(如第一可用区)可以是一个互联网数据中心(internetdatacenter,简写idc),idc是指一种拥有完善的设备(包括高速互联网接入带宽、高性能局域网络、安全可靠的机房环境等)、专业化的管理、完善的应用的服务平台。在这个平台基础上,idc服务商为客户提供互联网基础平台服务(服务器托管、虚拟主机、邮件缓存、虚拟邮件等)以及各种增值服务(如场地的租用服务、域名系统服务、负载均衡系统、数据库系统、数据备份服务等)。或者,本申请中的可用区(如第一可用区)可以是云平台(公有云或私有云)的可用区。

待监控应用程序的监控指标在超出阈值后,第一监控程序则会产生第一警告指令,第一警告指令可以通过网络发送至软件工程师,其中发送至软件工程师的网络不局限于因特网,也可以为移动通信网络,如2g第二代移动通信技术、3g第三代移动通信技术、4g第四代移动通信技术、5g第五代移动通信技术等。

102、将第二监控程序部署于第二可用区,所述第二监控程序用于监控所述第一监控程序,所述第二可用区用于部署待监控应用程序。

第二可用区与第一可用区为不同的可用区,第二可用区与第一可用区可以通过高速网络连接。

第二监控程序可以实现对第一监控程序的监控功能异常进行监控,第一监控程序的监控功能发生异常后,第二监控程序则会产生第二警告指令,第二警告指令可以通过网络发送至软件工程师。

本公开的实施例提供的技术方案中,在第一可用区部署监控待监控应用程序的第一监控程序,在第二可用区部署第二监控程序,第二监控程序监控第一监控程序。若是第一可用区的第一监控程序出现故障,可通过第二可用区部署的第二监控程序获知。相对于现有技术,在第一可用区第一监控程序发生故障的状态下,仍能够通过第二监控程序及时的通过监控程序获知,从而能够及时的对第一可用区的第一监控程序进行维修,使得待监控应用程序的存活性较高。

为了进一步的提高对待监控软件监控的可靠性,第一监控程序除了对第一可用区的待监控应用程序进行监控之外,还对第二可用区的第二监控程序进行监控,第二监控程序的监控功能发生异常后,第一监控程序则会产生第三警告指令,第三警告指令可以通过网络发送至软件工程师。在第一可用区的第一监控程序和第二可用区的第二监控程序在不同时出现异常的情况下,能够保证对监控应用程序可靠的不间断的实时监控。

对应于在应用程序的规模越来越复杂的情况,待监控应用程序通常会跨越多个idc、多个区域、多个可用区,对应于多个可用区的应用环境中,结合图2所示,所述第一可用区包括用于部署待监控应用程序的第一子可用区和第二子可用区,所述第一监控程序包括第一子监控程序以及第二子监控程序,步骤101,包括:

将所述第一监控程序中第一子监控程序部署于所述第一可用区中的第一子可用区,将所述第一监控程序中第二子监控程序部署于所述第一可用区中的第二子可用区。

第一子可用区的待监控应用程序的监控指标在超出阈值后,第一子监控程序则会产生第一子警告指令,第一子警告指令可以通过网络发送至软件工程师。第二子可用区的待监控应用程序的监控指标在超出阈值后,第二子监控程序则会产生第二子警告指令,第二子警告指令可以通过网络发送至软件工程师。

容易理解的是,用于部署待监控应用程序的子可用区的个数在实际应用当中不限,即也可以为三个或三个以上。以下本申请的实施例以两个子可用区为例,但不局限于此。其中,在两个子可用区中,其中的一个可用区,例如第一子可用区的待监控应用程序可以运行主要业务,另外的一个可用区第二子可用区的待监控应用程序可以运行从业务。第一子可用区和第二子可用区可以布置于同一城市当中,两者通过城市内部高速网络,例如光纤实现互联,例如两者可以构成局域网。第二可用区则分别与第一子可用区和第二子可用区处于不同的城市当中,第二可用区则分别与第一子可用区和第二子可用区通过城域网互联,在一些实施例中,第二可用区则分别与第一子可用区和第二子可用区通过虚拟专用网络vpn或是专线互联。当其中的一个城市的网络出现故障的情况下,不会同时导致三个可用区(第一子可用区、第二子可用区、第二可用区)的监控程序同时宕机,导致警告指令无法发送给软件工程师。

对于第一监控程序对第二监控程序进行监控,在具体的实施当中,可以采用所述第二监控程序监控所述第二子监控程序,所述第一子监控程序与所述第二监控程序相互监控实现,或者是,采用所述第二监控程序监控所述第一子监控程序,所述第二子监控程序与所述第二监控程序相互监控实现。以单独的采用所述第二子监控程序与所述第二监控程序相互监控为例,若是第一子监控程序异常,第二监控程序可以实现对第一子监控程序异常进行监控,并向软件工程师发送警告。若是第二子监控程序异常,第二监控程序可以实现对第二子监控程序异常进行监控,并向软件工程师发送警告。若是第二监控程序异常,第二子监控程序可以实现对第二监控程序异常进行监控,并向软件工程师发送警告。其中,第一可用区可以位于一个地域,第二可用区可以位于另一个地域,第一子可用区、第二子可用区、第二可用区构成两地三中心。

其中,对于较传统数据中心,两地指的是两个距离较远的地域,第一子可用区、第二子可用区位于一个地域,第二可用区位于另一个地域,例如处于不同地域的城域网,三中心是三个idc。

对于公有云或者私有云,两地指的是同一个云(公有云或私有云)的或者不同云(公有云或私有云)的两个区域region,第一子可用区、第二子可用区位于一个区域region,第二可用区位于另一个区域region,以现有亚马逊aws云服务为例,在12月18日发布会之前全球aws云服务有9个区域,包括:美东(北佛吉尼亚)、美西(俄勒冈)、美西(北加利佛尼亚)、欧洲(爱尔兰)、亚太(新加坡)、亚太(东京)、亚太(悉尼)、南美(圣保罗)和在美西服务政府的govcloud区域。aws中国(北京)区域将是亚马逊aws在亚太地区的第4个区域,同时也是全球范围内的第10个区域。第一子可用区、第二子可用区可以位于aws中国(北京)区域,第二可用区可以位于亚太(东京)区域。三中心指的是三个可用区,两地三中心,可以确保只要不是两个地域、两个公有云同时在较短时间(如5秒内)出现不可用事件,监控系统即可以检测到不可用事件,及时发送警告指令,通知运维人员软件工程师及时知悉,第一时间修复监控系统,进而提升整个软件系统的监控透明性和系统可用性。

为了进一步的提高对待监控软件监控的可靠性,所述第一子监控程序还可以与所述第二子监控程序相互监控。若是第一子监控程序异常,第二子监控程序可以实现对第一子监控程序异常进行监控,并向软件工程师发送警告。若是第二子监控程序异常,第一子监控程序可以实现对第二子监控程序异常进行监控,并向软件工程师发送警告。

其中,接收到警告至修复监控程序的过程需要耗费一定的时间,对于安全性要求较高的应用程序,软件工程师的修复时间超出了安全要求所需的时间,为此,本申请的一些实施例中,在第一子可用区备份所述第二子监控程序,在第二字可用区的第二子监控程序故障后,软件工程师可以快速的从第一子可用区调取备份的第二子监控程序,通过备份的第二子监控程序实现对第二字可用区的待监控应用程序进行快速监控。同样的,在第二子可用区备份所述第一子监控程序,在第一字可用区的第一子监控程序故障后,软件工程师可以快速的从第二子可用区调取备份的第一子监控程序,通过备份的第一子监控程序实现对第一字可用区的待监控应用程序进行快速监控。实施中,也可以通过程序自动实现,所述第一子监控程序监控所述第二子监控程序是否失效,若所述第一子监控程序监测到所述第二子监控程序失效,则启动所述第一子监控程序备份的监控程序执行监控所述第二子可用区的待监控应用程序;所述第二子监控程序监控所述第一子监控程序是否失效,若所述第二子监控程序监测到所述第一子监控程序失效,则启动所述第二子监控程序备份的监控程序执行监控所述第一子可用区的待监控应用程序。即,如果一个可用区的监控程序出现不可用等异常事件时,另一个可用区备份的监控程序可以快速接管,或者拉起另一个监控实例进行监控。

对应于多个可用区的应用环境中,以下本申请的实施例以三个子可用区为例(未图示),基于上述的实施例,除了第一子可用区和第二子可用区之外,所述第一可用区包括用于部署待监控应用程序的第三子可用区,第一子可用区、第二子可用区和第三子可用区可以布置于同一城市当中,任意两者通过城市内部高速网络,例如光纤实现互联,例如三者可以构成局域网。第二可用区则分别与第一子可用区、第二子可用区和第三子可用区处于不同的城市当中,第二可用区则分别与第一子可用区、第二子可用区和第三子可用区通过城域网互联,在一些实施例中,第二可用区则分别与第一子可用区、第二子可用区和第三子可用区通过虚拟专用网络vpn或是专线互联。当其中的一个城市的网络出现故障的情况下,不会同时导致四个可用区(第一子可用区、第二子可用区、第三子可用区、第二可用区)的监控程序同时宕机,导致警告指令无法发送给软件工程师。

其中,第三子监控程序可与所述第一子监控程序相互监控。实施中,在第一子可用区备份所述第三子监控程序;在第三子可用区备份所述第一子监控程序。若所述第一子监控程序监测到所述第三子监控程序失效,则启动所述第一子监控程序备份的监控程序执行监控所述第三子可用区的待监控应用程序。

当然,实施中,第三子监控程序还可与所述第二子监控程序相互监控,实施中,在第二子可用区备份所述第三子监控程序;在第三子可用区备份所述第二子监控程序。若所述第一子监控程序监测到所述第二子监控程序、所述第三子监控程序失效,则启动所述第一子监控程序备份的监控程序执行监控所述第二子可用区的待监控应用程序、所述第三子可用区的待监控应用程序。若所述第二子监控程序监测到所述第一子监控程序、所述第三子监控程序失效,则启动所述第二子监控程序备份的监控程序执行监控所述第一子可用区的待监控应用程序、所述第三子可用区的待监控应用程序。若所述第三子监控程序监测到所述第一子监控程序、所述第二子监控程序失效,则启动所述第三子监控程序备份的监控程序执行监控所述第一子可用区的待监控应用程序、所述第二子可用区的待监控应用程序。

在一些实施例中,所述第三子监控程序还可与所述第三监控程序相互监控。

第二方面,依据图3所示,本公开的另一个实施例还提供了一种监控系统的部署装置,如图3所示,所述装置主要包括:

第一部署单元10,用于将第一监控程序部署于第一可用区,所述第一监控程序用于监控所述待监控应用程序,所述第一可用区用于部署待监控应用程序;

第二部署单元20,用于将第二监控程序部署于第二可用区,所述第二监控程序用于监控所述第一监控程序,所述第二可用区用于部署待监控应用程序。

在一些实施例中,如图4所示,第一部署单元10,包括:

第一子部署模块11,用于将所述第一监控程序中第一子监控程序部署于所述第一可用区中的第一子可用区;

第二子部署模块12,用于将所述第一监控程序中第二子监控程序部署于所述第一可用区中的第二子可用区。

在一些实施例中,所述第一子监控程序与所述第二子监控程序相互监控。

在一些实施例中,所述第二监控程序监控所述第二子监控程序;

所述第一子监控程序与所述第二监控程序相互监控。

在一些实施例中,所述第二监控程序监控所述第一子监控程序;所述第二子监控程序与所述第二监控程序相互监控。

在一些实施例中,第一子备份单元30,用于在第一子可用区备份所述第二子监控程序;

第二子备份单元40,用于在第二子可用区备份所述第一子监控程序。

在一些实施例中,第一启动单元50,用于若所述第一子监控程序监测到所述第二子监控程序失效,则启动所述第一子监控程序备份的监控程序执行监控所述第二子可用区的待监控应用程序;

第二启动单元60,用于若所述第二子监控程序监测到所述第一子监控程序失效,则启动所述第二子监控程序备份的监控程序执行监控所述第一子可用区的待监控应用程序。

所述装置包括处理器和存储介质,上述第一部署单元、第二部署单元等均作为程序单元存储在存储介质中,由处理器执行存储在存储介质中的上述程序单元来实现相应的功能。

上述处理器中包含内核,由内核去存储介质中调取相应的程序单元。内核可以设置一个或以上。

本公开的实施例提供的技术方案中,第一部署单元在第一可用区部署监控待监控应用程序的第一监控程序,第二部署单元在第二可用区部署第二监控程序,第二监控程序监控第一监控程序。若是第一可用区的第一监控程序出现故障,可通过第二可用区部署的第二监控程序获知。相对于现有技术,在第一可用区第一监控程序发生故障的状态下,仍能够通过第二监控程序及时的通过监控程序获知,从而能够及时的对第一可用区的第一监控程序进行维修,使得待监控应用程序的存活性较高。

第二方面的实施例提供的监控系统的部署装置,可以用以执行第一方面的实施例所提供的监控系统的部署方法,相关的用于的含义以及具体的实施方式可以参见第一方面的实施例中的相关描述,在此不再详细说明。

第三方面,本公开的实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行第一方面所述的监控系统的部署方法。

存储介质可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram),存储器包括至少一个存储芯片。

第四方面,本公开的实施例提供了一种监控系统的部署装置,所述监控系统的部署装置包括存储介质;及一个或者多个处理器,所述存储介质与所述处理器耦合,所述处理器被配置为执行所述存储介质中存储的程序指令;所述程序指令运行时执行第一方面所述的监控系统的部署方法。

本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开的实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开的实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照本公开的实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本公开的实施例可提供为方法、系统或计算机程序产品。因此,本公开的实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本公开的实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1