一种大数据云计算环境下的告警装置及方法与流程

文档序号:20203039发布日期:2020-03-27 20:50阅读:115来源:国知局
一种大数据云计算环境下的告警装置及方法与流程
本发明涉及电信通讯
技术领域
,特别涉及一种大数据云计算环境下的告警装置及方法。
背景技术
:在大数据多业务融合通信的大背景下,电信通讯领域的业务设备数量和类型都很多,并且在运行过程中会动态接入。如果操作维护系统集中在一个设备节点上,不光数据量大,性能要求无法承受,用户操作管理也会相当的复杂繁琐,由此产生了不同业务设备节点间分层化操作维护管理的需求。为了实现分层管理时所有层级数据的一致性,需要在层级之间进行数据同步,告警数据就是需要同步的一个重要方面。业务设备分层级管理,上级和下级设备之间有一个对应的管理关系。通过对上级设备的操作可以实现对下级设备的管理。在一套云计算设备环境下,不同层级的业务设备上会分别部署操作维护功能,以实现负载均衡。如果这些操作维护系统独立处理并展示告警,不利于用户进行统一管理。技术实现要素:根据本发明实施例提供的方案解决的技术问题是云资源运营管理中难以实现不同层级设备之间告警数据统一管理的需求。根据本发明实施例提供的一种大数据云计算环境下的告警装置,包括:一级设备,用于发送告警同步消息和接收告警同步响应;m个二级设备,所述m个二级设备布置成相互独立的n个集合,每个集合中有p个相互独立的二级设备,并从每个集合的二级设备中选取一个作为二级操作维护管理设备;其中,所述一级设备分别与所述n个集合中的二级操作维护管理设备之间建立第一通信通道,并利用所述第一通信通道将所述告警同步消息发送给所述每个集合中的二级操作维护管理设备以及接收所述每个集合中的二级操作维护管理设备根据所述告警同步消息而返回的告警同步响应;其中,所述m≥2;n≥1;p≥2;m、n、p均为正整数。根据本发明实施例提供的一种大数据云计算环境下的告警方法,包括:用于发送告警同步消息和接收告警同步响应的一级设备;用于根据所述一级设备的告警同步消息,生成告警同步响应的n个二级操作维护管理设备;其中,所述n个二级操作维护管理设备是从m个二级设备布置成相互独立的n个集合,每个集合中有p个相互独立的二级设备以及从每个集合的二级设备中选取出来的;其中,所述一级设备分别与所述n个集合中的二级操作维护管理设备之间建立第一通信通道,并利用所述第一通信通道将所述告警同步消息发送给所述每个集合中的二级操作维护管理设备以及接收所述每个集合中的二级操作维护管理设备根据所述告警同步消息而返回的告警同步响应;其中,所述m≥2;n≥1;p≥2;m、n、p均为正整数。根据本发明实施例提供的一种大数据云计算环境下的告警设备,所述设备包括:处理器,以及与所述处理器耦接的存储器;所述存储器上存储有可在所述处理器上运行的大数据云计算环境下的告警的程序,所述大数据云计算环境下的告警的程序被所述处理器执行时实现根据本发明实施例提供的所述的大数据云计算环境下的告警的装置的步骤。根据本发明实施例提供的一种计算机存储介质,存储有大数据云计算环境下的告警的程序,所述大数据云计算环境下的告警的程序被处理器执行时实现根据本发明实施例提供的所述的大数据云计算环境下的告警的装置的步骤。根据本发明实施例提供的方案,提供了告警功能在大数据多设备分层级管理架构下的解决方案,满足了负载均衡和统一管理的操作维护要求。附图说明图1是本发明实施例提供的一种大数据云计算环境下的告警装置示意图;图2是本发明实施例提供的云计算平台架构图;图3是本发明实施例提供的设备告警级联策略发送流程图;图4是本发明实施例提供的设备告警级联策略同步流程图;图5是本发明实施例提供的设备告警级联消息同步流程图。具体实施方式以下结合附图对本发明的优选实施例进行详细说明,应当理解,以下所说明的优选实施例仅用于说明和解释本发明,并不用于限定本发明。图1是本发明实施例提供的一种大数据云计算环境下的告警装置示意图,如图1所示,包括:一级设备,用于发送告警同步消息和接收告警同步响应;m个二级设备,所述m个二级设备布置成相互独立的n个集合,每个集合中有p个相互独立的二级设备,并从每个集合的二级设备中选取一个作为二级操作维护管理设备;其中,所述一级设备分别与所述n个集合中的二级操作维护管理设备之间建立第一通信通道,并利用所述第一通信通道将所述告警同步消息发送给所述每个集合中的二级操作维护管理设备以及接收所述每个集合中的二级操作维护管理设备根据所述告警同步消息而返回的告警同步响应;其中,所述m≥2;n≥1;p≥2;m、n、p均为正整数。其中,所述每个集合中的二级操作维护管理设备根据所述告警同步消息而返回的告警同步响应包括:所述每个集合中的二级操作维护管理设备根据所述告警同步消息,获取需要进行告警级联同步的资源列表信息和所述资源列表中每个资源的告警信息;所述每个集合中的二级操作维护管理设备按资源分条将符合的告警信息组装成告警同步响应,并将所述告警同步响应发送给所述一级设备。本发明实施例还包括:所述一级设备利用所述第一通信通道分别向所述每个集合中的二级操作维护管理设备发送包含一级设备ip、一级设备端口以及需要进行告警级联的一个或多个资源信息的第一消息;所述每个二级操作维护管理设备根据所述第一消息中的资源信息,采集并保存所在集合中的每个二级设备中所述一个或多个资源的告警信息。本发明实施例还包括:所述一级设备利用所述第一通信通道分别向所述每个集合中的二级操作维护管理设备发送包含一级设备ip、一级设备端口以及需要进行告警级联同步的资源列表信息的第二消息;所述每个二级操作维护管理设备根据所述第二消息,将预存的资源信息清除并添加保存所述需要进行告警级联同步的资源列表信息。本发明实施例还包括:x个三级设备,所述x个三级设备布置成相互独立的y个集合,每个集合中有z个相互独立的三级设备,并从每个集合的三级设备中选取一个作为三级操作维护管理设备;其中,所述三级操作维护管理设备与所述二级操作维护管理设备之间建立第二通信通道,并利用所述第二通信通道接收所述二级操作维护管理设备的所述告警同步消息以及根据所述告警同步消息上报所在集合中每个三级设备的告警同步响应;其中,所述x≥2;y≥1;z≥2;x、y、z均为正整数。本发明实施例还包括:在每个集合中的二级设备或三级设备需要增加资源或删除资源时,则通过集合中的同级操作维护管理设备进行增加资源或删除资源的管理操作;在需要增加一个层级设备或删除一个层级设备时,则通过所述层级设备的上级操作维护管理设备进行增加层级设备或删除层级设备的管理操作。本发明实施例还提供了一种大数据云计算环境下的告警方法,包括:用于发送告警同步消息和接收告警同步响应的一级设备;用于根据所述一级设备的告警同步消息,生成告警同步响应的n个二级操作维护管理设备;其中,所述n个二级操作维护管理设备是从m个二级设备布置成相互独立的n个集合,每个集合中有p个相互独立的二级设备以及从每个集合的二级设备中选取出来的;其中,所述一级设备分别与所述n个集合中的二级操作维护管理设备之间建立第一通信通道,并利用所述第一通信通道将所述告警同步消息发送给所述每个集合中的二级操作维护管理设备以及接收所述每个集合中的二级操作维护管理设备根据所述告警同步消息而返回的告警同步响应;其中,所述m≥2;n≥1;p≥2;m、n、p均为正整数。本发明实施例还包括:用于根据所述二级操作维护管理设备的告警同步消息,生成告警同步响应的三级操作维护管理设备;其中,所述三级操作维护管理设备是从x个三级设备布置成相互独立的y个集合,每个集合中有z个相互独立的三级设备以及从每个集合的三级设备中选取出来的;其中,所述三级操作维护管理设备与所述二级操作维护管理设备之间建立第二通信通道,并利用所述第二通信通道接收所述二级操作维护管理设备转发的所述告警同步消息以及根据所述告警同步消息上报所在集合中每个三级设备的告警同步响应;其中,所述x≥2;y≥1;z≥2;x、y、z均为正整数。本发明实施例还提供了一种大数据云计算环境下的告警设备,所述设备包括:处理器,以及与所述处理器耦接的存储器;所述存储器上存储有可在所述处理器上运行的大数据云计算环境下的告警的程序,所述大数据云计算环境下的告警的程序被所述处理器执行时实现根据本发明实施例提供的所述的大数据云计算环境下的告警的装置的步骤。本发明实施例还提供了一种计算机存储介质,存储有大数据云计算环境下的告警的程序,所述大数据云计算环境下的告警的程序被处理器执行时实现根据本发明实施例提供的所述的大数据云计算环境下的告警的装置的步骤。图2是本发明实施例提供的云计算平台架构图,如图2所示,纵向层级、横向设备资源都可以无限扩充,部署的告警单元都是同一套。本架构中的设备层级分为上级设备和下级设备,上级设备对下级设备进行管理,是一对多的映射关系,可以扩充为多级设备;被管理的下级设备作为操作维护设备管理同级设备,管理的同级设备可横向扩充。其中,在任何一级设备的操作维护设备上均部署有告警单元,且各级操作维护设备上的处理逻辑一样。上述的映射关系由本告警单元提供监听接口。上述的告警单元包括如下内容:1)告警单元中维护一个告警策略,本告警策略包含有上级设备的ip、端口,需要同步告警的资源名称。2)不同层级设备之间通过告警级联策略同步流程进行策略同步,如图4告警级联策略同步流程图展示。3)告警单元的告警同步流程包括策略发送告警同步,如图3告警级联策略发送流程图展示4)告警单元的告警同步流程还包括告警消息同步,如图5告警级联消息同步流程图展示。设备扩充和删除流程如下:101)设备资源增加,向同级的操作维护设备注册,操作维护设备接收到资源增加注册后将资源加入自己的管理资源列表,同时开始接收此资源的告警、性能等采集数据。而对上级操作维护设备来说,它管理的资源与下级操作维护设备管理的设备是一对多的映射关系,因此它的资源并没有发生变化。102)设备资源删除,会向同级的操作维护设备发送删除消息,操作维护设备接收到资源增删除消息后将此资源的告警性能等数据一起删除,并且同步给上级操作维护设备。103)架构中增加一个层级的设备资源,这个层级设备中的操作维护设备会将本层级的设备资源向上级操作维护设备注册,上级操作维护设备接收到下级设备的资源增加注册后将下级设备的资源做个映射并且加入自己的管理资源列表。同时,向下级操作维护设备发送级联告警同步策略。104)架构中删除一个层级的设备资源,这个层级设备中的操作维护设备会向上级操作维护设备发送删除消息,上级操作维护设备接收到消息后将自身维护的映射后资源删除,并且删除此层级设备的所有性能和告警数据。下面结合附图3至附图5对本发明进行详细说明。图3是本发明实施例提供的设备告警级联策略发送流程图,如图3所示,包括:301)上级操作维护设备的告警单元向下级操作维护设备的告警单元发送告警级联策略消息,消息中包含上级设备的ip、端口和需要进行告警级联的资源。302)告警单元维护一个告警级联策略列表,如表1所示,保存接收到的ip、端口和需要进行告警级联的资源,并将此列表导入数据库。表1:告警级联策略列表字段名字段含义id序号ipaddr上级设备ipport上级设备端口资源id需要同步告警的资源id资源类型需要同步告警的资源类型303)告警单元在告警和恢复(手动恢复和自动恢复)流程中,加入告警级联发送流程。搜索告警级联策略列表,如果发送的告警或恢复符合策略,则调用dcf(distributecommunicationframe,分布式通讯框架)客户端接口,发送告警和恢复,发送的告警和恢复带上告警级联的标志。图4是本发明实施例提供的设备告警级联策略同步流程图,如图4所示,该流程包括:401)上级操作维护设备的告警单元发送告警级联策略同步消息,消息中包含上级设备的ip、端口和需要进行告警级联的资源列表。402)下级操作维护设备的告警单元收到同步消息后,根据消息的ip、端口将告警级联策略列表中相应的策略全部清空,然后再根据消息中的资源列表增加告警级联策略,并且同步到数据库中。图5是本发明实施例提供的设备告警级联消息同步流程图,如图5所示,该流程包括:501)上级操作维护设备的告警单元发送告警级联同步消息。消息中包含本设备的ip、端口。502)下级操作维护设备的告警单元收到同步消息后,根据消息的ip、端口,搜索告警级联策略列表中相应的告警级联策略,同时搜索实时告警缓存,按资源分条将符合策略的告警组装成同步告警消息响应,发送出去。搜索实时告警缓存的时候,忽略带有屏蔽标志的告警。503)上级操作维护设备的告警单元收到同步告警消息后,根据资源与实时告警缓存中带有级联标志的告警进行比对,少则增加,多则恢复。结合附图和具体实施例对本发明所述技术方案作进一步的详细描述,但所举实施例不作为对本发明的限定。本发明实施实例,具体内容包括如下:步骤1、某虚拟化软件平台业务利用资源模型,定义1000台虚拟设备,并设置设备的所在区域、通讯方式、ip、操作系统类型、驻留程序端口号、设备类型、设备id等属性,业务能够定义多种设备类型的资源,业务能够定义多少个资源模型,平台就能接入多少个设备,实现了多设备接入的目的。这些虚拟设备根据不同的策略进行了分组,每组部署一台操作维护设备。步骤2、某云资源运营管理平台利用资源模型,定义了1台运营管理平台设备,作为上级设备,管理步骤1中的虚拟设备。步骤3、上级设备中有一个设备上部署了操作维护系统,下级设备中有多个设备部署操作维护系统。步骤4、上级设备的操作维护系统向自己管理的下级设备的操作维护系统发送级联告警策略消息,息中包含上级设备的ip、端口和需要进行告警级联的资源列表。步骤5、下级设备收到同步消息后,根据上级设备的ip、端口将告警级联策略列表中相应的策略全部清空,然后再根据消息中的资源列表增加告警级联策略,并且同步到数据库中。步骤6、下级设备采集到告警消息,搜索告警级联策略列表,如果发送的告警或恢复符合策略,则调用dcf客户端接口,向上级设备发送告警和恢复,发送的告警和恢复带上告警级联的标志。步骤7、上级设备接收到下级设备发送的告警消息后,先调用业务的资源转换监听接口,将告警消息中的资源映射为上级设备中的资源(也就是发送告警的下级设备的管理设备),然后按正常告警流程进行处理。步骤8、上级设备的操作维护系统向自己管理的下级设备的操作维护系统发送告警级联同步消息。消息中包含上级设备的ip、端口。步骤9、下级设备收到同步消息后,根据上级设备的ip、端口,搜索告警级联策略列表中相应的告警级联策略,同时搜索实时告警缓存,按资源分条将符合策略的告警组装成同步告警消息响应,发送给上级告警。搜索实时告警缓存的时候,忽略带有屏蔽标志的告警。步骤10、上级设备收到下级设备发送的同步告警消息后,先进行资源转换,再根据资源与实时告警缓存中带有级联标志的告警进行比对,少则增加,多则恢复。根据本发明实施例提供的方案,实现了一种可级联、可扩展的告警单元,将下级设备操作维护系统中处理的告警同步到上级设备的操作维护系统中进行展示或进一步同步。同时即保证了多设备的接入,又为多设备上报大量数据问题做出了方案进行处理。为运营商,网管部门及设备制造方提供准确,及时,必要的数据,并保证了数据的正确性、合法性,以便用户队网络运行状况进行评估。本发明中的告警单元可以在业务设备中无限扩充,所有层级的业务设备中本告警单元的处理逻辑都是一样的。尽管上文对本发明进行了详细说明,但是本发明不限于此,本
技术领域
技术人员可以根据本发明的原理进行各种修改。因此,凡按照本发明原理所作的修改,都应当理解为落入本发明的保护范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1