专利名称:一种网络管理系统及性能采集的方法
技术领域:
本发明涉及电信网络管理技术,尤其涉及一种网络管理系统及性能采集的方法。
背景技术:
在电信网络管理系统中,性能管理是非常重要的一部分,大数据量性能的处理尤其是其中的一个难点。一个电信网络往往管理着成千上万个设备,而分析网络性能数据,实时准确地掌握设备的运行情况,及时处理设备出现的异常以及预防设备出现重大故障,同时备份性能数据,以备事后分析原因等,而上述的实现都需要考虑对大量性能数据进行分析,处理性能数据采集效率的问题及大批量数据传输的问题等。目前,大多数厂商所设计的都是如何处理前转的流程,而没有考虑大量数据处理的方法,如专利CN200810083^9. 7公开了一种通过任务调度采集的方法,介绍了采集任务的分级、调度、采集等方法,解决了任务采集的划分,以及任务调度的情况。但是随着网络管理能力的提高,网络管理系统所管理的网元数量的增加,当性能达到一定数量级时,将使采集线程异常繁忙,网元产生的性能不能及时得到处理,从而使网络管理系统处理效率下降、 可靠性降低,更严重时会导致性能数据的丢失。当前的网络管理系统要求能够管理的网元数量已经达到了两万个以上,针对这种情况,如何有效利用系统资源,进一步提高性能采集处理效率,及时处理性能配置,避免网络管理中处理大数据量性能时丢失数据,成为必须面对的问题。
发明内容
有鉴于此,本发明的主要目的在于提供一种网络管理系统及性能采集的方法,提高了网络管理系统的可靠性。为达到上述目的,本发明的技术方案是这样实现的—种性能采集的方法,所述方法包括下述步骤采集单元启动时自动连接主控单元,根据预先存储于主控单元中的网元分布信息,获取自身所管理的网元信息,并与所述自身所管理的网元建立连接;采集单元根据预先设置的定时周期,下发采集命令至所管理的网元,并将所述网元返回的性能数据进行存储。进一步地,所述方法还包括主控单元与网元建立连接。进一步地,所述方法还包括主控单元接收用户下发的性能业务命令,并判断所述性能业务命令的类型,当性能业务命令为查询类性能业务命令时,将查询类性能业务命令下发到采集单元;采集单元根据接收到的性能业务命令,进行查询,将查询到的性能数据返回给主控单元。其中,所述当性能业务命令为业务配置类性能业务命令时,主控单元将所述业务配置类性能业务命令下发到网元。进一步地,所述方法还包括主控单元监听采集单元的连接信息,并记录采集单元的连接状态,当监听到采集单元的连接断开时,上报告警并重启异常的采集单元。一种网络管理系统,所述系统包括主控单元和至少一个采集单元;其中,主控单元,用于存储网元分布信息;采集单元,用于在启动时自动连接主控单元,根据所述网元分布信息,获取自身所管理的网元信息,并与所述自身所管理的网元建立连接;并根据预先设置的定时周期,下发采集命令至所管理的网元,将所述网元返回的性能数据进行存储。其中,所述主控单元进一步包括主进程和主进程数据库;其中,主进程,用于与网元建立连接;主进程数据库,用于存储网元分布信息。其中,采集单元进一步包括采集进程和采集进程数据库;其中,采集进程数据库,用于存储所述网元返回的性能数据;相应地,所述主进程进一步用于接收用户下发的性能业务命令,并判断所述性能业务命令的类型,当性能业务命令为查询类性能业务命令时,将所述查询类性能业务命令发送到采集进程;当性能业务命令为业务配置类性能业务命令时,将所述业务配置类性能业务命令发送到网元;采集进程,用于根据接收到的性能业务命令,查询采集进程数据库,将查询到的性能数据返回给所述主进程。进一步地,所述主控单元还用于监听采集单元的连接信息,并记录采集单元的连接状态,当监听到采集单元的连接断开时,上报告警并重启异常的采集单元。本发明通过利用分布式部署的采集单元对网元进行性能数据的采集,有效利用了网络管理系统的资源,进一步提高了网络管理系统管理多网元时的性能采集效率,避免了网络管理中网元个数过多导致的性能数据丢失的问题;同时采取主控单元对所有采集单元及网元的配置进行统一管理,避免了网络管理过程中对其它业务的影响,提高了网络管理系统的可靠性和性能数据的完整性。
图1为本发明的性能采集的方法的流程示意图;图2为本发明的网络管理系统的结构示意图。
具体实施例方式本发明的基本思想为采集单元启动时自动连接主控单元,根据预先存储于主控单元中的网元分布信息,获取自身所管理的网元信息,并与所述自身所管理的网元建立连接;采集单元根据预先设置的定时周期,下发采集命令至所管理的网元,并将所述网元返回的性能数据进行存储。为使本发明的目的、技术方案和优点更加清楚明白,以下举实施例并参照附图,对本发明进一步详细说明。步骤101,主控单元启动,其依赖于主控单元的主进程数据库;
具体地,主控单元的主进程启动,其依赖于主进程数据库;主进程数据库中预先存储有网元分布信息、采集单元个数信息及采集单元配置信息等;另外,本发明中采集单元的个数可以根据初始网络的规模进行设置,还能够根据网络中网元个数的改变,进行适应性调整。其中,采集单元配置信息包含有采集单元ID等信息,用以方便主控单元统一对采集单元进行管理、访问等操作。步骤102,采集单元自动连接主控单元的主进程,并与自身所管理的网元建立连接;具体地,一个采集单元上有一个采集进程,采集单元的采集进程在启动时,自动连接主进程,根据预先存储于主进程数据库中的网元分布信息,获取所管理的网元信息,进而与自身所管理的网元建立连接。其中,网元分布信息包括网元的ID及网元所属采集单元的 ID,当采集进程上报包含有采集单元ID的信息给主进程时,主进程根据网元分布信息及采集单元ID,将属于该采集单元的采集进程管理的网元的ID发送给该采集进程。步骤103,主控单元与各网元建立连接;应当理解,步骤102和步骤103在执行上不存在先后顺序。步骤104,采集单元的采集进程根据预先设置的定时周期,下发采集命令至所管理的网元,并将所述网元返回的性能数据存储至采集单元的采集进程数据库;本步骤中,各采集进程下发采集命令的定时周期可以通过自身的配置文件进行设置;网元接收到采集命令后,通过文件传输协议(File Transfer Protocol, FTP)将性能数据文件返回给采集进程,采集进程将接收到的性能数据文件转换为采集进程数据库自定义的数据库格式,并进行存储。步骤105,主控单元的主进程接收用户输入的性能业务命令,并判断所述性能业务命令的类型,当所述性能业务命令为查询类性能业务命令时,执行步骤106 ;当所述性能业务命令为业务配置类性能业务命令时,执行步骤108 ;具体地,主进程可以通过性能业务命令的命令码进行类型的判断如命令码小于86500的性能业务命令的类型为查询类型;命令码大于86500的性能业务命令的类型为业务配置类型;其中,查询类性能业务命令可以为用户输入的关键性能计数器(Key Performance Indicator, KPI)计算、性能统计等查询命令。本步骤中还包括,主进程通过套接字(socket)监听采集进程的连接信息,并记录采集进程的连接状态;当监听到采集进程的连接断开时,主进程上报“采集进程连接断开告警”至客户端,并重启异常的采集进程。步骤106,主控单元的主进程将查询类性能业务命令下发给相应的采集单元的采集进程;当主进程判断得到用户输入的性能业务命令为查询类性能业务命令时,进一步根据查询类性能业务命令中包含的网元编号,及主进程数据库中预先存储的网元分布信息, 将所述查询类性能业务命令下发到所述网元编号对应网元所连接的采集进程。步骤107,采集单元的采集进程接收到查询类性能业务命令后,到采集进程数据库中查询,对性能数据进行统计,并返回给主控单元的主进程;本步骤中,查询类性能业务命令可以为查询所述采集进程所管理的某个网元当天的所有性能数据,此时,采集进程需要查询自身的采集进程数据库,统计该网元当天的所有性能数据,并返回给主控单元的主进程,其中,查询类性能业务命令还可以为查询所述采集进程所管理的某个网元的一周、或一个月时长的所有性能数据。步骤108,主控单元的主进程将业务配置类性能业务命令直接下发到网元;当主进程判断得到用户输入的性能业务命令为业务配置类性能业务命令时,进一步根据业务配置类性能业务命令中包含的网元编号,将所述业务配置类性能业务命令下发到所述网元编号对应的网元;其中所述业务配置类性能业务命令可以为性能屏蔽命令、性能清零命令等。步骤109,网元接收到所述性能业务命令后,根据所述业务配置类性能业务命令进行处理,处理完毕后返回成功应答消息给主控单元的主进程;本步骤中,业务配置类性能业务命令可以为性能屏蔽、性能清零等性能业务命令。 其中,当网元接收到性能屏蔽的业务命令时,其将不进行自身性能数据的上报;当网元接收到性能清零的业务命令时,根据性能清零业务命令所要清除的性能数据,将所述性能数据清零。例如,当所述性能清零业务命令所要清除的性能数据为丢包计数值时,则将所述丢包计数值清零。应当理解,上述性能采集的方法在实际应用中,主控单元和采集单元可以部署在一个机器上,也可以部署在多个机器上;同时主进程数据库和采集进程数据库不存在依赖关系,相互独立。图2示出了本发明网络管理系统的结构,所述网络管理系统包括主控单元和至少一个采集单元,其中,主控单元,用于存储网元分布信息;采集单元,用于在启动时自动连接主控单元,根据所述网元分布信息,获取自身所管理的网元信息,并与所述自身所管理的网元建立连接;并根据预先设置的定时周期,下发采集命令至所管理的网元,将所述网元返回的性能数据进行存储。图2示出了 η个采集单元的情况采集单元1 采集单元η ;每个采集单元所管理的网元的个数至少为1个,图2示出了采集单元1所管理的网元为网元1,采集单元η所管理的网元为网元η。具体地,主控单元进一步包括主进程和主进程数据库;其中,主进程,用于与网元建立连接;主进程数据库用于存储网元分布信息。具体地,采集单元进一步包括采集进程和采集进程数据库;其中,采集进程数据库,用于存储所述网元返回的性能数据;其中,各采集进程下发采集命令的定时周期可以通过自身的配置文件进行设置;网元接收到采集命令后,通过FTP形式将性能数据文件返回给采集进程,采集进程将接收到的性能数据文件转换为采集进程数据库自定义的数据库格式,并进行存储。相应地,主进程进一步用于接收用户通过客户端下发的性能业务命令,并判断所述性能业务命令的类型,当性能业务命令为查询类性能业务命令时,将所述查询类性能业务命令发送到相应的采集进程;具体地,主进程可以通过性能业务命令的命令码进行类型的判断命令码小于86500的性能业务命令的类型为查询类;主进程进一步根据查询类性能业务命令中包含的网元编号,及主进程数据库中预先存储的网元分布信息,将所述查询类性能业务命令下发到所述网元编号对应网元所在的采集进程;当性能业务命令为业务配置类性能业务命令时,将所述业务配置类性能业务命令发送到网元;命令码大于86500的性能业务命令的类型为业务配置类命令;当主进程判断得到用户输入的性能业务命令为业务配置类性能业务命令时,进一步根据业务配置类性能业务命令中包含的网元编号,将所述业务配置类性能业务命令下发到所述网元编号对应的网元;其中所述性能业务命令可以为性能屏蔽、性能清零等业务配置类命令。采集进程根据接收到的性能业务命令,查询采集进程数据库,将查询到的性能数据返回给所述主进程。例如,当性能业务命令为查询所述采集进程所管理的某个网元当天的所有性能数据,此时,采集进程需要查询自身的采集进程数据库,统计该网元当天的所有性能数据,并返回给主进程,其中,查询类性能业务命令还可以为查询所述采集进程所管理的某个网元的一周、或一个月时长的所有性能数据。进一步地,所述主控单元还用于监听采集单元的连接信息,并记录采集单元的连接状态,当监听到采集单元的连接断开时,上报告警并重启异常的采集单元。具体地,主控单元的主进程通过套接字(socket)监听采集单元的采集进程的连接信息,并记录采集进程的连接状态;当监听到采集进程的连接断开时,主进程上报“采集进程连接断开告警”至客户端,并重启异常的采集进程。应当理解,上述网络管理系统在实际应用中,主控单元和采集单元可以部署在一个机器上,也可以部署在多个机器上;同时主控单元的主进程数据库和采集单元的采集进程数据库不存在依赖关系,相互独立。以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
权利要求
1.一种性能采集的方法,其特征在于,所述方法包括下述步骤采集单元启动时自动连接主控单元,根据预先存储于主控单元中的网元分布信息,获取自身所管理的网元信息,并与所述自身所管理的网元建立连接;采集单元根据预先设置的定时周期,下发采集命令至所管理的网元,并将所述网元返回的性能数据进行存储。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括 主控单元与网元建立连接。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括主控单元接收用户下发的性能业务命令,并判断所述性能业务命令的类型,当性能业务命令为查询类性能业务命令时,将查询类性能业务命令下发到采集单元;采集单元根据接收到的性能业务命令,进行查询,将查询到的性能数据返回给主控单兀。
4.根据权利要求3所述的方法,其特征在于,所述当性能业务命令为业务配置类性能业务命令时,主控单元将所述业务配置类性能业务命令下发到网元。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括主控单元监听采集单元的连接信息,并记录采集单元的连接状态,当监听到采集单元的连接断开时,上报告警并重启异常的采集单元。
6.一种网络管理系统,其特征在于,所述系统包括主控单元和至少一个采集单元;其中,主控单元,用于存储网元分布信息;采集单元,用于在启动时自动连接主控单元,根据所述网元分布信息,获取自身所管理的网元信息,并与所述自身所管理的网元建立连接;并根据预先设置的定时周期,下发采集命令至所管理的网元,将所述网元返回的性能数据进行存储。
7.根据权利要求6所述的系统,其特征在于,所述主控单元进一步包括主进程和主进程数据库;其中,主进程,用于与网元建立连接; 主进程数据库,用于存储网元分布信息。
8.根据权利要求7所述的系统,其特征在于,采集单元进一步包括采集进程和采集进程数据库;其中,采集进程数据库,用于存储所述网元返回的性能数据;相应地,所述主进程进一步用于接收用户下发的性能业务命令,并判断所述性能业务命令的类型,当性能业务命令为查询类性能业务命令时,将所述查询类性能业务命令发送到采集进程;当性能业务命令为业务配置类性能业务命令时,将所述业务配置类性能业务命令发送到网元;采集进程,用于根据接收到的性能业务命令,查询采集进程数据库,将查询到的性能数据返回给所述主进程。
9.根据权利要求6至8任一项所述的系统,其特征在于,所述主控单元还用于监听采集单元的连接信息,并记录采集单元的连接状态,当监听到采集单元的连接断开时,上报告警并重启异常的采集单元。
全文摘要
本发明提供了一种网络管理系统及性能采集的方法,所述方法包括采集单元启动时自动连接主控单元,根据预先存储于主控单元中的网元分布信息,获取自身所管理的网元信息,并与自身所管理的网元建立连接;采集单元根据预先设置的定时周期,下发采集命令至所管理的网元,并将所述网元返回的性能数据进行存储。本发明通过利用分布式部署的采集单元对网元进行性能数据的采集,有效利用了资源,提高了网络管理系统管理多网元时的性能采集效率,避免了网络管理中网元个数过多导致的性能数据丢失问题;同时主控单元对所有采集单元及网元的配置进行统一管理,避免了网络管理对其它业务的影响,提高了网络管理系统的可靠性和性能数据的完整性。
文档编号H04L12/24GK102480369SQ20101055620
公开日2012年5月30日 申请日期2010年11月23日 优先权日2010年11月23日
发明者刘海瑞, 张曰明, 郭文婷 申请人:中兴通讯股份有限公司