专利名称:一种物理链路断路告警处理方法和设备单元的制作方法
技术领域:
本发明涉及移动通信技术领域,特别是涉及一种物理链路断路告警处理方法和一 种设备单元。
背景技术:
在时分同步码分多址(TD-SCDMA,TimeDivision-Synchronous Code Division Multiple Access)通信系统中,基站和核心网设备一般都由数个设备单元组成,各设备单 元的告警处理模块负责监控各自所属设备单元的工作状态,并根据这些状态产生相应的告 警消息,上报给上级的管理维护中心。在TD-SCDMA系统中,由于这样或那样的原因,会导致设备单元与上一级管理维护 中心之间的物理链路发生断路。目前,对这类情况的告警处理方法主要是物理链路断路的 情况发生后,设备单元将告警信息保存到固件中,当物理链路恢复正常后,只是主动向管理 维护中心上报物理链路断链恢复告警。上述的告警处理方法中,设备单元没有将物理链路断路时间窗(Tl T2时间段, Tl是物理链路断开发生时刻,T2是物理链路恢复正常的时刻)内产生的故障和告警信息上 报给管理维护中心。这导致如下缺点1、物理链路断路重启系统后,未将Tl T2时间段内的故障和告警信息上报给管 理维护中心,导致管理维护中心的故障和告警信息缺失,妨碍系统运维人员对故障原因进 行快速定位分析。主要体现在,一旦物理链路发生长时间的断路得不到恢复,为使物理链 路恢复正常,系统通常会直接执行进程退出、系统复位重启等操作,而在启动链路恢复正常 后,也没有将物理链路断开时间窗内的故障和告警信息进行上报,直接导致管理维护中心 层面的故障和告警信息的缺失。2、物理链路未经重启动已恢复正常时,未将Tl T2时间段内的故障和告警信息 上报给管理维护中心,导致管理维护中心的故障和告警信息缺失。这主要体现在现有的方 法仅向管理维护中心上报了物理链路断链恢复告警,管理维护中心无法在第一时间获取发 生在物理链路断开时间窗内的故障和告警信息。综上所述,现有的物理链路断路告警处理方法中,没有将物理链路断路时间窗内 的故障和告警信息在物理链路恢复时及时上报给管理维护中心,导致管理维护中心层面的 故障和告警信息的缺失。
发明内容
本发明公开了 一种物理链路断路告警处理方法,该方法使得管理维护中心能够及 时地得到完整的故障和告警信息。本发明还公开了一种设备单元,该设备单元使得管理维护中心能够及时地得到完 整的故障和告警信息。为达到上述目的,本发明的技术方案是这样实现的
本发明公开了一种物理链路断路告警处理方法,该方法包括当设备单元与管理维护中心之间的物理链路发生断路时,设备单元保存物理链路 断路时间窗内产生的故障和告警信息;当设备单元与管理维护中心之间的物理链路恢复时,设备单元将保存的所述物理 链路断路时间窗内产生的故障和告警信息上报给管理维护中心。本发明还一种设备单元,该设备单元包括物理链路断路告警处理模块、存储模块 和告警上报模块,其中,物理链路断路告警处理模块,用于在设备单元与管理维护中心之间的物理链路发 生断路时,将物理链路断路时间窗内产生的故障和告警信息保存到存储模块中;用于在设 备单元与管理维护中心之间的物理链路恢复时,向告警上报模块发送上报指示消息;存储模块,用于保存故障和告警信息;告警上报模块,用于在接收到所述上报指示消息后,将存储模块中的故障和告警 信息上报给管理维护中心。由上述可将,本发明这种当设备单元与管理维护中心之间的物理链路发生断路 时,设备单元保存物理链路断路时间窗内产生的故障和告警信息,当设备单元与管理维护 中心之间的物理链路恢复时,设备单元将保存的所述物理链路断路时间窗内产生的故障和 告警信息上报给管理维护中心的技术方案,由于设备单元在物理链路断路期间收集并保存 故障和告警信息,并在物理链路恢复时主动向管理维护中心上报故障和告警信息,因此使 得管理维护中心能够及时地得到完整的故障和告警信息。
图1是本发明实施例一种物理链路断路告警处理方法的流程图;图2是本发明中的一种物理链路断路告警处理方法的较佳实施例的流程图;图3是本发明实施例一种设备单元的组成结构示意图。
具体实施例方式图1是本发明实施例一种物理链路断路告警处理方法的流程图。如图1所示,该 方法包括步骤101,当设备单元与管理维护中心之间的物理链路发生断路时,设备单元保存 物理链路断路时间窗内产生的故障和告警信息。这里,故障和告警信息泛指一切与故障和告警相关的信息,例如,包括告警信息、 故障信息、故障恢复信息、告警清除信息等。步骤102,当设备单元与管理维护中心之间的物理链路恢复时,设备单元将保存的 所述物理链路断路时间窗内产生的故障和告警信息上报给管理维护中心。较佳地,在本步骤中,如果物理链路未经重启动即恢复正常,则执行告警补充上报 流程,即将所保存的物理链路断路时间窗内产生的故障和告警信息上报给管理维护中心。 如果,在预设时间内,物理链路仍没有恢复,则进行重启操作,并在重启物理链路恢复正常 时执行告警补充上报流程。为了使本发明的目的、技术方案和优点更加清楚,下面列举较佳实施例对本发明进行详细描述。图2是本发明中的一种物理链路断路告警处理方法的较佳实施例的流程图。如图 2所示,当设备单元与管理维护中心之间的物理链路发生断路时,设备单元执行以下步骤步骤201,设置配置文件中的物理链路断路标志为有效。本步骤中,还将物理链路断路(Tl时刻)之前的未来得及保存的故障和告警信息 同时保存到告警日志存储区中以及随机存取存储器(RAM)补报数据区中。步骤202,判断是否有新的故障和告警信息产生,是则执行步骤203,否则执行步 骤 206。步骤203,判断告警日志存储区以及RAM补报数据区是否已被写满,是则执行步骤 204,否则执行步骤205。步骤204,对警日志存储区以及RAM补报数据区中的故障和告警信息进行筛选删 除。本步骤,由于没有足够的存储空间,因此进行故障和告警信息的截留处理。对物理 链路断路后的警日志存储区以及RAM补报数据区采取日志删除筛选操作,保留比较重要的 故障和告警信息,将一些不重要的故障和告警信息删除,以节省空间。由于系统故障分析对 物理链路断路后初期以及链路恢复前期的告警需求比较强烈,因此对物理链路断路时间窗 内产生的首尾两端的数据进行优先保留,而对物理链路断路时间窗中间部分的预设时间段 内产生的故障和告警信息进行删除;其中,所述预设时间段的起始时间tl滞后于物理链路 断路时间窗的起始时间Tl第一预设时间长度,所述预设时间段的截止时间t2超前于物理 链路断路时间窗的截止时间T2第二预设时间长度。第一预设时间长度和第二预设时间长 度可以根据实际情况进行设置。步骤205,将所述新的故障和告警信息同时保存到告警日志存储区中以及RAM补 报数据区中。步骤206,判断设备单元与管理维护中心之间的物理链路是否恢复,是则执行步骤 215,否则执行步骤207。步骤207,判断设备单元与管理维护中心之间的物理链路的断路时间是否超过预 设时间,是则执行步骤208,否则返回步骤202。步骤208,将RAM补报数据区中的故障和告警信息转移到永久性存储介质中的补 报文件中。本步骤中,将RAM补报数据区中的故障和告警信息转移到永久性存储介质中的补 报文件中的原因是,对设备进行重启操作会使得RAM补报数据区中的数据被删除。步骤209,进行重启操作。本步骤中,设备单元重启进行初始化。步骤210,判断设备单元与管理维护中心之间的物理链路是否恢复,是则执行步骤 211,否则继续执行步骤210。步骤211,判断配置文件中的物理链路断路标志是否为有效,是则执行步骤212, 否则,结束本流程。步骤212,提取补报文件中的故障和告警信息,将故障和告警信息填充到告警补充 上报信元数据结构中,形成告警补报消息。
步骤213,删除补报文件中的故障和告警信息以及将配置文件中的物理链路断路 标志设置为无效。步骤214,将告警补报消息上报给管理维护中心。结束流程。步骤215,提取RAM补报数据区中的故障和告警信息,将所提取故障和告警信息填 充到告警补充上报信元数据结构中,形成告警补报消息。步骤216,删除RAM补报数据区中的故障和告警信息以及将配置文件中的物理链 路断路标志设置为无效。步骤217,将告警补报消息上报给管理维护中心。结束流程。告警补充上报信元数据结构如表1所示
序号字段名称取值说明1IE标志告警IEM2IE长度告警IE长度3告警码4告警子码5告警产生时间戳格式:yyyy~mm~dd hh:mm:ss6告警清除标志0 告警未清除1 告警已清除7告警补充上报标志0 正常告警 1 补充上报告警8上报时间戳格式:yyyy~mm~dd hh:mm:ss9附加信息表 1如表1所示,告警补充上报信元数据结构由如下字段组成信元标志字段、信元长 度字段、告警码字段、告警子码字段、告警产生时间戳字段、告警清除标志字段、告警补充上 报标志字段、上报时间戳字段和附加信息字段。基于上述实施例,接下来给出本发明中的一种设备单元的组成结构。图3是本发明实施例一种设备单元的组成结构示意图。如图3所示,该设备单元 包括物理链路断路告警处理模块301、存储模块302和告警上报模块303,其中,物理链路断路告警处理模块301,用于在设备单元与管理维护中心之间的物理链 路发生断路时,将物理链路断路时间窗内产生的故障和告警信息保存到存储模块302中; 用于在设备单元与管理维护中心之间的物理链路恢复时,向告警上报模块303发送上报指 示消息;
8
存储模块302,用于保存故障和告警信息;告警上报模块303,用于在接收到所述上报指示消息后,将存储模块302中的故障 和告警信息上报给管理维护中心。在图3所示的设备单元中,存储模块302包括固件存储子模块304和RAM子模块 305 ;当设备单元与管理维护中心之间的物理链路发生断路时,所述物理链路断路告警 处理模块301执行以下的步骤步骤A,判断是否有新的故障和告警信息产生,是则执行步骤B,否则执行步骤E ;步骤B,判断固件存储子模块304和RAM子模块305是否已被写满,是则执行步骤 C,否则执行步骤D ;步骤C,对固件存储子模块304和RAM子模块305中的故障和告警信息进行筛选删 除;步骤D,将所述新的故障和告警信息同时保存到固件存储子模块304和RAM子模块 305 中;步骤E,判断设备单元与管理维护中心之间的物理链路是否恢复,是则向告警上报 模块发送第一上报指示消息,否则执行步骤F ;步骤F,判断设备单元与管理维护中心之间的物理链路的断路时间是否超过预设 时间,是则执行步骤G,否则返回步骤A ;步骤G,将RAM子模块305的故障和告警信息转移到永久性存储介质中的补报文件 中;固件存储子模块304是永久性存储介质,因此在本发明的一个实施例中,补报文件可以 保存在固件存储子模块304中,或者也可以存储到其它的永久性存储介质中。步骤H,进行设备单元重启动操作,并在设备单元与管理维护中心之间的物理链路 恢复时,向告警上报模块303发送第二上报指示消息;所述告警上报模块303,用于在接收到第一上报指示消息时,将RAM子模块305中 的故障和告警信息上报给管理维护中心;用于在接收到第二上报指示消息时,将补报文件 中的故障和告警信息上报给管理维护中心。在图3所示的设备单元中,所述物理链路断路告警处理模块301,用于在步骤C中 删除物理链路断路时间窗内的预设时间段内产生的故障和告警信息;其中,所述预设时间 段的起始时间tl滞后于物理链路断路时间窗的起始时间Tl第一预设时间长度,所述预设 时间段的截止时间t2超前于物理链路断路时间窗的截止时间T2第二预设时间长度。在图3所示的设备单元中,所述物理链路断路告警处理模块301,进一步用于在步 骤A之前,将配置文件中的物理链路断路标志设置为有效;进一步用于在步骤H中,在物理 链路恢复时先判断配置文件中的物理链路断路标志是否为有效,是则向告警上报模块303 发送第二上报指示消息;进一步用于在告警上报模块303将补报文件中的故障和告警信息 上报为管理维护中心之后,删除补报文件中的故障和告警信息以及将配置文件中的物理链 路断路标志设置为无效;进一步用于在告警上报模块303将RAM子模块305中的故障和告 警信息上报给管理维护中心之后,删除RAM子模块305中的故障和告警信息以及将配置文 件中的物理链路断路标志设置为无效。在本发明的一个实施例中,配置文件可以保存在固 件存储子模块304中。
在图3所示的设备单元中,所述告警上报模块303,用于将故障和告警信息填充 到告警补充上报信元数据结构中,形成告警补报消息,将告警补报消息上报给管理维护中 心;其中,所述告警补充上报信元数据结构由如下字段组成信元标志字段、信元长度 字段、告警码字段、告警子码字段、告警产生时间戳字段、告警清除标志字段、告警补充上报 标志字段、上报时间戳字段和附加信息字段。本发明提供的上述技术方案存在如下优点1、解决了物理链路断路重启造成故障和告警信息丢失的问题,主要在于在物理链 路断路重启前,及时保存物理链路断路时间窗内产生的故障和告警信息,避免重要故障和 告警信息的丢失。2、有利于节省系统维护及故障定位时间,主要在于物理链路断路重启恢复正常通 讯后,采用主动上报物理链路断路时间窗内产生的故障和告警信息,在最快时间内上报给 管理维护中心。3、提高了链路断路告警的上报及时性和完整性,主要在于未经重启动链路恢复 时,直接触发告警补充上报流程,向上级管理维护中心主动上报物理链路断路时间窗内产 生的故障和告警信息。4、采用告警补充上报信元数据结构进行故障和告警信息的上报,以区分正常的非 补充形式的告警信息,便于管理维护中心的运维人员对物理链路断路时间窗内产生的故障 和告警信息进行查询。5、对物理链路断路时间窗内的海量告警发生情况,进行重要故障和告警信息数据 的区分截取,避免由于存储空间的限制导致重要的故障和告警信息被丢弃的问题。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精 神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
10
权利要求
一种物理链路断路告警处理方法,其特征在于,该方法包括当设备单元与管理维护中心之间的物理链路发生断路时,设备单元保存物理链路断路时间窗内产生的故障和告警信息;当设备单元与管理维护中心之间的物理链路恢复时,设备单元将保存的所述物理链路断路时间窗内产生的故障和告警信息上报给管理维护中心。
2.根据权利要求1所述的方法,其特征在于,所述设备单元保存物理链路断路时间窗 内产生的故障和告警信息,当设备单元与管理维护中心之间的物理链路恢复时,设备单元 将保存的所述物理链路断路时间窗内产生的故障和告警信息上报给管理维护中心包括步骤A,判断是否有新的故障和告警信息产生,是则执行步骤B,否则执行步骤E ;步骤B,判断告警日志存储区以及随机存取存储器RAM补报数据区是否已被写满,是则 执行步骤C,否则执行步骤D ;步骤C,对警日志存储区以及RAM补报数据区中的故障和告警信息进行筛选删除;步骤D,将所述新的故障和告警信息同时保存到告警日志存储区中以及RAM补报数据 区中;步骤E,判断设备单元与管理维护中心之间的物理链路是否恢复,是则执行步骤I,否 则执行步骤F ;步骤F,判断设备单元与管理维护中心之间的物理链路的断路时间是否超过预设时间, 是则执行步骤G,否则返回步骤A ;步骤G,将RAM补报数据区中的故障和告警信息转移到永久性存储介质中的补报文件中;步骤H,进行重启动操作,并在物理链路恢复时,将补报文件中的故障和告警信息上报 给管理维护中心;结束本流程;步骤I,将RAM补报数据区中的故障和告警信息上报给管理维护中心;结束本流程。
3.根据权利要求2所述的方法,其特征在于,所述步骤C包括删除物理链路断路时间 窗内的预设时间段内产生的故障和告警信息;其中,所述预设时间段的起始时间tl滞后于 物理链路断路时间窗的起始时间Tl第一预设时间长度,所述预设时间段的截止时间t2超 前于物理链路断路时间窗的截止时间T2第二预设时间长度。
4.根据权利要求2所述的方法,其特征在于,在步骤A之前,该方法进一步包括设置 配置文件中的物理链路断路标志为有效;所述步骤H进一步包括在物理链路恢复时先判断配置文件中的物理链路断路标志是 否为有效,是则执行所述将补报文件中的故障和告警信息上报给管理维护中心的步骤,并 删除补报文件中的故障和告警信息以及将配置文件中的物理链路断路标志设置为无效,否 则直接结束流程;所述步骤I进一步包括在将RAM补报数据区中的故障和告警信息上报给管理维护中 心之后,删除RAM补报数据区中的故障和告警信息以及将配置文件中的物理链路断路标志 设置为无效。
5.根据权利要求1至4中任一项所述的方法,其特征在于,将故障和告警信息上报给管 理维护中心包括将故障和告警信息填充到告警补充上报信元数据结构中,形成告警补报消息,将告警补报消息上报给管理维护中心;所述告警补充上报信元数据结构由如下字段组成信元标志字段、信元长度字段、告警 码字段、告警子码字段、告警产生时间戳字段、告警清除标志字段、告警补充上报标志字段、 上报时间戳字段和附加信息字段。
6.一种设备单元,其特征在于,该设备单元包括物理链路断路告警处理模块、存储模 块和告警上报模块,其中,物理链路断路告警处理模块,用于在设备单元与管理维护中心之间的物理链路发生断 路时,将物理链路断路时间窗内产生的故障和告警信息保存到存储模块中;用于在设备单 元与管理维护中心之间的物理链路恢复时,向告警上报模块发送上报指示消息; 存储模块,用于保存故障和告警信息;告警上报模块,用于在接收到所述上报指示消息后,将存储模块中的故障和告警信息 上报给管理维护中心。
7.根据权利要求6所述的设备单元,其特征在于, 所述存储模块包括固件存储子模块和RAM子模块;当设备单元与管理维护中心之间的物理链路发生断路时,所述物理链路断路告警处理 模块执行以下的步骤步骤A,判断是否有新的故障和告警信息产生,是则执行步骤B,否则执行步骤E ; 步骤B,判断固件存储子模块和RAM子模块是否已被写满,是则执行步骤C,否则执行步 骤D;步骤C,对固件存储子模块和RAM子模块中的故障和告警信息进行筛选删除; 步骤D,将所述新的故障和告警信息同时保存到固件存储子模块和RAM子模块中; 步骤E,判断设备单元与管理维护中心之间的物理链路是否恢复,是则向告警上报模块 发送第一上报指示消息,否则执行步骤F ;步骤F,判断设备单元与管理维护中心之间的物理链路的断路时间是否超过预设时间, 是则执行步骤G,否则返回步骤A ;步骤G,将RAM子模块中的故障和告警信息转移到永久性存储介质中的补报文件中; 步骤H,进行设备单元重启动操作,并在设备单元与管理维护中心之间的物理链路恢复 时,向告警上报模块发送第二上报指示消息;所述告警上报模块,用于在接收到第一上报指示消息时,将RAM子模块中的故障和告 警信息上报给管理维护中心;用于在接收到第二上报指示消息时,将补报文件中的故障和 告警信息上报给管理维护中心。
8.根据权利要求7所述的设备单元,其特征在于,所述物理链路断路告警处理模块,用于在步骤C中删除物理链路断路时间窗内的预设 时间段内产生的故障和告警信息;其中,所述预设时间段的起始时间tl滞后于物理链路断 路时间窗的起始时间Tl第一预设时间长度,所述预设时间段的截止时间t2超前于物理链 路断路时间窗的截止时间T2第二预设时间长度。
9.根据权利要求7所述的设备单元,其特征在于,所述物理链路断路告警处理模块,进一步用于在步骤A之前,将配置文件中的物理链 路断路标志设置为有效;进一步用于在步骤H中,在物理链路恢复时先判断配置文件中的物理链路断路标志是否为有效,是则向告警上报模块发送第二上报指示消息;进一步用于 在告警上报模块将补报文件中的故障和告警信息上报为管理维护中心之后,删除补报文件 中的故障和告警信息以及将配置文件中的物理链路断路标志设置为无效;进一步用于在告 警上报模块将RAM子模块中的故障和告警信息上报给管理维护中心之后,删除RAM子模块 中的故障和告警信息以及将配置文件中的物理链路断路标志设置为无效。
10.根据权利要求6至9中任一项所述的设备单元,其特征在于, 所述告警上报模块,用于将故障和告警信息填充到告警补充上报信元数据结构中,形 成告警补报消息,将告警补报消息上报给管理维护中心;其中,所述告警补充上报信元数据结构由如下字段组成信元标志字段、信元长度字 段、告警码字段、告警子码字段、告警产生时间戳字段、告警清除标志字段、告警补充上报标 志字段、上报时间戳字段和附加信息字段。
全文摘要
本发明公开了一种物理链路断路告警处理方法和设备单元。所诉和方法包括当设备单元与管理维护中心之间的物理链路发生断路时,设备单元保存物理链路断路时间窗内产生的故障和告警信息;当设备单元与管理维护中心之间的物理链路恢复时,设备单元将保存的所述物理链路断路时间窗内产生的故障和告警信息上报给管理维护中心。本发明的技术方案,使得管理维护中心能够及时地得到完整的故障和告警信息。
文档编号H04W24/04GK101951632SQ20101028328
公开日2011年1月19日 申请日期2010年9月16日 优先权日2010年9月16日
发明者何定润 申请人:新邮通信设备有限公司