一种信息化机房故障点影响范围分析系统及方法

文档序号:9818429阅读:269来源:国知局
一种信息化机房故障点影响范围分析系统及方法
【技术领域】
[0001]本发明涉及机房故障点监测领域,具体地说是一种信息化机房故障点影响范围分析系统及方法。
【背景技术】
[0002]近年来,随着信息化技术的普及和大规模应用,各类企、事业单位建设了大量的应用系统,与之相对应,多数单位建设了现代化的信息化机房。作为企业信息化建设的基础设施,机房具有高复杂性、高投入性、高技术密集性和高风险性等特点,它的稳定运行关系到企业的生产安全、信息安全以及日常的业务流程处理,在企业的运转过程中起到了越来越重要的作用。
[0003]目前,大多企业机房都具备一些保障系统,如网络管理系统、监控系统、消防报警系统等,这些系统在一定程度上提高了机房运行的安全性,但是,这些系统往往只关注机房运行的单一方面,且技术路线不统一,数据难共享,难以从整体分析故障的位置及影响范围;另一方面,随着机房规模的不断扩大、网络接线的增加、应用系统的增多以及应用系统间业务关联不断增强,故障点的定位和处理也变得更复杂,很难通过人工手段来解决。
[0004]目前缺少专门的工具从机房整体考虑、并综合多种因素来分析故障点可能带来的影响范围,以及引起该故障的可能故障源,这给机房的日常维护带来困难;另一方面,当对机房设备或系统进行检修时,也难以方便、快速、准确的评估检修可能影响到的其它设备、系统及业务流程,从而影响检修预案的质量,给机房的日常维护带来潜在的风险。

【发明内容】

[0005]针对现有技术的不足,本发明提供一种可以提高机房的管理水平的信息化机房故障点影响范围分析系统及方法,用来协助机房管理人员及时发现故障点,并通过智能分析,向管理员提供该故障点可能影响到的设备和应用系统。
[0006]本发明为实现上述目的所采用的技术方案是:一种信息化机房故障点影响范围分析系统,其中,数据采集模块连接被监控对象,采集被监控对象的状态信息;任务调度模块连接数据采集模块,接收数据采集模块发送的被监控对象的状态信息;任务调度模块连接故障信息处理模块,调度故障信息处理模块进行故障判断;其特征在于:任务调度模块连接故障影响分析模块,调度故障影响分析模块分析故障影响。
[0007]所述任务调度模块为负责系统整体业务调度和控制,同时将数据进行汇总、缓存和同步的模块。
[0008]所述故障影响分析模块为负责分析故障点影响范围的模块。
[0009]还包括系统运行监控模块与任务调度模块连接,接收任务调度模块的实时数据,对其运行情况进行监控。
[0010]一种信息化机房故障点影响范围分析方法,包括以下过程:
[0011]步骤1:对机房中设备和应用系统进行数据建模,并定义被监测对象故障判断规则和故障影响范围判断规则;
[0012]步骤2:任务调度模块调度数据采集模块采集被监测对象的实时状态信息;
[0013]步骤3:故障信息处理模块根据故障判断规则判断当前被监测对象的故障状态;
[0014]步骤4:当被监测对象为故障状态时,故障影响分析模块根据故障影响范围判断规则判断当前故障影响范围。
[0015]所述故障判断规则为:根据需求设定每个被监测对象的非故障范围,则超出非故障范围判定为故障状态。
[0016]所述故障影响范围判断规则包括网络拓扑判断规则和应用系统判断规则。
[0017]所述网络拓扑判断规则为找出与故障点相关的网络拓扑设备,设备范围为故障影响范围。
[0018]所述应用系统判断规则为找出与故障点相关的应用系统,以及与该系统有逻辑关系的应用系统,应用系统范围为故障影响范围。
[0019]本发明具有以下有益效果及优点:
[0020]1.本发明故障点的判断以及故障影响范围分析都采用基于表达式的规则定义方式,处理灵活,扩展性强,效率高。
[0021]2.本发明从机房整体作为分析对象,综合考虑了设备、网络、应用、机房环境多种因素对故障点进行影响范围分析,相比现有的其它系统,具有更高的判断准确性和技术先进性。
【附图说明】
[0022]图1是本发明的总体结构关系图;
[0023]图2是本发明的模块结构图。
【具体实施方式】
[0024]下面结合附图及实施例对本发明做进一步的详细说明。
[0025]如图1所示为本发明的总体结构关系图,本发明的系统是一种多层次、模块化、支持分布式部署的信息化系统,它主要可分为三个层次,从下向上依次为数据存储层、平台功能层和业务应用层。
[0026]数据存储层由平台数据中心组成,平台数据中心包括了系统运行所依赖的底层的模型定义数据和业务数据,以及操作这些数据的接口方法。
[0027]平台数据中心包括的数据主要有监控模型数据(包括设备、系统、机房环境对象信息及监测点定义等数据)、故障判断规则模型、故障范围分析模型等数据定义,另外还包括系统运行时采集的业务数据和生成的日志信息。这些数据的存储方式有多种选择方式,如数据库、文件等。
[0028]平台数据中心可以独立部署,也可以与整个系统共同部署,它提供数据访问接口供上层应用调用,提高了系统部署的灵活性。
[0029]如图1所示,平台功能层是系统的核心部分,它又可以进一步分为任务调度模块、数据采集模块、故障信息处理模块、故障影响分析模块、系统运行监控模块等几部分。
[0030]平台系统初始化的时候,会通过平台数据中心加载各种模型数据、网络拓扑信息、应用系统关系数据、故障判断规则、故障影响范围规则等基础数据,特别是对网络拓扑信息、应用系统关系数据,平台会根据它们的逻辑关系生成有向图模型,以便于数据的遍历和处理。
[0031]如图2所示为本发明的模块结构图,任务调度模块与数据采集模块是两个相对独立的子系统,可以分布式部署,通过网络实现互联,提高系统的灵活性和扩展性。任务调度模块是系统的核心业务调度模块,同时负责业务数据的缓存及同步;数据采集模块涵盖了数据采集协议的解析、采集数据处理、数据采集等底层功能,实现外部监测数据的接入。
[0032]故障信息处理模块的运行依赖任务调度模块,它以采集数据、故障判断规则为基础数据进行计算,完成监控点状态的判断,实现故障信息的生成和日志记录。
[0033]故障影响分析模块由任务调用模块调用,它以故障信息处理模块生成的报警信息、故障范围分析规则为基础数据进行分析计算,得出当前故障影响的范围,或者引起当前故障的潜在故障源信息。
[0034]系统运行监控模块,是平台管理员对平台运行情况进行监控的接口,保证系统的安全稳定运行。
[0035]业务应用层根据具体的业务需求,提供用户与系统交互的人机界面,完成用户的业务操作。它分为应用控制中心和各类应用页面两部分,应用控制中心负责平台核心模块与业务页面的连接,实现业务模型分析、业务数据处理、页面数据解析、数据质量校验等核心功能;各类应用页面负责数据的显示和对用户操作的响应。
【主权项】
1.一种信息化机房故障点影响范围分析系统,其中,数据采集模块连接被监控对象,采集被监控对象的状态信息;任务调度模块连接数据采集模块,接收数据采集模块发送的被监控对象的状态信息;任务调度模块连接故障信息处理模块,调度故障信息处理模块进行故障判断;其特征在于:任务调度模块连接故障影响分析模块,调度故障影响分析模块分析故障影响。2.根据权利要求1所述的信息化机房故障点影响范围分析系统,其特征在于:所述任务调度模块为负责系统整体业务调度和控制,同时将数据进行汇总、缓存和同步的模块。3.根据权利要求1所述的信息化机房故障点影响范围分析系统,其特征在于:所述故障影响分析模块为负责分析故障点影响范围的模块。4.根据权利要求1所述的信息化机房故障点影响范围分析系统,其特征在于:还包括系统运行监控模块与任务调度模块连接,接收任务调度模块的实时数据,对其运行情况进行监控。5.一种信息化机房故障点影响范围分析方法,其特征在于,包括以下过程: 步骤1:对机房中设备和应用系统进行数据建模,并定义被监测对象故障判断规则和故障影响范围判断规则; 步骤2:任务调度模块调度数据采集模块采集被监测对象的实时状态信息; 步骤3:故障信息处理模块根据故障判断规则判断当前被监测对象的故障状态; 步骤4:当被监测对象为故障状态时,故障影响分析模块根据故障影响范围判断规则判断当前故障影响范围。6.根据权利要求5所述的信息化机房故障点影响范围分析方法,其特征在于,所述故障判断规则为:根据需求设定每个被监测对象的非故障范围,则超出非故障范围判定为故障状态。7.根据权利要求5所述的信息化机房故障点影响范围分析方法,其特征在于:所述故障影响范围判断规则包括网络拓扑判断规则和应用系统判断规则。8.根据权利要求7所述的信息化机房故障点影响范围分析方法,其特征在于:所述网络拓扑判断规则为找出与故障点相关的网络拓扑设备,设备范围为故障影响范围。9.根据权利要求7所述的信息化机房故障点影响范围分析方法,其特征在于:所述应用系统判断规则为找出与故障点相关的应用系统,以及与该系统有逻辑关系的应用系统,应用系统范围为故障影响范围。
【专利摘要】本发明涉及一种信息化机房故障点影响范围分析系统及方法,数据采集模块连接被监控对象,任务调度模块连接数据采集模块、故障信息处理模块和故障影响分析模块;对机房中设备和应用系统进行数据建模,并定义被监测对象故障判断规则和故障影响范围判断规则;任务调度模块调度数据采集模块采集被监测对象的实时状态信息;故障信息处理模块根据故障判断规则判断当前被监测对象的故障状态;当被监测对象为故障状态时,故障影响分析模块根据故障影响范围判断规则判断当前故障影响范围。本发明适合设备众多、接线复杂、业务系统间关系复杂的大型机房,尤其是对安全性要求较高的能源、电力、国防、政府等各类企、事业单位信息化机房。
【IPC分类】H04L12/24
【公开号】CN105591788
【申请号】CN201410652779
【发明人】韩嵩峰, 王汉军, 向勇, 李喜旺, 张千里, 李丹, 代宇
【申请人】中国科学院沈阳计算技术研究所有限公司
【公开日】2016年5月18日
【申请日】2014年11月14日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1