用于通信网络中的利用自适应诊断模型的诊断设备的制作方法

文档序号:7620430阅读:119来源:国知局
专利名称:用于通信网络中的利用自适应诊断模型的诊断设备的制作方法
技术领域
本发明涉及被管理的通信网络的领域,并且特别涉及用于确定发生在这种网络内的问题的原因的诊断设备。
背景技术
发生在被管理的通信网络中的问题可以具有许多不同的原因。主要的原因包括例如停电、连接断开、网络设备(或构成其的元件)损坏或故障,以及不完全与所述网络的剩余部分兼容的网络设备(或构成其的元件)的新或旧版本的集成。
在本上下文中,“网络设备”是指硬件和软件的组合。
已经建议了一些诊断设备(或工具)用于确定所述问题的原因。某些所述设备使用基于以面向对象的语言和/或基于规则的语言来编程的技术,该编程可能由规则引擎来管理。这特别应用于事件相关性专家(ECXpert,event correlation expert)设备、来自使用用于诊断的可编程规则引擎的ILOG的设备、Network Node Manager版本6.4的设备、来自HewlettPackard的Network Node Manager Extended Topology版本2.0的设备、来自Agilent的Fault Detective for Data Communications(FDDC)的设备,以及来自CISCO的TAC设备。
ALCATEL还提供了一种诊断设备,其是基于贝叶斯概率论原理(Bayesian probabilistic theory)的并被用于基于附加证据和背景信息的概念来确定用于精炼假定的规则,这导致了这样的数值每个都表示假定为真的概率并且被用于构造贝叶斯网络(也称为贝叶斯图表),该贝叶斯网络定义了与统计的或概率的权重关联的测试操作。
上述诊断设备的主要缺点是其使用了静态的诊断模型,也就是在设计时就固定了其特性的模型,因此从硬件(或其版本)的观点与从软件(或其版本)的观点相同,该模型不适于(或仅在特别适合的最好的事例情景中)开发多数网络的资源,或者开发网络中的业务。这是所述诊断模型是从知识基础被构造的事实的结果,所述知识基础是基于专业知识的并且很难适于所有特定的硬件和软件和/或适于硬件和/或软件的所有组合,并且该诊断模型另外在其被设计时最多代表仅在现有技术中已知的。
美国专利6,076,083建议了一种适应诊断模型的解决方案,但这仅根据在其使用中所获得的经验。因此所述解决方案不能考虑到所述被管理的通信网络的发展,并且因此是不充分的。
当然,总是可以设计出适于所述网络的每个发展的新的诊断模型,但这特别昂贵并且需要特定的设计时间,在该设计时间期间发生在网络内的问题的新原因不能被正确地诊断。

发明内容
本发明的目的是改进不存在完全符合要求的现有技术诊断设备的情况。
为此,建议了一种用于通信网络的诊断设备,所述通信网络包括耦合到管理系统的网络设备,所述设备包括适于通过一个或多个诊断模型来确定发生在所述网络中的问题的原因的诊断装置,以及适于根据由所述管理系统提供的数据来适应所述诊断模型的处理装置,所述管理系统代表所述网络的组成。
所述诊断设备可以特别单独地或组合地具有附加特征
—所述数据代表网络设备的修改,并且所述处理装置包括分析装置和适应装置,所述分析装置适于分析所接收的数据来确定要采取的动作,以根据所述动作所代表的网络设备的一个或多个修改来适应所述诊断模型,以及产生代表所述动作的指令,所述适应装置适于根据接收自所述分析装置的一个或多个指令来适应诊断模型,—所述处理装置包括第一存储器,其被耦合到所述分析装置并且适于存储一个或多个参考诊断模型,并且所述分析装置适于通过将所接收的数据与存储在所述第一存储器中的一个或多个参考诊断模型相比较,来确定将要采取的每个适应动作,—所述分析装置适于确定从组中选择的适应动作,所述组包括代表将要构造的新模型的动作、代表将要对现有诊断模型进行修改的动作,以及代表现有诊断模型的重新配置的动作,—所述设备还包括第二存储器,其被耦合到所述处理装置和所述诊断装置,并且适于存储由所述处理装置发送的每个诊断模型,—当接收到由于特定的网络设备的修改而要求产生新的诊断模型的指令时,所述适应装置适于从所述第一存储器提取参考诊断模型以便产生新的诊断模型,并且然后将该新的诊断模型存储到所述第二存储器中,所述参考诊断模型根据所述特定修改而适合所述网络的组成,—当接收到由于特定的网络设备的修改而要求修改存储在所述第二存储器中的现有诊断模型的指令时,所述自适应装置适于从所述第二存储器提取所述现有诊断模型以便根据所述特定的修改来将其修改,并且然后将修改后的现有诊断模型存储在所述第二存储器中,—当接收到由于特定的网络设备的修改而要求重新配置存储在所述第二存储器中的现有诊断模型的指令时,所述自适应装置适于从所述第二存储器提取所述现有诊断模型以便根据所述特定的修改将其重新配置,并且然后将重新配置后的现有诊断模型存储在所述第二存储器中,—当接收到针对被选择的诊断的请求时,所述诊断装置适于从所述第二存储器提取所述被选择的诊断并且然后执行所提取的诊断模型,以便在输出发送诊断,—所述数据由所述管理系统以通知的形式发送,—至少一些所述参考诊断模型采取一个或多个贝叶斯网络的形式,—至少一些所述诊断模型采取一个或多个贝叶斯网络的形式。
本发明还提供用于被管理的通信网络的网络管理系统或服务管理系统,所述系统包括上文限定类型的一个或多个诊断设备。


在读过下面的详细描述并且检查附图后,本发明的其它特征和优点将变得明显。
图1示出了耦合到网络管理系统的本发明的诊断设备的一个实施例;图2A至2C分别示出了适于确定在IP路由器中分组丢失的原因的贝叶斯网络的第一个例子、由图2A所示的第一个例子的适应所产生的贝叶斯网络的第二个例子,以及由图2B所示的第二个例子的适应所产生的贝叶斯网络的第三个例子;图3示出了包括本发明的诊断设备的网络管理系统的一个实施例。
具体实施例方式
附图构成了本发明说明书的一部分,并且如果必要,有助于本发明的定义。
本发明的目的是通过包括自适应诊断模型的诊断设备,能够确定发生在被管理的通信网络中的问题的原因。
本发明应用于包括网络设备的任何类型的被管理的网络,并且特别是因特网协议(IP)网络。
在本上下文中,表达“网络设备”是指硬件和软件的组合,例如核心路由器和边缘路由器。
首先参照图1描述本发明的诊断设备DD。
在所示实施例中,所述诊断设备DD被耦合到被管理的通信网络N的管理系统MS。为此,可以采用适于被连接到所述管理系统MS的专用卡或模块的形式,这经由连接接口是可应用的。
然而,在图3所示的变化中,所述诊断设备DD形成所述管理系统MS的一部分。这样,所述诊断设备DD的处理模块MT被耦合到所述管理系统MS的管理服务器SG。
所述诊断设备DD所耦合的管理系统MS可以是所述网络N的网络管理系统(NMS)或服务管理系统(当要求诊断服务时)。下文通过非限制性例子的方式考虑所述诊断设备DD所耦合的管理系统MS是网络管理系统(NMS)。
此外,所述诊断同样可以涉及网络级别(网络设备和配置),并且涉及管理和服务级别(网络设备、配置、服务质量(QoS)和服务级协议(SLA))。
所述诊断设备DD首先包括用于通过一个或多个诊断模型来确定问题的原因的诊断模块MD。
每次请求实现请求中所指定的诊断时,所述诊断模块MD激活(或使用或执行)对应于所指定的诊断的诊断模块,以便在输出发送诊断,也就是发生在所述网络N内的问题的至少一个或多个原因。
所述诊断模型例如被存储在所述诊断设备DD的存储器M2中,例如采用数据库的形式,所述诊断模块MD可以访问该数据库以在接收到诊断请求后选择所述模型之一。
将诊断请求发送到所述诊断设备DD通常是由网络运营商在所述网络管理系统MS接收到来自网络设备NE的一个或多个通知之后来请求的。
所述诊断请求可以由所述网络管理系统MS产生,或者被直接发送到所述诊断设备DD而不通过所述管理系统MS。
例如,所述通知是这样的警报如果所述网络设备NE在其自身内(即在其元件之一的级别处,例如输入或输出接口)或在其连接之一上检测到问题(损坏或故障),则自动发送到所述网络管理系统MS。
由于所述通知不总包含足够的信息,因此通常在网络运营商的请求下,可以由所述网络管理系统MS请求有关所述网络设备的补充信息。所述补充信息可以是管理信息和/或关于某些网络设备NE的运行的信息,例如,其通常被存储在所述网络设备的管理信息库(MIB)中。
所述信息同样可以是涉及网络参数的测量,例如在某些连接上或由某些呼叫(业务分析)所使用的带宽,或者在某些连接上或某些呼叫中的分组丢失率,这尤其能使网络运营商监测和管理服务质量(QoS),所述服务质量与每个用户客户机或服务相关联,并且由服务级协议(SLA)来定义。
本发明涉及任何类型的诊断模型,而与相关的网络设备NE(无论是纯粹的元件(硬件)、纯粹的软件或其组合)无关。
所述诊断模块MD根据其使用的诊断模型被适应。因此,其被设计为例如执行参考诊断模型的情景和使用数据库、SNMP工具等,并且将构成诊断的结果向输出传送。
本发明的所述诊断设备DD还包括处理模块MT,其被耦合到所述网络管理系统MS,并且负责根据代表由所述网络管理系统MS提供的网络N的组成的数据,适应例如存储在所述存储器M2中的诊断模型。
为了适应所述诊断模型,如图1所示,所述处理模块MT例如包括相互耦合的分析模块MA和适应模块MC。
所述分析模块MA更特别负责分析来自所述网络管理系统MS的数据,以便确定必须要采取的动作,以适应存储在所述存储器M2中的诊断模型或所述模型之一,或者产生新的诊断模型。
根据包含在所接收的数据中和在所请求的任何补充数据中的信息,确定每个动作。
例如,所述管理系统MS以网络设备NE(硬件和/或软件)的修改通知的形式,将所述数据发送到所述处理模块MT。
所述传输可以被如下实现自动地、周期性地,或者每次当所述管理系统MS接收到代表所述网络N中的修改的信息时。可选地,可以设想配置所述分析模块MA,以观察所述管理系统MS中代表所述网络N中的修改的数据。同样可以设想配置所述分析模块MA,以请求所述管理系统MS由于先前的请求而将代表所述网络N中的修改的数据例如周期性地发送给该分析模块。
可以设想至少三种类型的动作。第一种类型涉及产生将被构造的新的诊断模型。第二种类型涉及修改现有诊断模型。第三种类型涉及重新配置现有诊断模型。
如果从所述管理系统MS接收的数据不足以确定将要采取的动作,则所述分析模块MA可以从所述管理系统MS请求补充信息(补充数据)。
所述分析模块MA还负责产生代表动作的指令,所述动作是该分析模块在接收数据之后所确定的,并且所述指令用于所述自适应模块MC。
指令限定了一个或多个将要采取的动作,并且包括代表由所述管理系统MS所报告的修改的信息。
例如,为了确定将要采取的每个动作,所述分析模块MA可以将其接收的数据与存储在所述处理模块MT的存储器M1中的参考(或基本)诊断模型相比较。所述存储器M1例如采用数据库的形式。
所述参考诊断模型可以是不同的类型。其可以特别采用规则和/或模型或贝叶斯网络(也称为原因图表)的形式。可以设想任何诊断模型产生技术,并且特别是密码本(CodeBook)技术、神经(neural)网络技术或佩特里(Petri)网络技术。
贝叶斯网络是一种因果关系树,其由关联于补充概率的分支组成并且包括指定将要实现的基本(或初级)测试的节点,并且从所述节点可以分出一个或多个子分支,所述子分支也关联于一个或多个概率并且具有指定将要实现的其它基本(或初级)测试的节点,并且从所述节点可以分出一个或多个子分支。
换句话说,贝叶斯网络是一种这样的情景其用于通过根据正被讨论的概率而执行不同的测试来找到特定问题的根本原因,以便发送回所述问题的原因,并且如果可以确定补充信息则应用该补充信息(例如分组丢失的数量),所述特定问题例如是在IP VPN中的分组丢失。
在贝叶斯网络上的附加信息及其在诊断设备中的使用可以在UCLPress.的1996年(2001年再版)的F.Jensen的“An introduction to BayesianNetworks”中找到。
每个参考诊断模型适于确定所清查的问题的至少一个原因。例如,参考诊断模型可以专用于诊断IP路由器中的分组丢失。
为了经由网络来验证服务配置的一致性,每个参考诊断模型可以包括用于有源或无源测量的测试和请求、用于配置验证的请求,或者读取这样的参数被存储在管理信息库(MIB)中或者在例如路由器的某些网络设备中可用并且专用于设备。
特别根据基于专业知识并且包括来自一个或多个源的数据(或信息)的知识基础,所述参考诊断模型可以通过任何方式来产生,例如所述设备的设计(规格、配置、认证等以及遇到的问题和/或缺点)、所述设备的制造(所使用的元件、所使用的技术等以及遇到的问题和/或缺点)、实验室设备测试(严重故障、可靠性、缺陷、兼容性、使用寿命等),以及在实际条件下的使用(尤其来自用户客户机的信息、维护服务和损坏报告、例如涉及可靠性与设备和元件的及时故障的统计信息、根据特定使用或特定制造的设备的最常见的故障、设备兼容性、使用寿命等等)。
在2002年3月的第三界网络国际会议(International Conference onNetworking)的Gerard Delegue等的论文“IP VPN Network DiagnosisTechnologies and Perspectives”中,描述了获得用于产生诊断测试的信息的详细例子,所述诊断测试涉及IP VPN内的服务质量(QoS)。
所述自适应模块MC负责适应现有诊断模型或根据接收自所述分析模块MA的指令创建新的诊断模型,所述指令代表一个或多个将要采取的动作(产生、修改或重新配置)。
每次接收到要求产生新诊断模型的、伴随着代表由所述管理系统MS所报告的修改的信息的指令时,所述自适应模块从所述存储器M1提取一个或多个参考诊断模型,所述诊断模型适合由所述伴随信息限定的网络N的构造。然后所述自适应模块例如通过合并所提取的参考诊断模型来产生新的诊断模型,这在适应(修改和/或重新配置)了所述参考诊断模型的至少一个之后是可应用的。然后所述自适应模块将所述新的诊断模型存储在所述存储器M2中,以使所述诊断模块MD可以在要求时使用该新的诊断模型。
而且,每次所述自适应模块MC接收到要求修改存储在所述存储器M2中的现有诊断模型的、伴随着代表由所述管理系统MS所报告的修改的信息的指令时,就从所述存储器M1提取所述现有诊断模型并且然后根据所报告的所述网络N中的修改来将其修改。所述修改可能需要从所述存储器M1提取一个或多个参考诊断模型,以便将其集成到或关联于所述现有诊断模型,这在适应(改变和/或配置)后是可应用的。所述自适应模块MC然后将所修改的诊断模型存储到所述存储器M2中。
例如,如果所述诊断模型采用一个或多个贝叶斯网络的形式,则修改该诊断模型可能在于给所述贝叶斯网络增加和/或从其消除一个或多个分支和/或子分支和/或一个或多个节点,每个节点关联于至少一个基本测试和所选择的概率。例如,如果所述网络N的修改涉及在网络设备NE中用多重处理器卡替代单个处理器卡,则用于测试CPU的分支将由多重分支替代。
图2B和2C示出了对采用图2A所示的贝叶斯网络形式的诊断模型进行连续修改的两个例子。
为了更加准确,在图2A所示的例子中,所述贝叶斯网络是这样的情景其用于确定在因特网协议虚拟专用网(IP VPN)的IP路由器中的分组丢失(“LossPacket”)的原因。
在所述贝叶斯网络中-“InterfaceInStatus”是对输入接口的状态建模的变量,-“HighCPUUtilization”是指出所述路由器的处理能力(或CPU容量)是否超载的变量,以及-“IPForwardMIB”是用于确定LSP是否已经被设置的测试变量。
LossPacket首先测试InterfaceInStatus(其通常是最可能的原因)。然后,如果InterfaceInStatus的状态是“OK”,则测试HighCPUUtilization(其通常是第二最可能的原因)。如果HighCPUUtilization的状态是“NOK”(即不OK),则LossPacket发送HighCPUUtilization NOK,如果能够确定,还要加上所述问题的原因(例如“路由器的容量超载”)和分组丢失的数量。如果HighCPUUtilization的状态是OK,则LossPacket测试IPForwardMIB。如果IPForwardMIB的状态是NOK,则LossPacket发送IPForwardMIB NOK,如果能够确定,还要加上所述问题的原因(例如“LSP还没有被设置”)和分组丢失的数量。
如果软件的新版本被装载到所述网络中,则补充节点必须被增加到图2A的贝叶斯网络。为了考虑所述网络的组成的修改,所述自适应模块MC将包括节点“QueueMib”的分支增加到图2A的贝叶斯网络,这产生了图2B中所示的被修改的贝叶斯网络。
“QueueMIB”是用于验证是否在输入接口和输出接口中定义了策略模型(“policy-map”)的变量。
如果新的接口被装载到所述网络中,则网络的一部分必须被增加到图2B的贝叶斯网络。为了考虑所述网络的组成的修改,所述自适应模块MC将在图2B的贝叶斯网络的InterfaceInStatus节点的级别,增加分别包括节点“InterfaceOperStatus”和节点“InterfaceAdminStatus”的两个分支,这产生了图2C所示的被修改的贝叶斯网络。
“InterfaceOperStatus”是所述管理信息库(MIB)的变量,其指出接口的当前可操作状态。
“InterfaceAdminStatus”是所述管理信息库(MIB)的另一个变量,其指出接口的所要求的状态。
如果利用基本顺序图表技术产生所述模型,则所述修改在于例如通过增加简单测试到现有顺序或从现有顺序消除该简单测试,来更新参考连续情景。
每次所述自适应模块MC接收到要求重新配置存储在所述存储器M2中的现有诊断模型的、伴随着代表由所述管理系统MS所报告的修改的信息的指令时,就从所述存储器M1提取所述现有诊断模型,并且然后根据所报告的所述网络N中的修改来将其配置。所述自适应模块MC然后将被重新配置的诊断模型存储在所述存储器M2中。
例如,如果所述诊断模型采用一个或多个贝叶斯网络的形式,则其重新配置可能在于更新一个或多个概率(或加权)。
如果所述诊断模型不是贝叶斯网络,则其重新配置可能例如在于修改一个或多个管理成本和/或一个或多个统计或概率权重。
本发明的所述诊断设备DD,特别是其处理模块MT和其诊断模块MD,可以以电子电路、软件(或数据处理)模块或电路和软件的组合的形式来实现。
本发明不限于上文仅通过例子的方式描述的诊断设备和网络或服务管理系统的实施例,而是包括本领域的技术人员可能预期的、在权利要求范围内的所有变形。
权利要求
1.一种用于通信网络的诊断设备,所述通信网络包括耦合到管理系统的网络设备,所述设备包括诊断装置和处理装置,所述诊断装置适于通过一个或多个诊断模型来确定发生在所述网络中的问题的原因,所述处理装置适于根据由所述管理系统提供的数据来适应所述诊断模型,所述管理系统代表所述网络的组成。
2.根据权利要求1的设备,其中,所述数据代表网络设备的修改,并且所述处理装置包括分析装置和适应装置,所述分析装置适于分析所接收的数据来确定将要采取的动作,以根据所述动作所代表的所述网络设备的一个或多个修改,来适应所述诊断模型并且产生代表所述动作的指令,所述适应装置适于根据接收自所述分析装置的一个或多个指令来适应诊断模型。
3.根据权利要求2的设备,其中,所述处理装置包括第一存储器,该第一存储器被耦合到所述分析装置并且适于存储一个或多个参考诊断模型,并且所述分析装置适于通过将所接收的数据与存储在所述第一存储器中的一个或多个参考诊断模型相比较,来确定将要采取的每个适应动作。
4.根据权利要求2的设备,其中,所述分析装置适于确定从组中所选择的适应动作,所述组包括代表将被构造的新模块的动作、代表将要对现有诊断模型进行修改的动作,以及代表现有诊断模型的重新配置的动作。
5.根据权利要求1的设备,还包括第二存储器,该第二存储器被耦合到所述处理装置和所述诊断装置,并且适于存储由所述处理装置发送的每个诊断模型。
6.根据权利要求4并结合权利要求5的设备,其中,当接收到由于特定的网络设备的修改而要求产生新的诊断模型的指令时,所述自适应装置适于从所述第一存储器提取参考诊断模型,以便产生新的诊断模型并且然后将其存储到所述第二存储器中,所述参考诊断模型适合根据所述特定修改的所述网络的组成。
7.根据权利要求4并结合权利要求5的设备,其中,当接收到由于特定的网络设备的修改而要求修改存储在所述第二存储器中的现有诊断模型的指令时,所述自适应装置适于从所述第二存储器提取所述现有诊断模型,以便根据所述特定修改来将其修改,并且然后将修改后的现有诊断模型存储到所述第二存储器中。
8.根据权利要求4并结合权利要求5的设备,其中,当接收到由于特定的网络设备的修改而要求重新配置存储在所述第二存储器中的现有诊断模型的指令时,所述自适应装置适于从所述第二存储器提取所述现有诊断模型,以便根据所述特定修改来将其重新配置,并且然后将重新配置后的现有诊断模型存储到所述第二存储器中。
9.根据权利要求5的设备,其中,当接收到针对被选择的诊断的请求时,所述诊断装置适于从所述第二存储器提取所述被选择的诊断并且然后执行所提取的诊断模型,以便在输出发送诊断。
10.根据权利要求1的设备,其中,所述数据由所述管理系统以通知的形式来发送。
11.根据权利要求3的设备,其中,至少一些所述参考诊断模型采取一个或多个贝叶斯网络的形式。
12.根据权利要求1的设备,其中,至少一些所述诊断模型采取一个或多个贝叶斯网络的形式。
13.一种用于被管理的通信网络的管理系统,所述系统包括一个或多个根据在先权利要求的任何一个的诊断设备。
14.根据权利要求13的管理系统,构成了网络管理系统。
15.根据权利要求13的管理系统,构成了服务管理系统。
全文摘要
一种包括耦合到管理系统的网络设备的通信网络。用于所述网络的诊断设备通过一个或多个诊断模型来确定发生在所述网络中的问题的原因,并且根据由所述管理系统提供的数据来适应所述诊断模型,所述管理系统代表所述网络的组成。
文档编号H04L12/24GK1747403SQ20051008264
公开日2006年3月15日 申请日期2005年7月6日 优先权日2004年9月8日
发明者M·A·赛义迪, O·马蒂诺, E·马里利, S·斯奎丁 申请人:阿尔卡特公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1