专利名称::一种实现通讯产品故障检测和定位的方法及系统的制作方法
技术领域:
:本发明涉及通讯领域,尤其涉及一种实现通讯产品故障检测和定位的方法及系统。
背景技术:
:在大型通讯产品的在线运行中,通讯产品的实时故障检测和故障定位是人们普遍关注的问题。当通讯产品在线运行出现故障后,如何快速、准确检测并定位故障是首先要解决的问题。高效的故障检测和隔离技术是产品质量的有效保证。现有技术中对通讯产品进行故障检测和故障定位通常采用手动方式进行,其缺点如下采用手动方式对通讯产品进行故障检测和故障定位需要的硬件资源较多。对于在线运行的通讯产品来说,直接在工程现场进行手工故障检测和故障定位有可能会影响到通讯业务,潜藏着巨大风险,甚至导致故障没有排除,反而引发更严重的问题,这是令人难以接受的。但是如果不在工程现场,而是通过在实验室进行环境的模拟再现故障现场,则需要的资源较多,故障重现困难,耗时长。因为工程现场组网环境复杂,影响因素非常多,要重现故障比较困难,有时需要几十天才能重现故障,有时甚至用实验室的环境根本就重现不了故障。或者即时重现了故障,由于某些通讯产品的结构比较复杂,相互有关联的模块较多,同一种类型的故障可能会由多种原因造成,故障原因排除的工作量较大,耗时也比较长。综上所述,采用人工方法对通讯产品进行故障检测和故障定位不仅耗资大而且耗时长,严重影响通讯产品的快速更新,甚至导致客户满意度下降。因此,如何用很少的资源对通讯产品进行快速的故障检测和故障定位已成为一个现实的问题。
发明内容本发明提供一种实现通讯产品故障检测和定位的方法及系统,用以解决现有技术中采用手动方式对通讯产品进行故障检测和故障定位时效率低下的问题。本发明所述技术方案如下—种实现通讯产品故障检测和定位的方法,包括步骤A、在被测通讯产品的功能单元框图中确定监控点可被设置的位置,并建立相关性矩阵,该矩阵对存在相关性的监控点与被测通讯产品的功能单元之间的相交点予以标识;B、从所述相关性矩阵中删除相同的行和列,得到简化的相关性矩阵,从中确定出故障检测用监控点和故障定位用监控点,通过在简化的相关性矩阵中去除未选用的监控点对应的列描绘出故障字典矩阵;C、在被测通讯产品中设置故障检测用监控点和故障定位用监控点,获取相应的监控信息,若监控信息显示有故障发生,则将该监控信息在所述故障字典矩阵中进行匹配,得出故障检测及定位结果。进一步地,所述相关性矩阵中,行表示被测通讯产品的各功能单元的故障在监控点上的反应信息,列表示各监控点可监控到的功能单元。进一步地,在所述相关性矩阵中,当功能单元发生故障时,能够检测到该故障的监控点与该功能单元的相交点的数值为l,否则为0。进一步地,从所述简化的相关性矩阵中确定出故障检测用监控点的过程如下Bl、计算所述简化的相关性矩阵中各监控点的故障权值,将各监控点对应列的1和0相加既为各监控点的故障权值;B2、选择故障权值最大的监控点为故障检测用监控点,用该监控点对应的列将所述简化的相关性矩阵分为两个子矩阵,一个子矩阵是由该列中"O"元素所对应的行构成的子矩阵,另一个子矩阵是由该列中"1"元素所对应的行构成的子矩阵;B3、若所述"0"元素所对应的行构成的子矩阵是不等于0,则计算该子矩阵的故障权值,返回步骤B2,直到选用的故障检测用监控点对应的列矩阵中不再有为"0"的元素为止。进一步地,从所述简化的相关性矩阵中确定出故障定位用监控点的过程如下bl、从所述简化的相关性矩阵中去除仅利用故障检测用监控点即可定位故障的功能单元所在的行,计算剩余的相关性矩阵中各监控点的故障隔离权值,将各监控点对应列中"1"的个数和"0"的个数相乘既为各监控点的故障隔离权值;b2、选择故障隔离权值最大的监控点为故障隔离用监控点,用该监控点对应的列将相关性矩阵分为两个子矩阵,一个子矩阵是由该列中"O"元素所对应的行构成的子矩阵,另一个子矩阵是由该列中"l"元素所对应的行构成的子矩阵;b3、若所述"0"元素和"1"元素所对应的行构成的子矩阵不是单行,则计算这两个子矩阵的故障隔离权值,根据步骤b2循环操作,直到"0"元素和"1"元素所对应的行构成的子矩阵为单行为止。进一步地,所述步骤C中还包括将获取到的监控信息保存到后台数据库或产品运行日志中的步骤,以及将故障检测及定位结果予以显示的步骤。—种实现通讯产品故障检测和定位的系统,包括简化相关性矩阵确定模块,监控点确定模块、故障字典描绘模块、监控模块及故障处理模块,其中,简化相关性矩阵确定模块,用于在被测通讯产品的功能单元框图中确定监控点可被设置的位置,并建立相关性矩阵,用于对存在相关性的监控点与被测通讯产品的功能单元之间的相交点予以标识,从该相关性矩阵中删除相同的行和列,得到简化的相关性矩阵;监控点确定模块,用于从所述简化的相关性矩阵中确定出故障检测用监控点和故障定位用监控点;故障字典描绘模块,用于在所述简化的相关性矩阵中去除未被确定为故障检测用监控点或故障定位用监控点的监控点对应的列;监控模块,用于在被测通讯产品中设置故障检测用监控点和故障定位用监控点,获取相应的监控信息;故障处理模块,用于将所述监控信息在所述故障字典矩阵中进行匹配,得出故障检测及定位结果。进一步地,所述故障处理模块中具体包括故障检测子模块和故障定位子模块,其中,故障检测子模块,用于根据故障检测用监控点的监控信息确定出故障检测结果;故障定位子模块,用于获取故障定位用监控点的监控信息,将该监控信息在所述故障字典矩阵中进行匹配,得出故障定位结果。进一步地,所述系统还包括故障信息显示模块,用于将故障检测结果和故障定位结果予以实时显示。本发明描述了一种实现通讯产品故障检测和定位的方法及系统,通过内嵌监控点的相关性矩阵进行分析选择出故障检测用的监控点和故障定位用监控点,描绘出故障字典矩阵,然后根据故障字典矩阵自动进行故障检测和故障定位,克服了现有技术中采用手工方法进行事后故障检测和故障定位时需要的资源多、工作量大、耗时长、不准确的缺点,具有故障检测和故障定位准确、及时,可以在线进行的优点。图1为本发明中实现通讯产品故障检测和定位的方法的流程图;图2为本发明所述实现通讯产品故障检测和定位的系统的结构框图;图3为本发明所述实施例中被测通讯产品的结构框图;图4为本发明所述实施例中为图3所示通讯产品进行故障检测及定位的方法的流程图;图5为本发明所述实施例中为图3所示通讯产品进行故障检测及定位的系统的结构框图。具体实施例方式本发明描述了一种实现通讯产品故障检测和定位的方法及系统,通过内嵌监控点的相关性矩阵进行分析选择出故障检测用的监控点和故障定位用监控点,描绘出故障字典矩阵,然后根据故障字典矩阵自动进行故障检测和故障定位。下面将结合各个附图对本发明的具体实现予以说明。请参阅图l,该图为本发明中实现通讯产品故障检测和定位的方法的流程图,其主要包括步骤步骤10、在被测通讯产品的功能单元框图中确定监控点可被设置的位置,并建立相关性矩阵,该矩阵的行表示被测通讯产品的各功能单元的故障在监控点上的反应信息,该矩阵的列表示各监控点可监控到的功能单元。本步骤中建立的相关性矩阵对存在相关性的监控点与被测通讯产品的功能单元之间的相交点进行了标识,当功能单元发生故障时,能够检测到该故障的监控点与该功能单元的相交点的数值为l,否则为0。步骤11、从步骤10中建立的相关性矩阵中删除相同的行和列,得到简化的相关性矩阵,从中确定出故障检测用监控点。本步骤中,从简化的相关性矩阵中确定出故障检测用监控点的过程如下1)计算所述简化的相关性矩阵中各监控点的故障权值,将各监控点对应列的1和0相加既为各监控点的故障权值;2)选择故障权值最大的监控点为故障检测用监控点,用该监控点对应的列将所述简化的相关性矩阵分为两个子矩阵,一个子矩阵是由该列中"O"元素所对应的行构成的子矩阵,另一个子矩阵是由该列中"l"元素所对应的行构成的子矩阵;3)若所述"O"元素所对应的行构成的子矩阵是不等于O,则计算该子矩阵的故障权值,返回步骤2),直到选用的故障检测用监控点对应的列矩阵中不再有为"0"的元素为止。步骤12、从所述简化的相关性矩阵中去除仅利用故障检测用监控点即可定位故障的功能单元所在的行,从剩余的相关性矩阵中确定出故障定位用监控点。本步骤中从所述剩余的相关性矩阵中确定出故障定位用监控点的过程如下1)计算剩余的相关性矩阵中各监控点的故障隔离权值,将各监控点对应列中"l"的个数和"O"的个数相乘既为各监控点的故障隔离权值;2)选择故障隔离权值最大的监控点为故障隔离用监控点,用该监控点对应的列将相关性矩阵分为两个子矩阵,一个子矩阵是由该列中"O"元素所对应的行构成的子矩阵,另一个子矩阵是由该列中"l"元素所对应的行构成的子矩阵;3)若所述"0"元素和"1"元素所对应的行构成的子矩阵不是单行,则计算这两个子矩阵的故障隔离权值,根据步骤2)循环操作,直到"0"元素和"1"元素所对应的行构成的子矩阵为单行为止。步骤13、在所述简化的相关性矩阵中去除未被确定为故障检测用监控点或故障定位用监控点的监控点对应的列,剩余的矩阵即为故障字典矩阵。步骤14、在被测通讯产品中设置故障检测用监控点和故障定位用监控点。步骤15、获取故障检测用监控点和故障定位用监控点的监控信息,将其保存到后台数据库或产品运行日志中。步骤16、若获取到的监控信息显示有故障发生,则将该监控信息在所述故障字典矩阵中进行匹配,得出故障检测及定位结果。步骤17、对故障检测及定位结果予以显示。相应于本发明上述方法,本发明进而提供了一种实现通讯产品故障检测和定位的系统,请参阅图2,该图为本发明所述实现通讯产品故障检测和定位的系统的结构框图,其主要包括简化相关性矩阵确定模块,监控点确定模块、故障字典描绘模块、监控模块、故障处理模块及故障信息显示模块,其中,简化相关性矩阵确定模块,用于在被测通讯产品的功能单元框图中确定监控点可被设置的位置,并建立相关性矩阵,用于对存在相关性的监控点与被测通讯产品的功能单元之间的相交点予以标识,从该相关性矩阵中删除相同的行和列,得到简化的相关性矩阵。监控点确定模块,用于从所述简化的相关性矩阵中确定出故障检测用监控点和故障定位用监控点;确定故障检测用监控点和故障定位用监控点的具体过程请参阅上述方法中相应内容的描述,这里不再给予过多赘述。故障字典描绘模块,用于在所述简化的相关性矩阵中去除未被确定为故障检测用监控点或故障定位用监控点的监控点对应的列。监控模块,用于在被测通讯产品中设置故障检测用监控点和故障定位用监控点,获取相应的的监控信息。故障处理模块,用于将所述监控信息在所述故障字典矩阵中进行匹配,得出故障检测及定位结果。故障信息显示模块,用于将故障检测结果和故障定位结果予以实时显示。上述模块中,所述故障处理模块中具体包括故障检测子模块和故障定位子模块,其中,故障检测子模块,用于根据故障检测用监控点的监控信息确定出故障检测结果;故障定位子模块,用于获取故障定位用监控点的监控信息,将该监控信息在所述故障字典矩阵中进行匹配,得出故障定位结果。下面通过一具体实施例对本发明予以进一步详细的说明。请参阅图3,该图为本发明所述实施例中被测通讯产品的结构框图,由图中可见,该被测系统由7个功能单元组成,分别为F1、F2、F4、F5、F6、F7和F8。下面分别对为图3所示通讯产品的进行故障检测及定位的方法及系统的具体实现予以说明。请参阅图4,该图为本发明所述实施例中为图3所示通讯产品进行故障检测及定位的方法的流程图,其主要包括步骤步骤101,分析被测通讯产品的功能单元框图。根据各功能单元之间的连接关系和信号传输方向确定监控点可被设置的位置。步骤102,建立相关性矩阵。通过对系统框图直接分析可以得出相关性矩阵,如果监控点与功能单元部件存在逻辑关系,就说明两者相关,如果功能单元Fi发生故障,监控点Tj运行不正常的,则矩阵中监控点Tj和功能单元Fi相交点对应的数值为l,否则数值为o。分析完所有的监控点和功能单元的相关性,将结果列在一个二维表格中形成相关性矩阵,如下表所示。<table>tableseeoriginaldocumentpage8</column></row><table>步骤103,简化相关性矩阵。合并相关性矩阵中相同的行F5和F6,合并相同的列T2和T3及T5和T6,就得到简化后的相关性矩阵。监控点T3和T6是多余的,可以去掉;F5和F6在一个反馈回路内是一个模糊组,在此条件下不能区分F5和F6的故障,下表所示为简化后的相关性矩阵。<table>tableseeoriginaldocumentpage9</column></row><table>步骤104,从图6所示简化后的相关性矩阵中确定故障检测用监控点。首先选用故障权值最大的监控点T8(故障权值T8为6,T7为4,T5为3,T4为3,T2为2,Tl为1)为第一个监控点,分割矩阵后,0元素对应的子矩阵只有F7—行,再选择T7就可自检到所有的组成单元了。进行故障检测时,首先分析T8,可以判断除F7以外的部分无故障;再分析T7,可判断F7是否有故障。如果两点运行结果都正常,就表明系统无故障。步骤105,从图6所示简化的相关性矩阵中去除仅利用故障检测用监控点即可定位故障的功能单元F7所在的行,从中确定出故障定位用监控点。在单故障假设的前提下,如果分析T8发现有故障,则F7无故障,故障必在Fl、F2、F4、F5或F8中,选择隔离用监控点时,首先选用故障隔离权值最大的监控点T7(故障隔离权值T7为6,T5为6,T4为6,T3为6,Tl为4)作为第一个故障定位用监控点,将矩阵分为"0"元素对应的子矩阵和"1"元素对应的子矩阵。再重新计算两个子矩阵的故障隔离权值,故障隔离权值最大的监控点为T5,以此类推,再选择T1就可将矩阵分为单行了。所以T7、T5、T1为选用的故障定位用监控点。步骤106,描绘出故障字典矩阵。在简化的相关性矩阵上,去掉未选用的监控点(T2和T4)所对应的列,生成被测通讯产品的故障字典矩阵,如下表所示。<table>tableseeoriginaldocumentpage9</column></row><table><table>tableseeoriginaldocumentpage10</column></row><table>步骤107,系统无故障时对应故障字典矩阵的各个测试点全是"0";如果系统有故障时,分别采集故障检测用监控点和故障定位用监控点(Tl、T5、T7、T8)监控点的信息,根据故障字典矩阵就可查出是哪个功能单元发生了故障,将故障检测及定位结果予以显示。请参阅图5,该图为本发明所述实施例中为图3所示通讯产品进行故障检测及定位的系统的结构框图,其主要包括简化相关性矩阵确定模块,监控点确定模块、故障字典描绘模块、监控模块及故障处理模块,其中,简化相关性矩阵确定模块,用于按照上述步骤101至步骤103确定出相关性矩阵。监控点确定模块,用于按照上述步骤104及步骤105确定出故障检测用监控点和故障定位用监控点。故障字典描绘模块,用于按照上述步骤106描绘出故障字典矩阵。监控模块,用于在被测通讯产品中设置故障检测用监控点和故障定位用监控点,获取相应的的监控信息,包括第一监控子模块、第二监控子模块、第三监控子模块和第四监控子模块,其中第一监控子模块用于获取监控点Tl的监控信息,第二监控子模块用于获取监控点T5的监控信息,第三监控子模块用于获取监控点T8的监控信息,第四监控子模块用于获取监控点T7的监控信息。故障处理模块,用于将所述监控信息在故障字典描绘模块中的故障字典矩阵中进行匹配,得出故障检测及定位结果。故障信息显示模块,用于将故障检测结果和故障定位结果予以实时显示。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。权利要求一种实现通讯产品故障检测和定位的方法,其特征在于,包括步骤A、在被测通讯产品的功能单元框图中确定监控点可被设置的位置,并建立相关性矩阵,该矩阵对存在相关性的监控点与被测通讯产品的功能单元之间的相交点予以标识;B、从所述相关性矩阵中删除相同的行和列,得到简化的相关性矩阵,从中确定出故障检测用监控点和故障定位用监控点,通过在简化的相关性矩阵中去除未选用的监控点对应的列描绘出故障字典矩阵;C、在被测通讯产品中设置故障检测用监控点和故障定位用监控点,获取相应的监控信息,若监控信息显示有故障发生,则将该监控信息在所述故障字典矩阵中进行匹配,得出故障检测及定位结果。2.如权利要求1所述的方法,其特征在于,所述相关性矩阵中,行表示被测通讯产品的各功能单元的故障在监控点上的反应信息,列表示各监控点可监控到的功能单元。3.如权利要求1所述的方法,其特征在于,在所述相关性矩阵中,当功能单元发生故障时,能够检测到该故障的监控点与该功能单元的相交点的数值为l,否则为0。4.如权利要求3所述的方法,其特征在于,从所述简化的相关性矩阵中确定出故障检测用监控点的过程如下Bl、计算所述简化的相关性矩阵中各监控点的故障权值,将各监控点对应列的1和0相加既为各监控点的故障权值;B2、选择故障权值最大的监控点为故障检测用监控点,用该监控点对应的列将所述简化的相关性矩阵分为两个子矩阵,一个子矩阵是由该列中"O"元素所对应的行构成的子矩阵,另一个子矩阵是由该列中"1"元素所对应的行构成的子矩阵;B3、若所述"0"元素所对应的行构成的子矩阵是不等于0,则计算该子矩阵的故障权值,返回步骤B2,直到选用的故障检测用监控点对应的列矩阵中不再有为"0"的元素为止。5.如权利要求3所述的方法,其特征在于,从所述简化的相关性矩阵中确定出故障定位用监控点的过程如下bl、从所述简化的相关性矩阵中去除仅利用故障检测用监控点即可定位故障的功能单元所在的行,计算剩余的相关性矩阵中各监控点的故障隔离权值,将各监控点对应列中"l"的个数和"0"的个数相乘既为各监控点的故障隔离权值;b2、选择故障隔离权值最大的监控点为故障隔离用监控点,用该监控点对应的列将相关性矩阵分为两个子矩阵,一个子矩阵是由该列中"O"元素所对应的行构成的子矩阵,另一个子矩阵是由该列中"l"元素所对应的行构成的子矩阵;b3、若所述"0"元素和"1"元素所对应的行构成的子矩阵不是单行,则计算这两个子矩阵的故障隔离权值,根据步骤b2循环操作,直到"0"元素和"l"元素所对应的行构成的子矩阵为单行为止。6.如权利要求1所述的方法,其特征在于,所述步骤C中还包括将获取到的监控信息保存到后台数据库或产品运行日志中的步骤,以及将故障检测及定位结果予以显示的步骤。7.—种实现通讯产品故障检测和定位的系统,其特征在于,包括简化相关性矩阵确定模块,监控点确定模块、故障字典描绘模块、监控模块及故障处理模块,其中,简化相关性矩阵确定模块,用于在被测通讯产品的功能单元框图中确定监控点可被设置的位置,并建立相关性矩阵,用于对存在相关性的监控点与被测通讯产品的功能单元之间的相交点予以标识,从该相关性矩阵中删除相同的行和列,得到简化的相关性矩阵;监控点确定模块,用于从所述简化的相关性矩阵中确定出故障检测用监控点和故障定位用监控点;故障字典描绘模块,用于在所述简化的相关性矩阵中去除未被确定为故障检测用监控点或故障定位用监控点的监控点对应的列;监控模块,用于在被测通讯产品中设置故障检测用监控点和故障定位用监控点,获取相应的监控信息;故障处理模块,用于将所述监控信息在所述故障字典矩阵中进行匹配,得出故障检测及定位结果。8.如权利要求7所述的系统,其特征在于,所述故障处理模块中具体包括故障检测子模块和故障定位子模块,其中,故障检测子模块,用于根据故障检测用监控点的监控信息确定出故障检测结果;故障定位子模块,用于获取故障定位用监控点的监控信息,将该监控信息在所述故障字典矩阵中进行匹配,得出故障定位结果。9.如权利要求7所述的系统,其特征在于,所述系统还包括故障信息显示模块,用于将故障检测结果和故障定位结果予以实时显示。全文摘要本发明公开了一种实现通讯产品故障检测和定位的方法及系统,通过内嵌监控点的相关性矩阵进行分析选择出故障检测用的监控点和故障定位用监控点,描绘出故障字典矩阵,然后根据故障字典矩阵自动进行故障检测和故障定位,克服了现有技术中采用手工方法进行事后故障检测和故障定位时需要的资源多、工作量大、耗时长、不准确的缺点,具有故障检测和故障定位准确、及时,可以在线进行的优点。文档编号H04L12/26GK101714928SQ20081016715公开日2010年5月26日申请日期2008年10月7日优先权日2008年10月7日发明者何剑锋,王志鹏,程兵旺,魏雪晔申请人:中兴通讯股份有限公司