本发明提出一种基于多层耦合关系网络的关键基础设施脆弱性测评方法,属于系统可靠性技术领域。
背景技术:
在现代社会中,关键基础设施是包括通讯、电力、能源、交通运输等在内的关系到经济社会正常运转的最重要的基础设施系统。探测关键基础设施系统的安全隐患、评估关键基础设施的脆弱性、帮助避免大规模安全事故的发生,都是当代国家安全与社会运行中的重大课题。
在信息技术高速发展的今天,由于很多系统内部,以及不同系统之间,都涌现出越来越多的相互依赖、相互耦合的关系,使许多关键基础设施具有越来越强的系统脆弱性。例如,当城市中的电力系统由于一些极端自然灾难或者人为因素而中止工作后,其它如互联网、交通运输等依赖于电力供应的关键系统也会发生停运故障。这样的故障耦合关系的存在使得故障事件可以跨系统地施加影响,造成更大规模的破坏。基于这些考虑,计算不同系统节点之间的故障相关关系成为了衡量系统节点间故障耦合关系强弱、帮助评价系统脆弱性的可行的方法。此外,考虑到系统节点之间存在的故障耦合关系自身也具有一定的多层网络结构,很有必要从系统节点故障时间序列出发构建多层的耦合关系网络,并使用复杂网络领域的节点重要性评价方法,从网络结构的角度衡量系统节点间的故障耦合关系,乃至整个系统的脆弱性。
复杂网络是近二十年来迅速发展的交叉学科领域,主要研究网络的结构性质与其功能属性之间的关系。由于很多现实系统中都包含着不同类型的网络结构,这些网络的结构如何影响系统的运行是具有重大现实意义的问题。在复杂网络领域,人们基于一些模型网络与现实系统的网络结构研究渗流相变、级联故障、同步动力学、疾病传播等方面的功能特性,还能为改进现实系统的网络结构提供建议。实际上,除了研究系统节点已知的网络结构,人们也开始从系统节点时间序列出发发掘系统中未知的节点间的关联,并分析其网络结构。相关性网络就是其中常用的方法之一,主要以节点时间序列的相关系数作为定义节点之间连边的方式。近年来,相关性网络分析已经广泛应用于基因、金融、大脑、气候等不同现实系统,用于探测系统内部的组织结构。
本发明考虑将基于相关性网络的方法应用于系统可靠性与脆弱性的评价上。具体来说,本发明考虑由不同关键基础设施系统的节点故障历史数据出发,构建多层故障耦合关系(相关关系)网络,并定义具有时间延迟及其方向的连边。基于所构建的相关性网络,本方法重点使用节点在子网络内部与跨子网络的度等结构指标作为衡量节点的耦合关系数量与强度的主要指标,以此评价单个节点以及整个系统的脆弱性。
与传统的系统脆弱性分析方法相比,基于故障相关性网络探测的脆弱性评价方法具有以下两方面优势。一方面,本方法的主要目的在于发现与度量现实系统节点间客观存在的故障耦合关系,而并非关注于故障事件发生的概率等其它方面。这样的耦合关系恰恰是使现代社会关键基础设施系统出现越来越多的大规模安全问题的主要原因之一。而且,基于0-1故障时间序列的建网方式使本方法可以广泛应用于很多不同领域基础设施的脆弱性评估。另一方面,本方法是基于复杂网络领域的一些节点重要程度的评价指标,从而在将来可以有进一步发展的广阔空间。例如,如果在将来复杂网络领域(包括单层网络和多层网络)发现了新的更好的节点关键程度的评价方法,就同样可以应用在本方法中构建的节点故障相关性网络上,为更好地理解基础设施的系统脆弱性服务。
在上述背景的基础上,提出以下基于多层故障耦合关系网络的关键基础设施脆弱性测评方法。
技术实现要素:
针对关键基础设施系统内部,以及不同系统之间的节点耦合关系普遍存在的特点,本发明提出了一种基于多层耦合关系网络推断的关键基础设施系统脆弱性评价方式。
(一)本发明的目的
本发明的主要目的包括:基于不同基础设施系统节点的故障历史数据计算系统节点间的故障相关性,并根据相关性强度为同一系统内部以及不同系统之间的节点对连边,构建成有向的多层节点故障相关性网络;然后,使用节点的度(包括出度、入度、层内的度、层间的度等)等复杂网络中常用的节点中心性指标来评价单个节点以及整个系统的耦合关系数量和强度,从而评价现实基础设施系统的脆弱性,并为现实系统保护故障事件传播中的重要节点提供有效的建议。
(二)本发明的技术方案
本发明提出的基于多层耦合关系网络的关键基础设施脆弱性测评方法,该方法包含以下步骤:
步骤一:获取系统节点信息与历史故障数据,确定合适的节点数量、空间分布、时间范围与时间间隔,从而获得每个节点的故障时间序列;根据实际系统耦合关系探测的需要,对节点时间序列进行预处理;
步骤二:选择合适的故障相关关系计算方式,如皮尔逊相关系数、互信息等,以考虑节点间关联的时间延迟的方式定义每对节点之间的边权、方向、时间延迟等;通过给故障相关性取一定的阈值,只保留那些足够强的边。分别为每个系统及子系统内部的和不同系统及子系统之间的节点连边后,形成加权有向的多层耦合关系网络;
步骤三:针对步骤二中构建的多层耦合关系网络,使用节点的度(连边数量)等网络结构指标,及其在整个网络上的均值等,作为单个节点乃至整个系统的故障耦合关系强弱的评价指标。可根据需要观察评价指标随时间或空间的变化趋势;
通过以上步骤,本发明提出从多层耦合关系网络的角度对关键基础设施脆弱性的测评方法,能够有效的发现与度量现实系统节点间客观存在的故障耦合关系。这样的耦合关系恰恰是使现代社会关键基础设施系统出现越来越多的大规模安全问题的主要原因之一。本方法是基于复杂网络领域的一些节点重要程度的评价指标,对于将来发展节点关键程度的评价方法亦有启发性作用,从而为更好地理解基础设施的系统脆弱性服务。
其中,在步骤一中所述的“获取系统节点信息与历史故障数据,确定合适的节点数量、空间分布、时间范围与时间间隔,从而获得每个节点的故障时间序列;根据实际系统耦合关系探测的需要,对节点时间序列进行预处理”,其具体作法如下:
确定合适的节点数量和空间分布:用于构建故障耦合关系网络的系统节点通常是所有能获得故障历史数据的系统节点的一个子集。该子集的规模往往要取得适中。太大的节点集会导致计算复杂度过高,太小的节点集则又无法代表要研究的系统的整体。实际上,除了节点数量,节点时间序列的长度和节点相关性的计算方法的选取也会影响计算的复杂度,所以往往要在这三方面之间寻找适当的平衡。对一些具有空间地理位置的系统,往往还根据需要选取一定空间区域内的节点。
确定合适的时间范围与时间间隔:节点时间序列的时间范围与时间间隔的选择主要取决于要研究的节点故障相关关系的大致时间尺度。使用过于稀疏的时间序列可能无法捕捉到更快尺度的相关关系,而过密的时间点则可能导致时间序列中出现较强的自相关,从而影响正常的相关关系计算结果。此外,过长或过短的时间序列也会给计算效率和统计分析带来影响。在实际选取时,需要从这些方面综合考虑,选择可行的节点时间序列的时间点。
对节点时间序列进行预处理:对于已得到的节点时间序列,很多情况下,在计算相关性之前还需要进行一定的预处理。在本发明中,一般要求使用0-1序列来作为节点历史故障的描述方式。当节点在某时刻出现了该故障事件时,就用1值表示;否则,就用0值表示。如果本身是连续取值的节点序列,可以去一定的阈值将其转化为0-1时间序列。还有些情况下,为了消除某些趋势(如线性趋势,或者季节性周期)对相关性计算的影响,需要先从每个节点的时间序列中去掉这些趋势,然后再转化为0-1序列。
其中,在步骤二中所述的“选择合适的故障相关关系计算方式,如皮尔逊相关系数、互信息等,以考虑节点间关联的时间延迟的方式定义每对节点之间的边权、方向、时间延迟等;通过给故障相关性取一定的阈值,只保留那些足够强的边。分别为每个系统及子系统内部的和不同系统及子系统之间的节点连边后,形成加权有向的多层耦合关系网络”,其具体作法如下:
选取合适的相关关系计算方法:计算节点故障相关性时可以选用的常用方法主要包括皮尔逊相关系数、互相关、互信息、事件同步性系数(eventsynchronization)等。由于关键基础设施系统节点之间的故障耦合关系一般来说具有一定的方向性和时间间隔,因此,在本发明中,主要使用考虑时间延迟的互相关系数方法计算故障相关性:对两个节点i,j的故障时间序列si(t)和sj(t),t=1,2,…,l,计算其互相关系数:
其中e(·)与sd(·)分别表示序列在t=1,2,…,l范围内的均值和标准差。τ的取值范围为τ=-τmax,…,0,…,τmax。进而取ρi,j(τ)在该范围内的最大值,定义为边权wi,j,并定义该最大值所对应的τ值为两点间的时间延迟τi,j。因此,τi,j的绝对值即为两点间的关联的时间间隔,而其符号则决定了两点间的连边方向:τi,j>0时为从点i到j;τi,j<0时为从j到i;τi,j=0时为双向连边。将这样的方法用在不同的关键基础设施系统内部,以及跨不同系统之间的每一对节点上,就可以为所有节点对定义这样的边权和时间延迟,得到一个加权的、有向的、多层耦合的故障相关关系网络。
为边权选取阈值:在计算出每一对节点之间的故障相关性的边权wi,j和时间延迟τi,j之后,可以根据需要为边权wi,j确定一定的阈值wmin,从而在网络中只保留比阈值更强的故障相关关系。这样做的目的,首先是为了使网络中不包含那些统计上不显著的较弱的相关关系。此外,在不同的现实基础设施系统中,也可能不仅要求显著的相关关系,而且还要求相关关系本身要强到一定程度以上,才真正视为两点之间有关联。因此,可以从这两个角度出发为计算出的节点故障相关性取适当的阈值。在计算相关关系的显著性时,通常采用一定的随机打乱时间序列之后再算相关性的方式计算出真实的相关关系的p-值。例如当p-值小于0.05时,就可以认为是显著的相关关系。可以用p-值等于0.05所对应的相关性的值(随机打乱后的相关关系分布的95%分位数)作为选取阈值的下限。总之,需要综合考虑选取恰当的阈值wmin,使得保留的连边都具有显著的、较强的相关关系,而剩余的节点和连边的数量也还没有过小。给定阈值后,可以只为那些故障相关关系超过阈值的节点对连边。这样就构建出本方法所需的加权有向的多层节点故障相关关系网络。
其中,在步骤三中所述的“针对步骤二中构建的多层耦合关系网络,使用节点的度(连边数量)等网络结构指标,及其在整个网络上的均值等,作为单个节点乃至整个系统的故障耦合关系强弱的评价指标。可根据需要观察评价指标随时间或空间的变化趋势”,其具体包括以下内容:
节点的度等网络结构指标的使用:在使用步骤二中的方法构建了多层耦合的系统节点故障相关关系网络之后,首先可以使用一些基本的网络结构性质作为系统故障相关程度的评价指标。例如,节点的度,即每个节点的连边数量,是最常用的衡量节点中心性的方法。在加权网络中,节点的强度(所有连边的边权之和)也是常用的衡量指标。在本发明中,我们主要选择使用节点的度而非强度作为衡量指标。这主要是考虑到我们构建网络时,已经去掉了那些边权不够大(小于上述阈值wmin)的连边;而且计算边权所用的互相关系数的峰值也包含一些其它扰动因素,并不一定边权越大总意味着更强的节点故障耦合关系。在现实的关键基础设施系统的故障相关性网络中,节点的度描述了该节点在整个系统中与多少其它节点有较强的故障相关关系。可以想象,对一个度值较大的节点,当其它节点出现故障时,自己也容易受到影响。因此,节点的度可以作为评价每个节点的脆弱性的一个重要方面的衡量指标。而在本发明所构建的有向的故障相关性网络中,可以分别计算节点的出度和入度。出度或入度越大,该节点的故障可能越倾向于影响到其它节点,或者是被其它节点的故障影响。除了每个节点的(出、入)度值,还可以用所有节点的平均(出、入)度作为整个系统的节点耦合关系的评价指标。在本方法中,基于步骤二中构建的多层耦合的节点故障相关性网络,分别计算每个节点在该子网络内部的出度、入度,以及该节点到其它子网络的节点的出度和入度,分别作为该节点在所在的子系统内部以及不同子系统之间的故障影响传播过程中的重要程度的衡量。这些度值在节点所在的子网络,以及整个多层网络上的平均值,在本专利中也是评价整个多层系统的脆弱性的主要指标,描述了(子)系统中的整体的故障相关关系的数量和强度。最后,具有较大度值的节点,也是在现实系统中应该重点予以保护的对象。
理解故障相关关系网络的时空变化性质:基于上述这些从网络结构角度评价系统节点故障耦合关系与系统脆弱性的指标,可以分别观察多层耦合系统的故障相关关系随时间和空间的演化性质。当研究时间演化时,可以分别使用不同的时间段的节点故障时间序列来构建相关关系网络,然后观察节点的度等网络结构指标如何随时间变化。如果在某些时间段,子系统内部或者不同子系统之间的故障相关关系出现了显著变强或者变弱的趋势,就说明系统中很可能出现了某些影响系统节点故障耦合关系的内在原因,例如一些节点之间的物理连接结构可能发生了变化,从而导致整个系统的故障相关关系的变化。在空间变化上,可以在构建出的多层故障相关性网络中观察节点间相关关系如何随网络上的距离(最短路径),或者地球上的空间距离(对有空间地理位置的系统而言)变化。对不同的具体基础设施系统而言,如果在某些距离值附近对应的故障相关关系较强,那么说明故障事件同时影响大量节点,或者在不同节点间传播时,可能具有某些固定的距离模式。此外,也可以使用不同空间区域内的节点分别构建相关性网络,观察网络的结构指标在空间上的分布。通过上述这些方面的分析可以帮助理解故障事件的影响和传播在时间和空间上的变化趋势,揭示故障传播的速度、方向和路径,从而帮助评价整个系统的脆弱性。
(三)本发明的优点和功效
与传统的系统脆弱性分析方法相比,基于故障相关性网络探测的脆弱性评价方法具有以下两方面优势。一方面,本方法的主要目的在于发现与度量现实系统节点间客观存在的故障耦合关系,而并非关注于故障事件发生的概率等其它方面。这样的耦合关系恰恰是使现代社会关键基础设施系统出现越来越多的大规模安全问题的主要原因之一。而且,基于0-1故障时间序列的建网方式使本方法可以广泛应用于很多不同领域基础设施的脆弱性评估。另一方面,本方法是基于复杂网络领域的一些节点重要程度的评价指标,从而在将来可以有进一步发展的广阔空间。例如,如果在将来复杂网络领域(包括单层网络和多层网络)发现了新的更好的节点关键程度的评价方法,就同样可以应用在本方法中构建的节点故障相关性网络上,为更好地理解基础设施的系统脆弱性服务。
附图说明
图1为所述方法的总流程图。
图2为取了一定阈值wmin后的加权有向的多层故障相关关系网络的一个示意图,以双层的情况为例。图中两个子网络分别表示子系统a和子系统b,边的粗细描述了边权的大小。
图3为图2所示的双层耦合关系网络中两层子网络a与b各自的节点度的分布。
图4为图2所示的双层耦合关系网络中两层子网络a与b的节点的入度、出度的分布。
具体实施方式:
下面结合附图1中的方法流程图以及附图2中的耦合关系网络示例对本发明做进一步详细说明。
本发明提出的基于多层耦合关系网络的关键基础设施脆弱性测评方法,见图1所示,该方法包含以下步骤:
步骤一:获取系统节点信息与历史故障数据,确定合适的节点数量、空间分布、时间范围与时间间隔,从而获得每个节点的故障时间序列;根据实际系统耦合关系探测的需要,对节点时间序列进行预处理;
具体而言,本发明考虑由两个基础设施(子)系统a、b组成的耦合系统。通过步骤一的方法,分别在两个(子)系统中分别选取na、nb个系统节点,每个节点i得到长度为l的0-1故障时间序列si(t)。
步骤二:选择合适的故障相关关系计算方式,如皮尔逊相关系数、互信息等,以考虑节点间关联的时间延迟的方式定义每对节点之间的边权、方向、时间延迟等;通过给故障相关性取一定的阈值,只保留那些足够强的边。分别为每个(子)系统内部的和不同(子)系统之间的节点连边后,形成加权有向的多层耦合关系网络。
具体而言,本发明由步骤二中所述的方法,可以为两个基础设施(子)系统a、b组成的耦合系统中每一对节点计算互相关系数的最大值,定义为边权wi,j。并进一步定义每对节点的时间延迟τi,j,其符号决定了连边的方向。选定边权阈值wmin后,可构建出一个有向加权的双层耦合故障相关性网络。图2所示的网络即为一个这样的双层相关性网络的例子。其中两个子网络分别对应子系统a、b,分别具有10个和8个顶点。灰色虚线的边为跨两层网络之间的边,连边的粗细表示了边权的大小。
步骤三:针对步骤二中构建的多层耦合关系网络,使用节点的度(连边数量)等网络结构指标,及其在整个网络上的均值等,作为单个节点乃至整个系统的故障耦合关系强弱的评价指标。可根据需要观察评价指标随时间或空间的变化趋势。
本发明使用步骤三中所描述的方法,计算节点的度等网络结构指标,并由此评价整个系统的脆弱性与可靠性。具体而言,在网络结构分析方面,本发明主要使用节点的度(出度、入度)作为节点在故障事件传播中关键程度的衡量指标,并用整个网络的平均度评价整个系统的节点故障耦合关系的强度。具体到图2所示的双层故障相关性网络,可以分别计算每个节点的度、入度和出度。作为分析节点的度的例子,图3的两个子图展示了图2中a、b两个子网络各自的节点度值的频数图。两个网络中最大的度值均为4,而a、b两个子网络分别具有1个和2个度值为4的节点,它们可认为是该耦合基础设施系统的故障作用中较为脆弱的节点。图4的两个子图则分别展示了a、b两个子网络各自的节点入度和出度的频数图。例如,那些出度为0的节点,可以认为是在故障的传播中并不倾向于导致其它节点发生故障。而那些出度较大(如出度为3)的节点,则可能是故障传播中更容易导致其它节点故障的那些节点。这些关键节点,应在实际耦合基础设施系统的节点保护中予以重点考虑。除此之外,还可以分别计算每个节点在本层内部以及不同层之间的入度和出度。例如在图2这个例子中,子网络a中就有两个节点的跨层的出度为1,一个节点的跨层的入度为1。而子网络b中则相反。根据步骤三的描述,这些度值都是评价节点在子系统内部以及子系统之间的故障影响过程中的危险程度的指标。
上述针对图2中故障耦合关系网络示例的分析表明,本发明中提出的方法确实能够有效地对不同关键基础设施系统组成的耦合系统的脆弱性进行评价,帮助理解不同系统节点在系统内部与不同系统之间故障事件影响中的参与程度,并能进一步为不同实际关键系统中的节点保护提供具体可行的建议。
本发明未详细阐述部分属于本领域公知技术。
以上所述,仅为本发明部分具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域的人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。