本发明涉及一种复杂网络建网方法。特别是涉及一种基于时间序列模式表征的加权有向复杂网络建网方法。
背景技术:
复杂网络分析方法是把复杂系统内部基元之间的关系抽象为网络的节点和连边形式,然后通过量化分析网络的拓扑结构及动力学行为,揭示复杂系统的内在属性及运行规律等重要信息。复杂网络分析方法为不同类型的复杂系统研究(例如生物网络、脑神经网络、万维网、社交网络等)提供了全新的视角,因此受到了不同学科科研人员的广泛关注,并取得了一系列可喜的进展。但随着研究的不断深入及应用对象的剧增,现有的复杂网络方法的缺陷和不足也逐渐凸显,因此探寻新的适用度更广且性能更优的复杂网络建网方法成为该领域亟待解决的难题之一。
近些年来,科研人员研究发现复杂网络分析方法不仅能够挖掘出时间序列中的重要信息,而且便于研究理论模型难以精确描述的复杂非线性系统,因此,逐渐发展成为一类全新的(非线性)时间序列的分析工具。目前,(非线性时间序列映射为复杂网络最经典的方法有:基于相空间重构建网方法和可视图建网方法。相空间重构建网方法是通过嵌入维数和延迟时间估算技术从原始时间序列中抽取一组多维向量,将这些向量作为复杂网络的节点,然后依据向量之间的相似性确定网络节点的连边(节点间的相似性度大于某一给定阈值),从而构造出原始时间序列对应的复杂网络,该方法在嵌入维数和延迟时间估算过程中存在不稳定因素,且连边关系判断的最佳阈值也很难确定,导致该方法应用的鲁棒性较差。可视图建网方法是将原始时间序列中的数据点作为网络的节点,将数据点之间的可视关系作为网络的连边,其中可视关系是通过节点之间的数据大小和可视规则确定的。相比相空间重构建网方法,可视图建网方法参数较少,算法鲁棒性较好,但这种建网方法网络规模与时间序列长度直接相关,当分析的时间序列长度较长时,对应复杂网络节点数较多,导致后续复杂网络特性的抽取计算复杂度较大。此外,上述两种建网方法只能构建无权、无向复杂网络。
在无权、无向复杂网络中,各基元之间仅存在“有关联和没关联”这种简单的关系,如果有关联代表基元的两个节点之间就存在连边,否则就不存在连边。但在很多实际复杂系统中,各基元之间关联程度存在量上的差异,因此不能简单地用“0”或“1”表示。此外,很多基元之间关联还存在一定的方向性差异,例如基元A可以影响基元B,但基元B可能对基元A的状态没有影响,即基元A对基元B具有单向传递性。由此看出,无权、无向复杂网络无法精确反应节点(或基元)之间的关联。
技术实现要素:
本发明所要解决的技术问题是,提供一种能够更精细的反映原始时间序列各分段之间关系的基于时间序列模式表征的加权有向复杂网络建网方法。
本发明所采用的技术方案是:一种基于时间序列模式表征的加权有向复杂网络建网方法,包括如下步骤:
1)采用零均值规范化方法将原始时间序列规范化,通过如下计算公式:
其中,是时间序列的均值,a为原始时间序列的标准偏差,
对于原始时间序列{xi},i=1,…,t,进行标准化后得到新的时间序列{yi},i=1,…,t;
2)将新的时间序列{yi},i=1,…,t等概率划分为n个区间,然后用设定的字符串中的字符来表示各个区间,每个区间对应一个字符,从而将新的时间序列{yi},i=1,…,t表示为字符串序列{sk},k=1,…,t,其中sk是设定的字符串中的字符,所述设定的字符串是由英文字母中的前n个字母组成;
3)用一个长度为l的滑窗,l的默认值为4,从字符串序列{sk},k=1,…,n的第一个字符开始自左向右移动,滑窗每次移动1步,就将字符串序列{sk}划分为长度均为l的(n-l+1)个片段,将每一个片段视为一个模态;
4)将不同模态作为复杂网络的节点,由节点之间的转换频次和转换方向确定复杂网络节点之间的连边权重和方向,从而将字符串序列{sk}映射为一个加权有向复杂网络;
5)计算加权有向复杂网络的网络拓扑统计特性,包括网络规模SN、加权有向平均路径长度WPL和介数中心性BC;
SN=N (4)
其中,
其中,
其中N为网络的节点总数;Pl(p,q)为节点p到节点q的加权有向最短路径长度,wpq为节点p到节点q的加权路径;Bc(p)为节点p的介数中心性,Lmq为从节点m到节点q的所有最短路径的总数目,Lmq(p)从节点m到节点q且经过节点p的所有最短路径数目。
步骤4)是依据如下规则确定复杂网络节点之间的连边权重和方向:如果当前节点与下一时刻节点相同,即节点保持不变;如果从当前节点到下一时刻的节点发了变化,那么这两个节点之间存在一条连边,方向为从当前节点指向下一个节点,且这两个节点之间的连边权重增加1。
步骤4)还包括借助UCINET软件的NETDRAW工具包绘制有向加权网络的连接状况可视图。
本发明的基于时间序列模式表征的加权有向复杂网络建网方法,借助时间序列符号化表征技术和滑窗技术,获得一系列符号化模式作为网络节点,然后分析符号化模式之间的关联确定网络的权重和方向。本发明能够更精细的反映原始时间序列各分段之间的关系,因此其网络结构和特性能更灵敏、更准确的体现不同信号的差异,从而显著提升时间序列信号的分类或识别精度。本发明主要优点及特色体现在如下几个方面:
1、本发明提出的加权有向复杂网络由于能更精细地反映基元之间的关联,因此其网络拓扑结构和特性能更灵敏、更准确地体现时间序列的差异,显著提升时间序列分类和识别性能。
2、本发明方法利用时间序列符号化模式表征技术确定网络节点,然后通过计算符号化模式的转换频次确定网络权重,符号化模式的转换方向确定节点间的连接方向。上述处理方法受时间序列的长度影响较小,可适用于长度较长甚至超长的时间序列分析,而经典时间序列复杂网络分析方法(如可视图方法和相空间方法)无法实现。
3、本发明提出的时间序列有向、加权复杂网络建网方法适用范围非常广,分析信号可以是线性信号也可以是非线性信号。该方法为不同类型的复杂系统的分析,如气象数据、股票数据、心脑电等数据的分析提供一全新的解读工具。
附图说明
图1是本发明基于时间序列模式表征的加权有向复杂网络建网方法的流程图;
图2是本发明实例选取的Logistics映射在不同参数下对应的时间序列图;
图3是本发明实例选取的Logistics映射在不同参数下对应的时间序列标准化后得到的序列图;
图4是Logistics映射在参数μ=3.8时的标准化序列进行符号化表征的示意图;
图5a是不同参数下Logistics映射对应的周期状态时间序列建立的加权有向复杂网络的网络规模SN变化图;
图5b是不同参数下Logistics映射对应的混沌状态时间序列建立的加权有向复杂网络的网络规模SN变化图;
图6a是不同参数下Logistics映射对应的混沌状态时间序列建立的加权有向复杂网络的加权有向平均路径长度WDPL变化图;
图6b是不同参数下Logistics映射对应的混沌状态时间序列建立的加权有向复杂网络的介数中心性BC变化图。
具体实施方式
下面结合实施例和附图对本发明的基于时间序列模式表征的加权有向复杂网络建网方法做出详细说明。
本发明的基于时间序列模式表征的加权有向复杂网络建网方法,包括如下步骤:
1)采用零均值规范化方法将原始时间序列规范化,零均值规范化方法是将所有时间序列数据转化为均值为0,方差为1的标准化时间序列。通过如下计算公式:
其中,是时间序列的均值,a为原始时间序列的标准偏差,
对于原始时间序列{xi},i=1,…,t,进行标准化后得到新的时间序列{yi},i=1,…,t;
2)将新的时间序列{yi},i=1,…,t等概率划分为n个区间,然后用设定的字符串中的字符来表示各个区间,每个区间对应一个字符,从而将新的时间序列{yi},i=1,…,t表示为字符串序列{sk},k=1,…,t,其中sk是设定的字符串中的字符,所述设定的字符串是由英文字母中的前n个字母组成;
3)用一个长度为l的滑窗,l的默认值为4,从字符串序列{sk},k=1,…,n的第一个字符开始自左向右移动,滑窗每次移动1步,就将字符串序列{sk}划分为长度均为l的(n-l+1)个片段,将每一个片段视为一个模态;
4)将不同模态作为复杂网络的节点,由节点之间的转换频次和转换方向确定复杂网络节点之间的连边权重和方向,从而将字符串序列{sk}映射为一个加权有向复杂网络;具体是依据如下规则确定复杂网络节点之间的连边权重和方向:如果当前节点与下一时刻节点相同,即节点保持不变;如果从当前节点到下一时刻的节点发了变化,那么这两个节点之间存在一条连边,方向为从当前节点指向下一个节点,且这两个节点之间的连边权重增加1;
该步骤还包括借助UCINET软件的NETDRAW工具包绘制有向加权网络的连接状况可视图。
5)计算加权有向复杂网络的网络拓扑统计特性,包括网络规模SN、加权有向平均路径长度WDPL和介数中心性BC;
SN=N (4)
其中,
其中,
其中N为网络的节点总数;Pl(p,q)为节点p到节点q的加权有向最短路径长度,wpq为节点p到节点q的加权路径;Bc(p)为节点p的介数中心性,Lmq为从节点m到节点q的所有最短路径的总数目,Lmq(p)从节点m到节点q且经过节点p的所有最短路径数目。
下面结合Logistics映射实例及附图详细的说明基于时间序列模式表征的加权有向复杂网络建网方法如下:
Logistics映射是典型的一维混沌时间序列模型,它是通过倍周期分叉进入混沌的。Logistics映射模型参照下面的方程:
xn+1=μxn(1-xn) (8)
参数μ的取值不同,即对应不同的状态。在本实例中,我们设定Logistics系统的初始值为0.5,步长为0.01,时间为100s。参数μ分别取3.5,3.6,3.628,3.7,3.74,3.8,3.84,3.9,3.99这9个值时,可以得到长度均为10000的不同状态的Logistics时间序列,如图2所示。各个参数下的状态参照表1。
表1 Logistics系统在各个参数下的状态
1)将每一个Logistics时间序列{xn},n=1,…,10000规范化,这里我们采用零均值规范化方法。该方法是将所有时间序列数据转化为均值为0,方差为1的标准化时间序列。对于原始时间序列{xn},n=1,…,10000,将其进行标准化为后得到新的时间序列{yn},i=1,…,10000,如图3所示。其计算公式为:
其中,是时间序列的均值,a为原始时间序列的标准偏差。
2)将得到的标准化的时间序列{yi},i=1,…,10000等概率划分为12个区间,然后用设定的字符串中的字符表示各个区域,每个区域对应一个字符,如图4所示。这样就将数据序列{yi},i=1,…,10000转化为字符串序列{sk},k=1,…,10000,其中sk是设定的字符串中的字符,所述设定的字符串是由英文字母中的前12个字母组成
3)用一个长度为4的滑窗,从从字符串序列{sk},k=1,…,10000的第一个字符开始自左向右移动,划分字符串序列{sk},k=1,…,10000为各个子片段,滑窗每次移动1步。这样,就将字符串序列划分为长度均为4的9997个片段,将每一个片段视为一个模态。
4)将不同模态作为复杂网络的节点,由节点之间的转换频次和转换方向确定复杂网络节点之间的连边权重和方向,从而将字符串序列{sk}映射为一个加权有向复杂网络。具体是依据如下规则确定复杂网络节点之间的连边权重和方向:如果当前节点与下一时刻节点相同,即节点保持不变;如果从当前节点到下一时刻的节点发了变化,那么这两个节点之间存在一条连边,方向为从当前节点指向下一个节点,且这两个节点之间的连边权重增加1。
5)借助UCINET软件的NETDRAW工具包绘制有向加权网络的连接状况可视图;
6)计算得到的加权有向网络图的网络拓扑统计特性,包括网络规模SN、加权有向平均路径长度WDPL和介数中心性BC;
SN=N (4)
其中,
其中,
其中N为网络的节点总数;Pl(p,q)为节点p到节点q的加权有向最短路径长度,wpq为节点p到节点q的加权路径;Bc(p)为节点p的介数中心性,Lmq为从节点m到节点q的所有最短路径的总数目,Lmq(p)从节点m到节点q且经过节点p的所有最短路径数目。
如图5a所示,不同参数下Logistics映射对应的周期时间序列建立的加权有向复杂网络的网络规模恰好等于周期解集的个数,如图5b所示,不同参数下Logistics映射对应的混沌时间序列建立的加权有向复杂网络的网络规模随混沌程度的增大而增加。如图6a所示,不同参数下Logistics映射对应的混沌时间序列建立的加权有向复杂网络的加权有向平均路径长度WDPL的值,随着混沌程度的增大而增大,如图6b所示,不同参数下Logistics映射对应的混沌时间序列建立的加权有向复杂网络的介数中心性BC随着混沌程度的增加而不断减小。