本发明涉及复杂网络应用领域,具体涉及了一种水文监测网络的优化方法。
背景技术:
早在1986年,ward等就指出监测网中存在着“数据丰富但信息贫乏”的问题,其导致了尽管投入了大量的人力资源与财力资源,但由于水文监测网络获取的数据存在冗余性,反而为水文研究和应用代表了不便和干扰。一个高效的监测网络,不仅可以提供实时的水文信息,同时可以为水文科学研究提供可靠来源,是决策者有效管理的工具。但长期以来,对于监测网络缺乏有效的评价与优化,使得信息冗余但同时又缺失。
水文监测网作为流域水文信息提供的载体,布局合理是否直接影响所获得的水文数据对于流域内在规律及特征分析的代表性和研究价值。通过水文监测网络收集的水文信息,对于水资源系统的规划、设计以及管理具有重要意义,同时也是许多水资源工程的重要输入,比如水库的设计、水资源分布系统、灌溉系统等;利用得到的监测水文信息,可以对淡水资源进行规划和管理,这从一定程度上可以缓解日益增长的工农业用水需求,减少由于用水引发的矛盾;通过对得到的水文监测数据研究和分析,可以了解气候变化以及土地利用情况等;总体来说,水文监测网站提供的数据的精确性直接影响与其相关的各种水文工作和研究的开展。
目前针对水文监测网络的研究已经引起了学者的广泛重视,并取得了初步成果。本发明提出了一种利用复杂网络方法挖掘水文监测数据时空关联、从而来考量监测网络是否能够有效的测量流域水文变量的一种方法。
技术实现要素:
本发明所要解决的技术问题是针对背景技术中所涉及到的缺陷,提供一种水文监测网络的优化方法。
本发明为解决上述技术问题采用以下技术方案:
一种水文监测网络的优化方法,包含以下步骤:
步骤a),利用复杂网络抽象方法对水文监测网络所获得的水文监测数据进行建模,形成水文监测复杂网络模型;
步骤b),利用newman快速算法对水文监测复杂网络模型进行社团挖掘,完成流域划分;
步骤c),计算流域划分后的水文监测复杂网络模型中每个节点的信息量指标、转移性指标、冗余性指标,并根据该节点的信息量指标、转移性指标、冗余性指标计算其重要性指标;
步骤d),根据节点的重要性指标对水文监测网络进行优化。
作为本发明一种水文监测网络的优化方法进一步的优化方案,所述步骤a)的详细步骤如下:
步骤a.1),针对每个水文监测站的数据,将对应的监测站的地理位置抽象为节点;
步骤a.2),将两个节点间的水文监测数据序列之间的相关性作为评价两个节点之间是否存在连边的标准,建立复杂网络模型:若相关性大于预设的相关性阈值,认为对应节点之间存在连边,否则认为节点之间不存在连边。
作为本发明一种水文监测网络的优化方法进一步的优化方案,所述步骤a.2)中采用皮尔森系数作为两个节点间序列之间的相关性,计算公式如下:
其中xi代表节点i的水文变量时间序列,其中xj代表节点j的水文变量时间序列;
作为本发明一种水文监测网络的优化方法进一步的优化方案,所述步骤b)的详细步骤如下:
步骤b.1),初始化水文监测复杂网络模型为n个社团,n为复杂网络模型的节点数目,即每个节点就是一个独立的社团;
初始化eij和ai,使其满足
ai=ki/2m
其中,eij为节点i所在社团的点与节点j所在社团的点之间的边所占的比例,ai为连接到节点i所在社团的边的比例,ki为节点i的度,m为网络中总的边数;
步骤b.2),合并有边相连的社团对,使模块度q增大最多或者减少最小,合并后的模块度增量δq的计算公式如下:
δq=eij+eji-2aiaj=2(eij-aiaj)
步骤b.3),对相应的元素eij更新:将与i,j社团相关的行和列对应的eij相加作为新的eij;
步骤b.4),记录本次模块度q的值以及其对应的社团划分结构;
步骤b.5),重复执行步骤b.2)至步骤b.4),直到整个复杂网络模型都合并成为一个社团;
步骤b.6),选择模块度q的最大值对应的社团划分结构作为流域划分的结果。
作为本发明一种水文监测网络的优化方法进一步的优化方案,所述步骤c)的详细步骤为:
步骤c.1),信息量指标计算:对于节点i,根据以下公式计算其信息量指标kii:
其中,cd(i)为节点i的度中心性,min(cd)为节点中度中心性的最小值,max(cd)为节点中度中心性的最大值;
步骤c.2),转移性指标计算:对于节点i,根据以下公式计算其转移性指标bii:
其中,cb(i)代表节点i的介数中心性,min(cb)代表节点中介数中心性的最小值,而max(cb)代表节点中介数中心性的最大值;
步骤c.3),冗余性指标计算:对于节点i,根据以下公式计算其冗余性指标rii:
式中,
步骤c.4),重要性指标计算:对于节点i,根据以下公式计算其重要性指标fi:
其中,kii为节点i的信息量指标,bii为节点i的转移性指标,rii为节点i的冗余性指标。
作为本发明一种水文监测网络的优化方法进一步的优化方案,所述步骤d)的详细步骤为:
步骤d.1),保护节点:对所有重要性指标大于预设的重要性指标阈值的节点进行保护;
步骤d.2),删除节点:对所有冗余性指标大于预设的最高冗余性指标阈值的节点进行删除;
步骤d.3),增加站点:对所有冗余性指标小于预设的最低冗余性指标阈值的节点周围增加节点,使得节点的冗余性指标大于最低冗余性指标阈值。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
本发明利用复杂网络挖掘监测水文数据之间空间上的拓扑关联,从测量到的数据出发分析,考量监测网络是否能够有效的测量流域水文变量,不需要对流域水文特性有深入了解,在广泛的领域内具有较好的扩展性。
附图说明
图1示出了本发明的流程示意图;
图2示出了本发明的水文监测复杂网络构建流程图;
图3示出了本发明的水文监测网络评价的流程示意图;
图4示出了本发明的社团规模中社团划分方法——newman社团挖掘算法的流程示意图;
图5示出了本发明的监测网络优化的流程示意图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
图1示出的是本发明的流程示意图。本发明提出的一种水文监测网络的优化方法包含三大步骤:水文监测复杂网络模型构建,水文监测复杂网络模型评价,水文监测复杂网络优化。本算法的输入为待评价水文监测网所获取的水文变量的时空序列,输出为对水文监测网络的优化。
图2示出的是本发明的水文监测复杂网络构建框图。具体步骤如下:
步骤1:选取合适的水文数据
根据需要从数据库中选取合适的符合要求的监测站的水文数据,选取的标准为监测网获取的水文数据的年限范围和序列的时间长度。假定选取了n个符合要求的监测站,每个监测站对应的水文变量时间序列表示为x=(x1,x2,x3,……xt)。
步骤2:节点抽象
本发明中节点的抽象是将水文变量序列对应的监测站的地理位置作为节点,则共有n个节点,对应为x1,x2,x3......xn。
步骤3:计算相关系数r
本发明中选取的相关性衡量标准为皮尔森系数:
其中xi代表节点i的水文变量时间序列,其中xj代表节点j的水文变量时间序列;对每个节点xi分别计算其与另外n-1个节点的皮尔森相关系数,计算公式如上式。
步骤4:设定相关性阈值ts
相关性阈值ts的设定要考虑到边密度ρ(t):
其中n(t)代表ts=t时网络边的数目,如果阈值ts设定的过大,导致n(t)太小,从而造成很多孤立节点,如果阈值ts设定的过小,导致n(t)太大,使得网络几乎是完全网络,这些情况对于网络的研究和节点的分析都是无用的,因此根据步骤2计算出来的相关系数,画出相关系数的密度分布图,选取一个合适的ts取值范围。
同时相关性阈值ts的选取还需要考虑遥相关连边的存在,所谓的遥相关指的是即使地理位置相距很远的节点,其相关性仍然很高的节点。阈值选取的过程中要注意不要丢失这些连边。
步骤5:边的抽象
对于节点i,j,如果其
至此,水文监测复杂网络模型构建结束。
根据社团挖掘与流域划分之间的一致性,利用社团挖掘方法来对水文监测复杂网络模型进行社团划分,社团挖掘的结果是每个群内部的节点之间连接相对非常紧密,但是各个群之间的连接相对来说比较稀疏,因此利用社团挖掘方法进行流域划分的目标的。
利用newman快速算法进行社团划分,这是一种基于贪婪算法思想的凝聚算法。它首先将每一个节点考虑成一个社团,然后逐步合并成一个社团,合并的原则是朝着社团模块度增大最大的方向或是减少最小的方向,则对应模块度最大的社团划分则对应最优的社团划分,即流域划分的结果。
图4示出的是本发明的社团规模计算中社团划分方法:newman快速算法流程图。具体如以下步骤:
步骤1:初始化
初始化网络为n个社团,即每个节点就是一个独立的社团。初始化eij和ai满足
ai=ki/2m
其中,ki为节点i的度,m为网络中总的边数。
步骤2:合并网络
一次合并有边相连的社团对,并计算合并后的模块度增量:
δq=eij+eji-2aiaj=2(eij-aiaj)
根据贪婪算法的原理,每次合并应该沿着使q增大最多或者减少最小的方向进行。每次合并以后,对相应的元素eij更新:将与i,j社团相关的行和列对应的eij相加作为新的eij。
重复执行本步骤,不断的合并社团,直到整个网络都合并成为一个社团。
步骤3:选择最优社团划分结果
在合并社团过程中,每一个合并之后都对应着一个社团划分结果,选择一个对应着局部最大q值的社团划分,则其对应的就是最优的网络社团结构。
图3给出的是水文监测复杂网络模型评价的流程示意图,其主要是针对站点重要性进行评价,而站点重要性评价则建立了一个依托于复杂网络统计性质的评价标准方法,具体步骤如下:
步骤1:信息量指标计算
所谓信息量指标指的是水文监测站点获取的监测数据反映的水文信息量。在复杂网络中,度中心性指标代表了节点在整个网络中的影响力,一个节点的度越大,则表明这个节点所代表的水文信息越能代表这个流域的水文状况,因此度中心性指标可以用来衡量水文监测站的重要程度,其对应的度中心性指标越大,则其在水文监测网络中扮演的角色就越重要。因此,对于节点i设定信息量指标kii,定义其表达式公式为:
其中cd(i)代表节点i的度中心性,min(cd)代表节点中度中心性的最小值,而max(cd)代表节点中度中心性的最大值。
步骤2:转移性指标计算
转移性指标反映的水文监测复杂网络模型中由一个监测点水文状况推测另一水文监测点水文状况的能力,其反映的是水文信息的转移与传播能力。在复杂网络节点重要性挖掘中,介数中心性指标描述了信息流经过给定节点的可能性,刻画了网络中的节点对于信息流动的影响力,反映了网络中节点的转移能力,因此利用复杂网络中节点的介数中心性指标反映水文网络中监测站点的转移能力,利用转移性指标bii表示,定义其计算公式为:
其中,cb(i)代表节点i的介数中心性,min(cb)代表节点中介数中心性的最小值,而max(cb)代表节点中介数中心性的最大值。
步骤3:冗余性指标计算
冗余性是水文监测网常见的问题,监测网常面临着或者在一个流域内设立太多监测站,导致了网络的冗余性;或者在一个流域内设立的监测点太少,导致了网络的无效性。因此,对于水文监测网站评价来说,冗余性是一个重要衡量标准。在复杂网络中,利用社团规模指标表示大规模的冗余度,利用聚类系数表示小规模的冗余度。社团规模指标表示为csi,具体计算方法见图4。而小范围内的冗余程度则以聚类系数指标cii表示,其计算公式为:
其中,ci代表节点i的聚类系数,cmin代表复杂网络中节点聚类系数的最小值,cmax代表复杂网络中节点聚类系数的最大值。则在水文监测网络模型中,节点i的冗余性指标可以表示为rii,其对应值为:
式中,
本式中考虑了网络中孤立节点其聚类系数不存在的情况,因此在节点度为0时其对应值设为0,即孤立节点所对应的监测站点在网络中部存在冗余性。冗余性指标ri越大,则表明此节点的冗余性越大,反之,则表明冗余性较小。
步骤4:重要性指标计算
对于水文监测复杂网络模型中站点重要性的评价,利用信息量指标体现了站点本身的重要性,利用转移性指标体现了站点在网络信息传输中的重要性,利用冗余性指标体现了站点在空间布局密度上的分布状况,因此,设定重要性指标评价函数f为:
其中,kii为节点i的信息量指标,bii为节点i的转移性指标,rii为节点i的冗余性指标。利用函数f来分别计算每个节点的重要性指标,以此来评价监测网络中站点的重要性。
图5给出的是本发明的水文监测复杂网络模型优化框图。主要是在节点评价的基础上提出了如何针对现有的监测网络进行重要监测点的保护、删除一些冗余监测站以及在哪些位置上增加节点是最有效的。
(1)保护节点
在水文监测网络中,存在一些重要的监测站点,这些站点出现故障时会导致整个监测网络系统的效率降低,针对这些节点需要进行额外的保护以确保监测系统的可靠性。在水文监测复杂网络模型中,节点重要性评价指标依据信息量指标、转移性指标以及冗余性指标,因此,对于节点的保护也需要从这三方面入手,信息量指标较大的监测站点即度较大的节点反映了广泛范围内的水文信息,此类节点对应的水文状况是流域内水文状况的整体反应;转移性较大的监测站点即介数较大的节点反映了水文信息在流域内的传输较为密集的地方,因此,此类节点对应的水文状况较为复杂,也应给予额外重视;而针对冗余性较小的节点,尤其是孤立节点,其对应的监测站点反映的水文状况是相对特殊的水文状态,因此对于此类站点也应该给予注意。具体操作为:对所有重要性指标大于预设的重要性指标阈值的节点进行保护。
(2)删除节点
在水文监测网中,由于水文监测站的建设以及维护成本等因素,需要减少一些监测站以减少维护成本。在水文监测复杂网络模型中中,节点的删除应当考虑冗余性指标,在冗余性指标较大的地方,存在着水文信息的冗余,因此停用一些监测水文站对流域水文整体状况的获取并不会产生太大的影响。而冗余性指标是由社团规模指标cs以及聚类系数c组成,因此在考虑节点删除时,应当首先删除大社团中聚类系数较大的节点。这些水文监测站的停用一方面不会对流域水文状况分析产生太大的作用,另一方面,由于其周围监测站设立较多,可以通过pub预测方法获取其对应节点的水文信息。具体操作为:对所有冗余性指标大于预设的最高冗余性指标阈值的节点进行删除。
(3)增加节点
为了更好的研究流域的水文状况,需要获取更多的具有代表性的流域水文数据,更多水文数据的获取则主要依托增加水文监测站点。在水文监测复杂网络模型中,节点的增加应当考虑冗余性指标,在冗余性指标较小的地方,可能存在着信息获取不足等问题,可以通过增加更多监测站来获取更多的水文数据。而冗余性指标是由社团规模指标cs以及聚类系数c组成,因此在考虑节点增加时,应当优先把监测站点增加在社团规模较小的社团,特别是孤立节点对应的社团,从而可以对对应流域的水文状况进行更深入的分析与研究。具体操作为:对所有冗余性指标小于预设的最低冗余性指标阈值的节点周围增加节点,使得节点的冗余性指标大于最低冗余性指标阈值。
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。