基于快速密度聚类的电力通信网节点重要性评估方法
【技术领域】
[0001] 本发明涉及电力系统的自动化技术,具体涉及电力通信网节点重要性评估的快速 客观评估方法。
【背景技术】
[0002] 电力通信网是专门为电力行业服务的专用网络,由电厂、变电站以及各级电力系 统相互通讯传输系统组成,目前已经成为电网的重要组成部分。由于电力系统的不断发展 壮大,电力通信网承载的业务量也变得越来越多,增长速度惊人。随着电力通信网络规模的 不断扩大,电力通信网的安全性、可靠性研究也变得越来越重要。而电力通信网中的重要节 点在很大程度上决定了电力通信网的稳定性和安全性,对重要节点的重点维护和管理成为 电力通信网的一个重要任务。因此,如何在复杂的电力通信网中寻找到关键节点成为电力 通信网研究的一个重要问题。
[0003] 电力通信网中的重要节点决定了网络的稳定性和安全性,电力通信网中节点的重 要性表明了该节点在可能的故障情况下对网络性能的影响,使用定量的方法来对网络节点 进行评估已经成为电力通信网研究的热点。目前国内外现有对电力通信网节点的重要性评 估主要存在下面一些方法:1)利用节点的度作为节点重要性的指标。该方法中某节点的连 接的边越多,那么该节点的重要性就越大。2)基于节点删除的评价。该方法通过删除某个节 点,看网络的连通性的变化来分析节点的重要性。3)基于节点的介数的评价,如果该节点的 介数越大那么该节点越重要。4)通过节点紧密度来对节点进行评价,紧密度越大则节点的 重要性越强。目前的电力通信网节点重要性评估主要采用以上几种方法,但是以上的方法 都具有一些缺陷:以节点的度作为评价指标存在一定的片面性,例如桥节点的度虽然不大, 但重要性却很强;基于节点删除的方式中如果删除的是末梢节点,那么就不能实现节点重 要性的客观评估;介数和紧密度体现的是节点对于全局的影响。节点介数定义为网络中所 有最短路径中经过该节点的路径的数目占最短路径总数的比例。紧密度指标C用于刻画网 络中的节点通过网络到达其他节点的难易程度。介数和紧密度没有体现出该节点对局域网 络的影响,因此基于节点的介数和紧密度的方法的评估不能全面反映节点的重要性。而节 点度的指标能够刻画节点对局部网络的影响。因此,本发明中综合利用节点的度、介数和紧 密度作为节点重要性的评价指标。
[0004] 目前有关电力通信网节点重要性评估的工作基本上都是以单一连接权值为主,将 距离和带宽都考虑进评估模型的还没有。而且以往的电力通信网的节点重要性评估往往只 利用单个的评价指标,而没有有效的综合多种评价指标,并且很多方法只针对网络结构本 身,而忽略了网络的连接权重。
[0005] 针对目前电力通信网评估存在的各种问题,本发明利用网络带宽和距离作为加 权,通过多种评价指标的综合来对节点的重要性进行评估。由于采用多指标的方式进行节 点重要性的评估分类,并且这种分类是一种无监督的分类。目前针对电力通信网节点重要 性评估的无监督分类主要为K-means方法。K-means方法为无监督分类中的主要传统方法, 但是因为该方法基于距离,故结果是圆形的聚类形状并不能很好的对复杂特征的融合进行 分类。针对该问题,本发明采用了一种叫做快速密度聚类的方法,该方法发表在2014年的 《science》期刊上,该方法不仅利用距离作为分类的度量,还利用密度作为分类的指标,有 效解决了K-means方法的不足。在加权网络的基础上,本发明基于快速密度聚类的方法,采 用节点度、节点紧密度以及节点的介数作为评价指标,对电力通信网的节点重要性进行评 估。利用某省的实际电网通信数据进行检验,验证了本发明方法在电力通信网中的实用性。
【发明内容】
[0006] 基于以上的背景,针对目前电力通信网评估存在的各种问题,本发明利用网络带 宽和距离作为评价加权,本发明基于快速密度聚类的方法,采用节点度、节点紧密度以及节 点的介数作为评价指标,对电力通信网节点的重要性进行评估,可以有效快速地确定电力 通信网节点的重要性。
[0007] 本发明提供了一种基于快速密度聚类的电力通信网节点重要性评估方法,其特征 在于,包括如下步骤:
[0008] 步骤1)根据待评估电力通信网络建立有权网络数据模型;统计网络带宽和距离, 将距离和带宽的权值进行归一化整合,采用网络带宽和距离作为评价加权;
[0009] 步骤2)计算节点度,计算节点紧密度,计算节点介数,将计算得到的数据归一化;
[0010] 步骤3)归一化的数据输入到快速密度聚类算法中,分析计算得出电力通信网的节 点的重要性结果。
[0011] 其中,优选的综合节点度、节点紧密度和节点介数三种评价指标评估电力通信网 的节点的重要性;
[0012] 距离和带宽的权值各为50%;
[0013] 快速密度聚类算法利用距离和密度作为分类指标;
[0014] 数据点的平均邻居数为数据集中点总数的值优选为1-2%。
[0015]任意数据点i的局部密度Pi定义为:
[0016]
[0017]点i至俱有更高局部密度点的距离61定义为:
[0018]
[0019] 所述快速密度聚类算法中具有相对较高Pl和相对较高~的点可被认为是类簇中 心,类簇中心找到后,剩余的每个点被归属到它的有更高密度的最近邻所属类簇。类簇分配 只需一步即可完成,不像其它算法要对目标函数进行迭代优化。快速密度聚类算法计算电 力通信网节点的步骤包括:步骤1)输入归一化的节点度、节点紧密度和节点介数,计算节点 的局部密度P;步骤2)计算节到具有更高密度点的距离S;步骤3)选择P ? S较大的值作为类 簇中心;步骤4)剩余的每个点被归属到它的有更高密度的最近邻所属类簇,从而给出节点 重要性的分类。
[0020] 优选的,选择p ? S值最大的四个点作为类簇中心。
[0021] 快速密度聚类算法使一种简洁优美的聚类算法,可以识别各种形状的类簇,并且 其超参数很容易确定。本发明将快速聚类算法应用于电力通信网络节点重要性的评估中, 采用网络带宽和距离作为评价加权,取得了很好的效果。综合节点度、节点紧密度和节点介 数三种评价指标评估电力通信网节点的重要性,能够快速有效的确定各节点的重要性,克 服了现有技术中基于单一参数评估重要性、用K-means方法或其他方法评估节点重要性存 在的不足。
【附图说明】
[0022]图1为本发明实施例电力通信网络节点重要性评估方法的流程图;
[0023]图2为本发明实施例的节点紧密度分析结果图;
[0024]图3为本发明实施例的节点脆弱性分析结果图;
[0025] 图4为本发明实施例的节点度、节点紧密度以及节点介数之间的相关关系结果图;
[0026] 图5为本发明实施例电力通信网节点重要性的流程图;
[0027] 图6为本发明实施例的节点的重要性聚类分布图;
[0028] 图7为本发明实施例的电力通信网节点的重要性分类图。
【具体实施方式】
[0029]下面结合【附图说明】,以2013年河南省电网同性数据作为数据分析来源,开展本发 明的实施例,进一步阐述本发明的方法,附图1为本发明电力通信网络节点重要性评估方法 的流程图。具体包括如下步骤:
[0030] 步骤1)建立有权网络数据模型,根据地区的物理结构,统计网络带宽和距离。
[0031] 节点数为n,边数为m的通信网有权网络数学模型可以用一个加权矩阵来描述。 'WG1 …wGlM、
[0032] : (1) \WGm] y
[0033]边权邻接矩阵的矩阵元为:
(2)
[0035]式中,伪节点i与节点j之间线路的权值。边权代表节点间相互作用的强度或难 易程度。如果节点之间的距离作为权值,权值越大表示两点间的距离越大,作用越弱。如果 节点之间的带宽作为权值,则权值越大作用越大。在本发明中将距离和带宽的权值进行归 一化整合,距离和带宽的权值各为50%。
[0036] 网络中节点的重要性不但与节点本身的度有一定关系,而且与节点的邻居节点的 度大小、节点的紧密度、节点的介数也存在一定的关联,这些指标体现了节点的影响力。节 点的影响力包括直接影响力和间接影响力。直接影响力反映节点本身影响其他节点的能 力,如节点的度。间接影响力反映节点通过网络对其他节点施加影响的能力,如紧密度和介 数。本发明利用节点度、节点紧密度、节点的介数作为节点重要性的评价指标。
[0037] 步骤2)计算节点的度、紧密度、介数,并归一化。
[0038] 节点的度:节点i的度数ki是指与该节点直接连接的边数,反映的是一个节点对于 网络中其他节点的直接影响力。具有n个节点的网络中,节点的度不会超过n-1。通常情况 下,加权后节点i的强度Si定义为:
[0039] Si = ki/max(kj),j = 1,2,? ? ?,n (3)
[0040] 节点的紧密度:紧密度指标C用于刻画网络中的节点通过网络到达其他节点的难 易程度,反映节点的间接影响力。其值定义为该节点到达所有其他节点的距离之和的倒数。 具有n