一种量化评价MSV的边级视觉混杂程度指标计算方法与流程

文档序号:16430568发布日期:2018-12-28 20:07阅读:438来源:国知局
一种量化评价MSV的边级视觉混杂程度指标计算方法与流程

本发明涉及动态网络可视化中大规模序列视图(msv)的可视优化领域,特别涉及一种量化评价msv的边级视觉混杂程度指标的计算方法。

背景技术

网络(network)也称作图(graph),通常一切具有关系的实体都可以抽象成一个网络(图),即实体被抽象成节点,实体之间的关系被抽象成边。根据网络是否会随着时间发生变化,可分为静态网络和动态网络。

动态网络主要用来表示网络中的节点及节点间关系随时间变化的情况。为高效、直观地帮助人们理解时变网络的行为信息,常见的做法是通过可视化技术对动态网络中的数据实现符合美学标准的视觉映射和布局设计。msv是一种经典的动态网络可视化技术,被广泛应用于分析动态社交网络和程序执行跟踪。在msv中,用水平线表示动态网络的节点,其在纵轴上等距;用横轴表示网络存在的时间。当时刻t存在从节点a到b的瞬时关系,则在t的垂线位置作以a为起点,b为终点的垂线。由于msv支持任意细粒度的可视化并可保留用户的心理地图,所以易于用户从节点对到全局网络对通信趋势进行观察与分析。然而,msv容易受到可视混杂的影响。在动态网络中,当多条边出现在相近但不完全相同的时刻,在进行边的绘制时,如果屏幕横向空间无法提供足够的像素,就会导致边重叠引起的视觉混杂。视觉混杂会使msv的整体可读性下降,造成人们对网络通信的时变趋势理解困难。为解决该问题,一些技术对msv做出改进。过滤技术和缩放技术提供细节和像素化的视图来显示选定的时间和节点,但无法对全局进行清晰描述。反锯齿技术可以减少由于过度绘制边缘而导致的视觉混乱,但无法优化重叠边。弯曲连接技术可避免边缘重叠,但是会造成边的交叉。到目前为止,节点排序策略是改进msv的最佳技术,但是当节点之间的通信密集且不规律时,很难得到满意结果。并且,动态网络的网络结构是动态演化的,而不是如静态网络一样固定不变。现有的边采样技术的关注点为如何均匀随机地对静态图进行采样,即采样过程中考虑保留的是重要的静态属性。因此,这些边采样技术不适用于动态网络,更不能在采样后有效保留动态网络的结构。



技术实现要素:

为了解决现有边采样技术大多考虑的是静态图采样,极少有考虑动态图采样的算法。并且,现有msv改进技术都不是利用采样来完成的,且改进后的结果都会引入新的缺陷(如引入边交叉等)的问题。本发明提供一种量化评价msv的边级视觉混杂程度指标计算方法,能够实现在msv中对动态网络直接进行边级评估,并且能够定量的衡量msv中一条边所在屏幕位置的视觉混杂程度。利用该指标作为msv边采样的依据,可有效降低msv视图的混杂程度,极大程度的提高视图的可读性,从而帮助工作人员理解网络通信的时变趋势,节省其网络探索的时间。

本发明为解决上述问题所采用的技术方案为:

一种量化评价msv的边级视觉混杂程度指标计算方法,包括以下步骤:

步骤1):将动态网络描述为一个有向图并以msv视图的形式实现可视化,选取其中任意一条边e,求出e在横轴上的位置,然后从中心位置分别向左右各扩展一个不可区分的像素距离的宽度,以msv视图高度为高度,形成一个矩形区域,即不可区分的像素区域ipa;

步骤2):以msv视图左上角为坐标系原点,且以边e在纵轴偏上的端点所在的节点作为起始节点,偏下的端点所在的节点作为终点节点,然后找出所有部分或全部处于边e的ipa内且与边e产生了重叠的其他边,将这些边归类于边e的交错边并置于交错边集合eos中;

步骤3):将eos中的边按照节点顺序进行分解,分解后得到若干个等距且直接相邻的节点对组成的集合ed(e),然后利用并集操作消除重叠的覆盖,得到消除重叠覆盖的eos边集eos*(e);

步骤4):计算边e的视觉混杂程度指标eod,其eod为其中|·|为求集合元素个数操作,vp,vq分别为边e的两个端点。

所述的方法,所述步骤1)中,将动态网络描述成一个有向图g=(v,e)包括以下步骤:

步骤1.1)根据动态网络原始数据中出现的所有节点记录,构建一个节点集合v;

步骤1.2)根据步骤1.1)中的节点集合v,以及动态网络原始数据中任意节点间边的出现时间集合t,构建边集合e,边以两个节点作为端点,故该边集合e中的元素表示为(vi,vj,t),vi和vj分别表示这条边的两个端点,t表示这条边出现的时间。

所述的方法,所述步骤1)中,计算边e在横轴上的中心位置hp(e)为:

wmsv表示msv中绘制整个采样区域的宽度,即时间轴长度,tmin和tmax表示绘制在msv中动态网络的开始和结束时间,te为边e的出现时间。

所述的方法,所述步骤1)中,ipa的计算包括以下步骤:

步骤1.3)采用以下公式计算边e的不可区分的像素距离:

其中,weage表示绘制边edge的宽度,ceil()为向上取整函数,ρ为调节ipd大小的用户自定义参数,取不小于1的整数;

步骤1.4)边e的ipa为以其所在的x轴位置为中心,向左右各扩展ipd个像素形成的矩形区域,该矩形区域的高为msv画布的高度hmsv,宽度以如下区间表示:[hp(e)-ipd,hp(e)+ipd]。

所述的方法,所述步骤2)中,找出边e的交错边的步骤为:

根据边e的ipa中其他边的顶点与边e的顶点的关系来确定交错边,交错边为满足(vpbegin(e)<vpbegin(ei)<vpend(e)),或者同时满足(vpbegin(e)<vpend(ei)<vpend(e))、(vpbegin(ei)<vpbegin(e)<vpend(ei))和(vpbegin(ei)<vpend(e))的边,其中vpbegin()为起始节点,vpend()为终点节点,ei为其它边。

所述的方法,所述步骤3)中,设边e的两个节点分别是vi和vj。则所述的集合ed(e)表示为ed(e)={(vi,vi+1),(vi+1,vi+2),...,(vi+n,vj)},其中节点vi+1,vi+2,...,vi+n是位于节点vi和vj之间的所有节点,并且vi,vi+1,vi+2,...,vi+n,vj在msv纵轴方向上的位置逐渐变高。

所述的方法,所述步骤3)中,利用并集操作消除重叠的覆盖是:

对于节点为(vi,vj)的边e,其消除重叠覆盖的eos边集为eos*(e)=ed(ei1)∪ed(ei2)∪...∪ed(ein),其中ei1,ei2,...,ein∈eos(vi,vj,e)。

;本发明提供了一种量化评价msv的边级视觉混杂程度指标,首先获取msv中的任意一条边e作为关注边,确定其中心位置,并计算其不可区分的像素距离值,对边e的中心位置向左右方向分别扩展该像素距离的宽度,形成一个矩形区域,即不可区分的像素区域;然后将该像素区域中的其他边与边e的顶点进行比较,将与边e交错的边加入交错边集合;对交错边集合按节点顺序进行分解,得到若干等距且相邻的节点对集合,利用集合并操作消除重叠覆盖,得到消除重叠覆盖的交错边集合;根据消除覆盖的交错边集合与节点对集合计算边e的视觉混杂程度指标。该指标对msv中的边的视觉混杂程度进行了定量评价,有助于为后续边采样工作提供可靠依据,进而有助于减少msv中的数据额混杂程度,提高msv的可读性。

附图说明

图1为本发明实施的流程图;

图2为ipa和eod的说明图;

图3为原始未采样的动态网络的msv视图;

图4为结合本发明指标进行采样后的msv视图。

具体实施方式

为使本发明的目的、设计思路和优点更加清楚,以下结合具体实例,并参照附图,对本发明作进一步详细说明。

本发明提供了一种量化评价msv的边级视觉混杂程度指标,如图1所示,包括以下四个主要步骤:

步骤1):获取动态网络数据,图2所示的说明样例为一个包含5个节点,19条边的动态网络数据;图3、4所示的实际应用案例的动态网络数据是由安然公司提供的从1999年到2002年150名员工之间的通信邮件,该数据为150个员工在此期间的24705条通信记录。即该动态网络中存在150个节点,24705条边。根据流式模型的定义,将动态网络描述成一个有向图g=(v,e),v表示动态网络的节点集,表示该动态网络的边集,(vi,vj,t)表示该边集中的一条边,在每条边中分别指定了两个端点vi,vj及该条边出现的时间t。直接对说明样例和未采样处理的数据集用msv可视化技术展现,得到效果图如图2、3。

步骤2):对其中任意边e计算其不可区分的像素区域ipa,其具体方法如下:(1)计算边e关于横轴的中心位置:

wmsv表示msv中绘制整个采样区域(时间轴)的像素宽度,tmin和tmax为绘制在msv中的动态网络开始和结束时间,te为边e的出现时间。(2)利用计算出该条边的不可区分的像素距离(在这个范围内,用户不能完全区分两个不同边)。weage表示绘制一条边的像素宽度,ceil()为向上取整函数,ρ(ρ≥1)为一个整数,是调节ipd大小的用户自定义参数,通常取值为1。(3)边e的ipa为以其所在的x轴位置为中心,向左右各扩展ipd个像素,形成的一个矩形区域。该矩形区域的高为msv视图的高度hmsv,宽度为[hp(e)-ipd,hp(e)+ipd]。如图2所示,边e1出现在时刻t1,将t1时刻作为中心,并向左右扩展一个ipd像素的宽度来获得e1的ipa。

步骤3):定义以屏幕左上角为坐标系原点,节点位置在纵轴上固定不变,且边e起始节点vpbegin(e)的位置总是低于终点节点vpend(e)的位置,并判断边e与其ipa范围内其他边的关系,根据ipa中其他边的顶点与边e的顶点在纵轴方向的关系,将这些边分为三类:分离边,同类边,交错边。若边e与其他边关系为重叠,则将该交错边加入边e的交错边集合eos,边e的eos为

eos(e)={ei|((vpbegin(e)<vpbegin(ei)<

vpend(e))0r(vpbegin(e)<vpbend(ei)<

vpend(e)))∪(vpbegin(ei)<vpbegin(e)andvpbend(ei)<vpend(e))}。如图2所示,边e1的ipa中有三条边:eae、eab和ebd,其中eae是交错边,eab是分离边,ebd是同类边。同理,e2的ipa中有两条边,其中ecd和eac都是交错边,将交错边加入交错边集合,则有eos(e1)为{eae,eos(e2)为{eac,ecd}。

步骤4):将边e的eos边集中的边按照节点顺序进行分解,得到若干个等距且直接相邻的节点对组成的集合ed(e),ed(e)={(vi,vi+1),(vi+1,vi+2),...,(vi+n,vj)},公式中节点vi+1,vi+2,...,vi+n是位于节点vi和vj之间的所有节点,并且vi,vi+1,vi+2,...,vi+n,vj在msv纵轴方向上的位置逐渐增高。之后,利用集合并操作,消除重叠的覆盖,即对于节点组合为(vi,vj)的边e,其消除重叠覆盖的eos边集为eos*(e)=ed(ei1)∪ed(ei2)∪...∪ed(ein),其中ei1,ei2,...,ein∈eos(vi,vj,e)。如图2所示,边e3的顶点坐标为(b,d),则边e3可被分解为{(b,c),(c,d)}(c位于b和d之间)。并且,边e3的eos边集的所有边分解为{(b,c)}和{(a,b),(b,c)},通过集合的并操作,获得消除叠加覆盖的eos边集{(a,b),(b,c)}。

步骤5):计算节点组合为(vi,vj)的边e的视觉混杂程度指标eod,其具体方法如下:(1)利用边分解和集合的交并操作求出边e的eos边集里的边对边e的覆盖程度。(2)计算边e的eod指标:

计算得到边e的边级视觉混杂程度指标(eod的取值范围在0~1,0表示其eos边集为空集,即没有边对其造成覆盖;1表示其eos边集里的边对其造成了完全覆盖)。如图2,e1的eos边集仅含eae,而e1在竖直方向上完全与eae共线,也就是e1在视觉上会完全被eae覆盖,因此e1的eod计算为1。对于e2,它的eos边集包含两条边eac和ecd,边e2的上半部与eac在竖直方向上共线,边e2的下半部与ecd在竖直方向上共线,因为eac和ecd各自覆盖了e2长度的一半,所以e2的eod为1。对于e3,它的eos边集包含边eac和ebc,边eac和ebc都覆盖了e3的上半部,因此e3只有一半的长度被eos边集覆盖,e3的eod为0.5。

步骤6)遍历动态网络中的所有边(节点对),重复2、3、4、5步骤,最终获得动态网络中所有边的eos指标。对安然公司提供的实际案例的动态网络数据集进行eos指标计算,重新采样后得到效果图如图4。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1