一种基于度特征替换策略的流式图抽样方法_2

文档序号:9288420阅读:来源:国知局
换;
[0039] b)若uGVs,vg'P;,如果现有点的个数|Vs| <n,则不发生替换;否贝1J,点v需要 添加到Vs*并且替换掉一个现有的点;
[0040] C)若如果现有点的个数|vs| <n-l,则不发生替换;否则,u,v都需 要添加到Vs中并发生一次或两次替换。
[0041] S2.根据抽样子图Gs中点的度特性,确定点替换概率函数f^),D。根据概 率函数计算点Vi被替换的概率Pvi=f(dvi),其中dvi是点v;的度,得到子图中点替换概率 集合
[0042] 为了减少度高的点的频繁替换导致抽样子图的抖动,为度较高的点分配较小的替 换概率,即函数以山)在作用域[l,d_]内单调递减,其中(1_为度分布集合中最高的度数。 以山)可以是反比例函数,也可以是递减的指数函数等。
[0043] S3.采用遗传算法中的选择算法select(P) (P为S2中计算得到的点替换概率集 合),选取待替换的点r。选择算法select(P)的原则是:使得替换概率高的点被选择的概 率大,select(P)可以是遗传算法中的轮盘赌选择算法,也可以是比例选择算法等。
[0044] S4.根据替换原则,判断S3选择的点r是否符合要求,若符合,则转至S5 ;否则,转 至S3。
[0045] 替换原则如下:
[0046] a)上述S1的b)情况下,在选择替换点时,不能选择新增边中的点,并且在后续的 孤立点删除时也不能删除新增边中的点;
[0047] b)上述S1的c)情况下,假设先添加u,再添加V。在添加u时,Vs中没有与其相 关联的点,所以发生的替换并没有限制。后面在添加v时,由于Vs中存在与其相连的点u, 所以替换出的点不能为u。在这种情况下,第一个新增点在替换时没有限制,第二新增点在 替换时不能替换刚新增的第一个点,并且在后续的孤立点删除时也不能删除刚新增的第一 个点。
[0048] S5.从1中删除r,从删除与r相关联的边。
[0049] S6.从1中删除独立点。
[0050] S7.把新增点和边e加入子图Gs中。
[0051] 下面以图2,图3为例,说明本发明方法的实施过程。图2为流式到达的边,图3为 抽样过程中暂存子图的点、边集合示意图,令目标子图点集大小n= 4,在算法初始化时,将 VJPE3设置为空,具体包括以下步骤:
[0052]步骤1 :前三条边(nl,n5),(n6,n2),(nl,n2)的到达都不会发生点替换,依次将点 和边加入子图集合中。当读取边(n2,n4)时,此时点的个数达到集合大小的上限4,且出现 新节点n4,故需要进行点替换;
[0053] 步骤2 :选定/ (4 ) =I为替换函数,人为比例系数,则点V;的替换概率为 ? / 爲=/(今)=^。那么此时,111、115、116、112的度分别为2、1、2、1,根据芝>,,;=1计算得到 1 1 iill] 义二。得到子图中点nl、n5、n6、n2替换概率为自
[0054] 步骤3 :采用轮盘赌选择算法,图4为本发明实施例提供的轮盘赌概率分布示意 图,接下来的随机选择是在圆盘上随机选择一个点,这个点落在的区域对应的点即为被替 换的点;
[0055] 步骤4 :假设根据这一选择算法得到的被替换点为n2,根据本发明方法的替换原 贝1J,被替换的点不能为当前处理边中的点,那么就会按照选择算法重新随机选择一次,直到 选择的点不在当前处理边的两端点中。再假设最终选择了满足要求的替换点为nl;
[0056] 步骤5 :根据替换规则,在V#删除点nl的同时,要删除Es中与nl相关联的边 (nl,n2)和(nl,n5);
[0057] 步骤6 :在这两条边被删除后,产生了一个孤立点n5,它也会从、中被删除;
[0058] 步骤7 :添加新增的节点n2和新增边(n2,n4)到子图中。
[0059] 本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以 限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含 在本发明的保护范围之内。
【主权项】
1. 一种基于度特征替换策略的流式图抽样方法,其特征在于,所述方法包括如下步 骤:51. 流式边e= (u,v)到达,判断是否会产生点替换,如果会发生点替换,则执行S2,否 则执行S7 ;52. 根据抽样子图氏中点的度特性,确定点替换概率函数f(di),diGD;根据概率函数 计算点Vi被替换的概率馬=/的,),得到子图中点替换概率集合f=诉I,取,…,的},其中 店^是点V;的度,且j由样子图为Gs=(VS,Es),Vs={v1,V2,. . .,V。}为子图的点集 合,Vi(l《i《n)为抽样子图中的点,且点集大小|V」=n化={e1,62,. . .,e"J为子图的 边集合,e,(l《j《m)为抽样子图中的边;D= {di,d2,. . .,cU为点集合中点的度分布;53. 采用遗传算法中的选择算法select(P),其中P为S2中计算得到的点替换概率集 合,选取待替换的点r;54. 根据替换原则,判断S3选择的点r是否符合要求,若符合则转至S5 ;否则转至S3 ;55. 从Vs中删除r,从Es中删除与r相关联的边;56. 从V,中删除独立点;57. 把新增点和边e加入子图Gs中。2. 如权利要求1所述的方法,其特征在于,所述步骤S1中判断是否会产生点替换的依 据如下: a) 若UEYs,vEYs,不会引起Vs添加新点,不发生替换; b) 若UGVwv€K,如果现有点的个数IV」<n,则不发生替换;否贝1J,点V需要添加 到Vs中并且替换掉一个现有的点; C)若如果现有点的个数IV」<n-l,则不发生替换;否则,u,v都需要添 加到V.中并发生一次或两次替换。3. 如权利要求1或2所述的方法,其特征在于,所述步骤S2中确定点替换概率函数 f化)的原则为: 为度较高的点分配较小的替换概率,即函数f(di)在作用域[l,dmJ内单调递减,其中 屯。、为度分布集合中最高的度数。4. 如权利要求1或2所述的方法,其特征在于,所述f(d1)是反比例函数,或者是递减 的指数函数。5. 如权利要求1或2所述的方法,其特征在于,所述步骤S3中选择算法select(P)的 原则是:使得替换概率高的点被选择的概率大。6. 如权利要求1或2所述的方法,其特征在于,所述选择算法select(巧是遗传算法中 的轮盘赌选择算法,或者是比例选择算法。7. 如权利要求2所述的方法,其特征在于,所述步骤S4中的替换原则如下: a) 上述S1的b)情况下,在选择替换点时,不能选择新增边中的点,并且在后续的孤立 点删除时也不能删除新增边中的点; b) 上述S1的C)情况下,假设先添加U,再添加V;在添加U时,V,中没有与其相关联的 点,所W发生的替换并没有限制;后面在添加V时,由于Vg中存在与其相连的点U,所W替换 出的点不能为U;在运种情况下,第一个新增点在替换时没有限制,第二新增点在替换时不 能替换刚新增的第一个点,并且在后续的孤立点删除时也不能删除刚新增的第一个点。
【专利摘要】本发明属于流式图数据抽样领域,尤其涉及一种度特征替换策略的抽样方法。包括:S1.流式边e=(u,v)到达,判断是否会产生点替换,如果会发生点替换,则执行S2,否则执行S7;S2.根据抽样子图Gs中点的度特性,确定点替换概率函数f(di),di∈D,D为子图中点的度分布集合;根据概率函数计算点vi被替换的概率得到子图中点替换概率集合S3.采用遗传算法中的选择算法select(P),其中P为S2中计算得到的点替换概率集合,选取待替换的点r;S4.根据替换原则,判断S3选择的点r是否符合要求,若符合则转至S5;否则转至S3;S5.从Vs中删除r,从Es中删除与r相关联的边;S6.从Vs中删除独立点;S7.把新增点和边e加入子图Gs中。本发明方法得到的抽样子图与原图的特性相似度高。
【IPC分类】G06F17/30
【公开号】CN105005586
【申请号】CN201510354896
【发明人】施展, 冯丹, 余静, 韩江, 郭鹏飞, 黄力, 鲍匡迪, 欧阳梦云
【申请人】华中科技大学
【公开日】2015年10月28日
【申请日】2015年6月24日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1