一种基于数据场的Web节点排序方法

文档序号:6499603阅读:420来源:国知局
一种基于数据场的Web节点排序方法
【专利摘要】本发明涉及基于数据场的Web节点排序方法。本发明的基于数据场的Web节点排序方法包括:映射步骤,将Web网络映射到二维空间中并且将Web网络中的每个目标页面节点作为具有一定质量的粒子;场势计算步骤,计算所述每个节点的场势大小;排序步骤,根据所述计算步骤得到的每个节点的场势进行排序。利用本发明的方法,能够将网络中的每个节点对其周边节点的影响力映射成数据场,通过计算所有节点的场势,获得社区内场势的变化规律,从而发现社区结构,由此能够准确定位Web页面的重要性以及节点间关系,能够便于发现并处理目标网页,对网络信息处理有较大的帮助。
【专利说明】一种基于数据场的Web节点排序方法
【技术领域】
[0001]本发明涉及网络信息处理方法,具体地涉及给予数据场的Web节点排序方法。
【背景技术】
[0002]Web网络由于数据量巨大,数据无序,变化较快,现有技术中,社区发现方法虽然性能优越,但不适合Web网络的特征。而目前的网页排序方法多适用于在搜索引擎结果排序,不能准确定位节点及节点在其社区中的重要性,不利于发现目标网页并对其进行深入处理。目前的网页排序方法虽然能够对网页的重要性作出一种的评估,但不能准确定位Web页面在社区中的位置。而在一些应用场景下,需要准确定位网页在所在Web社区中的位置,以便进行进一步处理。如在对Web银行卡营销信息搜索处理过程中,需要分析网页在其所在Web网页簇中的地位及影响性,并以此为依据,对其进行分析,获得有效信息。而之前的网页排序方法难于适应于此类场景。
[0003]

【发明内容】

[0004]鉴于上述问题,本发明旨在提供一种能够便于发现并处理目标网页、对挖掘有用信息提供可能的基于数据场的Web节点排序方法。
[0005]本发明的基于数据场的Web节点排序方法,其特征在于,包括:
映射步骤,将Web网络映射到二维空间中并且将Web网络中的每个目标页面节点作为具有一定质量的粒子;
场势计算步骤,计算所述每个节点的场势大小;
排序步骤,根据所述计算步骤得到的每个节点的场势进行排序。
[0006]优选地,所述计算步骤包括下述子步骤:
步骤(1),根据场势函数,计算所有节点处的场势并同时记录具有局部最高场势的节
占.步骤(2),合并一定范围内局部最高场势节点并作为簇的代表节点;
步骤(3),从所述代表节点出发,在该代表节点区域内可达范围内,按场势降低的方向进行节点的遍历并判断是否将节点加入到节点簇内;
步骤(4),对每加入一个节点均需判断规定条件,若满足规定条件,则跳过当前节点; 步骤(5),合并符合一定条件的已有的节点簇。
[0007]优选地,在所述步骤(3)中包括下述步骤:
1若与代表节点间的距离为1,则直接将该节点加入到社区中;
4若与代表节点间的距离大于1,则计算式其节点簇的场势和,若符合条件,将该节点加入到社区中,并标记该节点,否则不加入该节点;
W若节点P对多个簇内的代表节点均是领域内可达的,则分别计算两个簇在访节点处的场势,将节点P划归为在该处有较高场势的簇,并将节点P标记为边界节点。
[0008]优选地,所述步骤(4)中的规定条件包括:
中该节点的加入不会使社区内的节点连接小于与非社区内节点的连接数;
A从代表节点到当前节点的距离大于某临界值; α:>碰见边界节点;
Φ若在遍历的过程中碰见已经标记的节点,则不做处理,跳过对该节点的处理。
[0009]优选地,在所述步骤(5)中的合并符合下述两个条件的节点簇:
由边界节点相连;以及
两个簇合并后满足式下式(I):
【权利要求】
1.一种基于数据场的Web节点排序方法,其特征在于,包括: 映射步骤,将Web网络映射到二维空间中并且将Web网络中的每个目标页面节点作为具有一定质量的粒子; 场势计算步骤,计算所述每个节点的场势大小; 排序步骤,根据所述计算步骤得到的每个节点的场势进行排序。
2.如权利要求1所述的基于数据场的Web节点排序方法,其特征在于, 所述计算步骤包括下述子步骤: 步骤(1),根据场势函数,计算所有节点处的场势并同时记录具有局部最高场势的节占.步骤(2),合并一定范围内局部最高场势节点并作为簇的代表节点; 步骤(3),从所述代表节点出发,在该代表节点区域内可达范围内,按场势降低的方向进行节点的遍历并判断是否将节点加入到节点簇内; 步骤(4),对每加入一个节点均需判断规定条件,若满足规定条件,则跳过当前节点; 步骤(5),合并符合一定条件的已有的节点簇。
3.如权利要求2所述的基于数据场的Web节点排序方法,其特征在于, 在所述步骤(3)中包括下述步骤: ?若与代表节点间的距离为I,则直接将该节点加入到社区中; @若与代表节点间的距离大于1,则计算式其节点簇的场势和,若符合条件,将该节点加入到社区中,并标记该节点,否则不加入该节点; @若节点P对多个簇内的代表节点均是领域内可达的,则分别计算两个簇在访节点处的场势,将节点P划归为在该处有较高场势的簇,并将节点P标记为边界节点。
4.如权利要求2所述的基于数据场的Web节点排序方法,其特征在于, 所述步骤(4)中的规定条件包括: ?该节点的加入不会使社区内的节点连接小于与非社区内节点的连接数; ?从代表节点到当前节点的距离大于某临界值; @碰见边界节点; @若在遍历的过程中碰见已经标记的节点,则不做处理,跳过对该节点的处理。
5.如权利要求2所述的基于数据场的Web节点排序方法,其特征在于, 在所述步骤(5)中合并符合下述两个条件的节点簇: 由边界节点相连;以及 两个簇合并后满足式下式(I):
6.如权利要求3所述的基于数据场的Web节点排序方法,其特征在于, 所述场势函数如下:假设网络G= (V,E),其中F =...1.V? }为节点的非空有限极限集,为节点偶对或边的集合,Pl = ?,任意节点he的场势可以表示为: 假设给定Web网络σ={ ,£),其中,F = Kv2,...,^为节点的非空有限集,E为节点偶对或边的集合,任意节点V e F的场势可表示为:
7.如权利要求3所述的基于数据场的Web节点排序方法,其特征在于, 所述粒子是在其周边存在一个环球对称的虚拟数据场并且所述目标页面节点位于场的中间,场中的其他节点均受到所述目标节点生成的数据场的影响。
8.如权利要求3所述的基于数据场的Web节点排序方法,其特征在于, 在所述排序步骤中,通过将节点依照场势排序,从而获得的节点的重要程度以及在Web社区即页面节点的聚集中的定位。
【文档编号】G06F17/30GK103970772SQ201310035237
【公开日】2014年8月6日 申请日期:2013年1月30日 优先权日:2013年1月30日
【发明者】赵启飞, 黄河 申请人:中国银联股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1