网页数据查询、建立网页跳转路径数据库的方法及装置的制造方法

文档序号:10624775阅读:513来源:国知局
网页数据查询、建立网页跳转路径数据库的方法及装置的制造方法
【专利摘要】本申请实施例公开了网页数据查询、建立网页跳转路径数据库的方法及装置,其中一网页数据查询方法包括:提供第一数据库,所述第一数据库中保存有预先收集到的网页跳转路径的统计信息;其中,所述网页跳转路径以被访问网页作为节点,并根据被访问网页网址中包含的来源信息,将相关的节点进行串联;所述网页跳转路径的统计数据包括各条网页跳转路径的出现次数、各网页跳转路径的起始节点以及所述起始节点在作为流量来源时所属的类型;接收与流量来源类型相关的查询请求;根据所述第一数据库中保存的信息,提供查询结果。通过本申请实施例,能够为网页运营人员从整体上掌握网页的流量情况提供依据,提高资源的投放效率。
【专利说明】
网页数据查询、建立网页跳转路径数据库的方法及装置
技术领域
[0001] 本申请设及网页流量信息处理技术领域,特别是设及网页数据查询、建立网页跳 转路径数据库的方法及装置。
【背景技术】
[0002] 随着计算机网络的日益普及W及相关技术的飞速发展,网站W及网页数量都已经 非常巨大,对于网页提供者而言,获得尽可能多的用户访问流量,是其追求的目标。为此,在 各种网页中,网页超链接技术几乎无处不在,并且,按照链接路径的不同,网页中的超链接 一般可W分为内部链接、外部链接等等,总之,超链接技术可W使得网页与网页之间可W建 立起错综复杂的连接关系,对于同一目标网页,用户一般可W通过多种途径进行访问。
[0003] 例如,最基本的途径可W是直接在浏览器的地址栏输入网页的网址。或者,网页提 供者可W通过内部链接的形式,在内部网站的首页等位置添加具体网页的链接,运样,用户 可W通过运种内部链接进行访问。例如,在电子商务平台网站的首页可W添加各种店铺页 面的链接,或者各具体业务对象页面的链接等等。再或者,网页提供者还可W通过外部链接 的,将网页地址添加到其他外部网站的页面中,例如,对于某电子商务平台中某店铺页面, 可W在一些口户类的网页(例如,新闻口户网站的网页等)中投放其链接,用户在访问口户 类网页的过程中,就可W通过点击该链接的方式,进入到该店铺页面,或者,还可W在一些 导航类的网页中投放其链接,用户在打开该导航类网页之后,通过点击对应的链接,同样可 W进入到该店铺页面,等等。
[0004] 总之,多种访问途径使得一个网页可W通过多种方式来获得用户的访问流量,但 是,对于网页提供者而言,往往还需要对网页流量进行分析,W便对网页链接的投放方式等 进行调整,W进一步优化其网页的用户访问流量,提高资源的投放效率。然而,实际应用中 的网页链接情况错综复杂,因此,如何提供网页的流量信息,使得网页提供方能够快速了解 网页的流量情况,进而对其链接投放方向等进行有效的调整,成为迫切需要本领域技术人 员解决的技术问题。

【发明内容】
阳〇化]本申请提供了提供网页流量统计信息的方法及装置,能够为网页运营人员从整体 上掌握网页的流量情况提供依据,进而可W据此对其链接投放方向等进行有效的调整,W 提高资源的投放效率。
[0006] 本申请提供了如下方案:
[0007] 一种网页数据查询方法,包括:
[0008] 提供第一数据库,所述第一数据库中保存有预先收集到的网页跳转路径的统计信 息;其中,所述网页跳转路径W被访问网页作为节点,并根据被访问网页网址中包含的来源 信息,将相关的节点进行串联;所述网页跳转路径的统计数据包括各条网页跳转路径的出 现次数、各网页跳转路径的起始节点W及所述起始节点在作为流量来源时所属的类型;
[0009] 接收与流量来源类型相关的查询请求;
[0010] 根据所述第一数据库中保存的信息,提供查询结果。
[0011] 一种建立网页跳转路径数据库的方法,包括:
[0012] 收集与预置站点的网页访问相关的信息;
[0013] 将被访问网页作为节点,并根据被访问网页网址中包含的来源信息,将相关的节 点进行串联,生成多条网页跳转路径,并统计各条网页跳转路径的出现次数;其中,关于各 网页跳转路径的起始节点,根据起始节点的网址中包含的域名信息,确定所述起始节点在 作为流量来源时所属的类型;
[0014] 根据各条网页跳转路径及其出现次数,W及各个起始节点的流量来源类型信息, 生成第一数据库。
[0015] 一种网页数据查询方法,包括:
[0016] 提供第二数据库,所述第二数据库中保存有预先收集到的网页跳转路径的统计信 息;其中,所述网页跳转路径W被访问网页作为节点,并根据被访问网页网址中包含的来源 信息,将相关的节点进行串联;
[0017] 接收第Ξ查询请求,所述第Ξ查询请求用于查看指定网页的来源W及去向详细信 息;
[0018] 查询所述第二数据库,确定包含所述指定网页的各条第Ξ目标网页跳转路径;
[0019] 根据所述指定网页在各条第Ξ目标网页跳转路径中所处的位置,确定所述指定网 页的一跳或多跳来源节点、一跳或多跳去向节点W及各跳节点之间的跳转关系;
[0020] 根据所述一跳或多跳来源节点、一跳或多跳去向节点W及各跳节点之间的跳转关 系,返回所述来源W及去向详细信息。
[0021] 一种建立网页跳转路径数据库的方法,包括:
[0022] 收集与预置站点的网页访问相关的信息;
[0023] 将被访问网页作为节点,并根据被访问网页网址中包含的来源信息,将相关的节 点进行串联,生成多条网页跳转路径,并统计各条网页跳转路径的出现次数;
[0024] 根据各条网页跳转路径及其出现次数,生成第二数据库。
[00巧]一种网页数据查询方法,包括:
[00%] 提供第Ξ数据库,所述第Ξ数据库中保存有预先收集到的网页跳转路径的统计信 息;其中,所述网页跳转路径W被访问网页作为节点,并根据被访问网页网址中包含的来源 信息,将相关的节点进行串联;所述网页跳转路径的统计信息包括:各节点所具有的预置 特性;
[0027] 接收与节点特性相关的查询请求;
[0028] 根据所述第Ξ数据库中保存的信息,提供查询结果。
[0029] 一种建立网页跳转路径数据库的方法,包括:
[0030] 收集与预置站点的网页访问相关的信息;
[0031] 将被访问网页作为节点,并根据被访问网页网址中包含的来源信息,将相关的节 点进行串联,生成多条网页跳转路径,并统计各条网页跳转路径的出现次数;其中,关于各 网页跳转路径上的各节点,根据网址中包含的属性信息,确定各节点所具有的预置特性;
[0032] 根据各条网页跳转路径及其出现次数,W及各个节点所具有的特性信息,生成第 Ξ数据库。
[0033] 一种网页数据查询装置,包括:
[0034] 第一数据库提供单元,用于提供第一数据库,所述第一数据库中保存有预先收集 到的网页跳转路径的统计信息;其中,所述网页跳转路径W被访问网页作为节点,并根据被 访问网页网址中包含的来源信息,将相关的节点进行串联;所述网页跳转路径的统计数据 包括各条网页跳转路径的出现次数、各网页跳转路径的起始节点W及所述起始节点在作为 流量来源时所属的类型;
[0035] 类型查询请求接收单元,用于接收与流量来源类型相关的查询请求;
[0036] 类型查询结果提供单元,用于根据所述第一数据库中保存的信息,提供查询结果。
[0037] 一种建立网页跳转路径数据库的装置,包括:
[0038] 第一收集单元,用于收集与预置站点的网页访问相关的信息;
[0039] 第一统计单元,用于将被访问网页作为节点,并根据被访问网页网址中包含的来 源信息,将相关的节点进行串联,生成多条网页跳转路径,并统计各条网页跳转路径的出现 次数;其中,关于各网页跳转路径的起始节点,根据起始节点的网址中包含的域名信息,确 定所述起始节点在作为流量来源时所属的类型; W40] 第一生成单元,用于根据各条网页跳转路径及其出现次数,W及各个起始节点的 流量来源类型信息,生成第一数据库。
[0041] 一种网页数据查询装置,包括:
[0042] 第二数据库提供单元,用于提供第二数据库,所述第二数据库中保存有预先收集 到的网页跳转路径的统计信息;其中,所述网页跳转路径W被访问网页作为节点,并根据被 访问网页网址中包含的来源信息,将相关的节点进行串联;
[0043] 来源去向查询请求接收单元,用于接收第Ξ查询请求,所述第Ξ查询请求用于查 看指定网页的来源W及去向详细信息;
[0044] 数据库查询单元,用于查询所述第二数据库,确定包含所述指定网页的各条第Ξ 目标网页跳转路径;
[0045] 跳转关系确定单元,用于根据所述指定网页在各条第Ξ目标网页跳转路径中所处 的位置,确定所述指定网页的一跳或多跳来源节点、一跳或多跳去向节点W及各跳节点之 间的跳转关系;
[0046] 返回单元,用于根据所述一跳或多跳来源节点、一跳或多跳去向节点W及各跳节 点之间的跳转关系,返回所述来源W及去向详细信息。
[0047] 一种建立网页跳转路径数据库的装置,包括:
[0048] 第二收集单元,用于收集与预置站点的网页访问相关的信息;
[0049] 第二统计单元,用于将被访问网页作为节点,并根据被访问网页网址中包含的来 源信息,将相关的节点进行串联,生成多条网页跳转路径,并统计各条网页跳转路径的出现 次数;
[0050] 第二生成单元,用于根据各条网页跳转路径及其出现次数,生成第二数据库。
[0051] 一种网页数据查询装置,包括:
[0052] 第Ξ数据库提供单元,用于提供第Ξ数据库,所述第Ξ数据库中保存有预先收集 到的网页跳转路径的统计信息;其中,所述网页跳转路径W被访问网页作为节点,并根据被 访问网页网址中包含的来源信息,将相关的节点进行串联;所述网页跳转路径的统计信息 包括:各节点所具有的预置特性;
[0053] 特性查询请求接收单元,用于接收与节点特性相关的查询请求;
[0054] 特性查询结果提供单元,用于根据所述第Ξ数据库中保存的信息,提供查询结果。 阳化5] -种建立网页跳转路径数据库的装置,包括:
[0056] 第Ξ收集单元,用于收集与预置站点的网页访问相关的信息;
[0057] 第Ξ统计单元,用于将被访问网页作为节点,并根据被访问网页网址中包含的来 源信息,将相关的节点进行串联,生成多条网页跳转路径,并统计各条网页跳转路径的出现 次数;其中,关于各网页跳转路径上的各节点,根据网址中包含的属性信息,确定各节点所 具有的预置特性;
[0058] 第Ξ生成单元,用于根据各条网页跳转路径及其出现次数,W及各个节点所具有 的特性信息,生成第Ξ数据库
[0059] 根据本申请提供的具体实施例,本申请公开了 W下技术效果: W60] 通过本申请实施例,能够根据用户访问网页过程中产生的日志,建立网页跳转路 径信息数据库,并对各条路径和/或节点上的数据进行统计及实时更新,在此过程中,就可 W接收查询流量统计信息的请求,并根据数据库中记录的数据,提供具体的流量统计信息 结果。运样,可W从整体上提供某指定网页的流量统计等信息,从而为网页运营人员从整体 上掌握网页的流量情况提供了依据,进而可W据此对其链接投放方向等进行有效的调整, W便于更有效的利用网络资源,避免资源浪费或者利用不足。
[0061] 当然,实施本申请的任一产品并不一定需要同时达到W上所述的所有优点。
【附图说明】
[0062] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施 例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可W根据运些附图获 得其他的附图。
[0063] 图1是本申请实施例提供的第一方法的流程图; W64] 图2是本申请实施例提供的第二方法的流程图; W65] 图3-1是本申请实施例提供的第一视图的示意图;
[0066] 图3-2是本申请实施例提供的第二视图的示意图;
[0067] 图4是本申请实施例提供的第Ξ方法的流程图;
[0068] 图5是本申请实施例提供的第四方法的流程图; W例图6-1是本申请实施例提供的第二视图的不意图;
[0070] 图6-2是本申请实施例提供的第四视图的示意图;
[0071] 图7是本申请实施例提供的第五方法的流程图;
[0072] 图8是本申请实施例提供的第六方法的流程图;
[0073] 图9是本申请实施例提供的第五视图的示意图;
[0074] 图10是本申请实施例提供的第一装置的示意图;
[0075] 图11是本申请实施例提供的第二装置的示意图;
[0076] 图12是本申请实施例提供的第Ξ装置的示意图;
[0077] 图13是本申请实施例提供的第四装置的示意图;
[007引图14是本申请实施例提供的第五装置的示意图;
[0079] 图15是本申请实施例提供的第六装置的示意图。
【具体实施方式】
[0080] 下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于 本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的 范围。
[0081] 在本申请实施例中,为了便于查询网页访问相关的数据,可W首先对各个用户的 网页访问日志进行收集,通过对运种日志信息,生成网页跳转路径信息数据库,该数据库中 记录有各种基于用户的操作生成的网页跳转路径,W及各条路径W及节点上的统计数据, 进而可W依据该数据库,提供全面的流量统计信息。下面对具体的实现方式进行详细介绍。 阳0間实施例一
[0083] 在该实施例一中,可W查询与流量来源类型相关的信息,运种流量来源类型相关 的信息可W是从整体上对一个网页的各种来源的流量情况进行统计,或者,还可W统计某 个类型的流量来源向各个网页的流向情况。例如,某网页共有A、B、CS个来源,则可W分别 统计出运Ξ个来源分别的流量是多少,进而,网页运营人员等可此作为参考,调整网页 链接的投放策略等等。
[0084] 为此,参见图1,本申请实施例一首先提供了一种建立网页跳转路径数据库的方 法,该方法可W包括W下步骤:
[00化]S101 :收集与预置站点的网页访问相关的信息;
[0086] 为了建立网页跳转路径信息数据库,可W对广大用户的网页访问信息进行收集。 当然,在本申请实施例中,可W仅收集与预置站点的网页相关的访问信息,例如,假设预置 站点为"淘宝"的页面W及"天猫"的页面,则可W仅收集与"淘宝"W及"天猫"运两个站点 相关的页面的访问信息。例如,假设某用户打开浏览器之后,首先通过浏览器打开某导航页 面,在导航页面内点击某口户网站(例如,新浪、捜狐等)的链接,在该口户网站的首页上点 击相关的链接进入了淘宝网站的某一网页,之后将该淘宝的网页关闭,则在收集用户的访 问信息时,可W仅收集用户从该口户网站的首页进入了该淘宝页面运一信息,而关于从导 航页面进入口户网站页面的信息可不再进行记录。
[0087] 具体进行收集时,可W由服务器查询各个用户的历史访问日志,从中进行网页访 问信息的提取及收集。或者,也可W由客户端主动进行提交。例如,客户端可W对用户的网 页访问情况进行监控,当监控到访问了预置站点的网页时,则将相关的访问信息上传到服 务器,运样,服务器可W更加实时的收集到相关的网页访问信息。
[0088] S102:将被访问网页作为节点,并根据被访问网页网址中包含的来源信息,将相关 的节点进行串联,生成多条网页跳转路径,并统计各条网页跳转路径的出现次数;其中,关 于各网页跳转路径的起始节点,根据起始节点的网址中包含的域名信息,确定所述起始节 点在作为流量来源时所属的类型;
[0089] 具体在收集到用户的访问信息之后,可W生成多条网页跳转路径,每条路径上可 W由多个节点组成,每个节点对应一个具体的网页,并且,可W根据被访问网页网址中包含 的来源信息,将各个相关的节点串联起来,从而生成跳转路径,并且还可W统计出每条跳转 路径的出现次数等信息。需要说明的是,在本申请实施例中,用户的访问信息可W是动态收 集的,随着收集到的用户访问信息的增多,该数据库中保存的信息也在实时更新。另外,在 生成各条网页跳转路径的过程中,还可W对各条路径和/或节点上的统计数据进行记录及 更新。需要说明的是,关于统计信息,可W是在一定的时间段内进行统计,例如,可W每天进 行统计,从每天的0点等起始时间开始进行网页跳转路径的生成W及各种信息的统计,并 且可W实时更新。24小时之后,对统计的数据进行清零,重新利用新收集到的数据生成路径 并统计各种数据,W此类推。当然,对于过去统计周期中的统计结果也可W保存,W便进行 数据的比较等。
[0090] 其中,具体在生成各条网页跳转路径时,可W根据被访问网页的网址等包含的信 息进行。例如,如果某网页A是通过点击了在另一网页B中的链接之后打开的,则在该网页 A的U化等网址的refer字段,一般会携带有关于网页B的U化。运样,如果某条访问信息 是某网页A被访问,则通过分析该网页A的U化,则可W获知该网页的上一条来自于网页B, 运样,在生成网页跳转路径时,就可W将网页A与网页B分别作为一个节点,并在运两个节 点之间建立其串联关系,组成一条网页B至网页A的路径。之后,再根据其他的访问信息, 还可W对该路径的上下游进行延伸,总之,通过运种方式,就可W建立多个节点之间的上下 游串联关系,并且可W据此建立一棵或者多棵路径树。
[0091] 关于各条路径的统计数据,主要可W包括各条路径出现的次数等。例如,在生成网 页跳转路径的过程中,如果某条路径在数据库中已经存在,则可W对该路径的出现次数进 行加一处理。
[0092] 另外,如前文所述,ht化请求中的refer字段一般还携带有流量来源信息,因此, 在生成各条跳转路径之后,还可W确定出每条路径的起始节点,并且根据起始节点的U化 中包含的域名等信息,可W确定出起始节点所属的流量来源的类型信息。例如,运种类型信 息可W包括捜索引擎、网站推广(还可W分为站内推广或者站外推广)、内部链接等等。例 如,对于从外部网站引导来的流量,运种流量的访问ht化请求中,http header会有一个字 段refer指明了来源网站地址;如果是非其他网站引导来的流量,运种流量的访问ht化请 求中http header为空,因此,可W区分出来源的类型。
[009引例如,某路径为A-〉B-乂,其中,A为该路径的起始节点,则此时,可W对网页B 的ht化请求进行分析,假设B网页的ht化请求中,ht化header的refer字段包含的U化 为:WWW. bing. com,此时,可W证明该路径的流量来自于站外,并且根据网页A的域名可知, 该域名包含在预置的捜索引擎域名列表中,因此,可W确定出该路径的流量来源类型为捜 索引擎。
[0094] S103 :根据各条网页跳转路径及其出现次数,W及各个起始节点的流量来源类型 信息,生成第一数据库。
[0095] 在确定出各条网页跳转路径及其出现次数,W及各个起始节点的流量来源类型信 息之后,就可W将其保存到第一数据库中。也即,第一数据库中的每个数据条目可W包括W 下信息:网页跳转路径包括的各个节点、网页跳转路径出现的次数、起始节点标识W及起始 节点作为流量来源时所属的流量来源类型。例如,在具体实现时,第一数据库的结构可w如 W下表1所示:
[0096] 表 1
[0097]
[009引在生成了上述第一数据库之后,就可W为用户提供与流量来源类型相关的查询服 务。此时,参见图2,本申请实施例一还提供了一种网页数据查询方法,该方法具体可W包括 W下步骤:
[0099] S201 :提供第一数据库,所述第一数据库中保存有预先收集到的网页跳转路径的 统计信息;其中,所述网页跳转路径W被访问网页作为节点,并根据被访问网页网址中包含 的来源信息,将相关的节点进行串联;所述网页跳转路径的统计数据包括各条网页跳转路 径的出现次数、各网页跳转路径的起始节点W及所述起始节点在作为流量来源时所属的类 型; 阳100] 建立第一数据库的过程在前文中已经介绍,运里不再寶述。 阳101] S202 :接收与流量来源类型相关的查询请求; 阳102] 其中,与流量来源类型相关的查询请求可W有多种,例如,其中一种可W是第一查 询请求,该第一查询请求用于查询指定网页的流量来源类型信息。此时,具体在提供指定网 页的流量来源类型信息时,可W首先查询第一数据库,确定出包含指定网页的各条第一目 标网页跳转路径,然后确定各条第一目标网页跳转路径中起始节点的流量来源类型,W及 各条第一目标网页跳转路径的出现次数,并基于运种类型,对各个来源网页进行归类,对相 同流量来源类型下的第一目标网页跳转路径的出现次数进行汇总,确定各流量来源类型分 别对应的第一目标网页跳转路径的总出现次数,进而可W将各个流量来源类型W及对应的 总出现次数,作为流量来源信息返回。运样,网页运营人员就可W获知其指定的网页有多少 流量来自于捜索引擎,有多少流量来自于网站推广,等等。 阳103] 查询请求的发出者可W是某网站的运营人员等,一个站点中可能包含多个网页, 其可W选择其需要关注的网页,来发出具体的与流量来源类型相关的查询请求。为了便于 用户选择,可W在用户界面中提供下拉列表等,供用户选择可W查看的网页,或者也可W允 许用户通过在指定的输入框输入网页的网址等方式来捜索其需要查看流量信息的网页。 [0104] 例如,假设某网页A为用户指定的网页,则为了提供关于该网页A的流量来源类型 信息,可W首先从数据库中取出包含有该网页A的所有路径,例如其中一共有100条,每条 路径都可W对应有出现次数等统计数据;假设其中有20条路径,是W该网页A作为起始节 点的,则可W来源为直接输入地址访问的流量确定为20 ;剩余80条路径中,其中有40条路 径的起始节点都属于站内推广,有30条属于捜索引擎类,另外10条为站外推广。则最终可 W确定该网页A在上述四种来源类型下分别对应的流量,进而可W将具体的信息提供给请 求方。
[01化]另外,与流量来源类型相关的请求还可W是第二请求,该第二请求可W用于查询 指定类型的流量来源到指定站点中各节点的流量去向信息。例如,在指定具体站点(例如 "天猫")的情况下,可W查询某类型的流量来源(例如,站外推广)到该站点内各个网页的 流向情况。具体实现时,可W首先查询第一数据库,确定W所述指定类型作为起始节点的各 条第二目标网页跳转路径,然后将包含有所述指定站点下相同节点的第二目标网页跳转路 径的出现次数进行汇总,确定所述指定类型的流量来源到所述指定站点下各节点的流向次 数,最后根据指定类型的流量来源到指定站点下各节点的流向次数,返回查询结果。 阳106] S203 :根据所述第一数据库中保存的信息,提供查询结果。 阳107] 具体在返回查询结果时,具体的形式可W有多种,例如,可W直接W文字的形式进 行展示,或者,为了使得提供的结果更加直观,还可W根据目标网页对应的各种类型来源的 流量信息,生成整体流量来源视图,W视图的方式展示流量来源信息,如图3-1。或者根据目 标类型的流量来源到站内各网页的流向信息,生成各类型流量的流向试图,然后对该视图 进行展示,同样W视图的方式展示流向信息,如图3-2所示。其中nl至n5分别代表流向的 次数,也即流量。 阳108] 实施例二
[0109] 在实施例二中,还可W提供某目标网页的详细的来源及去向信息,也即,其流量分 别来自于哪些节点(称为来源节点),流经本节点之后,又流向了哪些节点(称为去向节 点),等等。其中,无论是来源节点还是去向节点,都可W是多跳。具体实现时,该实施例二 首先提供了一种建立网页跳转路径数据库的方法,参见图4,该方法可W包括W下步骤:
[0110] S401 :收集与预置站点的网页访问相关的信息; 阳111] S402:将被访问网页作为节点,并根据被访问网页网址中包含的来源信息,将相关 的节点进行串联,生成多条网页跳转路径,并统计各条网页跳转路径的出现次数;
[0112] S403 :根据各条网页跳转路径及其出现次数,生成第二数据库。
[0113] 该实施例二中生成的第二数据库与实施例一中生成的第一数据库相比,不同之处 在于,只需要在第二数据库中保存各条网页跳转路径W及各自出现的次数,因此,第二数据 库的结构可W如W下表2所示:
[0114] 表 2 阳115]
[0116] 关于访问信息的收集W及网页跳转路径的生成、出现次数统计等,可W参见实施 例一中的介绍,运里不再寶述。
[0117] 生成该第二数据库之后,可W用于查询某网页的详细来源去向信息。具体的,该实 施例二还提供了一种网页数据查询方法,参见图5,该方法可W包括W下步骤:
[0118] S501 :提供第二数据库,所述第二数据库中保存有预先收集到的网页跳转路径的 统计信息;其中,所述网页跳转路径W被访问网页作为节点,并根据被访问网页网址中包含 的来源信息,将相关的节点进行串联;
[0119] S502:接收第Ξ查询请求,所述第Ξ查询请求用于查看指定网页的来源W及去向 详细信息;
[0120] S503:查询所述第二数据库,确定包含所述指定网页的各条第Ξ目标网页跳转路 径; 阳121] 具体实现时,在接收到具体的第Ξ查询请求之后,可W首先根据指定网页所在的 各个第Ξ目标网页跳转路径,后续的具体来源去向信息就可W依据运些第Ξ目标网页跳转 路径来获得。
[0122] S504:根据所述指定网页在各条第Ξ目标网页跳转路径中所处的位置,确定所述 指定网页的一跳或多跳来源节点、一跳或多跳去向节点W及各跳节点之间的跳转关系;
[0123] 由于每条网页跳转路径上都包括多个节点,各个节点根据跳转关系进行串联,因 此,在确定出各个第Ξ目标网页跳转路径之后,就可W根据指定网页在各条目标路径中所 处的位置,确定出指定网页的一跳或多条来源节点,W及一跳或多跳去向节点,然后根据所 述一跳或多条来源节点,化及一跳或多跳去向节点,返回该指定网页的来源去向详细信息。 例如,假设某条第Ξ目标网页跳转路径为:A-〉B-乂一〉D,待查询的指定网页是C,则B是 C的一跳来源节点,A是C的二跳来源节点,D是C的一跳去向节点,W此类推。 阳124] S505:根据所述一跳或多跳来源节点、一跳或多跳去向节点W及各跳节点之间的 跳转关系,返回所述来源W及去向详细信息。
[0125] 由于同一个网页可能出现在多条网页跳转路径中,因此,可W将包含该网页的跳 转路径取出,然后进行汇总,获知该网页的具体来源去向情况,如图6-1所示。例如,某指定 网页对应的节点是节点D,该节点所在的路径包括W下四条:
[0126] A-乂一〉D-〉F 阳 127] A->D 阳12引 B-〉D
[0129] B->D->E->G 阳130] 则该节点D的一跳来源节点包括节点C、A、B,二跳来源节点包括节点A, -跳去向 节点包括节点E、F,二跳去向节点包括节点G 阳131] 具体实现时,为了使得用户获得更直观的信息,还可指定网页对应的节点为 中屯、,根据获得的一跳或多跳来源节点,W及一跳或多跳去向节点,生成该指定网页的来源 去向视图并返回。例如,对于前述例子,对应生成的视图可W如图6-2所示。
[0132] 当然,在实际应用中,运种节点来源与去向不限于图3所示的两跳,而是可W展 开,即可展开一跳、二跳、Ξ跳乃至到结束为止。 阳133] 实施例Ξ 阳134] 在实际应用中,还有些网页,由于具有某种特性(例如,行业类目页面、店铺页面、 品牌页面、业务对象详情页面、实验页面等等),可能需要获得指定网页节点在某特性下的 流量情况,W便基于该特性来了解该指定网页节点的流量情况。或者,还可能需要了解某特 性的网页的流向情况,等等。为此,在本申请实施例Ξ中,还提供了另一种建立网页跳转路 径数据库的方法,参见图7,该方法可W包括W下步骤:
[0135] S701 :收集与预置站点的网页访问相关的信息;
[0136] S702 :将被访问网页作为节点,并根据被访问网页网址中包含的来源信息,将相关 的节点进行串联,生成多条网页跳转路径,并统计各条网页跳转路径的出现次数;其中,关 于各网页跳转路径上的各节点,根据网址中包含的属性信息,确定各节点所具有的预置特 性;
[0137] 其中,关于各条网页跳转路径的生成方式已经出现次数的统计方式,可W如实施 例一所述。而关于节点的特性信息,由于一般在网页的U化等信息中可W携带具体的特性 信息,因此,可W通过分析网页的U化,确定各节点是否具有某种特征,如果具有,则可W将 节点对应的具体特性信息记录到第Ξ数据库中。
[0138] S703 :根据各条网页跳转路径及其出现次数,W及各个节点所具有的特性信息,生 成第Ξ数据库。
[0139] 也就是说,第Ξ数据库中除了包括网页跳转路径及其出现次数信息之外,还可W 保存各节点所具有的特性信息,当然,可能并不是每个节点都具有特性,因此,所谓的"节点 所具有的特性信息"可W包括两层含义,第一,是否具有特性,第二,如果有,那么具有具体 的何种特性。例如,具体实现时,第Ξ数据库的结构可W如W下表3所示:
[0140] 表 3
[0141]
阳142] 其中,上述表3中的第Ξ条网页跳转路径中,没有记录与节点F相关的特性信息, 则意味着该节点F不具有特定的特性。 阳143]总之,基于上述第Ξ数据库,可W查询与节点特性相关的流量统计信息。具体的, 参见图8,该实施例Ξ还提供了一种网页数据查询方法,该方法具体可W包括W下步骤:
[0144] S801 :提供第Ξ数据库,所述第Ξ数据库中保存有预先收集到的网页跳转路径的 统计信息;其中,所述网页跳转路径W被访问网页作为节点,并根据被访问网页网址中包含 的来源信息,将相关的节点进行串联;所述网页跳转路径的统计信息包括:各节点所具有 的预置特性;
[0145] S802 :接收与节点特性相关的查询请求; 阳146] S803 :根据所述第Ξ数据库中保存的信息,提供查询结果。 阳147] 其中,具体与节点特性相关的查询请求可W包括多个方面,例如,在其中一种情况 下,该查询请求可W是第四查询请求,该第四查询请求用于查看各节点流向指定特性节点 的流量信息。例如,对于天猫站点下的各个网页,可W查询从运些网页到具有实验特性的网 页的流向信息。
[0148] 具体的,就可W首先查询第Ξ数据库,确定包含有指定特性节点的各条第四目标 网页跳转路径,然后根据各条第四目标网页跳转路径,确定流向所述指定特性节点的来源 节点W及各来源节点的出现次数,最后根据来源节点W及各来源节点的出现次数,返回查 询结果。例如,假设需要查看某网站内的节点流向品牌页的流量,则可W从数据库中提取出 带有品牌页特性节点的各条路径,例如,假设共有100条,每条路径中都可W对应确定出运 种带有品牌页特性的节点的来源节点,例如,有节点B、C、D等,进而可W根据各条路径的出 现次数,对各个来源节点W及对应的出现次数进行汇总,确定出各个来源节点流向品牌页 的流量,也即,节点B、C、D等分别流向品牌页的流量。
[0149] 另外,与节点特性相关的查询请求还可W是第五查询请求,该第五查询请求用于 查看指定特性节点到指定站点内各节点的流量信息,此时,可W首先查询第Ξ数据库,确定 包含有所述指定特性节点的各条第四目标网页跳转路径;然后,根据各条第四目标网页跳 转路径,确定指定特性节点流向的去向节点W及各去向节点的出现次数,之后就可W根据 所述去向节点W及各去向节点的出现次数,返回查询结果。
[0150] 对于实施例Ξ中的查询结果,同样可W采用视图的方式来提供具体的流量统计信 息,W提高信息的可读性。例如,对于某网站内的节点流向品牌页的流量信息,可W如图9 所示。 阳151] 总之,通过本申请实施例,能够根据用户访问网页过程中产生的日志,建立网页跳 转路径信息数据库,并对各条路径和/或节点上的数据进行统计及实时更新,在此过程中, 就可W接收查询流量统计信息的请求,并根据数据库中记录的数据,提供具体的流量统计 信息结果。运样,可W从整体上提供某指定网页的流量统计等信息,从而为网页运营人员从 整体上掌握网页的流量情况提供了依据,进而可W据此对其链接投放方向等进行有效的调 整,W便于更有效的利用网络资源,避免资源浪费或者利用不足。 阳152]与本申请实施例一提供的网页数据查询方法相对应,本申请实施例还提供了一种 网页数据查询装置,参见图10,该装置具体可W包括:
[0153] 第一数据库提供单元1001,用于提供第一数据库,所述第一数据库中保存有预先 收集到的网页跳转路径的统计信息;其中,所述网页跳转路径W被访问网页作为节点,并根 据被访问网页网址中包含的来源信息,将相关的节点进行串联;所述网页跳转路径的统计 数据包括各条网页跳转路径的出现次数、各网页跳转路径的起始节点W及所述起始节点在 作为流量来源时所属的类型; 阳154] 类型查询请求接收单元1002,用于接收与流量来源类型相关的查询请求;
[01巧]类型查询结果提供单元1003,用于根据所述第一数据库中保存的信息,提供查询 结果。 阳156] 其中,所述类型查询请求接收单元1002具体可W包括: 阳157] 第一查询请求接收子单元,用于接收第一查询请求,所述第一查询请求用于查询 指定网页的流量来源类型信息;
[0158] 相应的,所述类型查询结果提供单元1003可W包括:
[0159] 第一查询子单元,用于查询所述第一数据库,确定包含所述指定网页的各条第一 目标网页跳转路径;
[0160] 类型确定子单元,用于确定各条第一目标网页跳转路径中起始节点对应的类型, W及各条第一目标网页跳转路径的出现次数; 阳161] 第一汇总子单元,用于对具有相同类型起始节点的第一目标网页跳转路径的出现 次数进行汇总,确定各类型分别对应的第一目标网页跳转路径的总出现次数;
[0162] 第一返回子单元,用于根据所述各个类型W及对应的所述总出现次数,确定所述 流量来源信息并返回。 阳163] 或者,所述类型查询请求接收单元1002包括:
[0164] 第二查询请求接收子单元,用于接收第二查询请求,所述第二查询请求用于查询 指定类型的流量来源到指定站点中各节点的流量去向信息;
[01化]相应的,所述类型查询结果提供单元1003可W包括:
[0166] 第二查询子单元,用于查询所述第一数据库,确定W所述指定类型作为起始节点 的各条第二目标网页跳转路径;
[0167] 第二汇总子单元,用于将包含有所述指定站点下相同节点的第二目标网页跳转路 径的出现次数进行汇总,确定所述指定类型的流量来源到所述指定站点下各节点的流向次 数; 阳168] 第二返回子单元,用于根据所述指定类型的流量来源到所述指定站点下各节点的 流向次数,返回查询结果。
[0169] 与本申请实施例一提供的建立网页跳转路径数据库的方法相对应,本申请实施例 还提供了一种建立网页跳转路径数据库的装置,参见图11,该装置具体可W包括:
[0170] 第一收集单元1101,用于收集与预置站点的网页访问相关的信息; 阳171] 第一统计单元1102,用于将被访问网页作为节点,并根据被访问网页网址中包含 的来源信息,将相关的节点进行串联,生成多条网页跳转路径,并统计各条网页跳转路径的 出现次数;其中,关于各网页跳转路径的起始节点,根据起始节点的网址中包含的域名信 息,确定所述起始节点在作为流量来源时所属的类型;
[0172] 第一生成单元1103,用于根据各条网页跳转路径及其出现次数,W及各个起始节 点的流量来源类型信息,生成第一数据库。
[0173] 与本申请实施例二提供的网页数据查询方法相对应,本申请实施例还提供了一种 网页数据查询装置,参见图12,该装置具体可W包括:
[0174] 第二数据库提供单元1201,用于提供第二数据库,所述第二数据库中保存有预先 收集到的网页跳转路径的统计信息;其中,所述网页跳转路径W被访问网页作为节点,并根 据被访问网页网址中包含的来源信息,将相关的节点进行串联;
[01巧]来源去向查询请求接收单元1202,用于接收第Ξ查询请求,所述第Ξ查询请求用 于查看指定网页的来源W及去向详细信息;
[0176] 数据库查询单元1203,用于查询所述第二数据库,确定包含所述指定网页的各条 第Ξ目标网页跳转路径; 阳177] 跳转关系确定单元1204,用于根据所述指定网页在各条第Ξ目标网页跳转路径中 所处的位置,确定所述指定网页的一跳或多跳来源节点、一跳或多跳去向节点W及各跳节 点之间的跳转关系;
[0178] 返回单元1205,用于根据所述一跳或多跳来源节点、一跳或多跳去向节点W及各 跳节点之间的跳转关系,返回所述来源W及去向详细信息。
[0179] 其中,所述返回单元1205具体可W用于:
[0180] W所述指定网页对应的节点为中屯、,根据所述一跳或多跳来源节点、一跳或多跳 去向节点W及各跳节点之间的跳转关系,生成该指定网页的来源去向关系视图并返回。 阳181] 与本申请实施例二提供的建立网页跳转路径数据库的方法相对应,本申请实施例 还提供了一种建立网页跳转路径数据库的装置,参见图13,该装置具体可W包括: 阳182] 第二收集单元1301,用于收集与预置站点的网页访问相关的信息; 阳183] 第二统计单元1302,用于将被访问网页作为节点,并根据被访问网页网址中包含 的来源信息,将相关的节点进行串联,生成多条网页跳转路径,并统计各条网页跳转路径的 出现次数; 阳184] 第二生成单元1303,用于根据各条网页跳转路径及其出现次数,生成第二数据库。
[0185] 与本申请实施例Ξ提供的网页数据查询方法相对应,本申请实施例还提供了一种 网页数据查询装置,参见图14,该装置具体可W包括:
[0186] 第Ξ数据库提供单元1401,用于提供第Ξ数据库,所述第Ξ数据库中保存有预先 收集到的网页跳转路径的统计信息;其中,所述网页跳转路径W被访问网页作为节点,并根 据被访问网页网址中包含的来源信息,将相关的节点进行串联;所述网页跳转路径的统计 信息包括:各节点所具有的预置特性; 阳187] 特性查询请求接收单元1402,用于接收与节点特性相关的查询请求;
[0188] 特性查询结果提供单元1403,用于根据所述第Ξ数据库中保存的信息,提供查询 结果。
[0189] 其中,所述特性查询请求接收单元1402具体可W包括:
[0190] 第四查询请求接收子单元,用于接收第四查询请求,所述第四查询请求用于查看 各节点流向指定特性节点的流量信息; 阳191] 相应的,所述特性查询结果提供单元1403可W包括:
[0192] 第Ξ查询子单元,用于查询所述第Ξ数据库,确定包含有所述指定特性节点的各 条第四目标网页跳转路径;
[0193] 第Ξ汇总子单元,用于根据各条第四目标网页跳转路径,确定流向所述指定特性 节点的来源节点w及各来源节点的出现次数;
[0194] 第Ξ返回子单元,用于根据所述来源节点W及各来源节点的出现次数,返回查询 结果。
[01巧]或者,所述特性查询请求接收单元1402包括:
[0196] 第五查询请求接收子单元,用于接收第五查询请求,所述第五查询请求用于查看 指定特性节点到指定站点内各节点的流量信息; 阳197] 所述特性查询结果提供单元1403可W包括:
[0198] 第四查询子单元,用于查询所述第Ξ数据库,确定包含有所述指定特性节点的各 条第四目标网页跳转路径;
[0199] 第四汇总子单元,用于根据各条第四目标网页跳转路径,确定所述指定特性节点 流向的去向节点W及各去向节点的出现次数; 阳200] 第四返回子单元,用于根据所述去向节点W及各去向节点的出现次数,返回查询 结果。 阳201]与本申请实施例二提供的建立网页跳转路径数据库的方法相对应,本申请实施例 还提供了一种建立网页跳转路径数据库的装置,参见图15,该装置具体可W包括: 阳202] 第Ξ收集单元1501,用于收集与预置站点的网页访问相关的信息; 阳203] 第Ξ统计单元1502,用于将被访问网页作为节点,并根据被访问网页网址中包含 的来源信息,将相关的节点进行串联,生成多条网页跳转路径,并统计各条网页跳转路径的 出现次数;其中,关于各网页跳转路径上的各节点,根据网址中包含的属性信息,确定各节 点所具有的预置特性; 阳204] 第Ξ生成单元1503,用于根据各条网页跳转路径及其出现次数,W及各个节点所 具有的特性信息,生成第Ξ数据库。
[0205] 通过本申请实施例,能够根据用户访问网页过程中产生的日志,建立网页跳转路 径信息数据库,并对各条路径和/或节点上的数据进行统计及实时更新,在此过程中,就可 W接收查询流量统计信息的请求,并根据数据库中记录的数据,提供具体的流量统计信息 结果。运样,可W从整体上提供某指定网页的流量统计等信息,从而为网页运营人员从整体 上掌握网页的流量情况提供了依据,进而可W据此对其链接投放方向等进行有效的调整, W便于更有效的利用网络资源,避免资源浪费或者利用不足。 阳206] 通过W上的实施方式的描述可知,本领域的技术人员可W清楚地了解到本申请可 借助软件加必需的通用硬件平台的方式来实现。基于运样的理解,本申请的技术方案本质 上或者说对现有技术做出贡献的部分可软件产品的形式体现出来,该计算机软件产品 可W存储在存储介质中,如R0M/RAM、磁碟、光盘等,包括若干指令用W使得一台计算机设备 (可W是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些 部分所述的方法。 阳207] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部 分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或 系统实施例而言,由于其基本相似于方法实施例,所W描述得比较简单,相关之处参见方法 实施例的部分说明即可。W上所描述的系统及系统实施例仅仅是示意性的,其中所述作为 分离部件说明的单元可W是或者也可W不是物理上分开的,作为单元显示的部件可W是或 者也可w不是物理单元,即可w位于一个地方,或者也可w分布到多个网络单元上。可w根 据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术 人员在不付出创造性劳动的情况下,即可W理解并实施。 阳20引 W上对本申请所提供的网页数据查询、建立网页跳转路径数据库的方法及装置, 进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,W上实 施例的说明只是用于帮助理解本申请的方法及其核屯、思想;同时,对于本领域的一般技术 人员,依据本申请的思想,在【具体实施方式】及应用范围上均会有改变之处。综上所述,本说 明书内容不应理解为对本申请的限制。
【主权项】
1. 一种网页数据查询方法,其特征在于,包括: 提供第一数据库,所述第一数据库中保存有预先收集到的网页跳转路径的统计信息; 其中,所述网页跳转路径以被访问网页作为节点,并根据被访问网页网址中包含的来源信 息,将相关的节点进行串联;所述网页跳转路径的统计数据包括各条网页跳转路径的出现 次数、各网页跳转路径的起始节点以及所述起始节点在作为流量来源时所属的类型; 接收与流量来源类型相关的查询请求; 根据所述第一数据库中保存的信息,提供查询结果。2. 根据权利要求1所述的方法,其特征在于,所述接收与流量来源类型相关的查询请 求,包括: 接收第一查询请求,所述第一查询请求用于查询指定网页的流量来源类型信息; 所述根据所述第一数据库中保存的信息,提供查询结果,包括: 查询所述第一数据库,确定包含所述指定网页的各条第一目标网页跳转路径; 确定各条第一目标网页跳转路径中起始节点对应的类型,以及各条第一目标网页跳转 路径的出现次数; 对具有相同类型起始节点的第一目标网页跳转路径的出现次数进行汇总,确定各类型 分别对应的第一目标网页跳转路径的总出现次数; 根据所述各个类型以及对应的所述总出现次数,确定所述流量来源信息并返回。3. 根据权利要求1所述的方法,其特征在于,接收与流量来源类型相关的查询请求,包 括: 接收第二查询请求,所述第二查询请求用于查询指定类型的流量来源到指定站点中各 节点的流量去向信息; 所述根据所述第一数据库中保存的信息,提供查询结果,包括: 查询所述第一数据库,确定以所述指定类型作为起始节点的各条第二目标网页跳转路 径; 将包含有所述指定站点下相同节点的第二目标网页跳转路径的出现次数进行汇总,确 定所述指定类型的流量来源到所述指定站点下各节点的流向次数; 根据所述指定类型的流量来源到所述指定站点下各节点的流向次数,返回查询结果。4. 一种建立网页跳转路径数据库的方法,其特征在于,包括: 收集与预置站点的网页访问相关的信息; 将被访问网页作为节点,并根据被访问网页网址中包含的来源信息,将相关的节点进 行串联,生成多条网页跳转路径,并统计各条网页跳转路径的出现次数;其中,关于各网页 跳转路径的起始节点,根据起始节点的网址中包含的域名信息,确定所述起始节点在作为 流量来源时所属的类型; 根据各条网页跳转路径及其出现次数,以及各个起始节点的流量来源类型信息,生成 第一数据库。5. -种网页数据查询方法,其特征在于,包括: 提供第二数据库,所述第二数据库中保存有预先收集到的网页跳转路径的统计信息; 其中,所述网页跳转路径以被访问网页作为节点,并根据被访问网页网址中包含的来源信 息,将相关的节点进行串联; 接收第三查询请求,所述第三查询请求用于查看指定网页的来源以及去向详细信息; 查询所述第二数据库,确定包含所述指定网页的各条第三目标网页跳转路径; 根据所述指定网页在各条第三目标网页跳转路径中所处的位置,确定所述指定网页的 一跳或多跳来源节点、一跳或多跳去向节点以及各跳节点之间的跳转关系; 根据所述一跳或多跳来源节点、一跳或多跳去向节点以及各跳节点之间的跳转关系, 返回所述来源以及去向详细信息。6. 根据权利要求5所述的方法,其特征在于,所述根据所述一跳或多跳来源节点、一跳 或多跳去向节点以及各跳节点之间的跳转关系,返回所述来源以及去向详细信息,包括: 以所述指定网页对应的节点为中心,根据所述一跳或多跳来源节点、一跳或多跳去向 节点以及各跳节点之间的跳转关系,生成该指定网页的来源去向关系视图并返回。7. -种建立网页跳转路径数据库的方法,其特征在于,包括: 收集与预置站点的网页访问相关的信息; 将被访问网页作为节点,并根据被访问网页网址中包含的来源信息,将相关的节点进 行串联,生成多条网页跳转路径,并统计各条网页跳转路径的出现次数; 根据各条网页跳转路径及其出现次数,生成第二数据库。8. -种网页数据查询方法,其特征在于,包括: 提供第三数据库,所述第三数据库中保存有预先收集到的网页跳转路径的统计信息; 其中,所述网页跳转路径以被访问网页作为节点,并根据被访问网页网址中包含的来源信 息,将相关的节点进行串联;所述网页跳转路径的统计信息包括:各节点所具有的预置特 性; 接收与节点特性相关的查询请求; 根据所述第三数据库中保存的信息,提供查询结果。9. 根据权利要求8所述的方法,其特征在于,所述接收与节点特性相关的查询请求,包 括: 接收第四查询请求,所述第四查询请求用于查看各节点流向指定特性节点的流量信 息; 所述根据所述第三数据库中保存的信息,提供查询结果,包括: 查询所述第三数据库,确定包含有所述指定特性节点的各条第四目标网页跳转路径; 根据各条第四目标网页跳转路径,确定流向所述指定特性节点的来源节点以及各来源 节点的出现次数; 根据所述来源节点以及各来源节点的出现次数,返回查询结果。10. 根据权利要求8所述的方法,其特征在于,所述接收与节点特性相关的查询请求, 包括: 接收第五查询请求,所述第五查询请求用于查看指定特性节点到指定站点内各节点的 流量信息; 所述根据所述第三数据库中保存的信息,提供查询结果,包括: 查询所述第三数据库,确定包含有所述指定特性节点的各条第四目标网页跳转路径; 根据各条第四目标网页跳转路径,确定所述指定特性节点流向的去向节点以及各去向 节点的出现次数; 根据所述去向节点以及各去向节点的出现次数,返回查询结果。11. 一种建立网页跳转路径数据库的方法,其特征在于,包括: 收集与预置站点的网页访问相关的信息; 将被访问网页作为节点,并根据被访问网页网址中包含的来源信息,将相关的节点进 行串联,生成多条网页跳转路径,并统计各条网页跳转路径的出现次数;其中,关于各网页 跳转路径上的各节点,根据网址中包含的属性信息,确定各节点所具有的预置特性; 根据各条网页跳转路径及其出现次数,以及各个节点所具有的特性信息,生成第三数 据库。12. -种网页数据查询装置,其特征在于,包括: 第一数据库提供单元,用于提供第一数据库,所述第一数据库中保存有预先收集到的 网页跳转路径的统计信息;其中,所述网页跳转路径以被访问网页作为节点,并根据被访问 网页网址中包含的来源信息,将相关的节点进行串联;所述网页跳转路径的统计数据包括 各条网页跳转路径的出现次数、各网页跳转路径的起始节点以及所述起始节点在作为流量 来源时所属的类型; 类型查询请求接收单元,用于接收与流量来源类型相关的查询请求; 类型查询结果提供单元,用于根据所述第一数据库中保存的信息,提供查询结果。13. 根据权利要求12所述的装置,其特征在于,所述类型查询请求接收单元包括: 第一查询请求接收子单元,用于接收第一查询请求,所述第一查询请求用于查询指定 网页的流量来源类型信息; 所述类型查询结果提供单元包括: 第一查询子单元,用于查询所述第一数据库,确定包含所述指定网页的各条第一目标 网页跳转路径; 类型确定子单元,用于确定各条第一目标网页跳转路径中起始节点对应的类型,以及 各条第一目标网页跳转路径的出现次数; 第一汇总子单元,用于对具有相同类型起始节点的第一目标网页跳转路径的出现次数 进行汇总,确定各类型分别对应的第一目标网页跳转路径的总出现次数; 第一返回子单元,用于根据所述各个类型以及对应的所述总出现次数,确定所述流量 来源信息并返回。14. 根据权利要求12所述的装置,其特征在于,所述类型查询请求接收单元包括: 第二查询请求接收子单元,用于接收第二查询请求,所述第二查询请求用于查询指定 类型的流量来源到指定站点中各节点的流量去向信息; 所述类型查询结果提供单元包括: 第二查询子单元,用于查询所述第一数据库,确定以所述指定类型作为起始节点的各 条第二目标网页跳转路径; 第二汇总子单元,用于将包含有所述指定站点下相同节点的第二目标网页跳转路径的 出现次数进行汇总,确定所述指定类型的流量来源到所述指定站点下各节点的流向次数; 第二返回子单元,用于根据所述指定类型的流量来源到所述指定站点下各节点的流向 次数,返回查询结果。15. -种建立网页跳转路径数据库的装置,其特征在于,包括: 第一收集单元,用于收集与预置站点的网页访问相关的信息; 第一统计单元,用于将被访问网页作为节点,并根据被访问网页网址中包含的来源信 息,将相关的节点进行串联,生成多条网页跳转路径,并统计各条网页跳转路径的出现次 数;其中,关于各网页跳转路径的起始节点,根据起始节点的网址中包含的域名信息,确定 所述起始节点在作为流量来源时所属的类型; 第一生成单元,用于根据各条网页跳转路径及其出现次数,以及各个起始节点的流量 来源类型信息,生成第一数据库。16. -种网页数据查询装置,其特征在于,包括: 第二数据库提供单元,用于提供第二数据库,所述第二数据库中保存有预先收集到的 网页跳转路径的统计信息;其中,所述网页跳转路径以被访问网页作为节点,并根据被访问 网页网址中包含的来源信息,将相关的节点进行串联; 来源去向查询请求接收单元,用于接收第三查询请求,所述第三查询请求用于查看指 定网页的来源以及去向详细信息; 数据库查询单元,用于查询所述第二数据库,确定包含所述指定网页的各条第三目标 网页跳转路径; 跳转关系确定单元,用于根据所述指定网页在各条第三目标网页跳转路径中所处的位 置,确定所述指定网页的一跳或多跳来源节点、一跳或多跳去向节点以及各跳节点之间的 跳转关系; 返回单元,用于根据所述一跳或多跳来源节点、一跳或多跳去向节点以及各跳节点之 间的跳转关系,返回所述来源以及去向详细信息。17. 根据权利要求16所述的装置,其特征在于,所述返回单元具体用于: 以所述指定网页对应的节点为中心,根据所述一跳或多跳来源节点、一跳或多跳去向 节点以及各跳节点之间的跳转关系,生成该指定网页的来源去向关系视图并返回。18. -种建立网页跳转路径数据库的装置,其特征在于,包括: 第二收集单元,用于收集与预置站点的网页访问相关的信息; 第二统计单元,用于将被访问网页作为节点,并根据被访问网页网址中包含的来源信 息,将相关的节点进行串联,生成多条网页跳转路径,并统计各条网页跳转路径的出现次 数; 第二生成单元,用于根据各条网页跳转路径及其出现次数,生成第二数据库。19. 一种网页数据查询装置,其特征在于,包括: 第三数据库提供单元,用于提供第三数据库,所述第三数据库中保存有预先收集到的 网页跳转路径的统计信息;其中,所述网页跳转路径以被访问网页作为节点,并根据被访问 网页网址中包含的来源信息,将相关的节点进行串联;所述网页跳转路径的统计信息包括: 各节点所具有的预置特性; 特性查询请求接收单元,用于接收与节点特性相关的查询请求; 特性查询结果提供单元,用于根据所述第三数据库中保存的信息,提供查询结果。20. 根据权利要求19所述的装置,其特征在于,所述特性查询请求接收单元包括: 第四查询请求接收子单元,用于接收第四查询请求,所述第四查询请求用于查看各节 点流向指定特性节点的流量信息; 所述特性查询结果提供单元包括: 第三查询子单元,用于查询所述第三数据库,确定包含有所述指定特性节点的各条第 四目标网页跳转路径; 第三汇总子单元,用于根据各条第四目标网页跳转路径,确定流向所述指定特性节点 的来源节点以及各来源节点的出现次数; 第三返回子单元,用于根据所述来源节点以及各来源节点的出现次数,返回查询结果。21. 根据权利要求19所述的装置,其特征在于,所述特性查询请求接收单元包括: 第五查询请求接收子单元,用于接收第五查询请求,所述第五查询请求用于查看指定 特性节点到指定站点内各节点的流量信息; 所述特性查询结果提供单元包括: 第四查询子单元,用于查询所述第三数据库,确定包含有所述指定特性节点的各条第 四目标网页跳转路径; 第四汇总子单元,用于根据各条第四目标网页跳转路径,确定所述指定特性节点流向 的去向节点以及各去向节点的出现次数; 第四返回子单元,用于根据所述去向节点以及各去向节点的出现次数,返回查询结果。22. -种建立网页跳转路径数据库的装置,其特征在于,包括: 第三收集单元,用于收集与预置站点的网页访问相关的信息; 第三统计单元,用于将被访问网页作为节点,并根据被访问网页网址中包含的来源信 息,将相关的节点进行串联,生成多条网页跳转路径,并统计各条网页跳转路径的出现次 数;其中,关于各网页跳转路径上的各节点,根据网址中包含的属性信息,确定各节点所具 有的预置特性; 第三生成单元,用于根据各条网页跳转路径及其出现次数,以及各个节点所具有的特 性信息,生成第三数据库。
【文档编号】G06F17/30GK105989002SQ201510041278
【公开日】2016年10月5日
【申请日】2015年1月27日
【发明人】陈东
【申请人】阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1