一种网页解析、获取方法及装置与流程

文档序号:12364498阅读:来源:国知局

技术特征:

1.一种网页解析方法,其特征在于,包括:

对获取的待显示网页进行解析,获取所述待显示网页头部的目标标识的标签,所述标签包含有与所述待显示网页关联的超级链接的域名;

对所述标签所包含的各域名进行预解析,获取各所述域名对应的IP地址;

将各所述域名对应的IP地址进行保存,以便在请求所述待显示网页中目标超级链接的域名对应的资源时,查询保存的与所述目标超级链接的域名对应的IP地址,并基于查询到的IP地址进行资源的下载。

2.根据权利要求1所述的网页解析方法,其特征在于,所述对获取的待显示网页进行解析,获取所述待显示网页头部的目标标识的标签,包括:

对待显示网页进行解析,获取所述待显示网页头部的name值为目标值的meta标签。

3.根据权利要求1或2所述的网页解析方法,其特征在于,在所述获取所述待显示网页头部的目标标识的标签之后,该方法还包括:

将所述标签包含的各域名添加至域名预解析队列中;

所述对所述标签所包含的各域名进行预解析,获取各所述域名对应的IP地址,包括:

调用后台线程,对所述域名预解析队列中的各所述域名进行预解析,获取各所述域名对应的IP地址。

4.根据权利要求3所述的网页解析方法,其特征在于,还包括:

在判断保存的域名及对应的IP地址达到失效时限时,将达到失效时限的域名添加至所述域名预解析队列中。

5.一种网页获取方法,其特征在于,基于权利要求1-4任一项所述的网页解析方法,该网页加载方法包括:

接收对网页中目标超级链接的触发指令;

在所述目标超级链接中提取域名,并查询已存储的域名及IP地址对应关系列表,确定与提取的域名对应的IP地址;其中,所述域名及IP地址对应关系列表中记录有,在所述网页解析时获取的网页头部的目标标识的标签所包含的各域名,以及对各域名预解析所得到的对应的IP地址;

根据确定的与提取的域名对应的IP地址,访问该IP地址对应的服务器,获取网页数据。

6.一种网页解析装置,其特征在于,包括:

域名获取单元,用于对获取的待显示网页进行解析时,获取所述待显示网页头部的目标标识的标签,所述标签包含有与所述待显示网页关联的超级链接的域名;

域名预解析单元,用于对所述标签所包含的各域名进行预解析,获取各所述域名对应的IP地址;

对应关系保存单元,用于将各所述域名对应的IP地址进行保存,以便在请求所述待显示网页中目标超级链接的域名对应的资源时,查询保存的与所述目标超级链接的域名对应的IP地址,并基于查询到的IP地址进行资源的下载。

7.根据权利要求6所述的网页解析装置,其特征在于,所述域名获取单元包括:

Meta标签获取单元,用于对待显示网页进行解析,获取所述待显示网页头部的name值为目标值的meta标签。

8.根据权利要求6或7所述的网页解析装置,其特征在于,还包括:

第一队列添加单元,用于在获取所述待显示网页头部的目标标识的标签之后,将所述标签包含的各域名添加至域名预解析队列中;

所述域名预解析单元包括:

后台预解析单元,用于调用后台线程,对所述域名预解析队列中的各所述域名进行预解析,获取各所述域名对应的IP地址。

9.根据权利要求8所述的网页解析装置,其特征在于,还包括:

第二队列添加单元,用于在判断保存的域名及对应的IP地址达到失效时限时,将达到失效时限的域名添加至所述域名预解析队列中。

10.一种网页获取装置,其特征在于,基于权利要求6-9任一项所述的网页解析装置,其特征在于,该网页获取装置包括:

触发指令接收单元,用于接收对网页中目标超级链接的触发指令;

IP地址查询单元,用于在所述目标超级链接中提取域名,并查询已存储的域名及IP地址对应关系列表,确定与提取的域名对应的IP地址;其中,所述域名及IP地址对应关系列表中记录有,在所述网页解析时获取的网页头部的目标标识的标签所包含的各域名,以及对各域名预解析所得到的对应的IP地址;

IP地址访问单元,用于根据确定的与提取的域名对应的IP地址,访问该IP地址对应的服务器,获取网页数据。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1