专利名称:一种以时间为权重的将web网站信息移植到wap的技术的制作方法
技术领域:
本发明涉及一种以时间为权重的将web网站信息移植到wap的技术,特别涉及一 种采用智能web信息提纯方式,实现将web网页上近期发布现的各类异构信息提取出来并 移植到wap网页上的技术。
背景技术:
随着移动互联网产业的快速发展。越来越多的人使用手机上网。3G各类wap网站 开始蓬勃发展,很多传统互联网网站都希望将自己原有的内容移植到移动互联网中,借助 手机网络用户的增长,继续保持发展。当前的wap站点的建设,大多依靠建立专门的项目组 进行wap程序开发。这其中需要解决数据整合,内容发布和管理,实时更新,系统运营与维 护等众多复杂问题。要耗费相对较高的成本才能完成wap站点的建立并整合原有web站点 内容。本发明的建立,实现了在无需额外的wap页面程序开发的基础上,将web网页上近期 发布的信息移植到wap网页上的技术。
发明内容
本发明所要解决的技术问题是提供一种采用(智能web信息提纯技术方式将web 网页上近期发布的各类异构信息全部提取出来并移植到wap网页上的方法。本发明所述的一种以时间为权重的将web网站信息移植到wap的技术,该方法至 少包括如下的步骤步骤1 获取目web网页中的海量信息。步骤2 将海量信息进行统一的格式化与提纯,提取出关键信息。步骤3 从提取出的关键信息中筛选出近期发布的信息,并移植到wap网页上。本发明所述的一种以时间为权重的将web网站信息移植到wap的技术,获取目web 网页中的海量信息,其步骤为步骤11 将目标web网页的海量异构信息抓取到内容聚合服务器中。步骤12 将内容聚合服务器中的海量异构信息进行统一的格式化。步骤13 将格式化后的信息存放到资源服务器中。本发明所述的一种以时间为权重的将web网站信息移植到wap的技术,将海量信 息进行统一的格式化与提纯,提取出关键信息,其步骤为步骤21 将格式化后的信息通过智能解析进行提纯,滤去多余的数据。步骤22 从提纯后的信息中提取出标题、正文、时间、图片、音频、视频等关键信 肩、ο本发明所述的一种以时间为权重的将web网站信息移植到wap的技术,从提取出 的关键信息中筛选出近期发布的信息,并移植到wap网页上,其步骤为步骤31 确定信息筛选时间范围。步骤32 以“步骤31”确定的时间范围为依据,将近期发布的信息从关键信息中筛选出来。步骤33 将筛选出的近期发布的信息移植到wap网页上。本发明涉及一种以时间为权重的将web网站信息移植到wap的技术,利用智能web 信息提纯技术,使web网页上近期发布的各类异构信息提取出来并移植到wap网页上,体现 了 web网页向wap网页转化过程中的时效性,同时节约了资源。
具体实施例方式本发明的主要步骤如下步骤1 获取目web网页中的海量信息。步骤2 将海量信息进行统一的格式化与提纯,提取出关键信息。步骤3 从提取出的关键信息中筛选出近期发布的信息,并移植到wap网页上。上述步骤1获取目web网页中的海量信息的具体步骤如下步骤11 将目标web网页的海量异构信息抓取到内容聚合服务器中。步骤12 将内容聚合服务器中的海量异构信息进行统一的格式化。步骤13 将格式化后的信息存放到资源服务器中。上述步骤2将海量信息进行统一的格式化与提纯,提取出关键信息的具体步骤如 下步骤21 将格式化后的信息通过智能解析进行提纯,滤去多余的数据。步骤22 从提纯后的信息中提取出标题、正文、时间、图片、音频、视频等关键信 肩、ο上述步骤3从提取出的关键信息中筛选出近期发布的信息,并移植到wap网页上 的具体步骤如下步骤31 确定信息筛选时间范围。步骤32 以“步骤31”确定的时间范围为依据,将近期发布的信息从关键信息中筛 选出来。步骤33 将筛选出的近期发布的信息移植到wap网页上。上述的技术方案实施时实现了将web网页上近期发布的各类异构信息提取出来 并移植到wap网页上,体现了 web网页向wap网页转化过程中的时效性,同时节约了资源。最后所应说明的是,以上实施例仅用以说明而并非限制本发明所描述的技术方 案;因此,尽管本说明书参照上述的实施例对本发明已进行了详细的说明,但是,本领域的 普通技术人员应当理解,仍然可以对本发明进行修改或者等同地替换;而一切不脱离本发 明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围当中。
权利要求
一种以时间为权重的将web网站信息移植到wap的技术,其特征在于该方法至少包括如下的步骤步骤1获取目web网页中的海量信息。步骤2将海量信息进行统一的格式化与提纯,提取出关键信息。步骤3从提取出的关键信息中筛选出近期发布的信息,并移植到wap网页上。
2.根据权利要求1所述的一种以时间为权重的将web网站信息移植到wap的技术,其 特征在于获取目web网页中的海量信息,其步骤为步骤11 将目标web网页的海量异构信息抓取到内容聚合服务器中。 步骤12 将内容聚合服务器中的海量异构信息进行统一的格式化。 步骤13 将格式化后的信息存放到资源服务器中。
3.根据权利要求1所述的一种以时间为权重的将web网站信息移植到wap的技术,其 特征在于将海量信息进行统一的格式化与提纯,提取出关键信息,其步骤为步骤21 将格式化后的信息通过智能解析进行提纯,滤去多余的数据。步骤22 从提纯后的信息中提取出标题、正文、时间、图片、音频、视频等关键信息。
4.根据权利要求1所述的一种以时间为权重的将web网站信息移植到wap的技术, 其特征在于从提取出的关键信息中筛选出近期发布的信息,并移植到wap网页上,其步骤 为步骤31 确定信息筛选时间范围。步骤32 以“步骤31”确定的时间范围为依据,将近期发布的信息从关键信息中筛选出来。步骤33 将筛选出的近期发布的信息移植到wap网页上。
全文摘要
一种以时间为权重的将web网站信息移植到wap的技术,首先获取目web网页中的海量信息;然后将海量信息进行统一的格式化与提纯,提取出关键信息;从提取出的关键信息中筛选出近期发布的信息,并移植到wap网页上;本发明使web网页上近期发布的各类异构信息提取出来并移植到wap网页上,体现了web网页向wap网页转化过程中的时效性,同时节约了资源。
文档编号G06F17/30GK101887420SQ20091008406
公开日2010年11月17日 申请日期2009年5月13日 优先权日2009年5月13日
发明者朱红军, 汤海京, 田耘, 蒋海涛, 贾鹏 申请人:北京博越世纪科技有限公司