一种网址导航方法及系统的制作方法

文档序号:6562364阅读:200来源:国知局
专利名称:一种网址导航方法及系统的制作方法
技术领域
本发明涉及计算机网络,特别是涉及一种网址导航方法及系统。
技术背景通常,互联网上的网站是通过域名进行访问的,而域名是基于英文表示的, 所以对于非英语系的国家来说,就有一个大众化普及英文的问题。针对上述问题,出现了很多网址导航网站(简称网址导航站),也出现了 3721网络实名等 工具。所述网址导^^站将各个网站对应的中文名称分类显示在网页中,如分为 名站导航、实用网站、娱乐休闲、生活服务等类别,在各个类别下收录相应的 多个网站链接供用户选择。目前,网址导航站的模式几乎是一样的,都是按照 相对固定的分类来显示收录网站。但是,现在互联网发展十分迅速,有越来越多的网站出现。当网址导航站 收录的网站数量增多的时候,因为在一个分类下已经有很多网站了,所以需要 对类目再进行细分形成多级目录,常见的导航形式是首页〉一级栏目〉二级栏 目〉三级栏目〉内容页面。这时,通常的网址导^U莫式就显示出局限性首先, 类目的增多导致用户到达选定网站的层次增多,即用户在选择网站的时候需要 访问多级目录,影响用户的使用体验;其次,由于每个人的理解不同,出现类 目细分是否合理的问题,由此可能会造成用户进入其他导航网页而不能快速选 定要访问的网站。 发明内容本发明所要解决的技术问题是提供一种网址导航方法及系统,以解决现有 网址导航模式类目层次太多,以及大量数据中如何快速有效地进行信息过滤和 提取的问题。为解决上述技术问题,本发明提供了一种网址导航方法,包括 提供至少一种可供用户选择的排序规则; 定期读取网址列表;对应所述排序规则,将所述网址列表中的网站排序; 根据用户选择或默认设置的排序规则,将对应的排序结果按照一级分类显示。
其中,所述排序规则为根据网站首页内容变化程度进行排序,执行以下排序步骤抓取网站首页内容;对所述内容进行过滤htral标签和分隔内容的处 理;将处理结果与保存的最新数据比较,计算变化率,并保存所述处理结果; 按照所述变化率的大小从高到低排序。其中,所述排序规则为根据Google计算出来的网页级别(PR)排名进行 排序,执行以下排序步骤根据所述网址列表中的网址,查找对应网站的PR 值;按照所述PR值的大小从高到低排序。其中,所述排序规则为根据Alexa排名进行排序,执行以下排序步骤根 据所述网址列表中的网址,查找对应网站的A1 exa值;按照所述A1 exa值的大 小从低到高排序。优选的显示预定范围内的排序结果。本发明还提供了一种网址导航系统,包括存储单元,用于保存网址列表和排序结果;数据读取单元,用于定期读取网址列表;排序单元,用于提供至少一种可供用户选择的排序规则;对应所述排序规 则,将所述网址列表中的网站排序;显示单元,用于根据用户选择或默认设置的排序规则,将对应的排序结果 按照一级分类显示。其中,所述排序规则为根据网站首页内容变化程度进行排序,排序单元 执行以下排序步骤抓取网站首页内容;对所述内容进行过滤html标签和分 隔内容的处理;将处理结果与存储单元保存的最新数据比较,计算变化率,并 将所述处理结果保存在存储单元;按照所述变化率的大小从高到低排序。其中,所述排序规则为根据Google计算出来的网页级别(PR)排名进行 排序,排序单元执行以下排序步骤根据所述网址列表中的网址,查找对应网 站的PR值;按照所述PR值的大小从高到低排序。其中,所述排序规则为根据Alexa排名进行排序,排序单元执行以下排序 步骤根据所述网址列表中的网址,查找对应网站的Alexa值;按照所述Alexa 值的大小从低到高排序。优选的所述显示单元显示预定范围内的排序结果。 与现有技术相比,本发明具有以下优点首先,本发明根据某种规则来定期计算导航类目下的网站分值,然后按照 分值的高低将最合适的网站排在最前面显示。由于网站的排列是定期变化的, 而且排序的规则代表了用户的某种浏览需求,所以只需设置一级导航目录,在 不增加类目层次的情况下,即可将用户想要访问的网站直接在最前面展现出 来,从而避免用户需要访问多级类目的问题。尤其对于分值变化较大的网站, 可以根据网站实际的运营情况来推荐给用户。而且,由于一级目录的分类范围 相对较大,因此能够避免用户对网站分类理解不一致的问题。本发明所述方法 能够给用户带来更好的使用体验,用户在浏览导航网站一级目录的时候就能快 速选定网站。其次,本发明提供了多种可供用户选择的排序方式,满足用户的多种需求。 而且,排序方式并不限于本发明中记载的根据首页内容变化程度进行排序、根 据Google计算出来的网页级别(PR)排序以及根据Alexa排名进行排序的方 式,还可以根据用户的不同需求,增加其他的排序规则,提供给用户更多的选 择机会。再次,将排序后的网站显示给用户的时候,根据不同的排序方式设定不同 的阈值,只将分值在阈值范围内的网站显示,从而将各种排序方式下有意义的 网站推荐给用户,而一些阈值范围以外的网站由于没有太大的选择意义,就舍 弃显示。


图l是用户使用本发明所述网址导航站的流程图; 图2是本发明所述网址导航方法的系统处理流程图; 图3是本发明所述网址导航系统的结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式
对本发明作进一步详细的说明。本发明的核心思想是只设置一级导航目录,提供多种排序方式,对每种 方式按照某个规则计算网站的分值,排序后在一级分类目录下将用户想要访问 的网站推送到前面显示,而将分值在阈值范围以外的网站不显示出来。
本发明提出了一种新型的网址导航站,参照图1,是用户使用本发明所述 网址导航站的流程图。步骤IOI,登录网站选择类目查看。本发明所述网址导航网站的首页中列 出了各个网站在一级目录下的分类显示,所述一级目录是将网页中显示的所有 网站按照最大范围的类别进行分类,如分为娱乐、新闻、财经等。用户访问网 站进入首页后,选择要查看的某一类内容。为扩大同一类目下所列网站的选择 范围,用户可以点击类目关键词,进入一级目录。如点击"娱乐",页面显示 出导航网站收录的所有娱乐类的网站链接。步骤102,用户判断当前页面内容是否符合自己的查看习惯。当用户首次 登录导航网站时, 一级目录下的网站排列是按照系统默认设置进行的排列。本 发明提供了三种排列方式根据首页内容变化程度排列,根据网站评测的"重 要性"排列,根据网站的访问情况排列。如果页面中显示的排列方式符合用户 的浏览需求,则执行步骤103;否则,执行步骤104。步骤103,点击网址链接跳转到选定的网站,查看更多内容。如果用户希 望根据首页内容变化程度,或者网站评测的"重要性",或者页面访问量等不 同目的来选择网站,而当前的排列方式符合用户的需求,则用户直接点击网址 链接,即可在众多网站中快速选定首页内容变化最大,或者最有价值,或者访 问量最高的网站。而当一级目录下提供的网站数量超出一页范围时,用户也可 以点击下一页的链接继续查看。步骤104,选择其他排列方式。如果当前的网站排列方式不能满足用户的 浏览需求,则用户可以在下拉列表中选择另一种排列方式。例如,当前页面是 按照网站访问量进行的排序,而用户希望查看首页内容变化较大的网站,则可 以通过导航网站提供的多种排列方式进行选择。可供用户选择的排列方式也可 以不使用下拉列表的方式,而直接在页面中设置多个排序按钮或链接。步骤105,系统按照用户选择的排列方式,将排列结果显示给用户。如上 例,系统会将按照首页内容变化程度排列的网站提供给用户。步骤105之后再 返回步骤102,用户查看新显示的网页内容是否符合自己的浏览目的,因此用 户还可以进行多次排序选择。而在符合用户需求的网页内,直接列出了多个同 类内容的网站链接,用户通过一级导航目录即可选定要访问的网站。
上述过程是用户访问网址导航站的前台运行说明,对于网站后台的数据处 理过程,参照图2所示,是本发明所述网址导航方法的系统处理流程图。步骤201,定期读取待处理网址列表。所述网址列表中列出了导航网站收 录的所有网站的网址,后台系统定期(通常为每天)读取一次网址列表,进行 所列网站的分值更新。步骤202,判断所列网站的PR值是否更新。所述PR (PageRank,网页级 别)是Google搜索引擎用于评测一个网页"重要性"的一种方法,在揉合了 诸如Title (标题)标识和Keywords (关键词)标识等所有其它因素之后, Google通过PR来调整结果,使那些更具"重要性"的网页在搜索结果中令网站 排名获得提升,从而提高搜索结果的相关性和质量。因此,Google给每个网 站根据多项指标计算出来的分值(即PR值)越高,表示网站越有价值。本发 明提供给用户选择的 一种排序方式,就是利用Goog 1 e计算出来的PR值进行排 序。如果有人通过其他方式在系统自动更新前就更新了网站的PR值,则系统 判断PR值已更新,继续执行步骤205;如果当天的PR值还未更新,则执行步 骤203,系统自动更新PR值。步骤203,根据网址查询PR值。在提供查询的网站上,如Google PageRank (Pm直)的在纟戋查询http://www. 123cha. com/google—pagerank/,车俞入要查 询的网站URL,即可查询到对应网站的PR值排名。如前所述,查到的分值越 高,网站就越有价值。系统每天都会查询网址列表中收录的网站PR值排名。步骤204,如果查询成功,则在数据库中记录最新的PR值,并更新状态 为成功;如果由于系统故障或网络中断等原因造成查询失败,则更新状态为失 败。对于查询失败的情况,可以提供几次(如三次)重新查询的机会,若仍未 成功,则放弃继续查询,状态记为失败。完成步骤204后,继续执行步骤205。步骤205,判断所列网站的Alexa排名值是否更新。本发明提供给用户选 择的另一种排序方式,就是利用Alexa排名进行排序。所述Alexa是以发布世 界网站排名而引人注目的一个网站,是一个提供搜索、提供分类导航的网站, Alexa排名是目前常引用的用来评价某一网站访问量的一个指标。与上述PR 值不同,Alexa排名查询到的排名值越小,对应的网站访问量就越大。在本发 明中,如果有人通过其他方式在系统自动更新前就更新了网站的Alexa排名, 则系统判断Alexa排名已更新,继续执行步骤208;如果当天的Alexa排名还 未更新,则^l行步骤206,系统自动更新。步骤206,根据网址查询Alexa排名值。如前所述,在提供查询的网站上, 如在线查询http: 〃www. 123cha. com/alexa/,输入要查询的网站URL,即可 查询到对应网站的Alexa排名值。系统每天都会查询网址列表中收录的网站 Alexa排名值排名。步骤207,如前所述,如果查询成功,则在数据库中记录最新的Alexa排 名值,并更新状态为成功;如果由于系统故障或网络中断等原因造成查询失败, 则更新状态为失败。对于查询失败的情况,可以提供几次(如三次)重新查询 的机会,若仍未成功,则放弃继续查询,状态记为失败。完成步骤207后,继 续执行步骤208。步骤208,判断所列网站的首页变化程度是否统计,若已统计,则执行步 骤215;若未统计,则执行步骤209。本发明提供的第三种排序方式即为所述 根据网站首页内容变化程度进行排序,所述方法能够统计出网站首页每天的变 化情况。步骤209,读取首页内容。系统可以利用现有的网页抓取工具每天抓取网 站的首页内容,对于基于Java语言的系统框架也可以利用Java提供的程序接 口,通过传递URL直接访问网站首页,得到返回的首页代码。然后,系统判断 页面抓取是否成功,若成功,执行步骤210;否则,执行步骤214。步骤210,过滤html标签。得到返回的首页代码后,利用预先定义的html 标签集,找到所有html代码并去掉,即过滤掉html的内容。步骤211,把过滤html标签后剩下的内容去掉空格,并按照标点符号分 隔所述内容。步骤212,读取最近一次的数据并比较,统计变化率。所述最近一次的数 据是指保存的最后更新的首页内容,例如,如果昨天更新成功,则最近一次的 数据即为昨天的数据;如果昨天更新失败,则最近一次的数据即为前天更新成 功的数据。首先,将上述分隔后的内容到保存的最近一次的内容中去寻找,如 果找到,则对应内容没有变化;如果没有找到,则对应内容即为新增或修改的 内容。对于与最近一次数据相比较已删除的内容,不作统计。然后,根据逐行
比较的结果,将变化的行数与今天的总行数相除,得到今天的变化率。步骤213,保存本次过滤分隔后的首页内容,供下次对比使用。步骤214,如前所述,如杲上述操作成功,则在数据库中记录最新的变化 率,并更新状态为成功;如果由于系统故障或网络中断等原因造成查询失败, 则更新状态为失败。对于查询失败的情况,可以4是供几次(如三次)重新查询 的机会,若仍未成功,则放弃继续查询,状态记为失败。上述本发明提供的多种可供用户选择的排序方式,满足用户的多种需求。 但是,排序方式并不限于上述记栽,还可以根据用户的不同需求,增加其他的 排序规则,提供给用户更多的选择机会。步骤215,根据得到的分值,按照不同的排序方式进行排序。后台系统完 成上述过程的网站分值更新后,将排序操作交给数据库处理。当用户选择一种 排序方式,系统执行访问数据库操作,数据库将根据已更新的分值,将对应排 序方式的网站排列结果显示给用户。为节省系统资源,数据库每天只进行一次 排序,然后将排序结果保存,当用户访问时直接将已排序的网站显示。对于根据Google计算出来的PR值进行排序的方式,按照PR值从高到低 的顺序,分别在一级目录的类别下排列,将PR值最大的网站排在最前面;对 于根据Alexa排名进行排序的方式,按照Alexa排名值从低到高的顺序,分别 在一级目录的类别下排列,将Alexa排名最小的网站排在最前面;对于根据首 页内容变化程度进行排序的方式,按照变化率从高到低的顺序,分别在一级目 录的类别下排列,将变化率最大的网站排在最前面。所述定期更新的排序结果,将根据用户的不同选择或默认设置显示在一级 目录下。如果一个类目下的所列网站太多,由于排在后面的网站没有太大的意 义,而且还需要设置多页来显示,所以通常设置一阈值,只将有意义的网站推 荐给用户,而将排在阈值以外的网站不显示。例如,对于PR值,可设定阈值 为2, PR值小于2的网站不显示;对于Alexa排名值,可设定阈值为50,排 名50以后的网站将不显示。由上可知,本发明中由于网站的排列是定期变化的,而且排序的规则代表 了用户的某种浏览需求,所以只需设置一级导航目录,在不增加类目层次的情 况下,即可将用户想要访问的网站直接在最前面展现出来,从而避免用户需要
访问多级类目的问题。尤其对于分值变化较大的网站,可以根据网站实际的运 营情况来推荐给用户。而且,由于一级目录的分类范围相对较大,因此能够避 免用户对网站分类理解不一致的问题。本发明所述方法能够给用户带来更好的 使用体验,用户在浏览导航网站一级目录的时候就能快速选定网站。本发明还提供了一种网址导航系统,参照图3,是本发明所述网址导航系统的结构图。所述系统包括存储单元301,数据读取单元302,排序单元303, 显示单元304。存储单元301,用于保存网址列表、对应网站的分值和更新状态、以及排 序结果等数据。所述网址列表中列出了导航网站收录的所有网站的网址,所述 数据读取单元302定期读取一次网址列表,进行所列网站的分值更新。所述网 站的分值是根据某种规则计算出来的,用于根据分值的高低对网站进行排序, 将最合适的网站排在最前面。所述更新状态标识了网址列表中的分值是否已定 期更新,分为成功和失败两个状态。所述排序结果为网址列表中的网站按照不 同排序方式进行排序后的网站排列。数据读取单元302,用于定期读取所述存储单元301中的网址列表。通常 每天读取一次,然后触发排序单元303对读取的网址进行排序处理。因此,本 发明中网站的排列是定期变化的。排序单元303,用于根据可供用户选择的排序规则,将网址列表所收录的 网站进行排序。本发明提供了三种排列方式根据Google计算出来的PR值进 行排序,根据Alexa排名进行排序,根据首页内容变化程度进行排序。对于前 两种排序,可以直接根据网站的URL在提供查询的网站上查询得到PR值或 Alexa排名值,然后按照从高到低的顺序排列PR值,按照从低到高的顺序排 列Alexa排名值,因为PR值越高网站越有价值,而Alexa排名值越小网站的 访问量越高。对于第三种排序方式,首先需要利用现有的网页抓取工具定期抓取网站的 首页内容,对于基于Java语言的系统框架也可以利用Java提供的程序接口, 通过传递URL直接访问网站首页,得到返回的首页代码;然后利用预先定义的 html标签集,找到所有html代码并去掉,即过滤掉html的内容;把剩下的 内容去掉空格,并按照标点符号分隔所述内容;最后把分好的内容逐行与最近 一次的数据进行比较,得到今天变化的行数,再跟今天的总行数相除,得到今 天的变化率。统计出首页的变化率后,还要在所述存储单元301中保存本次经 过滤和分隔的内容,供下次对比使用。排序时根据变化率的大小从高到低排列, 变化率越大排在越前面。所述排序单元303定期都要对上述三种排序方式进行分值的更新和重新 排序,并在所述存储单元301中保存排序结果,以得到当天的最新排序结果显 示给用户。在更新每种分值的操作结束后,都要在存储单元301记录最新的分 值,并更新状态。而所述排序操作都是在导航网站的一级目录下进行的排序, 即娱乐类的排序、体育类的排序,等等。由于网站的排列是定期变化的,而且 排序的规则代表了用户的某种浏览需求,所以本发明只需设置一级导航目录, 在不增加类目层次的情况下,即可将用户想要访问的网站排在最前面显示,从 而给用户带来更好的使用体验。此外,排序方式并不限于本发明中的记载,还 可以根据用户的不同需求,增加其他的排序规则,提供给用户更多的选择机会。显示单元304,用于根据用户选择或默认设置的排序规则,将排序单元303 处理完的对应排序结果显示。当用户登录导航网站查看类目后,先根据默认设 置将一种排序结果按照一级类目显示,然后用户可以根据不同的浏览目的,选 择系统提供的多种排序方式,进行网站的选择。在所述排序结果中,还根据不 同排序方式设置了不同的阈值,由于排在后面的网站没有太大的意义,而且还 需要设置多页来显示,所以通常只将有意义的网站推荐给用户,而将排在阈值 以外的网站不显示。以上对本发明所提供的一种网址导航方法及系统,进行了详细介绍,本文只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术 人员,依据本发明的思想,在具体实施方式
及应用范围上均会有改变之处。综 上所述,本说明书内容不应理解为对本发明的限制。
权利要求
1、一种网址导航方法,其特征在于,包括提供至少一种可供用户选择的排序规则;定期读取网址列表;对应所述排序规则,将所述网址列表中的网站排序;根据用户选择或默认设置的排序规则,将对应的排序结果按照一级分类显示。
2、 根据权利要求1所述的方法,其特征在于,所述排序规则为根据网站 首页内容变化程度进行排序,执行以下排序步骤抓取网站首页内容;对所述内容进行过滤html标签和分隔内容的处理; 将处理结果与保存的最新数据比较,计算变化率,并保存所述处理结果; 按照所述变化率的大小从高到低排序。
3、 根据权利要求1所述的方法,其特征在于,所述排序规则为根据Google 计算出来的网页级别(PR)排名进行排序,执行以下排序步骤根据所述网址列表中的网址,查找对应网站的PR值; 按照所述PR值的大小从高到低排序。
4、 根据权利要求1所述的方法,其特征在于,所述排序规则为根据Alexa 排名进行排序,执行以下排序步骤根据所述网址列表中的网址,查找对应网站的Alexa值; 按照所述Alexa值的大小从低到高排序。
5、 根据权利要求1所述的方法,其特征在于显示预定范围内的排序结果。
6、 一种网址导航系统,其特征在于,包括 存储单元,用于保存网址列表和排序结果; 数据读取单元,用于定期读取网址列表;排序单元,用于提供至少一种可供用户选择的排序规则;对应所述排序规 则,将所述网址列表中的网站排序;显示单元,用于根据用户选择或默认设置的排序规则,将对应的排序结果 按照一级分类显示。
7、 根据权利要求6所述的方法,其特征在于,所述排序规则为根据网站 首页内容变化程度进行排序,排序单元执行以下排序步骤4爪耳又网站首页内容;对所述内容进行过滤html标签和分隔内容的处理; 将处理结果与存储单元保存的最新数据比较,计算变化率,并将所述处理 结果保存在存储单元;按照所述变化率的大小从高到低排序。
8、 根据权利要求1所述的方法,其特征在于,所述排序规则为根据Google 计算出来的网页级别(PR)排名进行排序,排序单元执行以下排序步骤根据所述网址列表中的网址,查找对应网站的PR值; 按照所述PR值的大小从高到^^排序。
9、 根据权利要求1所述的方法,其特征在于,所述排序规则为根据Alexa 排名进行排序,排序单元执行以下排序步骤才艮据所述网址列表中的网址,查找对应网站的A1 exa值; 按照所述Alexa值的大小从低到高排序。
10、 根据权利要求1所述的方法,其特征在于所述显示单元显示预定范 围内的排序结果。
全文摘要
本发明公开了一种网址导航方法及系统,涉及计算机网络,用来解决现有网址导航模式类目层次太多,以及大量数据中如何快速有效地进行信息过滤和提取的问题。所述方法包括提供至少一种可供用户选择的排序规则;定期读取网址列表;对应所述排序规则,将所述网址列表中的网站排序;根据用户选择或默认设置的排序规则,将对应的排序结果按照一级分类显示。本发明只设置一级导航目录,在不增加类目层次的情况下,即可将用户想要访问的网站在最前面显示,从而避免用户需要访问多级类目的问题。而且,由于一级目录的分类范围相对较大,因此能够避免用户对网站分类理解不一致的问题。本发明所述方法能够给用户带来更好的使用体验。
文档编号G06F17/30GK101154224SQ20061014072
公开日2008年4月2日 申请日期2006年9月30日 优先权日2006年9月30日
发明者沈少峰 申请人:阿里巴巴公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1