搜索结果显示方法、装置及搜索系统的制作方法
【技术领域】
[0001]本发明涉及搜索领域,特别是涉及一种搜索结果显示方法、装置及搜索系统。
【背景技术】
[0002]目前,搜狗、百度等搜索引擎大都会在搜索结果中的某些网站主入口的下方展现网站内的某些热点频道,以缩短用户到达自己所感兴趣的子频道的点击步骤,提升用户的搜索体验。
[0003]但是现有搜索引擎往往是通过人工运营或者直接抓取网站的导航频道的方法来抽取网站下的子频道,将其展现于搜索结果中网站主入口的下方。通过人工运营或者直接抓取网站的导航频道的方法对搜索结果进行调整在一定程度上可以方便用户点击,提升用户的浏览体验。但是人工运营成本较高,而直接抓取网站的导航频道的方法局限性又太强。并且用户进入一个网站后并不一定最常访问网站的子频道,也有可能访问个人中心,用户登录等非导航频道页面,而现有的搜索结果显示方法往往只关注导航栏内的子频道,因此基于现有的搜索结果显示方法难以将网站中用户访问度较高的某些非导航类子频道(如淘宝网下的“我的淘宝”频道)显示在搜索结果中网站主入口的下方。
[0004]因此,需要一种搜索结果显示方法、装置及搜索系统,其能够更加方便且灵活地在搜索结果中网站主入口的下方显示网站子频道入口。。
【发明内容】
[0005]本发明要解决的一个技术问题是提供一种搜索结果显示方法、装置及搜索系统,其能够更加方便且灵活地在搜索结果中网站主入口的下方显示网站子频道入口。根据本发明的一个方面,公开了一种搜索结果显示方法,包括调整搜索结果布置方案,该调整搜索结果布置方案的步骤包括:获取搜索结果中的至少一个网站的网站热力图,网站热力图能够反映网站中多个页面的访问热度;基于网站热力图,在网站的多个页面中选出访问热度排名靠前的至少一个页面,为其配置相应的锚文本;将配置好的锚文本布置在网站的主入口的下方。
[0006]由此,对于搜索结果中的某个网站,就可以根据该网站中多个页面的访问热度,选出访问热度排名靠前的一个或多个页面,为其配置相应的锚文本,然后将配置好的锚文本显示在网站的主入口的下方。这样,就可以将访问热度较高的页面作为网站的导航页显示在搜索结果中。
[0007]优选地,该方法中获取网站的网站热力图的步骤可以包括:获取一段时间内多个用户访问网站的历史访问记录;针对历史访问记录中的每条访问记录,选取访问记录中的当前访问页面和与当前访问页面相对应的父页面作为节点,构建从父页面指向当前访问页面的有向边;对于网站中的任一页面,将其作为父页面出现的次数,作为该页面的访问热度;基于多条有向边构成网站的网站热力图。
[0008]由此,可以根据网站的访问记录,构建能够反映网站中多个页面的访问热度的网站热力图,使得基于构建的网站热力图就可以直观地了解网站中多个页面的访问情况。
[0009]优选地,该方法中获取网站的网站热力图的步骤还可以包括:对于任一有向边,如果该有向边所对应的父页面的访问热度不明显大于子页面的访问热度,和/或该有向边所对应的父页面的url深度大于子页面的url深度,和/或该有向边的权重小于预设值,其中,权重对应于该有向边在历史访问记录中出现的次数,和/或该有向边所对应的父页面到子页面的访问行为属于非正常点击行为,则剔除该有向边,其中,基于保留下来的多条有向边构成网站的网站热力图。
[0010]由此,基于筛选后的有向边所构成的网站热力图能够较为准确地反映出网站中访问热度较高的页面。
[0011]优选地,该方法中获取网站的网站热力图的步骤还可以包括:计算网站热力图中每一节点在一段预设时间内单位时间的访问热度的标准差;对于任一有向边,如果有向边所对应的任一节点的标准差大于预设标准差值,则剔除该有向边,其中,基于保留下来的多条有向边构成网站的网站热力图。
[0012]由此,可以避免突发热点事件带来的影响,进一步保证了所构造的网站热力图的准确度。
[0013]优选地,该方法中为其配置相应的锚文本的步骤可以包括:对于访问热度排名靠前的多个页面中的每个页面,对该页面的所有外链进行分析,选出质量较高的外链所对应的链接文本和/或出现次数较多的链接文本作为文本关键词,基于该文本关键词建立页面的锚文本;或对一段时间内用户访问该页面时所点击的链接进行分析,选出质量最高的链接所对应的链接文本和/或出现次数最多的链接文本作为文本关键词,基于该文本关键词建立页面的锚文本;或在页面的url包含文字字符串时,将文字字符串作为文本关键词,根据该文本关键词建立页面的锚文本;或选取页面的标题作为文本关键词,根据该文本关键词建立页面的锚文本。
[0014]由此,基于上述多种配置方式,可以为页面配置能够反映页面内容的锚文本。
[0015]优选地,该方法种为其配置相应的锚文本的步骤还可以包括:将锚文本中的文本关键词与预先存储的数据库进行比对,将不适于显示在搜索结果中的文本关键词所对应的锚文本剔除,其中,数据库存储有不能体现页面内容属性的词语或短句。由此,可以进一步保证所配置的锚文本的准确性。
[0016]优选地,该方法还可以包括:获取一段时间内多个用户的搜索记录,搜索记录包括搜索词、基于搜索词得到的多个搜索结果以及用户对各个所述搜索结果的点击信息;对于所述搜索记录中的至少一个搜索词,在用户对基于该搜索词得到的一个或多个搜索结果的点击次数高于预设值时,将一个或多个搜索结果所对应的网站标记为中意网站;响应于再次收到基于搜索词的搜索请求,执行调整搜索结果布置方案的步骤,将锚文本布置在中意网站的主入口的下方。
[0017]由此,可以根据用户的搜索记录,事先挖据出具有明确寻址意图的搜索词、和该搜索词下的中意网站,在以后的搜索中,对于一些寻址意图不强烈的搜索词,可以不触发执行本发明的搜索结果布置方案,而对于被标记为具有明确寻址意图的搜索词,可以触发执行本发明的搜索结果布置方案,为该搜索词所对应的中意网站中访问热度排名靠前的多个页面配置相应的锚文本,并将其布置在对应的中意网站的主入口的下方,以方便用户点击。
[0018]优选地,该方法还可以包括:获取一段时间内多个用户的页面浏览记录;根据页面浏览记录,选出浏览量高于预设值的网站,作为热点网站;当搜索结果中含有热点网站时,执行调整搜索结果布置方案的步骤,将锚文本布置在热点网站的主入口的下方。
[0019]由此,可以将点击量较高的网站认为是用户普遍比较感兴趣的网站,当搜索结果中存在这些网站时,就可以调整搜索结果布置方案,为这些网站中访问热度较高的页面配置相应的锚文本,并将其显示在相应的网站的主入口的下方,以便于用户点击。
[0020]优选地,该方法还可以包括:获取一段预定时间内搜索结果中网站和/或网站的主入口下方的锚文本的点击率;优化搜索结果布置方案,将点击率较高的锚文本布置在网站的主入口的下方,和/或删除点击率低于预设值的网站和/或锚文本。
[0021]由此,可以实时根据用户的点击情况,调整搜索结果布置方案,使得显示的搜索结果可以符合用户的点击情况。
[0022]优选地,该方法还可以包括:基于用户的浏览记录,获取用户对网站中多个页面的浏览兴趣分;统计网站主入口的下方的锚文本的点击记录,得出点击次数最多的锚文本的展示位置;优化搜索结果布置方案,将用户浏览兴趣分最高的页面的锚文本布置在展示位置。
[0023]由此,可以根据用户的浏览记录,将用户比较感兴趣的页面个性化地展示在比较符合用户浏览习惯的位置。
[0024]根据本发明的另一个方面,还公开了一种搜索结果显示装置,包括调整搜索结果布置模块,调整搜索结果布置模块包括:网站热力图获取模块,用于获取搜索结果中的至少一个网站的网站热力图,网站热力图能够反映网站中多个页面的访问热度;锚文本配置模块,用于基于网站热力图,在网站的多个页面中选出访问热度排名靠前的多个页面,为其配置相应的锚文本;锚文本布置模块,用于将锚文本布置在网站的主入口的下方。
[0025]优选地,该装置中的网站热力图获取模块可以包括:历史访问记录获取模块,用于获取一段时间内多个用户访问网站的历史访问记录;有向边构建模块,用于针对历史访问记录中的每条访问记录,选取访问记录中的当前访问页面和与当前访问页面相对应的父页面作为节点,构建从父页面指向当前访问页面的有向边,网站热力图构成模块,用于基于多条有向边构成网站的网站热力图,并将网站中的任一页面作为父页面出现的次数,作为该页面的访问热度。
[0026]优选地,对于访问热度排名靠前的多个页面中的每个页面,锚文本配置模块对该页面的所有外链进行分析,选出质量最高的外链所对应的链接文本和/或出现次数最多的链接文本作为文本关键词,基于该文本关键词建立页面的锚文本;或锚文本配置模块对一段时间内用户访问该页面时所点击的链接进行分析,选出质量最高的链接所对应的链接文本和/或出现次数最多的链接文本作为文本关键词,基于该文本关键词建立页面的锚文本;或在页面的url包含文字字符串时,锚文本配置模块将文字字符串作为文本关键词,根据该文本关键词建立页面的锚文本;或锚文本配置模块选取页面的标题作为文本关键词,根据该文本关键词建立页面的锚文本。
[0027]优选地,该装置还可以包括:搜索记录获取模块,用于获取一段时间内多个用户的搜索记录,搜索记录包括搜索词、基于搜索词得到的多个搜索结果以及用户