一步包括:当用户在当前网页上点击被标注的一个关键词时,由该关键词对应的搜索脚本代码向搜索引擎发送包含该关键词搜索请求,获得该关键词的搜索结果;跳转到该关键词的搜索结果页面。
[0038]对网页内容的关键词进行标注,也方便了用户利用关键词进行搜索的操作。用户只需要在当前网页上点击已经标注过的关键词,就可以直接跳转到与该关键词对应的搜索结果页面,不必再选中关键词,复制粘贴到搜索引擎,简化了利用关键词进行搜索的步骤。
[0039]在本发明的一个实施例中,图1所示方法中,当用户访问网站的网页时,由浏览器向服务器发送包含当前网页URL的关键词标注请求。
[0040]在本发明的一个实施例中,图1所示方法的步骤SllO中所述向服务器发送包含当前网页URL的关键词标注请求包括:
[0041]将关键词标注请求发送到实现流量负载均衡的Linux虚拟服务器LVS系统,由该LVS系统将关键词请求发送到服务器。
[0042]Linux虚拟服务器(Linux Virtual Server,LVS)是一个虚拟的服务器集群系统,通过采用LVS系统,能够增加吞吐量、加强数据处理能力、提高网络的灵活性和可用性。通过将关键词标注请求发送到实现流量负载均衡的Linux虚拟服务器LVS系统,由该LVS系统将关键词请求发送到服务器实现了服务器集群的负载均衡和故障转移。
[0043]与前述实现在网页上标注关键词的方法相对应,本发明还提供了一种实现在网页上标注关键词的装置,图2示出了根据本发明一个实施例的一种实现在网页上标注关键词的装置的框图。参见图2该实现在网页上标注关键词的装置200包括:
[0044]关键词请求发送单元210,适于当用户访问网站的网页时,向服务器发送包含当前网页URL的关键词标注请求;
[0045]接收单元220,适于接收服务器返回的所述当前网页中包含的一个或多个关键词以及与各关键词分别对应的搜索脚本代码;
[0046]标注单元230,适于在对当前网页进行加载渲染时,基于各个搜索脚本代码分别对当前网页中包含的一个或多个关键词进行标注。
[0047]通过本发明的这种实现在网页上标注关键词的装置200,能够实现对用户访问的网站对应的网页上的关键词进行标注,突出显示,方便用户查看和进一步操作。
[0048]在本发明的一个实施例中,该实现在网页上标注关键词的装置200进一步包括:
[0049]搜索单元,当用户在当前网页上点击被标注的一个关键词时,利用该关键词对应的搜索脚本代码向搜索引擎发送包含该关键词搜索请求,获得该关键词的搜索结果;并跳转到该关键词的搜索结果页面。
[0050]在本发明的一个实施例中,关键词请求发送单元210,适于将所述关键词标注请求发送到实现流量负载均衡的Linux虚拟服务器LVS系统,由该LVS系统将所述关键词请求发送到所述服务器。
[0051]需要说明的是,本发明实施例的这种实现在网页上标注关键词的装置是和前述的实现在网页上标注关键词的方法相对应的,因此,本实施例的这种实现在网页上标注关键词的装置的工作过程可以参见前述的实现在网页上标注关键词的方法部分的相应说明,在此不再赘述。
[0052]图3示出了根据本发明一个实施例的一种浏览器客户端的框图,参见图3,本发明一个实施例的浏览器客户端300包括:本发明前述实施例中的实现在网页上标注关键词的装置200。
[0053]用户通过本发明的这种浏览器客户端访问网站的网页时,浏览器客户端会向服务器发送包含当前网页URL的关键词标注请求;并接收服务器返回的当前网页中包含的一个或多个关键词以及与各关键词分别对应的搜索脚本代码;这样在加载和渲染当前网页时,呈现出当前网页中包含的一个或者多个关键词已标注的效果,提升了经浏览器客户端访问网站的使用体验。
[0054]本发明还提供了一种实现在网页上标注关键词的系统,图4示出了根据本发明一个实施例的一种实现在网页上标注关键词的系统的框图,参见图4,该实现在网页上标注关键词的系统400包括:浏览器客户端300,以及服务器410。
[0055]在本发明的一个实施例中,服务器410,适于接收浏览器客户端300侧发来的包含网页URL的关键词标注请求;基于关键词请求中包含的网页URL,提取网页URL的文本信息;查找上述文本信息中与关键词字典对应的一个或多个关键词;将所查找到的一个或多个关键词以及与关键词分别对应的搜索脚本代码返回给浏览器客户端300。
[0056]在本发明的一个实施例中,该服务器410进一步包括:数据库单元,适于存储关键词数据库;关键词查询单元,适于根据关键词请求中包含的网页URL,从关键词数据库中查找出对应的一个或多个关键词;其中,关键词数据库中对应保存有网页URL和网页URL所指网页中包含的关键词。可选地,数据库单元中采用Redis存储关键词数据库,并采用主从备份。
[0057]在本发明的一个实施例中,服务器410进一步包括:
[0058]热词加载单元,适于将关键词数据库中的查询频率大于预设值的热门数据加载到内存中;关键词查询单元,适于根据关键词请求中包含的网页URL,先查询内存,再查询关键词数据库。
[0059]在本发明的一个实施例中,服务器410进一步包括离线制作关键词数据库的装置,具体包括:
[0060]URL获取单元,适于获取URL列表;
[0061]网页抓取单元,适于利用网络蜘蛛抓取URL列表中的各URL对应的网页HTML代码;
[0062]正文抽取单元,适于从网页HTML代码中抽取网页正文相关信息;
[0063]关键词提取单元,适于从网页正文相关信息中提取关键词。
[0064]在本发明的一个实施例中,服务器410的关键词字典生成单元,适于从包括如下中的一种或多种的来源中获取关键词添加到关键词字典中:
[0065]机构名称;
[0066]搜索机构提供的“百科”库中词;
[0067]滑词,即用户在浏览网页时,在网页上选中并进行搜索的词;
[0068]搜索机构提供的“实体库”中的词,所示实体库中规定了实体之间的关系。
[0069]本发明实施例的这种实现在网页上标注关键词的系统400,能够在用户通过浏览器客户端300访问网站的网页时,服务器410能够返回查找到的一个或多个关键词以及与关键词分别对应的搜索脚本代码的网页上的关键词对应的搜索脚本代码,以使得浏览器客户端加载渲染后,呈现出用户感兴趣的词语/句子等关键词进行了标注的效果,提升了用户体验。
[0070]综上所述,本发明的这种实现在网页上标注关键词的方法、装置和系统能够实现对用户访问的网站的网页上的关键词进行标注,突出显示,方便用户查看,简化了用户利用网页上被标注的关键词进行搜索的操作,提升了用户使用体验。此外,本发明还提供了一种浏览器客户端来运行本发明实施例的这种实现在网页上标注关键词的装置,实现了对网页上的关键词进行标注的效果。
[0071]需要说明的是:
[0072]在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的