技术总结
本发明实施例公开了一种网页中内容块的提取方法、装置及服务器。该方法包括:当获取到搜索网页后,构建所述搜索网页的标签树,其中,所述标签树中的各节点对应所述搜索网页中的一个内容块;从所述标签树中筛选出与搜索主题相关的内容块;根据所述内容块对应的节点所包含的标签获取所述内容块的权重值;将所述搜索主题中的关键词在所述内容块中出现的频率与所述权重值的乘积结果赋值于所述内容块的相关度值;按照与所述搜索主题相关的各内容块的相关度值大小进行排序后,提取所述各内容块。采用本发明实施例,提高了垂直搜索的搜索结果的精准度。
技术研发人员:郑仕腾;
受保护的技术使用者:北京金山安全软件有限公司;
文档号码:201511031541
技术研发日:2015.12.31
技术公布日:2016.07.20