专利名称:社会化搜索系统及搜索方法
技术领域:
本发明涉及网络搜索技术,特别是涉及一种社会化搜索系统及搜索方法。
背景技术:
现有的搜索引擎在互联网上搜集信息时主要是通过网页之间的静态链接关系来 收集数据。当现有的搜索引擎返回搜索结果时,搜索结果通常包括指向不同网站的网页的 链接,用户可以选择一个指向特定网站的链接来尝试找到感兴趣的内容。现有的搜索结果 通常针对同样的搜索请求返回相同的搜索结果。随着互联网技术的高速发展,在线网络社 区也越来越普及成熟。用户越来越关注和重视与自身有关的搜索结果,例如朋友发表的文 章、朋友针对某产品发表的评论等等。如何为搜索用户提供更为贴近用户自身的搜索结果 成为热门的研究课题。发明内容
有鉴于上述现有技术所存在的缺陷,本发明的目的在于,提供一种社会化搜索系 统及搜索方法,使其所返回的搜索结果包含社会化信息。
为了实现上述目的,依据本发明提出的一种社会化搜索系统,所述社会化搜索系 统用于搜索至少一个网络社区的多个话题,所述话题包括话题基本信息、话题关联信息、创 建该话题的创建成员信息和与该话题关联的关联成员信息,所述搜索系统包括搜索接口, 接收搜索用户提出的搜索请求,并判断该搜索用户是否为所述网络社区的社区成员;以及 话题搜索系统,从所述网络社区的多个话题中搜索与所述搜索请求匹配的话题,并将搜索 到的话题排序后将话题的链接展现给所述搜索用户。本发明的社会化搜索系统的搜索结果 中包含了网络社区的话题,因此能够提现社会化信息。
本发明还可采用以下技术措施进一步实现。
前述的社会化搜索系统,其还包括网页搜索系统,接收所述搜索请求并将网页搜 索结果展现给搜索用户。本发明的社会化搜索系统的搜索结果不仅包含话题还包括网页, 因此更为贴近用户的需求。
前述的社会化搜索系统,其还包括搜索整合模块,所述搜索整合模块将话题搜索 结果和网页搜索结果单独和/或整合展现给所述搜索用户。本发明的搜索结果展现方式多 样,便于搜索用户浏览。
前述的社会化搜索系统,其中所述的搜索整合模块根据排名要素对话题搜索结果 和/或网页搜索结果进行排名,所述排名要素选自下述一种或多种要素所述搜索请求的 社会化意图;所述搜索用户是登录该网络社区的成员时,该社区成员的社会化活跃度;所 述搜索用户是登录该网络社区的成员时,话题与该社区成员的关联度。
前述的社会化搜索系统,其中所述的搜索整合模块收集社区成员的点击、浏览、创 建话题的行为,调整所述社区成员的社会化活跃度。
前述的社会化搜索系统,其中所述的话题搜索系统包括话题索引数据库,存储所述网络社区话题的话题索引;话题搜索模块,接收搜索用户的搜索请求,从该话题索引数据 库中搜索与搜索请求相关联的话题索引;以及话题排序模块,将所述话题搜索模块搜索到 的话题索引所指向的话题进行排序。
前述的社会化搜索系统,其中所述的话题是由网络社区成员创建和/或根据热点 的热度创建;所述的话题索引数据库根据网络社区的话题实时更新话题索引。
前述的社会化搜索系统,其中所述的话题索引数据库包括话题名称索引库及话题 相关内容索引库;所述话题名称索引库的基本搜索单元是话题名称;所述话题相关内容索 弓I库的基本搜索单元是和话题关联信息。
前述的社会化搜索系统,其中所述话题排序是根据下述一种或多种因素排序话 题与搜索请求匹配程度;关注话题的成员总数;话题相关条目的总条目数;与搜索请求匹 配的话题相关条目的条目数;当搜索用户是社区成员时,话题关联成员与该搜索用户的匹 配程度;当搜索用户是社区成员时,与搜索请求匹配的话题相关条目中搜索用户的朋友参 与的数目。
前述的社会化搜索系统,其中所述的话题链接包括所述的话题基本信息。
前述的社会化搜索系统,其中所述的话题链接还包括所述的话题关联信息、所述 的创建成员信息和/或所述关联成员信息。
前述的社会化搜索系统,其中所述的话题链接还包括用于关注该话题的关注选 项。
依据本发明还提出一种搜索结果中包含社会化信息的搜索方法,其特征在于,用 于搜索至少一个网络社区中的多个话题,所述话题包括话题基本信息、话题关联信息、创建 该话题的创建成员信息和与该话题关联的关联成员信息,其特征在于搜索方法包括以下步 骤搜索请求接收步骤,接收搜索用户提出的搜索请求;以及话题搜索展现步骤,从所述网 络社区的多个话题中搜索与所述搜索请求匹配的话题,并将搜索到的话题排序后将话题链 接展现给所述搜索用户。
本发明还可采用以下技术措施进一步实现。
前述的搜索方法,其还包括网页搜索展现步骤,接收所述搜索请求并将网页搜索 结果展现给搜索用户。
前述的搜索方法,其还包括搜索整合步骤,所述搜索整合步骤包括将话题搜索结 果和网页搜索结果分别和/或整合展现给所述搜索用户。
前述的搜索方法,其中所述的搜索整合步骤还包括根据排名要素对话题搜索结果 和/或网页搜索结果进行排名步骤,所述排名要素选自下述一种或多种要素所述搜索请 求的社会化意图;所述搜索用户是登录该网络社区的成员时,该社区成员的社会化活跃度; 所述搜索用户是登录该网络社区的成员时,话题与该社区成员的关联度。
前述的搜索方法,其中所述的搜索整合步骤还包括收集社区成员的行为,调整所 述社区成员的社会化活跃度的步骤。
前述的搜索方法,其中所述的话题搜索展现步骤包括话题索引数据库建立步骤, 话题索引数据库存储所述网络社区话题的话题索引;话题搜索步骤,接收搜索用户的搜索 请求,从该话题索引数据库中搜索与搜索请求相关联的话题索引;以及话题排序步骤,将所 述话题搜索模块搜索到的话题索引所指向的话题进行排序。
前述的搜索方法,其中所述的话题是由网络社区成员创建和/或根据热点的热度 创建;所述的话题索引数据库根据网络社区的话题实时更新话题索引。
前述的搜索方法,其中所述的话题索引数据库包括话题名称索引库及话题相关内 容索引库;所述话题名称索引库的基本搜索单元是话题名称;所述话题相关内容索引库的 基本搜索单元是话题关联信息。
前述的搜索方法,其中所述的话题排序是依据话题与搜索请求关联程度和/或话 题被社区成员关注程度排序。
前述的搜索方法,其中所述的话题链接包括所述的话题基本信息。
前述的搜索方法,其中所述的话题链接还包括所述的话题关联信息、所述的创建 成员信息和/或所述关联成员信息。
前述的搜索方法,其中所述的话题链接还包括用于关注该话题的关注选项。本发 明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明的社会化搜索 系统及搜索方法,至少具有下列优点
一、本发明的社会化搜索系统及搜索方法,能够使得搜索结果包含社会化信息。
二、本发明的社会化搜索系统及搜索方法,能够利用搜索用户的社会化信息影响 返回给搜索用户的搜索结果,搜索结果更贴近搜索用户的自身需求。
三、本发明的社会化搜索系统及搜索方法,也更好地反映不同维度的对社会化 (用户共享)信息的倾向性的不同。
图1是实施本发明社会化搜索系统的网络架构的方框示意图。
图2是本发明中话题的示意图。
图3是本发明的话题搜索系统的方框示意图。
图4是本发明的话题索引数据库的示意图。
图5是本发明的话题排序模块的示意图。
图6是本发明的搜索整合系统的示意图。
图7是本发明的话题搜索结果展现示意图。
图8是本发明的话题搜索结果与网页搜索结果综合展现示意图。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合 附图及较佳实施例,对依据本发明提出的社会化搜索系统及搜索方法其具体实施方式
、步 骤、结构、特征及其功效详细说明。
本发明提出一种社会化搜索系统,用于搜索网络社区的话题,搜索结果包含社会化信息。
所述的网络社区可以是针对某一领域的专业网络社区(例如专利论坛、游戏社 区、汽车论坛、网店平台、博客平台等等),也可以是包含多领域的综合网络社区。本发明的 网络社区至少包括社区成员、社区成员关联信息及社区成员创建的话题。
话题是互联网内容聚合生成的概念的载体,很多情况下,一个话题对应于一个传统垂直网站的一个分类。例如,“数码相机”是一个典型的电子商务网站对产品的一个分类, “古龙小说”是一个在线图书小说阅读网站对小说的一个分类。但是,相对于传统垂直网站 比较固定的分类结构,在本发明中话题是由网络社区的成员生成的针对某个概念的信息聚 合的载体。
本发明中的话题可由网络社区成员自主创建生成。所述话题包括话题基本信息、 话题关联信息、创建该话题的创建成员信息和与该话题关联的关联成员信息。话题创建成 员可以输入话题基本信息,包括但不限于话题名称、话题描述、话题图片和话题分类等。话 题的主要内容通过话题名称表达(比如“数码相机”或“古龙小说”),该话题创建成员拥有 话题管理权限,可以修改、更新话题基本信息。话题关联信息包括,与该话题关联的问题、问 题的答复、该话题的评论、与该话题关联的关联成员等,话题关联信息由创建成员或/和关 联成员生成。
本发明中的“社会化信息”也可称为社交化信息,体现为网络社区中社区成员的 社交化行为,例如创建话题、修改话题基本信息、点击话题、浏览话题、与其他成员建立关系 (朋友、粉丝等)、提出问题、答复问题、关注话题、发表评论、搜索话题等等行为,但不限于 此。
本发明的社会化搜索系统至少包括,搜索接口及话题搜索系统。搜索接口接收搜 索用户提出的搜索请求,并判断该搜索用户是否为所述网络社区的登录成员;该话题搜索 系统,从所述网络社区的多个话题中搜索与所述搜索请求匹配的话题,并将搜索到的话题 排序后将话题的链接展现给所述搜索用户。本发明的社会化搜索系统,搜索结果包含社会 化信息。所述搜索请求包括搜素关键词或搜索词。
根据如下因素对话题进行排序话题名称与搜索关键词精确匹配程度;话题名称 包含搜索关键词的程度;关注话题的成员总数;话题相关条目的总条目数;与搜索词匹配 的话题相关条目的条目数。另外,搜索用户是社区成员用户时,还考虑以下因素话题关联 成员与该搜索用户的匹配程度;与搜索词匹配的话题相关条目中搜索用户的朋友参与(编 辑,关注)的数日。
本发明的社会化搜索系统还包括网页搜索系统,接收所述搜索请求并将网页搜索 结果展现给搜索用户。网页搜索系统可以是现有的搜索引擎技术,其搜索结果包括网站、网 页、博客、文章等互联网上公开资源。
本发明的社会化搜索系统还包括搜索整合模块,用于将话题搜索结果和网页搜索 结果排名后单独和/或整合展现给所述搜索用户。所述搜索整合模块根据搜索请求的社会 化意图、和/或所述搜索用户的社会化活跃度,对话题搜索结果排名或者对该话题搜索系 统排序的话题重新排名。
下面通过一个具体实施例详细说明。请参阅图1所示,是运行本发明社会化搜索 系统的网络构架的方框示意图。该网络构架包括用户终端3、网络I和服务器端8。
本发明较佳实施例的社会化搜索系统100可以安装于服务器端8,包括搜索接口 5、话题搜索系统10、网页搜索系统20及搜索整合模块30。所述社会化搜索系统100,用于 搜索网络社区的话题。所述网络社区包括社区成员、社区成员关联信息及社区成员创建的 话题;社区成员信息、社区成员关联信息存储在网络社区数据库40,话题存储在网络社区 数据库40中的话题数据库50。社区成员信息包括成员ID、地址、兴趣、年龄、性别等个人基本信息;社区成员关联信息包括成员的好友、粉丝等信息,但不以此为限。搜索用户通过用户终端3输入搜索请求,搜索请求通过网络I传递到服务器端的社会化搜索系统100 ;社会化搜索系统100返回的搜索结果在用户终端3展现给搜索用户。用户终端3具有可以输入搜索请求并展现搜索结果的模块,例如浏览器。用户终端3可以是实体装置(例如个人计算机、无线电话、个人数字助理(PDA)、笔记本电脑或其它类型的计算机或通信装置)、在这些装置中的一个上运行的线程或进程、和/或可由这些装置中的一个执行的对象。
所述的搜索接口 5接收搜索请求,并将搜索请求内容传递给话题搜索系统10和网页搜索系统20 ;所述的话题搜索系统10针对网络社区中话题进行搜索并返回话题搜索结果;所述的网页搜索系统20针对网页进行搜索并返回网页搜索结果;搜索整合模块30将话题搜索系统10搜索结果和网页搜索系统20搜索结果返回给搜索接口 5 ;搜索接口 5将最终搜索结果在用户终端3展现给搜索用户。搜索结果的展现内容,可以是综合了话题和网页搜索结果的整合搜索结果(如图7所示),也可以是仅包括话题搜索结果(如图8所示) 或网页搜索结果。
搜索用户可分为两种用户,一种是登录了网络社区的社区成员用户,另一种是没有登录网络社区的普通用户。搜索接口 5接收搜索请求时判断搜索用户是否为社区成员用户,具体是通过读取网络社区数据库40中成员信息来判断。
上述服务器端和用户终端设备在架构上都包含一些基本组件,如总线、处理装置、 存储装置、输入输出装置和通信接口等。总线可以包括一个或多个导线,用来实现服务器端或用户终端设备各组件之间的通信。处理装置包括各类型的用来执行指令、处理进程或线程的处理器或微处理器。存储装置可以包括存储动态信息的随机访问存储器(RAM)等动态存储器,和存储静态信息的只读存储器(ROM)等静态存储器,以及包括磁或光学记录介质与相应驱动的大容量存储器。输入装置供用户输入信息到服务器端或用户终端设备,如键盘、鼠标、手写笔、声音识别装置、或生物测定装置等。输出装置包括用来输出信息的显示器、打印机、扬声器等。通信接口用来使服务器端或用户终端设备与其它系统或装置进行通信。通信接口之间可通过有线连接、无线连接、或光连接到网络中,使社会化搜索系统 100、用户终端3间能够通过网络实现相互间的通信。网络可以包括局域网(LAN)、广域网 (WAN)、电话网络如公共交换电话网(PSTN)、企业内部的互联网、因特网、或上述这些网络的结合等。服务器和用户终端设备上均包含有用来管理系统资源、控制其它程序运行的操作系统软件,以及用来实现特定功能模块的应用软件。
如图2所示,是本发明中话题的示意图。话题60是由多个条目组成,包括话题名称61、话题描述63、话题创建成员信息62、问题64和答复65、66、问题提出的成员信息69、 评论67、评论的成员信息69、关注该话题的成员信息68等等,但不以此为限制,也可以包括网页、照片、图片和成员创建的其他内容。其中,话题名称61、话题描述63、话题创建成员信息62是话题基本彳目息;问题64和答复65、66、问题提出的成员/[目息69、评论67、评论的成员信息69、关注该话题的成员信息68是话题关联信息。其中其他成员提出的内容(如问题、 评论)与话题是相关联的。以问题为例,问题与话题发生关联有两种方式成员提出问题时主 动增加话题标签,比如问题是“哪款数码相机好? ”,成员可以为其添加“数码相机”话题标签,该问题“哪款数码相机好? ”显示在所有话题名称为“数码相机”的话题中,问题与话题就发生了关联。另一种是,成员提出问题时话题搜索系统10根据成员提出的问题推荐话题标签具体流程包括,将成员提出的问题转化成一个搜索词,如果提出的问题的文本内容 较多,进行基于语义分析的核心词提取,去除不重要的词或者短句;用生成的搜索词对话题 索引数据库进行搜索,将最好的话题结果作为推荐呈现给成员;成员可以选择一个或者多 个话题;问题将显示在所有同名的话题中。
话题除了由社区成员主动创建外,还可以根据热点“热度”自动创建。社会化搜索 系统100包括热点发现模块及根据热点“热度”自动创建话题模块。其热点数据来源有两 种一是成员对成员自己生成内容(UGC)打标签(比如成员提问有关数码相机的内容时,可 以对问题打上标签“数码相机”),系统将用所打的标签,查询话题数据库,如果不存在,将自 动建立一个以该标签命名的热点;二是,用户在搜索过程中对所搜索的关键词可以进行关 注,当成员关注了某个关键词后,将查询话题数据库,如果不存在,将自动建立一个以该关 键词命名的热点。该自动创建话题模块将根据热点的“热度”来确定是否自动创建为话题, 一个热点的热度信号包括(但不仅限于)以下属性以同名标签标注用户生成内容的用户 数(反映了该热点的关注该广度)、以同名标签标注用户生成内容的条目数(反映了该热 点的关注活跃度)、以与热点名相同的关键词进行关注/搜索的总数(反映了该热点的关 注持久度)、在近期以与热点名相同的关键词进行关注/搜索的总数(反映了该热点的时 鲜度);自动创建话题模块根据热点成为话题后的用户活跃度进行机器学习,自动调整“热 点”的各个热度信号的权重。
请参阅图3所示,是本发明的话题搜索系统的方框示意图。所述话题搜索系统10 包括话题索引数据库15、话题搜索模块13及话题排序模块11。
上述的话题索引数据库15根据话题数据库50的话题实时更新,存储网络社区话 题的话题索引。如图4所示,话题索引数据库15包括话题名称索引库151及话题相关内容 索引库153。话题名称索引库151,其基本搜索单元是话题名称,如果网络社区中有多个话 题名称相同的话题,会被多个搜索单元表示,即社区成员可创建话题名称相同的话题,话题 名称相同话题在网络社区中是互相独立的。话题相关内容索引库153,其基本搜索单元是话 题相关条目,例如但不仅限于其他成员针对一个话题的提问、回答、评论等。
话题名称索引库151及话题相关内容索引库153的每一个基本搜索单元由存储在 内存的一组“表征”(token)所表不。所述表征包括,属于不同性质的文本内容条目(例如 话题名称,话题描述,问题标题,问题扩展说明)中包含的词(经过切词以后的基本语义单 位);由各种数据类型(话题,成员)的ID所转化而成的在整个索引中唯一的字符串;基本 搜索单元的其他(数值,枚举,和字符串类型的)属性。属于同一个基本搜索单元的所有表 征存储在一个连续的内存空间里。每一个表征有一个索引链表(倒排表),存储(按照递增 顺序)该表征在所有基本搜索单元里出现的位置(内存地址,token position)。当沿着一 个表征的索引链表遍历时,可以通过内存地址倒算出包含该表征的当前基本搜索单元。一 个基本搜索单元的表征可以包含属性,以表示该表征的重要性和匹配方法。
话题名称索引库151以如下内容建立表征和索引话题的名称,话题的描述,所有 关注该话题的成员ID,和话题高度相关的高质量网页(例如话题所对应的百科类网页或者 官方首页)所抽取的相关信息。对于高质量网页的识别是基于如下信息,用户以话题名作 为关键词进行搜索时,点击率高而且稳定的网页;锚文本和话题名称高度吻合的网页(排 除作弊网站)。
话题相关内容索引库153以如下内容建立表征和索引话题相关条目(问题,答 案,评论)的文本信息;所关联的(一个或者多个)话题的话题ID ;关注/编辑该条目的成 员的成员ID ;话题相关内容条目的属性(例如已解答(针对问题条目)、最佳答案(针对答 案条目),及其更新时间等)。
前述的话题搜索模块13根据搜索请求,同时搜索话题名称索引库151和话题相关 内容索引库153,返回的结果包含话题名称索引库151搜索出来的高质量话题,及话题相关 内容索引库153搜索出来的话题相关条目高度关联的话题。比如搜索“索尼数码相机”时, 可能返回两类话题结果通过话题名称索引库151搜索出来的直接与“索尼数码相机”相关 的话题,比如“索尼相机”,“索尼数码相机”,“索尼单反相机”等话题;通过话题相关内容索 引库153,找到了用户创建的问题或者评论,比如比较各种型号的数码相机,再通过该问题 或评论的链表中的话题表征,查到“尼康数码相机”或“佳能数码相机”话题。
前述的话题排序模块11针对话题搜索模块13搜索的话题排序,话题排序模块11 包括话题表征权值计算模块111 (如图5所示)。话题排序包括以下步骤。步骤一,当搜索 用户是社区成员用户时,从搜索请求中取出社区成员ID,从网络社区数据库中获取影响话 题相关度的社会化信息,例如社区成员用户关注的所有社区成员(即单向的“朋友”)列表, 以及该社区成员用户的一个或多个的成员信息(比如,性别,年龄,所在城市等等)等。步 骤二,对于话题搜索模块13返回的每一个话题,从相对应的基本搜索单元的内存空间的表 征向量中获取影响话题相关度的社会化信息。步骤三,根据如下的因素对话题进行打分话 题名称与搜索词(即,搜索请求中搜索词)精确匹配(exact match)(比如搜索词为“数码 相机”,话题名也为“数码相机”);话题名包含搜索词的程度(partial match)(比如搜索词 为“数码相机”,话题名为“索尼数码相机”);关注话题的成员总数(由话题名称索引库返 回),反映了话题的受欢迎程度;话题相关条目的条目总数(由话题名索引库返回),反映了 话题的活跃程度;话题的关联成员与提出搜索请求的社区成员匹配程度,反映了话题与搜 索用户的社会化相关度(比如来自“北京市”的用户搜索,如果话题的关联成员也有很多来 自“北京市”,匹配程度较高);关注话题的成员中该搜索用户(搜索用户是社区成员用户) 的朋友的人数,反映了话题与搜索用户的社会化相关度(比如关注“数码相机”话题的关联 成员中,有很多是提出搜索请求的用户所关注的人,匹配程度较高);与搜索词匹配的话题 相关条目的条目结果数(由话题相关内容索引库返回的结果根据相关话题聚合获得),反 映了话题内容与关键词的相关度(比如“哪个数码相机好”这个问题与“数码相机”搜索词 相关,而该问题指向的话题为“索尼数码相机”,则“索尼数码相机”话题与搜索词“数码相 机”有较高的相关度);与搜索词匹配的话题相关条目的条目结果(由话题相关内容索引库 返回的结果获得)中该搜索用户(搜索用户是社区成员用户时)的朋友参与(编辑,关注) 的数目,反映了话题内容与搜索用户的社会化相关度(比如“哪个数码相机好”这个问题与 “数码相机”搜索词相关,而关注该问题的用户中,很多也是该搜索用户关注的人,该问题指 向的话题为“索尼数码相机”,则名称为“索尼数码相机”的话题与搜索词“数码相机”有较 高的相关度)。步骤四,根据话题所得分数对话题搜索模块13搜索到的话题排序。所述的 话题排序因素,通过对社区成员历史行为进行定期地机器学习来调整,即不同因素的权重 不是固定不变的,根据网络社区数据库记录的信息定期进行调整。
请参阅图6所示,是本发明的搜索整合系统30的示意图。前述的搜索整合系统30可以对话题搜索结果和/或网页搜索结果进行排名,并且将话题搜索结果和网页搜索结果 分别和/或综合展现给所述搜索用户。前述的搜索整合系统30包括搜索词社会化意图分 析模块31、用户社会化活跃度识别模块33、结果整合模块35、用户搜索行为分析反馈模块 37。
该搜索词社会化意图分析模块31,对(搜索请求的)搜索关键词的社会化意图进 行识别,识别要素包括一、搜索关键词是否为问题类型搜索词,从语法和语义上和一个问 题相似的搜索关键词相对来说更需要社会化搜索结果;二、搜索关键词是否有清晰的单一 的非主观需求,例如,包含“在线观看”或者“在线阅读”词根的搜索关键词所需要的是静态 的互联网内容,而非社会化内容;三、搜索关键词的“热度”,对于社会热点和最近发生的事 件,搜索用户相对来说更需要社会化信息,因为社会化信息补充了传统网页搜索结果的时 效性。
该用户社会化活跃度识别模块33,用于识别社区成员的社会化活跃度。一种实施 例方式中,社区成员的社会化活跃度是基于社区成员对社会化信息的参与程度、搜索历史 中对社会化结果和/或话题结果的点击率确定。社区成员对社会化信息的参与,例如是话 题创建、提出问题、答复问题、发表评论、关注的其他成员等在网络社区中的活动或行为。
该结果整合模块35,根据排名要素对话题搜索结果和/或网页搜索结果进行排 名,所述排名要素选自下述一种或多种要素所述搜索请求的社会化意图;所述搜索用户 是登录该网络社区的成员时,该社区成员的社会化活跃度;所述搜索用户是登录该网络社 区的成员时,话题与该社区成员的关联度。该结果整合模块35进一步将话题搜索结果和网 页搜素结果整合(如图7所示),整合步骤包括首先将搜索结果中的话题的权值和网页的 权值归一化;根据话题结果和网页结果的权值,从高到低排名。每一个话题结果都有一个绝 对权值,表明这个话题结果对于当前搜索词的相关度;同样的,对于每一个网页结果也有一 个绝对权值,表明该网页结果对于当前搜索词的相关度。话题的权值范围和网页的权值范 围是不同的,比如话题的权值范围是1000-5000,网页的权值范围是100-200 ;—个简单的 归一化方法是将网页的权值线性变换到1000-5000的区间,使其与话题可以直接比较。其 他实施例中,变换的条件复杂,往往不是线性的,而是根据不同区间有不同的匹配函数,区 间的划分是动态的,对于不同类型的搜索词,区间的划分粒度和变换函数都可能不同。整合 后排名结果中可以有一个或多个话题结果,话题结果出现的位置视其相对网页结果的权值 排名而定(如图7所述)。
该用户搜索行为分析反馈模块37,收集社区成员的点击、浏览、创建话题的行为, 调整所述社区成员的社会化活跃度和整合模块中的变换函数。比如对于搜索词“数码相 机”,初始的整合模块将“索尼数码相机”话题放在了整合搜索页的第四位,但从搜索用户 (社区成员用户)的行为来看,社区成员经常点击该话题,点击率超过了排在它之前的网页 结果,那么会对变换函数进行调整,增加该话题的权值,未来它可能会出现在更高的位置。 搜索行为分析反馈模块37定期将数据反馈给整合模块,整合模块35利用机器学习定期调 整整合算法。
本实施例的搜索结果展现方式有三种,一种是如图7所示话题和网页的整合展现 方式,另一种是如图8所示的话题单独展现方式,在一种网页单独展现方式(未图示)。搜 索用户可以点击搜索结果中话题链接或网页链接,进入该话题或网页。话题链接中,至少包括话题名称,还可以包括话题其他基本信息、话题关联信息、话题关注成员人数。话题链接 中还可以包括关注该话题的关注选项。
本实施例的社会化搜索系统的社会化搜索结果不仅反映在搜索用户的社会化信 息会影响话题搜索结果,而且也反映在(搜索请求的)搜索关键词的社会化意图影响搜索 结果。不同维度的对社会化(用户共享)信息的倾向性的不同。不同搜索用户对社会化信 息的不同倾向性,例如,一个在微博和脸谱(Facebook)等网络社区上很活跃用户更为乐于 见到搜索结果中包含社会化相关度高的话题结果;所有用户作为一个整体对不同类别的搜 索关键词的社会化信息的不同倾向性,例如,搜索词“步步惊心”普遍地来说更需要社会化 相关度高的结果,因为朋友对这部最新的电视连续剧的看法是搜索用户所乐于见到的;而 搜索词“射雕英雄传在线观看”则不需要太多的社会化信息,因为大量的网页结果已经包含 了用户所需要的内容。
上述本发明示例实施例的描述并非是要穷尽或将本发明限定在所公开的特定形 式。例如,尽管关于图7描述了一系列步骤,这些步骤的顺序可以在与本发明一致的其它实 施方式中被改变。另外,非从属性的步骤可以被并行实现。
虽然本发明已以较佳实施例揭露如上,然并非用以限定本发明实施的范围,依据 本发明的权利要求书及说明内容所作的简单的等效变化与修饰,仍属于本发明技术方案的 范围内。
权利要求
1.一种社会化搜索系统,其特征在于,所述社会化搜索系统用于搜索至少一个网络社区的多个话题,所述话题包括话题基本信息、话题关联信息、创建该话题的创建成员信息和与该话题关联的关联成员信息,所述搜索系统包括 搜索接口,接收搜索用户提出的搜索请求,并判断该搜索用户是否为所述网络社区的社区成员;以及 话题搜索系统,从所述网络社区的多个话题中搜索与所述搜索请求匹配的话题,并将搜索到的话题排序后将话题的链接展现给所述搜索用户。
2.如权利要求1所述的社会化搜索系统,其特征在于其还包括网页搜索系统,接收所述搜索请求并将网页搜索结果展现给搜索用户;所述社会化搜索系统还包括搜索整合模块,所述搜索整合模块将话题搜索结果和网页搜索结果单独和/或整合展现给所述搜索用户; 其中所述的搜索整合模块根据排名要素对话题搜索结果和/或网页搜索结果进行排名,所述排名要素选自下述一种或多种要素 所述搜索请求的社会化意图; 所述搜索用户是登录该网络社区的成员时,该社区成员的社会化活跃度; 所述搜索用户是登录该网络社区的成员时,话题与该社区成员的关联度。
3.如权利要求1所述的社会化搜索系统,其特征在于其中所述的话题搜索系统包括 话题索引数据库,存储所述网络社区话题的话题索引; 话题搜索模块,接收搜索用户的搜索请求,从该话题索引数据库中搜索与搜索请求相关联的话题索引;以及 话题排序模块,将所述话题搜索模块搜索到的话题索引所指向的话题进行排序。
4.如权利要求3所述的社会化搜索系统,其特征在于其中所述的话题是由网络社区成员创建和/或根据热点的热度创建;所述的话题索引数据库根据网络社区的话题实时更新话题索引。
5.如权利要求1或4所述的社会化搜索系统,其特征在于其中,话题排序是根据下述一种或多种因素排序 话题与搜索请求匹配程度; 关注话题的成员总数; 话题相关条目的总条目数; 与搜索请求匹配的话题相关条目的条目数; 当搜索用户是社区成员时,话题关联成员与该搜索用户的匹配程度; 当搜索用户是社区成员时,与搜索请求匹配的话题相关条目中搜索用户的朋友参与的数目。
6.一种社会化搜索方法,其特征在于,用于搜索至少一个网络社区中的多个话题,所述话题包括话题基本信息、话题关联信息、创建该话题的创建成员信息和与该话题关联的关联成员信息,所述的搜索方法包括以下步骤 搜索请求接收步骤,接收搜索用户提出的搜索请求;以及 话题搜索展现步骤,从所述网络社区的多个话题中搜索与所述搜索请求匹配的话题,并将搜索到的话题排序后将话题链接展现给所述搜索用户。
7.如权利要求6所述的搜索方法,其特征在于其还包括网页搜索展现步骤,接收所述搜索请求并将网页搜索结果展现给搜索用户;所述社会化搜索系统还包括搜索整合步骤,包括将话题搜索结果和网页搜索结果单独和/或整合展现给所述搜索用户; 其中所述的搜索整合步骤还包括根据排名要素对话题搜索结果和/或网页搜索结果进行排名步骤,所述排名要素选自下述一种或多种要素 所述搜索请求的社会化意图; 所述搜索用户是登录该网络社区的成员时,该社区成员的社会化活跃度; 所述搜索用户是登录该网络社区的成员时,话题与该社区成员的关联度。
8.如权利要求6所述的搜索方法,其特征在于其中所述的话题搜索展现步骤包括 话题索引数据库建立步骤,话题索引数据库存储所述网络社区话题的话题索引; 话题搜索步骤,接收搜索用户的搜索请求,从该话题索引数据库中搜索与搜索请求相关联的话题索引;以及 话题排序步骤,将所述话题搜索模块搜索到的话题索引所指向的话题进行排序。
9.如权利要求8所述的搜索方法,其特征在于其中所述的话题是由网络社区成员创建和/或根据热点的热度创建;所述的话题索引数据库根据网络社区的话题实时更新话题索引。
10.如权利要求6或8所述的搜索方法,其特征在于其中,话题排序是根据下述一种或多种因素排序 话题与搜索请求匹配程度; 关注话题的成员总数; 话题相关条目的总条目数; 与搜索请求匹配的话题相关条目的条目数; 当搜索用户是社区成员时,话题关联成员与该搜索用户的匹配程度; 当搜索用户是社区成员时,与搜索请求匹配的话题相关条目中搜索用户的朋友参与的数目。
全文摘要
本发明是有关一种社会化搜索系统及搜索方法。该社会化搜索系统,用于搜索至少一个网络社区的多个话题,所述话题包括话题基本信息、话题关联信息、创建该话题的创建成员信息和与该话题关联的关联成员信息,其包括搜索接口,接收搜索用户提出的搜索请求,并判断该搜索用户是否为所述网络社区的社区成员;以及话题搜索系统,从所述网络社区的多个话题中搜索与所述搜索请求匹配的话题,并将搜索到的话题排序后将话题的链接展现给所述搜索用户。该社会化搜索方法,包括以下步骤接收搜索用户提出的搜索请求;以及从所述网络社区的多个话题中搜索与所述搜索请求匹配的话题,并将搜索到的话题排序后将话题链接展现给所述搜索用户。本发明的搜索结果包含社会化信息,更贴近搜索用户的需求。
文档编号G06F17/30GK103034672SQ20121008202
公开日2013年4月10日 申请日期2012年3月26日 优先权日2011年9月29日
发明者刘骏, 孙峥, 盛佳, 李大海, 王东, 陈利人, 曲径, 项锟, 安兴华, 马俊, 寇黎钦, 马剑, 张晓鑫 申请人:云壤(北京)信息技术有限公司