使用相关用户的数据来增强web搜索的制作方法

文档序号:6479639阅读:203来源:国知局
专利名称:使用相关用户的数据来增强web搜索的制作方法
使用相关用户的数据来增强web搜索背景在许多情况下,使用搜索引擎来搜索信息。一般而言,搜索引擎是被设计成帮助寻 找存储在例如公共服务器或一个人自己的个人计算机等计算机上的文件(例如,网页、图 像、文本……)的特殊程序(例如计算机可执行指令)。典型的搜索引擎让用户能够发动 针对满足特定准则的文件,例如标题或正文中包含给定词或短语的文件的查询。web搜索 引擎一般通过存储与通过跟随所定位到的基本上每一个链接的web爬行器(crawler)或自 动化web浏览器从万维网(WWW)检索到的大量网页有关的信息来工作。随后分析每一网页 的内容来确定其应被如何索引,例如可以从标题、题目、或被称为元标签的特殊字段中提取 文字。关于网页的数据被存储在索引数据库中以供在稍后查询时使用。一些搜索引擎存储 (或高速缓存)源页面的全部或部分以及关于网页的信息。在用户通过提供关键词来通过 web搜索引擎发动查询时,该web搜索引擎查找索引并提供最匹配准则的网页的列表,其通 常具有包含文档的标题和/或正文的各部分的简短概述。一般而言,搜索引擎的有用性取决于其向用户呈现的结果的相关度以及这些结果 的呈现。尽管可能有包括特定词或短语的许多网页,但一些网页可能比其他网页更相关、更 流行或更具权威性。大多数搜索引擎采用各种方法来对结果进行排名,以首先提供“最佳” 结果。搜索引擎如何决定哪些网页是最佳匹配以及结果应以什么顺序显示都随引擎而广泛 变化。按照惯例,用于向用户显示搜索引擎认为是关于网页的相关信息的内容的技术可以 基于静态排名和动态排名。换言之,传统上,查询结果是基于关于结果质量的静态信息(例 如链接的数量和与这些链接相关联的通信量)和关于结果与查询的相关度的动态信息(如 查询项在结果中出现的次数)来进行排名的。因此,没有提到查询项的特定网页可能因为 这一网页中的链接具有相对高的通信量而被排得很高。具体而言,静态排名可以涉及查看 有多少其他网页链接到一网页以及在该页面上与搜索项的匹配的密度。动态排名可以涉及 查询项在文档中的频率或在一链接出现在该查询的搜索结果中之后在用户每次点击该链 接时使得页面排名稍更高一些。通常,筛选并浏览因特网搜索结果以标识相关或适用信息。例如,在搜索引擎上使 用特定项的搜索可产生各个具体结果,其中一个结果对第一用户而言是重要的并且使其满 意,而不同的结果可能对第二用户而言是重要的并且使其满意。当前对搜索结果“个性化” 的研究尝试通过利用个人的数据(例如,机器上的内容的索引、过去的web访问、查询历史 等)来增强web搜索体验以定制搜索结果。例如,可以对搜索结果重新排名以使得与用户 机器上的文档相似的结果排名更高。另外,可以对web搜索结果重新排名以使得个人在过 去访问的结果排名更高。一般而言,web搜索结果的个性化可以证明是用户因特网浏览体 验的重要因素。概述以下提出了本发明的简化描述以便提供对在此描述的某些方面的基本理解。本概 述并不是对所要求保护的主题的全面综述。它既不旨在标识所要求保护的主题的关键或重 要要素,也不描绘本发明的范围。其唯一目的是以简化的形式来介绍所要求保护的主题的
4一些概念,作为稍后呈现的更为详细的描述的序言。本发明涉及便于通过将用户的个人内容与一个或多个相关用户的内容进行组合 以产生个性化结果来增强web搜索结果的系统和/或方法。个性化组件可以基于评估来自 用户的个性化内容和组成员关系来提供对该用户特定的增强查询结果。组成员关系可以基 于显式(例如,基于相似人口统计、工作角色、或显式兴趣)或隐式(例如,基于具有相关数 据或发出了相似查询)。因此,组成员关系可以基于具有相关数据或基于具有共同兴趣、任 务、或组成员之间的其他关系。一般而言,可以通过分析与用户和/或伙伴组成员相关联的 个性化内容的一部分来标识兴趣、关系、或充分相似的相互关系。因此,web个性化努力通 过将个人的数据与其他相关的人的数据进行组合而得到增强。根据本发明的一个方面,个性化组件可以充分利用该组来向该组的特定成员提供 相关搜索结果。个性化组件可以提供编组化排名(例如,生成每一组成员与每一搜索结果 的相关度的各单独的个性化分数并对每一个性化分数求和以得到组分数)、智能划分技术 (例如,将搜索查询结果分发给该组的成员以进行并行评估)、和/或组查询扩展(例如,通 过评估来自该组的成员的相关搜索查询来加宽搜索查询)。在所要求保护的主题的其他方 面,提供了便于实现共享web任务来增强web搜索结果的个性化的方法。以下描述和附图详细阐明了所要求保护的主题的某些说明性方面。然而,这些方 面仅指示了可采用本发明的原理的各种方法中的几种,且所要求保护的主题旨在包括所有 这些方面及其等效方面。当结合附图考虑以下本发明的详细描述时,所要求保护的主题的 其他优点和新颖特征将变得显而易见。附图简述

图1示出便于通过将用户的个性化内容与一个或多个相关用户的内容进行组合 以产生个性化结果来增强web搜索结果的示例性系统的框图。图2示出便于标识具有相关个性化内容的一组用户以便能够生成个性化web搜索 结果的示例性系统的框图。图3示出方便基于将用户专用内容与相关组成员进行组合来优化使用搜索引擎 的个性化web搜索结果的示例性系统的框图。图4示出方便定义组个性化web搜索选项来提供定制搜索结果的示例性系统的框 图。图5示出方便实现共享web任务以增强web搜索结果的个性化的示例性系统的框 图。图6示出根据本发明的方便推断用户之间的关系并方便接口的示例性系统的框 图。图7示出用于通过将用户的个性化内容与一个或多个相关用户的内容进行组合 以产生个性化结果来增强web搜索结果的示例性方法。图8示出方便实现共享web任务以增强web搜索结果的个性化的示例性方法。图9示出其中可采用所要求保护的主题的新颖方面的示例性联网环境。图10示出根据所要求保护的主题可采用的示例性操作环境。详细描述所要求保护的主题参考附图来描述,所有附图中使用相同的附图标记来指代相同的元素。在以下描述中,为解释起见,阐明了众多具体细节以提供对本发明的全面理解。然 而,很明显,所要求保护的主题可以在没有这些具体细节的情况下实施。在其他情况下,以 框图形式示出了公知的结构和设备以便于描述本发明。如在此使用的,术语“组件”、“系统”、“接口”、“引擎”、“存储”等指的是计算机相关 的实体,它们可以是硬件、软件(例如,执行中的)和/或固件。例如,组件可以是运行在处 理器上的进程、处理器、对象、可执行码、程序、函数、库、子例程、和/或计算机或软件和硬 件的组合。作为说明,运行在服务器上的应用程序和服务器都可以是组件。一个或多个组件 可驻留在一个进程内,且组件可位于一台计算机上和/或分布在两台或更多计算机之间。此外,所要求保护的主题可以使用产生控制计算机以实现所公开的主题的软件、 固件、硬件或其任意组合的标准编程和/或工程技术而被实现为方法、装置或制品。在此 使用的术语“制品,,旨在涵盖可以从任何计算机可读设备、载体或介质访问的计算机程序。 例如,计算机可读介质可以包括但不限于磁存储设备(例如,硬盘、软盘、磁带……)、光盘 (例如,紧致盘(⑶)、数字多功能盘(DVD)……)、智能卡和闪存设备(例如,卡、棒、钥匙驱 动器……)。另外应该明白,可以使用载波来承载计算机可读电子数据,例如那些用于发送 和接收电子邮件或用于访问如因特网或局域网(LAN)等网络的数据。当然,本领域的技术 人员将会认识到,在不背离所要求保护的主题的范围或精神的前提下可以对这一配置进行 许多修改。此外,在此使用词语“示例性”意指用作示例、实例或说明。在此被描述为“示例 性”的任何方面或设计并不一定要被解释为相比其他方面或设计更优选或有利。现在转向附图,图1示出方便通过将用户的个人内容与一个或多个相关用户的内 容进行组合以产生个性化结果来增强web搜索结果的系统100。系统100可包括可基于经 由接口组件106(例如,在以下更详细地讨论)接收到的与两个更多用户相关的查询和个性 化内容来生成个性化查询结果104的个性化组件102。一般而言,个性化组件102可以收集 两个或更多个用户的用户专用数据,其中可以充分利用这些所组合的组专用数据来标识更 相关的搜索结果(例如,个性化查询结果104)。因此,可以利用具有相关个人内容或数据的 两个或更多个用户来参与共享web搜索任务以产生个性化查询结果104。例如,一组用户可以提供可被充分利用来为该组的各单独成员标识个性化搜索结 果的共享背景或兴趣。在一个示例中,一组用户可以基于任何合适的准则或特征,诸如但不 限于职业数据(例如,工作经历、职业、证书等)、地理数据(例如,住处、位置等)、个人信 息(例如,姓名、年龄、传统、税级等)、消费数据(例如,所拥有的财产、所使用的电子设备、 所赚的钱、所花的钱等)、组织数据(例如,成员关系、成员关系的持续时间等)、浏览的数据 (例如,网站访问、所查看的图像、所使用的媒体等)、个人兴趣(例如,喜好、厌恶等)、和/ 或可用来将两个或更多个人分类或编组的任何其他信息。因此,具有相关兴趣或背景的一 组成员可以用来为该组的一成员标识更准确的搜索结果。在一示例中,用户可以与对特定内容(例如,项目、商品、服务等)感兴趣的一组用 户一起参与协作web搜索。通过利用该组成员和相应的相关兴趣,可以向该组成员中的每 一个提供更准确和相关的搜索结果。在一个具体示例中,可以计算每一个组成员的排名或 分数,其中该分数或排名反映每一个成员的兴趣的相关度。可为组成员计算这一分数或排 名的平均,其中可以对搜索结果进行排序或过滤。因而,充分利用组成员来标识搜索结果的 平均排名。在另一示例中,该组的成员可被用来提供协作搜索,其中该组的第一成员提供查询而该组的各不同成员提供对搜索结果的并行评估。在又一示例中,组成员查询可以通过 包括该组的其他成员发起的相关查询来扩展。一般而言,利用具有相关兴趣或个性化内容 的一组成员可最优地增强搜索和/或查询数据。另外,系统100可包括任何合适的和/或必要的接口组件106 (在此被称为“接口 106”),该接口组件提供将个性化组件102集成到实际上任何操作和/或数据库系统中和/ 或彼此集成的各种适配器、连接器、通道、通信路径等。另外,接口组件106可以提供各种适 配器、连接器、通道、通信路径等,它们提供与个性化组件102、个性化查询结果104、个性化 内容、用户、搜索引擎(未示出)、以及与系统100相关联的任何其他设备和/或组件的交 互。图2示出方便标识具有相关个人内容的一组用户以便能够生成个性化web搜索结 果的系统200。与系统200相关联的个性化组件102可基于评估属于一个组的不同用户来 为用户优化搜索结果相关度,在该组中成员关系标识个性化内容中的关系或相互关系。例 如,来自第一用户的查询可以经由接口 106来接收,其中个性化组件102可以充分利用组 (例如,其中第一用户是一个成员并且共享兴趣)来帮助标识或过滤搜索结果。因而,通过 利用第一用户的组和相关兴趣,个性化组件102可以提供个性化查询结果104。如所讨论的,个性化组件102可以接收与用户和/或包括两个或更多个用户的组 相关联的个性化内容。用户组202可以基于对每一个人的个性化内容的自动评估来创建。 在另一示例中,用户组202可以基于每一用户基于个人兴趣或具有共同、相似、或相关兴趣 的标识而加入这一组来创建。例如,第一用户可以创建与特定视频游戏相关联的组,而另外 的用户可以鉴于对这一视频游戏感兴趣而加入这一组。在创建了用户组202后,可以通过 充分利用这一编组来提供个性化查询结果104。在每一组内,每一成员的个性化内容可被 评估和/或利用来增强为这一组的某成员提供个性化查询结果104的效率。可以明白,个 性化内容可以是但不限于是,兴趣、浏览的内容或数据、历史(例如,因特网历史、查看的页 面、访问的数据等)、简档(例如,用户简档、设置等)、网站、问卷(例如,详细问题、具体信 息请求等)、购物、购置、社交网络网站数据、专用组搜索界面和/或与其相关的数据、和/或 可以标识个性化偏好或兴趣的任何其他合适的数据。例如,个性化组件102可以实现编组化排名。对于查询所返回的前N个结果中的 每一搜索结果(例如,其中N是正整数),可为该组中的每一个人计算个性化分数。将每一 结果的“组”分数计算成每一组成员的个性化分数的总和,或者该“组”分数可以通过使用 关于该组的聚集信息替换关于一个人的信息以计算个性化分数来进行计算。可以对结果列 表进行重新排名以使得具有最高组分数的结果最先出现,并且可以向执行该搜索的组成员 示出这一重新排名的列表。这一编组化排名可具有通过使与多个组成员相关的项排名很高 来进一步增强个性化查询结果104的效果。换言之,基于组成员的平均的感兴趣的搜索结 果可以排名更高。可以使用个人的个人分数与组分数的加权组合来标识既与个人相关也与 该组相关的结果。在这种情况下,各平均组成员感兴趣的并且执行该搜索的组成员也特别 感兴趣的结果可以排名很高。在另一示例中,个性化组件102可以利用智能划分。协作web搜索工具可以使在 线的一组人能够通过进行划分搜索来协作,其中一个组成员可以输入查询并且可以将该查 询的搜索结果的非重叠子集发送到该组的每一成员以便能进行并行评估。朴素(NaiVe)划分算法可以通过智能划分过程来增强,该过程可以分发结果以使得各个组成员接收到就个 人而言最相关的结果。在一种情况下,这可以通过取查询的前M个结果(例如,其中M是正 整数),为每一个组成员计算每一结果的个性化分数,基于他们的个性化分数来为每一个组 成员对结果列表进行重新排名(例如,最高分数是第一),随后通过以循环方式向每一个组 成员分配其个性化列表上的尚未分配给另一组成员的排名在前的结果直至将所有结果都 分配给了用户为止以创建最终划分列表来实现。此外,个性化组件102可以启用组查询扩展。用户通常发起与单个任务相关的若 干查询。这些查询可以基于语义内容、在其中发起它们的时间跨度而被自动地推断为具有 某种关系,和/或基于协作搜索工具的使用(例如,将各组查询组织成手动定义的任务会话 等)而被手动地推断为具有某种关系。这些相关查询集合还可以通过包括其他组成员(例 如,正在充分相似的任务会话中使用协作搜索工具的其他人,等等)发起的相关查询或通 过找出web使用日志中的发起了相似查询的其他人并使用这些用户存储的相关查询集合 来进一步扩展。此外,个性化组件102可以通过找出具有相似背景的其他人来扩展查询,相 似背景是通过过去查询、过去网页访问、计算机索引内容等的相似性来定义的。图3示出方便基于将用户专用内容与相关组成员进行组合来优化使用搜索引擎 的个性化web搜索结果的系统300。系统300可包括可通过将个人的数据与其他相关人或 用户的数据进行组合来增强接收因特网上的搜索结果的个性化的个性化组件102。具体而 言,个性化组件102可以通过评估属于一个组的每一用户的个性化内容来标识相关个性化 查询结果104。例如,用户可以加入或参与存在共同、相似、或相关兴趣的一个组。在另一 示例中,可以基于对个性化内容(例如,历史、浏览的内容、简档、网站、问卷、兴趣、购物、购 置、桌面内容等)的分析和匹配来将用户自动地分配给一个组。可以明白,个性化组件102 可以提供按任何合适的方式分配的组,这些方式诸如但不限于,用户定义的组分配、基于对 组和/或用户个性化数据的评估的自动分配、和/或其任何合适的组合(例如,自动分配和 对自动设置/分配的手动编辑,等等)。系统300还可以包括数据存储302,数据存储302可以包括与个性化组件102、个 性化查询结果104、以及接口 106相关的任何合适的数据。例如,数据存储可包括组成员关 系定义、组成员关系数据、个性化内容、用户兴趣、用户设置、用户查询、组查询、用户隐私设 置(例如,个性化内容暴露,等等)、用户简档、web历史、浏览的数据、组设置(例如,组参 与、成员的排名、编组的相关度,等等)、编组化排名数据(例如,用于为组成员计算分数或 排名的公式、用于标识组的平均分数或排名的公式,等等)、智能划分数据(例如,协作设 置、组成员并行评估分配,等等)、突出显示设置(例如,强调设置、颜色、字体、用户定义的 强调细节,等等)、组查询扩展数据(例如,用户专用查询扩展设置、查询扩展相关定义,等 等)、与查询数据相关的任何合适的数据、与基于对一个组中的至少一个成员的评估来提供 搜索结果相关的任何合适的数据,等等。可以理解,数据存储302可以是例如易失性存储器 或非易失性存储器,或者可同时包括易失性存储器和非易失性存储器两者。作为说明而非 局限,非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、 电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM),它用 作外部高速缓冲存储器。作为说明而非限制,RAM具有多种形式,诸如静态RAM(SRAM)、动态 RAM(DRAM)、同步 DRAM (SDRAM)、双数据率 SDRAM (DDR SDRAM)、增强型 SDRAM (ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM (RDRAM)、直接存储器总线 动态RAM(DRDRAM)、以及存储器总线动态RAM (RDRAM)。本发明的系统和方法的数据存储302 旨在包括但不限于这些以及任何其他适当类型的存储器。此外,可以理解,数据存储302可 以是服务器、数据库、硬盘驱动器等等。个性化组件102还可利用方便查询数据的搜索组件304。在一种情况下,搜索组件 304可以接收查询并至少部分地基于接收到的查询来提供查询结果,其中个性化组件102 可以基于组成员关系和这些成员的相应个性化兴趣来过滤这些查询结果。在另一种情况 下,搜索组件304可被用作用于向特定组的各个成员提供协作搜索的共享搜索引擎,其中 成员关系可以基于相关兴趣、个人内容等。换言之,个性化组件102可以根据来自具有相关 兴趣的组的各个成员来过滤搜索组件304所提供的查询结果。图4示出方便定义组个性化web搜索选项来提供定制搜索结果的系统400。系统 400可包括可利用具有相关或共同兴趣(例如,相关个性化内容等)的一组用户来提供对提 交查询的用户而言更加个性化的查询结果104的个性化组件102。个性化组件102可以实 现允许对组评估设置和/或细节进行具体定制的范围组件402。例如,范围组件402可以允 许用户定义对于组分配可考虑哪些特定关系或兴趣。此外,范围组件402可以允许用户定 义对各个组成员的兴趣或个性化内容的置信度排名。因此,用户可以用置信度排名来具体 地定义各个组成员的置信度或共同性水平,这可进一步帮助为用户标识搜索结果。此外,个性化组件102可以采用使用户能够定义与个性化内容相关的安全设置的 编辑组件404。例如,用户可以允许或不允许暴露用于标识组和/或标识个性化查询结果 的个性化内容。例如,对于搜索结果或组成员关系的标识而言,可以不考虑网站历史的一部 分。因此,用户可以手动地编辑与个性化内容相关的信息。另外,编辑组件404可以允许各 种粒度级别。例如,用户可以向第一组或用户展示或允许个性化内容的一部分,而向第二组 或用户禁止个性化内容的该部份。图5示出方便实现共享web任务以增强web搜索结果的个性化的系统500。系统 500可包括可经由接口 106从用户接收查询的个性化组件102,其中个性化查询结果104可 以基于对来自该用户和共享反映相关兴趣和/或个性化内容的组成员关系的不同用户的 个性化内容的评估来生成。例如,用户可以鉴于个性化内容(例如,浏览历史、访问的网站、 兴趣、问卷、简档、浏览的内容、访问的数据,等等)之间的充分相似性而参与一个组或被分 配给一个组。通过充分利用一组用户以及提供查询的特定用户,可以用更高效的方式来标 识个性化查询结果104。可以利用共享web任务引擎502来方便充分利用组成员以增强个性化努力。一般 而言,共享web任务引擎502可以允许两个或更多个用户(例如,用户组202)协作和/或 共享web搜索任务。可以明白,共享web任务引擎502可以是任何合适的协作web搜索工 具。具体而言,共享web任务引擎502可被用来提供智能划分(如上所述),其中搜索结果 可被分发给各个组成员202以进行对相关度的并行评估。另外,共享web任务引擎502可 以启用组查询扩展,其中可以访问来自各个组成员的任务会话和/或相关查询以扩展所提 交的查询(例如,如上所述)。系统500还可包括可以对所使用的来自组查询扩展技术的项或相关查询采用强 调技术的突出显示器组件504。一般而言,突出显示器组件504可以通过从组查询扩展突出
9显示来自一组相关查询的查询(例如,通过当来自一组相关查询的查询项出现在搜索结果 列表中时,如在标题、URL、摘录等中时,对其进行突出显示)来执行组命中突出显示,而不 论这些查询是由该个人发起还是由该组中的其他人发起。应当明白,突出显示器组件504 能以任何合适的形式向标题、URL、摘录等提供强调,这些形式诸如但不限于文本突出显示 (例如,任何合适的颜色、任何合适的大小,等等)、放大、字体、加粗、下划线、弹出框、图形 的一部分、或可将注意力吸引到搜索结果的一部分的任何其他合适的技术。此外,突出显示 器组件504可为一个组的每一成员允许特定的强调技术。因此,与来自用户A的查询相关 联的项具有第一强调技术(例如,用红色突出显示),而与来自用户B的查询相关联的项具 有第二强调技术(例如,用蓝色突出显示)。突出显示了许多项的结果因此可以更加吸引用户的注意,因为它们可能是相关查 询关键词集合中的许多项的匹配。另外,相关关键词集合可被用来自动地扩展用户的查询 (例如,诸如通过使用“优选”运算符,等等),以帮助搜索引擎(未示出)返回更适当的结 果。可以明白,突出显示器组件504可以提供任何用户界面特征,诸如如何将组命中突出显 示呈现给用户(例如,用于在当前查询关键词、从个人自己的任务相关查询集合中提取的 关键词、从其他组成员提取的关键词等之间进行区分不同的颜色)。图6示出根据本发明的方便推断用户之间的关系并方便接口的系统600。系统600 可包括个性化组件102、个性化查询结果104、接口 106、个性化内容、以及查询。可以明白, 个性化组件102、个性化查询结果104、接口 106、个性化内容、以及查询可基本上类似于之 前附图中描述的相应组件、结果、内容、查询、以及接口。系统600还包括智能组件602。智 能组件602可由个性化组件102用来方便自动地将用户分配给一个组并基于组成员之间的 充分相似的个性化内容来标识相关搜索结果。例如,智能组件602可以推断组分配、用户兴 趣、用于评估的个性化内容、突出显示设置(例如,强调技术、颜色、字体、频率,等等)、查询 扩展任务会话、来自组成员的用于扩展的相关查询、暴露给各个组成员的并行评估、每一成 员的个性化分数、智能划分、结果到各个组成员的分发、组分数计算,等等。智能组件602可以采用信息值(V0I)计算来标识个性化搜索结果。例如,通过利 用V0I计算,可以确定最理想和/或最适当的搜索结果。此外,可以理解,智能组件602能 够从一组通过事件和/或数据捕捉到的观察结果中推出或推断系统、环境和/或用户的状 态。例如,推断可用于标识特定的上下文或动作,或可生成状态的概率分布。推论可以是概 率性的,即,基于数据和事件的考虑计算感兴趣的状态的概率分布。推断也可以指用于从一 组事件和/或数据组成更高级事件的技术。这类推断导致从一组观察到的事件和/或存储 的事件数据中构造新的事件或动作,而无论事件是否在相邻时间上相关,也无论事件和数 据是来自一个还是若干个事件和数据源。可采用各种分类(显式和/或隐式训练的)方案 和/或系统(例如,支持向量机、神经网络、专家系统、贝叶斯信任网络、模糊逻辑、数据融合 引擎……)来执行关于所要求保护的主题的自动化和/或推断的动作。分类器是将输入属性矢量x = (xl,x2, x3, x4, xn)映射到该输入属于的一个类 的置信度的函数,即f(x)=置信度(类)。这种分类可采用基于概率和/或基于统计的分 析(例如,分解成分析效用和成本)来预测或推断用户期望自动执行的动作。支持向量机 (SVM)是可采用的分类器的一个示例。SVM通过找出可能输入空间中的超曲面来操作,其 中,超曲面试图将触发准则从非触发事件中分离出来。直观上,这使得分类对于接近但不等同于训练数据的测试数据正确。可采用其他定向和非定向模型分类方法,包括,例如,朴素 贝叶斯、贝叶斯网络、决策树、神经网络、模糊逻辑模型以及提供不同独立性模式的概率分 类模型。此处所使用的分类也包括用于开发优先级模型的统计回归。个性化组件102还可利用提供各种类型的用户界面来方便用户和耦合到个性化 组件102的任何组件之间的交互的呈现组件604。如图所示,呈现组件604是可以与个性化 组件102 —起利用的单独实体。然而,可以理解,呈现组件604和/或类似的查看组件可以 被结合到个性化组件102中和/或是一独立单元。呈现组件604可提供一个或多个图形用 户界面(GUI)、命令行界面等等。例如,可以呈现向用户提供对数据进行加载、导入、读取等 的区域或手段的⑶I,并且该⑶I可包括呈现这些动作的结果的区域。这些区域可包括已知 的文本和/或图形区域,包括对话框、静态控件、下拉菜单、列表框、弹出菜单、编辑控件、组 合框、单选按钮、复选框、按钮以及图形框。另外,可采用方便呈现的实用程序,诸如用于导 航的垂直和/或水平滚动条以及确定一区域是否可被查看的工具栏按钮。例如,用户可以 与耦合到和/或结合到个性化组件102中的一个或多个组件交互。用户还可例如经由诸如鼠标、滚动球、触摸垫、键区、键盘、触摸屏、笔和/或语音 激活、身体运动检测等各种设备来与这些区域交互以便选择和提供信息。通常,诸如键盘上 的按钮或回车键等机制可在输入了信息之后采用以启动搜索。然而,可以理解,所要求保护 的主题不限于此。例如,仅仅突出显示一复选框即可启动信息传达。在另一示例中,可采用 命令行界面。例如,命令行界面可以提示(例如,经由显示器上的文本消息和音频声调)用 户通过提供文本消息来输入信息。用户然后可提供适当的信息,诸如对应于在该界面提示 中提供的选项的字母数字输入或对提示中所提出的问题的回答。可以理解,命令行界面可 以与GUI和/或API结合使用。另外,命令行界面可以结合具有有限图形支持和/或低带 宽通信信道的硬件(例如,视频卡)和/或显示器(例如,黑白、EGA、VGA、SVGA,等等)来 使用。图7-8示出根据所要求保护的主题的方法和/或流程图。为解释简明起见,这些方 法被描绘和描述为一系列动作。可以理解和明白,本发明不受所示出的动作和/或动作次 序的限制。例如,动作可按照各种次序和/或并发发生,且带有未在此处呈现和描述的其他 动作。此外,并非所有示出的动作都是实现根据所要求保护的主题的方法所必需的。另外, 本领域的技术人员可以理解和明白,方法可经由状态图或事件替代地被表示为一系列互相 关状态。另外还应该理解,下文以及本说明书全文中所公开的方法能够被存储在制品上,以 便于把此类方法传送和转移到计算机。在此使用的术语“制品”意指包含可以从任何计算 机可读设备、载体或介质访问的计算机程序。图7示出方便通过将用户的个人内容与一个或多个相关用户的内容进行组合来 产生个性化结果以增强web搜索结果的方法700。在附图标记702处,可以接收来自用户的 搜索查询。在附图标记704处,可以评估用户专用的数据的一部分来标识相关用户组。例 如,用户专用的数据的一部分可以是个性化内容,诸如但不限于,兴趣、浏览的内容或数据、 历史、因特网历史、查看的页面、访问的数据、简档、用户简档、设置、网站、问卷、详细问题、 具体信息请求、购物、购置、可以标识个性化偏好或兴趣的任何其他合适的数据,等等。此 外,所标识的相关用户组可以基于共享背景或兴趣。在一个示例中,一组用户可以基于任何 合适的准则或特征,诸如但不限于职业数据(例如,工作经历、职业、证书等)、地理数据(例
11如,住处、位置等)、个人信息(例如,姓名、年龄、传统、税级等)、消费数据(例如,所拥有的 财产、所使用的电子设备、所赚的钱、所花的钱等)、组织数据(例如,成员关系、成员关系的 持续时间等)、浏览的数据(例如,网站访问、所查看的图像、所使用的媒体等)、个人兴趣 (例如,喜好、厌恶等)、和/或可用来将两个或更多个用户分类或编组的任何其他信息。在附图标记706处,可以标识该组用户与该查询之间的相互关系。可以明白,该相 互关系可以基于编组化排名(例如,对该组中每一用户的搜索结果的个性化排名分数求平 均以提供编组化排名)、智能划分(例如,将搜索结果分发给组内的用户以进行并行评估)、 和/或组查询扩展(例如,充分利用与所提交的查询相关的组成员查询来寻找更宽泛的结 果)中的至少一个。在附图标记708处,可以至少部分地基于该相互关系来过滤从该查询 生成的一个或多个搜索结果。图8示出用于实现共享web任务以增强web搜索结果的个性化的方法800。在附 图标记802处,可以接收与因特网相关的搜索查询。在附图标记804处,可以实现搜索查询 的共享web搜索。例如,共享web搜索可以结合具有共享兴趣或相关个性化内容的一组用 户来采用。在附图标记806处,可以基于共享web搜索来为特定用户标识相关结果。在附 图标记808处,可以在搜索查询的相关结果上利用组命中突出显示。具体而言,命中突出显 示可以基于查询的起源点(例如,来自用户或组成员)来采用将注意力吸引到搜索结果中 的项(例如,标题、URL、摘录,等等)的强调技术。为了提供用于实现所要求保护的主题的各方面的附加上下文,图9-10及以下讨 论旨在提供对其中可实现本发明的各方面的合适的计算环境的简要概括描述。例如,在以 上附图中描述的方便将来自两个或更多个用户的个性化内容进行组合以增强个性化web 搜索结果的个性化组件可以在这一合适的计算环境中实现。尽管上文已经在运行在本地计 算机和/或远程计算机上的计算机程序的计算机可执行指令的一般上下文中描述了所要 求保护的主题,然而本领域中的技术人员将认识到,本发明也可以结合其他程序模块来实 现。一般而言,程序模块包括执行特定任务和/或实现特定抽象数据类型的例程、程序、组 件、数据结构等等。此外,本领域的技术人员可以理解,本发明的方法可用其他计算机系统配置来实 施,包括单处理器或多处理器计算机系统、小型计算机、大型计算机、以及个人计算机、手持 式计算设备、基于微处理器的和/或可编程消费电子产品等,其每一个都可操作上与一个 或多个相关联的设备通信。所示的所要求保护的主题的各方面也可在其中某些任务由通过 通信网络链接的远程处理设备来执行的分布式计算环境中实施。然而,本发明的一些方面 (如果不是全部方面)可以在独立计算机上实施。在分布式计算环境中,程序模块可以位于 本地和/或远程存储器存储设备中。图9是所要求保护的主题可以与之交互的示例性计算环境900的示意性框图。系 统900包括一个或多个客户机910。客户机910可以是硬件和/或软件(例如,线程、进程、 计算设备)。系统900还包括一个或多个服务器920。服务器920可以是硬件和/或软件 (例如,线程、进程、计算设备)。服务器920可以容纳各线程以通过例如利用本发明执行转换。在客户机910和服务器920之间的一种可能的通信能够以适合在两个或更多计算 机进程之间传输的数据分组的形式进行。系统900包括可以用来使客户机910和服务器920之间通信更容易的通信框架940。客户机910可在操作上连接到一个或多个可以用来 存储对客户机910本地的信息的客户机数据存储950。同样地,服务器920可在操作上连接 到一个或多个可以用来存储对服务器920本地的信息的服务器数据存储930。参考图10,用来实现所要求保护的主题的各个方面的示例性环境1000包括计算 机1012。计算机1012包括处理单元1014、系统存储器1016和系统总线1018。系统总线 1018将包括但不限于系统存储器1016的系统组件耦合到处理单元1014。处理单元1014 可以是各种可用处理器中的任一种。双微处理器和其他多处理器体系结构也可用作处理单 元 1014。系统总线1018可以是几种类型的总线结构中的任意一种,包括存储器总线或 存储器控制器、外围总线或外部总线、和/或利用下述可用总线体系结构中的任意一种 的局部总线,其包括但不限于,工业标准体系结构(ISA)、微通道体系结构(MSA)、扩展型 ISA(EISA)、智能驱动器电子学(IDE)、VESA局部总线(VLB)、外围部件互连(PCI)、卡总线、 通用串行总线(USB)、高级图形端口(AGP)、个人计算机存储卡国际联合会总线(PCMCIA)、 火线(IEEE 1394)、以及小型计算机系统接口(SCSI)。系统存储器1016包括易失性存储器1020和非易失性存储器1022。基本输入/输 出系统(BIOS)包含诸如在启动期间在计算机1012的元件之间传送信息的基本例程,其存 储在非易失性存储器1022中。作为说明而非限制,非易失性存储器1022可以包括只读存储 器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM (EEPROM)、或者闪 存。易失性存储器1020包括用作外部高速缓存存储器的随机存取存储器(RAM)。作为说明 而非限制,RAM具有多种形式,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM (SDRAM)、双 数据率 SDRAM (DDR SDRAM)、增强型 SDRAM (ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、 存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总 线动态 RAM(RDRAM)。计算机1012还包括可移动/不可移动、易失性/非易失性计算机存储介质。例 如,图10示出了盘存储1024。盘存储1024包括但不限于诸如磁盘驱动器、软盘驱动器、磁 带驱动器、Jaz驱动器、Zip驱动器、LS-100驱动器、闪存卡、或者记忆棒之类的设备。此外, 盘存储1024可以包括独立的或者与其他存储介质结合的存储介质,其他存储介质包括但 不限于诸如紧致盘ROM设备(⑶-ROM)、可记录⑶驱动器(⑶-R驱动器)、可重写⑶驱动器 (⑶-RW驱动器)或者数字多功能盘ROM驱动器(DVD-ROM)这样的光盘驱动器。为了便于 将盘存储设备1024连接到系统总线1018,通常使用诸如接口 1026等可移动或不可移动接应该明白,图10描述了担当用户与在合适的操作环境1000中描述的基本计算机 资源之间的中介的软件。这样的软件包括操作系统1028。可被存储在盘存储1024上的操 作系统1028用于控制并分配计算机系统1012的资源。系统应用程序1030通过存储在系 统存储器1016或盘存储1024上的程序模块1032和程序数据1034来利用操作系统1028 对资源的管理。应该明白,所要求保护的主题可以用各种操作系统或操作系统的组合来实 现。用户通过输入设备1036将命令或信息输入到计算机1012中。输入设备1036包 括但不限于诸如鼠标、跟踪球、指示笔、触摸垫等定点设备,键盘,话筒,操纵杆,游戏手柄,
13圆盘式卫星天线,扫描仪,TV调谐卡,数码相机,数码摄像机,网络摄像头等等。这些以及其 他输入设备通过系统总线1018经由接口端口 1038连接至处理单元1014。接口端口 1038 包括,例如串行端口、并行端口、游戏端口、以及通用串行总线(USB)。输出设备1040利用与 输入设备1036相同类型的某些端口。因此,例如,USB端口可以用来向计算机1012提供输 入,以及将来自计算机1012的信息输出到输出设备1040。提供输出适配器1042是为了说 明除了输出设备1040之外还有一些像监视器、扬声器、以及打印机这样的需要专用适配器 的输出设备1040。输出适配器1042包括,作为说明而非限制,提供输出设备1040和系统总 线1018之间的连接手段的显卡和声卡。应该注意到,其他设备和/或设备系统提供了输入 和输出能力,诸如远程计算机1044。计算机1012可以使用至诸如远程计算机1044等一个或多个远程计算机的逻辑连 接在网络化环境中操作。远程计算机1044可以是个人计算机、服务器、路由器、网络PC、工 作站、基于微处理器的电器、对等设备或者其他常见的网络节点等,且通常包括相对于计算 机1012所描述的多个或者全部元件。为了简明起见,对远程计算机1044仅示出了存储器 存储设备1046。远程计算机1044经由网络接口 1048被逻辑地连接到计算机1012,然后经 由通信连接1050物理地连接。网络接口 1048包括诸如局域网(LAN)和广域网(WAN)这样 的有线和/或无线通信网络。LAN技术包括光纤分布式数据接口(FDDI)、铜分布式数据接 口(⑶DI)、以太网、令牌环等。WAN技术包括但不限于,点对点链路、诸如综合业务数字网 (ISDN)及其各种变体等电路交换网、分组交换网、以及数字用户线(DSL)。通信连接1050指的是用于将网络接口 1048连接到总线1018的硬件/软件。虽 然为了清楚地举例说明,通信连接1050被示为在计算机1012的内部,但其也可以在计算机 1012的外部。仅出于示例的目的,连接到网络接口 1048所需要的硬件/软件包括内部和外 部技术,诸如包括常规电话级调制解调器、电缆调制解调器以及DSL调制解调器等调制解 调器,ISDN适配器,和以太网卡。在上面所描述的包括本发明的示例。当然,不可能为了描述所要求保护的主题而 描述组件或方法的每一个可以想到的组合,但本领域中的普通技术人员应该认识到,本发 明的许多进一步的组合和排列都是可能的。因此,所要求保护的主题旨在涵盖所有这些落 入所附权利要求书的精神和范围中的改变、修改和变动。特别地,对于由上述组件、设备、电路、系统等执行的各种功能,除非另外指明,否 则用于描述这些组件的术语(包括对“装置”的引用)旨在对应于执行所描述的执行此处 在所要求保护的主题的示例性方面中所示的功能的组件的指定功能(例如,功能上等效) 的任何组件,即使这些组件在结构上不等效于所公开的结构。在这一点上,也可认识到本发 明包括用于执行所要求保护的主题的各种方法的动作和/或事件的系统以及具有用于执 行这些动作和/或事件的计算机可执行指令的计算机可读介质。有多种实现本发明的方法,例如适当的API、工具箱、驱动程序代码、操作系统、控 件、独立或可下载软件对象等,它们使得应用程序和服务能够使用本发明的广告技术。所要 求保护的主题构想了从API (或其他软件对象)的观点以及从根据本发明的广告技术来操 作的软件或硬件对象的观点来看的用途。由此,此处描述的本发明的各种实现都可以具有 完全采用硬件、部分采用硬件并且部分采用软件、以及采用软件的方面。已经关于若干组件之间的交互描述了前述系统。应该理解,这样的系统和组件可以包括根据前述的各种置换和组合的那些组件或指定的子组件、指定的组件或子组件中的 某一些、和/或另外的组件。子组件也可以被实现为通信耦合至其它组件而非被包括在父 组件(分层)内的组件。另外,应注意到一个或多个组件可被组合成提供聚集功能的单个 组件,或被分成若干单独的子组件,且诸如管理层等任何一个或多个中间层可被设置成通 信耦合到这样的子组件以便提供集成功能。此处描述的任何组件也可以与在此未具体描述 但本领域的技术人员公知的一个或多个其他组件交互。 另外,尽管可相对于若干实现中的仅一个来公开本发明的一个特定特征,但是这 一特征可以如对任何给定或特定应用所需且有利地与其他实现的一个或多个其他特征相 组合。而且,就术语“包括”、“含有”、“具有”、“包含”、其变型以及其他类似单词在详细描述 或权利要求书中的使用而言,这样的术语旨在以类似于术语“包括”作为开放的过渡词的方 式为包含性的而不排除任何附加或其他元素。
权利要求
一种方便为特定用户生成个性化查询结果的系统,包括接口(106),所述接口接收要搜索的文本查询的一部分或与提交所述文本查询的所述部分的用户相关的个性化内容的一部分中的至少一个;以及个性化组件(102),所述个性化组件将与所述用户相关的个性化内容的所述部分与同一个或多个不同用户相关的个性化内容的一部分进行组合以创建具有组个性化内容的组,其中将所述组个性化内容与所述文本查询的所述部分相比较来标识它们之间的关系以根据这一关系来生成个性化查询结果(104)。
2.如权利要求1所述的系统,其特征在于,所述个性化内容涉及以下至少一个兴趣、 浏览的内容的一部分、因特网历史的一部分、用户简档的一部分、访问的网站、问卷、购置、 通过使用专用协作web搜索工具联合参与搜索而建立的共享任务、与社交网络网站相关的 数据的一部分、专用组搜索界面、与机器相关的桌面内容的一部分、或购物历史。
3.如权利要求1所述的系统,其特征在于,所述个性化内容是用户专用的,并且是本地 数据、远程数据、设备上的数据、或计算机器上的数据中的至少一个。
4.如权利要求1所述的系统,其特征在于,还包括基于所述文本查询生成两个或更多 个查询结果的搜索组件,所述查询结果基于所述用户与所述组的关系来进行过滤或排名。
5.如权利要求1所述的系统,其特征在于,所述个性化组件通过以下动作中的至少一 个来采用编组化排名计算所述组的每一成员的个性化分数并通过组合来自每一成员的个性化分数来计算 每一查询结果的组分数,并且基于所述组分数来对所述查询结果重新排名;从所述组成员的简档的组合来计算所述组个性化分数并基于所述组分数对所述查询 结果进行重新排名;或者利用算法将所述个人分数组合成所述组分数。
6.如权利要求5所述的系统,其特征在于,所述组的每一成员的个性化分数基于与各 单独成员和相应个性化内容的相关度。
7.如权利要求1所述的系统,其特征在于,还包括利用智能划分技术来提供协作web搜 索的共享web任务引擎,所述智能划分技术接收所述文本查询的所述部分并将所述查询结 果的一部分分发给所述组的各个成员以便能够进行并行评估。
8.如权利要求7所述的系统,其特征在于,所述查询结果的所述部分是作为非重叠子 集来分发的,其中所述分发基于每一成员的个性化分数。
9.如权利要求7所述的系统,其特征在于,所述共享web任务引擎实现基于对来自所述 组的文本查询的评估来扩展所述文本查询的所述部分的组查询扩展,对所述文本查询的扩 展取决于它们之间有关系,其中所述关系是语义内容、输入的时间跨度、或手动推断中的至 少一个。
10.如权利要求9所述的系统,其特征在于,从所述共享web任务引擎或所述协作web 搜索中的至少一个中手动地定义的任务会话中标识来自所述组的所述文本查询。
11.如权利要求9所述的系统,其特征在于,还包括对从所述组查询扩展搜索中生成的 查询结果的一部分采用强调技术的突出显示器组件。
12.如权利要求11所述的系统,其特征在于,所述强调技术是文本突出显示、放大、字 体、加粗、下划线、弹出框、或图形的一部分中的至少一个。2
13.如权利要求11所述的系统,其特征在于,所述突出显示器组件对第一用户利用第 一强调技术而对第二用户利用第二强调技术,所述第一用户和所述第二用户是所述组的成 员O
14.如权利要求1所述的系统,其特征在于,还包括利用所述组内的至少一个成员的置 信度排名的分数组件,所述置信度排名定义所述组内的第一成员与第二成员之间的相似性的度量。
15.如权利要求1所述的系统,其特征在于,还包括为所述组内的用户定义安全设置的 编辑组件,所述安全设置使得能够将一部分数据从个性化内容中排除考虑。
16.如权利要求15所述的系统,其特征在于,所述编辑组件允许所述用户使用一粒度 级别来手动地编辑个性化内容的一部分。
17.一种方便增强相关搜索结果的标识的计算机实现的方法,包括 接收来自用户的搜索查询(702、802);评估所述用户专用的数据的一部分以标识他们之间具有相关数据的至少一个附加用 户(704,806);标识所述用户、所述至少一个附加用户、以及所述查询之间的相互关系(706);生成所述查询的一个或多个搜索结果(706、806);以及至少部分地基于所述相互关系来过滤所述一个或多个搜索结果(706、806)。
18.如权利要求17所述的方法,其特征在于,还包括 将所述至少一个附加用户聚集成一个组;向所述组中的每一成员提供所述搜索结果的个性化分数;以及 利用所述个性化分数来对所述搜索结果进行重新排名。
19.如权利要求17所述的方法,其特征在于,还包括 实现所述搜索查询的共享web搜索;基于所述共享web搜索来为特定用户标识相关结果;以及 在所述搜索查询的相关结果上利用组命中突出显示。
20.一种方便生成与用户相关的查询结果的计算机实现的方法,包括用于接收要搜索的文本查询的一部分或与提交所述文本查询的所述部分的用户相关 的个性化内容的一部分中的至少一个的装置(106、702、802);用于将至少一个附加用户与提交所述文本查询的用户聚集成一个组的装置(102、704、 804);用于评估与所述至少一个附加用户和提交所述文本查询的用户相关的个性化内容的 装置(102,704,804);用于充分利用所述组和所述个性化内容来使用以下至少一个提供搜索结果的装置 (102、104、706、806)计算所述组的每一成员的搜索结果的个性化排名并组合所述个性化排名以提供组分 数的编组化排名(102,806);将所述搜索结果分发给所述组以便进行并行评估的智能划分(102、806);以及 通过评估所述组的成员所生成的相关查询来加宽所述文本查询的组查询扩展(102、 806)。
全文摘要
所要求保护的主题提供一种方便为特定用户生成个性化查询结果的系统和/或方法。接口可以接收要搜索的文本查询的一部分或与提交该文本查询的该部分的用户相关的个性化内容的一部分中的至少一个。个性化组件可以将与该用户相关的个性化内容的这一部分与同一个或多个不同用户相关的个性化内容的一部分进行组合以创建组个性化内容,其中将该组个性化内容与该文本查询的这一部分相比较来标识它们之间的关系以根据这一关系生成个性化查询结果。
文档编号G06F17/30GK101946249SQ200880126908
公开日2011年1月12日 申请日期2008年12月31日 优先权日2008年2月13日
发明者J·B·蒂文, J·W·米肯斯, M·J·莫里斯, S·阿默施 申请人:微软公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1