专利名称:使用其他人简档的个人化推荐器简档修改的制作方法
技术领域:
本发明涉及搜索引擎,其通过观察用户行为来学习用户喜好并基于所观察的喜好来过滤大空间的数据。这样的系统采用算法从用户行为来推断规则而不是需要用户明确地输入规则。更具体而言,本发明涉及这样的搜索引擎,其基于用户的选择和其他人的选择而为个体用户做出推荐。
背景技术:
搜索引擎在必须有效且快速使用很大数据库的应用中变得日益重要。搜索引擎不仅对于搜索万维网是有用的,对于存储目录、电视节目播放、音乐列表、文件系统等亦是有用的。在焦点正从信息转变到知识的世界中,搜索引擎是巨大的增长面并具有极大的潜力。
搜索引擎正在寻找应用的一种方式是用所谓的被动推荐器,其观察用户的选择行为并基于该行为做出推荐。该技术是结合用于选择电视节目播放的电子节目向导(EPG)而使用的。
电子节目向导(EPG)承诺使从无数的电视和其它媒体观看选择中选择的任务更加可管理。被动搜索引擎构建用户喜好数据库并使用喜好数据来提出建议,过滤当前或将来节目播放信息以简化选择的工作,或甚至以用户的名义做出选择。例如,系统将无需来自用户的特定请求或它所推荐的加亮选择而记录节目。
如以上所述,从用户的观点来看,用于构建喜好数据库的一种类型的设备是被动型。用户仅以正常方式从原始EPG数据做出选择,而系统通过从该选择中提取用户行为的模型而逐渐构建个人喜好数据库。然后它使用该模型做出有关用户在将来将优选看什么的预测。该提取过程可遵循简单的算法,如通过检测对相同项目的重复请求来识别明显的收藏,或者它可以是复杂的机器学习过程,如具有大量输入(自由度)的决策树技术。一般而言,这样的模型寻找用户交互行为(即与用户界面(UI)交互以便于做出选择)中的模式。
一种用于从用户观看模式中提取有用信息的直截了当且相当强有力的技术是生成特征值计数的表。特征的实例是“一天中的时间”,而对应的值可以是“早上”。当做出选择时,表征该选择的特征值被递增。通常,给定选择将具有许多特征值。亦可通过选择鉴别选择的表演(show)的子集(任选地,在相同时间)生成负选择的集合。其相应的特征值计数将被递减(或者用于未看表演的计数被递增)。这些数据被发送给Bayesian预测器,其将所述计数用作对表征候选者的特征计数的权重以预测候选者将被用户优选的概率。这种类型的概括机理被描述于提交于2000年2月4日的US专利申请序列号09/498,271,BAYESIAN TVSHOW RECOMMENDER中,其整体在此被引入作为参考,就象在此被完整提出的那样。这种相同类别的系统中的基于规则的推荐器根据对用户行为的观察被动地构建简档,其亦被描述于99年1月14日出版的PCT申请,WO 99/01984,INTELLIGENT ELECTRONIC PROGRAM GUIDE中。
第一种类型的另一个实例是MbTV,一种通过监视观看者的观看模式来学习其电视观看喜好的系统。MbTV透明地工作并构建观看者口味的简档。该简档被用于提供服务,例如推荐观看者可能有兴趣看的电视节目。MbTV学习每个其观看者的口味并使用其所学来推荐即将到来的节目。通过向观看者提醒理想的、即将到来的节目,MbTV可帮助观看者排定其电视观看时间,并且借助存储设备的添加而在观看者不在时自动记录这些节目。
MbTV具有喜好确定引擎和存储管理引擎。这些被用于使时间转变的电视便利。MbTV可自动记录而不是简单地建议理想的节目播放。MbTV的存储管理引擎试图确保存储设备具有最佳内容。该过程涉及跟踪哪些所记录的节目已被观看(完整地或部分地)以及哪些被忽略。观看者可“锁定”用于将来观看的所记录的节目以防止删除。观看者处理节目建议或所记录内容的方式提供了给MbTV的喜好引擎的附加反馈,所述引擎使用该信息来改进将来的决策。
MbTV将保留一部分记录空间以表示每个“构成的兴趣”。这些“兴趣”可转化成不同的系列号或可表示不同的口味目录。尽管MbTV不需要用户介入,但它可由想要细调其容量的人们来定制。观看者可影响用于不同类型节目的“存储预算”。例如,尽管儿童在家中看大部分的电视,观看者可指示不多于25%的记录空间应由儿童节目来消费。
第二种类型的设备是较为主动的类型。它允许用户通过给特征分等来指定喜欢或不喜欢。这些可以是评分特征值对(一个用于特征的权重加上一个值;例如,权重=特征的重要性,而值是优选的或不喜欢的值)或者是某种其它的规则规范,如收藏节目,象“我喜欢纪录片,但不是在星期四,这是那伙人来的夜晚”的特征值对的组合。例如,用户可通过用户界面指示戏剧和动作电影是所喜欢的并且特定演员是不被喜欢的。然后这些准则可被应用于预测在一组节目中哪些将是用户优选的。
作为第二种类型的系统的实例,一个EP申请(EP 0854645A2)描述了一种系统,其使用户能输入一般喜好,如优选节目目录,例如连续剧、戏剧系列片、老电影等。该申请亦描述了喜好模板,在其中可选择喜好简档,例如,一个用于年龄在10-12岁之间的儿童,另一个用于十几岁的女孩,另一个用于飞机爱好者,等等。
第三种类型的系统允许用户以某种方式来分级节目。例如,目前,TIVO允许用户展示多达三指以上或多达三指以下。该信息在某种程度上类似于第二种类型的系统,除了它允许可实现的被给予特征值对的加权的更精细程度的分辨率,并且类似于第一种类型,除了在此情况下对用户口味的表示更明确。(注意,这并不是许可如在第三种系统中,被组合了用户分级的在US专利申请序列号09/498,271中讨论的Bayesian技术是在现有技术中。)PCT申请(WO 97/4924,名为System and Method for Using TelevisionSchedule Information)是第三种类型的实例。它描述了这样一种系统,在其中用户可导航经过以通常的表格方式显示的电子节目向导并选择各种节目。在每一个时刻,他/她可进行任何各种所述任务,包括选择用于记录或观看的节目,排定看节目的提醒信号,以及选择要指定为收藏的节目。将节目指定为收藏可能是为了实施固定的规则,如“总显示看该表演的选项”,或者实施循环的提醒信号。指定收藏的目的未在该申请中明确描述。然而,更重要的是,为了创建喜好数据库,当用户选择要指定为收藏的节目时,她/他可被提供指示它是收藏的原因的选项。所述原因以相同的方式被指示为其它明确准则通过限定一般喜好。
第一种类型的系统具有对用户来说较为容易的优点,这是因为用户不必提供任何明确的数据。用户仅需要与系统交互。对于有效的任何各种机器学习或预测性方法,交互的基本历史必须可用于构建有用的用户喜好数据库。第二和第三种类型具有提供明确喜好信息的优点。第二种是可靠的,但不是完美的,这是因为用户可能难以提炼其自己的喜好到以下程度,即能决策哪些准则是好的鉴别器并且给它们什么样的权重的程度。第三种不给用户增加负担并可能提供了最佳质量的信息,但要生成可用第二种获得的所有信息可能是负担,并且仍可能不包含所有信息,并亦可能象第一种一样需要有关许多表演的信息。
当用户重复看相同节目时,针对现有技术的一个问题显现出来。大部分的用户选择是由从限定过窄范围的推荐的这些选择结束中提取的数据和规则的过小集合组成的。该问题类似于落入惯例。针对现有技术的另一个问题是它们不允许在用户之间容易地共享不明确的简档。如果用户喜欢朋友的推荐,对该用户来说没有好的方式来获得他/她朋友的简档的某些或所有部分并以某种方式将其与他/她自己的组合。
发明内容
本发明提供了基于其他人的喜好,特别是相同家庭中的用户的喜好来扩展用户喜好简档所提供的选择的机理。基于正和/或负实例来生成并改进选择引擎的各种类型的机理被示出。被称为解释空间算法的一种节省了对数据库(即“选择空间”)中可用的所有可能选择的两个描述(1)概括描述,其是除了所有负选择以外的选择空间的最宽描述;以及(2)特别描述,其是包含选择空间中所有正实例的最窄描述。每次当负或正实例被提供时,它被用于相应地改变特别或概括描述。有关解释空间算法的算法和进一步的细节被描述于名为“Television ProgrammingRecommendation Through Generalized And Specialization Of ProgramContent”的US专利申请序列号09/794,445中,其整体在此被引入作为参考,就象在此被完整提出的那样。
在电视节目选择的情况下,概括描述指示用户可能有兴趣的所有可能节目播放选择。特别描述指示用户明确有兴趣的所有可能节目播放描述。概括和特别描述之间的描述范围可以是大的。还有,概括描述可能过于自由以至于不能将大集合的选择减小到合理的数量,而特别描述对于由窄范围的实例来捕获可能是过窄的。
现有技术已提供了其它方式来使用户跳出这种混乱。一种是从由概括描述限定的大空间中随机选择节目内容并让用户分级它们。但这可导致极为愚蠢的练习。例如,假定所提供的仅有实例是英语语言实例。用户没有给出非英语描述的空间中的内容的负实例。但大多数用户可能不愿意通过看电视来扩展其语言水平。这样,随机选择器将抓住英语语言空间以外的实例并让用户分级它们,这仅仅是为了获得或多或少有用的准则。就是说,用户不喜欢它是因为它有关汽车或因为它是用西班牙语言吗?如果请用户分级过多的不相关选择,用户将迅速变得不耐烦。较好的将是从比用户的概括描述窄的描述中选取实例。依照本发明,这可通过以下来实现影响(leveraging)特别描述或依照某种准则而类似于用户的其他人,例如相同家庭中的用户的描述。
在一个实施例中,概括-特别描述被限定包含由用户选择的一个或多个其他人的特别描述的整个空间。这种概括-特别描述被用作源过滤器,用于生成采样,用户的正和负反馈是相对于所述采样而被请求的。在另一个实施例中,一组被自动限定,如家庭中的所有用户,并且新的特别描述被生成,其是包含所有特别描述所限定的空间的最窄特别描述。采样类似地从新的特别空间被得到。
在对以上两个实施例的改进中,优先权被给予鉴别用户特别描述中的含糊维的测试采样。就是说,来自遵循用户特别描述的概括-特别描述的采样已被避免,而处于那个描述以外的采样是所喜欢的。后者的采样显然具有在维方面的较高鉴别能力,用户的特别描述沿该维与概括-特别描述汇合。
对以上途径的另一个改进是使用用户概括描述来使概括-特别描述特别化。由于概括描述是用户所不喜欢的项目的仓库,它可被用作过滤器以过滤概括-特别描述的空间。
在另一个实施例中,用户的类别被限定,并且以类似于合作过滤的方式,用户的特别描述被概括化以包含原型(archetypal)用户的特别描述的空间。例如,服务供应商可为固定形象(stereotype)生成特别描述,如“运动狂热者”、“英国国旗(blood and guts)”、“历史怪人”、“伤感的感情”、“科学情人”和“幻想情人”。
在又一个实施例中,代替使用其它特别描述来创建用于反馈的源以改进用户的描述,新的特别描述被创建,从而来影响其它特别描述。换句话说,概括-特别描述被用来替换用户的特别描述。
在支持用户的特别描述被用来替换概括-特别描述的实施例的用户界面中,可要求用户试用固定形象一段时间。如果用户不喜欢该结果,老的特别描述可被检索。任选地,用户可保留在固定形象描述被应用于使用户的特别描述概括化时获得的反馈的益处。
本发明可被延伸到其它类型的归纳引擎(induction engine)。例如,神经网络可从其它网络针对预测来训练以使它们对喜欢和不喜欢的预测概括化。决策树可通过已知技术来扩展,例如添加由另一个决策树生成的采样或更直接地通过共享来自另一个决策树的分枝。其它类型的机器学习,即使是尚未知的类型,亦可结合本申请中所讲而使用本发明背后的基本思想,并应处于本领域技术人员的能力范围内。
将参照以下说明性附图结合特定优选实施例来描述本发明以更全面地理解它。参照附图,应强调的是,所示的细节仅仅是为了举例并为了对本发明优选实施例的说明性讨论,并且被提出是为了提供被认为是对本发明原理和概念性方面的最有用且容易理解的描述的那些。就这一点而言,没有做出以比基本理解本发明所必要的多的细节来示出本发明的结构性细节的尝试,结合附图进行的描述使得对于本领域的技术人员来说,如何在实践中实施本发明的几种形式是显而易见的。
图1是为了描述其中可实施本发明的一种类型的归纳引擎的概念空间的图解。
图2A-2C是根据两个特别描述来聚集数据以形成用于生成反馈的源过滤器或要被用来替换用户特别描述的新的特别描述的图解。
图3A-3D是表示聚集概括和特别描述与另一个用户的特别描述以形成用于检验目标数据的源过滤器的图解。
图4A和4B说明了对用于特别描述特征的标记的选择。
图5是用于实施本发明的示例硬件环境的图解。
图6是简档引擎特征值评分类型的第一类型和使用的图解。
图7是简档引擎特征值评分类型的第二类型和使用的图解。
具体实施例方式
参考图1,针对描述体系而限定了概念空间100。图1暗示了基于框架的数据结构或者表示语言,其使用用于每个框架间隙中的值的Venn型表示。为了讨论的目的,基于框架的结构中的大量间隙被表示为两个轴x1和x2,其表示描述符分量,如基于框架的结构中的间隙。应理解,所选间隙可表示任何参数,而附图并不旨在暗示它们是独立的或者对它们的数量有任何限制。例如,轴X1可表示电视表演的类型(喜剧、戏剧、恐怖、运动等),而x2可表示演员(Tom Cruise、Shelly Duvall、RobertWagner等)。为了讨论,可以想象有许多不同的描述符分量,其每个都可以取一个或多个值或者一个或多个范围的值,并且其每个都可能相关于或不相关于另一个描述符分量。
可能描述的全体(概念空间100)仅由所述体系的固有偏置来限制。在此,每个可能的描述都被包含在概念空间的最高水平处的零概括描述115中。在进行任何学习之前,这个单元素集合(singleton)概括描述115包含每个可能的实例。在概念空间的最低水平处的是仅包含由用户提供的第一正实例130的单元素集合。
在例如使用被描述于以上、被引入作为参考的申请中的解释空间算法用正和负实例训练了一段时间后,最近期的特别描述170被加宽以使它是包含所有正实例的描述的最窄集合。通过限定,它排除了所有的负实例。还有,在训练之后,已从零概括描述115得到了当前概括描述165,所述零概括描述是不包含任何负实例的可能描述的最宽集合。通过限定,其包含了所有正实例。
从由当前特别描述170限定的选择空间进行的选择仅包括类似于先前正实例的选择。这样,如果推荐是从当前特别描述170得到的,则该推荐将是过窄的,而因为已经给出实例的过窄集合上的正反馈用户将忙于他/她的惯例。在此情况下,用户亦可能具有过宽的概括描述,因此概括描述可能是要扩展成的过宽的空间。在这些极端之间有被称为解释空间(version space)101的空间,其以在人们从概括描述移向特别描述时增加的确定性来限定用于用户可能喜欢的主题的可能描述。
现在参考图2A-2C,新的特别描述290是从用户的特别描述280与另一个特别描述285的并集得到的。后者可以是例如固定形象描述或是另一个用户的。在此,作为域110、115、120和125的并集的用户集合被与另一个集合组合,它是域210、215、220和225的并集。结果是由图2C中所示的邻域250、255、260、265、270和275的并集限定的集合。更确切地说,新描述是用户的被概括化以便于不排除由另一个特别描述285包含的主题的特别描述280。注意,优选的是,概括-特别域包括在与该用户相同的家庭中的其它用户的多个其它特别域。已发现,以与其它家庭用户一致的方式进行扩展提供了比用户自己的简档好的预测。
使用附加用户简档以扩展陷入惯例的简档可被使得可由用户来选择。用户可被提供选择一组用户简档、固定形象简档或被用于扩展用户选项的一个或多个特定简档的选项。其它简档可被用于永久修改用户简档或简单地在使用到使用的基础上扩展选择范围。另一个可能性是对于学习引擎来说,检测用户简档何时已落入惯例并采取校正性动作,例如通过添加家庭所有成员的特别描述。这可依照简档类型以各种方式来确定。例如,在特征值评分类型简档中,仅具有小量特征值评分记录的简档可被识别为是按照惯例的(in a rut)。在概念空间中,被高度特别化的特别描述将指示该简档是按照惯例的。注意,区分相同年龄的家庭成员并仅当成员处于相似年龄目录中时共享描述可能是适当的。
如在现有技术中所知的,系统可请求有关随机选择的新实例的反馈。然而,这样的策略可能是不实用的,这是因为它可包括负反馈已被提供的材料,并可仅包括可能主题的过大空间。通常为负的实例将被发现的高度可能性是存在的,而用户将有可能变得灰心并失去兴趣。可替换的是,当前概括描述165可被用作用于新实例的过滤器。然而,当前概括描述165仍可限定实用的可能性的过大空间。
解决该问题的一个途径是使用另一个用户的特别描述作为过滤器以便于请求反馈。系统可使用另一个用户的简档的特别描述作为过滤器以便于选择新材料并请求这个新材料的用户反馈。参考图3A-3D,优选的是,用户已给出反馈的材料从检验实例中被排除。这样,用户的概括描述165和用户的特别描述170中对应的部分可从另一个特别描述285中被去除以提供用于反馈315的新模板。尽管仅一个其它特别描述170被示出于图中,显然任何数量的特别描述的并集亦可被用于生成用于反馈的模板。
涉及允许用户使用其他人的简档来增强他/她自己的简档的一个重要问题是给予用户对过程的某种意义上的控制。可能在此主要关心的是使用户明确她或他可以做什么。在某些情况下,其它简档的影响可以透明地进行。例如,代替单独依赖于用户的个体简档,推荐器可包括从与该用户同一的家庭中的其他用户的简档得到的推荐。这可在部分时间或所有时间进行。当然,不论何时获得反馈,它都可被用于改进个体用户的简档。
尽管以上讨论采用了解释空间算法所建议的比喻性术语(figurativeterm)和附图,本发明亦可用于其它类型的推荐器系统。假定第一用户喜欢通过另一个用户的简档而推荐的实例。允许用户使用另一个用户的简档来修改其自己的简档的一种方式是使用该另一个用户的简档来生成使用另一个用户的简档所建议的表演并允许第一用户给出有关它们的反馈。这可无需它们在推荐引擎之间的任何兼容性而实现。
用于扩展用户简档的另一个策略是用另一个用户的概括描述来替换用户的概括描述。
参考图5,可支持本发明的硬件环境的实例包括计算机440,其被配备以接收视频信号470和控制通道改变功能,并允许用户通过被链接于计算机440的调谐器445而不是电视的调谐器430来选择通道。然后通过使用遥控410控制计算机来加亮来自所显示的节目时间表的所需选择,用户可选择要观看的节目。计算机440具有数据链接460,通过它计算机可接收更新的节目时间表数据。这可以是可连接于互联网服务供应商的电话线或某种其它适当的连接。计算机440具有海量存储设备435,例如硬盘,以存储节目时间表信息、节目申请和升级,以及其它信息。有关用户喜好的信息和其它数据可通过可移动介质如存储器卡或盘420上载到计算机440中。
注意,在以上示例硬件环境中许多替换是可能的,并且都可结合本发明而使用。海量存储可由易失性存储器或非易失性存储器来替换。数据可在本地或远距离存储。事实上,整个计算机440可被替换成通过链接在现场以外工作的服务器。代替使用遥控通过红外线端口415将命令发送给计算机440还可以控制器通过数据通道460来发送命令,所述数据通道可与载运视频的物理通道分离或与之相同。视频470或其它内容可由线缆、RF或任何其它宽带物理通道来载运或从海量存储或可移动存储介质获得。它可由交换的物理通道如电话线或者虚拟交换的通道如ATM或适合于同步数据通信的其它网络来载运。内容可以是非同步的并且可容许信号失落,因此现今的IP网络可被使用。此外,用来接收节目播放内容的线的内容可以是音频、聊天会话数据、网站或各种选择对其来说可能的任何其它种类的内容。节目向导数据可通过通道而不是分离的数据链接460来接收。例如,节目向导信息可通过与视频或其它内容相同的物理通道来接收。它甚至可以通过可移动数据存储介质如存储器卡或盘420来提供。遥控410可被替换成键盘、语音命令界面、3D鼠标、游戏杆或任何其它适当的输入设备。可通过移动加亮的指示符、用符号(例如通过名字或数字)标识选择而做出选择,或通过数据传输或可移动介质以批量形式做出选择。在后者的情况下,一个或多个选择可以以某种形式被存储并发送给计算机440,从而彻底绕过了显示器170。例如,批量数据可来自便携式存储设备(例如个人数字助理、存储器卡或智能卡)。这样的设备可在其上存储许多喜好以便在各种环境中使用以定制要使用的计算机设备。
某些类型的概括机理允许其内部目标描述被显示为抽象(abstraction)。例如,在基于框架的数据结构中实际上允许一个用户通过将标题关联于不同间隙而检查另一个用户的简档将是可能的。尽管因为间隙不是独立的,在任何一个间隙中选择的影响可影响其它间隙中经允许的选择,但向用户呈现简档如何被构建的有意义视图的直截了当的任务是不必要的。例如,用户的简档可包含暗示演员Tom Cruise为用户所喜欢的特别描述。但被给予正反馈的实例被局限于动作类型的电影。这样,不能说用户喜欢Tom Cruise。可能是用户仅喜欢特定类型的电影中的Tom Cruise。以上实例是简单的。真正的实例可能是很复杂的并因此使得难以呈现给用户。界面将必须示出具有任何兴趣间隙的所有被链接的间隙,由此限定多参数空间。但要考虑到目标不是100%的精度。目标可以是简单地允许用户借用另一个用户的简档的仅特定方面并且可不必很完整地表征那个方面。系统可提供以(offer to)基于特定间隙来修改用户的简档,该特定间隙通过基于仅一个间隙中的值来标记所述修改而与许多其它间隙耦合。这样,如果系统向第一用户表明第二用户的简档显示出对Tom Cruise的经标记的喜好,则第一用户在接受基于那个喜好对他/她自己的简档的修改的情况下可扩展他/她的简档,从而使其推荐与在第二用户的简档中隐含的所有附属警告(attendant caveat)耦合的Tom Cruise实例。换句话说,在所给的实例中,第一用户将被询问她或他是否要Tom Cruise并且她或他将获得Tom Cruise,但仅仅是动作电影中的Tom Cruise。
在被调节于解释空间算法下的基于框架的数据结构中,用于用户简档的特征的确定标记如“Tom Cruise”可通过选择一个值(例如,与其它间隙中的值多次组合而出现的“Tom Cruise”)来识别。换句话说,存在特别描述中的那个间隙值的高发生率。用于允许用户控制将描述信息从一个简档移植到另一个中的这种机理被示出于图4A和4B中。在此,可以是例如用户特别描述的用户描述被扫描,并且其各个部分根据优势特征而被标记。图中所示的是将部分210标记成“Tom Cruise”。比方说,数据结构的一维x1可对应于演员。另一维x2可被认为是对应于其它参数,如电影类型或任何其它的。值“Tom Cruise”已结合其它参数的多个值而被选择,因此可以推断,它是重要的特征值。
注意,尽管描述的部分210被示出为邻近封闭(close)的空间,如在其它图中的其它部分,这意味着邻近的范围,但这样的特征可能或可能不表示数据是如何在目标描述中被表示的。在基于框架的模型中,每个特征或间隙可具有离散值并且在相邻特征之间可能没有关系,因此数据集将趋向于形成诸如210的封闭空间。这仅仅是为了讨论而借用的抽象。封闭空间的仅有方面是,在330处表示的维上的其长度暗示了这样的事实,即值“Tom Cruise”被关联于沿暗示其重要性的维x2的其它特征的多个值。
在其它类型的数据结构中,用于标记简档部分的机理将是容易识别的。例如,在存储特征值对的系统中,标记重要特征并移植该特征到另一个简档是更为容易的。参考图6,在这样的系统中,用户提供反馈以将选择分级成喜欢或不喜欢的,并且任选地,包括喜欢或不喜欢的程度。例如,系统可使用从1-7的评分,其中4是中性,1-3表示不喜欢的程度,而5-7表示喜欢的程度。用户界面(UI)500被用于列出节目并接受反馈信息。可替换的是,UI 500可以是简单的提示,当节目结束或当用户从节目离开时其请求用户给出有关该节目的反馈。优选的是,提示类型将受制于(subject to)喜好集合,如果需要的话,其将允许用户在某些或所有情况下不考虑提示。
由反馈UI 500的每个例子生成的信息是一个或多个选择(如果是电视数据库,则是表演)555,其具有与该选择关联的评分。这可被用于管理反馈历史文件505,其可包含大量这样的条目。反馈数据然后可被应用于简档器550。可替换的是,可通过首先在简档器550中减少数据然后存储在反馈简档数据库525中从而以减少的形式来存储数据。所述减少可以是一个集合的特征值对465,每个都有一个分级,如在提交于2000年2月4日的09/498,271,BAYESIAN TV SHOW RECOMMENDER中所述。给定选择可产生具有对应评分的一个数量(M)的特征值对565。优选地,用户分级既喜欢又不喜欢的节目以使正和负反馈两者均被获得。如果仅正反馈被获取,比如由于反馈仅对选择用于观看的节目而被提供,则负因子可能不入住数据库。然后这可通过以下来改进使系统通过选择在做出选择的同时可用的表演的子集而生成负选择的集合。优选地,如所述,用户提供正和负反馈的平衡并且不需要对负选择的自动采样。其相应的特征值计数将被递减。在许多选择上存储的这个数据可被存储在反馈简档525数据库中。然后当推荐器580基于从表演数据库520得到的候选者清单而做出推荐时,N个记录的整体555是可用的。该过程的最终结果是可以从表演数据库520中获得的选择的经过滤或分拣的清单575。推荐器可以是Bayesian过滤器或任何其它预测器。
参考图7,与图6很相似的过程可被用于生成特征值对简档数据库。该预测器是在背景部分中描述的第一种类型。在此,对节目选择的用户选择被推断以指示用于节目选择的正评分。用户给定选择的结果是任选地具有附属评分的特定节目665。该结果亦可包括可从用户响应的方式来推断的评分。如果用户看节目到结束,则评分可能是高的,而如果仅看了短时间,则评分可能是负的。如果节目被看了介于两者之间的时间段,则评分可以是中间量级。可替换的是,所看的节目可接收正评分而未看的节目(任选地,在相同时间)的随机采样可按收负评分。
观看历史数据库510存储表演和评分。记录670被提供给简档器595,其生成具有附属评分675的特征值对,其可被存储在隐含简档数据库530中。隐含简档数据库530的内容680然后可用于推荐器620,其组合所述内容与来自当前表演520的数据以生成推荐685。
在这种类型的简档器中,缺乏对特征的耦合使标记可从一个简档被移植到另一个的数据部分的问题不复杂。这样,特征“演员”和值“TomCruise”将容易被识别为在目标简档中是突出的。这是因为那个特征值对将具有与之关联的高评分。用户可被提供选择另一个用户的简档的那个方面以便于移植到他/她的简档中的选项。结果将是对与用户简档中对应的特征值关联的评分的调节。
组合特征值评分类型的数据以加宽简档按照惯例的用户将是一种这样的事情即在惯例用户(rutted user)的简档中提高在非惯例用户的数据库中具有高评分的特征值对的评分。同样,用户界面可被生成以允许惯例用户选择要修改的特征值。可替换的是,用户可允许看不见地进行此事。又一个替换允许仅仅暂时做出改变以试验该变化。处理落入惯例的问题的另一种方式是调节与用户的简档关联的任何很强的评分。这可由用户选择性地进行。用户界面可向用户指示什么样的特征值具有很强的评分(正或负)并允许用户修改它们。
对本领域的技术人员来说将显而易见的是,本发明并不局限于以上说明性实施例的细节,并且可在本发明的精神或基本属性范围内以其它特定形式来实施本发明。当前的实施例因此应被认为在所有方面都是说明性的,而非局限性的,本发明的范围由所附的权利要求而不是以上描述来指示,因此属于权利要求的等效意义和范围内的所有变化旨在被包括于其中。
例如,尽管已参照电视推荐器讨论了本发明,显然它可适用于搜索引擎可能被使用的任何种类的介质或数据。这样,例如,本发明可在互联网搜索工具或用于音乐数据库的搜索引擎的情况下被使用。
权利要求
1.一种修改用于数据类别推荐器的第一用户的用户简档的方法,包括以下步骤接收来自属于各种数据类别的第一用户评分实例的反馈;响应于所述反馈而改进所述第一用户的用户简档;响应于来自第二用户的用户简档的数据而选择性地修改所述第一用户的用户简档以使所述第一用户的用户简档较类似于所述第二用户的用户简档。
2.权利要求1的方法,其中所述选择性修改步骤包括从所述第一用户接收命令。
3.权利要求1的方法,其中所述第一和第二用户的用户简档每个都包括概括目标描述,其限定喜欢的数据类别的最宽描述,并且所述修改步骤包括将所述第一用户的用户简档的所述概括描述替换成所述第二用户的用户简档的所述概括描述。
4.权利要求3的方法,其中所述概括化步骤包括通过用至少所述第一用户的用户简档和所述第二用户的用户简档的特别描述的并集来替换所述第一用户的用户简档的所述特别描述,从而修改所述第一用户的用户简档。
5.权利要求1的方法,其中隐含型第一用户简档是基于有关特定数据类别的反馈为数据类别推荐器而生成的,该方法包括以下步骤基于准则的种类来标记第二用户简档的特征,所述第二用户简档是通过提供有关各个选择的反馈而生成的隐含简档;显示从所述标记步骤产生的标记;选择至少一个所述标记;响应于对应于所述至少一个所述标记的所述第二用户简档的部分而修改所述第一用户简档。
6.权利要求5的方法,其中所述标记步骤包括识别与多个其它第二数据描述符结合出现的第一数据描述符并且用对应于所述第一数据描述符的标记来标记。
7.权利要求5的方法,其中所述标记步骤包括识别高评分所存在的特征值评分数据库中的第一数据描述符。
8.权利要求1的方法,其中隐含型第一用户简档被修改,该方法包括以下步骤组合所述第一用户简档的特征与第二用户简档的特征以使所述第一用户筒档更象所述第二用户简档;所述组合步骤包括以下的至少一个将第一简档概括描述替换成第二简档概括描述;将第二简档特别描述的至少一部分添加给第一简档特别描述;以及响应于第二简档特征值评分数据库的评分而修改第一简档特征值评分数据库的评分。
全文摘要
推荐电视节目的数据类别推荐器,如电子节目向导,允许用户使用其他用户的简档来修改其隐含的简档。例如,如果用户喜欢通过朋友的简档做出的节目播放选择,则通过将朋友的简档添加给其自己的简档的部分,不论替换所述部分还是形成指示所喜欢的数据类别的描述符的并集,用户可使他/她的简档被修改。依照实施例,特征可被标记以允许修改的用户选择朋友简档的特定部分以在做出修改的过程中使用。标记可基于特征值评分或以下的种类来进行,即对于该种类,在限定优选主题的描述中,如在解释空间的特别描述中,存在与其它种类的高频率的交叉相关性。
文档编号H04N7/16GK1739106SQ02819016
公开日2006年2月22日 申请日期2002年9月17日 优先权日2001年9月28日
发明者S·V·R·古特塔, K·库拉帕蒂 申请人:皇家飞利浦电子股份有限公司