一种用于确定用户所对应的目标对象信息的方法与设备的制作方法
【专利摘要】本发明的目的是提供一种用于确定用户在资源信息库中所对应的目标对象信息的方法与设备。处理设备通过根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的候选目标对象信息,根据所述用户在所述检索词下所对应的检索日志信息,确定所述候选目标对象信息所对应的检索应用信息,根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的目标对象信息。与现有技术相比,本发明实现了在特定资源范围内的对所述目标对象信息的获取,提高了所获取的目标对象信息的准确性与完整性,提高了获取目标对象信息的效率,进而准确地对用户进行如个性化推荐等服务,改善了用户体验。
【专利说明】一种用于确定用户所对应的目标对象信息的方法与设备
【技术领域】
[0001]本发明涉及互联网领域,尤其涉及一种用于确定用户在资源信息库中所对应的目标对象信息的技术。
【背景技术】
[0002]当前,对于用户的目标对象信息(如用户的兴趣点)的确定,主要是通过文本分析或专名识别的方法进行。所述文本分析方法,是指将所有用户的检索词信息、以及用户查看网页的标题和正文中的文本信息收集起来,采用潜在语言模型或者文本聚类的方法建立N个目标对象信息,然后分别计算每个用户在每个目标对象信息上的兴趣程度或者直接将所述N个目标对象信息作为每个用户所拥有的目标对象信息;所述专名识别方法,是指首先建立一个专名词典(如电影名称),然后从用户搜索的检索词中匹配词典中的专有名词,若能匹配则表明用户对该专名感兴趣,从而将所述专名作为用户的目标对象信息。
[0003]然而,所述文本分析方法反映出的用户的目标对象信息(如用户的兴趣点)不够明确和具体,只能从文本层面用聚类簇这种抽象的概念来描述用户对哪些词语感兴趣,无法准确描述用户对某一类实体(电影、电视剧、动漫、综艺等)的兴趣。所述专名识别方法可以将用户的目标对象信息(如用户的兴趣点)描述到实体专名的层次,但是由于一词多义性的原因,单纯从检索词中匹配专名的方法准确性不高,容易造成用户兴趣点识别错误;另外,由于同名、别名的存在,许多用户兴趣点也可能会被遗漏。
【发明内容】
[0004]本发明的目的是提供一种用于确定用户在资源信息库中所对应的目标对象信息的方法与设备。
[0005]根据本发明的一个方面,提供了一种用于确定用户在资源信息库中所对应的目标对象信息的方法,其中,该方法包括以下步骤:
[0006]a根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选目标对象信息;
[0007]b根据所述用户在所述检索词下所对应的检索日志信息,确定所述候选目标对象信息所对应的检索应用信息,其中,所述检索应用信息包括所述候选目标对象信息在所述检索日志信息中的一个或多个应用维度信息;
[0008]c根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0009]根据本发明的另一方面,还提供了一种用于确定用户在资源信息库中所对应的目标对象信息的处理设备,其中,该设备包括:
[0010]匹配装置,用于根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选目标对象信息;
[0011]维度确定装置,用于根据所述用户在所述检索词下所对应的检索日志信息,确定所述候选目标对象信息所对应的检索应用信息,其中,所述检索应用信息包括所述候选目标对象信息在所述检索日志信息中的一个或多个应用维度信息;
[0012]对象确定装置,用于根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0013]与现有技术相比,本发明通过根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选目标对象信息,再根据所述用户在所述检索词下所对应的检索日志信息,确定所述候选目标对象信息所对应的包含一个或多个应用维度的检索应用信息,最后根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的目标对象信息;从而实现了在特定资源范围内的对所述目标对象信息的获取,提高了所获取的目标对象信息的准确性与完整性,提高了获取目标对象信息的效率,进而准确地对用户进行如个性化推荐等服务,改善了用户体验。[0014]而且,本发明还可以根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选资源信息,根据所述候选资源信息,确定与所述检索词相对应的一个或多个候选目标对象信息;从而从多个角度来确定候选目标对象信息,进一步实现了在特定资源范围内的对所述目标对象信息的获取,提高了所获取的目标对象信息的准确性与完整性,提高了获取目标对象信息的效率,进而准确地对用户进行如个性化推荐等服务,改善了用户体验。
[0015]而且,本发明还可以根据所述用户在所述检索词下所对应的检索日志信息,确定与所述候选目标对象信息相关联的一个或多个访问对象信息,根据所述访问对象信息,确定所述候选目标对象信息所对应的检索应用信息;进一步地,根据所述用户在所述检索词下所对应的检索日志信息,结合所述资源信息库,确定与所述候选目标对象信息相关联的一个或多个访问对象信息;从而通过根据所确定的访问对象信息,来确定所述候选目标对象信息所对应的包含一个或多个应用维度的检索应用信息,进一步地实现了实现了在特定资源范围内的对所述目标对象信息的获取,提高了所获取的目标对象信息的准确性与完整性,提高了获取目标对象信息的效率,进而准确地对用户进行如个性化推荐等服务,改善了用户体验。
[0016]优选地,本发明还可以根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的一个或多个第一初选目标对象信息,根据所述一个或多个第一初选目标对象信息,确定所述用户在所述资源信息库中所对应的目标对象信息;从而通过对第一初选目标对象信息的筛选、映射、整合等,选出更为精准的、符合用户需求的目标对象信息,实现了在特定资源范围内的对所述目标对象信息的获取,提闻了所获取的目标对象?目息的准确性与完整性,提闻了获取目标对象?目息的效率,进而准确地对用户进行如个性化推荐等服务,改善了用户体验。
[0017]而且,本发明还可以根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的第二初选目标对象信息,根据所述第二初选目标对象信息,结合所述资源信息库,确定与所述第二初选目标对象信息相对应的一个或多个候选目标属性信息,根据所述候选目标属性信息,确定所述用户在所述资源信息库中所对应的目标对象信息;从而根据与第二初选目标对象相对应的候选目标属性信息,确定所述目标对象信息,丰富了目标对象信息的类型与内容,实现了在特定资源范围内的对所述目标对象信息的获取,提高了所获取的目标对象信息的准确性与完整性,提高了获取目标对象信息的效率,进而准确地对用户进行如个性化推荐等服务,改善了用户体验。
[0018]而且,本发明还可以根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的第三初选目标对象信息,根据所述第三初选目标对象信息,结合所述用户的检索日志信息,确定与所述第三初选目标对象信息所对应的关联检索词,根据所述关联检索词,结合所述资源信息库,确定所述用户在所述资源信息库中所对应的目标对象信息;从而提高了目标对象信息挖掘的召回率,丰富了目标对象信息的范围与内容,更加全面描述用户兴趣,防止无法达到匹配条件的候选兴趣点被过滤,实现了在特定资源范围内的对所述目标对象信息的获取,提高了所获取的目标对象信息的准确性与完整性,提高了获取目标对象信息的效率,进而准确地对用户进行如个性化推荐等服务,改善了用户体验。
[0019]而且,本发明还可以根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的第四初选目标对象信息,根据所述第四初选目标对象信息,结合与所述第四初选目标对象信息相对应的时间信息,确定所述用户在所述资源信息库中所对应的目标对象信息;从而实现了根据时间信息对第四初选目标对象信息的筛选或优选,从而实现了在特定资源范围内的对所述目标对象信息的获取,提高了所获取的目标对象信息的准确性与完整性,提高了获取目标对象信息的效率,进而准确地对用户进行如个性化推荐等服务,改善了用户体验。
[0020]而且,本发明还可以获取所述用户的查询序列信息,根据所述用户在所述资源信息库中所对应的目标对象信息,确定与所述查询序列信息相对应的优选查询序列信息;从而对所述用户的查询序列信息进行优化,获得更符合用户需求的优选查询序列信息,提高了用户获取信息的效率,准确地对用户进行如个性化推荐等服务,改善了用户体验。
[0021]而且,本发明还可以根据所述目标对象信息,确定与所述用户相对应的用户特征模型;进一步地,还可以根据所述用户特征模型,将与所述用户特征模型相对应的资源信息提供至所述用户;从而准确地对用户进行如个性化推荐等服务,提高了推荐的准确性,改善了用户体验。
【专利附图】
【附图说明】
[0022]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0023]图1示出根据本发明一个方面的一种用于确定用户在资源信息库中所对应的目标对象信息的处理设备示意图;
[0024]图2示出根据本发明一个优选实施例的一种用于确定用户在资源信息库中所对应的目标对象信息的处理设备示意图;
[0025]图3示出根据本发明另一个方面的一种用于确定用户在资源信息库中所对应的目标对象信息的方法流程图;
[0026]图4示出根据本发明一个优选实施例的一种用于确定用户在资源信息库中所对应的目标对象信息的方法流程图。[0027]附图中相同或相似的附图标记代表相同或相似的部件。
【具体实施方式】
[0028]下面结合附图对本发明作进一步详细描述。
[0029]图1示出根据本发明一个方面的一种用于确定用户在资源信息库中所对应的目标对象信息的处理设备示意图;其中,所述处理设备包括匹配装置1、维度确定装置2、对象确定装置3。具体地,匹配装置I根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选目标对象信息;维度确定装置2根据所述用户在所述检索词下所对应的检索日志信息,确定所述候选目标对象信息所对应的检索应用信息,其中,所述检索应用信息包括所述候选目标对象信息在所述检索日志信息中的一个或多个应用维度信息;对象确定装置3根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0030]在此,所述处理设备包括但不限于网络设备、用户设备、或网络设备与用户设备通过网络相集成所构成的设备。其中,所述网络设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。所述网络设备其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述用户设备其包括但不限于任何一种可与用户通过键盘、遥控器、触摸板、或声控设备进行人机交互的电子产品,例如计算机、智能手机、PDA、游戏机、或IPTV等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。本领域技术人员应能理解,其他的处理设备同样适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
[0031]上述各装置之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各装置分别实时地,或者按照设定的或实时调整的工作模式要求,进行候选目标对象信息的获取、检索应用信息的确定、目标对象信息的确定等,直至所述处理设备停止获取与所述检索词相对应的一个或多个候选目标对象信息。
[0032]匹配装置I根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选目标对象信息。
[0033]具体地,所述匹配装置I根据各种通信协议(Communications Protocol),通过各类数据传输接口,与存储或提供所述检索词或查询序列信息的一个或多个数据库或其他第三方设备相交互,以获取所述数据库或所述第三方设备中所存储或提供的用户的检索词;或者所述匹配装置I还可以根据各种通信协议(Communications Protocol),通过各类数据传输接口,与所述用户直接交互,获取所述用户通过输入、选择、触摸等方式所提交的检索词或查询序列信息。
[0034]在此,所述匹配装置I可以将所述数据库或第三方设备所存储的用户的查询序列(query)信息直接作为检索词,也可以对所述数据库或第三方设备所存储的用户的查询序列(query)信息进行分词后,获得一个或多个检索词;同理,所述匹配装置I可以将所述用户所输入的查询序列(query)信息直接作为检索词,也可以对所述用户所输入的查询序列(query)信息进行分词后,获得一个或多个检索词。在此,是否需要分词可根据所述查询序列信息的长度、语义等进行确定。
[0035]例如,当用户输入查询序列信息“让子弹飞”时,则将“让子弹飞”直接作为检索词;当用户输入查询序列信息“郭敬明小时代”时,则将“郭敬明”和“小时代”分别作为两个检索词。
[0036]当所述匹配装置I获取所述用户的检索词时,将所述检索词在预定的资源信息库中进行匹配查询,若所述检索词命中所述资源信息库中的资源信息,则将所述资源信息作为与所述检索词相对应的一个或多个候选目标对象信息。
[0037]其中,所述资源信息库可以是系统默认的、或是用户指定的、或是根据应用需求所设置的资源信息库;例如,如需要统计用户对特定分类的资源的目标对象信息,则将与该特定分类的资源所对应的资源信息库作为用来匹配检索词的预定的资源信息库;例如,如用户希望获取某一方向的资源,则可以指定特定的资源信息库,从而获取系统所确定的该方向的目标对象信息。在此,所述资源信息库包括但不限于多媒体作品信息库(如电影作品信息库、音乐作品信息库、动漫作品信息库、小说作品信息库、其他书籍信息库等,或者前述两个或多个的混合多媒体作品信息库)、地点信息库、商品信息库;从而通过所述资源信息库,可以对用户与兴趣实体相关的兴趣点进行挖掘,如对多媒体作品的目标对象信息(如希望观看的多媒体作品的兴趣点)、如对地点相关的目标对象信息(如感兴趣的餐厅、喜欢的旅游景点等)、如对商品相关的目标对象信息(如感兴趣的商品等)。
[0038]以所述资源信息库为多媒体作品信息库为例,所述资源信息库中包括但不限于以下至少任一项:
[0039]-所述分类资源所对应的资源名称信息,其中,所述资源名称信息中包括一个或多个别名信息,例如,所述分类资源为“海贼王”时,则存储“海贼王” “one piece” “航海王”等多个资源名称信息;
[0040]-所述分类资源所对应的资源属性信息,例如,所述分类资源为“海贼王”时,则存储“海贼王”所对应的作者、国别、出品时间、登场人物、章节目录、内容简介;
[0041]-所述分类资源所对应的url信息,例如,所述分类资源为“海贼王”时,则将与“海贼王”相关联的垂直站点的网址的url列表作为与“海贼王”所对应的url信息,所述url列表中的每个url都对应于“海贼王”这个作品,例如是该作品的介绍、fansite、资源信息站等。
[0042]例如,当所述匹配装置I获取所述用户的检索词“one piece”时,将所述检索词在预定的资源信息库中进行匹配查询,所述检索词“onepiece”命中该资源信息库中的资源信息“海贼王”,则将所述资源信息“海贼王”作为与所述检索词相对应的候选目标对象信息。
[0043]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选目标对象信息的方式、或者任何资源信息库的类型或其包含的内容信息,均应包含在本发明的范围内。
[0044]优选地,所述匹配装置I可以根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选资源信息;根据所述候选资源信息,确定与所述检索词相对应的一个或多个候选目标对象信息。
[0045]具体地,当所述匹配装置I获取所述用户的检索词时,将所述检索词在预定的资源信息库中进行匹配查询,若所述检索词命中所述资源信息库中的资源属性信息或其他相关信息,则将所述资源属性信息或其他相关信息作为与所述检索词相对应的一个或多个候选资源信息;根据所述候选资源信息,将与所述资源属性信息相对应的资源信息(如资源名称信息),确定为与所述检索词相对应的一个或多个候选目标对象信息。
[0046]例如,当所述匹配装置I获取所述用户的检索词“尾田荣一郎”时,将所述检索词在预定的资源信息库中进行匹配查询,所述检索词命中所述资源信息库中的资源属性信息“作者信息”,则将所述“作者信息:尾田荣一郎”作为与所述检索词相对应的一个或多个候选资源信息;根据所述候选资源信息,将与所述“作者信息”相对应的资源信息,即“海贼王”,确定为与所述检索词相对应的一个或多个候选目标对象信息。
[0047]从而通过这些更细粒度的资源属性信息,判断用户实际希望得到的候选目标对象信息;还可以通过这些更细粒度的资源属性信息,实现跨资源库的推荐(如根据演员八,将其主演的电影、电视剧、参加的综艺节目、相关娱乐资讯等均作为候选目标对象信息),以实现更加精准丰富的推荐服务。
[0048]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选资源信息,并根据所述候选资源信息,确定与所述检索词相对应的一个或多个候选目标对象信息方式,均应包含在本发明的范围内。
[0049]维度确定装置2根据所述用户在所述检索词下所对应的检索日志信息,确定所述候选目标对象信息所对应的检索应用信息,其中,所述检索应用信息包括所述候选目标对象信息在所述检索日志信息中的一个或多个应用维度信息。
[0050]具体地,所述维度确定装置2根据各种通信协议(Communications Protocol),通过各类数据传输接口,与存储或提供所述用户的检索日志信息的一个或多个数据库或其他第三方设备相交互,以获取所述数据库或所述第三方设备中所存储或提供的用户的检索日志信息,进而获取所述用户在所述检索词下所对应的检索日志信息;或者所述维度确定装置2还可以根据各种通信协议(Communications Protocol),通过各类数据传输接口,与所述用户直接交互,获取所述用户通过输入、选择、触摸等方式所提交的检索信息,进而获得所述用户在所述检索词下所对应的检索日志信息。
[0051]其中,所述检索日志信息包括所述用户的id信息、cookie信息、检索词、检索时间、所述用户通过点击、触摸等方式所选择的一条或多条检索结果信息中的一种或多种;在此,所述检索结果信息中包含检索结果所对应的URL信息以及所述URL所对应的页面标题信息、页面内容信息等。所述用户在所述检索词下所对应的检索日志信息,则为指向所述检索词的检索时间、以及所述用户通过点击、触摸等方式所选择的在所述检索词下的一条或多条检索结果信息。
[0052]所述维度确定装置2通过获取所述用户在所述检索词下所对应的检索日志信息,对所述检索日志信息中的内容进行统计整合,从而获取所述候选目标对象信息在所述检索日志信息中的一个或多个应用维度信息;根据所述一个或多个应用维度信息,将所述一个或多个应用维度信息所对应的信息确定为所述候选目标对象信息所对应的检索应用信息。[0053]其中,所述应用维度信息包括但不限于以下至少任一项:
[0054]-资源基本维度信息:即所述用户通过点击、触摸等方式所选择的一条或多条检索结果信息与所述候选目标对象相对应的数目,例如,继上例,用户的检索词为“海贼王”,并且所述“海贼王”为候选目标对象信息,然后用户在与“海贼王”相对应的搜索结果中,点击了 N条与“海贼王”相对应的URL,则将N或者根据预定计算方式对N处理后的数据(如将N条URL分别乘以所述URL所对应的站点的权重值),作为与该用户的检索词“海贼王”相对应的资源基本维度信息;
[0055]-资源标题维度信息:即所述用户通过点击、触摸等方式所选择的一条或多条检索结果信息中,所述检索结果信息所对应的页面的标题中包含所述候选目标对象信息的数目,例如,继上例,用户点击了 N条与“海贼王”相对应的URL,所述N条URL所对应的页面的标题中,有M个都包含了候选目标对象信息“海贼王”,则将M或者根据预定计算方式对M处理后的数据(如将M个标题分别乘以所述URL所对应的站点的权重值,其中,若所述标题中含有特殊加强符号,则所述标题所对应的权重值高),作为与该用户的检索词“海贼王”相对应的资源标题维度信息;
[0056]-资源文本维度信息:即所述用户通过点击、触摸等方式所选择的一条或多条检索结果信息中,所述检索结果信息所对应的页面的内容中包含所述候选目标对象信息的数目、或与所述候选目标对象信息相关联的其他信息的数目,例如,继上例,用户点击了 N条与“海贼王”相对应的URL,所述N条URL所对应的页面的内容中,包含了 K个候选目标对象信息“海贼王”,则将K或者根据预定计算方式对K处理后的数据(如将K个内容分别乘以所述URL所对应的站点的权重值),作为与该用户的检索词“海贼王”相对应的资源文本维度信息。
[0057]从而,所述维度确定装置2将所述一个或多个应用维度信息,如资源基本维度信息、资源标题维度信息、资源文本维度信息中的一个或多个,作为所述候选目标对象信息所对应的检索应用信息。
[0058]对象确定装置3根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0059]具体地,所述对象确定装置3根据所述匹配装置I所获取的一个或多个候选目标对象信息,并结合与所述候选目标对象信息所对应的检索应用信息,例如通过对所述多个候选目标信息所对应的检索应用信息中的多个维度信息进行排序、加权排序等方式,对所述多个候选目标对象信息进行筛选或基于一定的阈值进行过滤,从而将排序靠前的、或是大于所述过滤阈值的候选目标信息,确定为所述用户在所述资源信息库中所对应的目标对象信息,从而实现了在特定资源范围内的对所述目标对象信息的获取,能提高用户对特定资源的兴趣点挖掘准确性,提高兴趣点识别的准确性和召回率,通过结合所述检索应用信息,避免同义词等兴趣提取不准确的情况,为用户提供更加精准的个性化推荐。
[0060]在此,所述检索应用信息除了可以用来进行排序或加权排序外,以进行筛选所述候选目标对象信息外,还可以协助判断所述用户的候选目标对象信息的类别。例如,当用户输入检索词“苹果”,所述“苹果”可以是手机、电影、水果等类别,若希望提取用户对电影的兴趣,则所述资源信息库为电影作品信息库,若用户的检索应用信息(如所点击的URL信息)命中了所述电影作品信息库,则所述用户的检索词所对应的目标对象信息是电影类型的“苹果”。
[0061]进一步地,所述对象确定装置3可以根据所述匹配装置I所获取的一个或多个候选目标对象信息,并结合与所述候选目标对象信息所对应的检索应用信息,例如通过对所述多个候选目标信息所对应的检索应用信息中的多个维度信息进行排序等方式,对所述多个候选目标对象信息进行筛选,从而确定所述用户在所述资源信息库中所对应的一个或多个初选目标对象信息;然后根据所述一个或多个初选目标对象信息,结合所述初选目标对象信息的对象相关信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0062]其中,所述对象相关信息包括但不限于以下至少任一项:
[0063]-所述初选目标对象信息所对应的资源名称信息,如所述初选目标对象信息为资源作者信息或资源属性信息,则将所述初选目标对象信息所对应的资源名称信息确定为所述目标对象信息;
[0064]-所述初选目标对象信息所对应的对象属性信息,如所述初选目标对象信息在所述资源信息库中对应一个或多个对象属性信息(如作者、国别、出品时间、登场人物、章节目录、内容摘要关键字等),则将所述对象属性信息作为所述目标对象信息;
[0065]-所述初选目标对象信息所对应的检索相关信息,如根据所述检索相关信息,可以确定与所述初选目标对象所对应的检索词相对应的关联检索词,且所述关联检索词信息命中所述资源信息库中的资源信息,则将所述关联检索词所对应的资源信息直接作为所述目标对象信息;
[0066]-所述初选目标对象信息所对应的时间相关信息,如根据所述初选目标对象信息的搜索时间与当前时间的时间差,距离当前时间越久,则所述初选目标对象信息的时间衰减系数越高,例如,若距离当前时间超过预定阈值,则不再将所述初选目标对象信息作为所述目标对象信息,反之,若距离当前时间小于预定阈值,则将所述初选目标对象信息作为所述目标对象信息;或者,例如对所述小于一定时间阈值范围内的多个初选目标对象信息进行频次统计或聚类,从而将频次统计较高的、或是聚类结果较大的初选目标对象信息作为所述目标对象信息。
[0067]优选地,所述对象确定装置3可以根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的一个或多个第一初选目标对象信息;根据所述一个或多个第一初选目标对象信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0068]具体地,所述对象确定装置3根据所述匹配装置I所获取的一个或多个候选目标对象信息,并结合与所述候选目标对象信息所对应的检索应用信息,例如通过对所述多个候选目标信息所对应的检索应用信息中的多个维度信息进行排序等方式,对所述多个候选目标对象信息进行筛选,从而确定所述用户在所述资源信息库中所对应的一个或多个第一初选目标对象信息。
[0069]所述对象确定装置3根据所述一个或多个第一初选目标对象信息,通过对所述多个第一初选目标对象信息进行聚类整合等方式,确定所述用户在所述资源信息库中所对应的目标对象信息,例如,所述多个第一初选目标对象信息都指向同一个作品或指向相似的作品,则将所指向的作品作为所述目标对象信息;或者,所述第一初选目标对象信息为所述资源信息所对应的资源属性信息,如为作者信息,则将所述资源属性信息所对应的资源名称信息(即作者信息所对应的作品名)作为所述目标对象信息。
[0070]优选地,所述对象确定装置3可以根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的第二初选目标对象信息;根据所述第二初选目标对象信息,结合所述资源信息库,确定与所述第二初选目标对象信息相对应的一个或多个候选目标属性信息;根据所述候选目标属性信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0071]具体地,所述对象确定装置3根据所述匹配装置I所获取的一个或多个候选目标对象信息,并结合与所述候选目标对象信息所对应的检索应用信息,例如通过对所述多个候选目标信息所对应的检索应用信息中的多个维度信息进行排序等方式,对所述多个候选目标对象信息进行筛选,从而确定所述用户在所述资源信息库中所对应的第二初选目标对象息。
[0072]所述对象确定装置3根据所述第二初选目标对象信息,结合所述资源信息库,通过将所述第二初选目标对象信息在所述资源信息库中进行查询,将所述资源信息库中与所述第二初选目标对象信息所对应的属性信息等,确定为与所述第二初选目标对象信息相对应的一个或多个候选目标属性信息。
[0073]所述对象确定装置3根据所述候选目标属性信息,将所述一个或多个候选目标属性信息作为所述用户在所述资源信息库中所对应的目标对象信息,从而根据所述资源信息库中的结构化数据及其描述字段等信息,将更细粒度的内容作为目标对象信息。
[0074]其中,所述候选目标属性信息包括作者、国别、出品时间、登场人物、章节目录、内容摘要关键字等中的一项或多项。
[0075]例如,用户的第二初选目标对象信息为“名侦探柯南”和“九龙珠”,所述对象确定装置3结合所述资源信息库,确定与“名侦探柯南”和“九龙珠”相对应的候选目标属性信息为“作者青山刚昌”,则将“作者青山刚昌”作为所述用户在所述资源信息库中所对应的目标对象信息。
[0076]优选地,所述对象确定装置3可以根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的第三初选目标对象信息;根据所述第三初选目标对象信息,结合所述用户的检索日志信息,确定与所述第三初选目标对象信息所对应的关联检索词,其中,所述关联检索词与所述第三初选目标对象信息所对应检索词的共现频次满足共现阈值条件;根据所述关联检索词,结合所述资源信息库,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0077]具体地,所述对象确定装置3根据所述匹配装置I所获取的一个或多个候选目标对象信息,并结合与所述候选目标对象信息所对应的检索应用信息,例如通过对所述多个候选目标信息所对应的检索应用信息中的多个维度信息进行排序等方式,对所述多个候选目标对象信息进行筛选,从而确定所述用户在所述资源信息库中所对应的第三初选目标对象息。
[0078]所述对象确定装置3根据所述第三初选目标对象信息,结合所述用户的检索日志信息,获取所述用户在与所述第三初选目标对象信息所对应的检索词相关联的一个或多个关联检索词;其中,所述关联指的是所述关联检索词与所述第三初选目标对象信息所对应检索词的共现频次满足共现阈值条件。[0079]在此,所述共现阈值条件如共现次数、共现时间、共现顺序等。例如,所述第三初选目标对象信息所对应的检索词为A,而用户在搜索时,总是将A与B同时搜索,则当所述A和B的共现次数大于预定的阈值条件时,则将B作为关联检索词;例如,所述第三初选目标对象信息所对应的检索词为A,而用户在搜索时,检索词C与检索词A的共现时间小于一定的阈值,则将与所述检索词C作为所述关联检索词;例如,所述第三初选目标对象信息所对应的检索词为A,而用户在搜索时,搜索的顺序为:检索词D、检索词A、检索词E,由于所述检索词D、E与检索词A的顺序满足共现顺序的要求,则将与所述检索词D、E作为所述关联检索
ο
[0080]当所述对象确定装置3确定所述关联检索词时,结合所述资源信息库,若所述关联检索词能够命中所述资源信息库中的相关信息,则将所述关联检索词所对应的资源信息作为所述用户在所述资源信息库中所对应的目标对象信息。
[0081]从而,本发明考虑到用户的前后搜索行为往往具有一定的联系,基于用户在某个很短的特定时间段内往往会多次搜索感兴趣的某类事物以获得更加详细的需求满足的规律,若用户的某一次搜索行为被识别为兴趣点(即目标对象信息),则假设其关联搜索(如前后搜索)也是同类型的兴趣,若关联检索词也恰好命中所述资源信息库中的名称或别名,则不管关联检索词与资 源信息库的匹配情况是否达到确定其为目标对象信息的条件,都将所述关联搜索词作为用户的目标对象信息,从而提高兴趣点挖掘的召回率,更加全面描述用户兴趣,防止无法达到匹配条件的兴趣点被过滤。
[0082]优选地,所述对象确定装置3可以根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的第四初选目标对象信息;根据所述第四初选目标对象信息,结合与所述第四初选目标对象信息相对应的时间信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0083]具体地,所述对象确定装置3根据所述匹配装置I所获取的一个或多个候选目标对象信息,并结合与所述候选目标对象信息所对应的检索应用信息,例如通过对所述多个候选目标信息所对应的检索应用信息中的多个维度信息进行排序等方式,对所述多个候选目标对象信息进行筛选,从而确定所述用户在所述资源信息库中所对应的第四初选目标对象息。
[0084]所述对象确定装置3根据所述第四初选目标对象信息,通过结合与所述第四初选目标对象信息相对应的时间信息,例如,根据所述时间信息距离当前时间的远近,将所述时间信息转换成为时间衰减系数,距离当前时间越远的第四初选目标对象信息的时间衰减系数越高,从而对所述第四初选目标信息进行筛选或更新,根据筛选或更新结果确定所述用户在所述资源信息库中所对应的目标对象信息。例如,对于长时间不再搜索的第四初选目标对象信息,则不再将其作为所述目标对象信息等。
[0085]或者,所述对象确定装置3根据所述第四初选目标对象信息,通过结合与所述第四初选目标对象信息相对应的时间信息,例如对所述小于一定时间阈值范围内的多个第四初选目标对象信息信息进行频次统计或聚类,从而将频次统计较高的、或是聚类结果较大的第四初选目标对象信息作为所述用户的目标对象信息等。
[0086]优选地,所述处理设备还包括序列获取装置(未示出)和序列优选装置(未示出);其中,所述序列获取装置获取所述用户的查询序列信息;所述序列优选装置根据所述用户在所述资源信息库中所对应的目标对象信息,确定与所述查询序列信息相对应的优选查询序列信息,其中,所述优选查询序列信息基于所述查询序列信息及其中检索词所对应的目标对象信息。
[0087]具体地,所述序列获取装置根据各种通信协议(Communications Protocol),通过各类数据传输接口,与存储或提供所述查询序列信息的一个或多个数据库或其他第三方设备相交互,以获取所述数据库或所述第三方设备中所存储或提供的所述用户的查询序列信息;或者所述序列获取装置还可以根据各种通信协议(Communications Protocol),通过各类数据传输接口,与所述用户直接交互,获取所述用户通过输入、选择、触摸等方式所提交的所述用户的查询序列信息。
[0088]其中,所述查询序列信息中可以包括一个或多个检索词信息。
[0089]所述序列优选装置根据所述用户在所述资源信息库中所对应的目标对象信息,根据所述目标对象信息所对应的检索词,以及基于所述查询序列信息及其中检索词,对所述查询序列中的检索词进行优选,从而确定与所述查询序列信息相对应的优选查询序列信
肩、O
[0090]例如,对于所述用户,已经建立起检索词a与目标对象信息A之间的关联关系,当所述用户再次输入包含检索词a的查询序列时,如查询序列abc,则所述序列优选装置将所述查询序列变更为Abc,作为与所述查询序列信息abc相对应的优选查询序列信息。进一步地,还可以为所述用户提供与Abc相关联的搜索结果或推荐结果。
[0091]优选地,所述处理设备还包括模型确定装置(未示出),其中,所述模型确定装置根据所述目标对象信息,确定与所述用户相对应的用户特征模型。
[0092]具体地,所述模型确定装置可以与所述对象确定装置3相交互,以获取所述对象确定装置3所确定的一个或多个目标对象信息;根据所述一个或多个目标对象信息,通过基于所述目标对象信息的类别、属性、与其他目标对象信息的相关性等方面,确定与所述用户相对应的用户特征模型,从而基于所述用户特征模型,实现为用户提供相对应的推荐信息等。
[0093]在此,利用所述用户特征模型进行推荐的推荐方式主要包括以下至少任一项:
[0094]-推荐其他目标对象信息,即为用户个性化推荐其感兴趣的其他目标对象信息(即资源实体,如电影、商品、地点等),通过将用户的目标对象信息与其他资源实体的特征进行匹配来进行获取,若匹配结果超过一定阈值,则将所述资源实体推荐给用户,作为用户的新的目标对象信息;
[0095]-推荐相似的关联目标对象信息,即通过大量用户的协同效应发掘目标对象信息之间的相关性,认为相似的用户群体所关注的目标对象信息之间具有一定的相似性。例如:用户正在浏览的某个电影页面,可以推荐一些与该电影相似的关联电影;用户正在访问的某个商品页面,可以推荐一些与该商品类似的关联商品。
[0096]更优选地,所述处理设备还包括提供装置(未示出),其中,所述提供装置根据所述用户特征模型,将与所述用户特征模型相对应的资源信息提供至所述用户。
[0097]具体地,所述提供装置根据所述模型确定装置所确定的所述用户特征模型,将根据所述用户特征模型所推荐的目标对象信息所对应的资源信息,根据各种通信协议(Communications Protocol),通过各类数据传输接口,利用直接提供的方式或者经过其他第三方设备中转等方式,将所述资源信息提供至所述用户。
[0098]图2示出根据本发明一个优选实施例的一种用于确定用户在资源信息库中所对应的目标对象信息的处理设备示意图;其中,所述处理设备包括匹配装置I’、维度确定装置2’、对象确定装置3’,所述维度确定装置2’包括访问确定单元21’和元素映射单元22’。具体地,匹配装置I’根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选目标对象信息;访问确定单元21’根据所述用户在所述检索词下所对应的检索日志信息,确定与所述候选目标对象信息相关联的一个或多个访问对象信息;维度确定单元22’根据所述访问对象信息,确定所述候选目标对象信息所对应的检索应用信息,其中,所述检索应用信息包括所述候选目标对象信息在所述检索日志信息中的一个或多个应用维度信息;对象确定装置3’根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0099]其中,所述处理设备的匹配装置I’、对象确定装置3’与图1所示对应装置相同或基本相同,故此处不再赘述,并通过弓I用的方式包含于此。
[0100]上述各装置之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各装置分别实时地,或者按照设定的或实时调整的工作模式要求,进行候选目标对象信息的获取、访问对象信息的确定、检索应用信息的确定、目标对象信息的确定等,直至所述处理设备停止获取与所述检索词相对应的一个或多个候选目标对象信息。
[0101]访问确定单元21’根据所述用户在所述检索词下所对应的检索日志信息,确定与所述候选目标对象信息相关联的一个或多个访问对象信息。
[0102]具体地,所述访问确定单元21’根据各种通信协议(Communications Protocol),通过各类数据传输接口,与存储或提供所述用户的检索日志信息的一个或多个数据库或其他第三方设备相交互,以获取所述数据库或所述第三方设备中所存储或提供的用户的检索日志信息,进而获取所述用户在所述检索词下所对应的检索日志信息;或者所述访问确定单元21’还可以根据各种通信协议(Communications Protocol),通过各类数据传输接口,与所述用户直接交互,获取所述用户通过输入、选择、触摸等方式所提交的检索信息,进而获得所述用户在所述检索词下所对应的检索日志信息。
[0103]其中,所述检索日志信息包括所述用户的id信息、cookie信息、检索词、检索时间、所述用户通过点击、触摸等方式所选择的一条或多条检索结果信息中的一种或多种;在此,所述检索结果信息中包含检索结果所对应的URL信息以及所述URL所对应的页面标题信息、页面内容信息等。所述用户在所述检索词下所对应的检索日志信息,则为指向所述检索词的检索时间、以及所述用户通过点击、触摸等方式所选择的在所述检索词下的一条或多条检索结果信息。
[0104]所述访问确定单元21’根据所述用户在所述检索词下所对应的检索日志信息,通过基于所述用户的点击、输入等选择操作,将所述用户所选中的一个或多个链接信息(URL信息)作为与所述候选目标对象信息相关联的一个或多个访问对象信息。
[0105]维度确定单元22’根据所述访问对象信息,确定所述候选目标对象信息所对应的检索应用信息,其中,所述检索应用信息包括所述候选目标对象信息在所述检索日志信息中的一个或多个应用维度信息。
[0106]所述维度确定单元22’根据所述访问对象信息,结合所述检索日志信息,确定所述访问对象信息所对应的一个或多个应用维度信息,并将所述应用维度信息作为所述候选目标对象信息所对应的检索应用信息。
[0107]其中,所述应用维度信息包括但不限于以下至少任一项:
[0108]-资源基本维度信息:即所述用户通过点击、触摸等方式所选择的一条或多条访问对象信息与所述候选目标对象相对应的数目,例如,继上例,用户的检索词为“海贼王”,并且所述“海贼王”为候选目标对象信息,然后用户在与“海贼王”相对应的搜索结果中,点击了 N条与“海贼王”相对应的URL,则将N或者根据预定计算方式对N处理后的数据(如将N条URL分别乘以所述URL所对应的站点的权重值),作为与该用户的检索词“海贼王”相对应的资源基本维度信息;
[0109]-资源标题维度信息:即所述用户通过点击、触摸等方式所选择的一条或多条访问对象信息中,所述访问对象信息所对应的页面的标题中包含所述候选目标对象信息的数目,例如,继上例,用户点击了 N条与“海贼王”相对应的URL,所述N条URL所对应的页面的标题中,有M个都包含了候选目标对象信息“海贼王”,则将M或者根据预定计算方式对M处理后的数据(如将M个标题分别乘以所述URL所对应的站点的权重值,其中,若所述标题中含有特殊加强符号,则所述标题所对应的权重值高),作为与该用户的检索词“海贼王”相对应的资源标题维度信息;
[0110]-资源文本维度信息:即所述用户通过点击、触摸等方式所选择的一条或多条访问对象信息中,所述访问对象信息所对应的页面的内容中包含所述候选目标对象信息的数目、或与所述候选目标对象信息相关联的其他信息的数目,例如,继上例,用户点击了 N条与“海贼王”相对应的URL,所述N条URL所对应的页面的内容中,包含了 K个候选目标对象信息“海贼王”,则将K或者根据预定计算方式对K处理后的数据(如将K个内容分别乘以所述URL所对应的站点的权重值),作为与该用户的检索词“海贼王”相对应的资源文本维度信息。
[0111]优选地,所述访问确定单元21’可以根据所述用户在所述检索词下所对应的检索日志信息,结合所述资源信息库,确定与所述候选目标对象信息相关联的一个或多个访问对象信息。
[0112]具体地,所述访问确定单元21’可以根据所述用户在所述检索词下所对应的检索日志信息,确定所述用户通过点击、输入等选择操作所选中的一个或多个链接信息(URL信息),然后将所述链接信息与所述资源信息库中所包含的链接信息进行匹配,若所述链接信息与所述资源信息库中所包含的链接信息成功匹配,则将所述链接信息作为与所述候选目标对象信息相关联的访问对象信息;反之,则所述链接信息不属于与所述候选目标对象信息相关联的访问对象信息。从而提高了所述访问对象信息的准确性。
[0113]图3示出根据本发明另一个方面的一种用于确定用户在资源信息库中所对应的目标对象信息的方法流程图。具体地,在步骤Si中,所述处理设备根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选目标对象信息;在步骤s2中,所述处理设备根据所述用户在所述检索词下所对应的检索日志信息,确定所述候选目标对象信息所对应的检索应用信息,其中,所述检索应用信息包括所述候选目标对象信息在所述检索日志信息中的一个或多个应用维度信息;在步骤s3中,所述处理设备根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0114]上述各步骤之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各步骤分别实时地,或者按照设定的或实时调整的工作模式要求,进行候选目标对象信息的获取、检索应用信息的确定、目标对象信息的确定等,直至所述处理设备停止获取与所述检索词相对应的一个或多个候选目标对象信息。
[0115]在步骤Si中,所述处理设备根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选目标对象信息。
[0116]具体地,在步骤si中,所述处理设备根据各种通信协议(CommunicationsProtocol),通过各类数据传输接口,与存储或提供所述检索词或查询序列信息的一个或多个数据库或其他第三方设备相交互,以获取所述数据库或所述第三方设备中所存储或提供的用户的检索词;或者在步骤Si中,所述处理设备还可以根据各种通信协议(Communications Protocol),通过各类数据传输接口,与所述用户直接交互,获取所述用户通过输入、选择、触摸等方式所提交的检索词或查询序列信息。
[0117]在此,在步骤Si中,所述处理设备可以将所述数据库或第三方设备所存储的用户的查询序列(query)信息直接作为检索词,也可以对所述数据库或第三方设备所存储的用户的查询序列(query)信息进行分词后,获得一个或多个检索词;同理,在步骤si中,所述处理设备可以将所述用户所输入的查询序列(query)信息直接作为检索词,也可以对所述用户所输入的查询序列(query)信息进行分词后,获得一个或多个检索词。在此,是否需要分词可根据所述查询序列信息的长度、语义等进行确定。
[0118]例如,当用户输入查询序列信息“让子弹飞”时,则将“让子弹飞”直接作为检索词;当用户输入查询序列信息“郭敬明小时代”时,则将“郭敬明”和“小时代”分别作为两个检索词。
[0119]当步骤Si中,所述处理设备获取所述用户的检索词时,将所述检索词在预定的资源信息库中进行匹配查询,若所述检索词命中所述资源信息库中的资源信息,则将所述资源信息作为与所述检索词相对应的一个或多个候选目标对象信息。
[0120]其中,所述资源信息库可以是系统默认的、或是用户指定的、或是根据应用需求所设置的资源信息库;例如,如需要统计用户对特定分类的资源的目标对象信息,则将与该特定分类的资源所对应的资源信息库作为用来匹配检索词的预定的资源信息库;例如,如用户希望获取某一方向的资源,则可以指定特定的资源信息库,从而获取系统所确定的该方向的目标对象信息。在此,所述资源信息库包括但不限于多媒体作品信息库(如电影作品信息库、音乐作品信息库、动漫作品信息库、小说作品信息库、其他书籍信息库等,或者前述两个或多个的混合多媒体作品信息库)、地点信息库、商品信息库;从而通过所述资源信息库,可以对用户与兴趣实体相关的兴趣点进行挖掘,如对多媒体作品的目标对象信息(如希望观看的多媒体作品的兴趣点)、如对地点相关的目标对象信息(如感兴趣的餐厅、喜欢的旅游景点等)、如对商品相关的目标对象信息(如感兴趣的商品等)。
[0121]以所述资源信息库为多媒体作品信息库为例,所述资源信息库中包括但不限于以下至少任一项:
[0122]-所述分类资源所对应的资源名称信息,其中,所述资源名称信息中包括一个或多个别名信息,例如,所述分类资源为“海贼王”时,则存储“海贼王” “one piece” “航海王”等多个资源名称信息;
[0123]-所述分类资源所对应的资源属性信息,例如,所述分类资源为“海贼王”时,则存储“海贼王”所对应的作者、国别、出品时间、登场人物、章节目录、内容简介;
[0124]-所述分类资源所对应的url信息,例如,所述分类资源为“海贼王”时,则将与“海贼王”相关联的垂直站点的网址的url列表作为与“海贼王”所对应的url信息,所述url列表中的每个url都对应于“海贼王”这个作品,例如是该作品的介绍、fansite、资源信息站等。
[0125]例如,当在步骤si中,所述处理设备获取所述用户的检索词“one piece”时,将所述检索词在预定的资源信息库中进行匹配查询,所述检索词“one piece”命中该资源信息库中的资源信息“海贼王”,则将所述资源信息“海贼王”作为与所述检索词相对应的候选目标对象信息。
[0126]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选目标对象信息的方式、或者任何资源信息库的类型或其包含的内容信息,均应包含在本发明的范围内。
[0127]优选地,在步骤Si中,所述处理设备可以根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选资源信息;根据所述候选资源信息,确定与所述检索词相对应的一个或多个候选目标对象信息。
[0128]具体地,当在步骤Si中,所述处理设备获取所述用户的检索词时,将所述检索词在预定的资源信息库中进行匹配查询,若所述检索词命中所述资源信息库中的资源属性信息或其他相关信息,则将所述资源属性信息或其他相关信息作为与所述检索词相对应的一个或多个候选资源信息;根据所述候选资源信息,将与所述资源属性信息相对应的资源信息(如资源名称信息),确定为与所述检索词相对应的一个或多个候选目标对象信息。
[0129]例如,当在步骤Si中,所述处理设备获取所述用户的检索词“尾田荣一郎”时,将所述检索词在预定的资源信息库中进行匹配查询,所述检索词命中所述资源信息库中的资源属性信息“作者信息”,则将所述“作者信息:尾田荣一郎”作为与所述检索词相对应的一个或多个候选资源信息;根据所述候选资源信息,将与所述“作者信息”相对应的资源信息,即“海贼王”,确定为与所述检索词相对应的一个或多个候选目标对象信息。
[0130]从而通过这些更细粒度的资源属性信息,判断用户实际希望得到的候选目标对象信息;还可以通过这些更细粒度的资源属性信息,实现跨资源库的推荐(如根据演员八,将其主演的电影、电视剧、参加的综艺节目、相关娱乐资讯等均作为候选目标对象信息),以实现更加精准丰富的推荐服务。
[0131]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选资源信息,并根据所述候选资源信息,确定与所述检索词相对应的一个或多个候选目标对象信息方式,均应包含在本发明的范围内。
[0132]在步骤s2中,所述处理设备根据所述用户在所述检索词下所对应的检索日志信息,确定所述候选目标对象信息所对应的检索应用信息,其中,所述检索应用信息包括所述候选目标对象信息在所述检索日志信息中的一个或多个应用维度信息。[0133]具体地,在步骤s2中,所述处理设备根据各种通信协议(CommunicationsProtocol),通过各类数据传输接口,与存储或提供所述用户的检索日志信息的一个或多个数据库或其他第三方设备相交互,以获取所述数据库或所述第三方设备中所存储或提供的用户的检索日志信息,进而获取所述用户在所述检索词下所对应的检索日志信息;或者在步骤s2中,所述处理设备还可以根据各种通信协议(Communications Protocol),通过各类数据传输接口,与所述用户直接交互,获取所述用户通过输入、选择、触摸等方式所提交的检索信息,进而获得所述用户在所述检索词下所对应的检索日志信息。
[0134]其中,所述检索日志信息包括所述用户的id信息、cookie信息、检索词、检索时间、所述用户通过点击、触摸等方式所选择的一条或多条检索结果信息中的一种或多种;在此,所述检索结果信息中包含检索结果所对应的URL信息以及所述URL所对应的页面标题信息、页面内容信息等。所述用户在所述检索词下所对应的检索日志信息,则为指向所述检索词的检索时间、以及所述用户通过点击、触摸等方式所选择的在所述检索词下的一条或多条检索结果信息。
[0135]在步骤s2中,所述处理设备通过获取所述用户在所述检索词下所对应的检索日志信息,对所述检索日志信息中的内容进行统计整合,从而获取所述候选目标对象信息在所述检索日志信息中的一个或多个应用维度信息;根据所述一个或多个应用维度信息,将所述一个或多个应用维度信息所对应的信息确定为所述候选目标对象信息所对应的检索应用信息。
[0136]其中,所述应用维度信息包括但不限于以下至少任一项:
[0137]-资源基本维度信息:即所述用户通过点击、触摸等方式所选择的一条或多条检索结果信息与所述候选目标对象相对应的数目,例如,继上例,用户的检索词为“海贼王”,并且所述“海贼王”为候选目标对象信息,然后用户在与“海贼王”相对应的搜索结果中,点击了 N条与“海贼王”相对应的URL,则将N或者根据预定计算方式对N处理后的数据(如将N条URL分别乘以所述URL所对应的站点的权重值),作为与该用户的检索词“海贼王”相对应的资源基本维度信息;
[0138]-资源标题维度信息:即所述用户通过点击、触摸等方式所选择的一条或多条检索结果信息中,所述检索结果信息所对应的页面的标题中包含所述候选目标对象信息的数目,例如,继上例,用户点击了 N条与“海贼王”相对应的URL,所述N条URL所对应的页面的标题中,有M个都包含了候选目标对象信息“海贼王”,则将M或者根据预定计算方式对M处理后的数据(如将M个标题分别乘以所述URL所对应的站点的权重值,其中,若所述标题中含有特殊加强符号,则所述标题所对应的权重值高),作为与该用户的检索词“海贼王”相对应的资源标题维度信息;
[0139]-资源文本维度信息:即所述用户通过点击、触摸等方式所选择的一条或多条检索结果信息中,所述检索结果信息所对应的页面的内容中包含所述候选目标对象信息的数目、或与所述候选目标对象信息相关联的其他信息的数目,例如,继上例,用户点击了 N条与“海贼王”相对应的URL,所述N条URL所对应的页面的内容中,包含了 K个候选目标对象信息“海贼王”,则将K或者根据预定计算方式对K处理后的数据(如将K个内容分别乘以所述URL所对应的站点的权重值),作为与该用户的检索词“海贼王”相对应的资源文本维度信息。[0140]从而,在步骤s2中,所述处理设备将所述一个或多个应用维度信息,如资源基本维度信息、资源标题维度信息、资源文本维度信息中的一个或多个,作为所述候选目标对象信息所对应的检索应用信息。
[0141]在步骤s3中,所述处理设备根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0142]具体地,在步骤S3中,所述处理设备根据所述步骤Si中所获取的一个或多个候选目标对象信息,并结合与所述候选目标对象信息所对应的检索应用信息,例如通过对所述多个候选目标信息所对应的检索应用信息中的多个维度信息进行排序、加权排序等方式,对所述多个候选目标对象信息进行筛选或基于一定的阈值进行过滤,从而将排序靠前的、或是大于所述过滤阈值的候选目标信息,确定为所述用户在所述资源信息库中所对应的目标对象信息,从而实现了在特定资源范围内的对所述目标对象信息的获取,能提高用户对特定资源的兴趣点挖掘准确性,提高兴趣点识别的准确性和召回率,通过结合所述检索应用信息,避免同义词等兴趣提取不准确的情况,为用户提供更加精准的个性化推荐。
[0143]在此,所述检索应用信息除了可以用来进行排序或加权排序外,以进行筛选所述候选目标对象信息外,还可以协助判断所述用户的候选目标对象信息的类别。例如,当用户输入检索词“苹果”,所述“苹果”可以是手机、电影、水果等类别,若希望提取用户对电影的兴趣,则所述资源信息库为电影作品信息库,若用户的检索应用信息(如所点击的URL信息)命中了所述电影作品信息库,则所述用户的检索词所对应的目标对象信息是电影类型的“苹果”。
[0144]进一步地,在步骤S3中,所述处理设备可以根据所述步骤Si中所获取的一个或多个候选目标对象信息,并结合与所述候选目标对象信息所对应的检索应用信息,例如通过对所述多个候选目标信息所对应的检索应用信息中的多个维度信息进行排序等方式,对所述多个候选目标对象信息进行筛选,从而确定所述用户在所述资源信息库中所对应的一个或多个初选目标对象信息;然后根据所述一个或多个初选目标对象信息,结合所述初选目标对象信息的对象相关信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0145]其中,所述对象相关信息包括但不限于以下至少任一项:
[0146]-所述初选目标对象信息所对应的资源名称信息,如所述初选目标对象信息为资源作者信息或资源属性信息,则将所述初选目标对象信息所对应的资源名称信息确定为所述目标对象信息;
[0147]-所述初选目标对象信息所对应的对象属性信息,如所述初选目标对象信息在所述资源信息库中对应一个或多个对象属性信息(如作者、国别、出品时间、登场人物、章节目录、内容摘要关键字等),则将所述对象属性信息作为所述目标对象信息;
[0148]-所述初选目标对象信息所对应的检索相关信息,如根据所述检索相关信息,可以确定与所述初选目标对象所对应的检索词相对应的关联检索词,且所述关联检索词信息命中所述资源信息库中的资源信息,则将所述关联检索词所对应的资源信息直接作为所述目标对象信息;
[0149]-所述初选目标对象信息所对应的时间相关信息,如根据所述初选目标对象信息的搜索时间与当前时间的时间差,距离当前时间越久,则所述初选目标对象信息的时间衰减系数越高,例如,若距离当前时间超过预定阈值,则不再将所述初选目标对象信息作为所述目标对象信息,反之,若距离当前时间小于预定阈值,则将所述初选目标对象信息作为所述目标对象信息;或者,例如对所述小于一定时间阈值范围内的多个初选目标对象信息进行频次统计或聚类,从而将频次统计较高的、或是聚类结果较大的初选目标对象信息作为所述目标对象信息。
[0150]优选地,在步骤S3中,所述处理设备可以根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的一个或多个第一初选目标对象信息;根据所述一个或多个第一初选目标对象信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0151 ] 具体地,在步骤S3中,所述处理设备根据所述步骤Si所获取的一个或多个候选目标对象信息,并结合与所述候选目标对象信息所对应的检索应用信息,例如通过对所述多个候选目标信息所对应的检索应用信息中的多个维度信息进行排序等方式,对所述多个候选目标对象信息进行筛选,从而确定所述用户在所述资源信息库中所对应的一个或多个第一初选目标对象信息。
[0152]在步骤s3中,所述处理设备根据所述一个或多个第一初选目标对象信息,通过对所述多个第一初选目标对象信息进行聚类整合等方式,确定所述用户在所述资源信息库中所对应的目标对象信息,例如,所述多个第一初选目标对象信息都指向同一个作品或指向相似的作品,则将所指向的作品作为所述目标对象信息;或者,所述第一初选目标对象信息为所述资源信息所对应的资源属性信息,如为作者信息,则将所述资源属性信息所对应的资源名称信息(即作者信息所对应的作品名)作为所述目标对象信息。
[0153]优选地,在步骤S3中,所述处理设备可以根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的第二初选目标对象信息;根据所述第二初选目标对象信息,结合所述资源信息库,确定与所述第二初选目标对象信息相对应的一个或多个候选目标属性信息;根据所述候选目标属性信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0154]具体地,在步骤S3中,所述处理设备根据所述步骤Si所获取的一个或多个候选目标对象信息,并结合与所述候选目标对象信息所对应的检索应用信息,例如通过对所述多个候选目标信息所对应的检索应用信息中的多个维度信息进行排序等方式,对所述多个候选目标对象信息进行筛选,从而确定所述用户在所述资源信息库中所对应的第二初选目标对象信息。
[0155]在步骤S3中,所述处理设备根据所述第二初选目标对象信息,结合所述资源信息库,通过将所述第二初选目标对象信息在所述资源信息库中进行查询,将所述资源信息库中与所述第二初选目标对象信息所对应的属性信息等,确定为与所述第二初选目标对象信息相对应的一个或多个候选目标属性信息。
[0156]在步骤s3中,所述处理设备根据所述候选目标属性信息,将所述一个或多个候选目标属性信息作为所述用户在所述资源信息库中所对应的目标对象信息,从而根据所述资源信息库中的结构化数据及其描述字段等信息,将更细粒度的内容作为目标对象信息。
[0157]其中,所述候选目标属性信息包括作者、国别、出品时间、登场人物、章节目录、内容摘要关键字等中的一项或多项。
[0158]例如,用户的第二初选目标对象信息为“名侦探柯南”和“九龙珠”,在步骤S3中,所述处理设备结合所述资源信息库,确定与“名侦探柯南”和“九龙珠”相对应的候选目标属性信息为“作者青山刚昌”,则将“作者青山刚昌”作为所述用户在所述资源信息库中所对应的目标对象信息。
[0159]优选地,在步骤S3中,所述处理设备可以根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的第三初选目标对象信息;根据所述第三初选目标对象信息,结合所述用户的检索日志信息,确定与所述第三初选目标对象信息所对应的关联检索词,其中,所述关联检索词与所述第三初选目标对象信息所对应检索词的共现频次满足共现阈值条件;根据所述关联检索词,结合所述资源信息库,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0160]具体地,在步骤S3中,所述处理设备根据所述步骤Si所获取的一个或多个候选目标对象信息,并结合与所述候选目标对象信息所对应的检索应用信息,例如通过对所述多个候选目标信息所对应的检索应用信息中的多个维度信息进行排序等方式,对所述多个候选目标对象信息进行筛选,从而确定所述用户在所述资源信息库中所对应的第三初选目标对象信息。
[0161]在步骤s3中,所述处理设备根据所述第三初选目标对象信息,结合所述用户的检索日志信息,获取所述用户在与所述第三初选目标对象信息所对应的检索词相关联的一个或多个关联检索词;其中,所述关联指的是所述关联检索词与所述第三初选目标对象信息所对应检索词的共现频次满足共现阈值条件。
[0162]在此,所述共现阈值条件如共现次数、共现时间、共现顺序等。例如,所述第三初选目标对象信息所对应的检索词为A,而用户在搜索时,总是将A与B同时搜索,则当所述A和B的共现次数大于预定的阈值条件时,则将B作为关联检索词;例如,所述第三初选目标对象信息所对应的检索词为A,而用户在搜索时,检索词C与检索词A的共现时间小于一定的阈值,则将与所述检索词C作为所述关联检索词;例如,所述第三初选目标对象信息所对应的检索词为A,而用户在搜索时,搜索的顺序为:检索词D、检索词A、检索词E,由于所述检索词D、E与检索词A的顺序满足共现顺序的要求,则将与所述检索词D、E作为所述关联检索
ο
[0163]当在步骤S3中,所述处理设备确定所述关联检索词时,结合所述资源信息库,若所述关联检索词能够命中所述资源信息库中的相关信息,则将所述关联检索词所对应的资源信息作为所述用户在所述资源信息库中所对应的目标对象信息。
[0164]从而,本发明考虑到用户的前后搜索行为往往具有一定的联系,基于用户在某个很短的特定时间段内往往会多次搜索感兴趣的某类事物以获得更加详细的需求满足的规律,若用户的某一次搜索行为被识别为兴趣点(即目标对象信息),则假设其关联搜索(如前后搜索)也是同类型的兴趣,若关联检索词也恰好命中所述资源信息库中的名称或别名,则不管关联检索词与资源信息库的匹配情况是否达到确定其为目标对象信息的条件,都将所述关联搜索词作为用户的目标对象信息,从而提高兴趣点挖掘的召回率,更加全面描述用户兴趣,防止无法达到匹配条件的兴趣点被过滤。
[0165]优选地,在步骤S3中,所述处理设备可以根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的第四初选目标对象信息;根据所述第四初选目标对象信息,结合与所述第四初选目标对象信息相对应的时间信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0166]具体地,在步骤S3中,所述处理设备根据所述步骤Si所获取的一个或多个候选目标对象信息,并结合与所述候选目标对象信息所对应的检索应用信息,例如通过对所述多个候选目标信息所对应的检索应用信息中的多个维度信息进行排序等方式,对所述多个候选目标对象信息进行筛选,从而确定所述用户在所述资源信息库中所对应的第四初选目标对象信息。
[0167]在步骤s3中,所述处理设备根据所述第四初选目标对象信息,通过结合与所述第四初选目标对象信息相对应的时间信息,例如,根据所述时间信息距离当前时间的远近,将所述时间信息转换成为时间衰减系数,距离当前时间越远的第四初选目标对象信息的时间衰减系数越高,从而对所述第四初选目标信息进行筛选或更新,根据筛选或更新结果确定所述用户在所述资源信息库中所对应的目标对象信息。例如,对于长时间不再搜索的第四初选目标对象信息,则不再将其作为所述目标对象信息等。
[0168]或者,在步骤S3中,所述处理设备根据所述第四初选目标对象信息,通过结合与所述第四初选目标对象信息相对应的时间信息,例如对所述小于一定时间阈值范围内的多个第四初选目标对象信息信息进行频次统计或聚类,从而将频次统计较高的、或是聚类结果较大的第四初选目标对象信息作为所述用户的目标对象信息等。
[0169]优选地,该方法还包括步骤s4 (未示出)和步骤s5 (未示出);其中,在步骤s4中,所述处理设备获取所述用户的查询序列信息;在步骤s5中,所述处理设备根据所述用户在所述资源信息库中所对应的目标对象信息,确定与所述查询序列信息相对应的优选查询序列信息,其中,所述优选查询序列信息基于所述查询序列信息及其中检索词所对应的目标对象信息。
[0170]具体地,在步骤s4中,所述处理设备根据各种通信协议(CommunicationsProtocol),通过各类数据传输接口,与存储或提供所述查询序列信息的一个或多个数据库或其他第三方设备相交互,以获取所述数据库或所述第三方设备中所存储或提供的所述用户的查询序列信息;或者在步骤s4中,所述处理设备还可以根据各种通信协议(Communications Protocol),通过各类数据传输接口,与所述用户直接交互,获取所述用户通过输入、选择、触摸等方式所提交的所述用户的查询序列信息。
[0171]其中,所述查询序列信息中可以包括一个或多个检索词信息。
[0172]在步骤s5中,所述处理设备根据所述用户在所述资源信息库中所对应的目标对象信息,根据所述目标对象信息所对应的检索词,以及基于所述查询序列信息及其中检索词,对所述查询序列中的检索词进行优选,从而确定与所述查询序列信息相对应的优选查询序列信息。
[0173]例如,对于所述用户,已经建立起检索词a与目标对象信息A之间的关联关系,当所述用户再次输入包含检索词a的查询序列时,如查询序列abc,则在步骤s5中,所述处理设备将所述查询序列变更为Abc,作为与所述查询序列信息abc相对应的优选查询序列信息。进一步地,还可以为所述用户提供与Abc相关联的搜索结果或推荐结果。
[0174]优选地,该方法还包括步骤s6 (未示出),其中,在步骤s6中,所述处理设备根据所述目标对象信息,确定与所述用户相对应的用户特征模型。
[0175]具体地,在步骤s6中,所述处理设备可以与所述步骤S3相交互,以获取所述步骤s3所确定的一个或多个目标对象信息;根据所述一个或多个目标对象信息,通过基于所述目标对象信息的类别、属性、与其他目标对象信息的相关性等方面,确定与所述用户相对应的用户特征模型,从而基于所述用户特征模型,实现为用户提供相对应的推荐信息等。
[0176]在此,利用所述用户特征模型进行推荐的推荐方式主要包括以下至少任一项:
[0177]-推荐其他目标对象信息,即为用户个性化推荐其感兴趣的其他目标对象信息(SP资源实体,如电影、商品、地点等),通过将用户的目标对象信息与其他资源实体的特征进行匹配来进行获取,若匹配结果超过一定阈值,则将所述资源实体推荐给用户,作为用户的新的目标对象信息;
[0178]-推荐相似的关联目标对象信息,即通过大量用户的协同效应发掘目标对象信息之间的相关性,认为相似的用户群体所关注的目标对象信息之间具有一定的相似性。例如:用户正在浏览的某个电影页面,可以推荐一些与该电影相似的关联电影;用户正在访问的某个商品页面,可以推荐一些与该商品类似的关联商品。
[0179]更优选地,该方法还包括步骤s7 (未示出),其中,在步骤s7中,所述处理设备根据所述用户特征模型,将与所述用户特征模型相对应的资源信息提供至所述用户。
[0180]具体地,在步骤s7中,所述处理设备根据所述步骤s6所确定的所述用户特征模型,将根据所述用户特征模型所推荐的目标对象信息所对应的资源信息,根据各种通信协议(Communications Protocol),通过各类数据传输接口,利用直接提供的方式或者经过其他第三方设备中转等方式,将所述资源信息提供至所述用户。
[0181]图4示出根据本发明一个优选实施例的一种用于确定用户在资源信息库中所对应的目标对象信息的方法流程图。具体地,在步骤Si’中,所述处理设备根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选目标对象信息;在步骤s21’中,所述处理设备根据所述用户在所述检索词下所对应的检索日志信息,确定与所述候选目标对象信息相关联的一个或多个访问对象信息;在步骤s22’中,所述处理设备根据所述访问对象信息,确定所述候选目标对象信息所对应的检索应用信息,其中,所述检索应用信息包括所述候选目标对象信息在所述检索日志信息中的一个或多个应用维度信息;在步骤S3’中,所述处理设备根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
[0182]其中,所述处理设备的步骤sI’、步骤S3’与图3所示对应步骤相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
[0183]上述各步骤之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各步骤分别实时地,或者按照设定的或实时调整的工作模式要求,进行候选目标对象信息的获取、访问对象信息的确定、检索应用信息的确定、目标对象信息的确定等,直至所述处理设备停止获取与所述检索词相对应的一个或多个候选目标对象信息。
[0184]在步骤S21’中,所述处理设备根据所述用户在所述检索词下所对应的检索日志信息,确定与所述候选目标对象信息相关联的一个或多个访问对象信息。
[0185]具体地,在步骤s21’中,所述处理设备根据各种通信协议(CommunicationsProtocol ),通过各类数据传输接口,与存储或提供所述用户的检索日志信息的一个或多个数据库或其他第三方设备相交互,以获取所述数据库或所述第三方设备中所存储或提供的用户的检索日志信息,进而获取所述用户在所述检索词下所对应的检索日志信息;或者在步骤s21 ’中,所述处理设备还可以根据各种通信协议(Communications Protocol),通过各类数据传输接口,与所述用户直接交互,获取所述用户通过输入、选择、触摸等方式所提交的检索信息,进而获得所述用户在所述检索词下所对应的检索日志信息。
[0186]其中,所述检索日志信息包括所述用户的id信息、cookie信息、检索词、检索时间、所述用户通过点击、触摸等方式所选择的一条或多条检索结果信息中的一种或多种;在此,所述检索结果信息中包含检索结果所对应的URL信息以及所述URL所对应的页面标题信息、页面内容信息等。所述用户在所述检索词下所对应的检索日志信息,则为指向所述检索词的检索时间、以及所述用户通过点击、触摸等方式所选择的在所述检索词下的一条或多条检索结果信息。
[0187]在步骤S21’中,所述处理设备根据所述用户在所述检索词下所对应的检索日志信息,通过基于所述用户的点击、输入等选择操作,将所述用户所选中的一个或多个链接信息(URL信息)作为与所述候选目标对象信息相关联的一个或多个访问对象信息。
[0188]在步骤s22’中,所述处理设备根据所述访问对象信息,确定所述候选目标对象信息所对应的检索应用信息,其中,所述检索应用信息包括所述候选目标对象信息在所述检索日志信息中的一个或多个应用维度信息。
[0189]在步骤s22’中,所述处理设备根据所述访问对象信息,结合所述检索日志信息,确定所述访问对象信息所对应的一个或多个应用维度信息,并将所述应用维度信息作为所述候选目标对象信息所对应的检索应用信息。
[0190]其中,所述应用维度信息包括但不限于以下至少任一项:
[0191]-资源基本维度信息:即所述用户通过点击、触摸等方式所选择的一条或多条访问对象信息与所述候选目标对象相对应的数目,例如,继上例,用户的检索词为“海贼王”,并且所述“海贼王”为候选目标对象信息,然后用户在与“海贼王”相对应的搜索结果中,点击了 N条与“海贼王”相对应的URL,则将N或者根据预定计算方式对N处理后的数据(如将N条URL分别乘以所述URL所对应的站点的权重值),作为与该用户的检索词“海贼王”相对应的资源基本维度信息;
[0192]-资源标题维度信息:即所述用户通过点击、触摸等方式所选择的一条或多条访问对象信息中,所述访问对象信息所对应的页面的标题中包含所述候选目标对象信息的数目,例如,继上例,用户点击了 N条与“海贼王”相对应的URL,所述N条URL所对应的页面的标题中,有M个都包含了候选目标对象信息“海贼王”,则将M或者根据预定计算方式对M处理后的数据(如将M个标题分别乘以所述URL所对应的站点的权重值,其中,若所述标题中含有特殊加强符号,则所述标题所对应的权重值高),作为与该用户的检索词“海贼王”相对应的资源标题维度信息;
[0193]-资源文本维度信息:即所述用户通过点击、触摸等方式所选择的一条或多条访问对象信息中,所述访问对象信息所对应的页面的内容中包含所述候选目标对象信息的数目、或与所述候选目标对象信息相关联的其他信息的数目,例如,继上例,用户点击了 N条与“海贼王”相对应的URL,所述N条URL所对应的页面的内容中,包含了 K个候选目标对象信息“海贼王”,则将K或者根据预定计算方式对K处理后的数据(如将K个内容分别乘以所述URL所对应的站点的权重值),作为与该用户的检索词“海贼王”相对应的资源文本维度信息。[0194]优选地,在步骤s21’中,所述处理设备可以根据所述用户在所述检索词下所对应的检索日志信息,结合所述资源信息库,确定与所述候选目标对象信息相关联的一个或多个访问对象信息。
[0195]具体地,在步骤s21’中,所述处理设备可以根据所述用户在所述检索词下所对应的检索日志信息,确定所述用户通过点击、输入等选择操作所选中的一个或多个链接信息(URL信息),然后将所述链接信息与所述资源信息库中所包含的链接信息进行匹配,若所述链接信息与所述资源信息库中所包含的链接信息成功匹配,则将所述链接信息作为与所述候选目标对象信息相关联的访问对象信息;反之,则所述链接信息不属于与所述候选目标对象信息相关联的访问对象信息。从而提高了所述访问对象信息的准确性。
[0196]对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此夕卜,显然“包括” 一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
【权利要求】
1.一种用于确定用户在资源信息库中所对应的目标对象信息的方法,其中,该方法包括以下步骤: a根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选目标对象信息; b根据所述用户在所述检索词下所对应的检索日志信息,确定所述候选目标对象信息所对应的检索应用信息,其中,所述检索应用信息包括所述候选目标对象信息在所述检索日志信息中的一个或多个应用维度信息; c根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
2.根据权利要求1所述的方法,其中,所述步骤a包括: -根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选资源信息; -根据所述候选资源信息,确定与所述检索词相对应的一个或多个候选目标对象信息。
3.根据权利要求1或2所述的方法,其中,所述步骤b包括: X根据所述用户在所述检索词下所对应的检索日志信息,确定与所述候选目标对象信息相关联的一个或多个 访问对象信息; -根据所述访问对象信息,确定所述候选目标对象信息所对应的检索应用信息,其中,所述检索应用信息包括所述候选目标对象信息在所述检索日志信息中的一个或多个应用维度信息。
4.根据权利要求3所述的方法,其中,所述步骤X包括: -根据所述用户在所述检索词下所对应的检索日志信息,结合所述资源信息库,确定与所述候选目标对象信息相关联的一个或多个访问对象信息。
5.根据权利要求1至4中任一项所述的方法,其中,所述步骤c包括: -根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的一个或多个第一初选目标对象信息; -根据所述一个或多个第一初选目标对象信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
6.根据权利要求1至5中任一项所述的方法,其中,所述步骤c包括: -根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的第二初选目标对象信息; -根据所述第二初选目标对象信息,结合所述资源信息库,确定与所述第二初选目标对象信息相对应的一个或多个候选目标属性信息; -根据所述候选目标属性信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
7.根据权利要求1至6中任一项所述的方法,其中,所述步骤c包括: -根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的第三初选目标对象信息; -根据所述第三初选目标对象信息,结合所述用户的检索日志信息,确定与所述第三初选目标对象信息所对应的关联检索词,其中,所述关联检索词与所述第三初选目标对象信息所对应检索词的共现频次满足共现阈值条件; -根据所述关联检索词,结合所述资源信息库,确定所述用户在所述资源信息库中所对应的目标对象信息。
8.根据权利要求1至7中任一项所述的方法,其中,所述步骤c包括: -根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的第四初选目标对象信息; -根据所述第四初选目标对象信息,结合与所述第四初选目标对象信息相对应的时间信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
9.根据权利要求1至8中任一项所述的方法,其中,该方法还包括: -获取所述用户的查询序列信息; -根据所述用户在所述资源信息库中所对应的目标对象信息,确定与所述查询序列信息相对应的优选查询序列信息,其中,所述优选查询序列信息基于所述查询序列信息及其中检索词所对应的目标对象信息。
10.根据权利要求1至9中任一项所述的方法,其中,该方法还包括: -根据所述目标对象信息,确定与所述用户相对应的用户特征模型。
11.根据权利要求10所述的方法,其中,该方法还包括: -根据所述用户特征模型,将与所述用户特征模型相对应的资源信息提供至所述用户。
12.一种用于确定用户在资源信息库中所对应的目标对象信息的处理设备,其中,该设备包括: 匹配装置,用于根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选目标对象信息; 维度确定装置,用于根据所述用户在所述检索词下所对应的检索日志信息,确定所述候选目标对象信息所对应的检索应用信息,其中,所述检索应用信息包括所述候选目标对象信息在所述检索日志信息中的一个或多个应用维度信息; 对象确定装置,用于根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
13.根据权利要求12所述的处理设备,其中,所述匹配装置用于: -根据用户的检索词,在资源信息库中进行匹配查询,以获得与所述检索词相对应的一个或多个候选资源信息; -根据所述候选资源信息,确定与所述检索词相对应的一个或多个候选目标对象信息。
14.根据权利要求12或13所述的处理设备,其中,所述维度确定装置包括: 访问确定单元,用于根据所述用户在所述检索词下所对应的检索日志信息,确定与所述候选目标对象信息相关联的一个或多个访问对象信息; 维度确定单元,用于根据所述访问对象信息,确定所述候选目标对象信息所对应的检索应用信息,其中,所述检索应用信息包括所述候选目标对象信息在所述检索日志信息中的一个或多个应用维度信息。
15.根据权利要求14所述的处理设备,其中,所述访问确定单元用于: -根据所述用户在所述检索词下所对应的检索日志信息,结合所述资源信息库,确定与所述候选目标对象信息相关联的一个或多个访问对象信息。
16.根据权利要求1至15中任一项所述的处理设备,其中,所述对象确定装置用于: -根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的一个或多个第一初选目标对象信息; -根据所述一个或多个第一初选目标对象信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
17.根据权利要求12至16中任一项所述的处理设备,其中,所述对象确定装置用于: -根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的第二初选目标对象信息; -根据所述第二初选目标对象信息,结合所述资源信息库,确定与所述第二初选目标对象信息相对应的一个或多个候选目标属性信息; -根据所述候选目标属性信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
18.根据权利要求12至17中任一项所述的处理设备,其中,所述对象确定装置用于: -根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的第三初选目标对象信息; -根据所述第三初选目标对象信息,结合所述用户的检索日志信息,确定与所述第三初选目标对象信息所对应的关联检索词,其中,所述关联检索词与所述第三初选目标对象信息所对应检索词的共现频次满足共现阈值条件; -根据所述关联检索词,结合所述资源信息库,确定所述用户在所述资源信息库中所对应的目标对象信息。
19.根据权利要求12至18中任一项所述的处理设备,其中,所述对象确定装置用于: -根据所述一个或多个候选目标对象信息,并结合所述检索应用信息,确定所述用户在所述资源信息库中所对应的第四初选目标对象信息; -根据所述第四初选目标对象信息,结合与所述第四初选目标对象信息相对应的时间信息,确定所述用户在所述资源信息库中所对应的目标对象信息。
20.根据权利要求12至19中任一项所述的处理设备,其中,该设备还包括: 序列获取装置,用于获取所述用户的查询序列信息; 序列优选装置,用于根据所述用户在所述资源信息库中所对应的目标对象信息,确定与所述查询序列信息相对应的优选查询序列信息,其中,所述优选查询序列信息基于所述查询序列信息及其中检索词所对应的目标对象信息。
21.根据权利要求12至20中任一项所述的处理设备,其中,该设备还包括: 模型确定装置,用于根据所述目标对象信息,确定与所述用户相对应的用户特征模型。
22.根据权利要求21所述的处理设备,其中,该设备还包括: 提供装置,用于根据所述用户特征模型,将与所述用户特征模型相对应的资源信息提供至所述用户。
【文档编号】G06F17/30GK103955480SQ201410131462
【公开日】2014年7月30日 申请日期:2014年4月2日 优先权日:2014年4月2日
【发明者】代大攀, 樊开元, 姚旭 申请人:百度在线网络技术(北京)有限公司