用于补全搜索词及建立个体兴趣模型的方法及装置的制作方法

文档序号:6377486阅读:226来源:国知局
专利名称:用于补全搜索词及建立个体兴趣模型的方法及装置的制作方法
技术领域
本发明涉及计算机网络技术领域,具体涉及一种用于补全搜索词的方法及装置,以及一种用于建立客户端设备的访问方的个体兴趣模型的方法及装置。
背景技术
随着计算机技术的发展和互联网用户规模的不断扩大,越来越多的互联网用户使用个人计算机通过互联网获得各种各样所需的信息。同时,为互联网用户提供信息服务的网站也越来越多,互联网网页的数量每天都在以惊人的速度增长,互联网信息呈现出爆发式的增长。对于用户来说,经常需要通过一定的手段,才能在浩如烟海的互联网信息中迅速定位最适合自己需求的网站或者需要的信息,比如通过搜索引擎服务。搜索引擎的服务器将互联网上的大量网站的网页信息收集起来,经过加工处理 后,建立信息数据库和索引数据库,用户可以通过在搜索引擎提供的入口中输入搜索查询词,获取搜索引擎针对该搜索词返回的搜索结果。而且,为了提高用户搜索的效率,可以为其提供搜索查询词推荐的技术服务,这种技术服务是在用户输入搜索查询词的一部分时,为用户推荐一定数量的匹配用户输入部分的搜索查询词的选项(推荐补全搜索词)供用户选择。虽然这种技术服务在一定程度上方便了用户使用搜索引擎,但现有技术中的补全搜索词的推荐技术方案,在为用户提供推荐选项时,往往只是机械地结合用户的输入进行上下文相关性的联想,相关词条很多无法满足用户的真实需求。另外一种为用户提供推荐选项的技术方案,是生硬的与当前热点结合,忽视用户的真实需求强行给用户推荐热点词条,不仅无法满足用户的真正需求,而且还容易让用户反感。由此可见,现有在用户搜索时为用户提供推荐选项的两种方法,由于与用户的真正需求匹配度相对较差,因此不能很好的提高用户搜索效率。

发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的用于补全搜索词的方法和相应的用于补全搜索词的装置,以及用于建立客户端设备的访问方的个体兴趣模型的方法和相应的用于建立客户端设备的访问方的个体兴趣模型的装置。依据本发明的一个方面,提供了一种用于补全搜索词的方法,包括匹配客户端设备的访问方进行搜索的输入内容,获取与所述输入内容具有相关性的若干候选搜索词;至少根据所述客户端设备的访问方的个体兴趣模型在所述若干候选搜索词中确定用于补全的搜索词,所述客户端设备的访问方的个体兴趣模型包括体现所述客户端设备的访问方的个性化兴趣的信息;根据所述用于补全的搜索词,对所述客户端设备的访问方进行搜索的输入内容进行补全。可选地,所述根据用于补全的搜索词,对所述客户端设备的访问方进行搜索的输入内容进行补全包括向所述客户端设备反馈所述用于补全的搜索词;和/或,在所述客户端设备的用户界面上向所述客户端设备的访问方呈现所述用于补全的搜索词。可选地,所述至少根据所述客户端设备的访问方的个体兴趣模型在所述若干候选搜索词中确定用于补全的搜索词候选搜索词用于补全的搜索词包括至少根据所述客户端设备的访问方的个体兴趣模型对所述若干候选搜索词的部分或全部进行排序;根据所述排序的结果,确定用于补全的搜索词以及所述用于补全的搜索词的顺序。可选地,所述客户端设备的访问方的个体兴趣模型包括若干兴趣点,每一所述兴趣点基于所述客户端设备的访问方的个性化兴趣被赋予相应的兴趣度权重;所述至少根据客户端设备的访问方的个体兴趣模型对所述若干候选搜索词的部分或全部进行排序包括根据所述客户端设备的访问方的个体兴趣模型中与所述候选搜索词相关的兴趣点的兴趣度权重,确定所述候选搜索词的兴趣权重;至少根据所述候选搜索词的兴趣权重,对所述若干候选搜索词的部分或全部进行排序。可选地,所述至少根据客户端设备的访问方的个体兴趣模型在所述若干候选搜索词中确定用于补全的搜索词包括至少根据所述客户端设备的访问方的个体兴趣模型和当前热点信息,在所述若干候选搜索词中确定用于补全的搜索词。可选地,所述至少根据所述客户端设备的访问方的个体兴趣模型在所述若干候选搜索词中确定用于补全的搜索词候选搜索词用于补全的搜索词包括至少根据所述客户端设备的访问方的个体兴趣模型和当前热点信息,对所述若干候选搜索词的部分或全部进行排序;根据所述排序的结果,确定用于补全的搜索词以及所述用于补全的搜索词的顺序。可选地,所述客户端设备的访问方的个体兴趣模型包括若干兴趣点,每一所述兴趣点基于所述客户端设备的访问方的个性化兴趣被赋予相应的兴趣度权重;所述至少根据客户端设备的访问方的个体兴趣模型和当前热点信息,对所述若干候选搜索词的部分或全·部进行排序包括根据所述客户端设备的访问方的个体兴趣模型中与所述候选搜索词相关的兴趣点的兴趣度权重,确定所述候选搜索词的兴趣权重;将所述候选搜索词与所述当前热点信息进行匹配,确定所述候选搜索词的热点权重;至少根据所述候选搜索词的兴趣权重和热点权重,对所述若干候选搜索词的部分或全部进行排序。根据本发明的另一方面,提供了一种用于建立客户端设备的访问方的个体兴趣模型的方法,包括收集多台基于客户端设备的访问事件的历史行为数据;根据所述多台基于客户端设备的访问事件的历史行为数据,标记和分类客户端设备的访问方的兴趣点特征词;根据每一所述客户端设备的访问方的个体历史行为数据以及所述兴趣点特征词进行匹配,获得每个客户端设备的访问方的个体兴趣模型,所述个体兴趣模型中包括若干兴趣点,每一兴趣点基于所述客户端设备的访问方的个体历史行为数据被赋相应的兴趣度权重。根据本发明的又一方面,提供了一种用于补全搜索词的装置,包括接收单元,用于接收客户端设备发送的客户端设备的访问方进行搜索的输入内容;候选确定单元,用于根据接收到的所述输入内容获取与所述输入内容具有相关性的若干候选搜索词;搜索词确定单元,用于至少根据客户端设备的访问方的个体兴趣模型在所述若干候选搜索词中确定用于补全的搜索词,所述客户端设备的访问方的个体兴趣模型包括体现所述客户端设备的访问方的个性化兴趣的信息;反馈单元,用于向所述客户端设备反馈所述用于补全的搜索
ο可选地,所述搜索词确定单元包括第一排序单元,用于至少根据所述客户端设备的访问方的个体兴趣模型对所述若干候选搜索词的部分或全部进行排序;第一确定单元,用于根据所述排序的结果,确定用于补全的搜索词以及所述用于补全的搜索词的顺序。可选地,所述客户端设备的访问方的个体兴趣模型包括若干兴趣点,每一所述兴趣点基于所述客户端设备的访问方的个性化兴趣被赋予相应的兴趣度权重;所述第一排序单元包括兴趣权重子单元,用于根据所述客户端设备的访问方的个体兴趣模型中与所述候选搜索词相关的兴趣点的兴趣度权重,确定所述候选搜索词的兴趣权重;第一搜索词排序子单元,用于至少根据所述候选搜索词的兴趣权重,对所述若干候选搜索词的部分或全部进行排序。
可选地,所述搜索词确定单元,具体用于至少根据所述客户端设备的访问方的个体兴趣模型和当前热点信息,在所述若干候选搜索词中确定用于补全的搜索词。可选地,所述搜索词确定单元包括第二排序单元,用于至少根据所述客户端设备的访问方的个体兴趣模型和当前热点信息,对所述若干候选搜索词的部分或全部进行排序;第二确定单元,用于根据所述排序的结果,确定用于补全的搜索词以及所述用于补全的搜索词的顺序。可选地,所述客户端设备的访问方的个体兴趣模型包括若干兴趣点,每一所述兴趣点基于所述客户端设备的访问方的个性化兴趣被赋予相应的兴趣度权重;所述第二排序单元包括兴趣权重子单元,用于根据所述客户端设备的访问方的个体兴趣模型中与所述候选搜索词相关的兴趣点的兴趣度权重,确定所述候选搜索词的兴趣权重;热点权重子单元,用于将所述候选搜索词与所述当前热点信息进行匹配,确定所述候选搜索词的热点权重;第二搜索词排序子单元,用于至少根据所述候选搜索词的兴趣权重和热点权重,对所述若干候选搜索词的部分或全部进行排序。可选地,所述兴趣点至少包括一级兴趣点和二级兴趣点,其中每一所述一级兴趣点包括若干二级兴趣点,所述兴趣权重子单元包括第一兴趣权重子单元,用于根据所述客户端设备的访问方的个体兴趣模型中与所述候选搜索词相关的二级兴趣点的兴趣度权重,以及所述相关的二级兴趣点所属一级兴趣点的一级权重占比,确定所述候选搜索词的兴趣权重;或,第二兴趣权重子单元,用于根据所述客户端设备的访问方的个体兴趣模型中与所述候选搜索词相关的二级兴趣点的兴趣度权重,以及所述相关的二级兴趣点在所属一级兴趣点中的二级权重占比,确定所述候选搜索词的兴趣权重。可选地,所述兴趣点至少包括一级兴趣点和二级兴趣点,其中每一所述一级兴趣点包括若干二级兴趣点,所述兴趣权重子单元包括第三兴趣权重子单元,用于在如果所述客户端设备的访问方进行的搜索是非垂直搜索时,则根据所述客户端设备的访问方的个体兴趣模型中与所述候选搜索词相关的二级兴趣点的兴趣度权重,以及所述相关的二级兴趣点所属一级兴趣点的一级权重占比,确定所述候选搜索词的兴趣权重;以及,第四兴趣权重子单元,用于在如果所述客户端设备的访问方进行的搜索是垂直搜索时,确定所述垂直搜索对应的一级兴趣点,根据所述一级兴趣点下与所述候选搜索词相关的二级兴趣点的兴趣度权重,以及所述相关的二级兴趣点在所属一级兴趣点中的二级权重占比,确定所述候选搜索词的兴趣权重。依据本发明的又一方面,提供了一种用于补全搜索词的装置,包括输入获取单元,用于获取客户端设备的访问方在客户端设备上进行搜索的输入内容;候选确定单元,用于根据所述输入内容获取与所述输入内容具有相关性的若干候选搜索词;搜索词确定单元,用于至少根据客户端设备的访问方的个体兴趣模型在所述若干候选搜索词中确定用于补全的搜索词,所述客户端设备的访问方的个体兴趣模型包括体现所述用户个性化兴趣的信息;信息呈现单元,用于在所述客户端设备的用户界面上向所述客户端设备的访问方呈现所述用于补全的搜索词。可选地,所述搜索词确定单元,具体用于至少根据所述客户端设备的访问方的个体兴趣模型和当前热点信息,在所述若干候选搜索词中确定用于补全的搜索词。依据本发明的又一方面,提供了一种用于补全搜索词的装置,包括候选单元,用于匹配客户端设备的访问方进行搜索的输入内容,获取与所述输入内容具有相关性的若干 候选搜索词;补全搜索词确定单元,用于至少根据客户端设备的访问方的个体兴趣模型在所述若干候选搜索词中确定用于补全的搜索词,所述客户端设备的访问方的个体兴趣模型包括体现所述客户端设备的访问方的个性化兴趣的信息;补全单元,用于根据所述用于补全的搜索词,对所述客户端设备的访问方进行搜索的输入内容进行补全。依据本发明的再一方面,提供了一种用于建立客户端设备的访问方的个体兴趣模型的装置,包括数据收集单元,用于收集多台基于客户端设备的访问事件的历史行为数据;标记分类单元,用于根据所述多台基于客户端设备的访问事件的历史行为数据,标记和分类客户端设备的访问方的兴趣点特征词;匹配单元,用于根据每一所述客户端设备的访问方的个体历史行为数据以及所述兴趣点特征词进行匹配,获得每个客户端设备的访问方的个体兴趣模型,所述个体兴趣模型中包括若干兴趣点,每一兴趣点基于所述客户端设备的访问方的个体历史行为数据被赋相应的兴趣度权重。根据本发明的推荐补全搜索词的方法和装置,及具体实施例,可以通过匹配客户端设备的访问方进行搜索的输入内容,获取与客户端设备的访问方输入内容具有相关性的若干补全搜索词,为客户端设备的访问方确定用于补全的搜索词做好数据准备;然后至少根据客户端设备的访问方的个体兴趣模型确定用于补全的搜索词,可以为不同的客户端设备的访问方确定更符合其兴趣要求的补全搜索词;并根据用于补全的搜索词,对客户端设备的访问方进行搜索的输入内容进行补全。,由此解决了只是机械地结合用户的输入进行上下文相关性的联想,或生硬的与当前热点结合,忽视用户的真实需求给用户推荐热点词条,而无法满足用户的真正需求的问题。取得了能够在不同用户进行搜索输入时为其输入内容补全更符合其个人兴趣要求的搜索词的有益效果。上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式



通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中图I示出了根据本发明一个实施例的用于补全搜索词的方法流程图;图2示出了根据本发明一个实施例的用于建立客户端设备的访问方的个体兴趣模型的方法流程图;图3示出了根据本发明一个实施例的用于补全搜索词的装置第一实施例示意图;以及图4示出了根据本发明一个实施例的用于建立客户端设备的访问方的个体兴趣模型的装置示意图。
具体实施例方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。请参阅图1,其示出了根据本发明一个实施例的用于补全搜索词的方法流程图。该方法实施例包括以下步骤SlOl :匹配客户端设备的访问方进行搜索的输入内容,获取与所述输入内容具有相关性的若干候选搜索词;每一个用户可以对应一个客户端设备,用户作为客户端设备的访问方,可以是客户端设备的登录者或输入者,每个客户端设备的访问方可以被分配以一个和客户端设备的访问方对应的唯一性标识,以对不同的客户端设备的访问方进行区分。为叙述方便,下述后续实施例以及具体实施方式
的描述中,在某些具体阐述时会以“用户”代替“客户端设备的访问方”进行说明。用户在使用搜索引擎时,可以通过多种站点的页面提供的搜索引擎入口来使用,例如可以使用搜索引擎服务提供商提供的站点页面中提供的搜索引擎入口,还可以使用一些导航网站的页面提供的搜索引擎入口等来使用搜索引擎。用户可以在这些搜索引擎入口输入关键词,查询需要的信息。用户进行搜索的输入内容,狭义的理解可以包括用户在搜索引擎入口中使用鼠标、键盘、触屏等输入设备进行输入时输入的具体字符等;广义的理解,还可以包括用户在搜索引擎入口中使用输入设备进行输入时产生的行为信息,例如用户将鼠标指针定位到搜索引擎入口,或者用户在搜索引擎入口进行点击等行为所产生的信息。在用户进行输入时,可以将用户的输入内容与保存有若干词的词库进行匹配,进而获取与用户输入的内容具有相关性的若干候选搜索词。在匹配用户的输入内容获取与用户输入内容具有相关性的补全搜索词时,可以获取与用户输入内容有上下文相关性的字词,例如当用户当前输入的内容是“η”时,获取的作为候选搜索词可以包括“NBA”、“嫩54”、“1^8”、“0剛”、“嫩5040”等,可以将这些词作为候选搜索词。另外有一种特殊情况是,当用户还未在搜索引擎入口输入任何字符内容,但却产生了广义上的行为信息时,例如在用户将鼠标指针定位到搜索引擎入口,却未输入任何字符内容时,可以认为此时的状态是用户的输入字符为空,用户的输入内容为用户将鼠标指针定位到搜索入口所产生的行为信息,此时也可以使用一定的方法获取候选的补全搜索词,例如根据用户的浏览网页历史记录数据,分析出用户的浏览偏好信息,根据这些用户偏好信息,获取用户在用户将鼠标指针定位到搜索引擎入口却还未输入任何字符时的候选搜索词。此外,在用户输入的内容发生变化时,还可以根据变化后的用户的输入内容进行匹配,以实时地匹配用户的搜索内容,获取与用户输入的当前内容具有相关性的若干补全搜索词。S102:至少根据所述客户端设备的访问方的个体兴趣模型在所述若干候选搜索词中确定用于补全的搜索词,所述客户端设备的访问方的个体兴趣模型包括体现所述客户端设备的访问方的个性化兴趣的信息。为了更充分的公开本步骤的具体实现,首先介绍客户端设备的访问方的个体兴趣模型的相关技术特征。客户端设备的访问方的个体兴趣模型,是体现不同用户个体的不同兴趣类别的一 种数据模型,其包括体现用户个性化兴趣的信息。客户端设备的访问方的个体兴趣模型的表达形式可以是多样的,即客户端设备的访问方的个体兴趣模型包括的体现用户个性化兴趣的信息可以是多种多样的,只要能体现出用户的兴趣即可,本发明实施例对用户个体兴趣模型的具体形式并没有限制。例如,可以通过兴趣点和兴趣点的兴趣度权重作为体现用户个性化兴趣的信息。例如,客户端设备的访问方的个体兴趣模型可以包括用户的若干兴趣点(或称兴趣分类),每一兴趣点包括若干兴趣点特征词,对于每一兴趣点可以基于用户的个性化兴趣赋予兴趣度权重。为每一兴趣点赋予兴趣度权重的过程,可以认为是对具体客户端设备的访问方的个体兴趣模型的实例化或量化的过程,而根据具体客户端设备的访问方的个性化兴趣对此客户端设备的访问方的个体兴趣模型实例化或量化后,得到的就是此客户端设备的访问方的个体兴趣模型的实例。比如用集合表示的客户端设备的访问方的个体兴趣模型可以是首先,可以根据群体用户的兴趣进行分类,获得一个基准兴趣分类,例如,根据用户群体的兴趣数据获得如下的一个基准兴趣分类,每类可以代表一个兴趣点,每个兴趣点包括若干兴趣点特征词,例
如{新闻,体育,科技,娱乐,汽车,视频,......,房产,旅游,音乐,时尚,军事,教育},这
个集合包含了某用户群体的所有兴趣点,每个兴趣点都可以包括若干兴趣点特征词,比如,“体育”这个兴趣点可以包括兴趣点特征词“姚明”、“奥运会”、“比赛”等等,这些特征词都属于该兴趣点。而对于群体中每个具体的用户个体而言,对集合中每个兴趣点的兴趣高低程度可能不尽相同,此时,可以基于基准兴趣分类建立客户端设备的访问方的个体兴趣模型,表示用户个体对基准兴趣分类中各兴趣点的兴趣高低程度,基于基准兴趣分类的个体兴趣模型可以用数据集合的形式来表示,如{cIq 3*1,&2,&3,&4,&5,......,&i,^ ( +ι) & (i+2),&(i+3),& (i+4),&(i+5)^对集合中的各个元素进行数量化和实例化,就可以得到用于表示某个具体客户端设备的访问方的个体兴趣模型实例,例如上述的用户群体中的某个具体客户端设备的访问方的个体兴趣模型可以实例化为{950,540,51,855,0,1022,......,10,366,784,599,15,56}集合中每个元素对应基准兴趣分类中的一个分类,即一个兴趣点,用户对于各兴趣点的兴趣高低程度则通过各元素的取值,即兴趣度权重来反映,如上述的数据集合就可以用来表示此用户某一时刻对各个兴趣点的感兴趣程度,如元素a5对应的值1022相对于其他元素较高,则可以看出此用户此时对元素a5对应的视频类信息的兴趣度较高。又如,为了更加细化用户兴趣分类,还可以使用二维矩阵来建立和表示客户端设备的访问方的个体兴趣模型,二维矩阵表示的个体兴趣模型如下所示
权利要求
1.一种用于补全搜索词的方法,包括 匹配客户端设备的访问方进行搜索的输入内容,获取与所述输入内容具有相关性的若干候选搜索词; 至少根据所述客户端设备的访问方的个体兴趣模型在所述若干候选搜索词中确定用于补全的搜索词,所述客户端设备的访问方的个体兴趣模型包括体现所述客户端设备的访问方的个性化兴趣的信息; 根据所述用于补全的搜索词,对所述客户端设备的访问方进行搜索的输入内容进行补全。
2.根据权利要求I所述的方法,所述根据用于补全的搜索词,对所述客户端设备的访问方进行搜索的输入内容进行补全包括 向所述客户端设备反馈所述用于补全的搜索词; 和/或, 在所述客户端设备的用户界面上向所述客户端设备的访问方呈现所述用于补全的搜索词。
3.根据权利要求I所述的方法,所述至少根据所述客户端设备的访问方的个体兴趣模型在所述若干候选搜索词中确定用于补全的搜索词候选搜索词用于补全的搜索词包括 至少根据所述客户端设备的访问方的个体兴趣模型对所述若干候选搜索词的部分或全部进行排序; 根据所述排序的结果,确定用于补全的搜索词以及所述用于补全的搜索词的顺序。
4.根据权利要求3所述的方法,所述客户端设备的访问方的个体兴趣模型包括若干兴趣点,每一所述兴趣点基于所述客户端设备的访问方的个性化兴趣被赋予相应的兴趣度权重;所述至少根据客户端设备的访问方的个体兴趣模型对所述若干候选搜索词的部分或全部进行排序包括 根据所述客户端设备的访问方的个体兴趣模型中与所述候选搜索词相关的兴趣点的兴趣度权重,确定所述候选搜索词的兴趣权重; 至少根据所述候选搜索词的兴趣权重,对所述若干候选搜索词的部分或全部进行排序。
5.根据权利要求I所述的方法,所述至少根据客户端设备的访问方的个体兴趣模型在所述若干候选搜索词中确定用于补全的搜索词包括 至少根据所述客户端设备的访问方的个体兴趣模型和当前热点信息,在所述若干候选搜索词中确定用于补全的搜索词。
6.根据权利要求5所述的方法,所述至少根据所述客户端设备的访问方的个体兴趣模型在所述若干候选搜索词中确定用于补全的搜索词候选搜索词用于补全的搜索词包括 至少根据所述客户端设备的访问方的个体兴趣模型和当前热点信息,对所述若干候选搜索词的部分或全部进行排序; 根据所述排序的结果,确定用于补全的搜索词以及所述用于补全的搜索词的顺序。
7.根据权利要求6所述的方法,所述客户端设备的访问方的个体兴趣模型包括若干兴趣点,每一所述兴趣点基于所述客户端设备的访问方的个性化兴趣被赋予相应的兴趣度权重;所述至少根据客户端设备的访问方的个体兴趣模型和当前热点信息,对所述若干候选搜索词的部分或全部进行排序包括 根据所述客户端设备的访问方的个体兴趣模型中与所述候选搜索词相关的兴趣点的兴趣度权重,确定所述候选搜索词的兴趣权重; 将所述候选搜索词与所述当前热点信息进行匹配,确定所述候选搜索词的热点权重;至少根据所述候选搜索词的兴趣权重和热点权重,对所述若干候选搜索词的部分或全部进行排序。
8.一种用于建立客户端设备的访问方的个体兴趣模型的方法,包括 收集多台基于客户端设备的访问事件的历史行为数据; 根据所述多台基于客户端设备的访问事件的历史行为数据,标记和分类客户端设备的访问方的兴趣点特征词; 根据每一所述客户端设备的访问方的个体历史行为数据以及所述兴趣点特征词进行匹配,获得每个客户端设备的访问方的个体兴趣模型,所述个体兴趣模型中包括若干兴趣点,每一兴趣点基于所述客户端设备的访问方的个体历史行为数据被赋相应的兴趣度权重。
9.一种用于补全搜索词的装置,包括 接收单元,用于接收客户端设备发送的客户端设备的访问方进行搜索的输入内容;候选确定单元,用于根据接收到的所述输入内容获取与所述输入内容具有相关性的若干候选搜索词; 搜索词确定单元,用于至少根据客户端设备的访问方的个体兴趣模型在所述若干候选搜索词中确定用于补全的搜索词,所述客户端设备的访问方的个体兴趣模型包括体现所述客户端设备的访问方的个性化兴趣的信息; 反馈单元,用于向所述客户端设备反馈所述用于补全的搜索词。
10.根据权利要求9所述的装置,所述搜索词确定单元包括 第一排序单元,用于至少根据所述客户端设备的访问方的个体兴趣模型对所述若干候选搜索词的部分或全部进行排序; 第一确定单元,用于根据所述排序的结果,确定用于补全的搜索词以及所述用于补全的搜索词的顺序。
11.根据权利要求10所述的装置,所述客户端设备的访问方的个体兴趣模型包括若干兴趣点,每一所述兴趣点基于所述客户端设备的访问方的个性化兴趣被赋予相应的兴趣度权重;所述第一排序单元包括 兴趣权重子单元,用于根据所述客户端设备的访问方的个体兴趣模型中与所述候选搜索词相关的兴趣点的兴趣度权重,确定所述候选搜索词的兴趣权重; 第一搜索词排序子单元,用于至少根据所述候选搜索词的兴趣权重,对所述若干候选搜索词的部分或全部进行排序。
12.根据权利要求9所述的装置 所述搜索词确定单元,具体用于至少根据所述客户端设备的访问方的个体兴趣模型和当前热点信息,在所述若干候选搜索词中确定用于补全的搜索词。
13.根据权利要求12所述的装置,所述搜索词确定单元包括 第二排序单元,用于至少根据所述客户端设备的访问方的个体兴趣模型和当前热点信息,对所述若干候选搜索词的部分或全部进行排序; 第二确定单元,用于根据所述排序的结果,确定用于补全的搜索词以及所述用于补全的搜索词的顺序。
14.根据权利要求13所述的装置,所述客户端设备的访问方的个体兴趣模型包括若干兴趣点,每一所述兴趣点基于所述客户端设备的访问方的个性化兴趣被赋予相应的兴趣度权重;所述第二排序单元包括 兴趣权重子单元,用于根据所述客户端设备的访问方的个体兴趣模型中与所述候选搜索词相关的兴趣点的兴趣度权重,确定所述候选搜索词的兴趣权重; 热点权重子单元,用于将所述候选搜索词与所述当前热点信息进行匹配,确定所述候选搜索词的热点权重; 第二搜索词排序子单元,用于至少根据所述候选搜索词的兴趣权重和热点权重,对所述若干候选搜索词的部分或全部进行排序。
15.根据权利要求11或14中任一项所述的装置,所述兴趣点至少包括一级兴趣点和二级兴趣点,其中每一所述一级兴趣点包括若干二级兴趣点,所述兴趣权重子单元包括 第一兴趣权重子单元,用于根据所述客户端设备的访问方的个体兴趣模型中与所述候选搜索词相关的二级兴趣点的兴趣度权重,以及所述相关的二级兴趣点所属一级兴趣点的一级权重占比,确定所述候选搜索词的兴趣权重; 或, 第二兴趣权重子单元,用于根据所述客户端设备的访问方的个体兴趣模型中与所述候选搜索词相关的二级兴趣点的兴趣度权重,以及所述相关的二级兴趣点在所属一级兴趣点中的二级权重占比,确定所述候选搜索词的兴趣权重。
16.根据权利要求11或14中任一项所述的装置,所述兴趣点至少包括一级兴趣点和二级兴趣点,其中每一所述一级兴趣点包括若干二级兴趣点,所述兴趣权重子单元包括 第三兴趣权重子单元,用于在如果所述客户端设备的访问方进行的搜索是非垂直搜索时,则根据所述客户端设备的访问方的个体兴趣模型中与所述候选搜索词相关的二级兴趣点的兴趣度权重,以及所述相关的二级兴趣点所属一级兴趣点的一级权重占比,确定所述候选搜索词的兴趣权重; 以及, 第四兴趣权重子单元,用于在如果所述客户端设备的访问方进行的搜索是垂直搜索时,确定所述垂直搜索对应的一级兴趣点,根据所述一级兴趣点下与所述候选搜索词相关的二级兴趣点的兴趣度权重,以及所述相关的二级兴趣点在所属一级兴趣点中的二级权重占比,确定所述候选搜索词的兴趣权重。
17.一种用于补全搜索词的装置,包括 输入获取单元,用于获取客户端设备的访问方在客户端设备上进行搜索的输入内容; 候选确定单兀,用于根据所述输入内容获取与所述输入内容具有相关性的若干候选搜索词; 搜索词确定单元,用于至少根据客户端设备的访问方的个体兴趣模型在所述若干候选搜索词中确定用于补全的搜索词,所述客户端设备的访问方的个体兴趣模型包括体现所述用户个性化兴趣的信息;信息呈现单元,用于在所述客户端设备的用户界面上向所述客户端设备的访问方呈现所述用于补全的搜索词。
18.根据权利要求17所述的装置 所述搜索词确定单元,具体用于至少根据所述客户端设备的访问方的个体兴趣模型和当前热点信息,在所述若干候选搜索词中确定用于补全的搜索词。
19.一种用于补全搜索词的装置,包括 候选单元,用于匹配客户端设备的访问方进行搜索的输入内容,获取与所述输入内容具有相关性的若干候选搜索词; 补全搜索词确定单元,用于至少根据客户端设备的访问方的个体兴趣模型在所述若干候选搜索词中确定用于补全的搜索词,所述客户端设备的访问方的个体兴趣模型包括体现所述客户端设备的访问方的个性化兴趣的信息; 补全单元,用于根据所述用于补全的搜索词,对所述客户端设备的访问方进行搜索的输入内容进行补全。
20.一种用于建立客户端设备的访问方的个体兴趣模型的装置,包括 数据收集单元,用于收集多台基于客户端设备的访问事件的历史行为数据; 标记分类单元,用于根据所述多台基于客户端设备的访问事件的历史行为数据,标记和分类客户端设备的访问方的兴趣点特征词; 匹配单元,用于根据每一所述客户端设备的访问方的个体历史行为数据以及所述兴趣点特征词进行匹配,获得每个客户端设备的访问方的个体兴趣模型,所述个体兴趣模型中包括若干兴趣点,每一兴趣点基于所述客户端设备的访问方的个体历史行为数据被赋相应的兴趣度权重。
全文摘要
本发明公开了一种用于补全搜索词的方法,包括匹配客户端设备的访问方进行搜索的输入内容,获取与所述输入内容具有相关性的若干候选搜索词;至少根据所述客户端设备的访问方的个体兴趣模型在所述若干候选搜索词中确定用于补全的搜索词,所述客户端设备的访问方的个体兴趣模型包括体现所述客户端设备的访问方的个性化兴趣的信息;根据所述用于补全的搜索词,对所述客户端设备的访问方进行搜索的输入内容进行补全。本发明还公开了一种用于补全搜索词的装置。能够在不同用户进行搜索输入时为其输入内容补全更符合其个人兴趣要求的搜索词。
文档编号G06F17/30GK102902753SQ201210353539
公开日2013年1月30日 申请日期2012年9月20日 优先权日2012年9月20日
发明者周浩, 邓夏玮 申请人:北京奇虎科技有限公司, 奇智软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1