词汇的获取方法及装置、推送方法及装置的制造方法
【专利说明】
【技术领域】
[0001]本发明涉及互联网应用技术领域,尤其涉及一种词汇的获取方法及装置、推送方法及装置。
【【背景技术】】
[0002]目前,输入法词库包括终端本地预先下载的词库和线上的云词库,这样,当用户使用输入法输入词汇时,可以为用户提供丰富的候选词汇,供用户选择。
[0003]现有技术中,每个用户所使用的客户端能够获取到的候选词汇都是从输入法词库获取的,每个用户的输入法词库都是相同的;而且,输入法词库量级的增长也无法满足用户的个性化输入需求,30万词库量级之后,词库扩容所带来的首选率和覆盖率的提升能力越来越有限。因此,现有技术中输入法能够提供的词汇无法满足用户的个性化输入需求,使得词汇首选率和词库利用效率都比较低,从而导致输入效率较低。
【
【发明内容】
】
[0004]有鉴于此,本发明实施例提供了一种词汇的获取方法及装置、推送方法及装置,用以解决输入法词汇无法满足用户的个性化输入需求的问题。
[0005]本发明实施例的一方面,提供一种词汇的获取方法,包括:
[0006]获取用户的兴趣分布信息;
[0007]生成个性化词库,所述个性化词库包含基础词汇和新词;
[0008]根据所述用户的兴趣分布信息和所述个性化词库,获得针对所述用户的个性化词汇。
[0009]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述生成个性化词库,包括:
[0010]根据已有词库,获取所述基础词汇;
[0011]根据热门词汇和时效性词汇,获取所述新词;
[0012]根据所述基础词汇和所述新词,生成所述个性化词库。
[0013]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据热门词汇和时效性词汇,获取所述新词之前,所述方法还包括:
[0014]获取时效性的页面内容;
[0015]对所述时效性的页面内容进行切词处理,以获得至少一个候选词汇;
[0016]根据用户输入词汇历史记录和每个候选词汇的标签,对所述至少一个候选词汇进行筛选,以获得所述时效性词汇。
[0017]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述用户的兴趣分布信息包括所述用户的至少一个兴趣标签以及每个所述兴趣标签的权重值;所述根据所述用户的兴趣分布信息和所述个性化词库,获得针对所述用户的个性化词汇,包括:
[0018]根据预设的词汇总数和每个所述兴趣标签的权重值,确定每个所述兴趣标签对应的个性化词汇数目;
[0019]根据每个所述兴趣标签和每个所述兴趣标签对应的个性化词汇数目,从所述个性化词库获得每个所述兴趣标签对应的个性化词汇,以作为针对所述用户的个性化词汇。
[0020]本发明实施例的一方面,提供一种词汇的推送方法,包括:
[0021]接收客户端发送的词汇版本信息和用户标识;
[0022]根据所述词汇版本信息和所述用户标识,获得针对使用所述客户端的用户的个性化词汇;所述针对使用所述客户端的用户的个性化词汇为利用所述的词汇的获取方法获取的;
[0023]将针对使用所述客户端的用户的个性化词汇推送给所述客户端。
[0024]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述词汇版本信息和所述用户标识,获得针对使用所述客户端的用户的个性化词汇,包括:
[0025]根据所述用户标识,获得最新的词汇版本信息;
[0026]将所述最新的词汇版本信息与从所述客户端接收的词汇版本信息进行比较,若两个词汇版本信息不一致,根据所述用户标识,获得针对使用所述客户端的用户的个性化词汇。
[0027]本发明实施例的一方面,提供一种词汇的获取装置,包括:
[0028]兴趣获取单元,用于获取用户的兴趣分布信息;
[0029]词库生成单元,用于生成个性化词库,所述个性化词库包含基础词汇和新词;
[0030]词汇获取单元,用于根据所述用户的兴趣分布信息和所述个性化词库,获得针对所述用户的个性化词汇。
[0031]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述词库生成单元,具体用于:
[0032]根据已有词库,获取所述基础词汇;
[0033]根据热门词汇和时效性词汇,获取所述新词;
[0034]根据所述基础词汇和所述新词,生成所述个性化词库。
[0035]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述词库生成单元,还用于:
[0036]获取时效性的页面内容;
[0037]对所述时效性的页面内容进行切词处理,以获得至少一个候选词汇;
[0038]根据用户输入词汇历史记录和每个候选词汇的标签,对所述至少一个候选词汇进行筛选,以获得所述时效性词汇。
[0039]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述用户的兴趣分布信息包括所述用户的至少一个兴趣标签以及每个所述兴趣标签的权重值;所述词汇获取单元,具体用于:
[0040]根据预设的词汇总数和每个所述兴趣标签的权重值,确定每个所述兴趣标签对应的个性化词汇数目;
[0041 ] 根据每个所述兴趣标签和每个所述兴趣标签对应的个性化词汇数目,从所述个性化词库获得每个所述兴趣标签对应的个性化词汇,以作为针对所述用户的个性化词汇。
[0042]本发明实施例的一方面,提供一种词汇的推送装置,包括:
[0043]信息输入单元,用于接收客户端发送的词汇版本信息和用户标识;
[0044]词汇处理单元,用于根据所述词汇版本信息和所述用户标识,获得针对使用所述客户端的用户的个性化词汇;所述针对使用所述客户端的用户的个性化词汇为利用所述的词汇的获取装置获取的;
[0045]信息输出单元,用于将针对使用所述客户端的用户的个性化词汇推送给所述客户端。
[0046]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述词汇处理单元,具体用于:
[0047]根据所述用户标识,获得最新的词汇版本信息;
[0048]将所述最新的词汇版本信息与从所述客户端接收的词汇版本信息进行比较,若两个词汇版本信息不一致,根据所述用户标识,获得针对使用所述客户端的用户的个性化词汇。
[0049]由以上技术方案可以看出,本发明实施例具有以下有益效果:
[0050]本发明实施例提供的技术方案,能够生成个性化词库,并根据用户的兴趣信息从个性化词库中获取针对用户的个性化词汇,进一步可以输出用户的个性化词汇,因此,实现了用户词汇的个性化获取和推送,能够满足用户的个性化输入需求,解决现有技术中输入法词汇无法满足用户的个性化输入需求的问题,从而能够提高用户输入效率、词库首选率和覆盖率。
【【附图说明】】
[0051]为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
[0052]图1是本发明实施例所提供的词汇的获取方法的流程示意图;
[0053]图2是本发明实施例所提供的获得针对用户的个性化词条的示例图;
[0054]图3是本发明实施例所