关联词调整方法及调整系统与流程

文档序号:15164167发布日期:2018-08-14 17:15阅读:257来源:国知局

本发明涉及计算机技术领域,尤其涉及一种关联词调整方法,以及基于该方法下的关联词调整系统。



背景技术:

随着互联网的迅猛发展、web信息的增加,移动互联网、物联网、人工智能、大数据、区块链等各种场景,使得信息越来越多,但是信息之间的关联度越来越差,用户要在信息海洋里查找自己所需的信息,就像大海捞针一样,用户面临的不是查找不到信息,而是干扰信息过多,找不到真正想要的信息。搜索系统和推荐系统的出现恰好解决了这一难题。它可以为用户提供智能、准确的信息检索、推荐服务,根据使用者提供的相关信息能够找到真正需要信息。

然而,目前各行各业的推荐系统、搜索系统基本上都是基于关键词直接查询到结果或者基于用户行为找到不同词之间的关联关系,这种传统的方法只能满足简单的应用场景和基于大数据的分析才能实现。

百度就是明显的基于关键词的搜索系统,但是其搜索出来的结果必须和输入的关键词匹配才可以。此外,基于用户行为分析的推荐算法必须基于海量的数据积累以及算法的训练,对于很多公司来说有很高的门槛,不能快速在企业达到效果。

例如,用户输入腾讯,用户想要知道的结果肯定包括qq、微信、企鹅等和这个词关联的信息,然而现有的搜索系统和推荐系统只会将和腾讯相关的内容推荐给客户,难以满足客户的需求。



技术实现要素:

有鉴于此,本发明旨在提出一种关联词调整方法,以可使搜索工作更加快速且有效。

为达到上述目的,本发明的技术方案是这样实现的:

一种关联词调整方法,该方法包括:

设置多个关键词库,各所述关键词库中包含有与一核心词相互关联的原始关键词,所述核心词和多个所述原始关键词被赋予原始权重,并记录各所述关键词库中的各所述核心词和所述原始关键词的使用次数;

获取用户在预设单位时间范围内搜索的关键词集合,所述关键词集合中包含有多个按顺序排列的关键词;依据用户输入的首个所述关键词,查找与各所述关键词库中包含的所述核心词的关联度大于预设关联度阈值的所述关键词库;

将所述关键词集合中的各所述关键词,加入到查找到的所述关键词库中;并依据该所述关键词集合的首个所述关键词和该所述关键词库中的所述核心词的关联度,按所述关键词集合中的各所述关键词的排列顺序,由高到低的顺次赋予所述关键词集合中的各所述关键词的权重。

进一步的,还包括调整步骤:依据各所述原始关键词、所述核心词以及补入的各所述关键词的使用次数,动态调整各所述原始关键词、所述核心词以及补入的各所述关键词的权重。

进一步的,依据所述关键词集合中的首个所述关键词,查找与各所述关键词库中包含的所述核心词的关联度大于预设关联度阈值的所述关键词库时,是依据所述关键词集合中的首个所述关键词,查找该首个所述关键词对应的所述关键词库中的所述原始关键词,以查找到的所述原始关键词和所述核心词的关联度作为首个所述关键词和所述核心词的关联度。

进一步的,将所述关键词集合中的各所述关键词,加入到查找到的所述关键词库中时,以查找到的所述原始关键词的权重,作为补入到所述关键词中的首个所述关键词的权重。

进一步的,首个所述关键词和所述核心词的关联度=a/|a-b|;

其中,a为首个所述关键词对应的所述关键词库中的所述原始关键词的权重;

b为核心词的权重。

本发明的关联词调整方法,通过设置关键词库,并根据用户搜索内容,在关键词库中不断增加关键词并赋予新增加的关键词权重,可以使搜索工作快速高效,方便使用。

此外,本发明的关键词调整方法,适用于当今社会网络信息繁杂、不断变化的情况,其可随着社会热点的出现而动态调整关键词库,并且这种关联关系及动态调整过程是自动维护的,使用户可以在最少的时间内获得最有效的信息,节约用户时间,方便用户使用。

此外,本发明同时提供一种关联词调整系统,包括:

存储模块,用于存储多个关键词库,各所述关键词库中包含有与一核心词相互关联的原始关键词,所述核心词和多个所述原始关键词被赋予原始权重,并记录各所述关键词库中的各所述核心词和所述原始关键词的使用次数;

获取模块,获取用户在预设单位时间范围内搜索的关键词集合,所述关键词集合中包含有多个按顺序排列的关键词;

计算单元,依据所述关键词集合中的首个所述关键词,计算与各所述关键词库中包含的所述核心词的关联度大于预设关联度阈值的所述关键词库;

添加模块,用于将所述关键词集合中的各所述关键词,加入到查找到的所述关键词库中;并依据该所述关键词集合的首个所述关键词和该所述关键词库中的所述核心词的关联度,按所述关键词集合中的各所述关键词的排列顺序,由高到低的顺次赋予所述关键词集合中的各所述关键词的权重。

进一步的,还包括:

记录模块,用于记录各所述原始关键词、所述核心词以及补入的各所述关键词的使用次数,以动态调整各所述原始关键词、所述核心词以及补入的各所述关键词的权重。

本发明所述的关联词调整系统,可以将前述的关键词调整方法形成模块化结构,使得搜索工作更加简单。

具体实施方式

需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

下面将结合实施例来详细说明本发明。

本实施例涉及一种关联词调整方法,该方法包括设置多个关键词库,各关键词库中包含有与一核心词相互关联的原始关键词,核心词和多个原始关键词被赋予原始权重,并记录各关键词库中的各核心词和原始关键词的使用次数。其中,权重可以采用分数计算,其代表原始关键词与核心词之间的关联度,10分是强关联,1分是弱关联。

例如,其一关键词库中,核心词是“腾讯”,权重是10,使用次数为100,然后原始关键词1为“微信”,对应的权重是9,使用次数为20,原始关键词2为“qq”,权重是8,使用次数为30等;

再如,另一关键词库中,核心词是“麻省理工”,权重是10,使用次数为100,然后原始关键词1为“mit”,对应的权重是10,使用次数为90,原始关键词2为“名校”,权重是5,使用次数为50等;

以上两个例子,可综合列表如表1所示。

表1关键词库中核心词和原始关键词权重及使用次数

为了使用户快速准确的得到需求的信息,本发明的关键词调整方法还包括动态的扩充词库的方法,通过获取用户在预设单位时间范围内搜索的关键词集合;所述关键词集合中包含有多个按顺序排列的关键词。

单个用户在单位时间段内搜索的关键词通常有关联性,因此基本认为用户在预设单位时间范围内输入的关键词是高度相关的,并且可以配置默认第二个关键词,第三个关键词等的权重,这样就能实现动态的扩充词库和设置权重。

例如,预设单位时间为30s,用户在多次搜索行为过程中,两次搜索间隔时间在30秒之内,则认为这两次关键词相关,如果用户在30s内连续输入了关键词“微信”、“聊天软件”,如果“微信”已存在于某一关键词库中,则将该时间范围内用户输入的其余关键词增加到对应的关键词库中,也即应将“聊天软件”加入到该关键词库中。

具体来讲,依据关键词集合中的首个关键词,查找与各关键词库中包含的核心词的关联度大于预设关联度阈值的关键词库;将关键词集合中的各关键词,加入到查找到的关键词库中;并依据该关键词集合的首个关键词和该关键词库中的核心词的关联度,按关键词集合中的各关键词的排列顺序,由高到低的顺次赋予关键词集合中的各关键词的权重。

以上方法中,首个关键词和核心词的关联度可采用如下公式计算:

a/|a-b|;

其中,a为首个关键词对应的关键词库中的原始关键词的权重;b为核心词的权重。

此外,本实施例中,依据关键词集合中的首个关键词,查找与各关键词库中包含的核心词的关联度大于预设关联度阈值的关键词库时,是依据关键词集合中的首个关键词,查找该首个关键词对应的关键词库中的原始关键词,以查找到的原始关键词和核心词的关联度作为首个关键词和核心词的关联度。

另外,将关键词集合中的各关键词,加入到查找到的关键词库中时,以查找到的原始关键词的权重,作为补入到关键词中的首个关键词的权重。

举例来讲,比如预设关联度阈值为3,获取30s内的查找到的关键词依次为“微信”、“聊天软件”和“支付软件”,“微信”、“聊天软件”和“支付软件”组合即构成前述的关键词集合,其中首个关键词为“微信”,“微信”在其对应的关键词库中的权重是8,其与核心词的关联度为8/|8-10|=4,而4大于3,则将“聊天软件”和“支付软件”增加到含有“微信”的关键词库中,并将“聊天软件”和“支付软件”这两个关键词顺次赋予权重,由于“微信”的权重是8,则“聊天软件”和“支付软件”的权重分别是7和6。

为了进一步提高用户搜索工作的快速有效性,本发明的关键词调整方法还包括动态权重调整步骤:依据各原始关键词、核心词以及补入的各关键词的使用次数,动态调整各原始关键词、核心词以及补入的各关键词的权重。

使用次数的记录可以基于用户输入或点击。比如,用户是通过点击使用词语,则记录用户点击当前词语的次数。在用户使用词语“腾讯”的时候,出来的会是“腾讯”、“微信”、“qq”等内容,如果20个用户点击“微信”,则记录微信的使用次数是20;如果30个用户点击“qq”,则记录“qq”的使用次数是30。

记录用户点击量之后,采用冒泡排序法将当前词语和前一个词语的点击量进行排序,如果当前词语点击次数>前一个词语的点击次数,则将两个词的权重互换。例如,“qq”的点击量是30,“微信”的点击量是20,“qq"比“微信”的点击量大,则应将“qq”和“微信”的权重互换,所以此时“qq”的权重变成9,“微信”的权重变成8,动态变化之后,结果如下表所示:

表3动态调整权重后关键词库中核心词和原始关键词权重及使用次数

以上方法中,通过对关键词库中核心词和原始关键词的权重进行动态调整,可根据社会热点的变换而对词库进行动态调整,有利于用户快速高效的得到需要的信息。

本发明的关联词调整方法,可使搜索和推荐系统基于关键词库中的词语进行搜索和推荐,而非基于海量的互联网信息,通过设置关键词库,并根据用户搜索内容,在关键词库中不断增加关键词并赋予新增加的关键词权重,可以使搜索工作快速高效,方便使用。

此外,本发明的关键词调整方法,适用于当今社会网络信息繁杂、不断变化的情况,其可随着社会热点的出现而动态调整关键词库,并且这种关联关系及动态调整过程是自动维护的,使用户可以在最少的时间内获得最有效的信息,节约用户时间,方便用户使用。

同时,本实施例还涉及一种关联词调整系统,主要包括存储模块、获取模块、查找模块、计算单元和添加模块。

其中:

存储模块用于存储多个关键词库,各关键词库中包含有与一核心词相互关联的原始关键词,核心词和多个原始关键词被赋予原始权重,并记录各关键词库中的各核心词和原始关键词的使用次数;

获取模块用于获取用户在预设单位时间范围内搜索的关键词集合,所述关键词集合中包含有多个按顺序排列的关键词。

计算单元用于依据关键词集合中的首个关键词,计算与各关键词库中包含的核心词的关联度大于预设关联度阈值的关键词库。

添加模块用于将关键词集合中的各关键词,加入到查找到的关键词库中;并依据该关键词集合的首个关键词和该关键词库中的核心词的关联度,按关键词集合中的各关键词的排列顺序,由高到低的顺次赋予关键词集合中的各关键词的权重。

本实施例的关联词调整系统,还包括记录模块,用于记录各原始关键词、核心词以及补入的各关键词的使用次数,以动态调整各原始关键词、核心词以及补入的各关键词的权重。

本发明的关联词调整系统,可以将前述的关键词调整方法形成模块化结构,使得搜索工作更加简单。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1