一种基于用户标签的话题推荐方法及系统与流程

文档序号:22878266发布日期:2020-11-10 17:32阅读:145来源:国知局
一种基于用户标签的话题推荐方法及系统与流程

本申请涉及数据处理领域,尤其涉及一种基于用户标签的话题推荐方法及系统。



背景技术:

随着互联网的日益普及,网络论坛、专业领域的网络社区成为人们获取专业信息、交流专业信息的重要渠道。大量网民在网络社区中发表自己的意见见解、发布发行业动态、研发新进展或突破、以及热点科技新闻等,为了提高网络社区活跃度,往往会从各种意见、热点新闻等中找出一些热点话题以供用户进行讨论交流。倘若提供给用户的话题是用户擅长的,感兴趣的,那么可大大提高用户参与该话题讨论的热情,提升网络社区的活跃度。

现有的话题推送方式,通常是直接将网络社区的热点话题显示在首页或者推送给用户,而该热点话题并不一定是每个用户都感兴趣的。因此这种推送方式具有一定的局限性,推送效果有限,无法根据用户的个性化推送贴合的话题,提高话题参与度与用户体验。



技术实现要素:

为解决上述技术问题,本申请提供一种基于用户标签的话题推荐方法及系统,具体的,本申请的技术方案如下:

一方面,本申请公开了一种基于用户标签的话题推荐方法,包括:从云端的关键词标签库中,选取话题关键词;所述关键词标签库中分类存储有不同的关键词及频数;将所述话题关键词输入训练好的不同模式的文本生成神经网络模型,获得所述话题关键词的不同模式的话题;获取用户的阅读标签,根据所述用户的阅读标签查找与所述用户的阅读标签匹配的话题,并将其推荐给所述用户。

优选地,所述基于用户标签的话题推荐方法,还包括:获取所述用户的搜索、阅读的历史数据信息;从所述历史数据信息中提取关键词,并统计各关键词的频数;根据所述历史数据信息获取所述用户的文本模式喜好;根据统计的各关键词、频数、及所述文本模式喜好,确定所述用户的阅读标签。

优选地,所述用户的阅读标签包括:阅读关键词及其频数,以及文本模式喜好;所述根据所述用户的阅读标签查找与所述用户的阅读标签匹配的话题,并将其推荐给所述用户具体包括:获取所述用户的阅读标签中频数最高的关键词作为目标关键词;查找与所述目标关键词匹配的话题;当查找到与所述目标关键词匹配的话题时,从查找到的话题中,选取与所述用户的阅读标签中的文本模式喜好匹配的话题作为目标话题;将所述目标话题推荐给所述用户。

优选地,所述基于用户标签的话题推荐方法还包括:训练不同模式的文本生成神经网络模型;其具体包括:从网上爬取阅读量超过预设阈值的热点话题;对采集的热点话题根据文本模式进行分类;提取所述热点话题中的关键词,并进行标注,获得训练样本;将训练样本按照文本模式的类别输入不同的神经网络模型中进行迭代训练,获得不同模式的文本生成神经网络模型。

优选地,所述基于用户标签的话题推荐方法还包括:当未查找到与所述用户的阅读标签匹配的话题,根据所述用户的阅读标签,确定目标关键词及文本模式;根据确定的文本模式,选取对应模式的文本生成神经网络模型作为目标文本生成神经网络模型;将确定的所述目标关键词输入所述目标文本生成神经网络模型,生成对应模式的目标话题;将所述目标话题推荐给所述用户。

优选地,所述基于用户标签的话题推荐方法还包括:当未查找到与所述用户的阅读标签匹配的话题时,将网站内所有话题按照阅读量或者参与量进行排序,获取若干个热点话题;将所述若干个热点话题推荐给所述用户。

优选地,所述关键词标签库中还存储有关键词引申图谱;在获取到所述用户的阅读标签中频数最高的关键词作为目标关键词之后包括:根据所述关键词引申图谱,查找所述目标关键词的引申关键词;查找与所述目标关键词或所述引申关键词匹配的话题;当查找到与所述目标关键词或所述引申关键词匹配的话题时,从查找到的话题中,选取与所述用户的阅读标签中的文本模式喜好匹配的话题作为目标话题;将所述目标话题推荐给所述用户。

优选地,在获得所述话题关键词的不同模式的话题之后还包括:从已发布的话题中,查找与所述关键词相关的话题作为备选话题;从通过神经网络模型获取的话题中,筛选出与所述备选话题相似度达预设阈值的话题,并进行删除处理。

另一方面,本申请还公开了一种基于用户标签的话题推荐系统,包括:关键词标签库,用于分类存储不同的关键词及频数;所述关键词标签库设立于云端;关键词选取模块,用于从云端的关键词标签库中,选取话题关键词;话题生成模块,用于将所述话题关键词输入训练好的不同模式的文本生成神经网络模型,获得所述话题关键词的不同模式的话题;标签获取模块,用于获取用户的阅读标签;话题推荐模块,用于根据所述用户的阅读标签查找与所述用户的阅读标签匹配的话题,并将其推荐给所述用户。

优选地,所述标签获取模块包括:历史数据采集子模块,用于获取所述用户的搜索、阅读的历史数据信息;提取统计子模块,用于从所述历史数据信息中提取关键词,并统计各关键词的频数;数据分析子模块,用于根据所述历史数据信息获取所述用户的文本模式喜好;并根据统计的各关键词、频数、及所述文本模式喜好,确定所述用户的阅读标签。

优选地,所述用户的阅读标签包括:阅读关键词及其频数,以及文本模式喜好;所述话题推荐模块具体包括:目标获取子模块,用于获取所述用户的阅读标签中频数最高的关键词作为目标关键词;匹配查找子模块,用于查找与所述目标关键词匹配的话题;话题选取子模块,用于当查找到与所述目标关键词匹配的话题时,从查找到的话题中,选取与所述用户的阅读标签中的文本模式喜好匹配的话题作为目标话题;信息推荐子模块,用于将所述目标话题推荐给所述用户。

优选地,所述基于用户标签的话题推荐系统还包括:模型训练模块,用于训练不同模式的文本生成神经网络模型;所述模型训练模块具体包括:信息爬取子模块,用于从网上爬取阅读量超过预设阈值的热点话题;信息处理子模块,用于对采集的热点话题根据文本模式进行分类;并提取所述热点话题中的关键词进行标注,获得训练样本;迭代训练子模块,用于将训练样本按照文本模式的类别输入不同的神经网络模型中进行迭代训练,获得不同模式的文本生成神经网络模型。

优选地,所述话题推荐模块还包括:模型选取子模块,其中:所述目标获取子模块,还用于当所述匹配查找子模块未查找到与所述目标关键词匹配的话题时,根据所述用户的阅读标签,确定目标关键词及文本模式;所述模型选取子模块,用于根据确定的文本模式,选取对应模式的文本生成神经网络模型作为目标文本生成神经网络模型;并通过所述话题生成模块将确定的所述目标关键词输入所述目标文本生成神经网络模型,生成对应模式的目标话题;所述信息推荐子模块,还用于将所述目标话题推荐给所述用户。

优选地,所述基于用户标签的话题推荐系统,还包括:话题排序模块,用于当未查找到与所述用户的阅读标签匹配的话题时,将网站内所有话题按照阅读量或者参与量进行排序,获得若干个热点话题;所述话题推荐模块,还用于将所述若干个热点话题推荐给所述用户。

优选地,所述关键词标签库中还存储有关键词引申图谱;所述话题推荐模块还包括:关联查找子模块;其中:所述关联查找子模块,用于根据所述关键词引申图谱,查找所述目标关键词的引申关键词;所述匹配查找子模块,还用于查找与所述目标关键词或所述引申关键词匹配的话题;所述话题选取子模块,还用于当查找到与所述目标关键词或所述引申关键词匹配的话题时,从查找到的话题中,选取与所述用户的阅读标签中的文本模式喜好匹配的话题作为目标话题。

本申请至少包括以下一项技术效果:

(1)本申请从关键词标签库中选取出话题关键词,然后利用不同模式的文本生成神经网络模型生成不同类型的话题,然后再根据用户的阅读标签去进行匹配,选取与用户标签匹配的话题(比如用户可能感兴趣的、喜爱的文笔模式的话题)进行推荐,从而大大提高了用户参与该话题讨论的可能性,进而提升了网络社区的活跃度。

(2)本申请在进行话题推荐时,在考虑到用户可能感兴趣的关键词的话题内容外,还进一步考虑到了该用户对文本模式的偏好,进而从查找到的与该感兴趣的关键词相关的、喜欢的文本模式的话题来作为目标话题,这样,不仅是用户对该目标关键词的内容感兴趣,还是用户喜欢的笔调写法,进而更加赢得用户的青睐,更容易触动用户,让用户更加愿意参与该话题的讨论。

(3)本申请除了会针对选取的目标关键词生成、或选取目标话题外,还可以根据关键词标签库中存储的关键词引申图谱,获得目标关键词的引申关键词,进而根据该引申关键词,通过文本生成神经网络模型获得对应的与引申关键词相关的话题。由于引申关键词是目标关键词的拓展延伸、相关联,因此,若用户对该目标关键词的话题感兴趣的话,则也极有可能对该目标关键词的引申话题也感兴趣。因此,在向用户推荐话题时,除了推荐直接的目标关键词的话题外,还可以推荐与该目标关键词相关的引申关键词的话题,让用户可参与多个不同的感兴趣的话题,在保证推荐的精准性前提下,拓宽话题推荐的范围。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请基于用户标签的话题推荐方法的一个实施例的流程图;

图2为本申请基于用户标签的话题推荐方法的另一实施例的流程图;

图3为本申请基于用户标签的话题推荐方法的另一实施例的流程图;

图4为本申请基于用户标签的话题推荐系统的一个实施例的结构框图;

图5为本申请基于用户标签的话题推荐系统的一个实施例的结构框图;

图6为本申请基于用户标签的话题推荐系统的一个实施例的结构框图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其他实施例中也可以实现本申请。在其他情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。

应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所述描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或集合的存在或添加。

为使图面简洁,各图中只示意性地表示出了与本申请相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘出了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。

还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

另外,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对照附图说明本申请的具体实施方式。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。

本申请公开了一种基于用户标签的话题推荐方法,实施例一如图1所示,包括:

s101,从云端的关键词标签库中,选取话题关键词;所述关键词标签库中分类存储有不同的关键词及频数;

具体的,关键词标签库设置在云端,从而能提供数据多重实时存储技术,避免数据丢失。关键词标签库中按照类别存储了不同的关键词及该关键词的频数。频数即该关键词的统计次数。一般的,网络社区中的每新增一篇文章、新闻或帖子等数据信息,便会对该数据信息进行处理,提取该数据信息的关键词;若该关键词已在云端的关键词标签库中存在了,则会直接在关键词标签库中更新该关键词的频数(加一);若该关键词还未存储在关键词标签库中,则先确定该关键词的类别,然后再在关键词标签库中对应类别下新增该关键词,并记录其频数(新增为1)。

从云端的关键词标签库中,选取话题关键词;具体的,可以根据其存储的各关键词的频数来选取话题关键词,频数高的关键词则说明网络社区中对该关键词的关注度比较高,那么关于该关键词的话题也最有可能成为热门话题。当然,除了可以根据关键词的频数来选取话题关键词外,也可以根据频数增长率来选取话题关键词,比如有些关键词,虽然频数还不是很高,但是其在近一周内频数增长率比较快,那么该关键词的相关信息很有可能是近期的热点,因此,也可选取预设时间段内频数增长率达到预设增长点的关键词作为话题关键词;或者选取预设时间段内,选取若干频数增长率排名靠前的关键词作为话题关键词。当然,还可以上述两种方式兼而有之,本实施例不限定话题关键词的选取策略,可根据实际需求设置对应的选取策略来从关键词标签库中众多的关键词里选取出可能成为热点的话题关键词。当然,这里的话题关键词并不是只限定为一个关键词,可以包含一个或多个关键词共同作为一个话题的话题关键词。

s102,将所述话题关键词输入训练好的不同模式的文本生成神经网络模型,获得所述话题关键词的不同模式的话题;

具体的,本实施例中训练好了不同模式文本生成神经网络模型,这里的模式是指文体模式或者说是写法,同一关键词,同一件事,采用不同的写法获得的效果也是不一样的。比如,有的人喜欢偏文艺范的,情感模式;有的人喜欢短小精悍、一针见血的极简模式;有的人喜欢诙谐幽默的搞笑文笔模式;有的人喜欢事实陈述、传统的新闻模式。具体的,可根据需求定义不同的模式类别。输入同样的关键词,不同模式的文本生成神经网络则会生成不同模式(不同写法或不同笔调)的话题。

s103,获取用户的阅读标签;

具体的,根据用户的历史阅读数据信息,便可确定出该用户的阅读标签,知道该用户偏爱哪一类文笔,喜欢哪一类数据信息。

s104,根据所述用户的阅读标签,查找与所述用户的阅读标签匹配的话题,并将其推荐给所述用户。

具体的,确定好用户的阅读标签后,便可根据该阅读标签从各话题中进行查找匹配,最后将匹配到的话题推荐给用户,引导用户参与话题讨论。而进行匹配的话题,一种是仅限于从通过各文本生成神经网络模型生成的各话题中进行匹配;另一种实现方式则是除了本实施例中根据选取的话题关键词,通过各文本生成神经网络模型生成的话题外,还可以是之前已发布的历史话题。前者的匹配工作量小;后者的匹配成功的可能性更高。当然,还可以是先从生成的各话题中进行匹配,若匹配不上,则再从历史话题中进行匹配。

本实施例中,先从关键词标签库中选取出话题关键词,然后利用不同模式的文本生成神经网络模型生成不同类型的话题,然后再根据用户的阅读标签去进行匹配,选取用户可能感兴趣的、喜爱的文笔模式的话题进行推荐,从而大大提高了用户参与该话题讨论的可能性,进而提升了网络社区的活跃度。

上述实施例中,关于用户标签,可采用如下方式来获取;具体的,上述实施例中的步骤s103,获取用户的阅读标签具体包括:

s103-1,获取所述用户的搜索、阅读的历史数据信息;

s103-2,从所述历史数据信息中提取关键词,并统计各关键词的频数;

s103-3,根据所述历史数据信息获取所述用户的文本模式喜好;

s103-4,根据统计的各关键词、频数、及所述文本模式喜好,确定所述用户的阅读标签。

具体的,通过获取用户的历史搜索、浏览阅读等数据信息,可大致统计出用户关注的关键词及其频数(相当于关注度),比如,经过数据统计,用户a关注医学专家类型中的关键词“xyz”(医学专家名),频数达55次;也就是说该用户a曾搜索或浏览过关于专家“xyz”相关的数据信息高达55篇或高达55次。

而根据历史数据信息获取用户的文本模式喜好,则需要分析用户浏览阅读的数据信息的文本类型或模式,看该用户喜欢看哪一种文本模式的信息,比如有的喜欢看短小精悍的极简模式文本,有的喜欢笔触细腻,容易引起共鸣的情感模式文本。

最后,根据统计的各关键词、关键词频数、及文本模式喜好,便可确定出该用户的阅读标签。具体的,本方案中确定的阅读标签并不是常规的确定用户的大致喜好,现有的给用户打标签一般仅给出大致的喜好范围,比如,某用户b的标签是名人百事通、饮食养生达人、心脑血管专家。而本方案中给用户确定的标签则更为细化,并不仅仅浮于表面的大范围,而是落实到了大范围中的具体小标签。比如,本实施例中,确定好的用户的阅读标签中,名人百事通大标签里,还细化到了其感兴趣的具体的专家名人这种小标签;另外还确定该用户喜欢的文本模式等。更佳的,还会针对具体的小标签进行频数统计,从而可以获得该用户对每类小标签(关键词)的关注度。也正是如此,从而可以根据用户的标签进行更精细化的匹配,匹配到用户更关注、更感兴趣的话题,从而进行推荐。当然,由于前面各神经网络模型生成的各话题是与选取的话题关键词相关的,如果选取的话题关键词与该用户的匹配度并不高,那么便可再从以往的历史话题帖中查找到是否与该用户标签匹配的话题,进而进行推荐。

本申请的基于用户标签的话题推荐方法的另一实施例,如图2所示,在上述实施例的基础上,所述用户的阅读标签包括:阅读关键词及其频数,以及文本模式喜好;本实施例的话题推荐方法流程具体包括:

s201,从云端的关键词标签库中,选取话题关键词;所述关键词标签库中分类存储有不同的关键词及频数;

s202,将所述话题关键词输入训练好的不同模式的文本生成神经网络模型,获得所述话题关键词的不同模式的话题;

s203,获取用户的阅读标签,

s204,获取所述用户的阅读标签中频数最高的关键词作为目标关键词;

s205,查找与所述目标关键词匹配的话题;

s206,当查找到与所述目标关键词匹配的话题时,从查找到的话题中,选取与所述用户的阅读标签中的文本模式喜好匹配的话题作为目标话题;

s207,将所述目标话题推荐给所述用户。

本实施例中,在获取到用户的阅读标签后,会根据用户的阅读标签,锁定到频数最高的关键词,该关键词便可作为目标关键词。由于频数最高,则说明该用户最为关注,那么如果推荐的话题与该目标关键词相关,则用户极有可能会参与讨论。此外,在查找到与该目标关键词匹配的话题后,各话题的文本模式(笔调或写法)也是各不相同,而不同用户对文本模式的喜好也是不同的,本实施例中,在考虑到用户可能对该目标关键词的话题感兴趣外,还进一步考虑到了该用户对文本模式的偏好,进而从查找到的与该目标关键词相关的各话题中,选取用户喜欢的文本模式的话题来作为目标话题,这样,不仅是用户对该目标关键词的内容感兴趣,还是用户喜欢的笔调写法,进而更加赢得用户的青睐,更容易触动用户,让用户更加愿意参与该话题的讨论。

上述任一实施例中,各不同模式的文本生成神经网络模型是如何训练而成的呢,具体的,其训练过程包括:

s301,从网上爬取阅读量超过预设阈值的热点话题;

s302,对采集的热点话题根据文本模式进行分类;

s303,提取所述热点话题中的关键词,并进行标注,获得训练样本;

s304,将训练样本按照文本模式的类别输入不同的神经网络模型中进行迭代训练,获得不同模式的文本生成神经网络模型。

具体的,在训练之初,我们先需要从网上爬取大量的热点话题,为什么选择热点话题呢,热点话题用户的参与度比较高,则说明普遍受到用户的喜爱,而受到用户的喜爱,除了内容本身外,与该内容的表述手法也有一定关系,同样的事情,表述手法(写法或笔调)不同,则效果也大相径庭。因此,本实施例爬取大量的热点话题则非常具有代表性和学习的意义。在获取到大量的热点话题素材后,则还需要对其进行加工,具体的,需要对这些热点话题按照文本模式进行分类,也就是根据其表述手法(笔调或写法)进行分类,此外,还要从热点话题中提取出该话题的关键词,并进行标注。最后按照类别分别输入对应类别的神经网络模型进行训练。比如,情感模式的热点话题训练样本,则输入情感模式的神经网络模型中进行训练,训练好后,则可通过该情感模式的神经网络模型,输出与输入的关键词相关的话题,且该话题的表述模式是情感模式。

本申请基于用户标签的话题推荐方法的另一实施例,如图3所示,包括:

s401,从云端的关键词标签库中,选取话题关键词;所述关键词标签库中分类存储有不同的关键词及频数;

s402,将所述话题关键词输入训练好的不同模式的文本生成神经网络模型,获得所述话题关键词的不同模式的话题;

s403,获取用户的阅读标签;

s404,根据所述用户的阅读标签,是否查找到与所述用户的阅读标签匹配的目标话题;若是,则进入步骤s408;否则,进入步骤s405;

s405,根据所述用户的阅读标签,确定目标关键词及文本模式;

s406,根据确定的文本模式,选取对应模式的文本生成神经网络模型作为目标文本生成神经网络模型;

s407,将确定的所述目标关键词输入所述目标文本生成神经网络模型,生成对应模式的目标话题;

s408,将所述目标话题推荐给所述用户。

本实施例中,对于没有找到与用户阅读标签匹配的话题(将可以与用户的阅读标签匹配上的话题称为目标话题)时,则会根据用户的阅读标签,从而确定用户感兴趣的目标关键词及喜好的文本模式;然后再选取该文本模式的文本生成神经网络模型,将确定的目标关键词输入该模型,进而输出用户感兴趣的关于该目标关键词的话题,且该话题的文本模式也是该用户所青睐的,最后将该生成的目标话题推荐给用户,由于该目标话题从内容到文本模式都是根据用户标签量身打造的,因此,用户参与该目标话题的积极性会大大提高,也提高了网络社区的活跃度。

当然,对于根据用户的阅读标签,从已有的话题中未查找到匹配的目标话题时,除了上面实施例的实施办法外,还可以采用其它的实施办法,具体的,比如,当未查找到与所述用户的阅读标签匹配的话题时,将网站内所有话题按照阅读量或者参与量进行排序,获取若干个热点话题;然后将所述若干个热点话题推荐给所述用户。该方案对于没有查找到与用户的阅读标签匹配的话题,或者无法获取到用户的阅读标签的情况,则非常适用,由于将网站上的所有话题都按照参与情况或者阅读量进行了排序,从而可以知道哪些话题是很多用户都积极参与或感兴趣的话题,那么推荐给该用户的话,相比其它普通话题(非热点话题),该用户参与该热点话题的可能性更高。

本申请基于用户标签的话题推荐方法的另一实施例,在上述任一实施例的基础上,增加了话题引申。也就是说,本申请的实施例中,除了会针对选取的目标关键词生成目标话题外,还可以根据关键词标签库中存储的关键词引申图谱,获得目标关键词的引申关键词,进而根据该引申关键词,通过文本生成神经网络模型获得对应的与引申关键词相关的话题。由于引申关键词是目标关键词的拓展延伸、相关联,因此,若用户对该目标关键词的话题感兴趣的话,则也极有可能对该目标关键词的引申话题也感兴趣。因此,在向用户推荐话题时,除了推荐直接的目标关键词的话题外,还可以推荐与该目标关键词相关的引申关键词的话题,让用户可参与多个不同的感兴趣的话题。

具体的,本实施例有如下几种实现形式:

(1)若根据所述用户的阅读标签查找到与所述用户的阅读标签匹配的话题时,则根据查找到的话题,提取该话题的目标关键词;然后再根据关键词引申图谱,获取该目标关键词的引申关键词;获取到引申关键词后,则再根据该引申关键词查找是否有与该引申关键词相关的话题。此时,又分为以下几种情况:

1查找到已有话题中存在与该引申关键词相关的话题,进一步判断查找到的该引申关键词的话题的文本模式是否是用户阅读标签中喜好的文本模式;若是,则将该查找到的引申关键词的话题与之前根据用户阅读标签查找匹配的话题一起作为目标话题推荐给该用户。

进一步地,若查找到的该引申关键词的话题的文本模式不是用户阅读标签中喜好的文本模式,则可将该引申关键词输入对应的文本模式(根据用户的阅读标签确定)的文本生成神经网络模型,进而生成用户喜好的文本模式的、关于该引申关键词的话题,最后再将该生成的话题与之前根据用户阅读标签查找匹配的话题一起作为目标话题推荐给该用户。

当然,若查找到的该引申关键词的话题的文本模式不是用户阅读标签中喜好的文本模式,则也可放弃引申关键词的话题推荐,只将之前根据用户阅读标签查找匹配的话题作为目标话题推荐给该用户。

2若从已有话题中未查找到与该引申关键词相关的话题,则可将该引申关键词输入对应的文本模式(根据用户的阅读标签确定)的文本生成神经网络模型,进而生成用户喜好的文本模式的、关于该引申关键词的话题,最后再将该生成的话题与之前根据用户阅读标签查找匹配的话题一起作为目标话题推荐给该用户。

(2)若根据所述用户的阅读标签未查找到与所述用户的阅读标签匹配的话题时,则根据用户的阅读标签,获取用户感兴趣的目标关键词及喜好的文本模式;根据该喜好的文本模式选取对应模式的文本生成神经网络模型;再根据关键词引申图谱获取该目标关键词的引申关键词;最后分别将该目标关键词、引申关键词输入选取的对应模式的文本生成神经网络模型,从而获得目标关键词的话题、以及引申关键词的话题;且生成的这些话题的文本模式也是用户喜欢的(符合用户的阅读标签),最后将这些生成的话题一起作为目标话题推荐给用户。

本实施例基于关键词引申图谱,获得目标关键词的引申关键词,从而可获得更多的推荐话题,且该引申关键词由于与目标关键词相关联,属于目标关键词的引申拓展,因而其相关的话题也容易引起用户的注意和兴趣,在保证推荐的精准性前提下,拓宽话题推荐的范围。

此外,本实施例中的关键词引申图谱,可以显示出各目标关键词的引申拓展实体;比如,目标关键词为“剖腹产”则其引申关键词可以为“产后修复”、“祛疤药”等。

本申请基于用户标签的话题推荐系统的另一实施例,在上述任一方法实施例的基础上,增加了相似话题处理步骤,具体的,本实施例的话题推荐方法包括如下步骤:

s501,从云端的关键词标签库中,选取话题关键词;所述关键词标签库中分类存储有不同的关键词及频数;

s502,将所述话题关键词输入训练好的不同模式的文本生成神经网络模型,获得所述话题关键词的不同模式的话题;

s503,从已发布的话题中,查找与所述关键词相关的话题作为备选话题;

s504,从通过神经网络模型获取的话题中,筛选出与所述备选话题相似度达预设阈值的话题,并进行删除处理;

s505,获取用户的阅读标签,

s506,根据所述用户的阅读标签查找与所述用户的阅读标签匹配的话题,并将其推荐给所述用户。

本实施例中,在通过不同模式的文本生成神经网络模型获得话题关键词的各不同模式的话题后,再将生成的各话题与已有的各话题进行相似度匹配;若存在相似程度比较大(相似度达到预设阈值)的话题,则会将该通过神经网络模型获得的相似度比较大的话题进行删除操作,只保留相似度不高于预设阈值的话题。具体的,比如从关键词标签库中,筛选出话题关键词a,然后再将话题关键词a分别输入不同模式的文本生成神经网络模型x1、x2、x3;从而得到对应模式的关于话题关键词a的话题:a1、a2、a3;若之前已发布的话题中,关于话题关键词a的发题还有:a′1、a′2、a′3、a′4、a′5、a′6;则会分别将话题a1、a2、a3与话题a′1、a′2、a′3、a′4、a′5、a′6进行相似度比较,若比较后得出,仅话题a1与话题a′1相似度达到预设阈值,则将话题a1进行删除,保留下来的关于话题关键词a的话题:a2、a3、a′2、a′3、a′4、a′5、a′6;最后,再根据用户的阅读标签,从话题a2、a3、a′2、a′3、a′4、a′5、a′6中查找与该用户的阅读标签匹配的话题,推荐给该用户。

基于相同的技术构思,本申请还公开了一种基于用户标签的话题推荐系统,该系统可采用本申请上述任一话题推荐方法实施的方法来向用户推荐话题。具体的,本申请的基于用户标签的话题推荐系统的一个实施例,如图4所示,包括:

关键词标签库10,用于分类存储不同的关键词及频数;所述关键词标签库10设立于云端;具体的,存储在云端的关键词标签库10中按照类别存储了不同的关键词及该关键词的频数。频数即该关键词的统计次数。

关键词选取模块20,用于从云端的关键词标签库10中,选取话题关键词;具体的,可以根据其存储的各关键词的频数来选取话题关键词,频数高的关键词则说明网络社区中对该关键词的关注度比较高,那么关于该关键词的话题也最有可能成为热门话题。当然,除了可以根据关键词的频数来选取话题关键词外,也可以根据频数增长率来选取话题关键词(根据关键词标签库10中存储的历史时间点的关键词频数,可计算出预设时间段内的关键词的频数增长率)。

话题生成模块30,用于将所述话题关键词输入训练好的不同模式的文本生成神经网络模型,获得所述话题关键词的不同模式的话题;这里的模式是指文体模式或者说是写法,同一关键词,同一件事,采用不同的写法获得的效果也是不一样的。模式类型可根据需求定义。输入同样的关键词,不同模式的文本生成神经网络则会生成不同模式(不同写法或不同笔调)的话题。

标签获取模块40,用于获取用户的阅读标签;比如,可根据用户的历史阅读信息、用户的注册信息等确定用户的阅读标签。

话题推荐模块50,用于根据所述用户的阅读标签查找与所述用户的阅读标签匹配的话题,并将其推荐给所述用户。具体的,确定好用户的阅读标签后,便可根据该阅读标签从各话题中进行查找匹配,最后将匹配到的话题推荐给用户,引导用户参与话题讨论。而进行匹配的话题,一种是仅限于从通过各文本生成神经网络模型生成的各话题中进行匹配;另一种实现方式则是除了本实施例中根据选取的话题关键词,通过各文本生成神经网络模型生成的话题外,还可以是之前已发布的历史话题。前者的匹配工作量小;后者的匹配成功的可能性更高。当然,还可以是先从生成的各话题中进行匹配,若匹配不上,则再从历史话题中进行匹配。

本实施例中,先通过关键词选取模块20从关键词标签库10中选取出话题关键词,然后话题生成模块30利用不同模式的文本生成神经网络模型生成不同类型的话题,然后再通过标签获取模块40获取用户的阅读标签,话题推荐模块50根据用户的阅读标签去进行匹配,选取用户可能感兴趣的,喜爱的文笔模式的话题进行推荐,从而大大提高了用户参与该话题讨论的可能性,进而提升了网络社区的活跃度。

本申请系统的另一实施例,在上述系统实施例的基础上,如图5所示,所述标签获取模块40包括:

历史数据采集子模块41,用于获取所述用户的搜索、阅读的历史数据信息;

提取统计子模块42,用于从所述历史数据信息中提取关键词,并统计各关键词的频数;

数据分析子模块43,用于根据所述历史数据信息获取所述用户的文本模式喜好;并根据统计的各关键词、频数、及所述文本模式喜好,确定所述用户的阅读标签。

较佳的,所述用户的阅读标签包括:阅读关键词及其频数,以及文本模式喜好;所述话题推荐模块50具体包括:

目标获取子模块51,用于获取所述用户的阅读标签中频数最高的关键词作为目标关键词;

匹配查找子模块52,用于查找与所述目标关键词匹配的话题;

话题选取子模块53,用于当查找到与所述目标关键词匹配的话题时,从查找到的话题中,选取与所述用户的阅读标签中的文本模式喜好匹配的话题作为目标话题;

信息推荐子模块54,用于将所述目标话题推荐给所述用户。

本实施例对上述系统实施例中的话题推荐模块50进行了细化,具体的,目标获取子模块51在获取到用户的阅读标签后,会根据用户的阅读标签,锁定到频数最高的关键词,该关键词便可作为目标关键词。由于频数最高,则说明该用户最为关注,那么如果推荐的话题与该目标关键词相关,则用户极有可能会参与讨论。此外,匹配查找子模块52在查找到与该目标关键词匹配的话题,由于各话题的文本模式(笔调或写法)也是各不相同,而不同用户对文本模式的喜好也是不同的,本实施例中,在考虑到用户可能对该目标关键词的话题感兴趣外,还进一步考虑到了该用户对文本模式的偏好,话题选取子模块53进而从查找到的与该目标关键词相关的各话题中,选取用户喜欢的文本模式的话题来作为目标话题,最后通过信息推荐子模块54进行推荐。这样,不仅是用户对该目标关键词的内容感兴趣,还是用户喜欢的笔调写法,进而更加赢得用户的青睐,更容易触动用户,让用户更加愿意参与该话题的讨论。

上述实施例阐述了在查找到与所述目标关键词匹配的话题时后续的话题选取与推荐操作,而如果未查找到与所述目标关键词匹配的话题又该如何操作呢?下面这一实施例就具体针对未查找到与所述目标关键词匹配的话题时的处理步骤进行了详细说明。具体的,本实施例的话题推荐系统在上一实施例的基础上,所述话题推荐模块50还包括:模型选取子模块55,其中:

所述目标获取子模块51,还用于当所述匹配查找子模块52未查找到与所述目标关键词匹配的话题时,根据所述用户的阅读标签,确定目标关键词及文本模式;

所述模型选取子模块55,用于根据确定的文本模式,选取对应模式的文本生成神经网络模型作为目标文本生成神经网络模型;并通过所述话题生成模块30将确定的所述目标关键词输入所述目标文本生成神经网络模型,生成对应模式的目标话题;

所述信息推荐子模块54,还用于将所述目标话题推荐给所述用户。

本实施例中,对于没有找到与用户阅读标签匹配的话题(将可以与用户的阅读标签匹配上的话题称为目标话题)时,则会根据用户的阅读标签,从而确定用户感兴趣的目标关键词及喜好的文本模式;然后再选取该文本模式的文本生成神经网络模型,将确定的目标关键词输入该模型,进而输出用户感兴趣的关于该目标关键词的话题,且该话题的文本模式也是该用户所青睐的,最后将该生成的目标话题推荐给用户,由于该目标话题从内容到文本模式都是根据用户标签量身打造的,因此,用户参与该目标话题的积极性会大大提高,也提高了网络社区的活跃度。

当然,对于根据用户的阅读标签,从已有的话题中未查找到匹配的目标话题时,除了上面实施例的实施办法外,还可以采用其它的实施办法,比如,本申请系统的另一实施例,如图6所示,在上述任一实施例的基础上,所述基于用户标签的话题推荐系统,还包括:

话题排序模块70,用于当未查找到与所述用户的阅读标签匹配的话题时,将网站内所有话题按照阅读量或者参与量进行排序,获得若干个热点话题;

所述话题推荐模块70,还用于将所述若干个热点话题推荐给所述用户。

本实施例中,当未查找到与所述用户的阅读标签匹配的话题时,将网站内所有话题按照阅读量或者参与量进行排序,获取若干个热点话题;然后将所述若干个热点话题推荐给所述用户。该方案对于没有查找到与用户的阅读标签匹配的话题,或者无法获取到用户的阅读标签的情况,则非常适用,由于将网站上的所有话题都按照参与情况或者阅读量进行了排序,从而可以知道哪些话题是很多用户都积极参与或感兴趣的话题,那么推荐给该用户的话,相比其它普通话题(非热点话题),该用户参与该热点话题的可能性更高。

本申请系统的另一实施例,在上述任一实施例的基础上,所述基于用户标签的话题推荐系统还包括:

模型训练模块60,用于训练不同模式的文本生成神经网络模型;所述模型训练模块60具体包括:

信息爬取子模块61,用于从网上爬取阅读量超过预设阈值的热点话题;

信息处理子模块62,用于对采集的热点话题根据文本模式进行分类;并提取所述热点话题中的关键词进行标注,获得训练样本;

迭代训练子模块63,用于将训练样本按照文本模式的类别输入不同的神经网络模型中进行迭代训练,获得不同模式的文本生成神经网络模型。

具体的,本实施例除了上述任一系统实施例的技术特征外,重点阐述了系统中的模型训练模块,通过该模型训练模块训练出各不同模式的文本生成神经网络模型。

本申请系统的最后一个实施例,如图所示,在上述任一系统实施例的基础上,所述关键词标签库10中还存储有关键词引申图谱;所述话题推荐模块50还包括:关联查找子模块56;其中:

所述关联查找子模块56,用于根据所述关键词引申图谱,查找所述目标关键词的引申关键词;

所述匹配查找子模块52,还用于查找与所述目标关键词或所述引申关键词匹配的话题;

所述话题选取子模块53,还用于当查找到与所述目标关键词或所述引申关键词匹配的话题时,从查找到的话题中,选取与所述用户的阅读标签中的文本模式喜好匹配的话题作为目标话题;最后通过信息推荐子模块54将该目标话题推荐给用户。

本申请的实施例中,除了会针对选取的目标关键词生成目标话题外,还可以根据关键词标签库10中存储的关键词引申图谱,获得目标关键词的引申关键词,进而根据该引申关键词,通过文本生成神经网络模型获得对应的与引申关键词相关的话题。由于引申关键词是目标关键词的拓展延伸、相关联,因此,若用户对该目标关键词的话题感兴趣的话,则也极有可能对该目标关键词的引申话题也感兴趣。因此,在向用户推荐话题时,除了推荐直接的目标关键词的话题外,还可以推荐与该目标关键词相关的引申关键词的话题,让用户可参与多个不同的感兴趣的话题。

本申请的系统实施例与方法实施例对应,本申请中的方法实施例的技术细节同样适用于本申请的方法实施例,为减少重复,不再赘述。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1