信息推荐方法和装置与流程

文档序号:15077093发布日期:2018-08-01 02:07阅读:153来源:国知局

本发明涉及数据处理领域,特别涉及一种信息推荐方法和装置。



背景技术:

大数据时代,购物网站基于用户历史点击浏览、历史搜索等网站的内部数据对商品属性进行重要性排序,从而挖掘用户决策树,以为用户推荐商品信息。从而,可以缩短用户所关注商品的购物路径,优化了购物体验。

然而,仅基于网站的内部数据进行信息推荐会使推荐结果局限化,无法快速、准确地响应用户的新需求。



技术实现要素:

本发明实施例所要解决的一个技术问题是:如何提高信息推荐的准确度。

根据本发明实施例的第一个方面,提供一种信息推荐方法,包括:获取目标舆情实体词;根据舆情实体词与商品之间的映射关系,获取目标舆情实体词对应的商品;将目标舆情实体词对应的商品的信息推荐给用户。

在一个实施例中,还包括:从舆情数据源中获取舆情实体词;搜索与舆情实体词匹配的商品标签;搜索具有商品标签的商品;将舆情实体词与搜索到的商品进行关联映射,并保存舆情实体词与搜索到的商品之间的映射关系。

在一个实施例中,从舆情数据源中获取舆情实体词包括:从舆情数据源中获得舆情文本数据;将舆情文本数据进行分词处理,获得若干舆情分词;对舆情分词进行分类;将预设类别中的舆情分词作为舆情实体词。

在一个实施例中,搜索具有商品标签的商品包括:在舆情实体词所属的类别中,搜索具有商品标签的商品。

在一个实施例中,获取目标舆情实体词包括:获取在预设时间内发布的舆情数据;从在预设时间内发布的舆情数据中提取目标舆情实体词。

在一个实施例中,将目标舆情实体词对应的商品的信息推荐给用户包括:将目标舆情实体词对应的商品的信息在搜索结果、分类结果、推送消息、网站首页、专题页面中的至少一处推荐给用户。

在一个实施例中,将目标舆情实体词对应的商品的信息推荐给用户包括:将目标舆情实体词对应的商品中,商品统计数据符合预设条件的商品的信息推荐给用户,或者将商品统计数据符合预设条件的商品的信息以及目标舆情实体词对应的商品的信息推荐给用户。

根据本发明实施例的第二个方面,提供一种信息推荐装置,包括:目标舆情实体词获取模块,用于获取目标舆情实体词;商品获取模块,用于根据舆情实体词与商品之间的映射关系,获取目标舆情实体词对应的商品;商品信息推荐模块,用于将目标舆情实体词对应的商品的信息推荐给用户。

在一个实施例中,还包括:舆情实体词获取模块,用于从舆情数据源中获取舆情实体词;商品标签搜索模块,用于搜索与舆情实体词匹配的商品标签;商品搜索模块,用于搜索具有商品标签的商品;商品映射模块,用于将舆情实体词与搜索到的商品进行关联映射,并保存舆情实体词与搜索到的商品之间的映射关系。

在一个实施例中,舆情实体词获取模块包括:舆情文本数据获取单元,用于从舆情数据源中获得舆情文本数据;分词单元,用于将舆情文本数据进行分词处理,获得若干舆情分词;舆情分词分类单元,用于对舆情分词进行分类;舆情实体词确定单元,用于将预设类别中的舆情分词作为舆情实体词。

在一个实施例中,商品搜索模块进一步用于在舆情实体词所属的类别中,搜索具有商品标签的商品。

在一个实施例中,目标舆情实体词获取模块包括:时效舆情数据获取单元,用于获取在预设时间内发布的舆情数据;目标舆情实体词提取模块,用于从在预设时间内发布的舆情数据中提取目标舆情实体词。

在一个实施例中,商品信息推荐模块进一步用于将目标舆情实体词对应的商品的信息在搜索结果、分类结果、推送消息、网站首页、专题页面中的至少一处推荐给用户。

在一个实施例中,商品信息推荐模块进一步用于将目标舆情实体词对应的商品中,商品统计数据符合预设条件的商品的信息推荐给用户,或者将商品统计数据符合预设条件的商品的信息以及目标舆情实体词对应的商品的信息推荐给用户。

根据本发明实施例的第三个方面,提供一种信息推荐装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器中的指令,执行前述任意一种信息推荐方法。

根据本发明实施例的第四个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述任意一种信息推荐方法。

本发明通过在推荐商品信息时参考舆情信息,根据舆情实体词与商品之间的映射关系,将目标舆情实体词对应的商品的信息推荐给用户,使推荐结果能够快速地响应当前的关注热点,满足用户的购买意图,提高了信息推荐的准确性。

通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明信息推荐方法的一个实施例的流程图。

图2为本发明舆情实体词与商品之间的映射关系建立方法的一个实施例的流程图。

图3为本发明信息推荐装置的一个实施例的结构图。

图4为本发明信息推荐装置的另一个实施例的结构图。

图5为本发明信息推荐装置的又一个实施例的结构图。

图6为本发明信息推荐装置的再一个实施例的结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。

在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

图1为本发明信息推荐方法的一个实施例的流程图。如图1所示,该实施例的信息推荐方法包括:

步骤s102,获取目标舆情实体词。

目标舆情实体词是指能够反映当前舆情状况的实体词,可以从预设的舆情数据源中提取目标舆情实体词。例如,可以从天气预报中提取“雾霾”、“降温”等词语作为目标实体词,也可以从时尚新闻中获取当季流行款式作为目标实体词。

获取目标舆情实体词的一个实施例为:获取在预设时间内发布的舆情数据;从在预设时间内发布的舆情数据中提取目标舆情实体词。从而,目标舆情实体词可以反映最近一段时间的热点。

其中,可以在预设的舆情数据源中获取在预设时间内发布的、并且位于预设位置的文本数据。例如,当舆情数据源为新闻时,可以仅获取包括了核心内容的标题部分作为舆情数据,在提取时,可以根据html(hypertextmarkuplanguage,超文本标记语言)标签类型或者标签的类、标识(id)来识别哪些是标题部分的文本;又例如,当舆情数据源为天气应用中的天气预报时,可以获取该应用的数据接口,并根据该接口返回的数据的数据格式,确定返回的数据中的哪些字段为温度、哪些字段为空气质量,以便从预设的字段中提取舆情数据。

在获得了舆情数据后,如果舆情数据本身即为词语,则可以直接将其作为目标舆情实体词;如果舆情数据为一段文本,则可以采用自然语言处理技术提取其中的目标舆情实体词。一个实施例为,可以首先对舆情数据进行分词,并根据预先建立的舆情实体词词表查找分词结果中的舆情实体词,并将其作为目标舆情实体词;另一个实施例为,可以首先对舆情数据进行分词,再将具有预设词性的词语作为目标舆情实体词,例如名词和形容词往往和商品的关系更紧密,可以提取“冷”、“干燥”、“风衣”等名词和形容词作为目标舆情实体词;又一个实施例为,可以预先训练目标舆情实体词提取模型,目标舆情实体词提取模型的训练数据为舆情数据文本,其中包括了舆情数据中的若干词语,并将目标舆情实体词进行标注,在预测时,可以输入分词后的待测舆情数据文本,目标舆情实体词提取模型可以根据之前的训练参数输出待测舆情数据文本中的目标舆情实体词。

此外,在获取了目标舆情实体词之后,还可以判断该目标舆情实体词是否为情感正向的实体词,并且仅保留情感正向的目标舆情实体词。其中,情感正向的实体词可以指实体词本身为情感正向的,例如“冠军”、“金牌”,也可以指与该实体词具有关联性的词语为情感正向的,例如舆情数据中描述了a手机充电快、续航能力强,则当提取了“a手机”作为目标舆情实体词后,通过“充电快”、“续航能力强”等情感正向的关联描述,能够确定舆情数据给予了a手机正面评价,因此可以将“a手机”保留为目标舆情实体词。从而,能够为用户推荐优质的商品信息。

确定情感正向的实体词可以采用情感正向词表匹配、建立情感正向词语识别模型等方法,这里不再赘述。

根据需要,本领域技术人员还可以采用其他方式获取目标舆情实体词,这里不再赘述。

步骤s104,根据舆情实体词与商品之间的映射关系,获取所述目标舆情实体词对应的商品。

舆情实体词与商品之间的映射关系是预先建立的,该映射关系可以保存在数据库中。

舆情实体词对应的商品可以是从名称上关联的商品,例如当舆情实体词为“篮球”时,对应的商品可以为篮球、篮球鞋、篮球衣、篮球票等等;舆情实体词对应的商品还可以是从功能上关联的商品,例如当舆情实体词为“干燥”时,对应的商品可以为加湿器、湿度计等等,商品的功能信息可以从商家提供的商品功能参数或者商品描述数据中获取。

根据需要,本领域技术人员还可以采用其他方式对舆情实体词与商品进行关联映射,后文将进一步对另一个实施例进行阐述。

步骤s106,将所述目标舆情实体词对应的商品的信息推荐给用户。

商品的信息是指商品的购买链接、商品介绍等等与商品相关的信息。可以将目标舆情实体词对应的商品中部分商品的信息推荐给用户,例如可以按照预设指标对商品进行排序,并将排序结果中排名靠前的预设比例的商品的信息推荐给用户。

其中,可以将目标舆情实体词对应的商品的信息在搜索结果、分类结果、推送消息、网站首页、专题页面中的至少一处推荐给用户。从而,可以将目标舆情实体词对应的商品的信息在重要的区域展示给用户。例如,当目标舆情实体词为“雾霾”,即当前空气质量较差,可以直接在网站首页进行展示,从而当用户浏览网站或者网站对应的应用时,可以快速地看到“雾霾”对应的空气净化器、过滤口罩等产品,减少了用户进行搜索查找的时间,提高了用户体验。

在进行信息推荐时,除了根据舆情情况进行推荐以外,还可以结合网站或应用的固有数据进行综合推荐。

一个实施例为,将目标舆情实体词对应的商品中,商品统计数据符合预设条件的商品的信息推荐给用户。例如,可以将目标舆情实体词对应的商品中,销量高、评价分数高的商品优先推荐给用户,还可以将评价分数高但点击率低的商品优先推荐给用户,以提升优质商品的点击概率。通过采用这种方法,可以结合网站的内部数据和网站外部的舆情数据进行综合推荐,既能够满足网站自身的业务需求,也能够响应外部变化。

另一个实施例为,将商品统计数据符合预设条件的商品的信息以及目标舆情实体词对应的商品的信息推荐给用户。通过将根据网站的内部数据进行推荐的商品以及根据网站外部的舆情数据进行推荐的商品进行并列展示,可以同时考虑到关注热点的用户和不关注热点的用户的需求。

通过在推荐商品信息时参考舆情信息,根据舆情实体词与商品之间的映射关系,将目标舆情实体词对应的商品的信息推荐给用户,使推荐结果能够快速地响应当前的关注热点,满足用户的购买意图,提高了信息推荐的准确性。

建立舆情实体词与商品之间的映射关系时可以参考步骤s104的方法,也可以采用其他方法。下面参考图2介绍本发明一个实施例的舆情实体词与商品之间的映射关系建立方法。

图2为本发明舆情实体词与商品之间的映射关系建立方法的一个实施例的流程图。如图2所示,该实施例的映射关系建立方法包括:

步骤s202,从舆情数据源中获取舆情实体词。

该舆情数据源可以是在进行信息推荐的过程中获取目标舆情实体词时采用的数据源,也可以是范围更大的数据源或者不同的数据源。

在一个实施例中,获取舆情实体词的具体实施方式可以参考步骤s102。

由于在建立舆情实体词与商品之间的映射关系阶段,目的为获取可能经常出现的舆情实体词,而不一定是当前重点关注的舆情实体词,因此可以不对提取舆情实体词所采用的舆情数据进行时效性的要求。

当然,也可以仅获取预设时间内发布的舆情数据并提取舆情实体词,以发现更多的新词,使商品信息推荐的结果更符合外部信息的变化,提高推荐的准确性。

在另一个实施例中,可以采用以下方法获取舆情实体词:首先,从舆情数据源中获得舆情文本数据;然后,将舆情文本数据进行分词处理,获得若干舆情分词;最后,对舆情分词进行分类,将预设类别中的舆情分词作为舆情实体词。

例如,舆情数据源中包括新闻数据源,新闻数据源中包括各个类别的信息,而某购物网站往往较为关注天气、时尚、体育方面的信息,而社会新闻、政策类新闻与该购物网站销售的商品的关联性较弱。因此,可以通过对舆情分词进行分类,并筛除属于非关注类别的舆情分词,可以使筛选出的舆情实体词更具有代表性。

在对舆情分词进行分类时,例如可以首先计算各个舆情分词的词向量,并根据各个舆情分词的词向量、采用聚类算法对舆情分词进行聚类,其中,可以根据舆情分词在舆情数据中的上下文信息或者根据预先设定的舆情分词的词向量表等方式计算各个舆情分词的词向量。

根据需要,本领域技术人员还可以采用其他分类方法,这里不再赘述。

步骤s204,搜索与舆情实体词匹配的商品标签。

商品标签是对商品的描述信息,每个商品的商品标签可以有多个。例如,空气净化器的标签可以包括电器、空气、雾霾、家用、除菌、加湿等等。

在搜索与舆情实体词匹配的商品标签时,可以采用精确匹配的方法,即仅当舆情实体词和商品标签完全相同时,才认为二者是匹配的;还可以采用模糊匹配的方式,即舆情实体词和商品标签之间的相似度大于预设的阈值时,二者是匹配的,例如“化妆”和“美妆”、“球服”和“球衣”等等。本领域技术人员可以根据需要进行选择。

步骤s206,搜索具有商品标签的商品。

当确定了与舆情实体词匹配的商品标签后,可以进一步确认哪些商品具有这些商品标签。

此外,还可以借助商品画像系统。商品画像系统与用户画像系统类似,商品画像为每个商品提供了若干描述信息,即商品标签。因此,可以在商品画像系统中直接搜索舆情实体词对应的商品。

其中,可以在舆情实体词所属的类别中,搜索具有商品标签的商品。例如,“钢琴”一词可能代表的是钢琴乐器、钢琴唱片或者钢琴演出票,而上述三种商品属于完全不同的三个类别。而舆情实体词“钢琴”在提取时的舆情数据为某知名钢琴家来华演出的消息,此时“钢琴”所属的类别应为演出门票。因此,可以仅在舆情实体词所属的类别中搜索具有商品标签的商品,使舆情实体词与商品之间的映射关系更准确。

当然,根据需要,每个舆情实体词可以仅属于一个类别,也可以属于多个类别。

步骤s208,将舆情实体词与搜索到的商品进行关联映射,并保存舆情实体词与搜索到的商品之间的映射关系。

通过采用上述方法,能够借助商品标签精确地对舆情实体词与商品进行关联映射,进而可以提高信息推荐的准确性。

下面参考图3介绍本发明一个实施例的信息推荐装置。

图3为本发明信息推荐装置的一个实施例的结构图。如图3所示,该实施例的信息推荐装置包括:目标舆情实体词获取模块31,用于获取目标舆情实体词;商品获取模块32,用于根据舆情实体词与商品之间的映射关系,获取目标舆情实体词对应的商品;商品信息推荐模块33,用于将目标舆情实体词对应的商品的信息推荐给用户。

其中,商品信息推荐模块33可以进一步用于将目标舆情实体词对应的商品的信息在搜索结果、分类结果、推送消息、网站首页、专题页面中的至少一处推荐给用户。

此外,商品信息推荐模块33也可以进一步用于将目标舆情实体词对应的商品中,商品统计数据符合预设条件的商品的信息推荐给用户,或者将商品统计数据符合预设条件的商品的信息以及目标舆情实体词对应的商品的信息推荐给用户。

下面参考图4介绍本发明另一个实施例的信息推荐装置。

图4为本发明信息推荐装置的另一个实施例的结构图。如图4所示,该实施例的信息推荐装置还包括:舆情实体词获取模块44,用于从舆情数据源中获取舆情实体词;商品标签搜索模块45,用于搜索与舆情实体词匹配的商品标签;商品搜索模块46,用于搜索具有商品标签的商品;商品映射模块47,用于将舆情实体词与搜索到的商品进行关联映射,并保存舆情实体词与搜索到的商品之间的映射关系。

其中,舆情实体词获取模块44可以包括:舆情文本数据获取单元441,用于从舆情数据源中获得舆情文本数据;分词单元442,用于将舆情文本数据进行分词处理,获得若干舆情分词;舆情分词分类单元443,用于对舆情分词进行分类;舆情实体词确定单元444,用于将预设类别中的舆情分词作为舆情实体词。

其中,商品搜索模块46可以进一步用于在舆情实体词所属的类别中,搜索具有商品标签的商品。

此外,目标舆情实体词获取模块31还可以包括:时效舆情数据获取单元411,用于获取在预设时间内发布的舆情数据;目标舆情实体词提取模块412,用于从在预设时间内发布的舆情数据中提取目标舆情实体词。

图5为本发明信息推荐装置的又一个实施例的结构图。如图5所示,该实施例的装置500包括:存储器510以及耦接至该存储器510的处理器520,处理器520被配置为基于存储在存储器510中的指令,执行前述任意一个实施例中的信息推荐方法。

其中,存储器510例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(bootloader)以及其他程序等。

图6为本发明信息推荐装置的再一个实施例的结构图。如图6所示,该实施例的装置500包括:存储器510以及处理器520,还可以包括输入输出接口630、网络接口640、存储接口650等。这些接口630,640,650以及存储器510和处理器520之间例如可以通过总线660连接。其中,输入输出接口630为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口640为各种联网设备提供连接接口。存储接口650为sd卡、u盘等外置存储设备提供连接接口。

此外,本发明还可以提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述任意一种信息推荐方法。

本领域内的技术人员应当明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1