一种信息推荐方法、设备及存储介质与流程

文档序号:20685178发布日期:2020-05-08 18:46阅读:120来源:国知局
一种信息推荐方法、设备及存储介质与流程

本发明涉及数据处理技术领域,特别是指一种信息推荐方法、设备及存储介质。



背景技术:

随着科技的发展,人们接触到越来越多的数据,并且需要从这些数据中甄别出自身感兴趣的数据,这需要耗费很多精力。比如,互联网用户在互联网上购买物品时,需要浏览、比较各种物品;再比如,用户在互联网上阅读文章时,只能根据文章标题,选择自身可能感兴趣的文章;再比如,用户在互联网上收听音乐时,只能根据音乐名称,选择自身可能感兴趣的音乐。

目前,一些方案中,能够对用户进行信息推荐,但是这种推荐方案,大多是随机选择推荐信息,推荐的准确性较差。



技术实现要素:

有鉴于此,本发明的目的在于提出一种信息推荐方法、设备及存储介质,以提高推荐准确性。

基于上述目的,本发明实施例提供了一种信息推荐方法,包括:

在检测到用户行为的情况下,确定所述用户行为指向的对象,作为待处理对象;

基于建立的对象相似度关系,确定所述待处理对象的相似对象;

推荐所述相似对象;

其中,建立所述对象相似度关系的过程包括:

获取多个样本对象的标签;

对所述标签进行聚类,得到多个标签类;

针对每个样本对象,计算该样本对象的标签与所述多个标签类之间的相似度,得到该样本对象对应的相似度集合;

根据每个样本对象对应的相似度集合,建立各样本对象之间的相似度关系。

可选的,所述标签为词向量;

所述获取多个样本对象的标签,包括:

获取多个样本对象的文本数据;

对所述文本数据进行分词处理,得到多个词语;

分别将每个词语映射至词向量空间,得到词向量。

可选的,所述对所述文本数据进行分词处理,得到多个词语,包括:

基于预先生成的前缀词典,确定所述文本数据中的候选词,并生成所述候选词构成的有向无环图;

基于所述前缀词典中前缀词的出现频率,计算所述有向无环图中各路径的概率;

基于所述各路径的概率,确定分词得到的词语。

可选的,所述分别将每个词语映射至词向量空间,得到词向量,包括:

分别将每个词语输入至语义分析模型,得到所述语义分析模型输出的携带语义信息的词向量。

可选的,所述对所述标签进行聚类,得到多个标签类,包括:

遍历每个标签,判断聚类特征树中是否存在与该标签的距离小于预设距离阈值的节点;如果存在,确定该标签属于所述节点,如果不存在,基于该标签在所述聚类特征树中建立新的节点;

遍历所述聚类特征树中的每个节点,判断该节点包括的标签数量是否大于预设数量阈值;如果大于,将该节点分为两个节点;

针对每个节点,将该节点包括的标签划分为一个标签类。

可选的,所述计算该样本对象的标签与所述多个标签类之间的相似度,包括:

针对每个标签类,计算该样本对象的每个标签与该标签类的质心之间的距离,作为该样本对象与该标签类之间的相似度。

基于上述目的,本发明实施例还提供了一种信息推荐方法,包括:

在检测到第一用户的行为的情况下,基于建立的用户对对象的喜好度关系,确定所述第一用户喜好的对象;

推荐所述第一用户喜好的对象;

其中,建立所述用户对对象的喜好度关系的过程包括:

获取多个样本用户分别对应的行为对象的标签;

对所述标签进行聚类,得到多个标签类;

针对每个样本用户,根据该样本用户对应的行为对象的标签,统计该样本用户对每个标签类的喜好度;根据所述喜好度、以及获取到的行为对象的标签,建立该样本用户对行为对象的喜好度关系。

可选的,所述标签为词向量;

所述获取多个样本用户分别对应的行为对象的标签,包括:

获取多个样本用户分别对应的行为对象的文本数据;

对所述文本数据进行分词处理,得到多个词语;

分别将每个词语映射至词向量空间,得到词向量。

可选的,所述对所述文本数据进行分词处理,得到多个词语,包括:

基于预先生成的前缀词典,确定所述文本数据中的候选词,并生成所述候选词构成的有向无环图;

基于所述前缀词典中前缀词的出现频率,计算所述有向无环图中各路径的概率;

基于所述各路径的概率,确定分词得到的词语。

可选的,所述分别将每个词语映射至词向量空间,得到词向量,包括:

分别将每个词输入至语义分析模型,得到所述语义分析模型输出的携带语义信息的词向量。

可选的,所述对所述标签进行聚类,得到多个标签类,包括:

遍历每个标签,判断聚类特征树中是否存在与该标签的距离小于预设距离阈值的节点;如果存在,确定该标签属于所述节点,如果不存在,基于该标签在所述聚类特征树中建立新的节点;

遍历所述聚类特征树中的每个节点,判断该节点包括的标签数量是否大于预设数量阈值;如果大于,将该节点分为两个节点;

针对每个节点,将该节点包括的标签划分为一个标签类。

可选的,所述获取多个样本用户分别对应的行为对象的标签,包括:

获取用户行为数据,所述用户行为数据中包括样本用户的标识、行为对象的标识、行为对象的标签之间的对应关系;

所述根据该样本用户对应的行为对象的标签,统计该样本用户对每个标签类的喜好度,包括:

将该样本用户对应的行为对象的标签分别划分至其所属的标签类;

针对每个标签类,统计该样本用户对应的行为对象的标签被划分至该标签类的次数;根据所述次数确定该样本用户与该标签类的喜好度关系。

可选的,所述用户行为数据中包括样本用户的标识、行为对象的标识、行为类型、行为对象的标签之间的对应关系;

所述统计该样本用户对应的行为对象的标签被划分至该标签类的次数,包括:

分别统计该样本用户的各行为类型对应的行为对象的标签被划分至该标签类的次数;

所述根据所述次数确定该样本用户与该标签类的喜好度关系,包括:

根据行为类型对应的权重,对所述次数进行加权处理;

根据加权后的次数,确定该样本用户与该标签类的喜好度关系。

基于上述目的,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一种信息推荐方法。

基于上述目的,本发明实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述任一种信息推荐方法。

应用本发明所示实施例,先建立对象相似度关系:获取多个样本对象的标签;对标签进行聚类,得到多个标签类;针对每个样本对象,计算该样本对象的标签与多个标签类之间的相似度,得到该样本对象对应的相似度集合;根据每个样本对象对应的相似度集合,建立各样本对象之间的相似度关系;然后在检测到用户行为的情况下,确定用户行为指向的对象,作为待处理对象;基于建立的对象相似度关系,确定待处理对象的相似对象;推荐相似对象;可见,本方案中,在检测到用户行为的情况下,向用户推荐该行为指向对象的相似对象,用户行为指向的对象可以理解为用户感兴趣的对象,相比于随机推荐对象,向用户推荐其感兴趣对象的相似对象,推荐的准确性较高。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的第一种信息推荐方法的流程示意图;

图2为本发明实施例提供的一种建立对象相似度关系的流程示意图;

图3为本发明实施例提供的第二种信息推荐方法的流程示意图;

图4为本发明实施例提供的一种建立用户对对象的喜好度关系的流程示意图;

图5为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。

需要说明的是,除非另外定义,本发明实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。

本发明实施例提供了信息推荐方法、设备及存储介质,该方法可以应用于手机、电脑等各种电子设备,具体不做限定。下面首先对第一种信息推荐方法进行详细介绍。

图1为本发明实施例提供的第一种信息推荐方法的流程示意图,包括:

s101:在检测到用户行为的情况下,确定用户行为指向的对象,作为待处理对象。

举例来说,用户行为可以包括:点赞、评论、分享、购买、收藏等等,具体不做限定。用户行为指向的对象可以为文章、图像、物品等等,具体不做限定。以社交网站为例来说,社交网站中包括文章、图像等信息,假设检测到用户对文章的点赞行为,则可以将该文章确定为待处理对象。以购物网站为例来说,购物网站中包括各种物品的信息,假设检测到用户对物品的购买行为,则可以将该物品确定为待处理对象。

s102:基于建立的对象相似度关系,确定待处理对象的相似对象。

本发明所示实施例中,建立该对象相似度关系的过程可以如图2所示,包括:

s201:获取多个样本对象的标签。

为了区分描述,将建立对象相似度关系的过程中涉及的对象称为样本对象。举例来说,对象的标签可以为描述对象属性的一些词语。比如,假设对象为文章,标签可以为文艺、科学、娱乐等等。再比如,假设对象为图像,标签可以为风景、人物等等。再比如,对象为商品,标签可以为女装、裙装等等。

一种实施方式中,标签可以为词向量,s201可以包括:获取多个样本对象的文本数据;对所述文本数据进行分词处理,得到多个词语;分别将每个词语映射至词向量空间,得到词向量。

举例来说,可以获取语料库,该语料库中包括多个样本对象的文本数据。一种实施方式中,可以先对文本数据进行清洗,比如:对一些无意义的文本数据可以进行过滤处理;对重复的文本数据可以进行去重处理;对于一些含有特殊分隔符的文本数据,可以基于特殊分隔符对文本数据进行分割;还可以将繁体字转换成简体字等等,具体的清洗过程不做限定。清洗过程为可选步骤。

然后可以对清洗后的文本数据进行分词处理。分词方式有多种,比如,基于字符串匹配的分词方式、基于统计的分词方式,等等,具体不做限定。

一种实施方式中,分词方式可以包括:基于预先生成的前缀词典,确定所述文本数据中的候选词,并生成所述候选词构成的有向无环图;基于所述前缀词典中前缀词的出现频率,计算所述有向无环图中各路径的概率;基于所述各路径的概率,确定分词得到的词语。

一般来说,基于前缀词典生成有向无环图(dag,directedacyclicgraph),dag中的每条路径分别对应文本数据的一种切分形式,一条路径中包括多个词语(候选词),该多个词语是根据一种切分形式对文本数据切分得到的。针对每条路径,根据构成该路径中的各候选词在前缀词典中的出现概率,计算该路径的概率。可以采用动态规划算法,从右向左反向计算该路径的概率。可以将概率最大的路径中包括的词语确定为分词得到的词语。

一种实施方式中,可以分别将分词得到的每个词语输入至语义分析模型,得到所述语义分析模型输出的携带语义信息的词向量。

举例来说,语义分析模型可以为bert(bidirectionalencoderrepresentationsfromtransformers,来自变换器的双向编码器表征量)模型,bert模型是一个词向量模型,bert模型的基础集成单元是transformer的编码器,其具有较多的编码器层数、较大的前馈神经网络以及多个attentionheads(注意力头)。bert模型可以对词语进行词嵌入编码,将字符串输入至bert模型,输入的数据在bert模型的各层之间传递计算,每一层都可以利用selfattention(自注意力)机制,并通过前馈神经网络传递其处理结果,将处理结果交给下一个编码器。bert模型输出的是一个隐藏层大小的向量,也就是携带语义信息的词向量。

或者,语义分析模型也可以为word2vec(wordtovector,将单词转换成向量形式)模型,或者,也可以为其他模型,具体不做限定。

本实施方式中,通过语义分析模型对分词得到的词语进行语义分析,得到携带语义信息的词向量,后续可以基于语义信息进行推荐,提高了推荐准确度。

s202:对该标签进行聚类,得到多个标签类。

举例来说,可以利用各种聚类算法,对s201中获取的标签聚类。

一种实施方式中,s202可以包括:遍历每个标签,判断聚类特征树中是否存在与该标签的距离小于预设距离阈值的节点;如果存在,确定该标签属于所述节点,如果不存在,基于该标签在所述聚类特征树中建立新的节点;遍历所述聚类特征树中的每个节点,判断该节点包括的标签数量是否大于预设数量阈值;如果大于,将该节点分为两个节点;针对所述聚类特征树中的每个节点,将该节点包括的标签划分为一个标签类。

本实施方式中,遍历s201中获取的所有标签,每读入一个标签时,根据预设距离阈值选择该标签所属的节点,或者,如果该标签与节点的距离均大于预设距离阈值,则新建一个节点,该标签属于新建的节点。

本实施方式中,聚类过程可以理解为建立聚类特征树的过程。读入第一个标签时,第一个标签可以作为根节点,读入第二个标签时,判断第二个标签与根节点的距离是否小于预设距离阈值,如果小于,则判定第二个标签属于根节点,如果不小于,则基于第二个标签建立新的根节点。读入后续标签的情况类似,不再一一赘述。

如果某个根节点中包括的标签数量大于预设数量阈值,则该根节点分裂为两个叶子节点,比如,可以将距离较远的标签分裂为属于不同的叶子节点。如果某个叶子节点中包括的标签数量大于预设数量阈值,则该叶子节点继续分裂为两个叶子节点,比如,可以将距离较远的标签分裂为属于不同的叶子节点。

这样,最终形成的聚类特征树中,每个节点包括的标签属于一个标签类。

标签种类较多,对标签进行聚类,同一标签类中各标签关联性较高,不同标签类中标签关联性较低,后续基于标签类计算对象的相似度,相比于基于标签计算对象的相似度,可以提高计算效率。

s203:针对每个样本对象,计算该样本对象的标签与该多个标签类之间的相似度,得到该样本对象对应的相似度集合。

一种实施方式中,计算该样本对象的标签与所述多个标签类之间的相似度,可以包括:针对每个标签类,计算该样本对象的每个标签与该标签类的质心之间的距离,作为该样本对象与该标签类之间的相似度。

举例来说,假设样本对象p的标签包括:l1、l2……ln,假设s202中聚类得到的标签类包括:c1、c2……cm,标签li与标签类cj之间的距离可以定义为:

其中,cj表示标签类cj的质心,表示li与cj之间的欧氏距离。距离的具体类型不做限定,比如可以为欧氏距离、马氏距离、余弦距离等等。

样本对象p到标签类cj的距离可以定义为:

该距离可以表示相似度,距离越小,相似度越大。

通过计算各样本对象与各标签类之间的距离,可以针对每个样本对象分别构建一个m维的对象-标签类-距离向量。比如,样本对象p对应的m维向量为:m为大于1的正整数,该m维向量可以理解为样本对象p对应的相似度集合。

s204:根据每个样本对象对应的相似度集合,建立各样本对象之间的相似度关系。

延续上述例子,对于任意两个样本对象p1和p2来说,假设样本对象p1对应的m维向量为假设样本对象p2对应的m维向量为可以通过这两份m维向量,建立p1和p2之间的相似度关系该相似度关系也就是这两份m维向量之间的距离,比如,可以为欧氏距离、马氏距离、余弦距离等等,具体不做限定。

通过s204建立了对象与对象之间的相似度关系,这样,便可以确定待处理对象的相似对象。

s103:推荐相似对象。

一种情况下,可以按照相似度由高到低的顺序,对待处理对象的各相似对象进行排序,可以向用户推荐排在前k位的相似对象,k的具体数值不做限定。

或者,另一种情况下,也可以设定相似度阈值,将相似度大于该阈值的相似对象推荐给用户。

举例来说,假设用户在浏览社交网站的过程中,对社交网站中的文章进行点赞,则可以应用本发明所示实施例,向用户推荐与该文章相似度较高的其他文章。再举一例,假设用户在浏览购物网站的过程中,对购物网站中的物品进行收藏,则可以应用本发明所示实施例,向用户推荐与该物品相似度较高的其他物品。这样,可以挖掘用户潜在的喜好,提高用户的活跃度和黏性。

应用本发明所示实施例,第一方面,在检测到用户行为的情况下,向用户推荐该行为指向对象的相似对象,用户行为指向的对象可以理解为用户感兴趣的对象,相比于随机推荐对象,向用户推荐其感兴趣对象的相似对象,推荐的准确性较高。第二方面,一种实施方式中,通过语义分析模型对分词得到的词语进行语义分析,得到携带语义信息的词向量,基于语义信息相似度进行推荐,提高了推荐准确度。第三方面,对对象的标签进行聚类,基于标签类计算对象的相似度,可以提高计算效率。

下面对第二种信息推荐方法进行详细介绍,图3为本发明实施例提供的第二种信息推荐方法的流程示意图,包括:

s301:在检测到第一用户的行为的情况下,基于建立的用户对对象的喜好度关系,确定第一用户喜好的对象。

举例来说,用户行为可以包括:点赞、评论、分享、购买、收藏等等,具体不做限定。

本发明所示实施例中,建立用户对对象的喜好度关系的过程可以如图4所示,包括:

s401:获取多个样本用户分别对应的行为对象的标签。

为了区分描述,将建立用户对对象的喜好度关系的过程中涉及的用户称为样本用户,将推荐过程针对的用户称为第一用户。

如上所述,用户行为可以包括:点赞、评论、分享、购买、收藏等等,具体不做限定。用户的行为对象可以为文章、图像、物品等等,具体不做限定。举例来说,对象的标签可以为描述对象属性的一些词语。比如,假设对象为文章,标签可以为文艺、科学、娱乐等等。再比如,假设对象为图像,标签可以为风景、人物等等。再比如,对象为商品,标签可以为女装、裙装等等。

一种实施方式中,s401可以包括:获取用户行为数据,所述用户行为数据中包括样本用户的标识、行为对象的标识、行为对象的标签之间的对应关系。

举例来说,可以获取样本用户的标识、行为对象的标识、行为对象的文本数据之间的对应关系;然后对该文本数据进行切分等处理,得到行为对象的标签;这样,便得到了样本用户的标识、行为对象的标识、行为对象的标签之间的对应关系。

一种情况下,标签可以为词向量;这种情况下,可以获取多个样本用户分别对应的行为对象的文本数据;对所述文本数据进行分词处理,得到多个词语;分别将每个词语映射至词向量空间,得到词向量。

举例来说,可以获取语料库,该语料库中包括多个样本用户分别对应的行为对象的文本数据。比如,该语料库中的每条数据可以包括:样本用户的标识、行为对象的标识以及行为对象的文本数据;或者,一些情况下,每条数据中还可以包括行为类型(如点赞、评论等)等信息。比如,一条数据可以包括:用户u1对文章a1进行了点赞行为、以及文章a1的文本数据。再比如,另一条数据可以包括:用户u2购买了物品o、以及物品o的文本数据。

一种实施方式中,可以先对文本数据进行清洗,比如:对一些无意义的文本数据可以进行过滤处理;对重复的文本数据可以进行去重处理;对于一些含有特殊分隔符的文本数据,可以基于特殊分隔符对文本数据进行分割;还可以将繁体字转换成简体字等等,具体的清洗过程不做限定。清洗过程为可选步骤。

然后可以对清洗后的文本数据进行分词处理。分词方式有多种,比如,基于字符串匹配的分词方式、基于统计的分词方式,等等,具体不做限定。

一种实施方式中,分词方式可以包括:基于预先生成的前缀词典,确定所述文本数据中的候选词,并生成所述候选词构成的有向无环图;基于所述前缀词典中前缀词的出现频率,计算所述有向无环图中各路径的概率;基于所述各路径的概率,确定分词得到的词语。

一般来说,基于前缀词典生成有向无环图(dag,directedacyclicgraph),dag中的每条路径分别对应文本数据的一种切分形式,一条路径中包括多个词语(候选词),该多个词语是根据一种切分形式对文本数据切分得到的。针对每条路径,根据构成该路径中的各候选词在前缀词典中的出现概率,计算该路径的概率。可以采用动态规划算法,从右向左反向计算该路径的概率。可以将概率最大的路径中包括的词语确定为分词得到的词语。

一种实施方式中,可以分别将分词得到的每个词语输入至语义分析模型,得到所述语义分析模型输出的携带语义信息的词向量。

举例来说,语义分析模型可以为bert(bidirectionalencoderrepresentationsfromtransformers,来自变换器的双向编码器表征量)模型,bert模型是一个词向量模型,bert模型的基础集成单元是transformer的编码器,其具有较多的编码器层数、较大的前馈神经网络以及多个attentionheads(注意力头)。bert模型可以对词语进行词嵌入编码,将字符串输入至bert模型,输入的数据在bert模型的各层之间传递计算,每一层都可以利用selfattention(自注意力)机制,并通过前馈神经网络传递其处理结果,将处理结果交给下一个编码器。bert模型输出的是一个隐藏层大小的向量,也就是携带语义信息的词向量。

或者,语义分析模型也可以为word2vec(wordtovector,将单词转换成向量形式)模型,或者,也可以为其他模型,具体不做限定。

本实施方式中,通过语义分析模型对分词得到的词语进行语义分析,得到携带语义信息的词向量,后续可以基于语义信息进行推荐,提高了推荐准确度。

s402:对该标签进行聚类,得到多个标签类。

举例来说,可以利用各种聚类算法,对s201中获取的标签聚类。

一种实施方式中,s402可以包括:遍历每个标签,判断聚类特征树中是否存在与该标签的距离小于预设距离阈值的节点;如果存在,确定该标签属于所述节点,如果不存在,基于该标签在所述聚类特征树中建立新的节点;遍历所述聚类特征树中的每个节点,判断该节点包括的标签数量是否大于预设数量阈值;如果大于,将该节点分为两个节点;针对所述聚类特征树中的每个节点,将该节点包括的标签划分为一个标签类。

本实施方式中,遍历s401中获取的所有标签,每读入一个标签时,根据预设距离阈值选择该标签所属的节点,或者,如果该标签与节点的距离均大于预设距离阈值,则新建一个节点,该标签属于新建的节点。

本实施方式中,聚类过程可以理解为建立聚类特征树的过程。读入第一个标签时,第一个标签可以作为根节点,读入第二个标签时,判断第二个标签与根节点的距离是否小于预设距离阈值,如果小于,则判定第二个标签属于根节点,如果不小于,则基于第二个标签建立新的根节点。读入后续标签的情况类似,不再一一赘述。

如果某个根节点中包括的标签数量大于预设数量阈值,则该根节点分裂为两个叶子节点,比如,可以将距离较远的标签分裂为属于不同的叶子节点。如果某个叶子节点中包括的标签数量大于预设数量阈值,则该叶子节点继续分裂为两个叶子节点,比如,可以将距离较远的标签分裂为属于不同的叶子节点。

这样,最终形成的聚类特征树中,每个节点包括的标签属于一个标签类。

标签种类较多,对标签进行聚类,同一标签类中各标签关联性较高,不同标签类中标签关联性较低,后续基于标签类计算用户对对象的喜好度,相比于基于标签计算用户对对象的喜好度,可以提高计算效率。

s403:针对每个样本用户,根据该样本用户对应的行为对象的标签,统计该样本用户对每个标签类的喜好度;根据该喜好度、以及获取到的行为对象的标签,建立该样本用户对行为对象的喜好度关系。

延续上述例子,可以获取语料库,该语料库中的每条数据可以包括:样本用户的标识、行为对象的标识以及行为对象的文本数据。对该文本数据进行分词处理,并将分词得到的词语映射得到词向量,词向量即为标签。

一种实施方式中,根据该样本用户对应的行为对象的标签,统计该样本用户对每个标签类的喜好度,可以包括:将该样本用户对应的行为对象的标签分别划分至其所属的标签类;针对每个标签类,统计该样本用户对应的行为对象的标签被划分至该标签类的次数;根据所述次数确定该样本用户与该标签类的喜好度关系。

假设用户u1对对象p1产生了行为,p1的标签包括11,l2,假设标签l1所属的标签类为c1,标签l2所属的标签类为c2;假设用户u1对对象p2产生了行为,p2的标签包括11,l3,假设标签l3所属的标签类为c3;假设用户u1对对象p3产生了行为,p3的标签包括11,l4,假设标签l4所属的标签类为c4;则对于标签类c1来说,用户u1对应的行为对象的标签被划分至该标签类的次数为3;对于标签类c2来说,标签被划分至该标签类的次数为1;对于标签类c3来说,标签被划分至该标签类的次数为1;对于标签类c4来说,标签被划分至该标签类的次数为1。次数越多表示用户与标签类的喜好度越高。

举例来说,可以构建一个m维的用户-标签类-喜好度向量u表示用户,c1、c2……cm表示各个标签类,表示用户u对标签类c1的喜好度,表示用户u对标签类c2的喜好度……以此类推,不再赘述,m表示大于1的正整数。

根据该m维的向量以及各对象的标签,可以建立用户对对象的喜好度关系:li∈ci;其中,fu,p表示用户u对对象p的喜好度关系。

一种实施方式中,用户行为数据中包括样本用户的标识、行为对象的标识、行为类型、行为对象的标签之间的对应关系;这种实施方式中,可以分别统计该样本用户的各行为类型对应的行为对象的标签被划分至该标签类的次数;然后可以根据行为类型对应的权重,对所述次数进行加权处理;根据加权后的次数,确定该样本用户与该标签类的喜好度关系。

假设用户u1对对象p1进行了购买,p1的标签包括11,l2,假设标签l1所属的标签类为c1,标签l2所属的标签类为c2;假设用户u1对对象p2进行了收藏,p2的标签包括11,l3,假设标签l3所属的标签类为c3;假设用户u1对对象p3进行了购买,p3的标签包括11,l4,假设标签l4所属的标签类为c4。

则对于标签类c1来说,关于购买行为,用户u1对应的行为对象的标签被划分至该标签类的次数为2,关于收藏行为,用户u1对应的行为对象的标签被划分至该标签类的次数为1。

对于标签类c2来说,关于购买行为,用户u1对应的行为对象的标签被划分至该标签类的次数为1,关于收藏行为,用户u1对应的行为对象的标签被划分至该标签类的次数为0。

对于标签类c3来说,关于购买行为,用户u1对应的行为对象的标签被划分至该标签类的次数为0,关于收藏行为,用户u1对应的行为对象的标签被划分至该标签类的次数为1。

对于标签类c4来说,关于购买行为,用户u1对应的行为对象的标签被划分至该标签类的次数为1,关于收藏行为,用户u1对应的行为对象的标签被划分至该标签类的次数为0。

不同行为类型对应的权重可以根据实际情况进行设定。假设购买行为对应的权重为80%,收藏行为对应的权重为20%,则对于标签类c1来说,加权后的次数=2*80%+1*20%,对于标签类c2来说,加权后的次数=1*80%,对于标签类c3来说,加权后的次数=1*20%,对于标签类c4来说,加权后的次数=1*80%。加权后的次数越多表示用户与标签类的喜好度越高。

本实施方式中,为不同的行为类型赋予不同的权重,能够更准确地反应用户的感兴趣程度。

通过s403建立了用户对对象的喜好度关系,这样,便可以确定第一用户喜好的对象。

s302:推荐第一用户喜好的对象。

一种情况下,可以按照喜好度由高到低的顺序,对各对象进行排序,可以向第一用户推荐排在前k位的对象,k的具体数值不做限定。

或者,另一种情况下,也可以设定喜好度阈值,将喜好度大于该阈值的相似对象推荐给第一用户。

举例来说,假设用户在浏览社交网站的过程中,对社交网站中的文章进行点赞,则可以应用本发明所示实施例,向用户推荐用户喜好度较高的其他文章或者图像等。再举一例,假设用户在浏览购物网站的过程中,对购物网站中的物品进行收藏,则可以应用本发明所示实施例,向用户推荐用户喜好度较高的其他物品其他信息。这样,可以挖掘用户潜在的喜好,提高用户的活跃度和黏性。

应用本发明所示实施例,第一方面,在检测到用户行为的情况下,向用户推荐其喜好的对象,相比于随机推荐对象,向用户推荐其喜好的对象,推荐的准确性较高。第二方面,一种实施方式中,通过语义分析模型对分词得到的词语进行语义分析,得到携带语义信息的词向量,基于语义信息进行推荐,提高了推荐准确度。第三方面,对对象的标签进行聚类,基于标签类计算用户对对象的喜好度,可以提高计算效率。

与上述方法实施例相对应,本发明实施例还提供一种电子设备,如图5所示,包括存储器502、处理器501及存储在存储器502上并可在处理器501上运行的计算机程序,处理器501执行所述程序时实现上述任一种信息推荐方法。

本发明实施例还提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述任一种信息推荐方法。

所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。

另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(ic)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。

尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态ram(dram))可以使用所讨论的实施例。

本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1