一种基于多源附加信息增强的混合标签推荐方法

文档序号:30065062发布日期:2022-05-18 00:43阅读:142来源:国知局
一种基于多源附加信息增强的混合标签推荐方法

1.本发明属于混合推荐系统相关技术领域,特别是涉及一种基于多源附加信息增强的混合标签推荐方法。


背景技术:

2.用户使用一些关键词对物品(如电影和文章)进行注释的行为称为标记。合适的标签可以方便内容组织、检索、消费等。标签推荐系统旨在为物品推荐合适的标签,以帮助用户更轻松地标记,同时也通过创建便捷的注释来促进物品的传播。因此,为物品推荐合适的标签非常重要,尤其是在包含大量物品的互联网时代。
3.标签推荐系统通过利用在线用户提供给物品和标签之间的历史标记交互来辅助标记过程。物品-标签交互中包含的协同信息反映了用户对商品的协同感知,已经被证明在标签推荐系统中十分有效。然而,物品-标签交互的稀疏性和标签推荐中的冷启动问题使得仅使用协同信息的系统难以执行。基于内容的标签推荐系统通过对物品的内容信息(如文字内容或者图像内容)进行建模,从而推荐符合物品内容的标签,不需要物品-标签交互进行推荐,因此被广泛地研究。然而基于内容的推荐不考虑其他用户对物品的协同看法,且依赖于特征工程的好坏,因此可能出现很差的推荐效果。基于以上的考量,综合协同信息和内容信息进行混合标签推荐值得研究,但是此类混合推荐方法很少被探索。
4.如何将物品内容信息和协同信息耦合是一个挑战。物品除包含图像、文字等内容信息外,还包含物品间相互链接的社交信息,充分地利用物品的多源附加信息,即内容信息和社交信息,可以最大限度地有利于标签推荐过程。使用贝叶斯概率模型通过定义一个概率生成过程可以将多源附加信息与协同信息耦合,且在推荐系统上取得了不错的效果。考虑到贝叶斯概率生成过程对不同信息集成的灵活性和深度神经网络强大的特征学习能力,本发明提出使用深度生成模型来学习物品的潜在协同变量,并通过定义概率生成过程来耦合协同信息和物品多源附加信息。


技术实现要素:

5.本发明针对现有技术的不足,提供一种基于多源附加信息增强的混合标签推荐方法,包括以下步骤:
6.步骤1,构建物品多源附加信息,包括内容信息和社交信息;
7.步骤2,定义标签推荐的概率图模型,得到潜在变量和观测变量的联合分布;
8.步骤3,构建mavae网络,利用块坐标提升算法求解潜在变量的后验分布;
9.步骤4,随机初始化网络参数,对mavae网络进行训练;
10.步骤5,利用训练mavae网络得到的参数进行物品的标签推荐。
11.而且,所述步骤1中多源附加信息包括物品的内容信息和社交信息。物品内容信息包括对物品的描述信息,通过词频-逆文档频率进行特征提取,从而为每个物品赋予一个内容特征。物品社交信息描述物品之间的链接关系,不同领域的物品有其自身的链接关系,用
户对物品的共同交互关系也被用来描述物品之间的链接关系,通过定义具体的链接条件,物品的社交网络可以被构建。利用构建好的多源附加信息加上物品-标签的交互矩阵作为观测数据用来训练模型,从而实现对物品的标签推荐。
12.而且,所述步骤2中概率图的生成过程定义如下:从正态分布中采样k维潜在低维空间中的潜在物品内容变量ci和潜在物品社交变量si,物品的内容由其潜在内容变量ci通过变分自编码的生成网络生成,物品社交图由采样子图的潜在社交变量si通过变分图自编码器的生成网络生成。
13.为了综合利用物品多源附加信息,采用多头乘积原理融合多源附加变量,然后从多种分布的乘积分布中采样物品协同变量vi,通过神经网络参数化的非线性函数对物品协同变量vi进行转换,生成j个标签上的概率分布。
14.物品的交互从多项式分布中采样为:
15.π(ri)

softmax{nn(vi;θ)}
ꢀꢀꢀꢀ
(1)
16.ri~multinomial(ni,π(ri))
ꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
17.式中,π(ri)由神经网络nn(vi;θ)输出,并通过softmax函数将输出标准化;vi是物品协同变量;θ是深度神经网络的训练权值;ni为物品i的交互总数;multinomial()表示多项式分布函数;ri从参数化的多项式分布中采样。
18.各变量的联合分布可表示为:
19.p
θ
(v,c,s,r,x,g)=p
θ
(x|c)p(c)p
θ
(g|s)p(s)p(v|c,s)p
θ
(r|v)
ꢀꢀ
(3)
20.式中,{r,x,g}为所有观测变量的集合,分别表示物品的交互矩阵、物品的内容矩阵和物品的社交图网络;{v,c,s}为所有需要推理的潜在变量的集合,分别表示物品潜在协同变量矩阵、物品潜在内容变量矩阵和物品潜在社交变量矩阵;p
θ
(x|c)p(c)表示物品内容观测变量x由物品内容潜在变量c的先验p(c)乘上其对物品内容的生成概率p
θ
(x|c)生成;p
θ
(g|s)p(s)表示物品社交图网络观测变量g由物品社交潜在变量s的先验p(s)乘上其对物品社交图的生成概率p
θ
(g|s)生成;p(v|c,s)p
θ
(r|v)表示物品交互矩阵观测变量r由物品潜在协同变量的生成过程p(v|c,s)乘上其对物品交互矩阵的生成概率p
θ
(r|v)生成;p
θ
(x|c)、p
θ
(g|s)和p
θ
(r|v)的生成过程由生成网络建模,θ是生成网络的参数。
21.通过定义的概率生成过程得到各变量的联合分布p
θ
(v,c,s,r,x,g),由于物品潜在协同变量和多个附加变量的生成过程是非线性的,因此利用变分推理的思想为每个变量的后验分布设定一个近似后验q
φ
(v,c,s|r,x,g),并使得近似后验与真实后验的相对熵最小,经验证最小化该相对熵等价于最大化证据下界elbo。
22.elbo的表示如下:
[0023][0024]
将式(3)联合分布公式带入式(4),得:
[0025][0026]
式中,p
θ
(x|c)表示根据物品内容潜在变量c生成物品内容观测变量x的生成过程,
p
θ
(g|s)表示根据物品社交潜在变量s生成物品社交图观测变量g的生成过程,p(v|s)和p(v|c)分别表示由物品潜在社交变量s和物品潜在内容变量c生成物品潜在协同变量v的生成过程,p
θ
(r|v)表示根据物品社交潜在变量生成物品交互矩阵r的生成过程,kl(q
φ
(c|x)||p(c))表示物品内容潜在变量的变分后验与其先验的偏离程度,kl(q
φ
(s|g)||p(s))表示物品社交潜在变量的变分后验与其先验的偏离程度,表示q
φ
(v|r)的熵,本发明将其视为常数,变分后验的推理过程由神经网络参数化,φ是推理网络的参数。
[0027]
而且,所述步骤3中构建mavae网络,利用块坐标提升算法来最大化证据下界elbo,即通过固定一部分参数来求另一部分参数,该证据下界可以划分为mult-vae协同信息网络参数优化、vae内容信息网络参数优化和vgae社交信息网络参数优化,通过三部分优化不断迭代,联合训练得出所有的参数。
[0028]
mavae网络包括物品协同mult-vae网络子模块、物品内容vae网络子模块和物品社交网络vgae网络子模块三部分,通过重参数化技巧,编码器得到的潜在变量的分布可以避开直接采样,通过采样一个符合标准正态的∈,来迭代优化标签推荐的三个子模块,从而形成紧密耦合的混合模型。
[0029]
mult-vae网络子模块由编码器和解码器构成,编码器和解码器是对称的多层感知机(mlp),总体架构为[j-》600-》64-》600-》j],j为标签总数,每层感知机由线性转换linear层、dropout层和非线性激活函数relu组成。
[0030]
vae网络子模块由编码器和解码器构成,编码器和解码器是对称的两层多层感知机,总体架构为[f-》64-》64-》64-》f],f为输入特征的维度数,每层感知机由线性转换linear层、dropout层和非线性激活函数relu组成。
[0031]
vgae网络子模块由编码器和解码器构成,编码器由图卷积网络构成,解码器由点积解码器构成,每层邻居的采样数设为20,并聚合两阶邻居,邻居聚合采用均值聚合加非线性映射。
[0032]
由于本发明建模各变量为高斯变量,各编码器输出64维的均值向量和对数函数log下的方差向量来参数化高斯分布,通过从均值和方差向量中采样可以得到潜在的高斯嵌入。
[0033]
而且,所述步骤4中将各变量建模为高斯分布,高斯分布的负对数似然为l2重构损失,mavae网络的损失函数可进一步表示为:
[0034][0035]
式中,λc、λs设置为超参数,分别表示物品内容变量和社交变量的精度向量;和分别表示物品协同信息变量、内容变量和社交图变量的推理和生成过程,具体为自编码器的形式,kl(q
φ
(c|x)||p(c))表示物品内容潜在变量的变分后验与其先验的偏离程度,kl(q
φ
(s|g)||p(s))表示物
品社交潜在变量的变分后验与其先验的偏离程度,和分别表示物品潜在内容变量ci和物品潜在社交变量si和物品潜在协同变量vi的均方损失。
[0036]
对mavae网络的训练包括以下几个子步骤:
[0037]
步骤4.1,固定与物品附加变量c、s的相关参数,优化物品协同变量v相关的mult-vae网络子模块。
[0038]
与物品协同变量v相关的多项式分布变分自编码器mult-vae损失函数可表达为:
[0039][0040]
式中,λc、λs分别为物品内容变量和社交变量的精度向量,vi为物品潜在协同变量,表示协同潜在变量v的近似后验分布,协同潜在变量v从近似后验分布中采样,并通过生成过程p
θ
(r|v)重构协同交互信息r,表示对协同潜在变量进行采样,并重构r的似然分布的期望,既物品协同隐变量的推理和协同交互的生成的过程,为由物品vae网络子模块的推理网络推理出的物品内容变量的均值,为由物品vgae网络子模块的推理网络推理出的物品社交变量的均值,表示对协同潜在变量进行采样并求期望的过程。
[0041]
步骤4.2,固定物品协同变量v和物品社交潜在变量s的参数,优化物品内容变量c相关的vae网络子模块。
[0042]
将与c相关的公式分离出来,物品内容vae网络的损失函数可表达为:
[0043][0044]
式中,项表示物品内容变量的推理和生成过程,具体为自编码器的形式,kl(q
φ
(c|x)‖p(c))项表示物品内容变量的变分后验与其先验的偏离程度,为由mult-vae网络子模块的推理网络推理出的物品协同变量的均值,表示物品内容潜在变量c的近似后验分布,为对物品内容潜在变量从近似后验中采样并求期望的过程,λc为物品内容变量的精度向量,vi为物品的协同变量,ci为物品的潜在内容变量。
[0045]
步骤4.3,固定物品协同变量v和内容变量c的相关参数,优化物品社交变量相关的vgae网络子模块。
[0046]
分离与s相关的项后,vgae的损失函数可表达为:
[0047][0048]
式中,λs为物品社交变量的精度向量,vi为物品的协同变量,si为物品的潜在社交变量,项表示物品社交变量的推理和生成过程,具体为自编码器的形式,kl(q
φ
(s|g)‖p(s))项表述物品社交潜在变量的后验分布与其先验的偏离程度,为由mult-vae网络子模块的推理网络推理出的物品协同变量的均值,表示物品社交潜在变量s的近似后验分布,为对物品社交潜在变量从近似后验中采样并求期望的过程。
[0049]
社交信息vgae网络子模块建模物品社交图中的链接关系,利用物品的文本词频-逆文档频率属性作为网络节点特征,并采用内积解码器作为vgae的生成过程,受贝叶斯个性化排名(bpr)损失启发,vgae的解码器表示如下:
[0050][0051]
式中,ζ是增加非线性的激活函数,是三元组的集合,v为待嵌入的目标物品,v
+
为物品v通过随机游走采样的低阶邻居,v-是随机抽样的不与v交互的负项,sv为待嵌入的目标物品的潜在社交嵌入,为物品v低阶邻居的潜在社交嵌入,为v不交互的负项的潜在社交嵌入。
[0052]
对于编码器,利用均值聚合函数来聚合邻居的特征,可以表示为:
[0053][0054]
式中,是采样子图中物品v的邻居,物品的第k层社交嵌入由物品的k-1层嵌入与聚集的邻居向量连接得到,物品自身的k-1层嵌入的使用可以将其视为残差连接,w为线性转换的权重,ζ为非线性激活函数,mean为均值函数。
[0055]
而且,所述步骤5中通过训练mavae网络的参数,学习到了物品协同mult-vae网络子模块、内容vae网络子模块、社交网络vgae网络子模块的推理网络和生成网络的权值,对于存在于训练集的物品,可以通过推理网络得到测试物品的协同嵌入、内容嵌入和社交嵌入,并通过协同mult-vae网络子模块的生成网络生成该物品对各个标签的推荐打分,最终生成前k个标签;对于不存在于训练集的新物品,利用推理到的内容嵌入和社交嵌入的融合输入协同mult-vae网络子模块的生成网络预测打分,并推荐top-k的标签。
[0056]
对存在于训练集中的物品,通过模型训练,学习了物品对标签的交互、物品内容和物品社交图的推理网络和生成网络的参数,标签的预测可以表示为:
[0057][0058]
式中,d为观测数据,e[r|d]为根据训练集中的观测数据d得到测试集中物品对各
标签的预测概率r的过程,μr为通过mult-vae网络子模块的编码器推理的潜在协同变量的均值向量,μc为通过vae网络子模块的编码器推理的潜在内容变量的均值向量,μs为通过vgae网络子模块的编码器推理的潜在社交变量的均值向量,计算物品内容变量与社交变量通过poe融合的均值向量,表示推理出的潜在协同均值向量通过mult-vae网络子模块的生成网络生成对各标签的打分概率,表示物品融合的多源附加均值向量通过mult-vae网络子模块的生成网络生成对各标签的打分概率,最终mavae模型对各标签的预测推荐概率由协同信息和物品多源附加信息综合相加得到。
[0059]
对于全新的物品,利用物品内容vae网络子模块、社交网络vgae网络子模块的推理网络可以获得的物品内容嵌入和社交嵌入的poe融合形式,通过协同mult-vae网络子模块的解码器对各标签的推荐进行预测,预测可以表示为:
[0060][0061]
式中,d为观测数据,e[r|d]为根据训练集中的观测数据d得到测试集中物品对各标签的预测概率r的过程,μc为通过vae网络子模块的编码器推理的潜在内容变量的均值向量,μs为通过vgae网络子模块的编码器推理的潜在社交变量的均值向量,为物品多源附加均值向量通过poe融合,再通过mult-vae网络子模块的生成网络生成对各标签的打分概率。
[0062]
与现有技术相比,本发明具有如下优点:
[0063]
1)通过定义一个概率生成过程,将物品多源附加信息(内容信息和社交信息)集成到协同信息的建模中,进而可以利用物品多源附加信息来做出更好的标签推荐;
[0064]
2)使用建模能力更强的深度生成模型对协同信息和交互信息进行建模,并将其整合进一个统一的网络框架(多源附加信息增强的变分自编码器网络,multiple auxiliary information augmented variational auto-encoder,mavae)中;
[0065]
3)提出一种归纳式的变分图自动编码器,通过利用子图抽样和邻域聚合的方法解决了在图中添加新节点的问题,进而新物品的社交图信息和内容信息可以被充分的建模来进行冷启动的标签推荐;
[0066]
4)对于不存在协同信息的新物品,通过物品多源附加嵌入推理每个标签的推荐概率的生成,从而解决了冷启动下的标签推荐问题,并通过增加多源物品附加嵌入和通过协同解码器的生成损失,增强物品多源附加信息对交互反馈的预测能力。
附图说明
[0067]
图1为本发明实施例的流程框图。
[0068]
图2为本发明物品内容建模框架和物品社交图建模框架。
[0069]
图3为本发明mavae网络训练的流程图。
具体实施方式
[0070]
本发明提供一种基于多源附加信息增强的混合标签推荐方法。下面结合附图和实施例对本发明的技术方案作进一步说明。
[0071]
如图1所示,本发明实施例的流程包括以下步骤:
[0072]
步骤1,构建物品多源附加信息,包括内容信息和社交信息。
[0073]
基于协同过滤的物品标签推荐受限于物品-标签交互的稀疏性和标签推荐中的冷启动问题,利用物品多源的附加信息可以缓解稀疏性和冷启动问题。多源附加信息包括物品的内容信息和社交信息。物品内容信息包括对物品的描述信息,通过词频-逆文档频率(tf-idf)进行特征提取,从而为每个物品赋予一个内容特征。物品社交信息描述物品之间的链接关系,不同领域的物品有其自身的链接关系,如文章的引用关系,视频的同导演、演员关系等。除此之外,用户对物品的共同交互关系也被用来描述物品之间的链接关系。通过定义具体的链接条件,物品的社交网络可以被构建。利用构建好的多源附加信息加上物品-标签的交互矩阵作为观测数据用来训练模型,从而实现对物品的标签推荐。
[0074]
步骤2,定义标签推荐的概率图模型,得到潜在变量和观测变量的联合分布。
[0075]
概率图的生成过程定义如下:物品-标签的交互由物品潜在协同变量生成,且物品的多源附加信息由不同的潜在变量生成,即物品的内容和社交图分别由它们的潜在内容变量和社交变量通过生成网络生成。为了耦合物品-标签的交互信息和物品的多源附加信息,以便更好的对稀疏的物品-标签交互信息进行信息增强,物品的潜在协同变量由物品的潜在内容和社交变量生成,然后通过神经网络参数化的非线性函数对物品协同变量进行转换,从而生成所有标签上的概率分布,进行标签推荐。通过将混合信息耦合进一个统一的框架,潜在变量和观测变量的联合分布可以被表示出来,从而更进一步对潜在变量的后验分布进行求解。
[0076]
从正态分布中采样k维潜在低维空间中的潜在物品内容变量ci和潜在物品社交变量si,物品的内容由其潜在内容变量ci通过变分自编码器的生成网络生成,物品社交图由采样子图的潜在社交变量si通过变分图自编码器的生成网络生成。
[0077]
为了综合利用物品多源附加信息,采用多头乘积(product-of-experts,poe)原理融合多源附加变量,然后从多种分布的乘积分布中采样物品协同变量vi,通过神经网络参数化的非线性函数对物品协同变量vi进行转换,生成j个标签上的概率分布。
[0078]
物品的交互从多项式分布中采样为:
[0079]
π(ri)

softmax{nn(vi;θ)}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0080]ri
~multinomial(ni,π(ri))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0081]
式中,π(ri)由神经网络nn(vi;θ)输出,并通过softmax函数将输出标准化;vi是物品协同变量;θ是深度神经网络的训练权值;ni为物品i的交互总数;multinomial()表示多项式分布函数;ri从参数化的多项式分布中采样。
[0082]
多项式分布在隐式反馈数据建模方面取得了很好的表现,该模型将为更有可能被交互的标签分配更多的概率质量,从而使得其在top-k排名损失下表现良好。
[0083]
各变量的联合分布可表示为:
[0084]
p
θ
(v,c,s,r,x,g)=p
θ
(x|c)p(c)p
θ
(g|s)p(s)p(v|c,s)p
θ
(r|v)
ꢀꢀꢀꢀ
(3)
[0085]
式中,{r,x,g}为所有观测变量的集合,分别表示物品的交互矩阵、物品的内容矩
阵和物品的社交图网络;{v,c,s}为所有需要推理的潜在变量的集合,分别表示物品潜在协同变量矩阵、物品潜在内容变量矩阵和物品潜在社交变量矩阵;p
θ
(x|c)p(c)表示物品内容观测变量x由物品内容潜在变量c的先验p(c)乘上其对物品内容的生成概率p
θ
(x|c)生成;p
θ
(g|s)p(s)表示物品社交图网络观测变量g由物品社交潜在变量s的先验p(s)乘上其对物品社交图的生成概率p
θ
(g|s)生成;p(v|c,s)p
θ
(r|v)表示物品交互矩阵观测变量r由物品潜在协同变量的生成过程p(v|c,s)乘上其对物品交互矩阵的生成概率p
θ
(r|v)生成;p
θ
(x|c)、p
θ
(g|s)和p
θ
(r|v)的生成过程由生成网络建模,θ是生成网络的参数。
[0086]
通过定义的概率生成过程得到各变量的联合分布p
θ
(v,c,s,r,x,g),由于物品潜在协同变量和多个附加变量的生成过程是非线性的(被参数化为深度神经网络),因此利用变分推理的思想为每个变量的后验分布设定一个近似(变分)后验q
φ
(v,c,s|r,x,g),并使得近似后验与真实后验的相对熵(kullback-leibler散度)最小。经验证最小化该kl散度等价于最大化一个证据下界elbo(evidence lower bound)。
[0087]
elbo的表示如下:
[0088][0089]
将式(3)联合分布公式带入式(4),得:
[0090][0091]
式中,p
θ
(x|c)表示根据物品内容潜在变量c生成物品内容观测变量x的生成过程,p
θ
(g|s)表示根据物品社交潜在变量s生成物品社交图观测变量g的生成过程,p(v|s)和p(v|c)分别表示由物品潜在社交变量s和物品潜在内容变量c生成物品潜在协同变量v的生成过程,p
θ
(r|v)表示根据物品社交潜在变量生成物品交互矩阵r的生成过程,kl(q
φ
(c|x)||p(c))表示物品内容潜在变量的变分后验与其先验的偏离程度,kl(q
φ
(s|g)||p(s))表示物品社交潜在变量的变分后验与其先验的偏离程度,表示q
φ
(v|r)的熵,本发明将其视为常数,变分后验的推理过程由神经网络参数化,φ是推理网络的参数。
[0092]
步骤3,构建mavae网络,利用块坐标提升算法求解潜在变量的后验分布。
[0093]
构建mavae网络,利用一种期望最大化(expectation maximization)风格的块坐标提升算法来最大化证据下界elbo,即通过固定一部分参数来求另一部分参数,该证据下界可以划分为mult-vae协同信息网络参数优化、vae内容信息网络参数优化和vgae社交信息网络参数优化,通过三部分优化不断迭代,联合训练得出所有的参数。
[0094]
mavae网络包括物品协同mult-vae(multimomial variational auto-encoder)网络子模块、物品内容vae(variational auto-encoder)网络子模块和物品社交网络vgae(variational graph auto-encoder)网络子模块三部分,通过重参数化技巧,编码器得到的潜在变量的分布可以避开直接采样,通过采样一个符合标准正态的∈,来迭代优化标签推荐的三个子模块,从而形成紧密耦合的混合模型。具体地,协同信息可以指导物品多源附加特征的映射学习,多源附加潜在表示可以进一步提高基于交互的mult-vae的性能,特别是对具有稀疏交互的物品。
[0095]
mult-vae网络子模块由编码器和解码器构成,编码器和解码器是对称的多层感知机(mlp),总体架构为[j-》600-》64-》600-》j],其中j为标签总数。具体地,每层感知机由线性转换linear层、dropout层和非线性激活函数relu组成。
[0096]
vae网络子模块由编码器和解码器构成,编码器和解码器是对称的两层多层感知机。总体架构为[f-》64-》64-》64-》f],其中f为输入特征的维度数。具体地,每层感知机由线性转换linear层、dropout层和非线性激活函数relu组成。
[0097]
vgae网络子模块由编码器和解码器构成,编码器由图卷积网络构成,解码器由点积解码器构成。本发明设置每层邻居的采样数为20,并聚合两阶邻居。邻居聚合采用均值聚合加非线性映射。
[0098]
由于本发明建模各变量为高斯变量,各编码器输出64维的均值向量和对数函数log下的方差向量来参数化高斯分布,通过从均值和方差向量中采样可以得到潜在的高斯嵌入。
[0099]
步骤4,随机初始化网络参数,对mavae网络进行训练。
[0100]
将各变量建模为高斯分布,高斯分布的负对数似然为l2重构损失,mavae网络的损失函数可表示为:
[0101][0102]
式中,λc、λs设置为超参数,分别表示物品内容变量和社交变量的精度向量;和分别表示物品协同信息变量、内容变量和社交图变量的推理和生成过程,具体为自编码器的形式,kl(q
φ
(c|x)||p(c))表示物品内容潜在变量的变分后验与其先验的偏离程度,kl(q
φ
(s|g)||p(s))表示物品社交潜在变量的变分后验与其先验的偏离程度,和分别表示物品潜在内容变量ci和物品潜在社交变量si和物品潜在协同变量vi的均方损失。
[0103]
步骤4.1,固定与物品附加变量c、s的相关参数,优化物品协同变量v相关的mult-vae网络子模块。
[0104]
与物品协同变量v相关的多项式分布变分自编码器(mult-vae)损失函数可表达为:
[0105][0106]
式中,λc、λs分别为物品内容变量和社交变量的精度向量,vi为物品潜在协同变量,
表示协同潜在变量v的近似后验分布,协同潜在变量v从近似后验分布中采样,并通过生成过程p
θ
(r|v)重构协同交互信息r,表示对协同潜在变量进行采样,并重构r的似然分布的期望,既物品协同隐变量的推理和协同交互的生成的过程,为由物品vae网络子模块的推理网络推理出的物品内容变量的均值,为由物品vgae网络子模块的推理网络推理出的物品社交变量的均值,表示对协同潜在变量进行采样并求期望的过程。
[0107]
步骤4.2,固定物品协同变量v和物品社交潜在变量s的参数,优化物品内容变量c相关的vae网络子模块。
[0108]
将与c相关的公式分离出来,物品内容vae网络的损失函数可表达为:
[0109][0110]
式中,项表示物品内容变量的推理和生成过程,具体为自编码器的形式,kl(q
φ
(c|x)‖p(c))项表示物品内容变量的变分后验与其先验的偏离程度,为由mult-vae网络子模块的推理网络推理出的物品协同变量的均值,表示物品内容潜在变量c的近似后验分布,为对物品内容潜在变量从近似后验中采样并求期望的过程,λc为物品内容变量的精度向量,vi为物品的协同变量,ci为物品的潜在内容变量。
[0111]
设置先验p(c)为标准高斯,这样便可以限制物品内容变量趋向于标准正态分布,从而抑制过多的无关信息被编码进物品内容变量中。
[0112]
步骤4.3,固定物品协同变量v和内容变量c的相关参数,优化物品社交变量相关的vgae网络子模块。
[0113]
分离与s相关的项后,vgae的损失函数可表达为:
[0114][0115]
式中,λs为物品社交变量的精度向量,vi为物品的协同变量,si为物品的潜在社交变量,项表示物品社交变量的推理和生成过程,具体为自编码器的形式,kl(q
φ
(s|g)‖p(s))项表述物品社交潜在变量的后验分布与其先验的偏离程度,为由物品mult-vae网络子模块的推理网络推理出的物品协同变量的均值,表示物品社交潜在变量s的近似后验分布,为对物品社交潜在变量从近似后验中采样并求期望的过程。
[0116]
为了利用物品的多源附加信息对新出现的物品推荐合适的标签,本发明在测试时增加新的节点,扩展变分图自编码器以适应归纳式的学习。在训练过程中,利用一个图采样
器来采样节点的子图,并在批处理中学习一个批次的节点嵌入,然后利用聚合函数融合节点的局部邻居特征,通过小批量梯度下降可以很好地学习到聚合函数的参数。因此,对于不在训练集的新节点的节点嵌入,可以使用学到的邻居聚合操作函数通过聚合邻居的嵌入得到。同时,归纳变分图自编码器可以应用于通过小批量的训练和推理,在用户-物品二部图等大型图的推荐系统中具有现实意义。
[0117]
社交信息vgae网络子模块建模物品社交图中的链接关系,利用物品的文本词频-逆文档频率属性作为网络节点特征,并采用内积解码器作为vgae的生成过程。受贝叶斯个性化排名(bpr)损失启发,vgae的解码器表示如下:
[0118][0119]
式中,ζ是增加非线性的激活函数,是三元组的集合,v为待嵌入的目标物品,v
+
为物品v通过随机游走采样的低阶邻居,v-是随机抽样的不与v交互的负项,sv为待嵌入的目标物品的潜在社交嵌入,为物品v低阶邻居的潜在社交嵌入,为v不交互的负项的潜在社交嵌入。
[0120]
对于编码器,利用均值聚合函数来聚合邻居的特征,可以表示为:
[0121][0122]
式中,是采样子图中物品v的邻居,物品的第k层社交嵌入由物品的k-1层嵌入与聚集的邻居向量连接得到,物品自身的k-1层嵌入的使用可以将其视为残差连接,w为线性转换的权重,ζ为非线性激活函数,mean为均值函数。
[0123]
步骤5,利用训练mavae网络得到的参数进行物品的标签推荐。
[0124]
通过训练mavae网络的参数,学习到了物品协同mult-vae网络子模块、内容vae网络子模块、社交网络vgae网络子模块的推理网络和生成网络的权值。对于存在于训练集的物品,可以通过推理网络得到测试物品的协同嵌入、内容嵌入和社交嵌入,并通过协同mult-vae网络子模块的生成网络生成该物品对各个标签的推荐打分,最终生成前k个(top-k)标签。对于不存在于训练集的新物品,利用推理到的内容嵌入和社交嵌入的融合输入协同mult-vae网络子模块的生成网络预测打分,并推荐top-k的标签。
[0125]
对存在于训练集中的物品,通过模型训练,学习了物品对标签的交互、物品内容和物品社交图的推理网络和生成网络的参数,标签的预测可以表示为:
[0126][0127]
式中,d为观测数据,e[r|d]为根据训练集中的观测数据d得到测试集中物品对各标签的预测概率r的过程,μr为通过mult-vae网络子模块的编码器推理的潜在协同变量的均值向量,μc为通过vae网络子模块的编码器推理的潜在内容变量的均值向量,μs为通过vgae网络子模块的编码器推理的潜在社交变量的均值向量,计算物品内容变
量与社交变量通过poe融合的均值向量,表示推理出的潜在协同均值向量通过mult-vae网络子模块的生成网络生成对各标签的打分概率,表示物品融合的多源附加均值向量通过mult-vae网络子模块的生成网络生成对各标签的打分概率,最终mavae模型对各标签的预测推荐概率由协同信息和物品多源附加信息综合相加得到。
[0128]
对于全新的物品,利用物品内容vae网络子模块、社交网络vgae网络子模块的推理网络可以获得的物品内容嵌入和社交嵌入的poe融合形式,通过协同mult-vae网络子模块的解码器对各标签的推荐进行预测,预测可以表示为:
[0129][0130]
式中,d为观测数据,e[r|d]为根据训练集中的观测数据d得到测试集中物品对各标签的预测概率r的过程,μc为通过vae网络子模块的编码器推理的潜在内容变量的均值向量,μs为通过vgae网络子模块的编码器推理的潜在社交变量的均值向量,为物品多源附加均值向量通过poe融合,再通过mult-vae网络子模块的生成网络生成对各标签的打分概率。
[0131]
具体实施时,以上流程可采用计算机软件技术实现自动运行流程。
[0132]
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1