基于半监督网络表示学习的电商网络社区发现方法及系统

文档序号:32797505发布日期:2023-01-03 22:45阅读:来源:国知局

技术特征:
1.一种基于半监督网络表示学习的电商网络社区发现方法,其特征在于,包括以下步骤:s10、获取电商网络用户数据集,依据用户之间的好友关系构建电商网络结构,将用户的购买数据、浏览数据、店铺关注数据、参加活动的数据以及商品收藏数据作为用户节点特征,将已标记类型的用户作为标签数据,基于电商网络结构、用户节点特征以及部分标签数据构建邻接矩阵、特征矩阵和标签矩阵;s20、基于步骤s10建立的邻接矩阵、特征矩阵和标签矩阵,使用两个独立的gcn编码器构建半监督网络表示学习的电商网络社区发现模型;s30、对于步骤s20构建的半监督网络表示学习的电商网络社区发现模型,设计一个联合优化目标函数,通过最小化目标函数进行模型训练,确定模型参数;s40、利用步骤s20构建的半监督网络表示学习的电商网络社区发现模型,以及步骤s30确定的模型参数,实现对电商网络的社区发现与检测,并将社区发现结果进行输出。2.根据权利要求1所述的一种基于半监督网络表示学习的电商网络社区发现方法,其特征在于,该方法所述步骤s10包含以下具体步骤:s11、从电商网络平台中获取并加载电商网络用户数据集,依据用户之间的好友关系构建电商网络结构,将用户的购买数据、浏览数据、店铺关注数据以及商品收藏数据作为用户节点特征,将已标记类型的用户作为标签数据;将电商网络记为g=(v,e,x),v={v1,v2,

,v
n
}表示电商网络中n个用户节点的集合,其中第n个用户(1 n n)记为用户节点v
n
;表示电商网络中l个已标记类型的用户节点构成的集合,其中第l个用户(1 l l)记为已标记类型的用户节点e={e1,e2,

,e
m
}表示用户节点之间存在的m条边,其中第m条边(1 m m)记为e
m
;x是一个n
×
r维的用户节点特征矩阵,其第n(1 n n)行x
n
=[x
n1
,x
n2
,

x
nr
]表示电商网络中用户节点v
n
的r个特征,其中元素x
nr
表示用户节点v
n
的第r个特征;a表示一个n
×
n的邻接矩阵,与集合e包含的m条边相对应,矩阵中第i行第j列(1 i n,1 j n)元素即a
ij
表示第i个用户节点v
i
和第j个用户节点v
j
的邻接关系,若用户节点v
i
和用户节点v
j
之间有连边则a
ij
=1,否则a
ij
=0;将电商网络中存在的用户节点类别标记情况通过是l
×
k维的标签矩阵y进行记录,其中,l表示具有类别标签的用户节点数量,k表示标签类别数,矩阵中第i行第j列(1 i l,1 j k)元素即y
ij
表示第i个已标记类型的用户节点与第j个类标签之间的关系,若已标记类型的用户节点属于该类别则y
ij
=1,否则y
ij
=0。3.根据权利要求2所述的一种基于半监督网络表示学习的电商网络社区发现方法,其特征在于:所述步骤s20中的半监督网络表示学习的电商网络社区发现模型包含半监督通道、自监督通道以及冗余消除模块三个部分,其中:半监督通道包含一个gcn编码器,利用已标记类型的用户信息作为指导,学习兴趣相同的用户间的共性特征,以及兴趣不同的用户间的差异特征;自监督通道也同样包含一个gcn编码器,通过构造虚假的用户特征信息,将其与用户真实的特征信息形成对比,使用户低维表示在真实—虚假特征信息的对比机制下更好的捕捉和保持电商网络的结构与特性;冗余消除模块用于将上述两个通道中存在的重合信息进行去除,加强用户低维表示学习过程中指导监督作用的有效性,从而使电商网络社区发现模型获得稳定的性能;模型的具体操作步骤为:s21、在半监督通道中,将电商网络g=(v,e,x)输入到gcn编码器中进行编码,得到电商
网络中用户节点的表示向量,其编码过程的形式化表示如式(1)所示:其中,d为用户节点的度矩阵,用户节点v
i
的度表示为该用户节点相关联的边的数量;w0和w1是可学习的参数矩阵;h={h1,h2…
,h
n
}是电商网络中用户节点的表示向量的集合,h
i
表示用户节点v
i
经过编码得到的用户低维表示;这里的输入由两部分组成:电商网络用户节点特征矩阵x和电商网络邻接矩阵a;编码器中激活函数relu(
·
)由式(2)定义:构建半监督通道损失时,本发明使用一种基于softmax和交叉熵损失函数的神经网络分类器作为互信息估计器,用于评估用户节点特征x和部分用户节点标签y之间的相关性,从而使用户低维表示h={h1,h2…
,h
n
}可以学习到更多与用户节点标签y的相关信息;半监督通道优化目标如式(3)所示:其中,x
l
表示第l个具备标签的用户节点的特征,y
l
表示第l个具备标签的用户节点的标签值,y

表示用户标签类别,p(y

)为用户标签的先验分布概率,f(x
l
)表示通过gcn编码器得到的第l个具备标签的用户节点的低维表示;s22、在自监督通道中,同样将电商网络用户节点特征矩阵x和电商网络邻接矩阵a作为输入,通过gcn编码器,得到用户低维表示输入,通过gcn编码器,得到用户低维表示表示用户节点v
i
经过编码得到的用户低维表示;构建自监督通道损失时,我们使用jensen-shannon估计器衡量用户低维表示与用户节点v
n
及其相邻用户节点间的相关性,从用户的节点特征x和邻接矩阵a两个方面进行衡量,该通道总的优化目标如式(4)所示:其中,g
i
表示由用户节点v
i
及其相邻用户节点构成的子图,表示用户节点特征重构一致性,i(a
ij
;w
ij
)表示用户结构重构一致性,为电商网络中用户低维表示和的相关性,a
ij
表示用户节点v
i
和v
j
之间边的权重大小;用户节点特征重构一致性由式(5)计算:其中,x
j
表示用户节点v
n
以及相邻的用户节点的特征信息,x

j
是生成的虚假的用户节点特征,主要通过将用户节点的邻接矩阵a进行打乱,特征矩阵x不变,生成对应虚假的用户
节点特征信息;为鉴别器,用于对真实用户节点特征与生成的虚假的用户节点特征进行鉴别,如式(6)所示:其中,θ1中是一个可训练的得分矩阵,中t表示转置操作,σ为sigmoid函数,如式(7)所示:对于电商网络用户结构重构一致性由(8)计算:i(a
ij
;w
ij
)=a
ij
logw
ij
+(1-a
ij
)log(1-w
ij
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)s23、利用冗余消除模块识别和度量冗余信息,在半监督通道和自监督通道中分别获得的用户低维表示为h
l
和利用二者之间的相关性进行信息冗余的度量,如式(9)所示,其中,是针对生成的虚假数据,为鉴别器,h
lt
中t为转置操作,如式(10)所示:4.根据权利要求3所述的一种基于半监督网络表示学习的电商网络社区发现方法,其特征在于,该方法所述步骤s30包含以下具体步骤:s31、将s20所述的半监督通道、自监督通道以及冗余消除模块三个部分联合训练,为半监督网络表示学习的电商网络社区发现模型定义总的优化目标函数如式(11)所示:其中,是半监督通道损失,是自监督通道损失,i
r
是冗余信息,θ是超参数,用来衡量自监督通道的重要性;s32、对步骤s20中的半监督网络表示学习的电商网络社区发现模型进行参数初始化,给定调节系数θ和迭代次数t,迭代执行步骤s33~s35,直到达到迭代次数,完成对半监督网络表示学习的电商网络社区发现模型的训练,获得模型的最优参数;s33、将s11获取的电商网络用户邻接矩阵a和特征矩阵x作为输入,分别输入到半监督通道和自监督通道中,经过式(1)gcn编码器获取半监督电商网络表示h={h1,h2…
,h
n
}和自监督电商网络表示s34、按式(3)、式(4)和式(9)分别得到半监督通道目标损失自监督通道目标损失以及冗余信息i
r
;s35、将s34得到的损失输入到式(11)中,得到半监督网络表示学习的电商网络社区发现模型的总损失,进行反向传播,循环更新半监督通道神经网络参数w0和w1以及自监督通道神经网络参数和得分矩阵θ1、θ2。5.根据权利要求4所述一种基于半监督网络表示学习的电商网络社区发现方法,其特征在于,该方法所述步骤s40包含以下具体步骤:
s41、通过s33~s35获得模型的最优参数,输入新的电商网络用户数据,通过式(12)得到每个用户节点的社区标签;其中,c
(i)
表示第i个用户节点的社区标签,z
(i)
表示第i个用户节点的表示,z
(i)
由式(13)计算得到,μ
(j)
表示第j个聚类的质心点,μ
(j)
由式(14)计算得到,s42、将电商网络社区发现结果输出至电商平台运营人员或相关领域科研人员,用于商品推荐、店铺推荐、好友或群聊推荐、用户兴趣分析以及兴趣社区分析类相关任务。6.一种基于半监督网络表示学习的电商网络社区发现系统,其特征在于:用于实现权利要求1-5任一项所述的基于半监督网络表示学习的电商网络社区发现方法,包括计算机处理器和内存,电商网络邻接矩阵、特征矩阵以及标签矩阵单元,基于半监督网络表示学习的电商网络社区发现模型训练单元,基于半监督网络表示学习的电商网络社区发现模型结果输出单元;所述电商网络邻接矩阵、特征矩阵以及标签矩阵单元执行步骤s10,对于获取到的用户数据集,依据用户之间的好友关系构建电商网络结构,将用户的购买数据、浏览数据、店铺关注数据、参加活动的数据以及商品收藏数据作为用户节点特征,将已标记类型的用户作为标签数据,由此建立邻接矩阵、特征矩阵和标签矩阵,并加载到计算机内存中;基于半监督网络表示学习的电商网络社区发现模型训练单元根据步骤s10中构建的邻接矩阵、特征矩阵以及标签矩阵执行步骤s20~s30,构建半监督网络表示学习的电商网络社区发现模型,并基于定义的目标函数对模型进行训练;基于半监督网络表示学习的电商网络社区发现模型结果输出单元执行步骤s40,将电商网络中兴趣相似的用户划分到同一社区中,将电商网络社区发现结果输出至电商平台运营人员或相关领域科研人员,用于商品推荐、店铺推荐、好友或群聊推荐、用户兴趣分析以及兴趣社区分析类相关任务;所有单元中具体的数据处理和计算工作由所述计算机处理器完成,且所有单元都与所述计算机内存数据交互。

技术总结
本发明涉及电商网络数据挖掘领域,公开了一种基于半监督网络表示学习的电商网络社区发现方法及系统,所述方法包括电商网络邻接矩阵、特征矩阵以及部分用户标签矩阵构建环节,半监督网络表示学习的电商网络社区发现模型构建及优化环节,半监督网络表示学习的电商网络社区发现模型结果输出环节;利用两个独立的GCN编码器构建半监督网络表示学习的电商网络社区发现模型,并设计一个联合优化目标函数,通过最小化目标函数进行模型训练。所述系统包括计算机处理器和内存,电商网络邻接矩阵、特征矩阵以及标签矩阵单元,基于半监督网络表示学习的电商网络社区发现模型训练单元,基于半监督网络表示学习的电商网络社区发现模型结果输出单元。果输出单元。果输出单元。


技术研发人员:杜航原 谢富中 王文剑 白亮 梁吉业
受保护的技术使用者:山西大学
技术研发日:2022.09.29
技术公布日:2023/1/2
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1