本发明涉及技术推荐领域,具体设计一种基于超图的音乐推荐方法与系统。
背景技术:
1、当前在音乐推荐中常用的算法是协同过滤推荐算法,它通过挖掘用户的行为数据,找到用户之间的相似性和关联性,并据此推荐相应的音乐给用户。但随着数据量的增加,协同过滤算法在海量数据环境下面临越来越多的挑战。随着科技的进步,不同平台所生成的数据以指数级的速度不断增长,这种趋势也出现在音乐网站上。尽管每天都有更多的音乐上传到网站,但用户却不会对自己所有听过的音乐进行评分,导致音乐评分数据稀疏,影响音乐推荐系统的推荐效果。
2、超图是一种数据结构,它扩展了图的概念,允许边连接多于两个节点,从而更好地表示复杂关系。在推荐系统中,超图可以用于建模更复杂的用户和物品之间的关联,从而提供更准确和个性化的推荐。然而,目前尚缺乏将超图、情景感知与音乐推荐相结合的研究,以提高音乐推挤的准确性和合理性。此外,情境感知可以考虑用户当前的环境、活动、心情等因素,从而更好地满足用户的需求。将情境感知与音乐推荐融合,可以使推荐系统更好地理解用户的偏好,进一步个性化推荐。
3、因此,现有的音乐推荐方法存在数据稀疏性较大,未能捕捉用户的长期兴趣变化,并且在考虑推荐上下文方面存在不足,无法充分满足用户当前的需求。为了解决这些问题,本发明提出了一种基于超图的音乐推荐方法与系统,并且融合了用户当前的情境感知,以提高音乐推荐系统的准确性和用户满意度。
技术实现思路
1、本发明提供的一种能够基于超图和融合用户情境感知的音乐推荐方法。通过综合应用超图构建和推理、情境感知的偏好学习,基于音乐数据集中所有用户的历史行为,实现对用户的个性化音乐推荐,提升用体验。
2、本发明公开了一种基于超图的音乐推荐方法与系统,包含以下步骤:
3、步骤1:数据采集。将获取的音乐数据,获取一定时间内多个用户的历史音乐收听记录进行数据预处理,得到训练样本集与测试样本集。
4、步骤2:超图模型构建。基于步骤1获取的训练集,使用超图数据结构对数据信息进行建模。
5、步骤3:嵌入生成。从超图数据模型中生成随机游走,并利用跳字模型学习超图顶点的嵌入,最后融合用户听歌当下的情景信息。
6、步骤4:模型的训练与生成推荐。基于给定的音乐数据库,利用所构建的超图音乐推荐方法,计算超图中每个顶点作为输入结点的上下文顶点的概率,预测用户任意时间感兴趣的音乐。
7、步骤5:模型评估。通过相应评价指标评价模型的预测精度,检验所拟合模型的充分性。
8、进一步的,所述步骤1中数据采集的具体方法包括:
9、获取一定时间内多个用户的历史音乐收听记录h={h1,…,hu,…,hu},是用户u∈u的音乐收听记录,ti是mi∈m的时间戳,u和m分别表示用户集合和音乐集合,并且将对应音乐相关系的专辑和歌手集合记为a和s,将对应音乐相关的标签属性记为t。
10、进一步的,所述步骤2中超图模型构建的具体方法包括:
11、超图的定义:,其中:v是一组顶点集,e是一组超图的带有索引的超边集。
12、v由以下不同的实体构成:
13、m:歌曲集;u:用户集;s:歌手;a:专辑;t:标签
14、顶点的集合定义为v=m∪u∪s∪a∪t,其中m为歌曲集,u为用户集,s为歌手集,a为专辑集,t为类别集,
15、根据不同实体之间的不同关系,可以定义以下的超边e:
16、eum:歌手音乐视角,即一位用户和其听过的所有歌曲之间的关系
17、eam:专辑音乐视角,即一张专辑和其拥有所有的歌曲之间的关系
18、esa:歌手专辑视角,即一位歌手和其发布过的专辑之间的关系
19、etm:标签音乐视角,即一种歌曲类别和其所属的歌曲之间的关系
20、超边ei∈e是由有序对定义的,其中为其“头部”,为其“尾部”;是顶点的集合,是顶点的集合,是构成整个超边的顶点的子集。
21、进一步的,所述步骤3嵌入生成的具体方法包括:
22、步骤3.1、首先使用随机游走生成器,为每个顶点创建一个游走,然后随机选择以顶点v∈v为尾部的超边e∈e,评估从该顶点v跳跃到另一条超边的概率p,具体公式为:
23、
24、其中,α,β≥0为超参数。
25、步骤3.2、使用跳字模型从生成的游走中学习顶点嵌入。在本发明中,将超边的顶点被视为单词、随机游走视为句子。将超图所有的结点组成跳字模型的词汇表,然后将每一个结点表示为一个大小为|v|的one-hot编码,第i个位置对应与第i个结点,则设置第i个值为1,否则为0。
26、步骤3.2、融合情景信息,首先融合时间情景,提出时间效应函数,公式如下:
27、
28、其中,ti表示用户当前时间听歌与其最后听歌时间的相差天数。
29、然后融合天气情景,对于情景信息的选择了天气,引入了天气敏感函数,公式如下:
30、
31、其中,w∈[1,6],表示六种不同的天气环境,ksw表示音乐s对天气w的敏感程度,若敏感ksw为1,不敏感则为0。
32、将两种融合要素相结合,得到最终的用户-音乐偏好权重ws,公式如下:
33、ws=λ*time+(1-λ)×weather(s,w)
34、其中,λ为权重因子。
35、进一步的,所述步骤4模型的训练与生成推荐的具体方法包括:
36、步骤4.1、寻找结点匹配,即在随机行走中出现彼此接近的节点对,意味着它们之间存在上下文关系。使用softmax函数计算超图中每个顶点vj作为输入结点vi∈vp的上下文顶点的概率,其中j∈{1,2,...,|v|}
37、
38、其中,uj为输入顶点的one-hot编码向量与嵌入矩阵wi、上下文矩阵w′o和用户-音乐偏好权重的乘积
39、
40、步骤4.2、生成推荐,首先对嵌入进行z-score归一化,然后为每个用户计算其嵌入与每一个我们想要推荐项目的嵌入之间的余弦相似度:
41、
42、最后,可以通过得分最高的top-k个项目,为用户选择k个推荐的歌曲。然后采用可视化的方法显示所预测用户任意时间感兴趣的音乐。
43、进一步的,所述步骤5模型评估的具体方法包括:
44、步骤5.1、设定平均绝对误差(mae)、平均相对误差(mape)、均方根误差(rmse)、thei1不等系数u,四个评价指标。评价指标的具数学公式如下:
45、平均绝对误差:
46、平均相对误差:
47、均方根误差rmse:
48、thei1不等系数:
49、步骤5.2、基于构建的基于超图的音乐推荐模型,结合步骤1中得到的测试集,通过第一步所述的四个评价指标进行模型评估,检验所拟合模型的充分性。
50、从以上技术方案可以看出,本发明具有以下优点:
51、传统推荐系统通常只考虑用户和物品之间的关系,而超图能够同时考虑多个实体之间的关系,从而更好地捕捉推荐中的多样性,通过超图能够更全面地了解用户的兴趣和偏好,从而提供更多样化的推荐结果。在传统图中,通常只有一个类型的边表示节点之间的连接。而在超图中,边可以是多类型的,允许更丰富的关系建模。这对于推荐系统来说特别重要,因为用户与物品之间的关系可能是多维度的,超图能够更好地捕捉这种复杂性,提高推荐准确度。并且超图允许节点之间的高阶关系,不仅可以考虑直接相连的节点,还可以考虑更远距离的节点之间的关系。这样推荐系统可以更好地利用上下文信息。同时超图可以更好地应对数据中的噪声和缺失,因为它可以通过多个实体之间的关系来填充缺失的信息,从而提高推荐系统的鲁棒性。
52、超图结构不仅包含与传统矩阵分解方法相关的附加信息,而且捕获与图方法相关的更高关系信息,能够无缝地表示用户与歌曲之间具有相关特征的所有可能和复杂的交互。除此之外,通过嵌入技术来训练超图学习,提供了一种通过向量映射推断用户与歌曲相似度的有效方法,并且不需要任何时态数据,而不需要利用其他方法解决冷启动问题。总体来说,引入超图可以增强音乐推荐系统的功能,提供更加个性化、多样化、上下文感知的音乐推荐体验,同时解决传统推荐系统在音乐领域所面临的一些问题。
53、在推荐过程中,为了更准确地反映用户的偏好和兴趣,考虑了用户对不同类型音乐的喜好、时间偏好情景、天气影响情景等。考虑了用户最近一段时间的喜好相比于考虑其过去一段时间的喜好要更有价值。并且用户当前的音乐偏好还受到天气环境因素的影响,在不同的天气环境下,人们会对不同类型的音乐产生不同的兴趣通过对时间情景的分析。这些都可以帮助我们准确的实现符合用户个人音乐喜好的推荐,从而提高用户的满意程度。