本申请涉及数据处理领域,尤其涉及一种歌曲推荐方法及装置。
背景技术:
当前智能音箱等智能设备越来越成为人们生活中的一部分。目前如何让智能音箱的反馈更加个性化,是现在技术不断追求的一个方向。
其中,智能音箱可以是一个音箱升级的产物,是家庭消费者用语音进行上网的一个工具,比如点播歌曲、上网购物,或是了解天气预报,它也可以对智能家居设备进行控制,比如打开窗帘、设置冰箱温度、提前让热水器升温等。
现有智能音箱的歌曲推荐系统通常都是仅考虑了歌曲推荐的准确性和不同类型歌曲的多样性。
然而,现有的歌曲推荐系统会为用户推荐该用户经常收听的类型的歌曲,导致用户只收听一种类型的歌曲,故现有的歌曲推荐系统的歌曲推荐在歌曲类型上具有局限性,降低了用户体验。
技术实现要素:
本申请实施例提供一种歌曲推荐方法及装置,解决了现有技术存在的上述问题,可以为用户推荐未收听过的类型的歌曲,提高了用户体验。
第一方面,提供了一种歌曲推荐方法,该方法可以包括:
接收终端发送的待推荐用户的用户属性信息;
查找存储的特征向量关系表,获取所述用户属性信息对应的用户特征向量和除所述待推荐用户的歌曲收听日志中历史收听歌曲之外的至少一首待推荐歌曲的歌曲特征向量;其中,所述特征向量关系表包括每个用户属性信息对应的用户特征向量与不同歌曲的歌曲特征向量间的对应关系、相应对应关系的关联概率和每个歌曲特征向量对应的歌曲属性信息;所述用户特征向量用于描述用户收听不同歌曲的收听行为特征;所述歌曲特征向量用于描述歌曲被不同用户收听的被收听特征;
采用预设推荐算法,对所述用户特征向量和所述至少一首待推荐歌曲的歌曲特征向量进行运算,得到所述待推荐用户与所述每首待推荐歌曲的关联概率;
向所述终端发送满足预设关联概率条件的待推荐歌曲。
在一个可选的实现中,所述特征向量关系表的获取过程具体包括;
获取至少两个用户的歌曲收听日志,所述歌曲收听日志包括每个用户的用户属性信息、历史收听歌曲和所述每个用户收听不同歌曲的收听行为;
采用特征提取算法,对所述歌曲收听日志中每个用户收听不同歌曲的收听行为进行特征提取,得到每首歌曲被不同用户收听的歌曲特征向量;
根据所述每个用户收听的歌曲,获取收听每首歌曲的至少一个用户;
采用所述特征提取算法,对所述歌曲收听日志中收听每首歌曲的至少一个用户的收听行为进行特征提取,得到每个用户收听不同歌曲的用户特征向量;
根据所述至少两个用户的用户属性信息、相应用户特征向量、所述每个用户收听的歌曲的歌曲特征向量以及相应歌曲属性信息,生成特征向量关系表。
在一个可选的实现中,采用特征提取算法,对所述歌曲收听日志中收听每首歌曲的至少一个用户的收听行为进行特征提取,得到每个用户收听不同歌曲的用户特征向量,包括:
采用预设聚类算法,对所述歌曲收听日志中收听每首歌曲的不同用户的收听行为进行聚类,得到用户间的关联程度值;
获取每个用户收听不同歌曲的初始用户特征向量;
采用预设相似算法,对每两个用户的初始用户特征向量进行运算,得到所述每两个用户的计算关联程度值和其相对于所述关联程度值的误差;
根据所述误差,对所述每两个目标用户的初始用户特征向量进行迭代修正,获取所述误差满足预设误差阈值时所述每两个用户中每个用户的用户特征向量。
在一个可选的实现中,采用特征提取算法,对所述歌曲收听日志中每个用户收听不同歌曲的收听行为进行特征提取,得到每首歌曲被不同用户收听的歌曲特征向量,包括:
采用预设聚类算法,对所述歌曲收听日志中每两个用户收听的不同歌曲进行聚类,得到歌曲间的关联程度值;
获取每首歌曲被不同用户收听的初始歌曲特征向量;
采用预设相似算法,对每两首歌曲的初始歌曲特征向量进行运算,得到所述每两首歌曲的计算关联程度值和相对于所述关联程度值的误差;
根据所述误差,对所述每两首歌曲的初始歌曲特征向量进行迭代修正,获取所述误差满足预设误差阈值时所述每两首歌曲中每首歌曲的歌曲特征向量。在一个可选的实现中,根据所述至少两个用户的用户属性信息、相应用户特征向量、所述每个用户收听的歌曲的歌曲特征向量以及相应歌曲属性信息,生成特征向量关系表,包括:
根据所述每首歌曲的歌曲特征向量和相应歌曲属性信息,获取所述每首歌曲的目标歌曲特征向量,并根据所述每个用户的用户属性信息和相应用户特征向量,获取所述每个用户的目标用户特征向量;
采用所述预设相似算法,对所述目标歌曲特征向量和所述目标用户特征向量进行运算,得到所述每个用户对应所述每首歌曲的关联概率;
生成特征向量关系表。
在一个可选的实现中,采用所述预设相似算法,对所述目标歌曲特征向量和所述目标用户特征向量进行运算,得到所述每个用户对应所述每首歌曲的关联概率之前,所述方法还包括:
将具有预设收听行为的歌曲确定为第一类歌曲,并将不具有所述预设收听行为的歌曲确定为第二类歌曲;
采用所述预设相似算法,对所述目标歌曲特征向量和所述目标用户特征向量进行运算,得到所述每个用户与所述每首歌曲的关联概率,包括:
若所述目标歌曲特征向量对应的歌曲为所述第一类歌曲,则采用所述预设相似算法,对所述目标歌曲特征向量和所述目标用户特征向量进行运算,得到所述每个用户与所述第一类歌曲中每首歌曲的中间关联概率;
将所述中间关联概率与预设概率做差值运算后,获取所述每个用户与所述第一类歌曲中每首歌曲的关联概率;
若所述目标歌曲特征向量对应的歌曲为所述第二类歌曲,则采用所述预设相似算法,对所述目标歌曲特征向量和所述目标用户特征向量进行运算,得到所述每个用户与所述第二类歌曲中每首歌曲的关联概率。
在一个可选的实现中,所述预设收听行为为用户收听时长不大于预设时间段的收听行为。
第二方面,提供了一种歌曲推荐装置,该装置可以包括:接收单元、获取单元、运算单元和发送单元;
所述接收单元,用于接收终端发送的待推荐用户的用户属性信息;
所述获取单元,用于查找存储的特征向量关系表,获取所述用户属性信息对应的用户特征向量和除所述待推荐用户的歌曲收听日志中历史收听歌曲之外的至少一首待推荐歌曲的歌曲特征向量;其中,所述特征向量关系表包括每个用户属性信息对应的用户特征向量与不同歌曲的歌曲特征向量间的对应关系、相应对应关系的关联概率和每个歌曲特征向量对应的歌曲属性信息;所述用户特征向量用于描述用户收听不同歌曲的收听行为特征;所述歌曲特征向量用于描述歌曲被不同用户收听的被收听特征;
所述运算单元,用于采用预设推荐算法,对所述用户特征向量和所述至少一首待推荐歌曲的歌曲特征向量进行运算,得到所述待推荐用户与所述每首待推荐歌曲的关联概率;
所述发送单元,用于向所述终端发送满足预设关联概率条件的待推荐歌曲。
在一个可选的实现中,所述装置还包括:提取单元和生成单元;
所述获取单元,还用于获取至少两个用户的歌曲收听日志,所述歌曲收听日志包括每个用户的用户属性信息、历史收听歌曲和所述每个用户收听不同歌曲的收听行为;
所述提取单元,用于采用特征提取算法,对所述歌曲收听日志中每个用户收听不同歌曲的收听行为进行特征提取,得到每首歌曲被不同用户收听的歌曲特征向量;
所述获取单元,还用于根据所述每个用户收听的歌曲,获取收听每首歌曲的至少一个用户;
所述提取单元,还用于采用所述特征提取算法,对所述歌曲收听日志中收听每首歌曲的至少一个用户的收听行为进行特征提取,得到每个用户收听不同歌曲的用户特征向量;
所述生成单元,用于根据所述至少两个用户的用户属性信息、相应用户特征向量、所述每个用户收听的歌曲的歌曲特征向量以及相应歌曲属性信息,生成特征向量关系表。
在一个可选的实现中,所述提取单元,具体用于采用预设聚类算法,对所述歌曲收听日志中收听每首歌曲的不同用户的收听行为进行聚类,得到用户间的关联程度值;
获取每个用户收听不同歌曲的初始用户特征向量;
采用预设相似算法,对每两个用户的初始用户特征向量进行运算,得到所述每两个用户的计算关联程度值和其相对于所述关联程度值的误差;
根据所述误差,对所述每两个目标用户的初始用户特征向量进行迭代修正,获取所述误差满足预设误差阈值时所述每两个用户中每个用户的用户特征向量。
在一个可选的实现中,所述提取单元,还具体用于采用预设聚类算法,对所述歌曲收听日志中每两个用户收听的不同歌曲进行聚类,得到歌曲间的关联程度值;
获取每首歌曲被不同用户收听的初始歌曲特征向量;
采用预设相似算法,对每两首歌曲的初始歌曲特征向量进行运算,得到所述每两首歌曲的计算关联程度值和相对于所述关联程度值的误差;
根据所述误差,对所述每两首歌曲的初始歌曲特征向量进行迭代修正,获取所述误差满足预设误差阈值时所述每两首歌曲中每首歌曲的歌曲特征向量。
在一个可选的实现中,所述生成单元,具体用于根据所述每首歌曲的歌曲特征向量和相应歌曲属性信息,获取所述每首歌曲的目标歌曲特征向量,并根据所述每个用户的用户属性信息和相应用户特征向量,获取所述每个用户的目标用户特征向量;
采用所述预设相似算法,对所述目标歌曲特征向量和所述目标用户特征向量进行运算,得到所述每个用户对应所述每首歌曲的关联概率;
生成特征向量关系表。
在一个可选的实现中,所述装置还包括确定单元;
所述确定单元,用于将具有预设收听行为的歌曲确定为第一类歌曲,并将不具有所述预设收听行为的歌曲确定为第二类歌曲;
所述获取单元,还用于若所述目标歌曲特征向量对应的歌曲为所述第一类歌曲,则采用所述预设相似算法,对所述目标歌曲特征向量和所述目标用户特征向量进行运算,得到所述每个用户与所述第一类歌曲中每首歌曲的中间关联概率;
将所述中间关联概率与预设概率做差值运算后,获取所述每个用户与所述第一类歌曲中每首歌曲的关联概率;
若所述目标歌曲特征向量对应的歌曲为所述第二类歌曲,则采用所述预设相似算法,对所述目标歌曲特征向量和所述目标用户特征向量进行运算,得到所述每个用户与所述第二类歌曲中每首歌曲的关联概率。
在一个可选的实现中,所述预设收听行为为用户收听时长不大于预设时间段的收听行为。
第三方面,提供了一种电子设备,该电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面中任一所述的方法步骤。
第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一所述的方法步骤。
本发明实施例的歌曲推荐方法中服务器在接收终端发送的待推荐用户的用户属性信息后,查找存储的特征向量关系表,获取用户属性信息对应的用户特征向量和除待推荐用户的歌曲收听日志中历史收听歌曲之外的至少一首待推荐歌曲的歌曲特征向量;特征向量关系表包括每个用户属性信息对应的用户特征向量与不同歌曲的歌曲特征向量间的对应关系、相应对应关系的关联概率和每个歌曲特征向量对应的歌曲属性信息;用户特征向量用于描述用户收听不同歌曲的收听行为特征;歌曲特征向量用于描述歌曲被不同用户收听的被收听特征;采用预设推荐算法,对用户特征向量和至少一首待推荐歌曲的歌曲特征向量进行运算,得到待推荐用户与每首待推荐歌曲的关联概率;向终端发送满足预设关联概率条件的待推荐歌曲。该方法可以为用户推荐未收听过的类型的歌曲,提高了用户体验。
附图说明
图1为本发明实施例提供的一种歌曲推荐方法及装置;
图2为本发明实施例提供的一种歌曲推荐方法的流程示意图;
图3为本发明实施例提供的一种歌曲推荐装置的结构示意图;
图4为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,并不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本发明实施例提供的歌曲推荐方法可以应用在服务器上,也可以应用在终端上,或者,应用在如图1所示的服务器和终端(如智能音箱)组成的系统中。
例如,图1中的终端可以用于接收用户的推荐播放语音指令、向用户播放歌曲、存储语音特征与用户属性信息的关系,即不同用户的语音特征与相应用户的用户属性信息的关系,以及可以根据用户的当前语音特征确定用户属性信息等。其中,用户属性信息可以包括用户标识、年龄、职业等用户信息。
服务器可以用于存储每个用户的歌曲收听日志,该歌曲收听日志可以包括用户属性信息、历史收听歌曲,以及收听不同歌曲的收听行为,歌曲收听时间等,收听行为可以包括完整收听歌曲的行为、收藏行为、点赞行为或循环播放行为、切歌行为等。
以及,可以用于根据终端确定的用户属性信息,获取待推荐歌曲,并将待推荐歌曲发送至终端。
为了保证推荐的精确性,服务器可以是具有较强计算能力的应用服务器或云服务器;终端可以是具有较强的计算能力的移动电话、智能电话、智能音箱、笔记本电脑、数字广播接收器、个人数字助理(pda)、平板电脑(pad)等用户设备(userequipment,ue)、手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备、移动台(mobilestation,ms)、移动终端(mobileterminal)等。该终端具备经无线接入网(radioaccessnetwork,ran)与一个或多个核心网进行通信的能力。
本申请提供的歌曲推荐方法可以从惊喜度上为当前用户推荐其没有接触收听过的歌曲类型的歌曲,该歌曲是与当前用户对应的相似用户的历史收听歌曲,且与当前用户历史收听歌曲的歌曲类型不同。相似用户是与当前用户存在相同或相似的歌曲收听特点,如喜欢收听相同的歌曲类型等。
由于当前用户与相似用户存在相似歌曲收听特点,故相似用户历史收听的歌曲类型中除与当前用户的相同歌曲类型外的不同歌曲类型也可以得到当前用户的喜爱,该不同歌曲类型的歌曲相对于当前用户可以具有较高惊喜度,故可以向当前用户推荐相似用户与当前用户间的不同歌曲类型的歌曲。
其中,惊喜度可以是指:
(1)给用户推荐该用户历史的收听列表中不曾听过的歌曲,且也不曾听过相似类型的歌曲;
(2)用户对于推荐的歌能够完整听完,或进行收藏,或进行二次点播等;
可选的,惊喜度还可以是指用户对该类型的歌曲或开始进行点播或收听。
以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明,并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
图2为本发明实施例提供的一种歌曲推荐方法的流程示意图。如图2所示,该方法可以包括:
步骤210、终端根据待推荐用户的推荐播放语音指令的语音特征,确定待推荐用户的用户属性信息。
以终端为智能音箱为例,智能音箱接收待推荐用户的推荐播放语音指令,并采用预设特征提取算法提取该推荐播放语音指令的语音特征。
智能音箱查找存储的语音特征与用户属性信息的关系,获取待推荐用户的语音特征对应的用户属性信息。
步骤220、终端向服务器发送待推荐用户的用户属性信息。
步骤230、服务器查找存储的特征向量关系表,获取用户属性信息对应的用户特征向量和除待推荐用户的歌曲收听日志中历史收听歌曲之外的至少一首待推荐歌曲的歌曲特征向量。
其中,特征向量关系表可以包括每个用户属性信息对应的用户特征向量与不同歌曲的歌曲特征向量间的对应关系、相应对应关系的关联概率和每个歌曲特征向量对应的歌曲属性信息;用户特征向量可以用于描述用户收听不同歌曲的收听行为特征;歌曲特征向量可以用于描述歌曲被不同用户收听的被收听特征,被收听特征表征歌曲的被收听信息。
其中,收听行为特征可以包括完整收听歌曲的行为特征、收藏行为特征、点赞行为特征或循环播放行为特征、切歌行为特征等。
被收听特征可以包括被收听时长、被收听次数、被连续收听次数、被收听时间等。
可选的,特征向量关系表的获取过程具体可以包括;
首先,获取至少两个用户的歌曲收听日志,其中,歌曲收听日志可以包括每个用户的用户属性信息、历史收听歌曲和每个用户收听不同歌曲的收听行为;收听行为可以包括完整收听歌曲的行为、收藏行为、点赞行为或循环播放行为、切歌行为等。
然后,采用特征提取算法,对歌曲收听日志中每个用户收听不同歌曲的收听行为进行特征提取,得到每首歌曲被不同用户收听的歌曲特征向量;
具体的,采用预设聚类算法,如word2vec算法,对歌曲收听日志中每两个用户收听的歌曲进行聚类,得到歌曲间的关联程度值,即每两首歌曲连续播放的关联概率;
随机生成每首歌曲被至少两个用户收听的初始歌曲特征向量,从而获取每首歌曲被不同用户收听的初始歌曲特征向量;
采用预设相似算法,如余弦相似度算法、欧氏距离算法等,对每两首歌曲的初始歌曲特征向量进行运算,得到相应每两首歌曲的计算关联程度值和其相对于所述关联程度值的误差;
根据误差,对每两首歌曲的初始歌曲特征向量进行迭代修正,获取误差满足预设误差阈值时每两首歌曲中每首歌曲的歌曲特征向量。
例如,上述步骤可以具体包括:
1,首先将歌曲a和歌曲b分别随机生成一个随机的初始歌曲特征向量;
2,采用统计学算法,可以根据随机歌曲特征向量构成一个有向图,同时得到歌曲a和歌曲b的关联程度值;
3,在第一轮迭代开始时,利用随机生成的初始歌曲特征向量,计算歌曲a和b的余弦相似度,作为两首歌曲的计算关联程度值,再对比统计得到的关联程度值,获得两者间的误差;
4,利用反向传播和梯度下降的算法,求误差的梯度,并设置固定学习率,由此可对随机生成的初始歌曲特征向量进行修正,得到歌曲特征向量;
5,下一轮迭代使用上一轮修正后的歌曲特征向量,直到总体误差不大于预设误差阈值后迭代结束,得到歌曲a和b对应的当前的歌曲特征向量。
进一步的,服务器可以根据每个用户收听的歌曲,获取收听每首歌曲的至少一个用户;采用特征提取算法,对歌曲收听日志收听每首歌曲的至少一个用户的收听行为进行特征提取,得到每个用户收听不同歌曲的用户特征向量;
具体的,服务器可以采用预设聚类算法,对歌曲收听日志中收听每首歌曲的不同用户的收听行为进行聚类,得到用户间的关联程度值;
获取每个用户收听不同歌曲的初始用户特征向量;
采用预设相似算法,对每两个用户的初始用户特征向量进行运算,得到相应每两个用户的计算关联程度值和相对于关联程度值的误差;
根据误差,对每两个用户的初始用户特征向量进行迭代修正,获取误差满足预设误差阈值时每两个用户中每个用户的用户特征向量。
之后,服务器可以根据至少两个用户的用户属性信息、相应用户特征向量、每个用户收听的歌曲的歌曲特征向量以及相应歌曲属性信息,生成特征向量关系表。
服务器可以根据每首歌曲的歌曲特征向量和相应歌曲属性信息,获取每首歌曲的目标歌曲特征向量,并根据每个用户的用户属性信息和相应用户特征向量,获取每个用户的目标用户特征向量;
采用预设相似算法,对目标歌曲特征向量和目标用户特征向量进行运算,得到每个用户对应每首歌曲的关联概率,从而生成特征向量关系表。
可选的,在得到每个用户对应每首歌曲的关联概率之前,服务器可以将具有预设收听行为的歌曲确定为第一类歌曲,并将不具有预设收听行为的歌曲确定为第二类歌曲;其中,预设收听行为可以为用户收听时长不大于预设时间段的收听行为。
例如,基于用户的歌曲收听日志,将用户完整收听的歌曲、收藏、点赞或循环播放过的歌曲作为第二样本,将用户收听时间在30s以内的歌曲作为第一样本。
此时,若目标歌曲特征向量对应的歌曲为第一类歌曲,则服务器可以采用预设相似算法,对目标歌曲特征向量和目标用户特征向量进行运算,得到每个用户与所述第一类歌曲中每首歌曲的中间关联概率,并将中间关联概率与预设概率做差值运算后,获取每个用户与第一类歌曲中每首歌曲的关联概率;
若目标歌曲特征向量对应的歌曲为第二类歌曲,则服务器可以采用预设相似算法,对目标歌曲特征向量和目标用户特征向量进行运算,得到每个用户与第二类歌曲中每首歌曲的关联概率。
步骤240、服务器采用预设推荐算法,对用户特征向量和至少一首待推荐歌曲的歌曲特征向量进行运算,得到待推荐用户与每首待推荐歌曲的关联概率。
服务器可以采用余弦相似度算法,对用户特征向量和至少一首中的每首待推荐歌曲的歌曲特征向量进行运算,得到待推荐用户对应的至少一个关联概率。
步骤250、服务器向终端发送满足预设关联概率条件的待推荐歌曲。
可选的,服务器可以将得到的至少一个关联概率进行排序,并将满足预设关联概率条件的待推荐歌曲发送至终端,如智能音箱,以使智能音箱播放待推荐歌曲。
其中,满足预设关联概率条件可以是关联概率大于预设概率阈值,即服务器将大于预设概率阈值的预设概率对应的待推荐歌曲发送至终端。
或者,满足预设关联概率条件可以是按照从大到小排序后的关联概率中预设数量个在前的关联概率。
本发明实施例的歌曲推荐方法中服务器在接收终端发送的待推荐用户的用户属性信息后,用户信息是终端根据待推荐用户的推荐播放语音指令的语音特征和存储的语音特征与用户属性信息的关系确定的;查找存储的特征向量关系表,获取用户属性信息对应的用户特征向量和除待推荐用户的歌曲收听日志中历史收听歌曲之外的至少一首待推荐歌曲的歌曲特征向量;特征向量关系表包括每个用户属性信息对应的用户特征向量与不同歌曲的歌曲特征向量间的对应关系、相应对应关系的关联概率和每个歌曲特征向量对应的歌曲属性信息;用户特征向量用于描述用户收听不同歌曲的收听行为特征;歌曲特征向量用于描述歌曲被不同用户收听的被收听特征;采用预设推荐算法,对用户特征向量和至少一首待推荐歌曲的歌曲特征向量进行运算,得到待推荐用户与每首待推荐歌曲的关联概率;向终端发送满足预设关联概率条件的待推荐歌曲。该方法可以为用户推荐未收听过的类型的歌曲,提高了用户体验。
与上述方法对应的,本发明实施例还提供一种歌曲推荐装置,如图3所示,该歌曲推荐装置包括:接收单元310、获取单元320、运算单元330和发送单元340;
接收单元310,用于接收终端发送的待推荐用户的用户属性信息;
获取单元320,用于查找存储的特征向量关系表,获取所述用户属性信息对应的用户特征向量和除所述待推荐用户的歌曲收听日志中历史收听歌曲之外的至少一首待推荐歌曲的歌曲特征向量;其中,所述特征向量关系表包括每个用户属性信息对应的用户特征向量与不同歌曲的歌曲特征向量间的对应关系、相应对应关系的关联概率和每个歌曲特征向量对应的歌曲属性信息;所述用户特征向量用于描述用户收听不同歌曲的收听行为特征;所述歌曲特征向量用于描述歌曲被不同用户收听的被收听特征;
运算单元330,用于采用预设推荐算法,对所述用户特征向量和所述至少一首待推荐歌曲的歌曲特征向量进行运算,得到所述待推荐用户与所述每首待推荐歌曲的关联概率;
发送单元340,用于向所述终端发送满足预设关联概率条件的待推荐歌曲。
在一个可选的实现中,所述装置还包括:提取单元350和生成单元360;
获取单元320,还用于获取至少两个用户的歌曲收听日志,所述歌曲收听日志包括每个用户的用户属性信息、历史收听歌曲和所述每个用户收听不同歌曲的收听行为;
提取单元350,用于采用特征提取算法,对所述歌曲收听日志中每个用户收听不同歌曲的收听行为进行特征提取,得到每首歌曲被不同用户收听的歌曲特征向量;
获取单元320,还用于根据所述每个用户收听的歌曲,获取收听每首歌曲的至少一个用户;
提取单元350,还用于采用所述特征提取算法,对所述歌曲收听日志中收听每首歌曲的至少一个用户的收听行为进行特征提取,得到每个用户收听不同歌曲的用户特征向量;
生成单元360,用于根据所述至少两个用户的用户属性信息、相应用户特征向量、所述每个用户收听的歌曲的歌曲特征向量以及相应歌曲属性信息,生成特征向量关系表。
在一个可选的实现中,提取单元350,具体用于采用预设聚类算法,对所述歌曲收听日志中收听每首歌曲的不同用户的收听行为进行聚类,得到用户间的关联程度值;
获取每个用户收听不同歌曲的初始用户特征向量;
采用预设相似算法,对每两个用户的初始用户特征向量进行运算,得到所述每两个用户的计算关联程度值和其相对于所述关联程度值的误差;
根据所述误差,对所述每两个目标用户的初始用户特征向量进行迭代修正,获取所述误差满足预设误差阈值时所述每两个用户中每个用户的用户特征向量。
在一个可选的实现中,提取单元350,还具体用于采用预设聚类算法,对所述歌曲收听日志中每两个用户收听的不同歌曲进行聚类,得到歌曲间的关联程度值;
获取每首歌曲被不同用户收听的初始歌曲特征向量;
采用预设相似算法,对每两首歌曲的初始歌曲特征向量进行运算,得到所述每两首歌曲的计算关联程度值和相对于所述关联程度值的误差;
根据所述误差,对所述每两首歌曲的初始歌曲特征向量进行迭代修正,获取所述误差满足预设误差阈值时所述每两首歌曲中每首歌曲的歌曲特征向量。
在一个可选的实现中,生成单元360,具体用于根据所述每首歌曲的歌曲特征向量和相应歌曲属性信息,获取所述每首歌曲的目标歌曲特征向量,并根据所述每个用户的用户属性信息和相应用户特征向量,获取所述每个用户的目标用户特征向量;
采用所述预设相似算法,对所述目标歌曲特征向量和所述目标用户特征向量进行运算,得到所述每个用户对应所述每首歌曲的关联概率;
生成特征向量关系表。
在一个可选的实现中,所述装置还包括确定单元370;
确定单元370,用于将具有预设收听行为的歌曲确定为第一类歌曲,并将不具有所述预设收听行为的歌曲确定为第二类歌曲;
获取单元320,还用于若所述目标歌曲特征向量对应的歌曲为所述第一类歌曲,则采用所述预设相似算法,对所述目标歌曲特征向量和所述目标用户特征向量进行运算,得到所述每个用户与所述第一类歌曲中每首歌曲的中间关联概率;
将所述中间关联概率与预设概率做差值运算后,获取所述每个用户与所述第一类歌曲中每首歌曲的关联概率;
若所述目标歌曲特征向量对应的歌曲为所述第二类歌曲,则采用所述预设相似算法,对所述目标歌曲特征向量和所述目标用户特征向量进行运算,得到所述每个用户与所述第二类歌曲中每首歌曲的关联概率。
在一个可选的实现中,所述预设收听行为为用户收听时长不大于预设时间段的收听行为。
本发明上述实施例提供的歌曲推荐装置的各功能单元的功能,可以通过上述各方法步骤来实现,因此,本发明实施例提供的歌曲推荐装置中的各个单元的具体工作过程和有益效果,在此不复赘述。
本发明实施例还提供了一种电子设备,如图4所示,包括处理器410、通信接口420、存储器430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。
存储器430,用于存放计算机程序;
处理器410,用于执行存储器430上所存放的程序时,实现如下步骤:
接收终端发送的待推荐用户的用户属性信息;
查找存储的特征向量关系表,获取所述用户属性信息对应的用户特征向量和除所述待推荐用户的歌曲收听日志中历史收听歌曲之外的至少一首待推荐歌曲的歌曲特征向量;其中,所述特征向量关系表包括每个用户属性信息对应的用户特征向量与不同歌曲的歌曲特征向量间的对应关系、相应对应关系的关联概率和每个歌曲特征向量对应的歌曲属性信息;所述用户特征向量用于描述用户收听不同歌曲的收听行为特征;所述歌曲特征向量用于描述歌曲被不同用户收听的被收听特征;
采用预设推荐算法,对所述用户特征向量和所述至少一首待推荐歌曲的歌曲特征向量进行运算,得到所述待推荐用户与所述每首待推荐歌曲的关联概率;
向所述终端发送满足预设关联概率条件的待推荐歌曲。
在一个可选的实现中,所述特征向量关系表的获取过程具体包括;
获取至少两个用户的歌曲收听日志,所述歌曲收听日志包括每个用户的用户属性信息、历史收听歌曲和所述每个用户收听不同歌曲的收听行为;
采用特征提取算法,对所述歌曲收听日志中每个用户收听不同歌曲的收听行为进行特征提取,得到每首歌曲被不同用户收听的歌曲特征向量;
根据所述每个用户收听的歌曲,获取收听每首歌曲的至少一个用户;
采用所述特征提取算法,对所述歌曲收听日志中收听每首歌曲的至少一个用户的收听行为进行特征提取,得到每个用户收听不同歌曲的用户特征向量;
根据所述至少两个用户的用户属性信息、相应用户特征向量、所述每个用户收听的歌曲的歌曲特征向量以及相应歌曲属性信息,生成特征向量关系表。
在一个可选的实现中,采用特征提取算法,对所述歌曲收听日志中收听每首歌曲的至少一个用户的收听行为进行特征提取,得到每个用户收听不同歌曲的用户特征向量,包括:
采用预设聚类算法,对所述歌曲收听日志中收听每首歌曲的不同用户的收听行为进行聚类,得到用户间的关联程度值;
获取每个用户收听不同歌曲的初始用户特征向量;
采用预设相似算法,对每两个用户的初始用户特征向量进行运算,得到所述每两个用户的计算关联程度值和其相对于所述关联程度值的误差;
根据所述误差,对所述每两个目标用户的初始用户特征向量进行迭代修正,获取所述误差满足预设误差阈值时所述每两个用户中每个用户的用户特征向量。
在一个可选的实现中,采用特征提取算法,对所述歌曲收听日志中每个用户收听不同歌曲的收听行为进行特征提取,得到每首歌曲被不同用户收听的歌曲特征向量,包括:
采用预设聚类算法,对所述歌曲收听日志中每两个用户的不同歌曲进行聚类,得到歌曲间的关联程度值;
获取每首歌曲被不同用户收听的初始歌曲特征向量;
采用预设相似算法,对每两首歌曲的初始歌曲特征向量进行运算,得到所述每两首歌曲的计算关联程度值和相对于所述关联程度值的误差;
根据所述误差,对所述每两首歌曲的初始歌曲特征向量进行迭代修正,获取所述误差满足预设误差阈值时所述每两首歌曲中每首歌曲的歌曲特征向量。
在一个可选的实现中,根据所述至少两个用户的用户属性信息、相应用户特征向量、所述每个用户收听的歌曲的歌曲特征向量以及相应歌曲属性信息,生成特征向量关系表,包括:
根据所述每首歌曲的歌曲特征向量和相应歌曲属性信息,获取所述每首歌曲的目标歌曲特征向量,并根据所述每个用户的用户属性信息和相应用户特征向量,获取所述每个用户的目标用户特征向量;
采用所述预设相似算法,对所述目标歌曲特征向量和所述目标用户特征向量进行运算,得到所述每个用户对应所述每首歌曲的关联概率;
生成特征向量关系表。
在一个可选的实现中,采用所述预设相似算法,对所述目标歌曲特征向量和所述目标用户特征向量进行运算,得到所述每个用户对应所述每首歌曲的关联概率之前,所述方法还包括:
将具有预设收听行为的歌曲确定为第一类歌曲,并将不具有所述预设收听行为的歌曲确定为第二类歌曲;
采用所述预设相似算法,对所述目标歌曲特征向量和所述目标用户特征向量进行运算,得到所述每个用户与所述每首歌曲的关联概率,包括:
若所述目标歌曲特征向量对应的歌曲为所述第一类歌曲,则采用所述预设相似算法,对所述目标歌曲特征向量和所述目标用户特征向量进行运算,得到所述每个用户与所述第一类歌曲中每首歌曲的中间关联概率;
将所述中间关联概率与预设概率做差值运算后,获取所述每个用户与所述第一类歌曲中每首歌曲的关联概率;
若所述目标歌曲特征向量对应的歌曲为所述第二类歌曲,则采用所述预设相似算法,对所述目标歌曲特征向量和所述目标用户特征向量进行运算,得到所述每个用户与所述第二类歌曲中每首歌曲的关联概率。
在一个可选的实现中,所述预设收听行为为用户收听时长不大于预设时间段的收听行为。
上述提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(randomaccessmemory,ram),也可以包括非易失性存储器(non-volatilememory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
由于上述实施例中电子设备的各器件解决问题的实施方式以及有益效果可以参见图2所示的实施例中的各步骤来实现,因此,本发明实施例提供的电子设备的具体工作过程和有益效果,在此不复赘述。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的歌曲推荐方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的歌曲推荐方法。
本领域内的技术人员应明白,本申请实施例中的实施例可提供为方法、系统、或计算机程序产品。因此,本申请实施例中可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例中可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例中是参照根据本申请实施例中实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例中的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例中范围的所有变更和修改。
显然,本领域的技术人员可以对本申请实施例中实施例进行各种改动和变型而不脱离本申请实施例中实施例的精神和范围。这样,倘若本申请实施例中实施例的这些修改和变型属于本申请实施例中权利要求及其等同技术的范围之内,则本申请实施例中也意图包含这些改动和变型在内。