本发明涉及歌单数据处理技术领域,具体涉及一种歌单列表确定方法、装置及电子设备。
背景技术:
歌单列表为音乐播放应用推荐给用户的歌单集合,一个歌单可以为多首歌曲的集合;音乐播放应用如提供音乐播放服务的网页,安装于用户终端上提供音乐播放服务的客户端等;
目前歌单列表确定方式主要为:依据歌单列表的类型,从歌单库中筛选歌单的类型与歌单列表的类型对应的歌单,将筛选出的歌单集合到歌单列表中;如一歌单列表的类型为热门播放,则可从歌单库中筛选出热门播放的歌单,将筛选出的热门播放的歌单集合到歌单列表中,形成具有歌单热门播放的歌单列表。
本发明的发明人在研究过程中发现,目前歌单列表是统一推荐给用户的,即给所有用户推荐的歌单列表中的歌单均是相同的,歌单列表中的歌单与所推荐的用户的相关性不高,这导致歌单列表推荐后,歌单列表的收听转化率较低;因此提供一种新的歌单列表确定方法,使得歌单列表中的歌单与所推荐的用户具有较高的相关性,为提升歌单列表的收听转化率提供可能,成为本领域技术人员需要考虑的问题。
技术实现要素:
有鉴于此,本发明实施例提供一种歌单列表确定方法、装置及电子设备,以使得歌单列表中的歌单与所推荐的用户具有较高的相关性,为提升歌单列表的收听转化率提供可能。
为实现上述目的,本发明实施例提供如下技术方案:
一种歌单列表确定方法,包括:
确定多个预选歌单;
确定各预选歌单的音乐特征的特征数据,及目标用户偏好的音乐特征的特征数据,其中一个歌单具有至少一个音乐特征;
对于各预选歌单,确定预选歌单与目标用户的各相同音乐特征的特征数据的相关系数;
根据各预选歌单与目标用户的相同音乐特征的特征数据的相关系数,从所述多个预选歌单中确定候选歌单;
从所述候选歌单中确定组成歌单列表的歌单。
本发明实施例还提供一种歌单列表确定装置,包括:
预选歌单确定模块,用于确定多个预选歌单;
特征数据确定模块,用于确定各预选歌单的音乐特征的特征数据,及目标用户偏好的音乐特征的特征数据,其中一个歌单具有至少一个音乐特征;
相关系数确定模块,用于对于各预选歌单,确定预选歌单与目标用户的各相同音乐特征的特征数据的相关系数;
候选歌单确定模块,用于根据各预选歌单与目标用户的相同音乐特征的特征数据的相关系数,从所述多个预选歌单中确定候选歌单;
歌单列表确定模块,用于从所述候选歌单中确定组成歌单列表的歌单。
本发明实施例还提供一种电子设备,包括上述所述的歌单列表确定装置。
基于上述技术方案,本发明实施例通过确定预选歌单与目标用户的各相同音乐特征的特征数据的相关系数,可得出预选歌单与目标用户就相同音乐特征的相关性,从而从多个预选歌单中确定出与目标用户就相同音乐特征的相关性较高的歌单,得到目标用户所偏好的候选歌单;从目标用户所偏好的候选歌单中确定组成歌单列表的歌单,可使得歌单列表的歌单为目标用户所偏好的概率大幅提升,使得本发明实施例所确定的歌单列表推荐给目标用户后,被目标用户点击收听的可能性极大的提升,为提升歌单列表的收听转化率提供了可能。本发明实施例提供的歌单列表确定方法,能够使得歌单列表中的歌单与所推荐的目标用户具有较高的相关性,为提升歌单列表的收听转化率提供了可能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的歌单列表确定方法的流程图;
图2为本发明实施例提供的从所述多个预选歌单中确定候选歌单的方法流程图;
图3为本发明实施例提供的基于音乐画像数据判断该预选歌单是否为候选歌单的方法流程图;
图4为本发明实施例提供的从候选歌单中确定组成歌单列表的歌单的方法流程图;
图5为歌单与用户关联子图的示意图;
图6为本发明实施例提供的歌单列表确定方法的另一流程图;
图7为本发明实施例提供的歌单列表确定装置的结构框图;
图8为本发明实施例提供的相关系数确定模块的结构框图;
图9为本发明实施例提供的候选歌单确定模块的结构框图;
图10为本发明实施例提供的判断确定单元的结构框图;
图11为本发明实施例提供的歌单列表确定模块的结构框图;
图12为本发明实施例提供的歌单列表确定装置的另一结构框图;
图13为本发明实施例提供的电子设备的硬件结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的歌单列表确定方法的流程图,该方法可应用于电子设备,电子设备如提供有音乐播放服务的服务器,也可以为具有数据处 理能力的用户侧设备;参照图1,该方法可以包括:
步骤S100、确定多个预选歌单;
可选的,本发明实施例可从歌单库中选取多个预选歌单,选取方式可以为随机;
可选的,歌单库的歌单数据主要来自于UGC(User Generated Content,用户原创内容)数据,这导致歌单库中的歌单质量有好有坏,为使得后续推荐给用户的歌单列表具有较好的质量,本发明实施例可设置一定的筛选规则从歌单库中筛选出符合筛选规则的多个预选歌单;
可选的,筛选规则如歌单名应符合预定歌单名书写规则,和/或,歌单描述内容应符合预定歌单描述内容书写规则,和/或,歌单中歌曲相关数量数据应符合预定数量要求,和/或,歌单中歌曲相关收听数据应符合预定收听要求等。
步骤S110、确定各预选歌单的音乐特征的特征数据,及目标用户偏好的音乐特征的特征数据,其中一个歌单具有至少一个音乐特征;
可选的,音乐特征可以认为是从歌单中抽离的音乐属性的类型,音乐属性的类型如歌单的歌手、歌曲、流派、年代、语种、旋律等;本发明实施例可预置歌单的至少一个音乐属性的类型作为歌单的音乐特征,从而预置至少一个音乐特征;如本发明实施例可从歌单的歌手、歌曲、流派、年代、语种、旋律等音乐属性的类型中选取一种或多种,作为本发明实施例所用的歌单的音乐特征;
可选的,在本发明实施例中,歌单的歌手特征可以歌单中各歌曲的歌手数量集合作为一个特征向量来看待的;比如一个歌单中包含2首歌手A的歌曲,一首歌手B的歌曲,两首歌手C的歌曲,则歌单的歌手特征就为((歌手A,2),(歌手B,1),(歌手C,2));歌单中的流派特征,则可简化处理,选取歌单的歌曲中所属数量最大的流派作为歌单的流派;显然,歌单中流派特征的处理也可依照歌手特征的处理方式;歌单中年代、语种、旋律等其他音乐特征的处理可依流派特征的处理或歌手特征的处理方式,具体可视实际情况而定;
可选的,歌单的歌曲特征可以包含歌曲的流派,语种,年代,播放量等信息;
在确定本发明实施例所用的歌单的至少一个音乐特征后,对于各预选歌单,本发明实施例可确定预选歌单的各音乐特征的特征数据,音乐特征的特征数据可以认为是对音乐特征的值表示;
具体的,对于预选歌单中的各音乐特征,本发明实施例可将音乐特征的相关数据抽象为音乐特征向量,对音乐特征的音乐特征向量进行取值,得到音乐特征的音乐特征向量的特征值,则音乐特征的特征值可以视为是音乐特征的特征数据;通过确定各预选歌单中的各音乐特征的特征值,则可确定出各预选歌单的各音乐特征的特征数据;
如歌单的音乐特征为歌手特征、歌曲特征、流派特征,则本发明实施例可将各预选歌单的歌手特征的相关数据抽象为歌手特征向量,将歌曲特征的相关数据抽象为歌曲特征向量,将流派特征的相关数据抽象为流派特征向量,取得各预选歌单的歌手特征向量的特征值,歌曲特征向量的特征值,流派特征向量的特征值,实现各预选歌单的歌手特征的特征数据,歌曲特征的特征数据,流派特征的特征数据的确定;
目标用户为歌单列表所推荐的具体用户,目标用户偏好的音乐特征与本发明实施例所设置的歌单的音乐特征相应,即本发明实施例所设置的歌单的音乐特征是哪几个,则目标用户偏好的音乐特征也是哪几个;
可选的,目标用户可定义偏好的音乐特征的具体内容,对目标用户偏好的各音乐特征的具体内容进行特征取值,可得到目标用户偏好的各音乐特征的特征数据;
可选的,本发明实施例也可通过分析目标用户收听音乐的历史数据,分析出目标用户偏好的音乐特征。
步骤S120、对于各预选歌单,确定预选歌单与目标用户的各相同音乐特征的特征数据的相关系数;
在确定各预选歌单的音乐特征的特征数据,及目标用户偏好的音乐特征的特征数据后,针对预选歌单和目标用户相同的音乐特征,本发明实施例可确定预选歌单和目标用户就相同音乐特征的特征数据间的相关系数;
如音乐特征为歌手特征、歌曲特征、流派特征,则对于各预选歌单,本发明实施例可确定预选歌单和目标用户就歌手特征的特征数据间的相关系数,就歌曲特征的特征数据间的相关系数,及就流派特征的特征数据间的相 关系数;
预选歌单与目标用户相同音乐特征的特征数据的相关系数,反映的是预选歌单与目标用户就相同音乐特征的相关性;可选的,本发明实施例可通过确定预选歌单与目标用户就相同音乐特征的特征数据的皮尔森(pearson)相关系数,确定预选歌单与目标用户就相同音乐特征的相关性。
步骤S130、根据各预选歌单与目标用户的相同音乐特征的特征数据的相关系数,从所述多个预选歌单中确定候选歌单;
候选歌单为所述多个预选歌单中与目标用户就相同音乐特征的相关性较高的歌单;在得到预选歌单与目标用户的各相同音乐特征的特征数据的相关系数后,对于各预选歌单,本发明实施例可通过综合预选歌单与目标用户的所有相同音乐特征的特征数据的相关系数,确定预选歌单中为目标用户所偏好的歌单,从而将所述多个预选歌单中目标用户所偏好的歌单确定为候选歌单;所确定的候选歌单的数量为多个,但小于所述多个预选歌单的数量。
步骤S140、从所述候选歌单中确定组成歌单列表的歌单。
在得到候选歌单后,本发明实施例可从候选歌单中选取歌单,以组成歌单列表。
本发明实施例提供的歌单列表确定方法,包括:确定多个预选歌单;确定各预选歌单的音乐特征的特征数据,及目标用户偏好的音乐特征的特征数据,其中一个歌单具有至少一个音乐特征;对于各预选歌单,确定预选歌单与目标用户的各相同音乐特征的特征数据的相关系数;根据各预选歌单与目标用户的相同音乐特征的特征数据的相关系数,从所述多个预选歌单中确定候选歌单;从所述候选歌单中确定组成歌单列表的歌单。
可以看出,本发明实施例通过确定预选歌单与目标用户的各相同音乐特征的特征数据的相关系数,可得出预选歌单与目标用户就相同音乐特征的相关性,从而从多个预选歌单中确定出与目标用户就相同音乐特征的相关性较高的歌单,得到目标用户所偏好的候选歌单;从目标用户所偏好的候选歌单中确定组成歌单列表的歌单,可使得歌单列表的歌单为目标用户所偏好的概率大幅提升,使得本发明实施例所确定的歌单列表推荐给目标用户后,被目标用户点击收听的可能性极大的提升,为提升歌单列表的收听转化率提供了可能。本发明实施例提供的歌单列表确定方法,能够使得歌单列表中的歌单 与所推荐的目标用户具有较高的相关性,为提升歌单列表的收听转化率提供了可能。
可选的,预选歌单与目标用户就相同音乐特征的特征数据的相关系数,可以为皮尔森相关系数;对应的,确定预选歌单与目标用户的各相同音乐特征的特征数据的相关系数的方式可以如下:
对于各预选歌单,根据公式分别确定预选歌单与目标用户的各相同音乐特征的特征数据的皮尔森相关系数;
其中,P(U,P)为预选歌单与目标用户一相同音乐特征的特征数据的皮尔森相关系数,U为目标用户的一音乐特征的特征数据,P为预选歌单中与U相同的音乐特征的特征数据,*表示乘号,||||表示其内特征数据的各特征的平方和开根号;
例如U表示歌单中歌手特征的特征数据(即歌单中歌手特征的特征向量),则歌单中各歌曲的歌手数量可以作为U的各特征,如歌手特征的特征数据可以为((歌手A,2),(歌手B,1),(歌手C,2))等的集合,则(歌手A,2),(歌手B,1),(歌手C,2)可视为是U的特征;相应的,||U||可视为对歌手特征这一向量内的各特征作平方和开根号的处理。
如歌单的音乐特征为歌手特征、歌曲特征、流派特征;则对于各预选歌单可根据如下方式确定预选歌单与目标用户的各相同音乐特征的特征数据的相关系数:
本发明实施例可根据公式确定预选歌单与目标用户的歌手特征的特征数据的皮尔森相关系数,
其中,P(U1,P1)为预选歌单与目标用户就歌手特征的皮尔森相关系数,U1为目标用户的歌手特征的特征数据,P1为预选歌单中歌手特征的特征数据;
根据公式确定预选歌单与目标用户的歌曲特征的特征数据的皮尔森相关系数,
其中,P(U2,P2)为预选歌单与目标用户就歌曲特征的特征数据的皮尔森相关系数,U2为目标用户的歌曲特征的特征数据,P2为预选歌单中歌曲特征的特征数据;
根据公式确定预选歌单与目标用户的流派特征的特征数据的皮尔森相关系数,
其中,P(U3,P3)为预选歌单与目标用户就流派特征的特征数据的皮尔森相关系数,U3为目标用户的流派特征的特征数据,P3为预选歌单中流派特征的特征数据;
通过上述公式的计算,则可分别得到预选歌单与目标用户就歌手特征、歌曲特征、流派特征的特征数据的皮尔森相关系数。
可选的,在确定各预选歌单与目标用户的相同音乐特征的特征数据的相关系数后,本发明实施例可通过综合预选歌单与目标用户的所有相同音乐特征的特征数据的相关系数,确定预选歌单中为目标用户所偏好的歌单,从而得到候选歌单;对应的,图2示出了本发明实施例提供的从所述多个预选歌单中确定候选歌单的方法流程图,参照图2,该方法可以包括:
步骤S200、若预选歌单与目标用户所有相同音乐特征的特征数据的相关系数,均满足预定系数条件,则确定该预选歌单为候选歌单;
可选的,预定系数条件可以为本发明实施例所设置的预选歌单与目标用户就相同音乐特征具有高相关性的系数值,具体可视实际情况设定;如果某一预选歌单与目标用户所有相同音乐特征的特征数据的相关系数,均满足预定系数条件,则可确定该预选歌单与目标用户具有高相关性,为目标用户所偏好的,确定该预选歌单为候选歌单;
如歌单的音乐特征为歌手特征、歌曲特征、流派特征,则如果预选歌单与目标用户就歌手特征的特征数据的相关系数满足预定系数条件,就歌曲特征的特征数据的相关系数满足预定系数条件,且就流派特征的特征数据的相关系数满足预定系数条件,则可确定该预选歌单为候选歌单。
步骤S210、若预选歌单与目标用户中任一相同音乐特征的特征数据的相关系数,不满足预定系数条件,则确定该预选歌单为待判断预选歌单,根据目标用户的音乐画像数据判断所述待判断预选歌单是否为候选歌单。
待判断预选歌单为预选歌单中与目标用户非所有相同音乐特征的特征数据的相关系数,均满足预定系数条件的歌单;
如歌单的音乐特征为歌手特征、歌曲特征、流派特征,则只要预选歌单 与目标用户就歌手特征、歌曲特征、流派特征中的至少一个的特征数据的相关系数不满足预定系数条件,则可确定该预选歌单为待判断预选歌单;
为进一步判断待判断预选歌单是否为目标用户所偏好的,本发明实施例可引入目标用户的音乐画像数据;可选的,本发明实施例可就不满足预定系数条件的相关系数的音乐特征,确定待判断预选歌单中该音乐特征的特征数据,是否与目标用户的音乐画像数据中表示的该音乐特征的内容相匹配,从而根据匹配结果,确定判断预选歌单是否为目标用户所偏好的。
音乐画像数据为用户画像数据在音乐领域的表示;可以知道,用户画像数据为应用大数据技术的基础方式,用户画像数据可以认为是用户信息的标签化,通过收集与分析用户社会属性、生活习惯、某一领域的行为等主要信息的数据之后,抽象出一个用户的在某一领域的全貌特征,得到用户画像数据,用户画像数据能够帮助快速找到精准用户群体以及实现用户需求的匹配;
对应的,图3示出了本发明实施例提供的基于音乐画像数据判断该预选歌单是否为候选歌单的方法流程图,参照图3,该方法可以包括:
步骤S300、确定所述相关系数不满足预定系数条件的音乐特征;
步骤S300所确定的为待判断预选歌单中与目标用户的特征数据的相关系数,不满足预定系数条件的音乐特征;如预选歌单与目标用户仅就歌手特征的特征数据的相关系数不满足预定系数条件,则步骤S300所确定的音乐特征为歌手特征。
步骤S310、判断所述待判断预选歌单中该音乐特征的特征数据,是否与目标用户的音乐画像数据中表示的该音乐特征的内容相匹配,若是,执行步骤S320,若否,执行步骤S330;
可选的,本发明实施例可直接验证音乐画像数据统计的该音乐特征的内容中,是否存在所述待判断预选歌单的该音乐特征的特征数据,若不存在,则确定不匹配,若存在,则确定匹配。
步骤S320、确定所述待判断预选歌单为候选歌单;
步骤S330、确定所述待判断预选歌单不为候选歌单。
可选的,图3所示方法仅为预选歌单与目标用户中任一相同音乐特征的特征数据的相关系数,不满足预定系数条件下的一种处理方式;对于待判断预选歌单,本发明实施例也可计算待判断预选歌单中与目标用户就各音乐特 征的特征数据的相关系数的均值,通过所计算的均值确定待判断预选歌单是否为目标用户偏好的歌单,在均值大于设定均值时,可确定待判断预选歌单为目标用户偏好的歌单,在均值小于设定均值时,可确定待判断预选歌单不为目标用户偏好的歌单;设定均值可视实际使用情况设定。
可选的,在确定候选歌单后,本发明实施例可从候选歌单中选取预定数量的歌单组成歌单列表,选取方式可以为随机。
可选的,由于根据各预选歌单与目标用户的相同音乐特征的特征数据的相关系数,所确定的候选歌单虽然为用户偏好的歌单;但候选歌单大部分聚焦在某一音乐特征上,若以此确定歌单列表并推荐给目标用户,则可能使得目标用户长时收听同一类型的歌单,这使得目标用户的歌单多样性体验降低,目标用户极可能存在视听疲惫;
如目标用户听歌习惯是多样的,可能同时喜欢流行音乐,摇滚音乐和民谣音乐这些流派的音乐;但对于流行音乐,摇滚音乐和民谣音乐的喜欢程度又是不同的,本发明实施例根据各预选歌单与目标用户的相同音乐特征的特征数据的相关系数,可将目标用户对流行音乐,摇滚音乐和民谣音乐流派的喜欢程度进行量化,即体现为歌单的音乐特征的相关系数的取值上;由此计算得到的结果,就会存在同一音乐特征的高相关系数的歌单扎堆被确定为候选歌单,由这些候选歌单确定的歌单列表中将扎堆存在同一类型的歌单;
比如歌单列表中前5个歌单是流行音乐相关的歌单,中间3个是摇滚音乐相关的歌单,而最后4个是民谣音乐相关的歌单;若是仅依照歌单与目标用户的相关性的顺序,将该歌单列表推荐给目标用户,因为连续5个同一类型的歌单被推荐,那么目标用户将极可能存在视听疲惫;因此在从候选歌单中确定组成歌单列表的歌单时,本发明实施例可考虑与用户相关性高,且类型多样的歌单;
对应的,图4示出了本发明实施例提供的从候选歌单中确定组成歌单列表的歌单的方法流程图,参照图4,该方法可以包括:
步骤S400、以歌单和目标用户为节点,分别针对各音乐特征,构建所有候选歌单与目标用户的特征数据之间的连通关系,得到反应所述候选歌单与目标用户的相关性的最大连通子图;
最大连通子图可以认为是把图的所有节点用最少的边连接起来的子图, 本发明实施例中连接节点所用的边可以认为是候选歌单与目标用户的特征数据的相关性;如歌单的音乐特征包括歌手特征、歌曲特征、流派特征,针对歌单和目标用户相同的音乐特征(分别为歌手特征、歌曲特征、流派特征),可以就相同音乐特征的特征数据间的相关性建立起关系,当所有的关系建立起来后,从整体上看,就是一张最大连通子图。
步骤S410、对于各音乐特征,从所述最大连通子图中确定相连通的歌单,得到各音乐特征的歌单集合;
图5示出了歌单与用户关联子图的示意图,图中圆形表示歌单,三角形表示用户;在最大连通子图中所有节点(包括歌单和用户)不是都是连通的,而相互连通的节点对应的歌单之间可以认为是存在相关性的,比如都是摇滚的歌单;而相互不连通的歌单,就是相互之间没有什么联系的歌单,比如一个子图是摇滚的歌单,一个子图是民谣的歌单;通过对于各音乐特征,从最大连通子图中确定相连通的歌单,则可得到各音乐特征的歌单集合,保证歌单类型的多样性;一个歌单集合所包含的节点为歌单,且一个歌单集合中的歌单的音乐特征相同,属于同一类型的歌单。
步骤S420、从各音乐特征的歌单集合中,分别选取相关系数符合预定推荐条件的歌单,构成预定数量的歌单,以组成歌单列表。
可选的,歌单集合中相关系数符合预定推荐条件的歌单,可以认为是歌单集合中相关系数最高的歌单;可选的,相关系数符合预定推荐条件的歌单也可视实际情况设定;
从各个音乐特征的歌单集合中,选取出相关系数符合预定推荐条件的歌单后,则可得到多类型,且与目标用户相关性高的歌单,由这些歌单组成歌单列表,可使得后续推荐给目标用户的歌单列表中的歌单具有多样性、且与目标用户相关性高的特点,为提升歌单的收听转化率提供了可能。
可选的,在得到歌单列表后,本发明实施例可对歌单列表中的歌单进行排序;具体的,本发明实施例可确定歌单列表中各歌单与目标用户的各音乐特征的特征数据的相关系数的均值,从而根据所述均值排序歌单列表中的歌单,如根据均值由大到小排序歌单列表中的歌单;
以歌单的音乐特征包括歌手特征、歌曲特征、流派特征为例,对于歌单列表中的各歌单,本发明实施例可确定歌单与目标用户就歌手特征、歌曲特 征、流派特征的特征数据的相关系数的均值,从而以所确定的歌单的均值排序歌单在歌单列表中的位置。
可选的,本发明实施例可根据筛选规则,从歌单库中确定多个预选歌单;具体的,本发明实施例可从歌单库中筛选歌单名符合预定歌单名书写规则,歌单描述内容符合预定歌单描述内容书写规则,歌单中歌曲相关数量数据符合预定数量要求,歌单中歌曲相关收听数据符合预定收听要求的歌单,得到多个预选歌单;
可选的,歌单名符合预定歌单名书写规则可以有如下条件:歌单名字符数大于5个以上,小于20个以下;歌单名中的特殊符号应小于字符总数的20%,特殊符号包括非主流符号、火星文符号、个性化符号等,如︿╮ヾづ№╮→ゞ灬ゞゞ(?▽`)/ゞ?????????等符号;歌单名的开头不应超过2个空格,歌单名的总字符中不应超过3个空格;歌单名的开头不应有标点符号(如,。!?等),歌单名的总字符中不应超过3个标点符号;
歌单描述内容符合预定歌单描述内容书写规则可以有如下条件:歌单描述内容的总字符数大于5个以上;歌单描述内容的特殊符号应小于字符总数的20%;
可选的,歌单中歌曲相关数量数据可以为歌单中的歌曲数量,专辑数量,歌手数量,语种数量等;歌单中歌曲相关数量数据符合预定数量要求可以有如下条件:歌曲数量应不小于10首;专辑数量应大于3张,歌单中属于同一专辑的歌曲不超过5首;歌手数量无限制;歌单中歌曲的语种数量应小于5;
可选的,歌单中歌曲相关收听数据可以为歌单中歌曲收听占比,歌单的完整收听率,歌单的人均收听数等;其中歌单中歌曲收听占比可以为歌单中歌曲的收听总量/歌单库中所有歌曲的收听总量,歌单的完整收听率可以为歌单内歌曲的完整收听率的均值,歌曲的完整收听率为歌曲针每次的播放时长的和/(播放次数*歌曲时长);歌单的人均收听数为歌单中各歌曲的说听人数的均值;
歌单中歌曲相关收听数据符合预定收听要求可以有如下条件:歌曲收听占比大于90%,歌单的完整收听率大于65%,歌单的人均收听数大于3。
优选的,图6示出了本发明实施例提供的歌单列表确定方法的另一流程图,参照图6,该方法可以包括:
步骤S500、从歌单库中筛选歌单名符合预定歌单名书写规则,歌单描述内容符合预定歌单描述内容书写规则,歌单中歌曲相关数量数据符合预定数量要求,歌单中歌曲相关收听数据符合预定收听要求的歌单,得到多个预选歌单;
步骤S510、确定各预选歌单的音乐特征的特征数据,及目标用户偏好的音乐特征的特征数据,其中一个歌单具有至少一个音乐特征;
步骤S520、根据公式分别确定预选歌单与目标用户的各相同音乐特征的特征数据的皮尔森相关系数;
其中P(U,P)为预选歌单与目标用户一相同音乐特征的特征数据的皮尔森相关系数,U为目标用户的一音乐特征的特征数据,P为预选歌单中与U相同的音乐特征的特征数据。
步骤S530、若预选歌单与目标用户所有相同音乐特征的特征数据的相关系数,均满足预定系数条件,则确定该预选歌单为候选歌单;
步骤S540、若预选歌单与目标用户中任一相同音乐特征的特征数据的相关系数,不满足预定系数条件,则确定该预选歌单为待判断预选歌单;确定所述相关系数不满足预定系数条件的音乐特征;判断所述待判断预选歌单中该音乐特征的特征数据,是否与目标用户的音乐画像数据中表示的该音乐特征的内容相匹配;若是,则确定所述待判断预选歌单为候选歌单;若否,则确定所述待判断预选歌单不为候选歌单;
步骤S550、以歌单和目标用户为节点,分别针对各音乐特征,构建所有候选歌单与目标用户的特征数据之间的连通关系,得到反应所述候选歌单与目标用户的相关性的最大连通子图;
步骤S560、对于各音乐特征,从所述最大连通子图中确定相连通的歌单,得到各音乐特征的歌单集合;
步骤S570、从各音乐特征的歌单集合中,分别选取相关系数符合预定推荐条件的歌单,构成预定数量的歌单,以组成歌单列表;
步骤S580、确定歌单列表中各歌单与目标用户的各音乐特征的特征数据的相关系数的均值;
步骤S590、根据所述均值排序歌单列表中的歌单。
在确定歌单列表中的歌单并排序歌单后,可将歌单列表推荐给目标用户,由于所推荐的歌单列表与目标用户具有较高的相关性,为提升歌单的收听转化率提供了可能。
下面对本发明实施例提供的歌单列表确定装置进行介绍,下文描述的歌单列表确定装置可与上文描述的歌单列表确定方法相互对应参照。
图7为本发明实施例提供的歌单列表确定装置的结构框图,该装置可应用于电子设备,电子设备如提供有音乐播放服务的服务器,也可以为具有数据处理能力的用户侧设备;参照图7,该装置可以包括:
预选歌单确定模块100,用于确定多个预选歌单;
特征数据确定模块200,用于确定各预选歌单的音乐特征的特征数据,及目标用户偏好的音乐特征的特征数据,其中一个歌单具有至少一个音乐特征;
相关系数确定模块300,用于对于各预选歌单,确定预选歌单与目标用户的各相同音乐特征的特征数据的相关系数;
候选歌单确定模块400,用于根据各预选歌单与目标用户的相同音乐特征的特征数据的相关系数,从所述多个预选歌单中确定候选歌单;
歌单列表确定模块500,用于从所述候选歌单中确定组成歌单列表的歌单。
可选的,图8示出了本发明实施例提供的相关系数确定模块300的一种可选结构,参照图8,相关系数确定模块300可以包括:
皮尔森相关系数确定单元310,用于根据公式分别确定预选歌单与目标用户的各相同音乐特征的特征数据的皮尔森相关系数;
其中P(U,P)为预选歌单与目标用户一相同音乐特征的特征数据的皮尔森相关系数,U为目标用户的一音乐特征的特征数据,P为预选歌单中与U相同的音乐特征的特征数据,*表示乘号,||||表示其内特征数据的各特征的平方和开根号。
可选的,图9示出了本发明实施例提供的候选歌单确定模块400的一种可选结构,参照图9,候选歌单确定模块400可以包括:
第一确定单元410,用于若预选歌单与目标用户所有相同音乐特征的特征数据的相关系数,均满足预定系数条件,则确定该预选歌单为候选歌单;
判断确定单元420,用于若预选歌单与目标用户中任一相同音乐特征的特征数据的相关系数,不满足预定系数条件,则确定该预选歌单为待判断预选歌单,根据目标用户的音乐画像数据判断所述待判断预选歌单是否为候选歌单。
可选的,图10示出了本发明实施例提供的判断确定单元420的一种可选结构,参照图10,判断确定单元420可以包括:
音乐特征确定子单元421,用于确定所述相关系数不满足预定系数条件的音乐特征;
匹配判断子单元422,用于判断所述待判断预选歌单中该音乐特征的特征数据,是否与目标用户的音乐画像数据中表示的该音乐特征的内容相匹配;
第一结果确定子单元423,用于若是,则确定所述待判断预选歌单为候选歌单;
第二结果确定子单元424,用于若否,则确定所述待判断预选歌单不为候选歌单。
可选的,歌单列表确定模块500具体可用于从所述候选歌单中选取预定数量的歌单组成歌单列表。
可选的,本发明实施例可结合歌单的多样性,以使歌单列表确定模块500从所述候选歌单中确定组成歌单列表的歌单;对应的,图11示出了本发明实施例提供的歌单列表确定模块500的一种可选结构,参照图11,歌单列表确定模块500可以包括:
子图构建单元510,用于以歌单和目标用户为节点,分别针对各音乐特征,构建所有候选歌单与目标用户的特征数据之间的连通关系,得到反应所述候选歌单与目标用户的相关性的最大连通子图;
歌单集合确定单元520,用于对于各音乐特征,从所述最大连通子图中确定相连通的歌单,得到各音乐特征的歌单集合;
歌单选取单元530,用于从各音乐特征的歌单集合中,分别选取相关系数符合预定推荐条件的歌单,构成预定数量的歌单,以组成歌单列表。
可选的,图12示出了本发明实施例提供的歌单列表确定装置的另一结构, 结合图7和图12所示,该装置还可以包括:
均值确定模块600,用于确定歌单列表中各歌单与目标用户的各音乐特征的特征数据的相关系数的均值;
排序模块700,用于根据所述均值排序歌单列表中的歌单。
可选的,预选歌单确定模块100可根据预置筛选规则从歌单库中确定多个预选歌单;具体的,预选歌单确定模块100具体可用于,从歌单库中筛选歌单名符合预定歌单名书写规则,歌单描述内容符合预定歌单描述内容书写规则,歌单中歌曲相关数量数据符合预定数量要求,歌单中歌曲相关收听数据符合预定收听要求的歌单,得到多个预选歌单。
本发明实施例还提供一种电子设备,该电子设备可以包括上述所述的歌单列表确定装置。
采用本发明实施例提供的电子设备确定歌单列表中的歌单,可使得所确定的歌单列表与目标用户具有较高的相关性,为提升歌单的收听转化率提供了可能。
图13为本发明实施例提供的电子设备的硬件结构框图,电子设备可以为服务器,也可以为用户侧设备;参照图13,该电子设备可以包括:处理器1,通信接口2,存储器3和通信总线4;
其中处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;
可选的,通信接口2可以为通信模块的接口,如GSM模块的接口;
处理器1,用于执行程序;
存储器3,用于存放程序;
程序可以包括程序代码,所述程序代码包括计算机操作指令。
处理器1可能是一个中央处理器CPU,或者是特定集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
其中,程序可具体用于:
确定多个预选歌单;
确定各预选歌单的音乐特征的特征数据,及目标用户偏好的音乐特征的特征数据,其中一个歌单具有至少一个音乐特征;
对于各预选歌单,确定预选歌单与目标用户的各相同音乐特征的特征数据的相关系数;
根据各预选歌单与目标用户的相同音乐特征的特征数据的相关系数,从所述多个预选歌单中确定候选歌单;
从所述候选歌单中确定组成歌单列表的歌单。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。