新增歌单推荐方法及其装置、设备、介质、产品与流程

文档序号:29357621发布日期:2022-03-23 00:27阅读:97来源:国知局
新增歌单推荐方法及其装置、设备、介质、产品与流程

1.本技术涉及音乐信息检索技术领域,尤其涉及一种新增歌单推荐方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。


背景技术:

2.随着人们精神文明生活质量的提升,用户创作歌单的热情越来越高,产出许多优质ugc歌单即用户原创歌单,对于各在线音乐平台而言,每天都有庞大的用户原创歌单需要审核进而优选出优质的用户原创歌单用于歌单推荐,一般该工作主要是由各在线音乐平台中的专业人士完全依靠标准和其个人的审美来进行判断,产出十分有限,且由于工作量相当大,需要的相关人手比较多,因此不可避免会存在以下具体问题:
3.1、成本高企,需要专业人力成本长时间的进行审核工作,况且,随着用户量越来越大,所需的专业人士也逐渐增多,很可能演变成专业人力资源紧缺以致无法进行审核工作的地步;
4.2、不同的专业人士审核具有不同的审美和权衡,很容易导致审核入库的歌单质量良莠不齐,一些优质的歌单也有可能因此被淘汰掉,无法保证公平性。
5.概括而言,现有技术中的新增歌单推荐,难以统一审核标准,导致审核的歌单出现质量问题,另一方面审核歌单所需人力逐渐欠缺,因此,本技术人对此作出相应的探索。


技术实现要素:

6.本技术的首要目的在于解决上述问题至少之一而提供一种新增歌单推荐方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品。
7.为满足本技术的各个目的,本技术采用如下技术方案:
8.适应本技术的目的之一而提供的一种新增歌单推荐方法,包括如下步骤:
9.响应用户推荐请求,根据该用户的历史行为数据获取其用户特征向量,该用户特征向量用于表示所述历史行为数据所隐含的用户访问音乐库中歌单和歌曲的偏好相对应的深层语义信息;
10.计算所述用户特征向量与音乐库内新增歌单的预采集的歌单特征向量之间的相似度,获得相应的相似度数值;该歌单特征向量为相应的新增歌单的图文信息的深层语义信息的特征表示;
11.将相似度数值满足预设条件的多个新增歌单分发给该用户,相应获取所述多个新增歌单被该用户访问相对应的用户行为数据;
12.根据音乐库内全量新增歌单被不同用户访问相对应的用户行为数据统计出的各新增歌单的访问热度的高低筛选出目标新增歌单,将目标新增歌单构造为推荐列表。
13.进一步的实施例中,根据该用户的历史行为数据获取其用户特征向量,包括如下步骤:
14.从该用户的历史行为数据中获得该用户所访问的歌单、歌曲的唯一性特征信息与
该用户所实施的行为类型的映射关系数据,所述行为类型包括点击、播放、收藏、下载、分享中任意一项或任意多项;
15.根据所述映射关系数据进行编码获得用户编码向量;
16.采用预训练至收敛的用户特征提取模型,根据所述用户编码向量进行特征提取,获得相应的用户特征向量。
17.进一步的实施例中,将相似度数值满足预设条件的多个新增歌单分发给该用户,相应获取所述多个新增歌单被该用户访问相对应的用户行为数据,包括如下步骤:
18.检测所述多个新增歌单相对应的历史分发总量是否达到预设阈值,当达到停止分发相应的新增歌单,否则将相应的新增歌单分发给该用户;
19.基于被分发的新增歌单对该用户所实施的用户行为数据实施监听;
20.响应于该用户所提交的用户行为数据,检测获取针对所述被分发的新增歌单的用户行为数据。
21.进一步的实施例中,根据音乐库内全量新增歌单被不同用户访问相对应的用户行为数据统计出的各新增歌单的访问热度的高低筛选出目标新增歌单,将目标新增歌单构造为推荐列表,包括如下步骤:
22.针对音乐库内全量新增歌单,根据被不同用户访问所产生的用户行为数据,统计每个新增歌单被施加不同行为类型相对应的访问量,所述行为类型包括点击、播放、收藏、下载、分享中任意一项或任意多项;
23.针对每个新增歌单,对不同行为类型的访问量进行加权求和,获得各个新增歌单相对应的访问热度;
24.判断每个新增歌单的访问热度是否超过预设阈值,将访问热度超过预设阈值的新增歌单确定为目标新增歌单;
25.创建推荐列表,将所述目标新增歌单添加至该推荐列表中。
26.进一步的实施例中,将目标新增歌单构造为推荐列表的步骤之后,包括如下步骤:
27.响应用户的歌单推荐请求,根据该用户的所述用户特征向量,从所述推荐列表中的新增歌单中匹配出歌单特征向量与该用户特征向量构成相似的一个或多个优选新增歌单,将所述优选新增歌单推送给相应的用户。
28.进一步的实施例中,响应用户推荐请求之前,包括如下步骤:
29.采用预计的数据集,训练用于提取所述用户特征向量和歌单特征向量的双塔模型,使其达致收敛状态;其中,所述数据集包括多个数据样本,每个数据样本表示一个用户相对应的用户特征数据和歌单特征数据,所述用户特征数据为相应用户所访问的歌单、歌曲的唯一性特征信息与该用户所实施的行为类型的映射关系数据,所述歌单特征数据为该相应用户所访问的歌单的图文信息;
30.调用已训练至收敛状态的所述双塔模型,为音乐库内的任意歌单,根据该歌单的图文信息提取出其相对应的歌单特征向量。
31.适应本技术的目的之一而提供的一种新增歌单推荐装置,包括:用户处理模块、相似匹配模块、歌单分发模块、歌单筛选模块,其中用户处理模块,用于响应用户推荐请求,根据该用户的历史行为数据获取其用户特征向量,该用户特征向量用于表示所述历史行为数据所隐含的用户访问音乐库中歌单和歌曲的偏好相对应的深层语义信息;相似匹配模块,
用于计算所述用户特征向量与音乐库内新增歌单的预采集的歌单特征向量之间的相似度,获得相应的相似度数值;该歌单特征向量为相应的新增歌单的图文信息的深层语义信息的特征表示;歌单分发模块,用于将相似度数值满足预设条件的多个新增歌单分发给该用户,相应获取所述多个新增歌单被该用户访问相对应的用户行为数据;歌单筛选模块,用于根据音乐库内全量新增歌单被不同用户访问相对应的用户行为数据统计出的各新增歌单的访问热度的高低筛选出目标新增歌单,将目标新增歌单构造为推荐列表。
32.进一步的实施例中,所述用户处理模块,包括:
33.数据获取子模块,用于从该用户的历史行为数据中获得该用户所访问的歌单、歌曲的唯一性特征信息与该用户所实施的行为类型的映射关系数据,所述行为类型包括点击、播放、收藏、下载、分享中任意一项或任意多项;
34.数据向量化子模块,用于根据所述映射关系数据进行编码获得用户编码向量;
35.特征提取子模块,用于采用预训练至收敛的用户特征提取模型,根据所述用户编码向量进行特征提取,获得相应的用户特征向量。
36.进一步的实施例中,所述歌单分发模块,包括:
37.阈值检测子模块,用于检测所述多个新增歌单相对应的历史分发总量是否达到预设阈值,当达到停止分发相应的新增歌单,否则将相应的新增歌单分发给该用户;
38.用户监听子模块,用于基于被分发的新增歌单对该用户所实施的用户行为数据实施监听;
39.数据获取子模块,用于响应于该用户所提交的用户行为数据,检测获取针对所述被分发的新增歌单的用户行为数据。
40.进一步的实施例中,所述歌单筛选模块,包括:
41.访问量统计子模块,用于针对音乐库内全量新增歌单,根据被不同用户访问所产生的用户行为数据,统计每个新增歌单被施加不同行为类型相对应的访问量,所述行为类型包括点击、播放、收藏、下载、分享中任意一项或任意多项;
42.访问热度计算子模块,用于针对每个新增歌单,对不同行为类型的访问量进行加权求和,获得各个新增歌单相对应的访问热度;
43.阈值判断子模块,用于判断每个新增歌单的访问热度是否超过预设阈值,将访问热度超过预设阈值的新增歌单确定为目标新增歌单;
44.歌单推荐子模块,用于创建推荐列表,将所述目标新增歌单添加至该推荐列表中。
45.进一步的实施例中,所述歌单筛选模块之后,还包括:
46.歌单推送子模块,用于响应用户的歌单推荐请求,根据该用户的所述用户特征向量,从所述推荐列表中的新增歌单中匹配出歌单特征向量与该用户特征向量构成相似的一个或多个优选新增歌单,将所述优选新增歌单推送给相应的用户。
47.进一步的实施例中,所述用户处理模块之前,还包括:
48.模型训练子模块,用于采用预计的数据集,训练用于提取所述用户特征向量和歌单特征向量的双塔模型,使其达致收敛状态;其中,所述数据集包括多个数据样本,每个数据样本表示一个用户相对应的用户特征数据和歌单特征数据,所述用户特征数据为相应用户所访问的歌单、歌曲的唯一性特征信息与该用户所实施的行为类型的映射关系数据,所述歌单特征数据为该相应用户所访问的歌单的图文信息;
49.模型调用子模块,用于调用已训练至收敛状态的所述双塔模型,为音乐库内的任意歌单,根据该歌单的图文信息提取出其相对应的歌单特征向量。
50.适应本技术的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本技术所述的新增歌单推荐方法的步骤。
51.适应本技术的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的新增歌单推荐方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
52.适应本技术的另一目的而提供的一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本技术任意一种实施例中所述方法的步骤。
53.相对于现有技术,本技术的优势如下:当每一用户需要平台推荐歌单时,针对平台中的大量的新增歌单,根据表征用户行为数据的用户特征向量与这些新增歌单相对应的歌单特征向量之间的相似度,向用户分发相似度较高的歌单,使得新增歌单可以被分发给潜在匹配用户,然后平台在后端通过监听机制,实现对每一新增歌单的分发总量的控制,以及对应获取接收所述新增歌单的用户后续提交的用户行为数据,通过这些用户行为数据统计出各个新增歌单被访问的情况,量化表示为新增歌单的访问热度,最后,根据访问热度确定各个新增歌单的优劣,做出筛选,构造出推荐列表,利用用户交互数据所起的投票效果,实现对新增歌单的评价和选优,省去人工筛选歌单的麻烦,大大提升在线音乐平台的歌单产出质量。
附图说明
54.本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
55.图1为本技术的新增歌单推荐方法的典型实施例的流程示意图;
56.图2为本技术实施例中的双塔模型中用户侧的神经网络模型的工作过程的流程示意图;
57.图3为本技术实施例中新增歌单分发的流程示意图;
58.图4为本技术实施例中的推荐列表创建的流程示意图;
59.图5为本技术实施例中增加后置歌单推荐的流程示意图;
60.图6为本技术实施例中增加前置提取歌单的歌单特征向量的流程示意图;
61.图7为本技术的新增歌单推荐装置的原理框图;
62.图8为本技术所采用的一种计算机设备的结构示意图。
具体实施方式
63.下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本技术,而不能解释为对本技术的限制。
64.本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本技术的说明书中使用的措
辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
65.本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本技术所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
66.本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;pcs(personal communications service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;pda(personal digital assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或gps(global positioning system,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是pda、mid(mobile internet device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
67.本技术所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
68.需要指出的是,本技术所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本技术的网络部署方式的实施方式。
69.本技术的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。
70.本技术中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程
服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
71.本技术所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本技术的技术方案所调用即可。
72.本领域技术人员对此应当知晓:本技术的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本技术所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
73.本技术即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本技术的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
74.本技术的一种新增歌单推荐方法,可被编程为计算机程序产品,部署于服务器中运行而实现,藉此,客户端可以网页程序或应用程序的形式访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品的进程实现人机交互。
75.请参阅图1,本技术的新增歌单推荐方法,在其典型实施例中,包括如下步骤:
76.步骤s1100、响应用户推荐请求,根据该用户的历史行为数据获取其用户特征向量,该用户特征向量用于表示所述历史行为数据所隐含的用户访问音乐库中歌单和歌曲的偏好相对应的深层语义信息;
77.所述用户的历史行为数据为该用户最近的一段时间内其访问音乐库中的歌单或歌曲的图形用户界面上实施的点击、播放、收藏、下载、分享等操作行为,进一步,所述操作行为一定程度上反映用户对所述歌单或歌曲的好感,同时也包含用户对所述歌单或歌曲对应的年代流派、歌手、歌词、语种中的任意一种或多种特征属性的喜好,相对而言,所述历史行为数据隐含用户访问音乐库中歌单和歌曲的偏好。
78.用户在其终端设备所安装的应用程序的图形用户界面上点击相关的推荐歌单的控件,譬如滚动图形用户界面至推荐区域、在首页界面展示的推荐歌单栏目中点击更多按钮控件、在用户选中的歌曲的图形用户界面上点击播放模式切换控件将播放模式设置为心动模式等等,由此,触发为该用户推荐歌单或歌曲的请求,该请求被发送至本技术的服务器,该服务器接收该请求后,对其进行响应。
79.服务器响应所述请求,据该用户的历史行为数据与预采集的用户特征向量的映射关联关系,从缓存中获得其用户特征向量,该预采集的用户特征向量为调用预先训练至收敛状态的双塔模型中用户侧的文本特征提取模型,对所述历史行为数据编码形成的编码向量进行特征表示,获得其中的深层语义信息相对应的特征向量,继而将其存储于缓存数据库中,便于后续对缓存中所述用户侧与新增歌单侧对应的特征向量之间进行快速匹配过程中,快速调用所述用户特征向量用于相似度计算,最终实现根据用户历史行为数据匹配相应的新增歌单。所述的文本特征提取模型可采用现有技术中多种预训练的基于cnn、rnn的神经网络模型实现。
80.所述双塔模型由用户侧的文本特征提取模型以及新增歌单侧的神经网络模型组
成,该模型预先将用户的行为数据以及其对应访问的歌曲和歌单数据作为训练集以及相应的设置测试集,由此,进行监督训练至收敛状态。关于所述双塔模型更多的技术细节由本技术后续的一个实施例所揭示,此处暂且按下不表。
81.其他实施例中,也可采用其他神经网络模型对所述的用户特征向量进行表征,本领域技术人员对此应当知晓。
82.步骤s1200、计算所述用户特征向量与音乐库内新增歌单的预采集的歌单特征向量之间的相似度,获得相应的相似度数值;该歌单特征向量为相应的新增歌单的图文信息的深层语义信息的特征表示;
83.所述新增歌单为在线音乐平台中的一首或多首歌曲构成的歌单,所述歌单可以由平台用户或者专业人员创建,以在线上传、邮件发送、现场交稿等的方式递交至音乐平台,进而由该音乐平台中相关负责人员归集后进行一定的预处理,最终统一转换为数字音乐形式进行上传,录入至该音乐平台的音乐库中。
84.所述预采集的歌单特征向量为调用预先训练至收敛状态的双塔模型中歌单侧的神经网络模型,对所述音乐库内新增歌单的图文信息编码形成的编码向量进行特征表示,获得相应的深层语义信息相对应的特征向量,继而将其存储于缓存数据库中。所述的神经网络模型可采用现有技术中多种预训练的基于cnn、rnn的神经网络模型实现。
85.调用预设的相似度计算方法计算所述用户特征向量与音乐库中相应的各个所述歌单特征向量之间的相似度,由此,获得缓存中所述用户侧与新增歌单侧对应的特征向量之间的相似度数值。
86.步骤s1300、将相似度数值满足预设条件的多个新增歌单分发给该用户,相应获取所述多个新增歌单被该用户访问相对应的用户行为数据;
87.所述预设条件为预设的相似度阈值,具体该相似度阈值可为经验阈值或实验阈值,本领域的技术人员可按需选取设置。
88.筛选出所述相似度数值超过预设的相似度阈值的歌单特征向量对应的新增歌单,将该多个新增歌单推送至所述用户,所述推送可为邀请用户参加免费试听新歌活动,在活动界面上展示所述新增歌单、或简单的以平常推荐歌单的方式等,进一步,在所述新增歌单展示展示界面上设置相应的监听,以收集用户访问该新增歌单对应的用户行为数据。
89.步骤s1400、根据音乐库内全量新增歌单被不同用户访问相对应的用户行为数据统计出的各新增歌单的访问热度的高低筛选出目标新增歌单,将目标新增歌单构造为推荐列表。
90.前述步骤s1100至步骤s1300的过程,可以针对平台的任意用户进行响应,由此,对于平台而言,相对广大平台用户实现新增歌单的分发。对应的,平台服务器可以负责对每一新增歌单分发的数量进行监听统计和控制,例如,针对每一新增歌单限量分发,在分发总量达到预设值时便可停止相应新增歌单的分发。
91.平台服务器监听收集各个平台用户访问相应的新增歌单的行为数据,从而统计出各个新增歌单的访问热度,进一步,据该访问热度的高低将对应的新增歌单从高到低顺序进行排序,筛选出其中排序靠前的新增歌单作为目标新增歌单,以各个目标歌单对应的排序构造为推荐列表。
92.通过本典型实施例的揭示,可以看出,本技术具有诸多技术优势,包括但不限于:
当每一用户需要平台推荐歌单时,针对平台中的大量的新增歌单,根据表征用户行为数据的用户特征向量与这些新增歌单相对应的歌单特征向量之间的相似度,向用户分发相似度较高的歌单,使得新增歌单可以被分发给潜在匹配用户,然后平台在后端通过监听机制,实现对每一新增歌单的分发总量的控制,以及对应获取接收所述新增歌单的用户后续提交的用户行为数据,通过这些用户行为数据统计出各个新增歌单被访问的情况,量化表示为新增歌单的访问热度,最后,根据访问热度确定各个新增歌单的优劣,做出筛选,构造出推荐列表,利用用户交互数据所起的投票效果,实现对新增歌单的评价和选优,省去人工筛选歌单的麻烦,大大提升在线音乐平台的歌单产出质量。
93.请参阅图2,进一步的实施例中,根据该用户的历史行为数据获取其用户特征向量,包括如下步骤:
94.步骤s1110、从该用户的历史行为数据中获得该用户所访问的歌单、歌曲的唯一性特征信息与该用户所实施的行为类型的映射关系数据,所述行为类型包括点击、播放、收藏、下载、分享中任意一项或任意多项;
95.所述歌单、歌曲的唯一性特征信息为由用户或平台首次上传歌单、歌曲时,依据平台相应的特征信息生成规则,相应的为其创建的唯一性特征信息用作标识,对于各个不同的歌单、歌曲对应的标识不同,便于软件工程技术人员存储及调用该歌单、歌曲。
96.所述用户的历史行为数据为该用户访问的歌单、歌曲时实施的行为类型数据,该行为类型数据由预设在歌单、歌曲相应的展示界面中的监听器收集上传至服务器,进而服务器将该行为类型数据映射关联该歌单、歌曲的唯一性特征信息作为行为数据,存储至对应该用户的行为数据库中。
97.从所述用户的历史行为数据中获取所述唯一性特征信息,由此获得对应的映射关系数据即该用户所实施的行为类型数据。
98.典型的一种实施例中,可以利用不同行为类型构造不同的歌单、歌曲的唯一特征信息列表,每个歌单、歌曲列表表征其相应的行为类型所对应的用户感兴趣歌单、歌曲,后续可根据这些列表进行编码。
99.步骤s1120、根据所述映射关系数据进行编码获得用户编码向量;
100.调用预先训练至收敛状态的双塔模型中用户侧的文本特征提取模型,对所述映射关系数据即所述行为类型数据具体例如对各种行为类型相对应的歌单、歌曲列表进行one-hot编码操作从而获得用户编码向量,所述文本特征提取模型优选bert、electra之类的成熟模型,本领域技术人员可灵活采用。
101.步骤s1130、采用预训练至收敛的用户特征提取模型,根据所述用户编码向量进行特征提取,获得相应的用户特征向量。
102.进一步,调用预先训练至收敛状态的双塔模型中用户侧的文本特征提取模型对所述用户编码向量进行特征提取,相应的对稠密特征直接做标准化操作,稀疏特征进行embedding降维到低维空间,继而将该稠密、稀疏特征进行拼接操作从而获得相应的用户特征向量,将所述用户特征向量关联所述用户存储至缓存的内存数据库中。
103.本实施例中,据用户的行为数据构造其用户特征向量,并将该用户特征向量预存储于缓存中,因此,需要调用该用户特征向量时即可快速从缓存中获取,极为适合后续线上快速召回用于匹配的业务场景。根据用户的历史行为数据获取用户感兴趣的歌单、歌曲列
表,可以有效表征用户的个人偏好,方便后续为其推荐兴趣相匹配的新增歌单。
104.请参阅图3,进一步的实施例中,将相似度数值满足预设条件的多个新增歌单分发给该用户,相应获取所述多个新增歌单被该用户访问相对应的用户行为数据,包括如下步骤:
105.步骤s1310、检测所述多个新增歌单相对应的历史分发总量是否达到预设阈值,当达到停止分发相应的新增歌单,否则将相应的新增歌单分发给该用户;
106.所述历史分发总量为对于一个新增歌单而言所分发的用户数,相应的可据此设置所述预设阈值,最简单的方式是设置一个经验定值,但也可以出于统计学上实现有效统计的原理进行更为复杂的设定,例如:据平台统计每日活跃用户数总量对应的百分之二十的用户数作为阈值、据平台筛选出最近一段时间内点赞数飙升最快的一批优质歌单,统计其各自对应的点赞数并计算出相应的均值,进一步将该均值乘上1.25倍作为阈值,此处设置本领域技术人员可按需灵活变通设置。
107.服务器响应新增歌单分发事件,实时统计所述新增歌单对应的所述分发的用户数,将该用户数与所述预设阈值进行比较,由此,实现新增歌单分发的管控,进而将音乐库中所有新增歌单分发至相应的用户,以完成所述新增歌单分发事件。
108.步骤s1320、基于被分发的新增歌单对该用户所实施的用户行为数据实施监听;
109.一种实施例中,服务器在向一个用户分发新增歌单后,便启动对该用户的监听机制,当用户实施对其所接收的新增歌单的操作时,触发向服务器提交相应的用户行为数据,服务器便可收集该用户相应的行为数据;这些用户行为数据,可以对应新增歌单播放界面上的点赞、收藏、下载、分享等事件,由此,当用户触发相应的事件,服务器判断相应的新增歌单已点赞、已收藏、下载成功、分享成功,便可收集该用户相应的行为数据。
110.步骤s1330、响应于该用户所提交的用户行为数据,检测获取针对所述被分发的新增歌单的用户行为数据。
111.实质上,服务器可以随时访问任意用户所产生并提交的用户行为数据,但是,为了统计所需,可由服务器检测其中关联于被分发的新增歌单的用户行为数据及对应用户的唯一标识码,继而存储至缓存中,以便据此进行统计。
112.本实施例中,由于该新增歌单并未通过平台相关的专业人士进行人工审核评定为优质歌单,而是合理化设置阈值管控新增歌单的分发,该用户由本技术的双塔模型据该用户的历史行为数据筛选出合适的新增歌单再进行相应的推送,即对于分发至该用户的新增歌单而言,该用户合适作为该新增歌单的评审,可以对该新增歌单进行“投票”,新增歌单服务器相应负责采集用户针对这些新增歌单触发提交的用户行为数据进行统计,相对而言,即可为各个新增歌单收取大众评审的反馈。总体概括而言,一方面鉴于新增歌单的优劣有一定的不确定性,直接将新增歌单分发给对应的大量用户而不加以限制,此举可能让广大用户对平台推送歌曲质量的不稳定而产生些疑惑因而减少好感度,因此,所述合理化设置阈值的方式是有利于既保障具有一定用户量给相应的新增歌单进行评审,降低不良影响;一方面交由大众评审相比于平台相关的专业人士进行人工评审,更为客观、审核效果更好,节省人力成本,因此,由此评定的优质新增歌单更为适合广大用户。
113.请参阅图4,进一步的实施例中,所述步骤s1400、根据音乐库内全量新增歌单被不同用户访问相对应的用户行为数据统计出的各新增歌单的访问热度的高低筛选出目标新
增歌单,将目标新增歌单构造为推荐列表,包括如下步骤:
114.步骤s1410、针对音乐库内全量新增歌单,根据被不同用户访问所产生的用户行为数据,统计每个新增歌单被施加不同行为类型相对应的访问量,所述行为类型包括点击、播放、收藏、下载、分享中任意一项或任意多项;
115.调用缓存中监听所述全量新增歌单对应被不同用户访问时收集的用户行为数据,相应地统计每个新增歌单被点击的次数、播放的次数,该播放包含被同一用户重复播放及被不用用户播放、点赞的次数、收藏的次数、下载成功的次数、分享成功的次数,这些次数即为所述的访问量。
116.步骤s1420、针对每个新增歌单,对不同行为类型的访问量进行加权求和,获得各个新增歌单相对应的访问热度;
117.据不同行为类型相对应的访问量即所述点击的次数、播放的次数、点赞的次数、收藏的次数、下载成功的次数、分享成功的次数,以及不同的行为类型对应不同的权重,相应的进行加权求和作为所述各个新增歌单相对应的访问热度。
118.所述权重为点击为1分、播放2分、点赞3分、收藏5分、下载6分、分享9分,本领域的技术人员可据所述行为类型的投入度如投入的时间成本、社交压力、实施复杂程度灵活设定该权重。
119.步骤s1430、判断每个新增歌单的访问热度是否超过预设阈值,将访问热度超过预设阈值的新增歌单确定为目标新增歌单;
120.一种实施例中,所述预设阈值为统计最近一段时间内的一批优质歌单对应的点击的次数、播放的次数、点赞的次数、收藏的次数、下载成功的次数、分享成功的次数,将其根据所述权重相应地进行加权求和计算,继而将该计算结果再计算出均值作为预设阈值。此处阈值的设置可由本领域的技术人员按需灵活变通设置。
121.确定所述的预设阈值后,便可将其与访问热度相比较对各个新增歌单进行选优,将超过预设阈值的新增歌单确定为目标新增歌单。
122.可以相替换的一种实施方式中,也可先根据歌单、歌曲的内容将各个新增歌单先行分类,然后针对每一类选取访问热度靠前的新增歌单,具体可通过预设阈值来筛选,作为所述的目标新增歌单。
123.步骤s1440、创建推荐列表,将所述目标新增歌单添加至该推荐列表中。
124.进一步,据所述目标新增歌单的访问热度对所述目标新增歌单进行高到低顺序的热度排序,继而将所述排序的目标新增歌单添加至所述推荐列表中。
125.本实施例中,进一步的量化所述用户行为数据为对应新增歌单的访问热度,继而将其与当前优质歌单对应的访问热度进行比较,由此,合理地优选出访问热度较高的目标新增歌单相应地构建推荐列表,至此,实现据大众评审的行为数据优选新增歌单。
126.请参阅图5,进一步的实施例中,将目标新增歌单构造为推荐列表的步骤之后,包括如下步骤:
127.步骤s1500、响应用户的歌单推荐请求,根据该用户的所述用户特征向量,从所述推荐列表中的新增歌单中匹配出歌单特征向量与该用户特征向量构成相似的一个或多个优选新增歌单,将所述优选新增歌单推送给相应的用户。
128.用户在其终端设备所安装的应用程序的图形用户界面上点击相关的推荐歌单的
控件,触发为该用户推荐歌单或歌曲的请求,该请求被发送至本技术的服务器,该服务器接收该请求后,对其进行响应。
129.服务器响应所述请求,据所述用户的唯一标识码以获取缓存中该用户的所述用户特征向量,继而将其与缓存中所述推荐列表中新增歌单对应的歌单特征向量进行相似度计算,筛选出相似度超过预设阈值的歌单特征向量,此处预设阈值可由本领域技术人员据实际召回结果灵活变通设置,进一步确定其对应的新增歌单为优选新增歌单,继而将所述优选新增歌单推送给所述用户。
130.本实施例中,通过预训练至收敛状态的双塔模型中的用户侧及新增歌单侧的神经网络模型,相应的预采集用户特征向量及歌单特征向量,并将其存储至缓存中的内存数据库中,进而,在用户侧与新增歌单侧之间的匹配过程中,即可快速从所述缓存中调用所需的特征向量作相似度计算,以实现高效匹配。
131.请参阅图6,进一步的实施例中,响应用户推荐请求之前,包括如下步骤:
132.步骤s1000、采用预计的数据集,训练用于提取所述用户特征向量和歌单特征向量的双塔模型,使其达致收敛状态;其中,所述数据集包括多个数据样本,每个数据样本表示一个用户相对应的用户特征数据和歌单特征数据,所述用户特征数据为相应用户所访问的歌单、歌曲的唯一性特征信息与该用户所实施的行为类型的映射关系数据,所述歌单特征数据为该相应用户所访问的歌单的图文信息;
133.可由基于cnn的神经网络模型提取其中所述歌单的封面图片特征,由此构建相应的图片特征向量;可由基于rnn的神经网络模型如bert、electra等的文本特征模型提取其中所述歌单的歌单标题、歌单简介、歌手名称、专辑名称等文本信息对应的特征,由此构建相应的文本特征向量,将所述特征中的稠密特征进行one-hot编码操作、稀疏特征进行embedding降维至低维空间,然后进行特征拼接操作,进一步将所述图片特征向量和所述文本特征向量进行拼接构建图文特征向量作为所述歌单的歌单特征向量。
134.所述双塔模型的模型监督训练分在两侧即为用户侧和新增歌单侧对应分开的两个神经网络模型分别进行,在模型的输入层阶段,用户侧的神经网络模型负责构建用户特征向量而新增歌单侧的神经网络模型负责构建歌单特征向量;在模型的表示层阶段,将所述用户特征向量和所述歌单特征向量分别经由各自对应的神经网络模型中的两个全连接层进行进一步的特征提取转化为固定长度的向量,由此获得维度相同且低维用户特征向量和低维歌单特征向量,此处在模型训练至收敛后将它们存储至redis这一类的内存数据库中即缓存中。各自对应的神经网络模型中的网络层数和维度可以不同,但是分别输出的特征向量的维度必须一致,方可在匹配层进行运算,所述低维用户特征向量和低维歌单特征向量的维度可为32维或128维等;在模型的匹配层阶段,调用所述低维用户特征向量和低维歌单特征向量计算cos余弦相似度,将该cos函数得到的结果输入至sigmoid函数与测试集对应的真实标签计算logloss,查看所述双塔模型是否收敛,评估主要使用auc指标,进一步的调整相关参数直至所述双塔模型收敛以完成所述监督训练,所述测试集由本领域技术人员据实际场景灵活变通设置。
135.步骤s1010、调用已训练至收敛状态的所述双塔模型,为音乐库内的任意歌单,根据该歌单的图文信息提取出其相对应的歌单特征向量。
136.可由基于cnn的神经网络模型提取所述歌单的封面图片特征,由此构建相应的图
片特征向量;可由基于rnn的神经网络模型如bert、electra等的文本特征模型提取所述歌单的歌单标题、歌单简介、歌手名称、专辑名称等文本信息对应的特征,由此构建相应的文本特征向量,将所述特征中的稠密特征进行one-hot编码操作、稀疏特征进行embedding降维至低维空间,然后进行特征拼接操作,进一步将所述图片特征向量和所述文本特征向量进行拼接构建图文特征向量输入至所述双塔模型的输入层中,继而获得所述歌单对应的歌单特征向量。
137.本实施例中,采用有监督训练所述双塔模型,使得经其输出的相似度结果精度较高,据其匹配的精准度也更高。
138.请参阅图7,本技术提供的一种新增歌单推荐装置,适应本技术的新增歌单推荐方法进行功能化部署,包括:用户处理模块1100、相似匹配模块1200、歌单分发模块1300、歌单筛选模块1400,其中用户处理模块,用于响应用户推荐请求,根据该用户的历史行为数据获取其用户特征向量,该用户特征向量用于表示所述历史行为数据所隐含的用户访问音乐库中歌单和歌曲的偏好相对应的深层语义信息;相似匹配模块,用于计算所述用户特征向量与音乐库内新增歌单的预采集的歌单特征向量之间的相似度,获得相应的相似度数值;该歌单特征向量为相应的新增歌单的图文信息的深层语义信息的特征表示;歌单分发模块,用于将相似度数值满足预设条件的多个新增歌单分发给该用户,相应获取所述多个新增歌单被该用户访问相对应的用户行为数据;歌单筛选模块,用于根据音乐库内全量新增歌单被不同用户访问相对应的用户行为数据统计出的各新增歌单的访问热度的高低筛选出目标新增歌单,将目标新增歌单构造为推荐列表。
139.进一步的实施例中,所述用户处理模块1100,包括:数据获取子模块,用于从该用户的历史行为数据中获得该用户所访问的歌单、歌曲的唯一性特征信息与该用户所实施的行为类型的映射关系数据,所述行为类型包括点击、播放、收藏、下载、分享中任意一项或任意多项;数据向量化子模块,用于根据所述映射关系数据进行编码获得用户编码向量;特征提取子模块,用于采用预训练至收敛的用户特征提取模型,根据所述用户编码向量进行特征提取,获得相应的用户特征向量。
140.进一步的实施例中,所述歌单分发模块1300,包括:阈值检测子模块,用于检测所述多个新增歌单相对应的历史分发总量是否达到预设阈值,当达到停止分发相应的新增歌单,否则将相应的新增歌单分发给该用户;用户监听子模块,用于基于被分发的新增歌单对该用户所实施的用户行为数据实施监听;数据获取子模块,用于响应于该用户所提交的用户行为数据,检测获取针对所述被分发的新增歌单的用户行为数据。
141.进一步的实施例中,所述歌单筛选模块1400,包括:访问量统计子模块,用于针对音乐库内全量新增歌单,根据被不同用户访问所产生的用户行为数据,统计每个新增歌单被施加不同行为类型相对应的访问量,所述行为类型包括点击、播放、收藏、下载、分享中任意一项或任意多项;访问热度计算子模块,用于针对每个新增歌单,对不同行为类型的访问量进行加权求和,获得各个新增歌单相对应的访问热度;阈值判断子模块,用于判断每个新增歌单的访问热度是否超过预设阈值,将访问热度超过预设阈值的新增歌单确定为目标新增歌单;歌单推荐子模块,用于创建推荐列表,将所述目标新增歌单添加至该推荐列表中。
142.进一步的实施例中,所述歌单筛选模块1100之后,还包括:歌单推送子模块,用于响应用户的歌单推荐请求,根据该用户的所述用户特征向量,从所述推荐列表中的新增歌
单中匹配出歌单特征向量与该用户特征向量构成相似的一个或多个优选新增歌单,将所述优选新增歌单推送给相应的用户。
143.进一步的实施例中,所述用户处理模块1400之前,还包括:模型训练子模块,用于采用预计的数据集,训练用于提取所述用户特征向量和歌单特征向量的双塔模型,使其达致收敛状态;其中,所述数据集包括多个数据样本,每个数据样本表示一个用户相对应的用户特征数据和歌单特征数据,所述用户特征数据为相应用户所访问的歌单、歌曲的唯一性特征信息与该用户所实施的行为类型的映射关系数据,所述歌单特征数据为该相应用户所访问的歌单的图文信息;模型调用子模块,用于调用已训练至收敛状态的所述双塔模型,为音乐库内的任意歌单,根据该歌单的图文信息提取出其相对应的歌单特征向量。
144.为解决上述技术问题,本技术实施例还提供计算机设备。如图8所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种新增歌单推荐方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本技术的新增歌单推荐方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图8中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
145.本实施方式中处理器用于执行图8中的各个模块及其子模块的具体功能,存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本技术的新增歌单推荐装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
146.本技术还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本技术任一实施例的新增歌单推荐方法的步骤。
147.本技术还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被一个或多个处理器执行时实现本技术任一实施例所述方法的步骤。
148.本领域普通技术人员可以理解实现本技术上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)等计算机可读存储介质,或随机存储记忆体(random access memory,ram)等。
149.综上所述,本技术根据表征用户行为数据的用户特征向量匹配相应的新增歌单,给用户对新增歌单进行“评分”获得相应的访问热度,由此,筛选出访问热度较高的优质新增歌单构建推荐列表,利用足量用户交互数据所起的投票效果,客观、高效地择优出优质新增歌单,省去大量人力成本,大大提升在线音乐平台的歌单产出效率以及质量。
150.本技术领域技术人员可以理解,本技术中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本技术中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本技术中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
151.以上所述仅是本技术的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1