本申请涉及听歌识曲,特别是涉及一种听歌识曲的多版本结果确定方法、计算机设备、存储介质和计算机程序产品。
背景技术:
1、在mir(music information retrieval,音乐信息检索)识别领域中,最为基础和重要的技术之一便是听歌识曲;听歌识曲,可以帮用户在茫茫歌海中,迅速定位到其所听到的那首歌。
2、目前的听歌识曲方案中,大多都以单结果形式返回听歌识曲音频库内音频最为相似的歌曲,以输出给用户播放;但是,以单结果形式返回只返回一个音频,容易仅将盗歌返回给用户。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种听歌识曲的多版本结果确定方法、计算机设备、存储介质和计算机程序产品。
2、本申请提供一种听歌识曲的多版本结果确定方法,所述方法包括:
3、获取用户请求识别的音频片段;
4、基于所述音频片段的指纹与听歌识曲音频指纹库里的指纹之间的相似度,在听歌识曲音频库里确定被召回歌曲;
5、基于所述被召回歌曲在预先构建的同歌组库里进行检索,扩充得到多结果歌曲池;所述同歌组库里的同歌组是基于同一首歌的不同版本形成的;
6、将所述多结果歌曲池里的各歌曲归至相应的版本类别,在每个版本类别中选取热度值满足预设热度条件的歌曲,得到多版本结果,以将所述多版本结果返回给所述用户。
7、在一个实施例中,基于所述被召回歌曲在预先构建的同歌组库里进行检索,扩充得到多结果歌曲池,包括:
8、在预先构建的同歌组库里,将所述被召回歌曲出现的同歌组,作为目标同歌组;
9、将所述目标同歌组内的歌曲归入同个池,得到多结果歌曲池。
10、在一个实施例中,将所述多结果歌曲池里的各歌曲归至相应的版本类别,包括:
11、基于歌曲的版本标签和版本类别之间的映射关系,将所述多结果歌曲池里的各歌曲归至相应的版本类别。
12、在一个实施例中,在每个版本类别中选取热度值满足预设热度条件的歌曲,得到多版本结果,包括:
13、基于歌曲的完播率、收藏率和分享率中的至少一种,得到每个版本类别下的各歌曲的热度值;
14、按热度值从高到低进行排序,在每个版本类别中选取热度值排序靠前的歌曲,得到每个版本类别中热度值满足预设热度条件的歌曲,以形成多版本结果。
15、进一步地,基于歌曲的完播率、收藏率和分享率中的至少一种,得到每个版本类别下的各歌曲的热度值,包括:
16、获取每个版本类别下各歌曲的完播率、收藏率和分享率;
17、对同一歌曲的完播率、收藏率和分享率进行加权求和,得到每个版本类别下各歌曲的热度值。
18、更进一步地,获取每个版本类别下各歌曲的完播率,包括:
19、根据歌曲在预设历史时段内的平均播放时长与该歌曲的时长之间的比值,得到每个版本类别下各歌曲的完播率。
20、更进一步地,获取每个版本类别下各歌曲的收藏率,包括:
21、根据歌曲的收藏次数与该歌曲的点击播放次数之间的比值,得到每个版本类别下各歌曲的收藏率。
22、更进一步地,获取每个版本类别下各歌曲的分享率,包括:
23、根据歌曲的分享次数与该歌曲的点击播放次数之间的比值,得到每个版本类别下各歌曲的分享率。
24、在一个实施例中,构建所述同歌组库的步骤,包括:
25、从所述听歌识曲音频库中,筛选出歌曲,得到候选歌曲池;
26、分别以候选歌曲池里的各歌曲为请求,在所述候选歌曲池中召回在旋律上满足相似条件的歌曲,得到所述候选歌曲池里各歌曲的初步同歌组;
27、基于所述候选歌曲池里各歌曲的初步同歌组,得到所述同歌组库。
28、进一步地,从所述听歌识曲音频库中,筛选出歌曲,得到候选歌曲池,包括:
29、在所述听歌识曲音频库中,确定具有歌曲标签的音频;
30、将具有歌曲标签的音频归在同个池中,得到候选歌曲池。
31、进一步地,分别以候选歌曲池里的各歌曲为请求,在所述候选歌曲池中召回在旋律上满足相似条件的歌曲,得到所述候选歌曲池里各歌曲的初步同歌组,包括:
32、分别以候选歌曲池里的各歌曲为请求,根据两两歌曲的旋律特征向量之间的余弦值,得到作为所述请求的歌曲与所述候选歌曲池内其他歌曲在旋律上的相似度;
33、将旋律上的相似度大于阈值的其他歌曲,归入作为所述请求的歌曲的初步同歌组中。
34、更进一步地,在根据两两歌曲的旋律特征向量之间的余弦值,得到作为所述请求的歌曲与所述候选歌曲池内其他歌曲在旋律上的相似度之前,所述方法还包括:
35、获取所述候选歌曲池内每首歌曲的梅尔频谱图;
36、利用训练好的翻唱模型对每首歌曲的梅尔频谱图进行矩阵运算,得到所述候选歌曲池内每首歌曲的旋律特征向量。
37、进一步地,基于所述候选歌曲池里各歌曲的初步同歌组,得到所述同歌组库,包括:
38、基于两两歌曲之间的歌名相似度、歌词相似度和旋律相似度,得到所述候选歌曲池里各歌曲与对应初步同歌组内的其他歌曲间的融合相似度;
39、从所述候选歌曲池里各歌曲的初步同歌组中,剔除融合相似度低于阈值的所述其他歌曲,得到所述候选歌曲池里各歌曲的剔除后同歌组;
40、基于所述候选歌曲池里各歌曲的剔除后同歌组,得到所述同歌组库。
41、更进一步地,基于所述候选歌曲池里各歌曲的剔除后同歌组,得到所述同歌组库,包括:
42、获取两两剔除后同歌组之间的歌曲交集数;
43、若所述歌曲交集数在其中一个剔除后同歌组内的歌曲数中的占比超过阈值,则将所述两两剔除后同歌组进行合并,以得到所述同歌组库。
44、本申请提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行上述方法。
45、本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行上述方法。
46、本申请提供一种计算机程序产品,其上存储有计算机程序,所述计算机程序被处理器执行上述方法。
47、本申请中,在得到用户请求识别的音频片段后,基于该音频片段的指纹与听歌识曲音频指纹库里的指纹之间的相似度,在听歌识曲音频库里确定被召回歌曲;接着,基于所述被召回歌曲在预先构建的同歌组库里进行检索,扩充得到多结果歌曲池,避免单结果返回导致仅返回盗歌版本的情况;并且,在得到多结果歌曲池后,将结果歌曲池里的各歌曲归至相应的版本类别,在每个版本类别中选取热度值满足预设热度条件的歌曲,得到多版本结果,相较于单结果而言,多版本结果更可能包括用户感兴趣的版本,便于用户在多版本结果中确定感兴趣的版本,提高听歌识曲效率。
1.一种听歌识曲的多版本结果确定方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,基于所述被召回歌曲在预先构建的同歌组库里进行检索,扩充得到多结果歌曲池,包括:
3.根据权利要求1所述的方法,其特征在于,在每个版本类别中选取热度值满足预设热度条件的歌曲,得到多版本结果,包括:
4.根据权利要求1至3任一项所述的方法,其特征在于,构建所述同歌组库的步骤,包括:
5.根据权利要求4所述的方法,其特征在于,分别以候选歌曲池里的各歌曲为请求,在所述候选歌曲池中召回在旋律上满足相似条件的歌曲,得到所述候选歌曲池里各歌曲对应的初步同歌组,包括:
6.根据权利要求5所述的方法,其特征在于,在根据两两歌曲的旋律特征向量之间的余弦值,得到作为所述请求的歌曲与所述候选歌曲池内其他歌曲在旋律上的相似度之前,所述方法还包括:
7.根据权利要求4所述的方法,其特征在于,基于所述候选歌曲池里各歌曲对应的初步同歌组,得到所述同歌组库,包括:
8.根据权利要求7所述的方法,其特征在于,基于所述候选歌曲池里各歌曲的剔除后同歌组,得到所述同歌组库,包括:
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法。