本发明涉及信息处理技术,尤其涉及多媒体信息推荐模型训练方法、多媒体信息推荐方法、装置、及电子设备。
背景技术:
1、人工智能(ai,artificial intelligence)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如自然语言处理技术以及机器学习/深度学习等几大方向,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
2、传统技术中,各类多媒体信息推荐系统向用户推荐相应的多媒体信息过程中,为了保证推荐速度,通常使用通用数据推荐模型,但是通用数据推荐模型是针对多领域通用数据训练而成的,其推荐结果过于常规,缺乏针对行业特点的多媒体信息推荐,而相反针对某一行业单独建立模型,则会因为训练数据缺乏造成模型的过拟合,影响推荐的准确性,严重影响用户的使用体验。
技术实现思路
1、有鉴于此,本发明实施例提供一种多媒体信息推荐模型训练方法、装置、电子设备及存储介质,本发明实施例的技术方案是这样实现的:
2、本发明实施例提供了一种多媒体信息推荐模型训练方法包括:
3、获取多媒体信息推荐环境中的基础历史数据;
4、基于所述基础历史数据,提取预训练样本集合;
5、基于所述预训练样本集合,对基础推荐模型进行训练,得到所述基础推荐模型的模型参数;
6、获取多媒体信息推荐环境中的行业历史数据;
7、从所述基础推荐模型的模型参数中提取所述基础推荐模型嵌入层网络的参数,并将所述嵌入层网络的参数迁移至多媒体信息推荐模型中,其中,所述基础推荐模型与所述多媒体信息推荐模型的模型结构相同;
8、根据所述行业历史数据,对所述多媒体信息推荐模型进行训练,确定多媒体信息推荐模型的模型参数,以实现通过所述多媒体信息推荐模型对目标行业的多媒体信息的召回策略进行调整,并且通过所述召回策略进行多媒体信息推荐。
9、本发明实施例还提供了一种获取多媒体信息数据源中的待推荐多媒体信息;
10、通过多媒体信息推荐模型对不同待推荐多媒体信息进行处理,确定不同待推荐多媒体信息的优先级;
11、根据不同待推荐多媒体信息的优先级对多媒体信息的召回策略进行调整,并且通过所述召回策略进行多媒体信息推荐。
12、本发明实施例还提供了一种多媒体信息推荐模型训练装置,包括:
13、信息传输模块,用于获取多媒体信息推荐环境中的基础历史数据;
14、信息处理模块,用于基于所述基础历史数据,提取预训练样本集合;
15、所述信息处理模块,用于基于所述预训练样本集合,对基础推荐模型进行训练,得到基础推荐模型的模型参数;
16、所述信息处理模块,用于获取多媒体信息推荐环境中的行业历史数据;
17、所述信息处理模块,用于根据所述行业历史数据,对所述多媒体信息推荐模型进行训练,确定多媒体信息推荐模型的模型参数,以实现通过所述多媒体信息推荐模型对目标行业的多媒体信息的召回策略进行调整,并且通过所述召回策略进行多媒体信息推荐。
18、上述方案中,
19、所述信息处理模块,用于根据所述行业历史数据,对所述基础推荐模型的嵌入层网络的嵌入特征进行调整,得到多媒体信息推荐模型的嵌入特征;
20、所述信息处理模块,用于根据所述目标行业的类型,为所述多媒体信息推荐模型配置训练循环轮次参数;
21、所述信息处理模块,用于当所述多媒体信息推荐模型的训练次数小于等于所述训练循环轮次参数时,保持所述嵌入层网络的参数不变,利用所述多媒体信息推荐模型的嵌入特征,和所述多媒体信息推荐模型的多任务损失函数,对所述多媒体信息推荐模型的网络参数进行调整;
22、直至所述多媒体信息推荐模型对应的损失函数达到相应的收敛条件时,确定所述多媒体信息推荐模型的第一模型参数,其中,所述多媒体信息推荐模型的模型参数包括所述第一模型参数。
23、上述方案中,
24、所述信息处理模块,用于当所述多媒体信息推荐模型的训练次数大于所述训练循环轮次参数时,利用所述多媒体信息推荐模型的嵌入特征,对所述基础推荐模型进行训练,以实现调整所述多媒体信息推荐模型的第一模型参数,得到所述多媒体信息推荐模型的模型参数。
25、上述方案中,
26、所述信息处理模块,用于确定所述多媒体信息推荐模型对应的损失函数的收敛速度;
27、所述信息处理模块,用于根据所述收敛速度,对所述训练循环轮次参数进行动态调整,以实现所述训练循环轮次参数与所述收敛速度相匹配。
28、上述方案中,
29、所述信息处理模块,用于根据所述行业历史数据,确定所述预训练样本集合中的无效样本;
30、所述信息处理模块,用于基于所述行业历史数据,确定与所述行业历史数据相匹配的行业特征样本;
31、所述信息处理模块,用于利用所述无效样本和所述行业特征样本,对所述预训练样本集合进行调整,得到行业训练样本集合。
32、上述方案中,
33、所述信息处理模块,用于根据所述目标行业的类型,为所述多媒体信息推荐模型配置训练循环轮次参数;
34、所述信息处理模块,用于提取所述基础推荐模型的嵌入层网络的嵌入特征;
35、所述信息处理模块,用于当所述多媒体信息推荐模型的训练次数小于等于所述训练循环轮次参数时,保持所述嵌入层网络的参数不变,通过所述行业训练样本集合,对所述嵌入特征进行调整,得到所述多媒体信息推荐模型的第二模型参数,其中,所述多媒体信息推荐模型的模型参数包括所述第二模型参数;
36、所述信息处理模块,用于当所述多媒体信息推荐模型的训练次数大于所述训练循环轮次参数时,通过所述行业训练样本集合,对所述基础推荐模型进行训练,以实现调整所述多媒体信息推荐模型的第二模型参数,得到所述多媒体信息推荐模型的模型参数。
37、上述方案中,
38、所述信息处理模块,用于当所述多媒体信息为视频广告时,
39、所述信息处理模块,用于将所述视频广告播放时的曝光参数向检测服务器发送,以实现所述检测服务器获取视频广告的曝光参数;
40、所述信息处理模块,用于将所述曝光参数作为所述多媒体信息的播放效果的评价参数,并且根据所述召回策略的调整结果,查找目标曝光参数。
41、上述方案中,
42、所述信息处理模块,用于获取目标行业对应观众的历史浏览信息;
43、所述信息处理模块,用于基于所述目标行业对应观众的历史浏览信息,确定与所述历史浏览信息对应的多媒体信息曝光历史;
44、所述信息处理模块,用于基于所述历史浏览信息对应的多媒体信息曝光历史,对所述多媒体信息的召回策略进行动态调整。
45、上述方案中,
46、所述信息处理模块,用于根据所述多媒体信息推荐环境,确定待推荐多媒体信息的品类;
47、所述信息处理模块,用于响应于所述待推荐多媒体信息的品类,触发相匹配的多媒体信息数据源,以实现通过与待推荐多媒体信息的品类相匹配的多媒体信息数据源对所述待推荐多媒体信息进行调整。
48、本发明实施例还提供了一种多媒体信息推荐模型训练装置,包括:
49、数据传输模块,用于获取多媒体信息数据源中的待推荐多媒体信息;
50、数据处理模块,用于通过多媒体信息推荐模型对不同待推荐多媒体信息进行处理,确定不同待推荐多媒体信息的优先级;
51、所述数据处理模块,用于根据不同待推荐多媒体信息的优先级对多媒体信息的召回策略进行调整,并且通过所述召回策略进行多媒体信息推荐。
52、本发明实施例还提供了一种电子设备,所述电子设备包括:
53、存储器,用于存储可执行指令;
54、处理器,用于运行所述存储器存储的可执行指令时,实现前述的多媒体信息推荐模型训练方法,或者前述的多媒体信息推荐方法。
55、本发明实施例还提供了一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时实现前述的多媒体信息推荐模型训练方法,或者前述的多媒体信息推荐方法。
56、本发明实施例具有以下有益效果:
57、本发明通过获取多媒体信息推荐环境中的基础历史数据;基于所述基础历史数据,提取预训练样本集合;基于所述预训练样本集合,对基础推荐模型进行训练,得到基础推荐模型的模型参数;获取多媒体信息推荐环境中的行业历史数据;从所述基础推荐模型的模型参数中提取所述基础推荐模型嵌入层网络的参数,并将所述嵌入层网络的参数迁移至多媒体信息推荐模型中,其中,所述基础推荐模型与所述多媒体信息推荐模型的模型结构相同;根据所述行业历史数据,对所述多媒体信息推荐模型进行训练,确定多媒体信息推荐模型的模型参数,以实现通过所述多媒体信息推荐模型对目标行业的多媒体信息的召回策略进行调整,并且通过所述召回策略进行多媒体信息推荐。由此,可以实现多媒体信息推荐模型能够对使用环境中不同行业的用户进行多媒体信息的推荐,同时增强了多媒体信息推荐的准确性与关联性,有效提高多媒体信息的推荐的质量,也可以使用较少的样本完成模型训练,同时减少多媒体信息推荐模型的过拟合,提升多媒体信息推荐模型的泛化性,提升用户的使用体验。