本公开实施例涉及深度学习技术,尤其涉及一种模型的训练方法、数据召回方法、装置、介质及设备。
背景技术:
1、随着应用程序的不断发展,通过应用程序向客户端进行高精度的数据推送成为一个研究方向。
2、在海量数据中,可通过数据召回模型进行针对性的数据召回。但是,在数据召回模型在目前的训练过程中存在训练难度大,对样本的使用效率差。
技术实现思路
1、本公开提供一种模型的训练方法、数据召回方法、装置、介质及设备,以实现训练得到高精度的数据召回模型。
2、第一方面,本公开实施例提供了一种数据召回模型的训练方法,包括:
3、获取样本对象的特征数据和所述样本对象对应的正样本数据集和负样本数据集,其中,所述负样本数据集中包括第一负样本数据和第二负样本数据,所述第一负样本数据与所述样本对象的特征数据的距离,小于所述第二负样本数据与所述样本对象的特征数据的距离;
4、基于所述样本对象的特征数据、任一所述正样本数据、任一所述第二负样本数据和所述第一负样本数据形成样本组;
5、基于任一所述样本对象的多个样本组训练得到数据召回模型:在训练过程中,基于训练过程中的数据召回模型输出的所述样本组中数据分别对应的特征向量,基于各所述特征向量之间的距离生成损失函数,基于所述损失函数对训练过程中的数据召回模型进行参数调节。
6、第二方面,本公开实施例还提供了一种数据召回方法,包括:
7、获取目标对象的特征数据和候选数据,将所述特征数据和候选数据输入至预先训练的数据召回模型中,得到所述特征数据对应的对象特征向量和所述候选数据对应的数据特征向量;
8、分别确定各所述候选数据的数据特征向量与所述对象特征向量的距离,并基于所述距离在所述候选数据中确定所述目标对象对应的目标数据。
9、第三方面,本公开实施例还提供了一种数据召回模型的训练装置,包括:
10、数据获取模块,用于获取样本对象的特征数据和所述样本对象对应的正样本数据集和负样本数据集,其中,所述负样本数据集中包括第一负样本数据和第二负样本数据,所述第一负样本数据与所述样本对象的特征数据的距离,小于所述第二负样本数据与所述样本对象的特征数据的距离;
11、样本组采样模块,用于基于所述样本对象的特征数据、任一所述正样本数据、任一所述第二负样本数据和所述第一负样本数据形成样本组;
12、模型训练模块,用于基于任一所述样本对象的多个样本组训练得到数据召回模型:在训练过程中,基于训练过程中的数据召回模型输出的所述样本组中数据分别对应的特征向量,基于各所述特征向量之间的距离生成损失函数,基于所述损失函数对训练过程中的数据召回模型进行参数调节。
13、第四方面,本公开实施例还提供了一种数据召回装置,包括:
14、数据处理模块,用于获取目标对象的特征数据和候选数据,将所述特征数据和候选数据输入至预先训练的数据召回模型中,得到所述特征数据对应的对象特征向量和所述候选数据对应的数据特征向量;
15、目标数据确定模块,用于分别确定各所述候选数据的数据特征向量与所述对象特征向量的距离,并基于所述距离在所述候选数据中确定所述目标对象对应的目标数据。
16、第五方面,本公开实施例还提供了一种电子设备,其特征在于,所述电子设备包括:
17、一个或多个处理器;
18、存储装置,用于存储一个或多个程序,
19、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如任意实施例提供的数据召回模型的训练方法和/或任意实施例提供的数据召回方法。
20、第六方面,本公开实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如任意实施例提供的数据召回模型的训练方法和/或任意实施例提供的数据召回方法。
21、本公开实施例提供的技术方案,通过对样本对象进行样本采样,形成包含样本对象的特征数据、正样本数据、第二负样本数据和第一负样本数据的样本组,通过上述样本组对数据召回模型进行训练,可避免模型训练过程中对正负样本识别导致的无法继续优化的情况,引入第二负样本数据,避免在模型训练过程中损失趋于零导致的无法继续优化的情况,加深了模型训练程度,提高样本利用率,进一步提供了模型的训练精度和模型泛化能力。
1.一种数据召回模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述样本对象对应的负样本数据集中包括基于所述样本对象获取的负样本数据,和其他样本对象的正样本数据和负样本数据。
3.根据权利要求2所述的方法,其特征在于,所述样本对象为媒体数据的展示用户,所述正样本数据为向所述展示用户展示并被点击的媒体数据,所述基于所述样本对象获取的负样本数据为向所述展示用户展示并未被点击的媒体数据。
4.根据权利要求1所述的方法,其特征在于,在获取样本对象的特征数据和所述样本对象对应的正样本数据集和负样本数据集之后,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,所述基于所述样本对象的特征数据、任一所述正样本数据、任一所述第二负样本数据和所述第一负样本数据形成样本组,包括:
6.根据权利要求1所述的方法,其特征在于,所述基于训练过程中的数据召回模型输出的所述样本组中数据分别对应的特征向量,基于各所述特征向量之间的距离生成损失函数,包括:
7.根据权利要求6所述的方法,其特征在于,所述损失项包括如下的一项或多项:基于所述第二特征向量与所述第一特征向量之间的第一距离、所述第三特征向量与所述第一特征向量之间的第二距离确定的第一损失项;
8.一种数据召回方法,其特征在于,包括:
9.一种数据召回模型的训练装置,其特征在于,包括:
10.一种数据召回装置,其特征在于,包括:
11.一种电子设备,其特征在于,所述电子设备包括:
12.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的数据召回模型的训练方法和/或权利要求8所述的数据召回方法。