一种模型的训练方法、数据召回方法、装置、介质及设备与流程

文档序号：34589745发布日期：2023-06-28 16:42阅读：40来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本公开实施例涉及深度学习技术，尤其涉及一种模型的训练方法、数据召回方法、装置、介质及设备。

背景技术：

1、随着应用程序的不断发展，通过应用程序向客户端进行高精度的数据推送成为一个研究方向。

2、在海量数据中，可通过数据召回模型进行针对性的数据召回。但是，在数据召回模型在目前的训练过程中存在训练难度大，对样本的使用效率差。

技术实现思路

1、本公开提供一种模型的训练方法、数据召回方法、装置、介质及设备，以实现训练得到高精度的数据召回模型。

2、第一方面，本公开实施例提供了一种数据召回模型的训练方法，包括：

3、获取样本对象的特征数据和所述样本对象对应的正样本数据集和负样本数据集，其中，所述负样本数据集中包括第一负样本数据和第二负样本数据，所述第一负样本数据与所述样本对象的特征数据的距离，小于所述第二负样本数据与所述样本对象的特征数据的距离；

4、基于所述样本对象的特征数据、任一所述正样本数据、任一所述第二负样本数据和所述第一负样本数据形成样本组；

5、基于任一所述样本对象的多个样本组训练得到数据召回模型：在训练过程中，基于训练过程中的数据召回模型输出的所述样本组中数据分别对应的特征向量，基于各所述特征向量之间的距离生成损失函数，基于所述损失函数对训练过程中的数据召回模型进行参数调节。

6、第二方面，本公开实施例还提供了一种数据召回方法，包括：

7、获取目标对象的特征数据和候选数据，将所述特征数据和候选数据输入至预先训练的数据召回模型中，得到所述特征数据对应的对象特征向量和所述候选数据对应的数据特征向量；

8、分别确定各所述候选数据的数据特征向量与所述对象特征向量的距离，并基于所述距离在所述候选数据中确定所述目标对象对应的目标数据。

9、第三方面，本公开实施例还提供了一种数据召回模型的训练装置，包括：

10、数据获取模块，用于获取样本对象的特征数据和所述样本对象对应的正样本数据集和负样本数据集，其中，所述负样本数据集中包括第一负样本数据和第二负样本数据，所述第一负样本数据与所述样本对象的特征数据的距离，小于所述第二负样本数据与所述样本对象的特征数据的距离；

11、样本组采样模块，用于基于所述样本对象的特征数据、任一所述正样本数据、任一所述第二负样本数据和所述第一负样本数据形成样本组；

12、模型训练模块，用于基于任一所述样本对象的多个样本组训练得到数据召回模型：在训练过程中，基于训练过程中的数据召回模型输出的所述样本组中数据分别对应的特征向量，基于各所述特征向量之间的距离生成损失函数，基于所述损失函数对训练过程中的数据召回模型进行参数调节。

13、第四方面，本公开实施例还提供了一种数据召回装置，包括：

14、数据处理模块，用于获取目标对象的特征数据和候选数据，将所述特征数据和候选数据输入至预先训练的数据召回模型中，得到所述特征数据对应的对象特征向量和所述候选数据对应的数据特征向量；

15、目标数据确定模块，用于分别确定各所述候选数据的数据特征向量与所述对象特征向量的距离，并基于所述距离在所述候选数据中确定所述目标对象对应的目标数据。

16、第五方面，本公开实施例还提供了一种电子设备，其特征在于，所述电子设备包括：

17、一个或多个处理器；

18、存储装置，用于存储一个或多个程序，

19、当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如任意实施例提供的数据召回模型的训练方法和/或任意实施例提供的数据召回方法。

20、第六方面，本公开实施例还提供了一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行如任意实施例提供的数据召回模型的训练方法和/或任意实施例提供的数据召回方法。

21、本公开实施例提供的技术方案，通过对样本对象进行样本采样，形成包含样本对象的特征数据、正样本数据、第二负样本数据和第一负样本数据的样本组，通过上述样本组对数据召回模型进行训练，可避免模型训练过程中对正负样本识别导致的无法继续优化的情况，引入第二负样本数据，避免在模型训练过程中损失趋于零导致的无法继续优化的情况，加深了模型训练程度，提高样本利用率，进一步提供了模型的训练精度和模型泛化能力。

技术特征：

1.一种数据召回模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述样本对象对应的负样本数据集中包括基于所述样本对象获取的负样本数据，和其他样本对象的正样本数据和负样本数据。

3.根据权利要求2所述的方法，其特征在于，所述样本对象为媒体数据的展示用户，所述正样本数据为向所述展示用户展示并被点击的媒体数据，所述基于所述样本对象获取的负样本数据为向所述展示用户展示并未被点击的媒体数据。

4.根据权利要求1所述的方法，其特征在于，在获取样本对象的特征数据和所述样本对象对应的正样本数据集和负样本数据集之后，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述基于所述样本对象的特征数据、任一所述正样本数据、任一所述第二负样本数据和所述第一负样本数据形成样本组，包括：

6.根据权利要求1所述的方法，其特征在于，所述基于训练过程中的数据召回模型输出的所述样本组中数据分别对应的特征向量，基于各所述特征向量之间的距离生成损失函数，包括：

7.根据权利要求6所述的方法，其特征在于，所述损失项包括如下的一项或多项：基于所述第二特征向量与所述第一特征向量之间的第一距离、所述第三特征向量与所述第一特征向量之间的第二距离确定的第一损失项；

8.一种数据召回方法，其特征在于，包括：

9.一种数据召回模型的训练装置，其特征在于，包括：

10.一种数据召回装置，其特征在于，包括：

11.一种电子设备，其特征在于，所述电子设备包括：

12.一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的数据召回模型的训练方法和/或权利要求8所述的数据召回方法。

技术总结
本公开实施例提供了一种模型的训练方法、数据召回方法、装置、介质及设备，其中训练方法包括：获取样本对象的特征数据和所述样本对象对应的正样本数据集和负样本数据集，基于所述样本对象的特征数据、任一所述正样本数据、任一所述第二负样本数据和所述第一负样本数据形成样本组；基于任一所述样本对象的多个样本组训练得到数据召回模型：在训练过程中，基于训练过程中的数据召回模型输出的所述样本组中数据分别对应的特征向量，基于各所述特征向量之间的距离生成损失函数，基于所述损失函数对训练过程中的数据召回模型进行参数调节。通过引入第二负样本数据，加深了模型训练程度，提供了模型的训练精度和模型泛化能力。

技术研发人员：雷鑫华,杨志雄,杨延展,李永会
受保护的技术使用者：抖音视界有限公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：雷鑫华杨志雄杨延展李永会
技术所有人：抖音视界有限公司
我是此专利的发明人

上一篇：盖板、显示面板、电子设备及盖板的制造方法与流程
上一篇：电池安全管控方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。