双塔模型的训练方法及商品召回方法与流程

文档序号:37276687发布日期:2024-03-12 21:11阅读:15来源:国知局
双塔模型的训练方法及商品召回方法与流程

本公开涉及信息处理,尤其涉及一种双塔模型的训练方法及商品召回方法。


背景技术:

1、目前,针对商品召回场景,往往基于双塔模型进行确定相关的商品,然而,双塔模型的目标函数对超参数十分敏感,相关技术中,可以通过网格搜索方法,即通过打表的方式,遍历尽可能多的超参数,然后选择性能最好的模型,还可以通过神经结构搜索(neuralarchitecture search,简称nas)的超参数优化方法,即通过近似双层优化训练模型,加速参数的选择,然而上述方法,获取超参数的效率较低,且训练成本较高,超参数的自适应性较低,因此,如何更加高效地获取超参数,提高超参数的自适应性,以提高模型的性能,已成为亟待解决的问题。


技术实现思路

1、本公开提出一种双塔模型的训练方法、商品召回方法、装置、电子设备、存储介质及计算机程序产品。

2、本公开第一方面实施例提出了一种双塔模型的训练方法,该方法包括:获取多个正负样本对,每个所述正负样本对包括对应同一样本查询词的正样本和负样本,其中,所述正样本还包括第一商品信息,所述负样本还包括第二商品信息;将所述正负样本对输入至双塔模型中进行训练,获取所述正样本对应的第一超参数和所述负样本对应的第二超参数,其中,所述第一超参数和所述第二超参数用于获取优化所述双塔模型的模型参数的目标函数;根据所述正样本和所述第一超参数,以及所述负样本和所述第二超参数,获取用于优化所述双塔模型的模型参数的目标函数;根据所述目标函数,对所述双塔模型的模型参数进行优化并返回继续训练,直至满足训练结束条件得到目标双塔模型,其中,所述目标双塔模型用于确定查询词与商品信息之间的映射关系。

3、本公开实施例中,通过获取多个正负样本对,每个正负样本对包括对应同一样本查询词的正样本和负样本,其中,正样本还包括第一商品信息,负样本还包括第二商品信息,将正负样本对输入至双塔模型中进行训练,获取正样本对应的第一超参数和负样本对应的第二超参数,其中,第一超参数和第二超参数用于获取优化双塔模型的模型参数的目标函数,根据正样本和第一超参数,以及负样本和第二超参数,获取用于优化双塔模型的模型参数的目标函数,根据目标函数,对双塔模型的模型参数进行优化并返回继续训练,直至满足训练结束条件得到目标双塔模型,其中,目标双塔模型用于确定查询词与商品信息之间的映射关系,本公开通过将正负样本对输入至双塔模型中进行训练,可以获取样本级别的超参数,提高了获取超参数的自适应性和高效性,提高了双塔模型的训练效率和模型性能。

4、本公开第二方面实施例提出了一种商品召回方法,该方法包括:获取用户查询词,将所述用户查询词输入至目标双塔模型,通过所述目标双塔模型基于所述用户查询词,确定与所述用户查询词对应的第一目标向量;通过所述目标双塔模型,确定候选商品对应的第二目标向量,根据所述第二目标向量建立索引集合;根据所述第一目标向量,对所述索引集合中的候选索引进行检索,确定与所述用户查询词关联的目标商品,其中,所述目标信息匹配模型为采用如第一方面任一项所述的方法训练出的模型。

5、本公开实施例中,通过获取用户查询词,将用户查询词输入至目标双塔模型,通过目标双塔模型基于用户查询词,确定与用户查询词对应的第一目标向量,通过目标双塔模型,确定候选商品对应的第二目标向量,根据第二目标向量建立索引集合,根据第一目标向量,对索引集合中的候选索引进行检索,确定与用户查询词关联的目标商品,本公开基于目标双塔模型,可以获取与用户查询词关联的目标商品,提高了商品召回的准确性和可靠性。

6、本公开第三方面实施例提出一种双塔模型的训练装置,包括:第一获取模块,用于获取多个正负样本对,每个所述正负样本对包括对应同一样本查询词的正样本和负样本,其中,所述正样本还包括第一商品信息,所述负样本还包括第二商品信息;第二获取模块,用于将所述正负样本对输入至双塔模型中进行训练,获取所述正样本对应的第一超参数和所述负样本对应的第二超参数,其中,所述第一超参数和所述第二超参数用于获取优化所述双塔模型的模型参数的目标函数;第三获取模块,用于根据所述正样本和所述第一超参数,以及所述负样本和所述第二超参数,获取用于优化所述双塔模型的模型参数的目标函数;训练模块,用于根据所述目标函数,对所述双塔模型的模型参数进行优化并返回继续训练,直至满足训练结束条件得到目标双塔模型,其中,所述目标双塔模型用于确定查询词与商品信息之间的映射关系。

7、本公开第四方面实施例提出一种商品召回装置,包括:第一获取模块,用于获取多个正负样本对,每个所述正负样本对包括对应同一样本查询词的正样本和负样本;第二获取模块,用于将所述正负样本对输入至双塔模型中进行训练,获取所述正样本对应的第一超参数和所述负样本对应的第二超参数;第三获取模块,用于根据所述正样本和所述第一超参数,以及所述负样本和所述第二超参数,获取用于优化所述双塔模型的模型参数的目标函数;训练模块,用于根据所述目标函数,对所述双塔模型的模型参数进行优化并返回继续训练,直至满足训练结束条件得到目标双塔模型,其中,所述目标双塔模型用于确定查询词与商品之间的映射关系。

8、本公开第五方面实施例提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述第一方面实施例双塔模型的训练方法或第二方面实施例的商品召回方法。

9、本公开第六方面实施例提出了一种存储有计算机指令的计算机可读存储介质,所述计算机指令用于使所述计算机执行如上述第一方面实施例双塔模型的训练方法或第二方面实施例的商品召回方法。

10、本公开第七方面实施例提出了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现本公开第一方面实施例双塔模型的训练方法或第二方面实施例的商品召回方法。

11、本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。



技术特征:

1.一种双塔模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述第二超参数的获取过程,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述样本词向量、所述第一样本向量和所述第二样本向量,获取所述负样本对应的第二超参数,包括:

4.根据权利要求1或2所述的方法,其特征在于,所述第一超参数的获取过程,包括:

5.根据权利要求3所述的方法,其特征在于,所述根据所述正样本和所述第一超参数,以及所述负样本和所述第二超参数,获取用于优化所述双塔模型的模型参数的目标函数,包括:

6.根据权利要求5所述的方法,其特征在于,所述第一目标函数的获取过程,包括:

7.根据权利要求5所述的方法,其特征在于,所第二目标函数的获取过程,包括:

8.根据权利要求5所述的方法,其特征在于,所述第一目标函数的获取过程,包括:

9.根据权利要求5所述的方法,其特征在于,所述第二目标函数的获取过程,包括:

10.一种商品召回方法,其特征在于,所述方法,包括:

11.根据权利要求10所述的方法,其特征在于,所述根据所述第一目标向量,对所述索引集合中的候选索引进行检索,确定与所述用户查询词关联的目标商品,包括:

12.根据权利要求11所述的方法,其特征在于,所述根据所述相似度从候选索引中确定目标索引,包括:

13.根据权利要求11所述的方法,其特征在于,所述根据所述相似度从候选索引中确定目标索引,包括:

14.一种双塔模型的训练装置,其特征在于,所述装置包括:

15.一种商品召回装置,其特征在于,所述装置包括:

16.一种电子设备,其特征在于,包括存储器和处理器;

17.一种计算机可读存储介质计算机可读存储介质存储计算机程序,当计算机程序在计算机上运行时,权利要求1-9或权利要求10-13中任一项所述的方法被执行。

18.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-9或权利要求10-13中任一项所述的方法。


技术总结
本公开提出一种双塔模型的训练方法及商品召回方法,训练方法包括获取多个正负样本对,每个正负样本对包括对应同一样本查询词的正样本和负样本;将正负样本对输入至双塔模型中进行训练,获取正样本对应的第一超参数和负样本对应的第二超参数;根据正样本和第一超参数,负样本和第二超参数,获取用于优化双塔模型的模型参数的目标函数;根据目标函数对双塔模型的模型参数进行优化并返回继续训练,直至满足训练结束条件得到目标双塔模型,目标双塔模型用于确定查询词与商品之间的映射关系,本公开通过将正负样本对输入至双塔模型中进行训练,可以获取样本级别的超参数,提高了获取超参数的自适应性和高效性,提高了双塔模型的训练效率和模型性能。

技术研发人员:李明明,王彬彬,卓靖炜,刘林
受保护的技术使用者:北京沃东天骏信息技术有限公司
技术研发日:
技术公布日:2024/3/11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1