模型训练方法、文本检索方法、装置、电子设备和介质与流程

文档序号：33819472发布日期：2023-04-19 18:45阅读：32来源：国知局

本公开涉及人工智能，尤其涉及深度学习、自然语言处理和检索，可应用于搜索引擎、智能问答、知识检索、对话系统等场景下。更具体地，本公开提供了一种深度学习模型的训练方法、文本检索方法、装置、电子设备和存储介质。

背景技术：

1、随着人工智能技术的发展，深度学习模型的应用场景不断增加。可以利用深度学习模型处理用户输入的文本，得到文本向量。根据文本向量，返回与输入文本相关的检索结果

技术实现思路

1、本公开提供了一种深度学习模型的训练方法、文本检索方法、装置、电子设备和存储介质。

2、根据本公开的一方面，提供了一种深度学习模型的训练方法，该方法包括：将至少一个第一样本文本对分别输入深度学习模型，得到至少一个第一样本文本向量对，其中，第一样本文本对包括两个第一样本文本，第一样本文本向量对包括两个第一样本文本向量；将至少一个第二样本文本对分别输入深度学习模型，得到至少一个第二样本文本向量对，其中，第二样本文本对包括两个第二样本文本，第二样本文本向量对包括两个第二样本文本向量，第一样本文本向量对的两个第一样本文本向量之间的第一相似度大于或等于第二样本文本向量对的两个第二样本文本向量之间的第二相似度；以及根据至少一个第一相似度和至少一个第二相似度，训练深度学习模型。

3、根据本公开的另一方面，提供了一种文本检索方法，该方法包括：将目标文本输入深度学习模型，得到目标文本向量；根据目标文本向量与多个预设文本向量之间的多个目标相似度，得到目标检索结果，其中，深度学习模型的编码器是利用本公开提供的方法训练的。

4、根据本公开的另一方面，提供了一种深度学习模型的训练装置，该装置包括：第一获得模块，用于将至少一个第一样本文本对分别输入深度学习模型，得到至少一个第一样本文本向量对，其中，所述第一样本文本对包括两个第一样本文本，第一样本文本向量对包括两个第一样本文本向量；第二获得模块，用于将至少一个第二样本文本对分别输入深度学习模型，得到至少一个第二样本文本向量对，其中，所述第二样本文本对包括两个第二样本文本，第二样本文本向量对包括两个第二样本文本向量，第一样本文本向量对的两个第一样本文本向量之间的第一相似度大于或等于第二样本文本向量对的两个第二样本文本向量之间的第二相似度；以及训练模块，用于根据至少一个第一相似度和至少一个第二相似度，训练深度学习模型。

5、根据本公开的另一方面，提供了一种文本检索装置，该装置包括：第三获得模块，用于将目标文本输入深度学习模型，得到目标文本向量；第四获得模块，用于根据目标文本向量与多个预设文本向量之间的多个目标相似度，得到目标检索结果，其中，深度学习模型的编码器是利用本公开提供的装置训练的。

6、根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行根据本公开提供的方法。

7、根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使计算机执行根据本公开提供的方法。

8、根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现根据本公开提供的方法。

9、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种深度学习模型的训练方法，包括：

2.根据权利要求1所述的方法，其中，所述根据至少一个所述第一相似度和至少一个所述第二相似度，训练所述深度学习模型包括：

3.根据权利要求2所述的方法，其中，所述确定至少一个所述第一相似度和至少一个所述第二相似度之间的至少一个差异包括：

4.根据权利要求2所述的方法，其中，所述利用第一预设函数分别处理至少一个所述差异，得到至少一个第一处理结果包括：

5.根据权利要求2所述的方法，其中，所述利用第二预设函数处理至少一个所述第一处理结果，得到损失信息包括：

6.根据权利要求1所述的方法，其中，所述第一相似度为第一余弦相似度，所述第二相似度为第二余弦相似度。

7.根据权利要求1所述的方法，其中，所述第一相似度为正数，所述第二相似度为负数。

8.根据权利要求1所述的方法，其中，所述深度学习模型包括编码器，

9.一种文本检索方法，包括：

10.一种深度学习模型的训练装置，包括：

11.根据权利要求10所述的装置，其中，所述训练模块包括：

12.根据权利要求11所述的装置，其中，所述确定子模块包括：

13.根据权利要求1l所述的装置，其中，所述第一处理子模块包括：

14.根据权利要求11所述的装置，其中，所述第二处理子模块包括：

15.根据权利要求1o所述的装置，其中，所述第一相似度为第一余弦相似度，所述第二相似度为第二余弦相似度。

16.根据权利要求1o所述的装置，其中，所述第一相似度为正数，所述第二相似度为负数。

17.根据权利要求1o所述的装置，其中，所述深度学习模型包括编码器，

18.一种文本检索装置，包括：

19.一种电子设备，包括：

20.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1至9中任一项所述的方法。

21.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求l至9中任一项所述的方法。

技术总结
本公开提供了一种深度学习模型的训练方法，涉及人工智能技术领域，尤其涉及深度学习、自然语言处理和检索技术领域，可应用于搜索引擎、智能问答、知识检索、对话系统等场景下。具体实现方案为：将至少一个第一样本文本对分别输入深度学习模型，得到至少一个第一样本文本向量对；将至少一个第二样本文本对分别输入深度学习模型，得到至少一个第二样本文本向量对，其中，第一样本文本向量对的两个第一样本文本向量之间的第一相似度大于或等于第二样本文本向量对的两个第二样本文本向量之间的第二相似度；以及根据至少一个第一相似度和至少一个第二相似度，训练深度学习模型。本公开还提供了一种文本检索方法、装置、电子设备和存储介质。

技术研发人员：李威
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李威
技术所有人：北京百度网讯科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。