语义识别模型的训练方法和装置、存储介质及电子设备与流程

文档序号：35867981发布日期：2023-10-27 21:46阅读：82来源：国知局

本发明涉及计算机领域，具体而言，涉及一种语义识别模型的训练方法和装置、存储介质及电子设备。

背景技术：

1、随着互联网技术的发展，用户通过搜索引擎获取感兴趣的媒体资源越来越普遍。如果用户在搜索过程中输入的query(搜索词条)存在词不达意或跟想要找的目标媒体资源存在一定的语意偏差时，引擎可能就无法有效返回用户想要的目标媒体资源。

2、现有技术会采用一些query自动改写技术来缓解此类体验不佳的问题，例如可以采用seq2seq(即encoder-decoder)模型基于原搜索请求中的第一搜索词条改写得到第二搜索词条，并基于第一搜索词条和第二搜索词条召回媒体资源。由于改写后得到的第二搜索词条可能与第一搜索词条存在一定的语义偏差，如果直接基于存在语义偏差的第二改写词条召回媒体资源，仍然可能召回不准确的媒体资源。

3、相关技术在确定第二搜索词条之后，主要基于词条改写前后的各个字符之间的相似度进行语义偏差的判断，但基于字符之间的相似度仍然不能反映改写前后词条的整体意图相关性。例如，搜索词条中包括的“武书连”通常是人名意图，而包括的“五连书城”可能是机构/网站寻址意图。由此可见，现有的语义相关性识别的方法存在识别准确率低的技术问题。

4、针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

1、本发明实施例提供了一种语义识别模型的训练方法和装置、存储介质及电子设备，以至少解决相关技术中识别两个词条之间的语义相关性的准确率低的技术问题。

2、根据本发明实施例的一个方面，提供了一种语义识别模型的训练方法，包括：利用目标样本词条对集合训练特征提取网络，得到满足第一收敛条件的目标特征提取网络；对上述目标特征提取网络和语义相关性分档网络进行联合训练，其中，上述语义相关性分档网络中包括：全连接层及复合任务识别网络，上述复合任务识别网络中至少包括用于对上述样本词条对中搜索词条之间的语义相关性进行识别分档的分档子网络，以及用于对上述样本词条对中搜索词条各自的表达意图进行识别的识别子网络；在联合训练的训练损失达到第二收敛条件的情况下，利用上述目标特征提取网络、上述全连接层和上述分档子网络构建目标语义识别模型，其中，上述目标语义识别模型用于识别两个搜索词条之间的语义相关性对应的分档。

3、根据本发明实施例的另一方面，还提供了一种搜索词条的确定方法，包括：响应于资源召回请求，获取资源召回请求中携带的原始搜索词条；根据原始搜索词条生成派生搜索词条，其中，基于原始搜索词条召回的媒体资源集合与基于派生搜索词条召回的媒体资源集合之间的重合度大于目标阈值；利用目标语义识别模型确定原始搜索词条和派生搜索词条之间的语义相关性对应的分档，其中，目标语义识别模型为根据目标特征提取网络、全连接层和分档子网络构建得到的识别模型，全连接层和分档子网络为对目标特征提取网络和语义相关性分档网络进行联合训练确定的网络，语义相关性分档网络中包括：全连接层及复合任务识别网络，复合任务识别网络中至少包括分档子网络，以及用于对样本词条对中搜索词条各自的表达意图进行识别的识别子网络，分档子网络用于对样本词条对中搜索词条之间的语义相关性进行识别分档；在语义相关性对应的分档满足目标条件的情况下，将原始搜索词条和派生搜索词条确定为目标搜索词条，其中，目标搜索词条用于召回目标媒体资源集合。

4、根据本发明实施例的又一方面，还提供了一种语义识别模型的训练装置，包括：第一训练单元，用于利用目标样本词条对集合训练特征提取网络，得到满足第一收敛条件的目标特征提取网络，其中，上述目标样本词条对集合中的样本词条对包括第一搜索词条和第二搜索词条，基于上述第一搜索词条召回的媒体资源集合与基于上述第二搜索词条召回的媒体资源集合之间的重合度大于目标阈值，上述特征提取网络是通过蒸馏方式得到的用于提取搜索词条的语义特征的神经网络；第二训练单元，用于对上述目标特征提取网络和语义相关性分档网络进行联合训练，其中，上述语义相关性分档网络中包括：全连接层及复合任务识别网络，上述复合任务识别网络中至少包括用于对上述样本词条对中搜索词条之间的语义相关性进行识别分档的分档子网络，以及用于对上述样本词条对中搜索词条各自的表达意图进行识别的识别子网络；构建单元，用于在联合训练的训练损失达到第二收敛条件的情况下，利用上述目标特征提取网络、上述全连接层和上述分档子网络构建目标语义识别模型，其中，上述目标语义识别模型用于识别两个搜索词条之间的语义相关性对应的分档。

5、根据本发明实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述语义识别模型的训练方法或上述搜索词条的确定方法。

6、根据本申请实施例的又一个方面，提供一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行如以上语义识别模型的训练方法或上述搜索词条的确定方法。

7、根据本发明实施例的又一方面，还提供了一种电子设备，包括存储器和处理器，上述存储器中存储有计算机程序，上述处理器被设置为通过上述计算机程序执行上述的语义识别模型的训练方法或上述搜索词条的确定方法。

8、在本发明实施例中，首先利用目标样本词条对集合训练特征提取网络，得到满足第一收敛条件的目标特征提取网络；对目标特征提取网络和语义相关性分档网络进行联合训练，其中，语义相关性分档网络中包括：全连接层及复合任务识别网络，复合任务识别网络中至少包括用于对样本词条对中搜索词条之间的语义相关性进行识别分档的分档子网络，以及用于对样本词条对中搜索词条各自的表达意图进行识别的识别子网络；在联合训练的训练损失达到第二收敛条件的情况下，进而利用目标特征提取网络、全连接层和分档子网络构建目标语义识别模型，其中，目标语义识别模型用于识别两个搜索词条之间的语义相关性对应的分档。通过本申请上述实施方式，在训练过程中联合具有词条意图识别的子网络进行联合训练，根据训练损失对模型的共有部分进行调整，进而提升模型的共有部分的词条语义和意图的识别能力，再利用模型共有部分与分档子网络进行语义相关性分档，从而显著提升模型对于词条的语义相关性的识别能力，解决相关技术中识别两个词条之间的语义相关性的准确率低的技术问题，实现对词条之间的语义相关性进行准确识别的技术效果。

技术特征：

1.一种语义识别模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述目标特征提取网络和语义相关性分档网络进行联合训练包括：

3.根据权利要求2所述的方法，其特征在于，所述确定当前样本词条对之前，还包括：

4.根据权利要求2所述的方法，其特征在于，将所述第一样本特征输入所述语义相关性分档网络，得到所述当前样本词条对的当前分档结果和当前识别结果，至少包括以下之一：

5.根据权利要求1所述的方法，其特征在于，在利用目标样本词条对集合训练特征提取网络，得到满足第一收敛条件的目标特征提取网络之前，还包括：

6.根据权利要求5所述的方法，其特征在于，所述获取所述第一搜索词条和所述第二搜索词条之间的语义相关性的标注分档结果包括：

7.根据权利要求5所述的方法，其特征在于，将携带有所述标注分档结果的所述第一搜索词条和所述第二搜索词条，构成所述目标样本词条对集合中的所述样本词条对之后，还包括：

8.根据权利要求7所述的方法，其特征在于，所述确定本轮训练中的参考语义识别模型包括以下之一：

9.根据权利要求1至8中任一项所述的方法，其特征在于，在利用所述目标特征提取网络、所述全连接层和所述分档子网络构建目标语义识别模型之后，还包括：

10.一种搜索词条的确定方法，其特征在于，包括：

11.一种语义识别模型的训练装置，其特征在于，包括：

12.一种计算机可读的存储介质，其特征在于，所述计算机可读的存储介质包括存储的程序，其中，所述程序运行时执行所述权利要求1至10任一项中所述的方法。

13.一种计算机程序产品，包括计算机程序/指令，其特征在于，该计算机程序/指令被处理器执行时实现权利要求1至10中任一项所述方法的步骤。

14.一种电子设备，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至10任一项中所述的方法。

技术总结
本公开提供了一种语义识别模型的训练方法和装置、存储介质及电子设备。其中，该方法包括：利用目标样本词条对集合训练特征提取网络，得到满足第一收敛条件的目标特征提取网络；对目标特征提取网络和语义相关性分档网络进行联合训练，语义相关性分档网络中包括：全连接层及复合任务识别网络，复合任务识别网络中至少包括分档子网络，以及用于对表达意图进行识别的识别子网络；在联合训练的训练损失达到第二收敛条件的情况下，利用目标特征提取网络、全连接层和分档子网络构建目标语义识别模型，其中，目标语义识别模型用于识别两个搜索词条之间的语义相关性对应的分档。本公开解决了现有识别两个词条之间的语义相关性的准确率低的技术问题。

技术研发人员：康战辉
受保护的技术使用者：腾讯科技（深圳）有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：康战辉
技术所有人：腾讯科技（深圳）有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。