本申请实施例涉及人工智能,特别涉及一种意图识别方法、装置、设备及存储介质。
背景技术:
1、意图识别是指对于查询文本的意图(如购买、检索等)进行识别的过程,随着人工智能技术的发展,人工智能可有效应用于意图识别。
2、在相关技术中,通过构建一个分类模型(如二分类模型、多分类模型等),并通过大量的有标签数据(即标注有意图识别结果的样本文本)对该分类模型进行有监督训练,从而得到能够对查询文本的意图进行识别的分类模型。
3、然而,相关技术需要通过大规模的有标签数据对分类模型进行训练,耗时耗力,训练效率低下。
技术实现思路
1、本申请实施例提供了一种意图识别方法、装置、设备及存储介质,能够在提高模型的意图识别准确性的同时,降低模型的训练成本。所述技术方案可以包括如下内容。
2、根据本申请实施例的一个方面,提供了一种意图识别方法,所述方法包括:
3、采用带标签数据对n个标准意图识别模型进行训练,得到n个训练后的标准意图识别模型,所述带标签数据是指标注有意图识别结果的样本文本,n为大于1的整数;
4、采用所述n个训练后的标准意图识别模型对无标签数据分别进行处理,得到所述无标签数据的n个初步意图识别结果,所述无标签数据是指未标注有意图识别结果的样本文本;
5、根据所述无标签数据的n个初步意图识别结果,确定所述无标签数据的最终意图识别结果;
6、基于所述无标签数据以及所述无标签数据的最终意图识别结果,对轻量意图识别模型进行训练,得到训练后的轻量意图识别模型,所述训练后的轻量意图识别模型用于对查询文本进行处理得到所述查询文本的意图识别结果。
7、根据本申请实施例的一个方面,提供了一种意图识别装置,所述装置包括:
8、标准模型训练模块,用于采用带标签数据对n个标准意图识别模型进行训练,得到n个训练后的标准意图识别模型,所述带标签数据是指标注有意图识别结果的样本文本,n为大于1的整数;
9、初步结果获取模块,用于采用所述n个训练后的标准意图识别模型对无标签数据分别进行处理,得到所述无标签数据的n个初步意图识别结果,所述无标签数据是指未标注有意图识别结果的样本文本;
10、最终结果获取模块,用于根据所述无标签数据的n个初步意图识别结果,确定所述无标签数据的最终意图识别结果;
11、轻量模型训练模块,用于基于所述无标签数据以及所述无标签数据的最终意图识别结果,对轻量意图识别模型进行训练,得到训练后的轻量意图识别模型,所述训练后的轻量意图识别模型用于对查询文本进行处理得到所述查询文本的意图识别结果。
12、根据本申请实施例的一个方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现上述意图识别方法。
13、根据本申请实施例的一个方面,提供了一种计算机可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现上述意图识别方法。
14、根据本申请实施例的一个方面,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序,处理器执行该计算机程序,使得该计算机设备执行上述意图识别方法。
15、本申请实施例提供的技术方案可以包括如下有益效果。
16、通过有标签数据对多个标准意图识别模型进行训练,再通过多个训练后的标准意图识别模型,获取无标签数据的最终意图识别结果,最后通过无标签数据和无标签数据的最终意图识别结果,对轻量意图识别模型进行训练,使得轻量意图识别模型能够从多个训练后的标准意图识别模型中学习到先验知识,从而提高了轻量意图识别模型的意图识别准确性。
17、另外,由于可以借助无标签数据对轻量意图识别模型进行训练,而不受限于有标签数据,使得轻量意图识别模型的训练成本更低,以及训练后的轻量意图识别模型的泛化能力更强。同时,使得本申请实施例仅需小规模高质量样本对多个标准意图识别模型进行训练即可,从而进一步降低了模型的训练成本。
1.一种意图识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述初步意图识别结果用于指示所述无标签数据是否属于目标意图;
3.根据权利要求2所述的方法,其特征在于,所述根据所述无标签数据的n个初步意图识别结果分别对应的分值的平均值,确定所述无标签数据的最终意图识别结果,包括:
4.根据权利要求1所述的方法,其特征在于,所述初步意图识别结果用于指示所述无标签数据是否属于目标意图;
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,所述基于所述无标签数据以及所述无标签数据的最终意图识别结果,对轻量意图识别模型进行训练,得到训练后的轻量意图识别模型之后,还包括:
7.根据权利要求1所述的方法,其特征在于,所述n个标准意图识别模型中包括第一标准意图识别模型,所述第一标准意图识别模型用于执行分类任务;
8.根据权利要求7所述的方法,其特征在于,
9.根据权利要求1所述的方法,其特征在于,所述n个标准意图识别模型中包括第二标准意图识别模型,所述第二标准意图识别模型用于执行回归任务;
10.根据权利要求1所述的方法,其特征在于,所述基于所述无标签数据以及所述无标签数据的最终意图识别结果,对轻量意图识别模型进行训练,得到训练后的轻量意图识别模型,包括:
11.根据权利要求10所述的方法,其特征在于,所述获取所述无标签数据的向量表示,包括:
12.根据权利要求1所述的方法,其特征在于,所述采用带标签数据对n个标准意图识别模型进行训练,得到n个训练后的标准意图识别模型之前,还包括:
13.一种意图识别装置,其特征在于,所述装置包括:
14.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至12任一项所述的意图识别方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至12任一项所述的意图识别方法。