意图识别方法、装置、设备及存储介质与流程

文档序号:34238292发布日期:2023-05-24 23:47阅读:40来源:国知局
意图识别方法、装置、设备及存储介质与流程

本技术涉及计算机,尤其涉及一种意图识别方法、装置、设备及存储介质。


背景技术:

1、随着计算机、互联网技术的快速发展,越来越多的智能化交互方式已逐渐深入日常生活。例如在智能客服场景中,可以根据用户输入的语句识别用户的意图,并为用户提供合适的回应。特别是用户输入的语句包含多意图的情况下,需要准确识别出用户的多个意图,进而针对每一个意图提供合适的回应。

2、目前,针对多意图识别的情况,在对用于多意图识别的意图识别模型进行训练的时候,需要对样本语句进行人工标注,将样本语句包含的多个意图转换为多标签分类,来获得训练集;基于训练集,对意图识别模型进行训练来得到训练好的模型,进而将训练好的意图识别模型用于多意图识别。通过上述方式进行多意图识别的效率不高。


技术实现思路

1、本技术提供一种意图识别方法、装置、设备及存储介质,以解决通过目前方式进行多意图识别的效率不高的问题。

2、第一方面,本技术提供一种意图识别方法,包括:

3、获取待识别语句;

4、将待识别语句输入意图识别模型,得到待识别语句对应的语句特征向量,意图识别模型是基于意图知识图谱获得的训练样本对进行训练获得的;

5、确定意图向量空间集中与语句特征向量的相似度小于相似度阈值的目标意图向量,意图向量空间集是根据意图识别模型的输出获得的;

6、根据目标意图向量,得到待识别语句对应的目标意图。

7、可选的,训练样本对是通过以下方式获得的:将意图知识图谱中同一意图类别对应的意图路径进行两两组合获得正样本对,以及将意图知识图谱中不同意图类别对应的意图路径进行两两组合获得负样本对;将正样本对和负样本对确定为训练样本对。

8、可选的,意图向量空间集是根据意图识别模型的输出获得的,包括:基于意图识别模型输出的意图路径对应的特征向量,对同一意图类别下的意图路径对应的特征向量进行平均处理,获得平均特征向量;根据平均特征向量,得到意图向量空间集,意图向量空间集用于表征将意图类别的向量表示映射到向量空间得到的向量集合。

9、可选的,确定意图向量空间集中与语句特征向量的相似度小于相似度阈值的目标意图向量,包括:获取语句特征向量与意图向量空间集中每个意图向量的相似度;将意图向量空间集中与语句特征向量的相似度小于相似度阈值的预设数量的意图向量确定为目标意图向量。

10、可选的,将待识别语句输入意图识别模型,包括:对待识别语句进行分词处理,获得分词处理后的语句;对分词处理后的语句进行编码处理,得到编码后的语句;将编码后的语句输入意图识别模型。

11、第二方面,本技术提供一种意图识别模型的训练方法,包括:

12、获取多个训练样本对,训练样本对包含正样本对和负样本对,正样本对是将意图知识图谱中同一意图类别对应的意图路径进行两两组合获得的样本对,负样本对是将意图知识图谱中不同意图类别对应的意图路径进行两两组合获得的样本对,意图知识图谱包含多个意图类别以及每个意图类别对应的意图路径;

13、将多个训练样本对输入初始意图识别模型,得到特征向量集,特征向量集包括每个意图路径对应的特征向量;

14、获取特征向量集中正样本对的两个意图路径分别对应的特征向量的第一相似度,以及负样本对的两个意图路径分别对应的特征向量的第二相似度;

15、基于第一相似度和第二相似度,迭代训练初始意图识别模型,得到意图识别模型。

16、可选的,意图知识图谱是通过以下方式获得的:获取语料集;基于语料集,采用预设意图抽取方法抽取语料集中每个语料对应的意图类别以及节点信息;基于意图类别以及节点信息,获得每个语料对应的意图路径;基于意图路径,构建意图知识图谱,意图知识图谱包括节点和边,节点包括意图类别,边为意图类别对应的意图路径。

17、可选的,得到意图识别模型之后,该意图识别模型的训练方法还包括:基于意图识别模型输出的意图路径对应的特征向量,对同一意图类别下的意图路径对应的特征向量进行平均处理,获得平均特征向量;根据平均特征向量,得到意图向量空间集。

18、第三方面,本技术提供一种意图识别装置,包括:

19、第一获取模块,用于获取待识别语句;

20、处理模块,用于将待识别语句输入意图识别模型,得到待识别语句对应的语句特征向量,意图识别模型是基于意图知识图谱获得的训练样本对进行训练获得的;

21、确定模块,用于确定意图向量空间集中与语句特征向量的相似度小于相似度阈值的目标意图向量,意图向量空间集是根据意图识别模型的输出获得的;

22、得到模块,用于根据目标意图向量,得到待识别语句对应的目标意图。

23、可选的,该意图识别装置还包括第二获取模块,用于通过以下方式获得训练样本对:将意图知识图谱中同一意图类别对应的意图路径进行两两组合获得正样本对,以及将意图知识图谱中不同意图类别对应的意图路径进行两两组合获得负样本对;将正样本对和负样本对确定为训练样本对。

24、可选的,该意图识别装置还包括第三获取模块,用于:基于意图识别模型输出的意图路径对应的特征向量,对同一意图类别下的意图路径对应的特征向量进行平均处理,获得平均特征向量;根据平均特征向量,得到意图向量空间集,意图向量空间集用于表征将意图类别的向量表示映射到向量空间得到的向量集合。

25、可选的,确定模块具体用于:获取语句特征向量与意图向量空间集中每个意图向量的相似度;将意图向量空间集中与语句特征向量的相似度小于相似度阈值的预设数量的意图向量确定为目标意图向量。

26、可选的,处理模块具体用于:对待识别语句进行分词处理,获得分词处理后的语句;对分词处理后的语句进行编码处理,得到编码后的语句;将编码后的语句输入意图识别模型。

27、第四方面,本技术提供一种意图识别模型的训练装置,包括:

28、第一获取模块,用于获取多个训练样本对,训练样本对包含正样本对和负样本对,正样本对是将意图知识图谱中同一意图类别对应的意图路径进行两两组合获得的样本对,负样本对是将意图知识图谱中不同意图类别对应的意图路径进行两两组合获得的样本对,意图知识图谱包含多个意图类别以及每个意图类别对应的意图路径;

29、处理模块,用于将多个训练样本对输入初始意图识别模型,得到特征向量集,特征向量集包括每个意图路径对应的特征向量;

30、第二获取模块,用于获取特征向量集中正样本对的两个意图路径分别对应的特征向量的第一相似度,以及负样本对的两个意图路径分别对应的特征向量的第二相似度;

31、训练模块,用于基于第一相似度和第二相似度,迭代训练初始意图识别模型,得到意图识别模型。

32、可选的,该意图识别模型的训练装置还包括第三获取模块,用于通过以下方式获得意图知识图谱:获取语料集;基于语料集,采用预设意图抽取方法抽取语料集中每个语料对应的意图类别以及节点信息;基于意图类别以及节点信息,获得每个语料对应的意图路径;基于意图路径,构建意图知识图谱,意图知识图谱包括节点和边,节点包括意图类别,边为意图类别对应的意图路径。

33、可选的,处理模块还用于:得到意图识别模型之后,基于意图识别模型输出的意图路径对应的特征向量,对同一意图类别下的意图路径对应的特征向量进行平均处理,获得平均特征向量;根据平均特征向量,得到意图向量空间集。

34、第五方面,本技术提供一种电子设备,包括:处理器,以及与处理器通信连接的存储器;

35、存储器存储计算机执行指令;

36、处理器执行存储器存储的计算机执行指令,以实现如本技术第一方面所述的意图识别方法。

37、第六方面,本技术提供一种电子设备,包括:处理器,以及与处理器通信连接的存储器;

38、存储器存储计算机执行指令;

39、处理器执行存储器存储的计算机执行指令,以实现如本技术第二方面所述的意图识别模型的训练方法。

40、第七方面,本技术提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序指令,计算机程序指令被处理器执行时,实现如本技术第一方面所述的意图识别方法。

41、第八方面,本技术提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序指令,计算机程序指令被处理器执行时,实现如本技术第二方面所述的意图识别模型的训练方法。

42、第九方面,本技术提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现如本技术第一方面所述的意图识别方法。

43、第十方面,本技术提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现如本技术第二方面所述的意图识别模型的训练方法。

44、本技术提供的意图识别方法、装置、设备及存储介质,通过将待识别语句输入意图识别模型,得到待识别语句对应的语句特征向量,意图识别模型是基于意图知识图谱获得的训练样本对进行训练获得的,而不需要通过人工标注的方式获得训练集,能够大大降低模型训练的成本,提高模型训练的效率;确定意图向量空间集中与语句特征向量的相似度小于相似度阈值的目标意图向量,意图向量空间集是根据意图识别模型的输出获得的,由于将意图向量空间集中的每个意图向量与语句特征向量进行相似度匹配,而不是将语句特征向量与意图知识图谱中每个意图类别对应的意图路径的特征向量进行匹配,比较次数少,计算简单高效;根据目标意图向量,得到待识别语句对应的目标意图。因此,本技术在保证准确地进行多意图识别的基础上,能够大大降低多意图识别的成本,提高多意图识别的效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1