本发明涉及计算机,尤其涉及一种多意图识别方法及装置。
背景技术:
1、基于知识图谱的问答(knowledge base question answering,kbqa),是一种给定自然语言问题,通过对问题进行语义理解和解析,进而利用知识库进行查询、推理得出答案的问答服务。其中,对于用户的询问意图,尤其是多个意图的识别是kbqa中需要解决的关键问题。
2、目前,多个意图的识别方式主要有两种,一种是基于语法语义分析与句法依存分析的规则匹配法,该方法需要根据知识图谱的数据结构预先设置大量的规则,对于规则范围内的询问意图具有良好的识别效果。但由于知识图谱用户之间的提问水平的差别,导致该方法的拓展性较弱,尤其是对于规则之外的问句,往往不能准确识别询问意图。此外,随着知识图谱本体数据与关系数据的改变,需要重新修改规则,造成较大的维护与更新难度。
3、另一种是基于深度学习的方法,该类方法主要有两种思路,一种是根据句法依存分析或断句模型切分问句,将多意图识别问题转化为若干个单意图识别,但这样做同样受限于知识图谱用户的提问水平;另一种思路是将多意图问题转化为文本多标签多分类问题,为充分提取用户问句的特征,该方法则需要大量的有标签的问答语料作为数据支撑,对于一个新建的知识图谱问答应用,这一点往往无法满足。
技术实现思路
1、本发明提供一种多意图识别方法及装置,用以解决现有技术中多意图识别方法中,对于不同领域的问答语料不易获取,识别的拓展性差的缺陷,实现不同领域的问答语句的精确多意图识别。
2、本发明提供一种多意图识别方法,包括:
3、获取待识别问答语料;
4、将所述待识别语料输入多意图识别模型,得到所述多意图识别模型输出的识别结果;
5、其中,所述多意图识别模型是基于样本问答语料及其对应的多意图标签进行训练得到的,所述样本问答语料是基于目标领域知识图谱的本体信息确定的。
6、根据本发明提供的一种多意图识别方法,确定所述样本问答语料,包括:
7、基于所述目标领域知识图谱的本体信息,确定查询意图集合;
8、基于所述查询意图集合,确定所述样本问答语料。
9、根据本发明提供的一种多意图识别方法,所述基于所述目标领域知识图谱的本体信息,确定查询意图集合,包括:
10、基于所述目标领域知识图谱的本体信息,得到本体的属性以及本体间的关系;
11、将所述本体的属性以及所述本体间的关系作为查询意图,得到所述查询意图集合,其中,所述查询意图集合包括多种查询意图组合,每种查询意图组合至少包括一个查询意图。
12、根据本发明提供的一种多意图识别方法,所述基于所述查询意图集合,确定所述样本问答语料,包括:
13、基于所述多种查询意图组合,生成多个初始问答语料;
14、通过生成相似文本对所述多个初始问答语料进行扩充,得到多个样本问答语料。
15、根据本发明提供的一种多意图识别方法,确定所述样本问答语料对应的多意图标签,包括:
16、基于所述查询意图集合中查询意图的个数,确定所述多意图标签的位数;
17、基于每个样本问答语料对应的查询意图组合进行多标签编码,得到所述每个样本问答语料对应的多意图标签。
18、根据本发明提供的一种多意图识别方法,所述多意图识别模型的训练过程包括:
19、获取所述样本问答语料及其对应的多意图标签,并提取所述样本问答语料的语料特征;
20、将所述样本问答语料的语料特征输入至初始多意图识别模型,得到所述样本问答语料对应的预测多意图标签;
21、根据所述多意图标签和所述预测多意图标签,更新所述初始多意图识别模型的模型参数,以训练得到所述多意图识别模型。
22、本发明还提供一种多意图识别装置,包括:
23、输入模块,用于获取待识别问答语料;
24、输出模块,用于将所述待识别语料输入多意图识别模型,得到所述多意图识别模型输出的识别结果;
25、其中,所述多意图识别模型是基于样本问答语料及其对应的多意图标签进行训练得到的,所述样本问答语料是基于目标领域知识图谱的本体信息确定的。
26、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述多意图识别方法。
27、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述多意图识别方法。
28、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述多意图识别方法。
29、本发明提供的多意图识别方法及装置,通过多意图识别模型可以对任意目标领域内的问答语料,实现多意图识别。对于一个新建的知识图谱问答应用,往往是没有问答语料的,此时需要构建大量的带标签的问答语料作为数据支撑,然后才能进行意图识别。由于本发明多意图识别模型在训练时,只需要通过任意目标领域的已有知识图谱构建样本问答语料,无需受限于知识图谱用户的提问水平和数据量,在此基础上训练深度学习模型,训练好的多意图识别模型可以准确地识别出用户问答语料中的多个问答意图。
1.一种多意图识别方法,其特征在于,包括:
2.根据权利要求1所述的多意图识别方法,其特征在于,确定所述样本问答语料,包括:
3.根据权利要求2所述的多意图识别方法,其特征在于,所述基于所述目标领域知识图谱的本体信息,确定查询意图集合,包括:
4.根据权利要求2所述的多意图识别方法,其特征在于,所述基于所述查询意图集合,确定所述样本问答语料,包括:
5.根据权利要求4所述的多意图识别方法,其特征在于,确定所述样本问答语料对应的多意图标签,包括:
6.根据权利要求1至5任一所述的多意图识别方法,其特征在于,所述多意图识别模型的训练过程包括:
7.一种多意图识别装置,其特征在于,包括:
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述多意图识别方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述多意图识别方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述多意图识别方法。