一种数据查询方法、装置、设备及存储介质与流程

文档序号:37930681发布日期:2024-05-11 00:09阅读:9来源:国知局
一种数据查询方法、装置、设备及存储介质与流程

本技术涉及自然语言处理,尤其涉及一种数据查询方法、装置、设备及存储介质。


背景技术:

1、近些年随着计算机科学技术不断的突破和创新,人工智能越来越多的走进人们的生活,自然语言处理基本上是人工智能的一个分支,它允许计算机程序理解人类的自然语言。自然语言处理无缝地弥合了复杂的人类语言和编码机器之间的通信鸿沟,正确的语义理解帮助机器更好的服务人类。目前对意图的识别方法主要集中在单意图的识别上,但在日常对话场景中,常出现一句话多个意图的情况,如:“a区的人均工资是多少,排名怎么样”,意图包括“问指标”意图及“问排名”意图,“附近有没有火锅店,怎么去”包括“查询餐馆”意图和“查询路线”意图。

2、然而,现有的自然语言处理方法在识别多意图时,无法得到较准确的意图类别。


技术实现思路

1、本技术实施例提供了一种数据查询方法、装置、设备及存储装置,通过对意图向量进行特征向量的构建,能够得到准确的意图类别。

2、第一方面,本技术实施例提供了一种数据查询方法,所述方法包括:

3、将待处理文本输入语义理解模型的联合信息提取层,得到所述待处理文本的意图向量和多个槽位信息向量;

4、根据所述各槽位信息向量与所述各槽位信息向量对应的权重系数,对所述意图向量进行特征构建,得到所述待处理文本的意图特征向量,所述权重系数用于表征槽位信息向量对意图类别的影响程度;

5、根据所述意图特征向量对各槽位信息向量进行特征重构,得到各槽位信息向量对应的各联合槽位特征向量;

6、将所述意图特征向量和所述各联合槽位特征向量输入语义理解模型的分类层中,得到所述待处理文本的多个意图类别和多个槽位信息;所述槽位信息用于表征用户意图;

7、基于所述多个意图类别和多个槽位信息,获得所述待处理文本的查询结果。

8、在上述实施例中,通过根据槽位信息向量对意图向量进行特征向量的构建,得到意图特征向量,然后再根据意图特征向量对槽位信息向量进行联合槽位特征向量的构建,充分利用意图信息和槽位信息之间的关联,意图信息与槽位信息的相互特征增强,提高意图识别和槽位抽取准确性。

9、在一种可能的实施方式中,所述根据所述各槽位信息向量与所述各槽位信息向量对应的各权重系数,对所述意图向量进行特征构建,得到所述待处理文本的意图特征向量,包括:

10、基于各槽位信息向量与所述意图向量的相似度,分别确定各槽位信息向量对应的权重系数;

11、分别计算各槽位信息向量与对应的权重系数的乘积,并将各乘积相加的和作为所述待处理文本的意图特征向量。

12、在上述实施例中,基于各槽位信息向量与所述意图向量的相似度,分别确定各槽位信息向量对应的权重系数,即各槽位特征向量看成是对意图有影响且影响度不同的关键词,通过槽位特征向量增强意图类别的识别,进而能够得到较为准确的意图类别。

13、在一种可能的实施方式中,所述根据所述意图特征向量对各槽位信息向量进行特征重构,得到各槽位信息向量对应的各联合槽位特征向量,包括:

14、针对任意一个槽位信息向量,对所述意图特征向量进行加权,将加权后的意图特征向量与所述任意一个槽位信息向量相加,将相加得到的和通过激活函数得到任意一个联合槽位特征向量。

15、在上述实施例中,将意图特征向量与所述任意一个槽位信息向量直接相加作为后续提取槽位信息任务的输入,这样将意图信息添加到提取槽位信息过程中,充分利用了二者的内在联系,加强二者的关联性,进而可以提取到更准确的槽位信息。

16、在一种可能的实施方式中,所述语义理解模型是通过下列方式训练的:

17、获取多个样本文本;

18、选取样本文本输入待训练的语义理解模型,基于所述语义理解模型,识别所述样本文本的样本意图类别,及提取所述样本文本包含的各样本槽位信息;

19、分别基于所述样本意图类别、所述样本槽位信息构建对应的交叉熵损失函数;

20、采用基于构建的各交叉损失函数确定的目标损失函数,对所述语义理解模型进行参数调整。

21、在上述实施例中,对于数据查询方法,需要利用意图类别和槽位信息进行查询,因此在训练的过程中,需要基于构建的意图类别交叉损失函数、样本槽位信息交叉熵损失函数确定目标损失函数。

22、在一种可能的实施方式中,采用如下公式构建所述样本意图类别对应的交叉熵损失函数,包括:

23、其中,lossintent用于表示样本意图类别对应的交叉熵损失函数,i为第i个样本文本,p为样本文本数量,j为第j个意图类别,k为意图类别数量,为第i个样本文本的第j个真实样本意图输出,为第i个样本文本的第j个预测样本意图输出。

24、在上述实施例中,当意图类别包括多个时,其对应的交叉熵函数也需要包括多个真实样本意图输出和多个预测样本意图输出。

25、在一种可能的实施方式中,所述将待处理文本输入语义理解模型的联合信息提取层之前,包括:

26、根据所述待处理文本的句法依存关系,判断所述待处理文本意图类别的数量;

27、根据所述待处理文本意图类别的数量确定所述意图特征向量对应的分类器。

28、在上述实施例中,在根据句法依存关系确定待处理文本意图类别的数量后,根据该数量判断意图特征向量对应的分类器,为单个意图类别和多个意图类别分别设置不同的分类器,可以得到更准确的意图类别。

29、在一种可能的实施方式中,所述根据所述待处理文本的句法依存关系,判断所述待处理文本意图类别的数量,包括:

30、若所述待处理文本的句法依存关系中包括并列关系,则所述待处理文本包括多个意图类别;

31、若所述待处理文本的句法依存关系中不包括并列关系,则所述待处理文本包括单个意图类别。

32、在上述实施例中,确定待处理文本的句法依存关系中包括并列关系时,确定待处理文本包括多个意图类别,首先判断待处理文本是否包括多个意图类别,使得选择分类器类别的流程更加简化。

33、在一种可能的实施方式中,根据所述待处理文本意图类别的数量确定所述意图特征向量对应的分类器,包括:

34、若所述待处理文本意图类别的数量为单个,则确定所述意图特征向量对应的分类器为归一化指数函数softmax;

35、若所述待处理文本意图类别的数量为多个,则确定所述意图特征向量对应的分类器为s型激活函数sigmoid。

36、在上述实施例中,对于识别单个意图类别来说,属于互斥多标签分类问题,对于识别多个意图类别来说,属于不互斥多标签分类问题,因此基于不同的分类问题设置不同的分类器。

37、在一种可能的实施方式中,将所述意图特征向量输入语义理解模型的分类层中,得到所述待处理文本的多个意图类别,包括:

38、针对任意一个意图类别,确定所述任意一个意图类别对应的概率大于预设概率阈值,将所述任意一个意图类别作为所述待处理文本的意图类别。

39、在上述实施例中,得到的多个意图类别中,不一定所有的意图类别都对于后续数据查询的结果有影响,因此,设置一个意图阈值δ,若第i个意图类别满足,第i个意图类别的概率大于意图阈值,则确定该待处理文本中包含第i个意图类别。

40、第二方面,本技术实施例提供了一种数据查询装置,所述装置包括:

41、提取模块,用于将待处理文本输入语义理解模型的联合信息提取层,得到所述待处理文本的意图向量和多个槽位信息向量;

42、第一特征构建模块,用于根据所述各槽位信息向量与所述各槽位信息向量对应的权重系数,对所述意图向量进行特征构建,得到所述待处理文本的意图特征向量,所述权重系数用于表征槽位信息向量对意图类别的影响程度;

43、第二特征构建模块,用于根据所述意图特征向量对各槽位信息向量进行特征重构,得到各槽位信息向量对应的各联合槽位特征向量;

44、分类模块,用于将所述意图特征向量和所述各联合槽位特征向量输入语义理解模型的分类层中,得到所述待处理文本的多个意图类别和多个槽位信息;所述槽位信息用于表征用户意图;

45、查询模块,用于基于所述多个意图类别和多个槽位信息,获得所述待处理文本的查询结果。

46、第三方面,本技术实施例提供了一种电子设备,所述设备包括:

47、至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面的方法。

48、第四方面,本技术实施例提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序用于使计算机执行上述第一方面的方法。

49、本技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本技术而了解。本技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1