一种自然问句处理方法及装置与流程

文档序号:31210766发布日期:2022-08-20 03:31阅读:68来源:国知局
一种自然问句处理方法及装置与流程

1.本发明涉及语句处理技术领域,具体涉及一种自然问句处理方法及装置。


背景技术:

2.在客户服务,以及学习培训等领域,对问句进行回答处理显得尤为重要。
3.为了进一步提高问句回答处理效率,现有技术通过智能机器人自动识别出问句的语义,并根据语义匹配出与该问句对应的问句回答语句,但是,从问句中识别的语义信息量有限,不能准确的表示出问句所包含的信息内容,使得回答语句不能够准确回答问句所要表达的内容。


技术实现要素:

4.针对现有技术中的问题,本发明实施例提供一种自然问句处理方法及装置,能够至少部分地解决现有技术中存在的问题。
5.一方面,本发明提出一种自然问句处理方法,包括:
6.获取待进行回答处理的自然问句,提取所述自然问句中的实体,并确定所述自然问句的问题分类信息;
7.获取与所述问题分类信息对应的问答模板,并将所述实体添加到所述问答模板中,得到查询语句;
8.通过所述查询语句查询与所述自然问句对应的回答语句,得到所述查询语句的查询结果。
9.其中,所述提取所述自然问句中的实体,包括:
10.基于预设实体提取模型对所述自然问句中的实体进行提取,得到所述自然问句中的实体;
11.其中,所述预设实体提取模型根据训练样本数据训练中文命名实体识别模型得到。
12.其中,所述确定所述自然问句的问题分类信息,包括:
13.基于预设问题分类模型对所述自然问句进行问题分类,得到所述自然问句的问题分类信息;
14.其中,所述预设问题分类模型根据训练样本数据训练用于文本分类的卷积神经网络模型得到。
15.其中,所述问答模板基于图数据库的数据查询语句表示;相应的,所述通过所述查询语句查询与所述自然问句对应的回答语句,包括:
16.通过由所述数据查询语句表示的查询语句查询与所述自然问句对应的回答语句。
17.其中,在得到所述查询语句的查询结果的同时,所述自然问句处理方法还包括:
18.基于图形化展示由知识图谱三元组表示的所述自然问句;
19.其中,所述知识图谱三元组包括:实体在所述自然问句的位置信息、问题分类信息
和实体之间关系信息。
20.其中,所述基于图形化展示由知识图谱三元组表示的所述自然问句,包括:
21.利用力导向图可视化组件展示由知识图谱三元组表示的所述自然问句。
22.其中,所述知识图谱三元组根据模式层、数据层和知识存储层的先后顺序依次构建得到。
23.一方面,本发明提出一种自然问句处理装置,包括:
24.获取单元,用于获取待进行回答处理的自然问句,提取所述自然问句中的实体,并确定所述自然问句的问题分类信息;
25.添加单元,用于获取与所述问题分类信息对应的问答模板,并将所述实体添加到所述问答模板中,得到查询语句;
26.查询单元,用于通过所述查询语句查询与所述自然问句对应的回答语句,得到所述查询语句的查询结果。
27.再一方面,本发明实施例提供一种电子设备,包括:处理器、存储器和总线,其中,
28.所述处理器和所述存储器通过所述总线完成相互间的通信;
29.所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:
30.获取待进行回答处理的自然问句,提取所述自然问句中的实体,并确定所述自然问句的问题分类信息;
31.获取与所述问题分类信息对应的问答模板,并将所述实体添加到所述问答模板中,得到查询语句;
32.通过所述查询语句查询与所述自然问句对应的回答语句,得到所述查询语句的查询结果。
33.本发明实施例提供一种非暂态计算机可读存储介质,包括:
34.所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如下方法:
35.获取待进行回答处理的自然问句,提取所述自然问句中的实体,并确定所述自然问句的问题分类信息;
36.获取与所述问题分类信息对应的问答模板,并将所述实体添加到所述问答模板中,得到查询语句;
37.通过所述查询语句查询与所述自然问句对应的回答语句,得到所述查询语句的查询结果。
38.本发明实施例提供的自然问句处理方法及装置,获取待进行回答处理的自然问句,提取所述自然问句中的实体,并确定所述自然问句的问题分类信息;获取与所述问题分类信息对应的问答模板,并将所述实体添加到所述问答模板中,得到查询语句;通过所述查询语句查询与所述自然问句对应的回答语句,得到所述查询语句的查询结果,能够准确回答自然问句所要表达的内容。
附图说明
39.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
40.图1是本发明一实施例提供的自然问句处理方法的流程示意图。
41.图2是本发明另一实施例提供的自然问句处理方法的流程示意图。
42.图3是本发明实施例提供的自然问句处理方法模块化的结构示意图。
43.图4是本发明一实施例提供的自然问句处理装置的结构示意图。
44.图5为本发明实施例提供的电子设备实体结构示意图。
具体实施方式
45.为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互任意组合。
46.图1是本发明一实施例提供的自然问句处理方法的流程示意图,如图1所示,本发明实施例提供的自然问句处理方法,包括:
47.步骤s1:获取待进行回答处理的自然问句,提取所述自然问句中的实体,并确定所述自然问句的问题分类信息。
48.步骤s2:获取与所述问题分类信息对应的问答模板,并将所述实体添加到所述问答模板中,得到查询语句。
49.步骤s3:通过所述查询语句查询与所述自然问句对应的回答语句,得到所述查询语句的查询结果。
50.在上述步骤s1中,装置获取待进行回答处理的自然问句,提取所述自然问句中的实体,并确定所述自然问句的问题分类信息。装置可以是执行该方法的计算机设备,例如可以包括服务器。需要说明是,本发明实施例涉及回答处理数据的获取及分析是经用户授权的。如图2所示,对提取所述自然问句中的实体,以及确定所述自然问句的问题分类信息的先后顺序不做具体限定。
51.以自然语句“数字证书的功能是什么,由哪几块构成?”为例进行说明如下:
52.提取该问句中的实体,实体可以理解为问句中的关键字,例如为“数字证书”,确定该问句中的问题分类信息,例如为“%e有%e1、%e2

功能”,“%e包括%e1、%e2
…”

53.本发明实施例的问题分类信息可以通过六个分类标签表示,每类分类标签有各自对应的问答模板,如表1所示:
54.表1
55.[0056][0057]
所述提取所述自然问句中的实体,包括:
[0058]
基于预设实体提取模型对所述自然问句中的实体进行提取,得到所述自然问句中的实体;可以将自然问句输入至预设实体提取模型,将预设实体提取模型的输出结果作为自然问句中的实体。
[0059]
其中,所述预设实体提取模型根据训练样本数据训练中文命名实体识别模型得到。
[0060]
中文命名实体识别模型可以具体为lattice-lstm。
[0061]
lattice-lstm具有如下优点:
[0062]
可以同时利用中文字符和单词的信息,通过增加word-base cell和控制门,对字
composition-2”和“e-composition-2”,由于该模型直接对三元组进行建模,且加快抽取速度并保证准确率。
[0081]
其中分类关系分别对应的中文含义如表2所示:
[0082]
表2
[0083]
分类关系中文含义alias别称character特性category类别apply应用composition组成function应用
[0084]
使用(begin,inside,other,end和single)中的首个字母,即b、i、o、e和s分别代表实体在自然问句的位置信息。
[0085]
1或2表示在三元组中的实体之间关系信息,参照上述举例,即表示销售产品中的1与股票产品销售、基金产品销售、定期存款,活期存款中的2之间的实体之间关系。
[0086]
所述基于图形化展示由知识图谱三元组表示的所述自然问句,包括:
[0087]
利用力导向图可视化组件展示由知识图谱三元组表示的所述自然问句。可以利用echarts绘制力导向图可视化组件。echarts是一款基于javascript的数据可视化图表库,提供直观,生动,可交互,可个性化定制的数据可视化图表。
[0088]
所述知识图谱三元组根据模式层、数据层和知识存储层的先后顺序依次构建得到,具体说明如下:
[0089]
1)模式层:由于目前运用于序列标记任务中的神经网络的知识三元组抽取模型,被广泛应用于序列标记任务中,因此本发明实施例实现了一个cnn-cnn-lstm数据标注方法和网络结构模型,来提取知识三元组。以下为数据标注实现方式:
[0090]
利用顶向下的方法从数据集中预定义出6种关系分类,即表2。分类标签被通过系统的需求一共分为48种,本发明实施例,示例仅列出与composition相关的几种,例如包括:
[0091]
b-composition-1、b-composition-2、i-composition-1、i-composition-2、e-composition-1、e-composition-2、s-composition-1和s-composition-2。
[0092]
标注方式可参照上述“销售产品包括股票产品销售、基金产品销售、定期存款,活期存款”示例。
[0093]
对cnn-cnn-lstm简要说明如下:
[0094]
char-level encoder:一共有三层网络,利用cnn神经网络提取句子字级特征,如句子中的第i个词中的字向量为每层网络之间用relu函数激活。结合前一层网络的输出和字符级向量的输入作为模型最后一层cnn残差网络的输入。使用cnn进行编码,虽然效果略逊于lstm,但优点在于降低了计算成本。在两层cnn之间应用relu和dropout,在最后添加max-pooling层,得到character特征
[0095]
word_level encoder:得到序列中每个词的词向量后,首先经过预训练的模
型对词向量进行初始化。此处encoder的输入是由字的向量与词的向量进行拼接操作得到。使用word-drop的处理方法来处理字典中不存在的词。同样利用两层的cnn作为encoder,并且每个词的特征由公式所示:
[0096][0097]
lstm decoder:在解码层,我们使用lstm来处理序列标签。当w
t
所属标签为tag时,decoder的输入是来自encoder的标签向量t
t-1
,cell状态c
t-1
,向量h
t-1
和上一个预测出的标签向量t
t-1

[0098]
通过上述lstm输出的标签预测向量t
t
,softmax层就能够计算出的实体标签概率
[0099]
lstm具有处理长序列依赖问题的特性,所以该模型能够获得tag之间的关联信息。
[0100]
2)数据层:依照构建完成的训练模型,对自然语句语料库进行实体关系三元组抽取标注,包含实体位置信息以及实体之间的关系信息,将知识三元组抽取问题转化为标记问题。由于该模型直接对三元组进行建模,且加快抽取速度并保证准确率。
[0101]
3)知识存储层:通过使用py2neo构建包实现对知识库三元组数据的批量写入,采用neo4j图数据库完成知识图谱数据的存储。
[0102]
本发明实施例提供的自然问句处理方法,获取待进行回答处理的自然问句,提取所述自然问句中的实体,并确定所述自然问句的问题分类信息;获取与所述问题分类信息对应的问答模板,并将所述实体添加到所述问答模板中,得到查询语句;通过所述查询语句查询与所述自然问句对应的回答语句,得到所述查询语句的查询结果,能够准确回答自然问句所要表达的内容。
[0103]
进一步的,所述提取所述自然问句中的实体,包括:
[0104]
基于预设实体提取模型对所述自然问句中的实体进行提取,得到所述自然问句中的实体;可参照上述说明,不再赘述。
[0105]
其中,所述预设实体提取模型根据训练样本数据训练中文命名实体识别模型得到。可参照上述说明,不再赘述。
[0106]
本发明实施例提供的自然问句处理方法,通过准确提取自然问句中的实体,进一步能够准确回答自然问句所要表达的内容。
[0107]
进一步的,所述确定所述自然问句的问题分类信息,包括:
[0108]
基于预设问题分类模型对所述自然问句进行问题分类,得到所述自然问句的问题分类信息;可参照上述说明,不再赘述。
[0109]
其中,所述预设问题分类模型根据训练样本数据训练用于文本分类的卷积神经网络模型得到。可参照上述说明,不再赘述。
[0110]
本发明实施例提供的自然问句处理方法,通过准确确定自然问句的问题分类信息,进一步能够准确回答自然问句所要表达的内容。
[0111]
进一步的,所述问答模板基于图数据库的数据查询语句表示;相应的,所述通过所述查询语句查询与所述自然问句对应的回答语句,包括:
[0112]
通过由所述数据查询语句表示的查询语句查询与所述自然问句对应的回答语句。可参照上述说明,不再赘述。
[0113]
本发明实施例提供的自然问句处理方法,通过由数据查询语句表示的查询语句查询与自然问句对应的回答语句,能够高效获取回答语句。
[0114]
进一步的,在得到所述查询语句的查询结果的同时,所述自然问句处理方法还包括:
[0115]
基于图形化展示由知识图谱三元组表示的所述自然问句;可参照上述说明,不再赘述。
[0116]
其中,所述知识图谱三元组包括:实体在所述自然问句的位置信息、问题分类信息和实体之间关系信息。可参照上述说明,不再赘述。
[0117]
本发明实施例提供的自然问句处理方法,基于图形化展示由知识图谱三元组表示的自然问句,有助于直观向用户展示自然问句的细节信息内容。
[0118]
进一步的,所述基于图形化展示由知识图谱三元组表示的所述自然问句,包括:
[0119]
利用力导向图可视化组件展示由知识图谱三元组表示的所述自然问句。可参照上述说明,不再赘述。
[0120]
本发明实施例提供的自然问句处理方法,进一步提高展示由知识图谱三元组表示的自然问句的展示效果。
[0121]
进一步的,所述知识图谱三元组根据模式层、数据层和知识存储层的先后顺序依次构建得到。
[0122]
本发明实施例提供的自然问句处理方法,能够准确和高效的获取知识图谱三元组。可参照上述说明,不再赘述。
[0123]
如图3所示,进一步地,可以基于模块化实现本发明实施例的方法,具体包括:
[0124]
知识库管理模块:用于知识图谱存储、知识抽取和知识三元组管理。
[0125]
实体可视化展示模块:用于实体检索和力导向图可视化。
[0126]
自动问答管理模块:用户自然问句实体抽取、问句类别识别、答案模板匹配、查询语句生成和规则答案反馈。
[0127]
需要说明的是,本发明实施例提供的自然问句处理方法可用于金融领域,也可用于除金融领域之外的任意技术领域,本发明实施例对自然问句处理方法的应用领域不做限定。
[0128]
图4是本发明一实施例提供的自然问句处理装置的结构示意图,如图4所示,本发明实施例提供的自然问句处理装置,包括获取单元401、添加单元402和查询单元403,其中:
[0129]
获取单元401用于获取待进行回答处理的自然问句,提取所述自然问句中的实体,并确定所述自然问句的问题分类信息;添加单元402用于获取与所述问题分类信息对应的问答模板,并将所述实体添加到所述问答模板中,得到查询语句;查询单元403用于通过所述查询语句查询与所述自然问句对应的回答语句,得到所述查询语句的查询结果。
[0130]
具体的,装置中的获取单元401用于获取待进行回答处理的自然问句,提取所述自然问句中的实体,并确定所述自然问句的问题分类信息;添加单元402用于获取与所述问题分类信息对应的问答模板,并将所述实体添加到所述问答模板中,得到查询语句;查询单元403用于通过所述查询语句查询与所述自然问句对应的回答语句,得到所述查询语句的查
询结果。
[0131]
本发明实施例提供的自然问句处理装置,获取待进行回答处理的自然问句,提取所述自然问句中的实体,并确定所述自然问句的问题分类信息;获取与所述问题分类信息对应的问答模板,并将所述实体添加到所述问答模板中,得到查询语句;通过所述查询语句查询与所述自然问句对应的回答语句,得到所述查询语句的查询结果,能够准确回答自然问句所要表达的内容。
[0132]
进一步的,所述获取单元401具体用于:
[0133]
基于预设实体提取模型对所述自然问句中的实体进行提取,得到所述自然问句中的实体;
[0134]
其中,所述预设实体提取模型根据训练样本数据训练中文命名实体识别模型得到。
[0135]
本发明实施例提供的自然问句处理装置,通过准确提取自然问句中的实体,进一步能够准确回答自然问句所要表达的内容。
[0136]
进一步的,所述获取单元401具体用于:
[0137]
基于预设问题分类模型对所述自然问句进行问题分类,得到所述自然问句的问题分类信息;
[0138]
其中,所述预设问题分类模型根据训练样本数据训练用于文本分类的卷积神经网络模型得到。
[0139]
本发明实施例提供的自然问句处理装置,通过准确确定自然问句的问题分类信息,进一步能够准确回答自然问句所要表达的内容。
[0140]
进一步的,所述问答模板基于图数据库的数据查询语句表示;相应的,所述查询单元403具体用于:
[0141]
通过由所述数据查询语句表示的查询语句查询与所述自然问句对应的回答语句。
[0142]
本发明实施例提供的自然问句处理装置,通过由数据查询语句表示的查询语句查询与自然问句对应的回答语句,能够高效获取回答语句。
[0143]
进一步的,在得到所述查询语句的查询结果的同时,所述自然问句处理装置还用于:
[0144]
基于图形化展示由知识图谱三元组表示的所述自然问句;
[0145]
其中,所述知识图谱三元组包括:实体在所述自然问句的位置信息、问题分类信息和实体之间关系信息。
[0146]
本发明实施例提供的自然问句处理装置,基于图形化展示由知识图谱三元组表示的自然问句,有助于直观向用户展示自然问句的细节信息内容。
[0147]
进一步的,所述自然问句处理装置还用于:
[0148]
利用力导向图可视化组件展示由知识图谱三元组表示的所述自然问句。
[0149]
本发明实施例提供的自然问句处理装置,进一步提高展示由知识图谱三元组表示的自然问句的展示效果。
[0150]
进一步的,所述知识图谱三元组根据模式层、数据层和知识存储层的先后顺序依次构建得到。
[0151]
本发明实施例提供的自然问句处理装置,能够准确和高效的获取知识图谱三元
组。
[0152]
本发明实施例提供自然问句处理装置的实施例具体可以用于执行上述各方法实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。
[0153]
图5为本发明实施例提供的电子设备实体结构示意图,如图5所示,所述电子设备包括:处理器(processor)501、存储器(memory)502和总线503;
[0154]
其中,所述处理器501、存储器502通过总线503完成相互间的通信;
[0155]
所述处理器501用于调用所述存储器502中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:
[0156]
获取待进行回答处理的自然问句,提取所述自然问句中的实体,并确定所述自然问句的问题分类信息;
[0157]
获取与所述问题分类信息对应的问答模板,并将所述实体添加到所述问答模板中,得到查询语句;
[0158]
通过所述查询语句查询与所述自然问句对应的回答语句,得到所述查询语句的查询结果。
[0159]
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:
[0160]
获取待进行回答处理的自然问句,提取所述自然问句中的实体,并确定所述自然问句的问题分类信息;
[0161]
获取与所述问题分类信息对应的问答模板,并将所述实体添加到所述问答模板中,得到查询语句;
[0162]
通过所述查询语句查询与所述自然问句对应的回答语句,得到所述查询语句的查询结果。
[0163]
本实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,所述计算机程序使所述计算机执行上述各方法实施例所提供的方法,例如包括:
[0164]
获取待进行回答处理的自然问句,提取所述自然问句中的实体,并确定所述自然问句的问题分类信息;
[0165]
获取与所述问题分类信息对应的问答模板,并将所述实体添加到所述问答模板中,得到查询语句;
[0166]
通过所述查询语句查询与所述自然问句对应的回答语句,得到所述查询语句的查询结果。
[0167]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0168]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序
指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0169]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0170]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0171]
在本说明书的描述中,参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0172]
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1