文本处理方法及装置与流程

文档序号:25304395发布日期:2021-06-04 14:08阅读:210来源:国知局
文本处理方法及装置与流程

1.本申请涉及文本处理技术领域,特别涉及文本处理方法及装置。


背景技术:

2.随着互联网技术的发展,越来越多的信息开始数据化;而随着信息的数据化转换,用户在进行相关信息检索时也变得更加方便。现有技术在将信息转换为数据形式时,通常是采用表格型数据库存储相应的数据,当用户需要查询相互关联的信息时,需要采用多次查询和记录的方式才能够实现答案的获取;这种方法在面对多跳查询时,只能通过多次调用并记录的方式实现,该过程不仅所需要时间较长,而且跳数过多,单次查询结果量过大,不仅影响查询效率,还需要额外的存储空间记录每跳的查询结果,因此亟需一种有效的方案以解决上述问题。


技术实现要素:

3.有鉴于此,本申请实施例提供了一种文本处理方法,以解决现有技术中存在的技术缺陷。本申请实施例同时提供了一种文本处理装置,一种文本处理系统,一种计算设备,以及一种计算机可读存储介质。
4.根据本申请实施例的第一方面,提供了一种文本处理方法,包括:
5.获取用户针对目标领域提交的问题文本;
6.提取所述问题文本中的实体和关系,并根据所述实体和所述关系创建查询路径;
7.确定所述查询路径对应的路径结构信息,并根据所述实体和所述关系确定所述路径结构信息对应的限定条件;
8.基于所述限定条件和所述查询路径在所述目标领域对应的图数据库中确定所述问题文本对应的答案文本,并向所述用户进行反馈。
9.可选地,所述提取所述问题文本中的实体和关系,包括:
10.按照所述目标领域预中预设的关系集合对所述问题文本进行标准化处理,获得目标问题文本;
11.对所述目标问题文本进行分词处理获得多个词单元,并将所述多个词单元与所述关系集合中包含的基准关系进行匹配;
12.根据匹配结果确定所述关系,并基于所述关系在所述问题文本中提取所述实体。
13.可选地,所述根据所述实体和所述关系创建查询路径,包括:
14.基于所述实体和所述关系构建所述问题文本对应的问题特征;
15.将所述问题特征输入至语义识别模型进行处理,获得所述问题文本对应的意图标签;
16.根据所述意图标签在所述实体中提取目标实体,以及在所述关系中提取目标关系;
17.基于所述目标实体和所述目标关系创建所述查询路径。
18.可选地,所述确定所述查询路径对应的路径结构信息,包括:
19.对所述查询路径进行解析,获得所述查询路径中的路径节点和路径关系;
20.根据所述路径节点和所述路径关系确定所述路径结构信息。
21.可选地,所述根据所述实体和所述关系确定所述路径结构信息对应的限定条件,包括:
22.基于所述路径结构信息在所述实体中提取条件实体,以及在所述关系中提取条件关系;
23.根据所述条件实体或所述条件关系生成所述路径结构信息对应的所述限定条件。
24.可选地,所述根据所述条件实体或所述条件关系生成所述路径结构信息对应的所述限定条件,包括:
25.将所述问题文本输入至文本识别模型进行处理,获得所述问题文本对应的问题类型;
26.在所述问题类型为实体问题类型的情况下,根据所述条件实体生成所述路径结构信息对应的所述限定条件;
27.在所述问题类型为关系问题类型的情况下,根据所述条件关系生成所述路径结构信息对应的所述限定条件。
28.可选地,所述基于所述限定条件和所述查询路径在所述目标领域对应的图数据库中确定所述问题文本对应的答案文本,包括:
29.在所述问题类型为实体问题类型的情况下,根据所述限定条件和所述查询路径在所述图数据库中确定目标实体;
30.根据所述目标实体生成所述问题文本对应的所述答案文本。
31.可选地,所述基于所述限定条件和所述查询路径在所述目标领域对应的图数据库中确定所述问题文本对应的答案文本,包括:
32.在所述问题类型为关系问题类型的情况下,根据所述限定条件和所述查询路径在所述图数据库中确定目标关系;
33.根据所述目标关系生成所述问题文本对应的所述答案文本。
34.可选地,所述基于所述限定条件和所述查询路径在所述目标领域对应的图数据库中确定所述问题文本对应的答案文本,包括:
35.根据所述限定条件对所述查询路径进行更新,获得目标查询路径;
36.基于所述目标查询路径在所述图数据库中确定所述问题文本对应的所述答案文本。
37.可选地,所述图数据库通过如下方式创建:
38.获取所述目标领域对应的目标数据;
39.根据所述目标数据生成三元组,并基于所述三元组构建所述图数据库。
40.根据本申请实施例的第二方面,提供了一种文本处理装置,包括:
41.获取模块,被配置为获取用户针对目标领域提交的问题文本;
42.创建模块,被配置为提取所述问题文本中的实体和关系,并根据所述实体和所述关系创建查询路径;
43.确定模块,被配置为确定所述查询路径对应的路径结构信息,并根据所述实体和
所述关系确定所述路径结构信息对应的限定条件;
44.反馈模块,被配置为基于所述限定条件和所述查询路径在所述目标领域对应的图数据库中确定所述问题文本对应的答案文本,并向所述用户进行反馈。
45.根据本申请实施例的第三方面,提供了一种文本处理系统,包括:
46.客户端和服务端;
47.所述客户端,被配置为接收用户上传的问题文本,以及针对所述问题文本提交的领域选择指令;将所述领域选择指令和所述问题文本发送至所述服务端;
48.所述服务端,被配置为提取所述问题文本中的实体和关系,并根据所述实体和所述关系创建查询路径;确定所述查询路径对应的路径结构信息,并根据所述实体和所述关系确定所述路径结构信息对应的限定条件;确定所述领域选择指令对应的目标领域,并基于所述限定条件和所述查询路径在所述目标领域对应的图数据库中确定所述问题文本对应的答案文本,将所述答案文本发送至所述客户端;
49.所述客户端,还被配置为根据所述答案文本创建所述问题文本对应的反馈界面,并向所述用户展示所述反馈界面。
50.根据本申请实施例的第四方面,提供了一种计算设备,包括:
51.存储器和处理器;
52.所述存储器用于存储计算机可执行指令,所述处理器执行所述计算机可执行指令时实现所述文本处理方法的步骤。
53.根据本申请实施例的第五方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述文本处理方法的步骤。
54.本申请提供的文本处理方法,在获取到用户针对目标领域提交的问题文本之后,将提取所述问题文本中的实体和关系,之后基于所述问题文本和所述关系创建查询路径,此时根据所述查询路径即可初步确定问题文本对应的初始答案文本,而为了能够提高查询所述问题文本对应的答案文本的精准度,将确定所述查询路径对应的路径结构信息,并根据所述实体和所述关系确定所述路径结构信息对应的限定条件,最后根据所述限定条件和所述查询路径在所述目标领域对应的图数据库中提取所述问题文本对应的答案文本,并向所述用户进行反馈,实现了在针对所述问题文本确定答案文本的过程中,不仅通过所述查询路径提高确定答案文本的查询效率,还通过所述限定条件提高了确定答案文本的精准度,从而实现向用户可以快速且精准的反馈所述答案文本。
附图说明
55.图1是本申请一实施例提供的一种文本处理方法的流程图;
56.图2是本申请一实施例提供的一种应用于合同检索场景中的文本处理方法的处理流程图;
57.图3是本申请一实施例提供的一种文本处理方法中展示页面的示意图;
58.图4是本申请一实施例提供的一种文本处理装置的结构示意图;
59.图5是本申请一实施例提供的一种文本处理系统的结构示意图;
60.图6是本申请一实施例提供的一种计算设备的结构框图。
具体实施方式
61.在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
62.在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
63.应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。
64.首先,对本发明一个或多个实施例涉及的名词术语进行解释。
65.实体(entity):是对客观个体的抽象,一般指的是文本中具有特定意义或者指代性强的实体,通常包括人名、地名、组织机构名、日期时间、专有名词等。
66.关系(relation):关系是实体与实体之间关系的抽象,为两个或多个实体之间的某种联系;例如,句子“北京是中国的首都、政治中心和文化中心”中表述的关系可以表示为(中国,首都,北京),(中国,政治中心,北京)和(中国,文化中心,北京)。
67.图数据库:是指汇聚具体领域知识的数据库,数据组建形式是非结构的自然语言,而为了方便计算机处理和理解,将知识采用三元组表达的方式进行形式化和简洁化;数据库中的三元组即为(实体entity,实体关系relation,实体entity)。
68.命名实体识别:命名实体识别(named entity recognition,ner),是指识别文本中具有特定意义的实体。
69.bert模型:(bidirectionalencoder representations from transformer),是基于transformer的双向编码器表征,bert模型的根基就是transformer,来源于attention is all you need。其中双向的意思表示它在处理一个词的时候,能考虑到该词前面和后面单词的信息,从而获取上下文的语义。
70.合同:是民事主体(参加民事法律关系享受权利和承担义务的人,即民事法律关系的当事人)之间设立、变更、终止民事法律关系的协议。
71.知识图谱(knowledge graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
72.在本申请中,提供了一种文本处理方法。本申请同时涉及一种文本处理装置、一种文本处理系统、一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
73.图1示出了根据本申请一实施例提供的一种文本处理方法的流程图,具体包括以下步骤:
74.步骤s102,获取用户针对目标领域提交的问题文本。
75.具体的,所述用户是指具有查询需求的用户,所述目标领域是指用户所需要查询的内容所属的领域,如用户查询电脑知识,则目标领域可以是电学领域;如用户查询健康指令,则目标领域可以是医学领域;此外,所述目标领域也可以是业务人员需要查询业务相关信息所属的领域,如业务人员查询某公司的合同信息,则目标领域可以是合同领域;如业务人员查询某公司的人事信息,则目标领域可以是人事领域;也即是说,所述目标领域在不同的查询场景中具有不同的定义。相应的,所述问题文本具体是指用户提交的需要查询内容所对应的文本。
76.具体实施时,用户在针对目标领域提交问题文本之后,如果问题文本较为简单,如问题文本为一度问题,则可以直接在知识库中提取答案文本向用户进行反馈;但是如果问题文本较为复杂,如问题文本为多度问题的情况下,就需要根据问题的度数经过多次跳转才能够从所述知识库中提取出所述答案文本,并且在此过程中,每一次跳转后的结果都需要进行记录,还需要额外的存储空间记录跳转后的结果,很大程度上影响了提取答案文本的效率,无法实现快速的向用户进行反馈。
77.有鉴于此,本申请提供的文本处理方法,无需关注问题文本的度数关系,通过创建问题文本的查询路径即可实现答案文本的抽取,并且在此过程中,为了能够保证答案文本抽取的精准度,将根据问题文本中的实体和关系构建限定条件,通过所述限定条件减小所述查询路径的映射范围,从而进一步保证了所述答案文本抽取的精准度,实现快速且精准的针对用户的问题进行反馈,以提高用户的查询体验。
78.本实施例以所述目标领域为合同领域对所述文本处理方法进行描述,所述用户提交的问题文本是指需要查询合同信息相关的文本,需要说明的是,其他领域的文本处理过程均可参见本实施例相应的描述内容,在此不作过多赘述。
79.步骤s104,提取所述问题文本中的实体和关系,并根据所述实体和所述关系创建查询路径。
80.具体的,在上述获取到用户针对目标领域上传的问题文本的基础上,进一步的,为了能够提高查询效率,以及避免多跳造成的记录负担,可以针对所述问题文本创建查询问题答案的查询路径,所述查询路径具体是指在图数据库中针对所述问题文本查询问题答案的路径。
81.其中,所述实体是指所述问题文本中的抽象个体,需要说明的是,不同的目标领域对应不同的图数据库,因此在不同的领域中将具有不同的实体,如在合同领域中,问题中包含的实体可以是用户名称,公司名称或者合同名称等,合同可以是一种实体,在医疗领域中,疾病可以是一种实体。相应的,所述关系是指问题文本中实体和实体之间关系。
82.具体实施时,能够从所述问题文本中抽取出的实体和关系,将在所述目标领域的图数据库中具有对应关系的实体和关系,并且由于图数据库中数据的存储形式是节点和关系,因此可以在图数据库中确定实体和关系所映射的实体或关系,该映射的实体和关系即可用于确定所述问题文本的答案文本。
83.基于此,在获得所述问题文本之后,通过对所述问题文本进行处理,即可抽取出所述实体和所述关系,之后基于所述实体和所述关系创建所述查询路径,以用于后续可以在目标领域对应的图数据库中抽取所述问题文本对应的答案文本。实际应用中,为了能够方便通过所述查询路径在所述图数据库中进行答案的查询,将设定提取出的所述实体和所述
关系与所述图数据库中的实体和关系具有相同的表达形式,从而为后续进行答案抽取打下基础;此外,也可以在抽取答案前对查询路径中的实体和关系进行转换,转换出满足图数据库查询条件的语句进行答案的查询,具体查询方式可以根据实际应用场景设定,本实施例在此不作任何限定。
84.进一步的,若要准确的查询到所述问题文本对应的答案文本,就需要保证提取实体和关系的准确性,因此本申请提供的文本处理方法为了能够向用户提供更加优质的查询服务,将在查询问题文本的答案过程中,采用预设关系集合的方式进行关系和实体的抽取,本实施例中,具体实现方式如下所述:
85.按照所述目标领域预中预设的关系集合对所述问题文本进行标准化处理,获得目标问题文本;
86.对所述目标问题文本进行分词处理获得多个词单元,并将所述多个词单元与所述关系集合中包含的基准关系进行匹配;
87.根据匹配结果确定所述关系,并基于所述关系在所述问题文本中提取所述实体。
88.具体的,所述预设的关系集合是指所述目标领域中能够涉及的全部关系组成的集合,需要说明的是,由于所述目标领域所涉及的信息较为单一,因此关系集合中的关系可以通过穷举法得到;相应的,对所述问题文本进行标准化处理的一种方式具体是指剔除所述问题文本中的段落符号,方便后续进行分词处理;所述词单元具体是指对目标问题文本进行分词处理后得到的元素,所述关系集合中包含的基准关系具体是指预先建立并存储的关系;其中,所述基准关系具体是指所述目标领域所能够涉及的关系,并且所述基准关系存在于所述图数据库;此外,由于所述目标领域涉及的关系较多,因此可以采用穷举的方式得到。
89.基于此,在获取到所述问题文本之后,可以按照所述目标领域中预设的关系集合对所述问题文本进行标准化处理,具体是指遍历所述问题文本的词,将所述问题文本中不属于所述关系集合中的词剔除,根据处理结果即可获得所述目标问题文本;之后再对所述目标问题文本进行分词处理获得多个词单元,同时将各个词单元与关系集合中的基准关系进行匹配,选择与所述关系集合中包含的基准关系匹配的词单元作为所述关系,最后基于所述关系即可实现从所述问题文本中抽取实体。
90.实际应用中,在基于所述关系从所述问题文本中抽取实体时,可以按照如下方式完成实体的抽取操作:从所述目标问题文本的第二个词开始遍历,遇到所述关系,就可以选择所述关系最近的实体作为所述实体。
91.例如,用户需要查询a公司和b公司在2019年签订的租赁合同,此时获取到用户上传的问题文本为“a公司和b公司在2019年签了多少份有关租赁关系的合同?”;基于此,在确定用户上传的问题文本后,则可以按照合同领域中预设的关系集合{签订关系,责任关系,赔偿关系

}对问题文本进行标准化处理,获得目标问题文本为“2019年a公司和b公司签订的租赁合同”,之后对目标问题文本进行分词处理,获得词单元包括{2019年,a公司,和,b公司,签订,的,租赁,合同}。
92.进一步的,将词单元与关系集合中包含的基准关系{签订关系,责任关系,赔偿关系

}进行匹配,确定词单元中“签订”与基准关系“签订关系”相匹配,则可以确定“签订”为问题文本的关系,之后基于关系从问题文本中抽取出实体为“a公司”和“b公司”,以用于后
续查询问题文本的答案。
93.综上,通过对所述问题文本进行标准化处理,实现可以精准的在所述问题文本中抽取出所述关系和所述实体,为后续创建查询路径做好准备,以提高后续确定问题文本的精准度。
94.此外,从所述问题文本中抽取实体和关系的操作,还可以采用弱监督的关系提取、有监督的关系提取、无监督的关系提取或模糊监督的关系提取,具体抽取方式可以根据实际应用场景选择,本实施例在此不作任何限定。
95.更进一步的,由于从所述问题文本中抽取出的关系和所述实体可能包含多个,因此在创建所述查询路径时可能创建出多条查询路径,如果基于多条查询路径进行答案的查询,可能会出现答案数量过多的问题,即查询答案的精准度较低,为了能够提高后续答案确定的精准度,可以结合语义分析模型创建所述查询路径,本实施例中,具体实现方式如下所述:
96.基于所述实体和所述关系构建所述问题文本对应的问题特征;
97.将所述问题特征输入至语义识别模型进行处理,获得所述问题文本对应的意图标签;
98.根据所述意图标签在所述实体中提取目标实体,以及在所述关系中提取目标关系;
99.基于所述目标实体和所述目标关系创建所述查询路径。
100.具体的,所述问题特征具体是指所述问题文本对应的属性特征,所述问题特征由所述实体和所述关系构建,作为所述语义识别模型的输入特征,所述问题特征的表达形式可以是向量形式;相应的,所述意图标签是指表达所述问题文本意图的标签,通过所述意图标签可以确定所述用户提出所述问题文本的意图;所述目标实体具体是指所述实体中与所述意图标签匹配度较高的实体,所述目标关系具体是指所述关系中与所述意图标签匹配度较高的关系;其中,所述语义识别模型可以使用预训练的bert模型,也可以根据实际业务需求选择其他结构的模型,本实施例在此不作任何限定。
101.基于此,首先根据所述实体和所述关系构建所述问题文本对应的问题特征,其次将所述问题特征输入至语义识别模型进行处理,获得所述问题文本对应的意图标签,再次根据所述意图标签从所述实体中抽取出所述目标实体,以及根据所述意图标签从所述关系中抽取出所述目标关系,最后基于所述目标实体和所述目标关系即可构建出所述查询路径。
102.实际应用中,确定所述目标实体和所述目标关系,可以采用计算匹配度的方式实现,即计算所述意图标签与各个实体之间的匹配度,选择匹配度最高的实体作为所述目标实体,以及计算所述意图标签与各个关系之间的匹配度,选择匹配度最高的关系作为所述目标关系。
103.进一步的,根据所述目标关系和所述目标实体构建出的查询路径是用于查询答案的路径,因此所述查询路径可以通过所述目标关系和所述目标实体进行表征,具体表达形式可以是尾实体表达形式<?x><关系><实体>,也可以是头实体表达形式<实体><关系><?x>;或者query path=[relationship
direction
,entity attribute
];再或者{entity.attribute/relationship.direction/?x.html or?x.doc or?x.jpg};实际应用中所述查询路径的具
体表达形式可以根据问题文本的内容确定,本实施例在此不作任何限定。
[0104]
例如,在问题文本“a公司和b公司在2019年签了多少份有关租赁关系的合同?”中抽取出的实体包括{a公司,b公司,租赁合同},关系包括{签订关系,租赁关系},则可以根据实体和关系构建问题文本对应的问题特征features_s,之后将问题特征features_s输入至语义识别模型进行处理,获得问题文本对应的意图标签为label_s,意图标签label_s表示查询合同,结合意图标签和问题文本可以确定用户的意图是查询a公司和b公司之间签订的合同。
[0105]
基于此,计算各个实体与意图标签label_s的匹配度,确定实体“a公司”和“b公司”与意图标签的匹配度最高,则将“a公司”和“b公司”确定为目标实体,之后再计算各个关系与意图标签label_s的匹配度,确定关系“签订关系”与意图标签的匹配度最高,则将“签订”确定为目标关系,最后基于目标实体{a公司,b公司}和目标关系{签订}构建的查询路径为<a公司><b公司><签订><?x>,以用于后续查询问题文本对应的答案。
[0106]
综上,为了能够满足后续精准的查询所述问题文本对应的答案文本,将结合语义识别确定所述问题文本的意图,之后根据识别出的意图标签提取目标实体和目标关系,最后结合目标实体和目标关系即可构建出具有查询精准度较高的查询路径,以实现后续可以精准的确定满足用户查询需求的答案文本。
[0107]
步骤s106,确定所述查询路径对应的路径结构信息,并根据所述实体和所述关系确定所述路径结构信息对应的限定条件。
[0108]
具体的,在上述基于所述实体和所述关系构建所述查询路径的基础上,进一步的,为了能够提高查询答案文本的精准度,可以再次结合所述实体和所述关系确定具有辅助作用的限定条件,以实现通过所述限定条件减小所述查询路径的映射范围,提高查询所述答案文本的精准度。
[0109]
基于此,所述路径结构信息具体是指所述查询路径对应的结构信息,通过所述路径结构信息可以确定所述查询路径中的节点信息和关系信息;相应的,所述限定条件具体是指辅助减小所述查询路径映射翻译的条件,即通过所述限定条件可以减少后续查询所述答案文本数量的效果。
[0110]
进一步的,由于查询路径是用于后续查询答案文本的基础,因此控制所述查询路径的映射范围是决定答案文本数量的根本,而查询路径又是由路径节点和路径关系构建,故所述限定条件的实质是针对查询路径中的节点和关系进行限制的条件,因此在确定所述限定条件前,需要确定所述查询路径的结构信息,本实施例中,具体实现方式如下所述:
[0111]
对所述查询路径进行解析,获得所述查询路径中的路径节点和路径关系;
[0112]
根据所述路径节点和所述路径关系确定所述路径结构信息。
[0113]
具体的,所述路径节点具体是指所述查询路径中由实体或关系构建的节点,所述路径关系具体是指所述查询路径中由关系构建的关系;相应的,所述路径结构信息即为整合所述路径节点和所述路径关系的信息。
[0114]
更进一步的,在确定所述路径结构信息之后,即可根据所述实体和所述关系确定所述路径结构信息对应的限定条件,以用于后续辅助查询路径查询所述答案文本,本实施例中,具体实现方式如下所述:
[0115]
基于所述路径结构信息在所述实体中提取条件实体,以及在所述关系中提取条件
关系;
[0116]
根据所述条件实体或所述条件关系生成所述路径结构信息对应的所述限定条件。
[0117]
具体的,所述条件实体具体是指能够对所述查询路径的映射范围起到缩限作用的实体,所述条件关系具体是指能够对所述查询路径的映射范围起到缩限作用的关系。
[0118]
基于此,由于查询路径是由路径节点和路径关系构建生成,并且创建所述查询路径的路径节点和路径关系是从所述实体和所述关系中提取出的目标实体和目标关系,因此在确定所述限定条件时,可以结合所述路径结构信息在所述实体中提取出条件实体,以及根据所述路径结构信息在所述关系中提取出条件关系。
[0119]
若基于所述路径结构信息从所述实体中提取到条件实体,则可以根据所述条件实体生成所述路径结构信息对应的限定条件;若基于所述路径结构信息从所述关系中提取到条件关系,则可以根据所述条件关系生成所述路径结构信息对应的限定条件,最后结合所述限定条件和所述查询路径即可完成后续的答案查询操作。
[0120]
进一步的,在生成所述限定条件的过程中,由于限定条件是缩小查询路径映射范围的条件,因此针对不同的问题类型可以采用不同的策略创建所述限定条件,本实施例中,具体实现方式如下所述:
[0121]
将所述问题文本输入至文本识别模型进行处理,获得所述问题文本对应的问题类型;
[0122]
在所述问题类型为实体问题类型的情况下,根据所述条件实体生成所述路径结构信息对应的所述限定条件;
[0123]
在所述问题类型为关系问题类型的情况下,根据所述条件关系生成所述路径结构信息对应的所述限定条件。
[0124]
具体的,所述实体问题类型是指所述问题文本的答案是图数据库中的实体的类型,所述关系问题类型是指所述问题文本的答案是图数据库中的关系的类型;基于此,将所述问题文本输入至所述文本识别模型进行处理,获得所述文本识别模型输出的所述问题类型,在所述问题类型为实体问题类型的情况下,说明所述问题文本对应的答案是图数据库中的实体,此时可以根据所述条件实体生成所述路径结构信息对应的所述限定条件,用于减小查询路径的映射范围;在所述问题类型为条件问题类型的情况下,说明所述问题文本对应的答案是图数据库中的关系,此时可以根据所述条件关系生成所述路径结构信息对应的所述限定条件,用于减小查询路径的映射范围。
[0125]
此外,若从所述问题文本中抽取出的实体和关系较多,则可以同时抽取出条件实体和条件关系,结合所述条件实体和所述条件关系确定所述限定条件,以提高后续查询答案文本的精准度。
[0126]
例如,根据实体和关系创建的查询路径为<a公司><b公司><签订><?x>的情况下,通过对查询路径进行解析,确定路径节点是“a公司”和“b公司”,路径关系是“签订”;之后根据路径节点在实体中提取到条件实体是“2019年”,根据路径关系在关系中提取到条件关系是“赔偿关系”;再将问题文本输入至文本识别模型进行处理,获得问题文本的问题类型是实体问题类型,则可以选择条件实体创建限定条件,即根据条件实体“2019年”创建查询路径<a公司><b公司><签订><?x>的限定条件是时间限定条件,以用于后续辅助查询答案文本。
[0127]
综上,通过针对不同的问题类型创建所述限定条件,可以有效的对所述查询路径的映射范围进行限定,从而保证后续查询的答案文本与所述问题文本的契合度,实现向用户反馈精准度较高的答案文本。
[0128]
步骤s108,基于所述限定条件和所述查询路径在所述目标领域对应的图数据库中确定所述问题文本对应的答案文本,并向所述用户进行反馈。
[0129]
具体的,在上述获得所述限定条件的基础上,进一步的,可以结合所述限定条件辅助所述查询路径进行答案文本的确定,不仅可以减少答案文本的数量,还能够保证确定答案文本的精准度,从而提高用户的查询体验。
[0130]
实际应用中,由于用户的问题文本是针对目标领域提交的,因此所述图数据库需要基于目标领域的目标数据构建,并且为了提高后续查询答案的查询效率,可以采用三元组的方式构建所述图数据库,本实施例中,具体实现方式如下所述:
[0131]
获取所述目标领域对应的目标数据;
[0132]
根据所述目标数据生成三元组,并基于所述三元组构建所述图数据库。
[0133]
具体的,所述目标数据具体是指所述目标领域涉及的全部数据,在目标领域为合同领域的情况下,目标数据可以是与合同相关的数据,如合同的类型,条款数据,甲方数据,乙方数据,赔偿数据等;所述三元组具体是指有实体和关系构建的元素,所述图数据库将由大量的三元组构成,三元组的数量由所述目标数据决定。
[0134]
此外,所述图数据库可以根据实际需求进行扩容,即当有新的目标数据生成后,可以通过图数据库设置的接口上传新的目标数据,之后由承载所述图数据库的系统对新的目标数据进行处理后,获得新的实体和/或关系;此时可以在图数据库中检测与新的实体和/或关系关联的实体或关系,之后将新的实体和/或关系与图数据库中的实体或关系进行连接,即可获得扩容后的图数据库。实际应用中,所述图数据库可以采用neo4j结构搭建,本实施在此不作任何限定。
[0135]
进一步的,在所述问题类型为实体问题类型的情况下,说明所述问题文本对应的答案是图数据库中的实体,则可以将根据所述限定条件和所述查询路径在图数据库中确定的实体作为所述答案,本实施例中,具体实现方式如下所述:
[0136]
在所述问题类型为实体问题类型的情况下,根据所述限定条件和所述查询路径在所述图数据库中确定目标实体;
[0137]
根据所述目标实体生成所述问题文本对应的所述答案文本。
[0138]
例如,问题文本是“a公司和b公司在2019年签了多少份有关租赁关系的合同?”,之后通过对问题文本进行处理,确定问题文本对应的限定条件是“2019年”,以及查询路径是<a公司><b公司><签订><租赁><?x>,根据查询路径和限定条件在图数据库中确定的目标实体有{打印机租赁合同,电脑租赁合同,工位租赁合同},则根据目标实体{打印机租赁合同,电脑租赁合同,工位租赁合同}确定问题文本的答案文本是?x=“3份租赁合同,分别是打印机租赁合同,电脑租赁合同和工位租赁合同”,并将答案文本向用户进行反馈即可。
[0139]
更进一步的,在所述问题类型为关系问题类型的情况下,说明所述问题文本对应的答案是图数据库中关系,则可以将根据所述限定条件和所述查询路径在图数据库中确定的关系作为所述答案,本实施例中,具体实现方式如下所述:
[0140]
在所述问题类型为关系问题类型的情况下,根据所述限定条件和所述查询路径在
所述图数据库中确定目标关系;
[0141]
根据所述目标关系生成所述问题文本对应的所述答案文本。
[0142]
例如,问题文本是“a公司和b公司在2019年签订的打印机租赁合同中的约定的违约金是多少?”;通过对问题文本进行处理,确定问题文本对应的限定条件是“2019年”以及查询路径是<a公司><b公司><签订><打印机><租赁><违约金><?x>,根据查询路径和限定条件在图数据库中确定的目标关系为10000元,则根据目标关系即可确定问题文本的答案文本是?x=“10000元”,并将答案文本向用户进行反馈即可。
[0143]
综上,通过结合所述限定条件实现答案文本的确定,不仅可以提高查询精准度,还能够减少确定答案文本的数量,从而实现向用户反馈满足查询需求的答案文本。
[0144]
此外,在根据所述限定条件和所述查询路径确定所述答案文本的过程中,由于限定条件是减小所述查询路径的映射范围的条件,因此在具体实施时可以根据所述限定条件对所述查询路径进行更新,本实施例中,具体实现方式如下所述:
[0145]
根据所述限定条件对所述查询路径进行更新,获得目标查询路径;
[0146]
基于所述目标查询路径在所述图数据库中确定所述问题文本对应的所述答案文本。
[0147]
具体的,所述目标查询路径具体是指将所述限定条件添加到所述查询路径后生成的新查询路径,基于此,在确定所述限定条件后,可以根据所述限定条件对所述查询路径进行更新,获得所述目标查询路径;最后基于所述目标查询路径在所述图数据库中确定所述问题文本对应的所述答案文本即可。
[0148]
例如,限定条件是“2019年”,查询路径是<a公司><b公司><签订><租赁><?x>,此时根据限定条件“2019年”对查询路径<a公司><b公司><签订><租赁><?x>进行更新,获得目标查询路径为<a公司><b公司><2019年><签订><租赁><?x>,最后再基于目标查询路径进行答案文本的确定即可。
[0149]
本申请提供的文本处理方法,在获取到用户针对目标领域提交的问题文本之后,将提取所述问题文本中的实体和关系,之后基于所述问题文本和所述关系创建查询路径,此时根据所述查询路径即可初步确定问题文本对应的初始答案文本,而为了能够提高查询所述问题文本对应的答案文本的精准度,将确定所述查询路径对应的路径结构信息,并根据所述实体和所述关系确定所述路径结构信息对应的限定条件,最后根据所述限定条件和所述查询路径在所述目标领域对应的图数据库中提取所述问题文本对应的答案文本,并向所述用户进行反馈,实现了在针对所述问题文本确定答案文本的过程中,不仅通过所述查询路径提高确定答案文本的查询效率,还通过所述限定条件提高了确定答案文本的精准度,从而实现向用户可以快速且精准的反馈所述答案文本。
[0150]
下述结合附图2,以本申请提供的文本处理方法在合同检索场景中的应用为例,对所述文本处理方法进行进一步说明。其中,图2示出了本申请一实施例提供的一种应用于合同检索场景中的文本处理方法的处理流程图,具体包括以下步骤:
[0151]
步骤s202,获取用户提交的问题文本。
[0152]
本实施例将以文本处理方法应用于合同检索场景为例进行说明,相应的,目标领域对应的图数据库具体是指a公司和b公司从合作之初到当前时间签订的全部合同相关的数据组成的图数据库,在该图数据库中a公司、b公司以及各种类型的合同均为实体,其他与
合同相关的信息,与a公司和b公司相关的信息均为关系和实体的属性。
[0153]
基于此,当a公司中的用户甲需要查询a公司和b公司在2019年的上半年签订的合同时,用户甲可以通过合同检索系统上传问题文本“a公司和b公司在2019年上半年的时候签了几份合同?”。
[0154]
步骤s204,提取问题文本中的实体和关系。
[0155]
具体的,在获得问题文本“a公司和b公司在2019年上半年的时候签了几份合同?”之后,为了能够提高针对问题文本的答复精准度,将按照预设的关系集合对问题文本进行标准化处理,获得问题文本为“2019年上半年a公司和b公司签了几份合同”。
[0156]
基于此,对目标问题文本进行分词处理,获得多个词单元{2019年,上半年,a公司,和,b公司,签,了,几份,合同},之后将多个词单元与关系集合中包含的记住关系进行匹配,遇到与关系集合中匹配的词单元后,可以选出该词单元左后最近的词单元作为实体,将与关系集合匹配的词单元作为关系,即实体为a公司和b公司,关系为签订关系和时间关系。
[0157]
步骤s206,基于实体和关系构建问题文本对应的问题特征,并将问题特征输入至语义识别模型进行处理,获得问题文本对应的意图标签。
[0158]
具体的,在获得实体a公司和b公司,以及关系为签订关系和时间关系的基础上,为了能够快速的在图数据库中查询到相关的合同信息,可以对问题文本进行意图识别,从而确定用户的意图。
[0159]
基于此,基于实体{a公司,b公司}以及关系{签订关系,时间关系}构建出问题特征,之后将问题特征输入至预先训练的语义识别模型进行语义识别处理,获得问题文本对应的意图标签是intention label_1,此时确定用户的意图为查询a公司和b公司之间的合同信息。
[0160]
步骤s208,根据意图标签在实体中提取目标实体,以及在关系中提取目标关系。
[0161]
步骤s210,基于目标实体和目标关系创建查询路径。
[0162]
具体的,在获得意图标签intention label_1之后,为了能够创建出可以快速查询问题文本对应的答案文本的查询路径,可以根据意图标签在实体中提取出目标实体,以及在关系中提取出目标关系,最后根据目标实体和目标关系创建查询路径,用于后续的答案文本的查询即可。
[0163]
基于此,根据意图标签intention label_1在实体{a公司,b公司}中提取出目标实体为{a公司,b公司},以及根据意图标签intention label_1在关系{签订关系,时间关系}中提取出目标关系为{签订关系},之后按照用户的意图“查询a公司和b公司之间的合同信息”对目标实体和目标关系进行拼接处理,获得查询路径为<a公司><签订关系><x?><签订关系><b公司>,以用于后续查询问题文本对应的答案文本。
[0164]
步骤s212,确定查询路径的路径结构信息,并根据实体和关系生成路径结构信息对应的限定条件。
[0165]
具体的,查询路径为<a公司><签订关系><x?><签订关系><b公司>,实体为{a公司,b公司},关系为{签订关系,时间关系};为了能够提高针对问题文本进行答复的精准度,可以通过限定条件减小答案的范围。
[0166]
基于此,由于实体a公司、b公司以及关系签订关系用于创建了查询路径<a公司><签订关系><x?><签订关系><b公司>,因此可以将关系

时间关系确定为条件关系,此时可结
合条件关系为查询路径中的路径节点和路径关系生成对应的限定条件{2019年上半年}。
[0167]
步骤s214,基于限定条件和查询路径生成目标查询路径。
[0168]
具体的,确定查询路径为<a公司><签订关系><x?><签订关系><b公司>,限定条件为{2019年上半年},此时可以将查询路径和限定条件进行组合,生成携带有限定条件的目标查询路径<a公司><签订关系><2019年><1

6月份><x?><签订关系><1

6月份><2019年><b公司>,以用于后续查询答案文本。
[0169]
步骤s216,根据目标查询路径在预设的图数据库中确定问题文本对应的答案文本,并向用户进行反馈。
[0170]
具体的,在确定目标查询路径<a公司><签订关系><2019年><1

6月份><x?><签订关系><1

6月份><2019年><b公司>后,基于目标查询路径查询图数据库,确定在图数据库中a公司和b公司同时指向的合同实体有100份,结合时间属性确定2019年签订的合同有30份,而在1月份至6月份之间签订的合同有2份,分别为办公用具采购合同和电脑采购合同。
[0171]
基于此,根据查询到的办公用具采购合同和电脑采购合同生成答案文本,答案文本为{办公用具采购合同,甲方:a公司,乙方:b公司,签订时间:2019

01

15,办公用具:500只笔,200个本,合同条款

}以及{电脑采购合同,甲方:a公司,乙方:b公司,签订时间:2019

01

15,电脑:s牌笔记本50台,合同条款

},为了方便用户观看,还可以将获取到的答案文本添加到预设的展示模板后再向用户进行展示,展示内容如图3所示的展示页面。
[0172]
综上所述,实现了在针对所述问题文本确定答案文本的过程中,不仅通过所述查询路径提高确定答案文本的查询效率,还通过所述限定条件提高了确定答案文本的精准度,从而实现向用户可以快速且精准的反馈所述答案文本。
[0173]
与上述方法实施例相对应,本申请还提供了文本处理装置实施例,图4示出了本申请一实施例提供的一种文本处理装置的结构示意图。如图4所示,该装置包括:
[0174]
获取模块402,被配置为获取用户针对目标领域提交的问题文本;
[0175]
创建模块404,被配置为提取所述问题文本中的实体和关系,并根据所述实体和所述关系创建查询路径;
[0176]
确定模块406,被配置为确定所述查询路径对应的路径结构信息,并根据所述实体和所述关系确定所述路径结构信息对应的限定条件;
[0177]
反馈模块408,被配置为基于所述限定条件和所述查询路径在所述目标领域对应的图数据库中确定所述问题文本对应的答案文本,并向所述用户进行反馈。
[0178]
一个可选的实施例中,所述创建模块404进一步被配置为:
[0179]
按照所述目标领域预中预设的关系集合对所述问题文本进行标准化处理,获得目标问题文本;对所述目标问题文本进行分词处理获得多个词单元,并将所述多个词单元与所述关系集合中包含的基准关系进行匹配;根据匹配结果确定所述关系,并基于所述关系在所述问题文本中提取所述实体。
[0180]
一个可选的实施例中,所述创建模块404进一步被配置为:
[0181]
基于所述实体和所述关系构建所述问题文本对应的问题特征;将所述问题特征输入至语义识别模型进行处理,获得所述问题文本对应的意图标签;根据所述意图标签在所述实体中提取目标实体,以及在所述关系中提取目标关系;基于所述目标实体和所述目标关系创建所述查询路径。
[0182]
一个可选的实施例中,所述确定模块406进一步被配置为:
[0183]
对所述查询路径进行解析,获得所述查询路径中的路径节点和路径关系;根据所述路径节点和所述路径关系确定所述路径结构信息。
[0184]
一个可选的实施例中,所述确定模块406进一步被配置为:
[0185]
基于所述路径结构信息在所述实体中提取条件实体,以及在所述关系中提取条件关系;根据所述条件实体或所述条件关系生成所述路径结构信息对应的所述限定条件。
[0186]
一个可选的实施例中,所述确定模块406进一步被配置为:
[0187]
将所述问题文本输入至文本识别模型进行处理,获得所述问题文本对应的问题类型;在所述问题类型为实体问题类型的情况下,根据所述条件实体生成所述路径结构信息对应的所述限定条件;在所述问题类型为关系问题类型的情况下,根据所述条件关系生成所述路径结构信息对应的所述限定条件。
[0188]
一个可选的实施例中,所述反馈模块408进一步被配置为:
[0189]
在所述问题类型为实体问题类型的情况下,根据所述限定条件和所述查询路径在所述图数据库中确定目标实体;根据所述目标实体生成所述问题文本对应的所述答案文本。
[0190]
一个可选的实施例中,所述反馈模块408进一步被配置为:
[0191]
在所述问题类型为关系问题类型的情况下,根据所述限定条件和所述查询路径在所述图数据库中确定目标关系;根据所述目标关系生成所述问题文本对应的所述答案文本。
[0192]
一个可选的实施例中,所述反馈模块408进一步被配置为:
[0193]
根据所述限定条件对所述查询路径进行更新,获得目标查询路径;基于所述目标查询路径在所述图数据库中确定所述问题文本对应的所述答案文本。
[0194]
一个可选的实施例中,所述图数据库通过如下方式创建:
[0195]
获取所述目标领域对应的目标数据;
[0196]
根据所述目标数据生成三元组,并基于所述三元组构建所述图数据库。
[0197]
本实施例提供的文本处理装置,在获取到用户针对目标领域提交的问题文本之后,将提取所述问题文本中的实体和关系,之后基于所述问题文本和所述关系创建查询路径,此时根据所述查询路径即可初步确定问题文本对应的初始答案文本,而为了能够提高查询所述问题文本对应的答案文本的精准度,将确定所述查询路径对应的路径结构信息,并根据所述实体和所述关系确定所述路径结构信息对应的限定条件,最后根据所述限定条件和所述查询路径在所述目标领域对应的图数据库中提取所述问题文本对应的答案文本,并向所述用户进行反馈,实现了在针对所述问题文本确定答案文本的过程中,不仅通过所述查询路径提高确定答案文本的查询效率,还通过所述限定条件提高了确定答案文本的精准度,从而实现向用户可以快速且精准的反馈所述答案文本。
[0198]
上述为本实施例的一种文本处理装置的示意性方案。需要说明的是,该文本处理装置的技术方案与上述的文本处理方法的技术方案属于同一构思,文本处理装置的技术方案未详细描述的细节内容,均可以参见上述文本处理方法的技术方案的描述。此外,装置实施例中的各组成部分应当理解为实现该程序流程各步骤或该方法各步骤所必须建立的功能模块,各个功能模块并非实际的功能分割或者分离限定。由这样一组功能模块限定的装
置权利要求应当理解为主要通过说明书记载的计算机程序实现该解决方案的功能模块构架,而不应当理解为主要通过硬件方式实现该解决方案的实体装置。
[0199]
与上述方法实施例相对应,本申请还提供了文本处理系统实施例,图5示出了本申请一实施例提供的一种文本处理系统的结构示意图。如图5所示,文本处理系统500包括客户端502和服务端504;
[0200]
所述客户端502,被配置为接收用户上传的问题文本,以及针对所述问题文本提交的领域选择指令;将所述领域选择指令和所述问题文本发送至所述服务端504;
[0201]
所述服务端504,被配置为提取所述问题文本中的实体和关系,并根据所述实体和所述关系创建查询路径;确定所述查询路径对应的路径结构信息,并根据所述实体和所述关系确定所述路径结构信息对应的限定条件;确定所述领域选择指令对应的目标领域,并基于所述限定条件和所述查询路径在所述目标领域对应的图数据库中确定所述问题文本对应的答案文本,将所述答案文本发送至所述客户端502;
[0202]
所述客户端502,还被配置为根据所述答案文本创建所述问题文本对应的反馈界面,并向所述用户展示所述反馈界面。
[0203]
具体的,所述客户端502具体是指用户所持有的终端设备,该终端设备可以向用户提供查询问题文本的答案的功能,该功能可以承载与网页或者应用程序;具体实施时,所述客户端包括但不限于电脑、手机、阅读器等设备。相应的,所述服务端504具体是指根据客户端的请求进行查询处理的一端,即根据客户端上传的指令和问题文本,可以在指令对应的领域的图数据库中,针对问题文本进行答案的检索。
[0204]
实际应用中,在通过所述客户端502展示所述反馈界面后,用户可以通过反馈界面查看到所述问题文本所对应的答案;当用户需要查看答案文本的具体内容时,可以通过下载的方式对答案文本中涉及的文件或者资源进行下载。如合同检索场景中,当针对用户提交的问题文本反馈合同检索结果后,用户还可以通过下载的方式对合同检索结果中涉及的合同副本进行下载。需要说明的是,由于答案文本中涉及的文件或者资源可能相对于目标领域较为重要,因此也可以在用户下载前或界面展示前对用户进行身份验证,如果用户通过身份验证才能够下载或展示相关的答案文本。
[0205]
可选地,所述提取所述问题文本中的实体和关系,包括:
[0206]
按照所述目标领域预中预设的关系集合对所述问题文本进行标准化处理,获得目标问题文本;
[0207]
对所述目标问题文本进行分词处理获得多个词单元,并将所述多个词单元与所述关系集合中包含的基准关系进行匹配;
[0208]
根据匹配结果确定所述关系,并基于所述关系在所述问题文本中提取所述实体。
[0209]
可选地,所述根据所述实体和所述关系创建查询路径,包括:
[0210]
基于所述实体和所述关系构建所述问题文本对应的问题特征;
[0211]
将所述问题特征输入至语义识别模型进行处理,获得所述问题文本对应的意图标签;
[0212]
根据所述意图标签在所述实体中提取目标实体,以及在所述关系中提取目标关系;
[0213]
基于所述目标实体和所述目标关系创建所述查询路径。
[0214]
可选地,所述确定所述查询路径对应的路径结构信息,包括:
[0215]
对所述查询路径进行解析,获得所述查询路径中的路径节点和路径关系;
[0216]
根据所述路径节点和所述路径关系确定所述路径结构信息。
[0217]
可选地,所述根据所述实体和所述关系确定所述路径结构信息对应的限定条件,包括:
[0218]
基于所述路径结构信息在所述实体中提取条件实体,以及在所述关系中提取条件关系;
[0219]
根据所述条件实体或所述条件关系生成所述路径结构信息对应的所述限定条件。
[0220]
可选地,所述根据所述条件实体或所述条件关系生成所述路径结构信息对应的所述限定条件,包括:
[0221]
将所述问题文本输入至文本识别模型进行处理,获得所述问题文本对应的问题类型;
[0222]
在所述问题类型为实体问题类型的情况下,根据所述条件实体生成所述路径结构信息对应的所述限定条件;
[0223]
在所述问题类型为关系问题类型的情况下,根据所述条件关系生成所述路径结构信息对应的所述限定条件。
[0224]
可选地,所述基于所述限定条件和所述查询路径在所述目标领域对应的图数据库中确定所述问题文本对应的答案文本,包括:
[0225]
在所述问题类型为实体问题类型的情况下,根据所述限定条件和所述查询路径在所述图数据库中确定目标实体;
[0226]
根据所述目标实体生成所述问题文本对应的所述答案文本。
[0227]
可选地,所述基于所述限定条件和所述查询路径在所述目标领域对应的图数据库中确定所述问题文本对应的答案文本,包括:
[0228]
在所述问题类型为关系问题类型的情况下,根据所述限定条件和所述查询路径在所述图数据库中确定目标关系;
[0229]
根据所述目标关系生成所述问题文本对应的所述答案文本。
[0230]
可选地,所述基于所述限定条件和所述查询路径在所述目标领域对应的图数据库中确定所述问题文本对应的答案文本,包括:
[0231]
根据所述限定条件对所述查询路径进行更新,获得目标查询路径;
[0232]
基于所述目标查询路径在所述图数据库中确定所述问题文本对应的所述答案文本。
[0233]
可选地,所述图数据库通过如下方式创建:
[0234]
获取所述目标领域对应的目标数据;
[0235]
根据所述目标数据生成三元组,并基于所述三元组构建所述图数据库。
[0236]
本实施例提供的文本处理系统,实现了在针对所述问题文本确定答案文本的过程中,不仅通过所述查询路径提高确定答案文本的查询效率,还通过所述限定条件提高了确定答案文本的精准度,从而实现向用户可以快速且精准的反馈所述答案文本。
[0237]
上述为本实施例的一种文本处理系统的示意性方案。需要说明的是,该文本处理系统的技术方案与上述的文本处理方法的技术方案属于同一构思,文本处理系统的技术方
案未详细描述的细节内容,均可以参见上述文本处理方法的技术方案的描述。
[0238]
图6示出了根据本申请一实施例提供的一种计算设备600的结构框图。该计算设备600的部件包括但不限于存储器610和处理器620。处理器620与存储器610通过总线630相连接,数据库650用于保存数据。
[0239]
计算设备600还包括接入设备640,接入设备640使得计算设备600能够经由一个或多个网络660通信。这些网络的示例包括公用交换电话网(pstn)、局域网(lan)、广域网(wan)、个域网(pan)或诸如因特网的通信网络的组合。接入设备640可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(nic))中的一个或多个,诸如ieee802.11无线局域网(wlan)无线接口、全球微波互联接入(wi

max)接口、以太网接口、通用串行总线(usb)接口、蜂窝网络接口、蓝牙接口、近场通信(nfc)接口,等等。
[0240]
在本申请的一个实施例中,计算设备600的上述部件以及图6中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图6所示的计算设备结构框图仅仅是出于示例的目的,而不是对本申请范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
[0241]
计算设备600可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或pc的静止计算设备。计算设备600还可以是移动式或静止式的服务器。
[0242]
其中,处理器620用于执行如下计算机可执行指令:
[0243]
获取用户针对目标领域提交的问题文本;
[0244]
提取所述问题文本中的实体和关系,并根据所述实体和所述关系创建查询路径;
[0245]
确定所述查询路径对应的路径结构信息,并根据所述实体和所述关系确定所述路径结构信息对应的限定条件;
[0246]
基于所述限定条件和所述查询路径在所述目标领域对应的图数据库中确定所述问题文本对应的答案文本,并向所述用户进行反馈。
[0247]
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的文本处理方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述文本处理方法的技术方案的描述。
[0248]
本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于:
[0249]
获取用户针对目标领域提交的问题文本;
[0250]
提取所述问题文本中的实体和关系,并根据所述实体和所述关系创建查询路径;
[0251]
确定所述查询路径对应的路径结构信息,并根据所述实体和所述关系确定所述路径结构信息对应的限定条件;
[0252]
基于所述限定条件和所述查询路径在所述目标领域对应的图数据库中确定所述问题文本对应的答案文本,并向所述用户进行反馈。
[0253]
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的文本处理方法的技术方案属于同一构思,存储介质的技术方案
未详细描述的细节内容,均可以参见上述文本处理方法的技术方案的描述。
[0254]
上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0255]
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0256]
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
[0257]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
[0258]
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本申请的内容,可作很多的修改和变化。本申请选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1