1.本发明涉及智能问答技术领域,尤其涉及一种电网缺陷的问答方法、装置、电子设备及存储介质。
背景技术:2.随着科技的发展,智能问答服务已经渗透人们工作生活的各个领域中,例如,智能客服领域、辅助驾驶领域以及电网领域等。
3.目前,电网领域可以提供不同场景的智能问答服务。例如,在电网缺陷询问场景中,用户发出与设定电网设备匹配的缺陷查询问题,智能问答系统通过在知识库中查询与该电网设备匹配的各项缺陷问答知识,获取与该缺陷查询问题匹配的标准问,并将知识库中与该标准问匹配的标准答进行用户反馈。
4.发明人在实现本发明的过程中,发现现有技术存在如下缺陷:现有技术在构建与各电网设备匹配的缺陷问答知识时,主要根据经验进行人为构建,构建效率低,耗时长;此外,所构建的缺陷问答知识一般无法完全贴合实际的缺陷问答场景,匹配成功率低,难以有效命中用户的实际问答需求。
技术实现要素:5.本发明实施例提供了一种电网缺陷的问答方法、装置、电子设备及存储介质,以自动构建电网缺陷询问场景中与各电网设备匹配的知识库。
6.根据本发明实施例的一方面,提供了一种电网缺陷的问答方法,包括:
7.获取用户在电网缺陷询问场景中输入的提问文本,并在提问文本中识别目标电网设备;
8.在与目标电网设备匹配的知识库中,获取与提问文本匹配的目标标准问;
9.其中,所述知识库通过使用与目标电网设备匹配的目标电网设备缺陷文本集所挖掘出的隐性知识构建得到;
10.获取与目标标准问匹配的目标标准答,作为对所述提问文本的反馈结果。
11.根据本发明实施例的另一方面,提供了一种电网缺陷的问答装置,包括:
12.目标电网设备识别模块,用于获取用户在电网缺陷询问场景中输入的提问文本,并在提问文本中识别目标电网设备;
13.目标标准问获取模块,用于在与目标电网设备匹配的知识库中,获取与提问文本匹配的目标标准问;
14.其中,所述知识库通过使用与目标电网设备匹配的目标电网设备缺陷文本集所挖掘出的隐性知识构建得到;
15.目标标准答获取模块,用于获取与目标标准问匹配的目标标准答,作为对所述提问文本的反馈结果。
16.根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
17.至少一个处理器;以及
18.与所述至少一个处理器通信连接的存储器;其中,
19.所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的电网缺陷的问答方法。
20.根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的电网缺陷的问答方法。
21.本发明实施例的技术方案,使用基于电网设备缺陷文本集挖掘出的隐性知识构建得到与每个电网设备分别对应的知识库,进而,在获取用户在电网缺陷询问场景中输入的提问文本后,通过在提问文本中识别目标电网设备,在与目标电网设备匹配的知识库中,获取与提问文本匹配的目标标准问,并获取与目标标准问匹配的目标标准答,作为对所述提问文本的反馈结果的方式,通过使用历史出现的电网设备缺陷文本集进行隐性知识的挖掘,可以自动化构建出准确贴合电网缺陷询问场景的知识库,在降低构建知识库所需人力成本的同时,可以有效提高对用户实际问答需求的命中率。
22.应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
23.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
24.图1是根据本发明实施例一提供的一种电网缺陷的问答方法的流程图;
25.图2是根据本发明实施例二提供的一种电网缺陷的问答方法的流程图;
26.图3是根据本发明实施例三提供的一种电网缺陷的问答方法的流程图;
27.图4是根据本发明实施例四提供的一种电网缺陷的问答装置的结构示意图;
28.图5是实现本发明实施例的电网缺陷的问答方法的电子设备的结构示意图。
具体实施方式
29.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
30.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆
盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
31.实施例一
32.图1为本发明实施例一提供了一种电网缺陷的问答方法的流程图,本实施例可适用于在电网缺陷询问场景中,根据用户所询问电网设备的缺陷问题,向用户反馈缺陷解决答案的情形。该方法可以由电网缺陷的问答装置来执行,该电网缺陷的问答装置可以采用硬件和/或软件的形式实现,该电网缺陷的问答装置可配置于用于提供智能问答服务的终端或者服务器中。如图1所示,该方法包括:
33.s110、获取用户在电网缺陷询问场景中输入的提问文本,并在提问文本中识别目标电网设备。
34.在本实施例中,该电网缺陷询问场景可以理解为对电网环境中某一具体的电网设备的缺陷(或者也可以理解为故障或者问题)进行询问的场景。具体的,在电网知识问答系统中,可以根据具体的问答内容,细分出多个场景,例如,电网缺陷询问场景、电费查询场景或者实时运行状态查询场景等。本实施例的技术方案主要应用在该电网缺陷询问场景中。
35.相应的,当问答用户选择进入该电网缺陷询问场景时,可以在该电网缺陷询问场景中直接输入提问文本,或者还可以在该电网缺陷询问场景中输入提问语音,系统通过语音转文字的方式将该提问语音转换为提问文本。
36.在获取该提问文本后,可以通过关键词识别的方式,在该提问文本中,提取出用户需要询问缺陷的电网设备,也即目标电网设备。
37.其中,该电网设备可以为电网环境中被普遍使用的网元,例如该电网设备的类型可以为变压器、隔离开关、断路器或者接触器等,本实施例对此并不进行限制。
38.可选的,可以预先建立电网设备文本库,通过将该提问文本与电网设备文本库中的各电网设备文本进行匹配,可以获取该提问文本中包括的目标电网设备。
39.s120、在与目标电网设备匹配的知识库中,获取与提问文本匹配的目标标准问。
40.其中,所述知识库通过使用与目标电网设备匹配的目标电网设备缺陷文本集所挖掘出的隐性知识构建得到。
41.在本实施例中,针对该电网缺陷询问场景,可以为每个电网设备分别建立一一对应的知识库。例如,针对电网设备a,建立与之对应的知识库a’。在该知识库a’中存储有与该电网设备a的缺陷所关联的全部问答对,也即,标准问和与标准问对应的标准答。
42.进而,通过文本相似度计算的方式,可以基于提问文本,在与目标电网设备匹配的知识库中,获取与提问文本匹配的目标标准问。
43.在本实施例中,与每个电网设备分别对应的知识库,通过使用与每个电网设备匹配的电网设备缺陷文本集所挖掘出的隐性知识构建得到。
44.该电网设备缺陷文本集中的各电网设备缺陷文本,可以根据历史用户通过文本或者语音的方式,针对电网设备上报或者询问的缺陷信息所形成的。其中,隐性知识的概念是:人在长期实践中积累起来的与个人经验密切相关的、不易用语言表达,也不易被他人学习的知识。
45.在本实施例中,为了使得电网缺陷询问场景可以更全面、更准确的命中用户的实
际缺陷询问需求,除了构建出显性的、标准化的问答对之外,还可以进一步通过挖掘历史用户所询问过的缺陷信息中的隐性知识,并基于该隐性知识构建符合用户语言习惯的新的问答对,以满足用户实际的缺陷询问需求。
46.s130、获取与目标标准问匹配的目标标准答,作为对所述提问文本的反馈结果。
47.在本实施例中,在从知识库中匹配出与提问文本匹配的目标标准问后,可以相应获取与目标标准问匹配的目标标准答,作为对所述提问文本的反馈结果。
48.相应的,可以将文本形式的或者语音形式的目标标准答,进行反馈给所述提问文本的发送方用户。
49.本发明实施例的技术方案,通过使用与每个电网设备分别匹配的电网设备缺陷文本集所挖掘出的隐性知识构建得到与每个电网设备分别对应的知识库,进而,在获取用户在电网缺陷询问场景中输入的提问文本后,通过在提问文本中识别目标电网设备;在与目标电网设备匹配的知识库中,获取与提问文本匹配的目标标准问,并获取与目标标准问匹配的目标标准答,作为对所述提问文本的反馈结果的技术手段,使用历史出现的电网设备缺陷文本集进行隐性知识挖掘的方式,自动化构建出准确贴合电网缺陷询问场景的知识库,在降低构建知识库建立所需的人力成本的同时,可以有效提高对用户实际问答需求的命中率。
50.在上述各实施例的技术上,在获取用户在电网缺陷询问场景中输入的提问文本之前,还可以包括:
51.收集电网缺陷文本,并按照与每个电网缺陷文本分别匹配的电网设备,将各电网缺陷文本划分为与每类电网设备分别对应的电网设备缺陷文本集;
52.根据各所述电网设备缺陷文本集,构建与每类电网设备分别对应的语义框架,所述语义框架中包括按照设定顺序串联的多个语义槽;
53.根据与每类电网设备分别对应的语义框架,分别在每个电网设备缺陷文本集中提取隐性知识;
54.根据在每个电网设备缺陷文本集中提取的隐性知识,构建与每类电网设备分别对应的知识库。
55.在本可选实施方式中,首先收集得到与每类电网设备分别对应的电网缺陷文本,之后可以针对每类电网设备分别构建相适配的语义框架,进而,可以使用与每类电网设备分别对应的语义框架,在每个电网设备缺陷文本集中提取隐性知识。
56.这样设置的好处是:可以自适应的在每类电网设备的电网设备缺陷文本集中,有效挖掘出所需的隐性知识,进而可以使得最终得到的与每类电网设备分别对应的知识库可以更好的命中用户的实际缺陷询问需求,提高智能问答效率。
57.实施例二
58.图2为本发明实施例二提供的一种电网缺陷的问答方法的流程图,本实施例在上述各实施例的基础上进行优化,在本实施例中,将根据各所述电网设备缺陷文本集,构建与每类电网设备分别对应的语义框架,具体化为:获取当前处理电网设备匹配的当前电网设备缺陷文本集;基于深度学习算法,提取当前电网设备缺陷文本集中各当前电网设备缺陷文本中包括的目标关键词,以及各目标关键词的词语描述信息;按照各目标关键词的词语描述信息,将每个当前电网设备缺陷文本中包括的目标关键词在预设的多个语义槽中进行
填充,得到与每个当前电网设备缺陷文本分别对应的语义槽填充结果;根据与每个当前电网设备缺陷文本分别对应的语义槽填充结果,生成与当前处理电网设备对应的语义框架;
59.同时,将根据在每个电网设备缺陷文本集中提取的隐性知识,构建与每类电网设备分别对应的知识库,具体化为:根据在每个电网设备缺陷文本集中提取的隐性知识,构建与每类电网设备分别对应的标准问;根据在每个电网设备缺陷文本集中提取的隐性知识,查询预先构建的电网知识图谱,获取与每类电网设备的标准问分别对应的标准答;根据与每类电网设备分别对应的标准问和标准答,构建与每类电网设备分别对应的知识库。
60.相应的,如图2所示,该方法包括:
61.s210、收集电网缺陷文本,并按照与每个电网缺陷文本分别匹配的电网设备,将各电网缺陷文本划分为与每类电网设备分别对应的电网设备缺陷文本集。
62.在本实施例中,可以在设定电网知识论坛上,或者在实际的电网缺陷日志中,或者在用户通过电话或者邮箱方式上报或者询问的电网缺陷信息中,收集电网缺陷文本。
63.在得到上述各电网缺陷文本后,可以通过如前所述的关键词匹配的方式,确定出每个电网缺陷文本所询问缺陷的电网设备,进而,可以将收集到的各电网缺陷文本划分为与每类电网设备分别对应的电网设备缺陷文本集。
64.s220、依次获取当前处理电网设备;
65.s230、获取与当前处理电网设备匹配的当前电网设备缺陷文本集;
66.s240、基于深度学习算法,提取当前电网设备缺陷文本集中各当前电网设备缺陷文本中包括的目标关键词,以及各目标关键词的词语描述信息。
67.具体的,该目标关键词可以理解为电网设备缺陷文本中用于表达设定语义,或者说含有一定的信息量的词语。词语描述信息可以理解为对该目标关键词进行词性或者语法成分描述的信息,例如,该词语描述信息可以为名词、形容词或者动词等,或者,该词语描述信息还可以为:主语、谓语或者宾语等。
68.相应的,可以基于深度学习算法,预先训练得到一个语义识别模型,基于该语音识别模型,可以识别出一个电网设备缺陷文本中包括的各目标关键词,以及与每个目标关键词分别对应的词语描述信息。
69.s250、按照各目标关键词的词语描述信息,将每个当前电网设备缺陷文本中包括的目标关键词在预设的多个语义槽中进行填充,得到与每个当前电网设备缺陷文本分别对应的语义槽填充结果。
70.语义槽可以理解为实体已明确定义的属性,例如打车场景中的,出发地点语义槽,目的地语义槽,出发时间语义槽中的属性分别是“出发地点”、“目的地”和“出发时间”等。
71.在本实施例中,可以基于各目标关键词的词语描述信息,对预先构建的多个语义槽进行填充。例如,如果获取了词语描述信息为“主语”的目标关键词,可以将该目标关键词填充至主语语义槽中,得到对该主语语义槽的填充结果。
72.其中,一个当前电网设备缺陷文本的语义槽填充结果,可以理解为针对一个当前电网设备缺陷文本,有哪些语义槽被成功的填充了。也即,一个当前电网设备缺陷文本的语义槽填充结果中包括有一个或多个语义槽。
73.可以理解的是,可以将当前电网设备缺陷文本中的同一目标关键词填充至单一或者多个语义槽中,本实施例对此并不进行限制。
74.s260、根据与每个当前电网设备缺陷文本分别对应的语义槽填充结果,生成与当前处理电网设备对应的语义框架。
75.其中,所述语义框架中包括按照设定顺序串联的多个语义槽。
76.具体的,可以根据与每个当前电网设备缺陷文本分别对应的语义槽填充结果,收集其中的共性语义槽,也即在各当前电网设备缺陷文本中出现频率较高的语义槽,并基于各共性语义槽,形成与当前处理电网设备对应的语义框架。
77.具体的,可以预先构建多个可选语义框架,并根据上述各共性语义槽所命中的可选语义框架,作为与当前处理电网设备对应的语义框架。
78.在本实施例的一个可选的实施方式中,根据与每个当前电网设备缺陷文本分别对应的语义槽填充结果,生成与当前处理电网设备对应的语义框架可以包括:
79.将与每个当前电网设备缺陷文本分别对应的语义槽填充结果,输入至预先训练的强化学习网络中,获取与当前处理电网设备对应的语义框架。
80.也即,通过训练一个强化学习网络后,基于该强化学习网络输入与同一电网设备的多个电网设备缺陷文本分别对应的各义槽填充结果后,该强化学习网络可以相应输出与该电网设备对应的语义框架。
81.s270、判断是否完成对全部电网设备的处理:若是,执行s280;否则,返回执行s220。
82.s280、根据与每类电网设备分别对应的语义框架,分别在每个电网设备缺陷文本集中提取隐性知识。
83.在本实施例中,在获取与每类电网设备分别对应的语义框架后,可以基于该语义框架,在与每类设备分别对应的每个电网设备缺陷文本集中提取相应的隐性知识。
84.s290、根据在每个电网设备缺陷文本集中提取的隐性知识,构建与每类电网设备分别对应的标准问。
85.s2100、根据在每个电网设备缺陷文本集中提取的隐性知识,查询预先构建的电网知识图谱,获取与每类电网设备的标准问分别对应的标准答。
86.其中,电网知识图谱中存储有多个电网知识问答对,通过查询该电网知识图谱,可以获取与每类电网设备的标准问分别对应的标准答。
87.在本实施例的一个可选的实施方式中,在查询预先构建的电网知识图谱之前,还可以包括:
88.获取与各类电网设备分别对应的缺陷维护文档,并在设定网站中收集各类电网设备的缺陷维护问答网页;对各所述缺陷维护文档和各所述缺陷维护问答网页进行语义分析,生成所述电网知识图谱。
89.s2110、根据与每类电网设备分别对应的标准问和标准答,构建与每类电网设备分别对应的知识库。
90.s2120、获取用户在电网缺陷询问场景中输入的提问文本,并在提问文本中识别目标电网设备。
91.s2130、在与目标电网设备匹配的知识库中,获取与提问文本匹配的目标标准问。
92.s2140、获取与目标标准问匹配的目标标准答,作为对所述提问文本的反馈结果。
93.本发明实施例的技术方案,通过使用与每个电网设备分别匹配的电网设备缺陷文
本集所挖掘出的隐性知识构建得到与每个电网设备分别对应的知识库,进而,在获取用户在电网缺陷询问场景中输入的提问文本后,通过在提问文本中识别目标电网设备;在与目标电网设备匹配的知识库中,获取与提问文本匹配的目标标准问,并获取与目标标准问匹配的目标标准答,作为对所述提问文本的反馈结果的技术手段,使用历史出现的电网设备缺陷文本集进行隐性知识挖掘的方式,自动化构建出准确贴合电网缺陷询问场景的知识库,在降低构建知识库建立所需的人力成本的同时,可以有效提高对用户实际问答需求的命中率。
94.实施例三
95.图3为本发明实施例三提供的一种电网缺陷的问答方法的流程图,本实施例在上述各实施例的基础上进行优化,在本实施例中,将在与目标电网设备匹配的知识库中,获取与提问文本匹配的目标标准问,具体化为:获取与提问文本匹配的多个触发体,并将各触发体与问答库中的各标准问进行匹配,获取各触发体与匹配的标准问之间的目标匹配度;在根据各目标匹配度确定存在多个冲突触发体时,使用消解词库对各冲突触发体的目标匹配度进行至少一轮冲突消解处理,直至检测到满足冲突消解条件的目标冲突触发体;获取与目标触发体对应的目标标准问。
96.相应的,如图3所示,所述方法具体可以包括:
97.s310、获取用户在电网缺陷询问场景中输入的提问文本,并在提问文本中识别目标电网设备。
98.s320、获取与提问文本匹配的多个触发体,并将各触发体与问答库中的各标准问进行匹配,获取各触发体与匹配的标准问之间的目标匹配度。
99.触发体是指将获取的提问文本进行分词重组、去干扰字等处理后获取的处理文本。触发体可以用于与问答库中的标准问进行匹配,若存在匹配度达到匹配标准的标准问,则该标准问可能为与该触发体匹配的标准问。
100.由于提问文本是用户较为主观的语言表达,因此在词汇选择上也带有一定主观倾向,对于部分提问文本来说,可能存在通过不同领域的词库对提问文本进行处理时,针对每个类型词库可能会获得不同的分词结果,因此针对一个提问文本可能存在多个匹配的触发体。
101.优选的,可以在问答库中获取与当前触发体匹配度最高的标准问,作为与该触发体匹配的标准问,该匹配的标准问与该触发体之间的匹配度为关联标准问与该触发体之间的目标匹配度,每个触发体在问答库中可以存在一个匹配的标准问。
102.s330、在根据各目标匹配度确定存在多个冲突触发体时,使用消解词库对各冲突触发体的目标匹配度进行至少一轮冲突消解处理,直至检测到满足冲突消解条件的目标冲突触发体。
103.在实际应用过程中,研发人员为了增加问答范围,会逐渐向问答库中补充标准问答语句,因此问答库中的标准问答语句的数量逐渐上升,可能会导致多个触发体与其关联标准问之间的目标匹配度均相同或相近的情况发生,这类目标匹配度相同或相近的触发体可看作冲突触发体。
104.在此种情况下,难以选择能够获取最优答案的标准触发体,因此,本发明创造性的提出了使用消解词对冲突触发体进行冲突消解处理,直至在冲突触发体中选出目标冲突触
发体。
105.优选的,可以预先设置一个冲突匹配度范围。
106.可以理解的是,冲突消解处理主要针对无法确定能够获取最优答案的多个触发体进行筛选,且此类触发体能够获取的标准答还应该具有一定的可靠性。
107.若存在触发体与匹配的标准问之间的目标匹配度超过冲突匹配度范围上限,则不需要进行冲突消解处理,此类触发体在问答库中获取的标准答理论上已经能作为最优答案,且当多个触发体与匹配的关联标准问之间的目标匹配度均超过冲突匹配度范围上限时,可随机选择目标触发体,并将目标触发体在问答库中获取的标准答作为最优答案。
108.若存在多个触发体与匹配的关联标准问之间的目标匹配度落入冲突匹配度范围时,此类触发体可视为冲突触发体,冲突消解处理主要是针对冲突触发体进行消解处理,冲突消解处理的目的是在多个冲突触发体中获取能够获得最优答案的目标冲突触发体。
109.在本发明的实施例中,冲突消解处理可以理解为:将各冲突触发体中各分词与预先生成的多个消解词子库进行匹配,若冲突触发体存在命中消解词子库的分词,则根据该消解词子库对应的消解量更新触发体的目标匹配度,直至某个冲突触发体超出冲突匹配度范围上限,则将该冲突触发体作为目标冲突触发体。
110.目标冲突触发体可理解为,当提问文本存在多个冲突触发体时,经冲突消解处理后,选择的唯一冲突触发体,与目标冲突触发体匹配的目标关联标准问所对应的标准答可作为该提问文本的反馈结果。
111.优选的,可以预先生成多个消解词子库。
112.消解词子库的类型可以包括通用类型的消解词子库、行业领域类型的消解词子库以及动态类型的消解词子库,每种类型的消解词子库对应的消解量应具有一定差异,以便于对各目标匹配度的更新更准确。
113.可选的,在冲突消解处理的过程中,可以分为多轮次处理,在每一轮次为每个冲突触发体随机匹配一个通用类型的消解词子库、一个行业领域类型的消解词子库以及一个动态类型的消解词子库,通过采用这种消解词子库的方式,能够在保证消解准确率的情况下,提高冲突消解的效率。
114.s340、获取与目标触发体对应的目标标准问。
115.其中,所述知识库通过使用与目标电网设备匹配的目标电网设备缺陷文本集所挖掘出的隐性知识构建得到。
116.s350、获取与目标标准问匹配的目标标准答,作为对所述提问文本的反馈结果。
117.可选的,若在问答库中针对目标标准问存在多个对应的标准答,则可随机选择一个标准答作为提问文本的反馈结果。
118.本发明实施例的技术方案通过当提问文本存在多个相匹配的冲突触发体时,对冲突触发体进行冲突消解处理直至获取目标冲突触发体,获取目标冲突触发体的目标标准问对应的标准答作为提问文本的反馈结果的方式,能够在问答库中准确、高效的选择最优回答并反馈给用户,解决了传统语义问答方法所获取的回答准确性不高的问题。
119.在上述各实施例的基础上,获取与提问文本匹配的多个触发体,可以包括:
120.使用多个词库分别对所述提问文本进行分词处理,得到与各词库分别对应的分词集合;
121.对去除干扰词后的各分词集合分别进行分词重组,得到所述多个触发体。
122.在上述各实施例的基础上,将各触发体与问答库中的各标准问进行匹配,获取各触发体与匹配的标准问之间的目标匹配度,包括:
123.将当前触发体与问答库中的每个标准问分别进行匹配,得到与当前触发体对应的各匹配度;
124.将与最高匹配度对应的标准问确定为与所述当前触发体匹配的标准问,并将所述最高匹配度确定为当前触发体与匹配的标准问之间的目标匹配度。
125.在上述各实施例的基础上,根据各目标匹配度确定存在多个冲突触发体,可以包括:
126.获取预设的冲突匹配度范围;
127.当不存在超过冲突匹配度范围上限的目标匹配度,且落入冲突匹配度范围的目标匹配度为多个时,确定存在与落入冲突匹配度范围的各目标匹配度分别对应的多个冲突触发体。
128.在上述各实施例的基础上,使用消解词库对各冲突触发体的目标匹配度进行至少一轮冲突消解处理,直至检测到满足冲突消解条件的目标冲突触发体,可以包括:
129.获取与当前轮次对应的至少一个消解词子库,并将各冲突触发体中各分词分别与各消解词子库中的各消解词进行匹配;
130.在匹配过程中,每当检测到有目标分词命中目标消解词子库的消解词,则使用与目标消解词子库匹配的消解量,更新与目标分词对应的冲突触发体的目标匹配度;
131.在完成当前轮次的冲突消解处理时,检测是否存在超过冲突匹配度范围上限的目标匹配度;
132.若是,则将与超过冲突匹配度范围上限的目标匹配度对应的冲突触发体确定为目标冲突触发体;
133.否则,在更新当前轮次后,返回执行获取与当前轮次对应的至少一个消解词子库的处理,直至成功获取目标冲突触发体。
134.在上述各实施例的基础上,在获取与当前轮次对应的至少一个消解词子库之前,还包括下述至少一项:
135.将多个通用词库中的各通用词与问答库中的各问答语句进行比对,计算每个通用词在问答库中的词频,并根据每个通用词的词频,生成多个通用类型的消解词子库;
136.将多个行业领域词库中的各行业领域词与问答库中的各问答语句进行比对,计算每个行业领域词在问答库中的词频,并根据每个行业领域词的词频,生成多个行业领域类型的消解词子库;
137.在问答库中获取设定时间区间内的高频问答对,以及与各通用词库和各行业领域词库分别对应的通用词别名和行业领域词别名,并根据高频问答对、通用词别名和行业领域词别名生成多个动态类型的消解词子库;
138.其中,各消解词子库的类型、通用词的词频以及行业领域词的词频用于确定消解量。
139.在上述各实施例的基础上,在使用与目标消解词子库匹配的消解量,更新与目标分词对应的冲突触发体的目标匹配度之前,还可以包括:
140.获取目标消解词子库的类型;
141.如果所述类型为通用类型,则在目标消解词子库中获取与目标分词对应的通用词的第一目标词频,将第一目标词频与通用类型对应的第一权重之间的乘积,确定为与目标消解词子库匹配的消解量;
142.如果所述类型为行业领域类型,则在目标消解词子库中获取与目标分词对应的行业领域词的第二目标词频,将第二目标词频与行业领域类型对应的第二权重之间的乘积,确定为与目标消解词子库匹配的消解量;
143.如果所述类型为动态类型,则将与动态类型对应的第三权重,确定为与目标消解词子库匹配的消解量;
144.其中,第三权重大于第二权重,第二权重大于第一权重。
145.在上述各实施例的基础上,获取与当前轮次对应的至少一个消解词子库,包括:
146.获取与当前轮次对应的至少一个通用类型的消解词子库、至少一个行业领域类型的消解词子库以及至少一个动态类型的消解词子库。
147.实施例四
148.图4为本发明实施例四提供的一种电网缺陷的问答装置的结构示意图。如图4所示,该装置包括:目标电网设备识别模块410、目标标准问获取模块420以及目标标准答获取模块430,其中:
149.目标电网设备识别模块410,用于获取用户在电网缺陷询问场景中输入的提问文本,并在提问文本中识别目标电网设备;
150.目标标准问获取模块420,用于在与目标电网设备匹配的知识库中,获取与提问文本匹配的目标标准问;
151.其中,所述知识库通过使用与目标电网设备匹配的目标电网设备缺陷文本集所挖掘出的隐性知识构建得到;
152.目标标准答获取模块430,用于获取与目标标准问匹配的目标标准答,作为对所述提问文本的反馈结果。
153.本发明实施例的技术方案,通过使用与每个电网设备分别匹配的电网设备缺陷文本集所挖掘出的隐性知识构建得到与每个电网设备分别对应的知识库,进而,在获取用户在电网缺陷询问场景中输入的提问文本后,通过在提问文本中识别目标电网设备;在与目标电网设备匹配的知识库中,获取与提问文本匹配的目标标准问,并获取与目标标准问匹配的目标标准答,作为对所述提问文本的反馈结果的技术手段,使用历史出现的电网设备缺陷文本集进行隐性知识挖掘的方式,自动化构建出准确贴合电网缺陷询问场景的知识库,在降低构建知识库建立所需的人力成本的同时,可以有效提高对用户实际问答需求的命中率。
154.在上述各实施例的基础上,还可以包括:
155.电网设备缺陷文本集划分单元,用于在获取用户在电网缺陷询问场景中输入的提问文本之前,收集电网缺陷文本,并按照与每个电网缺陷文本分别匹配的电网设备,将各电网缺陷文本划分为与每类电网设备分别对应的电网设备缺陷文本集;
156.语义框架构建单元,用于根据各所述电网设备缺陷文本集,构建与每类电网设备分别对应的语义框架,所述语义框架中包括按照设定顺序串联的多个语义槽;
157.隐性知识提取单元,用于根据与每类电网设备分别对应的语义框架,分别在每个电网设备缺陷文本集中提取隐性知识;
158.知识库构建单元,用于根据在每个电网设备缺陷文本集中提取的隐性知识,构建与每类电网设备分别对应的知识库。
159.在上述各实施例的基础上,语义框架构建单元,可以具体包括:
160.当前电网设备缺陷文本集获取子单元,用于获取当前处理电网设备匹配的当前电网设备缺陷文本集;
161.目标关键词提取子单元,用于基于深度学习算法,提取当前电网设备缺陷文本集中各当前电网设备缺陷文本中包括的目标关键词,以及各目标关键词的词语描述信息;
162.语义槽填充子单元,用于按照各目标关键词的词语描述信息,将每个当前电网设备缺陷文本中包括的目标关键词在预设的多个语义槽中进行填充,得到与每个当前电网设备缺陷文本分别对应的语义槽填充结果;
163.语义框架生成子单元,用于根据与每个当前电网设备缺陷文本分别对应的语义槽填充结果,生成与当前处理电网设备对应的语义框架。
164.在上述各实施例的基础上,语义框架生成子单元,可以具体用于:
165.将与每个当前电网设备缺陷文本分别对应的语义槽填充结果,输入至预先训练的强化学习网络中,获取与当前处理电网设备对应的语义框架。
166.在上述各实施例的基础上,知识库构建单元,可以具体用于:
167.根据在每个电网设备缺陷文本集中提取的隐性知识,构建与每类电网设备分别对应的标准问;
168.根据在每个电网设备缺陷文本集中提取的隐性知识,查询预先构建的电网知识图谱,获取与每类电网设备的标准问分别对应的标准答;
169.根据与每类电网设备分别对应的标准问和标准答,构建与每类电网设备分别对应的知识库。
170.在上述各实施例的基础上,还可以包括电网知识图谱生成单元,用于:
171.在查询预先构建的电网知识图谱之前,获取与各类电网设备分别对应的缺陷维护文档,并在设定网站中收集各类电网设备的缺陷维护问答网页;对各所述缺陷维护文档和各所述缺陷维护问答网页进行语义分析,生成所述电网知识图谱。
172.在上述各实施例的基础上,目标标准问获取模块420可以具体用于:
173.获取与提问文本匹配的多个触发体,并将各触发体与问答库中的各标准问进行匹配,获取各触发体与匹配的标准问之间的目标匹配度;在根据各目标匹配度确定存在多个冲突触发体时,使用消解词库对各冲突触发体的目标匹配度进行至少一轮冲突消解处理,直至检测到满足冲突消解条件的目标冲突触发体;获取与目标触发体对应的目标标准问。
174.本发明实施例所提供的电网缺陷的问答装置可执行本发明任意实施例所提供的电网缺陷的问答方法,具备执行方法相应的功能模块和有益效果。
175.实施例五
176.图5示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形
式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
177.如图5所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(rom)12、随机访问存储器(ram)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(rom)12中的计算机程序或者从存储单元18加载到随机访问存储器(ram)13中的计算机程序,来执行各种适当的动作和处理。在ram 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、rom 12以及ram 13通过总线14彼此相连。输入/输出(i/o)接口15也连接至总线14。
178.电子设备10中的多个部件连接至i/o接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
179.处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如本发明实施例所述的电网缺陷的问答方法,其中,所述方法包括:
180.获取用户在电网缺陷询问场景中输入的提问文本,并在提问文本中识别目标电网设备;
181.在与目标电网设备匹配的知识库中,获取与提问文本匹配的目标标准问;
182.其中,所述知识库通过使用与目标电网设备匹配的目标电网设备缺陷文本集所挖掘出的隐性知识构建得到;
183.获取与目标标准问匹配的目标标准答,作为对所述提问文本的反馈结果。
184.在一些实施例中,该电网缺陷的问答方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由rom 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到ram 13并由处理器11执行时,可以执行上文描述的电网缺陷的问答方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行电网缺陷的问答方法。
185.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
186.用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合
来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
187.在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
188.为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
189.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
190.计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。
191.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
192.上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。