基于简称识别的客服问答方法、装置、设备和介质与流程

文档序号:33322748发布日期:2023-03-03 21:31阅读:49来源:国知局
基于简称识别的客服问答方法、装置、设备和介质与流程

1.本技术涉及计算机技术领域,特别是涉及一种基于简称识别的客服问答方法、装置、设备和介质。


背景技术:

2.随着社会经济的高速发展,企业为了能够在充分、快速地服务客户的同时降低人力运营成本,从而,电子客服问答系统应运而生。
3.目前,在经济高速发展的驱动下,各行各业百花齐放,各个专业领域内也各自拥有自己领域内对应的简称,然而,现有的电子客服问答系统,在用户输入内容中包含有简称时,电子客服无法准确地识别用户输入内容的含义,进而导致电子客服无法给出让用户满意的回复,极大程度地影响了用户的使用体验。


技术实现要素:

4.本技术实施例提供了一种基于简称识别的客服问答方法、装置、设备和介质,实施本技术实施例,能够准确地判断用户问题所属的专业领域,进而准确地识别出用户问题的内容以匹配正确的答案给用户。
5.第一方面,本技术实施例提供了一种基于简称识别的客服问答方法,应用于电子问答系统中,电子问答系统包括预设问答库,预设问答库包括多个文本问题和与文本问题相匹配的答案,上述方法包括:
6.接收用户终端发送的目标输入文本;
7.检测目标输入文本中是否存在无法识别语义的存疑部分;
8.若是,则判断目标输入文本所属的目标专业领域,并检测存疑部分是否包括目标专业领域的目标简称;
9.若是,则结合目标专业领域获取目标简称对应的目标全称;
10.使用目标全称对存疑部分进行替换处理,得到替换后的文本问题;
11.在目标专业领域对应的预设问答库中获取与替换后的文本问题相匹配的目标答案;
12.将目标答案发送给用户终端。
13.在一个可能的示例中,若根据目标专业领域,检测到存疑部分包括目标专业领域的多个目标简称,则上述方法还包括:
14.结合目标专业领域将目标专业领域的多个目标简称中每个目标简称翻译成与每个目标简称的指向内容一致的多个参考全称;
15.将多个参考全称中每个参考全称分别进行组合,得到多个参考全称组合;
16.对用户终端进行反向提问,反向提问用于向用户终端确定多个参考全称组合中的目标全称组合;
17.接收用户终端的确认指令,确定使用确认指令中包括的目标全称组合对存疑部分
进行替换处理,得到替换后的文本问题。
18.在一个可能的示例中,上述对用户终端进行反向提问,具体为:
19.获取多个参考全称中每个参考全称在历史输入文本中的出现频次,根据每个参考全称的出现频次确定出每个参考全称的优先值;
20.根据每个参考全称的优先值,计算出多个全称组合中每个全称组合的优先值总和;
21.根据每个全称组合的优先值总和对多个全称组合进行大小顺序的排序,按照大小顺序的排序向用户终端发送目标全称组合进行反向提问。
22.第二方面,本技术实施例提供了一种基于简称识别的客服问答装置,应用于电子问答系统中,电子问答系统包括预设问答库,预设问答库包括多个文本问题和与文本问题相匹配的答案,上述装置包括:
23.接收单元,用于接收用户终端发送的目标输入文本;
24.检测单元,用于检测目标输入文本中是否存在无法识别语义的存疑部分;
25.领域单元,用于在目标输入文本中存在无法识别语义的存疑部分时,则判断目标输入文本所属的目标专业领域,并检测存疑部分是否包括目标专业领域的目标简称;
26.简称单元,用于在存疑部分包括目标专业领域的目标简称时,则结合目标专业领域获取目标简称对应的目标全称;
27.替换单元,用于使用目标全称对存疑部分进行替换处理,得到替换后的文本问题;
28.获取单元,用于在目标专业领域对应的预设问答库中获取与替换后的文本问题相匹配的目标答案;
29.发送单元,用于将目标答案发送给用户终端。
30.第三方面,本技术实施例提供了一种电子设备,包括处理器、存储器以及存储在存储器上并可在处理器上运行的计算机执行指令,当计算机执行指令被运行时,使得电子设备执行如本技术实施例第一方面任一方法中所描述的部分或全部步骤。
31.第四方面,本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机指令,当计算机指令在通信装置上运行时,使得通信装置执行如本技术实施例第一方面任一方法中所描述的部分或全部步骤。
32.第五方面,本技术实施例提供了一种计算机程序产品,其中,计算机程序产品包括计算机程序,计算机程序可操作来使计算机执行如本技术实施例第一方面任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
33.可以看出,本技术实施例中,通过接收用户终端发送的目标输入文本;检测目标输入文本中是否存在无法识别语义的存疑部分;若是,则判断目标输入文本所属的目标专业领域,并检测存疑部分是否包括目标专业领域的目标简称;若是,则结合目标专业领域获取目标简称对应的目标全称;使用目标全称对存疑部分进行替换处理,得到替换后的文本问题;在目标专业领域对应的预设问答库中获取与替换后的文本问题相匹配的目标答案;将目标答案发送给用户终端。采用本技术实施例的方法,能够准确地判断用户终端发送的目标输入文本所属的目标专业领域,进而准确地识别出目标输入文本中包括的简称对应的含义,从而在目标专业领域内匹配出正确的答案给用户终端,提升存疑部分语义解析准确度,进而提高系统问答准确率和用户的满意度。
附图说明
34.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
35.图1a是本技术实施例提供的一种电子客服问答系统的结构部署图;
36.图1b是本技术实施例提供的一种基于简称识别的客服问答方法的流程图;
37.图1c是本技术实施例提供的一种基于简称识别的客服问答方法的示意图;
38.图1d是本技术实施例应用的一种基于简称识别的客服问答系统的结构部署图;
39.图2a是本技术实施例提供的一种基于简称识别的客服问答方法的示意图;
40.图2b是本技术实施例提供的一种基于简称识别的客服问答方法的示意图;
41.图3是本技术实施例提供的一种基于简称识别的客服问答装置的结构示意图;
42.图4是本技术的实施例提供的一种电子设备的硬件运行环境的服务器结构示意图。
具体实施方式
43.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
44.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤的过程、方法、系统、产品或设备没有限定于已列出的步骤,而是可选地还包括没有列出的步骤,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤。
45.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
46.下面结合附图对本技术实施例中所涉及的设备进行介绍。
47.图1a是本技术实施例提供的一种电子客服问答系统的结构部署图。如图1a所示,该系统包括用户终端、问答交互模块、问答数据库。
48.其中,用户终端,用于发送输入文本给问答交互模块、并接收与输入文本相匹配的答案。用户终端可以是手机、平板电脑、个人数字助理、穿戴式设备等电子设备。
49.其中,问答交互模块,用于接收用户终端发送的输入文本,并且将输入文本在问答数据库中进行匹配,得到问答数据库发送的与输入文本相匹配的答案后,将答案发送给用户终端。
50.其中,问答数据库,用于存储有预先设置的多个文本问题和与文本问题相匹配的答案,并根据问答交互模块收到的输入文本的内容发送与输入文本相匹配的答案给问答交
互模块。
51.在上述系统进行问答的过程中,问答交互模块只是机械性地将用户终端发送的输入文本在问答数据库中进行匹配,且问答数据库也只是机械性地根据输入文本的内容来匹配答案,存在某个简称在多个专业领域内分别对应有不同含义而无法准确识别输入文本的含义的可能性,导致在输入文本中包含简称的场景下将无法全面地满足用户终端的真实需求。
52.基于此,本技术实施例提供了一种基于简称识别的客服问答方法,应用于电子问答系统中,电子问答系统包括预设问答库,预设问答库包括多个文本问题和与文本问题相匹配的答案,请参阅图1b,图1b是本技术实施例提供的一种基于简称识别的客服问答方法的流程图,如图1b所示,该方法包括以下步骤:
53.101:接收用户终端发送的目标输入文本;
54.其中,用户终端可以是手机、平板电脑、个人数字助理、穿戴式设备等电子设备。
55.102:检测目标输入文本中是否存在无法识别语义的存疑部分;
56.其中,无法识别语义的存疑部分,包括无法识别出其含义的存疑部分,还包括同一个简称在多个专业领域内分别对应有不同的含义而无法识别其正确含义的存疑部分。在具体实现中,检测目标输入文本中是否存在无法识别语义的存疑部分,可以是通过使用文本处理技术、句法分析技术、语义分析技术结合的方式实现,其中,文本处理技术用于对目标输入文本进行分词处理并且在分词处理后进行词性标注;句法分析技术用于在经过文本处理技术后根据目标输入文本的语法自动地推导出目标输入文本的语法结构;语义分析技术用于在经过句法分析技术后确定出目标输入文本中通用的语义信息。
57.其中,若检测到目标输入文本中不存在无法识别语义的存疑部分,说明目标输入文本的语义清晰明确,可以直接将目标输入文本对应的文本问题和与文本问题相匹配的答案发送给用户终端。
58.103:若是,则判断目标输入文本所属的目标专业领域,并检测存疑部分是否包括目标专业领域的目标简称;
59.其中,判断目标输入文本所属的目标专业领域,目的是为了根据用户终端输入的信息来判断用户终端的需求信息所属的目标专业领域;在判断出目标输入文本所属的目标专业领域后检测存疑部分是否包括目标专业领域的目标简称,目的是为了能够根据更准确地识别出存疑部分的含义。
60.104:若是,则结合目标专业领域获取目标简称对应的目标全称;
61.其中,结合目标专业领域获取目标简称对应的目标全称,即是说,限定在目标专业领域中获取目标简称对应的目标全称,而不考虑目标简称在其他专业领域中对应的含义。目的是根据用户终端的目标输入文本所属的目标专业领域,精准匹配出符合用户终端的目标输入文本实际表达的含义,更贴近用户的真实需求。
62.105:使用目标全称对存疑部分进行替换处理,得到替换后的文本问题;
63.其中,使用目标全称对存疑部分进行替换处理,目的是得到完整且含义明确的替换后的文本问题,从而能够根据替换后的文本问题在预设问答库中获取与替换后的文本问题相匹配的目标答案。
64.106:在目标专业领域对应的预设问答库中获取与替换后的文本问题相匹配的目
标答案;
65.107:将目标答案发送给用户终端。
66.示例性地,电子问答系统包括智能机器人,智能机器人用于接收用户终端的目标输入文本并将目标答案发送给用户终端,请参阅图1c,图1c是本技术实施例提供的一种基于简称识别的客服问答方法的示意图,如图1c所示,智能机器人接收到用户终端发送的目标输入文本为“th的电梯额定载重量是多少?”其中,简称“th”在多个专业领域内分别对应有不同的含义,例如,“th”在化学专业领域中对应的含义是化学元素钍,“th”在医学专业领域中对应的含义是甲状腺素,而“th”在电梯专业领域中对应的含义是载货电梯,可以看出,由于“th”在多个专业领域内分别对应有不同的含义,此时无法识别其正确含义,即“th”是目标输入文本中无法识别语义的存疑部分,因此,此时要判断目标输入文本的目标专业领域才能确定此时“th”在目标输入文本中的具体明确含义,而通过“电梯额定载重量”可以判断目标输入文本所属的目标专业领域是电梯专业领域,并且检测到存疑部分“th”是电梯专业领域中的简称,即目标简称是“th”,因此,结合电梯专业领域获取到目标简称“th”对应的目标全称为“载货电梯”,使用目标全称对存疑部分进行替换处理,得到替换后的文本问题为“载货电梯的电梯额定载重量是多少?”,在电梯专业领域对应的预设问答库中获取到与“载货电梯的电梯额定载重量是多少?”相匹配的目标答案为“通常为1000kg、2000kg、3000kg、4000kg、5000kg等。”,由智能机器人将该目标答案发送给用户终端,至此完成结合用户终端提问问题的专业领域对提问问题中的简称含义进行识别以对提问问题进行准确解答的过程。
67.下面结合附图对本技术实施例中所涉及的设备进行介绍。
68.请参阅图1d,图1d是本技术实施例应用的一种基于简称识别的客服问答系统的结构部署图,如图1d所示,该基于简称识别的客服问答系统包括问答交互模块、简称识别模块、预设问答库,简称识别模块中包括检测单元、领域单元、全称单元、替换单元,基于简称识别的客服问答系统与用户终端连接。其中,每个模块的功能可以由单独的服务器来实现,也可以是多个模块的功能由一个服务器实现。实现不同模块功能的多个服务器互相通信连接。
69.其中,用户终端可以根据实际情况将自己感兴趣的问题通过输入文本的方式向基于简称识别的客服问答系统发出提问,即是说,用户终端是使用基于简称识别的客服问答系统并向该系统发送目标输入文本的角色。
70.其中,基于简称识别的客服问答系统中的问答交互模块,用于接收用户终端发送的目标输入文本,将目标输入文本发送给简称识别模块进行处理,并且将来自预设问答库的目标答案发送给用户终端。
71.其中,简称识别模块中的检测单元,用于检测目标输入文本中是否存在无法识别语义的存疑部分;
72.其中,简称识别模块中的领域单元,用于在目标输入文本中存在无法识别语义的存疑部分时判断目标输入文本所属的目标专业领域,并检测存疑部分是否包括目标专业领域的目标简称;
73.其中,简称识别模块中的全称单元,用于在存疑部分包括目标专业领域的目标简称时,结合目标专业领域获取目标简称对应的目标全称;
74.其中,简称识别模块中的替换单元,用于使用目标全称对存疑部分进行替换处理,得到替换后的文本问题,并将替换后的文本问题发送给预设问答库。
75.其中,预设问答库,包括多个文本问题和与文本问题相匹配的答案,用于根据来自简称识别模块中的替换单元的替换后的文本问题获取与替换后的文本问题相匹配的目标答案,并将目标答案发送给问答交互模块。
76.可以看出,本技术实施例中,通过接收用户终端发送的目标输入文本;检测目标输入文本中是否存在无法识别语义的存疑部分;若是,则判断目标输入文本所属的目标专业领域,并检测存疑部分是否包括目标专业领域的目标简称;若是,则结合目标专业领域获取目标简称对应的目标全称;使用目标全称对存疑部分进行替换处理,得到替换后的文本问题;在目标专业领域对应的预设问答库中获取与替换后的文本问题相匹配的目标答案;将目标答案发送给用户终端。采用本技术实施例的方法,能够准确地判断用户终端发送的目标输入文本所属的目标专业领域,进而准确地识别出目标输入文本中包括的简称对应的含义,从而在目标专业领域内匹配出正确的答案给用户终端,提升存疑部分语义解析准确度,进而提高系统问答准确率和用户的满意度。
77.在一个可能的示例中,上述判断目标输入文本所属的目标专业领域,包括:获取目标输入文本对应的至少一个历史输入文本,历史输入文本为终端用户在第一预设时间段内发送的文本;确定历史输入文本中是否包括用户终端对专业领域的指向内容,指向内容为用户终端对专业领域的明确表示;若是,则确定指向内容表示的专业领域为目标专业领域;或获取至少一个历史输入文本的话题关键词;按照预设的话题关键词与专业领域的映射关系,确定至少一个历史输入文本的话题关键词对应的至少一个参考专业领域;确定至少一个参考专业领域中的目标专业领域,目标专业领域为至少一个参考专业领域中与其他参考专业领域关联度最高的一个参考专业领域。
78.其中,第一预设时间段可以是从用户终端输入第一个输入文本开始到用户终端输入目标输入文本之前的这一时间段。
79.示例性地,指向内容为用户终端对专业领域的明确表示,可以是用户终端在历史输入文本中输入了“我的专业领域是电梯领域”或“我想了解电梯领域”等。这里不对指向内容的句式做限制,只要内容上明确表示了某一专业领域即可。
80.其中,话题关键词,指属于某个专业领域中的话题的关键词。
81.其中,预设的话题关键词与专业领域的映射关系,可以是一个话题关键词对应一个专业领域,也可以是多个话题关键词对应一个专业领域。
82.示例性地,预设的话题关键词与专业领域的映射关系如表1所示,若获取到用户终端在历史输入文本中提及了“电力拖动”、“电气控制”、“轿厢”等话题关键词,则根据预设的话题关键词与专业领域的映射关系可确定出参考专业领域为电梯领域。
83.话题关键词专业领域升降梯电梯领域客梯、货梯电梯领域制冷、送风空调领域电力拖动、电气控制、轿厢电梯领域
84.表1
85.可以看出,本技术实施例中,通过确定历史输入文本中是否包括用户终端对专业领域的指向内容来确定出目标专业领域,或者根据历史输入文本的话题关键词确定出目标专业领域,能够结合用户终端的实际情况准确地确定出用户终端发送的目标输入文本所属的目标专业领域,从而能够在确定出来的目标专业领域内匹配出正确的答案给用户终端,通过提高所回复答案的正确率进而提高用户的满意度。
86.在一个可能的示例中,在确定至少一个参考专业领域中的目标专业领域之前,上述方法还包括:构建多个专业领域节点,专业领域包括至少一个参考专业领域中每个参考专业领域;按照预设的专业领域之间的关联关系,对多个专业领域节点进行连线,根据多个专业领域中每个专业领域与其他专业领域节点的连线情况确定每个专业领域的关联度。
87.在一个可能的示例中,确定至少一个参考专业领域中的目标专业领域,包括:根据至少一个参考专业领域中,每个参考专业领域与其他参考专业领域的连线个数确定该参考专业领域的关联度,其中与其他参考专业领域连线最多的一个参考专业领域为目标专业领域;或者获取多个专业领域节点连线的关联度权值,其中与至少一个参考专业领域连线的关联度权值高于与多个专业领域节点中的其他专业领域连线的关联度权值;对多个专业领域节点连线的关联度权值求和,确定每个专业领域节点的关联度;确定至少一个参考专业领域中,关联度权值之和最大的一个参考专业领域为目标专业领域。
88.其中,预设的专业领域之间的关联关系,可以是把彼此之间具有一定关联关系的专业领域节点进行连线,示例性地,电梯轿厢中往往配置有监控摄像头或媒体广告,因此,可以将电梯领域节点与监控领域节点和/或媒体领域节点进行连线。
89.示例性地,构建有电梯领域节点、空调领域节点、监控领域节点、车辆领域节点、氛围灯领域节点、道路领域节点、媒体领域节点等多个专业领域节点,请参阅图2a,图2a是本技术实施例提供的一种基于简称识别的客服问答方法的示意图,如图2a所示,按照预设的专业领域之间的关联关系,对多个专业领域节点进行连线,得到多个专业领域中每个专业领域与其他专业领域节点的连线情况,
90.若多个专业领域节点对应的多个专业领域中的电梯领域、空调领域和监控领域为参考专业领域,且确定至少一个参考专业领域中的目标专业领域的方式为将与其他参考专业领域连线最多的一个参考专业领域为目标专业领域,则可以看出,由于电梯领域节点连接有空调领域节点和监控领域节点共连线2个专业领域节点,而空调领域节点和监控领域节点都只与电梯领域节点连接,因此,电梯领域与其他参考专业领域连线最多,即电梯领域为目标专业领域。
91.或者,多个专业领域节点对应的多个专业领域中的电梯领域、空调领域和监控领域为参考专业领域,且确定至少一个参考专业领域中的目标专业领域的方式为确定至少一个参考专业领域中关联度权值之和最大的一个参考专业领域为目标专业领域,若获取到电梯-空调领域节点连线的关联度权值为8、电梯-监控领域节点连线的关联度权值为8、电梯-媒体领域节点连线的关联度权值为5、空调-车辆领域节点连线的关联度权值为5、监控-道路领域节点连线的关联度权值为5,则对多个专业领域节点连线的关联度权值求和,确定出电梯领域节点的关联度=电梯-空调领域节点连线的关联度权值+电梯-监控领域节点连线的关联度权值+电梯-媒体领域节点连线的关联度权值=8+8+5=21、空调领域节点的关联度=电梯-空调领域节点连线的关联度权值+空调-车辆领域节点连线的关联度权值=8+5
=13、监控领域节点的关联度=电梯-监控领域节点连线的关联度权值+监控-道路领域节点连线的关联度权值=8+5=13,可以看出,关联度权值之和最大的一个参考专业领域节点为电梯领域节点,即电梯领域为目标专业领域。
92.可以看出,本技术实施例中,通过构建多个专业领域节点,按照预设的专业领域之间的关联关系,对多个专业领域节点进行连线,根据多个专业领域中每个专业领域与其他专业领域节点的连线情况确定每个专业领域的关联度,在可能存在多个参考专业领域的情况下也能够结合多个参考专业领域之间的关联关系准确地确定出用户终端的目标专业领域,通过提高专业领域的定位准确度从而提高回复答案的正确率,进而提高用户的使用体验。
93.在一个可能的示例中,预设问答库中的多个文本问题中的每个文本问题还包括与文本问题对应的至少一个专业领域,上述获取多个专业领域节点连线的关联度权值,具体为:根据多个专业领域节点连线中每个专业领域节点连线的第一端和第二端分别所连接的专业领域,得到每个专业领域节点连线的专业领域组合;根据专业领域组合在其他用户终端对应的历史输入文本中的覆盖率,得到每个专业领域节点连线对应的参考关联度:根据专业领域组合在预设问答库中出现在同一文本问题中的覆盖率,得到每个专业领域节点连线对应的关联度调节系数;根据每个专业领域节点连线对应的关联度调节系数和参考关联度,计算出每个专业领域节点连线的关联度权值,关联度权值=关联度调节系数*参考关联度+预设增益值,其中,与至少一个参考专业领域连线的预设增益值为正数,与多个专业领域节点中的其他专业领域连线的预设增益值为0。
94.示例性地,存在专业领域节点连线的第一端连接的专业领域节点为电梯领域节点且第二端连接的专业领域节点为空调领域节点,则该专业领域节点连线的专业领域组合为电梯-空调领域组合。
95.其中,专业领域节点连线对应的参考关联度,可以是专业领域节点连线的专业领域组合在其他用户终端对应的历史输入文本中的覆盖率越高,则参考关联度越高。示例性地,电梯-监控领域组合在其他用户终端对应的历史输入文本中出现的覆盖率高于电梯-空调领域组合的覆盖率,则电梯-监控领域节点连线的参考关联度高于电梯-空调领域节点连线的参考关联度。
96.其中,专业领域节点连线对应的关联度调节系数,可以是专业领域节点连线的专业领域组合在预设问答库中出现在同一文本问题中的覆盖率越高,则关联度调节系数越高。示例性地,预设问答库中“电梯监控的安装有什么注意事项?”这一个文本问题中即出现了电梯-监控领域组合。示例性地,电梯-监控领域组合在预设问答库中出现在同一文本问题中的覆盖率高于电梯-空调领域组合的覆盖率,则电梯-监控领域节点连线的关联度调节系数高于电梯-空调领域节点连线的关联度调节系数。
97.其中,与至少一个参考专业领域连线的预设增益值为正数,与多个专业领域节点中的其他专业领域连线的预设增益值为0,目的是确保多个专业领域节点连线中,与至少一个参考专业领域连线的关联度权值高于与多个专业领域节点中的其他专业领域连线的关联度权值。
98.可以看出,本技术实施例中,根据每个专业领域节点连线的专业领域组合在其他用户终端对应的历史输入文本中的覆盖率、在预设问答库中出现在同一文本问题中的覆盖
率,最终计算出每个专业领域节点连线的关联度权值,从而在可能存在多个参考专业领域的情况下,能够根据参考专业领域之间的实际情况准确地确定出用户终端的目标专业领域,通过提高专业领域的定位准确度从而提高回复答案的正确率,进而提高用户的使用体验。
99.在一个可能的示例中,若与目标简称内容一致的参考全称为多个,则上述结合目标专业领域将目标简称翻译成与目标简称内容一致的目标全称,具体为:对目标输入文本进行命名实体识别,确定存疑部分的目标实体类型,实体类型包括地点、物品、现象;对每个参考全称进行命名实体识别,得到每个参考全称的实体类型,根据每个参考全称的实体类型与目标实体类型之间的一致性,得到每个参考全称的实体类型权值;获取每个参考全称在历史输入文本中的最新输入时间,根据每个参考全称的最新输入时间的先后性,得到每个参考全称的输入时间权值;按照专业领域对应的参考全称与参考关联度之间的映射关系,得到每个全称的参考关联度;根据实体类型权值、输入时间权值和参考关联度,计算出每个参考全称的目标关联度;确定具有最高目标关联度对应的参考全称为目标全称。
100.其中,命名实体识别用于识别目标输入文本中具有特定意义的实体以确定存疑部分的目标实体类型。
101.其中,实体类型为地点时可以包括某一空间、某一具体地址等。
102.示例性地,电梯的四大空间有机房、井道、轿厢、层站,因此,若用户终端的历史输入文本为“我想查看电梯的井道尺寸表。”、“电梯的轿厢内必须设置什么标识标志?”时,其中的“井道”“轿厢”的实体类型都是地点,同理,若用户终端的历史输入文本为“供应商厂房地址:xx街道xx路xx号”时,其中的“xx街道xx路xx号”的实体类型也是地点。
103.其中,实体类型为物品时可以包括特种设备、零配件等。
104.示例性地,高速电梯是一种特种设备,语音报站器是电梯中的一种零配件,因此,若用户终端的历史输入文本为“高速电梯有没有安装语音报站器?”时,其中的“高速电梯”、“语音报站器”的实体类型都是物品。
105.其中,实体类型为现象时可以包括不同专业领域对应的科学现象。
106.示例性地,建筑摇摆、烟囱效应、活塞效应是电梯领域内被普遍关心的科学现象,因此,在目标专业领域为电梯领域时,若用户终端的历史输入文本为“建筑摇摆对电梯运行的影响?”、“电梯井道对烟囱效应有什么应对措施?”、“什么是电梯的活塞效应?”时,其中的“建筑摇摆”、“烟囱效应”和“活塞效应”的实体类型都是现象。
107.其中,参考全称的实体类型权值,可以是参考全称的实体类型与目标实体类型之间具有一致性时为正数,而在参考全称的实体类型与目标实体类型之间不具有一致性时为0。
108.其中,参考全称的输入时间权值,由于用户对输入时间越接近于当前有存疑部分的目标输入文本的参考全称的关注程度可能更强,因此,可以是参考全称的最新输入时间越晚,则参考全称的输入时间权值越高。示例性地,最新输入时间为2021年7月12日17:00的参考全称的输入时间权值高于最新输入时间为2021年7月12日8:00的输入时间权值。
109.其中,根据实体类型权值、输入时间权值和参考关联度,计算出每个参考全称的目标关联度,可以是目标关联度=(实体类型权值+输入时间权值)*参考关联度。
110.示例性地,目标关联度=(实体类型权值+输入时间权值)*参考关联度,参考全称
的最新输入时间越晚,则参考全称的输入时间权值越高。若目标输入文本为“电梯门有几种开门方式?”,其中的“电梯门”不仅可以指代电梯的厅门、还可以指代电梯的轿门,因此简称“电梯门”的参考全称有“电梯厅门”和“电梯轿门”两种,此时“电梯门”为存疑部分,假设根据专业领域对应的参考全称与参考关联度之间的映射关系,得到“电梯厅门”和“电梯轿门”的参考关联度一致,则,对目标输入文本进行命名实体识别,确定存疑部分的目标实体类型为物品,由于两个参考全称对应的实体类型也都是物品,因此“电梯厅门”与“电梯轿门”的实体类型权值一致,获取到“电梯厅门”在历史输入文本中的最新输入时间晚于“电梯轿门”的最新输入时间,则“电梯厅门”的输入时间权值高于“电梯轿门”的输入时间权值,由于“电梯厅门”和“电梯轿门”的参考关联度一致,因此,根据目标关联度=(实体类型权值+输入时间权值)*参考关联度,可以得知“电梯厅门”的目标关联度高于“电梯轿门”的目标关联度,因此将具有最高目标关联度“电梯厅门”确定为目标全称。在后续使用目标全称对存疑部分进行替换处理时,能够得到替换后的文本问题为“电梯厅门有几种开门方式?”。
111.可以看出,本技术实施例中,在与简称内容一致的参考全称为多个时,能够根据每个参考全称的实体类型、在历史输入文本中的最新输入时间以及专业领域对应的参考全称与参考关联度之间的映射关系,确定出每个参考全称的目标关联度,并确定具有最高目标关联度对应的参考全称为目标全称,在精准确定目标专业领域的基础上进一步地精准匹配目标简称对应的全称内容,从而进一步地提高了回复答案的正确率,通过更精准地触及用户的需求来提高用户的满意度。
112.在一个可能的示例中,若存疑部分不属于目标专业领域的简称,在预设问答库中获取与替换后的文本问题相匹配的目标答案之前,上述方法还包括:对存疑部分进行文字拆分,得到顺序排序的组成文字;将组成文字与历史输入文本进行匹配,得到包括组成文字的至少一个备选关键词;获取至少一个备选关键词中的目标关键词,目标关键词为包含的组成文字为顺序排序的备选关键词;使用目标关键词替代存疑部分,得到替换后的文本问题。
113.示例性地,请参阅图2b,图2b是本技术实施例提供的一种基于简称识别的客服问答方法的示意图,如图2b所示,目标输入文本为“请问电梯的开报怎么写?”且存在历史输入文本1为“如果没有开工报告,电梯承包商是否可以进行施工?”、历史输入文本2位“电梯安装报开工,需要甲方准备配合什么工作?”,其中,目标输入文本中无法识别语义的存疑部分为“开报”,“开报”并不是特定属于电梯领域的简称,因此对存疑部分进行文字拆分,得到顺序排序的组成文字“开”“报”,将组成文字与历史输入文本进行匹配,得到包括组成文字“开”“报”的备选关键词“开工报告”和“报开工”,由于组成文字“开”“报”在“开工报告”中的排序为上述“开报”的顺序排序,而组成文字“开”“报”在“报开工”中的排序并非上述“开报”的顺序排序,因此确定备选关键词其中的“开工报告”为目标关键词,使用目标关键词“开工报告”替代存疑部分“开报”,得到替换后的文本问题为“请问电梯的开工报告怎么写?”,至此完成将存在无法识别语义的存疑部分的目标输入文本转变成语义明确的文本问题,以了解用户终端的实际需求。
114.可以看出,本技术实施例中,在存疑部分不属于目标专业领域的简称时,对存疑部分进行文字拆分,将组成文字与历史输入文本进行匹配,得到包括组成文字的至少一个备选关键词,在至少一个备选关键词中确定包含的组成文字为顺序排序的备选关键词为目标
关键词,并使用目标关键词替代存疑部分,得到替换后的文本问题。本技术实施例的方法能够结合用户终端输入的历史输入文本对存疑部分的组成文字进行匹配,在例如用户终端在多次输入全称之后为了节省时间而自创简称等个性化场景下,也能够通过用户终端的历史输入文本来确定自创简称对应的内容,在实现问答智能化的同时还满足了用户的个性化需求。
115.在一个可能的示例中,若根据目标专业领域,检测到存疑部分包括目标专业领域的多个目标简称,则上述方法还包括:结合目标专业领域将目标专业领域的多个目标简称中每个目标简称翻译成与每个目标简称的指向内容一致的多个参考全称;将多个参考全称中每个参考全称分别进行组合,得到多个参考全称组合;对用户终端进行反向提问,反向提问用于向用户终端确定多个参考全称组合中的目标全称组合;接收用户终端的确认指令,确定使用确认指令中包括的目标全称组合对存疑部分进行替换处理,得到替换后的文本问题。
116.在一个可能的示例中,上述对用户终端进行反向提问,具体为:获取多个参考全称中每个参考全称在历史输入文本中的出现频次,根据每个参考全称的出现频次确定出每个参考全称的优先值;根据每个参考全称的优先值,计算出多个全称组合中每个全称组合的优先值总和;根据每个全称组合的优先值总和对多个全称组合进行大小顺序的排序,按照大小顺序的排序向用户终端发送目标全称组合进行反向提问。
117.其中,按照大小顺序的排序向用户终端发送目标全称组合进行反向提问的过程中,可以在得到用户终端针对某一目标全称组合发出确认指令后即停止,不再对排序在该目标全称组合之后的其他目标全称组合进行反向提问。
118.其中,根据每个参考全称的出现频次确定出每个参考全称的优先值,可以是将每个参考全称的出现频次作为每个参考全称的优先值,也可以是通过优先值=2^(出现频次)或优先值=|tan(出现频次
±
k*π/2)|来确定每个参考全称的优先值。
119.示例性地,根据每个参考全称的出现频次确定出每个参考全称的优先值的方式是将每个参考全称的出现频次作为每个参考全称的优先值,存疑部分包括目标简称1、目标简称2,目标简称1的指向内容与参考全称1、参考全称2一致,目标简称2的指向内容与参考全称3、参考全称4一致,将目标简称1对应的2个参考全称和目标简称2对应的2个参考全称分别进行组合,得到4个参考全称组合,其中,参考全称组合1=参考全称1+参考全称3、参考全称组合2=参考全称1+参考全称4、参考全称组合3=参考全称2+参考全称3、参考全称组合4=参考全称2+参考全称4,对用户终端进行反向提问,获取目标全称1-4在历史输入文本中的出现频次,假设得到参考全称1的出现频次为5即参考全称1的优先值为5、参考全称2的出现频次为3即参考全称2的优先值为3、参考全称3的出现频次为3即参考全称3的优先值为3、参考全称4的出现频次为2即参考全称4的优先值为2,因此,计算出参考全称组合1的优先值总和=参考全称1的优先值+参考全称3的优先值=5+3=8、参考全称组合2的优先值总和=参考全称1的优先值+参考全称4的优先值=5+2=7、参考全称组合3的优先值总和=参考全称2的优先值+参考全称3的优先值=3+3=6、参考全称组合4的优先值总和=参考全称2的优先值+参考全称4的优先值=3+2=5,参考全称组合1-4对应的组合内容、优先值如表2所示,
120.参考全称组合组合内容优先值
参考全称组合1参考全称1+参考全称38参考全称组合2参考全称1+参考全称47参考全称组合3参考全称2+参考全称36参考全称组合4参考全称2+参考全称45
121.表2
122.可以看出,参考全称组合1的优先值最高,根据每个全称组合的优先值总和对多个全称组合进行大小顺序的排序,将按照参考全称组合1

参考全称组合2

参考全称组合3

参考全称组合4的排序向用户终端发送目标全称组合进行反向提问,例如向用户终端发送目标全称组合1进行反向提问的句式可以是“请问您是在咨询参考全称1+参考全称3的内容吗?”若此时得到用户终端的确认指令“是的。”,即停止对后续参考全称组合2-4的反向提问。
123.可以看出,本技术实施例中,在存疑部分包括目标专业领域的多个目标简称时,通过将多个目标简称中每个目标简称翻译成与每个目标简称的指向内容一致的多个参考全称,将多个参考全称中每个参考全称分别进行组合后,根据每个目标全称的频次系数计算出每个全称组合的优先值总和,再根据全称组合的优先值总和排序对用户终端进行反向提问,在例如用户终端的目标输入文本中包括多个简称时能够根据用户终端对简称对应的全称的输入频次来进行反向提问,从而更准确地确认用户终端的提问意图,在实现问答智能化的同时还满足了用户的个性化需求。
124.与上述图1b所示的实施例一致的,请参阅图3,图3是本技术实施例提供的一种基于简称识别的客服问答装置的结构示意图,如图3所示:
125.一种基于简称识别的客服问答装置,应用于电子问答系统中,电子问答系统包括预设问答库,预设问答库包括多个文本问题和与文本问题相匹配的答案,上述装置包括:
126.301:接收单元,用于接收用户终端发送的目标输入文本;
127.302:检测单元,用于检测目标输入文本中是否存在无法识别语义的存疑部分;
128.303:领域单元,用于在目标输入文本中存在无法识别语义的存疑部分时,则判断目标输入文本所属的目标专业领域,并检测存疑部分是否包括目标专业领域的目标简称;
129.304:简称单元,用于在存疑部分包括目标专业领域的目标简称时,则结合目标专业领域获取目标简称对应的目标全称;
130.305:替换单元,用于使用目标全称对存疑部分进行替换处理,得到替换后的文本问题;
131.306:获取单元,用于在目标专业领域对应的预设问答库中获取与替换后的文本问题相匹配的目标答案;
132.307:发送单元,用于将目标答案发送给用户终端。
133.可以看出,本技术实施例中,通过接收单元接收用户终端发送的目标输入文本;通过检测单元检测目标输入文本中是否存在无法识别语义的存疑部分;通过领域单元在目标输入文本中存在无法识别语义的存疑部分时,则判断目标输入文本所属的目标专业领域,并检测存疑部分是否包括目标专业领域的目标简称;通过简称单元在存疑部分包括目标专业领域的目标简称时,则结合目标专业领域获取目标简称对应的目标全称;通过替换单元使用目标全称对存疑部分进行替换处理,得到替换后的文本问题;通过获取单元在目标专
业领域对应的预设问答库中获取与替换后的文本问题相匹配的目标答案;通过发送单元将目标答案发送给用户终端。采用本技术实施例的装置,能够准确地判断用户终端发送的目标输入文本所属的目标专业领域,进而准确地识别出目标输入文本中包括的简称对应的含义,从而在目标专业领域内匹配出正确的答案给用户终端,提升存疑部分语义解析准确度,进而提高系统问答准确率和用户的满意度。
134.具体地,本技术实施例可以根据上述方法示例对基于简称识别的客服问答装置进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本技术实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
135.与上述图1b所示的实施例一致的,本技术实施例提供了一种电子设备,请参阅图4,图4是本技术的实施例提供的一种电子设备的硬件运行环境的服务器结构示意图,如图4所示,电子设备包括处理器、存储器以及存储在存储器上并可在处理器上运行的计算机执行指令,当计算机执行指令被运行时,使得电子设备执行任一项基于简称识别的客服问答方法。
136.其中,处理器为cpu。
137.其中,存储器,可选的,存储器可以为高速ram存储器,也可以是稳定的存储器,例如磁盘存储器。
138.本领域技术人员可以理解,图4中示出的服务器的结构并不构成对其的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
139.如图4所示,存储器中可以包括操作系统、网络通信模块以及基于简称识别的客服问答的计算机执行指令。操作系统用于管理和控制服务器硬件和软件资源,支持计算机执行指令的运行。网络通信模块用于实现存储器内部各组件之间的通信,以及与服务器内部其他硬件和软件之间通信,通信可以使用任一通信标准或协议,包括但不限于gsm(global system of mobile communication,全球移动通讯系统)、gprs(general packet radio service,通用分组无线服务)、cdma2000(codedivision multiple access 2000,码分多址2000)、wcdma(wideband code divisionmultiple access,宽带码分多址)、td-scdma(time division-synchronous codedivision multiple access,时分同步码分多址)等。
140.在图4所示的服务器中,处理器用于运行存储器中存储的人员管理的计算机执行指令,实现以下步骤:接收用户终端发送的目标输入文本;检测目标输入文本中是否存在无法识别语义的存疑部分;若是,则判断目标输入文本所属的目标专业领域,并检测存疑部分是否包括目标专业领域的目标简称;若是,则结合目标专业领域获取目标简称对应的目标全称;使用目标全称对存疑部分进行替换处理,得到替换后的文本问题;在目标专业领域对应的预设问答库中获取与替换后的文本问题相匹配的目标答案;将目标答案发送给用户终端。
141.本技术涉及的服务器的具体实施可参见上述基于简称识别的客服问答方法的各实施例,在此不做赘述。
142.本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机指令,当计算机指令在通信装置上运行时,使得通信装置执行以下步骤:接收用户终端
发送的目标输入文本;检测目标输入文本中是否存在无法识别语义的存疑部分;若是,则判断目标输入文本所属的目标专业领域,并检测存疑部分是否包括目标专业领域的目标简称;若是,则结合目标专业领域获取目标简称对应的目标全称;使用目标全称对存疑部分进行替换处理,得到替换后的文本问题;在目标专业领域对应的预设问答库中获取与替换后的文本问题相匹配的目标答案;将目标答案发送给用户终端。上述计算机包括电子设备。
143.其中,电子设备包括手机、平板电脑、个人数字助理、穿戴式设备等。
144.其中,计算机可读存储介质可以是上述实施例所述的电子设备的内部存储单元,例如电子设备的硬盘或内存。计算机可读存储介质也可以是上述电子设备的外部存储设备,例如电子设备上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,计算机可读存储介质还可以既包括电子设备的内部存储单元也包括外部存储设备。计算机可读存储介质用于存储计算机执行指令以及电子设备所需的其他计算机执行指令和数据。计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
145.本技术涉及的计算机可读存储介质的具体实施可参见上述基于简称识别的客服问答方法的各实施例,在此不做赘述。
146.本技术实施例提供了一种计算机程序产品,其中,计算机程序产品包括计算机程序,计算机程序可操作来使计算机如上述方法实施例中记载的任何一种基于简称识别的客服问答方法的部分或全部步骤,该计算机程序产品可以是一个软件安装包。
147.需要说明的是,对于前述的任一种基于简称识别的客服问答方法的实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本技术所必须的。
148.以上对本技术实施例进行了详细介绍,本文中应用了具体个例对本技术一种基于简称识别的客服问答方法、装置、设备和介质的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术一种基于简称识别的客服问答方法、装置、设备和介质的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
149.本技术是参照本技术实施例的方法、硬件产品和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
150.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。存储器可以包括:闪存盘、只读存储器(英文:read-only memory,简称:rom)、随机存取器(英文:random access memory,简称:ram)、磁盘或光盘等。
151.尽管在此结合各实施例对本技术进行了描述,然而,在实施所要求保护的本技术过程中,本领域技术人员通过查看附图、公开内容、以及所附权利要求书,可理解并实现所公开实施例的其他变化。在权利要求中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
152.本领域普通技术人员可以理解上述任一种基于简称识别的客服问答方法的方法实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:read-only memory,简称:rom)、随机存取器(英文:random access memory,简称:ram)、磁盘或光盘等。
153.显然,本领域的技术人员可以对本技术提供的一种基于简称识别的客服问答方法、装置、设备和介质进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1