1.本技术涉及信息处理技术领域,具体而言,涉及一种识别用户意图的方法、装置、存储介质及电子设备。
背景技术:2.随着社会的不断发展,用户需求越来越多样化。目前,在相关的业务场景(例如,保险增值业务)中,如何处理好保险增值业务的服务质量尤为重要。由于业务需求的增多以及趋于多样化,话务量也在不断提升,因此需要增加大量的人力物力才能确保服务质量,但是耗费的时间长,业务处理效率较低,用户体验较差。
3.因此,如何提供一种高效的识别用户意图的方法的技术方案成为亟需解决的技术问题。
技术实现要素:4.本技术一些实施例的目的在于提供一种识别用户意图的方法、装置、存储介质及电子设备,通过本技术的实施例的技术方案采用人机交互的方式可以根据用户语音快速精准定位用户意图,并向用户播报相应的话术信息,可以提升人机交互的效率,进而提升后续人工处理业务的效率,同时也提升了用户体验。
5.第一方面,本技术一些实施例提供了一种识别用户意图的方法,应用于语音识别端,包括:将获取的用户语音转化为文本信息;获取与所述文本信息对应的话术信息;通过语音网关向用户播报所述话术信息。
6.本技术一些实施例通过获取用户语音对应的文本信息,进而获取向用户播报的话术信息,使得智能机器人可以准确识别用户意图,并与用户进行高效率对话,提升人机交互的工作效率,同时一定程度上减少了客服人员的工作量,提升了整体业务的办理效率。
7.在一些实施例,在所述将获取的用户语音转化为文本信息之前,所述方法还包括:获取所述用户语音;通过所述语音网关将所述用户语音发送至所述语音识别端。
8.本技术一些实施例通过语音网关将用户语音发送至语音识别端,可以使得语音识别端获取完整的用户信息。
9.在一些实施例,所述获取与所述文本信息对应的话术信息,包括:根据所述文本信息,利用目标文本分类模型获取用户意图槽位值,其中,所述用户意图槽位值是用于标识所述文本信息中用户意图的关键词的标签信息;根据所述用户意图槽位值,获取任务节点槽位值,其中,所述任务节点槽位值用于标识任务节点的关键词的标签信息;根据所述任务节点槽位值,获取与所述任务节点对应的所述话术信息。
10.本技术一些实施例通过目标文本分类模型得到的用户意图槽位值,获取下一任务节点槽位值对应的话术信息,实现了对用户意图的精准识别,同时可以准确获取用于引导用户说出与下一任务节点相关的话术信息,提升人机交互的效率。
11.在一些实施例,所述目标文本分类模型是通过如下方法获取的:将标注后的用户
对话样本数据作为训练数据;利用所述训练数据对初始文本分类模型进行训练,获取所述目标文本分类模型。
12.本技术一些实施例通过训练获取目标文本分类模型,可以灵活获取不同业务场景下的目标文本分类模型,可以在不同场景下训练不同的目标文本分类模型,提升了对用户意图识别的准确率。
13.在一些实施例,所述根据所述用户意图槽位值,获取任务节点槽位值,包括:根据目标多轮问答模型,获取历史文本,其中,所述历史文本是位于所述文本信息之前的一条对话文本信息或多条对话文本信息;基于所述历史文本和所述用户意图槽位值,获取所述任务节点槽位值。
14.本技术一些实施例通过历史对话信息和用户意图槽位值,得到任务节点槽位值,可以获取与用户语音精准匹配的下一任务节点的关键词的标签信息,提升了人机交互效率。
15.在一些实施例,所述目标多轮问答模型是通过如下方法获取的:获取与业务逻辑相匹配的业务特征数据;根据所述业务特征数据对所述初始多轮问答模型进行配置,获取所述目标多轮问答模型。
16.本技术一些实施例通过不同业务逻辑场景下对应的业务特征数据,对初始多轮问答模型进行配置,可以得到不同业务逻辑场景下的目标多轮问答模型,在不同的业务逻辑场景下,有效对用户意图进行识别,准确度较高,提升了业务处理效率。
17.第二方面,本技术一些实施例提供了一种识别用户意图的装置,包括:语音转化模块,被配置为将获取的用户语音转化为文本信息;信息获取模块,被配置为获取与所述文本信息对应的话术信息;信息发送模块,被配置为通过语音网关向用户播报所述话术信息。
18.第三方面,本技术一些实施例提供了一种计算机存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现第一方面中任意实施例所述的方法。
19.第四方面,本技术一些实施例提供了一种计算机产品,所述的计算机程序产品包括计算机程序,其中,所述的计算机程序被处理器执行时可实现第一方面中任意实施例所述的方法。
20.第五方面,本技术一些实施例提供了一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时可实现第一方面中任意实施例所述的方法。
附图说明
21.为了更清楚地说明本技术一些实施例的技术方案,下面将对本技术一些实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
22.图1为本技术一些实施例提供的一种识别用户意图的系统示意图;
23.图2为本技术一些实施例提供的一种识别用户意图的方法流程图之一;
24.图3为本技术一些实施例提供的一种识别用户意图的方法流程图之二;
25.图4为本技术一些实施例提供的一种识别用户意图的装置组成框图;
26.图5为本技术一些实施例提供的一种电子设备示意图。
具体实施方式
27.下面将结合本技术一些实施例中的附图,对本技术一些实施例中的技术方案进行描述。
28.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
29.相关技术中,在相关的业务场景(例如,保险业务中的救援增值服务)中,随着用户量的不断增加,用户的需要也越来越多样化。目前,研究发现由于救援增值服务较复杂,当前需要投入大量的人力去处理该项业务,导致办理救援增值服务的效率较低,用户体验较差。
30.鉴于此,本技术一些实施例提供了一种识别用户意图的方法、装置、存储介质及电子设备,该方法采用人机交互的方式,根据获取的用户语音信息,向用户播报对应的话术信息,可以提升业务办理效率,进而后续再转接人工的时候,可以提升人工处理业务的效率,同时提升了用户体验。
31.如图1所示,本技术的一些实施例提供了一种识别用户意图的系统示意图,该识别用户意图的系统包括用户端100、语音网关200和语音识别端300。图1的语音网关200可以将获取的用户端100的用户语音转发至语音识别端300,之后语音识别端300根据用户语音,获取对应的话术信息,通过语音网关200向用户端100播报。该识别用户意图的系统中的语音识别端可以精准识别用户意图,提升了用户端100、语音网关200和语音识别端300之间的交互效率,进而提升业务办理效率。
32.不难理解的是,在本技术一些实施例中,用户端100可以是座机、移动电话或者具有通信功能的其他设备,语音识别端300既可以部署在移动终端设备上,也可以部署在非便携的电脑终端。本技术不限定具体设备类型。
33.下面结合附图2具体阐述由图1的语音识别端300执行的一种识别用户意图的方法。
34.请参见附图2,图2为本技术一些实施例提供的一种识别用户意图的方法,该识别用户意图的方法可以包括:s210,将获取的用户语音转化为文本信息。s220,获取与所述文本信息对应的话术信息。s230,通过语音网关向用户播报所述话术信息。
35.需要说明的是,在本技术一些实施例中,在s210之前,该识别用户意图的方法还可以包括:获取所述用户语音;通过所述语音网关将所述用户语音发送至所述语音识别端。
36.下面示例性阐述上述过程。
37.在本技术一些实施例中,在s210中可以利用基于深度学习算法的语音识别算法(例如,语音识别引擎),对用户语音进行转译,得到与用户语音对应的文本信息。
38.为了精准识别用户意图,在本技术一些实施例中,s220可以包括:根据所述文本信息,利用目标文本分类模型获取用户意图槽位值,其中,所述用户意图槽位值是用于标识所述文本信息中用户意图的关键词的标签信息;根据所述用户意图槽位值,获取任务节点槽位值,其中,所述任务节点槽位值用于标识任务节点的关键词的标签信息;根据所述任务节
点槽位值,获取与所述任务节点对应的所述话术信息。
39.在本技术一些实施例中,用户意图槽位值是从用户语音对应的文本信息中提取出的关键词的标签信息,可以是一个或多个。例如,文本信息为“我要报案,需要办理救援业务”,此时,目标文本分类模型会提取出“报案”和“救援”这些关键词,作为用户意图槽位值(也就是“报案”是一个槽位值,“救援”是一个槽位值)。根据这些关键词的标签信息,可以在数据系统中匹配出需要回答用户的信息中的任务节点槽位值,也就是机器人回答用户“我要报案,需要办理救援业务”这一语音时,需要查找包含的关键词的标签信息,然后生成对应的话术信息,去答复用户。因此,根据用户意图槽位值和任务节点槽位值的对应关系,可以实现与用户的灵活对话,准确定位用户意图,提升人机交互效率。
40.在本技术一些实施例中,所述目标文本分类模型是通过如下方法获取的:将标注后的用户对话样本数据作为训练数据;利用所述训练数据对初始文本分类模型进行训练,获取所述目标文本分类模型。
41.例如,在本技术一些实施例中,可以获取在不同的环境下用户与人工客服直接的对话数据进行标注,然后训练初始文本分类模型,获取目标文本分类模型。
42.在本技术一些实施例中,将在保险增值业务中的救援场景中用户和人工客服的对话数据并进行标注,获取训练数据。利用训练数据对多种初始文本分类模型进行训练,得到救援场景下的目标文本分类模型。
43.例如,在本技术另一些实施例中,将在保险增值业务中的救援场景中用户和人工客服的对话数据并进行标注,获取训练数据和验证数据。利用训练数据分别对textcnn文本分类模型、bilstm-attention文本分类模型和gru-cnn(convolutional neural networks-gated recurrent unit)文本分类模型进行训练,得到待验证textcnn文本分类模型、待验证bilstm-attention文本分类模型和待验证gru-cnn文本分类模型。然后,利用验证数据集分别对待验证textcnn文本分类模型、待验证bilstm-attention文本分类模型和待验证gru-cnn文本分类模型进行验证打分,将三种模型(也就是待验证textcnn文本分类模型、待验证bilstm-attention文本分类模型和待验证gru-cnn文本分类模型)中分值最高的模型作为最终的目标文本分类模型。
44.在本技术一些实施例中,所述根据所述用户意图槽位值,获取任务节点槽位值,包括:根据目标多轮问答模型,获取历史文本,其中,所述历史文本是位于所述文本信息之前的一条对话文本信息或多条对话文本信息;基于所述历史文本和所述用户意图槽位值,获取所述任务节点槽位值。
45.为了提升人机交互效率,在本技术一些实施例中,需要基于目标多轮问答模型获取用户与机器人在本次交互之前的历史对话信息(也就是历史文本),可以根据历史对话信息,分析用户电话需求,更加准确定位用户意图,更准确地确定出本次交互,机器人需要向用户播报的话术信息。
46.在本技术一些实施例中,所述目标多轮问答模型是通过如下方法获取的:获取与业务逻辑相匹配的业务特征数据;根据所述业务特征数据对所述初始多轮问答模型进行配置,获取所述目标多轮问答模型。
47.不难理解的是,在本技术一些实施例中,由于业务场景的不同,业务逻辑也存在区别,因此为了精准地识别用户需求,需要在特定的业务场景中对初始多轮问答模型进行数
据(也就是业务特征数据)配置,以使目标多轮问答模型可以适用于不同的业务场景。例如,在保险增值业务中的救援场景中,需要根据救援场景中的业务特征数据配置初始多轮问答模型,以获取可以应用在救援场景中识别用户意图的目标多轮问答模型。
48.下面以保险增值业务中的救援场景为例,示例性介绍本技术一些实施例的识别用户意图的方法的实现过程。
49.请参见附图3,图3为本技术一些实施例提供的在救援场景下的识别用户意图的方法流程图。需要说明的是,在语音识别端300在执行识别用户意图的方法之前,已经部署有目标文本分类模型和目标多轮问答模型。
50.s301,获取用户语音。
51.作为本技术的一个具体示例,用户端100拨通电话后需要说出需求,例如,用户语音为“我需要救援,请尽快给我办理救援业务”。此时,语音网关200将用户语音转发至语音识别端300。
52.s302,将获取的用户语音转化为文本信息。
53.作为本技术的一个具体示例,语音识别端300接收到用户语音后,利用asr算法(automatic speech recognition,自动语音识别算法)将用户语音转译为文本信息,即“我需要救援,请尽快给我办理救援业务”。
54.s303,获取与所述文本信息对应的话术信息。
55.作为本技术的一个具体示例,语音识别端300的目标nlp模型(作为目标文本分类模型的一个具体示例),识别出用户意图槽位值,也就是“救援”和“办理救援业务”。根据用户意图槽位值,目标nlp算法可以判断用户符合救援条件,进而获取与“救援”和“办理救援业务”对应的任务节点槽位值,即根据系统内部的预先配置的业务逻辑,对应的任务节点槽位值为“用户身份核对”,此时将该任务节点槽位值对应的任务节点的话术“请输入您的身份证号码”这一文本信息,利用语音合成算法获取话术信息。
56.需要说明的是,目标nlp模型是利用救援场景下的训练数据对nlp(natural language processing,自然语言处理)模型进行训练得到的。
57.s304,通过语音网关向用户播报所述话术信息。
58.作为本技术的一个具体示例,语音网关200将话术信息“请输入您的身份证号码”播报给用户。
59.s305,获取用户输入的身份证号码,语音识别端识别用户意图。
60.作为本技术的一个具体示例,用户输入身份证号码之后,目标nlp模型会查询与该身份证号码对应的保单信息,并获取下一任务节点槽位值,即“车牌号核对”,此时将该任务节点对应的话术“您的车牌号后三位为***,请确认”这一文本信息,利用语音合成算法获取话术信息。
61.s306,通过语音网关向用户播报对应的话术信息。
62.作为本技术的一个具体示例,语音网关200将话术信息“您的车牌号后三位为***,请确认”播报给用户。
63.s307,获取用户回复的语音信息,语音识别端识别用户意图。
64.作为本技术的一个具体示例,语音网关200将用户回复的“确认”(如果用户回复否定性的回答,例如,不正确、不对等,则自动转接到人工客服)语音发送至语音识别端300,语
音识别端利用asr算法将“确认”语音转译为文本信息。之后目标nlp模型得到用户意图槽位值,即“确认”这一关键词,此时目标多轮问答模型根据上述用户的历史对话信息,获取下一任务节点槽位值,即“获取联系电话”,此时将下一任务节点对应的话术“请输入您的联系电话”这一文本信息,利用语音合成算法获取话术信息。
65.s308,通过语音网关向用户播报对应的话术信息。
66.作为本技术的一个具体示例,语音网关200将话术信息“请输入您的联系电话”播报给用户。
67.s309,获取用户输入的电话信息,语音识别端识别用户意图。
68.作为本技术的一个具体示例,用户输入电话号码之后,目标nlp模型会获取下一任务节点槽位值,即“救援项目确认”,此时将该任务节点对应的话术“您需要什么救援项目”这一文本信息,利用语音合成算法获取话术信息。需要说明的是,如果目标nlp模型识别失败,则自动转接人工客服。
69.s310,通过语音网关向用户播报对应的话术信息。
70.作为本技术的一个具体示例,语音网关200将话术信息“您需要什么救援项目”播报给用户。
71.s311,获取用户回复的救援项目语音信息,语音识别端识别用户意图。
72.作为本技术的一个具体示例,语音网关200将用户回复的“车辆故障”语音发送至语音识别端300,语音识别端利用asr算法将“车辆故障”语音转译为文本信息。之后目标nlp模型得到用户意图槽位值,即“车辆故障”这一关键词,此时目标多轮问答模型根据上述用户的历史对话信息,获取下一任务节点槽位值,即“转接人工服务”,此时将下一任务节点对应的话术“即将为您转接人工服务”这一文本信息,利用语音合成算法获取话术信息。
73.需要说明的是,如果目标nlp模型识别失败,则自动转接人工客服。
74.s312,通过语音网关向用户播报对应的话术信息。
75.作为本技术的一个具体示例,语音网关200将话术信息“即将为您转接人工服务”播报给用户。
76.至此,完成救援项目的人机交互任务。由于采用了本技术一些实施例提供的识别用户意图的方法,实现了对用户意图的精准定位,提升了人机交互效率,还提升了用户体验,为增值业务的办理效率提供了保障。
77.需要说明的是,救援项目的人机交互任务已经对用户意图进行准确识别,并完整的记录了用户的需求,后续客服人员只需要与用户确认详细的救援地址等其他相关信息即可,大大降低了客服人员的工作量,进而提升了客服人员的业务办理效率。
78.请参考图4,图4示出了本技术一些实施例提供的一种识别用户意图的装置。应理解,该识别用户意图的装置与上述方法实施例对应,能够执行上述方法实施例涉及的各个步骤,该识别用户意图的装置的具体功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。
79.图4的识别用户意图的装置包括至少一个能以软件或固件的形式存储于存储器中或固化在识别用户意图的装置中的软件功能模块,该识别用户意图的装置包括:语音转化模块410,至少被配置为将获取的用户语音转化为文本信息;信息获取模块420,至少被配置为获取与所述文本信息对应的话术信息;信息发送模块430,至少被配置为通过语音网关向
用户播报所述话术信息。
80.在本技术的一些实施例中,识别用户意图的装置还包括信息转发模块(图中未示出),至少被配置为获取所述用户语音;通过所述语音网关将所述用户语音发送至所述语音识别端。
81.在本技术的一些实施例中,信息获取模块420,至少被配置为根据所述文本信息,利用目标文本分类模型获取用户意图槽位值,其中,所述用户意图槽位值是用于标识所述文本信息中用户意图的关键词的标签信息;根据所述用户意图槽位值,获取任务节点槽位值,其中,所述任务节点槽位值用于标识任务节点的关键词的标签信息;根据所述任务节点槽位值,获取与所述任务节点对应的所述话术信息。
82.在本技术的一些实施例中,所述目标文本分类模型是通过如下方法获取的:将标注后的用户对话样本数据作为训练数据;利用所述训练数据对初始文本分类模型进行训练,获取所述目标文本分类模型。
83.在本技术的一些实施例中,信息获取模块420,至少被配置为根据目标多轮问答模型,获取历史文本,其中,所述历史文本是位于所述文本信息之前的一条对话文本信息或多条对话文本信息;基于所述历史文本和所述用户意图槽位值,获取所述任务节点槽位值。
84.在本技术的一些实施例中,所述目标多轮问答模型是通过如下方法获取的:获取与业务逻辑相匹配的业务特征数据;根据所述业务特征数据对所述初始多轮问答模型进行配置,获取所述目标多轮问答模型。
85.本技术的一些实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现如上述实施例提供的识别用户意图的方法。
86.本技术的一些实施例还提供了一种计算机程序产品,所述的计算机程序产品包括计算机程序,其中,所述的计算机程序被处理器执行时可实现如上述实施例提供的识别用户意图的方法。
87.如图5所示,本技术一些实施例提供了一种电子设备500,该电子设备500包括:存储器510、处理器520以及存储在存储器510上并可在处理器520上运行的计算机程序,其中,处理器520通过总线530从存储器510读取程序并执行所述程序时可实现如上述控制方法包括的任意实施例对应的方法。
88.处理器520可以处理数字信号,可以包括各种计算结构。例如复杂指令集计算机结构、结构精简指令集计算机结构或者一种实行多种指令集组合的结构。在一些示例中,处理器520可以是微处理器。
89.存储器510可以用于存储由处理器520执行的指令或指令执行过程中相关的数据。这些指令和/或数据可以包括代码,用于实现本技术实施例描述的一个或多个模块的一些功能或者全部功能。本技术公开实施例的处理器520可以用于执行存储器510中的指令以实现上述任一实施例所示的方法。存储器510包括动态随机存取存储器、静态随机存取存储器、闪存、光存储器或其它本领域技术人员所熟知的存储器。
90.以上所述仅为本技术的实施例而已,并不用于限制本技术的保护范围,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图
中不需要对其进行进一步定义和解释。
91.以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应所述以权利要求的保护范围为准。
92.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。