可配置智能语音机器人的实现方法、装置和存储介质与流程

文档序号:29612330发布日期:2022-04-13 09:55阅读:178来源:国知局
可配置智能语音机器人的实现方法、装置和存储介质与流程

1.本技术涉及人工智能领域,尤其涉及一种可配置智能语音机器人的实现方法、装置和存储介质。


背景技术:

2.目前,智能语音机器人广泛应用于在电话营销、客服系统中,通过ivr(互动式语音应答)服务,由机器人完成对特定客户的电话营销。其中,电话营销包括简单形式和复杂形式,简单形式指“单边营销宣传”,例如一句话营销内容播报;复杂形式还可以实现与客户的多轮语音问答交互,并且对客户潜在意向进行判断反馈。智能语音机器人可以解决传统人工电话营销的招聘成本高、培训周期长、业务水平不一致、服务质量不稳定等长期困扰行业的问题,通过基于自然语言模型的后台机器人,完成大规模、重复性劳动,帮助企业减少近80%的一般性外呼的人力成本。
3.在实现本发明的过程中,发明人发现目前可以进行场景问答交互的复杂形式的智能语音机器人普遍存在如下技术问题:
4.智能语音机器人在场景问答交互过程中,可以通过识别用户会话的意图场景,来给出相应回复。传统基于文本分类模型的意图识别算法采用的是离线训练的方式,模型通过学习历史标签语料,对未来新增的样本进行判断,将其分类到已习得的某一标签类别中。这种以贝叶斯理论为基础的算法模型只能处理已知的分类,对于历史语料中未出现的类别,依然只能归类到已知分类中,这就必然导致分类错误。在实际应用中,为了解决这个问题,开发人员一般只能在历史标签语料中添加新类别的标注语料,然后重新回滚训练模型。这种方式不仅效率低、成本高,而且无法保证模型正向收敛,即引入新语料再学习可能会降低原有类别的分类准确度,并且,由于算法底层依赖条件概率,各类别的判别概率不是相互独立的,这样针对不同的场景类别开发智能语音机器人时,需要分别定制化开发,彼此无法迁移复用,从而导致智能语音机器人的场景开发成本过高。


技术实现要素:

5.为了解决上述背景技术中提到的技术问题,本技术提供了可配置智能语音机器人的实现方法、装置和存储介质。本技术的技术方案如下:
6.第一方面,提供了一种可配置智能语音机器人的实现方法,所述方法包括:
7.获取多个会话场景中的各所述会话场景的样本语料;
8.针对每一所述会话场景,基于所述会话场景的样本语料,生成所述会话场景的场景特征,所述场景特征包括所述会话场景的特征词以及对所述特征词映射转换得到的特征词序列;
9.基于预设的词向量空间模型以及各所述会话场景的场景特征,对所述智能语音机器人进行配置,所述词向量空间模型用以供所述智能语音机器人对用户会话与各所述会话场景的场景特征进行词向量相似度计算,以识别所述用户会话的意图场景。
10.进一步地,所述针对每一所述会话场景,基于所述会话场景的样本语料,生成所述会话场景的场景特征,包括:
11.针对每一所述会话场景,基于预设的领域词典,获取所述会话场景的样本语料的离散表示;
12.基于所述会话场景的样本语料的离散表示,采用特征选择算法提取所述会话场景的特征词;
13.对所述会话场景的特征词映射转换到对应的词典索引,生成所述会话场景的特征词序列;
14.优选地,所述特征选择算法为卡方统计特征选择算法。
15.进一步地,所述方法还包括:
16.将各所述会话场景与各所述会话场景的场景特征保存至场景特征关系表中;
17.优选地,所述方法还包括:
18.接收针对任一所述会话场景输入的配置特征词;
19.基于所述会话场景的配置特征词以及对所述配置特征词映射转换得到的配置特征词序列,对所述场景特征关系表中的该会话场景的场景特征进行维护;
20.优选地,所述接收针对任一所述会话场景输入的配置特征词,包括:
21.接收具有特征配置权限的用户针对所述会话场景输入的配置特征词。
22.进一步地,所述基于所述会话场景的配置特征词以及对所述配置特征词映射转换得到的配置特征词序列,对所述场景特征关系表中的该会话场景的场景特征进行维护,包括:
23.在所述场景特征关系表中,将所述会话场景的配置特征词合并到所述会话场景的特征词中,并将合并后的所述配置特征词的配置特征词序列添加到所述会话场景的特征词序列中。
24.进一步地,所述词向量空间模型是采用如下方式训练得到:
25.使用各会话场景所属领域的领域语料对预训练后的bert词向量空间进行训练,得到所述词向量空间模型。
26.进一步地,所述方法还包括:
27.针对任一所述会话场景,接收第一用户对所述会话场景输入的状态转移图,并接收第二用户对所述状态转移图输入的补充信息,以生成所述会话场景的状态转移矩阵;
28.基于所述会话场景的状态转移矩阵,生成用于包含状态转移逻辑关系的脚本文件,并基于所述脚本文件,生成有限状态机,以用于在识别出用户会话的意图场景时返回相应的话术。
29.进一步地,所述方法还包括:
30.配置好的所述智能语音机器人接收到用户会话后,对所述用户会话进行预处理以获取所述用户会话中的多个分词,并对所述多个分词进行映射转换,获得所述用户会话的特征词序列;
31.基于所述用户会话的特征词序列以及各所述会话场景的特征词序列,使用所述词向量空间模型构建所述用户会话的特征向量以及各所述会话场景的场景特征向量;
32.对所述用户会话的特征向量与各所述会话场景的场景特征向量进行相似度计算,
基于相似度计算结果,识别所述用户会话的意图,以返回所述意图对应的话术。
33.第二方面,提供了一种可配置智能语音机器人的实现装置,所述装置包括:
34.获取模块,用于获取多个会话场景中的各所述会话场景的样本语料;
35.生成模块,用于针对每一所述会话场景,基于所述会话场景的样本语料,生成所述会话场景的场景特征,所述场景特征包括所述会话场景的特征词以及对所述特征词映射转换得到的特征词序列;
36.配置模块,用于基于预设的词向量空间模型以及各所述会话场景的场景特征,对所述智能语音机器人进行配置,所述词向量空间模型用以供所述智能语音机器人对用户会话与各所述会话场景的场景特征进行词向量相似度计算,以识别所述用户会话的意图场景。
37.进一步地,所述生成模块包括:
38.表示单元,用于针对每一所述会话场景,针对每一所述会话场景,基于预设的领域词典,获取所述会话场景的样本语料的离散表示;
39.筛选单元,用于基于所述会话场景的样本语料的离散表示,采用特征选择算法提取所述会话场景的特征词;
40.生成单元,用于对所述会话场景的特征词映射转换到对应的词典索引,生成所述会话场景的特征词序列;
41.优选地,所述特征选择算法为卡方统计特征选择算法。
42.进一步地,所述装置还包括:
43.保存模块,用于将各所述会话场景与各所述会话场景的场景特征保存至场景特征关系表中;
44.优选地,所述装置还包括:
45.接收模块,用于接收针对任一所述会话场景输入的配置特征词;
46.维护模块,用于基于所述会话场景的配置特征词以及对所述配置特征词映射转换得到的配置特征词序列,对所述场景特征关系表中的该会话场景的场景特征进行维护;
47.优选地,所述接收模块用于接收具有特征配置权限的用户针对所述会话场景输入的配置特征词。
48.进一步地,所述维护模块用于在所述场景特征关系表中,将所述会话场景的配置特征词合并到所述会话场景的特征词中,并将合并后的所述配置特征词的配置特征词序列添加到所述会话场景的特征词序列中。
49.进一步地,所述装置还包括训练模块,所述训练模块用于使用各会话场景所属领域的领域语料对预训练后的bert词向量空间进行训练,得到所述词向量空间模型。
50.进一步地,所述装置还包括状态机配置模块,所述状态机配置模块用于:
51.针对任一所述会话场景,接收第一用户对所述会话场景输入的状态转移图,并接收第二用户对所述状态转移图输入的补充信息,以生成所述会话场景的状态转移矩阵;
52.基于所述会话场景的状态转移矩阵,生成用于包含状态转移逻辑关系的脚本文件,并基于所述脚本文件,生成有限状态机,以用于在识别出用户会话的意图场景时返回相应的话术。
53.进一步地,所述装置还包括意图场景识别模块,所述意图场景识别模块包括:
54.获取单元,用于配置好的所述智能语音机器人接收到用户会话后,对所述用户会话进行预处理以获取所述用户会话中的多个分词,并对所述多个分词进行映射转换,获得所述用户会话的特征词序列;
55.构建单元,用于基于所述用户会话的特征词序列以及各所述会话场景的特征词序列,使用所述词向量空间模型构建所述用户会话的特征向量以及各所述会话场景的场景特征向量;
56.匹配单元,用于对所述用户会话的特征向量与各所述会话场景的场景特征向量进行相似度计算,基于相似度计算结果,识别所述用户会话的意图,以返回所述意图对应的话术。
57.第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下操作步骤:
58.获取多个会话场景中的各所述会话场景的样本语料;
59.针对每一所述会话场景,基于所述会话场景的样本语料,生成所述会话场景的场景特征,所述场景特征包括所述会话场景的特征词以及对所述特征词映射转换得到的特征词序列;
60.基于预设的词向量空间模型以及各所述会话场景的场景特征,对所述智能语音机器人进行配置,所述词向量空间模型用以供所述智能语音机器人对用户会话与各所述会话场景的场景特征进行词向量相似度计算,以识别所述用户会话的意图场景。
61.第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如下操作步骤:
62.获取多个会话场景中的各所述会话场景的样本语料;
63.针对每一所述会话场景,基于所述会话场景的样本语料,生成所述会话场景的场景特征,所述场景特征包括所述会话场景的特征词以及对所述特征词映射转换得到的特征词序列;
64.基于预设的词向量空间模型以及各所述会话场景的场景特征,对所述智能语音机器人进行配置,所述词向量空间模型用以供所述智能语音机器人对用户会话与各所述会话场景的场景特征进行词向量相似度计算,以识别所述用户会话的意图场景。
65.本技术提供一种可配置智能语音机器人的实现方法、装置和存储介质,通过获取多个会话场景中的各会话场景的样本语料;针对每一会话场景,基于会话场景的样本语料,生成会话场景的场景特征,场景特征包括会话场景的特征词以及对特征词映射转换得到的特征词序列;基于预设的词向量空间模型以及各会话场景的场景特征,对智能语音机器人进行配置,词向量空间模型用以供智能语音机器人对用户会话与各会话场景的场景特征进行词向量相似度计算,以识别用户会话的意图场景。采用本技术提供的技术方案,针对同一业务领域,无论何种业务场景,都能够以一套通用的智能语音机器人解决方案进行处理,避免了对同一业务线的不同产品或不同客群进行特定ivr(interactive voice response,互动式语音应答)的场景会话时,需要各自开发不同语音机器人的尴尬局面,能够实现共同会话场景之间的跨任务复用,极大地降低了营销机器人的开发成本和定制化服务的门槛。
附图说明
66.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
67.图1为本技术提供的可配置智能语音机器人的实现整体框架图;
68.图2为一个实施例中的可配置智能语音机器人的实现方法的流程示意图;
69.图3为图2所示方法中步骤202的流程示意图;
70.图4为一个实施例中的场景特征维护的流程示意图;
71.图5为一个实施例中的逻辑实体配置的流程示意图;
72.图6为一个实施例中的前台状态转移图画板效果图;
73.图7为一个实施例中的表示状态转移矩逻辑关系的json文件形式的示意图;
74.图8为一个实施例中的意图场景识别的流程示意图;
75.图9为一个实施例中的可配置智能语音机器人的实现装置的结构示意图;
76.图10为本技术实施例提供的一种计算机设备的内部结构图。
具体实施方式
77.为使本技术的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
78.需要说明的是,除非上下文明确要求,否则整个说明书和权利要求书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
79.此外,在本技术的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。
80.如前述背景技术所述,现有技术针对不同的场景类别进行开发智能语音机器人时,需要分别定制化开发,彼此无法迁移复用,这样会导致智能语音机器人的场景开发成本过高,有鉴于此,本技术创新性地提供了一种可配置智能语音机器人的实现方法,能够提供统一接口服务且场景可配置,并通过配套的“智能语音平台”,为业务提供了可视化的操作界面,极大地提高了智能语音机器人的场景开发效率、业务参与体验,在一定程度上解决了机器人逻辑实体无法复用的问题,并提供了对业务友好的开放式的场景配置接口,使业务可以直接参与到机器人实体的训练、生成过程中。
81.图1为本技术提供的可配置智能语音机器人的实现整体框架图。参照图1所示,该框架主要涉及到内部基础配置、外部配置、意图识别以及fsm(finite-state machine,有限状态机)机器人逻辑实体,其中,内部基础配置可以由后台算法开发人员通过相关算法实现,包括内部基础特征(即,场景特征)、内部基础话术以及内部基础逻辑,外部配置可以由前台业务人员通过智能语音机器人后台管理系统的前端进行相应配置,包括对外可配置特
征、对外可配置话术以及对话可配置逻辑。通过采用本技术的技术方案配置生成智能语音机器人后,智能语音机器人可以对框架的输入内容,即对客户语音通过asr(自动语音识别)模块识别转写成的文本内容进行意图场景的识别,并根据有限状态机逻辑实体返回对应的话术内容,进而输出通过tts(text-to-speech,从文本到语音)技术对话术转换成的语音内容。
82.下面通过多个实施例来详细说明本技术的技术方案。
83.在一个实施例中,提供了一种可配置智能语音机器人的实现方法,该方法可以应用于任一计算机设备,例如服务器,服务器可以采用独立的服务器或者是多个服务器组成的服务器集群来实现。如图2所示,该方法可以包括以下步骤:
84.201,获取多个会话场景中的各会话场景的样本语料。
85.这里,多个会话场景包含在预设的会话场景列表中,会话场景列表用于记录特定业务领域的一个或多个会话场景。
86.具体地,可以通过对特定领域语料按照会话场景的类别进行分类标注,得到各个会话场景的样本语料,这里,特定领域语料是指特定的业务领域的语料,例如消费贷电销的客服语料等。应理解,本技术实施例对具体的获取过程不作限定。
87.上述的会话场景可以通过对特定领域语料进行场景抽象而得到,其中,场景抽象是一个从数据到信息再到知识的过程。示例性地,针对消费贷电销领域,可以通过分析消费贷产品的电销对话日志,在业务人员的指导下,梳理出电销活动的常见会话场景,例如“征信相关问题”、“额度相关问题”、“利息相关问题”、“操作咨询”等,根据总结归类出的若干场景将客服会话日志中的语句进行标注。例如,针对消费贷电销活动的应用,可以抽象出如下表1所示的会话场景:
88.表1:消费贷电销的会话场景
89.序号会话场景1征信相关2利息相关3额度相关4操作咨询5再联系6肯定7否认8终止要求9未知
90.在实际应用中,可以将每个会话场景抽象为一个会话状态(state),客服和客户的对话过程抽象为在会话状态之间的转移。如果把会话状态作为节点,则会话状态之间的有向连线就是一个状态向另一个状态转移的过程,那样整个对话过程都可以抽象为由节点和有向连线构成的图(graph)。
91.202,针对每一会话场景,基于会话场景的样本语料,生成会话场景的场景特征,场景特征包括会话场景的特征词以及对特征词映射转换得到的特征词序列。
92.具体地,可以对每个会话场景的样本语料进行基于词袋模型(word of bag,wob)
的内容转换,获得每个会话场景的样本语料的离散表示,然后基于每个会话场景的样本语料的离散表示,通过采用特征选择算法提取每个会话场景的特征词,之后再对每个会话场景的特征词进行映射转换到预设的领域词典的词典索引,得到每个会话场景的特征词序列。
93.上述的词袋模型可以将一个语料文本划分成一个个词,想象成将所有词放入一个袋子里,忽略其词序、语法、句法等要素,将其仅仅看作是若干个词汇的集合,文本中每个词的出现都是独立的,不依赖于其他词是否出现,其中,词袋模型可以采用one-hot(也叫独热编码)、tf-idf或n-gram模型。
94.示例性地,对于“征信相关”会话场景的5个特征词:[“征信”,“人行”,“报告”,“个人信用”,“风控”],映射转换到对应领域词典中的索引序号为[12,223,166,17,62],即得到“征信相关”会话场景的特征词序列。
[0095]
优选地,针对每一会话场景,基于会话场景的样本语料,生成会话场景的场景特征步骤之后,方法还可以包括:
[0096]
将各会话场景与各会话场景的场景特征保存至场景特征关系表中。
[0097]
具体地,将每个会话场景的名称、特征词以及特征词序列对应保存至场景特征关系表中。其中,场景特征关系表用于保存会话场景以及场景特征(包含特征词以及特征词序列)之间的对应关系。
[0098]
示例性地,消费贷电销活动的场景特征关系表可以参照表2所示。
[0099]
表2:消费贷电销活动的场景特征关系表
[0100]
序号会话场景特征词特征词序列1征信相关['征信','人行'][12,223]2利息相关['额度','放贷额','借贷额','金额'][2,12,13,9]3额度相关['利息','利率','金额'][3,5,9]4操作咨询['操作','办理','设置','配置'][8,103,198,210]
…………
[0101]
在实际应用中,上述的场景特征关系表保存到服务器中,由后台算法技术人员基于定期的文本数据挖掘工作进行离线维护,并对前台业务人员隔离。
[0102]
203,基于预设的词向量空间模型以及各会话场景的场景特征,对智能语音机器人进行配置,词向量空间模型用以供智能语音机器人对用户会话与各会话场景的场景特征进行词向量相似度计算,以识别用户会话的意图场景。
[0103]
本实施例中,通过基于词向量空间模型以及各会话场景的场景特征之间的对应关系,对智能语音机器人进行配置,这样在实际应用中,可以基于词向量空间模型以及各个会话场景的场景特征,对用户会话的意图场景进行识别。具体来说,智能语音机器人与用户进行会话时,可以获取通过自动语音识别技术(automatic speech recognition,asr)对用户会话语音识别转换得到的用户会话文本,并提取出用户会话文本中的特征信息,进而根据词向量空间模型对用户会话与各会话场景的场景特征进行词向量相似度计算,基于词向量相似度计算结果识别出用户会话的意图场景。
[0104]
在一个示例中,上述的词向量空间模型可以采用如下方式训练得到,包括:
[0105]
使用各会话场景所属领域的领域语料对预训练后的bert词向量空间进行训练,得
到所述词向量空间模型。
[0106]
这里,领域语料是指各会话场景所属的特定业务领域的语料,例如消费贷电销的客服语料等。
[0107]
本实施例中,可以通过引入google bert_serving中预训练的大规模bert(bidirectional encoder representations from transformers)词向量空间(768维),获得当前硬件资源无法实现的基于大规模语料和高计算成本的pre-trained embedding。在此基础上,通过带入自有的业务客服语料进行bert词向量空间进行再训练,实现对bert词向量的校准,能够使之更符合特定业务场景。
[0108]
采用本实施例的技术方案,针对同一业务领域,无论何种业务场景,都能够以一套通用的智能语音机器人解决方案进行处理,避免了对同一业务线的不同产品或不同客群进行特定ivr(interactive voice response,互动式语音应答)的场景会话时,需要各自开发不同语音机器人的尴尬局面,能够实现共同会话场景之间的跨任务复用,并且业务场景可扩展,从而极大地降低了营销机器人的开发成本和定制化服务的门槛。
[0109]
在一个实施例中,如图3所示,上述步骤202针对每一会话场景,基于会话场景的样本语料,生成会话场景的场景特征,可以包括:
[0110]
301,针对每一会话场景,基于预设的领域词典,获取会话场景的样本语料的离散表示。
[0111]
具体地,可以基于去除停用词的全量分词语料创建领域词典,该领域词典包括语料中出现的全量有效词汇,基于该领域字典对目标会话场景的所有样本语料进行基于词袋模型的内容转换,得到离散表示,即将语料转换为如下表达形式:
[0112]
[(词在字典的索引,词在文档的词频)]
[0113]
例如,有一包含4个词的基础字典[“我”,“你”,“讨厌”,“爱”,“南京”,“家乡”],则语句“我/爱/我/家乡/南京”通过词袋转写后为[(0,2),(3,1),(4,1),(5,1)]。
[0114]
302,基于会话场景的样本语料的离散表示,采用特征选择算法提取会话场景的特征词。
[0115]
具体地,完成词袋转换后,得到目标会话场景的样本语料的离散表示,之后可以采用特征选择算法提取目标会话场景的特征词。
[0116]
优选地,特征选择算法为卡方统计特征选择算法。
[0117]
本实施例中,可以基于卡方统计(chi-square statistic,chi)技术进行目标会话场景的特征词提取。在具体实施过程中,可以按照如下表3形式以及chi计算公式目标会话场景的特征词提取。
[0118]
表3:类别与文档归属
[0119]
文档归属类别c文档数非类别c文档数包含t文档数ab不包含t文档数cd
[0120]
chi计算公式:
[0121]
[0122]
其中,c是某一类别(class),即“会话场景”,t是某一词条(term),n是训练语料中的文本总数。
[0123]
上述χ2在统计学上一般用于卡方假设检验,用于判断实际分布与理论分布的一致性或拟合优度,其无效假设h0为“观察频数和期望频数没有显著差别”。所以卡方统计量越小,观察频数和期望频数越接近,两者的相关性越高。所以χ2可以看作是观察对象和期望对象之间距离的一种度量,距离学校,两者相关性越高。本技术中“观察对象”是词条,期望对象是会话场景,如果词条和会话场景存在高度相关性,则两者在整体样本中的统计分布应该接近。因而通过χ2统计量,可以基于大量语料,较快、较准确计算字典中所有词汇与各类别之间的相关性,根据相关性排序结果选择χ2最小的预设数量的词(预设数量可以设置为5个)作为会话场景的特征集,完成场景列表中各场景/类的特征映射。
[0124]
303,对会话场景的特征词映射转换到对应的词典索引,生成会话场景的特征词序列。
[0125]
具体地,对目标会话场景的特征词通过领域词典的词典索引映射转换,得到目标会话场景的特征词序列。
[0126]
示例性地,假设通过步骤302提取出的“征信相关”会话场景的5个特征词汇为[“征信”,“人行”,“报告”,“个人信用”,“风控”],那么经过词典索引映射转换,可以得到对应字典中的索引序号为[12,223,166,17,62],即目标会话场景的特征词序列。
[0127]
在现有技术中,针对样本语料通常会采用诸如word2vec、glove或elmo等词向量模型生成词向量,而由于生成的词向量中还隐藏着词语的抽象维度,使得用户无法维护和拓展,本技术实施例通过针对每一会话场景,基于预设的领域词典,获取会话场景的样本语料的离散表示,以及采用特征选择算法提取目标会话场景的特征词并映射转换为特征词序列,由于目标会话场景的特征词以及特征词序列能够表示为具体的词,因此能够便于用户进行可视化维护和拓展,从而为业务人员和算法人员合作开发智能语音机器人的场景特征提供了可能性。
[0128]
在一个实施例中,如图4所示的场景特征维护的流程示意图,方法还包括:
[0129]
401,接收针对任一会话场景输入的配置特征词。
[0130]
具体地,接收用户通过系统前端针对目标会话场景输入的配置特征词,这里的用户是指业务人员,比如客服人员,在具体实现过程中,前端可以提供业务人员对业务领域进行维护的“特征关系扩展”功能,业务人员在前端选择特定会话场景选项,并从输入框键入自己根据业务知识和经验总结提炼出的场景高相关词汇,以作为目标会话场景的配置特征词,系统接收到配置特征词后会经过后台评审更新到该目标会话场景的外部输入特征集中。
[0131]
其中,接收针对任一会话场景输入的配置特征词,该过程可以包括:
[0132]
接收具有特征配置权限的用户针对会话场景输入的配置特征词。
[0133]
本实施例中,由于来自外部的配置特征词可能因为业务人员经验和水平的差异而存在质量不稳定的问题,因此可以通过构建特征配置权限列表,将外部特征配置权限仅开放给经验丰富、经过挑选的部分业务人员。
[0134]
402,基于会话场景的配置特征词以及对配置特征词映射转换得到的配置特征词序列,对场景特征关系表中的该会话场景的场景特征进行维护。
[0135]
在一个示例中,步骤402的实现过程可以包括:
[0136]
在场景特征关系表中将会话场景的配置特征词合并到会话场景的特征词中,并将合并后的配置特征词的配置特征词序列添加到会话场景的特征词序列中。
[0137]
具体地,对目标会话场景输入的配置特征词进行基本的去重、纠错处理后,会直接添加到场景特征关系表中的该目标会话场景的特征词中,并进行特征词序列映射。最终合并结果如下表4所示:
[0138]
表4:内外配置合并后的场景特征关系表
[0139][0140]
需要说明的是,如果外部输入的配置特征词未包含领域词典中,那么会对该配置特征词进行忽略,例如表4中“人民银行”一词不在领域词典中时,则在合并特征词序列时会直接忽略该词。于本实施例中,通过基于会话场景的配置特征词以及对配置特征词映射转换得到的配置特征词序列,对场景特征关系表中的该会话场景的场景特征进行维护,能够克服传通过“业务定义需求,技术开发应用”的“前后台”工作模式,通过“内外配置共同定义”的模式实现了业务人员和技术人员合作开发营销机器人,极大缓解了传统机器人开发模式中存在的“开发和生产的脱离、需求和响应的错配”的问题。
[0141]
在一个实施例中,如图5所示的逻辑实体配置的流程示意图,方法还包括:
[0142]
501,针对任一会话场景,接收第一用户对会话场景输入的状态转移图,并接收第二用户对状态转移图输入的补充信息,以生成会话场景的状态转移矩阵。
[0143]
其中,第一用户是指业务人员,第二用户是指算法开发技术人员。
[0144]
502,基于会话场景的状态转移矩阵,生成用于包含状态转移逻辑关系的脚本文件,并基于脚本文件,生成有限状态机,以用于在识别出用户会话的意图场景时返回相应的话术。
[0145]
其中,有限状态机(finite-state machine,fsm),又称有限状态自动机,简称状态机,是表示有限个状态以及这些状态之间的转移和动作等行为的数学模型。其作用主要是描述对象在它的生命周期内所经历的状态序列,以及如何响应来自外界的各种事件,进行状态之间的转移。状态机包括4个要素:现状、条件、动作、次态。现态是当前所处的状态;条件又称为“事件”,当条件被满足时将会触发一个动作或执行一次状态迁移;动作是指条件满足后执行的动作,动作执行完毕后,可以迁移到新的状态,也可以仍旧保持原状态,动作不是必需的,当条件满足后,也可以不执行任何动作,直接迁移到新状态;次态是指条件满足后要迁往的新状态。“次态”是相对于“现态”而言的,“次态”一旦被激活,就转变成新的“现态”了。有限状态机的逻辑关系可以表示为如下表5的状态转移矩。
[0146]
表5:fsm状态转移矩
[0147][0148]
这里“动作”是指满足“触发条件”后“现态”转换为“次态”的变化过程。
[0149]
在实际应用中,业务人员在前端平台画板拖拽完成基础状态转移图的绘制后,后台会生成一个可能不完整的状态转移矩。前台状态转移图画板效果可以参照图6所示。考虑到业务技术能力的限制,很难保证状态转移矩对“逻辑完整性”的基本要求,所以一般会由后台技术人员每天定时对这些新生成的状态转移矩进行修补,使之符合表5所示的状态。有限状态机模型可以抽象为如下模式的组合:
[0150][0151]
当识别出用户会话的意图场景时,即可以通过有限状态机的逻辑实体返回对应话术内容。其中“会话场景”即为“条件/事件”。例如,现态为“问候”状态,条件/事件为“额度相关”会话场景,触发执行动作后转移至次态“咨询额度”状态。下一轮对话中,“咨询额度”作为现态,条件/事件为“否定”,触发执行动作后转移至次态“未成交”状态。这样即完成了一个完整的客服对话过程。其状态转移逻辑如下:
[0152][0153]
上述修补完整的fsm状态转移矩会由程序自动转译成json格式的脚本文件。
[0154]
在实际应用中,针对消费贷活动,表示其状态转移矩逻辑关系的json脚本文件形式可以参照图7所示。该json脚本文件随后会在生成有限状态机实例时由程序读取录入到状态机对象中,使逻辑生效。生成的状态机实例会根据前端传递的uuid作为索引值存入到redis中,便于后续ivr服务启动时的程序访问。用户也可根据需要对状态机进行持久化操作,便于长期稳定的调用该状态机。如果用户在前端选择了任务类型为“单次任务”,则存储在redis中的该任务的有限状态机实例会在触发ivr营销服务后的预设时间段(例如24小时)内,作为失效对象清除掉,以节约存储资源。
[0155]
采用本实施例的技术方案,相较于传统根据业务场景需求离线训练营销机器人实例的开发方式而言,由于传统开发方式依赖固化的配置文件和状态转移逻辑,一旦业务侧的环境发生变化,如需要对逻辑或话术进行修改,研发侧的改造成本和风险巨大,而本实施例采用的前端配置、后台转译的方式,保证了机器人对配置信息更新的及时响应,并且配置文件和程序应用解耦,使得机器人核心组件——fsm的更新简单、轻便。而话术部分也依赖前台维护,实现了及时生效。
[0156]
此外,在实际应用中,根据产品需求,开发人员自主完成业务逻辑抽象、状态转移图构建,但是整个机器人开发过程缺乏业务的直接参与和监督,而机器人最终的应用效果又极大依赖于对业务背景和商业环境的理解,这在很大程度上造成了开发和生产的脱离、
需求和响应的错配。而本实施例的技术方案能够克服传统“业务定义需求,技术开发应用”的“前后台”工作模式,通过“内外配置共同定义”的模式实现了业务人员和技术人员合作开发智能语音机器人,极大缓解了传统机器人开发模式中存在的“开发和生产的脱离、需求和响应的错配”的问题。
[0157]
在一个实施例中,如图8所示的意图场景识别的流程示意图,方法还包括:
[0158]
801,配置好的智能语音机器人接收到用户会话后,对用户会话进行预处理以获取用户会话中的多个分词,并对多个分词进行映射转换,获得用户会话的特征词序列。
[0159]
具体地,配置生成智能语音机器人后,智能语音机器人可以与用户进行会话,用户会话可以是对用户会话语音通过自动语音识别技术(automatic speech recognition,asr)识别转写成的文本内容,该文本内容经过分词处理,得到多个分词,其中的分词处理过程包括字符纯化、纠错、分词、去停用词。对多个分词通过领域字典的索引映射转换成和场景特征关系表中会话场景的“特征词序列”一样的表示形式,即得到用户会话的特征词序列。
[0160]
802,基于用户会话的特征词序列以及各会话场景的特征词序列,使用所述词向量空间模型构建用户会话的特征向量以及各会话场景的场景特征向量。
[0161]
在一个示例中,步骤802的实现过程可以包括:
[0162]
使用词向量空间模型,分别对用户会话的特征词序列以及场景特征关系表中各会话场景的特征词序列进行映射,生成用户会话的特征向量以及各会话场景的场景特征向量。
[0163]
具体来说,将用户会话的特征词序列中的每一个元素映射到bert词向量空间中,获得一个768维的特征向量,将所有元素求和平均(或取最大、或取中间值),获得一个1
×
768的向量作为用户会话输入的特征表达。相应地,对场景特征关系表中各会话场景的特征词序列进行同样的操作,分别转换为1
×
768的特征向量。
[0164]
803,对用户会话的特征向量与各会话场景的场景特征向量进行相似度计算,基于相似度计算结果,识别用户会话的意图,以返回意图对应的话术。
[0165]
具体地,针对每一个会话场景,计算用户会话输入的特征向量与该会话场景的场景特征向量之间的余弦相似度,数值越大,相似度越高,用户会话和该会话场景的相关性也越高。通过将所有会话场景根据余弦相似度计算结果进行降序排列,返回相似度最高的会话场景,作为用户本次输入的意图场景判断结果,并根据有限状态机的当前所处状态,返回该意图场景下对应的应答话术(pattern),其中,应答话术会通过tts(text-to-speech,从文本到语音)技术转换成语音内容以播放给用户,应答话术形式可以参照表6所示。
[0166]
表6:状态话术关系表
[0167][0168]
采用本实施例的技术方案,通过基于用户会话的特征词序列以及各会话场景的特征词序列,使用词向量空间模型构建用户会话的特征向量以及各会话场景的场景特征向量,以及对用户会话的特征向量与各会话场景的场景特征向量进行相似度匹配,以识别出用户会话的意图场景,能够提高用户会话意图识别结果的准确度。
[0169]
应理解,虽然上述各个流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述各流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0170]
在一个实施例中,提供了一种可配置智能语音机器人的实现装置,该装置用于执行上述实施例中的可配置智能语音机器人的实现方法。如图9所示,该实现装置可以包括:
[0171]
获取模块901,用于获取多个会话场景中的各会话场景的样本语料;
[0172]
生成模块902,用于针对每一会话场景,基于会话场景的样本语料,生成会话场景的场景特征,场景特征包括会话场景的特征词以及对特征词映射转换得到的特征词序列;
[0173]
配置模块903,用于预设的词向量空间模型以及各会话场景的场景特征,对智能语音机器人进行配置,词向量空间模型用以供智能语音机器人对用户会话与各会话场景的场景特征进行词向量相似度计算,以识别用户会话的意图场景。
[0174]
在一个实施例中,生成模块902可以包括:
[0175]
表示单元,用于针对每一会话场景,针对每一会话场景,基于预设的领域词典,获取会话场景的样本语料的离散表示;
[0176]
筛选单元,用于基于会话场景的样本语料的离散表示,采用特征选择算法提取会话场景的特征词;
[0177]
生成单元,用于对会话场景的特征词映射转换到对应的词典索引,生成会话场景的特征词序列;
[0178]
优选地,特征选择算法为卡方统计特征选择算法。
[0179]
在一个实施例中,装置还可以包括:
[0180]
保存模块904,用于将各会话场景与各会话场景的场景特征保存至场景特征关系表中;
[0181]
接收模块905,用于接收针对任一会话场景输入的配置特征词;
[0182]
维护模块906,用于基于会话场景的配置特征词以及对配置特征词映射转换得到的配置特征词序列,对场景特征关系表中的该会话场景的场景特征进行维护;
[0183]
优选地,接收模块905用于接收具有特征配置权限的用户针对会话场景输入的配置特征词。
[0184]
在一个实施例中,维护模块906用于在场景特征关系表中,将会话场景的配置特征词合并到会话场景的特征词中,并将合并后的配置特征词的配置特征词序列添加到会话场景的特征词序列中。
[0185]
在一个实施例中,装置还可以包括训练模块,训练模块用于使用各会话场景所属领域的领域语料对预训练后的bert词向量空间进行训练,得到词向量空间模型。
[0186]
在一个实施例中,装置还包括状态机配置模块907,状态机配置907模块用于:
[0187]
针对任一会话场景,接收第一用户对会话场景输入的状态转移图,并接收第二用户对状态转移图输入的补充信息,以生成会话场景的状态转移矩阵;
[0188]
基于会话场景的状态转移矩阵,生成用于包含状态转移逻辑关系的脚本文件,并基于脚本文件,生成有限状态机,以用于在识别出用户会话的意图场景时返回相应的话术。
[0189]
在一个实施例中,装置还包括意图场景识别模块908,意图场景识别模块908包括:
[0190]
获取单元,用于配置好的智能语音机器人接收到用户会话后,对用户会话进行预处理以获取用户会话中的多个分词,并对多个分词进行映射转换,获得用户会话的特征词序列;
[0191]
构建单元,用于基于用户会话的特征词序列以及各会话场景的特征词序列,使用词向量空间模型构建用户会话的特征向量以及各会话场景的场景特征向量;
[0192]
匹配单元,用于对用户会话的特征向量与各会话场景的场景特征向量进行相似度计算,基于相似度计算结果,识别用户会话的意图,以返回意图对应的话术。
[0193]
关于可配置智能语音机器人的实现装置的具体限定可以参见上文中对于可配置智能语音机器人的实现方法的限定,在此不再赘述。上述可配置智能语音机器人的实现装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0194]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该服务器包括通过系统总线连接的处理器、存储器、网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与其他设备通过网络连接通信。该计算机程序被处理器执行时以实现一种可配置智能语音机器人的实现方法。
[0195]
本领域技术人员可以理解,图10中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不生成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设
备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0196]
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
[0197]
针对每一会话场景,基于会话场景的样本语料,生成会话场景的场景特征,场景特征包括会话场景的特征词以及对特征词映射转换得到的特征词序列;
[0198]
基于预设的词向量空间模型以及各会话场景的场景特征,对智能语音机器人进行配置,词向量空间模型用以供智能语音机器人对用户会话与各会话场景的场景特征进行词向量相似度计算,以识别用户会话的意图场景。
[0199]
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
[0200]
针对每一会话场景,基于会话场景的样本语料,生成会话场景的场景特征,场景特征包括会话场景的特征词以及对特征词映射转换得到的特征词序列;
[0201]
基于预设的词向量空间模型以及各会话场景的场景特征,对智能语音机器人进行配置,词向量空间模型用以供智能语音机器人对用户会话与各会话场景的场景特征进行词向量相似度计算,以识别用户会话的意图场景。
[0202]
综上,与现有技术相比,本技术实施例的技术方案能够达到以下技术效果:
[0203]
1、采用本技术的可配置智能语音机器人,研发成本综合考量可节省约60%。尤其是针对营销场景比较集中在个别业务领域时,较之传统模式,本技术可节约成本与场景个数成正相关;
[0204]
2、本技术采用的前端配置生效模式,使机器人可以根据业务环境的变化安全、稳定、轻便的进行更新,并隔日生效,给业务方带来极大的便捷,同时提升了技术侧的运行稳定性;
[0205]
3、结合前端平台,业务人员可直接参与到营销机器人的核心组件研发过程,极大提升了业务人员的满意度和参与感;
[0206]
4、该机器人配合前端语音服务平台,为业务方提供了一整套从“需求提出”到“智能语音机器人生成”到“ivr电销启动”再到“反馈调整需求”的闭环解决方案,能够实现对客户智能营销ivr需求的一步响应。
[0207]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0208]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛
盾,都应当认为是本说明书记载的范围。
[0209]
以上实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1