一种95598客户诉求处理方法、设备及存储介质与流程

文档序号:30946217发布日期:2022-07-30 05:20阅读:232来源:国知局
一种95598客户诉求处理方法、设备及存储介质与流程

1.本发明属于计算机通信技术领域,涉及一种基于多模型融合的95598客户诉求处理方法、设备及存储介质。


背景技术:

2.随着社会经济的不断发展及生活水平的日益提高,电力客户消费意识越来越强,传统的供电服务已经无法满足客户日常需求,电力客户越来越需要多样化、差异化的服务。同时,由于其他各行业市场化程度提高,社会整体服务水平日益提升,电力客户对供电服务的需求类型越来越多,期望值也越来越高。
3.95598热线作为国家电网有限公司的统一热线服务窗口,每天业务量 20-30万通,借由电话渠道,客户的诉求、情绪、期望都集中于此过程,对语音转译文本开展深入研究意义巨大。国网客服中心致力于为客户提供更好的服务,作为与电力客户接触的一线单位,对服务风险非常重视,同时这些风险也是公司总部、各省(市)公司关注的问题,在这样的服务指导模式下,风险的分析、处理、管控显得尤为重要。
4.因此,基于海量客户服务语音数据借助人工神经网络技术,可以全面、深入、准确地了解客户需求、客户期望及服务情况,能够帮助公司快速发现服务短板,有效开展精准服务,不断提升客户服务水平。
5.95598客服电话产生的海量语音数据蕴藏了大量的客户实际诉求和关注热点。基于海量客户服务语音数据是基于统计的学习方法,自然语言处理中越来越多地使用机器自动学习的方法来获取语言知识。从充分利用数据资源,改善供电服务质量,增强客户粘性角度出发,通过建立多模融合的语义分析模型,对海量语音通话内容进行智能化分析归纳,挖掘客户原始诉求,辅助开展工单处理,提高服务的准确性、针对性,推动现代服务体系建设。
6.然而,在文本内容分类、文本情感分析这类,需要对文本内容进行识别的应用场景下,要求精确地提取,判别文本的语义内容。而目前传统的基于统计的技术方案,无法做到精确的语义分类,进而无法实现精准服务的开展。
7.实际工程上的经验,采用一层的bilstm网络对语料进行处理,由于有些电话的对话语句很长,无法有效的保留全部特征,因此分类识别效果不佳, self-attention网络对于长句的特征提取,有更好的性能表现,而目前流行的做法是采用多层的self-attention组合来做语义提取,google的bert就是12层的self-attention组合,但是这种网络结构的缺点是对计算资源占用极大,需要专业的,多台gpu服务器,才能获得理想的处理速度。


技术实现要素:

8.本发明的目的是提供一种95598客户诉求处理方法,该方法是基于多模型融合的处理方法,能够在较低的计算资源下,实现对文本语义的提取,特征的生成,然后对比不同文本语义特征,以达到判断文本内容的目的。
9.本发明采取的技术方案如下:
10.本发明实施例提供一种95598客户诉求处理方法,包括以下步骤:
11.s101、数据分词
12.对客户的语音转译文本数据进行预处理,首先要对数据进行分句,去掉无效句,然后对每句话的词,进行分词处理,获得分词后的结果数据;
13.s102、数据向量化
14.分词后的结果数据生成词向量;
15.具体为:将分词后的结果数据全部进行向量化,转化为能够被神经网络处理的一串数字,根据全部的词组,对这串数字,建立一个向量空间,然后用每个向量来表示每个词和字,获得词向量。
16.s103、词向量处理
17.将生成的词向量输入客户诉求识别算法模型,通过神经网络结构,提取文本的核心语义,捕捉整个句意中不同词/字在整句句意的语义,根据语义从而识别得到客户的语音转译文本数据的诉求分类;
18.s104、结果输出
19.将所述诉求分类的结果发送至相应的处理端。
20.优选地,步骤s101中分词的原理是通过统计海量的文章和文本,来制作一个字典库的数据库,使用trie型树的数据结构来保存所有的词组,然后根据trie型树,生成一个有相无环图的数据结构。
21.优选地,步骤s101中是使用动态规划算法进行分词的,获得分词结果之后,对语音转译文本格式进行调整,去掉停用词,停用词包括语气助词、副词、介词、连接词。
22.优选地,步骤s103中的客户诉求识别算法模型结合了时序神经网络的记忆力,并从字/词意、句意和文本意三个层级提取文本的核心语义。
23.优选地,步骤s103中在提取文本的核心语义时,同时兼顾句全局和文本全局的不同部分对整个文本语义的贡献。
24.优选地,步骤s103中在提取文本的核心语义时,通过句层的注意力机制把握句意的核心词/字,从而获取整句的语义;通过文本层的注意力机制,获得不同语句的语义,从而识别得到客户语音转译文本数据的诉求分类。
25.优选地,步骤s101至步骤s103是基于如下网络模型实现的:所述网络模型是通过tensorflow框架,搭建双层的bilstm+self-attention+fullyconnected+softmax的网络模型。
26.本发明实施例提供一种95598客户诉求处理系统,所述处理系统用于实现上述一种基于多模型融合的95598客户诉求处理方法,所述处理系统基于如下网络模型实现:所述网络模型是通过tensorflow框架,搭建双层的 bilstm+self-attention+fully connected+softmax的网络模型。
27.本发明实施例提供一种终端设备,包括存储器和处理器:
28.存储器用于存储计算机指令;
29.处理器,用于运行存储器中存储的计算机指令,实现上述基于多模型融合的95598客户诉求处理方法。
30.本发明实施例提供一种存储介质,包括可读存储介质和计算机指令,所述计算机
指令存储在所述可读存储介质中,所述计算机指令用于实现上述一种基于多模型融合的95598客户诉求处理方法。
31.本发明实施例提供一种计算机程序产品,包括计算机指令,计算机指令用于实现上述一种基于多模型融合的95598客户诉求处理方法。
32.本发明的优点:
33.本发明使用bilstm+self-attention组合的网络模型,寻求了一个性能和计算量的均衡,能够在较低的计算资源下,实现对文本语义的提取,特征的生成,然后对比不同文本语义特征,以达到判断文本内容的目的。
34.本发明构建bilstm+self-attention+fully connected+softmax 多模融合模型,通过self-attention结构,捕捉整个句意中不同词/字对整句句意的语义贡献,实现字/词语义特征的再编码。该模型从字/词意——句意——文本意三个层级提取文本的核心语义,结合了时序神经网络的记忆力,又兼顾句全局和文本全局的不同部分对整个文本语义的贡献。句层的注意力机制精准的把握句意的核心词/字,从而获取整句的语义;文本层的注意力机制,又获得不同语句对最终分类任务的作用,从而识别得到统文的诉求分类。
35.同时,不同的诉求被发送至对应的处理端,各个处理端获得精准的诉求信息进行后续处理,能够有效开展精准服务,提升了客户服务水平。
36.本发明兼顾了性能与计算资源消耗,双方面的考虑,在尽可能保证信息准确度的情况下,大大降低了对计算资源的消耗,可以以较低的代价,就获得比较理想的结果。
附图说明
37.图1是本发明的诉求分析原理图;
38.图2是本发明实施例提供的诉求处理流程示意图;
39.图3是本发明的有相无环图的数据结构示意图;
40.图4是本发明终端设备的结构示意图。
具体实施方式
41.客服中心每天会接到海量的客户来电,如果可以将所有的来电根据来电诉求进行准确的分类,那么客服中心就可以对客户来电的情况有清晰的掌握。本发明的处理方法,就是对来电诉求进行分类。
42.本发明针对的都是来电通话的文本,而通话语音到文本的转译工作,由客户现有的转译系统完成。
43.本发明处理方法采用神经网络技术,构基于客户服务语音数据的电力客户诉求识别模型,能够快速、准确地挖掘出客户在致电95598过程中提出的诉求内容,通过客户服务数据识别客户服务过程中存在的风险,从而便于精准服务的开展。
44.图2是本发明实施例提供的一种基于多模型融合的95598客户诉求处理方法的流程图,该处理方法涉及的网元包括终端设备中的部分或者全部、网络设备的部分或者全部。下面以终端设备和网络设备为执行主体对本发明的处理方法进行说明,如图2,该方法包括以下步骤:
45.s101、终端设备执行数据分词
46.对客户的语音转译文本数据进行预处理,首先要对数据进行分句,去掉无效句,然后对每句话的词,进行分词处理,获得分词后的结果数据;
47.s102、终端设备执行数据向量化
48.分词后的结果数据生成词向量;
49.具体为:将分词后的结果数据全部进行向量化,转化为能够被神经网络处理的一串数字,根据全部的词组,对这串数字,建立一个向量空间,然后用每个向量来表示每个词和字,获得词向量。
50.s103、终端设备向执行词向量处理
51.将生成的词向量输入客户诉求识别算法模型,通过神经网络结构,提取文本的核心语义,捕捉整个句意中不同词/字在整句句意的语义,根据语义从而识别得到客户的语音转译文本数据的诉求分类;
52.s104、终端设备执行结果输出
53.终端设备将诉求分类的结果发送至网络设备相应的处理端;这样,不同的诉求被发送至对应的处理端,各个处理端获得精准的诉求信息进行后续处理,降低了对计算资源的消耗,保证了服务精准性,提升了客户服务水平。
54.一些实施例中,步骤s101中分词的原理是通过统计海量的文章和文本,来制作一个字典库的数据库,使用trie型树的数据结构来保存所有的词组,然后根据trie型树,生成一个有相无环图的数据结构;
55.步骤s101中是使用动态规划算法进行分词的,获得分词结果之后,对语音转译文本格式进行调整,去掉停用词,停用词包括语气助词、副词、介词、连接词。
56.一些实施例中,步骤s103中的客户诉求识别算法模型结合了时序神经网络的记忆力,并从字/词意、句意和文本意三个层级提取文本的核心语义;
57.步骤s103中在提取文本的核心语义时,同时兼顾句全局和文本全局的不同部分对整个文本语义的贡献;
58.步骤s103中在提取文本的核心语义时,还通过句层的注意力机制把握句意的核心词/字,从而获取整句的语义;通过文本层的注意力机制,获得不同语句的语义,从而识别得到客户语音转译文本数据的诉求分类。
59.本发明处理方法,是基于如下网络模型实现:该网络模型是通过 tensorflow框架,搭建双层的bilstm+self-attention+fully connected +softmax的网络模型。
60.本发明的客户诉求处理原理说明见图1:
61.(一)模型构建
62.通过tensorflow框架,搭建双层的bilstm+self-attention+fullyconnected+softmax网络模型,用于客户诉求识别。
63.根据我们实际工程上的经验,采用一层的bilstm网络对语料进行处理,由于有些电话的对话语句很长,无法有效的保留全部特征,因此分类识别效果不佳,self-attention网络对于长句的特征提取,有更好的性能表现,而目前流行的做法是采用多层的self-attention组合来做语义提取,google的 bert就是12层的self-attention组合,但是这种网络结构的缺点是对计算资源占用极大,需要专业的,多台gpu服务器,才能获得理想的处理速度。但是考虑到实际情况,我们的计算资源有限,因此需要寻求一个折中的设计方案。
因此,我们使用bilstm+self-attention组合的网络模型,寻求一个性能和计算量的均衡。
64.(二)数据处理
65.1.中文分词。
66.语音转译文本无法直接作为网络模型的输入数据,需要对数据进行预处理,首先要对数据进行分句,去掉无效句,然后对每句话的词,进行分词处理,中文语句都是连续的词组组成的,中间并没有进行分隔,而网络模型本身不具备识别词组的能力,因此需要先对每句话中的词组进行分隔。
67.分词的原理是通过统计海量的文章,文本,来制作一个叫字典库的数据库,使用了trie型树的数据结构来保存所有的词组,然后根据trie型树,生成一个叫有相无环图的数据结构,示意图如图3。
68.图中每个节点上的字,与其他所有可能组成词组的字均有连接,因此有可能一个字对应多个字,这也是对应中文断句中有可能出现多种断句可能性的情况,同时,每个字也都是有权重的,这个权重就是在海量文本中统计的词频,因此接下来使用动态规划算法就可以获得一句话的最佳分词结果。
69.在获得分词结果之后,对文本格式进行调整,去掉停用词。(为了提高对文字的处理效率,通常在进行文字处理之前,会将一些无意义的词过滤掉,这些过滤掉的词,叫停用词。一般是语气助词、副词、介词、连接词等,比如常见的“的”,“在”这类词)
70.2.向量化。
71.神经网络无法像人一样,直接理解每个词,因此需要将词字转化为神经网络可以处理的一串数字,这串数字,目前普遍的转换方式,是根据全部的词组,建立一个向量空间,然后用每个向量来表示每个词,字。例如:
72.你,我,他,三个词可以生成一个维度为3的向量空间[0,0,0],如果是你,向量表示为[1,0,0],我[0,1,0],他[0,0,1],实际当中,汉字词语组成的向量空间会是一个几千位长的向量,此例仅为示意说明。
[0073]
将中文分词后的结果数据生成词向量。考虑到电力客服内容词汇的专业性和语音识别中不可避免的识别错误、语义间断、口语化等现象,因此,将词和字全部进行向量化,将其语义传递给后面的分析网络从而提高信息提取的准确性。
[0074]
(三)结果输出
[0075]
将语音转译文本数据的处理结果输入客户诉求识别算法模型,通过神经网络结构,捕捉整个句意中不同词/字对整句句意的语义贡献,实现字/词语义特征的再编码。该模型从字/词意——句意——文本意三个层级提取文本的核心语义,结合了时序神经网络的记忆力,又兼顾句全局和文本全局的不同部分对整个文本语义的贡献。句层的注意力机制精准的把握句意的核心词/ 字,从而获取整句的语义;文本层的注意力机制,又获得不同语句对最终分类任务的作用,从而识别得到统文的诉求分类。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1