本发明涉及客户投诉智能诊断技术领域,特别是涉及一种移动通信客户投诉的诊断方法及系统。
背景技术:
随着电信行业的不断发展,移动通信运营商所提供的服务日益丰富,同时使用人群也在不断的扩大。当客户使用移动终端的各种服务时,若遇到基础通信问题时,如通讯质量差,网络信号差以及不能上网,往往会向移动通讯运营商进行投诉,并希望得到尽快处理。而随着客户投诉量的不断增多,如何有效处理客户投诉问题,提高客户满意度愈发重要。
目前,运营商进行投诉处理的方法主要有:
(1)构建客户关系管理系统,其注重与客户之间的交流,及时了解客户需求,从而及时有效地处理客户投诉问题。
(2)构建客户投诉管理系统,其偏重“投诉一体化”流程,从而将客户投诉受理过程与处理过程关联起来,并增强客服人员处理投诉的能力。
(3)构建客服系统,其侧重投诉渠道的拓展,如增加客服服务渠道,采用在线客服等,从而使得客户投诉更加便捷。
然而,现有处理方式主要解决的是客户投诉渠道多样化以及投诉处理流程的优化,对投诉信息的分析能力有限。而对客户投诉信息的诊断,尤其是非结构化文本信息的诊断多为人工分析,依赖于经验丰富的技术人员。
客服人员在接到客户投诉后,如果遇到在自身权限范围内能够解决的,则迅速给出回复;如果遇到移动通信质量问题,则将投诉工单传递至后台的技术支撑部门进行具体处理和解答。技术支撑部门接到投诉工单后,由经验丰富的技术专家进行诊断,分析引起投诉的原因,给出相应的处理意见,并交由相关网络建设或维护部门进行处理,同时将处理结果反馈给客户。显然上述方法对客户投诉信息的诊断多为人工分析,依赖于经验丰富的技术人员,因此存在人工分析方式效率低下,人力成本高,并容易产生误判,从而导致客户投诉升级,降低客户满意度等问题。
技术实现要素:
本发明的目的是提供一种移动通信客户投诉的诊断方法及系统,以实现提高诊断的准确率以及处理效率。
为实现上述目的,本发明提供了一种移动通信客户投诉的诊断方法,所述诊断方法包括:
获取移动通信客户投诉工单;
判断所述移动通信客户投诉工单是否同时包含客户信息和投诉文本描述,获得第一判断结果;如果第一判断结果表示为不同时包含客户信息和投诉文本描述,则删除所述移动通信客户投诉工单;如果第一判断结果表示为同时包含客户信息和投诉文本描述,则从各所述移动通信客户投诉工单中提取客户信息和投诉文本描述;所述客户信息包括:手机号、投诉时间和投诉地点;
根据所述投诉文本描述提取文本特征,获得投诉文本特征;
根据所述客户信息,通过云端数据库访问接口访问所述客户信息对应的云端数据库资源,获取相对应的关键要素特征;
构建投诉智能诊断模型;
将所述投诉文本特征和所述关键要素特征输入所述客户投诉智能诊断模型对所述移动通信客户投诉工单进行诊断,获得投诉结果;所述投诉结果为弱覆盖、故障、干扰、热点、客户原因中的任一种。
可选的,所述根据所述投诉文本描述提取文本特征,获得投诉文本特征,具体包括:
对所述投诉文本描述进行分词,去除停用词,获得关键词;
采用tf-idf算法,根据所述关键词进行文本特征提取,获得投诉文本特征。
可选的,所述构建投诉智能诊断模型,具体包括:
根据多个历史通信客户投诉工单构建数据集;所述数据集包括从各所述历史通信客户投诉工单中获得的历史关键要素特征、历史投诉文本特征、历史真实的分类结果;
根据所述数据集构建s个数据子集;其中,s为大于等于1的整数;
根据各所述数据子集构建与各所述数据子集对应的支持向量机基分类器;
将s个数据子集分别输入各所述支持向量机基分类器中,获得s个预测的分类结果;
根据各所述预测的分类结果,利用证据推理规则进行结果合成,确定投诉智能诊断模型。
可选的,所述根据所述数据集构建s个数据子集,具体包括:
根据所述数据集确定各历史关键要素特征的信息增益值和各历史投诉文本特征的信息增益值;
将各历史关键要素特征的信息增益值和各历史投诉文本特征的信息增益值进行归一化处理,获得特征权重;
根据所述特征权重,对所述数据集中的特征进行随机采样,抽取出s个数据子集。
可选的,所述根据各所述预测的分类结果,利用证据推理规则进行结果合成,确定投诉智能诊断模型,具体包括:
将各所述预测的分类结果转换为证据;
根据各所述预测的分类结果与各所述预测的分类结果对应的历史真实的分类结果确定各所述支持向量机基分类器预测的准确率;
将各所述支持向量机基分类器预测的准确率作为证据的初始权重;
将各所述支持向量机基分类器预测的准确率作为证据的初始可靠性值;
根据所述证据的初始权重和各所述证据确定各证据的加权信度;
根据各证据的初始可靠性值和加权信度进行多条证据合成,获得最终预测的各分类结果对应的概率;
从最终预测的各分类结果对应的概率中选取概率最大的类别作为最终预测的分类结果;
根据最终预测的分类结果和所述历史真实的分类结果确定误差值;
采用非线性优化计算方法缩小所述误差值、优化权重,根据相邻的两个误差值确定误差变化值;
判断所述误差变化值是否小于设定阈值,获得第二判断结果;如果所述第二判断结果为小于设定阈值,则输出投诉智能诊断模型;如果所述第二判断结果为大于或等于设定阈值,则将优化后的权重作为证据的初始权重,并返回步骤“将各所述支持向量机基分类器预测的准确率作为证据的初始可靠性值”。
本发明还提供一种移动通信客户投诉的诊断系统,所述诊断系统包括:
获取模块,用于获取移动通信客户投诉工单;
判断模块,用于判断所述移动通信客户投诉工单是否同时包含客户信息和投诉文本描述,获得第一判断结果;如果第一判断结果表示为不同时包含客户信息和投诉文本描述,则删除所述移动通信客户投诉工单;如果第一判断结果表示为同时包含客户信息和投诉文本描述,则从各所述移动通信客户投诉工单中提取客户信息和投诉文本描述;所述客户信息包括:手机号、投诉时间和投诉地点;
提取模块,用于根据所述投诉文本描述提取文本特征,获得投诉文本特征;
访问模块,用于根据所述客户信息,通过云端数据库访问接口访问所述客户信息对应的云端数据库资源,获取相对应的关键要素特征;
构建模块,用于构建投诉智能诊断模型;
诊断模块,用于将所述投诉文本特征和所述关键要素特征输入所述客户投诉智能诊断模型对所述移动通信客户投诉工单进行诊断,获得投诉结果;所述投诉结果为弱覆盖、故障、干扰、热点、客户原因中的任一种。
可选的,所述提取模块,具体包括:
分词单元,用于对所述投诉文本描述进行分词,去除停用词,获得关键词;
提取单元,用于采用tf-idf算法,根据所述关键词进行文本特征提取,获得投诉文本特征。
可选的,所述构建模块,具体包括:
第一构建单元,用于根据多个历史通信客户投诉工单构建数据集;所述数据集包括从各所述历史通信客户投诉工单中获得的历史关键要素特征、历史投诉文本特征、历史真实的分类结果;
第二构建单元,用于根据所述数据集构建s个数据子集;其中,s为大于等于1的整数;
第三构建单元,用于根据各所述数据子集构建与各所述数据子集对应的支持向量机基分类器;
输入单元,用于将s个数据子集分别输入各所述支持向量机基分类器中,获得s个预测的分类结果;
合成单元,用于根据各所述预测的分类结果,利用证据推理规则进行结果合成,确定投诉智能诊断模型。
可选的,所述第二构建单元,具体包括:
信息增益值确定子单元,用于根据所述数据集确定各历史关键要素特征的信息增益值和各历史投诉文本特征的信息增益值;
归一化处理子单元,用于将各历史关键要素特征的信息增益值和各历史投诉文本特征的信息增益值进行归一化处理,获得特征权重;
抽取子单元,用于根据所述特征权重,对所述数据集中的特征进行随机采样,抽取出s个数据子集。
可选的,所述合成单元,具体包括:
转换子单元,用于将各所述预测的分类结果转换为证据;
准确率确定子单元,用于根据各所述预测的分类结果与各所述预测的分类结果对应的历史真实的分类结果确定各所述支持向量机基分类器预测的准确率;
第一赋值子单元,用于将各所述支持向量机基分类器预测的准确率作为证据的初始权重;
第二赋值子单元,用于将各所述支持向量机基分类器预测的准确率作为证据的初始可靠性值;
加权信度确定子单元,用于根据所述证据的初始权重和各所述证据确定各证据的加权信度;
概率确定子单元,用于根据各证据的初始可靠性值和加权信度进行多条证据合成,获得最终预测的各分类结果对应的概率;
第三赋值子单元,用于从最终预测的各分类结果对应的概率中选取概率最大的类别作为最终预测的分类结果;
误差值确定子单元,用于根据最终预测的分类结果和所述历史真实的分类结果确定误差值;
误差变化值确定子单元,用于采用非线性优化计算方法缩小所述误差值、优化权重,根据相邻的两个误差值确定误差变化值;
判断子单元,用于判断所述误差变化值是否小于设定阈值,获得第二判断结果;如果所述第二判断结果为小于设定阈值,则输出投诉智能诊断模型;如果所述第二判断结果为大于或等于设定阈值,则将优化后的权重作为证据的初始权重,并返回“第二赋值子单元”。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明先获取移动通信客户投诉工单;其次根据所述投诉文本描述提取文本特征,获得投诉文本特征;根据所述客户信息,通过云端数据库访问接口访问所述客户信息对应的云端数据库资源,获取相对应的关键要素特征;然后构建投诉智能诊断模型;最后将所述投诉文本特征和所述关键要素特征输入所述客户投诉智能诊断模型对所述移动通信客户投诉工单进行诊断,获得投诉结果;不仅能够提高诊断的准确度,还能提高客户投诉的处理效率,降低劳动力成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例移动通信客户投诉的诊断方法流程图;
图2为本发明实施例移动通信客户投诉的诊断系统结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种移动通信客户投诉的诊断方法及系统,以实现提高诊断的准确率以及处理效率。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例移动通信客户投诉的诊断方法流程图,如图1所示,本发明提供一种移动通信客户投诉的诊断方法,所述一种移动通信客户投诉的诊断方法,其特征在于,所述诊断方法包括:
步骤s1:获取移动通信客户投诉工单;
步骤s2:判断所述移动通信客户投诉工单是否同时包含客户信息和投诉文本描述,获得第一判断结果;如果第一判断结果表示为不同时包含客户信息和投诉文本描述,则删除所述移动通信客户投诉工单;如果第一判断结果表示为同时包含客户信息和投诉文本描述,则从各所述移动通信客户投诉工单中提取客户信息和投诉文本描述;所述客户信息包括:手机号、投诉时间和投诉地点;
步骤s3:根据所述投诉文本描述提取文本特征,获得投诉文本特征;
步骤s4:根据所述客户信息,通过云端数据库访问接口访问所述客户信息对应的云端数据库资源,获取相对应的关键要素特征;
步骤s5:构建投诉智能诊断模型;
步骤s6:将所述投诉文本特征和所述关键要素特征输入所述客户投诉智能诊断模型对所述移动通信客户投诉工单进行诊断,获得投诉结果;所述投诉结果为弱覆盖、故障、干扰、热点、客户原因中的任一种。
下面对各个步骤进行详细论述:
本发明为了更清楚解释,给出了投诉文本描述的示例,但并不限于以下两种描述:
示例1:用户表示无法主叫,网络忙,在每天早上7点左右都不行,可以被叫,满格。
示例2:用户反映该地区的信号不稳定。无法正常使用。打电话经常断断续续。四格。
步骤s3:根据所述投诉文本描述提取文本特征,获得投诉文本特征,具体包括:
步骤s31:对所述投诉文本描述进行分词,去除停用词,获得关键词;
步骤s32:采用tf-idf算法,根据所述关键词进行文本特征提取,获得投诉文本特征。
步骤s4:根据所述客户信息,通过云端数据库访问接口访问所述客户信息对应的云端数据库资源,获取相对应的关键要素特征;具体的,所述云端数据库资源包括移动通信运营商已有的网优检测系统、基站设备系统、营帐系统、网络建设和规划系统、干扰信息库、人群密集度动态分布信息库等各类系统和数据库。
关键要素特征包括:
(1)拟建设区域(是/否):用来判断该投诉地点是否已列入网络建设规划中;
(2)基站状况(良好/故障):用来判断该投诉地点的移动终端所使用的基站或信号放大器是否正常工作;
(3)干扰区域(是/否):用来判断该投诉地点是否有信号干扰源;
(4)干扰时段(是/否):用来判断该投诉时间是否有信号干扰源;
(5)热点区域(是/否):用来判断该投诉地点是否属于人口密集分布区域,如工厂、学校等;
(6)热点时段(是/否):用来判断该投诉时间是否属于人口密集分布时段,如上下班高峰期;
(7)手机制式匹配(是/否):表示该投诉手机所采用的制式与当地网络的最佳制式是否匹配。
步骤s5:构建投诉智能诊断模型,具体包括:
步骤s51:根据多个历史通信客户投诉工单构建数据集;所述数据集包括从各所述历史通信客户投诉工单中获得的历史关键要素特征、历史投诉文本特征、历史真实的分类结果;本发明根据历史通信客户投诉工单提取历史关键要素特征、历史投诉文本特征、历史真实的分类结果与上边提取根据通信客户投诉工单提取关键要素特征、投诉文本特征的方法相同,在此不再一一论述。
步骤s52:根据所述数据集构建s个数据子集;其中,s为大于等于1的整数,具体包括:
步骤s521:根据所述数据集确定各历史关键要素特征的信息增益值和各历史投诉文本特征的信息增益值,具体公式为:
其中,ig(y,x)为各历史关键要素特征的信息增益值或各历史投诉文本特征的信息增益值,y为历史真实的分类结果,所述历史真实的分类结果包括弱覆盖、故障、干扰、热点、客户原因,y∈y为历史真实的分类结果中的任一种,x为特征要素,所述特征要素包括关键要素特征和文本特征,x∈x为特征要素中的任一种,h(y)为历史真实的分类结果y的熵值,h(y|x)为加入特征要素x之后历史真实的分类结果y的熵值,p(y)为结果y的边际密度函数,p(x)特征x的边际密度函数,p(y|x)为加入特征x后,y的边际密度函数。
步骤s522:将各历史关键要素特征的信息增益值和各历史投诉文本特征的信息增益值进行归一化处理,获得特征权重w;将特征权重w做为每个特征的抽取概率。
步骤s523:根据所述特征权重,对所述数据集中的特征进行随机采样,抽取出s个数据子集,各数据子集中包括r个从数据集中提取的特征,其中r为大于等于1的整数。
步骤s53:根据各所述数据子集构建与各所述数据子集对应的支持向量机基分类器;
步骤s54:将s个数据子集分别输入各所述支持向量机基分类器中,获得s个预测的分类结果;所述预测的分类结果为ys={(y1,p1),(y2,p2),…,(y5,p5)},s∈s,其中yj∈y,j为小于等于5的整数,pj为0或1。
步骤s55:根据各所述预测的分类结果,利用证据推理规则进行结果合成,确定投诉智能诊断模型,具体包括:
步骤s551:将各所述预测的分类结果转换为证据,具体公式为:
其中,es为第s个预测的分类结果转换的证据,yj为第j类分类结果,
步骤s552:根据各所述预测的分类结果与各所述预测的分类结果对应的历史真实的分类结果确定各所述支持向量机基分类器预测的准确率;
步骤s553:将各所述支持向量机基分类器预测的准确率作为证据的初始权重;
步骤s554:将各所述支持向量机基分类器预测的准确率作为证据的初始可靠性值;
步骤s555:根据所述证据的初始权重和各所述证据确定各证据的加权信度,具体公式为:
其中,
步骤s556:根据各证据的初始可靠性值和加权信度进行多条证据合成,获得最终预测的各分类结果对应的概率,具体公式为:
其中,
步骤s557:从最终预测的各分类结果对应的概率中选取概率最大的类别作为最终预测的分类结果;
步骤s558:根据最终预测的分类结果和所述历史真实的分类结果确定误差值,具体公式为:
其中,m为样本总数,ui为第i个样本的最终预测的分类结果对应的向量,vi为第i个样本的历史真实的分类结果对应的向量,de(ui-vi)为两个向量之间的欧式距离。
例如,最终预测的分类结果为y1,ui则为(1,0,0,0,0);若历史分类结果为y2,则vi为(0,1,0,0,0)。
步骤s559:采用非线性优化计算方法缩小所述误差值、优化权重,根据相邻的两个误差值确定误差变化值;
步骤s560:判断所述误差变化值是否小于设定阈值,获得第二判断结果;如果所述第二判断结果为小于设定阈值,则输出投诉智能诊断模型;如果所述第二判断结果为大于或等于设定阈值,则将优化后的权重作为证据的初始权重,并返回步骤“将各所述支持向量机基分类器预测的准确率作为证据的初始可靠性值”。
图2为本发明实施例移动通信客户投诉的诊断系统结构图,如图2所示,本发明还提供一种移动通信客户投诉的诊断系统,所述诊断系统包括:
获取模块1,用于获取移动通信客户投诉工单;
判断模块2,用于判断所述移动通信客户投诉工单是否同时包含客户信息和投诉文本描述,获得第一判断结果;如果第一判断结果表示为不同时包含客户信息和投诉文本描述,则删除所述移动通信客户投诉工单;如果第一判断结果表示为同时包含客户信息和投诉文本描述,则从各所述移动通信客户投诉工单中提取客户信息和投诉文本描述;所述客户信息包括:手机号、投诉时间和投诉地点;
提取模块3,用于根据所述投诉文本描述提取文本特征,获得投诉文本特征;
访问模块4,用于根据所述客户信息,通过云端数据库访问接口访问所述客户信息对应的云端数据库资源,获取相对应的关键要素特征;
构建模块5,用于构建投诉智能诊断模型;
诊断模块6,用于将所述投诉文本特征和所述关键要素特征输入所述客户投诉智能诊断模型对所述移动通信客户投诉工单进行诊断,获得投诉结果;所述投诉结果为弱覆盖、故障、干扰、热点、客户原因中的任一种。本发明还可以将弱覆盖、故障、干扰、热点、客户原因之外的各种情况全部归为其他。
下面对各个模块进行详细论述:
所述提取模块3,具体包括:
分词单元,用于对所述投诉文本描述进行分词,去除停用词,获得关键词;
提取单元,用于采用tf-idf算法,根据所述关键词进行文本特征提取,获得投诉文本特征。
所述构建模块5,具体包括:
第一构建单元,用于根据多个历史通信客户投诉工单构建数据集;所述数据集包括从各所述历史通信客户投诉工单中获得的历史关键要素特征、历史投诉文本特征、历史真实的分类结果;
第二构建单元,用于根据所述数据集构建s个数据子集;其中,s为大于等于1的整数;
第三构建单元,用于根据各所述数据子集构建与各所述数据子集对应的支持向量机基分类器;
输入单元,用于将s个数据子集分别输入各所述支持向量机基分类器中,获得s个预测的分类结果;
合成单元,用于根据各所述预测的分类结果,利用证据推理规则进行结果合成,确定投诉智能诊断模型。
所述第二构建单元,具体包括:
信息增益值确定子单元,用于根据所述数据集确定各历史关键要素特征的信息增益值和各历史投诉文本特征的信息增益值;
归一化处理子单元,用于将各历史关键要素特征的信息增益值和各历史投诉文本特征的信息增益值进行归一化处理,获得特征权重;
抽取子单元,用于根据所述特征权重,对所述数据集中的特征进行随机采样,抽取出s个数据子集。
所述合成单元,具体包括:
转换子单元,用于将各所述预测的分类结果转换为证据;
准确率确定子单元,用于根据各所述预测的分类结果与各所述预测的分类结果对应的历史真实的分类结果确定各所述支持向量机基分类器预测的准确率;
第一赋值子单元,用于将各所述支持向量机基分类器预测的准确率作为证据的初始权重;
第二赋值子单元,用于将各所述支持向量机基分类器预测的准确率作为证据的初始可靠性值;
加权信度确定子单元,用于根据所述证据的初始权重和各所述证据确定各证据的加权信度;
概率确定子单元,用于根据各证据的初始可靠性值和加权信度进行多条证据合成,获得最终预测的各分类结果对应的概率;
第三赋值子单元,用于从最终预测的各分类结果对应的概率中选取概率最大的类别作为最终预测的分类结果;
误差值确定子单元,用于根据最终预测的分类结果和所述历史真实的分类结果确定误差值;
误差变化值确定子单元,用于采用非线性优化计算方法缩小所述误差值、优化权重,根据相邻的两个误差值确定误差变化值;
判断子单元,用于判断所述误差变化值是否小于设定阈值,获得第二判断结果;如果所述第二判断结果为小于设定阈值,则输出投诉智能诊断模型;如果所述第二判断结果为大于或等于设定阈值,则将优化后的权重作为证据的初始权重,并返回“第二赋值子单元”。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。