敏感客户识别方法、系统及存储介质与流程

文档序号:23341593发布日期:2020-12-18 16:38阅读:285来源:国知局
敏感客户识别方法、系统及存储介质与流程

本发明属于电力技术领域,具体涉及基于供电服务客服热线的敏感客户识别方法、系统及存储介质。



背景技术:

电网客户服务热线(95598热线)集自动、人工服务于一体,为客户提供24小时不间断、全方位的一站式服务,提供的服务主要包括:故障报修、服务申请、意见、举报、信息查询、投诉、建议等11大类。其中投诉类工单表明客户存在情绪不满,该类业务引起业务人员重点关注,尽量避免客户投诉事件发生。其他大类中部分客户存在诉求升级的风险,不利于业务人员定位跟踪分析。当前模式下业务人员难以及时准确把控客户诉求风险、识别客户敏感点。

当前诉求相关业务人员依靠人工经验分析历史工单,根据客户工单受理内容、来电数量等关键信息识别敏感客户。但是,该方法难以大量、迅速识别风险客户,对潜在诉求升级客户缺乏有效的识别手段。



技术实现要素:

为此,本发明提供敏感客户识别方法、系统及存储介质,以解决现有技术无法快速、有效识别敏感客户的技术问题。

一方面,本发明采取的技术方案为:敏感客户识别方法,该方法包括以下步骤:

步骤1、数据获取:从数据表中筛选重点字段,数据表包括客服热线工单、回访反馈表,重点字段包括工单编号、工单分类大类、工单分类小类、受理内容、受理时间、处理状态、通话时长及回访内容;

步骤2、数据分析及处理:对所获取的数据进行分析及处理,通过文本解析将文本信息数据化,对客服热线工单中的客户编号进行补全;

步骤3、构建指标体系:将经过步骤2分析处理后的数据生成指标体系,指标体系中设有对敏感客户识别的参考指标;所构建的指标体系作为建模分群的输入变量;

步骤4、利用em聚类算法将样本数据划分类群;

步骤5、分析类群特征:分析每个类群特征和不同类群间差异,分析各个类群的数据分布情况,挖掘数据的集中和离散趋势,基于业务可解释性总结类群特征;

步骤6、固化识别规则:基于步骤5的类群特征分析成果并引入专家经验,生成符合业务经验的敏感客户的最终识别规则,精准定位敏感客户。

另一方面,本发明还采取如下技术方案:敏感客户识别系统,包括:

数据获取模块:从数据表中筛选重点字段,数据表包括客服热线工单、回访反馈表,重点字段包括工单编号、工单分类大类、工单分类小类、受理内容、受理时间、处理状态、通话时长及回访内容;

数据分析及处理模块:对所获取的数据进行分析及处理,通过文本解析将文本信息数据化,对客服热线工单中的客户编号进行补全;

指标体系构建模块:将经过数据分析及处理模块分析处理后的数据生成指标体系,指标体系中设有对敏感客户识别的参考指标;所构建的指标体系作为建模分群的输入变量;

类群划分模块:利用em聚类算法将样本数据划分类群;

类群特征分析模块:分析每个类群特征和不同类群间差异,分析各个类群的数据分布情况,挖掘数据的集中和离散趋势,基于业务可解释性总结类群特征;

识别规则固化模块:基于类群特征分析成果并引入专家经验,生成符合业务经验的敏感客户的最终识别规则,精准定位敏感客户。

再一方面,本发明还提供存储介质,其上存储有计算机指令,所述计算机指令被处理器执行时,实现本发明敏感客户识别方法的步骤1-步骤6。

本发明与现有技术相比,具有如下优点和有益效果:

本发明建立一种基于供电服务95598客服热线的敏感客户识别方法和系统,将大量文本信息经分词技术、关键词提取转换为数值化指标,通过机器学习算法构建敏感客户识别模型,提炼客户特征并固化为规则,助力业务人员直观、准确、快速掌握客户敏感特征,为降低客户投诉风险、提高服务水平提供数据支撑。

附图说明

图1为本发明基于供电服务客服热线的敏感客户识别方法的流程示意图;

图2是本发明基于供电服务客服热线的敏感客户识别系统的结构方框图。

具体实施方式

下面将结合实施例及附图对本发明的技术方案做进一步详细的描述,但本发明的实施方式不限于此。

实施例

如图1所示,本发明提供了一种基于供电服务客服热线的敏感客户识别方法,包括数据获取、数据分析及处理、构建指标宽表、利用em聚类划分类群、分析类群特征、固化识别规则。具体包括如下步骤:

步骤1、数据获取:对敏感客户的识别主要基于95598客服热线工单、回访反馈表等数据表,从数据表上获取包括工单编号、工单分类大类、工单分类小类、受理内容、受理时间、处理状态、通话时长、回访内容等在内的重点字段。

步骤2、数据分析及处理:

步骤2.1、文本分析及处理:通过分词技术,从所获取的数据中筛选情绪词并分类,对每个客服工单标记情绪特征;通过文本提取,提取催办、回访派单、重复来电次数等关键指标;将回访反馈表中的客户评价数值化。

步骤2.2、数据清洗:95598客服热线工单中的客户编号因客户不愿提供、诉求公共区域事件等现状导致缺失较为严重,需进行补全。通过分析发现,可通过两种方式补全:一是提取客服热线工单的工单编号并关联前序工单,若前序工单中记录客户编号,则可根据该客户编号进行补全。二是将客服热线工单提供的地址与客户档案信息中用电地址进行匹配,补全相关客户编号。

步骤3、构建指标体系:将经过步骤2分析处理后的数据生成指标体系,以客户编号进行聚合,统计客户近半年、近一年、近两年的诉求次数、诉求总电话数、情绪不满次数、投诉次数、重复拨打次数、电话平均时长、回访评价负面得分等,分析客户在不同时间维度上的数据分布情况;并确定最终观测周期为近一年,即12个月。

本步骤所构建的指标体系作为建模分群的主要输入变量。而指标体系中设置的对敏感客户识别的主要参考指标如表1所示,包括两大类,第一大类为直接计算的指标,第二大类为经文本分词后计算的指标。直接计算的指标包括近12个月(即一个观测周期内)诉求总次数、投诉次数、通话平均时长、文本平均长度和非故障类诉求次数。经文本分词后计算的指标包括近12个月(即一个观测周期内)情绪不满/比较不满次数、情绪极其不满/非常不满次数、催办次数、重复来电次数、回访派单次数和回访负面评价总分。各项指标的描述详见表1。

步骤4、利用em聚类算法将样本数据划分类群:

由于客户诉求内容多种多样较为复杂,通过业务经验仅可把握部分特征,难以掌握整体规律。因此利用指标数据,采用无监督的em聚类将样本数据划分为多个类群,支撑下阶段特征分析工作。其中聚类数目设置为1到20,计算每个聚类数目下的bic值,确定最佳聚类数目。

采用em聚类的原因主要是该方法以高斯分布为基础,聚类结果在几何上是椭圆的,适用性更广。em聚类算法主要是计算概率,用一个给定的多元高斯概率分布模型来估计出一个数据点属于一个聚类的概率,即将每一个聚类看作是一个高斯概率分布模型,主要由两步交替进行,通过e-step和m-step的不断交替来增加总的对数似然直到高斯概率分布模型收敛。

以某类敏感客户为例,提取考察期内该类敏感客户诉求工单,采用em聚类算法并设置聚类数目为1到20,系统自动计算每个聚类数据下的bic值,输出最佳聚类数目为9。

步骤5、分析类群特征:

聚类是将样本数据分类到不同的类或者簇的过程,所以同一个类中的对象有很大的相似性,而不同类间的对象有很大的相异性。经步骤4聚类后生成多个类群,本步骤分析每个类群特征和不同类群间差异,分析各个类群的数据分布情况,挖掘数据的集中和离散趋势,基于业务可解释性总结类群特征,帮助业务人员更深入的了解问题及原因,支撑下一步制定识别规则。

步骤5.1、分析每个类群特征:结合业务经验分析类群特征,关注群内数据分布情况和群样本数量。数据分布情况主要是分析关键指标的分布,包括:离群值、四分位点、均值、中位数、众数等,挖掘数据的集中和离散趋势;基于诉求业务事件中大部分客户属于正常客户、少量客户存在敏感性的认知,因此关注群样本数量为重点关注样本数量较少的类群及样本数量较大的边缘样本。

步骤5.2、分析不同类群间差异:基于前述每个类群特征的分析成果,引入极差、均值、方差等维度分析各个类群数据分布与总体样本分布的偏差、不同类群在各个指标数据分布的差异性,分析结果满足业务可解释性。

以某类敏感客户为例,经步骤4聚类后分为互不重叠的9类,分别标注为类群序号1到9;然后依次按照步骤5.1和步骤5.2开展分析,即:

针对类群1开展群特征分析,可得:该类群样本数量最多,占比高达85.60%;类群特征主要表现为一次诉求基本无异议,表明客户致电客服热线一次后问题得以解决,未发生情绪不满、催办、回派、重复来电等行为。按此模式依次对其他类群特征开展分析。

针对9个类群间特征差异开展分析,可得:类群2、3、7分别在情绪不满、催办、投诉指标中数据特征较为明显;类群序号8在回派工单及回访差评中指标中特征较为明显;类群9在催办、回派、不满情绪、重复来电、回访差评多个指标中特征明显。按此模式对其他类群间特征开展分析。

经上述分析,各个类群数量占比、业务说明见下表2。

步骤6、固化识别规则:基于步骤5的类群分析成果并引入专家经验,生成符合业务经验的敏感客户的最终识别规则,快速精准定位敏感客户。

步骤6.1、根据步骤5分析所获得的每个类群特征分布、不同类群间特征差异,生成数据及业务的显性评判;然后圈定部分重点关注的敏感特质数据;最后对疑似正常用户、疑似敏感用户归纳产生基于指标特征组及其阈值组合的初步规则框架。

步骤6.2、引入专家经验,对专家业务中常态化可直接总结的简单敏感客户识别经验进行归总,直接生成判断规则;将专家经验与上述初步规则框架的内容进行结合,评判指标特征组及其阈值组合的合理性;并基于服务能力调整敏感特质数据识别阈值及识别规则,保证敏感客户数量与服务资源匹配;基于调整后的识别阈值和识别规则,抽样被识别群体,开展专家业务验证,论证识别规则的有效性;最后将经过数据分析并结合业务经验的结果固化为敏感客户的最终识别规则。

以某类敏感客户为例,基于步骤5的类群分析成果,重点关注催办、重复来电次数、回派工单、回访差评、诉求总次数、投诉次数等指标,归纳指标特征并根据数据分布设置阈值。如:根据类群1,诉求次数大于2的圈定该类群的边缘样本为“疑似敏感用户”;根据类群7,投诉次数大于1的样本划分为“疑似敏感用户”;类群5各项指标均无明显特征,直接剔除不作研究。不同类群生成不同识别规则见下表3,类群1的识别规则为诉求次数大于2,类群2的识别规则为情绪不满次数大于2,类群3的识别规则为催办次数大于1,类群4的识别规则为重复来电次数大于0,类群7的识别规则为投诉次数大于1,类群8的识别规则为回访派单次数大于0且回访得分小于0,类群6、9的识别规则为回访得分小于负3。

将上述识别规则、识别结果提交专家。专家结合业务经验、现有服务资源评估规则的合理性、识别结果的准确性,并开展指标及阈值的修正工作,如:针对类群序号7得出的“投诉次数大于1次”规则,专家认为工单大类为投诉,表明客户已经存在不满情绪,需慎重处理相关事务,因此将阈值调整为0次,即客户一旦发生投诉行为则划分为敏感群体。最终将满足数据分布及专家经验的结果固化为该类敏感客户识别规则,具体规则见下表4。经专家评议后,类群2的最终提取规则为情绪不满次数大于1,类群7的最终提取规则为投诉次数大于0。

基于相同的构思,本发明还提供一种基于供电服务客服热线的敏感客户识别系统,如图2所示,其包括:

数据获取模块:用于执行上述方法的步骤1,从数据表中筛选重点字段,数据表包括客服热线工单、回访反馈表,重点字段包括工单编号、工单分类大类、工单分类小类、受理内容、受理时间、处理状态、通话时长及回访内容;

数据分析及处理模块:用于执行上述方法的步骤2,对所获取的数据进行分析及处理,通过文本解析将文本信息数据化,对客服热线工单中的客户编号进行补全;

指标体系构建模块:用于执行上述方法的步骤3,将经过数据分析及处理模块分析处理后的数据生成指标体系,指标体系中设有对敏感客户识别的参考指标;所构建的指标体系作为建模分群的输入变量;

类群划分模块:用于执行上述方法的步骤4,利用em聚类算法将样本数据划分类群;

类群特征分析模块:用于执行上述方法的步骤5,分析每个类群特征和不同类群间差异,分析各个类群的数据分布情况,挖掘数据的集中和离散趋势,基于业务可解释性总结类群特征;

识别规则固化模块:用于执行上述方法的步骤6,基于类群特征分析成果并引入专家经验,生成符合业务经验的敏感客户的最终识别规则,精准定位敏感客户。

同样地,基于相同的发明构思,本发明还提供存储介质,存储介质上存储有计算机指令;上述计算机指令被处理器执行时,实现本发明敏感客户识别方法的步骤1-步骤6,完成敏感客户的精准识别。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1