一种高投诉敏感用户风险模型系统及识别方法与流程

文档序号:35680566发布日期:2023-10-08 17:17阅读:73来源:国知局
一种高投诉敏感用户风险模型系统及识别方法与流程

本发明涉及,特别涉及一种高投诉敏感用户风险模型系统及识别方法。


背景技术:

1、在当今社会,随着人们生活意识的不断增强,人们越来越注重保护自己的合法权益,例如:物业服务、电器使用及银行等,人们在生活和工作中经常遇到众多问题和困惑,这时就会想到投诉热线进行反馈,并要求相关的单位给予答复及解决响应问题,但是目前的投诉需要进行文字或电子记录,记录内容比较简单,若是反馈后,则表示当前投诉就完成了,缺少针对投诉较多用户的风险预测,不能对此类用户进行针对性的服务,导致用户体验度较差,不能对此类用户进行更好的服务。

2、现有技术一,申请号:cn202110158341.1公开了一种用户特征数据筛选方法、装置及电子设备,方法包括:获取多个用户的多个特征数据,特征数据中包括多个特征和其对应的特征值;将特征数据中的多个特征进行数值类型变换处理;基于变换后的多个特征和其对应的特征值采用并行计算的方式,分别计算每个特征的映射值;基于每个特征的映射值确定多个特征数据对应的多个信息量;基于信息量由多个特征数据中提取目标特征数据。虽然能够快速准确的由海量用户特征中挑选出关键特征,进而减少模型训练时间,在实际应用中减少模型计算时间,提高用户体验度、减轻服务器系统压力;但是不能对投诉较多的用户进行风险预测,使得用户不能接收到更好的服务。

3、现有技术二,申请号:cn201711171946.4公开了一种风险测评的实现方法和装置,方法包括:接收用户终端发送的风险测评请求,获取用户的风险测评题目;获取用户的测评基础数据,采用测评基础数据生成至少一道风险测评题目的推荐答案;基于推荐答案得到用户的风险模型特征值;根据用户的风险模型特征值生成用户的风险测评结果,并返回给用户的终端。虽然减少了用户的操作,提高了风险测评的效率;但是没有对投诉量较高的用户作出提前识别,并提供个性化服务。

4、现有技术三,申请号:cn201711415665.9公开了一种投诉预测的方法、装置、电子设备和存储介质。方法包括若终端于检测周期内在常驻小区发生回落,则确定回落时长;若回落时长超过预设门限,则将该常驻小区确定为预测投诉小区。虽然通过分析终端在常驻小区的回落时长,有针对性地对终端的常驻小区的网络质量进行投诉预测,可以提高投诉预测的准确性;但是其应用范围有限,仅针对小区投诉,并能给绝大部分的投诉用户进行服务,导致不能对此类用户进行更好的服务。

5、目前现有技术一、现有技术二及现有技术三存在缺少针对告诉诉敏感用户风险的预测模型,不能对此类用户进行针对的信息处理,也就不能对此类用户进行更好的服务,导致用户体验感较差的问题,因而,本发明提供一种高投诉敏感用户风险模型系统及识别方法,通过系统实现对敏感用户的提前识别和预测,进一步提升用户的体验感。


技术实现思路

1、为了解决上述技术问题,本发明提供了一种高投诉敏感用户风险模型系统,其特征在于,包含:

2、数据获取模块,负责获取所有投诉用户的目标特征数据,特征数据包含多个特征及对应的特征值,特征包含:用户投诉内容及解决方式,当特征值达到阈值时,将特征值对应的投诉用户定义为高投诉敏感用户;

3、模型建立模块,负责通过目标特征数据构建训练集,有放回地对训练集进行重采样,每次随机地从所有特征中选择某些特征,某些特征包括投诉原因、投诉类型及投诉次数指标,对特征数据利用某些特征建立决策树,组成由多个决策树构成的随机森林模型;

4、风险测评模块,负责当有新的投诉用户的特征数据时,特征数据输入至随机森林模型,判断新的投诉用户是否属于高投诉敏感用户,若属于高投诉敏感用户,则进行风险模型特征值计算,生成风险测评结果,并反馈至终端进行处理;若不属于高投诉敏感用户,则继续等待新的投诉用户的特征数据的输入。

5、进一步,数据获取模块,包含:

6、数据变换子模块,负责以投诉用户标识做基础将特征数据进行排序,将特征数据的属性、特征值及标签作为列向量;将特征数据的特征值由行向量转换为列向量以将特征数据中的多个表格型的特征转换为引导聚集型数据;

7、特征计算子模块,负责将变换后的多个特征数据和对应的特征值发送到分布式计算系统,并进行计算生成映射值;

8、信息量计算子模块,负责基于每个特征数据的映射值再次进行并行计算以确定多个特征数据对应的多个信息量;

9、特征提取子模块,负责基于信息量由多个特征数据中提取目标特征数据。

10、进一步,模型建立模块,包含:

11、集合构建子模块,负责获取数据获取模块中的目标特征数据,提取目标特征数据对应的高投诉敏感用户,对目标特征数据进行属性约简,采用属性约简后的目标特征数据构建训练集;

12、决策树建立子模块,负责将训练集中的目标特征数据与高投诉敏感用户进行关联,得到具备主体的目标特征数据;有放回地对训练集进行重采样,每次随机地从所有特征中选择投诉原因、投诉类型及投诉次数指标,并建立决策树;

13、模型输出子模块,负责将训练集中的目标特征数据、高投诉敏感用户及决策树来构建由多个决策树构成的随机森林模型。

14、进一步,集合构建子模块,包含:

15、函数定义单元,负责按照外在属性高投诉敏感用户分析目标特征数据的属性重要度,通过评价函数分解成并行计算的评价子函数;属性包含投诉原因、投诉类型及投诉次数指标;属性重要度定位投诉原因、投诉类型及投诉次数指标的权重;

16、属性权重单元,负责采用多线程实现属性和评价子函数的并行计算,通过并行规约计算评价子函数计算得到属性的权重;

17、属性约简单元,负责通过属性的权重对比,利用决策树完成属性的选择,从内在属性投诉原因、投诉类型及投诉次数指标中至少选择一个,得到属性简约后的目标特征数据。

18、进一步,决策树建立子模块,包含:

19、基础决策单元,负责获取随机森林模型的基础决策树,基础决策树基于训练集的目标特征数据生成;

20、分裂值计算单元,负责提取基础决策树的树骨架,树骨架包括节点的分裂特征,且不包括分裂值或包括部分分裂值;其中分裂值通过计算目标特征数据的纯度确定,通过衡量一个目标特征数据的重要性的度量,计算公式为:

21、ig(d,a)=h(d)-∑(|dv|/|d|)×h(dv)

22、其中,d表示当前基础决策树的目标特征数据集,a表示某个目标特征,dv表示目标特征a的某个取值对应的训练集,h(d)表示目标特征数据集d的信息熵,h(dv)表示训练集dv的信息熵,信息增益的值ig(d,a)越大表示特征对于分类任务的重要性越高;

23、目标决策单元,负责利用属性约简后的目标特征数据训练树骨架缺少的分裂值,得到目标决策树。

24、进一步,风险测评模块,包含:

25、数据接收子模块,负责接收新的投诉用户的特征数据,包含投诉原因、投诉类型及投诉次数指标;

26、数据分析子模块,负责将特征数据输入至随机森林模型进行分析,得到投诉的问题和用户的投诉行为模式,得到分析结果;根据分析结果,识别出包含投诉原因、投诉类型及投诉次数指标的关键指标;

27、阈值比对子模块,负责根据关键指标,与随机森林模型预设的投诉的阈值比对,超过阈值的用户被认为是高投诉敏感用户;根据设定的阈值,对高投诉敏感用户的行为进行监测,当高投诉敏感用户的行为符合高投诉敏感用户的特征时,触发相应的处理措施;

28、措施实施子模块,负责对于被识别为高投诉敏感用户的用户,采取措施,加强对投诉的处理和回应,优化产品或服务,提供个性化的解决方案。

29、本发明提供的一种高投诉敏感用户的识别方法,包含以下步骤:

30、获取所有投诉用户的目标特征数据,特征数据包含多个特征及对应的特征值,特征包含:用户投诉内容及解决方式,当特征值达到阈值时,将特征值对应的投诉用户定义为高投诉敏感用户;

31、通过目标特征数据构建训练集,有放回地对训练集进行重采样,每次随机地从所有特征中选择某些特征,某些特征包括投诉原因、投诉类型及投诉次数指标,对特征数据利用某些特征建立决策树,组成由多个决策树构成的随机森林模型;

32、当有新的投诉用户的特征数据时,特征数据输入至随机森林模型,判断新的投诉用户是否属于高投诉敏感用户,若属于高投诉敏感用户,则进行风险模型特征值计算,生成风险测评结果,并反馈至终端进行处理;若不属于高投诉敏感用户,则继续等待新的投诉用户的特征数据的输入。

33、进一步,获取所有投诉用户的目标特征数据的过程,包含以下步骤:

34、以投诉用户标识做基础将特征数据进行排序,将特征数据的属性、特征值及标签作为列向量;将特征数据的特征值由行向量转换为列向量以将特征数据中的多个表格型的特征转换为引导聚集型数据;

35、将变换后的多个特征数据和对应的特征值发送到分布式计算系统,并进行计算生成映射值;

36、基于每个特征数据的映射值再次进行并行计算以确定多个特征数据对应的多个信息量;基于信息量由多个特征数据中提取目标特征数据。

37、进一步,随机森林模型的构建过程,包含以下步骤:

38、获取数据获取模块中的目标特征数据,提取目标特征数据对应的高投诉敏感用户,对目标特征数据进行属性约简,采用属性约简后的目标特征数据构建训练集;

39、将训练集中的目标特征数据与高投诉敏感用户进行关联,得到具备主体的目标特征数据;有放回地对训练集进行重采样,每次随机地从所有特征中选择投诉原因、投诉类型及投诉次数指标,并建立决策树;

40、将训练集中的目标特征数据、高投诉敏感用户及决策树来构建由多个决策树构成的随机森林模型。

41、进一步,随机森林模型对特征数据的处理过程,包含以下步骤:

42、接收新的投诉用户的特征数据,包含投诉原因、投诉类型及投诉次数指标;

43、将特征数据输入至随机森林模型进行分析,得到投诉的问题和用户的投诉行为模式,得到分析结果;根据分析结果,识别出包含投诉原因、投诉类型及投诉次数指标的关键指标;

44、根据关键指标,与随机森林模型预设的投诉的阈值比对,超过阈值的用户被认为是高投诉敏感用户;根据设定的阈值,对高投诉敏感用户的行为进行监测,当高投诉敏感用户的行为符合高投诉敏感用户的特征时,触发相应的处理措施;

45、对于被识别为高投诉敏感用户的用户,采取措施,加强对投诉的处理和回应,优化产品或服务,提供个性化的解决方案。

46、本发明的数据获取模块获取所有投诉用户的目标特征数据,特征数据包含多个特征及对应的特征值,特征包含:用户投诉内容及解决方式等;模型建立模块通过目标特征数据构建训练集,有放回地对训练集进行重采样,每次随机地从所有特征中选择某些特征,某些特征包括投诉原因、投诉类型及投诉次数指标,对特征数据利用某些特征建立决策树,组成由多个决策树构成的随机森林模型;风险测评模块当有新的投诉用户的特征数据时,特征数据输入至随机森林模型,判断新的投诉用户是否属于高投诉敏感用户,若属于高投诉敏感用户,则进行风险模型特征值计算,生成风险测评结果,并反馈至终端进行处理;若不属于高投诉敏感用户,则继续等待新的投诉用户的特征数据的输入;上述方案通过由特征数据建立随机森林模型,一方面在特征数据不足的情况下,建立比较可靠的随机森林模型,另一方面有效保证高投诉敏感用户风险模型预测的精度,不仅实现了高投诉敏感用户的识别准确性,而且能够更好的为高投诉敏感用户进行服务,提升此类用户的服务感受度。

47、本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

48、下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1