一种工单投诉风险预控方法与流程

文档序号:29126649发布日期:2022-03-05 00:13阅读:来源:国知局

技术特征:
1.一种工单投诉风险预控方法,其特征在于:包括以下步骤:s1、输入训练数据集和测试数据集,检测数据分布情况并统计信息,同时对数据进行预处理;s2、对变量进行筛选,删除对回归模型影响不显著或自相关性较强的变量;s3、利用卡方方法对变量进行分箱,对变量进行woe转化,并判断变量的稳定性;s4、建立回归模型,利用训练数据集和测试数据集评价回归模型的准确性;s5、将回归模型转换为标准评分卡,并输出各变量分箱后的分数。2.根据权利要求1所述的工单投诉风险预控方法,其特征在于:s1中检测数据分布情况并统计信息,同时对数据进行预处理,包括:统计数据的缺失比例、最大值、最小值相关信息,确定各字段的长度、类型,将存在异常数据的字段处理为正常数据。3.根据权利要求1所述的工单投诉风险预控方法,其特征在于:s2中对变量进行筛选,删除对回归模型影响不显著或自相关性较强的变量,包括:计算每个变量的信息价值,根据信息价值和变量间自相关性对变量进行筛选,并结合逐步回归删除对回归模型影响不显著或自相关性较强的变量。4.根据权利要求3所述的工单投诉风险预控方法,其特征在于:所述根据信息价值和变量间自相关性对变量进行筛选,包括:保留信息价值大于0.01且变量间自相关性系数大于0.7的变量。5.根据权利要求1所述的工单投诉风险预控方法,其特征在于:s3中利用卡方方法对变量进行分箱,包括:分箱后观察分箱结果,当分箱结果不理想时进行手动调整分箱。6.根据权利要求5所述的工单投诉风险预控方法,其特征在于:s3中对变量进行woe转化,包括:采用下式对变量进行woe转化:其中,i为某个特征的第i个分箱,bad
i
为在第i个分箱中坏标签的数量,bad
t
为坏标签的总数,good
i
为在第i个分箱中好标签的数量,good
t
为好标签的总数。7.根据权利要求6所述的工单投诉风险预控方法,其特征在于:s3中判断变量的稳定性,包括:计算每列特征的psi值,并基于psi值判断变量的稳定性。8.根据权利要求1所述的工单投诉风险预控方法,其特征在于:s4中建立回归模型,利用训练数据集和测试数据集评价回归模型的准确性,包括:利用logistic回归建立回归模型,并对训练数据集和测试数据集进行预测,分别计算两个数据集的ks值和auc值,评价回归模型的准确性。

技术总结
本发明涉及风险控制,具体涉及一种工单投诉风险预控方法,输入训练数据集和测试数据集,检测数据分布情况并统计信息,同时对数据进行预处理,对变量进行筛选,删除对回归模型影响不显著或自相关性较强的变量,利用卡方方法对变量进行分箱,对变量进行WOE转化,并判断变量的稳定性,建立回归模型,利用训练数据集和测试数据集评价回归模型的准确性,将回归模型转换为标准评分卡,并输出各变量分箱后的分数;本发明提供的技术方案能够有效克服现有技术所存在的根据工单内容不能区别客户的敏感性,导致不能向客户提供具有针对性差异化服务的缺陷。的缺陷。的缺陷。


技术研发人员:刘峰 罗玉
受保护的技术使用者:安徽数升数据科技有限公司
技术研发日:2021.12.01
技术公布日:2022/3/4
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1