一种政企客户信用评分卡生成方法、装置、设备及介质与流程

文档序号:36971528发布日期:2024-02-07 13:21阅读:39来源:国知局
一种政企客户信用评分卡生成方法、装置、设备及介质与流程

本技术涉及通信,尤其涉及一种政企客户信用评分卡生成方法、装置、设备及介质。


背景技术:

1、目前,电信运营商等企业的政企业务发展进入平台期,过去粗放式的经营模式难以为继,急需以客户为中心开展高质量的深度运营。但过去电信运营商对客户的分级主要采用基于规则的简单分级,如行业、收入规模、战略重要性等,导致资源向收入规模大的客户倾斜,也因此带来了较高的应收账款占收比。为平衡客户收入规模和收入质量,有必要对客户应收账款逾期进行评估并据此为客户进行信用评级。

2、现有技术中,使用以图卷积神经网络、深度卷积网络为代表的深度学习算法构建客户信用评级方法。存在信用评分效果不好的问题。


技术实现思路

1、本技术提供一种政企客户信用评分卡生成方法、装置、设备及介质,用以解决现有技术中存在的评分效果不好的问题。

2、第一方面,本技术提供一种政企客户信用评分卡生成方法,包括:

3、获取第一数据集,第一数据集包括初始特征、初始特征的特征值、以及逾期标签,初始特征包括政企客户的回款安全性类型特征、业务结构安全性类型特征、以及经营状况安全性类型特征,逾期标签表征政企客户的逾期类型;

4、根据初始特征、与初始特征对应的特征值,确定初始特征的分箱区间、以及与分箱区间对应的证据权重;

5、根据初始特征的分箱区间、以及与分箱区间对应的证据权重,确定初始特征中的入模特征、入模特征的原始分箱区间、原始分箱区间的原始证据权重、入模特征的入模分箱区间、以及入模分箱区间的入模证据权重;

6、根据第二数据集,对逻辑回归模型进行训练,得到入模特征的权重,第二数据集包括入模特征、入模分箱区间、入模证据权重、以及入模特征的逾期标签;

7、根据原始分箱区间的分数,得到政企客户信用评分卡,原始分箱区间的分数根据入模特征的权重、以及原始分箱区间的原始证据权重得到。

8、在本技术中,根据初始特征、与初始特征对应的特征值,确定初始特征的分箱区间、以及与分箱区间对应的证据权重,包括:

9、确定初始特征的特征值类型;

10、根据初始特征的特征值类型,确定分箱目标,其中,当初始特征的特征值类型为连续型时,分箱目标为初始特征,当初始特征的特征值类型为离散型,分箱目标为初始特征中的每个特征值;

11、根据分箱目标,确定初始特征的分箱区间;

12、根据初始特征的分箱区间,确定分箱区间的证据权重。

13、在本技术中,当初始特征的特征值类型为连续型时,分箱目标为初始特征时,

14、根据分箱目标,确定初始特征的分箱区间,包括:

15、确定初始特征的特征值中的稀疏值;

16、若初始特征的特征值存在稀疏值,则将稀疏值作为第一分箱区间;

17、根据稀疏值,确定初始特征的剩余特征值;

18、根据预设的分箱策略,对初始特征的剩余特征值进行等频分箱,得到第二分箱区间;

19、根据第一分箱区间和第二分箱区间,得到初始特征的分箱区间。

20、在本技术中,根据分箱区间,确定分箱区间的证据权重,包括:

21、确定证据权重公式,证据权重公式为:

22、

23、其中,woe为分箱区间的证据权重;

24、根据第一数据集和分箱区间,确定分箱区间内的逾期客户总数、分箱区间内的未逾期客户总数、第一数据集内的逾期客户总数、以及第一数据集内的未逾期客户总数;

25、根据证据权重公式、分箱区间内的逾期客户总数、分箱区间内的未逾期客户总数、第一数据集内的逾期客户总数、以及第一数据集内的未逾期客户总数,确定分箱区间的证据权重。

26、在本技术中,根据初始特征的分箱区间、以及与分箱区间对应的证据权重,确定初始特征中的入模特征、入模特征的原始分箱区间、原始分箱区间的原始证据权重、入模特征的入模分箱区间、以及入模分箱区间的入模证据权重,包括:

27、根据初始特征的分箱区间、以及与分箱区间对应的证据权重,确定初始特征的信息价值;

28、根据初始特征的信息价值,确定入模特征、入模特征的原始分箱区间、原始分箱区间的原始证据权重、入模特征的入模分箱区间、以及入模分箱区间的入模证据权重。

29、在本技术中,根据初始特征的分箱区间、以及与分箱区间对应的证据权重,确定初始特征的信息价值,包括:

30、确定信息价值公式,信息价值公式为:

31、

32、其中,woei为初始特征的第i个分箱区间的证据权重,n为初始特征的分箱区间的总数;

33、根据第一数据集和初始特征的各个分箱区间,确定各个分箱区间内的逾期客户总数、各个分箱区间内的未逾期客户总数、第一数据集内的逾期客户总数、以及第一数据集内的未逾期客户总数;

34、根据初始特征的各个分箱区间的证据权重、信息价值公式、各个分箱区间内的逾期客户总数、各个分箱区间内的未逾期客户总数、第一数据集内的逾期客户总数、以及第一数据集内的未逾期客户总数,确定初始特征的信息价值。

35、在本技术中,根据初始特征的信息价值,确定入模特征、入模特征的原始分箱区间、原始分箱区间的原始证据权重、入模特征的入模分箱区间、以及入模分箱区间的入模证据权重,包括:

36、根据初始特征的信息价值,确定入模特征;

37、根据入模特征和初始特征的分箱区间的证据权重,确定入模特征的原始分箱区间、以及原始分箱区间的原始证据权重;

38、根据初始特征的特征值,确定入模特征的入模特征值;

39、根据入模特征值、入模特征的分箱区间、以及入模特征的分箱区间的原始证据权重,确定入模特征值的入模证据权重。

40、在本技术中,根据第二数据集,对逻辑回归模型进行训练,得到入模特征的权重,包括:

41、将第二数据集中的入模特征、入模特征的入模分箱区间、以及入模分箱区间的入模证据权重作为输入,入模特征的逾期标签作为输出,对逻辑回归模型进行训练,得到目标逻辑回归模型;

42、根据目标逻辑回归模型,确定入模特征的权重。

43、在本技术中,根据原始分箱区间的分数,得到政企客户信用评分卡,包括:

44、对入模特征的权重、以及与原始分箱区间的原始证据权重进行求乘积处理,得到原始分箱区间的分数;

45、根据原始分箱区间的分数,得到政企客户信用评分卡。

46、在本技术中,对入模特征的权重、以及与原始分箱区间的原始证据权重进行求乘积处理,得到原始分箱区间的分数,包括:

47、确定分数计算公式,分数计算公式为:

48、s=缩放系数×入模特征的权重×原始分箱区间的原始证据权重,

49、其中,s为入模特征的原始分箱区间的分数,缩放系数为预设的评分卡标尺,以使入模特征的原始分箱区间的分数根据缩放系数进行调整;

50、根据分数计算公式,对入模特征的权重、以及原始分箱区间的原始证据权重进行求乘积处理,得到原始分箱区间的分数。

51、在本技术中,根据原始分箱区间的分数,得到政企客户信用评分卡,包括:

52、将入模特征按照特征类型进行分类,确定目标入模特征,特征类型包括回款安全性类型特征、业务结构安全性类型特征、以及经营状况安全性类型特征;

53、根据目标入模特征、目标入模特征的原始分箱区间的分数、以及特征类型对应的评分标准,确定各个目标入模特征的原始分箱区间的子分数;

54、根据特征类型中各个特征类型权重,对所有子分数进行更新,得到政企客户信用评分;

55、根据政企客户信用评分,生成并展示政企客户信用评分卡。

56、第二方面,本技术提供一种政企客户信用评分卡生成装置,包括:

57、获取模块,用于获取第一数据集,第一数据集包括初始特征、初始特征的特征值、以及逾期标签,初始特征包括政企客户的回款安全性类型特征、业务结构安全性类型特征、以及经营状况安全性类型特征,逾期标签表征政企客户的逾期类型;

58、第一确定模块,用于根据初始特征、与初始特征对应的特征值,确定初始特征的分箱区间、以及与分箱区间对应的证据权重;

59、第二确定模块,用于根据初始特征的分箱区间、以及与分箱区间对应的证据权重,确定初始特征中的入模特征、入模特征的原始分箱区间、原始分箱区间的原始证据权重、入模特征的入模分箱区间、以及入模分箱区间的入模证据权重;

60、训练模块,用于根据第二数据集,对逻辑回归模型进行训练,得到入模特征的权重,第二数据集包括入模特征、入模分箱区间、入模证据权重、以及入模特征的逾期标签;

61、得到模块,用于根据原始分箱区间的分数,得到政企客户信用评分卡,原始分箱区间的分数根据入模特征的权重、以及原始分箱区间的原始证据权重得到。

62、第三方面,本技术提供一种电子设备,包括:处理器,以及与处理器通信连接的存储器;

63、存储器存储计算机执行指令;

64、处理器执行存储器存储的计算机执行指令,以实现本技术的一种政企客户信用评分卡生成方法。

65、第四方面,本技术提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现本技术的一种政企客户信用评分卡生成方法。

66、本技术提供的一种政企客户信用评分卡生成方法、装置、设备及介质,通过获取第一数据集,第一数据集包括初始特征、初始特征的特征值、以及逾期标签,初始特征包括政企客户的回款安全性类型特征、业务结构安全性类型特征、以及经营状况安全性类型特征,逾期标签表征政企客户的逾期类型;根据初始特征、与初始特征对应的特征值,确定初始特征的分箱区间、以及与分箱区间对应的证据权重;根据初始特征的分箱区间、以及与分箱区间对应的证据权重,确定初始特征中的入模特征、入模特征的原始分箱区间、原始分箱区间的原始证据权重、入模特征的入模分箱区间、以及入模分箱区间的入模证据权重;根据第二数据集,对逻辑回归模型进行训练,得到入模特征的权重,第二数据集包括入模特征、入模分箱区间、入模证据权重、以及入模特征的逾期标签;根据原始分箱区间的分数,得到政企客户信用评分卡,原始分箱区间的分数根据入模特征的权重、以及原始分箱区间的原始证据权重得到的手段,通过将特征值转化为证据权重,再根据证据权重对逻辑回归模型进行训练,提高了模型的准确度和区分能力,采用对逻辑回归模型进行训练得到入模特征的权重,能够清晰简洁地逐步解释模型信用评级原理,提高了可解释性,使得政企客户信用评分卡的评分效果更好。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1