一种普惠小微客群整体质量偏移的识别方法与流程

文档序号:30750378发布日期:2022-07-13 08:48阅读:160来源:国知局
一种普惠小微客群整体质量偏移的识别方法与流程

1.本发明涉及中小微普惠业务金融信贷风控技术领域,尤其涉及一种普惠小微客群整体质量偏移的识别方法。


背景技术:

2.在中小微普惠金融信贷风控领域中,对申请主体的信用风险评分、额度授信和贷后管理环节存在大量风控手段和技术,但是对群体的整体质量监控方面缺少关注。现有技术中主要采用日常报表的方式,对申请群体进行单维度的统计指标计算,例如申请数量变动、行业数量变动等,而缺少对整个申请群体的质量偏移情况的定性和定量分析,不能够对客群整体质量的偏移进行识别。


技术实现要素:

3.基于此,有必要针对上述技术问题,提供一种普惠小微客群整体质量偏移的识别方法。
4.一种普惠小微客群整体质量偏移的识别方法,包括以下步骤:获取观测时间内的核心指标数据,所述核心指标数据包括量化指标数据、被拒原因数据或至少两个核心单维度的特征统计值;检测所述观测时间和核心指标数据,根据检测结果确定采用的客群整体质量偏移的识别方法;在观测时间为至少两个时间段,且所述核心指标数据为量化指标数据时,采用综合信用评分psi分析法对客群整体质量偏移进行识别;在观测时间为至少两个时间段,且所述核心指标数据为被拒原因数据时,采用拒绝原因卡方分析法对客群整体质量偏移进行识别;在观测时间为一个时间段,且所述核心指标数据为至少两个核心单维度的特征统计值时,采用关键特征卡方分析综合评定法对客群整体质量偏移进行识别。
5.在其中一个实施例中,所述综合信用评分psi分析法,具体包括:选取观测时间的颗粒度,所述颗粒度包括逐月统计、季度统计和半年统计;计算至少两个时间段内的客户评分或评分等级的psi值,公式如下:
[0006][0007]
其中,ai表示近期时间客户评分分数各箱占比,ai表示历史水平上客户评分分数各箱占比;根据所述psi值进行分箱,根据分箱结果得出客群整体质量的偏移程度。
[0008]
在其中一个实施例中,所述根据分箱结果得出客群整体质量的偏移程度,具体包括:在所述psi值小于或等于0.1时,客群整体质量稳定,不存在偏移;在所述psi值大于0.1且小于0.25时,客群整体质量存在轻微偏移;在所述psi值大于或等于0.25时,客群整体质量存在显著偏移。
[0009]
在其中一个实施例中,所述拒绝原因卡方分析法,具体包括:获取至少两个时间段的被拒原因数据;根据时间段统计所述被拒原因数据的数量,并对被拒原因数据进行数据
清理,获取被拒原因;计算每个时间段的被拒原因占比,并进行皮尔森卡方检验,公式为:
[0010][0011]ei
=npi;
[0012]
其中,ei表示理论分布下的i类个数,ni表示观测期在不同被拒原因下的个数,n表示观测期申请群体样本个数,pi表示理论上各被拒原因出现的概率;预设显著性水平值,在卡方值大于临界值,或卡方统计量计算获取的p值小于显著性水平值时,表示在观测时间内的客群整体质量出现显著偏移。
[0013]
在其中一个实施例中,所述临界值为常量根据卡方分布查表获取或计算获取,计算公式为:
[0014][0015]
其中,α表示显著性水平值,k为自由度。
[0016]
在其中一个实施例中,所述关键特征卡方分析综合评定法,具体包括:获取至少两个核心单维度下的特征统计值,所述特征统计值包括行业特征、收入规模特征、司法负面信息和纳税规模特征;计算所述特征统计值下的卡方值,判断分布是否存在显著差异;设定阈值,统计单特征下分布存在显著差异的特征数,在分布存在显著差异的特征数大于设定阈值时,表示客群质量整体出现显著偏移。
[0017]
相比于现有技术,本发明的优点及有益效果在于:本发明通过获取观测时间内的核心指标数据,核心指标数据可以为量化指标数据、被拒原因数据或至少两个核心单维度的特征统计值,检测观测时间和核心指标数据,在观测时间为至少两个时间段,且核心指标数据为量化指标数据时,采用综合信用评分psi分析法对客群整体质量偏移进行识别;在观测时间为至少两个时间段,且核心指标数据为被拒原因数据时,采用拒绝原因卡方分析法对客群整体质量偏移进行识别;在观测时间为一个时间段,且核心指标数据为至少两个核心单维度的特征统计值时,采用关键特征卡方分析综合评定法对整体客群质量偏移进行识别,能够从整体上对客群质量进行偏移识别,适用于多种场景下对申请客群的质量检测。
附图说明
[0018]
图1为一个实施例中一种普惠小微客群整体质量偏移的识别方法的流程示意图。
具体实施方式
[0019]
为了使本发明的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本发明做进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0020]
在一个实施例中,如图1所示,提供了一种普惠小微客群整体质量偏移的识别方法,包括以下步骤:
[0021]
步骤s101,获取观测时间内的核心指标数据,核心指标数据包括量化指标数据、被拒原因数据或至少两个核心单维度的特征统计值。
[0022]
具体地,观测时间可以是一个时间段或多个时间段,在观测时间为一个时间段时,
获取的核心指标数据为至少两个核心单维度的特征统计值,在观测时间为至少两个时间段时,核心指标数据可以为量化指标数据或被拒原因数据。
[0023]
步骤s102,检测观测时间和核心指标数据,根据检测结果确定采用的客群整体质量偏移的识别方法。
[0024]
具体地,检测观测时间是否为一个时间段,在为一个时间段时,采用关键特征卡方分析综合评定法识别客群整体质量偏移;在观测时间为至少两个时间段时,检测核心指标数据为量化指标数据或被拒原因数据,在为量化指标数据时,采用综合信用评分psi分析法识别客群整体质量偏移;在为被拒原因数据时,采用拒绝原因卡方分析法识别客群整体质量偏移。
[0025]
步骤s103,在观测时间为至少两个时间段,且核心指标数据为量化指标数据时,采用综合信用评分psi分析法对客群整体质量偏移进行识别。
[0026]
具体地,在获取至少两个不同时间段,且具有一定样本量,能够代表客户综合信用风险的量化指标数据,例如信用评分或评分等级时。在评分策略不变,且不同时间段的评分或评分等级的分布出现显著差异,即表示申请群体的可取整体质量出现了严重偏移,反之,若不同时间段的申请群体整体质量偏移不大,则表示客户综合信用评分指标分布亦处于相对稳定状态。
[0027]
其中,综合信用评分psi分析法,具体包括:选取观测时间的颗粒度,颗粒度包括逐月统计、季度统计和半年统计;计算至少两个时间段内的客户评分或评分等级的psi值,公式如下:
[0028][0029]
其中,ai表示近期时间客户评分分数各箱占比,ai表示历史水平上客户评分分数各箱占比;根据psi值进行分箱,根据分箱结果得出客群整体质量的偏移程度。
[0030]
其中,在psi值小于或等于0.1时,客群整体质量稳定,不存在偏移;在psi值大于0.1且小于0.25时,客群整体质量存在轻微偏移;在psi值大于或等于0.25时,客群整体质量存在显著偏移。
[0031]
在一个实施例中,根据信用评分分数,评估近1个月的客群整体质量是否存在明显差异,如表1所示。具体步骤为:(1)选定样本。近六个月客户评分分数(不含近1个月)标识历史客群的评分水平,近1个月客群评分水平表示待考察的样本。(2)计算不同样本评分分数的分箱数和占比。(3)计算psi值,并根据psi值情况得出相应的客群偏移程度。
[0032]
表1客户信用评分psi值
[0033][0034]
根据表1计算获取近1个月客群和历史客群的信用评分分数的psi值为0.26,0.26
大于0.5,因此,近1个月的客群整体质量与历史客群整体质量,存在显著偏移。
[0035]
步骤s104,在观测时间为至少两个时间段,且核心指标数据为被拒原因数据时,采用拒绝原因卡方分析法对客群整体质量偏移进行识别。
[0036]
具体地,在能够获取至少两个不同时间段的被拒原因数据时,在拒绝策略不变的前提下,通过判定不同时间段拒绝原因分布是否存在差异,从而实现对申请客群整体质量的检测,若客群整体质量差异不大,在既定的拒绝策略下,客户的拒绝原因分布也处于相对稳定的状态,若客户的拒绝原因分布出现显著差异,说明客群整体质量出现显著偏移。
[0037]
需注意,一个时间段内的被拒原因数据不少于50,且每个被拒原因下的样本数不少于5个,对于不符合要求的被拒原因进行合并处理,例如合并为其他原因。
[0038]
其中,拒绝原因卡方分析法,具体包括:获取至少两个时间段的被拒原因数据;根据时间段统计所述被拒原因数据的数量,并对被拒原因进行数据清理,获取被拒原因;计算每个时间段的被拒原因占比,并进行皮尔森卡方检验,公式为:
[0039][0040]ei
=npi;
[0041]
其中,ei表示理论分布下的i类个数,ni表示观测期在不同被拒原因下的个数,n表示观测期申请群体样本个数,pi表示理论上各被拒原因出现的概率;预设显著性水平值,在卡方值大于临界值,或卡方统计量计算获取的p值小于显著性水平值时,表示在观测时间内的客群整体质量出现显著偏移。
[0042]
其中,临界值为常量根据卡方分布查表获取或计算获取,计算公式为:
[0043][0044]
其中,α表示显著性水平值,k为自由度。
[0045]
在一个实施例中,根据拒绝原因,评估最近一个月的客群整体质量是否存在显著偏移。首先,确定样本,即将近六个月申请群体(不包含最近一个月数据)的被拒原因数据表示历史水平,将近一个月申请群体的被拒原因数据表示带观测的样本;分别统计上述两个群体的拒绝原因个数和频率,对不足5个样本的被拒原因进行合并,其中,近一个月申请客群数量为400户记为n,近六个月申请客群数为2500户。
[0046]
其次,根据上述公式计算卡方值,各被拒原因的卡方值如表2所示。
[0047]
表2被拒原因卡方值
[0048][0049]
最后,将卡方值与临界值进行对比。选定显著性水平值为0.05,本实施例中自由度为6,临界值为11.07,卡方值为22.45,显然,卡方值大于临界值,则表示近一个月被拒原因分布与近六个月的历史被拒原因分布出现显著差异,即近一个月客群整体质量出现显著偏
移。
[0050]
步骤s105,在观测时间为一个时间段,且核心指标数据为至少两个核心单维度的特征统计值时,采用关键特征卡方分析综合评定法对客群整体质量偏移进行识别。
[0051]
具体地,在获取一段时间内的申请群体至少两个核心单维度下的特征统计值时,通过逐一对比单维度特征进行分布检验,若多个单维度特征下的分布均存在显著差异,则认定客群整体质量出现显著偏移。
[0052]
其中,关键特征卡方分析综合评定法,具体包括:获取至少两个核心单维度下的特征统计值,特征统计值包括行业特征、收入规模特征、司法负面信息和纳税规模特征;计算特征统计值下的卡方值,判断分布是否存在显著差异;设定阈值,统计单特征下分布存在显著差异的特征数,在分布存在显著差异的特征数大于设定阈值时,表示客群质量整体出现显著偏移。
[0053]
在一个实施例中,根据申请群体的关键特征,评估近一个月的客群整体质量是否存在显著差异。
[0054]
首先,筛选5个核心指标用于综合评估企业质量的特征,分别为行业指标、近12个月应税销售收入指标、近6个月应税销售收入环比指标、近3个越增值税应纳税额环比指标和当前欠税指标。
[0055]
其次,确定样本。以近六个月的申请客群作为历史样本(不含近一个月数据),近一个月申请客群作为待观测样本。其三,对不同特征进行卡方检验,如步骤s104所示,若既定特征下的两个分布存在显著差异,则记为1,反之记为0,如表3所示。
[0056]
表3特征分布差异表
[0057][0058]
最后,设定阈值为2,在本实施例中,5个核心特征中有3个特征的分布与历史水平存在显著差异,则表示近一个月申请客群的整体质量与历史客群的整体质量出现显著偏移。
[0059]
在本实施例中,获取观测时间内的核心指标数据,核心指标数据可以为量化指标数据、被拒原因数据或至少两个核心单维度的特征统计值,检测观测时间和核心指标数据,在观测时间为至少两个时间段,且核心指标数据为量化指标数据时,采用综合信用评分psi分析法对客群整体质量偏移进行识别;在观测时间为至少两个时间段,且核心指标数据为被拒原因数据时,采用拒绝原因卡方分析法对客群整体质量偏移进行识别;在观测时间为一个时间段,且核心指标数据为至少两个核心单维度的特征统计值时,采用关键特征卡方分析综合评定法对整体客群质量偏移进行识别,能够从整体上对客群质量进行偏移识别,适用于多种场景下对申请客群的质量检测,可行性高,易于推广,对实际风控管理具有较大的指导意义。
[0060]
以上内容是结合具体的实施方式对本发明所做的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1