本技术属于大数据,尤其涉及一种授信额度模型的建模方法、装置、介质及程序产品。
背景技术:
1、授信额度是贷款的关键要素之一,如何核定授信额度是各银行机构要解决的难点。
2、现有技术的常见做法有两种,一种是通过专家经验模型确定授信额度,例如,通过“授信参考变量*专家系数”的方式确定授信额度,但是这种方式主要集中在一个维度,因此得到的授信额度受单一变量的影响较大,致使根据模型确定出的授信额度不准确;另一种是通过构建客户贷款资金需求与客户数据特征的关系,得到授信额度模型,然后基于授信额度模型可以确定客户的授信额度,但是这种方式面临模型的目标变量定义模糊的问题,目标变量定义的不准确,也会出现根据模型确定出的授信额度不准确的问题。
3、因此,亟需一种授信额度模型的建模方法,以提高确定授信额度的准确率。
技术实现思路
1、本技术实施例提供一种授信额度模型的建模方法、装置、介质及程序产品,能够提高确定授信额度的准确率。
2、一方面,本技术实施例提供一种授信额度模型的建模方法,包括:
3、获取多个第一样本,每个第一样本包括历史用户的第一授信额度以及历史用户的多个特征参数的样本数据,第一授信额度为历史用户在第一时间点后第一预设时间段内新增贷款的余额最大值,多个特征参数的样本数据为在第二时间点获得的数据,第二时间点在第一时间点之前,且第二时间点与第一时间点的距离为第二预设时间段;
4、针对每个第一样本,分别从多个特征参数的样本数据中去除满足预设条件的特征参数的样本数据,得到目标特征参数的样本数据;
5、依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型。
6、在本技术的一些实施例中,非线性回归模型为幂指函数模型或决策树回归模型。
7、在本技术的一些实施例中,非线性回归模型为幂指函数模型,依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型,包括:
8、针对每个第一样本,求解历史用户的第一授信额度的对数,得到历史用户的第一授信额度的对数值;
9、依据多个第一样本的第一授信额度的对数值以及目标特征参数的样本数据,构建第一授信额度的对数与目标特征参数的线性关系;
10、将第一授信额度的对数与目标特征参数的线性关系转换为第一授信额度与目标特征参数的幂指函数关系,得到幂指函数模型。
11、在本技术的一些实施例中,非线性回归模型为决策树回归模型,依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型,包括:
12、依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,采用分类回归树算法,构建第一授信额度与目标特征参数的非线性关系,得到决策树回归模型。
13、在本技术的一些实施例中,预设条件包括以下至少一种:
14、字符型特征以及波动率小于第一预设值;
15、特征缺失率高于第二预设值;
16、单一值比例高于第三预设值;
17、与第一授信额度的相关系数小于第四预设值;
18、特征之间的两两相关系数大于第五预设值;
19、特征的稳定性大于第六预设值。
20、在本技术的一些实施例中,在依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型之后,方法还包括:
21、获取多个第二样本,每个第二样本包括历史用户的第一授信额度的真实值以及历史用户的目标特征参数的样本数据;
22、将目标特征参数的样本数据输入授信额度模型,得到第一授信额度的预测值;
23、根据第一授信额度的真实值和预测值,确定授信额度模型的评价指标数值。
24、在本技术的一些实施例中,在依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型之后,方法还包括:
25、获取多个第二样本,每个第二样本包括历史用户的目标特征参数的样本数据;
26、根据多个第二样本中的目标特征参数的样本数据以及多个第一样本中的目标特征参数的样本数据,确定授信额度模型的评价指标数值。
27、在本技术的一些实施例中,在依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型之后,方法还包括:
28、获取用户的目标特征参数的数据;
29、将目标特征参数的数据输入授信额度模型,得到用户的目标授信额度。
30、另一方面,本技术实施例提供了一种授信额度模型的建模装置,装置包括:
31、第一获取单元,用于获取多个第一样本,每个第一样本包括历史用户的第一授信额度以及历史用户的多个特征参数的样本数据,第一授信额度为历史用户在第一时间点后第一预设时间段内新增贷款的余额最大值,多个特征参数的样本数据为在第二时间点获得的数据,第二时间点在第一时间点之前,且第二时间点与第一时间点的距离为第二预设时间段;
32、筛选单元,用于针对每个第一样本,分别从多个特征参数的样本数据中去除满足预设条件的特征参数的样本数据,得到目标特征参数的样本数据;
33、训练单元,用于依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型。
34、在本技术的一些实施例中,非线性回归模型为幂指函数模型或决策树回归模型。
35、在本技术的一些实施例中,非线性回归模型为幂指函数模型,训练单元包括:
36、求解单元,用于针对每个第一样本,求解历史用户的第一授信额度的对数,得到历史用户的第一授信额度的对数值;
37、第一构建单元,用于依据多个第一样本的第一授信额度的对数值以及目标特征参数的样本数据,构建第一授信额度的对数与目标特征参数的线性关系;
38、转换单元,用于将第一授信额度的对数与目标特征参数的线性关系转换为第一授信额度与目标特征参数的幂指函数关系,得到幂指函数模型。
39、在本技术的一些实施例中,非线性回归模型为决策树回归模型,训练单元包括:
40、第二构建单元,用于依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,采用分类回归树算法,构建第一授信额度与目标特征参数的非线性关系,得到决策树回归模型。
41、在本技术的一些实施例中,预设条件包括以下至少一种:
42、字符型特征以及波动率小于第一预设值;
43、特征缺失率高于第二预设值;
44、单一值比例高于第三预设值;
45、与第一授信额度的相关系数小于第四预设值;
46、特征之间的两两相关系数大于第五预设值;
47、特征的稳定性大于第六预设值。
48、在本技术的一些实施例中,建模装置还包括:
49、第四获取单元,用于获取用户的所述目标特征参数的数据;
50、第三确定单元,用于将所述目标特征参数的数据输入所述授信额度模型,得到所述用户的目标授信额度。
51、另一方面,本技术实施例提供一种授信额度模型的建模设备,数据处理设备包括:处理器以及存储有计算机程序指令的存储器;
52、处理器执行计算机程序指令时实现上述任一实施例的授信额度模型的建模方法。
53、另一方面,本技术实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现上述任一实施例的授信额度模型的建模方法。
54、另一方面,本技术实施例提供一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行上述任一实施例的授信额度模型的建模方法。
55、根据本技术实施例提供的授信额度模型的建模方法、装置、介质及程序产品,将历史用户在第一时间点后第一预设时间段内新增贷款的余额最大值作为第一授信额度,准确地的定义了目标变量,而且由于实际经济活动中,用户授信额度需求与用户数据特征的关系大多不是线性关系,更多表现出来的是非线性关系,故本技术实施例中利用第一授信额度以及目标特征参数的样本数据,基于非线性回归建立授信额度模型的建模方法所建立的授信额度模型可以更准确的反应用户授信额度需求与用户数据特征的关系,且模型受单一变量的影响较小,故能够提高确定授信额度的准确率。