本发明涉及机器学习风险预测领域,特别涉及一种基于模拟审批流程的贷前风险模型优化方法。
背景技术:
1、当下汽车金融行业迅猛发展,广大客户对汽车贷款业务的需求显著增加。然而汽车金融公司和银行对评判贷款客户的好坏不尽相同,这样不仅影响了客户最终的贷款结果,也有可能造成贷款业务相关资源的浪费。
2、针对汽车金融领域的贷前申请,机器学习方法被广泛使用,比较有代表性的包括决策树、神经网络、支持向量机等。一般情况下汽车金融公司内部会有一套评价模型来基于用户信息对用户的信用进行评估然后输出对应的评估结果,该结果一般对应为是否放贷的结果数据,这一模型一般为金融公司内部的预测模型,金融公司会根据这一模型的预测结果来将预测可以放贷的客户数据交由银行来放贷,但是实际上银行也有一个自动评估的模型,银行会对金融公司提交的订单中的信息进行评估然后输出是否放贷的结果,一般要求金融公司的预测模型输出结果要尽可能的接近或者靠近银行内部模型,然而目前的汽车金融公司和银行对好坏客户的识别方式相对独立,二者之间没有关联性,且汽车金融公司是无法直接得到银行模型的相关参数,这就造成了通过汽车金融公司识别出来的好客户(输出结果为审批通过可以放贷的结果),在经过银行审批时,可能会出现终止贷款的情况(不予放贷、审核不通过)。这就造成了汽车金融公司预测模型输出结果与银行输出结果不一致,导致递交至银行的客户订单无法审批通过,造成了相关资源的浪费,因此,针对现有汽车金融中贷前客户识别结果和银行对该客户识别结果无法更有效匹配等问题,本发明提出一种基于模拟审批流程的贷前风险模型优化方法。
技术实现思路
1、本发明的目的在于克服现有技术的不足,本发明提出一种基于模拟审批流程的贷前风险模型优化方法,使汽车金融公司评判出来的好客户尽可能的符合银行对贷款客户的相关要求,提高汽车金融公司识别优质客户的准确性,避免造成相关资源的浪费。
2、为了实现上述目的,本发明采用的技术方案为:一种基于模拟审批流程的贷前风险模型优化方法,包括如下步骤:
3、步骤一:建立贷前风险预测模型并进行训练,该模型用于预测贷款申请的评价结果;
4、步骤二:建立二次审批预测模型并进行训练,该模型用于对金融机构的风险预测模型进行更新优化;
5、步骤三:采用贷款申请中银行未给出结果的贷款申请数据对贷前风险预测模型、二次审批预测模型进行测试,然后根据测试结果来优化调整贷前风险预测模型。
6、步骤一中,采用银行已给出评价结果的贷款申请数据作为训练数据对贷前风险预测模型进行训练。
7、贷款申请数据包括客户基本信息、申请信息和客户征信信息。
8、4、如权利要求2或3所述的一种基于模拟审批流程的贷前风险模型优化方法,其特征在于:将贷款申请数据进行特征缩放,采用标准差标准化法,对所有特征数据进行按比例缩放,使数据取值范围在一个特定的区间,具体公式如下:
9、x'=x-μ/σ
10、其中,x为样本值,μ为特征数据均值,σ为特征数据的标准差;然后,将数据按5:1的比例分成训练集和测试集。
11、建立贷前风险预测模型包括基础数据模型xgboost模型和lightgbm模型以及下一层模型bilstm模型。
12、对建立的贷前风险预测模型进行训练包括:
13、1)、使用两种基础数据模型做模型融合,分别为model1:xgboost,model2:lightgbm;
14、将银行已给出审批结果的贷款数据作为样本数据,对其使用5折交叉验证方法进行处理;设总训练集为m个,总测试集为n个;对model1采用其中个训练样本进行模型训练,使用生成的模型对另外个验证集进行测试,预测结果记为a1,并对测试集n个样本进行预测,预测结果为b1;
15、重复上述过程5次,那么最终基于model1对验证集的预测结果分布为a1,a2,a3,a4,a5,对测试集的预测结果为b1,b2,b3,b4,b5;
16、2)、在对于model1模型的训练、验证、测试步骤结束之后,将验证集的预测结果a1,a2,a3,a4,a5合并起来,形成一个m×1的矩阵,记为a1;对于测试集的结果b1,b2,b3,b4,b5,取平均得到一个n×1的矩阵,记为b1;
17、3)、重复步骤1)、步骤2)对model2模型进行训练,基于model2模型的结果可以分别得到验证集和测试的结果a2和b2;
18、4)、将子步骤2和子步骤3的验证集结果并联形成一个m×2的矩阵a,此矩阵作为下一层模型训练的训练集;将子步骤2和子步骤3的测试集结果并联形成一个n×2的矩阵b,此矩阵作为下一层模型训练的测试集;
19、5)、使用bilstm作为贷前风险预测模型的下一层模型,基于步骤4)中的新数据测试集训练深度学习模型bilstm,风险预测模型的结果为:
20、opredict=bilstm(new_i,label)
21、其中new_i为维度为(m+n)×2的矩阵,label为银行审批结果。
22、步骤二中建立二次审批预测模型并进行训练包括:以银行给出的审批结果作为标签,构建一个由多层bilstm组成的预测网络,作为对银行二次审批结果的模拟预测模型:
23、output=bilstm(i,label)
24、其中label为银行审批结果,i二次审批预测模型的输入向量。
25、针对银行已给出审批结果的贷款申请数据为数据集,将申请人的所有基本信息、申请信息、征信信息与风险预测模型的输出为基本输入维度进行连接,形成二次审批预测模型的输入向量:
26、i=concat(bi,ai,ci,opredict)
27、其中bi为申请人的所有基本信息对应表征向量,bi为申请信息对应表征向量,ci为征信信息对应表征向量,opredict为风险预测模型给出的预测结果。
28、在步骤三中:
29、针对贷款申请数据中因被金融机构评估未通过而未收到银行审批的贷款申请,使用风险预测模型做出预测得到风险预测模型的输出结果:
30、predict1=rp(bi',ai',ci')
31、其中rp()为风险预警模型,bi',ai',ci'为未通过金融机构评估的客户基本信息、申请信息和征信信息对应的表征向量;
32、将风险预测模型预测结果与基本信息、申请信息表征向量连接后输入至训练完成后的二次审批预测模型,获得对应的二次审批预测模型模拟的二次审核结果:
33、predict2=sap(bi',ai',ci',predict1)
34、其中sap为二次审批预测模型,predict2为二次审批预测模型输出的模拟结果;
35、对比二次审批预测模型给出的结果predict2与贷前风险预测模型给出的结果predict1;当两个模型给出的预测结果一致的时候,判定风险预测模型的结果是正确的,并将风险预测模型计算得到的损失值降低为原计算结果的η倍作为奖励,反之则需给出惩罚,将损失值增加至原计算结果的η倍,从而达到利用银行未给出审批结果数据进行训练。
36、本发明的优点在于:利用现有的审批数据可以准确的将汽车等金融机构的风险预测模型优化成接近或等同于银行的风险审批结果,大大提高了金融机构的风险评估的准确性,保证了风险评估结果与银行相匹配,减少无效申请送入到银行产生的资源浪费;本发明提出一种风险预测模型,该模型结合深度学习方法和stacking策略优化金融公司现有模型,接着提出一种二次审批预测模型用于模拟银行贷前审批模型,基于该审批模型指导和更新金融公司现有模型,同时利用银行未给出审批结果数据,输入到风险预测模型和二次审批预测模型,根据二次审批预测模型的结果调整风险预测模型优化方向,达到提高风险预测模型准确度的目的。