本技术属于人工智能,尤其涉及一种贷款需求的确定方法、装置、设备、可读存储介质及产品。
背景技术:
1、近年来,国家大力推进发展普惠贷款业务,因此贷款机构对小微企业的贷款需求的判断是很有必要的。贷款机构在对客户进行信贷业务的推广时,需要先确定目标客户,即筛选出可能有贷款资金需求的客户。目前各贷款机构的做法通常是把机构内符合贷款条件的存量客户都列入推广名单,然后将名单分配到执行人员(如客户经理)手上,但这并不能有效地判断客户是否有资金需求,导致营销效果不佳,同时客户经理的工作量也大大增加。
2、目前的贷款推广方式不管是对满足贷款条件的客户还是对能够获得额度的客户进行推广,都忽视了客户是否需要这个贷款,因此这种针对性不强的推广方式尚存在较大的改善空间。一是满足贷款条件的客户是非常多的,而真正有贷款需求的客户占少数,如果没有选择性地对这些客户进行推广,不能针对资金饥渴度高的客户加强推广,必会损失大量的推广成本;二是对于暂时没有贷款需求的客户,频繁地推广必会给客户带来不必要的打扰,造成客户的流失以及金融机构信誉的损失。因此,若能够建立确定客户贷款需求的机器学习模型是很有必要的。
3、然而,建立确定客户贷款需求的机器学习模型需要至少两方面的数据,一是客户响应标签,即判断是否有贷款需求;二是解释变量,即能够对客户响应标签y进行解释的自变量x。当具有历史贷款数据时,客户响应标签y自然而然可以定义为是否推广成功,即推广之后客户是否进行了贷款;而当下大多数贷款机构的普惠贷款业务刚刚起步,没有足够多的贷款数据,且没有客户响应标签。因此,客户的贷款需求的难以确定。
技术实现思路
1、本技术实施例提供了一种贷款需求的确定方法、装置、设备、可读存储介质及产品,能够提高对于目标用户的贷款需求判断的准确性。
2、第一方面,本技术实施例提供了一种贷款需求的确定方法,贷款需求的确定方法包括:从目标检查分析系统中,获取目标用户在至少一个贷款机构的第一收支数据;将第一收支数据输入预先训练好的机器学习模型,得到机器学习模型的第一输出结果,机器学习模型为基于梯度提升框架算法建立,并基于从目标检查分析系统中获得的样本用户的收支数据和样本用户的贷款结果训练得到;所述机器学习模型包括多个基学习器,一个所述样本用户的收支数据和一个所述样本用户的贷款结果作为一个训练样本,所述训练样本被赋予权重,所述多个基学习器为通过调整所述训练样本的权重依次训练获得,所述机器学习模型的输出结果包括多个训练好的所述基学习器的输出结果的加权平均值;根据第一输出结果,确定目标用户是否存在贷款需求。
3、根据本技术第一方面的实施方式,在将第一收支数据输入预先训练好的机器学习模型,得到机器学习模型的第一输出结果之前,贷款需求的确定方法还包括:基于梯度提升框架算法,建立机器学习模型;基于样本用户的收支数据和样本用户的贷款结果对机器学习模型进行训练,得到训练好的机器学习模型。
4、根据本技术第一方面前述任一实施方式,基于样本用户的收支数据和样本用户的贷款结果对机器学习模型进行训练,得到训练好的机器学习模型,包括:对于任意一个样本用户,将样本用户的收支数据和样本用户的贷款结果作为一个训练样本,并对训练样本赋予权重,其中,至少两个训练样本对应的权重不同;基于赋予权重后的多个训练样本对第一个基学习器进行训练,得到训练好的第一个基学习器;根据第i个基学习器的输出结果,调整训练样本的权重,i为正整数;基于调整权重后的多个训练样本对第i+1个基学习器进行训练,得到训练好的第i+1个基学习器;当i+1小于或等于第一预设阈值时,将i+1更新为i,并返回根据第i个基学习器的输出结果,调整训练样本的权重的步骤,直至i+1大于第一预设阈值;将多个训练好的基学习器的输出结果进行加权处理,作为机器学习模型的输出结果。
5、根据本技术第一方面前述任一实施方式,基于样本用户的收支数据和样本用户的贷款结果对机器学习模型进行训练,得到训练好的机器学习模型,还包括:当机器学习模型出现过拟合时,调整机器学习模型的目标模型参数,目标模型参数包括用于调整单棵树的最大叶子数目的第一参数、用于设置树的最大深度的第二参数、用于调整每个叶子的最小样本数的第三参数、用于调整每次训练抽取的样本数的第四参数、用于调整每次训练抽取的特征数的第五参数和用于调整正则项的权重的第六参数中的至少一项。
6、根据本技术第一方面前述任一实施方式,样本用户包括在目标历史时间段内贷款的第一样本用户和在目标历史时间段内未贷款的第二样本用户;在基于样本用户的收支数据和样本用户的贷款结果对机器学习模型进行训练,得到训练好的机器学习模型之前,还包括:对第一样本用户进行过采样处理,增加第一样本用户的数量;和/或,对第二样本用户进行欠采样处理,减少第二样本用户的数量;基于样本用户的收支数据和样本用户的贷款结果对机器学习模型进行训练,得到训练好的机器学习模型,包括:基于过采样处理和/或欠采样处理后的样本用户的收支数据和样本用户的贷款结果对机器学习模型进行训练,得到训练好的机器学习模型。
7、根据本技术第一方面前述任一实施方式,样本用户的收支数据包括多个特征的数据;在基于样本用户的收支数据和样本用户的贷款结果对机器学习模型进行训练,得到训练好的机器学习模型之前,还包括:根据特征的缺失率、特征的信息比率和/或多个特征之间的相关性,对样本用户的多个特征的数据进行筛选,得到样本用户的目标特征的数据;基于样本用户的收支数据和样本用户的贷款结果对机器学习模型进行训练,得到训练好的机器学习模型,包括:基于样本用户的目标特征的数据和样本用户的贷款结果对机器学习模型进行训练,得到训练好的机器学习模型。
8、根据本技术第一方面前述任一实施方式,获取目标用户在至少一个贷款机构的第一收支数据,包括:从目标检查分析系统中,获取目标用户在多个贷款机构的第一收支数据,第一收支数据包括目标用户的基本信息、存款数据、流水数据和/或贷款数据。
9、根据本技术第一方面前述任一实施方式,第一输出结果包括目标用户存在贷款需求的概率;根据第一输出结果,确定目标用户是否存在贷款需求,包括:当目标用户存在贷款需求的概率大于预设概率阈值时,确定目标用户存在贷款需求。
10、根据本技术第一方面前述任一实施方式,在基于样本用户的收支数据和样本用户的贷款结果对机器学习模型进行训练,得到训练好的机器学习模型之后,还包括:将多个样本用户的收支数据输入训练好的机器学习模型,输出多个样本用户各自对应的第二输出结果,第二输出结果包括样本用户存在贷款需求的概率;将多个样本用户存在贷款需求的概率转换为多个分数,并对多个分数进行分段;根据各个分段中的样本用户的总数量和各个分段中的第一样本用户的数量,确定各个分段的第一样本用户的占比,第一样本用户包括在目标历史时间段内贷款的样本用户;根据第一输出结果,确定目标用户是否存在贷款需求,包括:确定第一输出结果对应的目标分段,根据目标分段的第一样本用户的占比,确定目标用户是否存在贷款需求。
11、第二方面,本技术实施例提供了一种贷款需求的确定装置,贷款需求的确定装置包括:获取模块,用于从目标检查分析系统中,获取目标用户在至少一个贷款机构的第一收支数据;输出模块,用于将第一收支数据输入预先训练好的机器学习模型,得到机器学习模型的第一输出结果,机器学习模型为基于梯度提升框架算法建立,并基于从目标检查分析系统中获得的样本用户的收支数据和样本用户的贷款结果训练得到;机器学习模型包括多个基学习器,一个样本用户的收支数据和一个样本用户的贷款结果作为一个训练样本,训练样本被赋予权重,多个基学习器为通过调整训练样本的权重依次训练获得,机器学习模型的输出结果包括多个训练好的基学习器的输出结果的加权平均值;第一确定模块,用于根据第一输出结果,确定目标用户是否存在贷款需求。
12、第三方面,本技术实施例提供了一种电子设备,电子设备包括:处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序,计算机程序被处理器执行时实现如第一方面提供的贷款需求的确定方法的步骤。
13、第四方面,本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现如第一方面提供的贷款需求的确定方法的步骤。
14、第五方面,本技术实施例提供了一种计算机程序产品,计算机程序产品被存储在非易失的存储介质中,计算机程序产品被至少一个处理器执行以实现如第一方面提供的贷款需求的确定方法的步骤。
15、本技术实施例的贷款需求的确定方法、装置、设备、可读存储介质及产品,预先基于样本用户的收支数据和样本用户的贷款结果训练得到机器学习模型,从目标检查分析系统中,获取目标用户在至少一个贷款机构的第一收支数据,将获取的目标用户在至少一个贷款机构的第一收支数据输入预先训练好的机器学习模型,得到机器学习模型的第一输出结果;机器学习模型为基于梯度提升框架算法建立,并基于从目标检查分析系统中获得的样本用户的收支数据和样本用户的贷款结果训练得到;机器学习模型包括多个基学习器,一个样本用户的收支数据和一个样本用户的贷款结果作为一个训练样本,训练样本被赋予权重,多个基学习器为通过调整训练样本的权重依次训练获得,机器学习模型的输出结果包括多个训练好的基学习器的输出结果的加权平均值;根据机器学习模型的第一输出结果,确定目标用户是否存在贷款需求。一方面,可以从目标检查分析系统中获取足够数量的样本用户的收支数据和所述样本用户的贷款结果作为训练样本,从而得到训练好的机器学习模型;另一方面,基于训练好的机器学习模型的第一输出结果,可以较为准确的确定目标用户是否存在贷款需求,从而提高对于目标用户的贷款需求判断的准确性,有利于实现对于目标用户贷款的精准帮扶。