1.一种基于拒绝推断方法的模型构建方法,其特征在于,包括:
获取全量样本数据,对接受样本定义正、负样本,以建立训练数据集,所述训练数据集包括用户特征数据和金融表现数据,该金融表现数据包括违约概率和/或逾期概率;
构建初始风险评估模型,使用所述训练数据集训练该初始风险评估模型;
使用训练好的初始风险评估模型,为拒绝样本打分,得到每个拒绝样本的变坏概率;
采用拒绝推断方法,对拒绝样本进行加权扩展,还对所有接受样本进行加权处理;
整合加权处理后的接受样本和拒绝样本,建立新训练数据集;
使用新训练数据集,重新训练所述初始风险评估模型,以得到最终风险评估模型。
2.根据权利要求1所述的模型构建方法,其特征在于,所述采用拒绝推断方法,对拒绝样本进行加权扩展,还对所有接受样本进行加权处理包括:
根据所计算的每个拒绝变坏概率,采用外推法将每一个拒绝样本扩展成一个正样本和一个负样本,为所述一个负样本给定权重系数p,为所述一个正样本给定权重系数1-p,为每一个接受样本给定权重系数1。
3.根据权利要求1所述的模型构建方法,其特征在于,
使用聚类分析方法,将具有标签值的接受样本分为两类,分别计算每一类的中心点;
对每一个拒绝样本,分别计算该拒绝样本到各中心点的欧式距离,并基于所计算的欧式距离进行分类,以确定每一个拒绝样本的标签值。
4.根据权利要求2或3所述的模型构建方法,其特征在于,所述整合加权处理后的接受样本和拒绝样本包括:
将计算加权处理后的接受样本和拒绝样本的总量,并判断正样本与负样本的比例是否在阈值范围内。
5.根据权利要求4所述的模型构建方法,其特征在于,
在判断为不在阈值范围内的情况下,进行过采样或欠采样,以使正样本与负样本的数量相等。
6.根据权利要求4所述的模型构建方法,其特征在于,
使用接受样本和加权处理且打标后的拒绝样本,建立新训练数据集,并使用所述新训练数据集构建最终风险评估模型。
7.根据权利要求6所述的模型构建方法,其特征在于,
获取目标用户的用户特征数据,使用所述最终风险评估模型,计算所述目标用户的风险评估值。
8.一种基于拒绝推断方法的模型构建装置,其特征在于,包括:
数据获取模块,用于获取全量样本数据,对接受样本定义正、负样本,以建立训练数据集,所述训练数据集包括用户特征数据和金融表现数据,该金融表现数据包括违约概率和/或逾期概率;
第一构建模块,用于构建初始风险评估模型,使用所述训练数据集训练该初始风险评估模型;
打分估算模块,用于使用训练好的初始风险评估模型,为拒绝样本打分,得到每个拒绝样本的变坏概率;
第一处理模块,用于采用拒绝推断方法,对拒绝样本进行加权扩展,还对所有接受样本进行加权处理;
第二处理模块,用于整合加权处理后的接受样本和拒绝样本,建立新训练数据集;
第二构建模块,用于使用新训练数据集,重新训练所述初始风险评估模型,以得到最终风险评估模型。
9.一种电子设备,其中,该电子设备包括:
处理器;以及,
存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1-7中任一项所述的基于拒绝推断方法的模型构建方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1-7中任一项所述的基于拒绝推断方法的模型构建方法。