基于拒绝推断方法的模型构建方法、装置和电子设备与流程

文档序号:24289822发布日期:2021-03-17 00:38阅读:来源:国知局

技术特征:

1.一种基于拒绝推断方法的模型构建方法,其特征在于,包括:

获取全量样本数据,对接受样本定义正、负样本,以建立训练数据集,所述训练数据集包括用户特征数据和金融表现数据,该金融表现数据包括违约概率和/或逾期概率;

构建初始风险评估模型,使用所述训练数据集训练该初始风险评估模型;

使用训练好的初始风险评估模型,为拒绝样本打分,得到每个拒绝样本的变坏概率;

采用拒绝推断方法,对拒绝样本进行加权扩展,还对所有接受样本进行加权处理;

整合加权处理后的接受样本和拒绝样本,建立新训练数据集;

使用新训练数据集,重新训练所述初始风险评估模型,以得到最终风险评估模型。

2.根据权利要求1所述的模型构建方法,其特征在于,所述采用拒绝推断方法,对拒绝样本进行加权扩展,还对所有接受样本进行加权处理包括:

根据所计算的每个拒绝变坏概率,采用外推法将每一个拒绝样本扩展成一个正样本和一个负样本,为所述一个负样本给定权重系数p,为所述一个正样本给定权重系数1-p,为每一个接受样本给定权重系数1。

3.根据权利要求1所述的模型构建方法,其特征在于,

使用聚类分析方法,将具有标签值的接受样本分为两类,分别计算每一类的中心点;

对每一个拒绝样本,分别计算该拒绝样本到各中心点的欧式距离,并基于所计算的欧式距离进行分类,以确定每一个拒绝样本的标签值。

4.根据权利要求2或3所述的模型构建方法,其特征在于,所述整合加权处理后的接受样本和拒绝样本包括:

将计算加权处理后的接受样本和拒绝样本的总量,并判断正样本与负样本的比例是否在阈值范围内。

5.根据权利要求4所述的模型构建方法,其特征在于,

在判断为不在阈值范围内的情况下,进行过采样或欠采样,以使正样本与负样本的数量相等。

6.根据权利要求4所述的模型构建方法,其特征在于,

使用接受样本和加权处理且打标后的拒绝样本,建立新训练数据集,并使用所述新训练数据集构建最终风险评估模型。

7.根据权利要求6所述的模型构建方法,其特征在于,

获取目标用户的用户特征数据,使用所述最终风险评估模型,计算所述目标用户的风险评估值。

8.一种基于拒绝推断方法的模型构建装置,其特征在于,包括:

数据获取模块,用于获取全量样本数据,对接受样本定义正、负样本,以建立训练数据集,所述训练数据集包括用户特征数据和金融表现数据,该金融表现数据包括违约概率和/或逾期概率;

第一构建模块,用于构建初始风险评估模型,使用所述训练数据集训练该初始风险评估模型;

打分估算模块,用于使用训练好的初始风险评估模型,为拒绝样本打分,得到每个拒绝样本的变坏概率;

第一处理模块,用于采用拒绝推断方法,对拒绝样本进行加权扩展,还对所有接受样本进行加权处理;

第二处理模块,用于整合加权处理后的接受样本和拒绝样本,建立新训练数据集;

第二构建模块,用于使用新训练数据集,重新训练所述初始风险评估模型,以得到最终风险评估模型。

9.一种电子设备,其中,该电子设备包括:

处理器;以及,

存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1-7中任一项所述的基于拒绝推断方法的模型构建方法。

10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1-7中任一项所述的基于拒绝推断方法的模型构建方法。


技术总结
本发明提供了一种基于拒绝推断方法的模型构建方法、装置和电子设备。该方法包括:获取全量样本数据,对接受样本定义正、负样本,以建立训练数据集,训练数据集包括用户特征数据和金融表现数据;构建初始风险评估模型,使用训练数据集训练初始风险评估模型;使用训练好的初始风险评估模型,为拒绝样本打分,得到每个拒绝样本的变坏概率;采用拒绝推断方法,对拒绝样本进行加权扩展,还对所有接受样本进行加权处理;整合加权处理后的接受样本和拒绝样本,建立新训练数据集;使用新训练数据集,重新训练初始风险评估模型,以得到最终风险评估模型。本发明有效解决了样本偏差或样本数据缺失等的问题,提高了模型预测精度。

技术研发人员:聂婷婷
受保护的技术使用者:北京淇瑀信息科技有限公司
技术研发日:2021.02.03
技术公布日:2021.03.16
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1