基于拒绝推断方法的模型构建方法、装置和电子设备与流程

文档序号：24289822发布日期：2021-03-17 00:38阅读：来源：国知局

技术特征：

1.一种基于拒绝推断方法的模型构建方法，其特征在于，包括：

获取全量样本数据，对接受样本定义正、负样本，以建立训练数据集，所述训练数据集包括用户特征数据和金融表现数据，该金融表现数据包括违约概率和/或逾期概率；

构建初始风险评估模型，使用所述训练数据集训练该初始风险评估模型；

使用训练好的初始风险评估模型，为拒绝样本打分，得到每个拒绝样本的变坏概率；

采用拒绝推断方法，对拒绝样本进行加权扩展，还对所有接受样本进行加权处理；

整合加权处理后的接受样本和拒绝样本，建立新训练数据集；

使用新训练数据集，重新训练所述初始风险评估模型，以得到最终风险评估模型。

2.根据权利要求1所述的模型构建方法，其特征在于，所述采用拒绝推断方法，对拒绝样本进行加权扩展，还对所有接受样本进行加权处理包括：

根据所计算的每个拒绝变坏概率，采用外推法将每一个拒绝样本扩展成一个正样本和一个负样本，为所述一个负样本给定权重系数p，为所述一个正样本给定权重系数1-p，为每一个接受样本给定权重系数1。

3.根据权利要求1所述的模型构建方法，其特征在于，

使用聚类分析方法，将具有标签值的接受样本分为两类，分别计算每一类的中心点；

对每一个拒绝样本，分别计算该拒绝样本到各中心点的欧式距离，并基于所计算的欧式距离进行分类，以确定每一个拒绝样本的标签值。

4.根据权利要求2或3所述的模型构建方法，其特征在于，所述整合加权处理后的接受样本和拒绝样本包括：

将计算加权处理后的接受样本和拒绝样本的总量，并判断正样本与负样本的比例是否在阈值范围内。

5.根据权利要求4所述的模型构建方法，其特征在于，

在判断为不在阈值范围内的情况下，进行过采样或欠采样，以使正样本与负样本的数量相等。

6.根据权利要求4所述的模型构建方法，其特征在于，

使用接受样本和加权处理且打标后的拒绝样本，建立新训练数据集，并使用所述新训练数据集构建最终风险评估模型。

7.根据权利要求6所述的模型构建方法，其特征在于，

获取目标用户的用户特征数据，使用所述最终风险评估模型，计算所述目标用户的风险评估值。

8.一种基于拒绝推断方法的模型构建装置，其特征在于，包括：

数据获取模块，用于获取全量样本数据，对接受样本定义正、负样本，以建立训练数据集，所述训练数据集包括用户特征数据和金融表现数据，该金融表现数据包括违约概率和/或逾期概率；

第一构建模块，用于构建初始风险评估模型，使用所述训练数据集训练该初始风险评估模型；

打分估算模块，用于使用训练好的初始风险评估模型，为拒绝样本打分，得到每个拒绝样本的变坏概率；

第一处理模块，用于采用拒绝推断方法，对拒绝样本进行加权扩展，还对所有接受样本进行加权处理；

第二处理模块，用于整合加权处理后的接受样本和拒绝样本，建立新训练数据集；

第二构建模块，用于使用新训练数据集，重新训练所述初始风险评估模型，以得到最终风险评估模型。

9.一种电子设备，其中，该电子设备包括：

处理器；以及，

存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行根据权利要求1-7中任一项所述的基于拒绝推断方法的模型构建方法。

10.一种计算机可读存储介质，其中，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被处理器执行时，实现权利要求1-7中任一项所述的基于拒绝推断方法的模型构建方法。

技术总结
本发明提供了一种基于拒绝推断方法的模型构建方法、装置和电子设备。该方法包括：获取全量样本数据，对接受样本定义正、负样本，以建立训练数据集，训练数据集包括用户特征数据和金融表现数据；构建初始风险评估模型，使用训练数据集训练初始风险评估模型；使用训练好的初始风险评估模型，为拒绝样本打分，得到每个拒绝样本的变坏概率；采用拒绝推断方法，对拒绝样本进行加权扩展，还对所有接受样本进行加权处理；整合加权处理后的接受样本和拒绝样本，建立新训练数据集；使用新训练数据集，重新训练初始风险评估模型，以得到最终风险评估模型。本发明有效解决了样本偏差或样本数据缺失等的问题，提高了模型预测精度。

技术研发人员：聂婷婷
受保护的技术使用者：北京淇瑀信息科技有限公司
技术研发日：2021.02.03
技术公布日：2021.03.16

完整全部详细技术资料下载

当前第2页1 2