基于迁移样本筛选的金融风险预测方法、装置和电子设备与流程

文档序号:23729779发布日期:2021-01-26 07:33阅读:来源:国知局

技术特征:
1.一种基于迁移样本筛选的金融风险预测方法,其特征在于,包括:获取历史样本数据,确定源域训练集和目标域训练集;基于所述目标域训练集训练多个子模型,并从训练好的多个子模型中选出至少两个子模型;使用所选出的至少两个子模型,根据样本筛选策略,在所述源域数据集中进行迁移样本筛选,以形成迁移样本训练集;将所形成的迁移样本训练集与目标域训练集合并,以得到新目标域训练集;使用所述新目标域数据集,训练金融风险预测模型;使用训练好的金融风险预测模型,计算目标用户在目标域上的用户风险预测值。2.根据权利要求1所述的金融风险预测方法,其特征在于,所述从训练好的多个子模型中选出至少两个子模型包括:通过最大互信息系数mic,从训练好的多个子模型中选取三个子模型。3.根据权利要求1-2中任一所述的金融风险预测方法,其特征在于,还包括:使用所述三个子模型进行加权融合,以构建融合模型作为金融风险预测模型;所述加权融合包括使用各子模型在验证集上所计算的评价指标值作为权重系数,该评价指标值为auc值。4.根据权利要求1-3中任一所述的金融风险预测方法,其特征在于,还包括:从源域数据集和目标域数据集中提取模型特征,该模型特征包括与金融风险相关的共性特征、解释性特征和区别特征;根据模型特征,从所述源域数据集中筛选样本数据,建立训练集和测试集,并从所述目标域数据集中筛选样本数据,建立目标域测试集。5.根据权利要求1-4中任一所述的金融风险预测方法,其特征在于,还包括:设定样本筛选策略,所述样本筛选策略包括设定筛选指标,其中,该筛选指标包括待去除的样本比例、初始权重系数、权重更新方式和次数、最大迭代次数、最小比对阈值和最大比对阈值;所述筛选规则包括判断是否达到最大迭代次数、是否更新权重系数、是否小于最小比对阈值、是否大于等于最大比对阈值中的至少两个。6.根据权利要求1-5中任一所述的金融风险预测方法,其特征在于,还包括:对于训练集的样本数据,将各子模型的输出结果与最小比对阈值和最大比对阈值进行比较,将小于最小比对阈值或者大于等于最大比对阈值的样本去除。7.根据权利要求1-6中任一所述的金融风险预测方法,其特征在于,还包括:对于训练集和测试集的样本数据,使用tradaboost算法,分别计算各样本数据的输出结果的错误率;根据所计算的错误率,重新调整样本权重,所述重新调整样本权重包括提高或降低权重系数。8.一种基于迁移样本筛选的金融风险预测装置,其特征在于,包括:数据获取模块,其用于获取历史样本数据,确定源域训练集和目标域训练集;第一训练模块,基于所述目标域训练集训练多个子模型,并从训练好的多个子模型中选出至少两个子模型;
样本筛选模块,其用于使用所选出的至少两个子模型,根据样本筛选策略,在所述源域数据集中进行迁移样本筛选,以形成迁移样本训练集;合并模块,用于将所形成的迁移样本训练集与目标域训练集合并,以得到新目标域训练集;第二训练模块,用于使用所述新目标域数据集,训练金融风险预测模型;计算模块,用于使用训练好的金融风险预测模型,计算目标用户在目标域上的用户风险预测值。9.一种电子设备,其中,该电子设备包括:处理器;以及,存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1-7中任一项所述的基于迁移样本筛选的金融风险预测方法。10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1-7中任一项所述的基于迁移样本筛选的金融风险预测方法。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1