本技术涉及人工智能,尤其涉及一种信贷风险预测模型训练方法、信贷风险预测方法。
背景技术:
1、随着人工智能技术的不断发展,人工智能技术也逐渐被应用于金融信贷这一应用场景中,比如利用人工智能网络模型对信贷风险进行预测,从而规避信贷逾期造成的坏账损失。现有常见的信贷风险预测方法包括:基于统计模型的信贷风险评估方案、基于机器学习的信贷风险评估方案、基于深度学习的信贷风险评估方案、基于集成学习的信贷风险评估方案等等。
2、但是,从各信贷风险预测方案的实际应用效果来看,现有的信贷风险评估方案通常无法有效捕捉时间序列中的长时间依赖关系,难以处理复杂的时间特征,且存在预测精度低的问题。
技术实现思路
1、有鉴于此,本技术实施例提供了一种信贷风险预测模型训练方法、信贷风险预测方法,以提高信贷风险预测模型的预测精度。
2、第一方面,本技术实施例提供了一种信贷风险预测模型训练方法,其中,该方法包括:获取训练样本数据集,并将所述训练样本数据集输入至初始的信贷风险预测模型中,其中,所述训练样本数据集中包括各条训练样本数据,各条所述训练样本数据包括:用户的历史信贷交易记录数据、用户的历史社交关系记录数据;所述信贷风险预测模型是基于时序图网络构建的神经网络模型;
3、由所述初始的信贷风险预测模型对各条训练样本数据进行数据处理,并输出各条训练样本数据对应的预测信贷评估结果,其中,所述预测信贷评估结果为各所述用户在不同信贷周期下的预测信贷逾期概率;
4、根据所述预测信贷评估结果与各训练样本数据对应的用户的真实信贷逾期结果之间的目标数据差异,对所述初始的信贷风险预测模型的模型参数进行调整,直至所述目标数据差异小于预设数据差异阈值;
5、将所述目标数据差异小于预设数据差异阈值对应的信贷风险预测模型,确定为训练好的目标信贷风险预测模型。
6、在一些可能的实施例中,所述信贷风险预测模型包括:特征编码器、序列模型、序列嵌入模块、风险评估模块,其中,所述由所述初始的信贷风险预测模型对各条训练样本数据进行数据处理,并输出各条训练样本数据对应的预测信贷评估结果,包括:
7、由所述特征编码器基于各所述训练样本数据进行特征提取,获取各用户在时间维度上的第一交易行为特征以及获取各用户在社交关系维度上的第二交易行为特征;其中,所述第一交易行为特征与所述第二交易行为特征均由特征向量表示;
8、将所述第一交易行为特征与所述第二交易行为特征输入至所述序列模型中,由所述序列模型获取各特征向量中的时间依赖关系以及动态变化情况;
9、由所述序列嵌入模块将各所述特征向量中的时间依赖关系以及动态变化情况转换为序列嵌入向量,所述序列嵌入向量用于表示用户的综合信贷行为特征;
10、将所述综合信贷行为特征输入至所述风险评估模块中,由所述风险评估模块基于所述综合信贷行为特征输出所述预测信贷评估结果。
11、在一些可能的实施例中,所述第一交易行为特征包括:交易频率μ、交易金额标准差σ,所述获取各用户在时间维度上的第一交易行为特征,包括:
12、由所述特征编码器基于如下公式获取所述交易频率μ:
13、
14、其中,n为用户在时间t内的交易次数,xt为时间t内的交易金额;
15、由所述特征编码器基于如下公式提取所述交易金额标准差σ:
16、
17、在一些可能的实施例中,所述第二交易行为特征包括:用户u与关联用户v在预设时间段内的关系特征ru,所述获取各用户在社交关系维度上的第二交易行为特征,包括:
18、由所述特征编码器基于如下公式提取所述用户与关联用户在预设时间段内的关系特征ru:
19、
20、其中,f(v)为用户v的交易行为特征,wv为用户v的交易行为特征的特征系数。
21、在一些可能的实施例中,所述序列模型包括:长短期记忆网络模型;所述将所述第一交易行为特征与所述第二交易行为特征输入至所述序列模型中,由所述序列模型获取各特征向量中的时间依赖关系以及动态变化情况;包括:
22、所述序列模型基于如下公式获取各特征向量中的时间依赖关系以及动态变化情况:
23、ft=σ(wf·[ht-1,xt]+bf)
24、it=σ(wi·[ht-1,xt]+bi)
25、
26、ot=σ(wo·[ht-1,xt]+bo)
27、ht=ot·tanh(ct)
28、其中,ft为遗忘门,it为输入门,ot为输出门,ct为记忆单元的状态,ht为隐状态,为候选记忆单元状态,σ()为sigmoid函数,xt为所述序列模型在t时刻的输入,wf为遗忘门的权重参数,wo为输出门的权重参数,wc为记忆单元的的状态的权重参数,wi为输入门的权重参数,bf为遗忘门偏置,bi为输出门偏置,bc为记忆单元偏置,bo为输出门偏置。
29、在一些可能的实施例中,所述信贷风险预测模型还包括:关系图更新模块,所述根据所述预测信贷评估结果与各训练样本数据对应的用户的真实信贷逾期结果之间的目标数据差异,对所述初始的信贷风险预测模型的模型参数进行调整,包括:
30、利用所述关系图更新模块,根据所述信贷风险预测模型每轮输出的预测信贷评估结果与所述真实信贷逾期结果之间的目标数据差异,对所述信贷风险预测模型的图网络中邻居节点之间的权重系数进行更新。
31、在一些可能的实施例中,所述由所述风险评估模块基于所述综合信贷行为特征输出所述预测信贷评估结果,包括:
32、由所述风险评估模块基于所述序列嵌入向量,利用预设加权计算规则,计算各用户的预测信贷逾期概率。
33、在一些可能的实施例中,所述信贷风险预测模型还包括:融合模块,其中,所述融合模块通过自注意力机制整合时序图网络和lstm的输出,具体通过如下公式整合所述时序图网络和lstm的输出:
34、
35、其中,q为时序网络各时间步的隐向量,k为key向量,所述key向量用于与所述隐向量计算目标向量相似度,v为权值向量,所述权值向量用于基于所述目标向量相似度向量提取目标输出向量,dk为所述隐向量、所述key向量的特征维度。
36、第二方面,本技术实施例提供了一种信贷风险预测方法,其中,该方法包括:
37、获取待处理目标用户的信贷信息,其中,所述目标用户的信贷信息包括:所述目标用户的历史交易记录、历史时空关系记录;
38、将所述目标用户的信贷信息输入至目标信贷风险预测模型中,由所述目标信贷风险预测模型基于所述目标用户的信贷信息进行数据处理,输出所述目标用户在不同信贷周期下的信贷逾期概率;
39、其中,所述目标信贷风险预测模型预先利用第一方面所述的信贷风险预测模型训练方案训练得到的信贷风险预测模型。
40、第三方面,本技术实施例提供了一种信贷风险预测模型训练装置,其中,该装置包括:
41、获取模块,用于获取训练样本数据集,并将所述训练样本数据集输入至初始的信贷风险预测模型中,其中,所述训练样本数据集中包括各条训练样本数据,各条所述训练样本数据包括:用户的历史信贷交易记录数据、用户的历史社交关系记录数据;所述信贷风险预测模型是基于时序图网络构建的神经网络模型;
42、模型训练模块,用于利用所述初始的信贷风险预测模型对各条训练样本数据进行数据处理,并输出各条训练样本数据对应的预测信贷评估结果,其中,所述预测信贷评估结果为各所述用户在不同信贷周期下的预测信贷逾期概率;
43、模型参数调整模块,用于根据所述预测信贷评估结果与各训练样本数据对应的用户的真实信贷逾期结果之间的目标数据差异,对所述初始的信贷风险预测模型的模型参数进行调整,直至所述目标数据差异小于预设数据差异阈值;
44、模型确定模块,用于将所述目标数据差异小于预设数据差异阈值对应的信贷风险预测模型,确定为训练好的目标信贷风险预测模型。
45、第四方面,本技术实施例提供了一种信贷风险预测装置,其中,该装置包括:
46、信贷信息获取模块,用于获取待处理目标用户的信贷信息,其中,所述目标用户的信贷信息包括:所述目标用户的历史交易记录、历史时空关系记录;
47、信贷信息处理模块,用于将所述目标用户的信贷信息输入至目标信贷风险预测模型中,由所述目标信贷风险预测模型基于所述目标用户的信贷信息进行数据处理,输出所述目标用户在不同信贷周期下的信贷逾期概率;
48、其中,所述目标信贷风险预测模型预先利用第一方面所述的信贷风险预测模型训练方案训练得到的信贷风险预测模型。
49、第五方面,本技术实施例提供了一种电子设备,其中,所述电子设备包括:
50、处理器;以及
51、存储程序的存储器,
52、其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行第一方面所述的信贷风险预测模型训练方法或者第二方面所述的信贷风险预测方法。
53、第四方面,本技术实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使计算机执行第一方面所述的信贷风险预测模型训练方法或者第二方面所述的信贷风险预测方法。
54、本技术的有益效果:
55、本技术实施例提供了一种信贷风险预测模型训练方法、信贷风险预测方法,其中,该信贷风险预测模型训练方法利用用户的历史信贷交易记录数据、用户的历史社交记录数据对基于时序图网络构建的初始信贷风险预测模型进行训练,由该基于时序图网络构建的初始信贷风险预测模型对各条训练样本进行数据处理,输出各条训练样本对应的预测信贷评估结果,最后根据预测信贷评估结果与各训练样本数据对应的用户的真实信贷逾期结果之间的目标数据差异对该初始信贷风险预测模型的模型参数进行调整,直至两者之间的目标数据差异小于预设数据差异阈值,然后将目标数据差异小于预设数据差异阈值的信贷风险预测模型确定为训练好的目标信贷风险预测模型。
56、由于用户的信贷行为不仅受到自身信贷行为的影响,还会受到用户的社会关系、经济活动、生活习惯的影响,选用本技术实施例,通过历史社交记录反映信贷用户的社会关系、经济活动、生活习惯变化,将用户的历史社交记录数据纳入训练样本数据中,如此训练得到的目标信贷风险预测模型能够综合考虑时间、用户关系维度等多维度信贷评估因素,从而使得训练得到目标信贷风险预测模型能够根据用户的历史信贷交易记录数据以及用户的历史社交关系记录数据,综合给出一个更为精准的风险预测结果,有助于提高信贷风险评估的准确性。