信贷欺诈行为识别方法、系统、终端设备及存储介质与流程

文档序号:28376481发布日期:2022-01-07 22:00阅读:122来源:国知局
信贷欺诈行为识别方法、系统、终端设备及存储介质与流程

1.本公开涉及信贷安全技术领域,尤其涉及一种基于纵向联邦的信贷欺诈行为识别方法、一种基于纵向联邦的信贷欺诈行为识别系统、一种终端设备以及一种计算机可读存储介质。


背景技术:

2.目前信贷反欺诈治理主要依托专家风控规则,其由专家经验以人工的形式进行识别规则制定,然后根据识别规则进行信贷欺诈行为的识别,尽管采用人工识别方式具有较高的可靠性,但其覆盖范围有限,无法对多样化场景及欺诈手段实现全面覆盖,时效性不强,此外,随着欺诈行为的变化需不断动态调整规则,易出现误报现象,且仅根据业务侧单一数据源进行数据建模分析的模式亦限制了其识别范围,导致识别结果不够准确。


技术实现要素:

3.本公开提供了一种基于纵向联邦的信贷欺诈行为识别方法、系统、终端设备及计算机可读存储介质,以至少解决目前信贷欺诈行为识别时效性低以及识别结果不准确等问题。
4.根据本公开提供的一种基于纵向联邦学习的信贷欺诈行为识别方法,包括:
5.分别获取运营商侧数据集和信贷业务侧数据集;
6.基于纵向联邦学习算法对所述运营商侧数据集和所述信贷业务侧数据集进行训练,得到信贷业务联邦预测模型;
7.基于所述信贷业务联邦预测模型对当前的信贷业务数据进行预测,得到预测结果;以及,基于所述预测结果识别出信贷欺诈行为。
8.在一种实施方式中,所述运营商侧数据集包括用户样本的移动信令数据,所述信贷业务侧数据集包括用户样本的信贷业务行为数据。
9.在一种实施方式中,所述分别获取运营商侧数据集和信贷侧业务数据集,包括:
10.分别获取运营商侧原始数据集和信贷侧业务数据集;
11.基于所述信贷侧业务数据集对所述运营商侧原始数据集进行预处理,得到运营商侧数据集。
12.在一种实施方式中,基于纵向联邦学习算法对所述运营商侧数据集和所述信贷业务侧数据集进行训练,包括:
13.对所述运营商侧数据集和所述信贷业务侧数据集进行样本对齐,得到经过样本对齐的数据集;
14.基于经过样本对齐的数据集训练出关于运营商侧的第一模型和关于信贷业务侧的第二模型;以及,
15.基于所述第一模型和所述第二模型构建信贷业务联邦预测模型。
16.在一种实施方式中,基于经过样本对齐的数据集训练出关于运营商侧的第一模型
和关于信贷业务侧的第二模型,包括:
17.基于经过样本对齐的数据集构建关于运营商侧的第一初始模型和关于信贷业务侧的第二初始模型;以及,
18.基于xgboost算法分别对所述第一初始模型和所述第二初始模型进行更新训练,得到所述第一模型和所述第二模型。
19.在一种实施方式中,基于xgboost算法分别对所述第一初始模型和所述第二初始模型进行更新训练,得到第一模型和第二模型,具体为:
20.基于xgboost算法分别确定第一初始模型的目标函数以及第二初始模型的目标函数;
21.分别计算第一初始模型的目标函数的损失以及第二初始模型的目标函数的损失;
22.基于第一初始模型的目标函数的损失计算第一更新梯度,并基于所述第一更新梯度更新第一初始模型,得到所述第一模型;以及,
23.基于第二初始模型的目标函数的损失计算第二更新梯度,并基于所述第二更新梯度更新第二初始模型,得到所述第二模型。
24.在一种实施方式中,所述基于xgboost算法分别确定第一初始模型的目标函数以及第二初始模型的目标函数,根据以下公式得到:
[0025][0026][0027]
式中,obj表示第一初始模型或者第二初始模型的目标函数;n表示经过样本对齐的数据集的用户样本总数,表示损失函数,其中yi表示第i个用户样本的实际标签,表示第i个样本的预测标签;代表正则化项,其中k表示树的总棵数,fk表示第k棵树,xi表示第i个用户样本的样本特征,fk(xi)表示第k棵树对样本xi的预测结果。
[0028]
根据本公开的另一方面,提供一种基于纵向联邦学习的信贷欺诈行为识别系统,包括:
[0029]
获取模块,其设置为分别获取运营商侧数据集和信贷业务侧数据集;
[0030]
训练模块,其设置为基于纵向联邦学习算法对所述运营商侧数据集和所述信贷业务侧数据集进行训练,得到信贷业务联邦预测模型;
[0031]
预测模块,其设置为基于所述信贷业务联邦预测模型对当前的信贷业务数据进行预测,得到预测结果;以及,
[0032]
识别模块,其设置为基于所述预测结果识别出信贷欺诈行为。
[0033]
根据本公开的再一方面,提供一种终端设备,包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时,所述处理器执行所述的基于纵向联邦学习的信贷欺诈行为识别方法。
[0034]
根据本公开的又一方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,所述处理器执行所述的基于纵向联邦学习的信贷欺诈行为识别方法。
[0035]
根据本公开提供的技术方案,通过分别获取运营商侧数据集和信贷业务侧数据集;基于纵向联邦学习算法对所述运营商侧数据集和所述信贷业务侧数据集进行训练,得
到信贷业务联邦预测模型;基于所述信贷业务联邦预测模型对当前的信贷业务数据进行预测,得到预测结果;以及,基于所述预测结果识别出信贷欺诈行为。本公开通过获取运营商侧数据集及信贷业务侧数据集,利用纵向联邦学习对双方数据源进行训练扩充,建立信贷业务联邦预测模型,其数据覆盖范围更广,对用户信贷行为的预测更加准确,并且可以基于运营商侧数据集和信贷业务侧数据集的数据变化随时对模型进行更新,提高了信贷业务欺诈行为识别的时效性。
[0036]
本公开的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本公开而了解。本公开的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
[0037]
附图用来提供对本公开技术方案的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开的技术方案,并不构成对本公开技术方案的限制。
[0038]
图1为本公开实施例提供的一种基于纵向联邦学习的信贷欺诈行为识别方法的流程示意图;
[0039]
图2为图1中步骤s101的流程示意图;
[0040]
图3为图1中步骤s102的流程示意图;
[0041]
图4为本公开实施例提供的另一种基于纵向联邦学习的信贷欺诈行为识别方法的流程示意图之一;
[0042]
图5为本公开实施例提供的另一种基于纵向联邦学习的信贷欺诈行为识别方法的流程示意图的流程示意图之二;
[0043]
图6为本公开实施例提供的一种基于纵向联邦学习的信贷欺诈行为识别系统的结构示意图;
[0044]
图7为本公开实施例提供的一种终端设备的结构示意图。
具体实施方式
[0045]
为使本公开实施例的目的、技术方案和优点更加清楚,以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
[0046]
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序;并且,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互任意组合。
[0047]
其中,在本公开实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
[0048]
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本公开的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
[0049]
为解决上述问题,本公开实施例提供一种基于纵向联邦学习的信贷欺诈行为识别
方法,通过获取电信行业用户行为基础数据及银行侧业务数据,利用纵向联邦学习对双方数据源进行训练扩充,建立信贷业务联邦预测模型,可以实现对信贷行为轨迹的预测,提供用户信贷风险评估结果,对用户为业务侧提供评估支持,降低信贷业务风险,避免财产损失。请参照图1,图1为本公开实施例提供的一种基于纵向联邦学习的信贷欺诈行为识别方法,所述方法包括步骤s101-s104。
[0050]
在步骤s101中,分别获取运营商侧数据集和信贷业务侧数据集。
[0051]
本实施例中,用于建模的数据包括运营商侧数据集和信贷业务侧数据集,结合运营商数据对建模数据进行扩充,解决现有技术中仅根据业务侧单一数据源进行数据建模分析的模式亦限制了其识别范围,导致识别结果不够准确的问题。
[0052]
具体地,所述运营商侧数据集包括用户样本的移动信令数据,其包括若干移动信令特征,所述信贷业务侧数据集包括用户样本的信贷业务行为数据,其包括若干信贷业务行为特征。
[0053]
可以理解的是,用户样本的移动信令数据为超过一定数量的普通用户的历史移动信令数据,其可以包括用户手机号,imsi,imei,终端类型,当前所在省份,当前所在城市,当前所在小区编号,流量类型,在线时长,ip,开始时间,结束时间等指标;相应的,用户样本的信贷业务行为数据为超过一定数量的普通用户的历史信贷业务行为数据,其可以包括用户手机号,银行账号,ip,开始时间,结束时间,金额,是否有过信贷记录等指标。
[0054]
在一种实施方式中,通过首先获取运营商侧原始数据集和信贷业务侧数据集,并利用信贷业务侧数据集对运营商侧原始数据集进行预处理,得到信贷业务欺诈行为识别所需要的运营商侧数据,以提高模型的构建效率,具体地,如图2所示,步骤s101包括步骤s101a和步骤s101b,
[0055]
在步骤s101a中,分别获取运营商侧原始数据集和信贷侧业务数据集;
[0056]
在步骤s101b中,基于所述信贷侧业务数据集对所述运营商侧原始数据集进行预处理,得到运营商侧数据集。
[0057]
本实施例中,由于运营商侧数据集是用于辅助信贷场景中的多种行为进行识别,其获取过程基于信贷侧业务数据集获取得到,首先采集运营商侧原始数据,然后针对信贷侧业务数据集对运营商侧原始数据进行预处理。在一种实施方式中,为便于后续对这两种数据集的处理和训练,通过表格的形式对数据集进行记录,以下为例:
[0058]
信贷业务侧采集用户业务行为数据,包括用户手机号,银行账号,ip,开始时间,结束时间,金额,是否有过信贷记录等数据,由于信贷业务侧数据集是对后续分类模型的构建进行数据准备,本实施还根据业务历史数据进行欺诈标记,标记结果克分为5个等级(0-4分别对应白账户、低风险、中风险、高风险)。构建的数据结构如下:
[0059][0060]
基于上述信贷侧业务数据集,根据每一个用户(手机号码)的当日统计信息进行预处理后得到:活动城市数、跨越小区数、流量类型数、宽带流量类型占比,对应imsi数,对应imei数,对应终端类型数,平均在线时长,活跃ip数。形成数据集a,数据结构如下所示:
[0061][0062]
在一些实施方式中,为保证数据的安全性,本实施例所获取的信贷侧业务数据集和运营商侧数据集分别由不同的终端采集。
[0063]
在步骤s102中,基于纵向联邦学习算法对所述运营商侧数据集和所述信贷业务侧数据集进行训练,得到信贷业务联邦预测模型。
[0064]
在一种实施方式中,首先对不同侧的数据集进行样本对齐,然后基于样本对齐后的数据集分别训练出第一模型和第二模型,并基于第一模型和第二模型构建联邦模型,如图3所示,所述步骤s102包括以下步骤s102a-s102c。
[0065]
在步骤s102a中,对所述运营商侧数据集和所述信贷业务侧数据集进行样本对齐,得到经过样本对齐的数据集。
[0066]
本实施例中,将用户手机号码作为id对双方数据集进行样本对齐工作,需要说明的是,为保证训练数据所有的特征都是零均值并且具有同一阶数上的方差,本实施例首先的电信运营商数据集为进行了归一化处理的数据集,具体地,
[0067]
计算全量号码每个特征(或指标)的平均数值及标准差,以跨越小区数为例:cell_cntavg=∑(cell_cnt1+

cell_cnt n)/n,其中n为样本数据量大小,cell_cntstandard deviation=sqrt(((cell_cnt1-cell_cntavg)^2+(cell_cnt2-cell_cntavg)^2+......(cell_cntn-cell_cntavg)^2)/(n-1))。
[0068]
之后对该特征指标进行归一化处理,公式如下:(cell_cnt-cell_cntavg)/(cell_cntstandard deviation),归一化处理后得到数据集a',然后将用户手机号码作为id对进行归一化后的运营商集a'和银行侧数据集b进行样本对齐,xa={phone1,phone2……
phonen}表示运营商侧拥有的样本id集合,其中n表示运营商侧样本id数量;xb={tell1,tell2……
tellm}表示银行侧拥有的样本id集合,m表示银行侧样本id数量。可以理解的是,联邦学习需要保证不同侧数据的保密性,本实施例双方样本id可以根据约定的密钥进行加密,得到xa'={phone1',phone2'
……
phonen'}及xb'={tell1',tell2'
……
tellm'},对加密样本进行对齐,假设对齐成功的样本id个数为w,即仅将双方都包含的id所对应记录作为算法的输入数据,亦可保证未对齐样本的安全性。
[0069]
在步骤s102b中,基于经过样本对齐的数据集训练出关于运营商侧的第一模型和关于信贷业务侧的第二模型。
[0070]
可以理解的是,基于经过样本对齐的数据集即为运营商侧数据集经过样本对其后的数据集,以及信贷业务侧数据集经过样本对其后的数据集。
[0071]
在步骤s102c中,基于所述第一模型和所述第二模型构建信贷业务联邦预测模型。
[0072]
在一些实施例中,利用xgboost算法首先确定第一模型或第二模型的目标函数,然后计算模型的损失,最终完成模型的更新与构建,使得所构建模型能够满足预测准确度需求。
[0073]
在步骤s103中,基于所述信贷业务联邦预测模型对当前的信贷业务数据进行预测,得到预测结果。
[0074]
可以理解的是,当前的信贷业务数据,即需要进行预测信贷业务欺诈行为的用户
的信贷业务数据,利用信贷业务联邦预测模型对当前的信贷业务数据进行预测,为拟合预测,尽可能逼近实际情况,使获得的结果更加准确。
[0075]
在步骤s104中,基于所述预测结果识别出信贷欺诈行为。
[0076]
在一些实施例中,将当前信贷业务数据及所获得的预测结果等进行记录于存储,例如构建欺诈用户库,并作为训练数据集重新应用于信贷业务联邦预测模型的更新与构建。
[0077]
纵向联邦学习(vertical federated learning又称heterogenous federated learning)是联邦学习的一种,其可以在两个数据集的用户重叠较多而用户特征重叠较少的情况下,把数据集按照纵向(即特征维度)切分,并取出双方用户相同而用户特征不完全相同的那部分数据进行训练。比如有两个不同的机构,家是某地的银行,另一家是同一个地方的电商,它们的用户群体很有可能包含该地的大部分居民因此用户的交集较大,但是,由于银行记录的都是用户的收支行为与信用评级,而电商则保有用户的浏览与购买历史,因此它们的用户特征交集较小,纵向联邦学习就是将这些不同特征在加密的状态下加以聚合,以增强模型能力。
[0078]
本实施例利用纵向联邦学习对双方数据源进行训练扩充,建立信贷业务联邦预测模型,其获得的模型覆盖范围更广,使得识别结果也更加准确,此外,本实施例所创建的信贷业务联邦预测模型,在双方数据源出现更新的状态下自动完成更新,以解决现有技术中覆盖范围有限,无法对多样化场景及欺诈手段实现全面覆盖,且随着欺诈行为的变化需不断动态调整规则,所产生的时效性不强、易出现误报等现象。
[0079]
请参照图4,图4为本公开实施例提供的另一种基于纵向联邦的信贷欺诈行为识别方法的流程示意图,在上一实施例的基础上,本实施例提出了模型构建的具体示例,利用xgboost算法更新及构建第一模型和第二模型,最终获得可进行信贷业务行为预测的联邦模型,具体地,步骤s102b,包括以下步骤s401-s402。
[0080]
在步骤s401中,基于经过样本对齐的数据集构建关于运营商侧的第一初始模型和关于信贷业务侧的第二初始模型。
[0081]
可以理解的是,经过样本对齐的数据集包括经过样本对齐的运营商侧数据集和经过样本对齐的信贷业务侧数据集,其中第一初始模型和第二初始模型的构建可以利用联邦学习对于数据集的加密训练获得。
[0082]
在步骤s402中,基于xgboost算法分别对所述第一初始模型和所述第二初始模型进行更新训练,得到所述第一模型和所述第二模型。
[0083]
进一步地,步骤s402,具体为:
[0084]
基于xgboost算法分别确定第一初始模型的目标函数以及第二初始模型的目标函数;
[0085]
分别计算第一初始模型的目标函数的损失以及第二初始模型的目标函数的损失;
[0086]
基于第一初始模型的目标函数的损失计算第一更新梯度,并基于所述第一更新梯度更新第一初始模型,得到所述第一模型;以及,
[0087]
基于第二初始模型的目标函数的损失计算第二更新梯度,并基于所述第二更新梯度更新第二初始模型,得到所述第二模型。
[0088]
xgboost算法全名叫(extreme gradient boosting)极端梯度提升,它是大规模并
行boosted tree推进树的工具,也是目前最快最好的开源boosted tree工具包,xgboost所应用的算法就是gbdt(gradient boosting decision tree梯度提升决策树)的改进,既可以用于分类也可以用于回归问题中。本实施例利用xgboost算法推进树的形式可以使得所构建模型不断趋于损失更小的方向进行,进而使得所构建模型的预测结果更加准确。
[0089]
本实施例中,第一初始模型和第二初始模型在完成更新训练后,得到第一模型和第二模型两个本地模型,然后基于两个本地模型即可构建完整模型(信贷业务联邦预测模型)对现有数据进行拟合预测,进一步地,可以更新至欺诈黑账户库并将结果用于信贷行为评估。
[0090]
进一步地,所述基于xgboost算法分别确定第一初始模型的目标函数以及第二初始模型的目标函数,根据以下公式得到:
[0091][0092][0093]
式中,obj表示第一初始模型或者第二初始模型的目标函数;n表示经过样本对齐的数据集的用户样本总数,表示损失函数,其中yi表示第i个用户样本的实际标签,表示第i个样本的预测标签;代表正则化项,其中k表示树的总棵数,fk表示第k棵树,xi表示第i个用户样本的样本特征,fk(xi)表示第k棵树对样本xi的预测结果。
[0094]
其中,假设经过样本对齐的数据集(运营商侧数据集或信贷业务侧数据集)所建立的初始模板中数据集c={(x1,y1),(x2,y2),
……
,(xw,yw)},其中w可以为样本对齐的样本数量(即n)。xi表示样本特征,xi={number,city_cnt
……
,timeavg,bank_acc
……
,imei_cnt},yi为实际标签,其中0表示白账户、1表示黑账户。
[0095]
本实施例中结合实际的标签yi进行损失函数的构建,其中代表正则化项,定义复杂度,本实施例的目标函数为希望得到损失更小以及复杂度更小的模型。可以理解的是,损失函数即当前所构建模型中树的损失函数,通过计算当前树的损失函数,取损失函数下降最多的树作为当前树的形状,直至损失函数的减少量小于预设阈值θ。在xgboost算法中,每次添加一棵树即学习新的函数来拟合上次预测的误差,假设模型包括k棵树,那么每一个特征均对应到k棵树的k个叶子节点上,每个叶子节点对应一个分数,将每棵树对应的分数加起来即为该样本的预测值。具体地,可以首先初始化每一个样本i的预测值,然后计算损失函数对于第i个样本的预测值的导数,并根据导数信息建立一颗新的树,将第一棵树到第k棵树中对应的每个特征的分数相加获得总分数即预测值,然后返回计算损失函数对于第i个样本的预测值的导数的步骤循环构建新的树直到损失函数的减少量小于预设阈值θ或达到次数上限。
[0096]
为便于理解,请结合图5所示,对于信贷业务欺诈行为的识别包括三阶段,分别为数据准备、模型构建以及数据使用,其中企业a代表电信运营商,企业b代表信贷业务侧例如银行,企业a和企业b分别进行数据预处理后,并经过样本对其形成数据a和数据b(即经过样本对齐的数据集),然后利用纵向联邦学习算法进行模型的构建,其中在模型构建过程中,然后计算模型a和模型b的损失和梯度对进行模型更新,得到最终的模型a和模型b,然后利用模型a和模型b构建联合模型(也即本实施例中的信贷业务联邦预测模型),最后调用该联
合模型进行信贷业务欺诈行为的预测和识别,同时可以基于新的数据对联合模型进行更新。
[0097]
需要说明的是,此处的数据预处理与上述实施例中步骤s101a和步骤s101b不同,其包括在步骤s101a之前的数据预处理以及步骤s101a和步骤s101b的数据预处理,其中在步骤s101a之前的数据预处理可以包括企业a或者企业b在采集数据时对无用数据进行筛除过滤。
[0098]
基于相同的技术构思,本公开实施例相应提供一种基于纵向联邦学习的信贷欺诈行为识别系统,如图6所示,所述系统包括获取模块61、训练模块62、预测模块63以及识别模块64,其中,
[0099]
所述获取模块61,其设置为分别获取运营商侧数据集和信贷业务侧数据集;
[0100]
所述训练模块62,其设置为基于纵向联邦学习算法对所述运营商侧数据集和所述信贷业务侧数据集进行训练,得到信贷业务联邦预测模型;
[0101]
所述预测模块63,其设置为基于所述信贷业务联邦预测模型对当前的信贷业务数据进行预测,得到预测结果;以及,
[0102]
识别模块64,其设置为基于所述预测结果识别出信贷欺诈行为。
[0103]
在一种实施方式中,所述运营商侧数据集包括用户样本的移动信令数据,所述信贷业务侧数据集包括用户样本的信贷业务行为数据。
[0104]
在一种实施方式中,所述获取模块61,包括:
[0105]
获取单元,其设置为。分别获取运营商侧原始数据集和信贷侧业务数据集;
[0106]
预处理单元,其设置为基于所述信贷侧业务数据集对所述运营商侧原始数据集进行预处理,得到运营商侧数据集。
[0107]
在一种实施方式中,训练模块62包括:
[0108]
样本对齐单元,其设置为对所述运营商侧数据集和所述信贷业务侧数据集进行样本对齐,得到经过样本对齐的数据集;
[0109]
训练单元,其设置为基于经过样本对齐的数据集训练出关于运营商侧的第一模型和关于信贷业务侧的第二模型;以及,
[0110]
构建单元,其设置为基于所述第一模型和所述第二模型构建信贷业务联邦预测模型。
[0111]
在一种实施方式中,所述训练单元包括:
[0112]
构建子单元,其设置为基于经过样本对齐的数据集构建关于运营商侧的第一初始模型和关于信贷业务侧的第二初始模型;以及,
[0113]
训练子单元基于xgboost算法分别对所述第一初始模型和所述第二初始模型进行更新训练,得到所述第一模型和所述第二模型。
[0114]
在一种实施方式中,所述训练子单元具体设置为:
[0115]
基于xgboost算法分别确定第一初始模型的目标函数以及第二初始模型的目标函数;
[0116]
分别计算第一初始模型的目标函数的损失以及第二初始模型的目标函数的损失;
[0117]
基于第一初始模型的目标函数的损失计算第一更新梯度,并基于所述第一更新梯度更新第一初始模型,得到所述第一模型;以及,
[0118]
基于第二初始模型的目标函数的损失计算第二更新梯度,并基于所述第二更新梯度更新第二初始模型,得到所述第二模型。
[0119]
进一步地,所述基于xgboost算法分别确定第一初始模型的目标函数以及第二初始模型的目标函数,根据以下公式得到:
[0120][0121][0122]
式中,obj表示第一初始模型或者第二初始模型的目标函数;n表示经过样本对齐的数据集的用户样本总数,表示损失函数,其中yi表示第i个用户样本的实际标签,表示第i个样本的预测标签;代表正则化项,其中k表示树的总棵数,fk表示第k棵树,xi表示第i个用户样本的样本特征,fk(xi)表示第k棵树对样本xi的预测结果。
[0123]
基于相同的技术构思,本公开实施例相应还提供一种终端设备,如图7所示,所述终端设备包括存储器71和处理器72,所述存储器71中存储有计算机程序,当所述处理器72运行所述存储器71存储的计算机程序时,所述处理器72执行所述的基于纵向联邦学习的信贷欺诈行为识别方法。
[0124]
基于相同的技术构思,本公开实施例相应还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,所述处理器执行所述的基于纵向联邦学习的信贷欺诈行为识别方法。
[0125]
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
[0126]
最后应说明的是:以上各实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述各实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1