风控模型的更新方法和装置与流程

文档序号:34709358发布日期:2023-07-07 13:39阅读:29来源:国知局
风控模型的更新方法和装置与流程

本说明书一个或多个实施例涉及机器学习领域,尤其涉及风控模型的更新方法和装置。


背景技术:

1、在互联网场景下,许多服务平台会部署风控模型,来识别有可能对平台带来风险的用户和事件。例如,电商平台可以部署风控模型,以识别出虚假交易事件和黑产批量签约事件;电子支付平台通过部署风控模型,来识别不安全或不合法的转账事件;内容平台通过部署风控模型,识别水军刷评事件,等等。各个平台也可以利用风控模型识别对平台安全性有威胁的操作事件,例如盗号登录等。因此,风控模型对于服务平台的安全性和稳定性,发挥至关重要的作用。

2、风控模型面临的一个挑战,是较强的时效性和攻防对抗性。也就是说,风控防范的对象在被识别或拦截之后,往往会尝试各种手段,来对抗或绕开风控模型的识别策略。由此,风险形势会随着防控手段的升级持续变化。

3、因此,希望能有改进的方案,可以根据风控中的对抗形式变化,适时更新风控模型,以适应新的攻击手段。


技术实现思路

1、本说明书一个或多个实施例描述了一种更新风控模型的方法和装置,基于已有模型部署上线后互联网环境中新增的操作事件,对已有风控模型进行增量更新,从而高效灵活地适应对抗形式的变化,提高风险识别能力。

2、根据第一方面,提供了一种风控模型的更新方法,包括:

3、获取第一风控模型部署上线后,用户在互联网中产生的新增操作事件,以及对应的风险标签;其中,所述第一风控模型基于操作事件的第一特征集训练得到,并实现为由n棵子树构成的树模型;

4、响应于确定需新增特征,筛选出相对于第一特征集新增的事件特征所构成的第二特征集;

5、基于所述第一风控模型执行若干轮迭代,得到第二风控模型;其中每轮迭代包括,根据对所述新增操作事件的预测效果,从当前树模型的n棵子树中删除m棵已有子树,得到中间模型;利用所述新增操作事件的第二特征集和所述风险标签,训练m棵新建子树,将其集成到所述中间模型,作为迭代后的树模型。

6、在一种实现方式中,风控模型的更新方法还包括:响应于确定无需新增特征,利用所述新增操作事件的第一特征集和所述风险标签,对所述第一风控模型进行再训练,得到第三风控模型。

7、在一个实施例中,前述确定需新增特征,包括以下中至少一项:所述第一风控模型部署上线超过预定时长;所述第一风控模型的预测性能低于预定阈值。

8、根据一种实施方式,筛选出相对于第一特征集新增的事件特征所构成的第二特征集,具体包括:获取第一备选特征集中各项事件特征各自的统计类指标的指标值;根据所述指标值,从所述第一备选特征集中剔除第一部分备选特征。

9、在具体实施例中,上述统计类指标可以包括以下中的一项或多项:空值率,单调性,信息价值iv。

10、根据一种实施方式,筛选出相对于第一特征集新增的事件特征所构成的第二特征集,可以包括:以所述第一特征集为初始的已选特征集,执行若干轮特征选择,每轮特征选择包括,从当前的备选特征集中确定出目标事件特征,将其从备选特征集移动到已选特征集中;其中所述目标特征是当前的备选特征集中增益最大的特征;基于所述若干轮特征选择后的已选特征集,确定出所述第二特征集。

11、进一步的,在一个实施例红,基于所述若干轮特征选择后的已选特征集,确定出所述第二特征集,包括:针对所述已选特征集中相对于所述第一特征集新增的各项事件特征,确定该事件特征与其他事件特征的相关系数;剔除与其他事件特征的相关系数均高于预设阈值的事件特征。

12、根据一种实施方式,从当前树模型的n棵子树中删除m棵已有子树,得到中间模型,包括:确定出从所述n棵子树中去除m棵子树的多种子树组合;确定所述多种子树组合对应的多个临时模型分别针对所述新增操作事件的预测效果;将预测效果最佳的临时模型确定为所述中间模型。

13、在一个实施例中,训练m棵新建子树具体包括,执行m次子树训练过程,任意一次子树训练过程包括:

14、迭代执行确定节点的分裂条件以及根据分裂条件对所述新增操作事件进行划分,其中,任一节点的分裂条件中的分裂特征选自所述第二特征集,且根据所述风险标签确定;

15、在达到停止条件时,得到一棵新建子树。

16、根据一种实施方式,在得到第二风控模型后,将其部署上线。

17、根据第二方面,提供了一种风控模型的更新装置,包括:

18、获取单元,配置为获取第一风控模型部署上线后,用户在互联网中产生的新增操作事件,以及对应的风险标签;其中,所述第一风控模型基于操作事件的第一特征集训练得到,并实现为由n棵子树构成的树模型;

19、筛选单元,配置为响应于确定需新增特征,筛选出相对于第一特征集新增的事件特征所构成的第二特征集;

20、更新单元,配置为基于所述第一风控模型执行若干轮迭代,得到第二风控模型;其中每轮迭代包括,根据对所述新增操作事件的预测效果,从当前树模型的n棵子树中删除m棵已有子树,得到中间模型;利用所述新增操作事件的第二特征集和所述风险标签,训练m棵新建子树,将其集成到所述中间模型,作为迭代后的树模型。

21、根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面所述的方法。

22、根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。

23、在本说明书的实施例中,提出一种风控模型的更新方案。在已有风控模型上线后,采集新增操作事件作为新增训练样本。在确定需要新增特征的情况下,首先筛选出新增特征,然后基于新增操作事件的新增特征,采用增量迭代的方式,更新已有风控模型。在增量迭代过程中,从已有风控模型的子树中删除一些效用不佳的子树,将基于新增特征训练的新增子树添加到模型中。如此,可以保留已有风控模型的风险识别能力,又能够适应持续变化的风险形势,以更加灵活更加高效的方式应对风险手段的更新,提高风险识别和防控能力。



技术特征:

1.一种风控模型的更新方法,包括:

2.根据权利要求1所述的方法,还包括:

3.根据权利要求1所述的方法,其中,确定需新增特征,包括以下中至少一项:

4.根据权利要求1所述的方法,其中,筛选出相对于第一特征集新增的事件特征所构成的第二特征集,包括:

5.根据权利要求4所述的方法,其中,所述统计类指标包括以下中的一项或多项:空值率,单调性,信息价值iv。

6.根据权利要求1或4所述的方法,其中,筛选出相对于第一特征集新增的事件特征所构成的第二特征集,包括:

7.根据权利要求6所述的方法,其中,基于所述若干轮特征选择后的已选特征集,确定出所述第二特征集,包括:

8.根据权利要求1所述的方法,其中,从当前树模型的n棵子树中删除m棵已有子树,得到中间模型,包括:

9.根据权利要求1所述的方法,其中,利用所述新增操作事件的第二特征集和所述风险标签,训练m棵新建子树,包括,执行m次子树训练过程,任意一次子树训练过程包括:

10.根据权利要求1所述的方法,还包括:

11.一种风控模型的更新装置,包括:

12.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-10中任一项所述的方法。

13.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-10中任一项所述的方法。


技术总结
本说明书实施例提供一种风控模型的更新方法和装置。根据该方法,首先获取第一风控模型部署上线后,用户在互联网中产生的新增操作事件,以及对应的风险标签;其中,所述第一风控模型基于操作事件的第一特征集训练得到,并实现为由N棵子树构成的树模型。在确定需新增特征的情况下,筛选出相对于第一特征集新增的事件特征所构成的第二特征集。然后,基于第一风控模型执行若干轮迭代,得到第二风控模型;其中每轮迭代包括,根据对新增操作事件的预测效果,从当前树模型的N棵子树中删除m棵已有子树,得到中间模型;利用新增操作事件的第二特征集和风险标签,训练m棵新建子树,将其集成到中间模型,作为迭代后的树模型。

技术研发人员:高睿哲
受保护的技术使用者:支付宝(杭州)信息技术有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1