数据处理方法、装置、电子设备以及存储介质与流程

文档序号:34391186发布日期:2023-06-08 10:01阅读:26来源:国知局
数据处理方法、装置、电子设备以及存储介质与流程

本公开涉及人工智能,尤其涉及机器学习和深度学习,具体可应用于金融风控场景。具体地,涉及一种数据处理方法、装置、电子设备以及存储介质。


背景技术:

1、随着计算机技术的发展,人工智能技术也得到了发展。例如,可以将人工智能技术应用于金融风控领域。例如,可以利用金融风控数据来训练机器学习模型得到金融风控模型。


技术实现思路

1、本公开提供了一数据处理方法、装置、电子设备以及存储介质。

2、根据本公开的一方面,提供了一种数据处理方法,包括:根据第一金融风控数据集和第二金融风控数据集,确定第一指标值集,其中,上述第一指标值集包括至少一个第一指标值,上述第一指标值用于评估上述第一金融风控数据集和上述第二金融风控数据集之间的特征分布一致性程度;在根据上述第一指标值确定上述第一金融风控数据集和上述第二金融风控数据集满足特征分布一致性的情况下,基于决策路径集,根据上述第一金融风控数据集和上述第二金融风控数据集,得到与上述第一金融风控数据集对应的第二指标值集和与上述第二金融风控数据集对应的第三指标值集,其中,上述决策路径集包括至少一个决策路径,上述决策路径用于表征从与根节点对应的特征到与叶节点对应的特征所形成的路径;以及,根据上述第二指标值集和上述第三指标值集,确定上述第一金融风控数据集和上述第二金融风控数据集之间的决策分布一致性程度。

3、根据本公开的另一方面,提供了一种数据处理装置,包括:第一确定模块,用于根据第一金融风控数据集和第二金融风控数据集,确定第一指标值集,其中,上述第一指标值集包括至少一个第一指标值,上述第一指标值用于评估上述第一金融风控数据集和上述第二金融风控数据集之间的特征分布一致性程度;第一获得模块,用于在根据上述第一指标值确定上述第一金融风控数据集和上述第二金融风控数据集满足特征分布一致性的情况下,基于决策路径集,根据上述第一金融风控数据集和上述第二金融风控数据集,得到与上述第一金融风控数据集对应的第二指标值集和与上述第二金融风控数据集对应的第三指标值集,其中,上述决策路径集包括至少一个决策路径,上述决策路径用于表征从与根节点对应的特征到与叶节点对应的特征所形成的路径;以及,第二确定模块,用于根据上述第二指标值集和上述第三指标值集,确定上述第一金融风控数据集和上述第二金融风控数据集之间的决策分布一致性程度。

4、根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与上述至少一个处理器通信连接的存储器;其中,上述存储器存储有可被上述至少一个处理器执行的指令,上述指令被上述至少一个处理器执行,以使上述至少一个处理器能够执行如本公开上述的方法。

5、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,上述计算机指令用于使上述计算机执行如本公开上述的方法。

6、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,上述计算机程序在被处理器执行时实现如本公开上述的方法。

7、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种数据处理方法,包括:

2.根据权利要求1所述的方法,其中,所述决策路径集是根据决策一致性模型确定的,所述决策一致性模型是利用所述第一金融风控数据集训练树模型得到的,所述决策一致性模型包括所述决策路径集。

3.根据权利要求2所述的方法,其中,所述决策一致性模型包括原始决策路径集,所述决策路径集是根据第四指标值集,从所述原始决策路径集确定的;

4.根据权利要求2或3所述的方法,其中,所述决策一致性模型是利用所述第一金融风控数据集训练树模型得到的,包括:

5.根据权利要求4所述的方法,其中,所述第一目标特征是所述至少一个第一特征中满足预定重要性条件的第一特征,包括:

6.根据权利要求1~5中任一项所述的方法,其中,所述第二指标值集包括至少一个第二指标值,所述第三指标值集包括至少一个第三指标值;

7.根据权利要求6所述的方法,还包括:

8.根据权利要求6或7所述的方法,还包括:

9.根据权利要求6~8中任一项所述的方法,还包括:

10.根据权利要求9所述的方法,其中,所述第一金融风控数据集包括至少一个第一金融风控数据,所述第一金融风控数据包括至少一个第一特征的第一金融风控特征数据,所述第二金融风控数据集包括至少一个第二金融风控数据,所述第二金融风控数据包括至少一个第二特征的第二金融风控特征数据;

11.根据权利要求10所述的方法,还包括:

12.根据权利要求11所述的方法,其中,所述第一性能评估信息包括至少一个第一性能评估值,所述第二性能评估信息包括至少一个第二性能评估值,所述第三性能评估信息包括至少一个第三性能评估值,所述第四性能评估信息包括至少一个第四性能评估值;

13.根据权利要求12所述的方法,还包括:

14.根据权利要求1~13中任一项所述的方法,还包括:

15.根据权利要求14所述的方法,其中,所述至少一个第一指标值包括全局指标值和局部指标值,所述全局指标值用于评估所述第一金融风控数据集和所述第二金融风控数据集之间的全局特征分布一致性程度,所述局部指标值用于评估所述第一金融风控数据集和所述第二金融风控数据集之间的局部特征分布一致性程度;

16.根据权利要求1~15中任一项所述的方法,其中,所述第一金融风控数据集和所述第二金融风控数据集为以下之一场景的数据集:信用评估场景、反欺诈场景、授信场景和违约场景。

17.一种数据处理方法,包括:

18.一种电子设备,包括:

19.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1~16中任一项所述的方法。

20.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1~16中任一项所述的方法。


技术总结
本公开提供了一种数据处理方法、装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及机器学习和深度学习技术领域,具体可应用于金融风控场景。具体实现方案为:根据第一金融风控数据集和第二金融风控数据集,确定第一指标值集;在根据第一指标值确定第一金融风控数据集和第二金融风控数据集满足特征分布一致性的情况下,基于决策路径集,根据第一金融风控数据集和第二金融风控数据集,得到与第一金融风控数据集对应的第二指标值集和与第二金融风控数据集对应的第三指标值集;根据第二指标值集和第三指标值集,确定第一金融风控数据集和第二金融风控数据集之间的决策分布一致性程度。

技术研发人员:刘昊骋,陈才
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1