本技术涉及数据处理,尤其涉及一种风险排查的方法及装置。
背景技术:
1、银行作为金融服务行业的重要组成部分,对于保障金融安全、维护市场秩序具有重要作用。然而,银行员工的异常行为不仅会危害银行自身的利益,还有可能对整个金融市场造成不良影响。
2、目前,通过人工对进行数据筛选、数据排查和数据核算,也就是根据风险专家提供的固有规则,对场景的资金流水和操作流水数据进行识别,再结合预设的评分权重,判断该场景所涉及到的员工是否存在异常行为风险。由于专家所提供的固有规则数量有限,若涉及到固有规则未涵盖到的风险识别方法,在利用固有规则进行识别时,会影响风险识别结果,导致对员工是否存在异常行为进行判定时会存在不准确情况。
3、因此,如何准确判定员工是否存在异常行为,成为本领域亟需解决的问题。
技术实现思路
1、本技术提供了一种风险排查的方法及装置,目的在于准确判定员工是否存在异常行为。
2、为了实现上述目的,本技术提供了以下技术方案:
3、一种风险排查的方法,包括:
4、获取原始数据源、多个变量数据以及多个历史风险流水数据;
5、对于多个所述历史风险流水数据,从多个所述变量数据中筛选出与所述历史风险流水数据一致的变量数据,并将与所述历史风险流水数据一致的变量数据的数量作为历史风险流水数据的相关值;
6、从所述多个历史风险流水数据的相关值中选取出大于预设阈值的相关值,并将所述相关值对应的历史风险流水数据标识为风险排查规则;所述风险排查规则包括规则参数;
7、从所述原始数据源中筛选出符合所述风险排查规则的数据,并统计所述数据的数量,得到风险流水数据的数量;
8、从所有历史风险流水数据中筛选出符合所述风险排查规则的目标历史风险流水数据,并统计所述目标历史风险流水数据的数量,得到目标历史风险流水数据的数量;
9、根据所述风险流水数据的数量和所述目标历史风险流水数据的数量,对所述规则参数进行调整,得到调整后的规则参数;
10、利用所述调整后的规则参数和所述风险排查规则对待排查流水数据进行风险排查,得到风险排查结果。
11、可选的,所述获取原始数据源、多个变量数据以及多个历史风险流水数据,包括:
12、获取原始数据源和历史风险排查记录;所述原始数据源包括:资金流水数据、交易流水数据、客群信息数据以及行为痕迹数据;
13、将所述资金流水数据、所述交易流水数据、所述客群信息数据以及所述行为痕迹数据进行关联,得到关联后的数据;
14、从所述关联后的数据中选取预设数量的数据,得到多个变量数据;
15、将所述关联后的数据与所述历史风险排查记录进行关联,得到多个历史风险流水数据。
16、可选的,所述根据所述风险流水数据的数量和所述历史风险流水数据的数量,对所述规则参数进行调整,得到调整后的规则参数,包括:
17、将所述风险流水数据的数量除以所述目标历史风险流水数据的数量,得到准确率;
18、将原始数据源的数量与所述风险流水数据的数量相减,得到非风险流水数据的数量;
19、将所述非风险流水数据的数量除以所述目标历史风险流水数据的数量,得到第一数值;
20、将1与所述第一数值相减,得到覆盖率;
21、当所述准确率不大于第一预设阈值和/或所述覆盖率不大于第二预设阈值时,对所述规则参数进行调整,得到调整后的规则参数。
22、可选的,还包括:
23、当所述准确率值大于第一预设阈值,且所述覆盖率值不大于第二预设阈值时,不调整所述规则参数。
24、可选的,还包括:
25、获取新的流水数据;所述新的流水数据与历史流水数据一致;
26、利用所述调整后的规则参数和所述风险排查规则,对新的流水数据进行风险排查,得到新的风险排查结果;
27、利用所述调整后的规则参数和所述风险排查规则,对历史流水数据进行风险排查,得到历史风险排查结果;
28、当新的风险排查结果和历史风险排查结果存在差异数据时,根据差异数据对所述风险排查规则进行更新,得到更新后的风险排查规则。
29、可选的,所述根据差异数据对所述风险排查规则进行更新,得到更新后的规则参数,包括:
30、当差异数据为新增数据时,将所述差异数据添加至所述风险排查规则中,得到更新后的风险排查规则;所述新增数据为所述风险排查规则中未包含的数据;
31、当所述差异数据所包含的规则参数与所述风险排查规则中的规则参数不一致时,从多个所述变量数据中筛选出与所述差异数据一致的变量数据,并将与差异数据一致的变量数据的数量作为差异数据的相关值;
32、当所述差异数据的相关值大于风险排查规则的相关值时,将所述风险排查规则中的规则参数替换为所述差异数据所包含的规则参数。
33、一种风险排查的装置,包括:
34、获取单元,用于获取原始数据源、多个变量数据以及多个历史风险流水数据;
35、筛选单元,用于对于多个所述历史风险流水数据,从多个所述变量数据中筛选出与所述历史风险流水数据一致的变量数据,并将与所述历史风险流水数据一致的变量数据的数量作为历史风险流水数据的相关值;
36、选取单元,用于从所述多个历史风险流水数据的相关值中选取出大于预设阈值的相关值,并将所述相关值对应的历史风险流水数据标识为风险排查规则;所述风险排查规则包括规则参数;
37、第一统计单元,用于从所述原始数据源中筛选出符合所述风险排查规则的数据,并统计所述数据的数量,得到风险流水数据的数量;
38、第二统计单元,用于从所有历史风险流水数据中筛选出符合所述风险排查规则的目标历史风险流水数据,并统计所述目标历史风险流水数据的数量,得到目标历史风险流水数据的数量;
39、调整单元,用于根据所述风险流水数据的数量和所述目标历史风险流水数据的数量,对所述规则参数进行调整,得到调整后的规则参数;
40、排查单元,用于利用所述调整后的规则参数和所述风险排查规则对待排查流水数据进行风险排查,得到风险排查结果。
41、可选的,所述获取单元具体用于:
42、获取原始数据源和历史风险排查记录;所述原始数据源包括:资金流水数据、交易流水数据、客群信息数据以及行为痕迹数据;
43、将所述资金流水数据、所述交易流水数据、所述客群信息数据以及所述行为痕迹数据进行关联,得到关联后的数据;
44、从所述关联后的数据中选取预设数量的数据,得到多个变量数据;
45、将所述关联后的数据与所述历史风险排查记录进行关联,得到多个历史风险流水数据。
46、可选的,所述调整单元具体用于:
47、将所述风险流水数据的数量除以所述目标历史风险流水数据的数量,得到准确率;
48、将原始数据源的数量与所述风险流水数据的数量相减,得到非风险流水数据的数量;
49、将所述非风险流水数据的数量除以所述目标历史风险流水数据的数量,得到第一数值;
50、将1与所述第一数值相减,得到覆盖率;
51、当所述准确率不大于第一预设阈值和/或所述覆盖率不大于第二预设阈值时,对所述规则参数进行调整,得到调整后的规则参数。
52、可选的,还包括:
53、参数调整单元,用于当所述准确率值大于第一预设阈值,且所述覆盖率值不大于第二预设阈值时,不调整所述规则参数。
54、本技术提供的技术方案,获取原始数据源、多个变量数据以及多个历史风险流水数据;对于多个历史风险流水数据,从多个变量数据中筛选出与历史风险流水数据一致的变量数据,并将与历史风险流水数据一致的变量数据的数量作为历史风险流水数据的相关值;从多个历史风险流水数据的相关值中选取出大于预设阈值的相关值,并将相关值对应的历史风险流水数据标识为风险排查规则;从原始数据源中筛选出符合风险排查规则的数据,并统计数据的数量,得到风险流水数据的数量;从所有历史风险流水数据中筛选出符合风险排查规则的目标历史风险流水数据,并统计目标历史风险流水数据的数量,得到目标历史风险流水数据的数量;根据风险流水数据的数量和目标历史风险流水数据的数量,对规则参数进行调整,得到调整后的规则参数;利用调整后的规则参数和风险排查规则对待排查流水数据进行风险排查,得到风险排查结果。在本技术中,风险排查规则会根据风险排查情况定期进行更新,提升了风险识别的准确率,进而能够准确判定出员工是否存在异常行为。