一种风险识别方法、装置、设备及可读存储介质与流程

文档序号:28278370发布日期:2021-12-31 21:10阅读:76来源:国知局
一种风险识别方法、装置、设备及可读存储介质与流程

1.本技术涉及数据分析技术领域,尤其涉及一种风险识别方法、装置、设备及可读存储介质。


背景技术:

2.银行业欺诈风险已由传统的信贷、柜面、外部盗抢,向贸易融资、理财产品、银行卡以及电子银行等业务领域延伸,对银行资金安全、社会声誉乃至正常运营造成严重威胁。
3.现有技术中对公交易反欺诈是在特定交易场景或渠道上做完数据分析后,针对欺诈用户的交易风险特征制定相应的规则并应用于特定的交易场景或渠道。然而,随着银行业务的发展,对公的交易场景或渠道日渐繁杂,这种针对每一种场景都制定对应的反欺诈规则显然已不能快速地响应业务发展的需求,且现有技术的对公交易中的欺诈识别都是针对存在风险的某个用户进行识别,风险识别准确率较低。


技术实现要素:

4.本技术实施例提供一种风险识别方法、装置、设备及可读存储介质,可以提高风险识别的准确率。
5.第一方面,本技术提供一种风险识别方法,包括:
6.获取n个用户的用户数据,基于该n个用户的用户数据创建该n个用户之间的关系网络,一个用户的用户数据包括该一个用户与其他用户之间的关联数据,该关联数据包括用户之间的交易数据、担保数据以及投资数据中的至少一种,n为正整数;
7.基于该n个用户之间的关系网络对该n个用户进行划分,确定m个用户集合,每个用户集合中包括至少一个用户,m为小于或等于n的正整数;
8.基于该m个用户集合中每个用户集合包括的用户的用户数据,确定该m个用户集合中每个用户集合的风险指数,输出该风险指数。
9.结合第一方面,在一种可能的实现方式中,该基于该n个用户之间的关系网络对该n个用户进行划分,确定m个用户集合,包括:
10.将该n个用户确定为n个节点,一个用户对应一个节点;
11.计算该n个节点中的第一目标节点与其他n

1个节点之间的第一模块度,得到n

1个第一模块度,该第一模块度用于反映节点之间的关联程度,该第一目标节点为该n个节点中的任意一个节点;
12.若该n

1个第一模块度中的最大第一模块度大于模块度阈值,则将该第一目标节点和该n

1个模块度中的最大第一模块度对应的节点加入第一节点集合;
13.计算第二目标节点与其他n

3个节点之间的第二模块度,得到n

3个第二模块度,该第二目标节点为该n个节点中除该第一节点集合以外的任意一个节点;
14.若该n

3个第二模块度中的最大第二模块度大于该模块度阈值,则将该第二目标节点和该n

3个第二模块度中的最大第二模块度对应的节点加入第二节点集合,从该n个节
点中除该第一节点集合和该第二节点集合以外的剩余节点中选择任意一个剩余节点,计算该任意一个剩余节点与其他剩余节点之间的第三模块度,将该任意一个剩余节点和最大第三模块度对应的剩余节点加入第三节点集合,直至该n个节点全部加入节点集合得到m个节点集合为止,一个节点集合对应一个用户集合,该m个节点集合包括该第一节点集合、该第二节点集合以及该第三节点集合。
15.结合第一方面,在一种可能的实现方式中,该基于该n个用户之间的关系网络对该n个用户进行划分,确定m个用户集合,包括:
16.将该n个用户确定为n个节点,一个用户对应一个节点;
17.将该n个节点之间的第四模块度大于模块度阈值的任意两个节点加入同一个节点集合,得到k个节点集合,k为大于或等于m的正整数;
18.若该n个节点中存在第三目标节点与该n个节点中的任一节点之间的第五模块度小于或等于该模块度阈值,则计算该第三目标节点与第四节点集合之间的第五模块度,若该第三目标节点与该第四节点集合之间的第五模块度大于该模块度阈值,则将该第三目标节点加入该第四节点集合,该第三目标节点为该n个节点中除该k个节点集合以外的节点,该第四节点集合为该k个节点集合中的任意一个节点集合;
19.计算k个节点集合中的任意两个节点集合之间的第六模块度,若该任意两个节点集合之间的第六模块度大于该模块度阈值,则将该任意两个节点集合合并为一个节点集合,以得到m个节点集合。
20.结合第一方面,在一种可能的实现方式中,该用户数据还包括用户的异常数据,该异常数据包括黑名单数据、异常交易模式数据、异常交易行为数据、用户设备异常使用数据、用户联系信息异常数据中的至少一种;该n个用户之间的关系网络包括该n个用户之间的知识图谱。
21.结合第一方面,在一种可能的实现方式中,该基于该m个用户集合中每个用户集合包括的用户的用户数据,确定该m个用户集合中每个用户集合的风险指数,包括:
22.将该m个用户集合中每个用户集合包括的用户的用户数据与预设风险指标库进行匹配,得到该每个用户集合包括的用户的风险匹配结果,该风险匹配结果用于反映用户的风险情况;
23.基于该风险匹配结果确定该m个用户集合中每个用户集合的风险指数。
24.结合第一方面,在一种可能的实现方式中,该风险匹配结果包括与用户的用户数据匹配的p个参考风险指标,p为正整数;
25.该基于该风险匹配结果确定该m个用户集合中每个用户集合的风险指数,包括:
26.获取目标业务类型,以及该目标业务类型对应的p个参考风险指标的权重;
27.分别获取该p个参考风险指标关联的参考分数,基于该p个参考风险指标的权重与该p个参考风险指标关联的参考分数,确定该m个用户集合中每个用户集合的风险指数。
28.结合第一方面,在一种可能的实现方式中,该方法还包括:
29.若该m个用户集合中的第i个用户集合的风险指数大于风险阈值,则获取该第i个用户集合包括的用户的风险指标,以及该第i个用户集合包括的用户的关联用户的风险指标,i为正整数;
30.输出该第i个用户集合包括的用户的风险指标,以及该第i个用户集合包括的用户
的关联用户的风险指标。
31.第二方面,本技术提供一种风险识别装置,包括:
32.关系创建模块,用于获取n个用户的用户数据,基于该n个用户的用户数据创建该n个用户之间的关系网络,一个用户的用户数据包括该一个用户与其他用户之间的关联数据,该关联数据包括用户之间的交易数据、担保数据以及投资数据中的至少一种,n为正整数;
33.集合划分模块,用于基于该n个用户之间的关系网络对该n个用户进行划分,确定m个用户集合,每个用户集合中包括至少一个用户,m为小于或等于n的正整数;
34.风险确定模块,用于基于该m个用户集合中每个用户集合包括的用户的用户数据,确定该m个用户集合中每个用户集合的风险指数,输出该风险指数。
35.结合第二方面,在一种可能的实现方式中,该集合划分模块,包括:
36.第一确定单元,用于将该n个用户确定为n个节点,一个用户对应一个节点;
37.第一计算单元,用于计算该n个节点中的第一目标节点与其他n

1个节点之间的第一模块度,得到n

1个第一模块度,该第一模块度用于反映节点之间的关联程度,该第一目标节点为该n个节点中的任意一个节点;
38.第一加入单元,用于若该n

1个第一模块度中的最大第一模块度大于模块度阈值,则将该第一目标节点和该n

1个模块度中的最大第一模块度对应的节点加入第一节点集合;
39.第二计算单元,用于计算第二目标节点与其他n

3个节点之间的第二模块度,得到n

3个第二模块度,该第二目标节点为该n个节点中除该第一节点集合以外的任意一个节点;
40.第二加入单元,用于若该n

3个第二模块度中的最大第二模块度大于该模块度阈值,则将该第二目标节点和该n

3个第二模块度中的最大第二模块度对应的节点加入第二节点集合,从该n个节点中除该第一节点集合和该第二节点集合以外的剩余节点中选择任意一个剩余节点,计算该任意一个剩余节点与其他剩余节点之间的第三模块度,将该任意一个剩余节点和最大第三模块度对应的剩余节点加入第三节点集合,直至该n个节点全部加入节点集合得到m个节点集合为止,一个节点集合对应一个用户集合,该m个节点集合包括该第一节点集合、该第二节点集合以及该第三节点集合。
41.结合第二方面,在一种可能的实现方式中,该集合划分模块,包括:
42.第三加入单元,用于将该n个用户确定为n个节点,一个用户对应一个节点,将该n个节点之间的第四模块度大于模块度阈值的任意两个节点加入同一个节点集合,得到k个节点集合,k为大于或等于m的正整数;
43.第三计算单元,用于若该n个节点中存在第三目标节点与该n个节点中的任一节点之间的第五模块度小于或等于该模块度阈值,则计算该第三目标节点与第四节点集合之间的第五模块度,若该第三目标节点与该第四节点集合之间的第五模块度大于该模块度阈值,则将该第三目标节点加入该第四节点集合,该第三目标节点为该n个节点中除该k个节点集合以外的节点,该第四节点集合为该k个节点集合中的任意一个节点集合;
44.集合合并单元,用于计算k个节点集合中的任意两个节点集合之间的第六模块度,若该任意两个节点集合之间的第六模块度大于该模块度阈值,则将该任意两个节点集合合
并为一个节点集合,以得到m个节点集合。
45.结合第二方面,在一种可能的实现方式中,该用户数据还包括用户的异常数据,该异常数据包括黑名单数据、异常交易模式数据、异常交易行为数据、用户设备异常使用数据、用户联系信息异常数据中的至少一种;该n个用户之间的关系网络包括该n个用户之间的知识图谱。
46.结合第二方面,在一种可能的实现方式中,该风险确定模块,包括:
47.数据匹配单元,用于将该m个用户集合中每个用户集合包括的用户的用户数据与预设风险指标库进行匹配,得到该每个用户集合包括的用户的风险匹配结果,该风险匹配结果用于反映用户的风险情况;
48.数据确定单元,用于基于该风险匹配结果确定该m个用户集合中每个用户集合的风险指数。
49.结合第二方面,在一种可能的实现方式中,该风险匹配结果包括与用户的用户数据匹配的p个参考风险指标,p为正整数;该数据确定单元,具体用于:
50.获取目标业务类型,以及该目标业务类型对应的p个参考风险指标的权重;
51.分别获取该p个参考风险指标关联的参考分数,基于该p个参考风险指标的权重与该p个参考风险指标关联的参考分数,确定该m个用户集合中每个用户集合的风险指数。
52.结合第二方面,在一种可能的实现方式中,该风险识别装置,还包括:
53.风险获取模块,用于若该m个用户集合中的第i个用户集合的风险指数大于风险阈值,则获取该第i个用户集合包括的用户的风险指标,以及该第i个用户集合包括的用户的关联用户的风险指标,i为正整数;
54.风险输出模块,用于输出该第i个用户集合包括的用户的风险指标,以及该第i个用户集合包括的用户的关联用户的风险指标。
55.第三方面,本技术提供了一种计算机设备,包括:处理器、存储器、网络接口;
56.上述处理器与存储器、网络接口相连,其中,网络接口用于提供数据通信功能,上述存储器用于存储计算机程序,上述处理器用于调用上述计算机程序,以使包含该处理器的计算机设备执行上述风险识别方法。
57.第四方面,本技术提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行上述风险识别方法。
58.第五方面,本技术提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本技术第一方面中的各种可选方式中提供的风险识别方法。
59.本技术实施例中,获取n个用户的用户数据,基于n个用户的用户数据创建n个用户之间的关系网络;基于n个用户之间的关系网络对n个用户进行划分,确定m个用户集合;基于m个用户集合中每个用户集合包括的用户的用户数据,确定m个用户集合中每个用户集合的风险指数,输出风险指数。通过创建用户之间的关系网络,可以基于用户之间的关系网络对用户进行划分,例如可以基于用户之间的关系网络计算用户之间的关联程度,从而基于用户之间的关联程度将用户划分至不同的用户集合中。通过分析用户集合包括的每个用户
存在的风险情况,并根据用户集合包括的每个用户存在的风险情况确定用户集合的风险指数。由于不仅对单个用户进行了风险识别,还对用户所属的用户集合中的其他用户进行了风险识别,可以提高确定用户集合是否为诈骗团伙的准确率。通过从多个维度对用户存在的风险进行了识别,可以提高风险识别的准确率。
附图说明
60.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
61.图1是本技术实施例提供的一种风险识别方法的流程示意图;
62.图2是本技术实施例提供的一种节点划分示意图;
63.图3是本技术实施例提供的另一种风险识别方法的流程示意图;
64.图4是本技术实施例提供的一种风险识别装置的组成结构示意图;
65.图5是本技术实施例提供的一种计算机设备的组成结构示意图。
具体实施方式
66.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
67.本技术技术方案适用于对全量对公交易场景下(例如企业网银、数字口袋、银行企业直连,开发银行等场景)的所有用户的用户数据进行获取以及分析,从而确定该种场景下的每个用户所属的用户集合的风险指数,进而实现对场景下的诈骗团伙的识别。由于本技术技术方案中不仅对单个用户进行了风险识别,还对用户所属的用户集合中包括的所有用户进行了风险识别,即对用户所在的用户集合进行了风险识别,可以确定用户集合是否为诈骗团伙,提高风险识别的准确率。
68.请参见图1,图1是本技术实施例提供的一种风险识别方法的流程示意图;如图1所示,该风险识别方法可以应用于计算机设备。其中,计算机设备可以是独立的服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。该计算机设备还可以是一种电子设备,包括但不限于手机、平板电脑、台式电脑、笔记本电脑、掌上电脑、车载设备、增强现实/虚拟现实(augmented reality/virtual reality,ar/vr)设备、头盔显示器、可穿戴设备、智能音箱、数码相机、摄像头及其他具备网络接入能力的移动互联网设备(mobile internet device,mid)等等。如图1所示,该风险识别方法包括但不限于以下步骤:
69.s101,获取n个用户的用户数据,基于n个用户的用户数据创建n个用户之间的关系网络。
70.本技术实施例中,计算机设备可以获取n个用户的用户数据,基于n个用户的用户数据创建n个用户之间的关系网络。其中,一个用户的用户数据包括一个用户与其他用户之间的关联数据,关联数据包括用户之间的交易数据、担保数据以及投资数据中的至少一种,n为正整数。其中,用户的用户数据可以是指全量对公交易场景下的用户数据,即用户可以为在该场景下注册了对公账户的用户。全量对公交易场景例如可以包括但不限于企业网银、数字口袋、银行企业直连,开发银行等场景。用户可以包括自然人、法人或者其他组织,例如用户可以包括个人、机构、公司或者其他组织,则用户数据可以包括用户的工商数据、交易数据、担保数据、股权数据、法人数据、公司人员组成数据、地址信息以及联系方式等数据。
71.可选地,计算机设备可以提取用户数据中的三元组关系,例如可以提取用户的交易数据、担保数据、股权数据、法人数据、公司人员组成数据、地址信息以及联系方式等数据,将提取到的数据导入neo4j图数据库中,建立n个用户之间的关系网络,其中,n个用户之间的关系网络可以为n个用户之间的知识图谱,也可以为其他反映n个用户之间的关联关系的网络架构。
72.s102,基于n个用户之间的关系网络对n个用户进行划分,确定m个用户集合。
73.本技术实施例中,计算机设备可以基于n个用户之间的关系网络对n个用户进行划分,确定m个用户集合。其中,每个用户集合中包括至少一个用户,m为小于或等于n的正整数。
74.一种可能的实现方式中,计算机设备可以计算n个用户之间的关联程度,从而基于用户之间的关联程度对n个用户进行划分,确定m个用户集合。具体地,计算机设备可以将n个用户确定为n个节点,一个用户对应一个节点;计算n个节点中的第一目标节点与其他n

1个节点之间的第一模块度,得到n

1个第一模块度,第一目标节点为n个节点中的任意一个节点。进一步地,若n

1个第一模块度中的最大第一模块度大于模块度阈值,则计算机设备可以将第一目标节点和n

1个第一模块度中的最大第一模块度对应的节点加入第一节点集合;计算第二目标节点与其他n

3个节点之间的第二模块度,得到n

3个第二模块度,其中,第二目标节点为n个节点中除第一节点集合以外的任意一个节点。进一步地,若n

3个第二模块度中的最大第二模块度大于模块度阈值,则计算机设备可以将第二目标节点和n

3个第二模块度中的最大第二模块度对应的节点加入第二节点集合,从n个节点中除第一节点集合和第二节点集合以外的剩余节点中选择任意一个剩余节点,计算任意一个剩余节点与其他剩余节点之间的第三模块度,将任意一个剩余节点和最大第三模块度对应的剩余节点加入第三节点集合,直至n个节点全部加入节点集合得到m个节点集合为止。其中,第一模块度、第二模块度以及第三模块度均用于反映节点之间的关联程度。一个节点集合对应一个用户集合,m个节点集合包括第一节点集合、第二节点集合以及第三节点集合。
75.举例来说,假设n等于6,则计算机设备可以将6个用户确定为6个节点,6个节点分别为节点a1、a2、a3、a4、a5、a6,一个用户对于一个节点,计算机设备可以将节点a1确定为第一目标节点,则可以分别计算节点a1与节点a2、a3、a4、a5、a6之间的第一模块度,得到5个第一模块度,若5个第一模块度中的最大第一模块度为节点a1与节点a2之间的第一模块度,且节点a1与节点a2之间的第一模块度大于模块度阈值,则将节点a1和节点a2加入第一节点集合。进一步地,计算机设备可以确定节点a3为第二目标节点,则分别计算节点a3与节点a4、
a5、a6之间的第二模块度,得到3个第二模块度,若3个第二模块度中的最大第二模块度为节点a3与节点a4之间的第二模块度,且节点a3与节点a4之间的第二模块度大于模块度阈值,则将节点a3与节点a4加入第二节点集合1。进一步地,计算机设备可以计算剩余节点如节点a5与节点a6之间的第三模块度,若节点a5与节点a6之间的第三模块度大于模块度阈值,则将节点a5与节点a6加入第三节点集合,使得6个节点全部加入节点集合得到m个(如3个)节点集合。
76.通过上述基于n个用户中每两个用户之间的模块度对n个用户进行划分,可以将n个用户两两划分,得到n个节点中与任意一个节点关联程度最高的节点,即确定n个用户中与每个用户关联程度最高的用户,并将每两个用户组成用户集合,便于后续步骤中结合用户本身,以及与用户关联程度较高的用户进行分析,确定用户之间的风险情况,提高风险识别的准确率。
77.另一种可能的实现方式中,计算机设备可以基于n个用户之间的关联程度对n个用户进行划分,得到k个用户集合之后,还可以对k个用户集合进行合并,得到m个用户集合。具体地,计算机设备可以将n个用户确定为n个节点,一个用户对应一个节点;将n个节点之间的第四模块度大于模块度阈值的任意两个节点加入同一个节点集合,得到k个节点集合,k为大于或等于m的正整数;若n个节点中存在第三目标节点与n个节点中的任一节点之间的第五模块度小于或等于模块度阈值,则计算第三目标节点与第四节点集合之间的第五模块度,若第三目标节点与第四节点集合之间的第五模块度大于模块度阈值,则将第三目标节点加入第四节点集合。其中,第三目标节点为n个节点中除k个节点集合以外的节点,第四节点集合为k个节点集合中的任意一个节点集合。进一步地,计算机设备可以计算k个节点集合中的任意两个节点集合之间的第六模块度,若任意两个节点集合之间的第六模块度大于模块度阈值,则将任意两个节点集合合并为一个节点集合,以得到m个节点集合。第四模块度用于反映节点之间的关联程度,第五模块度用于反映节点与节点集合之间的关联程度,第六模块度用于反映节点集合与节点集合之间的关联程度。
78.可选地,若第三目标节点与第四节点集合之间的第五模块度小于或等于模块度阈值,则计算机设备可以重新计算第三目标节点与k个节点集合中除第四节点集合外的第五节点集合之间的第五模块度,若第三目标节点与第五节点集合之间的第五模块度大于模块度阈值,则将第三目标节点加入第五节点集合,若第三目标节点与第五节点集合之间的第五模块度小于或等于模块度阈值,则重新计算第三目标节点与k个节点集合中其他节点集合之间的第五模块度,直至第三目标节点加入k个节点集合中的一个节点集合。
79.可以理解的是,若第三目标节点与k个节点集合中的每个节点集合之间的第五模块度均小于或等于模块度阈值,表示第三目标节点与n个节点中的其他节点,以及节点集合之间的关联程度较低,则可以将该第三目标节点加入第六节点集合,第六节点集合可以由第三目标节点构成。
80.也就是说,在该种实现方式中,计算机设备通过计算n个节点中每两个节点之间的第四模块度,可以确定k个由两个节点组成的节点集合。进一步地,若n个节点中还剩下除k个节点集合以外的第三目标节点(单个节点),则计算机设备可以分别计算第三目标节点与k个节点集合之间的第五模块度,若第三目标节点与第四节点集合之间的第五模块度大于模块度阈值,则将第三目标节点加入第四节点集合。或者,若第三目标节点与第四节点集合
之间的第五模块度小于或等于模块度阈值,则计算机设备可以计算第三目标节点与k个节点集合中除第四节点集合以外的节点集合之间的第五模块度,从而实现将第三目标节点加入到k个节点集合中的一个节点集合中。此时,计算机设备将n个节点分别加入到与n个节点对应的k个节点集合中,n个节点中不再有单个节点。再进一步地,计算机设备可以计算k个节点集合中任意两个节点集合之间的第六模块度,若任意两个节点集合之间的第六模块度高于模块度阈值,则可以将该任意两个节点集合合并为一个节点集合,最终得到m个节点集合。该过程通过不断计算节点之间的模块度,节点与节点集合之间的模块度,以及节点集合与节点集合之间的模块度,可以实现对n个节点的划分,尽可能多的将关联程度较高的节点划分至同一个节点集合,得到m个节点集合。
81.可选地,节点之间的模块度是评估关系网络划分好坏的度量方法,即评价用户之间的关联程度的方法,其物理含义是用户集合内节点的连边数与随机情况下的边数之差,模块度的取值范围是[

0.5,1),模块度的计算公式可以如公式(1

1)所示:
[0082][0083]
其中,q表示模块度,c
i
表示节点i所属的节点集合,c
j
表示节点j所属的节点集合,当节点未加入节点集合时,可将节点看作为一个集合,即c
i
可以表示节点i,c
j
可以表示节点j。m=0.5
×

ij
a
ij
表示所有边的权重之和,a
ij
表示节点i和节点j之间边的权重,k
i
=∑
j
a
ij
表示所有与节点i相连的边的权重之和,k
j
=∑
i
a
ij
表示所有与节点j相连的边的权重之和。其中,当节点i和节点j属于同一个节点集合时,δ(c
i
,c
j
)等于1,当节点i和节点j不属于同一个节点集合时,δ(c
i
,c
j
)等于0。可选地,节点之间边的初始权重可以为1或者其他默认值,若一个节点与多个节点之间的模块度相等且大于模块度阈值,则可以将该节点与多个节点中的任意一个节点加入同一个节点集合。上述模块度公式(1

1)还可以简化为下列公式(1

2):
[0084][0085]
其中,∑in表示节点集合c内的所有节点之间的边权重之和,∑tot表示与节点集合c内的节点相连的边的权重之和。
[0086]
可选地,如图2所示,图2是本技术实施例提供的一种节点划分示意图,图2中包括12个节点(图2中的黑色小圆点表示节点),节点之间的连接线表示节点之间的边。对于节点集合1来说,∑in表示节点集合1中的4个节点之间的边(实线)权重之和,∑tot表示节点集合1与节点集合3之间的边(虚线)权重、以及节点集合1与节点集合2之间的边(虚线)权重之和。通过计算节点之间的模块度,节点与节点集合之间的模块度,以及节点集合与节点集合之间的模块度,最终将12个节点划分为3个节点集合,如节点集合1、节点集合2以及节点集合3,即可以将12个用户划分至3个不同的用户集合。
[0087]
由于节点之间的模块度用于反映节点之间的关联程度,通过计算n个节点之间的模块度,可以实现基于节点之间的关联程度对节点进行划分,得到节点集合,即可以基于用户之间的关联程度对n个用户进行划分,得到m个用户集合,便于后续对每个用户集合中用
户的用户数据进行判断,从而确定出诈骗团伙。
[0088]
s103,基于m个用户集合中每个用户集合包括的用户的用户数据,确定m个用户集合中每个用户集合的风险指数,输出风险指数。
[0089]
本技术实施例中,计算机设备可以基于m个用户集合中每个用户集合包括的用户的用户数据,确定m个用户集合中每个用户集合的风险指数,输出风险指数。通过计算m个用户集合中每个用户集合包括的用户的用户数据,可以得到每个用户集合的风险指数,风险指数可以表示该用户集合为诈骗团伙的可能性。风险指数越高,表示该用户集合为诈骗团伙的可能性越高;风险指数越低,表示该用户集合为诈骗团伙的可能性越低。通过输出每个用户集合的风险指数,相关管理用户可以查看到每个用户集合中的风险情况,从而可以对每个用户集合以及用户集合中包括的用户进行进一步判断以及处理。
[0090]
可选地,用户数据还包括用户的异常数据,用户的异常数据包括黑名单数据、异常交易模式数据、异常交易行为数据、用户设备异常使用数据、用户联系信息异常数据中的至少一种。黑名单数据可以包括但不限于命中小消黑名单、商户黑名单、电信诈骗名单、全国失信人员名单、支票停限售名单、反洗钱可疑用户名单、运营关注名单等数据。异常交易模式数据可以包括但不限于对公交易流水中某时间段内存在资金分散转入集中转出、集中转入分散转出或资金构成循环互转等数据。异常交易行为数据可以包括但不限于对公交易流水中某时间段内存在资金出入平衡、资金快进快出不留余额、交易金额特殊、小额试探后大额交易、疑似贸易背景不符、高频高额异常转账或大量公转私等数据。用户设备异常使用数据可以包括但不限于用户存在共用ip地址、mac地址的情况,或用户在某时间段内app端或pc登录时间与正常用户分布不一,且频率较高等数据。用户联系信息异常数据可以包括但不限于用户存在批量注册公司,注册地址偏远,无正式固定办公经营场所、无准确联系方式等数据。
[0091]
具体地,计算机设备确定m个用户集合中每个用户集合的风险指数的方法可以包括:将m个用户集合中每个用户集合包括的用户的用户数据与预设风险指标库进行匹配,得到每个用户集合包括的用户的风险匹配结果,其中,风险匹配结果用于反映用户的风险情况;基于风险匹配结果确定m个用户集合中每个用户集合的风险指数。由于每个用户集合中包括至少两个用户,则计算机设备可以分别将至少两个用户的中每个用户的用户数据,与预设风险指标库进行匹配,得到每个用户集合包括的用户的风险匹配结果,从而确定每个用户的用户数据与预设风险指标库中的哪些参考风险指标匹配;再基于风险匹配结果确定该任意一个用户集合的风险指数,从而确定m个用户集合的风险指数。可选地,预设风险指标库可以预先设置多种参考风险指标,其中,参考风险指标可以包括黑名单数据、异常交易模式数据、异常交易行为数据、用户设备异常使用数据、用户联系信息异常数据中的至少一种。
[0092]
可选地,风险匹配结果可以包括与用户的用户数据匹配的p个参考风险指标,p为正整数,也就是说,用户的用户数据可能与预设风险指标库中的p项参考风险指标匹配;则计算机设备可以获取目标业务类型,基于目标业务类型对用户集合包括的用户的风险指数进行调整,使得调整后的用户集合的风险指数可以更准确反映用户集合的风险情况。具体地,计算机设备可以获取目标业务类型,以及目标业务类型对应的p个参考风险指标的权重;分别获取p个参考风险指标关联的参考分数,基于p个参考风险指标的权重与p个参考风
险指标关联的参考分数,确定m个用户集合中每个用户集合的风险指数。
[0093]
具体地,计算机设备可以预先设置预设风险指标库中包括的多种参考风险指标,以及每种参考风险指标关联的参考分数,则在确定用户的用户数据与预设风险库中的参考风险指标匹配时,可以基于匹配的参考风险指标关联的参考分数确定用户集合的风险指数。进一步地,计算机设备可以设置每种业务类型对应的各个参考风险指标的权重,则当获取到当前业务所属的目标业务类型时,确定目标业务类型对应的p个参考风险指标的权重,从而基于权重对p个参考风险指标关联的参考分数进行调整,得到用户集合的风险指数。例如在一些业务类型中,黑灰名单数据对该业务的影响程度大于异常交易模式数据,则黑灰名单数据的权重可以大于异常交易模式数据的权重。
[0094]
可选地,计算机设备可以根据用户集合中每个用户存在的风险指标关联的分数,以及风险指标对应的权重,计算得到每个用户的风险指数,再根据用户集合中包括的用户的风险指数计算得到用户集合的风险指数。例如,计算机设备可以将用户集合包括的每个用户的风险指数之和确定为该用户集合的风险指数,或者将用户集合中每个用户的风险指数的平均值确定为该用户集合的风险指数,本方案中不对此进行限定。
[0095]
举例来说,例如p等于3,即用户1的用户数据中存在3个风险指标与预设风险指标库中的参考风险指标匹配,例如风险指标1与黑名单数据匹配、风险指标2与异常交易模式数据匹配、风险指标3与用户设备异常使用数据匹配。其中,目标业务类型对应的3个参考风险指标的权重分别为x1、x2、x3,且3个参考风险指标关联的参考分数分别为y1、y2、y3,即用户1存在的风险指标关联的分数分别为y1、y2、y3,则用户1的风险指数为x1*y1+x2*y2+x3*y3。假设该用户所属的用户集合中包括3个用户,分别为用户1、用户2、以及用户3,用户2的风险指数为x4*y1+x5*y2、以及用户3的风险指数为x6*y2+x7*y3,则计算得到该用户集合的风险指数可以为3个用户的风险指数之和,例如x1*y1+x2*y2+x3*y3+x4*y1+x5*y2+x6*y2+x7*y3,或者也可以为3个用户的风险指数的平均值,例如(x1*y1+x2*y2+x3*y3+x4*y1+x5*y2+x6*y2+x7*y3)/3,本技术实施例中不做限定。由于用户集合的风险指数是通过用户集合包括的用户的风险指数计算得到的,因此用户集合的风险指数可以更准确反映该用户集合包括的用户的风险情况,从而确定用户集合是否为诈骗团伙。
[0096]
可选地,计算机设备还可以根据m个用户集合中每个用户集合的风险指数进行排序,例如升序排序或者降序排序,并输出排序后的m个用户集合中每个用户集合的风险指数,便于相关管理用户快速查看m个用户集合的风险指数,从而实现快速对用户集合以及用户集合包括的用户进行相应管理。
[0097]
本技术实施例中,通过创建用户之间的关系网络,可以基于用户之间的关系网络对用户进行划分,例如可以基于用户之间的关系网络计算用户之间的关联程度,从而基于用户之间的关联程度将用户划分至不同的用户集合中。通过分析用户集合包括的每个用户存在的风险情况,并根据用户集合包括的每个用户存在的风险情况确定用户集合的风险指数。由于不仅对单个用户进行了风险识别,还对用户所属的用户集合中的其他用户进行了风险识别,可以提高确定用户集合是否为诈骗团伙的准确率。通过从多个维度对用户存在的风险进行了识别,可以提高风险识别的准确率。
[0098]
可选的,请参见图3,图3是本技术实施例提供的另一种风险识别方法的流程示意图。该风险识别方法可以应用于计算机设备;如图3所示,该风险识别方法包括但不限于以
下步骤:
[0099]
s201,获取n个用户的用户数据,基于n个用户的用户数据创建n个用户之间的关系网络。
[0100]
s202,基于n个用户之间的关系网络对n个用户进行划分,确定m个用户集合。
[0101]
s203,基于m个用户集合中每个用户集合包括的用户的用户数据,确定m个用户集合中每个用户集合的风险指数。
[0102]
本技术实施例中,步骤s201~步骤s203的具体实现方式可以参考图1中步骤s101~步骤s103中的实现方式,此处不再赘述。
[0103]
s204,若m个用户集合中的第i个用户集合的风险指数大于风险阈值,则获取第i个用户集合包括的用户的风险指标,以及第i个用户集合包括的用户的关联用户的风险指标。
[0104]
本技术实施例中,计算机设备可以预先设置风险阈值,若用户集合的风险指数大于风险阈值,表示该用户集合中的风险指数较高,则该用户集合为诈骗团伙的可能性较高,可以输出该用户集合。可选地,若用户集合的风险指数小于或等于风险阈值,表示该用户集合中的风险指数较低,则该用户集合为诈骗团伙的可能性较低,可以不输出该用户集合。
[0105]
具体地,若m个用户集合中的第i个用户集合的风险指数大于风险阈值,则计算机设备可以获取第i个用户集合包括的用户的风险指标,以及第i个用户集合包括的用户的关联用户的风险指标。i为正整数,第i个用户集合为m个用户集合中的任意一个。也就是说,若m个用户集合中存在风险指数大于风险阈值的用户集合,则计算机设备可以获取该用户集合包括的每个用户的风险指标,还可以获取该用户集合包括的每个用户的关联用户的风险指标,关联用户可以包括除该用户集合以外的用户集合中与该用户集合中的任意一个用户存在关联关系的用户,如图2所示,用户集合1也是指节点集合1,则节点集合1中节点的关联节点可以包括节点集合2中与节点集合1具有连接关系的节点,也就是说,用户集合1中用户的关联用户可以包括用户集合2中与用户集合1具有连接关系的用户。
[0106]
也就是说,用户与关联用户之间存在关联数据,例如用户之间进行了交易、担保以及投资中的至少一种,由于不同用户集合包括的用户之间存在关联数据,则可能存在风险。例如用户集合1的风险指数大于风险阈值时,用户集合1可能为诈骗团伙,后续通过输出与用户集合1具有关联数据的用户,可以实现更准确的找到诈骗团伙的同谋,提高风险识别的完整性。
[0107]
可选地,计算机设备也可以获取第i个用户集合包括的每个用户的风险指标,通过获取该用户集合包括的每个用户的风险指标,可以挖掘出该用户集合存在的统一风险指标,便于识别出该用户集合是否为诈骗团伙,从而对用户集合、用户集合包括的用户以及相关联的用户进行相应管理。
[0108]
s205,输出第i个用户集合包括的用户的风险指标,以及第i个用户集合包括的用户的关联用户的风险指标。
[0109]
本技术实施例中,计算机设备通过输出第i个用户集合包括的用户的风险指标,以及第i个用户集合包括的用户的关联用户的风险指标。相关管理用户可以查看到该用户集合的风险指数,以及该用户集合中包括的每个用户的风险指标,以及该用户集合中每个用户的关联用户的风险指标,从而可以进一步对该用户集合以及用户集合中包括的每个用户进行判断,确定该用户集合是否为诈骗团伙,在确定用户集合为诈骗团伙的情况下,可以将
用户集合包括的每个用户的用户数据发送至相关管理机构,例如公检法机构进行相应判断以及处理。
[0110]
本技术实施例中,通过创建用户之间的关系网络,可以基于用户之间的关系网络对用户进行划分,例如可以基于用户之间的关系网络计算用户之间的关联程度,从而基于用户之间的关联程度将用户划分至不同的用户集合中。通过分析用户集合包括的每个用户存在的风险情况,并根据用户集合包括的每个用户存在的风险情况确定用户集合的风险指数。由于不仅对单个用户进行了风险识别,还对用户所属的用户集合中的其他用户进行了风险识别,可以提高确定用户集合是否为诈骗团伙的准确率。通过从多个维度对用户存在的风险进行了识别,可以提高风险识别的准确率。通过对m个用户集合中风险指数大于风险阈值的用户集合进行获取,可以实现根据用户集合的风险指数进行预警,相关管理用户可以快速确定预警的用户集合,从而提高风险识别效率。
[0111]
上面介绍了本技术实施例的方法,下面介绍本技术实施例的装置。
[0112]
参见图4,图4是本技术实施例提供的一种风险识别装置的组成结构示意图,上述风险识别装置可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如该风险识别装置为一个应用软件;该风险识别装置可以用于执行本技术实施例提供的风险识别方法中的相应步骤。该风险识别装置40包括:
[0113]
关系创建模块41,用于获取n个用户的用户数据,基于该n个用户的用户数据创建该n个用户之间的关系网络,一个用户的用户数据包括该一个用户与其他用户之间的关联数据,该关联数据包括用户之间的交易数据、担保数据以及投资数据中的至少一种,n为正整数;
[0114]
集合划分模块42,用于基于该n个用户之间的关系网络对该n个用户进行划分,确定m个用户集合,每个用户集合中包括至少一个用户,m为小于或等于n的正整数;
[0115]
风险确定模块43,用于基于该m个用户集合中每个用户集合包括的用户的用户数据,确定该m个用户集合中每个用户集合的风险指数,输出该风险指数。
[0116]
可选地,该集合划分模块42,包括:
[0117]
第一确定单元421,用于将该n个用户确定为n个节点,一个用户对应一个节点;
[0118]
第一计算单元422,用于计算该n个节点中的第一目标节点与其他n

1个节点之间的第一模块度,得到n

1个第一模块度,该第一模块度用于反映节点之间的关联程度,该第一目标节点为该n个节点中的任意一个节点;
[0119]
第一加入单元423,用于若该n

1个第一模块度中的最大第一模块度大于模块度阈值,则将该第一目标节点和该n

1个模块度中的最大第一模块度对应的节点加入第一节点集合;
[0120]
第二计算单元424,用于计算第二目标节点与其他n

3个节点之间的第二模块度,得到n

3个第二模块度,该第二目标节点为该n个节点中除该第一节点集合以外的任意一个节点;
[0121]
第二加入单元425,用于若该n

3个第二模块度中的最大第二模块度大于该模块度阈值,则将该第二目标节点和该n

3个第二模块度中的最大第二模块度对应的节点加入第二节点集合,从该n个节点中除该第一节点集合和该第二节点集合以外的剩余节点中选择任意一个剩余节点,计算该任意一个剩余节点与其他剩余节点之间的第三模块度,将该任
意一个剩余节点和最大第三模块度对应的剩余节点加入第三节点集合,直至该n个节点全部加入节点集合得到m个节点集合为止,一个节点集合对应一个用户集合,该m个节点集合包括该第一节点集合、该第二节点集合以及该第三节点集合。
[0122]
可选地,该集合划分模块42,包括:
[0123]
第三加入单元426,用于将该n个用户确定为n个节点,一个用户对应一个节点,将该n个节点之间的第四模块度大于模块度阈值的任意两个节点加入同一个节点集合,得到k个节点集合,k为大于或等于m的正整数;
[0124]
第三计算单元427,用于若该n个节点中存在第三目标节点与该n个节点中的任一节点之间的第五模块度小于或等于该模块度阈值,则计算该第三目标节点与第四节点集合之间的第五模块度,若该第三目标节点与该第四节点集合之间的第五模块度大于该模块度阈值,则将该第三目标节点加入该第四节点集合,该第三目标节点为该n个节点中除该k个节点集合以外的节点,该第四节点集合为该k个节点集合中的任意一个节点集合;
[0125]
集合合并单元428,用于计算k个节点集合中的任意两个节点集合之间的第六模块度,若该任意两个节点集合之间的第六模块度大于该模块度阈值,则将该任意两个节点集合合并为一个节点集合,以得到m个节点集合。
[0126]
可选地,该用户数据还包括用户的异常数据,该异常数据包括黑名单数据、异常交易模式数据、异常交易行为数据、用户设备异常使用数据、用户联系信息异常数据中的至少一种;该n个用户之间的关系网络包括该n个用户之间的知识图谱。
[0127]
可选地,该风险确定模块43,包括:
[0128]
数据匹配单元431,用于将该m个用户集合中每个用户集合包括的用户的用户数据与预设风险指标库进行匹配,得到该每个用户集合包括的用户的风险匹配结果,该风险匹配结果用于反映用户的风险情况;
[0129]
数据确定单元432,用于基于该风险匹配结果确定该m个用户集合中每个用户集合的风险指数。
[0130]
可选地,该风险匹配结果包括与用户的用户数据匹配的p个参考风险指标,p为正整数;该数据确定单元432,具体用于:
[0131]
获取目标业务类型,以及该目标业务类型对应的p个参考风险指标的权重;
[0132]
分别获取该p个参考风险指标关联的参考分数,基于该p个参考风险指标的权重与该p个参考风险指标关联的参考分数,确定该m个用户集合中每个用户集合的风险指数。
[0133]
可选地,该风险识别装置40,还包括:
[0134]
风险获取模块44,用于若该m个用户集合中的第i个用户集合的风险指数大于风险阈值,则获取该第i个用户集合包括的用户的风险指标,以及该第i个用户集合包括的用户的关联用户的风险指标,i为正整数;
[0135]
风险输出模块45,用于输出该第i个用户集合包括的用户的风险指标,以及该第i个用户集合包括的用户的关联用户的风险指标。
[0136]
需要说明的是,图4对应的实施例中未提及的内容可参见方法实施例的描述,这里不再赘述。
[0137]
本技术实施例中,通过创建用户之间的关系网络,可以基于用户之间的关系网络对用户进行划分,例如可以基于用户之间的关系网络计算用户之间的关联程度,从而基于
用户之间的关联程度将用户划分至不同的用户集合中。通过分析用户集合包括的每个用户存在的风险情况,并根据用户集合包括的每个用户存在的风险情况确定用户集合的风险指数。由于不仅对单个用户进行了风险识别,还对用户所属的用户集合中的其他用户进行了风险识别,可以提高确定用户集合是否为诈骗团伙的准确率。通过从多个维度对用户存在的风险进行了识别,可以提高风险识别的准确率。
[0138]
参见图5,图5是本技术实施例提供的一种计算机设备的组成结构示意图。如图5所示,上述计算机设备50可以包括:处理器501,网络接口504和存储器505,此外,上述计算机设备50还可以包括:用户接口503,和至少一个通信总线502。其中,通信总线502用于实现这些组件之间的连接通信。其中,用户接口503可以包括显示屏(display)、键盘(keyboard),可选用户接口503还可以包括标准的有线接口、无线接口。网络接口504可选的可以包括标准的有线接口、无线接口(如wi

fi接口)。存储器505可以是高速ram存储器,也可以是非易失性的存储器(non

volatile memory),例如至少一个磁盘存储器。存储器505可选的还可以是至少一个位于远离前述处理器501的存储装置。如图5所示,作为一种计算机可读存储介质的存储器505中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
[0139]
在图5所示的计算机设备50中,网络接口504可提供网络通讯功能;而用户接口503主要用于为用户提供输入的接口;而处理器501可以用于调用存储器505中存储的设备控制应用程序,以实现:
[0140]
获取n个用户的用户数据,基于该n个用户的用户数据创建该n个用户之间的关系网络,一个用户的用户数据包括该一个用户与其他用户之间的关联数据,该关联数据包括用户之间的交易数据、担保数据以及投资数据中的至少一种,n为正整数;
[0141]
基于该n个用户之间的关系网络对该n个用户进行划分,确定m个用户集合,每个用户集合中包括至少一个用户,m为小于或等于n的正整数;
[0142]
基于该m个用户集合中每个用户集合包括的用户的用户数据,确定该m个用户集合中每个用户集合的风险指数,输出该风险指数。
[0143]
应当理解,本技术实施例中所描述的计算机设备50可执行前文图1、图3所对应实施例中对上述一种风险识别方法的描述,也可执行前文图4所对应实施例中对上述一种风险识别装置的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
[0144]
本技术实施例中,通过创建用户之间的关系网络,可以基于用户之间的关系网络对用户进行划分,例如可以基于用户之间的关系网络计算用户之间的关联程度,从而基于用户之间的关联程度将用户划分至不同的用户集合中。通过分析用户集合包括的每个用户存在的风险情况,并根据用户集合包括的每个用户存在的风险情况确定用户集合的风险指数。由于不仅对单个用户进行了风险识别,还对用户所属的用户集合中的其他用户进行了风险识别,可以提高确定用户集合是否为诈骗团伙的准确率。通过从多个维度对用户存在的风险进行了识别,可以提高风险识别的准确率。
[0145]
本技术实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令当被计算机执行时使该计算机执行如前述实施例该的方法,该计算机可以为上述提到的计算机设备的一部分。例如为上述的处
理器501。作为示例,程序指令可被部署在一个计算机设备上执行,或者被部署位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链网络。
[0146]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,该的存储介质可为磁碟、光盘、只读存储记忆体(read

only memory,rom)或随机存储记忆体(random access memory,ram)等。
[0147]
以上所揭露的仅为本技术较佳实施例而已,当然不能以此来限定本技术之权利范围,因此依本技术权利要求所作的等同变化,仍属本技术所涵盖的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1