一种团伙挖掘方法、装置、设备及可读存储介质与流程

文档序号:30224023发布日期:2022-05-31 23:52阅读:184来源:国知局
一种团伙挖掘方法、装置、设备及可读存储介质与流程

1.本发明涉及安全保障技术领域,特别是涉及一种团伙挖掘方法、装置、设 备及可读存储介质。


背景技术:

2.团伙挖掘是反洗钱监测系统中的重要组成部分,团伙挖掘主要是 识别洗钱中的团伙洗钱模式,识别可疑客户的亲密联系客户。现有团 伙挖掘方案一般应用交易关系进行组网,根据收付款关系构成有向图, 然后挖掘各种类型可疑客户的密切联系客户作为团伙案例进行预警。
[0003][0004]
上述应用交易关系进行组网的团伙挖掘方案仅适用于对私场景或者实际 业务中对私交易(笔数、金额)占比较大的情况,在其他业务场景下均无法实 现有效的挖掘识别,应用范围较窄。
[0005]
综上所述,如何实现在各种业务场景下的有效团伙挖掘,是目前本领域技 术人员急需解决的技术问题。


技术实现要素:

[0006]
本发明的目的是提供一种团伙挖掘方法、装置、设备及可读存储介质,以 实现在各种业务场景下的有效团伙挖掘。
[0007]
为解决上述技术问题,本发明提供如下技术方案:
[0008]
一种团伙挖掘方法,包括:
[0009]
接收用户交易数据;
[0010]
根据所述用户交易数据对应的业务场景中的交易类型确定组图方式;
[0011]
若确定所述组图方式为交易关系组图,根据交易关系为所述用户交易数据 构建关联网络;
[0012]
若确定所述组图方式为其他关系组图,提取所述用户交易数据中的客户关 联关系;
[0013]
按组网规则对所述客户关联关系进行筛选,得到候选组网关系;
[0014]
若所述候选组网关系为强关系组图,根据候选组网关系为所述用户交易数 据构建关联网络;
[0015]
若所述候选组网关系为弱关系组图,根据所述候选组网关系筛选所述用户 交易数据中的可疑客户构建关联网络;
[0016]
根据所述关联网络进行可疑客户及其团伙组网分析,得到团伙挖掘结果。
[0017]
可选地,所述根据所述用户交易数据对应的业务场景中的交易类型确定组 图方式,包括:
[0018]
若所述用户交易数据对应的业务场景中只有对私交易,确定为所述交易关 系组
图;
[0019]
若所述用户交易数据对应的业务场景中只有对公交易,确定为所述其他关 系组图;
[0020]
若所述用户交易数据对应的业务场景中包括对私交易以及对公交易,确定 所述业务场景中风险交易场景的主要交易类型;若所述主要交易类型为对私交 易,确定为所述交易关系组图;若所述主要交易类型为对公交易,确定为所述 其他关系组图。
[0021]
可选地,所述按组网筛选规则对所述客户关联关系进行筛选,包括:
[0022]
剔除所述客户关联关系中无区分性的关系,得到第一关系;
[0023]
确定各所述第一关系对应的交易数据量,剔除所述交易数据量不在第一范 围内的关系,得到第二关系;
[0024]
确定各所述第二关系的取值集合,剔除所述取值集合的量级不在第二范围 内的关系,得到第三关系;
[0025]
剔除所述第三关系中无区分性的取值集合,得到第四关系;
[0026]
将所述第四关系作为所述候选组网关系。
[0027]
可选地,所述根据所述候选组网关系筛选所述用户交易数据中的可疑客户 构建关联网络,包括:
[0028]
筛选出所述用户交易数据中的可疑客户,得到可疑客户集合;
[0029]
判断所述可疑客户集合的总量是否大于阈值;
[0030]
如果是,利用强关系组网方式对所述进行关联网络构建,作为原始组图; 对所述原始组图进行社区挖掘,得到可疑社区集合;在可疑社区集合中利用所 述候选组网关系构建关联网络;
[0031]
如果否,根据候选组网关系为所述可疑客户集合构建关联网络。
[0032]
可选地,在所述按组网规则对所述客户关联关系进行筛选,得到候选组网 关系之后,还包括:剔除候选组网关系中的异常取值。
[0033]
一种团伙挖掘装置,包括:
[0034]
数据接收单元,用于接收用户交易数据;
[0035]
组图方式确定单元,用于根据所述用户交易数据对应的业务场景中的交易 类型确定组图方式;
[0036]
交易关系组图单元,用于若确定所述组图方式为交易关系组图,根据交易 关系为所述用户交易数据构建关联网络;
[0037]
其他关系确定单元,用于若确定所述组图方式为其他关系组图,提取所述 用户交易数据中的客户关联关系;
[0038]
关系筛选单元,用于按组网规则对所述客户关联关系进行筛选,得到候选 组网关系;
[0039]
强关系组图单元,用于若所述候选组网关系为强关系组图,根据候选组网 关系为所述用户交易数据构建关联网络;
[0040]
弱关系组图单元,用于若所述候选组网关系为弱关系组图,根据所述候选 组网关系筛选所述用户交易数据中的可疑客户构建关联网络;
[0041]
关联网络分析单元,用于根据所述关联网络进行可疑客户及其团伙组网分 析,得
到团伙挖掘结果。
[0042]
可选地,所述组图方式确定单元包括:
[0043]
对私确定子单元,用于若所述用户交易数据对应的业务场景中只有对私交 易,确定为所述交易关系组图;
[0044]
对公确定子单元,用于若所述用户交易数据对应的业务场景中只有对公交 易,确定为所述其他关系组图;
[0045]
混合确定子单元,用于若所述用户交易数据对应的业务场景中包括对私交 易以及对公交易,确定所述业务场景中风险交易场景的主要交易类型;若所述 主要交易类型为对私交易,确定为所述交易关系组图;若所述主要交易类型为 对公交易,确定为所述其他关系组图。
[0046]
可选地,所述关系筛选单元包括:
[0047]
第一处理子单元,用于剔除所述客户关联关系中无区分性的关系,得到第 一关系;
[0048]
第二处理子单元,用于确定各所述第一关系对应的交易数据量,剔除所述 交易数据量不在第一范围内的关系,得到第二关系;
[0049]
第三处理子单元,用于确定各所述第二关系的取值集合,剔除所述取值集 合的量级不在第二范围内的关系,得到第三关系;
[0050]
第四处理子单元,用于剔除所述第三关系中无区分性的取值集合,得到第 四关系;
[0051]
确定子单元,用于将所述第四关系作为所述候选组网关系。
[0052]
一种计算机设备,包括:
[0053]
存储器,用于存储计算机程序;
[0054]
处理器,用于执行所述计算机程序时实现上述团伙挖掘方法的步骤。
[0055]
一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机 程序被处理器执行时实现上述团伙挖掘方法的步骤。
[0056]
本发明实施例所提供的方法提供了一种适应于各种应用场景下的团伙挖 掘方案,该方案摒弃了传统的固定以交易关系进行组网分析的方式,从业务类 型入手进行分析,确定对应的组网方式,其中针对无法使用交易关系进行组图 的情况,根据对应的业务场景分析数据关系,获取组网关系,并分析组网关系 的可用性,进而筛选可用于组网的关系,然后筛选可疑交易的节点,最后再根 据选取的组网关系组图之后挖掘可疑交易的团伙,该方案阐述了从选择候选组 网关系、分析候选关系、确定组图关系利用所选关系组图的实现过程,挖掘了 不同业务场景下最有效的组图方式,实现了普适性的团伙挖掘组网分析。
[0057]
相应地,本发明实施例还提供了与上述团伙挖掘方法相对应的团伙挖掘装 置、设备和可读存储介质,具有上述技术效果,在此不再赘述。
附图说明
[0058]
为了更清楚地说明本发明实施例或相关技术中的技术方案,下面将对实施 例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述 中的附图仅仅是
本发明的一些实施例,对于本领域普通技术人员来讲,在不付 出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0059]
图1为一种反洗钱整体架构示意图;
[0060]
图2为本发明实施例中一种团伙挖掘方法的实施流程图;
[0061]
图3为本发明实施例中一种团伙挖掘组图方案整体设计示意图;
[0062]
图4为本发明实施例中一种团伙挖掘装置的结构示意图;
[0063]
图5为本发明实施例中一种计算机设备的结构示意图。
具体实施方式
[0064]
本发明的核心是提供一种团伙挖掘方法,可以实现在各种业务场景下的有 效团伙挖掘。
[0065]
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实 施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一 部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术 人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保 护的范围。
[0066]
如图1所示为一种反洗钱整体架构示意图,反洗钱整体系统中包括数据仓 库模块、监测功能模块和审核模块。在监测功能模块中,功能主要包括名单监 控、可疑监测、风险评级、大额监测、以及尽职调查、风险事件、数据统计等, 其中可疑监测是监测模块中的重要组成部分,其主要是从各场景的交易中例行 监控,获取交易异常的客户并进行预警,本文发明就属于反洗钱监测模块中可 疑监测的功能之一,即图1中的洗钱团伙发现,以下简称为“团伙挖掘”。
[0067]
现有团伙挖掘方案一般应用交易关系进行组网,根据收付款关系构成有向 图(所有边都是有方向的图),然后挖掘各种类型团伙,例如分散转入集中转 出、集中转入分散转出、快进快出等。还可以通过社区发现技术,找出可疑的 团伙案例;如果对节点或者边进行了过滤,则可组成可疑客户关联网络,通过 图挖掘算法找出可疑客户的密切联系客户作为团伙案例进行预警。
[0068]
上述应用交易关系进行组网的团伙挖掘方案仅适用于对私场景或者实际 业务中对私交易(笔数、金额)占比比较大的情况,如果业务场景是对公交易 占比较大,依然使用交易关系组图时,则会形成以商户为中心的超级节点,最 终的图会是由多个超级节点为中心的子图组成的一张大图,并不能得到用户与 用户之间的关系或密切程度,对于后续的图挖掘等工作没有贡献度,此时根据 交易关系组成的网络在子图划分后,无法获取可疑团伙。
[0069]
基于此,为保证在各种业务场景下的有效团伙挖掘,本发明提出了一种团 伙挖掘方法,请参考图2,图2为本发明实施例中一种团伙挖掘方法的流程图, 该方法主要包括以下步骤:
[0070]
s101、接收用户交易数据;
[0071]
从反洗钱数据仓库获取用户交易数据,用户交易数据主要包括客户属性信 息,一段时间的交易数据(根据每日的交易流水量级,确定时段,一段是1-2 个月)等,接收到用户交易数据后,启动步骤s102。
[0072]
s102、根据用户交易数据对应的业务场景中的交易类型确定组图方式;
[0073]
做团伙挖掘时,传统的方案是使用交易关系进行组图,构造有向图。但也 有业务场景不存在对私交易或对私交易占比的较低或对私业务中单个节点客 户洗钱可能较低,针对于此,本发明中提出针对每次团伙挖掘进行针对性的业 务场景分析,以分析其业务场景中的交易类型,比如仅包含对公交易、仅包含 对私交易、或同时包含对公交易以及对私交易,从而进一步根据交易类型匹配 对应的组图方式,从而实现组图方式的适应性调整,以满足不同应用场景的需 要。
[0074]
其中,交易类型可以分为对公交易(指用户与商户之间进行交易)以及对 私交易(指用户与用户之间进行交易),组图方式可以分为:交易关系组图以 及其他关系组图(本发明中指除交易关系之外的关系组图方式)。交易关系组 图为:每一笔交易由付款方和收款方、交易时间、地点、金额等信息数据组成, 则可将交易的双方作为节点(顶点),交易关系作为边,由付款方指向收款方,kenen地点、金额等信息作为边的属性数据,进而多笔交易就可以构成网络 (图);其他关系组图为:使用除交易以外的关系进行组网进而挖掘团伙。组 图为:客户(用户或者商户)作为节点(顶点),客户之间的某种关系作为边, 节点和边构成的图(网络)。
[0075]
而具体地,根据用户交易数据对应的业务场景中的交易类型确定组图方式 的实现方法本实施例中不做限定,可以根据风险业务场景中的风险交易类型、 或主要业务场景中的主要风险交易类型、或风险业务场景中的主要交易类型、 或主要业务场景中的风险交易类型来确定。而确定出的待检测交易类型与组图 方式的对应关系为:对私交易对应交易关系组图,对公交易对应其他关系组图。
[0076]
s103、若确定组图方式为交易关系组图,根据交易关系对用户交易数据构 建关联网络;
[0077]
在使用交易关系进行关联网络的构建可以参照相关技术的实现方式,在此 不做限定。具体地,可以使用两种方案,一种方案是直接使用交易数据进行组 图,得到的是交易链路图,通过对交易链路图的可视化分析、子图划分、社区 发现等,可以发现可疑的洗钱模式,比如分散转入-集中转出,集中转入-分散 转出,快进快出或频繁汇入-汇出,链式交易结构,环状交易结构,嵌套环状 交易结构等异常的交易结构,挖掘支点客户甚至连接多个子图的重点可疑客 户,并分析资金动向以及亲密联系节点;
[0078]
另一种方案是对交易和节点(交易的客户)进行过滤,从金额、笔数、交 易时间段、交易地点、交易场景、客户本身属性等筛选出洗钱可疑程度较大的 客户,将可疑客户组图后,挖掘亲密联系的可疑客户作为团伙案例。挖掘亲密 联系的可疑客户作为团伙案例比如:在组成的图(关联关系网络)中,进行子 图划分,分析(强)联通子图(其中,连通指:比如顶点a到顶点b之间有 路径相连,则称a和b是联通的;联通图指图中的任意两个顶点都是联通的, 则该图称为联通图;进一步地,联通的有向图称为强连通图),应用社区发现 技术,得到初步可疑团伙候选集合,再经过一系列规则和策略的筛选可疑团伙 候选集合及团伙中的客户后,预警团伙案例。
[0079]
本实施例中仅以上述两种使用交易关系进行关联网络构建的方式为例进 行介绍,其他基于交易关系的构建方式均可参照本实施例的介绍,在此不再赘 述。
[0080]
s104、若确定组图方式为其他关系组图,提取用户交易数据中的客户关联 关系;
[0081]
若确定组图方式为其他关系组图,获取除交易以外的客户关联关系。所谓 客户关联关系,即能将两个客户(节点)连接起来的中介,常见的客户关联关 系除交易关系外,还有设备及设备指纹,银行卡号,手机号,ip,地点(实际 交易地点、身份证归属、ip归属地、手机号归属地、发货地址、收货地址等), 交易场景或交易类型,客户自身属性(各类地址或常住地、职业(单位)、用 户画像、代付人、亲密关联客户等关注、浏览信息、附属卡或绑定卡、各类优 惠活动的邀请关系)等。通过对数据的分析(分析从数据库中获得的数据,包 括客户属性数据、交易数据等,从中提炼中能将两个客户连接起来的关系,比 如同一个手机号,同一个ip,同一个收货地址等属性信息,还有进行过交易 的两个客户也能连接起来),挑选出用户交易数据中的组图关系候选集合。
[0082]
s105、按组网规则对客户关联关系进行筛选,得到候选组网关系;
[0083]
提取出用户交易数据中所有的客户关联关系后,调用设定的组网筛选规则 对客户关联关系进行筛选,本发明中的组网筛选规则指筛选出适合进行组网分 析的区分性强、量级合适的组网关系的规则,具体可以根据实际业务场景进行 组网筛选规则的设定,在此不做限定。
[0084]
进行筛选后可以过滤掉一大批缺乏区分性不适合组网的客户关联关系,将 筛选出来的关系作为候选组网关系。需要说明的是,候选组网关系可以为一个, 也可以为多个,在此不做限定。
[0085]
另外,为避免异常数据对于组网分析的干扰,提升分析精准度,在按组网 规则对客户关联关系进行筛选,得到候选组网关系之后,在下述步骤进行关联 网络的构建之前,还可以进一步剔除候选组网关系中的异常取值,对候选关系 中的特定取值做筛选,比如候选组网关系为ip关系时,可以去除公网ip地址、 局域网地址,某一个客户量级极高超出服务器能力的取值,某个客户量级极少 的取值等。当然,也可以不进行该步骤,本实施例中对此不做限定。
[0086]
s106、若候选组网关系为强关系组图,根据候选组网关系为用户交易数据 构建关联网络;
[0087]
判断筛选得到的候选组网关系是否是强关系,如果是强关系则执行步骤 s106,如果是弱关系则执行步骤s107。其中,强关系指的是类似于交易关系、 亲属关系等可以明确的将两个节点连接起来的关系,是一种紧密联系。若候选 组网关系为强关系组图,说明该候选组网关系具有将用户交易数据紧密联系进 行组网的能力,则可以直接利用候选组网关系进行组图。组图方案可以是直接 根据关系组成有向图或无向图(所有边都是无方向的图),也可以在筛选可疑 节点后组成有向图或无向图,具体方案可以择优进行,在此不做限定。
[0088]
需要说明的是,筛选出来的候选组网关系可能不止一个,若候选组网关系 中既包括强关系组图,又包括弱关系组图,此时可以对用户交易数据既采用 s106的方式进行网络的构建,又采用s107的方式进行网络的构建,同时根据 两个关联网络启动步骤s108的分析,也可以将多个关系同时放在一种图上, 然后给每种关系做个标签,将标签的取值作为边属性的取值,本实施例中仅以 上述两种方式为例进行介绍,其他实现方式均可参照本实施例的介绍,在此不 再赘述。
[0089]
s107、若候选组网关系为弱关系组图,根据候选组网关系筛选用户交易数 据中的
可疑客户构建关联网络;
[0090]
弱关系指的是同一个公司、同一个省市、同一个小区等体量较大的集体关 系,显而易见的弱关系中的所有人并非紧密联系,针对该种情况本方法中提出 根据候选组网关系筛选用户交易数据中的可疑客户,根据筛选出来的可疑客户 构建关联网络,以构建可以进行可疑团伙挖掘的有效的关联网络。
[0091]
s108、根据关联网络进行可疑客户及其团伙组网分析,得到团伙挖掘结果。
[0092]
在组成的关联关系网络(图)中,进行子图划分,分析(强)联通子图, 应用社区发现技术,得到初步可疑团伙候选集合,再经过一系列规则和策略的 筛选可疑团伙候选集合及团伙中的客户后,预警团伙案例。
[0093]
方案中提到的筛选可疑团伙候选集合及团伙中的客户,可以参照相关技术 中的实现方式,具体可以从团伙的平均交易金额、平均交易笔数,风险交易笔 数、金额,团伙客户的年龄、职业、账户数、销户数,销户客户的交易笔数、 金额等方面进行筛选;可以使用gcn(图卷积神经网络)等深度学习算法来 挖掘可疑团伙;还可以使用聚类算法挖掘可疑客户的亲密联系者组成团伙,或 者将可疑度高、洗钱风险大的簇作为团伙案例,仅以上述三种实现方式为例进 行介绍,在此不再详细描述。
[0094]
基于上述介绍,本发明实施例所提供的技术方案提供了一种适应于各种应 用场景下的团伙挖掘方案,该方案摒弃了传统的固定以交易关系进行组网分析 的方式,从业务类型入手进行分析,确定对应的组网方式,其中针对无法使用 交易关系进行组图的情况,根据对应的业务场景分析数据关系,获取组网关系, 并分析组网关系的可用性,进而筛选可用于组网的关系,然后筛选可疑交易的 节点,最后再根据选取的组网关系组图之后挖掘可疑交易的团伙,该方案阐述 了从选择候选组网关系、分析候选关系、确定组图关系利用所选关系组图的实 现过程,挖掘了不同业务场景下最有效的组图方式,实现了普适性的团伙挖掘 组网分析。
[0095]
需要说明的是,基于上述实施例,本发明实施例还提供了相应的改进方案。 在优选/改进实施例中涉及与上述实施例中相同步骤或相应步骤之间可相互参 考,相应的有益效果也可相互参照,在本文的优选/改进实施例中不再一一赘 述。
[0096]
上述实施例中对于根据用户交易数据对应的业务场景中的交易类型确定 组图方式的实现方法本实施例中不做限定,本实施例中主要介绍一种实现方 法,具体包括如下步骤:
[0097]
(1)若用户交易数据对应的业务场景中只有对私交易,确定为交易关系 组图;
[0098]
(2)若用户交易数据对应的业务场景中只有对公交易,确定为其他关系 组图;
[0099]
考察业务场景,如果业务场景只有对私交易,则可选择交易关系进行组图; 如果业务场景只有对公交易,则选择使用除交易外的关系进行组图。
[0100]
(3)若用户交易数据对应的业务场景中包括对私交易以及对公交易,确 定业务场景中风险交易场景的主要交易类型;若主要交易类型为对私交易,确 定为交易关系组图;若主要交易类型为对公交易,确定为其他关系组图。
[0101]
如果用户交易数据对应的业务场景中既含有对私交易,又含有对公交易, 可以确定业务场景中风险交易场景的主要交易类型,具体可以通过对交易数据 进行业务分析来确定风险交易场景,再针对风险交易场景下的交易数据进行数 值分析。其中,业务分析的
的关系进行下面的步骤。
[0111]
(3)确定各第二关系的取值集合,剔除取值集合的量级不在第二范围内 的关系,得到第三关系;
[0112]
在过滤完成的关系中,对每组关系,查看单个客户拥有某种关系取值的集 合大小,某种关系特定取值拥有客户量级的大小,以筛选出关系取值集合大小 合适的关系。具体地,取值集合的量级可以通过查看一:单个客户最多拥有该 关系的不同值的量级;查看二:该关系每个取值拥有的客户量级;选择量级在 一定区间的关系。区间的边界阈值需要根据关系类型、研发所使用的服务器(集 群)计算存储能力来不断探测,过滤超出服务器能力的关系以及每个取值拥有 客户量级均较少的关系。本实施例中仅以上述两种查看方式为例进行介绍,其 他查看方式均可参照本实施例的介绍,在此不再赘述。
[0113]
(4)剔除第三关系中无区分性的取值集合,得到第四关系;
[0114]
(5)将第四关系作为候选组网关系。
[0115]
过滤关系中大部分取值都不具有区分性的关系。例如ip关系,大部分都 是局域网,则此时ip关系不可用;
[0116]
需要说明的是,本实施例中仅以上述过滤条件为例进行介绍,实际业务中 的其余过滤条件,可以由具体业务场景进行相应设定,在此不再赘述。
[0117]
上述实施例中对于根据候选组网关系筛选用户交易数据中的可疑客户构 建关联网络的具体实现方式不做限定,为加深理解,本实施例中介绍一种实现 方式,具体包括以下步骤:
[0118]
(1)筛选出用户交易数据中的可疑客户,得到可疑客户集合;
[0119]
根据设定的规则筛选可疑客户(节点),组成可疑客户集合。对于可疑客 户的筛选方式,本实施例中不做限定,具体的方法比如:1.使用高风险客户; 2.使用规则模型和ai模型预警的客户;3.利用加工规则,从客户属性信息特征、 交易特征等筛选可疑的客户。一般情况下,考虑到可疑客户的数量,以及尽量 监测较多的可疑客户,可以使用方案3进行,其中筛选可疑客户还涉及到对加 工的特征调整阈值等工作,可以根据具体业务情景筛选可疑客户的方案,在此 不再赘述。
[0120]
(2)判断可疑客户集合的总量是否大于阈值;如果是,执行下述步骤(3); 如果否,执行下述步骤(4);
[0121]
判断可疑客户集合的总量是否大于阈值,若大于阈值,指示待分析的可疑 客户体量大,需要精细挖掘以确定大量杂乱数据之间的微弱联系;若不大于阈 值,指示待分析的可疑客户体量小,挖掘技术难度相对较低。
[0122]
本实施例中针对不同的应用场景(不同可疑客户体量)下采用适应性的组 图方式,以提升整体挖掘精准度。
[0123]
(3)利用强关系组网方式对进行关联网络构建,作为原始组图;对原始 组图进行社区挖掘,得到可疑社区集合;在可疑社区集合中利用候选组网关系 构建关联网络;
[0124]
如果可疑客户集合量级大,则先利用交易关系或其余可用的强关系组成大 图,然后进行子图划分和社区挖掘(社区挖掘算法一般常见的有louvain算法 等),得到可疑社区集合,然后在可疑社区集合中利用候选组网关系(弱关系) 进行组图。
[0125]
(4)根据候选组网关系为可疑客户集合构建关联网络。
[0126]
如果可疑客户集合量级小,则在可疑客户集合中利用候选组网关系(弱关 系)构建关联网络,组成无向图或有向图(一般可以为无向图)。
[0127]
需要说明的是,本实施例中仅以上述实现步骤为例对根据候选组网关系筛 选用户交易数据中的可疑客户构建关联网络进行介绍,其他实现方式均可参照 本实施例的介绍,在此不再赘述。
[0128]
图3为本发明实施例中一种团伙挖掘组图方案整体设计示意图,该示意图 中在首个实施例提出的整体方案架构上,复用了本实施例中提出的根据候选组 网关系筛选用户交易数据中的可疑客户构建关联网络的方式,以及上述实施例 中提出的组图方式确定方法,体现了一种整体协作方案,其他具体实现方式均 可参照图3的介绍,在此不再赘述。
[0129]
相应于上面的方法实施例,本发明实施例还提供了一种团伙挖掘装置,下 文描述的团伙挖掘装置与上文描述的团伙挖掘方法可相互对应参照。
[0130]
参见图4所示,该装置包括以下模块:
[0131]
数据接收单元110主要用于接收用户交易数据;
[0132]
组图方式确定单元120主要用于根据用户交易数据对应的业务场景中的 交易类型确定组图方式;
[0133]
交易关系组图单元130主要用于若确定组图方式为交易关系组图,根据交 易关系为用户交易数据构建关联网络;
[0134]
其他关系确定单元140主要用于若确定组图方式为其他关系组图,提取用 户交易数据中的客户关联关系;
[0135]
关系筛选单元150主要用于按组网规则对客户关联关系进行筛选,得到候 选组网关系;
[0136]
强关系组图单元160主要用于若候选组网关系为强关系组图,根据候选组 网关系为用户交易数据构建关联网络;
[0137]
弱关系组图单元170主要用于若候选组网关系为弱关系组图,根据候选组 网关系筛选用户交易数据中的可疑客户构建关联网络;
[0138]
关联网络分析单元180主要用于根据关联网络进行可疑客户及其团伙组 网分析,得到团伙挖掘结果。
[0139]
在本发明的一种具体实施方式中,组图方式确定单元包括:
[0140]
对私确定子单元,用于若用户交易数据对应的业务场景中只有对私交易, 确定为交易关系组图;
[0141]
对公确定子单元,用于若用户交易数据对应的业务场景中只有对公交易, 确定为其他关系组图;
[0142]
混合确定子单元,用于若用户交易数据对应的业务场景中包括对私交易以 及对公交易,确定业务场景中风险交易场景的主要交易类型;若主要交易类型 为对私交易,确定为交易关系组图;若主要交易类型为对公交易,确定为其他 关系组图。
[0143]
在本发明的一种具体实施方式中,关系筛选单元包括:
[0144]
第一处理子单元,用于剔除客户关联关系中无区分性的关系,得到第一关 系;
[0145]
第二处理子单元,用于确定各第一关系对应的交易数据量,剔除交易数据 量不在第一范围内的关系,得到第二关系;
[0146]
第三处理子单元,用于确定各第二关系的取值集合,剔除取值集合的量级 不在第二范围内的关系,得到第三关系;
[0147]
第四处理子单元,用于剔除第三关系中无区分性的取值集合,得到第四关 系;
[0148]
确定子单元,用于将第四关系作为候选组网关系。
[0149]
相应于上面的方法实施例,本发明实施例还提供了一种计算机设备,下文 描述的一种计算机设备与上文描述的一种团伙挖掘方法可相互对应参照。
[0150]
该计算机设备包括:
[0151]
存储器,用于存储计算机程序;
[0152]
处理器,用于执行计算机程序时实现上述方法实施例的团伙挖掘方法的步 骤。
[0153]
具体的,请参考图5,为本实施例提供的一种计算机设备的具体结构示意 图,该计算机设备可因配置或性能不同而产生比较大的差异,可以包括一个或 一个以上处理器(central processing units,cpu)322(例如,一个或一个以上 处理器)和存储器332,存储器332存储有一个或一个以上的计算机应用程序342 或数据344。其中,存储器332可以是短暂存储或持久存储。存储在存储器332 的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对数 据处理设备中的一系列指令操作。更进一步地,中央处理器322可以设置为与 存储器332通信,在计算机设备301上执行存储器332中的一系列指令操作。
[0154]
计算机设备301还可以包括一个或一个以上电源326,一个或一个以上有线 或无线网络接口350,一个或一个以上输入输出接口358,和/或,一个或一个 以上操作系统341。
[0155]
上文所描述的团伙挖掘方法中的步骤可以由计算机设备的结构实现。
[0156]
相应于上面的方法实施例,本发明实施例还提供了一种可读存储介质,下 文描述的一种可读存储介质与上文描述的一种团伙挖掘方法可相互对应参照。
[0157]
一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处 理器执行时实现上述方法实施例的团伙挖掘方法的步骤。
[0158]
该可读存储介质具体可以为u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(random access memory,ram)、磁碟或 者光盘等各种可存储程序代码的可读存储介质。
[0159]
本领域技术人员还可以进一步意识到,结合本文中所公开的实施例描述的 各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实 现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般 性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行, 取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定 的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发 明的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1