1.本技术属于数据处理技术领域,尤其涉及一种反洗钱处理方法和装置。
背景技术:2.随着金融技术不断提升,全球资金流动更加快速便捷,加上投资环境宽松,洗钱的方式、地域和技术手段以及参与洗钱活动的人员都发生了巨大变化,洗钱活动呈现出更加猖獗的势头。
3.在如今的大数据时代,传统的数据侦查方法已经不能满足反洗钱工作的需要,从海量的金融交易数据中进行信息发现从而为反洗钱工作提供调查线索以及调查方向,已经成为影响打击洗钱犯罪顺利开展的关键问题之一,因此提供一种能用于达到上述目的反洗钱解决方案成为本领域亟需解决的技术问题。
技术实现要素:4.有鉴于此,本技术提供一种反洗钱处理方法和装置,用于通过从海量的金融交易数据中发现其少量的隐秘的洗钱特征,并基于发现的隐秘洗钱特征识别异常交易的可疑账户或团伙,来为反洗钱工作提供调查线索以及调查方向。
5.具体技术方案如下:
6.一种反洗钱处理方法,包括:
7.获取至少基于筛选条件确定出的具有洗钱嫌疑的第一交易数据集;
8.对所述第一交易数据集进行统计与归并处理,得到第二交易数据集;
9.按与洗钱相关的预设交易特征,对所述第二交易数据集对应的各个交易账户进行聚类处理,得到交易账户的多个目标聚类集;
10.对各个目标聚类集按类进行类内的交易账户嫌疑程度检测,得到各交易账户分别在所属目标聚类集内的类内嫌疑程度;
11.通过对不同目标聚类集对应的交易网络进行链接发现,确定不同目标聚类集类间的关键嫌疑账户;
12.根据各交易账户分别在所属目标聚类集内的类内嫌疑程度和不同目标聚类集类间的关键嫌疑账户,识别洗钱账户及洗钱账户对应的洗钱属性信息。
13.可选的,所述获取至少基于筛选条件确定出的具有洗钱嫌疑的第一交易数据集,包括:
14.从交易数据源选取与设定的筛选条件匹配的交易数据;
15.将选取的交易数据转换为资金流向图并可视化展示;所述资金流向图的节点包括交易账户所对应的实体数据,边包括不同交易账户之间的交易信息;
16.响应于检测到对所述资金流向图的节点和/或边的剔除操作,从所述资金流向图剔除所述剔除操作指示的节点和/或边,得到完成剔除处理后的资金流向图,完成剔除处理后的资金流向图对应的交易数据作为所述第一交易数据集。
17.可选的,所述对所述第一交易数据集进行统计与归并处理,得到第二交易数据集,包括:
18.将资金流向图形式的所述第一交易数据集导入预设数据库,并在导入所述预设数据库时进行数据预处理;
19.按照所述与洗钱相关的预设交易特征对预处理后的第一交易数据进行统计与归并处理,得到第二交易数据集。
20.可选的,所述按与洗钱相关的预设交易特征,对所述第二交易数据集对应的各个交易账户进行聚类处理,得到交易账户的多个目标聚类集,包括:
21.按所述预设交易特征对所述第二交易数据集对应的各个交易账户进行第一聚类处理,得到交易账户的多个第一聚类集;
22.从各个所述第一聚类集中剔除满足异常条件的异常交易账户,得到完成剔除后的各个第一聚类集,并将剔除的异常交易账户添加到可疑名单;
23.按所述预设交易特征对完成剔除后的每个第一聚类集包含的各个账户进行第二聚类处理,得到所述第二交易数据集对应的各个交易账户的多个第二聚类集,作为交易账户的所述多个目标聚类集。
24.可选的,所述对各个目标聚类集按类进行类内的交易账户嫌疑程度检测,得到各交易账户分别在所属聚类集内的类内嫌疑程度,包括:
25.确定每个目标聚类集中不同交易账户对应的不同交易数据的数据点间的预设类型距离,根据不同数据点间的预设类型距离确定不同数据点的离群程度;
26.基于不同数据点的离群程度确定所对应的不同交易账户的类内嫌疑程度。
27.可选的,所述通过对不同目标聚类集对应的交易网络进行链接发现,确定不同目标聚类集类间的关键嫌疑账户,包括:
28.采用度量相关性的方式确定各个目标聚类集对应的交易网络中不同目标聚类集的类间每两个节点数据项之间的关联强度,得到类间每两个节点数据项之间的相关值;
29.基于类间各对节点数据项之间的相关值构造一多变图,所述多变图以图中相邻节点间的边信息表征类间每两个节点数据项间的相关值;
30.基于通过链接标识定义的映射函数,将所述多变图映射为所述多变图的各个子图;每一子图包括基于所述映射函数从所述多变图中筛选出的以一个节点数据项为中心以及与作为中心的节点数据项直接相连的类间相应节点数据项,且每一子图中的类间各对节点数据项间的相关值满足所述映射函数中对节点间相关性的要求;
31.将每一子图中的交易账户确定为不同目标聚类集类间的关键嫌疑账户。
32.可选的,所述根据各交易账户分别在所属目标聚类集内的类内嫌疑程度和不同聚类集类间的关键嫌疑账户,识别洗钱账户及洗钱账户对应的洗钱属性信息,包括:
33.根据每一目标聚类集的各交易账户的类内嫌疑程度确定每一目标聚类集的类嫌疑程度;
34.根据每一子图包含的关键嫌疑账户在所属类内对应的类内嫌疑程度、所属类的类嫌疑程度、关键嫌疑账户与所属子图中其他关键嫌疑账户的关联值,以及所述其他关键嫌疑账户所属类的类嫌疑程度中的至少部分信息,识别洗钱账户及洗钱账户对应的洗钱属性信息。
35.一种反洗钱处理装置,包括:
36.获取单元,用于获取至少基于筛选条件确定出的具有洗钱嫌疑的第一交易数据集;
37.统计与归并单元,用于对所述第一交易数据集进行统计与归并处理,得到第二交易数据集;
38.聚类单元,用于按与洗钱相关的预设交易特征,对所述第二交易数据集对应的各个交易账户进行聚类处理,得到交易账户的多个目标聚类集;
39.类内检测单元,用于对各个目标聚类集按类进行类内的交易账户嫌疑程度检测,得到各交易账户分别在所属目标聚类集内的类内嫌疑程度;
40.类间检测单元,用于通过对不同目标聚类集类对应的交易网络进行链接发现,确定不同目标聚类集类间的关键嫌疑账户;
41.识别单元,用于根据各交易账户分别在所属目标聚类集内的类内嫌疑程度和不同目标聚类集类间的关键嫌疑账户,识别洗钱账户及洗钱账户对应的洗钱属性信息。
42.可选的,所述聚类单元具体用于:
43.按所述预设交易特征对所述第二交易数据集对应的各个交易账户进行第一聚类处理,得到交易账户的多个第一聚类集;
44.从各个所述第一聚类集中剔除满足异常条件的异常交易账户,得到完成剔除后的各个第一聚类集,并将剔除的异常交易账户添加到可疑名单;
45.按所述预设交易特征对完成剔除后的每个第一聚类集包含的各个账户进行第二聚类处理,得到所述第二交易数据集对应的各个交易账户的多个第二聚类集,作为交易账户的所述多个目标聚类集。
46.可选的,所述类间检测单元具体用于:
47.采用度量相关性的方式确定各个目标聚类集对应的交易网络中不同目标聚类集的类间每两个节点数据项之间的关联强度,得到类间每两个节点数据项之间的相关值;
48.基于类间各对节点数据项之间的相关值构造一多变图,所述多变图以图中相邻节点间的边信息表征类间每两个节点数据项间的相关值;
49.基于通过链接标识定义的映射函数,将所述多变图映射为所述多变图的各个子图;每一子图包括基于所述映射函数从所述多变图中筛选出的以一个节点数据项为中心以及与作为中心的节点数据项直接相连的类间相应节点数据项,且每一子图中的类间各对节点数据项间的相关值满足所述映射函数中对节点间相关性的要求;
50.将每一子图中的交易账户确定为不同目标聚类集类间的关键嫌疑账户。
51.根据以上方案可知,本技术提供的反洗钱处理方法和装置,通过聚类处理将具有相似交易特征的交易账户聚集在一起,并在聚类基础上进行基于聚类的异常分析,其中,基于聚类的异常分析是在聚类结果集的基础上对类内以及类间的关系进行全面的分析、检测,具体通过对聚类集进行类内的交易账户嫌疑程度检测确定各交易账户分别在所属类的类内嫌疑程度,以及通过对不同目标聚类集对应的交易网络进行链接发现,确定不同类间的关键嫌疑账户,之后,综合交易账户对应的类内嫌疑程度和不同聚类集类间的关键嫌疑账户,识别洗钱账户及洗钱账户对应的洗钱属性信息,可以十分有效的为反洗钱工作提供调查线索以及调查方向,减轻工作人员办案的人力与财力。
附图说明
52.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
53.图1是本技术提供的反洗钱处理方法流程图;
54.图2是本技术提供的基于聚类算法的反洗钱系统的组成结构图;
55.图3是本技术提供的节点聚合及异常分析处理逻辑;
56.图4是本技术提供的反洗钱处理装置的组成结构图。
具体实施方式
57.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
58.本技术实施例公开一种反洗钱处理方法和装置,通过对基于数据源获得的交易账户数据对象进行聚类,将具有类似交易特征的数据对象归类,然后针对每个聚类分别进行异常程度检测,再对整个聚类对应的交易网络运用链接发现技术进行关键嫌疑账户确定,来更加具有针对性与全面性的挖掘个体交易可疑的差别以及类与类之间关键节点的作用,实现更准确的洗钱账户及其洗钱属性信息识别。
59.参见图1提供的反洗钱处理方法流程图,本技术实施例公开的反洗钱处理方法包括如下处理步骤:
60.步骤101、获取至少基于筛选条件确定出的具有洗钱嫌疑的第一交易数据集。
61.可选的,本技术实施例通过一基于聚类算法的反洗钱系统实现本技术的反洗钱处理方法。参见图2提供的该系统的组成结构图,该系统包括数据处理模块10、数据管理模块20、可视化分析模块30以及离群检测模块40。并通过数据处理模块10、数据管理模块20和可视化分析模块30来提供第一交易数据集的确定、筛选功能。
62.其中,第一交易数据集的获取过程,具体可实现为:
63.11)从交易数据源选取与设定的筛选条件匹配的交易数据。
64.优选的,数据处理模块10将数据源进行统一封装,提供一个统一的设置接口给系统使用,使数据源与系统发生隔离,系统对数据的操作不会破坏数据源的完整性,并可以根据用户的需求提取所需的具体字段数据,更换数据源的标准不需要对系统做出更改,只需要在设置接口进行相关的配置即可。
65.数据管理模块20提供了丰富的搜索功能,系统能够按照用户需要的具体字段去检索对应的交易记录。此外,该模块还具有统计功能,比如交易频率、交易次数、交易金额以及交易时间等。
66.相应的,用户可根据需要进行检索所需的字段配置,系统的数据管理模块20根据用户配置的检索字段构造相应的筛选条件,并从交易数据源检索与设定的筛选条件匹配的交易数据。
67.12)将选取的交易数据转换为资金流向图并可视化展示。
68.利用可视化分析模块30将根据选定的条件从数据源检索的交易信息实时转换为资金流向图,资金流向图的节点包括交易账户所对应的实体数据,如交易账户对应的个人或公司/企业等的相关实体数据,边包括不同交易账户之间的交易信息,如各种详细交易明细。
69.资金流向图支持人机交互,用户可以查看图中任一交易账户的详细交易信息,也可以查看图中边的详细交易信息,可操作性强,可以放缩、拖拽。且可选的,利用可视化分析模块30还可以根据用户关注的指定账户的详细交易信息,生成包含资金流向序列的交易预警报告。
70.13)响应于检测到对所述资金流向图的节点和/或边的剔除操作,从所述资金流向图剔除所述剔除操作指示的节点和/或边,得到完成剔除处理后的资金流向图对应的交易数据,作为所述第一交易数据集。
71.可选的,可视化分析模块30还具有资金流向图的过滤功能,基于该功能将图中无关的交易节点和交易边剔除,使关注的交易路径清晰清楚化。
72.相应的,用户可结合洗钱交易特点,直接通过与资金流向图的交互操作,对资金流向图中明显与洗钱交易无关的节点和/或边(如,对应的交易次数低于预设次数、交易额度低于预设额度的节点和/或边)剔除,系统响应于检测到对资金流向图的节点和/或边的剔除操作,从资金流向图剔除该操作指示的节点和/或边,得到完成剔除后的资金流向图,并将完成剔除后的资金流向图对应的交易数据作为第一交易数据集。
73.步骤102、对第一交易数据集进行统计与归并处理,得到第二交易数据集。
74.系统中的离群检测模块40,用于在数据处理以及后期的数据统计合并的基础上,选取用户关注的属性形成新的交易数据集即第二交易数据集,并对该交易数据集进行嫌疑账户的归类以及嫌疑账户的嫌疑程度排序,最后针对归类的嫌疑账户集合进行链接发现来约减交易网络,从而发现交易网络的关键交易节点,便于综合各交易账户分别在所属聚类集内的类内嫌疑程度和不同聚类集类间的关键嫌疑账户,识别洗钱账户及其洗钱属性信息,为办案提供清晰明了的线索。
75.离群检测模块40分为4个子模块:数据预处理子模块、聚类子模块、类内嫌疑检测子模块和链接发现子模块。
76.本步骤基于数据预处理子模块实现对第一交易数据集进行统计与归并处理,得到第二交易数据集,该过程包括:
77.21)将资金流向图形式的第一交易数据集导入预设数据库,并在导入数据库时进行数据预处理。
78.具体的,先利用数据预处理子模块将资金流向图形式的真实交易流水数据即第一交易数据集导入预设数据库,如导入到mysql数据库中,并在将数据导入数据库时进行数据预处理,对无效的数据进行剔除,剔除规则包括但不限于:将账号不存在或者对方账号不存在的数据进行剔除,将手续费扣除以及手续费返还等正常银行交易的数据剔除。
79.22)按照与洗钱相关的预设交易特征对预处理后的交易数据进行统计与归并处理,得到第二交易数据集。
80.申请人发现,结合洗钱的操作过程以及银行的交易流水特点,聚类方法中的属性
应包括对存取资金的数量、存取资金的次数和交易情况等的描述。相应的,本技术在结合银行流水交易的账户特征以及洗钱特点的基础上进行数据探索,定义一系列与洗钱相关的交易特征,主要包括:账号、资金收付标志、交易次数、交易数额、对方账号、总资产。
81.并对数据库中预处理后的所有交易流水数据按照账号、资金收付标志、对方账号等交易特征进行统计与归并处理,得到后续聚类需要使用的第二交易数据集,其中,即使交易对方是同一个账户,但是若资金收付标记不一样,也被视为两条不同的数据对象。
82.步骤103、按与洗钱相关的预设交易特征,对第二交易数据集对应的各个交易账户进行聚类处理,得到交易账户的多个目标聚类集。
83.该步骤103具体利用聚类子模块实现对第二交易数据集的两阶段聚类处理,其中,聚类子模块主要的作用是通过两阶段聚类处理发现作案团伙,这在洗钱案件中非常有用,并且为后续模块进行数据集剪枝,减小后续模块处理的时间复杂度提供支持。该模块具体是通过两阶段聚类处理对第二数据集进行聚类,把具有相似交易特征的账户聚集在一起,并且把一些异常交易账户放入交易嫌疑名单中,为用户对案件分析提供有效的线索。
84.其中,首先按上述定义的预设交易特征,对第二交易数据集对应的各个交易账户进行第一聚类处理(即,第一阶段的聚类处理),得到交易账户的多个第一聚类集。可选的,具体可设置上文定义的各个交易特征作为聚类所依据的数据类型,并采用chameleon聚类算法对第二交易数据集进行第一阶段的聚类处理。
85.实际应用中,参见图3提供的节点聚合及异常分析处理逻辑,还可结合公安部提供的嫌疑账号信息及相关口供信息,对交易数据集的交易账号进行聚类处理。
86.之后,根据设定的异常条件从各个第一聚类集中识别存在明显异常的异常交易账户,发现存在明显异常的异常交易账户,并剔除发现的异常交易账户,将剔除的异常交易账户添加到可疑名单。在此基础上,将完成剔除处理后的各个第一聚类集作为第二阶段聚类处理的原始数据再次进行聚类处理(即第二聚类处理),具体同样按上述定义的预设交易特征为聚类依据,对完成剔除后的每个第一聚类集包含的各个账户进行第二聚类处理,以用于通过第二阶段聚类进一步挖掘无法基于异常条件识别的潜在、隐藏异常/嫌疑账户,相应得到第二聚类处理后对应的多个第二聚类集,多个第二聚类集即作为上述的多个目标聚类集。
87.其中,第二聚类处理可以但不限于采用nk-means聚类,相应得到nk_means的多个聚类结果数据集作为上述的多个目标聚类集。
88.步骤104、对各个目标聚类集按类进行类内的交易账户嫌疑程度检测,得到各交易账户分别在所属目标聚类集内的类内嫌疑程度。
89.针对通过两阶段聚类处理所得的各个账户的多个目标聚类集,本步骤104基于类内嫌疑检测子模块对各个目标聚类集按类进行类内的交易账户嫌疑程度检测,其中首先确定每个目标聚类集中不同交易账户对应的不同交易数据的数据点间的预设类型距离,根据不同交易数据的数据点间的预设类型距离确定不同数据点的离群程度;之后基于不同数据点的离群程度确定所对应的不同交易账户的类内嫌疑程度。
90.可选的,具体可对各个目标聚类集按类进行孤立点的挖掘,通过计算类内数据点间的马氏距离确定每个数据点的mdlof来判断数据点的离群程度,并基于数据点的离群程度确定数据点所对应交易账户的类内嫌疑程度(或类内异常程度)。
91.可选的,还可进一步输出每个类中各交易账户的嫌疑程度排名,以便为办案人员按线索调查案件的顺序与重视程度提供有价值的参考借鉴。
92.步骤105、通过对不同目标聚类集对应的交易网络进行链接发现,确定不同目标聚类集类间的关键嫌疑账户。
93.在通过聚类将具有类似交易特征的数据对象归类,然后针对每个聚类分别进行类内嫌疑/异常程度检测之后,再基于链接发现子模块,对整个聚类交易网络运用链接发现技术确定类间的关键嫌疑账户,如针对nk-means聚类的结果集,对结果集对应形成的交易网络进行链接发现,这样对于离群检测将更加具有针对性与全面性,从而提高了离群检测的准确性。
94.该通过链接发现技术确定不同目标聚类集类间的关键嫌疑账户的过程,可实现为:
95.31)采用度量相关性的方式确定各个目标聚类集对应的交易网络中不同目标聚类集的类间每两个节点数据项之间的关联强度,得到类间每两个节点数据项之间的相关值;
96.32)基于类间各对节点数据项之间的相关值构造一多变图,所述多变图以图中相邻节点间的边信息表征类间每两个节点数据项间的相关值;
97.33)基于通过链接标识定义的映射函数,将所述多变图映射为所述多变图的各个子图;每一子图包括基于所述映射函数从所述多变图中筛选出的以一个节点数据项为中心以及与作为中心的节点数据项直接相连的类间相应节点数据项,且每一子图中的类间各对节点数据项间的相关值满足所述映射函数中对节点间相关性的要求;
98.34)将每一子图中的交易账户确定为不同目标聚类集类间的关键嫌疑账户。
99.每个目标聚类集中交易账户的嫌疑程度不同,针对nk-means聚类的结果集,对结果集对应形成的交易网络(金融网络拓扑图)进行链接发现。具体用度量相关性的方式来判断交易网络中类间每两个节点数据项之间的联系强弱,定义各个目标聚类集对应的交易网络结果集为u,采用s表示u中的每一目标聚类集,这样对于s中的任何一节点数据项都存在一个与其他s中节点的函数关系c,c表征类间节点数据项之间[0,1]范围的相关值,此步骤定义不同s间任意一对节点数据项之间的关联关系为:然后将函数c应用于涉及不同s中的每一对节点数据项,以生成不同s中任意两项的实际相关值,再把结果表示为一个完整的多变图g,g(s,e),其中e是具有计算出的相关值的边界。联系确定后,最后链接标识定义了另一个函数p,它将完整的多变图g映射到它的子图m∈g,每一子图包括基于映射函数p从多变图g中筛选出的以一个节点数据项为中心以及与作为中心的节点数据项直接相连的类间相应节点数据项,且每一子图中的类间各对节点数据项间的相关值满足映射函数p对节点间相关性的要求,以此筛选出多变图g中潜在的、隐藏的异常/嫌疑账户及其之间的关联来形成或映射为相应的子图。
[0100]
每一个子图都作为一个关键节点,每一关键节点中的交易账户作为不同目标聚类集类间的关键嫌疑账户。关键节点一般都是洗钱交易中重要的角色,可以进一步为反洗钱工作提供调查方向线索。
[0101]
步骤106、根据各交易账户分别在所属目标聚类集内的类内嫌疑程度和不同目标聚类集类间的关键嫌疑账户,识别洗钱账户及洗钱账户对应的洗钱属性信息。
[0102]
最终,根据每一目标聚类集的各交易账户的类内嫌疑程度确定每一目标聚类集整
体的类嫌疑程度,根据每一子图包含的关键嫌疑账户在所属类内对应的类内嫌疑程度、所属类的类嫌疑程度、关键嫌疑账户与所属子图中其他关键嫌疑账户的关联值,以及所述其他关键嫌疑账户所属类的类嫌疑程度中的至少部分信息,识别洗钱账户及洗钱账户对应的洗钱属性信息。
[0103]
洗钱账户对应的洗钱属性信息,包括但不限于洗钱账户对应的洗钱嫌疑权重,与其他洗钱账户间的关联值,是否为洗钱交易链中的关键账户等。
[0104]
进一步,根据每个目标聚类集各个节点数据项的类内嫌疑程度/异常程度确定每个目标聚类集的整体类异常程度,后续,结合每个目标聚类集异常程度综合界定类间关键节点(子图)的异常程度,其中,如果类间关键节点(子图)本身处于异常程度高的类中,且关键节点(子图)包含的各个账户的类内异常程度高,则给予子图及其包含的各账户更高的嫌疑权重,如果关键节点(子图)未处于异常程度高的类中,但与异常程度高的类或子图具有较高关联,则也为其及其包含的账户配置相对较高的嫌疑权重,否则为其配置相对的较低的嫌疑权重,最终确定嫌疑权重高的账户为洗钱账户,并给出其对应的可疑权重、与其他洗钱账户间的关联、是否为洗钱交易链中的关键账户等洗钱属性信息。容易理解,最终可以结合前文添加到可疑名单中的异常交易账户输出识别的洗钱账户及其相关洗钱属性信息。
[0105]
通过以上各个步骤的处理过程,把具有异常交易特征的账户列入到可疑名单列表中,例如交易金额大但是总资产少、交易频繁、总资产总是为零但是交易对手多的账户等特征都能被发现为可疑账户/洗钱账户,并且最后还能确定嫌疑权重/程度以及交易网络的关键洗钱节点,可以十分有效的为反洗钱工作提供调查线索以及调查方向,减轻工作人员办案的人力与财力。
[0106]
常见的基于聚类的离群检测方法,都是先对整个数据源进行基于距离的聚类,然后将不能聚类的点判断为离群点,将具有相似交易特点的数据对象划分为一类,申请人研究发现,基于反洗钱工作的特殊应用场景,反洗钱工作的数据源具有大量和复杂的特点,常见的基于聚类的离群检测方法忽视了个体交易可疑的差别以及类与类之间关键节点的作用。本技术通过对基于数据源获得的交易账户数据对象进行两阶段聚类,将具有类似的交易特征的数据对象归类,然后针对每个聚类分别进行异常程度检测,再对整个聚类交易网络运用链接发现技术进行关键嫌疑账户确定,可更加具有针对性与全面性的挖掘个体交易可疑的差别以及类与类之间关键节点的作用,从而实现更准确的洗钱账户及其洗钱属性信息识别。
[0107]
根据以上方案可知,本技术提供的反洗钱处理方法,通过聚类处理将具有相似交易特征的交易账户聚集在一起,并在聚类基础上进行基于聚类的异常分析,其中,基于聚类的异常分析是在聚类结果集的基础上对类内以及类间的关系进行全面的分析、检测,具体通过对聚类集进行类内的交易账户嫌疑程度检测确定各交易账户分别在所属类的类内嫌疑程度,以及通过对不同目标聚类集对应的交易网络进行链接发现,确定不同类间的关键嫌疑账户,之后,综合交易账户对应的类内嫌疑程度和不同聚类集类间的关键嫌疑账户,识别洗钱账户及洗钱账户对应的洗钱属性信息,可以十分有效的为反洗钱工作提供调查线索以及调查方向,减轻工作人员办案的人力与财力。
[0108]
对应于上述的反洗钱处理方法,本技术实施例还提供一种反洗钱处理装置,参见图4提供的该装置的组成结构图,该反洗钱处理装置具体包括:
[0109]
获取单元401,用于获取至少基于筛选条件确定出的具有洗钱嫌疑的第一交易数据集;
[0110]
统计与归并单元402,用于对所述第一交易数据集进行统计与归并处理,得到第二交易数据集;
[0111]
聚类单元403,用于按与洗钱相关的预设交易特征,对所述第二交易数据集对应的各个交易账户进行聚类处理,得到交易账户的多个目标聚类集;
[0112]
类内检测单元404,用于对各个目标聚类集按类进行类内的交易账户嫌疑程度检测,得到各交易账户分别在所属目标聚类集内的类内嫌疑程度;
[0113]
类间检测单元405,用于通过对不同目标聚类集类对应的交易网络进行链接发现,确定不同目标聚类集类间的关键嫌疑账户;
[0114]
识别单元406,用于根据各交易账户分别在所属目标聚类集内的类内嫌疑程度和不同目标聚类集类间的关键嫌疑账户,识别洗钱账户及洗钱账户对应的洗钱属性信息。
[0115]
在一实施方式中,获取单元401,具体用于:
[0116]
从交易数据源选取与设定的筛选条件匹配的交易数据;
[0117]
将选取的交易数据转换为资金流向图并可视化展示;所述资金流向图的节点包括交易账户所对应的实体数据,边包括不同交易账户之间的交易信息;
[0118]
响应于检测到对所述资金流向图的节点和/或边的剔除操作,从所述资金流向图剔除所述剔除操作指示的节点和/或边,得到完成剔除处理后的资金流向图,完成剔除处理后的资金流向图对应的交易数据,作为所述第一交易数据集。
[0119]
在一实施方式中,统计与归并单元402,具体用于:
[0120]
将资金流向图形式的所述第一交易数据集导入预设数据库,并在导入所述预设数据库时进行数据预处理;
[0121]
按照所述与洗钱相关的预设交易特征对预处理后的第一交易数据进行统计与归并处理,得到第二交易数据集。
[0122]
在一实施方式中,聚类单元403,具体用于:
[0123]
按所述预设交易特征对所述第二交易数据集对应的各个交易账户进行第一聚类处理,得到交易账户的多个第一聚类集;
[0124]
从各个所述第一聚类集中剔除满足异常条件的异常交易账户,得到完成剔除后的各个第一聚类集,并将剔除的异常交易账户添加到可疑名单;
[0125]
按所述预设交易特征对完成剔除后的每个第一聚类集包含的各个账户进行第二聚类处理,得到所述第二交易数据集对应的各个交易账户的多个第二聚类集,作为交易账户的所述多个目标聚类集。
[0126]
在一实施方式中,类间检测单元405,具体用于:
[0127]
确定每个目标聚类集中不同交易账户对应的不同交易数据的数据点间的预设类型距离,根据不同的数据点间的预设类型距离确定不同数据点的离群程度;
[0128]
基于不同数据点的离群程度确定所对应的不同交易账户的类内嫌疑程度。
[0129]
在一实施方式中,类间检测单元405,具体用于:
[0130]
采用度量相关性的方式确定各个目标聚类集对应的交易网络中不同目标聚类集的类间每两个节点数据项之间的关联强度,得到类间每两个节点数据项之间的相关值;
[0131]
基于类间各对节点数据项之间的相关值构造一多变图,所述多变图以图中相邻节点间的边信息表征类间每两个节点数据项间的相关值;
[0132]
基于通过链接标识定义的映射函数,将所述多变图映射为所述多变图的各个子图;每一子图包括基于所述映射函数从所述多变图中筛选出的以一个节点数据项为中心以及与作为中心的节点数据项直接相连的类间相应节点数据项,且每一子图中的类间各对节点数据项间的相关值满足所述映射函数中对节点间相关性的要求;
[0133]
将每一子图中的交易账户确定为不同目标聚类集类间的关键嫌疑账户。
[0134]
在一实施方式中,识别单元406,具体用于:
[0135]
根据每一目标聚类集的各交易账户的类内嫌疑程度确定每一目标聚类集的类嫌疑程度;
[0136]
根据每一子图包含的关键嫌疑账户在所属类内对应的类内嫌疑程度、所属类的类嫌疑程度、关键嫌疑账户与所属子图中其他关键嫌疑账户的关联值,以及所述其他关键嫌疑账户所属类的类嫌疑程度中的至少部分信息,识别洗钱账户及洗钱账户对应的洗钱属性信息。
[0137]
对于本技术实施例公开的反洗钱处理装置而言,由于其与上文方法实施例公开的反洗钱处理方法相对应,所以描述的比较简单,相关相似之处请参见上文方法实施例的说明即可,此处不再详述。
[0138]
综上所述,本技术实施例公开的反洗钱处理方法和装置,通过梳理涉案账户的资金流向,构建资金流向图,找出资金的最终来源和去向,对涉案所有账户基于两阶段聚类处理自动汇聚,挖掘出重点嫌疑账户或者嫌疑团伙,并构建金融网络拓扑图,在聚类结果集的基础上对类内以及类间的关系进行全面分析,掌握涉案账户交易基本特征,从全局上分析案件形势,确定类的账户嫌疑程度以及类间的关键嫌疑账户,快速汇聚团伙成员,最终可实现更准确的洗钱账户及其属性信息识别,且可以处理交易流水量大的案件,支持交易流水的样式较多,另外对于各类洗钱相关数据的分析便捷,精准度高。
[0139]
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0140]
为了描述的方便,描述以上系统或装置时以功能分为各种模块或单元分别描述。当然,在实施本技术时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
[0141]
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例或者实施例的某些部分所述的方法。
[0142]
最后,还需要说明的是,在本文中,诸如第一、第二、第三和第四等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方
法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0143]
以上所述仅是本技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。