异常资金链路识别方法、装置、设备和计算机程序产品与流程

文档序号:31705363发布日期:2022-10-01 10:45阅读:40来源:国知局
异常资金链路识别方法、装置、设备和计算机程序产品与流程

1.本发明实施例涉及大数据技术领域,尤其涉及一种异常资金链路识别方法、 装置、设备和计算机程序产品。


背景技术:

2.随着互联网、大数据等技术的兴起与普及,商业银行通常会产生大量客户 交易数据,在带来可观利润的同时,也存在以资金异常为典型的潜在交易风险。 因此目前通常对用户交易数据的资金链路进行监测,并根据监测结果对资金链 路进行查询。
3.但是目前的资金链路主要是通过传统数据库进行搜索穿透,追踪资金的深 度有限,导致无法获取到精准的资金链路,同时资金穿透更多是实现账户级穿 透,主体划分不清,从而导致所获取的资金链不够全面。因此现有技术中无法 获取到精准全面的资金链路,从而影响异常资金链路的有效识别。


技术实现要素:

4.本发明实施例提供了一种异常资金链路识别方法、装置、设备和计算机程 序产品,以实现对异常资金链路的有效识别。
5.第一方面,本发明实施例提供了一种异常资金链路识别方法,包括:对原 始资金信息进行预处理获取基本链路单元,所述基本链路单元中包含端对端的 资金流向关系;
6.基于预先指定的本体模型对所述链路单元进行实体融合和关系对齐,获取 图谱形式的资金链路,所述资金链路中包含交易对象的类别和关系;
7.对所述资金链路进行检测识别获取异常资金链路。
8.第二方面,本发明实施例提供了一种异常资金链路识别装置,包括:
9.基本链路单元获取模块,用于对原始资金信息进行预处理获取基本链路单 元,所述基本链路单元中包含端对端的资金流向关系;
10.资金链路获取模块,用于基于预先指定的本体模型对所述链路单元进行实 体融合和关系对齐,获取图谱形式的资金链路,所述资金链路中包含交易对象 的类别和关系;
11.异常资金链路识别模块,用于对所述资金链路进行检测识别获取异常资金 链路。
12.第三方面,本发明实施例提供了一种电子设备,电子设备包括:
13.一个或多个处理器;
14.存储装置,用于存储一个或多个程序,
15.当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现 如上的方法。
16.第四方面,本发明实施例提供了一种计算机程序产品,包括计算机程序, 该计算机程序被处理器执行时实现如上所述的方法。
17.本发明实施例的技术方案,通过预先指定的本体模型,对包含端对端资金 流向关系的基本链路单元进行实体融合和关系对齐,可以获取到包含交易对象 的类别和关系的
资金链路,由于所获取的资金链路更加精准全面,从而针对所 获取的资金链路进行异常识别时,提高了异常资金链路识别精准度。
附图说明
18.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使 用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例, 因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创 造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
19.图1是本发明实施例一提供的异常资金链路识别方法的流程图;
20.图2是本发明实施例一提供的异常资金链路识别方法的流程图;
21.图3是本发明实施例二提供的异常资金链路识别方法的流程图;
22.图4是本发明实施例三提供的异常资金链路识别装置的结构示意图;
23.图5是本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
24.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此 处所描述的具体实施例仅用于解释本发明,而非对本发明的限定。
25.另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部 分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示 例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或 步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同 时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可 以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于 方法、软件实现、硬件实现等等。本技术技术方案中对数据的获取、存储、使 用、处理等均符合国家法律法规的相关规定。
26.实施例一
27.图1是本发明实施例提供的异常资金链路识别方法的流程图,给实施例可 适用于对资金链路进行异常识别的情况,该方法可以由本发明实施例中的异常 资金链路识别装置来执行,该装置可以采用软件和/或硬件的方式实现。如图1 所示,该方法具体包括如下操作:
28.步骤s101,对原始资金信息进行预处理获取基本链路单元。
29.可选的,对原始资金信息进行预处理获取链路单元,包括:将原始资金信 息存入图数据库获取初始链路单元;按照指定标准对初始链路单元进行检验, 获取基本链路单元,其中,指定标准包括:业务逻辑标准和字段标准。
30.具体的说,本实施方式中的原始资金信息具体可以是银行监管部门从银行 所获取的明细数据,具体可以包括交易数据、客户信息、信贷信息、转账流水 信息和转账交易数据等,本实施方式中并不限定原始资金信息的具体内容。在 获取到银行的原始资金信息之后,还会将原始资金信息导入到大数据存储部分 进行保存,以便于后续数据加工以及资金链路的穿透计算等相关操作。
31.其中,在接收到用户指令需要进行异常资金链路识别时,会从存储部分提 取出原
始资金信息,并将原始资金信息存入图数据库获取初始链路单元,本实 施方式中的图数据库是一种非关系型数据库,用于存储实体之间的关系信息, 因此本实施方式中通过将原始资金信息存入图数据库,可以获取包含端对端的 资金流向关系的初始链路单元,例如,资金a在实体a和实体b之间流向。
32.可选的,按照指定标准对初始链路单元进行检验,获取基本链路单元,包 括:判断初始链路单元是否符合业务逻辑标准,若是,判断初始链路单元是否 符合字段标准,若是,则将初始链路单元作为基本链路单元,否则,将初始链 路单元进行删除;否则,将初始链路单元进行删除。
33.需要说明的是,在通过图数据库获取到初始链路单元后需要对初始链路单 元按照指定标准进行校验,而指定标准具体可以包括业务逻辑标准和字段标准。 例如,业务逻辑标准中规定了有转出则必定有对应的转出,如果关于一笔资金 w,由实体a流入到实体b,则针对转出方实体a来说,实体a有笔资金w转出 到实体b,则必定有成对的信息,针对转入方实体b来说,实体b有笔资金w 由实体a转入,因此如果初始链路单元中关于一笔资金仅包含转出信息或仅包 含转入信息,则确定该条初始链路单元是无效的,并将初始链路单元进行删除; 如果初始链路单元中关于一笔资金同时包含转出信息和转入信息,则确定该条 初始链路单元是有效的,此时会继续按照字段标准进行校验。例如,对账号字 段的具体格式进行了预先设置,当确定初始链路单元中所涉及的资金账号格式 与预先设置的格式不符时,则确定该条初始链路单元是无效的,因此将校验不 通过的初始链路单元进行删除,将校验通过的初始链路单元进行保留,并将保 留的初始链路单元作为基本链路单元。当然,本实施方式中仅是举例说明,而 并不限定进行校验时指定标准的具体类型,只要能够获取到符合要求的基本链 路单元,则都是在本技术的保护范围内,本实施方式中并不对其进行限定。
34.步骤s102,基于预先指定的本体模型对基本链路单元进行实体融合和关系 对齐,获取图谱形式的资金链路。
35.可选的,基于预先指定的本体模型对基本链路单元进行实体融合和关系对 齐,获取图谱形式的资金链路,包括:确定基本链路单元中交易实体的类型; 基于预先指定的本体模型将归属于指定类型的基本链路单元进行保留;确定保 留的基本链路单元中交易实体的关系,根据关系将保留的各基本链路单元进行 连接,获取图谱形式的资金链路。
36.具体的说,本实施方式中会对基本链路单元中交易实体的类型进行划分, 如交易实体的类型可以是银行、对公企业、对私企业和个人等,本实施方式中 并不限定交易的具体类型进行限定。本体模型是指示图谱的重要组成部分,是 一种逻辑模型,能够将结构化指示转化为形式化的关系元组,因此具有一定的 指向性。本实施方式中可以预先指定本体模型,本体模型中预先设置实现资金 从企业流向个人,以及个人流向个人,因此通过本体模型可以对上述交易实体 类型确定的基本链路单元进行筛选,将个人流向企业的基本链路单元进行删除。 并且还会确定保留的基本链路单元中交易实体的关系以进行关系对齐,关系具 体可以包括转账和占股等。并且会根据关系将保留的各基本链路单元进行连接, 获取图谱形式的资金链路,在所获取的资金链路中包含交易对象的类别和关系。 例如,所获取的一条资金链路中,包含资金由企业a流向个人b,个人b又流 向个人c,个人c流向个人d,同时企业a和个人b之间是占股关系,个人b和 个人c之间是转账关系,个人c和个人d之间
是转账关系。
37.其中,本实施方式通过本体模型可以获取到具有指向性的基本链路单元, 从而实现对基本链路单元的筛选,以按照本体模型所要求的指向性进行异常资 金链路的检测识别,并且资金链路中不进包含交易对象的类别而且还包括关系, 因此所获取的资金链路更加准确,从而可以提高异常资金链路识别的精确性。
38.步骤s103,对资金链路进行检测识别获取异常资金链路。
39.如图2所示,具体对步骤s103进行具体说明,具体包括:
40.步骤s1031,从资金链路中筛选出包含相同交易对象的指定资金链路。
41.具体的说,在实际应用中,例如银行信贷发放场景下通常会涉及到多实体 业务交叉的情况,并且在这种情况下通常存在异常资金链路的概率比较大,因 此本实施方式中在对资金链路进行检测识别时,首先确定出汇聚链路,然后对 汇聚链路进行检测识别。因此本实施方式中会从资金链路中筛选出包含相同交 易对象的指定资金链路。例如,资金链路a为资金由企业a流向个人b,个人b 又流向个人c;资金链路b为资金由企业a流向个人c,个人c流向个人d;资 金链路c为个人m流向个人n,个人n流向个人p。则可以确定资金链路a和资 金链路b中包含相同的交易对象c,此时则将资金链路a和资金链路b作为指 定资金链路,当然,本实施方式中仅是举例进行说明,而并不对指定资金链路 以及指定资金链路的具体数量进行限定。
42.步骤s1032,将指定资金链路进行汇聚获取汇聚链路。
43.其中,在获取到包含相同交易对象的指定资金链路后,会将指定资金链路 根据相同交易对象进行汇聚,即将相同交易对象作为汇聚点,将至少两条指定 资金链路进行连接汇聚,从而形成一条汇聚链路。
44.需要说明的是,本实施方式中可以根据指定资金链路获取到多条汇聚链路, 而每个汇聚链路所对应的汇聚点分别不同,本实施方式中并不限定汇聚链路的 具体数量。
45.步骤s1033,对汇聚链路进行检测识别获取异常资金链路。
46.可选的,对汇聚链路进行检测识别获取异常资金链路,包括:对汇聚链路 进行相似度计算,根据相似度计算结果获取归属于同一图结构的指定汇聚链路; 在确定图结构为预先指定的异常图结构时,则将构成指定汇聚链路的资金链路 作为异常资金链路。
47.本发明实施例的技术方案,通过预先指定的本体模型,对包含端对端资金 流向关系的基本链路单元进行实体融合和关系对齐,可以获取到包含交易对象 的类别和关系的资金链路,由于所获取的资金链路更加精准全面,从而针对所 获取的资金链路进行异常识别时,提高了异常资金链路识别精准度。
48.实施例二
49.图3是本发明实施例提供的异常资金链路识别方法的流程图,本实施例以 上述实施例为基础,对上述步骤s1033进行具体说明,方法步骤具体包括如下 操作:
50.步骤s201,对汇聚链路进行相似度计算,根据相似度计算结果获取归属于 同一图结构的指定汇聚链路。
51.可选的,对汇聚链路进行相似度计算,根据相似度计算结果获取归属于同 一图结构的指定汇聚链路,包括:计算每个汇聚链路之间的相似度,获取各汇 聚链路所对应的相似度序列,其中,相似度序列中包含与除自身外各汇聚链路 之间的相似度;将相似度序列
中的相似度与预设阈值进行比较,将大于预设阈 值的相似度所对应的汇聚链路作为指定汇聚链路;将指定汇聚链路归属于同一 图结构。
52.在一个具体实现中,在对汇聚链路进行检测识别时,具体是对各汇聚链路 进行相似度的计算,例如,有x、y和z三条汇聚链路,分别计算每个汇聚链路 之间的相似度,获取各汇聚链路所对应的相似度序列,相似度序列中包含与除 自身外各汇聚链路之间的相似度,如下表1为汇聚链路x所对应的相似度序列 1示例:
53.表1
54.汇聚链路相似度xy0.6xz0.3
55.如下表2为汇聚链路y所对应的相似度序列2示例:
56.表2
57.汇聚链路相似度yx0.6yz0.2
58.如下表3为汇聚链路z所对应的相似度序列3示例:
59.表3
60.汇聚链路相似度zx0.3zy0.2
61.需要说明的是,本实施方式中预先设定的预设阈值可以为0.5,将大于预 设阈值的相似度所对应的汇聚链路作为指定汇聚链路,则根据上述表1、表2 和表3可以得出,汇聚链路x和汇聚链路z之间的相似度超过了预设阈值,因 此可以将汇聚链路x和汇聚链路z作为指定汇聚链路,并将指定汇聚链路归属 于同一图结构f。
62.步骤s202,在确定图结构为预先指定的异常图结构时,则将构成指定汇聚 链路的资金链路作为异常资金链路。
63.具体的说,本实施方式中会对资金流向异常的场景预先设置图结构,例如 信贷资金流向房地产的异常资金交易主要出现在图结构f中,因此可以将归属 于图结构f的汇聚链路x和汇聚链路z作为异常汇聚链路,并将构成汇聚链路 x和汇聚链路z的资金链路分别作为异常资金链路。
64.本发明实施例的技术方案,通过预先指定的本体模型,对包含端对端资金 流向关系的基本链路单元进行实体融合和关系对齐,可以获取到包含交易对象 的类别和关系的资金链路,由于所获取的资金链路更加精准全面,从而针对所 获取的资金链路进行异常识别时,提高了异常资金链路识别精准度。
65.实施例三
66.图4为本发明实施例提供的异常资金链路识别装置的结构示意图,该装置 包括:基本链路单元获取模块310、资金链路获取模块320和异常资金链路识 别模块330。
67.其中,基本链路单元获取模块310,用于对原始资金信息进行预处理获取 基本链
路单元,基本链路单元中包含端对端的资金流向关系;
68.资金链路获取模块320,用于基于预先指定的本体模型对链路单元进行实 体融合和关系对齐,获取图谱形式的资金链路,资金链路中包含交易对象的类 别和关系;
69.异常资金链路识别模块330,用于对资金链路进行检测识别获取异常资金 链路。
70.可选的,基本链路单元获取模块,用于将原始资金信息存入图数据库获取 初始链路单元;
71.按照指定标准对初始链路单元进行检验,获取基本链路单元,其中,指定 标准包括:业务逻辑标准和字段标准。
72.可选的,基本链路单元获取模块,具体用于判断初始链路单元是否符合业 务逻辑标准,若是,判断初始链路单元是否符合字段标准,若是,则将初始链 路单元作为基本链路单元,否则,将初始链路单元进行删除;
73.否则,将初始链路单元进行删除。
74.可选的,资金链路获取模块,用于确定基本链路单元中交易实体的类型;
75.基于预先指定的本体模型将归属于指定类别的基本链路单元进行保留;
76.确定保留的基本链路单元中交易实体的关系,根据关系将保留的各基本链 路单元进行连接,获取图谱形式的资金链路。
77.可选的,异常资金链路识别模块,用于从资金链路中筛选出包含相同交易 对象的指定资金链路;
78.将指定资金链路进行汇聚获取汇聚链路;
79.对汇聚链路进行检测识别获取异常资金链路。
80.可选的,异常资金链路识别模块,具体用于对汇聚链路进行相似度计算, 根据相似度计算结果获取归属于同一图结构的指定汇聚链路;
81.在确定图结构为预先指定的异常图结构时,则将构成指定汇聚链路的资金 链路作为异常资金链路。
82.可选的,异常资金链路识别模块,具体用于计算每个汇聚链路之间的相似 度,获取各汇聚链路所对应的相似度序列,其中,相似度序列中包含与除自身 外各汇聚链路之间的相似度;
83.将相似度序列中的相似度与预设阈值进行比较,将大于预设阈值的相似度 所对应的汇聚链路作为指定汇聚链路;
84.将指定汇聚链路归属于同一图结构。
85.上述装置可执行本发明任意实施例所提供的异常资金链路识别方法,具备 执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节, 可参见本发明任意实施例提供的方法。
86.实施例四
87.图5是本发明实施例提供的一种电子设备的结构示意图。图5示出了适用 于用来实现本发明实施方式的示例性电子设备412的框图。图5显示的电子设 备412仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
88.如图5所示,电子设备412以通用计算设备的形式出现。电子设备412的 组件可以包括但不限于:一个或者多个处理器416,存储器428,连接不同系统 组件(包括存储器428
和处理器416)的总线418。
89.总线418表示几类总线结构中的一种或多种,包括存储器总线或者存储器 控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总 线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构 (isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准 协会(vesa)局域总线以及外围组件互连(pci)总线。
90.电子设备412典型地包括多种计算机系统可读介质。这些介质可以是任何 能够被电子设备412访问的可用介质,包括易失性和非易失性介质,可移动的 和不可移动的介质。
91.存储器428用于存储指令。存储器428可以包括易失性存储器形式的计算 机系统可读介质,例如随机存取存储器(ram)430和/或高速缓存存储器432。 电子设备412可以进一步包括其它可移动/不可移动的、易失性/非易失性计算 机系统存储介质。仅作为举例,存储系统434可以用于读写不可移动的、非易 失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可 以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对 可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱 动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线 418相连。存储器428可以包括至少一个程序产品,该程序产品具有一组(例 如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
92.具有一组(至少一个)程序模块442的程序/实用工具440,可以存储在例 如存储器428中,这样的程序模块442包括但不限于操作系统、一个或者多个 应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可 能包括网络环境的实现。程序模块442通常执行本发明所描述的实施例中的功 能和/或方法。
93.电子设备412也可以与一个或多个外部设备414(例如键盘、指向设备、 显示器424等)通信,还可与一个或者多个使得用户能与该电子设备412交互 的设备通信,和/或与使得该电子设备412能与一个或多个其它计算设备进行通 信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/ 输出(i/o)接口422进行。并且,电子设备412还可以通过网络适配器420与 一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如 因特网)通信。如图所示,网络适配器420通过总线418与电子设备412的其 它模块通信。应当明白,尽管图5中未示出,可以结合电子设备412使用其它 硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外 部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
94.处理器416通过运行存储在存储器428中的指令,从而执行各种功能应用 以及数据处理,例如实现本发明实施例所提供的异常资金链路识别方法:对原 始资金信息进行预处理获取基本链路单元,基本链路单元中包含端对端的资金 流向关系;基于预先指定的本体模型对链路单元进行实体融合和关系对齐,获 取图谱形式的资金链路,资金链路中包含交易对象的类别和关系;对资金链路 进行检测识别获取异常资金链路。
95.实施例五
96.本发明实施例提供了一种计算机程序产品,包括计算机程序,该程序被处 理器执行时实现如本技术所有发明实施例提供的异常资金链路识别方法:对原 始资金信息进行预处理获取基本链路单元,基本链路单元中包含端对端的资金 流向关系;基于预先指定的
本体模型对链路单元进行实体融合和关系对齐,获 取图谱形式的资金链路,资金链路中包含交易对象的类别和关系;对资金链路 进行检测识别获取异常资金链路。
97.可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以 是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可 以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或 者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包 括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储 器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、 光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者 上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或 存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与 其结合使用。
98.计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据 信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种 形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读 的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算 机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用 或者与其结合使用的程序。
99.计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不 限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。
100.可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计 算机程序代码,所述程序设计语言包括面向对象的程序设计语言诸如java、 smalltalk、c++,还包括常规的过程式程序设计语言诸如“c”语言或类似的程 序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机 上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机 上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中, 远程计算机可以通过任意种类的网络包括局域网(lan)或广域网(wan)连接到 用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通 过因特网连接)。
101.注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员 会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进 行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽 然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以 上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例, 而本发明的范围由所附的权利要求范围决定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1