一种客户转账关系分析方法及系统的制作方法
【专利摘要】本发明公开了一种客户转账关系分析方法,包括:采集客户在银行的转账交易数据;对转账交易数据进行数据加工,生成客户的交易向量,所述交易向量包括:客户号、交易权重和交易对手号;以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络。本发明能够通过对客户转账关系的分析实现对客户关系的深度研究,构建出转账关系网络。本发明还公开了一种客户转账关系分析系统。
【专利说明】
一种客户转账关系分析方法及系统
技术领域
[0001]本发明涉及数据处理分析技术领域,尤其涉及一种客户转账关系分析方法及系统。
【背景技术】
[0002]随着互联网金融的发展,银行营业层出不穷,特别是电子银行、手机银行等的出现,使得客户的规模不断扩大,客户通过转账关系相互连接、影响,这些关系形成了巨大的关系网络。
[0003]目前对客户的研究停留在“点”的方式,仅仅分析单个客户的各项指标,如性别、年龄、财富、交易行为、资产状况等;缺乏对客户关系的深度研究,没有有效的对客户建立关系网络,银行的客户之间关系主要以转账关系的形式存在,因此如何实现对客户转账关系进行分析是一项亟待解决的问题。
【发明内容】
[0004]本发明提供了一种客户转账关系分析方法,能够通过对客户转账关系的分析实现对客户关系的深度研究,构建出转账关系网络。
[0005]本发明提供了一种客户转账关系分析方法,包括:
[0006]采集客户在银行的转账交易数据;
[0007]对所述转账交易数据进行数据加工,生成客户的交易向量,所述交易向量包括:客户号、交易权重和交易对手号;
[0008]以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络。
[0009]优选地,所述方法还包括:
[0010]并行计算转账关系网络中每个节点的度;
[0011]对节点的度进行排序,输出节点的度大于预设阈值的节点。
[0012]优选地,所述方法还包括:
[0013]为转账关系网络中每个节点赋予一个第一无二的初始标签,表示迭代开始前,每个节点自身为一个独立的社区;
[0014]对于转账关系网络中的每一个节点,遍历节点的邻居节点信息,选取邻居节点中出现次数最多的标签,将其设定为该节点的新标签;
[0015]重复上述步骤,直至所有节点的标签不再改变或达到预先设定的迭代次数;
[0016]将具有相同标签的节点合并到同一社区。
[0017]优选地,所述对所述转账交易数据进行数据加工,生成客户的交易向量具体为:
[0018]对所述转账交易数据进行加载、清洗和转换,生成客户的交易向量。
[0019]优选地,所述以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络包括:
[0020]用无向图的节点表示转账关系网络中的成员,用无向图的边表示成员与成员间的关系;
[0021]建立客户转账关系的邻接矩阵,有转账关系的节点将其对应的位置为转账次数,无转账关系矩阵对应的位置置为O。
[0022]一种客户转账关系分析系统,包括:
[0023]采集单元,用于采集客户在银行的转账交易数据;
[0024]数据处理单元,用于对所述转账交易数据进行数据加工,生成客户的交易向量,所述交易向量包括:客户号、交易权重和交易对手号;
[0025]生成单元,用于以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络。
[0026]优选地,所述系统还包括:
[0027]计算单元,用于并行计算转账关系网络中每个节点的度;
[0028]输出单元,用于对节点的度进行排序,输出节点的度大于预设阈值的节点。
[0029]优选地,所述系统还包括:
[0030]赋予单元,用于为转账关系网络中每个节点赋予一个第一无二的初始标签,表示迭代开始前,每个节点自身为一个独立的社区;
[0031]选取单元,用于对于转账关系网络中的每一个节点,遍历节点的邻居节点信息,选取邻居节点中出现次数最多的标签,将其设定为该节点的新标签;
[0032]合并单元,用于将具有相同标签的节点合并到同一社区。
[0033]优选地,所述数据处理单元具体用于:
[0034]对所述转账交易数据进行加载、清洗和转换,生成客户的交易向量。
[0035]优选地,所述生成单元包括:
[0036]表示单元,用于用无向图的节点表示转账关系网络中的成员,用无向图的边表示成员与成员间的关系;
[0037]建立单元,用于建立客户转账关系的邻接矩阵,有转账关系的节点将其对应的位置为转账次数,无转账关系矩阵对应的位置置为O。
[0038]由上述方案可知,本发明提供的一种客户转账关系分析方法,首先通过采集客户在银行转账过程中的转账交易数据,然后对采集到的转账交易数据进行数据加工,生成由客户号、交易权重和交易对手号构成的交易向量,最后以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络。通过对客户转账关系进行分析,有效的建立了客户关系网络,通过转账关系网络实现了对客户关系的深度研究。
【附图说明】
[0039]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0040]图1为本发明实施例一公开的一种客户转账关系分析方法的流程图;
[0041 ]图2为本发明实施例二公开的一种客户转账关系分析方法的流程图;
[0042]图3为本发明实施例三公开的一种客户转账关系分析方法的流程图;
[0043]图4为本发明实施例四公开的一种客户转账关系分析方法的流程图;
[0044]图5为本发明实施例五公开的一种客户转账关系分析系统的结构示意图;
[0045]图6为本发明实施例六公开的一种客户转账关系分析系统的结构示意图;
[0046]图7为本发明实施例七公开的一种客户转账关系分析系统的结构示意图;
[0047]图8为本发明实施例八公开的一种客户转账关系分析系统的结构示意图。
【具体实施方式】
[0048]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0049]如图1所不,为本发明实施例一公开的一种客户转账关系分析方法,包括:
[0050]SlOl、采集客户在银行的转账交易数据;
[0051]当需要对客户转账关系进行分析时,采集客户在银行多渠道的转账交易数据,例如在电子银行、掌上银行、柜台、自动机柜等上的转账交易数据。其中,所述的转账交易数据包括转账的源客户号、账户号、客户名称,目标客户号、账号、客户名称,转账金额、转账次数,转出行号、转出行名称、转入行号、转入行名称等。在采集的过程中,还可以将采集到的转账交易数据存储在分布式文件系统或数据库中。
[0052]S102、对转账交易数据进行数据加工,生成客户的交易向量,所述交易向量包括:客户号、交易权重和交易对手号;
[0053]对采集到的转账交易数据进行数据加工,生成客户的交易向量,交易向量包括:客户号、交易权重和交易对手号。其中,交易权重为客户A与客户B的交易次数,当交易对手是行内客户时,交易对手号为其客户号,当交易对手是行外客户时,交易对手号为其账户号。
[0054]S103、以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络。
[0055]以发生转账交易的客户为节点,客户之间的转账关系为边,即以客户之间的交易权重为边,构造出转账关系网络。在转账关系网络的构建过程中,可以采用MapReduce来实现,转账关系网络的结果可以保存在分布式文件系统中,转账关系网络中主要包括节点,节点关联的节点,以及边的权重信息。
[0056]综上所述,在上述实施例中,首先通过采集客户在银行转账过程中的转账交易数据,然后对采集到的转账交易数据进行数据加工,生成由客户号、交易权重和交易对手号构成的交易向量,最后以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络。通过对客户转账关系进行分析,有效的建立了客户关系网络,通过转账关系网络实现了对客户关系的深度研究。
[0057]如图2所示,为本发明实施例二公开的一种客户转账关系分析方法,包括:
[0058]S201、采集客户在银行的转账交易数据;
[0059]当需要对客户转账关系进行分析时,采集客户在银行多渠道的转账交易数据,例如在电子银行、掌上银行、柜台、自动机柜等上的转账交易数据。其中,所述的转账交易数据包括转账的源客户号、账户号、客户名称,目标客户号、账号、客户名称,转账金额、转账次数,转出行号、转出行名称、转入行号、转入行名称等。在采集的过程中,还可以将采集到的转账交易数据存储在分布式文件系统或数据库中。
[ΟΟ?Ο] S202、对转账交易数据进行数据加工,生成客户的交易向量,所述交易向量包括:客户号、交易权重和交易对手号;
[0061]对采集到的转账交易数据进行数据加工,生成客户的交易向量,交易向量包括:客户号、交易权重和交易对手号。其中,交易权重为客户A与客户B的交易次数,当交易对手是行内客户时,交易对手号为其客户号,当交易对手是行外客户时,交易对手号为其账户号。
[0062]S203、以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络;
[0063]以发生转账交易的客户为节点,客户之间的转账关系为边,即以客户之间的交易权重为边,构造出转账关系网络。在转账关系网络的构建过程中,可以采用MapReduce来实现,转账关系网络的结果可以保存在分布式文件系统中,转账关系网络中主要包括节点,节点关联的节点,以及边的权重信息。
[0064]S204、并行计算转账关系网络中每个节点的度;
[0065]通过编写MapReduce程序并行计算转账关系网络中每个节点的度,Map阶段,客户A与客户B转账的记录,对应生成两条记录(A,B),(B,A) !Reduce端进行合并,计算出每个节点的度,即每个客户转账的总的客户数。
[0066]S205、对节点的度进行排序,输出节点的度大于预设阈值的节点。
[0067]对节点的度进行排序,发现其中的“大V”客户,节点大于预先设定阈值的为“大V”客户。
[0068]综上所述,在上述实施例中,首先通过采集客户在银行转账过程中的转账交易数据,然后对采集到的转账交易数据进行数据加工,生成由客户号、交易权重和交易对手号构成的交易向量,最后以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络。通过对客户转账关系进行分析,有效的建立了客户关系网络,通过转账关系网络实现了对客户关系的深度研究。进一步,通过并行计算转账关系网络中每个节点的度,能够发现每个客户转账的总的客户数,通过转账的客户数能够分析出重要客户。
[0069]如图3所示,为本发明实施例三公开的一种客户转账关系分析方法,包括:
[0070 ] S301、采集客户在银行的转账交易数据;
[0071]当需要对客户转账关系进行分析时,采集客户在银行多渠道的转账交易数据,例如在电子银行、掌上银行、柜台、自动机柜等上的转账交易数据。其中,所述的转账交易数据包括转账的源客户号、账户号、客户名称,目标客户号、账号、客户名称,转账金额、转账次数,转出行号、转出行名称、转入行号、转入行名称等。在采集的过程中,还可以将采集到的转账交易数据存储在分布式文件系统或数据库中。
[0072]S302、对转账交易数据进行数据加工,生成客户的交易向量,所述交易向量包括:客户号、交易权重和交易对手号;
[0073]对采集到的转账交易数据进行数据加工,生成客户的交易向量,交易向量包括:客户号、交易权重和交易对手号。其中,交易权重为客户A与客户B的交易次数,当交易对手是行内客户时,交易对手号为其客户号,当交易对手是行外客户时,交易对手号为其账户号。
[0074]S303、以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络;
[0075]以发生转账交易的客户为节点,客户之间的转账关系为边,即以客户之间的交易权重为边,构造出转账关系网络。在转账关系网络的构建过程中,可以采用MapReduce来实现,转账关系网络的结果可以保存在分布式文件系统中,转账关系网络中主要包括节点,节点关联的节点,以及边的权重信息。
[0076]S304、并行计算转账关系网络中每个节点的度;
[0077]通过编写MapReduce程序并行计算转账关系网络中每个节点的度,Map阶段,客户A与客户B转账的记录,对应生成两条记录(A,B),(B,A) !Reduce端进行合并,计算出每个节点的度,即每个客户转账的总的客户数。
[0078]S305、对节点的度进行排序,输出节点的度大于预设阈值的节点;
[0079]对节点的度进行排序,发现其中的“大V”客户,节点大于预先设定阈值的为“大V”客户。
[0080]S306、为转账关系网络中每个节点赋予一个第一无二的初始标签,表示迭代开始前,每个节点自身为一个独立的社区;
[0081]转账关系网络用图表示,设图G= G(V,E),所谓转账关系网络中的社区发现:是指在图6中确定1:(1:> = 1)个社区,
[0082]C={Cl,C2,C3,...,Ct}
[0083]使得各社区的顶点集合构成节点V集合的一个覆盖。采用的改进的并行标签传递算法实现转账关系网络中的社区发现。首先,Map阶段:读取保存在分布式文件系统中的转账关系网络的信息,为每个节点赋予一个独一无二的初始标签,代表迭代开始前,每个节点自身为一个独立的社区。每个节点生成(节点,标签),(邻居节点,次数权重,节点,标签),发送给Reduce端。
[0084]S307、对于转账关系网络中的每一个节点,遍历节点的邻居节点信息,选取邻居节点中出现次数最多的标签,将其设定为该节点的新标签;
[0085]其次,聚合Map端发送的数据,为每个节点选出出现次数最多的标签(当多个标签出现次数同样多时,选择权重大即转账次数多的那个标签),将其设定为该节点的新标签。汇总(节点,标签,邻居节点)信息。
[0086]重复上述步骤,直至所有节点的标签不再改变或达到预先设定的迭代次数;
[0087]迭代执行上述MapReduce过程,直到所有节点的标签不再改变或达到预先设定的迭代次数。采用该算法,一般迭代10-15次能完成。
[0088]S308、将具有相同标签的节点合并到同一社区。
[0089]将具有相同标签的节点合并到同一社区,最终的结果表示成标签、客户号的集合,优选的可将结果保存在分布式文件系统中。
[0090]综上所述,在上述实施例中,首先通过采集客户在银行转账过程中的转账交易数据,然后对采集到的转账交易数据进行数据加工,生成由客户号、交易权重和交易对手号构成的交易向量,最后以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络。通过对客户转账关系进行分析,有效的建立了客户关系网络,通过转账关系网络实现了对客户关系的深度研究。进一步,通过并行计算转账关系网络中每个节点的度,能够发现每个客户转账的总的客户数,通过转账的客户数能够分析出重要客户。进一步,实现了转账关系网络中的客户社区发现,实现了发现客户的亲疏关系,提炼客户社区的特征,进一步发现客户交易行为是否属于大额、可疑交易。
[0091]如图4所示,为本发明实施例四公开的一种客户转账关系分析方法,包括:
[0092 ] S401、采集客户在银行的转账交易数据;
[0093]当需要对客户转账关系进行分析时,采集客户在银行多渠道的转账交易数据,例如在电子银行、掌上银行、柜台、自动机柜等上的转账交易数据。其中,所述的转账交易数据包括转账的源客户号、账户号、客户名称,目标客户号、账号、客户名称,转账金额、转账次数,转出行号、转出行名称、转入行号、转入行名称等。在采集的过程中,还可以将采集到的转账交易数据存储在分布式文件系统或数据库中。
[0094]S402、对所述转账交易数据进行加载、清洗和转换,生成客户的交易向量,所述交易向量包括:客户号、交易权重和交易对手号;
[0095]对采集到的转账交易数据进行数据加载、清洗和转换,生成客户的交易向量,交易向量包括:客户号、交易权重和交易对手号。其中,交易权重为客户A与客户B的交易次数,当交易对手是行内客户时,交易对手号为其客户号,当交易对手是行外客户时,交易对手号为其账户号。
[0096]其中,加载是指将数据中生成系统转移到分析系统,并从分析系统磁盘加载到数据库中或者分布式文件系统中,本发明主要是加载到分布式文件系统中。
[0097]清洗过程是指,银行的交易记录可能有些坏记录,如字符编码有误,数据分隔符错误等,清洗就是将这些坏记录去除。
[0098]转换是指将一条多字段的交易数据中,抽取出所需的信息,如转账源客户号、转账源账户号,转账源名称,转账目标客户号、转账目标账户号,转账目标名称,转账金额、转账次数。
[0099]S403、用无向图的节点表示转账关系网络中的成员,用无向图的边表示成员与成员间的关系;
[0100]以发生转账交易的客户为节点,客户之间的转账关系为边构造转账关系网络。转账关系网络中的成员用无向图的节点来表示,成员与成员间的关系用无向图的边来表示。
[0101]S404、建立客户转账关系的邻接矩阵,有转账关系的节点将其对应的位置为转账次数,无转账关系矩阵对应的位置置为O;
[0102]建立客户转账关系的邻接矩阵,该矩阵为稀疏矩阵,有转账关系的节点将其对应的位置为转账次数,无转账关系矩阵对应的位置置为0,为节省存储空间不保存。可以采用MapReduce实现转账关系网络的构建,转账关系网络的结果保存在分布式文件系统中,转账关系网络中主要包括节点,节点关联的节点,以及边的权重信息。
[0103]S405、并行计算转账关系网络中每个节点的度;
[0104]通过编写MapReduce程序并行计算转账关系网络中每个节点的度,Map阶段,客户A与客户B转账的记录,对应生成两条记录(A,B),(B,A) !Reduce端进行合并,计算出每个节点的度,即每个客户转账的总的客户数。
[0105]S406、对节点的度进行排序,输出节点的度大于预设阈值的节点;
[0106]对节点的度进行排序,发现其中的“大V”客户,节点大于预先设定阈值的为“大V”客户。
[0107]S407、为转账关系网络中每个节点赋予一个第一无二的初始标签,表示迭代开始前,每个节点自身为一个独立的社区;
[0108]转账关系网络用图表示,设图G= G(V,E),所谓转账关系网络中的社区发现:是指在图6中确定1:(1:> = 1)个社区,
[0109]C={C1, C2,C3,…,Ct}
[0110]使得各社区的顶点集合构成节点V集合的一个覆盖。采用的改进的并行标签传递算法实现转账关系网络中的社区发现。首先,Map阶段:读取保存在分布式文件系统中的转账关系网络的信息,为每个节点赋予一个独一无二的初始标签,代表迭代开始前,每个节点自身为一个独立的社区。每个节点生成(节点,标签),(邻居节点,次数权重,节点,标签),发送给Reduce端。
[0111]S408、对于转账关系网络中的每一个节点,遍历节点的邻居节点信息,选取邻居节点中出现次数最多的标签,将其设定为该节点的新标签;
[0112]其次,聚合Map端发送的数据,为每个节点选出出现次数最多的标签(当多个标签出现次数同样多时,选择权重大即转账次数多的那个标签),将其设定为该节点的新标签。汇总(节点,标签,邻居节点)信息。
[0113]重复上述步骤,直至所有节点的标签不再改变或达到预先设定的迭代次数;
[0114]迭代执行上述MapReduce过程,直到所有节点的标签不再改变或达到预先设定的迭代次数。采用该算法,一般迭代10-15次能完成。
[0115]S409、将具有相同标签的节点合并到同一社区。
[0116]将具有相同标签的节点合并到同一社区,最终的结果表示成标签、客户号的集合,优选的可将结果保存在分布式文件系统中。
[0117]综上所述,在上述实施例中,首先通过采集客户在银行转账过程中的转账交易数据,然后对采集到的转账交易数据进行数据加工,生成由客户号、交易权重和交易对手号构成的交易向量,最后以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络。通过对客户转账关系进行分析,有效的建立了客户关系网络,通过转账关系网络实现了对客户关系的深度研究。进一步,通过并行计算转账关系网络中每个节点的度,能够发现每个客户转账的总的客户数,通过转账的客户数能够分析出重要客户。进一步,实现了转账关系网络中的客户社区发现,实现了发现客户的亲疏关系,提炼客户社区的特征,进一步发现客户交易行为是否属于大额、可疑交易。
[0118]如图5所示,为本发明实施例五公开的一种客户转账关系分析系统,包括:
[0119]采集单元501,用于采集客户在银行的转账交易数据;
[0120]数据处理单元502,用于对所述转账交易数据进行数据加工,生成客户的交易向量,所述交易向量包括:客户号、交易权重和交易对手号;
[0121]生成单元503,用于以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络。
[0122]上述实施例五的工作原理与实施例一相同,在此不再赘述。
[0123]如图6所示,为本发明实施例六公开的一种客户转账关系分析系统,包括:
[0124]采集单元601,用于采集客户在银行的转账交易数据;
[0125]数据处理单元602,用于对所述转账交易数据进行数据加工,生成客户的交易向量,所述交易向量包括:客户号、交易权重和交易对手号;
[0126]生成单元603,用于以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络;
[0127]计算单元604,用于并行计算转账关系网络中每个节点的度;
[0128]输出单元605,用于对节点的度进行排序,输出节点的度大于预设阈值的节点。
[0129]上述实施例六的工作原理与实施例二相同,在此不再赘述。
[0130]如图7所示,为本发明实施例七公开的一种客户转账关系分析系统,包括:
[0131]采集单元701,用于采集客户在银行的转账交易数据;
[0132]数据处理单元702,用于对所述转账交易数据进行数据加工,生成客户的交易向量,所述交易向量包括:客户号、交易权重和交易对手号;
[0133]生成单元703,用于以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络;
[0134]计算单元704,用于并行计算转账关系网络中每个节点的度;
[0135]输出单元705,用于对节点的度进行排序,输出节点的度大于预设阈值的节点;
[0136]赋予单元706,用于为转账关系网络中每个节点赋予一个第一无二的初始标签,表示迭代开始前,每个节点自身为一个独立的社区;
[0137]选取单元707,用于对于转账关系网络中的每一个节点,遍历节点的邻居节点信息,选取邻居节点中出现次数最多的标签,将其设定为该节点的新标签;
[0138]合并单元708,用于将具有相同标签的节点合并到同一社区。
[0139]上述实施例七的工作原理与实施例三相同,在此不再赘述。
[0140]如图8所示,为本发明实施例八公开的一种客户转账关系分析系统,包括:
[0141]采集单元801,用于采集客户在银行的转账交易数据;
[0142]数据处理单元802,用于对所述转账交易数据进行加载、清洗和转换,生成客户的交易向量,所述交易向量包括:客户号、交易权重和交易对手号;
[0143]表示单元803,用于用无向图的节点表示转账关系网络中的成员,用无向图的边表示成员与成员间的关系;
[0144]建立单元804,用于建立客户转账关系的邻接矩阵,有转账关系的节点将其对应的位置为转账次数,无转账关系矩阵对应的位置置为O;
[0145]计算单元805,用于并行计算转账关系网络中每个节点的度;
[0146]输出单元806,用于对节点的度进行排序,输出节点的度大于预设阈值的节点;
[0147]赋予单元807,用于为转账关系网络中每个节点赋予一个第一无二的初始标签,表示迭代开始前,每个节点自身为一个独立的社区;
[0148]选取单元808,用于对于转账关系网络中的每一个节点,遍历节点的邻居节点信息,选取邻居节点中出现次数最多的标签,将其设定为该节点的新标签;
[0149]合并单元809,用于将具有相同标签的节点合并到同一社区。
[0150]上述实施例八的工作原理与实施例四相同,在此不再赘述。
[0151]本实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本发明实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0152]本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
[0153]对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
【主权项】
1.一种客户转账关系分析方法,其特征在于,包括: 采集客户在银行的转账交易数据; 对所述转账交易数据进行数据加工,生成客户的交易向量,所述交易向量包括:客户号、交易权重和交易对手号; 以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络。2.根据权利要求1所述的方法,其特征在于,还包括: 并行计算转账关系网络中每个节点的度; 对节点的度进行排序,输出节点的度大于预设阈值的节点。3.根据权利要求2所述的方法,其特征在于,还包括: 为转账关系网络中每个节点赋予一个第一无二的初始标签,表示迭代开始前,每个节点自身为一个独立的社区; 对于转账关系网络中的每一个节点,遍历节点的邻居节点信息,选取邻居节点中出现次数最多的标签,将其设定为该节点的新标签; 重复上述步骤,直至所有节点的标签不再改变或达到预先设定的迭代次数; 将具有相同标签的节点合并到同一社区。4.根据权利要求3所述的方法,其特征在于,所述对所述转账交易数据进行数据加工,生成客户的交易向量具体为: 对所述转账交易数据进行加载、清洗和转换,生成客户的交易向量。5.根据权利要求4所述的方法,其特征在于,所述以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络包括: 用无向图的节点表示转账关系网络中的成员,用无向图的边表示成员与成员间的关系; 建立客户转账关系的邻接矩阵,有转账关系的节点将其对应的位置为转账次数,无转账关系矩阵对应的位置置为O。6.一种客户转账关系分析系统,其特征在于,包括: 采集单元,用于采集客户在银行的转账交易数据; 数据处理单元,用于对所述转账交易数据进行数据加工,生成客户的交易向量,所述交易向量包括:客户号、交易权重和交易对手号; 生成单元,用于以发生转账交易的客户为节点,客户之间的交易权重为边,生成转账关系网络。7.根据权利要求6所述的系统,其特征在于,还包括: 计算单元,用于并行计算转账关系网络中每个节点的度; 输出单元,用于对节点的度进行排序,输出节点的度大于预设阈值的节点。8.根据权利要求7所述的系统,其特征在于,还包括: 赋予单元,用于为转账关系网络中每个节点赋予一个第一无二的初始标签,表示迭代开始前,每个节点自身为一个独立的社区; 选取单元,用于对于转账关系网络中的每一个节点,遍历节点的邻居节点信息,选取邻居节点中出现次数最多的标签,将其设定为该节点的新标签; 合并单元,用于将具有相同标签的节点合并到同一社区。9.根据权利要求8所述的系统,其特征在于,所述数据处理单元具体用于: 对所述转账交易数据进行加载、清洗和转换,生成客户的交易向量。10.根据权利要求9所述的系统,其特征在于,所述生成单元包括: 表示单元,用于用无向图的节点表示转账关系网络中的成员,用无向图的边表示成员与成员间的关系; 建立单元,用于建立客户转账关系的邻接矩阵,有转账关系的节点将其对应的位置为转账次数,无转账关系矩阵对应的位置置为O。
【文档编号】G06Q40/02GK105913235SQ201610252430
【公开日】2016年8月31日
【申请日】2016年4月21日
【发明人】张勇, 曹震, 钟新斌, 王鑫毅, 杜瑞岭
【申请人】中国农业银行股份有限公司