电子银行账户欺诈行为及风险检测方法与系统的制作方法
【技术领域】
[0001] 本发明设及电子商务领域,更为具体地,设及一种电子银行账户欺诈行为及风险 检测方法与系统。
【背景技术】
[0002] 电子银行是银行传统柜台业务的延伸,可使银行业务不再受营业地点、营业时间 的限制,随时为人们提供所需的金融服务。在其带来便利的同时也面临着诸多安全风险,尤 其随着欺诈案例的不断增加,将会为银行及其用户带来巨大的损失。目前,为了更好的预防 电子银行欺诈行为的发生,主要采用依据专家系统生成规则的方式检测欺诈行为,然而,基 于规则方法通常会带来规则更新滞后、误报率高、匹配效率低等问题,使得银行和用户的利 益不能够得到保障。
[0003] 目前针对该领域的专利是200910204571. 6,该专利采用基于规则的方法进行电子 银行风险监控,主要着眼于使用单一规则和历史规则完成风险识别过程,并依据风险识别 的阔值结果进行交易行为的响应。但是针对整个系统中关键的规则生成过程没有详细的叙 述,造成后续风险分值的生成W及依据风险阔值进行风险评价的过程缺乏有力支撑。而且 如前所述,基于规则的检测方式已不能够适应当前电子银行所面临的现实情况:首先,该方 法对于新的风险无法识别,其次,当规则数目过于庞大时,分析检测过程将对系统处理能力 带来明显压力。
[0004] 综上所述,需要对传统基于规则的检测方法进行改进,从行为出发检测欺诈,并提 出针对欺诈行为的风险评价方法与系统。
【发明内容】
[0005] 本发明提供一种电子银行账户欺诈行为及风险检测方法与系统,用于对电子银行 业务中账户欺诈行为进行检测,同时评估该行为存在的欺诈风险。
[0006] -方面,本发明提供了一种电子银行账户欺诈行为及风险检测方法,该方法包 括:
[0007] 1)为账户构建指标体系,包括总体指标与个体指标;
[0008] a)所述总体指标为能够反映大多数用户行为习惯的指标;
[0009]b)所述个体指标为能够反映每个电子银行账户自身历史行为习惯的指标;
[0010] 2)使用统计学方法对样本数据的总体指标和个体指标进行计算;
[0011] a)所述总体指标计算方法W操作会话为单位;
[0012] b)所述个体指标计算方法W账户为单位;
[0013] 3)通过对样本数据指标分布进行分析,设置指标特征区间,并为每个特征区间生 成相应的风险评分值;
[0014] 4)对账户进行检测和评价的过程包括特征提取、欺诈检测、风险评价=个部分:
[0015] a)所述特征提取将获取账户的总体指标特征和个体指标特征,组成特征向量;
[0016]b)所述欺诈检测将特征向量中每个分量与对应指标的特征区间进行比较,并产生 相应的风险评分;
[0017] C)所述风险评价将特征向量中每个分量的风险评分按照该向量之间的关系W及 向量的重要性进行加权求和,得到针对该账户的风险评分结果,并将该风险评分结果依据 设定风险等级阔值得到定性的风险评价结果,并判断该账户是否存在欺诈行为。所述风险 等级阔值的生成,依据一段历史区间中所有风险评分结果的分布情况进行设定,形成不同 的风险等级,例如;高风险、中风险、低风险等。
[0018] 另一方面,本发明提供了一种电子银行账户欺诈行为与风险检测系统,该系统包 括数据收集与预处理子系统、模型构建子系统、风险分析子系统S部分。同时由于本发明所 采集的数据量较大,因此在系统架构时完全采用主流大数据工具。
[0019] 1)所述数据收集与预处理子系统,利用数据收集工具实时、批量收集关系数据库 中的数据存入分布式数据存储平台中,并分别W会话和用户为单位进行数据预处理;
[0020] a)所述分布式数据存储平台采用主流大数据工具搭建,能够支持海量异构数据的 存储和查询;
[0021] b)所述预处理过程使用分布式计算技术W会话和用户为主键对数据进行整理,整 理后的数据能够直接被用来进行模型构建W及风险分析;
[0022] 2)所述模型构建子系统用于实现如下功能;使用大数据工具中的分布式计算技 术对预处理后的数据生成进行总体指标与个体指标的提取与训练,并依据指标特征的分布 划分阔值区间,依据阔值生成不同的风险评分模型,并依据策略对该模型进行动态更新;
[0023] 所述动态更新具体包括,各类型指标阔值区间的设置会依据新补充的数据进行定 期的更新扩充。其中,所述新补充的数据为上次训练数据之后的新数据。其中,所述更新扩 充是对总体指标W及个体指标特征区间进行校正。
[0024] 3)所述风险分析子系统用于实现如下功能;其依据总体模型与该账户的个体模 型得到当前账户每个指标的风险评分,并依据指标之间的关系和指标重要程度设定累加权 重从而生成该账户的总风险评分,该总体风险评分与风险等级划分相对应,得到当前账户 的风险级别,最终依据账户的风险级别对账户交易行为进行响应。所述交易行为响应主要 包括几种形式:阻断交易、电话确认后恢复交易、执行交易。
[0025]本发明的电子银行账户欺诈行为检测及风险评价系统具有如下有益效果:
[0026]本发明对账户行为进行分析,得到账户风险评分值,根据所述评分结果与风险阔 值的关系判断是否为风险账户,并在检测系统中显示相关分析结果;本发明在大数据处理 平台下(可支持数据存储、查询、分析),利用总体指标与个体指标相结合的方法,从数据中 发现特征,并对不同账户使用不同特征,降低了欺诈行为检测误报率,同时提高了数据处理 效率。
【附图说明】
[0027] 图1是本发明的一种电子银行账户欺诈行为及风险检测方法的流程图;
[002引图2是图1中所述的S102的流程图;
[0029] 图3是图1中所述的S103的流程图;
[0030] 图4是图3中所述的S310的流程图;
[0031] 图5是图3中所述的S320的流程图。
【具体实施方式】
[0032] 为使本发明的实施例的目的、技术方案和优点更加清楚,下面进一步结合附图对 本发明作详细描述。
[0033] 1.图1是本发明的电子银行账户欺诈行为及风险检测方法的流程图。如图1所 示,所述方法包括:
[0034] 1)S101,数据收集与预处理,将存储在业务系统中的数据W实时或者批量的方 式收集到分布式数据存储平台中,例如使用Storm和皿FS,并通过并行计算方法,例如 MapRe化ce,W会话和账户为单位对数据进行整理;
[00巧]2)S102,模型构建,对整理好的历史样本数据提取总体指标与个体指标处理,并使 用统计学方法依据数据分布划分指标特征区间,为每一个特征区间设定一个风险评分值; [003引扣S103,风险分析,对待评价的账户数据提取总体指标与个体指标,并将指标的特 征值与模型构建输出的风险评分对应的特征区间进行比较,得到该指标的风险评分值,将 所有指标的风险评分值加权综合得到该账户最终的风险评分结果,并依据风险等级为该账 户进行风险级别评定。
[0037] 2.在本发明的一种实施方式中,所述构建模型主要的输入为账户的时间类信息、 交易类信息及客户端类信息。
[0038] 并且需要说明的是,对于总体指标W及个体指标,指标类型不尽相同,并且所使用 的统计量也不相同,例如,总体指标包括:时间类指标和交易类指标等;个体指标包括:时 间类指标、交易类指标、客户端类指标W及关系类指标等。又如,采用的统计量包括概率分 布、均值-方差等类型。总体类指标的统计对象为全体用户,个体类指标的统计对象为单个 用户;总体类指标更关注于整体分布,而个体类指标关注个人习惯。
[0039] 3.下面将对图2进行详细描述,该图2是上面步骤S102的具体流程:
[0040] 1)S201,提取指标特征值,例如使用概率分布、均值-方差、马尔可夫链等;
[0041] 2)S202,采用统计学方法依据分布获得指标的特征区间,例如使用聚类方法对特 征值进行聚合,如果聚合为3个中屯、,则认为该指标的特征区间能够被确定为3,并且区间 的边界确定为聚类边界;
[0042] 3)S203,确定风险评分,按照特征区间内样本取样的异常程度进行风险值设定,即 抽样样本异常度越低风险值设置为低,相反风险值设定越高。
[0043] 4.当有账户进行风险分析时,进入步骤S103。
[0044] 图3是图1中的S103的流程图,具体可W包括;风险评分计算与风险级别确定。
[0045] 1)S310风险评分计算,其流程如图4所示,包括:
[0046]a)S311通过特征提取过程获得待分析账户的总体指标,通过总体指标模型得到被 检测账户在该模型下的风险评分,可有多个指标,对一系列指标进行按照指标关系W及重 要程度进行加权累加,得到结果值1。
[0047]b)S312通过特征提取过程获得待分析账户的个体指标,通过个体指标模型得到被 检测账户在该模型下的风险评分,可有多个指标通过该数据与账户、历史统计指标正常样 本的偏差和阔值区间之间的关系得到对应风险值,进行累加,得到结果值2。
[0048]c)S313将结果值1和结果值2进行加权累加,得到账户最终风险评分。
[0049] 需要说明的是,在本发明的实施方式中,步骤i和步骤ii的执行顺序并