信贷欺诈分析方法、装置、设备及计算机可读存储介质与流程

文档序号:17330698发布日期:2019-04-05 22:03阅读:159来源:国知局
信贷欺诈分析方法、装置、设备及计算机可读存储介质与流程
本发明涉及大数据领域,尤其涉及一种信贷欺诈分析方法、装置、设备及计算机可读存储介质。
背景技术
:随着社会和金融行业的快速发展,信贷业务活跃于市场。信贷机构在向贷款申请者进行放款前,需要根据贷款申请者提供的信息进行分析,以确定其欺诈风险性;在分析过程中,往往会涉及贷款申请者的地址分析,如家庭地址、工作地址、gps地址等。传统的信贷风险分析方法,是对各个地址信息进行单一分析,确定其真实性,而忽略了各地址之间的关联性,从而降低了信贷欺诈分析的准确性。技术实现要素:本发明的主要目的在于提供一种信贷欺诈分析方法、装置、设备及计算机可读存储介质,旨在提高信贷欺诈分析的准确性。为实现上述目的,本发明提供一种信贷欺诈分析方法,所述信贷分析方法包括:的基本信息,并根据所述基本信息获取对应的地址因子集,所述地址因子集的地址因子数量至少为两个;基于预设关联规则对所述地址因子集的地址因子之间建立实体关联,获得对应的地址关联图,所述地址关联图中至少包括两个相互关联的地址因子;根据接收到的因子指定指令在所述地址关联图中分别确定目标因子和参考因子,并根据所述目标因子和参考因子的关联关系、因子类型和预设关系度公式计算所述目标因子与参考因子之间的关系度;当所述参考因子属于黑名单因子时,判断所述关系度是否大于预设关系阈值;若所述关系度大于预设关系阈值,则确定所述目标因子所对应的基本信息为疑似欺诈信息。可选地,所述基本信息包括地址类信息,所述地址因子集包括直译地址因子,所述根据所述基本信息获取对应的地址因子集的步骤包括:基于预设区划词典对所述地址类信息进行关键字匹配,提取地址关键字;根据所述地址关键字和所述预设区划词典对所述地址类信息进行规整,得到对应的直译地址因子。可选地,所述基本信息包括非地址类信息,所述地址因子集包括转译地址因子,所述根据所述基本信息获取对应的地址因子的步骤包括:根据所述非地址类信息的信息类型确定对应的信息转译规则,并根据所述信息转译规则对所述非地址类信息进行转译,得到对应的转译地址因子。可选地,所述基于预设关联规则对所述地址因子集的地址因子之间建立实体关联的步骤包括:根据预设模糊匹配算法以成对计算的方式计算所述地址因子集的地址因子之间的模糊匹配度,并在模糊匹配度大于预设模糊阈值的两个地址因子之间建立模糊匹配关联。可选地,所述根据预设模糊匹配算法以成对计算的方式计算所述地址因子之间的模糊匹配度的步骤包括:在所述地址因子集中选取两个地址因子作为计算因子,并基于预设量化规则分别将所述计算因子量化为对应的第一字符组d1和第二字符组d2;根据所述第一特征组d1和所述第二特征组d2获取全字符组d,并分别根据全字符组d的各字符在第一字符组d1和第二字符组d2中出现频率、确定第一特征组d1对应的第一字符频率组dd1和第一特征组d2对应第二字符频率组dd2;根据预设模糊匹配度公式、所述第一字符频率组dd1和所述第二字符频率组dd2计算对应的模糊匹配度,所述预设模糊匹配度公式为其中,sim为计算因子之间的模糊匹配度;n为所述第一字符频率组dd1或所述第二字符频率组dd2的元素数量;dd1i为所述第一字符频率组dd1第i个元素,dd2i所述第二字符频率组dd2第i个元素,0<i≤n,且i为整数。可选地,所述基于预设关联规则对所述地址因子集的地址因子之间建立实体关联的步骤还包括:确定所述地址因子集的地址因子对应的真实地址;根据所述真实地址确定地址因子之间的真实地址距离,并在真实地址距离小于预设距离阈值的两个地址因子之间建立距离匹配关联。可选地,所述预设关系度公式为:其中,f为所述目标因子和所述参考因子的关系度;m为所述目标因子和所述参考因子的最短关联路径上的路径因子数量,所述路径因子包括所述目标因子和所述参考因子,m≥2;k0为与所述参考因子的因子类型相关的预设距离系数,0<k0;x0为与所述参考因子的因子类型相关的预设距离系数,0<x0;ki为所述路径因子各自对应的关联距离系数,0<ki;ui为所述路径因子各自对应的衰减因子系数,0<ui≤1;xi为所述路径因子各自对应的关联强度系数,0<xi。此外,为实现上述目的,本发明还提供一种信贷欺诈分析装置,所述信贷欺诈分析装置包括:因子集获取模块,用于在接收到信贷风险分析请求时,获取所述信贷风险分析请求对应信贷申请者的基本信息,并根据所述基本信息获取对应的地址因子集,所述地址因子集的地址因子数量至少为两个;因子关联模块,用于基于预设关联规则对所述地址因子集的地址因子之间建立实体关联,获得对应的地址关联图,所述地址关联图中至少包括两个相互关联的地址因子;关系度计算模块,用于根据接收到的因子指定指令在所述地址关联图中分别确定目标因子和参考因子,并根据所述目标因子和参考因子的关联关系、因子类型和预设关系度公式计算所述目标因子与参考因子之间的关系度;关系度判断模块,用于当所述参考因子属于黑名单因子时,判断所述关系度是否大于预设关系阈值;欺诈分析模块,用于若所述关系度大于预设关系阈值,则确定所述目标因子所对应的基本信息为疑似欺诈信息。此外,为实现上述目的,本发明还提供一种信贷欺诈分析设备,所述信贷欺诈分析设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的信贷欺诈分析程序,其中所述信贷欺诈分析程序被所述处理器执行时,实现如上述的信贷欺诈分析方法的步骤。此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信贷欺诈分析程序,其中所述信贷分析欺诈程序被处理器执行时,实现如上述的信贷欺诈分析方法的步骤。本发明以“关系“的方式将贷款申请者的多种地址信息进行整合和关联,有利于确定地址信息之间的联系,并结合染黑(或染灰)的处理逻辑对潜在信贷欺诈风险进行预测,从而以大数据分析的方式对贷款申请者的贷款终端进行关联风险检测,提高了信贷分析的准确性,能够更有效地对潜在风险进行预警,有利于尽早地发现并规避风险,降低坏账率。附图说明图1为本发明实施例方案中涉及的信贷欺诈分析设备的硬件结构示意图;图2为本发明信贷欺诈分析方法第一实施例的流程示意图;图3为图2所示实施例涉及的地址关系度示意图;图4为本发明信贷欺诈分析装置第一实施例的功能模块示意图。本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。本发明实施例涉及的信贷欺诈分析方法主要应用于信贷欺诈分析设备,该信贷欺诈分析设备可以是个人计算机(personalcomputer,pc)、笔记本电脑、服务器等具有数据处理功能的设备。参照图1,图1为本发明实施例方案中涉及的信贷欺诈分析设备的硬件结构示意图。本发明实施例中,信贷欺诈分析设备可以包括处理器1001(例如中央处理器centralprocessingunit,cpu),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真wireless-fidelity,wi-fi接口);存储器1005可以是高速随机存取存储器(randomaccessmemory,ram),也可以是稳定的存储器(non-volatilememory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的硬件结构并不构成对本发明的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。继续参照图1,图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、网络通信模块以及信贷欺诈分析程序。在图1中,网络通信模块可用于连接数据库,与数据库进行数据通信;而处理器1001可以调用存储器1005中存储的信贷欺诈分析程序,并执行本发明实施例提供的信贷欺诈分析方法。本发明实施例提供了一种信贷欺诈分析方法。参照图2,图2为本发明信贷欺诈分析方法第一实施例的流程示意图。本实施例中,所述信贷欺诈分析方法包括以下步骤:步骤s10,在接收到信贷风险分析请求时,获取所述信贷风险分析请求对应信贷申请者的基本信息,并根据所述基本信息获取对应的地址因子集,所述地址因子集的地址因子数量至少为两个;随着社会和金融行业的快速发展,信贷业务活跃于市场。信贷机构在向贷款申请者(包括自然人和企业)进行放款前,需要根据贷款申请者提供的信息进行分析,以确定其欺诈风险性;在分析过程中,往往会涉及贷款申请者的地址分析,如家庭地址、工作地址、gps地址等。传统的信贷风险分析方法,是对各个位置因子进行单一分析,确定其真实性,而忽略了各地址之间的关联性,从而降低了信贷欺诈分析的准确性。对此,本实施例中提出一种信贷欺诈分析方法,将贷款申请者相关的各地址信息之间建立实体关联,对各地址信息进行关联分析,提高信贷欺诈分析的准确性。本实施例中的信贷欺诈分析方法是由信贷欺诈分析设备实现的,该信贷欺诈分析设备以分析服务器为例进行说明。本实施例中的服务器在接收到信贷风险分析请求时,首先根据该信贷风险分析请求确定对应的贷款申请者,然后获取该贷款申请者的相关基本信息。其中,该信贷风险分析请求,可以是贷款申请者通过客户终端(如个人电脑pc、手机、平板电脑等)在网络上提出信贷请求时触发的,也可以是业务人员通过审核终端(如个人电脑pc、手机、平板电脑等)进行信贷审核时触发的。而这些基本信息包括有贷款申请者在进行贷款申请时主动提供的个人信息,还包括有服务器检测到的环境信息。对于个人信息,包括有家庭地址、工作地址、单位地址、银行账户、身份证、常用联系人等,这些个人信息可以是贷款申请者在通过客户终端在网络上提出贷款申请时,自行录入至客户终端,并由客户终端发送至服务器中;当然也可以是贷款申请者在线下进行贷款申请,由业务人员将贷款申请的位置信息录入业务终端并发送至服务器。对于环境信息,则包括有终端(客户终端或者业务终端)的gps地址(在填写时获取)、终端的网络ip、wifi信息、贷款申请者的手机号等;当然这些环境信息通常是需要得到贷款申请者的授权后服务器才可进行获取。在得到贷款申请者的基本信息时,服务器将会根据这些基本信息获取到对应的地址因子集,该地址因子集可以看作与贷款申请者相关的地址信息的集合,其中的每一条与贷款申请者相关的地址信息为一个地址因子,例如身份证归属地地址因子,家庭地址因子,工作单位地址因子等。值得说明的是,该地址因子集中的地址因子数量至少为两个。进一步的,本实施例中的基本信息包括地址类信息,对于这些地址类信息,可以直接将其直译为对应的地址因子(例如家庭地址信息、单位地址信息等),为了描述方便,对于地址类信息直译得到的地址因子可称为直译地址因子。考虑到这些获得这些地址类信息时,这些地址类信息的形式可能是具有区别的,例如对于同一地址a省b市c县d乡,可能出现a省b市d乡(缺失某一信息)、abc县d乡(缺失行政区划级别标识)等多种形式。为了避免后续分析时出现误差,同时也为了方便存储,服务器在获取到地址类信息时,首先要对地址类信息进行规整,再将其直译为对应的直译地址因子。具体的,本实施例中的服务器中预先设置有区划词典,该区划词典中具有相应的行政区划分类信息,例如省市县乡abcdabcebtyu............直译地址因子的形式将根据该区划词典进行设置;在得到地址类信息时,首先将根据该区划词典对地址类信息进行关键字匹配,提取出地址关键字;根据所述地址关键字和该预设区划词典对地址类信息进行规整,得到对应的直译地址因子。例如,对于地址类信息a省b市d乡,可根据区划词典提取出关键词a、b、d,同时还确定该地址类信息中缺少了县级信息;对此可根据区划词典进行规整(补齐),即a省b市c县d乡,从而得到对应的直译地址因子。值得说明的是,当信息缺失类的信息缺失的是最低一级的区划信息(如乡级信息)时,是无法进行准确补齐的,针对这一情况,可以是规定贷款申请者在提供个人信息时,若涉及到直接位置因子,则该个人信息应按要求包括有最低一级的区划信息,从而避免上述无法补齐的情况。当然对于区划字典和地址因子标准格式,还可以设置为具体到街道、门牌号等。再进一步的,本实施例中的基本信息还包括非地址类信息,对于这些非地址类信息,虽然并未直接表示一个地址,但通过一定规则对其转移后,也可得到一个地址因子,例如手机号信息(转译得到手机号归属地)、终端ip信息(转译为ip所在地)、银行卡号(转译得到银行卡开户行所在地)等;为了描述方便,该转译得到地址因子可称为转译地址因子。对此,服务器中还可预先设置有若干的信息转译规则,在获取到非地址类信息时,首先根据非地址类信息的信息类型确定对应的信息转译规则,然后根据该信息转译规则将非地址类信息转译得到对应的转译地址因子。例如我国手机号一般为11位,而各段的号码又具有不同的含义;如前3位为网络识别号,第4至第7位为地区编码,第8到11位为用户号码,基于这一编码规则,若获取到某一手机号码的前7位(我国的一个手机号),即可相应的确定该手机号归属地。又例如对于终端ip地址,可以是借助其它网络用户上报的ip信息确定,即其它网络用户会实时上报各类ip的确切地址信息,形成ip地址库,服务器可在该ip地址库中查询终端ip所对应的地址信息;当然,也可以服务器是通过向相关的网络运营商发送的询问信息,以确定该终端ip对应的地址信息,从而得到对应的转译地址。步骤s20,基于预设关联规则对所述地址因子集的地址因子之间建立实体关联,获得对应的地址关联图,所述地址关联图中至少包括两个相互关联的地址因子;本实施例中,服务器在获取到地址因子集时,将会基于预设关联规则对地址因子集中的地址因子建立实体关联,从而孤立的地址因子进行联系起来,形成地址关联网络,获得对应的地址关联图,该地址关联图中至少包括两个地址因子。而对于实体关联,则可以是根据多种方式建立。本实施例中的实体关联可以是通过模糊匹配的方式建立的模糊匹配关联,即通过成对计算的方式两两计算地址因子之间的模糊匹配度,例如地址因子集中包括a、b、c三个地址因子,则需要以成对计算的方式分别计算a与b之间的模糊匹配度、a与c之间的模糊匹配度、b与c之间的模糊匹配度;对于模糊匹配度大于预设模糊阈值的两个地址因子,即可在两者之间建立模糊匹配关联。而对于地址因子之间的模糊匹配度,可以是基于余弦相似度的计算原理进行计算。具体的,首先可在地址因子集中选取两个地址因子作为计算因子,然后根据预设量化规则将这两个计算因子量化为对应的第一字符组d1和第二字符组d2,字符组的形式可以为(市,区,路,号),当然量化规则和字符组的形式也可以根据实际情况进行设置;在量化完成时,服务器将根据第一字符组d1和第二字符组d2得到全字符组d(该全字符组为第一字符组d1和第二字符组d2的并集,且该全字符组中不含有重复的元素);随后,服务器将分别根据全字符组d的各字符在第一字符组d1和第二字符组d2中出现频率、确定对应的第一字符频率组dd1和第二字符频率组dd2;在得到第一字符频率组dd1和第二字符频率组dd2时,即可将第一字符频率组dd1和第二字符频率组dd2代入至预设模糊匹配度公式中计算两个地址因子的模糊匹配度,该预设模糊匹配度公式为其中,sim为计算因子之间的模糊匹配度;n为所述第一字符频率组dd1或所述第二字符频率组dd2的元素数量;dd1i为所述第一字符频率组dd1第i个元素,dd2i所述第二字符频率组dd2第i个元素,0<i≤n,且i为整数。例如,服务器从地址因子集中取出的两个地址因子作为计算因子,这两个计算因子分别为家庭地址因子x市y区a路b号和单位地址因子x市y区a路c号;根据这两个计算因子可得到对应的第一字符组d1(x,y,a,b)和第二字符组(x,y,a,c);第一字符组d1和第二字符组对应的全字符组为d(x,y,a,b,c);该全字符组d的各字符元素在第一字符组内出现的字符频率分别为x出现1次、y出现1次、a出现1次、b出现1次、c出现1次,则第一字符组d1针对全字符组d的第一字符频率组dd1为(1,1,1,1,0);而全字符组d的各字符元素在第二字符组内出现的字符频率分别为x出现1次、y出现1次、a出现1次、b出现0次、c出现1次,则第二字符组d2针对全字符组d的第二字符频率组dd2为(1,1,1,1,0);此时服务器可将该第一字符频率组dd1和第二字符频率组dd2代入至预设模糊匹配度公式中,计算模糊匹配度,如此时即可判断该模糊匹配度是否大于预设模糊阈值;若该模糊匹配度大于预设模糊阈值(如0.6),则可在两个计算因子(地址因子)之间建立模糊匹配关联。进一步的,当两个地址因子建立模糊匹配关联后,还可以根据模糊匹配度的大小定义其关联强度值,模糊匹配度越大,关联强度值越大。通过模糊匹配的关联方式,可从地址文本的维度将文本相似的地址因子进行关联,以进行后续的欺诈分析。本实施例中的实体关联还可以是通过距离匹配的方式建立的距离匹配关联。具体的,服务器首先将确定地址因子集中各地址因子所对应的真实地址,然后根据各地址因子的真实地址确定各地址因子之间的真实地址距离(即各地址因子所代表的地址之间的真实距离);对于真实地址距离大于预设距离阈值的两个地址因子,即可在两者之间建立距离匹配关联。例如,对于家庭地址因子x市y区a路b号和身份证归属地址因子x市y区e路b号,两者的真实地址距离为500米,小于预设距离阈值1000米,则可在两者之间建立距离匹配关联。进一步的,当两个地址因子建立距离匹配关联后,还可以根据真实地址距离的大小定义其关联强度值,真实地址距离越小,关联强度值越大。通过距离匹配的关联方式,可从实际距离的维度将距离相似的地址因子进行关联,以进行后续的欺诈分析。当然,在实际中,还可以设置其它的关联规则以将地址因子进行关联。值得说明的是,本实施例中的地址因子,可能存在连续关联的形式,例如工作地址w与家庭地址h关联,而家庭地址h又与手机号所在地p关联,则此时工作地址w与手机号所在地p也可以看作是关联的(间接关联)。步骤s30,根据接收到的因子指定指令在所述地址关联图中分别确定目标因子和参考因子,并根据所述目标因子和参考因子的关联关系、因子类型和预设关系度公式计算所述目标因子与参考因子之间的关系度;本实施例中,在接收得到地址关联图时,服务器将根据对地址关联图中的地址因子进行关系度的计算,该关系度可看作是地址因子联系紧密度的表征;关系度越大,两者的联系越紧密。在进行计算时,首先需要确定目标因子和参考因子,以参考因子为基准,计算目标因子与参考因子之间的关系度。对于该参考因子,可以是由分析人员触发因子指定指令进行指定;在实际中往往是指定某个黑名单/灰名单地址因子(或是风险等级较高的地址因子)作为参考因子,以其它真实性未知的地址因子作为参考因子,从而进行关系度的计算。在计算关系度时,需要根据目标因子和参考因子的关联关系、因子类型和预设关系度公式进行,其中预设关系度公式为其中,f为所述目标因子和所述参考因子的关系度;m为所述目标因子和所述参考因子的最短关联路径上的路径因子数量,所述路径因子包括所述目标因子和所述参考因子,m≥2;k0为与所述参考因子的因子类型相关的预设距离系数,0<k0;x0为与所述参考因子的因子类型相关的预设距离系数,0<x0;ki为所述路径因子各自对应的关联距离系数,0<ki,路径因子与参考因子的关联距离(即关联的路径数)越大,ki越小;xi为所述路径因子各自对应的关系强度系数,0<xi,与路径因子的类型有关,例如家庭地址的关系强度系数大于单位地址的关系强度系数;ui为所述路径因子各自对应的衰减因子系数,0<ui≤1,与路径因子的类型有关,例如家庭地址的衰减因子系数小于单位地址的衰减因子系数,当然该关联强度系数还可以与建立关联时的关联强度值有关(路径因子与参考因子方向的相邻因子的关联强度值越大,衰减因子系数越大)。具体的,在进行计算某一目标因子的与参考因子的关联度时,首先获取参考因子的预设距离系数k0和预设强度系数x0;然后根据地址关联图中参考因子和目标因子之间的关联关系确定两者的计算关系路径,其中若参考因子与目标因子之间有多条关系路径,则选择关系数最少的一条作为计算关系路径;在确定计算关系路径时,将要确定该计算关系路径上的所有路径因子(包括目标因子和参考路径),并根据计算关系路径的关联距离、因子类型、关联强度等确定各路径因子对应的关联距离系数ki、衰减因子系数ui和关联强度系数xi,再将各参数代入至上述公式中,即可计算出目标位置因子与参考因子的关系度。服务器在计算得目标因子与参考因子之间的关系度时,可在地址关联图中进行标注,得到地址关系度示意图,如图3所示,图3中参考因子为家庭地址因子,目标因子包括gps地址因子(关系度73)、单位地址因子(关系度73)、手机号归属地地址因子(关系度56)。步骤s40,当所述参考因子属于黑名单因子时,判断所述关系度是否大于预设关系阈值;在得到目标因子与参考因子之间关系度时,即可通过染黑逻辑(或染灰逻辑)对参考因子进行欺诈分析。具体的,当参考因子属于黑名单因子(或者该参考因子对应的基本信息确认为虚假)时,服务器将判断目标因子与参考因子之间的关系度是否大于预设阈值,即通过目标因子与目标因子之间的关系紧密程度关联分析目标因子的欺诈风险性。步骤s50,若所述关系度大于预设关系阈值,则确定所述目标因子所对应的基本信息为疑似欺诈信息。本实施例中,若目标因子与参考因子的关系度大于预设阈值,则可认为该目标因子所对应的基本信息也是可疑的,并将该目标因子所对应的基本信息确定为疑似欺诈信息。进一步的,还可以将该目标因子添加对应的疑似欺诈标签,并以该疑似欺诈的目标因子作为第二参考因子,进而判断其它与之关联的其它地址因子的欺诈分析性,从而实现对各地址因子(基本信息)的关联分析,有效识别出欺诈行为。进一步的,在具体实施中,服务器还可以进行欺诈分析之后,还可以生成对应的分析报告,分析报告的内容可以包括实体关联的建立过程(包括计算过程)、地址关联图、关系度计算和判断等,以供分析人员查看。本实施例中,在接收到信贷风险分析请求时,获取所述信贷风险分析请求对应信贷申请者的基本信息,并根据所述基本信息获取对应的地址因子集,所述地址因子集的地址因子数量至少为两个;基于预设关联规则对所述地址因子集的地址因子之间建立实体关联,获得对应的地址关联图,所述地址关联图中至少包括两个相互关联的地址因子;根据接收到的因子指定指令在所述地址关联图中分别确定目标因子和参考因子,并根据所述目标因子和参考因子的关联关系、因子类型和预设关系度公式计算所述目标因子与参考因子之间的关系度;当所述参考因子属于黑名单因子时,判断所述关系度是否大于预设关系阈值;若所述关系度大于预设关系阈值,则确定所述目标因子所对应的基本信息为疑似欺诈信息。通过以上方式,本实施例以“关系“的方式将贷款申请者的多种地址信息进行整合和关联,有利于确定地址信息之间的联系,并结合染黑(或染灰)的处理逻辑对潜在信贷欺诈风险进行预测,从而以大数据分析的方式对贷款申请者的贷款终端进行关联风险检测,提高了信贷分析的准确性,能够更有效地对潜在风险进行预警,有利于尽早地发现并规避风险,降低坏账率。此外,本发明实施例还提供一种信贷欺诈分析装置。参照图4,图4为本发明信贷欺诈分析装置第一实施例的功能模块示意图。本实施例中,所述信贷欺诈分析装置包括:因子集获取模块10,用于在接收到信贷风险分析请求时,获取所述信贷风险分析请求对应信贷申请者的基本信息,并根据所述基本信息获取对应的地址因子集,所述地址因子集的地址因子数量至少为两个;因子关联模块20,用于基于预设关联规则对所述地址因子集的地址因子之间建立实体关联,获得对应的地址关联图,所述地址关联图中至少包括两个相互关联的地址因子;关系度计算模块30,用于根据接收到的因子指定指令在所述地址关联图中分别确定目标因子和参考因子,并根据所述目标因子和参考因子的关联关系、因子类型和预设关系度公式计算所述目标因子与参考因子之间的关系度;关系度判断模块40,用于当所述参考因子属于黑名单因子时,判断所述关系度是否大于预设关系阈值;欺诈分析模块50,用于若所述关系度大于预设关系阈值,则确定所述目标因子所对应的基本信息为疑似欺诈信息。其中,上述信贷欺诈分析装置的各虚拟功能模块存储于图1所示信贷欺诈分析设备的存储器1005中,用于实现信贷欺诈分析程序的所有功能;各模块被处理器1001执行时,可实现将多种地址信息进行整合和关联,并结合染黑(或染灰)的处理逻辑对潜在信贷欺诈风险进行预测的功能。进一步的,所述基本信息包括地址类信息,所述地址因子集包括直译地址因子,所述因子集获取模块10,还用于基于预设区划词典对所述地址类信息进行关键字匹配,提取地址关键字;根据所述地址关键字和所述预设区划词典对所述地址类信息进行规整,得到对应的直译地址因子。进一步的,所述基本信息包括非地址类信息,所述地址因子集包括转译地址因子,所述因子集获取模块10,还用于根据所述非地址类信息的信息类型确定对应的信息转译规则,并根据所述信息转译规则对所述非地址类信息进行转译,得到对应的转译地址因子。进一步的,所述因子关联模块20,还用于根据预设模糊匹配算法以成对计算的方式计算所述地址因子集的地址因子之间的模糊匹配度,并在模糊匹配度大于预设模糊阈值的两个地址因子之间建立模糊匹配关联。进一步的,所述因子关联模块20,还用于在所述地址因子集中选取两个地址因子作为计算因子,并基于预设量化规则分别将所述计算因子量化为对应的第一字符组d1和第二字符组d2;根据所述第一特征组d1和所述第二特征组d2获取全字符组d,并分别根据全字符组d的各字符在第一字符组d1和第二字符组d2中出现频率、确定第一特征组d1对应的第一字符频率组dd1和第一特征组d2对应第二字符频率组dd2;根据预设模糊匹配度公式、所述第一字符频率组dd1和所述第二字符频率组dd2计算对应的模糊匹配度,所述预设模糊匹配度公式为其中,sim为计算因子之间的模糊匹配度;n为所述第一字符频率组dd1或所述第二字符频率组dd2的元素数量;dd1i为所述第一字符频率组dd1第i个元素,dd2i所述第二字符频率组dd2第i个元素,0<i≤n,且i为整数。进一步的,所述因子关联模块20,还用于确定所述地址因子集的地址因子对应的真实地址;根据所述真实地址确定地址因子之间的真实地址距离,并在真实地址距离小于预设距离阈值的两个地址因子之间建立距离匹配关联。进一步的,所述预设关系度公式为:其中,f为所述目标因子和所述参考因子的关系度;m为所述目标因子和所述参考因子的最短关联路径上的路径因子数量,所述路径因子包括所述目标因子和所述参考因子,m≥2;k0为与所述参考因子的因子类型相关的预设距离系数,0<k0;x0为与所述参考因子的因子类型相关的预设距离系数,0<x0;ki为所述路径因子各自对应的关联距离系数,0<ki;ui为所述路径因子各自对应的衰减因子系数,0<ui≤1;xi为所述路径因子各自对应的关联强度系数,0<xi。其中,上述信贷欺诈分析装置中各个模块的功能实现与上述信贷欺诈分析方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。此外,本发明实施例还提供一种计算机可读存储介质。本发明计算机可读存储介质上存储有信贷欺诈分析程序,其中所述信贷欺诈分析程序被处理器执行时,实现如上述的信贷欺诈分析方法的步骤。其中,信贷欺诈分析程序被执行时所实现的方法可参照本发明信贷欺诈分析方法的各个实施例,此处不再赘述。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的
技术领域
,均同理包括在本发明的专利保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1