一种基于金融反欺诈的知识图谱构建方法与流程

文档序号:19943668发布日期:2020-02-14 23:33阅读:2738来源:国知局
一种基于金融反欺诈的知识图谱构建方法与流程

本发明涉及知识图谱技术领域,特别涉及一种基于金融反欺诈的知识图谱构建方法。



背景技术:

随着改革开放的不断深入和社会主义市场经济体制的逐步建立,发生在金融领域的犯罪活动也急剧增加,其中金融诈骗犯罪活动已成为危害最大的经济犯罪活动之一。其严重破坏了国家的金融财税秩序和社会秩序,直接危害到经济建设的健康发展。金融诈骗犯罪已成为当前金融领域的一大公害。依法防范和打击金融诈骗犯罪活动,已成为世界各国的共识。在面对金融欺诈案件,老旧的防欺诈手段很难应对复杂多变的欺诈手段。



技术实现要素:

本发明的目的旨在至少解决所述技术缺陷之一。

为此,本发明的目的在于提出一种基于金融反欺诈的知识图谱构建方法。

为了实现上述目的,本发明的实施例提供一种基于金融反欺诈的知识图谱构建方法,包括如下步骤:

步骤s1,获取多个预设数据源的个人金融相关数据,构建知识图谱;

步骤s2,接收借款人提交的借款申请,根据所述借款申请中的借款人信息,从所述知识图谱中进行检测;

步骤s3,当从检测结果判断该借款人信息符合潜在风险条件时,对该借款人进行风险标记,判断其存在否存在金融诈骗嫌疑,存储至潜在风险数据库中。

进一步,在所述步骤s1中,所述多个预设数据源包括:征信公司提供的欺诈数据、拥有的代办包装公司数据、互联网公开欺诈黑名单、行业黑名单联盟、银行数据、保险行业数据、社交媒体信息。

进一步,所述预设数据源定期进行更新补充。

进一步,在所述步骤s1中,所述借款人信息包括:借款人的个人信息、工作信息、手机号、学历、工作单位、住址、担保人信息、亲属信息。

进一步,在所述步骤s2中,从所述知识图谱中进行检测,包括:根据借款人信息在知识图谱中的索引,通过图的形式连结,显示借款人的简介信息,并根据索引结果对该借款人设置标签。

进一步,所述标签包括:逾期,虚假手机号,代办包装、组团骗贷。

进一步,在所述步骤s3中,所述潜在风险条件包括:

(1)借款人和有过不良记录的人、公司或者有过不良记录具有关联关系;

(2)借款人信息出现不一致性;

(3)借款人信息经验证为伪造。

进一步,所述借款人信息出现不一致性,包括:

(1)借款人的一个实体同时属于两个互斥的类别;

(2)借款人的一个实体实体所对应的一个资产对应多个值。

根据本发明实施例的基于金融反欺诈的知识图谱构建方法,构建并采用金融反欺诈知识图谱可以有效的应对复杂多变的欺诈手段,有效提高业务时效性、降低风控成本和欺诈风险。知识图谱可以在互联网中收集借款人的基本信息,还可以把借款人日常生活中的消费记录、行为记录、关系信息、网上浏览记录等整合到知识图谱里。在此基础上,对该借款人的借贷风险进行分析和评估。与搜索引擎的场景不同,知识图谱在反欺诈场景中具有较低的应用门槛,数据量较少时也可以进行低程度的交叉验证,而随着数据量的积累和增多,知识图谱也会越来越完善,其反欺诈能力也会越来越强。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1为根据本发明实施例的基于金融反欺诈的知识图谱构建方法的流程图;

图2为根据本发明实施例的知识图谱判断流程图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

如图1和图2所示,本发明实施例的基于金融反欺诈的知识图谱构建方法,包括如下步骤:

步骤s1,获取多个预设数据源的个人金融相关数据,构建知识图谱。

具体的,多个预设数据源包括:征信公司提供的欺诈数据、拥有的代办包装公司数据、互联网公开欺诈黑名单、行业黑名单联盟、银行数据、保险行业数据、社交媒体信息。其中,预设数据源定期进行更新补充。

在本发明的实施例中,借款人信息包括:借款人的个人信息、工作信息、手机号、学历、工作单位、住址、担保人信息、亲属信息。

在反欺诈场景中,知识图谱可以识别潜在的代办包装或是组团骗贷,本发明利用征信公司提供的欺诈数据、拥有的代办包装公司数据、互联网公开欺诈黑名单、行业黑名单联盟、银行、征信公司、保险行业、社交媒体信息等。逐步绘制出借款人的简介信息profile,从而针对性质的识别欺诈风险。以一个借款人举例,借款人可以有身份证号,手机号,学历等个人信息,属于个人的属性信息;而借款人可以有担保人或是亲属好友,借款人与担保人之间的关系(也就是边edge)是被担保与担保的关系,借款人与其亲属好友之间的关系是父亲、母亲、同事、同学等关系;借款人也具有住址,银行流水,工作单位等信息。这些信息可以来自于多个渠道,例如可以由借款人自己填写,或是积累的历史数据,或是数据提供商提供,或是在互联网上获得,甚至通过推理得到。

步骤s2,接收借款人提交的借款申请,根据借款申请中的借款人信息,从知识图谱中进行检测。

具体的,从知识图谱中进行检测,包括:根据借款人信息在知识图谱中的索引,通过图的形式连结,显示借款人的简介信息,并根据索引结果对该借款人设置标签。

在本发明的实施例中,标签包括:逾期,虚假手机号,代办包装、组团骗贷。需要说明的是,上述标签仅是出于示例的目的,而不是为了限制本发明。本发明中设置标签还可以包括其他条目内容,在此不再赘述。

本发明将借款人信息通过图的形式连结,展示出了借款人的简介信息profile,对实体(包括公司和人)贴上标签,例如逾期,虚假手机号,代办包装或是组团骗贷等标签。

步骤s3,当从检测结果判断该借款人信息符合潜在风险条件时,对该借款人进行风险标记,判断其存在否存在金融诈骗嫌疑,存储至潜在风险数据库中。

在借款人提交借款申请开始即介入整个风控流程,对接多个数据源以获取借款人的数据信息,在各个环节建立检查节点checkpoint,通过可配置的规则引擎在各个检查节点checkpoint执行预定的逻辑,识别和防御欺诈风险。

在本发明的实施例中,潜在风险条件包括:

(1)借款人和有过不良记录的人、公司或者有过不良记录具有关联关系;

(2)借款人信息出现不一致性;

其中,借款人信息出现不一致性,包括:

a)借款人的一个实体同时属于两个互斥的类别;

b)借款人的一个实体实体所对应的一个资产对应多个值

具体来说,当融合来自不同数据源的信息构成知识图谱时,有一些实体会同时属于两个互斥的类别(例如同时在两个不同的城市工作),或某个实体所对应的一个资产(同一个人的住址)对应多个值,这样就会出现不一致性,这个不一致性即可判定为潜在的可疑点。

3)借款人信息经验证为伪造。

具体的,通过借款人的其他信息进行推理出其相关信息进行验证。例如,本发明可以通过借款人的身份证号和姓名可以获得他的学历信息和年龄,通过学历信息和年龄可以推算出其工作年限,再根据其所在城市,行业,职位,结合互联网上的招聘网站数据推理出其薪水范围,进而验证他的收入水平;甚至可以通过不同借款人之间的同事关系,验证其工作单位的真假,从而对申请人辨别是否存在金融诈骗嫌疑。

通过这种不一致性检测,本发明利用绘制出的知识图谱可以识别潜在的欺诈风险。在p2p行业,欺诈风险主要的骗术包括个人信息造假、工作单位虚假、代办包装、虚假联系人、组团骗贷等。以识别数据造假为例,利用知识图谱本发明可以通过借款人的身份信息pii(personalidentifyinformation),例如手机号或是身份证号,直接索引到个人的全部信息,并以此与借款人的填写信息进行不一致性检测。

当借款人进行申请贷款时,如果本发明发现他和有过不良记录的人、公司或者有过不良记录具有较多的关联关系,则这个人有很大的可能是欺诈,从而识别出风险。

根据本发明实施例的基于金融反欺诈的知识图谱构建方法,构建并采用金融反欺诈知识图谱可以有效的应对复杂多变的欺诈手段,有效提高业务时效性、降低风控成本和欺诈风险。知识图谱可以在互联网中收集借款人的基本信息,还可以把借款人日常生活中的消费记录、行为记录、关系信息、网上浏览记录等整合到知识图谱里。在此基础上,对该借款人的借贷风险进行分析和评估。与搜索引擎的场景不同,知识图谱在反欺诈场景中具有较低的应用门槛,数据量较少时也可以进行低程度的交叉验证,而随着数据量的积累和增多,知识图谱也会越来越完善,其反欺诈能力也会越来越强。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。本发明的范围由所附权利要求及其等同限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1