一种用户逾期评估方法、装置及存储介质与流程

文档序号:19072773发布日期:2019-11-08 20:55阅读:146来源:国知局
一种用户逾期评估方法、装置及存储介质与流程

本发明涉及金融风控技术领域,具体而言,涉及一种用户逾期评估方法、装置及存储介质。



背景技术:

随着信息技术的发展,计算机的计算能力得到了显著的提升,形成大量的用户关联数据形成的复杂网络数据,如何基于这种复杂网络数据对用户逾期可能性准确的预测,是一个亟待解决的问题。传统的算法只考虑了用户自身的标签(如数据中有是否逾期记录)在网络图上的传播,然而有标签的用户数量有限,能够提供的信息也是有限的,故而现有的预测方法精确度较低。



技术实现要素:

有鉴于此,本发明实施例的目的在于提供一种用户逾期评估方法、装置及存储介质,以改善上述的问题。

本发明实施例提供了一种用户逾期评估方法,所述方法包括:

获取目标用户的特征信息及关联信息,所述关联信息包括所述目标用户的联系人、所述联系人的特征信息及所述目标用户与所述联系人的关联系数;

根据所述联系人的特征信息及所述目标用户与所述联系人的关联系数确定所述目标用户的多度特征信息;

将所述目标用户的特征信息及多度特征信息输入预先设置的评估模型以对所述目标用户是否可能逾期进行评估。

进一步地,根据所述联系人的特征信息及所述目标用户与所述联系人的关联系数确定所述目标用户的多度特征信息的步骤包括:

根据所述目标用户与所述联系人的关联系数确定所述联系人的特征权重;

根据所述联系人的特征信息及所述联系人的特征权重确定所述目标用户的多度特征信息;其中,所述目标用户的多度特征信息与所述联系人的特征信息及所述联系人的特征权重满足下式:

fa=w1*f1+w2*f2+…wn*fn;

式中,fa指所述目标用户的多度特征信息;f1、f2…fn指具有相同维度的不同联系人的特征信息,w1、w2…wn指相应的所述联系人的特征权重。

进一步地,所述联系人包括一度联系人,所述一度联系人是指与所述目标用户具有直接联系的联系人,所述多度特征信息包括一度特征信息,所述一度特征信息为所述目标用户的一度联系人的加权特征,所述一度联系人的特征权重为关联比例,所述关联比例为所述一度联系人的关联系数与所述目标用户所有的一度联系人的关联系数之比;

所述根据所述联系人的特征信息及所述联系人的特征权重确定所述目标用户的多度特征信息的步骤,包括:

根据所述一度联系人的特征信息及所述关联比例确定所述目标用户的一度特征信息。

进一步地,所述联系人包括二度联系人,所述目标用户的二度联系人是指与所述目标用户具有相同一度联系人的联系人,所述多度特征信息包括二度特征信息,所述二度特征信息为所述目标用户的二度联系人的加权特征,所述二度联系人的特征权重为所述二度联系人相对所述一度联系人的关联比例与所述一度联系人的特征权重之积;

所述根据所述联系人的特征信息及所述联系人的特征权重确定所述目标用户的多度特征信息的步骤,包括:

根据所述二度联系人的特征信息及所述二度联系人的特征权重确定所述目标用户的二度特征信息。

进一步地,所述特征信息包括指定应用程序的使用习惯以及是否具有贷款逾期记录。

进一步地,获取目标用户的特征信息及关联信息之后,所述方法还包括:

对所述目标用户的所述特征信息及所述关联信息进行脱敏处理。

进一步地,将所述目标用户的特征信息及多度特征信息输入预先设置的评估模型以对所述目标用户是否可能逾期进行评估的步骤包括:

将所述目标用户的特征信息及多度特征信息输入预先设置的xgboost模型以对所述目标用户是否可能逾期进行评估。

本发明还提供了一种用户逾期评估装置,所述用户逾期评估装置用于执行上述的用户逾期评估方法,所述用户逾期评估装置包括:

数据获取单元,用于获取目标用户的特征信息及关联信息,所述关联信息包括所述目标用户的联系人、所述联系人的特征信息及所述目标用户与所述联系人的关联系数;

特征确定单元,用于根据所述联系人的特征信息及所述目标用户与所述联系人的关联系数确定所述目标用户的多度特征信息;

评估单元,用于将所述目标用户的特征信息及多度特征信息输入预先设置的评估模型以对所述目标用户是否可能逾期进行评估。

进一步地,所述特征确定单元用于根据所述目标用户与所述联系人的关联系数确定所述联系人的特征权重;

所述特征确定单元还用于根据所述联系人的特征信息及所述联系人的特征权重确定所述目标用户的多度特征信息;其中,所述目标用户的多度特征信息与所述联系人的特征信息及所述联系人的特征权重满足下式:

fa=w1*f1+w2*f2+…wn*fn;

式中,fa指所述目标用户的多度特征信息;f1、f2…fn指具有相同维度的不同联系人的特征信息,w1、w2…wn指相应的所述联系人的特征权重。

本发明还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述的用户逾期评估方法。

相对现有技术,本发明具有以下有益效果:

本发明提供的一种用户逾期评估方法、装置及存储介质,所述方法包括:获取目标用户的特征信息及关联信息,所述关联信息包括所述目标用户的联系人、所述联系人的特征信息及所述目标用户与所述联系人的关联系数;根据所述联系人的特征信息及所述目标用户与所述联系人的关联系数确定所述目标用户的多度特征信息;将所述目标用户的特征信息及多度特征信息输入预先设置的评估模型以对所述目标用户是否可能逾期进行评估。通过引入更多用户多度的特征信息,能够更加客观的对用户是否可能逾期进行评估,对于用户用户是否可能逾期的评估能力有显著的提升。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明实施方式的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本发明所提供的一种服务器示意图。

图2示出了本发明所提供的一种用户逾期评估方法的流程图。

图3示出了图2中s2的子步骤流程图。

图4示出了用户逾期评估装置的功能单元示意图。

附图标记:200-服务器;210-网络端口;220-处理器;230-通信总线;240-存储介质;250-i/o接口;300-用户逾期评估装置;310-数据获取单元;320-特征确定单元;330-评估单元。

具体实施方式

下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

在本发明的描述中,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。

图1示出了本发明实施例提供可以实现本申请思想的服务器的示例性硬件和软件组件的示意图。例如,处理器220可以用于服务器200上,并且用于执行本申请中的功能。

服务器200可以是通用计算机或特殊用途的计算机,两者都可以用于实现本申请的用户逾期评估方法。本申请尽管仅示出了一个计算机,但是为了方便起见,可以在多个类似平台上以分布式方式实现本申请描述的功能,以均衡处理负载。

例如,服务器200可以包括连接到网络的网络端口210、用于执行程序指令的一个或多个处理器220、通信总线230、和不同形式的计算机可读存储介质240,例如,磁盘、rom、或ram,或其任意组合。示例性地,计算机平台还可以包括存储在rom、ram、或其他类型的非暂时性存储介质、或其任意组合中的程序指令。根据这些程序指令可以实现本申请的方法。服务器200还包括计算机与其他输入输出设备(例如键盘、显示屏)之间的输入/输出(input/output,i/o)接口250。

为了便于说明,在服务器200中仅描述了一个处理器。然而,应当注意,本申请中的服务器200还可以包括多个处理器,因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如,若服务器200的处理器执行步骤a和步骤b,则应该理解,步骤a和步骤b也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如,第一处理器执行步骤a,第二处理器执行步骤b,或者第一处理器和第二处理器共同执行步骤a和b。

请参阅图2,图2示出了本实施例提供了一种用户逾期评估方法,所述方法包括s1~s3。

s1,获取目标用户的特征信息及关联信息。

特征信息是表征表征用户行为习惯的信息,例如,指定应用程序的使用习惯,如新闻资讯类应用程序、金融类应用程序、娱乐游戏类应用程序等。一般地,上述信息可以由用户的智能终端获取后发送至特定的服务器,例如,安装了特定应用程序(application,app)的智能终端可以主动或被动地获取上述信息并将获取的信息发送至服务器,服务器对相应的信息进行脱敏处理后进行存储,在需要对某一用户是否可能逾期进行评估时,则提取该目标用户的特征信息进行处理和评估。

特征信息还包括用户是否具有贷款逾期记录,可以理解地,若用户已经具有贷款逾期记录,则其再次逾期的可能性较大,若用户不具有贷款逾期记录,则其逾期的可能性较小。

关联信息包括目标用户的联系人、联系人的特征信息及目标用户与联系人的关联系数。

以通话数据为例,通过安装了特定应用程序(application,app)的智能终端可以主动或被动地获取用户的通讯录及通话记录,从而可以获取目标用户的联系人信息,可以理解地,联系人的特征信息也存储在特定的服务器中,根据获取的联系人信息可以确定联系人的特征信息。特征信息是表征表征用户行为习惯的信息,例如,指定应用程序的使用习惯,用户是否具有贷款逾期记录等。目标用户与联系人的关联系数表示用户与联系人的联系密切度,例如,关联系数可以是一定时间段内的通话时长,如1周内的通话时长或者1个月内的通话时长,可以理解地,关联系数越大,则目标用户与该联系人的联系越密切,越容易受到该联系人的影响。

获取目标用户的特征信息及关联信息之后,所述方法包括:

对获取的获取目标用户的特征信息及关联信息进行脱敏处理。

脱敏处理是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及用户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。

s2,根据联系人的特征信息及目标用户与联系人的关联系数确定目标用户的多度特征信息。

联系人包括联系人,如一度联系人、二度联系人、三度联系人等。根据一度联系人的特征信息及目标用户与一度联系人的关联系数可以确定目标用户的一度特征信息;根据二度联系人的特征信息及目标用户与二度联系人的关联系数可以确定目标用户的二度特征信息;根据三度联系人的特征信息及目标用户与三度联系人的关联系数可以确定目标用户的三度特征信息。

请参阅图3,根据联系人的特征信息及目标用户与联系人的关联系数确定目标用户的多度特征信息的步骤包括s21~s22。

s21:根据目标用户与联系人的关联系数确定联系人的特征权重。

以一度联系人的特征权重为例:

将目标用户与一度联系人的关联系数与目标用户与所有的一度联系人的关联系数的比例作为一度联系人相对目标用户的特征权重。

目标用户与联系人的关联系数表示用户与联系人的联系密切度,例如,关联系数可以是一定时间段内的通话时长,如1周内的通话时长或者1个月内的通话时长。若目标用户存在四个一度联系人a、b、c、d,目标用户与在1个月内与一度联系人a的关联系数为5,与一度联系人b的关联系数为10,与一度联系人c的关联系数为3,与一度联系人d的关联系数为2,则一度联系人a的特征权重w1为5/(5+10+3+2)=0.25;同理,一度联系人b的特征权重w2为10/(5+10+3+2)=0.5、一度联系人c的特征权重w3为3/(5+10+3+2)=0.15、一度联系人d的特征权重w4为2/(5+10+3+2)=0.1。可以理解地,对于同一纬度的联系人而言,其特征权重w1+w2+w3+…wn=1。

以二度联系人的特征权重为例,目标用户的二度联系人是指与目标用户具有相同一度联系人的联系人;多度特征信息包括二度特征信息,根据目标用户与联系人的关联系数确定联系人的特征权重的步骤包括:

将二度联系人相对一度联系人的特征权重与一度联系人相对目标用户的特征权重之积作为二度联系人相对目标用户的特征权重。

目标用户的二度联系人是指与目标用户具有相同一度联系人的联系人,目标用户存在多个一度联系人,每一个一度联系人又存在多个一度联系人,一度联系人的一度联系人(除去目标用户本身及目标用户的已有一度联系人)即为目标用户的二度联系人。将二度联系人相对一度联系人的特征权重与一度联系人相对目标用户的特征权重之积作为二度联系人相对目标用户的特征权重。

s22:根据联系人的特征信息及联系人的特征权重确定目标用户的多度特征信息。

目标用户的多度特征信息与联系人的特征信息及联系人的特征权重满足下式:

fa=w1*f1+w2*f2+…wn*fn;

式中,fa指目标用户的多度特征信息;f1、f2…fn指具有相同维度的不同联系人的特征信息,w1、w2…wn指相应的联系人的特征权重。可以理解地,在确定用户的多度特征信息时,应采用对应的联系人及相应的特征权重,例如,计算目标用户的一度特征信息时,应选用一度联系人的特征信息及一度联系人相对目标用户的特征权重;计算目标用户的二度特征信息时,应选用二度联系人的特征信息及二度联系人相对目标用户的特征权重。

以一度特征信息为例,目标用户的一度特征信息与一度联系人的特征信息及一度联系人的特征权重满足下式:

fa1=w1*f1+w2*f2+…wn*fn;

式中,fa1指目标用户的一度特征信息;f1指第一位一度联系人的特征信息、f2指第二位一度联系人的特征信息…fn指第n位一度联系人的特征信息,w1、w2…wn指相应的一度联系人的特征权重。

s30,将目标用户的特征信息及多度特征信息输入预先设置的评估模型以对目标用户是否可能逾期进行评估。

例如,将目标用户自身的特征信息及其多度特征信息输入预先设置的xgboost模型以对目标用户是否可能逾期进行评估。xgboost模型通过决策树模型对用户是否可能逾期进行评估。将用户自身的特征如是否存在逾期记录、app使用习惯,以及根据联系人确定的多度特征信息作为决策树的特征进行评估预测,能够明显提高评估的精确率。

需要说明的是,于本发明的其他实施方式中,还可以通过其他的相同或相似的模型对用户是否可能逾期进行预测,本实施例对此不作限定。

第二实施例

本实施例提供了一种用户逾期评估装置300,用户逾期评估装置300用于执行第一实施例提供的用户逾期评估方法。需要说明的是,本实施例所提供的用户逾期评估装置300,其基本原理及产生的技术效果和第一实施例提供的用户逾期评估方法基本相同,为简要描述,本实施例部分未提及之处,可参考上述的实施例中相应内容。

请参阅图4,用户逾期评估装置300包括:数据获取单元310、特征确定单元320及评估单元330。

数据获取单元310,用于获取目标用户的特征信息及关联信息,关联信息包括目标用户的联系人、联系人的特征信息及目标用户与联系人的关联系数。

特征信息是表征表征用户行为习惯的信息,例如,指定应用程序的使用习惯,如新闻资讯类应用程序、金融类应用程序、娱乐游戏类应用程序等。特征信息还包括用户是否具有贷款逾期记录,可以理解地,若用户已经具有贷款逾期记录,则其再次逾期的可能性较大,若用户不具有贷款逾期记录,则其逾期的可能性较小。关联信息包括目标用户的联系人、联系人的特征信息及目标用户与联系人的关联系数。目标用户与联系人的关联系数表示用户与联系人的联系密切度,例如,关联系数可以是一定时间段内的通话时长,如1周内的通话时长或者1个月内的通话时长,可以理解地,关联系数越大,则目标用户与该联系人的联系越密切,越容易受到该联系人的影响。

获取目标用户的特征信息及关联信息后,数据获取单元310还用于对获取的信息进行脱敏处理,避免泄漏用户隐私对用户造成损失。

可以理解地,在一种优选的实施方式中,数据获取单元310可以用于执行s10及s11。

特征确定单元320,用于根据联系人的特征信息及目标用户与联系人的关联系数确定目标用户的多度特征信息。

联系人包括联系人,如一度联系人、二度联系人、三度联系人等。以一度联系人的特征权重为例:将目标用户与一度联系人的关联系数与目标用户与所有的一度联系人的关联系数的比例作为一度联系人相对目标用户的特征权重。

以二度联系人的特征权重为例,目标用户的二度联系人是指与目标用户具有相同一度联系人的联系人;多度特征信息包括二度特征信息,将二度联系人相对一度联系人的特征权重与一度联系人相对目标用户的特征权重之积作为二度联系人相对目标用户的特征权重。

特征确定单元320用于根据联系人的特征信息及联系人的特征权重确定目标用户的多度特征信息;其中,目标用户的多度特征信息与联系人的特征信息及联系人的特征权重满足下式:

fa=w1*f1+w2*f2+…wn*fn;

式中,fa指目标用户的多度特征信息;f1、f2…fn指具有相同维度的不同联系人的特征信息,w1、w2…wn指相应的联系人的特征权重。

可以理解地,特征确定单元320可以用于执行s20。

评估单元330,用于将目标用户的特征信息及多度特征信息输入预先设置的评估模型以对目标用户是否可能逾期进行评估。

于本实施例中,评估单元330用于将目标用户自身的特征信息及其多度特征信息输入预先设置的xgboost模型以对目标用户是否可能逾期进行评估。xgboost模型通过决策树模型对用户是否可能逾期进行评估。将用户自身的特征如是否存在逾期记录、app使用习惯,以及根据联系人确定的多度特征信息作为决策树的特征进行评估预测,能够明显提高评估的精确率。

综上所述,本发明提供的一种用户逾期评估方法、装置及存储介质,方法包括:获取目标用户的特征信息及关联信息,关联信息包括目标用户的联系人、联系人的特征信息及目标用户与联系人的关联系数;根据联系人的特征信息及目标用户与联系人的关联系数确定目标用户的多度特征信息;将目标用户的特征信息及多度特征信息输入预先设置的评估模型以对目标用户是否可能逾期进行评估。通过引入更多用户多度的特征信息,能够更加客观的对用户是否可能逾期进行评估,对于用户用户是否可能逾期的评估能力有显著的提升。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1