用户可信度社交网络数据的处理方法与流程

文档序号:18623686发布日期:2019-09-06 22:45阅读:215来源:国知局
用户可信度社交网络数据的处理方法与流程

本发明涉及互联网应用领域,特别涉及一种用户可信度社交网络数据的处理方法。



背景技术:

目前,产品采用全线上的模式对用户进行质量评估,包含但不限于监测用户的真实性、还款能力和还款意愿。由于全线上的模式进行数据采集时面临用户数据真实性无法把控,用户还款意愿和还款能力无法通过用户上传的简单的身份信息和资产信息进行评估和确定。与此同时国内没有健全的用户信用档案数据,借款用户中的绝大多数无法通过信用接口查询历史信用情况,致使线上评估用户的真实性、还款能力和还款意愿存在极大困难。

面对国内的征信体系不够健全,用户的信用意识较为淡薄,如何解决在用户基本信息不够完全,资产数据不够完整时的用户信用评分问题,是我们面对的一个崭新课题。



技术实现要素:

本发明的目的在于克服现有技术的不足之处,提供一种用户可信度社交网络数据的处理方法,通过社交信息抓取系统,允许用户在系统中进行指定的操作产生社交关系请求,用户在经授权并允许的社交网络中传播该社交信息请求以达成社交信息的收集,构建围绕该用户的不同层级与类型的社交数据网络,给出该用户的信用评级与风险定价,对用户风险进行清晰明确的刻画,进行二次授信。

为了达到上述目的,本发明提供的用户可信度社交网络数据的处理方法,该方法设置包括微信的社交网络平台,该方法执行的步骤包括:

1)用户通过手机号码注册的形式实现用户准入,用户填写基本资料作为待审条件,系统根据所述待审条件给出判断并执行接受或拒绝操作,之后系统对被接受用户的资料进行信息量化处理生成对应的社交关系判定请求;

2)所述判定请求生成后,在用户发起借款请求的同时,对该用户社交关系判定请求在不同层级与类型的社交网络平台上进行分享传播,获取不同层级与类型的社交数据网络信息;

3)对已获取的所述社交数据网络信息进行录入、清洗和梳理;

4)所述判定请求生成后,同时在用户社交圈内进行用户信用评估,获取用户信用数据;

5)所述用户社交数据协同所述用户信用数据进行二次授信评级;

6)根据所述二次授信评级进行可信度评估,并评判该用户的借贷违约率与授信风险;

7)结束。

本发明用户可信度社交网络数据的处理方法,在其中所述步骤3)中,所述用户社交数据至少包括时间、pv、uv、单次停留时长的信息;所述社交数据的录入、清洗和整理至少包括:

(1)数据录入:用户基本资料和用户社交圈交叉比对信息;

(2)数据整理:采用r语言数据清洗与整理信息;

(3)数据分析:采用logistic回归建模;

(4)模型检验:多重共线性、残差分析、正态性检验、独立性检验、vif检验、d-w检验和异常值检验;

(5)网络图谱:a.社交关系交叉验证图谱;b.用户社交层级划分图谱。

本发明用户可信度社交网络数据的处理方法,在其中步骤4)中,在用户社交圈内进行用户信用评估至少包括:

(1)弱关系获取:好友点击链接进行点赞操作,发生点赞关系的人数、时间点、时间差、点击数的信息;

(2)强关系获取:好友回答若干关于用户借款的询问,回答正确则认证成功,发生认证关系人数、时间点、时间差、点击数的信息;

(3)用户社交圈闭合度:用户社交圈在不同纬度之间重合情况的信息;

(4)投资关系获取:好友对用户资金使用进行投资担保中投资金额、投资时间地点的信息;

(5)用户筹满资金额,可以提现的信息。

本发明用户可信度社交网络数据的处理方法,在其中所述步骤5)中,系统通过下式计算评估用户借贷违约率,并输出用户社交数据:

p=exp(b0+b1*x1+b2*x2+b3*x3+b4*x4)/(1+exp(b0+b1*x1+b2*x2+b3*x3+b4*x4))

其中:x1为社交平台完成对该用户的答题认证中用户被认证数据;x2为社交平台完成对该用户的信用投资中用户被投资数据;x3为社交平台完成对该用户的点赞中用户被点赞数据;x4为用户社交圈闭合度数据;b0、b1、b2、b3、b4为系统计算所得参数。

本发明用户可信度社交网络数据的处理方法,在其中所述步骤6)中,信用评级采用基于logistic回归模型建立的评分卡系统,系统首先计算用户借贷违约率p1,

当满足p1<k1时自动进入下一步验证,当p1>k2时自动驳回,当k1<p1<k2时进入人工审核;然后系统计算用户借贷违约率,在满足信用差值条件|p1-p2|<k3时,用户被通过,否则进入人工审核,其中:p1为参与社交互动用户的借贷违约率,p2为参与社交互动用户借贷违约率的加权平均值,k1、k2、k3为信用评级系数。

本发明用户可信度社交网络数据的处理方法的优点和积极效果是:通过对用户在平台进行一系列的社交行为采集,基于采集数据对用户进行建模与分析,给出了用户的逾期率预估,实现了基于用户的社交数据给用户一个的评估作为用户授信的标准。通过用户的逾期率预估,用以区别用户优劣的模型评估值能达到40以上,而传统模型的评估值只在35左右,用户评估的识别率能达到70%以上,即通过模型能够准确识别70%用户的还款结果。这在实际应用中相较于传统模式的授信取得了显著的效果。

为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图对本发明进一步详细说明。

附图说明

图1为本发明用户可信度社交网络数据的处理方法的流程图;

图2为用户借款的界面图;

图3为用户生成借款详情的界面截图;

图4为网络分享的界面截图;

图5为朋友圈点赞互动截图;

图6为朋友圈收到分享截图;

图7为用户点赞互动截图;

图8为投资确认截图;

图9为投资成功截图;

图10为授信完成截图;

图11为社交关系交叉验证的示意图;

图12为用户社交层级划分的示意图。

具体实施方式

为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

本发明是基于用户个人资料生成一套评估社交关系的方法,并以此收集用户社交行为中的各项数据进而评估用户在社交行为中的各项表现。通过用户社交行为数据给出用户一次授信,在此基础上依据与被授信用户发生关联的社交圈的授信情况对被授信用户进行二次授信。

参照图1,本发明用户可信度社交网络数据的处理方法,该方法设置包括微信的社交网络平台,该方法执行的步骤包括:

1)用户注册:用户通过手机号码注册的形式实现用户准入,用户填写基本资料作为待审条件,系统根据待审条件给出判断并执行接受或拒绝操作,之后系统对被接受用户的资料进行信息量化处理生成对应的社交关系判定请求;

2)判定请求生成后,在用户发起借款请求的同时,对该用户社交关系判定请求在不同层级与类型的社交网络平台上进行分享传播,获取不同层级与类型的社交数据网络信息;

3)已获取的社交数据网络信息进行录入、清洗和梳理。

在步骤3)中,用户社交数据至少包括时间、pv、uv、单次停留时长的信息;社交数据的录入、清洗和整理至少包括:

(1)数据录入:用户基本资料和用户社交圈交叉比对信息;

(2)数据整理:采用r语言数据清洗与整理信息;

(3)数据分析:采用logistic回归建模;

(4)模型检验:多重共线性、残差分析、正态性检验、独立性检验、vif检验、d-w检验和异常值检验;

(5)网络图谱:参照图11和图12,社交关系交叉验证图谱;用户社交层级划分图谱。

4)判定请求生成后,同时在用户社交圈内进行用户信用评估,获取用户信用数据。

在步骤4)中,在用户社交圈内进行用户信用评估至少包括:

(1)弱关系获取:参照图5至图7,好友点击链接进行点赞操作,发生点赞关系的人数、时间点、时间差、点击数的信息;

(2)强关系获取:参照图2至图4,好友回答若干关于用户借款的询问,回答正确则认证成功,发生认证关系人数、时间点、时间差、点击数的信息;

(3)用户社交圈闭合度:用户社交圈在不同纬度之间重合情况的信息;

(4)投资关系获取:参照图8至图10,好友对用户资金使用进行投资担保中投资金额、投资时间地点的信息;

(5)用户筹满资金额,可以提现的信息。

5)用户社交数据协同用户信用数据进行二次授信评级。信用评级采用基于logistic回归模型建立的评分卡系统。

在步骤5)中,系统通过下式计算评估用户借贷违约率,并输出用户社交数据:

p=exp(b0+b1*x1+b2*x2+b3*x3+b4*x4)/(1+exp(b0+b1*x1+b2*x2+b3*x3+b4*x4))

其中:x1:社交平台完成对该用户的答题认证中用户被认证数据;x2:社交平台完成对该用户的信用投资中用户被投资数据;x3:社交平台完成对该用户的点赞中用户被点赞数据;x4:用户社交圈闭合度数据;b0、b1、b2、b3、b4为系统计算所得参数。

6)根据二次授信评级进行可信度评估,并评判该用户的借贷违约率与授信风险。

在步骤6)中,信用评级采用基于logistic回归模型建立的评分卡系统,系统首先计算用户借贷违约率p1,当满足p1<k1时自动进入下一步验证,当p1>k2时自动驳回,当k1<p1<k2时进入人工审核;然后系统计算用户借贷违约率,在满足信用差值条件|p1-p2|<k3时,用户被通过,否则进入人工审核,其中:p1为参与社交互动用户的借贷违约率,p2为参与社交互动用户借贷违约率的加权平均值,k1、k2、k3为信用评级系数。

7)结束。

实施例1:

用户a通过手机号注册进入社交平台并且完成身份认证后发起一笔借款,用户执行平台要求将该笔借款请求分享到社交圈。a的朋友a1、a2…a6点击了该链接,记录这6个用户的点击时间和对应的页面刷新次数。然后这6个朋友中的a1、a2离开页面,剩下a3、a4、a5、a6这4个人被页面引导进入下一步操作,也即回答了关于用户a身份的相关问题,a3回答错误,a4、a5、a6回答正确并对用户a进行了投资。用户a筹集满金额,数据收集完毕。

对于用户a,基于a1-a6点击链接在时间、地域、设备匹配上无异常值,被点赞关系数值为6;基于a4-a6回答正确和a3部分回答正确,其认证关系数值为3.3;基于a4-a6投资成功且无异常值出现,其投资关系数值为3。同时,基于用户a本身,历史至今a被5个人进行过认证,同时a认证过6个人,这11个人次中,有4个是重合的,因此社交圈闭合度为4/7=0.57。用户a的个人信用评估值为:

p1=exp(b0+b1*3.5+b2*3+b3*6+b4*0.57)/(1+exp(b0+b1*3.5+b2*3+b3*6+b4*0.57))=0.268

由于p1<k1,因此该用户进入下一轮信用值差别判断:

p2=a1*pa4+a2*pa5+a3*pa6=0.317

根据用户表现调整确定的预设值为k1=0.35,k2=0.65,k3=0.13,由于|p1-p2|=0.049<k3,用户a通过审核。

实施例2:

用户b通过手机号注册进入社交平台并且完成身份认证后发起一笔借款,用户执行平台要求的将该笔借款请求分享到社交圈。b的朋友b1、b2、b3点击了该链接,记录这3个用户的点击时间和对应的页面刷新次数。然后这3个朋友全部进入下一步操作也即回答了关于该用户身份的相关问题,全部回答正确并都对b用户进行了投资,b用户筹集满金额,数据收集完毕。对于用户b,基于b1-b3点击链接在时间、地域、设备匹配上无异常值,其被点赞关系数值为3;基于b1-b3回答正确,其认证关系数值为3;基于b1-b3投资成功且无异常值出现,其投资关系数值为3。同时基于用户b本身,历史至今b被9个人进行过认证,同时b认证过10个人,这19个人次中有9个是重合的,因此社交圈闭合度为9/10=0.9。用户b的个人信用评估值为:

p1=exp(b0+b1*3+b2*3+b3*3+b4*0.9)/(1+exp(b0+b1*3+b2*3+b3*3+b4*0.9))=0.632

由于k1<p1<k2,因此该用户在人工审核后进入下一轮信用值差别判断:

p2=a1*pa4+a2*pa5+a3*pa6=0.472

根据用户表现调整确定的预设值为k1=0.35,k2=0.65,k3=0.13,由于|p1-p2|=0.160>k3,用户被拒绝。

目前,在互联网金融时代,用户群体的朋友圈十分丰富,每个用户都有对应活跃的社交圈,与此同时,国内现状决定了社交环境对用户的约束力也在加强,人群的群体化现象较为显著。聚集在一起的用户群个体更倾向于拥有相似的消费能力和还款能力,以户社交信息丰富性和社交约束力为基础,结合用户的群体聚集性来对用户进行征信与授信,本发明实现了基于用户的社交数据给用户一个的评估作为用户授信的标准。对用户在平台进行一系列的社交行为采集后,基于采集数据对用户进行建模与分析,给出用户的逾期率预估,用来区别用户能力优劣的模型评估值能达到40以上,而传统模型的评估值只在35左右,用户评估的识别率能达到70%以上,通过模型能够准确识别70%用户的还款结果。在实际应用中相较于传统模式的授信取得了显著的效果。

上面所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的构思和范围进行限定,在不脱离本发明设计方案前提下,本领域中普通工程技术人员对本发明的技术方案做出的各种变型和改进,均应落入本发明的保护范围,本发明请求保护的技术内容,已经全部记载在权利要求书中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1