基于电话通讯网络和社交行为的信用评估方法及装置与流程

文档序号:24075644发布日期:2021-02-26 16:48阅读:94来源:国知局
基于电话通讯网络和社交行为的信用评估方法及装置与流程

[0001]
本发明涉及信用评估技术领域,尤其涉及一种基于电话通讯网络和社交行为的信用评估方法及装置。


背景技术:

[0002]
随着信用贷款的越来越普及,人们在面对资金不足的情况时,可以选择各种各样的贷款方式解决。在现有的贷款业务中,一般是根据获取的用户的个人资料、之前的贷款记录、银行流水等信息来评估用户信用,从而根据用户信用以及用户申请的贷款额度给用户发放贷款。
[0003]
然而,随着大数据时代的来临,这种信用的评估方式已然不够全面,也不够准确,比如,客户与客户之间的信用关系,客户自身的社交行为也会成为客户的“担保人”,而现有用户信用评估方法中,并没有利用到上述评价因素。


技术实现要素:

[0004]
针对现有技术中存在的问题,本发明实施例提供一种基于电话通讯网络和社交行为的信用评估方法及装置。
[0005]
本发明实施例提供一种基于电话通讯网络和社交行为的信用评估方法,包括:获取用户的通讯信息,根据所述通讯信息建立通讯邻接矩阵;获取所述通讯信息中的通讯对象,并获取所述通讯对象中的违约客户,通过预设的扩散激活模型计算所述违约客户的扩散能量;结合所述邻接矩阵,通过所述扩散能量计算所述通讯对象的风险敞口值;获取所述用户的社交数据,并将所述社交数据和所述风险敞口值作为收益特征输入到预设的随机森林测量模型中,计算所述收益特征的收益数据;通过所述收益数据判断对应用户为违约用户或守约用户,以及对应用户的个体收益情况。
[0006]
在其中一个实施例中,所述方法还包括:获取历史样本中的历史收益特征,建立测试数据集;通过所述随机森林测量模型训练所述历史收益特征对应的特征数据,得到历史样本对应的预测树;建立混淆矩阵,计算所述预测树的收益;通过所述预测树的收益计算所述测试数据集中历史收益特征的平均减少收益;对所述历史收益特征的平均减少收益进行筛选,得到各个所述历史收益特征对应的收益数据;获取预设的emp公式,结合所述历史收益特征对应的收益数据以及收益特征,计算得到所述收益特征的收益数据。
[0007]
在其中一个实施例中,所述通讯信息,包括:
通讯对象、通讯时长、通讯发起方、通讯对象类型。
[0008]
在其中一个实施例中,所述方法还包括:通过所述通讯对象确定所述邻接矩阵的邻边,通过所述通讯时长表示所述邻边的权重,通过所述通讯发起方确定所述邻边的方向,通过所述通讯对象类型设定所述通讯对象对应节点的标签。
[0009]
在其中一个实施例中,所述社交数据,包括:个人消费数据、个人收入数据、个人还款数据、通讯对象的个人还款数据。
[0010]
在其中一个实施例中,所述方法还包括:计算所述通讯对象的总收益,并通过所述个体收益情况以及总收益调整所述随机森林测量模型的参数。
[0011]
本发明实施例提供一种基于电话通讯网络和社交行为的信用评估装置,包括:第一获取模块,用于获取用户的通讯信息,根据所述通讯信息确定通讯邻接矩阵;第二获取模块,用于获取所述通讯信息中的通讯对象,并获取所述通讯对象中的违约客户,通过预设的扩散激活模型计算所述违约客户的扩散能量;计算模块,用于结合所述邻接矩阵,通过所述扩散能量计算所述通讯对象的风险敞口值;第三获取模块,用于获取所述用户的社交数据,并将所述社交数据和所述风险敞口值作为收益特征输入到预设的随机森林测量模型中,计算所述收益特征的收益数据;判断模块,用于通过所述收益数据判断对应用户为违约用户或守约用户,以及对应用户的个体收益情况。
[0012]
在其中一个实施例中,所述装置还包括:第四获取模块,用于获取历史样本中的历史收益特征,建立测试数据集;训练模块,用于通过所述随机森林测量模型训练所述历史收益特征对应的特征数据,得到历史样本对应的预测树;建立模块,用于建立混淆矩阵,计算所述预测树的收益;第二计算模块,用于通过所述预测树的收益计算所述测试数据集中历史收益特征的平均减少收益;筛选模块,用于对所述历史收益特征的平均减少收益进行筛选,得到各个所述历史收益特征对应的收益数据;第三计算模块,用于获取预设的emp公式,结合所述历史收益特征对应的收益数据以及收益特征,计算得到所述收益特征的收益数据。
[0013]
本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于电话通讯网络和社交行为的信用评估方法的步骤。
[0014]
本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述基于电话通讯网络和社交行为的信用评估方法的步骤。
[0015]
本发明实施例提供的基于电话通讯网络和社交行为的信用评估方法及装置,获取用户的通讯信息,根据通讯信息建立通讯邻接矩阵;获取通讯信息中的通讯对象,并获取通
讯对象中的违约客户,通过预设的扩散激活模型计算违约客户的扩散能量;结合邻接矩阵,通过扩散能量计算通讯对象的风险敞口值;获取用户的社交数据,并将社交数据和风险敞口值作为收益特征输入到预设的随机森林测量模型中,计算收益特征的收益数据;通过收益数据判断对应用户为违约用户或守约用户,以及对应用户的个体收益情况。这样结合相关的消费和社交行为对客户进行信用评估,使得评估结果更加全面,也提高了信用评估的准确性。
附图说明
[0016]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]
图1为本发明实施例中基于电话通讯网络和社交行为的信用评估方法的流程图;图2为本发明实施例中基于电话通讯网络和社交行为的信用评估装置的结构图;图3为本发明实施例中电子设备结构示意图。
具体实施方式
[0018]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0019]
图1为本发明实施例提供的基于电话通讯网络和社交行为的信用评估方法的流程示意图,如图1所示,本发明实施例提供了一种基于电话通讯网络和社交行为的信用评估方法,包括:步骤s101,获取用户的通讯信息,根据所述通讯信息建立通讯邻接矩阵。
[0020]
具体地,获取用户通话信息表中的通讯信息,其中,通讯信息包括通讯对象、通讯时长、通讯发起方、通讯对象类型(即通讯对象是违约用户或守约用户)等,然后根据通讯信息建立对应的通讯邻接矩阵,即是将通话信息表中的所有用户抽象成对应的节点,然后通过通讯对象确定邻接矩阵的邻边,通过通讯时长表示邻边的权重,通过通讯发起方确定邻边的方向,通过通讯对象类型设定通讯对象对应节点的标签,具体的建立过程可以为:若用户在通话信息表间存在联系,则两者之间存在边的连接,绘制成邻接矩阵。用彼此间的通话时长表示边的权重,其中。通过拨打和被拨打的行为,可以将矩阵分成有向边,拨打表示出度,被拨打表示入度。节点第一阶级的邻居节点集合为。并将这些节点根据个体还款情况进行标签化,分成违约和守约两类。
[0021]
步骤s102,获取所述通讯信息中的通讯对象,并获取所述通讯对象中的违约客户,通过预设的扩散激活模型计算所述违约客户的扩散能量。
[0022]
具体地,获取通讯信息中通讯对象的违约客户,并根据预设的扩散激活模型计算
违约客户的扩散能量,因为每个违约客户都携带有能量,并且会将节点能量扩散到其他的邻居节点,所以可以利用扩散激活模型(spa)。假设活跃节点(违约客户)的集合为,携带有的能量为。在经过k次迭代后,活跃节点d部分的节点能量扩散给其邻居节点,将此能量定义为转移能量,可以表示成:当没有新的邻居节点受到影响和能量改变小于阈值时候,激活模型停止,这样得到了违约客户在邻接矩阵中的扩散能量。
[0023]
步骤s103,结合所述邻接矩阵,通过所述扩散能量计算所述通讯对象的风险敞口值。
[0024]
具体地,通过扩散能量计算通讯对象的风险敞口值可以利用修正后的pagerank算法,比如假设网络中的权矩阵为w,每个点的风险敞口值,阻尼系数为()表示随机概率,计算公式为经过扩散激活模型(spa)和修正后的pagerank算法计算,可以求出网络中每个点的风险敞口值。另外,当节点的能量值小于设定的临界值时候,定义成低风险节点;当能量值高于设定的临界值时候,定义成高风险节点。
[0025]
步骤s104,获取所述用户的社交数据,并将所述社交数据和所述风险敞口值作为收益特征输入到预设的随机森林测量模型中,计算所述收益特征的收益数据。
[0026]
具体地,获取用户的社交数据,社交数据可以包括个人消费数据、个人收入数据、个人还款数据、通讯对象的个人还款数据,其中,主要参考对象是用户的个人还款数据以及用户通讯对象的个人还款数据,然后将社交数据和计算得到的各个节点的风险敞口值作为收益特征输入到预设的随机森林测量模型,计算各个节点中收益特征对应的收益数据。
[0027]
步骤s105,通过所述收益数据判断对应用户为违约用户或守约用户,以及对应用户的个体收益情况。
[0028]
具体地,通过计算得到随机森林测量模型中的收益数据,并获取判定的界限值,将是否高于界限值的数据点分成对应的违约用户或守约用户,以及计算对每个用户进行贷款时,针对用户的个体收益情况。
[0029]
本发明实施例提供的一种基于电话通讯网络和社交行为的信用评估方法,获取用户的通讯信息,根据通讯信息建立通讯邻接矩阵;获取通讯信息中的通讯对象,并获取通讯对象中的违约客户,通过预设的扩散激活模型计算违约客户的扩散能量;结合邻接矩阵,通过扩散能量计算通讯对象的风险敞口值;获取用户的社交数据,并将社交数据和风险敞口值作为收益特征输入到预设的随机森林测量模型中,计算收益特征的收益数据;通过收益数据判断对应用户为违约用户或守约用户,以及对应用户的个体收益情况。这样结合相关的消费和社交行为对客户进行信用评估,使得评估结果更加全面,也提高了信用评估的准确性。
[0030]
在上述实施例的基础上,所述基于电话通讯网络和社交行为的信用评估方法,还
包括:获取历史样本中的历史收益特征,建立测试数据集;通过所述随机森林测量模型训练所述历史收益特征对应的特征数据,得到历史样本对应的预测树;建立混淆矩阵,计算所述预测树的收益;通过所述预测树的收益计算所述测试数据集中历史收益特征的平均减少收益;对所述历史收益特征的平均减少收益进行筛选,得到各个所述历史收益特征对应的收益数据;获取预设的emp公式,结合所述历史收益特征对应的收益数据以及收益特征,计算得到所述收益特征的收益数据。
[0031]
在本发明实施例中,通过预设的步骤,并利用随机森林测量模型计算收益特征的收益数据,具体的详细计算步骤可以比如:假设随机森林模型()有n个样本,m个特征数目,按照以下步骤:利用随机森林算法去训练数据,并得出每个预测树;利用混淆矩阵,计算每个树的收益;计算测试数据集中的每个特征,并计算平均减少的收益。定义如下: 。其中表示特征属于树。
[0032]
筛选。值最高的特征拥有最平均的减少收益。
[0033]
s105:调整后的emp预期最大利润评价指标:s105:调整后的emp预期最大利润评价指标:表示是每个借贷人的平均利润,表成为违约人(守约人)的概率,表示累计的违约人(守约人)的密度函数。可得最优函数为:函数为:表示正确识别违约人的收益,即,lgd(loss given default)表示违约损失率,ead(exposure at default)表示可能发生违约风险的资金额度,a表示借贷数目。表示错误将守约人判断成违约人的损失,等价于借贷的投资回报率(roi)。表示操作的代价,表示代价/收益比例,表示分类损失的联合概率密度,最佳
截止值为。当时,表示拒绝一个客户后不产生任何损失。
[0034]
本发明实施例通过上述步骤计算各个节点中各个特征产生的收益影响。
[0035]
在上述实施例的基础上,所述基于电话通讯网络和社交行为的信用评估方法,还包括:计算所述通讯对象的总收益,并通过所述个体收益情况以及总收益调整所述随机森林测量模型的参数。
[0036]
在本发明实施例中,在计算用户的个体收益情况后,还可以计算通讯对象(各个节点)的总收益,其中,计算的方法可以通过混淆矩阵,然后将计算结果数据反馈到随机森林测量模型中,对随机森林测量模型的参数进行对应调整。其中,混淆矩阵可以如表1所示:表1本发明实施例通过收益结果反馈调整随机森林测量模型的参数,使得随机森林测量模型的参数更加准确。
[0037]
图2为本发明实施例提供的一种基于电话通讯网络和社交行为的信用评估装置,包括:第一获取模块201、第二获取模块202、计算模块203,第三获取模块204,判断模块205,其中:第一获取模块201,用于获取用户的通讯信息,根据所述通讯信息确定通讯邻接矩阵。
[0038]
第二获取模块202,用于获取所述通讯信息中的通讯对象,并获取所述通讯对象中的违约客户,通过预设的扩散激活模型计算所述违约客户的扩散能量。
[0039]
计算模块203,用于结合所述邻接矩阵,通过所述扩散能量计算所述通讯对象的风险敞口值。
[0040]
第三获取模块204,用于获取所述用户的社交数据,并将所述社交数据和所述风险敞口值作为收益特征输入到预设的随机森林测量模型中,计算所述收益特征的收益数据。
[0041]
判断模块205,用于通过所述收益数据判断对应用户为违约用户或守约用户,以及对应用户的个体收益情况。
[0042]
在一个实施例中,装置还可以包括:第四获取模块,用于获取历史样本中的历史收益特征,建立测试数据集。
[0043]
训练模块,用于通过所述随机森林测量模型训练所述历史收益特征对应的特征数据,得到历史样本对应的预测树。
[0044]
建立模块,用于建立混淆矩阵,计算所述预测树的收益。
[0045]
第二计算模块,用于通过所述预测树的收益计算所述测试数据集中历史收益特征的平均减少收益。
[0046]
筛选模块,用于对所述历史收益特征的平均减少收益进行筛选,得到各个所述历史收益特征对应的收益数据。
[0047]
第三计算模块,用于获取预设的emp公式,结合所述历史收益特征对应的收益数据以及收益特征,计算得到所述收益特征的收益数据。
[0048]
在一个实施例中,装置还可以包括:第四计算模块,用于计算所述通讯对象的总收益,并通过所述个体收益情况以及总收益调整所述随机森林测量模型的参数。
[0049]
关于基于电话通讯网络和社交行为的信用评估装置的具体限定可以参见上文中对于基于电话通讯网络和社交行为的信用评估方法的限定,在此不再赘述。上述基于电话通讯网络和社交行为的信用评估装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0050]
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)301、存储器(memory)302、通信接口(communications interface)303和通信总线304,其中,处理器301,存储器302,通信接口303通过通信总线304完成相互间的通信。处理器301可以调用存储器302中的逻辑指令,以执行如下方法:获取用户的通讯信息,根据通讯信息建立通讯邻接矩阵;获取通讯信息中的通讯对象,并获取通讯对象中的违约客户,通过预设的扩散激活模型计算违约客户的扩散能量;结合邻接矩阵,通过扩散能量计算通讯对象的风险敞口值;获取用户的社交数据,并将社交数据和风险敞口值作为收益特征输入到预设的随机森林测量模型中,计算收益特征的收益数据;通过收益数据判断对应用户为违约用户或守约用户,以及对应用户的个体收益情况。
[0051]
此外,上述的存储器302中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0052]
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如包括:获取用户的通讯信息,根据通讯信息建立通讯邻接矩阵;获取通讯信息中的通讯对象,并获取通讯对象中的违约客户,通过预设的扩散激活模型计算违约客户的扩散能量;结合邻接矩阵,通过扩散能量计算通讯对象的风险敞口值;获取用户的社交数据,并将社交数据和风险敞口值作为收益特征输入到预设的随机森林测量模型中,计算收益特征的收益数据;通过收益数据判断对应用户为违约用户或守约用户,以及对应用户的个体收益情况。
[0053]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单
元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0054]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0055]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1