风控评估方法及装置与流程

文档序号:31675885发布日期:2022-09-28 02:02阅读:129来源:国知局
风控评估方法及装置与流程

1.本发明涉及计算机技术领域,尤其涉及一种风控评估方法及装置。


背景技术:

2.在风控评估中,现有一般采用rfm衡量客户的风险。其中,r(recency)为交易时间间隔、f(frequency)为交易次数、m(monetary)为交易金额。
3.现有的通过rfm的客户风控评估方式,通过交易时间间隔、交易次数以及交易金额的评估方式,未考虑客户的交易占比信息,无法全面的对客户风险做出评估,从而最终导致评估准确性不高。


技术实现要素:

4.本发明提供一种风控评估方法及装置,用以解决现有技术针对客户的风控评估中,无法全面的对客户风险做出评估,从而最终导致评估准确性不高的技术问题。
5.本发明提供一种风控评估方法,包括:
6.根据特征提取rfmp方法,从目标用户的风控关联数据中获取所述目标用户的风控关联特征;
7.将所述风控关联特征输入风控评估模型,得到所述风控评估模型输出的所述目标用户的风控评估结果;
8.所述风控评估模型是基于风控样本特征对逻辑回归模型进行训练得到的;
9.所述风控样本特征是根据所述rfmp方法,从风控关联样本数据中获取的;
10.所述rfmp方法是基于交易时间间隔、交易次数、交易金额以及交易金额占比确定的。
11.根据本发明提供的一种风控评估方法,根据预设的权重系数,确定所述rfmp方法中,交易时间间隔、交易次数、交易金额以及交易金额占比的权重。
12.根据本发明提供的一种风控评估方法,从目标用户的风控关联数据中获取所述目标用户的风控关联特征之后,还包括:
13.对所述风控关联特征进行筛选;
14.所述对所述风控关联特征进行筛选,包括以下至少一项:
15.根据信息价值iv法,确定各风控关联特征的iv值,并删除所述风控关联特征中iv值小于预设iv值的特征;
16.根据主成分分析法,确定各风控关联特征的相关性,并删除所述风控关联特征中相关性大于预设相关性阈值的特征。
17.根据本发明提供的一种风控评估方法,所述从目标用户的风控关联数据中获取所述目标用户的风控关联特征之前,还包括:
18.根据所述风控关联数据中的数据范围,确定所述风控关联数据中的异常数据,并删除所述异常数据。
19.根据本发明提供的一种风控评估方法,所述从目标用户的风控关联数据中获取所述目标用户的风控关联特征之前,还包括:
20.根据风控关联数据中数据的相似度,删除所述风控关联数据中相似度高于预设相似度阈值的数据。
21.根据本发明提供的一种风控评估方法,所述风控关联数据包括用户基本信息数据、交易数据、资产数据、工商司法数据中的一项或多项。
22.本发明还提供一种风控评估装置,包括:
23.特征提取模块,用于根据特征提取rfmp方法,从目标用户的风控关联数据中获取所述目标用户的风控关联特征;
24.风控评估结果确定模块,用于将所述风控关联特征输入风控评估模型,得到所述风控评估模型输出的所述目标用户的风控评估结果;
25.所述风控评估模型是基于风控样本特征对逻辑回归模型进行训练得到的;
26.所述风控样本特征是根据所述rfmp方法,从风控关联样本数据中获取的;
27.所述rfmp方法是基于交易时间间隔、交易次数、交易金额以及交易金额占比确定的。
28.本发明还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述风控评估方法。
29.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述风控评估方法。
30.本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述风控评估方法。
31.本发明提供的风控评估方法及装置,通过rfmp方法,从目标用户的风控关联数据中获取目标用户的风控关联特征,并将获取的风控关联特征输入风控评估模型,得到目标用户的风控评估结果,实现了目标用户的风险评估。与此同时,通过rfmp的方法进行特征提取,可更精确的对目标用户的风险做出判断,从而提高评估结果的准确性。
附图说明
32.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图简要地说明,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
33.图1是本发明提供的风控评估方法的流程示意图;
34.图2是本发明提供的风控评估装置的结构示意图;
35.图3是本发明提供的电子设备的结构示意图。
具体实施方式
36.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,
而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
37.图1为本发明提供的风控评估方法的流程示意图。参照图1,本发明提供的风控评估方法可以包括:
38.步骤110,根据特征提取rfmp方法,从目标用户的风控关联数据中获取所述目标用户的风控关联特征;
39.步骤120,将所述风控关联特征输入风控评估模型,得到所述风控评估模型输出的所述目标用户的风控评估结果;
40.所述风控评估模型是基于风控样本特征对逻辑回归模型进行训练得到的;
41.所述风控样本特征是根据所述rfmp方法,从风控关联样本数据中获取的;
42.所述rfmp方法是基于交易时间间隔、交易次数、交易金额以及交易金额占比确定的。
43.本发明提供的风控评估方法的执行主体可以是电子设备、电子设备中的部件、集成电路、或芯片。该电子设备可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、超级移动个人计算机(ultra-mobile personal computer,umpc)、上网本或者个人数字助理(personal digital assistant,pda)等,非移动电子设备可以为服务器、网络附属存储器(network attached storage,nas)或个人计算机(personal computer,pc)等,本发明不作具体限定。
44.下面以计算机执行本发明提供的风控评估方法为例,详细说明本发明的技术方案。
45.需要说明的是,风控指的是风险控制。风险控制是指风险管理者采取各种措施和方法,消灭或减少风险事件发生的各种可能性,或风险控制者减少风险事件发生时造成的损失。总会有些事情是不能控制的,风险总是存在的。作为管理者会采取各种措施减小风险事件发生的可能性,或者把可能的损失控制在一定的范围内,以避免在风险事件发生时带来的难以承担的损失。
46.风控评估是指,根据用户的风控信息,对用户的风险进行评估。例如,根据用户的交易记录、用户的工商司法记录以及用户的信用记录等,评估用户办理银行业务出现违约的概率等。
47.在步骤110中,获取目标用户的风控关联数据,根据特征提取rfmp方法,从目标用户的风控关联数据中获取目标用户的风控关联特征。
48.目标用户的风控关联数据包括目标用户的基本信息、目标用户的交易数据、目标用户的资产数据以及目标用户的工商司法数据等。其中,目标用户的基本信息包括目标用户的年龄、性别、工作收入、工作性质以及学历等。目标用户的交易数据包括目标用户的购买基金保险的交易数、目标用户消费交易数据等。目标用户的资产数据包括目标用户的账户余额,目标用户账户年资产存入数据等。目标用户的工商司法数据包括用户的行政处罚数据、目标用户的裁判文书数据、目标用户的风险信息等。
49.可以理解的是,目标用户的基本信息、目标用户的交易数据、目标用户的资产数据以及目标用户的工商司法数等风控关联数据,反映的是目标用户的交易信息以及目标用户交易过程的信用信息。所以,可以根据目标用户的风控关联数实现对目标用户的风控评估。
例如,根据目标用户的风控关联数据,对目标用户的办理业务违约的概率进行确定。
50.特征提取rfmp方法是基于交易时间间隔、交易次数、交易金额以及交易金额占比确定的。即特征提取rfmp方法是根据输入数据,从输入数据中提取交易时间间隔、交易次数、交易金额以及交易金额占比相关的特征。
51.相对于相关技术中的rfm方法,通过交易时间间隔、交易次数、交易金额对客户的价值、客户的创利能力以及客户的风险进行衡量。本发明实施例在相关技术的rfm方法中新增percentage方法,通过对客户交易频次和金额占比的评估,可更精确的对客户价值、创利以及风险做出判断,从而提高最终风控评估的准确性。
52.具体地,rfmp的含义如下:r(recency):客户最近一次交易时间的间隔;f(frequency):客户在最近一段时间内交易的次数;m(monetary):客户在最近一段时间内交易的金额;p(percentage):客户在最近一段时间内交易频次或者金额的占比。其中,r值越大,表示客户交易发生的日期越久,反之则表示客户交易发生的日期越近。f值越大,表示客户交易越频繁,反之则表示客户交易不够活跃。m值越大,表示客户价值越高,反之则表示客户价值越低。p值越大,表示客户价值越高,反之则表示客户价值越低。
53.可选地,在对目标用户的风控关联数据进行风控关联特征提取的过程中,rfmp中的r可以为最近一次发生交易日期距今天数;f可以为近三个月流出资金笔数;m可以为近一个月流入资金总额/最大值/最小值/平均值;p可以为近一个月流出水电气费资金总额占总流出比。
54.可以理解的是,在获取目标用户的风控关联数据后,根据rfmp方法中的定义,可以从目标用户的风控关联数据中,筛选出目标用户的风控关联特征。例如,根据rfmp方法,风控关联数据中筛选出目标用户的特征包括:资金流入流出特征、个人资本特征、交易频次特征以及违法次数特征等。
55.在步骤120中,步骤110中获取的目标用户的风控关联特征输入风控评估模型,得到风控评估模型输出的目标用户的风控评估结果。
56.风控样本特征是根据rfmp方法,从风控关联样本数据中获取的。其中,风控关联样本数据是根据训练逻辑回归模型的需要,选取的用于训练逻辑回归模型的样本数据。
57.获取风控关联样本数据,根据rfmp方法,从风控关联样本数据中提取风控样本特征。
58.特征提取rfmp方法是基于交易时间间隔、交易次数、交易金额以及交易金额占比确定的。即特征提取rfmp方法是根据输入的风控关联样本数据,从输入的风控关联样本数据中提取交易时间间隔、交易次数、交易金额以及交易金额占比相关的特征,作为风控样本特征。
59.风控评估模型是基于风控样本特征对逻辑回归模型进行训练得到的。逻辑回归(logistic regression)模型,则是一个分类算法,常常用于二分类问题。逻辑回归可以用公式(1)来解释:
[0060][0061]
其中,x为逻辑回归模型的输入,即输入的风控样本特征;y为逻辑回归模型的输出,即输出的目标用户的风控评估结果;ω和b为逻辑回归模型的参数。
[0062]
通过确定的风控样本特征,对逻辑回归模型进行训练,得到逻辑回归模型中的参数ω和b。将训练后得到参数ω和b构成的逻辑回归模型作为风控评估模型。
[0063]
所述风控样本特征是根据特征加工rfmp方法,从风控关联样本数据中获取的。
[0064]
在对逻辑回归模型进行训练,得到风控评估模型后,将目标用户的风控关联特征输入风控评估模型,得到目标用户的风控评估结果。
[0065]
本发明实施例提供的风控评估方法,通过rfmp方法,从目标用户的风控关联数据中获取目标用户的风控关联特征,并将获取的风控关联特征输入风控评估模型,得到目标用户的风控评估结果,实现了目标用户的风险评估。与此同时,通过rfmp的方法进行特征提取,可更精确的对目标用户的风险做出判断,从而提高评估结果的准确性。
[0066]
在一个实施例中,还包括:根据预设的权重系数,确定所述rfmp方法中,交易时间间隔、交易次数、交易金额以及交易金额占比的权重。
[0067]
rfmp方法是用于提取特征的,是用于获取数据中交易时间间隔、交易次数、交易金额以及金额占比的相关特征。在确定rfmp方法后,可以根据预设的权重系数,可以确定rfmp方法中交易时间间隔、交易次数、交易金额以及金额占比的权重,从而确定提取的特征占所有特征的权重。
[0068]
可以理解的是,可以根据需要,调整权重系数,从而对输出的结果进行调整,进一步提高调整的灵活性。根据需要,调整权重系数,从而实现对各特征所占比重的调整。
[0069]
本发明实施例提供的风控评估方法,通过预设的权重系数,确定所述rfmp方法中,交易时间间隔、交易次数、交易金额以及交易金额占比的权重,提升了风控关联特征提取的灵活性。
[0070]
在一个实施例中,从目标用户的风控关联数据中获取所述目标用户的风控关联特征之后,还包括:对所述风控关联特征进行筛选;所述对所述风控关联特征进行筛选,包括以下至少一项:根据信息价值iv法,确定各风控关联特征的iv值,并删除所述风控关联特征中iv值小于预设iv值的特征;根据主成分分析法,确定各风控关联特征的相关性,并删除所述风控关联特征中相关性大于预设相关性阈值的特征。
[0071]
iv(information value,信息价值)是用于衡量信息的重要性。通过计算信息的iv值,可以根据信息的重要性对信息进行排名。可以理解的是,信息价值iv值越高,则该特征的重要性就越高。所以,可以根据信息价值iv值进行特征筛选。
[0072]
根据信息价值iv法,确定各风控关联特征的iv值。删除风控关联特征中iv值小于预设iv值的特征。其中,预设iv值是根据特征筛选的需要设定的阈值。
[0073]
主成分分析(principal component analysis,pca),是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。主成分分析是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。
[0074]
根据主成分分析法,确定各风控关联特征之间的相关性,并删除所述风控关联特征中相关性大于预设相关性阈值的特征。其中,预设相关性阈值是根据特征筛选的需要设定的阈值。
[0075]
本发明实施例提供的风控评估方法,通过信息价值iv法以及主成分分析法,对获
取的目标用户的风控关联特征进行筛选,将进一步提升最终风控评估结果的准确性。
[0076]
在一个实施例中,从目标用户的风控关联数据中获取所述目标用户的风控关联特征之前,还包括:根据所述风控关联数据中的数据范围,确定所述风控关联数据中的异常数据,并删除所述异常数据。
[0077]
确定风控关联数据的数据范围。例如,可以设定目标用户的风控关联数据中的用户的年龄范围、交易的数额范围、月交易次数范围以及交易日期范围。根据确定的风控关联数据中的数据范围,可以根据数据范围,确定风控关联数据中的异常数据。在确定异常数据后,对异常数据进行删除。
[0078]
本发明实施例提供的风控评估方法,通过确定的风控关联数据中的数据范围,可以根据数据范围,确定风控关联数据中的异常数据,对获取的目标用户的风控关联数据进行筛选,将进一步提升最终风控评估结果的准确性。
[0079]
在一个实施例中,从目标用户的风控关联数据中获取所述目标用户的风控关联特征之前,还包括:根据风控关联数据中数据的相似度,删除所述风控关联数据中相似度高于预设相似度阈值的数据。
[0080]
对风控关联数据中数据的相似度进行计算,可以确定风控关联数据中的重复的数据。若确定风控关联数据中数据的相似度高于预设相似度阈值,则可以确定该数据为重复数据,对确定的重复数据进行删除。
[0081]
本发明实施例提供的风控评估方法,通过据风控关联数据中数据的相似度,确定风控关联数据中的重复数据,并对重复的数据进行删除,将进一步提升最终风控评估结果的准确性。
[0082]
在一个实施例中,风控关联数据包括用户基本信息数据、交易数据、资产数据、工商司法数据中的一项或多项。
[0083]
目标用户的风控关联数据包括目标用户的基本信息、目标用户的交易数据、目标用户的资产数据以及目标用户的工商司法数据中的一项或多项。其中,目标用户的基本信息包括目标用户的年龄、性别、工作收入、工作性质以及学历等。目标用户的交易数据包括目标用户的购买基金保险的交易数、目标用户消费交易数据等。目标用户的资产数据包括目标用户的账户余额,目标用户账户年资产存入数据等。目标用户的工商司法数据包括用户的行政处罚数据、目标用户的裁判文书数据、目标用户的风险信息等。
[0084]
可以理解的是,目标用户的基本信息、目标用户的交易数据、目标用户的资产数据以及目标用户的工商司法数等风控关联数据,反映的是用户的交易信息以及用户交易过程的信用信息。所以,可以根据目标用户的风控关联数实现对目标用户的风控评估。例如,根据目标用户的风控关联数据,对目标用户的办理业务违约的概率进行确定。
[0085]
本发明实施例提供的风控评估方法,通过确定风控关联数据包括用户基本信息数据、交易数据、资产数据、工商司法数据中的一项或多项,为后续根据风控关联数据提取风控关联特征提供了基础。
[0086]
图2为本发明提供的风控评估装置的结构示意图,如图2所示,该装置包括:
[0087]
特征提取模块210,用于根据特征提取rfmp方法,从目标用户的风控关联数据中获取所述目标用户的风控关联特征;
[0088]
风控评估结果确定模块220,用于将所述风控关联特征输入风控评估模型,得到所
述风控评估模型输出的所述目标用户的风控评估结果;
[0089]
所述风控评估模型是基于风控样本特征对逻辑回归模型进行训练得到的;
[0090]
所述风控样本特征是根据所述rfmp方法,从风控关联样本数据中获取的;
[0091]
所述rfmp方法是基于交易时间间隔、交易次数、交易金额以及交易金额占比确定的。
[0092]
本发明实施例提供的风控评估装置,通过rfmp方法,从目标用户的风控关联数据中获取目标用户的风控关联特征,并将获取的风控关联特征输入风控评估模型,得到目标用户的风控评估结果,实现了目标用户的风险评估。与此同时,通过rfmp的方法进行特征提取,可更精确的对目标用户的风险做出判断,从而提高评估结果的准确性。
[0093]
在一个实施例中,特征提取模块210具体用于:
[0094]
根据预设的权重系数,确定所述rfmp方法中,交易时间间隔、交易次数、交易金额以及交易金额占比的权重。
[0095]
在一个实施例中,特征提取模块210还具体用于:
[0096]
从目标用户的风控关联数据中获取所述目标用户的风控关联特征之后,还包括:
[0097]
对所述风控关联特征进行筛选;
[0098]
所述对所述风控关联特征进行筛选,包括以下至少一项:
[0099]
根据信息价值iv法,确定各风控关联特征的iv值,并删除所述风控关联特征中iv值小于预设iv值的特征;
[0100]
根据主成分分析法,确定各风控关联特征的相关性,并删除所述风控关联特征中相关性大于预设相关性阈值的特征。
[0101]
在一个实施例中,特征提取模块210还具体用于:
[0102]
从目标用户的风控关联数据中获取所述目标用户的风控关联特征之前,还包括:
[0103]
根据所述风控关联数据中的数据范围,确定所述风控关联数据中的异常数据,并删除所述异常数据。
[0104]
在一个实施例中,特征提取模块210还具体用于:
[0105]
从目标用户的风控关联数据中获取所述目标用户的风控关联特征之前,还包括:
[0106]
根据风控关联数据中数据的相似度,删除所述风控关联数据中相似度高于预设相似度阈值的数据。
[0107]
在一个实施例中,特征提取模块210还具体用于:
[0108]
风控关联数据包括用户基本信息数据、交易数据、资产数据、工商司法数据中的一项或多项。
[0109]
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(communications interface)420、存储器(memory)430和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行风控评估方法,该方法包括:
[0110]
根据特征提取rfmp方法,从目标用户的风控关联数据中获取所述目标用户的风控关联特征;
[0111]
将所述风控关联特征输入风控评估模型,得到所述风控评估模型输出的所述目标用户的风控评估结果;
[0112]
所述风控评估模型是基于风控样本特征对逻辑回归模型进行训练得到的;
[0113]
所述风控样本特征是根据所述rfmp方法,从风控关联样本数据中获取的;
[0114]
所述rfmp方法是基于交易时间间隔、交易次数、交易金额以及交易金额占比确定的。
[0115]
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0116]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的风控评估方法,该方法包括:
[0117]
根据特征提取rfmp方法,从目标用户的风控关联数据中获取所述目标用户的风控关联特征;
[0118]
将所述风控关联特征输入风控评估模型,得到所述风控评估模型输出的所述目标用户的风控评估结果;
[0119]
所述风控评估模型是基于风控样本特征对逻辑回归模型进行训练得到的;
[0120]
所述风控样本特征是根据所述rfmp方法,从风控关联样本数据中获取的;
[0121]
所述rfmp方法是基于交易时间间隔、交易次数、交易金额以及交易金额占比确定的。
[0122]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的风控评估方法,该方法包括:
[0123]
根据特征提取rfmp方法,从目标用户的风控关联数据中获取所述目标用户的风控关联特征;
[0124]
将所述风控关联特征输入风控评估模型,得到所述风控评估模型输出的所述目标用户的风控评估结果;
[0125]
所述风控评估模型是基于风控样本特征对逻辑回归模型进行训练得到的;
[0126]
所述风控样本特征是根据所述rfmp方法,从风控关联样本数据中获取的;
[0127]
所述rfmp方法是基于交易时间间隔、交易次数、交易金额以及交易金额占比确定的。
[0128]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0129]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可
借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0130]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1