一种基于多维度实现决策评估的方法与流程

文档序号:24307528发布日期:2021-03-17 01:11阅读:547来源:国知局
一种基于多维度实现决策评估的方法与流程

本发明属于智能决策挖掘技术领域,具体涉及一种基于多维度实现决策评估的方法。



背景技术:

在大数据与人工智能技术飞速发展的时代下,将大数据与智能技术应用于金融领域,能够实现对信贷产品从多维度进行量化,通过将这些智能化的量化指标与业务方向、企业发展阶段、市场规模、客群定位等相结合,从而实现信贷产品的精细化定价。

如图1所示,现有技术中信贷产品的定价技术方案为:

横向流程为模型构建流程:

步骤一:数据采集:对客户的信息数据进行采集;

步骤二:数据加工与整合:将采集到的所有数据进行汇总整理;

步骤三:风控模型训练:对风险数据进行模型训练和参数调优,最终得到训练好的模型文件;

步骤四:模型服务:将得到的模型文件封装成api接口服务;

纵向流程为用户信贷申请定价流程:

步骤五:用户申请授信:在客户申请授信过程中,采集客户的数据信息;

步骤六:授信决策:授信决策引擎对步骤五的数据信息进行匹配整合以及加工,然后调用步骤四生成的api接口服务,得到各类风险评估预测值,再通过决策规则库匹配不同类型的规则确定客户的风险表现,给予个性化的定价。

步骤七:反馈授信结果:将步骤六得到个性化定价反馈给客户,通过前端交互工具进行展示。

现有技术中存在的缺点:

1.企业仅仅从客户风险视角量化信贷收益,不能满足其他的场景和维度,无法对客户做到精细化运营;

2.企业依赖风险视角量化信贷收益,难以从自身业务视角进行定价策略调整。



技术实现要素:

针对现有技术中仅仅从风险视角量化信贷收益,很难做到对客户的精细化运营,并且一些小的金融机构,单从风险视角量化信贷收益,很难从业务视角进行定价策略调整化的问题,本发明提供一种可精细化信贷定价的方法,其目的在于:结合大数据技术与机器学习或深度学习技术,实现对信贷客户的成本、收益相关特征行为进行量化,使得信贷客户的预期收益预估更加准确,实现信贷产品的精细化运营,同时为产品运营提供更多维度的量化指标,提升金融企业应对复杂市场环境的能力。

为了达到上述目的,本发明采用如下技术方案:

一种基于多维度实现决策评估的方法,包括:

步骤a:对客户的风险特征数据和收益特征数据进行采集,并存储至大数据平台中;

步骤b:将步骤a中采集的所有客户数据进行汇总整理,然后进行加工;

步骤c:对加工后的数据进行清洗,同时确认多种目标变量与总量特征,构建不同目标变量对应的模型进行模型训练与参数优化,得到训练好的模型文件;

步骤d:将所述模型文件封装成api接口服务,所述api接口服务的输入为模型所需特征,输出为模型预测的结果;

步骤e:客户在前端交互工具中申请授信时,在服务流程的过程中完成对客户授信所需数据的采集;

步骤f:将步骤e采集的信息进行匹配整合以及加工,加工逻辑与步骤b中的加工逻辑一一对应,然后将加工后的数据通过步骤d生成的api接口服务,得到不同模型对应的输出值,并根据输出值匹配不同类型的决策规则,确定客户的客群划分,得到客户的个性化定价,并计算客户的预期收益;

步骤g:将所述个性化定价通过前端交互工具展示反馈给客户。

进一步的,步骤a中:所述客户的风险特征数据和收益特征数据包括客户的征信数据、第三方数据、交易数据和客户行为数据,所述征信数据和第三方数据来源于外部系统,所述交易数据来源于企业数据,所述客户行为数据基于前端埋点工具采集。

进一步的,步骤b中:将客户相关的所有数据,按照客户唯一id进行匹配对齐,然后对数据进行统计,最后进行基础加工。

进一步的,步骤c包括:

步骤c1:对加工后的数据进行清洗,同时确认不同的目标变量与总量特征,分别将风险特征和收益特征作为不同的目标变量选择,所述数据清洗包括数据去重和坏样本清除工作,所述坏样本为缺失值大于50%的数据;

步骤c2:对连续性特征进行分桶或归一化,计算ig、卡方值进行特征重要性评估,配合统计指标进行特征维度筛选;

步骤c3:将筛选后的全部样本分割成n个折,并选择对应的模型;

步骤c4:通过选择的模型进行模型训练,并进行参数调优,得到训练好的模型文件。

本发明所训练的模型不止一个,而是跟进不同的诉求进行建模。

进一步的,步骤e包括:客户在申请授信的服务流程中,对客户授信所需的数据进行采集,所述数据采集包括:客户录入的基本信息、客户行为数据、根据客户唯一id调用第三方服务匹配的信息和根据客户唯一id匹配企业内部的交易数据。

进一步的,步骤f包括:所述输出值为不同模型对应风险预测值和收益预测值,将得到的预测值集合通过决策规则库进行匹配,确定客户的客群划分;并同时针对客户进行“收益计算”,量化客户的预期收益。

本发明这些预测值本质是用户产生对应行为特征的概率,这些行为特征又与收益、成本等直接挂钩(例如提款概率、复借概率等等),根据行为发生的概率和产生的收益,能够对单客户实现精细化预期收益计算,有效量化每一个客户预期价值。

进一步的,所述风险预测值和收益预测值包括提款率、额度使用率、复借概率、流失概率和提前结清概率,所述“收益计算”具体为:客户预期收益=(权重1*提款率)*(权重2*额度使用率)*额度+(权重3*复借概率)*(权重2*额度使用率)*额度-(权重4*流失概率)*运营成本-(权重5*提前结清概率)*结清额度;所述权重为默认使用预测值的准确率,支持实际应用场景调整。

本发明通过客户提款率、额度使用率、借款周期、复借概率以及提前结清概率、客户流失概率等等与用户信贷收益息息相关的特征行为指标,基于机器学习技术或深度学习技术构建了一套标准化的、可量化对信贷客户收益指标体系,实现了对收益、成本损失、响应度等维度等三个方面的信贷收益评估。

进一步的,所述决策规则库通过专家后台进行配置,将匹配出的规则对应客群中所有客户的预期收益进行累加,反过来对匹配规则的效果进行量化。

采用该优选方案,本发明对匹配规则的效果进行量化,可以从业务角度明确直观的去调整规则。

综上所述,由于采用了上述技术方案,本发明的有益效果是:

一、本发明结合大数据技术与机器学习或深度学习技术,实现对信贷客户的成本、收益相关特征行为进行量化,使得信贷客户的预期收益预估更加准确,实现信贷产品的精细化运营,实现了对收益、成本损失、响应度等维度等三个方面的信贷收益评估。

二、本发明通过累计某个客群划分规则对应客户所有收益预估值,量化客群划分规则,实现对该规则效果的量化估值。

附图说明

图1为本发明的现有技术流程示意图;

图2为本发明一种具体实施方式的客户量化指标体系示意图;

图3为本发明一种具体实施方式的流程示意图。

具体实施方式

本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。

名词解释:

机器学习:机器学习是一种数据分析技术,让计算机执行人和动物与生俱来的活动:从经验中学习。机器学习算法使用计算方法直接从数据中“学习”信息,而不依赖于预定方程模型。当可用于学习的样本数量增加时,这些算法可自适应提高性能。

深度学习:深度学习是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。

特征工程:(featureengineering)它是将原始数据转化成更好的表达问题本质的特征的过程,使得将这些特征运用到预测模型中能提高对不可见数据的模型预测精度。特征工程简单讲就是发现对因变量y有明显影响作用的特征,通常称自变量x为特征,特征工程的目的是发现重要特征。如何能够分解和聚合原始数据,以更好的表达问题的本质,这是做特征工程的目的。

客户违约概率pd:客户风险预警系统在商业银行信用风险管理中,违约概率是指借款人在未来一定时期内不能按合同要求偿还银行贷款本息或履行相关义务的可能性。违约概率是计算贷款预期损失、贷款定价以及信贷组合管理的基础,因此如何准确、有效地计算违约概率对商业银行信用风险管理十分重要。

债项损失率lgd:是指债务人一旦违约将给债权人造成的损失数额,即损失严重程度。从贷款回收的角度看,lgd决定了贷款回收的程度,即lgd=1-回收率。

下面将结合附图及具体实施方式对本发明作进一步的描述。

如图2、图3所示,一种基于多维度实现决策评估的方法,首先构建一套与收益、成本高度相关的单客户量化指标体系,总共可以分为收益、成本损失以及响应度;

收益维度中,包含客户提款率、额度使用率、提款周期预测值以及复借概率,这些单客户的特性行为量化维度都能直接反应企业从该客户那里获取的收益情况。

成本损失维度则反应的可能对企业带来直接损失的单客户特征行为,包括:贷款客户提前结清概率、客户流失概率以及疑似资金运作概率。通过量化这些指标能预测单客所带来的损失。

响应度维度包含自然流量概率、利率敏感度、额度敏感度以及沉睡客户促活概率。这些量化指标可以有效评估营销活动或服务活动,对客户的有效程度,有效程度越高,可产生的业务效果越大。

基于上述构建的收益量化体系,通过机器学习技术或深度学习技术,结合用户行为数据、交易数据以及征信数据,实现对单客户的这些行为特征进行预测,预测值即为对应量化指标。

一种基于多维度实现决策评估的方法,包括:

步骤a:对客户的风险特征数据和收益特征数据进行采集,并存储至大数据平台中;

步骤a中:所述客户的风险特征数据和收益特征数据包括客户的征信数据、第三方数据、交易数据和客户行为数据,所述征信数据和第三方数据来源于外部系统,所述交易数据来源于企业数据,所述客户行为数据基于前端埋点工具采集。

步骤b:将已经采集的所有数据,进行汇总整理,主要包括用户相关所有数据,按照用户唯一id进行匹配对齐;对用户行为数据进行统计加工,与业务主要流程相关的功能页面都统计如下指标:近3日访问次数、最近一周访问次数、最近一个月访问次数、无访问记录天数。最后进行一些基础加工包括:空值、异常值标准化、码值统一转换等等。

步骤c:对加工后的数据进行清洗,同时确认多种目标变量与总量特征,构建不同目标变量对应的模型进行模型训练与参数优化,得到训练好的模型文件;

步骤c具体为:首先对数据进行去重、坏样本(缺失值大于50%)清除等工作,同时确认目标变量与总量特征;然后进行特征工程:通过对连续特征进行分桶或归一化,计算ig、卡方值进行特征重要性评估,配合缺失率等统计指标进行特征维度筛选。接着将全量样本分割成n个折(即通常使用5倍或10倍交叉验证集),并选择模型(可以试验的模型包括gbdt、xgboost、lightgbm、deepfm)然后进行模型训练与参数调优,调优方式视具体模型而定,最终会得到训练好的模型文件。

本发明所训练的模型不止一个,而是跟进不同的诉求进行建模,这些模型主要刻画或共同刻画用户的客户违约概率pd和债项损失率lgd。其中收益模型训练子流程与风控模型训练子流程的建模方式也是一致的,只是在目标变量选择上,不再是风险特征(如用户是否逾期、是否有坏账行为),变成以收益相关的数据作为目标变量(如客户是否提款,是否复借等等)。

步骤d:将所述模型文件封装成api接口服务,api接口服务可以基于java或python语音开发,对外提供api接口,api接口服务的输入为模型所需特征,输出为模型预测的结果。

步骤e:客户申请授信:通过web服务、公众号或小程序、手机app等前端交互工具中,实现客户申请授信的完整流程与相应功能,并通过引流来对客户产生服务,然后在整个服务流程中完成对客户授信所需数据的采集。采集数据包括:用户录入的基本信息、用户行为数据、根据用户唯一id调用第三方服务匹配出的相关信息、根据用户唯一id匹配出企业内部的交易数据等等。

步骤f:将步骤e采集的信息进行匹配整合以及加工,加工逻辑与步骤b中的加工逻辑一一对应,然后将加工后的数据通过步骤d生成的api接口服务,得到不同模型对应的输出值,并根据输出值匹配不同类型的决策规则,确定客户的客群划分,得到客户的个性化定价,并计算客户的预期收益;

步骤f包括:所述输出值为不同模型对应风险预测值和收益预测值,将得到的预测值集合通过决策规则库进行匹配,确定客户的客群划分;并同时针对客户进行“收益计算”,量化客户的预期收益。这些预测值本质是用户产生对应行为特征的概率,这些行为特征又与收益、成本等直接挂钩(例如提款概率、复借概率等等),根据行为发生的概率和产生的收益,我们能够对单客户实现精细化预期收益计算,有效量化每一个客户预期价值。

所述风险预测值和收益预测值包括提款率、额度使用率、提款周期预测值、复借概率、流失概率和提前结清概率,所述“收益计算”具体为:客户预期收益=(权重1*提款率)*(权重2*额度使用率)*额度*(权重3*提款周期预测值*利率)+(权重4*复借概率)*(权重2*额度使用率)*额度*(权重3*提款周期预测值*利率)-(权重5*流失概率)*运营成本-(权重6*提前结清概率)*结清额度;每一个预测值都有一个可调整权重,该权重可以默认使用预测值的准确率,也可在此基础之上根据实际展业情况微调。

同时还可以通过不断丰富类似相关的预测概率,来提升客户预期收益的精准度,例如指标体系图中的“疑似资金运作概率”,疑似资金运作概率是指只在免息期内借款,过了免息期就还款,就是所谓的薅羊毛客户,本质上也是会带来成本损失;于是我们可以通过新增如下公式,计算这部分新增的损失成本。

新增损失成本计算=权重8*疑似资金运作概率*额度*特定活动免息周期*利率

再通过将该计算公式纳入客户预期收益的整体计算从而提升预期精准度。循环这个过程不断丰富成本与收益的计算,是后续持续优化的核心工作。

所述决策规则库是针对多个指标筛选条件的组合,例如(a预测值大于0.7&b预测值在0.2-0.3之间),决策规则库通过专家后台进行配置,将匹配出的规则对应客群中所有客户的预期收益进行累加,反过来对匹配规则的效果进行量化。对匹配规则的效果进行量化,可以从业务角度明确直观的去调整规则。例如:我们有些规则覆盖客群数量很大、客户响应度也较高,但收益量较小,这种规则适合冲量的业务场景,而另一些规则覆盖客群数量一般,但累计收益很大,则可以在月末冲kpi的时候实时触达。由此基于量化的客户价值与量化规则效果,实现灵活化、可量化的定价策略。

步骤g:将所述个性化定价通过前端交互工具展示反馈给客户。

该技术方案结合大数据技术与机器学习或深度学习技术,实现对信贷客户的成本、收益相关特征行为进行量化,使得信贷客户的预期收益预估更加精准,实现信贷产品的精细化运营;同时通过多维度,体系化单客收益量化,实现了精准的信贷客户预期收益计算,基于这些计算结果可以进一步评估客群划分规则(或策略)的价值,实现从业务视角进行可量化、敏捷化的定价策略调整,大大提升了企业对定价策略的丰富性、有效性、可控性,也使得信贷产品具备应对市场负责环境的核心竞争力。

以上仅是本发明众多具体应用范围中的代表性实施方式,对本发明的保护范围不构成任何限制。凡采用变换或是等效替换而形成的技术方案,均落在本发明权利保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1