1.本技术涉及计算机信息处理技术领域,具体涉及一种用于消费贷的商户准入方法、装置及存储介质。
背景技术:2.金融类企业经营管理的很多方面都可以应用大数据技术,例如金融产品研发、客户关系维护、绩效考评、市场营销等,但是在风险管理的应用上还是最为重要的。随着科技信息的发展和数据的海量增长,大量结构化和非结构化的数据信息存在于银行内外部环境中,为风险管理中大数据技术的应用提供了一定的数据基础。
3.在家装消费贷金融场景下,银行与家居商户进行合作,需要家居商户作为渠道进行引流,另一方面针对履约型商户,如家装公司,全屋定制公司等,需要优先对商户进行准入预判,以防止出现批量性跑路及套现风险,导致银行资产出现风险。
4.在家装消费贷场景下的银行对于家居商户的准入中,一般都是通过有权审批人的固有的审批思维在进行分析判断,该类分析判断方式无法进行效果合理性判定,而且根据审批人的不同,分析维度就会存在较大的差异,时效性较低且评估方法大多基于个人经验、非常主观。
技术实现要素:5.本技术实施例的目的在于提供一种用于消费贷的商户准入方法、装置及存储介质,用以解决现有技术中的通过有权审批人的分析判断方式无法进行效果合理性判定,而且根据审批人的不同,分析维度就会存在较大的差异,时效性较低且评估方法大多基于个人经验、非常主观的问题。
6.为实现上述目的,本技术实施例提供一种用于消费贷的商户准入方法,包括步骤:获取影响商户经营稳定性和/或信用的风险点,基于所述风险点获取对应的外部数据,如果所述外部数据超出预设指标,则发出风险提醒;
7.根据所述风险点对应的所述外部数据,结合时间特性进行特征构建,构造出所述风险点对应的目标统计量;
8.根据所述目标统计量对所述商户进行准入审查,并输出具体的风险内容
9.可选地,所述风险点包括:
10.经营风险,所述经营风险对应的所述外部数据包括:工商数据、征信数据、招聘数据和/或银联数据;
11.以及,信用风险,所述信用风险对应的所述外部数据包括:企业诉讼数据和/或法定代表人诉讼数据。
12.可选地,构建所述目标统计量的方法包括:
13.对所述风险点对应的所述外部数据在时间序列上通过滑动窗口,生成多个切片数据,基于不同的所述切片数据构建所述目标统计量,所述目标统计量包括不同切片数据之
间的比值、差值和/或趋势。
14.可选地,结合时间特性进行特征构建之后,还包括:
15.对构建出的统计量进行特征筛选,筛选出目标统计量,特征筛选的方法包括:基于特征重要性和特征相关性进行筛选。
16.可选地,根据金融机构反馈的所述商户的信息结合所述外部数据,对已有样本进行打标,定义出好样本和坏样本,基于所述好样本和坏样本对基于所述目标统计量的准入策略进行验证和评估。
17.可选地,根据内部数据和所述外部数据对基于所述目标统计量的准入策略进行优化,所述内部数据包括所述金融机构反馈的订单信息和/或操作信息。
18.可选地,进行特征构建的方法包括:
19.根据所述风险点,梳理基础指标,结合时间特性,进行特征衍生。
20.为实现上述目的,本技术还提供一种用于消费贷的商户准入装置,包括:存储器;以及
21.与所述存储器连接的处理器,所述处理器被配置成:
22.获取影响商户经营稳定性和/或信用的风险点,基于所述风险点获取对应的外部数据,如果所述外部数据超出预设指标,则发出风险提醒;
23.根据所述风险点对应的所述外部数据,结合时间特性进行特征构建,构造出所述风险点对应的目标统计量;
24.根据所述目标统计量对所述商户进行准入审查,并输出具体的风险内容。
25.可选地,所述处理器还被配置成:构建所述目标统计量的方法包括:
26.对所述风险点对应的所述外部数据在时间序列上通过滑动窗口,生成多个切片数据,基于不同的所述切片数据构建所述目标统计量,所述目标统计量包括不同切片数据之间的比值、差值和/或趋势。
27.为实现上述目的,本技术还提供一种计算机存储介质,其上存储有计算机程序,其中所述计算机程序被机器执行时实现如上所述的方法的步骤。
28.本技术实施例具有如下优点:
29.本技术实施例提供一种用于消费贷的商户准入方法,包括步骤:获取影响商户经营稳定性和/或信用的风险点,基于所述风险点获取对应的外部数据,如果所述外部数据超出预设指标,则发出风险提醒;根据所述风险点对应的所述外部数据,结合时间特性进行特征构建,构造出所述风险点对应的目标统计量;根据所述目标统计量对所述商户进行准入审查,并输出具体的风险内容。
30.通过上述方法,基于外部三方数据,其中包含了专家的主观针对企业的风险经验变量,也包含了通过数据分析得出的“坏”企业的高度相关的风险变量,二种变量相结合最终输出家居商户的风险准入策略结论。从而克服了现有技术中的通过有权审批人的分析判断方式无法进行效果合理性判定,而且根据审批人的不同,分析维度就会存在较大的差异,时效性较低且评估方法大多基于个人经验、非常主观的问题,为后续家居商户的机构准入策略的配设提供科学依据。
附图说明
31.为了更清楚地说明本技术的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
32.图1为本技术实施例提供的一种用于消费贷的商户准入方法的流程图;
33.图2为本技术实施例提供的一种用于消费贷的商户准入方法的特征衍生流程示意图;
34.图3为本技术实施例提供的一种用于消费贷的商户准入方法的特征重要性排序示意图;
35.图4为本技术实施例提供的一种用于消费贷的商户准入方法的方案设计结构图;
36.图5为本技术实施例提供的一种用于消费贷的商户准入方法的模型开发结构图;
37.图6为本技术实施例提供的一种用于消费贷的商户准入装置的模块框图。
具体实施方式
38.以下由特定的具体实施例说明本技术的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本技术的其他优点及功效,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
39.此外,下面所描述的本技术不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
40.本技术一实施例提供一种用于消费贷的商户准入方法,参考图1,图1为本技术的一实施方式中提供的一种用于消费贷的商户准入方法的流程图,应当理解的是,该方法还可以包括未示出的附加框和/或可以省略所示出的框,本技术的范围在此方面不受限制。
41.在步骤101处,获取影响商户经营稳定性和/或信用的风险点,基于所述风险点获取对应的外部数据,如果所述外部数据超出预设指标,则发出风险提醒。
42.具体地,该步骤又称为变量抽取,收集围绕家装消费贷场景下家居商户(企业)的经营稳定性及欺诈性相关风险点,如经营风险,信用风险等,再根据机构的各风险点及其相关性能够合理运用的外部数据信息,如企业端:银联数据-企业刷卡信息、人行企业征信数据、工商、法院及舆情等数据,法人自然人端:法院,多头,公安不良等数据。
43.在一些实施例中,所述风险点包括:经营风险,所述经营风险对应的所述外部数据包括:工商数据、征信数据、招聘数据和/或银联数据;以及,信用风险,所述信用风险对应的所述外部数据包括:企业诉讼数据和/或法定代表人诉讼数据。
44.具体地,经营风险包括:
45.1)工商数据,企业具体指标为:企业经营状态命中非“存续”“在业”等正常状态,则发出风险提醒;企业命中严重税务违规,严重工商违规等违规行为,则发出风险提醒;企业三个月内出现法人变更大于2次,股东变更大于2次,名称变更大于1次的,则发出风险提醒;分公司注销比例大于80%,则发出风险提醒;对外投资公司的注销率比例>80%,则发出风险提醒;近1个月负面舆情增长率同比大于100%(负面舆情数量>3),则发出风险提醒;自
然人法人具体指标为:法人关联企业中命中高风险提示的占比>50%,则发出风险提醒;法人关联企业中命中警示信息大于10条的占比>50%,则发出风险提醒;法人关联企业中经营状态为存续/开业的数量占比<20%,则发出风险提醒;
46.2)征信数据,具体指标为:企业所有的借款五级分类中出现“关注”,“次级”,“可疑”,“损失”的,则发出风险提醒;企业的借款状态中“逾期”的,则发出风险提醒;近6个月的查询金融机构数量增长>50%,则发出风险提醒;
47.3)招聘数据,具体指标为:近3个月发布招聘人员的总数同比下降比例>100%,则发出风险提醒;近3个月发布招聘岗位的数量同比下降<50%,则发出风险提醒;近6个月招聘岗位无需工作年限的岗位数量环比增加>100%,则发出风险提醒;
48.4)银联数据,具体指标为:近30天的交易笔数同比下降>50%,则发出风险提醒;近60天的交易笔数环比下降>30%,则发出风险提醒;近30天的交易金额同比下降>100%,则发出风险提醒;近30天的疑似套现的交易笔数>3笔,则发出风险提醒;近30天的疑似套现的交易总金额>50万元,则发出风险提醒。
49.信用风险包括:
50.1)企业诉讼,具体指标为:近30日新增的被执行信息/失信信息/限高信息,则发出风险提醒;近30天内的劳务纠纷被告次数增加3笔以上,则发出风险提醒;近90天内的金融案件纠纷为被告的数量>3笔,则发出风险提醒;
51.2)自然人法人诉讼,具体指标为:近30日新增的被执行信息/失信信息/限高信息,则发出风险提醒;近30日存在新增金融案件被告纠纷,则发出风险提醒;近30天内命中公安不良(在逃,贩毒,吸毒,有前科),则发出风险提醒;近30天内命中刑事案件,则发出风险提醒。
52.在步骤102处,根据所述风险点对应的所述外部数据,结合时间特性进行特征构建,构造出所述风险点对应的目标统计量。
53.在一些实施例中,构建所述目标统计量的方法包括:对所述风险点对应的所述外部数据在时间序列上通过滑动窗口,生成多个切片数据,基于不同的所述切片数据构建所述目标统计量,所述目标统计量包括不同切片数据之间的比值、差值和/或趋势。
54.具体地,基于业务专家经验,影响家居商户准入风险的主要维度有:经营风险、信用风险等。根据这些维度,梳理基础指标,并结合时间特性,基于均值、方差、比值等统计量进行特征衍生,具体的特征衍生方案参考图2。构造出某日前一月平均值、后一月平均值、前一月均值与后一月均值的比值、差值、趋势等统计量,共计2000+维特征。
55.在一些实施例中,结合时间特性进行特征构建之后,还包括:
56.对构建出的统计量进行特征筛选,筛选出目标统计量,特征筛选的方法包括:基于特征重要性和特征相关性进行筛选。
57.具体地,根据特征筛选条件,iv≥0.02,corr=0.7,经过筛选后并对类别型变量进行独热编码,粗筛2000个特征变量进入模型开发,接着使用随机森林进行特征重要性排序,部门指标的重要性排序样例见图3。
58.在一些实施例中,还包括:根据金融机构反馈的所述商户的信息结合所述外部数据,对已有样本进行打标,定义出好样本和坏样本,基于所述好样本和坏样本对基于所述目标统计量的准入策略进行验证和评估。
59.具体地,此步骤又称为样本打标及增强,根据行方(金融机构)反馈的家居商户情况并结合外部数据,对已有样本进行打标,定义出“好”“坏”样本,“坏”样本的定义为:1.行方(金融机构)黑名单的家居商户,2.外部数据中工商信息中经营状态为非正常状态的,如“清算”“简易注销”,3.诉讼信息中存在被执行,法院限高等,其他的为“好”样本。如果样本较少,那需要对样本进行上采样,即样本增强。可以在样本的时间序列上通过滑动窗口,生成多个切片数据,不同切片数据相当于对原单个样本进行复制或增强。
60.组合策略变量集合进行模型的验证和评估工作。使模型的效果在验证数据中能命中50%的高风险合作机构。
61.在步骤103处,根据所述目标统计量对所述商户进行准入审查,并输出具体的风险内容。
62.具体地,模型上线后,根据外部大数据信息针对行内准备合作的家居商户进行准入审查,得出相关的模型监测结果,辅助行方对于家居合作商户进行风险管控。
63.在一些实施例中,还包括:根据内部数据和所述外部数据对基于所述目标统计量的准入策略进行优化,所述内部数据包括所述金融机构反馈的订单信息和/或操作信息。
64.具体地,可根据6个月左右的家居商户表现,可以进行准入策略的优化工作,主要是基于内外部的数据积累来完成,内部数据包含但不限于订单信息,操作信息,外部数据包含但不限于工商数据,银联数据,法院数据等。
65.综上所述,参考图4及图5,本技术实现的技术方案是:一、变量抽取,收集围绕家装消费贷场景下家居商户(企业)的经营稳定性及欺诈性相关风险点,如经营风险,信用风险等,再根据机构的各风险点及其相关性能够合理运用的外部数据信息,如企业端:银联数据-企业刷卡信息、人行企业征信数据、工商、法院及舆情等数据,法人自然人端:法院,多头,公安不良等数据;二、样本定义,定义出“好”“坏”样本,进行样本分层;三、特征构建,总结归纳出所有数据属性下的相关特征及变量数据,包含数据源内的数据清洗及数据集划分,且继续衍生变量和组合变量的相关性分析工作;四、特征筛选,特征筛选包括基于特征重要性筛选和基于特征相关性筛选;五、组合策略变量集合进行模型的验证和评估工作;六、行方系统内配设家居商户准入模型,在家居商户准入时进行模型跑批,并提示出具体的风险内容,有助于审批人员更有针对性地排查机构风险;七、根据家居商户后续合作留存的内外部数据进行准入策略优化,内部数据包含但不限于订单信息,操作信息,外部数据包含但不限于工商数据,银联数据,法院数据等。
66.通过上述方法,基于外部三方数据,其中包含了专家的主观针对企业的风险经验变量,也包含了通过数据分析得出的“坏”企业的高度相关的风险变量,二种变量相结合最终输出家居商户的风险准入策略结论。从而克服了现有技术中的通过有权审批人的分析判断方式无法进行效果合理性判定,而且根据审批人的不同,分析维度就会存在较大的差异,时效性较低且评估方法大多基于个人经验、非常主观的问题,为后续家居商户的机构准入策略的配设提供科学依据。
67.图6为本技术实施例提供的一种用于消费贷的商户准入装置的模块框图。该装置包括:
68.存储器201;以及与所述存储器201连接的处理器202,所述处理器202被配置成:获取影响商户经营稳定性和/或信用的风险点,基于所述风险点获取对应的外部数据,如果所
述外部数据超出预设指标,则发出风险提醒;
69.根据所述风险点对应的所述外部数据,结合时间特性进行特征构建,构造出所述风险点对应的目标统计量;
70.根据所述目标统计量对所述商户进行准入审查,并输出具体的风险内容。
71.在一些实施例中,所述处理器202还被配置成:所述风险点包括:
72.经营风险,所述经营风险对应的所述外部数据包括:工商数据、征信数据、招聘数据和/或银联数据;
73.以及,信用风险,所述信用风险对应的所述外部数据包括:企业诉讼数据和/或法定代表人诉讼数据。
74.在一些实施例中,所述处理器202还被配置成:构建所述目标统计量的方法包括:
75.对所述风险点对应的所述外部数据在时间序列上通过滑动窗口,生成多个切片数据,基于不同的所述切片数据构建所述目标统计量,所述目标统计量包括不同切片数据之间的比值、差值和/或趋势。
76.在一些实施例中,所述处理器202还被配置成:结合时间特性进行特征构建之后,还包括:
77.对构建出的统计量进行特征筛选,筛选出目标统计量,特征筛选的方法包括:基于特征重要性和特征相关性进行筛选。
78.在一些实施例中,所述处理器202还被配置成:还包括:
79.根据金融机构反馈的所述商户的信息结合所述外部数据,对已有样本进行打标,定义出好样本和坏样本,基于所述好样本和坏样本对基于所述目标统计量的准入策略进行验证和评估。
80.在一些实施例中,所述处理器202还被配置成:还包括:
81.根据内部数据和所述外部数据对基于所述目标统计量的准入策略进行优化,所述内部数据包括所述金融机构反馈的订单信息和/或操作信息。
82.在一些实施例中,所述处理器202还被配置成:进行特征构建的方法包括:
83.根据所述风险点,梳理基础指标,结合时间特性,进行特征衍生。
84.具体实现方法参考前述方法实施例,此处不再赘述。
85.本技术可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本技术的各个方面的计算机可读程序指令。
86.计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
87.这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
88.用于执行本技术操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本技术的各个方面。
89.这里参照根据本技术实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本技术的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
90.这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其他可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
91.也可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其他可编程数据处理装置、或其他设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
92.附图中的流程图和框图显示了根据本技术的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动
作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
93.注意,除非另有直接说明,否则本说明书(包含任何所附权利要求、摘要和附图)中所揭示的所有特征皆可由用于达到相同、等效或类似目的的可替代特征来替换。因此,除非另有明确说明,否则所公开的每一个特征仅是一组等效或类似特征的一个示例。在使用到的情况下,进一步地、较优地、更进一步地和更优地是在前述实施例基础上进行另一实施例阐述的简单起头,该进一步地、较优地、更进一步地或更优地后带的内容与前述实施例的结合作为另一实施例的完整构成。在同一实施例后带的若干个进一步地、较优地、更进一步地或更优地设置之间可任意组合的组成又一实施例。
94.虽然,上文中已经用一般性说明及具体实施例对本技术作了详尽的描述,但在本技术基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本技术精神的基础上所做的这些修改或改进,均属于本技术要求保护的范围。