自动化授信方法、装置、设备、介质和程序产品与流程

文档序号:30524285发布日期:2022-06-25 06:12阅读:168来源:国知局
自动化授信方法、装置、设备、介质和程序产品与流程

1.本发明涉及人工智能技术领域,尤其涉及一种自动化授信方法、装置、设备、介质和程序产品。


背景技术:

2.目前在授信审批风险监测环节,通常采用两种方法。一种方法是简单的设置行业准入或客户准入财务指标的刚性要求。该方法存在的问题是,仅能输出是否异常,以进行预警,但由于信息量较少,无法有效评估授信过程中财务相关的风险,从而无法辅助判断审批是否通过。另一种方法是通过人为主观的方式,加权构建财务数据的评分体系。很显然,这种方法具有较强的主观性。综上所述,现有的授信审批方法存在财务指标的评估信息量少、主观性强的问题。


技术实现要素:

3.本发明提供了一种自动化授信方法、装置、设备、介质和程序产品,以丰富财务指标的评估信息量、提升授信审批的客观性。
4.根据本发明的一方面,提供了一种自动化授信方法,包括:
5.获取财务数据,所述财务数据包括多个样本的财务报表数据和审批文本数据;
6.将所述财务报表数据和所述审批文本数据输入第一分类模型,得到对授信审批有贡献的特征数据;
7.根据所述对授信审批有贡献的特征数据,将所述样本中对应的特征数据输入第二分类模型,得到预测审批决策。
8.可选地,所述对授信审批有贡献的特征数据的获取方法具体包括:
9.对所述财务报表数据中的财务信息进行分类,构造多种财务特征;
10.对所述审批文本数据进行分析并提取评价信息,构造多个第一黑标签和多个第一白标签;所述第一黑标签或所述第一白标签与一个所述财务特征对应;
11.所述第一分类模型根据所述财务特征、所述第一黑标签和所述第一白标签计算所述财务特征的重要性排名,得到所述对授信审批有贡献的特征数据。
12.可选地,所述财务特征包括:反应财务欺诈的特征、反应企业财务数据质量评分的特征、反应偿债的特征、反应盈利的特征、反应营运的特征、反应成长的特征、反应现金流量能力的特征和计量利润操控水平的盈余管理指标特征中的至少一种。
13.可选地,所述财务特征的构造方法具体包括:
14.对所述财务报表数据建立评分规则,滤除评分低于阈值的数据,并对剩余的数据进行完善;
15.基于金融审批业务的角度,对所述财务报表数据中的初始财务特征进行重新认定、筛选、解释和分析,并衍生反应企业状况的中间财务特征;
16.对所述初始财务特征和所述中间财务特征按照财务功能进行归并,得到所述财务
特征。
17.可选地,在建立所述评分规则之前,还包括:
18.验证所述财务报表数据的真实性、完整性和勾稽关系;
19.根据验证结果甄别所述财务报表数据的财务信息质量。
20.可选地,完善数据的方式包括:数据清洗、缺失值填补、异常值处理、特征分箱、特征重要性检验和特征相关性处理中的至少一种。
21.可选地,所述第一分类模型包括xgboost分类模型。
22.可选地,所述第二分类模型包括机器学习分类模型。
23.可选地,所述机器学习分类模型的获取方法具体包括:
24.提取所述多个样本的对授信审批有贡献的特征数据;
25.若所述样本的审批结论为续议或否决,则将所述样本打标为第二黑标签,对应的样本为黑样本;若所述样本的审批结论为通过,则将所述样本打标为第二白标签,对应的样本为白样本;
26.按照所述黑样本的数量和所述白样本的数量为第一预设比例的规则,构建训练集和测试集;
27.根据所述训练集和所述测试集训练所述机器学习分类模型。
28.可选地,所述训练集和所述测试集的构建方法具体包括:
29.根据所述第一预设比例,判断所述黑样本的数量和所述白样本的数量是否平衡;若是,则从所述样本中抽取对应数量的黑样本和白样本;
30.否则,所述黑样本为全量选择,根据所述第一预设比例抽取相应数量的所述白样本;以相同的规则构建多个数据集;
31.将所述数据集按第二预设比例分为训练集和测试集。
32.可选地,所述根据所述训练集和所述测试集训练所述机器学习分类模型,包括:
33.将所述训练集输入模型池,得到模型池输出结果;
34.将所述模型池输出结果输入神经网络,得到待评价机器学习分类模型;
35.将所述测试集输入所述待评价机器学习分类模型,以进行模型评价和后续调优。
36.可选地,在得到对授信审批有贡献的特征数据之后,还包括:
37.生成财务体检表并输出,所述财务体检表包括所述对授信审批有贡献的特征数据类型和数值范围。
38.根据本发明的另一方面,提供了一种授信审批装置,包括:
39.数据获取模块,用于获取财务数据,所述财务数据包括多个样本的财务报表数据和审批文本数据;
40.第一评价模块,用于将所述财务报表数据和所述审批文本数据输入第一分类模型,得到对授信审批有贡献的特征数据;
41.第二评价模块,用于根据所述对授信审批有贡献的特征数据,将所述样本中对应的特征数据输入第二分类模型,得到预测审批决策。
42.根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
43.至少一个处理器;以及
44.与所述至少一个处理器通信连接的存储器;其中,
45.所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的自动化授信方法。
46.根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的自动化授信方法。
47.根据本发明的另一方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序在被处理器执行时实现本发明任一实施例所述的自动化授信方法。
48.本发明实施例以财务数据为主体,通过引入第一分类模型和第二分类模型的方式,主动学习审批人员对相关风险审批判断,训练出较好的拟合模型后,再对审批结果进行预测。其中,第一分类模型输出对授信审批有贡献的特征数据,能够丰富财务指标的评估信息量;采用第二分类模型对审批决策进行预测,能够提升收信审批的客观性。因此,本发明实施例能够帮助审批人员更全面了解企业的财务状况,且审批结果更加客观。
49.应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
50.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
51.图1为本发明实施例提供的一种自动化授信方法的流程示意图;
52.图2为本发明实施例提供的另一种自动化授信方法的流程示意图;
53.图3为本发明实施例提供的一种第一阶段的执行步骤示意图;
54.图4为本发明实施例提供的一种财务特征的构造方法的示意图;
55.图5为本发明实施例提供的一种第二阶段的执行步骤示意图;
56.图6为本发明实施例提供的一种机器学习分类模型训练的示意图;
57.图7为本发明实施例提供的一种授信审批装置的结构示意图;
58.图8为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
59.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
60.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用
的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
61.需要说明的是,在本发明实施例中,所涉及的财务数据的获取、存储和/或处理时,符合国家法律法规的相关规定,且不违背公序良俗。
62.本发明实施例提供了一种自动化授信方法,该方法适用于授信授信审批风险监测环节,通过构建分类特征、采用第一分类模型和第二分类模型以辅助相关人员有效评估授信过程中财务相关的风险。该方法可以由授信审批装置执行,该装置可以集成于电脑、手机、平板电脑等电子设备中,该装置可以由软件和/或硬件执行。
63.图1为本发明实施例提供的一种自动化授信方法的流程示意图。参见图1,该自动化授信方法包括以下步骤:
64.s110、获取财务数据,财务数据包括多个样本的财务报表数据和审批文本数据。
65.其中,获取的财务数据可以是原始财务数据,也可以是经过处理的财务数据。若获取到的是原始财务数据,还需要对财务数据进行预处理。示例性地,原始财务数据包括:额度授信审批的审批意见和审批结论数据、审批业务的企业近三年的财务报表数据、企业的行业信息和企业的工商信息等数据。数据预处理的规则可以包括:币种为人民币;财报企业类型为企业,非集团;财报类型为年报;财报截止日期范围为20xx-xx-xx至20yy-yy-yy,根据客户号与财报截止日期,考虑更新状态与审计情况取最新;从原始财务数据中取出所有财务报表字段,并对其进缺失率计算,若缺失率超过80%则删除该字段;为了避免极端值对模型影响,对每个字段进行1%和99%百分位数的缩尾处理,即计算出该字段的1%和99%分位数后,小于1%分位数的用1%分位数替换,大于99%分位数的,用99%分位数替换。
66.s120、将财务报表数据和审批文本数据输入第一分类模型,得到对授信审批有贡献的特征数据。
67.其中,财务报表数据可用于形成财务特征,审批文本数据可用于对财务特征打标,标记为第一黑标签或第一白标签。可选地,第一分类模型包括xgboost分类模型。xgboost的全称是extreme gradient boosting,其经过优化的分布式梯度提升库,旨在高效、灵活且可移植。xgboost既能解决分类问题,也能解决回归问题。示例性地,在进行xgboost分类模型构建时,可以按黑白样本比为1:10抽取数据。训练集20xx-20yy年,测试集20zz年。
68.具体地,xgboost有三种计算特征重要性的方法:weight、gain和cover。weight:在所有树中特征用来分割的节点个数总和;gain:特征用于分割的平均增益;cover:可以理解为被分到该节点的样本的二阶导数之和,而特征度量的标准就是平均的coverage值。示例性地,通过分析三种方法计算出的特征重要性排名,结合业务相关知识,选择合适的一种方法,输出特征的重要性排名。
69.s130、根据对授信审批有贡献的特征数据,将所述样本中对应的特征数据输入第二分类模型,得到预测审批决策。
70.其中,对授信审批有贡献的特征数据是通过第一分类模块提取到的特征,例如,贡献度排名前30(top30)的财务特征。且还可以对每个样本进行打标,标记为第二黑标签或第
二白标签,以进行黑白样本的区分,从而训练第二分类模型。可选地,第二分类模型包括机器学习分类模型。将待审批的财务数据输入至第二分类模型,可以得到预测审批决策,以供相关审批人员进行参考。
71.综上所述,本发明实施例以财务数据为主体,通过引入第一分类模型和第二分类模型的方式,主动学习审批人员对相关风险审批判断,训练出较好的拟合模型后,再对审批结果进行预测。其中,第一分类模型输出对授信审批有贡献的特征数据,能够丰富财务指标的评估信息量;采用第二分类模型对审批决策进行预测,能够提升收信审批的客观性。因此,本发明实施例能够帮助审批人员更全面了解企业的财务状况,且审批结果更加客观。
72.图2为本发明实施例提供的另一种自动化授信方法的流程示意图。参见图2,在上述各实施例的基础上,可选地,在s120之后,还包括:
73.s121、生成财务体检表并输出,财务体检表包括对授信审批有贡献的特征数据类型和数值范围。
74.其中,将财务体检表输出是指,构建应用程序,输出给显示器、打印机等显示设备,将财务体检表实现可视化,从而让审批人员能够看到由第一分类模型输出的对授信审批有贡献的特征数据类型和数值范围。这样设置能够提示审批人员对相关的特征数据进行重点关注,从而帮助审批人员进行决策。
75.由上述实施例可以看出,本发明实施例提供的自动化授信方法包括两个阶段,第一阶段根据第一分类模型获取对授信审批有贡献的特征数据,并输出财务体检表。第二阶段根据第一阶段提取的对授信审批有贡献的特征数据,构建第二分类模型达到对后续审批是否通过的预测。下面对第一阶段和第二阶段的执行步骤进行具体说明。
76.图3为本发明实施例提供的一种第一阶段的执行步骤示意图。参见图3,在本发明的一种实施方式中,可选地,第一阶段的执行步骤包括:
77.s210、获取原始财务数据。
78.其中,该步骤可以与前述实施例中的s110合并。
79.s220、数据预处理。
80.其中,该步骤可以与前述实施例中的s110合并,也可以单独执行。若s110中已经进行了数据预处理,则该步骤与s110和并;若s110中未进行数据预处理,则该步骤单独执行。示例性地,数据预处理的规则可以包括:币种为人民币;财报企业类型为企业,非集团;财报类型为年报;财报截止日期范围为20xx-xx-xx至20yy-yy-yy,根据客户号与财报截止日期,考虑更新状态与审计情况取最新;从原始财务数据中取出所有财务报表字段,并对其进缺失率计算,若缺失率超过80%则删除该字段;为了避免极端值对模型影响,对每个字段进行1%和99%百分位数的缩尾处理,即计算出该字段的1%和99%分位数后,小于1%分位数的用1%分位数替换,大于99%分位数的,用99%分位数替换。
81.s230、对财务报表数据中的财务信息进行分类,构造多种财务特征。
82.其中,财务报表数据中包括不同种类的财务信息,但是这些财务信息的分类往往不符合授信审批需求。因此,需要对已有特征按照其功能进行归并,明确每个特征反映的是企业哪个方面的能力或行为。示例性地,财务特征包括:反应财务欺诈的特征、反应企业财务数据质量评分的特征、反应偿债的特征、反应盈利的特征、反应营运的特征、反应成长的特征、反应现金流量能力的特征和计量利润操控水平的盈余管理指标特征中的至少一种。
83.s240、获取授信审批批复意见。
84.其中,授信审批批复意见为审批文本数据中的内容,属于文本数据。
85.s250、分析并提取评价信息。
86.其中,由于授信审批批复意见属于文本数据,因此,需要对文本数据进行分析并提取评价信息,以进行后续黑白标签的构造。
87.s260、构造黑白标签。
88.其中,根据提取的评价信息构造黑白标签,提取的评价信息包括不同特征的评价信息,例如,体现资产负债率过高、资不抵债和主营业务盈利能力差等评价信息的财务特征打标为第一黑标签;不存在资产负债率过高、资不抵债和主营业务盈利能力差等评价信息的财务特征打标为第一白标签。即第一黑标签或第一白标签与一个财务特征对应。
89.s270、将财务特征、第一黑标签和第一白标签输入第一分类模型。
90.其中,第一分类模型为xgboost分类模型。xgboost分类模型经过优化的分布式梯度提升库,旨在高效、灵活且可移植。xgboost既能解决分类问题,也能解决回归问题。具体地,xgboost有三种计算特征重要性的方法:weight、gain和cover。weight:在所有树中特征用来分割的节点个数总和;gain:特征用于分割的平均增益;cover:可以理解为被分到该节点的样本的二阶导数之和,而特征度量的标准就是平均的coverage值。示例性地,通过分析三种方法计算出的特征重要性排名,结合业务相关知识,选择合适的一种方法,以输出特征的重要性排名。
91.s280、输出特征的重要性排名。
92.示例性地,输出贡献度top30的财务特征。
93.s290、输出财务体检表。
94.其中,将财务体检表输出是指,构建应用程序,输出给显示器、打印机等显示设备,将财务体检表实现可视化,从而让审批人员能够看到由第一分类模型输出的对授信审批有贡献的特征数据类型和数值范围。这样设置能够提示审批人员对相关的特征数据进行重点关注,从而帮助审批人员进行决策。
95.示例性地,基于s280输出的贡献度top30的财务特征,计算每个财务特征的合理区间,形成企业的财务体检表。财务指标有的越大越好,称为正向指标;有的越小越好,称为负向指标。合理区间的范围取值方法如下:从白样本中,计算各指标的99%分位数(d1)、1%分位数(d2),均值+3倍标准差的值(d3),均值-3倍标准差的值(d4),正向指标:上界为min(d1,d3),下界为max(d2,d4)。负向指标:上界为min(d2,d4),下界为max(d1,d3)。
96.通过s210-s290实现了第一阶段的执行步骤。第一阶段主要通过构建财务特征和财务问题的黑白标签,来提取审批人员关注的财务特征;并基于这些特征构建应用以辅助财务状况分析,输出财务体检表。这样设置,对于需要通过授信审批的企业而言,可以通过关注财务体检表合理进行财务分配;对于需要审核授信审批的审批人员而言,可以通过关注财务体检表进行审批参考。
97.在上述各实施例的基础上,可选地,财务特征的构造方法具体包括:对财务报表数据建立评分规则,滤除评分低于阈值的数据,并对剩余的数据进行完善。基于金融审批业务的角度,对财务报表数据中的初始财务特征进行重新认定、筛选、解释和分析,并衍生反应企业状况的中间财务特征。对初始财务特征和中间财务特征按照财务功能进行归并,得到
财务特征。具体地,图4为本发明实施例提供的一种财务特征的构造方法的示意图。参见图4,财务特征的构造方法具体包括:
98.s211、数据验证。
99.其中,数据验证包括验证财务报表数据的真实性、完整性和勾稽关系。
100.s212、企业财务数据质量评分。
101.其中,根据验证结果对财务报表数据建立评分规则,从而对企业财务数据质量评分,以甄别财务报表数据的财务信息质量。
102.s213、完善数据。
103.其中,完善数据是指滤除评分低于阈值的数据,并对剩余的数据进行完善。示例性地,完善数据的方式包括:数据清洗、缺失值填补、异常值处理、特征分箱、特征重要性检验和特征相关性处理中的至少一种。
104.s214、特征衍生和业务解释。
105.其中,特征衍生和业务解释是指,基于金融审批业务的角度,对财务报表数据中的初始财务特征进行重新认定、筛选、解释和分析,并衍生反应企业状况的中间财务特征。
106.s215、特征归并。
107.其中,特征归并是指,对初始财务特征和中间财务特征按照财务功能进行归并,得到财务特征。这些财务特征应当是能够进行企业能力体系设定的特征。具体地,经特征归并后的财务特征能够明确每个特征反映的是企业哪个方面的能力或行为。主要分为反应企业偿债、盈利、营运、现金流量能力等的字段特征,以及反应企业利润操控水平的盈余管理指标(因为授信审批过程中,有两个方面的信息需要重点考虑,一是待审批企业的财务数据质量,二是在财务数据质量一定水平下,企业对利润主观调控行为的程度,前者代表财务信息的完整性,后者代表财务信息的客观公允性)。特征划分为反应财务欺诈、企业财务数据质量评分、偿债、盈利、营运、成长、现金流量能力和计量利润操控水平的盈余管理指标等,一共8个维度。
108.通过s211-s215完成了财务特征的构建,通过对财务数据进行分析提取而构建的财务特征能够明确每个特征反映的是企业哪个方面的能力或行为,自动化程度高,无需财务人员进行手动分类,具有准确性高、效率高的特点。
109.图5为本发明实施例提供的一种第二阶段的执行步骤示意图。参见图5,在本发明的一种实施方式中,可选地,机器学习分类模型的获取方法具体包括:
110.s310、提取多个样本的对授信审批有贡献的特征数据。
111.示例性地,提取贡献度top30的财务特征,这些财务特征为第一阶段获取到的特征。
112.s320、对样本进行打标。
113.其中,若样本的审批结论为续议或否决,则将样本打标为第二黑标签,对应的样本为黑样本;若样本的审批结论为通过,则将样本打标为第二白标签,对应的样本为白样本。与第一阶段的第一黑白标签针对的是财务特征不同,第二黑白标签针对的是样本。
114.s330、输入机器学习分类模型。
115.其中,按照黑样本的数量和白样本的数量为第一预设比例的规则,构建训练集和测试集,并根据训练集和测试集训练机器学习分类模型。
116.s340、输出审批结果预测。
117.其中,在进行机器学习分类模型的过程中,输入量为财务特征和样本黑白标签,输出量为审批结果。根据已有的训练集,可以进行机器学习分类模型的构建。在机器学习分类模型构建完成后,将待审批的财务数据输入该机器学习分类模型,可以得到该待审批的财务数据的审批结果预测。
118.通过s310-s340,完成了机器学习分类模型的构建。
119.图6为本发明实施例提供的一种机器学习分类模型训练的示意图。参见图6,在上述各实施例的基础上,可选地,训练集和测试集的构建方法具体包括:
120.s331、构建数据集。
121.其中,数据集的构建根据第一预设比例,判断黑样本的数量和白样本的数量是否平衡;若是,则从样本中抽取对应数量的黑样本和白样本;否则,黑样本为全量选择,根据第一预设比例抽取相应数量的白样本;以相同的规则构建多个数据集。示例性地,第一预设比例为1、3、5、10等值。以黑白样本不平衡的情况下,构建5个数据集为例,数据集1中黑样本为全量选择,白样本按照黑样本的5倍进行抽样;数据集2中黑样本为全量选择,白样本按照黑样本的5倍进行抽样;
……
;数据集5中黑样本为全量选择,白样本按照黑样本的5倍进行抽样。
122.s332、构建训练集和测试集。
123.其中,训练集和测试集以数据集为依据获取,将数据集按第二预设比例分为训练集和测试集。示例性地,第二预设比例为7:3等比例。具体地,数据集1中的70%为训练集,30%为测试集;数据集2中的70%为训练集,30%为测试集;
……
;数据集5中的70%为训练集,30%为测试集。
124.根据训练集和测试集训练机器学习分类模型,包括:
125.s341、输入模型池。
126.具体地,将训练集输入模型池,得到模型池输出结果。示例性地,模型池可以包括:逻辑回归模型、随机森林模型、gbdt模型和xgboost模型等。若模型池包括上述四种模型,训练出20(5*4)预测结果,然后统一模型内部,预测结果取均值。
127.s342、输入神经网络。
128.具体地,将模型池输出结果输入神经网络,得到待评价机器学习分类模型。若模型池包括上述四种模型,将结果取均值输入神经网络,每类模型(逻辑回归模型、随机森林模型、gbdt模型和xgboost模型)计算出四个模型权重。
129.s343、模型评价。
130.具体地,将测试集输入待评价机器学习分类模型,以进行模型评价和后续调优。示例性地,用测试集数据对复合模型进行测试,并主要用查准(precision)和查全率(recall)以及auc值对模型评价,并后续调优。
131.通过s331-s343完成了机器学习分类模型的构建。
132.综上所述,本发明实施例以财务数据为主体,通过引入第一分类模型和第二分类模型的方式,主动学习审批人员对相关风险审批判断,训练出较好的拟合模型后,再对审批结果进行预测。其中,第一分类模型输出对授信审批有贡献的特征数据,能够丰富财务指标的评估信息量;采用第二分类模型对审批决策进行预测,能够提升收信审批的客观性。因
此,本发明实施例能够帮助审批人员更全面了解企业的财务状况,且审批结果更加客观。
133.本发明实施例还提供了一种授信审批装置。图7为本发明实施例提供的一种授信审批装置的结构示意图。参见图7,该授信审批装置包括:
134.数据获取模块410,用于获取财务数据,财务数据包括多个样本的财务报表数据和审批文本数据;
135.第一评价模块420,用于将财务报表数据和审批文本数据输入第一分类模型,得到对授信审批有贡献的特征数据;
136.第二评价模块430,用于根据对授信审批有贡献的特征数据,将样本中对应的特征数据输入第二分类模型,得到预测审批决策。
137.可选地,第一评价模块具体包括:
138.特征构造单元,用于对财务报表数据中的财务信息进行分类,构造多种财务特征;
139.第一打标单元,用于对审批文本数据进行分析并提取评价信息,构造多个第一黑标签和多个第一白标签;第一黑标签或第一白标签与一个财务特征对应;
140.贡献特征筛选单元,用于第一分类模型根据财务特征、第一黑标签和第一白标签计算财务特征的重要性排名,得到对授信审批有贡献的特征数据。
141.可选地,财务特征包括:反应财务欺诈的特征、反应企业财务数据质量评分的特征、反应偿债的特征、反应盈利的特征、反应营运的特征、反应成长的特征、反应现金流量能力的特征和计量利润操控水平的盈余管理指标特征中的至少一种。
142.可选地,特征构造单元具体用于:
143.对财务报表数据建立评分规则,滤除评分低于阈值的数据,并对剩余的数据进行完善;
144.基于金融审批业务的角度,对财务报表数据中的初始财务特征进行重新认定、筛选、解释和分析,并衍生反应企业状况的中间财务特征;
145.对初始财务特征和中间财务特征按照财务功能进行归并,得到财务特征。
146.特征构造单元还用于在建立评分规则之前,验证财务报表数据的真实性、完整性和勾稽关系;
147.根据验证结果甄别财务报表数据的财务信息质量。
148.可选地,完善数据的方式包括:数据清洗、缺失值填补、异常值处理、特征分箱、特征重要性检验和特征相关性处理中的至少一种。
149.可选地,第一分类模型包括xgboost分类模型。
150.可选地,第二分类模型包括机器学习分类模型。
151.可选地,机器学习分类模型的获取模块具体包括:
152.提取多个样本的对授信审批有贡献的特征数据;
153.打标单元,用于若样本的审批结论为续议或否决,则将样本打标为第二黑标签,对应的样本为黑样本;若样本的审批结论为通过,则将样本打标为第二白标签,对应的样本为白样本;
154.训练集和测试集构建单元,用于按照黑样本的数量和白样本的数量为第一预设比例的规则,构建训练集和测试集;
155.训练单元,用于根据训练集和测试集训练机器学习分类模型。
156.可选地,训练集和测试集构建单元具体用于:
157.根据第一预设比例,判断黑样本的数量和白样本的数量是否平衡;若是,则从样本中抽取对应数量的黑样本和白样本;
158.否则,黑样本为全量选择,根据第一预设比例抽取相应数量的白样本;以相同的规则构建多个数据集;
159.将数据集按第二预设比例分为训练集和测试集。
160.可选地,训练单元具体用于:
161.将训练集输入模型池,得到模型池输出结果;
162.将模型池输出结果输入神经网络,得到待评价机器学习分类模型;
163.将测试集输入待评价机器学习分类模型,以进行模型评价和后续调优。
164.可选地,第一评价模块还用于在得到对授信审批有贡献的特征数据之后,生成财务体检表并输出,财务体检表包括对授信审批有贡献的特征数据类型和数值范围。
165.本发明实施例所提供的授信审批装置可执行本发明任意实施例所提供的自动化授信方法,具备执行方法相应的功能模块和有益效果。
166.图8为本发明实施例提供的一种电子设备的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
167.如图8所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(rom)12、随机访问存储器(ram)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(rom)12中的计算机程序或者从存储单元18加载到随机访问存储器(ram)13中的计算机程序,来执行各种适当的动作和处理。在ram 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、rom 12以及ram 13通过总线14彼此相连。输入/输出(i/o)接口15也连接至总线14。
168.电子设备10中的多个部件连接至i/o接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
169.处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如自动化授信方法。
170.在一些实施例中,自动化授信方法可被实现为计算机程序产品,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由rom 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到ram 13并由处理器11执行时,可以执行上文描述的自动化授信方法的一个或多个步骤。备
选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行自动化授信方法。
171.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
172.用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
173.在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
174.为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
175.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
176.计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云
主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。
177.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
178.上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1