小微企业的信用风险识别方法及装置与流程

文档序号:23160223发布日期:2020-12-04 13:54阅读:158来源:国知局
小微企业的信用风险识别方法及装置与流程
本发明涉及数据处理
技术领域
,尤其涉及一种小微企业的信用风险识别方法及装置。
背景技术
:随着互联网技术的不断发展,针对企业进行线上信贷的技术也在不断的完善中。线上对企业开展信贷业务就需要对企业的信用进行评估,评估企业信用风险的要素有很多方面,包括:财务信息、企业主信息、工商信息、人行征信信息、司法涉诉信息等,每个方面都能一定程度体现出企业可能存在的风险。市场上有很多科技企业都开发了用于企业信用评估的风险评估模型,并逐渐形成相应的风控理论。但这类风险评估模型在训练过程虽然应用了企业的财务信息,但大多只参考了大中企业的经监管后编制的标准财务指标,也就是说,对于小微企业财报中能够准确反应小微企业风险状况的非标准财务指标没有过多考虑,进而导致利用此类风险评估模型识别出的小微企业的信用风险结果不够准确。技术实现要素:本发明的目的在于提供一种小微企业的信用风险识别方法及装置,除标准财务指标外还结合了能够反映出小微企业风险状况的非标准财务指标训练企业违约预测模型,以提升小微企业的信用风险识别准确度。为了实现上述目的,本发明的第一方面提供一种小微企业的信用风险识别方法,包括:基于多个小微企业的财报挖掘出与所述财报一一对应的样本数据,所述样本数据中包括标准财务指标和非标准财务指标的多个财务指标分类;针对所述样本数据中为空值和异常值的财务指标分类进行数据修正,和/或,根据同一所述财务指标分类中为空值的数量占样本数据总量的比值以及为异常值的数量占样本数据总量的比值,对所述财务指标分类进行初筛过滤;将每个所述财务指标分类按照对应财务指标值的大小划分为多段,并匹配出各所述样本数据中财务指标值所处的分段及对应企业违约率构建训练样本;根据每个所述财务指标分类在逻辑回归分析中的显著性对保留下的财务指标分类进行二次过滤,之后通过构建的训练样本训练企业违约预测模型;基于所述待测小微企业的财报及所述企业违约预测模型,识别出所述待测小微企业的信用风险。示例性地,所述标准财务指标包括规模类指标、盈利类指标、杠杆类指标、流动性类指标、运营效率类指标、债务覆盖类指标和增长类指标,所述非标准财务指标包括企业实力类指标、经营管理类指标、还债能力类指标和经营稳定性类指标。优选地,针对所述样本数据中为异常值的财务指标分类进行数据修正的方法包括:从各所述样本数据中分别提取出属于同一分类的财务指标值,并将每个财务指标分类对应的财务指标值按照从小到大的顺序排序;设定每个财务指标分类的异常值阈值,所述异常值阈值的下限为所属财务指标分类中排序的第a1百分位对应的财务指标值,所述异常值阈值的上限为所属财务指标分类中排序的第a2百分位对应的财务指标值;若所述样本数据中的财务指标值低于所属财务指标分类的异常值阈值下限,则将所述财务指标值替换为所述异常值阈值的下限,若所述样本数据中的财务指标值高于所属财务指标分类的异常值阈值上限,则将所述财务指标值替换为所述异常值阈值的上限。较佳地,针对所述样本数据中为空值的财务指标分类进行数据修正的方法包括:从各所述样本数据中分别提取出属于同一分类的财务指标值,并将每个财务指标分类对应的财务指标值按照从小到大的顺序排序;若空值产生原因在于财报缺失引起的,则将所述空值替换为所属财务指标分类中排序的第b1百分位对应的财务指标值;若空值产生原因在于变量计算引起的,则将所述空值替换为所属财务指标分类中排序的第b2百分位对应的财务指标值。优选地,根据同一所述财务指标分类中为空值的数量占样本数据总量的比值以及为异常值的数量占样本数据总量的比值,对所述财务指标分类进行初筛过滤的方法包括:当同一分类的财务指标值为空值的数量占样本数据总量的比值超过第一阈值时,初筛过滤掉对应的财务指标分类;当同一分类的财务指标值为异常值的数量占样本数据总量的比值超过第二阈值时,初筛过滤掉对应的财务指标分类。优选地,将所述财务指标分类按照对应财务指标值的大小划分为多段,并匹配出各所述样本数据中财务指标值所处的分段及对应企业违约率构建训练样本的方法包括:获取全部样本数据中每个所述财务指标分类对应的最大财务指标值和最小财务指标值,将每个所述财务指标分类对应的财务指标值划分为多段;基于每个所述财务指标分类对应财务指标值所处分段计算出对应的企业违约率,并根据每个所述财务指标分类及对应的企业违约率构建训练样本。优选地,根据每个所述财务指标分类在逻辑回归分析中的显著性对保留下的财务指标分类进行二次过滤,之后通过构建的训练样本训练企业违约预测模型的方法包括:计算每个所述财务指标分类对训练样本的ks值或auc值,剔除掉低于ks阈值或低于auc阈值的财务指标分类;计算逻辑回归分析方法中所述财务指标分类的显著性值,剔除掉低于显著性阈值的财务指标分类;基于保留下财务指标分类的训练样本训练企业违约预测模型。优选地,基于所述待测小微企业的财报及所述企业违约预测模型,识别出所述待测小微企业的信用风险的方法包括:基于所述待测小微企业的财报及所述企业违约预测模型,得到所述待测小微企业的初步预测违约概率p1;采用公式p=p2*p1计算所述待测小微企业的预测违约概率,并基于所述预测违约概率从预设的映射关系中匹配出所述待测小微企业的信用风险;其中,所述p2为调整系数。优选地,基于所述待测小微企业的财报及所述企业违约预测模型,识别出所述待测小微企业的信用风险之后还包括:汇总所述样本数据中被过滤掉的属于非标准财务指标类型的财务指标分类,并将每个财务指标分类对应的财务指标值按照从小到大的顺序排序;若任一所述财务指标分类对应的财务指标值介于第一区间百分位,将所述待测小微企业的信用风险下调一级,直至信用风险下调至准入级为止;若任一所述财务指标分类对应的财务指标值低于最低值百分位,将所述待测小微企业的信用风险下调为准入级;若任一所述财务指标分类对应的财务指标值介于第二区间百分位,将所述待测小微企业的信用风险上调一级,直至信用风险上调至最高级为止。与现有技术相比,本发明提供的小微企业的信用风险识别方法具有以下有益效果:本发明提供的小微企业的信用风险识别方法中,由于采用的样本数据不仅包括了属于标准财务指标的财务指标分类,还包括了能够体现小微企业风险特点的非标准财务指标对应的财务指标分类,在通过后续的数据修正以及过滤筛选后得到训练样本,最终基于这些训练样本训练出的企业违约预测模型,能够准确识别出小微企业的信用风险。本发明的第二方面提供一种小微企业的信用风险识别装置,应用于上述技术方案所述的小微企业的信用风险识别方法中,所述装置包括:数据获取单元,基于多个小微企业的财报挖掘出与所述财报一一对应的样本数据,所述样本数据中包括标准财务指标和非标准财务指标的多个财务指标分类;数据处理单元,用于针对所述样本数据中为空值和异常值的财务指标分类进行数据修正,和/或,根据同一所述财务指标分类中为空值的数量占样本数据总量的比值以及为异常值的数量占样本数据总量的比值,对所述财务指标分类进行初筛过滤;样本构建单元,用于将每个所述财务指标分类按照对应财务指标值的大小划分为多段,并匹配出各所述样本数据中财务指标值所处的分段及对应企业违约率构建训练样本;模型训练单元,用于根据每个所述财务指标分类在逻辑回归分析中的显著性对保留下的财务指标分类进行二次过滤,之后通过构建的训练样本训练企业违约预测模型;风险识别单元,基于所述待测小微企业的财报及所述企业违约预测模型,识别出所述待测小微企业的信用风险。与现有技术相比,本发明提供的小微企业的信用风险识别装置的有益效果与上述技术方案提供的小微企业的信用风险识别方法的有益效果相同,在此不做赘述。本发明的第三方面提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述小微企业的信用风险识别方法的步骤。与现有技术相比,本发明提供的计算机可读存储介质的有益效果与上述技术方案提供的小微企业的信用风险识别方法的有益效果相同,在此不做赘述。附图说明此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:图1为本发明实施例一中小微企业的信用风险识别方法的流程示意图;图2为本发明实施例一中财务指标值分段与企业违约率的关系示例图。具体实施方式为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本发明保护的范围。实施例一请参阅图1,本实施例提供一种小微企业的信用风险识别方法,包括:基于多个小微企业的财报挖掘出与财报一一对应的样本数据,样本数据中包括标准财务指标和非标准财务指标的多个财务指标分类;针对样本数据中为空值和异常值的财务指标分类进行数据修正,和/或,根据同一财务指标分类中为空值的数量占样本数据总量的比值以及为异常值的数量占样本数据总量的比值,对财务指标分类进行初筛过滤;将每个财务指标分类按照对应财务指标值的大小划分为多段,并匹配出各样本数据中财务指标值所处的分段及对应企业违约率构建训练样本;根据每个财务指标分类在逻辑回归分析中的显著性对保留下的财务指标分类进行二次过滤,之后通过构建的训练样本训练企业违约预测模型;基于待测小微企业的财报及企业违约预测模型,识别出待测小微企业的信用风险。本实施例提供的小微企业的信用风险识别方法中,由于采用的样本数据不仅包括了属于标准财务指标的财务指标分类,还包括了能够体现小微企业风险特点的非标准财务指标对应的财务指标分类,在通过后续的数据修正以及过滤筛选后得到训练样本,最终基于这些训练样本训练出的企业违约预测模型,能够准确识别出小微企业的信用风险。其中,标准财务指标包括规模类指标、盈利类指标、杠杆类指标、流动性类指标、运营效率类指标、债务覆盖类指标和增长类指标,非标准财务指标包括企业实力类指标、经营管理类指标、还债能力类指标和经营稳定性类指标。具体实施时,首先需收集并整理小微企业的财报,不同于大中企业,小微企业的财报存在不标准、格式多样、缺失等缺陷,所以收集到的财报要按统一格式整理,一般来说,需要收集最近2年完整的年报和最新一期季度财报,若财报有空缺可以往前推一年。每家小微企业财报中的资产负债表按以下格式整理:每家小微企业财报中的损益表(利润表)按以下格式整理:项目本期金额上期金额一、主营业收入减:主营业务成本主营业务税金及附加二、主营业务利润(亏损以“-”号填列)加:其他业务利润(亏损以“-”号填列)减:营业费用管理费用财务费用三、营业利润(亏损以“-”号填列)加:投资收益(亏损以“-”号填列)补贴收入营业外收入四、利润总额(亏损总额以“-”号填列)减:所得税费用五、净利润(净亏损以“-”号填列)对表中出现的缺损值、空值统一补0处理。同时核对两张报表的钩稽关系。钩稽关系包括:总资产=负债+所有者权益;总资产=流动资产+非流动资产;总负债=流动负债+非流动负债;主营业务利润=主营业务收入-主营业务成本-主营业务税金及附加;营业利润=主营业务利润+其他业务利润-营业费用-管理费用-财务费用;利润总额=营业利润+投资收益+补贴收入+营业外收入;净利润=利润总额-所得税费用等。接下来需要对标准财务指标进行分类整理,具体分类整理的过程为:基于市场上常用的财务指标分类方式,按指标的含义以及体现出的信息分成以下7大类,每一大类都对应有具体的财务指标分类:规模类指标对应的财务指标分类有:总资产、净资产、总销售额等;盈利类指标对应的财务指标分类有:总资产收益率、净资产收益率、净利润、毛利率、资本收益等;杠杆类指标对应的财务指标分类有:资产负债率、资本化比率、净债务率、短期债务比率、长期债务比率等;流动性类指标对应的财务指标分类有:流动比率、速动比率、现金负债比、现金债务比等;运营效率类指标对应的财务指标分类有:流动资产周转率、应收账款周转率、应付账款周转率、固定资产周转率等;债务覆盖类指标对应的财务指标分类有:eb、现金债务比率、毛收入债务比率、流动资产债务比率等;增长类指标对应的财务指标分类有:总资产增长率、净资产增长率、销售额增长率、债务增长率等。这些都是用来分析大中企业的财务指标分类,然后基于财务报表的格式整理出相应财务指标分类及对应的财务指标值。整理财务指标值时按以下顺序逐一核实数据:1、对同时需要资产负债表和损益表科目才能计算出的财务指标分类,需要对资产负债表的科目取两年平均,如总资产收益率(roa);2、当通过两个表科目相除计算出的财务指标值,发现分母是零或负的情况,要根据指标的经济意义设成较大值或较小值;如果分母为债务(应付帐款、短期借款、长期借款等)相关科目时,分母为零或负的情况说明企业的债务负担小,这时可以把该指标设成较大值,即,所有样本的该指标从小到大排序后取第99百分位的值设成该指标的值。如果分母为资产一类(如流动资产、现金、应收帐款、净资产等)的科目时,分母为零或负的情况说明企业的相应资产项小风险高,这时可以把该指标设成较小值,即,所有样本的该指标从小到大排序后取第1百分位的值设成该指标的值。3、当缺少某一年财报而无法计算对应的增长率指标,如:总资产增长率、净资产增长率、净利润增长率、应收帐款增长率、留存收益增长率、固定资产增长率,这些指标统一设成对应指标值按从小到大排序后的第50百分位值来代替。接下来需要对非标准财务指标进行分类整理,具体分类整理的过程为:基于市场上常用的财务指标分类方式,按指标的含义以及体现出的信息分成以下4大类,每一大类都对应有具体的财务指标分类:企业实力类指标包括体现企业大小和企业主投入情况的财务指标分类,如:实收资本、留存收益、纳税额等;经营管理类指标指的是包括企业在经营中能够体现企业经营管理能力和效率的指标,如留存收益同销售额的比率、管理费用同销售额的比率、应收帐款占销售额的比率、应付帐款占销售额的比率等;还债能力类指标指的是企业经营情况对现有债务还款能力的体现,如:债务占销售额的比率、债务同净资产比率等;经营稳定性类指标指的是企业在实际经营中体现经营稳定性的指标,如:过去十二个月销售额的稳定性、过去半年销售额增长率、过去三个月销售额增长率等;这些财务指标分类在对大中企业进行统计分析时一般不用,或者说对大中企业没有明显区分能力,但更能体现小微企业的经营状况和还款能力,比较适合小微企业的企业违约预测模型采用。上述实施例中,针对样本数据中为异常值的财务指标分类进行数据修正的方法包括:从各样本数据中分别提取出属于同一分类的财务指标值,并将每个财务指标分类对应的财务指标值按照从小到大的顺序排序;设定每个财务指标分类的异常值阈值,异常值阈值的下限为所属财务指标分类中排序的第a1百分位对应的财务指标值,异常值阈值的上限为所属财务指标分类中排序的第a2百分位对应的财务指标值;若样本数据中的财务指标值低于所属财务指标分类的异常值阈值下限,则将财务指标值替换为异常值阈值的下限,若样本数据中的财务指标值高于所属财务指标分类的异常值阈值上限,则将财务指标值替换为异常值阈值的上限。具体实施时,每个样本数据均对应有多种财务指标分类,且每个样本数据中的财务指标分类相同,分别将每一种财务指标分类所对应全部样本数据的财务指标值,按照从小到大的顺序排序;然后分别设定每一种财务指标分类所对应的异常值阈值,例如,a1的取值为1,a2的取值为99,也就是说低于第1百分位的财务指标值和高于第99百分位的财务指标值可作为异常值处理,具体为,将低于第1百分位对应的财务指标值替换为第1百分位对应的财务指标值,将高于第99百分位对应的财务指标值替换为第99百分位对应的财务指标值。上述实施例中,针对样本数据中为空值的财务指标分类进行数据修正的方法包括:从各样本数据中分别提取出属于同一分类的财务指标值,并将每个财务指标分类对应的财务指标值按照从小到大的顺序排序;若空值产生原因在于财报缺失引起的,则将空值替换为所属财务指标分类中排序的第b1百分位对应的财务指标值;若空值产生原因在于变量计算引起的,则将空值替换为所属财务指标分类中排序的第b2百分位对应的财务指标值。具体实施时,如果财务指标值的空值是由于正常数据缺失造成的,这样的缺失可以直接付与一个中性的值;如,缺少某一年财报而无法计算各类增长率指标,如总资产增长率、净资产增长率、净利润增长率、应收账款增长率、留存收益增长率、固定资产增长率等,将这些缺失的财务指标值替换为第50百分位对应的财务指标值,也即b1的取值为50。如果财务指标值的空值是由于变量合成时计算异常造成,如分母为零或为负,要根据情况处理,如果分母为债务,如应付帐款、短期借款、长期借款等相关科目时,分母为零或负的情况说明企业的债务负担小,这时可以把该些缺失的财务指标值替换为第99百分位对应的财务指标值,也即b2的取值为99。如果分母为资产一类,如流动资产、现金、应收帐款、净资产等科目时,分母为零或负的情况说明企业的相应资产项小风险高,这时可以把这些财务指标值替换为第1百分位对应的财务指标值,也即b2的取值为1。上述实施例中,根据同一财务指标分类中为空值的数量占样本数据总量的比值以及为异常值的数量占样本数据总量的比值,对财务指标分类进行初筛过滤的方法包括:当同一分类的财务指标值为空值的数量占样本数据总量的比值超过第一阈值时,初筛过滤掉对应的财务指标分类;当同一分类的财务指标值为异常值的数量占样本数据总量的比值超过第二阈值时,初筛过滤掉对应的财务指标分类。具体实施时,如果某种财务指标分类对应的异常值过多,如超过所有样本数据总量的50%,舍弃该财务指标分类。如果某种财务指标分类对应的空值过多,如超过所有样本数据总量的80%,舍弃该财务指标分类。也即第一阈值的取值为50%,第二阈值的取值为80%。上述实施例中,将财务指标分类按照对应财务指标值的大小划分为多段,并匹配出各样本数据中财务指标值所处的分段及对应企业违约率构建训练样本的方法包括:获取全部样本数据中每个财务指标分类对应的最大财务指标值和最小财务指标值,将每个财务指标分类对应的财务指标值划分为多段;基于每个财务指标分类对应财务指标值所处分段计算出对应的企业违约率,并根据每个财务指标分类及对应的企业违约率构建训练样本。具体实施时,在进行回归分析前还需对样本数据中的每种财务指标分类分别进行数据处理,具体过程为,从全部样本数据中获取每种财务指标分类对应的最大财务指标值和最小财务指标值,然后计算每种财务指标分类的最大财务指标值与最小财务指标值的差值,如将差值分成10等份,最终实现将每种财务指标分类对应的财务指标值化成10多段,然后基于每个财务指标值所属的财务指标分类及所处分段计算出对应的企业违约率,直至全部样本数据中的各财务指标值对应的企业违约率计算完毕为止,构建训练样本。如图2所示,财务指标分类a所属分段1-2的企业违约率为7.5%,财务指标分类a所属分段2-3的企业违约率为6%,最终根据每个财务指标分类及对应的企业违约率构建训练样本。上述实施例中,根据每个财务指标分类在逻辑回归分析中的显著性对保留下的财务指标分类进行二次过滤,之后通过构建的训练样本训练企业违约预测模型的方法包括:计算每个财务指标分类对训练样本的ks值或auc值,剔除掉低于ks阈值或低于auc阈值的财务指标分类;计算逻辑回归分析方法中财务指标分类的显著性值,剔除掉低于显著性阈值的财务指标分类;基于保留下财务指标分类的训练样本训练企业违约预测模型。具体实施时,通过非参数统计量ks值或auc值对财务指标分类进行初步筛选,分别对每一个财务指标分类对训练样本的ks值或auc值进行计算,如果ks值或auc值低于ks阈值或低于auc阈值,ks阈值取0.08,auc阈值取0.55,则剔除这些财务指标分类,在逻辑回归分析过程中,采用常规的方法,剔除掉显著性p值低于显著性阈值的财务指标分类,显著性阈值取3,以实现对训练样本中数据的更新,然后基于更新后的训练样本采用线性回归方法或逻辑回归方法训练企业违约预测模型。可以理解的是,企业违约预测模型的训练方法为本领域现有技术,本实施例对此不做赘述。另外,可通过如下方法对企业违约预测模型进行检验:对财务指标分类的相关性进行检查,也就是变量共线性检查。如通过vif(varianceinformationfactor)方差膨胀系数来检查,该vif在逻辑回归时可以通过统计软件直接得出结果,如果vif的计算结果大于5,需要重新调整财务指标分类,否则无需调整。在无需调整训练数据中财务指标分类的情况下,针对被过滤掉的属于非标准财务指标类型的财务指标分类,计算财务指标分类的ks值或auc值,如果ks值或auc值合理,即大于预先设定的ks阈值或auc阈值就认可该模型,否则要对模型进行调整或重新开发。上述实施例中,基于待测小微企业的财报及企业违约预测模型,识别出待测小微企业的信用风险的方法包括:基于待测小微企业的财报及企业违约预测模型,得到待测小微企业的初步预测违约概率p1;采用公式p=p2*p1计算待测小微企业的预测违约概率,并基于预测违约概率从预设的映射关系中匹配出待测小微企业的信用风险;其中,p2为调整系数。具体实施时,从待测小微企业的财报中获取与更新后训练样本相同维度的样本数据,并将该样本数据输入训练好的企业违约预测模型得到初步预测违约概率p1,其中,所述p实际表示样本数据中各财务指标值所占分段对应企业违约率的均值,所述p样本表示违约企业占训练样本总量的比值。由于预先设置好了预测违约概率与信用风险的映射关系表,故可根据最终得到的预测违约概率自动匹配输出待测小微企业的信用风险。上述实施例中,基于待测小微企业的财报及企业违约预测模型,识别出待测小微企业的信用风险之后还包括:汇总样本数据中被过滤掉的属于非标准财务指标类型的财务指标分类,并将每个财务指标分类对应的财务指标值按照从小到大的顺序排序;若任一财务指标分类对应的财务指标值介于第一区间百分位,将待测小微企业的信用风险下调一级,若存在多个财务指标分类对应的财务指标值介于第一区间百分位,则对应将信用风险下调多级,直至信用风险下调至准入级为止;若任一财务指标分类对应的财务指标值低于最低值百分位,将待测小微企业的信用风险下调为准入级;若任一财务指标分类对应的财务指标值介于第二区间百分位,将待测小微企业的信用风险上调一级,若存在多个财务指标分类对应的财务指标值介于第二区间百分位,则对应将信用风险上调多级,直至信用风险上调至最高级为止。具体实施时,若任一财务指标分类对应的财务指标值介于第一区间百分位,将待测小微企业的信用风险下调一级,直至信用风险下调至准入级为止,第一区间为2至15百分位区间,如从aa-下调到a+级别;若任一财务指标分类对应的财务指标值低于最低值百分位,将待测小微企业的信用风险下调为准入级,最低值百分位为2百分位;若任一财务指标分类对应的财务指标值介于第二区间百分位,将待测小微企业的信用风险上调一级,直至信用风险上调至最高级为止,第一区间为15至30百分位区间;对财务指标分类缺失值的调整,如果上一年度财务报表缺失,下调该企业的信用风险下调一级。综上,现有技术在对小微企业进行风险模型开发的时候,主要考虑以下数据来源:财务报表信息、税务、人行征信、社会征信、工商司法等信息。但是,在财务指标分类相关变量的设计和合成方面,没有明显区别于大中企业,没有突出小微企业的特性。小微企业由于财务报表不全,信息不可靠,用常规的标准财务指标进行考虑有很不完善的地方,需要针对性的考虑和设计适用于小微企业的非标准财务指标。再者,常规统计方法在选取有风险区分能力的财务指标分类时,会更偏向那些统计上有普遍意义的指标,而排除一些出现可能性小,但对小微企业信用是致命的或非常关键风险指标。或者说这些指标统计分析不显著,容易被统计方法筛掉。本实施例旨在跳出常规风险因素的框架,基于数据可靠性低的事实,设计出一些更能体现小微企业风险的财务指标分类进行统计分析,然后以统计分析结果为基础,找出那些重要但统计显著性低的风险因子,通过不同的调整方式进入模型。这样开发的模型能更为精确地预测小微企业的信用风险。实施例二本实施例提供一种小微企业的信用风险识别装置,包括:数据获取单元,基于多个小微企业的财报挖掘出与所述财报一一对应的样本数据,所述样本数据中包括标准财务指标和非标准财务指标的多个财务指标分类;数据处理单元,用于针对所述样本数据中为空值和异常值的财务指标分类进行数据修正,和/或,根据同一所述财务指标分类中为空值的数量占样本数据总量的比值以及为异常值的数量占样本数据总量的比值,对所述财务指标分类进行初筛过滤;样本构建单元,用于将每个所述财务指标分类按照对应财务指标值的大小划分为多段,并匹配出各所述样本数据中财务指标值所处的分段及对应企业违约率构建训练样本;模型训练单元,用于根据每个所述财务指标分类在逻辑回归分析中的显著性对保留下的财务指标分类进行二次过滤,之后通过构建的训练样本训练企业违约预测模型;风险识别单元,基于所述待测小微企业的财报及所述企业违约预测模型,识别出所述待测小微企业的信用风险。与现有技术相比,本发明实施例提供的小微企业的信用风险识别装置的有益效果与上述实施例一提供的小微企业的信用风险识别方法的有益效果相同,在此不做赘述。实施例三本实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述小微企业的信用风险识别方法的步骤。与现有技术相比,本实施例提供的计算机可读存储介质的有益效果与上述技术方案提供的小微企业的信用风险识别方法的有益效果相同,在此不做赘述。本领域普通技术人员可以理解,实现上述发明方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,上述程序可以存储于计算机可读取存储介质中,该程序在执行时,包括上述实施例方法的各步骤,而的存储介质可以是:rom/ram、磁碟、光盘、存储卡等。以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1