本申请涉及机器学习及商业大数据,具体而言,涉及一种基于电商大数据对风险指标进行标准化及进行风险评级预测的方法及计算设备。
背景技术:
1、随着网络计算技术的发展,电子商务活动中产生了大量的商业大数据。例如,与传统行业相比,电商在其生态价值链上会产生海量可获取的原始电商数据。这些数据的获取、加工、或者有效利用,可对企业经营活动提供帮助,或者对企业经营决策提供支持。
2、虽然这些电商大数据可资利用,例如用于计算一些企业评级的风险指标,但这些风险指标存在随不同统计维度产生偏差等问题。
3、在所述背景技术部分公开的上述信息仅用于加强对本申请的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
1、本申请旨在提供一种基于电商大数据对风险指标进行标准化及进行风险评级预测的方法及计算设备,通过对风险指标进行标准化处理,使之可用于预测或训练模型,并能够提升模型的收敛速度和精度。
2、本申请的其该用户特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
3、根据本申请的一方面,提供一种基于电商大数据对风险指标进行标准化的方法,包括:获取电商数据样本;确定用于对所述电商数据样本进行统计计算的多个时间片;对所述电商数据样本根据属性维度组合的筛选结果按所述多个时间片进行指标统计并计算风险指标,从而得到风险样本;根据所述属性维度组合对所述风险指标进行数据标准化。
4、根据本申请的另一方面,提供一种基于大数据进行风险评级预测的方法,包括:获取目标客户的电商数据样本;根据前述方法,基于所述电商数据样本,获得标准化的多个风险指标,所述多个风险指标划分为至少一个风险维度;将所述多个风险指标放入随机森林模型进行计算,其中所述随机森林模型包括第一组决策树和第二组决策树,所述第一组决策树获取所述多个风险指标,所述第二组决策树分别获取各风险维度的风险指标;获取随机森林模型的输出结果,得到总体风险预测和风险画像。
5、根据本申请的另一方面,提供一种计算设备,包括:处理器;存储器,所述存储器上存储有计算机程序;当所述处理器执行所述计算机程序时实现前述方法。
6、根据本申请的另一方面,提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现前述的方法。
7、根据一些实施例,通过对风险指标进行标准化处理,使之可用于预测或训练模型,并能够提升模型的收敛速度和精度,避免时间、地域、品类等不同维度对模型训练和预测产生影响。
8、应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
1.一种基于电商大数据对风险指标进行标准化的方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述获取电商数据样本,包括:
3.如权利要求1所述的方法,其特征在于,对所述电商数据样本根据属性维度组合的筛选结果按所述多个时间片进行指标统计并计算风险指标,包括:
4.如权利要求1所述的方法,其特征在于,所述风险指标包括销售同比环比、库存周转率、流量转化率、侵权投诉数、回款率中的一种或多种。
5.如权利要求4所述的方法,其特征在于,所述属性维度组合包括:品类、地域及时间窗口。
6.如权利要求1所述的方法,其特征在于,根据所述属性维度组合对所述风险指标进行数据标准化,包括:
7.一种基于大数据进行风险评级预测的方法,其特征在于,包括:
8.如权利要求7所述的方法,其特征在于,将所述第一组决策树和所述第二组决策树输出的平均值作为所述目标用户的总体风险预测值。
9.如权利要求7所述的方法,其特征在于,将所述第二组决策树输出的各风险维度的风险预测作为风险画像。
10.如权利要求7所述的方法,其特征在于,所述至少一个风险维度包括:退货风险、库存风险、基础风险、结算表现和销售表现中的至少一种。
11.如权利要求7所述的方法,其特征在于,所述方法用于金融机构对电商的贷款逾期进行风险评级预测。
12.如权利要求7所述的方法,其特征在于,还包括:
13.一种计算设备,其特征在于,包括: