本技术涉及数据处理领域,具体而言,涉及一种决策树模型检验方法及装置、存储介质及电子装置。
背景技术:
1、目前,决策树模型投产上线后,会不断积累运行数据产生新样本,这些新产生的样本相较于训练集可能已产生变化,即投产上线后的决策树模型可能存在无法完全匹配新样本的情况,针对这种情况,有必要使用投产后数据对决策树模型进行检验。
2、不过目前的决策树评估程序或工具只能在建模阶段评估决策树模型。对于已完成建模的决策树,无法自动使用新样本进行检验,只能基于新样本再次执行程序产生一个新的决策树。
3、因此,在相关技术中,存在无法对已投产上线的决策树模型进行检验的技术问题。
4、因此,有必要对相关技术予以改良以克服相关技术中的所述缺陷。
技术实现思路
1、本技术实施例提供了一种决策树模型检验方法及装置、存储介质及电子装置,以至少解决无法对已投产上线的决策树模型进行检验的问题。
2、根据本技术实施例的一方面,提供了一种决策树模型检验方法,包括:获取目标企业使用决策树模型进行业务分析所得到的业务运行数据;从所述业务运行数据中确定出第一业务特征,其中,所述第一业务特征在所述决策树模型中对应有第一叶节点;确定出与所述第一叶节点相邻的第二叶节点,并从所述决策树模型中确定出所述第二叶节点对应的第二业务特征,其中,所述第一叶节点和所述第二叶节点具有相同类别的节点标签;对所述第一业务特征和所述第二业务特征进行异质性检验,得到所述异质性检验的检验结果。
3、在一个示例性实施例中,从所述业务运行数据中确定出第一业务特征,包括:获取对所述业务运行数据进行解析得到的解析结果,其中,所述解析结果中的业务数据对应多种业务类型;确定出所述目标企业使用决策树模型进行业务分析之前的原始业务数据,其中,所述原始业务数据对应于原始业务类型;在确定所述多种业务类型除了包含所述原始业务类型之外,还包括其他业务类型的情况下,从所述解析结果中获取所述其他业务类型的业务数据;从所述其他业务类型的业务数据提取出业务参数,将所述业务参数确定为所述第一业务特征。
4、在一个示例性实施例中,对所述第一业务特征和所述第二业务特征进行异质性检验,包括:从所述第一叶节点中的第一节点标签中确定出第一目标标签,其中,所述第一目标标签对应的第一对象个数大于第一剩余节点标签对应的第二对象个数,所述第一剩余节点标签为所述第一节点标签中除了所述第一目标标签之外的节点标签;从所述第二叶节点中的第二节点标签中确定出第二目标标签,其中,所述第二目标标签对应的第三对象个数大于第二剩余节点标签对应的第四对象个数,所述第二剩余节点标签为所述第一节点标签中除了所述第二目标标签之外的节点标签;确定出所述第一对象个数与所述第二对象个数的第一比值,以及确定出所述第三对象个数与所述第四对象个数的第二比值;基于所述第一比值确定出进行异质性检验所需的第一置信区间,以及基于所述第二比值确定出进行异质性检验所需的第二置信区间;使用所述第一置信区间和所述第二置信区间进行异质性检验。
5、在一个示例性实施例中,基于所述第一比值确定出进行异质性检验所需的第一置信区间,以及基于所述第二比值确定出进行异质性检验所需的第二置信区间,包括:获取所述第一比值和第一预设临界值的第一和值,以及获取所述第一比值和所述第一预设临界值的第一差值,根据所述第一和值和所述第一差值确定所述第一置信区间,其中,所述第一置信区间的上界值为所述第一和值,所述第一置信区间的下界值为所述第一差值;获取所述第二比值和第二预设临界值的第二和值,以及获取所述第二比值和所述第二预设临界值的第二差值,根据所述第二和值和所述第二差值确定所述第二置信区间,其中,所述第二置信区间的上界值为所述第二和值,所述第二置信区间的下界值为所述第二差值。
6、在一个示例性实施例中,使用所述第一置信区间和所述第二置信区间进行异质性检验,包括:对所述第一置信区间和所述第二置信区间进行重合检验;在确定所述重合检验的检验结果用于指示所述第一置信区间和所述第二置信区间之间存在重合值的情况下,确定所述第一业务特征和所述第二业务特征进行异质性检验的检验结果为不通过;在确定所述重合检验的检验结果用于指示所述第一置信区间和所述第二置信区间之间不存在重合值的情况下,确定所述第一业务特征和所述第二业务特征进行异质性检验的检验结果为通过。
7、在一个示例性实施例中,在对所述第一业务特征和所述第二业务特征进行异质性检验之后,所述方法还包括:对所述第一业务特征和所述第二业务特征进行同质性检验,将得到的所述同质性检验的检验结果发送给目标对象,其中,对所述第一业务特征和所述第二业务特征进行同质性检验,包括:将所述业务参数的参数值拆分为至少两个子参数值,其中,所述至少两个子参数值在所述决策树模型中均对应有子叶节点;从所述决策树模型确定出分别与所述至少两个子参数值对应的至少两个子叶节点;对所述至少两个子叶节点进行异质性检验;在确定所述异质性检验的检验结果用于指示所述至少两个子叶节点未通过异质性检验的情况下,确定所述至少两个子叶节点通过同质性检验;在确定所述异质性检验的检验结果用于指示所述至少两个子叶节点通过异质性检验的情况下,确定所述至少两个子叶节点未通过同质性检验。
8、在一个示例性实施例中,在对所述第一业务特征和所述第二业务特征进行异质性检验,得到所述异质性检验的检验结果之后,所述方法还包括:在确定所述异质性检验的检验结果用于指示所述第一业务特征和所述第二业务特征未通过异质性检验的情况下,向所述目标对象发送所述异质性检验的检验结果和提示信息,其中,所述提示信息用于提供对所述决策树模型的处理建议;和/或,在确定所述异质性检验的检验结果用于指示所述第一业务特征和所述第二业务特征通过异质性检验的情况下,如果确定所述第一业务特征和所述第二业务特征未通过异质性检验,则向所述目标对象发送所述异质性检验的检验结果和提示信息。
9、根据本技术实施例的另一方面,还提供了一种决策树模型检验装置,包括:数据获取模块,用于获取目标企业使用决策树模型进行业务分析所得到的业务运行数据;第一确定模块,用于从所述业务运行数据中确定出第一业务特征,其中,所述第一业务特征在所述决策树模型中对应有第一叶节点;第二确定模块,用于确定出与所述第一叶节点相邻的第二叶节点,并从所述决策树模型中确定出所述第二叶节点对应的第二业务特征,其中,所述第一叶节点和所述第二叶节点具有相同类别的节点标签;结果得到模块,用于对所述第一业务特征和所述第二业务特征进行异质性检验,得到所述异质性检验的检验结果。
10、根据本技术实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述决策树模型检验方法。
11、根据本技术实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述决策树模型检验方法。
12、通过本技术,获取目标企业使用决策树模型进行业务分析所得到的业务运行数据;从所述业务运行数据中确定出第一业务特征,其中,所述第一业务特征在所述决策树模型中对应有第一叶节点;确定出与所述第一叶节点相邻的第二叶节点,并从所述决策树模型中确定出所述第二叶节点对应的第二业务特征,其中,所述第一叶节点和所述第二叶节点具有相同类别的节点标签;对所述第一业务特征和所述第二业务特征进行异质性检验,得到所述异质性检验的检验结果。采用上述技术方案,解决了无法对已投产上线的决策树模型进行检验的问题,进而可以实现对已投产上线的决策树模型进行检验。