数据分析方法、装置、计算机可读介质及电子设备与流程

文档序号:35466452发布日期:2023-09-16 06:11阅读:31来源:国知局
数据分析方法、装置、计算机可读介质及电子设备与流程

本公开涉及计算机,具体地,涉及一种数据分析方法、装置、计算机可读介质及电子设备。


背景技术:

1、在实际业务场景中,通常基于测试数据来对不同维度的数据进行差异化处理效应(heterogeneity of treatment effect,hte)分析,以定位到符合某些目标指标的子群(人群/事物),从而对该子群生效具体的业务策略。

2、相关技术中,一般采用人工拆解分析方法来对测试数据进行维度拆解,并根据拆解后的维度进行差异化处理效应分析,以定位到符合某些目标指标的子群。但是,人工拆解分析方法效率较低,耗时过长,且很难通过穷尽不同维度的交叉组合寻找到最佳子群。


技术实现思路

1、提供该
技术实现要素:
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。

2、第一方面,本公开提供一种数据分析方法,所述方法包括:

3、获取针对业务系统的测试数据和预设分析指标,所述预设分析指标用于表征期望从所述测试数据中得到的目标数据与目标指标之间的关系,所述测试数据包括实验组数据和对照组数据,所述目标指标由第一数据指标除以第二数据指标得到,所述第一数据指标基于所述实验组数据与所述对照组数据在第一子数据指标下的第一差值数据得到,所述第二数据指标基于所述实验组数据与所述对照组数据在第二子数据指标下的第二差值数据得到;

4、在不同数据维度下将所述测试数据处理为二分类数据;

5、确定每一所述二分类数据中每类数据之间的分布差异度,并根据所述预设分析指标,确定每一所述二分类数据中每类数据的类别解释度,所述类别解释度用于表征所述每类数据对应的所述第一差值数据或所述第二差值数据在所述测试数据中的数据占比;

6、根据所述分布差异度和所述类别解释度,在所述测试数据中确定目标数据子群。

7、第二方面,本公开提供一种数据分析装置,包括:

8、获取模块,用于获取针对业务系统的测试数据和预设分析指标,所述预设分析指标用于表征期望从所述测试数据中得到的目标数据与目标指标之间的关系,所述测试数据包括实验组数据和对照组数据,所述目标指标由第一数据指标除以第二数据指标得到,所述第一数据指标基于所述实验组数据与所述对照组数据在第一子数据指标下的第一差值数据得到,所述第二数据指标基于所述实验组数据与所述对照组数据在第二子数据指标下的第二差值数据得到;

9、处理模块,用于在不同数据维度下将所述测试数据处理为二分类数据;

10、第一确定模块,用于确定每一所述二分类数据中每类数据之间的分布差异度,并根据所述预设分析指标,确定每一所述二分类数据中每类数据的类别解释度,所述类别解释度用于表征所述每类数据对应的所述第一差值数据或所述第二差值数据在所述测试数据中的数据占比;

11、第二确定模块,用于根据所述分布差异度和所述类别解释度,在所述测试数据中确定目标数据子群。

12、第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现第一方面所述方法的步骤。

13、第四方面,本公开提供一种电子设备,包括:

14、存储装置,其上存储有计算机程序;

15、处理装置,用于执行所述存储装置中的所述计算机程序,以实现第一方面所述方法的步骤。

16、通过上述技术方案,可以根据目标指标将不同数据维度下的测试数据处理为二分类数据,从而可以根据二分类数据确定每类数据之间的分布差异度和类别解释度,进而可以根据每类数据之间的分布差异度和类别解释度,在测试数据中确定出目标数据子群。由于目标指标由第一数据指标除以第二数据指标得到,因此目标指标可以表征第一数据指标和第二数据指标之间的差异处理效应,由此可以从不同数据维度对测试数据进行自动化的差异化处理效应分析,从而更准确的得到符合预设分析指标的目标数据子群,提高数据分析效率。

17、本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。



技术特征:

1.一种数据分析方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述在不同数据维度下将所述测试数据处理为二分类数据,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述数据维度的类型,确定所述数据维度对应的目标划分信息,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述数据维度的类型,确定所述数据维度对应的候选划分信息,包括:

5.根据权利要求3所述的方法,其特征在于,所述根据所述数据维度的类型,确定所述数据维度对应的候选划分信息,包括:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

7.根据权利要求3-6任一项所述的方法,其特征在于,所述确定将所述测试数据按照所述候选划分信息划分后每类数据之间的分布差异度,包括:

8.根据权利要求1-6任一项所述的方法,其特征在于,所述确定每一所述二分类数据中每类数据之间的分布差异度,包括:

9.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所述分布差异度和所述类别解释度,在所述测试数据中确定目标数据子群,包括:

10.根据权利要求9所述的方法,其特征在于,所述将所述测试数据在所述目标指标下的计算结果作为根节点,并将所述目标数据维度对应的每类数据作为所述根节点的子节点,生成目标数据决策树,包括:

11.根据权利要求9所述的方法,其特征在于,所述方法还包括:

12.一种数据分析装置,其特征在于,包括:

13.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现权利要求1-11中任一项所述方法的步骤。

14.一种电子设备,其特征在于,包括:


技术总结
本公开涉及一种数据分析方法、装置、计算机可读介质及电子设备,方法包括:获取针对业务系统的测试数据和预设分析指标;在不同数据维度下将所述测试数据处理为二分类数据;确定每一所述二分类数据中每类数据之间的分布差异度,并根据所述预设分析指标,确定每一所述二分类数据中每类数据的类别解释度;根据所述分布差异度和所述类别解释度,在所述测试数据中确定目标数据子群。通过上述技术方案,可以对每个测试数据的不同数据维度进行自动分析,以从不同的数据维度中准确的确定出符合预设分析指标的目标数据子群。

技术研发人员:柯珍梅
受保护的技术使用者:北京字跳网络技术有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1