本申请涉及计算机应用领域,特别是涉及一种数据分析方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
1、在汽车工业领域,通常在产线量产之前,需要反复做多次产品测试,分析测试数据,找出问题并解决,直到产品质量稳定,不合格率降低到可接受的水平为止。对测试数据进行分析,找出问题的根本原因并加以解决,即为根因分析。考虑到整车生产的试错成本较高,测试数据往往较少,样本体量较小,因此限制了如试误法、单因子法等分析手段的使用。
2、在传统小样本根因分析中,通常的分析流程为:
3、1、采用doe(design of experimental,实验设计)进行一系列实验,有针对性地对输入因子进行更改;
4、2、对doe获取的数据进行回归分析和方差分析,找出输入因子与输出结果之间的关系,以及输出因子的最佳取值范围;
5、3、按照doe设计规定的指标和维度,进行适量生产;
6、4、进行eol(end of line,整车下线流程)测试,检验产品是否合格。
7、但是,上述分析方法涉及到众多统计学概念和知识,复杂且难以理解,操作难度较大,导致根因分析效率很低。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种提高小样本数据根因分析的数据分析方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本申请提供了一种数据分析方法。所述方法包括:
3、获取产品相关样本数据,样本数据包括质量评估指标和若干个影响质量评估指标的影响因子;
4、获取影响因子与质量评估指标之间的线性相关性和非线性相关性;线性相关性和非线性相关性均与影响因子对应;
5、结合线性相关性和非线性相关性,确认关键因子集合。
6、在其中一个实施例中,获取产品相关样本数据,样本数据包括质量评估指标和若干个影响质量评估指标的影响因子包括:
7、获取多个产品关于影响因子的检测数据;
8、根据产品质量对相应产品赋予以数据形式呈现的质量评估指标;
9、将同一产品的检测数据与质量评估指标对应,获得样本数据。
10、在其中一个实施例中,获取影响因子与质量评估指标之间的线性相关性和非线性相关性包括:
11、获取各个影响因子与质量评估指标之间的相关性系数;相关性系数反映了影响因子与质量评估指标之间的线性相关性;
12、获取各个影响因子与质量评估指标之间的最大互信息系数;最大互信息系数反映了影响因子与质量评估指标之间的非线性相关性;
13、结合线性相关性和非线性相关性,确认关键因子集合,包括:
14、结合相关性系数和最大互信息系数,确认关键因子。
15、在其中一个实施例中,结合相关性系数和最大互信息系数,确认关键因子包括:
16、选取相关性系数满足相应条件的影响因子,组成第一影响因子集合;
17、根据最大互信息系数的大小将对应于最大互信息系数的影响因子进行排序;
18、从排序结果中选取与第一影响因子集合的元素数量相同的影响因子,组成第二影响因子集合;
19、基于第一影响因子集合和第二影响因子集合,确定关键因子集合。
20、在其中一个实施例中,基于第一影响因子集合和第二影响因子集合,确定关键因子集合包括:
21、获取第一影响因子集合与第二影响因子集合的交集,根据交集确定关键因子集合。
22、在其中一个实施例中,该方法还包括:
23、以关键因子集合中的单一元素为自变量,质量评估指标为因变量,制作与关键因子集合中的单一元素对应的可视化图表;
24、根据可视化图表,确认关键因子集合中各元素的目标取值范围。
25、第二方面,本申请还提供了一种数据分析装置。所述装置包括:
26、样本获取模块,用于获取产品相关样本数据,样本数据包括质量评估指标和若干个影响质量评估指标的影响因子;
27、相关性分析模块,用于获取影响因子与质量评估指标之间的线性相关性和非线性相关性;线性相关性和非线性相关性均与影响因子对应;
28、确认模块,用于结合线性相关性和非线性相关性,确认关键因子集合。
29、第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
30、获取产品相关样本数据,样本数据包括质量评估指标和若干个影响质量评估指标的影响因子;
31、获取影响因子与质量评估指标之间的线性相关性和非线性相关性;线性相关性和非线性相关性均与影响因子对应;
32、结合线性相关性和非线性相关性,确认关键因子集合。
33、第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
34、获取产品相关样本数据,样本数据包括质量评估指标和若干个影响质量评估指标的影响因子;
35、获取影响因子与质量评估指标之间的线性相关性和非线性相关性;线性相关性和非线性相关性均与影响因子对应;
36、结合线性相关性和非线性相关性,确认关键因子集合。
37、第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
38、获取产品相关样本数据,样本数据包括质量评估指标和若干个影响质量评估指标的影响因子;
39、获取影响因子与质量评估指标之间的线性相关性和非线性相关性;线性相关性和非线性相关性均与影响因子对应;
40、结合线性相关性和非线性相关性,确认关键因子集合。
41、上述数据分析方法、装置、计算机设备、存储介质和计算机程序产品,利用线性相关性分析和非线性相关性分析办法,获得与产品质量相关性较强的影响因子,从而快速实现根因分析,提高了数据分析效率。
1.一种数据分析方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述获取产品相关样本数据,所述样本数据包括质量评估指标和若干个影响质量评估指标的影响因子包括:
3.根据权利要求2所述的方法,其特征在于,所述分析所述影响因子与所述质量评估指标之间的线性相关性和非线性相关性包括:
4.根据权利要求3所述的方法,其特征在于,所述结合所述相关性系数和所述最大互信息系数,确认关键因子包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述第一影响因子集合和第二影响因子集合,确定关键因子集合包括:
6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
7.一种数据分析装置,其特征在于,所述装置包括:
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。