本技术涉及人工智能,特别涉及一种属性预测方法、属性预测装置、电子设备及计算机可读存储介质。
背景技术:
1、在对企业等业务对象的不同属性维度的数据(例如股价、舆情资讯、财务指标等)之间的关系进行分析时,由于业务对象的属性数据往往采集于不同渠道不同来源,获得的各个数据样本序列也就具有不同的观察时间,随之导致了不同数据样本序列具有不同的样本分布频率的问题;例如,在根据上市公司的股价、舆情资讯预测公司财务指标时,股价、舆情资讯对应的数据样本序列为日频序列,而财务指标对应的数据样本序列为季频序列。因此,需要将股价、舆情资讯对应的数据样本序列的样本分布频率与财务指标对应的数据样本序列的样本分布频率转换成一致。
2、现有技术中,是采用单一的一种映射规则,将样本分布频率较高的数据样本序列转换成样本分布频率较低的数据样本序列,不能较为完整的涵盖原数据样本序列的信息,或将样本分布频率较低的数据样本序列转换成样本分布频率较高的数据样本序列,增加了一些不稳定的波动;同时,也无法确保样本分布频率一致之后的数据样本序列之间的相关性,给预测结果的准确性造成不利影响。
技术实现思路
1、为了提高预测结果的准确性,本技术提供了一种属性预测方法、属性预测装置、电子设备及计算机可读存储介质。
2、根据本技术实施例的一方面,公开了一种属性预测方法,包括:
3、获取对业务对象的历史属性数据进行数据采样得到的对应于第一属性维度的第一属性分布序列以及对应于第二属性维度的第二属性分布序列,所述属性分布序列是由所述业务对象在不同时间节点处分布的历史属性数据组成的数据样本序列,所述第一属性分布序列与所述第二属性分布序列具有不同的样本分布频率;
4、使用多种不同的映射规则对所述第二属性分布序列进行映射处理,得到与所述第一属性分布序列具有相同样本分布频率的多个第三属性分布序列;
5、将多个所述第三属性分布序列分别与所述第一属性分布序列进行相关性分析,得到各个所述第三属性分布序列的第一相关性系数,所述第一相关性系数用于指示所述第三属性分布序列与所述第一属性分布序列在所述历史属性数据随时间变化趋势上的一致性程度;
6、从多个所述第三属性分布序列中筛选得到所述第一相关性系数大于第一系数阈值的若干目标属性分布序列;
7、根据所述目标属性分布序列与所述第一属性分布序列预测所述业务对象在所述第一属性维度与所述第二属性维度之间的属性数据映射关系。
8、在一种示例性实施例中,在根据所述目标属性分布序列与所述第一属性分布序列预测所述业务对象在所述第一属性维度与所述第二属性维度之间的属性数据映射关系之前,还包括:
9、将若干所述目标属性分布序列两两之间进行相关性分析,得到若干所述目标属性分布序列两两之间的第二相关性系数,所述第二相关性系数用于指示若干所述目标属性分布序列两两之间在各时间点的所述历史属性数据的一致性程度;
10、从若干所述目标属性分布序列中筛选得到所述第二相关性系数小于第二系数阈值的目标属性分布序列和所述第二相关性系数大于所述第二系数阈值的两目标属性分布序列中的其中一者,并将筛选得到的目标属性分布序列作为用于与所述第一属性分布序列预测所述业务对象在所述第一属性维度与所述第二属性维度之间的属性数据映射关系的目标属性分布序列。
11、在一种示例性实施例中,所述第二属性分布序列的样本分布频率高于所述第一属性分布序列的样本分布频率。
12、在一种示例性实施例中,所述使用多种不同的映射规则对所述第二属性分布序列进行映射处理,得到与所述第一属性分布序列具有相同样本分布频率的多个第三属性分布序列,包括:
13、使用重叠指标分析法、动量指标分析法、周期性分析法、线性回归预测法中的至少两者,分别对所述第二属性分布序列进行映射处理,得到与所述第一属性分布序列具有相同样本分布频率的多个第三属性分布序列;
14、其中,所述重叠指标分析法是在对所述第二属性分布序列进行样本数据提取时,每次提取操作的范围有所重叠,以得到所述第三属性分布序列;
15、所述动量指标分析法是采用所述第二属性分布序列的变化趋势相关信息,得到所述第三属性分布序列;
16、所述周期性分析法是基于所述第二属性分布序列的周期性进行预测,得到所述第三属性分布序列;
17、所述线性回归预测法是基于构建的线性回归预测模型进行预测,得到所述第三属性分布序列。
18、在一种示例性实施例中,所述使用多种不同的映射规则对所述第二属性分布序列进行映射处理,得到与所述第一属性分布序列具有相同样本分布频率的多个第三属性分布序列,包括:
19、采用简单移动平均法,将所述第二属性分布序列转换成与所述第一属性分布序列的样本分布频率相同的一第三属性分布序列;
20、采用指数移动平均法,将所述第二属性分布序列转换成与所述第一属性分布序列的样本分布频率相同的一第三属性分布序列。
21、在一种示例性实施例中,所述使用多种不同的映射规则对所述第二属性分布序列进行映射处理,得到与所述第一属性分布序列具有相同样本分布频率的多个第三属性分布序列,包括:
22、获取相对强弱指数;
23、将所述相对强弱指数作为一所述第三属性分布序列;
24、获取钱德动量摆动指标;
25、将所述钱德动量摆动指标作为一所述第三属性分布序列。
26、在一种示例性实施例中,所述获取相对强弱指数,包括:
27、获取所述第二属性分布序列中相邻位置的两个样本数据;
28、根据所述相邻位置的两个样本数据生成向上波动的差值和向下波动的差值;
29、获取第一位置范围内所述向上波动的差值的指数移动平均值与所述向下波动的差值的指数移动平均值的比值;
30、对所述比值做归一化处理,得到与所述比值具有正相关关系的相对强弱指数。
31、根据本技术实施例的一方面,公开了一种属性预测装置,包括:
32、获取模块,用于获取对业务对象的历史属性数据进行数据采样得到的对应于第一属性维度的第一属性分布序列以及对应于第二属性维度的第二属性分布序列,所述属性分布序列是由所述业务对象在不同时间节点处分布的历史属性数据组成的数据样本序列,所述第一属性分布序列与所述第二属性分布序列具有不同的样本分布频率;
33、映射处理模块,用于使用多种不同的映射规则对所述第二属性分布序列进行映射处理,得到与所述第一属性分布序列具有相同样本分布频率的多个第三属性分布序列;
34、相关性分析模块,用于将多个所述第三属性分布序列分别与所述第一属性分布序列进行相关性分析,得到各个所述第三属性分布序列的第一相关性系数,所述第一相关性系数用于指示所述第三属性分布序列与所述第一属性分布序列在所述历史属性数据随时间变化趋势上的一致性程度;
35、序列筛选模块,用于从多个所述第三属性分布序列中筛选得到所述第一相关性系数大于第一系数阈值的若干目标属性分布序列;
36、预测模块,用于根据所述目标属性分布序列与所述第一属性分布序列预测所述业务对象在所述第一属性维度与所述第二属性维度之间的属性数据映射关系。
37、根据本技术实施例的一方面,公开了一种电子设备,所述电子设备包括一个或多个处理器以及存储器,所述存储器用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现前述属性预测方法。
38、根据本技术实施例的一方面,公开了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使所述计算机执行前述属性预测方法。
39、本技术的实施例提供的技术方案至少包括以下有益效果:
40、本技术提供的技术方案,使用多种不同的映射规则对第二属性分布序列进行映射处理,得到与第一属性分布序列具有相同样本分布频率的多个第三属性分布序列,多个第三属性分布序列可以更好地表征第二属性分布序列所具备的信息,同时又将得到的多个第三属性分布序列分别与第一属性分布序列进行相关性分析,筛选得到与第一属性分布序列相关性较强的第三属性分布序列作为目标属性分布序列,最终获得的目标属性分布序列既能较好地表征第二属性分布序列所具备的信息,又与第一属性分布序列保持一定程度的相关性,可以提高业务对象在第一属性维度与第二属性维度之间的属性数据映射关系预测的准确性。
41、应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本技术。